戲為飲品「大葷君」作

DHJ

其一
涪陵崖腳錦城雲,紅岸清歌悄不聞。
攘往熙來成底事?江山付與大葷君。

其二
尊中黜外宜乎禮,秉憲修班諡曰文1
此去華胥應不遠,兆民同夢大葷君。

其三
師夷長技辱斯文,築就高牆書可焚。
借問何如奧巴馬2?咸稱美甚大葷君!


  1. 諡法,修治班制曰文。「秉憲修班」,即「依法懲處腐敗分子」云云。 
  2. 人名,用拗句。 

Spectra of Modular Surfaces II

上篇:Spectra of Modular Surfaces I

考虑紧致无边Riemann流形M上的自由粒子运动,
(经典模型)作为等能面的单位切丛S(M)\to M,以及作为Hamilton流的测地流\mathcal{G}_t:S(M) \to S(M)
负曲率流形上的Hamilton流是经典混沌系统的典型例子(Hopf, Moser, Sinai, etc.)。
(量子模型)视\Delta为Schrödinger算子,我们得到一个量子混沌系统。
在量子混沌的领域中有大量基于数值实验的猜想有待解决,主要的技术手段是准经典分析(semi-classical analysis)。另一方面,由于\triangleHecke算子交换,算术流形上的量子混沌系统通常有强得多的代数刚性,在许多方面表现得更像是量子可积系统,因而得到了更多成果。
以下讨论将遵循soft vs. hard的二分(dichotomy):先对一般的Riemann流形(M,\triangle)做出陈述,之后承袭对模曲面(X,\triangle)的讨论,将其作为算术模型的特例加以比较。

Distribution of the Eigenvalues
定义N(\lambda)=\{j:\lambda_j\leq \lambda\},研究N(\lambda)的渐进行为是谱几何中的重要论题。
对于紧流形M^n,我们有经典的Weyl密度估计\displaystyle \frac{1}{\lambda}N(\lambda) \to \frac{V(B^n)}{(2\pi)^n}V(M,g)\lambda \to \inftyX的算术性在一定程度上“补偿”了非紧性,这使得Selberg能够利用Selberg迹公式证明同样类型的密度估计\displaystyle \frac{1}{\lambda}N(\lambda) \to \frac{1}{4\pi}V(X)\lambda \to \infty
另一个常见的考察对象是相邻特征值间距的分布。对于量子混沌系统,通常我们期望其相邻特征值的间距分布得足够随机,即满足某个Gauss系综(Gaussian ensemble),但算术量子混沌系统的情况有所不同。
具体地说,对于X(1)=\Gamma(1)\backslash \Bbb H,基于数值实验,我们有
(Cartier猜想) \triangle的所有大于0的(尖点)特征值都是单重的。
V(X(1))=\pi/3,故此时(\lambda_{i+1}-\lambda_i)/12的期望值为1. 在此归一化下,数值实验显示\triangle的相邻特征值间距满足指数分布:
(Steil猜想)\displaystyle \frac{\#\{i\leq N:(\lambda_{i+1}-\lambda_i)/12 \in[\alpha,\beta]\}}{N} \to \int_\alpha^\beta e^{-x}dxN \to \infty
最后是一点题外话。“算术对象服从量子统计”,此类规律通常有大量数值证据支持,却难以从理论上加以证明。很多时候我们甚至无法像上述例子一样,找到一个将物理与数论自然结合的理论框架。以下是2个例子:关于Riemann zeta函数的Montgomery-Odlyzko猜想,以及新近提出的关于椭圆曲线的BKLPR猜想

Quamtum Ergodicity
遍历性(ergodicity)是混沌系统的本质特征之一。量子系统的高能极限对应于h\to 0的准经典近似,我们有理由期待i \to \infty时特征函数f_i趋于X上的一致分布1。我们有2种方式将这一命题精确化:
考虑概率测度\mu_\psi=|\psi|^2dgS(M)上的微局部提升(microlocal lift)\nu_\psi,已知
(SCZ量子遍历定理2)若测地流\mathcal{G}_t:S(M) \to S(M)是遍历的,则\forall \psi\in C_0^\infty(S(M))\displaystyle \frac{1}{N(\lambda)}\sum_{\lambda_i \leq \lambda}|\nu_{f_i}(\psi)-\bar{\psi}|^2=o(1)\lambda \to \infty
Zelditch  Quantum ergodicity of C^{*} dynamical systems
我们称\nu_{f_i}的弱极限为量子极限。由Egorov定理,它是一个\mathcal{G}_t不变的概率测度。比SCZ量子遍历定理更强的,我们有
(量子唯一遍历性猜想,QUE)\nu_{f_i}有唯一的量子极限:S(M)上的Haar测度\nu
Rudnick, Sarnak  The behavior of eigenstates of arithmetic hyperbolic manifolds
已获证明的结果全部来自算术曲面:由于在算术动力系统方面的一系列工作,包括证明了紧算术曲面上的QUE,Lindenstrauss获得2010年的Fields奖。在此基础上,Soundararajan证明了非紧算术曲面上的QUE.
Lindenstrauss  Invariant measures and arithmetic quantum unique ergodicity
Soundararajan  Quantum Unique ergodicity for SL_2(\Bbb Z)\backslash \Bbb H
作为Maass形式理论的一部分,算术量子唯一遍历性猜想在全纯形式理论中有一个完全类似的陈述。此猜想已由Soundararajan和Holowinsky证明,相关消息可以参见AIM的专题报道
作为QUE的提出人之一,Sarnak简要总结了相关论题截止到09年9月的进展。


  1. 反之,对于可积系统,我们则期待i \to \infty时,f_i发生局域化(localization)。 
  2. SCZ指的是Shnirelman, Yves Colin de Verdière和Zelditch. 

水調歌頭·二零一四

二祖慧可問初祖達磨曰:「諸佛法印,可得聞乎?」
祖曰:「諸佛法印,匪從人得。」
可曰:「我心未寧,乞師與安。」
祖曰:「將心來,與汝安。」
可良久曰:「覓心了不可得。」
祖曰:「我與汝安心竟。」

久未逢明月,今夜復孤寒。
聊因世事相問,月影便團團:
「但喚青燈侍酒,莫許紅顏入夢,誰似汝痴頑!」
蹇步固宜矣,大笑轉蹣跚。

杯擲卻,歌唱徹,劍空彈。
從頭翻悔,將心來已得心安。
不執不然不可,無念無身無患,天地又何言?
且作中宵舞,俯仰即人間。

爱因斯坦的上帝,刘慈欣的上帝

「上帝深奥难测,却绝无恶意。」(Raffiniert ist der Herrgott, aber boshaft ist Er nicht.) 此处的「上帝」并非基督教的耶和华,而是泛神论意义上的大自然1。爱因斯坦谈论的是自然研究者的某种普遍信仰,这一点在诺伯特·维纳(Norbert Wiener)的《人有人的用处》(The Human Use of Human Beings)里阐述得很清楚:摩尼教认为「恶」是某种人格化的力量,在永恒的涨落中处心积虑地妨碍人达致「善」;圣奥古斯丁(St.Augustine)则将「恶」定义为「善」的缺失,仅仅是一种暂时的、局部的现象,可以通过人的努力从图景中消除。科学家相信,他们所面对的「恶魔」——物质世界在表面上呈现出的无秩序状态——是奥古斯丁式的而非摩尼教式的。自然可能拒绝被轻易解读,但祂不会主动欺骗人类2

在《三体》中,刘慈欣设想了一个「自然欺骗人类」的场景。世界上的所有粒子加速器同时发生紊乱,对于同样条件下的实验,它们拒绝给出相同的结果。最终读者被告知,这确实是来自上帝的恶意,不过仅仅是来自「地球三体组织」3的「上帝」——三体星人。或许是因为担心对读者造成太过剧烈的冲击,刘慈欣并未跨过科幻小说的底线:他没有尝试肢解科学本身。然而对于自己笔下的人物,刘慈欣就吝于施舍同情了。《三体》中许多物理学家因为信仰粉碎而自杀,他们的生死仅悬于作者这位「上帝」的寥寥一笔。

我回忆起自己的高中时代。在一篇名为《落星》的小说里,我构想了一个因为宇宙秩序崩溃而陷入疯狂的巫觋。我很清楚这个隐喻的指向。小说仅仅是容器,它真正记录下的是一个陷入巨大激情的少年人,不惜乞灵于怀疑主义甚至虚无主义,挣扎着为自己去魅的努力。在几年后的今天看来,这不过是以较为矜持的方式表达了某种自恋,现实从来也不曾屈从于我的想象。如果一个人围绕某种信仰去构建他的人生,或许他的人生不可能比这种信仰本身更坚固。然而,如果你不曾那样活过,你很可能会低估那种信仰的强度。现在我可以有把握地说,科学家不会为了某个图景的崩坏而发疯,或者上吊。这不是因为他们不够虔诚,恰恰相反,是因为他们对爱因斯坦的上帝深信不疑。

这是否足以回应刘慈欣的非难呢?本质上,有两种构建小说的方式:沿着人物的个性漂流,而将种种境遇理解为小说世界的切面,抑或事先布置好舞台场景,再将人物抛掷到幻想的竞技场中。刘慈欣感兴趣的是极端状况下人的选择,他假定一个不可克服的世界,先就人的本性得出了自己的答案,之后才去考虑人作为小说中的角色将如何行动。对刘慈欣的拒绝也因此区分出不同的层面。

最为直接的否定是:刘慈欣构筑的世界并非不可克服。科学基础的崩坏或许将导致绝对的不可知论,但刘慈欣放弃了哲学意义上的探索。从「智子」正式登场的那一刻起,故事从超越的世界滑落现实,完全接受「科技锁死」而不作抵抗的失败主义从此成为所有人物不可反抗的「思想烙印」,在这个设定的帮助下作者才得以顺利地布置好舞台。为此他也付出了代价:牺牲了人物的真实,至少是人物的自由。我们希望——或者奢望——对人类社会的呈现是巴尔扎克式的,包括了每一类人的肖像。在刘慈欣的舞台上,始终只有经过他遴选的同一类人在起舞。

即使接受一个不可克服的世界,反对者依然可以争辩说这个世界不可能是真实的,甚至不是接近真实的:「不能脱离『人类历史』去谈『人类本质』,将人逼迫到悬崖边上拷问是施虐癖的体现,结果将是对人性的扭曲而非揭露。这令人产生情感上的不适,也不会带来满意的道德推论。」「这种假设没有意义。」

然而刘慈欣可以坚持提问:「如果这个世界是真实的呢?」

在现实的层面上拒绝某个答案并不意味着取消了问题本身。允许幻想,就必须允许提问。当《约伯记》里的上帝在旋风中显现:「如果我坚持要试炼你呢?强辩的岂可与全能者争论么?」信仰爱因斯坦的上帝之人又将如何回答4

在我看来,这是文学最有趣的地方——文本会超越作者的意图,而映照出读者本身的形象。

我愿意提供我的答案。每个人本来就面临一种不可克服的命运:个体的消亡。在托尔斯泰的故事里,人类原本可以预知自己的死期,耶稣担心这会导致堕落,因而收回了这种能力。我不知道别人会怎么选择,但「我将在明天死去」「三体舰队将在四百年后到来」无法吓倒我。在有生的瞬间我将继续播种,并不指望看到收获。

在更大的时间尺度上,一切「意义」都是渺小的。在我所知的范围内,宇宙也有自己不可克服的命运:「热寂」(heat death)。将一切压缩到一个故事中,强迫读者直面太阳系的终结,并不能使之变得更加恐怖。我仍将有尊严地活下去,并坦然面对终点。

三体文明经历了一轮又一轮毁灭,西西弗的石头一次又一次滚落原地。即使在没有希望的世界里,绝望也不是绝对的。确实存在一种理智的悲观主义可以抗衡上帝的恶意:“We shall go down, but let it be in a manner to which we may look forward as worthy of our dignity.”5


  1. 由此看来,Raffiniert ist der Herrgott不妨译作「道心惟微」。 
  2. 一种down-to-earth的诠释是将其理解为科学方法论上的建议,再朴素一点,关于「如何聪明地做选择」,例如当实验结果不尽如人意的时候,坚持「自然不会出错,是我错了」,可以节省一半的时间。爱因斯坦喜欢在这个意义上谈论上帝,例如著名的“I, at any rate, am convinced that He is not playing at dice.”
    对此的批判性意见可以上溯到尼尔斯·玻尔(Niels Bohr): “Einstein, don’t tell God what to do.” 其核心论点是:对「微妙」与「恶意」的区分不可避免地带有人类先入为主的偏见。对爱因斯坦来说,基于概率诠释的量子理论是「恶意」的,一个宇称不守恒的世界大概也是,尽管绝大多数现代物理学家愿意将其作为自然的「微妙」加以接受。 
  3. 刘慈欣对「地球三体组织」的构想并非毫无依据:类似「地球解放阵线」(Earth Liberation Front)的组织是真实存在的。 
  4. 后现代的宇宙图景更加开放地拥抱各种可能性,当代的物理学家不惮于设想「上帝或许是促狭的」。下面将要谈到的「我的答案」同样基于某种后现代思想,即加缪(Camus)式的存在主义。两者的共同点在于背离了对世界的古典理解:「如果『上帝』不存在,或者不是善意的,秩序和道德依然是可能的。」即使因此我们必须放弃秩序和道德的必然性,或许还要牺牲演化稳定性。 
  5. Wiener, The Human Use of Human Beings: Cybernetics and Society 

Spectra of Modular Surfaces I

下篇:Spectra of Modular Surfaces II

几天前,某篇宣称证明了Pólya猜想论文(基本可以确定是一记“乌龙”)在我的朋友圈里引发了一些讨论。一种观点是:与20年来复几何、辛几何方面的新思想(例如Donaldson学派为解决同调镜对称猜想而发展的一系列工作)相比,诸如Pólya猜想一类的几何分析问题已经过时了。
必须承认,Pólya猜想在理论上并没有太多有趣的推论。就方法论而言,它固然是特征值估计技术的试金石,但迄今为止,在Li-Yau方法的基础上并没有本质的进步,何况几何分析学家真正感兴趣的也仅仅是第一特征值,整个higher theory还有待发展。
然而,冒着“越俎代庖”的风险,我还是想为谱几何的整体价值稍作辩护。
Laplace算子的谱理论不仅是几何的一部分,也是无穷维表示论的样本。我手头恰好有一个相对晚近的例子,涉及特征值估计技术在模形式理论中的应用,兼有数论和量子物理两方面的重要性。就精神而言,这是Langlands纲领(数论的,几何的,物理的)一部分,是镜对称的“远亲”。
我第一次了解到这方面的数学,是在阅读了P.Sarnak的Baltimore讲稿之后:
Sarnak  Spectra of Hyperbolic Surfaces

经典Maass形式理论的研究对象包括
(1)上半平面\Bbb H在赋予Poincaré度量后成为常曲率双曲Riemann面,面积测度\displaystyle dA=\frac{dx \wedge dy}{y^2},Laplace算子\Delta=-y^2(\partial_x^2+\partial_y^2)
(2)模群PSL(2,\Bbb Z)通过Möbius变换\displaystyle z\mapsto \frac{az+b}{cz+d}作用于\Bbb H,我们感兴趣的子群包括:
(2.1)N阶主同余子群\Gamma(N)=\{\gamma\in PSL(2,\Bbb Z):\gamma \equiv I \pmod{N}\}.模群本身记为\Gamma(1)
(2.2)同余子群\Gamma:对某个N\Gamma(N) \subset \Gamma. 满足上述条件的最小的N称为\Gamma的阶;
(2.3)N阶Hecke同余子群\Gamma_0(N)=\{\gamma\in PSL(2,\Bbb Z):c\equiv 0 \pmod{N}\}
(3)模曲面X=\Gamma\backslash \Bbb H是有限面积的非紧双曲Riemann面。可以通过加入若干个尖点(cusp)使其紧化。X是满足特定算术性质的椭圆曲线的模空间(moduli space),这是经典椭圆函数论的一部分;
(4)Maass形式:满足\Delta f_\lambda=\lambda f_\lambda的光滑函数f_\lambda:X \to \Bbb C
Selberg细致地研究了(\Delta,X)的谱:
Selberg   On the estimation of Fourier coefficients of modular forms
具体地说,有界复函数\displaystyle \mathcal{B}(X) \subset \mathcal{L}(X)=L^2(X,dA)\Delta作用下分裂为2个正交不变子空间:\mathcal{B}(X)=\mathcal{C}(X)\oplus \mathcal{E}(X)
\mathcal{C}(X)由尖点型(cuspidal)函数f构成:f在任意尖点处的Fourier展开均无常数项,或者等价的,在环绕任意尖点的极限圆(horocycle)上有周期(period)0。
自共轭紧算子\Delta|_{\mathcal{C}(X)}有离散谱0=\lambda_0<\lambda_1\leq\lambda_2\leq \cdots\lambda_i \to \infty
由谱定理,\mathcal{C}(X)\mathcal{L}(X)中的完备化\tilde{\mathcal{C}}(X)拥有一组完备正交基对应\Delta的谱分解。
f \in \mathcal{E}(X)是一类Eisenstein级数\Delta|_{\mathcal{E}(X)}仅在\lambda=0处有点态谱,此外有连续谱[\displaystyle \frac{1}{4},\infty). 因而,对于特征值\lambda>0,相应的特征函数f_{\lambda}将自动成为Maass尖点形式1
\lambda=\nu(1-\nu)f_\lambda有Fourier-Whittaker展开:
\displaystyle f_{\lambda}(z)=\sum_{n \neq 0}a(n)\sqrt{2\pi y}K_{\nu-\frac{1}{2}}(2\pi|n|y)e(nx)Bessel函数\displaystyle K_\nu(y)=\int_0^{+\infty}e^{-y \cosh t}\cosh(\nu t)dt
Iwaniec  Introduction to the Spectral Theory of Automorphic Forms

X的算术性体现在Hecke算子作用于\mathcal{L}(X):对于N阶同余子群\Gamma(n,N)=1,定义
\displaystyle (T_nf)(z)=\frac{1}{\sqrt{n}}\sum_{ad=n}\sum_{b=0}^{d-1}f(\frac{az+b}{d})
(1)T_n正规算子\Gamma=\Gamma(1)\Gamma_0(N)时是自共轭算子;
(2)\displaystyle T_mT_n=T_nT_m=\sum_{d|(m,n)}T_{mn/d^2}T_n\Delta=\Delta T_n
(3)\mathcal{C}(X)T_n的不变子空间;
若尖点形式f_\lambda同时是所有T_n的特征函数,则称其为Maass-Hecke特征形式2,在标准化a(1)=1下,我们有T_nf_\lambda=a(n)f_\lambda,\forall n. 考虑Hecke L-函数
\displaystyle L(s,f_\lambda)=\sum_{n=1}^{\infty}a(n)n^{-s}=\prod_p(1-a(p)p^{-s}+p^{-2s})^{-1}
(Ramanujan-Petersson猜想)|a(p)|\leq 2,或者,|a(n)|\leq\sigma_0(n)\sigma_0因子函数
Deligne对Weil猜想的证明可推出全纯尖点形式的Ramanujan-Petersson猜想。Maass尖点形式的Ramanujan-Petersson猜想迄今为止尚未得到证明。

回到对\Delta的讨论。我们将另辟新章讨论作为算术量子混沌系统的(X,\Delta)及其高能渐进。在低能端,数论学家感兴趣的主要是第一特征值估计:
(Selberg 1/4猜想)\displaystyle \lambda_1(X)\geq \frac{1}{4},即\Delta大于0的离散谱完全落在连续谱\displaystyle [\frac{1}{4},\infty)中。
(Selberg 1/4猜想,几何分析形式)\forall f\in C^\infty_0(X)满足\int_X fdA=0,梯度估计
\displaystyle \int_X |\nabla f|^2 dA \geq \frac{1}{4}\int_X|f|^2dA成立。
不难证明1/4是最优的:N \to \infty时,(\Delta,X(N))的尖点谱在[\displaystyle \frac{1}{4},\infty)中趋于稠密。事实上,对于不可约2维偶Galois表示\rho:\mathrm{Gal}(K/\Bbb Q) \to GL(2,\Bbb C),若相应的Artin L-函数L(s,\rho)是整函数(即满足Artin猜想),则通过Langlands对应原理,它给出X(N)上的Maass尖点形式f_{1/4}N\rho的导子。
对于X(1),通过简单的推理即可得到强得多的下界,例如3\pi^2/2 (Vignéras). 对于一般的X,Selberg证明了\lambda_1(X)\geq 3/16.

从Langlands哲学的角度看,Ramanujan-Petersson猜想和Selberg 1/4猜想是同一个猜想在不同的位(place)上的体现。我们简单地说明这一点。
G(\Bbb Q)=GL(2,\Bbb Q)G(\Bbb A)=GL(2,\Bbb A)Z(\Bbb A)G(\Bbb A)的中心。G(\Bbb A)上有平凡中心特征的尖点形式空间L_0^2(Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A))\phi:G(\Bbb A) \to \Bbb C构成的Hilbert空间,\phi满足
(1)模性:\phi(\gamma g z)=\phi(g)\forall \gamma \in G(\Bbb Q),\forall z\in Z(\Bbb A)
(2)平方可积性:\displaystyle \int_{Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A)}|\phi(g)|^2dg <\infty
(3)尖点性:\displaystyle \int_{\Bbb Q\backslash \Bbb A}\phi(\begin{pmatrix}1&&x \\ 0&&1\end{pmatrix}g)dx=0\forall g\in G(\Bbb A)
G(\Bbb A)L_0^2(Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A))上的作用(\gamma f)(g)=f(g\gamma)给出G(\Bbb A)的酉表示,称为尖点表示(cuspidal representation),它可以分解为不可约可容许表示(admissible representation)的直和3
Maass-Hecke特征形式f可以唯一地提升为\phi_f\in L_0^2(Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A)),记相应的不可约表示为\pi_f,我们考虑\pi_f在不同位上的分解\pi_f=\pi_\infty \otimes \prod \pi_p. 对于非Archimedean位p和Archimedean位\infty处的可容许表示,我们分别有Bernstein–Zelevinsky分类Langlands分类作为参考的“地标”:
(Ramanujan-Petersson猜想,表示论形式)\pi_p主级数表示(p,N)=1
Satake  Spherical functions and Ramanujan’s conjecture
(Selberg 1/4猜想,表示论形式)\pi_\infty是主级数表示;
Langlands提出上述2个猜想可以由GL(2)\to GL(m+1)的Langlands函子性猜想推出。这决定性地影响了对Selberg猜想的现代研究。
m=2(Gelbart-Jacquet),m=3(Kim-Shahidi)和m=4(Kim)的函子性已得到证明。最后一个结果给出当前的最佳下界记录: \displaystyle \lambda_1(X)\geq \frac{975}{4096}=0.238\dots


  1. 这个现象体现了某种算术刚性:对于一般的(generic)双曲曲面X,Phillips-Sarnak理论暗示至多有有限个特征值以尖点形式为特征函数。
    Phillips, Sarnak  On cusp forms for cofinite subgroups of PSL(2,\Bbb R) 
  2. 基于大量数值实验,Cartier猜想(\Delta,X(1))的所有正特征值都是单特征值。如果这个猜想成立,那么X(1)的所有Maass尖点形式都是Maass-Hecke特征形式。 
  3. Jacquet和Langlands对GL(2)证明了重数1定理:在上述分解中每个不可约可容许表示有重数1. 一般地,我们希望决定所有使重数1定理成立的可约群。
    Jacquet, Langlands  Automorphic forms on GL(2) 

Algebraic Number Theory: Dirichlet’s Theorem Revisited

Number theory: An Approach Through History from Hammurapi to Legendre选择Legendre作为征程的句点,自然有其理由:在阅读Disquisitiones Arithmeticae时找到灵感进而提出Weil猜想的人,比谁都深刻地认识到“还不到总结Gauss的时候”。在Weil去世的16年之后,我们积累了更多证据支持这一判断,例如新科Fields奖得主Bhargava同样是在阅读Disquisitiones Arithmeticae时得到了PhD论文的灵感,从而做出了推广Gauss复合律的系列工作(,,)。
然而就思想史的脉络而言,我更愿意将Gauss和Einstein这样分水岭式的人物归入“旧世界”。Gauss,如同Euler, Lagrange和Legendre,是彻头彻尾的经验主义者,他们以巨人之姿勇敢地投身广袤的现象之海,以超凡的计算能力从中萃取原理。在Gauss和Riemann之间,在古典和现代之间,真正开启新范式的,是Gauss的狂热崇拜者、“一流数学家中的二流人物”——Dirichlet. 如Minkowski所说,”he possessed the art of connecting a maximum of seeing thoughts by means of a minimum of blind formulas”1,这对Riemann,乃至整个现代数学都产生了决定性的影响,数学自此在“现象-原理”之上获得了第三个维度“图景”——不仅要理解数学事实,更要将其放置于最合适的框架下来理解。

穿过Weil立下的“海格力斯之柱”(Pillars of Hercules),我想讨论Dirichlet最知名的工作——关于算术级数中素数分布的Dirichlet定理原论文发表于Abhandlungen der Königlichen Preußischen Akademie der Wissenschaften von 1837,有现成的英译本可供参考。

(Dirichlet定理)给定互素的aq,算术级数a+nq(n=1,2,\cdots)包含无穷多个素数。

如今看来,这个结果是完全初等的。然而,Dirichlet的证明却触碰到了Euler, Gauss甚至Riemann都未曾触碰到的领域。为了阐明“原理”,二次域的知识已经足够,但只有在类域论臻于完备后,才能找到这项工作在整体“图景”中的合适位置。

Euclid’s Theorem
q=1时Dirichlet定理退化为Euclid定理。Euler的证明给出了更精细的结果:在\mathrm{Re}(s)>1上取对数函数的主支,\displaystyle \log\zeta(s)=\sum_p \log\frac{1}{1-p^{-s}}=\sum_{n,p}1/np^{ns}
n \geq 2的部分绝对收敛。令s \to 1,得到
\displaystyle \sum_{p\leq X}\frac{1}{p}=\log\log X+O(1)X \to \infty
Dirichlet定理可以用完全类似的方式精细化:
\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}\log\log X+O(1)X \to \infty

The Theory of Dirichlet Characters
为得到形如\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}\sum_{p\leq X}\frac{1}{p}+\text{residue terms}的代数恒等式,Dirichlet首先假定d为素数并乞灵于单位根/分圆域理论。从今天的观点看,他将有限交换群的不可约复表示(Fourier分析的别名)引入了数论。
我们仅需要最简单的事实:令G_q=(\Bbb{Z}/q\Bbb{Z})^{*}特征\tilde{\chi}:G_q \to GL_1(\Bbb C)构成L^2(G_q)的完备正交基。对偶地,G_q也构成L^2(\hat{G_q})的完备正交基。
\tilde{\chi}扩张到\mathbb{Z}上,即得到Dirichlet特征\chi:\Bbb Z \to GL_1(\Bbb C). 为\displaystyle \frac{1}{p}赋权\displaystyle \frac{1}{\phi(q)}\sum_\chi \bar{\chi}(a)\chi(p),我们得以筛选出满足同余条件的p
\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}(\sum_{p\leq X}\frac{1}{p}+\sum_{\chi\neq 1}\chi(a)\sum_{p\leq X}\frac{\chi(p)}{p})
目标转为对\chi \neq 1证明\displaystyle \sum_{p\leq X}\frac{\chi(p)}{p}=O(1)X \to \infty.

The Dirichlet L-function
上述推理引向对Dirichlet L-函数的研究:
\displaystyle L(s,\chi)=\sum_{n=1}^{\infty}\frac{\chi(n)}{n^s}=\prod_p \frac{1}{1-\chi(p)p^{-s}}
\mathrm{Re}(s)>1上取对数函数的主支,\displaystyle \log L(s,\chi)=\sum_{n,p}\chi(p)^n/np^{ns}n \geq 2的部分依然绝对收敛。目标再次转为对\chi \neq 1证明L(1,\chi)\neq 0.
如下解析事实足以完成证明:\displaystyle \prod_\chi L(s,\chi)(如同L(s,1)=\zeta(s)一样)在s=1处有单极点。
Serre A Course in Arithmetic

Dirichlet的证明更加迂回,也因此包含了远为丰富的内容。我们先陈述较为一般的现代观点:给定\Bbb Q的代数扩张K
(1)Dedekind zeta函数\zeta_K(s)在极点s=1处的留数包含了K的整体算术信息,通常称为类数公式
(2)若K是Galois扩张,则\zeta_K(s)可以分解为Artin L-函数的乘积;
(3)若K是Abel扩张,则由Kronecker-Weber定理(或者更一般地,Artin互反律),Artin L-函数与本原(primitive)Dirichlet L-函数存在某种形式的一一对应;

Dirichlet完整地处理了K为二次域/\chi为本原二次特征的情况:此时
\displaystyle \zeta(s)L(s,\chi)=\zeta_K(s)K=\Bbb Q(\sqrt{\chi(-1)q})

(1)通常将二次域类数公式归于Dirichlet名下2
\displaystyle \mathrm{Res}_{s=1}\zeta_K(s)=\frac{2\pi h_K r_K}{w_K\sqrt{|D_K|}}
其中h_K为类数,r_K正规子(regulator),w_KK包含的单位根个数,D_K为判别式。
(Leibniz公式)取q=4,此时唯一的非平凡Dirichlet特征\chi满足\chi(1)=1\chi(3)=-1L(1,\chi)=\pi/4. 对照类数公式,这即是说\Bbb Q(\sqrt{-1})有类数1。

(2)令G=\mathrm{Gal}(K/\Bbb Q)为Abel群,\rho:G \to GL(1),定义Artin L-函数
\displaystyle L(s,\rho)=\prod_p\frac{1}{1-\rho(\sigma(p))p^{-s}}
此处\sigma(p)Frobenius自同构,约定表示\rho(\sigma(p))定义在惯性群的不变子空间上。
分解\displaystyle \zeta_K(s)=\zeta(s)\prod_{\rho \neq 1} L(s,\rho)是纯代数的:将正则表示分解为不可约表示。
对于二次域KG=\{1,-1\},此时仅有一个非平凡的\rho\rho(\sigma(p))=0当且仅当p分歧(ramified);\rho(\sigma(p))=1当且仅当分解(split);\rho(\sigma(p))=-1当且仅当p惯性(inert)。也就是说,p为奇素数时,\rho(\sigma(p))等同于Legendre符号\displaystyle (\frac{D_K}{p}).

(3)令K=\Bbb Q(\sqrt{\chi(-1)q})。暂时假定q是不包含平方的奇数。一方面,唯一的以q为导子(conductor)的本原二次Dirichlet特征\chi(p)Jacobi符号\displaystyle (\frac{p}{q});另一方面,判别式D_K=(-1)^{(q-1)/2}。此时Artin L-函数L(s,\rho)与Dirichlet L-函数L(s,\chi)的对应\displaystyle (\frac{D_K}{p})=(\frac{p}{q})不是别的,正是二次互反律

(3)可以用adele的观点理解:以\Bbb A\Bbb Qadele环\Bbb A^{*}=\Bbb Q^{*}\times\Bbb R_{+}^{*}\times \hat{\Bbb Z}^{*}.
对于K=\Bbb Q(\xi_q)G=\mathrm{Gal}(K/\Bbb Q)=G_q. 取逆向极限,由Kronecker-Weber定理知\displaystyle \mathrm{Gal}(\Bbb Q^{ab}/\Bbb Q)同构于\hat{\Bbb Z}^{*},进而同构于\Bbb Q^{*} \backslash \Bbb A^{*}=GL_1(\Bbb Q)\backslash GL_1(\Bbb A)的连通分支:Artin L-函数和Dirichlet L-函数源于同一个对象的一维表示。

作为(3)的“相对”版本,对于整体域K的Abel扩张,Dirichlet特征推广为Hecke特征。Hecke特征理论可以诠释为adele对象上的调和分析,这是“Tate论文”的主题。

对于K的非Abel扩张,Langlands考虑了GL_n(\Bbb A)自守尖点表示以及相应的L-函数。此种情况下的Langlands互反猜想(reciprocity conjecture)是Langlands函子性猜想(functoriality conjecture)的一部分。为了理解与之相关的表示论,他构建了一个庞大的理论框架,通常以Langlands纲领之名为人所知。

今时今日的数学中存在2类L-函数:一类L-函数源于动机,关于其解析性质(类似于上面的(1)),我们有数学中最知名的一些猜想:Riemann猜想,BSD猜想,etc.;另一类L-函数则源于自守表示论,更浪漫一些,“无穷维的对称”。证明他们是同一尊坚纽斯神(Janus)的两面,是Langlands和许多数学家孜孜以求的梦想,当然也不妨说是,Dirichlet之梦。


  1. Felix Klein, Development of Mathematics in the 19th Century, translated by M.Ackerman
    Arnold在某次访谈中提及的轶事在当代语境下诠释了这句名言:
    The Bourbakists claimed that all the great mathematicians were, using the words of Dirichlet, replacing blind calculations by clear ideas. The Bourbaki manifesto containing these words was translated into Russian as “all clear ideas were replaced by blind calculations.” The editor of the translation was Kolmogorov. His French was excellent. I was shocked to find such a mistake in the translation and discussed it with Kolmogorov. His answer was: I had not realized that something was wrong in the translation since the translator described the Bourbaki style much better than the Bourbakists did.
    我一直怀疑Arnold所说的误译其实是”all clear calculations were replaced by blind ideas”(这才是对Bourbaki风格的“最佳”描述)。由于他本人的口误或者记者的失察,把”calcultions”和”ideas”的位置对调了。 
  2. 第一个以某种形式得到二次域类数公式的人是Gauss,但一如既往,他没有发表这个结果。