Weil猜想漫谈 III:第二主题

通常在介绍Weil猜想时,「第二主题」的进入会被推迟到「末乐章」——即Deligne完成证明的最后一步。这不尽合乎历史发展的顺序,也破坏了Langlands所揭示的两个主题的对应结构。因此,我们决定在发展「第一主题」之前,让「第二主题」先行进入。具体地说,我们将暂时离开代数几何,而去考察起源于自守形式理论的另一大类L函数。

熟知模形式\displaystyle \Delta(z)=q\prod_{n=1}^{\infty}(1-q^n)^{24}q=e^{2\pi\sqrt{-1}z}是(精确到常数意义上)唯一的权为12的尖点形式
(1) \displaystyle \Delta(\frac{az+b}{cz+d})=(cz+d)^{12}\Delta(z)
(2) Fourier展开\displaystyle \Delta(z)=\sum_{n=1}^{\infty}\tau(n)q^n无常数项;
1916年,Ramanujan证明了:
(1) 对于素数p\tau(p) \equiv 1+p^{11}\mod 691
并提出了如下猜想:
(2) \tau满足递推式:
(2.1) \tau(mn)=\tau(m)\tau(n),若(m,n)=1
(2.2) \tau(p^{i+1})=\tau(p^{i})\tau(p)-p^{11}\tau(p^{i-1}),若p为素数;
或者等价的,
(2′) L函数\displaystyle L_\Delta=\sum_{n=1}^{\infty}\tau(n)n^{-s}有Euler积表示\displaystyle \prod_p Q_p(p^{-s})^{-1},其中Q_p(T)=1-\tau(p)T+p^{11} T^2
(3, Ramanujan猜想) |\tau(p)|<2p^{11/2},即Q_p(X)无实根;
结合(2),我们可以将(3)改写成等价的(请读者证明)
(3′) |\tau(n)|<\sigma_0(n)n^{11/2}\displaystyle \sigma_0(n)=\sum_{d|n}1除数函数
(3”) |\tau(n)|=O(n^{11/2+\epsilon})\forall \epsilon>0
注意,对Fourier系数的初等估计已给出\tau(n)=O(n^6).

(1)的证明只需注意到:作为权12的模形式,E_6^2可以表成\displaystyle E_{12}+\frac{a}{691}\Deltaa \in \Bbb Z
691的出现是因为我们有Eisenstein级数展开:
\displaystyle E_{12}(z)=1+\frac{65520}{691}\sum_{n=1}^{\infty}\sigma_{11}(n)q^n\displaystyle \sigma_q(n)=\sum_{d|n}d^q
Mordell对(2)的证明发展为Hecke理论1
以下称模形式f是归一的,若f的Fourier系数\lambda_f(n)=O(n^C)C>0,且\lambda_f(1)=1.
在权为k的模形式空间M_k上可定义Hecke算子T_k(n): M_k \to M_k,满足T_k(m)T_k(n)=T_k(n)T_k(m).
若归一模形式f同时为所有Hecke算子T(n)的特征函数,则f有对应的Hecke L函数
\displaystyle L_f(s)=\sum_{n=1}^{\infty}\lambda_f(n)n^{-s}=\prod_p(1-\lambda_f(p)p^{-s}+p^{k-1-2s})^{-1}
(Hecke) \hat{L}_f(s)=(2\pi)^{-s}\Gamma(s)L_f(s)可解析延拓为:整函数,若f是尖点形式;仅在s=0s=k处有单极点的亚纯函数,若f非尖点形式。\hat{L}_f满足函数方程\hat{L}_f(k-s)=(-1)^{k/2}\hat{L}(s).
特别地,限制到尖点形式空间S_k上,Petersson内积使Hecke算子成为一族可互换的自共轭算子,从而给出S_k的一族正交单位基。对于归一Hecke特征形式f,我们可以将(3)推广为
(Ramanujan-Petersson猜想) |\lambda_f(p)|<2p^{(k-1)/2},或者等价的,|\lambda_f(n)|=O(n^{(k-1)/2+\epsilon})\forall \epsilon>0

1939年Rankin迈出了朝Ramanujan-Petersson猜想推进的第一步。这是著名的Rankin-Selberg方法的一个应用。
给定权为k的归一模形式\displaystyle f(z)=\sum_{n=1}^{\infty}a(n)q^n\displaystyle g(z)=\sum_{n=1}^{\infty}b(n)q^n,考虑对应的Hecke L函数\displaystyle L_f(s)=\prod_p[(1-\alpha_1(p)p^{-s})(1-\alpha_2(p)p^{-s})]^{-1}\displaystyle L_g(s)=\prod_p[(1-\beta_1(p)p^{-s})(1-\beta_2(p)p^{-s})]^{-1}
此时我们可以定义张量积\displaystyle L_{f\otimes g}(s)=\prod_p[(1-\alpha_1\beta_1(p)p^{-s})(1-\alpha_1\beta_2(p)p^{-s})(1-\alpha_2\beta_1(p)p^{-s})(1-\alpha_2\beta_2(p)p^{-s})]^{-1}
不难证明\displaystyle L_{f\otimes g}(s)=\zeta(2s-2k+2)\sum_{n=1}^{\infty}a(n)b(n)n^{-s}.
(Rankin-Selberg)\displaystyle \hat{L}_{f\otimes g}(s)=(2\pi)^{-2s}\Gamma(s)\Gamma(s-k+1)L_{f\otimes g}(s)可以延拓为全平面上的亚纯函数,至多在s=ks=k-1处有单极点,并满足函数方程\displaystyle \hat{L}_{f\otimes g}(s)=\hat{L}_{f\otimes g}(2k-1-s).
例1\displaystyle g=-\frac{B_k}{2k}E_k\displaystyle L_{f \otimes g}(s)=L_f(s)L_f(s-k+1). 注意到此式给出了又一种解析延拓L_f(s)的方式。
例2 L_{f \otimes f}(s)s=ks=k-1处有单极点,由此知Dirichlet级数\displaystyle D(s)=\sum_{n=1}^{\infty}\lambda_f(n)^2 n^{-s}的所有可能极点中,s=k的实部最大。
另一方面,给定\displaystyle \sum_{n=1}^{\infty}c_nn^{-s}c_n\in \Bbb R_{+},我们有经典的
(Landau) 若该Dirichlet级数在某个半平面\Re{s}>l内绝对收敛,l_0=\inf \{l\} >-\infty,则级数在s=l_0处有奇点。
特别的,D(s)\Re{s}>k内绝对收敛。若将D(s)在绝对收敛区域内写成Euler积形式\displaystyle D(s)=\prod_p \frac{1}{(1-a_{p,1}p^{-s})\cdots(1-a_{p,m}p^{-s})},则|a_{p,i}|\leq p^k\forall p,i.
通过仔细分析这些a_{p,i},可以改进初等估计|\lambda_f(n)|=O(n^{k/2})
(Rankin) |\lambda_f(n)|=O(n^{k/2-1/5})

我们对模形式理论的讨论暂告一段落。从经典的观点看,Ramanujan \tau函数似乎与Weil猜想了无关联。Weil的确注意到Euler因子Q_p(T)=1-\tau(p)T+p^{11} T^2与局部\zeta函数的Euler因子Z_C(T)存在某种相似性,并提出或许可以通过研究(假想的)「Ramanujan簇」证明\tau函数满足的其他同余关系2。然而真正在两者之间建立起坚实的联系却是60年代后期的事情:此时l进上同调,l进表示,乃至由Eichler-志村等人肇始、以谷山-志村猜想的形式出现,又由Langlands极大推广的「动机L函数-自守L函数」对应等一系列思想都臻于成熟。
当我们的「第二主题」以表示论的形式再次响起时,读者将会较清楚地看到上述思想的互相关联。再往后就是乐曲的高潮:Deligne综合了所有这些发展,得到了一个伟大的「交互证明」,即借助(经Langlands推广后的)Rankin技巧证明了Weil猜想,又利用Weil猜想给出了Ramanujan-Petersson猜想的证明。


  1. 对于实解析的Maass形式也可以发展完全类似的理论,参见我们之前的讨论。这种情况下的Ramanujan-Petersson猜想仍是开问题。另一方面,可以利用表示论的观点对Hecke理论进行重述和推广,参见Bump, Automorphic Forms and Representations
  2. 参见他在1960年写给Serre的私人信件。Milne, The Riemann Hypothesis over Finite Fiels: From Weil to the Present Day收录了此信的影印件,并附有英文翻译。 

Spectra of Modular Surfaces II

上篇:Spectra of Modular Surfaces I

考虑紧致无边Riemann流形M上的自由粒子运动,
(经典模型)作为等能面的单位切丛S(M)\to M,以及作为Hamilton流的测地流\mathcal{G}_t:S(M) \to S(M)
负曲率流形上的Hamilton流是经典混沌系统的典型例子(Hopf, Moser, Sinai, etc.)。
(量子模型)视\Delta为Schrödinger算子,我们得到一个量子混沌系统。
在量子混沌的领域中有大量基于数值实验的猜想有待解决,主要的技术手段是准经典分析(semi-classical analysis)。另一方面,由于\triangleHecke算子交换,算术流形上的量子混沌系统通常有强得多的代数刚性,在许多方面表现得更像是量子可积系统,因而得到了更多成果。
以下讨论将遵循soft vs. hard的二分(dichotomy):先对一般的Riemann流形(M,\triangle)做出陈述,之后承袭对模曲面(X,\triangle)的讨论,将其作为算术模型的特例加以比较。

Distribution of the Eigenvalues
定义N(\lambda)=\{j:\lambda_j\leq \lambda\},研究N(\lambda)的渐进行为是谱几何中的重要论题。
对于紧流形M^n,我们有经典的Weyl密度估计\displaystyle \frac{1}{\lambda}N(\lambda) \to \frac{V(B^n)}{(2\pi)^n}V(M,g)\lambda \to \inftyX的算术性在一定程度上“补偿”了非紧性,这使得Selberg能够利用Selberg迹公式证明同样类型的密度估计\displaystyle \frac{1}{\lambda}N(\lambda) \to \frac{1}{4\pi}V(X)\lambda \to \infty
另一个常见的考察对象是相邻特征值间距的分布。对于量子混沌系统,通常我们期望其相邻特征值的间距分布得足够随机,即满足某个Gauss系综(Gaussian ensemble),但算术量子混沌系统的情况有所不同。
具体地说,对于X(1)=\Gamma(1)\backslash \Bbb H,基于数值实验,我们有
(Cartier猜想) \triangle的所有大于0的(尖点)特征值都是单重的。
V(X(1))=\pi/3,故此时(\lambda_{i+1}-\lambda_i)/12的期望值为1. 在此归一化下,数值实验显示\triangle的相邻特征值间距满足指数分布:
(Steil猜想)\displaystyle \frac{\#\{i\leq N:(\lambda_{i+1}-\lambda_i)/12 \in[\alpha,\beta]\}}{N} \to \int_\alpha^\beta e^{-x}dxN \to \infty
最后是一点题外话。“算术对象服从量子统计”,此类规律通常有大量数值证据支持,却难以从理论上加以证明。很多时候我们甚至无法像上述例子一样,找到一个将物理与数论自然结合的理论框架。以下是2个例子:关于Riemann zeta函数的Montgomery-Odlyzko猜想,以及新近提出的关于椭圆曲线的BKLPR猜想

Quamtum Ergodicity
遍历性(ergodicity)是混沌系统的本质特征之一。量子系统的高能极限对应于h\to 0的准经典近似,我们有理由期待i \to \infty时特征函数f_i趋于X上的一致分布1。我们有2种方式将这一命题精确化:
考虑概率测度\mu_\psi=|\psi|^2dgS(M)上的微局部提升(microlocal lift)\nu_\psi,已知
(SCZ量子遍历定理2)若测地流\mathcal{G}_t:S(M) \to S(M)是遍历的,则\forall \psi\in C_0^\infty(S(M))\displaystyle \frac{1}{N(\lambda)}\sum_{\lambda_i \leq \lambda}|\nu_{f_i}(\psi)-\bar{\psi}|^2=o(1)\lambda \to \infty
Zelditch  Quantum ergodicity of C^{*} dynamical systems
我们称\nu_{f_i}的弱极限为量子极限。由Egorov定理,它是一个\mathcal{G}_t不变的概率测度。比SCZ量子遍历定理更强的,我们有
(量子唯一遍历性猜想,QUE)\nu_{f_i}有唯一的量子极限:S(M)上的Haar测度\nu
Rudnick, Sarnak  The behavior of eigenstates of arithmetic hyperbolic manifolds
已获证明的结果全部来自算术曲面:由于在算术动力系统方面的一系列工作,包括证明了紧算术曲面上的QUE,Lindenstrauss获得2010年的Fields奖。在此基础上,Soundararajan证明了非紧算术曲面上的QUE.
Lindenstrauss  Invariant measures and arithmetic quantum unique ergodicity
Soundararajan  Quantum Unique ergodicity for SL_2(\Bbb Z)\backslash \Bbb H
作为Maass形式理论的一部分,算术量子唯一遍历性猜想在全纯形式理论中有一个完全类似的陈述。此猜想已由Soundararajan和Holowinsky证明,相关消息可以参见AIM的专题报道
作为QUE的提出人之一,Sarnak简要总结了相关论题截止到09年9月的进展。


  1. 反之,对于可积系统,我们则期待i \to \infty时,f_i发生局域化(localization)。 
  2. SCZ指的是Shnirelman, Yves Colin de Verdière和Zelditch. 

Spectra of Modular Surfaces I

下篇:Spectra of Modular Surfaces II

几天前,某篇宣称证明了Pólya猜想论文(基本可以确定是一记“乌龙”)在我的朋友圈里引发了一些讨论。一种观点是:与20年来复几何、辛几何方面的新思想(例如Donaldson学派为解决同调镜对称猜想而发展的一系列工作)相比,诸如Pólya猜想一类的几何分析问题已经过时了。
必须承认,Pólya猜想在理论上并没有太多有趣的推论。就方法论而言,它固然是特征值估计技术的试金石,但迄今为止,在Li-Yau方法的基础上并没有本质的进步,何况几何分析学家真正感兴趣的也仅仅是第一特征值,整个higher theory还有待发展。
然而,冒着“越俎代庖”的风险,我还是想为谱几何的整体价值稍作辩护。
Laplace算子的谱理论不仅是几何的一部分,也是无穷维表示论的样本。我手头恰好有一个相对晚近的例子,涉及特征值估计技术在模形式理论中的应用,兼有数论和量子物理两方面的重要性。就精神而言,这是Langlands纲领(数论的,几何的,物理的)一部分,是镜对称的“远亲”。
我第一次了解到这方面的数学,是在阅读了P.Sarnak的Baltimore讲稿之后:
Sarnak  Spectra of Hyperbolic Surfaces

经典Maass形式理论的研究对象包括
(1)上半平面\Bbb H在赋予Poincaré度量后成为常曲率双曲Riemann面,面积测度\displaystyle dA=\frac{dx \wedge dy}{y^2},Laplace算子\Delta=-y^2(\partial_x^2+\partial_y^2)
(2)模群PSL(2,\Bbb Z)通过Möbius变换\displaystyle z\mapsto \frac{az+b}{cz+d}作用于\Bbb H,我们感兴趣的子群包括:
(2.1)N阶主同余子群\Gamma(N)=\{\gamma\in PSL(2,\Bbb Z):\gamma \equiv I \pmod{N}\}.模群本身记为\Gamma(1)
(2.2)同余子群\Gamma:对某个N\Gamma(N) \subset \Gamma. 满足上述条件的最小的N称为\Gamma的阶;
(2.3)N阶Hecke同余子群\Gamma_0(N)=\{\gamma\in PSL(2,\Bbb Z):c\equiv 0 \pmod{N}\}
(3)模曲面X=\Gamma\backslash \Bbb H是有限面积的非紧双曲Riemann面。可以通过加入若干个尖点(cusp)使其紧化。X是满足特定算术性质的椭圆曲线的模空间(moduli space),这是经典模曲线理论的一部分;
(4)Maass形式:满足\Delta f_\lambda=\lambda f_\lambda的光滑函数f_\lambda:X \to \Bbb C
Selberg细致地研究了(\Delta,X)的谱:
Selberg   On the estimation of Fourier coefficients of modular forms
具体地说,有界复函数\displaystyle \mathcal{B}(X) \subset \mathcal{L}(X)=L^2(X,dA)\Delta作用下分裂为2个正交不变子空间:\mathcal{B}(X)=\mathcal{C}(X)\oplus \mathcal{E}(X)
\mathcal{C}(X)由尖点型(cuspidal)函数f构成:f在尖点处的Fourier展开无常数项,或者等价的,在环绕尖点的极限圆(horocycle)上有周期(period)0。
自共轭紧算子\Delta|_{\mathcal{C}(X)}有离散谱0=\lambda_0<\lambda_1\leq\lambda_2\leq \cdots\lambda_i \to \infty
由谱定理,\mathcal{C}(X)\mathcal{L}(X)中的完备化\tilde{\mathcal{C}}(X)拥有一组完备正交基对应\Delta的谱分解。
f \in \mathcal{E}(X)是一类Eisenstein级数\Delta|_{\mathcal{E}(X)}仅在\lambda=0处有点态谱,此外有连续谱[\displaystyle \frac{1}{4},\infty). 因而,对于特征值\lambda>0,相应的特征函数f_{\lambda}将自动成为Maass尖点形式1
\lambda=\nu(1-\nu)f_\lambda有Fourier-Whittaker展开:
\displaystyle f_{\lambda}(z)=\sum_{n \neq 0}a(n)\sqrt{2\pi y}K_{\nu-\frac{1}{2}}(2\pi|n|y)e(nx)Bessel函数\displaystyle K_\nu(y)=\int_0^{+\infty}e^{-y \cosh t}\cosh(\nu t)dt
Iwaniec  Introduction to the Spectral Theory of Automorphic Forms

X的算术性体现在Hecke算子作用于\mathcal{L}(X):对于N阶同余子群\Gamma(n,N)=1,定义
\displaystyle (T_nf)(z)=\frac{1}{\sqrt{n}}\sum_{ad=n}\sum_{b=0}^{d-1}f(\frac{az+b}{d})
(1)T_n正规算子\Gamma=\Gamma(1)\Gamma_0(N)时是自共轭算子;
(2)\displaystyle T_mT_n=T_nT_m=\sum_{d|(m,n)}T_{mn/d^2}T_n\Delta=\Delta T_n
(3)\mathcal{C}(X)T_n的不变子空间;
若尖点形式f_\lambda同时是所有T_n的特征函数,则称其为Maass-Hecke特征形式2,在标准化a(1)=1下,我们有T_nf_\lambda=a(n)f_\lambda,\forall n. 考虑Hecke L-函数
\displaystyle L(s,f_\lambda)=\sum_{n=1}^{\infty}a(n)n^{-s}=\prod_p(1-a(p)p^{-s}+p^{-2s})^{-1}
(Ramanujan-Petersson猜想)|a(p)|\leq 2,或者,|a(n)|\leq\sigma_0(n)\sigma_0因子函数
Deligne对Weil猜想的证明可推出全纯尖点形式的Ramanujan-Petersson猜想。Maass尖点形式的Ramanujan-Petersson猜想迄今为止尚未得到证明。

回到对\Delta的讨论。我们将另辟新章讨论作为算术量子混沌系统的(X,\Delta)及其高能渐进。在低能端,数论学家感兴趣的主要是第一特征值估计:
(Selberg 1/4猜想)\displaystyle \lambda_1(X)\geq \frac{1}{4},即\Delta大于0的离散谱完全落在连续谱\displaystyle [\frac{1}{4},\infty)中。
(Selberg 1/4猜想,几何分析形式)\forall f\in C^\infty_0(X)满足\int_X fdA=0,梯度估计
\displaystyle \int_X |\nabla f|^2 dA \geq \frac{1}{4}\int_X|f|^2dA成立。
不难证明1/4是最优的:N \to \infty时,(\Delta,X(N))的尖点谱在[\displaystyle \frac{1}{4},\infty)中趋于稠密。事实上,对于不可约2维偶Galois表示\rho:\mathrm{Gal}(K/\Bbb Q) \to GL(2,\Bbb C),若相应的Artin L-函数L(s,\rho)是整函数(即满足Artin猜想),则通过Langlands对应原理,它给出X(N)上的Maass尖点形式f_{1/4}N\rho的导子。
对于X(1),通过简单的推理即可得到强得多的下界,例如3\pi^2/2 (Vignéras). 对于一般的X,Selberg证明了\lambda_1(X)\geq 3/16,对这个结果感兴趣的读者不妨参考陶哲轩的博文,在此文中他同时还证明了Selberg 1/4猜想等价于关于Kloosterman和的Linnik猜想。文中将Lax-Phillips散射理论应用于自守波动方程的想法由Faddeev和Pavlov首倡,参见
Lax, Phillips Scattering theory for automorphic functions

从Langlands哲学的角度看,Ramanujan-Petersson猜想和Selberg 1/4猜想是同一个猜想在不同的位(place)上的体现。我们简单地说明这一点。
G(\Bbb Q)=GL(2,\Bbb Q)G(\Bbb A)=GL(2,\Bbb A)Z(\Bbb A)G(\Bbb A)的中心。G(\Bbb A)上有平凡中心特征的尖点形式空间L_0^2(Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A))\phi:G(\Bbb A) \to \Bbb C构成的Hilbert空间,\phi满足
(1)模性:\phi(\gamma g z)=\phi(g)\forall \gamma \in G(\Bbb Q),\forall z\in Z(\Bbb A)
(2)平方可积性:\displaystyle \int_{Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A)}|\phi(g)|^2dg <\infty
(3)尖点性:\displaystyle \int_{\Bbb Q\backslash \Bbb A}\phi(\begin{pmatrix}1&&x \\ 0&&1\end{pmatrix}g)dx=0\forall g\in G(\Bbb A)
G(\Bbb A)L_0^2(Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A))上的作用(\gamma f)(g)=f(g\gamma)给出G(\Bbb A)的酉表示,称为尖点表示(cuspidal representation),它可以分解为不可约可容许表示(admissible representation)的直和3
Maass-Hecke特征形式f可以唯一地提升为\phi_f\in L_0^2(Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A)),记相应的不可约表示为\pi_f,我们考虑\pi_f在不同位上的分解\pi_f=\pi_\infty \otimes \prod \pi_p. 对于非Archimedean位p和Archimedean位\infty处的可容许表示,我们分别有Bernstein–Zelevinsky分类Langlands分类作为参考的“地标”:
(Ramanujan-Petersson猜想,表示论形式)\pi_p主级数表示(p,N)=1
Satake  Spherical functions and Ramanujan’s conjecture
(Selberg 1/4猜想,表示论形式)\pi_\infty是主级数表示;
Langlands提出上述2个猜想可以由GL(2)\to GL(m+1)的Langlands函子性猜想推出。这决定性地影响了对Selberg猜想的现代研究。
m=2(Gelbart-Jacquet),m=3(Kim-Shahidi)和m=4(Kim)的函子性已得到证明。最后一个结果给出当前的最佳下界记录: \displaystyle \lambda_1(X)\geq \frac{975}{4096}=0.238\dots


  1. 这个现象体现了某种算术刚性:对于一般的(generic)双曲曲面X,Phillips-Sarnak理论暗示至多有有限个特征值以尖点形式为特征函数。
    Phillips, Sarnak  On cusp forms for cofinite subgroups of PSL(2,\Bbb R) 
  2. 基于大量数值实验,Cartier猜想(\Delta,X(1))的所有正特征值都是单特征值。如果这个猜想成立,那么X(1)的所有Maass尖点形式都是Maass-Hecke特征形式。 
  3. Jacquet和Langlands对GL(2)证明了重数1定理:在上述分解中每个不可约可容许表示有重数1. 一般地,我们希望决定所有使重数1定理成立的可约群。
    Jacquet, Langlands  Automorphic forms on GL(2) 

有理域上的代数曲线 Ⅶ

作为这个系列的谢幕,我们回到1维,介绍椭圆曲线研究中最激动人心的近代结果。

假定\mathfrak{E}\mathbb{Q}_p上的椭圆曲线。v: \mathbb{Q}_p \to \mathbb{Z}表示\mathbb{Q}_p上的离散赋值。赋值的离散性允许我们选取一类“极小”方程代表\mathfrak{E}。具体地说,通过适当的坐标变换可以让方程的系数\in \mathbb{Z}_p。此时v(\triangle) \geq 0,使v(\triangle)取到极小值的方程称为\mathfrak{E}的极小Weierstrass模型。

\mathbb{Z}_p \to \mathbb{Z}_p/p\mathbb{Z}_p=\mathbb{F}_p作用于\mathfrak{E}的极小Weierstrass模型,得到有限域\mathbb{F}_p上的曲线\mathfrak{E}_p,这称为椭圆曲线的约化。约化后的\mathfrak{E}_p可能带有奇点,但常点\mathfrak{E}_p^{*}仍构成Abel群。

v(\triangle)=0,则\mathfrak{E}_p是椭圆曲线,这时称约化为好的,否则为坏的。坏约化又可以根据奇点的性质分为:乘法约化,此时奇点是节点(右图);加法约化,此时奇点是尖点(左图)。

乘法约化在奇点处带来2条切线。若两条切线的斜率均属于\mathbb{F}_p,则此乘法约化称为分裂的,否则称为非分裂的。

\mathbb{F}_p上的曲线\mathfrak{E}_p,定义L_p(T)如下:对加法约化,L_p(T)=1;对分裂的乘法约化,L_p(T)=1-T;对非分裂的乘法约化,L_p(T)=1+T;对好约化,L_p(T)=1-a(p)T+pT^2,其中a(p)=p+1-|\mathfrak{E}_p(\mathbb{F}_p)|

以上定义是纯形式的。事实上L_p(T)反应了\mathfrak{E}_p的性质:L_p(1/p)=|\mathfrak{E}_p^{*}(\mathbb{F}_p)|/p。若\mathfrak{E}_p是椭圆曲线,这个等式对应Weil猜想

现在转回对整体域的讨论。\mathbb{Q}上的椭圆曲线\mathfrak{E}在每个p处均有相应的约化。若\mathfrak{E}没有加法约化,则称其为半稳定的。采用这个术语的原因是加法约化将在基域扩张下消失:

\mathbb{Q}上的椭圆曲线\mathfrak{E},存在数域K使得\mathfrak{E}K上的半稳定椭圆曲线(即在K的所有位上\mathfrak{E}的约化都是好的或乘法的)。

“局部-整体”原理在亏格大于0的代数曲线上不再成立。作为替代,可以将各个局部的信息集合成Hasse-Weil L函数L_{\mathfrak{E}}(s)=\prod_{p} L_{p}(p^{-s})^{-1}

v(\triangle) \neq 0等价于p|\triangle,故坏约化仅有有限个,上述Euler积收敛与否取决于a_p。通过估计|\mathfrak{E}_p(\mathbb{F}_p)|,Hasse证明了|a(p)| \leq 2\sqrt{p},从而L_{\mathfrak{E}}(s)Re(s)>\frac{3}{2}收敛。

收敛区域内的Euler积也可写为Dirichlet级数\sum a(n) n^{-s},此处a(n):\mathbb{N} \to \mathbb{Z}是由a(p)扩充而成的积性函数:对加法约化,定义a(p^m)=0;对分裂的乘法约化,定义a(p^m)=1;对非分裂的乘法约化,定义a(p^m)=(-1)^{m+1};对好约化,定义a(p^m)=a(p)a(p^{m-1})-pa(p^{m-2})

将上述讨论与Ramanujan猜想进行对比是有趣的。

类比Riemann \zeta函数,一个自然的猜想是L_{\mathfrak{E}}(s)可以解析延拓到整个复平面。截至上世纪90年代,仅对带有复乘的椭圆曲线(Deuring, Weil)和模椭圆曲线(Eichler, Shimura)证实了此猜想:这意味着Birch和Swinnerton-Dyer在提出他们的著名猜想时,甚至不知道是否所有的L_{\mathfrak{E}}(s)都在s=1处有定义!

突破来自于对Taniyama-Shimura猜想的研究。这一猜想可以粗略地叙述为:所有椭圆曲线都是模曲线。更精确地说,\sum a(n)e^{2n\pi iz}是对应于某个同余子群的权为2的自守形式。这一对应是Langlands纲领的特例。

1994年,Wiles对半稳定的椭圆曲线证明了Taniyama-Shimura猜想。由于86年Frey在假定Fermat大定理不成立的情况下构造出了违背Serre \epsilon猜想及Taniyama-Shimura猜想的半稳定椭圆曲线,而Serre \epsilon猜想已于89年被Ribet证明,Wiles的结果推出Fermat大定理

A.Wiles(1953-  )

2001年,基于Wiles方法,Breuil, Conrad, Diamond和Taylor完全证明了Taniyama-Shimura猜想(模定理)。与Eichler, Shimura的结果相结合,这也解决了L_{\mathfrak{E}}(s)的解析延拓问题(甚至证明了此情况下的Riemann猜想)。

从模函数到单值化定理 Ⅶ

Prologue:

…Here was a man who could work out modular equations and theorems… to orders unheard of, whose mastery of continued fractions was… beyond that of any mathematician in the world, who had found for himself the functional

equation of the zeta function and the dominant terms of many of the most famous problems in the analytic theory of numbers; and yet he had never heard of a doubly periodic function or of Cauchy’s theorem, and had indeed but the vaguest idea of what a function of a complex variable was…

——G.H.Hardy

S.Ramanujan (1887-1920)

站在旅程的终点,我们还想眺望一下远处的风景。Fuchs群PSL(2,\mathbb{Z})称为模群,它有丰富的算术性质。利用与模群相联系的自守形式来研究数论是一个强有力的方法,在本系列中我们无意深入这一极为广阔的领域。就当前的兴趣而言,考察模形式出于如下2个目的:1)揭示之前介绍过的系列对象之间的联系,以期形成一个较完整的印象;2)为“代数几何-复几何”处在纯数学研究的中心位置再添一个例证。

今后我们用\Gamma表示模群。\Gamma并非无挠地作用在\mathbb{H}上。具体地说,\Gamma中包含椭圆型元素S=\left({\begin{array}{cc} 0&-1\\ 1&0\\ \end{array}}\right)T=\left({\begin{array}{cc} 1&1\\ 0&1\\ \end{array}}\right),因而在上半平面带来3个椭圆型不动点i,\rho,\rho^{2}。事实上,\Gamma=<S,T;S^{2}=1,(ST)^{3}=1>,故它们也是仅有的不动点:i是2阶的,其余两个是3阶的。

我们可以定出\mathbb{H}/\Gamma的基本域(图中阴影部分)。由于\Gamma不是无挠的,在基本域上引入解析结构略显微妙,关键在于3个不动点处:对i用半个参数盘来覆盖,对\rho,\rho^{2}则分别用\frac{1}{3}个参数盘。加入i\infty\mathbb{H}/\Gamma进行紧化,由单值化定理,单连通的\overline{\mathbb{H}/\Gamma}解析同构于\mathbb{C}P^{1}

注意到\mathbb{H}/\Gamma正是椭圆曲线的模空间,故而对椭圆曲线定义的“数”成为\mathbb{H}/\Gamma上的“函数”:例如Eisenstein级数。更准确地说,在上半平面定义G_{k}(z)=\sum^{\prime}\frac{1}{(mz+n)^{2k}}。视其为特征为0的特殊Poincaré级数,有自守关系G_{k}(z)=J_{g}^{k}G_{k}(gz)g \in \Gamma。利用\Gamma的生成元可将自守关系改写为:G_{k}(z+1)=G_{k}(z)G_{k}(-1/z)=z^{2k}G_{k}(z)

引入几个一般的术语。满足上述自守关系的函数被称为权为k的弱模函数。如果其在i\infty处是亚纯的,则称为模函数。在上半平面处处全纯(包括无穷远点)的模函数称为模形式。在无穷远点取0值的模形式称为尖点形式。不难证明G_{k}(\infty)=2\zeta(2k)\zeta(z)为Riemann zeta函数,故Eisenstein级数为模形式。特别地,椭圆曲线的判别式函数\DeltaG_{2},G_{3}的多项式,计算表明\Delta(\infty)=0,故其为权为6的尖点形式。

以上例子是有典型意义的。事实上,Riemann-Roch定理给出:Riemann面上权为k的模形式构成一线性空间,其维数为(2k-1)(g-1)+kp+\sum[k(1-\frac{1}{e_{i}})],其中g为亏格,p为抛物型不动点的个数,e_{i}为每个抛物型不动点的阶数,[ x]表示对x取整。应用到当前的情况,知若k \equiv 1(mod 6),相应的函数空间为[k/6]维,否则为[k/6]+1维。特别的,在相差一个常数的意义下,G_{2}G_{3}是唯一的权为2的和权为3的模形式,继而用归纳法不难证明,所有模形式构成的分次代数同构于\mathbb{C}[G_{2},G_{3}]。这一结构性定理在模形式的研究中是很重要的。

所有权为0的模函数的结构也是清楚的:它们可以表为2个同权模形式的商。经典的例子是Klein考察过的j=G_{2}^{3}/\Delta。它定义了\overline{\mathbb{H}/\Gamma}\bar{\mathbb{C}}的双射。考察\bar{\mathbb{C}}的解析自同构群,容易证明任何一个权为0的模函数都是j的有理函数。

由于f(z+1)=f(z),故每一个模函数在原点附近都有一个亚纯的Fourier展开。研究系数的增长速率和系数间的代数关系在数论上有很重要的推论。我们将会对此略加说明。

对于尖点形式\Delta,其Fourier展开式有特别优美的形式:

(Jacobi) \Delta=(2\pi)^{12}q \prod (1-q^{n})^{24}q=e^{2\pi iz}

从椭圆函数论的角度可以给出一个想法很自然的证明。这也是Jacobi的原始证明。具体地说,Jacobi用以构造椭圆函数的theta函数,其Fourier展开有自然的周期性。我们需要做的,不过是用这些theta级数构造出\mathfrak{P}\mathfrak{P}^{\prime},由此即可得到\Delta的一个Fourier展开。

以上我们讨论了模函数在函数论方面的性质。对模函数数论性质的现代研究在多个方向上受到Ramanujan工作的启发。为了不偏离主题,我们仅勾勒历史发展的轮廓。

\Delta=\sum \tau(n)q^{n}\tau(n)称为Ramanujan函数。

1916年,经过大量数值计算,Ramanujan猜想:

a)Dirichlet L函数\sum\tau (n)n^{-s}可写成Euler积\prod (1-\tau (p)p^{-s}+p^{11-2s})^{-1};

b)对素数p,|\tau(p)|<2p^{\frac{11}{2}};

c)对素数p,\tau(p) \equiv 1+p^{11}( mod 691);

Ramanujan猜想是历史上第一个用模形式定义Dirichlet L函数的例子。另一方面,借助代数几何中“位”的语言,可以对特定的代数簇定义L函数。对有理数域上的椭圆曲线,通过L函数建立“椭圆曲线-模形式”的对应(谷山-志村猜想)是成就Wiles对Fermat大定理证明的关键;

c)被Ramanujan本人证明。大量类似的同余关系出现在l进表示的理论中,不借助模形式通常是很难发现和证明的。

a)实际上是Ramanujan函数的函数方程的紧凑表达,在1917年被Mordell证明。为此Mordell定义了所谓的Mordell算子。这一想法在1925年被Hecke推广为Hecke算子,成为现代模形式理论的基本工具。

对于一般的权为k的尖点形式,b)的推广|c(p)|<2p^{\frac{2k-1}{2}}称为Ramanujan-Peterson猜想,它的重要性在于反应了相应L函数的解析性质。对有限域上的代数簇定义L函数,有类比Riemann猜想而提出的Weil猜想。1974年,Deligne证明了Weil猜想,作为副产品得到了Ramanujan-Peterson猜想的证明。他因此获得1978年的Fields奖章。

奇人Ramanujan对现代数论的影响不可谓不巨大。

为结束讨论,或许回到我们的出发点:模函数\lambda是合适的。模群的同余子群\Gamma_{N}由所有满足g \equiv id(mod N)g组成。类似的,我们可以定义对同余子群自守的模函数来考察同余子群的算术性质。我们不再展开讨论,而是给出一个熟悉的例子:\lambda是对\Gamma_{2}自守的模函数。

从模函数到单值化定理 Ⅵ

Prologue: …For fifteen days I strove to prove that there could not be any functions like those I have since called Fuchsian functions. I was then very ignorant; every day I seated myself at my work table, stayed an hour or two, tried a great number of combinations and reached no results. One evening, contrary to my custom, I drank black coffee and could not sleep. Ideas rose in crowds; I felt them collide until pairs interlocked, so to speak, making a stable combination. By the next morning I had established the existence of a class of Fuchsian functions, those which come from the hypergeometric series; I had only to write out the results, which took but a few hours….

——H. Poincaré

回忆曾证明过的:以\mathbb{H}为万有覆叠的Riemann面解析同构于\mathbb{H}/GG是某个无挠的Fuchs群。除球面和环面外的所有的紧Riemann面均属于这一类。这是我们当前感兴趣的情形,事实上也是唯一便于考察的情形。

我们从一般的特征开始。不难证明,3种典型的Mobius变换完全刻画了PSL(2,\mathbb{R})PSL(2,\mathbb{C})中的共轭类:

a)椭圆型:若tr^{2}(w)<4,则w共轭于旋转变换,在上半平面和下半平面各有1个不动点;

b)抛物型:若tr^{2}(w)=4,则w共轭于平移变换,在实轴上有1个不动点;

c)双曲型:若tr^{2}(w)>4,则w共轭于相似变换,在实轴上有2个不动点;

单值群中的非平凡元素是忠实作用的,因而不能是椭圆型的。抛物型元素共轭于z \mapsto z+1。考察曲线\gamma=\{x+iy:0 \leq x \leq 1\},其在S上的投影是一条非平凡的闭曲线。然而随着y \to +\infty,该曲线在Poincaré度量下的长度趋于0。紧Riemann流形上的非平凡闭曲线不能有任意小的长度,这说明:对紧的\mathbb{H}/GG中所有非平凡元素都是双曲型的。

GPSL(2,\mathbb{R})的离散子群,故只有可列个元素g_{j}。考察z_{0} \in \mathbb{H}的轨道z_{0},z_{1},...,z_{n}=g_{n}(z_{0}),...。“垂直平分”z_{0}z_{n}的Poincaré直线将上半平面划分为2个部分,取所有包含z_{0}的部分的交,得到一个双曲几何意义下的“凸多边形”。遵从Poincaré,我们称其为G关于点z_{0}的基本多边形P_{o}

我们将基本多边形的性质总结如下:

a)限定g_{0}=idP_{0}不依赖于G中其他元素的排列顺序;

b)任意有界集至多与基本多边形的有限多条边相交:若轨道z_{0},z_{1},...,z_{n},...是闭的,则基本多边形本身仅有有限多条边。开轨道不能包含在某紧集中,也就是说,\{d(z_{0},z_{n})\}是无界的,由此也可推出结论成立;

c)由b)可推出基本多边形是上半平面中的开集;

d)我们知道PSL(2,\mathbb{R})是双曲几何的刚体群,故g_{j}(P_{0})=P_{j}。所有P_{j}彼此不交,且\cap \bar{P_{j}}=\mathbb{H}。特别的,基本多边形中的任意两点关于G不等价;

下面限定\mathbb{H}/G是紧的:

e)轨道必须闭合,故\{d(z_{0},z_{n})\}有界,推出\bar{P_{0}}是紧集。由b)知P_{0}仅有有限条边;

f)P_{0}的边与G中的非平凡元素一一对应,容易证明两条边关于G等价当且仅当对应的群元素互逆。因为g_{j}不能保持某条边不动,故P_{0}有偶数条边,两两配成一对关于G等价。a)说明P_{0}的边有天然顺序,我们选定逆时针方向遍历每一条边后回到出发点,更细致一些的分析指出,任意边的2条邻边都关于G等价。将等价的边粘合起来,我们得到:以\mathbb{H}为万有覆叠的紧Riemann面同胚于亏格为g>1的可定向闭曲面(球面装上g个环柄);

g=1的情形类似,我们也希望能将所有亏格为g>1的紧Riemann面参数化。这一参数空间称为模空间。当g>1时,Riemann猜想模空间依赖于3g-3个复参数。证明这一猜想的决定性想法来自Teichmüller,此后发展成有关拟共形映射的一整套理论。直到今天,模空间仍然是代数几何学家感兴趣的对象。

代数几何方面,要实现紧Riemann面到复射影空间的嵌入;函数论方面,要构造S上的亚纯函数,或等价的,上半平面中的自守函数。类似于第5章,如果我们能构造定义在上半平面的全纯函数f,对g \in G满足f(gz)=\gamma_{g}(z)f(z)\gamma_{g}(z)是在上半平面全纯且处处不为0的解析函数,满足\gamma_{gh}(z)=\gamma_{g}(hz)\gamma_{h}(z),则这两方面的要求均得以满足。

g的Jacobi行列式为J_{g},链式法则说明J_{g}^{-k}满足对\gamma_{g}(z)的要求,即可以取\gamma_{g}(z)=(cz+d)^{2k}。相应的f称为自守形式,因为\mathbb{H}上的k次微分形式fdz^{k}满足自守关系f(gz)d(gz)^{k}=f(z)dz^{k}。特别地,k=0定义了全纯的自守函数。

正是在前面所提到的不眠之夜,Poincaré构造出了满足上述条件的“Fuchs theta函数”(后世称为Poincaré级数)。为第7章的讨论方便记,我们给出Poincaré原始构造的一个变体:

\theta_{k,n}(z)=\sum^{*}J_{g}^{k}h(gz)h(z)=e^{2n\pi iz}

整参数k称为Poincaré级数的权,整参数n称为Poincaré级数的特征。满足h(gz)=h(z)g构成子群G_{0}\sum^{*}指求和在陪集G/G_{0}上进行。可以证明这种求和方式是定义良好的,且在k >1n \geq 0时保证级数在上半平面的任意紧子集上绝对且一致收敛,从而不难验证级数的自守性。

利用Poincaré级数可以实现亏格大于1的紧Riemann面到复射影空间的嵌入。同样的想法应用到高维,就成为Siegel在高维自守形式方面所做的工作的一部分。另一方面,2个权为k的Poincaré级数的商是\mathbb{H}上的自守函数,因而我们证明了紧Riemann面上总存在非常数的亚纯函数。由于单值化定理的失效,这对高维紧复流形是不成立的。

最后我们指出,我们对紧Riemann面的分类打开了一扇通往Poincaré猜想的暗门。注意到一个拓扑曲面一定具有微分结构,而一个带有微分结构的可定向曲面又一定具有复结构,因而我们实际上已证明了亏格作为拓扑不变量给出2维可定向闭曲面的完备分类。单连通曲面总是可定向的,由此马上证得Poincaré猜想的2维版本:单连通的2维闭曲面同胚于球面。

受2维情形的启发,Thurston猜想可以将3维紧流形分解为若干子流形,每个子流形上容许8种几何结构中的一种,进而证明Poincaré猜想。利用Hamilton发展出的Ricci流技术,Perelman证明了Thurston的几何化猜想。凭借这一突破摘得2006年Fields奖的他却拒绝领奖,并放弃了Clay研究所为Poincaré猜想设立的百万奖金。这是大家都很熟悉的故事了。

G.Perelman (1966-    )

同样在2006年,田刚等人用Ricci流的手段重新证明了单值化定理。

在复几何和拓扑学这两个如此不同的领域所做的开创性工作,被后人如此深刻有力地结合在一起,这是Poincaré所想不到的吧。