Algebraic Number Theory: Dirichlet’s Theorem Revisited

Number theory: An Approach Through History from Hammurapi to Legendre选择Legendre作为征程的句点,自然有其理由:在阅读Disquisitiones Arithmeticae时找到灵感进而提出Weil猜想的人,比谁都深刻地认识到“还不到总结Gauss的时候”。在Weil去世的16年之后,我们积累了更多证据支持这一判断,例如新科Fields奖得主Bhargava同样是在阅读Disquisitiones Arithmeticae时得到了PhD论文的灵感,从而做出了推广Gauss复合律的系列工作(,,)。
然而就思想史的脉络而言,我更愿意将Gauss和Einstein这样分水岭式的人物归入“旧世界”。Gauss,如同Euler, Lagrange和Legendre,是彻头彻尾的经验主义者,他们以巨人之姿勇敢地投身广袤的现象之海,以超凡的计算能力从中萃取原理。在Gauss和Riemann之间,在古典和现代之间,真正开启新范式的,是Gauss的狂热崇拜者、“一流数学家中的二流人物”——Dirichlet. 如Minkowski所说,”he possessed the art of connecting a maximum of seeing thoughts by means of a minimum of blind formulas”1,这对Riemann,乃至整个现代数学都产生了决定性的影响,数学自此在“现象-原理”之上获得了第三个维度“图景”——不仅要理解数学事实,更要将其放置于最合适的框架下来理解。

穿过Weil立下的“海格力斯之柱”(Pillars of Hercules),我想讨论Dirichlet最知名的工作——关于算术级数中素数分布的Dirichlet定理原论文发表于Abhandlungen der Königlichen Preußischen Akademie der Wissenschaften von 1837,有现成的英译本可供参考。

(Dirichlet定理)给定互素的aq,算术级数a+nq(n=1,2,\cdots)包含无穷多个素数。

如今看来,这个结果是完全初等的。然而,Dirichlet的证明却触碰到了Euler, Gauss甚至Riemann都未曾触碰到的领域。为了阐明“原理”,二次域的知识已经足够,但只有在类域论臻于完备后,才能找到这项工作在整体“图景”中的合适位置。

Euclid’s Theorem
q=1时Dirichlet定理退化为Euclid定理。Euler的证明给出了更精细的结果:在\mathrm{Re}(s)>1上取对数函数的主支,\displaystyle \log\zeta(s)=\sum_p \log\frac{1}{1-p^{-s}}=\sum_{n,p}1/np^{ns}
n \geq 2的部分绝对收敛。令s \to 1,得到
\displaystyle \sum_{p\leq X}\frac{1}{p}=\log\log X+O(1)X \to \infty
Dirichlet定理可以用完全类似的方式精细化:
\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}\log\log X+O(1)X \to \infty

The Theory of Dirichlet Characters
为得到形如\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}\sum_{p\leq X}\frac{1}{p}+\text{residue terms}的代数恒等式,Dirichlet首先假定d为素数并乞灵于单位根/分圆域理论。从今天的观点看,他将有限交换群的不可约复表示(Fourier分析的别名)引入了数论。
我们仅需要最简单的事实:令G_q=(\Bbb{Z}/q\Bbb{Z})^{*}特征\tilde{\chi}:G_q \to GL_1(\Bbb C)构成L^2(G_q)的完备正交基。对偶地,G_q也构成L^2(\hat{G_q})的完备正交基。
\tilde{\chi}扩张到\mathbb{Z}上,即得到Dirichlet特征\chi:\Bbb Z \to GL_1(\Bbb C). 为\displaystyle \frac{1}{p}赋权\displaystyle \frac{1}{\phi(q)}\sum_\chi \bar{\chi}(a)\chi(p),我们得以筛选出满足同余条件的p
\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}(\sum_{p\leq X}\frac{1}{p}+\sum_{\chi\neq 1}\chi(a)\sum_{p\leq X}\frac{\chi(p)}{p})
目标转为对\chi \neq 1证明\displaystyle \sum_{p\leq X}\frac{\chi(p)}{p}=O(1)X \to \infty.

The Dirichlet L-function
上述推理引向对Dirichlet L-函数的研究:
\displaystyle L(s,\chi)=\sum_{n=1}^{\infty}\frac{\chi(n)}{n^s}=\prod_p \frac{1}{1-\chi(p)p^{-s}}
\mathrm{Re}(s)>1上取对数函数的主支,\displaystyle \log L(s,\chi)=\sum_{n,p}\chi(p)^n/np^{ns}n \geq 2的部分依然绝对收敛。目标再次转为对\chi \neq 1证明L(1,\chi)\neq 0.
如下解析事实足以完成证明:\displaystyle \prod_\chi L(s,\chi)(如同L(s,1)=\zeta(s)一样)在s=1处有单极点。
Serre A Course in Arithmetic

Dirichlet的证明更加迂回,也因此包含了远为丰富的内容。我们先陈述较为一般的现代观点:给定\Bbb Q的代数扩张K
(1)Dedekind zeta函数\zeta_K(s)在极点s=1处的留数包含了K的整体算术信息,通常称为类数公式
(2)若K是Galois扩张,则\zeta_K(s)可以分解为Artin L-函数的乘积;
(3)若K是Abel扩张,则由Kronecker-Weber定理(或者更一般地,Artin互反律),Artin L-函数与本原(primitive)Dirichlet L-函数存在某种形式的一一对应;

Dirichlet完整地处理了K为二次域/\chi为本原二次特征的情况:此时
\displaystyle \zeta(s)L(s,\chi)=\zeta_K(s)K=\Bbb Q(\sqrt{\chi(-1)q})

(1)通常将二次域类数公式归于Dirichlet名下2
\displaystyle \mathrm{Res}_{s=1}\zeta_K(s)=\frac{2\pi h_K r_K}{w_K\sqrt{|D_K|}}
其中h_K为类数,r_K正规子(regulator),w_KK包含的单位根个数,D_K为判别式。
(Leibniz公式)取q=4,此时唯一的非平凡Dirichlet特征\chi满足\chi(1)=1\chi(3)=-1L(1,\chi)=\pi/4. 对照类数公式,这即是说\Bbb Q(\sqrt{-1})有类数1。

(2)令G=\mathrm{Gal}(K/\Bbb Q)为Abel群,\rho:G \to GL(1),定义Artin L-函数
\displaystyle L(s,\rho)=\prod_p\frac{1}{1-\rho(\sigma(p))p^{-s}}
此处\sigma(p)Frobenius自同构,约定表示\rho(\sigma(p))定义在惯性群的不变子空间上。
分解\displaystyle \zeta_K(s)=\zeta(s)\prod_{\rho \neq 1} L(s,\rho)是纯代数的:将正则表示分解为不可约表示。
对于二次域KG=\{1,-1\},此时仅有一个非平凡的\rho\rho(\sigma(p))=0当且仅当p分歧(ramified);\rho(\sigma(p))=1当且仅当分解(split);\rho(\sigma(p))=-1当且仅当p惯性(inert)。也就是说,p为奇素数时,\rho(\sigma(p))等同于Legendre符号\displaystyle (\frac{D_K}{p}).

(3)令K=\Bbb Q(\sqrt{\chi(-1)q})。暂时假定q是不包含平方的奇数。一方面,唯一的以q为导子(conductor)的本原二次Dirichlet特征\chi(p)Jacobi符号\displaystyle (\frac{p}{q});另一方面,判别式D_K=(-1)^{(q-1)/2}。此时Artin L-函数L(s,\rho)与Dirichlet L-函数L(s,\chi)的对应\displaystyle (\frac{D_K}{p})=(\frac{p}{q})不是别的,正是二次互反律

(3)可以用adele的观点理解:以\Bbb A\Bbb Qadele环\Bbb A^{*}=\Bbb Q^{*}\times\Bbb R_{+}^{*}\times \hat{\Bbb Z}^{*}.
对于K=\Bbb Q(\xi_q)G=\mathrm{Gal}(K/\Bbb Q)=G_q. 取逆向极限,由Kronecker-Weber定理知\displaystyle \mathrm{Gal}(\Bbb Q^{ab}/\Bbb Q)同构于\hat{\Bbb Z}^{*},进而同构于\Bbb Q^{*} \backslash \Bbb A^{*}=GL_1(\Bbb Q)\backslash GL_1(\Bbb A)的连通分支:Artin L-函数和Dirichlet L-函数源于同一个对象的一维表示。

作为(3)的“相对”版本,对于整体域K的Abel扩张,Dirichlet特征推广为Hecke特征。Hecke特征理论可以诠释为adele对象上的调和分析,这是“Tate论文”的主题。

对于K的非Abel扩张,Langlands考虑了GL_n(\Bbb A)自守尖点表示以及相应的L-函数。此种情况下的Langlands互反猜想(reciprocity conjecture)是Langlands函子性猜想(functoriality conjecture)的一部分。为了理解与之相关的表示论,他构建了一个庞大的理论框架,通常以Langlands纲领之名为人所知。

今时今日的数学中存在2类L-函数:一类L-函数源于动机,关于其解析性质(类似于上面的(1)),我们有数学中最知名的一些猜想:Riemann猜想,BSD猜想,etc.;另一类L-函数则源于自守表示论,更浪漫一些,“无穷维的对称”。证明他们是同一尊坚纽斯神(Janus)的两面,是Langlands和许多数学家孜孜以求的梦想,当然也不妨说是,Dirichlet之梦。


  1. Felix Klein, Development of Mathematics in the 19th Century, translated by M.Ackerman
    Arnold在某次访谈中提及的轶事在当代语境下诠释了这句名言:
    The Bourbakists claimed that all the great mathematicians were, using the words of Dirichlet, replacing blind calculations by clear ideas. The Bourbaki manifesto containing these words was translated into Russian as “all clear ideas were replaced by blind calculations.” The editor of the translation was Kolmogorov. His French was excellent. I was shocked to find such a mistake in the translation and discussed it with Kolmogorov. His answer was: I had not realized that something was wrong in the translation since the translator described the Bourbaki style much better than the Bourbakists did.
    我一直怀疑Arnold所说的误译其实是”all clear calculations were replaced by blind ideas”(这才是对Bourbaki风格的“最佳”描述)。由于他本人的口误或者记者的失察,把”calcultions”和”ideas”的位置对调了。 
  2. 第一个以某种形式得到二次域类数公式的人是Gauss,但一如既往,他没有发表这个结果。 
Advertisements

Manjul Bhargava and his 290 theorem

ICM 2014今天在韩国首尔召开。正如之前所预测的那样,Manjul Bhargava获得了2014年的Fields Medal. 一同获奖的还有Artur Avila, Martin HairerMaryam Mirzakhani.

这份名单相当有趣:史上第一位女性获奖者1;4人广义上的“祖国”(印度、巴西、奥地利以及伊朗)此前均无Fields奖得主2;3人的研究工作和遍历理论紧密相关;2人有参加IMO的经历3;等等。

本文将介绍获奖者Manjul Bhargava的一项“初等”工作:简化了Conway-Schneeberger 15定理的证明,并进一步证明了Conway的290猜想。

1.
我们感兴趣的是在整格\Bbb Z^n上取整值的n元多项式f。若f是齐次的,这相当于要求f的系数为整数。对可表示集R_f:=f(\Bbb N^n) \subset \Bbb Z(约定0 \in \Bbb N)的研究贯穿了整个数论史:
(1.1)Fermat集中研究了用2元2次整系数多项式表示素数p的问题,并发现
f(x,y)=x^2+y^2,则p \in R_f当且仅当p形如4a+1
f(x,y)=x^2+2y^2,则p \in R_f当且仅当p形如8a+18a+3
f(x,y)=x^2-2y^2,则p \in R_f当且仅当p形如8a+18a+7
f(x,y)=x^2+3y^2,则p \in R_f当且仅当p形如3a+1
f(x,y)=x^2+5y^2,则p \in R_f当且仅当p形如20a+120a+9
此类现象是代数数论乃至类域论的渊薮。
(1.2)由Fermat二平方和定理开始,Euler等数学家获得了一系列经典结果。
(Fermat二平方和定理, 由Euler证明) 若f(x,y)=x^2+y^2,则自然数k \in R_f当且仅当k的奇素因子(若有)均形如4a+1
(Lagrange四平方和定理) 若f(x,y,z,w)=x^2+y^2+z^2+w^2,则R_f=\Bbb N
(Legendre三平方和定理) 若f(x,y,z)=x^2+y^2+z^2,则自然数k \in R_f当且仅当k不能写成2^{2a}(8b+7)的形式。
(1.3) 平方数有一类推广,即所谓的多边形数:填满正多边形内部的点的个数。
(Gauss三角数定理,“Eureka定理”)令\displaystyle f(x,y,z)=\frac{x(x+1)}{2}+\frac{y(y+1)}{2}+\frac{z(z+1)}{2},则R_f=\Bbb N
推广Gauss三角数定理和Lagrange四平方和定理,我们有如下结果:
(Fermat多边形数定理,由Cauchy证明) 任意自然数均可表示为不超过nn边形数之和。
(1.4)从Lagrange四平方和定理出发,我们也可以研究高次幂多项式的表示问题:
(Waring问题,由Hilbert解决) 给定k \geq 2f=\sum_{1 \leq i \leq g} x_i^k。对于充分大的gR_f=\Bbb N
关于g的下确界g(k)有许多研究:g(2)=4(Lagrange),g(3)=9(Wieferich, Kempner),g(4)=19(Balasubramanian),g(5)=37(陈景润,Conway),等等。已知g(k)=2^k-2+\lfloor 1.5^k\rfloork \leq 471600000成立,欠缺的只是一个证明。

对相应的数论史感兴趣的读者可以参考
Weil  Number theory: an approach through history from Hammurapi to Legendre
Edwards  Fermat’s last theorem: a genetic introduction to algebraic number theory

2.
在所有整系数多项式中,我们对整二次型的理解是最好的。荣耀归于Gauss:他在Disquisitiones Arithmeticae中建立了完备的整二元二次型理论,这是整个现代数论的起点。
首先我们区别整二次型的2种不同定义:(1)较强的Legendre定义要求二次型取整值(整系数);(2)较弱的Gauss定义要求二次型对应的对称双线型取整值(对应矩阵为整系数)。为避免混淆,我们称后者为整矩阵型。
本节讨论的整二次型默认为正定的。 这允许我们从几何的观点研究问题:这些整二次型可以视为整格上的“Riemann度量”,整格因之获得“Riemann空间”的结构。
满足R_f=\Bbb N的整二次型f(及其对应的整格)称为万有的(universal)。任意二元和三元整二次型都不可能是万有的。另一方面,Lagrange四平方和定理说明f(x,y,z,w)=x^2+y^2+z^2+w^2是万有的。
1916年,Ramanujan一口气给出了所有54个四元万有整对角型(Le style c’est l’ homme!),由此重燃了对这个领域的兴趣。研究者继而提出了
(万有性问题) 刻画所有万有整格的等价类。
1948年,Willerding在她的博士论文中分类了“所有”四元万有整矩阵型。四十多年间无人发现其中隐藏的重大疏漏。直到1993年,Conway重新考虑了这个问题,才给出万有整矩阵型的完满刻画(Conway-Schneeberger, 由Bhargava简化):
(15定理) 整矩阵型f是万有的当且仅当R_f包含以下9个关键值(critical value)
1,2,3,5,6,7,10,14,15.
Bhargava  On the Conway-Schneeberger Fifteen Theorem
由此可以决定四元万有矩阵型的所有204个等价类(参见上文附表)。
令人吃惊的是,若悬置等价性的判定,则Bhargava 的简化证明将是完全初等的——一个数学系新生完全能理解其过程并借助计算机验证结果。核心操作是整格的扩充(escalation):若其不能表示的最小正整数为m(称为“逃学生”,truant),则其扩充指的是加入一个模长为m的向量后生成的新整格。
从0维整格出发,不断进行扩充,我们得到一棵以整格为节点的。15定理的核心是如下事实:Bhargava树的高度有限(事实上,为5——这个幸运的“巧合”使得穷举不会复杂到无法处理的程度)。如果约化到等价类,则各层的节点数分别为1,1,2,9,207,1630。每个非叶节点都对应一个“逃学生”,15定理涉及的关键值是这些“逃学生”的集合。

沿着证明15定理的思路,Bhargava又得到了如下“副产品”:
(33定理) 给定整矩阵型fR_f包含所有奇数当且仅当R_f包含以下8个关键值
1,3,5,7,11,13,15,33.
(73定理) 给定整矩阵型fR_f包含所有素数当且仅当R_f包含以下17个关键值
2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,67,73.

和整矩阵型相比,整二次型的万有性问题远为复杂。2005年,Bhargava和Hanke宣布他们证明了Conway的290猜想:
(290定理) 整二次型f是万有的当且仅当R_f包含以下29个关键值
1,2,3,5,6,7,10,13,14,15,
17,19,21,22,23,26,29,30,31,34,
35,37,42,58,93,110,145,203,290.
由于证明牵涉到大规模计算,二人迄今尚未正式发表这个结果。他们的证明思路以预印本的形式流布:
Bhargava, Hanke Universal quadratic forms and the 290-Theorem
对于整二次型,Bhargava树的前5层分别有1,1,3,34,6560个节点。在6560个节点中,6402个为叶节点,153个节点至多有3代子孙,剩下的5个节点可以用两人发明的“10-14技巧”处理。

3.
迄今为止的讨论尚有一处留白:整二次型的等价分类。这是一个经典问题,此处只能略述大概。我们推荐读者查阅:
Conway, Sloane  Sphere packings, lattices and groups, Chapter 15

Gauss完全解决了整二元二次型的分类问题,在Conway, Sloane中可以找到他的等价判定算法(Gauss约化)以及判别式d较小时整二元二次型等价类的全表。
多元的情况相对复杂。我们先考虑一些较粗糙的等价关系,再逐步将其精细化。
(3.1)有理二次型的\Bbb Q-等价判定由如下经典结果给出:
(Hasse-Minkowski定理) fg整体域\Bbb Q上等价当且仅当它们在所有局部域\Bbb Q_p(约定\Bbb R=\Bbb Q_\infty)上等价。
因而f的等价类由其在\Bbb Q_p上的不变量完全刻画:判别式d,号差\sigma,以及由Hilbert符号给出的Hasse-Minkowski不变量\epsilon_p
Serre  A course in arithmetics
(3.2)稍精细一点,我们可以考虑二次型的\Bbb Z_p等价,其等价类即Gauss研究过的(genus)。
此处有许多深刻的数论结果,例如在Weil著名的Acta论文中,二次型的属分类通过自守形式与酉表示论相联系,由此得到的Weil-Siegel公式推广了经典的Smith-Minkowski-Siegel质量公式。我们希望在今后讨论酉表示论时更深入地介绍这方面的结果。
(3.3)属可以划分为更加精细的旋子属(spinor genus),此时有一个自旋算子群可迁地作用在旋子属上。
(Eichler) n \geq 3时,旋子属与n元不定整二次型的等价类一一对应。
读者可以在Conway, Sloane以其所引述的文献中找到详细的叙述和证明。
至此我们完整分类了不定整二次型。
(3.4)正定整二次型的分类要困难得多。以上讨论过的不变量依然可以用于分类(尤其在低维),但不再对应唯一的等价类。即使限制到幺模整格(二次型的d=1),随着维数的上升,等价类的数目也将迅速趋于天文数字:例如,Smith-Minkowski-Siegel质量公式指出32维欧氏空间中有超过8 \times 10^{16}个幺模整格的等价类!
推广Gauss约化,我们有称为Minkowski约化的算法。遗憾的是n>7时,Minkowski算法的复杂度急剧上升。此时所谓的Kneser粘贴方法(gluing method)可以进行一些有益的补充。

n>25时,正定整二次型的任何较完备的分类在目前都是不可想象的。然而从某种意义上说,24或许已经足够了:在24维我们有著名的Leech整格,7个“第二代”散在单群(sporadic group)作用于其上,包括3个Conway群Higman-Sims群铃木群Janko群J_2。Leech整格可用于构造Griess代数(作为某个共形场论顶点算子代数),后者的自同构群给出最大的散在单群:魔群(monster group,此群的阶数约为8 \times 10^{53},中文翻译似未能传达monster所隐含的“巨大”之意)——至矣,大矣,蔑以加矣!
无论从何处出发,我的兴趣总是将我引向同一个目的地。从数论开始,最终抵达魔群的所在地——这条路恰恰是Conway本人所走过的。在这里,他发现了散在单群与模形式的神秘联系,量子物理和数论以不可分割的方式结合在一起。Conway和Norton的魔群月光猜想描述了这些现象。
conway

John H.Conway (1937- )

16年前,Conway的学生Borcherds正是凭借对魔群月光猜想的证明获得了另一枚Fields奖章。


  1. 或许是为了赶在美国第一位女总统之前? 
  2. 何其政治正确!当然这也反映了现今欧美基础学科研究人员的“去欧美化”趋势。 
  3. 有此经历的Fields奖得主越来越多,当然,其中并没有华人的身影——丘成桐或许会愿意就数学研究和奥林匹克数学的关系作进一步的评论。 

代数数论:分歧理论

大概是五六年前吧。那是我还在念高中,班上已有人开始读《数论导引》。我永远都记得第一次听说“Fermat-Euler定理”的那个下午。任何一个4n+1型的素数都可以表示为平方和。在我看来,这条定理在简单性和美感之间达成了某种惊人的平衡。

我曾反复尝试“徒手”证明这个结论——直到了解到这花去了Euler数年的时间。后来我的数论知识增长了——虽然很慢——终于也到了能够理解类域论的程度。但这条定理的魅力并不稍减。

在数论中我再也没有遇上能让我如此“悸动”的定理。

问题

Fermat-Euler定理事实上描述了在扩域\Bbb Q(\sqrt{-1})\Bbb Z的素理想的分解状况。一般地,我们希望知道对于数域(或一般的整体域)K的扩张LO_K的素理想将如何分解。

Fermat业已观察到有理数域二次扩张中的许多基本事实。更进一步,对于Abel扩张我们的了解是完全的:这构成整体类域论的内容。

扩张的几何图像

理解分歧理论的最佳途径是首先借助数域和函数域的类比,再利用函数域和代数曲线的范畴等价过渡到紧Riemann面的几何。域扩张的次数[L:K]对应曲面间的映射度。熟知素理想的对应物是曲面上的点,记素理想pL中的分解为\prod q_i^{e_i}e_i称为分歧指数

过渡到局部环。q_i处剩余域F_ip处剩余域F的有限扩张,记其次数为f_i。由此得到数值不变量的基本关系[L:K]=\sum e_i f_i。这允许我们对p进行分类:

(1)若某个e_i>1,则称pq_i处分歧。最糟糕的状况是某个e_i=[L:K],此时我们称p完全分歧。几何上我们得到一个形如z^{1/e_i}支点

(2)称不在(1)中的p为非分歧的。最理想的状况是“覆叠”:原像的个数等于映射度(e_i=f_i=1),此时我们称p完全分解。

扩张的代数性质

\{a \in L: \mathrm{Tr}(aO_L) \subset O_K\}O_L的分式理想,其逆理想D(L/K)O_L的整理想,称为LK的(相对)共轭差积。作为扩张L/K的不变量,D(L/K)可以从基本不变量构建出来:其理想范数即相对判别式\triangle_{L/K}

(分歧判据)p分歧当且仅当p|D(L/K)

D(L/K)q_i处的赋值为d_i,则d_i \geq e_i-1,等号成立当且仅当F_i的特征不整除e_i,此时称pq_i处弱分歧(反之为强分歧)。

结合Minkowski定理,我们得到经典的:给定K的有限素点集S和正整数n,至多有有限个扩域L使得[L:K]=n且在S之外非分歧。特别地,\Bbb Q没有非分歧扩张。

以下要求L/K是Galois扩张。历史上第一个研究此类现象的是Hilbert。置换作用的存在对可能的分歧带有强有力的限制:例如,所有e_i都必须相等,同理所有f_id_i也相等。

局部地看,O_L/q_i是有限域O_K/p的扩张,其Galois群(以Frobenius同构\mathrm{Frob}_{p,q_i}为生成元的循环群)自然嵌入到\mathrm{Gal}(L/K)中。经由置换作用,这在\mathrm{Gal}(L/K)中定义了Frobenius共轭类\mathrm{Frob}_{p,L} (在Abel扩张的情形重新退化为Frobenius同构)。

(完全分解判据)非分歧素理想p完全分解当且仅当\mathrm{Frob}_{p,L}平凡。更一般的,若\mathrm{Frob}_{p,q_i}d阶元,则pO_L中分解为[L:K]/d个素理想。

K在Galois扩张L下的完全分解的素理想集合为\mathrm{Spl}_L(K)。几何上,\mathrm{Spl}_L(K)是“典型”的,有关信息足以决定L的几何“形状”。在数论中,我们也希望达成这一点:例如,由Chebotarev密度定理,我们知道\mathrm{Spl}_L(K)在所有素理想中的密度为1/[L:K],从而得到了扩张次数的信息。对于Abel扩张,已知\mathrm{Spl}_L(K)可由K的算术信息完全描述,这允许我们决定L

分歧在完备化下的性态

分歧理论在完备化下有良好的性态。

(1)[L:K]=\sum[L_{q_i}:K_p],故p完全分解当且仅当L_{q_i}=K_p

(2)p非分歧的情况同样非常简单。此时作为完备离散赋值域的K_p的有限非分歧扩张在Galois群同构意义下一一对应于其剩余域(某个有限域\Bbb F_q)的有限可分扩张。特别地,我们知道K_p的有限非分歧扩张一定是Abel扩张。

代数数论:局部与整体

近世数学中最重要的一个类比或许是有理数域与有理函数域的对比。研究有理/代数函数时,常用的手段是考虑其在某点处的Laurent展开,从“代数”范畴过渡到(拓扑上完备的)“解析”范畴。现在我们考虑这一过程在数论中的类比。

\Bbb Q的完备化

Hensel第一个考虑了\Bbb Q在各个位(place)处的完备化,这是p进数研究的肇始。

(Ostrowski) \Bbb Q的完备化仅有\Bbb R=\Bbb Q_\infty\Bbb Q_p

p进数的最初应用是求解特定的同余方程。例如,由于p进整数环\Bbb Z_p\Bbb Z/p^n\Bbb Z逆向极限,模p^n的代数方程对任意n可解当且仅当其在\Bbb Z_p中可解。作为局部环\Bbb Z_p的剩余域是有限域,此时分析中求近似解的标准方法(Newton法)将在有限步后给出精确解,此即著名的Hensel引理。这也是一个普遍现象的最简单例证:p进分析一般比实分析/函数论简单。

第一个真正认识到p进数潜力的人是Hensel的学生Hasse。利用p进数,他得以将Hurwitz, Hilbert, Minkowski等人发展得蔚为壮观的二次型理论/有理曲线上的有理点研究整合成一条迷人的定理,其大意为:二次代数方程在\Bbb Q(整体域)上可解当且仅当其在所有\Bbb Q_v(局部域)中可解。关于这部分内容,参见我们之前的讨论

上述“局部-整体”原理/Hasse原理诱使我们寻求其推广。一个可能的方向是考虑高亏格曲线乃至高维代数簇:一般来说,Hasse原理将失去效用。进一步,我们可以考虑特定对象以衡量其失效程度,例如椭圆曲线/Abel簇的Tate-Shafarevich群。另一个可能的方向是将问题中的\Bbb Q/代数数域替换为其他整体域:(有限域上的)有理函数域/代数函数域。一般来说,此替换会(极大地)简化问题。诸多例子中,我们愿意提到函数域上的Langlands纲领 (Drinfeld, Lafforgue)。

 Adele环和Idele群

Someone like you风靡一时的时候,我才后知后觉地知道Adele。当时我曾开玩笑说,她爹一定是搞数论的。数论中的Adele环和Idele群是Chevalley, Weil等人在研究类域论时引入的。

类比亚纯函数环,我们将所有K_v的信息收集在一起,定义其限制拓扑积为整体域的Adele环A_K。它是局部紧致的拓扑交换环,K是其中的离散子环。由1维酉表示的Pontryagin理论知(1)A_K是自对偶的;(2)A_K/K同构于\hat{K},因而是紧致的。

称Adele环A_K的单位群为Idele群J_K,它是K_v^*限制拓扑积。模去主Idele之后,我们得到Idele类群C_K=J_K/K^*。实践中我们常类比紧Riemann面上的“留数和定理”,取J_K^1=\{a\in J_K| |a|=1\}并考虑比C_K略小的商群C_K^1=J_K^1/K^*\Bbb R^n上的Minkowski定理现在可以推广至带有Haar测度的紧拓扑Abel群A_K/K上,由此可以证明重要的:C_K^1是紧群。

理想类群的有限性和单位群的有限生成性都是这一定理的推论。我们只需取:

(1)除子映射\mathrm{div}:J_K \to I_K\mathrm{div}((x_v))=\sum_{v \neq \infty}v(x_v)\cdot v

这诱导C_K^1(紧群)到Cl_K(离散群)的满射,从而Cl_K也是紧群,从而是有限群。

(2)对数映射l:J_K \to \Bbb R^sl((x_v)_v)=(\cdots,\log|x_v|_v,\cdots)_{v \in S},此处S \in \mathrm{Spec}(O_K)是包含K的所有Archimedean位的有限集,s=|S|

对所有v \notin S满足|a|_v=1a \in K^*构成一个乘法群E_S,称为S-单位群。类似Dirichlet定理,S-单位群是有限生成的:\mathrm{ker} l给出挠元,\mathrm{im} l则给出\Bbb R^s的离散子群并使得余核紧致:此为\Bbb Z^s

代数数论:基本概念和基本事实

假期里应邀写一篇面向高中生的数论科普。这使我萌生了一个念头:整理一下自己所知的、关于代数数论的零碎知识。这一系列的文章主要依仗于识途老马的经验:

Manin, Panchishkin  Introduction to modern number theory

我们从讨论19世纪的经典结果开始。

代数数域

讨论代数数域可以从两方面入手:域论和\Bbb Q-线性空间的表示论。

1.Galois理论

从Galois理论的角度看,代数数论研究的是\Bbb Q的代数扩张。作为万有对象,\mathrm{Gal}(\bar{\Bbb Q}/\Bbb Q)(“绝对基本群”)几乎包含了我们希望知道的所有信息。当然,我们对这个投射有限群的了解仍很有限:例如,我们不知道是否每个有限群都能实现为它的商群(Galois问题)。

暂时采用更经典的观点。\Bbb Q的有限扩张域有形式K=\Bbb Q(\alpha)(本原元定理)。不妨假定这是一个正规扩张,我们希望研究\mathrm{Gal}(K/\Bbb Q)(“相对基本群”)。

例1:分圆域K_m=\Bbb Q(\zeta_m)\zeta_mm本原单位根。这是一个\phi(m)Abel扩张\mathrm{Gal}(K_m/\Bbb Q)=(\Bbb Z/m\Bbb Z)^{*}。代数数论中最基本的事实之一是:

(Kronecker-Weber定理)\Bbb Q的任意Abel扩张均是某个分圆扩张的子扩张。

特别地,“任意有限交换群均能实现为\mathrm{Gal}(\bar{\Bbb Q}/\Bbb Q)的商群”是KW定理的(平凡)推论。

2.表示论

作为\Bbb Q-代数,左乘在扩域K上诱导自然的伴随表示\rho:K \to \mathrm{End}(K)。定义\beta \in K的迹\mathrm{Tr}\beta和范数\mathrm{N}\beta\rho(\beta)的迹和行列式,\beta的极小多项式即\rho(\beta)的特征多项式。

f_K\alpha的极小多项式,f_K在另一扩域L中分解为\prod f_i,则表示的张量积K \otimes_\Bbb Q L =\prod L_if_i是扩张L_i/L的极小多项式。特别地,我们可以取L\Bbb Q的完备化:目下不妨仅讨论\infty处的完备化\Bbb Rf_K\Bbb R中分解为r_1个一次多项式和r_2个二次多项式。记n=[K:\Bbb Q],我们得到n=r_1+2r_2。几何上,我们得到Kr_1个实嵌入和r_2个复嵌入,它们将K嵌入到\Bbb R^n

代数整数环

\beta \in K为代数整数,若其极小(首一)多项式\in \Bbb Z[X],它们构成交换环O_K

例2:二次域的研究经Gauss之手臻于成熟。特别的,他得到了二次域代数整数环的完整描述:假设\alpha^2=d,则O_K=\Bbb Z[\omega]\omega等于(1+\alpha)/2(d \equiv 1(\mod 4))或\alpha(d \equiv 2,3(\mod 4))。

对于O_K,仍有2种互为补充的观点:其一强调交换环结构,其一强调自由\Bbb Z模结构。

1.O_K作为Dedekind整环

这部分内容无疑是经典代数数论的主干,发轫于Kummer而大成于Dedekind。

熟知\Bbb Z是一个主理想整环(PID),遗憾的是,这一性质通常不能为O_K所保持:最经典的例子是\Bbb Z[\sqrt{-5}],它甚至不是唯一分解整环(UFD)。我们所能保证的是O_KDedekind整环,即整闭且有Krull维数1Noether整环:另一个重要例子是代数曲线的坐标环。

Kummer最重要的数学贡献或许是证明了“代数整数环基本定理”:Dedekind整环中的理想均可唯一分解为素理想的乘积。视素理想为Grothendieck意义下的位(place),其上的自由\Bbb ZI_K称为分式理想群/除子群,我们希望衡量其与主分式理想群/主除子群(从而O_K与PID)的差距:考虑\beta \in K^* \mapsto (\beta) \in I_K,其核是O_K的单位群O_K^*,余核则称为理想类群/除子类群Cl_K(其阶数h_K称为类数)。显然,O_K为PID当且仅当h_K=1

类群和单位群是O_K最重要的不变量,也是经典代数数论的主要研究对象。下面是一个众所周知的例子:对于K=\Bbb Q(\zeta_p),若p>2不整除h_K,则称p正则素数。Kummer证明Fermat大定理对所有正则素数成立。一个负面结果是存在无穷多个非正则素数(Jensen),另一方面,尚不知道是否存在无穷多个正则素数。

关于2次域的类数,我们有著名的Gauss类数猜想

(1)d \to -\inftyh_d \to \infty (Heilbronn);

(2)类数为1,2,3的虚二次域仅有有限个(Baker, Stark等人已给出完整列表);

(3)类数为1的实二次域有无穷多个(未解决,甚至不知道类数为1的数域是否有无穷多个);

2.O_K作为整格

代数上,\mathrm{Tr}(\rho(u)\rho(v))O_K上定义了一个对称双线型B(u,v)(这是Lagrange,Legendre和Gauss研究二次域的观点),记其判别式为D_K。几何上,我们视O_K\Bbb R^n中的整格并记其基本域的体积为V,易见V=2^{-r_2}\sqrt{|D_K|}

数的几何”(Geometrie der Zahlen)的基本定理是:

(Minkowski定理)中心对称且体积大于2^n V的凸集X \subset \Bbb R^n至少包含一个整格。

这条简单的定理却能推出很多不平凡的经典结论:

(Hermite)K \mapsto D_K是一个“有限对一”函数。

(Minkowski) K \neq \Bbb QD_K>1

以及更重要的

(类群的有限性)Cl_K为有限群(即类数h_K < \infty)。

(单位群的有限生成性;Dirichlet) O_K^*为有限生成Abel群,其秩r=r_1+r_2-1

在对数映射下,O_K^*的像又成为一个整格。此时经典不变量——整格的体积(精确到常数\sqrt{r+1})称为K调整子

可除代数与中心单代数

对可除代数与中心单代数的考察给出了“局部-整体”原理的一个重要范例。这植根于可除代数与类域论的联系中。此外,非交换代数理论有其本身的兴趣。在Noether学派取得的经典结果外,我们还想提到2个与K理论有关的近代进展。

以下讨论的所有代数都是有限维的。

非交换代数的一个中心问题是给定域K,描述K上所有可除代数。这相当于域扩张理论的非交换版本。历史上对这一问题的兴趣是被复数\mathbb{C},四元数\mathbb{H},八元数\mathbb{O}等一系列“超代数”的发现所激起的。最重要的经典定理是

(Frobenius) \mathbb{R}上的可除代数仅有\mathbb{R}\mathbb{C}\mathbb{H}

\mathbb{C}上不存在非平凡的可除代数。这一结论对任意代数闭域成立。

AK上的可除代数,则其中心Z(A)K的有限扩张。于是可以把问题分为两部分:研究域的有限扩张,这属于Galois理论的范畴;研究Z(A)=K的可除代数A,我们称这样的A为中心可除代数。

中心可除代数必为中心单代数。Wedderburn定理指出K上的中心单代数同构于某个方阵代数M_{n}(A)AK上的中心可除代数。特别地,代数闭域上的中心单代数同构于M_{n}(K)。通过对基域取代数闭包,不难证明任何中心单代数的维数均为平方数。

我们考察几个具体的例子。

(Hasse)\mathbb{Q}_p上有\phi(n)n^2维中心可除代数。

(Wedderburn) 有限域\mathbb{F}_q上不存在非平凡的中心可除代数(因而有限体必是域)。

(曾炯之) 若K是代数闭域,CK上不可约代数曲线,则代数函数域K(C)上不存在非平凡的中心可除代数。

后2个否定性结果可以统一处理。代数闭域K上齐次多项式F(x_1,x_2,\dots,x_n)=0deg F \leq n恒有非平凡的零点。如果对deg F <nK能保证这一点,则称K为拟代数闭的。拟代数闭域上不存在非平凡的中心可除代数,而有限域和代数函数域又都是拟代数闭域(前者是Chevalley的一条定理,参见Serre, A course in arithmetic)。

\mathbb{R}上仅有2个非平凡的中心单代数:中心可除代数\mathbb{H}和方阵代数M_2(\mathbb{R})。类比从\mathbb{R}\mathbb{H}的过程,可以在任意特征不等于2的域K上构造4维中心单代数如下:取a,b \in K^{*}A是由1,i,j,k张成的K线性空间,i^2=aj^2=bij=-ji=k

可以证明,若ax^2+by^2=1K^2中有解,则A同构于M_{2}(K),否则A为中心可除代数。在K=\mathbb{Q}的情形,上述结论等价于说A是否为可除代数由\mathbb{Q}_v上的Hilbert符号所确定。这一事实的高维推广是“局部-整体”原理的范例:

(Bauer-Hasse-Noether)整体域K上的中心单代数A同构于M_{n}(K),当且仅当对每个位vA \otimes_{K} K_{v}同构于M_{n}(K_v)

中心可除代数与代数数论的联系体现在Brauer群这一对象上。具体地说,K上的中心单代数对张量积封闭。Wedderburn定理给出等式A_1 \otimes A_2=M_n(A_3),这在中心可除代数上定义了一个Abel群Br(K),称为K的Brauer群。

以上Frobenius和Wedderburn的结果可改写为Br(\mathbb{R})=\mathbb{Z}/2\mathbb{Z}Br(\mathbb{F}_q)=0

Brauer群在经典类域论中有重要地位。例如,以下结果推广了二次互反律:

对整体域K0 \to Br(K) \to \oplus_{v}Br(K_v) \to \mathbb{Q}/\mathbb{Z} \to 0

限于篇幅,这里不再深入。

我们还想提到2个与K理论有关的近代进展。

用拓扑K理论可以证明Frobenius定理的如下推广(去掉了经典Hurwitz定理中的赋范条件):

(Bott-Milnor) \mathbb{R}上的非结合可除代数仅有\mathbb{R}\mathbb{C}\mathbb{H}\mathbb{O}

代数K理论方面,Merkur’ev和Suslin发现利用K_2(K)可以完整地描述Br(K)

主要参考文献: Shafarevich, Basic notions of algebra

有理域上的代数曲线 Ⅰ

早在19世纪,代数数域与代数函数域的相似性已引起数学界的兴趣。而“复几何-代数几何-代数数论”三位一体格局的最终成型,则要归功于20世纪中叶Grothendieck的工作。这个系列并不涉及最一般的理论,而主要想讨论“三位一体”的1维情形。更具体地说,我们要以研究紧Riemann面的方法为借镜,考察有理域上的代数曲线。本系列也不拟深入讨论高亏格的曲线,而把注意力集中在亏格0和亏格1的曲线上——时到今日,后者仍是数论研究的核心领域。

A.Grothendieck (1928- )

我们先来初步考察一下复几何和代数数论的某些相似性,为今后的具体讨论做一点准备。
从最简单的情况看起。数论与复代数提供了含幺交换环的两个模本:\mathbb{Z}\mathbb{C}[X]。两者的相似性很早就被注意到:均为主理想整环,从而有唯一分解性。作为\mathbb{C}上的函数环,\mathbb{C}[X]中的任意元素均可以在某一复点处作“Taylor展开”(有限项),从而定义了复点与\mathbb{C}[X]的素/极大理想间的一一对应。这启发我们将环A的所有素理想收集在一起定义素谱Spec[A],进而将A视为Spec[A]上的“函数环”。例如\mathbb{Z}可以视为定义在所有素数上的“函数环”。可以在Spec[A]上定义拓扑,即所谓的Zariski拓扑。

注记:在一般情况下,素理想并不总是极大理想。我们之所以考虑素理想,是因为素理想有较好的“函子性”:给定环同态f:A \to BB中素理想的原像总是素理想,而极大理想的原像则不一定是极大理想。

研究解析函数局部性质的最有力方法是考察其在某点的Taylor展开。本着这一精神,我们希望定义整数在素数处的“展开”。这引出了“局部化”和“完备化”的想法。

局部化:\mathbb{Q}\mathbb{Z}的分式域。若我们把注意力集中到某个素数p“附近”,考虑所有形如\{\frac{a}{b}:b \nmid p\}的分数构成的环,则得到对应于素数p的分式环,可以类比在某点处全纯的有理函数环。上述定义可以推广到任意含幺交换环A及其素理想p上。

完备化:对于给定的某点,可以将多项式环嵌入到幂级数环中研究。尤其是,我们可以在\mathbb{C}[X]上定义拓扑,使得这一嵌入类似于从\mathbb{Q}\mathbb{R}的完备化。类似的,整数环\mathbb{Z}可以在素数p处嵌入到p进整数环\mathbb{Z}_{p}中,其上赋有由逆向极限诱导的p进拓扑。分式域\mathbb{Q}嵌入到分式域\mathbb{Q}_{p}中。亚纯函数在某点处零点/极点的重数也有自然的类比,称为\mathbb{Q}_{p}上的p进赋值。在\mathbb{C}P^{1}上考虑有理函数的性质更为整齐,与之平行地,我们将\mathbb{Q}\mathbb{R} 的嵌入类比于有理函数在“无穷远点”的展开。以上两种嵌入均称为完备化。用几何的语言,\mathbb{Q}称为整体域,素数p称为有限素点,\mathbb{Q}_{p}\mathbb{R}称为局部域。在代数数论的研究中,可取特定的代数数域为整体域,对每个素理想考察局部域的性质再整合为整体性质。这是现代代数数论的指导思想之一。

将复几何中的概念和工具引入代数数论,用几何语言来思考数是极富启发性的。我们再举几个例子:

考虑紧Riemann面的除子群并注意到紧Riemann面上的点对应代数函数环的素理想,其在代数数论中的类比是清楚的:Dedekind整环的分式理想群,分式理想可唯一分解为素理想。进一步,容易看出主除子和主分式理想相对应,于是得到关键的对应:除子类群-理想类群。理想类群同构于整体域极大非歧Abel扩张(对应的扩域即Hilbert类域)的Galois群。

从拓扑的角度看,我们知道紧Riemann面的除子类群和Picard群同构,于是将理想类群视为Picard群,层论和上同调的手段自然而然地进入了代数数论的研究。

另一方面,考虑紧Riemann面上的亚纯函数环并将代数函数环嵌入其中研究是分析中常用的手法。类比:将局部域收集起来定义其直积环,在几乎所有有限素理想处属于赋值环的元素构成一子环,称为整体域的adele环。其可逆元成群,称为idele群。紧Riemann面上的亚纯函数环自然和其除子群紧密相关。借助idele群我们也可以定义idele类群。idele类群是一个精细的对象,理想类群/除子类群都是它的商群。

考察idèle类群有技术上的便利:从局部到整体的过程可以借助经典分析的一整套想法。特别的,代数数论中的经典定理:理想类群的有限性和Dirichlet单位定理,均可以借此得到优雅的证明。和现代数论的巨大成就相比,这不过是代数几何思想的牛刀小试而已。

又例如,将代数函数域视为有理函数域的域扩张,此域扩张定义了某紧Riemann面到\mathbb{C}的分歧覆叠。在代数数论的情形,我们要考虑各式各样的Abel扩张,这些扩张导致部分素理想“分解”,这可以借助非分歧点处覆叠的几何图像来思考。此类现象早在17世纪已被注意到:Fermat发现奇素数p在Gauss整数环中能够进一步分解当且仅当p \equiv 1(mod4)。20世纪代数数论的一个重要成就是将素理想分解的规律系统地用Galois理论加以解释(Galois群类比于覆叠的单值群),进而发展出所谓的类域论。对非Abel扩张的研究则是当前的热点,这方面我们有称为Langlands纲领的指导性猜想。