Dirichlet’s Theorem Revisited

Number theory: An Approach Through History from Hammurapi to Legendre选择Legendre作为征程的句点,自然有其理由:在阅读Disquisitiones Arithmeticae时找到灵感进而提出Weil猜想的人,比谁都深刻地认识到“还不到总结Gauss的时候”。在Weil去世的16年之后,我们积累了更多证据支持这一判断,例如新科Fields奖得主Bhargava同样是在阅读Disquisitiones Arithmeticae时得到了PhD论文的灵感,从而做出了推广Gauss复合律的系列工作(,,)。
然而就思想史的脉络而言,我更愿意将Gauss和Einstein这样分水岭式的人物归入“旧世界”。Gauss,如同Euler, Lagrange和Legendre,是彻头彻尾的经验主义者,他们以巨人之姿勇敢地投身广袤的现象之海,以超凡的计算能力从中萃取原理。在Gauss和Riemann之间,在古典和现代之间,真正开启新范式的,是Gauss的狂热崇拜者、“一流数学家中的二流人物”——Dirichlet. 如Minkowski所说,”he possessed the art of connecting a maximum of seeing thoughts by means of a minimum of blind formulas”1,这对Riemann,乃至整个现代数学都产生了决定性的影响,数学自此在“现象-原理”之上获得了第三个维度“图景”——不仅要理解数学事实,更要将其放置于最合适的框架下来理解。

穿过Weil立下的“海格力斯之柱”(Pillars of Hercules),我想讨论Dirichlet最知名的工作——关于算术级数中素数分布的Dirichlet定理原论文发表于Abhandlungen der Königlichen Preußischen Akademie der Wissenschaften von 1837,有现成的英译本可供参考。

(Dirichlet定理)给定互素的aq,算术级数a+nq(n=1,2,\cdots)包含无穷多个素数。

如今看来,这个结果是完全初等的。然而,Dirichlet的证明却触碰到了Euler, Gauss甚至Riemann都未曾触碰到的领域。为了阐明“原理”,二次域的知识已经足够,但只有在类域论臻于完备后,才能找到这项工作在整体“图景”中的合适位置。

Euclid’s Theorem
q=1时Dirichlet定理退化为Euclid定理。Euler的证明给出了更精细的结果:在\mathrm{Re}(s)>1上取对数函数的主支,\displaystyle \log\zeta(s)=\sum_p \log\frac{1}{1-p^{-s}}=\sum_{n,p}1/np^{ns}
n \geq 2的部分绝对收敛。令s \to 1,得到
\displaystyle \sum_{p\leq X}\frac{1}{p}=\log\log X+O(1)X \to \infty
Dirichlet定理可以用完全类似的方式精细化:
\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}\log\log X+O(1)X \to \infty

The Theory of Dirichlet Characters
为得到形如\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}\sum_{p\leq X}\frac{1}{p}+\text{residue terms}的代数恒等式,Dirichlet首先假定d为素数并乞灵于单位根/分圆域理论。从今天的观点看,他将有限交换群的不可约复表示(Fourier分析的别名)引入了数论。
我们仅需要最简单的事实:令G_q=(\Bbb{Z}/q\Bbb{Z})^{*}特征\tilde{\chi}:G_q \to GL_1(\Bbb C)构成L^2(G_q)的完备正交基。对偶地,G_q也构成L^2(\hat{G_q})的完备正交基。
\tilde{\chi}扩张到\mathbb{Z}上,即得到Dirichlet特征\chi:\Bbb Z \to GL_1(\Bbb C). 为\displaystyle \frac{1}{p}赋权\displaystyle \frac{1}{\phi(q)}\sum_\chi \bar{\chi}(a)\chi(p),我们得以筛选出满足同余条件的p
\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}(\sum_{p\leq X}\frac{1}{p}+\sum_{\chi\neq 1}\chi(a)\sum_{p\leq X}\frac{\chi(p)}{p})
目标转为对\chi \neq 1证明\displaystyle \sum_{p\leq X}\frac{\chi(p)}{p}=O(1)X \to \infty.

The Dirichlet L-function
上述推理引向对Dirichlet L-函数的研究:
\displaystyle L(s,\chi)=\sum_{n=1}^{\infty}\frac{\chi(n)}{n^s}=\prod_p \frac{1}{1-\chi(p)p^{-s}}
\mathrm{Re}(s)>1上取对数函数的主支,\displaystyle \log L(s,\chi)=\sum_{n,p}\chi(p)^n/np^{ns}n \geq 2的部分依然绝对收敛。目标再次转为对\chi \neq 1证明L(1,\chi)\neq 0.
如下解析事实足以完成证明:\displaystyle \prod_\chi L(s,\chi)(如同L(s,1)=\zeta(s)一样)在s=1处有单极点。
Serre A Course in Arithmetic

Dirichlet的证明更加迂回,也因此包含了远为丰富的内容。我们先陈述较为一般的现代观点:给定\Bbb Q的代数扩张K
(1)Dedekind zeta函数\zeta_K(s)在极点s=1处的余数包含了K的整体算术信息,通常称为类数公式
(2)若K是Galois扩张,则\zeta_K(s)可以分解为Artin L-函数的乘积;
(3)若K是Abel扩张,则由Kronecker-Weber定理(或者更一般地,Artin互反律),Artin L-函数与本原(primitive)Dirichlet L-函数存在某种形式的一一对应;

Dirichlet完整地处理了K为二次域/\chi为本原二次特征的情况:此时
\displaystyle \zeta(s)L(s,\chi)=\zeta_K(s)K=\Bbb Q(\sqrt{\chi(-1)q})

(1)通常将二次域类数公式归于Dirichlet名下2
\displaystyle \mathrm{Res}_{s=1}\zeta_K(s)=\frac{2\pi h_K r_K}{w_K\sqrt{|D_K|}}
其中h_K为类数,r_K正规子(regulator),w_KK包含的单位根个数,D_K为判别式。
(Leibniz公式)取q=4,此时唯一的非平凡Dirichlet特征\chi满足\chi(1)=1\chi(3)=-1L(1,\chi)=\pi/4. 对照类数公式,这即是说\Bbb Q(\sqrt{-1})有类数1。

(2)令G=\mathrm{Gal}(K/\Bbb Q)为Abel群,\rho:G \to GL(1),定义Artin L-函数
\displaystyle L(s,\rho)=\prod_p\frac{1}{1-\rho(\sigma(p))p^{-s}}
此处\sigma(p)Frobenius自同构,约定表示\rho(\sigma(p))定义在惯性群的不变子空间上。
分解\displaystyle \zeta_K(s)=\zeta(s)\prod_{\rho \neq 1} L(s,\rho)是纯代数的:将正则表示分解为不可约表示。
对于二次域KG=\{1,-1\},此时仅有一个非平凡的\rho\rho(\sigma(p))=0当且仅当p分歧(ramified);\rho(\sigma(p))=1当且仅当分解(split);\rho(\sigma(p))=-1当且仅当p惯性(inert)。也就是说,p为奇素数时,\rho(\sigma(p))等同于Legendre符号\displaystyle (\frac{D_K}{p}).

(3)令K=\Bbb Q(\sqrt{\chi(-1)q})。暂时假定q是不包含平方的奇数。一方面,唯一的以q为导子(conductor)的本原二次Dirichlet特征\chi(p)Jacobi符号\displaystyle (\frac{p}{q});另一方面,判别式D_K=(-1)^{(q-1)/2}。此时Artin L-函数L(s,\rho)与Dirichlet L-函数L(s,\chi)的对应\displaystyle (\frac{D_K}{p})=(\frac{p}{q})不是别的,正是二次互反律

(3)可以用adele的观点理解:以\Bbb A\Bbb Qadele环\Bbb A^{*}=\Bbb Q^{*}\times\Bbb R_{+}^{*}\times \hat{\Bbb Z}^{*}.
对于K=\Bbb Q(\xi_q)G=\mathrm{Gal}(K/\Bbb Q)=G_q. 取逆向极限,由Kronecker-Weber定理知\displaystyle \mathrm{Gal}(\Bbb Q^{ab}/\Bbb Q)同构于\hat{\Bbb Z}^{*},进而同构于\Bbb Q^{*} \backslash \Bbb A^{*}=GL_1(\Bbb Q)\backslash GL_1(\Bbb A))的连通分支:Artin L-函数和Dirichlet L-函数源于同一个对象的一维表示。

作为(3)的“相对”版本,对于整体域K的Abel扩张,Dirichlet特征推广为Hecke特征。Hecke特征理论可以诠释为adele对象上的调和分析,这是“Tate论文”的主题。

对于K的非Abel扩张,Langlands考虑了GL_n(\Bbb A)自守尖点表示以及相应的L-函数。此种情况下的Langlands互反猜想(reciprocity conjecture)是Langlands函子性猜想(functoriality conjecture)的一部分。为了理解与之相关的表示论,他构建了一个庞大的理论框架,通常以Langlands纲领之名为人所知。

今时今日的数学中存在2类L-函数:一类L-函数源于动机,关于其解析性质(类似于上面的(1)),我们有数学中最知名的一些猜想:Riemann猜想,BSD猜想,etc.;另一类L-函数则源于自守表示论,更浪漫一些,“无穷维的对称”。证明他们是同一尊坚纽斯神(Janus)的两面,是Langlands和许多数学家孜孜以求的梦想,当然也不妨说是,Dirichlet之梦。


  1. Felix Klein, Development of Mathematics in the 19th Century, translated by M.Ackerman
    Arnold在某次访谈中提及的轶事在当代语境下诠释了这句名言:
    The Bourbakists claimed that all the great mathematicians were, using the words of Dirichlet, replacing blind calculations by clear ideas. The Bourbaki manifesto containing these words was translated into Russian as “all clear ideas were replaced by blind calculations.” The editor of the translation was Kolmogorov. His French was excellent. I was shocked to find such a mistake in the translation and discussed it with Kolmogorov. His answer was: I had not realized that something was wrong in the translation since the translator described the Bourbaki style much better than the Bourbakists did.
    我一直怀疑Arnold所说的误译其实是”all clear calculations were replaced by blind ideas”(这才是对Bourbaki风格的“最佳”描述)。由于他本人的口误或者记者的失察,把”calcultions”和”ideas”的位置对调了。 
  2. 第一个以某种形式得到二次域类数公式的人是Gauss,但一如既往,他没有发表这个结果。 

Snoldelev Stone from the Semiotic Viewpoint

我不能辨识如尼文字(Runes),也不懂符号学。如果本文的标题引发了任何不切实际的期待,我愿意为之道歉:我即将写下的一切与学理无涉,它只关乎一些有趣的事实,以及它们之间的微妙联系。
我总有这样一种感觉:语言、文字和符号(包括梵文、Leibniz确立的微积分记号、ZFC公理体系范畴论Python)生活在比人类更深的某处。

本文源于一次闲谈。愿林香蕉老师赐福于EG老师,并使其平安!

收藏于丹麦国家博物馆Snoldelev石刻(约公元9世纪)是丹麦现存最古老的如尼石刻之一。石刻的内容包括3部分:2行如尼文字,3只互相勾住的角杯以及1个卍 字符

StoneSnoldelev石刻

Snoldelev_stone_drawingSnoldelev石刻(绘图)

卍 字符在文化圈之间的扩散现象(cultural diffusion)向来是饶有兴味的学术课题,印象中时常会看到诸如“太阳崇拜之为集体无意识”之类的讨论——当然非我所能置喙。近代卍 字符经历了一个符号所能经历的最大规模的流行化,相关领域的研究兴趣自然更浓了。

依照Weyl在他的名著Symmetry里的思路,或许应该对符号学中的“对称”概念稍作探求。作为SO(2)离散子群\Bbb Z/4\Bbb Z自然是容易理解的,唯一的微妙之处在于O(2)SO(2)的区别,用通俗的话说,镜像对称之间的区别。一般地,我们对半单Lie群的离散子群已有相当的了解(例如Margulis的超刚性(superrigidity)和算术性(arithmeticity)定理),理论几乎允许我们分类所有“对称符号”——可惜在此之前,我们的视觉想象力早已到达极限!

3只互相勾住的角杯是一个不完整的Borromean环(Borromean ring, 因出现于北意大利贵族Borromeo家族的族徽中而得名)。国际数学联盟(IMU)现如今采用的Logo即是一个Borromean环(由John Sullivan设计)。

Snoldelev-three-interlaced-hornsSnoldelev石刻上的3只角杯 (示意图)

Coat_of_arms_of_the_House_of_BorromeoBorromeo家族的族徽

IMU-Bthe Logo of IMU (since 2006)

扭结理论中,Borromean环是最简单(因而也最知名)的Brunnian链环,后者指的是这样的非平凡链环:去掉任意一个环都可以解开整个链环。
Brunnian链环在链环同伦意义下的分类已由John Milnor完成。
Milnor  Link Groups

Borromean环的上述拓扑性质使其成为一个备受青睐的符号。在神学上它被广泛用于表示“三位一体”(trinity),Jacques Lacan则将其采纳为精神分析学的拓扑图腾:三个环分别代表现实(reality)的三个部分,实在的(real),幻想的(imaginary)和符号的(symbolic)1

我希望再举一个来自流行文化的例子。在知名游戏Sid Meier’s Civilization 5中,丹麦文明的领袖是传奇英雄Harald Bluetooth,而丹麦文明的旗帜则取自Snoldelev石刻上的3只角杯。

蓝牙文明5中的“蓝牙”

丹麦文明5中丹麦文明的旗帜

最后,关于Snoldelev石刻上的2行如尼文字。如尼字母表有Elder Futhark(2至8世纪)和Younger Futhark(8至12世纪)之分,Snoldelev石刻反映了过渡时期双表并用的情况:同一个字母h在石刻中有ᚺ (Elder Futhark)和ᚼ (Younger Futhark)2种写法2

90年代中期,几大IT业巨头试图在手机与电子计算机之间建立一个新的无线通讯标准。Jim Kardach提议将这种无线通讯标准及其相关技术命名为Bluetooth,“蓝牙”。Harald Bluetooth统一了丹麦诸王国。Kardach希望这项发明也能在通讯协议领域达成同样的伟业。
Kardach  Tech History: How Bluetooth got its name
依照Younger Futhark,Harald Bluetooth的姓名缩写B.H.应该写为ᛒ ᚼ,将两者组合在一起的结果是Bluetooth

古代英雄和现代智者的野心重叠在了一起。

符号有着不易觉察的重量。


  1. 后现代哲学对数学概念的滥用几成风气。就我个人而言,此前和Derrida打交道的不愉快经历让我对此类“理论”产生了深切的怀疑。无论如何,我愿意秉承“不知为不知”的态度,承认我对Lacan理论毫无了解。如若在表述和翻译上有不够圆妥之处,还请批评指教。 
  2. 如果您的Chrome无法正确显示如尼字母,请使用Firefox浏览本文。 

On the Maslov index

关于“量子数学”,我们计划展开一系列讨论。本文是系列的第2篇。
我们将引入Maslov指标的概念,并介绍其在现代数学中的不同“面相”,进而为研究相空间的几何性质做好准备。
A.Ranicki建立了一个关于Maslov指标的主题站,搜罗了大量有价值的原始资料。

The Ambient Space
给定辛空间(V^{2n},\omega),其Lagrange子空间模空间称为Lagrage Grassman流形。遵从Arnold,我们将其记为\Lambda(V)\Lambda(n)。必要时(比方说,为了定义万有示性类),也可以考虑作为正向极限的稳定LG流形\Lambda(\infty)
LG流形是齐性空间\Lambda(n)=U(n)/O(n)\mathrm{dim}(\Lambda(n))=n(n+1)/2。辛群Sp(2n)可迁地作用于\Lambda(n),事实上\Lambda(n)=Sp(2n)/SS是保持某个Lagrange子空间不变的稳定子群。
从Lie代数的角度看,视\mathfrak{u}(n)斜Hermite形式斜对称形式\mathfrak{o}(n)为其实部,则LG流形在l处的切空间与斜Hermite形式的虚部,即l上的对称形式,有一个自然同构(\gamma(t), \dot{\gamma}(t)) \mapsto B[\gamma(t),\dot{\gamma}(t)]\gamma:[a,b] \to \Lambda
给定l后,我们可以将\Lambda(n)分解为\Sigma_k的不交并,\Sigma_k中的l'满足\mathrm{dim}(l' \cap l)=k。连通开流形\Sigma_k的余维数为k(k+1)/2l' \in \Sigma_k处的切向量v满足B[l',v]|_{l \cap l'}=0.
l' \in \Sigma_0,则称l'l横截相交(intersect transversally)。这是微分拓扑意义上的一般位置(generic position)。奇点集\Sigma=\overline{\Sigma_1}=\cup_{k \geq 1}\Sigma_k\Lambda(n)的代数子流形,称为Maslov闭链(Maslov cycle)。
标准的同伦序列计算指出\Lambda(n)的基本群为\Bbb Z,故H_1(\Lambda(n);\Bbb Z)=H^1(\Lambda(n);\Bbb Z)=\Bbb Z\Sigma所在的同调类与l的选取无关:其Poincaré 对偶\alphaH^1(\Lambda(n);\Bbb Z)的生成元。

The Index for a Loop
(Maslov指标\mu,定义1) 对于闭曲线\gamma:[a,b] \to \Lambda\gamma(a)=\gamma(b)=l,扰动\gamma使其横截于\Sigma_1(作为Maslov闭链\Sigma的稠密子集)。定义\mu(\gamma)\gamma\Sigma_1相交数
由同伦不变性知此定义与基点l的选取无关。
Arnold  Characteristic class entering in quantization conditions
曲线闭合的假定允许我们将此定义同调化:对于\gamma:S^1 \hookrightarrow \Lambda,定义\mu(\gamma)=\alpha[f(S^1)]
Arnold提供了一个计算\mu(f)的方法:对于任意l',均存在g \in U(n)满足g(l)=l',其判别式精确到\pm 1。这在整个LG流形上定义了映射\mathrm{det}^2: \Lambda(n) \to S^1\mu(f)\mathrm{det}^2 \circ f:S^1 \to S^1卷绕数(winding number)。

The Index for a Path
Arnold仅对闭曲线\gamma定义了Maslov指标,因为他需要一般位置的论证来保证\gamma\Sigma_1横截相交。
若我们允许更一般的相交方式,则可以对任意\gamma定义Maslov指标。具体地说,称I[l,\gamma,t]=B[\gamma(t),\dot{\gamma}(t)]|_{l \cup \gamma(t)}\gamma(t)处的相交形式,B有非平凡的定义当且仅当\gamma(t) \in \Sigma。我们记I[l,\gamma,t]的号差为\sigma[l,\gamma,t]
(Maslov指标\mu,定义2) 对于\gamma:[a,b] \to \LambdaI[l,\gamma,t]保持非奇异(几何上这意味着\gamma和所有\Sigma_k横截相交), 定义
\mu(\gamma)=\frac{1}{2}\sigma[l,\gamma,a]+\frac{1}{2}\sigma[l,\gamma,b]+\sum_{a<t<b}\sigma[l,\gamma,t]
Robbin, Salamon  The Maslov index for paths

The Index for Two Paths
Arnold指出闭曲线的Maslov指标可以理解为卷绕数。熟知卷绕数有一个相对形式的版本(relative version)——2条闭曲线的环绕数(linking number)——这促使我们寻找相对Maslov指标的定义。
给定\gamma_1,\gamma_2:[a,b] \to \Lambda,定义相对相交形式
I[\gamma_1,\gamma_2,t]=I[\gamma_1,\gamma_2(t),t]-I[\gamma_2,\gamma_1(t),t]
其号差记为\sigma[\gamma_1,\gamma_2,t]
(Maslov指标\mu,定义3)对于\gamma_1,\gamma_2:[a,b] \to \LambdaI[\gamma_1,\gamma_2,t]保持非奇异, 定义
\mu(\gamma_1,\gamma_2)=\frac{1}{2}\sigma[\gamma_1,\gamma_2,a]+\frac{1}{2}\sigma[\gamma_1,\gamma_2,b]+\sum_{a<t<b}\sigma[\gamma_1,\gamma_2,t]
定义2是\gamma_1(t) \equiv l的情况。
Cappell, Lee, Miller指出可以用以下6条公理刻画Maslov指标\mu(\gamma_1,\gamma_2)
(1)底空间VV=\Bbb R^2时满足归一化条件;
(2)底空间V:辛可加性;
(3)时间参数t:仿射不变性;
(4)道路\gamma:可加性;
(5)道路\gamma:同伦不变性;
(6)道路\gamma:辛不变性;
Cappell, Lee, Miller  On the Maslov index

The Index for a Triple of Points
对于Lagrange子流形的三元组(l_1,l_2,l_3),定义Kashiwara指标\tau(l_1,l_2,l_3)为实二次型Q(x_1,x_2,x_3)=\omega(x_1,x_2)+\omega(x_2,x_3)+\omega(x_3,x_1)的号差。这个定义属于柏原正树(Masaki Kashiwara)。
Lion, Vergne  The Weil representation, Maslov index and Theta series
\tau是辛不变的,我们可以认为这个整值函数是\Lambda(V)上2维单形的“有向面积”(2-上闭链),它决定了2维单形的辛等价类。
通过单形分解,我们可以对任意2维单纯复形定义Kashiwara指标。
考虑\gamma_i:[a,b] \to \Lambdai=1,2,3h_{jk}(t)\gamma_j(t) \cap \gamma_k(t)的维数。\tau\mu有一个形如Newton-Leibniz公式的关系:
\tau(\gamma_1(b),\gamma_2(b),\gamma_3(b))-\tau(\gamma_1(a),\gamma_2(a),\gamma_3(a))=2[\mu(\gamma_1,\gamma_2)+\mu(\gamma_2,\gamma_3)+\mu(\gamma_3,\gamma_1)]+\sum[h_{jk}(b)-h_{jk}(a)]

Indices on the Total Spaces
给定纤维丛E \to \Lambda,上面讨论过的所有指标均在E上有自然的定义:投影映射的“拉回”。E的常见例子包括万有覆叠\tilde{\Lambda}和辛群Sp(2n)

Other facets
Maslov指标最迷人的特征是它以不同的形式出现于现代数学的各个领域。有鉴于辛几何在统一不同数学分支中的作用,Weinstein提出了所谓的“辛哲学”,这或许可以作为其中一个例证。
限于篇幅,我们将满足于列出一张(并不完备的)清单以传递整体图景。对于清单上的部分条目,我们将在他处作更详细的讨论。

(1) 在研究WKB近似时,Maslov考虑了相空间V的Lagrange子流形M到构型空间p=0的投影问题。为了研究投影的奇点集,他取M中横截奇点集的曲线,并定义其与奇点集的相交数为Maslov指标。在他之前,Keller在研究Bohr-Sommerfeld量子条件时也定义过类似的概念。

(2) Weil 表示是辛群的“典范”射影酉表示,Kashiwara指标在其中扮演着Schur乘子的角色——辛不变量籍由表示论深入到了数论的领域。

(3) Hörmander在研究Fourier算子理论时定义了Hörmander指标s(l_1,l_3;l_2,l_4)。可以证明Hörmander指标恰为4边形(l_1,l_2,l_3,l_4)的Kashiwara指标的一半。
Hörmander  Fourier Integral Operators I

(4) 在经典力学/几何光学中,Hamilton-Jacobi力学和Lagrange力学是一体两面的存在,因而辛几何和Riemann几何中的变分问题也有着天然的联系。Duistermaat试图将Maslov指标与Morse指标联系起来,因而考虑了Morse指标在Legendre变换下的对应概念:Duistermaat指标。Duistermaat指标不满足道路可加性,其补正项恰恰是Hörmander指标s(l_1,l_3;l_2,l_4)
Duistermaat  On the Morse index in variational calculus

(5)我们转向拓扑。将可定向流形L^{4k}沿闭流形M^{4k-1}切成2片,Novikov证明了号差的可加性:\sigma(L)=\sigma(L_1)+\sigma(L_2)。当\partial M非空时,Wall指出上述公式需要一项补正:\partial M作为3个流形边缘的嵌入映射给出辛空间H_{2k-1}(N;\Bbb R)的3个Lagrange子空间,补正项是它们的Kashiwara指标。
Wall  Non-additivity of the signature

(6)对于(5)中的现象,我们有另一种理解方式。Atiyah, Patodi和Singer试图将Hirzebruch号差定理推广到带边的紧4k维流形,在此过程中他们发现补正项是边缘上某个Dirac算子的“指标”(对无穷和取zeta函数正则化)。这个补正项在数学上称为eta不变量,对应物理中的谱不对称性(spectral asymmetry)。
Atiyah, Patodi, Singer  Spectral asymmetry and Riemannian Geometry. I
就我们的目的而言,重要的是如下事实:给定2组Lagrange子空间,我们可以定义某个Dirac算子D。相对Maslov指标是D\epsilon-谱流(spectral flow),从而可以由D的eta不变量表出,详见Cappell, Lee, Miller。用这一事实重新证明(5)将是有趣的。

(7)Floer同调论在某种意义上是(4)(6)的综合。Maslov指标以Conley-Zehnder指标的形式出现在某些Cauchy-Riemann型算子的谱流计算中。

Manjul Bhargava and his 290 theorem

ICM 2014今天在韩国首尔召开。正如之前所预测的那样,Manjul Bhargava获得了2014年的Fields Medal. 一同获奖的还有Artur Avila, Martin HairerMaryam Mirzakhani.

这份名单相当有趣:史上第一位女性获奖者1;4人广义上的“祖国”(印度、巴西、奥地利以及伊朗)此前均无Fields奖得主2;3人的研究工作和遍历理论紧密相关;2人有参加IMO的经历3;等等。

本文将介绍获奖者Manjul Bhargava的一项“初等”工作:简化了Conway-Schneeberger 15定理的证明,并进一步证明了Conway的290猜想。

1.
我们感兴趣的是在整格\Bbb Z^n上取整值的n元多项式f。若f是齐次的,这相当于要求f的系数为整数。对可表示集R_f:=f(\Bbb N^n) \subset \Bbb Z(约定0 \in \Bbb N)的研究贯穿了整个数论史:
(1.1)Fermat集中研究了用2元2次整系数多项式表示素数p的问题,并发现
f(x,y)=x^2+y^2,则p \in R_f当且仅当p形如4a+1
f(x,y)=x^2+2y^2,则p \in R_f当且仅当p形如8a+18a+3
f(x,y)=x^2-2y^2,则p \in R_f当且仅当p形如8a+18a+7
f(x,y)=x^2+3y^2,则p \in R_f当且仅当p形如3a+1
f(x,y)=x^2+5y^2,则p \in R_f当且仅当p形如20a+120a+9
此类现象是代数数论乃至类域论的渊薮。
(1.2)由Fermat二平方和定理开始,Euler等数学家获得了一系列经典结果。
(Fermat二平方和定理, 由Euler证明) 若f(x,y)=x^2+y^2,则自然数k \in R_f当且仅当k的奇素因子(若有)均形如4a+1
(Lagrange四平方和定理) 若f(x,y,z,w)=x^2+y^2+z^2+w^2,则R_f=\Bbb N
(Legendre三平方和定理) 若f(x,y,z)=x^2+y^2+z^2,则自然数k \in R_f当且仅当k不能写成2^{2a}(8b+7)的形式。
(1.3) 平方数有一类推广,即所谓的多边形数:填满正多边形内部的点的个数。
(Gauss三角数定理,“Eureka定理”)令f(x,y,z)=\frac{x(x+1)}{2}+\frac{y(y+1)}{2}+\frac{z(z+1)}{2},则R_f=\Bbb N
推广Gauss三角数定理和Lagrange四平方和定理,我们有如下结果:
(Fermat多边形数定理,由Cauchy证明) 任意自然数均可表示为不超过nn边形数之和。
(1.4)从Lagrange四平方和定理出发,我们也可以研究高次幂多项式的表示问题:
(Waring问题,由Hilbert解决) 给定k \geq 2f=\sum_{1 \leq i \leq g} x_i^k。对于充分大的gR_f=\Bbb N
关于g的下确界g(k)有许多研究:g(2)=4(Lagrange),g(3)=9(Wieferich, Kempner),g(4)=19(Balasubramanian),g(5)=37(陈景润,Conway),等等。已知g(k)=2^k-2+\lfloor 1.5^k\rfloork \leq 471600000成立,欠缺的只是一个证明。

对相应的数论史感兴趣的读者可以参考
Weil  Number theory: an approach through history from Hammurapi to Legendre
Edwards  Fermat’s last theorem: a genetic introduction to algebraic number theory

2.
在所有整系数多项式中,我们对整二次型的理解是最好的。荣耀归于Gauss:他在Disquisitiones Arithmeticae中建立了完备的整二元二次型理论,这是整个现代数论的起点。
首先我们区别整二次型的2种不同定义:(1)较强的Legendre定义要求二次型取整值(整系数);(2)较弱的Gauss定义要求二次型对应的对称双线型取整值(对应矩阵为整系数)。为避免混淆,我们称后者为整矩阵型。
本节讨论的整二次型默认为正定的。 这允许我们从几何的观点研究问题:这些整二次型可以视为整格上的“Riemann度量”,整格因之获得“Riemann空间”的结构。
满足R_f=\Bbb N的整二次型f(及其对应的整格)称为万有的(universal)。任意二元和三元整二次型都不可能是万有的。另一方面,Lagrange四平方和定理说明f(x,y,z,w)=x^2+y^2+z^2+w^2是万有的。
1916年,Ramanujan一口气给出了所有54个四元万有整对角型(Le style c’est l’ homme!),由此重燃了对这个领域的兴趣。研究者继而提出了
(万有性问题) 刻画所有万有整格的等价类。
1948年,Willerding在她的博士论文中分类了“所有”四元万有整矩阵型。四十多年间无人发现其中隐藏的重大疏漏。直到1993年,Conway重新考虑了这个问题,才给出万有整矩阵型的完满刻画(Conway-Schneeberger, 由Bhargava简化):
(15定理) 整矩阵型f是万有的当且仅当R_f包含以下9个关键值(critical value)
1,2,3,5,6,7,10,14,15.
Bhargava  On the Conway-Schneeberger Fifteen Theorem
由此可以决定四元万有矩阵型的所有204个等价类(参见上文附表)。
令人吃惊的是,若悬置等价性的判定,则Bhargava 的简化证明将是完全初等的——一个数学系新生完全能理解其过程并借助计算机验证结果。核心操作是整格的扩充(escalation):若其不能表示的最小正整数为m(称为“逃学生”,truant),则其扩充指的是加入一个模长为m的向量后生成的新整格。
从0维整格出发,不断进行扩充,我们得到一棵以整格为节点的。15定理的核心是如下事实:Bhargava树的高度有限(事实上,为5——这个幸运的“巧合”使得穷举不会复杂到无法处理的程度)。如果约化到等价类,则各层的节点数分别为1,1,2,9,207,1630。每个非叶节点都对应一个“逃学生”,15定理涉及的关键值是这些“逃学生”的集合。

沿着证明15定理的思路,Bhargava又得到了如下“副产品”:
(33定理) 给定整矩阵型fR_f包含所有奇数当且仅当R_f包含以下8个关键值
1,3,5,7,11,13,15,33.
(73定理) 给定整矩阵型fR_f包含所有素数当且仅当R_f包含以下17个关键值
2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,67,73.

和整矩阵型相比,整二次型的万有性问题远为复杂。2005年,Bhargava和Hanke宣布他们证明了Conway的290猜想:
(290定理) 整二次型f是万有的当且仅当R_f包含以下29个关键值
1,2,3,5,6,7,10,13,14,15,
17,19,21,22,23,26,29,30,31,34,
35,37,42,58,93,110,145,203,290.
由于证明牵涉到大规模计算,二人迄今尚未正式发表这个结果。他们的证明思路以预印本的形式流布:
Bhargava, Hanke Universal quadratic forms and the 290-Theorem
对于整二次型,Bhargava树的前5层分别有1,1,3,34,6560个节点。在6560个节点中,6402个为叶节点,153个节点至多有3代子孙,剩下的5个节点可以用两人发明的“10-14技巧”处理。

3.
迄今为止的讨论尚有一处留白:整二次型的等价分类。这是一个经典问题,此处只能略述大概。我们推荐读者查阅:
Conway, Sloane  Sphere packings, lattices and groups, Chapter 15

Gauss完全解决了整二元二次型的分类问题,在Conway, Sloane中可以找到他的等价判定算法(Gauss约化)以及判别式d较小时整二元二次型等价类的全表。
多元的情况相对复杂。我们先考虑一些较粗糙的等价关系,再逐步将其精细化。
(3.1)有理二次型的\Bbb Q-等价判定由如下经典结果给出:
(Hasse-Minkowski定理) fg整体域\Bbb Q上等价当且仅当它们在所有局部域\Bbb Q_p(约定\Bbb R=\Bbb Q_\infty)上等价。
因而f的等价类由其在\Bbb Q_p上的不变量完全刻画:判别式d,号差\sigma,以及由Hilbert符号给出的Hasse-Minkowski不变量\epsilon_p
Serre  A course in arithmetics
(3.2)稍精细一点,我们可以考虑二次型的\Bbb Z_p等价,其等价类即Gauss研究过的(genus)。
此处有许多深刻的数论结果,例如在Weil著名的Acta论文中,二次型的属分类通过自守形式与酉表示论相联系,由此得到的Weil-Siegel公式推广了经典的Smith-Minkowski-Siegel质量公式。我们希望在今后讨论酉表示论时更深入地介绍这方面的结果。
(3.3)属可以划分为更加精细的旋子属(spinor genus),此时有一个自旋算子群可迁地作用在旋子属上。
(Eichler) n \geq 3时,旋子属与n元不定整二次型的等价类一一对应。
读者可以在Conway, Sloane以其所引述的文献中找到详细的叙述和证明。
至此我们完整分类了不定整二次型。
(3.4)正定整二次型的分类要困难得多。以上讨论过的不变量依然可以用于分类(尤其在低维),但不再对应唯一的等价类。即使限制到幺模整格(二次型的d=1),随着维数的上升,等价类的数目也将迅速趋于天文数字:例如,Smith-Minkowski-Siegel质量公式指出32维欧氏空间中有超过8 \times 10^{16}个幺模整格的等价类!
推广Gauss约化,我们有称为Minkowski约化的算法。遗憾的是n>7时,Minkowski算法的复杂度急剧上升。此时所谓的Kneser粘贴方法(gluing method)可以进行一些有益的补充。

n>25时,正定整二次型的任何较完备的分类在目前都是不可想象的。然而从某种意义上说,24或许已经足够了:在24维我们有著名的Leech整格,7个“第二代”散在单群(sporadic group)作用于其上,包括3个Conway群Higman-Sims群铃木群Janko群J_2。Leech整格可用于构造Griess代数(作为某个共形场论顶点算子代数),后者的自同构群给出最大的散在单群:魔群(monster group,此群的阶数约为8 \times 10^{53},中文翻译似未能传达monster所隐含的“巨大”之意)——至矣,大矣,蔑以加矣!
无论从何处出发,我的兴趣总是将我引向同一个目的地。从数论开始,最终抵达魔群的所在地——这条路恰恰是Conway本人所走过的。在这里,他发现了散在单群与模形式的神秘联系,量子物理和数论以不可分割的方式结合在一起。Conway和Norton的魔群月光猜想描述了这些现象。
conway

John H.Conway (1937- )

16年前,Conway的学生Borcherds正是凭借对魔群月光猜想的证明获得了另一枚Fields奖章。


  1. 或许是为了赶在美国第一位女总统之前? 
  2. 何其政治正确!当然这也反映了现今欧美基础学科研究人员的“去欧美化”趋势。 
  3. 有此经历的Fields奖得主越来越多,当然,其中并没有华人的身影——丘成桐或许会愿意就数学研究和奥林匹克数学的关系作进一步的评论。 

On Arrow’s theorem

我无法理解经济学。

理论上,你需要做的只是将现实抽象成公式,丢进Poincaré 的法国香肠制造机,任由数学家们胡搅一气,坐等成品出炉后再喂给现实中的狗——简直像物理学一样明晰。
可悲的是你永远无法统一经济学家眼中的现实 (仿佛一经经济学家观测,“现实”本身都发生了扭曲——光荣归于不确定性原理!),永远无法迫使他们就模型的遴选达成一致 (如果现实的复杂度可以轻易压垮任何模型,那么比较将是不可能的),更无法阻止他们对纯数学结果给出各种天花乱坠的曲解并美其名曰:“诠释”。

我认为经济学是不可理解的。
然而经济学定理仍然有其单纯的一面——只涉及数学的那一面。

The Voting Paradox
给定n元集合A(选择),令L/L^{*}A上的所有可能的全序关系/严格全序关系。今后我们用x,y,z,\cdotsA中的不同元素。
对于I=\{1,2,\cdots,N\}(社会),F:L^N \to L^{*}\vec{R}=(R_1,R_2,\cdots,R_N) \mapsto R称为社会福利函数。寻找F即寻找一种能将个人偏好统一为集体偏好的方法。
n=2时,多数决给出一个构造R的方法:x > y (R)当且仅当\#\{i: x > y (R_i)\} > \#\{i: x < y (R_i)\}
n \geq 3时,我们有所谓的

(Condorcet悖论) 令x > y > z(R_1)z > x > y(R_2)y > z > x(R_3),此时R的任何取值都将违背多数决原则。

“悖论”这个听上去颇可怕的词并不意味着“行使多数决时我们将不可避免地陷入矛盾”——因为现实生活中的绝大多数投票过程要么不涉及排序,要么允许以加权的形式表达偏好。经济学家认为这两种方案同样不可接受。他们为自己塑造了一尊名叫utility的金牛犊 (我不知道该怎么翻译:你可以谈论“效用”的边际效应,但不能说J.Bentham信奉“效用主义1),并就其神学意义展开了无休止的争论。当代大部分经济学家相信,理性人(另一个暧昧的概念!)眼中的utility是一个全序关系。
经济学家热衷于讨论没有确定意义乃至于根本不存在的东西。让他们继续讨论下去吧。

Who Dominate?
Condorcet悖论的核心是社会权力分配。现在我们将“权力”这个概念抽象化。
J \subset I对有序对(x,y)拥有决定权(decisive),若对所有满足x>y(R_i)\forall i \in J\vec{R}x>y(R)
J同时对(x,y)(y,x)拥有决定权,则称Jx?y(R)构成统治(dominant)。
J只包含一个元素j,寡头统治退化为独裁(dictatorial)。
任何有意义的社会福利函数都应该采纳所有成员“一致通过”的结论。我们要求:
(Ⅰ)I对任意x?y(R)构成统治;
就政治而言,(Ⅰ)代表集体意志的执行;就经济而言,(Ⅰ)给出一个Pareto优化:以x取代y后,所有人都更加满意。

Independence of Irrelevant Alternatives
n \geq 3时,另一条限制似乎也是自然的:
(Ⅱ)对任意有序对(x,y)x?y(R)仅由x?y(\vec{R})决定;
这通常被称为对无关选择的非依赖性(independence of irrelevant alternatives, IIA)。
与之相对应的,我们引入一个稍弱于决定权的概念:
J对有序对(x,y)拥有准决定权(almost decisive),若对所有同时满足(1)x>y(R_i)\forall i \in J;(2)y>x(R_i)\forall i \not \in J\vec{R}x>y(R)
乍看上去温良无害的(Ⅱ)实际上是一条极强的限制:假定n \geq 3F满足(Ⅰ)(Ⅱ),我们有
(引理1) 若J(x,y)拥有准决定权,则\forall zJ(x,z)拥有决定权。
证明:令
(3)x>y>z(R_j)i \in J
(4)y>x, y>z(R_i)i \not \in J
由假设知x>y(R),由(Ⅰ)知y>z(R),因此x>z(R)。(4)对x?z(R_i)i \not \in J没有任何限制,故由(Ⅱ)知J(x,z)拥有决定权。
同理我们有
(引理2) 若J(x,y)拥有准决定权,则\forall zJ(z,y)拥有决定权。
反复应用上述2条引理,我们得到
(引理3) 若J(x,y)拥有准决定权,则Jx?y(R)y?z(R)z?x(R)构成统治。
(引理4)若J(x,y)拥有准决定权,则J对任意u?v(R)构成统治。

The Voting Paradox Revisited
多数决要求F在满足(Ⅰ)(Ⅱ)的同时保证I的子集拥有准决定权当且仅当其充分大,Condorcet悖论指出在n \geq 3时这是不可能做到的。事实上我们有
(广义Condorcet悖论,Baby Arrow) 若n \geq 3F满足(Ⅰ)(Ⅱ),则存在j \in I对某个有序对(x,y)拥有准决定权。
证明:显然拥有准决定权的集合是存在的:例如I。有此性质的集合中,有一个包含的元素最少,记为J。若J不是单元素集,则J可拆分为2个非空集合J_1J_2的不交并。取有序对(x,y)之外的z,并令
x > y > z(R_i)i \in J_1
z > x > y(R_i)i \in J_2
y > z > x(R_i)i \not \in J
因为J(x,y)拥有准决定权,x>y(R)。由于J是此类集合中最小的,子集J_1不可能对(x,z)拥有准决定权,因此x \leq z(R)。同理y \geq z(R),矛盾。

Arrow’s Theorem
将引理4和Baby Arrow相结合,我们得到一个出乎意料的结果:
(Arrow一般可能性定理) 若n \geq 3F满足(Ⅰ)(Ⅱ),则存在j \in I对所有u?v(R)构成统治(独裁)。
换言之,此时F必为投影:R=F(R_1,R_2,\cdots,R_N)=R_j(R是一个严格全序关系,R=R_j仅在“遗忘”掉R_j中所有“=”的意义下成立)。
我们该怎么诠释这条定理呢?“所有投票都是不公平的”?理性和民主注定无法相容?如果我们高擎理性主义的大旗,那么哲人王将会是历史的唯一解药?又或者一切都指向虚无,在现实的废墟上既不存在所谓理性,也不存在所谓民主,Arrow定理和“真空中的球形鸡”无异2?形形色色的诠释者中,太多人既不懂数学,也不懂经济。站在Arrow立下的磐石上,他们翩然高蹈,自我陶醉地飞向了形而上学的领域。

几乎所有避开Arrow定理的方法都已经被尝试过了。放弃全序关系的模型,限制F的定义域,将n固定为2,令N \to \infty,放宽(Ⅰ)(Ⅱ),乃至迫使个体修正其偏好……究竟哪一种方法更好地描述了现实呢?在所有人自说自话的喧嚣中,我深深地怀疑even god does not know and time will never tell.

补注:豆瓣上的Welfare向我指出,在放宽(Ⅱ) (即IIA)的方向上已有不少积极成果,例如

Campbell,Kelly  Information and preference aggregation

另一方面,他也提到,A.Sen修正个体偏好的尝试被评价为”NOT very substantial”(if not trivial).

A Loose End

Arrow定理是一系列一般可能性定理中的头一个。我们还可以举出Gibbard–Satterthwaite 定理Duggan–Schwartz 定理,Sen的Pareto自由不可能定理,等等。

所有证明都是类似的,乃至平行于彼此。或许我们从未曾走得更远。60年过去了,我们仍在Arrow的荫蔽下,举目不见阳光。

Reference
Arrow  Social choice and individual values
Cassels  Economics for mathematicians
Reny  Arrow’s theorem and the Gibbard-Satterthwaite theorem: a unified approach


  1. 黄有光即提倡将utilitarianism翻译为“效用主义”,钱永祥、周保松则提倡“效益主义“的译法。一个更古雅的翻译是“乐利主义”,这是梁启超、胡适那个时代的译法。 
  2. 或许此处我们可以引用赵鼎新的辩护:“形式模型的目的不在于精确预测事物的具体发展,而在于抓住事物在一定条件下的发展规律及其背后的机制,因此,对形式模型进行简单的经验性批判没有什么意义。”(《社会与政治运动讲义》,社会科学文献出版社,2012) 

鹊桥仙

飘摇恍惚,浮流恍惚,恍惚彼时情动。色声香味触依然,断不了,贪嗔痴痛。

笙歌仿佛,游嬉仿佛,仿佛伊人与共。欲偷开眼认分明,又怕是,庄生一梦。


对我来说,新诗太难了:你几乎没有办法隐藏自己,除非你的诗艺足够平庸。

所以我喜欢填词。掌故、成句、双声、叠韵,在这些小把戏的沙堆下,当一只鸵鸟要容易得多。

七夕快乐。愿天下有情人终成眷属,我才能加倍享受自己的孤独。

Quantization as Deformation

Very early in my study of physics, Weyl became one of my gods. I use the word “god” rather than, say, “outstanding teacher” for the ways of gods are mysterious, inscrutable, and beyond the comprehension of ordinary mortals.
                                                                                                  ——Schwinger
关于“量子数学”,我们计划展开一系列讨论。本文是系列的第1篇。
Weyl是研究量子物理与表示论联系的第一人。这个领域至今依然非常迷人:表示论、代数几何、复几何、弦论乃至数论都交织在一起。
Weyl  Quantenmechanik und Gruppentheorie
 
1.Weyl代数和Heisenberg代数
1926年,秉承将可观测量矩阵化(算子化)的思路,Heisenberg发现了如下对易关系
[P_i,Q_j]=-i\hbar\delta_{ij}\hbar为约化Planck常数                   (1)
不久后,Bohn, Jordan以及Dirac等人的进一步研究阐明了(1)在量子力学中的基础性价值。
Weyl的着眼点是由位置算子和动量算子生成的算子环。一般地,对2k维线性空间V,(1)中Kronecker delta函数可以实现为V上的辛形式\omegau \otimes v-v \otimes u=\omega(u,v)定义了V上的Weyl代数W(V)。在这个意义上,经典力学对应对称代数,而Weyl代数是对称代数的“量子化”。
从Lie群的角度看,(1)又可以理解为某个Lie代数的结构方程:以辛形式定义Lie括号,在Weyl代数的生成元中加入单位元R(一维中心扩张)后生成的实Lie代数称为Heisenberg代数。其对应的幂零Lie群即著名的Heisenberg群。可赋予Heisenberg代数的中心元素以特殊的物理意义:当R为Hamilton算子时,其余生成算子对应的可观测量守恒。
例1  Heisenberg群H_{2k+1}可以在\Bbb R^{2k} \times \Bbb R上实现为:
(v_1,t_1)+(v_2,t_2)=(v_1+v_2, t_1+t_2+\omega(v_1,v_2)/2)
Heisenberg群出现在数学的各个领域:从Abel簇的构造 (Mumford) 到3维流形的分类 (Thurston)。其与theta函数的天然联系指向数论、模形式和数学物理。
 
2.Heisenberg群的酉表示
数学家的谨慎使Weyl不愿意处理P,Q这样的无界算子;另一方面,量子力学的物理诠释要求可观测量a对应自共轭算子A,于是过渡到Lie群层面后,e^{iA}为酉算子,这是特别令人满意的。
一般地,对于构型空间\Bbb R^k和算子P_i, Q_i1 \leq i \leq k,引入参数a,b \in \Bbb R^k并定义
X(a)=e^{iaQ}Y(b)=e^{ibP},向量相乘理解为内积
(1)等价于
X(a)Y(b)X(a)^{-1}Y(b)^{-1}=e^{-i\hbar ab}                                  (2)
此处的计算是形式的,可视为Baker–Campbell–Hausdorff公式的一个特例。
X(a), Y(b)\Bbb R^k的酉表示。Weyl的创辟之处在于他坚持统一处理共轭量的表示:
W:(a,b) \mapsto e^{(i\hbar/2)ab}X(a)Y(b)
由于XY不可交换,W不是\Bbb R^{2k}的酉表示,却能诱导一个射影酉表示:因为W满足W(a,b)W(a',b')=m(a,b:a',b')W(a+a',b+b'),其中Schur乘子m(a,b;a',b')=e^{(i\hbar/2)(ab'-ba')}在单位圆上取值。
物理上,这个射影酉表示非常令人满意:它对应量子力学中的波函数归一化。数学上我们有一个等价描述:定义Z(c)=e^{icR}c \in \Bbb R,并取
W:(a,b,c) \mapsto X(a)Y(b)Z(c)
此时W扩张为Heisenberg群H_{2k+1}的酉表示。乘子项m(a,b;a',b')得到了更好的解释:它对应H_{2k+1}的“挠部分”\omega(v_1,v_2)/2
尽管H_{2k+1}有非常简单的矩阵模型,它的酉表示却不可能是有限维的。下面是一些无穷维酉表示的例子。
例2 (theta表示) 给定上半平面的复数\tau,我们赋予复平面上的整函数如下范数:
\parallel f \parallel^2_\tau=\int_{\Bbb C} e^{(-2\pi y^2/Im(\tau))}|f(x+iy)|^2 dxdy
取所有满足\parallel f \parallel^2_\tau<\infty的整函数构成的Hilbert空间\mathcal{H}_\tau为表示空间,H_3有不可约酉表示
(W_t(a,b,c)f)(z)=e^{i\pi(a^2\tau+2az+c)}f(z+a\tau+b)
特别地,H_3的Abel子群\Bbb Z^2作用于\mathcal{H}_\tau上有唯一的不变向量,即Jacobi theta函数
例3 (Weyl表示;Schrödinger模型) 取L^2(\Bbb R^k)为表示空间,H_{2k+1}有不可约酉表示
(W_s(a,b,c)\psi)(x)=e^{i(ax+\hbar c)}\psi(x+\hbar b)
这个表示被称为Schrödinger模型的理由是可以由此获得量子力学的波动力学描述:例如,取R为Hamilton算子He^{itH}\psi=W_s(0,0,t)\psi=e^{i\hbar t}\psi。相因子无关紧要,我们可以认为波函数在单参数酉群e^{itH}的作用下不变(能量守恒)。取微分过渡到Lie代数层面,即得到Schrödinger方程
Weyl提出了如下问题:是否Heisenberg群H_{2k+1}的任意不可约酉表示均酉等价于W_s?1930年前后,Stone和von Neumann各自独立地给出了肯定的回答——从而给出了矩阵力学等价于波动力学的又一个证明。
(Stone-von Neumann定理H_{2k+1}的任意酉表示均酉等价于若干个W_s的直和。
由此也得知\mathcal{H}_\tauL^2(\Bbb R)作为H_3-模同构。
von Neumann的原始证明可以在以下著作中找到
Folland  Harmonic analysis in phase space
Kirillov分类了幂零Lie群的酉表示(并由其他人推广到可解Lie群)。他的中心思想是所谓的轨道方法:给定作为量子模型的Lie群的酉表示,我们可以反过来构造出辛流形作为经典模型的相空间。
 
3.抽象Heisenberg群
实Heisenberg群是局部紧Abel群\Bbb R^{2k}的中心扩张。Weyl提出可以将\Bbb R替换为有限群\Bbb Z_n,作为玩具模型来研究。另一方面,根据Lefschetz原理,也有理由将\Bbb R替换为其他局部域 (尤其是p-adic数域) 的加法群进行研究。这都要求我们推广局部紧Abel群上的调和分析
具体来说,我们以局部紧Abel群G取代\Bbb R^{2k},以2-闭上链取代辛形式\omega。以所有单位复数为中心的中心扩张1 \to \Bbb C_1^{*} \to H \to G \to 1给出抽象Heisenberg群H
群上同调论的角度看,Schur乘子m(a,b;a',b')作为2-闭上链的结构是清楚的,因为它满足
m(x+y;z)m(x;y)=m(x;y+z)m(y;z)
对于抽象Heisenberg群,Stone-von Neumann定理有一个深远的推广:Mackey理论。关于Mackey理论的主定理,一个细致且清晰的证明可以在下面这本书中找到:
Mumford  Tata Lecture on Theta III
当然也可以参看Mackey本人的著作,以及
Varadarajan  Geometry of quantum mechanics, Vol.2
 
 
4.Weyl量子化
局部紧Abel群满足Pontryagin对偶。对于相空间\Bbb R^{2k}而言,这个对偶关系是
(q,p) \mapsto (a,b)
经典物理量是(q,p)的函数。Weyl量子化,或者,Weyl变换,指的是(1)通过Fourier逆变换将经典物理量变为(a,b)的函数;(2)通过Weyl表示将(a,b)的函数变为算子(Q,P)的函数,也即Q_\hbar: f \mapsto W(F^{-1}f)
不难证明,(1)Q_\hbar(f)自共轭当且仅当f是实函数; (2) 若f速降函数,则Q_\hbar(f)迹类算子并有一个积分核表示。
对于一般的局部紧Abel群,我们也可以定义Weyl变换。p-adic数域的情况或许是最有趣的,不仅和数论紧密相关,而且有可能应用于物理上:某些数学物理学家(例如Volovich)怀疑Planck尺度下的时空是非Archimedes的。
Weyl变换的逆变换称为Wigner变换。这是一个非常有趣的变换:量子概念的经典”对应“常常有意料之外的物理意义。下面我们将进行这方面的讨论。
 
5.Weyl-Moyal代数
1940年前后,Moyal对Weyl量子化进行了更深入的考察。和Weyl不同,他感兴趣的对象不是算子,而是经典函数空间:Weyl忽略了经典函数空间的Poisson结构,而这正是Moyal希望研究的。
定义Moyal积\cdot_\hbar为算子复合运算在Wigner变换下的拉回:
Q_\hbar(f_1 \cdot_\hbar f_2)=Q_\hbar(f_1)Q_\hbar(f_2)
定义Moyal括号[f_1,f_2]_\hbar=f_1 \cdot_\hbar f_2-f_2 \cdot_\hbar f_1,我们有:
Q_\hbar([f_1,f_2]_\hbar)=[Q_\hbar(f_1),Q_\hbar(f_2)]
这在经典函数空间(不妨取成Schwartz空间)上定义了一个Poisson代数结构,我们称其为Moyal代数。
\hbar \mapsto 0时,Moyal代数趋于退化,这对应经典物理的假定:测量顺序不影响结果。一般地,我们希望研究Moyal代数对参数\hbar的依赖。
展开到一阶:
f_1 \cdot_\hbar f_2=f_1 f_2+\frac{i\hbar}{2}\{f_1,f_2\}+O(\hbar^2)
[f_1,f_2]_\hbar=i\hbar\{f_1,f_2\}+O(\hbar^2)
事实上,展开到二阶后,[f_1,f_2]_\hbar=i\hbar\{f_1,f_2\}+O(\hbar^3).

Dirac发明的正则量子化 (更确切地,对应于单粒子的一次量子化)方法以Poisson括号描述非交换性,上式指出这只在二阶近似的意义上成立。历史上人们很早就发现正则量子化有不可避免的内在矛盾。例如,Groenewold-van Hove不可行定理(no-go theorem)指出对于次数大于2的多项式f(x_1,x_2),一个自洽的正则量子化是不可能的。几何量子化、形变量子化等方法正是由此发展而来。

为了将Moyal代数的结构看得更加清楚,我们必须推广对Poisson括号的定义:
取2组变元q^{(1)},p^{(1)},q^{(2)},p^{(2)}
定义S(\Bbb R^{2k} \times \Bbb R^{2k})上的微分算子\Pi=\Sigma(\frac{\partial}{\partial q_j^{(1)}} \otimes \frac{\partial}{\partial p_j^{(2)}}-\frac{\partial}{\partial p_j^{(1)}} \otimes \frac{\partial}{\partial q_j^{(2)}}),定义S(\Bbb R^{2k} \times \Bbb R^{2k}) \to S(\Bbb R^{2k})的对角算子D(f)(q,p)=f(q,p,q,p),Poission括号相当于这两个算子的复合:
\{f_1,f_2\}=D \circ \Pi(f_1 \otimes f_2)=P(f_1 \otimes f_2)
由此我们可以定义Poisson括号的“幂”:P^N(f_1,f_2)=D \circ \Pi^N(f_1 \otimes f_2)
于是形式上我们有
f_1 \cdot_\hbar f_2=e^{(i\hbar/2)P}(f_1,f_2)
[f_1,f_2]_\hbar=\frac{2}{\hbar}\sin(\frac{\hbar}{2}P)(f_1,f_2)
这就是Moyal括号又被称为“正弦括号”的原因。
 
6.形变量子化
通过上述对Moyal代数的考察,我们发现以\hbar为形变参数,量子代数可以视为经典代数的形变。这个观点由Flato等人首次提出。特别地,他们证明了对于S(\Bbb R^{2k})上的经典Poisson代数结构,Moyal代数在规范等价的意义上是唯一可能的形变——也就是说,量子力学是经典力学唯一可能的”形变“。
 
一般地,令A为某光滑流形X上所有光滑函数的代数。A上的Moyal积定义为
(f,g) \mapsto f \star g=fg+\hbar C_1(f,g)+\hbar^2 C_2(f,g)+\cdots \in A[[\hbar]]
此处\hbar为形式变元,C_i为双微分算子。
 
为了进行形变,我们要求Moyal积不仅仅是一个形式的渐进展开,而是一个真正的解析展开。这一点并没有先验的保证。
 
Darboux定理,辛流形上的局部Poisson代数结构总能形变为Moyal代数。我们只需在装备一个平坦的辛联络之后,将这个局部形变扩张到整个流形上。对于一般的Poisson流形,情况要复杂得多。此时Kontsevich量子化公式给出一个Moyal积的形式定义(这是Kontsevich获得1998年Fields奖的原因之一),但尚不清楚它是否在规范等价的意义上给出唯一可能的形变量子化。