Spectra of Modular Surfaces I

几天前,某篇宣称证明了Pólya猜想论文(基本可以确定是一记“乌龙”)在我的朋友圈里引发了一些讨论。一种观点是:与20年来复几何、辛几何方面的新思想(例如Donaldson学派为解决同调镜对称猜想而发展的一系列工作)相比,诸如Pólya猜想一类的几何分析问题已经过时了。
必须承认,Pólya猜想在理论上并没有太多有趣的推论。就方法论而言,它固然是特征值估计技术的试金石,但迄今为止,在Li-Yau方法的基础上并没有本质的进步,何况几何分析学家真正感兴趣的也仅仅是第一特征值,整个higher theory还有待发展。
然而,冒着“越俎代庖”的风险,我还是想为谱几何的整体价值稍作辩护。
Laplace算子的谱理论不仅是几何的一部分,也是无穷维表示论的样本。我手头恰好有一个相对晚近的例子,涉及特征值估计技术在模形式理论中的应用,兼有数论和量子物理两方面的重要性。就精神而言,这是Langlands纲领(数论的,几何的,物理的)一部分,是镜对称的“远亲”。
我第一次了解到这方面的数学,是在阅读了P.Sarnak的Baltimore讲稿之后:
Sarnak  Spectra of Hyperbolic Surfaces

经典Maass形式理论的研究对象包括
(1)上半平面\Bbb H在赋予Poincaré度量后成为常曲率双曲Riemann面,面积测度\displaystyle dA=\frac{dx \wedge dy}{y^2},Laplace算子\Delta=-y^2(\partial_x^2+\partial_y^2)
(2)模群PSL(2,\Bbb Z)通过Möbius变换\displaystyle z\mapsto \frac{az+b}{cz+d}作用于\Bbb H,我们感兴趣的子群包括:
(2.1)N阶主同余子群\Gamma(N)=\{\gamma\in PSL(2,\Bbb Z):\gamma \equiv I \pmod{N}\}.模群本身记为\Gamma(1)
(2.2)同余子群\Gamma:对某个N\Gamma(N) \subset \Gamma. 满足上述条件的最小的N称为\Gamma的阶;
(2.3)N阶Hecke同余子群\Gamma_0(N)=\{\gamma\in PSL(2,\Bbb Z):c\equiv 0 \pmod{N}\}
(3)模曲面X=\Gamma\backslash \Bbb H是有限面积的非紧双曲Riemann面。可以通过加入若干个尖点(cusp)使其紧化。X是满足特定算术性质的椭圆曲线的模空间(moduli space);
(4)Maass形式:满足\Delta f_\lambda=\lambda f_\lambda的光滑函数f_\lambda:X \to \Bbb C
Selberg细致地研究了(\Delta,X)的谱:
Selberg   On the estimation of Fourier coefficients of modular forms
具体地说,有界复函数\displaystyle \mathcal{B}(X) \subset \mathcal{L}(X)=L^2(X,dA)\Delta作用下分裂为2个正交不变子空间:\mathcal{B}(X)=\mathcal{C}(X)\oplus \mathcal{E}(X)
\mathcal{C}(X)由尖点型(cuspidal)函数f构成:f在任意尖点处的Fourier展开均无常数项,或者等价的,在环绕任意尖点的极限圆(horocycle)上有周期(period)0。
自共轭紧算子\Delta|_{\mathcal{C}(X)}有离散谱0=\lambda_0<\lambda_1\leq\lambda_2\leq \cdots\lambda_i \to \infty
由谱定理,\mathcal{C}(X)\mathcal{L}(X)中的完备化\tilde{\mathcal{C}}(X)拥有一组完备正交基对应\Delta的谱分解。
f \in \mathcal{E}(X)是一类Eisenstein级数\Delta|_{\mathcal{E}(X)}仅在\lambda=0处有点态谱,此外有连续谱[\displaystyle \frac{1}{4},\infty). 因而,对于特征值\lambda>0,相应的特征函数f_{\lambda}将自动成为Maass尖点形式1
\lambda=\nu(1-\nu)f_\lambda有Fourier-Whittaker展开:
\displaystyle f_{\lambda}(z)=\sum_{n \neq 0}a(n)\sqrt{2\pi y}K_{\nu-\frac{1}{2}}(2\pi|n|y)e(nx)Bessel函数\displaystyle K_\nu(y)=\int_0^{+\infty}e^{-y \cosh t}\cosh(\nu t)dt
Iwaniec  Introduction to the Spectral Theory of Automorphic Forms

X的算术性体现在Hecke算子作用于\mathcal{L}(X):对于N阶同余子群\Gamma(n,N)=1,定义
\displaystyle (T_nf)(z)=\frac{1}{\sqrt{n}}\sum_{ad=n}\sum_{b=0}^{d-1}f(\frac{az+b}{d})
(1)T_n正规算子\Gamma=\Gamma(1)\Gamma_0(N)时是自共轭算子;
(2)\displaystyle T_mT_n=T_nT_m=\sum_{d|(m,n)}T_{mn/d^2}T_n\Delta=\Delta T_n
(3)\mathcal{C}(X)T_n的不变子空间;
若尖点形式f_\lambda同时是所有T_n的特征函数,则称其为Maass-Hecke特征形式2,在标准化a(1)=1下,我们有T_nf_\lambda=a(n)f_\lambda,\forall n. 考虑Hecke L-函数
\displaystyle L(s,f_\lambda)=\sum_{n=1}^{\infty}a(n)n^{-s}=\prod_p(1-a(p)p^{-s}+p^{-2s})^{-1}
(Ramanujan-Petersson猜想)|a(p)|\leq 2,或者,|a(n)|\leq\sigma_0(n)\sigma_0因子函数
Deligne对Weil猜想的证明可推出全纯尖点形式的Ramanujan-Petersson猜想。Maass尖点形式的Ramanujan-Petersson猜想迄今为止尚未得到证明。

回到对\Delta的讨论。我们将另辟新章讨论作为算术量子混沌系统的(X,\Delta)及其高能渐进。在低能端,数论学家感兴趣的主要是第一特征值估计:
(Selberg 1/4猜想)\displaystyle \lambda_1(X)\geq \frac{1}{4},即\Delta大于0的离散谱完全落在连续谱\displaystyle [\frac{1}{4},\infty)中。
(Selberg 1/4猜想,几何分析形式)\forall f\in C^\infty_0(X)满足\int_X fdA=0,梯度估计
\displaystyle \int_X |\nabla f|^2 dA \geq \frac{1}{4}\int_X|f|^2dA成立。
不难证明1/4是最优的:N \to \infty时,(\Delta,X(N))的尖点谱在[\displaystyle \frac{1}{4},\infty)中趋于稠密。事实上,对于不可约2维偶Galois表示\rho:\mathrm{Gal}(K/\Bbb Q) \to GL(2,\Bbb C),若相应的Artin L-函数L(s,\rho)是整函数(即满足Artin猜想),则通过Langlands对应原理,它给出X(N)上的Maass尖点形式f_{1/4}N\rho的导子。
对于X(1),通过简单的推理即可得到强得多的下界,例如3\pi^2/2 (Vignéras). 对于一般的X,Selberg证明了\lambda_1(X)\geq 3/16.

从Langlands哲学的角度看,Ramanujan-Petersson猜想和Selberg 1/4猜想是同一个猜想在不同的位(place)上的体现。我们简单地说明这一点。
G(\Bbb Q)=GL(2,\Bbb Q)G(\Bbb A)=GL(2,\Bbb A)Z(\Bbb A)G(\Bbb A)的中心。G(\Bbb A)上有平凡中心特征的尖点形式空间L_0^2(Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A))\phi:G(\Bbb A) \to \Bbb C构成的Hilbert空间,\phi满足
(1)模性:\phi(\gamma g z)=\phi(g)\forall \gamma \in G(\Bbb Q),\forall z\in Z(\Bbb A)
(2)平方可积性:\displaystyle \int_{Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A)}|\phi(g)|^2dg <\infty
(3)尖点性:\displaystyle \int_{\Bbb Q\backslash \Bbb A}\phi(\begin{pmatrix}1&&x \\ 0&&1\end{pmatrix}g)dx=0\forall g\in G(\Bbb A)
G(\Bbb A)L_0^2(Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A))上的作用(\gamma f)(g)=f(g\gamma)给出G(\Bbb A)的酉表示,称为尖点表示(cuspidal representation),它可以分解为不可约可容许表示(admissible representation)的直和3
Maass-Hecke特征形式f可以唯一地提升为\phi_f\in L_0^2(Z(\Bbb A)G(\Bbb Q)\backslash G(\Bbb A)),记相应的不可约表示为\pi_f,我们考虑\pi_f在不同位上的分解\pi_f=\pi_\infty \otimes \prod \pi_p. 对于非Archimedean位p和Archimedean位\infty处的可容许表示,我们分别有Bernstein–Zelevinsky分类Langlands分类作为参考的“地标”:
(Ramanujan-Petersson猜想,表示论形式)\pi_p主级数表示(p,N)=1
Satake  Spherical functions and Ramanujan’s conjecture
(Selberg 1/4猜想,表示论形式)\pi_\infty是主级数表示;
Langlands提出上述2个猜想可以由GL(2)\to GL(m+1)的Langlands函子性猜想推出。这决定性地影响了对Selberg猜想的现代研究。
m=2(Gelbart-Jacquet),m=3(Kim-Shahidi)和m=4(Kim)的函子性已得到证明。最后一个结果给出当前的最佳下界记录: \displaystyle \lambda_1(X)\geq \frac{975}{4096}=0.238\dots


  1. 这个现象体现了某种算术刚性:对于一般的(generic)双曲曲面X,Phillips-Sarnak理论暗示至多有有限个特征值以尖点形式为特征函数。
    Phillips, Sarnak  On cusp forms for cofinite subgroups of PSL(2,\Bbb R) 
  2. 基于大量数值实验,Cartier猜想(\Delta,X(1))的所有正特征值都是单特征值。如果这个猜想成立,那么X(1)的所有Maass尖点形式都是Maass-Hecke特征形式。 
  3. Jacquet和Langlands对GL(2)证明了重数1定理:在上述分解中每个不可约可容许表示有重数1. 一般地,我们希望决定所有使重数1定理成立的可约群。
    Jacquet, Langlands  Automorphic forms on GL(2) 

Algebraic Number Theory: Dirichlet’s Theorem Revisited

Number theory: An Approach Through History from Hammurapi to Legendre选择Legendre作为征程的句点,自然有其理由:在阅读Disquisitiones Arithmeticae时找到灵感进而提出Weil猜想的人,比谁都深刻地认识到“还不到总结Gauss的时候”。在Weil去世的16年之后,我们积累了更多证据支持这一判断,例如新科Fields奖得主Bhargava同样是在阅读Disquisitiones Arithmeticae时得到了PhD论文的灵感,从而做出了推广Gauss复合律的系列工作(,,)。
然而就思想史的脉络而言,我更愿意将Gauss和Einstein这样分水岭式的人物归入“旧世界”。Gauss,如同Euler, Lagrange和Legendre,是彻头彻尾的经验主义者,他们以巨人之姿勇敢地投身广袤的现象之海,以超凡的计算能力从中萃取原理。在Gauss和Riemann之间,在古典和现代之间,真正开启新范式的,是Gauss的狂热崇拜者、“一流数学家中的二流人物”——Dirichlet. 如Minkowski所说,”he possessed the art of connecting a maximum of seeing thoughts by means of a minimum of blind formulas”1,这对Riemann,乃至整个现代数学都产生了决定性的影响,数学自此在“现象-原理”之上获得了第三个维度“图景”——不仅要理解数学事实,更要将其放置于最合适的框架下来理解。

穿过Weil立下的“海格力斯之柱”(Pillars of Hercules),我想讨论Dirichlet最知名的工作——关于算术级数中素数分布的Dirichlet定理原论文发表于Abhandlungen der Königlichen Preußischen Akademie der Wissenschaften von 1837,有现成的英译本可供参考。

(Dirichlet定理)给定互素的aq,算术级数a+nq(n=1,2,\cdots)包含无穷多个素数。

如今看来,这个结果是完全初等的。然而,Dirichlet的证明却触碰到了Euler, Gauss甚至Riemann都未曾触碰到的领域。为了阐明“原理”,二次域的知识已经足够,但只有在类域论臻于完备后,才能找到这项工作在整体“图景”中的合适位置。

Euclid’s Theorem
q=1时Dirichlet定理退化为Euclid定理。Euler的证明给出了更精细的结果:在\mathrm{Re}(s)>1上取对数函数的主支,\displaystyle \log\zeta(s)=\sum_p \log\frac{1}{1-p^{-s}}=\sum_{n,p}1/np^{ns}
n \geq 2的部分绝对收敛。令s \to 1,得到
\displaystyle \sum_{p\leq X}\frac{1}{p}=\log\log X+O(1)X \to \infty
Dirichlet定理可以用完全类似的方式精细化:
\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}\log\log X+O(1)X \to \infty

The Theory of Dirichlet Characters
为得到形如\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}\sum_{p\leq X}\frac{1}{p}+\text{residue terms}的代数恒等式,Dirichlet首先假定d为素数并乞灵于单位根/分圆域理论。从今天的观点看,他将有限交换群的不可约复表示(Fourier分析的别名)引入了数论。
我们仅需要最简单的事实:令G_q=(\Bbb{Z}/q\Bbb{Z})^{*}特征\tilde{\chi}:G_q \to GL_1(\Bbb C)构成L^2(G_q)的完备正交基。对偶地,G_q也构成L^2(\hat{G_q})的完备正交基。
\tilde{\chi}扩张到\mathbb{Z}上,即得到Dirichlet特征\chi:\Bbb Z \to GL_1(\Bbb C). 为\displaystyle \frac{1}{p}赋权\displaystyle \frac{1}{\phi(q)}\sum_\chi \bar{\chi}(a)\chi(p),我们得以筛选出满足同余条件的p
\displaystyle \sum_{\substack{p\leq X \\ p\equiv a\pmod{q}}}\frac{1}{p}=\frac{1}{\phi(q)}(\sum_{p\leq X}\frac{1}{p}+\sum_{\chi\neq 1}\chi(a)\sum_{p\leq X}\frac{\chi(p)}{p})
目标转为对\chi \neq 1证明\displaystyle \sum_{p\leq X}\frac{\chi(p)}{p}=O(1)X \to \infty.

The Dirichlet L-function
上述推理引向对Dirichlet L-函数的研究:
\displaystyle L(s,\chi)=\sum_{n=1}^{\infty}\frac{\chi(n)}{n^s}=\prod_p \frac{1}{1-\chi(p)p^{-s}}
\mathrm{Re}(s)>1上取对数函数的主支,\displaystyle \log L(s,\chi)=\sum_{n,p}\chi(p)^n/np^{ns}n \geq 2的部分依然绝对收敛。目标再次转为对\chi \neq 1证明L(1,\chi)\neq 0.
如下解析事实足以完成证明:\displaystyle \prod_\chi L(s,\chi)(如同L(s,1)=\zeta(s)一样)在s=1处有单极点。
Serre A Course in Arithmetic

Dirichlet的证明更加迂回,也因此包含了远为丰富的内容。我们先陈述较为一般的现代观点:给定\Bbb Q的代数扩张K
(1)Dedekind zeta函数\zeta_K(s)在极点s=1处的留数包含了K的整体算术信息,通常称为类数公式
(2)若K是Galois扩张,则\zeta_K(s)可以分解为Artin L-函数的乘积;
(3)若K是Abel扩张,则由Kronecker-Weber定理(或者更一般地,Artin互反律),Artin L-函数与本原(primitive)Dirichlet L-函数存在某种形式的一一对应;

Dirichlet完整地处理了K为二次域/\chi为本原二次特征的情况:此时
\displaystyle \zeta(s)L(s,\chi)=\zeta_K(s)K=\Bbb Q(\sqrt{\chi(-1)q})

(1)通常将二次域类数公式归于Dirichlet名下2
\displaystyle \mathrm{Res}_{s=1}\zeta_K(s)=\frac{2\pi h_K r_K}{w_K\sqrt{|D_K|}}
其中h_K为类数,r_K正规子(regulator),w_KK包含的单位根个数,D_K为判别式。
(Leibniz公式)取q=4,此时唯一的非平凡Dirichlet特征\chi满足\chi(1)=1\chi(3)=-1L(1,\chi)=\pi/4. 对照类数公式,这即是说\Bbb Q(\sqrt{-1})有类数1。

(2)令G=\mathrm{Gal}(K/\Bbb Q)为Abel群,\rho:G \to GL(1),定义Artin L-函数
\displaystyle L(s,\rho)=\prod_p\frac{1}{1-\rho(\sigma(p))p^{-s}}
此处\sigma(p)Frobenius自同构,约定表示\rho(\sigma(p))定义在惯性群的不变子空间上。
分解\displaystyle \zeta_K(s)=\zeta(s)\prod_{\rho \neq 1} L(s,\rho)是纯代数的:将正则表示分解为不可约表示。
对于二次域KG=\{1,-1\},此时仅有一个非平凡的\rho\rho(\sigma(p))=0当且仅当p分歧(ramified);\rho(\sigma(p))=1当且仅当分解(split);\rho(\sigma(p))=-1当且仅当p惯性(inert)。也就是说,p为奇素数时,\rho(\sigma(p))等同于Legendre符号\displaystyle (\frac{D_K}{p}).

(3)令K=\Bbb Q(\sqrt{\chi(-1)q})。暂时假定q是不包含平方的奇数。一方面,唯一的以q为导子(conductor)的本原二次Dirichlet特征\chi(p)Jacobi符号\displaystyle (\frac{p}{q});另一方面,判别式D_K=(-1)^{(q-1)/2}。此时Artin L-函数L(s,\rho)与Dirichlet L-函数L(s,\chi)的对应\displaystyle (\frac{D_K}{p})=(\frac{p}{q})不是别的,正是二次互反律

(3)可以用adele的观点理解:以\Bbb A\Bbb Qadele环\Bbb A^{*}=\Bbb Q^{*}\times\Bbb R_{+}^{*}\times \hat{\Bbb Z}^{*}.
对于K=\Bbb Q(\xi_q)G=\mathrm{Gal}(K/\Bbb Q)=G_q. 取逆向极限,由Kronecker-Weber定理知\displaystyle \mathrm{Gal}(\Bbb Q^{ab}/\Bbb Q)同构于\hat{\Bbb Z}^{*},进而同构于\Bbb Q^{*} \backslash \Bbb A^{*}=GL_1(\Bbb Q)\backslash GL_1(\Bbb A)的连通分支:Artin L-函数和Dirichlet L-函数源于同一个对象的一维表示。

作为(3)的“相对”版本,对于整体域K的Abel扩张,Dirichlet特征推广为Hecke特征。Hecke特征理论可以诠释为adele对象上的调和分析,这是“Tate论文”的主题。

对于K的非Abel扩张,Langlands考虑了GL_n(\Bbb A)自守尖点表示以及相应的L-函数。此种情况下的Langlands互反猜想(reciprocity conjecture)是Langlands函子性猜想(functoriality conjecture)的一部分。为了理解与之相关的表示论,他构建了一个庞大的理论框架,通常以Langlands纲领之名为人所知。

今时今日的数学中存在2类L-函数:一类L-函数源于动机,关于其解析性质(类似于上面的(1)),我们有数学中最知名的一些猜想:Riemann猜想,BSD猜想,etc.;另一类L-函数则源于自守表示论,更浪漫一些,“无穷维的对称”。证明他们是同一尊坚纽斯神(Janus)的两面,是Langlands和许多数学家孜孜以求的梦想,当然也不妨说是,Dirichlet之梦。


  1. Felix Klein, Development of Mathematics in the 19th Century, translated by M.Ackerman
    Arnold在某次访谈中提及的轶事在当代语境下诠释了这句名言:
    The Bourbakists claimed that all the great mathematicians were, using the words of Dirichlet, replacing blind calculations by clear ideas. The Bourbaki manifesto containing these words was translated into Russian as “all clear ideas were replaced by blind calculations.” The editor of the translation was Kolmogorov. His French was excellent. I was shocked to find such a mistake in the translation and discussed it with Kolmogorov. His answer was: I had not realized that something was wrong in the translation since the translator described the Bourbaki style much better than the Bourbakists did.
    我一直怀疑Arnold所说的误译其实是”all clear calculations were replaced by blind ideas”(这才是对Bourbaki风格的“最佳”描述)。由于他本人的口误或者记者的失察,把”calcultions”和”ideas”的位置对调了。 
  2. 第一个以某种形式得到二次域类数公式的人是Gauss,但一如既往,他没有发表这个结果。 

Snoldelev Stone from the Semiotic Viewpoint

我不能辨识如尼文字(Runes),也不懂符号学。如果本文的标题引发了任何不切实际的期待,我愿意为之道歉:我即将写下的一切与学理无涉,它只关乎一些有趣的事实,以及它们之间的微妙联系。
我总有这样一种感觉:语言、文字和符号(包括梵文、Leibniz确立的微积分记号、ZFC公理体系范畴论Python)生活在比人类更深的某处。

本文源于一次闲谈。愿林香蕉老师赐福于EG老师,并使其平安!

收藏于丹麦国家博物馆Snoldelev石刻(约公元9世纪)是丹麦现存最古老的如尼石刻之一。石刻的内容包括3部分:2行如尼文字,3只互相勾住的角杯以及1个卍 字符

StoneSnoldelev石刻

Snoldelev_stone_drawingSnoldelev石刻(绘图)

卍 字符在文化圈之间的扩散现象(cultural diffusion)向来是饶有兴味的学术课题,印象中时常会看到诸如“太阳崇拜之为集体无意识”之类的讨论——当然非我所能置喙。近代卍 字符经历了一个符号所能经历的最大规模的流行化,相关领域的研究兴趣自然更浓了。

依照Weyl在他的名著Symmetry里的思路,或许应该对符号学中的“对称”概念稍作探求。作为SO(2)离散子群\Bbb Z/4\Bbb Z自然是容易理解的,唯一的微妙之处在于O(2)SO(2)的区别,用通俗的话说,镜像对称之间的区别。一般地,我们对半单Lie群的离散子群已有相当的了解(例如Margulis的超刚性(superrigidity)和算术性(arithmeticity)定理),理论几乎允许我们分类所有“对称符号”——可惜在此之前,我们的视觉想象力早已到达极限!

3只互相勾住的角杯是一个不完整的Borromean环(Borromean ring, 因出现于北意大利贵族Borromeo家族的族徽中而得名)。国际数学联盟(IMU)现如今采用的Logo即是一个Borromean环(由John Sullivan设计)。

Snoldelev-three-interlaced-hornsSnoldelev石刻上的3只角杯 (示意图)

Coat_of_arms_of_the_House_of_BorromeoBorromeo家族的族徽

IMU-Bthe Logo of IMU (since 2006)

扭结理论中,Borromean环是最简单(因而也最知名)的Brunnian链环,后者指的是这样的非平凡链环:去掉任意一个环都可以解开整个链环。
Brunnian链环在链环同伦意义下的分类已由John Milnor完成。
Milnor  Link Groups

Borromean环的上述拓扑性质使其成为一个备受青睐的符号。在神学上它被广泛用于表示“三位一体”(trinity),Jacques Lacan则将其采纳为精神分析学的拓扑图腾:三个环分别代表现实(reality)的三个部分,实在的(real),幻想的(imaginary)和符号的(symbolic)1

我希望再举一个来自流行文化的例子。在知名游戏Sid Meier’s Civilization 5中,丹麦文明的领袖是传奇英雄Harald Bluetooth,而丹麦文明的旗帜则取自Snoldelev石刻上的3只角杯。

蓝牙文明5中的“蓝牙”

丹麦文明5中丹麦文明的旗帜

最后,关于Snoldelev石刻上的2行如尼文字。如尼字母表有Elder Futhark(2至8世纪)和Younger Futhark(8至12世纪)之分,Snoldelev石刻反映了过渡时期双表并用的情况:同一个字母h在石刻中有ᚺ (Elder Futhark)和ᚼ (Younger Futhark)2种写法2

90年代中期,几大IT业巨头试图在手机与电子计算机之间建立一个新的无线通讯标准。Jim Kardach提议将这种无线通讯标准及其相关技术命名为Bluetooth,“蓝牙”。Harald Bluetooth统一了丹麦诸王国。Kardach希望这项发明也能在通讯协议领域达成同样的伟业。
Kardach  Tech History: How Bluetooth got its name
依照Younger Futhark,Harald Bluetooth的姓名缩写B.H.应该写为ᛒ ᚼ,将两者组合在一起的结果是Bluetooth

古代英雄和现代智者的野心重叠在了一起。

符号有着不易觉察的重量。


  1. 后现代哲学对数学概念的滥用几成风气。就我个人而言,此前和Derrida打交道的不愉快经历让我对此类“理论”产生了深切的怀疑。无论如何,我愿意秉承“不知为不知”的态度,承认我对Lacan理论毫无了解。如若在表述和翻译上有不够圆妥之处,还请批评指教。 
  2. 如果您的Chrome无法正确显示如尼字母,请使用Firefox浏览本文。 

On the Maslov index

Maslov指标最迷人的特征是它以不同的形式出现于现代数学的各个领域。有鉴于辛几何在统一不同数学分支中的作用,Weinstein提出了所谓的“辛哲学”,这或许可以作为其中一个例证。
从“量子数学”的角度看,可以用一句话概括Maslov指标的作用:它在不同极化模型之间扮演了相因子(phase factor)的角色。

From Manifolds to Grassmannians
给定辛空间(V^{2n},\omega),其Lagrange子空间模空间称为Lagrage Grassman流形。遵从Arnold,我们将其记为\Lambda(V)\Lambda(n)。必要时,也可以考虑作为正向极限的稳定LG流形\Lambda(\infty)
在几何中,Grassman流形几乎是“万有对象”的同义词。具体地说,以P\Lambda(n)上的重言丛(tautological bundle),我们有如下保持向量丛结构的自然映射:
(1)TN \to NP \to \Lambda(n)N是辛流形(M^{2n},\omega)的Lagrange子流形;
(2)\mathfrak{P} \to MP \to \Lambda(n)\mathfrak{P}TM的可积Lagrange子丛,又称为极化(polarization);
因而,在LG流形上定义的Maslov指数可以作为某种“万有示性类”理解。

The Ambient Space
LG流形是齐性空间\Lambda(n)=U(n)/O(n)\mathrm{dim}(\Lambda(n))=n(n+1)/2。辛群Sp(2n)可迁地作用于\Lambda(n)
从Lie代数的角度看,视\mathfrak{u}(n)斜Hermite形式斜对称形式\mathfrak{o}(n)为其实部,则LG流形在l处的切空间与斜Hermite形式的虚部,即l上的对称形式,有一个自然同构(\gamma(t), \dot{\gamma}(t)) \mapsto B[\gamma(t),\dot{\gamma}(t)]\gamma:[a,b] \to \Lambda
给定l后,我们可以将\Lambda(n)分解为\Sigma_k的不交并,\Sigma_k中的l'满足\mathrm{dim}(l' \cap l)=k。连通开流形\Sigma_k的余维数为k(k+1)/2l' \in \Sigma_k处的切向量v满足B[l',v]|_{l \cap l'}=0.
l' \in \Sigma_0,则称l'l横截相交(intersect transversally)。这是微分拓扑意义上的一般位置(generic position)。奇点集\Sigma=\overline{\Sigma_1}=\cup_{k \geq 1}\Sigma_k\Lambda(n)的代数子流形,称为Maslov闭链(Maslov cycle)。
标准的同伦序列计算指出\Lambda(n)的基本群为\Bbb Z,故H_1(\Lambda(n);\Bbb Z)=H^1(\Lambda(n);\Bbb Z)=\Bbb Z\Sigma所在的同调类与l的选取无关:其Poincaré 对偶\alphaH^1(\Lambda(n);\Bbb Z)的生成元。

The Index for a Loop
(Maslov指标\mu,定义1) 对于闭曲线\gamma:[a,b] \to \Lambda\gamma(a)=\gamma(b)=l,扰动\gamma使其横截于\Sigma_1(作为Maslov闭链\Sigma的稠密子集)。定义\mu(\gamma)\gamma\Sigma_1相交数
由同伦不变性知此定义与基点l的选取无关。
Arnold  Characteristic class entering in quantization conditions
曲线闭合的假定允许我们将此定义同调化:对于\gamma:S^1 \hookrightarrow \Lambda,定义\mu(\gamma)=\alpha[f(S^1)]
Arnold提供了一个计算\mu(f)的方法:对于任意l',均存在g \in U(n)满足g(l)=l',其判别式精确到\pm 1。这在整个LG流形上定义了映射\mathrm{det}^2: \Lambda(n) \to S^1\mu(f)\mathrm{det}^2 \circ f:S^1 \to S^1卷绕数(winding number)。

The Index for a Path
Arnold仅对闭曲线\gamma定义了Maslov指标,因为他需要一般位置的论证来保证\gamma\Sigma_1横截相交。
若我们允许更一般的相交方式,则可以对任意\gamma定义Maslov指标。具体地说,称I[l,\gamma,t]=B[\gamma(t),\dot{\gamma}(t)]|_{l \cup \gamma(t)}\gamma(t)处的相交形式,B有非平凡的定义当且仅当\gamma(t) \in \Sigma。我们记I[l,\gamma,t]的号差为\sigma[l,\gamma,t]
(Maslov指标\mu,定义2) 对于\gamma:[a,b] \to \LambdaI[l,\gamma,t]保持非奇异(几何上这意味着\gamma和所有\Sigma_k横截相交), 定义
\mu(\gamma)=\frac{1}{2}\sigma[l,\gamma,a]+\frac{1}{2}\sigma[l,\gamma,b]+\sum_{a<t<b}\sigma[l,\gamma,t]
Robbin, Salamon  The Maslov index for paths

The Index for Two Paths
Arnold指出闭曲线的Maslov指标可以理解为卷绕数。熟知卷绕数有一个相对形式的版本(relative version)——2条闭曲线的环绕数(linking number)——这促使我们寻找相对Maslov指标的定义。
给定\gamma_1,\gamma_2:[a,b] \to \Lambda,定义相对相交形式
I[\gamma_1,\gamma_2,t]=I[\gamma_1,\gamma_2(t),t]-I[\gamma_2,\gamma_1(t),t]
其号差记为\sigma[\gamma_1,\gamma_2,t]
(Maslov指标\mu,定义3)对于\gamma_1,\gamma_2:[a,b] \to \LambdaI[\gamma_1,\gamma_2,t]保持非奇异, 定义
\mu(\gamma_1,\gamma_2)=\frac{1}{2}\sigma[\gamma_1,\gamma_2,a]+\frac{1}{2}\sigma[\gamma_1,\gamma_2,b]+\sum_{a<t<b}\sigma[\gamma_1,\gamma_2,t]
定义2是\gamma_1(t) \equiv l的情况。
Cappell, Lee, Miller指出可以用以下6条公理刻画Maslov指标\mu(\gamma_1,\gamma_2)
(1)底空间VV=\Bbb R^2时满足归一化条件;
(2)底空间V:辛可加性;
(3)时间参数t:仿射不变性;
(4)道路\gamma:可加性;
(5)道路\gamma:同伦不变性;
(6)道路\gamma:辛不变性;
Cappell, Lee, Miller  On the Maslov index

The Index for a Triple of Points
对于Lagrange子流形的三元组(l_1,l_2,l_3),定义Kashiwara指标1\tau(l_1,l_2,l_3)为实二次型Q(x_1,x_2,x_3)=\omega(x_1,x_2)+\omega(x_2,x_3)+\omega(x_3,x_1)的号差。这个定义属于柏原正树(Masaki Kashiwara)。
Lion, Vergne  The Weil representation, Maslov index and Theta series
\tau是辛不变的,我们可以认为这个整值函数是\Lambda(V)上2维单形的“有向面积”(2-上闭链),它决定了2维单形的辛等价类。
通过单形分解,我们可以对任意2维单纯复形定义Kashiwara指标。
考虑\gamma_i:[a,b] \to \Lambdai=1,2,3h_{jk}(t)\gamma_j(t) \cap \gamma_k(t)的维数。\tau\mu有一个形如Newton-Leibniz公式的关系:
\tau(\gamma_1(b),\gamma_2(b),\gamma_3(b))-\tau(\gamma_1(a),\gamma_2(a),\gamma_3(a))=2[\mu(\gamma_1,\gamma_2)+\mu(\gamma_2,\gamma_3)+\mu(\gamma_3,\gamma_1)]+\sum[h_{jk}(b)-h_{jk}(a)]

Indices on the Total Spaces
给定纤维丛E \to \Lambda,上面讨论过的所有指标均在E上有自然的定义:投影映射的“拉回”。E的常见例子包括万有覆叠\tilde{\Lambda}和辛群Sp(2n)

Other facets
A.Ranicki建立了一个关于Maslov指标的主题站,搜罗了大量有价值的原始资料。
下面是一张(并不完备的)清单。

(1) 在研究WKB近似时,Maslov考虑了相空间V的Lagrange子流形M到构型空间p=0的投影问题。为了研究投影的奇点集,他取M中横截奇点集的曲线,并定义其与奇点集的相交数为Maslov指标。在他之前,Keller在研究Bohr-Sommerfeld量子条件时也定义过类似的概念。

(2) Weil 表示是辛群的“典范”射影酉表示,Kashiwara指标在其中扮演着Schur乘子的角色——辛不变量籍由表示论深入到了数论的领域。

(3) Hörmander在研究Fourier算子理论时定义了Hörmander指标s(l_1,l_3;l_2,l_4)。可以证明Hörmander指标恰为4边形(l_1,l_2,l_3,l_4)的Kashiwara指标的一半。
Hörmander  Fourier Integral Operators I

(4) 在经典力学/几何光学中,Hamilton-Jacobi力学和Lagrange力学是一体两面的存在,因而辛几何和Riemann几何中的变分问题也有着天然的联系。Duistermaat试图将Maslov指标与Morse指标联系起来,因而考虑了Morse指标在Legendre变换下的对应概念:Duistermaat指标。Duistermaat指标不满足道路可加性,其补正项恰恰是Hörmander指标s(l_1,l_3;l_2,l_4)
Duistermaat  On the Morse index in variational calculus

(5)我们转向拓扑。将可定向流形L^{4k}沿闭流形M^{4k-1}切成2片,Novikov证明了号差的可加性:\sigma(L)=\sigma(L_1)+\sigma(L_2)。当\partial M非空时,Wall指出上述公式需要一项补正:\partial M作为3个流形边缘的嵌入映射给出辛空间H_{2k-1}(N;\Bbb R)的3个Lagrange子空间,补正项是它们的Kashiwara指标。
Wall  Non-additivity of the signature

(6)对于(5)中的现象,我们有另一种理解方式。Atiyah, Patodi和Singer试图将Hirzebruch号差定理推广到带边的紧4k维流形,在此过程中他们发现补正项是边缘上某个Dirac算子的“指标”(对无穷和取zeta函数正则化)。这个补正项在数学上称为eta不变量,对应物理中的谱不对称性(spectral asymmetry)。
Atiyah, Patodi, Singer  Spectral asymmetry and Riemannian Geometry. I
就我们的目的而言,重要的是如下事实:给定2组Lagrange子空间,我们可以定义某个Dirac算子D。相对Maslov指标是D\epsilon-谱流(spectral flow),从而可以由D的eta不变量表出,详见Cappell, Lee, Miller。用这一事实重新证明(5)将是有趣的。

(7)Floer同调论在某种意义上是(4)(6)的综合。Maslov指标以Conley-Zehnder指标的形式出现在某些Cauchy-Riemann型算子的谱流计算中。


  1. 最早提出这个概念的人可能是Jean Leray:
    Leray  Lagrangian Analysis and Quantum Mechanics 

Manjul Bhargava and his 290 theorem

ICM 2014今天在韩国首尔召开。正如之前所预测的那样,Manjul Bhargava获得了2014年的Fields Medal. 一同获奖的还有Artur Avila, Martin HairerMaryam Mirzakhani.

这份名单相当有趣:史上第一位女性获奖者1;4人广义上的“祖国”(印度、巴西、奥地利以及伊朗)此前均无Fields奖得主2;3人的研究工作和遍历理论紧密相关;2人有参加IMO的经历3;等等。

本文将介绍获奖者Manjul Bhargava的一项“初等”工作:简化了Conway-Schneeberger 15定理的证明,并进一步证明了Conway的290猜想。

1.
我们感兴趣的是在整格\Bbb Z^n上取整值的n元多项式f。若f是齐次的,这相当于要求f的系数为整数。对可表示集R_f:=f(\Bbb N^n) \subset \Bbb Z(约定0 \in \Bbb N)的研究贯穿了整个数论史:
(1.1)Fermat集中研究了用2元2次整系数多项式表示素数p的问题,并发现
f(x,y)=x^2+y^2,则p \in R_f当且仅当p形如4a+1
f(x,y)=x^2+2y^2,则p \in R_f当且仅当p形如8a+18a+3
f(x,y)=x^2-2y^2,则p \in R_f当且仅当p形如8a+18a+7
f(x,y)=x^2+3y^2,则p \in R_f当且仅当p形如3a+1
f(x,y)=x^2+5y^2,则p \in R_f当且仅当p形如20a+120a+9
此类现象是代数数论乃至类域论的渊薮。
(1.2)由Fermat二平方和定理开始,Euler等数学家获得了一系列经典结果。
(Fermat二平方和定理, 由Euler证明) 若f(x,y)=x^2+y^2,则自然数k \in R_f当且仅当k的奇素因子(若有)均形如4a+1
(Lagrange四平方和定理) 若f(x,y,z,w)=x^2+y^2+z^2+w^2,则R_f=\Bbb N
(Legendre三平方和定理) 若f(x,y,z)=x^2+y^2+z^2,则自然数k \in R_f当且仅当k不能写成2^{2a}(8b+7)的形式。
(1.3) 平方数有一类推广,即所谓的多边形数:填满正多边形内部的点的个数。
(Gauss三角数定理,“Eureka定理”)令\displaystyle f(x,y,z)=\frac{x(x+1)}{2}+\frac{y(y+1)}{2}+\frac{z(z+1)}{2},则R_f=\Bbb N
推广Gauss三角数定理和Lagrange四平方和定理,我们有如下结果:
(Fermat多边形数定理,由Cauchy证明) 任意自然数均可表示为不超过nn边形数之和。
(1.4)从Lagrange四平方和定理出发,我们也可以研究高次幂多项式的表示问题:
(Waring问题,由Hilbert解决) 给定k \geq 2f=\sum_{1 \leq i \leq g} x_i^k。对于充分大的gR_f=\Bbb N
关于g的下确界g(k)有许多研究:g(2)=4(Lagrange),g(3)=9(Wieferich, Kempner),g(4)=19(Balasubramanian),g(5)=37(陈景润,Conway),等等。已知g(k)=2^k-2+\lfloor 1.5^k\rfloork \leq 471600000成立,欠缺的只是一个证明。

对相应的数论史感兴趣的读者可以参考
Weil  Number theory: an approach through history from Hammurapi to Legendre
Edwards  Fermat’s last theorem: a genetic introduction to algebraic number theory

2.
在所有整系数多项式中,我们对整二次型的理解是最好的。荣耀归于Gauss:他在Disquisitiones Arithmeticae中建立了完备的整二元二次型理论,这是整个现代数论的起点。
首先我们区别整二次型的2种不同定义:(1)较强的Legendre定义要求二次型取整值(整系数);(2)较弱的Gauss定义要求二次型对应的对称双线型取整值(对应矩阵为整系数)。为避免混淆,我们称后者为整矩阵型。
本节讨论的整二次型默认为正定的。 这允许我们从几何的观点研究问题:这些整二次型可以视为整格上的“Riemann度量”,整格因之获得“Riemann空间”的结构。
满足R_f=\Bbb N的整二次型f(及其对应的整格)称为万有的(universal)。任意二元和三元整二次型都不可能是万有的。另一方面,Lagrange四平方和定理说明f(x,y,z,w)=x^2+y^2+z^2+w^2是万有的。
1916年,Ramanujan一口气给出了所有54个四元万有整对角型(Le style c’est l’ homme!),由此重燃了对这个领域的兴趣。研究者继而提出了
(万有性问题) 刻画所有万有整格的等价类。
1948年,Willerding在她的博士论文中分类了“所有”四元万有整矩阵型。四十多年间无人发现其中隐藏的重大疏漏。直到1993年,Conway重新考虑了这个问题,才给出万有整矩阵型的完满刻画(Conway-Schneeberger, 由Bhargava简化):
(15定理) 整矩阵型f是万有的当且仅当R_f包含以下9个关键值(critical value)
1,2,3,5,6,7,10,14,15.
Bhargava  On the Conway-Schneeberger Fifteen Theorem
由此可以决定四元万有矩阵型的所有204个等价类(参见上文附表)。
令人吃惊的是,若悬置等价性的判定,则Bhargava 的简化证明将是完全初等的——一个数学系新生完全能理解其过程并借助计算机验证结果。核心操作是整格的扩充(escalation):若其不能表示的最小正整数为m(称为“逃学生”,truant),则其扩充指的是加入一个模长为m的向量后生成的新整格。
从0维整格出发,不断进行扩充,我们得到一棵以整格为节点的。15定理的核心是如下事实:Bhargava树的高度有限(事实上,为5——这个幸运的“巧合”使得穷举不会复杂到无法处理的程度)。如果约化到等价类,则各层的节点数分别为1,1,2,9,207,1630。每个非叶节点都对应一个“逃学生”,15定理涉及的关键值是这些“逃学生”的集合。

沿着证明15定理的思路,Bhargava又得到了如下“副产品”:
(33定理) 给定整矩阵型fR_f包含所有奇数当且仅当R_f包含以下8个关键值
1,3,5,7,11,13,15,33.
(73定理) 给定整矩阵型fR_f包含所有素数当且仅当R_f包含以下17个关键值
2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,67,73.

和整矩阵型相比,整二次型的万有性问题远为复杂。2005年,Bhargava和Hanke宣布他们证明了Conway的290猜想:
(290定理) 整二次型f是万有的当且仅当R_f包含以下29个关键值
1,2,3,5,6,7,10,13,14,15,
17,19,21,22,23,26,29,30,31,34,
35,37,42,58,93,110,145,203,290.
由于证明牵涉到大规模计算,二人迄今尚未正式发表这个结果。他们的证明思路以预印本的形式流布:
Bhargava, Hanke Universal quadratic forms and the 290-Theorem
对于整二次型,Bhargava树的前5层分别有1,1,3,34,6560个节点。在6560个节点中,6402个为叶节点,153个节点至多有3代子孙,剩下的5个节点可以用两人发明的“10-14技巧”处理。

3.
迄今为止的讨论尚有一处留白:整二次型的等价分类。这是一个经典问题,此处只能略述大概。我们推荐读者查阅:
Conway, Sloane  Sphere packings, lattices and groups, Chapter 15

Gauss完全解决了整二元二次型的分类问题,在Conway, Sloane中可以找到他的等价判定算法(Gauss约化)以及判别式d较小时整二元二次型等价类的全表。
多元的情况相对复杂。我们先考虑一些较粗糙的等价关系,再逐步将其精细化。
(3.1)有理二次型的\Bbb Q-等价判定由如下经典结果给出:
(Hasse-Minkowski定理) fg整体域\Bbb Q上等价当且仅当它们在所有局部域\Bbb Q_p(约定\Bbb R=\Bbb Q_\infty)上等价。
因而f的等价类由其在\Bbb Q_p上的不变量完全刻画:判别式d,号差\sigma,以及由Hilbert符号给出的Hasse-Minkowski不变量\epsilon_p
Serre  A course in arithmetics
(3.2)稍精细一点,我们可以考虑二次型的\Bbb Z_p等价,其等价类即Gauss研究过的(genus)。
此处有许多深刻的数论结果,例如在Weil著名的Acta论文中,二次型的属分类通过自守形式与酉表示论相联系,由此得到的Weil-Siegel公式推广了经典的Smith-Minkowski-Siegel质量公式。我们希望在今后讨论酉表示论时更深入地介绍这方面的结果。
(3.3)属可以划分为更加精细的旋子属(spinor genus),此时有一个自旋算子群可迁地作用在旋子属上。
(Eichler) n \geq 3时,旋子属与n元不定整二次型的等价类一一对应。
读者可以在Conway, Sloane以其所引述的文献中找到详细的叙述和证明。
至此我们完整分类了不定整二次型。
(3.4)正定整二次型的分类要困难得多。以上讨论过的不变量依然可以用于分类(尤其在低维),但不再对应唯一的等价类。即使限制到幺模整格(二次型的d=1),随着维数的上升,等价类的数目也将迅速趋于天文数字:例如,Smith-Minkowski-Siegel质量公式指出32维欧氏空间中有超过8 \times 10^{16}个幺模整格的等价类!
推广Gauss约化,我们有称为Minkowski约化的算法。遗憾的是n>7时,Minkowski算法的复杂度急剧上升。此时所谓的Kneser粘贴方法(gluing method)可以进行一些有益的补充。

n>25时,正定整二次型的任何较完备的分类在目前都是不可想象的。然而从某种意义上说,24或许已经足够了:在24维我们有著名的Leech整格,7个“第二代”散在单群(sporadic group)作用于其上,包括3个Conway群Higman-Sims群铃木群Janko群J_2。Leech整格可用于构造Griess代数(作为某个共形场论顶点算子代数),后者的自同构群给出最大的散在单群:魔群(monster group,此群的阶数约为8 \times 10^{53},中文翻译似未能传达monster所隐含的“巨大”之意)——至矣,大矣,蔑以加矣!
无论从何处出发,我的兴趣总是将我引向同一个目的地。从数论开始,最终抵达魔群的所在地——这条路恰恰是Conway本人所走过的。在这里,他发现了散在单群与模形式的神秘联系,量子物理和数论以不可分割的方式结合在一起。Conway和Norton的魔群月光猜想描述了这些现象。
conway

John H.Conway (1937- )

16年前,Conway的学生Borcherds正是凭借对魔群月光猜想的证明获得了另一枚Fields奖章。


  1. 或许是为了赶在美国第一位女总统之前? 
  2. 何其政治正确!当然这也反映了现今欧美基础学科研究人员的“去欧美化”趋势。 
  3. 有此经历的Fields奖得主越来越多,当然,其中并没有华人的身影——丘成桐或许会愿意就数学研究和奥林匹克数学的关系作进一步的评论。 

On Arrow’s theorem

我无法理解经济学。

理论上,你需要做的只是将现实抽象成公式,丢进Poincaré 的法国香肠制造机,任由数学家们胡搅一气,坐等成品出炉后再喂给现实中的狗——简直像物理学一样明晰。
可悲的是你永远无法统一经济学家眼中的现实 (仿佛一经经济学家观测,“现实”本身都发生了扭曲——光荣归于不确定性原理!),永远无法迫使他们就模型的遴选达成一致 (如果现实的复杂度可以轻易压垮任何模型,那么比较将是不可能的),更无法阻止他们对纯数学结果给出各种天花乱坠的曲解并美其名曰:“诠释”。

我认为经济学是不可理解的。
然而经济学定理仍然有其单纯的一面——只涉及数学的那一面。

The Voting Paradox
给定n元集合A(选择),令L/L^{*}A上的所有可能的全序关系/严格全序关系。今后我们用x,y,z,\cdotsA中的不同元素。
对于I=\{1,2,\cdots,N\}(社会),F:L^N \to L^{*}\vec{R}=(R_1,R_2,\cdots,R_N) \mapsto R称为社会福利函数。寻找F即寻找一种能将个人偏好统一为集体偏好的方法。
n=2时,多数决给出一个构造R的方法:x > y (R)当且仅当\#\{i: x > y (R_i)\} > \#\{i: x < y (R_i)\}
n \geq 3时,我们有所谓的

(Condorcet悖论) 令x > y > z(R_1)z > x > y(R_2)y > z > x(R_3),此时R的任何取值都将违背多数决原则。

“悖论”这个听上去颇可怕的词并不意味着“行使多数决时我们将不可避免地陷入矛盾”——因为现实生活中的绝大多数投票过程要么不涉及排序,要么允许以加权的形式表达偏好。经济学家认为这两种方案同样不可接受。他们为自己塑造了一尊名叫utility的金牛犊 (我不知道该怎么翻译:你可以谈论“效用”的边际效应,但不能说J.Bentham信奉“效用主义1),并就其神学意义展开了无休止的争论。当代大部分经济学家相信,理性人(另一个暧昧的概念!)眼中的utility是一个全序关系。
经济学家热衷于讨论没有确定意义乃至于根本不存在的东西。让他们继续讨论下去吧。

Who Dominate?
Condorcet悖论的核心是社会权力分配。现在我们将“权力”这个概念抽象化。
J \subset I对有序对(x,y)拥有决定权(decisive),若对所有满足x>y(R_i)\forall i \in J\vec{R}x>y(R)
J同时对(x,y)(y,x)拥有决定权,则称Jx?y(R)构成统治(dominant)。
J只包含一个元素j,寡头统治退化为独裁(dictatorial)。
任何有意义的社会福利函数都应该采纳所有成员“一致通过”的结论。我们要求:
(Ⅰ)I对任意x?y(R)构成统治;
就政治而言,(Ⅰ)代表集体意志的执行;就经济而言,(Ⅰ)给出一个Pareto优化:以x取代y后,所有人都更加满意。

Independence of Irrelevant Alternatives
n \geq 3时,另一条限制似乎也是自然的:
(Ⅱ)对任意有序对(x,y)x?y(R)仅由x?y(\vec{R})决定;
这通常被称为对无关选择的非依赖性(independence of irrelevant alternatives, IIA)。
与之相对应的,我们引入一个稍弱于决定权的概念:
J对有序对(x,y)拥有准决定权(almost decisive),若对所有同时满足(1)x>y(R_i)\forall i \in J;(2)y>x(R_i)\forall i \not \in J\vec{R}x>y(R)
乍看上去温良无害的(Ⅱ)实际上是一条极强的限制:假定n \geq 3F满足(Ⅰ)(Ⅱ),我们有
(引理1) 若J(x,y)拥有准决定权,则\forall zJ(x,z)拥有决定权。
证明:令
(3)x>y>z(R_j)i \in J
(4)y>x, y>z(R_i)i \not \in J
由假设知x>y(R),由(Ⅰ)知y>z(R),因此x>z(R)。(4)对x?z(R_i)i \not \in J没有任何限制,故由(Ⅱ)知J(x,z)拥有决定权。
同理我们有
(引理2) 若J(x,y)拥有准决定权,则\forall zJ(z,y)拥有决定权。
反复应用上述2条引理,我们得到
(引理3) 若J(x,y)拥有准决定权,则Jx?y(R)y?z(R)z?x(R)构成统治。
(引理4)若J(x,y)拥有准决定权,则J对任意u?v(R)构成统治。

The Voting Paradox Revisited
多数决要求F在满足(Ⅰ)(Ⅱ)的同时保证I的子集拥有准决定权当且仅当其充分大,Condorcet悖论指出在n \geq 3时这是不可能做到的。事实上我们有
(广义Condorcet悖论,Baby Arrow) 若n \geq 3F满足(Ⅰ)(Ⅱ),则存在j \in I对某个有序对(x,y)拥有准决定权。
证明:显然拥有准决定权的集合是存在的:例如I。有此性质的集合中,有一个包含的元素最少,记为J。若J不是单元素集,则J可拆分为2个非空集合J_1J_2的不交并。取有序对(x,y)之外的z,并令
x > y > z(R_i)i \in J_1
z > x > y(R_i)i \in J_2
y > z > x(R_i)i \not \in J
因为J(x,y)拥有准决定权,x>y(R)。由于J是此类集合中最小的,子集J_1不可能对(x,z)拥有准决定权,因此x \leq z(R)。同理y \geq z(R),矛盾。

Arrow’s Theorem
将引理4和Baby Arrow相结合,我们得到一个出乎意料的结果:
(Arrow一般可能性定理) 若n \geq 3F满足(Ⅰ)(Ⅱ),则存在j \in I对所有u?v(R)构成统治(独裁)。
换言之,此时F必为投影:R=F(R_1,R_2,\cdots,R_N)=R_j(R是一个严格全序关系,R=R_j仅在“遗忘”掉R_j中所有“=”的意义下成立)。
我们该怎么诠释这条定理呢?“所有投票都是不公平的”?理性和民主注定无法相容?如果我们高擎理性主义的大旗,那么哲人王将会是历史的唯一解药?又或者一切都指向虚无,在现实的废墟上既不存在所谓理性,也不存在所谓民主,Arrow定理和“真空中的球形鸡”无异2?形形色色的诠释者中,太多人既不懂数学,也不懂经济。站在Arrow立下的磐石上,他们翩然高蹈,自我陶醉地飞向了形而上学的领域。

几乎所有避开Arrow定理的方法都已经被尝试过了。放弃全序关系的模型,限制F的定义域,将n固定为2,令N \to \infty,放宽(Ⅰ)(Ⅱ),乃至迫使个体修正其偏好……究竟哪一种方法更好地描述了现实呢?在所有人自说自话的喧嚣中,我深深地怀疑even god does not know and time will never tell3.

A Loose End

Arrow定理是一系列一般可能性定理中的头一个。我们还可以举出Gibbard–Satterthwaite 定理Duggan–Schwartz 定理,Sen的Pareto自由不可能定理,等等。

所有证明都是类似的,乃至平行于彼此。或许我们从未曾走得更远。60年过去了,我们仍在Arrow的荫蔽下,举目不见阳光。

Reference
Arrow  Social choice and individual values
Cassels  Economics for mathematicians
Reny  Arrow’s theorem and the Gibbard-Satterthwaite theorem: a unified approach


  1. 黄有光即提倡将utilitarianism翻译为“效用主义”,钱永祥、周保松则提倡“效益主义“的译法。一个更古雅的翻译是“乐利主义”,这是梁启超、胡适那个时代的译法。 
  2. 或许此处我们可以引用赵鼎新的辩护:“形式模型的目的不在于精确预测事物的具体发展,而在于抓住事物在一定条件下的发展规律及其背后的机制,因此,对形式模型进行简单的经验性批判没有什么意义。”(《社会与政治运动讲义》,社会科学文献出版社,2012) 
  3. 豆瓣上的Welfare向我指出,在放宽(Ⅱ) (即IIA)的方向上已有不少积极成果,例如
    Campbell,Kelly  Information and preference aggregation
    另一方面,他也提到,A.Sen修正个体偏好的尝试被评价为”NOT very substantial”(if not trivial).