Quantization as Deformation I

Very early in my study of physics, Weyl became one of my gods. I use the word “god” rather than, say, “outstanding teacher” for the ways of gods are mysterious, inscrutable, and beyond the comprehension of ordinary mortals.
——Schwinger

Weyl是研究量子物理与表示论联系的第一人。这个领域至今依然非常迷人:表示论、代数几何、复几何、弦论乃至数论都交织在一起。
Weyl  Quantenmechanik und Gruppentheorie

From Weyl Algebra to Heisenberg Lie Algebra
一般地,“量子化问题”可以陈述为:给定描述物理过程的经典模型(辛流形上的Hamilton系统,Riemann流形上的Lagrange系统,etc.),将可观测量函数系统地替换为某个Hilbert空间上的算子,使其满足特定的量子化条件。
1926年,Heisenberg发现了位置算子和动量算子的如下对易关系(CCR):
[P_i,Q_j]=-\sqrt{-1}\hbar\delta_{ij}\hbar为约化Planck常数                   (1)
视(1)为量子化条件,Weyl研究了PQ生成的算子环:对2k维线性空间V,(1)中Kronecker delta函数可以实现为V上的辛形式\omegau \otimes v-v \otimes u=\omega(u,v)定义了V上的Weyl代数W(V)。在这个意义上,经典力学对应对称代数,而Weyl代数(物理文献中又称为CCR代数)是对称代数的“量子化”。
从Lie群的角度看,(1)又可以理解为某个Lie代数的结构方程:以辛形式定义Lie括号,在Weyl代数的生成元中加入单位元R(一维中心扩张)后生成的实Lie代数称为Heisenberg代数。其对应的幂零Lie群即著名的Heisenberg群H_{2k+1}H_{2k+1}可以在\Bbb R^{2k} \times \Bbb R上实现为:
(v_1,t_1)+(v_2,t_2)=(v_1+v_2, t_1+t_2+\omega(v_1,v_2)/2)
Heisenberg群出现在数学的各个领域:从Abel簇的构造 (Mumford) 到3维流形的分类 (Thurston)。其与theta函数的天然联系指向数论、模形式和数学物理。

Unitary Representations of the Heisenberg Group
数学家的谨慎使Weyl不愿意处理P,Q这样的无界算子;另一方面,量子力学的物理诠释要求可观测量a对应自共轭算子A,于是过渡到Lie群层面后,e^{iA}为酉算子(至少在形式上),这是特别令人满意的。
一般地,对于构型空间\Bbb R^k和算子P_i, Q_i1 \leq i \leq k,引入参数a,b \in \Bbb R^k并定义
X(a)=e^{\sqrt{-1}aQ}Y(b)=e^{\sqrt{-1}bP},向量相乘理解为内积
由此可以将对易关系(1)写成指数形式(又称Weyl形式):
\displaystyle X(a)Y(b)X(a)^{-1}Y(b)^{-1}=e^{-\sqrt{-1}\hbar ab}                                  (2)
此处的计算是形式的,可视为Baker–Campbell–Hausdorff公式的一个特例。
X(a), Y(b)\Bbb R^k的酉表示。Weyl的创辟之处在于他坚持统一处理共轭量的表示:
\displaystyle W:(a,b) \mapsto e^{(\sqrt{-1}\hbar/2)ab}X(a)Y(b)
由于XY不可交换,W不是\Bbb R^{2k}的酉表示,却诱导一个射影酉表示W满足W(a,b)W(a',b')=m(a,b:a',b')W(a+a',b+b')Schur乘子\displaystyle m(a,b;a',b')=e^{(\sqrt{-1}\hbar/2)(ab'-ba')}在单位圆上取值。
物理上,这个射影酉表示非常令人满意:它对应量子力学中的波函数归一化。数学上我们有一个等价描述:定义Z(c)=e^{\sqrt{-1}cR}c \in \Bbb R,并取
W:(a,b,c) \mapsto X(a)Y(b)Z(c)
此时W扩张为Heisenberg群H_{2k+1}的酉表示。乘子项m(a,b;a',b')得到了更好的解释:它对应H_{2k+1}的“挠部分”\omega(v_1,v_2)/2

Three Models
尽管H_{2k+1}有非常简单的矩阵模型,它的酉表示却不可能是有限维的。下面是3个无穷维酉表示的例子。
模型1(theta表示) 给定上半平面的复数\tau,赋予整函数f:\Bbb C \to \Bbb C如下范数:
\displaystyle \parallel f \parallel^2_\tau=\int_{\Bbb C} e^{(-2\pi y^2/Im(\tau))}|f(x+\sqrt{-1}y)|^2 dxdy
满足\parallel f \parallel^2_\tau<\infty的整函数f构成Hilbert空间\mathcal{H}_\tauH_3\mathcal{H}_\tau上有不可约酉表示
\displaystyle (W_t(a,b,c)f)(z)=e^{\sqrt{-1}\pi(a^2\tau+2az+c)}f(z+a\tau+b)
特别地,H_3的Abel子群\Bbb Z^2作用于\mathcal{H}_\tau上有唯一的不变向量,即Jacobi theta函数
模型2(Fock表示)视\Bbb R^{2k}=\Bbb C^k,赋予全纯函数f:\Bbb C^k \to \Bbb C如下范数:
\parallel f \parallel^2=\int_{\Bbb C^k} e^{-|z|^2}|f(z)|^2 dz
满足\parallel f \parallel^2<\infty的全纯函数f构成Segal-Bargmann空间\mathcal{H}.
\partial_iz_i诠释为阶梯算子1,我们有
\displaystyle Q_i=\frac{1}{\sqrt{2}}(\partial_i+z_i)\displaystyle P_i=\frac{\sqrt{-1}}{\sqrt{2}}(-\partial_i+z_i)
自共轭算子P_i,Q_i给出Weyl代数W(\Bbb R^{2k})\mathcal{H}上的不可约表示。
模型3(Weyl表示;Schrödinger模型) 取L^2(\Bbb R^k)为表示空间,H_{2k+1}有不可约酉表示
\displaystyle (W_s(a,b,c)\psi)(x)=e^{\sqrt{-1}(ax+\hbar c)}\psi(x+\hbar b)
这个表示被称为Schrödinger模型,由此可以获得量子力学的波动力学描述:例如,取R为Hamilton算子He^{\sqrt{-1}tH}\psi=W_s(0,0,t)\psi=e^{\sqrt{-1}\hbar t}\psi。相因子无关紧要,我们可以认为波函数在单参数酉群e^{\sqrt{-1}tH}的作用下不变(能量守恒)。取微分过渡到Lie代数层面,即得到Schrödinger方程

Stone-von Neumann Theorem
Weyl提出了如下问题:是否Heisenberg群H_{2k+1}的任意不可约酉表示均酉等价于Schrödinger模型W_s?1930年前后,Stone和von Neumann各自独立地给出了肯定的回答——从而给出了矩阵力学等价于波动力学的又一个证明。
(Stone-von Neumann定理) H_{2k+1}的任意酉表示均酉等价于若干个W_s的直和。
von Neumann的原始证明可以在以下著作中找到
Folland Harmonic analysis in phase space
实Heisenberg群是局部紧Abel群\Bbb R^{2k}的中心扩张。Weyl提出可以将\Bbb R替换为有限群\Bbb Z_n,作为玩具模型来研究。另一方面,根据Lefschetz原理,也有理由将\Bbb R替换为其他局部域 (尤其是p-adic数域) 的加法群进行研究。这都要求我们推广局部紧Abel群上的调和分析
具体来说,我们以局部紧Abel群G取代\Bbb R^{2k},以2-闭上链取代辛形式\omega。中心扩张1 \to U(1) \to H \to G \to 1给出抽象Heisenberg群H
群上同调论的角度看,Schur乘子m(a,b;a',b')作为2-闭上链的结构是清楚的:
m(x+y;z)m(x;y)=m(x;y+z)m(y;z)
对于抽象Heisenberg群,Stone-von Neumann定理有一个深远的推广:Mackey理论。关于其主定理,一个细致且清晰的证明可以在下面这本书中找到:
Mumford  Tata Lecture on Theta III
当然也可以参看Mackey本人的著作,以及
Varadarajan  Geometry of quantum mechanics, Vol.2

Weyl Quantization
局部紧Abel群满足Pontryagin对偶。对于相空间\Bbb R^{2k}而言,这个对偶关系是(q,p) \mapsto (a,b).
经典物理量是(q,p)的函数。Weyl量子化,或者,Weyl变换,指的是(1)通过Fourier逆变换将经典物理量变为(a,b)的函数;(2)通过Weyl表示将(a,b)的函数变为算子(Q,P)的函数,也即Q_\hbar: f \mapsto W(F^{-1}f).
不难证明,(1)Q_\hbar(f)自共轭当且仅当f是实函数; (2) 若f速降函数,则Q_\hbar(f)迹类算子并有一个积分核表示。
对于一般的局部紧Abel群,我们也可以定义Weyl变换。p-adic数域的情况或许是最有趣的,不仅和数论紧密相关,而且有可能应用于物理上:某些数学物理学家(例如Volovich)怀疑Planck尺度下的时空是非Archimedes的。
Weyl变换的逆变换称为Wigner变换。这是一个非常有趣的变换:量子概念的经典“对应”常常有意料之外的物理意义。

Weyl-Moyal Algebra
1940年前后,Moyal对Weyl量子化进行了更深入的考察。和Weyl不同,他感兴趣的对象不是算子,而是经典函数空间:Weyl忽略了经典函数空间的Poisson结构,而这正是Moyal希望研究的。
定义Moyal积\cdot_\hbar为算子复合运算在Wigner变换下的拉回2
Q_\hbar(f_1 \cdot_\hbar f_2)=Q_\hbar(f_1)Q_\hbar(f_2)
定义Moyal括号[f_1,f_2]_\hbar=f_1 \cdot_\hbar f_2-f_2 \cdot_\hbar f_1,我们有:
Q_\hbar([f_1,f_2]_\hbar)=[Q_\hbar(f_1),Q_\hbar(f_2)]
这在经典函数空间(不妨取成Schwartz空间)上定义了一个Poisson代数结构,我们称其为Moyal代数。
\hbar \mapsto 0时,Moyal代数趋于退化,这对应经典物理的假定:测量顺序不影响结果。一般地,我们希望研究Moyal代数对参数\hbar的依赖。
展开到一阶:
\displaystyle f_1 \cdot_\hbar f_2=f_1 f_2+\frac{\sqrt{-1}\hbar}{2}\{f_1,f_2\}+O(\hbar^2)
\displaystyle [f_1,f_2]_\hbar=\sqrt{-1}\hbar\{f_1,f_2\}+O(\hbar^2)
事实上,展开到二阶后,\displaystyle [f_1,f_2]_\hbar=\sqrt{-1}\hbar\{f_1,f_2\}+O(\hbar^3)3.

为了将Moyal代数的结构看得更加清楚,我们必须推广对Poisson括号的定义:取2组变元q^{(1)},p^{(1)},q^{(2)},p^{(2)}。定义S(\Bbb R^{2k} \times \Bbb R^{2k})上的微分算子\Pi=\Sigma(\frac{\partial}{\partial q_j^{(1)}} \otimes \frac{\partial}{\partial p_j^{(2)}}-\frac{\partial}{\partial p_j^{(1)}} \otimes \frac{\partial}{\partial q_j^{(2)}}),定义S(\Bbb R^{2k} \times \Bbb R^{2k}) \to S(\Bbb R^{2k})的对角算子D(f)(q,p)=f(q,p,q,p),Poission括号相当于这两个算子的复合:
\{f_1,f_2\}=D \circ \Pi(f_1 \otimes f_2)=P(f_1 \otimes f_2)
由此我们可以定义Poisson括号的“幂”:P^N(f_1,f_2)=D \circ \Pi^N(f_1 \otimes f_2)
于是形式上我们有
\displaystyle f_1 \cdot_\hbar f_2=e^{(\sqrt{-1}\hbar/2)P}(f_1,f_2)
\displaystyle [f_1,f_2]_\hbar=\frac{2}{\hbar}\sin(\frac{\hbar}{2}P)(f_1,f_2)
这就是Moyal括号又被称为“正弦括号”的原因。

Deformation Quantization
通过上述对Moyal代数的考察,我们发现以\hbar为形变参数,量子代数可以视为经典代数的形变。这个观点由Flato等人首次提出。特别地,他们证明了对于S(\Bbb R^{2k})上的经典Poisson代数结构,Moyal代数在规范等价的意义上是唯一可能的形变——也就是说,量子力学是经典力学唯一可能的“形变”。
一般地,令A为某光滑流形X上所有光滑函数的代数。A上的Moyal积定义为
(f,g) \mapsto f \star g=fg+\hbar C_1(f,g)+\hbar^2 C_2(f,g)+\cdots \in A[[\hbar]]
此处\hbar为形式变元,C_i为双微分算子。
为了进行形变,我们要求Moyal积不仅仅是一个形式的渐进展开,而是一个真正的解析展开。这一点并没有先验的保证。
Darboux定理,辛流形上的局部Poisson代数结构总能形变为Moyal代数。我们只需在装备一个平坦的辛联络之后,将这个局部形变扩张到整个流形上。对于一般的Poisson流形,情况要复杂得多。此时Kontsevich量子化公式给出一个Moyal积的形式定义(这是Kontsevich获得1998年Fields奖的原因之一),但尚不清楚它是否在规范等价的意义上给出唯一可能的形变量子化。
Kontsevich  Deformation quantization of Poisson manifolds
物理学家将Kontsevich量子化公式及作为其推广的形式化猜想(formality conjecture)理解为某种扰动弦论。尽管这个想法在物理上非常自然,但和“量子数学”中的诸多结果一样,我们要面临在数学上严格处理Feynman路径积分的困难。
Cattaneo, Felder  A path integral approach to the Kontsevich quantization formula


  1. 这个数学模型在量子场论中有着全然不同的物理意义:\partial_iz_i被称为消灭和创生算子,Hamilton算子的特征分解给出Fock空间\mathcal{H}的分次结构,量子数代表粒子数。这是Fock表示命名的由来。 
  2. Moyal积的定义首次出现于Groenewold的博士论文中:
    Groenewold  On the Principles of elementary quantum mechanics 
  3. Dirac提出的正则量子化 (更确切地,对应于单粒子的一次量子化,或者,辛流形的几何量子化)以Poisson括号描述非交换性,上式指出这只在二阶近似的意义上成立。历史上人们很早就发现作为量子论的半经典近似,正则量子化会导致不可避免的内在矛盾。例如,Groenewold-van Hove不可行定理(no-go theorem)指出对于次数大于2的多项式f(x_1,x_2),一个自洽的正则量子化是不可能的。 
Advertisements

Maxwell理论札记

2011年6月5日

没有系统学习过经典电动力学。因为假期里要做家教讲高中电磁学,这两天重读了Feynman的讲义,有新的体会。物理学家习惯用反对称张量,微分算子的内积、外积来描写现象,数学家则说外微分形式,Hodge对偶和外微分算子。阿早和我说过这样的话:把方程写得简单漂亮意思不大,重要的是求解具体的问题。我想Feynman一定会赞同这种哲学。 不过两者也非截然矛盾:例如在讲义第2卷第19章,Feynman展示了如何用Dirichlet原理近似计算圆柱体的电容。

2012年5月5日

时隔将近一年,我决定重写这篇札记:改正了之前的一些错漏,将对Maxwell理论的Lagrange形式的讨论并入本文,并引入规范场论的语言。

以下约定真空电容率\epsilon_0=1,真空磁导率\mu_0=1,因而光速\displaystyle c=\frac{1}{\sqrt{\epsilon_0 \mu_0}}=1

Maxwell理论

E记电场强度,B记磁感应强度,j记传导电流密度,\rho记电荷密度。真空中的Maxwell方程组为:

\nabla \cdot E=0+\rho(1.1)   \nabla \times E=-{\partial }_t B+?(1.2)

\nabla \cdot B=0+?(1.3)      \nabla \times B=\partial_t E+j(1.4)

上述4条方程分别是电场的Gauss定律Faraday电磁感应定律磁场的Gauss定律以及Ampère环路定律的Maxwell修正。?代表假想中磁单极子的贡献。方程右端,第1项描述无源场,第2项描述有源场,此时场源是方程的奇点,这将带来非平凡的上同调类。

J.Maxwell (1831-1879)

1.电荷守恒:对(1.4)取散度并以(1.1)代入,得到\partial_t \rho+\nabla \cdot j=0 (1.5)

历史上,Maxwell正是因为发现Ampère定律和其他电磁学定律结合在一起时不满足电荷守恒的要求才提出在(1.4)的右端加上\partial_t E这一项,从而得到了电磁学的完整规律。

2.波动方程:若不存在电荷和传导电流,(\partial_{tt}-\triangle)E=0(\partial_{tt}-\triangle)B=0。此波动方程组的解即众所周知的电磁波。

3.电磁势:迄今未在实验中发现磁单极子。由(1.3)和Poincaré引理,存在向量势A使得B=\nabla \times A。代入(1.2),同理推出存在标量势\Phi使得E=-\nabla\Phi-\partial_t A

相对论性Maxwell理论

波动方程有对称群O(1) \times O(3),较Lorentz群O(1,3)为小。Einstein提出Maxwell方程的解应该是Lorentz不变的,这导致了狭义相对论的诞生。

现赋予\mathbb{R}^4以Minkowski度量g_{\mu \nu}=(+,-,-,-)使之成为伪Riemann流形。4维流j^\mu=(\rho,j^1,j^2,j^3)是Lorentz不变的,我们要求4维势A^\mu=(\Phi,A^1,A^2,A^3)同样Lorentz不变。定义对偶1形式A_\mu=g_{\mu\nu}A^\nu,2形式F_{\mu \nu}=dA_\mu称为电磁张量F^{\mu \nu}的6个分量将给出电场E^\mu和磁场B^\mu

(1.2)(1.3)的信息以Bianchi恒等式的形式包含在电磁张量中。(1.1)(1.4)则给出

\partial_\nu F^{\mu\nu}=j^\mu  (2.1)

我们称(2.1)为Yang-Mills方程。

Maxwell理论的Lagrange形式

以下假定时空中仅存在电磁场。(2.1)退化为d^* F_{\mu\nu}=0

定义Lagrange量L=F^{\mu\nu}F_{\mu \nu}=F_{\mu\nu} \wedge *F_{\mu\nu}作用量\displaystyle S=\int_{[t_0,t_1] \times \mathbb{R}^3} L

推广Dirichlet原理,可以证明F_{\mu\nu}为上闭形式是S处在临界点的充要条件:最小作用量原理和Yang-Mills方程一致。

电磁应力-能量张量T^{\mu\nu}=F^{\mu\alpha}F_\alpha^\mu-g^{\mu\nu}L/4是一个零迹二阶对称张量:

T^{\mu\nu}=\begin{pmatrix} u&S \\ S&-\sigma_{ij} \end{pmatrix}

其中能量密度\displaystyle u=\frac{1}{2}E^2+\frac{1}{2}B^2,能流密度(Poynting向量)S=E \times BMaxwell应力张量\sigma_{ij}=E_iE_j+B_iB_j-\delta_{ij}u

(能量守恒/Poynting定律\partial_t u+\nabla \cdot S=0  (3.1)

(动量守恒)\partial_t S=\nabla \cdot \sigma  (3.2)

作为规范理论的Maxwell理论

注意到\PhiA的选取各容许一个额外的自由度,这称为规范对称性。加上某个规范条件以冻结这个自由度在处理物理问题时常常是方便的。

(1)Lorenz规范条件\nabla \cdot A+\partial_t\Phi=0:即d^{*}A_\mu=0

(1.1)(1.4)化为(\partial_{tt}-\triangle)\Phi=\rho(4.1)  (\partial_{tt}-\triangle)A=j(4.3)

引入d’Alembert算子\square=\partial^\mu \partial_\mu=dd^*+d^*d,上面2式可合并为

\square A^\mu =j^\mu (4.3)

作为(4.3)的解,A^\mu是Lorentz不变的。

注记:Lorenz规范条件以丹麦物理学家Ludvig Lorenz命名。他与相对论先驱、荷兰物理学家Hendrik Lorentz并非一人。

(2)Coulomb规范条件\nabla \cdot A=0

(1.1)(1.4)化为\triangle\Phi=-\rho(4.4)   (\partial_{tt}-\triangle)A=j-\partial_t\nabla \Phi(4.5)

此时\Phi代表带电粒子的Coulomb势A则给出横向电磁辐射。

Aharonov-Bohm效应显示即使在没有磁场的区域,电磁势的作用仍可能改变波函数的相位。从微分几何的观点看,A_\mu相当于联络形式。对于复函数\psi,规范变换A_\mu \mapsto A_\mu+id\lambda可理解为对应相位变换\psi \mapsto e^{i\lambda} \psi的联络变换。物理上,我们称光子\mathrm{U}(1)对称性。

标准模型中的其他基本粒子有更高的对称性(\mathrm{SU}(2)\mathrm{SU}(3)等等)。对应的,我们要考察构型空间上相应主丛的几何:此即Yang-Mills理论

谱几何初步

这学期选了倪磊的微分几何课。我喜欢他上课的风格:图景清晰,细节准确,间杂一些质朴的幽默感。不过,这部分笔记与其说是课堂的实录,不如说是我自己对相关课题的一点整理。

给定有界区域\Omega \subset \mathbb{R}^n\partial \Omega光滑,考虑Laplace算子-\triangle的Dirichlet型谱问题:
-\triangle u=\lambda u,要求在\partial\Omegau=0
由椭圆算子理论知-\triangle的谱是离散的:0<\lambda_1 <\lambda_2 \leq \cdots\lambda_k \to \infty。注意到\lambda_1总是单特征值,它有特殊的重要性。
这个数学模型在物理中有各种各样的应用,参见名作
Kac  Can One Hear the Shape of a Drum?

基于经典黑体辐射理论,Lorentz猜想\lambda_k的渐进行为足以决定\Omega的体积。在Göttingen宣讲后,Weyl很快给出了证明:
(Weyl渐进公式)\displaystyle \lambda_k \sim \frac{4\pi^2 k^{2/n}}{(V(B^n)V(\Omega))^{2/n}},常数V(B^n)代表单位球的体积。
与之相关的,我们有著名的
(Dirichlet型Pólya猜想)\displaystyle \lambda_k \geq \frac{4\pi^2 k^{2/n}}{(V(B^n)V(\Omega))^{2/n}}
特别地,Pólya本人证明了若能用\Omega铺满\Bbb R^2,则猜想成立。
Pólya  On the eigenvalues of vibrating membranes
对于一般的\Omega,李伟光和丘成桐证明了Dirichlet型猜想在“平均”意义上成立。
Li, Yau  On the Schrödinger equation and the eigenvalue problem

Kac进一步问:-\triangle的算子谱是否足以在等距同构的意义下确定\Omega?特别地,n=2时算子谱描述了鼓面振动时的特征频率,是否能从鼓的特征频率“听出鼓的形状”?对于闭流形,回答是否定的:早在Kac的论文发表之前,Milnor就构造出了2个同谱却不等距同构的16维环面。
Milnor  Eigenvalues of the Laplace operator on certain manifolds
这个结果有很深的数论背景:在16维空间上存在2个偶幺模整格(D_{16}^{+}E_8 \oplus E_8)对应同一个theta函数/模形式\Theta(q)=1+480\sum \sigma_7(n)q^{2n}
80年代初,借助自守形式的谱理论,找到了2个同谱却不等距同构的双曲Riemann面:
Vignéras Variétés riemanniennes isospectrales et non isométriques
90年代初,同谱却不等距同构的2维开区域的例子也被找到,最终否定地回答了“听鼓”问题:
Gordon, Webb, Wolpert  Isospectral plane domains and surfaces via Riemannian orbifolds

类似的,可以考虑Neumann型谱问题-\triangle u=\mu u,要求在\partial\Omega{\partial u }/{\partial n}=0-\triangle有离散的非负谱:0=\mu_1<\mu_2 \leq \cdots\mu_k \to \infty
(Weyl渐进公式)\displaystyle \mu_{k+1} \sim \frac{4\pi^2 k^{2/n}}{(V(B^n)V(\Omega))^{2/n}}
(Neumann型Pólya猜想)\displaystyle \mu_{k+1} \leq \frac{4\pi^2 k^{2/n}}{(V(B^n)V(\Omega))^{2/n}}
Kröger证明了Neumann型猜想同样在“平均”意义上成立。
有趣的是,尽管2个Pólya猜想均未获证明,Friedlander却能够证明\mu_{k+1} \leq \lambda_k。这是支持Pólya猜想成立的有力证据。

P.S. For a general problem list, see here.

Pauli矩阵,表示论与Kähler恒等式

我们曾经讨论过电子自旋的数学理论:3个正交方向上的自旋算子由S_k=\sigma_k/2给出(k=1,2,3),\sigma_1=\begin{pmatrix} 0&1 \\ 1&0 \end{pmatrix}\sigma_2=\begin{pmatrix} 0&-i \\ i&0 \end{pmatrix}\sigma_3=\begin{pmatrix} 1&0 \\ 0&-1 \end{pmatrix}Pauli矩阵。由Heisenberg图像X_k=iS_k\mathfrak{su}_2的一组基。

作为Lie代数,\mathfrak{su}_2上有基本交换关系:[X_j,X_k]=-X_l对正置换(jkl)成立。

考虑\mathfrak{su}_2在复向量空间V上的表示\rho\mathrm{SU}_2是紧Lie群,由Peter-Weyl定理\rho可分解为有限维不可约表示的直和。 不妨假定\rho已是有限维不可约表示。

\mathfrak{sl}_2=\mathfrak{su}_2 \otimes_\mathbb{R} \mathbb{C}(\mathfrak{su}_2\mathfrak{sl}_2紧实形式),\rho的复化(仍以\rho记)给出\mathfrak{sl}_2的表示。取S_+=S_1+iS_2S_-=S_1-iS_2S_3为基,有恒等式

[S_3,S_\pm]=\pm S_\pm[S_+,S_-]=2S_3

V^\lambda\rho(S_3)权空间,由交换关系不难推知\rho(S_\pm):V^\lambda \to V^{\lambda \pm 1}v \in V^\lambda称为本原的,若\rho(S_+)v=0。以P记本原空间,由V的不可约性得到

(本原分解)V=\oplus_{l \geq 0} \rho(S_-)^l P。进而推知

(S_3的谱分解)所有\lambda均为半整数,\displaystyle V=V^{-\frac{m-1}{2}} \oplus V^{-\frac{m-3}{2}}\oplus \cdots \oplus V^\frac{m-1}{2}。特别地,\rho(S_\pm)^n:V^{\pm n/2} \to V^{\mp n/2}定义了一个同构。

上述2个分解相容。以P^\lambdaP \cup V^\lambda,我们得到

(精细分解)V^\lambda=\oplus_{l \geq 0} \rho(S_-)^l P^{\lambda+l}

S_\pm在物理上对应阶梯算子,这是研究角动量算子和量子谐振子的标准工具。在量子场论中,其对应物是创生/消灭算子。

从Witten的观点看,Riemann流形上的几何分析与量子力学相平行:\Omega^*(M)对应波函数,\triangle_d对应Hamilton量,等等。更进一步,弦论考虑带有复结构的时空:紧Kähler流形M,生成/湮灭算子由L: \mu\mapsto \omega \wedge \muL^*给出。定义分次算子 h=\sum (n-k)\Pi^k\Pi^k:\Omega^*(M) \to \Omega^k(M)为投影算子。LL^*h均与\triangle_d交换,从而作用在有限维空间\mathcal{H}^{*}(M)上。事实上,它们生成\mathfrak{sl}_2的一个表示:

\rho(S_+)=L^*/2\rho(S_-)=L/2\rho(S_3)=h/2

交换关系给出Kähler恒等式[L^*,L]=h[h,L]=-2L[h,L^*]=2L^*

h的谱对应\mathcal{H}^{*}(M)的分次结构。结合Hodge定理得到

(Lefschetz对偶)L^k: H^{n-k}_{dR}(M) \to H^{n+k}_{dR}(M)是同构,这推广了Poincaré对偶。

算子L给出的信息不止于此。k \leq n时,L作用在H^k_{dR}(M)上是单射,我们得到不等式b_{k-2}\leq b_k,这从拓扑上刻画了Kähler流形。

定义本原de Rham上同调P_{dR}^k(M)=(\ker L^*)\cap H_{dR}^k(M),精细分解对应

(Lefschetz分解)H_{dR}^k(M)=\oplus_{l \geq 0} L^l P_{dR}^{k-2l}(M)

Lefschetz对L的理解是几何的。考虑代数流形M \subset P^N,Fubini-Study度量的Kähler形式是超平面H的Poincaré对偶,其在M上的限制\omega则是W=M \cap H \subset M的Poincaré对偶。原始版本的Lefschetz对偶可叙述为:相交操作\cap W^{N-k}诱导同调群的同构H_{n+k}(M) \to H_{n-k}(M)

Boltzmann方程,H定理和非平衡态统计力学

我一直觉得熵是一个极其神秘而有趣的概念(尽管对这方面的物理知识几近一无所知)。前些日子听了新晋Fields奖得主C.Villani关于Landau阻尼的讲座。他的法式夸张和他的法式口音同样典型,看来是一个很聪明(也很自恃)的人。无论如何,这个讲座重新激起了我对统计物理的兴趣。

Boltzmann方程是理解熵的基本模型之一。这篇文章是我的学习笔记。

Rezakhanlou, Villani  Entropy Methods for the Boltzmann Equation


大数目的同类分子群(例如稀薄气体)的分布将如何演化?换言之,给定2维/3维构型空间V,我们希望考察在T^*V \times [0,+\infty)上定义的概率密度函数f_t(x,p) \geq 0的演化。

定义Liouville算子L=\partial_t+\{\cdot,H\}=\partial_t+v \cdot \nabla_x+F \cdot \nabla_p

分子间不存在碰撞:连续性方程给出Liouville方程Lf_t=0(概率密度局域守恒)。

分子间存在弹性碰撞:加入碰撞项C(f_t),我们得到Boltzmann方程Lf_t=C(f_t)

基于所谓的分子混沌假设,Boltzmann给出的碰撞项是C(f_t)=Q(f_t,f_t),其中

\displaystyle Q(f_1,f_2)=\int_{S^2}\int_{\mathbb{R}^3}(f^{'}_1 f^{'}_2-f_1 f_2)B(p_1-p_2,\sigma)dp_2 d\sigma

这个非线性项描述了动量为p_i的2个分子在x处相撞后动量改变为p_i^{'}的过程(i=1,2)。发生完全弹性碰撞时,动量和动能守恒,(p_1,p_2)可用单位向量\sigma \in S^2参数化。碰撞核B是非负Borel函数,取决于p_1-p_2及其与\sigma的交角\theta,它描述了分子的“弹性”。

理论上经常考察Boltzmann方程的如下简化:

(1)齐性空间模型:f_t(x,p)=f_t(p)。特别地,L中的v \cdot \nabla_x项消失。

(2)无附加力场:F \equiv 0。特别地,L中的F \cdot \nabla_p项消失,且总动能守恒。

(3)f_t满足下列3种典型的边值条件之一:周期性条件V=T^3,此时总动量守恒;回弹条件f_t(x,p)=f_t(x,-p)x \in \partial V;镜面反射条件f_t(x,p)=f_t(x,R_x p)x \in \partial VR_x pp关于x处法线的镜面反射象,此时总角动量守恒。

(4)假定B \sim |p_1-p_2|^{a},碰撞核B可分为硬分子型(a>0),软分子型(a<0)和Maxwell分子型(B|p_1-p_2|无关,仅取决于\cos \theta)。根据\theta \to 0时的表现,碰撞核B可分为截断核(\int B d\sigma<+\infty)和非截断核(\int B d\sigma \to +\infty)。


以下讨论假定(2)成立,总动能守恒(且有限)。此时弱解的存在性是已知的(DiPerna, Lions),全局唯一性和正则性则(像Navier-Stokes方程一样)仍是著名的开问题。
定义H泛函H(f)=\int_{T^*V} f \mathrm{log} f,Boltzmann最杰出的工作是提出了H定理
\displaystyle \frac{d}{dt} H(f_t) \leq 0。特别地,假定碰撞核B几乎处处大于0,满足边值条件(3)且达到全局平衡态(泛函极小值)的f_t(x,p)将形如M(p)M(p)是某个Maxwell分布
S(f)=-kH(f)称为系统的Gibbs熵(kBoltzmann常数),它推广了Boltzmann熵S=k \mathrm{log} W。在这个观点下H定理应视为热力学第二定律的一例。

L.Boltzmann (1844-1906)

Villani在讲座中提到了他拜访Boltzmann墓的情景。此君最喜欢的公式正是刻在墓上的S=k \mathrm{log} W

信息论中,一个直接的类比是概率分布fShannon熵S(f)=-\int f \mathrm{log} f dx。Shannon注意到可以用S来衡量“信息量”。例如不等式S((f,g)) \leq S(f)+S(g)相当于“独立事件包含的信息量大于相关事件”。
熵为研究偏微分方程提供了一个强力的工具,而信息论又为熵的研究注入了新的洞见。


以下讨论假定(2)(3)成立。技术上我们要求若V \subset \mathbb{R}^3V必须是严格凸的。
非平衡态统计力学的一个基本问题是:系统是否最终会收敛到全局平衡态?就当前的情形,我们要问\displaystyle \lim_{t \to \infty} f_t \to M是否对Boltzmann方程的任意解成立?如若成立,其收敛速度如何?
对第1个问题的回答是:若f_t满足一定的先验估计,我们可以保证L^1意义下的弱收敛。第2个问题启发了许多工作(甚至形成了一个子领域),下面仅介绍一个特出的结果。
在信息论中,常用Kullback-Lerbler距离(相对熵)来衡量2个概率分布fg的差异大小:\displaystyle D(f|g)=H_g(\frac{df}{dg})=\int \mathrm{log}(\frac{df}{dg})dfD(f|g) \to 0当且仅当f几乎处处趋于g,这给出L^1意义下的弱收敛。
下面是一个较新的结果(2005),也是Villani获2010年Fields奖的主要工作之一:
(Desvillettes, Villani)假定f_t满足某些(自然的)先验估计,则D(f_t |M)=O(t^{-\infty})
Desvillettes, Villani  On the trend to global equilibrium for spatially inhomogeneous kinetic systems: the Boltzmann Equation
上述结果以其一般性取胜:对远离平衡态的f_t给出这样的一致估计要克服许多技术困难。
对特定的碰撞核B(例如硬分子模型),收敛速度可能是指数级的:这方面的研究仍在进行中。

附记
Villani的讲义参考了一篇由Carlen与卢旭光合作的文章:假定(1)(2)成立,他们针对(4)中的Maxwell型截断核构造了一个极其缓慢的收敛模型。这在某种程度上补充了上述Villani的结果。
09年在清华的时候,卢老师是我分析课的任课老师。他极其敬业(令我印象很深的是他曾自费打印Tao谈数学的文章分发给全班),对我个人也很关照。那时我隐约知道他是做统计物理学的。10年Fields奖颁出时我已南下赴港,没能听到他对Villani工作的评论。另一方面,港大的Mok恰好是这届Fields奖的评委之一,不过他也没有公开评论获奖者的工作。

自旋,Pauli矩阵和Dirac方程

Schrödinger方程有2个先天“缺憾”:第一,非Lorentz不变;第二,不能描述自旋。

推广非相对论性的Schrödinger方程只能得到一个描述磁场的“半场论”。手法仍是量子化:利用Legendre变换将Maxwell理论的Lagrange描述切换到Hamilton描述后,形式地将Hamilton函数替换为能量算子。Uhlenbeck和Goudsmit发现这个“半场论”加上一个额外假设后可以很好地解释反常Zeeman效应:电子在3个正交的方向上各有一个“内蕴”的角动量,各对应2个特征态:“向上”或“向下”。令人印象深刻的是与(轨道)角动量不同,这个称为自旋的可观测量完全是量子的,它在经典理论中没有任何对应。

电子自旋的数学理论由Pauli完成。3个自旋算子S_k=\sigma_k/2\sigma_k称为Pauli矩阵

\sigma_1=\begin{pmatrix} 0&1 \\ 1&0 \end{pmatrix}\sigma_2=\begin{pmatrix} 0&-i \\ i&0 \end{pmatrix}\sigma_3=\begin{pmatrix} 1&0 \\ 0&-1 \end{pmatrix}

Pauli矩阵与四元数紧密相关:i\sigma_k是张成\mathfrak{su}(2)的一组基。这是Heisenberg图像的一个推论,事实上可以由这点反推出Pauli矩阵的形式。

总自旋算子S^2=\sum S_k^2对应量子数\frac{1}{2},故电子有自旋\frac{1}{2}。Pauli证明了自旋-统计定理:有半整数自旋的粒子满足Fermi-Dirac统计,有整数自旋的粒子则满足Bose-Einstein统计,由此直接推出电子满足Pauli不相容原理。他因为这一系列工作获得1945年的Nobel物理学奖。

W.Pauli (1900-1958)

 “Das ist nicht nur nicht richtig, es ist nicht einmal falsch! ”

下一个伟大发现由Dirac做出。Schrödinger方程的2个缺陷是相关的:电子的自旋并非先验性质,它可以由相对论性的Schrödinger方程推出。这也是通往量子电动力学的第一步。

考虑最简单的自由粒子。直接对相对论关系E^2=p^2+m^2进行量子化,得到:

(Klein-Gordon方程)(\square+m^2)\psi=0d’Alembert算子\displaystyle \square=\frac{\partial^2}{\partial t^2}-\triangle

给定波函数的初始条件即可确定其演化,这与Schrödinger方程是时间的一阶方程一致。然而Klein-Gordon方程却是时间的二阶方程,说明这个尝试不够成功。从场论的观点看,Klein-Gordon方程应该解释为某个标量场而非粒子的波函数,否则其概率流密度不能保持为正。

Dirac试图将d’Alembert算子表成某个算子的平方,从而将方程分解为一阶的:

(Dirac方程)(D\pm im)\psi=0Dirac算子\displaystyle D=\gamma^k \frac{\partial}{\partial x_k}D^2=\square

\gamma_k没有复数解。Dirac提出的矩阵解是\gamma_0=\begin{pmatrix} 0&I \\ I&0 \end{pmatrix}\gamma_k=\begin{pmatrix} 0&\sigma_k \\ -\sigma_k&0 \end{pmatrix}:描述自旋的Pauli矩阵自然而然地出现在Dirac方程中。

Dirac方程的另一深远推论是:由于正负Dirac算子均是\square的平方根,作为特征值的能量将允许取负值。Dirac设想电子浸没在(满足共轭方程的)正电子Dirac海中,这预言了反粒子的存在。

因为对量子理论的决定性贡献,Dirac和Schrödinger分享了1933年的Nobel物理学奖。

P.Dirac (1902-1984)

Atiyah和Singer在研究指标定理时“重新发现”了Dirac算子。事实上\{i\gamma_0,\gamma_k\}Clifford代数Cl_4=\mathbb{H}(2)的一组生成元。至此进一步推广Dirac算子的可能性已十分清楚。

附注:我在Dirac接受Oppenheim纪念奖的演说中读到,Schrödinger才是最早考虑Klein-Gordon方程的人,然而他也最先注意到这个方程与物理原理不相协调。经过几个月徒劳的努力,他才意识到非相对论性方程已对当时的实验数据有极强的解释力,从而(不情愿地)发表了后来大名鼎鼎的Schrödinger方程。

量子力学:Schrödinger表象与Heisenberg表象

采用泛函分析的观点讨论量子力学称为Dirac表象。基于Dirac表象,我们介绍另外2种常用的表象:更加“形而下”的Schrödinger表象(PDE)与更加“形而上”的Heisenberg表象(算子代数)。

我们做统一的约定:约化Planck常数\hbar=1

单粒子的“经典态”在确定的时刻取确定值。在量子力学中,其量子态则必须用构形空间ML^2范数为1的复概率函数\psi(波函数)/Hilbert空间中的单位矢量(态矢)来表示。Hilbert空间的图像允许2种描述态矢演化的方式:考虑\psi_t满足的偏微分方程(Schrödinger)或考虑作用在\psi_0上的酉算子族U_t(Heisenberg)。前者给出:

(Schrödinger方程)(D_t+H)\psi=0。按惯例D_t-i\partial_t

E.Schrödinger (1887-1961)

自共轭算子H代表能量。一般地,量子理论中的可观测量由自共轭算子P表示,其期望为\overline{P}=(\psi,P\psi)。对于P的特征函数,\overline{P}给出相应的(实)特征值。研究P时,通常用P(互相正交的)特征空间来定义Hilbert空间的正交坐标系,这允许我们将量子态分解成系列特征态的叠加。转变研究的算子时,坐标系的变换由某个酉算子给出。

最基本的可观测量的例子是位置算子x及动量算子p=D_x。此时描述坐标系变换的酉算子正是Fourier变换算子F。这样的一对可观测量称为共轭的。特别有趣的是这给出了“多项式-微分算子”这一对偶的物理解释。

观测值必须满足已知的经典关系。假定波函数满足一定的边值条件,则\mathbb{R}[x,p]是一个自共轭算子代数,这允许我们利用xp对其他力学量进行正则量子化。例如对于非相对论性粒子,H=p^2/2m+V,保守势场V(t,x)可以包含电势在内。有趣的是,此时描述波函数的是一个热方程。这是量子力学与热方程相联系的最简单例子。我们将进一步讨论这种联系:它导向指标定理的分析证明。

代表可观测量的算子P必须是自共轭算子。S表象给出这一假设的后验解释:符合物理事实的实特征值,特征空间的正交性,等等。H表象则给出一个先验解释:作为酉算子族U_t的“切算子”,更准确地说,无穷维酉群的Lie代数中的元素,iP必须是斜自共轭的。Wigner,Weyl等人采用这种观点来研究量子系统的“对称”。

一般来说,Lie括号[P,Q]=PQ-QP不等于0,这种非交换性在物理上体现为明显的非经典效应,即所谓的“测不准”。定义\Delta P=P-\overline{P},易见[P,Q]衡量了2种不同测量顺序导致的“误差”:[P,Q]=[\Delta P,\Delta Q]

[x,p]=i,这一天然限制反应到“测不准”上,给出经典的Heisenberg不确定性关系

\parallel \Delta x \psi\parallel_2 \parallel \Delta p \psi \parallel_2\geq \frac{1}{2}

W.Heisenberg (1901-1976)

上述讨论在很大程度上是形式的。困难大致有二:从S表象看,构型空间M是否紧致/有界将对P的谱产生重大影响;从H表象看,线性代数到算子代数的推广也绝非显然。这些困难大致上已被von Neumann的工作所消解,并写成名著 Mathematical Foundations of Quantum Mechanics。如何(彻底地)处理量子场论所引发的更严重的数学困难迄今尚无定论。