前面总结了有限群和有限群的表示理论,接着总结连续群的一些东西,参考的书还是那几本,如果有小伙伴发现我写错了请直接指出,谢谢!
群元素无穷多时为无限群。若是可数无穷则称为分立的,如果是不可数无穷,则称为连续的。与有限群不同,连续群常常和微分方程以及拓扑联系紧密。
先总结一下连续群和它的表示的一些基本概念和结论。
\(\def\vec#1{\boldsymbol{#1}}\) \(\def\bra#1{\langle#1|}\) \(\def\ket#1{|#1\rangle}\) \(\def\dirac#1#2{\langle#1|#2\rangle}\)连续群基本结论
维数
设一个参数集合\(\{a_i,\cdots,a_r\}\)能标明所有群元素,且用的参数数量最少,则参数个数\(r\)叫做连续群的维数,\(r\)个参数至少有一个是连续的。
比如,\(n\)个变量的齐次线性变换\[x'_i=\sum_{j=1}^na_{ij}x_j,|a_{ij}|\not=0\]所有此变换的集合为一个\(n^2\)个参数的连续群(\(n\)维线性群\(GL(n)\))。
参数空间和拓扑群
设群元可与\(r\)维实内积空间的某个子集\(S_r\)中的点建立一一映射关系,则\(S_r\)称为参数空间,群元\(x\)的参数空间对应点记为\(P(x)\).
有了参数空间,可以定义群元的邻域这一概念,群元\(x_0\)的邻域\(z_\varepsilon\)指的是满足\(|P(x)-P(x_0)|\leqslant\varepsilon\)的所有群元\(x\)的集合。
拓扑群的概念建立在此之上,拓扑群说的是:
考虑群合成\(x_1x_2=x_3\),对任意正数\(\varepsilon>0\),总可以找到实数\(\delta_\varepsilon\)使得\(x_2\)的邻域\(z_{\delta_\varepsilon}\)中的任何元素\(x\)都满足\(x_1x\)属于\(x_3\)的邻域\(z_\varepsilon\). 满足这个条件的连续群称为拓扑群。
换句话说,指的就是,对于群乘\(x_1x_2=x_3\)而言,\(x_2\)的微小变动只引起\(x_3\)的微小变动。
群的连通性
参数空间连同的群称为连通群。注意,连续群可以不连通。
李群及其生成元
设一个\(r\)维拓扑群\(G\)有\(\forall x_1,x_2\in G\),记为\(x_1=x_1(a_1,\cdots,a_r)\),\(x_2=x_2(b_1,\cdots,b_r)\),令\(x_3=x_1x_2=x_3(c_1,\cdots,c_r)\),令\(x_4=x_1^{-1}=x_4(d_1,\cdots,d_r)\),其中\(c_i,d_i\)都可以表示为\(a_i,b_i\)的函数\(c_i=c_i(a_1,\cdots,a_r;b_1,\cdots,b_r),d_i=d_i(a_1,\cdots,a_r)\).
如果对于群\(G\),存在单位元\(e\)的邻域\(N\),使得其中两元素\(x_1,x_2\)的乘积和逆都在\(N\)中,且满足函数\(c_i(a_1,\cdots,a_r;b_1,\cdots,b_r)\)和函数\(d_i=(a_1,\cdots,a_r)\)都是连续可微函数,则称群\(G\)为一个\(r\)维李群。
一般将李群的单位元\(e\)对应到参数空间\(S_r\)的原点\((0,\cdots,0)\),由于李群的解析性质,靠近单位元的群元写为\(x(0,\cdots,\varepsilon_j,\cdots,0)\approx x(0,\cdots,0)+i\varepsilon_jI_j\),其中\(I_j\)为一个算符,如果\(\varepsilon_j\)是一个无穷小量,则上式精确成立。其中算符\(I_j\)满足\[I_j=\lim_{\varepsilon_j\to0}\{\frac{1}{i\varepsilon_j}\left[x(0,\cdots,\varepsilon_j,\cdots,0)-x(0,\cdots,0)\right]\}\]对于距离单位元有限远的群元\(x(0,\cdots,a_j,\cdots,0)\)则利用群乘法来表达:令\(a_j=\varepsilon_jN\),其中\(\varepsilon_j\to0,N\to\infty\),进而有\[\begin{align}x(0,\cdots,a_j,\cdots,0)&=\lim_{\varepsilon_j\to0,N\to\infty}[x(0,\cdots,\varepsilon_j,\cdots,0)]^N\\&=\lim_{\varepsilon_j\to0,N\to\infty}[x(0,\cdots,0)+i\varepsilon_jI_j]^N\\&={\rm exp}(ia_jI_j)\end{align}\]推广到一般情况,则有\[x(a_1,\cdots,a_r)={\rm exp}\left(\sum_{j=i}^ria_jI_j\right)\]由上式可知,只要知道了算符\(\{I_j\}\)则李群各个元素都知道了,所以把这组算符叫做李群的生成元。\(r\)维李群就有\(r\)个生成元。
连续群的连续表示
设群\(G\)有表示\(\Gamma\),当\(x\to x'\)时,有\(\Gamma(x)\to\Gamma(x')\),则称表示\(\Gamma\)是一个连续表示。
对于李群而言,由于李群是一种拓扑群,所以当\(P(x)\to P(x')\)时,有\(\Gamma(x)\to\Gamma(x')\).
对于紧致连续群的连续表示,有以下结论:
- 任一表示都有等价的幺正表示;
- 任一幺正表示是可完全约化的;
- 任一不可约表示维数是有限的。
\(\ast\)所谓紧致连续群,是指连续群的参数空间是紧致的。所谓紧致,指的是空间闭且有界。所谓闭,指的是集合中任意柯西序列收敛于该集合。
轴转动群\(SO(2)\)
绕定轴的转动操作构成一个连续群。参数为转动角\(\varphi\),在\([0,2\pi]\)上取值,它是一个单参数、连通的、阿贝尔的、紧致的李群,记为\(SO(2)\),叫做轴转动群。其合成法则(群乘法)是\[T(\psi)T(\theta)= \begin{cases} T(\psi+\theta)& \psi+\theta<2\pi\\ T(\psi+\theta-2\pi)& \psi+\theta\geqslant2\pi \end{cases} \]群元的逆是\(T^{-1}(\varphi)=T(2\pi-\varphi)\),单位元是\(e=T(0)\).
若转轴设为\(z\)轴,则其对基矢\((\hat{\vec{x}},\hat{\vec{y}})\)的作用为\[(\hat{\vec{x}}',\hat{\vec{y}}')=(\hat{\vec{x}},\hat{\vec{y}})\begin{pmatrix} \cos\psi&-\sin\psi\\ \sin\psi&cos\psi \end{pmatrix}\]上面的矩阵是一个行列式等于1的实正交矩阵的一般形式。
\(\ast\)实正交矩阵是幺正矩阵在实数域的情况,因为另有复正交矩阵不属于幺正矩阵,所以强调一下实正交矩阵。
\(\ast\)注意,上式是主动观点的结果,被动观点的矩阵类似,只是角度差一个负号,这是因为被动观点把绕\(z\)轴对\(x-y\)平面转动\(\varphi\)理解为将\(x,y\)坐标轴绕\(-z\)转动\(\varphi\),因此相差一个负号(换句话说,如果在被动观点里把绕\(z\)轴对\(x-y\)平面转动\(\varphi\)理解为将\(x,y\)坐标轴绕\(-z\)转动\(-\varphi\),则矩阵和主动观点的一致,但是一般书中的被动观点都不这样做,所以始终和主动观点差一个负号)。
由上面的几何意义可知,\(T(\psi)\)与所有二维的行列式为\(1\)的实正交矩阵组成的群同构,从而该矩阵群可以作为其一个二维表示,把该矩阵群也记为\(SO(2)\).
\(SO(2)\)的类结构和不可约表示
\(SO(2)\)的类结构是很简单的,每个角度独自是一个类。至于\(SO(2)\)群的特征标\(\chi(\varphi)\),因为\(SO(2)\)是阿贝尔群,所以它的不可约表示一定是一维的,从而不可约表示的特征标就是不可约表示本身。由于群乘的定义中有\(f(x)f(y)=f(xy)\)的形式,只有指数函数有这个特性,所以\(\chi(\varphi)={\rm exp}(c\varphi)\),另一方面\(T(2\pi)=e\)所以有\(c=im\)其中\(m\)是整数,也就是说\(\chi(\varphi)={\rm exp}(im\varphi)\),每一个\(m\)值都代表一个不等价不可约表示。
而这时特征标正交性定理变为\[\int^{2\pi}_0\chi^{(m)*}(\varphi)\chi^{(m')*}(\varphi){\rm d}\varphi=2\pi\delta_{mm'}\]代入特征标以后变为\[\int_0^{2\pi}{\rm exp}[i(m-m')\varphi]{\rm d}\varphi=2\pi\delta_{mm'}\]积分直接验证上式,显然是成立的。
\(SO(2)\)的生成元
\(SO(2)\)是一个单参数的李群,所以只有一个生成元\(I\),\(I\)的算符形式已经由生成元的定义式给出了,要求该算符的具体形式要取决于研究的是哪个同构于\(SO(2)\)的具体的群。
例1:对于固定的整数\(m\),所有复数\(\{ {\rm exp}(im\varphi)\}\)同构于\(SO(2)\),按照生成元的定义式\[I=\lim_{\varphi\to0}\left\{\frac{1}{i\varphi}\left[{\rm exp}(im\varphi)-1\right]\right\}=m\]求出了生成元,就是\(m\),为验证,可以由生成元写出群元素的一般形式为\[{\rm exp}(i\varphi I)={\rm exp}(im\varphi)\]与原来形式一致。
例2:所有行列式为1的二阶正交矩阵构成的同构于\(SO(2)\)的群。此群元素的一般表达式为\[\begin{pmatrix} \cos\varphi&-\sin\varphi\\ \sin\varphi&\cos\varphi \end{pmatrix}\]于是生成元按照定义式为\[I=\lim_{\varphi\to0}\left\{\frac{1}{i\varphi}\left[ \begin{pmatrix} \cos\varphi&-\sin\varphi\\ \sin\varphi&\cos\varphi \end{pmatrix}-\begin{pmatrix} 1&0\\ 0&1 \end{pmatrix}\right]\right\}=\begin{pmatrix} 0&-i\\ i&0 \end{pmatrix}=\sigma_y\]这正是泡利矩阵中的一个。有了生成元就可以写出所有元素了,要验证的是\[\begin{pmatrix} \cos\varphi&-\sin\varphi\\ \sin\varphi&\cos\varphi \end{pmatrix}={\rm exp}(i\varphi\sigma_y)\]要验证上式,只需要把指数函数按照泰勒级数展开,分奇数偶数求和即可。
例3:设一个半径为\(a\)的圆,函数\(f(x)\)定义于圆周上,\(x\)为累计弧长,\(\hat{T}(\varphi)\)算符代表将\(f(x)\)绕圆心转一个角度\(\varphi\),即\(\hat{T}(\varphi)f(x)=f(x+a\varphi)\)。按照生成元的定义,把算符作用于函数\(f(x)\)上,有\[\begin{align}If(x)&=\lim_{\varphi\to0}\left\{\frac{1}{i\varphi}[\hat{T}(\varphi)f(x)-f(x)]\right\}\\&=\lim_{\varphi\to0}\left\{\frac{1}{i\varphi}[f(x+a\varphi)-f(x)]\right\}\\&=-ia\frac{\partial}{\partial x}f(x)\end{align}\]所以去除两边的测试函数\(f(x)\)有\[I=-ia\frac{\partial}{\partial x}=\frac{aP_x}{\hbar}\]其中\(P_x=-i\hbar\frac{\partial}{\partial x}\)是坐标表象下的的动量算符。群元写为\(\hat{T}(\varphi)={\rm exp}(ia\varphi P_x/\hbar)\).
例4:设\(f(x,y)\)是定义在\(x-y\)平面上的函数,引入算符\(\hat{T}(\varphi)\)使得\(x-y\)平面上的函数沿着\(z\)轴转动\(\varphi\)角度。于是\[\hat{T}(\varphi)f(x,y)=\hat{T}(\varphi)f({\bf r})=f(Q^{-1}{\bf r})=f(x\cos\varphi+y\sin\varphi,-x\sin\varphi+y\cos\varphi)\]按照生成元的定义\[\begin{align}If(x,y)&=\lim_{\varphi\to0}\left\{\frac{1}{i\varphi}[f(x\cos\varphi+y\sin\varphi,-x\sin\varphi+y\cos\varphi)-f(x,y)]\right\}\\&=-i\left(y\frac{\partial}{\partial x}-x\frac{\partial}{\partial y}\right)f(x,y)\end{align}\]求上面的那个极限有点麻烦,但可以用泰勒展开强行求极限。所以\[I=-i\left(y\frac{\partial}{\partial x}-x\frac{\partial}{\partial y}\right)=-L_z/\hbar\]而任意这种旋转变换可以统一表达为\[\hat{T}(\varphi)=\exp(-iL_z\varphi/\hbar)\]
正当转动群\(SO(3)\)
\(3\times3\)的实正交矩阵\(R\)(定义为\(RR^T=R^TR=E\))和三维实空间上的正交变换是什么关系?三维实空间上的正交变换是不改变矢量内积的线性变换。从而变换算符必然为幺正算符,幺正算符在正交归一基矢量下必然为幺正矩阵,又因为在实数域,所以是实正交矩阵。也就是说,三维实空间上的正交变换和\(3\times3\)的实正交矩阵是一一对应的关系。
考虑三维实矢量空间上所有正交变换的集合,显然它们构成一个群,记为\(O(3)\),用\(3\times3\)正交矩阵构成的群定义\(O(3)\)也可以,两者同构。
如果\(R\)为一个\(3\times3\)的正交矩阵,则必然满足\(RR^T=R^TR=E\)(这是定义),两边取行列式,得到\(det(R)^2=1\)从而\(det(R)=\pm1\). 可以验证行列式为\(1\)的那部分构成群,记为\(SO(3)\),其对应的转动称为正当转动(真转动);行列式为\(-1\)的那部分不构成群(称为非真转动),因为任意两个矩阵乘积的行列式为\(1\),不封闭。非真转动是真转动加上一个反演操作。
考虑到空间反演操作和任何转动都是对易的这一事实(反演就是把坐标\((x,y,z)\)映射到\((-x,-y,-z)\)用算符\(J\)表示),另一方面单位元\(E\)和\(J\)构成一个二阶群,所以有\(O(3)=SO(3)\otimes\{E,J\}\)
引入欧拉角如下图
其中\(ON\)称为节线。和\(SO(2)\)的表示类似,主动观点和被动观点得出的矩阵是不一样的。如果按照主动观点,为了从固定的\(xyz\)得到\(XYZ\)(状态记为\((\alpha,\beta,\gamma)\)),分三步进行:
- 按固定的\(z\)轴旋转\(\gamma\)角,记为\(Q({\bf \hat{z}},\gamma)\)
- 按固定的\(y\)轴旋转\(\beta\)角,记为\(Q({\bf \hat{y}},\beta)\)
- 按固定的\(z\)轴旋转\(\alpha\)角,记为\(Q({\bf \hat{z}},\alpha)\)
总的旋转为三者乘积\(Q(\alpha,\beta,\gamma)=Q({\bf \hat{z}},\alpha)Q({\bf \hat{y}},\beta)Q({\bf \hat{z}},\gamma)\).
其中\[Q({\bf \hat{z}},\gamma)=\begin{pmatrix} \cos\gamma&-\sin\gamma&0\\ \sin\gamma&\cos\gamma&0\\ 0&0&1 \end{pmatrix},Q({\bf \hat{y}},\beta)=\begin{pmatrix} \cos\beta&0&\sin\beta\\ 0&1&0\\ -\sin\beta&0&\cos\beta \end{pmatrix}\]而总的旋转算符为(喀兴林《高等量子力学》\({\rm P}_{293}\))\[Q(\alpha,\beta,\gamma)=\\ \begin{pmatrix} \cos\alpha\cos\beta\cos\gamma-\sin\alpha\sin\gamma&-\cos\alpha\cos\beta\sin\gamma-\sin\alpha\cos\gamma&\cos\alpha\sin\beta\\ \sin\alpha\cos\beta\cos\gamma+\cos\alpha\sin\gamma&-\sin\alpha\cos\beta\sin\gamma+\cos\alpha\cos\gamma&\sin\alpha\sin\beta\\ -\sin\beta\cos\gamma&\sin\beta\sin\gamma&\cos\beta \end{pmatrix}\] 如果是被动观点,则也是分三步得到\(XYZ\)
- 绕\(z\)轴旋转\(\alpha\)角
- 绕新\(y\)轴旋转\(\beta\)角
- 绕新\(z\)轴旋转\(\gamma\)角
总的变换为\(Q(\alpha,\beta,\gamma)=Q({\bf \hat{z}},\gamma)Q({\bf \hat{y}},\beta)Q({\bf \hat{z}},\alpha)\),注意这里的单个旋转矩阵和主动观点的已经不同了(角度差一个符号),乘积的顺序也不同。得到的矩阵为\[Q(\alpha,\beta,\gamma)=\\ \begin{pmatrix} \cos\alpha\cos\beta\cos\gamma-\sin\alpha\sin\gamma&\sin\alpha\cos\beta\cos\gamma+\cos\alpha\sin\gamma&-\sin\beta\cos\gamma\\ -\cos\alpha\cos\beta\sin\gamma-\sin\alpha\cos\gamma&-\sin\alpha\cos\beta\sin\gamma+\cos\alpha\cos\gamma&\sin\beta\sin\gamma\\ \cos\alpha\sin\beta&\sin\alpha\sin\beta&\cos\beta \end{pmatrix}\]恰好是上面主动观点矩阵的转置(另外,Joshi.$\S$4.3中的式4.43似乎是错的)。
\(SO(3)\)的生成元
设三维实空间中任意一个轴,以其单位矢量\(\hat{ {\bf u}}\)代表。对于固定的轴\(\hat{ {\bf u}}\),因为任意旋转\(Q(\hat{ {\bf u}},\varphi)\)构成的群同构于\(SO(2)\),因此可以根\(SO(2)\)的生成元直接推广得到\(I_{u}=-\hat{ { L}}_u/\hbar\),其中\(\hat{ { L}}_u\)是角动量矢量\(\hat{ {\bf L}}\)沿着单位矢量\(\hat{ {\bf u}}\)的投影,\(\hat{ { L}}_u=\hat{ {\bf L}}\cdot\hat{ {\bf u}}\).
让\(\hat{ {\bf u}}\)轴的选取任意,则任意的轴、任意的旋转角总能取遍每一个\(SO(3)\)的元素,所以\(SO(3)\)元素的一般形式可以写为\[R(\hat{ {\bf u}},\varphi)={\exp(-i\hat{ {\bf L}}\cdot\hat{ {\bf u}}\varphi/\hbar)}=\exp\left[-\frac{i}{\hbar}\varphi(L_xu_x+L_yu_y+L_zu_z)\right]\]根据上式,\(SO(3)\)的生成元显然是以下三个\(I_1=-\hat{ { L}}_x/\hbar\),\(I_2=-\hat{ { L}}_y/\hbar\),\(I_3=-\hat{ { L}}_z/\hbar\). 要注意的是,如果要展开算符的指数函数,要小心三个叫动量算符不对易:\[[L_i,L_j]=\sum_ki\hbar\varepsilon_{ijk}L_k\]
\(SO(3)\)的类结构和特征标
考虑绕两个定轴\(\hat{ {\boldsymbol{u}}},\hat{ {\boldsymbol{v}}}\)的转动\(Q(\hat{\boldsymbol{u}},\varphi),Q(\hat{\boldsymbol{v}},\varphi)\),其中转动角度相同。因为\(SO(3)\)中必有元素将\(\hat{ {\boldsymbol{u}}}\)轴转动到\(\hat{\boldsymbol{v}}\)轴,所以转动\(Q(\hat{ {\boldsymbol{u}}},\varphi)\)和\(Q(\hat{\boldsymbol{v}},\varphi)\)共轭(前一篇最后面列出了共轭元素的求法),由此可推得绕所有轴的同一角度的转动都是共轭的,组成一个类。
求特征标需要先求出表示。求表示的一种方法是(还有一种方法,用在\(SU(2)\)那里):对于给定的群\(Q\),找一组基矢量,使得这组基矢量在群元的变换下称为自身的线性组合,则线性变换的矩阵就是群\(Q\)的表示。对于\(SO(3)\)群而言,对于给定\(l\)的\((2l+1)\)个球谐函数\(Y_{l,m}(\theta,\varphi),(m=-l,\cdots,l)\)满足在群元的变换下(三维旋转)变成自己的线性组合(这一点的数学证明在后面)。从而球谐函数\(Y_{l,m}(\theta,\varphi),(m=-l,\cdots,l)\)可以作为一组基来生成\(SO(3)\)的一个表示。因为特征标是类的函数,所以只需要求出\(Q(\hat{\boldsymbol{z}},\varphi)\)的特征标就可以了。
对\((2l+1)\)个球谐函数而言,生成的是\((2l+1)\)维表示。因为球谐函数表达式为\[Y_{l,m}(\theta,\varphi)=C_{l,m}\exp(im\varphi)\frac{1}{\sin^n\theta}\left(\frac{d}{d\cos\theta}\right)^{l-m}\sin^{2l}\theta\]所以\(Q(\hat{\boldsymbol{z}},\alpha)Y_{l,m}(\theta,\varphi)=Y_{l,m}(\theta,\varphi-\alpha)=\exp(-im\alpha)Y_{l,m}(\theta,\varphi)\)对比等式最左边和最右边,有\[[Q(\hat{\boldsymbol{z}},\alpha)]_{nm}=\delta_{nm}\exp(-im\alpha),m,n=-l,\cdots,l\]从而\[[Q(\hat{\boldsymbol{z}},\alpha)]= \begin{pmatrix} e^{il\alpha}&&&\\ &e^{i(l-1)\alpha}&&\\ &&\cdots&\\\ &&&&e^{-il\alpha} \end{pmatrix}\]所以特征标\[\chi^{(l)}(\alpha)=\sum_{m=-l}^le^{im\alpha}=\frac{\sin(l+\frac{1}{2})\alpha}{\sin\frac{\alpha}{2}}\]
这是利用了特征标是类的函数这一特点,只从绕\(z\)轴的变换就求出了全部特征标表达式。上面的矩阵只是绕\(z\)轴旋转时\(Y_{l,m}\)的变换矩阵,对于一般情况,形式上为\[Q(\alpha,\beta,\gamma)Y_{l,m}(\theta,\varphi)=\sum_{m'=-l}^lY_{l,m}(\theta,\varphi)D_{m'm}^{(l)}(\alpha,\beta,\gamma)\]矩阵\(D_{m'm}^{(l)}(\alpha,\beta,\gamma)\)的形式后面通过\(SU(2)\)的表示来求出。如果直接通过对球谐函数的变换来求,自然也是可以的。SU(2)群
\(SO(3)\)群是三维实空间的正当转动群,与此类似,\(SU(2)\)是二维复空间的“转动群”。设\(\psi,\varphi\)是二维复空间中的一对正交归一矢量,“旋转操作”使得它们中的任一个都变成它们的线性组合\[(\psi',\varphi')=(\psi,\varphi)\begin{pmatrix} a&b\\c&d \end{pmatrix}\]其中矩阵\[u(a,b,c,d)=\begin{pmatrix} a&b\\c&d \end{pmatrix}\]含有4个复变量,也就是8个实变量。现在对旋转操作施加要求:不改变内积。这要求变换算符\(u\)是幺正算符,在此表象下,矩阵\(u(a,b,c,d)\)必然是幺正矩阵。可以证明加入这一要求,实变量缩减到4个:采用列向量形式,变换前\(\lambda=(\lambda_1,\lambda_2)^T\),变换后\(\lambda'=(\lambda'_1,\lambda'_2)^T\)作内积使之在变换前后不变,则有\[|\lambda_1|^2+|\lambda_2|^2=|\lambda'_1|^2+|\lambda'_2|^2\]展开上式,令等式左右两边\(\lambda_1\lambda_1^*,\lambda_2\lambda_2^*,\lambda_1\lambda_2^*,\lambda_1^*\lambda_2\)四项的系数相等,得出\[aa^*+cc^*=1\\bb^*+dd^*=1\\ab^*+cd^*=0\]这三个方程,前两个是实方程,后一个是复方程,一共相当于4个实方程,将8个实变量缩减为4个。
这里有一个问题,上面只是利用了一个矢量\(\lambda\)便把实变量缩减到了4个,如果使用两个矢量作内积会不会把变量数目缩减到更少?不会。因为可以证明如果对于任意矢量\(|\lambda\rangle\)都有\(\langle\lambda|A|\lambda\rangle=\langle\lambda|\lambda\rangle\)则\(A=E\),所以使用两个矢量作内积并不会给出更多信息。
满足上面条件的变换构成一个群,记为\(U(2)\),矩阵群与变换群同构,都记为\(U(2)\),它是一个4参数群。因为是幺正矩阵,其行列式的模必为\(1\),抽取其中矩阵行列式为\(1\)的元素,它们也构成一个群,记为\(SU(2)\)。由于加入了行列式为1这一条件,实变量缩减为\(3\)个,所以群\(SU(2)\)为一个3参数群。
现在要写出矩阵群\(SU(2)\)的一般表达式。因为\(SU(2)\)定义是行列式为1的幺正矩阵集合,所以可以验证下面的形式满足这一定义\[u(a,b)=\begin{pmatrix} a&b\\-b^*&a^* \end{pmatrix},aa^*+bb^*=1\]除此以外,还可以得到另一种一般的表达式,在上面基础上,作代换\[a=me^{-i\xi},b=-ne^{-i\zeta},m=\cos\eta,n=\sin\eta\]得到\[u(\xi,\zeta,\eta)=\begin{pmatrix} e^{i\xi}&-e^{-i\zeta}\sin\eta\\ e^{-i\zeta}\sin\eta&e^{i\xi}\cos\eta \end{pmatrix},\xi\in[0,2\pi],\zeta\in[0,2\pi],\eta\in[0,\frac{\pi}{2}]\]上面的两种一般表示后面都有用到。
\(SU(2)\)的生成元
一个\(2\)阶幺正矩阵有\(4\)个独立的实参数,所以\(U(2)\)群有\(4\)个生成元。
幺正矩阵的行列式的模是\(1\),群\(SU(2)\)是\(U(2)\)中行列式为\(1\)的子群。根据前面的分析,因为\(SU(2)\)群只有\(3\)个独立实参数,所以其生成元只有3个。
定理:\(H\)为厄米矩阵的充要条件为\(\exp(iH)\)是幺正矩阵
所以如果\(U\)是幺正矩阵,则必然可以写为\(U=\exp(iH)\),其中\(H\)为厄米矩阵。因为厄米矩阵的实线性组合还是厄米矩阵,所以由\(U\)中有\(4\)个独立实变量可以推得有且仅有\(4\)个二阶线性独立的厄米矩阵(这里把厄米矩阵看做空间基矢,空间是一个实系数空间)。这样,\(U\)可以写成下面形式\[U=\exp\left[i\sum_{j=1}^4a_jH_j\right]\]其中\(H_j,j=1,2,3,4\)是线性独立的二阶厄米矩阵。从群元的角度来看,上面四个矩阵\(H_j\)就是群\(U(2)\)的生成元,显然,生成元并非唯一的,可以换成另外四个线性独立的厄米矩阵。
因为\(det(e^A)=e^{Tr(A)}\)(证明很容易,利用Taylor展开,再将\(A\)对角化即可证明,注意对角化不改变行列式和迹),所以如果给\(U(2)\)群附加上行列式为\(1\)的要求,则等于要求矩阵\(\sum_{j=1}^4a_jH_j\)的迹为\(0\),而\(H_j\)是线性独立的,所以等于要求每个\(H_j\)都是迹\(0\)的,另一方面,线性独立的二阶迹\(0\)的厄米矩阵只有\(3\)个,所以只要给\(U(2)\)加上行列式为\(1\)这个要求,则生成元只有\(3\)个,它们是线性独立的二阶迹\(0\)厄米矩阵。这和上面说的\(SU(2)\)是3参数群是符合的。
这三个线性独立的二阶迹\(0\)厄米矩阵可以取为泡利矩阵\[\sigma_x= \begin{pmatrix} 0&1\\1&0 \end{pmatrix},\sigma_y= \begin{pmatrix} 0&-i\\i&0 \end{pmatrix},\sigma_z= \begin{pmatrix} 1&0\\0&-1 \end{pmatrix}\]它们是\(SU(2)\)的生成元,显然生成元并非唯一的,三个泡利矩阵的线性组合也可以作为生成元。
同样的,用三个泡利矩阵加上一个二阶单位阵,这四个矩阵是\(U(2)\)的生成元。
\(SU(2)\)的类结构
先从一般形式\(u(a,b)\)入手,设\(\lambda\)是其本征值,则有本正方程\[\lambda^2-(a+a^*)\lambda+1=0\]得到\(\lambda=(\beta\pm\sqrt{\beta^2-4})/2\)其中\(\beta=a+a^*\)是一个实数,仅仅取决于\(Re[a]\)。既然在\(u(a,b)\)的一般形式中有\(|a|^2+|b|^2=1\)则\(Re[a]\in[-1,1]\)从而\(\beta\in[-2,2]\)所以\(\lambda\)两个根是一对共轭复根。另一方面\(\lambda_1\lambda_2=1\)所以两个\(\lambda\)都是模为\(1\)的。作变量代换\[\cos\frac{\alpha}{2}=\frac{\beta}{2},\sin\frac{\alpha}{2}=\sqrt{1-\frac{\beta^2}{4}}\]其中\(\alpha\)也是实数,也仅仅取决于\(Re[a]\),代换以后得到\(\lambda=\exp(\pm i\alpha/2)\)仅仅取决于\(Re[a]\),进一步,因为本征值相等的矩阵是相似的(共轭的),而本征值仅仅取决于\(Re[a]\),所以所有\(a\)实部相等的元都是属于同一类。
\(SU(2)\)的其他表示
生成一个群\(\{\hat{Q}\}\)的表示,除了前面的那种方法,还可以这么做:群\(\{\hat{Q}\}\)在线性空间\(S\)中使得其中基矢量变换,设函数\(f({\bf r})\)自变量\({\bf r}\)来自于空间\(S\),算符群\(\{\hat{D}(Q)\}\)的元\(\hat{D}(Q)\)作用在函数\(f({\bf r})\)上使其变换,如果能找到这样的一组函数\(\{f_i({\bf r})\}\)作为基函数生成函数空间\(F\),则基函数们在\(F\)中生成群\(\{\hat{D}(Q)\}\)的表示\(D(Q)\)。因为群\(\{\hat{D}(Q)\}\)与群\(\{\hat{Q}\}\)同态,所以表示\(D(Q)\)也是群\(\{\hat{Q}\}\)的表示。
为此,在二维复矢量空间中,对于任一个矢量\({\bf r}\),写成列向量的形式\({\bf r}=(\xi,\eta)^T\),其中\(\xi,\eta\)是分量系数,是复数。现在要找\({\bf r}\)的一组函数(也就是关于复数\(\xi,\eta\)的二元函数),使得函数在\(\{\hat{D}(u)\}\)的变换下变成自己的线性组合(封闭性)。因为变换\(u(a,b)\)是\(\xi,\eta\)的齐次线性变换,所以可以考虑\(f\)为\(\xi,\eta\)的齐次多项式,因为\(\xi,\eta\)的齐次多项式们经过\(\xi,\eta\)的齐次线性变换后还是\(\xi,\eta\)的齐次多项式。例如\(\xi\eta\)和\(\xi^2\)经过\(u(a,b)\)的变换以后分别成为\((a^*\xi-b\eta)(b^*\xi+a\eta)\)和\((a^*\xi-b\eta)^2\)(注意\(\hat{D}(u)f({\bf r})=f(u^{-1}{\bf r})\)),它们仍然是\(\xi,\eta\)的齐次多项式。
注意,\(2j\)次多项式有\((2j+1)\)个线性无关项,它们是\(\xi^{j-m}\eta^{j+m},m=-j,\cdots,j\),从而\(2j\)次多项式可以作为一个封闭的\(2j+1\)维函数空间。这里\(j\)可以为整数,也可以为半整数。
上面的\(2j+1\)组基函数已经可以生成\(\{\hat{D}(u)\}\)(从而\(\{u\}\))的表示了,但是为了表示是不可约的幺正表示,对上面的基函数添加一组系数,使之成为\[f_{j,m}(\xi,\eta)=\frac{\xi^{j-m}\eta^{j+m}}{\sqrt{(j-m)!(j+m)!}}\]则\[\begin{align}f'_{j,m}(\xi,\eta)&=\hat{D}(u)f_{j,m}(\xi,\eta)=f_{j,m}(a^*\xi-b\eta,b^*\xi+a\eta)\\&=\frac{(a^*\xi-b\eta)^{j-m}(b^*\xi+a\eta)^{j+m}}{\sqrt{(j-m)!(j+m)!}}\end{align}\]继续把上式右端按照\(f_{j,m}(\xi,\eta)\)展开\[\hat{D}(u)f_{j,m}(\xi,\eta)=\sum_{m=-j}^jf_{j,m'}(\xi,\eta)D^{(j)}_{m'm}(u)\]观察上式的形式,\(D^{(j)}_{m'm}(u)\)就是群\(\{\hat{D}(u)\}\)的\((2j+1)\)维表示,从而也是\(SU(2)\)群的\((2j+1)\)维表示。
利用二项式展开,代换求和指标最后的化简结果是
\[\begin{align}&D_{m'm}^{(j)}(a,b)=D_{m'm}^{(j)}(u(a,b))\\&=\sum_n\frac{\sqrt{(j-m)!(j+m)!(j-m')!(j+m')!}}{(j+m'-n)!(j-m-n)!(n+m-m')!n!}a^{j+m'-n}(a^*)^{j-m-n}b^n(-b^*)^{n+m-m'}\end{align}\]其中求和指标\(n\)的取值范围是所有使得所有分母阶乘都不为负数的一切整数。可以证明表示\(D_{m'm}^{(j)}(a,b)\)是幺正的(因为函数空间里没有定义内积,所以得用幺正矩阵的定义来证明),它们(\(j\)取正整数和半正整数)都是不可约表示(用到舒尔引理),且它们是\(SU(2)\)的所有不可约表示。前面已知的二维表示已经被此纳入,此时\(j=1/2\),基函数正是\(\xi\)和\(\eta\)本身,显然矩阵与前面的一致。
从\(SU(2)\)到\(SO(3)\)的同态
\(SO(3)\)和\(SU(2)\)都是3参数群,它们之间是同态关系。
为建立两群关系,先试着找\(SU(2)\)群元\(u\)对三维实空间中矢量\({\bf r}\)的变换,看看它是不是等价于某个\(SO(3)\)元素的变换。但是\(SU(2)\)元素是二维幺正矩阵,为此必须找到一个对应法则,将三维实空间中的矢量映射成为一个二维复矩阵\(h\)再经受\(u\)的变换。具体如下:把\(\bf r\)映射为一个二维复矩阵\(h\),\(SU(2)\)群元\(u\)作用于\(h\)使其变换,再通过对应法则将\(h'\)映射为\(\bf r'\),这样\(u\)就完成了对\(\bf r\)的变换。
现在假设\(h\)是一个二维复矢量空间的迹\(0\)厄米算符,它和三维实空间的矢量\({\bf r}\)之间的一一对应关系为\[h=\boldsymbol{\sigma\cdot r}=\begin{pmatrix} z&x-iy\\x+iy&-z \end{pmatrix}\]当\(SU(2)\)群元\(u\)对\(h\)作幺正变换时,产生一个新算符\(h'=uhu^{-1}\),易证\(\bf r'\)也是迹\(0\)的厄米矩阵,因而\(h'\)又对应着一个新的三维实空间中的矢量\(\bf r'\) \[h'=\boldsymbol{\sigma\cdot r'}=\begin{pmatrix} z'&x'-iy'\\x'+iy'&-z' \end{pmatrix}\]由于\(\det(h')=\det(uhu^{-1})=\det(h)\)所以\(x'^2+y'^2+z'^2=x^2+y^2+z^2\)从而可以说\(SU(2)\)群元\(u\)对任意\(\bf r\)矢量的变换是“不改变矢量模”的,因此必与\(SO(3)\)某一个群元等价,把对应的这个旋转记为\(Q(u)\),表达如下式\[u\boldsymbol{\sigma}\cdot{\bf r}u^{-1}=\boldsymbol{\sigma}\cdot[Q(u){\bf r}]\]对于接连两次变换\(u_1u_2\),则有\[\begin{align}(u_1u_2)\boldsymbol{\sigma}\cdot{\bf r}(u_1u_2)^{-1}&=u_1u_2\boldsymbol{\sigma}\cdot{\bf r}u_2^{-1}u_1^{-1}\\&=u_1\boldsymbol{\sigma}\cdot[Q(u_2){\bf r}]u_1^{-1}\\&=\boldsymbol{\sigma}\cdot[Q(u_1)Q(u_2)]{\bf r}\\&=\boldsymbol{\sigma}\cdot Q(u_1u_2){\bf r}\end{align}\]最后一个等号是直接由最左边得出的。观察上式最后一个等号两边,前面说过,泡利矩阵是线性独立的,所以等号左右两边三个分量一一对应相等,从而对任意\({\bf r}\)有\(Q(u_1)Q(u_2){\bf r}=Q(u_1u_2){\bf r}\)这正表明\(SU(2)\)与\(SO(3)\)是同态关系。
既然从\(SU(2)\)到\(SO(3)\)是一个同态,那是几对几的同态关系?也就是说,对任意\({\bf r}\),会不会存在不止一个\(u\)对\({\bf r}\)的变换是相同的?不妨设\(u_1\)对\({\bf r}\)进行的变换和\(u\)是相同的,即\(u_1\boldsymbol{\sigma}\cdot {\bf r}u_1^{-1}=u\boldsymbol{\sigma}\cdot{\bf r}u^{-1}\)上式变形为\[u^{-1}u_1\boldsymbol{\sigma}\cdot{\bf r}=\boldsymbol{\sigma}\cdot{\bf r}u^{-1}u_1\]上式表明\(\boldsymbol{\sigma}\cdot{\bf r}\)和\(u^{-1}u_1\)对易。另一方面因为泡利矩阵是线性独立的迹\(0\)厄米矩阵,所以\(\boldsymbol{\sigma}\cdot{\bf r}\)由\({\bf r}\)的任意性,可以取到全体迹\(0\)的厄米矩阵。可以使用简单的特例来证明,满足这种对易特性的矩阵\(u^{-1}u_1\)只能是正负单位阵。所以要么\(u_1=u\)要么\(u_1=-u\).
所以\(SU(2)\)和\(SO(3)\)是二对一的同态关系。
由\(SU(2)\)的表示生成\(SO(3)\)的表示
前面已经证明了\(SU(2)\)和\(SO(3)\)的同态关系,给定一个\(SU(2)\)元对应一个\(SO(3)\)元,给定一个\(SO(3)\)元对应两个\(SU(2)\)元.
先看两个例子,在\(u(a,b)\)形式中,代入\(a=\exp(-i\alpha/2),b=0\)得到\[u(e^{-i\alpha/2},0)=\begin{pmatrix} e^{-i\alpha/2}&0\\ 0&e^{-i\alpha/2} \end{pmatrix}\]从而\[h'=u(e^{-i\alpha/2},0)hu^{-1}(e^{-i\alpha/2},0)=\begin{pmatrix} z&(x-iy)e^{-i\alpha}\\ (x+iy)e^{i\alpha}&-z \end{pmatrix}\]对应的\({\bf r'}\)点为\[x'=x\cos\alpha-y\sin\alpha\\y'=x\sin\alpha+y\cos\alpha\\z'=z\]这恰好是绕\(z\)轴\(\alpha\)角的变换\(Q({\bf\hat{z}},\alpha)\). 同理可证明\(u(\cos\beta/2,-\sin\beta/2)\)对应旋转\(Q({\bf\hat{y}},\beta)\).
从而得出\(SU(2)\)的元\[\begin{align}u(\alpha,\beta,\gamma)&=u(e^{-i\alpha/2},0)u(\cos\beta/2,-\sin\beta/2)u(e^{-i\gamma/2},0)\\&= \begin{pmatrix} e^{-i\frac{\alpha+\gamma}{2}}\cos\frac{\beta}{2}&-e^{-i\frac{\alpha-\gamma}{2}}\sin\frac{\beta}{2}\\ e^{i\frac{\alpha-\gamma}{2}}\sin\frac{\beta}{2}&e^{i\frac{\alpha+\gamma}{2}}\cos\frac{\beta}{2} \end{pmatrix}\end{align}\]对应于\(SO(3)\)的元\(Q(\alpha,\beta,\gamma)\). 对比\(SU(2)\)的另一种一般形式\(u(\xi,\zeta,\gamma)\)可知\[\alpha\in[0,4\pi]\\ \beta\in[0,\pi]\\ \gamma\in[0,2\pi]\]换句话说,对于\(u(\alpha,\beta,\gamma)\)而言,三个参数必须要取遍上面的范围,才能遍历所有的\(SU(2)\)群元。但是另一方面,对于\(SO(3)\)群元\(Q(\alpha,\beta,\gamma)\)而言,其三个参数是欧拉角,\(\beta,\gamma\)两个角取值范围和\(SU(2)\)一样,但是其$\alpha \(取值范围是\)[0,2\pi]\(只有上面范围的一半。因为对于欧拉角而言,\)\alpha$等于\(2\pi\)便是等于\(0\),大于\(2\pi\)就是重新从\(0\)开始取,所以\(\alpha=5/2\pi\)的矩阵等价于\(\alpha=1/2\pi\)的矩阵。然而这对\(SU(2)\)来说却是两个矩阵。所以这里有二对一的同态关系。顺便注意,由上面矩阵不难计算\(u(\alpha+2\pi,\beta,\gamma)=-u(\alpha,\beta,\gamma)\),而这正是上面的结论。
这时如果对\(SO(3)\)群稍作修改,原本的\(Q(2\pi,0,0)=Q(0,0,0)=E\)现在令\(Q(2\pi,0,0)=\overline{E}\not=E=Q(0,0,0)\),其中\(\overline{E}\)是新加入的元素,这个群记为\(SO(3)'\),称为泛覆盖群,它与\(SU(2)\)现在是同构的了。
前面说的是\(SU(2)\)和\(SO(3)\)的群的关系。现在来说表示,看能不能根据\(SU(2)\)的表示\(D^{(j)}_{m'm}(a,b)\)来找到\(SO(3)\)的表示。前面已经求出来了和\(Q(\alpha,\beta,\gamma)\)对应的\(u(\alpha,\beta,\gamma)\)矩阵形式了,对照\(SU(2)\)矩阵的\(u(a,b)\)形式的一般表达式,知\[a=e^{-i\frac{\alpha+\gamma}{2}}\cos\frac{\beta}{2}\\b=-e^{-i\frac{\alpha-\gamma}{2}}\sin\frac{\beta}{2}\]把\(a,b\)代入\(D^{(j)}_{m'm}(a,b)\)表达式,得到\(D^{(j)}_{m'm}(\alpha,\beta,\gamma)\),它就是\(SO(3)\)的表示\[D^{(j)}_{m'm}(\alpha,\beta,\gamma)=(-1)^n\sum_n\frac{\sqrt{(j-m)!(j+m)!(j-m')!(j+m')!}}{(j+m'-n)!(j-m-n)!(n+m-m')!n!}\\e^{-im'\alpha}\left(\cos\frac{\beta}{2}\right)^{2j+m'-m-2n}\left(\sin\frac{\beta}{2}\right)^{2n+m-m'}e^{-im\gamma}\]
因为前面已经指出\(u(\alpha+2\pi,\beta,\gamma)=-u(\alpha,\beta,\gamma)\),在表示矩阵这里,\(D^{(j)}_{m'm}(\alpha+2\pi,\beta,\gamma)\)会是什么呢?由上面的表示矩阵元的通项,很容易得到:当\(j\)为整数时,\(D^{(j)}_{m'm}(\alpha+2\pi,\beta,\gamma)=D^{(j)}_{m'm}(\alpha,\beta,\gamma)\),当\(j\)为半整数时\(D^{(j)}_{m'm}(\alpha+2\pi,\beta,\gamma)=-D^{(j)}_{m'm}(\alpha,\beta,\gamma)\),也就是说当\(j\)为整数时\(D(u)=D(-u)\),当\(j\)为半整数时,\(D(u)=-D(-u)\).
总结如下:
- 当\(j\)为整数时,\(SU(2)\)和\(SO(3)\)二对一同态,\(SU(2)\)与\(D(\alpha,\beta,\gamma)\)二对一同态,\(D(\alpha,\beta,\gamma)\)为\(SO(3)\)元素\(Q(\alpha,\beta,\gamma)\)的表示。
- 当\(j\)为半整数时,\(SU(2)\)和\(SO(3)\)二对一同态,\(SU(2)\)与\(D(\alpha,\beta,\gamma)\)不是二对一同态,把\(\alpha\)限制在\([0,2\pi]\)中\(D(\alpha,\beta,\gamma)\)才是\(SO(3)\)的表示。
表示的基矢
上面求出了表示\(D(\alpha,\beta,\gamma)\)但是基矢是什么?具有怎样的物理意义?
在前面\(SO(2)\)群那里例4,讲到了对于定义在\(x-y\)平面上的函数\(f(x,y)\)使之绕\(z\)轴旋转\(\varphi\)角的算符可以统一表达为\[\hat{T}(\varphi)=\exp(-iL_z\varphi/\hbar)\]现在直接推广到(证明也很简单,仿照那个就行)三维实空间(位形空间)里,这里使得任何定义在三维\(x-y-z\)空间里的函数\(f(x,y,z)\)绕\(\boldsymbol{\hat{n}}\)轴旋转\(\varphi\)角的算符可以写为\(\hat{D}(\boldsymbol{\hat{n}},\varphi)=\exp\left(-\frac{i}{\hbar}\boldsymbol{J}\cdot {\boldsymbol{\hat{n}}}\varphi\right)\)(\(\hat{Q}\)对位形空间矢量作用,\(\hat{D}\)对定义在位形空间上的函数\(f\)作用,\(\boldsymbol{J}\)表示一般的角动量算符),也把\(\hat{D}(\boldsymbol{ \hat{n}},\varphi)\)写成欧拉角形式\(\hat{D}(\alpha,\beta,\gamma)\). 则有\(\hat{D}(0,0,\varphi)=\exp\left(-\frac{i}{\hbar}J_z\varphi\right)\),可求得其矩阵为\(D^{(j)}_{m'm}(0,0,\varphi)=\delta_{m'm}e^{-im\varphi}\).
设\(|j,m\rangle\)为标号为\(j\)的不可约表示\(D^{(j)}\)的标号为\(m\)的基矢量。
则应该有\[\hat{D}(\alpha,\beta,\gamma)|j,m\rangle=\sum_{m'=-j}^j|j,m'\rangle D^{(j)}_{m'm}(\alpha,\beta,\gamma)\]于是\[\hat{D}(0,0,\varphi)|j,m\rangle=\exp(-\frac{i}{\hbar} J_z\varphi)|j,m\rangle=e^{-im\varphi}|j,m\rangle\]上式对\(\varphi\)求导,再令其为\(0\)得到\[J_z|j,m\rangle=m\hbar|j,m\rangle\]同样的方法,先求出矩阵\(D(0,\beta,0)^{(j)}_{m'm}\)再如法炮制,可得\[J_y|j,m\rangle=-\frac{i\hbar}{2}\sqrt{(j-m)(j+m+1)}|j,m+1\rangle+\frac{i\hbar}{2}\sqrt{(j+m)(j-m+1)}|j,m-1\rangle\\J_x|j,m\rangle=\frac{\hbar}{2}\sqrt{(j-m)(j+m+1)}|j,m+1\rangle+\frac{\hbar}{2}\sqrt{(j+m)(j-m+1)}|j,m-1\rangle\]后面两个式子得到\[(J_x\pm iJ_y)|j,m\rangle=\hbar\sqrt{(j\mp m)(j\pm m+1)}|j,m\pm1\rangle\]利用\[J^2=J_+J_-+J_z^2-\hbar J_z\]可得\[J^2|j,m\rangle=j(j+1)\hbar^2|j,m\rangle\]所以矢量\(|j,m\rangle\)是算符\(J^2\)和算符\(J_z\)共同本征矢量,也就是角动量算符\(\boldsymbol{J}\)的本征矢量。
当\(j\)取整数时,本征矢量\(|j,m\rangle\)在坐标表象下就是球谐函数\(Y_{l,m}(\theta,\phi)\),所以前面说“\((2j+1)\)个球谐函数在\(SO(3)\)群元的作用下变成自己的线性组合”。
\(U(n)\)和\(SU(n)\)生成元
\(U(n)\)为\(n\)阶幺正矩阵群,参数个数为\(n^2\)。本应该有\(2n^2\)个实参数,但是有\(n^2\)个被幺正算条件消耗掉了:设\(U\in U(n)\)有\(\sum_jU_{ij}U_{kj}^*=\delta_{ik}\)其中\(i,k=1,2,\cdots,n\),这样的等式有\(n^2\)个。所以\(U(n)\)群有\(n^2\)个生成元。
所以不难推测\(SU(n)\)群有\((n^2-1)\)个生成元,因为行列式为\(1\)用去一个。
模仿前面对\(U(2)\)的套路,设\(U\in U(n)\)则由于\(U=\exp(iH)\),而\(U\)有\(n^2\)个参数,所以线性独立的\(n\)阶厄米矩阵最多也只有\(n^2\)个(由\(n\)阶厄米矩阵张成的实系数线性空间维数为\(n^2\)).
若\(U\in SU(n)\),则有\(1=\det(U)=\exp[i\sum a_jTr(H_j)]\)右侧指数部分的各个厄米矩阵都是线性独立的,要其迹的和为\(0\)就是要每个厄米矩阵都是迹\(0\)的。而左侧\(U\)只含\((n^2-1)\)个参数,所以对照右侧,得出结论:\(n\)阶线性独立的厄米矩阵最多只有\((n^2-1)\)个。模仿前面对\(SU(2)\)的做法,可以证明它们是\(SU(n)\)的生成元。
对于\(U(n)\)的生成元,只需要在\(SU(n)\)的生成元(线性独立的\(n\)阶厄米矩阵)上再找出一个与它们都线性无关的\(n\)阶厄米矩阵就可以了,可以选作\(n\)阶单位阵。
李代数的一些概念
具有\(r\)个参量\(\{a_1,\cdots,a_r\}\)的李群生成元设为\(\{I_1,I_2,\cdots,I_r\}\)则群元一般表达式为\[x(a_1,\cdots,a_r)=\exp\left(i\sum^r_{j=1}a_jI_j\right)\]由上式可知,生成元并非唯一的,生成元的适当线性组合也可以作为生成元。
对于有限群,其结构完全由乘法表决定。对于李群,可以证明,其结构由生成元的对易式完全决定。
对两个元素\(x_1=\exp(ia_kI_k),x_2=\exp(ia_lI_l)\),其乘积\(x_1x_2=\exp(ia_kI_k)\exp(ia_lI_l)\)由于\([I_k,I_l]\)不一定为零而难以展开,但是一定可以写成\[\exp(ia_{k,l}[I_k,I_l]+\cdots)\]的形式,因此对易式\([I_k,I_l]\)必然可以写为生成元的线性组合\[[I_k,I_l]=\sum^r_{j=1}c_j^{(k,l)}I_j\]其中\(c_j^{(k,l)}\)称为李群的结构常数。对于给定的生成元算符,一个李群的的结构常数是确定的,不因为算符的具体形式而改变(算符矩阵的维数),但是结构常数并非唯一的,因为生成元算符本身就不是唯一的。因为生成元的实系数组合仍然是生成元,所以在更高的抽象层次上可以把生成元作为基矢而张成实系数线性空间。同时可以把对易式\([I_k,I_l]\)视为一种二元合成法则,它产生一个矢量,该矢量仍处于此空间中。事实上这符合李代数的定义。
李代数是被赋予某种二元合成法则的\(r\)维实系数线性空间\(L\),合成法则满足以下条件:
- \([x,y]\in L\)
- \([x,y]=-[y,x]\)
- \([x,[y,z]]+[y,[z,x]]+[z,[x,y]]=0\)
恰好对易式这种二元合成法则满足上面三条关系。因此线性独立的\(r\)个李群的生成元是其对应的李代数的一组基。
李代数有什么用?李代数可以生成李群的一个表示。具体做法如下:
如果找到\(r\)个\(p\)阶方阵\(\{I_j\}\)满足\[[I_k,I_l]=\sum^r_{j=1}c_j^{(k,l)}I_j\]其中\(c_j^{(k,l)}\)为某\(r\)维李群的结构常数,则若把这\(r\)个\(p\)阶方阵\(\{I_j\}\)作为生成元,就能得到该李群的一个\(p\)维表示。例如对于\(SU(2)\)群而言,其生成元可以选作三个泡利矩阵,满足的对易关系为\[[\sigma_i,\sigma_j]=2i\sum_{ij}\varepsilon_{ijk}\sigma_k\]其结构常数为\(c_k^{(i,j)}=2i\varepsilon_{ijk}\)。现在又发现矩阵组\[\lambda_1=\begin{pmatrix}0&1&0\\1&0&0\\0&0&0\end{pmatrix},\lambda_2=\begin{pmatrix}0&-i&0\\i&0&0\\0&0&0\end{pmatrix},\lambda_3=\begin{pmatrix}1&0&0\\0&-1&0\\0&0&0\end{pmatrix}\]也满足\[[\lambda_i,\lambda_j]=2i\sum_{ij}\varepsilon_{ijk}\lambda_k\]则上面三个矩阵可以生成群\(SU(2)\)的一个三维表示。实际上上面三个矩阵是自旋为\(1\)粒子的泡利矩阵。
李群的阶定义为互相对易的生成元的最大个数。因为\(SO(3),SU(2)\)生成元都互相不对易,所以阶为\(1\),另外还有一个叫做卡塞米尔算符(Casimir)的概念,卡塞米尔算符定义为与李群所有生成元都对易的算符。理论证明李群的卡塞米尔算符的个数等于李群的阶数。所以\(SO(3)\)和\(SU(2)\)群都只有一个卡塞米尔算符,它就是角动量平方\({\boldsymbol L}^2\).