SU(2),SO(3)群笔记

这个笔记的思路有点乱糟糟,但是记录了我以前的一些计算。以后估计还会有用,所以先贴在这里。

1 U(2)群

二维复矢量空间中的线性变换为

\[[ u', v'] = [u,v]S = [u,v] \begin{bmatrix} a & c \\ b & d \end{bmatrix} \]

如果保证变换前后矢量的模方不变,即

\[|u'|^2 + |v'|^2 = |u|^2 + |v|^2 \]

\[[u',v'] \begin{bmatrix} u'^* \\ v'^* \end{bmatrix} = [u,v] S S^\dagger \begin{bmatrix} u^* \\ v^* \end{bmatrix} \]

对任意\(u,v\)都成立.
可以证明,“保证变换前后矢量模方不变”\(\Leftrightarrow\)“变换矩阵\(S\)是幺正的,即\(SS^\dagger=1\)”。记

\[SS^\dagger = \begin{bmatrix} A & B \\ C & D \end{bmatrix} \]

然后取如下情况,

1)取 \([u,v] = [1,0] \Rightarrow A=1\);

2)取 \([u,v] = [0,1] \Rightarrow D=1\);

3)取 \([u,v] = [2^{-1/2},2^{-1/2}] \Rightarrow B+C=0\);

4)取 \([u,v] = [2^{-1/2},i2^{-1/2}] \Rightarrow B-C=0\);

所以必有\(SS^\dagger = 1\)。而\(SS^\dagger=1\)也是充分的,足以保证\(|u|^2 + |v|^2=1\)在变换前后不变。

这样的\(S\)构成\(U(2)\)群,因为单位元、封闭性、结合律、逆元都满足。以\(U\)来标记,大概是unitary,即幺正性。
很显然,如果勒令\(S\)的元素都是实数,则构成子群\(O(2)\),\(O\)大概是orthogonal的缩写,即正交性。

要使得\(SS^\dagger=1\),即

\[SS^\dagger = \begin{bmatrix} a & c \\ b & d \end{bmatrix} \begin{bmatrix} a^* & b^* \\ c^* & d^* \end{bmatrix} = 1, \]

即等价于:(a,c)幺模,(b,d)幺模,(a,c)与(b,d)內积为0,即正交,这里內积定义为
\begin{equation}
(a,c) \cdot (b,d) = ab^* + cd^*.
\end{equation}
所以可以定义\(a = \cos \theta e^{i\alpha}, c = \sin\theta e^{i\gamma}, b = \sin \phi e^{i\delta}, d = \cos \phi e^{i (\beta - \alpha)}\),其中\(\theta,\phi\)都在\([0,\pi/2]\)中取值,辐角这么安排只是为了和Joshi的书保持一致,方便后面的笔记叙述。毕竟只要\(\alpha, \beta, \gamma, \delta\)取值范围是\(2\pi\)长的区间,\(a,b,c,d\)的相位就具有一般性。
\(\theta\)和\(\phi\)的设置满足了两个幺模性,而(a,c)与(b,d)正交,则是

\[\cos \theta \sin \phi e^{i(\alpha - \delta)} + \sin \theta \cos \phi e^{i(\gamma + \alpha - \beta)} = 0, \]

把左边第二项移到右边,然后两边取模,得到\(\cos\theta \sin\phi = \sin\theta\cos\phi\),考虑到它们的取值范围,则有\(\phi = \theta\),所以上式即

\[\alpha - \delta = \gamma + \alpha - \beta + (2k+1)\pi, k\in Z, \]

\[\delta = \beta - \gamma - (2k+1)\pi, k \in Z, \]

所以最终

\[S = \begin{bmatrix} \cos \theta e^{i\alpha} & \sin \theta e^{i \gamma} \\ - \sin\theta e^{i (\beta - \gamma)} & \cos\theta e^{i(\beta - \alpha)} \end{bmatrix} \]

显然有\(|S| = e^{i\beta}\)。
\(a,b\)受\(|a|^2 + |b|^2 = 1\)的约束,所以共有三个*度。

2 SU(2)群

如果\(\beta = 0\),即\(|S| = 1\),则\(S\)构成SU(2)群。S大概是special,即特殊的幺正群,

\[S = \begin{bmatrix} \cos \theta e^{i\alpha} & \sin \theta e^{i \gamma} \\ - \sin\theta e^{i ( - \gamma)} & \cos\theta e^{i( - \alpha)} \end{bmatrix} = \begin{bmatrix} a & -b^* \\ b & a^* \end{bmatrix} \]

3 SU(2)群的不可约表示

考虑二维复矢量\([u,v]\)的函数
\begin{equation}
f^m_j = \frac{ u^{j+m} v^{j-m} }{ [(j+m)!(j-m)!]^{1/2} }, ~~~ 2j = 0,1,2,\cdots, ~~~ m = -j, -j+1, \cdots, j,
\end{equation}
因为\(u^{j+m}v^{j-m}\)整体的幂次是\(2j\),对\([u,v]\)做了线性变换以后,\(u',v'\)是\(u,v\)的线性叠加,那么\(u'^{j+m} v'^{j-m}\)仍然是\(u,v\)的\(2j\)齐次型,所以\(f^m_j\)在变换之后,是\(f^{m'}_j\)的线性叠加。
也就是说,在\(u,v\)进行线性变换时,\(f^m_j\)构成一个\(2j+1\)阶的封闭空间。
那么,以\(f^m_j\)为基矢,就可以构造线性变换矩阵,与\(u,v\)的线性变换相对应。
这样的矩阵,就是\(U(2)\)群元的表示,如果是\(SU(2)\)群元,就是\(SU(2)\)的表示。
用\(R(a,b)\)标记这个线性变换,对应\(S=[\begin{smallmatrix} a & -b^*\\ b & a^* \end{smallmatrix}]\),则有
\begin{equation}
R(a,b) f^m_j = \frac{ 1 }{ [(j+m)!(j-m)!]^{1/2} } (au + bv)^{j+m} (-b^* u + a^* v)^{j-m},
\end{equation}
将上式展开,经过计算整理,得到

\[R(a,b) f^m_j = \sum^j_{m'=-j} f^{m'}_j D_{m' m}^j(a,b), \]

其中

\[D^j_{m' m}(a,b) = \sum_k \frac{ [(j+m)!(j-m)!(j+m')!(j-m')!]^{1/2} }{ (j+m-k)!k!(j-m'-k)!(m'-m+k)! } a^{j+m-k} (a^*)^{j-m'-k} b^k (-b^*)^{m'-m+k}. \]

\(k\)使得所有阶乘的宗量不小于0,这样来确定它的求和范围。

注意到,如果\((u,v)\)的模方不变,\(f^m_j\)作为一个\(2j+1\)维矢量,它的模方是不变的

\[\sum_m |f^m_j|^2 = \frac{1}{(2j)!} ( |u|^2 + |v|^2 )^{2j}, \]

所以\(D^j_{m' m}(a,b)\)是一个幺正矩阵表示。
另外(unchecked),用舒尔引理的逆命题可以证明,\(D^j_{m'm}(a,b)\)是一个不可约表示。Joshi还声称它是SU(2)唯一的2j+1维不可约表示,这一点我没有理解。

因为线性变换的“乘法”对应着上文中矩阵\(S\)的乘法,所以SU(2)群中的共轭群元一定有相同的特征值。
有完全相同特征值的\(S\)矩阵也一定是相似的,对应共轭群元。
所以,考虑SU(2)群的类,只需按特征值划分。
而矩阵\(S\)的特征方程为
\begin{equation}
\lambda^2 - (a + a^*) \lambda + 1 =0,
\end{equation}
只与\(a\)的实部有关。
所以,所有\(a\)的实部相同的SU(2)元素构成一类。
因为\(D^j_{m'm}(a,b)\)是同构的幺正不可约矩阵群,所以类结构也会映射过来,即所有\(a\)的实部相同的\(D^j_{m'm}(a,b)\)构成一类,相应的特征标为

\[\chi^j(e^{i\alpha/2}, 0 ) = \sum^j_{m=-j} D^j_{mm} (e^{i\alpha/2},0) = \frac{\sin(j+\frac{1}{2})\alpha }{ \sin \frac{1}{2} \alpha }. \]

4 SU(2)到SO(3)群的同态

既然SU(2)线性变换矩阵\(S \equiv \begin{bmatrix} a & -b^* \\ b & a^* \end{bmatrix}\)与上面定义的\(D\)矩阵同构,研究某一个\(D\)矩阵表示,即可等价地研究SU(2)群。
那么不妨看\(D^1\)矩阵,即\(j=1,m=-1,0,1\)三维矩阵,函数基矢\(f^m_j\)是

\[\left\{ \begin{aligned} & x_1 = u^2 / \sqrt{2}, \\ & x_2 = uv, \\ & x_3 = v^2 / \sqrt{2} \end{aligned} \right. \]

相应的\(D\)矩阵很容易得到

\[\left\{ \begin{aligned} & x'_1 = R(a,b)x_1 = a^2 x_1 + \sqrt{2} ab x_2 + b^2 x_3, \\ & x'_2 = R(a,b)x_2 = - \sqrt{2} ab^* x_1 + (aa^* - bb^*)x_2 + \sqrt{2} a^*b x_3, \\ & x'_3 = R(a,b)x_3 = (b^*)^2 x_1 - \sqrt{2} a^* b^* x_2 + (a^*)^2 x_3. \end{aligned} \right. \]

\[D^1 = \begin{bmatrix} a^2 & - \sqrt{2} ab^* & (b^*)^2 \\ \sqrt{2} ab & (aa^* - bb^*) & -\sqrt{2} a^* b^* \\ b^2 & \sqrt{2} a^* b & (a^*)^2 \end{bmatrix}, ~~~~ R(a,b) (x_1, x_2, x_3) = (x_1, x_2, x_3) D^1 \]

\(D^1\)是一个复数矩阵,但是可以通过幺正变换,变成实数矩阵。定义

\[U = \begin{bmatrix} \frac{1}{\sqrt{2}} & -\frac{i}{\sqrt{2}} & \\ & & 1\\ -\frac{1}{\sqrt{2}} & -\frac{i}{\sqrt{2}} & \end{bmatrix} \]

则有

\[U^\dagger D^1 U = \begin{bmatrix} \frac{1}{2}( a^2 + (a^*)^2 - b^2 - (b^*)^2) & -\frac{i}{2}( a^2 - (a^*)^2 - b^2 + (b^*)^2) & -ab^* + a^*b \\ \frac{i}{2}(a^2 - (a^*)^2 + b^2 - (b^*)^2) & \frac{1}{2}(a^2 + (a^*)^2 + b^2 + (b^*)^2) & -i(ab^* - a^*b) \\ ab + a^* b^* & -i(ab-a^* b^*) & aa^* -bb^* \end{bmatrix}, \]

这是一个实数矩阵,而且行列式为1,所以实际上是\(SO(3)\)群的一个群元。
这意味着,每一个SU(2)的群元都对应着唯一的一个SO(3)的群元。

5 SO(3)群

不改变3维矢量长度的线性变换构成O(3)群,线性变换矩阵的行列式为 1 而不是 -1 的,则构成SO(3)群。
为何 SO(3) 群就是转动群?
首先,每一个转动变换矩阵一定是SO(3)的群元。
齐次,SO(3)的矩阵都对应着转动变换。
对任意SO(3)中的群元\(R\),坐标系按\(R\)转动时,一个矢量\(\vec{r} = x \vec{e}_x + y \vec{e}_y + z \vec{e}_z\)的坐标变化为
\begin{equation}
(x',y',z') = (x,y,z)R,
\end{equation}
因为\(R R^\top = 1\),所以变换前后矢量长度不变。
任意两个矢量的內积为
\begin{equation}
\vec{\alpha'}^\top \vec{\beta'} = \vec{\alpha}^\top R R^\top \vec{\beta} = \vec{\alpha}^\top \vec{\beta}
\end{equation}
两个矢量的外积与第三个矢量的点乘,反映了它们之间的手征关系,
\begin{equation}
(\vec{\alpha'} \times \vec{\beta'}) \cdot \vec{\gamma'}
= \alpha_l R_{li} \beta_m R_{mj} \gamma_n R_{nk} \epsilon_{ijk}
= \alpha_l \beta_m \gamma_n \epsilon_{lmn} = (\vec{\alpha} \times \vec{\beta}) \cdot \vec{\gamma},
\end{equation}
上式第二个等号使用了\(R\)的行列式为1。
有长度、內积、外积不变,即可说明SO(3)的任何一个元素都对应着转动。
因为长度、內积、外积不变,说明刚体上每一个点之间的相对位置都没有变。

6 SO(3)群的群元

以前我用几何的方法证明过,共原点的任意两个右手系,都可以通过唯一一次定轴转动相联系。
用三个欧拉角所标定的三次转动,也可以连接共原点的任意两个右手系。
所以,任意转动变换有两种表述,一个是定轴转动,一个是欧拉角的三次定轴转动。

任意的定轴转动,不妨设转轴为\(\vec{u}\),绕\(\vec{u}\)转角\(d\phi\)以后,任意一点\(\vec{r}\)的变化量为

\[- d\phi \vec{u} \times \vec{r} \]

注意,这里我使用了“坐标轴转动”的约定,与Joshi一致。
所以,生成元\(I\)作用在三维空间的任意标量函数\(f(\vec{r})\)上,有
\begin{equation}
I f(\vec{r}) = \lim\limits_{d\phi \rightarrow 0} \frac{1}{i d\phi} [ f(\vec{r} - d\phi \vec{u} \times \vec{r} ) - f(\vec{r}) ]
= i (\vec{u} \times \vec{r}) \cdot \vec{\nabla} f
= \vec{u} \cdot (\vec{r} \times i \vec{\nabla} ) f
= -\vec{u} \cdot \vec{L} / \hbar f
\end{equation}
所以一般地,转动变换可以表示为
\begin{equation}
R_{\vec{u}}(\phi) = e^{i\phi I} = e^{-i \phi \vec{u} \cdot \vec{L}/\hbar}.
\end{equation}
从这个角度,也可以理解,在转动变换下,球谐函数\(Y_{lm}(\theta, \phi), m=-l, \cdots,l\)构成不变子空间,因为\(R_{\vec{u}}(\phi)\)与\(L^2\)是对易的。

用欧拉角的表示方法,则是
\begin{equation}
R(\alpha, \beta, \gamma) = R_z(\gamma) R_y(\beta) R_z(\alpha)
\end{equation}
其中

\[R_z(\alpha) = \begin{bmatrix} \cos \alpha & \sin \alpha & 0 \\ -\sin \alpha & \cos \alpha & 0 \\ 0 & 0 & 1 \end{bmatrix}. \]

\(R_{\vec{u}}(\phi)\)与\(R_{\vec{e}_z}(\phi)\)是相似的。可以取\(\vec{u} \times \vec{e}_z\),绕它转动使\(\vec{e}_z\)与\(\vec{u}\)重合,然后转过\(\phi\)角,再绕\(\vec{u} \times \vec{e}_z\),将\(\vec{u}\)转回\(\vec{e}_z\)角,会发现整套操作与\(R_{\vec{e}_z}(\phi)\)相同。

所以,所有转角相同的定轴转动属于同一个类。

7 SO(3)群的表示

用欧拉角标记,

\[R(\alpha, \beta, \gamma) Y^m_l (\theta, \phi) = \sum^l_{m'=-l} Y^{m'}_l(\theta, \phi) D^l_{m',m}(\alpha, \beta, \gamma), \]

这样构成一个\(2l+1\)维的不可约表示\(D^l_{m',m}\)。

球谐函数的定义为(参考Arfken&Weber书的约定)
\begin{equation}
Y^m_n(\theta, \phi) = (-1)^m \sqrt{ \frac{ (2n+1)(n-m)! }{ 4\pi (n+m)! } } P^m_n(\cos \theta) e^{im \phi},
\end{equation}
所以有
\begin{equation}
R_z(\alpha) Y^m_l(\theta, \phi) = e^{-im\alpha} Y^m_l(\theta, \phi),
\end{equation}
所以\(D^l(R_z(\alpha))\)的特征标为
\begin{equation}
\chi^l(\alpha) = \frac{ \sin(l+1/2)\alpha }{ \sin \alpha/2 }.
\end{equation}

8 SO(3)群到SU(2)群的同态

我们回到第4节构造的SU(2)与SO(3)的联系,如果令\(U^\dagger D^1 U=R_z(\alpha)\),经过计算,会发现,这等价于要求\(a=\pm e^{i\alpha/2}, b = 0\);
如果令\(U^\dagger D^1 U=R_y(\beta)\),则会发现,这等价于要求\(a=\pm \cos \beta/2, b= \pm \sin \beta/2\)。
所以,应用于欧拉角标记下的\(R(\alpha,\beta,\gamma) = R_z(\gamma) R_y(\beta) R_z(\alpha)\),则会得到

\[\pm \begin{bmatrix} \cos \beta/2 e^{i(\alpha+\gamma)/2} & -\sin \beta/2 e^{i(\gamma-\alpha)/2} \\ \sin \beta/2 e^{i(\alpha-\gamma)/2} & \cos \beta/2 e^{-i(\alpha-\gamma)/2} \end{bmatrix} \Leftrightarrow R(\alpha, \beta, \gamma) \]

所以每个SO(3)的元素对应两个SU(2)的元素(相差一个负号)。

9 SO(3)群的矩阵表示

把\(a = \pm \cos \beta/2 e^{i(\alpha+\gamma)/2}, b=\pm \sin \beta/2 e^{i(\alpha-\gamma)/2}\)带入第三节\(D^j_{m'm}\)的表达式,可以得到
\begin{equation}
D^j_{m' m}(\pm \cos \beta/2 e^{i(\alpha+\gamma)/2},\pm \sin \beta/2 e^{i(\alpha-\gamma)/2})
= \sum_k (-1)^{m'-m+k} \frac{ [(j+m)!(j-m)!(j+m')!(j-m')!]^{1/2} }{ (j+m-k)!k!(j-m'-k)!(m'-m+k)! }
e^{im\alpha} e^{im'\gamma}
(\pm \cos \frac{\beta}{2})^{2j+m-m'-2k} (\pm \sin \frac{\beta}{2})^{m'-m+2k}.
\end{equation}
可以看出来,\(j\)是整数时,\(\pm\)符号对最终结果没有影响,是一个单值表示,而\(j\)是半整数时,\(D^j_{m'm}\)也有\(\pm\)符号,是所谓双值表示。

上一篇:高斯消元法和列主元素法


下一篇:基于深度强化学习的长期推荐系统