n维空间下两个随机向量的夹角分布

文章目录


昨天群里大家讨论到了 n n n维向量的一些反直觉现象,其中一个话题是“ 一般 n n n维空间下两个随机向量几乎都是垂直的”,这就跟二维/三维空间的认知有明显出入了。要从理论上认识这个结论,我们可以考虑两个随机向量的夹角 θ \theta θ分布,并算算它的均值方差。

概率密度

首先,我们来推导 θ \theta θ的概率密度函数。呃,其实也不用怎么推导,它是n维超球坐标的一个直接结论。

要求两个随机向量之间的夹角分布,很显然,由于各向同性,所以我们只需要考虑单位向量,而同样是因为各向同性,我们只需要固定其中一个向量,考虑另一个向量随机变化。不是一般性,考虑随机向量为
x = ( x 1 , x 2 , … , x n ) (1) x=(x_1,x_2,\dots,x_n)\tag{1} x=(x1​,x2​,…,xn​)(1)
而固定向量为
y = ( 1 , 0 , ⋯   , 0 ) (2) y=(1,0,\cdots,0)\tag{2} y=(1,0,⋯,0)(2)
将 x x x变换为超球坐标(关于 n n n维球的知识可以参考*):
{ x 1 = cos ⁡ ( φ 1 ) x 2 = sin ⁡ ( φ 1 ) cos ⁡ ( φ 2 ) x 3 = sin ⁡ ( φ 1 ) sin ⁡ ( φ 2 ) cos ⁡ ( φ 2 )     ⋮ x n − 1 = sin ⁡ ( φ 1 ) … sin ⁡ ( φ n − 2 ) cos ⁡ ( φ n − 1 ) x n = sin ⁡ ( φ 1 ) … sin ⁡ ( φ n − 2 ) sin ⁡ ( φ n − 1 ) (3) \begin{cases} x_1=\cos(\varphi_1) \\[0.01ex] x_2=\sin(\varphi_1)\cos(\varphi_2) \\ x_3=\sin(\varphi_1)\sin(\varphi_2)\cos(\varphi_2) \\ \quad\:\:\,\vdots\\ x_{n-1}=\sin(\varphi_1)\dots\sin(\varphi_{n-2})\cos(\varphi_{n-1}) \\ x_{n}=\sin(\varphi_1)\dots\sin(\varphi_{n-2})\sin(\varphi_{n-1}) \\ \end{cases} \tag{3} ⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧​x1​=cos(φ1​)x2​=sin(φ1​)cos(φ2​)x3​=sin(φ1​)sin(φ2​)cos(φ2​)⋮xn−1​=sin(φ1​)…sin(φn−2​)cos(φn−1​)xn​=sin(φ1​)…sin(φn−2​)sin(φn−1​)​(3)
其中 φ n − 1 ∈ [ 0 , 2 π ) \varphi_{n−1}\in[0,2\pi) φn−1​∈[0,2π)而剩下的 φ \varphi φ范围是 [ 0 , π ] [0,π] [0,π]。此时, x x x和 y y y的夹角是:
arccos ⁡ ⟨ x , y ⟩ = arccos ⁡ cos ⁡ φ 1 = φ 1 (4) \arccos{\langle x,y\rangle}=\arccos{\cos{\varphi_1}}=\varphi_1\tag{4} arccos⟨x,y⟩=arccoscosφ1​=φ1​(4)
也就是说两者的夹角正好是 φ 1 \varphi_1 φ1​。那么, x x x和 y y y的夹角不超过 θ \theta θ的概率是:
P n ( φ 1 ≤ θ ) = n 维 超 球 面 上 φ 1 不 超 过 θ 的 积 分 n 维 超 球 面 上 的 全 积 分 (5) P_n(\varphi_1\leq\theta)=\cfrac{n维超球面上\varphi_1不超过\theta的积分}{n维超球面上的全积分}\tag{5} Pn​(φ1​≤θ)=n维超球面上的全积分n维超球面上φ1​不超过θ的积分​(5)
而 n n n维超球面上的积分微元 sin ⁡ n − 2 ( φ 1 ) sin ⁡ n − 3 ( φ 2 ) ⋯ sin ⁡ ( φ n − 2 ) d φ 1 d φ 2 ⋯ d φ n − 1 \sin^{n-2}{(\varphi_1)}\sin^{n-3}{(\varphi_2)}\cdots\sin{(\varphi_{n-2})}d{\varphi_1}d{\varphi_2}\cdots d{\varphi_{n-1}} sinn−2(φ1​)sinn−3(φ2​)⋯sin(φn−2​)dφ1​dφ2​⋯dφn−1​(可在*找到),所以
P n ( φ 1 ≤ θ ) = ∫ 0 2 π ⋯ ∫ 0 π ∫ 0 θ sin ⁡ n − 2 ( φ 1 ) sin ⁡ n − 3 ( φ 2 ) ⋯ sin ⁡ ( φ n − 2 ) d φ 1 d φ 2 ⋯ d φ n − 1 ∫ 0 2 π ⋯ ∫ 0 π ∫ 0 π sin ⁡ n − 2 ( φ 1 ) sin ⁡ n − 3 ( φ 2 ) ⋯ sin ⁡ ( φ n − 2 ) d φ 1 d φ 2 ⋯ d φ n − 1 = ( n − 1 ) 维 单 位 超 球 的 表 面 积 × ∫ 0 θ sin ⁡ n − 2 φ 1 d φ 1 n 维 单 位 超 球 的 表 面 积 = Γ ( n 2 ) Γ ( n − 1 2 ) π ∫ 0 θ sin ⁡ n − 2 φ 1 d φ 1 ( n 维 球 面 的 表 面 积 S n = 2 π n 2 R n − 1 Γ ( n 2 ) ) (6) \begin{aligned} P_n(\varphi_1\leq\theta) & = \frac{\int_0^{2\pi}\cdots \int_0^{\pi}\int_0^{\theta}\sin^{n-2}(\varphi_1)\sin^{n-3}(\varphi_2)\cdots\sin(\varphi_{n-2})d\varphi_1d\varphi_2\cdots d\varphi_{n-1}}{\int_0^{2\pi}\cdots \int_0^{\pi}\int_0^{\pi}\sin^{n-2}(\varphi_1)\sin^{n-3}(\varphi_2)\cdots\sin(\varphi_{n-2})d\varphi_1d\varphi_2\cdots d\varphi_{n-1}} \\ & = \frac{(n−1)维单位超球的表面积\times\int_0^{\theta}\sin^{n-2}\varphi_1d\varphi_1}{n维单位超球的表面积} \\ & = \frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}\int_{0}^{ \theta}\sin^{n-2}\varphi_1d\varphi_1 \quad(n维球面的表面积S_n=\frac{2\pi^{\frac{n}{2}}R^{n-1}}{\Gamma(\frac{n}{2})}) \end{aligned} \tag{6} Pn​(φ1​≤θ)​=∫02π​⋯∫0π​∫0π​sinn−2(φ1​)sinn−3(φ2​)⋯sin(φn−2​)dφ1​dφ2​⋯dφn−1​∫02π​⋯∫0π​∫0θ​sinn−2(φ1​)sinn−3(φ2​)⋯sin(φn−2​)dφ1​dφ2​⋯dφn−1​​=n维单位超球的表面积(n−1)维单位超球的表面积×∫0θ​sinn−2φ1​dφ1​​=Γ(2n−1​)π ​Γ(2n​)​∫0θ​sinn−2φ1​dφ1​(n维球面的表面积Sn​=Γ(2n​)2π2n​Rn−1​)​(6)
这表明 θ \theta θ的概率密度函数就是
p n ( θ ) = Γ ( n 2 ) Γ ( n − 1 2 ) π sin ⁡ n − 2 θ (7) p_n(\theta)=\frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}\sin^{n-2}\theta\tag{7} pn​(θ)=Γ(2n−1​)π ​Γ(2n​)​sinn−2θ(7)
有时候我们想关心 η = cos ⁡ θ \eta=\cos{\theta} η=cosθ的分布,这时候需要应用第二积分换元法做一下概率密度的换元
p n ( θ ) = Γ ( n 2 ) Γ ( n − 1 2 ) π sin ⁡ n − 2 ( arccos ⁡ η ) ∣ d θ d η ∣ = Γ ( n 2 ) Γ ( n − 1 2 ) π ( 1 − η 2 ) n − 2 2 ( 1 − η 2 ) 1 2 = Γ ( n 2 ) Γ ( n − 1 2 ) π ( 1 − η 2 ) n − 3 2 (8) \begin{aligned} p_n(\theta) &=\frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}\sin^{n-2}(\arccos{ \eta})\bigg\lvert \frac{d\theta}{d\eta}\bigg\rvert \\ &=\frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}(1-\eta^2)^{\frac{n-2}2}(1-\eta^2)^{\frac12}\\ &=\frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}(1-\eta^2)^{\frac{n-3}2} \end{aligned} \tag{8} pn​(θ)​=Γ(2n−1​)π ​Γ(2n​)​sinn−2(arccosη)∣∣∣∣​dηdθ​∣∣∣∣​=Γ(2n−1​)π ​Γ(2n​)​(1−η2)2n−2​(1−η2)21​=Γ(2n−1​)π ​Γ(2n​)​(1−η2)2n−3​​(8)

分布情况

(7)(8)我们可以看到,当 n = 2 n=2 n=2时,夹角 θ \theta θ的分布是一个均匀分布,而当 n = 3 n=3 n=3时,夹角余弦 cos ⁡ θ \cos\theta cosθ的分布是均匀分布。这两个结果说明在我们所能感知到的二维和三维空间中,角度的分布是比较均匀的。但是 n n n比较大的时候呢?比如 n = 20 , 50 n=20,50 n=20,50?

从 p n ( θ ) ∼ sin ⁡ − 2 n θ p_n(\theta)\sim \sin^{-2n}\theta pn​(θ)∼sin−2nθ的形式可以发现,当 n ≥ 3 n\geq3 n≥3时,最大概率是 θ = π 2 \theta=\cfrac\pi2 θ=2π​(即90度),另外 sin ⁡ n − 2 θ \sin^{n−2}\theta sinn−2θ也是关于 θ = π 2 θ=\cfrac{\pi}{2} θ=2π​对称的,所以它的均值也是 π 2 \cfrac\pi2 2π​。但这还不能充分描述分布情况,我们还需要考虑方差
V a r n ( θ ) = Γ ( n 2 ) Γ ( n − 1 2 ) π ∫ 0 π ( θ − π 2 ) 2 sin ⁡ n − 2 θ d θ (9) Var_n(\theta)=\frac{\Gamma{(\frac{n}{2}})}{\Gamma{(\frac{n-1}{2})}\sqrt{\pi}}\int_0^{\pi}(\theta-\frac\pi2)^2\sin^{n-2}\theta d\theta\tag{9} Varn​(θ)=Γ(2n−1​)π ​Γ(2n​)​∫0π​(θ−2π​)2sinn−2θdθ(9)
这个积分有解析解,但是形式很麻烦(喜欢看的话可以自己用Mathematica去算),我们来看部分数值解就好:

n 方差
3 0.467401
10 0.110661
20 0.0525832
50 0.0204053
100 0.0101007
200 0.00502508
1000 0.001001

可以看到,随着 n n n的增大,方差越来越小,这意味着高维空间中任意两个向量的夹角几乎都集中在 π 2 \cfrac\pi2 2π​附近,换言之,高维空间中任意两个向量几乎都是垂直的。

当然,从图像也可以看出:
n维空间下两个随机向量的夹角分布
如果想要近似解析解的读者,可以考虑用拉普拉斯方法,用一个高斯分布去近似 p n ( θ ) p_n(\theta) pn​(θ):在 θ = π 2 \theta=\cfrac\pi2 θ=2π​处对 ln ⁡ sin ⁡ n − 2 θ \ln\sin^{n−2}\theta lnsinn−2θ进行展开
ln ⁡ sin ⁡ n − 2 θ = 2 − n 2 ( θ − π 2 ) 2 + O ( ( θ − π 2 ) 4 ) (10) \ln\sin^{n-2}\theta=\cfrac{2-n}{2}(\theta-\frac\pi2)^2+\mathscr{O}\big((\theta-\frac\pi2)^4\big) \tag{10} lnsinn−2θ=22−n​(θ−2π​)2+O((θ−2π​)4)(10)

sin ⁡ n − 2 θ ≈ exp ⁡ [ − n − 2 2 ( θ − π 2 ) 2 ] (11) \sin^{n-2}\theta\approx \exp[-\cfrac{n-2}{2}(\theta-\frac\pi2)^2] \tag{11} sinn−2θ≈exp[−2n−2​(θ−2π​)2](11)
从这个近似形式看,我们可以近似地认为 θ \theta θ服从均值为 π 2 \cfrac\pi2 2π​、方差为 1 n − 2 \cfrac1{n−2} n−21​的正态分布,即当 n n n较大时,方差近似为 1 n − 2 \cfrac1{n−2} n−21​,这也能看出 n n n越大,方差越小。

转载

本文转载自苏神的 n维空间下两个随机向量的夹角分布

上一篇:【PTA/乙级】【1051】复数乘法 (15 分) 精度控制永远的谜


下一篇:最大熵分布及其应用