Python中np.random.multivariate_normal问题

2021-11-13 02:35:07

首先看一下一维正态分布的公式：

其中μ为均值，σ为标准差，正态分布的草图如下图所示。

再看numpy提供的函数的参数：

multivariate_normal(mean,cov,size=None,check_valid=None,tol=None)

在一维正态分布中，第一个参数mean就是这里的均值μ，第二个参数cov就是方差【公式cov(x,x)=D(x)】，第三个参数size就是生成的正态分布矩阵的维度。

如下图，均值设置为3，方差为1，然后取100个点生成一维矩阵Y来绘制散点图，打印出的方差接近设定的值1.

import numpy as np
import matplotlib.pyplot as plt
mean = np.array([3])
cov = np.eye(1)
dot_num = 100
Y = np.random.multivariate_normal(mean,cov,dot_num)
X = np.linspace(0,dot_num-1,dot_num)
plt.scatter(X,Y,c = 'r',marker = '+')
plt.show()
print(np.var(Y))

打印出结果如下：

可以看到散点图如下，图中可以看出，100个散点的均值大致是3（看Y轴）

再看二维正态分布的公式：

这里μ1，μ2分别为变量X，Y的均值；σ1，σ2分别为变量X，Y的标准差，草图如下。

再看协方差的定义，以及协方差与期望值的关系

函数multivariate_normal(mean,cov,size = None,check_valid = None,tol =None)在二维正态分布中，mean是变量X和Y的均值，它的维度为一维。

cov是一个协方差矩阵，它的组成如下，在tensorflow中一般设置cov(x,y)=cov(y,x)=0

size表示生成的正态分布矩阵的维度，如size维度为（1，3，2），那么生成的正态分布矩阵维度为：1*3*2*len(mean)

其他几个参数见链接

链接：https://blog.csdn.net/xc_zhou/article/details/86701549

接着设置mean = [3,0],cov = diag(1,1),使用300个点绘制散点图，打印出X和Y的方差均接近于设定的值1

import numpy as np
import matplotlib.pyplot as plt
mean = np.array([3,0])
cov = np.eye(2) #协方差cov(X,Y)=0,方差D(X)=D(Y)=1
dot_num = 300

#len(mean) = 2，因此生成的正态矩阵维度为dot_num*len(mean)=300*2

f_xy = np.random.multivariate_normal(mean,cov,dot_num)

print(f_xy.shape)

print(np.var(f_xy[:,0]),np.var(f_xy[:,1]))

plt.scatter(f_xy[:,0],f_xy[:,1],c='r')
plt.xlabel("X")
plt.ylabel("Y")
plt.show()

可以看到散点图中，X和Y均值大致上分别是3和0

可依次类推至多维正态分布中。

码农公寓

相关文章