-
numpy.random.normal学习笔记用例:
- 正态分布=高斯分布
-
mean=loc=均值(或称期待值) stddev=scale=标准差 shape=size=输出形状,二者在处理这个参数时候(a,b)=[a,b],其中,numpy的normal对参数格式要求更灵活一些。 比如创建随机数的一行两列数组:
np.random.normal([2])=np.random.normal((2))=np.random.normal(0,1,2)注意最后一种用法必须带上前面两个参数,否则传递参数时候会把2当作均值传递
而tf的random_normal对shape的要求不能是数字,必须为[]或()格式
———————————————————————————————————————————————————————————————————————————————— -
对于numpy.random.normal函数,有三个参数(loc, scale, size),分别代表生成的高斯分布的随机数的均值、方差以及输出的size.
numpy.random.normal(loc=0.0, scale=1.0, size=None) -
意义如下:
参数loc(float):正态分布的均值,对应着这个分布的中心。loc=0说明这一个以Y轴为对称轴的正态分布;
参数scale(float):正态分布的标准差,对应分布的宽度,scale越大,正态分布的曲线越矮胖,scale越小,曲线越高瘦。
参数size(int 或者整数元组):输出的值赋在shape里,默认为None。
———————————————————————————————————————————————————————————————————————————————— -
功能:
从正态(高斯)分布中抽取随机样本。 - 渊源:
-
正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由棣莫弗(Abraham de Moivre)在求二项分布的渐近公式中得到。
-
在其后200年,高斯和拉普拉斯也分别发现了正态分布的概率密度函数。自然界中有许多符合正态分布的案例。例如,它可以描述样本受大量微小随机扰动影响的常见分布,其中,每个扰动都有自己独特的分布。
参数: -
变量名 | 数据类型 | 功能 |
---|---|---|
loc | 浮点型数据或者浮点型数据组成的数组 | 分布的均值(中心) |
scale | 浮点型数据或者浮点型数据组成的数组 | 分布的标准差(宽度) |
size | 整数或者整数组成的元组,可选参数 | 输出值的维度。如果给定的维度为(m, n, k) ,那么就从分布中抽取m * n * k 个样本。如果size为None(默认值)并且loc 和scale 均为标量,那么就会返回一个值。否则会返回np.broadcast(loc, scale).size 个值 |
- 返回值:
变量名 | 数据类型 | 功能 |
---|---|---|
out | n维数组或标量 | 从含参的正态分布中抽取的随机样本 |
- 备注:
高斯分布的概率密度函数为 p ( x ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 p(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}p(x)=2πσ21e−2σ2(x−μ)2其中μ \muμ代表均值,σ \sigmaσ代表标准差,标准差的平方σ 2 \sigma^2σ2称作方差。 函数在均值位置点取到峰值,当标准差增大的时候,其宽度也会增加(函数在x − σ x-\sigmax−σ到x + σ x+\sigmax+σ之间的面积为其总面积的0.607倍)。这意味着numpy.random.normal
更有可能返回靠近均值的样本而不是那些远离均值的样本。
最后对比参考TF和NP:
tf.random_normal()函数用于从服从指定正太分布的数值中取出指定个数的值。
tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
np.random.normal()给出均值为loc,标准差为scale的高斯随机数(场).
numpy.random.normal(loc=0.0, scale=1.0, size=None)