高斯过程
所谓高斯,即高斯分布
所谓过程,即随机过程
高斯分布
一维高斯
p(x)=N(μ,σ2)
高维高斯
多元高斯分布——高斯网络 x∈Rp
p(x)=N(μ,Σ),Σp×p,p<inf
无限维高斯分布
即高斯过程,定义在连续域(时间或者空间)上的无限多个高斯随机变量所组成的随机过程
假设有一个连续域 T,对于任意正整数 n,有 t1,...,tn∈T,且满足条件
⎣⎢⎡ξt1⋮ξtn⎦⎥⎤∼N(μt1−tn,Σt1−tn)则 {ξt}t∈T 就是一个高斯过程。
则一个高斯过程可以表示为
GP(m(t),k(s,t))其中m(t)=E[ξt]为均值函数,k(s,t)=E[ξs−E[ξs]][ξt−E[ξt]]为协方差函数
高斯过程回归
贝叶斯线性回归(权重空间视角)
线性回归
使用核函数就可以用于非线性
贝叶斯线性回归加上核方法(非线性转换内积)也就是高斯过程回归{f(x)=ϕT(x)wy=f(x)+ε这是从权重空间的角度来看
函数空间视角
f(x)∼GP(m(x),k(x,x′))
- f(x) 是函数
-
f(x)是高斯分布
与之前的定义对应关系就是
t→ξt,{ξt}t∈T∼GP x→f(x),{f(x)}x∈Rp∼GP
回归问题:
Data:{(xi,yi)}i=1N,y=f(x)+ϵ
定义 XN×p=(x1,...,xN)T,YN×1=(y1,...,yN)T
f(X)∼N(μ(X),K(X,X))
Y=f(X)+ϵ∼N(μ(X),K(X,X)+σ2I)
需要预测的数据为 X∗,则 Y∗=f(X∗)+ϵ
已知 x∼N(μ,Σ)
其中x=(xaxb),μ=(μaμb),Σ=(ΣaaΣbaΣabΣbb)则xb∣xa∼N(μb∣a,Σb∣a)其中
μb∣a=ΣbaΣaa−1(xa−μa)+μb,Σb∣a=Σbb−ΣbaΣaa−1Σab
令 xa=Y,xb=f(X∗),所要求的的条件概率为 p(f(X∗∣Y,X,X∗)) 即 p(xb∣xa),带入公式可得μ∗=K(X∗,X)(K(X,X)+σ2I)−1(Y−μ(X))+μ(X∗)Σ∗=K(X∗,X∗)−K(X∗,X)(K(X,X)+σ2I)−1K(X,X∗)因此p(f(X∗∣Y,X,X∗))=N(μ∗,Σ∗) p(Y∗∣Y,X,X∗)=N(μ∗,Σ∗+σ2I)
发现了一个易于理解的博客:https://blog.csdn.net/greenapple_shan/article/details/52402051