【统计学习】SVM之超平面方程来源

摘要

本文主要说明SVM中用到的超平面方程是怎么来的,以及各个符号的物理意义,怎么算空间上某点到该平面的距离。

正文

《 统计学习方法》一书给出如下说明:

  【统计学习】SVM之超平面方程来源

首先说明我对超平面的理解:

在三维坐标系里,XoY平面把三维坐标系”分割”成两个空间,这个分割平面引申到一维,二维,四维空间…来,他就是一个超平面。一维里是一个点分割空间,二维里是条线,3维刚好是个平面,4维的用几何已经无法表示了,但是我们赋予这个分割的东西为超平面,就比较形象了。

对于这个分离超平面方程时怎么来的,书中如此解释:

【统计学习】SVM之超平面方程来源

这里的符号造成了一定的误解,w时向量还是矩阵,b是向量吗…

不失一般性,我们在二维里面推导这个方程和其物理意义,然后推广到多维空间。

符号说明:w (超平面的法向量<这里的法向量尚未归一化>,黑体,斜体),x(空间的任意向量,黑体,斜体),b(实数)。

下面来看法向量w的提出有什么意义:

对于x在这里可以看做由[0,0]到超平面任意‘’的向量;

w法向量 的大小是[0,0]到分离超平面的距离,方向由分离超平面决定,或者说其方向决定了分离超平面,就像是先有鸡还是先有蛋的问题。

【统计学习】SVM之超平面方程来源

【统计学习】SVM之超平面方程来源

至此,我们论述了该方程确实可以表示一个二维空间里的超平面,推广到多维也是如此。接下来我们看下怎么计算空间里任一点A到该超平面的距离。

【统计学习】SVM之超平面方程来源

【统计学习】SVM之超平面方程来源

上一篇:HNU 13074 Goldbach’s Conjecture 解题报告


下一篇:BestCoder Round #85