准则
采用一种分类形式后,就要采用准则来衡量分类的效果,最好的结果一般出现在准则函数的极值点上,因此将分类器的设计问题转化为求准则函数极值问题,即求准则函数的参数,如线性分类器中的权值向量。
分类器设计准则:FIsher准则、感知机准则、最小二乘(最小均方误差)准则
Fisher准则
Fisher线性判别分析LDA(Linearity Distinction Analysis)
基本思想:对于两个类别线性分类的问题,选择合适的阈值,使得Fisher准则函数达到极值的向量作为最佳投影方向,与投影方向垂直的超平面就是两类的分类面,使得样本在该方向上投影后,达到最大的类间离散度和最小的类内离散度。
Fisher线性判别并不对样本的分布进行任何假设,但在很多情况下,当样本维数比较高且样本数也比较多时,投影到一维空间后样本接近正态分布,这时可以在一维空间中用样本拟合正态分布,用得到的参数来确定分类阈值。
。。类间离差平方和最大,类内离差平方和最小的投影方向。准则函数:组间离差平方和/组内离差平方和;准则:超过阈值?
感知机准则
基本思想:对于线性判别函数,当模式的维数已知时,判别函数的形式实际上就已经确定下来,线性判别的过程即是确定权向量