《数学建模:基于R》——2.3 判别分析

2.3 判别分析

判别分析是用以判别个体所属群体的一种统计方法,它产生于20世纪30年代.近年来,在许多现代自然科学的各个分支和技术部门中得到广泛的应用.

例如,利用计算机对一个人是否有心脏病进行诊断时,可以取一批没有心脏病的人,测其p个指标的数据,然后再取一批已知患有心脏病的人,同样也测得p个相同指标的数据,利用这些数据建立一个判别函数,并求出相应的临界值,这时对于需要进行诊断的人,也同样测其p个指标的数据,将其代入判别函数,求得判别得分,再依判别临界值,就可以判断此人是属于有心脏病的那一群体,还是属于没有心脏病的那一群体.又如,在考古学中,对化石及文物年代的判断;在地质学中,判断是有矿还是无矿;在质量管理中,判断某种产品是合格品,还是不合格品;在植物学中,对于新发现的一种植物,判断其属于哪一科.总之,判别分析方法在很多学科中都有着广泛的应用.

2.3.1 判别分析的基本原理

《数学建模:基于R》——2.3 判别分析
《数学建模:基于R》——2.3 判别分析
《数学建模:基于R》——2.3 判别分析
《数学建模:基于R》——2.3 判别分析
《数学建模:基于R》——2.3 判别分析

2.3.2 判别分析的计算

如果两个总体的协方差矩阵是相同时,则判别函数(2.30)或判别函数(2.35)是线性函数;当两个总体的协方差矩阵不同时,则判别函数(2.31})或判别函数(2.37)是二次函数.所以,距离判别属于线性判别或者二次判别.

同样,可以证明:Fisher判别属于线性判别,Bayes判别本质属于线性判别或者二次判别.

R并没有单独提供这三种判别,而是将判别分析的方法综合在一起,分别给出线性判别函数——lda()函数和二次判别函数——qda()函数.在使用这两个函数之前,需要加载MASS程序包,或使用命令library(MASS).

两个函数的使用格式基本相同,一种是公式形式,其使用格式为

《数学建模:基于R》——2.3 判别分析
《数学建模:基于R》——2.3 判别分析
《数学建模:基于R》——2.3 判别分析
《数学建模:基于R》——2.3 判别分析
《数学建模:基于R》——2.3 判别分析
《数学建模:基于R》——2.3 判别分析

上一篇:《数字视频和高清:算法和接口》一1.6色彩


下一篇:【北大夏令营笔记-线段树】POJ3468-A Simple Problem with Integers