卡方检验只能对两个分类变量之间是否存在联系进行检验,如果分类变量有多个水平的话,则无法衡量每个水平间的联系。对此,虽然可以使用逻辑回归进行建模,但是如果分类变量的水平非常多,就需要分别设定哑变量,这样对于操作和解释都非常繁琐。而对应分析则是专门解决上述问题的方法,它特别擅长对两个分类变量的多个水平之间的对应性进行分析。常用于市场细分、产品定位、品牌形象及满意度研究。
对应分析最大的特点是通过直观的图形方式,展现分类变量不同水平之间的联系,水平越多,效果越好。
对应分析是一种多元统计分析方法,由于只是运用数学原理对数据进行处理和转换,当中没有涉及假设检验,因此本质上也只是一种描述性、探索性统计方法,但是由于结果直观易懂,也在某些研究领域经常使用,它的使用前提是,变量间各水平要存在联系,这点可以通过卡方检验进行判断。
对应分析可以分为简单对应分析和多重对应分析,前者只是涉及两个变量,一般是列联表形式;而后者则针对多个分类变量。
SPSS把对应分析认为是一种降维技术,因此放在了降维过程中。
一、简单对应分析
分析—降维—对应分析
我们想分析头发颜色和眼睛颜色之间的关系,特收集了这两个变量,头发颜色有五个水平,眼睛颜色有四个水平,数据组成形式如下,注意频数要进行加权
首先对数据进行预分析,由于是频数数据,因此需要做条形图
以上的对应分析是针对单元格为频数的资料进行的,但有时候,我们收集来的数据资料并不是频数资料,而是均值、总和等,如下面的数据形式,单元格中为均值,此时需要使用基于均值的对应分析
之后的结果解释和基于频数的对应分析一致。
==================================================
二、多重对应分析
分析—降维—最优尺度
对于多个变量间的对应分析,需要使用最优尺度变换过程,看一个例子
该数据有7个变量,都属于无序多分类或二分类变量