-
Concept
将原始数据分成K组(一般是均分),将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型,用这K个模型最终的验证集的分类准确率的平均数作为此K-CV下分类器的性能指标.K一般大于等于2,实际操作时一般从3开始取,只有在原始数据集合数据量小的时候才会尝试取2.K-CV可以有效的避免过学习以及欠学习状态的发生,最后得到的结果也比较具有说服性
-
在matlab中使用K-CV功能
在使用matlab的libsvm(支持向量机工具包)来创建一个svm模型时想使用k折交叉验证进行模型评估时,我们直接在svmtrain()接口下的options中开启-v标志,-v后跟随k的值即 -v k