sklearn.model_selection.learning_curve的详细介绍（包含ShuffleSplit介绍）-需求分析

2024-04-19 11:04:41

通过参数train_size选取不同规模的数据集，再分别在不同规模的数据集上做交叉验证，通过参数cv选取交叉验证的类型；

例如：我们想选取含有1000个样本的数据集的10%，33%，55%，78%，100%的数据做实验，探究不同数据量下模型的预测准确度，选取不同规模的数据集后，我们又想分别在不同规模的数据集下做一下5折交叉验证。我们就可以设train_size=array([0.1, 0.33, 0.55, 0.78, 1.]), cv=5。