Python KNN 学习曲线

学习曲线的目的是选择更好的模型参数。以最近邻算法为例,选取最近的多少个数据点,才能达到最优。可以控制训练集不动,调整最近的点的个数,绘制学习曲线。

import matplotlib.pyplot as plt

score = []
krange=range(1,21) # K值取值范围
for i in krange:
    clf=KNN(n_neighbors=i)
    clf=clf.fit(Xtrain,Ytrain)
    score.append(clf.score(Xtest,Ytest))
plt.plot(krange, score)

结果:

Python KNN 学习曲线

可以找出最大值所在的索引,找出最佳的k值选择点:

bestindex=score.index(max(score))
print(bestindex+1)
print(score[bestindex])

输出:

8
0.935672514619883

上一篇:机器学习——集成算法


下一篇:吴裕雄 python 机器学习——模型选择参数优化随机搜索寻优RandomizedSearchCV模型