Sklearn

Sklearn

导入

函数 说明
from sklearn.neighbors import KNeighborsClassifier 导入KNN分类器
from sklearn.datasets import load_breast_cancer 导入Sklearn案例数据
from sklearn.model_selection import train_test_split 划分测试集与训练集

KNeighborsClassifier类型属性

函数 说明
clf = KNeighborsClassifier() 实例化,n_neighbors默认为5
clf.fit(训练集,目标集) 导入测试数据
clf.prediect(测试集) 预测测试集分类
clf.score(测试集,真实结果) 对模型进行一个评估,接口score返回预测的准确率
clf.predict_proba(测试集) 输出各分类预测概率
clf.kneighbors(Xtrain[15,:], n_neighbors=k, return_distance=True) 直接在测试集的特定位置,查找临近的k个点,及与之的距离和索引值

数据集处理

函数 作用 参数说明
Xtrain,Xtest,Ytrain,Ytest = train_test_split(X,y,test_size=0.2,random_state=420) 划分数据集与测试集 test_size设定测试集比例,random_state随机种子,类似于random.seed()
上一篇:决策树


下一篇:机器学习实战(4):决策树&集成学习&随机森林