Sklearn
导入
函数 | 说明 |
---|---|
from sklearn.neighbors import KNeighborsClassifier | 导入KNN分类器 |
from sklearn.datasets import load_breast_cancer | 导入Sklearn案例数据 |
from sklearn.model_selection import train_test_split | 划分测试集与训练集 |
KNeighborsClassifier类型属性
函数 | 说明 |
---|---|
clf = KNeighborsClassifier() | 实例化,n_neighbors默认为5 |
clf.fit(训练集,目标集) | 导入测试数据 |
clf.prediect(测试集) | 预测测试集分类 |
clf.score(测试集,真实结果) | 对模型进行一个评估,接口score返回预测的准确率 |
clf.predict_proba(测试集) | 输出各分类预测概率 |
clf.kneighbors(Xtrain[15,:], n_neighbors=k, return_distance=True) | 直接在测试集的特定位置,查找临近的k个点,及与之的距离和索引值 |
数据集处理
函数 | 作用 | 参数说明 |
---|---|---|
Xtrain,Xtest,Ytrain,Ytest = train_test_split(X,y,test_size=0.2,random_state=420) | 划分数据集与测试集 | test_size设定测试集比例,random_state随机种子,类似于random.seed() |