sklearndataset里面有鸢尾花数据集接口,本篇使用sklearn官方数据集,使用k近邻算法。
导入加载器,获取数据.
查看数据规模,养成良好习惯
数据分割
# %% from sklearn.model_selection import train_test_split # %% X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.25, random_state=33)
标准化
# %% from sklearn.preprocessing import StandardScaler ss = StandardScaler() X_train = ss.fit_transform(X_train) X_test = ss.transform(X_test)
使用k近邻分类器对数据进行训练
from sklearn.neighbors import KNeighborsClassifier # 使用K近邻分类器对测试数据进行类别预测,预测结果储存在变量y_predict中。 knc = KNeighborsClassifier() knc.fit(X_train, y_train) y_predict = knc.predict(X_test)
测试集预测结果如下
查看评分