4_鸢尾花(k临近)

sklearndataset里面有鸢尾花数据集接口,本篇使用sklearn官方数据集,使用k近邻算法。

导入加载器,获取数据.

4_鸢尾花(k临近)

 

4_鸢尾花(k临近)

 

查看数据规模,养成良好习惯

4_鸢尾花(k临近)

 

数据分割

# %%
from sklearn.model_selection import train_test_split
# %%
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.25, random_state=33)

标准化

# %%
from sklearn.preprocessing import StandardScaler
ss = StandardScaler()
X_train = ss.fit_transform(X_train)
X_test = ss.transform(X_test)

4_鸢尾花(k临近)

 

4_鸢尾花(k临近)

 

使用k近邻分类器对数据进行训练

from sklearn.neighbors import KNeighborsClassifier
# 使用K近邻分类器对测试数据进行类别预测,预测结果储存在变量y_predict中。
knc = KNeighborsClassifier()
knc.fit(X_train, y_train)
y_predict = knc.predict(X_test)

测试集预测结果如下

4_鸢尾花(k临近)

 

 查看评分

4_鸢尾花(k临近)

 

上一篇:聚类算法2-聚类算法api初步使用


下一篇:LightGBM简单例子