sklearn通用学习模式

 1 from sklearn import datasets#引入数据集,sklearn包含众多数据集
 2 from sklearn.model_selection import train_test_split#将数据分为测试集和训练集
 3 from sklearn.neighbors import KNeighborsClassifier#利用邻近点方式训练数据
 4 
 5 ###引入数据###
 6 iris=datasets.load_iris()#引入iris鸢尾花数据,iris数据包含4个特征变量
 7 
 8 #print(iris)
 9 
10 iris_X=iris.data #特征变量
11 iris_y=iris.target #目标值
12 # print(iris_X)
13 # print(iris_y)
14 '''
15 [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
16  0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
17  1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
18  2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
19  2 2]
20 '''
21 X_train,X_test,y_train,y_test=train_test_split(iris_X,iris_y,test_size=0.3)#利用train_test_split进行将训练集和测试集进行分开,test_size占30%
22 # print(y_train)#我们看到训练数据的特征值分为3类
23 '''
24 [1 0 0 1 1 1 1 0 1 2 2 2 1 0 1 1 2 1 0 0 2 2 0 2 1 2 1 0 2 2 2 2 2 0 2 2 0
25  2 0 1 1 2 0 0 2 1 1 1 0 0 2 0 1 2 0 1 2 0 0 0 2 1 2 2 1 1 2 0 2 0 1 1 0 1
26  2 2 1 1 2 1 0 2 2 2 1 2 2 1 2 1 0 2 0 0 0 2 1 2 0 1 1 0 1 1 2]
27  '''
28 #print(X_train)
29 ###训练数据###
30 knn=KNeighborsClassifier()#引入训练方法
31 knn.fit(X_train,y_train)#进行填充测试数据进行训练
32 
33 ###预测数据###
34 print(knn.predict(X_test))#预测特征值
35 
36 '''
37 [2 1 2 0 1 1 0 0 1 1 0 0 1 1 1 0 2 1 2 0 0 0 1 0 0 0 1 1 2 1 2 0 0 0 1 0 2
38  2 1 1 0 1 1 1 2]
39 '''
40 print(y_test)#真实特征值
41 '''
42 [2 1 2 0 1 1 0 0 1 1 0 0 1 1 1 0 2 1 2 0 0 0 2 0 0 0 1 1 2 1 2 0 0 0 1 0 2
43  2 1 1 0 2 1 1 2]
44 '''

 

上一篇:sklearn数据集的导入及划分


下一篇:机器学习-实验一