导入手写体加载器
# 从sklearn.datasets里导入手写体数字加载器。 from sklearn.datasets import load_digits digits = load_digits()
分割数据
四分之一作为测试集。
from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(digits.data, digits.target, test_size=0.25, random_state=33)
数据标准化处理
# 从sklearn.preprocessing里导入数据标准化模块。 from sklearn.preprocessing import StandardScaler # 从sklearn.svm里导入基于线性假设的支持向量机分类器LinearSVC。 # 将数据标准化 from sklearn.svm import LinearSVC ss = StandardScaler() X_train = ss.fit_transform(X_train) X_test = ss.transform(X_test)
模型训练
# 初始化线性假设的支持向量机分类器LinearSVC。 # 用模型训练 lsvc = LinearSVC() #进行模型训练 lsvc.fit(X_train, y_train) # 利用训练好的模型对测试样本的数字类别进行预测,预测结果储存在变量y_predict中。 y_predict = lsvc.predict(X_test) print(y_predict)
预测结果为:
预测性能评分
# 查看评分 print( lsvc.score(X_test, y_test)) from sklearn.metrics import classification_report print(classification_report(y_test, y_predict, target_names=digits.target_names.astype(str)))