当变量中有分类型的变量的时候,需要将分类型的变量转换成数值型的变量。
例如:
比如某衣服有一个颜色特征,特征值为红、绿、蓝三种颜色,该特征为分类型特征,需要把它转化成数值型特征,则把这个衣服颜色需要分为三个特征,分别是红色、绿色、蓝色,则红色衣服对应的特征值为1,0,0;绿色衣服对应的特征值为0,1,0;蓝色衣服对应的特征值为0,0,1。
代码
简单例子
from numpy import genfromtxt
import numpy as np
from sklearn import datasets,linear_model
dataPath = r"D:\csv_file\Delivery.csv"
deliveryData = genfromtxt(dataPath, delimiter = ",")#csv文件分割成数组
print("deliveryData:")
print(deliveryData)
X = deliveryData[:,0:-1]
Y = deliveryData[:,-1]
print("X:")
print(X)
print("Y:")
print(Y)
regr = linear_model.LinearRegression()
regr.fit(X, Y)
print("coefficients:")
print(regr.coef_)#斜率
print("intercept:")
print(regr.intercept_)#截距
xPred = [[102,6]]
yPred = regr.predict(xPred)
print("predicted y:")
print(yPred)
---------------------