"""sklearn中
fit_transform():输入数据,直接转换
=fit():输入数据,不转换,可以计算平均值、方差等
+transform():进行数据的转换,将数据转换成值
"""
"""转换器"""
from sklearn.preprocessing import StandardScaler
s = StandardScaler()
data = s.fit_transform([[1,2,3],[4,5,6]])
print(data) #将数据进行了标准化(因为用的是StandardScaler
data = s.fit([[1,2,3],[4,5,6]])
print(data) #是一个StandardScaler类
print(type(data))
print(s.transform([[1,2,3],[4,5,6]])) #之前的fit+这里的transform后,结果和上面的fit_transform相同
data = s.fit([[2,3,4],[5,6,7]]) #fit的数据不一样,标准差和平均值就不一样
#说明fit就是计算平均值和标准差
print(s.transform([[1,2,3],[4,5,6]])) #用2和4的平均值和标准差对1和4进行了转化
#这里的transform后的数据和前一个transform的数据不一样,就是因为标准不一样
"""估计器"""
#转换器实现了特征工程的api,估计器实现了算法的api
"""
1. 用于分类的估计器:
sklearn.neighbors k-邻近算法
sklearn.naive_bayes 贝叶斯
sklearn.liner_model.LogisticRegression 逻辑回归
sklearn.tree 决策树与随机森林
2. 用于回归的估计器:
sklearn.linear_model.LinearRegression 线性回归
sklearn.linear_model.Ridge 岭回归
难点在于每个算法api当中的参数
3. 估计器的使用流程:
1. 调用fit(x_train, y_train)
2. 输入测试集的数据x_test, y_test
1. y_predict = predict(x_test)
2. 预测的准确率:score(x_test, y_test)
"""