在训练集和测试集数据预处理时,需要对数据进行标准化
训练集使用fit_transform
测试集使用transform
例如:
StandardScaler类是一个用来讲数据进行归一化和标准化的类
1 from sklearn.preprocessing import StandardScaler 2 ss_x = StandardScaler() 3 x_train = ss_x.fit_transform(x_train) 4 x_test = ss_x.transform(x_test)
transform和fit_transform的区别
标准化公式
fit_transform方法是fit和transform的结合,fit_transform(X_train) 意思是找出X_train的和,并应用在X_train上。这时对于X_test,我们就可以直接使用transform方法。因为此时StandardScaler已经保存了X_train的
和。 参考链接: https://www.jianshu.com/p/2a635d9e894d