线性回归

##线性回归

import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression

#1.导入数据
#data = pd.read_csv(’’)

#2.数据预处理
#略,最终生成x_train,y_train,x_test

#此处用随机生成数据
#数据量m
m = 20
#特征数n
n = 6
x_train = pd.DataFrame(np.random.rand(m, n))
y_train = pd.DataFrame(np.random.rand(m, 1))
x_test = pd.DataFrame(np.random.rand(m, n))
#3.模型训练
lr = LinearRegression()
lr.fit(x_train, y_train)

#4.模型预测
y_predict = lr.predict(x_test)

print(y_predict)

#参数列表与调参方法

LinearRegression(fit_intercept=True, normalize=False, copy_X=True, n_jobs=None)

fit_intercept:boolean,optional,默认为True。是否计算此模型的截距。如果设置为False,则不会在计算中使用截距(例如,预计数据已经居中)。
normalize:布尔值,可选,默认为False。fit_intercept设置为False时,将忽略此参数。如果为True,则回归量X将在回归之前通过减去平均值并除以l2范数来归一化。
copy_X:布尔值,可选,默认为True。如果为True,则将复制X; 否则,它可能会被覆盖。
n_jobs:int或None,可选(默认=None)。用于计算的作业数。这只会为n_targets> 1和足够大的问题提供加速。 None表示1 。 -1表示使用所有处理器。

上一篇:07-转换器与估计器


下一篇:fit_transform和transform的区别