简单线性回归:使用单一的特征来预测响应值。
任务:基于自变量来预测因变量,假设两个变量是线性相关的,尝试寻求一种线性函数能够根据特征或自变量X来精确预测响应值Y。
目的:找到最佳的拟合线,最小化预测误差(观测值Yi和模型预测值Yp之间的长度),即min{sum(yi-yp)2}
步骤:
一、数据预处理
1、导入需要的库
2、导入数据集
3、检查缺失的数据并补全
4、划分数据集为训练集和测试集
5、特征缩放
二、训练
使用简单线性回归模型来对训练集进行训练。调用sklearn.linear_model中的LinearRegression来进行线性回归模型的训练。LinearRegression中的fit方法可以对LinearRegression对象进
行训练。
三、预测
利用LinearRegression中的predict函数来预测响应值。
四、结果可视化
使用matplotlib中的pyplot函数分别用不同的颜色绘制训练集、测试集的数据点和预测函数。