1、什么是回归算法
回归算法是监督型算法的一种,通过利用测试集数据来建立模型,再利用这个模型训练集中的数据进行处理的算法。线性回归旨在寻找到一根线,这个线到到达所有样本点的距离的和是最小的。常用在预测和分类领域。
2、回归和分类的区别:
3、机器学习回归算法可以干什么?
(1)房价预测
(2)销售额预测
(3)贷款额度预测
4、线性回归的定义:
5、损失函数:
6、最小二乘法指正规方程
二、思考线性回归算法可以用来做什么?(大家尽量不要写重复)
(1)趋势线:一条趋势线代表着时间序列数据的长期走势
(2)流行病学:有关吸烟对死亡率和发病率影响的早期证据来自采用了回归分析的观察性研究
(3)金融:资本资产定价模型利用线性回归以及Beta系数的概念分析和计算投资的系统风险。
(4)经济学:线性回归是经济学的主要实证工具。
三、自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题)
#运用线性回归算法预测波士顿房价 from sklearn.datasets import load_boston from sklearn.linear_model import LinearRegression import matplotlib.pyplot as plt data = load_boston() data_all = data['data'] x = data_all[:, 5:6] y = data['target'] model_LR = LinearRegression() model_LR.fit(x,y) pre = model_LR.predict(x) print('模型的权值:',model_LR.coef_,'模型的截距项:',model_LR.intercept_) print('模型的预测值为:',pre) #使用可视化的方式对比拟合出的线性回归方程与真实房价的分布情况 plt.scatter(x,y,c='skyblue') #真实房价的分布(散点图) plt.plot(x,pre,c='pink') #拟合出的线性回归方程 plt.legend(['real','pre']) plt.show()
运行结果: