相关性的计算 实战
实战二
相关分析与回归分析的区别和联系
回归问题
最小二乘回归法
实战
题一
习题一
import numpy as np
from sklearn import linear_model
X=[522,539,577,613,644,670,695,713,741,769,801,855,842,860,890,920]
Y=[6700,7136,7658,7784,8108,7583,8002,8442,8158,8683,9317,9675,8542,8584,9612,9719]
n=np.array(X)
x=np.array(X).reshape(-1,1) #把向量转化为矩阵形式
y=np.array(Y).reshape(-1,1)
print(n.shape) #观察reshape(-1,1)的作用,加上以后变成16行1列的矩阵
print(x.shape)
lr=linear_model.LinearRegression() #建立线性回归模型
lr.fit(x,y)
print(lr.coef_) #y=ax+b方程 a的系数
print(lr.intercept_) #y=ax+b方程 b的系数
多元线性回归与梯度下降法
常用随机下降梯度算法
取暖费用预测
取暖费用预测
import numpy as np
import pandas as pd
from sklearn import linear_model
A=[250,360,165,43,92,200,355,290,230,120,73,205,400,320,72,272,94,190,235,139]
B=[35,29,36,60,65,30,10,70,21,55,54,48,20,39,60,20,58,40,27,30]
C=[3,4,7,6,5,5,6,10,9,2,12,5,5,4,8,5,7,8,9,7]
D=[6,10,3,9,6,5,7,10,11,5,4,1,15,7,6,8,3,11,8,5]
x=np.array([B,C,D]).T #温度 厚度 年数 三个自变量合并,并转置
print(x)
print(x.shape) #20行3列
y=np.array(A).reshape(-1,1) #取暖费为因变量,变为20行 1列
print(y.shape)
lr=linear_model.LinearRegression()
lr.fit(x,y)
print(lr.coef_) # 三个自变量前面的系数k1 k2 k3
print(lr.intercept_) # y=k1x1+k2x2+k3x3+b 的b
test=np.array([30,5,10]).reshape(1,3) #测试的值 变为一行三列
print(test)
print(test.shape) #一行三列
print('取暖费为:',lr.predict(test))