线性回归算法的评测
衡量标准
i=1∑m(ytest(i)−y^test(i))2
方差与m的大小有关,例如第一个算法测试100个数据,累计误差为1000,第二个算法测试10000个数据,累计误差为99999, 如果我们仅以这个式子求出的累计误差大小衡量算法的优劣,显然是不合理的,所以我们需要让这个式子与测试数据的数量无关,所以引入均方误差MSE(Mean Squared Error)
m1⋅i=1∑m(ytest(i)−y^test(i))2
但是我们对 y 进行了平方,导致量纲与实际不一致,因此又引入了均方根误差RMSE(Root Mean Squared Error)
m1⋅i=1∑m(ytest(i)−y^test(i))2=MSEtest
平均绝对误差MAE(Mean Absolute Error)
m1⋅i=1∑m∣ytest(i)−y^test∣
我们的目标函数不会定义为绝对值的形式,因为它不是处处可导,但是它可以用来评价我们的线性回归算法,所以评价一个算法的标准可以与目标函数不同。
R 方
R Squared R2=1−∑ii(yˉ−y(i))2∑i(y^(i)−y(i))2=1−(∑i=1m(y(i)−yˉ)2)/m(∑i=1im(y^(i)−y(i))2)/m=1−Var(y)MSE(y^,y)
首先抛出问题,当我们的算法用于预测不同的线性回归问题时,其评价结果可能非常不同,例如预测房价的时候误差为几万,预测考试成绩的时候误差是几分,这样比较几万和几分就没有可比性,这就是RMSE和 RAE的局限性,因此引出 分类的准确度 :1 最好, 0 最差
R2=1−SStotalSSresidalR2=1−∑i(yˉ−y(i))2∑i(y^(i)⋅−y(i))2
分子是使用我们训练的模型的预测无擦,分母是用baseline model的预测结果
xingyze
发布了20 篇原创文章 · 获赞 5 · 访问量 7204
私信
关注