阿里云天池大赛赛题解析——机器学习篇-赛题一(2)

1.4 评估指标

阿里云天池大赛赛题解析——机器学习篇-赛题一(2)阿里云天池大赛赛题解析——机器学习篇-赛题一(2)

1.5 赛题模型

在赛题分析中,很重要的一点就是要根据赛题的特点和目标明确问题的类型,并选择合适的模型。在机器学习中,根据问题类型的不同,常用的模型包括回归预测模型和分类预测模型。

1. 回归预测模型

回归预测模型的预测结果是一个连续值域上的任意值,回归可以具有实值或离散的输入变量。我们通常把多个输入变量的回归问题称为多元回归问题,输入变量按时间排序的回归问题称为时间序列预测问题。

图1-1-5 所示为回归预测模型的分析示例图。

阿里云天池大赛赛题解析——机器学习篇-赛题一(2)

图1-1-5 回归预测模型分析示例图

2. 分类预测模型

分类预测模型的分类问题要求将实例分为两个或多个类中的一个,并具有实值或离散的输入变量。其中,两个类别的问题通常被称为二类分类问题或二元分类问题,多于两个类别的问题通常被称为多类别分类问题。

图1-1-6 所示为分类预测模型的分析示例图。

阿里云天池大赛赛题解析——机器学习篇-赛题一(2)

图1-1-6 分类预测模型分析示例图

3. 解题思路

在本赛题中,需要根据提供的V0~V37 共38 个特征变量来预测蒸汽量的数值,其预测值为连续型数值变量,故此问题为回归预测求解。

回归预测模型使用的算法包括线性回归(Linear Regression)、岭回归(Ridge Regression)、LASSO(Least Absolute Shrinkage and Selection Operator)回归、决策树回归(Decision Tree Regressor)、梯度提升树回归(Gradient Boosting Decison Tree Regressor)。

在后面的模型训练中,我们将采用这些模型来预测目标值。

上一篇:VB编程:SelectCase多分支选择结构实例测试生肖运势


下一篇:阿里云天池大赛赛题解析——机器学习篇-赛题一(3)