回归=值
分类=类
有监督:有标签
无监督:无标签(物类聚,人群分)
what is machine learning?
任务T,合理性能度量方案P,学习经验E,随着大量优质E(梯度下降),性能提高
(设计系统,学习,参数优化,预测问题)
class2
class3
class4
步骤:
- 加载数据(预处理)
- 分割数据
- 建立模型
- 训练模型
- 验证模型
class5 线性回归
class6逻辑回归
逻辑回归:二分类
class8
KNN
- 计算测试样本和所有训练样本的距离
- 为测试样本选择k个与其距离最小的训练样本(K不一定是奇数)
- 统计出k个训练样本中大多数样本所属的分类
- 这个分类为分类数据所属的分类
考点1:学过哪些模型?
预测房价? 线性回归
分类:KNN,决策树,逻辑回归
(逻辑回归:预测某个类别得1的概率,小于0.5为负,大于0.5为正?)
(KNN:鸳鸯花分类?)
考点2:独热编码变成多少?
类别型特征,如:性别(男、女)
sklearn.preprocessing.OneHotEncoder()
考点3:模型评价指标和模型选择
真正例TP, 假正例FP,真反例TN,假反例FN,
召回率
精确率
FPR
训练集:求参数
测试集:测试模型