machinefinal

回归=值

分类=类

有监督:有标签

无监督:无标签(物类聚,人群分)


what is machine learning?

任务T,合理性能度量方案P,学习经验E,随着大量优质E(梯度下降),性能提高

machinefinal

(设计系统,学习,参数优化,预测问题)

machinefinal

machinefinal

machinefinal


class2

machinefinal

machinefinal

machinefinal

machinefinal


class3

machinefinal


class4

machinefinal

machinefinal

machinefinal

machinefinal

步骤:

  • 加载数据(预处理)
  • 分割数据
  • 建立模型
  • 训练模型
  • 验证模型

class5 线性回归

machinefinal

machinefinal

machinefinal


class6逻辑回归

machinefinal

machinefinal

machinefinal

逻辑回归:二分类


class8

machinefinal

machinefinal

machinefinal

machinefinal

machinefinal

machinefinal


KNN

  • 计算测试样本和所有训练样本的距离
  • 为测试样本选择k个与其距离最小的训练样本(K不一定是奇数)
  • 统计出k个训练样本中大多数样本所属的分类
  • 这个分类为分类数据所属的分类

machinefinal

machinefinal

machinefinal



考点1:学过哪些模型?

	预测房价? 线性回归
	分类:KNN,决策树,逻辑回归
	(逻辑回归:预测某个类别得1的概率,小于0.5为负,大于0.5为正?)
	(KNN:鸳鸯花分类?)
	
	

考点2:独热编码变成多少?

类别型特征,如:性别(男、女)
sklearn.preprocessing.OneHotEncoder()

考点3:模型评价指标和模型选择

真正例TP, 假正例FP,真反例TN,假反例FN,
召回率
精确率
FPR

训练集:求参数

测试集:测试模型


网课1.1线性回归

machinefinal

machinefinal

上一篇:kNN(K- Nearest Neighbor)基本原理


下一篇:机器学习Sklearn实战——KNN算法