一、机器学习是什么?
机器学习的本质就是自动寻找函式
二、你想找什么样的函式?
1.regression(回归):
函数的输出是一个数值
比如PM2.5的预测,给machine的training data是过去的PM2.5资料,而输出的是对未来PM2.5的预测数值,这就是一个典型的regression的问题
2.classfication(分类):
1)Binary Classification(二元分类):
输出只有两个可能
2)multi-class Classification(多层次分类):
输出是让机器做选择题,从N个选项中做出正确的选择
3.generation(生成):
让机器生成有结构的复杂东西(例如:句子、图片),让机器学习怎么创造这些东西。
三、怎么告诉机器你想找什么样的函式?
1. supervised learning (有监督学习):
监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。
1)函式的loss:预测结果的出错率。用来估量模型的预测值f(x)与真实值Y的不一致程度,损失函数越小,模型的鲁棒性就越好。
2. unsupervised learning(无监督学习):
区别于supervised learning,unsupervised learning希望机器学到无师自通,在完全没有任何label(标记)的情况下,机器到底能学到什么样的知识
3. reinforcement learning(强化学习):
强化学习属于无监督学习,机器不知道正确答案,只知道自己做得好还是不好,但是机器不知道自己哪里做的不好,机器要自己想办法解决。引导机器学习的方向。
其实Alpha Go是用supervised Learning+reinforcement Learning的方式去学习的,机器先是从棋谱学习,有棋谱就可以做supervised的学习;之后再做reinforcement Learning,机器的对手是另外一台机器,Alpha Go就是和自己下棋,然后不断的进步
4.transfer learning(迁移学习):
训练数据跟测试数据的类型不一样的,例如以黑白图片训练识别数字,测试时使用了彩色图片,如何使机器也能输出正确的结果。
Transfer Learning要解决的问题是,这一堆不相干的data可以对结果带来什么样的帮助
5.meta learning(元学习):
学习如何学习
6.life-long learning(终身学习):
终身学习,不停学习
学习视频:李宏毅2020机器学习
部分学习笔记参考网络上优秀的解释,仅供自用学习记录。