李宏毅机器学习笔记(一)概论

李宏毅机器学习笔记(一)概论

一、机器学习是什么?

机器学习的本质就是自动寻找函式

二、你想找什么样的函式?

1.regression(回归):

函数的输出是一个数值
比如PM2.5的预测,给machine的training data是过去的PM2.5资料,而输出的是对未来PM2.5的预测数值,这就是一个典型的regression的问题
李宏毅机器学习笔记(一)概论

2.classfication(分类):

1)Binary Classification(二元分类):
输出只有两个可能
李宏毅机器学习笔记(一)概论
2)multi-class Classification(多层次分类):
输出是让机器做选择题,从N个选项中做出正确的选择
李宏毅机器学习笔记(一)概论

3.generation(生成):

让机器生成有结构的复杂东西(例如:句子、图片),让机器学习怎么创造这些东西。

三、怎么告诉机器你想找什么样的函式?

1. supervised learning (有监督学习):

监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。
李宏毅机器学习笔记(一)概论

1)函式的loss:预测结果的出错率。用来估量模型的预测值f(x)与真实值Y的不一致程度,损失函数越小,模型的鲁棒性就越好。

2. unsupervised learning(无监督学习):

区别于supervised learning,unsupervised learning希望机器学到无师自通,在完全没有任何label(标记)的情况下,机器到底能学到什么样的知识

3. reinforcement learning(强化学习):

强化学习属于无监督学习,机器不知道正确答案,只知道自己做得好还是不好,但是机器不知道自己哪里做的不好,机器要自己想办法解决。引导机器学习的方向。

其实Alpha Go是用supervised Learning+reinforcement Learning的方式去学习的,机器先是从棋谱学习,有棋谱就可以做supervised的学习;之后再做reinforcement Learning,机器的对手是另外一台机器,Alpha Go就是和自己下棋,然后不断的进步

4.transfer learning(迁移学习):

李宏毅机器学习笔记(一)概论
训练数据跟测试数据的类型不一样的,例如以黑白图片训练识别数字,测试时使用了彩色图片,如何使机器也能输出正确的结果。
Transfer Learning要解决的问题是,这一堆不相干的data可以对结果带来什么样的帮助

5.meta learning(元学习):

学习如何学习
李宏毅机器学习笔记(一)概论

6.life-long learning(终身学习):

终身学习,不停学习
李宏毅机器学习笔记(一)概论
学习视频:李宏毅2020机器学习
部分学习笔记参考网络上优秀的解释,仅供自用学习记录。

上一篇:ML之SL:监督学习(Supervised Learning)的简介、应用、经典案例之详细攻略


下一篇:论文阅读——S4L:Self-Supervised Semi-Supervised Learning