《李宏毅机器学习》——机器学习介绍笔记

AI需要机器具有学习的能力,而不是’IF‘的组合。AI需要机器具有自学习的能力。
机器学习的目的:寻找一个函数,可以实现辨识功能。如:
《李宏毅机器学习》——机器学习介绍笔记
输入一段语音序列,可以辨识出其所代表的英文,输入一张图片,可以辨识出图片中的图像,输出围棋中黑白棋子的位置,可以辨识出下一步落棋的位置,机器学习旨在找出具有此功能的函数。

如何找出机器学习的函数?

(1)找出一组function set(函数集),一组函数。
(2)Training Data:找出较好的function,在对应的function input中,函数可以输出我们的期望值。比如输入一个猫的图片,函数输出为”CAT“,根据训练资料判断function是好的还是不好的。
(3)根据上一步的判断,从function set中找出最好的function。
(4)将该函数应用于测试集。

按解的任务,分为Regression和Classification两类问题

Regression——函数的输出是一个数值
如预测未来PM2.5的函数,函数的输出为一个数值:
《李宏毅机器学习》——机器学习介绍笔记
其中训练集如下:
《李宏毅机器学习》——机器学习介绍笔记
以上为Regression问题的介绍。

Classification——分类问题,包括二分类和多分类问题
《李宏毅机器学习》——机器学习介绍笔记
二分类问题:
判断邮件是否是垃圾邮件,函数的输出为是/否。
训练集为:以往的邮件为训练集。
多分类问题:
新闻分类,函数输出为”政治“、”经济“、”财经“等等。
训练集为:以以往的文章及其所在分类作为训练集。

Structured Learning——Beyond Classification
相比于一般classification问题,Structured Learning机器输出的是更复杂的。比如:输入中文,输出英文;输入一段声音信号,输出声音信号对应的中文汉字。

Function Set(函数集)解决方法分类

在进行机器学习的过程中,首先要选择function set,不同的function set会得到不同的结果,我们对解决方法做如下分类:
Linear Model

Non-Linear Model
1、Deep Learning
2、SVM
3、decision tree
4、K-NN

根据学习情景分类

Supervised Learning
以上介绍的均为激励学习。

Semi-Supervised Learning
例如:在识别猫或狗的图片中,在训练集中,有一些Labelled Data,在这些数据中,会标注图片的期望输出(标注图片是猫或是狗),在训练数据时可以判断函数输出好坏;同时也会有一些unlabelled data,在这些数据中,只有图片,没有期望输出,在Semi-Supervised Learning中,这些unlabelled data也对训练有帮助。

Transfer Learning
例如:同样是在识别猫或狗的图片中,在unlabelled data中,会有一些未标注的猫或狗的图片,同时还会有一些与猫狗图片不想关的图片,在Transfer Learning中,这些数据也会对训练有帮助。

Unsupervised Learning
无师自通情况,如只让机器自己看大量的图片,然后给系统一个输入(比如小猫图片),机器可以自己输出一个小猫的图片。

Reinforcement Learning
从评价中学习,只知道做的好或不好,不知道正确的答案,类似于人类的学习过程。

文章为:哔哩哔哩《李宏毅机器学习》视频笔记

上一篇:【人工智能导论:模型与算法】线性回归 逻辑回归


下一篇:Machine Learning课程有多难?