林轩田机器学习基石笔记1—The Learning Problem

机器学习分为四步:

  • When Can Machine Learn?
  • Why Can Machine Learn?

  • How Can Machine Learn?

  • How Can Machine Learn Better?

一、What is Machine Learning

Q:什么是“学习”?

A:学习就是人类通过观察、积累经验,掌握某项技能或能力。就好像我们从小学习识别字母、认识汉字,就是学习的过程。

机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规律,获得某种分析问题、解决问题的能力。

林轩田机器学习基石笔记1—The Learning Problem

机器学习可以被定义为:Improving some performance measure with experence computed from data. 也就是机器从数据中总结经验,从数据中找出某种规律或者模型,并用它来解决实际问题。

林轩田机器学习基石笔记1—The Learning Problem

机器学习应用场合大致可归纳为三个条件:

  • 事物本身存在某种潜在规律
  • 某些问题难以使用普通编程解决

  • 有大量的数据样本可供使用

林轩田机器学习基石笔记1—The Learning Problem

二、Applications of Machine Learning

机器学习在我们的衣、食、住、行、教育、娱乐等各个方面都有着广泛的应用,我们的生活处处都离不开机器学习。

1)Food

data:网上的餐厅信息(位置,评价)

skill:告诉用户去该餐厅吃饭多大可能性中毒

2)Transportation

data:一些交通信号的图片和标志

skill:准备辨认交通信号

三、Components of Machine Learning

本系列的课程对机器学习问题有一些基本的术语需要注意一下:

  • 输入x
  • 输出y

  • 目标函数f,即最接近实际样本分布的规律

  • 训练样本data

  • 假设hypothesis,一个机器学习模型对应了很多不同的hypothesis,通过演算法A,选择一个最佳的hypothesis对应的函数称为矩g,g能最好地表示事物的内在规律,也是我们最终想要得到的模型表达式。

林轩田机器学习基石笔记1—The Learning Problem

实际中,机器学习的流程图可以表示为:

林轩田机器学习基石笔记1—The Learning Problem

机器学习模型:H + A

机器学习:通过样本数据得到假设g(use data to compute hypothesis g)

四、Machine Learning and Other Fields

与机器学习相关的领域有:

  • 数据挖掘(Data Mining):use (huge) data to find property that is intersting
  • 人工智能(Artificial Intelligence):compute somthing that shows intelligent behavior

  • 统计(Statistics):use data to make inference about an unknown process

其实,机器学习与这三个领域是相通的,基本类似,但也不完全一样。

如果DM中的intersting 和ML的hypothesies 相似,则ML=DM。DM can help ML

ML can realize AI.

Statistic can be used to achieve ML.

五、总结

本节课主要介绍了什么是机器学习,什么样的场合下可以使用机器学习解决问题,然后用流程图的形式展示了机器学习的整个过程,最后把机器学习和数据挖掘、人工智能、统计这三个领域做个比较。

上一篇:3 分钟了解 JSON Schema


下一篇:Mysql:约束