Machine Learning
机器学习,什么是机器学习。我觉得尚学堂的培训老师讲的很不错,就是两个字来介绍。------拟人。
就是模拟人类的思维方式。
老师举的例子:
和女朋友约会,第一次约会,约定是晚上七点到,但是女朋友7点十分才到。
第二次,约会,约定也是晚上七点到,但是女朋友还是7点十分才到。
那么第三次呢,这位男同志就可能会通过前两次约会的经验,做出女朋友迟到十分钟的预测,就是概率。也晚十分钟出门,十分钟可以看看书,听听歌什么的。那么这次预测就是对未来做出有价值的判断。
也有可能,前两次是女朋友来的路上碰上堵车,或者那条路修路,绕道。
那么如果约会次数多,一年365天,有300天都是迟到,那么下一次女朋友约会迟到的概率就会很大。
所以,机器学习,是建立在数据的基础上的预测,在海量数据中提取特征值,通过算法建立一个模型。通过测量数据来判断这个模型的正确性。然后改变参数,提高预测的正确性。
斯坦福大学的机器学习课程中,给出了两个定义。
第一种是:
The field of study that gives computers the ability to learn without being explicitly programmed.
使计算机无需显式编程就能学习的研究领域。
第二种提供了一个更现代的定义:
"A computer program is said to learn from experience E with respect to some class of tasks T and performace measure P ,if its performance at tasks in T,as tasks in T,as measured by P, improves with experience E"
“据说一个计算机程序可以从经验E中学习一些T类任务的执行情况并测量P,如果它在T任务中的表现,也就是T任务中的表现,如P所测量的,随着经验E的提高而提高,那么它就可以测量P了。”
又举了个例子:
Example:playing checkers.
玩跳棋
E = experience of playing many games of checkers.
E = 玩很多盘跳棋的经验
T = the task of playing checkers.
T = 玩跳棋的任务
P = the probability that the program will win the next game.
P = 程序下一句赢得概率
In generally, any machine learning problem can be assigned to one of two broad classifications:
总而言之,任何机器学习问题可以被分为两大类
Supervised learning and unsupervised learning.
监督性学习和非监督性学习。