第一讲 机器会学习么?--介绍学习-----学习总结

机器学习定义:

We define machine learning as a set of methods that can automatically detect patterns in data, and then use the uncovered patterns to predict future data, or to perform other kinds of decision making under uncertainty (such as planning how to collect more data!).

大数据、人工智能、机器学习和深度学习:

第一讲  机器会学习么?--介绍学习-----学习总结

 

 机器学习方法的分类:

有监督学习(supervised learning) 数据集中的样本带有标签,有明确目标 回归和分类

数据集中的样本带有标签

目标:找到样本到标签的最佳映射

应用场景:垃圾邮件分类、病理切片分类、客户流失预警、客户风险评估、房价预测等。

典型方法:回归模型:线性回归、岭回归、LASSO和回归样条等 分类模型:逻辑回归、K近邻、决策树、支持向量机等

 

无监督学习(unsupervised learning) 数据集中的样本没有标签,没有明确目标 聚类、降维、排序、密度估计、关联规则挖掘

根据数据本身的分布特点,挖掘反映数据的内在特性

聚类:将数据集中相似的样本进行分组,使得: 同一组对象之间尽可能相似; 不同组对象之间尽可能不相似。

应用场景: 基因表达水平聚类:根据不同基因表达的时序特征进行聚类,得到基因表达处于信号通路上游还是下游的信息 篮球运动员划分:根据球员相关数据,将其划分到不同类型(或者不同等级)的运动员阵营中 客户分析:把客户细分成不同客户群,每个客户群有相似行为,做到精准营销

例子:

第一讲  机器会学习么?--介绍学习-----学习总结

 

 

 

强化学习(reinforcement learning) 智慧决策的过程,通过过程模拟和观察来不断学习、提高决策能力 例如:AlphaGo

第一讲  机器会学习么?--介绍学习-----学习总结

 

 数据集:

第一讲  机器会学习么?--介绍学习-----学习总结

 

 第一讲  机器会学习么?--介绍学习-----学习总结

 

 

一般流程:

第一讲  机器会学习么?--介绍学习-----学习总结

 

 过度拟合问题:

第一讲  机器会学习么?--介绍学习-----学习总结

 

 

模型选择:

第一讲  机器会学习么?--介绍学习-----学习总结

 机器学习的数学结构:

数据也是有数学结构的,没有数学结构我们便无法处理数据。

度量结构:表示数据之间的距离。

网络结构:有些数据本身就有网络结构,如社交网络。如果没有,可以利用度量结构给数据附加一个网络结构。

代数结构:将数据看作向量、矩阵或更高阶的张量。

几何结构:流形、对称性等

度量结构:以文本处理为例

第一讲  机器会学习么?--介绍学习-----学习总结

 

 其他距离:

第一讲  机器会学习么?--介绍学习-----学习总结

 

 k近邻:

第一讲  机器会学习么?--介绍学习-----学习总结

 

 网络结构

第一讲  机器会学习么?--介绍学习-----学习总结

 

 PageRank算法

第一讲  机器会学习么?--介绍学习-----学习总结

 

 

Scikit-learn概览

Scikit-learn

Python用于数据建模的第三方库

实现主要的机器学习、数据挖掘算法 Scikit-learn的

主要功能:

数据集预处理

数据集划分

构建模型

模型提升

模型评估

常用函数:

第一讲  机器会学习么?--介绍学习-----学习总结

 

 Scikit-learn主要模块

第一讲  机器会学习么?--介绍学习-----学习总结

 

 

案例1:使用 KNN 对新闻主题进行自动分类

第一讲  机器会学习么?--介绍学习-----学习总结

 

 代码解决:http://cookdata.cn/note/view_static_note/ca759b585803e5a3fb8e0f5053cd010e/

 

 

案例2:使用 PageRank 对全球机场进行排序

第一讲  机器会学习么?--介绍学习-----学习总结

 

 

代码解决:

http://cookdata.cn/note/view_static_note/c73c2c8ae61485ac923995add62135ba/

上一篇:python之实现文件的读写


下一篇:【深度学习】One Model to Learn Them All详解