目录
前言
本文是机器学习初学系列的第一篇文章,是我边学边写的记录性的过程。
我将会持续在csdn上更新自己的学习记录。
一、课程主要内容
1.1 算法原理及相关内容
- KNN
- 线性回归
- 多项式回归
- 逻辑回归
- 模型正则化
- PCA降维
- SVM支持向量机
- 决策树
- 随机森林
- 集成学习
- 模型选择
- 模型调整
1.2 课程主要内容
- 深入理解算法的基本原理
- 实际使用算法解决真实场景的问题
- 对不同的算法进行对比实验
- 对同一算法的不同参数进行对比实验
- 对部分算法进行底层编写
1.3 其他重要任务
- 如何评价算法的好坏
- 如何解决过拟合和欠拟合
- 如何调节算法的参数
- 如何验证算法的正确性
注:对于调库,这是一件正常的事情,我们不反对调库,但在调库的时候应该对调用API概念原理有所了解,深入了解算法可以更好帮助我们选择算法
本文希望兼顾
-
算法原理的学习
-
部分算法底层的编写
-
sklearn机器学习库的使用
二、课程环境
语言:Python3
框架:scikit-learn
其他:numpy,matplotlib
IDE:Jupyter Notebook, Pycharm
数学:高等数学,线性代数,概率论
三、课程所使用的数据集
主要拿 scikit-learn上的toy datasets来练手
之所以称为toy,是因为这些数据过于简单,过于工整,这在现实中是不常见的。