机器学习导学

 

目录

前言

一、课程主要内容

二、课程环境

三、课程所使用的数据集


 

前言

本文是机器学习初学系列的第一篇文章,是我边学边写的记录性的过程。

我将会持续在csdn上更新自己的学习记录。

 

一、课程主要内容

1.1 算法原理及相关内容

 

  1. KNN
  2. 线性回归
  3. 多项式回归
  4. 逻辑回归
  5. 模型正则化
  6. PCA降维
  7. SVM支持向量机
  8. 决策树
  9. 随机森林
  10. 集成学习
  11. 模型选择
  12. 模型调整

1.2 课程主要内容

  • 深入理解算法的基本原理
  • 实际使用算法解决真实场景的问题
  • 对不同的算法进行对比实验
  • 对同一算法的不同参数进行对比实验
  • 对部分算法进行底层编写

1.3 其他重要任务

  • 如何评价算法的好坏
  • 如何解决过拟合和欠拟合
  • 如何调节算法的参数
  • 如何验证算法的正确性

 

 注:对于调库,这是一件正常的事情,我们不反对调库,但在调库的时候应该对调用API概念原理有所了解,深入了解算法可以更好帮助我们选择算法

         

本文希望兼顾 

  1. 算法原理的学习

  2. 部分算法底层的编写

  3. sklearn机器学习库的使用

 

二、课程环境

语言:Python3

框架:scikit-learn

其他:numpy,matplotlib

IDE:Jupyter Notebook, Pycharm

数学:高等数学,线性代数,概率论

 

三、课程所使用的数据集

主要拿 scikit-learn上的toy datasets来练手

之所以称为toy,是因为这些数据过于简单,过于工整,这在现实中是不常见的。

机器学习导学

上一篇:sklearn- kmeans API


下一篇:机器学习笔记:Hierarchical_clustering with scikit-learn(层次聚类)