热爱学习的小伙伴可以和我交流共同学习进步
数据分析由三大重要部分组成:
1.数据采集。它是我们的原材料,因为任何分析都是需要数据源;
2.数据挖掘。它可以说是最“高大上”的部分,也是整个商业价值所在。数据挖掘的核心是挖掘数据的商业价值,也就是我们所谈的商业智能BI
3.数据可视化。它可以说是数据领域中万金油的技能,可以让我们直观的了解到分析数据的结果。
一 数据采集
1.采集工具:八爪鱼,自动抓取的神器,它可以帮你抓取 99% 的页面源。
2.python爬虫:可编写,采集,存储数据,以及自动化采集设计。
二数据挖掘
它可以说是知识型的工程,相当于整个专栏中的“算法”部分。首先要知道他的基本流程,算法,以及底层的数学基础。
1.基本流程:商业理解,数据理解,数据准备,模型建立,模型评估,上线发布
2.算法:分类算法,聚类算法,关联分析,连接分析
3.数学基础:概率论和数据统计,线性代数,图论,最优化方法