Spark机器学习 Day2
快速理解机器学习
有两个问题:
- 机器学习到底是什么。
- 大数据机器学习到底是什么。
机器学习到底是什么
人正常思维的过程是根据历史经验得出一定的规律,然后在当前情况下根据这种规律来预测当前的情况下该怎么做,这种过程就是一个机器学习的过程。
我们可以发现,这个过程里有规律和当前的情况。规律就是模型,当前情况就是当前的数据,会根据当前的情况会根据不同的规律来得出不同的结论来驱动下一个行为,就是数据驱动的一种决策方式,这和我们编程用的指令驱动方式是完全不同的。
机器学习是根据统计学的理论,得出影响我们结果的几个变量,有应变量和自变量。
例如想预测房价,会根据历史房价波动的因素,判断哪些会影响房价,得出一个房价模型,就会根据具体地方和具体时间来预测房价,机器学习也是从数据中得出某种模型的。
机器学习其实和人的决策过程是一样的。
大数据机器学习是什么
为什么大数据机器学习特别重要,因为无论建立模型还是得出结果都是数据驱动的过程,而数据驱动显然在大数据和分布的情况下数据面更多,得出的模型更为合理,当前情况如果有更多的数据,得出的结论会更准确。
所以大数据机器学习已经成为了业界的主流,有着非常广泛的应用。
欲知后事如何,且听下回分解!
DT大数据每天晚上20:00YY频道现场授课频道68917580