这是第❾篇神扯:扯扯机器学习。
虽然,AI火了很久,但是谈起人工智能、机器学习、深度学习这些概念,吃瓜群众还是一脸懵逼。
今天,我们来系统讲讲,这些概念到底有啥区别和联系。
下面这张图看得比较明白,人工智能、机器学习和深度学习,其实三者是层层包含的关系。
人工智能的概念,起源于1950年代,包含多个分支,比如专家系统、进化计算、模糊逻辑、推荐系统,也包括最重要的分支:机器学习。
说白了,机器学习是实现人工智能的方法之一。
而机器学习,又细分了很多种学习“方法”:有监督学习、无监督学习、强化学习、深度学习等等。
先来简单扒一扒各种学习方法——
▌有监督学习
由“专家”先把数据的特征标记好,交给机器来学习这些特征,然后,机器会得到一个“模型”。这个过程,称之为训练。
得到“模型”以后,机器在看到没有标记的新数据,也能活学活用,把符合模型特征的找出来。这个过程,称之为推理。
这个学习过程,有所谓的砖家参与“监督”,所以叫做“有监督学习”。
▌无监督学习
整个过程,没有砖家参与标注数据,所有的数据都是一脸懵逼的进去,机器经过一番研究之后,会懵懂滴从中找出一些规律,然后输出结果。
比如,机器并不能学习并识别猫的模型,但是可从海量的猫图片中,发现黑猫白猫两大类,然后把他们分类。
这,就是“无监督学习”。
▌强化学习
在机器学习中,还有一种方法,叫做强化学习,俗称:打一巴掌,给个甜枣。让机器对问题作出判断,如果机器给出了错误的答案,就对机器进行“惩罚”,给与负面反馈。
如果机器给出了正确的答案,就对机器进行“奖励”,给与正面反馈。
整个过程,很像训练马戏团的猴子,久而久之,机器对这类事物的判断就会越来越趋向正确的方向。
通过奖惩来进行强化,这就是“强化学习”。
▌深度学习
接下来,轮到了机器学习领域最重要的方法:深度学习。深度学习也使用了有监督/无监督学习的方法,但近10年里,深度学习发展迅猛,现在已经在机器学习中自成一派,成了当红炸子鸡。
虽然深度学习并不像上面图中那样,把机器沉在深水中学习,但是,深度学习的“水”还是挺深的。
深度学习采用了“深度神经网络”,这个“深度”其实是指神经网络的层数。
神经网络有点像一个多级的水管系统,左边是数据输入,中间设置了很多阀门,通过不断调节每个阀门的出水量,最终,让右边的输出,达到我们预期的结果。
不断调节阀门、优化结果的过程,就是对神经网络进行训练,这个过程需要大量的数据输入,也需要消耗大量的算力。
最终,训练优化好的“水管网”(模型),才能部署到生产系统中,学以致用。
如果从0到1回放整个过程,我们会发现,要完成一次机器学习/深度学习实战,非常复杂。
六步跑下来,一顿操作猛如虎。
企业需要有数据、有算力、懂算法、懂场景,要有数据科学家、行业业务专家、系统工程师、开发工程师、运维工程师……
难怪AI落地这么难,因为这个过程确实很艰辛。
幸运的是,现在主流的公有云服务商,都逐步开始推出全托管式的机器学习平台。
这就像是个机器学习全家桶,在云上一站式搞定机器学习的所有流程。
在这其中,AWS推出的Amazon SageMaker表现格外出众,堪称“桶神”。
这个桶里,包含了一系列的工具,从数据集准备到模型构建、训练、监控、优化,再到生产部署、大规模扩展,全部一站式完成。
无论数据科学家还是开发者,甚至是吃瓜小白尝鲜,都可以轻松玩转机器学习。
从编写代码、创建任务、多人协作,到开启训练、部署模型、参数调优、迭代回溯,以及后期的应用和规模化部署,屁股不挪窝,就可以轻松走起来。
再举个具体的例子吧↓
Amazon SageMaker有个很强大的机器学习自动化组件,叫做Autopilot,它能自动训练模型,并让使用者能了解和控制整个过程而不是只提供个黑盒模型。
Amazon SageMaker ,贯穿了整个机器学习的工作流程,而且所有组件全部支持按需付费,让机器学习投入生产省时、省力、省钱!
目前,全球已经有数以万计的客户利用SageMaker加快机器学习部署,如今,这种便利,中国用户也可以享受到了↓
2020年4月30日,Amazon SageMaker在AWS中国(宁夏)区域和(北京)区域双双正式上线!
如果我们再通盘捋一遍AWS的AI能力,就会发现,SageMaker只是一个“小全家桶”,而AWS还有个更大的“AI全家桶”。
这个“大桶”,分三层——
最上层,是AWS预制的各类通用人工智能服务,比如视觉识别、语音识别、文字翻译、反欺诈检测等等,可以直接调用。
中间层,就是SageMaker了,是机器学习一条龙服务,快速构建、训练和部署自己的模型。
最下面一层,是机器学习基础架构,包含了各种框架、算法、专门用于ML的系统镜像和容器,还有CPU/GPU资源,以及AWS为AI定制的硬件和芯片。这一层,可以让资深人员或者组织,创建更为复杂的机器学习任务。
SO,如果你想实战AI,随手选个“桶”,搞定!