来源 | HaaS技术社区
1、高速发展的人工智能
说到人工智能,大家并不陌生,无论是围棋大战中战胜顶尖段位人类围棋手的Alpha Go,还是弹跳自如的波士顿机器狗。而无数的科幻电影更是为人类展示了一个无比美好的未来,而在科幻电影中的场景,正逐渐融入到我们的日常生活中。
当清晨从睡梦中被柔和的语音唤醒,叫醒你的可能是天猫精灵智能语音机器人,并且温馨地提醒你今天的天气情况与行程安排。
离开家出门时,自动驾驶汽车自动驶出车库并载你去你的目的地,而你可以在车上继续休息或关注机器人为你推送的新闻热点。
而到了工作单位,自动车牌识别,人脸识别打卡,机器狗为你送咖啡。许多的工作包括复杂的作词作曲,机器人都能为你分忧解难了。
闲暇时刷刷短视频,各种AI变脸、老照片翻新、长腿收敛 特效等让大家玩的不亦乐乎。
背后的背后,都是高速发展的人工智能技术提供了强大的技术支撑。
常见的人工智能使用场景有哪些呢?
1.1、智能语音交互
智能语音交互(Intelligent Speech Interaction),是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。
适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,在金融、保险、司法、电商等多个领域均有应用案例。
1.2、人脸识别
人脸识别(Face Recognition)实现了图像或视频中人脸的检测、分析和比对,包括人脸检测定位、人脸属性识别和人脸比对等独立服务模块,可为开发者和企业提供高性能的在线API服务,应用于人脸AR、人脸识别和认证、大规模人脸检索、照片管理等各种场景。
1.3、图像识别
图像识别服务(Image Recognition)基于大数据和深度学习实现,可精准识别图像中的视觉内容,包括上千种物体标签、数十种常见场景等,包含场景分类、图像打标、鉴黄等在线API服务模块,应用于智能相册管理、图片分类和检索、图片安全监控等场景。
1.4、图像搜索
图像搜索服务 (Image Search)是以深度学习和大规模机器学习技术为核心,通过图像识别和搜索功能,实现以图搜图的智能图像搜索产品。
图像搜索服务在基于图像识别技术基础上,结合不同行业应用和业务场景,帮助用户实现相同或相似图片搜索。
电商场景拍照识物
1.5、自然语言处理
自然语言处理(Natural Language Processing)是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,旨在帮助用户高效的处理文本,已经广泛应用在电商、文化娱乐、金融、物流等行业客户的多项业务中,取得了良好的效果。
未来,自然语言处理还将为用户带来更多更有价值的服务。非结构化文本数据通过自然语言处理解析并转变为结构化数据,可以被计算机高效处理,从而构建行业知识图谱,实现人机交互和机器阅读理解。
1.6、机器学习与模型训练
以阿里云的PAI及其学习平台为例,PAI起初是一个定位于服务阿里集团的机器学习平台,致力于让AI技术更加高效、简洁、标准的被公司内部开发者使用。对集团内,PAI服务了淘宝、支付宝、高德等部门的业务。
随着PAI的算法的不断积累,2015年底PAI作为天池大赛的官方比赛平台在阿里云正式上线,也成为了国内最早的云端机器学习平台之一。随着PAI在阿里云的业务的不断发展,2018年PAI平台正式商业化,目前已经在公有云积累了数万的企业客户以及个人开发者,是目前国内领先的云端机器学习平台之一。
2、常见AI学习打造路径
人工智能技术涉及到的知识非常深,如果想要在产品中使用人工智能技术,要如何进行学习打造呢?
传统的人工智能学习打造路径有:
2.1、机器视觉理论
机器视觉是通过光学的装置和非接触的传感器自动地接收和处理一个真实物体的图像,以获得所需信息或用于控制机器人运动的装置。通俗地说,机器视觉就是用机器模拟生物宏观视觉功能,代替人眼来做测量和判断。
人看到事物的过程首要前提是,外界物体发射或反射的光觉信息经过眼球屈光系统的角膜、晶状体、玻璃体,在眼底视网膜上形成图像,视网膜对这些光觉信息进行分析、整合、转换,以脉冲微电信号的方式,经过视觉传导神经传导至大脑的视觉中枢皮质系统,并形成视觉。而机器视觉是通过摄像机来获取环境图像并将他们转化成数字信号,使用计算机实现对视觉信息进行处理,来认知周围环境的信息。机器视觉不仅能模拟人眼的功能,而且最重要的是机器通常能完成人眼所不能胜任的任务。
对于已经获取到的机器视觉内容,就需要进行更进一步的信息预处理、特征提取与分类检测等。
2.2、统计学习理论
统计学习是指通过计算机基于数据构建概率统计模型,并运用模型对数据进行预测与分析。这里的数据指计算机及互联网上的各种数字、文字、图像、视频、音频数据以及它们的组合。统计学习关于数据的基本假设是同类数据具有一定的统计规律性。
近20年来,统计学习无论是在理论还是在应用方面都得到了巨大的发展,有许多重大突破,实践证明:统计学习是处理海量数据的有效方法,我们处于一个信息爆炸的时代,海量数据的处理与利用是人们必然的需求。现实中的数据不但规模大,而且常常具有不确定性,统计学习往往是处理这类数据最强有力的工具。
统计学习是计算机智能化的有效手段。智能化是计算机发展的必然趋势,也是计算机技术研究与开发的主要目标,近几十年来,人工智能等领域的研究表明,利用统计学习模仿人类智能的方法,虽有一定的局限性,但仍然是实现这目标的最有效手段
2.3、神经网络
人工神经网络(Artificial Neural Network,ANN),是20世纪80年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络。
最近十多年来,人工神经网络的研究工作不断深入,已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。
人工神经网络模型中常见的类型有以下几种:
- 卷积神经网络(Convolutional Neural Networks,CNN)
- 循环神经网络(Recurrent Neural Network,RNN)
- 生成对抗网络(Generative Adversarial Networks,GAN)
在机器视觉领域,应用最广的神经网络模型是CNN,随着其研究的不断深入,被广泛应用于图像识别,图像分割,目标检测,目标追踪等。
2.4、模型训练算法调优
不管是在实际工程中进行部署还是参加竞赛,训练神经网络的目的都是得到一个表现优异的模型。而获得一个优秀的模型需要考虑许多方面的影响:
- 首先是使用哪种类型的模型——是线性回归,SVM还是CNN?
- 其次是该模型中要包含哪些自变量(也称为特征选择);
- 完成这些任务后,要考虑的第三个方面是超参数调整,目的是找到所要使用的最佳超参数。
这就是为什么应该关心超参数调整的原因:就像模型选择或特征选择一样,它具有极大地提高模型准确性的能力。
2.5、算法硬件平台与部署
以打造一个视觉智能场景为例,需要运行起来上面提到的各种算法能力,需要用到比较强大的硬件如以下视觉AI场景套件。
一个典型的在AI BOX上部署人脸识别算法的流程如下:
完整的部署好后,就可以在您的场景中使用强大的AI能力了。
3、云端一体AI方案探索
从前两章中不难看出,人工智能已经深入到生活的方方面面,但是涉及到的知识深度和广度都是相当复杂的,要做出成熟的产品非常不容易。
有没有可以方便使用的方式呢?
有,HaaS云端一体AI解决方案就提供了非常强大的AI能力,将前面第二章中涉及到的许多知识点具像化。
并且将2.5中大量的AI算力部署在云上,打包成各种方便调用的服务,相当于AI领域的水电煤。这么做为开发者带来了三个极大的好处:
3.1、快速接入,即开即用
对于想用AI能力做产品的的开发者,无需从头到位学习人工智能系列的知识,只需要开通相应的服务,调用几个API就能使用。
真正做到AI的易上手低门槛,可以专注于我们的业务逻辑。
以HaaS云端一体AI打造的“老板来了”为例,需要的功能是 比对摄像头 采集到的人像是不是老板,实际需要的是人脸比对功能。
而阿里云AI服务中,就提供了这个功能,只需要开通这个服务,然后调用2个API即可。
然后,在设备端只需要读取摄像头数据,然后抽取一定帧数送到云上进行比对,获取比对结果即可。
3.2、瘦终端也能有大AI能力
因为将大量的AI能力部署在云上,设备端可以做到非常的轻量级,只需要做基本的数据采集和处理,极大的降低了设备硬件的需求,更为适合物联网的各种场景需求。
在HaaS 云端一体AI解决方案中,HaaS硬件开发板只需要做基础的摄像头数据采集,传送到服务端后由云上的视觉智能平台提供服务,设备端只需要一个轻量级的 Cloud AI Agent就好了。
3.3、丰富的云端一体AI能力
在视觉、语音、机器学习等各方面,人工智能都在高速的发展。以下是阿里云提供出来的部分人工智能类服务产品。
并且,这些服务背后有一大堆专家将云端一体的AI服务做不断的优化,专业的团队做专业的事情,而AI能力的使用者,只需要使用他们提供的服务就好。
不重复造*,而且还是这么专业的*。
4、云端一体的AI未来
4.1、持续不断地创新
除了上面提到的 监控“老板来了”,现实生活中还有非常多有意思的场景,物联网的奇妙之处就在于它的多样化。
没有一个产品能把所有场景都覆盖,而HaaS云端一体AI解决方案,已经为物联网场景式创新提供了非常多的积木,大家可以快速拼装出你所需要的带AI能力的产品。
例如,大家每天在超市用到的称重秤,根据菜品x重量再打出价码单付款。但是,超市里的菜品非常多,要选择到这个产品有时候就需要翻很多页,还容易搞错。
就有开发者突发奇想,在称重秤上加了一个摄像头,来识别它是土豆还是青椒。这样,用户只需要将菜放上去,无需选择,价码单就直接打出来了。非常快速。
4.2、云+端的AI未来
云上AI能力这么强大,服务这么丰富,是不是有了 云上AI之后,设备端本地AI就可以不需要了呢?
也不是,对于比较敏感的个人隐私信息,比如人脸识别、声纹识别比对,这些还是放在端上更能保护个人隐私。
另外,对于 如 “天猫精灵”语音唤醒,不用讲家庭场景实时声音信息采样后送到云上进行分析,也确保了家庭的信息隐私。
最后,随着5G等技术的发展,网络速度越来越快,数据传输将不再有瓶颈。
云端一体AI既拥有强大丰富的AI能力,又能将设备端的硬件资源需求将到很低,再辅以端上部分隐私保护性的AI能力,未来全民AI,万物智能化的时代必将加速到来!
更多精品好文