人工智能的发展
人工智能的发展经历过三次高峰。第一次高峰产生于五十年代人工智能技术初步兴起,第二次热潮产生于八十年代,其代表为专家系统。目前世界上正在经历人工智能的第三次发展高峰。前两次高峰并未给社会带来预想的翻天覆地的变化,这次的高峰是否会重蹈覆辙,还是会有不同?其实,本次发展高峰有以下4个不同于以往的特点:
1.深度学习:
作为人工智能强大的辅助工具,深度学习的出现为很多尚未解决的难题提供了解决方法;
2.强大计算:
云计算和芯片算力的提升大大增加了计算机处理数据的能力;
3.海量数据:
各行各业中积累的海量数据,为人工智能的应用提供了创造价值的条件;
4.成功案例:
搜索引擎、电商推荐、涮脸支付等成功的应用案例为人工智能技术的发展提供了参考。
人工智能产业的快速增长
人工智能产业从2012年前后开始经历了一段快速发展的时期。2017年及之前全球涌现了8000余家AI创业公司,活跃的AI创业公司数量较过往增加了14倍。在2017年当中,167家中国AI公司获得了总计50多亿的USD投资。目前绝大多数公司都成立了自己的AI实验室,试图通过人工智能技术辅助公司业务发展。
AI之困境
当前AI技术虽然发展的如火如荼,但在技术实际的应用过程中仍然存在营收困难、数据差异大、核心价值难以实现、用户期望过高等多种问题。
营收问题
如何利用AI技术创造营收是AI企业面临的首要难题。根据2018年的数据统计,超过90%的AI公司营收都在亏损。公司承接的AI项目定制成本及开发所用人力成本都很高,且项目资金不易回流,造成了AI项目投入大回报低的缺陷。同时由于各家公司技术差距的不断缩小,开发AI通用产品所能获得的回报也在逐渐减少。
实验室VS真实世界
人工智能技术落地的第二个困境是实验数据与实际数据的差异巨大。由于公开数据集与真实企业数据之间的巨大差异,企业真实场景中的结果常常不能令人满意。这使得企业无法正确估量相关技术应用后的效果,大大消减了企业的信心。例如在人脸识别技术的应用中,开发者们的代码往往可以在著名人脸识别数据集LFW上取得极高的准确率。但当代码被用在真实场景中时,由于不同使用场景差异很大,代码也常常不能获得很好的效果。
另一个例子,人员重识别(Person Re-ID),公开测试数据集与实际应用的区别则更大。相较于公开数据集的数据,真实场景中的人员会穿着不同的衣服,乘坐不同的交通工具并正在进行不同的动作。这些变化都给算法的识别造成了很大的困难,使得算法的准确度大大下降。
成熟的技术VS用户的需求
成熟的技术与用户实际需求之间较大的差异是AI技术应用的第三个困境。企业的用户对AI技术抱有很高的期望,常常寄希望于通过AI解决绝大部分业务问题。实际上AI技术仅能对业务中的某一类问题提供很好的解决方法,并不能解决全部的业务需求。
AI技术和应用成功的关键因素
AI技术成功应用的关键因素往往在于其能否为企业带来相应的核心价值。AI技术的价值可以分为以下三个境界。
1.锦上添花:
若企业在锦上添花阶段投入大量人力物力,往往得不到理想的产出并会造成资源的浪费。
2.雪中送碳:
在这个境界中,企业开发的技术能为行业带来不可替代的价值,为解决某些业务问题提供了良好的解决方法。
3.无中生有:
因为某项AI技术的产生,从而衍生出相关的需求与业务。例如,手机的大屏,就是个很好的例子。用于通讯的手机通过技术的发展实现大屏观看视频、浏览网站、视频通信等需求,大屏并不是手机的“初衷”,但现在已经成为了手机不可缺少的功能。
大规模人工智能应用场景
阿里巴巴的人工智能技术研发背靠大规模人工智能应用场景,通过解决实际应用场景中出现的问题促进相应AI技术的发展。下图展示了阿里巴巴中人工智能技术的部分应用场景,下面本文将围绕其中一些AI技术应用实例进行介绍。
视觉搜索应用场景
目前视觉搜索技术的应用非常广泛,该技术普遍应用于通用搜索、商品搜素、城市搜索及原料搜索等多个领域之中。下面将以电商中的视觉搜索作为例子,介绍视觉搜索的关键技术点。
视觉搜索流程
电商的视觉搜索的流程可以分为6个部分,分别是类目识别、主体检测、特征提取、检索、排序及结果呈现。算法首先对图片中的商品类别进行识别,将商品正确划归到其所属的类别之下。在类目识别后,通过主体检测方法将待观测商品在图片中标注出来,算法会将商品图像的像素转化为可以计算的特征,商品图搜搜索引擎对得到的特征数据与索引中的数据进行特征的比对及检索,并对返回的结果进行相似度的排序,最后将经过重排后的商品列表呈现在用户面前。
特征学习
特征学习是视觉搜索中十分关键的步骤。基于深度学习的特征学习方法会在图片中提取商品的特征,也就是将图片转化成可以比较的向量。深度学习技术的出现提升了特征学习的效果,通过深度学习的方式,可以设计网络结构迫使神经网络将图像特征收敛到理想的状态,从而大大提升搜索算法的准确率和召回率。
索引和搜索系统
索引与搜索系统是视觉搜索中另外两个大挑战。如何对向量数据进行搜索是一个难点,较为常见的方法是采用量化方式处理,将图像的向量特征转变为可以索引的数据。在搜索阶段,企业搭建相应的搜索系统处理用户的搜索请求,搜索系统会将索引数据分配至多台服务器中储存,并把每个搜索请求分到不同的服务器中进行处理,最后汇总所有的搜索结果进行排序。
技术效果
淘宝App中的拍立淘功能使用视觉搜索技术实现了识别用户图片并进行商品检索的功能。下图展示了拍立淘功能的效果,可以看到系统检索出的商品与用户上传图片中的商品基本为同款同型号或类似的产品。淘宝通过这种方式减少了用户手动搜索商品的时间,大大提高了用户的购物体验。
视觉制造应用场景
视觉制造技术可以应用算法制造视觉数据,包括图像、三维图形和视频。该技术通过结合视觉分析、搜索技术,以及视觉制造引擎将用户的想法转换为可见的视觉数据。以下为视觉制造技术在不同场景下的应用实例。
AlibabaWood商品页面秒变视频
阿里巴巴应用视觉制造技术在淘宝中实现了商品页面秒变视频的功能。系统会自动进行商品页面的图像分析及文本分析,并将分析得到的数据自动生成视频。通过将静态商品页面转换为动态播放视频的形式,增加了该种商品的点击率与转化率,同时节省了制作相关视频所需的成本。
视频修复增强
使用视觉制造技术还可以实现对低质量视频的修复。一部1.5小时的老旧电影,传统手工修复要40天,AI智能修复则只需3个小时。阿里巴巴与优酷联合上线的“经典高清”专区即通过视频修复增强方式在极短的时间内对超过1000部经典老片进行自动修复,使影片焕发出了新的生命力。下图所示为通过该方式对影视剧士兵突击修复后的效果,曾在电影院高清屏幕上播放,获得了观众的大量好评。
视频植入:从点位检测跟踪到渲染嵌入
通过视频制造技术可以在视频中找到合适的位置放入企业的植入广告。视频植入技术通过算法解析视频中的场景,在较为合适的水平或垂直平面或曲面放置企业的广告并将广告无缝渲染进场景之中。这种方式帮助企业做宣传的同时,同时保证了植入广告的自然度,并且不占用观众的时间,也不破坏视频内容,不会引起观看者的反感。下图所示为视频植入技术在视频中的应用效果。
鹿班:自动平面设计
鹿班智能平台是视觉制造技术的另一应用实例。阿里巴巴设计开发的鹿班智能平台可以为使用者自动设计平面广告。使用时,鹿班平台会整合用户的文案、图片及希望的广告风格,自动生成符合用户需求的广告图片或海报。鹿班平台可以以本科毕业生的水平每秒制作8000个banners图。在2017年的双十一期间,阿里巴巴集团使用鹿班平台共生成了4.1亿个banners图,增大了双十一活动的宣传影响力,并为企业节省了很大的宣传成本。
鹿班平台的开发为企业积累了成功的经验。鹿班这种场景,也就是大批量短时间产生广告图的需求,原来是没有的,因为人力很难实现。但自动设计技术使得这种场景变成可能,从而这项技术也成为大促场景的刚需了。企业认识到AI技术的应用要注重于关注刚性需求,而不是注重于炫酷的技术。新的AI技术可以提升商业创新,商业创新则可以反哺技术上的创新。
视觉诊断
视觉诊断技术为AI技术的另一重要应用,可以分为两类:诊断人,也就是医疗影像技术;诊断产品或机器,也就是工业视觉技术,特别是质量检测技术。以下为阿里巴巴集团在视觉诊断方面落地的技术和应用。
智能医疗健康
阿里巴巴的医疗健康AI团队致力于让AI技术辅助医疗保健,使医疗分析和健康管理变得更高效、普惠、低成本。数据统计发现在保证人们健康的诸多因素中,保持健康行为对人体健康的收效最高,因素比例高达50%,而目前人们的健康花费却大多集中在医疗服务方面。医院ICU往往成为了人们为健康花费最多的场所。如何更有效的保障人们的身体健康?阿里巴巴医疗团队通过采集人体听觉、视觉、感知及文本的数据搭建智能健康管理平台。平台会对人体数据整合分析,为糖尿病、高血脂、心血管等高危疾病的病人提供预警服务,为使用用户提供每日健康数据的分析。帮助使用者实时了解自己的身体状况,并通过身体状况信息随时调节自己的身体,达到通过促进用户保持健康行为保障身体健康的效果。
精准的冠状动脉CTA影像分析
通过深度学习方法及三维图像检测方式,CTA影像分析技术可以对心脏冠状动脉进行非常精细的分割和命名,并对冠状动脉中出现的狭窄区域及细小的病变斑块进行识别。通过精准的图像及深度学习技术可以检查出病人体内所有细微的病变。
智能骨科:脊柱MRI智能诊断
应用AI技术在骨科中可以进行脊柱结构的提取,对脊柱中锥体和椎间盘进行高精度的分割与测量。同时算法可以辅助医生进行辅助诊疗,以细粒度的级别区分退变性疾病,大大提升医生的诊断效率。
下图为智能骨科技术在髋膝关节手术测量中的应用示例。算法可以自动标注出关节中特征点的位置、角度和长度,为医生实施手术提供可靠的参考。
寻微:医疗健康搜索平台
通过阿里巴巴搭建的医疗健康搜索平台,医生可以在平台中找到与当前相似的病例信息及医疗影像,通过参考历史治疗记录及治疗经验更好的诊断病人并为之制定更合理的治疗方案。
健康精灵解决方案
阿里巴巴将有关医疗健康知识的数据构建成知识图谱,储存到天猫精灵可访问的数据库中。用户通过与天猫精灵对话可以调取数据库中的信息,天猫精灵会根据知识图谱为用户提供改善健康的方案。天猫精灵还可以对用户健康状况进行自动的分析管理。
未来健康管理
传统医学文化强调治未病,即在人体未生病时便开始对健康干预。阿里巴巴构建的未来健康管理通过认知、判断、决策、学习四个部分帮助用户防范健康问题于未然,结合AI医疗的技术为人们的身体健康保驾护航。
新冠肺炎CT影像分析
阿里巴巴AI医疗团队在2月16日成功上线了针对于新冠肺炎疫情的CT影像分析系统。系统会在20秒内对患者的患新冠肺炎的概率及病区占肺部的百分比等数据进行分析输出,预测的准确度高达96%,现已落地160多家定点医院,经过29万余次调用(最新数据),为新冠肺炎的快速确诊提供了可靠的帮助。
全基因测序数据分析
阿里巴巴为新冠肺炎设计的全基因测序分析技术在10分钟内即可完成全部基因组的比对工作,算法通过高达95%的全基因序列覆盖使得确诊的准确度基本上接近100%。由此,将全链路的新冠病毒全基因测序从两三天降低到14小时。
行业视觉诊断
行业视觉诊断技术广泛应用于电池板、纺织业、大型机械等工业制造过程中的产品质量检测和故障诊断中,旨在节省人力并提高产品的良品率和设备的精确度与稳定性。以下为行业诊断技术在各行各业中的应用实例。
太阳能电池板瑕疵检测
针对以往人工检测太阳能电池板瑕疵消耗时间长、不能全部检测等问题,阿里巴巴设计实现的太阳能电池板检测系统可以实现全量电池板的检测,通过AI技术辅助分析的方式使相关企业检测效能提升36倍。下图以准确率、速度与识别颗粒度为指标对人工与AI技术检测的效果做了对比。相较于人工方式的准确度、速度及识别颗粒度,AI技术均有很大提升。
更多行业视觉检测
行业视觉检测技术同时广泛应用于输电线路巡检、食品质检等多个行业的场景之中,并取得了良好效果。
智能养猪
阿里巴巴创建的智能养猪场使用AI技术可以实时掌握每头猪的身体状况。AI技术可以对猪场进行远程计数,通过对猪的行为与饮食分析了解猪的情况,并在必要时对猪的健康报警。
城市大脑
阿里巴巴集团设计实现的城市大脑旨在打通城市中积累的大量数据,通过人工智能分析采集的数据,并为城市提出相应的优化方案。城市大脑应用AI技术与算力相结合,分析城市中的数据,使城市治理和服务数据化、智能化,做到高效、低耗、便捷的管理城市。实现城市在治理模式、服务模式、产业发展上的多方面突破。
下图为城市大脑的结构示意图。 城市大脑首先会汇集视频、GPS、微波等多种类型的数据,并对视频数据进行分析理解,对数据产生初步的认知。对于已经生成的认知信息,城市大脑会通过AI算法对数据进行分析处理并提出优化决策,优化方案包含且不限于红绿灯优化、公交优化、事故事件报警等等。通过将城市中的要素放入搜索引擎,系统将会自动进行搜索与数据挖掘,此时系统可以同时进行可疑车搜索、发现交通规律、寻找拥堵原因等多个任务。系统在提供管理优化方案的同时提供数据预测功能,可以根据当前交通状况、天气、事件等因素对交通流量、交通事故概率等多方面数据做出预测,并基于预测数据进行相关的干预。
目前阿里巴巴的城市大脑系统已实现30余个城市或城区60余个项目的部署,企业开发的城市大脑人工智能开放创新平台支持十余家研究机构及第三方厂商的研发与部署。城市大脑系统的6组产品已广泛应用于交通、平安和市政管理等多个重要领域中。
城市大脑人工智能开放创新平台
城市大脑人工智能开放创新平台具有功能全面、使用灵活、实时性高、运行高效及开放性高等五大优点,可以为开发及研究团队提供安全可靠的AI平台层的支持。平台提供的大规模视频分析处理加速技术可以支持一台服务器同时处理超过100路视频,大大的增加了处理视频数据的效率。
全天候异常事件事故检测
城市大脑的全天候异常事故检测功能会将近实时检测到的城市中的事件事故自动排列在数据大屏上并对发生的事故不断的更新数据信息,根据事件事故的不同类型,系统自动处理或由交通警察及时进行相关处理。
杭州城市大脑交通态势/信号灯优化/事件优化
通过阿里巴巴城市大脑提供的交通态势、信号灯优化,杭州的交通通行效率比以往提升了15.3%,每天系统可报告2万起事件事故信息,准确度达96%。
杭州城市大脑:特种车优先通行
针对特殊车辆如警车、救护车、救火车等,城市大脑会通过干预信号灯、优化道路交通等方式为该种车辆保驾护航,使特殊车辆可以更快的到达目的地。
城市大脑其他功能
城市大脑同时提供车辆巡检、高危驾驶行为识别、车流量人流量预测、市政管理及智能安全检测等多个功能。通过这些功能为城市的发展提供保障。
城市3D重建和4D推理
城市大脑提供的城市3D重建及4D推理功能可以将城市的状态用实时3D沙盘的方式呈现给用户,并通过AI技术在3D沙盘上还原城市在不同时刻的运行情况。
在城市大脑的设计实现过程中,阿里巴巴AI团队通过AI技术创造出不可替代的价值,潜心理解应用场景并打磨产品功能,建立起产品的核心竞争力,最后通过打造平台建立起生态,实现了从项目到产品再到平台的演变,为城市的治理、管理提供了有力的技术支撑。
人工智能未来趋势
今天的人工智能方法论虽有局限,但各行各业之中有很多问题尚未解决,故人工智能仍有很大的发展空间。对于传统产业和数字产业,拥抱AI技术才可以更好的发展。对于人工智能的从业者而言,深入理解行业至关重要。对人工智能的商业化而言,需要用技术为客户创造足够的价值,否则无法很好的规模化落地。对于每个人来说,人工智能已经开始深入人们生活的方方面面,拥抱AI技术发展带来的变化不可避免。
人工智能技术到底是风是云是雨,取决于我们如何看待、研发或使用这些技术。如果不能选择好的路线,AI可能会如风般不实,如云般缥缈;若能可以深入研究技术,使用先进的核心技术打造产品,创造不可替代的价值,AI技术便可变成滋润万物的春雨,帮助我们走向成功。