受三星电子中国研究院邀请,新智元昨天走访研究院,了解三星的人工智能,并抢先体验了三星主推的AI技术——三星Bixby中文版部分功能。Bixby实现了对手机的多模态智能操控,以Bixby Vision、Voice、HOME、Reminder的“分身”,从对听到的语言进行语义理解、对眼睛看到内容进行视觉理解、对上下文及环境的理解,为用户提供“最强智能手机交互体验”。
因为AI,智能手机界最近发生了很多事情:苹果iPhone X掀起的人脸解锁热潮尚未散去,此前更有华为在手机上AI炫技——先是抢先一步发布麒麟970芯片,搭载专用神经网络处理器NPU(也即寒武纪1A),号称图像处理速度是三星S8的20倍,苹果7P的4倍;接着发布Mate 10,智能识别多达13种场景和物体(人脸除外),以及与微软合作在手机上的神经网络翻译——更不用说谷歌的Pixel 2,这家业界公认的AI第一巨头推出的智能手机,不但一个镜头就搞定景深摄影,而且手机上Google Assistant的声音是DeepMind WaveNet技术在支持。
那么,全球最大手机厂商的三星在做什么?
“作为全球ICT领军人物,三星怎么可能没有AI黑科技?”
在前天的小型媒体见面会上,三星电子中国研究院院长张代君如是说。就在刚刚ICCV 2017多人体姿态识别竞赛中获得第一名的三星,去年在研发上的投入是127亿美元,全球34个研发中心,7个设计中心。长线投资铺展开来的结果,三星也在语音、自然语言、图像、生物识别认证等一系列AI子领域开花落地。
“三星有个‘2020梦想’,我们提前3年实现了‘全球半导体第一’,剩下的就是在AI领域实现突破。”张代君说。
三星电子中国研究院成立于2000年,是三星电子在华投资设立的第一个研发机构,从15年前开始投入AI技术研究,非常敏锐地把握了多种AI技术产业应用的时机。2013年,邓力博士与Hinton合作,首次将深度神经网络应用到大规模语音识别并获得成功,在实践中显著提高了机器对语音的识别率,随后不久,三星电子中国研究院便开始全面引入深度学习。2014年,三星手机加入了采用深度神经网络模型的相册分类功能,随着深度学习的迅速发展,目前三星智能机中S-Gallery的图像搜索和管理得到进一步增强。“我们就是想知道,AI到底能给手机带来什么变化。”三星电子中国研究院常务史媛媛说
三星电子中国研究院院长张代君展示三星Bixby
“最强手机智能交互体验”,用Bixby控制和连接一切
虽然亚马逊Echo/Alexa开启了智能音箱引领的智能硬件新时代,但手机或许仍然是未来AI的最大应用场景,如果有一个手机能把所有最强悍的AI功能集大成,那无疑将成为一个强大的枢纽和入口。 而三星无疑就是这样认为并切身立行的。
“作为全球最大的手机和家电厂商,三星的目标是使用AI技术让硬件更加智能,并在这种结合之中,产生新的智能。”张代君说:“自然语言交互时代已经全面来临,我们要提供最强的手机智能交互体验。”
而这种最强手机智能交互体验的核心,便是三星Bixby——三星主推的人工智能技术。虽然是通过语音来激活,但Bixby的定位绝非仅限于语音助理。“Bixby有Voice、Vision、Home、Reminder,总之你能通过手机连接的一切,都能用Bixby控制和处理。”张代君介绍说。
这次体验活动的重点,则是即将正式上线的Bixby中文版语音功能。而被三星中国的研究人员戏称为“Mr. Bixby”的张代君院长,为了让Bixby中文版更加智能、顺畅地识别、适配用户发出的语音指令,带领三星的工程师在算法的优化、工程实现上做了无数次迭代研发,在中文的语义、语境等方面也花费了很多精力。在演示中,研究人员共展示了“点(touch)、看(vision)、说(voice)、笔(pen)”四大交互方式,并以旅行为场景,展示了三星在生物识别认证、视觉智能、场景智能以及智能语音等AI技术应用。
在生物识别认证领域,三星已经率先在今年的旗舰机型S8/S8+以及N8手机上实现了面部识别和安全虹膜识别,并给客户保留指纹识别的方便性,全部采用自主研发的技术。对于人脸+虹膜+指纹识别的“三位一体”,史媛媛表示,功能做到“全,是旗舰产品应有的态度”。在智能语音交互方面,三星设计了Bixby专用硬件HARDKEY,用户能够通过按键,从语音控制转化至视觉和文字控制。
此外,当应用程序启动Bixby时,用户可以通过Bixby完成所有可通过传统界面(触屏或者文本指令)进行的任务。同时,Bixby可以了解应用程序当前情景和状态,并继续执行当前任务。
在现场,研究人员使用语音功能进行自拍,用中文语音命令手机在拍摄过程中“把皮肤调成最好”、“把照片中的眼睛调到最大”,“好,把这个发朋友圈”,一系列动作即时顺畅地完成。“我们要解决自然语言交互可能出现的很多问题。”史媛媛说,即使提供的信息不完整,也能够理解用户的意图。
研究人员还展示了用语音将APP图标在手机屏幕上隐藏并在隐藏状态下调起使用。“三星手机有成千上万个功能,最复杂的功能我们也能通过语音来做到,一声直达。”史媛媛说。
深度整合展现对硬件的控制力,只有做过的人才能体会有多难
据介绍,三星Bixby的核心是用户与手机交互的新方式,因其具备高度理解能力,用户通过语音实现对手机多种功能的贯穿操控。针对当前三星手机内置的原生APP,Bixby语音能够做到“可点即可说”的操作方式转变。“只要是能够点击的,我们都可以用‘说’的方式来做到”。三星电子中国研究院首席研究员刘亚强表示。对于第三方,目前三星与主流APP巨头也已进行深度合作,同时欢迎更多第三方APP进行深层合作,完成更丰富的用户体验升级。
“用户看到的可能很简单,但这展现了Bixby与三星硬件的完美融合,”刘亚强首席感叹:“深度整合才能创造奇迹,但只有做过的人才能体会做到这点有多难。”
“我们哭过、吵过、打过(差点),都是为了达到更好的用户体验。真的是太疯狂了,我们自己把自己都感动到了。”刘亚强说:“但客观地讲,光凭我们的努力是无法做到的,正是因为三星有强大的硬件以及AI技术的深度积累,我们才有可能做到这种深度整合。”
被研究人员如此评价的Bixby中文版,凭借语音、视觉、提醒以及主页功能,将展现出怎样的人机交互方式,无疑令人分外期待。对于国内用户而言,Galaxy S8、S8+,Note8将很可能成为率先支持Bixby中文语音的产品。
11月8日,新智元AI World 2017世界人工智能大会,AI Vision会场的圆桌讨论环节,张代君院长也将代表三星电子中国研究院出席,与中国自动化学会副理事长王飞跃、英特尔中国研究院院长宋继强、爱奇艺CTO汤兴等产业和技术领袖一起,分享他们对AI技术产业发展的洞见。
张代君 三星电子中国研究院院长
张代君先生现任三星电子中国研究院院长。他与他领导的团队立足于中国本地的先行技术、商用化技术研发以及产品服务,为三星电子提供了坚实的技术保障,为中国本地以及全球向提供差异化产品服务。
张代君先生已投身人工智能、无线移动通信核心技术研究和开发领域20年时间,成功领导和管理多轮新技术创新到产品商业化的转化。张代君先生于2013年加入三星并担任三星电子中国研究院(北京)院长职务,凭借对产业技术发展方向的极佳判断力,准确把握行业趋势,将三星电子中国研究院成功的引向当下最前沿的人工智能以及下一代移动通信领域的发展浪潮中,在全球各大学术会议以及竞赛中获得了优异的成绩,成为了三星电子全球重点人工智能研究机构以及下一代通信研究机构。在张代君院长的带领下,三星电子中国研究院将会走向以AI、5G为核心技术的全球一流研发中心。
当前张代君先生主要负责领导三星电子中国研究院在视觉智能、语音语言交互、大数据挖掘、下一代无线通信,以及本地智能服务等领域的技术战略、产品管理以及项目运营, 特别领导了三星电子智能交互产品Bixby中文版的研发与商用,带领着800余名员工不断的进行创新和突破。
张代君先生1997年毕业于电信科学技术研究院并获得工学硕士学位,并在2007年获得中欧国际工商管理学院(CEIBS)高级工商管理硕士学位(EMBA); 2009年~2013年,担任意法-爱立信中国区总裁(Senior Fellow);2002年~2009年,担任北京天碁科技CTO,具备了深厚的技术背景以及管理经验。
原文发布时间为:2017-10-27
本文作者:闻菲
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号
原文链接:【AI手机三国杀】三星Bixby闯入战场,AI功能集成颠覆人机交互