人机大战机器胜!这次是智能语音识别技术!

昨天,在阿里云的一场年会上,真枪实弹的上演了一场人机大战。一张大屏分两边,一边实时滚动的是出自阿里著名的快男姜毅的文字速记,一边出现的是阿里云iDST的科学家们在短短一年时间打造出来的语音识别系统支持下的语音转文本记录。


人机大战一触即发,随着阿里云总裁胡晓明的演讲展开,屏幕两端实时出现了各自的文本记录,从现场效果来看,难分伯仲。如果不是提前告知,观者很难感知到擂台的一端是机器人,因为可以实时的看到机器人除了记录之外,还能根据演讲人语境的变化,返回来对前面的记录进行调整。


结果评估取孙权前八分钟的演讲录音,对比机器人和姜毅出现多字,少字以及错字的情况,出错少的一方获胜。机器人出现了一些词汇错误,而姜毅的正确率从头到尾非常高,但因为漏打了几个字,错失了机会。经过半个小时人工核对结果,机器人以微弱优势险胜姜毅。值得一提的是,前不久,在匈牙利举办的第50届国际速记大赛上,姜毅代表中国队,在文本看打速记比赛项目中以300字/分钟的文字速记速度,勇夺世界亚军。纵然是微弱的优势,但这次机器人战胜的已经是世界级的水平。


人机大战机器胜!这次是智能语音识别技术!


虽然是第一次正式亮相,但从去年开始iDST的语音识别系统,已经在阿里巴巴的多个业务场景中应用了。从去年开始,阿里集团与蚂蚁客服每接听一个电话,都会立刻启动一个叫风语者的系统,它就是自动语音识别技术,将语音转变成文字,千分之三的人工抽检可以瞬间升级为100%的自动质检。除此应用场景之外,阿里YunOS、阿里小蜜以及手淘,现在都已经应用到阿里云的语音识别系统。


云栖社区邀请到此次深度参与“人机大战”语音识别项目的阿里云iDST技术总监鄢志杰(智捷),他将和大家分享阿里语音识别技术目前的一些应用,背后的技术难点以及一些重点的技术沉淀。针对项目背后的一些核心技术关键点,例如:基于GPU的快速并行, BLSTM,超大规模语言模型,基于GPU的快速解码等,我们已经邀请到相关技术专家并约稿,会请他们来跟大家分享。请持续关注!


【技术解读】











人机大战机器胜!这次是智能语音识别技术!

持续更新,敬请关注哦!



上一篇:企业如何用CRM软件客户管理自动化优化流程?


下一篇:浅析医疗人工智能技术的发展前景