还记得去年上海世界人工智能大会上的那场「双马」对话吗? 马云和埃隆·马斯克激辩人工智能,一个更偏向相信人类,一个认为机器远比人类聪明。 孰对孰错、哪个站上风需要交给时间检验,但有趣的是:这场英文对话进行时,他们身后的大屏幕显示AI正在为他们进行实时语音识别与中英翻译。 哪怕成了被讨论的主角,AI依然有条不紊地运转着。 这项技术正是由科大讯飞全程参与提供。AI是否会取代人类仍是未知,但AI是否实现落地应用已经有了明确的答案。 12月27日下午,由国家工业信息安全发展研究中心主办的「2020中国语音创新发展高峰论坛暨中国语音产业联盟年会」在天津滨海召开,来自政、产、学、研、用等各方代表百余人齐聚一堂,围绕智能语音科技产业热点,共同谋划语音产业发展大计,助力人工智能与实体经济深度融合发展。
中国语音产业联盟旨在进一步整合产业资源,构建健康的产业生态体系,推进语音及语言产业的快速发展。在中美科技竞争背景下,中国智能语音企业坚持源头技术创新、技术自主可控,有效防止“卡脖子”风险。 会上,由国家工业信息安全发展研究中心发布的《中国智能语音产业发展白皮书》之十大观点摘要,为我们全面展示了语音行业的现状和未来。
《白皮书》十大观点重磅发布!科大讯飞市占率稳居国内第一
《白皮书》之十大观点摘要指出,全球智能语音及人工智能产业发展方兴未艾,进入规模化发展并保持快速发展态势。在深度学习、云计算、大数据和5G等四大基础技术的加持下,智能语音技术及应用不断向人工智能产业延伸。 图:2014-2019年全球智能语音产业规模和增长率 据预测,2020年全球智能语音及人工智能市场规模将超过200亿美元,谷歌、苹果、微软、科大讯飞等头部企业占有80%以上市场份额。全球智能语音头部企业优势明显,持续发力产业生态构建,市场发展潜力巨大。
图:2018-2019年全球智能语音市场份额
谷歌、微软和苹果的智能语音技术大多体现在其语音助手等C端消费产品上,而讯飞则是深入教育、医疗、家庭、办公等各大应用场景之中。
据IDC报告预计,在语音语义市场,科大讯飞市场占有率稳居国内第一,而后是百度、阿里云、思必驰等。
来源:IDC中国,2020
同时,据艾媒咨询《2020年上半年中国人工智能产业专题研究报告》显示,在智能语音赛道,科大讯飞的综合实力和成长能力远超同行业竞争者,独占第一梯队。
图:中国智能语音产业梯队,来源:艾媒咨询 可以看出,无论从市占率还是综合实力,科大讯飞都占据国内语音市场龙头地位,第二梯队的企业与之还有较大差距。 智能语音的「平台+赛道」两极放大效应凸显,围绕行业场景与个人场景加速落地。「涟漪效应」使得当前智能语音行业落地从刚需场景的典型案例走向规模应用,已在教育、医疗、政务、金融、运营商、司法等领域深度落地融合;个人场景重点围绕家庭、汽车、办公等场景展开,消费者智能语音产品不断涌现且频获市场认可。 同时,我国的智能语音应用催生了新消费、新应用、新市场。特别是新冠疫情爆发后,智医助理、电话随访、空中课堂、虚拟会议、虚拟主播等智能语音应用助力疫情防控,催生新的蓝海市场。 从近几年的发展来看,智能语音技术及产业化程度相对成熟,智能语音技术创新力度加大,语义理解技术取得较大突破。 今年NLP圈的一件大事就是GPT-3的发布,其1750亿的参数量引发了巨大轰动。要知道,人的大脑也才只有860亿个神经元,这一突破,使得很多人认为距离摘下NLP这颗人工智能的「掌上明珠」又近了一步。 白皮书也指出,人工智能下一步发展的关键创新点在小样本学习、动态自适应、迁移学习、离线计算与情感计算等,人机耦合将是技术长期发展趋势。 在新基建大战略下,智能语音交互将成为万物互联时代的人机交互入口和新型信息技术基础设施,对国家发展打造竞争新优势、注入增长新动能意义重大。在国内国际双循环相互促进的新发展格局下,智能语音技术及产品是解决人类交流的刚需。
要解决「卡脖子」难题,更要做「有温度」的黑科技
去年10月8日,据美国商务部官方网站公布的信息显示,科大讯飞等多家中国企业被列入美国实体清单。企业被列入实体清单后,美国*即可根据《出口管理条例》限制对这些机构出口、进口或转口。 科大讯飞则是名单中首个没有因此而停牌的上市公司,当天股价下跌后第二天就涨了回来。
过硬的技术实力,是科大讯飞腰板挺直的真正原因。
在会上,中国语音产业联盟理事长、科大讯飞董事长刘庆峰还进一步强调了智能语音的战略地位:
「万物互联时代,语音是核心技术的必争之地,也是防止卡脖子的关键技术。」
同时,刘庆峰提出2020年语音行业发展呈现的三个变化:
1.应用场景从移动互联网进入万物互联的特征越来越明显,语音正日益成为万物互联的入口;
2.随着行业应用落地的深入,语音技术和认知智能的结合越来越紧密;
3.社会刚需引导下,多语言技术发展越来越快。
语音技术和产品的规模化落地绝非易事,大规模的生产和使用具有相当大的挑战性,但2020年的疫情给了科大讯飞一个检验自身实力的机会。
科大讯飞的「智医助理」已通过国家执业医师综合笔试,并超过了96.3%的考生,能够快速掌握新冠肺炎知识。疫情期间,在国家卫健委指导下,讯飞通过人工智能对200万名基层医生做了培训,节省医护人员大量宝贵时间。
在武汉封城期间,通过讯飞的语音技术,一个机器可以给成百上千个家庭打电话,6小时即可完成100万人的电话访问。电话访问结束之后还可以自动生成统计报表。在全国推广后,共完成了5900万次的访问和统计,极大地节省了随访时间。
如果说今年的疫情是全球共同面临的难题,那么即将到来的老龄化社会就是我国即将面临的考验。
近日,工信部印发了《互联网应用适老化和无障碍改造专项行动方案》,该方案提出,开展互联网主要行业网站及老年人、残疾人常用移动互联网应用(APP)的适老化及无障碍改造。
在天津,讯飞就在尝试打造一个「有温度」的城市。
利用语音技术,AI系统还可以调取水电煤气信息,若独居老人的用水用电信息有所异常,系统就会主动拨打电话进行问候;若无人接听,系统则会通知家属或社区,极大地提高了社会效率。
在今年的1024开发者节上,讯飞开放平台上有1000多个团队,专门为聋哑人和盲人开发应用,这些应用每天有5000万人在调用,其中有不少聋人和盲人还成了创业英雄。
这背后所有的一切,背后都依靠的是科大讯飞多年的技术沉淀。
此前,刘庆峰就曾表示:AI应用红利兑现的基础,就是突破AI核心技术鸿沟。拥有21年历史的科大讯飞在国际上不断取得技术突破:
在两年一次的国际多通道语音分离和识别大赛(CHiME)中,科大讯飞联合中科大语音及语言信息处理国家工程实验室(USTC-NELSLIP)在给定说话人边界的多通道语音识别两个参赛任务上夺冠。
自2016年以来,科大讯飞第三次参加这项国际竞赛并连续夺冠,语音识别错误率从CHiME-5的46.1%降至现在的30.5%。
在全球声纹识别(VoxSRC)大赛公开刷榜阶段,科大讯飞还刷新了世界纪录。DCASE比赛任务3也拿到了全球第一,对应的产品「工业听诊器」也已经上线,能为企业节省成本,助力工业智能化升级。
虽然通用人工智能才刚刚开始起步,机器的常识推理甚至还没有达到孩童的水平。但只要在专业领域有足够的数据,未来通过语音系统来大幅改善生活质量提升效率,是非常值得期待的事情。
语音的技术和应用事关产业未来,语音产业的发展也离不开生态建设。
刘庆峰强调说:「唯有开放才能生生不息,生态繁荣决定产业繁荣」。过去一年中,讯飞开放平台实现超50万增长,开发者总量达169万。其中天津「北方声谷」自2018年5月开园至今,开发者团队已达2.3万,增长约3.3倍。
正如刘庆峰所说:
「中文语音要由中国人做到世界最好,中文语音产业要掌握在中国人自己手上。」
相信一批批人工智能企业在协同联动和创新驱动中,将为全球化下的「中国策」贡献更多AI智慧,用智能语音向世界传递中国声音,用人工智能讲好中国故事。