一句话,IBM的AI软件就能评估说话者的年龄,平均误差在4.7岁左右。
近日,IBM在人工智能领域取得了两个新突破。
一个突破是在自动说话人识别软件上获得了更高的准确性。该软件的主要功能是基于人类语音辨识说话者的身份。在2000年,当时最好的说话人识别验证软件的错误率在10%左右,如今的行业标准已经将错误率缩减到了1%以内,而IBM的软件则创下了0.59%的新纪录。
对此,IBM的Jason Pelecanos承认,该突破看上去似乎没什么重大意义,但是,分别有着0.6%错误率和1%错误率的两套识别系统,在对人声的识别验证上,0.6%的系统识别错误拒绝放行的概率比1%的系统要低了近50%。
此外,IBM团队还研发了一个软件来评估说话者的年龄,据公司称,它在同类软件中同样拥有着最高的准确率,平均误差在4.7岁左右。
该技术可用于AI软件与人类的互动,在对说话者年龄进行估计后,系统可采用更为个性化、更符合说话者年龄的词汇和语法与之进行互动,让AI变得更智能更灵活。
长远来看,这些成就似乎微不足道,但Pelecanos称,这些突破对于越来越智能的机器来说是必不可少的。的确,哪怕是当前,这些突破的作用也是相当大的,比如智能家居的智能音箱,若是能够分别出不同的说话者,将更便于命令的执行,而不是被众多说话声所打乱。
原文发布时间:2016-11-22 07:51
本文作者:韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。