利用人工智能“解锁”世界音乐

本文来自AI新媒体量子位(QbitAI)

利用人工智能“解锁”世界音乐

人们喜欢感受的是音乐带来的那种氛围。

整理过歌单的任何人都知道,好的歌单往往有一种贯穿始终的情感。那就是为什么Gracenote的音乐数据专家已经早早地将音乐按照心情和感情区分。

稍有不同的是,Gracenote的团队不是把数据库里面1亿首歌逐个听下来,而是教计算机去探测情感,使用机器学习和人工智能去判断一首歌的风格是梦幻还是阴郁,又或者是有着淡淡的忧愁。

Gracenote的音乐总经理Brain Hamilton在最近的一次采访中说到,“机器学习是我们的一个战略优势”。

早在10年前,Gracenote就开始在做声音的情绪分类。直到现在,更多的传统算法发展成先进的神经网络,音乐产业也正在越来越多地依靠人工智能,而Gracenote就是最好的样例。

采用这种人工智能分类音乐情感的技术的关键问题在于AI不知道人的感觉。

“我们不知道一种音乐会对每一个个体产生什么样的效用”,研究部副总裁Markus Cremer在美国娱乐界杂志巨头Variety的采访中说。

Gracenote试图将情感的评判标准转换成音乐家的创作目的,他们觉得创作者的目的才是音乐背后的一种连续的情感品质,换句话说,这家公司想教会计算机去识别音乐背后的深刻感情,而不是纠结于音乐对某个个体唤起的回忆。

教计算机去识别音乐中包含的感情的过程有点像治疗:首先要给情感命名。

Gracenote的音乐团队最开始使用的分类中包括了超过100种的气氛和情感,后来扩展到400多种。其中的一些有明确的情感分类,也有像“声色犬马”或“绝望的狂暴能量”这样过于细致的描述。新的分类也在不断的加入。这是一种迭代的过程,这些分类在迭代中不断的优化。

除了这些心情清单,Gracenote也有一些为机器学习准备的训练集,音乐专家们把4000多首歌收集分类后,编制训练集本身就是一种艺术,“我们只需要保证给的音乐的例子是人们正在听的,同时那些选出来的歌也要对某一种情感具有充分的代表性,不能模棱两可,“DiMaria说。

目前的训练集里面用Lady Gaga的《Love Game》代表“性感的摇滚”,Radiohead的《pyramid song》代表“哀愁”,Beyonce的《Me,Myself&I》作为“熟悉的,轻柔而感性的”曲风的代表。

利用人工智能“解锁”世界音乐

情感种类和训练集都需要不断的更新,因为艺术家们在不断地创造新的曲风,尤其对电音和hip-hop这些更新很快的曲种来说。

系统受到训练后就会被放到数百万的歌曲堆中去听了。计算机不仅仅一条条听,还把每一首歌切成700微秒的片段,然后从任意一个切片中提取出170多种声音的品质。另外,系统有时也会调用大段的音乐片段来分析一首歌的旋律或类似的特征,然后把这些值和既有的数据作比较来归纳一首歌的情感。这样下来最后的结果就不是一种单一的心情,而是某一类心情的概括。

要把所有的歌打乱重新归类是一件很复杂的事情,Gracenote的团队必须周期性维护,保证过程不出错。

计算机要听很多东西,除了乐器,声道,一层叠加到另一层的效果,还包括一些本身不是音乐的一部分的声音,比如为车载立体声或互联网流媒体优化过后的结果。

Cremer说这个系统也会可以捕获一些意料之外的东西,它会在无监督的状态下可以自己决定去注意一些压缩失真,然后和心情匹配起来。他开玩笑说,它或许会决定”都是96kbps的速度,所以这让我感到伤心“。

Gracenote一旦做好了音乐的分类,就将数据传送给客户,并以多种不同的方式使用。

一些小的媒体服务获得这些数据的授权后应用于端对端的音乐组织和推荐系统,如iPhone上的一个远程流媒体播放软件 Plex使用该公司的音乐推荐技术,来为用户提供个性化的播放列表或“心情电台”。

这个行业最大的一些音乐服务运营商也在使用这些数据,包括Apple和Spotify,但这些大玩家们不喜欢谈论他们是怎么样把数据用到产品里面的。另外,互联网上大的的流媒体运营商一般倾向于使用自己的音乐推荐算法,但他们也会用这些数据去训练和提升自己的算法。

这些数据的应用意味着音乐迷们可以清楚地了解Gracenote在音乐归类上的工作,而其他人或许不知道这个公司的人工智能技术提升了他们的音乐体验。

不论通过哪种方式,Gracenote都要保证这些数据是在国际上传播的,尤其注重新市场的授权。


8月1日,该公司宣布要在欧洲和拉美出售其音乐产品。另外,为了防止语义信息的丢失,Gracenote还专门雇佣了国际编辑真正去听那些样本歌,来找出和本土文化最为契合的翻译方式。

这种国际眼光还有另外一种形式,就是不断地去国际上搜寻新歌来训练。因此,Cremer说他们目前的状态是”我们的数据可以处理地球上每一张最新的专辑“。

像Gracenote这样的公司要做到对全球的音乐进行分类,就不能仅仅依靠人工,还要靠人工智能和类似机器试听这样的技术。仅靠人工无法对数量庞大的歌曲分类,这样就达不到根据用户最喜欢的音乐生成性化播放列表。而教会电脑去检测则可以帮助人们获得更好更完整的音乐体验。

而使用数据和技术解锁来自世界各地的音乐,是这份工作中最激动人心的部分之一。

—— ——

本文作者:颜萌
原文发布时间:2017-08-13 
上一篇:Qt一步一步实现插件通信(附源码)


下一篇:安凯微电子与阿里云IoT开展全面合作 共同打造视频芯云一体化解决方案