我要做的是有一个子例程,它每200毫秒分析一次给出的声音文件,并将特定频率范围的频率强度值(从0到1,以浮点数)分配到一个数组中,我稍后救.然后,此值将继续用作应该“选通”音频文件的图形的不透明度值.
问题是,我以前从未冒险进行音频分析,也不知道从哪里开始.我已经看过pymedia和scipy / numpy,以为可以实现此目的而使用FFT,但我不确定如何处理这些数据以达到预期的结果. pymedia的SpectrAnalyzer类的文档实际上是不存在的,并且该网站上的示例实际上不适用于该库的最新版本-并不能使我的生活更加轻松.
我将如何开始这个项目?我什至不应该使用什么库.
解决方法:
您首先需要了解采样的工作原理,然后应该使用Scipy FFT例程(它们非常快)以吐出频率强度值,然后可以使用Matplotlib绘制此类图形.
有关使用Python分析声音文件的文章,请参见here,而here是有关Python中FFT和频谱图的类似问题.