音高和基频(Pitch and F0)

音高(Pitch)和基频(F0)是两个非常接近的概念,
尽管它们有所不同,但通常并不区分。

音高和基频的关系最早在音乐界被发现,
通常认为,音高增高八度音程相当于基频翻倍。

在1000Hz以下,基频翻倍略小于音高的八度音程;
而在1000-5000Hz范围,基频翻倍略大于音高的八度音程。
John M. Eargle. Music, Sound and Technology. Van Nostrand Reinhold, Toronto, 1995.
Stephen Handel. Listening. MIT Press, Cambridge, 1989.

在3000Hz以上,保持基频不变,音强增强能使得音高增加;
在2000Hz以下,保持基频不变,音强增强却使得音高降低。
Stanley Coren, Lawrence M. Ward, and James T. Enns. Sensation and Perception.
Harcourt Brace College Publishers, Toronto, 1994.

以上是来自于正弦波实验的结论,而实际上,人声的谐波结构也会影响音高感知。

目前的基频提取算法很多,但是并没有一个基频提取算法在各种条件下都工作得很好。
通常一个算法离开了特定领域,性能就会变差。提取音乐基频和语音基频的算法就有所差异。

上一篇:转:Spine.JS+Rails重客户端Web应用技术选型思路:『风车』架构设计


下一篇:线性均衡器中的噪声增强问题