音高(Pitch)和基频(F0)是两个非常接近的概念,
尽管它们有所不同,但通常并不区分。
音高和基频的关系最早在音乐界被发现,
通常认为,音高增高八度音程相当于基频翻倍。
在1000Hz以下,基频翻倍略小于音高的八度音程;
而在1000-5000Hz范围,基频翻倍略大于音高的八度音程。
John M. Eargle. Music, Sound and Technology. Van Nostrand Reinhold, Toronto, 1995.
Stephen Handel. Listening. MIT Press, Cambridge, 1989.
在3000Hz以上,保持基频不变,音强增强能使得音高增加;
在2000Hz以下,保持基频不变,音强增强却使得音高降低。
Stanley Coren, Lawrence M. Ward, and James T. Enns. Sensation and Perception.
Harcourt Brace College Publishers, Toronto, 1994.
以上是来自于正弦波实验的结论,而实际上,人声的谐波结构也会影响音高感知。
目前的基频提取算法很多,但是并没有一个基频提取算法在各种条件下都工作得很好。
通常一个算法离开了特定领域,性能就会变差。提取音乐基频和语音基频的算法就有所差异。