本系列文章会陆续更新与ffmpeg相关的知识点。
与音频相关的概念极多,这里把最近学习到的进行总结:
1、编解码算法:目前已知的音频算法比较繁多,比较常见的有pcm(puluse)、aac、等。
a、pcm:pcm又分为adpcm。
2、音频格式:其实音频格式可以有两种维度的理解,一种是纯粹的裸码流即其中全是音频数据,即音频编码直接产生的有效数据,即第1点中的算法格式命名;第二种维度为带了一定封装的格式,如mp3、avi等,这也是我们生活中比较常见的格式。
3、采样率:1s钟对声波的采样频率。人耳能听到的音频范围为20HZ-20000HZ,低于或者高于该频率范围的一般人都无法察觉,(与人眼对光波的感光波长范围类似,也分为可见光和非可见光)。根据奈葵斯特采样定理,一般要高于采样频率2倍以上,才能有效恢复原始信号。目前采样频率一般共分为11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五个等级,11025Hz能达到AM调幅广播的声音品质,而22050Hz和24000HZ能达到FM调频广播的声音品质,44100Hz则是理论上的CD音质界限,48000Hz则更加精确。
4、位深(采样精度):单次采样的数据量,常见的8、16、32bit;
5、符号: 采样精度是无符号还是有符号数。
6、存储方式:音频数据在内存中的排列方式,分为packed和planar方式;
7、音频帧数据量:不同的采样方式,音频帧数据量大小都不同,以为例。