WAV文件格式

作者:阿宝 

更新:2016-09-21 

来源:彩色世界(https://blog.hz601.org/2016/09/21/waveform-audio-file-format/index.html) 

WAVE (Waveform Audio File Format),是由微软和IBM公司共同开发的音频编码格式;广泛应用于Windows平台;

又因为文件后缀名为.wav而被称为WAV。

官方文档

WAV文件格式 draft-ema-vpim-wav-00

WAVE和AVI支持的编码格式 RFC 2361

文件格式

由多个块组成,必须包含四种(分别为RIFF头块、格式块、数据头块、数据块),其中格式块必须在数据块前面,其他块可自定义并且允许被忽略。

所有数据均以小端方式存储。

OFFSET  LENGTH  VALUE   DESCRIPTION
0 4 bytes 'RIFF' The file format ID.
4 4 bytes Length of the file minus (-) 8 bytes.
8 4 bytes 'WAVE' The data format ID.
12 4 bytes 'fmt ' The chunk ID.
16 4 bytes 32 Length of the chunk excluding the 8
bytes for the ID and length.
20 4 bytes The codec ID.
24 4 bytes The number of channels.
28 8 bytes Samples per second.
36 8 bytes Average bytes per second.
44 4 bytes Block alignment.
48 4 bytes Bits per sample.
52 4 bytes 'data' The chunk ID.
56 4 bytes Length of the data (chunk size minus (-) 8 bytes.
60 4 bytes 'fact' The chunk ID.
4 bytes 8 Chunk size minus (-) 8 bytes.
8 bytes Sample length.

WAV文件示例

下面是一个由FFmpeg转码生成的WAV文件示例,PCM数据,大小5292078B,位宽16bit,小端存储,采样率44100,2声道,码率1411kb/s。

分析发现,真实的WAV文件格式与IETF中的描述并不一致,暂时还没找到原因。

在资源交换文件RIFF标准中,所有的数据被组织成"块"格式,每个块必须包含一个4字节的ID,一个4字节的长度字段,和若干字节的数据。

52 49 46 46 26 c0 50 00 57 41 56 45 66 6d 74 20
10 00 00 00 01 00 02 00 44 ac 00 00 10 b1 02 00
04 00 10 00 4c 49 53 54 1a 00 00 00 49 4e 46 4f
49 53 46 54 0e 00 00 00 4c 61 76 66 35 36 2e 34
30 2e 31 30 31 00 64 61 74 61 e0 bf 50 00 06 00
...

0-4B 0x52 0x49 0x46 0x46 文件格式标识'RIFF'

5-8B 0x26 0xc0 0x50 0x00 文件长度减8,小端存储,此处为5292070

9-12B 0x57 0x41 0x56 0x45 数据格式标识'WAVE'

13-16B 0x66 0x6d 0x74 0x20 格式块标识'fmt '

17-20B 0x10 0x00 0x00 0x00 格式长度,此处为16

21-22B 0x01 0x00 数据编码格式 Microsoft PCM Format 0x0001 RFC2361

23-24B 0x02 0x00 音频声道数,此处为2,双声道

25-28B 0x44 0xac 0x00 0x00 音频采样率,此处为44100

29-32B 0x10 0xb1 0x02 0x00 平均码率

33-34B 0x04 0x00 数据的调整数?

35-36B 0x10 0x00 样本位宽,此处为16bit

37-40B 0x4c 0x49 0x53 0x54 块标识'LIST'

41-44B 0x1a 0x00 0x00 0x00 块长度,此处为26

45-70B 0x49 0x4e 0x46 0x4f 0x49 0x53 0x46 0x54 0x0e 0x00 0x00 0x00 0x4c 0x61 0x76 0x66 0x35 0x36 0x2e 0x34 0x30 0x2e 0x31 0x30 0x31 0x00

71-74B 0x64 0x61 0x74 0x61 数据头块标识'data'

75-78B 0xe0 0xbf 0x50 0x00 数据长度,不包括数据头,此处为5292000

...

音频数据

WAV编码不对源数据做任何压缩处理;

如果源数据是无损的,编码后的WAV文件也是无损的;

如果源数据是有损的,编码后的WAV文件也是有损的;

关于采样

通常情况下人耳只能感受到频率从100到20,000赫兹的信号;因此44,100赫兹的采样相对于人耳即是“无损”的。

音乐制作人通常会录制采为96,000赫兹的数据,之后采样处理成不同的格式。

常见的音频处理软件

剪辑 Goldwave

精细制作 MATLAB

上一篇:[AngularJS] 使用AngularAMD动态加载Controller


下一篇:linux内核--内存管理(二)