20. 处理二进制文件

例如,wav是一种音频文件的格式,音频文件为二进制文件。wav文件由头部信息和音频采样数据构成。前面为头部信息,包括声道数、采样频率、编码位宽等,后面是音频采样数据。

要求:使用Python,分析一个wav文件头部信息,处理音频数据。

解决方案:

通过内置函数open()指定mode参数为rb,以二进制模式读取二进制文件。

解析二进制数据可以使用标准库中的struct.unpack()方法。


  • 对于open()函数:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

打开file并返回对应的file object。如果该文件不能打开,则触发OSError

可用的模式有:

mode 意义
‘r’ 读取(默认)
‘w’ 写入,并先截断文件
‘x’ 排它性创建,如果文件已存在则失败
‘a’ 写入,如果文件已存在则在末尾追加
‘b’ 二进制模式
‘t’ 文本模式(默认)
‘+’ 更新磁盘文件(读取并写入)
  • 对于struct.unpack()函数:
struct.unpack(format, buffer)

根据格式字符串format从缓冲区buffer解包(假定是由pack(format, …)打包)。结果为一个元组,即使其只包含一个条目。缓冲区的字节大小必须匹配格式所要求的大小。


  • 方案示例:
import structdef find_subchunk(f, name):
    f.seek(12)              #wav文件第一块大小为12
    
    while True:
        chunk_name = f.read(4)
        chunk_size, = struct.unpack('i', f.read(4))             #i表示int类型,4字节

        if chunk_name == name:
            return f.tell(), chunk_size

        f.seek(chunk_size, 1)               #1代表从当前位置开始算起f = open('demo.wav', 'rb')offset, size = find_subchunk(f, b'data')                #查看开头到data部分的指针偏移量,及data大小print(offset, size, offset + size, end=' ')               #offset+size为该demo.wav文件总大小118 31684608 31684726               #结果


上一篇:colab连接本机


下一篇:webpack 之(24) entry配置详解