python录制系统声音

2024-03-05 14:34:18

环境准备

python

wave
pyaudio

wave 可以通过pip直接install，在安装pyaudio时，通过正常的pip install 直接安装一直处于报错阶段，后来想到可以通过*直接安装。

在pypi提供的安装包中有对应的安装包，注意，不仅仅是python2和python3的区别，python3的小版本也有点差别。可杯具的是，小主电脑里装的是python3.8，后来想到还有一个网站可以安装pythonlibs，找到对应的版本后，下载下来。直接在文件所在目录，或者在安装中指定文件目录中执行安装

pip install /c/Users/root/Downloads/PyAudio-0.2.11-cp38-cp38-win_amd64.whl

代码和运行

def audio_record(out_file, rec_time):
    CHUNK = 1024
    FORMAT = pyaudio.paInt16  # 16bit编码格式
    CHANNELS = 1  # 单声道
    RATE = 16000  # 16000采样频率
    p = pyaudio.PyAudio()
    # 创建音频流
    dev_idx = findInternalRecordingDevice(p)
    stream = p.open(format=FORMAT,  # 音频流wav格式
                    channels=CHANNELS,  # 单声道
                    rate=RATE,  # 采样率16000
                    input=True,
                    input_device_index=dev_idx, # 指定内录设备的id，可以不写，使用win的默认录音设备
                    frames_per_buffer=CHUNK)
    print("Start Recording...")
    frames = []  # 录制的音频流
    # 录制音频数据
    for i in range(0, int(RATE / CHUNK * rec_time)): # 控制录音时间
        data = stream.read(CHUNK)
        frames.append(data)
    # 录制完成
    stream.stop_stream()
    stream.close()
    p.terminate()
    print("Recording Done...")
    # 保存音频文件
    wf = wave.open(out_file, 'wb')
    wf.setnchannels(CHANNELS)
    wf.setsampwidth(p.get_sample_size(FORMAT))
    wf.setframerate(RATE)
    wf.writeframes(b''.join(frames))
    wf.close()

在使用默认录音设备时，发现是话筒录音，效果并不是太理想，所以就去查查能不能直接录系统的声音。

def findInternalRecordingDevice(p):
    # 要找查的设备名称中的关键字
    target = '立体声混音'
    # 逐一查找声音设备
    for i in range(p.get_device_count()):
        devInfo = p.get_device_info_by_index(i)
        print(devInfo)
        if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
            # print('已找到内录设备,序号是 ',i)
            return i
    print('无法找到内录设备!')
    return -1

可以使用p.get_device_info_by_index()去查看系统有关声音的设备，通过设置为立体声混音就可以录制系统声音。

保存声音

def save(fileName):
    # 创建pyAudio对象
    p = pyaudio.PyAudio()
    # 打开用于保存数据的文件
    wf = wave.open(fileName, 'wb')
    # 设置音频参数
    wf.setnchannels(CHANNELS)
    wf.setsampwidth(p.get_sample_size(FORMAT))
    wf.setframerate(RATE)
    # 写入数据
    wf.writeframes(b''.join(_frames))
    # 关闭文件
    wf.close()
    # 结束pyaudio
    p.terminate()

保存声音是通过上述代码进行保存，此处的_frames是个list，是通过每录一个chunk（数据流块），就把这一块的数据添加进去

然后只需要重新创建PyAudio对象，把这个list转为字节串保存到文件中就可以了

问题

上述一般可以录到系统声音，但在执行的时候发现，并不能。

原因是：win的输入设备中没有配置立体声混音

设置步骤：

在win的声音调节出，右击打开声音设置
找到管理声音设备
在输入设备处启用立体声混音

就此，就完成了录制系统声音的需求

注意

上述操作，可以外放，可以插入3.5mm耳机，但系统静音和tpye-c耳机插入的时候不能录到声音

完整代码

import os
import pyaudio
import threading
import wave
import time
from datetime import datetime

# 需要系统打开立体声混音

# 录音类
class Recorder():
    def __init__(self, chunk=1024, channels=2, rate=44100):
        self.CHUNK = chunk
        self.FORMAT = pyaudio.paInt16
        self.CHANNELS = channels
        self.RATE = rate
        self._running = True
        self._frames = []

    # 获取内录设备序号,在windows操作系统上测试通过，hostAPI = 0 表明是MME设备
    def findInternalRecordingDevice(self, p):
        # 要找查的设备名称中的关键字
        target = '立体声混音'
        # 逐一查找声音设备
        for i in range(p.get_device_count()):
            devInfo = p.get_device_info_by_index(i)
            # print(devInfo)
            if devInfo['name'].find(target) >= 0 and devInfo['hostApi'] == 0:
                # print('已找到内录设备,序号是 ',i)
                return i
        print('无法找到内录设备!')
        return -1

    # 开始录音，开启一个新线程进行录音操作
    def start(self):
        threading._start_new_thread(self.__record, ())

    # 执行录音的线程函数
    def __record(self):
        self._running = True
        self._frames = []

        p = pyaudio.PyAudio()
        # 查找内录设备
        dev_idx = self.findInternalRecordingDevice(p)
        if dev_idx < 0:
            return
        # 在打开输入流时指定输入设备
        stream = p.open(input_device_index=dev_idx,
                        format=self.FORMAT,
                        channels=self.CHANNELS,
                        rate=self.RATE,
                        input=True,
                        frames_per_buffer=self.CHUNK)
        # 循环读取输入流
        while (self._running):
            data = stream.read(self.CHUNK)
            self._frames.append(data)

        # 停止读取输入流
        stream.stop_stream()
        # 关闭输入流
        stream.close()
        # 结束pyaudio
        p.terminate()
        return

    # 停止录音
    def stop(self):
        self._running = False

    # 保存到文件
    def save(self, fileName):
        # 创建pyAudio对象
        p = pyaudio.PyAudio()
        # 打开用于保存数据的文件
        wf = wave.open(fileName, 'wb')
        # 设置音频参数
        wf.setnchannels(self.CHANNELS)
        wf.setsampwidth(p.get_sample_size(self.FORMAT))
        wf.setframerate(self.RATE)
        # 写入数据
        wf.writeframes(b''.join(self._frames))
        # 关闭文件
        wf.close()
        # 结束pyaudio
        p.terminate()


if __name__ == "__main__":

    # 检测当前目录下是否有record子目录
    if not os.path.exists('record'):
        os.makedirs('record')

    print("\npython 录音机 ....\n")
    print("提示：按 r 键并回车 开始录音\n")

    i = input('请输入操作码:')
    if i == 'r':
        rec = Recorder()
        begin = time.time()

        print("\n开始录音,按 s 键并回车 停止录音，自动保存到 record 子目录\n")
        rec.start()

        running = True
        while running:
            i = input("请输入操作码:")
            if i == 's':
                running = False
                print("录音已停止")
                rec.stop()
                t = time.time() - begin
                print('录音时间为%ds' % t)
                # 以当前时间为关键字保存wav文件
                rec.save("record/rec_" + datetime.now().strftime("%Y-%m-%d_%H-%M-%S") + ".wav")

码农公寓

环境准备

代码和运行

保存声音

问题

注意

完整代码

相关文章