FFmpeg从视频中提取音频

FFmpeg从视频中提取音频

 

#include <iostream>



extern "C" {
#include <libavutil/log.h>
#include <libavformat/avformat.h>
}




enum class AUDIO_OP_ERRORS {
    NO_ERROR,   // 0, 无错误
    OPEN_FILE_ERROR, // 1, 打开文件错误
    OPEN_INPUT_VIDEO_ERROR, // 2, 打开输入的视频文件出错
    FIND_STREAM_ERROR, // 3, 查找流信息失败错误
    FIND_AUDIO_ERROR, // 4, 查找音频流失败
};

struct AudioOpWrapper {
    // 输出文件句柄
    FILE *dst_fd{ nullptr };
    // 输入文件格式
    AVFormatContext* fmt_ctx{ nullptr };
    // 每次读取的音频包
    AVPacket pkt{};

    ~AudioOpWrapper() {
        if (pkt.buf != nullptr) {
            av_packet_unref(&pkt);
        }
        if (dst_fd) {
            fclose(dst_fd);
        }
        if (fmt_ctx) {
            avformat_close_input(&fmt_ctx);
        }
    }
};


// aac每帧开头都要填写对应的格式信息
void adts_header(char *szAdtsHeader, int dataLen) {

    // 不同视频的音频流参数可能不一样
    int audio_object_type = 2;  // 2是aac LC
    int sampling_frequency_index = 4;  // 采样频率 44100是0x4
    int channel_config = 2; // stero是双声道,左声道+右声道

    int adtsLen = dataLen + 7;

    szAdtsHeader[0] = 0xff;         //syncword:0xfff                          高8bits
    szAdtsHeader[1] = 0xf0;         //syncword:0xfff                          低4bits
    szAdtsHeader[1] |= (0 << 3);    //MPEG Version:0 for MPEG-4,1 for MPEG-2  1bit
    szAdtsHeader[1] |= (0 << 1);    //Layer:0                                 2bits 
    szAdtsHeader[1] |= 1;           //protection absent:1                     1bit

    szAdtsHeader[2] = (audio_object_type - 1) << 6;            //profile:audio_object_type - 1                      2bits
    szAdtsHeader[2] |= (sampling_frequency_index & 0x0f) << 2; //sampling frequency index:sampling_frequency_index  4bits 
    szAdtsHeader[2] |= (0 << 1);                             //private bit:0                                      1bit
    szAdtsHeader[2] |= (channel_config & 0x04) >> 2;           //channel configuration:channel_config               高1bit

    szAdtsHeader[3] = (channel_config & 0x03) << 6;     //channel configuration:channel_config      低2bits
    szAdtsHeader[3] |= (0 << 5);                      //original:0                               1bit
    szAdtsHeader[3] |= (0 << 4);                      //home:0                                   1bit
    szAdtsHeader[3] |= (0 << 3);                      //copyright id bit:0                       1bit  
    szAdtsHeader[3] |= (0 << 2);                      //copyright id start:0                     1bit
    szAdtsHeader[3] |= ((adtsLen & 0x1800) >> 11);           //frame length:value   高2bits

    szAdtsHeader[4] = (uint8_t)((adtsLen & 0x7f8) >> 3);     //frame length:value    中间8bits
    szAdtsHeader[5] = (uint8_t)((adtsLen & 0x7) << 5);       //frame length:value    低3bits
    szAdtsHeader[5] |= 0x1f;                                 //buffer fullness:0x7ff 高5bits
    szAdtsHeader[6] = 0xfc;
}


void extract_audio(const std::string& src_video, const std::string& dst_audio,
    AUDIO_OP_ERRORS& err) {

    AudioOpWrapper op_wrapper;
    int err_code = 0;
    char errors[1024];

    // 打开输出文件
    op_wrapper.dst_fd = fopen(dst_audio.c_str(), "wb");
    if (!op_wrapper.dst_fd) {
        av_log(nullptr, AV_LOG_DEBUG, "Could not open destination file %s\n", dst_audio.c_str());
        err = AUDIO_OP_ERRORS::OPEN_FILE_ERROR;
        return;
    }
    // 打开输入的视频文件,分配文件操作上下文
    if ((err_code = avformat_open_input(&op_wrapper.fmt_ctx, src_video.c_str(), nullptr, nullptr)) < 0) {
        av_strerror(err_code, errors, 1024);
        av_log(nullptr, AV_LOG_DEBUG, "Could not open source file: %s, %d(%s)\n",
            src_video.c_str(),
            err_code,
            errors);
        err = AUDIO_OP_ERRORS::OPEN_INPUT_VIDEO_ERROR;
        return;
    }

    // 查找流信息
    if ((err_code = avformat_find_stream_info(op_wrapper.fmt_ctx, nullptr)) < 0) {
        av_strerror(err_code, errors, 1024);
        av_log(NULL, AV_LOG_DEBUG, "failed to find stream information: %s, %d(%s)\n",
            src_video.c_str(),
            err_code,
            errors);

        err = AUDIO_OP_ERRORS::FIND_STREAM_ERROR;
        return;
    }

    // 显示视频流信息
    av_dump_format(op_wrapper.fmt_ctx, 0, src_video.c_str(), 0);

    // 初始化音频流解析包
    av_init_packet(&op_wrapper.pkt);
    op_wrapper.pkt.data = nullptr;
    op_wrapper.pkt.size = 0;

    // 查找最好的音频流
    int audio_stream_index = av_find_best_stream(op_wrapper.fmt_ctx, AVMEDIA_TYPE_AUDIO, -1, -1, nullptr, 0);
    if (audio_stream_index < 0) {
        av_log(NULL, AV_LOG_DEBUG, "Could not find %s stream in input file %s\n",
            av_get_media_type_string(AVMEDIA_TYPE_AUDIO),
            src_video.c_str());
        err = AUDIO_OP_ERRORS::FIND_AUDIO_ERROR;
        return;
    }

    int len = 0;
    // 逐个包读取,加上adts头,然后写入目标文件
    while ((av_read_frame(op_wrapper.fmt_ctx, &op_wrapper.pkt)) >= 0) {
        // 刚好是音频流
        if (op_wrapper.pkt.stream_index == audio_stream_index) {
            char adts_header_buf[7];
            adts_header(adts_header_buf, op_wrapper.pkt.size);
            fwrite(adts_header_buf, 1, 7, op_wrapper.dst_fd);
            len = fwrite(op_wrapper.pkt.data, 1, op_wrapper.pkt.size, op_wrapper.dst_fd);
            if (len != op_wrapper.pkt.size) {
                av_log(NULL, AV_LOG_DEBUG, "warning, length of writed data isn‘t equal pkt.size(%d, %d)\n",
                    len,
                    op_wrapper.pkt.size);
            }
        }
    }
}

/*
* 从多媒体文件中抽取媒体信息
* */

int main(int argc, char *argv[]) {

    const std::string src_video="D:\\BaiduNetdiskDownload\\165.mp4";
    const std::string dst_audio="D:\\BaiduNetdiskDownload\\165.mp3";
    AUDIO_OP_ERRORS err = AUDIO_OP_ERRORS::NO_ERROR;

    extract_audio(src_video, dst_audio, err);

    if (err != AUDIO_OP_ERRORS::NO_ERROR) {
        std::cout << "抽取音频文件失败" << std::endl;
        return false;
    }

    return 0;
}

 

 

效果如下:

FFmpeg从视频中提取音频

注:音频可正常播放

参考:https://www.jianshu.com/p/9db301c5dff3

#####################

FFmpeg从视频中提取音频

上一篇:Breach - HTML5 时代,基于 JS 编写的浏览器


下一篇:ExtJS 表单 submit时错误处理