一、播放器框架
二、常用音视频概念
- 容器/文件(Conainer/File): 即特定格式的多媒体文件,比如mp4、flv、mkv等。
- 媒体流(Stream): 表示时间轴上的一段连续数据,如一段声音数据、一段视频数据或一段字幕数据,可以是压缩的,也可以是非压缩的,压缩的数据需要关联特定的编解码器(有些码流音频他是纯PCM)。
- 数据帧/数据包(Frame/Packet): 通常,一个媒体流是由大量的数据帧组成的,对于压缩数据,帧对应着编解码器的最小处理单元,分属于不同媒体流的数据帧交错存储于容器之中。
- 编解码器: 编解码器是以帧为单位实现压缩数据和原始数据之间的相互转换的。
-
复用器: 比如MP4、FLV等
-
编解码器: 将YUV或音频PCM数据进行压缩
三、FFmpeg库简介
FFMPEG有8个常用库:
- AVUtil: 核心工具库,下面的许多其他模块都会依赖该库做一些基本的音视频处理操作。
- AVFormat: 文件格式和协议库,该模块是最重要的模块之一,封装了Protocol层和Demuxer、Muxer层,使得协议和格式对于开发者来说是透明的。
- AVCodec: 编解码库,封装了Codec层,但是有一些Codec是具备自己的License的,FFmpeg是不会默认添加像libx264、FDK-AAC等库的,但是FFmpeg就像一个平台一样,可以将其他的第三方的Codec以插件的方式添加进来,然后为开发者提供统一的接口。
- AVFilter: 音视频滤镜库,该模块提供了包括音频特效和视频特效的处理,在使用FFmpeg的API进行编解码的过程中,直接使用该模块为音视频数据做特效处理是非常方便同时也非常高效的一种方式。
- AVDevice: 输入输出设备库,比如,需要编译出播放声音或者视频的工具ffplay,就需要确保该模块是打开的,同时也需要SDL的预先编译,因为该设备模块播放声音与播放视频使用的都是SDL库。
- SwrRessample: 该模块可用于音频重采样,可以对数字音频进行声道数、数据格式、采样率等多种基本信息的转换。
- SWScale: 该模块是将图像进行格式转换的模块,比如,可以将YUV的数据转换为RGB的数据,缩放尺寸由1280 * 720变为800 * 480。
- PostProc: 该模块可用于进行后期处理,当我们使用AVFilter的时候需要打开该模块的开关,因为Filter中会使用到该模块的一些基础函数。
四、FFmpeg函数简介
4.1初始化
-
av_register_all():注册所有组件,4.0已经弃用 - avdevice_register_all()对设备进行注册,比如V4L2等。
- avformat_network_init();初始化网络库以及网络加密协议相关的库(比如openssl)
4.2封装格式相关
- avformat_alloc_context(): 负责申请一个AVFormatContext结构的内存,并进行简单初始化
- avformat_free_context(): 释放该结构里的所有东西以及该结构本身
- avformat_close_input(): 关闭解复用器,关闭后就不再需要使用avformat_free_context 进行释放。
- avformat_open_input(): 打开输入视频文件
- avformat_find_stream_info(): 获取音视频文件信息
- av_read_frame(): 读取音视频包
- avformat_seek_file(): 定位文件。(如:播放器拖动时间轴,1分钟拖到5分钟位置)
-
av_seek_frame(): 定位文件。(拖动文件两种方式,按照pts和按照文件大小,如一共10分钟10M,拖动到5分钟则是拖动到5M大小位置)
alloc申请一个AVFormatContext结构的内存,avformat_open_input打开文件将其与AVFormatContext结构体进行关联,之后就可以获取音视频文件的一些信息(大小、时长、编码格式等),然后调用av_read_frame分别读取音频和视频文件。
封装大体流程:
4.3编解码
- avcodec_alloc_context3(): 分配解码器上下文
- avcodec_find_decoder(): 根据ID查找解码器,查找到第一个解码器就退出
- avcodec_find_decoder_by_name(): 根据解码器名字查找,找不到指定名字就返回没找到
- avcodec_open2(): 打开编解码器,和解码上下文做关联
-
avcodec_decode_video2():解码一帧视频数据,编和取在一个API,4.0新版本不建议使用 -
avcodec_decode_audio4():解码一帧音频数据,编和取在一个API,4.0新版本不建议使用 - avcodec_send_packet(): 发送编码数据包
- avcodec_receive_frame(): 接收解码后数据
- avcodec_free_context(): 释放解码器上下文,包含了avcodec_close()
- avcodec_close(): 关闭解码器
解码相关疑问解析:(此处很重要)
- avcodec_find_decoder()和avcodec_find_decoder_by_name(),一个是使用ID查找,一个使用解码器名字查找,他们的区别是什么呢?
- H264解码,H264只是一种解码标准,可能是由很多个产商根据这个标准来实现解码,如x264、JM等,这些不同的厂商他们使用的ID是相同的,但是名字使用不同的,这样就可以区分开(ID和名字都是针对ffmpeg内部的定义)
- 解码器和解码上下文的区别是什么?
- 假如有多路解码,解码器需要时支持多路可重入的,假如我们将上下文数据保存到解码器中,那么解码器 该怎么区分是哪个通道呢?所以引入了上下文的概念
解码相关大体流程图: