JPEG流封装AVI视频

前言:前几天工作任务,要把JPEG流封装为AVI视频,就找了些AVI文件结构资料和示例代码研究了下,现将学习总结及最终完成的可用代码分享出来,由于本人也是现学现用,如有不恰当或错误之处,欢迎提出!

1  AVI文件结构

AVI采用RIFF文件结构方式,RIFF是微软定义的一种用于管理windows环境中多媒体数据的文件格式,波形音频wave、MIDI和数字视频AVI都采用这种格式存储,构造RIFF文件的基本单元叫做数据块(Chunk),每个数据块包含3个部分:

(1)4字节的数据块标记(Chunk ID)

(2)4字节的数据块大小

(3)数据

整个RIFF文件可以看成一个ID为RIFF的数据块,RIFF块包含一系列子块,其中有一种子块的ID为LIST,称为LIST块,LIST块中可以再包含一系列子块,但除了LIST块的其他所有子块都不能再包含子块。

RIFF和LIST块分别比普通的数据块多一个被称为形式类型(Form Type)和列表类型(List Type)的数据域,其组成如下:

(1)4字节的数据块标记(Chunk ID)

(2)4字节的数据块大小

(3)4字节的形式类型(对于RIFF块)或列表类型(对于LIST块)

(4)数据

AVI文件是最复杂的RIFF文件,它能够同时存储音频和视频数据(注:本文档不涉及音频相关内容,只针对视频数据进行介绍),AVI文件RIFF块的形式类型是AVI ,它包含以下3个子块:

(1)信息块,ID为hdrl的LIST块,用于定义AVI文件的数据格式

(2)数据块,ID为movi的LIST块,用于存储音视频数据

(3)索引块,ID为idxl的数据块,用于定义音视频数据的索引,是可选块

AVI文件结构如图1所示

JPEG流封装AVI视频

图1  AVI文件结构

1.1 信息块

信息块包含两个子块:一个ID为avih的子块和一个ID为strl的LIST块。

1.1.1 avih块

JPEG流封装AVI视频

图2  avih块结构

avih块可用如图2所示的struct avi_avih_chunk结构体定义,图中已对结构体各变量的含义进行了解释,以下是对其中几个变量的补充说明:

(1)max_bytes_per_sec

max_bytes_per_sec用于控制视频的最大码率,即每秒传输的最大数据量。但实际上,给这个变量赋值并不能影响视频的码率,原因如下:设JPEG流图像总帧数为nframes,视频帧率为fps,各帧图像平均大小为len,则封装的AVI视频时长、文件大小和视频码率分别为

time = nframes / fps

video_size = nframes * len(实际大小还要加上文件头和文件尾的数据)

rate = video_size / time = fps * len

由此可见,在固定的帧率fps下,视频码率完全取决于JPEG各帧图像的大小,和max_bytes_per_sec的值没有关系,所以这个变量设为0即可。

(2)flags

flags表示AVI文件的全局属性,如是否含有索引块、是否即有音频数据又有视频数据等,不进行任何标记时flags值为0,若含有索引块,则flags值为0x00000010。

(3)init_frames

AVI文件若同时存储了音频和视频数据,则音频数据和视频数据是交叉存储的,init_frames仅在这种情况下使用,对于只有视频流的情况,该变量的值为0。

(4)width、height

这里的width和height不是JPEG图像的宽和高,而是用播放器打开AVI文件时视频主窗口的宽和高,举个例子,JPEG图像大小为1920*1080,width和height分别设为960和540,用QQ影音打开AVI文件,则QQ影音会以960*540的窗口大小进行播放。

1.1.2 strl块

strl块由图3所示的结构体定义,它包含strh和strf两个子块。

JPEG流封装AVI视频

图3  strl块结构

1、strh块结构

JPEG流封装AVI视频

JPEG流封装AVI视频

图4  strh块结构

图4所示为strh块结构定义,下面是对结构体内一些变量含义的补充说明:

(1)codec

codec是一个长度为4的字符数组,用于指定数据流的编码格式,也就是播放器播放这个流时需要的解码器,对于JPEG编码的视频流,codec数组内容就是'J', 'P', 'E', 'G',而不能随意指定,否则播放器播放时会无法解码。

(2)scale、rate

对于视频流,rate除以scale等于视频帧率,因此这两个变量可赋值为scale = 1、rate = fps。

2、strf块结构

strf块结构根据strh块中stream_type是视频流还是音频流而有所不同,对于视频流,strf块结构如图5所示,其中bitcount表示每个图像像素占的位数,其值根据视频流的实际情况而定,但只能是1、4、8、16、24和32之一,常用的有1(黑白二值化图像)、8(256阶灰度图)和24(RGB图像)。

JPEG流封装AVI视频

图5  针对视频流的strf块结构

1.2 数据块

由图1可知,数据块是一个ID为movi的LIST列表,也称为movi块,在仅有视频流时,该部分存储的就是一帧一帧的图像数据,图6展示了视频流movi块的详细结构。

JPEG流封装AVI视频

图6 仅有视频流的movi块结构

可以看到,movi块首先是一个固定结构的LIST列表头,包括块ID、块大小和块类型,其中块ID固定为LIST,块类型固定为movi,块大小为movi块去掉开头8字节后的大小。

然后是movi块数据,也就是各帧视频图像对应的数据块,每一帧图像的数据块都包含三部分:

(1)4字节ID:可以为00dc或00db,00dc表示压缩的视频数据,00db表示未压缩的视频数据,根据视频流的实际情况来选择赋值。

(2)4字节frame length:图像数据长度(单位:字节),该长度必须是4的整数倍,如果不是,则需要将其修正到4的整数倍,比如frame length原始数据为99,则需将其加到100。

(3)frame data:真正的图像数据。

1.3 索引块

索引块是AVI文件结构的可选部分,它是一个ID等于idxl的数据块,索引块提供了movi块中存储各帧图像的数据块在AVI文件中的位置索引,作用是提高AVI文件的读写速度,提高视频播放时的体验效果。

JPEG流封装AVI视频

图7 索引块结构

如图7所示为索引块结构,包括块ID、块大小和块数据三部分,其中块ID固定为idxl,块大小等于索引块数据的大小。

索引块数据是movi块中存储各帧图像数据块的索引,每一帧图像的索引都是一个16字节的数据结构,具体如下:

(1)4字节ChunkID:即movi块各帧图像数据块的ID,00dc或00db

(2)4字节ChunkFlag:表示该帧图像是否是关键帧,0x10代表关键帧,0x00代表非关键帧

(3)4字节ChunkOffset:图像数据块相对于“movi”标示符(图6红色箭头所指处)的偏移量,由图6可得,各帧图像索引ChunkOffset的值为:

第一帧图像索引àChunkOffset1 = 4;

第二帧图像索引àChunkOffset2 = ChunkOffset1+8+第一帧图像数据长度

第三帧图像索引àChunkOffset3 = ChunkOffset2+8+第二帧图像数据长度

…… (后面各帧图像索引以此类推,其中各帧图像数据长度指的是修正到4的整数倍后的长度)

(4)4字节ChunkLength:修正到4的整数倍后的各帧图像数据长度

2  JPEG流封装AVI步骤

JPEG流封装AVI视频的本质是按照AVI结构进行文件读写,操作流程大体上可分为三个步骤:

步骤1:创建空白AVI文件,设置文件偏移量到数据块movi标示符后面

(1)创建AVI文件,以二进制写方式打开

(2)计算文件偏移量offset,等于RIFF文件头12字节 + hdrl块大小 + movi LIST头12字节

(3)设置AVI文件偏移量为offset

步骤2:从offset偏移量处开始,向AVI文件中逐帧写入JPEG数据

(1)将当前JPEG图像数据长度加到4的整数倍,用length表示

(2)JPEG图像是压缩过的图像数据,故写入'0', '0', 'd', 'c'

(3)写入当前JPEG图像数据长度length

(4)写入当前JPEG图像数据,写入长度为length

(5)循环上述过程,完成逐帧图像数据的写入

步骤3:JPEG数据写完后,先继续向后写索引块,再定位到文件头回填各块数据

(1)写索引块

- 先写块ID  'i', 'd', 'x', 'l'

- 再写块大小 16 * nframes

- 最后写各帧图像的索引

(2)从文件头开始,回填各块数据

- 设置文件偏移量为0

- 按照AVI文件结构,写入步骤1跳过的各块数据

需要注意的是,步骤3写索引块时需要各帧图像的数据长度和总帧数,回填各块数据时也需要总帧数和所有帧的总大小,因此步骤2写入JPEG数据时需要保存它们的值。

3  代码分享

我完成的代码,是以若干张JPEG图片作为JPEG流,先将图片数据读入内存,再写入AVI文件,共包含五个文件:

1、list.h和list.c,双向循环链表,作用是保存各帧图像大小,用于写索引块

2、Jpeg2AVI.h和Jpeg2AVI.c,用于将JPEG流封装为AVI视频

3、main.c,测试程序

Jpeg2AVI.h

 #ifndef _JPEG2AVI_H_
#define _JPEG2AVI_H_ #include <stdio.h> void jpeg2avi_start(FILE *fp);
void jpeg2avi_add_frame(FILE *fp, void *data, unsigned int len);
void jpeg2avi_end(FILE *fp, int width, int height, int fps); typedef struct avi_riff_head
{
unsigned char id[];
unsigned int size;
unsigned char type[];
}AVI_RIFF_HEAD, AVI_LIST_HEAD; typedef struct avi_avih_chunk
{
unsigned char id[]; //块ID,固定为avih
unsigned int size; //块大小,等于struct avi_avih_chunk去掉id和size的大小
unsigned int us_per_frame; //视频帧间隔时间(以微秒为单位)
unsigned int max_bytes_per_sec; //AVI文件的最大数据率
unsigned int padding; //设为0即可
unsigned int flags; //AVI文件全局属性,如是否含有索引块、音视频数据是否交叉存储等
unsigned int total_frames; //总帧数
unsigned int init_frames; //为交互格式指定初始帧数(非交互格式应该指定为0)
unsigned int streams; //文件包含的流的个数,仅有视频流时为1
unsigned int suggest_buff_size; //指定读取本文件建议使用的缓冲区大小,通常为存储一桢图像 //以及同步声音所需的数据之和,不指定时设为0
unsigned int width; //视频主窗口宽度(单位:像素)
unsigned int height; //视频主窗口高度(单位:像素)
unsigned int reserved[]; //保留段,设为0即可
}AVI_AVIH_CHUNK; typedef struct avi_rect_frame
{
short left;
short top;
short right;
short bottom;
}AVI_RECT_FRAME; typedef struct avi_strh_chunk
{
unsigned char id[]; //块ID,固定为strh
unsigned int size; //块大小,等于struct avi_strh_chunk去掉id和size的大小
unsigned char stream_type[]; //流的类型,vids表示视频流,auds表示音频流
unsigned char codec[]; //指定处理这个流需要的解码器,如JPEG
unsigned int flags; //标记,如是否允许这个流输出、调色板是否变化等,一般设为0即可
unsigned short priority; //流的优先级,视频流设为0即可
unsigned short language; //音频语言代号,视频流设为0即可
unsigned int init_frames; //为交互格式指定初始帧数(非交互格式应该指定为0)
unsigned int scale; //
unsigned int rate; //对于视频流,rate / scale = 帧率fps
unsigned int start; //对于视频流,设为0即可
unsigned int length; //对于视频流,length即总帧数
unsigned int suggest_buff_size; //读取这个流数据建议使用的缓冲区大小
unsigned int quality; //流数据的质量指标
unsigned int sample_size; //音频采样大小,视频流设为0即可
AVI_RECT_FRAME rcFrame; //这个流在视频主窗口中的显示位置,设为{0,0,width,height}即可
}AVI_STRH_CHUNK; /*对于视频流,strf块结构如下*/
typedef struct avi_strf_chunk
{
unsigned char id[]; //块ID,固定为strf
unsigned int size; //块大小,等于struct avi_strf_chunk去掉id和size的大小
unsigned int size1; //size1含义和值同size一样
unsigned int width; //视频主窗口宽度(单位:像素)
unsigned int height; //视频主窗口高度(单位:像素)
unsigned short planes; //始终为1
unsigned short bitcount; //每个像素占的位数,只能是1、4、8、16、24和32中的一个
unsigned char compression[]; //视频流编码格式,如JPEG、MJPG等
unsigned int image_size; //视频图像大小,等于width * height * bitcount / 8
unsigned int x_pixels_per_meter; //显示设备的水平分辨率,设为0即可
unsigned int y_pixels_per_meter; //显示设备的垂直分辨率,设为0即可
unsigned int num_colors; //含义不清楚,设为0即可
unsigned int imp_colors; //含义不清楚,设为0即可
}AVI_STRF_CHUNK; typedef struct avi_strl_list
{
unsigned char id[]; //块ID,固定为LIST
unsigned int size; //块大小,等于struct avi_strl_list去掉id和size的大小
unsigned char type[]; //块类型,固定为strl
AVI_STRH_CHUNK strh;
AVI_STRF_CHUNK strf;
}AVI_STRL_LIST; typedef struct avi_hdrl_list
{
unsigned char id[]; //块ID,固定为LIST
unsigned int size; //块大小,等于struct avi_hdrl_list去掉id和size的大小
unsigned char type[]; //块类型,固定为hdrl
AVI_AVIH_CHUNK avih;
AVI_STRL_LIST strl;
}AVI_HDRL_LIST; #endif

Jpeg2AVI.c

 #include "Jpeg2AVI.h"
#include "list.h"
#include <stdlib.h>
#include <string.h> static int nframes; //总帧数
static int totalsize; //帧的总大小
static struct list_head list; //保存各帧图像大小的链表,用于写索引块 /*链表宿主结构,用于保存真正的图像大小数据*/
struct ListNode
{
int value;
struct list_head head;
}; static void write_index_chunk(FILE *fp)
{
unsigned char index[] = {'i', 'd', 'x', ''}; //索引块ID
unsigned int index_chunk_size = * nframes; //索引块大小
unsigned int offset = ;
struct list_head *slider = NULL;
struct list_head *tmpslider = NULL; fwrite(index, , , fp);
fwrite(&index_chunk_size, , , fp); list_for_each_safe(slider, tmpslider, &list)
{
unsigned char tmp[] = {'', '', 'd', 'c'}; //00dc = 压缩的视频数据
unsigned int keyframe = 0x10; //0x10表示当前帧为关键帧
struct ListNode *node = list_entry(slider, struct ListNode, head); fwrite(tmp, , , fp);
fwrite(&keyframe, , , fp);
fwrite(&offset, , , fp);
fwrite(&node->value, , , fp);
offset = offset + node->value + ; list_del(slider);
free(node);
}
} static void back_fill_data(FILE *fp, int width, int height, int fps)
{
AVI_RIFF_HEAD riff_head =
{
{'R', 'I', 'F', 'F'},
+ sizeof(AVI_HDRL_LIST) + sizeof(AVI_LIST_HEAD) + nframes * + totalsize,
{'A', 'V', 'I', ' '}
}; AVI_HDRL_LIST hdrl_list =
{
{'L', 'I', 'S', 'T'},
sizeof(AVI_HDRL_LIST) - ,
{'h', 'd', 'r', 'l'},
{
{'a', 'v', 'i', 'h'},
sizeof(AVI_AVIH_CHUNK) - ,
/ fps, , , , nframes, , , , width, height,
{, , , }
},
{
{'L', 'I', 'S', 'T'},
sizeof(AVI_STRL_LIST) - ,
{'s', 't', 'r', 'l'},
{
{'s', 't', 'r', 'h'},
sizeof(AVI_STRH_CHUNK) - ,
{'v', 'i', 'd', 's'},
{'J', 'P', 'E', 'G'},
, , , , , , , nframes, , 0xFFFFFF, ,
{, , width, height}
},
{
{'s', 't', 'r', 'f'},
sizeof(AVI_STRF_CHUNK) - ,
sizeof(AVI_STRF_CHUNK) - ,
width, height, , ,
{'J', 'P', 'E', 'G'},
width * height * , , , ,
}
}
}; AVI_LIST_HEAD movi_list_head =
{
{'L', 'I', 'S', 'T'},
+ nframes * + totalsize,
{'m', 'o', 'v', 'i'}
}; //定位到文件头,回填各块数据
fseek(fp, , SEEK_SET);
fwrite(&riff_head, sizeof(riff_head), , fp);
fwrite(&hdrl_list, sizeof(hdrl_list), , fp);
fwrite(&movi_list_head, sizeof(movi_list_head), , fp);
} void jpeg2avi_start(FILE *fp)
{
int offset1 = sizeof(AVI_RIFF_HEAD); //riff head大小
int offset2 = sizeof(AVI_HDRL_LIST); //hdrl list大小
int offset3 = sizeof(AVI_LIST_HEAD); //movi list head大小 //AVI文件偏移量设置到movi list head后,从该位置向后依次写入JPEG数据
fseek(fp, offset1 + offset2 + offset3, SEEK_SET); //初始化链表
list_head_init(&list); nframes = ;
totalsize = ;
} void jpeg2avi_add_frame(FILE *fp, void *data, unsigned int len)
{
unsigned char tmp[] = {'', '', 'd', 'c'}; //00dc = 压缩的视频数据
struct ListNode *node = (struct ListNode *)malloc(sizeof(struct ListNode)); /*JPEG图像大小4字节对齐*/
while (len % )
{
len++;
} fwrite(tmp, , , fp); //写入是否是压缩的视频数据信息
fwrite(&len, , , fp); //写入4字节对齐后的JPEG图像大小
fwrite(data, len, , fp); //写入真正的JPEG数据 nframes += ;
totalsize += len; /*将4字节对齐后的JPEG图像大小保存在链表中*/
if (node != NULL)
{
node->value = len;
list_add_tail(&node->head, &list);
}
} void jpeg2avi_end(FILE *fp, int width, int height, int fps)
{
//写索引块
write_index_chunk(fp); //从文件头开始,回填各块数据
back_fill_data(fp, width, height, fps);
}

list.h

 #ifndef _LIST_H_
#define _LIST_H_ struct list_head
{
struct list_head *next;
struct list_head *prev;
}; void list_head_init(struct list_head *list);
void list_add_tail(struct list_head *_new, struct list_head *head);
void list_del(struct list_head *entry); #ifndef offsetof
#define offsetof(TYPE, MEMBER) \
((size_t) &((TYPE *))->MEMBER)
#endif #ifndef container_of
#define container_of(ptr, type, member) \
((type *)((char *)ptr - offsetof(type,member)))
#endif /**
* list_entry - get the struct for this entry
* @ptr: the &struct list_head pointer.
* @type: the type of the struct this is embedded in.
* @member: the name of the list_struct within the struct.
*/
#define list_entry(ptr, type, member) \
container_of(ptr, type, member) /**
* list_for_each_safe - iterate over a list safe against removal of list entry
* @pos: the &struct list_head to use as a loop cursor.
* @n: another &struct list_head to use as temporary storage
* @head: the head for your list.
*/
#define list_for_each_safe(pos, n, head) \
for (pos = (head)->next, n = pos->next; pos != (head); \
pos = n, n = pos->next) #endif //_LIST_H_

list.c

 #include "list.h"
#include <stdio.h> static void __list_add(struct list_head *_new, struct list_head *prev, struct list_head *next)
{
next->prev = _new;
_new->next = next;
_new->prev = prev;
prev->next = _new;
} static void __list_del(struct list_head *prev, struct list_head *next)
{
next->prev = prev;
prev->next = next;
} void list_head_init(struct list_head *list)
{
list->next = list;
list->prev = list;
} /**
* list_add_tail - insert a new entry before the specified head
* @_new: new entry to be added
* @head: list head to add it before
*/
void list_add_tail(struct list_head *_new, struct list_head *head)
{
__list_add(_new, head->prev, head);
} /**
* list_del - deletes entry from list.
* @entry: the element to delete from the list.
*/
void list_del(struct list_head *entry)
{
__list_del(entry->prev, entry->next);
entry->next = NULL;
entry->prev = NULL;
}

main.c

 #include "Jpeg2AVI.h"
#include <string.h> #define JPEG_MAX_SIZE 100000 //JPEG图像最大字节数
#define JPEG_NUM 13800 //JPEG图像数量 int main()
{
FILE *fp_jpg;
FILE *fp_avi;
int filesize;
unsigned char jpg_data[JPEG_MAX_SIZE];
char filename[];
int i = ; fp_avi = fopen("sample.avi","wb"); jpeg2avi_start(fp_avi); for (i = ; i < JPEG_NUM; i++)
{
memset(filename, , );
memset(jpg_data, , JPEG_MAX_SIZE); sprintf(filename, "%d.jpg", i + );
fp_jpg = fopen(filename, "rb"); if (fp_jpg != NULL)
{
/*获取JPEG数据大小*/
fseek(fp_jpg, , SEEK_END);
filesize = ftell(fp_jpg);
fseek(fp_jpg, , SEEK_SET); /*将JPEG数据读到缓冲区*/
fread(jpg_data, filesize, , fp_jpg); /*将JPEG数据写入AVI文件*/
jpeg2avi_add_frame(fp_avi, jpg_data, filesize);
} fclose(fp_jpg);
} jpeg2avi_end(fp_avi, , , ); fclose(fp_avi);
printf("end\n"); return ;
}
上一篇:Sentry(v20.12.1) K8S 云原生架构探索,SENTRY FOR JAVASCRIPT SDK 配置详解


下一篇:花生壳宣布网站的网址直接绑定到详细的项目——jboss版本