找回密码
 立即注册
LiveVideoStack 首页 资讯 查看内容
  • QQ空间
  • 回复
  • 收藏

FFmpeg专栏 | 代码导读——基础篇(三)

2018-4-12 21:18

3.FLV文件结构解析


FLV(FLASH VIDEO),是一种常用的文件封装格式,目前国内外大部分视频分享网站都是采用的这种格式。其标准定义为《Adobe Flash Video File Format Specification》。RTMP协议也是基于FLV视频格式的。


FLV的文件格式在该规范中已阐述清楚,本章节不再重复描述,而是结合下面的示例具体阐述如何分析FLV文件。


图3. FLV文件结构示例1


图4. FLV文件结构示例2


FLV文件的分析工具有很多,这里给大家推荐FLV Parser这个小软件,通过它可以很容易的看到文件的组成结构。


3.1文件结构


从整个文件上看,FLV是由Header和File Body组成,如下图所示:


图5. FLV文件总体结构


  1. FLV Header - 长度为9,其结构的标准定义参见标准定义见E.2 The FLV header;

  2. FLV File Body - 由一连串的PreviousTagSize + Tag构成。previousTagSize是4个字节的数据,表示前一个tag的size。标准定义参见E.3 The FLV File Body。


以图3. FLV文件结构示例1为例分析整体结构:


1.位置0x00000000 - 0x00000008, 共9个字节,为FLV Header,其中:


  • 0x00000000 - 0x00000002 : 0x46 0x4C 0x56分别表示字符'F''L''V',用来标识这个文件是FLV格式的。在做格式探测的时候,如果发现前3个字节为“FLV”,就认为它是FLV文件;

  • 0x00000003 : 0x01, 表示FLV版本号;

  • 0x00000004 : 0x05, 转换为2进制是0000 0101,其中第0位为1,表示存在video,第2位为1,表示存在audio;

  • 0x00000005 - 0x00000008 : 0x00 0x00 0x00 0x09,转十进制为9,表示FLV header的长度,当FLV 版本号为1时,该值通常为9。


2.位置0x00000009 - ,为FLV File Body:


  • 0x00000009 - 0x0000000C : 0x00 0x00 0x00 0x00 PreviousTagSize0,转十进制为0,该值永远为0;

  • 0x0000000D - 0x00000209 : 0x12 ... 0x09,共509个字节,为Tag1的具体内容;

  • 0x0000020A - 0x0000020D : 0x00 0x00 0x01 0xFD,转十进制为509,表示它前面的Tag,即Tag1的长度为509;

  • 0x0000020E - :按照Tag + PreviousTagSize的结构依次递推,此处不再举例说明。


3.2Tag定义


FLV File Body是由一系列的PreviousTagSize + Tag组成,其中PreviousTagSize的长度为4个字节,用来表示前一个Tag的长度;Tag里面的数据可能是video、audio或者scripts,其定义参见E.4.1 FLV Tag,结构如下:


图6. FLV Tag 结构


以图3. FLV文件结构示例1为例分析Tag结构:


  1. 位置0x0000020E : 0x08, 二进制为0000 1000,第5位为0, 表示为非加扰文件;低5位01000为8,说明这个Tag包含的数据类型为Audio;

  2. 位置0x0000020F - 0x00000211 : 0x00 0x00 0x04,转十进制为4,说明Tag的内容长度为4,与该tag后面的previousTagSize(15) - 11相同;

  3. 位置0x00000212 - 0x00000214 : 0x00 0x00 0x00,转十进制为0,说明当前Audio数据的时间戳为0;

  4. 位置0x00000215 : 0x00,扩展时间戳为0,如果扩展时间戳不为0,那么该Tag的时间戳应为:Timestamp | TimestampExtended<<24;

  5. 位置0x00000216 - 0x00000218 : 0x00 0x00 0x00,StreamID,总是0;

  6. StreamID之后的数据每种格式的情况都不一样,下面会依次进行详细解读。


3.3Audio Tags


如果TAG包中的TagType等于8,表示该Tag中包含的数据类型为Audio。StreamID之后的数据就是AudioTagHeader,其定义详见E.4.2.1 AUDIODATA。结构如下:


图7. FLV Audio Tag结构


需要说明的是,通常情况下AudioTagHeader之后跟着的就是AUDIODATA数据了,但有个特例,如果音频编码格式为AAC,AudioTagHeader中会多出1个字节的数据AACPacketType,这个字段来表示AACAUDIODATA的类型:


  • 0 = AAC sequence header

  • 1 = AAC raw。


以图3. FLV文件结构示例为例分析AudioTag结构:


1.位置0x00000219 : 0xAF, 二进制表示为1010 1111:


  • 高4位为1010,转十进制为10,表示Audio的编码格式为AAC;

  • 第3、2位为11,转十进制为3,表示该音频的采样率为44KHZ;

  • 第1位为1,表示该音频采样点位宽为16bits;

  • 第0位为1,表示该音频为立体声。


2.位置0x0000021A : 0x00,十进制为0,并且Audio的编码格式为AAC,说明AACAUDIODATA中存放的是AAC sequence header;

3.位置0x0000021B - 0x0000021C : AUDIODATA数据,即AAC sequence header。


3.3.1 AudioSpecificConfig


AAC sequence header中存放的是AudioSpecificConfig,该结构包含了更加详细的音频信息,《ISO-14496-3 Audio》中的1.6.2.1 章节对此作了详细定义。


通常情况下,AAC sequence header这种Tag在FLV文件中只出现1次,并且是第一个Audio Tag,它存放了解码AAC音频所需要的详细信息。


为什么AudioTagHeader中定义了音频的相关参数,我们还需要传递AudioSpecificConfig呢?


因为当SoundFormat为AAC时,SoundType须设置为1(立体声),SoundRate须设置为3(44KHZ),但这并不意味着FLV文件中AAC编码的音频必须是44KHZ的立体声。播放器在播放AAC音频时,应忽略AudioTagHeader中的参数,并根据AudioSpecificConfig来配置正确的解码参数。

来自: LiveVideoStack
文章点评