FLV封装格式解析

原理

FLV封装格式是由一个FLV Header文件头和一个一个的Tag组成的。Tag中包含了音频数据以及视频数据。FLV的结构如下图所示。


有关FLV的格式本文不再做记录。可以参考文章《 视音频编解码学习工程:FLV封装格式分析器 》。本文的程序实现了FLV中的FLV Header和Tag的解析,并可以分离出其中的音频流。

代码

整个程序位于simplest_flv_parser()函数中,如下所示。
  1. #include <stdio.h>  
  2. #include <stdlib.h>  
  3. #include <string.h>  
  4.   
  5. //Important!  
  6. #pragma pack(1)  
  7.   
  8.   
  9. #define TAG_TYPE_SCRIPT 18  
  10. #define TAG_TYPE_AUDIO  8  
  11. #define TAG_TYPE_VIDEO  9  
  12.   
  13. typedef unsigned char byte;  
  14. typedef unsigned int uint;  
  15.   
  16. typedef struct {  
  17.     byte Signature[3];  
  18.     byte Version;  
  19.     byte Flags;  
  20.     uint DataOffset;  
  21. } FLV_HEADER;  
  22.   
  23. typedef struct {  
  24.     byte TagType;  
  25.     byte DataSize[3];  
  26.     byte Timestamp[3];  
  27.     uint Reserved;  
  28. } TAG_HEADER;  
  29.   
  30.   
  31. //reverse_bytes - turn a BigEndian byte array into a LittleEndian integer  
  32. uint reverse_bytes(byte *p, char c) {  
  33.     int r = 0;  
  34.     int i;  
  35.     for (i=0; i<c; i++)   
  36.         r |= ( *(p+i) << (((c-1)*8)-8*i));  
  37.     return r;  
  38. }  
  39.   
  40. /** 
  41.  * Analysis FLV file 
  42.  * @param url    Location of input FLV file. 
  43.  */  
  44.   
  45. int simplest_flv_parser(char *url){  
  46.   
  47.     //whether output audio/video stream  
  48.     int output_a=1;  
  49.     int output_v=1;  
  50.     //-------------  
  51.     FILE *ifh=NULL,*vfh=NULL, *afh = NULL;  
  52.   
  53.     //FILE *myout=fopen("output_log.txt","wb+");  
  54.     FILE *myout=stdout;  
  55.   
  56.     FLV_HEADER flv;  
  57.     TAG_HEADER tagheader;  
  58.     uint previoustagsize, previoustagsize_z=0;  
  59.     uint ts=0, ts_new=0;  
  60.   
  61.     ifh = fopen(url, "rb+");  
  62.     if ( ifh== NULL) {  
  63.         printf("Failed to open files!");  
  64.         return -1;  
  65.     }  
  66.   
  67.     //FLV file header  
  68.     fread((char *)&flv,1,sizeof(FLV_HEADER),ifh);  
  69.   
  70.     fprintf(myout,"============== FLV Header ==============\n");  
  71.     fprintf(myout,"Signature:  0x %c %c %c\n",flv.Signature[0],flv.Signature[1],flv.Signature[2]);  
  72.     fprintf(myout,"Version:    0x %X\n",flv.Version);  
  73.     fprintf(myout,"Flags  :    0x %X\n",flv.Flags);  
  74.     fprintf(myout,"HeaderSize: 0x %X\n",reverse_bytes((byte *)&flv.DataOffset, sizeof(flv.DataOffset)));  
  75.     fprintf(myout,"========================================\n");  
  76.   
  77.     //move the file pointer to the end of the header  
  78.     fseek(ifh, reverse_bytes((byte *)&flv.DataOffset, sizeof(flv.DataOffset)), SEEK_SET);  
  79.   
  80.     //process each tag  
  81.     do {  
  82.   
  83.         previoustagsize = _getw(ifh);  
  84.   
  85.         fread((void *)&tagheader,sizeof(TAG_HEADER),1,ifh);  
  86.   
  87.         //int temp_datasize1=reverse_bytes((byte *)&tagheader.DataSize, sizeof(tagheader.DataSize));  
  88.         int tagheader_datasize=tagheader.DataSize[0]*65536+tagheader.DataSize[1]*256+tagheader.DataSize[2];  
  89.         int tagheader_timestamp=tagheader.Timestamp[0]*65536+tagheader.Timestamp[1]*256+tagheader.Timestamp[2];  
  90.   
  91.         char tagtype_str[10];  
  92.         switch(tagheader.TagType){  
  93.         case TAG_TYPE_AUDIO:sprintf(tagtype_str,"AUDIO");break;  
  94.         case TAG_TYPE_VIDEO:sprintf(tagtype_str,"VIDEO");break;  
  95.         case TAG_TYPE_SCRIPT:sprintf(tagtype_str,"SCRIPT");break;  
  96.         default:sprintf(tagtype_str,"UNKNOWN");break;  
  97.         }  
  98.         fprintf(myout,"[%6s] %6d %6d |",tagtype_str,tagheader_datasize,tagheader_timestamp);  
  99.   
  100.         //if we are not past the end of file, process the tag  
  101.         if (feof(ifh)) {  
  102.             break;  
  103.         }  
  104.   
  105.         //process tag by type  
  106.         switch (tagheader.TagType) {  
  107.   
  108.         case TAG_TYPE_AUDIO:{   
  109.             char audiotag_str[100]={0};  
  110.             strcat(audiotag_str,"| ");  
  111.             char tagdata_first_byte;  
  112.             tagdata_first_byte=fgetc(ifh);  
  113.             int x=tagdata_first_byte&0xF0;  
  114.             x=x>>4;  
  115.             switch (x)  
  116.             {  
  117.             case 0:strcat(audiotag_str,"Linear PCM, platform endian");break;  
  118.             case 1:strcat(audiotag_str,"ADPCM");break;  
  119.             case 2:strcat(audiotag_str,"MP3");break;  
  120.             case 3:strcat(audiotag_str,"Linear PCM, little endian");break;  
  121.             case 4:strcat(audiotag_str,"Nellymoser 16-kHz mono");break;  
  122.             case 5:strcat(audiotag_str,"Nellymoser 8-kHz mono");break;  
  123.             case 6:strcat(audiotag_str,"Nellymoser");break;  
  124.             case 7:strcat(audiotag_str,"G.711 A-law logarithmic PCM");break;  
  125.             case 8:strcat(audiotag_str,"G.711 mu-law logarithmic PCM");break;  
  126.             case 9:strcat(audiotag_str,"reserved");break;  
  127.             case 10:strcat(audiotag_str,"AAC");break;  
  128.             case 11:strcat(audiotag_str,"Speex");break;  
  129.             case 14:strcat(audiotag_str,"MP3 8-Khz");break;  
  130.             case 15:strcat(audiotag_str,"Device-specific sound");break;  
  131.             default:strcat(audiotag_str,"UNKNOWN");break;  
  132.             }  
  133.             strcat(audiotag_str,"| ");  
  134.             x=tagdata_first_byte&0x0C;  
  135.             x=x>>2;  
  136.             switch (x)  
  137.             {  
  138.             case 0:strcat(audiotag_str,"5.5-kHz");break;  
  139.             case 1:strcat(audiotag_str,"1-kHz");break;  
  140.             case 2:strcat(audiotag_str,"22-kHz");break;  
  141.             case 3:strcat(audiotag_str,"44-kHz");break;  
  142.             default:strcat(audiotag_str,"UNKNOWN");break;  
  143.             }  
  144.             strcat(audiotag_str,"| ");  
  145.             x=tagdata_first_byte&0x02;  
  146.             x=x>>1;  
  147.             switch (x)  
  148.             {  
  149.             case 0:strcat(audiotag_str,"8Bit");break;  
  150.             case 1:strcat(audiotag_str,"16Bit");break;  
  151.             default:strcat(audiotag_str,"UNKNOWN");break;  
  152.             }  
  153.             strcat(audiotag_str,"| ");  
  154.             x=tagdata_first_byte&0x01;  
  155.             switch (x)  
  156.             {  
  157.             case 0:strcat(audiotag_str,"Mono");break;  
  158.             case 1:strcat(audiotag_str,"Stereo");break;  
  159.             default:strcat(audiotag_str,"UNKNOWN");break;  
  160.             }  
  161.             fprintf(myout,"%s",audiotag_str);  
  162.   
  163.             //if the output file hasn't been opened, open it.  
  164.             if(output_a!=0&&afh == NULL){  
  165.                 afh = fopen("output.mp3""wb");  
  166.             }  
  167.   
  168.             //TagData - First Byte Data  
  169.             int data_size=reverse_bytes((byte *)&tagheader.DataSize, sizeof(tagheader.DataSize))-1;  
  170.             if(output_a!=0){  
  171.                 //TagData+1  
  172.                 for (int i=0; i<data_size; i++)  
  173.                     fputc(fgetc(ifh),afh);  
  174.   
  175.             }else{  
  176.                 for (int i=0; i<data_size; i++)  
  177.                     fgetc(ifh);  
  178.             }  
  179.             break;  
  180.         }  
  181.         case TAG_TYPE_VIDEO:{  
  182.             char videotag_str[100]={0};  
  183.             strcat(videotag_str,"| ");  
  184.             char tagdata_first_byte;  
  185.             tagdata_first_byte=fgetc(ifh);  
  186.             int x=tagdata_first_byte&0xF0;  
  187.             x=x>>4;  
  188.             switch (x)  
  189.             {  
  190.             case 1:strcat(videotag_str,"key frame  ");break;  
  191.             case 2:strcat(videotag_str,"inter frame");break;  
  192.             case 3:strcat(videotag_str,"disposable inter frame");break;  
  193.             case 4:strcat(videotag_str,"generated keyframe");break;  
  194.             case 5:strcat(videotag_str,"video info/command frame");break;  
  195.             default:strcat(videotag_str,"UNKNOWN");break;  
  196.             }  
  197.             strcat(videotag_str,"| ");  
  198.             x=tagdata_first_byte&0x0F;  
  199.             switch (x)  
  200.             {  
  201.             case 1:strcat(videotag_str,"JPEG (currently unused)");break;  
  202.             case 2:strcat(videotag_str,"Sorenson H.263");break;  
  203.             case 3:strcat(videotag_str,"Screen video");break;  
  204.             case 4:strcat(videotag_str,"On2 VP6");break;  
  205.             case 5:strcat(videotag_str,"On2 VP6 with alpha channel");break;  
  206.             case 6:strcat(videotag_str,"Screen video version 2");break;  
  207.             case 7:strcat(videotag_str,"AVC");break;  
  208.             default:strcat(videotag_str,"UNKNOWN");break;  
  209.             }  
  210.             fprintf(myout,"%s",videotag_str);  
  211.   
  212.             fseek(ifh, -1, SEEK_CUR);  
  213.             //if the output file hasn't been opened, open it.  
  214.             if (vfh == NULL&&output_v!=0) {  
  215.                 //write the flv header (reuse the original file's hdr) and first previoustagsize  
  216.                     vfh = fopen("output.flv""wb");  
  217.                     fwrite((char *)&flv,1, sizeof(flv),vfh);  
  218.                     fwrite((char *)&previoustagsize_z,1,sizeof(previoustagsize_z),vfh);  
  219.             }  
  220. #if 0  
  221.             //Change Timestamp  
  222.             //Get Timestamp  
  223.             ts = reverse_bytes((byte *)&tagheader.Timestamp, sizeof(tagheader.Timestamp));  
  224.             ts=ts*2;  
  225.             //Writeback Timestamp  
  226.             ts_new = reverse_bytes((byte *)&ts, sizeof(ts));  
  227.             memcpy(&tagheader.Timestamp, ((char *)&ts_new) + 1, sizeof(tagheader.Timestamp));  
  228. #endif  
  229.   
  230.   
  231.             //TagData + Previous Tag Size  
  232.             int data_size=reverse_bytes((byte *)&tagheader.DataSize, sizeof(tagheader.DataSize))+4;  
  233.             if(output_v!=0){  
  234.                 //TagHeader  
  235.                 fwrite((char *)&tagheader,1, sizeof(tagheader),vfh);  
  236.                 //TagData  
  237.                 for (int i=0; i<data_size; i++)  
  238.                     fputc(fgetc(ifh),vfh);  
  239.             }else{  
  240.                 for (int i=0; i<data_size; i++)  
  241.                     fgetc(ifh);  
  242.             }  
  243.             //rewind 4 bytes, because we need to read the previoustagsize again for the loop's sake  
  244.             fseek(ifh, -4, SEEK_CUR);  
  245.   
  246.             break;  
  247.             }  
  248.         default:  
  249.   
  250.             //skip the data of this tag  
  251.             fseek(ifh, reverse_bytes((byte *)&tagheader.DataSize, sizeof(tagheader.DataSize)), SEEK_CUR);  
  252.         }  
  253.   
  254.         fprintf(myout,"\n");  
  255.   
  256.     } while (!feof(ifh));  
  257.   
  258.   
  259.     _fcloseall();  
  260.   
  261.     return 0;  
  262. }  

上文中的函数调用方法如下所示。
[cpp]  view plain  copy
  在CODE上查看代码片 派生到我的代码片
  1. simplest_flv_parser("cuc_ieschool.flv");  

结果

本程序的输入为一个FLV的文件路径,输出为FLV的统计数据,如下图所示。


此外本程序还可以分离FLV中的视频码流和音频码流。需要注意的是本程序并不能分离一些特定类型的音频(例如AAC)和视频

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值