1. <nobr id="easjo"><address id="easjo"></address></nobr>

      <track id="easjo"><source id="easjo"></source></track>
      1. 
        

      2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
      3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>
          貴州做網站公司
          貴州做網站公司~專業!靠譜!
          10年網站模板開發經驗,熟悉國內外開源網站程序,包括DEDECMS,WordPress,ZBlog,Discuz! 等網站程序,可為您提供網站建設,網站克隆,仿站,網頁設計,網站制作,網站推廣優化等服務。我們專注高端營銷型網站,企業官網,集團官網,自適應網站,手機網站,網絡營銷,網站優化,網站服務器環境搭建以及托管運維等。為客戶提供一站式網站解決方案?。?!

          mp4文件格式詳解

          來源:互聯網轉載 時間:2023-09-06 20:37:29

          目前MP4的概念被炒得很火,也很亂。最開始MP4指的是音頻(MP3的升級版),即MPEG-2 AAC標準。隨后MP4概念被轉移到視頻上,對應的是MPEG-4標準。而現在我們流行的叫法,多半是指能播放MPEG-4標準編碼格式視頻的播放器。但是這篇文章介紹的內容跟上面這些都無關,我們要討論的是MP4文件封裝格式,對應的標準為ISO/IEC 14496-12,即信息技術?視聽對象編碼的第12部分:ISO?基本媒體文件格式(Information technology Coding of audio-visual objects Part 12: ISO base media file format)。ISO/IEC組織指定的標準一般用數字表示,ISO/IEC 14496即MPEG-4標準。

          ????MP4視頻文件封裝格式是基于QuickTime容器格式定義的,因此參考QuickTime的格式定義對理解MP4文件格式很有幫助。MP4文件格式是一個十分開放的容器,幾乎可以用來描述所有的媒體結構,MP4文件中的媒體描述與媒體數據是分開的,并且媒體數據的組織也很自由,不一定要按照時間順序排列,甚至媒體數據可以直接引用其他文件。同時,MP4也支持流媒體。MP4目前被廣泛用于封裝h.264視頻和AAC音頻,是高清視頻的代表。

          ?

          ????現在我們就來看看MP4文件格式到底是什么樣的。

          1、概述

          ????MP4文件中的所有數據都裝在box(QuickTime中為atom)中,也就是說MP4文件由若干個box組成,每個box有類型和長度,可以將box理解為一個數據對象塊。box中可以包含另一個box,這種box稱為container box。一個MP4文件首先會有且只有一個“ftyp”類型的box,作為MP4格式的標志并包含關于文件的一些信息;之后會有且只有一個“moov”類型的box(Movie Box),它是一種container box,子box包含了媒體的metadata信息;MP4文件的媒體數據包含在“mdat”類型的box(Midia Data Box)中,該類型的box也是container box,可以有多個,也可以沒有(當媒體數據全部引用其他文件時),媒體數據的結構由metadata進行描述。

          ????下面是一些概念:

          ????track??表示一些sample的集合,對于媒體數據來說,track表示一個視頻或音頻序列。

          ????hint track??這個特殊的track并不包含媒體數據,而是包含了一些將其他數據track打包成流媒體的指示信息。

          ????sample??對于非hint track來說,video sample即為一幀視頻,或一組連續視頻幀,audio sample即為一段連續的壓縮音頻,它們統稱sample。對于hint track,sample定義一個或多個流媒體包的格式。

          ????sample table??指明sampe時序和物理布局的表。

          ????chunk?一個track的幾個sample組成的單元。

          ????在本文中,我們不討論涉及hint的內容,只關注包含媒體數據的本地MP4文件。下圖為一個典型的MP4文件的結構樹。

          ?

          2、Box

          ???????首先需要說明的是,box中的字節序為網絡字節序,也就是大端字節序(Big-Endian),簡單的說,就是一個32位的4字節整數存儲方式為高位字節在內存的低端。Box由header和body組成,其中header統一指明box的大小和類型,body根據類型有不同的意義和格式。

          ???????標準的box開頭的4個字節(32位)為box size,該大小包括box header和box body整個box的大小,這樣我們就可以在文件中定位各個box。如果size為1,則表示這個box的大小為large size,真正的size值要在largesize域上得到。(實際上只有“mdat”類型的box才有可能用到large size。)如果size為0,表示該box為文件的最后一個box,文件結尾即為該box結尾。(同樣只存在于“mdat”類型的box中。)

          ???????size后面緊跟的32位為box type,一般是4個字符,如“ftyp”、“moov”等,這些box type都是已經預定義好的,分別表示固定的意義。如果是“uuid”,表示該box為用戶擴展類型。如果box type是未定義的,應該將其忽略。

          3、File Type Box(ftyp)

          ????該box有且只有1個,并且只能被包含在文件層,而不能被其他box包含。該box應該被放在文件的最開始,指示該MP4文件應用的相關信息。

          ????“ftyp” body依次包括1個32位的major brand(4個字符),1個32位的minor version(整數)和1個以32位(4個字符)為單位元素的數組compatible brands。這些都是用來指示文件應用級別的信息。該box的字節實例如下:

          4、Movie Box(moov)

          ????該box包含了文件媒體的metadata信息,“moov”是一個container box,具體內容信息由子box詮釋。同File Type Box一樣,該box有且只有一個,且只被包含在文件層。一般情況下,“moov”會緊隨“ftyp”出現。

          ????一般情況下(限于篇幅,本文只講解常見的MP4文件結構),“moov”中會包含1個“mvhd”和若干個“trak”。其中“mvhd”為header box,一般作為“moov”的第一個子box出現(對于其他container box來說,header box都應作為首個子box出現)?!皌rak”包含了一個track的相關信息,是一個container box。下圖為部分“moov”的字節實例,其中紅色部分為box header,綠色為“mvhd”,黃色為一部分“trak”。

          4.1 Movie Header Box(mvhd)

          ????“mvhd”結構如下表。

          ?

          cellpadding="0" cellspacing="0">

          字段

          字節數

          意義

          box size

          4

          box大小

          box type

          4

          box類型

          version

          1

          box版本,0或1,一般為0。(以下字節數均按version=0)

          flags

          3

          ?

          creation time

          4

          創建時間(相對于UTC時間1904-01-01零點的秒數)

          modification time

          4

          修改時間

          time scale

          4

          文件媒體在1秒時間內的刻度值,可以理解為1秒長度的時間單元數

          duration

          4

          該track的時間長度,用duration和time scale值可以計算track時長,比如audio track的time scale = 8000, duration = 560128,時長為70.016,video track的time scale = 600, duration = 42000,時長為70

          rate

          4

          推薦播放速率,高16位和低16位分別為小數點整數部分和小數部分,即[16.16] 格式,該值為1.0(0x00010000)表示正常前向播放

          volume

          2

          與rate類似,[8.8] 格式,1.0(0x0100)表示最大音量

          reserved

          10

          保留位

          matrix

          36

          視頻變換矩陣

          pre-defined

          24

          ?

          next track id

          4

          下一個track使用的id號

          ?

          ???

          ????“mvhd”的字節實例如下圖,各字段已經用顏色區分開:

          4.2 Track Box(trak)

          ????“trak”也是一個container box,其子box包含了該track的媒體數據引用和描述(hint track除外)。一個MP4文件中的媒體可以包含多個track,且至少有一個track,這些track之間彼此獨立,有自己的時間和空間信息?!皌rak”必須包含一個“tkhd”和一個“mdia”,此外還有很多可選的box(略)。其中“tkhd”為track header box,“mdia”為media box,該box是一個包含一些track媒體數據信息box的container box。

          ????“trak”的部分字節實例如下圖,其中黃色為“trak”box的頭,綠色為“tkhd”,藍色為“edts”(一個可選box),紅色為一部分“mdia”。

          ?

          4.2.1 Track Header Box(tkhd)

          ????“tkhd”結構如下表。?

          字段

          字節數

          意義

          box size

          4

          box大小

          box type

          4

          box類型

          version

          1

          box版本,0或1,一般為0。(以下字節數均按version=0)

          flags

          3

          按位或操作結果值,預定義如下:

          0x000001 track_enabled,否則該track不被播放;

          0x000002 track_in_movie,表示該track在播放中被引用;

          0x000004 track_in_preview,表示該track在預覽時被引用。

          一般該值為7,如果一個媒體所有track均未設置track_in_movie和track_in_preview,將被理解為所有track均設置了這兩項;對于hint track,該值為0

          creation time

          4

          創建時間(相對于UTC時間1904-01-01零點的秒數)

          modification time

          4

          修改時間

          track id

          4

          id號,不能重復且不能為0

          reserved

          4

          保留位

          duration

          4

          track的時間長度

          reserved

          8

          保留位

          layer

          2

          視頻層,默認為0,值小的在上層

          alternate group

          2

          track分組信息,默認為0表示該track未與其他track有群組關系

          volume

          2

          [8.8] 格式,如果為音頻track,1.0(0x0100)表示最大音量;否則為0

          reserved

          2

          保留位

          matrix

          36

          視頻變換矩陣

          width

          4

          height

          4

          高,均為 [16.16] 格式值,與sample描述中的實際畫面大小比值,用于播放時的展示寬高

          ?

          ?

          ????“tkhd”的字節實例如下圖,各字段已經用顏色區分開:


          4.2.2 Media Box(mdia)

          ????“mdia”也是個container box,其子box的結構和種類還是比較復雜的。先來看一個“mdia”的實例結構樹圖。


          ???????總體來說,“mdia”定義了track媒體類型以及sample數據,描述sample信息。一般“mdia”包含一個“mdhd”,一個“hdlr”和一個“minf”,其中“mdhd”為media header box,“hdlr”為handler reference box,“minf”為media information box。下面依次看一下這幾個box的結構。

          4.2.2.1 Media Header Box(mdhd)

          ????“mdhd”結構如下表。?

          字段

          字節數

          意義

          box size

          4

          box大小

          box type

          4

          box類型

          version

          1

          box版本,0或1,一般為0。(以下字節數均按version=0)

          flags

          3

          ?

          creation time

          4

          創建時間(相對于UTC時間1904-01-01零點的秒數)

          modification time

          4

          修改時間

          time scale

          4

          同前表

          duration

          4

          track的時間長度

          language

          2

          媒體語言碼。最高位為0,后面15位為3個字符(見ISO 639-2/T標準中定義)

          pre-defined

          2

          ?

          ??

          ????“mdhd”的字節實例如下圖,各字段已經用顏色區分開:

          4.2.2.2 Handler Reference Box(hdlr)

          ????“hdlr”解釋了媒體的播放過程信息,該box也可以被包含在meta box(meta)中?!癶dlr”結構如下表。

          ?

          字段

          字節數

          意義

          box size

          4

          box大小

          box type

          4

          box類型

          version

          1

          box版本,0或1,一般為0。(以下字節數均按version=0)

          flags

          3

          ?

          pre-defined

          4

          ?

          handler type

          4

          在media box中,該值為4個字符:

          “vide”— video track

          “soun”— audio track

          “hint”— hint track

          reserved

          12

          ?

          name

          不定

          track type name,以‘\0’結尾的字符串

          ?

          ????“hdlr”的字節實例如下圖,各字段已經用顏色區分開:


          4.2.2.3 Media Information Box(minf)

          ????“minf”存儲了解釋track媒體數據的handler-specific信息,media handler用這些信息將媒體時間映射到媒體數據并進行處理?!癿inf”中的信息格式和內容與媒體類型以及解釋媒體數據的media handler密切相關,其他media handler不知道如何解釋這些信息?!癿inf”是一個container box,其實際內容由子box說明。

          ????一般情況下,“minf”包含一個header box,一個“dinf”和一個“stbl”,其中,header box根據track type(即media handler type)分為“vmhd”、“smhd”、“hmhd”和“nmhd”,“dinf”為data information box,“stbl”為sample table box。下面分別介紹。

          ????下圖為“minf”部分字節實例,其中紅色為box header,藍色為“smhd”,綠色為“dinf”,黃色為一部分“stbl”。

          ?

          4.2.2.3.1 Media Information Header Box(vmhd、smhd、hmhd、nmhd)

          Video Media Header Box(vmhd)?

          字段

          字節數

          意義

          box size

          4

          box大小

          box type

          4

          box類型

          version

          1

          box版本,0或1,一般為0。(以下字節數均按version=0)

          flags

          3

          ?

          graphics mode

          4

          視頻合成模式,為0時拷貝原始圖像,否則與opcolor進行合成

          opcolor

          2×3

          {red,green,blue}

          ?

          ?

          Sound Media Header Box(smhd)?

          字段

          字節數

          意義

          box size

          4

          box大小

          box type

          4

          box類型

          version

          1

          box版本,0或1,一般為0。(以下字節數均按version=0)

          flags

          3

          ?

          balance

          2

          立體聲平衡,[8.8] 格式值,一般為0,-1.0表示全部左聲道,1.0表示全部右聲道

          reserved

          2

          ?

          ?

          Hint Media Header Box(hmhd)

          ????略

          Null Media Header Box(nmhd)

          ????非視音頻媒體使用該box,略。

          4.2.2.3.2 Data Information Box(dinf)

          ????“dinf”解釋如何定位媒體信息,是一個container box?!癲inf”一般包含一個“dref”,即data reference box;“dref”下會包含若干個“url”或“urn”,這些box組成一個表,用來定位track數據。簡單的說,track可以被分成若干段,每一段都可以根據“url”或“urn”指向的地址來獲取數據,sample描述中會用這些片段的序號將這些片段組成一個完整的track。一般情況下,當數據被完全包含在文件中時,“url”或“urn”中的定位字符串是空的。

          ????“dref”的字節結構如下表。?

          字段

          字節數

          意義

          box size

          4

          box大小

          box type

          4

          box類型

          version

          1

          box版本,0或1,一般為0。(以下字節數均按version=0)

          flags

          3

          ?

          entry count

          4

          “url”或“urn”表的元素個數

          “url”或“urn”列表

          不定

          ?

          ?

          ????“url”或“urn”都是box,“url”的內容為字符串(location string),“urn”的內容為一對字符串(name string and location string)。當“url”或“urn”的box flag為1時,字符串均為空。

          ????下面是一個“dinf”的字節實例圖。其中黃色為“dinf”的box header,由紅色部分我們知道包含的“url”或“urn”個數為1,紅色后面為“url”box的內容。紫色為“url”的box header(根據box type我們知道是個“url”),綠色為box flag,值為1,說明“url”中的字符串為空,表示track數據已包含在文件中。

          4.2.2.3.3 Sample Table Box(stbl)

          ????“stbl”幾乎是普通的MP4文件中最復雜的一個box了,首先需要回憶一下sample的概念。sample是媒體數據存儲的單位,存儲在media的chunk中,chunk和sample的長度均可互不相同,如下圖所示。

          ????“stbl”包含了關于track中sample所有時間和位置的信息,以及sample的編解碼等信息。利用這個表,可以解釋sample的時序、類型、大小以及在各自存儲容器中的位置?!皊tbl”是一個container box,其子box包括:sample description box(stsd)、time to sample box(stts)、sample size box(stsz或stz2)、sample to chunk box(stsc)、chunk offset box(stco或co64)、composition time to sample box(ctts)、sync sample box(stss)等。

          ????“stsd”必不可少,且至少包含一個條目,該box包含了data reference box進行sample數據檢索的信息。沒有“stsd”就無法計算media sample的存儲位置?!皊tsd”包含了編碼的信息,其存儲的信息隨媒體類型不同而不同。

          Sample Description Box(stsd)

          ????box header和version字段后會有一個entry count字段,根據entry的個數,每個entry會有type信息,如“vide”、“sund”等,根據type不同sample description會提供不同的信息,例如對于video track,會有“VisualSampleEntry”類型信息,對于audio track會有“AudioSampleEntry”類型信息。

          ????視頻的編碼類型、寬高、長度,音頻的聲道、采樣等信息都會出現在這個box中。

          Time To Sample Box(stts)

          ????“stts”存儲了sample的duration,描述了sample時序的映射方法,我們通過它可以找到任何時間的sample?!皊tts”可以包含一個壓縮的表來映射時間和sample序號,用其他的表來提供每個sample的長度和指針。表中每個條目提供了在同一個時間偏移量里面連續的sample序號,以及samples的偏移量。遞增這些偏移量,就可以建立一個完整的time to sample表。

          Sample Size Box(stsz)

          ????“stsz” 定義了每個sample的大小,包含了媒體中全部sample的數目和一張給出每個sample大小的表。這個box相對來說體積是比較大的。

          Sample To Chunk Box(stsc)

          ????用chunk組織sample可以方便優化數據獲取,一個thunk包含一個或多個sample?!皊tsc”中用一個表描述了sample與chunk的映射關系,查看這張表就可以找到包含指定sample的thunk,從而找到這個sample。

          Sync Sample Box(stss)

          ????“stss”確定media中的關鍵幀。對于壓縮媒體數據,關鍵幀是一系列壓縮序列的開始幀,其解壓縮時不依賴以前的幀,而后續幀的解壓縮將依賴于這個關鍵幀?!皊tss”可以非常緊湊的標記媒體內的隨機存取點,它包含一個sample序號表,表內的每一項嚴格按照sample的序號排列,說明了媒體中的哪一個sample是關鍵幀。如果此表不存在,說明每一個sample都是一個關鍵幀,是一個隨機存取點。

          Chunk Offset Box(stco)

          ????“stco”定義了每個thunk在媒體流中的位置。位置有兩種可能,32位的和64位的,后者對非常大的電影很有用。在一個表中只會有一種可能,這個位置是在整個文件中的,而不是在任何box中的,這樣做就可以直接在文件中找到媒體數據,而不用解釋box。需要注意的是一旦前面的box有了任何改變,這張表都要重新建立,因為位置信息已經改變了。

          5、Free Space Box(free或skip)

          ????“free”中的內容是無關緊要的,可以被忽略。該box被刪除后,不會對播放產生任何影響。

          6、Meida Data Box(mdat)

          ????該box包含于文件層,可以有多個,也可以沒有(當媒體數據全部為外部文件引用時),用來存儲媒體數據。數據直接跟在box type字段后面,具體數據結構的意義需要參考metadata(主要在sample table中描述)。

          ?

          ????普通MP4文件的結構就講完了,可能會比較亂,下面這張圖是常見的box的樹結構圖,可以用來大致了解MP4文件的構造。

          ???

          ????這篇文章主要面向一些對MP4文件結構沒有太多了解的初學者,算是篇比較初級的文章,本人也是參考了一些資料寫出來的,對于MP4文件中涉及的一些概念沒有太深入的了解,因此其中應該是有一些錯誤理解,希望大家抱著批判的眼光讀這篇文章。如果有錯誤的地方,還請大家不吝賜教。

          該文主要參考了標準和網友wqyuwss的blog系列文章:mp4文件格式

          網絡推廣與網站優化公司(網絡優化與推廣專家)作為數字營銷領域的核心服務提供方,其價值在于通過技術手段與策略規劃幫助企業提升線上曝光度、用戶轉化率及品牌影響力。這...

          在當今數字化時代,公司網站已成為企業展示形象、傳遞信息和開展業務的重要平臺。然而,對于許多公司來說,網站建設的價格是一個關鍵考量因素。本文將圍繞“公司網站建設價...

          在當今的數字化時代,企業網站已成為企業展示形象、吸引客戶和開展業務的重要平臺。然而,對于許多中小企業來說,高昂的網站建設費用可能會成為其發展的瓶頸。幸運的是,隨...

          蘋果手機QQ顯示2G在線怎么設置?有兩種情況1.是可以表示用蘋果手機登陸后的,但是是2g網絡,同理可證,3g是手機3g在線,另外無線網絡標志意思是是手機wifi在線,電腦標志應該是電腦免費。2.要是是對方的屬于什么掛機的或退圈于桌面本來以前的那是2g然后他剛刪號時間不長也會會如此總是顯示.蘋果手機上的QQ只顯示4G,沒有顯示Wifi,這是什么情況?應該怎么辦?直接點擊可以設置,下拉到點開,再點可以...

          qplayerios版怎么使用?第一個是視頻播放軟件,可以下載觀看視頻,也可以打開網站播放。具體步驟如下:1。功能:視頻播放,可流暢播放高清視頻文件;2。直接播放,無需轉碼和安裝第三方插件,可識別手機上的所有視頻,支持視頻刪除功能;3。找到你想看的電影,點擊觀看。一些IE窗口會彈出提示(是否允許插件運行);4。要始終允許,您可以正常觀看。如果沒有,請繼續往下看。P2P播放是一種邊看邊下的形式,也就...

          select是什么牌子?Select是丹麥品牌。Selected是世界上最大的時裝集團之一。是凌志時尚著名的商務休閑男裝品牌。1997年在丹麥成立,2008年引入中國市場。Selected在全球25多個國家擁有自己的分店。select是哪個鍵急?打開游戲最上面一行,左邊第三個是“意見”第一個是“模擬設置”點擊彈出框頂部的“控制”“鍵盤”右欄下面有“選擇”,鍵盤上對應的鍵是“選擇”。所有的鑰匙都可以...

          TOP
          国产初高中生视频在线观看|亚洲一区中文|久久亚洲欧美国产精品|黄色网站入口免费进人
          1. <nobr id="easjo"><address id="easjo"></address></nobr>

              <track id="easjo"><source id="easjo"></source></track>
              1. 
                

              2. <bdo id="easjo"><optgroup id="easjo"></optgroup></bdo>
              3. <track id="easjo"><source id="easjo"><em id="easjo"></em></source></track><option id="easjo"><span id="easjo"><em id="easjo"></em></span></option>