專利名稱:文件編制方法和數(shù)據(jù)再現(xiàn)方法
技術領域:
本發(fā)明涉及采用G.726等聲音編碼方式的數(shù)據(jù)的文件制作方法和數(shù)據(jù)再現(xiàn)方法。
背景技術:
過去,作為通信用編碼方式,G.726和G.727等聲音編碼方式和H.261等動態(tài)圖像編碼方式,已由ITU-T(InternationalTelecommunication Union-Telecommunication Standardization Sector)進行了標準化。利用這種通信用編碼方式進行編碼的聲音數(shù)據(jù)和動態(tài)圖像數(shù)據(jù),其使用方式像電話通信那樣,直接通過通信線路進行傳輸,一旦把數(shù)據(jù)作為文件保存,然后,從文件中對聲音編碼數(shù)據(jù)進行解碼、再現(xiàn),這種使用方式也有設想。
在本說明書中,利用G.726作為該通信編碼方式的一例,進行說明如下。該G.726是一種聲音編碼方式,它利用編碼率為16千位/秒,24千位/秒,32千位/秒,40千位/秒這4種,在一秒內對8000個聲音取樣進行編碼,對每個聲音取樣,根據(jù)各自的編碼率依次分配2位、3位、4位、5位的位數(shù)。而且,以下把利用G.726編碼的聲音取樣稱為G.726取樣。
并且,作為文件格式的國際標準方式,已有ISO/IECJTC1/SC29/WG11 MPEG標準化的MP4文件格式。對該MP4文件格式中的數(shù)據(jù)進行解碼處理時的單位稱為存取單元,一個存取單元,像MPEG4AAC(Moving Picture Experts Group Phase 4 Advanced AudioCoding)等那樣,在采用把多個聲音取樣集中起來一齊進行編碼的幀(frame)結構的編碼方式中相當于1幀;像G.726等那樣,在不采用幀結構的編碼方式的情況下,一個G.726取樣相當于一個存取單元。
在此,對過去的文件制作方法加以說明。
首先,按G.726的編碼率對數(shù)字聲音數(shù)據(jù)進行編碼,制成G.726取樣,從一個G.726取樣制成一個存取單元。這時,在制作MP4文件時,必須按字節(jié)單位,即8位的整數(shù)倍單位來記錄一個存取單元。所以,如上所述,G.726的任一編碼率也都是一個G.726取樣為2~5位,不能成為8位的整數(shù)倍,所以,根據(jù)G.726的編碼率,增加6~3位的填充數(shù)據(jù),使1個存取單元變成8位的整數(shù)倍,制成一個存取單元。
然后,若結束上述編碼,制成最后的存取單元,則把所有的存取單元進行重疊(多重化),作為存取單元隊列,與MP4文件的標題信息相組合,制成MP4文件。
圖1表示利用上述過去的文件制作方法制作的MP4文件的結構。如該圖所示,MP4文件100由電影邏輯框101和電影數(shù)據(jù)邏輯框102構成,上述MP4文件的標題信息存放在電影邏輯框101內,上述存取單元隊列存放在電影數(shù)據(jù)邏輯框102內。
電影邏輯框(ボックス)101由存放邏輯框的標題信息的邏輯框標題部103和子邏輯框隊列104構成,該子邏輯框隊列由存放MP4文件100的格式信息的邏輯框群構成。在此把上述邏輯框標題信息和上述格式信息的組合體稱為MP4文件標題信息。
邏輯框標題部103包含在所有的邏輯框內,是存放各邏輯框標題信息的邏輯框,邏輯框標題信息記錄在邏輯框大小106、邏輯框型號107等內。
在邏輯框大小106內存放用字節(jié)單位表示邏輯框大小的信息,例如,若電影邏輯框101的大小為10KB(千字節(jié)),則邏輯框大小106內存放10K信息。
在邏輯框型號107內存放用4個字符的代碼來表示邏輯框的種類的信息。例如,在表示電影邏輯框101的種類的情況下,在邏輯框型號107內存放“moov”代碼信息,并且,在表示電影數(shù)據(jù)邏輯框102的種類的情況下,存放“mdat”代碼信息。
并且,上述子邏輯框隊列104由取樣大小邏輯框109,填充位邏輯框110和取樣描述邏輯框111等構成。
取樣大小邏輯框109是存放存取單元的大小和數(shù)量的信息的邏輯框,它由邏輯框標題部103、全取樣大小112、取樣計數(shù)113和取樣大小隊列114構成。
全取樣大小112,在所有的存取單元的大小都是同樣的情況下,記錄該存取單元的大小。在此情況下,不制作取樣大小隊列114,并且,在取樣計數(shù)113中,記錄存取單元的總數(shù),在取樣大小隊列114中即使只有一個大小不同的存取單元的情況下,也記錄所有的存取單元的大小。而且,在此情況下,所有取樣大小112都設定為零。
填充位邏輯框110是存放填充數(shù)據(jù)的位信息的邏輯框,該填充數(shù)據(jù)包括在所有的存取單元內,用于使1個存取單元變成8位的整數(shù)倍,該填充位邏輯框110由邏輯框標題部103、取樣計數(shù)115和填充位隊列116構成。
在取樣計數(shù)115中,與上述取樣計數(shù)113一樣,記錄存取單元的總數(shù),在填充位隊列116中存放表示包括在存取單元內的填充位的信息,對每個存取單元分別記錄填充數(shù)據(jù)的位信息。
取樣描述邏輯框111是存放G.726和G.727等編碼方式各不相同的信息的邏輯框,存放編碼率等信息。
再者,電影數(shù)據(jù)邏輯框102由邏輯框標題部103和存取單元隊列105構成,存取單元隊列105是由存取單元105a進行重疊而構成。并且,一個存取單元105a由G.726取樣105b和填充數(shù)據(jù)105c而制成(參見ISO/IEC JCT1/SC29/WG11 MPEG2001年7月20日發(fā)行ISO/IEC14496-1“LSO Media File format specification”)圖2說明利用過去的文件制作方法,使按照G.726的編碼率24千位/秒進行編碼的G.726取樣實現(xiàn)文件化時的文件大小。
MP4文件100如上所述,由電影邏輯框101和電影數(shù)據(jù)邏輯框102構成,對電影邏輯框101的大小和電影數(shù)據(jù)邏輯框102的大小進行合計而求出MP4文件100的文件大小。
在此,為了簡化說明,根據(jù)把16聲音取樣編碼成G.726取樣時的文件大小,說明持續(xù)60秒編碼后的文件大小。并且,對于上述電影邏輯框101內的構成子邏輯框隊列104的邏輯框,僅利用取樣大小邏輯框109和填充位邏輯框110來進行說明。而且,電影邏輯框101的邏輯框大小,隨著取樣大小邏輯框109和填充位邏輯框110以外的邏輯框的大小而變化,所以設定為“××××”。
如圖所示,取樣大小邏輯框109,對邏輯框大小信息等各個項目分別各用4個字節(jié)進行記錄,合計共20個字節(jié)的大小。而且,表示取樣大小邏輯框109的種類的4個字符的代碼為“stsz”。
再者,填充位邏輯框110,對邏輯框(邏輯單元)大小信息等各個項目分別各用4個字節(jié),也就是說用共16個字節(jié)進行記錄,并且,附加在G.726取樣上的填充數(shù)據(jù)的位數(shù),對每個存取單元分別進行記錄。在此,因為是G.726的編碼率24千位/秒,所以,填充數(shù)據(jù)的位數(shù)是5,表示該填充數(shù)據(jù)的位數(shù)為5的信息,對每個存取單元各用4位,也就是說對16個存取單元用64位來進行記錄。
所以,填充位邏輯框110,對記錄邏輯框大小信息等各個項目的16個字節(jié),加上記錄表示上述填充數(shù)據(jù)位數(shù)為5的信息的64位,即8個字節(jié),合計為24個字節(jié)的大小。而且,表示填充位邏輯框110的種類的4個字符的代碼為“padb”。
另一方面,電影數(shù)據(jù)邏輯框102,對邏輯框大小信息和邏輯框型號信息各用4個字節(jié),即共用8個字節(jié)進行記錄。表示該電影數(shù)據(jù)邏輯框102的種類的4個字符的代碼為“mdat”。并且,在記錄存取單元時,必須以一個存取單元為字節(jié)單位。也就是說,按照編碼率24千位/秒把5位的填充數(shù)據(jù)附加到3位的G.726取樣上,所以,在把16聲音取樣編碼成G.726取樣的情況下,制成16個存取單元,必須是16個字節(jié)的大小。所以,電影數(shù)據(jù)邏輯框102,對記錄上述邏輯框大小信息等的各個項目的8個字節(jié)再加上記錄16個存取單元的16個字節(jié),共計是24個字節(jié)。
再者,在60秒后,480,000聲音取樣被編碼成G.726取樣,電影數(shù)據(jù)邏輯框102的大小變成480,000字節(jié),取樣大小邏輯框109的大小變成20個字節(jié),填充位邏輯框110的大小變成240,016字節(jié)。
這樣,利用過去的文件制作方法,把采用G.726的編碼聲音數(shù)據(jù)制作成上述結構的文件,附加上聲音數(shù)據(jù)文件進行發(fā)送的帶有聲音的郵件、或者聲音數(shù)據(jù)文件,放置在網絡服務器上,用于下載、保存、再現(xiàn)的互聯(lián)網分配等。
但是,在利用上述文件制作方法,像G.726那樣,把非8位的整數(shù)倍的G.726取樣作為一個存取單元的情況下,必須在G.726取樣上附加填充數(shù)據(jù),把一個存取單元制成8位的整數(shù)倍,另外,也還需要存放上述填充數(shù)據(jù)的位信息的填充位邏輯框,所以,出現(xiàn)的問題是制成的文件的冗余性增強。
并且,存取單元的大小即使只有一個不同,也必須把所在的存取單元的大小都記錄在取樣大小邏輯框內,因此,出現(xiàn)的問題是制作的文件的冗余性更加增強。
其結果,又出現(xiàn)的問題是記錄媒體中記錄文件的存儲區(qū)、以及互聯(lián)網分配時下載所需的時間都將增加,進一步造成通信費用增加。
發(fā)明的內容因此,本發(fā)明,鑒于上述問題,其第1目的在于提供一種不增加文件的冗余性,能減小文件大小,減小記錄文件所需的存儲區(qū),減少文件下載所需的時間的MP4文件制作方法。
再者,本發(fā)明的第2目的在于提供一種能從用上述文件制作方法制作的MP4文件中讀出、再現(xiàn)數(shù)據(jù)的數(shù)據(jù)再現(xiàn)方法。
為達到上述第1目的,本發(fā)明是從包括多個編碼取樣在內的數(shù)字編碼數(shù)據(jù)中制作文件的方法,其特征在于包括以下步驟
存取單元數(shù)據(jù)制作步,其通過按一定數(shù)量對上述多個編碼取樣進行集中,而生成同樣大小的多個存取單元數(shù)據(jù);以及文件輸出步,其對在上述存取單元制作步生成的存取單元數(shù)據(jù)進行重疊,作為文件進行輸出。
再者,為達到上述第2目的,本發(fā)明作為數(shù)據(jù)再現(xiàn)方法,按一定數(shù)量對多個編碼取樣進行集中,制成全部存取單元數(shù)據(jù)的大小均相同的文件,對包含在上述存取單元數(shù)據(jù)中的上述編碼取樣進行解碼、再現(xiàn),該數(shù)據(jù)再現(xiàn)方法,其特征在于具有以下步驟存取單元解析步,其對包含在上述存取單元數(shù)據(jù)中的上述一定數(shù)量加以規(guī)定;以及解碼步,其根據(jù)上述存取單元解碼步的解析結果,對包含在上述存取單元數(shù)據(jù)中的上述一定數(shù)量的上述編碼取樣進行解碼。
這樣一來,對多個編碼取樣進行集中,制成字節(jié)為單位,全部存取單元的大小均一樣的文件,所以,不需要填充數(shù)據(jù)的附加和填充數(shù)據(jù)的位信息,并且能使取樣大小邏輯框減到最小,能減小文件大小。
并且,對包含在存取單元內的編碼取樣數(shù)進行解析,進行編碼,所以,能讀出、正確地解碼和再現(xiàn)用上述文件制作方法制作的文件。
附圖的簡要說明圖1是利用過去的文件制作方法制作的MP4文件的結構圖。
圖2是利用過去的文件制作方法制作的MP4文件大小說明圖。
圖3是涉及本發(fā)明第1實施方式的文件制作裝置的結構方框圖。
圖4a是利用涉及本發(fā)明第1實施方式的文件制作裝置進行處理的模式圖,該處理是根據(jù)按編碼率16千位/秒進行編碼的G.726取樣來制作存取單元。
圖4b是利用涉及本發(fā)明第1實施方式的文件制作裝置進行處理的模式圖,該處理是根據(jù)按編碼率24千位/秒進行編碼的G.726取樣來制作存取單元。
圖4c是利用涉及本發(fā)明第1實施方式的文件制作裝置進行處理的模式圖,該處理是根據(jù)按編碼率32千位/秒進行編碼的G.726取樣來制作存取單元。
圖4d是利用涉及本發(fā)明第1實施方式的文件制作裝置進行處理的模式圖,該處理是根據(jù)按編碼率40千位/秒進行編碼的G.726取樣來制作存取單元。
圖5是利用涉及本發(fā)明第1實施方式的文件制作裝置根據(jù)G.726取樣來制作存取單元的處理流程圖。
圖6是利用涉及本發(fā)明第1實施方式的文件制作方法制作的MP4文件的結構圖。
圖7是利用涉及本發(fā)明第1實施方式的文件制作方法制作的MP4文件的文件大小說明圖。
圖8是涉及本發(fā)明第2實施方式的數(shù)據(jù)再現(xiàn)裝置的結構方框圖。
圖9是涉及本發(fā)明第2實施方式的數(shù)據(jù)再現(xiàn)裝置的數(shù)據(jù)解碼處理的一部分的流程圖。
圖10是涉及本發(fā)明第1實施方式的文件制作裝置和涉及第2實施方式的數(shù)據(jù)再現(xiàn)裝置的使用例圖。
發(fā)明的
具體實施例方式
以及參照附圖,詳細說明本發(fā)明的實施方式。
圖3是涉及本發(fā)明第1實施方式的文件制作裝置的結構方框圖。
該文件制作裝置201是接受聲音數(shù)據(jù)的輸入,進行編碼,輸出MP4文件,寫入到存儲裝置206內的計算機等,其中具有數(shù)據(jù)輸入部202、編碼部203、格式制作部204和文件輸出部205。
數(shù)據(jù)輸入部202是接受聲音數(shù)據(jù)輸入的處理部,是接受模擬聲音數(shù)據(jù)輸入的話筒等和數(shù)字聲音數(shù)據(jù)輸入的接口等。這里,數(shù)據(jù)輸入部202在接受模擬聲音數(shù)據(jù)輸入的情況下,對該模擬聲音數(shù)據(jù)進行取樣和量子化,將其變換成數(shù)字聲音數(shù)據(jù)。
編碼部203是根據(jù)從G.726的4種編碼率中選出的編碼率,對數(shù)字聲音數(shù)據(jù)進行編碼,制成G.726取樣的處理部,其中具有CPU和存儲器。并且,該編碼部203根據(jù)上述編碼率,把多個G.726取樣集中在一起制成一個存取單元,使存取單元成為8位的整數(shù)倍,輸出到文件輸出部205內。再者,該編碼部203把在從G.726取樣制成一個存取單元時的格式信息輸出到格式制作部204內。
這里,所謂格式信息,是指存取單元的合計數(shù)、1個存取單元的大小、1個存取單元內包含的G.726取樣數(shù)、最后的存取單元內包含的有效取樣數(shù)和位率等。
格式制作部204是根據(jù)上述格式信息來制作MP4文件的標題信息的處理部,其中具有CPU和存儲器。并且該格式制作部204進行把上述制成的標題信息輸出到文件輸出部205內的處理。
文件輸出部205是一種處理部,它把上述存取單元重疊起來,制成存取單元隊列,把該存取單元隊列和上述標題信息組合在一起,制成MP4文件。其中具有CPU和存儲器。并且,該文件輸出部205進行輸出已制作的MP4文件,存儲到存儲裝置206內的處理。
存儲裝置206是硬盤、CD-R、SD存儲卡等記錄媒體,用于存儲用上述文件制作裝置制作的MP4文件。
以下說明采用上述結構的文件制作裝置的MP4文件的文件制作方法。
圖4(a)是上述文件制作裝置201進行制作處理的模式圖,這是把按照編碼率16位/秒進行編碼的G.726取樣制作成存取單元。
如圖所示,編碼部203把8個2位的G.726取樣302集合起來,制成16位,即2個字節(jié)的存取單元301,并輸出到文件輸出部205內。這樣,編碼部203連續(xù)進行以下動作;把每8個2位的G.726取樣302集合起來制成一個存取單元,把制成的存取單元輸出到文件輸出部205內。
這里,從文件輸入部202輸入的數(shù)字聲音數(shù)據(jù)的總取樣數(shù)不是8的倍數(shù)的情況下,最后的存取單元303包含1~7個G.726取樣302。這時,編碼部203進行大小調整,使存取單元的大小成為2個字節(jié)。
例如,如圖所示,在剩余了5個G.726取樣302的情況下,5×2位=10位,為了把存取單元的大小制成2個字節(jié),尚缺少6位,所以,由編碼部203附加6位的填充數(shù)據(jù)305,把最后的存取單元303的大小調整到2個字節(jié)。
并且,編碼部203在進行這樣的大小調整之后,把該最后的存取單元303輸出到文件輸出部205內。
再者,編碼部203若結束最后的存取單元303的制作,則把表示全部存取單元的數(shù)量、以及最后的存取單元303內所包含的有效取樣304為5個G.726取樣等的格式信息輸出到格式制作部204內。
圖4(b)是上述文件制作裝置201進行制作處理的模式圖,這是把按照編碼率24位/秒進行編碼的G.726取樣制作成存取單元。
如圖所示,編碼部203連續(xù)進行以下動作把8個3位的G.726取樣302集合起來,制成24位、即3個字節(jié)的存取單元301,再把每8個3位的G.726取樣302集合起來,制成1個存取單元,把制成的存取單元輸出到文件輸出部205內。
這里,在從數(shù)據(jù)輸入部202輸入的聲音數(shù)據(jù)的總取樣數(shù)不是8的倍數(shù)的情況下最后存取單元303包含1~7個G.726取樣302,和上述情況一樣,由編碼部203進行大小調整,使存取單元的大小變成3個字節(jié)。
圖4(c)是文件制作裝置201進行制作處理的模式圖,這是把按照編碼率32千位/秒進行編碼的G.726取樣制成存取單元。
如圖所示,編碼部203連續(xù)進行以下動作把4個4位的G.726取樣302集合起來,制成16位、即2個字節(jié)的存取單元301,再把每4個4位的G.726取樣302集合起來,制成1個存取單元,把制成的存取單元輸出到文件輸出部205內。
這里,在從數(shù)據(jù)輸入部202輸入的聲音數(shù)據(jù)的總取樣數(shù)不是4的倍數(shù)的情況下最后存取單元303包含1~3個G.726取樣302,和上述情況一樣,由編碼部203進行大小調整,使存取單元的大小變成2個字節(jié)。
圖4(d)是文件制作裝置201進行制作處理的模式圖,這是把按照編碼率40千位/秒進行編碼的G.726取樣制成存取單元。
如圖所示,編碼部203連續(xù)進行以下動作把8個5位的G.726取樣302集合起來,制成40位、即5個字節(jié)的存取單元301,再把每8個5位的G.726取樣302集合起來,制成1個存取單元,把制成的存取單元輸出到文件輸出部205內。
這里,在從數(shù)據(jù)輸入部202輸入的聲音數(shù)據(jù)的總取樣數(shù)不是8的倍數(shù)的情況下最后存取單元303包含1~7個G.726取樣302,和上述情況一樣,由編碼部203進行大小調整,使存取單元的大小變成5個字節(jié)。
這樣,G.726的任一編碼率也都是由編碼部203把G.726取樣302集合起來,制成一個存取單元301,并使存取單元301的大小變成8位的整數(shù)倍,而且是同樣的大小。再者,由于從數(shù)據(jù)輸入部202輸入的數(shù)字聲音數(shù)據(jù)經編碼后的G.726取樣302總數(shù)的關系,在不能使最后的存取單元303的大小與其他存取單元的大小相同的情況下,附加填充數(shù)據(jù)305,進行大小調整,制成最后的存取單元303。
而且,對G.726取樣302進行集中的數(shù)量并非僅限于上述的數(shù)量,可以選擇任意的數(shù)X,只要通過對上述G.726取樣302進行集中能使1個存取單元301的大小能成為8位的整數(shù)倍即可。
但是,也可能出現(xiàn)這樣的情況,即上述任意數(shù)X的值若設定得很大,則存取的粒度增大,在隨機存取再現(xiàn)時不能很準確地找出開頭。
例如,若把800個G.726取樣302歸結起來,制成1個存取單元301,則存取的粒度為1毫秒單位,另一方面,若把8000個G.726取樣302歸結起來制成1個存取單元301,則存取粒度為1秒單位。這樣,由于上述任意數(shù)X值增大,而在隨機存取再現(xiàn)時尋找開部的精度下降。
再者,如上所述,若把8000個G.726取樣302歸結起來制成一個存取單元301,則在G.726取樣302按編碼率24千位/秒進行編碼的情況下,集中了上述8000個G.726取樣302的一個存取單元301的大小為24,000位、即3000字節(jié)。這時,為了使所有的存取單元的大小都一致,附加到最后的存取單元303上的填充數(shù)據(jù)305的大小,最大時也可能需要23,997位,造成文件冗余性增大。
所以,上述任意數(shù)X值以盡量設定得較小為宜。
圖5表示從上述G.726取樣制作存取單元的處理流程圖。
首先,數(shù)據(jù)輸入部202接受聲音數(shù)據(jù)輸入(S11)。在此,在上述聲音數(shù)據(jù)為模擬聲音數(shù)據(jù)的情況下,數(shù)據(jù)輸入部202進行取樣、量子化,作為數(shù)字化處理,將其變換成數(shù)字聲音數(shù)據(jù)。并且,數(shù)據(jù)輸入部202把數(shù)字聲音數(shù)據(jù)輸出到編碼部203內。然后,編碼部203根據(jù)G.702的編碼率對從數(shù)據(jù)輸入部202接收的數(shù)字聲音數(shù)據(jù)進行編碼(S12),制成G.726取樣302(S13)。并且,編碼部203根據(jù)規(guī)定的文件化信息,用G.726取樣302制作存取單元301。在此,所謂規(guī)定的文件化信息,是指對每個上述編碼率,分別規(guī)了構成1個存取單元301的G.726取樣302的個數(shù)M,使存取單元301的大小成為8位的整數(shù)倍。再者,根據(jù)該文件化信息的編碼率,可以計算出分配給每1個G.726取樣的位數(shù)S。
這時,編碼部203對結束編碼的G.726取樣302的個數(shù)進行判斷(S14),在G.726取樣的個數(shù)大于上述個數(shù)M的情況下,取出M取樣,制作一個存取單元301(S15)。然后,在存取單元數(shù)C上加1(S16),再次判斷G.726取樣302的個數(shù)(S14),反復進行上述動作。
在此,在G.726取樣的個數(shù)為上述個數(shù)M的情況下,編碼部203取出M取樣,制成最后的存取單元301(S17)。并且,在G.726取樣的個數(shù)少于上述個數(shù)M的情況下,計算出剩余N個G.726取樣上附加的填充數(shù)據(jù)(S18)。這時,編碼部203對從M中減去N后的剩余值乘上S,計算出上述填充數(shù)據(jù)的位數(shù),在剩余的N個G.726取樣上附加上上述計算出的填充數(shù)據(jù),制成最后的存取單元301(S19)。
然后,編碼部203對存取單元數(shù)C加上1,計算出總存取單元數(shù)C(S20)。并且,在上述剩余的N個G.726取樣上附加上填充數(shù)據(jù)的情況下,把該個數(shù)N作為有效取樣,把該總存取單元數(shù)C、上述個數(shù)M、該有效取樣N、上述位數(shù)S和上述編碼率作為格式信息,輸出到格式制作部204內(S21)。
這樣,上述文件制作裝置201通過數(shù)據(jù)輸入部202來輸入數(shù)字聲音數(shù)據(jù),在編碼部203進行編碼,根據(jù)編碼率來集中數(shù)個G.726取樣,作為1個存取單元。并且,把上述存取單元輸出到文件輸出部205內,進行重疊,作為存取單元隊列。
并且,上述文件制作裝置201把在編碼部203對數(shù)字聲音數(shù)據(jù)進行文件化時的格式信息輸出到格式制作部204內,在該格式制作部204內,制作對上述格式信息進行記錄的取樣描述邏輯框和取樣大小邏輯框等子邏輯框隊列。
再者,上述文件制作裝置201在上述格式制作部204制作用于記錄各邏輯框的大小信息等的邏輯框標題部,并把記錄MP4文件100的標題信息的電影數(shù)據(jù)邏輯框和電影數(shù)據(jù)邏輯框的邏輯框標題部輸出到文件部205內。
然后,上述文件制作裝置201在文件輸出部205把包括多重化的存取單元隊列在內的邏輯框、以及記錄上述MP4文件100的標題信息的電影邏輯框等組合在一起,輸出到MP4文件100,把該MP4文件100存儲到存儲裝置206內。
圖6是涉及本發(fā)明第1實施方式的文件制作裝置制作的MP4文件的結構圖。
如圖所示,該MP4文件400和上述過去的MP4文件100一樣,由電影邏輯框401和電影數(shù)據(jù)邏輯框402構成,形成階梯化邏輯框結構。
電影邏輯框401是記錄MP4文件的標題信息的邏輯框群,在由邏輯框標題部403和子邏輯框隊列404構成這一點上,與上述過去的MP4文件100的結構相同,子邏輯框隊列404由取樣大小邏輯框409和取樣描述邏輯框410等構成,在沒有填充位邏輯框這一點上,與過去的MP4文件100的結構有很大不同。
并且,取樣大小邏輯框409由邏輯框標題部403、記錄取樣大小的邏輯框411、以及記錄總取樣數(shù)的取樣計邏輯框412構成,在沒有取樣大小隊列這一點上,與過去的MP4文件100的結構不同。
再者,存取單元隊列405由把多個G.726取樣302歸結起來而制成的存取單元301構成,在最后的存取單元303由有效取樣304和填充數(shù)據(jù)305構成這一點上,與過去的MP4文件100的結構不同。
并且,取樣描述邏輯框410,在記錄每一個存取單元的取樣數(shù)413和最后的存取單元的有效取樣數(shù)414這一點上,與過去的MP4文件的結構不同。
這樣,若采用涉及本發(fā)明的文件制作方法,則不需要按照字節(jié)單位,即8位的整數(shù)倍,來把多個G.726取樣302歸結起來制成一個存取單元301,對每個存取單元附加填充數(shù)據(jù),所以,不需要記錄填充數(shù)據(jù)的位信息的填充位邏輯框。
并且,因為把多個G.726取樣302歸結在一起制成1個存取單元301,使存取單元301的大小都有完全一樣,所以,不使用取樣大小隊列,能減小取樣大小邏輯框409的大小。
再有,對輸入的數(shù)字聲音數(shù)據(jù)的音取樣進行編碼,其結果,即使出現(xiàn)G.726取樣302的個數(shù)不夠,如上所述,不能歸結成是8位的整數(shù)倍,而且大小全都一樣的情況下,也可以在最后的存取單元303上附加填充數(shù)據(jù)305,所以,能使全部存取單元的大小都有一樣。
并且,在取樣描述邏輯框410內記錄每個存取單元的G.726取樣數(shù)413,并在附加上述填充數(shù)據(jù)305的情況下,記錄最后的存取單元的有效取樣數(shù)414,所以,在讀出MP4文件,進行解碼和再現(xiàn)處理時,利用這些信息,即可使數(shù)字聲音數(shù)據(jù)復原。
圖7是文件化時文件大小說明圖,這是利用涉及本發(fā)明第1實施方式的文件制作方法來使按G.726編碼率24千位/秒進行編碼的G.726取樣進行文件化。
其中,為了便于和利用過去的文件制作方法制作的文件大小進行比較,和上述過去的文件制作方法一樣,根據(jù)把16聲音取樣編碼成G.726取樣時的文件大小,說明連續(xù)60秒編碼后的文件大小。并且,同樣,對于構成上述電影邏輯框401內的子邏輯框隊列404的邏輯框,僅用取樣大小邏輯框409進行說明。而且,電影邏輯框401的邏輯框大小隨取樣大小邏輯框409以外的邏輯框的大小而變動,所以,定為“××××”。
如圖所示,取樣大小邏輯框409和過去的情況一樣,對邏輯框大小信息等各個項目分別用4字節(jié)記錄,合計為20字節(jié)大小。
再者,電影數(shù)據(jù)邏輯框402和過去的情況一樣,對邏輯框大小信息和邏輯框型號信息分別用4字節(jié),即共8字節(jié)進行記錄。
再有,每當記錄存取單元時,在編碼率24千位/秒中把8個3位的G.726取樣歸結起來,制成3字節(jié)的存取單元,所以,在把16聲音取樣編碼成G.726取樣的情況下,制成2個3字節(jié)的存取單元,需要6字節(jié)大小。所以,電影數(shù)據(jù)邏輯框402在記錄上述邏輯框大小信息等的各個項目的8個字節(jié)上,加上記錄2個3字節(jié)的存取單元的6字節(jié),合計為14字節(jié)。
再有,若采用本發(fā)明的文件制作方法,則不需要對每個存取單元附加填充數(shù)據(jù);所以不需在記錄填充數(shù)據(jù)的位信息的填充位邏輯框。
并且,在60秒后,480,000聲音取樣被編碼成G.726取樣,電影數(shù)據(jù)邏輯框402的大小變成180,008字節(jié),取樣大小邏輯框的大小變成20字節(jié),填充位邏輯框的大小變成0字節(jié)。
所以,如果把利用本發(fā)明的文件制作方法來制作的文件大小與利用過去的文件制作方法來制作的文件大小進行比較,那么,可以使電影數(shù)據(jù)邏輯框402的大字減少300,000字節(jié),并且,不需要填充位邏輯框,能減少240,016字節(jié)。
以下參照附圖,詳細說明涉及本發(fā)明第2實施方式的數(shù)據(jù)再現(xiàn)裝置。
圖8是涉及本發(fā)明第2實施方式的數(shù)據(jù)再現(xiàn)裝置的結構方框圖。
該數(shù)據(jù)再現(xiàn)裝置501是計算機等,它能對利用上述第1實施方式的文件制作裝置來制作,對存儲在存儲裝置502內的MP4文件,進行讀出,解碼,恢復成聲音,進行再現(xiàn),其中具有文件讀出部503、格式解析部504、解碼部505和再現(xiàn)部506。
文件讀出部503是從存儲裝置502中讀出MP4文件的CD-ROM驅動器和SD存儲卡讀出器等。該文件讀出部503把MP4文件的標題信息輸出到格式解析部504內,把MP4文件存取單元隊列每次向解碼部505內輸出1個存取單元。
格式解析部504具有CPU等,是對MP4文件的標題信息進行解析的處理部,對上述標題信息解析的結果,把獲得的格式信息輸出到解碼部505內。
解碼部505是具有CPU和存儲器,把MP4文件解碼成為聲音數(shù)據(jù)的處理部。該解碼部505從上述文件讀出部503中一個個地接收存取單元,并且,從上述格式解析部504中接收格式信息,根據(jù)該格式信息,把存取單元解碼成聲音數(shù)據(jù),輸出到再現(xiàn)部506內。
再現(xiàn)部506是楊聲器等外部輸出裝置,它把聲音數(shù)據(jù)變換成聲音進行再現(xiàn)。該再現(xiàn)部506從上述解碼部505中接收已解碼的聲音數(shù)據(jù),把該聲音數(shù)據(jù)變換成聲音,進行外部輸出。
存儲裝置502是存儲用上述第1實施方式的文件制作裝置而制作的MP4文件的硬盤、CD-R、SD存儲卡等記錄媒體。
以下說明采用上述結構的數(shù)據(jù)再現(xiàn)裝置的MP4文件的數(shù)據(jù)再現(xiàn)方法。
圖9是采用涉及本發(fā)明第2實施方式的數(shù)據(jù)再現(xiàn)裝置的數(shù)據(jù)解碼處理的一部分的流程圖。
首先,文件讀出部503讀出存儲在存儲裝置502內的MP4文件(S31)。并且,把記錄在電影邏輯框401內的MP4文件的標題信息輸出到格式解析部504內,從記錄在電影數(shù)據(jù)邏輯框402內的存取單元隊列405中,向解碼部505中一個個地輸出存取單元301。
然后,格式解析部504解析那些記錄了MP4文件標題信息的電影數(shù)據(jù)邏輯框內的取樣描述邏輯框和取樣大小邏輯框等,計算出總存取單元數(shù)C、構成一個存取單元301的G.726取樣302的個數(shù)M、最后的存取單元內所包含的G.726取樣的個數(shù)L、每1個G.726取樣的位數(shù)S和編碼率,作為格式信息輸出到解碼部505內(S32)。
并且,解碼部505若接收上述格式信息和上述1個存取單元301,則根據(jù)該格式信息對該1個存取單元301進行解碼(S33)。然后,解碼部505從存取單元數(shù)C中減去1(S34),對構成該1個存取單元301的M個G.726取樣進行解碼(S34)。
在此,解碼部505從上述格式信息中把總存取單元數(shù)C記錄到內部具有的存儲器內,計算出存取單元數(shù)C的余數(shù),重復進行上述動作,直到最后一個之前的存取單元為止。
然后,解碼部505若從文件讀出部503中接收最后的存取單元,則根據(jù)上述格式信息來特定最后存取單元內所包含的G.726取樣的個數(shù)L(S36),對L個G.726取樣進行解碼(S37)。
在此,解碼部505根據(jù)取樣描述邏輯框410中的最后存取單元的有效取樣數(shù)414內所記錄的信息,對上述個數(shù)L進行特定。也就是就,在上述第1實施方式中,如果制作最后的存取單元的G.726取樣的個數(shù)為M,那么,上述個數(shù)L與上述個數(shù)M相同;如果制作最后存取單元的G.726取樣的個數(shù)為N,那么,上述個數(shù)L與上述個數(shù)N相同,無論在那種情況下,解碼部505都能把G.726取樣解碼成數(shù)字聲音數(shù)據(jù)。這樣,解碼部505對最后的存取單元中所包含的L個G.726取樣進行解碼后,把該已解碼的數(shù)字聲音數(shù)據(jù)輸出到再現(xiàn)部506內,結束解碼處理。
這樣,利用涉及本發(fā)明第2實施方式的數(shù)據(jù)再現(xiàn)裝置501,可以從利用上述第1實施方式的文件制作裝置制作的MP4文件中讀出和再現(xiàn)數(shù)據(jù)。
如前所述,涉本發(fā)明各實施方式的文件制作裝置和數(shù)據(jù)再現(xiàn)裝置,能減小大小,制成MP4文件,從制作的MP4文件中讀出再現(xiàn)數(shù)據(jù)。在此利用附圖,說明本發(fā)明的實施方式。
圖10表示涉及本發(fā)明第1實施方式的文件制作裝置和涉及第2實施方式的數(shù)據(jù)再現(xiàn)裝置的使用例。
涉及本發(fā)明第1實施方式的文件制作裝置和涉及第2實施方式的數(shù)據(jù)再現(xiàn)裝置能用于通過互聯(lián)網等通信線路來接收或發(fā)送MP4文件的音樂和圖像分配系統(tǒng)等。
如圖所示,該音樂和圖像分配系統(tǒng)由便攜式電話601、SD存儲卡602,音樂和圖像分配服務器603、數(shù)碼相機604、個人計算機605和網絡通信網606構成。
在此,便攜式電話601、數(shù)碼相機604和個人計算機605對應于文件制作裝置206和數(shù)據(jù)再現(xiàn)裝置501,SD存儲卡602對應于存儲裝置206和存儲裝置502。并且,音樂和圖像分配服務器603通過網絡通信網606來分配MP4文件。
例如,利用與文件制作裝置201和數(shù)據(jù)再現(xiàn)裝置501相對應的個人計算機,制作記錄了音樂數(shù)據(jù)的MP4文件,通過網絡通信網606而上載到音樂和圖像分配服務器603內。
并且,利用與文件制作裝置201和數(shù)據(jù)再現(xiàn)裝置501相對應的便攜式電話601,通過網絡通信網606能對上載到上述音樂和圖像分配服務器603內的MP4文件進行下載,存儲到與存儲裝置201和存儲裝置502相對應的SD存儲卡602內,能從SD存儲卡602中讀出上述MP4文件再現(xiàn)上述音樂數(shù)據(jù)。
再有,利用與文件制作裝置201和數(shù)據(jù)再現(xiàn)裝置501相對應的數(shù)碼相機604,拍攝靜止圖像或活動圖像,制作成記錄了靜止圖像數(shù)據(jù)或活動圖像數(shù)據(jù)的MP4文件,存放到SD存儲卡602內。并且,從數(shù)碼相機604中取出存有上述MP4文件的SD存儲卡602,可以利用個人計算機605或便攜式電話606來對其進行再現(xiàn),或者通過網絡通信網606將其上載到音樂和圖像分配服務器603內。
這樣,本發(fā)明,例如是在音樂和圖像分配系統(tǒng)中實現(xiàn)的,如果采用該文件制作裝置和數(shù)據(jù)再現(xiàn)裝置,那么,能減小制成的MP4文件的大小,所以,能縮短上載和下載時的通信時間,能進一步高效率地使用SD存儲卡等存儲裝置的容量。
以上,根據(jù)各實施方式,說明了涉及本發(fā)明的文件制作方法和數(shù)據(jù)再現(xiàn)方法,但本發(fā)明并非僅限于這些實施方式。
例如,在上述各實施方式中利用G·726作為通信用編碼方式進行了說明,但本發(fā)明并非僅限于G·726,而是也可以采用G·727和H·261等其他通信用編碼方式。并且,在上述第1實施方式中,關于編碼率和構成1個存取單元的G.726取樣的關系,按照規(guī)定的文件化信息,但也可以在制作文件時動態(tài)地設定1個存取單元中所包含的G·726取樣數(shù)。
再有,在上述第1實施方式中,對最后的存取單元內所包含的有效取樣數(shù),直接指定了有效取樣數(shù),但為了求出最后的存取單元中所包含的有效取樣數(shù),也可以使用其他指標。例如,像number-of-samples那樣是G·726取樣總數(shù),也能獲得同樣效果。也就是說,也可以用一個存取單元中所包含的G·726取樣數(shù)去除G·726取樣總數(shù)時的余數(shù)作為最后的存取單元內所包含的有效取樣數(shù)。再者,在上述各實施方式中,文件制作裝置和數(shù)據(jù)再現(xiàn)裝置與硬盤等存儲裝置相連接,但也可以通過網絡與文件服務器相連接。
再者,本發(fā)明也可以用程序化的軟件方式來實現(xiàn),即對涉及上述各實施方式的文件制作裝置和數(shù)據(jù)再現(xiàn)裝置中的動作進行程序化。
權利要求
1.一種文件制作方法,其是根據(jù)包含多個編碼取樣在內的數(shù)字編碼數(shù)據(jù)來制作文件,其特征在于包括以下步驟存取單元數(shù)據(jù)制作步,其通過每次都按一定數(shù)量來集中上述多個編碼取樣來生成同樣大小的多個存取單元數(shù)據(jù);以及文件輸出步,通過對在上述存取單元數(shù)據(jù)制作步生成的存取單元數(shù)據(jù)進行多重化、而作為文件輸出。
2.如權利要求1所述的文件制作方法,其特征在于上述存取單元數(shù)據(jù)制作步,每次都按一定數(shù)量來對上述多個編碼取樣進行集中,使全部存取單元數(shù)據(jù)的大小按字節(jié)單位是相同的。
3.如權利要求1所述的文件制作方法,其特征在于上述文件制作方法還包括格式信息制作步,用于制作附屬信息,以表示在上述存取單元數(shù)據(jù)制作步集中的上述一定數(shù)量,上述文件輸出步把在上述格式信息制作部制作的上述附屬信息包含在文件內進行輸出。
4.如權利要求3所述的文件制作方法,其特征在于上述文件制作方法還包含模擬取樣附加步,其是在最后的存取單元數(shù)據(jù)中所包含的編碼取樣的數(shù)達不到上述一定數(shù)的情況下,附加相當于不足的編碼取樣數(shù)的模擬取樣。
5.如權利要求4所述的文件制作方法,其特征在于上述格式信息制作步,在最后的存取單元數(shù)據(jù)內所包含的編碼取樣的數(shù)達不到上述一定的數(shù)的情況下、制作表示上述最后的存取單元數(shù)據(jù)內所包含的編碼取樣的數(shù)的附屬信息。
6.一種數(shù)據(jù)再現(xiàn)方法,其取得由多個編碼取樣按一定數(shù)量集合在一起、全部存取單元數(shù)據(jù)的大小都是一樣的文件,對上述存取單元數(shù)據(jù)內所包含的上述編碼取樣解碼并進行再現(xiàn),其特征在于包括以下步驟存取單元解析步,其特定上述存取單元數(shù)據(jù)內所包含的上述一定數(shù);以及解碼步,其根據(jù)上述存取單元解析步內的解析結果,對上述存取單元數(shù)據(jù)內所包含的上述一定數(shù)的上述編碼取樣進行解碼。
7.如權利要求6所述的數(shù)據(jù)再現(xiàn)方法,其特征在于上述存取單元解析步,在最后的存取單元數(shù)據(jù)內附加模擬取樣的情況下,對上述最后的存取單元數(shù)據(jù)中所包括的編碼取樣的數(shù)進行特定,上述解碼步,根據(jù)上述存取單元解析步中的解析結果,對附加了上述模擬取樣的最后的存取單元數(shù)據(jù)內所包含的編碼取樣進行解碼。
8.一種文件制作裝置,其根據(jù)包含多個編碼取樣的數(shù)字編碼數(shù)據(jù)來制作文件,其特征在于具有存取單元數(shù)據(jù)制作裝置,其通過每次按一定數(shù)量來集中上述多個編碼取樣、而生成同一數(shù)據(jù)大小的多個存取單元數(shù)據(jù);以及文件輸出裝置,其通過對由上述存取單元數(shù)據(jù)制作裝置生成的存取單元數(shù)據(jù)進行多重化而作為文件輸出。
9.如權利要求8所述的文件制作裝置,其特征在于上述存取單元數(shù)據(jù)制作裝置每次都按一定數(shù)量對上述多個編碼取樣進行集中,使全部存取單元數(shù)據(jù)的大小按字節(jié)單位是相同的。
10.如權利要求8所述的文件制作裝置,其特征在于上述文件制作裝置還具有格式信息制作裝置,用于制作附屬信息,以表示上述存取單元數(shù)據(jù)制作裝置集中的上述一定數(shù)量,上述文件輸出裝置把由上述格式信息制作裝置所制作的上述附屬信息包含在文件內進行輸出。
11.如權利要求10所述的文件制作裝置,其特征在于上述文件制作裝置還具有模擬取樣附加裝置,用于在最后的存取單元數(shù)據(jù)中所包含的編碼取樣的數(shù)達不到上述一定的數(shù)的情況下,附加相當于缺少的編碼取樣的數(shù)量的模擬取樣。
12.如權利要求11所述的文件制作裝置,其特征在于上述格式信息制作裝置,在最后的存取單元數(shù)據(jù)中所包含的編碼取樣的數(shù)量達不到上述一定數(shù)量的情況下,制作附屬信息,用于表示上述最后的存取單元數(shù)據(jù)中所包含的編碼取樣的數(shù)量。
13.一種數(shù)據(jù)再現(xiàn)裝置,其取得由多個編碼取樣按一定數(shù)量進行組合,全部存取單元數(shù)據(jù)的大小都一樣的文件,對上述存取單元數(shù)據(jù)中所包含的上述編碼取樣進行解碼并進行再現(xiàn),其特征在于具有存取單元解析裝置,其對上述存取單元數(shù)據(jù)中所包含的上述一定數(shù)量進行特定;以及解碼裝置,其根據(jù)上述存取單元解析裝置的解析結果,對上述存取單元數(shù)據(jù)內所包括的上述一定數(shù)量的上述編碼取樣進行解碼。
14.如權利要求13所述的數(shù)據(jù)再現(xiàn)裝置,其特征在于上述存取單元解析裝置,在最后的存取單元數(shù)據(jù)內附加模擬取樣的情況下,對最后的存取單元數(shù)據(jù)內所包含的編碼取樣的數(shù)量進行特定,上述解碼裝置,對于根據(jù)上述存取單元解析裝置的解析結果、而附加了上述模擬取樣的最后的存取單元數(shù)據(jù)內所包括的編碼取樣進行解碼。
15.一種程序,用于文件制作裝置,其特征在于使計算機執(zhí)行權利要求1所述的文件制作方法中的步驟。
16.一種程序,用于數(shù)據(jù)再現(xiàn)裝置,其特征在于使計算機執(zhí)行權利要求6所述的數(shù)據(jù)再現(xiàn)方法的步驟。
17.一種記錄媒體,能用計算機來讀取其記錄的文件,其特征在于上述文件中包括多個存取單元數(shù)據(jù),其中的多個編碼取樣按一定數(shù)量組合在一起,其全部的大小相同;以及信息,其表示構成一個存取單元數(shù)據(jù)的上述編碼取樣的數(shù)量。
18.如權利要求17所述的記錄媒體,其特征在于在上述多個存取單元數(shù)據(jù)中,最后的存取單元數(shù)據(jù)中,有時包含模擬取樣,有時不包含模擬取樣,在上述文件中還包含用于表示構成上述最后的存取單元數(shù)據(jù)的編碼取樣的數(shù)量的信息。
全文摘要
本發(fā)明的文件編制方法和數(shù)據(jù)再現(xiàn)方法,其中,文件制作裝置(201)具有數(shù)據(jù)輸入部(202),用于輸入來自外部的聲音數(shù)據(jù),輸出數(shù)字聲音數(shù)據(jù);編碼部(203),其按照全部存取單元的大小均為相同的字節(jié)單位的方法來把編碼取樣集中在一起,制成一個存取單元,并輸出到文件輸出部(205)內;格式制作部(204),其取得來自編碼部(203)的格式信息,制作MP4文件的標題信息,輸出到文件輸出部(205)內;以及文件輸出部(205),其對從編碼部203取得的存取單元進行多重化,制作存取單元隊列,與從格式制作部(204)取得的標題信息相組合,輸出MP4文件。
文檔編號G10L19/00GK1417789SQ02146968
公開日2003年5月14日 申請日期2002年10月29日 優(yōu)先權日2001年10月29日
發(fā)明者松井義德, 井村康治, 大岳直人 申請人:松下電器產業(yè)株式會社