專利名稱:轉(zhuǎn)碼裝置和轉(zhuǎn)碼方法
技術領域:
本發(fā)明涉及轉(zhuǎn)碼,并且具體地涉及TTS (具有時間戳的傳輸流)轉(zhuǎn)碼技術。
背景技術:
當發(fā)送或存儲在復用壓縮視頻數(shù)據(jù)或音頻數(shù)據(jù)以后所獲得的內(nèi)容數(shù)據(jù)時將時間戳附連到每個分組。包含全部都被給定了時間戳的分組的內(nèi)容數(shù)據(jù)被稱為TTS或具有時間戳的傳輸流。時間戳是用于控制內(nèi)容數(shù)據(jù)的讀取時刻的時間信息。諸如日本未經(jīng)審查的專利申請公開No. 2008-263404中公開的傳統(tǒng)TTS播放裝置包含內(nèi)部計數(shù)器,該內(nèi)部計數(shù)器對基準時鐘脈沖進行計數(shù),將從TTS分離的時間戳與計數(shù)器的計數(shù)值進行比較,并且根據(jù)那些比較結(jié)果,控制將視頻數(shù)據(jù)和音頻數(shù)據(jù)輸出到解碼器的時刻。存在用于壓縮視頻數(shù)據(jù)并且包括MPEG2(注冊商標)、H. 264.VC-1等的現(xiàn)有技術中有公知的各種標準。根據(jù)具體應用來做出關于是否基于一種標準來壓縮包含在內(nèi)容數(shù)據(jù)中的視頻數(shù)據(jù)。例如,在數(shù)字廣播中,經(jīng)常在用于傳輸系統(tǒng)的應用中通過MPEG2來壓縮視頻數(shù)據(jù), 該傳輸系統(tǒng)沿著傳輸路徑來傳送內(nèi)容數(shù)據(jù);并且經(jīng)常在存儲系統(tǒng)應用中通過H. 264或VC-I 來壓縮視頻數(shù)據(jù),該存儲系統(tǒng)應用將內(nèi)容數(shù)據(jù)記錄在諸如硬盤或光盤的記錄介質(zhì)上?;诓煌臉藴?,根據(jù)內(nèi)容數(shù)據(jù)應用以相同的方式來壓縮音頻數(shù)據(jù)。當例如記錄數(shù)字廣播時,將匹配傳輸系統(tǒng)應用的內(nèi)容數(shù)據(jù)轉(zhuǎn)換為匹配存儲系統(tǒng)應用的內(nèi)容數(shù)據(jù)。在該轉(zhuǎn)換中,使復用的視頻數(shù)據(jù)和音頻數(shù)據(jù)彼此分離,并且然后通過獨立的標準對該視頻數(shù)據(jù)或音頻數(shù)據(jù)或者二者進行解碼和再壓縮,并且在再復用之后進行使用。而且,例如當將大量內(nèi)容數(shù)據(jù)復制到小容量記錄介質(zhì)時執(zhí)行轉(zhuǎn)換以減小內(nèi)容數(shù)據(jù)的大小。在該轉(zhuǎn)換中,使復用的視頻數(shù)據(jù)和音頻數(shù)據(jù)分離,并且然后通過解碼、再壓縮,并且然后再復用來使用該視頻數(shù)據(jù)或音頻數(shù)據(jù)或二者。再壓縮可以利用將數(shù)據(jù)再壓縮為不同標準的技術,或者在相同的標準下將數(shù)據(jù)再壓縮為更高壓縮比的技術。對壓縮的視頻數(shù)據(jù)或音頻數(shù)據(jù)進行解碼并且然后以不同的壓縮比將該數(shù)據(jù)再壓縮為單獨的標準或者再壓縮為相同的標準的處理被稱為視頻數(shù)據(jù)或音頻數(shù)據(jù)的轉(zhuǎn)碼。例如,日本未經(jīng)審查的專利申請公開No. 2008-136187公開了將MPEG2視頻數(shù)據(jù)轉(zhuǎn)碼為H. 264 視頻數(shù)據(jù)的技術。在本說明書的以下描述中,對包含在內(nèi)容數(shù)據(jù)中的音頻數(shù)據(jù)或視頻數(shù)據(jù)或二者進行轉(zhuǎn)碼和再復用的處理被稱為內(nèi)容數(shù)據(jù)轉(zhuǎn)碼或轉(zhuǎn)碼處理。在內(nèi)容數(shù)據(jù)的轉(zhuǎn)碼期間分別處理音頻數(shù)據(jù)和視頻數(shù)據(jù),因此視頻數(shù)據(jù)的轉(zhuǎn)碼和音頻數(shù)據(jù)的轉(zhuǎn)碼以及再復用通常通過相同時鐘(脈沖)的同步來進行。視頻數(shù)據(jù)或音頻數(shù)據(jù)的轉(zhuǎn)碼改變視頻數(shù)據(jù)或音頻數(shù)據(jù)中分組的大小和數(shù)目。日本未經(jīng)審查的專利申請公開No. 2008-131570公開了一種技術,該技術避免了由于視頻數(shù)據(jù)或音頻數(shù)據(jù)的轉(zhuǎn)碼所造成的更小分組大小導致的當分組數(shù)目減少時在再復用所轉(zhuǎn)碼的視頻數(shù)據(jù)或音頻數(shù)據(jù)期間的同步誤差(口型同步)。參照日本未經(jīng)審查的專利申請公開 No. 2008-131570的圖2 (本說明書中的圖5)描述該技術。在日本未經(jīng)審查的專利申請公開No. 2008-131570中的技術中,輸入的TTS被分離為視頻TTS分組和音頻TTS分組,在各自的轉(zhuǎn)碼處理以后使得成為TTS分組以獲得TTS視頻和TTS音頻,并且然后進行再復用。例如,當對視頻TTS分組進行轉(zhuǎn)碼和進行TTS分組化時,仍然使用與輸入TTS時相同的時間戳。下面描述該處理。該處理檢測來自視頻TTS的第一 PES (分組化的基本流)分組,與集合的TTS分組凈荷一起獲得PES分組,并且執(zhí)行對PES分組的轉(zhuǎn)碼,以獲得轉(zhuǎn)碼結(jié)果。該處理繼續(xù)仍然使用PES分組報頭的DTS (解碼時間戳)和PTS (呈現(xiàn)時間戳)。然后,將轉(zhuǎn)碼結(jié)果覆寫到輸入的TTS分組凈荷部分。與前-轉(zhuǎn)碼數(shù)據(jù)相比,后-轉(zhuǎn)碼數(shù)據(jù)的數(shù)據(jù)大小小,因此除了通過填充(附圖中的P)來填滿剩余區(qū)域之外,TTS分組中的不需要的分組由空分組(附圖中的空)來代替。以該方式,上述處理獲得后-轉(zhuǎn)碼視頻TTS。以相同的方式,該處理還對TTS分組的音頻進行轉(zhuǎn)碼,以獲得轉(zhuǎn)碼的音頻TTS。然后,該處理將輸入的TTS與后-轉(zhuǎn)碼音頻和視頻TTS的時間戳作比較,并且用被轉(zhuǎn)碼的分組代替匹配時間戳的分組。該技術在轉(zhuǎn)碼前后不變地保持首先輸入的相同的視頻和音頻TTS分組時間戳,以防止在再復用期間的同步誤差。此外,可以異步地轉(zhuǎn)碼和再復用視頻數(shù)據(jù)和音頻數(shù)據(jù),而不需要使用相同的時鐘。
發(fā)明內(nèi)容
日本未經(jīng)審查的專利申請公開No. 2008-131570中的技術實質(zhì)上對包含在可應用 PES分組中的多個TTS分組中的每一個分組中的視頻和音頻數(shù)據(jù)進行轉(zhuǎn)碼,并且按順序?qū)r間戳再附連到輸入的TTS的可應用PES分組中的每個轉(zhuǎn)碼的TTS分組。在再附連期間不再需要的TTS分組用空分組來代替。因此,該技術在獲得輸入的TTS的每個PES中的各個視頻數(shù)據(jù)和音頻數(shù)據(jù)的轉(zhuǎn)碼結(jié)果之后替換分組的凈荷部分,并且因此需要一些形式的控制,以處理已經(jīng)變得比源流更小的分組量??紤]到現(xiàn)有技術的上述背景,本發(fā)明的目的是提供一種用于轉(zhuǎn)碼內(nèi)容數(shù)據(jù)的更簡單的技術。在本發(fā)明的一個方面中,轉(zhuǎn)碼裝置通過對包含在輸入TTS(具有時間戳的傳輸流) 中的附連有時間戳的每個分組的視頻數(shù)據(jù)或音頻數(shù)據(jù)或者二者進行轉(zhuǎn)碼來獲得輸出TTS。 轉(zhuǎn)碼裝置包括視頻處理器單元、音頻處理器單元以及再復用器。為了對視頻數(shù)據(jù)進行轉(zhuǎn)碼,視頻處理器單元對輸入TTS中的視頻分組進行解碼和再壓縮,并且將時間戳再附連到再壓縮之后獲得的每個視頻分組。然而,如果沒有對視頻數(shù)據(jù)進行轉(zhuǎn)碼,則視頻處理器單元不變地輸出輸入TTS中的每個視頻分組。為了對音頻數(shù)據(jù)進行轉(zhuǎn)碼,音頻處理器單元對輸入TTS中的音頻分組進行解碼和再壓縮,并且將時間戳再附連到再壓縮之后獲得的每個音頻分組。但是,如果沒有對音頻數(shù)據(jù)進行轉(zhuǎn)碼,則音頻處理器單元將相對輸入的TTS不變地輸出每個音頻分組。再復用器按每個時間戳上所示的時間順序來對從視頻處理器單元和音頻處理器單元輸出的視頻分組和音頻分組進行排列,并且獲得輸出TTS。在再壓縮每個視頻幀之后,視頻處理器單元在可應用視頻幀時段內(nèi)按順序?qū)r間戳再附連到可應用視頻幀的每個視頻分組。在再壓縮每個視頻幀之后,音頻處理器單元在可應用視頻幀時段內(nèi)按順序?qū)r間戳再附連到可應用視頻幀的每個音頻分組。上述本發(fā)明的轉(zhuǎn)碼裝置在由在用作轉(zhuǎn)碼裝置或者包括可應用轉(zhuǎn)碼裝置的廣播裝置和記錄裝置的計算機上執(zhí)行的方法和系統(tǒng)或者程序來代替時仍然有效和可應用。本發(fā)明的一方面的技術基于視頻幀時段在再壓縮之后將時間戳附連到視頻分組或音頻分組,并且因此除了防止口型同步(lip synch)偏差之外,還能夠不論分組大小的改變或者再壓縮之后分組的增加還是減少都簡單地對TSS進行轉(zhuǎn)碼。
圖1是示出關于本發(fā)明的實施例的轉(zhuǎn)碼裝置的示圖;圖2是示出用于描述圖1中所示轉(zhuǎn)碼裝置的操作的示例的示圖;圖3是用于描述關于本發(fā)明的技術的效果的示圖(兩個示圖中的第一個);圖4是用于描述關于本發(fā)明的技術的效果的示圖(兩個示圖中的第二個);圖5是用于描述現(xiàn)有技術中的技術的示圖。
具體實施例方式接下來參考附圖來描述本發(fā)明的實施例。為了明確描述,在方便時簡化或省略了下面的描述和附圖。此外,附圖中用作用于實現(xiàn)不同處理的功能塊的每個結(jié)構元件都可以包括硬件,諸如CPU、存儲器和其他電路;或者包括軟件,諸如存儲器中加載的程序。因此, 本領域技術人員可以理解,可以僅通過硬件或者僅通過軟件或者通過硬件與軟件的組合來呈現(xiàn)這些功能塊,并且不受特定形式限制。相同的附圖標記被指配給每個附圖中相同的結(jié)構元件,并且在需要時省略多余描述。上述程序可以被存儲在不同類型的非臨時性計算機可讀介質(zhì)中并且被提供給計算機。這里,非臨時性計算機可讀介質(zhì)包括各種有形的存儲介質(zhì)類型。典型的非臨時性計算機可讀介質(zhì)包括磁記錄介質(zhì)(例如軟盤、磁帶、硬盤驅(qū)動器)、磁光式記錄介質(zhì)(例如,磁光盤)、CD-ROM (只讀存儲器)、CD-R、CD-R/W、半導體存儲器(例如,掩模ROM)、PROM (可編程ROM)、EPROM(可擦除PR0M)、閃速ROM、RAM(隨機存取存儲器)。還可以通過各種類型的臨時性計算機可讀介質(zhì)將程序提供給計算機。臨時性計算機可讀介質(zhì)的典型示例包括電信號、光信號以及電磁波。通過線纜通信路徑(諸如導線和光纖)或者通過無線(無線電) 通信路徑可以以程序的方式將臨時性計算機可讀介質(zhì)提供給計算機。圖1是示出關于本發(fā)明的實施例的轉(zhuǎn)碼裝置100的示圖。轉(zhuǎn)碼裝置100是用于將存儲在作為硬盤的記錄介質(zhì)(諸如盤102)上的TTS讀出并對其進行轉(zhuǎn)碼、以及在作為光盤的單獨記錄介質(zhì)(例如盤17 上進行寫入的裝置。轉(zhuǎn)碼單元100包括讀出單元104、解復用器110、STC 120、視頻處理器單元130、音頻處理器單元140、緩沖器150、再復用器160和記錄單元170。視頻處理器單元130包含緩沖器132、再壓縮器單元134以及視頻分組器單元136。音頻處理器單元140包含緩沖器142、再壓縮器單元144以及音頻分組器單元146。 再復用器160包含校正單元162。讀出單元104讀出存儲在盤102上的TTS,并且將其輸出到解復用器110。下文中, 讀出單元104從盤102讀出并且輸入到解復用器110的該TTS被稱為輸入TTS。該輸入TTS包括視頻數(shù)據(jù)分組(視頻分組)和音頻數(shù)據(jù)分組(音頻分組)以及其他分組。除了視頻分組和音頻分組之外,這些其他分組例如是包含在數(shù)字廣播中的數(shù)字廣播分組。在TTS的轉(zhuǎn)碼期間不對這些其他分組進行再壓縮。解復用器110將視頻分組、音頻分組以及其他分組從輸入TTS分離,并且按順序?qū)⑺鼈兎謩e輸出到緩沖器132、緩沖器142以及緩沖器150。根據(jù)輸入TTS中的每個視頻幀中的第一視頻分組上的時間戳上所示的時間,解復用器110進一步依次將分組輸出到STC 120。下文中每個視頻幀中的第一視頻分組被稱為 “第一視頻分組”,并且用于第一視頻分組的通過時間戳示出的時間被稱為可應用視頻幀的 “開始時間”。如果轉(zhuǎn)碼視頻數(shù)據(jù),則再壓縮器單元134對存儲在緩沖器132中的視頻分組進行解碼和再壓縮,并且將通過再壓縮獲得的視頻分組依次輸出到視頻分組器單元136。如果沒有對視頻數(shù)據(jù)進行轉(zhuǎn)碼,則再壓縮器單元134將存儲在緩沖器132中的視頻分組不改變地輸出到視頻分組器單元136。下文中解復用器110輸出到緩沖器132的視頻分組被稱為“輸入視頻分組”;并且再壓縮器單元134輸出到分組器單元160的視頻分組被稱為“輸出視頻分組”。不用于轉(zhuǎn)碼的輸出視頻分組與輸入視頻分組相同,并且被附連其原始時間戳。如果對視頻數(shù)據(jù)進行轉(zhuǎn)碼,然后不對輸出視頻分組附連時間戳,則諸如分組數(shù)目和分組大小的項目與輸入視頻分組不同。在完成單個視頻幀中的最終視頻分組的處理之后,再壓縮器單元134向STC 120 輸出完成信號E,該完成信號E示出處理完成。如果對音頻數(shù)據(jù)進行轉(zhuǎn)碼,則再壓縮器單元144對存儲在緩沖器142中的音頻分組進行解碼和再壓縮,并且將通過再壓縮獲得的音頻分組依次發(fā)送到音頻分組器單元146。 如果沒有對音頻數(shù)據(jù)進行轉(zhuǎn)碼,則再壓縮器單元144將存儲在緩沖器142中的音頻分組不改變地輸出到音頻分組器單元146。下文中解復用器110輸出到緩沖器142的音頻分組被稱為“輸入音頻分組”;并且此后,再壓縮器單元144輸出到音頻分組器單元146的音頻分組被稱為“輸出音頻分組”。 如果沒有對音頻數(shù)據(jù)進行轉(zhuǎn)碼,則輸出音頻分組與輸入音頻分組相同,并且附連原始時間戳。如果對音頻數(shù)據(jù)進行轉(zhuǎn)碼,則不對輸出音頻分組附連時間戳,并且諸如分組數(shù)目和分組大小的項目與輸入視頻分組不同。如果不對視頻數(shù)據(jù)進行轉(zhuǎn)碼,則視頻分組器單元136將來自再壓縮器單元134的輸出視頻數(shù)據(jù)不改變地發(fā)送到再復用器單元160。如果對視頻數(shù)據(jù)進行轉(zhuǎn)碼,則在再附連時間戳之后,視頻分組器單元136輸出來自再壓縮器單元134的輸出視頻分組。如果不對音頻數(shù)據(jù)進行轉(zhuǎn)碼,則音頻分組器單元146將來自再壓縮器單元144的輸出視頻數(shù)據(jù)不改變地發(fā)送到再復用器單元160。如果對音頻數(shù)據(jù)進行轉(zhuǎn)碼,則在再附連時間戳之后,音頻分組器單元146輸出來自再壓縮器單元144的輸出視頻分組。視頻分組器單元136和音頻分組器單元146基于由STC 120報告的每個視頻幀的開始時間T來再附連時間戳。每次從再壓縮器單元134接收到完成信號E,STC 120增加計數(shù)值,并且而且將用于與可應用完成信號E相對應的視頻幀之后的下一視頻幀(或者換言之,通過再壓縮器單元134完成其處理的視頻幀)的開始時間T輸出到視頻分組器單元136和音頻分組器單元 146。例如,STC 120在接收到示出從再壓縮器單元134接收到的第三音頻幀的處理完成的完成信號EC3)之后增加計數(shù)值,并且還將用于第四視頻幀的開始時間T(4)輸出到視頻分組器單元136和音頻分組器單元146。接下來詳細描述通過視頻分組器單元136和音頻分組器單元146進行的時間戳的再附連。再復用器單元160對來自視頻分組器單元136的視頻分組、和來自音頻分組器單元146的音頻分組以及來自緩沖器150的其他分組進行再復用,獲得輸出TTS并且將輸出 TTS發(fā)送到記錄單元170。在再復用期間,再復用器單元160按時間戳所示的時間順序來排列所有分組。來自視頻分組器單元136的視頻分組具有再附連的時間戳或者原始時間戳, 如上所述,并且來自音頻分組器單元146的音頻分組具有再附連的時間戳或者原始時間戳。來自緩沖器150的其他分組被附連有原始時間戳。再復用器單元160包括校正單元162,該校正單元162用于校正視頻分組或音頻分組的時間戳,使得在再復用期間,在時間戳上示出的各個時間不會重疊。下面詳細描述校正單元162。記錄單元170將從再復用器單元160獲得的輸出TTS寫到盤172上。轉(zhuǎn)碼裝置100對包含在輸入TTS中的視頻數(shù)據(jù)或音頻數(shù)據(jù)或二者進行轉(zhuǎn)碼,并且獲得輸出TTS。這里,參考圖2中的示例來描述對輸入TTS中的視頻數(shù)據(jù)進行轉(zhuǎn)碼以及不對音頻數(shù)據(jù)進行轉(zhuǎn)碼時的轉(zhuǎn)碼裝置100的操作。在圖2中,字符“V”、“A”和“0”分別表示“視頻分組”、“音頻分組”和“其他分組”。 此外,水平軸指示通過時間戳顯示的時間。首先,解復用器110將輸入視頻分組、輸入音頻分組以及其他分組從輸入TTS分離,并且將它們輸入緩沖器132、緩沖器142以及緩沖器150。與將這些分組輸出到各個緩沖器一起,解復用器110將每個視頻幀的開始時間T輸出到STC 120。解復用器110例如將視頻幀vf (η)的開始時間T(附圖中的t0)和視頻幀vf(n+l)的開始時間T(附圖中的tl) 輸出到STC 120。在這里給出的示例中,轉(zhuǎn)碼裝置100僅對視頻數(shù)據(jù)進行轉(zhuǎn)碼,因此音頻處理器單元140的再壓縮器單元144將輸入音頻分組不改變地輸出到音頻分組器單元146,作為輸出音頻分組。因此每個輸出音頻分組的時間戳與對應的輸入音頻分組的時間戳相同。然而,轉(zhuǎn)碼裝置對視頻數(shù)據(jù)進行轉(zhuǎn)碼,因此再壓縮器單元134對臨時存儲在緩沖器132中的輸入視頻分組進行解碼和再壓縮,并且獲得輸出視頻分組(步驟Si)。
7
每次完成用于一個幀部分的視頻分組的處理時,再壓縮器單元134就向STC 120 輸出完成信號E。在圖2中所示的示例中,再壓縮器單元134獲得視頻幀vf (η)的最終輸出視頻分組,并且向STC 120輸出完成信號Ε。由于通過再壓縮器單元134進行轉(zhuǎn)碼而導致用于每個單個視頻幀的視頻分組的數(shù)目如圖2中所示被改變。圖2中的示例示出在視頻分組上以5/13進行的再壓縮,并且因此每個單個視頻幀的13個分組變換為5個輸出視頻分組Vl至V5。視頻分組器單元136將時間戳再附連到每個輸出視頻分組(步驟S》。更具體地, 視頻分組器單元136將時間戳依次再附連到可應用視頻幀中的每個輸出視頻分組,并且在可應用視頻幀的時間段內(nèi)。這里,視頻幀時間段指示從可應用視頻幀的開始時間T直到可應用視頻幀的下一個視頻幀的開始時間的時段。在本實施例中,視頻分組器單元136將時間戳再附連到每個視頻幀中的輸出視頻分組,使得包含在可應用視頻幀中的多個輸出視頻分組中的時間戳所示的時間以有規(guī)律地隔開的間隔被布置??紤]圖2所示的示例。當再壓縮器單元134完成視頻幀vf (η)之前的視頻幀的處理時,STC 120向視頻分組器單元236通知視頻幀Vf (η)的開始時間t0并且保留該開始時間。然后,再壓縮器單元134對視頻幀vf (η)的每個輸入視頻分組進行解碼和再壓縮,并且將視頻幀vf (η)的輸出視頻分組Vl至V5中的每一個輸出到視頻分組器單元136。當再壓縮器單元134完成視頻幀vf (η)的處理時,向視頻分組器單元136通知視頻幀vf (η+1)的開始時間tl。視頻分組器單元136根據(jù)以下公式將時間戳再附連到多個視頻幀vf (η)的輸出視
頻分組。t(j) = t0+(j-l) X ((tl-t0)/m) (1)其中,t(j)表示視頻幀vf(n)的j個數(shù)目的輸出視頻分組時間戳;并且m表示視頻幀vf (η)的輸出視頻分組的數(shù)目。在圖2所示的示例中,在視頻幀vf(n)中存在5個輸出視頻分組,因此將以下 5 個時間 irtO”、“tO+(tl-tO)/5”、“tO+2X(tl-tO)/5”、“tO+3X(tl-tO)/5”、 "tO+4X (tl-t0)/5”再附連到這5個輸出視頻分組Vl至V5。在圖2所示的示例中,“tl-tO”是視頻幀vf (η)的時段。視頻分組器單元136將時間戳再附連到輸出視頻分組中的每一個,使得包含在可應用視頻幀中的多個輸出視頻分組中的時間戳所示的時間具有有規(guī)律地隔開的間隔。另一方面,當處理音頻數(shù)據(jù)時,再壓縮器單元134將輸入音頻數(shù)據(jù)分組作為輸出音頻數(shù)據(jù)分組不改變地輸出到音頻分組器單元146。該音頻分組器單元146不將時間戳再附連到輸出音頻分組。視頻分組器單元136、音頻分組器單元146和緩沖器150分別將具有再附連時間戳的輸出視頻分組、附連有其原始時間戳的輸出音頻分組以及其他分組輸出到再復用器單元 160。其他分組不經(jīng)過再壓縮,并且仍然保留其原始時間戳。如圖2中所示,視頻幀vf (η)的5個輸出視頻分組Vl至V5以及6個輸出音頻分組Al至Α6以及兩個其他分組01至02被輸出到再復用器160。在這些分組中,視頻分組器單元136將時間戳再附連到輸出視頻分組Vl至V5,并且將原始時間戳附加到輸出音頻分組Al至A6以及其他分組01至02。再復用器160對這些分組進行再復用并且獲得輸出TTS (步驟S; )。依據(jù)下面的程序來執(zhí)行再復用。(1)再復用器160按照附連到每個分組的時間戳所示的時間順序來布置分組。在該情況下,在再壓縮的分組上利用再附連的時間戳,并且在沒有再壓縮的分組上利用原始時間戳。在該示例中,視頻分組Vl至V5利用由視頻分組器單元136再附連的時間戳;并且音頻分組Al至A6以及其他分組01至02利用其原始時間戳。(2)當存在具有在其時間戳上示出的重疊時間的分組時,校正單元校正時間戳上的時間,以便將分組向前或向后移動。校正單元162進行該校正。在圖2所示的示例中,輸出視頻分組Vl的時間戳所示的時間不與任何其他時間戳上所示的時間重疊,因此輸出視頻分組Vl被排列在輸出音頻分組Al之前,正如時間戳(再附連的時間戳)上所示。然而,輸出視頻分組V3的時間戳所示的時間與輸出音頻分組A3的時間戳所示的時間彼此重疊,因此校正單元162通過將輸出音頻分組A3的時間戳所示的時間移動到較早的時間來進行校正。因此輸出視頻分組V3被排列在輸出音頻分組A3之后,如校正的時間戳上所示。上述示例描述了僅對輸入TTS的視頻數(shù)據(jù)進行轉(zhuǎn)碼的情況。如果對視頻數(shù)據(jù)和音頻數(shù)據(jù)都進行轉(zhuǎn)碼,或者當僅對音頻數(shù)據(jù)進行轉(zhuǎn)碼,則再壓縮器144對臨時存儲在緩沖器 142中的輸入音頻數(shù)據(jù)進行解碼和再壓縮,并且將壓縮的數(shù)據(jù)輸出到音頻分組器單元146。 音頻分組器單元146將時間戳再附連到從再壓縮器144獲得的每個輸出音頻分組。音頻分組器單元146按順序?qū)r間戳再附連到與可應用視頻幀相對應的每個輸出音頻分組,使得在可應用視頻幀時段內(nèi),時間具有有規(guī)律地隔開的間隔。這里,“與可應用視頻幀相對應的每個輸出音頻分組”指示在可應用視頻幀時段內(nèi)對包含時間戳的輸入音頻分組再壓縮之后獲得的輸出音頻分組。以該方式,本實施例的轉(zhuǎn)碼裝置100基于視頻幀的開始時間來將時間戳再附連到再壓縮的分組(視頻分組和/或音頻分組),并且還通過利用用于再壓縮分組的再附連的時間戳以及利用用于未再壓縮的分組的原始時間戳來執(zhí)行再復用。因此,視頻處理器單元 130的功能塊、音頻處理器單元140的功能塊以及再復用器160能夠進行異步操作。因此, 每個功能塊能夠執(zhí)行與其本身的負載匹配的處理;并且從總體上來說轉(zhuǎn)碼裝置100能夠進行全力處理。此外,在視頻幀時段內(nèi)再附連時間戳允許使用可選壓縮比。而且,每個功能塊能夠異步地進行操作,因此能夠根據(jù)可選定時或者根據(jù)輸入TTS 的輸入或輸出TTS的輸出來開始或停止再壓縮。轉(zhuǎn)碼裝置100使用視頻幀時段作為標準,基于視頻幀開始時間來將時間戳再附連到任何視頻分組或音頻分組,并且因此裝置可以被保持在小尺寸,并且控制簡單,只需要一個 STC 120。此外,在將時間戳再附連到再壓縮分組期間,沿著可應用視頻幀時段,每個分組的時間戳上所示的時間以相等隔開的間隔布置,因此可以實現(xiàn)均勻的輸出TTS比特率,如圖3和圖4所示。圖3和圖4所示的示例利用單個幀的總共5個分組,但是每個幀的分組數(shù)目不限于5個分組。例如,在圖3所示的TTS中的每個視頻幀時段中,并且應用聚集在分組的第一半的時間戳,每個視頻幀中的第一分組的時間戳與最后分組的時間戳之間的間隙 (“t0(5)-t0(l),m“tl(5)-tl(l)”)是短的。這里,與從 t0(5) IlJtl(O)的時段相對,讀取可應用TTS的處理裝置從tl (5)到t2的時段沒有分組可供處理;而在從tl (1)到tl (5) 的時段內(nèi)必須分別處理5個分組中的每個分組,因此需要相應的處理能力。另一方面,在圖4中,當在每個視頻幀中附連時間戳使得分組具有相等隔開的間隔時,每個視頻幀中的第一分組的時間戳與最后分組的時間戳之間的間隙變長,使得實現(xiàn)均勻的比特率。因此,用于讀取可應用TTS的處理裝置僅需要能夠在單個幀時段內(nèi)處理5 個分組?;趯嵤├枋隽吮景l(fā)明。這里所述的實施例僅僅是示例,只要不脫離本發(fā)明的精神和范圍,在上述實施例中可以做出所有方式的改變、增加和減少。對于本領域技術人員而言,通過做出這些改變、增加和減少所實現(xiàn)的變體在本發(fā)明的范圍和精神內(nèi)的事實顯而易見。
權利要求
1.一種轉(zhuǎn)碼裝置,所述轉(zhuǎn)碼裝置對包含在輸入TTS中的視頻數(shù)據(jù)或音頻數(shù)據(jù)中的任何一個或二者進行轉(zhuǎn)碼,其中,所述TTS為具有時間戳的傳輸流,所述輸入TTS包括附連到每個分組的時間戳,所述轉(zhuǎn)碼裝置包括視頻處理器單元,所述視頻處理器單元在對所述視頻數(shù)據(jù)進行轉(zhuǎn)碼的情況下,對所述輸入TTS中的視頻分組進行解碼和再壓縮,并且還在再壓縮之后在每個視頻幀的可應用幀時段內(nèi)按順序?qū)r間戳再附連到可應用視頻幀中的每個視頻分組,以及在不對所述視頻數(shù)據(jù)進行轉(zhuǎn)碼的情況下,不改變地輸出所述輸入TTS中的每個視頻分組;音頻處理器單元,所述音頻處理器單元在對所述音頻數(shù)據(jù)進行轉(zhuǎn)碼的情況下,對所述輸入TTS中的音頻分組進行解碼和再壓縮,并且還在再壓縮之后在每個視頻幀的可應用視頻幀時段內(nèi)按順序?qū)r間戳再附連到所述可應用視頻幀中的每個音頻分組,以及在不對所述音頻數(shù)據(jù)進行轉(zhuǎn)碼情況下,不改變地輸出所述輸入TTS中的音頻分組;以及再復用器單元,所述再復用器單元按每個時間戳上所示的時間順序來排列從所述視頻處理器單元和所述音頻處理器單元輸出的所述視頻分組和所述音頻分組,并且獲得輸出 TTS。
2.根據(jù)權利要求1所述的轉(zhuǎn)碼裝置,其中,所述視頻處理器單元再附連所述時間戳,使得在再壓縮之后的每個視頻分組的時間戳上所示的時間在所述可應用視頻幀時段內(nèi)以有規(guī)律地隔開的間隔被布置。
3.根據(jù)權利要求1所述的轉(zhuǎn)碼裝置,其中,所述音頻處理器單元再附連所述時間戳,使得在再壓縮之后的每個音頻分組的時間戳上所示的時間在所述可應用視頻幀時段內(nèi)以有規(guī)律地隔開的間隔被布置。
4.根據(jù)權利要求1所述的轉(zhuǎn)碼裝置,其中,所述再復用器單元包括校正單元,所述校正單元用于校正所述視頻分組或所述音頻分組的時間戳,使得在再復用期間所述時間戳上所示的各個時間不重疊。
5.一種用于使轉(zhuǎn)碼裝置對包含在輸入TTS中的視頻數(shù)據(jù)或音頻數(shù)據(jù)中的任何一個或二者進行轉(zhuǎn)碼的轉(zhuǎn)碼方法,其中,所述TTS為具有時間戳的傳輸流,所述輸入TTS包括附連到每個分組的時間戳,所述轉(zhuǎn)碼方法包括下述步驟執(zhí)行視頻處理,所述視頻處理在對視頻數(shù)據(jù)進行轉(zhuǎn)碼的情況下,對所述輸入TTS中的視頻分組進行解碼和再壓縮,并且還在再壓縮之后在每個視頻幀的可應用視頻幀時段內(nèi)按順序?qū)r間戳再附連到所述可應用視頻幀的每個視頻分組;以及在不對視頻數(shù)據(jù)進行轉(zhuǎn)碼的情況下,不改變地輸出所述輸入TTS中的每個視頻分組;執(zhí)行音頻處理,所述音頻處理在對音頻數(shù)據(jù)進行轉(zhuǎn)碼的情況下,對所述輸入TTS中的音頻分組進行解碼和再壓縮,并且還在再壓縮之后在每個視頻幀的可應用視頻幀時段內(nèi)按順序?qū)r間戳再附連到所述可應用視頻幀的每個音頻分組;以及在不對音頻數(shù)據(jù)進行轉(zhuǎn)碼的情況下,不改變地輸出所述輸入TTS中的每個音頻分組;以及執(zhí)行再復用處理,所述再復用處理按每個時間戳上所示的時間順序來排列從所述視頻處理和所述音頻處理獲得的所述視頻分組和所述音頻分組,并且獲得輸出TTS。
全文摘要
本發(fā)明公開了一種轉(zhuǎn)碼裝置和轉(zhuǎn)碼方法。用于簡化TTS(具有時間戳的傳輸流)的轉(zhuǎn)碼的裝置、方法和程序。在對輸入TTS中的視頻數(shù)據(jù)進行轉(zhuǎn)碼的情況下,視頻處理器單元在再壓縮之后在每個視頻幀的可應用幀時段內(nèi)按順序?qū)r間戳再附連到可應用視頻幀內(nèi)的每個視頻分組。在對輸入TTS中的音頻數(shù)據(jù)進行轉(zhuǎn)碼的情況下,音頻處理器單元在再壓縮之后在每個視頻幀的可應用視頻幀時段內(nèi)按順序?qū)r間戳再附連到可應用視頻幀中的每個音頻分組。
文檔編號H04N7/26GK102420981SQ20111028571
公開日2012年4月18日 申請日期2011年9月23日 優(yōu)先權日2010年9月27日
發(fā)明者松永光浩 申請人:瑞薩電子株式會社