專利名稱:用于壓縮域視頻編輯的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及視頻編碼,并且更特別地,涉及視頻編輯。
背景技術(shù):
數(shù)字?jǐn)z像機(jī)持續(xù)地在大眾中流行。許多最新的移動電話配備有攝像機(jī)以為用戶提供拍攝視頻剪輯并且通過無線網(wǎng)絡(luò)發(fā)送它們的能力。
就文件大小而言,數(shù)字視頻序列是非常大的。即使短的視頻序列也是由數(shù)十個圖像構(gòu)成。因此視頻總是以被壓縮的形式保存和/或傳輸。存在幾項(xiàng)視頻編碼技術(shù)可用于該目的。MPEG-4和H.263是最為廣泛使用的適于無線蜂窩環(huán)境的標(biāo)準(zhǔn)壓縮格式。
為了使用戶在他們的終端上生成有質(zhì)量的視頻,必須向例如配備有攝像機(jī)的移動電話、發(fā)信機(jī)和PDA的電子設(shè)備提供視頻編輯的能力。視頻編輯是將可用的視頻序列修改成新的視頻序列的過程。視頻編輯工具使得用戶可向他們的視頻剪輯上應(yīng)用一組效果以便生成他們視頻的功能上和美感上更好的顯示。為了在視頻序列上應(yīng)用視頻編輯效果,存在有幾種商業(yè)產(chǎn)品。然而,這些軟件產(chǎn)品主要針對PC平臺。
由于目前在PC平臺中處理能力、存儲量和存儲器的限制已經(jīng)不是問題,因此在此類視頻編輯產(chǎn)品中使用的技術(shù)大部分在空間域中主要以其原始格式對視頻序列進(jìn)行操作。換句話說,被壓縮的視頻首先被解碼,接著編輯效果被引入到空間域中,并且最終視頻被再次編碼。這就是已知的空間域視頻編輯操作。
上述的方案無法應(yīng)用到例如在處理能力、存儲空間、可用存儲器和電池功率方面具有低的資源的移動電話的設(shè)備上。對視頻序列進(jìn)行解碼并對其再次編碼是費(fèi)力的操作,這將花費(fèi)長的時間并且消耗大量的電池功率。
在現(xiàn)有技術(shù)中,視頻效果是在空間域中執(zhí)行的。更具體地,視頻剪輯首先被解壓縮并接著執(zhí)行視頻特定效果。最后,得到的圖像序列被再次編碼。圖1示出常規(guī)視頻編輯的一般過程。該方法的主要缺點(diǎn)在于其巨大的計(jì)算強(qiáng)度,尤其在編碼部分。這樣的系統(tǒng)是不適于移動平臺的。因?yàn)榭臻g域操作中的需求,所以很少在移動設(shè)備上使用視頻編輯系統(tǒng),并且可用的編輯特征也是有限的。
因此提供沒有現(xiàn)有技術(shù)處理的缺點(diǎn)的視頻編輯的方法是有優(yōu)勢并且是所期望的。
發(fā)明內(nèi)容
本發(fā)明提供用于壓縮域視頻編輯的方法和設(shè)備,其中解析器用于將媒體文件中的音頻數(shù)據(jù)和視頻數(shù)據(jù)分開以便音頻數(shù)據(jù)和視頻數(shù)據(jù)可被分別編輯。特別地,幀分析器用于基于輸入視頻幀的幀特性來確定視頻數(shù)據(jù)是適于壓縮域編輯還是適于空間域處理。
因此,本發(fā)明的第一個方面提供一種對比特流中的一個或多個輸入視頻幀進(jìn)行編輯的方法從而提供一個或多個已編輯的視頻幀,已編輯的視頻幀包括由一個或多個編輯參數(shù)指定的至少一個編輯效果。該方法包括識別比特流中至少一個輸入視頻幀的幀特性;以及基于所述至少一個幀的幀特性和指定的編輯參數(shù)在壓縮域中對比特流進(jìn)行修改從而提供表示所述已編輯的視頻幀的已修改的比特流。
根據(jù)本發(fā)明,輸入視頻幀包括視頻數(shù)據(jù)并且其中所述修改包括在壓縮域處理器中對視頻數(shù)據(jù)進(jìn)行修改以便提供已編輯的幀數(shù)據(jù)。
根據(jù)本發(fā)明,視頻數(shù)據(jù)以可變長碼(VLC)進(jìn)行編碼。所述方法進(jìn)一步包括在所述修改之前將經(jīng)VLC編碼的視頻數(shù)據(jù)轉(zhuǎn)換成二進(jìn)制形式。該方法有可能進(jìn)一步包括在所述轉(zhuǎn)換前對經(jīng)VLC編碼的視頻數(shù)據(jù)進(jìn)行反向量化,以及在所述轉(zhuǎn)換前以反余弦變換操作對經(jīng)VLC編碼的視頻數(shù)據(jù)進(jìn)行處理。
根據(jù)本發(fā)明,所述方法進(jìn)一步包括識別比特流中至少一個另外的視頻幀的幀特性;基于所述至少一個另外的視頻幀的幀特性和指定的編輯參數(shù)來對不同于壓縮域的另外的域中的比特流進(jìn)行修改以便提供另外的經(jīng)修改的比特流;以及將另外的修改的比特流的至少一部分與修改的比特流的至少一部分進(jìn)行合并。
另外的域是空間域或文件格式域。
根據(jù)本發(fā)明,所述方法進(jìn)一步包括將編輯的幀數(shù)據(jù)轉(zhuǎn)換為編輯的媒體文件以便在媒體播放器中使用;以及提供表示編輯的幀數(shù)據(jù)的編輯屬性的格式信息以便將編輯的幀數(shù)據(jù)轉(zhuǎn)換為與媒體播放器兼容的編輯的媒體文件。
根據(jù)本發(fā)明,當(dāng)比特流還包含可與輸入的視頻幀中的視頻數(shù)據(jù)分離的音頻數(shù)據(jù)時,所述方法進(jìn)一步包括在所述轉(zhuǎn)換前將音頻數(shù)據(jù)與編輯的幀數(shù)據(jù)進(jìn)行合并;如果期望的話,在所述合并前對音頻數(shù)據(jù)進(jìn)行修改;以及提供定時信息以便在所述合并中維持音頻數(shù)據(jù)和編輯的幀數(shù)據(jù)之間的同步。
根據(jù)本發(fā)明,基于由用戶選擇的一個或多個編輯選項(xiàng)對編輯參數(shù)進(jìn)行指定。
本發(fā)明的第二個方面提供一種媒體編輯設(shè)備,該設(shè)備用于對比特流中的一個或多個輸入視頻幀進(jìn)行編輯以便提供一個或多個已編輯的視頻幀,該已編輯的視頻幀包括由一個或多個編輯參數(shù)所指定的至少一個編輯效果。所述編輯設(shè)備包括
幀分析器模塊,用于響應(yīng)于表示視頻幀數(shù)據(jù)的信號,識別比特流中的至少一個輸入視頻幀的幀特性;以及壓縮域處理模塊,用于響應(yīng)于表示幀特性的信號,基于所述至少一個幀的幀特性和指定的編輯參數(shù)對視頻幀數(shù)據(jù)進(jìn)行修改以便提供表示所述已編輯的視頻幀的修改的視頻數(shù)據(jù)。
根據(jù)本發(fā)明,所述幀分析器進(jìn)一步包括識別比特流中至少一個另外的視頻幀的幀特性。所述編輯設(shè)備進(jìn)一步包括空間域處理模塊,響應(yīng)于表示另外的視頻幀的幀特性的信號,基于另外的視頻幀的幀特性和指定的編輯參數(shù)修改另外的視頻幀中的視頻幀以便提供另外的修改的視頻數(shù)據(jù);以及用于將另外的修改的視頻數(shù)據(jù)的至少一部分與修改的視頻數(shù)據(jù)的至少一部分進(jìn)行合并的模塊。
根據(jù)本發(fā)明,所述編輯設(shè)備進(jìn)一步包括格式編輯器模塊,用于響應(yīng)于表示修改的視頻數(shù)據(jù)的信號,將修改的視頻數(shù)據(jù)轉(zhuǎn)換為已編輯的媒體文件以便在媒體播放器中使用,以及幀分析器模塊進(jìn)一步識別表示修改的視頻數(shù)據(jù)的編輯屬性的格式信息以便將修改的視頻數(shù)據(jù)轉(zhuǎn)換為與媒體播放器兼容的已編輯的媒體文件。
格式編輯器模塊可以是文件格式編輯器或媒體格式編輯器。
根據(jù)本發(fā)明,當(dāng)比特流還包括音頻數(shù)據(jù)時,所述編輯設(shè)備進(jìn)一步包括格式解析器模塊,該模塊用于將輸入的視頻幀中的音頻與視頻幀數(shù)據(jù)進(jìn)行分離;音頻處理模塊,該模塊用于在需要的時候修改音頻數(shù)據(jù)以便提供修改的音頻數(shù)據(jù);合并模塊,該模塊用于將修改的視頻數(shù)據(jù)與修改的音頻數(shù)據(jù)進(jìn)行合并以便提供表示合并的數(shù)據(jù)的合并的信號;以及文件或媒體格式編輯器,用于響應(yīng)于合并的信號,將合并的數(shù)據(jù)轉(zhuǎn)換為編輯的媒體文件以便在媒體播放器中使用。
本發(fā)明的第三個方面提供一種能夠編輯媒體文件從而在一個或多個編輯的視頻幀中提供一個或多個編輯效果的通信設(shè)備,該編輯媒體文件包括一個或多個輸入視頻幀。所述通信設(shè)備包括視頻編輯應(yīng)用模塊,用于允許用戶指定編輯效果;以及視頻編輯系統(tǒng),包括壓縮域處理模塊,用于響應(yīng)于表示輸入視頻幀的信號,基于指定的編輯效果來對一個或多個視頻幀中的視頻幀數(shù)據(jù)進(jìn)行修改以便提供表示已編輯的視頻幀的修改的視頻數(shù)據(jù);以及幀分析器模塊,用于響應(yīng)于表示視頻幀數(shù)據(jù)的信號,識別至少一個輸入視頻幀的幀特性,以便也基于幀特性來允許壓縮域處理模塊修改視頻幀數(shù)據(jù)。
根據(jù)本發(fā)明,幀分析器進(jìn)一步識別比特流中至少一個另外的視頻幀的幀特性,所述編輯系統(tǒng)進(jìn)一步包括空間域處理模塊,用于響應(yīng)于表示另外的視頻幀的幀特性的信號,基于另外的視頻幀的幀特性和指定的編輯參數(shù)對另外的視頻幀中的視頻幀數(shù)據(jù)進(jìn)行修改以便提供另外的修改的視頻數(shù)據(jù);模塊,用于將至少一部分的另外的已修改視頻數(shù)據(jù)與至少一部分的修改的視頻數(shù)據(jù)進(jìn)行合并;以及格式編輯器模塊,用于響應(yīng)于表示修改的視頻數(shù)據(jù)的信號,將修改的視頻數(shù)據(jù)轉(zhuǎn)換為編輯的媒體文件以便在媒體播放器中使用。
根據(jù)本發(fā)明,通信設(shè)備進(jìn)一步包括顯示屏,用于基于修改的視頻數(shù)據(jù)顯示視頻圖像。
通信設(shè)備可以是移動終端、發(fā)信機(jī)設(shè)備、PDA等。
本發(fā)明的第四個方面提供一種用于視頻編輯系統(tǒng)中的軟件產(chǎn)品,該軟件產(chǎn)品用于比特流中的一個或多個視頻幀進(jìn)行編輯以便提供一個或多個已編輯的視頻幀,該已編輯的視頻幀包括由一個或多個編輯參數(shù)指定的至少一個編輯效果。所述軟件產(chǎn)品包括用于識別比特流中至少一個輸入視頻幀的幀特性的代碼;以及用于基于所述至少一個幀的幀特性和指定的編輯參數(shù)在壓縮域中對一個或多個輸入視頻幀中的視頻數(shù)據(jù)進(jìn)行修改從而提供表示所述編輯的視頻幀的修改的視頻數(shù)據(jù)的代碼。
根據(jù)本發(fā)明,當(dāng)輸入視頻幀包括以可變長碼(VLC)編碼的視頻數(shù)據(jù)時,所述軟件產(chǎn)品進(jìn)一步包括用于在對一個或多個輸入視頻幀中的視頻數(shù)據(jù)進(jìn)行修改前將VLC編碼的視頻數(shù)據(jù)轉(zhuǎn)換為二進(jìn)制形式的代碼。
根據(jù)本發(fā)明,識別代碼還包括識別至少一個另外的輸入視頻幀的幀特性,并且所述軟件產(chǎn)品進(jìn)一步包括用于基于所述另外的輸入的視頻幀和指定的編輯參數(shù)對在不同于壓縮域的另外的域中的一個或多個另外的輸入視頻幀中的視頻數(shù)據(jù)進(jìn)行修改以便提供修改的另外的視頻數(shù)據(jù)的代碼。該另外的域可以是空間域或文件格式域。
根據(jù)本發(fā)明,該軟件產(chǎn)品進(jìn)一步包括用于將修改的另外的視頻數(shù)據(jù)與修改的視頻數(shù)據(jù)進(jìn)行合并以便提供編輯的視頻幀的代碼;以及用于將修改的視頻數(shù)據(jù)轉(zhuǎn)換為編輯的媒體文件以便在媒體播放器中使用的代碼。
本發(fā)明的第五個方面提供一種媒體編碼系統(tǒng),包括媒體編碼器,其用于對媒體數(shù)據(jù)進(jìn)行編碼以便在具有幀數(shù)據(jù)的多個幀中提供已編碼的媒體數(shù)據(jù);媒體編輯設(shè)備,其用于響應(yīng)于已編碼的媒體數(shù)據(jù),提供包括一個或多個已編輯的幀的編輯的數(shù)據(jù),所述已編輯的幀具有由一個或多個編輯參數(shù)所指定的至少一個編輯效果,以及媒體解碼器,其用于響應(yīng)于已編輯的數(shù)據(jù),提供解碼的媒體數(shù)據(jù),其中所述編輯設(shè)備包括幀分析器模塊,用于響應(yīng)于表示已編碼的數(shù)據(jù)的信號,識別編碼的數(shù)據(jù)中的至少一個幀的幀特性;以及壓縮域處理模塊,用于響應(yīng)于表示幀特性的信號,基于所述至少一個幀的幀特性和指定的編輯參數(shù)來識別已編碼的幀數(shù)據(jù)以便提供表示所述編輯的媒體幀的修改的媒體數(shù)據(jù)。
根據(jù)本發(fā)明,該媒體編碼器具有連通性機(jī)制并且該編輯設(shè)備具有另外的連通性機(jī)制以便允許編輯設(shè)備以無線方式向媒體解碼器提供已編輯的數(shù)據(jù)。
根據(jù)本發(fā)明,該媒體編碼器和該編輯系統(tǒng)集成于擴(kuò)展的編碼系統(tǒng)中。
根據(jù)本發(fā)明,該媒體解碼器具有連通性機(jī)制并且該擴(kuò)展的編碼系統(tǒng)具有另外的連通性機(jī)制以便允許擴(kuò)展的編碼系統(tǒng)以無線方式向媒體解碼器提供已編輯的數(shù)據(jù)。
根據(jù)本發(fā)明,該媒體解碼器和該編輯系統(tǒng)集成于擴(kuò)展的解碼系統(tǒng)中。
根據(jù)本發(fā)明,該媒體編碼器具有連通性機(jī)制并且該擴(kuò)展的解碼系統(tǒng)具有另外的連通性機(jī)制以便允許媒體編碼器以無線方式向擴(kuò)展的解碼系統(tǒng)提供已編輯的數(shù)據(jù)。
根據(jù)本發(fā)明,連通性機(jī)制和另外的連通性機(jī)制的每一種包括藍(lán)牙連通性模塊、紅外線模塊或無線LAN設(shè)備。
在閱讀了結(jié)合圖2到圖10的描述后,本發(fā)明將變得顯而易見。
圖1是說明現(xiàn)有技術(shù)的視頻編輯的過程的方框圖;圖2是說明根據(jù)本發(fā)明的壓縮域視頻編輯的原理的示意圖;圖3是說明用于移動設(shè)備的典型視頻編輯系統(tǒng)的方框圖;圖4是說明根據(jù)本發(fā)明的視頻編輯處理器系統(tǒng)的方框圖;圖5是說明根據(jù)本發(fā)明的視頻處理器的方框圖;圖6是說明空間域視頻處理器的方框圖;圖7是說明音頻處理器的方框圖;圖8是說明待編輯的典型視頻序列的示意圖;圖9是說明根據(jù)本發(fā)明的能夠執(zhí)行壓縮域視頻編輯的便攜式設(shè)備的示意圖;
圖10是說明根據(jù)本發(fā)明的包括視頻處理器的媒體編碼系統(tǒng)的方框圖。
具體實(shí)施例方式
根據(jù)本發(fā)明,所述視頻編輯過程是基于壓縮域操作的。這樣就減小了解碼和編碼模塊的使用。如圖2中所示,編輯是在壓縮域處理器中執(zhí)行的。圖3說明了為例如移動電話的通信設(shè)備所設(shè)計(jì)的典型編輯系統(tǒng)。根據(jù)本發(fā)明,該編輯系統(tǒng)可包括視頻編輯方法和設(shè)備。如圖3所示,視頻編輯系統(tǒng)10包括視頻編輯應(yīng)用模塊12(圖形用戶界面),該界面與用戶互動以便交換視頻編輯選項(xiàng)。基于由用戶定義或選擇的編輯選項(xiàng),應(yīng)用利用視頻編輯器引擎14計(jì)算并且向視頻編輯處理模塊18輸出視頻編輯參數(shù)。視頻編輯處理器模塊18利用壓縮域編輯的原理來執(zhí)行實(shí)際的視頻編輯操作。如果視頻編輯操作在軟件中實(shí)施,則視頻編輯處理器模塊18可以是動態(tài)鏈接庫(dll)。另外,視頻編輯器引擎14和視頻編輯處理器18可以合并成單個的模塊。
圖4中示出了視頻編輯處理器模塊18的高層方框圖。如圖所示,編輯處理器模塊18接受媒體文件100,該文件通常是其中嵌入有音頻的視頻文件。編輯處理模塊18執(zhí)行壓縮域中期望的視頻和音頻編輯操作,并且輸出已編輯的媒體文件180。視頻編輯處理器模塊18由四個主單元構(gòu)成文件格式解析器20、視頻處理器30、音頻處理器60和文件格式編輯器80。
A.文件格式解析器例如視頻和音頻的媒體文件幾乎都采用某個標(biāo)準(zhǔn)編碼格式,例如用于視頻的H.263、MPEG-4以及用于音頻的AMR-NB、CELP。此外,壓縮的媒體數(shù)據(jù)通常被封裝到例如MP4或3GP的文件格式中。該文件格式包括有關(guān)媒體內(nèi)容的信息,媒體內(nèi)容可被有效地用于訪問、獲取和處理部分媒體數(shù)據(jù)。文件格式解析器的目的是讀取單個的視頻幀和音頻幀,以及它們的例如視頻幀的大小、其時間戳和該幀是否為幀內(nèi)(infra frame)的相應(yīng)屬性。文件格式解析器20連同它們的幀屬性從媒體文件100讀取單個的媒體幀并將該信息饋入到媒體處理器。如圖4所示,視頻幀數(shù)據(jù)和幀屬性120被饋入到視頻處理器30而音頻幀數(shù)據(jù)和幀屬性122被饋入到音頻處理器60。
B.視頻處理器視頻處理器30連同要被施加到媒體剪輯的編輯參數(shù)(統(tǒng)一由參考標(biāo)號120表示)一起接受視頻幀數(shù)據(jù)和它的相應(yīng)屬性。編輯參數(shù)由視頻編輯引擎14傳送到視頻編輯處理器模塊18以便指示在媒體剪輯上執(zhí)行的編輯操作。視頻處理器30接收這些編輯參數(shù)并且在壓縮域中的視頻幀上執(zhí)行編輯操作。視頻處理器的輸出是帶有幀屬性的已編輯的視頻幀,而幀屬性被更新成反映編輯的視頻幀中的變化。圖5中示出視頻處理器30的細(xì)節(jié)。如圖所示,所述視頻處理器30包括下面的模塊B.1.幀分析器幀分析器32的主要功能是查找?guī)膶傩圆⑶掖_定施加在該幀上的處理的類型。取決于幀的屬性和編輯參數(shù),視頻剪輯的不同幀可經(jīng)歷不同類型的處理。幀分析器做出關(guān)于施加在特定幀上的處理類型的重要的決定。圖8中示出了典型的視頻比特流。取決于比特流的幀屬性和指定的編輯參數(shù),可以以不同的方式作用于比特流的不同部分。如圖8所示,比特流的某些部分沒有包括在輸出的電影中并且將被丟棄。某些部分只是在被解碼后就丟棄。其它的將被再次編碼以便從P幀轉(zhuǎn)換為I幀。一些將在壓縮域中編輯并被添加到輸出的電影中,而還有其它一些將原封不動地簡單地復(fù)制到電影。幀分析器的工作是執(zhí)行所有這些重要的決定。
B.2.壓縮域處理器在壓縮域處理器34中執(zhí)行壓縮域中幀的核心處理。改變壓縮視頻數(shù)據(jù)以便應(yīng)用期望的編輯效果。該模塊可在壓縮的數(shù)據(jù)上執(zhí)行各種不同類型的操作。這些常見類型操作中的一個是黑白效果的應(yīng)用,其中通過從壓縮視頻數(shù)據(jù)去除色度數(shù)據(jù),彩色幀就變成了黑白幀。可由該模塊執(zhí)行的其它效果是特殊效果(例如色彩濾波、棕褐化(sepia)等)和過渡效果(例如淡入和淡出等)。注意所述模塊不僅限于這些效果,而是可以用于執(zhí)行所有可能類型的壓縮域編輯。
視頻數(shù)據(jù)通常是由VLC(可變長碼)編碼的。因此,為了在壓縮域中執(zhí)行編輯,數(shù)據(jù)首先進(jìn)行VLC解碼從而數(shù)據(jù)可以以常規(guī)的二進(jìn)制形式表示。接著根據(jù)期望的效果對二進(jìn)制數(shù)據(jù)進(jìn)行編輯,并且接著被編輯的二進(jìn)制數(shù)據(jù)被再次VLC編碼從而將其恢復(fù)成符合的壓縮形式。另外,一些編輯效果不僅只需要VLC編碼。例如,首先對數(shù)據(jù)進(jìn)行反量化和/或IDCT(反離散余弦變換)并且接著被編輯。被編輯的數(shù)據(jù)被再次量化和/或經(jīng)過DCT操作成為符合的壓縮形式。
B.3.解碼器盡管本發(fā)明涉及壓縮域處理,但還需要對幀進(jìn)行解碼。如圖5所示,視頻處理器30包括解碼器36,該解碼器操作性地連接到幀分析器32并有可能通過編碼器38連接到壓縮域處理器34。以圖8中所示的視頻比特流作為示例,如果輸入視頻中的起始截切點(diǎn)(cutpoint)落入P幀,則該幀不能簡單的作為P幀被包括到輸出電影中。視頻序列的第一個幀總是以I幀開始。因此,這就需要將該P(yáng)幀轉(zhuǎn)換為I幀。
為了將P幀轉(zhuǎn)換為I幀,該幀首先必須被解碼。此外,因?yàn)樗荘幀,所以解碼必須一直退后到起始截切點(diǎn)之前的第一個I幀。因此,解碼器36需要相關(guān)的解碼器以對從在先的I幀到第一個包括的幀的這些幀進(jìn)行解碼。該幀接著被發(fā)送到編碼器38以便再次編碼。
B.4.空間域處理器根據(jù)本發(fā)明可以將空間域50并入到壓縮域編輯系統(tǒng)中??臻g域處理器50主要用于其中對具體的幀無法進(jìn)行壓縮域處理的情況。這可以是特殊或過渡的一些效果,這些效果無法直接應(yīng)用到壓縮的二進(jìn)制數(shù)據(jù)。在這種情況中,對幀進(jìn)行解碼并且效果被應(yīng)用在空間域中。接著該編輯的幀被發(fā)送到編碼器以便再次編碼。
如圖6中所示,空間域處理器50可被分解成兩個不同的模塊??臻g效果處理器52用于在幀上應(yīng)用特殊效果(例如老電影效果等)。過渡效果處理器54用于在幀上應(yīng)用過渡效果(例如分割過渡效果等)。
B.5.編碼器如果幀將從P幀轉(zhuǎn)化為I幀,或如果在空間域中對幀應(yīng)用某個效果,則該幀由解碼器解碼并且可選效果在空間域內(nèi)應(yīng)用。如圖5所示,編輯的原始視頻幀接著被發(fā)送到編碼器38,其中該幀被壓縮回所需類型的幀(P幀或I幀)。
B.6.預(yù)編輯器如圖5所示,預(yù)編輯器40的主要功能是更新編輯的幀的屬性以便它準(zhǔn)備好由文件格式編輯器80(圖4)來構(gòu)成。
當(dāng)幀在壓縮域內(nèi)被編輯時,幀的大小將改變。此外,幀的持續(xù)時間和時間戳可能改變。例如,如果慢動作被應(yīng)用到視頻序列上,則幀的持續(xù)時間以及它的時間戳將改變。同樣地,如果幀屬于不是在輸出的電影中的第一個視頻剪輯的視頻剪輯時,盡管幀的單個持續(xù)時間不會改變,但幀的時間戳將被轉(zhuǎn)化以便調(diào)整第一個視頻剪輯的時間。
如果幀從P幀轉(zhuǎn)換為I幀,則幀的類型從幀間(inter)變成幀內(nèi)。另外,無論何時對幀進(jìn)行解碼和再編碼,都可能造成幀的編碼的大小的變化。所編輯的幀的屬性中的所有這些變化必須被正確地更新和反映。編輯器利用這些幀的屬性來以相關(guān)的文件格式構(gòu)成輸出電影。如果沒有正確地更新幀屬性,則將不能構(gòu)成電影。
C.音頻處理器通常視頻剪輯內(nèi)部嵌入有音頻。如圖4和7所示的音頻處理器60用于根據(jù)編輯參數(shù)處理輸入的視頻剪輯內(nèi)的音頻數(shù)據(jù)從而在輸出的電影中生成期望的音頻效果。
如圖7所示,編輯系統(tǒng)中可以存在許多不同類型的音頻操作。這些操作中最常見的例如有保留原始音頻、更換新的音頻和靜音音頻。在從文件格式解析器20接收到包括由編輯參數(shù)所指定的期望的音頻效果的音頻幀數(shù)據(jù)和音頻幀信息121后,信息處理器62查找出指定了何種類型的音頻操作并且將音頻幀數(shù)據(jù)中的不同數(shù)據(jù)發(fā)送到不同的音頻處理模塊以便處理。
C.1.保留原始音頻音頻處理器中進(jìn)行音頻數(shù)據(jù)處理的最常見的情況是在已編輯的視頻剪輯中保留原始的音頻。在這種情況下,由幀提取器模塊64從視頻剪輯162a提取所需的視頻幀并將其包括在輸出的已編輯剪輯164。當(dāng)包括原始音頻時,保持正確的音頻/視頻同步是至關(guān)重要的??蓮娜我獾狞c(diǎn)對視頻剪輯進(jìn)行截取。視頻和音頻的截切點(diǎn)必須要恰好匹配以便避免已編輯視頻剪輯內(nèi)的任意音頻偏移。在這方面,有關(guān)視頻的定時信息132a被應(yīng)用到音頻處理器以便同步。利用壓縮域音頻處理器65可以在壓縮域中處理音頻幀164。例如,如果處理器65包括各種子模塊和軟件程序,則可實(shí)現(xiàn)例如音頻衰減、音頻濾波、音頻混合、特殊音效和類似的各種壓縮域操作。
C.2.更換新的音頻音頻處理器還有可能包括來自另一個源的音頻并且利用新的音頻采樣來更換視頻剪輯中的原始音頻。另外,可以在輸出的電影是任何點(diǎn)和為輸出電影的任意持續(xù)時間插入該新的音頻采樣。如果新的音頻采樣具有比要插入的持續(xù)時間更短的持續(xù)時間,則音頻處理器能夠重復(fù)該音頻以便其在總的音頻插入持續(xù)時間上反復(fù)地播放。為了音頻數(shù)據(jù)更換的目的,幀提取器68(可以是相同的提取器64)操作性地連接到音頻源67以便獲得新的音頻采樣167并且在正確的時刻將新的音頻采樣作為新的音頻幀168輸出。利用壓縮域音頻處理器69,可在壓縮域中處理音頻幀168。例如,如果處理器69包括各種子模塊和軟件程序,則可實(shí)現(xiàn)例如音頻衰減、音頻濾波、音頻混合、特殊音效和類似的各種壓縮域操作。
C.3.靜音音頻音頻處理器還能夠?qū)敵鲭娪暗娜我獬掷m(xù)時間的原始音頻進(jìn)行靜音,使得已編輯的電影在靜音的持續(xù)時間不具有任何音頻。存在許多在電影中進(jìn)行靜音的方式。音頻處理器有可能簡單的在音頻要被靜音時在具體的持續(xù)時間上不提供任何的音頻幀??蛇x地,無聲幀發(fā)生器66可用于將“無聲”幀插入到音頻幀數(shù)據(jù)中,這樣當(dāng)播放時,音頻幀就在輸出的電影中出現(xiàn)無聲的或靜音的效果。
從例如幀提取器64、68和幀發(fā)生器66的各種音頻處理模塊的輸出在音頻幀合并模塊70中合并以便提供已處理的音頻幀170。音頻幀合并模塊70的輸出170被進(jìn)一步進(jìn)行壓縮域音頻處理,通過該處理,由壓縮域音頻處理器71對插入的音頻幀進(jìn)行壓縮域內(nèi)的編輯從而改變它們的內(nèi)容。除了音頻處理器65和67以外可以使用或由音頻處理器71代替音頻處理器65和67。
應(yīng)該注意到音頻處理僅不限于這三種操作。音頻處理器中可包括任意種不同的音頻處理能力,例如混音、對多音頻通道的支持等。上述的描述僅僅是出于示例性的目的。
音頻幀通常在持續(xù)時間上比它們對應(yīng)的視頻幀要短。因此,對于每個音頻幀通常在輸出的電影中包括多于一個的音頻幀。因此,在音頻處理器中需要加法器按照正確的時間順序來收集對應(yīng)于特定視頻幀的所有音頻幀。處理過的音頻幀接著被發(fā)送到編輯器以便在輸出的電影中將它們構(gòu)成。
D.文件格式編輯器如圖4中所示,一旦對媒體幀(視頻、音頻等)進(jìn)行了編輯和處理,就將它們發(fā)送到文件格式編輯器80。編輯器80連同它們的例如幀大小、幀時間戳、幀類型(例如P幀或I幀)等的相應(yīng)幀屬性一起接收已編輯視頻130和音頻幀160。接著利用該幀信息將媒體幀數(shù)據(jù)構(gòu)成和封裝到正確的文件格式中并帶有正確的視頻和音頻定時信息。得到的就是可在任意兼容的媒體播放器中播放的相關(guān)文件格式的已編輯媒體文件180。
如上所述的本發(fā)明提供了這樣的優(yōu)勢,即視頻編輯操作可在例如移動電話、發(fā)信機(jī)、配備有攝像機(jī)或能夠從外部源接收視頻數(shù)據(jù)的個人數(shù)字助理(PDA)的小的便攜式設(shè)備上實(shí)施。圖9是便攜式設(shè)備的示意圖,根據(jù)本發(fā)明該設(shè)備可用于壓縮域視頻編輯。如圖9所示,便攜式設(shè)備1包括例如可用于顯示視頻圖像的顯示器5。如圖3中所示,設(shè)備1還包括視頻編輯系統(tǒng)10,該系統(tǒng)包括視頻編輯應(yīng)用12、視頻編輯引擎12和視頻編輯處理器18。視頻編輯處理器18從媒體文件源210接收輸入的媒體文件100并將輸出的媒體文件180傳送到媒體文件接收機(jī)220。媒體文件源210可以是便攜式設(shè)備1的一部分的攝像機(jī)。然而,媒體文件源210可以是操作性地連接到攝像機(jī)的視頻接收機(jī)。視頻接收機(jī)可以是便攜式設(shè)備的一部分。另外,媒體文件源210可以是便攜式設(shè)備一部分的比特流接收機(jī)以便接收表示輸入媒體文件的比特流。已編輯的媒體文件180可在便攜式設(shè)備1的顯示器5上顯示。然而,已編輯的媒體文件180可被傳送到例如存儲介質(zhì)、視頻傳送器的媒體文件接收機(jī)。存儲介質(zhì)和視頻傳送器也可以是便攜式設(shè)備的一部分。此外,媒體文件接收機(jī)220還可以是外部的顯示設(shè)備。應(yīng)該注意到便攜式設(shè)備1還包括軟件程序7以便執(zhí)行結(jié)合圖4、5和7所述的許多壓縮域編輯步驟。例如,軟件程序7可用于文件格式解析、文件格式構(gòu)成、幀分析和壓縮域幀處理。
應(yīng)該注意到如圖10中所示,本發(fā)明的壓縮域視頻編輯處理器18可包括在視頻編碼系統(tǒng)中。如圖10中所示,編碼系統(tǒng)300包括視頻編碼器310、視頻解碼器330和視頻編輯系統(tǒng)2。編輯系統(tǒng)2可包括在例如圖9中的便攜式設(shè)備1的獨(dú)立的電子設(shè)備中。然而,編輯系統(tǒng)2還可包括分布式編碼系統(tǒng)中。例如,編輯系統(tǒng)2可以與視頻解碼器330一起在擴(kuò)展解碼器360中實(shí)施以便為在顯示設(shè)備332上的顯示提供解碼的視頻數(shù)據(jù)190。可選地,編輯系統(tǒng)2可以與視頻編碼器310一起在擴(kuò)展編碼器350中實(shí)施以便向獨(dú)立的視頻解碼器330提供已編輯的視頻數(shù)據(jù)。已編輯的視頻數(shù)據(jù)也可被傳送到傳送器320以便傳送或被傳送到存儲設(shè)備340以便存儲。
組件2、310、320、330、332、340、350、360的一部分或全部可在操作性地連接到連通性控制器356(或356’,356”)以便它們能夠作為遠(yuǎn)端可操作設(shè)備以許多種不同的方式中的一種方式操作,這些方式例如是藍(lán)牙、紅外線或無線LAN。例如,擴(kuò)展的編碼器350可通過無線連接與視頻解碼器330進(jìn)行通信。同樣地,編輯系統(tǒng)2能夠獨(dú)立地與視頻編碼器310進(jìn)行通信以便從它接收數(shù)據(jù)并利用視頻解碼器330向其提供數(shù)據(jù)。
因此,盡管結(jié)合本發(fā)明的一個或多個實(shí)施方式對本發(fā)明進(jìn)行了描述,但本領(lǐng)域的技術(shù)人員將理解對本發(fā)明可做出形式和細(xì)節(jié)上的上述和各種的其它變化、省略和變形,而不脫離本發(fā)明的范圍。
權(quán)利要求
1.一種對比特流中的一個或多個輸入視頻幀進(jìn)行編輯以便提供一個或多個已編輯的視頻幀的方法,所述已編輯的視頻幀包括由一個或多個編輯參數(shù)指定的至少一個編輯效果,所述方法的特征在于識別所述比特流中至少一個輸入視頻幀的幀特性;以及基于所述至少一個幀的幀特性和所述指定的編輯參數(shù)在壓縮域中對所述比特流進(jìn)行修改從而提供表示所述已編輯的視頻幀的已修改的比特流。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于所述輸入的視頻幀包括視頻數(shù)據(jù)并且在于所述修改包括在壓縮域處理器中對所述視頻數(shù)據(jù)進(jìn)行修改以便提供已編輯的幀數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于所述視頻數(shù)據(jù)以可變長碼(VLC)進(jìn)行編碼,所述方法的特征進(jìn)一步在于在所述修改之前將經(jīng)VLC編碼的視頻數(shù)據(jù)轉(zhuǎn)換成二進(jìn)制形式。
4.根據(jù)權(quán)利要求3所述的方法,其特征進(jìn)一步在于在所述轉(zhuǎn)換前對經(jīng)VLC編碼的視頻數(shù)據(jù)進(jìn)行反向量化。
5.根據(jù)權(quán)利要求3所述的方法,其特征進(jìn)一步在于在所述轉(zhuǎn)換前以反余弦變換操作對經(jīng)VLC編碼的視頻數(shù)據(jù)進(jìn)行處理。
6.根據(jù)權(quán)利要求1到5中任意一項(xiàng)所述的方法,其特征進(jìn)一步在于識別所述比特流中至少一個另外的視頻幀的幀特性;以及基于所述至少一個另外的視頻幀的所述幀特性和所述指定的編輯參數(shù)來對不同于所述壓縮域的另外的域中的所述比特流進(jìn)行修改以便提供另外的經(jīng)修改的比特流。
7.根據(jù)權(quán)利要求6所述的方法,其特征進(jìn)一步在于將所述另外的修改的比特流的至少一部分與所述修改的所述比特流的至少一部分進(jìn)行合并。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于所述另外的域包括空間域。
9.根據(jù)權(quán)利要求6所述的方法,其特征在于所述另外的域包括文件格式域。
10.根據(jù)權(quán)利要求2所述的方法,其特征進(jìn)一步在于將所述編輯的幀數(shù)據(jù)轉(zhuǎn)換為編輯的媒體文件以便在媒體播放器中使用。
11.根據(jù)權(quán)利要求10所述的方法,其特征進(jìn)一步在于提供表示所述編輯的幀數(shù)據(jù)的編輯屬性的格式信息以便將所述編輯的幀數(shù)據(jù)轉(zhuǎn)換為與所述媒體播放器兼容的所述編輯的媒體文件。
12.根據(jù)權(quán)利要求10所述的方法,其特征在于所述比特流還包含可與所述輸入的視頻幀中的視頻數(shù)據(jù)分離的音頻數(shù)據(jù),所述方法的特征進(jìn)一步在于在所述轉(zhuǎn)換前將所述音頻數(shù)據(jù)與所述編輯的幀數(shù)據(jù)進(jìn)行合并;
13.根據(jù)權(quán)利要求10所述的方法,其特征進(jìn)一步在于在所述合并前對所述音頻數(shù)據(jù)進(jìn)行修改。
14.根據(jù)權(quán)利要求10所述的方法,其特征進(jìn)一步在于提供定時信息以便在所述合并中維持所述音頻數(shù)據(jù)和所述編輯的幀數(shù)據(jù)之間的同步。
15.根據(jù)權(quán)利要求1到14中任意一項(xiàng)所述的方法,其特征在于基于由用戶選擇的一個或多個編輯選項(xiàng)對所述編輯參數(shù)進(jìn)行指定。
16.一種媒體編輯設(shè)備,該設(shè)備用于對比特流中的一個或多個輸入視頻幀進(jìn)行編輯以便提供一個或多個已編輯的視頻幀,所述已編輯的視頻幀包括由一個或多個編輯參數(shù)所指定的至少一個編輯效果,所述編輯設(shè)備的特征在于幀分析器模塊,其用于響應(yīng)于表示視頻幀數(shù)據(jù)的信號,識別所述比特流中的至少一個輸入視頻幀的幀特性;以及壓縮域處理模塊,其用于響應(yīng)于表示所述幀特性的信號,基于所述至少一個幀的所述幀特性和所述指定的編輯參數(shù)對所述視頻幀數(shù)據(jù)進(jìn)行修改以便提供表示所述已編輯的視頻幀的修改的視頻數(shù)據(jù)。
17.根據(jù)權(quán)利要求16所述的編輯設(shè)備,其特征在于所述幀分析器進(jìn)一步識別所述比特流中至少一個另外的視頻幀的幀特性,所述設(shè)備的特征進(jìn)一步在于空間域處理模塊,其響應(yīng)于表示所述另外的視頻幀的幀特性的信號,基于所述另外的視頻幀的幀特性和所述指定的編輯參數(shù)修改另外的視頻幀中的視頻幀以便提供另外的修改的視頻數(shù)據(jù)。
18.根據(jù)權(quán)利要求17所述的編輯設(shè)備,其特征進(jìn)一步在于用于將所述另外的修改的視頻數(shù)據(jù)的至少一部分與所述修改的視頻數(shù)據(jù)的至少一部分進(jìn)行合并的模塊。
19.根據(jù)權(quán)利要求16所述的編輯設(shè)備,其特征進(jìn)一步在于格式編輯器模塊,其用于響應(yīng)于表示所述修改的視頻數(shù)據(jù)的信號,將所述修改的視頻數(shù)據(jù)轉(zhuǎn)換為已編輯的媒體文件以便在媒體播放器中使用。
20.根據(jù)權(quán)利要求19所述的編輯設(shè)備,其特征在于所述格式編輯器模塊包括文件格式編輯器。
21.根據(jù)權(quán)利要求19所述的編輯設(shè)備,其特征在于所述格式編輯器模塊包括媒體格式編輯器。
22.根據(jù)權(quán)利要求19所述的編輯設(shè)備,其特征在于所述幀分析器模塊進(jìn)一步識別表示所述修改的視頻數(shù)據(jù)的編輯屬性的格式信息以便將所述修改的視頻數(shù)據(jù)轉(zhuǎn)換為與所述媒體播放器兼容的所述已編輯的媒體文件。
23.根據(jù)權(quán)利要求16所述的編輯設(shè)備,其特征在于所述比特流還包括音頻數(shù)據(jù),所述設(shè)備的特征進(jìn)一步在于格式解析器模塊,該模塊用于將輸入的視頻幀中的所述音頻與所述視頻幀數(shù)據(jù)進(jìn)行分離;以及音頻處理模塊,該模塊用于在需要的時候修改所述音頻數(shù)據(jù)以便提供修改的音頻數(shù)據(jù)。
24.根據(jù)權(quán)利要求21所述的編輯設(shè)備,其特征進(jìn)一步在于合并模塊,用于將所述修改的視頻數(shù)據(jù)與所述修改的音頻數(shù)據(jù)進(jìn)行合并以便提供表示所述合并的數(shù)據(jù)的合并的信號。
25.根據(jù)權(quán)利要求22所述的編輯設(shè)備,其特征進(jìn)一步在于格式編輯器,其用于響應(yīng)于所述合并的信號,將所述合并的數(shù)據(jù)轉(zhuǎn)換為編輯的媒體文件以便在媒體播放器中使用。
26.一種媒體編碼系統(tǒng),其特征在于媒體編碼器,用于對媒體數(shù)據(jù)進(jìn)行編碼以便在具有幀數(shù)據(jù)的多個幀中提供已編碼的媒體數(shù)據(jù);媒體編輯設(shè)備,用于響應(yīng)于已編碼的媒體數(shù)據(jù),提供包括一個或多個已編輯的幀的編輯的數(shù)據(jù),所述已編輯的幀具有由一個或多個編輯參數(shù)所指定的至少一個編輯效果,以及媒體解碼器,用于響應(yīng)于所述已編輯的數(shù)據(jù),提供解碼的媒體數(shù)據(jù),其中所述編輯設(shè)備包括幀分析器模塊,用于響應(yīng)于表示已編碼的數(shù)據(jù)的信號,識別所述編碼的數(shù)據(jù)中的至少一個幀的幀特性;以及壓縮域處理模塊,用于響應(yīng)于表示所述幀特性的信號,基于所述至少一個幀的幀特性和所述指定的編輯參數(shù)來識別所述已編碼的幀數(shù)據(jù)以便提供表示所述編輯的媒體幀的修改的媒體數(shù)據(jù)。
27.根據(jù)權(quán)利要求26所述的媒體編碼系統(tǒng),其特征在于所述媒體編碼器具有連通性機(jī)制并且所述編輯設(shè)備具有另外的連通性機(jī)制以便允許所述編輯設(shè)備與所述媒體解碼器進(jìn)行通信從而以無線方式從所述媒體解碼器接收已編碼的媒體數(shù)據(jù)。
28.根據(jù)權(quán)利要求26所述的媒體編碼系統(tǒng),其特征在于所述媒體解碼器具有連通性機(jī)制并且所述編輯設(shè)備具有另外的連通性機(jī)制以便允許所述編輯設(shè)備以無線方式向所述媒體解碼器提供已編輯的數(shù)據(jù)。
29.根據(jù)權(quán)利要求26所述的媒體編碼系統(tǒng),其特征在于所述媒體編碼器和所述媒體編輯設(shè)備集成于擴(kuò)展的編碼系統(tǒng)中。
30.根據(jù)權(quán)利要求29所述的媒體編碼系統(tǒng),其特征在于所述媒體解碼器具有連通性機(jī)制并且所述擴(kuò)展的編碼系統(tǒng)具有另外的連通性機(jī)制以便允許所述擴(kuò)展的編碼系統(tǒng)以無線方式向所述媒體解碼器提供已編輯的數(shù)據(jù)。
31.根據(jù)權(quán)利要求26所述的媒體編碼系統(tǒng),其特征在于所述媒體解碼器和所述媒體編輯設(shè)備集成于擴(kuò)展的解碼系統(tǒng)中。
32.根據(jù)權(quán)利要求31所述的媒體編碼系統(tǒng),其特征在于所述媒體編碼器具有連通性機(jī)制并且所述擴(kuò)展的解碼系統(tǒng)具有另外的連通性機(jī)制以便允許所述媒體編碼器以無線方式向所述擴(kuò)展的解碼系統(tǒng)提供已編輯的數(shù)據(jù)。
33.根據(jù)權(quán)利要求30或32所述的媒體編碼系統(tǒng),其特征在于所述連通性機(jī)制和另外的連通性機(jī)制的每一種包括藍(lán)牙連通性模塊。
34.根據(jù)權(quán)利要求30或32所述的媒體編碼系統(tǒng),其特征在于所述連通性機(jī)制和另外的連通性機(jī)制的每一種包括紅外線連通性模塊。
35.一種能夠編輯媒體文件從而在一個或多個編輯的視頻幀中提供一個或多個編輯效果的通信設(shè)備,所述編輯媒體文件包括一個或多個輸入視頻幀,所述通信設(shè)備的特征在于視頻編輯應(yīng)用模塊,用于允許用戶指定所述編輯效果;以及視頻編輯系統(tǒng),包括壓縮域處理模塊,其用于響應(yīng)于表示所述輸入視頻幀的信號,基于所述指定的編輯效果來對一個或多個所述視頻幀中的視頻幀數(shù)據(jù)進(jìn)行修改以便提供表示所述已編輯的視頻幀的修改的視頻數(shù)據(jù)。
36.根據(jù)權(quán)利要求35所述的通信設(shè)備,其中所述視頻編輯系統(tǒng)的特征進(jìn)一步在于幀分析器模塊,用于響應(yīng)于表示所述視頻幀數(shù)據(jù)的信號,識別至少一個輸入視頻幀的幀特性,以便也基于所述幀特性允許所述壓縮域處理模塊修改所述視頻幀數(shù)據(jù)。
37.根據(jù)權(quán)利要求36所述的通信設(shè)備,其特征在于所述幀分析器進(jìn)一步識別所述比特流中至少一個另外的視頻幀的幀特性,并且其中所述視頻編輯系統(tǒng)的特征進(jìn)一步在于空間域處理模塊,其用于響應(yīng)于表示所述另外的視頻幀的幀特性的信號,基于所述另外的視頻幀的幀特性和所述指定的編輯參數(shù)對所述另外的視頻幀中的視頻幀數(shù)據(jù)進(jìn)行修改以便提供所述另外的修改的視頻數(shù)據(jù)。
38.根據(jù)權(quán)利要求37所述的通信設(shè)備,其特征在于所述視頻編輯系統(tǒng)進(jìn)一步包括用于將至少一部分的所述另外的已修改的視頻數(shù)據(jù)與至少一部分的所述修改的視頻數(shù)據(jù)進(jìn)行合并的模塊。
39.根據(jù)權(quán)利要求35所述的通信設(shè)備,其特征在于所述視頻編輯系統(tǒng)進(jìn)一步包括格式編輯器模塊,其用于響應(yīng)于表示修改的視頻數(shù)據(jù)的信號,將所述修改的視頻數(shù)據(jù)轉(zhuǎn)換為編輯的媒體文件以便在媒體播放器中使用。
40.根據(jù)權(quán)利要求35所述的通信設(shè)備,其特征進(jìn)一步在于顯示屏,用于基于修改的視頻數(shù)據(jù)顯示視頻圖像。
41.根據(jù)權(quán)利要求35所述的通信設(shè)備,包括移動終端。
42.一種用于視頻編輯系統(tǒng)中的、嵌入到計(jì)算機(jī)可讀介質(zhì)中的軟件產(chǎn)品,該軟件產(chǎn)品用于對比特流中的一個或多個輸入視頻幀進(jìn)行編輯以便提供一個或多個已編輯的視頻幀,所述已編輯的視頻幀包括由一個或多個編輯參數(shù)指定的至少一個編輯效果,所述軟件產(chǎn)品的特征在于用于識別所述比特流中至少一個輸入視頻幀的幀特性的代碼;以及用于基于所述至少一個幀的幀特性和所述指定的編輯參數(shù)在所述壓縮域中對一個或多個輸入視頻幀中的視頻數(shù)據(jù)進(jìn)行修改從而提供表示所述編輯的視頻幀的修改的視頻數(shù)據(jù)的代碼。
43.根據(jù)權(quán)利要求42所述的軟件產(chǎn)品,其特征在于所述輸入視頻幀包括以可變長碼(VLC)編碼的視頻數(shù)據(jù),所述軟件產(chǎn)品的特征進(jìn)一步在于用于在對一個或多個輸入視頻幀中的視頻數(shù)據(jù)進(jìn)行修改前將所述VLC編碼的視頻數(shù)據(jù)轉(zhuǎn)換為二進(jìn)制形式的代碼。
44.根據(jù)權(quán)利要求42所述的軟件產(chǎn)品,其特征在于所述識別代碼還包括識別至少一個另外的輸入視頻幀的幀特性,所述軟件產(chǎn)品的特征進(jìn)一步在于用于基于所述另外的輸入的視頻幀和所述指定的編輯參數(shù)對在不同于所述壓縮域的另外的域中的一個或多個另外的輸入視頻幀中的視頻數(shù)據(jù)進(jìn)行修改以便提供修改的另外的視頻數(shù)據(jù)的代碼。
45.根據(jù)權(quán)利要求44所述的軟件產(chǎn)品,其特征在于所述另外的域是空間域。
46.根據(jù)權(quán)利要求44所述的軟件產(chǎn)品,其特征在于所述另外的域是文件格式域。
47.根據(jù)權(quán)利要求44所述的軟件產(chǎn)品,其特征進(jìn)一步在于用于將所述修改的另外的視頻數(shù)據(jù)與所述修改的視頻數(shù)據(jù)進(jìn)行合并以便提供所述編輯的視頻幀的代碼。
48.根據(jù)權(quán)利要求42所述的軟件產(chǎn)品,其特征進(jìn)一步在于用于將所述修改的視頻數(shù)據(jù)轉(zhuǎn)換為所述編輯的媒體文件以便在媒體播放器中使用的代碼。
全文摘要
一種用于對包括輸入視頻幀的媒體文件進(jìn)行編輯的方法和設(shè)備。該編輯設(shè)備包括幀分析器以便確定輸入視頻幀是否具有適于壓縮域編輯或空間域編輯的幀特性。對適于壓縮域編輯的那些幀,幀分析器向壓縮域處理器提供幀數(shù)據(jù)以便使視頻幀數(shù)據(jù)可在壓縮域中被修改。對僅適于空間域編輯的那些幀,幀分析器將幀數(shù)據(jù)提供給解碼器并接著提供給空間域處理器以便進(jìn)行幀數(shù)據(jù)修改。在不同的域修改的數(shù)據(jù)被合并并且由文件格式編輯器轉(zhuǎn)換為文件格式。此外,文件格式解析器用于將音頻數(shù)據(jù)與視頻數(shù)據(jù)分開使得如果期望的話也可對音頻數(shù)據(jù)進(jìn)行修改。
文檔編號G11B27/031GK1930888SQ200580007487
公開日2007年3月14日 申請日期2005年3月3日 優(yōu)先權(quán)日2004年3月10日
發(fā)明者阿薩德·伊斯拉姆, 費(fèi)米·切比爾 申請人:諾基亞公司