專利名稱:進行時間最優(yōu)化編碼的系統(tǒng)和方法
技術領域:
本發(fā)明總體涉及對視頻內(nèi)容進行編碼,更具體地,涉及視頻內(nèi)容 的時間最優(yōu)化編碼。
背景技術:
本部分意在向讀者介紹可能與下面所描述和/或要求保護的本發(fā)明 的各方面有關的技術的各方面。相信這種討論有助于向讀者提供背景信 息以利于更好地理解本發(fā)明的各方面。相應地,應該理解,應該就此而 論地閱讀這些聲明,而不是將其視為對現(xiàn)有技術的承認。
在過去,視頻編碼過程是由單片編碼硬件操控的線性過程。由于 在對編碼進行硬件中使用的編解碼器是簡單的并在合理的時間量內(nèi)完 成編碼,所以這種實現(xiàn)方式是足夠的。己經(jīng)開發(fā)了新一代的視頻編解
碼器(如,高級視頻編解碼器(AVC)),以便更高效地壓縮視頻從而改 進比特率效率并提供更高級的視頻質(zhì)量。然而,新的視頻編解碼器具
有的缺陷是數(shù)學計算強度大,并因而不期望地增大了視頻編碼所需 的時間周期。
此外,正在努力通過在多編碼通路中采用編解碼器來提高編碼的 質(zhì)量。更特別地,使編解碼器通過多編碼通路來傳遞內(nèi)容并分析內(nèi)容。 如果這些通路彼此依賴,則每個通路都必須等待前一通路完成。這增 大了完成多路編碼所需的時間,并因此還具有不期望地增大視頻編碼 所需的時間周期的缺陷。
本公開關注于克服這些缺陷。
發(fā)明內(nèi)容
本公開關注用于時間最優(yōu)化編碼的系統(tǒng)和方法。時間最優(yōu)化編碼 通過在編碼質(zhì)量犧牲最小或不犧牲編碼質(zhì)量的情況下使時間密集型編碼并行化,使多個編碼節(jié)點或群的使用最大化。從而,減少了完成時 間密集型編碼所需的時間,并提高了通過系統(tǒng)的多個編碼的有效吞吐
本公開的一方面關注用于一種編碼視頻內(nèi)容的方法,該方法包 括接收視頻內(nèi)容,將視頻內(nèi)容分段成多個場景,檢測場景的長度是 否超過第一限制,如果場景的長度超過第一限制則將場景切分成場景 段,以及并行地對切分后的場景進行編碼。
本公開的另一方面關注用于一種編碼視頻內(nèi)容的設備或系統(tǒng),該 設備包括用于接收視頻內(nèi)容的裝置,用于將視頻內(nèi)容分段成多個場 景的裝置,用于檢測場景的長度是否超過第一限制的裝置,用于在場 景的長度超過第一限制的情況下將場景切分成場景段的裝置,以及用 于并行地對切分后的場景進行編碼的裝置。
本發(fā)明的這些以及其它方面、特征以及優(yōu)點將從后續(xù)對較佳實施 例的詳盡描述中得以闡述或變得清晰,將結(jié)合附圖來閱讀這些較佳實施例。
在附圖中,相似的參考標記表示所有視圖中類似的元件-
圖1是示出了依照本公開的使用編碼器的示例性系統(tǒng)的方框圖2是示出了依照本公開的示例性編碼器布置的方框圖3是傳統(tǒng)編碼工作流程的示意圖4是依照本公開的編碼工作流程的示意圖5是依照本公幵的影片內(nèi)容場景的示意圖6是依照本公開的場景內(nèi)畫面組(GOP)大小和類型的示意以及
圖7是示出了依照本公開的編碼過程的流程圖。 應理解,附圖旨在說明本發(fā)明的構(gòu)思,并不一定是用于說明本發(fā) 明的唯一可能配置。
具體實施方式
應該知道,可以以不同形式的硬件、軟件或其組合來實現(xiàn)圖中所 示元件。優(yōu)選地,在一個或多個適當編程的通用設備上采用硬件與軟 件相結(jié)合的形式來實現(xiàn)這些元件,所述適當編程的通用設備可以包括 處理器、存儲器和輸入/輸出接口。
本描述示出了本發(fā)明的原理。因此將意識到,本領域技術人員可 以設計出體現(xiàn)本發(fā)明的原理并且包含在本發(fā)明的精神和范圍之內(nèi)的各 種布置,即使這里并未明確描述或示出這些布置。
此處提到的所有示例和條件性語言傾向用于教學目的以幫助讀 者理解本發(fā)明的原理以及由發(fā)明人為促進本領域發(fā)展而貢獻的構(gòu)思, 并且應理被解為不限于這些具體提到的示例和條件。
此外,這里提到本發(fā)明的原理、方面和實施例的所有陳述及其具 體示例旨在包含其結(jié)構(gòu)性和功能性等同物。此外,這些等同物旨在包 括當前現(xiàn)有的等同物以及將來開發(fā)的等同物,即,被開發(fā)為執(zhí)行相同 功能而與結(jié)構(gòu)無關的任何元件。
因此,例如,本領域技術人員應該意識到,這里所呈現(xiàn)的方框圖 表示說明本發(fā)明原理的示例電路的方案圖。類似地,應該意識到,任 何流程圖表、流程圖、狀態(tài)轉(zhuǎn)移圖、偽碼等表示各種過程,其中可以 在計算機可讀介質(zhì)中表示這些過程并且由計算機或處理器來執(zhí)行這些 過程,而不管是否明確示出了這樣的計算機或處理器。
可以通過使用專用硬件以及與適當?shù)能浖嚓P聯(lián)的、能夠執(zhí)行軟 件的硬件來提供圖中所示不同元件的功能。在由處理器來提供的情況 下,該功能可以由單個專用處理器、單個共享處理器,或者多個單獨 的處理器(其中的一些可以是共享的)來提供。此外,術語"處理器" 或"控制器"的明確使用不應被解釋為專指能夠執(zhí)行軟件的硬件,可以 隱含包括而不限于數(shù)字信號處理器("DSF')硬件、用于存儲軟件的
只讀存儲器("ROM")、隨機存取存儲器("RAM")、以及非易失性 存儲器。
也可以包括常規(guī)的或是定制的其他的硬件。類似地,附圖所示的 任何開關只是概念上的??梢酝ㄟ^編程邏輯的操作、通過專用邏輯、 通過程序控制與專用邏輯的交互、或者甚至以手動方式來實現(xiàn)這些開
7關的功能,如從上下文中可更加明確地理解的,具體的技術是可以由 實現(xiàn)者來選擇的。
在本文的權(quán)利要求中,以用于執(zhí)行指定功能的裝置的形式表示的 任何元件旨在包括執(zhí)行該功能的任何方式,例如包括a)執(zhí)行該功能. 的電路元件的組合,或b)任何形式的軟件(因此包括固件、微碼等 等),與用于執(zhí)行該軟件的適當電路相結(jié)合以執(zhí)行該功能。這些權(quán)利 要求所限定的發(fā)明在于按照權(quán)利要求所要求的方式,將各個所闡述 的裝置的功能性組合并且集合在一起。因此,認為能夠提供這些功能 性的任何裝置與這里所示出的裝置等同。
現(xiàn)參見圖l,示出了說明編碼布置或系統(tǒng)io中使用的本公開的實
施方式的方框圖。編碼布置10包括用戶圖形界面(GUI) 12,所述用戶 圖形界面(GUI) 12駐留在例如節(jié)點(未示出)上并且可操作地連接到 預處理器14和編碼器16 (如,高級視頻編碼(AVC)編碼器),編碼器 16可操作地連接到下游處理模塊18。在GUI 12的輸入處接收包含一系
列靜止圖像幀的未壓縮運動圖像視頻內(nèi)容數(shù)據(jù)流。
在操作中,GUI 12向預處理器14提供對未壓縮運動圖像視頻內(nèi)容 數(shù)據(jù)流的訪問。使用集成場景檢測模塊(未示出)的預處理器14對接 收到的未壓縮運動圖像視頻內(nèi)容數(shù)據(jù)流中的新場景進行檢測,并向GUI 12發(fā)送場景檢測信號,所述場景檢測信號指示需要對新的畫面組(G0P)
進行編碼。場景檢測信號可以包括時間戳、指針、同步數(shù)據(jù)等以指示 新GOP應在何時何地出現(xiàn)。GUI 12將未壓縮運動圖像視頻內(nèi)容和控制數(shù)
據(jù)(如,上述的場景檢測信號和/或下面討論的附加控制數(shù)據(jù))傳遞給 編碼器16。例如,利用從GUI 12接收到的控制數(shù)據(jù),依照運動圖像專 家組(MEPG)所開發(fā)的標準而工作的編碼器16將未壓縮數(shù)據(jù)流轉(zhuǎn)換成 包含以幀內(nèi)編碼幀(I幀)開始的GOP在內(nèi)的壓縮數(shù)據(jù)流,在幀內(nèi)編碼 幀(I幀)中,編碼視頻內(nèi)容數(shù)據(jù)與原始未壓縮靜止圖像的視覺屬性(如, 亮度、色度)相對應?;诮M中在先幀的改變來編碼GOP中的在后幀, 如,預測編碼幀(P幀)和雙向編碼幀(B幀)。常規(guī)上,因為與描述相 鄰靜止圖像之間較大改變所需的數(shù)據(jù)相比,描述新的靜止圖像所需的 數(shù)據(jù)更少,所以當視頻內(nèi)容數(shù)據(jù)改變較大時,在場景改變處開始新的幀群以及由此的新的I幀。如下面所討論的,本公開關注于可以當新的 幀組開始時改變的時間最優(yōu)化編碼技術。
在編碼器16壓縮了未壓縮數(shù)據(jù)流后,壓縮數(shù)據(jù)流被傳遞到下游處 理模塊18,該處理模塊18對該壓縮數(shù)據(jù)流執(zhí)行附加處理,以使得該壓
縮數(shù)據(jù)可被存儲(如,在硬盤驅(qū)動器(PiDD)、數(shù)字視頻碟(DVD)、高 分辨率數(shù)字視頻碟(HD-DVD)等中)、在媒體上(如,無線地、在互聯(lián) 網(wǎng)上、通過廣域網(wǎng)(WAN)或局域網(wǎng)(LAN)等)傳輸、或(如,在影 院中、在數(shù)字顯示器(如,等離子體顯示器、LCD顯示器、LC0S顯示器、 DLP顯示器、CRT顯示器)上等)顯示。
現(xiàn)參見圖2,示出了依照本公開的示例性編碼器布置16的方框圖。 編碼器布置16包括可操作地連接到多個群22-26的群管理器20。每 一個群22-26包含多個節(jié)點28-32,每一個節(jié)點28-32包含多個中央處 理單元(CPU)。在操作中,群管理器20從GUI12接收未壓縮運動圖 像視頻內(nèi)容和控制數(shù)據(jù),并且還可從群22-26中的節(jié)點28-32接收反 饋數(shù)據(jù)。如下面要進一步詳細討論的,基于控制數(shù)據(jù)以及任何所提供 的反饋數(shù)據(jù),群管理器20將未壓縮運動圖像內(nèi)容分段成幀組,并將所 述幀組傳遞至群22-26中的節(jié)點28-32。
現(xiàn)在參考圖3,示出了常規(guī)的編碼工作流程40。常規(guī)的編碼工作 流程包括群管理器20接收未壓縮運動圖像內(nèi)容,并基于控制數(shù)據(jù)(如, 預處理器14產(chǎn)生的場景檢測信號)將該未壓縮運動圖像內(nèi)容分段41 成場景(a-i)。在分段后,群管理器20可向群22-26提供場景(a-i), 并且群22-26可以對場景(a-i)執(zhí)行多編碼通路。例如,第一編碼通 路43可以包括將每一個場景提供給群22-26的不同節(jié)點28-32,因而 每一個節(jié)點28-32可以分析所分配的場景(a-i)的復雜度(如,場景 幀之間的運動、幀之間的顏色變化等)。中間處理44可以包括群22 的一個節(jié)點28將第一編碼通路43的結(jié)果聚集到單個日志文件或元數(shù) 據(jù)文件中。中間處理44還可包括附加處理,例如但不限于,基于節(jié)點 28從群管理器20接收到的指令來格式化調(diào)整。之后,在第二編碼通 路46期間,群管理器將每一個場景(a-i)連同元數(shù)據(jù)文件和任何附 加的指令一起提供給群22-24的不同節(jié)點28-32,因而每一個節(jié)點
928-32可以依照元數(shù)據(jù)和任何附加指令處理所分配的場景以產(chǎn)生針對
所分配場景的AVC文件。然后可將AVC文件聚集到包含壓縮運動圖 像視頻內(nèi)容的己編碼文件48中,如上所述,所述壓縮運動圖像視頻內(nèi) 容可被傳遞到下游處理模塊18以供進一步處理。
應該意識到,由于視頻內(nèi)容的隨機特性,場景可能會具有可變的 場景長度或大小。與較短的場景相比,較長的場景很可能花費更長的 時間來通過編碼通路。此外,在完成較長場景的編碼通路從而所有的 場景可以進行下一個編碼通路之前,較長的場景可能一直需要處理較 短場景的節(jié)點等待并進入待機模式,從而浪費寶貴的處理資源并降低 了處理效率。因此,常規(guī)的、并行場景處理途徑減慢了當前最前沿編碼 過程的吞吐量。
現(xiàn)返回圖3,進一步示出了常規(guī)并行場景處理途徑的缺陷。場景 (a-i)可以具有可變長度。例如,場景(i)比場景(c)長,g卩,比 場景(c)具有更多的幀。此外,如圖所示,如果由單個節(jié)點執(zhí)行中間 處理44,那么在可以開始中間處理44之前,必須完成第一編碼通路 43。因此,場景(i)的長度減慢了編碼工作流程40的吞吐量。
現(xiàn)參見圖4,示出了依照本公開的編碼工作流程50。編碼工作流 程50包括群管理器20接收未壓縮運動圖像視頻內(nèi)容,并基于控制 數(shù)據(jù)(例如但不限于由預處理器14產(chǎn)生的場景檢測信號)將該未壓縮 運動圖像視頻內(nèi)容分段52成場景(a-i)。如以下將更詳細討論的,在 將未壓縮運動圖像視頻內(nèi)容分段成場景后,群管理器20還可在在開始 編碼通路56之前基于例如GOP類型和GOP大小來切分54場景(a-i)。 優(yōu)選地,還可切分場景中的一些以提高所有場景(a-i)通過編碼通路 56 (即,第一編碼通路58、中間處理60和第二編碼通路62)的吞吐
如圖4所述,可認為場景(a、 b和e)具有"平均"長度,認為場 景(c、 f和h)具有"短的"長度以及認為場景(d、 g禾卩i)具有"長的" 長度。如上討論的,較長的場景(d、 g和i)很可能放慢所有場景(a-i) 通過編碼通路56的吞吐量。因此,為了提高吞吐量,群管理器20或 GUI 12還可切分54較長的場景(d、 g和i)。例如,可將場景(d、 g和i)切分成兩段(di、 d2; gl、 g2以及i,、 i2),其中, 一段具有近似 平均的長度(即,d2、 g2和i》,而另一段具有優(yōu)選地不大于平均長度
的可變長度(即,山、g,和ii)。應該注意到,還可將超過平均長度的
場景段切分成更小的場景段。在切分場景54后,群管理器還可在向群 22-26提供場景之前將剩余段(即,山、g,和i》與較短長度段(c、 f 和h)編組。由于群22-26的節(jié)點28-32應該大約在同時完成對所分配 場景(即,a、 b和e)、切分后的場景段(d2、 g2和i2)、或場景與切 分后的場景段的編組(d,和c、 g,和f、以及i,和h)的編碼通路,所 以場景的切分和編組(a、 b、山和c、 d2、 e、 g,和f、 g2、 i,和h、以 及i2)提高了場景通過編碼通路42的吞吐量。
例如,第一編碼通路58可以包括將每一個場景(即,a、 b和 e)、切分后的場景段(d2、 g2和i2)、或場景與切分后的場景段的編組 (d,與c、 gl與f以及i,與h)并行地提供給群22-26的不同節(jié)點28-32, 從而每一個節(jié)點28-32可分析所分配的場景(即,a、 b和e)、切分后 的場景段(d2、 g2和i2)或場景與切分后的場景段的編組(山和c、 gl 和f、以及ii和h)的復雜度。中間處理60可以包括群22的一個節(jié) 點28將第一編碼通路58的結(jié)果聚集到單個日志文件或元數(shù)據(jù)文件中。 中間處理60還可以包括附加處理,例如但不限于,基于節(jié)點28從群 管理器20接收到的指令來格式化調(diào)整。之后,在第二編碼通路62期 間,群管理器20將每一個場景(g卩,a、b和e)、切分后的場景段(d2、 g2和i2)或場景與切分后的場景段的編組(d,和c、 g,和f、以及"和 h)連同元數(shù)據(jù)文件和任何附加指令一起并行地提供給群22-24的不同 節(jié)點28-32,因而每一個節(jié)點28-32可以依照元數(shù)據(jù)和任何附加指令處 理所分配的場景以產(chǎn)生針對所分配場景的AVC文件。然后可將AVC 文件聚集到包含壓縮運動圖像視頻內(nèi)容的已編碼文件64中,如上所 述,所述壓縮運動圖像視頻內(nèi)容可被傳遞到下游處理模塊18以供進一 步處理。
應該意識到,場景的切分和編組克服了當對具有可變場景長度或 大小的場景的視頻內(nèi)容進行編碼時會遇到的缺陷。通過對場景進行切 分和編組,極大地減小了對長的場景進行編碼所導致的延遲。這種延遲的減小提高了編碼過程的效率和吞吐量。
現(xiàn)參見圖5,示出了示例性的影片內(nèi)容70。影片內(nèi)容70可以包 含任意數(shù)目的場景72-78。每一個場景可以包含可變數(shù)目的幀(未示 出)。
現(xiàn)參見圖6,示出了壓縮或編碼后的場景80。壓縮后的場景80 包括I幀82、 B幀84和P幀86。 I幀82包含完全示出該幀所需的所 有數(shù)據(jù)。基于組中在先幀的變化來編碼B幀84和P幀86。常規(guī)地, 編碼器依照預定的GOP類型或模式對影片內(nèi)容70編碼,直到達到預 定的畫面組大小90為止。在這一點上,編碼器產(chǎn)生另一個I幀,并依 照預定的GOP模式和大小繼續(xù)進行編碼過程。例如, 一個預定的GOP 模式可以是I幀之后跟著重復的B幀、P幀、B幀模式。預定的GOP 大小可以是24幀,以使得每第24幀是I幀。其它GOP模式和大小為
本領域技術人員所知并且被視為本公開的范圍之內(nèi)。
現(xiàn)返回圖2,為了最大程度使用群22-26的節(jié)點28-32,從而使所 需的編碼時間最小,可在群22-26的節(jié)點28-32之間平均劃分影片中所 有場景的幀。然而,以任意方式劃分幀都將導致編碼性能受損,因為 與在任意位置增加場景的子劃分可以引入比最優(yōu)必要I幀更多的I幀, 所述最優(yōu)必要I幀需要以最少量的編碼信息再循環(huán)來保留和存儲所有 畫面信息。因此,引入不必要的I幀增大了比特率以及所生成的視頻流 的文件大小。因此,編碼后的文件不是最優(yōu)的文件大小。
現(xiàn)參見圖6,由于GOP類型88和GOP大小90是已知的并且在 整個編碼過程中保持恒定,所以可以預測可充當自動切分場景的理想 位置的特定幀。使用這種途徑,可以產(chǎn)生具有最佳編碼性能和最優(yōu)文 件大小的編碼后的文件。
如上討論的,常規(guī)地,長的場景要求所分配的節(jié)點對整個場景編 碼。然而,依照本公開,可在長的場景內(nèi)已知的I幀位置處進一步切 分該場景。然后,可將切分后的段并行地提供給不同的節(jié)點,從而可 以在更短的時間周期內(nèi)編碼該場景。
按照本公開,預測或確定最優(yōu)場景中斷以最優(yōu)化并行處理的方法 可包括下面的步驟。在編碼期間,壓縮者或用戶選擇G0P大小90和G0P
12類型88。可以結(jié)合場景邊界標識使用G0P大小90和類型88來確定切分哪
一個場景和應在何處發(fā)生切分。基于統(tǒng)計數(shù)據(jù)(包括但不限于場景長 度、每一個場景中GOP的數(shù)目、以及可用的群22-26和/或節(jié)點28-32的 數(shù)目),可以通過算法或過程來產(chǎn)生歸一化分布。換言之,優(yōu)選地,所 有的節(jié)點都將有實質(zhì)上相等數(shù)目的GOP要處理。
確定在何處切分或中斷場景的一個示例性的算法或過程可以包
括
1. 在接收到的不包含淡變(fade)和漸隱(dissolve)的視頻 內(nèi)容(如,故事片或影片)中獲得原始的場景數(shù)目。
2. 在接收到的將被編碼的視頻內(nèi)容內(nèi)獲得幀的數(shù)目。
3. 針對每一個場景計算編碼以上幀所需的GOP數(shù)(Go)。
4. 根據(jù)場景的給定等級長度和數(shù)目所需的GOP數(shù),來創(chuàng)建直方 圖分布。
5. 采用該直方圖并創(chuàng)建該直方圖的密度曲線。
6. 找到該密度曲線的均值、中值、最大值、最小值和標準差。 換言之,針對來自群的平衡且最優(yōu)化編碼吞吐量,每節(jié)點應包含的平 均G0P數(shù)。
7. 假定密度曲線是正態(tài)曲線,即,對于不同場景大小該曲線符 合正態(tài)曲線族,則可以應用68-95-99.7%規(guī)則(又名正態(tài)分布規(guī)則) 來計算出位于第一標準差68%之上的所有場景并在該等級所指示的 GOP數(shù)目處將這些場景切分成更小的場景。曲線高度(或標準差)可 以取決于可用節(jié)點的數(shù)目。可用節(jié)點數(shù)目越大,標準差越小,并從而 場景可以包含的GOP數(shù)目越小。
應該注意到,淡變和漸隱可以根據(jù)編碼內(nèi)容需要附加的I幀,并 從而具有比通常更小或不同的GOP大小。這是由于淡變和漸隱是在過 渡幀之間具有可能她有限相似性的更復雜場景。使用更小或不同的 GOP大小可引入比最優(yōu)必要的更多的I幀。因此,特別當涉及淡變和 漸隱時,最優(yōu)化編碼時間的附加途徑是通過以下方式來實現(xiàn)的根據(jù) 場景所包含的幀數(shù)的增大的長度,來布置場景。然后,按照場景長度 的順序來分布場景。換言之,在較短場景之前將包含淡變和漸隱的較長場景或復雜場景提供給群或節(jié)點。這使得較長場景可以在早期開始編碼過程,而留下短的場景在其它節(jié)點變得可用時利用并行處理。
現(xiàn)參見圖7,示出了說明依照本公開的編碼處理100的流程圖。
最初,在步驟102處,編碼布置IO輸入或接收視頻內(nèi)容,例如但不限于長片(feature film)內(nèi)容。接下來,在步驟104,編碼布置10基于所輸入的視頻內(nèi)容拉產(chǎn)生視頻內(nèi)容數(shù)據(jù)。示例性的視頻內(nèi)容數(shù)據(jù)可包括但不限于場景和/或連續(xù)鏡頭檢測、淡變和/或漸隱檢測、直方圖產(chǎn)生、基于場景顏色的分類(如,著暗色和/或紅色的場景通常處理起來更復雜)、類似場景的識別、幀分類(如,具有很多移動對象的有噪幀,如樹葉被吹動的樹)、縮略圖產(chǎn)生等??梢杂深A處理器14或由用戶經(jīng)由GUI 12來產(chǎn)生視頻內(nèi)容數(shù)據(jù)。之后,在步驟106,編碼器布置10詢問用戶是否愿意使用時間最優(yōu)編碼對視頻內(nèi)容進行壓縮和編碼。如果不愿意,則編碼布置IO在步驟116發(fā)起常規(guī)的、為本領域技術人員所知的群編碼過程。如果想要進行時間最優(yōu)編碼,則編碼布置10在步驟108基于場景和/或連續(xù)鏡頭檢測以及淡變和/或漸隱檢測來計算并收集統(tǒng)計數(shù)據(jù)。接下來,在步驟IIO,編碼布置10處理統(tǒng)計數(shù)據(jù)以確定視頻內(nèi)容中給出的場景是否包含淡變和/或漸隱。如果場景不包含淡變或漸隱,編碼布置在步驟112進一步確定場景是短場景、平均場景、還是長場景,并且基于GOP大小和GOP類型適當切分該場景。如果場景的確包含淡變或漸隱,則編碼布置在步驟114依照場景的長度來組織包含淡變或漸隱的場景。之后,編碼布置10如上討論的讀具有淡變和/或漸隱的場景、切分后的場景和未切分的場景進行編組,并在步驟116將場景分發(fā)給群22-26的節(jié)點28-32以依照本公開進行時間最優(yōu)化編碼。
雖然在此詳細地示出和描述了加入本發(fā)明教導的實施方式,然而本領域技術人員可以輕易地想到仍然加入這些教導的很多其它不同實施方式。已經(jīng)描述了使用智能邊緣設備來打包和傳輸基本文件、元數(shù)據(jù)文件和業(yè)務數(shù)據(jù)文件的系統(tǒng)和方法的優(yōu)選實施方式,應該注意到,本領域技術人員在以上教導的啟示之下能夠做出修改和變型。因此應該理解,在所附權(quán)利要求所概括的本發(fā)明的范圍之內(nèi),可以對所公開的本發(fā)明的具體實施方式
進行改變,
權(quán)利要求
1、一種編碼視頻內(nèi)容的方法(100),所述方法包括以下步驟接收(102)視頻內(nèi)容;將所述視頻內(nèi)容分段(108)成多個場景;檢測(112)場景的長度是否超過第一限制;如果場景的長度超過所述第一限制,則將所述場景切分(112)成場景段;以及并行地編碼(116)切分后的場景。
2、 根據(jù)權(quán)利要求l的方法,其中,切分的步驟還包括以下步驟: 基于所述場景中的畫面組特性來切分(112)所述場景。
3、 根據(jù)權(quán)利要求2所述的方法,其中,所述畫面組特性是畫面 組類型(88)。
4、 根據(jù)權(quán)利要求2所述的方法,其中,所述畫面組特性是畫面 組大小(卯)。
5、 根據(jù)權(quán)利要求l的方法,其中,檢測的步驟還包括以下步驟 檢測(112)場景是否具有較短長度、平均長度和較長長度之一。
6、 根據(jù)權(quán)利要求5的方法,其中,切分的步驟還包括以下步驟: 將具有較長長度的場景切分(54)成第一場景段和第二場景段,所述第一場景段具有平均長度,所述第二場景段不超過平均長度。
7、 根據(jù)權(quán)利要求6的方法,其中,編碼的步驟還包括以下步驟:將所述第二場景段與具有較短長度的場景編組(54);與所述第一場景段并行地對編組后的第二場景段和較短長度的場景進行編碼(56)。
8、 根據(jù)權(quán)利要求7的方法,其中,編碼的步驟還包括以下步驟 與所述第一場景段并行地以及與平均長度的場景并行地對編組后的第二場景段和較短長度的場景進行編碼(56)。
9、 根據(jù)權(quán)利要求l的方法,其中,檢測的步驟還包括以下步驟檢測(110)場景是否包含淡變效果和漸隱效果之一。
10、 根據(jù)權(quán)利要求9的方法,其中,編碼的步驟還包括以下步驟在并行地對切分后的場景進行編碼之前,發(fā)起對包含淡變效果和 漸隱效果之一的場景的編碼(116)。
11、 一種用于編碼視頻內(nèi)容的設備10,所述設備包括 用于接收視頻內(nèi)容的裝置(12);用于將所述視頻內(nèi)容分段成多個場景的裝置(12、 20); 用于檢測場景的長度是否超過第一限制的裝置(12、 20); 用于在場景的長度超過所述第一限制的情況下將所述場景切分 成場景段的裝置(12、 20);以及用于并行地編碼切分后的場景的裝置(16)。
12、 根據(jù)權(quán)利要求11所述的設備,其中,用于切分的裝置還包括用于基于所述場景中的畫面組特性來切分所述場景的裝置(12、20)。
13、 根據(jù)權(quán)利要求12所述的設備,其中,所述畫面組特性是畫 面組類型(88)。
14、 根據(jù)權(quán)利要求12所述的設備,其中,所述畫面組特性是畫 面組大小(90)。
15、 根據(jù)權(quán)利要求11所述的設備,其中,用于檢測的裝置還包括用于檢測場景是否具有較短長度、平均長度和較長長度之一的裝 置(12、 20)。
16、 根據(jù)權(quán)利要求15所述的設備,其中,用于切分的裝置還包括用于將具有較長長度的場景切分成第一場景段和第二場景段的 裝置(12、 20),所述第一場景段具有平均長度,所述第二場景段不超 過平均長度。
17、 根據(jù)權(quán)利要求16所述的設備,其中,用于編碼的裝置還包括用于將所述第二場景段與具有較短長度的場景編組的裝置(12、20);用于與所述第一場景段并行地對編組后的第二場景段和較短長度的場景進行編碼的裝置(22-32)。
18、 根據(jù)權(quán)利要求17所述的設備,其中,用于編碼的裝置還包括用于與所述第一場景段并行地以及與平均長度的場景并行地對編組后的第二場景段和較短長度的場景進行編碼的裝置(22-32)。
19、 根據(jù)權(quán)利要求11所述的設備,其中,用于檢測的裝置還包括用于檢測場景是否包含淡變效果和漸隱效果之一的裝置(12、20)。
20、 根據(jù)權(quán)利要求19所述的設備,其中,用于編碼的裝置還包括用于在并行地對切分后的場景進行編碼之前,發(fā)起對包含淡變效 果和漸隱效果之一的場景的編碼的裝置(12、 20)。
全文摘要
本公開關注一種進行時間最優(yōu)化編碼的系統(tǒng)(10)和方法(100)。時間最優(yōu)化編碼通過在編碼質(zhì)量犧牲最小或不犧牲編碼質(zhì)量的情況下使時間密集型編碼并行化,使多個編碼節(jié)點(28-32)或群(22-26)的使用最大化。從而,減少了完成時間密集型編碼所需的時間,并提高了通過系統(tǒng)(10)的多個編碼的有效吞吐量。
文檔編號H04N7/26GK101682761SQ200780053276
公開日2010年3月24日 申請日期2007年6月14日 優(yōu)先權(quán)日2007年6月14日
發(fā)明者阿南德·卡普爾 申請人:湯姆森許可貿(mào)易公司