專利名稱:用于對(duì)視頻進(jìn)行編碼的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明公開總體上涉及計(jì)算機(jī)圖形處理和顯示系統(tǒng),更具體地,涉及一種用于對(duì) 視頻進(jìn)行編碼并減少編碼視頻中的視頻偽像的系統(tǒng)和方法。
背景技術(shù):
過去,基于影帶的標(biāo)清視頻的重編碼一直是機(jī)械過程,在該過程中,壓縮師或視頻 質(zhì)量工程師驗(yàn)證源的視頻質(zhì)量、基于他們的視覺發(fā)現(xiàn)進(jìn)行編碼或重編碼(修補(bǔ)(fixes))、 以及請(qǐng)求視頻偽像修補(bǔ)。參照?qǐng)D1,示出了用于對(duì)視頻進(jìn)行編碼的傳統(tǒng)影帶工作流。通常,獲 取包含視頻10的影帶。然后將該影帶加載到影帶驅(qū)動(dòng)12上,以由編碼系統(tǒng)攝取(ingest)。 各種編碼/重編碼參數(shù)應(yīng)用于視頻14,對(duì)該視頻進(jìn)行編碼16,以產(chǎn)生編碼文件18。實(shí)質(zhì)上, 壓縮師通過可用的濾波、數(shù)字視頻降噪器、壓縮以及其他硬件/軟件來重新運(yùn)行(例如,多 次迭代20)基于影帶的內(nèi)容,以獲得期望的重編碼的視頻輸出結(jié)果22。重編碼的多次迭代 可以是編碼器驅(qū)動(dòng)的重編碼或QC (質(zhì)量控制)驅(qū)動(dòng)的重編碼。編碼器驅(qū)動(dòng)的重編碼是基于 比特率分配、視頻質(zhì)量/偽像、峰值信噪比或這些共同的任何組合的某些統(tǒng)計(jì)分析的自動(dòng) (也可以是手動(dòng))重編碼。QC驅(qū)動(dòng)的編碼是壓縮師或視頻質(zhì)量工程師驅(qū)動(dòng)的重編碼,以提高 由于正被編碼的視頻內(nèi)容的高度隨機(jī)本質(zhì)而可能已被以上統(tǒng)計(jì)分析過程錯(cuò)失的視頻質(zhì)量。 不管是什么驅(qū)動(dòng)該過程,傳統(tǒng)工作流需要繁重的來回反復(fù)工作,來解決視頻偽像,而沒有任 何機(jī)制來捕獲適合于特定類型的偽像的重編碼參數(shù)。這期間使用的壓縮編解碼簡(jiǎn)單并易于理解。這對(duì)于標(biāo)清盤格式而言是足夠的,這 是因?yàn)橛捎谳^早的光學(xué)存儲(chǔ)介質(zhì)的物理限制,已編碼的視頻特征的容量是非常適中的。同 樣,基于影帶的分發(fā)(例如,VHS影帶、DLT等)是攝入到標(biāo)清產(chǎn)品的視頻的不同方法中的優(yōu) 選手段,這是由于對(duì)于這種特定產(chǎn)品,資產(chǎn)較少、易管理并工作良好。然而,該過程是耗時(shí)的 并易于出錯(cuò)。此外,傳統(tǒng)影帶工作流不會(huì)保持除了最后修補(bǔ)以外的其他修補(bǔ)的歷史。因此, 不允許修補(bǔ)版本之間的比較。隨著支持高級(jí)編解碼(例如,H. 264(AVC))以及視頻質(zhì)量的更好壓縮比的新近的 光學(xué)存儲(chǔ)空間增大的介質(zhì)的出現(xiàn),使得利用該附加磁盤空間用于其他增值內(nèi)容(例如游 戲、獎(jiǎng)勵(lì)視頻內(nèi)容、會(huì)談、音樂會(huì)、畫中畫以及當(dāng)今客戶/消費(fèi)者需求的事件)變?yōu)榭赡?。這 實(shí)質(zhì)上還已增加了高清視頻內(nèi)容的純粹容量、增加了復(fù)雜性(多系統(tǒng)、軟件等)以及成功 編碼所需的時(shí)間、增強(qiáng)了對(duì)更好管理/理解數(shù)字內(nèi)容的需求、以及增加了增值內(nèi)容素材,但 是,卻使得完成該附加內(nèi)容素材的周轉(zhuǎn)時(shí)間縮短了。使用較早的傳統(tǒng)標(biāo)清產(chǎn)品工作流不再 是可行的方案。這需要將高清產(chǎn)品朝著無影帶分發(fā)發(fā)展,以使得該過程在成本上更有效,這 是由于需要跟蹤和存儲(chǔ)的物理資產(chǎn)(D5影帶、DLT等)更少,并更容易進(jìn)行數(shù)字化操縱/操 作。
因此,需要技術(shù)來克服傳統(tǒng)無影帶數(shù)字工作流的缺點(diǎn)并更好管理重編碼過程,其 通過實(shí)現(xiàn)壓縮師的學(xué)習(xí)的可再用性、允許多個(gè)重編碼屬性/工具的應(yīng)用、以及允許使用和 控制的便利性,來提高壓縮師的效率。
發(fā)明內(nèi)容
提供了一種用于對(duì)視頻進(jìn)行編碼以及減少編碼視頻中的視頻偽像的系統(tǒng)和方法。 本發(fā)明的系統(tǒng)和方法使用戶能夠簡(jiǎn)單選擇預(yù)先設(shè)置(例如,一組編碼或重編碼參數(shù))來修 補(bǔ)在編碼視頻中存在的視頻偽像,或提供開始點(diǎn)來修補(bǔ)視頻偽像。此外,本發(fā)明的系統(tǒng)和方 法提供了一種根據(jù)視頻偽像的復(fù)雜性來創(chuàng)建新的預(yù)先設(shè)置庫的機(jī)制。這些用戶產(chǎn)生的編碼 參數(shù)集合或編碼參數(shù)的預(yù)先設(shè)置能夠容易地應(yīng)用在多個(gè)場(chǎng)景或不同特征上,并在不同用戶 之間共享。此外,本發(fā)明的系統(tǒng)和方法標(biāo)記、分類以及組織潛在的后編碼相關(guān)的視頻質(zhì)量問 題,例如,在編碼過程期間檢測(cè)到的視頻偽像,例如,條帶化、暗噪聲等。通過對(duì)視頻偽像進(jìn) 行識(shí)別和分類,本發(fā)明的系統(tǒng)和方法使這些視頻偽像的修補(bǔ)更容易并更精確,從而提高質(zhì) 量、節(jié)省時(shí)間、以及提高性能。該系統(tǒng)和方法還允許用戶提供視頻偽像特定的解決方案,以 通過采用用戶產(chǎn)生的編碼參數(shù)集合或編碼參數(shù)的預(yù)先設(shè)置,來解決這些視頻編碼異常。根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于減少視頻偽像的方法,所述方法包括以 下步驟接收源視頻、對(duì)所述源視頻進(jìn)行編碼、在編碼視頻中檢測(cè)不同的至少兩個(gè)偽像、以 及基于至少一個(gè)第一用戶產(chǎn)生編碼參數(shù)集合,對(duì)所述編碼視頻進(jìn)行重編碼,以便移除所述 至少兩個(gè)偽像。在另一方面中,所述方法還包括確定至少兩個(gè)偽像中的每一個(gè)的類別,以及基于 所確定的類別之一,來選擇至少一個(gè)第一用戶產(chǎn)生編碼參數(shù)集合。在另一方面中,所述方法包括確定至少兩個(gè)偽像中的每一個(gè)的嚴(yán)重性,以及基于 具有所確定的最高嚴(yán)重性的偽像,來選擇至少一個(gè)第一用戶產(chǎn)生編碼參數(shù)集合。根據(jù)本發(fā)明的另一方面,一種實(shí)現(xiàn)編碼視頻中偽像減少的方法,包括接收源視 頻,所述源視頻具有多個(gè)幀;對(duì)所述源視頻進(jìn)行編碼,確定編碼視頻的所述多個(gè)幀的一部分 是否包含第一類型的偽像;顯示具有所述第一類型偽像的視頻幀;以及使用戶能夠從多個(gè) 編碼參數(shù)集合中選擇編碼參數(shù)集合,以在對(duì)編碼視頻進(jìn)行重編碼時(shí)減少偽像。在另一方面中,所述方法還包括確定編碼視頻的所述多個(gè)幀的第二部分是否包 含第一類型的偽像,以及如果確定編碼視頻的所述多個(gè)幀的第二部分包含第一類型的偽 像,則將第一和第二部分分組到單個(gè)偽像類別中。根據(jù)本發(fā)明的另一方面,一種用于對(duì)視頻進(jìn)行編碼的系統(tǒng)包括用于源視頻的編 碼器,所述源視頻具有多個(gè)幀;用于在編碼視頻中檢測(cè)不同的至少兩個(gè)偽像的偽像檢測(cè)器; 以及多個(gè)用戶產(chǎn)生編碼參數(shù)集合,其中,所述編碼器基于至少一個(gè)第一用戶產(chǎn)生編碼參數(shù) 集合對(duì)所述編碼視頻進(jìn)行重編碼,以便移除所述至少兩個(gè)偽像。在各個(gè)方面中,該系統(tǒng)包括用于確定檢測(cè)到的偽像的類別的分類器,,并且偽像 檢測(cè)器確定檢測(cè)到的偽像的嚴(yán)重性。該系統(tǒng)基于檢測(cè)到的偽像的所確定的類別或嚴(yán)重性來 解決偽像。
根據(jù)參照附圖閱讀的優(yōu)選實(shí)施例的以下詳細(xì)描述,對(duì)本發(fā)明的這些和其他方面、 特征以及優(yōu)點(diǎn)進(jìn)行描述并使其變得顯而易見。在附圖中,類似的附圖標(biāo)記表示類似的元件圖1示出了根據(jù)現(xiàn)有技術(shù)的用于對(duì)來自影帶的視頻進(jìn)行編碼的工作流;圖2示出了根據(jù)本發(fā)明方面的用于對(duì)視頻進(jìn)行編碼的無影帶工作流;圖3是根據(jù)本發(fā)明方面的用于對(duì)視頻進(jìn)行編碼的系統(tǒng)的示例圖不;圖4是根據(jù)本發(fā)明方面的用于對(duì)視頻進(jìn)行編碼的示例方法的流程圖;圖5示出了根據(jù)本發(fā)明方面的用于選擇要重編碼的視頻的鏡頭/場(chǎng)景的示例屏幕 截圖;圖6示出了根據(jù)本發(fā)明另一方面的用于選擇要重編碼的視頻的鏡頭/場(chǎng)景的另一 示例屏幕截圖;圖7-10示出了根據(jù)本發(fā)明方面的用于控制視頻的重編碼、控制視頻重編碼的版 本化、以及向視頻應(yīng)用至少一個(gè)重編碼參數(shù)的若干示例屏幕截圖;圖11是用于創(chuàng)建重編碼參數(shù)的預(yù)先設(shè)置并將其應(yīng)用于視頻內(nèi)容以減少偽像的示 例方法的流程圖;圖12示出了用于選擇要應(yīng)用于包含在視頻內(nèi)容中的特定類別的偽像的重編碼參 數(shù)的預(yù)先設(shè)置的界面;圖13是根據(jù)本發(fā)明方面的用于識(shí)別并分類偽像的示例方法的流程圖。應(yīng)當(dāng)理解,附圖是為了示意本發(fā)明的構(gòu)思的目的,并不必是用于示出本公開的唯 一可能的配置。
具體實(shí)施例方式應(yīng)當(dāng)理解,圖中所示的元件可以以各種形式的硬件、軟件或其組合來實(shí)現(xiàn)。優(yōu)選 地,這些元件可以以一個(gè)或多個(gè)適當(dāng)編程的通用設(shè)備上的硬件和軟件的組合實(shí)現(xiàn),該通用 設(shè)備可以包括處理器、存儲(chǔ)器和輸入/輸出接口。本說明書示意了本發(fā)明的原理。因此將認(rèn)識(shí)到,本領(lǐng)域技術(shù)人員能夠設(shè)想各種布 置,這些布置盡管在這里沒有顯式描述或示出,但體現(xiàn)本發(fā)明的原理并包括在本發(fā)明的精 神和范圍內(nèi)。這里所引述的所有示例和條件性語言均為了教導(dǎo)的目的,以幫助讀者理解本發(fā)明 的原理以及發(fā)明人對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的構(gòu)思,應(yīng)看作不會(huì)被限制為這里具體引述的示例 和條件。此外,這里對(duì)本發(fā)明的原理、方面、實(shí)施例及其特定示例做出引述的所有聲明意在 包括本發(fā)明的結(jié)構(gòu)和功能上的等同物。另外,該等同物將包括當(dāng)前已知的等同物以及將來 開發(fā)出的等同物,即所開發(fā)出來的執(zhí)行相同功能的任何組件,而與結(jié)構(gòu)無關(guān)。因此,本領(lǐng)域的技術(shù)人員可以理解,例如這里所表示的框圖展示出體現(xiàn)本發(fā)明的 示意性電路的概念圖。類似地,將理解,任何流程、流程圖、狀態(tài)轉(zhuǎn)移圖、偽代碼等表現(xiàn)出實(shí) 質(zhì)上可以在計(jì)算機(jī)可讀介質(zhì)上表現(xiàn)的、并且由計(jì)算機(jī)或處理器執(zhí)行的各個(gè)過程,無論是否 明確示出該計(jì)算機(jī)或處理器。
可以通過使用專用硬件和能夠執(zhí)行適合的軟件的關(guān)聯(lián)軟件的硬件而提供圖中所 示各個(gè)組件的功能。當(dāng)由處理器來提供時(shí),這些功能可以由單個(gè)的專用處理器、單個(gè)的共享 處理器、或多個(gè)單獨(dú)的處理器來提供,其中一些可以是共享的。此外,術(shù)語“處理器”或“控 制器”的顯式使用不應(yīng)被解釋為排他性地指代能夠執(zhí)行軟件的硬件,而且可以隱式地包括 (不限為)數(shù)字信號(hào)處理器(“DSP”)硬件、用于存儲(chǔ)軟件的只讀存儲(chǔ)器(“ROM”)、隨機(jī)存 取存儲(chǔ)器(“RAM”)以及非易失性存儲(chǔ)器。還可以包括常規(guī)和/或定制的其它硬件。類似地,圖中所示的任何開關(guān)僅是概念 上的。其功能可以通過程序邏輯的操作、專用邏輯、程序控制和專用邏輯的交互、或甚至是 手動(dòng)地實(shí)現(xiàn),實(shí)施者可以選擇的具體技術(shù)可以從上下文中得到明確的理解。在權(quán)利要求書中,表示為用于執(zhí)行指定功能的裝置的任何組件意在包括執(zhí)行該功 能的任何方式,例如包括a)執(zhí)行該功能的電路元件的組合,或b)任意形式的軟件,包括固 件、微代碼等,并與用于執(zhí)行該軟件以執(zhí)行該功能的適合的電路進(jìn)行組合。由權(quán)利要求所限 定的本發(fā)明原理在于如下事實(shí)將各個(gè)引述的裝置所提供的功能以權(quán)利要求所要求的方式 組合在一起。因此,可以把能夠提供這些功能的任意裝置看作與這里所示的裝置相等同。提供了一種用于對(duì)視頻進(jìn)行編碼的系統(tǒng)和方法。本發(fā)明的系統(tǒng)和方法為重編碼提 供版本化,以允許控制、管理場(chǎng)景/鏡頭、以及在重編碼過程期間呈現(xiàn)重編碼歷史,這些在 所有質(zhì)量提高的重編碼工作期間都是必需的。參照?qǐng)D2,示出了根據(jù)本發(fā)明的用于對(duì)視頻 進(jìn)行編碼的無影帶工作流。在圖2的工作流中,經(jīng)由影帶驅(qū)動(dòng)來播放視頻影帶,并且捕獲該 影帶并將其轉(zhuǎn)換成數(shù)字格式13。在捕獲了內(nèi)容并將其轉(zhuǎn)換成數(shù)字格式之后,在完全的數(shù)字 工作流中(例如,在計(jì)算機(jī)上)中進(jìn)行處理變得很容易。所有圖像濾波器要么是軟件驅(qū)動(dòng) 的,要么利用專用硬件加速來執(zhí)行。這允許壓縮師或視頻質(zhì)量工程師容易地使用專用軟件 或硬件來向視頻內(nèi)容應(yīng)用修補(bǔ)。如下所述,本發(fā)明的系統(tǒng)具有專用軟件和/或硬件以允許 用戶(例如,壓縮師或視頻質(zhì)量工程師)選擇特定的鏡頭/場(chǎng)景或特定的輸入/輸出幀,來 進(jìn)行重編碼;允許用戶指定所應(yīng)用的重編碼參數(shù);以及允許使用集成視頻播放器進(jìn)行內(nèi)容 回放。該系統(tǒng)和方法允許重編碼的多次迭代,并使得粒度改進(jìn)成為可能。本發(fā)明的系統(tǒng)和方 法可以保存每次迭代,并編譯修補(bǔ)的歷史,從而允許多次重編碼(修補(bǔ))、編碼與其源之間 的比較。此外,該系統(tǒng)和方法包括預(yù)先設(shè)置修補(bǔ)(例如,用戶產(chǎn)生的編碼參數(shù)集合)的庫, 極大減少執(zhí)行修補(bǔ)的時(shí)間。現(xiàn)在參照附圖,在圖3中示出了根據(jù)本發(fā)明的實(shí)施例的示例系統(tǒng)100。可以提供掃 描設(shè)備103來將影片膠片104(例如,攝像機(jī)原始影片底片)掃描成數(shù)字格式,例如Cineon 格式或SMPTE DPX文件。例如,掃描設(shè)備103可以包括,電視電影機(jī)或根據(jù)影片產(chǎn)生視頻輸 出的任何設(shè)備,例如具有視頻輸出的Arri LocPro 0備選地,可以直接使用來自后期制作 過程或數(shù)字電影106的文件(例如,已經(jīng)是計(jì)算機(jī)可讀形式的文件)。潛在的計(jì)算機(jī)可讀文 件的源是AVID 編輯器、DPX文件、D5影帶等。將掃描后的影片膠片輸入至后處理設(shè)備102,例如,計(jì)算機(jī)。計(jì)算機(jī)在具有硬件的 各種已知計(jì)算機(jī)平臺(tái)中的任何平臺(tái)上實(shí)現(xiàn),該硬件例如是一個(gè)或多個(gè)中央處理單元(CPU)、 諸如隨機(jī)存取存儲(chǔ)器(RAM)和/或只讀存儲(chǔ)器(ROM)等存儲(chǔ)器110、以及諸如鍵盤、光標(biāo)控 制設(shè)備等輸入/輸出(I/O)用戶接口 112 (例如,鼠標(biāo)或操縱桿)以及顯示設(shè)備。該計(jì)算機(jī) 平臺(tái)還包括操作系統(tǒng)和微指令代碼。這里描述的各種過程和功能可以是經(jīng)由操作系統(tǒng)執(zhí)行的微指令代碼的一部分或軟件應(yīng)用程序的一部分(或其組合)。在一個(gè)實(shí)施例中,在程序 存儲(chǔ)設(shè)備上有形地體現(xiàn)軟件應(yīng)用程序,該軟件應(yīng)用程序可以上載到諸如后處理設(shè)備102等 任何適合的機(jī)器上并由該機(jī)器執(zhí)行。此外,各種其他外圍設(shè)備可以通過各種接口和總線結(jié) 構(gòu)(例如,并行端口、串行端口或通用串行總線(USB))連接至計(jì)算機(jī)平臺(tái)。其他外圍設(shè)備 可以包括附加的存儲(chǔ)設(shè)備124和印片機(jī)128。印片機(jī)128可以用于印制影片126的修改版 本,例如,影片的重編碼版本,其中,由于以下描述的技術(shù),可能已經(jīng)代替或修補(bǔ)了某個(gè)場(chǎng)景 或多個(gè)場(chǎng)景。備選地,可以直接將已經(jīng)是計(jì)算機(jī)可讀形式106的文件/影片(例如,可以存儲(chǔ)在 外部硬盤驅(qū)動(dòng)127中的數(shù)字電影)直接輸入到計(jì)算機(jī)102中。注意,這里使用的術(shù)語“影 片”可以指代影片膠片或數(shù)字電影。軟件程序包括存儲(chǔ)在存儲(chǔ)器10中并用于對(duì)視頻進(jìn)行編碼/重編碼的編碼版本化 模塊114。編碼版本化模塊114包括相互作用以執(zhí)行本發(fā)明中提供的各種功能和特征的各 種模塊。編碼版本化模塊114包括被配置為確定視頻(例如,影片或電影)的至少一個(gè)鏡頭 或場(chǎng)景的鏡頭/場(chǎng)景檢測(cè)器116。編碼模塊114還包括被配置為選擇編碼/重編碼參數(shù)并 將其應(yīng)用于檢測(cè)到的鏡頭/場(chǎng)景的重編碼參數(shù)118。示例的重編碼參數(shù)包括改變特定鏡頭 /場(chǎng)景的比特率的DeltaRate,將成塊偽像從鏡頭/場(chǎng)景中移除的去塊濾波器等。提供了編 碼器120,用于將攝取的視頻編碼成至少一個(gè)數(shù)字格式。示例編碼器包括MPEG-4(H.264)、 MPEG-2、QuickTime等。編碼版本化模塊114向編碼后的視頻的每個(gè)版本分配版本編號(hào)或 指示。提供預(yù)先設(shè)置修補(bǔ)庫122,用于基于給定條件將至少一個(gè)或多個(gè)修補(bǔ)應(yīng)用于視頻 鏡頭或場(chǎng)景。預(yù)先設(shè)置修補(bǔ)庫122是解決特定偽像的重編碼參數(shù)的集合。用戶能夠通過首 先選擇鏡頭/場(chǎng)景,然后基于在鏡頭/場(chǎng)景中找到的偽像來選擇已經(jīng)創(chuàng)建的現(xiàn)有預(yù)先設(shè)置, 來應(yīng)用特定的預(yù)先設(shè)置。也能夠基于用戶創(chuàng)建的類別,來應(yīng)用預(yù)先設(shè)置。此外,如果必要, 可以保存這些預(yù)先設(shè)置,以供今后用于類似的視頻編碼項(xiàng)目。編碼版本化模塊114還包括視頻播放器124,用于對(duì)視頻鏡頭/場(chǎng)景進(jìn)行解碼,并 向用戶可視化該視頻。提供了比較器126,用于比較相同鏡頭/場(chǎng)景的至少兩個(gè)版本的數(shù) 據(jù),并用于向用戶顯示比較數(shù)據(jù)。此外,編碼版本化模塊114包括偽像檢測(cè)器125,用于經(jīng)由多個(gè)編碼偽像檢測(cè)算法 或函數(shù),來在視頻的鏡頭/場(chǎng)景中檢測(cè)視頻偽像。示例檢測(cè)器檢測(cè)諸如暗噪聲、條帶化等偽 像,并且還可以考慮基于暗噪聲和條帶化兩者的組合檢測(cè)器。偽像檢測(cè)器125還確定檢測(cè) 到的偽像的嚴(yán)重性,并向該偽像分配嚴(yán)重性的值。提供了分類器129,用于對(duì)檢測(cè)到的偽像 進(jìn)行分類。分類器129基于鏡頭/場(chǎng)景中偽像的類型或基于檢測(cè)到的偽像的嚴(yán)重性、以及 用戶或系統(tǒng)設(shè)置的閾值,來對(duì)鏡頭/場(chǎng)景進(jìn)行分組。圖4是根據(jù)本發(fā)明方面的用于對(duì)視頻進(jìn)行編碼的示例方法的流程圖。首先,后處 理設(shè)備102獲取或?qū)胍曨l內(nèi)容(步驟202)。后處理設(shè)備102可以通過獲得計(jì)算機(jī)可讀格 式的數(shù)字主圖像文件,來獲取視頻內(nèi)容。可以通過利用數(shù)字?jǐn)z像機(jī)捕獲運(yùn)動(dòng)圖像的時(shí)間序 列,來獲取數(shù)字視頻文件。備選地,傳統(tǒng)膠片類型的攝像機(jī)可以捕獲該視頻序列。在這種情 況下,經(jīng)由掃描設(shè)備103來掃描影片。應(yīng)當(dāng)認(rèn)識(shí)到,無論對(duì)該影片進(jìn)行掃描還是該影片已經(jīng)為數(shù)字格式,影片的數(shù)字文件包括與幀的位置有關(guān)的指示或信息,例如,幀編號(hào),影片開始的時(shí)間等。數(shù)字圖像文件的 每個(gè)幀包括一個(gè)圖像,例如,I1, I2,... In。在導(dǎo)入視頻之后,攝取視頻并產(chǎn)生視頻內(nèi)容數(shù)據(jù)(步驟204)。引入該步驟以準(zhǔn)備 將來自不同源的視頻數(shù)據(jù)轉(zhuǎn)換成編碼器可接受的格式,例如從10比特DPX格式到8比特 YUV格式。這要求根據(jù)需要丟棄圖像的比特深度,保存在編碼過程內(nèi)可能使用的附加的顏色 元數(shù)據(jù)信息等。根據(jù)攝入的視頻,將若干算法或函數(shù)應(yīng)用于視頻,以導(dǎo)出內(nèi)容數(shù)據(jù),例如元 數(shù)據(jù)。例如,經(jīng)由鏡頭/場(chǎng)景檢測(cè)器116應(yīng)用場(chǎng)景/鏡頭檢測(cè)算法,來將完整的視頻分割成 場(chǎng)景/鏡頭;也可以使用淡入淡出/溶解檢測(cè)算法。所產(chǎn)生的其他內(nèi)容數(shù)據(jù)包括直方圖、 基于顏色的分類、類似場(chǎng)景檢測(cè)、比特率、幀分類、縮略圖等。接著,在步驟206中,編碼器12對(duì)視頻進(jìn)行編碼。第一編碼產(chǎn)生版本0或基本/ 參考編碼版本。根據(jù)需要或在相應(yīng)鏡頭/場(chǎng)景的版本之間,將所有其他版本與該版本進(jìn)行 比較,以用于視頻質(zhì)量提高。在步驟208中,確定是否有任何鏡頭/場(chǎng)景能夠進(jìn)一步提高或需要重編碼。在第一 編碼期間能夠自動(dòng)提高視頻鏡頭/場(chǎng)景的質(zhì)量。壓縮師能夠在視覺上檢查鏡頭/場(chǎng)景,以 確定是否需要進(jìn)一步重編碼。如果確定不需要進(jìn)一步重編碼,則在步驟220輸出最終的編 碼視頻。否則,如果需要進(jìn)一步重編碼,則該方法通過應(yīng)用預(yù)先設(shè)置或單獨(dú)的重編碼參數(shù), 繼續(xù)至步驟210。在步驟210中,鏡頭/場(chǎng)景由用戶選擇,自動(dòng)分配版本編號(hào)或指示,并且從重編碼 參數(shù)列表118中分配或選擇新的重編碼參數(shù)。備選地,用戶或壓縮師可以從預(yù)先設(shè)置修補(bǔ) 庫122中進(jìn)行選擇,該預(yù)先設(shè)置修補(bǔ)庫122可以包括一個(gè)或多個(gè)重編碼參數(shù)。應(yīng)當(dāng)認(rèn)識(shí)到, 用戶可以在鏡頭/場(chǎng)景內(nèi)選擇一個(gè)幀或多個(gè)幀,用于重編碼過程。然后對(duì)所選鏡頭/場(chǎng)景執(zhí)行重編碼(步驟212),然后經(jīng)由視頻播放器124播放重 編碼版本,并經(jīng)由比較器126將該重編碼版本與所選鏡頭/場(chǎng)景的先前版本進(jìn)行比較(步 驟214),以驗(yàn)證視頻或重編碼質(zhì)量。在一個(gè)實(shí)施例中,通過經(jīng)由視頻播放器124,在分屏中 顯示這些視頻,來在視覺上比較重編碼版本和先前版本。如以下關(guān)于圖6和7所描述的,還 能夠通過選擇/檢查特定版本,以及視覺上區(qū)分該鏡頭/場(chǎng)景版本的數(shù)據(jù),來簡(jiǎn)單地對(duì)比較 數(shù)據(jù)(或元數(shù)據(jù))進(jìn)行比較,例如,比較數(shù)據(jù)(或元數(shù)據(jù))是平均比特率等級(jí)、編碼幀類型、 峰值信噪比等。連續(xù)地,一直選擇每個(gè)鏡頭/場(chǎng)景的一個(gè)版本。可以顯示其他比較數(shù)據(jù),例 如,在視頻的編碼和重編碼版本中檢測(cè)到的視頻偽像的列表、視頻文件大小、以及用于所選 版本的具體的編碼參數(shù)。在基于步驟210中選擇的重編碼參數(shù)來執(zhí)行重編碼之后,確定針對(duì)鏡頭/場(chǎng)景的 重編碼是否令人滿意,或者確定是否應(yīng)當(dāng)應(yīng)用其他不同的重編碼參數(shù)(步驟216)。這種確 定是使用分離的視頻或?qū)Ρ容^數(shù)據(jù)可視化的視覺/手動(dòng)過程。在一個(gè)實(shí)施例中,用戶或壓 縮師基于比較數(shù)據(jù)(例如,峰值信噪比)的可視化,選擇若干產(chǎn)生的版本中相對(duì)而言無偽像 的那個(gè)版本,作為編碼視頻的最終版本。在其他實(shí)施例中,用戶或壓縮師基于通過視頻播放 器124的至少兩個(gè)所選版本的分離的可視化,來選擇若干產(chǎn)生的版本中相對(duì)而言無偽像那 個(gè)版本,作為編碼視頻的最終版本。如果鏡頭/場(chǎng)景的重編碼不令人滿意,則過程返回至步 驟210,應(yīng)用其他重編碼參數(shù)。否則,過程轉(zhuǎn)向步驟218。在步驟218中,針對(duì)與完整的視頻剪輯或電影相關(guān)聯(lián)的所有鏡頭/場(chǎng)景,確定編碼和重編碼是否令人滿意。如果存在要重編碼的其他鏡頭/場(chǎng)景,則過程返回至步驟210,選 擇另一鏡頭/場(chǎng)景。否則,如果對(duì)于所有鏡頭/場(chǎng)景,編碼和重編碼是令人滿意的,則在例 如存儲(chǔ)設(shè)備127中存儲(chǔ)最終編碼視頻,并可以獲取該最終編碼視頻用于回放(步驟220)。 此外,能夠?qū)⑦\(yùn)動(dòng)畫面或視頻剪輯的鏡頭/場(chǎng)景存儲(chǔ)在代表運(yùn)動(dòng)畫面或剪輯的完整版本的 單個(gè)數(shù)字文件130中。數(shù)字文件130可以存儲(chǔ)在存儲(chǔ)設(shè)備127中以供后續(xù)獲取,例如用于 印刷編碼視頻的影帶或影片版本。圖5-10示出了根據(jù)本發(fā)明方面的用于控制視頻的重編碼并向視頻應(yīng)用至少一個(gè) 重編碼參數(shù)的若干示例屏幕截圖。參照?qǐng)D5,示出了選擇特定鏡頭/場(chǎng)景用于重編碼的第一表示。提供界面500,其示 出了全部特征的縮略圖呈現(xiàn)的一部分,其中已經(jīng)對(duì)該全部特征執(zhí)行了鏡頭/場(chǎng)景檢測(cè)。能 夠選擇縮略圖來標(biāo)記入(例如,開始)和標(biāo)記出(例如,結(jié)束)用于重編碼的區(qū)域。能夠在 場(chǎng)景級(jí)別或幀級(jí)別上執(zhí)行這些選擇,并確定用于重編碼的具體區(qū)域。在圖5中,檢測(cè)到的視 頻鏡頭/場(chǎng)景由縮略圖502來表示。在選擇具體鏡頭/場(chǎng)景縮略圖504時(shí),向用戶顯示作 為縮略圖506的與所選鏡頭/場(chǎng)景相關(guān)聯(lián)的幀。界面500包括區(qū)段508,用于通過拖動(dòng)和放入重編碼類別中、或通過點(diǎn)擊縮略圖本 身來使用上下文菜單,來添加用于重編碼的鏡頭。能夠簡(jiǎn)單地將場(chǎng)景502放入用戶定義的 有色類別508中。在一個(gè)實(shí)施例中,類別的顏色表示視頻偽像、復(fù)雜度、鏡頭/場(chǎng)景閃爍等。 界面500還包括示出了屬于以上所選類型508中的各個(gè)單獨(dú)場(chǎng)景的區(qū)段510。這些縮略圖 示出了屬于所選/高亮類別內(nèi)的鏡頭/場(chǎng)景的第一幀。參照?qǐng)D6,示出了在幀級(jí)別上選擇用于重編碼的具體鏡頭/場(chǎng)景的第二表示。提供 另一界面600,其代表了(重)編碼視頻流的附加屬性或元數(shù)據(jù)。例如,比特率圖能夠用于 基于編碼流的屬性,來標(biāo)記入和標(biāo)記出需要質(zhì)量增強(qiáng)的區(qū)域。這里,標(biāo)記入/標(biāo)記出由標(biāo)志 602,604以及陰影區(qū)域606來表示。提供區(qū)段608,以在進(jìn)行添加以用于重編碼之前,應(yīng)用 用于重編碼的附加參數(shù)。圖7-10示出了根據(jù)本發(fā)明方面的使壓縮師或視頻質(zhì)量工程師能夠控制視頻的重 編碼、并向視頻應(yīng)用至少一個(gè)重編碼參數(shù)、以及允許壓縮師或視頻質(zhì)量工程師挑選相對(duì)而 言無視頻偽像的重編碼版本的若干示例屏幕截圖。根據(jù)本發(fā)明的各個(gè)方面,壓縮師或視頻質(zhì)量工程師能夠提供多個(gè)附加的重編碼參 數(shù),可以在相同場(chǎng)景內(nèi)低至各個(gè)單獨(dú)幀的更小粒度級(jí)別上應(yīng)用這些參數(shù)。圖7示出了用于在類別級(jí)別上選擇附加的重編碼設(shè)置屬性的界面700。區(qū)段702 示出了包含用戶使用以上選擇組件而請(qǐng)求的重編碼區(qū)域(例如,關(guān)于圖5和6描述的鏡頭/ 場(chǎng)景或幀)的樹狀列表。該樹包括1.)類別-對(duì)重編碼場(chǎng)景是部分的進(jìn)行分組,即,允許類 似的重編碼屬性應(yīng)用于作為該類別的一部分的所有場(chǎng)景;2.)場(chǎng)景編號(hào)的范圍-包括部分 重編碼的場(chǎng)景的開始和結(jié)束;3.)版本-正在執(zhí)行的重編碼的版本,具有進(jìn)度狀態(tài)信息(復(fù) 選框提供了用于選擇在壓縮師看來適合或解決所有視頻偽像的版本的方法);以及4.)幀 范圍_在該范圍中應(yīng)用重編碼屬性。這樣,用戶界面700顯示針對(duì)鏡頭/場(chǎng)景或幀的版本 指示的歷史。區(qū)段704示出了隨時(shí)間發(fā)展的、用于解決共同的重編碼問題的的預(yù)先設(shè)置的 列表,例如,預(yù)先設(shè)置修補(bǔ)庫122。這些預(yù)先設(shè)置用作可以與其他壓縮師/用戶一同使用或 共享來加速解決問題的重編碼工具箱。區(qū)段706示出了能夠分配的類別名稱,以及能夠與類別相關(guān)聯(lián)以更好理解類別的作用的附加文本數(shù)據(jù)。區(qū)段708示出了能夠應(yīng)用于解決視頻 偽像的重編碼參數(shù)名稱的列表。在區(qū)段708中示出的濾波器或重編碼參數(shù)屬于在區(qū)段704 中選擇的預(yù)先設(shè)置,并且隨著選擇不同的預(yù)先設(shè)置,該列表會(huì)改變。區(qū)段710是用戶能夠選 擇正在應(yīng)用的重編碼參數(shù)的強(qiáng)度的區(qū)段。區(qū)段712包括開始所選重編碼或開始迄今還沒有 進(jìn)行的所有重編碼的按鈕。使用圖6和7的界面600、700,對(duì)在區(qū)段702中選擇的鏡頭/場(chǎng)景執(zhí)行重編碼(如 以上步驟212所述),并且然后經(jīng)由視頻播放器124來回放重編碼版本,并經(jīng)由比較器126 將該重編碼版本與所選鏡頭/場(chǎng)景的先前版本進(jìn)行比較(如以上步驟214所述),以驗(yàn)證視 頻或重編碼質(zhì)量。在一個(gè)實(shí)施例中,經(jīng)由視頻播放器124,通過在分屏中顯示這些視頻,來 在視覺上比較重編碼版本和先前版本。在另一實(shí)施例中,還能夠通過選擇/檢查具體版本 702,以及在視覺上區(qū)分針對(duì)該鏡頭/場(chǎng)景版本的、圖6的陰影部分606中的數(shù)據(jù),來對(duì)比較 數(shù)據(jù)(也稱作元數(shù)據(jù))進(jìn)行比較,例如,比較數(shù)據(jù)(也稱作元數(shù)據(jù))是平均比特率級(jí)別、編 碼幀類型、峰值信噪比(PSNR)等,界面600可以用作比較器126。這里,通過在視頻版本之 間進(jìn)行選擇,界面600在針對(duì)每個(gè)版本的元數(shù)據(jù)之間來回切換,以用于用戶或壓縮師的視 覺檢查。例如,用戶能夠在視頻的兩個(gè)不同版本之間來回切換,觀察每個(gè)視頻的PSNR數(shù)據(jù), 其中,PSNR越高,視頻質(zhì)量越好。圖8示出了用于在場(chǎng)景級(jí)別上選擇附加的重編碼設(shè)置屬性的界面800。在區(qū)段802 中,選擇場(chǎng)景級(jí)別節(jié)點(diǎn)。示出了正被重編碼的場(chǎng)景的場(chǎng)景編號(hào)。區(qū)段804示出了對(duì)關(guān)于正 被重編碼的場(chǎng)景的文本數(shù)據(jù)進(jìn)行關(guān)聯(lián)的區(qū)域。區(qū)段806提供所有選項(xiàng)的列表,以在具體場(chǎng) 景的不同階段或版本之間進(jìn)行選擇和比較。該列表包括源版本-這是場(chǎng)景的實(shí)際源攝取版本_這是場(chǎng)景的攝取版本編碼版本一這是場(chǎng)景大的第一編碼版本重編碼版本X. YY-這些是壓縮師請(qǐng)求的重編碼。X. YY示出了重編碼的產(chǎn)生和歷 史。X是主要版本,而YY示出了次要版本。使用X.YY版本指示,用戶能夠得出重編碼的進(jìn) 度。例如,版本化學(xué)的一種表示如下版本1. 00-利用特定重編碼參數(shù)來重編碼的第一嘗試。版本1. 10-利用以上參數(shù)并具有一些附加或其他改進(jìn)的重編碼的第二嘗試。版本 1. 00是父輩,提供了開始重編碼的實(shí)際參數(shù)集合。版本1. 11 一嘗試?yán)靡恍└郊訁?shù)進(jìn)一步改進(jìn)版本1. 10。版本2. 00-利用不同的重編碼參數(shù)集合的重編碼新嘗試。以上示例還示出了用戶如何能夠推斷隨后的重編碼進(jìn)度,以提高編碼質(zhì)量。這允 許用戶更好地理解重編碼過程,并通過針對(duì)相同場(chǎng)景同時(shí)嘗試不同的重編碼集合,來快速 縮小范圍到質(zhì)量編碼,從而提高壓縮師生產(chǎn)率并提高質(zhì)量。選擇版本中的任意兩個(gè)版本,允 許壓縮師使用分屏集成視頻播放器124,來一起比較重編碼版本。這樣,能夠容易發(fā)現(xiàn)和選 擇版本之間的質(zhì)量提高,從而提高最終編碼視頻流。再次參照?qǐng)D8,區(qū)段808提供發(fā)起分屏模式的視頻播放器的按鈕,該分屏模式用于 比較在區(qū)段806中選擇的兩個(gè)版本。區(qū)段810中提供的按鈕發(fā)起全屏模式的視頻播放器, 播放所選場(chǎng)景的攝取或重編碼視頻流。
11
圖9示出了用于在版本級(jí)別上選擇附加的重編碼設(shè)置屬性的界面900。區(qū)段902 提供各種鏡頭/場(chǎng)景的版本(例如,版本X. YY)的列表。這些是壓縮師要求的重編碼。X. YY 示出了重編碼的產(chǎn)生和歷史。X是主要版本,而YY示出了次要版本。使用X.YY,用戶能夠 得出重編碼的進(jìn)度。圖9的區(qū)段904允許用戶將附加文本數(shù)據(jù)與所選版本相關(guān)聯(lián)。圖10示出了用于在幀范圍級(jí)別上選擇附加重編碼設(shè)置屬性的界面1000。區(qū)段 1002示出了會(huì)利用所選的具體場(chǎng)景來重編碼的幀編號(hào)。使用如關(guān)于圖5和6描述的選擇 用于重編碼的鏡頭/場(chǎng)景的以上表示之一,來確定該選擇。區(qū)段1004示出了預(yù)先設(shè)置的列 表,例如預(yù)先設(shè)置修補(bǔ)庫122,這些預(yù)先設(shè)置隨時(shí)間發(fā)展并能夠用于應(yīng)用到幀以解決共同的 重編碼偽像。這些預(yù)先設(shè)置能夠與其他用戶共享。區(qū)段1006允許用戶添加附加的幀范圍。 這使得壓縮師能夠定制不同的重編碼參數(shù)并將其應(yīng)用到原始所選范圍選擇內(nèi)的特定幀。區(qū) 段1008使得用戶能夠?qū)?dāng)前所選的重編碼參數(shù)集合應(yīng)用(拷貝)至類別級(jí)別。這樣,壓縮 師能夠容易地將修補(bǔ)的測(cè)試版本應(yīng)用于類似問題的鏡頭/場(chǎng)景的整個(gè)類別。區(qū)段1010提 供能夠應(yīng)用于幀范圍級(jí)別的重編碼參數(shù)的列表,并且區(qū)段1012使得壓縮師能夠選擇場(chǎng)景 類型。壓縮師能夠選擇或改變重編碼參數(shù)的強(qiáng)度。參照?qǐng)D11,示出了用于創(chuàng)建和應(yīng)用用戶產(chǎn)生的編碼參數(shù)集合或編碼參數(shù)的預(yù)先設(shè) 置。首先,在步驟1102中,如以上關(guān)于圖4所述,導(dǎo)入視頻內(nèi)容。接著,在步驟1104中,偽像 檢測(cè)器125確定視頻內(nèi)容中是否存在視頻偽像。如果視頻內(nèi)容中不存在偽像,并且對(duì)于所 有鏡頭/場(chǎng)景編碼和重編碼是令人滿意的,則將無視頻偽像的最終編碼視頻存儲(chǔ)在例如存 儲(chǔ)設(shè)備127中,并可以獲取該最終編碼視頻用于回放(步驟1118)。否則,在步驟1106中, 通過確定的偽像的類別/嚴(yán)重性,對(duì)鏡頭/場(chǎng)景進(jìn)行分組。如上關(guān)于圖5所述,鏡頭/場(chǎng)景 的分組可以是手動(dòng)的,或者如下關(guān)于圖13所述可以是自動(dòng)的。在步驟1108中,確定是否對(duì) 所有偽像進(jìn)行了分組或分類,并且如果為否,則方法返回步驟1106,以嘗試對(duì)剩余的偽像進(jìn) 行分組,或者為剩余偽像創(chuàng)建新分類。一旦對(duì)偽像進(jìn)行了分組或分類,在步驟1110中,確定針對(duì)偽像的特定組或分類 是否存在重編碼參數(shù)的預(yù)先設(shè)置。參照?qǐng)D12,示出了界面700的另一視圖,以說明用戶 或壓縮師如何從偽像的類別中進(jìn)行選擇,并應(yīng)用針對(duì)該類別的預(yù)先設(shè)置。如上所述,用 戶或壓縮師能夠在區(qū)段704中查看現(xiàn)有的預(yù)先設(shè)置。這里,將存儲(chǔ)在預(yù)先設(shè)置修補(bǔ)庫 122中的預(yù)先設(shè)置列表1202顯示為來自區(qū)段704的下拉菜單。根據(jù)用戶經(jīng)驗(yàn)、分類的鏡 頭/場(chǎng)景的視覺或分析(元數(shù)據(jù))圖6確認(rèn),壓縮師可以基于例如如列表1202中所示 的 LightBlockingArti fact λ MediumBlockingArtifact 或 SevereBlockingArtifact 等 較輕、中等或嚴(yán)重偽像(或任何其他強(qiáng)度類別),來選擇預(yù)先設(shè)置的強(qiáng)度。壓縮師還可以 使用特定的預(yù)先設(shè)置作為開始點(diǎn),并適當(dāng)調(diào)整所應(yīng)用的預(yù)先設(shè)置,來顯著減少偽像的出 現(xiàn),提高視頻的質(zhì)量。如果確定能夠使用現(xiàn)有的預(yù)先設(shè)置,用戶在區(qū)段702中選擇要修補(bǔ) 的分類,例如,Dark Noise Scenes (暗噪聲場(chǎng)景)、Banding Scenes (條帶化場(chǎng)景)、Dark Noise+BandingSceneiK暗噪聲+條帶化場(chǎng)景)等,然后從在區(qū)段704中提供的列表1202 中選擇并應(yīng)用適當(dāng)?shù)念A(yù)先設(shè)置(步驟1114)。在圖12所示的示例中。已經(jīng)選擇預(yù)先設(shè)置 MediumBandingArtifact (中等條帶化偽像),并且在區(qū)段708中列出了與所選預(yù)先設(shè)置 1204相關(guān)聯(lián)的重編碼參數(shù)。如果不存在針對(duì)具體分組或分類的預(yù)先設(shè)置,則在步驟1112中,用戶能夠創(chuàng)建新的視頻偽像預(yù)先設(shè)置。在圖7的區(qū)段706中,能夠分配分類名稱,并將附加文本數(shù)據(jù)與新的 預(yù)先設(shè)置相關(guān)聯(lián)。在區(qū)段708中,用戶從將被分配至新創(chuàng)建的預(yù)先設(shè)置的重編碼參數(shù)的列 表中進(jìn)行選擇。在步驟1116中,確定是否解決了偽像。如果視頻內(nèi)容中不存在偽像,并且對(duì)于所 有鏡頭/場(chǎng)景的編碼和重編碼是令人滿意的,則將無視頻偽像的最終編碼視頻存儲(chǔ)在例如 存儲(chǔ)設(shè)備127中,并可以獲取最終編碼視頻用于回放(步驟1118)。否則,該方法返回至步 驟1106,以嘗試分類和解決任何剩余的偽像。現(xiàn)在參照?qǐng)D13,描述用于偽像分類的方法。首先,在步驟1302中,如上關(guān)于圖4所 述,導(dǎo)入視頻內(nèi)容。然后,在步驟1304中,產(chǎn)生視頻編碼/重編碼偽像數(shù)據(jù)。在編碼過程期 間,經(jīng)由偽像檢測(cè)器125,使數(shù)字視頻內(nèi)容經(jīng)歷一系列編碼偽像檢測(cè)算法或函數(shù)。這些偽像 檢測(cè)算法或函數(shù)專用于找到在高清視頻編碼中找到的最顯著的視頻偽像,例如,條帶化、暗 噪聲或同時(shí)具有條帶化和暗噪聲。在整個(gè)編碼/編碼后的視頻上完全運(yùn)行了這些偽像算法 或函數(shù)之后,基于找到的偽像的嚴(yán)重性,向在編碼鏡頭/場(chǎng)景中找到的偽像分配一定范圍 的值。這些值可以是對(duì)偽像的存在的顯著性進(jìn)行量化的值。此時(shí),系統(tǒng)100能夠基于偽像 的嚴(yán)重性,例如較輕、中等或嚴(yán)重的暗噪聲偽像,確定相對(duì)于為偽像設(shè)置的閾值的偽像的程 度、相對(duì)于其他類型偽像的權(quán)重,然后適當(dāng)?shù)貙⑺鼈兎诸惖筋A(yù)定類型中,以用于進(jìn)一步視覺 改善以及解譯。盡管為了視頻內(nèi)容的簡(jiǎn)單性和連續(xù)性,一個(gè)鏡頭/場(chǎng)景可能僅屬于一個(gè)偽 像類別,即,例如,條帶化等特定偽像類別,然而鏡頭/場(chǎng)景可以包含若干類型的偽像。換言 之,當(dāng)考慮分類時(shí),一個(gè)偽像的顯著性可以使鏡頭/場(chǎng)景中的其他偽像相形見絀。備選地, 例如,基于修補(bǔ)的預(yù)先設(shè)置或一些其他用戶定義參數(shù),可以將鏡頭/場(chǎng)景分類到在支持多 個(gè)偽像的類別下,這多個(gè)偽像在邏輯上是分組到一起的。在步驟1306中,確定針對(duì)所選鏡頭/場(chǎng)景的偽像值是否大于預(yù)定閾值。如果針對(duì) 特定鏡頭/場(chǎng)景的偽像值在預(yù)定閾值以下,則在步驟1310中通過類型對(duì)偽像進(jìn)行分類。否 則,在步驟1308中,首先基于偽像閾值對(duì)偽像進(jìn)行分類,然后在步驟1310中通過偽像類型 對(duì)偽像進(jìn)行分類。基于以上分類規(guī)則,自動(dòng)對(duì)鏡頭/場(chǎng)景進(jìn)行分類,以提醒用戶注意,并在 圖5的區(qū)段508的適當(dāng)類別中顯示鏡頭/場(chǎng)景。應(yīng)當(dāng)認(rèn)識(shí)到,壓縮師也可以向這些偽像類 別手動(dòng)追加適合邏輯類別描述的鏡頭/場(chǎng)景。此外,一旦對(duì)鏡頭/場(chǎng)景進(jìn)行了分類,則圖5 的界面500允許壓縮師通過選擇區(qū)段512中的適當(dāng)?shù)膯芜x按鈕,容易地在不同工作流的類 別之間切換,例如,不同工作流是編碼、重編碼等。應(yīng)當(dāng)認(rèn)識(shí)到,在步驟1308中,分類器129可以按照字面確切地考慮閾值,并且通過 基于單個(gè)最嚴(yán)重偽像(例如,條帶化)對(duì)鏡頭/場(chǎng)景進(jìn)行分類,來標(biāo)記鏡頭/場(chǎng)景,以用于 分類。然而,在特定實(shí)施例中,根據(jù)鏡頭/場(chǎng)景具有不同級(jí)別的嚴(yán)重性和權(quán)重的多個(gè)偽像的 可能性,分類器129可以在基于偽像的最終分類之前,考慮所有數(shù)據(jù)的顯著性。例如,步驟 1308的分類還能夠基于總偽像嚴(yán)重性的百分比,例如,在視頻內(nèi)容中具有暗噪聲和條帶化 的最差場(chǎng)景的前5%,從而允許壓縮師在必要時(shí)快速縮小范圍和提高質(zhì)量。一旦對(duì)偽像進(jìn)行了分組或分類,在步驟1312中對(duì)鏡頭/場(chǎng)景進(jìn)行修補(bǔ)或重編碼。 可以通過如上關(guān)于圖11所述的選擇預(yù)先設(shè)置,或者通過選擇單個(gè)重編碼參數(shù),來完成重編 碼。在步驟1314中,確定是否存在要修補(bǔ)或重編碼的剩余鏡頭/場(chǎng)景。如果針對(duì)所有鏡頭 /場(chǎng)景,編碼和重編碼是令人滿意的,則將無視頻偽像的最終編碼視頻存儲(chǔ)在例如存儲(chǔ)設(shè)備127中,并獲取該最終編碼視頻用于回放(步驟1316)。否則,方法返回值步驟1312,以嘗試 分類和解決任何剩余的偽像。已經(jīng)描述了利用版本化對(duì)視頻進(jìn)行重編碼的系統(tǒng)和方法。該系統(tǒng)和方法實(shí)現(xiàn)和理 解起來簡(jiǎn)單且直觀;提高并增加了對(duì)編碼和重編碼過程的控制,并允許遞增的視頻質(zhì)量提 高/增強(qiáng)、洞察力;以及提供與重編碼修補(bǔ)有關(guān)的歷史。此外,該系統(tǒng)和方法允許用戶隨時(shí) 間保存和開發(fā)庫/知識(shí)庫,并且針對(duì)快速吞吐量實(shí)現(xiàn)了多個(gè)編碼工作上的可再用性或與其 他用戶的可再用性;以及提供對(duì)數(shù)字工作流/工具過程的效果(例如,攝取、濾波、編碼或重 編碼)的更好理解,以及對(duì)比較和解決壓縮的視頻輸出內(nèi)的質(zhì)量問題/偽像的理解。此外, 本發(fā)明的系統(tǒng)和方法減少了完成固定的特征編碼所需的用戶時(shí)間/工時(shí),并獲得增加的生 產(chǎn)率和吞吐量。盡管這里詳細(xì)示出并描述了結(jié)合本發(fā)明教導(dǎo)的實(shí)施例,但是本領(lǐng)域技術(shù)人員可以 容易設(shè)想仍結(jié)合這些教導(dǎo)的許多其他變化的實(shí)施例。已經(jīng)描述了用于對(duì)視頻進(jìn)行編碼并減 少編碼視頻中的偽像的系統(tǒng)和方法的優(yōu)選實(shí)施例(意在示意而非限制),但是注意,本領(lǐng)域 技術(shù)人員可以根據(jù)以上教導(dǎo)進(jìn)行修改和變型。因此應(yīng)當(dāng)理解,可以在根據(jù)權(quán)利要求概括的 本發(fā)明范圍內(nèi)所公開的本發(fā)明具體實(shí)施例中進(jìn)行改變。
權(quán)利要求
一種用于減少視頻偽像的方法,所述方法包括以下步驟接收源視頻(1102);對(duì)所述源視頻進(jìn)行編碼;在編碼視頻中檢測(cè)不同的至少兩個(gè)偽像(1104);以及基于第一用戶產(chǎn)生編碼參數(shù)集合,對(duì)所述編碼視頻進(jìn)行重編碼,以便移除所述至少兩個(gè)偽像(1114)。
2.根據(jù)權(quán)利要求1所述的方法,還包括確定所述至少兩個(gè)偽像中的每一個(gè)的類別 (1106)。
3.根據(jù)權(quán)利要求2所述的方法,還包括基于所確定的類別之一,選擇第一用戶產(chǎn)生編 碼參數(shù)集合(1110)。
4.根據(jù)權(quán)利要求1所述的方法,還包括確定所述至少兩個(gè)偽像中的每一個(gè)的嚴(yán)重性 (1106)。
5.根據(jù)權(quán)利要求4所述的方法,還包括基于所確定的具有最高嚴(yán)重性的偽像,選擇第 一用戶產(chǎn)生編碼參數(shù)集合(1110)。
6.根據(jù)權(quán)利要求1所述的方法,其中,如果第一用戶產(chǎn)生編碼參數(shù)集合未移除所述至 少兩個(gè)偽像,則產(chǎn)生第二用戶產(chǎn)生編碼參數(shù)集合(1112),所述第二用戶產(chǎn) 生編碼參數(shù)集合 的編碼參數(shù)與所述第一用戶產(chǎn)生編碼參數(shù)集合的編碼參數(shù)不同。
7.一種用于實(shí)現(xiàn)編碼視頻中的偽像減少的方法,所述方法包括以下步驟接收源視頻(1302),所述源視頻具有多個(gè)幀;對(duì)所述源視頻進(jìn)行編碼(1304);確定編碼視頻的所述多個(gè)幀的一部分是否包含第一類型的偽像(1310);顯示具有所述第一類型的偽像的視頻幀;以及使用戶能夠從多個(gè)編碼參數(shù)集合中選擇編碼參數(shù)集合,以在對(duì)編碼視頻進(jìn)行重編碼時(shí) 減少偽像(1312)。
8.根據(jù)權(quán)利要求7所述的方法,還包括確定編碼視頻的所述多個(gè)幀的第二部分是否包含第一類型的偽像;以及如果編碼視頻的所述多個(gè)幀的第二部分包含第一類型的偽像,則將第一和第二部分分 組到單個(gè)偽像類別中(1310)。
9.根據(jù)權(quán)利要求7所述的方法,還包括針對(duì)編碼視頻的所述多個(gè)幀,確定第一類型偽 像的嚴(yán)重性(1304)。
10.根據(jù)權(quán)利要求9所述的方法,其中,如果針對(duì)所述多個(gè)幀的一部分的嚴(yán)重性的值大 于預(yù)定閾值(1306),則顯示嚴(yán)重性比所述預(yù)定閾值大的該部分(1308)。
11.一種用于對(duì)視頻進(jìn)行編碼的系統(tǒng)(100),包括用于源視頻的編碼器(120),所述源視頻具有多個(gè)幀;用于在編碼視頻中檢測(cè)不同的至少兩個(gè)偽像的偽像檢測(cè)器(125);以及多個(gè)用戶產(chǎn)生編碼參數(shù)集合(122),其中,所述編碼器基于至少一個(gè)第一用戶產(chǎn)生編碼參數(shù)集合對(duì)所述編碼視頻進(jìn)行重編 碼,以便移除所述至少兩個(gè)偽像。
12.根據(jù)權(quán)利要求11所述的系統(tǒng)(100),還包括用于確定所述至少兩個(gè)偽像中的每一個(gè)的類別的分類器(129)。
13.根據(jù)權(quán)利要求12所述的系統(tǒng)(100),還包括用戶接口,用于基于所確定的類別之 一,選擇至少一個(gè)第一用戶產(chǎn)生編碼參數(shù)集合。
14.根據(jù)權(quán)利要求11所述的系統(tǒng)(100),其中,偽像檢測(cè)器(125)確定所述至少兩個(gè)偽 像中的每一個(gè)的嚴(yán)重性。
15.根據(jù)權(quán)利要求14所述的系統(tǒng)(100),還包括用戶接口,用于基于所確定的具有最 高嚴(yán)重性的偽像,選擇至少一個(gè)第一用戶產(chǎn)生編碼參數(shù)集合。
16.根據(jù)權(quán)利要求11所述的系統(tǒng)(100),還包括用戶接口,用于產(chǎn)生至少一個(gè)第二用 戶產(chǎn)生編碼參數(shù)集合,所述至少一個(gè)第二用戶產(chǎn)生編碼參數(shù)集合的編碼參數(shù)與所述至少一 個(gè)第一用戶產(chǎn)生編碼參數(shù)集合的編碼參數(shù)不同。
17.根據(jù)權(quán)利要求11所述的系統(tǒng)(100),還包括分類器(129),確定編碼視頻的所述多個(gè)幀的一部分是否包含第一類型的偽像;以及用戶接口,用于顯示具有所述第一類型偽像的視頻幀,并且使用戶能夠從多個(gè)編碼參 數(shù)集合中選擇用戶產(chǎn)生編碼參數(shù)集合,以在對(duì)編碼視頻進(jìn)行重編碼時(shí)減少偽像。
18.根據(jù)權(quán)利要求17所述的系統(tǒng)(100),其中,分類器(129)確定編碼視頻的所述多個(gè) 幀的第二部分是否包含第一類型的偽像,以及,如果編碼視頻的所述多個(gè)幀的第二部分包 含第一類型的偽像,則將第一和第二部分分組到單個(gè)偽像類別中。
19.根據(jù)權(quán)利要求17所述的系統(tǒng)(100),其中,偽像檢測(cè)器(125)針對(duì)編碼視頻的所述 多個(gè)幀,確定第一類型偽像的嚴(yán)重性。
20.根據(jù)權(quán)利要求19所述的系統(tǒng)(100),其中,如果針對(duì)所述多個(gè)幀的一部分的嚴(yán)重性 的值大于預(yù)定閾值,則用戶接口顯示具有比所述預(yù)定閾值大的嚴(yán)重性的該部分。
全文摘要
提供了一種用于對(duì)視頻進(jìn)行編碼并減少編碼視頻中的視頻偽像的系統(tǒng)和方法。本發(fā)明的系統(tǒng)和方法使得用戶能夠簡(jiǎn)單選擇預(yù)先設(shè)置(例如,一組編碼或重編碼參數(shù))來修補(bǔ)或者提供開始點(diǎn)以修補(bǔ)在編碼視頻中出現(xiàn)的視頻偽像(1114)。此外,本發(fā)明的系統(tǒng)和方法標(biāo)記、分類以及組織潛在的與后編碼有關(guān)的視頻質(zhì)量問題(1306、1308、1310),例如在編碼過程期間檢測(cè)(1304)的諸如條帶化、暗噪聲等視頻偽像。通過識(shí)別和分類視頻偽像,該系統(tǒng)和方法使得這些視頻偽像的修補(bǔ)(1312)更容易和更精確,從而提高質(zhì)量、節(jié)省時(shí)間、以及提高性能。
文檔編號(hào)G06T5/00GK101884221SQ200880115841
公開日2010年11月10日 申請(qǐng)日期2008年11月12日 優(yōu)先權(quán)日2007年11月16日
發(fā)明者阿南德·卡普爾 申請(qǐng)人:湯姆森許可貿(mào)易公司