專利名稱:線性平均解交錯的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種線性平均解交錯的方法,特別涉及一種對MPEG-2影像的譯碼方法。
背景技術(shù):
目前多媒體的來源對于我們而言是相當廣泛的,舉凡電視節(jié)目、電影、激光視盤片(VCD)及數(shù)字多功能光盤片(DVD)等等,在這些許多的來源中,我們不乏發(fā)現(xiàn)可以將這些來源大致分為逐行(非交錯式)影像及隔行(交錯式)影像兩大類。這些影像大都跟隨MPEG-2的編碼原則來編碼這些影像。
在MPEG-2的影像編/譯碼的過程中,將交錯式影片內(nèi)容成為解交錯格式(De-interlacing)是目前一般處理的方式,而解交錯格式中比較常見的就是場合并格式(Weave)和單場插值格式(BOB),場合并格式(Weave)是簡單地將兩場的數(shù)據(jù)合為一幀,而單場插值格式(BOB)是用一場的數(shù)據(jù)來生成一幀(Frame)。
顯然,用場合并格式(Weave)的方法生成的幀含有更多的信息量,圖像會更清晰,而單場插值格式(BOB)生成的幀會比較模糊,且對于一些靜止的區(qū)域會出現(xiàn)一定的跳動,比如電視臺的標志(Logo)。當然,場合并格式(Weave)也有其弊端,當視頻宏塊(Macro Block)是基于交錯的(Interlaced),那么場合并格式(Weave)合成的幀圖像中,在運動的區(qū)域往往會出現(xiàn)一些梳狀的瑕疵,又有稱之為老鼠牙(Mice Teeth)。
在一定的程度上,我們可以利用這兩種方法的優(yōu)點,將它們結(jié)合起來,在圖像運動的區(qū)域使用單場插值格式(BOB),從而達到消除老鼠牙的目的,而在圖像相對靜止的區(qū)域使用場合并格式(Weave)從而得到更多的清晰度。這就是所謂的運動自適應式解交錯(motion adaptive de-interlacing)。
如美國專利US6348949中的算法利用數(shù)據(jù)比較的方法來判斷一個區(qū)域的運動情況,這個算法著眼于一列已經(jīng)譯碼過的圖像或者一些無需譯碼的圖像(電視中的應用),所以實現(xiàn)成本相對較高,對系統(tǒng)的內(nèi)存頻寬的要求也比較高。
參閱圖1為常用的譯碼影像視頻流方框圖,包括一音頻/視頻解交錯影像編碼器10,一編碼壓縮音頻/視頻影像102,一音頻/視頻解交錯裝置104,一音頻/視頻解交錯影像譯碼器106,一音頻/視頻譯碼器108,一基于線平均值的解交錯決定單元110,一基于線平均值的解交錯位圖單元112,一宏塊數(shù)據(jù)的子集合信息114,一解壓縮的宏塊的數(shù)據(jù)116,一解壓縮的宏塊數(shù)據(jù)118,一使用線平均值的解交錯位圖的解交錯影像轉(zhuǎn)換單元120及一顯示單元122。
該音頻/視頻解交錯影像編碼器10為一MPEG-2編碼器,根據(jù)MPEG-2標準來編碼交錯式圖形數(shù)據(jù),將該編碼壓縮音頻/視頻影像102傳輸至該音頻/視頻解交錯裝置104內(nèi),該音頻/視頻解交錯裝置104包含音頻/視頻解交錯影像譯碼器106,及使用線平均值的解交錯位圖的解交錯影像轉(zhuǎn)換單元120,該音頻/視頻解交錯影像譯碼器106包括該音頻/視頻譯碼器108,該基于線平均值的解交錯決定單元110,及該基于線平均值的解交錯位圖單元112。
其中該音頻/視頻譯碼器108譯碼階段產(chǎn)生并且輸出該宏塊數(shù)據(jù)的子集合信息114及該解壓縮的宏塊的數(shù)據(jù)116,傳輸給該基于線平均值的解交錯決定單元110。該基于線平均值的解交錯決定單元110產(chǎn)生該基于線平均值的解交錯位圖單元112,該基于線平均值的解交錯位圖單元112包含兩位來代表一圖片的每一個宏塊是否為運動的或非運動的。
該音頻/視頻譯碼器的運動向量截取單元108譯碼該壓縮的宏塊數(shù)據(jù)和輸出解壓縮的宏塊數(shù)據(jù)118,到該使用線平均值位圖的解交錯影像轉(zhuǎn)換單元120,最后將處理過的影像傳送至該顯示單元122上。
發(fā)明內(nèi)容
本發(fā)明即為解決上述現(xiàn)有的缺陷,提出一種線性平均解交錯的方法。
本發(fā)明提供了一種線性平均解交錯的方法,該方法包括譯碼一圖像內(nèi)容成為多個宏塊數(shù)據(jù);計算該多個宏塊數(shù)據(jù)的線性平均值且將該線性平均值成為一判斷值;依據(jù)該判斷值,產(chǎn)生多個解交錯標志;依據(jù)該判斷值將該多個宏塊數(shù)據(jù)間作該時態(tài)延伸動作,實現(xiàn)時態(tài)延伸動作;及執(zhí)行破壞性動作,將該多個孤立的解交錯標志破壞并使之在空間運動上有其相關(guān)性。
根據(jù)上述構(gòu)想,本發(fā)明所述的線性平均解交錯的方法,其中,該圖像內(nèi)容可為一靜態(tài)圖像或一動態(tài)圖像。
根據(jù)上述構(gòu)想,本發(fā)明所述的線性平均解交錯的方法,其中,該線性平均值可分為全模式及半模式兩種計算模式。
根據(jù)上述構(gòu)想,本發(fā)明所述的線性平均解交錯的方法,其中,該判斷值由該線性平均值及該圖像內(nèi)容的對角線所形成。
根據(jù)上述構(gòu)想,本發(fā)明所述的線性平均解交錯的方法,其中,該產(chǎn)生多個解交錯標志步驟中,若線性平均值與判斷值不同時,則產(chǎn)生一解交錯標志且設該宏塊數(shù)據(jù)為單場插值格式,否則產(chǎn)生一解交錯標志且設該宏塊數(shù)據(jù)為場合并格式。
根據(jù)上述構(gòu)想,本發(fā)明所述的線性平均解交錯的方法,其中,該實現(xiàn)時態(tài)延伸動作步驟中,還進一步包括下列步驟設多個標志緩沖器;判斷第一個解交錯標志是否為場合并格式;判斷其余標志緩沖器是否都為單場插值格式;及設定該解交錯標志為衍生單場插值格式。
根據(jù)上述構(gòu)想,本發(fā)明所述的線性平均解交錯的方法,其中,該執(zhí)行破壞性動作步驟中,還進一步包括下列步驟設定該宏塊數(shù)據(jù)的影像垂直及水平大??;計算該影像中當前宏塊附近一定范圍內(nèi)的單場插值格式的數(shù)量值;及設定該解交錯標志為場合并格式。
根據(jù)上述構(gòu)想,本發(fā)明所述的線性平均解交錯的方法,其中,該設定該宏塊數(shù)據(jù)步驟中還包含判斷解交錯標志是否為單場插值格式。
根據(jù)上述構(gòu)想,本發(fā)明所述的線性平均解交錯的方法,其中,該判斷的結(jié)果為是則進行下一個步驟,若所判斷的結(jié)果為否,則還進一步包括下列步驟計算該影像中當前宏塊附近一定范圍內(nèi)的場合并格式的數(shù)量值;檢測計算值是否小于該場合并格式的判斷值;及設定該解交錯標志為單場插值格式。
根據(jù)上述構(gòu)想,本發(fā)明所述的線性平均解交錯的方法,其中,該計算步驟中還包含檢測計算值是否小于該單場插值格式的判斷值。
本發(fā)明的優(yōu)點在于1、本發(fā)明利用編/譯碼流中的宏塊信息來判斷宏塊(Marco Block)級的運動,其是利用了運動的連續(xù)性和相關(guān)性加入了一時態(tài)延伸動作(TemporalExtension)及破壞性動作(Devour)模塊,從而使得判斷更保守,盡量杜絕老鼠牙(Mice Teeth)的現(xiàn)象。
2、本發(fā)明同樣基于數(shù)據(jù)比較,但是不同于現(xiàn)有技術(shù)的是,本發(fā)明將這塊的設計和譯碼器緊密地結(jié)合起來,大大降低了成本以及對統(tǒng)內(nèi)存頻寬的要求,自適應的閥值調(diào)節(jié)使得判斷更趨合理。
圖1為常用的譯碼影像視頻流方框圖;圖2為本發(fā)明的線性平均解交錯的方法流程圖;圖3為本發(fā)明的產(chǎn)生多個解交錯標志流程圖;圖4為本發(fā)明的時態(tài)延伸動作流程圖;及圖5為本發(fā)明的破壞性動作流程圖。
其中,附圖標志說明如下10音頻/視頻解交錯影像編碼器102編碼壓縮音頻/視頻影像104音頻/視頻解交錯裝置106音頻/視頻解交錯影像譯碼器108音頻/視頻譯碼器110基于線平均值的解交錯決定單元112基于線平均值的解交錯位圖單元114宏塊數(shù)據(jù)的子集合信息116解壓縮的宏塊的數(shù)據(jù)118解壓縮的宏塊數(shù)據(jù)120使用線平均值位圖的解交錯影像轉(zhuǎn)換單元122顯示單元具體實施方式
為了能更進一步了解本發(fā)明為達到目的所采取的技術(shù)、手段及功效,請參閱以下有關(guān)本發(fā)明的詳細說明與附圖,相信本發(fā)明的目的、特征與特點,當可由此得一深入且具體的了解,然而所附附圖僅提供參考與說明用,并非用來對本發(fā)明加以限制。
參閱圖2為本發(fā)明的線性平均解交錯的方法流程圖,該方法包括將圖像內(nèi)容譯碼成為多個宏塊數(shù)據(jù)(S200),將該多個宏塊數(shù)據(jù)中計算線性平均值并成為一判斷值(S202),依據(jù)該判斷值來判斷該圖像內(nèi)容是否為活動的(S204),若判斷的結(jié)果為是,將所得的該判斷值作為多個解交錯標志產(chǎn)生的依據(jù)(S206)實現(xiàn)時態(tài)延伸動作(Temporal Extension)(S208);及執(zhí)行破壞性動作(Devour)(S210)。
線性平均值在發(fā)光映像點的同一垂直或水平線上得到平均值。對于幀圖片結(jié)構(gòu)的視頻流而言,本發(fā)明有全模式(Full mode)及半模式(Half mode)兩種模式去計算該線性平均值。在全模式中,對于每一宏塊數(shù)據(jù),本發(fā)明將計算對每一水平線和每一垂直線的平均值;在半模式中,對于每一宏塊數(shù)據(jù),本發(fā)明將計算在水平和垂直方向各一半的平均值,本發(fā)明會計算發(fā)光的線性平均值。本發(fā)明使用一個字節(jié)去儲存每一線性平均值,如此對全模式而言,每一宏塊數(shù)據(jù)本發(fā)明需要32個字節(jié)組去儲存線性平均值,對半模式而言,每一宏塊數(shù)據(jù)本發(fā)明需要16個字節(jié)組去儲存線性平均值。
對于場景圖片結(jié)構(gòu),本發(fā)明會計算底部場景的線性平均值,對于兩個宏塊數(shù)據(jù),本發(fā)明將使用一個宏塊數(shù)據(jù)去產(chǎn)生兩個解交錯標志,在水平方向,本發(fā)明對第一個宏塊數(shù)據(jù)計算第一個8個線性平均值,及對第二個宏塊數(shù)據(jù)計算第二個8個線性平均值,在垂直方向,本發(fā)明對兩個宏塊數(shù)據(jù)計算16個線性平均值。
當在目前宏塊數(shù)據(jù)譯碼時,該宏塊數(shù)據(jù)的32(或16)字節(jié)平均數(shù)據(jù)將會不同于在先前譯碼圖片的個別的宏塊數(shù)據(jù)的32(或16)字節(jié)平均數(shù)據(jù),(在視頻流中的第一個圖片,因缺少先前譯碼的圖片,所以本發(fā)明將會設為初始值。)這個不同處將會與一判斷值作為比較,假如差值的絕對值超過該判斷值,本發(fā)明將會考慮個別的宏塊數(shù)據(jù)是活動的,及設定目前宏塊數(shù)據(jù)的解交錯標志為單場插值格式(BOB),否則本發(fā)明將會考慮個別的宏塊數(shù)據(jù)為非活動的,及設定目前宏塊數(shù)據(jù)的解交錯標志為場合并格式(Weave)。
之后本發(fā)明將會更新包含先前平均值的目前線性平均值到一緩沖區(qū)內(nèi),本發(fā)明需要對每一個宏塊數(shù)據(jù)有2個位去儲存解交錯標志,本發(fā)明需要至少36×45×32字節(jié)組去儲存在先前圖片的每一宏塊數(shù)據(jù)的線性平均值,此后該解交錯標志將被使用于連續(xù)顯示上,所以本發(fā)明需要三個45×36×2位緩沖器去儲存那些標志。
本發(fā)明使用線性平均值和映像點數(shù)據(jù)在對角線(從(0,0)到(15,15))去判斷目前宏塊數(shù)據(jù)的影像內(nèi)容是否為活躍的,通常假如內(nèi)容是活動的,本發(fā)明將會增加判斷值,否則將會減少該判斷值。
參閱圖3為本發(fā)明的產(chǎn)生多個解交錯標志流程圖,包括判斷對角線的對均值的絕對差異總和(Sum of the absolute difference to the Mean;SADM)是否小于第一判斷值(S300),若判斷結(jié)果為否,則將垂直判斷值設為高判斷值及水平判斷值設為高判斷值(S304),若判斷結(jié)果為是,則判斷水平線平均值的對均值的絕對差異總和(SAMD)是否小于第二判斷值(S302),若判斷結(jié)果為否,則將垂直判斷值設為高判斷值(S306),若判斷結(jié)果為是,則將垂直判斷值設為低判斷值(S308),接著判斷垂直線平均值的對均值的絕對差異總和(SAMD)是否小于第二判斷值(S310),若判斷結(jié)果為否,則將水平判斷值設為高判斷值(S312),若判斷結(jié)果為是,則將水平判斷值設為低判斷值(S308)。
參閱圖4為本發(fā)明的時態(tài)延伸動作流程圖,包括設多個標志緩沖器(S400),判斷第一解交錯標志是否為場合并格式(Weave)(S402),若判斷結(jié)果為否,則結(jié)束本流程,若判斷結(jié)果為是,則進一步判斷其余解交錯標志緩沖器是否存在一定數(shù)量的單場插值格式(BOB)(S404),若判斷結(jié)果為否,則結(jié)束本流程,若判斷結(jié)果為是,則將該解交錯標志設為衍生單場插值格式(BOB2)。
參閱圖5為本發(fā)明的破壞性動作流程圖,包括設定宏塊數(shù)據(jù)的影像垂直大小(S500),設定宏塊數(shù)據(jù)的影像水平大小(S502),判斷解交錯標志是否為單場插值格式(S504),若判斷結(jié)果為是,則計算該影像中當前宏塊附近一定范圍內(nèi)的單場插值格式的數(shù)量值(S506),檢測計算值是否小于該單場插值格式的判斷值(S508),將解交錯標志設為場合并格式(S510)。
其中在該判斷解交錯標志是否為單場插值格式(S504)中,若所判斷的結(jié)果為否,則計算該影像中當前宏塊附近一定范圍內(nèi)的場合并格式的數(shù)量值(S512),檢測計算值是否小于該場合并格式的判斷值(S514),將解交錯標志設為衍生單場插值格式(S516)。
上述所揭示的附圖、說明,僅為本發(fā)明的實施例而已,凡本領(lǐng)域技術(shù)人員當可依據(jù)上述的說明作其它種種的改良,而這些改變?nèi)詫儆诒景l(fā)明的發(fā)明精神及以下所界定的權(quán)利要求范圍中。
權(quán)利要求
1.一種線性平均解交錯的方法,該方法包括譯碼一圖像內(nèi)容成為多個宏塊數(shù)據(jù);計算該多個宏塊數(shù)據(jù)的線性平均值且將該線性平均值成為一判斷值;依據(jù)該判斷值,產(chǎn)生多個解交錯標志;依據(jù)該判斷值將該多個宏塊數(shù)據(jù)間作該時態(tài)延伸動作,實現(xiàn)時態(tài)延伸動作;及執(zhí)行破壞性動作,將該多個孤立的解交錯標志破壞并使之在空間運動上有其相關(guān)性。
2.如權(quán)利要求1所述的線性平均解交錯的方法,其特征在于,該圖像內(nèi)容可為一靜態(tài)圖像或一動態(tài)圖像。
3.如權(quán)利要求1所述的線性平均解交錯的方法,其特征在于,該線性平均值可分為全模式及半模式兩種計算模式。
4.如權(quán)利要求1所述的線性平均解交錯的方法,其特征在于,該判斷值是由該線性平均值及該圖像內(nèi)容的對角線所形成。
5.如權(quán)利要求1所述的線性平均解交錯的方法,其特征在于,該產(chǎn)生多個解交錯標志步驟中,若線性平均值與判斷值不同時,則產(chǎn)生一解交錯標志且設該宏塊數(shù)據(jù)為單場插值格式,否則產(chǎn)生一解交錯標志且設該宏塊數(shù)據(jù)為場合并格式。
6.如權(quán)利要求1所述的線性平均解交錯的方法,其特征在于,該實現(xiàn)時態(tài)延伸動作步驟中,還進一步包括下列步驟設多個標志緩沖器;判斷第一個解交錯標志是否為場合并格式;判斷其余標志緩沖器是否都為單場插值格式;及設定該解交錯標志為衍生單場插值格式。
7.如權(quán)利要求1所述的線性平均解交錯的方法,其特征在于,該執(zhí)行破壞性動作步驟中,還進一步包括下列步驟設定該宏塊數(shù)據(jù)的影像垂直及水平大?。挥嬎阍撚跋裰挟斍昂陦K附近一定范圍內(nèi)的單場插值格式的數(shù)量值;及設定該解交錯標志為場合并格式。
8.如權(quán)利要求7所述的線性平均解交錯的方法,其特征在于,該設定該宏塊數(shù)據(jù)步驟中還包含判斷解交錯標志是否為單場插值格式。
9.如權(quán)利要求8所述的線性平均解交錯的方法,其特征在于,該判斷的結(jié)果為是則進行下一個步驟,若所判斷的結(jié)果為否,則還進一步包括下列步驟計算該影像中當前宏塊附近一定范圍內(nèi)的場合并格式的數(shù)量值;檢測計算值是否小于該場合并格式的判斷值;及設定該解交錯標志為單場插值格式。
10.如權(quán)利要求7所述的線性平均解交錯的方法,其特征在于,該計算步驟中還包含檢測計算值是否小于該單場插值格式的判斷值。
全文摘要
本發(fā)明為一種線性平均解交錯的方法,該方法包括將圖像內(nèi)容譯碼成多個宏塊數(shù)據(jù),由該多個宏塊數(shù)據(jù)計算線性平均值且成為一判斷值,由該判斷值產(chǎn)生多個解交錯標志,實現(xiàn)時態(tài)延伸動作及執(zhí)行破壞性動作。該時態(tài)延伸動作包括設多個解交錯標志緩沖器,判斷第一個解交錯標志是否為場合并格式,判斷其余解交錯標志緩沖器是否為單場插值格式,及設定該解交錯標志為衍生單場插值格式。該破壞性動作包括判斷解交錯標志是否為單場插值格式。本發(fā)明利用編/譯碼流中的宏塊信息判斷宏塊級的運動,利用運動的連續(xù)性和相關(guān)性加入時態(tài)延伸動作及破壞性動作模塊,盡量杜絕老鼠牙現(xiàn)象,降低成本以及對統(tǒng)內(nèi)存頻寬的要求,并且自適應閥值調(diào)節(jié)使得判斷更合理。
文檔編號H04N7/01GK1662050SQ200410006718
公開日2005年8月31日 申請日期2004年2月26日 優(yōu)先權(quán)日2004年2月26日
發(fā)明者陳岳勇, 朱健 申請人:揚智科技股份有限公司