亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種視頻編解碼中去塊濾波方法

文檔序號:7562510閱讀:296來源:國知局
專利名稱:一種視頻編解碼中去塊濾波方法
技術領域
本發(fā)明涉及視頻處理領域,更具體地,涉及視頻編解碼領域。
背景技術
H. 264是ITU-T/IS0在2003年公布的最新的國際視頻壓縮編碼標準,它大大提高 了編碼效率,其中一個重要原因是在編解碼環(huán)路中引入了去塊濾波。去塊濾波也給視頻壓 縮編碼帶來了很大的計算量,對于高清視頻,去塊濾波占用了大約38%的計算時間。在多核 /眾核處理器上,對去塊濾波任務并行化,成為性能提高的重要途徑。目前存在的并行方法,一般是在處理單元比較少的多核處理器上進行宏塊級并 行,即利用處理器提供的指令,直接將不相關的宏塊分配給不同的處理單元。每個宏塊在處 理之前,需要等待其相關宏塊處理完畢,這樣就需要一些額外的同步耗費。當在處理單元比 較多的眾核處理器上采用該并行方案時,并行度比較小,不能充分利用那么多的處理單元, 導致多個處理單元空閑,同時宏塊之間的同步耗費也大大降低了去塊濾波的速度。為了保證編碼和解碼中的去塊濾波過程完全一致,編解碼圖像的去塊濾波運算必 須按照一定順序進行。首先,對于宏塊內部,在分別對每個宏塊的亮度邊界和色度邊界進行 處理的過程中,根據現(xiàn)有技術邊界處理順序為由左向右,由上向下,并且先處理豎直邊界。 圖Ia示出了 16*16亮度數據,如圖所示,圖中黑色線條所示的亮度邊界處理先后順序依次 為左邊第1條、第2條、第3條、第4條、上邊第1條、第2條、第3條、第4條;圖Ib示出了 8*8色度數據,類似地,圖中黑色線條所示的色度邊界的處理先后順序依次為左邊第1條、 第2條、上邊第1條、第2條。其次,每幀圖像中的宏塊按照光柵掃描順序進行處理,編碼和 解碼過程都需要按照這個順序。由于如上所述的宏塊內部邊界的濾波順序以及整個圖像的宏塊處理順序,當前的 宏塊和臨近的左宏塊、上宏塊和右上宏塊三個臨近宏塊相關,如圖2所示。由此在對當前宏 塊濾波前,需要對這三個相關宏塊濾波。在去塊濾波的宏塊級并行方案中,直接將不相關的宏塊分配給不同的處理單元進 行同時濾波。圖3示出了現(xiàn)有技術中宏塊處理時間順序,其中每個方塊代表幀圖像中的一 個宏塊,數字代表該宏塊的時間戳,具有相同數字的宏塊可以并行處理。如圖3所示,在開 始濾波時,每過兩個時間戳,并行度加一。如果處理單元數目足夠多,幀圖像高度和寬度上 的宏塊數分別為H和W,則最大并行度為min(Ceil (ff/2),H),其中min表示取最小值,ceil 表示返回大于或者等于指定表達式的最小整數。如果對于當前宏塊,其一個相關宏塊所造 成的同步耗費為C,那么整個幀圖像的同步耗費近似于3*W*H*C。

發(fā)明內容
本發(fā)明的目的在于克服上述現(xiàn)有技術中的并行度小、同步耗費大以及濾波速度慢 的問題。根據本發(fā)明的一個方面,提供了一種視頻編解碼中去塊濾波方法,在對宏塊進行濾波時,亮度邊界處理順序為右邊第4條、右邊第3條、右邊第2條、上邊第1條、上邊第2 條、上邊第3條、上邊第4條、右邊第1條;色度邊界處理順序為右邊第2條、上邊第1條、上 邊第2條、右邊第1條。在上述方法中,處理器可以動態(tài)獲取待濾波的宏塊,也可以靜態(tài)獲取待濾波的宏 塊。根據本發(fā)明的另一方面,還提供一種視頻編解碼中去塊濾波方法,所述方法包括 下列步驟1)將每個宏塊的未處理的相關宏塊的數量存儲到條件矩陣;2)將所述條件矩陣中數字“0”的對應宏塊的坐標放入等待隊列,同時將該數字更 改為負,其中所述等待隊列用于存儲待濾波宏塊的坐標;3)空閑的處理單元從所述等待隊列獲得待濾波宏塊的坐標,對待濾波宏塊進行濾 波,并更新所述條件矩陣,所述濾波時,亮度邊界處理順序為右邊第4條、右邊第3條、右邊 第2條、上邊第1條、上邊第2條、上邊第3條、上邊第4條、右邊第1條;色度邊界處理順序 為右邊第2條、上邊第1條、上邊第2條、右邊第1條;4)判斷條件矩陣中是否還有數字“0”,如果還有,則轉到步驟3,否則結束。本發(fā)明可以利用更多的空閑處理單元,使得同步耗費相比于現(xiàn)有技術明顯減少; 另外,各個宏塊在濾波前,只需要和更少的宏塊進行同步通信,減少了額外操作,進一步加 快了整體濾波速度。


圖Ia和圖Ib分別是現(xiàn)有技術中亮度邊界和色度邊界的處理順序示意圖;圖2是現(xiàn)有技術中相關宏塊示意圖;圖3是現(xiàn)有技術中宏塊處理時間順序示意圖;圖4是根據本發(fā)明一個優(yōu)選實施例的亮度邊界和色度邊界的處理順序示意圖;圖5是根據本發(fā)明一個優(yōu)選實施例的相關宏塊示意圖;圖6是根據本發(fā)明一個優(yōu)選實施例的宏塊處理時間順序示意圖;圖7是根據本發(fā)明一個優(yōu)選實施例的去塊濾波過程示意圖。
具體實施例方式為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖,對根據本發(fā) 明一個優(yōu)選實施例的視頻編解碼中去塊濾波方法進一步詳細說明。應當理解,此處所描述 的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。在本發(fā)明中,通過更改宏塊內部邊界的濾波順序,來改變宏塊之間的相關性,但這 樣并沒有更改整個幀圖像中的邊界濾波順序,并且不影響視頻的質量。如圖如所示,根據 本發(fā)明的優(yōu)選實施例,在對每個宏塊的亮度邊界進行處理的過程中,邊界處理順序為右邊 第4條、右邊第3條、右邊第2條、上邊第1條、上邊第2條、上邊第3條、上邊第4條、右邊 第1條;如圖4b所示,在對每個宏塊的色度邊界進行處理的過程中,邊界處理順序為右邊第 2條、上邊第1條、上邊第2條、右邊第1條。由于宏塊內部邊界的濾波順序的修改,宏塊之間的相關性下降,如圖5所示,當前宏塊只和臨近的左宏塊和上宏塊相關。在對當前宏塊濾波前,需要對這兩個相關宏塊進行 濾波。圖6示出了根據本發(fā)明的一個優(yōu)選實施例減少了宏塊之間的相關性之后的宏塊 處理時間順序。與圖3類似地,每個方塊代表幀圖像中的宏塊,數字代表時間戳,具有相同 數字的宏塊可以并行處理。如圖6所示,在開始濾波時,每過一個時間戳,并行度加一,比現(xiàn) 有方法中并行度增加得更快。如果處理單元數目足夠多,幀圖像高度和寬度上的宏塊數分 別為H和W,最大并行度為min (W,H),其大于等于現(xiàn)有技術的最大并行度。如果對于當前宏 塊,其一個相關宏塊所造成的同步耗費為C,那么整個幀圖像的同步耗費近似于2*W*H*C。由此,本發(fā)明可以允許更多的非相關宏塊在處理器上并行濾波,較好地利用空閑 處理單元,使得同步耗費相比于現(xiàn)有技術明顯減少;另外,各個宏塊在濾波前,只需要和更 少的宏塊進行同步通信,減少了額外操作,加快了整體濾波速度。下面結合圖7詳細描述根據本發(fā)明優(yōu)選實施例的視頻編解碼中去塊濾波方法,該 方法具體包括如下步驟1)初始化條件矩陣,條件矩陣用于記錄每個宏塊的狀態(tài),該矩陣中的每個數字表 示其對應的宏塊還需要等待多少個宏塊處理之后才能進行處理,也就是表示其對應的宏塊 的未處理的相關宏塊數量。條件矩陣可存儲在多核/眾核處理器中各個處理單元的共享內 存中。2)初始化等待隊列為空,其中等待隊列用于存儲待濾波宏塊的坐標。等待隊列可 存儲在多核/眾核處理器中各個處理單元的共享內存中。3)檢測條件矩陣,將條件矩陣中數字“0”的對應宏塊的坐標放入等待隊列,同時 數字更改為負,例如將該數字更改為“-1”。4)空閑的處理單元從等待隊列獲得待濾波宏塊的坐標,根據上述宏塊中亮度邊界 和色度邊界處理順序對宏塊進行濾波,并更新條件矩陣。具體地,當坐標為(i,j)的宏塊被 濾波之后,將條件矩陣中坐標為(i+1,j)和(i,j+1)的宏塊所對應的數字減1。5)判斷條件矩陣中是否還有數字“0”,如果還有“0”存在,則跳轉到步驟3),否則結束。在上述優(yōu)選實施例中,提供了一種多核/眾核處理器采用動態(tài)方式獲取待濾波的 宏塊的去塊濾波方法,本領域普通技術人員可以理解,多核/眾核處理器也可以采用靜態(tài) 方式獲取待濾波的宏塊,例如對宏塊進行逐行濾波。利用本發(fā)明的上述方法和現(xiàn)有方法,分別在Tile64平臺上對濾波進行實驗。Tile64是Tilera公司推出的一款眾核處理器。它的64個處理單元由一個高速 2D網絡相連,形成一個8x8陣列。每個處理單元單個時鐘周期運行三條指令,且具有一個 16KB的Ll緩存,其中包括8KB的指令緩存和8KB的數據緩存,同時每個處理單元具有自 己的存儲器直接訪問(DMA)系統(tǒng)。在Tile64平臺上可以運行Tilera多核組件庫(TMC) 庫中所包含的各種線程和處理單元綁定、處理單元之間通信等指令。濾波測試軟件取自 H. 264參考軟件JM15. 1,測試的視頻有“藍天”、“行人”、“河床”等等,視頻的格式包括四種 1280x720(HD),720x576(SD),352x288(CIF)和 176x144 (QCIF)。測試結果如表1和表2所示,其中表1是對每個視頻的測試結果,表2是對每種格 式視頻的測試結果的平均統(tǒng)計,在表1和表2中的“JM15. 1”列表示串行執(zhí)行去塊濾波所需的時間,“加速比”表示現(xiàn)有方法所需時間除以本發(fā)明方法所需的時間得到的比例。從表中 可見,本發(fā)明的方法有效提高了去塊濾波的速度。表1多個視頻的去塊濾波測試結果
權利要求
1.一種視頻編解碼中去塊濾波方法,在對宏塊進行濾波時,亮度邊界處理順序為右邊 第4條、右邊第3條、右邊第2條、上邊第1條、上邊第2條、上邊第3條、上邊第4條、右邊 第1條;色度邊界處理順序為右邊第2條、上邊第1條、上邊第2條、右邊第1條。
2.根據權利要求1所述的方法,其特征在于,處理器動態(tài)獲取待濾波的宏塊。
3.根據權利要求1所述的方法,其特征在于,處理器靜態(tài)獲取待濾波的宏塊。
4.一種視頻編解碼中去塊濾波方法,所述方法包括下列步驟1)將每個宏塊的未處理的相關宏塊的數量存儲到條件矩陣;2)將所述條件矩陣中數字“0”的對應宏塊的坐標放入等待隊列,同時將該數字更改為 負,其中所述等待隊列用于存儲待濾波宏塊的坐標;3)空閑的處理單元從所述等待隊列獲得待濾波宏塊的坐標,對待濾波宏塊進行濾波, 并更新所述條件矩陣,所述濾波時,亮度邊界處理順序為右邊第4條、右邊第3條、右邊第2 條、上邊第1條、上邊第2條、上邊第3條、上邊第4條、右邊第1條;色度邊界處理順序為右 邊第2條、上邊第1條、上邊第2條、右邊第1條;4)判斷條件矩陣中是否還有數字“0”,如果還有,則轉到步驟3,否則結束。
5.根據權利要求4所述的方法,其特征在于,所述等待隊列存儲在多核/眾核處理器中 處理單元的共享內存中。
6.根據權利要求4所述的方法,其特征在于,所述條件矩陣存儲在多核/眾核處理器中 處理單元的共享內存中。
全文摘要
本發(fā)明提供一種視頻編解碼中去塊濾波方法,在對宏塊進行濾波時,亮度邊界處理順序為右邊第4條、右邊第3條、右邊第2條、上邊第1條、上邊第2條、上邊第3條、上邊第4條、右邊第1條;色度邊界處理順序為右邊第2條、上邊第1條、上邊第2條、右邊第1條。本發(fā)明的方法可以利用更多的空閑處理單元,使得同步耗費相比于現(xiàn)有技術明顯減少;另外,各個宏塊在濾波前,只需要和更少的宏塊進行同步通信,減少了額外操作,進一步加快了整體濾波速度。
文檔編號H04N7/26GK102075753SQ20111000713
公開日2011年5月25日 申請日期2011年1月13日 優(yōu)先權日2011年1月13日
發(fā)明者代鋒, 張勇東, 顏成鋼 申請人:中國科學院計算技術研究所
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1