一種參考數(shù)據(jù)訪問管理方法及裝置制造方法
【專利摘要】本發(fā)明還公開了一種適用于H.264/AVC并行編碼裝置的參考數(shù)據(jù)訪問管理方法及裝置,所述參考數(shù)據(jù)訪問管理裝置包括多個分別連接一編碼核心的一級緩存單元,所述一級緩存單元通過一總線連接于一個二級緩存單元,所述二級緩存單元進一步連接外部存儲器。僅當編碼核心訪問的數(shù)據(jù)在所有的一級緩存單元與二級緩存單元中均不存在時才需要從外部存儲器內(nèi)獲取。本發(fā)明可以充分的利用宏塊行多核并行H.264編碼器訪問參考數(shù)據(jù)的相關(guān)性,充分降低其參考數(shù)據(jù)外部存儲器訪問量。由于盡可能的消除了各個緩存內(nèi)重復(fù)的緩沖塊存儲,本發(fā)明的硬件開銷也很低。
【專利說明】一種參考數(shù)據(jù)訪問管理方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻編解碼領(lǐng)域,尤其涉及一種適用于H.264/AVC并行編碼裝置的參考數(shù)據(jù)管理裝置,適用于宏塊行(Marco-Block Row)為基本單位的并行編碼的參考數(shù)據(jù)訪問管理方法及裝置。
【背景技術(shù)】
[0002]H.264/AVC標準以其卓越的圖像壓縮性能已經(jīng)為業(yè)界所接受,然而隨著需要編碼的圖像幅面從CIF上升至D1、720P、1080P甚至4kx2k (超高清),H.264編碼更高的運算量在一些低功耗要求高的領(lǐng)域就成為一個主要問題。業(yè)界降低H.264編碼功耗在算法實現(xiàn)階段采用的手段是通過并行處理來降低編碼過程中的硬件/處理器的時鐘頻率,進而降低硬件運行電壓來降低系統(tǒng)功耗。
[0003]另一方面,H.264編碼器在進行幀間預(yù)測時需要參考幀圖像數(shù)據(jù)(下文簡稱為參考數(shù)據(jù))信息。而由于參考幀圖像的尺寸大很難在編碼器芯片內(nèi)部存儲,因此通常他們都被存儲在外部DDR中。通常對參考幀圖像的訪問是H.264編碼器外部存儲器訪問的最大部分。減少參考數(shù)據(jù)的訪問量將對削減H.264編碼器的外部存儲器訪問起到重要的作用,并進而降低編碼器的整體功耗。
[0004]基于宏塊行的H.264/AVC編碼方法將圖像幀分解為多個宏塊行分別提交給多個獨立的編碼核心,因而只需要增加編碼核心的數(shù)量,就能夠近乎線性的提升編碼吞吐率,因此達成高吞吐率的設(shè)計變得簡單。這使得設(shè)計一個高吞吐率的編碼器并降低電壓與降低工作頻率以降低功耗成為可能。
[0005]同時,由于基于宏塊行并行的H.264/AVC編碼方法通過多個核心并行編碼多個宏塊行。不僅各個核心處理的各個宏塊運動搜索范圍存在重疊。其各個核心的運動搜索范圍也存在重疊。因此其參考數(shù)據(jù)的訪問局部性相比普通的單核心編碼器或者幀/slice級編碼器更為突出。在良好的參考數(shù)據(jù)訪問控制管理下,其參考數(shù)據(jù)訪問帶寬低于普通基于IevelC數(shù)據(jù)重用的單核心編碼器或者幀/slice級并行的多核心并行編碼器。對于典型的應(yīng)用配置,其理論參考數(shù)據(jù)訪問帶寬相對單核心編碼器可以降低50%以上。
[0006]但是另一方面,相比單核心編碼器的數(shù)據(jù)訪問,多個并行編碼核心的并行數(shù)據(jù)訪問以及其訪問的相關(guān)性使得參考數(shù)據(jù)訪問管理變得更為復(fù)雜。而相比成熟的單核心H.264編碼器的參考數(shù)據(jù)訪問管理技術(shù),宏塊行并行H.264編碼器的參考數(shù)據(jù)訪問問題并沒有得到完善的解決。
[0007]直觀的做法是使用一個多端口 RAM或者cache為所有的編碼核心同時提供參考數(shù)據(jù),如圖1所示。但由于各個核心內(nèi)部的參考幀訪問所具有的高帶寬特性(往往達到每時鐘周期上百bit,每個宏塊的編碼需要訪問十幾到幾十個宏塊的參考數(shù)據(jù)),加之運動估計復(fù)雜而不對齊于內(nèi)存邊界的數(shù)據(jù)訪問特性使得這個設(shè)計從架構(gòu)到后端設(shè)計的難度都很大,尤其是在編碼核心數(shù)較多的場合。其高復(fù)雜度對硬件開銷與功耗控制不利。
[0008]一個簡單而可行的做法是各個核心均按照通常的單核心編碼器方式設(shè)計。如圖2所示,各個編碼核心擁有自己的參考幀數(shù)據(jù)訪問管理模塊,并各自獨立的訪問外部存儲器中的參考數(shù)據(jù)。單核心編碼器的參考數(shù)據(jù)訪問控制在業(yè)界已經(jīng)過了大量的探索與研究,常見的基于滑窗或者基于cache的訪問管理機制都能夠高效率的重用參考幀數(shù)據(jù)訪問(L1-Fu Ding, Multiview Video Coding:Algorithms, VLSI Architectures, andSystem Design, Graduate Institute of Electronics Engineering College ofElectrical Engineering&Computer Science National Taiwan University DoctoralDissertation),因此這種方案的設(shè)計難度低。然而這種做法只能利用同一個宏塊行內(nèi)的各個宏塊的參考數(shù)據(jù)訪問相關(guān)性。而各個宏塊行間對參考數(shù)據(jù)訪問的相關(guān)性并沒有得到利用。也即意味著宏塊行并行編碼器的數(shù)據(jù)重用等級仍然停留在levelC,低理論訪問帶寬的優(yōu)勢無從體現(xiàn)。
[0009]為了消除各個編碼核心間對參考數(shù)據(jù)的重復(fù)訪問,直觀的做法是在第一級的數(shù)據(jù)訪問控制裝置與外部存儲器之間再增加第二級的數(shù)據(jù)訪問控制裝置以提供各個編碼核心行間的數(shù)據(jù)重用,將數(shù)據(jù)重用等級從IevelC提升至IevelC+或者levelD。任何一個編碼核心的參考幀數(shù)據(jù)在通過本地的第一級數(shù)據(jù)訪問控制裝置重用消除水平方向的重復(fù)訪問后,再由第二級數(shù)據(jù)訪問控制裝置控制統(tǒng)一訪問外部RAM。這樣行間的參考數(shù)據(jù)重復(fù)訪問也大部分得到了消除,進一步的降低了全局對外部存儲器的訪問帶寬。測試表明典型場景下帶寬可以降低50%以上,外部訪問帶寬接近IevelD重用但硬件開銷遠低于levelD。但毫無疑問,增加第二級數(shù)據(jù)訪問控制模塊增加了額外的硬件開銷。在一個典型的應(yīng)用場景下,由于參考數(shù)據(jù)需要在第一與第二級數(shù)據(jù)訪問控制裝置中重復(fù)存儲,大體上會使本地RAM開銷加倍。
[0010]將第一級數(shù)據(jù)訪問控制裝置內(nèi)部的局部緩沖,如滑窗或者cache視為分布式RAM并使用NUMA(non-uniform memory access,非一致性內(nèi)存訪問)架構(gòu)管理有助于減少RAM開銷問題,然而通常的cache —致性協(xié)議如MOESI對于H.264編碼核心而言過于復(fù)雜,難以設(shè)計與驗證。并使得每一個編碼核心的數(shù)據(jù)訪問控制模塊內(nèi)部的數(shù)據(jù)管理都需要考慮其他編碼核心,這使得設(shè)計格外的復(fù)雜化。至今沒有采用這種設(shè)計的H.264宏塊并行編碼器的?艮告。
【發(fā)明內(nèi)容】
[0011]本發(fā)明所要解決的技術(shù)問題是提供一種兼具高吞吐率、低功耗與低硬件開銷優(yōu)點且結(jié)構(gòu)簡單易于設(shè)計驗證的適用于H.264/AVC并行編碼裝置的參考數(shù)據(jù)管理方法及裝置。
[0012]為實現(xiàn)上述技術(shù)效果,本發(fā)明公開了一種適用于H.264/AVC并行編碼裝置的參考數(shù)據(jù)訪問管理方法,所述參考數(shù)據(jù)訪問管理方法包括以下實現(xiàn)步驟:
[0013]編碼核心向一級緩存單元發(fā)起一個訪問請求;
[0014]所述一級緩存單元查詢其內(nèi)部第一多端口 2D緩存器,并向所述編碼核心返回參考數(shù)據(jù);
[0015]當所述第一多端口 2D緩存器內(nèi)無匹配參考數(shù)據(jù)時,所述一級緩存單元通過總線向二級緩存單元發(fā)起再填充請求;
[0016]所述二級緩存單元查`詢其內(nèi)部第二多端口 2D緩存器,并向所述一級緩存單元返回再填充參考數(shù)據(jù);[0017]當所述第二多端口 2D緩存器內(nèi)無匹配再填充參考數(shù)據(jù)時,向外部存儲器發(fā)出參考數(shù)據(jù)請求,并將自所述外部存儲器返回的參考數(shù)據(jù)通過總線發(fā)送至一級緩存單元。
[0018]所述參考數(shù)據(jù)訪問管理方法進一步的改進在于,當所述第二多端口 2D緩存器內(nèi)無匹配再填充參考數(shù)據(jù)時,所述二級緩存單元先查詢其內(nèi)部探聽過濾器的條目,并向所述條目所在的一級緩存單元發(fā)起請求,所述一級緩存單元根據(jù)所述請求從內(nèi)部取出所請求的參考數(shù)據(jù),當所述內(nèi)部探聽過濾器中無匹配條目時,所述二級緩存單元再向所述外部存儲器發(fā)出參考數(shù)據(jù)請求。
[0019]本發(fā)明還公開了一種適用于H.264/AVC并行編碼裝置的參考數(shù)據(jù)訪問管理裝置,所述參考數(shù)據(jù)訪問管理裝置包括多個分別連接一編碼核心的一級緩存單元,所述一級緩存單元通過一總線連接于一個二級緩存單元,所述二級緩存單元進一步連接外部存儲器。
[0020]所述參考數(shù)據(jù)訪問管理裝置進一步的改進在于,所述總線包括總線控制器以及控制連接于所述總線控制器的互連結(jié)構(gòu),所述互連結(jié)構(gòu)包括用于傳輸參考數(shù)據(jù)再填充請求的再填充請求(refilling_req)通道與再填充請求輔助(refilling_ast)通道、以及用于傳輸參考數(shù)據(jù)的存留數(shù)據(jù)(victim)通道與再填充數(shù)據(jù)(refilling)通道。
[0021]所述參考數(shù)據(jù)訪問管理裝置進一步的改進在于,所述一級緩存單元包括第一多端口 2D緩存器,所述一級緩存單元通過所述總線連接至所屬的編碼核心的運動估計模塊,所述一級緩存單元設(shè)有再填充請求輔助(refilling_ast)通道與存留數(shù)據(jù)(victim)通道。
[0022]所述參考數(shù)據(jù)訪問管理裝置進一步的改進在于,所述二級緩存單元包括第二多端口 2D緩存器、總線偵聽模塊、探聽過濾器、存留緩沖以及外部參考數(shù)據(jù)訪問模塊,所述存留緩沖分別連接所述第二多端口 2D緩存器和所述總線偵聽模塊,所述第二多端口 2D緩存器進一步連接所述探聽過濾器,所述總線偵聽模塊亦進一步連接所述探聽過濾器,所述探聽過濾器進一步連接所述外部參考數(shù)據(jù)訪問模塊,并且所述外部參考數(shù)據(jù)訪問模塊連接所述外部存儲器。
[0023]所述參考數(shù)據(jù)訪問管理裝置進一步的改進在于,所述一級緩存單元通過所述存留數(shù)據(jù)(victim)通道連接所述存留緩沖;所述探聽過濾器通過所述再填充請求輔助(refilling_ast)通道連接所述一級緩存單元。
[0024]所述參考數(shù)據(jù)訪問管理裝置進一步的改進在于,一個或多個所述再填充請求(refilling_req)通道連接至所述總線偵聽模塊與所述第二多端口 2D緩存器以傳輸參考數(shù)據(jù)訪問;所述探聽過濾器連接至所述再填充請求輔助(refilling_ast)通道以傳輸參考數(shù)據(jù)訪問。
[0025]所述參考數(shù)據(jù)訪問管理裝置進一步的改進在于,所述外部參考數(shù)據(jù)訪問模塊連接至所述再填充數(shù)據(jù)(refilling)通道以傳輸參考數(shù)據(jù)。
[0026]本發(fā)明由于采用了以上技術(shù)方案,使其具有以下有益效果是:
[0027]僅當編碼核心訪問的數(shù)據(jù)在所有的一級緩存單元與二級緩存單元中均不存在時才需要從外部存儲器內(nèi)獲取。一級緩存單元內(nèi)的數(shù)據(jù)可以視為hot數(shù)據(jù)(指最近被使用的數(shù)據(jù)),二級緩存單元內(nèi)的數(shù)據(jù)可視為cold數(shù)據(jù)(指最近未被使用的數(shù)據(jù)),因此本發(fā)明實現(xiàn)的全局緩沖塊替換策略為一個類LIRS(Low Interreference Recency Set, SongJiang&Xiaodong Zhang 《LIRS:an efficient low inter-reference recency setreplacement to improve buffer cache performance》)算法,在各種場景下都具有良好的表現(xiàn)。因而本發(fā)明可以充分的利用宏塊行多核并行H.264編碼器訪問參考數(shù)據(jù)的相關(guān)性,充分降低其參考數(shù)據(jù)外部存儲器訪問量。
[0028]由于盡可能的消除了各個緩存內(nèi)重復(fù)的緩沖塊存儲,本發(fā)明的硬件開銷也很低。
[0029]對于一個典型的4核宏塊行并行H.264編碼器,參考數(shù)據(jù)的外部訪問帶寬僅相當于類似搜索范圍的IevelC重用H.264單核編碼器的1/3。內(nèi)部的片上RAM尺寸也只相當于此單核編碼器的參考數(shù)據(jù)管理模塊的1/2,且不存在滑窗限制運動矢量范圍的缺陷。
[0030]相對于簡單的增加一個第二層參考數(shù)據(jù)訪問控制模塊的方案,本發(fā)明具有類似的外部訪問帶寬特性,但片上RAM開銷可以減少1/3。
[0031]而相對于復(fù)雜而緊稱合的NUMA非均勻訪存模型(Non Uniform Memory Access),本發(fā)明的一級緩存單元與二級緩存單元耦合很松,易于分別優(yōu)化設(shè)計,且本發(fā)明不需要復(fù)雜的cache —致性協(xié)議,很大程度的降低了驗證與設(shè)計的難度。
【專利附圖】
【附圖說明】
[0032]圖1是由單個多端口滑窗/cache為所有編碼核心提供參考數(shù)據(jù)的管理裝置的結(jié)構(gòu)示意圖。
[0033]圖2是多個獨立的參考數(shù)據(jù)管理模塊為各個編碼核心提供參考數(shù)據(jù)的管理裝置的結(jié)構(gòu)示意圖。
[0034]圖3是兩級參考數(shù)據(jù)訪問控制裝置的結(jié)構(gòu)示意圖。
[0035]圖4是本發(fā)明參考數(shù)據(jù)訪問管理裝置的結(jié)構(gòu)示意圖。
[0036]圖5是本發(fā)明參考數(shù)據(jù)訪問管理裝置的二級緩存單元的結(jié)構(gòu)示意圖。
【具體實施方式】
[0037]下面結(jié)合附圖以及【具體實施方式】對本發(fā)明作進一步詳細的說明。
[0038]首先參閱圖4所示,本發(fā)明由每個編碼核心100獨占的多個一級緩存單元101(Llcache)、由所有編碼核心共享的二級緩存單元102 (L2cache)以及連接兩者的總線103組成。
[0039]一級緩存單元101為第一多端口 2D緩存器。一級緩存單元101通過總線103連接至二級緩存單元102,并連接至所屬的編碼核心100的運動估計模塊。其直接為所屬編碼核心100的運動估計模塊提供參考數(shù)據(jù),并以緩存所指定的緩沖塊尺寸的二維圖像塊的形式向其外部請求參考數(shù)據(jù)。因此,一級緩存單元101將來自編碼器內(nèi)部對參考數(shù)據(jù)的訪問轉(zhuǎn)換為均一且對齊的緩沖塊尺寸的外部圖像訪問,并消除行內(nèi)各個宏塊對參考數(shù)據(jù)訪問的相關(guān)性。一級緩存單元101的結(jié)構(gòu)與實現(xiàn)類似通常的基于緩存的單核編碼器參考管理裝置結(jié)構(gòu),但為了匹配總線互連,增加了再填充請求輔助(refilling_ast)通道與存留數(shù)據(jù)(victim)通道。增加的通道允許二級緩存單元102發(fā)起請求并從一級緩存單元101讀取緩沖塊。增加的訪問通道所增加的訪問帶寬需求可由增加一級緩存單元101的端口數(shù)加以平衡。
[0040]配合圖5所示,二級緩存單元102包含一個第二多端口 2D緩存器105、總線偵聽模塊106、探聽過濾器107 (snoop filter)、存留緩沖108 (victim buffer)以及外部參考數(shù)據(jù)訪問模塊109。二級緩存單元102通過總線103連接各個一級緩存單元101,并連接到外部存儲器200??偩€103的存留數(shù)據(jù)(victim)通道連接到存留緩沖108以傳輸參考數(shù)據(jù),存留緩沖108允許連個多個存留數(shù)據(jù)(victim)通道以并行接收多個編碼核心的參考數(shù)據(jù);存留緩沖108連接到第二多端口 2D緩存器105以傳輸參考數(shù)據(jù);存留緩沖108連接總線偵聽模塊106以傳輸參考數(shù)據(jù)傳輸狀態(tài);第二多端口 2D緩存器105連接總線的再填充數(shù)據(jù)(refilling)通道以傳輸參考數(shù)據(jù),多端口特性允許第二多端口 2D緩存器105連接多個refilling通道以同時為多個以及緩存單元101傳輸參考數(shù)據(jù);第二多端口 2D緩存器105連接到探聽過濾器107以傳輸參考數(shù)據(jù)訪問;一個或者多個再填充請求(refilling_req)通道連接至總線偵聽與第二多端口 2D緩存器105以傳輸參考數(shù)據(jù)訪問。存留緩沖108以及總線refilling_req通道連接到總線偵聽模塊106以傳輸參考數(shù)據(jù)與參考數(shù)據(jù)請求;總線偵聽模塊106連接至探聽過濾器107以傳輸參考數(shù)據(jù)訪問;探聽過濾器107連接至總線的再填充請求輔助(refiiling_ast)通道以傳輸參考數(shù)據(jù)訪問,探聽過濾器107可連接至多個refilling_ast通道以同時向多個以及緩存單元101發(fā)送請求;探聽過濾器107連接至外部參考數(shù)據(jù)訪問模塊109以傳輸參考數(shù)據(jù)訪問;外部參考數(shù)據(jù)訪問模塊109連接至總線refilling通道以傳輸參考數(shù)據(jù);外部參考數(shù)據(jù)訪問模塊109連接至外部存儲器200接口,發(fā)起參考數(shù)據(jù)訪問并接收參考數(shù)據(jù)。二級緩存單元102通過總線偵聽模塊106監(jiān)聽全部總線數(shù)據(jù)傳輸,并追蹤全部一級緩存單元101的標簽(tag)更新并在內(nèi)部建立探聽過濾器107以避免增加對一級緩存單元101的標簽(tag)探測請求。二級緩存單元102作為全部一級緩存單元101的victim使用,緩存從一級緩存單元101被替換的緩沖塊。存留緩沖108用于匹配總線與二級緩存單元102操作的速率,避免victim數(shù)據(jù)溢出。二級緩存單元102的外部參考數(shù)據(jù)訪問模塊109負責通過外部存儲器200訪問接口讀取外部存儲器200中的參考數(shù)據(jù)。
[0041]總線103連接各個一級緩存單元101以及二級緩存單元102。其包括總線控制器以及互連結(jié)構(gòu)??偩€控制器控制互連結(jié)構(gòu)上的信息交換;互連結(jié)構(gòu)由refilling_req, refi 11 ing_ast, refilling 以及 victim 四個通道構(gòu)成。Refilling_req 與 refilling—ast用于傳輸參考數(shù)據(jù)再填充請求victim與refilling通道則用于傳輸參考數(shù)據(jù)。其中refilling與refilling_ast通道的傳輸方向為二級緩存單元102向各個一級緩存單元101 ;refilling_req以及victim通道為各個一級緩存單元101向二級緩存單元102。二級緩存單元102與總線103擁有多個連接,多個連接用于提高訪問帶寬。
[0042]本發(fā)明一種適用于H.264/AVC并行編碼裝置的參考數(shù)據(jù)訪問管理方法的操作流程如下:
[0043]當編碼核心100需要訪問參考數(shù)據(jù)時,其向一級緩存單元101發(fā)起一個訪問請求。一級緩存單元101檢查訪問是否命中內(nèi)部緩存。若命中,則向編碼核心100返回其請求的數(shù)據(jù)。否則通過總線103的refilling_req通道向二級緩存單元102發(fā)起再填充請求。
[0044]二級緩存單元102接到請求后首先檢查是否在本地存儲命中,本地存儲命中指請求的參考數(shù)據(jù)在二級緩存單元102本地的第二多端口 2D緩存器105或存留緩沖108中存在。若在本地存儲命中則通過refilling通道將命中的參考數(shù)據(jù)返回一級緩存單元101。若不在本地存儲命中,則檢查探聽過濾器107中的條目,若命中探聽過濾器107則通過refilling_ast通道向條目所在的一級緩存單元101發(fā)起請求。一級緩存單元101收到refilling_ast傳來的請求后從內(nèi)部緩存取出所請求的參考數(shù)據(jù),并通過victim通道將其返回給總線??偩€將此參考數(shù)據(jù)通過refilling通道發(fā)送給發(fā)起refiling請求的一級緩存單元101。若再填充參考數(shù)據(jù)請求在二級緩存單元102本地存儲以及探聽過濾器107中均未命中,則二級緩存單元102向外部存儲器200發(fā)出請求參考數(shù)據(jù),并將自外部存儲器200返回的數(shù)據(jù)通過總線103的refilling通道發(fā)送至發(fā)起refilling請求的一級緩存單元 101。
[0045]當發(fā)起再填充請求的一級緩存單元101接收到自總線refilling通道傳輸?shù)木彺鎵K數(shù)據(jù)后,將其裝入內(nèi)部RAM并更新內(nèi)部tag表,隨后將編碼核心所請求的參考數(shù)據(jù)返回。當此再填充的緩存塊進入一級緩存單元101時,可能會替換一級緩存單元101中一個原有的緩存塊,可以采用各種替換策略,包括但不限于PLRU (Pseudo-Least Recently Used,偽-最近最少使用)或隨機替換等。此時一級緩存單元101將這個緩存塊通過victim通道發(fā)送至二級緩存單元102并在存留緩沖108中暫時存儲。二級緩存單元102在空閑時檢查存留緩沖108中的緩存塊是否已經(jīng)在本地緩存中存在,若已經(jīng)存在則將其丟棄,否則將其存入本地緩存。這個過程中可能需要替換二級緩存單元102內(nèi)部原有的緩存塊,可以采用各種替換策略,包括但不限于PLRU或隨機替換等。
[0046]以上結(jié)合附圖實施例對本發(fā)明進行了詳細說明,本領(lǐng)域中普通技術(shù)人員可根據(jù)上述說明對本發(fā)明做出種種變化例。因而,實施例中的某些細節(jié)不應(yīng)構(gòu)成對本發(fā)明的限定,本發(fā)明將以所附權(quán)利要求書界定的范圍作為本發(fā)明的保護范圍。
【權(quán)利要求】
1.一種適用于H.264/AVC并行編碼裝置的參考數(shù)據(jù)訪問管理方法,其特征在于所述參考數(shù)據(jù)訪問管理方法包括以下實現(xiàn)步驟: 編碼核心向一級緩存單元發(fā)起一個訪問請求; 所述一級緩存單元查詢其內(nèi)部第一多端口 2D緩存器,并向所述編碼核心返回參考數(shù)據(jù); 當所述第一多端口 2D緩存器內(nèi)無匹配參考數(shù)據(jù)時,所述一級緩存單元通過總線向二級緩存單元發(fā)起再填充請求; 所述二級緩存單元查詢其內(nèi)部第二多端口 2D緩存器,并向所述一級緩存單元返回再填充參考數(shù)據(jù); 當所述第二多端口 2D緩存器內(nèi)無匹配再填充參考數(shù)據(jù)時,向外部存儲器發(fā)出參考數(shù)據(jù)請求,并將自所述外部存儲器返回的參考數(shù)據(jù)通過總線發(fā)送至一級緩存單元。
2.如權(quán)利要求1所述的參考數(shù)據(jù)訪問管理方法,其特征在于:當所述第二多端口2D緩存器內(nèi)無匹配再填充參考數(shù)據(jù)時,所述二級緩存單元先查詢其內(nèi)部探聽過濾器的條目,并向所述條目所在的一級緩存單元發(fā)起請求,所述一級緩存單元根據(jù)所述請求從內(nèi)部取出所請求的參考數(shù)據(jù),當所述內(nèi)部探聽過濾器中無匹配條目時,所述二級緩存單元再向所述外部存儲器發(fā)出參考數(shù)據(jù)請求。
3.一種適用于H.264/AVC并行編碼裝置的參考數(shù)據(jù)訪問管理裝置,其特征在于:所述參考數(shù)據(jù)訪問管理裝置包括多個分別連接一編碼核心的一級緩存單元,所述一級緩存單元通過一總線連接于一個二級緩存單元,所述二級緩存單元進一步連接外部存儲器。
4.如權(quán)利要求3所述的參`考數(shù)據(jù)訪問管理裝置,其特征在于:所述總線包括總線控制器以及控制連接于所述總線控制器的互連結(jié)構(gòu),所述互連結(jié)構(gòu)包括用于傳輸參考數(shù)據(jù)再填充請求的再填充請求通道與再填充請求輔助通道、以及用于傳輸參考數(shù)據(jù)的存留數(shù)據(jù)通道與再填充數(shù)據(jù)通道。
5.如權(quán)利要求4所述的參考數(shù)據(jù)訪問管理裝置,其特征在于:所述一級緩存單元包括第一多端口 2D緩存器,所述一級緩存單元通過所述總線連接至所屬的編碼核心的運動估計模塊,所述一級緩存單元設(shè)有再填充請求輔助通道與存留數(shù)據(jù)通道。
6.如權(quán)利要求5所述的參考數(shù)據(jù)訪問管理裝置,其特征在于:所述二級緩存單元包括第二多端口 2D緩存器、總線偵聽模塊、探聽過濾器、存留緩沖以及外部參考數(shù)據(jù)訪問模塊,所述存留緩沖分別連接所述第二多端口 2D緩存器和所述總線偵聽模塊,所述第二多端口2D緩存器進一步連接所述探聽過濾器,所述總線偵聽模塊亦進一步連接所述探聽過濾器,所述探聽過濾器進一步連接所述外部參考數(shù)據(jù)訪問模塊,并且所述外部參考數(shù)據(jù)訪問模塊連接所述外部存儲器。
7.如權(quán)利要求6所述的參考數(shù)據(jù)訪問管理裝置,其特征在于:所述一級緩存單元通過所述存留數(shù)據(jù)通道連接所述存留緩沖;所述探聽過濾器通過所述再填充請求輔助通道連接所述一級緩存單元。
8.如權(quán)利要求7所述的參考數(shù)據(jù)訪問管理裝置,其特征在于:一個或多個所述再填充請求通道連接至所述總線偵聽模塊與所述第二多端口 2D緩存器以傳輸參考數(shù)據(jù)訪問;所述探聽過濾器連接至所述再填充請求輔助通道以傳輸參考數(shù)據(jù)訪問。
9.如權(quán)利要求8所述的參考數(shù)據(jù)訪問管理裝置,其特征在于:所述外部參考數(shù)據(jù)訪問模塊連接至所述再填充數(shù)據(jù) 通道以傳輸參考數(shù)據(jù)。
【文檔編號】G06F17/30GK103729449SQ201310751654
【公開日】2014年4月16日 申請日期:2013年12月31日 優(yōu)先權(quán)日:2013年12月31日
【發(fā)明者】諸悅, 高厚新, 陳曉春, 章旭東, 劉斌, 劉翔, 陳子遇 申請人:上海富瀚微電子有限公司