一種系統(tǒng)級芯片及其內(nèi)存訪問管理方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種系統(tǒng)級芯片及其內(nèi)存訪問管理方法。
【背景技術(shù)】
[0002] 現(xiàn)代系統(tǒng)級芯片(System On Chip,S0C)中通常集成多種不同種類的處理器,包括 中央處理器(Central Processing Unit,CPU)/微控制單兀(Micro Control Unit,MCU)、圖 形處理器(Graphic Processing Unit,GPU)、數(shù)字信號處理(Digital Signal Processor, DSP)及多媒體核心等。根據(jù)處理器各自的特點以及獨特的性能表現(xiàn),確保相應的任務分配 給最高效的處理器去完成,從而使得SOC的性能和功效得到提升,而且這種由多種不同種 類的處理器構(gòu)成的SOC的性能和功效遠遠超越單一處理器構(gòu)成的S0C。例如:音頻和目標 偵測在低功耗DSP上執(zhí)行更高效,而大規(guī)模并行GPU則較適合做高度并行的任務,比如圖像 合成、圖像渲染、游戲等。
[0003] 目前,在SOC中集成多種不同種類的處理器是SOC的主流發(fā)展趨勢,現(xiàn)階段SOC只 是簡單的集成不同類型的處理器,每類處理器有自己的存儲子系統(tǒng)(Memory Sub-system), 包括層I(Ll)存儲器(例如:一級指令緩存(Lll-cache)、一級數(shù)據(jù)緩存(LID-cache)、LI 緊耦合內(nèi)存單元(Tightly Coupled Memory,TCM))、L2存儲器甚至L3存儲器,LI存儲器的 典型大小一般為32K比特(Byte)每核(per core),L2存儲器一般為512K Byte~幾兆(M) Byte,L3存儲器更大。
[0004] 不失一般性,由于CPU子系統(tǒng)和GPU子系統(tǒng)的面積較大,此處以CPU子系統(tǒng)和GPU 子系統(tǒng)為例?,F(xiàn)有實現(xiàn)方案只是簡單的將CPU核(core)及CPU子系統(tǒng)、GPU core及GPU子 系統(tǒng)集成在一顆SOC內(nèi)部,如圖1所示,CPU子系統(tǒng)10和GPU子系統(tǒng)11集成在一顆SOC內(nèi) 部,其中,CPU子系統(tǒng)10包括:多個CPU核102、虛擬內(nèi)存104以及物理內(nèi)存106, CPU核102 包括CPU1022和層1緩存1024, GPU子系統(tǒng)11包括:多個GPU核112、虛擬內(nèi)存114以及物 理內(nèi)存116, GPU核112包括GPU1122和層1緩存1124, CPU子系統(tǒng)10與GPU子系統(tǒng)11之 間通過內(nèi)存拷貝(Memory Copy)的方式進行通信,大量的內(nèi)存拷貝會加劇總線的負擔,同時 帶來巨大的功耗開銷。
[0005] 目前也有些芯片廠家宣稱自己的SOC是異構(gòu)架構(gòu),但他們的方案只是針對處理器 級別,比如相同類型的處理器(例如:CPU),每個CPU的工作頻率、電壓可調(diào),并且有獨立的 電源管理區(qū)域,可完全關(guān)閉,尚未涉及處理器子系統(tǒng)的共享及優(yōu)化。
[0006] 總之,現(xiàn)有的SOC異構(gòu)結(jié)構(gòu)中主要有以下三點不足:
[0007] 1、面積開銷大:不同處理器子系統(tǒng)之間沒有進行內(nèi)存共享,致使內(nèi)存占據(jù)SOC面 積的60%甚至70%以上,因此帶來很大的面積開銷,不具成本優(yōu)勢;
[0008] 2、功耗開銷大:不同處理器子系統(tǒng)之間沒有進行內(nèi)存共享,處理器子系統(tǒng)之間的 通信通過內(nèi)存拷貝的方式進行,大量的內(nèi)存拷貝導致SOC的功耗劇烈上升;
[0009] 3、無法實現(xiàn)共享內(nèi)存管理:現(xiàn)有技術(shù)中不同處理器子系統(tǒng)之間有共用內(nèi)存的設(shè) 計,但共用內(nèi)存無法實現(xiàn)內(nèi)存一致性管理、只能通過不同處理器子系統(tǒng)的軟件Cache操作、 處理器子系統(tǒng)間通過中斷來保持內(nèi)存一致性,使得軟件維護內(nèi)存一致性的開銷比較大,而 且應用起來不靈活、軟件容錯性差。
[0010] 綜上所述,現(xiàn)有SOC中在不同處理器子系統(tǒng)之間沒有進行內(nèi)存共享時,SOC中內(nèi) 存部分面積開銷大且不同處理器子系統(tǒng)之間通過內(nèi)存拷貝的形式進行通信大大增加了 SOC 的功耗開銷,現(xiàn)有SOC中在不同處理器子系統(tǒng)之間有內(nèi)存共享時,缺乏統(tǒng)一管理,導致SOC 維護內(nèi)存一致性開銷大,影響SOC的性能。
【發(fā)明內(nèi)容】
[0011] 本發(fā)明實施例提供了一種系統(tǒng)級芯片及其內(nèi)存訪問管理方法,用以實現(xiàn)SOC中不 同的處理器子系統(tǒng)的內(nèi)存共享,并且多個處理器子系統(tǒng)之間共享內(nèi)存進行一致性管理,從 而降低SOC的面積及功耗的開銷,以及實現(xiàn)共享內(nèi)存的統(tǒng)一管理。
[0012] 本發(fā)明實施例提供的一種系統(tǒng)級芯片,包括:多個處理器子系統(tǒng)、多個處理器子 系統(tǒng)共享的共享內(nèi)存,以及連接于所述多個處理器子系統(tǒng)與所述共享內(nèi)存之間,用于對 所述多個處理器子系統(tǒng)對所述共享內(nèi)存的訪問進行管理的系統(tǒng)內(nèi)存管理單元(Memory Management Unit, MMU)〇
[0013] 本發(fā)明實施例提供的上述系統(tǒng)級芯片中,通過在多個處理器子系統(tǒng)之間進行內(nèi)存 共享,并且通過系統(tǒng)MMU對多個處理器子系統(tǒng)之間的共享內(nèi)存進行一致性管理,與現(xiàn)有技 術(shù)中處理器子系統(tǒng)之間沒有進行內(nèi)存共享相比,降低了內(nèi)存在SOC中占據(jù)的面積,降低了 SOC的面積開銷,同時避免了多個處理器子系統(tǒng)以內(nèi)存拷貝的形式進行通信,降低了 SOC的 功耗開銷,并且通過系統(tǒng)MMU對共享內(nèi)存進行統(tǒng)一管理,提高了 SOC的軟件容錯性以及應用 靈活性。
[0014] 在一種可能的實施方式中,本發(fā)明實施例提供的上述系統(tǒng)級芯片中,每一處理器 子系統(tǒng)包括多個處理器核,每一處理器核包括處理器和層1緩存。
[0015] 在一種可能的實施方式中,本發(fā)明實施例提供的上述系統(tǒng)級芯片中,所述共享內(nèi) 存包括虛擬內(nèi)存和物理內(nèi)存,所述系統(tǒng)MMU具體用于:對于每一處理器核:為該處理器核分 配一段虛擬地址,以及建立該虛擬地址與物理地址的映射關(guān)系,當收到該處理器核訪問所 述共享內(nèi)存的請求時,若該請求中的虛擬地址屬于為該處理器核分配的虛擬地址,則將該 請求中的虛擬地址映射為對應的物理地址,并對該物理地址所對應的物理內(nèi)存進行訪問; 若該請求中的虛擬地址不屬于為該處理器核分配的虛擬地址,則判斷該請求中的虛擬地址 所對應的虛擬內(nèi)存是否空閑,如果是,則將該請求中的虛擬地址所對應的虛擬內(nèi)存分配給 該處理器核;否則,向該處理器核回復拒絕訪問該請求中的虛擬地址所對應的虛擬內(nèi)存的 響應。
[0016] 在一種可能的實施方式中,本發(fā)明實施例提供的上述系統(tǒng)級芯片中,所述處理器 核當收到所述系統(tǒng)MMU發(fā)送的拒絕訪問所述請求中的虛擬地址所對應的虛擬內(nèi)存的響應 后達到預設(shè)時間時,再次向所述系統(tǒng)MMU發(fā)送訪問所述共享內(nèi)存的請求。
[0017] 在一種可能的實施方式中,本發(fā)明實施例提供的上述系統(tǒng)級芯片中,所述共享內(nèi) 存包括虛擬內(nèi)存和物理內(nèi)存,每一處理器子系統(tǒng)還包括代理MMU,所述系統(tǒng)MMU為每一代理 MMU分配一段虛擬地址,建立該虛擬地址與物理地址的映射關(guān)系,并將該映射關(guān)系發(fā)送給該 代理MMU ;每一處理器子系統(tǒng)中的代理MMU具體用于:對于該處理器子系統(tǒng)中的每一處理器 核:記錄所述系統(tǒng)MMU為該代理MMU分配的虛擬地址,以及該虛擬地址與物理地址的映射關(guān) 系,當收到該處理器核訪問所述共享內(nèi)存的請求時,若該請求中的虛擬地址屬于所述系統(tǒng) MMU為該代理MMU分配的虛擬地址,則將該請求中的虛擬地址映射為對應的物理地址,并通 過所述系統(tǒng)MMU對該物理地址所對應的物理內(nèi)存進行訪問;若該請求中的虛擬地址不屬于 所述系統(tǒng)MMU為該代理MMU分配的虛擬地址,則向所述系統(tǒng)MMU發(fā)送該請求中的虛擬地址 所對應的虛擬內(nèi)存的申請;所述系統(tǒng)MMU收到所述申請后,判斷該申請中的虛擬地址所對 應的虛擬內(nèi)存是否空閑,如果是,則將該申請中的虛擬地址所對應的虛擬內(nèi)存分配給該代 理MMU ;否則,向該代理MMU回復拒絕所述申請的響應。
[0018] 在一種可能的實施方式中,本發(fā)明實施例提供的上述系統(tǒng)級芯片中,所述代理MMU 當收到所述系統(tǒng)MMU發(fā)送的拒絕所述申請的響應后達到預設(shè)時間時,再次向所述系統(tǒng)MMU 發(fā)送該申請中的虛擬地址所對應的虛擬內(nèi)存的訪問申請。
[0019] 本發(fā)明實施例提供的一種內(nèi)存訪問管理方法,應用于本發(fā)明實施例提供的系統(tǒng)級 芯片,所述方法包括:通過所述系統(tǒng)MMU,對所述多個處理器子系統(tǒng)對所述共享內(nèi)存的訪問 進行管理。
[0020] 本發(fā)明實施例提供的上述內(nèi)存訪問管理方法中,通過系統(tǒng)MMU對多個處理器子系 統(tǒng)之間的共享內(nèi)存進行一致性管理,提高了 SOC的軟件容錯性以及應用靈活性。
[0021 ] 在一種可能的實施方式中,本發(fā)明實施例提供的上述內(nèi)存訪問管理方法中,每一 處理器子系統(tǒng)包括多個處理器核,每一處理器核包括處理器和層1緩存。
[0022] 在一種可能的實施方式中,本發(fā)明實施例提供的上述內(nèi)存訪問管理方法中,所述 共享內(nèi)存包括虛擬內(nèi)存和物理內(nèi)存;通過所述系統(tǒng)MMU,對所述多個處理器子系統(tǒng)對所述 共享內(nèi)存的訪問進行管理,包括:對于每一處理器內(nèi)核:所述系統(tǒng)MMU為該處理器核分配一 段虛擬地址,以及建立該虛擬地址與物理地址的映射關(guān)系,當收到該處理器核訪問所述共 享內(nèi)存的請求時,若該請求中的虛擬地址屬于為該處理器核分配的虛擬地址,則所述系統(tǒng) MMU將該請求中的虛擬地址映射為對應的物理地址,并對該物理地址所對應的物理內(nèi)存進 行訪問;若該請求中的虛擬地址不屬于為該處理器核分配的虛擬地址,則所述系統(tǒng)MMU判 斷該請求中的虛擬地址所對應的虛擬內(nèi)存是否空閑,如果是,則將該請求中的虛擬地址所 對應的虛擬內(nèi)存分配給該處理器核;否則,向該處理器核回復拒絕訪問該請求中的虛擬地 址所對應的虛擬內(nèi)存的響應。
[0023] 在一種可能的實施方式中,本發(fā)明實施例提供的上述內(nèi)存訪問管理方法中,該方 法還包括:所述處理器核當收到所述系統(tǒng)MMU發(fā)送的拒絕訪問所述請求中的虛擬地址所對 應的虛擬內(nèi)存的響應后達到預設(shè)時間時,再次向所述系統(tǒng)MMU發(fā)送訪問所述共享內(nèi)存的請 求。
[0024] 在一種可