亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

具有條件通道路由和就地功能性的可重配置指令單元陣列的制作方法

文檔序號(hào):9493676閱讀:476來(lái)源:國(guó)知局
具有條件通道路由和就地功能性的可重配置指令單元陣列的制作方法
【專利說(shuō)明】具有條件通道路由和就地功能性的可重配置指令單元陣列
[0001]相關(guān)申請(qǐng)的交叉引用
[0002]本申請(qǐng)要求于2013年5月29日提交的美國(guó)非臨時(shí)申請(qǐng)N0.13/905,032的優(yōu)先權(quán),其全部?jī)?nèi)容通過(guò)援引納入于此。
技術(shù)領(lǐng)域
[0003]本申請(qǐng)涉及可重配置指令單元陣列(RICA),且更具體地涉及具有就地功能性的RICA。
[0004]背景
[0005]盡管微處理器計(jì)算能力已經(jīng)逐漸提高,但對(duì)附加提高的需求仍然未減弱。例如,智能電話現(xiàn)在使其處理器負(fù)擔(dān)令人困惑的各種任務(wù)。但單核處理器只能在給定時(shí)間容適這么多的指令。因此,現(xiàn)在通常提供能并行地處理指令集的多核或多線程處理器。但此類基于指令的架構(gòu)始終必須對(duì)抗由管芯空間、功耗、以及關(guān)于降低指令處理時(shí)間的復(fù)雜性所施加的限制。
[0006]如與可編程處理核的使用相比,存在能夠在專用硬件中被更高效地處理的許多算法。例如,圖像處理涉及顯著并行性以及通過(guò)處理步驟的流水線的對(duì)像素的成群處理。如果算法隨后被映射到硬件,則該實(shí)現(xiàn)利用該對(duì)稱性和并行性。但設(shè)計(jì)專用硬件是昂貴且還是麻煩的,因?yàn)槿绻惴ū恍薷?,則專用硬件必須被重新設(shè)計(jì)。
[0007]為了提供基于指令的架構(gòu)與專用硬件辦法之間的高效折衷,已經(jīng)開發(fā)出可重配置指令單元陣列(RICA)架構(gòu)。圖1A解說(shuō)了示例RICA系統(tǒng)50。在這一 RICA系統(tǒng)50中,多個(gè)指令單元2通過(guò)可編程交換結(jié)構(gòu)4互連。指令單元的配置(關(guān)于它們實(shí)現(xiàn)的何種的邏輯功能或指令)以及交換結(jié)構(gòu)可以在必要時(shí)在每一時(shí)鐘周期被重新編程以實(shí)現(xiàn)給定算法或功能。指令單元處理MEM單元12所檢索到的數(shù)據(jù)(其進(jìn)而從數(shù)據(jù)RAM 8加載)。指令單元2的這一處理根據(jù)從配置RAM 6獲取的配置指令10來(lái)發(fā)生。解碼模塊11解碼指令10以便不僅獲取用于指令單元2的編程,而且還獲取用于交換結(jié)構(gòu)4的編程。圖1A中所示的附加特征在于2006年4月28日提交的美國(guó)專利公開N0.2010/0122105中描述,該公開的內(nèi)容藉此通過(guò)援引整體納入于此。
[0008]注意,RICA的優(yōu)點(diǎn)在于:算法(諸如涉及通過(guò)流水線處理方案來(lái)處理多個(gè)像素的圖像處理)能以模擬專用硬件辦法的方式被映射到指令單元。但是無(wú)需設(shè)計(jì)專用硬件,取而代之地,可僅僅在必要時(shí)對(duì)這些單元和交換結(jié)構(gòu)進(jìn)行編程。由此,如果必須重新設(shè)計(jì)算法,則無(wú)需重新設(shè)計(jì)硬件,而是用戶可僅在必要時(shí)改變編程。這相對(duì)于傳統(tǒng)的基于指令的計(jì)算辦法而言是相當(dāng)有優(yōu)勢(shì)的。
[0009]盡管RICA由此提供了穩(wěn)健的優(yōu)點(diǎn),但其實(shí)現(xiàn)中仍然有挑戰(zhàn)。例如,按行和列以可重配置陣列來(lái)排列指令單元是常規(guī)的。每一指令單元、任何相關(guān)聯(lián)的寄存器以及輸入和輸出交換結(jié)構(gòu)可被認(rèn)為是駐留在開關(guān)盒內(nèi)。圖1B示出了按行和列安排的示例開關(guān)盒陣列。每一開關(guān)盒中的交換結(jié)構(gòu)隨后必需接納可能在某行和列位置處的給定開關(guān)盒100開始并隨后在不同行和列位置處的某一其他開關(guān)盒105的結(jié)束的數(shù)據(jù)路徑。在該數(shù)據(jù)路徑中,兩個(gè)指令單元被配置為算術(shù)邏輯單元(ALU) 110。其余開關(guān)盒中的指令單元為了解說(shuō)清楚而未示出。注意到,每一開關(guān)盒于是必須容適兩個(gè)交換矩陣或結(jié)構(gòu):用于選擇到其指令單元的輸入的輸入交換結(jié)構(gòu)以及用于選擇來(lái)自該開關(guān)盒的輸出的輸出交換結(jié)構(gòu)。
[0010]與指令單元形成對(duì)比的是,現(xiàn)場(chǎng)可編程門陣列(FPGA)中的邏輯塊使用查找表(LUT)。例如,設(shè)想在經(jīng)配置FPGA中執(zhí)行的邏輯運(yùn)算中需要AND(與)門。LUT隨后將以用于AND門邏輯功能的真值表來(lái)編程。但指令單元“粗粒度”得多,因?yàn)樗瑢S眠壿嬮T。例如,ALU指令單元將包括各色專用邏輯門。ALU指令單元的功能是可配置的一一其原語(yǔ)邏輯門是專用門并因此是不可配置的。例如,常規(guī)CMOS反相器是一種類型的專用邏輯門。關(guān)于此種反相器是沒(méi)什么可供配置的,該反相器不需要任何配置位。但FPGA可編程邏輯塊中的反相器功能的實(shí)例化則改為通過(guò)LUT的真值表的相應(yīng)編程來(lái)執(zhí)行。因此,如本文所使用的,術(shù)語(yǔ)“指令單元”指的是包括專用邏輯門的可配置邏輯元件。
[0011]指令單元對(duì)一個(gè)或多個(gè)操作數(shù)執(zhí)行其邏輯功能以形成指令單元輸出。該上下文中的操作數(shù)是接收到的輸入通道。取決于其配置位,指令單元被配置成執(zhí)行相應(yīng)的邏輯運(yùn)算。例如,第一開關(guān)盒可包括被配置成將對(duì)應(yīng)于兩個(gè)通道輸入的兩個(gè)操作數(shù)相加的ALU指令單元。但相同的ALU指令單元稍后可被更新為將這兩個(gè)操作數(shù)相減。由指令單元內(nèi)的邏輯運(yùn)算產(chǎn)生的指令單元輸出可能在另一指令單元中被需要。因此,第一開關(guān)盒中的輸出交換結(jié)構(gòu)將被配置成通過(guò)相應(yīng)的通道輸出將指令單元輸出驅(qū)動(dòng)至第一開關(guān)盒之外。與之形成對(duì)比的是,F(xiàn)PGA的LUT各自產(chǎn)生一個(gè)位,這些LUT不生成字。因此FPGA中的交換結(jié)構(gòu)根本上不同于RICA中的交換結(jié)構(gòu),因?yàn)镕PGA的交換結(jié)構(gòu)被配置成對(duì)來(lái)自FPGA的LUT的位進(jìn)行路由。與之形成對(duì)比的是,RICA中的開關(guān)盒之間的路由被配置成作為輸入通道和輸出通道兩者來(lái)路由字。例如,開關(guān)盒陣列可被配置成路由二十個(gè)通道。這一實(shí)施例中的開關(guān)盒因此可以從所有四個(gè)方向接收二十個(gè)輸入通道(如由行和列尺寸所限定的)并在這四個(gè)方向上驅(qū)動(dòng)二十個(gè)輸出通道。列尺寸可被認(rèn)為與任何給定開關(guān)盒的北和南方向相對(duì)應(yīng)。類似地,行尺寸可被認(rèn)為與東和西方向相對(duì)應(yīng)。
[0012]來(lái)自開關(guān)盒的每一輸出通道可通過(guò)開關(guān)盒內(nèi)的對(duì)應(yīng)通道輸出復(fù)用器來(lái)選擇。這樣的通道輸出復(fù)用器包括輸出復(fù)用器的集合,每一輸出復(fù)用器只與通道字寬的一個(gè)位相對(duì)應(yīng)。以下討論參考選擇用于整個(gè)通道的通道輸出復(fù)用器,但將理解,這樣的通道輸出復(fù)用器實(shí)際上包括多個(gè)輸出復(fù)用器,每一復(fù)用器具有單個(gè)位輸出。關(guān)于任何給定輸出方向(例如,北、南、東、或西),存在三個(gè)剩余的輸入方向。例如,北輸出通道可從東、西和南輸入通道中進(jìn)行選擇。給定輸出方向的每一通道輸出復(fù)用器因而可包括3:1復(fù)用器。但輸出通道也可由開關(guān)盒的指令單元輸出來(lái)驅(qū)動(dòng)。因而,每一通道輸出復(fù)用器可包括RICA開關(guān)盒中的4:1復(fù)用器。如果列通道被假定在北和南方向上行進(jìn),則在二十通道實(shí)施例中,開關(guān)盒因而將需要二十個(gè)4:1通道輸出復(fù)用器來(lái)驅(qū)動(dòng)北輸出通道且需要另二十個(gè)4:1通道輸出復(fù)用器來(lái)驅(qū)動(dòng)南輸出通道。類似地,行通道可被假定在東和西方向上行進(jìn)。因而,二十通道實(shí)施例中的開關(guān)盒將包括二十個(gè)4:1通道輸出復(fù)用器來(lái)驅(qū)動(dòng)?xùn)|輸出通道和二十個(gè)4:1通道輸出復(fù)用器來(lái)驅(qū)動(dòng)西輸出通道。所有四個(gè)方向的結(jié)果所得的4:1通道輸出復(fù)用器集合形成每一開關(guān)盒的輸出交換結(jié)構(gòu)。
[0013]每一 4:1通道輸出復(fù)用器需要兩個(gè)配置位來(lái)控制它可用的4個(gè)輸入中的哪一個(gè)應(yīng)當(dāng)被選擇來(lái)驅(qū)動(dòng)4:1通道輸出復(fù)用器的輸出通道。在常規(guī)RICA中,這些配置位是靜態(tài)的:它們是配置流的一部分,配置流還配置指令單元的邏輯運(yùn)算和每一開關(guān)盒的輸入交換結(jié)構(gòu)。但某些應(yīng)用(諸如多媒體應(yīng)用)需要靜態(tài)輸出交換結(jié)構(gòu)不能容納的條件移動(dòng)。
[0014]因此,本領(lǐng)域中存在對(duì)具有帶條件移動(dòng)能力的輸出交換結(jié)構(gòu)的可重配置指令單元陣列的需求。
[0015]概述
[0016]在可重配置指令單元陣列(RICA)中,指令單元陣列通過(guò)對(duì)應(yīng)配置字來(lái)被配置以實(shí)現(xiàn)所需邏輯算法或運(yùn)算。每一指令單元與指定為開關(guān)盒的單元中的對(duì)應(yīng)I/o端口的集合相對(duì)應(yīng)。指令單元陣列因而包括對(duì)應(yīng)開關(guān)盒陣列。開關(guān)盒中的每一I/o端口接收來(lái)自另一I/o端口(相鄰開關(guān)盒或同一開關(guān)盒,取決于開關(guān)盒在陣列中的位置)的多個(gè)輸入通道。在開關(guān)盒內(nèi),指令單元可被配置成對(duì)從開關(guān)盒的I/o端口接收到的輸入通道中的至少一者執(zhí)行邏輯運(yùn)算以形成指令單元輸出。開關(guān)盒中的每一I/o端口可配置成從由開關(guān)盒中的其余I/o端口接收到的輸入通道中以及從指令單元輸出中進(jìn)行選擇以形成多個(gè)輸出通道。進(jìn)而,來(lái)自開關(guān)盒的I/o端口的多個(gè)輸出通道被另一 I/O端口(在相鄰開關(guān)盒或同一開關(guān)盒中,取決于開關(guān)盒在陣列中的位置)作為多個(gè)輸入通道接收。
[0017]為作出其輸出通道的選擇,每一 I/O端口包括用于每一輸出通道的條件路由電路。I/o端口的條件路由電路被配置成從包括來(lái)自開關(guān)盒中的每一其余I/O端口的接收到的輸入信道和指令單元輸出的信號(hào)群中進(jìn)行選擇,以形成對(duì)應(yīng)輸出通道。為增強(qiáng)RICA操作和靈
當(dāng)前第1頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1