亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于高效浮點(diǎn)計(jì)算的運(yùn)算的制作方法

文檔序號(hào):8287844閱讀:500來(lái)源:國(guó)知局
用于高效浮點(diǎn)計(jì)算的運(yùn)算的制作方法
【專(zhuān)利說(shuō)明】用于高效浮點(diǎn)計(jì)算的運(yùn)算
[0001]共同待決專(zhuān)利申請(qǐng)案的參考
[0002]本專(zhuān)利申請(qǐng)案涉及以下共同待決的美國(guó)專(zhuān)利申請(qǐng)案:與本專(zhuān)利申請(qǐng)案同時(shí)申請(qǐng)的王亮凱(Liang-Kai Wang)的“用于具有指數(shù)按比例縮放的浮點(diǎn)融合乘法加法的微架構(gòu)(MICROARCHITECTURE FOR FLOATING POINT FUSED MULTIPLY-ADD WITH EXPONENTSCALING) ”(代理人案號(hào)121186),所述申請(qǐng)案已轉(zhuǎn)讓給本受讓人,且以引用的方式明確地并入本文中。
技術(shù)領(lǐng)域
[0003]所揭示實(shí)施例涉及用于浮點(diǎn)運(yùn)算的專(zhuān)用指令及技術(shù)。更確切地說(shuō),示例性實(shí)施例涉及用于檢測(cè)及有效地處置例如除法及平方根計(jì)算等浮點(diǎn)運(yùn)算中的有問(wèn)題的拐點(diǎn)情況的指令及技術(shù)。
【背景技術(shù)】
[0004]若干現(xiàn)代處理器支持浮點(diǎn)運(yùn)算且包含用于浮點(diǎn)算術(shù)的專(zhuān)用硬件及/或軟件。缺乏此類(lèi)支持可能需要軟件模擬浮點(diǎn)運(yùn)算,此情形可能為效率低下的及緩慢的。用于二進(jìn)制浮點(diǎn)算術(shù)的IEEE標(biāo)準(zhǔn)IEEE 754跨越處理器架構(gòu)為便攜式的,且通常用于實(shí)施浮點(diǎn)運(yùn)算的處理器中。所述標(biāo)準(zhǔn)用正負(fù)號(hào)、指數(shù)及小數(shù)部分(還被稱(chēng)為“尾數(shù)”或“有效數(shù)字”)定義有限數(shù)的進(jìn)制。例如加法、減法、乘法、除法及平方根計(jì)算等浮點(diǎn)算術(shù)運(yùn)算的實(shí)施方案可基于標(biāo)準(zhǔn)定義。所述標(biāo)準(zhǔn)還可定義可產(chǎn)生異常且造成引發(fā)某些旗標(biāo)的情境、精度要求、舍入模式等。
[0005]特別關(guān)于除法及平方根計(jì)算,所屬領(lǐng)域的技術(shù)人員將認(rèn)識(shí)到與其相關(guān)聯(lián)的所需精度、舍入模式及異常。一種用于除法的已知技術(shù)包含迭代除法,其中每一迭代計(jì)算最終商的一個(gè)數(shù)字,此情形可為效率非常低下的,且在不對(duì)現(xiàn)有處理器架構(gòu)進(jìn)行顯著更改的情況下難以實(shí)施。除法的另一種更高效方法(所謂的牛頓拉普森方法(Newton-Raphson method))利用收斂到預(yù)期的最終商值的算法。牛頓拉普森方法在浮點(diǎn)除法計(jì)算中使用分母的倒數(shù)的初始近似,且所述算法逐漸將倒數(shù)收斂到I除以分母。在其中分母的倒數(shù)達(dá)到足夠的準(zhǔn)確度的點(diǎn),將其乘以分子將提供除法的商。
[0006]雖然牛頓拉普森收斂除法方法一般較快且更高效,但某些浮點(diǎn)數(shù)造成需要特別注意的有問(wèn)題的拐點(diǎn)情況。此類(lèi)有問(wèn)題的情況包含下溢,其中最終的商值太小而無(wú)法在IEEE754標(biāo)準(zhǔn)中使用指配位數(shù)來(lái)表示;溢出,其中最終的商值太大而無(wú)法在IEEE 754標(biāo)準(zhǔn)中使用指配位數(shù)來(lái)表示;不充分的精度,這歸因于與中間結(jié)果的下溢及溢出相似的情境;及有效數(shù)字值,其并不是非常適合于倒數(shù)細(xì)化。其它有問(wèn)題的情況涉及除以零、為無(wú)窮大或非數(shù)字值(NaN)的操作數(shù)值(分子/分母)等的除法。類(lèi)似性質(zhì)的問(wèn)題同樣出現(xiàn)在平方根計(jì)算中。
[0007]用于處置此類(lèi)有問(wèn)題的拐點(diǎn)情況的已知技術(shù)包含檢測(cè)拐點(diǎn)情況及實(shí)施陷阱。然而,陷阱的實(shí)施方案可涉及不希望的復(fù)雜性。舉例來(lái)說(shuō),陷阱的實(shí)施方案類(lèi)似于軟件浮點(diǎn)模擬,其為效率低下的及緩慢的。此外,實(shí)施陷阱還招致與保存上下文及在處置拐點(diǎn)情況之后恢復(fù)程序執(zhí)行相關(guān)聯(lián)的開(kāi)銷(xiāo)。陷阱處理程序還難以在不影響相關(guān)聯(lián)的處理器的程序流程的其余部分的性能的情況下集成在處理器的管線中。
[0008]另外,常規(guī)實(shí)施方案還可在每個(gè)計(jì)算階段期間設(shè)置某些旗標(biāo),此可導(dǎo)致低效率。舉例來(lái)說(shuō),牛頓拉普森除法的常規(guī)實(shí)施方案可針對(duì)涉及用于存儲(chǔ)中間計(jì)算階段中的值的中間寄存器的精度的缺乏的狀況設(shè)置錯(cuò)誤旗標(biāo)或浮點(diǎn)旗標(biāo),即使計(jì)算的理論上預(yù)期的最終結(jié)果可能并未引發(fā)任何此類(lèi)旗標(biāo)也如此。因此,在中間階段中設(shè)置此類(lèi)旗標(biāo)可產(chǎn)生錯(cuò)誤,這是因?yàn)槠鞓?biāo)可能已被不正確地設(shè)置。
[0009]因此,所屬領(lǐng)域中存在對(duì)克服與浮點(diǎn)運(yùn)算的常規(guī)實(shí)施方案相關(guān)聯(lián)的上述缺點(diǎn)的對(duì)應(yīng)需要。

【發(fā)明內(nèi)容】

[0010]本發(fā)明的示例性實(shí)施例涉及關(guān)于用于檢測(cè)及有效地處置例如除法及平方根計(jì)算等浮點(diǎn)運(yùn)算中的有問(wèn)題的拐點(diǎn)情況的專(zhuān)用指令及技術(shù)的系統(tǒng)及方法。
[0011]舉例來(lái)說(shuō),示例性實(shí)施例涉及一種操作浮點(diǎn)單元的方法,所述方法包括:從存儲(chǔ)器接收一或多個(gè)浮點(diǎn)數(shù);接收對(duì)應(yīng)于計(jì)算的浮點(diǎn)指令;檢測(cè)將在所述計(jì)算中產(chǎn)生有問(wèn)題的拐點(diǎn)情況的一或多個(gè)浮點(diǎn)數(shù);用定點(diǎn)化運(yùn)算修改所述計(jì)算以便避免所述有問(wèn)題的拐點(diǎn)情況;在所述計(jì)算的中間階段期間抑制錯(cuò)誤旗標(biāo);及執(zhí)行所述經(jīng)修改的計(jì)算。
[0012]另一示例性實(shí)施例涉及一種執(zhí)行浮點(diǎn)乘法累加(FMA)運(yùn)算的方法,所述方法包括:在浮點(diǎn)單元中接收乘數(shù)、被乘數(shù)及加數(shù)操作數(shù);檢測(cè)關(guān)于所述操作數(shù)的FMA運(yùn)算將產(chǎn)生異常;定義針對(duì)所述FMA運(yùn)算的特殊狀況;在所述FMA運(yùn)算期間抑制錯(cuò)誤旗標(biāo);及在所述浮點(diǎn)單元中根據(jù)所述特殊狀況執(zhí)行所述FM運(yùn)算。
[0013]另一示例性實(shí)施例涉及一種執(zhí)行具有按比例縮放的浮點(diǎn)乘法累加運(yùn)算(FMASc)的方法,所述方法包括:在浮點(diǎn)單元中接收乘數(shù)、被乘數(shù)、加數(shù)及比例因子操作數(shù);檢測(cè)關(guān)于所述操作數(shù)的FMASc運(yùn)算將產(chǎn)生異常;針對(duì)所述FMASc運(yùn)算定義特殊狀況;在所述FMASc運(yùn)算期間抑制錯(cuò)誤旗標(biāo);及在所述浮點(diǎn)單元中根據(jù)所述特殊狀況執(zhí)行所述FMASc運(yùn)算。
[0014]另一示例性實(shí)施例涉及一種浮點(diǎn)單元,其包括:用以接收一或多個(gè)浮點(diǎn)數(shù)及對(duì)應(yīng)于計(jì)算的浮點(diǎn)指令的邏輯;經(jīng)配置以檢測(cè)將在所述計(jì)算中產(chǎn)生有問(wèn)題的拐點(diǎn)情況的一或多個(gè)浮點(diǎn)數(shù)的檢測(cè)邏輯;用以在所述計(jì)算的中間階段期間抑制錯(cuò)誤旗標(biāo)的邏輯;經(jīng)配置以修改所述計(jì)算以便避免所述有問(wèn)題的拐點(diǎn)情況的修改邏輯;及用以執(zhí)行所述經(jīng)修改的計(jì)算的邏輯。
[0015]另一示例性實(shí)施例涉及一種系統(tǒng),其包括:用于接收一或多個(gè)浮點(diǎn)數(shù)及對(duì)應(yīng)于計(jì)算的浮點(diǎn)指令的裝置;用于檢測(cè)將在所述計(jì)算中產(chǎn)生有問(wèn)題的拐點(diǎn)情況的一或多個(gè)浮點(diǎn)數(shù)的裝置;用于在所述計(jì)算的中間階段期間抑制錯(cuò)誤旗標(biāo)的裝置;用于修改所述計(jì)算以便避免所述有問(wèn)題的拐點(diǎn)情況的裝置;及用于執(zhí)行所述經(jīng)修改的計(jì)算的裝置。
[0016]又一示例性實(shí)施例涉及一種非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體,其包括在由處理器執(zhí)行時(shí)致使所述處理器執(zhí)行用于執(zhí)行浮點(diǎn)計(jì)算的運(yùn)算的代碼,所述非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體包括:用于檢測(cè)將在所述計(jì)算中產(chǎn)生有問(wèn)題的拐點(diǎn)情況的一或多個(gè)浮點(diǎn)數(shù)的代碼;用于在所述計(jì)算的中間階段期間抑制錯(cuò)誤旗標(biāo)的代碼;用于用定點(diǎn)化運(yùn)算修改所述計(jì)算以便避免所述有問(wèn)題的拐點(diǎn)情況的代碼;及用于執(zhí)行所述經(jīng)修改的計(jì)算的代碼。
【附圖說(shuō)明】
[0017]呈現(xiàn)附圖以輔助描述本發(fā)明的實(shí)施例,且提供所述附圖僅用于說(shuō)明本發(fā)明的實(shí)施例而非限制本發(fā)明的實(shí)施例。
[0018]圖1A到IB說(shuō)明用于使用牛頓拉普森方法執(zhí)行浮點(diǎn)除法運(yùn)算的數(shù)學(xué)等式。
[0019]圖2說(shuō)明用于浮點(diǎn)除法的坐標(biāo)輸入的曲線圖。
[0020]圖3A到3B說(shuō)明根據(jù)示例性實(shí)施例的用于使用牛頓拉普森方法實(shí)施浮點(diǎn)除法的匯編及高級(jí)代碼序列。
[0021]圖4說(shuō)明用于執(zhí)行浮點(diǎn)平方根計(jì)算的數(shù)學(xué)等式。
[0022]圖5A到5C說(shuō)明根據(jù)示例性實(shí)施例的用于實(shí)施浮點(diǎn)平方根計(jì)算的匯編及高級(jí)代碼序列。
[0023]圖6A說(shuō)明根據(jù)示例性實(shí)施例的經(jīng)配置以執(zhí)行浮點(diǎn)計(jì)算的示例性系統(tǒng)600。
[0024]圖6B說(shuō)明根據(jù)示例性實(shí)施例的用于對(duì)浮點(diǎn)數(shù)執(zhí)行計(jì)算的方法的流程圖表示。
[0025]圖7說(shuō)明可有利地在其中使用本發(fā)明的實(shí)施例的示范性無(wú)線通信系統(tǒng)700。
【具體實(shí)施方式】
[0026]在以下針對(duì)本發(fā)明的特定實(shí)施例的描述及相關(guān)圖式中揭示本發(fā)明的若干方面??稍诓幻撾x本發(fā)明的范圍的情況下設(shè)計(jì)出替代實(shí)施例。另外,將不會(huì)詳細(xì)描述或?qū)⑹÷员景l(fā)明的眾所熟知的元件以免混淆本發(fā)明的相關(guān)細(xì)節(jié)。
[0027]詞語(yǔ)“示例性”在本文中用于意味著“充當(dāng)實(shí)例、例子或說(shuō)明”。本文中被描述為“示例性”的任何實(shí)施例未必應(yīng)解釋為比其它實(shí)施例優(yōu)選或有利。同樣,術(shù)語(yǔ)“本發(fā)明的實(shí)施例”并非要求本發(fā)明的所有實(shí)施例包含所論述的特征、優(yōu)點(diǎn)或操作模式。
[0028]本文中所使用的術(shù)語(yǔ)僅僅是為了描述特定實(shí)施例,且并不希望限制本發(fā)明的實(shí)施例。如本文所使用,除非上下文另外清楚地指示,否則單數(shù)形式“一”及“所述”希望還包含復(fù)數(shù)形式。將進(jìn)一步理解,術(shù)語(yǔ)“包括”及/或“包含”當(dāng)在本文中使用時(shí)指定所陳述的特征、整數(shù)、步驟、操作、元件及/或組件的存在,但并不排除一或多個(gè)其它特征、整數(shù)、步驟、操作、元件、組件及/或其群組的存在或添加。
[0029]另外,依據(jù)待由(例如)計(jì)算裝置的元件執(zhí)行的動(dòng)作序列來(lái)描述許多實(shí)施例。將認(rèn)識(shí)到,可由特定電路(例如,專(zhuān)用集成電路(ASIC))、由正由一或多個(gè)處理器執(zhí)行的程序指令或由兩者的組合來(lái)執(zhí)行本文中所描述的各種動(dòng)作。另外,本文中所描述的這些動(dòng)作序列可被視為全部在任何形式的計(jì)算機(jī)可讀存儲(chǔ)媒體內(nèi)體現(xiàn),在所述計(jì)算機(jī)可讀存儲(chǔ)媒體中存儲(chǔ)有一組對(duì)應(yīng)的計(jì)算機(jī)指令,所述計(jì)算機(jī)指令在執(zhí)行時(shí)將致使相關(guān)聯(lián)的處理器執(zhí)行本文中所描述的功能性。因此,本發(fā)明的各種方面可以數(shù)個(gè)不同形式來(lái)體現(xiàn),預(yù)期所有形式屬于所主張的標(biāo)的物的范圍內(nèi)。另外,對(duì)于本文中所描述的實(shí)施例中的每一者來(lái)說(shuō),任何此類(lèi)實(shí)施例的對(duì)應(yīng)形式可在本文中被描述為(例如)“經(jīng)配置以(執(zhí)行所描述動(dòng)作)的邏輯”。
[0030]示例性實(shí)施例包含用于克服常規(guī)浮點(diǎn)實(shí)施方案的缺點(diǎn)的各種技術(shù)、特殊指令及相關(guān)聯(lián)硬件/軟件支持。一些實(shí)施例可包含示例性格式的指令,例如具有特殊舍入模式及旗標(biāo)處置以便實(shí)施例如除法及平方根計(jì)算等浮點(diǎn)運(yùn)算的融合乘法加法(FMA)。因此,在
當(dāng)前第1頁(yè)1 2 3 4 5 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1