本實(shí)用新型涉及存儲器的領(lǐng)域,并且更具體而言,涉及在存儲器中的高效的故障監(jiān)測。
背景技術(shù):
在被突然地中斷之前,應(yīng)用可以容忍某種程度上的存儲器故障。在執(zhí)行應(yīng)用期間可能發(fā)生永久故障和瞬態(tài)故障。永久故障通常被定義為永久的并且當(dāng)應(yīng)用關(guān)閉時(shí)不消失的故障。永久故障通常是由存儲器的物理缺陷導(dǎo)致的。瞬態(tài)故障是在執(zhí)行應(yīng)用期間發(fā)生的并且當(dāng)應(yīng)用關(guān)閉時(shí)消失的故障。瞬態(tài)故障通常是在存儲器沒有物理缺陷的情況下由數(shù)據(jù)值的改變導(dǎo)致的,并且可以由于環(huán)境條件而發(fā)生。
通常,瞬態(tài)故障比永久故障發(fā)生得更加頻繁得多并且是存儲器在使用周期之上使故障顯現(xiàn)的結(jié)果。在存在糾錯機(jī)制的情況下,應(yīng)用可能需要了解這類故障的范圍以評估存儲器的物理缺陷的嚴(yán)重性。例如,一個(gè)應(yīng)用可以用于在汽車上使用的存儲器。
技術(shù)實(shí)現(xiàn)要素:
一種電子設(shè)備可以包括具有經(jīng)受瞬態(tài)故障和永久故障的多個(gè)存儲器位置的存儲器以及耦接于該存儲器的故障檢測電路。該故障檢測電路可以被配置成用于:在第一時(shí)間讀取該多個(gè)存儲器位置,并且在該第一時(shí)間基于讀取該多個(gè)存儲器位置確定包括這些瞬態(tài)和永久故障的第一故障計(jì)數(shù)和故障映射簽名,并且存儲該第一故障計(jì)數(shù)和故障映射簽名。該故障檢測電路還可以:在第二時(shí)間讀取該多個(gè)存儲器位置,并且在該第二時(shí)間基于讀取該多個(gè)存儲器位置確定包括這些瞬態(tài)和永久故障的第二故障計(jì)數(shù)和故障映射簽名,并且將該存儲的第一故障計(jì)數(shù)和故障映射簽名與該第二故障計(jì)數(shù)和故障映射簽名進(jìn)行比較以確定永久故障計(jì)數(shù)。因此,該故障檢測電路可以在存儲器中檢測故障的范圍,如在故障達(dá)到應(yīng)用被突然地中斷的閾值點(diǎn)之前。
故障檢測設(shè)備還可以包括用于基于永久故障計(jì)數(shù)超過閾值而生成指示的指示器電路。此外,故障檢測電路可以包括被配置成用于讀取該多個(gè)存儲器位置的存儲器控制器以及耦接于存儲器控制器的存儲器錯誤處置器。存儲器控制器可以包括循環(huán)冗余校驗(yàn)(CRC)電路和錯誤計(jì)數(shù)器,該CRC電路被配置成用于檢測瞬態(tài)和永久故障,而該錯誤計(jì)數(shù)器耦接于該CRC電路并且被配置成用于確定瞬態(tài)和永久故障的第一和第二計(jì)數(shù)。
故障檢測電路可以進(jìn)一步包括處理器,該處理器耦接于CRC電路和錯誤計(jì)數(shù)器以將存儲的第一故障計(jì)數(shù)和故障映射簽名與第二故障計(jì)數(shù)和故障映射簽名進(jìn)行比較從而基于存儲的第一故障計(jì)數(shù)和故障映射簽名與第二故障計(jì)數(shù)和故障映射簽名之間的改變確定永久故障計(jì)數(shù)。存儲器控制器可以被配置成用于在存儲器內(nèi)的不同塊之上以三重復(fù)制存儲第一故障計(jì)數(shù)和故障映射簽名以及永久故障計(jì)數(shù)并且CRC電路可以被配置成用于從每個(gè)瞬態(tài)和永久故障計(jì)算故障映射簽名。
用于確定故障計(jì)數(shù)和故障映射簽名的第一時(shí)間可以對應(yīng)于存儲器的掉電事件而第二時(shí)間可以是存儲器的上電事件,其中,每個(gè)瞬態(tài)和永久故障可以具有與其相關(guān)聯(lián)的存儲器地址和校正子。此外,每個(gè)瞬態(tài)故障可以是單比特或雙比特可校正的錯誤,而每個(gè)永久故障可以是三比特不可校正的錯誤。存儲器可以是非易失性存儲器。
根據(jù)本公開的實(shí)施方式,提供了一種電子設(shè)備,其特征在于包括:存儲器,所述存儲器具有經(jīng)受瞬態(tài)故障和永久故障的多個(gè)存儲器位置;以及故障檢測電路,所述故障檢測電路耦接于所述存儲器并且被配置成用于:在第一時(shí)間讀取所述多個(gè)存儲器位置并且在所述第一時(shí)間基于讀取所述多個(gè)存儲器位置確定包括所述瞬態(tài)和永久故障的第一故障計(jì)數(shù)和故障映射簽名,存儲所述第一故障計(jì)數(shù)和故障映射簽名,在第二時(shí)間讀取所述多個(gè)存儲器位置并且在所述第二時(shí)間基于讀取所述多個(gè)存儲器位置確定包括所述瞬態(tài)和永久故障的第二故障計(jì)數(shù)和故障映射簽名,并且將所述存儲的第一故障計(jì)數(shù)和故障映射簽名與所述第二故障計(jì)數(shù)和故障映射簽名進(jìn)行比較以確定永久故障計(jì)數(shù)。
可選地,所述故障檢測電路進(jìn)一步包括指示器,所述指示器被配置成用于基于所述永久故障計(jì)數(shù)超過閾值而生成指示。
可選地,所述故障檢測電路包括:存儲器控制器,所述存儲器控制器被配置成用于讀取所述多個(gè)存儲器位置;以及存儲器錯誤處置器,所述存儲器錯誤處置器耦接于所述存儲器控制器。
可選地,所述存儲器控制器包括:循環(huán)冗余校驗(yàn)電路,所述循環(huán)冗余校驗(yàn)電路被配置成用于檢測所述瞬態(tài)和永久故障;以及錯誤計(jì)數(shù)器,所述錯誤計(jì)數(shù)器耦接于所述循環(huán)冗余校驗(yàn)電路并且被配置成用于確定所述瞬態(tài)和永久故障的所述第一和第二計(jì)數(shù)。
可選地,所述故障檢測電路進(jìn)一步包括處理器,所述處理器耦接于所述循環(huán)冗余校驗(yàn)電路和所述錯誤計(jì)數(shù)器以將所述存儲的第一故障計(jì)數(shù)和故障映射簽名與所述第二故障計(jì)數(shù)和故障映射簽名進(jìn)行比較從而基于所述存儲的第一故障計(jì)數(shù)和故障映射簽名與所述第二故障計(jì)數(shù)和故障映射簽名之間的改變確定所述永久故障計(jì)數(shù)。
可選地,所述存儲器控制器被配置成用于在所述存儲器內(nèi)的不同塊之上以三重復(fù)制存儲所述第一故障計(jì)數(shù)和故障映射簽名以及所述永久故障計(jì)數(shù)。
可選地,所述循環(huán)冗余校驗(yàn)電路被配置成用于針對每個(gè)瞬態(tài)和永久故障計(jì)算漸進(jìn)式簽名。
可選地,所述第一時(shí)間包括所述存儲器的掉電事件。
可選地,所述第二時(shí)間包括所述存儲器的上電事件。
可選地,每個(gè)瞬態(tài)和永久故障具有與其相關(guān)聯(lián)的存儲器地址和校正子。
可選地,每個(gè)瞬態(tài)故障包括單比特或雙比特可校正的錯誤,而每個(gè)永久故障包括三比特不可校正的錯誤。
可選地,所述存儲器包括非易失性存儲器。
根據(jù)本公開的實(shí)施方式,還提供了一種用于具有經(jīng)受瞬態(tài)故障和永久故障的多個(gè)存儲器位置的存儲器的故障檢測設(shè)備,其特征在于所述故障檢測設(shè)備包括:存儲器控制器和與其協(xié)同操作的存儲器錯誤處置器,并且被配置成用于:在第一時(shí)間讀取所述多個(gè)存儲器位置并且在所述第一時(shí)間基于讀取所述多個(gè)存儲器位置確定包括所述瞬態(tài)和永久故障的第一故障計(jì)數(shù)和故障映射簽名,存儲所述第一故障計(jì)數(shù)和故障映射簽名,在第二時(shí)間讀取所述多個(gè)存儲器位置并且在所述第二時(shí)間基于讀取所述多個(gè)存儲器位置確定包括所述瞬態(tài)和永久故障的第二故障計(jì)數(shù)和故障映射簽名,并且將所述存儲的第一故障計(jì)數(shù)和故障映射簽名與所述第二故障計(jì)數(shù)和故障映射簽名進(jìn)行比較以確定永久故障計(jì)數(shù)。
可選地,該故障檢測設(shè)備進(jìn)一步包括指示器,所述指示器被配置成用于基于所述永久故障計(jì)數(shù)超過閾值而生成指示。
可選地,所述存儲器控制器包括:循環(huán)冗余校驗(yàn)電路,所述循環(huán)冗余校驗(yàn)電路被配置成用于檢測所述瞬態(tài)和永久故障;以及錯誤計(jì)數(shù)器,所述錯誤計(jì)數(shù)器耦接于所述循環(huán)冗余校驗(yàn)電路并且被配置成用于確定所述瞬態(tài)和永久故障的所述第一和第二計(jì)數(shù)。
可選地,該故障檢測設(shè)備進(jìn)一步包括處理器,所述處理器耦接于所述循環(huán)冗余校驗(yàn)電路和所述錯誤計(jì)數(shù)器以將所述存儲的第一故障計(jì)數(shù)和故障映射簽名與所述第二故障計(jì)數(shù)和故障映射簽名進(jìn)行比較從而基于所述存儲的第一故障計(jì)數(shù)和故障映射簽名與所述第二故障計(jì)數(shù)和故障映射簽名之間的改變確定所述永久故障計(jì)數(shù)。
可選地,所述存儲器控制器被配置成用于在所述存儲器內(nèi)的不同塊之上以三重復(fù)制存儲所述第一故障計(jì)數(shù)和故障映射簽名以及所述永久故障計(jì)數(shù)。
可選地,所述循環(huán)冗余校驗(yàn)電路被配置成用于從每個(gè)瞬態(tài)和永久故障計(jì)算故障映射簽名。
可選地,所述第一時(shí)間包括所述存儲器的掉電事件。
可選地,所述第二時(shí)間包括所述存儲器的上電事件。
可選地,每個(gè)瞬態(tài)和永久故障具有與其相關(guān)聯(lián)的存儲器地址和校正子。
可選地,每個(gè)瞬態(tài)故障包括單比特或雙比特可校正的錯誤,而每個(gè)永久故障包括三比特不可校正的錯誤。
附圖說明
圖1是根據(jù)本實(shí)用新型的實(shí)施例的電子設(shè)備的框圖;
圖2是圖1的電子設(shè)備的更詳細(xì)的框圖;并且
圖3是根據(jù)本實(shí)用新型的實(shí)施例的一種監(jiān)測故障的方法的流程圖。
具體實(shí)施方式
現(xiàn)在將參照附圖在下文中更為全面地描述本實(shí)用新型,在附圖中示出了本實(shí)用新型的優(yōu)選實(shí)施例。然而,本實(shí)用新型可以用許多不同的形式來體現(xiàn),并且不應(yīng)當(dāng)被解釋為限于在此所列出的實(shí)施例。相反,提供了這些實(shí)施例從而使得本披露將是全面和完整的,并且將向本領(lǐng)域技術(shù)人員完全傳達(dá)本實(shí)用新型的范圍。貫穿全文相似的數(shù)字指代相似的元件,并且上撇號符號用于指示在替代實(shí)施例中的類似元件。
首先參照圖1,電子設(shè)備100被展示具有耦接于存儲器104的故障檢測電路102。存儲器104可以具有經(jīng)受瞬態(tài)故障和永久故障的多個(gè)存儲器位置。故障檢測電路102可以被配置成用于在第一時(shí)間(例如,掉電)處讀取存儲器104并且在該第一時(shí)間處基于讀取存儲器104確定包括這些瞬態(tài)和永久故障的第一故障計(jì)數(shù)和故障映射簽名。存儲第一故障計(jì)數(shù)和故障映射簽名。在具體實(shí)施例中,還可以在第二時(shí)間(例如,上電)處讀取存儲器104并且在該第二時(shí)間處基于讀取該多個(gè)存儲器位置確定包括這些瞬態(tài)和永久故障的第二故障計(jì)數(shù)和故障映射簽名。故障檢測電路102可以將對應(yīng)于掉電事件的存儲的第一故障計(jì)數(shù)和故障映射簽名與對應(yīng)于上電事件的第二故障計(jì)數(shù)和故障映射簽名進(jìn)行比較以確定永久故障計(jì)數(shù)。
電子設(shè)備100能夠在啟動(例如,上電)時(shí)并且在關(guān)機(jī)(例如,掉電)之前管理并讀取存儲器102、將故障信息存儲在可檢索的位置中、對存儲的故障信息和最近的測試執(zhí)行評估、并且讀取結(jié)果從而評估永久和瞬態(tài)故障的范圍。
如以上所解釋的,讀取存儲器104(例如,閃存或其他非易失性存儲器)并且可以在測試期間檢測可校正的錯誤。例如,可校正的錯誤可以是單比特、雙比特或三比特的。對應(yīng)于每種類型的可校正的錯誤的地址和校正子可以用于計(jì)算對應(yīng)的可校正的錯誤的唯一簽名。
此外,在存儲器104中每種類型的可校正的錯誤的數(shù)量由故障檢測電路102計(jì)數(shù)。此計(jì)數(shù)可以與上一次上電和掉電測試的存儲的計(jì)數(shù)結(jié)果進(jìn)行比較并且可以相應(yīng)地關(guān)于每種類型的永久和瞬態(tài)故障更新這些記錄。
例如,在上電時(shí)未被檢測到但在上一次掉電時(shí)被檢測到的可校正的錯誤被認(rèn)為是瞬態(tài)故障,而在上電和掉電時(shí)都被檢測到的可校正的錯誤被認(rèn)為是永久故障。每種類型的可校正的錯誤的簽名和計(jì)數(shù)被存儲在存儲器104(例如,數(shù)據(jù)閃存)內(nèi)部并且可以由分布在不同的存儲塊之上的三重復(fù)制和糾錯方案保護(hù)。
現(xiàn)在參照圖2,故障檢測電路102可以包括存儲器控制器106。存儲器控制器可以被配置成用于讀取存儲器104的多個(gè)存儲器位置。存儲器控制器106耦接于系統(tǒng)/測試總線104。如將由本領(lǐng)域技術(shù)人員認(rèn)識到的是,存儲器控制器106還可以具有循環(huán)冗余校驗(yàn)(CRC)108,該CRC被配置成用于檢測瞬態(tài)和永久故障。CRC 108還可以針對每個(gè)瞬態(tài)和永久故障使用對應(yīng)可校正的錯誤的地址和校正子計(jì)算簽名。
存儲器控制器106的錯誤計(jì)數(shù)器110可以用于確定瞬態(tài)和永久故障的第一和第二計(jì)數(shù)。存儲器控制器106可以包括處理器112,該處理器可以用軟件編程或者可以是專用集成電路(ASIC)。例如,存儲器控制器106的處理器112可以被配置成用于將第一故障計(jì)數(shù)和故障映射簽名與第二故障計(jì)數(shù)和故障映射簽名進(jìn)行比較以基于對應(yīng)于掉電事件的第一故障計(jì)數(shù)和故障映射簽名與對應(yīng)于上電事件的第二故障計(jì)數(shù)和故障映射簽名之間的改變確定永久故障計(jì)數(shù)。在特定實(shí)施例中,每個(gè)瞬態(tài)故障可以例如被定義為單比特或雙比特可校正的錯誤,而每個(gè)永久故障可以例如被定義為三比特不可校正的錯誤??尚U腻e誤比特計(jì)數(shù)基于糾錯方案是可擴(kuò)展的。
故障檢測電路102的存儲器錯誤處置器114可以耦接于存儲器104并且被配置成用于接收永久和瞬態(tài)故障。存儲器錯誤處置器114可以被配置成用于存儲(n)個(gè)可校正的和(m)個(gè)不可校正的錯誤。盡管安全和高保險(xiǎn)系統(tǒng)可以實(shí)現(xiàn)用于在電子設(shè)備100的壽命期間處置錯誤的糾錯方案,在故障達(dá)到應(yīng)用116被突然地中斷的臨界點(diǎn)之前故障在存儲器104中的范圍現(xiàn)在可以由故障檢測電路102指示。
例如,如將由本領(lǐng)域技術(shù)人員認(rèn)識到的是,糾錯方案可以校正多達(dá)(x)個(gè)比特。存儲器錯誤處置器114接收所有錯誤指示,即,具有相應(yīng)的地址和校正子的可校正的和不可校正的錯誤。存儲器錯誤處置器114可以存儲最多(n)個(gè)可校正的和(m)個(gè)不可校正的錯誤。將多達(dá)(x-1)個(gè)比特校正的可校正的錯誤轉(zhuǎn)發(fā)至存儲器錯誤處置器114可以由寄存器掩模,實(shí)現(xiàn)針對在存儲器控制器106內(nèi)部的隨機(jī)/瞬態(tài)故障的保護(hù)方案。例如,單比特錯誤可以被掩模為不重要的。
在存儲器104的啟動測試之后,將針對每種類型的可校正的錯誤的由CRC 108計(jì)算的簽名和錯誤計(jì)數(shù)器110的計(jì)數(shù)與之前存儲的記錄進(jìn)行比較以檢測每種類型的可校正的錯誤的數(shù)量中的任何改變。針對每種類型的可校正的錯誤的計(jì)數(shù)的增加可以指示應(yīng)用116可能更近乎被突然地中斷。故障檢測電路進(jìn)一步包括耦接于處理器112以基于永久故障計(jì)數(shù)超過閾值而生成指示的指示器電路或指示器118。
如以上所解釋的,在正常操作期間,可校正的錯誤掩模(CE-MASK)可以活躍的并且阻止將特定的可校正的錯誤(單比特)轉(zhuǎn)發(fā)至存儲器錯誤處置器114。出于用于診斷失效的調(diào)試目的,CE-MASK可以被取消激活。
直到?jīng)]有(x)比特可校正的錯誤被報(bào)告時(shí),針對(x-1)比特或更少比特的校正不被故障檢測電路102(可配置的)考慮在內(nèi)。在第一個(gè)(x)比特校正被報(bào)告后,在每次上電時(shí)執(zhí)行測試,其中,存儲器104的所有位置被讀取并且錯誤的簽名由CRC 108計(jì)算連同由錯誤計(jì)數(shù)器110執(zhí)行對每個(gè)可校正的錯誤的計(jì)數(shù)。在運(yùn)行時(shí)期間,瞬態(tài)(x-1)比特可校正的錯誤不被報(bào)告給存儲器控制器106。
在硬件/軟件控制之下在不同的閃存塊之上分布的存儲器104(例如,數(shù)據(jù)閃存)中以三重復(fù)制存儲針對每種類型的錯誤的簽名和計(jì)數(shù)。
在每次測試之后,將針對每種類型的可校正的錯誤(單比特、雙比特、三比特……)的計(jì)算的簽名和計(jì)數(shù)與之前存儲的計(jì)數(shù)(例如,來自上電或掉電)進(jìn)行比較以檢測每種類型的可校正的錯誤的數(shù)量中的任何改變并且記錄因此針對瞬態(tài)和永久類型的故障被更新。在掉電時(shí),存儲器104被再次讀取并且每個(gè)可校正的錯誤的簽名和錯誤計(jì)數(shù)可以被存儲。因此,在從之前的上電事件到掉電事件處可校正的錯誤沒有改變指示沒有附加的瞬態(tài)故障。如果在從上一次掉電事件到下一個(gè)上電事件處可校正的錯誤的計(jì)數(shù)沒有改變,那么沒有附加的永久故障被檢測到。
在正常操作期間,單錯誤校正掩模(SEC-MASK)可以是活躍的并且阻止將SEC事件轉(zhuǎn)發(fā)至存儲器錯誤處置器114。出于用于診斷失效的調(diào)試目的,SEC-MASK可以被取消激活。
現(xiàn)在參照圖3,現(xiàn)在描述并且總體上指定一種監(jiān)測存儲器中的故障的方法200的流程圖。以上所描述的故障檢測電路102可以實(shí)現(xiàn)方法200。例如,在202在第一時(shí)間讀取多個(gè)存儲器位置,并且在204在第一時(shí)間(例如,對應(yīng)于掉電事件)并且基于讀取該多個(gè)存儲器位置確定包括瞬態(tài)和永久故障的第一故障計(jì)數(shù)。移至206,在存儲器內(nèi)的不同存儲器塊之上以三重復(fù)制存儲永久和瞬態(tài)故障的第一故障計(jì)數(shù)和故障映射簽名。
在208在第二時(shí)間處讀取該多個(gè)存儲器位置并且在210在該第二時(shí)間(例如,對應(yīng)于上電事件)處基于讀取該多個(gè)存儲器位置確定包括這些瞬態(tài)和永久故障的第二故障計(jì)數(shù)和故障映射簽名。在212,將存儲的第一故障計(jì)數(shù)和故障映射簽名(例如,對應(yīng)于掉電事件)與第二故障計(jì)數(shù)和故障映射簽名(例如,對應(yīng)于上電事件)進(jìn)行比較以確定永久故障計(jì)數(shù)。在214,基于永久故障計(jì)數(shù)超過閾值而生成指示。在216,可以在存儲器中的不同塊之上以三重復(fù)制存儲第二故障計(jì)數(shù)和故障映射簽名。在204,該方法可以通過再次讀取存儲器位置并且重復(fù)以上所描述的處理而繼續(xù)監(jiān)測永久和瞬態(tài)故障。
本實(shí)用新型的許多修改和其他實(shí)施例對于受益于前面的描述和相關(guān)附圖中呈現(xiàn)的教導(dǎo)的本領(lǐng)域技術(shù)人員來說將是顯而易見的。因此,應(yīng)當(dāng)理解本實(shí)用新型不限于所披露的具體實(shí)施例,并且那些修改及實(shí)施例旨在被包括于所附權(quán)利要求書的范圍內(nèi)。