專利名稱:一種故障檢測(cè)的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)采集處理技術(shù)領(lǐng)域,特別是涉及一種工藝過程中故障檢測(cè) 的方法和系統(tǒng)。
背景技術(shù):
在半導(dǎo)體加工工業(yè)中,隨著加工的技術(shù)節(jié)點(diǎn)越來越小,對(duì)晶片加工的要求 越來越高,因此各種先進(jìn)的控制手段逐漸被用在半導(dǎo)體加工工業(yè)。例如先進(jìn)工
藝控制(Advanced Process Control )方法目前已經(jīng)廣泛應(yīng)用于300mm晶片加 工廠中。
而各種工藝控制解決方案一般都會(huì)包括故障檢測(cè)。其中,故障檢測(cè)可以利 用各種硬件傳感器實(shí)時(shí)監(jiān)控的數(shù)據(jù),使用統(tǒng)計(jì)等方法對(duì)數(shù)據(jù)進(jìn)行處理,及時(shí)發(fā) 現(xiàn)故障,避免后續(xù)晶片的浪費(fèi)。
為了實(shí)現(xiàn)故障檢測(cè),現(xiàn)有技術(shù)提出了以下解決方案
方案1
同時(shí)監(jiān)控多組工藝過程中的硬件參數(shù),并由結(jié)果分析出現(xiàn)問題的硬件,從 而進(jìn)行修正。該解決方案首先將一片晶片加工工藝過程的監(jiān)控?cái)?shù)據(jù)進(jìn)行了統(tǒng)計(jì) 分析,計(jì)算其平均值、標(biāo)準(zhǔn)偏差等統(tǒng)計(jì)量,然后利用這些統(tǒng)計(jì)量進(jìn)行診斷,即 判斷這些統(tǒng)計(jì)量的計(jì)算結(jié)果是否在控制線內(nèi),如果不在,表明某個(gè)^:件發(fā)生了 故障,或工藝發(fā)生了漂移。
但是上述方案是利用對(duì)一片晶片加工過程的監(jiān)控?cái)?shù)據(jù)進(jìn)行處理后,所得到 的一個(gè)統(tǒng)計(jì)量作為基礎(chǔ)進(jìn)行計(jì)算的,該方法無法采集到設(shè)備參數(shù)在實(shí)時(shí)過程中 發(fā)生的短時(shí)間的漂移,有可能丟失實(shí)時(shí)故障的信息,而隨著目前對(duì)工藝結(jié)果要 求越來越高,即使很短暫的故障也會(huì)導(dǎo)致晶片上部分單元無法滿足要求,從而 浪費(fèi)了晶片。并且更重要的是無法得到故障的信息,導(dǎo)致已經(jīng)存在問題的硬件 不能得到及時(shí)的維護(hù),造成更多晶片的浪費(fèi)。
方案2
現(xiàn)有技術(shù)的另一解決方案是對(duì)設(shè)備進(jìn)行實(shí)時(shí)數(shù)據(jù)的監(jiān)控,即對(duì)一些重要 參數(shù),實(shí)時(shí)監(jiān)控其數(shù)值,并設(shè)立上下控制界限,如果某個(gè)參數(shù)超過了控制界限,
4則對(duì)這個(gè)參數(shù)發(fā)生報(bào)警;從而指導(dǎo)設(shè)備工程師進(jìn)行維護(hù)。
但目前的方法是人為單獨(dú)對(duì)每個(gè)參數(shù)設(shè)置上下控制線,固然可以實(shí)現(xiàn)對(duì)各 個(gè)參數(shù)的單獨(dú)報(bào)警,但是無法確保相互關(guān)聯(lián)的參數(shù),其關(guān)聯(lián)性發(fā)生漂移,即雖 然每一個(gè)參數(shù)都沒有超出控制線,但其相互的相關(guān)性參數(shù)已經(jīng)漂移,即實(shí)際上 某個(gè)或某些硬件已經(jīng)發(fā)生了問題,但沒有被發(fā)現(xiàn)。
總之,需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問題就是如何能夠創(chuàng)新 性的提出一種提高檢測(cè)靈敏度的故障檢測(cè)解決方案。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種故障檢測(cè)的方法和裝置,能夠提高 故障檢測(cè)的靈敏度,并有效的防止誤報(bào)警。
為了解決上述問題,本發(fā)明公開了一種故障檢測(cè)的方法,可以包括采集 多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù);將所述多個(gè)參數(shù)變換為至少一個(gè)參數(shù)組合,每個(gè)參數(shù)組 合中至少包括兩個(gè)參數(shù);計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù);判斷該 指標(biāo)參數(shù)是否在闊值范圍內(nèi),如果超過閾值范圍,則確認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障。
優(yōu)選的,所述的方法還可以包括分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度 超過閾值的參數(shù)組合;計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值的參數(shù), 確定其為問題參數(shù)。
優(yōu)選的,所述的方法還可以包括分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度 超過閾值的參數(shù)組合;計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過闊值的參數(shù); 將在不同參數(shù)組合中,對(duì)主元貢獻(xiàn)度都超過閾值的參數(shù)確定為問題參數(shù)。
優(yōu)選的,所述的方法還可以包括依據(jù)所述問題參數(shù)確定故障硬件。
優(yōu)選的,所述的方法還可以包括發(fā)出報(bào)警和相應(yīng)提示信息。
優(yōu)選的,所述的方法還可以包括在采集數(shù)據(jù)的開始階段,去除超出閾值 范圍的參數(shù)數(shù)據(jù)。
優(yōu)選的,可以通過以下方式去除超出閾值范圍的參數(shù)數(shù)據(jù)對(duì)于各個(gè)參數(shù) 實(shí)時(shí)數(shù)據(jù),判斷其是否超出了基準(zhǔn)數(shù)據(jù)的3倍標(biāo)準(zhǔn)偏差,如果超過,則去除。 依據(jù)本發(fā)明的另一優(yōu)選實(shí)施例,還公開了一種故障檢測(cè)的系統(tǒng),包括 變換單元,用于將所采集的多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù)變換為至少一個(gè)參數(shù)組 合,每個(gè)參數(shù)組合中至少包括兩個(gè)參數(shù);指標(biāo)計(jì)算單元,用于計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù);
故障判定單元,用于判斷該指標(biāo)參數(shù)是否在闊偉范圍內(nèi),如果超過閾值范 圍,則確認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障。
優(yōu)選的,所述的系統(tǒng)還可以包括參數(shù)組合確定單元,用于分析確定在當(dāng)
前故障點(diǎn),對(duì)故障貢獻(xiàn)度超過閾值的參數(shù)組合;參數(shù)確定單元,用于計(jì)算得到
該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值的參數(shù),確定其為問題參數(shù)。
優(yōu)選的,所述的系統(tǒng)還可以包括
參數(shù)組合確定單元,用于分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度超過閾值 的參數(shù)組合;
參數(shù)確定單元,用于計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值的參
數(shù);
問題參數(shù)確定單元,用于將在不同參數(shù)組合中,對(duì)主元貢獻(xiàn)度都超過閾值 的參數(shù)確定為問題參數(shù)。
優(yōu)選的,所述的系統(tǒng)還可以包括硬件確定單元,用于依據(jù)所述問題參數(shù) 確定故障硬件。
優(yōu)選的,所述的系統(tǒng)還可以包括報(bào)警單元,用于發(fā)出報(bào)警和相應(yīng)提示信
自
優(yōu)選的,所述的系統(tǒng)還可以包括數(shù)據(jù)篩選單元,用于在采集數(shù)據(jù)的開始 階段,去除超出閾值范圍的參數(shù)數(shù)據(jù)。
優(yōu)選的,可以通過以下方式去除超出閾值范圍的參數(shù)數(shù)據(jù)對(duì)于各個(gè)參數(shù) 實(shí)時(shí)數(shù)據(jù),判斷其是否超出了基準(zhǔn)數(shù)據(jù)的3倍標(biāo)準(zhǔn)偏差,如果超過,則去除。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)
本發(fā)明結(jié)合多變量分析的方法,對(duì)實(shí)時(shí)的數(shù)據(jù)進(jìn)行處理;即在進(jìn)行工藝的 實(shí)時(shí)過程中,對(duì)每一個(gè)實(shí)時(shí)數(shù)據(jù)進(jìn)行多變量分析,從而確保不會(huì)丟失工藝過程 中的瞬間數(shù)據(jù),及時(shí)發(fā)現(xiàn)有問題的信息。另外,本發(fā)明使用了多變量的方法進(jìn) 行監(jiān)控,不僅考慮了每一個(gè)參數(shù)的變化,而且考慮了各參數(shù)之間的關(guān)聯(lián),可以 提高檢測(cè)靈敏度,并有效的防止誤報(bào)警。
本發(fā)明提高了故障檢測(cè)的準(zhǔn)確性和故障檢測(cè)的易用性,避免了從大量參數(shù)中挑選需要參數(shù)的過程。并利用多變量分析的方法對(duì)數(shù)據(jù)進(jìn)行分析,判斷發(fā)生 故障的原因,從 指導(dǎo)設(shè)備工程師對(duì)硬件問題進(jìn)行解決。
另外,本發(fā)明將工藝過程中的不穩(wěn)定點(diǎn)(如工藝開始階段的不穩(wěn)定點(diǎn))去 掉,避免了引入數(shù)據(jù)噪音,使數(shù)據(jù)無法和建立模型的數(shù)據(jù)比較,可以減少故障 的誤報(bào)。
圖1是本發(fā)明一種故障檢測(cè)的方法實(shí)施例1的步驟流程圖; 圖2是本發(fā)明一種故障檢測(cè)的方法實(shí)施例2的步驟流程圖; 圖3是本發(fā)明一種故障檢測(cè)的方法實(shí)施例3的步驟流程圖; 圖4是本發(fā)明一種以半導(dǎo)體工藝過程為例的方法實(shí)施例4的具體步驟流程
圖5是本發(fā)明一個(gè)工藝實(shí)時(shí)判斷情況的示意圖6是對(duì)實(shí)時(shí)數(shù)據(jù)按照本發(fā)明進(jìn)行處理后的一種結(jié)果示意圖7是對(duì)實(shí)時(shí)數(shù)據(jù)按照現(xiàn)有技術(shù)進(jìn)行處理后的一種結(jié)果示意圖8是本發(fā)明一種故障檢測(cè)的系統(tǒng)實(shí)施例1的結(jié)構(gòu)框圖9是本發(fā)明一種故障檢測(cè)的系統(tǒng)實(shí)施例2的結(jié)構(gòu)框圖IO是本發(fā)明一種故障檢測(cè)的系統(tǒng)實(shí)施例3的結(jié)構(gòu)框圖。
具體實(shí)施例方式
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。
本發(fā)明可用于眾多通用或?qū)S玫挠?jì)算系統(tǒng)環(huán)境或配置中。例如個(gè)人計(jì)算 機(jī)、服務(wù)器計(jì)算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基 于微處理器的系統(tǒng)、包括以上任何系統(tǒng)或設(shè)備的分布式計(jì)算環(huán)境等等。
本發(fā)明可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例 如程序模塊。 一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的 例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本 發(fā)明,在這些分布式計(jì)算環(huán)境中,由通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來 執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序^^莫塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。
參照?qǐng)D1,示出了本發(fā)明一種故障檢測(cè)的方法實(shí)施例1,具體可以包括 步驟IOI、采集多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù);
步驟102、將所述多個(gè)參數(shù)變換為至少一個(gè)參數(shù)組合,每個(gè)參數(shù)組合中至 少包括兩個(gè)參數(shù);
步驟103、計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù);
步驟104、判斷該指標(biāo)參數(shù)是否在閾值范圍內(nèi),如果超過閾值范圍,則確 認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障。
在確定出現(xiàn)故障之后,就可以發(fā)出報(bào)警和相應(yīng)的提示信息,以提示設(shè)備工 程師進(jìn)行維護(hù)。當(dāng)然,由于此時(shí)并沒有進(jìn)行更深入的故障分析,因此給出的提 示信息可能比較模糊。
由于在數(shù)據(jù)釆集的開始階段,可能存在一些不穩(wěn)定的數(shù)據(jù)點(diǎn),為了避免故 障的誤報(bào),需要去除這些不穩(wěn)定點(diǎn), 一般的可以通過設(shè)置閾值范圍來去除這些 不穩(wěn)定點(diǎn)。例如,對(duì)于各個(gè)參數(shù)實(shí)時(shí)數(shù)據(jù),判斷其是否超出了基準(zhǔn)數(shù)據(jù)的3 倍標(biāo)準(zhǔn)偏差,如果超過,則去除。當(dāng)然,本發(fā)明也可以采用其他方式去除這些 不穩(wěn)定點(diǎn),例如,由設(shè)備工程師依據(jù)自己的經(jīng)驗(yàn)手動(dòng)去除,或者依據(jù)經(jīng)驗(yàn)針對(duì) 特定參數(shù)預(yù)設(shè)上下限值等等。
對(duì)于步驟102, 一般可以通過PCA分析方法將所述多個(gè)參數(shù)變換為幾個(gè)參 數(shù)組合的形式,每個(gè)參數(shù)組合中至少包括兩個(gè)參數(shù),典型的參數(shù)組合數(shù)量可以 為3—6組。也可以根據(jù)工程師的經(jīng)驗(yàn),將相同類型的參數(shù)數(shù)量減少,獲得所 需的參數(shù)組合。
PCA是Principal component analysis的縮寫,中文翻譯為主元分析。 它是一種對(duì)數(shù)據(jù)進(jìn)行分析的技術(shù),最重要的應(yīng)用是對(duì)原有數(shù)據(jù)進(jìn)行簡(jiǎn)化。正如 它的名字主元分析,這種方法可以有效的找出數(shù)據(jù)中最"主要"的元素和結(jié) 構(gòu),去除噪音和冗余,將原有的復(fù)雜數(shù)據(jù)降維,揭示隱藏在復(fù)雜數(shù)據(jù)背后的簡(jiǎn) 單結(jié)構(gòu)。它的優(yōu)點(diǎn)是簡(jiǎn)單,而且無參數(shù)限制,可以方便的應(yīng)用與各個(gè)場(chǎng)合。因 此應(yīng)用極其廣泛,從神經(jīng)科學(xué)到計(jì)算機(jī)圖形學(xué)都有它的用武之地,PCA被譽(yù)為應(yīng)用線形代數(shù)最價(jià)值的結(jié)果之一。由于PCA理論比較成熟,并且本領(lǐng)域技術(shù)人
員應(yīng)用該理論無需創(chuàng)造性勞動(dòng)就可以實(shí)現(xiàn)上述變換過程,因此本發(fā)明在此對(duì)具 體變換實(shí)現(xiàn)過程不再贅述。
對(duì)于步驟103,可以通過Hotel ling T2或Q統(tǒng)計(jì)等算法計(jì)算得到針對(duì)所 述參數(shù)組合的一個(gè)指標(biāo)參數(shù)。Hotelling T2或Q統(tǒng)計(jì)是本領(lǐng)域常用的兩種數(shù) 學(xué)分析工具。其中,Hotelling T2主要原理是判斷待;險(xiǎn)測(cè)點(diǎn)到建立;f莫型的正 常數(shù)據(jù)點(diǎn)之間的距離是否大于控制限,即如果此距離過大表明超出控制限,即 此待檢測(cè)數(shù)據(jù)點(diǎn)出現(xiàn)故障。這種方法主要用來檢測(cè)在PCA方法后,那些主元模 型中發(fā)生的波動(dòng)。Q統(tǒng)計(jì)可以檢測(cè)那些落在非主元模型的數(shù)據(jù)發(fā)生偏移的現(xiàn) 象,在正常的工藝波動(dòng)下,測(cè)量數(shù)據(jù)在非主元空間內(nèi)的投影較小, 一般是由自 由噪音形成的,但是當(dāng)發(fā)生故障時(shí),這個(gè)投影就會(huì)顯著增加,通過判斷投影的 大小,得出故障發(fā)生的情況。Hotelling T2和Q統(tǒng)計(jì)的方法是兩種可以相互 補(bǔ)充的方法,應(yīng)用的范圍不完全相同,也可以組合使用。
對(duì)于步驟104,用來判斷該指標(biāo)參數(shù)是否滿足要求的閣值范圍是事先預(yù)置 的,可以由技術(shù)人員依據(jù)實(shí)際經(jīng)-^i殳定。優(yōu)選的,也可以利用正常工藝過程中 的數(shù)據(jù),采用與前述^f企測(cè)步驟相似的方法確定指標(biāo)參數(shù)的控制限。
具體的,在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,首先去除實(shí)時(shí)數(shù)據(jù)的不穩(wěn)定點(diǎn), 計(jì)算其統(tǒng)計(jì)值,例如平均值、標(biāo)準(zhǔn)偏差等。計(jì)算全部參數(shù)的協(xié)方差矩陣,并計(jì) 算其特征值和特征向量,從大到小排列特征值,并相加,當(dāng)前n個(gè)特征值之和 大于用戶設(shè)定的主元覆蓋率時(shí),這前n個(gè)特征值對(duì)應(yīng)的特征向量即對(duì)應(yīng)各參數(shù) 的n個(gè)組合,得到主元才莫型,就可以進(jìn)入Hotel 1 ing T2或Q統(tǒng)計(jì)進(jìn)行故障診 斷??刂葡薜倪x擇與客戶對(duì)此工藝控制的嚴(yán)格程度相關(guān)。例如選擇99%的參數(shù) 進(jìn)行控制限計(jì)算時(shí),表明當(dāng)檢測(cè)到故障時(shí),故障點(diǎn)真正發(fā)生故障的概率大于 99%。如果此參數(shù)越大,表明檢測(cè)到故障是真正硬件故障的可能性越大,但同 時(shí)如果此數(shù)值過大,也會(huì)漏掉一些故障點(diǎn)。 一般可以設(shè)置為95°/。到99%之間。
參照?qǐng)D2,示出了本發(fā)明一種故障檢測(cè)的方法實(shí)施例2,具體可以包括步驟201、采集多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù);
步驟202、將所述多個(gè)參數(shù)變換為至少一個(gè)參數(shù)組令,每個(gè)參數(shù)組合中至
少包括兩個(gè)參數(shù);
步驟203、計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù);
步驟204、判斷該指標(biāo)參數(shù)是否在閾值范圍內(nèi),如果超過閾值范圍,則確
認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障;
步驟205、分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度超過閾值的參數(shù)組合; 步驟206、計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值的參數(shù),確定其
為問題參數(shù)。
在確定問題參數(shù)之后,就可以發(fā)出報(bào)警和相應(yīng)的提示信息,因?yàn)橐话闱闆r 下,參數(shù)就可以直接指向故障硬件了,因此該問題參數(shù)即可以較好的提示設(shè)備 工程師進(jìn)行維護(hù)。
在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,在步驟206之后,還可以包括步驟207: 依據(jù)所述問題參數(shù)自動(dòng)確定故障硬件;進(jìn)而針對(duì)所確定的故障硬件,發(fā)出報(bào)警 和相應(yīng)提示信息。
實(shí)施例2相對(duì)于實(shí)施例1增加了故障分析的過程,以幫助設(shè)備工程師迅速 找到出現(xiàn)故障的硬件及其問題之所在。實(shí)施例2中的步驟205可能得到一個(gè)在 當(dāng)前故障點(diǎn)上對(duì)故障貢獻(xiàn)度超過閾值的參數(shù)組合,也可能得到多個(gè)這樣的參數(shù) 組合。進(jìn)而,步驟206也可能得到一個(gè)或者多個(gè)問題參數(shù)。
對(duì)于步驟205和206的故障分析過程,也可以采用PCA理論。當(dāng)獲悉當(dāng)前 故障點(diǎn)時(shí),通過預(yù)置的PCA模型,首先分析確定此故障點(diǎn)時(shí)在哪個(gè)主元方向(參 數(shù)組合)上偏離了控制限;然后進(jìn)一步通過PCA模型,分析確定在相應(yīng)的主元 方向上(參數(shù)組合中),哪個(gè)參數(shù)對(duì)主元貢獻(xiàn)較大,即計(jì)算出的主元貢獻(xiàn)值較 大,則可以確定該參數(shù)為可能引起故障的問題參數(shù)。在簡(jiǎn)單處理的情況下,當(dāng) 采用上述過程確定出了多個(gè)問題參數(shù)時(shí),可以直接報(bào)警,并給出相應(yīng)的故障硬 件;也可以采用更進(jìn)一步的分析(實(shí)施例3),以進(jìn)一步降低誤報(bào)的幾率。
參照?qǐng)D3,示出了本發(fā)明一種故障檢測(cè)的方法實(shí)施例2,具體可以包括 步驟301、采集多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù);步驟302、將所述多個(gè)參數(shù)變換為至少一個(gè)參數(shù)組合,每個(gè)參數(shù)組合中至
少包括兩個(gè)參數(shù); .
步驟303、計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù);
步驟304、判斷該指標(biāo)參數(shù)是否在閾值范圍內(nèi),如果超過閾值范圍,則確
認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障;
步驟305、分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度超過閾值的參數(shù)組合; 步驟306、計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值的參數(shù); 步驟307、將在不同參數(shù)組合中,對(duì)主元貢獻(xiàn)度都超過閾值的參數(shù)確定為
問題參數(shù)。
在確定問題參數(shù)之后,就可以發(fā)出報(bào)警和相應(yīng)的提示信息;也可以在由該 問題參數(shù)確定故障硬件之后,再發(fā)出報(bào)警和相應(yīng)提示信息。
實(shí)施例3中,對(duì)于步驟306所確定的多個(gè)參數(shù)并不直接確定為問題參數(shù), 進(jìn)入報(bào)警流程。而是對(duì)其進(jìn)行了更進(jìn)一步的分析,將在不同參數(shù)組合中,對(duì)主 元貢獻(xiàn)度都超過閾值的參數(shù)挑選出來,這些參數(shù)才是準(zhǔn)確度較高的問題參數(shù)。 當(dāng)然,如果步驟306所確定的多個(gè)參數(shù)都在一個(gè)參數(shù)組合中,則可以直接采用 實(shí)施例2中的方法全部確定為問題參數(shù)。
具體的,當(dāng)在判斷主元時(shí)發(fā)現(xiàn)這個(gè)故障點(diǎn)在多個(gè)主元方向偏離控制限,則 首先確定幾個(gè)主元中貢獻(xiàn)較大的參數(shù),然后篩選出在不同主元中貢獻(xiàn)均較大的 參數(shù)確定為導(dǎo)致問題的參數(shù),進(jìn)而將該參數(shù)所指向的硬件確定故障硬件。
總之,如果使用單變量方法,可能相關(guān)的兩個(gè)參數(shù)都發(fā)生了漂移,但是并 沒有超出控制限,所以使用單變量方法不會(huì)發(fā)出報(bào)警。而對(duì)于上述實(shí)施例l一 3,兩個(gè)或者多個(gè)參數(shù)的組合會(huì)增大漂移量,這時(shí)使用多變量分析方法就可以 對(duì)其組合量進(jìn)行檢測(cè),發(fā)現(xiàn)組合量超出控制限,及時(shí)發(fā)出報(bào)警,從而提高故障 檢測(cè)的靈敏度,以適應(yīng)現(xiàn)代工藝的要求。
下面參照?qǐng)D4,以半導(dǎo)體工藝過程為例,給出本發(fā)明一個(gè)更為詳細(xì)的故障 才會(huì)測(cè)方法實(shí)施例4,可以包括以下步驟
步驟401、在半導(dǎo)體設(shè)備進(jìn)行工藝的過程中,實(shí)時(shí)的進(jìn)行數(shù)據(jù)采集,例如 選擇數(shù)據(jù)采集頻率為1HZ或0. 5HZ進(jìn)行實(shí)時(shí)數(shù)據(jù)采集。步驟402、每一個(gè)工藝步驟之間有相應(yīng)的步驟標(biāo)識(shí)傳送到數(shù)據(jù)處理控制臺(tái)
中,如果判斷出此步驟需要進(jìn)行監(jiān)控,則將實(shí)時(shí)數(shù)據(jù)逐點(diǎn)實(shí)時(shí)的傳送到數(shù)據(jù)處
理單元,否則進(jìn)行步驟408,送到數(shù)據(jù)庫保存。
步驟403、進(jìn)入數(shù)據(jù)處理單元的數(shù)據(jù)首先去除其不穩(wěn)定點(diǎn),避免將開始時(shí) 不穩(wěn)定的點(diǎn)當(dāng)成故障點(diǎn)的發(fā)生誤判的現(xiàn)象。
步驟404、按照多變量故障i貪斷的方法,如PCA和Hotelling T2、 Q統(tǒng)計(jì) 等方法,計(jì)算其針對(duì)多變量的處理值。
步驟405、將處理值與原始建立模型的值進(jìn)行比較,如果這個(gè)點(diǎn)大于相應(yīng) 的模型中對(duì)應(yīng)的點(diǎn),則此點(diǎn)發(fā)生問題,即出現(xiàn)故障。建立原始模型的數(shù)據(jù)是對(duì) 完全正常的工藝進(jìn)行數(shù)據(jù)的采集并處理得到的正常情況下的值。如果這個(gè)點(diǎn)小 于相應(yīng)模型中對(duì)應(yīng)的點(diǎn),則表明這個(gè)實(shí)時(shí)的數(shù)據(jù)點(diǎn)正常,進(jìn)行下一個(gè)實(shí)時(shí)點(diǎn)的 判斷,重復(fù)步驟(1)以下的過程。實(shí)時(shí)的完成需要監(jiān)控的全部數(shù)據(jù)點(diǎn)的判斷。 參照?qǐng)D5,示出了一個(gè)工藝實(shí)時(shí)判斷情況的示意圖。其中,橫坐標(biāo)為時(shí)間,縱 坐標(biāo)為Q統(tǒng)計(jì)值,虛線501為閾值的模型值曲線,實(shí)線502為實(shí)時(shí)數(shù)據(jù)點(diǎn)的連 線,凸點(diǎn)區(qū)域503為凈全測(cè)確定的故障點(diǎn)。
步驟406、通過數(shù)據(jù)處理,計(jì)算確定哪個(gè)參數(shù)發(fā)生異常,進(jìn)而確定哪個(gè)硬 件對(duì)此故障有貢獻(xiàn)。
步驟407、發(fā)出報(bào)警和相應(yīng)的提示,指出異常硬件。
參照?qǐng)D6,是本發(fā)明一個(gè)更具體的實(shí)際例子,圖6中橫坐標(biāo)表示實(shí)時(shí)數(shù)據(jù) 點(diǎn)數(shù),縱坐標(biāo)表示控制值;其中,"*"點(diǎn)標(biāo)識(shí)控制限,而菱形實(shí)心符號(hào)則標(biāo)識(shí) 指標(biāo)參數(shù)值。圖6示出了對(duì)實(shí)時(shí)數(shù)據(jù)按照本發(fā)明進(jìn)行處理后的一種結(jié)果示意 圖,具體處理過程是對(duì)采集頻率為2HZ的數(shù)據(jù),經(jīng)過PCA, HotellingT2方法 進(jìn)行故障檢測(cè)。圖6中第11個(gè)點(diǎn)超出了控制限,發(fā)出報(bào)警,經(jīng)過硬件問題查 找,發(fā)現(xiàn)是瞬間打火導(dǎo)致的異常,并且已導(dǎo)致本片晶片上一些位置結(jié)果發(fā)生偏 差。
而如果仍然采用傳統(tǒng)技術(shù),人們難以及時(shí)發(fā)現(xiàn)問題。即如果使用一個(gè)工藝 步驟過后的統(tǒng)計(jì)值進(jìn)行計(jì)算,可能統(tǒng)計(jì)值的漂移不會(huì)超出控制限,見圖7所示 (圖7中的橫坐標(biāo)表示晶片的個(gè)數(shù),縱坐標(biāo)表示控制值的平均值),經(jīng)過平均值計(jì)算這21個(gè)點(diǎn)成為一個(gè)平均值點(diǎn),該點(diǎn)并沒有超出控制限。因此使用傳統(tǒng) 技術(shù)在晶片工藝過程進(jìn)行完后,再進(jìn)行統(tǒng)計(jì)計(jì)算,與控制限進(jìn)行對(duì)比,發(fā)現(xiàn)沒 有超出控制限,所以不會(huì)報(bào)警,從而導(dǎo)致有質(zhì)量問題的晶片存在,并且無法發(fā) 現(xiàn)故障所在。
參照?qǐng)D8,示出了本發(fā)明一種故障檢測(cè)的系統(tǒng)實(shí)施例1,具體可以包括 變換單元801,用于將所采集的多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù)變換為至少一個(gè)參數(shù)
組合,每個(gè)參數(shù)組合中至少包括兩個(gè)參數(shù);
指標(biāo)計(jì)算單元802,用于計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù); 故障判定單元803,用于判斷該指標(biāo)參數(shù)是否在閾值范圍內(nèi),如果超過閾
值范圍,則確認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障。
優(yōu)選的,上述系統(tǒng)實(shí)施例l還可以包括報(bào)警單元804,直接與參數(shù)確定單
元803相連,用于發(fā)出報(bào)警和相應(yīng)提示信息。
參照?qǐng)D9,示出了本發(fā)明一種故障檢測(cè)的系統(tǒng)實(shí)施例2,具體可以包括 變換單元901,用于將所采集的多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù)變換為至少一個(gè)參數(shù)
組合,每個(gè)參數(shù)組合中至少包括兩個(gè)參數(shù);
指標(biāo)計(jì)算單元902,用于計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù); 故障判定單元903,用于判斷該指標(biāo)參數(shù)是否在閾值范圍內(nèi),如果超過閾
值范圍,則確認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障;
參數(shù)組合確定單元904,用于分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度超過
閾值的參數(shù)組合;
參數(shù)確定單元905,用于計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值的
參數(shù),確定其為問題參數(shù)。
優(yōu)選的,上述系統(tǒng)實(shí)施例2還可以包括報(bào)警單元,直接與參數(shù)確定單元
905相連,用于針對(duì)問題參數(shù)發(fā)出報(bào)警和相應(yīng)提示信息。 更優(yōu)選的情況是,上述系統(tǒng)實(shí)施例2還可以包括 硬件確定單元906,用于依據(jù)所述問題參數(shù)確定故障硬件。 報(bào)警單元907,用于針對(duì)所確定的故障硬件發(fā)出報(bào)警和相應(yīng)提示信息。參照?qǐng)D10,示出了本發(fā)明一種故障檢測(cè)的系統(tǒng)實(shí)施例3,具體可以包括 變換單元1001,用于將所采集的多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù)變換為至少一個(gè)參
數(shù)組合,每個(gè)參數(shù)組合中至少包括兩個(gè)參數(shù);
指標(biāo)計(jì)算單元1002,用于計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù); 故障判定單元1003,用于判斷該指標(biāo)參數(shù)是否在閾值范圍內(nèi),如果超過
閾值范圍,則確認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障;
參數(shù)組合確定單元1004,用于分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度超
過閾值的參數(shù)組合;
參數(shù)確定單元1005,用于計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值
的參數(shù);
問題參數(shù)確定單元1006,用于將在不同參數(shù)組合中,對(duì)主元貢獻(xiàn)度都超
過閾值的參數(shù)確定為問題參數(shù)。
優(yōu)選的,上述系統(tǒng)實(shí)施例3還可以包括報(bào)警單元,直接與參數(shù)確定單元
10 0 6相連,用于針對(duì)問題參數(shù)發(fā)出報(bào)警和相應(yīng)提示信息。 更優(yōu)選的情況是,上述系統(tǒng)實(shí)施例3還可以包括 硬件確定單元1007,用于依據(jù)所述問題參數(shù)確定故障硬件。 報(bào)警單元1008,用于針對(duì)所確定的故障硬件發(fā)出報(bào)警和相應(yīng)提示信息。
需要說明的是,上述的報(bào)警單元,隨著與其他單元連接關(guān)系的不同,其報(bào) 警的具體信息也可以出現(xiàn)詳細(xì)程度的不同。
優(yōu)選的,上述的系統(tǒng)實(shí)施例l、 2和3都可以還包括凄t據(jù)篩選單元,用 于在采集數(shù)據(jù)的開始階段,去除超出閾值范圍的參數(shù)數(shù)據(jù)。優(yōu)選的,可以通過 以下方式去除超出閾值范圍的參數(shù)數(shù)據(jù)對(duì)于各個(gè)參數(shù)實(shí)時(shí)數(shù)據(jù),判斷其是否 超出了基準(zhǔn)數(shù)據(jù)的3倍標(biāo)準(zhǔn)偏差,如果超過,則去除。
本發(fā)明可以使用在與半導(dǎo)體晶片加工相關(guān)的各種工藝的故障檢測(cè)中,本發(fā) 明也可以應(yīng)用在與半導(dǎo)體晶片加工無關(guān)的其他工藝的故障檢測(cè)中。即本發(fā)明并 不限定具體應(yīng)用的工藝過程或者設(shè)備。
本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即 可。對(duì)于系統(tǒng)實(shí)施例而言,、由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn) 單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
以上對(duì)本發(fā)明所提供的一種故障檢測(cè)的方法和系統(tǒng),進(jìn)行了詳細(xì)介紹,本
明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技 術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會(huì)有改變之處, 綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
權(quán)利要求
1、一種故障檢測(cè)的方法,其特征在于,包括采集多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù);將所述多個(gè)參數(shù)變換為至少一個(gè)參數(shù)組合,每個(gè)參數(shù)組合中至少包括兩個(gè)參數(shù);計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù);判斷該指標(biāo)參數(shù)是否在閾值范圍內(nèi),如果超過閾值范圍,則確認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障。
2、 如權(quán)利要求l所述的方法,其特征在于,還包括 分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度超過閾值的參數(shù)組合; 計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值的參數(shù),確定其為問題參數(shù)。
3、 如權(quán)利要求l所述的方法,其特征在于,還包括 分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度超過閾值的參數(shù)組合; 計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值的參數(shù); 將在不同參數(shù)組合中,對(duì)主元貢獻(xiàn)度都超過閾值的參數(shù)確定為問題參數(shù)。
4、 如權(quán)利要求2或3所述的方法,其特征在于,還包括 依據(jù)所述問題參數(shù)確定故障硬件。
5、 如權(quán)利要求l、 2或3所述的方法,其特征在于,還包括 發(fā)出報(bào)警和相應(yīng)提示信息。
6、 如權(quán)利要求l所述的方法,其特征在于,還包括 在采集數(shù)據(jù)的開始階段,去除超出閾值范圍的參數(shù)數(shù)據(jù)。
7、 如權(quán)利要求6所述的方法,其特征在于,通過以下方式去除超出閾值 范圍的參數(shù)數(shù)據(jù)對(duì)于各個(gè)參數(shù)實(shí)時(shí)數(shù)據(jù),判斷其是否超出了基準(zhǔn)數(shù)據(jù)的3倍標(biāo)準(zhǔn)偏差,如 果超過,則去除。
8、 一種故障檢測(cè)的系統(tǒng),其特征在于,包括變換單元,用于將所采集的多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù)變換為至少一個(gè)參數(shù)組 合,每個(gè)參數(shù)組合中至少包括兩個(gè)參數(shù);指標(biāo)計(jì)算單元,用于計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù); 故障判g(shù)單元,用于判斷該指標(biāo)參數(shù)是否在閾值范圍內(nèi),如果超過閾值范 圍,則確認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障。
9、 如權(quán)利要求8所述的系統(tǒng),其特征在于,還包括 參數(shù)組合確定單元,用于分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度超過閾值的參數(shù)組合;參數(shù)確定單元,用于計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值的參 數(shù),確定其為問題參數(shù)。
10、 如權(quán)利要求8所述的系統(tǒng),其特征在于,還包括 參數(shù)組合確定單元,用于分析確定在當(dāng)前故障點(diǎn),對(duì)故障貢獻(xiàn)度超過閾值的參數(shù)組合;參數(shù)確定單元,用于計(jì)算得到該參數(shù)組合中對(duì)主元貢獻(xiàn)度超過閾值的參數(shù);問題參數(shù)確定單元,用于將在不同參數(shù)組合中,對(duì)主元貢獻(xiàn)度都超過閾值 的參數(shù)確定為問題參數(shù)。
11、 如權(quán)利要求9或10所述的系統(tǒng),其特征在于,還包括 硬件確定單元,用于依據(jù)所述問題參數(shù)確定故障硬件。
12、 如權(quán)利要求8、 9或10所述的系統(tǒng),其特征在于,還包括 報(bào)警單元,用于發(fā)出報(bào)警和相應(yīng)提示信息。
13、 如權(quán)利要求8所述的系統(tǒng),其特征在于,還包括 數(shù)據(jù)篩選單元,用于在采集數(shù)據(jù)的開始階段,去除超出闊值范圍的參數(shù)數(shù)據(jù)。
14、 如權(quán)利要求13所述的系統(tǒng),其特征在于,通過以下方式去除超出閾 值范圍的參數(shù)數(shù)據(jù)對(duì)于各個(gè)參數(shù)實(shí)時(shí)數(shù)據(jù),判斷其是否超出了基準(zhǔn)數(shù)據(jù)的3倍標(biāo)準(zhǔn)偏差,如 果超過,則去除。
全文摘要
本發(fā)明提供了一種故障檢測(cè)的方法和系統(tǒng),所述方法可以包括采集多個(gè)參數(shù)的實(shí)時(shí)數(shù)據(jù);將所述多個(gè)參數(shù)變換為至少一個(gè)參數(shù)組合,每個(gè)參數(shù)組合中至少包括兩個(gè)參數(shù);計(jì)算得到針對(duì)所述參數(shù)組合的一個(gè)指標(biāo)參數(shù);判斷該指標(biāo)參數(shù)是否在閾值范圍內(nèi),如果超過閾值范圍,則確認(rèn)當(dāng)前時(shí)間點(diǎn)出現(xiàn)故障。本發(fā)明在進(jìn)行工藝的實(shí)時(shí)過程中,對(duì)每一個(gè)實(shí)時(shí)數(shù)據(jù)進(jìn)行多變量分析,從而確保不會(huì)丟失工藝過程中的瞬間數(shù)據(jù),及時(shí)發(fā)現(xiàn)有問題的信息。另外,本發(fā)明使用了多變量的方法進(jìn)行監(jiān)控,不僅考慮了每一個(gè)參數(shù)的變化,而且考慮了各參數(shù)之間的關(guān)聯(lián),可以提高檢測(cè)靈敏度,并有效的防止誤報(bào)警。
文檔編號(hào)G05B19/048GK101470426SQ20071030437
公開日2009年7月1日 申請(qǐng)日期2007年12月27日 優(yōu)先權(quán)日2007年12月27日
發(fā)明者卓 陳 申請(qǐng)人:北京北方微電子基地設(shè)備工藝研究中心有限責(zé)任公司