本發(fā)明涉及檢查數(shù)據(jù)處理裝置以及檢查數(shù)據(jù)處理方法,特別涉及用于根據(jù)從被檢對象測量出的檢查數(shù)據(jù)來辨別該被檢對象是正常還是異常的檢查數(shù)據(jù)處理方法以及檢查數(shù)據(jù)處理裝置。
背景技術(shù):
在機械或者電器設(shè)備的產(chǎn)品檢查中實施音響檢查,以辨別正常產(chǎn)品與異常產(chǎn)品。音響檢查要求高的辨別精度。
對于由機械或者電氣設(shè)備產(chǎn)生的噪音,以往,主要通過人(檢查者)的耳朵來檢查噪音,從而辨別正常/異常。特別是,在根據(jù)是不是用檢查者的耳朵感到不適的聲音來辨別正常/異常的情況下,必須通過檢查者的耳朵進行感官檢查。
但是,在利用檢查者的耳朵進行的辨別中,每個檢查者的辨別基準(zhǔn)存在偏差。另外,即使是同一個檢查者,根據(jù)檢查時的身體狀況,辨別基準(zhǔn)也發(fā)生變化。
因此,需要一種不依賴于測量條件以及檢查者的自動辨別技術(shù)。這樣的辨別技術(shù)主要在聲音辨別領(lǐng)域中的辨別特定的音源或者語言的領(lǐng)域發(fā)展起來。
例如,在專利文獻1(日本特開2000-172291號公報)中,制作通過麥克風(fēng)收集到的聲音數(shù)據(jù)的音響模型,依照音響模型來辨別聲音的各單詞。另外,在專利文獻2(日本特開2002-189493號公報)中,通過使用學(xué)習(xí)到的按特征區(qū)分的圖案(pattern)校正說話者聲音的頻譜,從而提高聲音辨別性能。
另外,作為辨別正常與異常的方法提出有如下辨別方法:作為以正常產(chǎn)品的數(shù)據(jù)組為基準(zhǔn)定量地辨別異常的方法,將作為圖案辨別技術(shù)之一的馬氏距離用作指標(biāo)。例如,在專利文獻3(日本特開2003-310564號公報)中,在代替醫(yī)生來實施腦波的辨別的情況下,從腦波的時間序列數(shù)據(jù)提取多個特征量。然后,將馬氏距離用作分離指標(biāo),該馬氏距離是根據(jù)基準(zhǔn)數(shù)據(jù)空間以及該提取出的作為辨別對象的特征量計算出的,該基準(zhǔn)數(shù)據(jù)空間是使用基準(zhǔn)學(xué)習(xí)數(shù)據(jù)計算出的。
在與音響相關(guān)的領(lǐng)域中,也提出有將馬氏距離用作辨別指標(biāo)的方法。例如,在專利文獻4(日本特開2004-198383號公報)中,針對每個產(chǎn)生原因?qū)⑴鲎猜暤慕M所具有的聲音的特征量定義為基準(zhǔn)空間,使用馬氏距離評價各組辨別對象的分離度。由此,推測聲音的產(chǎn)生原因。
在這里,通過逆矩陣計算算出上述基準(zhǔn)空間。但是,在音響數(shù)據(jù)或者圖像數(shù)據(jù)等中,由于數(shù)據(jù)彼此的相關(guān)系數(shù)大,所以產(chǎn)生多重共線性的問題,其結(jié)果是,難以實施通常的逆矩陣計算。為了應(yīng)對這一情況,例如在專利文獻5(日本特開2012-093423號公報)中,通過將特征量集合為平均值、敏感度、標(biāo)準(zhǔn)sn比來避免逆矩陣計算,根據(jù)這些特征量計算馬氏距離,基于計算出的馬氏距離來實施圖案識別所涉及的辨別。
現(xiàn)有技術(shù)文獻
專利文獻1:日本特開2000-172291號公報
專利文獻2:日本特開2002-189493號公報
專利文獻3:日本特開2003-310564號公報
專利文獻4:日本特開2004-198383號公報
專利文獻5:日本特開2012-093423號公報
技術(shù)實現(xiàn)要素:
在上述專利文獻3中,為了根據(jù)馬氏距離辨別腦波的正常/異常,基于正常腦波數(shù)據(jù)生成用于辨別的基準(zhǔn)數(shù)據(jù)空間。根據(jù)該方法,在以正常的數(shù)據(jù)組為基準(zhǔn)時,數(shù)據(jù)的偏差比以異常的數(shù)據(jù)組為基準(zhǔn)時小,能夠提高正常/異常的分離度。然而,專利文獻4并未提出用于使基于正常聲波數(shù)據(jù)的基準(zhǔn)空間數(shù)據(jù)更加均勻的方法,所以難以基于基準(zhǔn)空間數(shù)據(jù)提高上述分離度。
本發(fā)明是為了解決上述課題而完成的,本發(fā)明的目的在于提供能夠高精度地辨別檢查對象是正常產(chǎn)品還是異常產(chǎn)品的檢查數(shù)據(jù)處理裝置以及檢查數(shù)據(jù)處理方法。
本發(fā)明的檢查數(shù)據(jù)處理裝置重復(fù)實施預(yù)定數(shù)量的從包括表示正常產(chǎn)品的特征量的上述預(yù)定數(shù)量的數(shù)據(jù)的數(shù)據(jù)組隨機提取多個數(shù)據(jù)并計算代表特征量的處理,根據(jù)包括表示通過重復(fù)實施該預(yù)定數(shù)量的處理而計算出的代表特征量的預(yù)定數(shù)量的數(shù)據(jù)的數(shù)據(jù)組生成基準(zhǔn)空間,該代表特征量代表所提取出的多個數(shù)據(jù)所表示的特征量。然后,根據(jù)所生成的基準(zhǔn)空間與表示檢查對象的特征量的數(shù)據(jù)之間的距離的大小辨別檢查對象是正常產(chǎn)品還是異常產(chǎn)品。
在一個方案中,如上所述,通過根據(jù)包括表示正常產(chǎn)品的代表特征量的預(yù)定數(shù)量的數(shù)據(jù)的數(shù)據(jù)組生成基準(zhǔn)空間,由基準(zhǔn)空間的數(shù)據(jù)表示均勻的特征量。由此,能夠基于與該基準(zhǔn)空間的距離來準(zhǔn)確地辨別正常產(chǎn)品或者異常產(chǎn)品。
附圖說明
圖1是示出本發(fā)明的實施方式的檢查數(shù)據(jù)處理裝置50的硬件結(jié)構(gòu)的圖。
圖2是示出本發(fā)明的實施方式的檢查數(shù)據(jù)處理裝置50的功能結(jié)構(gòu)的圖。
圖3是示出圖2的信息儲存部10中儲存的數(shù)據(jù)的一個例子的圖。
圖4是示出在檢查對象的設(shè)備的測量中得到的時間序列數(shù)據(jù)的一個例子的圖。
圖5是示出從圖4切出的1秒鐘的時間序列數(shù)據(jù)的一個例子的圖。
圖6是示出根據(jù)圖5的時間序列數(shù)據(jù)使用自回歸模型推測出的時間序列數(shù)據(jù)的一個例子的圖。
圖7是示出對時間序列數(shù)據(jù)進行fft處理后的結(jié)果的圖。
圖8是示出針對時間序列數(shù)據(jù)使用自回歸模型推測譜密度后的結(jié)果的圖。
圖9是示出實施方式3的用于對比的實驗結(jié)果的圖。
圖10是示出實施方式4的層次構(gòu)造的一個例子的圖。
圖11是示出實施方式4的實驗結(jié)果的一個例子的圖。
圖12是示出本實施方式5的針對各特征量的sn比(signal-to-noiseratio,信噪比)的一個例子的圖。
圖13是實施方式7的整體處理的流程圖。
(符號說明)
1:測量部;1a、1b:傳感器;2、2a、2b:信號處理部;3、3a、3b:特征量提取部;3c:ar推測部;3d:a特性校正部;4:基準(zhǔn)空間生成部;5:距離計算部;6:異常辨別部;7:異常產(chǎn)品提取部;8:層次聚類分析部;9:主要原因分析部;10:信息儲存部;20:辨別處理部;50:檢查數(shù)據(jù)處理裝置。
具體實施方式
以下,參照附圖,說明本發(fā)明的實施方式。此外,圖中相同的符號表示相同或者相當(dāng)?shù)牟糠帧?/p>
在本實施方式中,作為檢查對象例示出機械或者電氣設(shè)備等產(chǎn)品,但檢查對象不限于此。另外,作為檢查對象的產(chǎn)品相當(dāng)于正常產(chǎn)品或者異常產(chǎn)品的辨別對象即辨別產(chǎn)品。在本實施方式中,使用時間序列數(shù)據(jù)來實施辨別,該事件序列數(shù)據(jù)是通過以預(yù)定時間間隔對來自檢查對象的聲音信號進行采樣而生成的。時間序列數(shù)據(jù)被例示為表示聲波波形的強度(level)(振幅等)的時間變化以及頻率變化的數(shù)據(jù),但不限于該數(shù)據(jù),也可以是表示從檢查對象產(chǎn)生的振動波形的強度的時間變化以及頻率變化的數(shù)據(jù)。
另外,在本實施方式中,正常產(chǎn)品是指在利用人的聽覺檢查從產(chǎn)品產(chǎn)生的聲音時能夠判定為正常的產(chǎn)品。另外,異常產(chǎn)品是指在利用人的聽覺檢查從產(chǎn)品產(chǎn)生的聲音時能夠判定為異常的產(chǎn)品。具體而言,在產(chǎn)生的聲音包括例如由機械部件的接觸所引起的異常音、由旋轉(zhuǎn)體的軸偏移引起的接觸音的情況下,辨別為產(chǎn)品是異常產(chǎn)品即不合格產(chǎn)品。
(實施方式的概要)
本實施方式的檢查數(shù)據(jù)處理裝置重復(fù)實施預(yù)定數(shù)量(例如,1000個)的如下的處理:從包括表示正常產(chǎn)品的特征量的上述預(yù)定數(shù)量的數(shù)據(jù)的數(shù)據(jù)組隨機提取多個數(shù)據(jù),計算代表特征量,該代表特征量代表提取出的多個數(shù)據(jù)所表示的特征量。檢查數(shù)據(jù)處理裝置根據(jù)數(shù)據(jù)組生成基準(zhǔn)空間,該數(shù)據(jù)組包括表示通過該預(yù)定數(shù)量的重復(fù)實施而計算出的代表特征量的預(yù)定數(shù)量的數(shù)據(jù)。然后,檢查數(shù)據(jù)處理裝置根據(jù)所生成的基準(zhǔn)空間與表示檢查對象的特征量的數(shù)據(jù)之間的馬氏距離的大小,辨別檢查對象是正常產(chǎn)品還是異常產(chǎn)品。
這樣,通過由代表特征量組構(gòu)成基準(zhǔn)空間,能夠使構(gòu)成基準(zhǔn)空間的特征量的偏差降低并均勻化。因此,能夠基于離基準(zhǔn)空間的馬氏距離的大小來辨別正常/異常,該基準(zhǔn)空間是特征量的偏差少的均勻的基準(zhǔn)空間。由此,能夠提高辨別精度。
[實施方式1]
(裝置的結(jié)構(gòu))
圖1是示出本發(fā)明的實施方式的檢查數(shù)據(jù)處理裝置50的硬件結(jié)構(gòu)的圖。檢查數(shù)據(jù)處理裝置50具有相當(dāng)于計算機的結(jié)構(gòu)。具體而言,檢查數(shù)據(jù)處理裝置50具備相當(dāng)于信息處理部的cpu(centralprocessingunit,中央處理單元)51、包括rom(readonlymemory,只讀存儲器)以及ram(randomaccessmemory,隨機存取存儲器)等的主存儲裝置52、hdd(harddiskdrive,硬盤驅(qū)動器)等輔助存儲裝置53、鍵盤或者鼠標(biāo)等輸入裝置54、顯示器或者打印機等輸出裝置55、用于與外部設(shè)備(未圖示)通信的通信裝置56、存儲器驅(qū)動器57以及外部i/f(接口(interface)的簡記)部58。
外部i/f部58受理來自傳感器1a、1b的信號的輸入。傳感器1a、1b測量來自作為檢查對象的機械或者電氣設(shè)備(未圖示)的聲音,將測量出的信號(聲波信號)輸出到外部i/f部58。作為存儲介質(zhì)的存儲卡59以裝卸自如的方式安裝于存儲器驅(qū)動器57。在cpu51的控制之下,存儲器驅(qū)動器57將數(shù)據(jù)寫入到所安裝的存儲卡59或者從存儲卡59讀出數(shù)據(jù)。
(功能結(jié)構(gòu))
圖2是示出本發(fā)明的實施方式的檢查數(shù)據(jù)處理裝置50的功能結(jié)構(gòu)的圖。參照圖2,檢查數(shù)據(jù)處理裝置50具備:測量部1,測量從檢查對象的機械或者電氣設(shè)備(未圖示)產(chǎn)生的聲音;信號處理部2,對來自測量部1的測量信號進行處理并輸出時間序列數(shù)據(jù);以及辨別處理部20和信息儲存部10。辨別處理部20包括特征量提取部3、距離計算部5、正常/異常辨別部6、異常產(chǎn)品提取部7、層次聚類分析部8以及主要原因分析部9。這些各部的詳情將在后面敘述。
信號處理部2以及辨別處理部20分別通過由cpu51執(zhí)行的程序或者程序與電路的組合來實現(xiàn)。
信息儲存部10相當(dāng)于圖2的輔助存儲裝置53或者存儲卡59的存儲區(qū)域。圖3是示出圖2的信息儲存部10所儲存的數(shù)據(jù)的一個例子的圖。參照圖3,信息儲存部10包括區(qū)域e1~e8。區(qū)域e1儲存辨別產(chǎn)品特征量組11,該辨別產(chǎn)品特征量組11包括后述的多個辨別產(chǎn)品數(shù)據(jù)的特征量。區(qū)域e2儲存正常產(chǎn)品特征量組12,該正常產(chǎn)品特征量組12包括后述的多個正常產(chǎn)品數(shù)據(jù)的特征量。區(qū)域e3儲存表示基準(zhǔn)空間的基準(zhǔn)空間數(shù)據(jù)13。
區(qū)域e4儲存異常產(chǎn)品特征量組14,該異常產(chǎn)品特征量組14包括根據(jù)距離辨別出的異常產(chǎn)品數(shù)據(jù)的特征量。區(qū)域e5儲存按模式區(qū)分的特征量組15,該按模式區(qū)分的特征量組15包括后述的每個異常模式的異常產(chǎn)品數(shù)據(jù)的特征量。區(qū)域e6儲存用于識別每個異常模式的有效特征量的特征量識別數(shù)據(jù)16。區(qū)域e7儲存未分類數(shù)據(jù)組17,該未分類數(shù)據(jù)組17包括未被分類為任何異常模式的未分類數(shù)據(jù)8a。區(qū)域e8儲存異常主要原因數(shù)據(jù)18。各區(qū)域的數(shù)據(jù)的詳情將在后面敘述。
返回到圖2,測量部1包括:傳感器1a,測量來自被預(yù)先分類為正常產(chǎn)品的機械或者電氣設(shè)備的聲音;以及傳感器1b,測量來自作為檢查對象的機械或者電氣設(shè)備(即辨別產(chǎn)品)的聲音。傳感器1a和傳感器1b包括例如加速度傳感元件,具有相同的測量功能。
信號處理部2包括:信號處理部2a,對來自傳感器1a的測量信號進行處理,輸出基于處理結(jié)果的時間序列數(shù)據(jù)(以下稱為正常產(chǎn)品數(shù)據(jù));以及信號處理部2b,對來自傳感器1b的測量信號進行處理,輸出基于處理結(jié)果的時間序列數(shù)據(jù)(以下稱為辨別產(chǎn)品數(shù)據(jù))。信號處理部2a、信號處理部2b分別包括濾波器電路、模擬/數(shù)字(analog/digital)轉(zhuǎn)換電路以及采樣電路等,實施相同的信號處理。
特征量提取部3包括:特征量提取部3a,從來自信號處理部2a的表示正常產(chǎn)品的正常產(chǎn)品數(shù)據(jù)提取特征量;以及特征量提取部3b,從來自信號處理部2b的辨別產(chǎn)品數(shù)據(jù)提取特征量。特征量提取部3a和特征量提取部3b實施相同的特征提取處理。
另外,為了更適當(dāng)?shù)靥崛√卣髁浚卣髁刻崛〔?包括ar(autoregressive,自回歸)推測部3c以及a特性校正部3d。特征量提取部3a將從各正常產(chǎn)品數(shù)據(jù)提取出的特征量儲存到區(qū)域e2,特征量提取部3b將從各辨別產(chǎn)品數(shù)據(jù)提取出的特征量儲存到區(qū)域e1。
檢查數(shù)據(jù)處理裝置50還包括基準(zhǔn)空間生成部4?;鶞?zhǔn)空間生成部4根據(jù)儲存于區(qū)域e2的正常產(chǎn)品特征量組12生成表示基準(zhǔn)空間的基準(zhǔn)空間數(shù)據(jù)13,并將基準(zhǔn)空間數(shù)據(jù)13儲存到區(qū)域e3。
距離計算部5計算辨別產(chǎn)品數(shù)據(jù)的特征量與基準(zhǔn)空間數(shù)據(jù)13所表示的基準(zhǔn)空間之間的距離(后述的馬氏距離)。正常/異常辨別部6根據(jù)計算出的距離辨別該辨別產(chǎn)品數(shù)據(jù)的辨別產(chǎn)品是正常產(chǎn)品還是異常產(chǎn)品。異常產(chǎn)品提取部7將異常產(chǎn)品特征量7a儲存到區(qū)域e4,該異常產(chǎn)品特征量7a表示由正常/異常辨別部6辨別了的辨別產(chǎn)品數(shù)據(jù)中的、被辨別為異常產(chǎn)品的辨別產(chǎn)品數(shù)據(jù)的特征量。
為了將儲存于區(qū)域e4的異常產(chǎn)品特征量組14所包括的各異常產(chǎn)品特征量7a分類為多個異常模式,層次聚類分析部8實施層次聚類分析。主要原因分析部9針對每個異常模式分析異常的主要原因(原因)。層次聚類分析部8將異常產(chǎn)品特征量組14中的未被分類為任何異常模式的異常產(chǎn)品特征量作為未分類數(shù)據(jù)8a儲存到區(qū)域e8。主要原因分析部9將主要原因的分析結(jié)果反饋給層次聚類分析部8或者輸出。
此外,在圖2中,針對正常產(chǎn)品與辨別產(chǎn)品獨立地設(shè)置有傳感器、信號處理部以及特征量提取部,但傳感器、信號處理部以及特征量提取部也可以是正常產(chǎn)品與辨別產(chǎn)品共用的結(jié)構(gòu)。
(馬氏距離的計算)
在本實施方式中,檢查數(shù)據(jù)處理裝置50根據(jù)依照mts(馬氏田口系統(tǒng))法得到的馬氏距離d(以下還簡記為距離d)對辨別產(chǎn)品辨別正常/異常。mts法作為圖案辨別的一種方法,由田口玄一博士提出的這一方法與其它圖案辨別方法(例如神經(jīng)網(wǎng)絡(luò)等)相比,能夠處理的特征量的數(shù)量多、能夠?qū)崿F(xiàn)高的辨別精度。
mts法包括mt(馬氏田口)法、rt(recognitiontaguchi:識別田口)法等幾個計算方法,本實施方式使用mt(馬氏田口)法。距離d是使用廣義逆矩陣a計算出的,該廣義逆矩陣a基于根據(jù)構(gòu)成基準(zhǔn)空間的正常產(chǎn)品數(shù)據(jù)的特征量計算出的相關(guān)系數(shù)矩陣r。廣義逆矩陣也被稱為一般逆矩陣、穆爾-彭羅斯逆矩陣、偽逆矩陣,但在此統(tǒng)一稱為“廣義逆矩陣”。
<基準(zhǔn)空間的生成>
基準(zhǔn)空間是根據(jù)正常產(chǎn)品的聲音的時間序列數(shù)據(jù)生成的,正常產(chǎn)品是通過人的聽覺檢查預(yù)先分類出的。
傳感器1a通過加速度傳感元件從正常產(chǎn)品測量來自正常產(chǎn)品的聲音并輸出聲波信號。信號處理部2a對來自傳感器1a的聲波信號進行濾波處理,將濾波處理后的聲波信號轉(zhuǎn)換成作為數(shù)字?jǐn)?shù)據(jù)的正常產(chǎn)品數(shù)據(jù)(表示波形的時間序列數(shù)據(jù))。所得到的正常產(chǎn)品數(shù)據(jù)的數(shù)量例如為1000個,將該正常產(chǎn)品數(shù)據(jù)儲存到區(qū)域e2。
在特征量提取部3a中,通過利用ar推測部3c實施的ar推測(后述)將來自信號處理部2a的正常產(chǎn)品數(shù)據(jù)轉(zhuǎn)換成譜密度的數(shù)據(jù)。譜密度數(shù)據(jù)表示每個頻率分量的譜密度。特征量提取部3a針對譜密度數(shù)據(jù)每10hz進行譜密度的平均化處理,從而計算出1000個譜密度數(shù)據(jù)(特征量)。由此,對1000個正常產(chǎn)品數(shù)據(jù)的各個正常產(chǎn)品數(shù)據(jù)提取1000個特征量。此外,在提取特征量時,也可以實施由后述的a特性校正部3d進行的處理。
基準(zhǔn)空間生成部4將關(guān)于從特征量提取部3a輸出的1000個正常產(chǎn)品數(shù)據(jù)的特征量儲存到信息儲存部10的區(qū)域e3。由此,將基準(zhǔn)空間數(shù)據(jù)13儲存到區(qū)域e3。
參照通過發(fā)明人的實驗得到的圖4~圖8的時間序列數(shù)據(jù)說明由上述測量部1實施的測量信號的處理以及特征量的計算。
在這里,由于傳感器1a、傳感器1b實施相同的測量動作,所以以測量部1的動作來說明這些動作。另外,由于信號處理部2a、信號處理部2b實施相同的處理,所以以信號處理部2的處理來說明這些處理。另外,特征量提取部3a、特征量提取部3b也實施相同的處理,所以以特征量提取部3的處理來說明這些處理。
圖4是示出在檢查對象設(shè)備的測量中得到的時間序列數(shù)據(jù)的一個例子的圖。圖4示出連續(xù)5秒鐘的以100khz的采樣速度測量出的時間序列數(shù)據(jù)。
特征量提取部3將圖4的時間序列數(shù)據(jù)中的1秒鐘的數(shù)據(jù)作為連續(xù)部分切出。也就是說,從5秒鐘的時間序列數(shù)據(jù)得到包括5個時間序列數(shù)據(jù)的數(shù)據(jù)集。圖5是示出從圖4切出的1秒鐘的時間序列數(shù)據(jù)的一個例子的圖。
為了從上述時間序列數(shù)據(jù)提取特征量,特征量提取部3執(zhí)行用于利用ar推測部3c實施頻譜推測的計算處理。自回歸模型(ar模型)是與用于根據(jù)過去的序列值預(yù)測未來的值的時間序列預(yù)測相關(guān)的方法。具體而言,ar推測部3c通過以下步驟計算預(yù)測波形(時間序列數(shù)據(jù))。
在假設(shè)使用偏離平均值的偏移xi、自回歸系數(shù)aj、階m以及噪聲ξi而以(式1-1)表示的情況下,通過推測模型參數(shù)(m、aj、σ2,而對離散的時間序列數(shù)據(jù)進行模型化。另外,通過使用自解析模型的參數(shù),解析地得到(式1-2)。
[式1]
ar推測部3c推測參數(shù)ai、σ以及平均值m,根據(jù)自回歸模型推測時間序列數(shù)據(jù)。圖6是示出使用自回歸模型從圖5的時間序列數(shù)據(jù)推測出的時間序列數(shù)據(jù)的一個例子的圖。
在從表示聲音、振動等波形的時間序列數(shù)據(jù)提取特征量的情況下,通常通過傅里葉變換進行提取,傅里葉變換假設(shè)離散數(shù)據(jù)為無限連續(xù)的信號的1個周期。但是,在fft(fastfouriertransform,快速傅里葉變換)處理中,由于時間波形的偏移而產(chǎn)生大量的噪聲分量,有效的特征量可能被噪聲分量掩蓋。
因此,在本實施方式的特征量提取部3中,對時間序列數(shù)據(jù)應(yīng)用自回歸模型來推測譜密度。在正常/異常的辨別時使用通過推測得到的針對頻率分量的特征量(譜密度)的數(shù)據(jù)集。在該情況下,與通過fft處理獲得頻譜的情況相比,時間序列數(shù)據(jù)的曲線圖形狀更加平滑(參照圖6),能夠不被噪聲分量掩蓋而得到有效的特征量。
進一步地說明上述效果。圖7是示出對時間序列數(shù)據(jù)進行fft處理得到的結(jié)果的圖。圖7橫軸表示頻率,縱軸表示電壓信號的強度(單位:v2)。圖8是示出對時間序列數(shù)據(jù)使用自回歸模型推測譜密度而得到的結(jié)果的圖。圖8的橫軸與圖7同樣地表示頻率,縱軸表示通過電壓示出的譜密度(單位:v/hz)。
在本實施方式中,通過使用自回歸模型計算譜密度,從而能夠使圖6的時間序列數(shù)據(jù)與圖5的原來的時間序列數(shù)據(jù)充分一致。因此,在比較圖7的數(shù)據(jù)與圖8的時間序列數(shù)據(jù)的情況下,可知在圖8的時間序列數(shù)據(jù)中排除了每個頻率的細(xì)微的時間變化,其中,圖7的數(shù)據(jù)是針對時間序列數(shù)據(jù)簡單地對頻譜強度進行fft處理而得到的數(shù)據(jù),圖8的數(shù)據(jù)表示針對相同的時間序列數(shù)據(jù)通過自回歸模型推測出的譜密度。
發(fā)明人們得到如下的見解:在如上所示地使用自回歸模型推測譜密度得到的時間序列數(shù)據(jù)(參照圖8)的情況下,與通過fft處理取得的時間序列數(shù)據(jù)(參照圖7)相比,不被噪聲分量掩蓋而能夠提取有效的特征量。
<廣義逆矩陣a的計算>
cpu51從基準(zhǔn)空間數(shù)據(jù)13導(dǎo)出用于計算距離d的廣義逆矩陣a。具體而言,首先,cpu51根據(jù)信息儲存部10的基準(zhǔn)空間數(shù)據(jù)13計算以下的(式2)所示的相關(guān)系數(shù)矩陣r。
[式2]
如(式3)所示,相關(guān)系數(shù)矩陣r的要素rij是表示正常產(chǎn)品數(shù)據(jù)的特征量的數(shù)據(jù)(以下稱為單位數(shù)據(jù))的第i個項目與第j個項目的相關(guān)系數(shù)。也就是說,是表示單位數(shù)據(jù)所包括的1000個特征量(譜密度)中的第i個特征量與第j個特征量的相關(guān)性的系數(shù)。
[式3]
在i=j(luò)時,rij=1
rij=rji
接下來,為了計算奇異值矩陣λ、特征向量矩陣w以及矩陣v,首先,計算相關(guān)系數(shù)矩陣r的特征值(characteristicvalue)。具體而言,cpu51通過以下的(式4)計算特征值λ,按計算值從大到小的順序排列為λ1、λ2、λ3、…λk≥0。根據(jù)該排列,通過(式5)計算奇異值矩陣λ。
[式4]
[式5]
接下來,cpu51計算針對λ1的特征向量((式6)的λ1不是取平方根的奇異值)。也就是說,根據(jù)(式6)計算(式7)的向量。
[式6]
[式7]
另外,cpu51對λi(i=1~k)與上面敘述的λ1同樣地計算特征向量。cpu51根據(jù)計算出的這些特征向量計算(式8)所示的特征向量矩陣w。
[式8]
然后,cpu51根據(jù)下面的(式9)計算矩陣v。
[式9]
cpu51根據(jù)(式10)計算廣義逆矩陣a,(式10)使用了計算出的特征向量矩陣w、奇異值矩陣λ以及矩陣v。將計算出的廣義逆矩陣a儲存到信息儲存部10。
[式10]
<距離d的計算>
說明本實施方式的距離d的計算方法。cpu51使用廣義逆矩陣a計算各單位數(shù)據(jù)的距離d。例如,依照(式11)計算單位數(shù)據(jù)的樣品no.1的距離d。另外,關(guān)于信號數(shù)據(jù)、未知數(shù)據(jù)也同樣依照(式12)和(式13)計算距離d(a與求單位數(shù)據(jù)的距離d時所使用的矩陣是共同的)。
[式11]
[式12]
[式13]
在對構(gòu)成基準(zhǔn)空間數(shù)據(jù)13的全部的正常產(chǎn)品數(shù)據(jù)(單位數(shù)據(jù))分別計算出距離d時,cpu51根據(jù)它們的平均值,依照預(yù)定運算來計算用于辨別正常/異常的閾值(以下,辨別閾值)。將計算出的辨別閾值儲存到信息儲存部10的預(yù)定區(qū)域。
如上所述,根據(jù)正常產(chǎn)品數(shù)據(jù)的特征量(單位數(shù)據(jù))的集合即基準(zhǔn)空間數(shù)據(jù)13生成廣義逆矩陣,使用所生成的廣義逆矩陣計算各單位數(shù)據(jù)的距離d,根據(jù)計算出的距離d計算辨別閾值。
(正常/異常的辨別處理)
接下來,說明正常/異常的辨別處理。根據(jù)發(fā)明人們的實驗得到如下見解:在正常/異常辨別部6利用使用上述(式13)計算出的距離d來實施辨別處理的情況下,能夠降低將正常產(chǎn)品誤辨別為異常產(chǎn)品的概率。
實驗時,例如在信息儲存部10的區(qū)域e4中關(guān)于異常產(chǎn)品對由上述測量部1以及信號處理部2取得的時間序列數(shù)據(jù)(例如1000個時間序列數(shù)據(jù))儲存有異常產(chǎn)品特征量組14。特征量提取部3對區(qū)域e2的正常產(chǎn)品特征量組12應(yīng)用自回歸模型(ar模型)來提取特征量,對區(qū)域e4的異常產(chǎn)品特征量組14同樣地應(yīng)用自回歸模型來提取特征量。距離計算部5對正常產(chǎn)品特征量組12的各正常產(chǎn)品數(shù)據(jù)使用提取出的特征量,根據(jù)上述(式13)計算距離d,對異常產(chǎn)品特征量組14的各異常產(chǎn)品數(shù)據(jù)同樣地使用提取出的特征量,根據(jù)上述(式13)計算距離d。
正常/異常辨別部6對關(guān)于正常產(chǎn)品數(shù)據(jù)以及異常產(chǎn)品數(shù)據(jù)計算出的距離d與上述辨別閾值進行比較,根據(jù)比較結(jié)果,在(距離d≥辨別閾值)的關(guān)系成立的情況下辨別為是“異常產(chǎn)品”,在(距離d<辨別閾值)的關(guān)系成立的情況下辨別為是“正常產(chǎn)品”。在該情況下,能夠?qū)颜.a(chǎn)品誤辨別為異常產(chǎn)品的概率(也就是說“錯檢率(overlookingratio)”)做到約10%。
(實施方式1的效果)
根據(jù)實施方式1,通過在辨別中使用距基準(zhǔn)空間的距離d,能夠提高正常產(chǎn)品與異常產(chǎn)品的分離度,該基準(zhǔn)空間是利用正常產(chǎn)品特征量組12生成的基準(zhǔn)空間數(shù)據(jù)13所示出的基準(zhǔn)空間。具體而言,從正常產(chǎn)品測量出的聲音波形具有偏差小且特征也類似的性質(zhì),與此相對,從異常產(chǎn)品測量的聲音波形具有偏差大的性質(zhì)。也就是說,正常產(chǎn)品的特征量具有較均勻的分布,而異常產(chǎn)品的特征量的分布存在大的傾向性。
因此,通過將根據(jù)正常產(chǎn)品特征量組12生成的基準(zhǔn)空間數(shù)據(jù)13用作辨別基準(zhǔn),能夠高精度地辨別正常產(chǎn)品與異常產(chǎn)品,該正常產(chǎn)品特征量組包括比異常產(chǎn)品數(shù)據(jù)的特征量組更加均勻的特征量。
另外,為了計算距離d而實施使用廣義逆矩陣a的逆矩陣計算。在使用聲音等時間序列數(shù)據(jù)時有時產(chǎn)生多重共線性的問題,從而難以進行逆矩陣計算,但在廣義逆矩陣的情況下,即使在未正則的情況下也能夠計算逆矩陣。因此,通過應(yīng)用廣義逆矩陣a,不管有沒有多重共線性都能夠計算距離d。
另外,馬氏距離d通過使用廣義逆矩陣來計算,能夠得到高的辨別精度。也就是說,在如專利文獻4(日本特開2004-198383號公報)所述地將特征量集合為平均值、敏感度、標(biāo)準(zhǔn)sn比來計算馬氏距離的情況下,難以提取對辨別有效的特征而使用,從而無法得到高的辨別精度。相反,在實施方式1中,應(yīng)用廣義逆矩陣計算出的距離d由于不集合特征量而能夠包括與大量的特征量相關(guān)的信息,所以能夠得到高的辨別精度。
[實施方式2]
實施方式2示出實施方式1的變形例。在實施方式2中,基準(zhǔn)空間生成部4在生成基準(zhǔn)空間數(shù)據(jù)13時使單位數(shù)據(jù)的分布均勻化。
具體而言,基準(zhǔn)空間生成部4為了使基準(zhǔn)空間數(shù)據(jù)13中的單位數(shù)據(jù)的分布均勻化而實施包括以下的步驟sa和步驟sb的平均化處理。
(步驟sa):基準(zhǔn)空間生成部4從基準(zhǔn)空間數(shù)據(jù)13的1000個單位數(shù)據(jù)隨機提取400個單位數(shù)據(jù),對提取出的單位數(shù)據(jù)的特征量進行平均化處理,將表示平均化處理得到的特征量的數(shù)據(jù)定義為新的單位數(shù)據(jù)。
(步驟sb):基準(zhǔn)空間生成部4使在上述步驟sa中提取出的400個單位數(shù)據(jù)返回到原來的基準(zhǔn)空間數(shù)據(jù)13。之后,基準(zhǔn)空間生成部4實施上述步驟sa。
基準(zhǔn)空間生成部4重復(fù)實施1000次上述步驟sa和步驟sb的處理,生成包括計算(定義)出的1000個單位數(shù)據(jù)的新的基準(zhǔn)空間數(shù)據(jù)13,并儲存到區(qū)域e3。由此,將區(qū)域e3的基準(zhǔn)空間數(shù)據(jù)13的單位數(shù)據(jù)改寫成表示均勻的特征量的單位數(shù)據(jù)。此外,在上述步驟sa中對400個單位數(shù)據(jù)所表示的特征量計算了平均值,但計算值不限于此。也就是說,所計算的值是關(guān)于400個單位數(shù)據(jù)的特征量的代表值即可,也可以計算例如400個單位數(shù)據(jù)表示的特征量的中值、眾數(shù)等。
發(fā)明人們在實驗中,在使用實施上述平均化處理得到的基準(zhǔn)空間數(shù)據(jù)13的情況下實施了由正常/異常辨別部6進行的辨別處理,在使用未實施平均化處理得到的基準(zhǔn)空間數(shù)據(jù)13的情況下也實施了由正常/異常辨別部6進行的辨別處理。其結(jié)果,得到如下見解:實施平均化處理的情況與未實施平均化處理的情況相比,正常產(chǎn)品與異常產(chǎn)品的辨別精度提高。也就是說,在未實施平均化處理的實施方式1中錯檢率約10%,與此相對,根據(jù)實施平均化處理的實施方式2,能夠使該錯檢率降低到1%。
另外,發(fā)明人們通過實驗得到如下見解:在步驟sa中從基準(zhǔn)空間數(shù)據(jù)13提取的單位數(shù)據(jù)的數(shù)量與錯檢率具有相關(guān)性。也就是說,在從基準(zhǔn)空間數(shù)據(jù)13提取出40%~50%的數(shù)量的單位數(shù)據(jù)的情況下,能夠使錯檢率最低。另外,發(fā)明人們還得到不管構(gòu)成基準(zhǔn)空間數(shù)據(jù)13的單位數(shù)據(jù)的數(shù)量如何都能夠得到該效果的見解。
(實施方式2的效果)
這樣,在實施方式2中,通過使用包括均勻分布的單位數(shù)據(jù)的基準(zhǔn)空間數(shù)據(jù)13能夠使“錯檢率”降低即提高辨別精度,“錯檢率”表示將正常產(chǎn)品誤辨別為異常產(chǎn)品的概率。
[實施方式3]
實施方式3示出實施方式1或者2的變形例。在實施方式3中,為了使辨別精度接近人的敏感度的精度,特征量提取部3對上述時間序列數(shù)據(jù)進行基于頻率的加權(quán)。
具體而言,實施方式3基于以下背景進行:人的聽覺在頻帶中不具有同樣的敏感度。另一方面,在特征量提取部3對全部頻率區(qū)域以相等的權(quán)重從時間序列數(shù)據(jù)提取特征量的情況下,得到與人的聽覺不同的辨別結(jié)果,成為辨別精度降低的主要原因。因此,在實施方式3中,為了接近人的敏感度的辨別精度,特征量提取部3對時間序列數(shù)據(jù)進行基于頻率的加權(quán)處理。
特征量提取部3的a特性校正部3d是“加權(quán)部”的一個實施例,對時間序列數(shù)據(jù)實施基于a特性的校正處理。在基于a特性的校正處理中考慮人類聽覺而對頻率進行加權(quán)。也就是說,該校正處理相當(dāng)于鑒于如下特性的濾波處理,該特性為:人類的聽覺在低頻側(cè)在1000hz以下的頻帶中敏感度降低,在20hz以下不具有敏感度(聽不到),并且在高頻側(cè)也是頻率越高則敏感度越降低,在20khz時不具有敏感度。在該濾波處理中應(yīng)用a特性校正部3d所具有的a特性濾波器。
a特性濾波器具有不影響1000hz附近的分量而使低頻以及高頻的分量(振幅等)衰減的特性。a特性濾波器通過以下的(式14)表示。最好以人的耳朵敏感的頻率區(qū)域中的異常聲音作為對象來實施加權(quán)處理。因此,在(式14)中,將在人的聽覺中示出高的敏感度的頻率f1~f4用作參數(shù)。
[式14]
在發(fā)明人們的實驗中,特征量提取部3對時間序列數(shù)據(jù)實施在實施方式2中說明的由ar推測部3c進行的基于自回歸模型的譜密度計算,進而實施由a特性校正部3d進行的加權(quán)處理。由此,提取出表示所得到的譜密度數(shù)據(jù)的特征量。然后,基準(zhǔn)空間生成部4基于實施方式2的處理生成包括均勻的單位數(shù)據(jù)的基準(zhǔn)空間數(shù)據(jù)13。正常/異常辨別部6根據(jù)如上所述地被均勻化了的基準(zhǔn)空間數(shù)據(jù)13實施辨別處理。通過這樣的實驗,能夠?qū)㈠e檢率做到0.1%以下。
(其它實驗例)
發(fā)明人們進行了使用本實施方式3所示的、示出錯檢率為0.1%以下的基準(zhǔn)空間數(shù)據(jù)13的其它實驗。在該實驗中,特征量提取部3將通過人的聽覺檢查預(yù)先判明為異常的異常產(chǎn)品的150個時間序列數(shù)據(jù)以及正常產(chǎn)品的200個時間序列數(shù)據(jù)作為對象,從各時間序列數(shù)據(jù)提取出特征量。正常/異常辨別部6利用使用提取出的特征量計算出的距離d實施了辨別處理。在該實驗中,正常/異常辨別部6能夠完全無誤地辨別正常產(chǎn)品與異常產(chǎn)品。
另外,發(fā)明人們?yōu)榱诉M行對比還實施了其它實驗。圖9是示出實施方式3的用于對比的實驗結(jié)果的圖。在實驗中,在上述異常產(chǎn)品的150個時間序列數(shù)據(jù)中,表示3種異常主要原因的異常模式ma、mb、mc各包括30個通過人的聽覺檢查而判明異常的主要原因、且其特征明確的樣品。關(guān)于3種異常模式的各異常模式構(gòu)成基準(zhǔn)空間數(shù)據(jù)。對各異常模式的基準(zhǔn)空間數(shù)據(jù),關(guān)于未實施a特性校正的各異常產(chǎn)品數(shù)據(jù)計算距離d,并將計算出的距離d作為辨別閾值的指標(biāo)。發(fā)明人們針對每個異常模式,對各異常產(chǎn)品數(shù)據(jù)進行了基于該距離d和辨別閾值的辨別。在圖9中,關(guān)于異常模式ma、mb以及mc的各異常模式,以對比的方式示出通過該實驗得到的正解個數(shù)(16個、18個、17個)以及通過人的聽音檢查得到的正解個數(shù)(30個、30個、30個)。如圖9所示,可知在不實施a特性校正的情況下,正解率降低為50~60%。
(實施方式3的效果)
這樣,在實施方式3中,通過在對人的耳朵敏感的頻率區(qū)域的特征量(譜密度)進行加權(quán)之后實施特征量提取,能夠降低將正常產(chǎn)品誤辨別為異常產(chǎn)品的“錯檢率”。因此,辨別精度提高。
[實施方式4]
(層次聚類)
在本實施方式4中,層次聚類分析部8是“異常模式分類部”的一個實施例。層次聚類分析部8實施層次聚類分析,該層次聚類分析用于將被實施了實施方式3的ar推測或者a特性校正的辨別產(chǎn)品數(shù)據(jù)中的、被辨別為異常產(chǎn)品的各辨別產(chǎn)品數(shù)據(jù)分類為多種異常模式(相當(dāng)于集群)。以下說明層次聚類分析。
首先,層次聚類分析部8對信息儲存部10的區(qū)域e4的異常產(chǎn)品特征量組14的各異常產(chǎn)品數(shù)據(jù)的特征量實施層次聚類分析。
在這里,如上所述,因為異常產(chǎn)品特征量組14的各異常產(chǎn)品數(shù)據(jù)的特征量相當(dāng)于來自異常產(chǎn)品提取部7的異常產(chǎn)品特征量7a,所以使用異常產(chǎn)品特征量7a說明層次聚類分析。分析包括以下的處理步驟(1)~(4)。
步驟(1):層次聚類分析部8將異常產(chǎn)品特征量組14的各個異常產(chǎn)品特征量7a定量化為特征向量。定量化而得到的特征向量作為要素(相當(dāng)于后述的項目i、j)具有上述的對10hz的量的譜密度進行平均化處理而計算出的1000個特征量。
步驟(2):層次聚類分析部8根據(jù)“非類似度”計算距離矩陣,該“非類似度”是異常產(chǎn)品特征量7a彼此的非類似性的尺度。
步驟(3):層次聚類分析部8選擇聚類算法(后述)。
步驟(4):層次聚類分析部8依照選擇出的聚類算法重復(fù)進行處理,直至將全部異常產(chǎn)品特征量7a整合為一個集群為止。
在這里,在執(zhí)行層次聚類分析之前,層次聚類分析部8使用上述“非類似度”制作將特征向量的項目i與項目j之間的距離dij作為要素的距離矩陣,該“非類似度”為表示異常產(chǎn)品數(shù)據(jù)彼此的不相似程度的量。雖然提出有多個表示“非類似度”的式子,但在本實施方式中,“非類似度”使用相關(guān)系數(shù)rij通過以下的(式15)定義。
[式15]
dij=1-rij…(式15)
另外,還能夠應(yīng)用將向量xi與向量xj之間的“非類似度”設(shè)為cosθ、通過以下的(式16)定義的方法,但在這里,“非類似度”是使用相關(guān)系數(shù)rij通過(式15)計算的。
[式16]
在上述步驟(3)中,作為聚類算法,能夠應(yīng)用最近距離法、最遠距離法、組平均法、重心法、中值法、離差平方和(ward)法等算法。以下,說明各算法的概要。
最近距離法是如下方法:分別從2個集群的各個集群中各選擇1個個體并計算所選擇出的2個個體之間的距離,將在計算出的各距離中最近的個體間的距離確定為該2個集群之間的距離。
最遠距離法是如下方法:分別從2個集群的各個集群中各選擇1個個體并計算所選擇出的2個個體之間的距離,將在計算出的各距離中最遠的個體間的距離確定為該2個集群之間的距離。
組平均法是如下方法:將最近距離法與最遠距離法折衷的方法。具體而言,組平均法是指從2個集群的各個集群中各選擇1個個體,并計算所選擇出的2個個體之間的距離,將計算出的各距離的平均值確定為該2個集群之間的距離。
重心法是如下方法:計算集群各自的重心(例如,平均向量)并將計算出的重心之間的距離確定為集群之間的距離。
中值法是對重心法變形得到的方法。具體而言,雖然計算2個集群的重心之間的加權(quán)的距離,但將使權(quán)重相等而計算出的距離的值確定為2個集群之間的距離。
ward法是如下方法:在融合2個集群時,依照用于使各集群的組內(nèi)的方差與集群彼此之間的組間的方差之比最大化的基準(zhǔn)形成集群。ward法是能夠得到最高的分離度的方法,也被稱為最小方差法。
<數(shù)據(jù)的整合和異常模式的分類>
接下來,參照圖10,使用層次構(gòu)造來說明上述步驟(4)中的、將異常產(chǎn)品特征量組14的全部異常產(chǎn)品特征量7a整合為1個的過程,并且說明在該層次構(gòu)造中將異常產(chǎn)品特征量7a分類為各異常模式的過程。圖10是示出實施方式4的層次構(gòu)造的一個例子的圖。在這里,設(shè)想為異常產(chǎn)品特征量組14具有9個異常產(chǎn)品數(shù)據(jù)d1~d9的異常產(chǎn)品特征量。
作為使用上述特征量的距離尺度,應(yīng)用使用特征量彼此的相關(guān)系數(shù)rij的“非類似度”,使用相關(guān)系數(shù)rij依照上述(式15)定義非類似度dij。另外,在步驟(3)中,選擇上述的組平均法來作為聚類算法。
在組平均法中,根據(jù)作為對象的異常產(chǎn)品數(shù)據(jù)的特征量的相關(guān)系數(shù)計算“非類似度”,將該計算值的平均值作為異常產(chǎn)品數(shù)據(jù)彼此的距離。
層次聚類分析部8對異常產(chǎn)品特征量組14的9個異常產(chǎn)品數(shù)據(jù)d1~d9,用分支連接距離近的異常產(chǎn)品數(shù)據(jù)彼此。由此,制作圖10所示的系統(tǒng)樹圖(樹形圖)。在圖10的系統(tǒng)樹圖中示出對9個異常產(chǎn)品數(shù)據(jù)d1~d9進行聚類分析得到的結(jié)果。圖10的系統(tǒng)樹圖的縱軸表示聚類間的距離的值(0.2、0.4、…1.0),圖10的從下向上將異常產(chǎn)品數(shù)據(jù)d1~d9結(jié)合起來。
在這里,集群數(shù)量(即異常模式的數(shù)量)根據(jù)操作者的指示來確定。具體而言,當(dāng)操作者經(jīng)由輸入裝置54將集群數(shù)量輸入到檢查數(shù)據(jù)處理裝置50時,為了計算閾值(圖),層次聚類分析部8根據(jù)所輸入的集群數(shù)量執(zhí)行預(yù)先確定的運算。層次聚類分析部8通過將上述閾值應(yīng)用到所生成的系統(tǒng)樹圖,從而在系統(tǒng)樹圖上將全部異常產(chǎn)品數(shù)據(jù)分類為所指示的數(shù)量的集群(異常模式)。
在圖10中,將異常產(chǎn)品數(shù)據(jù)d1~d6分類為異常模式ma的集群,將異常產(chǎn)品數(shù)據(jù)d7和d8分類為異常模式mb的集群,并且將異常產(chǎn)品數(shù)據(jù)d9分類為異常模式mc的集群。這樣,將異常產(chǎn)品特征量組14的全部異常產(chǎn)品數(shù)據(jù)整合為1個系統(tǒng)樹圖,并且分類為各異常模式。
圖11是示出實施方式4的實驗結(jié)果的一個例子的圖。在圖11中,示出每個異常模式的相對于人的聽音檢查的正解的比例(正解率)。在實驗中,將異常產(chǎn)品特征量組14的異常產(chǎn)品數(shù)據(jù)的150個異常產(chǎn)品數(shù)據(jù)的特征量分割成異常模式ma、異常模式mb、異常模式mc以及其它模式這共計4種集群。
通過圖11的表示出通過人的聽音檢查得到的向各異常模式的分類結(jié)果,并示出其正解率是約70~80%。另外,發(fā)明人們根據(jù)實驗得到如下見解:通過層次聚類分析部8進行的基于正常產(chǎn)品的基準(zhǔn)空間的異常模式的分類處理與使用異常產(chǎn)品的基準(zhǔn)空間的異常模式的分類處理相比,提高了分類的精度。
(實施方式4的效果)
根據(jù)實施方式4,在使用包括正常產(chǎn)品數(shù)據(jù)的基準(zhǔn)空間數(shù)據(jù)13來辨別正常/異常的情況下,也實施ar推測以及a特性校正,從而異常產(chǎn)品特征量7a中能夠包括不被噪聲掩蓋而被進行了基于人的聽覺敏感度的加權(quán)的狀態(tài)的特征量。因此,通過層次聚類分析,能夠?qū)惓.a(chǎn)品特征量7a適當(dāng)?shù)胤诸悶槊總€異常模式。
[實施方式5]
在實施方式5中,檢查數(shù)據(jù)處理裝置50對實施方式4的通過層次聚類分析部8分類了的各異常模式分析異常的主要原因。
(異常主要原因的分析處理)
主要原因分析部9依照使用包括正常產(chǎn)品數(shù)據(jù)的基準(zhǔn)空間的mts(馬氏田口系統(tǒng))法對由層次聚類分析部8分類為異常模式的異常產(chǎn)品數(shù)據(jù)分析主要原因。
圖12是示出本實施方式5的各特征量的sn比(signal-to-noiseratio,信噪比)的一個例子的圖。在圖12中,對橫軸分配特征量編號n1、n2、…、n999、n1000,這些特征量編號被分配給作為上述特征向量的要素的1000個特征量(對應(yīng)于頻率分量的譜密度),對縱軸分配sn比。在作為特征向量的要素的1000個特征量中包括sn比大的特征量(以下稱為特定特征量)。這樣,sn比大的特定特征量在使用正常產(chǎn)品的基準(zhǔn)空間來辨別異常產(chǎn)品時以使馬氏距離d變大的方式發(fā)揮作用,所以作為正常/異常的辨別時使用的指標(biāo)是有效的。
預(yù)先通過實驗等對1000個特征量分析并確定sn比變大的物理性原因,從而能夠?qū)Ω鳟惓DJ酵茰y異常主要原因。例如,通過實驗等取得對應(yīng)于特征量編號的特征量的異常主要原因。然后,生成將各特征量編號與對應(yīng)的異常主要原因關(guān)聯(lián)起來登記的異常主要原因數(shù)據(jù)18,并預(yù)先儲存到信息儲存部10的區(qū)域e8。因此,能夠根據(jù)sn比大的特定特征量的編號從異常主要原因數(shù)據(jù)18讀出對應(yīng)的異常主要原因。
另外,通過選擇性地使用這些特定特征量,能夠降低馬氏距離的計算負(fù)荷,高速并且得到高的辨別精度。以下說明確定每個異常模式所特有的特征量的處理。
主要原因分析部9是“異常主要原因確定部”的一個實施例。主要原因分析部9對各異常模式使用被分類為該異常模式的異常產(chǎn)品特征量7a,實施上述逆矩陣計算,對各異常產(chǎn)品特征量7a計算馬氏距離(步驟t1)。
主要原因分析部9對每個異常模式計算標(biāo)準(zhǔn)差σ,該標(biāo)準(zhǔn)差σ表示異常產(chǎn)品數(shù)據(jù)組的馬氏距離d的偏差程度。具體而言,主要原因分析部9對各異常模式,分別計算僅使用特定特征量以及使用全部特征量這兩種情況下的馬氏距離d的偏差程度的標(biāo)準(zhǔn)差σ(步驟t2)。
當(dāng)在步驟t2中判斷為僅使用特定特征量時的馬氏距離的標(biāo)準(zhǔn)差σ小于使用全部特征量時的距離d的標(biāo)準(zhǔn)差σ的情況下,主要原因分析部9將該特定特征量確定為使該異常模式的異常產(chǎn)品數(shù)據(jù)組的分布減小(更加均勻化)的有效的特征量(以下還稱為有效特征量)。
主要原因分析部9根據(jù)所確定的有效特征量的編號,從信息儲存部10的區(qū)域e9讀出對應(yīng)的異常主要原因數(shù)據(jù)。將所讀出的異常主要原因數(shù)據(jù)經(jīng)由輸出裝置55輸出。由此,能夠通知被辨別為異常的檢查對象產(chǎn)品的異常主要原因。
(實施方式5的效果)
這樣,主要原因分析部9無需學(xué)習(xí)異常產(chǎn)品的數(shù)據(jù)庫,就能夠?qū)Ω鳟惓DJ酱_定用于確定異常主要原因的有效特征量。也就是說,隨著判定產(chǎn)品數(shù)據(jù)的增加,作為層次聚類分析對象的異常產(chǎn)品數(shù)據(jù)增加,其結(jié)果是,異常模式數(shù)量增加。經(jīng)過這樣的過程而學(xué)習(xí)到異常產(chǎn)品的數(shù)據(jù)庫。另外,通過使用特定特征量構(gòu)成各異常模式的基準(zhǔn)空間,就各異常模式的基準(zhǔn)空間來說,能夠生成包括更加均勻化的特征量的基準(zhǔn)空間。因此,容易使用馬氏距離來辨別辨別產(chǎn)品數(shù)據(jù)符合哪種異常模式。
[實施方式6]
在本實施方式6中,檢查數(shù)據(jù)處理裝置50使用實施方式5中的主要原因分析結(jié)果(對每個異常模式確定的有效特征量)來生成基準(zhǔn)空間數(shù)據(jù)13。
<使用主要原因分析結(jié)果的基準(zhǔn)空間的生成>
主要原因分析部9將識別上述有效特征量的特征量編號作為特征量識別數(shù)據(jù)16儲存到信息儲存部10的區(qū)域e6?;鶞?zhǔn)空間生成部4將表示單位數(shù)據(jù)的特征向量的1000個特征量中的由特征量識別數(shù)據(jù)16表示的第i個項目與第j個項目的相關(guān)系數(shù)用作用于計算廣義逆矩陣的相關(guān)系數(shù)矩陣r的要素rij(參照上述(式3))。另外,根據(jù)單位數(shù)據(jù)生成基準(zhǔn)空間數(shù)據(jù)13,該單位數(shù)據(jù)是由以特征量識別數(shù)據(jù)16示出的有效特征量表示的單位數(shù)據(jù)。
(實施方式6的效果)
根據(jù)實施方式6,能夠使利用第1距離d得到的正常產(chǎn)品/異常產(chǎn)品的辨別精度比利用第2距離d得到的辨別精度提高,其中上述第1距離d是根據(jù)僅使用有效特征量生成的基準(zhǔn)空間計算出的距離,上述第2距離d是與使用全部特征量生成的基準(zhǔn)空間的距離。
另外,在根據(jù)僅使用有效特征量生成的基準(zhǔn)空間通過層次聚類分析部8分類為各異常模式時,與使用異常產(chǎn)品所具有的全部特征量來辨別正常/異常的情況相比,也能夠提高分類精度。
[實施方式7]
在實施方式7中,說明通過程序來實施上述各實施方式所示的一系列的處理的情況。圖13是實施方式7的整體處理的流程圖。該流程圖所示的處理作為程序而預(yù)先儲存于存儲部(主存儲裝置52、輔助存儲裝置53以及存儲卡59等)。cpu51通過從存儲部讀出程序并執(zhí)行所讀出的程序來實現(xiàn)處理。
參照圖13的流程圖,說明預(yù)先生成基準(zhǔn)空間數(shù)據(jù)13的處理(步驟s1)。具體而言,基準(zhǔn)空間生成部4經(jīng)由信號處理部2a以及特征量提取部3a輸入表示由傳感器1a檢測到的從正常產(chǎn)品產(chǎn)生的聲音的特征量數(shù)據(jù),并將特征量數(shù)據(jù)儲存到信息儲存部10的區(qū)域e2。此時,在特征量提取部3a中實施利用ar推測部3c進行的ar推測處理以及利用a特性校正部3d進行的a特性校正處理(步驟s1a、s1b)。由此,將各正常產(chǎn)品的特征量數(shù)據(jù)(單位數(shù)據(jù))儲存到區(qū)域e2。
基準(zhǔn)空間生成部4根據(jù)正常產(chǎn)品特征量組12生成平均化處理了的基準(zhǔn)空間數(shù)據(jù)13,將所生成的基準(zhǔn)空間數(shù)據(jù)13儲存到區(qū)域e3(步驟s1c)。
由此,在信息儲存部10的區(qū)域e3儲存包括均勻的單位數(shù)據(jù)的基準(zhǔn)空間數(shù)據(jù)13,基準(zhǔn)空間數(shù)據(jù)13的生成結(jié)束。
接下來,說明基于基準(zhǔn)空間數(shù)據(jù)13所表示的基準(zhǔn)空間進行的正常/異常的辨別處理。
首先,生成包括多個辨別產(chǎn)品數(shù)據(jù)的辨別產(chǎn)品特征量組11(步驟s2)。具體而言,通過傳感器1b測量來自辨別產(chǎn)品的聲音。通過信號處理部2b以及特征量提取部3b對由傳感器1b得到的測量信號進行處理(步驟s3)。此時,在特征量提取部3b中,實施利用ar推測部3c以及a特性校正部3d進行的處理(步驟s4、s5)。
由此,將從辨別產(chǎn)品數(shù)據(jù)提取出的特征量數(shù)據(jù)作為辨別產(chǎn)品特征量儲存到信息儲存部10的區(qū)域e1。通過對多個辨別產(chǎn)品實施步驟s2~s5的處理,從而將辨別產(chǎn)品特征量組11儲存到區(qū)域e1。
對辨別產(chǎn)品特征量組11的各辨別產(chǎn)品特征量實施正常/異常的辨別(步驟s7)。具體而言,距離計算部5對從辨別產(chǎn)品特征量組11讀出的辨別產(chǎn)品特征量計算馬氏距離d。正常/異常辨別部6對計算出的距離d與判定閾值進行比較,根據(jù)比較結(jié)果進行辨別。另外,根據(jù)該辨別結(jié)果,將辨別產(chǎn)品數(shù)據(jù)中的被辨別為異常產(chǎn)品的異常產(chǎn)品特征量作為異常產(chǎn)品特征量7a儲存到信息儲存部10的區(qū)域e4。通過對辨別產(chǎn)品特征量組11的各辨別產(chǎn)品特征量實施步驟s5和s6的處理,從而將異常產(chǎn)品特征量組14儲存到區(qū)域e4。
層次聚類分析部8通過上述步驟(1)~(4)的層次聚類分析,對區(qū)域e4的異常產(chǎn)品特征量組14進行分類(步驟s9)。層次聚類分析部8將按異常模式區(qū)分的異常產(chǎn)品特征量作為按模式區(qū)分的特征量組15儲存到信息儲存部10的區(qū)域e5。另外,將未被分類為任何異常模式的異常產(chǎn)品特征量作為未分類數(shù)據(jù)8a儲存到信息儲存部10的區(qū)域e8。
在cpu51判斷為未分類數(shù)據(jù)組17的未分類數(shù)據(jù)8a達到預(yù)定個數(shù)時,主要原因分析部9通過主要原因分析確定每個異常模式的有效特征量,并將其特征量編號作為特征量識別數(shù)據(jù)16儲存到區(qū)域e6(步驟s11)。另外,將根據(jù)各異常模式的有效特征量從信息儲存部10的區(qū)域e8的異常主要原因數(shù)據(jù)18讀出的原因數(shù)據(jù)經(jīng)由輸出裝置55輸出。
將該原因分析的結(jié)果反饋給層次聚類分析部8(步驟s13)。具體而言,對由區(qū)域e6的特征量識別數(shù)據(jù)16表示的有效特征量進行加權(quán),實施上述層次聚類分析。由此,關(guān)于異常模式的分類,僅對敏感度高的特征量(有效特征量)進行加權(quán)。因此,在層次聚類分析中,能夠得到異常模式的分類的高分類精度。
另外,cpu51將主要原因分析結(jié)果反映到基準(zhǔn)空間(步驟s15)。具體而言,cpu51將單位數(shù)據(jù)的1000個特征量中的、由特征量識別數(shù)據(jù)16表示的第i個項目與第j個項目的相關(guān)系數(shù)用作用于計算廣義逆矩陣的相關(guān)系數(shù)矩陣r的要素rij(參照上述(式3)),即用作單位數(shù)據(jù)的第i個項目與第j個項目的相關(guān)系數(shù)。另外,將區(qū)域e3的基準(zhǔn)空間數(shù)據(jù)13變更為新的基準(zhǔn)空間數(shù)據(jù)13。基準(zhǔn)空間數(shù)據(jù)13包括表示通過特征量識別數(shù)據(jù)16識別的有效特征量的單位數(shù)據(jù)。
之后,cpu51判斷是否結(jié)束處理(步驟s16)。例如,cpu51根據(jù)從輸入裝置54輸入的操作者的指示判斷是否結(jié)束該處理。cpu51在判斷為不結(jié)束處理的情況下(步驟s16中“否”),使控制返回到步驟s2。cpu51在判斷為結(jié)束處理的情況下,(步驟s16中“是”),結(jié)束一系列的辨別處理。
[實施方式8]
將用于實現(xiàn)各實施方式中說明的檢查數(shù)據(jù)處理裝置50的處理的程序儲存在存儲部(主存儲裝置52、輔助存儲裝置53以及存儲卡59)中。cpu51通過從存儲部讀出該程序并執(zhí)行所讀出的程序,從而與其它電路部協(xié)作而實現(xiàn)處理。
上述各實施方式的處理還以上述程序來提供。將這樣的程序記錄到附屬于圖1的檢查數(shù)據(jù)處理裝置50的計算機的存儲卡59等計算機可讀的記錄介質(zhì)中來提供?;蛘撸€能夠記錄到內(nèi)置于計算機的主存儲裝置52、輔助存儲裝置53以及存儲卡59等記錄介質(zhì)來提供程序。另外,還能夠通過經(jīng)由未圖示的通信網(wǎng)絡(luò)以及通信裝置56下載到檢查數(shù)據(jù)處理裝置50的存儲部來提供程序。
將所提供的程序例如安裝于輔助存儲裝置53的硬盤等程序儲存部,由cpu51讀出并執(zhí)行所安裝的程序。此外,程序產(chǎn)品包括程序本身以及非臨時性地存儲程序的存儲介質(zhì)。
應(yīng)該認(rèn)為本次公開的實施方式在所有方面都是示例性的,而并非限制性的。本發(fā)明的范圍不通過上述說明表示,而是通過權(quán)利要求書來表示,意圖包括與權(quán)利要求書等同的含意以及范圍內(nèi)的全部變更。