專利名稱:聚類系統(tǒng)及缺陷種類判定裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及將檢測(cè)對(duì)象物的圖像中的缺陷部分的部分圖像取出、從該 部分圖像中提取缺陷的特征信號(hào)、并對(duì)缺陷的類別進(jìn)行分類的聚類系統(tǒng)、 和缺陷種類判定裝置。
背景技術(shù):
以往普遍地施行利用未知數(shù)據(jù)和學(xué)習(xí)數(shù)據(jù)的距離、例如馬氏
(Mahalanobis generalized distance)距離的聚類方法。即,通過判定未知數(shù)據(jù) 是否屬于作為事先已學(xué)習(xí)的群體(population)的類別來(lái)分類,進(jìn)行聚類處理。 例如,根據(jù)對(duì)多個(gè)類別的馬氏距離的大小,對(duì)未知數(shù)據(jù)屬于哪一個(gè)群體的 類別進(jìn)行判定(例如參照專利文獻(xiàn)1)。
另外,為有效計(jì)算上述的距離,選擇多個(gè)特征量進(jìn)行聚類處理。 另外,利用由多個(gè)識(shí)別器(classifier)得到的結(jié)果的投票、對(duì)該未知數(shù)據(jù) 歸屬的類別進(jìn)行判定的方法也較為普遍,使用不同傳感器的輸出的識(shí)別結(jié) 果、或?qū)τ谝粋€(gè)圖像上不同區(qū)域的未知數(shù)據(jù)的識(shí)別中的識(shí)別結(jié)果等(例如參 照專利文獻(xiàn)2)。
利用上述聚類方法,在根據(jù)血液檢査的結(jié)果所得到的參數(shù)的疾病診斷、 即屬于哪一種疾病的聚類中,具有如下方法,即,設(shè)定在多個(gè)類別中各以2 個(gè)類別為一組合,對(duì)所有組合的每個(gè)該組合,進(jìn)行被檢測(cè)數(shù)據(jù)類似于哪一 種類別的判定,根據(jù)該判定個(gè)數(shù)的統(tǒng)計(jì)結(jié)果,來(lái)決定將其分類成被判定的 個(gè)數(shù)較多的類別(例如專利文獻(xiàn)3)。
將LCD玻璃基板上帶有的各缺陷、按照預(yù)先設(shè)定的每個(gè)缺陷種類進(jìn)行 分類時(shí),進(jìn)行如下聚類,即,與分類時(shí)的識(shí)別相對(duì)應(yīng),對(duì)分類中使用的各 特征量進(jìn)行優(yōu)化,并對(duì)各特征量分別進(jìn)行加權(quán),使得與該優(yōu)化對(duì)應(yīng),并使 用該優(yōu)化后的特征量,對(duì)屬于哪一種類別進(jìn)行判定(例如專利文獻(xiàn)4)。專利文獻(xiàn)1:特開2005 — 214682號(hào)公報(bào) 專利文獻(xiàn)2:特開2001 — 56861號(hào)公報(bào) 專利文獻(xiàn)3:特開平07—105166號(hào)公報(bào) 專利文獻(xiàn)4:特開2002 — 99916號(hào)公報(bào)
但是,專利文獻(xiàn)3所示的聚類中,未對(duì)每個(gè)組合進(jìn)行優(yōu)化,未有效利 用成為判別材料的特征量,且如果應(yīng)判別的類別變多時(shí),則組合數(shù)龐大, 會(huì)有判定處理所需時(shí)間增大的問題。
另外,專利文獻(xiàn)4所示的聚類中,雖然想要根據(jù)判定率,對(duì)特征量加 權(quán)來(lái)提高判別精度,但沒有對(duì)每個(gè)類別的特征量進(jìn)行優(yōu)化的概念,與上述 的專利文獻(xiàn)3同樣,由于未有效利用特征量,因此存在無(wú)法進(jìn)行高精度的 分類的缺點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明是鑒于這樣的情況而完成的,在判別時(shí)有效利用從分類成所屬 的類別的對(duì)象即分類對(duì)象數(shù)據(jù)中提取的特征量,與現(xiàn)有例相比,提供能夠 以更高速度、更高精度對(duì)分類對(duì)象數(shù)據(jù)進(jìn)行分類的、例如能夠?qū)⒉AП砻?帶有的缺陷分類成與缺陷種類對(duì)應(yīng)的類別的聚類系統(tǒng)、和缺陷種類判定裝置。
為解決上述問題,與利用同一種類的特征量算出分類對(duì)象數(shù)據(jù)、和與 各分類之間的距離來(lái)決定分類目標(biāo)的現(xiàn)有例不同,本發(fā)明中,由于對(duì)每個(gè) 類別設(shè)定能在各類別間得到差分的特征量的集合,并利用不同的特征量求 出與各自的類別之間的距離,因此與以往相比可進(jìn)行精度更高的分類。
上述的特征量的集合由于是根據(jù)屬于各類別的學(xué)習(xí)數(shù)據(jù)施行的,因此 由可與其它類別區(qū)別的特征量構(gòu)成。
艮P,本發(fā)明采用以下構(gòu)成。
本發(fā)明的聚類系統(tǒng),利用輸入數(shù)據(jù)(i叩utdata)所具有的特征量 (parameter)、將該輸入數(shù)據(jù)分類成由學(xué)習(xí)數(shù)據(jù)(learning data)的群體所形成的 各類別,其中,包含特征量集合存儲(chǔ)部,該特征量集合存儲(chǔ)部存儲(chǔ)與各 類別對(duì)應(yīng)的、分類中使用的作為特征量組合的特征量集合(parameterset);
6特征量提取部,該特征量提取部從輸入數(shù)據(jù)中提取預(yù)先設(shè)定的特征量;距 離計(jì)算部,該距離計(jì)算部對(duì)每個(gè)與各類別對(duì)應(yīng)的特征量集合、根據(jù)該特征 量集合中包含的特征量來(lái)分別計(jì)算并輸出各類別的群體的中心和所述輸入 數(shù)據(jù)之間的距離作為集合距離;及位次提取部,該位次提取部將所述各集 合距離以從小到大的順序排列。
本發(fā)明優(yōu)選的聚類系統(tǒng),對(duì)每個(gè)類別設(shè)定多個(gè)所述特征量集合。 本發(fā)明優(yōu)選的聚類系統(tǒng),還具有類別分類部,該類別分類部在每個(gè)特 征量集合所得到的所述集合距離中,利用根據(jù)該集合距離的位次所設(shè)定的 表示對(duì)輸入數(shù)據(jù)的各類別的分類基準(zhǔn)的規(guī)則模式來(lái)檢測(cè)所述輸入數(shù)據(jù)屬于 哪一類別。
本發(fā)明優(yōu)選的聚類系統(tǒng),所述類別分類部利用所述集合距離的位次來(lái) 檢測(cè)所述輸入數(shù)據(jù)屬于哪一類別,檢測(cè)出該位次在前的集合距離較多的類 別作為所述輸入數(shù)據(jù)所屬的類別。
本發(fā)明優(yōu)選的聚類系統(tǒng),所述類別分類部具有對(duì)于位次在前的個(gè)數(shù)的 閾值,在前的類別在該閾值以上時(shí),檢測(cè)作為輸入數(shù)據(jù)所屬的類別。
本發(fā)明優(yōu)選的聚類系統(tǒng),所述距離計(jì)算部對(duì)所述集合距離乘以對(duì)應(yīng)于 特征量集合所設(shè)定的校正系數(shù),并將各特征量集合間的集合距離標(biāo)準(zhǔn)化。
本發(fā)明優(yōu)選的聚類系統(tǒng),還具有生成每個(gè)類別的特征量集合的特征量 集合生成部,所述特征量集合生成部對(duì)各特征量的多個(gè)組合的每個(gè)組合, 以各類別的群體的學(xué)習(xí)數(shù)據(jù)的平均值為原點(diǎn),求出該原點(diǎn)與其它類別的群 體的各學(xué)習(xí)數(shù)據(jù)之間的距離的平均值,選擇平均值最大的特征量的組合, 作為用于識(shí)別各類別與其它類別的特征量集合。
本發(fā)明的缺陷種類判定裝置,設(shè)置有上述記載的聚類系統(tǒng)中的任一個(gè), 所述輸入數(shù)據(jù)是產(chǎn)品缺陷的圖像數(shù)據(jù),利用表示缺陷的特征量,將圖像數(shù) 據(jù)中的缺陷按缺陷的種類來(lái)分類。
本發(fā)明優(yōu)選的缺陷種類判定裝置,所述產(chǎn)品是玻璃物品,將該玻璃物 品的缺陷按缺陷的種類來(lái)分類。
本發(fā)明的缺陷檢測(cè)裝置,設(shè)置有上述缺陷種類判定裝置來(lái)檢測(cè)產(chǎn)品缺 陷的種類。
7本發(fā)明的生產(chǎn)狀態(tài)判定裝置,設(shè)置有上述記載的缺陷種類判定裝置來(lái) 對(duì)產(chǎn)品的缺陷進(jìn)行分類,根據(jù)與對(duì)應(yīng)于該種類的發(fā)生原因的對(duì)應(yīng)來(lái)檢測(cè)生 產(chǎn)過程中的缺陷的發(fā)生原因。
本發(fā)明優(yōu)選的生產(chǎn)狀態(tài)判定裝置,設(shè)置有上述記載的聚類系統(tǒng)中的任 一個(gè),所述輸入數(shù)據(jù)是表示產(chǎn)品生產(chǎn)過程中的生產(chǎn)條件的特征量,將該特 征量按生產(chǎn)過程的各工序中的生產(chǎn)狀態(tài)來(lái)分類。
本發(fā)明優(yōu)選的生產(chǎn)狀態(tài)判定裝置,所述產(chǎn)品是玻璃物品,將該玻璃物 品的生產(chǎn)過程中的特征量按生產(chǎn)過程的各工序中的生產(chǎn)狀態(tài)來(lái)分類。
本發(fā)明的生產(chǎn)狀態(tài)檢測(cè)裝置,設(shè)置有上述記載的生產(chǎn)狀態(tài)判定裝置來(lái) 對(duì)產(chǎn)品生產(chǎn)過程的各工序中的生產(chǎn)狀態(tài)的種類進(jìn)行檢測(cè)。
本發(fā)明的生產(chǎn)狀態(tài)檢測(cè)裝置,設(shè)置有上述記載的生產(chǎn)狀態(tài)判定裝置來(lái) 對(duì)產(chǎn)品生產(chǎn)過程的各工序中的生產(chǎn)狀態(tài)的種類進(jìn)行檢測(cè),并根據(jù)對(duì)應(yīng)于該 種類的控制項(xiàng)目來(lái)進(jìn)行生產(chǎn)過程的工序中的過程控制。
如以上說明那樣,根據(jù)本發(fā)明,由于對(duì)每個(gè)分類目標(biāo)的類別,由分類 對(duì)象數(shù)據(jù)具有的多個(gè)特征量,預(yù)先設(shè)定與其它類別距離遠(yuǎn)的最佳的特征量 的組合,分別計(jì)算分類對(duì)象數(shù)據(jù)與各類別之間的距離,并將分類對(duì)象數(shù)據(jù) 分類成該計(jì)算得到的距離最小的類別,因此與現(xiàn)有的方法相比,能夠更準(zhǔn) 確地將分類對(duì)象數(shù)據(jù)分類成對(duì)應(yīng)的類別。
另外,根據(jù)本發(fā)明,由于對(duì)每個(gè)類別設(shè)定多個(gè)上述組合,將全部類別 與分類對(duì)象數(shù)據(jù)的距離的計(jì)算結(jié)果以從小到大的順序排列,并將分類對(duì)象 數(shù)據(jù)分類成預(yù)先設(shè)定的數(shù)的之前的組中包含的個(gè)數(shù)最多的類別,因此與以 往相比能夠進(jìn)行高精度的分類。
圖l是表示本發(fā)明的第l及第2實(shí)施方式的聚類系統(tǒng)的構(gòu)成例的方框圖。
圖2是說明對(duì)于根據(jù)判別基準(zhǔn)值X來(lái)選擇特征集合的處理的列表。 圖3是說明對(duì)于根據(jù)判別基準(zhǔn)值X來(lái)選擇特征集合的處理的列表。 圖4是說明對(duì)于根據(jù)判別基準(zhǔn)值X來(lái)選擇特征集合的效果的直方圖。圖5是表示第1實(shí)施方式的對(duì)各類別選擇特征量集合的處理中的動(dòng)作 例的流程圖。
圖6是表示第1實(shí)施方式的對(duì)分類對(duì)象數(shù)據(jù)的聚類處理中的動(dòng)作例的 流程圖。
圖7是表示第2實(shí)施方式中的生成聚類處理中使用的規(guī)則模式的列表 的動(dòng)作例的流程圖。
圖8是表示第2實(shí)施方式的對(duì)分類對(duì)象數(shù)據(jù)的聚類處理中的動(dòng)作例的
流程圖。
圖9是表示第2實(shí)施方式的對(duì)分類對(duì)象數(shù)據(jù)的其它聚類處理中的動(dòng)作 例的流程圖。
圖10是表示第3實(shí)施方式的對(duì)分類對(duì)象數(shù)據(jù)的聚類處理中的動(dòng)作例的 流程圖。
圖11是表示設(shè)定作為特征量的變換方法的運(yùn)算式的動(dòng)作例的流程圖。 圖12是表示算出圖11的流程圖中的評(píng)價(jià)值的動(dòng)作例的流程圖。 圖13是表示使用由所設(shè)定的變換方法變換后的特征量來(lái)算出距離的動(dòng) 作例的流程圖。
圖14是表示屬于各類別的學(xué)習(xí)數(shù)據(jù)的列表。
圖15是表示利用現(xiàn)有例的聚類方法將圖14的學(xué)習(xí)數(shù)據(jù)分類后的結(jié)果 的結(jié)果列表。
圖16是說明算出整體校正判定率的方法的概念圖。 圖17是表示利用第1實(shí)施方式中的聚類系統(tǒng)將圖14的學(xué)習(xí)數(shù)據(jù)分類 后的結(jié)果的結(jié)果列表。
圖18是表示利用第2實(shí)施方式中的聚類系統(tǒng)將圖14的學(xué)習(xí)數(shù)據(jù)分類
后的結(jié)果的結(jié)果列表。
圖19是表示利用第2實(shí)施方式中的聚類系統(tǒng)將圖14的學(xué)習(xí)數(shù)據(jù)分類
后的結(jié)果的結(jié)果列表。
圖20是表示使用了本發(fā)明的聚類系統(tǒng)的檢査裝置的構(gòu)成例的方框圖。 圖21是表示圖20的檢査裝置中的選擇特征量集合的動(dòng)作例的流程圖。 圖22是表示圖20的檢查裝置中的聚類處理的動(dòng)作例的流程圖。圖23是表示使用了本發(fā)明的聚類系統(tǒng)的缺陷種類判定裝置的構(gòu)成例的 方框圖。
圖24是表示使用了本發(fā)明的聚類系統(tǒng)的生產(chǎn)管理裝置的構(gòu)成例的方框圖。
圖25是表示使用了本發(fā)明的聚類系統(tǒng)的其它生產(chǎn)管理裝置的構(gòu)成例的
方框圖。 標(biāo)號(hào)說明
1…特征量集合生成部
2…特征量提取部
3…距離計(jì)算部
4…特征量集合存儲(chǔ)部
5…類別數(shù)據(jù)庫(kù)
100…被檢查物
101…圖像取得部
102…照明裝置
103…攝像裝置
104…缺陷候補(bǔ)檢測(cè)部
105…聚類部
200、 300…控制裝置
201、 202…圖像取得裝置 301、 302…生產(chǎn)裝置 303…通知部 304…存儲(chǔ)部
具體實(shí)施例方式
本發(fā)明的聚類系統(tǒng)涉及一種利用分類對(duì)象的輸入數(shù)據(jù)具有的特征量、 將該輸入數(shù)據(jù)分類成將學(xué)習(xí)數(shù)據(jù)作為群體而形成的各類別的聚類系統(tǒng),具 有與所述各類別相對(duì)應(yīng)、存儲(chǔ)有分類中使用的作為特征量組合的特征量集 合的特征量集合存儲(chǔ)部,特征量提取部根據(jù)預(yù)先設(shè)定的該特征量集合,從
10所述輸入數(shù)據(jù)中提取特征量,距離計(jì)算部對(duì)每個(gè)與各類別對(duì)應(yīng)的特征量集 合、根據(jù)該特征量集合中包含的特征量來(lái)分別計(jì)算與群體及所述輸入數(shù)據(jù) 的距離作為集合距離,位次提取部將各集合距離以從小到大的順序排列, 并對(duì)應(yīng)于排列順序進(jìn)行對(duì)類別的分類。 <第1實(shí)施方式>
下面,參照
本發(fā)明的第1實(shí)施方式的聚類系統(tǒng)。圖l是表示 該實(shí)施方式的聚類系統(tǒng)的構(gòu)成例的方框圖。
本實(shí)施方式的聚類系統(tǒng)如圖1所示,具有特征量集合生成部1、特征量
提取部2、距離計(jì)算部3、特征量集合存儲(chǔ)部4、及類別數(shù)據(jù)庫(kù)5。
特征量集合存儲(chǔ)部4中與各類別的識(shí)別信息相對(duì)應(yīng)、存儲(chǔ)對(duì)每個(gè)類別 分別設(shè)定的表示分類對(duì)象數(shù)據(jù)的特征量的組合的特征量集合。例如,在分 類對(duì)象數(shù)據(jù)為特征量的集合(a, b, c, d)時(shí),將各類別的特征量集合設(shè)定 作為[a, b]、 [a, b, c, d]、 [c]等種類的特征量的組合。在以下的說明中, 從所述特征量的集合中將所有特征量的組合、或多個(gè)(所述例中,集合中的 任意2個(gè)、3個(gè)特征量)的組合中的任一種定義為「特征量的組合」。
這里,在將類別A、 B及C設(shè)定作為分類目標(biāo)的類別時(shí),與各類別對(duì) 應(yīng)的特征量集合是使用預(yù)先分類成各類別的學(xué)習(xí)數(shù)據(jù)、作為各類別與其它 類別的距離最大的特征量的組合來(lái)求出,并存儲(chǔ)在特征量集合存儲(chǔ)部4。
例如,將對(duì)于類別A設(shè)定的特征量集合設(shè)定作為由屬于類別A的學(xué)習(xí) 數(shù)據(jù)的各特征量的平均值組成的矢量、和由屬于其它的類別B及類別C的 學(xué)習(xí)數(shù)據(jù)的各特征量的平均值組成的矢量的距離成為最大的特征量的組
合o
另外,分類對(duì)象數(shù)據(jù)和各類別中的群體的學(xué)習(xí)數(shù)據(jù)由同一特征量的集 合來(lái)構(gòu)成。
特征量提取部2在由輸入的分類對(duì)象數(shù)據(jù)計(jì)算與各類別的距離時(shí),從 特征量集合存儲(chǔ)部4中讀出與成為計(jì)算對(duì)象的類別對(duì)應(yīng)的特征量集合,并 從分類對(duì)象數(shù)據(jù)的多個(gè)特征量中提取與該特征量集合對(duì)應(yīng)的特征量,將提
取后的特征量輸出到距離計(jì)算部3。
距離計(jì)算部3將計(jì)算對(duì)象的類別的識(shí)別信息作為關(guān)鍵詞,從類別數(shù)據(jù)庫(kù)5中讀出由成為計(jì)算對(duì)象的類別的學(xué)習(xí)數(shù)據(jù)的各特征值的平均值組成的 矢量,根據(jù)該類別的特征量集合,算出由分類對(duì)象數(shù)據(jù)提取的特征量組成 的矢量、和由學(xué)習(xí)數(shù)據(jù)的各特征量的平均值組成的矢量(表示類別中的多個(gè) 學(xué)習(xí)數(shù)據(jù)的重心位置的重心矢量)的距離。
在進(jìn)行所述距離的計(jì)算時(shí),距離計(jì)算部3為了使特征量間的數(shù)據(jù)單位 無(wú)差異,而將特征量間的數(shù)據(jù)標(biāo)準(zhǔn)化,利用下面的式(l),對(duì)分類對(duì)象數(shù)據(jù) 中的每個(gè)特征量V(i)進(jìn)行歸一化。
V G) — (v (i) - avg. (i)) /std. (i) …(1)
這里,v(i)是特征量,avg.(i)是計(jì)算對(duì)象的類別內(nèi)的學(xué)習(xí)數(shù)據(jù)中的特征 量的平均值,std.(i)是計(jì)算對(duì)象的類別內(nèi)的學(xué)習(xí)數(shù)據(jù)中的特征量的標(biāo)準(zhǔn)偏差 (standardized deviation), V(i)是歸一化后的特征量。因而,計(jì)算距離時(shí),距 離計(jì)算部3需要對(duì)每個(gè)特征量集合進(jìn)行各特征量的歸一化。
另外,距離計(jì)算部3對(duì)用于分類對(duì)象數(shù)據(jù)中的距離計(jì)算的每個(gè)特征量, 使用學(xué)習(xí)數(shù)據(jù)分別對(duì)應(yīng)的特征量的平均值及標(biāo)準(zhǔn)偏差進(jìn)行所述歸一化處 理。
另外,作為距離,也可采用使用上述的標(biāo)準(zhǔn)化后的特征量的標(biāo)準(zhǔn)化歐 氏距離(standardized Euclidean distance)、馬氏距離、明氏距離(Minkowsky distance)等的任一個(gè)量。
這里,在使用馬氏距離時(shí),利用下面的式(2)求出馬氏平方距離 (Mahalanobis square distance)MHD。
MHD= (1/n) *(\%—V) …(2)
上述式(2)中的矩陣V中的各要素V(i)是對(duì)未知數(shù)據(jù)的多維的特征量 v(i)、利用該類別內(nèi)的學(xué)習(xí)數(shù)據(jù)的特征量的平均值avg.(i)和標(biāo)準(zhǔn)偏差std.(i) 由上述的式(l)求出的特征量。n是自由度,表示本實(shí)施方式的特征量集合(后 述)中的特征量的個(gè)數(shù)即特征量數(shù)。由此,馬氏平方距離是將n個(gè)變換后的 特征量的差分相加后的數(shù)值,利用(馬氏平方距離)/n,則群體平均的單位距 離變?yōu)?。另外,vT是以特征量v(i)為要素的矩陣V的轉(zhuǎn)置矩陣,R一是類 別內(nèi)的學(xué)習(xí)數(shù)據(jù)中的各特征量間的相關(guān)矩陣(correlation matrix)R的逆矩陣。
特征量集合生成部1對(duì)每個(gè)類別算出所述距離計(jì)算部3在計(jì)算分類對(duì)象數(shù)據(jù)和各類別之間的距離時(shí)使用的特征量集合,將算出結(jié)果對(duì)應(yīng)于各類 別的識(shí)別信息,寫入特征量集合存儲(chǔ)部4并存儲(chǔ)。
在算出特征量集合時(shí),特征量集合生成部1對(duì)每個(gè)類別,根據(jù)屬于生
成特征量集合的對(duì)象類別的學(xué)習(xí)數(shù)據(jù)的重心矢量(barycentricvector)、和屬 于該對(duì)象類別以外的其它所有類別的學(xué)習(xí)數(shù)據(jù)的重心矢量的距離,利用下 面的式(3)計(jì)算判別基準(zhǔn)(discriminantcriterion)的值人。下面,將特征量的組 合作為特征量集合進(jìn)行說明。
X = o> ,. (^ - ^〗(①cr tf 0> a ,》 …(3)
上述式(3)中,w是由「屬于對(duì)象類別的學(xué)習(xí)數(shù)據(jù)(類別內(nèi)群體)」的特征
量集合中的特征量的平均值組成的重心矢量。CTi是根據(jù)屬于該類別內(nèi)群體 的學(xué)習(xí)數(shù)據(jù)的特征量的矢量的標(biāo)準(zhǔn)偏差。COi是屬于類別內(nèi)群體的學(xué)習(xí)數(shù)據(jù)
對(duì)屬于所有類別的學(xué)習(xí)數(shù)據(jù)的個(gè)數(shù)的比例。另外,H。是由「屬于對(duì)象類別 以外的類別的學(xué)習(xí)數(shù)據(jù)(對(duì)象類別外群體)」的特征量集合中的特征量的平均
值組成的重心矢量。CJ。是根據(jù)屬于該對(duì)象類別外群體的學(xué)習(xí)數(shù)據(jù)的特征量
的矢量的標(biāo)準(zhǔn)偏差。co。是屬于所有類別的學(xué)習(xí)數(shù)據(jù)中的屬于類別外群體的 學(xué)習(xí)數(shù)據(jù)的個(gè)數(shù)的比例。這里,式(3)中的(^i。一)Lii)也可使用取log(對(duì)數(shù))及平 方根后的數(shù)值。另外,這里在計(jì)算各矢量時(shí),特征量集合生成部l利用式 (l)計(jì)算每個(gè)特征量歸一化后的特征量來(lái)使用。另外,也也可設(shè)定固有值作 為預(yù)先對(duì)比例叫及co。進(jìn)行運(yùn)算后的、相差較大的數(shù)值。
然后,特征量集合生成部l對(duì)每個(gè)對(duì)象類別使用上述式(3),對(duì)于構(gòu)成 學(xué)習(xí)數(shù)據(jù)的特征量的任一個(gè)或全部的組合,計(jì)算與其它類別的所述判別基 準(zhǔn)值X,并將計(jì)算后的判別基準(zhǔn)值X以從大到小的順序排列,輸出判別基準(zhǔn) 值X的順序表。
這里,特征值集合生成部l將與最大的判別基準(zhǔn)值人對(duì)應(yīng)的特征量的 組合作為對(duì)象類別的特征量集合,與判別基準(zhǔn)值人一起對(duì)應(yīng)于類別的識(shí)別 信息,存儲(chǔ)到特征量集合存儲(chǔ)部4。
上述的判別基準(zhǔn)值X的決定如圖2 (a)所示,當(dāng)特征量集合生成部l 進(jìn)行各類別的特征量集合的設(shè)定時(shí),在學(xué)習(xí)數(shù)據(jù)及分類對(duì)象數(shù)據(jù)的特征量 為a, b, c, d的4個(gè)量的情況下,計(jì)算該4個(gè)特征量的全部、多個(gè)、及任一個(gè)的全部組合中的所有判別基準(zhǔn)值X。
然后,特征量集合生成部1選擇最高的數(shù)值、例如圖2(a)中特征量b, C的組合。
另外,作為其它的判別基準(zhǔn)值X的方法,如圖2(b)所示的BSS法,即 對(duì)使用分類對(duì)象數(shù)據(jù)的集合中包含的全部n個(gè)特征量的判別基準(zhǔn)值人進(jìn)行 運(yùn)算,接著對(duì)從n個(gè)特征量的集合中取出n—l個(gè)的全部組合運(yùn)算判別基準(zhǔn) 值X。然后,從該n—l個(gè)的判別基準(zhǔn)值X中選擇最大值的組合,這次,對(duì) 從該n— 1個(gè)特征量中選擇的n — 2個(gè)的全部組合運(yùn)算判別基準(zhǔn)值X。這樣, 也可構(gòu)成特征量集合生成部1,使得依次地從集合中各減少1個(gè)特征量,從 減少后的特征量的集合中,選擇再減少1個(gè)后的組合并運(yùn)算判別基準(zhǔn)值X, 來(lái)選擇能夠以較少的特征量數(shù)進(jìn)行判別的組合。
另外,作為另一種判別基準(zhǔn)值X的方法,如圖2(c)所示的FSS法,即 從分類對(duì)象數(shù)據(jù)的集合中包含的n個(gè)特征量中1個(gè)個(gè)讀出特征量的全部種 類,運(yùn)算各特征量的判別基準(zhǔn)值人,從中選擇具有最大的判別基準(zhǔn)值的特征 量。接著,生成由該特征量和除它以外的特征量的2個(gè)特征量組成的組合, 計(jì)算對(duì)各自的組合的判別基準(zhǔn)值X。然后,從該組合中選擇具有最大的判別 基準(zhǔn)值的組合。接著,生成由該組合、和該組合中不包含的特征量的3個(gè) 特征量組成的組合,并生成各自的判別基準(zhǔn)值X。這樣,也可構(gòu)成特征量集 合生成部l,使得依次地從緊接之前的特征量的組合中選擇具有最大的判別 基準(zhǔn)值X的特征量,對(duì)組合的特征量的組合增加l個(gè)該組合中不存在的特 征量,計(jì)算增加后的組合的特征量的判別基準(zhǔn)值X,從該組合中選擇具有最 大的判別基準(zhǔn)值X的組合,對(duì)再增加l個(gè)該組合中不存在的特征量后的特 征量的組合的判別基準(zhǔn)值入進(jìn)行運(yùn)算,最終從計(jì)算判別基準(zhǔn)值^后的全部 的組合中,選擇判別基準(zhǔn)值X成為最大的組合作為特征量集合。
接著,利用圖3及圖4示出根據(jù)判別基準(zhǔn)值入、來(lái)選擇聚類中使用的特 征量集合的有效性。
圖3中說明從特征量a, b, c, d, e中提取特征量a及g的組合、特 征量a及h的組合、和特征量d及e的組合,作為選擇特征量集合的組合, 由這些組合在類別1、類別2及3中,特征量集合的選擇與現(xiàn)有例相比具有
14高分類特性。
圖3中,pl對(duì)應(yīng)于所述Hi, n2對(duì)應(yīng)于所述p。, al對(duì)應(yīng)于所述cji,
對(duì)應(yīng)于所述(T。, C0l對(duì)應(yīng)于所述C0i, C02對(duì)應(yīng)于所述O)。。
其中,在所述組合中,判別基準(zhǔn)值X的值最大的是特征量a及h的組 合,將該組合用于分離類別1和除它以外的類別,利用圖4確認(rèn)類別1和 除它以外的類別(類別2及3)的分類結(jié)果。
圖4中,橫軸表示使用特征量的組合來(lái)運(yùn)算后的馬氏距離取log的數(shù)值, 縱軸表示具有對(duì)應(yīng)的數(shù)值的分離對(duì)象數(shù)據(jù)的個(gè)數(shù)(直方圖)。這里,橫軸的數(shù) 值1.4表示馬氏距離取log的數(shù)值為1.4未滿且1.2以上(1.4的左側(cè)的數(shù)值)。 其它橫軸上的數(shù)值也是同樣的。另外,圖4中1.4《表示1.4以上。圖4的 馬氏距離是使用與類別1對(duì)應(yīng)的特征量集合、對(duì)屬于類別1及除它以外的 類別的分類對(duì)象數(shù)據(jù)分別計(jì)算得到的。
圖4(a)是使用特征量a及g的組合來(lái)運(yùn)算馬氏距離的例子,圖4(b)是使 用特征量a及h的組合來(lái)運(yùn)算馬氏距離的例子,圖4(c)是使用特征量d及e 的組合來(lái)運(yùn)算馬氏距離的例子。
觀察圖4中的直方圖可知,判別基準(zhǔn)值X的數(shù)值較大時(shí),可較好地進(jìn) 行類別1和其它類別的分類。
接著,參照?qǐng)D5及圖6,說明圖1的第1實(shí)施方式的聚類系統(tǒng)的動(dòng)作。 圖5是表示第1實(shí)施方式的聚類系統(tǒng)的特征量集合生成部1的動(dòng)作例的流 程圖,圖6是表示分類對(duì)象數(shù)據(jù)的聚類的動(dòng)作例的流程圖。
在以下的說明中,例如分類對(duì)象數(shù)據(jù)是玻璃物品帶有的傷痕的特征量 的集合時(shí),假設(shè)從圖像處理或測(cè)定結(jié)果得到「a:傷痕(scratch)的長(zhǎng)度」、
「b:傷痕的面積」、「C:傷痕的寬度」、「d:包含傷痕部分的預(yù)定區(qū)域 的透射率」、和「e:包含傷痕部分的預(yù)定區(qū)域的反射率」等作為該特征量。 因而,作為特征量的集合(以下稱為特征量集合)成為(a, b, c, d, e}。另 外,本實(shí)施方式中,將聚類中使用的距離作為使用標(biāo)準(zhǔn)化后的特征量的馬 氏距離來(lái)算出。這里,本實(shí)施方式中的上述玻璃物品作為一個(gè)例子,例如
為平板玻璃或顯示器用玻璃基板。
A.特征量集合生成處理(對(duì)應(yīng)圖5的流程圖)
15用戶檢測(cè)玻璃上帶有的傷痕,拍攝該圖像得到圖像數(shù)據(jù),并且利用圖 像處理從該圖像數(shù)據(jù)中對(duì)傷痕部分的長(zhǎng)度進(jìn)行測(cè)定等對(duì)特征量進(jìn)行提取, 采集由所述特征量的集合組成的特征量數(shù)據(jù)。然后,用戶對(duì)于傷痕的產(chǎn)生 原因或形狀等想要進(jìn)行分類的各類別,根據(jù)預(yù)先判定的產(chǎn)生原因或形狀等 信息,將特征量數(shù)據(jù)作為學(xué)習(xí)數(shù)據(jù)進(jìn)行分配,作為各類別的學(xué)習(xí)數(shù)據(jù)的群 體,從未圖示的處理終端對(duì)應(yīng)于類別的識(shí)別信息,存儲(chǔ)到類別數(shù)據(jù)庫(kù)5(步 驟Sl)。
接著,從所述處理終端輸入生成對(duì)于各類別的特征量集合的控制命令 時(shí),特征量集合生成部1從類別數(shù)據(jù)庫(kù)5對(duì)應(yīng)于各類別的識(shí)別信息,讀入 學(xué)習(xí)數(shù)據(jù)的群體。
然后,特征量集合生成部1對(duì)每個(gè)類別算出類別內(nèi)群體中的各特征量 的平均值及標(biāo)準(zhǔn)偏差,使用該平均值及標(biāo)準(zhǔn)偏差,由式(l)算出各學(xué)習(xí)數(shù)據(jù) 中的標(biāo)準(zhǔn)化后的特征量。
接著,特征量集合生成部l對(duì)特征量集合中包含的特征量的全部組合 的每個(gè)特征量集合,利用式(3)算出判別基準(zhǔn)值X。
此時(shí),特征量集合生成部l對(duì)每個(gè)類別,使用類別內(nèi)群體的標(biāo)準(zhǔn)化后 的特征量,算出由與各特征量集合對(duì)應(yīng)的特征量組成的矢量的平均值(重 心矢量)A;和由與類別內(nèi)群體中的特征量集合對(duì)應(yīng)的特征量組成的學(xué)習(xí)數(shù) 據(jù)的矢量的標(biāo)準(zhǔn)偏差Oi,及使用類別外群體的標(biāo)準(zhǔn)化后的特征量,算出
由與各特征量集合對(duì)應(yīng)的特征量組成的矢量的平均值(重心矢量)li。;由與
類別外群體中的特征量集合對(duì)應(yīng)的特征量組成的學(xué)習(xí)數(shù)據(jù)的矢量的標(biāo)準(zhǔn)偏
差CJ。;全部學(xué)習(xí)數(shù)據(jù)個(gè)數(shù)中的類別內(nèi)群體的學(xué)習(xí)數(shù)據(jù)個(gè)數(shù)的比例COi;和全
部學(xué)習(xí)數(shù)據(jù)個(gè)數(shù)中的類別外群體的學(xué)習(xí)數(shù)據(jù)個(gè)數(shù)的比例co。。
然后,特征量集合生成部1使用所述重心矢量A、 p。;標(biāo)準(zhǔn)偏差CJi、 (J。; 和比例coj、 co。,利用式(3)對(duì)每個(gè)類別,對(duì)于特征量集合的全部組合的特征
量集合,算出對(duì)每個(gè)類別判別和其它類別的距離的判別基準(zhǔn)值x。
所有的判別基準(zhǔn)值X的計(jì)算結(jié)束時(shí),特征量集合生成部1對(duì)每個(gè)類別
將判別基準(zhǔn)值x以從大到小的順序排列,檢測(cè)出與最大判別基準(zhǔn)值x對(duì)應(yīng) 的特征量集合,作為判定對(duì)各類別的所屬時(shí)、表示距離計(jì)算中使用的特征接著,特征量集合生成部1為了在距離計(jì)算部3的距離計(jì)算中使用, 算出與各特征量集合對(duì)應(yīng)的特征量間的相關(guān)系數(shù)R;和各類別內(nèi)群體中
的學(xué)習(xí)數(shù)據(jù)的特征量的平均值avg.(i)及標(biāo)準(zhǔn)偏差std.(i)(步驟S3)。
接著,特征量集合生成部1從所述判別基準(zhǔn)值^算出校正系數(shù)^一(1/2)。 該校正系數(shù) ^(1/2)是取得各特征量集合間的標(biāo)準(zhǔn)化的系數(shù)。由于根據(jù)類別不 同,與其它類別之間的距離會(huì)有偏差,因此為提高分類精度,需要進(jìn)行特
征量集合間的標(biāo)準(zhǔn)化。另外,作為校正系數(shù)也可不是^一(1/2),而是log(人),
或單純地使用0i。一m),只要是包含x的函數(shù)且能進(jìn)行特征量集合間的標(biāo)準(zhǔn)
化即可。
另外,在上述式(3)中,算出對(duì)象類別外群體的特征量集合中的重心矢
量p。時(shí),作為對(duì)象類別外群體中的學(xué)習(xí)數(shù)據(jù),是選擇以下的三種的任一種 來(lái)算出。
a. 全部學(xué)習(xí)數(shù)據(jù)中的對(duì)象類別外群體的全部學(xué)習(xí)數(shù)據(jù)
b. 上述對(duì)象類別外群體中的與分類的目的對(duì)應(yīng)的特定的學(xué)習(xí)數(shù)據(jù)
c. 特征量的選擇中使用的學(xué)習(xí)數(shù)據(jù)中的對(duì)象類別外群體的學(xué)習(xí)數(shù)據(jù) 這里,b.的分類的目的是在于與關(guān)注的類別明確地附予不同來(lái)區(qū)別,作
為學(xué)習(xí)數(shù)據(jù)是使用想附予不同的其它類別中包含的學(xué)習(xí)數(shù)據(jù)。
然后,特征量集合生成部1對(duì)應(yīng)于各類別的每個(gè)識(shí)別信息,將特征量
集合;與特征量集合對(duì)應(yīng)的校正系數(shù)、本實(shí)施方式中為X—(1/2)的值;逆矩陣
R一、平均值avg.(i);標(biāo)準(zhǔn)偏差std.(i),作為距離計(jì)算數(shù)據(jù)存儲(chǔ)到特征量集
合存儲(chǔ)部4(步驟S4)。
B.聚類處理(對(duì)應(yīng)圖6的流程圖)
分類對(duì)象數(shù)據(jù)被輸入時(shí),特征量提取部2利用各類別的識(shí)別信號(hào),從 特征量集合存儲(chǔ)部4中讀出與每個(gè)類別對(duì)應(yīng)的特征量集合。
然后,特征量提取部2對(duì)應(yīng)于讀出的特征量集合中的特征量的種類, 從分類對(duì)象數(shù)據(jù)中對(duì)每個(gè)類別提取特征量,并分別對(duì)應(yīng)于類別的識(shí)別信息, 將提取的特征量存儲(chǔ)到內(nèi)部存儲(chǔ)部(步驟Sll)。
接著,距離計(jì)算部3從特征量集合存儲(chǔ)部4讀出與從分類對(duì)象數(shù)據(jù)中提取的各特征量對(duì)應(yīng)的平均值avg.(i)和標(biāo)準(zhǔn)偏差std.(i),通過進(jìn)行所述式(2)
的運(yùn)算將各特征量歸一化,并將存儲(chǔ)在內(nèi)部存儲(chǔ)部的特征量替換成標(biāo)準(zhǔn)化 后的特征量。
然后,距離計(jì)算部3生成由上述那樣得到的V(i)的要素組成的矩陣V, 計(jì)算該矩陣V的轉(zhuǎn)置矩陣VT,利用式(3),依次地計(jì)算分類對(duì)象數(shù)據(jù)和各類 別之間的馬氏距離,并對(duì)應(yīng)于各類別的識(shí)別信息,存儲(chǔ)到內(nèi)部存儲(chǔ)部(步驟
512) 。
接著,距離計(jì)算部3對(duì)于計(jì)算結(jié)果的所述馬氏距離,乘以與特征量集 合對(duì)應(yīng)的校正系數(shù) 1一(1/2),求出校正距離,并分別與馬氏距離替換(步驟
513) 。另夕卜,乘以校正系數(shù)時(shí),也可在計(jì)算馬氏距離的log或平方根后相乘。 然后,距離計(jì)算部3比較內(nèi)部存儲(chǔ)部中的與各類別間的校正距離(步驟
514) ,檢測(cè)最小的校正距離,將與該校正距離對(duì)應(yīng)的識(shí)別信息的類別作為 分類對(duì)象數(shù)據(jù)所屬的類別,對(duì)應(yīng)于分類目標(biāo)的類別的識(shí)別信息,對(duì)類別數(shù) 據(jù)庫(kù)5,存儲(chǔ)分類后的分類對(duì)象數(shù)據(jù)(步驟S15)。
<第2實(shí)施方式〉
上述的第1實(shí)施方式說明了將進(jìn)行聚類時(shí)使用的特征量集合對(duì)每個(gè)類 別作為l種的情況,而也可如下面說明的第2實(shí)施方式那樣,對(duì)每個(gè)類別 設(shè)定多個(gè)特征量集合,運(yùn)算與各自的特征量集合對(duì)應(yīng)的馬氏距離,算出校 正距離,將該校正距離以從小到大的順序重新排列,利用在前的預(yù)定的位 次以內(nèi)的校正距離,根據(jù)預(yù)先設(shè)定的規(guī)則,來(lái)設(shè)定分類對(duì)象數(shù)據(jù)所屬的類 別。
艮P,本實(shí)施方式中的距離計(jì)算部3在對(duì)每個(gè)特征量集合得到的分類對(duì) 象數(shù)據(jù)和各類別的距離中,利用根據(jù)該距離的位次而設(shè)定的表示分類對(duì)象 數(shù)據(jù)對(duì)各類別的分類基準(zhǔn)的規(guī)則模式,來(lái)檢測(cè)分類對(duì)象數(shù)據(jù)是屬于哪一個(gè) 類別。
以下,第2實(shí)施方式的構(gòu)成與圖l所示的第1實(shí)施方式相同,對(duì)各構(gòu) 成附注同一標(biāo)號(hào),只對(duì)各構(gòu)成中與第1實(shí)施方式不同的動(dòng)作使用圖7進(jìn)行 說明。在第2實(shí)施方式中,具有由學(xué)習(xí)數(shù)據(jù)設(shè)定上述規(guī)則模式的處理。圖7 是表示設(shè)定規(guī)則模式的對(duì)距離的位次的模式學(xué)習(xí)的動(dòng)作例的流程圖。圖8及圖9是表示第2實(shí)施方式中的聚類的動(dòng)作例的流程圖。
另外,第l實(shí)施方式中,生成特征量集合時(shí),特征量集合生成部l對(duì) 每個(gè)類別,對(duì)于作為特征量的組合的多個(gè)特征量集合算出判別基準(zhǔn)值X,設(shè) 定與多個(gè)求出的判別基準(zhǔn)值X的最大值對(duì)應(yīng)的特征量集合,作為各類別的 特征量集合。
另一方面,第2實(shí)施方式中,特征量集合生成部1對(duì)每個(gè)類別,對(duì)于 其它類別的l個(gè)或多個(gè)的組合或者其它全部類別,分別設(shè)定與特征量的組 合數(shù)對(duì)應(yīng)的特征量集合的最大值,通過這樣求出多個(gè)判別基準(zhǔn)值X,對(duì)每個(gè) 類別設(shè)定用于與其它類別分離的多個(gè)特征量集合。
然后,特征量集合生成部1對(duì)每個(gè)特征量集合求出距離計(jì)算數(shù)據(jù),對(duì) 應(yīng)于類別的識(shí)別信息,將多個(gè)特征量集合、和各特征量集合的距離計(jì)算數(shù)
據(jù)存儲(chǔ)到特征量集合存儲(chǔ)部4。
然后,在圖7中,學(xué)習(xí)數(shù)據(jù)被輸入時(shí),特征量提取部2利用各類別的 識(shí)別信號(hào),從特征量集合存儲(chǔ)部4中讀出與每個(gè)類別對(duì)應(yīng)的多個(gè)特征量集合。
然后,特征量提取部2對(duì)應(yīng)于讀出的各特征量集合中的特征量的種類, 從學(xué)習(xí)數(shù)據(jù)中對(duì)每個(gè)類別提取特征量,并分別對(duì)應(yīng)于類別的識(shí)別信息,將 提取的特征量對(duì)每個(gè)特征量集合存儲(chǔ)到內(nèi)部存儲(chǔ)部(步驟S21)。
接著,距離計(jì)算部3從特征量集合存儲(chǔ)部4對(duì)每個(gè)特征量集合讀出與 從學(xué)習(xí)數(shù)據(jù)中提取的各特征量對(duì)應(yīng)的平均值avg.(i)和標(biāo)準(zhǔn)偏差std.(i),通過 進(jìn)行所述式(2)的運(yùn)算將各特征量歸一化,并將存儲(chǔ)在內(nèi)部存儲(chǔ)部的特征量 替換成標(biāo)準(zhǔn)化后的特征量。
然后,距離計(jì)算部3生成由上述那樣得到的V(i)的要素組成的矩陣V, 計(jì)算該矩陣V的轉(zhuǎn)置矩陣VT,利用式(3),依次地計(jì)算學(xué)習(xí)數(shù)據(jù)和各類別之 間的馬氏距離,并對(duì)應(yīng)于各類別的識(shí)別信息,對(duì)每個(gè)特征量集合存儲(chǔ)到內(nèi) 部存儲(chǔ)部(步驟S22)。
接著,距離計(jì)算部3對(duì)于計(jì)算結(jié)果的所述馬氏距離,乘以與特征量集 合對(duì)應(yīng)的校正系數(shù)人一(1/2),求出校正距離,并分別與馬氏距離替換(步驟 S23)。
19然后,距離計(jì)算部3將內(nèi)部存儲(chǔ)部中的與各類別間的校正距離以從小 到大的順序重新排列(重新排列成將越小的校正距離排在越前面的位次),即 以與分類對(duì)象數(shù)據(jù)的校正距離小的類別的識(shí)別信息在前的順序進(jìn)行排列 (步驟S24)。
接著,距離計(jì)算部3檢測(cè)出與從小的一方(前面)開始到第n位的各校正 距離對(duì)應(yīng)的類別的識(shí)別信息,并對(duì)該n個(gè)中包含的每個(gè)類別的識(shí)別信息的 個(gè)數(shù)進(jìn)行計(jì)數(shù),即對(duì)各類別進(jìn)行投票處理。
然后,距離計(jì)算部3檢測(cè)出各學(xué)習(xí)數(shù)據(jù)的各類別的識(shí)別信息的計(jì)數(shù)的 模式、與同一類別中包含的學(xué)習(xí)數(shù)據(jù)共同的規(guī)則模式。
例如,設(shè)n為10時(shí),在類別B的學(xué)習(xí)數(shù)據(jù)的情況下,若檢測(cè)出類別A 為5個(gè)、類別B為3個(gè)、類別C為2個(gè)的計(jì)數(shù)的模式,則將此作為規(guī)則Rl。
另外,在類別C的學(xué)習(xí)數(shù)據(jù)的情況下,若檢測(cè)出3個(gè)類別C,則即使 類別A為7個(gè),類別B為O個(gè),也一定是類別C,若這樣的情況是共同的 話,則如果類別C的計(jì)數(shù)為3以上,那么與其它類別的計(jì)數(shù)無(wú)關(guān)取類別C, 將此作為規(guī)則R2。
另外,在類別A的學(xué)習(xí)數(shù)據(jù)的情況下,在類別A占據(jù)前面第l位及第 2位的排列的模式時(shí),即使類別B的計(jì)數(shù)為8個(gè),也與其它類別的計(jì)數(shù)無(wú) 關(guān)取類別A,將此作為規(guī)則R3。
如上所述,檢測(cè)出分類成同一類別的各學(xué)習(xí)數(shù)據(jù)具有的各類別的計(jì)數(shù) 的規(guī)則性,對(duì)每個(gè)類別的識(shí)別信息作為模式列表預(yù)先存儲(chǔ)在內(nèi)部。這里, 可對(duì)各類別設(shè)定l個(gè)規(guī)則,也可設(shè)定多個(gè)。另外,在上述的說明中,是假 設(shè)距離計(jì)算部3提取規(guī)則模式,但用戶也可為了改變對(duì)各類別的分類精度, 任意地設(shè)定計(jì)數(shù)或排列的規(guī)則模式。
根據(jù)類別不同,有時(shí)也會(huì)與其它類別在特征信息的特性上相似,也會(huì) 存在由作為多個(gè)類別的相關(guān)性、即各類別的計(jì)數(shù)或前面位次的排列的模式 的對(duì)象模式來(lái)進(jìn)行分類對(duì)象數(shù)據(jù)的分類而使精度較高的情況,本實(shí)施方式 對(duì)這一點(diǎn)進(jìn)行補(bǔ)充。
接著,使用圖8的流程圖對(duì)使用上述的列表中記錄的規(guī)則的第2實(shí)施 方式的聚類處理進(jìn)行說明。分類對(duì)象數(shù)據(jù)被輸入時(shí),特征量提取部2利用各類別的識(shí)別信號(hào),從 特征量集合存儲(chǔ)部4中讀出與每個(gè)類別對(duì)應(yīng)的多個(gè)特征量集合。
然后,特征量提取部2對(duì)應(yīng)于讀出的各特征量集合中的特征量的種類, 從分類對(duì)象數(shù)據(jù)中對(duì)每個(gè)類別提取特征量,并分別對(duì)應(yīng)于類別的識(shí)別信息, 將提取的特征量對(duì)每個(gè)特征量集合存儲(chǔ)到內(nèi)部存儲(chǔ)部(步驟S31)。
接著,距離計(jì)算部3從特征量集合存儲(chǔ)部4讀出與從分類對(duì)象數(shù)據(jù)中 提取的各特征量對(duì)應(yīng)的平均值avg.(i)和標(biāo)準(zhǔn)偏差std.(i),通過進(jìn)行所述式(2)
的運(yùn)算將各特征量歸一化,并將存儲(chǔ)在內(nèi)部存儲(chǔ)部的特征量替換成標(biāo)準(zhǔn)化 后的特征量。
然后,距離計(jì)算部3生成由上述那樣得到的V(i)的要素組成的矩陣V, 計(jì)算該矩陣V的轉(zhuǎn)置矩陣VT,利用式(3),依次地計(jì)算分類對(duì)象數(shù)據(jù)和各類 別之間的馬氏距離,對(duì)應(yīng)于各類別的識(shí)別信息,對(duì)每個(gè)特征量集合存儲(chǔ)到 內(nèi)部存儲(chǔ)部(步驟S32)。
接著,距離計(jì)算部3對(duì)于計(jì)算結(jié)果的所述馬氏距離,乘以與特征量集 合對(duì)應(yīng)的校正系數(shù)^一(|/2),求出校正距離,并分別與馬氏距離替換(步驟 S33)。
然后,距離計(jì)算部3將內(nèi)部存儲(chǔ)部中的與各類別間的校正距離以從小 到大的順序重新排列,即以與分類對(duì)象數(shù)據(jù)的校正距離小的類別的識(shí)別信 息在前的順序進(jìn)行排列(步驟S34)。
重新排列后,距離計(jì)算部3檢測(cè)出與從小的一方(前面)開始到第n位的 各校正距離對(duì)應(yīng)的類別的識(shí)別信息,并對(duì)該n個(gè)中包含的每個(gè)類別的識(shí)別 信息的個(gè)數(shù)進(jìn)行計(jì)數(shù),即對(duì)各類別進(jìn)行投票處理。
接著,距離計(jì)算部3進(jìn)行對(duì)各分類對(duì)象數(shù)據(jù)的前面n個(gè)中的各類別的 計(jì)數(shù)的模式(或排列的模式)、是否存在于存儲(chǔ)在內(nèi)部的列表中的對(duì)照處理 (步驟S35)。
然后,若距離計(jì)算部3檢測(cè)出上述的對(duì)照結(jié)果為與分類對(duì)象數(shù)據(jù)的對(duì) 象模式相符的規(guī)則模式在列表中有記錄時(shí),則判定該分類對(duì)象數(shù)據(jù)屬于與 該相符的規(guī)則對(duì)應(yīng)的識(shí)別信息的類別,將分類對(duì)象數(shù)據(jù)分類成該類別(步驟 S36)。另外,使用圖9的流程圖對(duì)使用上述的列表中記錄的規(guī)則的第2實(shí)施 方式的其它聚類處理進(jìn)行說明。
該圖9所示的其它聚類處理中,步驟S31 步驟S35為止的處理與圖8 所示的處理相同,距離計(jì)算部3在步驟35中如已敘述那樣,根據(jù)列表中存 儲(chǔ)的規(guī)則模式,進(jìn)行與分類對(duì)象數(shù)據(jù)的對(duì)象模式的對(duì)照處理。
然后,距離計(jì)算部3檢測(cè)在上述對(duì)照結(jié)果中、是否檢索到與上述對(duì)象 模式相符的規(guī)則模式,在檢測(cè)出已檢索到相符的規(guī)則模式時(shí),將處理轉(zhuǎn)移 到步驟S47,另一方面,在檢測(cè)出未檢索到相符的規(guī)則模式時(shí),將處理轉(zhuǎn)移 到步驟S48(步驟S46)。
在檢測(cè)出已檢索到相符的規(guī)則模式時(shí),距離計(jì)算部3判定該分類對(duì)象 數(shù)據(jù)屬于與該相符的規(guī)則對(duì)應(yīng)的識(shí)別信息的類別,將分類對(duì)象數(shù)據(jù)分類成 該類別,對(duì)應(yīng)于分類目標(biāo)的類別的識(shí)別信息,對(duì)類別數(shù)據(jù)庫(kù)5,存儲(chǔ)己分類 的分類對(duì)象數(shù)據(jù)(步驟S47)。
另一方面,在檢測(cè)出未檢索到相符的規(guī)則模式時(shí),距離計(jì)算部3檢測(cè) 計(jì)數(shù)、即投票數(shù)最多的識(shí)別信息,將分類對(duì)象數(shù)據(jù)分類成與該識(shí)別信息對(duì) 應(yīng)的類別。
然后,距離計(jì)算部3對(duì)應(yīng)于歸屬目標(biāo)的類別的識(shí)別信息,對(duì)類別數(shù)據(jù) 庫(kù)5,存儲(chǔ)已分類的分類對(duì)象數(shù)據(jù)(步驟S48)。 <第3實(shí)施方式>
上述的第2實(shí)施方式說明了準(zhǔn)備有計(jì)算后的分類對(duì)象數(shù)據(jù)和各類別 的距離在從小的一方(相似性大)開始前面n個(gè)中的規(guī)則模式的列表,利用與 該列表中的規(guī)則模式是否對(duì)應(yīng),來(lái)進(jìn)行各分類對(duì)象數(shù)據(jù)的聚類處理,但也 可如以下說明的第3實(shí)施方式那樣,對(duì)每個(gè)類別設(shè)定多個(gè)特征量集合,對(duì) 與各自的特征量集合對(duì)應(yīng)的馬氏距離進(jìn)行運(yùn)算,算出校正距離,將在前的 預(yù)定的位次以內(nèi)的校正距離多的類別作為分類對(duì)象數(shù)據(jù)所屬的類別。
以下,第3實(shí)施方式的構(gòu)成與圖1所示的第1及第2實(shí)施方式相同, 對(duì)各構(gòu)成附注同一標(biāo)號(hào),只對(duì)各構(gòu)成中與第2實(shí)施方式不同的動(dòng)作使用圖 IO進(jìn)行說明。第3實(shí)施方式中,沒有由學(xué)習(xí)數(shù)據(jù)設(shè)定上述規(guī)則的處理,而 直接進(jìn)行圖9中的步驟S48。圖10是表示第3實(shí)施方式中的聚類的動(dòng)作例的流程圖。
該圖IO所示的其它聚類處理中,步驟S31 步驟S34為止的處理與圖 8所示的處理相同,距離計(jì)算部3如已敘述那樣,在步驟34中,將內(nèi)部存 儲(chǔ)部中的與各類別間的校正距離以從小到大的順序重新排列,即以與分類 對(duì)象數(shù)據(jù)的校正距離小的類別的識(shí)別信息在前的順序進(jìn)行排列(步驟S34)。
接著,距離計(jì)算部3檢測(cè)出與從小的一方(前面)開始到第n位的各校正 距離對(duì)應(yīng)的類別的識(shí)別信息,并對(duì)該n個(gè)中包含的每個(gè)類別的識(shí)別信息的 個(gè)數(shù)進(jìn)行計(jì)數(shù),即對(duì)各類別進(jìn)行投票處理(步驟S55)。
然后,距離計(jì)算部3檢測(cè)出投票結(jié)果中、最大計(jì)數(shù)值(投票數(shù))的識(shí)別信 息,將與該識(shí)別信息對(duì)應(yīng)的類別作為分類對(duì)象數(shù)據(jù)所屬的類別,對(duì)應(yīng)于歸 屬目標(biāo)的類別的識(shí)別信息,對(duì)類別數(shù)據(jù)庫(kù)5,存儲(chǔ)已分類的分類對(duì)象數(shù)據(jù)(步 驟S56)。
另外,用戶也可在距離計(jì)算部3中對(duì)每個(gè)識(shí)別信息預(yù)先設(shè)定用于停止 的投票數(shù)的閾值,投票數(shù)最多的識(shí)別信息的投票數(shù)未達(dá)到該閾值時(shí),進(jìn)行 不屬于任何類別的處理。
例如,在對(duì)類別A, B, C的3個(gè)類別將分類對(duì)象數(shù)據(jù)進(jìn)行分類時(shí),對(duì) 類別A的識(shí)別信息的投票數(shù)為5個(gè),對(duì)類別B的識(shí)別信息的投票數(shù)為3個(gè), 對(duì)類別C的識(shí)別信息的投票數(shù)為2個(gè),在這種情況下,距離計(jì)算部3檢測(cè)
出投票數(shù)最多的識(shí)別信息為類別A。
但是,將對(duì)類別A的上述閾值設(shè)定作為6個(gè)時(shí),由于對(duì)類別A的識(shí)別 信息的投票數(shù)未達(dá)到閾值,因此距離計(jì)算部3進(jìn)行不屬于任何類別的判定。
由此,在對(duì)于特征量與其它類別只有很小差別的類別的聚類中,能提 高分類對(duì)象數(shù)據(jù)的對(duì)類別的分類處理的可靠性。
<特征量的變換方法>
雖然期望各特征量的群體為正態(tài)分布來(lái)進(jìn)行聚類,但考慮到根據(jù)特征 量的種類(面積、長(zhǎng)度等)不同,有時(shí)不是正態(tài)分布,而是群體具有偏態(tài)分布, 此時(shí)分類對(duì)象數(shù)據(jù)和各類別之間的距離的計(jì)算、即判定分類對(duì)象數(shù)據(jù)和各 類別的相似性時(shí)的精度降低。
因此,根據(jù)特征量不同,需要利用預(yù)定方法變換群體的特征量,使其
23接近正態(tài)分布以提髙相似性判定的精度。
作為向該正態(tài)分布變換的變換方法,利用包含l0g、或平方根(7")、立 方根(3^)等11次方根、或階乘、或由數(shù)值計(jì)算求出的函數(shù)的任一個(gè)運(yùn)算式 來(lái)變換特征量。
下面,使用圖11說明各特征量的變換方法的設(shè)定處理。圖ll是表示 各特征量的變換方法的設(shè)定處理的動(dòng)作例的流程圖。此外,該變換方法對(duì) 每個(gè)類別用類別中包含的各特征量單位來(lái)設(shè)定。另外,該變換方法的設(shè)定 使用屬于各類別的學(xué)習(xí)數(shù)據(jù)來(lái)進(jìn)行。雖然以下的處理是作為由特征量集合 生成部1進(jìn)行來(lái)說明,但也可將與該處理對(duì)應(yīng)的處理部設(shè)置在他處。
特征量集合生成部1將分類對(duì)象的類別的識(shí)別信息作為關(guān)鍵詞,從類
別數(shù)據(jù)庫(kù)5中讀出該類別中包含的學(xué)習(xí)數(shù)據(jù),并算出各學(xué)習(xí)數(shù)據(jù)的特征量 (歸一化處理)(步驟61)。
接著,特征量集合生成部1使用存儲(chǔ)在內(nèi)部的進(jìn)行特征量變換的任一 種運(yùn)算式,通過對(duì)讀出的上述各學(xué)習(xí)數(shù)據(jù)進(jìn)行運(yùn)算,進(jìn)行特征量的變換(步
驟S62)。
全部的學(xué)習(xí)數(shù)據(jù)的特征量變換結(jié)束時(shí),特征量集合生成部1算出表示 由變換處理得到的分布是否接近正態(tài)分布的評(píng)價(jià)值(步驟S63)。
接著,特征量集合生成部l進(jìn)行是否已對(duì)存儲(chǔ)在內(nèi)部的、即作為變換 方法預(yù)先設(shè)定的全部運(yùn)算式算出評(píng)價(jià)值的檢測(cè),當(dāng)檢測(cè)到已算出由全部運(yùn) 算式將特征量變換后得到的分布的評(píng)價(jià)值時(shí),使處理進(jìn)入到S65,另一方面, 當(dāng)檢測(cè)到利用全部運(yùn)算式的特征量的算出尚未結(jié)束時(shí),為進(jìn)行下一設(shè)定的 運(yùn)算式的處理,使處理返回到步驟S62(步驟S64)。
利用全部運(yùn)算式的特征量的變換結(jié)束時(shí),特征量集合生成部l檢測(cè)出 由已設(shè)定的運(yùn)算式得到的分布中評(píng)價(jià)值最小的分布、即最接近于正態(tài)分布 的分布,將為生成檢測(cè)出的分布而使用的運(yùn)算式?jīng)Q定作為變換方法,并作 為該類別的特征量的變換方法在內(nèi)部設(shè)定(步驟S65)。
特征量集合生成部1對(duì)各類別的每個(gè)特征量進(jìn)行上述的處理,對(duì)應(yīng)于 各自的類別中的各特征量設(shè)定變換方法。
接著,用圖12說明上述步驟S63中的評(píng)價(jià)值的計(jì)算。圖12是說明求
24出利用運(yùn)算式得到的分布的評(píng)價(jià)值的處理的動(dòng)作例的流程圖。
特征量集合生成部1利用設(shè)定的運(yùn)算式來(lái)變換屬于對(duì)象類別的各學(xué)習(xí)
數(shù)據(jù)的特征量(步驟S71)。
將全部的學(xué)習(xí)數(shù)據(jù)的特征量變換后,特征量集合生成部1算出由該變
換后的特征量得到的分布(群體)的平均值p及標(biāo)準(zhǔn)偏差O(步驟S72)。
然后,特征量集合生成部l使用上述群體的平均值p和標(biāo)準(zhǔn)偏差CT,
利用(x—n)/o算出z值(l)(步驟S73)。
接著,特征量集合生成部1算出上述群體中的累積概率(步驟S74)。
算出后,特征量集合生成部l利用求出的群體中的累積概率,算出z值(2)作為標(biāo)準(zhǔn)正態(tài)分布的累積分布函數(shù)的逆函數(shù)的值(步驟S75)。
然后,特征量集合生成部l求出特征量的分布的2個(gè)z值、即z值(l)和z值(2)之差,即分布中的2個(gè)z值的誤差(步驟S76)。
求出z值的誤差時(shí),特征量集合生成部1算出上述2個(gè)z值的誤差之和、即該誤差的總和(平方和)作為評(píng)價(jià)值(步驟S77)。
上述的2個(gè)z值的誤差越小,分布越接近于正態(tài)分布,若沒有z值的誤差,則為正態(tài)分布,另一方面,分布離正態(tài)分布越遠(yuǎn),則誤差變得越大。
接著,使用圖13對(duì)進(jìn)行第1 第3的實(shí)施方式中的聚類處理之前、分類對(duì)象數(shù)據(jù)的特征量的算出進(jìn)行說明。圖13是表示分類對(duì)象數(shù)據(jù)的特征量數(shù)據(jù)的算出的動(dòng)作例的流程圖。
距離計(jì)算部3對(duì)應(yīng)于對(duì)各類別設(shè)定的特征量集合,從輸入的分類對(duì)象數(shù)據(jù)中提取識(shí)別對(duì)象的特征量,進(jìn)行已說明的歸一化處理(步驟S81)。
接著,距離計(jì)算部3利用對(duì)于該類別的特征量設(shè)定的變換方法(運(yùn)算式),將分類對(duì)象數(shù)據(jù)中的對(duì)分類對(duì)象的類別的分類中使用的特征量進(jìn)行變換(步驟S82)。
然后,距離計(jì)算部3如第1 第3實(shí)施方式所述那樣,算出和分類對(duì)象的類別的距離(步驟S83)。
接著,距離計(jì)算部3利用對(duì)應(yīng)于各類別的特征量設(shè)定的變換方法,對(duì)分類對(duì)象的全部類別將特征量進(jìn)行變換,并進(jìn)行是否已利用該變換后的特征量計(jì)算出與類別的距離,當(dāng)檢測(cè)到已對(duì)分類對(duì)象的全部類別求出距離時(shí),使處理進(jìn)入到步驟S85,另一方面,當(dāng)檢測(cè)到剩余有分類對(duì)象的類別時(shí),使
處理返回到步驟S82(步驟S84)。
然后,開始第1 第3各實(shí)施方式中從距離計(jì)算結(jié)束時(shí)刻開始的處理(步驟S85)。
利用上述處理,通過本實(shí)施方式而使用的馬氏距離中,由于在求出分類對(duì)象數(shù)據(jù)和各類別之間的距離時(shí),期望特征量為正態(tài)分布,因此群體的各特征量的分布越接近于正態(tài)分布,則與各類別之間越能夠求出準(zhǔn)確的距離(相似性),并可期望對(duì)各類別的分類的精度提高。
實(shí)施例
<計(jì)算例>
接著,使用上述的第1、第2及第3實(shí)施方式的聚類系統(tǒng),確認(rèn)利用圖14所示的樣本數(shù)據(jù)的、和現(xiàn)有例的分類的精度。雖然樣本數(shù)量較少,但可知盡管使用的特征量少,卻可得到現(xiàn)有例或其以上的正確率。該圖14中,作為類別,對(duì)種類l、種類2及種類3分別各定義IO個(gè)學(xué)習(xí)數(shù)據(jù),各學(xué)習(xí)數(shù)據(jù)具有8個(gè)特征量a, b, c, d, e, f, g, h。本例中,由圖14所示的屬于各類別的學(xué)習(xí)數(shù)據(jù),決定聚類中使用的特征量集合,接著,同樣使用學(xué)
習(xí)集合作為分類對(duì)象數(shù)據(jù)來(lái)進(jìn)行聚類。
作為計(jì)算結(jié)果,圖15表示作為現(xiàn)有的計(jì)算方法、使用特征量a及g作為特征量的組合并對(duì)類別1 類別3的圖14所示的各學(xué)習(xí)數(shù)據(jù)運(yùn)算馬氏距離的判定結(jié)果。圖15(a)中,類別1的列是和類別1的馬氏距離,類別2的列是和類別2的馬氏距離,類別3的列表示和類別3的馬氏距離。另外,種類的列表示各學(xué)習(xí)數(shù)據(jù)實(shí)際所屬的類別,判定結(jié)果表示學(xué)習(xí)數(shù)據(jù)和馬氏距離最小的類別。種類和判定結(jié)果的數(shù)字一致的是表示正確分類后的特征量數(shù)據(jù)。
在圖15(b)中,列的編號(hào)表示學(xué)習(xí)數(shù)據(jù)實(shí)際所屬的類別,行的編號(hào)表示被判定的類別。例如,記號(hào)R1的「8」表示類別1的IO個(gè)類別內(nèi)8個(gè)被判定作為類別l,記號(hào)R2的「2」表示類別1的IO個(gè)類別內(nèi)2個(gè)被判定作為類別3。 PO表示正確解和回答的一致率,pl表示兩者偶然一致的概率,k是整體校正判定率,利用下面的式子求出。該k越高,表示分類的精度越高。
<formula>formula see original document page 27</formula>上式中的a, b, c, d的關(guān)系用圖16來(lái)說明。
屬于類別1的數(shù)據(jù)被分類作為類別1的個(gè)數(shù)為a,屬于類別1的數(shù)據(jù)被分類作為類別2的個(gè)數(shù)為b, a+b表示屬于類別1的數(shù)據(jù)個(gè)數(shù)。另外,同樣地,屬于類別2的數(shù)據(jù)被分類作為類別2的個(gè)數(shù)為d,屬于類別2的數(shù)據(jù)被分類作為類別1的個(gè)數(shù)為c, c + d表示屬于類別2的數(shù)據(jù)個(gè)數(shù)。a + c是在全部數(shù)據(jù)a+b + c + d內(nèi)被分類成類別1的個(gè)數(shù),b+d是在全部數(shù)據(jù)a+b + c + d內(nèi)被分類成類別2的個(gè)數(shù)。
接著,圖17表示使用第1實(shí)施方式的計(jì)算方法、對(duì)類別1 類別3的圖14所示的各學(xué)習(xí)數(shù)據(jù)運(yùn)算馬氏距離的判定結(jié)果。對(duì)于該圖17(a)及(b)的看法,由于和圖15相同,因此省略其說明??芍_解率p0、偶然一致的概率pl、整體校正判定率K與圖15的現(xiàn)有的計(jì)算方法相同。這里,使用從上述的整體的組合中、對(duì)每個(gè)類別選擇具有最大的判別基準(zhǔn)值X的組合的方法,并算出與各類別對(duì)應(yīng)的特征量集合。使用特征量a及h的組合作為與類別l對(duì)應(yīng)的特征量集合,使用特征量a及d的組合作為與類別2對(duì)應(yīng)的特征量集合,使用特征量a及g的組合作為與類別3對(duì)應(yīng)的特征量集合。
接著,圖18表示使用第2實(shí)施方式的計(jì)算方法、對(duì)類別1 類別3的圖14所示的各學(xué)習(xí)數(shù)據(jù)運(yùn)算馬氏距離的判定結(jié)果。對(duì)于圖18(a)及(b)的看法,由于和圖15相同,因此省略其說明。正確解率p0為0.8333,偶然一致的概率pl為0.3333,整體校正判定率K為0.75,可知與圖15的現(xiàn)有的計(jì)算方法相比,分類精度提高。這里,使用從上述的整體的組合中、對(duì)每個(gè)類別選擇具有前3位為止的判別基準(zhǔn)值X的組合的方法,并算出與各類別對(duì)應(yīng)的特征量集合。使用特征量a'h、 a'g、 d'e的3個(gè)組合作為與類別1對(duì)應(yīng)的特征量集合,使用特征量a f、 a d、 a b的3個(gè)組合作為與類別2對(duì)應(yīng)的特征量集合,使用特征量e'g、 a*c、 a'g的3個(gè)組合作為與類別3對(duì)應(yīng)的特征量集合。另外,作為投票的判定,從馬氏距離小的開始依次排列,計(jì)算從小的開始進(jìn)入前3的類別的個(gè)數(shù),將個(gè)數(shù)最多的類別作為該分類對(duì)象數(shù)據(jù)所屬的類別。
接著,圖19表示使用第2實(shí)施方式的計(jì)算方法、對(duì)類別1 類別3的
圖14所示的各學(xué)習(xí)數(shù)據(jù)運(yùn)算馬氏距離并進(jìn)一步對(duì)計(jì)算結(jié)果的馬氏距離乘以校正系數(shù)(人)一(1/2)后進(jìn)行距離的排位的判定結(jié)果。對(duì)于圖19(a)及(b)的看法,由于和圖15相同,因此省略其說明。正確解率p0為0.8333,偶然一致的概率pl為0.3333,整體校正判定率K為0.75,可知與圖15的現(xiàn)有的計(jì)算方法相比,分類精度提髙。這里,使用從上述的整體的組合中、對(duì)每個(gè)類別選擇具有前3位為止的判別基準(zhǔn)值X的組合的方法,并算出與各類別對(duì)應(yīng)的特征量集合。使用特征量a h、 a g、 d e的3個(gè)組合作為與類別1對(duì)應(yīng)的特征量集合,使用特征量a.f、 a'd、 a,b的3個(gè)組合作為與類別2對(duì)應(yīng)的特征量集合,使用特征量e'g、 a*c、 a'g的3個(gè)組合作為與類別3對(duì)應(yīng)的特征量集合。
另外,作為投票的判定,從馬氏距離小的開始依次排列,計(jì)算從小的開始進(jìn)入前3的類別的個(gè)數(shù),將個(gè)數(shù)最多的類別作為該分類對(duì)象數(shù)據(jù)所屬的類別。
由上述的圖15、 17、 18、 19所示的各分類結(jié)果可知,本實(shí)施方式與現(xiàn)有例相比,進(jìn)行高速且高精度的聚類處理,能夠確認(rèn)本實(shí)施方式相對(duì)于現(xiàn)有例的優(yōu)越性。
<本發(fā)明的應(yīng)用例>
A.檢查裝置
如圖20所示,說明對(duì)被檢查物、例如玻璃基板表面的傷痕的種類進(jìn)行分類的檢查裝置(缺陷檢測(cè)裝置)。圖21是說明特征量集合的選擇的動(dòng)作例的流程圖,圖22是說明聚類處理中的動(dòng)作例的流程圖。
首先,說明特征量集合的選擇的動(dòng)作。圖5的流程圖的步驟Sl中的學(xué)習(xí)數(shù)據(jù)的采集對(duì)應(yīng)于圖21的流程圖的步驟S101到步驟S105。
圖21的步驟S2到步驟S4由于與圖5的流程圖相同,因此省略說明。
通過操作員的操作,采集與想要將傷痕的種類進(jìn)行分類的類別分別對(duì)應(yīng)的學(xué)習(xí)數(shù)據(jù)用的樣本(步驟SlOl)。
圖像取得部101利用照明裝置102照射作為學(xué)習(xí)數(shù)據(jù)進(jìn)行采集的傷痕
的形狀,利用攝像裝置103取得傷痕部分的圖像數(shù)據(jù)(步驟S102)。
然后,從圖像取得部IOI取得的圖像數(shù)據(jù)中,算出各學(xué)習(xí)數(shù)據(jù)的傷痕的特征量(步驟S103)。
將得到的學(xué)習(xí)數(shù)據(jù)的特征量分別向由目視得到的分類目標(biāo)進(jìn)行分配,進(jìn)行各類別的學(xué)習(xí)數(shù)據(jù)的確定(步驟S104)。
然后,重復(fù)從步驟S101到步驟102的處理,直到各類別的學(xué)習(xí)數(shù)據(jù)達(dá)到預(yù)定個(gè)數(shù)(預(yù)先設(shè)定好的樣本個(gè)數(shù))、例如各30個(gè)左右,達(dá)到預(yù)定個(gè)數(shù)時(shí),聚類部105進(jìn)行圖5已說明的步驟S2以后的處理。這里,聚類部105是第1或第2實(shí)施方式中的聚類系統(tǒng)。
接著,參照?qǐng)D22說明圖4的檢查裝置中的聚類處理。這里,圖22的步驟S31到步驟S34、 S55及S56由于與圖10的流程圖相同,因此省略說明。
圖20的檢查裝置中,檢查開始時(shí),照明裝置102對(duì)作為被檢査物100的玻璃基板進(jìn)行照明,攝像裝置103拍攝玻璃基板表面并將該拍攝圖像輸出到圖像取得部IOI。由此,缺陷候補(bǔ)檢測(cè)部104檢測(cè)出在從圖像取得部101輸入的拍攝圖像中與平面形狀不同的部分時(shí),將其作為應(yīng)分類的缺陷候補(bǔ)(步驟S201)。
接著,缺陷候補(bǔ)檢測(cè)部104從拍攝圖像中取出該缺陷候補(bǔ)的部分的圖像數(shù)據(jù),作為分類對(duì)象數(shù)據(jù)。
然后,缺陷候補(bǔ)檢測(cè)部104由分類對(duì)象數(shù)據(jù)的圖像數(shù)據(jù)算出特征量,對(duì)聚類部105輸出由提取出的特征量的集合組成的分類對(duì)象數(shù)據(jù)(步驟
對(duì)于之后的聚類處理,由于在圖10的步驟中已有說明,因此省略。如上所述,本發(fā)明的檢査裝置能夠?qū)⒉AЩ迳蠋в械膫郯磦鄣拿總€(gè)種類高精度地進(jìn)行分類。
B.缺陷種類判定裝置
圖23所示的缺陷種類判定裝置的聚類部105對(duì)應(yīng)于已說明的本發(fā)明的
29聚類系統(tǒng)。
圖像取得裝置201由圖20中的圖像取得部101、照明裝置102及攝像 裝置103構(gòu)成。
已取得將分類對(duì)象數(shù)據(jù)進(jìn)行分類的目標(biāo)的各類別的學(xué)習(xí)數(shù)據(jù),并在聚
類裝置105的類別數(shù)據(jù)庫(kù)5中準(zhǔn)備。因而,圖5中的特征量集合的選擇也 己結(jié)束。
從由安裝在各生產(chǎn)裝置的圖像取得裝置202輸入的拍攝圖像中檢測(cè)缺 陷候補(bǔ),取出該圖像數(shù)據(jù),并提取特征量輸入到數(shù)據(jù)采集裝置203。控制裝 置200將輸入到數(shù)據(jù)采集裝置203的分類對(duì)象數(shù)據(jù)轉(zhuǎn)送到聚類部105。然后, 如已說明的那樣,聚類部105將輸入的分類對(duì)象數(shù)據(jù)對(duì)與傷痕的種類對(duì)應(yīng) 的各類別進(jìn)行分類。
C. 生產(chǎn)管理裝置
本發(fā)明的生產(chǎn)管理裝置如圖24所示,由控制裝置300;生產(chǎn)裝置301、 302;通知部303;存儲(chǔ)部304;不佳裝置判定部305及缺陷種類判定裝置 306構(gòu)成。這里,缺陷種類判定裝置306與上述B項(xiàng)中說明的缺陷種類判 定裝置相同。
缺陷種類判定裝置306將來(lái)自分別設(shè)置在生產(chǎn)裝置301及生產(chǎn)裝置302 的圖像取得裝置201、 202的拍攝圖像,在對(duì)應(yīng)的缺陷候補(bǔ)檢測(cè)部104中進(jìn) 行圖像處理并提取特征量,進(jìn)行分類對(duì)象數(shù)據(jù)的分類。
接著,不佳裝置判定部305具有表示已分類的類別的識(shí)別信息、和與 該類別對(duì)應(yīng)的發(fā)生原因的關(guān)系的列表,從所述列表中讀出與從所述缺陷種 類判定裝置306輸入的分類目標(biāo)的類別的識(shí)別信息對(duì)應(yīng)的發(fā)生原因,判定 成為發(fā)生原因的生產(chǎn)裝置。即,不佳裝置判定部305對(duì)應(yīng)于類別的識(shí)別信 息,檢測(cè)出產(chǎn)品的生產(chǎn)過程中的缺陷的發(fā)生原因。
然后,不佳裝置判定部305從通知部303向操作員通知,并且對(duì)應(yīng)于 判定的日期,將缺陷被分類后的類別的識(shí)別編號(hào)、發(fā)生原因、和該生產(chǎn)裝 置的識(shí)別信息作為歷史紀(jì)錄存儲(chǔ)到存儲(chǔ)部304。另外,控制裝置300使不佳 裝置判定部305判定的生產(chǎn)裝置停止,或?qū)刂茀?shù)進(jìn)行控制。
D. 生產(chǎn)管理裝置本發(fā)明的另一生產(chǎn)管理裝置如圖25所示,由控制裝置300;生產(chǎn)裝置
301、 302;通知部303;存儲(chǔ)部304及聚類部105構(gòu)成。這里,聚類部105 與上述A、 B項(xiàng)中說明的構(gòu)成相同。
聚類部105中,與上述的A C的情況不同,分類對(duì)象數(shù)據(jù)的特征數(shù) 據(jù)是根據(jù)由工業(yè)產(chǎn)品、例如玻璃基板的生產(chǎn)過程中的生產(chǎn)條件(材料的成 分、處理溫度、壓力、處理速度等)組成的特征量,按生產(chǎn)過程的各工序的 生產(chǎn)狀態(tài)進(jìn)行分類。所述特征量作為設(shè)置在各生產(chǎn)裝置301或302的傳感 器檢測(cè)出的工序信息作為特征量輸入到聚類部105。
即,聚類部105根據(jù)上述分類對(duì)象數(shù)據(jù)的特征量,將各生產(chǎn)裝置的各 工序中的玻璃生產(chǎn)過程的生產(chǎn)狀態(tài)分類成「正常狀態(tài)」、「易產(chǎn)生缺陷需 要調(diào)整的狀態(tài)」、「危險(xiǎn)需要調(diào)整的狀態(tài)」等類別。然后,聚類部105利 用通知部303向操作員通知上述分類結(jié)果,并且將分類結(jié)果的類別的識(shí)別 信息輸出到控制裝置300,另外,對(duì)應(yīng)于判定的日期,將上述各工序的生產(chǎn) 狀態(tài)被分類后的類別的識(shí)別編號(hào)、作為最成為問題的特征量的生產(chǎn)條件、 和該生產(chǎn)裝置的識(shí)別信息作為歷史記錄存儲(chǔ)在存儲(chǔ)部304。
控制裝置300具有表示類別的識(shí)別信息和將生產(chǎn)條件恢復(fù)正常的調(diào)整 項(xiàng)目及其數(shù)據(jù)的對(duì)應(yīng)關(guān)系的列表,讀出與從聚類部105輸入的類別的識(shí)別 信息對(duì)應(yīng)的、將生產(chǎn)條件恢復(fù)正常的調(diào)整項(xiàng)目及其數(shù)據(jù),利用讀出的數(shù)據(jù) 控制對(duì)應(yīng)的生產(chǎn)裝置。
此外,也可將用于實(shí)現(xiàn)圖1中的聚類系統(tǒng)的功能的程序存儲(chǔ)到計(jì)算機(jī) 可讀取存儲(chǔ)介質(zhì),通過使計(jì)算機(jī)系統(tǒng)讀入存儲(chǔ)在該存儲(chǔ)介質(zhì)的程序并執(zhí)行, 來(lái)進(jìn)行分類對(duì)象數(shù)據(jù)的聚類處理。此外,這里所謂「計(jì)算機(jī)系統(tǒng)」,是指 包含OS及周邊設(shè)備等硬件。另外,「計(jì)算機(jī)系統(tǒng)」也包含具有主頁(yè)提供環(huán) 境(或顯示環(huán)境)的WWW系統(tǒng)。另外,所謂「計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)」, 是指軟盤、光磁盤、ROM、 CD — ROM等可移動(dòng)介質(zhì)、內(nèi)置于計(jì)算機(jī)系統(tǒng) 的硬盤等存儲(chǔ)裝置。再有所謂「計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)」,還包含如通過 互聯(lián)網(wǎng)等網(wǎng)絡(luò)或電話線路等通信線路發(fā)送程序時(shí)的成為服務(wù)器或客戶機(jī)的 計(jì)算機(jī)系統(tǒng)內(nèi)部的易失性存儲(chǔ)器(RAM)那樣的、在一定時(shí)間保持程序的介質(zhì)。
31另外,上述程序也可從在存儲(chǔ)裝置等中存儲(chǔ)該程序的計(jì)算機(jī)系統(tǒng)通過 傳輸介質(zhì)或利用傳輸介質(zhì)中的傳輸載波傳輸?shù)狡渌?jì)算機(jī)系統(tǒng)。這里,傳 輸程序的「?jìng)鬏斀橘|(zhì)」是指如互聯(lián)網(wǎng)等網(wǎng)絡(luò)(通信網(wǎng))或電話線路等通信線路 (通信線)那樣的具有傳輸信息的功能的介質(zhì)。另外,上述程序也可為用于實(shí) 現(xiàn)上述功能的一部分的程序。還可通過與已存儲(chǔ)在計(jì)算機(jī)系統(tǒng)中的程序的 組合來(lái)實(shí)現(xiàn)上述功能,即所謂的差分文件(差分程序)。
工業(yè)上的實(shí)用性
本發(fā)明可應(yīng)用于如玻璃物品等的缺陷檢測(cè)等那樣將具有多種特征量的 信息以高精度進(jìn)行分類和判別的領(lǐng)域,進(jìn)一步也可用在生產(chǎn)狀態(tài)檢測(cè)裝置 或產(chǎn)品生產(chǎn)管理裝置中。
此外,這里引用2006年7月6日申請(qǐng)的日本專利申請(qǐng)2006—186628 的說明書、權(quán)利要求的范圍、附圖及說明書摘要的全部?jī)?nèi)容,作為本發(fā)明 的說明書的揭示內(nèi)容而采用的。
權(quán)利要求
1. 一種聚類系統(tǒng),利用輸入數(shù)據(jù)所具有的特征量、將該輸入數(shù)據(jù)分類成由學(xué)習(xí)數(shù)據(jù)的群體所形成的各類別,其特征在于,包含特征量集合存儲(chǔ)部,該特征量集合存儲(chǔ)部存儲(chǔ)與所述各類別對(duì)應(yīng)的、分類中使用的作為特征量組合的特征量集合;特征量提取部,該特征量提取部從輸入數(shù)據(jù)中提取預(yù)先設(shè)定的特征量;距離計(jì)算部,該距離計(jì)算部對(duì)每個(gè)與各類別對(duì)應(yīng)的特征量集合、根據(jù)該特征量集合中包含的特征量來(lái)分別計(jì)算并輸出各類別的群體的中心和所述輸入數(shù)據(jù)之間的距離作為集合距離;以及位次提取部,該位次提取部將所述各集合距離以從小到大的順序排列。
2. 如權(quán)利要求l所述的聚類系統(tǒng),其特征在于, 對(duì)每個(gè)類別設(shè)定多個(gè)所述特征量集合。
3. 如權(quán)利要求2所述的聚類系統(tǒng),其特征在于,還具有類別分類部,該類別分類部在每個(gè)特征量集合所得到的所述集 合距離中,利用根據(jù)該集合距離的位次所設(shè)定的表示對(duì)輸入數(shù)據(jù)的各類別 的分類基準(zhǔn)的規(guī)則模式來(lái)檢測(cè)所述輸入數(shù)據(jù)屬于哪一類別。
4. 如權(quán)利要求3所述的聚類系統(tǒng),其特征在于,所述類別分類部利用所述集合距離的位次來(lái)檢測(cè)所述輸入數(shù)據(jù)屬于哪 一類別,檢測(cè)出該位次在前的集合距離較多的類別作為所述輸入數(shù)據(jù)所屬 的類別。
5. 如權(quán)利要求4所述的聚類系統(tǒng),其特征在于,所述類別分類部具有對(duì)于位次在前的個(gè)數(shù)的閾值,在前的類別在該閾 值以上時(shí),檢測(cè)作為輸入數(shù)據(jù)所屬的類別。
6. 如權(quán)利要求1至5的任一項(xiàng)所述的聚類系統(tǒng),其特征在于, 所述距離計(jì)算部對(duì)所述集合距離乘以對(duì)應(yīng)于特征量集合所設(shè)定的校正系數(shù),并將各特征量集合間的集合距離標(biāo)準(zhǔn)化。
7. 如權(quán)利要求1至6的任一項(xiàng)所述的聚類系統(tǒng),其特征在于, 還具有生成每個(gè)類別的特征量集合的特征量集合生成部,所述特征量集合生成部對(duì)各特征量的多個(gè)組合的每個(gè)組合,以各類別 的群體的學(xué)習(xí)數(shù)據(jù)的平均值為原點(diǎn),求出該原點(diǎn)與其它類別的群體的各學(xué) 習(xí)數(shù)據(jù)之間的距離的平均值,選擇平均值最大的特征量的組合,作為用于 識(shí)別各類別與其它類別的特征量集合。
8. —種缺陷種類判定裝置,其特征在于, 設(shè)置有權(quán)利要求1至7的任一項(xiàng)所述的聚類系統(tǒng),所述輸入數(shù)據(jù)是產(chǎn)品缺陷的圖像數(shù)據(jù),利用表示缺陷的特征量,將圖 像數(shù)據(jù)中的缺陷按缺陷的種類來(lái)分類。
9. 如權(quán)利要求8所述的缺陷種類判定裝置,其特征在于, 所述產(chǎn)品是玻璃物品,將該玻璃物品的缺陷按缺陷的種類來(lái)分類。
10. —種缺陷檢測(cè)裝置,其特征在于,設(shè)置有權(quán)利要求8或9所述的缺陷種類判定裝置來(lái)檢測(cè)產(chǎn)品缺陷的種類。
11. 一種生產(chǎn)狀態(tài)判定裝置,其特征在于,設(shè)置有權(quán)利要求8或9所述的缺陷種類判定裝置來(lái)對(duì)產(chǎn)品的缺陷進(jìn)行 分類,根據(jù)與對(duì)應(yīng)于該種類的發(fā)生原因的對(duì)應(yīng)來(lái)檢測(cè)生產(chǎn)過程中的缺陷的發(fā)生原因。
12. —種生產(chǎn)狀態(tài)判定裝置,其特征在于, 設(shè)置有權(quán)利要求1至7的任一項(xiàng)所述的聚類系統(tǒng), 所述輸入數(shù)據(jù)是表示產(chǎn)品生產(chǎn)過程中的生產(chǎn)條件的特征量,將該特征量按生產(chǎn)過程的各工序中的生產(chǎn)狀態(tài)來(lái)分類。
13. 如權(quán)利要求12所述的生產(chǎn)狀態(tài)判定裝置,其特征在于, 所述產(chǎn)品是玻璃物品,將該玻璃物品的生產(chǎn)過程中的特征量按生產(chǎn)過程的各工序中的生產(chǎn)狀態(tài)來(lái)分類。
14. 一種生產(chǎn)狀態(tài)檢測(cè)裝置,其特征在于,設(shè)置有權(quán)利要求12或13所述的生產(chǎn)狀態(tài)判定裝置來(lái)對(duì)產(chǎn)品生產(chǎn)過程 的各工序中的生產(chǎn)狀態(tài)的種類進(jìn)行檢測(cè)。
15. —種產(chǎn)品生產(chǎn)管理裝置,其特征在于,設(shè)置有權(quán)利要求12或13所述的生產(chǎn)狀態(tài)判定裝置來(lái)對(duì)產(chǎn)品生產(chǎn)過程的各工序中的生產(chǎn)狀態(tài)的種類進(jìn)行檢測(cè),并根據(jù)對(duì)應(yīng)于該種類的控制項(xiàng)目 來(lái)進(jìn)行生產(chǎn)過程的工序中的過程控制。
全文摘要
本發(fā)明提供一種能夠相比現(xiàn)有例以高速且高精度地對(duì)分類對(duì)象數(shù)據(jù)進(jìn)行分類的聚類系統(tǒng)。本發(fā)明的聚類系統(tǒng)利用輸入數(shù)據(jù)所具有的特征量、將該輸入數(shù)據(jù)分類成由學(xué)習(xí)數(shù)據(jù)的群體所形成的各類別,該聚類系統(tǒng)中,包含特征量集合存儲(chǔ)部,該特征量集合存儲(chǔ)部存儲(chǔ)與各類別對(duì)應(yīng)的、分類中使用的作為特征量的組合的特征量集合;特征量提取部,該特征量提取部從輸入數(shù)據(jù)中提取預(yù)先設(shè)定的特征量;距離計(jì)算部,該距離計(jì)算部對(duì)每個(gè)與各類別對(duì)應(yīng)的特征量集合、根據(jù)該特征量集合中包含的特征量來(lái)分別計(jì)算并輸出各類別的群體的中心和所述輸入數(shù)據(jù)之間的距離作為集合距離;及將各集合距離以從小到大的順序排列的位次提取部。
文檔編號(hào)G06N3/00GK101484910SQ20078002554
公開日2009年7月15日 申請(qǐng)日期2007年7月3日 優(yōu)先權(quán)日2006年7月6日
發(fā)明者大西孝二, 楜澤信, 勝呂昭男 申請(qǐng)人:旭硝子株式會(huì)社