專利名稱:信息處理設備、信息處理方法以及程序的制作方法
技術領域:
本發(fā)明涉及一種信息處理設備、信息處理方法以及程序。更具體地說, 本發(fā)明涉及一種可以提供多個具有評估指標間的折衷關系的算法的信息 處理設備、信息處理方法以及程序。
背景技術:
已經提出了一種通過使用基因搜索技術來自動配置特征量提取算法 的技術(自動算法配置技術),其中特征量提取算法用于提取表示給定數據 的特征的特征量。在自動算法配置技術中,可以自動地配置用于語音識別、 圖像識別等的算法。
例如,本受讓人已經提出了一種這樣的技術(例如,參考國際專利公
布No. WO2007/049641),其用于配置可以以高準確度從諸如音樂教:據的 內M據中快速地提取特征量的算法。
發(fā)明內容
在自動算法配置技術中,僅僅最高性能(最高準確度)的算法被輸出。 因此,例如,當存在諸如性能(準確度)和速度(處理時間)的兩個評估指標 時,即使可以稍微降低性能,要獲得以高速度操作的算法也是困難的。雖 然一旦算法被配置就可以減小評估指標中的一個,但是相關領域中的技術 典型地不可以處理變化,例如,期望增大評估指標中的一個。
本發(fā)明是鑒于這種情形而設計的,并且期望有可能提出多個具有評估 指標間的折衷關系的算法。
根據本發(fā)明的一個實施例,提供了一種信息處理設備。該信息處理i殳 備包括算法配置裝置,用于通過使用基因搜索技術來配置用于對輸入信 號執(zhí)行辨別的算法;以及折衷分析裝置,用于通辻基于算法執(zhí)行折衷分析 來確定算法關于評估指標的帕累托最優(yōu)解。信息處理設備還可以包括最佳算法確定裝置,用于在帕累托最優(yōu)解當 中確定與所要求的評估指標條件相匹配的最佳算法。
由算法配置裝置配置的算法可以具有特征提取表達式和信息估計表 達式,其中信息估計表達式是特征提絲達式的組合。
折衷分析裝置可以通過使用具有不同數目的特征提取表達式的算法 來生成初始狀態(tài)中的帕累托最優(yōu)解,其中該算法通過從由算法配置裝置配 置的算法中逐個地刪除特征提M達式來創(chuàng)建。
折衷分析裝置可以使用由算法配置裝置配置的算法作為初始狀態(tài)中 的帕累托最優(yōu)解。
折衷分析裝置可以通過隨機地改變初始狀態(tài)中的帕累托最優(yōu)解中的 每個特征提取表達式的使用或不使用,更新帕累托最優(yōu)解。
最佳算法確定裝置可以基于所要求的處理時間和準確度而在帕累托 最優(yōu)解當中確定最佳算法。
信息處理設備還可以包括評估值計算裝置,用于確定信息估計表達式 中的特征提取表達式的評估值,并且算法配置裝置可以基于所確定的特征 提取表達式的評估值而更新信息估計表達式中的特征提M達式。
當算法配置裝置配置多個信息估計表達式作為算法時,信息估計表達 式中的相同特征提取表達式的貢獻率的總值可以被用作對應的特征提取 表達式的評估值。
根據本發(fā)明的另 一實施例,提供了 一種用于信息處理設備的信息處理
方法,其中信息處理i殳備包括算法配置裝置,用于配置算法;以;^折衷 分析裝置,用于確定算法的帕累托最優(yōu)解。該信息處理方法包括以下步驟 通迚基因搜索技術來配置用于對輸入信號執(zhí)行辨別的算法;以及通過基于 算法執(zhí)行折衷分析來確定算法關于評估指標的帕累托最優(yōu)解。
根據本發(fā)明的另一實施例,提供了一種程序。該程序使計算機用作以 下裝置算法配置裝置,用于通過使用基因搜索技術來配置用于對輸入信 號執(zhí)行辨別的算法;以及折衷分析裝置,用于通過基于算法執(zhí)行折衷分析 來確定算法關于評估指標的帕累托最優(yōu)解。
根據本發(fā)明的實施例,配置用于對輸入信號執(zhí)行辨別的算法,并且基 于所配置的算法執(zhí)行折衷分析。結果,確定出算法關于評估指標的多個帕 累托最優(yōu)解。根據本發(fā)明的實施例,可以提供多個具有評估指標間的折衷關系的算法。
圖1是示出根據本發(fā)明實施例的信息處理設備的配置的示例的框圖2示出輸入到信息處理設備的釆樣信號的示例;
圖3是圖示要被生成的算法的結構的圖4是示出異常聲音辨別表達式的結構;
圖5是圖示要被生成的算法的另一結構的圖6是示出信息提取器的配置示例的框圖7示出特征提M達式的示例;
圖8示出一個特征提取表達式的示例;
圖9圖示輸入信號的類型;
圖10圖示輸入信號的類型;
圖11圖示輸入信號的類型;
圖12圖示操作符的類型;
圖13是示出由自動算法配置部件執(zhí)行的自動算法配置的示例的圖; 圖14圖示選擇生成; 圖15圖示交叉生成; 圖16圖示變異生成;
圖17圖示下一代特征提^達式的生成的示例;
圖18圖示下一代特征提取表達式;
圖19是示出自動算法配置部件的詳細配置的示例的框圖20圖示由學習數據剪截部件執(zhí)行的處理;
圖21示出由特征量計算部件計算的特征量的示例;
圖22示出被提供到機器學習部件的數據的示例;
圖23A和23B圖示由機器學習部件執(zhí)行的處理圖24圖示由機器學習部件執(zhí)行的處理;
圖25圖示由機器學習部件執(zhí)行的處理;
圖26A和26B圖示由機器學習部件執(zhí)行的處理;
圖27圖示帕累托最優(yōu)解;
圖28圖示帕累托最優(yōu)解的初始化;
圖29圖示帕累托最優(yōu)解的初始化;
圖30圖示帕累托最優(yōu)解的初始化;
圖31圖示帕累托最優(yōu)解的初始化;
圖32圖示帕累托最優(yōu)解的更新;
圖33是圖示帕累托最優(yōu)解的更新的圖表;
圖34是圖示帕累托最優(yōu)解的更新的圖表;
圖35是圖示帕累托最優(yōu)解的更新的圖表;
圖36圖示最佳算法的確定;
圖37圖示異常聲音辨別處理;
圖38是圖示自動算法配置處理的流程圖39是圖示特征提取表達式列表生成處理的流程圖40是圖示隨機生成處理的流程圖41是圖示下一代列表生成處理的流程圖42是圖示選擇生成處理的流程圖43是圖示交叉生成處理的流程圖44是圖示變異生成處理的流程圖45是圖示隨機生成處理的$錄圖46是圖示特征量計算處理的流程圖47是圖示機器學習處理的流程圖48是圖示折衷分析處理的流程圖49是圖示帕累托最優(yōu)解初始化處理的流程圖50是示出根據本發(fā)明另 一實施例的自動算法配置系統(tǒng)的框圖;圖51示出教師數據的示例;
圖52示出被提供到評估值計算部件的特征量和平均時間的示例; 圖53A和53B示出每個特征量的使用/不使用的示例; 圖54示出所計算的特征量的示例; 圖55示出總計算時間的計算的示例;
圖56示出M評估參考值、亮度評估參考值和總計算時間的示例;
圖57圖示帕累托最優(yōu)解的更新;
圖58是圖示帕累托最優(yōu)解搜索處理的流程圖59是圖示特征量計算處理的流程圖60是圖示評估值計算處理的流程圖61是圖示評估值確定處理的流程圖;以及
圖62是示出根據本發(fā)明的一個實施例的計算機的配置示例的框圖。
具體實施例方式
圖1示出根據本發(fā)明的一個實施例的信息處理設備的配置的示例。
信息處理設備1執(zhí)行用于檢測異常聲音的處理,基于作為學習數據輸 入的樣本信號自動地配置算法,其中樣本信號是異常聲音還是正常聲音是 已知的。信息處理i殳備1才艮據自動配置的算法來確定新的輸入信號(在下 文中,被稱為"新信號")是具有異常聲音還是具有正常聲音。
信息處理設備l包括樣本信號輸入部件ll、樣本信號存儲部件12、 自動算法配置部件13、折衷分析部件14、帕累托最優(yōu)解存儲部件15、使 用算法確定部件16、新信號輸入部件17、自動異常聲音辨別部件18、異 常聲音辨別結果輸出部件19和校正信息輸入部件20。
用于算法配置的樣本信號從信息處理設備1中的另一區(qū)塊(未示出)或 從另一設備輸入到樣本信號輸入部件11。響應于用于算法配置的樣本信 號,樣本信號輸入部件11將樣本信號提供到樣本信號存儲部件12。
樣本信號存儲部件12存儲從樣本信號輸入部件11提供的樣本信號, 作為教師數據。自動異常聲音辨別部件18和校正信息輸入部件20將信號 (在下面描述)提供到樣本信號存儲部件12。表示輸入到樣本信號輸入部件11的樣本信號是否具有正常聲音或異 常聲音的數據作為標注被附連到樣本信號。
圖2是輸入到樣本信號輸入部件11的樣本信號的示例。在圖2中, 水平軸表示時間,并且樣本信號和標注在每個時間點具有一對一的對應關 系。表示樣本信號是正常聲音還是異常聲音的標注可以皿定為具有高電 平或低電平的信號。
通it&于基因搜索技術來執(zhí)行學習,自動算法配置部件13配置(生成) 用于針對不知道是異常聲音還是正常聲音的新信號辨別異常聲音或正常 聲音的算法。所配置的算法是這樣的算法(特征量提取算法),其用于提取 表示輸入信號的預定特征的特征量并且使得有可能基于由算法提取的特 征量(值)是否大于或等于預定閾值而辨別異常聲音和正常聲音。下面參考 圖3及后續(xù)圖來描述算法配置的細節(jié)。
折衷分析部件14通過基于由自動算法配置部件13配置的算法而扭^行 折衷分析,確定帕累托最優(yōu)解作為算法。然后,折衷分析部件14將作為 帕累托最優(yōu)解的多個算法提供到帕累托最優(yōu)解存儲部件15。帕累托最優(yōu)解 存儲部件15存儲從折衷分析部件14提供的多個算法(其是帕累托最優(yōu)解)。
在存儲在帕累托最優(yōu)解存儲部件15中的多個算法當中,使用算法確 定部件16確定與所要求的用于評估指標的條件相匹配的最佳算法,并且 將所確定的最佳算法提供到自動異常聲音辨別部件18。評估指標例如包括 信息處理設備1的當前可用資源狀態(tài)和所要求性能。
新信號輸入部件17接收所輸入的將要進行異常聲音辨別的新信號, 并且將所接收的新信號提供到自動異常聲音辨別部件18。
自動異常聲音辨別部件18 ^吏用從使用算法確定部件16提供的算法來 對從新信號輸入部件17提供的新信號辨別異常聲音和正常信號,并且將 辨別結果提供到異常聲音辨別結果輸出部件19。自動異常聲音辨別部件 18還將辨別結果作為標注加到從新信號輸入部件17提供的新信號,并且 將所得到的信號提供到樣本信號存儲部件12以便存儲。這樣,從新信號 輸入部件17提供的新信號作為新的樣本信號被存儲在樣本信號存儲部件 12中。
異常聲音辨別結果輸出部件19以聲音或圖像形式輸出從自動異常聲 音辨別部件18提供的辨別結果。例如,當新信號具有異常聲音時,異常 聲音辨別結果輸出部件19輸出表示異常聲音的聲音,或者在屏幕上顯示示出文字"正常聲音"或"異常聲音"的視頻。
當存儲在樣本信號存儲部件12中的樣本信號的標注有錯誤時,校正 信息輸入部件20對標注進行校正。也就是說,校正信息輸入部件20響應 于用戶操作而改寫樣4^信號的標注。
因此,不但來自樣本信號輸入部件11的加有標注的樣本信號,而且 來自自動異常聲音辨別部件18的加有標注的樣本信號被輸入到樣本信號 存儲部件12。當從自動異常聲音辨別部件18提供的樣本信號的標注有錯 誤時,校正信息輸入部件20對該標注進行校正。
接下來,將詳細地描述由自動算法配置部件13執(zhí)行的算法配置。
圖3是圖示要被配置的算法的結構的圖。
所配置算法包括m個特征提M達式1到m(m是大于1的整數)、以 及由m個特征提取表達式1到m的線性組合表達式表示的信息估計表達 式。每個特征提取表達式對輸入信號執(zhí)行預定計算,并且輸出第一階值作 為計算結果。信息估計表達式使用從特征提取表達式輸出的第一階值來估 計表示輸入信號特征的信息。自動算法配置部件13確定異常聲音辨別表 達式U作為信息估計表達式。
圖4示出異常聲音辨別表達式U的具體示例。要被輸出的辨別結果是 表示異常聲音或正常聲音的二進制碼。因此,基于異常聲音辨別表達式U 的計算結果是小于或等于預定閾值Th還是大于預定閾值Th而辨別輸入 信號是具有異常聲音還是具有正常聲音。例如,如圖4所示,當異常聲音 辨別表達式U的計算結果小于或等于預定閾值Th時,要被輸出的辨別結 果表示輸入信號具有正常聲音,而當異常聲音辨別表達式U的計算結果大 于預定閾值Th時,要被輸出的辨別結^示輸入信號具有異常聲音。在 圖4所示的異常聲音辨別表達式U的示例中,只有特征提^達式1到m 中的特征提取表達式l、 2、 5和15被4吏用。這是因為其他特征提M達 式的線性組合系數為0。
要被配置的算法可以是用于估計例如預定范圍內的數值而不是表示 異常聲音或正常聲音的二進制碼的算法,其中預定范圍內的數值例如為音 樂速度和亮度的程度(級別)。在這種情況下,如圖5所示,根據由m個特 征提取表達式1到m的線性組合表達式表示的速度估計表達式的計算結 果,確定表示輸入信號速度的值,并且根據由m個特征提^達式1到m 的線性組合表達式表示的亮度估計表達式的計算結果,確定表示輸入信號亮度的值。
在下面參考圖50及后續(xù)圖描述的下一實施例中描述了這樣的示例, 其中在新信號被輸入時用作用于提取速度和亮度的值的特征提取器的算 法被配置成如圖6所示。
圖7示出特征提^達式1到m的示例。
特征提M達式可以處理可以以多階值表示的輸入信號,直至其具有 一個值,也就是說,其具有標量。圖8示出特征4^取表達式的一個示例。
圖8所示的這個特征提取表達式由表示輸入信號的類型的信息和提供 表示要對輸入信號執(zhí)行的信號處理的信息的操作符構成。每個操作符包括 處理目標軸和處理描述,并且可選地包括用于處理的^lt。在圖8所示的 示例中,"12TonesM,, g—表示輸入信號類型的信息,并且接著為四個操作 符"F弁Differential" 、 "F#MaxIndex,, 、 "T#LPF—1 ;0.861"和"T#UVariance"。
表示輸入信號類型的信息除包括"12TonesM"(在圖8的示例中示出) 之外還包括例如"wav"和"Spectrum",其中"12TonesM"表示單聲道 PCM(脈沖編碼調制)聲源波形數據受到沿著時間軸的區(qū)間分析,"wav"表 示波形,"Spectrum"表示二維圖像(其示出聲鐠)。
特征提取表達式表示從與表示輸入信號類型的信息較接近的信息開 始,順序地對輸入信號執(zhí)行由操作符表示的信號處理。每個操作符的開頭 表示要被處理的軸(處理目標軸)。在要被處理的軸中,T表示時間方向并 且F表示頻率(區(qū)間)方向。
關于操作符的處理目標軸之后的處理描述,"Differential"表示微分, "MaxIndex"表示獲取最大值索引,"LPF_1"表示低通濾波,并且 "UVariance"表示計算均方差。適當時,每個—^作符可以帶參數。在圖8 所示的示例中,"LPF_1"(低通濾波)的處理帶有參數"0.861"。
因此,圖8所示的特征提^達式是要沿著區(qū)間方向,對通過在時 間軸上對PCM波形數據執(zhí)行區(qū)間分析而獲得的數據進行微分;計算表示 沿區(qū)間方向的最大值的"Index"(即,獲得具有最強聲音的區(qū)間的號);沿 時間軸方向應用低通濾波器;以及最后計算均方差。輸出該計算的結果。
在本實施例中,輸入信號采用"wav",其表示聲音表示信號中的波形, 但是特征提^4達式不僅可以具有聲音信號,還可以具有任何可以以矩陣 形式(以具有值的多維矩陣形式)來表達的信號。示例包括靜態(tài)圖像信號和 運動圖像信號。例如,輸入信號可以是音頻波形信號,如圖9所示,其^L視為振幅、 時間和信道的矩陣;輸入信號可以是圖像信號,如圖10所示,其被視為 幀的X和Y軸、以及RGB(R:紅、G:綠和B:藍)的矩陣;或者可以是 運動圖像信號,如圖11所示,其被視為幀的X和Y軸、RGB、以及時間 的矩陣。另外,輸入信號可以是例如可以由矩陣表示的二進制數據。
作為示例,在圖12中示出了操作符類型。例如,IMt符類型包括 平均值(Mean)、快速傅氏變換(FFT)、標準偏差(StDev)、 ^L比(Ratio)、 低通濾波器(LPF」)、高通濾波器(HPF—1)、絕對值(ABS)、平方(Sqr)、平 方才艮(sqrt)、標準化(Normalize)、微分(Differential)、積分(Integrate)、最 大值(MaxIndex)、均方差(UVariance)和下采樣(DownSampling)。依賴于 所確定的操作符,處理目標軸可以是固定的。在這種情況下,該操作符使 用固定的處理目標軸。當確定使用^的操作符時,該參數也被確定為具 有隨機或預設值。
接下來,將參考圖13到18來描述自動算法配置部件13基于基因搜 索技術而執(zhí)行的自動算法生成的流程。
如圖13所示,關于當前代特征提取表達式1到m,自動算法配置部 件13確定用于評估特征4I:取表達式的評估值。自動算法配置部件13以評 估值的降序來重新排列當前代特征提取表達式1到m,然后執(zhí)行選擇生成、 交叉生成、變異生成和隨機生成,以生成下一代特征4^取表達式l到m。 以評估值的降序重新排列當前代特征4C取表達式1到m的原因是為了允 許以評估值的降序選擇用于生成下一代特征提取表達式的特征提取表達 式。因此,重復這樣的處理,其中下一代特征提取表達式1到m變?yōu)楫?前代特征提M達式1到m并且基于當前4戈特征提M達式1到m而生 成下一代特征提M達式1到m。
現在將詳細地描M擇生成、交叉生成、變異生成和隨機生成。 術語"選擇生成"是指通過從當前代特征提取表達式中以評估值的降
為下一代特征提M達式,生成新的特征4I:取表達式。
例如,如圖14所示,在當前代特征提取表達式l、 2和3的評估值分 別為0.53、 0.85和0.74時,具有最高評估值的當前代特征4C取表達式2 被選擇,并且被用作下一代特征提取表達式l。
術語"交叉生成"是指通過在為了有助于選擇具有更高評估值的特征提取表達式而分配權重的情況下隨機地選擇兩個特征提取表達式并且交 換(交叉)隨機位置處的所選特征提M達式,生成新的特征提M達式。
例如,如圖15所示,選擇具有高評估值的第一和第二特征提取表達 式,第一特征H^^達式"Wav,T#Differential,T#IndexLRO"和笫二特征 提取表達式"Wav,T#HPF_l;0.262544,T#Mean,,,并且組合第一特征提取 表達式中的部分"Wav,T#Differential"和第二特征提取表達式中的部分
"T#Mean",換句話說,第一特征提取表達式中的部分"T弁IndexLR0" 被換成第二特征提^^達式中的部分"T弁Mean",從而生成新的特征提取 表達式。
術語"變異生成"是指通過在為了有助于選擇具有更高評估值的特征 提取表達式而分配權重的情況下隨機地選擇特征提取表達式并且隨機地 改變所選特征提M達式的一部分,生成新的特征提M達式。
例如,如圖16所示,選擇具有高評估值的特征提取表達式 "Wav,T#LPF_l;0.3,T#IndexLR0"作為變異源,并且刪除所選特征提取 表達式中的一;操作符"T#LPF_1;0.3,,(變異示例1),加上操作符"Sqr" (變異示例2),或者將特征提M達式中的一個操作符"T#LPF—1;0.3"的 Wt變成0.7(變異示例3),從而生成新的特征提M達式。
術語"隨機生成"是指通過隨機地組合操作符來生成新的特征提^ 達式,使得輸入信號具有一個值(標量)。第一代特征提M達式l到m沒 有變?yōu)槠鋪碓吹纳弦淮卣魈酠達式,因此全部通過隨機生成來生成。
例如,如圖17所示,自動算法配置部件13^"吏用選擇生成來確定下一 代特征4^^達式1到3, j吏用交叉生成來確定下一代特征^:取表達式4 到7,使用變異生成來確定下一代特征提^達式8到13,并且使用隨機 生成來確定下一代特;^M達式14到m。
圖18示出根據當前代特征4CW^達式1到m生成下一4戈特征4^取表 達式1到m的示例。
圖19是示出自動算法配置部件13的詳細配置的示例的框圖。
自動算法配置部件13包括學習數據剪截部件31、特征提取表達式 列表生成部件32、特征量計算部件33、機器學習部件34和特征量提取算 法輸出部件35。
學習數據剪截部件31剪截存儲在樣本信號存儲部件12中的學習數 據,并且將學習數據提供到特辟量計算部件33和機器學習部件34。更具體地說,學習數據剪截部件31將存儲在樣本信號存儲部件12中的樣本信 號、以及樣本信號的標注分成預定單位時間中的部分,并且將各個單位時 間中的經劃分樣本信號提供到特征量計算部件33,并且還將單位時間中的 經劃分標注提供到機器學習部件34。
現在假定,如圖20所示,學習數據剪截部件31將存儲在樣本信號存 儲部件12中的樣本信號、以及樣本信號的標注分成n個單位時間中的n 部分。單位時間中的第一個到第n個樣本信號分別被稱為數據A到Dn,
并且與數據Di到Dn相關聯(lián)的標注被稱為標注數據。在這種情況下,學習
數據剪截部件31將數據A到Dn提供到特征量計算部件33,并且將數據 A到DD的標注數據提供到機器學習部件34。
機器學習部件34將當前代特征提取表達式1到m的評估值提供到特 征提取表達式列表生成部件32。基于評估值,特征提取表達式列表生成部 件32生成下一代特征4C^達式1到m,并且將所生成的下一代特征提 取表達式1到m提供到特征量計算部件33。更具體地i兌,特征提^達 式列表生成部件32以評估值的降序重新排列當前代特征4CM達式1到 m,然后對當前代中的預定特征提取表達式執(zhí)行選擇生成、交叉生成、變 異生成和隨機生成,從而生成下一代特征提^達式1到m。
關于從學習數據剪截部件31提供的各個數據A到Dn,特征量計算部 件33對從特征^LM達式列表生成部件32拔_供的特征提取表達式1到m 執(zhí)行計算,并且將計算結果,即,數據Di到Dn的特征量提供到機器學習 部件34。
圖21示出由特征量計算部件33計算并且被提供到機器學習部件34 的特征量的示例。
通過使用數據Di到Dn的特征量及其標注數據,其中特征量從特征量 計算部件33提供,而標注數據從學習數據剪截部件31提供,機器學習部 件34通過特征選擇執(zhí)行線性辨別,以估計異常聲音辨別表達式U。換句 話說,通過使用數據"到Dn的特征量(該特征量從特征量計算部件33提 供),機器學習部件34估計異常聲音辨別表達式U,其中異常聲音辨別表 達式U使用特征提M達式并且與數據A到Dn的標注數據(標注數據從 學習數據剪截部件31提供)匹配最佳。機器學習部件34確定在使用所估 計的異常聲音辨別表達式U時各個特征提取表達式的評估值,并且將所確 定的評估值提供到特征提取表達式列表生成部件32?,F在將更詳細地描述由機器學習部件34執(zhí)行的處理。
圖22示出從特征量計算部件33和學習數據剪截部件31提供到機器 學習部件34的數據的示例。
機器學習部件34評估將^f吏用當前代特征提^達式1到m中的哪
些,以便與數據Di到Dn的標注數據匹配最佳,并且確定務使用的特征提
M達式的最佳組合。
首先,基于當前代特征提取表達式1到m中的任何一個都未被使用 (即,特征提取表達式1到m沒有被使用)的參考狀態(tài)(圖所示),機器 學習部件34確定m個特征提取表達式的使用組合(圖23B所示),每個特 征提取表達式中的使用/不使用被順序地反轉。在圖23A和23B中,在一 行的0和1的排列中,"1"表示特征提^達式1到m中的每個被使用 的情況且"0"表示特征提^達式l到m中的每個未被使用的情況,并
且在一行中從左ii^順序地表示特征提取表達式l、 2、 3.....和m的使
用或不使用。
接下來,關于m個特征提取表達式的使用組合中的每個,機器學習 部件34生成(估計)異常聲音辨別表達式U。異常聲音辨別表達式U由下 式給出
U = + b2X2 + b3X3 +,.." +bmXm+b0 (1) 其中&到Xm表示從特征提取表達式1到m得到的特征量,h到K表示
線性組合系數,并且b。表示截距。
在表達式(l)中,對于每個未被使用的特征提取表達式的特征量,線性 組合系數的值為零。
可以使用最小平方法來確定線性組合系數lh到bm以及截距b。。也就 是說,當以Uk表示數據A到Dn的標注數據(標注數據從特征量計算部件
33提供)的第K個標注數據(真值),并且以Uk'表示M達式(l)獲得的真值 Uk的估計值時,估計誤差ek可以因此由下式給出ek={Uk- Uk'}。確定使 關于數據A到Dn的每個標注數據的估計誤差ek的均方誤差"E = Z ek2" 變?yōu)樽钚〉木€性組合系數lh到bm以及截距b。,使得有可能確定最佳線性 組合系數到bm以及最佳截距bo 。
例如,所確定的異常聲音辨別表達式U由下式給出
U = 0.5xXi + 0.3xX2 + 0.0xX3 +, " +0.7Xm + 0.2。在該異常聲音辨別表達式U的示例中,線性組合系數lh、 b2、 b3.....
和bm分別為0.5、 0.3、 0.0.....和0.7,截距b。為0.2,并且從線性組合
系數為0的特征提取表達式3得到的特征量未被使用。
接下來,機器學習部件34計算關于m個特征提^達式的使用組合 中的每個而生成的異常聲音辨別表達式U的評估值。在下文中,異常聲音 辨別表達式U的評估值被稱為"評估參考值",以便與每個特征提取表達 式的評估值相區(qū)別。
例如,AIC(Akaike信息標準)可以用作用于確定評估參考值的評估函 數。AIC是表示值越小越好(即,具有更高的評估)的函數,并且由下式給 出
AIC = nx(iog(2xPI)+l+l0g(||E||2+n))
+2x(m, + l) …(2)
其中n表示教師數據的條數,即從學習數據剪截部件31提供的數據的條 數,并且PI表示圓周率。"||E||2+n"表示針對每條數據Di到Dn的均方差 并且m'表示所使用的特征提取表達式的數目。
圖24示出關于圖23B所示的m個特征提M達式的使用組合而生成 的各個異常聲音辨別表達式U的評估參考值。
機器學習部件34選擇具有最高評估的特征提取表達式的使用組合(其 具有最小評估參考值),作為下一參考狀態(tài)。在圖24所示的示例中,對于 僅僅使用特征提取表達式4的使用組合,異常聲音辨別表達式U的評估參 考值為最小。因此,如圖25所示,機器學習部件34選擇僅僅使用特征提 取表達式4的使用組合,作為下一參考狀態(tài)。
關于僅僅使用特征提取表達式4的使用組合(圖26A所示的參考狀 態(tài)),機器學習部件34確定m個特征提取表達式的使用組合,如圖26B 所示地順序地反轉每個特征提取表達式的使用/不使用。
機器學習部件34重復處理,其中該處理用于通過針對所確定的m個 特征提取表達式的使用組合而生成(估計)異常聲音辨別表達式U并且計算 異常聲音辨別表達式U的評估參考值來確定下一參考狀態(tài)。重復上述參考 狀態(tài)的確定、異常聲音辨別表達式U的生成、及其評估參考值的計算,直 至評估參考值不再被更新,也就是說,直至沒有更小的評估參考值被計算 出。當獲得評估參考值不再被更新的異常聲音辨別表達式u時,機器學習
部件34基于所獲得的異常聲音辨別表達式U的線性組合系數,確定特征 提取表達式1到m的評估值。
具體地說,機器學習部件34計算第i個特征量的貢獻率Ci,作為特 征提取表達式i的評估值,如由下式給出
Cj = bj + StDev(Xj) x StDev(T) x Correl(Xj,T) (3)
其中StDev(Xi)表示數據Di到Dn的特征提取表達式i的值(特征量XO的標 準偏差,并且StDev(T)表示數據Di到數據Dn的標注數據T的標準偏差。 Correl(T)表示數據Di到Dn的特征提:^達式i的值(特征量X;)與其標注 數據T之間的Pearson相關系數。
將如上所述計算出的特征4^取表達式1到m的評估值與所生成的異 常聲音辨別表達式U —起提供到特征提^達式列表生成部件32。
當滿;t預定完成條件時,例如,當用于生成下一代特征提M達式的
處理被執(zhí)行預定次數時,機器學習部件34將最后代特征提取表達式和異 常聲音辨別表達式U提供到特征量提取算法輸出部件35。最后代特征提 取表達式從特征提取表達式列表生成部件32或特征量計算部件33獲得。
特征量提取算法輸出部件35將從機器學習部件34提供的最后代特征 提取表達式和異常聲音辨別表達式U提供到折衷分析部件14(圖1所示)。
接下來,將描述折衷分析部件14的詳細處理。
通過使用由自動算法配置部件13配置的算法(異常聲音辨別表達式 U)作為第一帕累托最優(yōu)解,折衷分析部件14通過使用兩個評估指標,即 算法執(zhí)行速度和準確度執(zhí)行折衷分析來確定新的帕累托最優(yōu)解。對于用于 確定新的帕累托最優(yōu)解的帕累托最優(yōu)解搜索,折衷分析部件14采用簡單 的基因算法,其中該算法用于僅僅通it^作為當前帕累托最優(yōu)解的特征量 提取算法的變異來生成下一個候選帕累托最優(yōu)解。
現在將參考圖27描述帕累托最優(yōu)解。
為了通過4吏用兩個評估指標來評估算法,當不存在具有所有評估指標 上的高評估的另一解時,當前考慮的解可以被認為是帕累托最優(yōu)解。相反, 當存在具有所有評估指標上的高評估的另一解時,當前考慮的解不是帕累 托最優(yōu)解。在圖27中,黑圓表示帕累托最優(yōu)解而白圓表示非帕累托最優(yōu) 解。為了確定作為帕累托最優(yōu)解的異常聲音辨別表達式U,如圖27所示, 折衷分析部件14首先初始化帕累托最優(yōu)解。也就是說,折衷分析部件14 以特征提取表達式的標注數據相關性(上面提及的Correl(T))的升序,逐一 順序地設置包括在由自動算法配置部件13配置的異常聲音辨別表達式U 中的特征提M達式,使得該特征提取表達式不被使用。通過這么做,折 衷分析部件14生成多個異常聲音辨別表達式U,其中所使用的特征提取 表達式的數目相差一個。在這種情況下,特征提取表達式的最大數目是包 括在由自動算法配置部件13配置的異常聲音辨別表達式U中的特征提取 表達式的數目,并且特征提取表達式的最小數目是一。
基于由自動算法配置部件13配置的異常聲音辨別表達式U而生成異 常聲音辨別表達式U被稱為帕累托最優(yōu)解初始化,其中每個異常聲音辨別 表達式U要使用不同數目的特征提取表達式。由于從自動算法配置部件 13提供的異常聲音辨別表達式U不必使用所有特征提^達式,因此包 括在由自動算法配置部件13配置的異常聲音辨別表達式U中的特征提取 表達式的數目可以小于m。然而,在本實施例中,為了筒化描述,將假定 從自動算法配置部件13提供的異常聲音辨別表達式U使用所有特征提取 表達式來給出描述。
將參考圖28到31進一步描述帕累托最優(yōu)解的初始化。
如圖28所示,折衷分析部件14創(chuàng)建列表,其包括為計算各個特征提 取表達式所花費的平均時間(平均計算時間)、以及使用各個特征提取表達 式計算出的標注數據相關系數。平均計算時間可以通過計算輸入數據" 到Dn來確定,并Jbt目關系數可以由表達式(3)中的Correl(T)來確定。
接下來,折衷分析部件14設置在被使用的特征提取表達式當中具有 最小相關系數的特征提取表達式,使得該特征提取表達式不被使用,并且 僅僅使用利用其余特征提取表達式提取的特征量來確定線性組合系數bi 到bm以及截距b。,并且確定新的異常聲音辨別表達式U。折衷分析部件 14還計算在新確定的異常聲音辨別表達式U被用來執(zhí)行異常聲音辨別時 所花費的時間(總的計算時間)以及所獲得的準確度(所估計的準確度)。
在圖28所示的數據示例中,特征提取表達式3的相關系U 0.05, 其是最低的,因此特征提取表達式3被設置成不被使用,如圖29所示。 其后,確定在使用除特征提M達式3之外的特征提M達式1到m時 的新的異常聲音辨別表達式U及其準確度,并且計算把為特征提M達式 3所花費的計算時間(0.11ms)排除在外的總計算時間類似地,以相關系數的升序逐一順序地設置特征提取表達式,使得該特征提M達式不被使用,確定新的異常聲音辨別表達式u,并且計算總計算時間和準確度。然后,創(chuàng)建圖30所示的候選帕累托最優(yōu)解列表。折衷分析部件14僅M圖30所示的候選帕累托最優(yōu)解列表提取帕累 托最優(yōu)解(即,刪除非帕累托最優(yōu)解)。更具體地說,在包括使用m個特征 ^1^達式的解1到僅僅使用一個特征提^達式的解m(每個解是候選 帕累托最優(yōu)解)的異常聲音辨別表達式U當中,刪除作為非帕累托最優(yōu)解 的解3到5并且將其余解用作帕累托最優(yōu)解,其中解3到5中的每個具有 準確度更高和總計算時間更短的另一解。一般而言,當特征4^隊良達式的數目減小時,雖然總的計算時間量變 少,但是準確度往往降低。因此,由帕累托最優(yōu)解初始化生成的異常聲音 辨別表達式U的總計算時間和準確度可以被繪制到如圖31所示的圖表上。 圖31的圖表上的水平軸表示總計算時間(ms),而垂直軸表示F值的準確 度(FMs:F量度)。作為上述帕累托最優(yōu)解初始化的結果,確定了初始狀態(tài)中的帕累托最 優(yōu)解。接下來,折衷分析部件14引起初始狀態(tài)中的帕累托最優(yōu)解的變異, 以生成新的解,從而執(zhí)行帕累托最優(yōu)解的更新,以便搜索更好的帕累托最 優(yōu)解。當帕累托最優(yōu)解被更新為更好的帕累托最優(yōu)解時,連接帕累托最優(yōu) 解的線如圖31的箭頭所示沿左上方向移位。更具體地說,折衷分析部件14隨機地選擇初始狀態(tài)中的帕累托最優(yōu) 解中的一個,并且生成新解,其中隨機地改變所選解中的特征提取表達式 (例如, 一到三)的使用或不使用。圖32示出變異的示例,其中所選解中的特征提:^達式7從"使用" 變?yōu)?不使用,,并且特征提^達式8從"不使用"變?yōu)?使用",從而 生成新解。然后,折衷分析部件14計算關于新解的總計算時間和準確度,重新 創(chuàng)建圖30所示的列表,并且刪除非帕累托最優(yōu)解。折衷分析部件14執(zhí)行如下處理直至滿足完成條件,例如,直至處理 被重復預定次數,其中該處理用于通過隨機地重新選擇其余帕累托解中的 一個并且基于所選解的變異生成新的解來搜索更好的帕累托最優(yōu)解。圖33示出在從初始狀態(tài)中的帕累托最優(yōu)解重復200次用于搜索帕累托最優(yōu)解的處理之后獲得的帕累托最優(yōu)解。在圖33中,連接黑圓的實線表示在處理被重復執(zhí)行200次之后獲得 的帕累托最優(yōu)解,并且虛線表示初始狀態(tài)中的帕累托最優(yōu)解。白圓(O)表 示由帕累托最優(yōu)解搜索處理計算出的非帕累托最優(yōu)解。類似地,圖34示出在帕累托最優(yōu)解搜索處理被重復執(zhí)行1000次之后 的帕累托最優(yōu)解,并且圖35示出在搜索處理被重復執(zhí)行5000次之后的帕 累托最優(yōu)解。搜索處理被重復的次M大,可以獲得的帕累托最優(yōu)解就越 好。然而,不能識別在執(zhí)行1000次處理的情況與執(zhí)行5000次處理的情況 之間的明顯差別,因此可以理解成可以通過執(zhí)行預定次數的處理來獲得令 人滿意的帕累托最優(yōu)解。接下來,將給出關于使用算法確定部件16和自動異常聲音辨別部件 18的處理的描述。如上所述,基于所要求的處理時間和準確度,使用算法確定部件16 從由折衷分析部件14確定的且存儲在帕累托最優(yōu)解存儲部件15中的用作 帕累托最優(yōu)解的算法(異常聲音辨別表達式U)之中確定最佳算法。然后, 使用算法確定部件16將所確定的最佳算法提供到自動異常聲音辨別部件 18。例如,如圖36所示,當存在足夠資源并且存在即使增加處理時間量 也要最高性能(最高準確度)的要求時,使用算法確定部件16確定具有最高 準確度的帕累托最優(yōu)解51的算法(異常聲音辨別表達式U),并且將所確定 的算法提供到自動異常聲音辨別部件18。例如,當要求準確度為0.76(FMs)或更多時,使用算法確定部件16確 定在滿足該要求的同時具有最短的總計算時間(處理時間)的帕累托最優(yōu)解 52的算法(異常聲音辨別表達式U),并且將所確定的算法提供到自動異常 聲音辨別部件18。另外,當要求每條數據的處理時間為2 ms或更少作為總計算時間(處 理時間)時,使用算法確定部件16確定帕累托最優(yōu)解53的算法(異常聲音 辨別表達式U),并且將所確定的算法提供到自動異常聲音辨別部件18。如圖37所示,自動異常聲音辨別部件18將從新信號輸入部件17提 供的新信號分成單位時間的信號,這與學習數據剪截部件31中的單位時 間的信號相類似。然后,自動異常聲音辨別部件18通過使用從使用算法 確定部件16提供的算法來辨別每個經劃分的每單位時間的新信號是異常聲音還是正常聲音,并且將辨別結果提供到異常聲音辨別結果輸出部件19。如上所述,每個單位時間的新信號的辨別結果也被提供到樣本信號存 儲部件12以便存儲。接下來,將參考圖38所示的流程圖來描述由自動算法配置部件13執(zhí) 行的自動算法配置處理。首先,在步驟S1中,學習數據剪截部件31剪截存儲在樣本信號存儲 部件12中的學習數據,并且將該學習數據提供到特征量計算部件33和機 器學習部件34。更具體地說,學習數據剪截部件31從學習數據剪截出數據Di到Dn,并且將數據Di到Dn提供到特征量計算部件33,并且將數據A到Dn的標注數據提供到機器學習部件34。在步驟S2中,基于當前代特征提取表達式1到m的評估值(評估值 a器學習部件34提供),特征4C取表達式列表生成部件32執(zhí)行用于生 成下一代特征提M達式1到m(特征提取表達式列表)的特征提:^達式 列表生成處理。重復地執(zhí)行步驟S2中的處理。當第一次執(zhí)行步驟S2中的 處理時,不存在當前代特征提取表達式l到m,因此通過隨機生成來生成 下一代特征提取表達式1到m。下面參考圖39來描述特征提取表達式列 表生成處理的細節(jié)。在步驟S3中,特征量計算部件33執(zhí)行特征量計算處理。也就是說, 關于從學習數據剪截部件31提供的各個數據"到Dn,特征量計算部件 33根據從特征提取表達式列表生成部件32提供的特征提取表達式1到m執(zhí)行計算,并且將計算結果,即數據Di到Dn的特征量提供到機器學習部件34。下面參考圖46來描述特征量計算處理的細節(jié)。在步驟S4中,機器學習部件34執(zhí)行機器學習處理。也就是說,通過 使用數據A到Dn的特征量,(該特征量從特征量計算部件33提供),機器 學習部件34估計異常聲音辨別表達式U,其中異常聲音辨別表達式U使 用特征提取表達式并且與從學習數據剪截部件31提供的數據A到Dn的 標注數據匹配最佳。機器學習部件34確定在使用所估計的異常聲音辨別 表達式U時的各個特征提取表達式的評估值,并且將所確定的評估值提供 到特征提取表達式列表生成部件32。下面參考圖47來描i^L器學習處理 的細節(jié)。在步驟S5中,機器學習部件34確定是否滿足完成條件。更具體地說, 例如,當步驟S2到S4中的處理被重復執(zhí),定次數時或者當檢測到用于停止的操作時,機器學習部件34確定滿足完成條件。當在步驟S5中確定不滿足完成條件時,處理返回到步驟S2并且重復 其后的處理。另一方面,當在步驟S5中確定滿足完成條件時,處理進入步驟S6。 在步驟S6中,機器學習部件34將最后代特征提取表達式和異常聲音辨別 表達式U提供到特征量提取算法輸出部件35。然后,特征量提取算法輸 出部件35將最后代特征提取表達式和異常聲音辨別表達式U輸出到折衷 分析部件14,從而結束處理。接下來,將參考圖39所示的流程圖來描述在圖38所示的步驟S2中 執(zhí)行的特征提取表達式列表生成處理。在步驟S21中,特征提M達式列表生成部件32確定要被生成的特 征提取表達式列表是否是第二代或更后。當在步驟S21中確定要被生成的特征提取表達式列表不是第二代或 更后時,也就是說,是第一代時,處理進入步驟S22。在步驟S22中,特 征提取表達式列表生成部件32執(zhí)行隨機生成處理,下面參考圖40對其進 行描述。當在步驟S21中確定特征提取表達式列表是第二代或更后時,處理進 入步驟S23。在步驟S23中,特征^:取表達式列表生成部件32執(zhí)行下一 代列表生成處理,下面參考圖41對其進行描述。在完成步驟S22或S23中的處理之后,處理進入步驟S24,其中特征 提取表達式列表生成部件32將由步驟S22或S23中的處理生成的特征提 取表達式列表提供到特征量計算部件33。然后,處理返回到圖38所示的 步驟S2并且ii^步驟S3。如上所述,對于第一代,隨機地生成所有特征提M達式,并且對于 第二代或更后,使用基因搜索技術來執(zhí)行下一代列表生成處理。接下來,將參考圖40所示的流程圖來描述在圖39所示的步驟S22中 執(zhí)行的隨機生成處理。在步驟S41中,特征提取表達式列表生成部件32將表達式循環(huán)M M初始化為l,并且開始表達式循環(huán)。該表達式循環(huán)被重復與包括在特征 提取表達式列表中的特征提取表達式的數目"m"相對應的次數。在步驟S42中,特征提取表達式列表生成部件32確定第M個特征提取表達式(在下文中,也被稱為"特征提取表達式[M")的輸入信號的類型。 在本實施例中,確定輸入信號的類型為表示波形的"wav"。在步驟S43中,特征提取表達式列表生成部件32為要被生成的特征 提M達式[M隨機地確定處理目標軸和一個操作符。在步驟S44中,特征提取表達式列表生成部件32確定直到當前時間 點已經生成的特征提取表達式[M的計算結果是否為標量(第一階值)。當在 步驟S44中確定計算結果不是標量,則處理返回到步驟S43并且重復其后 的處理,以便添加一個操作符。當在步驟S44中確定計算結果為標量時,處理進入步驟S45,其中特 征提取表達式列表生成部件32確定表達式循環(huán)M M是否小于最大值 m。當在步驟S45中確定表達式循環(huán)參數M小于最大值m時,表達式循 環(huán)參數M按1遞增。然后,處理返回到步驟S42并且重復其后的處理。另一方面,當在步驟S45中確定表達式循環(huán)參數M不小于最大值 m(即,等于最大值m)時,退出表達式循環(huán)。然后,處理返回到圖39中的 步驟S22并且進入步驟S24。作為上述處理的結果,生成了第一代的特征提取表達式列表。接下來,將參考圖41所示的流程圖來描述在圖39所示的步驟S23中 執(zhí)行的下一代列表生成處理。在步驟S61中,特征提取表達式列表生成部件32確定使得滿足ms + mx + mm + mr = m(特征提:^達式的總數)的值,其中ms表示由選擇生 成處理生成的特征提取表達式的數目(選擇的數目),mx表示由交叉生成處 理生成的特征4I:^^達式的數目(交叉的數目),mm表示由變異生成處理 生成的特征提取表達式的數目(變異的數目),并且mr表示由隨機生成處 理生成的特征提取表達式的數目(隨機生成的數目)。值的比率可以被預先確定或者該值可以被隨機地確定,使得滿足ms + mx + mm + mr = m。在步驟S62中,特征提^達式列表生成部件32執(zhí)行選擇生成處理, 下面參考圖42對其進行描述。在步驟S63中,特征提取表達式列表生成部件32執(zhí)行交叉生成處理, 下面參考圖43對其進行描述。在步驟S64中,特征提取表達式列表生成部件32執(zhí)行變異生成處理,下面參考圖44對其進行描述。
在步驟S65中,特征提^達式列表生成部件32執(zhí)行隨機生成處理,下面參考圖45對其進行描述。在完成隨機生成處理之后,處理返回到圖39中的步驟S23并且進入步驟S24。
作為上述處理的結果,基于基因搜索技術生成了第二代或更后的特征提取表達式列表。
接下來,將參考圖42所示的流程圖來描述在圖41所示的步驟S62中執(zhí)行的選擇生成處理。
在步驟S91中,特征提^達式列表生成部件32以評估值的降序對當前代特征提取表達式進行排序。
在步驟S92中,特征提取表達式列表生成部件32使用最上面的ms個特征提取表達式作為下一代特征提取表達式。然后,處理返回到圖41中的步驟S62并且ii^步驟S63。
作為該處理的結果,具有較高評估值的特征提取表達式可以被選擇并且可以被拷貝到下一代特征提M達式列表。
接下來,將參考圖43所示的流程圖來描述在圖41所示的步驟S63中執(zhí)行的交叉生成處理。
在步驟S121中,特征"R^達式列表生成部件32將交叉循環(huán)參數MX初始化為1并且開始交叉循環(huán)。交叉循環(huán)被重復與交叉數"mx"相對應的次數。
在步驟S122中,特征提取表達式列表生成部件32從包括在當前代特征提取表達式列表內的所有特征提取表達式中隨機地選擇一個表達式(被稱為"表達式A"),同時分配權重以便有助于選擇具有更高評估值的特征
提:^達式。
在步驟S123中,特征提取表達式列表生成部件32從包括在當前代特征提取表達式列表內的所有特征提取表達式中隨機地選擇一個表達式(被稱為"表達式B"),同時分配權重以便有助于選擇具有更高評估值的特征提取表達式。
在步驟S124中,特征提取表達式列表生成部件32確定表達式B是否不同于表達式A。當在步驟S124中確定表達式B與表達式A相同時,處理返回到步驟S123并且重復其后的處理,以便重新選擇表達式B,直至確定表達式B不同于表達式A。
當在步驟S124中確定表達式B不同于表達式A時,處理進入步驟S125,其中特征提取表達式列表生成部件32交換表達式A和B的部分,從而創(chuàng)建新的特征提^達式。
在這種情況下,特征4^取表達式列表生成部件32組合表達式A和B的部分,使得可以通過計算組合之后的特征提取表達式來從輸入數據獲得標量,也就是說,使得當從開始順序地執(zhí)行計算處理時,在處理軸中不發(fā)生矛盾。
在步驟S126中,特征提取表達式列表生成部件32將在步驟S125中生成的新的特征提取表達式加到下一代特征4^取表達式。
在步驟S127中,特征提取表達式列表生成部件32確定交叉循環(huán)^ltMX是否小于交叉數"mx", "mx,,為交叉循環(huán)^lt MX的最大值。當在步驟S127中確定交叉循環(huán)^ltMX小于交叉數"mx"時,交叉循環(huán)^MX按1遞增。然后,處理返回到步驟S122并且重復其后的處理。另一方面,當在步驟S127中確定交叉循環(huán)^MX不小于交叉數"mx",即等于交叉數"mx"時,退出交叉循環(huán)。于是,處理返回到圖41中的步驟S63并且iS^v步驟S64。
形成交叉循環(huán)的步驟S122到S126中的處理每被執(zhí)行一次,就生成要包括在下一代特征提取表達式列表內的特征提取表達式中的一個特征提取表達式。當完成交叉循環(huán)時,生成了包括在特征提取表達式列表中的特征4I^取表達式的mx個特征^^J^達式.
在這種處理中,選擇當前代特征提取表達式列表中的特征提取表達式,同時分配權重以便有助于選擇具有更高評估值的特征提取表達式,并且所選特征提:^達式被用來執(zhí)行交叉生成處理,以生成包括在下一代特征提取表達式列表中的特征提取表達式。
接下來,將參考圖44所示的流程圖來描述在圖41所示的步驟S64中執(zhí)行的變異生成處理。
在步驟S151中,特征提取表達式列表生成部件32將變異循環(huán)MMM初始化為1并且開始變異循環(huán)。變異循環(huán)被重復與變異數"mm"相對應的次數。
在步驟S152中,特征提取表達式列表生成部件32從包括在當前代特征提取表達式列表內的所有特征提取表達式中隨機地選擇一個表達式(被稱為"表達式A"),同時分配權重以便有助于選擇具有更高評估值的特征提M達式。
在步驟S153中,特征提M達式列表生成部件32通過執(zhí)行例如改變或刪除所選表達式A的一部分或者改變其中的M的處理來引起變異,從而創(chuàng)建新的特征提取表達式。
在這種情況下,通過使用使得可以通過計算改變表達式的一部分之后的特征提取表達式來從輸入數據獲得標量的方法,也就是說,通過使用使得當從開始順序地執(zhí)行計算處理時在處理軸中不發(fā)生矛盾的方法,特征提取表達式列表生成部件32改變表達式的一部分。
在步驟S154中,特征提取表達式列表生成部件32將在步驟S153中生成的新的特征提取表達式加到下一代特征提M達式。
在步驟S155中,特征提取表達式列表生成部件32確定變異循環(huán)^MM是否小于變異數"mm", "mm"為變異循環(huán)^ltMM的最大值。當在步驟S155中確定變異循環(huán)參數MM小于變異數"mm"時,變異循環(huán)參數MM按1遞增。然后,處理返回到步驟S152并且重復其后的處理。另一方面,當在步驟S155中確定變異循環(huán)^ltMM不小于變異數"mm",即等于變異數"mm"時,退出變異循環(huán)。于是,處理返回到圖41中的步驟S64并且ii^步驟S65。
形成變異循環(huán)的步驟S152到S154中的處理每被執(zhí)行一次,就生成要包括在下一代特征提^達式列表內的一個特征提取表達式。當完成變異循環(huán)時,生成了包括在特征提取表達式列表中的特征提取表達式的mm個特征4C取表達式。
在這種處理中,從當前代特征提取表達式列表中選擇當前代特征提取表達式列表中的特征提取表達式,同時分配權重以便有助于選擇具有更高評估值的特征4^取表達式,并且所選特征4I:取表達式被用來執(zhí)行變異生成處理,以生成要包括在下一代特征提取表達式列表中的特征提取表達式。
接下來,將參考圖45所示的流程圖來描述在圖41所示的步驟S65中執(zhí)行的隨機生成處理。
在步驟S181中,特征提取表達式列表生成部件32將隨機生成循環(huán)參數MR初始化為1并且開始隨機生成循環(huán)。隨機生成循環(huán)被重復與包括在特征提取表達式列表中的特征提取表達式數"mr"相對應的次數。
在步驟S182中,特征提取表達式列表生成部件32確定第MR個特征提取表達式(在下文中,也被稱為"特征提取表達式[MR")的輸入信號的類型。在本實施例中,確定輸入信號的類型為表示波形的"wav"。
在步驟S183中,特征提取表達式列表生成部件32為要被生成的特征提M達式[MR隨機地確定處理目標軸和一個^Mt符。
在步驟S184中,特征提取表達式列表生成部件32確定直到當前時間點已經生成的特征提^達式MR的計算結果是否為標量(第一階值)。當在步驟S184中確定計算結果不是標量時,處理返回到步驟S183并且重復其后的處理,以便添加一個操作符。
當在步驟S184中確定計算結果是標量時,處理進入步驟S185,其中特征提M達式列表生成部件32確定隨機生成循環(huán)^ MR是否小于最大值mr。當在步驟S185中確定隨機生成循環(huán)^MR小于最大值mr時,隨機生成循環(huán)MMR按1遞增。然后,處理返回到步驟S182并且重復其后的處理。另一方面,當在步驟S185中確定隨機生成循環(huán)參數MR不小于最大值mr(即,等于最大值mr)時,退出隨機生成循環(huán)。然后,處理返回到圖41中的步驟S65,進一步返回到圖39中的步驟S23并且i^步驟S24。
形成隨機生成循環(huán)的步驟S182到S185中的處理每被執(zhí)行一次,就生成要包括在下一代特征提M達式列表內的一個特征提取表達式。當完成隨機生成循環(huán)時,生成了包括在特征提^達式列表中的特征提取表達式的mr個特征^^^4達式。
在這種處理中,通過隨機生成處理來生成要包括在下一代特征提取表達式列表內的特征提M達式中的一些表達式。
接下來,將參考圖46所示的流程圖來描述在圖38所示的步驟S3中執(zhí)行的特征量計算處理。
在步驟S2U中,特征量計算部件33從特征提取表達式列表生成部件32獲得特征提取表達式列表,將表達式循環(huán)參數M初始化為1,并且開始表達式循環(huán)。表達式循環(huán)被重復與包括在特征提取表達式列表中的特征提取表達式數"m"相對應的次數。
在步驟S212中,特征量計算部件33將數據循環(huán)^lt N初始化為1并且開始數據循環(huán)。數據循環(huán)被重復與由學習數據剪截部件31剪截出的數據D的條數"n"相對應的次數。 在步驟S213中,關于數據DN,特征量計算部件33計算在使用第M個特征提取表達式(特征提^達式[M)時的特征量。
在步驟S214中,特征量計算部件33確定數據循環(huán)M N是否小于最大值n。當在步驟S214中確定數據循環(huán)參數N小于最大值n時,數據循環(huán)^ltN按l遞增。然后,處理返回到步驟S213并且重復其后的處理。
另一方面,當在步驟S214中確定數據循環(huán)參數N不小于最大值n(即,等于最大值n)時,退出數據循環(huán)并且處理ii^步驟S215。
在步驟S215中,特征量計算部件33確定表達式循環(huán)參數M是否小于最大值m。當在步驟S215中確定表達式循環(huán)^M小于最大值m時,表達式循環(huán)參數M按1遞增。然后,處理返回到步驟S212并且重復其后的處理。另一方面,當在步驟S215中確定表達式循環(huán)參數M不小于最大值m(即,等于最大值m)時,退出表達式循環(huán)。然后,處理返回到圖38中的步驟S3并且進入步驟S4。
作為上述處理的結果,計算出使用每個特征提取表達式提取的特征量。
接下來,將參考圖47所示的流程圖來描述在圖38所示的步驟S4中執(zhí)行的機器學習處理。
在步驟S241中,機器學習部件34創(chuàng)建當前代特征^C取表達式1到m的參考狀態(tài)。也就是說,機器學習部件34將所有當前代特征提取表達式1到mi殳成不被4吏用。
在步驟S242中,機器學習部件34將特征量循環(huán)參數M初始化為1并且開始特征量循環(huán)。特征量循環(huán)被重復與包括在特征提取表達式列表中的特征4CM達式數"m"相對應的次數。
在步驟S243中,基于參考狀態(tài)中的特征提取表達式1到m,機器學習部件34確定特征提取表達式的使用組合,其中反轉從第M個特征提取表達式得到的特征量的使用/不使用(在下文中,該使用組合可以被稱為特征提取表達式的使用組合[M)。
在步驟S244中,機器學習部件34針對經反轉的特征提取表達式的使用組合[M生成(估計)異常聲音辨別表達式U。
在步驟S245中,機器學習部件34計算所生成的異常聲音辨別表達式U的評估參考值(AIC)。
在步驟S246中,機器學習部件34確定特征量循環(huán)參數M是否小于最大值m。當在步驟S246中確定特征量循環(huán)參數M小于最大值m時, 特征量循環(huán)MM按1遞增。然后,處理返回到步驟S243并且重復其后 的處理。另一方面,當在步驟S246中確定特征量循環(huán)參數M不小于最大 值m(即,等于最大值m)時,退出特征量循環(huán)并且處理進入步驟S247。
在步驟S247中,機器學習部件34選擇具有最高評估(即,具有最小 評估參考值)的經反轉特征提取表達式的使用組合作為新的參考狀態(tài)。
在步驟S248中,機器學習部件34確定是否所生成的異常聲音辨別表 達式U的評估參考值不再被更新。當在步驟S248中確定評估參考值仍然 被更新時,處理返回到步驟S242并且重復其后的處理。
另一方面,當在步驟S248中確定評估參考值不再被更新時,處理返 回到圖38所示的步驟S4并且進入步驟S5。
現在將參考圖48所示的流程圖來描述由折衷分析部件14執(zhí)行的折衷 分析處理。
在步驟S271中,折衷分析部件14執(zhí)行帕累托最優(yōu)解初始化處理,下 面參考圖49對其進行描述。在初始化處理中,生成多個初始狀態(tài)中的帕 累托最優(yōu)解。
在步驟S272中,折衷分析部件14隨機地選擇初始狀態(tài)中的帕累托最 優(yōu)解中的一個并且通過所選解的變異來生成新的解。例如,關于所選解中 的一至三的特征提取表達式,折衷分析部件14生成隨機改變使用/不使用
的新解。
在步驟S273中,折衷分析部件14計算在使用新解時的總計算時間和 準確度。
其后,在步驟S274到S277中,折衷分析部件14更新帕累托最優(yōu)解。 也就是說,在步驟S274中,折衷分析部件14將新解加到帕累托最優(yōu)解, 將解循環(huán)參數K初始化為1,并且開始解循環(huán)。解循環(huán)被重復與當前* 的帕累托最優(yōu)解的總數"k"相對應的次數。
在步驟S275中,折衷分析部件14確定是否存在具有比第K個帕累 托最優(yōu)解(在下文中,也被稱為"帕累托最優(yōu)解[K1")更高的速度和更高的 準確度的解。當在步驟S275中確定存在具有比帕累托最優(yōu)解[K1更高的速 度和更高的準確度的解時,處理進入步驟S276。在步驟S276中,折衷分 析部件14從帕累托最優(yōu)解中刪除帕累托最優(yōu)解[K。當在步驟S275中確定不存在具有比帕累托最優(yōu)解[K]更高的速度和更 高的準確度的解時,處理i^步驟S277。在步驟S277中,折衷分析部件 14確定解循環(huán)參數K是否小于最大值k。當在步驟S277中確定解循環(huán)參 數K小于最大值k時,解循環(huán)^K按1遞增。然后,處理返回到步驟 S275并且重復其后的處理。
另一方面,當確定解循環(huán)^K不小于最大值k(即,等于最大值k) 時,退出解循環(huán)并且處理ii^步驟S278。
在步驟S278中,折衷分析部件14確定通過執(zhí)行經由從帕累托最優(yōu)解 的變異來生成新解的處理來搜索帕累托最優(yōu)解是否已被重復預定次數。當 在步驟S278中確定搜索帕累托最優(yōu)解的處理尚未被重復預定次數時,處 理返回到步驟S272并且重復其后的處理。
另一方面,當在步驟S278中確定搜索帕累托最優(yōu)解的處理已被重復 預定次數時,處理結束。
接下來,將參考圖49所示的流程圖來描述在圖48所示的步驟S271 中執(zhí)行的帕累托最優(yōu)解初始化處理。
在步驟S301中,折衷分析部件14將特征量循環(huán)參數M初始化為1, 并且開始特征量循環(huán)。特征量循環(huán)被重復與包括在特征提取表達式列表中 的特征4C取表達式數"m"相對應的次數。
在步驟S302中,折衷分析部件14計算為計算第M個特征提取表達 式(在下文中,可以被稱為"特征提取表達式[M")所花費的平均時間(平 均計算時間)以及標注數據相關系數。
在步驟S303中,折衷分析部件14確定特征量循環(huán)參數M是否小于 最大值m。當在步驟S303中確定特征量循環(huán)參數M小于最大值m時, 特征量循環(huán)參數M按1遞增。然后,處理返回到步驟S302并且重復其后 的處理。另一方面,當在步驟S303中確定特征量循環(huán)參數M不小于最大 值m(即,等于最大值m)時,退出特征量循環(huán)并且處理i^步驟S304。
在步驟S304中,在使用中的特征提取表達式當中,折衷分析部件14 設置具有最小相關系數的特征提取表達式,使得其不被使用。
在步驟S305中,折衷分析部件14僅僅使用通過除了被設置為不被使 用的特征提取表達式之外的其余特征提取表達式提取的特征量來執(zhí)行線 性辨別,并且確定新的異常聲音辨別表達式U。在步驟S305中,折衷分 析部件14還計算在所確定的新異常聲音辨別表達式U被用來執(zhí)行異常聲音辨別時的準確度。
在步驟S306中,折衷分析部件14計算在所確定的新異常聲音辨別表 達式U被用來執(zhí)行異常聲音辨別時所花費的時間(總計算時間),并且將所 確定的總計算時間加到候選帕累托最優(yōu)解列表中。
在步驟S307中,折衷分析部件14確定其余特征提取表達式的數目是 否為一。當在步驟S307中確定其余特征^取表達式的數目不為一時,處 理返回到步驟S304并且重復其后的處理。
另一方面,當確定其余特征提取表達式的數目為一時,處理進入步驟 S308,其中折衷分析部件14執(zhí)行用于更新帕累托最優(yōu)解的處理。該帕累 托最優(yōu)解的更新處理與上面描iOL在圖48中示出的步驟S274到S277的 處理相類似,因此在下文中不給出其描述。在步驟S308之后,處理返回 到圖48中的步驟S271并且i^步驟S272。
如上所述,在帕累托最優(yōu)解被初始化之后,搜索更多適當的帕累托最 優(yōu)解,以便執(zhí)行更新。
基于諸如信息處理設備1的當前可用資源狀態(tài)和所要求性能的信息, 使用算法確定部件16從作為由上述折衷分析處理確定且存儲在帕累托最 優(yōu)解存儲部件15中的帕累托最優(yōu)解的算法(異常聲音辨別表達式U)中確定 最佳算法。然后,使用算法確定部件16將所確定的最佳算法提供到自動 異常聲音辨別部件18?;趶氖褂盟惴ù_定部件16提供的算法,自動異 常聲音辨別部件18辨別所輸入的新信號是具有異常聲音還是具有正常聲 音。
因此,信息處理設備1可以提出多個具有評估指標間的折衷關系的算 法,其中評估指標例如為可用資源狀態(tài)(處理速度)和所要求的性能(準確 度)。根據當前的情形,信息處理設備1還可以確定多個具有評估指標間 的折衷關系的算法中的最優(yōu)算法,并且可以使用所確定的算法來執(zhí)行辨 別。
現在將描述使用上述帕累托最優(yōu)解的概念的其他實施例。
圖50是示出根據本發(fā)明另一實施例的自動算法配置系統(tǒng)101的框圖。 與上述實施例中的部件相對應的部件以相同的標號來表示,并且不給出其
描述o
自動算法配置系統(tǒng)101包括教師數據獲得部件131、特征提M達 式列表生成部件32、特征量計算部件132、評估值計算部件133和算法輸出部件134。
教師數據獲得部件131獲得作為教師數據輸入的波形信號(波形數 據)、以及要從該數據提取的目標變量的值,將波形信號提供到特征量計 算部件132,并且還將波形信號的目標變量的值提供到評估值計算部件 133。
例如,如圖51所示,教師數據獲得部件131獲得1條波形數據 到DD,及其目標變量的值作為教師數據,并且將波形數據塊DR到DD,以 及目標變量的值分別提供到特征量計算部件132和評估值計算部件133。
特征量計算部件132對從教師數據獲得部件131提供的波形數據 到DD,執(zhí)行從特征提取表達式列表生成部件32提供的特征提取表達式1 到m的計算。然后,特征量計算部件132將計算結果即波形數據D^到 DD,的特征量提供到評估值計算部件133。
特征量計算部件132計算為計算每個特征提M達式所花費的平均時 間,并且將所計算的平均時間提供到評估值計算部件133。
圖52示出由特征量計算部件132計算出的且被提供到評估值計算部 件133的特征量和平均時間的示例。
評估值計算部件133生成候選解,即候選帕累托最優(yōu)解。
首先,評估值計算部件133隨機地確定是否^f吏用從特征^l:取表達式 1到m得到的特征量中的每個。當已經*了一個或更多個帕累托最優(yōu)解 時,評估值計算部件133可以通過從所保存的帕累托最優(yōu)解中隨機地選擇 一個解并且(通過改變任意特征提取表達式的使用/不使用)引起所選解的 變異,確定是否要使用從特征提取表達式1到m中的每個得到的特征量。
圖53A示出隨機地確定特征提:^達式1到m中的每個的特征量的 4吏用/不使用的示例,并且圖53B示出通過引起從帕累托最優(yōu)解選擇的解 的變異來確定從特征提取表達式1到m中的每個得到的特征量的使用/不 使用的示例。
接下來,評估值計算部件133基于所確定的m個特征提取表達式的 使用組合而生成(估計)信息估計表達式(其是候選解)。也就是說,如圖54 所示,評估值計算部件133將波形數據到DD,的特征量與目標變 相 關聯(lián),其中該特征量和目標變量從特征量計算部件132提供,并且將關聯(lián) 值分配給與表達式(l)相類似的信息估計表達式,以確定使得每個目標變量 的估計誤差的均方誤差變?yōu)樽钚〉木€性組合系數l^到1v以及截距b。。關于速度和亮度的目標變量兩者來創(chuàng)建信息估計表達式。
其后,使用表達式(2),評估值計算部件133為每個目標變量計算用于 評估所生成的信息估計表達式的評估參考值(數量參考)。
評估值計算部件133還計算在所生成的信息估計表達式被用來計算目 標變量時所花費的總計算時間。更具體地i兌,如圖55所示,在為計算特 征提取表達式所花費的平均時間(該平均時間從特征量計算部件132提供)
生成的信息估計表達式的總計算時間。在圖55所示的示例中,由于特征 提M達式3未被使用,因此特征"R:^達式3的平均時間(0.31118)不包括 在總計算時間內。
圖56示出通過對作為候選解的信息估計表達式執(zhí)行計算而獲得的速 度評估參考值、亮度評估參考值、以及總計算時間。
接下來,評估值計算部件133將候選解的速度評估參考值、亮度評估 參考值和總計算時間,與當前M的帕累托最優(yōu)解的速度評估參考值、亮 度評估參考值和總計算時間相比較,并且刪除非帕累托最優(yōu)解。
圖57示出候選解與當前M的p個帕累托最優(yōu)解相比較的示例。
在圖57所示的示例中,在速度評估參考值、亮度評估參考值和總計 算時間的所有評估指標上,帕累托最優(yōu)解3劣于候選解,因此將其作為非 帕累托最優(yōu)解從帕累托最優(yōu)解中刪除。
對于每個帕累托最優(yōu)解或候選解,評估值計算部件133保存表示每個 特征提M達式的使用/不使用的信息、每個目標變量(信息類型)的信息估 計表達式的^t(線性組合系數l^到、以及截距b。)、每個目標變量(信息 類型)的評估參考值、以及總計算時間。
接下來,通過使用其余的帕累托最優(yōu)解,評估值計算部件133確定特
征4^M達式的評估值。確定特征提M達式的評估值的基4Ma念與上述
實施例中的相類似。在本實施例中,具體地i兌,由于存在多個目標變量(信 息類型)和多個帕累托最優(yōu)解(信息估計表達式),因此評估值計算部件133 確定通過對帕累托最優(yōu)解的第i個特征量關于所有目標變量(信息類型)的 貢獻率Ci求和而獲得的值。
也就是說,使用帕累托最優(yōu)解o (o = 1到p)的特征量"Xi"關于第j 個目標變量(信息類型)Tj (j = 1到k)的貢獻率C(o,Xi,Tj),在上面提及的表達式(3)中的貢獻率Q可以被改寫為
<formula>formula see original document page 35</formula>
特征提取表達式的評估值可以根據表達式(5)中的SUM一Ci來計算, 其中關于所有帕累托最優(yōu)解的所有目標變量對貢獻率C(o,Xi,Tj)進行求 和。
<formula>formula see original document page 35</formula>
評估值計算部件133計算特征提取表達式的評估值SUM一Ci (由表達 式(5)表示),并且將計算結果提供到特征提取表達式列表生成ip件32。
當通過執(zhí)行用于更新帕累托最優(yōu)解和計算每個特征提取表達式的評 估值的處理預定次數而達到預定條件時,評估值計算部件133將最終保留 的帕累托最優(yōu)解提供到算法輸出部件134。
取決于重點是放在速度和亮度的準確度上還是放在所要求的處理速 度(總計算時間)上,算法輸出部件134從所提供的帕累托最優(yōu)解中選擇最 佳算法。然后,算法輸出部件134輸出所選算法??梢圆鹏迵缬脩糁甘?來確定要選擇哪個算法。
接下來,將參考圖58所示的流程圖來描述由特征提取表達式列表生 成部件32、特征量計算部件132和評估值計算部件133執(zhí)行的帕累托最優(yōu) 解搜索處理。
首先,在步驟S401中,基于當前代特征提取表達式1到m的評估值 (該評估值從評估值計算部件133提供),特征提取表達式列表生成部件32 執(zhí)行用于生成下一代特征提取表達式1到m(特征提取表達式列表)的特征 提取表達式列表生成處理。該處理與在上述步驟S2中且在圖38中示出的 處理相類似,并且由此在下文中不給出對其的詳細描述。
在步驟S402中,特征量計算部件132執(zhí)行特征量計算處理。也就是 說,關于從教師數據獲得部件131提供的波形數據DDi到DD,,特征量計 算部件132計算從每個特征提取表達式得到的特征量、以及為計算每個特 征提M達式所花費的平均時間。下面參考圖59所示的流程圖來描述特 征量計算處理的細節(jié)。在步驟S403中,評估值計算部件133執(zhí)行評估值計算處理。也就是 說,評估值計算部件133生成作為候選帕累托解的候選解,將候選解與當 前M的帕累托最優(yōu)解相比較,執(zhí)行包括刪除非帕累托解的帕累托最優(yōu)解 更新,并且基于其余的帕累托最優(yōu)解而計算特征提取表達式的評估值。下 面參考圖61所示的流程圖來描述評估值計算處理的細節(jié)。
在步驟S404中,評估值計算部件133確定是否滿足完成條件。更具 體地說,例如,當上述步驟S401到S403中的處理被重復執(zhí)行預設次數時 或者當檢測到用于停止的操作時,評估值計算部件133確定滿足完成條件。
當在步驟S404中確定不滿足完成條件時,處理返回到步驟S401并且 重復其后的處理。
另一方面,當在步驟S404中確定滿足完成條件時,處理進入步驟 S405。在步驟S405中,評估值計算部件133將最后代特征提^達式和 信息估計表達式的帕累托最優(yōu)解輸出到算法輸出部件134 ,從而結束處理。
例如,取決于重點是放在速度和亮度的準確度上還是放在處理速度 (總計算時間)上,算法輸出部件134適當時在從評估值計算部件133提供 的帕累托最優(yōu)解中選擇最佳算法。然后,算法輸出部件134輸出所選算法。
接下來,將參考圖59所示的流程圖來描述在圖58所示的步驟S402 中執(zhí)行的特征量計算處理。
在步驟S411中,特征量計算部件132從特征4^取表達式列表生成部 件32獲得特征提取表達式列表,將表達式循環(huán)^ M初始化為1并且開 始表達式循環(huán)。表達式循環(huán)被重復與包括在特征提取表達式列表中的特征 提取表達式數"m"相對應的次數。
在步驟S412中,特征量計算部件132將數據循環(huán)參數L初始化為1 并且開始數據循環(huán)。數據循環(huán)被重復與由教師數據獲得部件131獲得的波 形數據DD的條數"1"相對應的次數。
在步驟S413中,特征量計算部件132計算在關于波形數據DDl使用 第M個特征提M達式(特征提M達式[M)時的特征量,并且M該計 算所花費的時間。
在步驟S414中,特征量計算部件132確定數據循環(huán)參數L是否小于 最大值l。當在步驟S414中確定數據循環(huán)參數L小于最大值1時,數據循 環(huán)^L按1遞增。然后,處理返回到步驟S413并且重復其后的處理。另一方面,當在步驟S414中確定數據循環(huán)^L不小于最大值1時, (即,等于最大值l),退出數據循環(huán)并且處理進入步驟S415。
在步驟S415中,特征量計算部件132計算為計算特征提取表達式[M
所花費的平均時間。也就是說,特征量計算部件132為波形數據D"到 DD,計算特征提取表達式[M的計算時間的平均時間,其中計算時間在步 驟S413中被計算和保存。
在步驟S416中,特征量計算部件132確定表達式循環(huán)參數M是否小 于最大值m。當在步驟S416中確定表達式循環(huán)^M小于最大值m時, 表達式循環(huán)參數M按1遞增。然后,處理返回到步驟S412并且重復其后 的處理。另一方面,當在步驟S416中確定表達式循環(huán)參數M不小于最大 值m時,(即,等于最大值m),退出表達式循環(huán)。然后,處理返回到圖 58中的步驟S402并且進入步驟S403。
接下來,將參考圖60所示的流程圖來描述在圖58所示的步驟S403 中執(zhí)行的評估值計算處理。
在步驟S431中,評估值計算部件133確定是否使用從特征提取表達 式1到m中的每個得到的特征量。評估值計算部件133可以通過改變從 所保存的帕累托最優(yōu)解中隨機地選擇的 一個選擇項的使用/不使用(通過一 個選擇項的變異),確定是否使用從特征提取表達式1到m中的每個得到 的特征量。然而,當第一次執(zhí)行步驟S431中的處理時,由于沒有保存帕 累托最優(yōu)解,因此隨fe^確定特征量的使用/不使用。
在步驟S432中,評估值計算部件133將目標變量循環(huán)^lt K初始化 為1并且開始數據循環(huán)。目標變量循環(huán)^:重復與用于目標變量的信息類型 的數目"k"相對應的次數。
在步驟S433中,評估值計算部件133生成(估計)在步驟S431中確定 的m個特征提取表達式的使用組合被使用時的信息估計表達式,其作為 候選解并且用于估計與目標變量K相對應的信息量。
在步驟S434中,使用上面提及的表達式(2),評估值計算部件133計 算用于評估信息估計表達式的評估參考值,其中信息估計表達式用于估計 與目標變量K相對應的信息量。
在步驟S435中,評估值計算部件133確定目標變量循環(huán)參數K是否 小于最大值k。當在步驟S435中確定目標變量循環(huán)參數K小于最大值k 時,目標變量循環(huán)MK按1遞增。然后,處理返回到步驟S433并且重復其后的處理。
另一方面,當在步驟S435中確定目標變量循環(huán)MK不小于最大值 k時,(即,等于最大值k),退出目標變量循環(huán)并且處理i^步驟S436。
在步驟S436中,基于從特征量計算部件132提供的每個特征提取表 達式的平均時間,評估值計算部件133計算在所生成的信息估計表達式被 用來計算目標變量時所花費的總計算時間。
在步驟S437到S440中,評估值計算部件133更新帕累托最優(yōu)解。也 就是說,在步驟S437中,評估值計算部件133將候選解加到帕累托最優(yōu) 解,將解循環(huán)參數o初始化為1,并且開始解循環(huán)。解循環(huán)被重復與當前 保存的包括候選解(一個或多個)的帕累托最優(yōu)解的總數"p"相對應的次數。
在步驟S438中,評估值計算部件133確定是否存在具有比第o個帕 累托最優(yōu)解(在下文中,也被稱為"帕累托最優(yōu)解[o")更高速度和更高準 確度的解。當在步驟S438中確定存在具有比帕累托最優(yōu)解[o更高速度和 更高準確度的解時,處理進入步驟S439。在步驟S439中,評估值計算部 件133從帕累托最優(yōu)解中刪除帕累托最優(yōu)解[o。
另一方面,當在步驟S438中確定不存在具有比帕累托最優(yōu)解[o]更高 速度和更高準確度的解時,處理進入步驟S440。在步驟S440中,評估值 計算部件133確定解循環(huán)參數o是否小于最大值p。當在步驟S438中確 定解循環(huán)^o小于最大值p時,解循環(huán)^lto按l遞增。然后,處理返 回到步驟S438并且重復其后的處理。
另一方面,當在步驟S438中確定解循環(huán)參數o不小于最大值p時,(即, 等于最大值p),退出解循環(huán)并且處理ii^步驟S441。
在步驟S441中,評估值計算部件133確定生成候選解并且搜索帕累 托最優(yōu)解的處理是否被重復預定次數。當在步驟S441中確定搜索帕累托 最優(yōu)解的處理尚未被重復預定次數時,處理返回到步驟S431并且重復其 后的處理。
另一方面,當在步驟S441中確定搜索帕累托最優(yōu)解的處理已被重復 預定次數時,處理進入步驟S442。在步驟S442中,使用其余的帕累托最 優(yōu)解,評估值計算部件133執(zhí)行用于確定特征提取表達式的評估值的評估 值確定處理。
圖61是示出在圖60所示的步驟S442中的評估值確定處理的細節(jié)的 流程圖。首先,在步驟S461中,評估值計算部件133將特征量循環(huán)^ i初 始化為1并且開始特征量循環(huán)。特征量循環(huán)被重復與包括在特征提M達 式列表中的特征提取表達式數"m"相對應的次數。
在步驟S462中,評估值計算部件133重置第i個特征提取表達式的 評估值SUM一Q,該評估值由上面提及的表達式(5)給出。
在步驟S463中,評估值計算部件133將解循環(huán)參數o初始化為1并 且開始解循環(huán)。解循環(huán)被重復與當前保存的帕累托最優(yōu)解的總數"p"相 對應的次數。
在步驟S464中,評估值計算部件133將目標變量循環(huán)^lt j初始化 為1并且開始目標變量循環(huán)。目標變量循環(huán)被重復與用于目標變量的信息 類型的數目"k"相對應的次數。
在步驟S465中,評估值計算部件133確定帕累托最優(yōu)解o的第i個 特征量"Xi"關于第j個目標變量Tj的貢獻率C(o,Xi,Tj),并且將所確定 的貢獻率加到評估值SUM一Ci。
在步驟S466中,評估值計算部件133確定目標變量循環(huán)M j是否 小于最大值k。當在步驟S466中確定目標變量循環(huán)M j小于最大值k 時,目標變量循環(huán)^ltj按l遞增。然后,處理返回到步驟S465并且重 復其后的處理。
另一方面,當在步驟S466中確定目標變量循環(huán)參數j不小于最大值k 時,(即,等于最大值k),退出目標變量循環(huán)并且處理ii^步驟S467。
在步驟S467中,評估值計算部件133確定解循環(huán)參數o是否小于最 大值p。當在步驟S467中確定解循環(huán)參數o小于最大值p時,解循環(huán)參 數o按l遞增。然后,處理返回到步驟S464并且重復其后的處理。
另一方面,當在步驟S467中確定解循環(huán)^o不小于最大值p時,(即, 等于最大值p),退出解循環(huán)并且處理ii^步驟S468。
在步驟S468中,評估值計算部件133確定特征量循環(huán)參數i是否小 于最大值m。當在步驟S468中確定特征量循環(huán)參數i小于最大值m時, 特征量循環(huán)Mi按l遞增。然后,處理返回到步驟S462并且重復其后 的處理。
另一方面,當在步驟S468中確定特征量循環(huán)參數i不小于最大 m 時,(即,等于最大值m),退出特征量循環(huán)。然后,處理返回到圖60中的步驟S442,進一步返回到圖58中的步驟S403,并且處理進入圖58中的 步驟S404。
如上所述,自動算法配置系統(tǒng)101通過隨機地確定從特征提取表達式 列表生成部件32所提供的提^達式1到m中的每個得到的特征量的使 用/不使用,創(chuàng)建單個算法作為初始狀態(tài)中的帕累托最優(yōu)解?;诔跏紶顟B(tài) 中的帕累托最優(yōu)解,自動算法配置系統(tǒng)101通過隨機地確定從特征提M 達式1到m中的每個得到的特征量的使用/不使用、或通過經由從所M 的帕累托最優(yōu)解隨機選擇的一個解的變異而確定從特征提^^達式1到m 中的每個得到的特征量的使用/不使用,創(chuàng)建帕累托最優(yōu)解的候選解。然后, 自動算法配置系統(tǒng)101將候選解的評估參考值和總計算時間與作為候選解 保存的帕累托最優(yōu)解的評估參考值和總計算時間相比較,從而確定多個帕 累托最優(yōu)解,其中要放在目標變量的準確度或處理速度上的重點的程度互 不相同。
通過該配置,對于輸入新信號的速度和亮度量的提取,自動算法配置 系統(tǒng)101可以提出多個作為帕累托最優(yōu)解的信息提取算法,其中要放在目 標變量的準確度或處理速度上的重點的程度互不相同。也就是說,自動算 法配置系統(tǒng)101可以提出多個具有評估指標間的折衷關系的算法。
然后,用戶可以根據每個目標指標的準確度或處理速度的重要程度來 選捧最佳算法,并且可以獲得目標變量的提取結果。
在圖1所示的信息處理設備1中,自動算法配置部件13和折衷分析 部件14可以被替換成這樣的信息提取塊,其包括設置在自動算法配置系 統(tǒng)101中的教師數據獲得部件131、特征量計算部件132、評估值計算部 件133和特征提^達式列表生成部件32。在這種情況下,信息處理設備 l可以用作用于執(zhí)行信息提取處理的設備,以便從輸入的新信號提^il度 和亮度量。
在相關技術的自動算法配置技術中,僅僅最高性能(最高準確度)的算 法被確定。因此,與手動配置算法的情況不同,配置能夠在滿足要求的同 時可以以最小資源量和所期望的準確度來執(zhí)行處理的算法是困難的。然 而,根據本發(fā)明實施例的信息處理設備l和自動算法配置系統(tǒng)101可以生 成可執(zhí)行這種處理的算法。
上迷系列處理可以通過硬件或軟件來執(zhí)行。在這種情況下,上述處理 可以由如圖62所示的計算機200來執(zhí)行。在圖62中,CPU(中央處理單元)201根據存儲在ROM(只讀存儲 器)202中的程序或從存儲部件208裝栽到RAM(隨;lM!"取存儲器)203的程 序,執(zhí)行各種類型的處理。RAM 203適當時存儲在CPU201執(zhí)行各種類 型的處理等時使用的數據等。
CPU201、 ROM202和RAM203通過內部總線204相互連接。內部 總線204還連接到輸V輸出接口 205。
輸入部件206、輸出部件207、存儲部件208和通信部件209也連接 到輸V輸出接口 205。輸入部件206包括例如^tit和鼠標。輸出部件207 包括例如揚聲器、以及諸如CRT(陰極射線管)顯示器或LCD(液晶顯示器) 的顯示器。存儲部件208包括例如硬盤。通信部件209包括調制解調器、 終端適配器等等。通信部件209通過包括電話線或CATV(有線電視)網絡 的網絡來執(zhí)行通信處理。
驅動器210也可以連接到輸^/輸出接口 205,其中諸如磁盤、光盤、 磁光盤或半導體存儲器的可拆卸介質適當時附連到輸/V輸出接口 205。適 當時,將從可拆卸介質221讀取的計算機程序安裝到存儲部件208。
行處理的程序,或者可以是并^地或在調用時執(zhí)行處理的程序。
在這里,流程圖所示的步驟不僅包括根據所述順序而按時間順序執(zhí)行 的處理,還包括并發(fā)地或單獨地執(zhí)行而不必按時間順序進行的處理。
本申請包含與2008年7月14日向日本專利局提交的日本優(yōu)先權專利 申請JP 2008-183019中公開的主題內斜目關的主題內容,在此通過引用將 其全文合并于此。
本發(fā)明的實施例不限于上述實施例,并且可以對其進行各種變化而不 背離本發(fā)明的精神和范圍。
本領域的技術人員應當理解,可以在所附權利要求或其等同方案的范 圍內根據設計需要或其它因素進行各種修改、組合、子組合和變更。
權利要求
1.一種信息處理設備,其包括算法配置裝置,用于通過使用基因搜索技術來配置用于對輸入信號執(zhí)行辨別的算法;以及折衷分析裝置,用于通過基于所述算法執(zhí)行折衷分析來確定所述算法關于評估指標的帕累托最優(yōu)解。
2. 根據權利要求1所述的信息處理設備,還包括最佳算法確定裝置, 用于在所述帕累托最優(yōu)解當中確定與所述評估指標的要求條件相匹配的 最佳算法。
3. 根據權利要求1所述的信息處理設備,其中由所述算法配置裝置 配置的所述算法具有特征提^達式、以及作為所述特征提取表達式的組 合的信息估計表達式。
4. 根據權利要求3所述的信息處理設備,其中所述折衷分析裝置通 過使用具有不同數目的特征提取表達式的算法來生成初始狀態(tài)中的帕累 托最優(yōu)解,其中所述算法通過從由所述算法配置裝置配置的所述算法中逐 個地刪除所述特征提^達式來創(chuàng)建。
5. 根據權利要求3所述的信息處理設備,其中所述折衷分析裝置使 用由所述算法配置裝置配置的所述算法,作為初始狀態(tài)中的帕累托最優(yōu) 解。
6. 根據權利要求4所述的信息處理設備,其中所述折衷分析裝置通 過隨機地改變所述初始狀態(tài)的帕累托最優(yōu)解中的每個特征提取表達式的 使用或不使用,更新所述帕累托最優(yōu)解。
7. 根據權利要求2所述的信息處理設備,其中所述最佳算法確定裝 置基于所要求的處理時間和準確度而在所述帕累托最優(yōu)解當中確定所述 最佳算法。
8. 根據權利要求3所述的信息處理設備,還包括評估值計算裝置, 用于確定所述信息估計表達式中的所述特征提取表達式的評估值,并且所述算法配置裝置基于所確定的所述特征提取表達式的評估值而更 新所述信息估計表達式中的所述特征提M達式。
9. 根據權利要求8所述的信息處理設備,其中當所述算法配置裝置配置多個信息估計表達式作為算法時,所述信息估計表達式中的相同特征^:取表達式的貢獻率的總值被用作相應特征提:^達式的評估值。
10. —種用于信息處理設備的信息處理方法,其中所述信息處理設備 包括算法配置裝置,用于配置算法;以及折衷分析裝置,用于確定所述 算法的帕累托最優(yōu)解,所述信息處理方法包括以下步驟通迚基因搜索技術來配置用于對輸入信號執(zhí)行辨別的所述算法;以及通過基于所述算法執(zhí)行折衷分析來確定所述算法關于評估指標的帕 累托最優(yōu)解。
11. 一種使計算機用作以下裝置的程序算法配置裝置,用于通過使用基因搜索技術來配置用于對輸入信號執(zhí) 行辨別的算法;以及折衷分析裝置,用于通迚基于所述算法執(zhí)行折衷分析來確定所述算法 關于評估指標的帕累托最優(yōu)解。
12. —種信息處理設備,其包括算法配置部件,其通過使用基因搜索技術來配置用于對輸入信號執(zhí)行 辨別的算法;以及折衷分析部件,其通過基于所述算法執(zhí)行折衷分析來確定所述算法關 于評估指標的帕累托最優(yōu)解。
13. 根據權利要求12所述的信息處理設備,還包括最佳算法確定部 件,其在所述帕累托最優(yōu)解當中確定與所述評估指標的要求4Ht相匹配的 最佳算法。
14. 根據權利要求12所述的信息處理設備,其中由所述算法配置部 件配置的所述算法具有特征提^達式、以及作為所述特征提取表達式的 組合的信息估計表達式。
15. 根據權利要求14所述的信息處理設備,其中所述折衷分析部件累托最優(yōu)解,其中所述算法通過從由所述算法配置裝置配置的所述算法中 逐個地刪除所述特征4C取表達式來創(chuàng)建。
16.根據權利要求14所述的信息處理設備,其中所述折衷分析部件 使用由所述算法配置裝置配置的所述算法,作為初始狀態(tài)中的帕累托最優(yōu)解。
17. 根據權利要求15所述的信息處理設備,其中所述折衷分析部件 通過隨機地改變所述初始狀態(tài)的帕累托最優(yōu)解中的每個特征提取表達式 的使用或不使用,更新所述帕累托最優(yōu)解。
18. 根據權利要求13所述的信息處理設備,其中所述最佳算法確定 部件基于所要求的處理時間和準確度而在所述帕累托最優(yōu)解當中確定所 述最佳算法。
19. 根據權利要求14所述的信息處理設備,還包括評估值計算部件, 其確定所述信息估計表達式中的所述特M取表達式的評估值,并且所述算法配置部件基于所確定的所述特征提取表達式的評估值而更 新所述信息估計表達式中的所述特征提M達式。
20. 根據權利要求19所述的信息處理設備,其中當所述算法配置部 件配置多個信息估計表達式作為算法時,所述信息估計表達式中的相同特 征提取表達式的貢獻率的總值被用作相應特征提:^達式的評估值。
21. —種用于信息處理設備的信息處理方法,其中所述信息處理設備 包括算法配置部件,其配置算法;以及折衷分析部件,其確定所述算法 的帕累托最優(yōu)解,所述信息處理方法包括以下步驟通過基因搜索技術來配置用于對輸入信號執(zhí)行辨別的所述算法;以及通過基于所述算法執(zhí)行折衷分析來確定所述算法關于評估指標的帕 累托最優(yōu)解。
22. —種使計算機用作以下部件的程序算法配置部件,其通過使用基因搜索技術來配置用于對輸入信號執(zhí)行 辨別的算法;以及折衷分析部件,其通il基于所述算法執(zhí)行折衷分析來確定所述算法關 于評估指標的帕累托最優(yōu)解。
全文摘要
本發(fā)明公開了一種信息處理設備、信息處理方法以及程序,其中該信息處理設備包括算法配置部件,其通過使用基因搜索技術來配置用于對輸入信號執(zhí)行辨別的算法;以及折衷分析部件,其通過基于算法執(zhí)行折衷分析來確定算法關于評估指標的帕累托最優(yōu)解。
文檔編號G10L11/00GK101630508SQ20091015949
公開日2010年1月20日 申請日期2009年7月14日 優(yōu)先權日2008年7月14日
發(fā)明者小林由幸 申請人:索尼株式會社