專利名稱::信息處理裝置、信息處理方法及其記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及信息處理裝置、信息處理方法及其記錄介質(zhì),更具體地說,涉及這樣的信息處理裝置、信息處理方法及記錄介質(zhì),使得即使沒有提供大容量詞典也能夠比如針對許多單詞計(jì)算單詞之間的相似性,以及即使沒有提供復(fù)雜的語法規(guī)則等也能夠?qū)卧~的集合轉(zhuǎn)換成構(gòu)成適當(dāng)含義的單詞排列(單詞串)。
背景技術(shù):
:從含義上考慮單詞間的相似性(類似性)在自然語言處理技術(shù)中用于各種使用目的。也就是說,比如,作為一種翻譯處理的技術(shù),其方法是事先準(zhǔn)備大量雙語對照例句,從這些雙語對照例句中搜索與輸入的句子最相似的例句并修正所搜索的雙語對照例句,生成將輸入的句子翻譯后的翻譯句子。在該種方法中,根據(jù)構(gòu)成輸入句子的各個(gè)單詞和構(gòu)成對應(yīng)于這些單詞的雙語對照例句的單詞之間的相似性(單詞相似性),計(jì)算輸入句子與雙語對照例句的相似性。作為計(jì)算單詞相似性的方法,公知的方法是使用樹狀或網(wǎng)絡(luò)狀詞庫的方法,和/或使用單詞在句子中的共同出現(xiàn)信息的方法。在使用詞庫的方法中,比如,在詞庫中確定構(gòu)成連接各節(jié)點(diǎn)的最短路徑的弧線的數(shù)目,這些節(jié)點(diǎn)分別對應(yīng)于計(jì)算其間單詞相似性的相應(yīng)的兩個(gè)單詞。該弧線數(shù)目的倒數(shù)導(dǎo)致單詞相似性。另外,在使用共同出現(xiàn)信息的方法中,針對大量的句子,登記在這些句子中顯現(xiàn)的單詞的共同出現(xiàn)信息。因此,根據(jù)從該共同出現(xiàn)信息中獲得的統(tǒng)計(jì)數(shù)量(關(guān)于嘗試計(jì)算其間單詞相似性的兩個(gè)單詞的容易共同出現(xiàn)的單詞的統(tǒng)計(jì)數(shù)量)確定單詞相似性。應(yīng)該指出的是,有關(guān)使用詞庫計(jì)算單詞相似性的方法,其詳細(xì)描述比如見D-II,Vol.J77-D-II,No.3,pp.557-565,1994,飯?zhí)锶省跋⒄Z介詞詞組修正目標(biāo)的初始使用的模糊性”(D-II,Vol.J77-D-II,No.3,pp.557-565,1994,JinIida“CancellationofuseinitiativeambiguityofmodificationdestinationofEnglishprepositionalphase”)BulletinofElectronicInformationSociety,而有關(guān)使用共同出現(xiàn)信息計(jì)算單詞相似性的方法,其詳細(xì)描述比如見DonaldHindle的“根據(jù)謂語變數(shù)結(jié)構(gòu)對名詞分類”,計(jì)算語言學(xué)聯(lián)合會(huì)年會(huì)論文集,pp.268-275,1990(DonaldHindle,“Nounclassificationfrompredicate-argumentstructure”,ProceedingsofAnnualmeetingoftheAssociationforComputationalLinguistics,pp.268-275,1990)等。同時(shí),在使用詞庫或共同出現(xiàn)信息的方法中,對于在詞庫中沒有登記的單詞或在共同出現(xiàn)信息中沒有登記的單詞(下文中在需要時(shí)稱作未登記的單詞),不能計(jì)算單詞的相似性。因此,在使用詞庫或共同出現(xiàn)信息執(zhí)行語言處理的語言處理系統(tǒng)中試圖實(shí)現(xiàn)豐富的語言能力時(shí),必須使用大量的學(xué)習(xí)樣本進(jìn)行學(xué)習(xí),以生成其中登記了詞庫或共同出現(xiàn)信息的詞典。但是,在語言處理系統(tǒng)中,希望只通過少量的用于學(xué)習(xí)的樣本進(jìn)行靈活地和高效地學(xué)習(xí),以便實(shí)現(xiàn)豐富的語言能力。為了實(shí)現(xiàn)此目的,對于未登記的單詞,也需要計(jì)算那些未登記的單詞和學(xué)習(xí)的單詞之間的單詞相似性,并且還必須計(jì)算包括未登記的單詞的單詞串和從學(xué)習(xí)的語法規(guī)則中獲得的單詞串之間的相似性(單詞串相似性)。另一方面,比如1998年巖波書店出版的巖波講座、語言科學(xué)6、語法生成、第4章中福井直樹的“以說明性的語言理論為目標(biāo)的最小模型的改進(jìn)”(NaokiFukui,“Developmentofminimummodel-orientedtoexplanatorytheoryoflanguage”Iwanamilecture,Scienceoflanguage6generationgrammar,Chapter4,Iwanamibookstore,1998)等,描述了人類將多個(gè)單詞的集合以符合語法的適當(dāng)順序排列的活動(dòng)是人類的語言能力中的思維或心理活動(dòng)的根本,并且闡明該心理功能的機(jī)理在理論語言學(xué)中被作為重要的研究課題對待。另外,實(shí)現(xiàn)能生成與人類進(jìn)行的單詞排列相似的單詞排列的功能,也是在開發(fā)實(shí)現(xiàn)(仿真)(整個(gè)或部分)人類語言功能的系統(tǒng)時(shí)所期望的。但是,在目前的情況下,在語言處理系統(tǒng)中學(xué)習(xí)的初期階段,即語法規(guī)則學(xué)習(xí)不充分或欲處理的單詞沒有作為學(xué)習(xí)樣本給出的階段,不可能計(jì)算單詞相似性和單詞串相似性。因此,很難獲得合適的單詞排列(單詞串)。此外,在利用不充分語法規(guī)則獲得的單詞串只能輸出的情況下,系統(tǒng)的語言表現(xiàn)能力將受到限制。鑒于以上事實(shí),需要這樣一種技術(shù),即對于沒有在通過學(xué)習(xí)獲得的詞典中登記的單詞,也能夠計(jì)算未登記的單詞和在詞典中登記的單詞(下文中需要時(shí)稱作登記的單詞)之間的單詞相似性,并且根據(jù)該單詞相似性能使單詞成串(clustering)以使學(xué)習(xí)的語法更具有通用性。發(fā)明的公開考慮到上述現(xiàn)狀,本發(fā)明已經(jīng)進(jìn)行并且試圖在即使沒有提供大容量詞典時(shí)也能夠針對許多單詞計(jì)算單詞之間的相似性,以及即使沒有提供復(fù)雜的語法規(guī)則等時(shí)也能夠?qū)卧~的集合轉(zhuǎn)換成具有適當(dāng)含義的單詞串。根據(jù)本發(fā)明的信息處理裝置包括輸入部分,用于輸入單詞連同表示單詞表達(dá)的事物(matter)的概念符號(hào)函數(shù)(conceptnotationfunction),以及單詞相似性計(jì)算部分,用于計(jì)算單詞和登記的單詞之間的相似性的單詞相似性。在詞典中,可以存儲(chǔ)登記的單詞連同關(guān)于該登記的單詞的概念符號(hào)函數(shù)。在根據(jù)本發(fā)明的信息處理裝置中,可以進(jìn)一步包括存儲(chǔ)詞典的詞典存儲(chǔ)器部分。概念符號(hào)函數(shù)可以是表示從單詞表達(dá)的事物中獲得的信息的函數(shù)。另外,概念符號(hào)函數(shù)可以是表示從用于感受由單詞表達(dá)的事物給出的刺激的傳感器部分的輸出中獲得的信息的函數(shù)。傳感器部分可以是將光或聲信號(hào)轉(zhuǎn)換為電信號(hào)的器件、觸覺傳感器、溫度傳感器或加速度傳感器。在這種情況下,概念符號(hào)函數(shù)可以是通過傳感器部分表示通過探測單詞表達(dá)的事物而獲得的參數(shù)的函數(shù)。概念符號(hào)函數(shù)可以是概率密度函數(shù)或離散概率分布函數(shù)。單詞相似性計(jì)算部分根據(jù)單詞和登記的單詞的概念符號(hào)函數(shù)之間的Bhattacharyya距離或Kullback散度(divergence)計(jì)算該單詞和登記的單詞之間的單詞相似性。在輸入部分中,將作為一組單詞的單詞集合連同有關(guān)各單詞的概念符號(hào)函數(shù)輸入。詞典存儲(chǔ)其中排列多個(gè)登記的單詞的登記單詞串的集合連同有關(guān)各登記的單詞的概念符號(hào)函數(shù)。在這種情況下,信息處理裝置可以進(jìn)一步包括單詞串生成部分,用于生成其中排列構(gòu)成單詞集合的單詞的單詞串;單詞串相似性計(jì)算部分,用于從構(gòu)成單詞串的各單詞和相應(yīng)于這些單詞的構(gòu)成登記的單詞串的登記單詞之間的單詞相似性、計(jì)算單詞串和登記的單詞串之間的單詞串相似性;以及輸出部分,用于根據(jù)單詞串相似性輸出其中將構(gòu)成單詞集合的單詞按預(yù)定順序排列的單詞串。根據(jù)本發(fā)明的一種信息處理方法包括輸入步驟,將單詞連同作為用于表示單詞表達(dá)的事物的函數(shù)的概念符號(hào)函數(shù)輸入,以及單詞相似性計(jì)算步驟,根據(jù)概念符號(hào)函數(shù)計(jì)算單詞和登記的單詞之間的相似性的單詞相似性。根據(jù)本發(fā)明的一種記錄介質(zhì),其記錄的程序包括輸入步驟,將單詞連同作為用于表示單詞表達(dá)的事物的函數(shù)的概念符號(hào)函數(shù)輸入,以及單詞相似性計(jì)算步驟,根據(jù)概念符號(hào)函數(shù)計(jì)算單詞和登記的單詞之間的相似性的單詞相似性。在根據(jù)本發(fā)明的信息處理裝置、信息處理方法、以及記錄介質(zhì)中,單詞連同作為用于表示單詞表達(dá)的事物的函數(shù)的概念符號(hào)函數(shù)輸入。因此,可以根據(jù)概念符號(hào)函數(shù)計(jì)算單詞和登記的單詞之間的相似性的單詞相似性。另外,根據(jù)本發(fā)明的一種信息處理裝置,包括函數(shù)生成部分,用于生成表示作為登記到詞典中的單詞的登記單詞表達(dá)的事物的概念符號(hào)函數(shù);以及對應(yīng)提供部分,用于使登記的單詞與關(guān)于該登記的單詞的概念符號(hào)函數(shù)相互對應(yīng)關(guān)系。概念符號(hào)函數(shù)可以是表示從單詞表達(dá)的事物中獲得的信息的函數(shù)。另外,概念符號(hào)函數(shù)可以是表示從用于感受單詞表達(dá)的事物給出的刺激的傳感器部分的輸出中獲得的信息的函數(shù)。傳感器部分可以是將光或聲信號(hào)轉(zhuǎn)換為電信號(hào)的器件、觸覺傳感器、溫度傳感器或加速度傳感器。在這種情況下,概念符號(hào)函數(shù)可以是通過傳感器部分表示通過探測單詞表達(dá)的事物而獲得的參數(shù)的函數(shù)。概念符號(hào)函數(shù)可以是概率密度函數(shù)或離散概率分布函數(shù)。根據(jù)本發(fā)明的一種信息處理方法,包括函數(shù)生成步驟,生成表示作為登記到詞典中的登記單詞表達(dá)的事物的函數(shù)的概念符號(hào)函數(shù);以及對應(yīng)提供步驟,使登記的單詞與關(guān)于該登記的單詞的概念符號(hào)函數(shù)相互對應(yīng)關(guān)系。根據(jù)本發(fā)明的一種記錄介質(zhì),其記錄的程序,包括函數(shù)生成步驟,生成作為表示登記到詞典中的登記單詞表達(dá)的事物的函數(shù)的概念符號(hào)函數(shù);以及對應(yīng)提供步驟,使登記的單詞與關(guān)于該登記的單詞的概念符號(hào)函數(shù)相互對應(yīng)關(guān)系。在根據(jù)本發(fā)明的信息處理裝置、信息處理方法、以及記錄介質(zhì)中,生成作為表示登記到詞典中的單詞的登記單詞表達(dá)的事物的概念符號(hào)函數(shù)。因此,可以提供登記的單詞與關(guān)于該登記的單詞的概念符號(hào)函數(shù)之間的對應(yīng)關(guān)系。附圖的簡要描述圖1為表示根據(jù)本發(fā)明的最優(yōu)單詞串輸出裝置的實(shí)施例的結(jié)構(gòu)示例的方框圖;圖2為表示圖1的最優(yōu)單詞串輸出部分4的結(jié)構(gòu)示例的方框圖;圖3A和3B示出存儲(chǔ)在圖2的登記單詞串?dāng)?shù)據(jù)庫23中的單詞詞典和單詞串詞典;圖4為說明圖2的最優(yōu)單詞串搜索部分22執(zhí)行的最優(yōu)單詞串搜索過程的流程圖;圖5示出用兩維方向表示的特征參數(shù)空間中的高斯分布;圖6示出由概念符號(hào)函數(shù)表示的高斯分布的輪廓;圖7為表示根據(jù)本發(fā)明的學(xué)習(xí)裝置的實(shí)施例的結(jié)構(gòu)示例的方框圖;圖8為說明圖7的學(xué)習(xí)裝置的學(xué)習(xí)過程的流程圖;圖9A至9C為說明根據(jù)本發(fā)明的記錄介質(zhì)的圖;和圖10為表示圖9的計(jì)算機(jī)101的結(jié)構(gòu)示例的方框圖。實(shí)現(xiàn)本發(fā)明的最佳方式圖1為表示根據(jù)本發(fā)明的最優(yōu)單詞串輸出裝置的實(shí)施例的結(jié)構(gòu)示例的方框圖。在該最優(yōu)單詞串輸出裝置中,適合于代表的事物的單詞串從構(gòu)成表達(dá)該事物的單詞串的一組單詞(單詞集合)中輸出。即,傳感器部分1感受按照作為對象的更實(shí)際的事物、來自該事物(下文中需要時(shí)稱作標(biāo)記事物)的刺激,將感受的結(jié)果輸出給預(yù)處理部分2。在圖1的實(shí)施例,傳感器部分1包括作為將光轉(zhuǎn)換為電信號(hào)的器件的攝像機(jī)、作為將聲信號(hào)轉(zhuǎn)換為電信號(hào)的器件的麥克風(fēng)、觸覺傳感器、溫度傳感器、以及加速度傳感器等。因此,在傳感器部分1中感受標(biāo)記事物的顏色、形狀、大小、位置、方向和速度(速率)等。在預(yù)處理部分2中,處理傳感器部分1的輸出并從該輸出中提取特征參數(shù)(特征向量)。即,在預(yù)處理部分2中,確定通過傳感器部分1探測標(biāo)記事物所獲得的信息的特征參數(shù)(因此,確定諸如標(biāo)記事物的顏色、形狀、大小、位置、方向和速度(速率)等之類的指示標(biāo)記事物的特征的參數(shù))。這些特征參數(shù)傳遞給單詞集合輸出部分3。單詞集合輸出部分3包括N個(gè)鑒別器111至11N和選擇器12,并用于輸出由代表傳感器部分1所探測到的標(biāo)記事物的單詞串構(gòu)成的一組單詞。即,鑒別器11N根據(jù)從該標(biāo)記事物中獲得的特征參數(shù),通過模式識(shí)別鑒別其標(biāo)記事物,輸出其鑒別結(jié)果。具體地說,鑒別器11N存儲(chǔ)用于鑒別由特定單詞#N代表的事物的鑒別函數(shù)fN(模型),通過使用來自預(yù)處理部分2的特征參數(shù)計(jì)算其鑒別函數(shù)fN。另外,鑒別器11N將鑒別函數(shù)fN的計(jì)算結(jié)果(下文中需要時(shí)稱作函數(shù)值)、指示由鑒別函數(shù)fN鑒別的事物的單詞#N的文字符號(hào)和聲音符號(hào)、以及鑒別函數(shù)輸出給選擇器12,作為單詞#N代表的事物的鑒別結(jié)果。當(dāng)選擇器12收到各個(gè)鑒別器111至11N的鑒別結(jié)果時(shí),從這些鑒別結(jié)果中選擇比如其中鑒別函數(shù)f1至fN的函數(shù)值為預(yù)定值的鑒別結(jié)果。即,在此鑒別函數(shù)fN的函數(shù)值變得越大,標(biāo)記事物由單詞#N代表的確實(shí)性變得越大。因此,選擇器12選擇函數(shù)值為預(yù)定值或更大的一個(gè)鑒別結(jié)果或多個(gè)鑒別結(jié)果作為適宜代表標(biāo)記事物的鑒別結(jié)果。這里,考慮標(biāo)記事物比如為大紅球的情況,在鑒別函數(shù)f1至fN中,用于鑒別分別代表三種事物“大”、“紅”、“球”的單詞的鑒別函數(shù)的函數(shù)值為預(yù)定值或更大。因此,在這種情況下,在選擇器12選擇這種鑒別結(jié)果。在本實(shí)施例中,假定在選擇器12中基本上是以這種方式選擇多個(gè)鑒別結(jié)果。當(dāng)選擇器12如上所述選擇了相應(yīng)于代表標(biāo)記事物的各個(gè)單詞的多個(gè)鑒別結(jié)果時(shí),它將選擇的多個(gè)鑒別結(jié)果輸入到最優(yōu)單詞串輸出部分4。這里,在鑒別器11N中用于鑒別單詞#N所代表的事物的鑒別函數(shù)fN,是通過使用探測單詞#N所代表的各個(gè)的實(shí)際事物獲得的特征參數(shù)進(jìn)行學(xué)習(xí)來獲得的。因此,由單詞#N代表的各個(gè)的實(shí)際事物構(gòu)成的特征參數(shù)是分別表達(dá)的。另一方面,當(dāng)假定代表事物的函數(shù)為概念符號(hào)函數(shù)時(shí),鑒別函數(shù)fN分別表達(dá)根據(jù)如上所述由單詞#N代表的各個(gè)實(shí)際事物所獲得的特征參數(shù)。因此可以將鑒別函數(shù)fN作為一種概念符號(hào)函數(shù)來領(lǐng)會(huì)。應(yīng)該指出的是,也僅能將鑒別函數(shù)fN作為概念符號(hào)函數(shù)來領(lǐng)會(huì)。因此,除了鑒別函數(shù)fN之外,其他函數(shù)也可以用作概念符號(hào)函數(shù)。另外,在下面的描述中,當(dāng)需要時(shí)假定使用由下式定義的單詞w。W=(L,P,C)……………(1)在上式中,L表示代表單詞的字符串(文字符號(hào)),P表示代表單詞聲音的符號(hào)(聲音符號(hào)),C表示代表單詞所表達(dá)的事物的符號(hào)(概念符號(hào))。對于聲音符號(hào)P,可以使用比如使用當(dāng)拼讀單詞時(shí)取得的聲音特征的聲音模式通過進(jìn)行學(xué)習(xí)所獲得的概率模型,比如HMM(隱馬爾可夫模型)等。另外,對于概念符號(hào)C,可以使用是概念符號(hào)函數(shù)的鑒別函數(shù)fN。應(yīng)該指出的是,對于使用如聲音符號(hào)P生成概率模型的學(xué)習(xí)方法,其詳細(xì)描述見比如KeinosukeFukunaga的“統(tǒng)計(jì)模式識(shí)別(StatisticalPatternRecognition)”科學(xué)出版社(AcademicPress)1990年;以及LawenceRabiner,Biing-HwangJuang(由KenFurui翻譯)的“聲音識(shí)別基礎(chǔ)(第一和第二卷)”,NTTAdvanceTechnologeKabashikiKaisha,1995年等。選擇器12將有關(guān)標(biāo)記事物的多個(gè)鑒別結(jié)果的每一個(gè)以公式(1)所定義的單詞的形式的集合提供給最優(yōu)單詞串輸出部分4。即,當(dāng)現(xiàn)在假定將適合于代表標(biāo)記事物的多個(gè)單詞表示為w1、w2、...,選擇器12將這些多個(gè)單詞w1、w2、...的集合提供給最優(yōu)單詞串輸出部分4。這里,多個(gè)單詞w1、w2、...的集合W由下式(2)定義。W={w1,w2,...}…………(2)另外,多個(gè)單詞w1、w2、...的排列(單詞串)s由下式(3)定義。s=[w1,w2,...]…………(3)此外,多個(gè)單詞串的s1、s2、...集合(單詞串集合)S由下式(4)定義。S={s1,s2,...}…………(4)應(yīng)注意單詞集合W是多個(gè)單詞w1、w2、...的集合,與這些多個(gè)單詞w1、w2、...的排列意義不同(由相同單詞構(gòu)成的單詞集合被認(rèn)為是同一集合,即使這些單詞的排列可能不同)。另一方面,單詞串是多個(gè)單詞w1、w2、...的一個(gè)排列,與這些單詞w1、w2、...的排列意義相同(盡管如果這些單詞的排列不同時(shí)認(rèn)為由相同單詞構(gòu)成的單詞串是不同的單詞串)。當(dāng)最優(yōu)單詞串輸出部分4從單詞集合輸出部分3(選擇器12)接收適于代表標(biāo)記事物的多個(gè)單詞w1、w2、...的集合W時(shí),它從構(gòu)成單詞集合的那些單詞中構(gòu)建單詞串(或句子)作為適于代表標(biāo)記事物的單詞的排列(下文中需要時(shí)稱作最優(yōu)單詞串),并輸出。圖2為表示圖1的最優(yōu)單詞串輸出部分4的結(jié)構(gòu)示例的方框圖。來自單詞集合輸出部分3(圖1)的單詞集合W(下文中需要時(shí)稱作輸入單詞集合)輸入到單詞串生成部分21。單詞串生成部分21生成通過使用構(gòu)成輸入單詞集合W的多個(gè)單詞w1、w2、...(下文中需要時(shí)稱作輸入單詞)構(gòu)成的、單詞的所有重新排列s1、s2、...(下文中需要時(shí)稱作輸入單詞串),以輸出所有單詞串的集合S(下文中需要時(shí)稱作輸入單詞串集合)到最優(yōu)單詞串搜索部分22。這里,在單詞集合輸出部分3輸出的包括M個(gè)單詞的單詞集合的情況下,在單詞串生成部分21生成M!種單詞串(!表示階乘)。最優(yōu)單詞串搜索部分22參照登記的單詞串?dāng)?shù)據(jù)庫23,從來自單詞串生成部分21的、構(gòu)成輸入單詞串集合S的輸入單詞串s1、s2、...中搜索最優(yōu)單詞串,并輸出搜索的最優(yōu)單詞串。即,最優(yōu)單詞串搜索部分22由單詞相似性計(jì)算部分31、單詞串相似性計(jì)算部分32和選擇部分33構(gòu)成,并用于計(jì)算有關(guān)構(gòu)成輸入單詞串集合S的輸入單詞串s1、s2、...,對于登記在登記的單詞串?dāng)?shù)據(jù)庫23中的各單詞串(登記的單詞串)的單詞串相似性,以從輸入單詞串s1、s2、...中選擇得到最大單詞串相似性(其值越大,單詞串之間的相似性越高)的輸入單詞串,并輸出所選擇的輸入單詞串作為最優(yōu)單詞串。具體地說,單詞相似性計(jì)算部分31根據(jù)概念符號(hào)函數(shù),計(jì)算構(gòu)成輸入單詞串si的每一個(gè)輸入單詞wij與相應(yīng)于構(gòu)成登記的單詞串的輸入單詞wij的單詞(按相同次序與輸入單詞wij同一位置的單詞)之間的單詞相似性,并輸出所計(jì)算的單詞相似性到單詞串相似性計(jì)算部分32。在這種情況下,單詞wij意指位于從單詞串si的開頭部分的第j個(gè)位置的單詞。單詞串相似性計(jì)算部分32根據(jù)構(gòu)成輸入單詞串si的每一個(gè)單詞與構(gòu)成相應(yīng)于該單詞的登記單詞串的單詞之間的單詞相似性,計(jì)算輸入單詞串si與登記的單詞串之間的相似性,并輸出計(jì)算的單詞串相似性到選擇部分33。選擇部分33選擇其中使關(guān)于登記的單詞串的單詞串相似性是構(gòu)成輸入單詞串集合S的輸入單詞串s1、s2、...中最大值的一個(gè)輸入單詞串,并輸出所選擇的輸入單詞串。登記的單詞串?dāng)?shù)據(jù)庫23存儲(chǔ)例如如圖3所示的單詞詞典和單詞串詞典。即,在單詞詞典中,如圖3A所示,以這樣一種方式登記需登記的單詞,即,使文字符號(hào)、聲音符號(hào)、和概念符號(hào)相應(yīng)于在公式(1)中所定義的。在單詞串詞典中,登記使多個(gè)登記的單詞以能夠給出一定含義的排列的方式排列的單詞串(登記的單詞串)。應(yīng)指出的是,不一定必須在登記的單詞串?dāng)?shù)據(jù)庫23中存儲(chǔ)其中登記了登記的單詞串的單詞串詞典。即,如果在登記的單詞串?dāng)?shù)據(jù)庫23中登記了語法規(guī)則等,則可以根據(jù)相應(yīng)的規(guī)則通過排列登記在單詞詞典中的登記單詞準(zhǔn)備登記的單詞串。下面描述圖2的最優(yōu)單詞串輸出部分4的處理過程。當(dāng)單詞串生成部分21從單詞集合輸出部分3(圖1)收到輸入單詞集合W時(shí),它生成由構(gòu)成輸入單詞集合W的多個(gè)單詞w1、w2、...構(gòu)成的輸入單詞串s1、s2、...,并輸出所選擇的單詞串的集合(輸入單詞串集合)S到最優(yōu)單詞串搜索部分22。當(dāng)最優(yōu)單詞串搜索部分22收到來自單詞串生成部分21的輸入單詞串集合S時(shí),執(zhí)行最優(yōu)單詞串搜索處理,參照登記的單詞串?dāng)?shù)據(jù)庫23,從構(gòu)成輸入單詞串集合S的輸入單詞串s1、s2、...中搜索最優(yōu)單詞串,以輸出搜索的最優(yōu)單詞串。即,如圖4的流程圖所示,在最優(yōu)單詞串搜索處理過程中,首先,在步驟S1,單詞相似性計(jì)算部分31從輸入單詞串集合S中選擇某一個(gè)單詞串si作為標(biāo)記的單詞串。處理過程前進(jìn)到步驟S2。在步驟S2,單詞相似性計(jì)算部分31從登記的單詞串?dāng)?shù)據(jù)庫23的詞典中選擇某一個(gè)登記的單詞串作為標(biāo)記的登記單詞串,并根據(jù)概念符號(hào)函數(shù),計(jì)算構(gòu)成標(biāo)記的單詞串si的各個(gè)單詞與在相應(yīng)于各個(gè)單詞的標(biāo)記的登記單詞串中的單詞之間的單詞相似性。即,當(dāng)使得經(jīng)歷過單詞相似性計(jì)算的標(biāo)記的單詞串和登記的單詞串的單詞分別用w_1和w_2表示時(shí),可以從公式(1)得出由下式表示的這些單詞w_1和w_2。w_1=(L_1,P_1,C_1)w_2=(L_2,P_2,C_2)…………(5)在上式中,L_1、P_1、C_1分別表示單詞w_1的文字符號(hào)、聲音符號(hào)和概念符號(hào)。類似地,L_2、P_2、C_2分別表示單詞w_2的文字符號(hào)、聲音符號(hào)和概念符號(hào)。作為概念符號(hào)的概念符號(hào)函數(shù)比如可以使用高斯概率分布函數(shù)。當(dāng)均值向量為x、協(xié)方差矩陣為∑的高斯概率分布函數(shù)表示為N(x,∑)時(shí),公式(5)的概念符號(hào)C_1和C_2可以用下式表示。C_1=N(x1,∑1)C_2=N(x2,∑2)…………(6)在上式中,x1和∑1分別表示從單詞w_1所代表的單個(gè)實(shí)際的事物中獲得的特征參數(shù)的均值和協(xié)方差矩陣。類似地,x2和∑2分別表示從單詞w_2所代表的單個(gè)實(shí)際的事物中獲得的特征參數(shù)的均值和協(xié)方差矩陣。應(yīng)該指出的是,在本實(shí)施例中,如上所述,輸入單詞的概念符號(hào)函數(shù)等于鑒別輸入單詞的鑒別函數(shù),并且圖1的鑒別器11N具有的鑒別函數(shù)fN因此用高斯概率分布函數(shù)代表。這里,通過使用從單詞w_1所代表的單個(gè)實(shí)際的事物中獲得的特征參數(shù)進(jìn)行學(xué)習(xí),確定作為用于鑒別標(biāo)記的單詞串的單詞w_1所代表的事物的鑒別函數(shù)的、高斯概率分布函數(shù)N(x1,∑1)的均值x1和協(xié)方差矩陣∑1。另外,通過使用從單詞w_2所代表的單個(gè)實(shí)際的事物中獲得的特征參數(shù)進(jìn)行學(xué)習(xí),確定作為用于鑒別標(biāo)記的單詞串的單詞w_2所代表的事物的鑒別函數(shù)的、高斯概率分布函數(shù)的均值x2和協(xié)方差矩陣∑2。在將高斯概率分布函數(shù)用作概念符號(hào)函數(shù)的情況下,兩個(gè)單詞w_1和w_2之間的單詞相似性Rw(w_1,w_2)比如可以使用高斯分布的Bhattacharyya距離作為各自的概念符號(hào)函數(shù),按下式(7)計(jì)算。Rw(w_1,w_2)=12ln|Σ1+Σ22||Σ1||Σ2|----(7)]]>在上式中,ln(x)表示x的自然對數(shù)。這里,在計(jì)算高斯分布的Bhattachayya距離時(shí),一般也考慮均值向量。在本示例中,由于注意力放在關(guān)于兩個(gè)單詞的高斯分布的相對外形之間的差異上(在不考慮兩個(gè)高斯分布的相對位置的狀態(tài)下進(jìn)行對比的情況下,即在僅允許兩個(gè)高斯分布平行移動(dòng)的狀態(tài)下進(jìn)行對比的情況下(因此,旋轉(zhuǎn)、壓縮、和擴(kuò)展不包括在內(nèi)),兩個(gè)高斯分布的外形是否相似),所以公式(7)只使用協(xié)方差矩陣。即,根據(jù)公式(7),依靠從每一個(gè)單詞w_1和w_2分別代表的事物中所獲得的特征參數(shù)的高斯分布的相對外形是否彼此相似,確定兩個(gè)單詞w_1和w_2之間的單詞相似性Rw(w_1,w_2)。應(yīng)該指出的是,當(dāng)關(guān)于各個(gè)單詞w_1和w_2的高斯分布的相對外形相似時(shí),由式(7)確定的單詞相似性Rw(w_1,w_2)的值變大,也就是說,從單詞w_1和w_2的含義來看,相似性變高。在步驟S2,計(jì)算構(gòu)成標(biāo)記的單詞串的各個(gè)單詞與相應(yīng)于該單詞的標(biāo)記的登記單詞串中的單詞之間的單詞相似性。然后,處理過程前進(jìn)到步驟S3。單詞相似性計(jì)算部分31判斷在步驟S2中單詞相似性的計(jì)算是否在將所有的登記單詞串作為標(biāo)記的登記單詞串時(shí)執(zhí)行。在其在步驟S3中判斷在步驟S2中單詞相似性的計(jì)算沒有將所有的登記單詞串作為標(biāo)記的登記單詞串執(zhí)行的情況下,處理過程返回到步驟S2。然后,重復(fù)類似的處理,將還沒有使其成為標(biāo)記的登記單詞串的登記單詞串作為新的標(biāo)記的登記單詞串。另外,在其在步驟S3中判斷在步驟S2中單詞相似性的計(jì)算已經(jīng)將所有的登記單詞串作為標(biāo)記的登記單詞串執(zhí)行的情況下,處理過程前進(jìn)到步驟S4,判斷是否存在還沒有使其成為輸入單詞串集合的標(biāo)記的單詞串的輸入單詞串。在其在步驟S4中判斷存在還沒有使其成為輸入單詞串集合的標(biāo)記的單詞串的輸入單詞串的情況下,處理過程返回步驟S1,重復(fù)步驟S2和隨后一直到此的步驟的處理,使還沒有使其成為標(biāo)記的單詞串的輸入單詞串作為新的標(biāo)記的單詞串。另一方面,在其在步驟S4中判斷不存在還沒有使其成為輸入單詞串集合的標(biāo)記的單詞串的輸入單詞串情況下,即在構(gòu)成輸入單詞串集合的所有輸入單詞串與構(gòu)成登記在登記的單詞串?dāng)?shù)據(jù)庫23中的各個(gè)登記的單詞串的單詞之間的單詞相似性的計(jì)算已經(jīng)執(zhí)行的情況下,處理過程前進(jìn)到步驟S5。在單詞串相似性計(jì)算部分32中,存有計(jì)算的、構(gòu)成輸入單詞串集合的各個(gè)單詞串與各個(gè)登記的單詞串之間的單詞串相似性。即,在單詞相似性計(jì)算部分31中確定的單詞相似性被傳遞到單詞串相似性計(jì)算部分32。在步驟S5,在單詞串相似性計(jì)算部分32中,存有通過利用來自單詞相似性計(jì)算部分31的單詞相似性計(jì)算的構(gòu)成輸入單詞串集合的各個(gè)單詞串與各個(gè)登記的單詞串之間的單詞串相似性。即,將構(gòu)成輸入單詞串集合的某一個(gè)輸入單詞串假定為s1,并將某一個(gè)登記的單詞串假定為s2。此外,當(dāng)將構(gòu)成單詞串s1和s2的單詞數(shù)目分別表示為L(s1)和L(s2)時(shí),在單詞串相似性計(jì)算部分32中根據(jù)比如下式(8)計(jì)算兩個(gè)單詞串s1和s2之間的單詞串相似性Rs(s1,s2)。在L(s1)=L(s2)時(shí),Rs(s1,s2)=Σi=1L(s1)RW(W1i,W2i)]]>在L(s1)≠L(s2)時(shí),Rs(s1,s2)=0…………(8)在上式中,單詞wij意指如上所述的從單詞串si的開頭部分開始的第j個(gè)單詞。因此,在輸入單詞串s1和登記的單詞串s2是由相同數(shù)量的單詞構(gòu)成的情況下,將兩個(gè)單詞串之間的單詞串相似性Rs(s1,s2)確定為構(gòu)成輸入單詞串s1的各個(gè)單詞與構(gòu)成相應(yīng)于各個(gè)單詞的登記單詞串s2之間的單詞相似性的總和。另外,在輸入單詞串s1和登記的單詞串s2是由不同數(shù)量的單詞構(gòu)成的情況下,使該單詞串相似性Rs(s1,s2)為0。應(yīng)該指出的是,當(dāng)隨從含義來看單詞串s1和s2之間的相似性越大時(shí),由公式(8)確定的單詞串s1和s2之間的單詞串相似性Rs(s1,s2)的數(shù)值變大,這與由公式(7)確定的單詞相似性Rw(w_1,w_2)類似。當(dāng)在步驟S5中,單詞串相似性計(jì)算部分32計(jì)算構(gòu)成輸入單詞串集合的各個(gè)單詞串與各個(gè)登記的單詞串之間的單詞串相似性后,將單詞串相似性傳遞給選擇部分33。在步驟S6,在選擇部分33中,確定來自單詞串相似性計(jì)算部分32的那些單詞串相似性的最大值。因此選擇獲得最大單詞串相似性的輸入單詞串與登記的單詞串的組合。此外,處理過程前進(jìn)到步驟S7,并且選擇部分33輸出在步驟S6中選擇的輸入單詞串作為最優(yōu)單詞串。因此完成最優(yōu)單詞串搜索處理過程。即,將登記在輸入單詞串集合和登記的單詞串?dāng)?shù)據(jù)庫23中的輸入單詞串集合和登記的單詞串集合分別假定為S和S’,并假定各集合用下式表示。S={s1,s2,...}S={s1’,s2’,...}…………(9)在上式中,s1、s2、...分別表示輸入單詞串,s1’、s2’、...分別表示登記的單詞串。在這種情況下,在選擇部分33中,根據(jù)下面的公式(10)從輸入單詞串集合S中確定最優(yōu)單詞串Ssuitable。Ssuitable=argmaxsi∈S{maxs′j∈S′{R(si,s′j)}}----(10)]]>在上式中,max{x}表示x的最大值,argmax{x}表示提供x的最大值的自變量。如上所述,將一個(gè)單詞連同代表該單詞所指的事物的概念符號(hào)函數(shù)輸入到最優(yōu)單詞串輸出部分4,并在最優(yōu)單詞串輸出部分4中根據(jù)該概念符號(hào)函數(shù)計(jì)算輸入單詞和登記在登記的單詞串?dāng)?shù)據(jù)庫23中的登記單詞之間的單詞相似性。因此,即使與輸入單詞相同的登記單詞沒有在登記的單詞串?dāng)?shù)據(jù)庫23中登記,也能夠計(jì)算輸入單詞與登記的單詞之間的單詞相似性,也能夠計(jì)算輸入單詞串與登記的單詞串之間的單詞串相似性。結(jié)果,即使沒有提供大容量的詞典,也能夠針對許多單詞進(jìn)行單詞之間的相似性計(jì)算。此外,即使沒有提供復(fù)雜的語法規(guī)則等,也可以將單詞集合轉(zhuǎn)換為具有合適含義的單詞串。即認(rèn)為,在用兩維方向表示的特征參數(shù)空間中,作為比如單詞“上”、“下”、“左”、“右”的概念符號(hào)函數(shù)的高斯分布是這樣的,如果隨位置在上、下、左、右方向上移動(dòng),則發(fā)生概率分別變大,如圖5所示。在本示例中,在圖5中,垂直于圖紙的方向表示概率的大小,并使用記號(hào)的是這樣的,概率相同的部分用線相連?,F(xiàn)在假定在登記的單詞串?dāng)?shù)據(jù)庫23中,將“左”和“上”登記為登記的單詞、以及將“左上”登記為登記的單詞串,并進(jìn)一步假定將沒有在登記的單詞串?dāng)?shù)據(jù)庫23中登記的單詞“下”和“右”的集合輸入到單詞串生成部分21(圖2)作為單詞集合。在這種情況下,在單詞串生成部分21中,將生成“下右”和“右下”作為輸入單詞串。這些單詞串傳遞給最優(yōu)單詞串搜索部分22。在最優(yōu)單詞串搜索部分22中,在單詞相似性計(jì)算部分31,計(jì)算構(gòu)成輸入單詞串“下右”的各個(gè)單詞和相應(yīng)于這些單詞構(gòu)成登記的單詞串“左上”的各個(gè)單詞之間的單詞相似性,并計(jì)算構(gòu)成輸入單詞串“右下”的各個(gè)單詞和相應(yīng)于這些單詞構(gòu)成登記的單詞串“左上”的各個(gè)單詞之間的單詞相似性。即,對于輸入單詞串“下右”,計(jì)算單詞“下”和單詞“左”之間的單詞相似性、以及單詞“右”和單詞“上”之間的單詞相似性。另外,對于輸入單詞串“右下”,計(jì)算單詞“右”和單詞“左”之間的單詞相似性、以及單詞“下”和單詞“上”之間的單詞相似性。此外,在單詞串相似性計(jì)算部分32,計(jì)算單詞“下”和單詞“左”之間的單詞相似性、以及單詞“右”和單詞“上”之間的單詞相似性的總和作為輸入單詞串“下右”和登記的單詞串“左上”之間的單詞串相似性,并且計(jì)算單詞“右”和單詞“左”之間的單詞相似性、以及單詞“下”和單詞“上”之間的單詞相似性的總和作為輸入單詞串“右下”和登記的單詞串“左上”之間的單詞串相似性?,F(xiàn)在,示于圖5的作為單詞“上”、“下”、“左”、“右”的概念符號(hào)函數(shù)的高斯分布,各自示意性的外形如圖6所示。從圖6中可以清楚地看出,單詞“上”和“下”的高斯分布的外形相互相似,而單詞“左”和“右”的高斯分布的外形相互相似。但是,單詞“上”和“右”或“左”的高斯分布的外形相互不相似,以及單詞“下”和“右”或“左”的高斯分布的外形相互不相似。因此,單詞“右”和單詞“左”之間的單詞相似性、以及單詞“下”和單詞“上”之間的單詞相似性均為較大的值,但是單詞“下”和單詞“左”之間的單詞相似性、以及單詞“右”和單詞“上”之間的單詞相似性均為較小的值。結(jié)果,作為單詞“右”和單詞“左”之間的單詞相似性以及單詞“下”和單詞“上”之間的單詞相似性的總和的輸入單詞串“右下”和登記的單詞串“左上”之間的單詞串相似性變?yōu)檩^大的值,并且作為單詞“下”和單詞“左”之間的單詞相似性以及單詞“右”和單詞“上”之間的單詞相似性的總和的輸入單詞串“下右”和登記的單詞串“左上”之間的單詞串相似性變?yōu)檩^小的值。因此,在選擇部分33,選擇具有較大單詞相似性的輸入單詞串“右下”和登記的單詞串“左上”的組合。因此,將輸入單詞串“右下”輸出作為最優(yōu)單詞串。即,作為輸入單詞串,獲得了“下右”和“右下”。在這種情況下,將其中更為合適的單詞排列“右下”輸出作為最優(yōu)單詞串。此外,現(xiàn)在假定在登記的單詞串?dāng)?shù)據(jù)庫23中,比如將“紅”和“鞋”登記為登記的單詞、以及將“紅鞋”登記為登記的單詞串。即使在將沒有在登記的單詞串?dāng)?shù)據(jù)庫23中登記的單詞“白”和在登記的單詞串?dāng)?shù)據(jù)庫23中登記的單詞“鞋”的集合輸入到單詞串生成部分21作為單詞集合的情況下,也可以與上述類似的方式輸出單詞串“白鞋”作為最優(yōu)單詞串。如上所述,對于沒有在登記的單詞串?dāng)?shù)據(jù)庫23中登記的輸入單詞,能夠計(jì)算單詞相似性。此外,對于包括這些輸入單詞的輸入單詞串,也能夠計(jì)算單詞串相似性。因此,即使沒有提供大容量的詞典,也能夠針對許多單詞進(jìn)行單詞之間相似性的計(jì)算。此外,即使沒有將復(fù)雜的語法規(guī)則和/或包括與輸入單詞串相同的單詞的單詞串登記作為登記的單詞串,也可以將單詞集合轉(zhuǎn)換為具有合適含義的單詞串(最優(yōu)單詞串)。圖7示出執(zhí)行用于準(zhǔn)備存儲(chǔ)在圖2的登記單詞串?dāng)?shù)據(jù)庫23中的單詞詞典和單詞串詞典的學(xué)習(xí)處理過程的學(xué)習(xí)裝置的實(shí)施例的結(jié)構(gòu)的一個(gè)示例。傳感器部分41的構(gòu)成與圖2的傳感器部分1相似,并且適于感受由將要所學(xué)習(xí)的實(shí)際事物(下文中需要時(shí)稱作所學(xué)習(xí)的事物)給出的刺激,輸出感受的結(jié)果到預(yù)處理部分42。預(yù)處理部分42的構(gòu)成與圖2的預(yù)處理部分2相似,并用于處理來自傳感器部分41的輸出,以從該輸出中提取特征參數(shù)。即,預(yù)處理部分42確定有關(guān)作為所學(xué)習(xí)的事物由傳感器部分41探測的這一事實(shí)的結(jié)果所獲得的信息的特征參數(shù),以輸出它們到學(xué)習(xí)部分43。將來自預(yù)處理部分42的有關(guān)所學(xué)習(xí)的事物的特征參數(shù)、以及來自文字輸入部分44和聲音輸入部分45的代表構(gòu)成代表所學(xué)習(xí)的事物的單詞串的各個(gè)單詞的字符串和聲音提供給學(xué)習(xí)部分43。另外,學(xué)習(xí)部分43通過使用有關(guān)構(gòu)成代表所學(xué)習(xí)的事物的單詞串的各個(gè)單詞的特征參數(shù)進(jìn)行學(xué)習(xí),因此生成代表由各個(gè)單詞表示的事物的概念符號(hào)函數(shù)、并根據(jù)自文字輸入部分44和聲音輸入部分45傳遞的字符串和聲音分別生成文字符號(hào)和聲音符號(hào),以便以使有關(guān)各個(gè)單詞的文字符號(hào)、聲音符號(hào)和概念符號(hào)函數(shù)與此相對應(yīng)的方式準(zhǔn)備圖3A所示的單詞詞典。此外,學(xué)習(xí)部分43還用于準(zhǔn)備圖3B所示的其中登記了代表所學(xué)習(xí)的事物的單詞串的單詞串詞典。文字輸入部分44由比如鍵盤等構(gòu)成,并且當(dāng)輸入代表構(gòu)成代表所學(xué)習(xí)的事物的單詞串的各個(gè)單詞的字符串時(shí),文字輸入部分44工作。聲音輸入部分45由比如麥克風(fēng)等構(gòu)成。對于聲音輸入部分45,輸入構(gòu)成代表所學(xué)習(xí)的事物的單詞串的各個(gè)單詞的發(fā)音。下面將參照圖8的流程圖說明圖7的學(xué)習(xí)裝置的學(xué)習(xí)處理過程。開始在步驟S11,在傳感器部分41中,感受來自所學(xué)習(xí)的事物給出的刺激。從文字輸入部分44和聲音輸入部分45分別輸入代表構(gòu)成代表所學(xué)習(xí)的事物的單詞串的各個(gè)單詞的字符串和聲音。此外,將傳感器部分41感受的結(jié)果傳遞給預(yù)處理部分42,并將分別來自文字輸入部分44和聲音輸入部分45的字符串和聲音傳遞給學(xué)習(xí)部分43。在步驟S12,當(dāng)預(yù)處理部分42收到傳感器部分41感受的結(jié)果時(shí),它從感受的結(jié)果中提取特征參數(shù),以傳遞給特征參數(shù)給學(xué)習(xí)部分43。在本示例中,在傳感器部分41中,感受由使其經(jīng)歷學(xué)習(xí)的單詞串代表的、不同的所學(xué)習(xí)的事物(比如,如果所學(xué)習(xí)的單詞串是蘭色球,則將各種蘭色球(比如蘭色棒球、蘭色足球等)作為相應(yīng)于這里提到的不同的所學(xué)習(xí)的事物的各種實(shí)際的單個(gè)事物)給出的刺激,并傳遞給預(yù)處理部分42。因此,在預(yù)處理部分42中,提取有關(guān)這些不同的所學(xué)習(xí)的事物給出的各種刺激的特征參數(shù),并傳遞給學(xué)習(xí)部分43。因此,當(dāng)關(guān)注一個(gè)構(gòu)成使之經(jīng)歷學(xué)習(xí)的單詞串的單詞時(shí),在預(yù)處理部分42中提取從由該單詞代表的不同的事物給出的刺激中獲得的多個(gè)特征參數(shù)。由此獲得的特征參數(shù)傳遞給學(xué)習(xí)部分43。在步驟S13,當(dāng)學(xué)習(xí)部分43收到有關(guān)由關(guān)于構(gòu)成使之經(jīng)歷學(xué)習(xí)的單詞串的各個(gè)單詞代表的不同的事物的特征參數(shù)時(shí),通過利用有關(guān)構(gòu)成使之經(jīng)歷學(xué)習(xí)的單詞串的各個(gè)單詞的獲得的多個(gè)特征參數(shù)進(jìn)行學(xué)習(xí),以確定代表其分布的函數(shù)、比如高斯概率分布函數(shù)等作為關(guān)于各個(gè)單詞的概念符號(hào)函數(shù)。此外,在步驟S14,學(xué)習(xí)部分43從來自文字輸入部分44的字符串和來自聲音輸入部分45的聲音,生成關(guān)于構(gòu)成使之經(jīng)歷學(xué)習(xí)的單詞串的各個(gè)單詞的文字符號(hào)和聲音符號(hào),以使得各個(gè)單詞的概念符號(hào)函數(shù)與其相對應(yīng),因此生成單詞詞典,并準(zhǔn)備其中將代表所學(xué)習(xí)的事物的單詞串登記的單詞串詞典、以完成對于經(jīng)當(dāng)前學(xué)習(xí)的單詞串的學(xué)習(xí)處理過程。應(yīng)該指出的是,作為利用關(guān)于由特定單詞代表的各個(gè)不同的事物的特征參數(shù)、即多個(gè)特征參數(shù)進(jìn)行學(xué)習(xí)的方法,可以使用在比如上述的“統(tǒng)計(jì)模式識(shí)別”和“聲音識(shí)別基礎(chǔ)(第一和第二卷)”等中描述的方法。上述的處理序列可以用硬件實(shí)現(xiàn),也可以用軟件實(shí)現(xiàn)。在一系列處理過程由軟件實(shí)現(xiàn)的情況下,構(gòu)成該軟件的程序安裝到配置在最優(yōu)單詞串輸出裝置或?qū)W習(xí)裝置作為專用硬件或通用計(jì)算機(jī)等的計(jì)算機(jī)中。下面將參照圖9與適于記錄相應(yīng)程序的記錄介質(zhì)結(jié)合進(jìn)行解釋,用于描述將執(zhí)行上述一系列處理過程的程序安裝到計(jì)算機(jī),以便該程序能夠由該計(jì)算機(jī)執(zhí)行??梢詫⒊绦蚴孪扔涗浽谟脖P102或半導(dǎo)體存儲(chǔ)器103中,它們用作為包括在圖9A所示的計(jì)算機(jī)101之內(nèi)的記錄介質(zhì)。或者,也可以將該程序臨時(shí)或永久地存儲(chǔ)(記錄)在諸如軟盤111、CD-ROM(只讀存儲(chǔ)器致密盤)112、MO(磁光)盤113、DVD(數(shù)字通用盤)114、磁盤115、或半導(dǎo)體存儲(chǔ)器116等之類的記錄介質(zhì)中??梢砸运^的數(shù)據(jù)包軟件的形式提供該記錄介質(zhì)。應(yīng)該指出的是,除了從上述的記錄介質(zhì)中將該程序安裝到計(jì)算機(jī)之外,也可以使用如圖9C所示的、通過用于數(shù)字衛(wèi)星廣播的人造衛(wèi)星122從下載站點(diǎn)121將程序通過無線電傳輸給計(jì)算機(jī)101、或通過如LAN(局域網(wǎng))或因特網(wǎng)的網(wǎng)絡(luò)131將程序通過有線線路傳輸給計(jì)算機(jī)123、由此安裝到包括在其中的硬盤102等的辦法。另外,在本說明書中,不一定必須按照沿著流程圖描述的順序的時(shí)間序列方式處理描述用于使計(jì)算機(jī)執(zhí)行該處理過程的步驟,而是將以并行或單獨(dú)方式執(zhí)行的處理(比如,并行處理或由對象進(jìn)行的處理)也包括在內(nèi)。圖10示出圖9的計(jì)算機(jī)101的結(jié)構(gòu)的一個(gè)示例。計(jì)算機(jī)101包括一個(gè)CPU(中央處理單元)142,如圖10所示。輸入/輸出接口145通過總線141連接到CPU142。當(dāng)用戶對由鍵盤或鼠標(biāo)等構(gòu)成的輸入部分147的操作將命令通過輸入/輸出接口145輸入到CPU142時(shí),CPU142按照該命令執(zhí)行存儲(chǔ)在相應(yīng)于圖9A的半導(dǎo)體存儲(chǔ)器103的ROM(只讀存儲(chǔ)器)143中的程序。CPU142還將存儲(chǔ)在硬盤102的程序、從人造衛(wèi)星122或網(wǎng)絡(luò)131傳輸?shù)?、在通信部?48接收并安裝到硬盤102的程序、或從每一個(gè)均配備有各自的驅(qū)動(dòng)器149的軟盤111、CD-ROM112、MO盤112、DVD114或磁盤115中讀出并安裝到硬盤102的程序、加載到RAM(隨機(jī)存取存儲(chǔ)器)144中,以便執(zhí)行該程序。此外,當(dāng)需要時(shí)CPU142通過輸入/輸出接口145輸出其處理的結(jié)果到比如由LCD(液晶顯示器)等構(gòu)成的顯示部分146。應(yīng)該指出的是,盡管在本實(shí)施例中將傳感器部分1或41感受的事物的刺激用于確定代表該事物的概念符號(hào)函數(shù),但是該概念符號(hào)函數(shù)可以通過比如使用代表該事物的單詞的聲音等替代來自該事物的刺激來確定。在使用來自該事物的刺激確定代表該事物的概念符號(hào)函數(shù)的情況下,使在現(xiàn)實(shí)世界中存在的實(shí)際事物和代表事物的單詞彼此相對應(yīng)關(guān)系。結(jié)果,有可能實(shí)現(xiàn),比如能夠通過各種傳感器感受特定事物給出的刺激、以從感受的結(jié)果輸出適于代表該事物的單詞串的機(jī)器人(robot),或者在與用戶或周圍真實(shí)世界有相關(guān)性的同時(shí)執(zhí)行語言處理的其它系統(tǒng)。此外,盡管在本實(shí)施例中將高斯概率分布函數(shù)用作概念符號(hào)函數(shù),但是也可以將除了高斯概率分布函數(shù)以外的概率密度函數(shù)以及用HMM代表的離散概率分布函數(shù)等用作概念符號(hào)函數(shù)。另外,盡管在本實(shí)施例中通過使用概念符號(hào)函數(shù)的Bhattacharyya距離確定兩個(gè)單詞之間的單詞相似性,但是也可以根據(jù)概念符號(hào)函數(shù)的Kullback散度等確定單詞相似性。即,可以根據(jù)兩個(gè)單詞各自的概念符號(hào)函數(shù)所代表的分布等的外形的相似性反映的物理量確定單詞相似性。此外,盡管在本實(shí)施例中沒有具體給出最優(yōu)單詞串輸出部分4輸出最優(yōu)單詞串的方法,但是,最優(yōu)單詞串可以比如以構(gòu)成最優(yōu)單詞串的單詞按照順序排列的各個(gè)單詞表示,或者可以通過語音聲音(合成聲音)輸出。最優(yōu)單詞串的表示可以通過使用各個(gè)單詞的文字符號(hào)實(shí)現(xiàn)。另外,通過最優(yōu)單詞串的語音聲音的輸出可以通過利用各個(gè)單詞的聲音符號(hào)生成合成聲音來實(shí)現(xiàn)。工業(yè)應(yīng)用根據(jù)本發(fā)明的第一信息處理裝置、第一信息處理方法、以及第一記錄介質(zhì),單詞連同用于表示這些單詞表達(dá)的事物的概念符號(hào)函數(shù)輸入,并根據(jù)該概念符號(hào)函數(shù)計(jì)算單詞和登記的單詞之間的相似性的單詞相似性。因此,即使沒有將同一單詞作為輸入的聲音登記為登記的單詞,也可以計(jì)算輸入的單詞和登記的單詞之間的單詞相似性。根據(jù)本發(fā)明的第二信息處理裝置、第二信息處理方法、以及第二記錄介質(zhì),生成作為表示登記到詞典中的登記單詞表達(dá)的事物的函數(shù)的概念符號(hào)函數(shù),并使登記的單詞與關(guān)于該登記的單詞的概念符號(hào)函數(shù)之間相對應(yīng)關(guān)系。因此,利用該概念符號(hào)函數(shù),可以計(jì)算單詞之間的相似性。權(quán)利要求1.一種信息處理裝置,用于確定輸入的單詞和在詞典中登記的單詞之間的相似性,該信息處理裝置包括輸入裝置,用于將單詞連同表示該單詞表達(dá)的事物的概念符號(hào)函數(shù)輸入;以及單詞相似性計(jì)算裝置,用于根據(jù)概念符號(hào)函數(shù)計(jì)算單詞和登記的單詞之間的相似性的單詞相似性。2.如權(quán)利要求1所述的信息處理裝置,其中該詞典存儲(chǔ)登記的單詞連同用于該登記的單詞的概念符號(hào)函數(shù)。3.如權(quán)利要求2所述的信息處理裝置,進(jìn)一步包括其中存儲(chǔ)詞典的詞典存儲(chǔ)裝置。4.如權(quán)利要求1所述的信息處理裝置,其中概念符號(hào)函數(shù)是表示從單詞表達(dá)的事物中獲得的信息的函數(shù)。5.如權(quán)利要求4所述的信息處理裝置,其中概念符號(hào)函數(shù)是表示從用于感受單詞表達(dá)的事物給出的刺激的傳感器裝置的輸出中獲得的信息的函數(shù)。6.如權(quán)利要求5所述的信息處理裝置,其中傳感器裝置是將光或聲信號(hào)轉(zhuǎn)換為電信號(hào)的器件、觸覺傳感器、溫度傳感器或加速度傳感器,并且其中概念符號(hào)函數(shù)是利用傳感器裝置通過探測單詞表達(dá)的事物而獲得的參數(shù)的函數(shù)。7.如權(quán)利要求1所述的信息處理裝置,其中概念符號(hào)函數(shù)是概率密度函數(shù)或離散概率分布函數(shù)。8.如權(quán)利要求1所述的信息處理裝置,其中單詞相似性計(jì)算裝置根據(jù)單詞和登記的單詞的概念符號(hào)函數(shù)之間的Bhattacharyya距離或Kullback散度計(jì)算該單詞和登記的單詞之間的單詞相似性。9.如權(quán)利要求1所述的信息處理裝置,其中輸入裝置輸入作為一組單詞的單詞集合連同有關(guān)各單詞的概念符號(hào)函數(shù),并且其中詞典存儲(chǔ)其中排列多個(gè)登記的單詞的登記的單詞串的集合連同有關(guān)各登記的單詞的概念符號(hào)函數(shù),信息處理裝置進(jìn)一步包括單詞串生成裝置,用于生成其中排列構(gòu)成單詞集合的單詞的單詞串;單詞串相似性計(jì)算裝置,用于從構(gòu)成單詞串的各單詞和相應(yīng)于這些單詞的構(gòu)成登記的單詞串的登記單詞之間的單詞相似性,計(jì)算單詞串和登記的單詞串之間的單詞串相似性;以及輸出裝置,用于輸出根據(jù)單詞串相似性構(gòu)成單詞集合的單詞按預(yù)定順序排列的單詞串。10.一種信息處理方法,用于確定輸入的單詞和在詞典中登記的單詞之間的相似性,該信息處理方法包括下列步驟將單詞連同用于表示單詞表達(dá)的事物的概念符號(hào)函數(shù)輸入;以及根據(jù)概念符號(hào)函數(shù)計(jì)算單詞和登記的單詞之間的相似性的單詞相似性。11.一種記錄介質(zhì),其上記錄使計(jì)算機(jī)執(zhí)行用于確定輸入的單詞和在詞典中登記的單詞之間的相似性的信息處理的程序,其中該程序包括以下步驟將單詞連同用于表示單詞表達(dá)的事物的概念符號(hào)函數(shù)輸入;以及根據(jù)概念符號(hào)函數(shù)計(jì)算單詞和登記的單詞之間的相似性的單詞相似性。12.一種信息處理裝置,適用于準(zhǔn)備用于計(jì)算關(guān)于輸入的單詞的相似性的詞典,該信息處理裝置包括函數(shù)生成裝置,用于生成表示登記到詞典中的登記單詞表達(dá)的事物的概念符號(hào)函數(shù);以及對應(yīng)形成裝置,用于使登記的單詞與關(guān)于該登記的單詞的概念符號(hào)函數(shù)相互對應(yīng)關(guān)系。13.如權(quán)利要求12所述的信息處理裝置,其中概念符號(hào)函數(shù)是表示從單詞表達(dá)的事物中獲得的信息的函數(shù)。14.如權(quán)利要求13所述的信息處理裝置,其中概念符號(hào)函數(shù)是表示從用于感受單詞表達(dá)的事物給出的刺激的傳感器裝置的輸出中獲得的信息的函數(shù)。15.如權(quán)利要求14所述的信息處理裝置,其中傳感器裝置是將光或聲信號(hào)轉(zhuǎn)換為電信號(hào)的器件、觸覺傳感器、溫度傳感器或加速度傳感器,并且其中概念符號(hào)函數(shù)是通過傳感器裝置表示通過探測單詞表達(dá)的事物而獲得的參數(shù)的函數(shù)。16.如權(quán)利要求12所述的信息處理裝置,其中概念符號(hào)函數(shù)是概率密度函數(shù)或離散概率分布函數(shù)。17.一種準(zhǔn)備用于計(jì)算關(guān)于輸入的單詞的相似性的詞典的信息處理方法,該信息處理方法包括下列步驟生成表示登記到詞典中的登記單詞表達(dá)的事物的概念符號(hào)函數(shù);以及使登記的單詞與關(guān)于該登記的單詞的概念符號(hào)函數(shù)相互對應(yīng)關(guān)系。18.一種記錄介質(zhì),在其上記錄使計(jì)算機(jī)執(zhí)行準(zhǔn)備用于計(jì)算關(guān)于輸入的單詞的相似性的詞典的信息處理的程序,其中該程序包括以下步驟生成表示登記到詞典中的登記單詞表達(dá)的事物的概念符號(hào)函數(shù);以及使登記的單詞與關(guān)于該登記的單詞的概念符號(hào)函數(shù)相互對應(yīng)關(guān)系。全文摘要從單詞集合輸出部分將一個(gè)單詞連同用于代表該單詞指示的事物的概念符號(hào)函數(shù)輸入到最優(yōu)單詞串輸出部分。最優(yōu)單詞串輸出部分根據(jù)各個(gè)概念符號(hào)函數(shù)計(jì)算來自單詞集合輸出部分的單詞和登記在詞典中的登記單詞之間的相似性。在輸入沒有登記在詞典中的單詞的情況下,最優(yōu)單詞串輸出部分也計(jì)算該單詞和登記在詞典中的單詞之間的相似性。文檔編號(hào)G06F17/27GK1327562SQ00802188公開日2001年12月19日申請日期2000年8月31日優(yōu)先權(quán)日1999年8月31日發(fā)明者巖橋直人申請人:索尼公司