專利名稱:用于通過推理識(shí)別輸入字符串的裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于識(shí)別輸入圖形并顯示識(shí)別結(jié)果的圖形識(shí)別裝置,尤其涉及對(duì)其輸入手寫的預(yù)定字符串例如地址和固定的詞組的圖形識(shí)別裝置。
由所謂“pen PC”(pen-input comprters)對(duì)于便條、發(fā)票和其它形式的處理主要涉及對(duì)這些裝置輸入地址和固定的詞組。已經(jīng)提出了輸入預(yù)定字符串例如地址和固定詞組的三種代表性的方法(1)從呈菜單形式的候選物當(dāng)中選擇;(2)以菜單和字符識(shí)別組合格式輸入ZIP碼,從而產(chǎn)生候選地址的菜單顯示,以便從中選擇;(3)用手寫要被識(shí)別的字符,使得利用字典對(duì)其候選物優(yōu)化。
上述的方法(1)在文章“Recognition of Handwritten Addresses in Unframed SetupAllowing for Character Position Displacements”(Periodical D-2 of the Institute ofElectronics,Information and Communication Engineers of Japan,Jan.,1994)中說明了。該方法一般涉及給定分級(jí)結(jié)構(gòu)的數(shù)據(jù)例如地址,從分級(jí)結(jié)構(gòu)的頂層到底層連續(xù)地選擇候選數(shù)據(jù)。例如,“茨城縣(Ibaraki-ken(日本的一個(gè)縣))的后面可以是“日立市(Hitachi-shi(城市)),其后又可以是“大みか町(Domika-cho(城鎮(zhèn)))”。這個(gè)方法的缺點(diǎn)在于,如果用戶不能確定Hitachi-shi是否位于例如Tochigi-ken或Ibaraki-ken中(即最高級(jí)別的縣),用戶則難于直觀地選擇Hitachi-shi。
利用上述的方法(2),用戶僅需要輸入ZIP碼,系統(tǒng)則給出代碼引起的地址的菜單顯示,以便從中選擇。只要用戶記住全部的ZIP碼,則該過程是相當(dāng)簡單的;但除去用戶自己的ZIP碼之外,他們可能難于記住其它的ZIP。
上述的方法(3)可以識(shí)別手寫字符并且通過使用字庫使其候選物優(yōu)化。參看下面一些附圖可以得知該方法的概況。圖3是一種常規(guī)的字符識(shí)別裝置的示意方塊圖。在圖3中,通過小平板a1輸入的手寫圖形在字符識(shí)別處理a3中和識(shí)別字典a2進(jìn)行圖形匹配。這樣獲得的候選字符在字相關(guān)處理b7中和和字庫a6按字匹配。然后,在LCDa8上顯示合適的字。
圖4是表示如何使用常規(guī)的字符識(shí)別裝置輸入地址的示意的流程圖。例如,要輸入“茨城縣(Ibaraki-ken(縣))”、“日立市(Hitachi-shi(市)”、“大みか町(Oomika-cho(鎮(zhèn))”,用戶在輸入?yún)^(qū)b1的預(yù)定的地址中用手寫入這些字符。然后在處理a3中識(shí)別手寫的字符。從識(shí)別處理獲得的候選字符按字和字庫a6匹配,從最高等級(jí)的層開始(即縣級(jí))。這樣,對(duì)候選字符優(yōu)化,并作為候選字符輸出結(jié)果。
一般說來,等級(jí)結(jié)構(gòu)的數(shù)據(jù)例如地址是從最高級(jí)的層向下進(jìn)行訪問的。這是因?yàn)樵诘燃?jí)結(jié)構(gòu)中的層越高,所存儲(chǔ)的數(shù)據(jù)量越小,從而使得一旦確定最高層的候選物,便可以從中容易地推斷較低的候選物。但是,假定常規(guī)系統(tǒng)接收通過字庫進(jìn)行檢索的字“大みか町(Domika-cho(鎮(zhèn)))”。在這種情況下,因?yàn)檩斎胱值膶邮俏粗?,系統(tǒng)除去檢索1.5MB之大的整個(gè)字典之外別無選擇。在例如需要快速響應(yīng)的聯(lián)機(jī)字符識(shí)別的應(yīng)用中,這種方案是不實(shí)際的。
在日本,一部典型的用于存儲(chǔ)地址的字庫的結(jié)構(gòu)如下縣名大約50個(gè)名字×每個(gè)名字大約3個(gè)字符×每個(gè)字符大約2個(gè)字節(jié)=大約300B的容量市和鎮(zhèn)大約4000個(gè)名字×每個(gè)名字大約3個(gè)字符×每字符2字節(jié)=大約2.5KB的容量下級(jí)市大約160,000個(gè)名字×每個(gè)名字大約4個(gè)字符×每字符大約2字節(jié)=大約1.3MB的容量這種典型的字庫的數(shù)據(jù)總?cè)萘看蠹s為1.5MB。
上述常規(guī)方法的一個(gè)缺點(diǎn)是用戶必須忍受必須手寫全部所需地址的麻煩,這些地址可能很長,例如“茨城縣(Ibaraki-ken),日立市(Hitachi-shi),大みか町(Oomika-cho)”。
上述的方法(1)到(3)三種方法的一個(gè)共同問題是,在字符識(shí)別應(yīng)用中,用戶必須經(jīng)受手寫全部字符串例如地址和固定的句子的麻煩。另一個(gè)共同的問題是,通過字庫檢索不在等級(jí)結(jié)構(gòu)中的最高層的字可能需要很長時(shí)間。還有一個(gè)問題在于,在例如由地址構(gòu)成的等級(jí)數(shù)據(jù)結(jié)構(gòu)的菜單驅(qū)動(dòng)環(huán)境中,較低層的項(xiàng)除非已知其上面的項(xiàng)否則不能選擇。
因此,本發(fā)明的目的在于,提供一種圖形識(shí)別裝置,用來只接受手寫的關(guān)鍵字母(例如“大みか(Oomika)”或“~みか町(Mika-cho)”以便推斷出其余的字符串(例如“茨城具(Ibaraki-ken),日立市(Hitachi-shi)”,借以輸出被識(shí)別的整個(gè)字符串(例如“茨城縣(Ibaraki-ken),日立市(Hitachi-shi),大みか町(Oomika-cho)”)。
在實(shí)現(xiàn)本發(fā)明時(shí),按照其一個(gè)方面,提供一種字符識(shí)別裝置,它具有用于識(shí)別輸入的字符串的識(shí)別裝置和用于顯示識(shí)別結(jié)果的顯示裝置,所述字符識(shí)別裝置包括存儲(chǔ)字識(shí)別信息和等級(jí)結(jié)構(gòu)信息的字庫,用于把許多字按等級(jí)分層并識(shí)別在等級(jí)結(jié)構(gòu)中的每個(gè)字;字母轉(zhuǎn)移概率表,用于至少存儲(chǔ)從一個(gè)字母轉(zhuǎn)移到另一個(gè)字母的概率和相應(yīng)于由這些轉(zhuǎn)移而得到的字母的組合的那些字識(shí)別信息片;優(yōu)化裝置,用于使用字母轉(zhuǎn)移概率表優(yōu)化由識(shí)別裝置獲得的候選字符串;以及檢索裝置,用于通過字庫檢索由相應(yīng)于優(yōu)化的候選字符串的字識(shí)別信息的那些片限定的字,借以檢索由等級(jí)信息的可應(yīng)用的片識(shí)別的并尚待輸入的檢索字。
當(dāng)下級(jí)的字符例如“Oomika-cho”單獨(dú)被輸入時(shí),上述的本發(fā)明的字符識(shí)別裝置首先提取“Oomika-cho”作為被優(yōu)化裝置優(yōu)化的候選字符串。然后根據(jù)相應(yīng)于優(yōu)化的字符串的字識(shí)別信息檢索字庫尋找較高級(jí)的字。這一檢索產(chǎn)生比輸入的“Oomika-cho”的等級(jí)較高的尚待輸入的字“Ibaraki-ken,Hitachi-shi.”。識(shí)別的結(jié)果是“Ibaraki-ken,Hitachi-shi,Oomika-cho”,整個(gè)字符串由輸入的和未被輸入的字構(gòu)成。
按照本發(fā)明的另一個(gè)方面,提供一種具有用于識(shí)別輸入的字符串的識(shí)別裝置和用來顯示識(shí)別結(jié)果的顯示裝置的字符識(shí)別裝置,所述裝置包括具有預(yù)先在特定地址中存儲(chǔ)的許多字符串的字庫;字母轉(zhuǎn)移概率表,至少存儲(chǔ)從一個(gè)字母轉(zhuǎn)移到另一個(gè)字母的概率,所述概率被存儲(chǔ)在和包括在轉(zhuǎn)移時(shí)涉及的組合字母的字符串的地址相應(yīng)的地址中;以及優(yōu)化裝置,使用字母轉(zhuǎn)移概率表優(yōu)化由識(shí)別裝置獲得的候選字符串;其中字庫被訪問相應(yīng)于優(yōu)化候選字符串的字符串的地址,并且在字庫的這些地址中的字符串作為識(shí)別結(jié)果被顯示。
圖1是使用本發(fā)明的手寫輸入地址識(shí)別裝置的功能方塊圖;圖2是說明使用本發(fā)明的手寫輸入地地址識(shí)別裝置如何工作的示意流程圖;圖3是現(xiàn)有的字符識(shí)別裝置的示意方塊圖;圖4是表示現(xiàn)有的字符識(shí)別裝置如何用于輸入地址的流程圖;圖5是使用本發(fā)明的手寫輸入地址識(shí)別裝置的硬件方塊圖;圖6是用于產(chǎn)生字母轉(zhuǎn)移概率表的步驟的示意的流程圖;圖7是典型的字庫的示意圖8是典型的字母出現(xiàn)計(jì)數(shù)表的示意圖;圖9是典型的字母轉(zhuǎn)移計(jì)數(shù)表的示意圖;圖10是典型的字母出現(xiàn)概率表的示意圖;圖11是典型的字母轉(zhuǎn)移概率表的示意圖;圖12是利用轉(zhuǎn)移概率表進(jìn)行字符識(shí)別的后處理的示意流程圖;圖13是說明根據(jù)后處理的結(jié)果如何推斷字符串的示意流程圖;圖14是說明根據(jù)后處理的結(jié)果如何推斷字符串的另一個(gè)示意流程圖;圖15是說明根據(jù)后處理的結(jié)果如何推斷字符串的另一個(gè)示意流程圖;圖16是說明根據(jù)后處理的結(jié)果如何推斷字符串的另一個(gè)示意流程圖;圖17是顯示推斷的字符串的一種典型格式的示意圖;圖18是顯示推斷的字符串的另一種典型格式示意圖;圖19是顯示推斷的字符串的另一種典型格式示意圖;圖20是表示推斷的字符串的另一種典型格式示意圖;圖21是說明如何根據(jù)后處理的結(jié)果推斷字符串的另一個(gè)示意流程圖;圖22是說明如何根據(jù)后處理的結(jié)果推斷字符串的另一個(gè)示意流程圖;圖23是表示使用本發(fā)明的手寫輸入醫(yī)療保健檢索裝置的功能方塊圖;圖24是用于說明使用本發(fā)明的手寫輸入醫(yī)藥檢索裝置的操作的圖;圖25是說明每種藥的處方、注意事項(xiàng)、副作用以及服用其它藥時(shí)的注意事項(xiàng)的表;圖26是說明根據(jù)使用本發(fā)明的步驟的病人名字檢索裝置的操作的例圖;圖27是圖書館檢索系統(tǒng)的結(jié)構(gòu)方框圖;圖28是表示書架布置引導(dǎo)處理的顯示輸出的例圖;圖29是圖書收集登記的結(jié)構(gòu)圖;圖30(a)、(b)和(c)分別是圖書收集表、作者姓名表和出版商表的圖;圖31表示圖書名稱字符對(duì)字符轉(zhuǎn)移概率表的結(jié)構(gòu);圖32是圖書名稱字符對(duì)字符轉(zhuǎn)移概率表的另一種結(jié)構(gòu);圖33是圖書館檢索處理的流程圖;圖34表示在圖書館檢索處理中顯示輸入檢索關(guān)鍵字的例圖;圖35是由圖書檢索處理產(chǎn)生的檢索結(jié)果的顯示的例圖;圖36表示可以由本發(fā)明提供的實(shí)施例實(shí)現(xiàn)的模糊輸入的多項(xiàng)數(shù)據(jù)庫檢索系統(tǒng)的結(jié)構(gòu);圖37(a)到37(i)表示在圖36所示的實(shí)施例中使用的表;圖38表示允許模糊輸入的檢索處理的流程圖;圖39(a)至39(d)表示在檢索包括非文本數(shù)據(jù)例如圖畫的多項(xiàng)數(shù)據(jù)庫中使用的表;圖40表示檢索索引產(chǎn)生工具的結(jié)構(gòu);圖41(a)到41(c)表示字符對(duì)字符轉(zhuǎn)移索引表的例子;圖42表示用于檢索包括非文本數(shù)據(jù)例如圖畫的多項(xiàng)數(shù)據(jù)庫的檢索系統(tǒng)的結(jié)構(gòu);圖43表示檢索關(guān)鍵字輸入托板的例子;圖44表示檢索結(jié)果顯示托板的例子;圖45表示通過應(yīng)用從檢索系統(tǒng)收到的檢索結(jié)果得到并顯示的屏幕的例子;圖46表示由識(shí)別結(jié)果優(yōu)化和數(shù)據(jù)推斷單元執(zhí)行的處理的示意流程圖;以及圖47(a)到47(b)是表示允許使用含有索引和索引的相似程度的表的模糊輸入的簡圖,所述每個(gè)索引把字母對(duì)字母的轉(zhuǎn)移和字連系起來。
下面參照
本發(fā)明的最佳實(shí)施例,本實(shí)施例允許手寫地址的字符識(shí)別。
圖2是表示使用本發(fā)明的手寫輸入地址識(shí)別裝置如何工作的示意流程圖。例如用戶在地址輸入?yún)^(qū)b1用筆a9寫入關(guān)鍵字“Oomika”。手寫的筆劃在字符識(shí)別處理a3中被識(shí)別。識(shí)別處理根據(jù)該關(guān)鍵字產(chǎn)生第一候選字符串“大みか(Oomika)”和第二候選的“大るか(Inuruka)。已知候選字符串,對(duì)于在該字符串中字符對(duì)字符轉(zhuǎn)移的概率(例如從字母A到字母B的轉(zhuǎn)移概率)參照轉(zhuǎn)移概率表a4。然后對(duì)于涉及的字母出現(xiàn)的概率參照字母出現(xiàn)概率表a8。候選字符的順序被優(yōu)化,使得該字符串出現(xiàn)的幾率最大。對(duì)于候選字號(hào),再參考字符轉(zhuǎn)移概率表,借以獲得包括在該候選字符串中的字母對(duì)字母轉(zhuǎn)移的字的指針。在2圖的例子中,當(dāng)候選字符組合成“大みか(Oomika)”時(shí)字出現(xiàn)的概率最大,因而從字符轉(zhuǎn)移概率表中獲得指針No.All,它指向包括“大(Oo)”到“み(mi)”轉(zhuǎn)移和“み(Mi)”到“か(ka)”轉(zhuǎn)移的字。利用本方法,當(dāng)在字符轉(zhuǎn)移概率表中提供字庫中的字的指針用于字符識(shí)別的后處理時(shí),目標(biāo)字會(huì)很快地被訪問。一旦在字庫中找到合適的字,關(guān)于字庫中的那個(gè)字的層信息便使得可應(yīng)用的較高的一層或幾層唯一地被識(shí)別。在圖2的例子中,上層字被唯一地得到,它們是“茨城縣(Ibaraki-ken),日立市(Hitachi-shi)”。即簡單地手寫“大みか(Oomika)”便使得目標(biāo)地址”茨城縣(Ibraki-ken),日立市(Hitachi-shi),大みか町(Oomika-cho)”作為可能的候選被顯示并象被輸入一樣。
圖1是使用本發(fā)明的手寫輸入地址識(shí)別裝置的功能框圖。下面參照?qǐng)D1說明本實(shí)施例如何工作。在小平板a1上使筆a9滑動(dòng)從而輸入手寫字符圖形。這樣輸入的手寫字符圖形在字符識(shí)別處理a3中和保持在識(shí)別字庫a2中的字符圖形匹配、識(shí)別處理產(chǎn)生候選字符,其順序通過參考預(yù)先通過學(xué)習(xí)產(chǎn)生的兩個(gè)表被優(yōu)化。一個(gè)表是轉(zhuǎn)移概率表a4,它包含字母對(duì)字母轉(zhuǎn)移的概率和包括這種轉(zhuǎn)移的字庫中的這些候選字的指針。參考的另一個(gè)表是字母出現(xiàn)幾率表a8,其中包含字母出現(xiàn)的幾率。在優(yōu)化時(shí),候選字符被最優(yōu)地排序,使得作為字符串出現(xiàn)的字母的幾率最大。同時(shí),指向字庫中可被應(yīng)用于優(yōu)化的字符串的這些字的指針被確定(處理a5)。上述從字庫中獲得的字和候選字符串進(jìn)行匹配,從字庫中的層信息中獲得關(guān)于每個(gè)可應(yīng)用的字和關(guān)于前面和后面的字的信息(步a7)。獲得的結(jié)果在LCD a8上顯示。
在實(shí)施本發(fā)明時(shí)有4個(gè)主要方面要被討論(1)如何產(chǎn)生轉(zhuǎn)移概率表a4;(2)如何優(yōu)化候選字符的順序,使得作為字符串出現(xiàn)的字母的概率最大,并且如何找到指向包括在優(yōu)化的字符串中的字母對(duì)字母轉(zhuǎn)移的字的指針;(3)如何被用檢測的字的指針推斷包括手寫輸入字(即關(guān)鍵字)的字符串;以及(4)如何顯示推斷的字符串。這些方面在下面詳細(xì)討論。
圖5是使用本發(fā)明的手寫輸入地址識(shí)別裝置的硬件框圖。該裝置包括以下功能使輸入圖形和字庫圖形匹配;優(yōu)化從圖形匹配獲得的候選字符并找出包括候選字符的字的指針;以及使候選字符和這些字匹配,從而檢索關(guān)于這些字的每個(gè)字前后字的信息。這些功能例如都被執(zhí)行從ROMc5中檢索的相應(yīng)程序的CPUc3實(shí)現(xiàn)。下面參照相應(yīng)的附圖詳細(xì)說明這些功能。[1]如何產(chǎn)生轉(zhuǎn)移概率表a4圖6是產(chǎn)生轉(zhuǎn)移概率表a4的示意流程圖。在步d1,讀字庫6以便進(jìn)行學(xué)習(xí)。利用從字庫中檢索的任一個(gè)字,在該字中每個(gè)構(gòu)成該字的字母出現(xiàn)的次數(shù)被計(jì)數(shù)(步d2)。字母出現(xiàn)計(jì)數(shù)被寫入字母出現(xiàn)計(jì)數(shù)表d3中。然后對(duì)字中的字母對(duì)字母的轉(zhuǎn)移計(jì)數(shù)(步d4)。轉(zhuǎn)移計(jì)數(shù)被寫入字母轉(zhuǎn)移計(jì)數(shù)表d6。包含該字母對(duì)字母轉(zhuǎn)移的原始字的字號(hào)(即字指針)被寫入字符轉(zhuǎn)移計(jì)數(shù)表d6(步d5)。例如,在日本字“大みか町(Oomika)”的情況下,日本字母“大(Oo)”,“み(mi)”和“か(ka)”出現(xiàn)一次,因而計(jì)數(shù)一次。同樣,在該字中“大(Oo)”到“み(mi)”和“み(mi)”到“か(ka)”的轉(zhuǎn)移也各計(jì)數(shù)一次。字“大みか(Oomika)”的字號(hào)被寫為“大(Oo)”到“み(mi)”轉(zhuǎn)移的候選字號(hào)和“み(mi)”到“か(ka)轉(zhuǎn)移的候選字號(hào)。對(duì)字庫a6中的所有的字重復(fù)步d1到d6。此后,這樣產(chǎn)生的字母出現(xiàn)計(jì)數(shù)表d3和字母轉(zhuǎn)移計(jì)數(shù)表d6被參考,以便制備轉(zhuǎn)移概率表a4,其中含有字母對(duì)字母的轉(zhuǎn)移概率和包括這種轉(zhuǎn)移的候選字的字號(hào)的信息(步d9)。如果需要,再次參考字母出現(xiàn)計(jì)數(shù)表d3,從而產(chǎn)生說明涉及的每個(gè)字母的出現(xiàn)概率的字母出現(xiàn)概率表d8(步d7)。下面參照相應(yīng)的
這些表的構(gòu)成。
圖7是典型的字庫的示意圖。其中所示是由日本的縣、市、鎮(zhèn)和下屬機(jī)構(gòu)的名字構(gòu)成的等級(jí)結(jié)構(gòu)的地址字庫a6。構(gòu)成該字庫的各項(xiàng)包括字號(hào)(即字位置信息),較高級(jí)的字號(hào)和字(字符串)。每個(gè)字利用其字?jǐn)?shù)進(jìn)行訪問。每個(gè)字的等級(jí)關(guān)系由其較高級(jí)的字號(hào)識(shí)別。
圖8是一種典型的字母出現(xiàn)計(jì)數(shù)表的示意圖。字母出現(xiàn)計(jì)數(shù)表d3存儲(chǔ)每個(gè)字母在用于學(xué)習(xí)的字庫中出現(xiàn)的次數(shù)。例如,表d3被用于計(jì)數(shù)在被學(xué)習(xí)的字中每個(gè)字母出現(xiàn)的次數(shù)。
圖9是一種典型的字母轉(zhuǎn)移計(jì)數(shù)表的示意圖。其中存儲(chǔ)在用于學(xué)習(xí)的字庫中每個(gè)字母對(duì)字母的轉(zhuǎn)移出現(xiàn)的次數(shù)和包括這種轉(zhuǎn)移的字?jǐn)?shù)(即候選字母符數(shù))。
圖10是一種典型的字母出現(xiàn)概率表的示意圖。例如,日本字母“hi”的出現(xiàn)概率以字母“hi”出現(xiàn)的次數(shù)除以字母的總數(shù)給出。這樣,字母出現(xiàn)概率表d8通過首先參考字母出現(xiàn)計(jì)數(shù)表d3以找出所涉及的每個(gè)字符的出現(xiàn)計(jì)數(shù)被產(chǎn)生。這樣獲得的出現(xiàn)計(jì)數(shù)被寫于字母出現(xiàn)概率表d8中。
圖11是一種典型的字母轉(zhuǎn)移概率表的示意圖。例如,“日(hi)”到“立(tachi)”轉(zhuǎn)移的概率表示為“日(hi)”到“立(tachi)”轉(zhuǎn)移發(fā)生的次數(shù)除以“日(hi)”出現(xiàn)的次數(shù)。這樣,字轉(zhuǎn)移概率表a4通過首先參考字母出現(xiàn)計(jì)數(shù)表d3和字母轉(zhuǎn)移計(jì)數(shù)表d6從而求出每個(gè)字母的轉(zhuǎn)移幾率被產(chǎn)生。這樣獲得的幾率被寫入字母轉(zhuǎn)移概率表a4中。
執(zhí)行上述處理產(chǎn)生具有字庫中的字的指針的轉(zhuǎn)移概率表a4。雖然上述實(shí)施例使用字?jǐn)?shù)作為識(shí)別字庫中的每個(gè)字的字識(shí)別信息,但是這不限制本發(fā)明。另外,可以使用代碼信息作為字識(shí)別信息。此外,雖然上述實(shí)施例使用較高級(jí)的字號(hào)作為代表字庫中的字之間的等級(jí)關(guān)系的等級(jí)信息,但這不限制制本發(fā)明。另外,其它類型的信息例如代碼信息可用于說明字之間的等級(jí)關(guān)系。[2]根據(jù)轉(zhuǎn)移概率的后處理(即如何優(yōu)化候選字符和如何確定候選字的指針)圖12是利用轉(zhuǎn)移概率表進(jìn)行字符識(shí)別的后處理的流程圖。如圖12所示,假定輸入圖形“大みか町(Oomika)”具有第一候選字符串“犬みか(Inuraka)”和第二候選字符串“犬みか(Kenmika)”。即與圖2的例子相反,這里假定輸入字符串“大みか(Oomika)”被不正確地識(shí)別。在這種情況下,如下所述,仍然可以通過根據(jù)轉(zhuǎn)移概率優(yōu)化候選字符來避免字符識(shí)別的錯(cuò)誤結(jié)果。如1圖2所示,有8個(gè)可能的候選字符組合。對(duì)于這些字符串中的每一個(gè),參考字母轉(zhuǎn)移概率表,從而找到涉及的字符串的出現(xiàn)概率并獲得字庫中候選字符的指針。成為具有最高出現(xiàn)概率的字符串的候選字符組合是最佳的候選字符組合。該字符組合和候選字?jǐn)?shù)一道被認(rèn)為是根據(jù)轉(zhuǎn)移概率處理的后處理的結(jié)果。
字符串的出現(xiàn)要率被計(jì)算如下一般地說,字符串S1,S2,...,Sn的出現(xiàn)概率利用下式近似計(jì)算出現(xiàn)概率(S1,S2,...,Sn)=出現(xiàn)概率(S1)×轉(zhuǎn)移概率(S1→S2)×轉(zhuǎn)移概率(Sn-1→Sn) ...(1)例如,圖12中的字符組合No.3“大みか(Oomika)”的出現(xiàn)概率計(jì)算出現(xiàn)概率(“大みか(Oomika)”)=出現(xiàn)概率(“大(Oo)”×轉(zhuǎn)移概率(“大(Oo)”→“み(mi)”)×轉(zhuǎn)移概率(“み(mi)”→“か(ka)”)更具體地說,通過參考轉(zhuǎn)移概率表a4和出現(xiàn)概率表a8獲得所需的概率如下出現(xiàn)概率(“大みか(Oomika)”)=(18/89,274)×(1/18)×(2/15)×(2/198)=14940×108-8% ...(2)下面說明如何獲得候選字?jǐn)?shù)(即如何求得字庫中字候選的指針0)。例如,對(duì)于字符串S1,S2,...,Sn的候選字?jǐn)?shù)使用下式獲得
候選字號(hào)(S1,S2,...,Sn)=候選字號(hào)(S1→S2)∩...∩候選字號(hào)(Sn-1→Sn)...(3)圖12中的字符串“大みか(Oomika)”通過參考字符轉(zhuǎn)移概率表a4并使用下式得到候選字號(hào)候選字號(hào)(“大みか(Oomika)”)=∩候選字號(hào)(“(Oo)”→“(mi)”)∩候選字號(hào)(“mi”→“ka”)=(A11)∩(A11,A12)=A11 ...(4)在上例中,候選字號(hào)相“與”(∩),從而使候選字符減少到“大みか町(Oomika-cho)”(A11)。另外,候選字號(hào)可以相“或”(∪),從而使得可以選擇“大みか町(Oomika-cho)”和“みかの原町(Mikanohara-cho)”作為候選字符。在這另一種情況下,根據(jù)字符計(jì)數(shù)可以選字“大みか町(Oomika-cho)”作為第一候選字符。
用所述方式,從字符識(shí)別處理得到的候選字符被優(yōu)化成具有足夠高的出現(xiàn)概率的字符串。然后獲得優(yōu)化的候選字符串的候選字符號(hào)(即該字的指針)。利用上述方法,只輸入字“大みか町(Oomika-cho)”的一部分(例如“みか(mika)”)仍然涉及兩個(gè)候選字“大みか町(Oomika-cho)”和“みかの原町(Mikanohara-cho)”。[3]如何推斷包括手寫輸入字(即關(guān)鍵字)的字符串下面參照有關(guān)
如何推斷包括優(yōu)化的候選字符串(即手寫輸入關(guān)鍵字)的整個(gè)字符串。
圖13是說明如何根據(jù)后處理的結(jié)果推斷字符串的示意流程圖。在圖13的例子中,根據(jù)轉(zhuǎn)移概率的后處理產(chǎn)生關(guān)鍵字“大みか(Oomika)”(候選字符)和候選字號(hào)A11。如圖所示只有一個(gè)字“大みか(Oomika)”作為關(guān)鍵字存在于字庫中。因?yàn)樽帧按螭撙?Oomika)”在等級(jí)結(jié)構(gòu)中的最低層,所以上一級(jí)的字符串“茨城縣日立市(Ibaraki-ken,Hitachi-shi)”便被唯一地確定。作為根據(jù)手寫字符“大みか(Oomika)”推斷的最后結(jié)果,候選字符串“茨城縣日立市大みか町(Ibararaki-ken,Hitachi-shi,Oomika-cho)”便被顯示。
圖22所示的情況除去對(duì)于手寫字符“大みか(Oomika)”具有兩個(gè)候選字符串之外和圖13的例子相同。一個(gè)候選字是從字符串推斷得到的“茨城縣日立市大みか町(Ibaraki-ken,Hitachi-shi,Oomika-cho)”,另一個(gè)候選字是從未經(jīng)推斷處理的字符識(shí)別得到的“大みか町(Oomika-cho)”,因而用戶可以選擇兩者之一。其優(yōu)點(diǎn)在于用戶可以在由關(guān)鍵字推斷的字符串和不加推斷的單獨(dú)的關(guān)鍵字之間進(jìn)行選擇。
圖14是表示如何根據(jù)后處理結(jié)果推斷字符串的另一個(gè)示意流程圖。在圖14的例子中,根據(jù)轉(zhuǎn)移概率的后處理從字庫中產(chǎn)生一個(gè)中間等級(jí)字“日立市(Hitachi)”(候選字號(hào)A1)。如圖所示,只有一個(gè)字“日立(Hitachi)”作為關(guān)鍵字存在于字庫中,因此上一級(jí)的字符串“茨城縣(Ibaraki-ken)”便被唯一地確定。在這種情況下,關(guān)鍵字“日立(Hitachi)”具有幾個(gè)和其相關(guān)的較低級(jí)別的字。它們(例如“茨城縣日立市大みか町(Ibaraki-ken,Hitachi-shi,Oomika-cho)”、“茨城縣日立市みかの原町(Ibaraki-ken,Hitachi-shi, Mikanohara-cho)”等)被顯示,由用戶從中選擇一個(gè)。
圖15的例子與圖14的相同之處在于,通過根據(jù)轉(zhuǎn)移概率的后處理從字庫中檢索中間級(jí)的字“日立(Hitachi)”(候選字號(hào)A1),由于該字具有幾個(gè)與其相關(guān)的較低級(jí)的候選字。在所述的例子中,字庫含有關(guān)于各個(gè)市鎮(zhèn)的人口統(tǒng)計(jì)的信息,使得幾個(gè)候選的低級(jí)的字按人口順序被顯示。用戶可以容易地根據(jù)顯示按照人口順序排列的市鎮(zhèn)進(jìn)行選擇。
圖16所示情況和圖15類似,其區(qū)別在于在圖16中字庫含有字對(duì)字轉(zhuǎn)移概率而不包含人口統(tǒng)計(jì)信息。即幾個(gè)候選的低級(jí)字按轉(zhuǎn)移概率的順序顯示。用戶也可以根據(jù)基于概率的字指示容易地進(jìn)行選擇。所述字對(duì)字的轉(zhuǎn)移概率例如可以從含有若干地理名稱的文本中學(xué)習(xí)來得到。在簡單的結(jié)構(gòu)中,轉(zhuǎn)移概率可以根據(jù)有關(guān)市鎮(zhèn)的知名度確定。
在圖21的例子中,和圖14一樣,通過根據(jù)轉(zhuǎn)移概率的后處理從字庫中檢索中間級(jí)的關(guān)鍵字“日立(Hitachi)”(候選字號(hào)A1),并且仍然必須確定和該關(guān)鍵字相關(guān)的低級(jí)候選字。圖21的例子和圖14的區(qū)別在于,只顯示唯一確定的字符串“茨城縣日立市(Ibaraki-ken,Hitachi-shi)”。較低級(jí)別的下屬地區(qū)由于不能唯一地被確定,必須再由用戶輸入。
如上所述,比關(guān)鍵字等級(jí)較高的字按照本發(fā)明被唯一地自動(dòng)推斷。當(dāng)有幾個(gè)對(duì)關(guān)鍵字而言是下級(jí)的低級(jí)候選字時(shí),便不能被唯一地確定。在這種情況下,用戶被提供給一個(gè)菜單,可以從中選擇或要求用戶進(jìn)行所需的附加輸入。[4]如何顯示推斷的字符串下面說明如何顯示以上述方式獲得的字符串的候選物。圖17到20表示如何顯示推斷的字符串。在每個(gè)例子中,字“大みか(Oomika)”被輸入并且推斷出字符串“茨城縣日立市大みか町(Ibaraki-ken,Hitachi-shi,Oomika-cho)”并進(jìn)行相就地顯示。所述例子之間的差別是在顯示裝置上字符串的位置不同。
在圖17的例子中,在候選字符串“茨城縣日立市大みか町(Ibaraki-ken,Hitachi-shi,Oomika-cho)”部分“大みか町(Oomika-cho)”的顯示位置靠近手寫字符“大みか(Oomika)”。這種類型顯示的優(yōu)點(diǎn)是,用戶可以容易地對(duì)手寫字符和其附近的識(shí)別候選字符進(jìn)行比較。
在圖18的例子中,候選字符串“茨城縣日立市大みか町(Ibaraki-ken,Hitachi-shi,Oomika-cho”從手寫字符“大みか(Oomika)”的開始位置附近被顯示。這種顯示使手寫字符和候選字符串的左邊對(duì)齊,清楚地表明識(shí)別結(jié)果在顯示器上的開始位置。
在圖19的例子中,顯示的候選字符串“茨城縣日立市大みか町(Inaraki-ken,Hitachi-shi,Oomika-cho)”在手寫字符“大みか(Oomika)”的位置上居中。這種顯示的優(yōu)點(diǎn)是手寫字符串和候選字符串互相靠近,因而用戶不必太多移動(dòng)其視線。
在圖20的例子中,手寫字符串“Oomika”和候選字符串“茨城縣日立市大みか町(Ibaraki-ken,Hitachi-shi,Oomika-cho)”的最后一個(gè)字符處于同一列。這種顯示尤其對(duì)右手的用戶有利,使得候選字符串不被藏在拿著筆的右手的下方。
系統(tǒng)或用戶可以按照其喜好選擇圖17到圖20所示的任一種顯示格式。
在圖17到圖20的例子中,在候選字符串中的關(guān)鍵字“大みか(Oomika)”以反視頻(reverse video)顯示以便強(qiáng)調(diào)。此外,關(guān)鍵字可利用不同的字體或用任何其它合適的方法加亮。另外一種方法是完全省去加亮的顯示部分。
如上所述,按照本發(fā)明的字符識(shí)別裝置只根據(jù)用戶輸入的手寫關(guān)鍵字例如地址或固定句子從等級(jí)數(shù)據(jù)結(jié)構(gòu)內(nèi)推斷整個(gè)字符串,并作為候選字符串顯示推斷的結(jié)果。本發(fā)明的裝置可以快速訪問內(nèi)部字庫進(jìn)行字匹配。其中字庫和以上實(shí)施例中一樣是分層的,對(duì)構(gòu)成字庫的任何一層的訪問可以高速地進(jìn)行,而與層的高低無關(guān)。
按照本發(fā)明,用戶只需要手寫關(guān)鍵字;其余的字符串由本發(fā)明的裝置推斷出來,從而作為識(shí)別結(jié)果輸出整個(gè)字符串。本發(fā)明的這些和其它的特點(diǎn)大大增強(qiáng)了字符識(shí)別處理的可操作性。
下面說明一種醫(yī)療保健檢索裝置,它能夠在其它的事項(xiàng)當(dāng)中容易地找到藥方的用途,和服藥注意事項(xiàng),這時(shí)只需輸入藥廠名字、藥名或藥的一部分代碼,或通過輸入病人名字的一部分便通過檢索找到病歷或病人的醫(yī)療保健情況。在檢索操作中,使用字符識(shí)別裝置用來識(shí)別輸入的字符圖形并通過參考等級(jí)結(jié)構(gòu)的字庫和字母對(duì)字母的轉(zhuǎn)移概率表推斷未被輸入的字。
圖23是使用本發(fā)明的手寫輸入醫(yī)療保健檢索裝置的功能框圖。
首先,用筆a209在小板a201上寫字符圖形、每個(gè)輸入字符圖形和預(yù)先在識(shí)別字庫a202中編目的字符圖形比較以找到和輸入的字符匹配的編目的字符圖形。對(duì)于每個(gè)輸入字符圖形,輸出包括候選字符的識(shí)別字符。通過參考字母對(duì)字母轉(zhuǎn)移概率表a204和字母出現(xiàn)概率表a208,求得最佳的排序,其中按順序列出候選字符以便形成字符串。和以前的字母對(duì)字母轉(zhuǎn)移概率相似,這個(gè)字母對(duì)字母轉(zhuǎn)移概率表a204也被用于預(yù)先存儲(chǔ)每個(gè)字母對(duì)字母轉(zhuǎn)移的概率以及包括這種轉(zhuǎn)移的在字庫中編目的字的指針。詳細(xì)地說,在優(yōu)化過程中,識(shí)別的和候選的字符被排序,從而產(chǎn)生優(yōu)化的字符串,其中作為字符串出現(xiàn)的字母的概率之和為最大。然后,在步a205,使用優(yōu)化的字符串根據(jù)字母對(duì)字母轉(zhuǎn)移概率表a204求出字庫a206中一個(gè)字的指針。該指針指的字是優(yōu)化的字符串。然后,在字對(duì)照和字符串推斷單元a207中,通過使用這一技術(shù)找到的字庫a206中的字和候選字符串比較,并求出關(guān)于該字以及其前后的字的信息。
標(biāo)號(hào)a210是醫(yī)藥表,其中說明例如每種藥的用途,服用的注意事項(xiàng)、副作用和服用其它藥時(shí)的注意事項(xiàng)。標(biāo)號(hào)a211是病人表,其中含有包括病歷和每個(gè)病人的醫(yī)療保健的信息,標(biāo)號(hào)a212是雇員登記表,用于存儲(chǔ)關(guān)于醫(yī)院雇員的信息,例如醫(yī)生、護(hù)士、藥劑師和醫(yī)療器械技師。
由上述的手寫輸入醫(yī)療保健檢索裝置進(jìn)行操作的結(jié)果在LCDa208上顯示。
下面參照?qǐng)D23、24和25說明用于檢索每種藥方的用途、服用注意、副作用和服用其它藥時(shí)注意事項(xiàng)的一個(gè)實(shí)施例,由對(duì)該手寫輸入醫(yī)療保健檢索裝置輸入醫(yī)藥代碼的部分進(jìn)行檢索。
圖24是使用本發(fā)明的手寫輸入醫(yī)藥檢索裝置的操作說明圖。
如圖所示,醫(yī)藥代碼TRN用筆a209輸入醫(yī)藥輸入?yún)^(qū)a201。字符識(shí)別單元a203利用手寫筆畫檢索識(shí)別字庫a202。作為檢索結(jié)果,字符識(shí)別單元a203輸出其它候選字當(dāng)中的第一候選字TRN和第二候選字TKM。通過參考字母對(duì)字母轉(zhuǎn)移概率表a204和字母出現(xiàn)概率表a208求得優(yōu)化順序,其中候選字符T,R,N,K和M按順序排列,從而形成字符串。使用字母對(duì)字母轉(zhuǎn)移概率表a204存儲(chǔ)醫(yī)藥代碼的這些候選字符的字母對(duì)字母的轉(zhuǎn)移概率和指向在字庫a206中預(yù)先編目的醫(yī)藥的指針。就當(dāng)注意,圖24沒有示出字母出現(xiàn)概率表a208。因?yàn)檩斎氲结t(yī)藥輸入?yún)^(qū)a201的從字母T到R再到字母N的轉(zhuǎn)移概率被發(fā)現(xiàn)為最高,所以確定字符串TRN作為代表醫(yī)藥代碼的候選字符的最佳順序,并發(fā)現(xiàn)字符串TRN和字母對(duì)字母轉(zhuǎn)移概率表a204中的指針X4相關(guān)。指針X4指向字庫a206中的叫作“トゥカリン(tokarin)”的藥和名字叫作“茨城制藥(Ibaraki Seiyaku)”的制藥廠,在字庫a206中預(yù)先編目醫(yī)藥名和藥廠以及藥代碼。因此,可以容易地識(shí)別藥名及其制造廠。
一旦藥名及基制造廠被識(shí)別出,如圖25所示的關(guān)于醫(yī)藥處方的用途、服用注意事項(xiàng)、副作用和服用其它藥時(shí)的注意事項(xiàng)可通過參考表a210得到。由圖25可見,藥“トウカリン(tokarin)”的效果增強(qiáng)叫作鋰的藥的效果而被叫作aspirin的藥減弱。
假設(shè)使用記錄筆a209向病人姓名輸入?yún)^(qū)a201輸入病人的姓名“一朗(Ichiro)”。手寫筆劃由字符識(shí)別單元a203用來檢索識(shí)別字庫a202。根據(jù)檢索結(jié)果,字符識(shí)別單元a203在其它候選字符當(dāng)中輸出第一候選字符“一朗(Ichiro)”和第二候選字符“一朗(Ichiro)”。通過參考字母對(duì)字母轉(zhuǎn)移概率表a204和字母出現(xiàn)概率表a208求出候選的日本字母“一(ichi)”,“一(ichi)”和“朗(ro)”被排序而形成字符串的最佳順序。字母對(duì)字母轉(zhuǎn)移概率表a204被用于存儲(chǔ)病人姓名的這些候選日本字母的每個(gè)字母對(duì)字母轉(zhuǎn)移的概率以及包括在字庫a206中預(yù)先被編目的轉(zhuǎn)移的病人姓名的指針。應(yīng)當(dāng)說明,圖26中未示出字母出現(xiàn)概率表a208。因?yàn)榍蟮玫膹娜毡咀帜浮耙?ichi)”到向病人姓名輸入?yún)^(qū)a201輸入的日本字母“朗(ro)”轉(zhuǎn)移的概率最高,所以字符串“一朗(Ichiro)”被確定為代表病人姓名的候選日本字符的最佳順序,并且發(fā)現(xiàn)字符串“一朗(Ichiro)”和字母對(duì)字母轉(zhuǎn)移概率表a204中的指針C2相關(guān)。指針C2在預(yù)先編目病人名字的字庫a206中指向病人的名字“山形一朗(Ichiro Yamagata)”。因此,病人姓名可以容易地被識(shí)別。
然后,醫(yī)生或護(hù)士可以更新在病人表a211中的例如病歷與醫(yī)病處理的信息。
在上述實(shí)施例中,說明了處理病人信息的操作。應(yīng)當(dāng)說明,所述處理可以用于處理在大醫(yī)院工作的顧員的狀態(tài)和工作情況,例如醫(yī)生、護(hù)士以及醫(yī)療設(shè)備技師。在這種情況下,需要預(yù)先生成用于存儲(chǔ)雇員記錄和雇用關(guān)系的字庫。
本實(shí)施例不僅可用于大醫(yī)院的雇用記錄,而且可用于一般公司的雇用記錄。
如上所述,只通過輸入藥名、病人名或雇員名的手寫部分,則可以容易地檢索出醫(yī)藥的用途、服用注意事項(xiàng)或病人的醫(yī)藥治療的記錄等信息,從而加強(qiáng)了手寫輸入的醫(yī)療檢索裝置的可操作性。
下面說明用于圖書檢索系統(tǒng)的情況。
圖27是圖書檢索系統(tǒng)的結(jié)構(gòu)的方塊圖。
圖中所示的標(biāo)號(hào)a301和a302分別是小平板和LCD(液晶顯示)。標(biāo)號(hào)a303代表字符識(shí)別單元,標(biāo)號(hào)a304代表字符識(shí)別字庫。標(biāo)號(hào)a305和a306分別代表主處理單元和用戶管理單元。標(biāo)號(hào)a307是用戶分戶賬,標(biāo)號(hào)a308代表借出書的數(shù)據(jù)。標(biāo)號(hào)a309和a310分別是書借出處理單元和圖書檢索處理單元。標(biāo)號(hào)a311代表書名檢索單元,標(biāo)號(hào)a312是書名字母對(duì)字母轉(zhuǎn)移率表。標(biāo)號(hào)a313和a314分別代表作為姓名檢索單元和作者姓名字母對(duì)字母轉(zhuǎn)移率表。標(biāo)號(hào)a315是書架布局處理單元標(biāo)號(hào)a316代表書架布局?jǐn)?shù)據(jù)。標(biāo)號(hào)a317和a318分別是新到圖書處理單元和檢索表產(chǎn)生單元。標(biāo)號(hào)a319是書收集表,標(biāo)號(hào)a320是作者姓名表。標(biāo)號(hào)a321和a322是出版者表和圖書收集總賬。標(biāo)號(hào)a323是出版者檢索處理單元,標(biāo)號(hào)a324是出版者名字字母對(duì)字母轉(zhuǎn)移率表。標(biāo)號(hào)a325和a326分別是關(guān)鍵字檢索處理單元和關(guān)鍵字字母對(duì)字母轉(zhuǎn)移概率表。標(biāo)號(hào)a327是關(guān)鍵字表1,標(biāo)號(hào)a328是卡片閱讀器。
下面說明圖書館檢索系統(tǒng)的操作。
在圖書館檢索系統(tǒng)被激活時(shí),主程序單元a305就在LCD a302上顯示一個(gè)菜單。圖書館檢索系統(tǒng)提供了供用戶使用的菜單,諸如圖書出租,圖書檢索,以及書架布局引導(dǎo),并且為圖書館管理人員提供了例如用戶管理和新書登記入冊的菜單。
如果用戶選擇了圖書出租菜單,主程序單元a305就請(qǐng)求圖書出租程序單元a309執(zhí)行圖書出租程序。用戶使用圖書出租菜單借書,并且用來預(yù)定借書。圖書出租程序單元a309通過主程序單元a305在LCD a302上顯示適當(dāng)?shù)男畔?,要求用戶?zhí)行一種操作。響應(yīng)這一信息,用戶通常需要將預(yù)先發(fā)放的用戶卡插入讀卡機(jī)a328,以便從用戶卡上讀出信息。讀卡機(jī)a328從用戶卡獲得用戶號(hào)碼,把用戶號(hào)碼送到用戶管理單元a306。用戶管理單元a306從用戶總帳a307中檢索該號(hào)碼,查出該號(hào)碼是否已被列入用戶總帳a307的目錄中,從而指示出用戶是有效用戶,也就是查出是否能把書借給該用戶。此時(shí),用戶的信息從用戶總帳a307中被讀出,并且送到圖書出租程序單元a309。送到圖書出租程序單元a309的信息包括圖書出租的目前狀態(tài)以及預(yù)定借書的狀態(tài)。另外,用戶總帳a307還包括每個(gè)用戶的信息,例如姓名,地址以及用戶的聯(lián)系方式。
如果圖書出租程序單元a309沒有從用戶管理單元a306獲得用戶的證實(shí),就在LCD a302上顯示一個(gè)信息,請(qǐng)用戶與圖書館管理人員聯(lián)系。這時(shí),程序就結(jié)束了。在LCD a302上也可以顯示要求用戶按照出租期限還書的信息或是用于解釋預(yù)定借書條件的信息。另一方面,如果圖書出租程序單元a309從用戶管理單元a306獲得了用戶的證實(shí),圖書出租程序單元a309就采用交互的方式接受用戶的借書或是預(yù)定借書目錄。借書或是預(yù)定借書的情況被記錄在圖書出租數(shù)據(jù)a308中,用于編制每本書的圖書出租狀態(tài)。
如果選擇了書架布局引導(dǎo)菜單,主程序單元a305就請(qǐng)求書架布局程序單元a315執(zhí)行書架布局引導(dǎo)程序。書架布局引導(dǎo)程序?yàn)橛脩籼峁┫驅(qū)?,指示出在圖書館的某一具體位置可以找到需要的書。如果用戶指定了需要的書,書架布局程序單元a315就從書架布局?jǐn)?shù)據(jù)a316中讀出每本書的位置信息。然后,主程序單元a305隨著表示所需圖書的圖書出租狀態(tài)的直接引導(dǎo)把表示所需圖書位置的書架布局顯示在LCD a302上,這種出租狀態(tài)是對(duì)圖書出租程序單元a309進(jìn)行適當(dāng)查詢的結(jié)果,如圖28中的窗口W4所示。另外,在必要時(shí)還可以顯示詳細(xì)的內(nèi)容。
如果選擇了用戶管理菜單,主程序單元a305就請(qǐng)求用戶管理單元a306執(zhí)行用戶管理程序,其中包括登記尚未登記的新用戶。
在用戶管理程序中,用戶管理單元a306請(qǐng)求圖書館管理人員輸入管理人員的登記號(hào)和用來證實(shí)管理人員的口令。如果管理人員得不到證實(shí),就顯示與圖書館管理人員聯(lián)系的信息,并且結(jié)束程序。另一方面,如果管理人員得到證實(shí),就接受由管理人員輸入的新登記用戶的私人數(shù)據(jù),例如姓名,地址,并且給用戶分配一個(gè)用戶號(hào)碼。然后把私人數(shù)據(jù)和用戶號(hào)碼登記在用戶總帳a307中。在此時(shí)也可以向用戶發(fā)放一個(gè)用戶卡。
如果選擇了新書登記入冊的菜單,主程序單元a305就請(qǐng)求新書登記入冊程序單元a317執(zhí)行新書登記入冊程序。
在新書登記入冊程序中,把一本沒有登記的新書包括在圖書集內(nèi)。
當(dāng)新書登記入冊程序單元a317接收到圖書館管理人員輸入的圖書數(shù)據(jù)時(shí),這種圖書數(shù)據(jù)就被傳送到檢索表產(chǎn)生單元a318。這種圖書數(shù)據(jù)包括需要登記的新書的信息,例如書名,作者和出版商的名稱,以及管理人員為這本書分配的關(guān)鍵字。檢索表產(chǎn)生單元a318把圖書數(shù)據(jù)登記在圖書收集總帳a322中,并且隨后或是在以后的適當(dāng)時(shí)間使用圖書收集總帳a322中新登記的圖書數(shù)據(jù)來更新書名字符到字符轉(zhuǎn)換概率表a312,作者名字符到字符轉(zhuǎn)換概率表a314,出版商字符到字符轉(zhuǎn)換概率表a324,關(guān)鍵字字符到字符轉(zhuǎn)換概率表a326,圖書收集表a319,作者名稱表a320,出版商表a321,以及關(guān)鍵字表a327的內(nèi)容。
圖29是表示圖書收集總帳a322結(jié)構(gòu)的示意圖。
如圖中所示,圖書收集總帳a322中已經(jīng)為圖書收集號(hào)碼輸入了各種登記數(shù)據(jù),例如書名,作者和出版商的名稱,以及關(guān)鍵字,圖書收集號(hào)碼被用作書的參考號(hào)碼。
圖30(a),(b)和(c)分別是表示圖書收集表a319,作者名稱表a320和出版商表a321的示意圖。
圖書收集表a319包含的內(nèi)容與圖書收集總帳a322相同,其區(qū)別僅是圖書收集表a319中的信息是按照可以執(zhí)行檢索操作的格式來登記的。在圖書收集表a319中為每個(gè)圖書收集號(hào)碼登記了書名,作者號(hào)碼,出版商號(hào)碼,以及關(guān)鍵字號(hào)碼。
在作者名稱表a320中為每個(gè)作者名稱分配一個(gè)作者號(hào)碼。對(duì)每個(gè)作者號(hào)碼登記分配了作者號(hào)碼的作者名稱,還有用圖書收集號(hào)碼代表的圖書收集量。另一方面,在出版商表a321中為每個(gè)出版商名稱分配一個(gè)出版商號(hào)碼。對(duì)每個(gè)出版商號(hào)碼登記分配了出版商號(hào)碼的出版商名稱,還有用圖書收集號(hào)碼代表的圖書收集量。
在圖中沒有表示出關(guān)鍵字表a327的結(jié)構(gòu)。然而,在關(guān)鍵字表a327中為每個(gè)關(guān)鍵字分配了一個(gè)關(guān)鍵字號(hào)碼。隨著用圖書收集號(hào)碼代表的并且具有分配的相同關(guān)鍵字的圖書收集量為每個(gè)關(guān)鍵字號(hào)碼登記與關(guān)鍵字號(hào)碼相關(guān)的關(guān)鍵字。
值得注意的是,圖書收集號(hào)碼是按照逐個(gè)的順序與書名相聯(lián)系的。在圖書收集表a319中,書名是直接描述圖書的唯一的數(shù)據(jù)項(xiàng)。為了使登記在圖書收集表a319中的數(shù)據(jù)項(xiàng)一致,只要用書名號(hào)碼為相關(guān)的每個(gè)書名產(chǎn)生一個(gè)獨(dú)立的表,就可以在圖書收集表a319中的書名位置上登記一個(gè)書名號(hào)碼。
圖31是表示書名字符到字符轉(zhuǎn)換概率表a312結(jié)構(gòu)的示意圖。作者名字符到字符轉(zhuǎn)換概率表a314,出版商字符到字符轉(zhuǎn)換概率表a324,以及關(guān)鍵字字符到字符轉(zhuǎn)換概率表a326與圖中所示的書名字符到字符轉(zhuǎn)換概率表a312具有相同的結(jié)構(gòu)。
如圖中所示,在書名字符到字符轉(zhuǎn)換概率表a312中為包括在圖書收集量中的每個(gè)書名中的每個(gè)字符登記了字符出現(xiàn)的次數(shù),字符到字符的轉(zhuǎn)換次數(shù),以及圖書的圖書收集號(hào)碼。
在圖中最左側(cè)一欄中所示的標(biāo)號(hào)101至105表示在收集的圖書名稱中各個(gè)字符出現(xiàn)的次數(shù)。如圖中所示,日語字符"シ(shi)"出現(xiàn)27次,字符"ス(su)"出現(xiàn)108次,而字符"タ(ta)"出現(xiàn)250次。用一個(gè)字符出現(xiàn)的次數(shù)除以所有字符出現(xiàn)的總次數(shù),所獲的結(jié)果就是該字符的出現(xiàn)概率。
在圖中左側(cè)第二欄中所示的標(biāo)號(hào)110至117各自表示字符到字符的轉(zhuǎn)換次數(shù)。例如標(biāo)號(hào)101與標(biāo)號(hào)110相連接,表示由字符"シ(shi)"101及隨后的字符"ン(ng)"構(gòu)成的一對(duì)順序的字符在書名中出現(xiàn)的次數(shù)是10。盡管標(biāo)號(hào)101是通過標(biāo)號(hào)110與標(biāo)號(hào)111相連接的,象標(biāo)號(hào)101和110直接連接的情況一樣,這種間接連接表示由字符"シ(shi)"101及隨后的字符"ス(su)"構(gòu)成的一對(duì)順序的字符在書名中出現(xiàn)的次數(shù)是17。按照這種方式,字符到字符的轉(zhuǎn)換次數(shù)代表了一對(duì)字符在書名中出現(xiàn)的次數(shù)。用字符到字符的轉(zhuǎn)換次數(shù)除以第一個(gè)字符的出現(xiàn)次數(shù),所獲的結(jié)果就是這對(duì)順序字符的字符到字符轉(zhuǎn)換概率。
在圖中第三欄中所示的標(biāo)號(hào)121至135各自表示一個(gè)圖書收集號(hào)。例如,標(biāo)號(hào)121到123各自表示一本書的圖書收集號(hào),這本書的書名包括由標(biāo)號(hào)110表示的一對(duì)字符"シン(shing)",盡管標(biāo)號(hào)121被直接連接到標(biāo)號(hào)110,而標(biāo)號(hào)122是通過標(biāo)號(hào)121間接地連接到標(biāo)號(hào)110,并且標(biāo)號(hào)123是通過標(biāo)號(hào)122和121間接地連接到標(biāo)號(hào)110的。這樣,標(biāo)號(hào)121到123就分別代表了圖書收集號(hào)為Bi,Bi+1和Bj的書,其各自的書名中包括一對(duì)字符"シン(shing)"。在圖中所示的字"Null"表示連接的結(jié)束。
另外,書名的字符到字符轉(zhuǎn)換概率表a312也可以重新布置成圖32所示的結(jié)構(gòu)。
圖32中所示的結(jié)構(gòu)適合這樣一種用途,其中的書名是按照日文kana-letters或拼音字符來登記的。也就是說,圖中所示的結(jié)構(gòu)適合采用例如日文katakana字符進(jìn)行登記的書名,為了在圖38所示的那種圖書館檢索系統(tǒng)中能夠?qū)嵤?,字符?shù)量通常不能超過70,以便高效率地登記字符出現(xiàn)的次數(shù),字符到字符的轉(zhuǎn)換次數(shù),以及圖書收集號(hào)。
圖32所示的結(jié)構(gòu)包括字符出現(xiàn)計(jì)數(shù)表a312-1,用于登記每個(gè)字符在書名中出現(xiàn)的次數(shù),一個(gè)字符到字符轉(zhuǎn)換計(jì)數(shù)表a312-2,用于登記在書名中每個(gè)字符后面有另一個(gè)字符的次數(shù),以及一個(gè)字符轉(zhuǎn)換/圖書收集號(hào)碼表a312-3,其各個(gè)入口被用于登記字符到字符的轉(zhuǎn)換和書名中包括這種轉(zhuǎn)換的那些圖書的圖書收集號(hào)碼。
以下要說明在選擇了圖書館檢索菜單時(shí)執(zhí)行的圖書館檢索程序。
如果在圖27所示的圖書館檢索系統(tǒng)中選擇了圖書館檢索菜單,就請(qǐng)求圖書館檢索程序單元a310執(zhí)行圖書館檢索程序。
圖33是一個(gè)流程示意圖,表示圖書館檢索程序的流程。
如圖中所示,圖書館檢索程序從用于識(shí)別用戶的子程序p1開始。用戶是通過與前述的圖書出租程序單元a309所執(zhí)行的用戶證實(shí)相同的程序來識(shí)別的。如果用戶得不到證實(shí),就在LCD a302上顯示一個(gè)信息,要求用戶與圖書館管理人員聯(lián)系,然后結(jié)束程序。即使用戶得不到證實(shí),程序仍可以進(jìn)行到后面的子程序p2,用于接待作為客人的用戶。另一方面,如果用戶得到證實(shí),程序自然會(huì)進(jìn)行到子程序p2。
在子程序p2中,用戶要輸入檢索關(guān)鍵字和每個(gè)檢索關(guān)鍵字的加權(quán)。為了詳細(xì)解釋,把圖34中所示的窗口W1顯示在LCD a302上。然后由用戶在窗口W1上為每個(gè)檢索項(xiàng)輸入一個(gè)字符串。在按下窗口W1的檢索按鈕時(shí),各個(gè)字符串就被接納為各個(gè)檢索項(xiàng)的檢索關(guān)鍵字。對(duì)每個(gè)檢索項(xiàng)可以采用多個(gè)字符串。在這種情況下,用戶要在兩個(gè)順序的字符串之間輸入一個(gè)作為分隔符的空格。應(yīng)該注意到,在本實(shí)施例中采用了手寫輸入接口。具體地說,如圖34所示,用戶在手寫輸入板a301上用手寫的字符串出現(xiàn)在LCD a302上顯示的窗口W2上。識(shí)別這種字符串,并且將識(shí)別結(jié)果顯示在窗口W1的各個(gè)檢索項(xiàng)方框內(nèi)的光標(biāo)位置上。
作為一個(gè)檢索項(xiàng)的加權(quán),在把字符串輸入到檢索項(xiàng)方框內(nèi)的同時(shí)顯示一個(gè)檢索項(xiàng)的字符串的加權(quán)輸入窗口W4。用戶在加權(quán)輸入窗口W4上的輸入被接納為檢索關(guān)鍵字的加權(quán)。如果用戶沒有在加權(quán)輸入窗口W4上輸入,就假設(shè)加權(quán)為1。在用戶從加權(quán)輸入窗口W4上輸入加權(quán)之后,也就是在開始輸入另一個(gè)字符串時(shí),為這一字符串輸入的加權(quán)就被顯示在一個(gè)圓括號(hào)()內(nèi)。應(yīng)該注意到,在加權(quán)的位置上可以對(duì)準(zhǔn)備用作檢索關(guān)鍵字的每個(gè)字符串分配一個(gè)優(yōu)先權(quán)順序號(hào)碼。
為準(zhǔn)備用作檢索關(guān)鍵字的字符串分配的上述加權(quán)可以讓用戶區(qū)分出一個(gè)字符串,例如,用戶可能是根據(jù)模糊的記憶把一個(gè)字符串確定為輸入的檢索關(guān)鍵字的。例如,如果用戶清楚地記住了被檢索的書名中的一個(gè)可以作為關(guān)鍵字的字,用戶就將該關(guān)鍵字的加權(quán)設(shè)定成較大的值。另一方面,如果用戶只能模糊地記住被檢索的書名中的一個(gè)可以作為關(guān)鍵字的字,就可以將這一檢索關(guān)鍵字的加權(quán)設(shè)定成較小的值。另外,可以預(yù)先為每個(gè)檢索項(xiàng)分配缺省的加權(quán)或是缺省的優(yōu)先權(quán)順序號(hào)。在這種情況下,如果用戶沒有輸入一個(gè)檢索項(xiàng)的加權(quán)或是優(yōu)先權(quán)順序號(hào),就使用分配給該檢索項(xiàng)的缺省值。只有數(shù)據(jù)庫的設(shè)計(jì)人員或是圖書館管理人員才能設(shè)定這種缺省值。
在圖34所示的實(shí)例中,加權(quán)2和加權(quán)1分別被分配給書名檢索項(xiàng)中的字符串"インタ-フエ-ス(接口)"和字符串"設(shè)計(jì)(sekkei)",而作者名稱檢索項(xiàng)的字符串"橫田(yokota)"的加權(quán)被設(shè)定為1。
如圖33所示,程序流程在此后進(jìn)到子程序p3到p6。在子程序p3到p6中,圖書館檢索程序單元a310請(qǐng)求檢索程序單元對(duì)作為各個(gè)檢索項(xiàng)的檢索關(guān)鍵字而輸入的字符串表示的檢索項(xiàng)執(zhí)行檢索程序。這種檢索程序單元包括書名檢索單元a311,作者名稱檢索單元a313,出版商名稱檢索單元a323,以及關(guān)鍵字檢索單元a325。值得注意的是圖中僅僅表示了書名檢索單元a311和作者名稱檢索單元a313。例如,假設(shè)在子程序p2中輸入了書名檢索項(xiàng)的字符串。在這種情況下,就請(qǐng)求書名檢索單元a311檢索由輸入的字符串表示的書名。值得注意的是,如果在子程序p2中為一個(gè)沒有在窗口W1中限定的檢索項(xiàng)輸入一個(gè)字符串,就要求書名檢索單元a311,作者名稱檢索單元a313,出版商檢索單元a323,以及關(guān)鍵字檢索單元a325等等所有檢索程序單元對(duì)輸入的字符串所代表的檢索項(xiàng)進(jìn)行檢索。
由書名檢索單元a311,作者名稱檢索單元a313,出版商檢索單元a323,以及關(guān)鍵字檢索單元a325等等各個(gè)檢索程序單元執(zhí)行的檢索程序在以下以書名檢索單元a311所執(zhí)行的操作為例來說明。
程序從子程序p3開始,在此時(shí)輸入用戶為書名檢索項(xiàng)輸入的檢索關(guān)鍵字。如果用戶輸入了一個(gè)關(guān)鍵字,程序流程就進(jìn)到子程序p4,書名檢索單元a311在此時(shí)執(zhí)行檢索程序,按照下述方式找出由作為書名檢索項(xiàng)關(guān)鍵字而輸入的字符串所代表的書名。
指定圖書的書名是這樣查找的,即根據(jù)書名的字符到字符轉(zhuǎn)換概率表a312找到圖書的圖書收集號(hào)碼,該書的書名中包含部分或全部輸入的字符串。然后在找到的書中選擇具有最高轉(zhuǎn)換匹配度的書。應(yīng)該注意到,書的轉(zhuǎn)換匹配度通常被限定為書名中的字符到字符的轉(zhuǎn)換與輸入的字符串中的字符到字符的轉(zhuǎn)換相匹配的次數(shù)。作為另外一種方式,把所有具有非零轉(zhuǎn)換匹配度的書,也就是書名中包含部分或全部輸入字符串的書找出來。
通過以下的例子可以進(jìn)一步解釋一本書的轉(zhuǎn)換匹配度。在上述的例子中輸入的字符串是"インタ-フエ-ス(接口)"。采用書名字符到字符轉(zhuǎn)換概率表a312檢索的結(jié)果是書名為"マンマシンインタ-フヱ-スの設(shè)計(jì)技術(shù)(人-機(jī)接口設(shè)計(jì)技術(shù))"和"マリ-とボンタ-フエ-ス(Marry and ponterface)"的書。對(duì)于第一本書的情況,在其書名中的一個(gè)詞"インタ-フエ-ス(接口)"中,從日語字符"イ(i)"到"ン(ng)",從"ン(ng)"到"タ(ta)"等等的轉(zhuǎn)換與輸入字符串"インタ-フエ-ス(接口)"中的轉(zhuǎn)換相匹配的次數(shù)是7。這樣,第一本書的轉(zhuǎn)換匹配度就是7。另一方面,對(duì)于第二本書的情況,在其書名中的詞"ボンタ-フエ-ス(ponterface)"中,從日語字符"タ(ta)"到"-(ah)",從"-(ah)"到"フ(fu)"等等的轉(zhuǎn)換與輸入字符串"インタ-フエ-ス(接口)"中的轉(zhuǎn)換相匹配的次數(shù)是5。這樣,第二本書的轉(zhuǎn)換匹配度就是5。順便說說,書名為"お庭の設(shè)計(jì)(庭院設(shè)計(jì))"的書的轉(zhuǎn)換匹配度是0。這樣,如果找到了所有具有非零轉(zhuǎn)換匹配度的書,采用書名的字符到字符轉(zhuǎn)換概率表a312檢索的結(jié)果就是上述書名為"マンマシンインタ-フヱ-スの設(shè)計(jì)技術(shù)(人-機(jī)接口設(shè)計(jì)技術(shù))"和"マリ-とボンタ-フエ-ス(Marry andponterface)"的書的圖書收集號(hào)碼。
具體地說,在圖31中所示的書名的字符到字符轉(zhuǎn)換概率表a312中進(jìn)行檢索,從而獲得與作為檢索關(guān)鍵字輸入的字符串中從一個(gè)字符到下一個(gè)字符的任何轉(zhuǎn)換有聯(lián)系的圖書收集號(hào)碼。在這種情況下,在檢索期間,圖書收集號(hào)碼在字符到字符轉(zhuǎn)換次數(shù)的位置上出現(xiàn)的次數(shù)被用作轉(zhuǎn)換匹配度,并且找到具有最高轉(zhuǎn)換匹配度的書。作為另外一種方式,可以按上述辦法列出所有具有非零轉(zhuǎn)換匹配度的書。例如,假設(shè)作為檢索關(guān)鍵字輸入的字符串是"シスの(shisuno)"。對(duì)于字符串中從日語字符"シ(shi)"到"ス(su)"的轉(zhuǎn)換來說,從圖中分別可以找到用標(biāo)號(hào)124和125表示的圖書收集號(hào)碼Bk和Bk+1。另一方面,對(duì)于字符串中從日語字符"ス(su)"到"の(no)"的轉(zhuǎn)換來說,從圖中分別可以找到用標(biāo)號(hào)126和127表示的圖書收集號(hào)碼Bk和Bk+1。對(duì)于所有的圖書收集號(hào)碼BC,Bk,Bk+1來說,書名中字符到字符的轉(zhuǎn)換與輸入字符串中的字符到字符的轉(zhuǎn)換相匹配的次數(shù)是1。然而,如果把圖書收集號(hào)碼在檢索期間出現(xiàn)的次數(shù)作為轉(zhuǎn)換匹配度,圖書收集號(hào)碼BC的轉(zhuǎn)換匹配度就是2,而其他圖書收集號(hào)碼Bk和Bk+1的轉(zhuǎn)換匹配度為1。
在按照上述方式選擇了圖書收集號(hào)碼之后,書名檢索程序單元a311就把根據(jù)作為書名檢索關(guān)鍵字輸入的每個(gè)字符串找到的圖書收集號(hào)碼的清單及其轉(zhuǎn)換匹配度一起送給圖書館檢索程序單元a310。程序隨后進(jìn)到子程序p5和p6,請(qǐng)求作者名稱檢索程序單元a313根據(jù)用戶輸入的作者名稱檢索項(xiàng)關(guān)鍵字的字符串來執(zhí)行程序。如上所述,作者名稱檢索程序單元a313,出版商檢索程序單元a323和關(guān)鍵字檢索程序單元a325執(zhí)行的程序與書名檢索程序單元a311執(zhí)行的程序相同。
如圖33所示,程序隨后進(jìn)到子程序p7,由圖書館檢索程序單元a310重新排列根據(jù)從書名檢索程序單元a311,作者名稱檢索程序單元a313,出版商檢索程序單元a323以及關(guān)鍵字檢索程序單元a325接受到的作為關(guān)鍵字輸入的每個(gè)字符串找到的圖書收集號(hào)碼清單中包括的圖書收集號(hào)碼,按照這些圖書收集號(hào)碼的轉(zhuǎn)換匹配度和用戶隨字符串一起輸入的加權(quán)將這些圖書收集號(hào)碼按預(yù)定順序排列。然后從圖書收集表a319中,作者名稱表a320中,出版商表a321中,以及關(guān)鍵字表a327中讀出這些圖書收集號(hào)碼的圖書館數(shù)據(jù),并且由主程序單元a305按照重新排列的圖書收集號(hào)碼順序?qū)?shù)據(jù)顯示在LCD a302上,如圖35所示。重新排列通常是按以下方式進(jìn)行的。
例如,如果即沒有設(shè)定加權(quán)也沒有設(shè)定優(yōu)先權(quán)順序號(hào),并且對(duì)于一個(gè)檢索項(xiàng)僅僅輸入了作為檢索關(guān)鍵字的一個(gè)字符串,圖書收集號(hào)碼就按照獲得的轉(zhuǎn)換匹配度的遞減順序排列。如果即沒有設(shè)定加權(quán)也沒有設(shè)定優(yōu)先權(quán)順序號(hào),并且對(duì)于一個(gè)檢索項(xiàng)輸入了作為檢索關(guān)鍵字的N個(gè)字符串,圖書收集號(hào)碼就按照具體計(jì)算數(shù)值的遞減順序排列。這一數(shù)值可以是每本書的N個(gè)轉(zhuǎn)換匹配度的總和或是其乘積。按照另一種方式,這一數(shù)值是用某種函數(shù)對(duì)N個(gè)轉(zhuǎn)換匹配度進(jìn)行變換的結(jié)果。如果即沒有設(shè)定加權(quán)也沒有設(shè)定優(yōu)先權(quán)順序號(hào),并且對(duì)于每k個(gè)檢索項(xiàng)輸入了作為檢索關(guān)鍵字的M個(gè)字符串,圖書收集號(hào)碼就按照具體計(jì)算數(shù)值的遞減順序排列。這種數(shù)值可以是每本書的k×M轉(zhuǎn)換匹配度的總和,乘積或是另外的函數(shù)變換結(jié)果。在按照總和或是根據(jù)函數(shù)的變換結(jié)果計(jì)算各個(gè)數(shù)值時(shí),將各個(gè)轉(zhuǎn)換匹配度與根據(jù)用于轉(zhuǎn)換匹配度的字符串長度確定的加權(quán)相乘。然后按照所得數(shù)值的遞減順序來排列圖書收集號(hào)碼。
如果把字符串設(shè)定為書名和作者名稱檢索項(xiàng)的檢索關(guān)鍵字,給予書名檢索項(xiàng)的字符串高于作者名稱檢索項(xiàng)的優(yōu)先權(quán)順序號(hào),圖書收集號(hào)碼就按照用書名檢索程序單元a311找到的轉(zhuǎn)換匹配度的遞減順序排列。如果用書名檢索程序單元a311找到的兩個(gè)以上圖書收集號(hào)碼具有相等的轉(zhuǎn)換匹配度,圖書收集號(hào)碼就按照用作者名稱檢索程序單元a312找到的轉(zhuǎn)換匹配度的遞減順序排列。
用書名檢索程序單元a311找到的具有相等轉(zhuǎn)換匹配度兩個(gè)以上圖書收集號(hào)碼在使用作者名稱檢索程序單元a312時(shí)可能找不到轉(zhuǎn)換匹配度。在這種情況下,就把這種圖書收集號(hào)碼當(dāng)作由作者名稱檢索程序單元a312找到的轉(zhuǎn)換匹配度為零的圖書收集號(hào)碼來處理。另外,在為每個(gè)檢索項(xiàng)設(shè)定了多個(gè)字符串的情況下,圖書收集號(hào)碼的排列方式與采用轉(zhuǎn)換匹配度和優(yōu)先權(quán)順序號(hào)時(shí)相同。
舉例來說,可以將設(shè)定成書名檢索項(xiàng)檢索關(guān)鍵字的字符串"インタ-フエ-ス(接口)"的加權(quán)設(shè)置為2,將設(shè)定成書名檢索項(xiàng)檢索關(guān)鍵字的字符串"設(shè)計(jì)"的加權(quán)設(shè)置為1,而將設(shè)定成作者名稱檢索項(xiàng)檢索關(guān)鍵字的字符串"橫田(Yokota)"的加權(quán)設(shè)置為1。在這種情況下找出加權(quán)的轉(zhuǎn)換匹配度,并且采用下文所述的方式按照找到的加權(quán)的轉(zhuǎn)換匹配度的遞減順序來排列圖書收集號(hào)碼。
以下的段落i到v是各本書的數(shù)據(jù),包括按順序排列的書名,書作者的名稱,以及書的出版商,這些例子可以解釋如何找到一本書的轉(zhuǎn)換匹配度。
i 書名"マンマシンインタ-フヱ-スの設(shè)計(jì)技術(shù)"(人-機(jī)接口設(shè)計(jì)技術(shù))作者"橫田他(Yokota等人)"出版商"YHG社(YHG公司)"計(jì)算關(guān)鍵字的加權(quán)的轉(zhuǎn)換匹配度1.關(guān)鍵字"インタ-フヱ-ス(接口)"的轉(zhuǎn)換匹配度從日語字符"イ(i)"到"ス(ng)",從"ス(ng)"到"タ(ta)"等等的轉(zhuǎn)換次數(shù)是7。
2.關(guān)鍵字"設(shè)計(jì)(sekkei)"的轉(zhuǎn)換匹配度從日語字符"設(shè)(setsu)"到"計(jì)(kei)"的轉(zhuǎn)換次數(shù)是1。
3.關(guān)鍵字"橫田(Yokota)"的轉(zhuǎn)換匹配度從日語字符"橫(yoko)"到"田(ta)"的轉(zhuǎn)換次數(shù)是1。這樣,關(guān)鍵字的轉(zhuǎn)換匹配度就是7*2+1*1+1*1=16。
ii.書名"日立は今インタ-フヱ-ス(Hitachi wa Ima interface)作者"橫田他(Yokota等人)"出版商"きりん堂(kirindoh公司)"計(jì)算關(guān)鍵字的加權(quán)的轉(zhuǎn)換匹配度1.關(guān)鍵字"インタ-フヱ-ス(接口)"的轉(zhuǎn)換匹配度從日語字符"イ(i)"到"ン(ng)",從"ン(ng)"到"タ(ta)"等等的轉(zhuǎn)換次數(shù)是7。
2.關(guān)鍵字"設(shè)計(jì)(sekkei)"的轉(zhuǎn)換匹配度由于此時(shí)在關(guān)鍵字的轉(zhuǎn)換中沒有轉(zhuǎn)換匹配,從"設(shè)(setsu)"到"計(jì)(kei)"的轉(zhuǎn)換次數(shù)是0。
3.關(guān)鍵字"橫田(Yokota)"的轉(zhuǎn)換匹配度從日語字符"橫(yoko)"到"田(ta)"的轉(zhuǎn)換次數(shù)是1。
因此,關(guān)鍵字的轉(zhuǎn)換匹配度就是7*2+0*1+1*1=15。
iii.書名"マンマシンインタ-フヱ-スの最佳設(shè)計(jì)"(人-機(jī)接口的最佳設(shè)計(jì))作者"山田他(Yamada等人)"出版商"日本館(Nihon-kan公司)"計(jì)算關(guān)鍵字的加權(quán)的轉(zhuǎn)換匹配度1.關(guān)鍵字"インタ-フヱ-ス(接口)"的轉(zhuǎn)換匹配度從日語字符"イ(i)"到"ン(ng)",從"ン(ng)"到"タ(ta)"等等的轉(zhuǎn)換次數(shù)是7。
2.關(guān)鍵字"設(shè)計(jì)(sekkei)"的轉(zhuǎn)換匹配度從日語字符"設(shè)(setsu)"到"計(jì)(kei)"的轉(zhuǎn)換次數(shù)是1。
3.關(guān)鍵字"橫田(Yokota)"的轉(zhuǎn)換匹配度由于此時(shí)在關(guān)鍵字的轉(zhuǎn)換中沒有轉(zhuǎn)換匹配,從"橫(yoko)"到"田(ta)"的轉(zhuǎn)換次數(shù)是0。
因此,關(guān)鍵字的轉(zhuǎn)換匹配度就是7*2+1*1+0*1=15。
iv.書名"マリ-とボンタ-フエ-ス(Marry and ponterface)"作者"ルタ-著(Ruter)"出版商"よい子の童話社(Yoi Ko No Dowa Company)"計(jì)算關(guān)鍵字的加權(quán)的轉(zhuǎn)換匹配度1.關(guān)鍵字"インタ-フヱ-ス(接口)"的轉(zhuǎn)換匹配度從日語字符"タ(ta)"到"-(ah)",從"-(ah)"到"ス(su)"等等的轉(zhuǎn)換次數(shù)是5。
2.關(guān)鍵字"設(shè)計(jì)(sekkei)"的轉(zhuǎn)換匹配度由于此時(shí)在關(guān)鍵字的轉(zhuǎn)換中沒有轉(zhuǎn)換匹配,從"設(shè)(setsu)"到"計(jì)(kei)"的轉(zhuǎn)換次數(shù)是0。
3.關(guān)鍵字"橫田(Yokota)"的轉(zhuǎn)換匹配度由于此時(shí)在關(guān)鍵字的轉(zhuǎn)換中沒有轉(zhuǎn)換匹配,從"橫(yoko)"到"田(ta)"的轉(zhuǎn)換次數(shù)是0。因此,關(guān)鍵字的轉(zhuǎn)換匹配度就是5*2+0*1+0*1=10。v.書名"ぉ庭の設(shè)計(jì)(庭院設(shè)計(jì))"
作者"橫田太朗(Taro Yokota)"出版商"大邸宅社(Daiteitaku Company)"計(jì)算關(guān)鍵字的加權(quán)的轉(zhuǎn)換匹配度1.關(guān)鍵字"インタ-フヱ-ス(接口)"的轉(zhuǎn)換匹配度由于在關(guān)鍵字的轉(zhuǎn)換中沒有轉(zhuǎn)換匹配,從"イ(i)"到"ン(ng)",從"ン(ng)"到"タ(ta)"等等的轉(zhuǎn)換次數(shù)是0。
2.關(guān)鍵字"設(shè)計(jì)(sekkei)"的轉(zhuǎn)換匹配度從日語字符"設(shè)(setsu)"到"計(jì)(kei)"的轉(zhuǎn)換次數(shù)是1。
3.關(guān)鍵字"橫田(Yokota)"的轉(zhuǎn)換匹配度從"橫(yoko)"到"田(ta)"的轉(zhuǎn)換次數(shù)是1。因此,關(guān)鍵字的轉(zhuǎn)換匹配度就是0*2+1*1+1*1=2。
與此相應(yīng),用戶通過輸入作為檢索關(guān)鍵詞的字符串"インタ-フヱ-ス(接口)","設(shè)計(jì)(sekkei)",和"橫田(Yokota)"進(jìn)行的檢索操作結(jié)果可以按照按上述方式計(jì)算的加權(quán)轉(zhuǎn)換匹配度的遞減順序顯示出來。
另外,在圖33所示的圖書館檢索程序中,不僅可以在LCD a312上顯示檢索操作的結(jié)果,用戶還可以從顯示的檢索操作結(jié)果中間選擇一本書,并且利用選定圖書的書架布局引導(dǎo)程序和圖書出租程序。
具體地說,在找到已經(jīng)重新排列和顯示的圖書之后,程序流程就進(jìn)到子程序p8,找出從顯示的圖書清單中是否選擇了某一本書。如果從顯示的圖書清單中選擇了一本具體的書,程序流程就進(jìn)到子程序p9,此時(shí)請(qǐng)求書架布局引導(dǎo)單元a315執(zhí)行針對(duì)選定圖書的書架布局引導(dǎo)程序。響應(yīng)這一請(qǐng)求,書架布局引導(dǎo)程序單元a315為選定的圖書執(zhí)行書架布局引導(dǎo)程序。然后,程序進(jìn)到子程序p10,查看是否有預(yù)定借閱選定圖書的請(qǐng)求。如果找到了用戶輸入的預(yù)定借閱選定圖書的請(qǐng)求,程序流程就進(jìn)到子程序p11,請(qǐng)求圖書出租程序單元a309對(duì)選定圖書執(zhí)行圖書出租程序。圖書出租程序單元a309接收到這一請(qǐng)求,執(zhí)行圖書出租程序。在對(duì)選定圖書執(zhí)行了圖書出租程序之后,程序流程就進(jìn)到子程序p12,使控制程序返回圖書館檢索程序單元a310。應(yīng)該注意到,如果在子程序p8中沒有從顯示的圖書清單中選擇某一本書,程序流程仍會(huì)進(jìn)到子程序p12。在子程序p12中,圖書館檢索程序單元a310接收來自用戶的一個(gè)指令,以便停止或是繼續(xù)檢索程序。圖書館檢索程序單元a310接收這一指令,從而結(jié)束程序,或是返回重復(fù)執(zhí)行程序的子程序p12,以便繼續(xù)執(zhí)行程序。
到此為止已經(jīng)描述了圖書館檢索系統(tǒng)的一個(gè)實(shí)施例。
在上述的實(shí)施例中為每個(gè)準(zhǔn)備檢索的項(xiàng)目提供了檢索程序單元和字符到字符的轉(zhuǎn)換概率表,這些檢索項(xiàng)目是書名,作者名稱,出版商,以及關(guān)鍵詞。還需要強(qiáng)調(diào)的一點(diǎn)是,盡管本發(fā)明是參照上述實(shí)施例來解釋的,但是這種解釋并不會(huì)構(gòu)成對(duì)本發(fā)明的限制。也就是說,本發(fā)明所概括的主題并不僅限于這一實(shí)施例。本領(lǐng)域的技術(shù)人員根據(jù)上述說明顯然還可以實(shí)現(xiàn)各種修改和變更。例如,一個(gè)檢索程序單元和一個(gè)字符到字符的轉(zhuǎn)換概率表可以用于兩個(gè)以上的檢索項(xiàng)目。具體地說,作為一個(gè)檢索項(xiàng)的檢索關(guān)鍵字輸入的kada-letters字符串可以用于檢索兩個(gè)以上檢索項(xiàng)目的共用的字符到字符轉(zhuǎn)換概率表。這樣做的結(jié)果可以縮小存儲(chǔ)這種表的存儲(chǔ)器容量。
特別是在采用關(guān)鍵字的檢索操作中,如果不知道需要檢索的項(xiàng)目,就可以采用以下兩種技術(shù)之一(1)為需要檢索的所有項(xiàng)目提供公用的檢索程序單元和字符到字符轉(zhuǎn)換概率表。用檢索程序單元對(duì)表進(jìn)行檢索,按用戶指定的關(guān)鍵字的指示找到數(shù)據(jù)。(2)為需要檢索的每個(gè)項(xiàng)目提供一個(gè)檢索程序單元和一個(gè)字符到字符轉(zhuǎn)換概率表。用與這些表相關(guān)的單元檢索每個(gè)表,按照用戶指定的關(guān)鍵字的指示找到數(shù)據(jù)。
無論上述哪種情況,檢索操作的結(jié)果是按照轉(zhuǎn)換匹配度和加權(quán)的遞減順序或是優(yōu)先權(quán)號(hào)碼重新排列。
另外,每個(gè)字符到字符轉(zhuǎn)換概率表可以按下述方式構(gòu)成,這些表包括書名的字符到字符轉(zhuǎn)換概率表,作者名稱的字符到字符轉(zhuǎn)換概率表,出版商的字符到字符轉(zhuǎn)換概率表,以及關(guān)鍵詞的字符到字符轉(zhuǎn)換概率表。
如果圖書數(shù)據(jù)是用西文例如英文撰寫的,在兩個(gè)順序的詞之間需要使用一個(gè)分界符。此時(shí)最好采用以下的結(jié)構(gòu)。
具體地說,按照與圖30所示的作者名稱表a320或是其他表類似的結(jié)構(gòu)產(chǎn)生一個(gè)包含許多入口的詞匯表,用每個(gè)入口表示詞匯編號(hào),詞匯,以及與該詞匯相關(guān)的一本書的圖書收集號(hào)碼之間的關(guān)系。另一方面,按照與圖32所示的書名的字符到字符轉(zhuǎn)換概率表a312類似的結(jié)構(gòu)產(chǎn)生一個(gè)包含許多入口的詞匯的字符到字符轉(zhuǎn)換概率表,用每個(gè)入口表示字符到字符的轉(zhuǎn)換與詞匯編號(hào)之間的關(guān)系。另外還設(shè)有一個(gè)詞匯處理單元,它利用作為關(guān)鍵字的一個(gè)字符串中從一個(gè)字符到另一字符的轉(zhuǎn)換從詞匯的字符到字符轉(zhuǎn)換概率表中找出詞匯編號(hào)和轉(zhuǎn)換匹配度。找到的詞匯編號(hào)進(jìn)一步被用于從詞匯表中找到圖書收集號(hào)碼和轉(zhuǎn)換匹配度。
按照另一種方式,可以按下述的結(jié)構(gòu)產(chǎn)生各個(gè)字符到字符轉(zhuǎn)換概率表,也就是書名的字符到字符轉(zhuǎn)換概率表,作者名稱的字符到字符轉(zhuǎn)換概率表,出版商的字符到字符轉(zhuǎn)換概率表,以及關(guān)鍵詞的字符到字符轉(zhuǎn)換概率表。
具體地說,書名的字符到字符轉(zhuǎn)換概率表a312是這樣構(gòu)成的,它包括一個(gè)包含許多入口的書名表,每個(gè)入口表示一個(gè)詞匯的字符到字符轉(zhuǎn)換與書名中包括這種轉(zhuǎn)換的一本書的圖書收集號(hào)碼,還有一個(gè)詞匯的字符到字符轉(zhuǎn)換概率表,它包含許多入口,每個(gè)入口表示一個(gè)字符到字符的轉(zhuǎn)換與一個(gè)詞匯編號(hào)之間的關(guān)系。參照詞匯的字符到字符轉(zhuǎn)換概率表請(qǐng)求書名檢索程序單元a311從作為關(guān)鍵字的字符串中找出一個(gè)詞匯編號(hào)和從字符到字符的轉(zhuǎn)換的轉(zhuǎn)換匹配度,并且參照書名表找出一個(gè)圖書收集號(hào)碼以及從字符到字符的轉(zhuǎn)換的轉(zhuǎn)換匹配度。這種結(jié)構(gòu)也可以用于其他檢索項(xiàng)目的字符到字符轉(zhuǎn)換概率表。應(yīng)該注意到,可以為所有檢索項(xiàng)目提供公用的詞匯表,或是為各個(gè)檢索項(xiàng)目提供單獨(dú)的詞匯表。
按照上述的內(nèi)容,在書名的字符到字符轉(zhuǎn)換概率表,作者名稱的字符到字符轉(zhuǎn)換概率表,出版商的字符到字符轉(zhuǎn)換概率表,以及關(guān)鍵詞的字符到字符轉(zhuǎn)換概率表等各個(gè)字符到字符的轉(zhuǎn)換概率表中,圖書收集號(hào)碼是直接分類。然而應(yīng)該注意到從各個(gè)字符到字符轉(zhuǎn)換概率表中可以省略圖書收集號(hào)碼。例如,如果在作者名稱中包括一個(gè)字符到字符的轉(zhuǎn)換,可以在作者名稱的字符到字符轉(zhuǎn)換概率表a314中按照作者的作者編號(hào)來編目,用于代替該作者撰寫的那本書的圖書收集號(hào)碼。在這種情況下,可以從作者名稱表a320中找到該書的圖書收集號(hào)碼。
另外,按照上文所述,在書名的字符到字符轉(zhuǎn)換概率表,作者名稱的字符到字符轉(zhuǎn)換概率表,出版商的字符到字符轉(zhuǎn)換概率表,以及關(guān)鍵詞的字符到字符轉(zhuǎn)換概率表等各個(gè)字符到字符的轉(zhuǎn)換概率表中分類的字符出現(xiàn)次數(shù)和字符到字符的轉(zhuǎn)換次數(shù)沒有被用于計(jì)算轉(zhuǎn)換匹配度。也就是說,在上述的這種計(jì)算中沒有明確表示字符出現(xiàn)次數(shù)和字符到字符轉(zhuǎn)換次數(shù)的作用。然而,應(yīng)該注意到,可以按照下述方式使用字符到字符的轉(zhuǎn)換次數(shù)。假設(shè)一本書的書名與作為關(guān)鍵字的特定字符串之間具有低概率的字符到字符轉(zhuǎn)換匹配。也就是說,書名中的字符到字符轉(zhuǎn)換在書名的字符到字符轉(zhuǎn)換概率表中的分類具有較低次數(shù)的字符到字符轉(zhuǎn)換。在這種情況下,可以象對(duì)待高轉(zhuǎn)換匹配度的書那樣來處理。這是因?yàn)榈透怕实淖址阶址D(zhuǎn)換表明了字符到字符的轉(zhuǎn)換很少,從而顯示出該書名與具有高概率的字符到字符轉(zhuǎn)換相比較的具體特征,也就是共同的字符到字符轉(zhuǎn)換特征。
另外,在本實(shí)施例中,從顯示內(nèi)容中可以省去具有低加權(quán)轉(zhuǎn)換匹配度的圖書數(shù)據(jù)。此外,還可以從具有最高加權(quán)轉(zhuǎn)換匹配度的圖書數(shù)據(jù)開始僅僅顯示出預(yù)定數(shù)量的圖書數(shù)據(jù)。
如上所述,按照本實(shí)施例提供的圖書館檢索系統(tǒng),檢索操作的結(jié)果可以按照為多個(gè)檢索關(guān)鍵字設(shè)定的加權(quán)和優(yōu)先權(quán)順序號(hào)重新排列,并且按重新排列的順序顯示。這樣,用戶就能獲得檢索操作的結(jié)果,這種結(jié)果是按照更適合檢索需求的格式來顯示的。
如上所述,本發(fā)明可以提供一種圖書館檢索系統(tǒng),它可以執(zhí)行檢索操作,并且用更適合用戶檢索需求的格式來顯示檢索結(jié)果。
以下要解釋的技術(shù)適用于執(zhí)行一種允許模糊輸入的檢索方式,在下文中還要詳細(xì)說明,用戶僅僅需要在各個(gè)檢索項(xiàng)目的方法中增加檢索項(xiàng)目的屬性和簡單的信息,就能夠在多項(xiàng)目數(shù)據(jù)庫中通用。具體地說,對(duì)于多項(xiàng)目數(shù)據(jù)中的每個(gè)檢索項(xiàng)目,由用戶指定(1)是否要執(zhí)行檢索操作;(2)檢索項(xiàng)目中的優(yōu)先權(quán)順序;以及(3)各個(gè)檢索項(xiàng)目的屬性。
然后,由通用檢索系統(tǒng)產(chǎn)生一個(gè)字符到字符的轉(zhuǎn)換索引表,以便在允許模糊輸入的檢索中使用,這種檢索方式允許在輸入字符串中有一些誤差或是含意模糊的屬性。例如,含糊的"藍(lán)"色可以代表"淺藍(lán)"或是"深藍(lán)",而含糊的詞オしンジ(橙色)可以表示"ネ-ブしオしンジ(臍橙色)"或是"みガん(橘紅色)"。本發(fā)明提供了用于執(zhí)行下述三種允許模糊輸入檢索的實(shí)施例[1]采用類似表的允許模糊輸入的檢索,例如采用詞典[2]對(duì)多項(xiàng)目數(shù)據(jù)的允許模糊輸入的檢索,數(shù)據(jù)中包括例如圖片等非文本數(shù)據(jù)(不需要檢索)[3]采用索引表的允許模糊輸入的檢索,每個(gè)索引與一個(gè)詞匯中的字符到字符的轉(zhuǎn)換相聯(lián)系[1]采用詞典的允許模糊輸入的檢索在本實(shí)施例中可以執(zhí)行這樣的檢索操作,在其中為每個(gè)數(shù)據(jù)屬性使用一個(gè)類似表,以便允許使用模糊的屬性。如上所述,例如,含糊的"藍(lán)"色可以代表"淺藍(lán)"或是"深藍(lán)",而含糊的詞"オしンジ(橙色)"可以表示"ネ-ブルオしンジ(臍橙色)"或是"みガん(橘紅色)"。
圖36是一個(gè)示意圖,表示本發(fā)明的實(shí)施例所提供的一個(gè)允許模糊輸入的多項(xiàng)目數(shù)據(jù)庫檢索系統(tǒng)的結(jié)構(gòu)。以下要簡要地說明本實(shí)施例的操作方式。首先,如圖中所示,通過一個(gè)小板S001輸入手寫的筆畫。然后,用字符識(shí)別單元S002將這些筆畫與字符識(shí)別庫S003相比較,從而識(shí)別手寫的筆畫。通過比較產(chǎn)生候選的字符串。然后用識(shí)別結(jié)果優(yōu)化和數(shù)據(jù)推斷單元S004分解候選的字符串,也就是把多個(gè)候選字符串拆成兩個(gè)一對(duì)的連續(xù)字符或是字符到字符的轉(zhuǎn)換。每個(gè)字符到字符的轉(zhuǎn)換與預(yù)先產(chǎn)生的字符到字符轉(zhuǎn)換索引表S005相比較,這一索引表是通過字符到字符轉(zhuǎn)換索引工具來產(chǎn)生的。如果找到了按照字符到字符轉(zhuǎn)換索引表S005分類的字符到字符的轉(zhuǎn)換,就將這種字符到字符的轉(zhuǎn)換當(dāng)作候選字符串的一部分來處理。在多項(xiàng)目數(shù)據(jù)庫S006中,包括某一候選的字符到字符的轉(zhuǎn)換的數(shù)據(jù)地址也是按字符到字符的轉(zhuǎn)換索引表S005來分類的,以便能訪問包含候選字符串的多項(xiàng)目數(shù)據(jù)庫S006。在上述的程序中,候選字符串被分解成字符到字符的轉(zhuǎn)換,并且在字符到字符轉(zhuǎn)換單元中參照字符到字符的轉(zhuǎn)換索引表S005來產(chǎn)生候選字符串,這種候選字符串是在多項(xiàng)目數(shù)據(jù)庫S006中預(yù)先分類的。這樣,即使在通過小板S001輸入的字符串中或是字符識(shí)別單元S002的輸出結(jié)果中存在局部誤差,仍可以檢索多項(xiàng)目數(shù)據(jù)庫S006。
為了找到意思與輸入數(shù)據(jù)接近的數(shù)據(jù),多項(xiàng)目數(shù)據(jù)庫S006中的命中數(shù)據(jù)被傳送到類似數(shù)據(jù)推斷單元S007。將命中數(shù)據(jù)中的每個(gè)檢索項(xiàng)與為檢索項(xiàng)目屬性準(zhǔn)備的一個(gè)類似表相比較。在一個(gè)屬性限定表中,為檢索項(xiàng)目屬性準(zhǔn)備的一個(gè)類似表的名稱被分類。在類似表中找到的與命中數(shù)據(jù)類似的數(shù)據(jù)被傳送到識(shí)別結(jié)果優(yōu)化和數(shù)據(jù)推斷單元S004。按照這種方式,很容易從包括類似數(shù)據(jù)的多項(xiàng)目數(shù)據(jù)庫S006中獲得數(shù)據(jù)。
如上所述,可以從多項(xiàng)目數(shù)據(jù)庫S006中檢索出數(shù)據(jù),這種數(shù)據(jù)中包括利用小板S001輸入的字符串和意思接近命中數(shù)據(jù)的類似數(shù)據(jù)。接著按照數(shù)據(jù)庫優(yōu)先權(quán)限定單元S011提供的定義為找到的每個(gè)數(shù)據(jù)片段確定其優(yōu)先權(quán)。然后從具有最高優(yōu)先權(quán)的數(shù)據(jù)片段開始一個(gè)接一個(gè)地在LCD a013上僅顯示出找到的部分?jǐn)?shù)據(jù)片段。找到的數(shù)據(jù)片段中被顯示的部分是按照檢索結(jié)果顯示范圍限定表S012提供的定義來確定的。在允許模糊輸入的檢索操作中,在檢索操作中命中的數(shù)據(jù)片段數(shù)量很大。然而,由于從具有最高優(yōu)先權(quán)的數(shù)據(jù)片段開始一個(gè)接一個(gè)地在LCD a013上僅顯示了找到的一部分?jǐn)?shù)據(jù)片段,用戶很容易從檢索結(jié)果中選擇需要的數(shù)據(jù)。
在上文中解釋了一個(gè)允許含意模糊的通用檢索系統(tǒng)的結(jié)構(gòu),并且用包含例如詞典等類似數(shù)據(jù)的類似表概括了這種系統(tǒng)的操作方式。
圖37(a)至(i)表示了在圖36的通用檢索系統(tǒng)結(jié)構(gòu)中使用的所有的表。以下要解釋表中的內(nèi)容。
首先,圖37(a)中所示的標(biāo)號(hào)S003是一個(gè)字符識(shí)別詞典。字符識(shí)別表S003通常被用于存儲(chǔ)字符圖形及其字符代碼。
標(biāo)號(hào)S005是用于對(duì)輸入分類的字符到字符轉(zhuǎn)換索引表,每個(gè)輸入表示一個(gè)字符到字符的轉(zhuǎn)換(也就是兩個(gè)一對(duì)的連續(xù)字符)和多項(xiàng)目數(shù)據(jù)庫S006中的一個(gè)地址,在數(shù)據(jù)庫中對(duì)包括字符到字符的轉(zhuǎn)換的字符串預(yù)先進(jìn)行了分類。在從多項(xiàng)目數(shù)據(jù)庫S006中檢索字符串時(shí),字符到字符轉(zhuǎn)換索引表S005的各個(gè)輸入被用作在多項(xiàng)目數(shù)據(jù)庫S006中分類的字符串的索引。應(yīng)該注意到,字符到字符轉(zhuǎn)換索引表S005是通過檢索索引產(chǎn)生工具自動(dòng)產(chǎn)生的,即利用這種工具把在多項(xiàng)目數(shù)據(jù)庫S006中分類的多項(xiàng)目數(shù)據(jù)分解成字符到字符的轉(zhuǎn)換或是兩個(gè)一對(duì)的連續(xù)字符。
標(biāo)號(hào)S006是多項(xiàng)目數(shù)據(jù)庫的一個(gè)例子。如圖中所示,每個(gè)數(shù)據(jù)片段具有三個(gè)檢索項(xiàng)即分別代表物品名稱,尺寸和價(jià)格的檢索項(xiàng)目編號(hào)1至3。
標(biāo)號(hào)S014是一個(gè)檢索對(duì)象指示表。檢索對(duì)象指示表S014被用于對(duì)作為檢索對(duì)象的多項(xiàng)目數(shù)據(jù)庫S006的檢索項(xiàng)目進(jìn)行分類。采用檢索對(duì)象指示表S014的原因是多項(xiàng)目數(shù)據(jù)庫S006可能還包含圖片和音樂數(shù)據(jù)等等難以根據(jù)允許模糊輸入的字符串進(jìn)行檢索的對(duì)象。采用檢索對(duì)象指示表S014可以清楚地鑒別檢索項(xiàng)目和非檢索項(xiàng)目。在本實(shí)施例中,分別代表物品名稱,尺寸和價(jià)格的檢索項(xiàng)目編號(hào)1至3都被作為可以檢索的對(duì)象。
標(biāo)號(hào)S015是一個(gè)用于表示屬性的屬性定義表,也就是表示多項(xiàng)目數(shù)據(jù)庫S006中的每個(gè)檢索項(xiàng)所具有的數(shù)據(jù)性質(zhì)。在允許模糊輸入的檢索中要參考一個(gè)檢索項(xiàng)目的類似表,用屬性定義表S015中分類的屬性來表示檢索項(xiàng)目,以便找到意思接近(也就是類似于)檢索項(xiàng)目的數(shù)據(jù)。
標(biāo)號(hào)S008是一例類似表。在這一類似表S008中表示了類似的尺寸檢索項(xiàng)。具體地說,在類似表S008的每個(gè)入口中對(duì)尺寸檢索項(xiàng)的值及其參考值進(jìn)行了分類。與參考值差別較小的尺寸被認(rèn)為是類似的尺寸。
標(biāo)號(hào)S009也是一例類似表。在類似表S009中模擬了由物品名稱檢索項(xiàng)目表示的一般貨物。在本例中的類似表S009是一種詞典,它是用于表示類似的一般物品的一個(gè)樣品表。如圖中所示,詞典中的每一欄表示一種物品以及與其有關(guān)的物品清單。物品按上,下等級(jí)的層次分類。等級(jí)層次是依次堆積的,表示了等級(jí)層次越是接近,層中的物品就越是類似。
如上所述,表S008是一個(gè)尺寸類似表,表示類似的尺寸檢索項(xiàng)目,而表S009是一個(gè)物品類似表,利用詞典來表示與物品名稱檢索項(xiàng)目類似的物品。其他類似表包括表示所有屬性的類似表,例如顏色,明/暗,和精度等等。在以下的實(shí)施例中要解釋顏色的類似表。
屬性的類似顯然是以屬性為依據(jù)的。例如,數(shù)字屬性顯然是類似的。在這種情況下沒有必要為數(shù)字的屬性提供類似表。也就是說,這種類似不需要類似表。
標(biāo)號(hào)S011是一個(gè)數(shù)據(jù)庫優(yōu)先權(quán)定義表。檢索操作的結(jié)果不一定能符合輸入的需要。例如,一個(gè)數(shù)據(jù)片段具有匹配的物品名稱,而另一片段具有匹配的尺寸。通過限定表示順序的優(yōu)先權(quán)來表示應(yīng)該首先顯示的具有匹配的物品名稱和匹配尺寸的數(shù)據(jù)片段,就可以在顯示中從其他數(shù)據(jù)前面取得與用戶需要的信息接近的數(shù)據(jù)。
根據(jù)允許模糊輸入的檢索結(jié)果,通??梢垣@得幾個(gè)候選數(shù)據(jù)。如果同時(shí)顯示所有候選結(jié)果,在通過檢索產(chǎn)生的所有候選者中間就很難選擇準(zhǔn)確的候選者邊界范圍。為了解決這一問題,按照優(yōu)先權(quán)順序依次顯示檢索結(jié)果,從最高優(yōu)先權(quán)開始逐步顯示較低的優(yōu)先權(quán)。
標(biāo)號(hào)S012是一例檢索結(jié)果顯示范圍定義表。在本實(shí)施例中,檢索結(jié)果顯示范圍定義表S012的每個(gè)入口包含顯示步驟和代表該步顯示的數(shù)據(jù)的匹配度數(shù)據(jù)。數(shù)據(jù)的匹配度是一個(gè)指示器,表示數(shù)據(jù)與輸入匹配的程度。在本例中,顯示步驟是按照匹配度來分類的。應(yīng)該注意到,顯示步驟也可以根據(jù)檢索結(jié)果計(jì)數(shù)或是偏差度來分類。
以上參照?qǐng)D37(a)至(i)說明了在允許模糊輸入的檢索中使用的表??偟貋碚f,由用戶來限定多項(xiàng)目數(shù)據(jù)庫S006,檢索對(duì)象指示表S014,數(shù)據(jù)庫優(yōu)先權(quán)定義表S011以及屬性定義表S015。另一方面,由檢索系統(tǒng)預(yù)先提供了類似表S008和S009。在此處使用的詞典可以在檢索系統(tǒng)中通用。
以下要參照?qǐng)D38來說明允許模糊輸入的檢索程序流程。
如圖中所示,首先通過小板S001輸入手寫的字符"オしンジ(橙色)"。然后由字符識(shí)別單元S002識(shí)別手寫字符,輸出用標(biāo)號(hào)S021表示的字符識(shí)別結(jié)果,即第一候選字符串"オしンジ(sairenji)"和第二候選字符串"オしンチ(oshirenji)"。然后,程序流程進(jìn)到步S022,把候選字符串分解成連續(xù)的字符對(duì),形成從一個(gè)候選字符到另一候選字符的轉(zhuǎn)換。然后,程序流程進(jìn)到步S023,將候選字符到候選字符的每個(gè)轉(zhuǎn)換與字符到字符轉(zhuǎn)換索引表S005相比較。如果在字符到字符轉(zhuǎn)換索引表S005的編目中找到了一個(gè)候選字符到候選字符的轉(zhuǎn)換,就獲得了與編目的字符到字符轉(zhuǎn)換相關(guān)的一個(gè)地址。該地址是多項(xiàng)目數(shù)據(jù)庫S006中的一個(gè)位置,包含這種字符到字符轉(zhuǎn)換的數(shù)據(jù)在這一位置上編目。在本例中,從候選字符"オ(o)"到候選字符"し(re)"的轉(zhuǎn)換和從"し(re)"到"ン(ng)"的轉(zhuǎn)換度是字符到字符轉(zhuǎn)換索引表S005中的編目,而相關(guān)的地址都是003.1。與"オ(o)"到"し(re)"和"し(re)"到"ン(ng)"的轉(zhuǎn)換相關(guān)的同一地址003.1被用作多項(xiàng)目數(shù)據(jù)庫S006中的地址003的一個(gè)索引,在該地址中分配了由夾在中間的字符"し(re)"聯(lián)系的概率比較大的候選字符串。然后,程序流程進(jìn)到步S024,在其中參照多項(xiàng)目數(shù)據(jù)庫S006的地址003就可以獲得數(shù)據(jù)"オしンジ(橙色),L,180圓"。這樣就獲得了接近手寫輸入字符"オしンジ(橙色)"的數(shù)據(jù)"オしンジ(橙色),L,180圓"。應(yīng)該注意到,還可以進(jìn)一步找到意思接近手寫輸入字符串"オしンジ(橙色)"的其他數(shù)據(jù)。從屬性定義表s015中可以清楚地看到分配給物品名稱檢索項(xiàng)的詞典類似表S009。因此,在地址003.1上命中的物品名稱"オしンジ(橙色)"就獲得了詞典類似表S009。另外,物品名稱"オしンジ(橙色)"在詞典類似表S009中是作為一個(gè)檢索項(xiàng)來編目的。按照等級(jí)層次高于物品名稱"オしンジ(橙色)"的概念對(duì)"みガん類(橘紅色類)"進(jìn)行編目。然后在詞典S009中對(duì)檢索項(xiàng)"みガん類(橘紅色類)"進(jìn)行檢索,按照等級(jí)層次比"みガん類(橘紅色類)"低的概念,在"オしンジ(橙色)"之外找到"みガん(橘紅色)"。此處將"みガん(橘紅色)"作為另一個(gè)候選字符串。利用與步S022到S024相同的方法在包括候選字符串"みガん(橘紅色)"的多項(xiàng)目數(shù)據(jù)庫S006中的地址001上獲得數(shù)據(jù)"みガん(橘紅色),M,160圓"。
然后,程序流程進(jìn)到步S025,在其中對(duì)檢索結(jié)果的每個(gè)數(shù)據(jù)片段計(jì)算手寫輸入字符的匹配度。匹配度是根據(jù)數(shù)據(jù)中命中的字符數(shù)及其與輸入字符串意思的接近程度來計(jì)算的。在本例中,地址003處的物品名稱數(shù)據(jù)"オしンジ(橙色),L,180圓"具有三個(gè)與輸入字符串匹配的字符。從數(shù)據(jù)庫優(yōu)先權(quán)定義表S011中可以清楚地看出,物品名稱檢索項(xiàng)具有最高的優(yōu)先權(quán)。因此,給予數(shù)據(jù)"オしンジ(橙色),L,180圓"的點(diǎn)數(shù)是3*1000=3000點(diǎn)。另一方面,在地址001處找到的類似于輸入字符串的物品名稱數(shù)據(jù)"みガん(橘紅色),M,160圓"獲得500點(diǎn)。
然后,程序進(jìn)到步S013,顯示出通過檢索找到的數(shù)據(jù)。
按照檢索結(jié)果顯示范圍定義表S012,第一顯示步被限定為用于顯示匹配度大于或等于1000點(diǎn)的數(shù)據(jù),而第二顯示步被限定為用于顯示匹配度等于或大于500點(diǎn)的數(shù)據(jù)。因此,在步S013中,在第一步中僅僅顯示分類在地址003處的數(shù)據(jù)"オしンジ(橙色),L,180圓"。如果用戶需要顯示后面的數(shù)據(jù),用戶就請(qǐng)求繼續(xù)顯示。在這種情況下,就在第二步顯示分類在地址001處的數(shù)據(jù)"みガん(橘紅色),M,160圓"。
檢索結(jié)果的顯示可以使本實(shí)施例的程序流程結(jié)束。包括圖象等等(不需要檢索的)非文本數(shù)據(jù)的允許模糊輸入的檢索。
在下文中說明了一種允許模糊輸入的檢索系統(tǒng),用于在除了根據(jù)字符串的檢索之外還包括圖形數(shù)據(jù)的多項(xiàng)目數(shù)據(jù)庫中進(jìn)行檢索。
圖39(a)是多項(xiàng)目數(shù)據(jù)庫S006的一例示意圖,其中包括圖象一類的非文本數(shù)據(jù)??偟貋碚f,包括圖像一類非文本數(shù)據(jù)的多項(xiàng)目數(shù)據(jù)庫S006被劃分成文本數(shù)據(jù)庫部分S006-1和非文本數(shù)據(jù)庫部分S006-2。文本數(shù)據(jù)庫部分S006-1和非文本數(shù)據(jù)庫部分S006-2是通過圖像數(shù)據(jù)的指針來聯(lián)系的。
對(duì)于多項(xiàng)目數(shù)據(jù)庫S006來說,采用檢索對(duì)象指示表S014在多項(xiàng)目數(shù)據(jù)庫S006中分類的數(shù)據(jù)片段中間清楚地指示出需要檢索的目標(biāo)。例如在汽車的信息片段中間把汽車名稱,汽車顏色,型號(hào)年代等檢索項(xiàng)目作為檢索對(duì)象,同時(shí)把檢索項(xiàng)目圖像指針作為非檢索項(xiàng)目來對(duì)待。按照這種方式清楚地表示出檢索對(duì)象,即使數(shù)據(jù)庫S006中包含不適合檢索的項(xiàng)目,仍可以僅僅檢索適合根據(jù)字符串進(jìn)行檢索的檢索項(xiàng)目。
與上述情況相似,標(biāo)號(hào)S015是一個(gè)屬性定義表。在屬性定義表S015中把汽車名稱檢索項(xiàng)作為主要字符串來對(duì)待。顏色屬性和型號(hào)屬性被分別分配給汽車顏色和型號(hào)年代檢索項(xiàng)。
標(biāo)號(hào)S088是一個(gè)顏色類似表。類似的顏色是不能用一維表達(dá)方式來體現(xiàn)的。在這種情況下,采用二維以上的表達(dá)方式來表示這種類似。在本例中,顏色是用矢量坐標(biāo)來表示的,而顏色類似(或是區(qū)別程度)是用矢量的差別來表示的。
圖40是一個(gè)檢索索引產(chǎn)生工具的結(jié)構(gòu)示意圖,其工作原理如下。首先用一個(gè)檢索屏幕自動(dòng)發(fā)生單元S031檢查檢索對(duì)象指示表S014,以便從多項(xiàng)目數(shù)據(jù)庫S006的文本數(shù)據(jù)部分S006-1中分類的檢索項(xiàng)目中間識(shí)別出需要檢索的對(duì)象。然后,檢索屏幕自動(dòng)發(fā)生單元S031參照屬性定義表S015識(shí)別出檢索對(duì)象的屬性。按照屬性對(duì)被檢索項(xiàng)目的數(shù)據(jù)進(jìn)行分析,以便產(chǎn)生檢索(字符到字符的轉(zhuǎn)換)索引表S005。如圖中所示,可以分別為每個(gè)檢索項(xiàng)目產(chǎn)生字符到字符的轉(zhuǎn)換索引表S005-1,S005-2,或是S005-3?;蚴且部梢蕴峁┧袡z索項(xiàng)目公用的一個(gè)字符到字符的轉(zhuǎn)換索引表S005。
圖41(a)至(c)是表示字符到字符的轉(zhuǎn)換索引表S005-1,S005-2,和S005-3的示意圖。在本例中,汽車名稱和汽車顏色檢索項(xiàng)目的數(shù)據(jù)被分解成兩個(gè)一對(duì)的順序字符,或是分解成所謂字符到字符的轉(zhuǎn)換。字符到字符的轉(zhuǎn)換和多項(xiàng)目數(shù)據(jù)庫S006中包括這種轉(zhuǎn)換的字符串地址分別構(gòu)成了字符到字符的轉(zhuǎn)換索引表S005-1和S005-2的一個(gè)入口,分別用于汽車名稱和汽車顏色。由于型號(hào)年代檢索項(xiàng)目的屬性是一種數(shù)字,用于項(xiàng)目型號(hào)年代檢索項(xiàng)目的字符到字符的轉(zhuǎn)換索引表S005-3是用數(shù)字部分來產(chǎn)生的,將這種數(shù)字作為索引。
圖42是一個(gè)檢索系統(tǒng)的結(jié)構(gòu)示意圖,該系統(tǒng)被用于檢索包括圖像等等非文本數(shù)據(jù)的多項(xiàng)目數(shù)據(jù)庫。在此僅僅解釋該檢索系統(tǒng)與圖36的區(qū)別。在本實(shí)施例的情況下,即使用戶沒有產(chǎn)生檢索屏幕,檢索屏幕自動(dòng)發(fā)生單元S031仍會(huì)自動(dòng)地顯示一個(gè)檢索平臺(tái)。另外,為上述的各個(gè)檢索項(xiàng)目提供了多個(gè)字符到字符轉(zhuǎn)換索引表。由于為各個(gè)檢索項(xiàng)目分別提供了一個(gè)字符到字符轉(zhuǎn)換索引表,識(shí)別結(jié)果優(yōu)化和數(shù)據(jù)推斷單元S004也被分解成一個(gè)具體項(xiàng)目的識(shí)別結(jié)果優(yōu)化和數(shù)據(jù)推斷單元S004-1和通用的識(shí)別結(jié)果優(yōu)化和數(shù)據(jù)推斷單元S004-2。另外,由于多項(xiàng)目數(shù)據(jù)庫S006被分解成了文本數(shù)據(jù)庫部分S006-1和用于存儲(chǔ)圖像一類非文本數(shù)據(jù)的非文本數(shù)據(jù)庫部分S006-2,提供了一個(gè)非文本數(shù)據(jù)合成單元S032,用于在文本數(shù)據(jù)庫部分S006-1的檢索完成之后把非文本數(shù)據(jù)庫部分S006-2中的圖像一類的非文本數(shù)據(jù)與顯示的文本數(shù)據(jù)合并。
圖43是由檢索屏幕自動(dòng)發(fā)生單元S031產(chǎn)生的一例檢索關(guān)鍵詞輸入平臺(tái)S041的示意圖。如圖中所示,檢索關(guān)鍵詞輸入平臺(tái)S041把作為檢索對(duì)象的多項(xiàng)目數(shù)據(jù)庫S006中檢索項(xiàng)目的關(guān)鍵詞輸入框顯示在屏幕上,讓用戶使用這個(gè)輸入框指定一個(gè)檢索項(xiàng)。另外還顯示了一個(gè)自由關(guān)鍵詞輸入框。這個(gè)自由關(guān)鍵詞輸入框被用于指定一個(gè)沒有被定義成檢索項(xiàng)的輸入。如果在自由關(guān)鍵詞輸入框中輸入了一個(gè)字符串,就用一個(gè)綜合檢索單元將輸入的字符串與所有的字符到字符轉(zhuǎn)換索引表相比較。值得注意的是應(yīng)該在關(guān)鍵詞輸入框中輸入一個(gè)字符串,并且其字符數(shù)不能超過與這一關(guān)鍵詞輸入框相關(guān)的檢索項(xiàng)的數(shù)據(jù)長度。如果屏幕的框中不能容納這個(gè)關(guān)健詞,可以使用滾動(dòng)條。
圖44是由檢索屏幕自動(dòng)發(fā)生單元S031產(chǎn)生的一例檢索結(jié)果顯示平臺(tái)S043的示意圖。檢索的結(jié)果可以包括一種不是檢索對(duì)象的檢索項(xiàng),例如是一種圖像。另外一種方式是顯示一種數(shù)字-字符格式的圖像數(shù)據(jù)指針,用于代替圖像數(shù)據(jù)本身。
圖45是按照應(yīng)用程序顯示的一例屏幕。該屏幕是通過從檢索系統(tǒng)接收的檢索結(jié)果而獲得的。在本例的應(yīng)用中執(zhí)行了包含圖像的程序。也就是說,檢索系統(tǒng)可以對(duì)最終的程序進(jìn)行局部的管理,即僅僅處理文本數(shù)據(jù)庫部分S006-1。
圖46是一個(gè)示意圖,表示綜合識(shí)別結(jié)果優(yōu)化和數(shù)據(jù)推斷單元S004-2執(zhí)行的程序流程。以下簡要說明這一程序。如果在檢索關(guān)鍵詞輸入平臺(tái)S041的自由關(guān)鍵詞輸入框中輸入一個(gè)關(guān)鍵詞,就參照所有檢索項(xiàng)目公用的一個(gè)字符到字符索引表執(zhí)行檢索操作,從中找到由關(guān)鍵詞指示的數(shù)據(jù)片段。另外,如果在具體檢索項(xiàng)目的關(guān)鍵詞輸入框中也輸入了關(guān)鍵詞,具體項(xiàng)目識(shí)別結(jié)果優(yōu)化和數(shù)據(jù)推斷單元S004-1就檢索由關(guān)鍵詞指示的數(shù)據(jù)片段,并且輸出由找到的數(shù)據(jù)片段組合(執(zhí)行OR操作)而成的信息,這些數(shù)據(jù)片段是由輸入到自由檢索項(xiàng)目輸入框的關(guān)鍵詞和輸入到具體檢索項(xiàng)目輸入框的關(guān)鍵詞來指定的。另一方面,如果僅僅在具體檢索項(xiàng)目的關(guān)鍵詞輸入框中輸入了關(guān)鍵詞,而沒有在自由關(guān)鍵詞輸入框中輸入關(guān)鍵詞,只有具體項(xiàng)目識(shí)別結(jié)果優(yōu)化和數(shù)據(jù)推斷單元S004-1對(duì)關(guān)鍵詞指示的數(shù)據(jù)片段進(jìn)行檢索,并且輸出檢索操作的結(jié)果。
在上文中說明了一種允許模糊輸入的檢索系統(tǒng),除了根據(jù)字符串進(jìn)行檢索之外,還可用于檢索包括圖像一類非文本數(shù)據(jù)的多項(xiàng)目數(shù)據(jù)庫。使用索引表進(jìn)行的允許模糊輸入的檢索,每個(gè)索引涉及到一個(gè)詞的字符到字符轉(zhuǎn)換圖47(a)至(c)是一種允許模糊輸入的檢索方式的總體示意圖,這種檢索方式使用的表中包含許多索引,它們各自對(duì)應(yīng)一個(gè)詞的字符到字符的轉(zhuǎn)換,以及這種索引的類似程度。如圖中所示,這種表的特征是,對(duì)在其中分類的信息進(jìn)行索引,各自用于把一種字符到字符的轉(zhuǎn)換與一個(gè)由數(shù)據(jù)(或是詞)構(gòu)成的輸入相聯(lián)系,這種數(shù)據(jù)中包含上述的字符到字符轉(zhuǎn)換,數(shù)據(jù)的類似估算值,包含分類在多項(xiàng)目數(shù)據(jù)庫中的數(shù)據(jù)(或詞)的多項(xiàng)目數(shù)據(jù)量,或是多項(xiàng)目數(shù)據(jù)在多項(xiàng)目數(shù)據(jù)庫中的地址。在實(shí)現(xiàn)允許模糊輸入的檢索系統(tǒng)的本實(shí)施例情況下,按照這種方式,由于每個(gè)索引包括一種字符到字符的轉(zhuǎn)換,就可以在執(zhí)行檢索時(shí)忽略小的錯(cuò)誤,例如日語字符串"カ-テガン"(意思是羊毛衫)"和另一個(gè)字符串"カ-テイガン′(意思也是羊毛衫)"之間的差別。值得注意的是,這兩個(gè)字符串之間在日語中的拼寫差別是由于在試圖用日語字母寫出英語詞′cardigan'時(shí)的模糊而造成的結(jié)果。當(dāng)然,這種系統(tǒng)也可以克服由用戶的局部輸入錯(cuò)誤造成的問題。上述的表是由各個(gè)索引構(gòu)成的,每個(gè)索引中包含多項(xiàng)目數(shù)據(jù)庫中分類的一個(gè)詞,并且按照詞中間的類似關(guān)系對(duì)索引進(jìn)行分類,也就是按照類似估算值的遞增順序進(jìn)行分類。這樣就能比較容易地找到包含某個(gè)詞的數(shù)據(jù),這個(gè)詞類似于在檢索操作中檢測的詞。
在本例中,在檢索關(guān)鍵詞輸入平臺(tái)中指定的檢索數(shù)據(jù)是"カ-テイガン"(羊毛衫),9號(hào),(紅色),5000圓"。作為一種接近用戶需要的檢索操作結(jié)果,可以獲得以下的第一數(shù)據(jù)"カ-テイガン"(羊毛衫),9號(hào),(紅色),4900圓"。作為與第一數(shù)據(jù)類似的數(shù)據(jù),還可以進(jìn)一步獲得以下的第二數(shù)據(jù)"カ-テイガン"(羊毛衫),ワイン(紫紅色),9號(hào),4700圓"。同時(shí)還可以類似地獲得與第一數(shù)據(jù)類似的第三數(shù)據(jù)"カ-テイガン"(羊毛衫),ビンケ(粉紅色),9號(hào),5400圓"。
以上概括地說明了允許模糊輸入的檢索方式,在這種方式中采用了包含索引的表,每個(gè)索引與一個(gè)詞中的字符到字符的轉(zhuǎn)換以及與該索引的類似程度相聯(lián)系。
如上所述,在檢索多項(xiàng)目數(shù)據(jù)庫時(shí),可以克服由用戶的輸入錯(cuò)誤和多項(xiàng)目數(shù)據(jù)庫本身的局部缺陷所造成的問題。另外,還可以執(zhí)行一種允許模糊輸入的檢索方式,從而獲得意思接近于輸入的數(shù)據(jù)。
權(quán)利要求
1.一種具有用于識(shí)別輸入字符串的識(shí)別裝置和用于顯示識(shí)別結(jié)果的顯示裝置的字符識(shí)別裝置,所述字符識(shí)別裝置包括字庫,用于存儲(chǔ)字識(shí)別信息和等級(jí)結(jié)構(gòu)信息,所述等級(jí)結(jié)構(gòu)信息用于把許多字分成等級(jí)并識(shí)別所述等級(jí)結(jié)構(gòu)內(nèi)的每個(gè)所述的字;字符轉(zhuǎn)移概率表,用來至少存儲(chǔ)從任何一個(gè)字符到另一個(gè)字符轉(zhuǎn)移的概率和相應(yīng)于從所述轉(zhuǎn)移得到的字符的組合的所述字識(shí)別信息的那些信息片;優(yōu)化裝置,用于使用所述字符轉(zhuǎn)移概率表優(yōu)化由所述識(shí)別裝置獲得的候選字符串;以及檢索裝置,用于通過所述字庫檢索由所述字識(shí)別信息的那些片限定的字,所述字識(shí)別信息相應(yīng)于優(yōu)化的候選字符串,借以檢索由所述等級(jí)信息的可用的片識(shí)別的并尚待必須被輸入的被檢索的字。
2.如權(quán)利要求1所述的字符識(shí)別裝置,其特征在于所述等級(jí)結(jié)構(gòu)信息由在級(jí)別上比在所述字庫中的每個(gè)字的級(jí)別高的字的有關(guān)字識(shí)別信息構(gòu)成。
3.如權(quán)利要求2所述的字符識(shí)別裝置,其特征在于所述檢索裝置從所述字庫中檢索在級(jí)別上比所述優(yōu)化的字符串的字高的字作為尚待輸入的字。
4.一種具有用于識(shí)別輸入字符串的識(shí)別裝置和用于顯示識(shí)別結(jié)果的顯示裝置的字符識(shí)別裝置,所述字符識(shí)別裝置包括具有在特定地址預(yù)先存儲(chǔ)的許多字符串的每個(gè)字符串的字庫;字符轉(zhuǎn)移概率表,用于至少存儲(chǔ)從任何一個(gè)字符到另一個(gè)字符的轉(zhuǎn)移概率,所述概率相應(yīng)于包括在所述轉(zhuǎn)移中涉及的組合字符的所述字符串的地址被存儲(chǔ);以及優(yōu)化裝置,用于使用所述字母轉(zhuǎn)移概率表優(yōu)化由所述識(shí)別裝置獲得的候選字符串;其中所述字庫對(duì)于相應(yīng)于優(yōu)化的候選字符串的字符串的地址被訪問,并且其中在所述字庫中的所述地址的字符作為識(shí)別結(jié)果被顯示。
5.如權(quán)利要求1或4的字符識(shí)別裝置,其特征在于所述識(shí)別裝置從由所述識(shí)別裝置得到的許多候選字符串當(dāng)中選擇從一個(gè)字符到另一個(gè)字符的轉(zhuǎn)移概率比其它候選字符串高的候選字符串,借以確定優(yōu)化的候選字符串。
6.如權(quán)利要求1或4所述的字符識(shí)別裝置,其特征在于所述字符串是手寫輸入的。
7.如權(quán)利要求1或4所述的字符識(shí)別裝置,其特征在于所述字符串是聲音輸入的。
8.一種具有用于輸入字符圖形的輸入裝置、用于識(shí)別輸入的字符圖形的識(shí)別裝置和用于顯示識(shí)別結(jié)果的顯示裝置的圖形識(shí)別裝置,所述圖形識(shí)別裝置包括具有許多預(yù)先存儲(chǔ)的字的字庫;字符轉(zhuǎn)移概率表,其中具有預(yù)先學(xué)習(xí)的從任何一個(gè)字符到另一個(gè)字符的轉(zhuǎn)移概率以及在所述字庫中指向包括所述轉(zhuǎn)移的那些字的指針;指針確定裝置,用于根據(jù)所述轉(zhuǎn)移的所述概率優(yōu)化識(shí)別的候選字符串,并檢測指向所述字庫中包括所述識(shí)別的候選字符串的字符對(duì)字符轉(zhuǎn)移的那些字的指針;以及推斷裝置,用于匹配優(yōu)化的候選字符串和所述字庫中被相應(yīng)的指針定位的那些字,并用于推斷有關(guān)從所述字庫內(nèi)定位的字的信息。
9.如權(quán)利要求8所述的圖形識(shí)別裝置,其特征在于在所述字庫中的字由等級(jí)結(jié)構(gòu)的數(shù)據(jù)構(gòu)成。
10.如權(quán)利要求8所述的圖形識(shí)別裝置,其特征在于所述字符圖形是手寫輸入的,并且其中由所述推斷裝置推斷的候選字符串在手寫輸入的字符圖形附近被顯示。
11.如權(quán)利要求10所述的圖形識(shí)別裝置,其特征在于候選字符中相應(yīng)于所述手寫輸入字符圖形的那些被反相顯示或者以不同的字體顯示。
12.一種用于識(shí)別輸入的字符圖形并顯示識(shí)別結(jié)果的圖形識(shí)別方法,所述圖形識(shí)別方法包括下述步驟從被識(shí)別的輸入字符圖形中提取候選字符串;利用字符轉(zhuǎn)移表優(yōu)化提取的候選字符串,所述字母轉(zhuǎn)移表描述預(yù)先學(xué)習(xí)的從任一字符向另一字符轉(zhuǎn)移的概率,所述概率相應(yīng)于包括所述轉(zhuǎn)移的字庫中的那些字的指針被存儲(chǔ);檢測包括優(yōu)化的候選字符串的字符對(duì)字符轉(zhuǎn)移的所述字庫中的那些字的指針;使所述優(yōu)化的候選字符串和在所述字庫中存儲(chǔ)的所述許多字當(dāng)中的由檢測的指針指向的那些字進(jìn)行匹配;以及從所述字庫中推斷和有關(guān)的字相關(guān)的信息以便作為候選字符串顯示推斷的結(jié)果。
13.如權(quán)利要求12所述的圖形識(shí)別方法,其特征在于所述字庫中的字由等級(jí)結(jié)構(gòu)的數(shù)據(jù)構(gòu)成。
14.如權(quán)利要求12所述的圖形識(shí)別方法,其特征在于所述字符圖形是手寫輸入的,并且其中推斷的字符串在手寫輸入字符圖形附近被顯示。
15.如權(quán)利要求14所述的圖形識(shí)別方法,其特征在于候選字符串中的相應(yīng)于所述手寫輸入字符圖形的那些被反相顯示或以不同字體顯示。
16.一種醫(yī)療檢索裝置,包括用于識(shí)別輸入的字符串的識(shí)別裝置;用于顯示識(shí)別結(jié)果的顯示裝置;字庫,用于按等級(jí)結(jié)構(gòu)編排許多字、用于識(shí)別每個(gè)所述字的字識(shí)別信息以及關(guān)于所述等級(jí)的信息;字符對(duì)字符轉(zhuǎn)移概率表,其中包括用于存儲(chǔ)字符串中從一個(gè)字符向下一個(gè)字母轉(zhuǎn)移的概率以及包含所述轉(zhuǎn)移的字的字識(shí)別信息的項(xiàng);優(yōu)化裝置,用于使用所述字符對(duì)字符轉(zhuǎn)移概率表優(yōu)化由所述識(shí)別裝置輸出的候選字符串,從而產(chǎn)生輸入字符的最佳候選字符串;以及檢索裝置,用于檢索所述字庫,找出由和所述輸入字符的最佳候選字符串相關(guān)的所述字識(shí)別信息指示的特定等級(jí)中的字以及不包括在高于與/或低于由關(guān)于所述等級(jí)信息指示的所述特定等級(jí)中的輸入字符的所述最佳候選字符串的字,其中在所述字庫中編目的字是制藥公司的名稱,所述醫(yī)藥名稱和醫(yī)藥代碼,所述字庫包括具有許多項(xiàng)的表,每個(gè)項(xiàng)用于存儲(chǔ)關(guān)于每種藥的信息、所述信息包括所述藥的用途、服用時(shí)的注意事項(xiàng)、副作用和與其它藥一起服用時(shí)的注意事項(xiàng)。
17.如權(quán)利要求16所述的醫(yī)療檢索裝置,其特征在于還包括用于記錄每個(gè)病人的病歷和醫(yī)療治療的表。
18.如權(quán)利要求16所述的醫(yī)療檢索裝置,其特征在于還包括存儲(chǔ)在醫(yī)院工作的雇員的記錄的表。
19.一種用于檢索數(shù)據(jù)庫查找由作為檢索關(guān)鍵字的許多字符串指示的信息,所述系統(tǒng)包括輸入裝置,用于輸入由用戶輸入的所述字符串和由所述用戶對(duì)每個(gè)所述字符串輸入的加權(quán)或優(yōu)先權(quán)順序號(hào);檢索裝置,用于檢索所述數(shù)據(jù)庫,查找由每個(gè)作為檢索關(guān)鍵字的所述字符串代表的信息;以及候選順序確定裝置,用于確定由檢索裝置產(chǎn)生的結(jié)果按照在檢索所述信息時(shí)作為關(guān)鍵字輸入的每個(gè)所述字符串的加權(quán)或所述優(yōu)選權(quán)順序號(hào)要作為候選物輸出的順序。
20.如權(quán)利要求19所述的檢索系統(tǒng),其特征在于所述檢索裝置按照轉(zhuǎn)移匹配的程度檢索所述數(shù)據(jù)庫,所述轉(zhuǎn)移匹配的程度是代表被包括在所述輸入字符串中的從一個(gè)字符到下一個(gè)字符有多少次轉(zhuǎn)移和被包括在被檢索的信息中的從一個(gè)字符到下一個(gè)字符的轉(zhuǎn)移相匹配;以及所述候選順序確定裝置按照減少的轉(zhuǎn)移匹配的加權(quán)程度的順序重排所述的候選物,所述每個(gè)轉(zhuǎn)移匹配的加權(quán)程度是通過使在檢索所述信息中作為檢索關(guān)鍵字使用的每個(gè)輸入的字符串的轉(zhuǎn)移匹配程度乘以所述字符串的加權(quán)或所述優(yōu)先順序數(shù)而被計(jì)算的。
21.如權(quán)利要求19或20的檢索系統(tǒng),其特征在于還包括輸出裝置,用于輸出由所述檢索裝置按照由所述候選順序確定裝置對(duì)所述候選物確定的所述順序產(chǎn)生的信息片的輸出裝置。
22.如權(quán)利要求19或20所述的檢索系統(tǒng),其特征在于在所述數(shù)據(jù)庫中存儲(chǔ)的每個(gè)信息片包括一組檢索項(xiàng);所述輸入裝置輸入由用戶對(duì)每個(gè)檢索項(xiàng)輸入的一個(gè)或幾個(gè)字符串和由所述用戶輸入的每個(gè)所述字符串的加權(quán)或優(yōu)先權(quán)順序數(shù);以及所述檢索裝置檢索所述數(shù)據(jù)庫,通過使用對(duì)于所述字符串輸入的一個(gè)檢索項(xiàng)目作為關(guān)鍵字輸入的所述字符串檢索信息。
23.如權(quán)利要求22所述的檢索系統(tǒng),其特征在于所述輸入裝置接收由用戶輸入的加權(quán)或優(yōu)先權(quán)順序數(shù)和檢索項(xiàng)的輸入的字符串,用于檢索項(xiàng)的所述字符串被輸入,或使用由所述數(shù)據(jù)庫預(yù)先設(shè)置的預(yù)定的加權(quán)或預(yù)定的優(yōu)先權(quán)順序數(shù)。
24.一種檢索系統(tǒng),包括一個(gè)屬性規(guī)定(確定)表,用于規(guī)定要被檢索的每個(gè)檢測項(xiàng)的數(shù)據(jù)屬性的指針,以及一個(gè)模擬表,用來根據(jù)所述屬性編排所述數(shù)據(jù)當(dāng)中的模擬關(guān)系,其中模擬輸入關(guān)鍵字的數(shù)據(jù)即使所述數(shù)據(jù)和所述輸入關(guān)鍵字不十分匹配時(shí)也作為檢索結(jié)果而被產(chǎn)生。
25.一種檢索系統(tǒng),具有檢索結(jié)果顯示范圍確定表,其中的每一項(xiàng)用于記錄檢索結(jié)果的若干顯示步驟,和用于指示所述檢索結(jié)果必須在多大程度上和關(guān)鍵字匹配或在所述檢索結(jié)果可以被顯示之前在所述檢索結(jié)果中匹配的檢索項(xiàng)的最小數(shù)量的指示項(xiàng),其中所述檢索結(jié)果按照由對(duì)每個(gè)顯示步驟記錄的所述指示項(xiàng)確定的優(yōu)先權(quán)順序逐步地被顯示。
26.一種檢索系統(tǒng),具有優(yōu)先權(quán)順序確定表,用于確定多項(xiàng)數(shù)據(jù)的檢索項(xiàng)的優(yōu)先權(quán)順序,其中檢索結(jié)果按照由所述優(yōu)先權(quán)順序確定表確定的所述優(yōu)先權(quán)順序確定的優(yōu)先權(quán)的順序被顯示。
27.一種用于檢索多項(xiàng)數(shù)據(jù)庫的檢索系統(tǒng),所述系統(tǒng)包括所述的多項(xiàng)數(shù)據(jù)庫;用于規(guī)定作為檢索對(duì)象的項(xiàng)目的檢索對(duì)象說明表;用于規(guī)定作為檢索對(duì)象的所述每個(gè)規(guī)定的項(xiàng)目的數(shù)據(jù)的屬性的指針的屬性規(guī)定表;用于基于所述屬性編排所述數(shù)據(jù)當(dāng)中的模擬關(guān)系的模擬表;用于參考檢索對(duì)象的數(shù)據(jù)的檢索索引表;用于規(guī)定檢索項(xiàng)目的優(yōu)先權(quán)順序的優(yōu)先權(quán)順序規(guī)定表;以及檢索結(jié)果顯示范圍規(guī)定表,其中的每一項(xiàng)用于記錄檢索結(jié)果的若干顯示步驟和指示,所述指示表示所述檢索結(jié)果和關(guān)鍵字匹配的程度,或在所述檢索結(jié)果可被顯示之前在所述檢索結(jié)果中匹配檢索項(xiàng)的最小數(shù)量,其中類似于輸入關(guān)鍵字的數(shù)據(jù)片或意義接近所述關(guān)鍵字的數(shù)據(jù)片,即使所述數(shù)據(jù)不完全匹配所述輸入關(guān)鍵字時(shí),也按照用于所需的優(yōu)先權(quán)順序從最接近所述輸入關(guān)鍵字的數(shù)據(jù)片開始,作為檢索結(jié)果被逐步地顯示。
28.一種用于檢索多項(xiàng)數(shù)據(jù)庫的檢索系統(tǒng),其中檢索索引表被自動(dòng)地產(chǎn)生,并且當(dāng)用戶只規(guī)定以下項(xiàng)時(shí),便顯示接近輸入關(guān)鍵字的數(shù)據(jù)所述多項(xiàng)數(shù)據(jù)庫;用于規(guī)定作為檢索對(duì)象的項(xiàng)的檢索對(duì)象規(guī)定表;用于規(guī)定作為檢索對(duì)象的所述每個(gè)規(guī)定的項(xiàng)的數(shù)據(jù)的屬性的指針的屬性規(guī)定表;用于規(guī)定檢索項(xiàng)的優(yōu)先權(quán)順序的優(yōu)先權(quán)順序規(guī)定表;以及檢索結(jié)果顯示范圍規(guī)定表,其中的每一項(xiàng)用于記錄檢索結(jié)果的若干顯示步驟和指示,所述指示表示所述檢索結(jié)果和關(guān)鍵字匹配的程度,或在所述檢索結(jié)果可被顯示之前在所述檢索結(jié)果中匹配檢索項(xiàng)的數(shù)量。
29.如權(quán)利要求27所述的用于檢索多項(xiàng)數(shù)據(jù)庫的檢索系統(tǒng),其特征在于使用所述模擬表存儲(chǔ)數(shù)據(jù)當(dāng)中例如顏色、物品/貨物以及亮度/暗度當(dāng)中的模擬關(guān)系。
30.如權(quán)利要求27所述的用于檢索多項(xiàng)數(shù)據(jù)庫的檢索系統(tǒng),其特征在于所述的模擬表通過匯編(thesaurus)實(shí)現(xiàn)。
全文摘要
本發(fā)明提供一種由用戶輸入的手寫關(guān)鍵字唯一地推斷整個(gè)字符串并作為候選字符串顯示推斷結(jié)果的裝置。它包括:字庫a6,用于存儲(chǔ)字識(shí)別信息和等級(jí)結(jié)構(gòu)信息,所述等級(jí)結(jié)構(gòu)信息用來把許多字按等級(jí)分層并用來識(shí)別等級(jí)內(nèi)的每一個(gè)字;字母轉(zhuǎn)移概率表a4,用于存儲(chǔ)從一個(gè)字母到另一個(gè)字母的轉(zhuǎn)移概率和相應(yīng)于由轉(zhuǎn)移所得的字母組合的字識(shí)別信息的那些片;以及優(yōu)化單元,用于使用字母轉(zhuǎn)移概率表a4優(yōu)化由識(shí)別單元獲得的候選字符串。
文檔編號(hào)G06K9/72GK1173684SQ9711359
公開日1998年2月18日 申請(qǐng)日期1997年5月21日 優(yōu)先權(quán)日1996年5月21日
發(fā)明者郡司圭子, 桂晃洋, 葛貫壯四郎, 三浦雅樹, 橫田登志美 申請(qǐng)人:株式會(huì)社日立制作所