專利名稱:漢語輸入變換處理裝置及漢語輸入變換處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及作成漢語文件時所使用的漢語字處理等漢語輸入變換處理裝置及漢語輸入變換處理方法,特別是涉及在用拼音輸入文字個數(shù)較多的單詞的讀音時使用的、便利的漢語字處理等漢語輸入變換處理裝置及漢語輸入變換處理方法。
過去的漢語字處理等漢語輸入變換處理裝置使用漢語漢字和表示其讀音的表音符號(以下稱為拼音)一一對應的漢語辭典,具有用拼音輸入漢語的讀音,并將之變換成漢字輸出的功能。這種功能稱為拼音漢字變換功能(相當于日語字處理的假名漢字變換功能)。
作為涉及這樣的拼音漢字變換功能的現(xiàn)有技術(shù),如日本特許出愿59-25892號公報、或日本特許出愿62-192086號公報等所記載的技術(shù)已眾所周知。
日本特許出愿59-25892號公報披露了對3個文字以上的單詞情況,即只輸入拼音文字列的最前面子音部(聲母)并將其變換成所期望的單詞的技術(shù)。
日本特許出愿62-192086號公報披露了對3個文字以上的單詞情況,即第1個文字全部輸入拼音文字列,第2個文字以后只輸入拼音文字列的最前面子音部(聲母)并將其變換成所期望的單詞的技術(shù)。
這些現(xiàn)有技術(shù)均是通過只輸入漢語單詞讀音的一部分(最前面子音部等)來檢索出相符的單詞的技術(shù)。此外,為防止變換候補單詞過于增加,還對3個文字以上的單詞進行了限定。
通過使用這些技術(shù),通常認為其可達到削減因長的拼音文字列而產(chǎn)生的敲擊鍵盤次數(shù),能具有更快速地進行輸入的效果。
但是,1個音節(jié)由子音和母音構(gòu)成,在人類的思考中,是在完全發(fā)出該“子音+母音”后,再開始判斷發(fā)出的是哪一個音節(jié)。這是自然語言共同的特征,漢語也決不例外。另外,因為漢語是1個漢字=1個音節(jié),所以,完全的音節(jié)對語言的理解的作用是極為重要的。因此,象上述各公報所記載的輸入方法那樣,用單純地省略拼音的一部分輸入的方法反而有成為輸入的妨礙之嫌。
在漢語中,一個漢字的發(fā)音必須為1個音節(jié),1個音節(jié)進一步又由被稱為“聲母”的最前面子音(音節(jié)最前面的子音)和被稱為“韻母”的除去“聲母”以外的部分(有母音、雙重母音、鼻音化母音等)構(gòu)成。此外,還有表示音節(jié)的抑揚頓挫的被稱為“四聲”的聲調(diào)(類似于日語的音調(diào)之類的東西)。
聲母例b,p,m,f,d,t,n,l,zh,ch,sh,…韻母例a,o,e,i,u,ai,en,ang,iong,…在表示上,與日語的羅馬字的子音母音不同,羅馬字母長度不是固定的是其特征之一。
另外,在漢語的單詞中,大多是1個文字到4個文字的單詞,具有超過這些文字個數(shù)的單詞是合成詞或名稱等,在常用單詞中是極少數(shù)(根據(jù)北京師范大學現(xiàn)代化教育技術(shù)研究所的統(tǒng)計結(jié)果)。還有,在2個文字以上的單詞的情況中,幾乎沒有同音詞(特別是包含有四聲時)的語匯,很多情況是由單一含意來確定,這一點與日語的同音詞的性質(zhì)不同。
從這種作為讀音文字列的拼音字母個數(shù)多的情況,或者2個文字以上單詞的單一含意性高的情況來看,可以象上述的現(xiàn)有技術(shù)那樣,考慮較少地輸入拼音(如只輸入各文字的最前面子音)來變換所期望的單詞。
但是,全部都采用單純地舍去其讀音的一部分的方法沒有充分考慮到用戶的已有知識或語言獲得等方面的情況。因此,用戶可能會反而感到不便,覺得在拼音輸入時盡是些相當于音節(jié)(=漢字)的最前面子音的字母。
這樣,單純地省略作為漢語讀音的拼音的一部分進行輸入的方法輸入效率不好是很明顯的,沿著自然語言的觀點,要使其更易于使用,這種方法不僅存在不能盡可能地施行靈活對應、而且還存在難于高效地變換所期望的單詞的問題。
本發(fā)明鑒于上述現(xiàn)狀而產(chǎn)生,目的在于提供能夠減輕對文字個數(shù)多的單詞的拼音輸入的負擔,并高效地變換所期望的單詞的、具有更高性能的輸入變換功能的漢語輸入變換處理裝置及漢語輸入變換處理方法。
按照本發(fā)明觀點之一,可提供輸入表示漢語漢字讀音的拼音,并把所輸入的拼音變換成漢字的漢語輸入變換處理裝置,該裝置的特征在于其具有用于用拼音輸入至少2個文字讀音的輸入裝置;對于每個單詞都保存拼音和與其對應的漢字的單詞辭典;從上述單詞辭典中將具有作為其讀音的一部分的由上述輸入裝置輸入的拼音的單詞作為變換候補來檢索的辭典檢索裝置;輸出上述辭典檢索裝置所檢索出來的變換候補的輸出裝置。
按照這樣的構(gòu)成,通過用拼音輸入至少2個漢字程度的讀音,可從辭典中抽出具有作為其讀音的一部分而輸入的拼音的單詞,并作為變換候補輸出。因此,即使是文字個數(shù)多(拼音讀音長)的單詞,也能減少其輸入次數(shù)而高效地進行變換。
另外,在上述漢語輸入變換處理裝置中,上述辭典檢索裝置也可以從上述單詞辭典中把最前面部分具有上述輸入拼音的單詞作為變換候補來檢索。
按照這樣的構(gòu)成,如把“臥薪嘗膽”說成“臥薪”那樣,通過用拼音輸入單詞讀音的最前面部分(最前面2個文字),可以作為變換候補得到所期望的單詞。
還有,在上述漢語輸入變換處理裝置中,上述辭典檢索裝置還可以從上述單詞辭典中把預先指定的位置處具有上述輸入的拼音的單詞作為變換候補進行檢索。
按照這樣的構(gòu)成,可以進一步擴大單詞讀音的適應范圍,如把“北京大學”說成“北大”、把“文化大革命”說成“文革”那樣,通過用拼音輸入單詞讀音的指定部分(長單詞的簡稱或通稱的讀音),可以作為變換候補得到所期望的單詞。
根據(jù)本發(fā)明另外的觀點,可以提供輸入表示漢語漢字讀音的拼音,并把其所輸入的拼音變換成漢字的漢語輸入變換處理裝置,該裝置的特征在于其具有用于用拼音輸入至少2個文字程度的讀音的輸入裝置;對于每個單詞都保存拼音和與其對應的漢字的單詞辭典;從上述單詞辭典中將符合上述輸入裝置輸入的拼音的單詞作為變換候補進行檢索的第1辭典檢索裝置;從上述單詞辭典中將具有作為其讀音的一部分由上述輸入裝置輸入的拼音的單詞作為變換候補進行檢索的第2辭典檢索裝置;確定由上述第1及第2辭典檢索裝置檢索出來的各變換候補的輸出順序的輸出順序確定裝置;按照由上述輸出順序確定裝置確定的輸出順序輸出上述各變換候補的輸出裝置。
按照這樣的構(gòu)成,通過用拼音輸入至少2個漢字程度的讀音,可以從辭典中分別抽出作為對應所輸入的拼音的單詞及具有作為其一部分的同一輸入拼音的單詞,并作為變換候補輸出。因此,即使是文字個數(shù)多(拼音讀音長)的單詞,也能減少其輸入次數(shù)而高效地進行變換。
另外,在上述漢語輸入變換處理裝置中,上述第2辭典檢索裝置也可以從上述單詞辭典中把最前面部分具有上述輸入拼音的單詞作為變換候補進行檢索。
按照這樣的構(gòu)成,如把“臥薪嘗膽”說成“臥薪”那樣,通過用拼音輸入單詞讀音的最前面部分(最前面2個文字),不僅可以把與該輸入拼音相符的單詞作為變換候補獲得,而且還可以作為變換候補得到最前面部分具有同一輸入拼音(最前面2個文字)的單詞。
還有,在上述漢語輸入變換處理裝置中,上述第2辭典檢索裝置還可以從上述單詞辭典中把預先指定的位置具有上述輸入拼音的單詞作為變換候補來進行檢索。
按照這樣的構(gòu)成,可以進一步擴大單詞讀音的適應范圍,如把“北京大學”說成“北大”、把“文化大革命”說成“文革”那樣,通過用拼音輸入單詞讀音的指定部分(長單詞的簡稱或通稱的讀音),不僅可以把與該輸入拼音相符的單詞作為變換候補,而且還可以作為變換候補得到指定位置上具有同一輸入拼音的單詞。
另外,在上述漢語輸入變換處理裝置中,上述輸出順序確定裝置還可以根據(jù)預先設定在作為各變換候補所得到的單詞中的頻度信息,確定其輸出順序。
按照這樣的構(gòu)成,在作為變換候補獲得與輸入拼音相符的單詞和作為一部分讀音的同一輸入拼音所具有的單詞時,可以根據(jù)預先設置在這些單詞中的頻度信息確定輸出順序,如可以優(yōu)先獲得使用頻度高的單詞。
此外,在上述漢語輸入變換處理裝置中,上述輸出順序確定裝置也可以根據(jù)作為各變換候補得到的單詞的文字個數(shù)來確定其輸出順序。
按照這樣的構(gòu)成,在作為變換候補獲得與輸入拼音相符的單詞和具有作為其一部分讀音的同一輸入拼音的單詞時,可以根據(jù)這些單詞中的文字個數(shù)來確定輸出順序,如可以優(yōu)先獲得文字個數(shù)多的單詞。
本發(fā)明的更進一步的目的及效果將在以下的描述中進行說明,有些可以從該描述中搞清楚,或通過實行本發(fā)明來加以理解。而且,該目的及效果可以特別地利用如下所示的裝置或其組合而明確地獲得。
附加的圖面構(gòu)成本說明書的一部分,它們圖示出本發(fā)明的理想的實施形態(tài),此外,也圖示出上述的一般的記述及后述的理想的實施形態(tài)的詳細的記述,是用于說明本發(fā)明的原理的圖面。
圖1是涉及本發(fā)明的表示漢語輸入變換處理裝置的系統(tǒng)構(gòu)成的方框圖。
圖2是表示利用圖1的系統(tǒng)構(gòu)成實現(xiàn)的漢語輸入變換處理裝置的功能構(gòu)成的方框圖。
圖3是表示圖2的漢語輸入變換處理裝置上設置的最前面讀音位置·全讀音對應辭典的構(gòu)成的方框圖。
圖4是表示設置在圖2的漢語輸入變換處理裝置上的句中讀音位置·全讀音對應辭典的構(gòu)成的方框圖。
圖5是表示本發(fā)明的第1實施形態(tài)的變換處理動作的流程圖。
圖6A及圖6B是用于說明上述本發(fā)明的第1實施形態(tài)的變換處理動作圖。
圖7是表示本發(fā)明的第2實施形態(tài)的變換處理動作的流程圖。
圖8A~圖8C是用于說明上述本發(fā)明的第2實施形態(tài)的變換處理動作圖。
下面參照圖面說明本發(fā)明的實施形態(tài)。
圖1是涉及本發(fā)明的表示漢語輸入變換處理裝置的系統(tǒng)構(gòu)成的方框圖。本實施形態(tài)的漢語輸入變換處理裝置通過使用讀入如保存在磁盤等記錄介質(zhì)上的程序,及利用該程序控制動作的計算機來實現(xiàn)。
如圖1所示,本實施形態(tài)的漢語輸入變換處理裝置由CPU11、存儲器12、輸入裝置13、顯示裝置14、外部存儲裝置15、打印裝置16、通信裝置17構(gòu)成。
CPU11是控制主裝置全部動作的設備,通過起動保存在存儲器12中的程序來動作。另外,作為基于保存在存儲器12中的程序來實現(xiàn)的功能,有利用應用程序進行的字處理等。
存儲器12由如ROM或RAM構(gòu)成,保存主裝置中使用的各種程序或字體(包括漢語字體)等數(shù)據(jù)。在該存儲器12上,除了設置有用于保存實現(xiàn)字處理的應用程序等程序數(shù)據(jù)的程序區(qū)12a外,還設置有輸入緩沖區(qū)12b、候補緩沖區(qū)12c、文件緩沖區(qū)12d等。
輸入緩沖區(qū)12b保存為作成文件而輸入的漢語漢字讀音的拼音文字列。候補緩沖區(qū)12c保存通過拼音漢字變換而得到的變換候補。文件緩沖區(qū)12d保存由利用拼音漢字變換而得到的由漢語漢字構(gòu)成的文件數(shù)據(jù)。
輸入裝置13由鍵盤構(gòu)成,是對主裝置進行指示或數(shù)據(jù)的輸入的設備,是為進行拼音文字列的輸入、或與該輸入的拼音文字列對應的拼音漢字變換指示(利用“變換”鍵的操作的指示)等的設備。
顯示裝置14由如CRT(陰極射線管)或LCD(液晶顯示屏)構(gòu)成,顯示利用輸入裝置13輸入的拼音文字列或拼音漢字變換結(jié)果等。
外部存儲裝置15由如HDD(硬盤驅(qū)動器)或CD-ROM(只讀光盤)構(gòu)成,保存各種程序或文件等數(shù)據(jù)。在該外部存儲裝置15中,除了包含用于實現(xiàn)字處理的應用程序外,還包含在拼音漢字變換處理中使用的辭典等數(shù)據(jù)。
打印裝置16用于進行文件的打印等。作為打印裝置16,即可以是內(nèi)藏于主裝置中的形式,也可以是通過外部進行連接的形式。
通信裝置17通過如內(nèi)部LAN(局域網(wǎng))或通信網(wǎng)絡等同外部裝置進行數(shù)據(jù)的發(fā)送接收控制。
下面,對利用圖1所示的系統(tǒng)構(gòu)成實現(xiàn)的漢語輸入變換處理裝置的功能結(jié)構(gòu)進行說明。
圖2是表示利用圖1的系統(tǒng)構(gòu)成實現(xiàn)的漢語輸入變換處理裝置的功能結(jié)構(gòu)的方框圖。如圖2所示,本實施形態(tài)的漢語輸入變換處理裝置具有輸入部21、控制部22、辭典檢索處理部23、單詞辭典24、最前面讀音抽出處理部25、句中讀音位置抽出處理部26、最前面讀音位置·全讀音對應辭典27、句中讀音位置·全讀音對應辭典28、輸出部29。
輸入部21進行對從輸入裝置13輸入的拼音文字列或變換指示等的輸入處理。
控制部22進行系統(tǒng)整體的控制。在該控制部22中包含有用于進行從輸入的拼音到漢字的變換的變換引擎。
辭典檢索處理部23根據(jù)輸入的拼音檢索單詞辭典24,并從同一辭典24中抽出對應輸入拼音的單詞。被該辭典檢索處理部23抽出的單詞作為輸入拼音的變換候補保存在存儲器12的候補緩沖區(qū)12c中。
單詞辭典24是作為標準辭典在拼音漢字變換中使用的辭典,對于每個單詞都保存有拼音和與拼音對應的漢字、品詞等拼音漢字變換處理所需要的信息。另外,在該單詞辭典24內(nèi)的各個單詞中,附加有預先設定的頻度信息。
最前面讀音抽出處理部25根據(jù)輸入的拼音檢索最前面讀音位置·全讀音對應辭典27,并從同一辭典中抽出最前面部分的輸入拼音所具有的單詞。
句中讀音位置抽出處理部26根據(jù)輸入的拼音檢索句中讀音位置·全讀音對應辭典28,并抽出預先指定位置的輸入拼音所具有的單詞。由上述最前面讀音抽出處理部25或句中讀音位置抽出處理部26抽出的單詞作為輸入拼音的變換候補被保存在存儲器12的候補緩沖區(qū)12c中。
最前面讀音位置·全讀音對應辭典27是作為擴展辭典而用于拼音漢字變換的辭典,以對應關(guān)系的形式記錄著關(guān)于特定單詞的全部漢字的讀音/索引和其最前面部分的讀音/索引(參照圖3)。另外,該最前面讀音位置·全讀音對應辭典27內(nèi)的各個單詞上附加有預先設定的頻度信息。
句中讀音位置·全讀音對應辭典28與上述最前面讀音位置·全讀音對應辭典27同樣,是作為擴展辭典而用于拼音漢字變換的辭典,以對應關(guān)系的形式記錄著關(guān)于特定單詞的全部漢字的讀音/索引和其中的指定位置的部分的讀音/索引(圖4)。另外,該句中讀音位置·全讀音對應辭典28內(nèi)的各個單詞上附加有預先設定的頻度信息。
輸出部29在顯示裝置14上進行顯示輸入的拼音的文字列或與其輸入的拼音對應的變換結(jié)果等輸出處理。
圖3是最前面讀音位置·全讀音對應辭典27的構(gòu)成圖。
最前面讀音位置·全讀音對應辭典27是以3個文字以上的單詞為對象,以對應關(guān)系的形式匯集其最前面的2個文字的讀音/索引和全讀音/索引而成的辭典。
例如,“萬紫千紅”這個單詞的讀音用“wan/zi/qian/hong”這樣的拼音文字列來表示。此處,文字列中的/表示1個漢字(音節(jié))的區(qū)隔,并不是實際中所表示的內(nèi)容。以這樣的“萬紫千紅”這一單詞的3個文字以上的單詞為對象,對應其最前面2個文字的讀音“wan/zi”、索引“萬紫”和全讀音“wan/zi/qian/hong”、索引“萬紫千紅”。
同樣地,“hao/shi”(好事)和“hao/shi/duo/mo”(好事多磨)、“l(fā)a/ding”(拉丁)和“l(fā)a/ding/mei/zhou”(拉丁美洲)分別對應。
還有,如相對于“zhong/yang”(中央),對應“zhong/yang/wei/yuan/hui”(中央委員會)和“zhong/yang/gan/bu/hui”(中央干部會)這樣,與在最前面位置中包含“中央”的3個文字以上的單詞相對應。
圖4是句中讀音位置·全讀音對應辭典28的構(gòu)成圖。
句中讀音位置·全讀音對應辭典28是以3個文字以上的單詞為對象,以對應關(guān)系的形式匯集預先指定位置的2個文字的讀音/索引和全讀音/索引而成的辭典。
與上述圖3的最前面讀音位置·全讀音對應辭典27的不同在于位置信息。該位置信息是表示讀音的位置的信息。例如“人民大學”這個單詞的讀音用“ren/min/da/xue”這樣的拼音文字列來表示。文字列中的/表示1個漢字(音節(jié))的區(qū)隔,并不是實際中所表示的內(nèi)容。對于這樣的’“人民大學”之類的3個文字以上的單詞,第1文字和第3文字的讀音“ren/da”、索引“人大”和全讀音“ren/min/da/xue”、索引“人民大學”相對應。進而,在部分讀音方面,作為位置信息附加“1,3”。
另外,“ren/da”(人大)在位置信息“1,5”時,對應“ren/min/dai/biao/da/hui”(人民代表大會)這個單詞。
同樣地,“bei/zhan”(北展)在位置信息“1,3”時,對應“bei/jing/zhan/lan/zhong/xin”(北京展覽中心)這個單詞,同時,“bei/zhan”(北展)在位置信息“1,4”時,對應“bei/jing/shi/zhan/lan/guan”(北京展覽館)這個單詞。
還有,作為該句中讀音位置·全讀音對應辭典28中所使用的部分的讀音,如把“東京大學”省略為“東大”、“北海道大學”省略為“北大”這樣,作為一般的略語使用通用單詞的讀音。
下面,說明主裝置的動作。
圖5是作為本發(fā)明的第1實施形態(tài)的變換處理動作的流程圖。第1實施形態(tài)的特征在于使用圖3所示的最前面讀音位置·全讀音對應辭典27,用最前面2個文字的拼音輸入變換成所期望的單詞。
首先,通過輸入部21用拼音(字母的文字列)輸入漢語的漢字讀音。該輸入的拼音文字列保存在圖1所示的輸入緩沖區(qū)12b中(步驟A11)。
在此,如果通過按下變換鍵輸出變換指示,控制部22便把輸入的拼音輸送到辭典檢索處理部23。在辭典檢索處理部23從作為標準辭典的單詞辭典24中檢索對應輸入拼音(讀音)的單詞(索引)(步驟A12)。檢索單詞辭典24的結(jié)果,如果有相符的單詞(步驟A13的YES),則辭典檢索處理部23把該單詞作為變換候補抽出(步驟A14)。此時抽出的變換候補保存在圖1所示的候補緩沖區(qū)12c中。
然后,控制部22把同一輸入拼音輸送到最前面讀音抽出處理部25。在最前面讀音抽出處理部25,參照作為擴展辭典的最前面讀音位置·全讀音對應辭典27檢索對應輸入拼音的單詞(步驟A15)。
此時,最前面讀音位置·全讀音對應辭典27如圖3所示那樣,是以3個文字以上的單詞為對象,以對應關(guān)系的形式匯集其最前面的2個文字的讀音/索引和全部的讀音/索引而成的辭典。最前面讀音抽出處理部25檢索該最前面讀音位置·全讀音對應辭典27中是否有符合最前面的讀音。如果有(步驟A16的YES),則最前面讀音抽出處理部25同時分別抽出作為變換候補的對應其最前面讀音的單詞(索引)和對應其全部的讀音的單詞(索引)(步驟A17)。此時抽出的變換候補保存在圖1所示的候補緩沖區(qū)12c中。
進行完這樣的辭典檢索后,控制部22把保存在候補緩沖區(qū)12c中的各個變換候補作為對應該輸入拼音的變換候補來取得,并進行確定這些的變換候補輸出順序等變換處理(步驟A18)。
該情況下,變換候補的輸出順序由單詞的頻度信息或者文字個數(shù)來決定。頻度信息預先設定在登錄在辭典(標準辭典及擴展辭典)中的各個單詞上,在抽出作為變換候補的單詞時被一并讀出。在根據(jù)該頻度信息時,進行如把使用頻度高的候補作為第1位等的輸出順序的確定處理。在根據(jù)文字個數(shù)時,檢查構(gòu)成作為變換候補而得到的單詞的漢字的文字個數(shù),進行如把文字個數(shù)多的候補作為第1位等的輸出順序的確定處理。
這樣,如果確定了各變換候補的輸出順序,則控制部22按照其輸出順序把各變換候補作為變換結(jié)果輸送到輸出部29(步驟A19)。由此,在輸出部29,或把輸入拼音變換成第1位的變換候補并顯示,或在候補區(qū)域進行其他的變換候補的顯示等的處理。
圖6A及圖6B中示出具體例。
如圖6A所示,例如,假定作為讀音信息輸入由“wanzi”這樣的文字列構(gòu)成的拼音。通過按下變換鍵,根據(jù)該輸入拼音檢索單詞辭典24及最前面讀音位置·全讀音對應辭典27,輸出圖6B所示的變換結(jié)果。
該情況下,在單詞辭典24沒有相符的單詞,而作為變換候補可由最前面讀音位置·全讀音對應辭典27獲得“萬紫千紅”、“萬紫”這樣2個單詞?!叭f紫千紅”是該輸入拼音“wanzi”最前面2個文字“wan”和“zi”所具有的單詞?!叭f紫”則是以“wanzi”為讀音的單詞。
優(yōu)先輸出哪一個與否由預先設定在各個單詞上的頻度信息或文字個數(shù)來確定。對文字個數(shù)的情況,是文字個數(shù)多的優(yōu)先還是文字少的優(yōu)先可由用戶任意選擇。在該例中,“萬紫千紅”作為第1候補輸出。
這樣,通過輸入作為“萬紫”的讀音的“wanzi”,可以使其最前面的讀音所具有的“萬紫千紅”也作為變換候補輸出。因此,即便是文字個數(shù)多(=拼音讀音長)的單詞也可以減少其輸入次數(shù)而高效地進行變換。
另外,在過去的輸入方法中,如果是“萬紫千紅”,需要象“w”、“z”、“q”、“h”這樣只輸入各個文字的最前面子音部,或象“wan”、“z”、“q”、“h”這樣,與第2個文字以后相關(guān)并只輸入最前面子音部,這與1個漢字=1個音節(jié)的規(guī)則相反,反而使用戶感覺不便。與此相反,因本實施形態(tài)的方法用拼音輸入單詞最前面2個文字的讀音就行,所以,不會給用戶帶來過去的那種不便感,可以用較少的輸入就能簡單地得到所期望的單詞。
在上述的說明中雖然實現(xiàn)了把所謂的單詞的最前面部分作為對象的拼音輸入的效率化,但進一步發(fā)展此點,可以不僅把最前面,而且還能夠把單詞中的任意部分作為對象,通過輸入其任意的部分(單詞之一部),也能夠變換相符的單詞。
這是通過使用圖4所示的句中讀音位置·全讀音對應辭典28來實現(xiàn)的。該句中讀音位置·全讀音對應辭典28將單詞的一部分(句中位置的部分)限定在2個文字程度,是用對應關(guān)系的形式把其2個文字作為一部分來包含的單詞而構(gòu)成的辭典。
與最前面讀音位置·全讀音對應辭典27相比,其不同之處是位置信息的追加。該位置信息可以考慮用于各種各樣的用途。例如,一般地,根據(jù)4個文字以上的單詞的比例極低這一點,可以判定位置信息的第2位的數(shù)字比4大的單詞為4個文字以上的單詞,可以降低變換候補的優(yōu)先順序。當然,根據(jù)用戶的指定,也可以是文字個數(shù)多的單詞優(yōu)先。
下面,作為第2實施形態(tài),說明使用該句中讀音位置·全讀音對應辭典28的變換處理。
圖7是表示作為本發(fā)明的第2實施形態(tài)的變換處理動作的流程圖。第2實施形態(tài)的特征在于使用圖4所示的句中讀音位置·全讀音對應辭典28,用指定位置有2個文字程度的拼音輸入變換所期望的單詞。
首先,通過輸入部21用拼音(字母的文字列)輸入漢語的漢字讀音。該輸入的拼音文字列保存在圖1所示的輸入緩沖區(qū)12b中(步驟B11)。
在此,如果通過按下變換鍵輸出變換指示,控制部22便把輸入的拼音輸送到辭典檢索處理部23。在辭典檢索處理部23從作為標準辭典的單詞辭典24中檢索對應輸入拼音(讀音)的單詞(索引)(步驟B12)。檢索單詞辭典24的結(jié)果,如果有相符的單詞(步驟B13的YES),則辭典檢索處理部23把該單詞作為變換候補抽出(步驟B14)。此時抽出的變換候補保存在圖1所示的候補緩沖區(qū)12c中。
然后,控制部22把同一輸入拼音輸送到句中讀音位置抽出處理部26。在句中讀音位置抽出處理部26,參照作為擴展辭典的句中讀音位置·全讀音對應辭典28檢索對應輸入拼音的單詞(步驟B15)。
此時,句中讀音位置·全讀音對應辭典28如圖4所示那樣,是以3個文字以上的單詞為對象,以對應關(guān)系的形式匯集其指定位置的2個文字的讀音/索引和全讀音/索引而成的辭典。句中讀音位置抽出處理部26檢索該句中讀音位置·全讀音對應辭典28中是否有相符的句中讀音。如果有(步驟B16的YES),則由句中讀音位置抽出處理部26同時分別抽出作為變換候補的對應其句中讀音的單詞(索引)和對應其全讀音的單詞(索引)(步驟B17)。此時抽出的變換候補保存在圖1所示的候補緩沖區(qū)12c中。
進行完這樣的辭典檢索后,控制部22把保存在候補緩沖區(qū)12c中的各個變換候補作為對應該輸入拼音的變換候補來取得,并進行確定這些的變換候補的輸出順序等的變換處理(步驟B18)。
該情況下,變換候補的輸出順序根據(jù)單詞的頻度信息或者文字個數(shù)來決定。頻度信息預先設定在登錄在辭典(標準辭典及擴展辭典)中的各個單詞上,在抽出作為變換候補的單詞時一并讀出。在根據(jù)該頻度信息時,進行如把使用頻度高的候補作為第1位等的輸出順序的確定處理。在根據(jù)文字個數(shù)時,檢查構(gòu)成作為變換候補而得到的單詞的漢字的文字個數(shù),進行如把文字個數(shù)多的候補作為第1位等的輸出順序的確定處理。
這樣,如果確定了各變換候補的輸出順序,則控制部22按照其輸出順序把各變換候補作為變換結(jié)果輸送到輸出部29(步驟B19)。由此,在輸出部29,或把輸入拼音變換成第1位的變換候補并顯示,或在候補區(qū)域進行其他的變換候補的顯示等的處理。
圖8A~圖8C中示出具體例。
如圖8A所示,假定作為讀音信息輸入如由“renda”這樣的文字列構(gòu)成的拼音。通過按下變換鍵,可基于該輸入的拼音檢索單詞辭典24及句中讀音位置·全讀音對應辭典28,并輸出如圖8B所示的結(jié)果。
該情況下,在單詞辭典24中沒有相符的單詞,利用句中讀音位置·全讀音對應辭典28,作為變換候補可以獲得“人民大學”、“人民代表大會”、“人大”這樣3個單詞?!叭嗣翊髮W”是在第1個文字具有該輸入拼音“renda”的“ren”、第3個文字具有“da”的單詞?!叭嗣翊泶髸笔窃诘?個文字具有該輸入拼音“renda”的“ren”、第5個文字具有“da”的單詞。“人大”是以該輸入拼音“renda”為讀音的單詞。
優(yōu)先輸出哪一個單詞與否由預先設定在各個單詞上的頻度信息或各單詞的文字個數(shù)來確定。對文字個數(shù)的情況,是文字個數(shù)多的優(yōu)先還是文字少的優(yōu)先可由用戶任意選擇。
具體地如圖8B所示,按下設置在作為優(yōu)先候補的單詞文字個數(shù)的操作畫面31上的“變更”按鈕發(fā)出變更指示。根據(jù)該變更指示,將顯示如圖8C所示的文字個數(shù)輸入畫面35,用戶可通過輸入具體的數(shù)字,變更優(yōu)先順序。
另外,33是“現(xiàn)狀”按鈕,在作為缺省指示預先設定的文字個數(shù)時使用。在缺省狀態(tài)下,規(guī)定4個文字以下的單詞優(yōu)先。34是“取消”按鈕,在取消錯誤的指示時使用。
在圖8B的例中,作為缺省通過指定優(yōu)先4個文字以下的單詞,最優(yōu)先輸出“人民大學”。另外,在圖8C的例中,指定6個文字以下的單詞優(yōu)先,最優(yōu)先輸出“人民代表大會”。
此外,雖然在此固定符合“人大”這個輸入拼音的單詞(略語)為最下位,但也可以包含該單詞來確定各變換候補的輸出順序。
這樣,通過輸入作為“人大”的讀音的“renda”,也可以把指定位置處的其讀音所具有的“人民大學”及“人民代表大會”作為變換候補輸出。因此,即使是文字個數(shù)多(=拼音讀音長)的單詞,也能夠減少其輸入個數(shù)而進行高效的變換。
還有,在過去的輸入方法中,如果是“人民大學”,需要象“r”、“m”、“d”、“x”這樣只輸入各個文字的最前面子音部,或象“ren”、“m”、“d”、“x”這樣只輸入與第2個文字以后相關(guān)的最前面子音部,這與1個漢字=1個音節(jié)的規(guī)則相反,反而使用戶感覺不便。與此相反,因本實施形態(tài)的方法用拼音輸入作為一般常用的略語的讀音即可,所以,不會給用戶帶來過去的那種不便感,可以實現(xiàn)用較少的輸入就能簡單地得到所期望的單詞。
上述第1及第2實施形態(tài)的構(gòu)成是使用單詞辭典24和另外準備的最前面讀音位置·全讀音對應辭典27或句中讀音位置·全讀音對應辭典28,根據(jù)讀音的部分輸入進行變換,但也可以把這些辭典匯集成1個實現(xiàn)。
另外,也可以合并在上述第1實施形態(tài)說明的變換處理和在上述第2實施形態(tài)說明的變換處理,作為一系列的變換處理來執(zhí)行。此時,可根據(jù)輸入的拼音分別檢索單詞辭典24、最前面讀音位置·全讀音對應辭典27、句中讀音位置·全讀音對應辭典28,進行抽出相符的單詞的處理。
還有,上述各實施形態(tài)中記載的手法作為可以使之在計算機中運行的程序,也可寫入如磁盤(軟盤、硬盤等)、光盤(CD-ROM、DVD等)、半導體存儲器等記錄介質(zhì)中來適用于各種裝置,或利用通信媒體傳送來適用于各種裝置。實現(xiàn)主裝置的計算機讀入記錄在記錄介質(zhì)中的程序,通過利用該程序控制動作來執(zhí)行上述的處理。
如以上所述,按照本發(fā)明,在輸入文字個數(shù)多(=拼音讀音長)的單詞時,無需用拼音輸入其全部讀音,只輸入其最前面部分的讀音就能高效且準確地進行變換。
另外,不只部分地限定在單詞的最前面,通過用拼音輸入單詞中指定部分的讀音,也可以實現(xiàn)有效且高自由度的拼音漢字變換。
此外,本發(fā)明并非只限定于上述的實施形態(tài),可以在其主旨范圍內(nèi)實施種種變形。
例如,在上述實施形態(tài)是以輸入拼音后按下變換鍵開始顯示變換候補為代表進行的說明,代替這種方式,也可以采用在拼音輸入的同時在規(guī)定位置顯示變換候補的構(gòu)成。這樣,當時就可以選擇期望的單詞,能夠?qū)崿F(xiàn)更高效率的漢語輸入變換處理。
還有,在上述第1實施形態(tài),是組合普通的辭典檢索和通過采用最前面讀音抽出的辭典檢索情況進行的說明,其實也可以根據(jù)需要對采用最前面讀音抽出的辭典檢索功能進行使用/不使用的變換。同樣地,在上述第2實施形態(tài),是組合普通的辭典檢索和通過采用句中讀音位置抽出的辭典檢索情況進行的說明,在此也可以根據(jù)需要對采用句中讀音位置抽出的辭典檢索功能進行使用/不使用的變換。
最后,還可以通過組合上述第1實施形態(tài)和上述第2實施形態(tài),采用包含全部普通的辭典檢索、利用最前面讀音抽出的辭典檢索、利用句中讀音位置抽出的辭典檢索來進行處理的構(gòu)成。
權(quán)利要求
1.一種漢語輸入變換處理裝置,該漢語輸入變換處理裝置輸入表示漢語的漢字讀音的拼音,并把其輸入的拼音變換成漢字,其特征在于具有用于用拼音輸入至少具有2個文字程度的讀音的輸入裝置(21);對于每個單詞保存拼音和對應拼音的漢字的單詞辭典(27或28);從上述單詞辭典(27或28)中把具有作為其讀音的一部分的利用上述輸入裝置輸入的拼音的單詞作為變換候補進行檢索的辭典檢索裝置(25或26);輸出利用上述辭典檢索裝置(25或26)檢索的變換候補的輸出裝置(29)。
2.權(quán)利要求1所記載的漢語輸入變換處理裝置,其特征在于上述辭典檢索裝置(25)從上述單詞辭典中把最前面部分具有上述輸入拼音的單詞作為變換候補來進行檢索。
3.權(quán)利要求1所記載的漢語輸入變換處理裝置,其特征在于上述辭典檢索裝置(26)從上述單詞辭典中把預先指定位置具有上述輸入拼音的單詞作為變換候補來進行檢索。
4.一種漢語輸入變換處理裝置,該漢語輸入變換處理裝置輸入表示漢語的漢字讀音的拼音,并把其輸入的拼音變換成漢字,其特征在于具有用于用拼音輸入至少具有2個文字程度的讀音的輸入裝置(21);對于每個單詞保存拼音和對應拼音的漢字的單詞辭典(24及27或28);從上述單詞辭典(24)中把符合利用上述輸入裝置(21)輸入的拼音的單詞作為變換候補進行檢索的第1辭典檢索裝置(23);從上述單詞辭典(27或28)中把具有作為其讀音的一部分的利用上述輸入裝置(21)輸入的拼音的單詞作為變換候補進行檢索的第2辭典檢索裝置(25或26);確定利用上述第1及第2辭典檢索裝置(23及25或26)檢索的各變換候補的輸出順序的輸出順序確定裝置(22);按照上述輸出順序確定裝置(22)所確定的輸出順序輸出上述各變換候補的輸出裝置(29)。
5.權(quán)利要求4所記載的漢語輸入變換處理裝置,其特征在于上述第2辭典檢索裝置(25)從上述單詞辭典中把最前面部分具有上述輸入拼音的單詞作為變換候補來進行檢索。
6.權(quán)利要求4所記載的漢語輸入變換處理裝置,其特征在于上述第2辭典檢索裝置(26)從上述單詞辭典中把預先指定位置具有上述輸入拼音的單詞作為變換候補來進行檢索。
7.權(quán)利要求4所記載的漢語輸入變換處理裝置,其特征在于上述輸出順序確定裝置(22)根據(jù)預先設定在作為各變換候補所得到的單詞上的頻度信息來確定其輸出順序。
8.權(quán)利要求4所記載的漢語輸入變換處理裝置,其特征在于上述輸出順序確定裝置(22)根據(jù)作為各變換候補所得到的單詞的文字個數(shù)來確定其輸出順序。
9.一種漢語輸入變換處理方法,該漢語輸入變換處理方法輸入表示漢語漢字讀音的拼音,并將其輸入的拼音變換成漢字,其特征在于用拼音至少輸入2個文字程度的讀音(A11、B11);根據(jù)上述輸入的拼音檢索對于每個單詞都保存其拼音和對應拼音的漢字的單詞辭典(A15、B15);從上述單詞辭典中把具有作為其讀音的一部分的上述輸入拼音的單詞作為變換候補抽出(A17、B17);輸出上述抽出的變換候補(A19、B19)。
10.一種漢語輸入變換處理方法,該漢語輸入變換處理方法輸入表示漢語漢字讀音的拼音,并將其輸入的拼音變換成漢字,其特征在于用拼音至少輸入具有2個文字程度的讀音(A11、B11);根據(jù)上述輸入的拼音檢索對于每個單詞都保存其拼音和對應拼音的漢字的單詞辭典(A12、B12);作為變換候補從上述單詞辭典中分別抽出與上述輸入拼音相符的單詞及具有作為其讀音的一部分的同一輸入拼音的單詞(A14、B14);確定上述抽出的各變換候補的輸出順序(A18、B18);按照上述確定的輸出順序輸出上述各變換候補(A19、B19)。
全文摘要
通過輸入部用拼音輸入至少具有2個文字程度的讀音,控制部通過辭典檢索處理部及最前面讀音抽出處理部進行辭典檢索。辭典檢索處理部從單詞辭典中把與輸入拼音相符的單詞作為變換候補檢索并抽出。另外,最前面讀音抽出處理部從最前面讀音位置·全讀音對應辭典把具有作為其讀音的一部分的同一輸入拼音的單詞作為變換候補檢索抽出??刂撇坷梦淖謧€數(shù)等確定該抽出的各變換候補的輸出順序,并按照其輸出順序?qū)⑸鲜龈髯儞Q候補輸出到輸出部。
文檔編號G06F17/20GK1218932SQ98122819
公開日1999年6月9日 申請日期1998年11月27日 優(yōu)先權(quán)日1997年11月27日
發(fā)明者林哲洋, 中里茂美, 石冢靖 申請人:株式會社東芝