專利名稱:漢語的輸入處理方法
技術領域:
本發(fā)明是有關漢語的輸入處理方法,更詳細地說是有關用拼音標記語及省略語,通過字母字符鍵將漢語輸入、然后進行變換處理的漢語輸入處理方法。
漢語是由眾多的漢字組成的,這些漢字如用鍵盤等輸入則極為麻煩。譬如也可考慮僅準備相當于漢字的數量的鍵,但因鍵數過于膨大而無實用價值。因此,可采用將漢字分割成左半部(稱為“偏”)及右半部(稱為“旁”),或分割成上半部(稱為“冠”)及下半部(稱為“腳”),通過“偏”及“旁”或“冠”及“腳”的組合來輸入漢字的方式。然而,此種方式也因必須備有眾多的“偏”鍵、“旁”鍵等而使效率極低。
因此,就開始采用如下方式即利用以字母標記漢語讀法的拼音標記法,并通過字母字符鍵以羅馬字標記形式輸入漢字的方式。又,因僅用拼音標記法不能分辨抑揚,故用聲調表示抑揚。聲調符號有四種,稱為“四聲”。漢字的聲調是有規(guī)定的(有的不只是一個),拼音標記通常規(guī)定須附上該四聲。四聲是由以下所述方式定義的。
一聲以高音平進。用[-]表示。
二聲由低音上升為高音。用[/]表示。
三聲由高音轉為低音、并再回升為高音。用[∨]表示。
四聲由高音降為低音。用[\]表示。
以下,用例子來表示。例如用拼音標記的“ma”,如加上聲調可以分辨出如下的漢字。
mā(一聲)媽(母親)
má(二聲)麻(麻木)mǎ(三聲)馬(馬)mà(四聲)罵(叱責)作為四聲的標記法,除上述符號之外也有采用數字的方法。
根據以上的說明,作為拼音標記法,有①不付四聲的拼音標記法;②付四聲的拼音標記法;③用數字表示四聲的拼音標記法等。
在使用不付四聲的拼音標記法場合,檢索輸出時因有許多同音異義詞相對應(參照前述“ma”),故要特定出所需要的漢字,操作煩瑣、需費很多時間。因此,在拼音標記輸入方式中四聲的處理是一個問題,如何合理且高效地加以處理至今一直是一個技術性的課題。
此外,用拼音直接標記漢語時存在的問題是具有標記字符數增多而使處理效率降低的缺點。例如在特開昭61-20176號公報上曾報導了用數字表示四聲的拼音標記方式。如果按照這種方式,譬如對漢語“萬古長青”,用數字表示四聲的拼音標記方式進行標記的話,則為“wan4gu3chang2quing1”,輸入由四個字組成的漢字所需的鍵操作次數增多,處理效率顯著差。
鑒于此,本發(fā)明的目的在于,采用通常的字母字符鍵,以減少輸入漢語用的鍵操作次數,實現一種既迅速、且準確地對漢語進行輸入處理的、高效率的漢語輸入處理方法。
解決上述問題的本發(fā)明所具有的特征在于,將根據下述的規(guī)則1及規(guī)則2作成的、使羅馬字標記省略語和漢字標記相對應的羅馬字標記省略語一一對應漢字標記漢語字典預先貯存在漢語輸入系統(tǒng)內所設置的存儲器中(步驟①);通過字母字符鍵用拼音標記法將漢語輸入時,根據下述規(guī)則1及規(guī)則2進行輸入(步驟②);參照前述羅馬字標記省略語一一對應漢字標記漢語字典將輸入的省略字符變換處理成為完整形的漢語(步驟③)。
圖1為表示本發(fā)明方法的原理的流程圖。
將簡便的付四聲的拼音標記輸入法與成語省略法進行組合,從而對漢語進行輸入處理。
實施例以下就本發(fā)明的實施例進行詳細說明。首先,對規(guī)則1進行舉例說明。
在此,若令規(guī)則1之②的特字文字乃至符號采用“j”,④的特字文字乃至符號采用“h”,并對前述的拼音標記“ma”采用規(guī)則1,則如下所示。
ma(一聲)媽maj(二聲)麻maa(三聲)馬mah(四聲)罵接著就規(guī)則2舉例加以說明。前述的三字以上成語“萬古長青”,如用付四聲拼音標記法輸入的話,則為“wàngǔchángqūing”?,F對它采用本發(fā)明。按照規(guī)則2,第1字“萬”因適用規(guī)則1而成為“wanh”顯示四聲。第2字開始的,即“古長青”則僅采用拼音標記的頭一個字母,即為“gcq”。整體用“wanhgcq”輸入便行了。利用付四聲的拼音標記法輸入時的鍵操作次數(以下稱為觸鍵數)為17次,與此相對,利用本發(fā)明方法輸入時的觸鍵數僅7次,可知操作次數顯著地減少了。
在此對規(guī)則2中的第2字開始僅使各字的頭一個字母相對應的理由進行說明。采用前述四聲聲調符號,雖在某種程度上能對漢字進行辨別,但是一個字一個字的話,又因同音異義詞多而不易識別。例如僅ma(一聲)所對應的漢字就有“抹”、“螞”、“麻”、“磨”、“媽”等很多字。對于由兩個字組成的常用詞,用拼音標記而無聲調符號時,因同音異義字多不易識別,如付上聲調符號則極易識別。
另一方面,三字以上(包括3字)組成的常用詞中,同音異義語就大大地減少了,但在向漢語輸入系統(tǒng)等進行輸入時如把全部字符都用拼音標記法輸入的話,則觸鍵數將要增多。因而,為使觸鍵數減少,想到了僅用字的拼音標記的頭一個字符進行輸入的方法。例如“人民”如用拼音標記表示則為“rén m
n”,僅取其頭一個字母表示為“rm”。然而,采用此標記法則又使同音異義字增加,使檢索變得極為麻煩。
為此,本發(fā)明對于2字常用詞(2字詞匯)以內按照拼音標記全部輸入,對于3字以上的常用詞(3字以上成語)的場合,其最初的第一字用拼音標記進行輸入,第2字開始用頭一個字母進行輸入的拼音標記省略語(羅馬字標記省略語),因而使之容易識別且觸鍵數減少。
因為如此輸入的漢語經大幅度簡略,如照此直接輸出則意義不明。因而,本發(fā)明將按照前述的規(guī)則1及規(guī)則2輸入的羅馬字標記變換成為完整形狀的漢語用的字典(羅馬字標記省略語一一對應漢字漢語字典)設置于漢語輸入系統(tǒng)中,使被輸入的簡略標記變換成為完整形的漢語。一旦變換成為完整形的漢語后,便能將該漢語根據所需目的輸出,或進行追加處理。
圖2是表示實施本發(fā)明方法用的漢語輸入系統(tǒng)的一個例子的構成圖。圖中,1為由字母字符鍵及其它控制鍵組成的鍵盤;2為接受來自鍵盤1的輸入后進行各種控制的CPU(中央處理機)。3為與CPU2連接、貯存各種情報的存儲器,上述羅馬字標記省略語一對應漢字標記字典3a包含在其內部。4為表示由CPU2輸出的各種情報的CRT,5為對變換成完整形漢語根據需要進行處理的處理電路,6為輸出變換處理結果的輸出裝置。作為輸出裝置6,可使用例如打印裝置。
以下對由此構成的系統(tǒng)的動作進行說明。操作者,通過遵從上述規(guī)則1、規(guī)則2的拼音省略輸入方式將須輸入的漢語從鍵盤1輸入。CPU2將輸入進來的羅馬字標記省略語與存儲器3內的羅馬字標記省略語一對應漢字標記字典3a相對照,并讀出對應漢字。由此完成羅馬字標記省略語向所對應漢字的變換處理。變換結果是,例如貯存于CPU2內所設的緩沖存儲器(圖中未示出)中的緩沖存儲內容顯示在CRT4。根據需要次數反復進行這種操作,便可完成漢語輸入處理。于是,CRT4中表示出輸入的漢語。
對于將CRT表示的漢語由輸出裝置6打印輸出的場合,將CPU2內的緩沖器的內容直接向輸出裝置6打印輸出。也就是說,這樣的結構就是漢語的字處理機。如果使其作為漢語的字處理機工作時,還有必要使之增加一種對貯存于CPU2內的緩沖存儲器中的文章進行變更、乃至訂正等編輯功能,如分配給附屬在鍵盤1中的控制鍵以各種功能,和附加或變更一些軟件,就能適應。
處理電路5中,可進行例如為與通訊電路連接而需要的變調處理,或者為與計算機連接而需要的接口處理。與通訊回路相連時,成為漢語傳文通訊裝置,如與計算機相連便可以進行輸入漢語的計算機操作。
根據本發(fā)明,由于鍵盤1可用通常的字母鍵,故可以使用26字母之外還具有控制鍵的ASCⅡ標準鍵盤。
以下,更為具體地對本發(fā)明加以說明。
對于按本發(fā)明將下述漢語文章輸入,進行漢字變換及輸出處理加以說明。
<漢語>
絲綢之路把東方跟西亞、歐洲聯系起來、成了東西方的交通要道、促進了東西方的文化交流、通商貿易和友好往來。
近年來,中國和一些友好國家共同決定重新開放絲綢之路。這對發(fā)展中國和各國人民之間的友誼、一定會作出新的貢獻。
以字母輸入的情報,如用拼音帶四聲的標記來表示上述文章,則如下所示。
<拼音帶四聲標記>
<p>如按照通常的拼音羅馬字標記將該標記輸入時其觸鍵數為437次。接著用本發(fā)明的拼音標記省略法來表示相同文章,則如下所示。
<本發(fā)明的拼音省略標記>
siczlbaadongfanggenxiyah,ouzhoulianjxqlchengjledongxfdjiaotyd,cuhjinhldongxfdwenjhjl,tongsmyhejyoouhwl.
jinhnl,zhongguojhejyixieyoouhgjgonghtjdchongjxkfsiczl,zhehduihfazhaanzhonggrmhejgehgrmzhijiandyoouyih,yidhzuochuxindgonghxianh.
此情況下的觸鍵數為221次,約為按照拼音羅馬字標記輸入時的1/2,可見本發(fā)明使效率大大提高。
圖3為本實施例所用的成語的漢字標記、拼音付四聲標記及拼音省略標記的對照圖??梢哉J為圖2中所示的羅馬字標記省略語一一對應漢字標記字典3a中大量收集著該圖所示的情報。此時,羅馬字標記省略語一一對應漢字標記字典3a的容量如有10~12萬字,則對于通常的使用目的已足夠。
如上詳細說明,根據本發(fā)明,通過將簡便的付四聲拼音標記輸入法與成語省略法相組合,能夠使利用通常的字母字符鍵將漢語輸入所需的鍵操作次數減少,以實現迅速且準確地輸入處理漢語的、效率高的漢語輸入處理方法,有極大的實用效果。
附面簡單說明圖1為表示本發(fā)明方法之原理的步驟圖;
圖2是為實施本發(fā)明方法而舉的漢語輸入系統(tǒng)的一個例子的構成圖;
圖3為成語的漢字標記、拼音付四聲標記及拼音省略標記相對應的對應圖。
1……鍵盤2……CPU3……存儲器3a……羅馬字標記省略語一一對應漢字標記字典4……CRT5……處理電路6……輸出裝置
權利要求
1.一種漢語輸入處理方法,其特征在于,該漢語輸入處理方法將根據下述規(guī)則1及規(guī)則2作成的、使羅馬字標記省略語和漢語標記相對應的羅馬字標記省略語一一對應漢字標記漢語字典預先貯存在漢語輸入系統(tǒng)內所設置的存儲器中(步驟①);通過字母字符鍵用拼音標記法將漢語輸入時,根據下述規(guī)則1及規(guī)則2進行輸入(步驟②),參照前述羅馬字標記省略語一一對應漢字標記漢語字典將輸入的省略文字變換處理成為完整形的漢語(步驟③);(規(guī)則1)按如下方法對1個字的詞匯及2個字的詞匯付加四聲后進行輸入①對一聲字不加音聲符號;②在二聲字字尾付加特定的文字乃至符號;③在三聲字字尾重疊最初的元音;④在四聲字字尾付加與②時不同的特定的文字乃至符號;(規(guī)則2)3個字以上(包括3個字在內)的成語,第1字按規(guī)則1付加四聲、第2字起只使各字頭一個字相對應。
全文摘要
本發(fā)明涉及一種漢語輸入處理方法。該方法通過字母字符鍵用拼音標記法或羅馬字省略標記字將漢語輸入,經預先貯存于漢語輸入系統(tǒng)內設置的存儲器中的羅馬字標記省略語一一對應漢字標記漢語字典,將輸入的省略文字變換處理成為完整形的漢語,其優(yōu)點為使?jié)h語輸入處理方法實現了既迅速且準確的愿望,有極大的實用價值。
文檔編號G06F17/22GK1035568SQ8810030
公開日1989年9月13日 申請日期1988年1月20日 優(yōu)先權日1987年7月31日
發(fā)明者李約瑟, 羽深邦男, 石和田四郎 申請人:三井東圧化學株式會社