專利名稱:漢字鍵盤輸入用自動組詞方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計算機(jī)漢字鍵盤輸入用的自動組詞方法。
漢字鍵盤輸入技術(shù)中大量地采用詞組,是方便使用、提高速度的重要手段,為提高詞組的命中率,現(xiàn)有的技術(shù)只是簡單地增加詞組的數(shù)量,這樣又帶來了詞組重碼多、系統(tǒng)開銷大的新弊病,況且既使是很大的系統(tǒng)詞庫也無法提供全部所需的詞組。
本發(fā)明的目的在于提供一種新的自動組詞方法,使大量使用詞組成為可能。
本發(fā)明的方法與傳統(tǒng)的漢字輸入技術(shù)不同,該方法用于輸入連續(xù)的漢字文本時,在選中單字或詞組的同時,在軟件中專門的緩沖區(qū)內(nèi)保存與選中單字或詞組相關(guān)的特征信息,作為將來組詞的素材,在一個生詞或一段連續(xù)文本第二次使用時,即可作為一個詞組來輸入,而直接得到用本發(fā)明的方法組成的詞組。
該方法具備如下特征1.有一個隨輸入過程自動更新的緩沖區(qū),它由代碼區(qū)、屬性區(qū)和文字區(qū)共三部分組成,分別保存選中單字或詞組的輸入代碼、組詞屬性和實際選中的漢字文本。三者之間是一種簡單的對應(yīng)關(guān)系;2.以緩沖區(qū)內(nèi)容為素材組成所需的詞匯,而與緩沖區(qū)以外內(nèi)容無關(guān);
3.組詞時按以下規(guī)則及順序進(jìn)行在緩沖區(qū)中尋找與輸入碼匹配的代碼串;判定代碼串對應(yīng)的組詞屬性是否合法;將有效代碼串對應(yīng)的文本取出送提示行顯示。
4.組詞屬性是描述緩沖區(qū)內(nèi)容是否可用于組詞的標(biāo)志。對于一個選中的詞組,其第一個字(詞頭)可用于組成詞組的詞頭,其末一個字(詞尾)可用于詞組的詞尾,詞的中間部分只能用于詞組的中間部分,反之則屬于非法。對于一個被選中的單字,被描述為既可用于詞組的詞頭也可用于詞組的詞尾。
5.對于一個較長的詞組,可以用較少的鍵數(shù)(例如4-5鍵),按系統(tǒng)規(guī)定的輸入方法來確定詞組的詞頭、詞尾及詞的中間部分,進(jìn)而確定整個詞組。
6.標(biāo)點(diǎn)符號、字母、數(shù)字也可以同漢字一樣賦予一定的編碼,并按照以上的描述成為詞組的一部分。
7.最近使用的單字可直接由緩沖區(qū)中取出,并使之位于提示行的靠前位置,便于用戶查找。
下面舉例說明本發(fā)明的自動組詞方法文本區(qū)中華人民共和國專利局位于北京薊門橋代碼區(qū)z h r m g h g z l j w y b j j m q屬性區(qū)h e h e h o e h e he h e h e he he he在上例中,屬性區(qū)中的h表示該字的屬性為詞頭,e表示該字的屬性為詞尾,o表示該字的屬性為中間。按照上述的方法,在以上句子中,“中華人民”、“人民共和國”、“薊門橋”、“北京薊門橋”、“專利局位于”等都是合法的詞組,而“華人民”、“利局位于”、“專利局位”等都屬于非法的詞組,在系統(tǒng)中不會出現(xiàn)。
權(quán)利要求
1.一種計算機(jī)漢字鍵盤輸入用的自動組詞方法,其特征在于,該方法在用于輸入連續(xù)的漢字文本時,在選中單字或詞組的同時,在軟件緩沖區(qū)內(nèi)保存與選中單字或詞組相關(guān)的特征信息,作為將來組詞的素材,如果一個生詞或一段連續(xù)文本第二次使用,即可作為一個詞組來輸入,用上述素材和本發(fā)明的方法自動組成一個詞組。
2.根據(jù)權(quán)利要求1所述的方法,其中的軟件緩沖區(qū)是一個可隨輸入過程自動更新的緩沖區(qū),它由代碼區(qū)、屬性區(qū)和文本區(qū)共三部分組成,分別保存選中單字或詞組的輸入代碼、組詞屬性和實際選中的漢字文本,三者之間是一種簡單的對應(yīng)關(guān)系。
3.根據(jù)權(quán)利要求1或2所述的方法,其中的素材是指緩沖區(qū)三部分的全部內(nèi)容。
4.根據(jù)權(quán)利要求1所述的自動組詞方法,其特征在于,是以緩沖區(qū)內(nèi)容為素材組成所需的詞匯,而與緩沖區(qū)以外的內(nèi)容無關(guān)。
5.根據(jù)權(quán)利要求1所述的組詞方法,其特征在于組詞時按以下規(guī)則及順序進(jìn)行a.在緩沖區(qū)中尋找與輸入代碼匹配的代碼串;b.判定代碼串對應(yīng)的組詞屬性是否合法;c.將有效代碼串對應(yīng)的文本取出送提示行顯示。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于其中的組詞屬性是描述緩沖區(qū)內(nèi)容是否可用于組詞的標(biāo)志,對于一個被選中的詞組,其第一個字(詞頭)被描述為可用于組成詞組的詞頭;其末一個字(詞尾)被描述為可用于詞組的詞尾;詞的中間部分被描述為只能用于詞組的中間部分;反之則屬于非法。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于對于一個被選中的單字,其組詞屬性被描述為既可用于詞組的詞頭也可用于詞組的詞尾。
8.根據(jù)權(quán)利要求1所述的自動組詞方法,其特征在于對于一個較長的詞組,可以用較少的鍵數(shù),按系統(tǒng)規(guī)定的方法來確定詞組的詞頭、詞尾及詞的中間部分,進(jìn)而確定整個詞組。
9.根據(jù)權(quán)利要求1所述的自動組詞方法,其特征在于標(biāo)點(diǎn)符號、字母、數(shù)字也可以同漢字一樣賦予一定的代碼,并按照以上的描述成為詞組的一部分。
10.根據(jù)權(quán)利要求1所述的自動組詞方法,其特征在于組詞是完全自動進(jìn)行的,不需要額外的人工干預(yù)即可獲得所需的詞組。
11.根據(jù)權(quán)利要求1所述的自動組詞方法,其特征在于單字作為最短的詞組,可直接由緩沖區(qū)中取出,并使之位于提示行的靠前位置,便于用戶查找。
全文摘要
本發(fā)明公開了一種計算機(jī)漢字鍵盤輸入用的自動組詞方法。在連續(xù)輸入漢字文本的同時,將選中文本的相關(guān)特征保存在軟件的對照緩沖區(qū)內(nèi),當(dāng)一個生詞或一段連續(xù)文本第二次使用時,即可用緩沖區(qū)中的內(nèi)容作為素材自動組成一個詞組。同樣地,一個或數(shù)個短詞組也可以組成一個更長的詞組。將該方法用于傳統(tǒng)上認(rèn)為重碼很多的拼音類輸入法,實際使用時可提供大量的系統(tǒng)沒有提供的詞組,除少數(shù)所謂的“高頻字”外,很少用到離散的單字,因此可大大加快漢字的輸入速度。
文檔編號G06F3/023GK1153335SQ95108878
公開日1997年7月2日 申請日期1995年9月1日 優(yōu)先權(quán)日1995年9月1日
發(fā)明者侯偉華 申請人:侯偉華