專利名稱:以詞為單位的漢字的通用計算機輸入方法
技術(shù)領(lǐng)域:
本發(fā)明是一種以詞為單位的漢字的通用計算機輸入方法,根據(jù)漢語拼音歸納出音碼及聲調(diào)碼,并將所有漢字拆解為部首+字身的形式,分別用音碼或者筆畫標記部首或者字身,構(gòu)成漢字的部首碼和字身碼,用漢字的音碼及聲調(diào)碼,以及漢字的部首碼和字身碼,以詞為單位按規(guī)則依次擊鍵輸入漢字。本發(fā)明屬于中文信息處理在漢字及相關(guān)信息處理領(lǐng)域方面的應用,是在“拼音混合輸入技術(shù)”(中國專利ZL 95102608.9)和“小鍵盤拼音混合輸入技術(shù)”(中國專利申請03153755.3)基礎(chǔ)上進行再創(chuàng)造所產(chǎn)生的發(fā)明。
背景技術(shù):
目前,計算機出現(xiàn)了膝上型、掌上型、微型化的趨勢,手機逐漸出現(xiàn)了具備計算機各項功能的趨勢,PDA、機頂盒、電子書、手持終端、家用電器以及固定電話等也都迫切需要用10個數(shù)字鍵方便、快捷地輸入中文信息,這就要求我們將現(xiàn)有的主要使用英文字母編碼的漢字輸入方法轉(zhuǎn)變?yōu)橹饕褂?0個數(shù)字鍵編碼的數(shù)字化漢字輸入方法。
以智能ABC(itABC)和微軟拼音(Microsoft Pinyin)為代表的拼音輸入法是人們在PC機上輸入漢字的主流輸入方法。為提高拼音漢字輸入方法的輸入效率,發(fā)明人于1995年根據(jù)《漢語拼音方案》、《漢語拼音正詞法基本規(guī)則》等規(guī)范的漢語知識,發(fā)明了拼音混合輸入技術(shù)(“以詞為單位的音形意漢字計算機輸入方法”,中國專利ZL95102608.9),有效地解決了漢字輸入前期易學性和后期效率的矛盾,使主要使用漢語拼音編碼的計算機漢字輸入變得更為快捷和便利。
在掌上型、微型化電腦以及手機、PDA、機頂盒、電子書、手持終端、家用電器、固定電話等領(lǐng)域,漢字輸入的效率還比較低。發(fā)明人于2003年在中國專利ZL 95102608.9的基礎(chǔ)上,發(fā)明了小鍵盤拼音混合輸入技術(shù)(“以詞為單位的數(shù)字化漢字計算機輸入方法”,中國專利申請03153755.3),有效地解決了這一難題。該專利技術(shù)得到智能ABC(itABC)和美國特捷通訊(Tegic Communications,其T9輸入法占據(jù)了世界手機輸入法70%以上市場)公司的好評,三方將在該技術(shù)的基礎(chǔ)上共同開發(fā)T9ABC小鍵盤漢字輸入法,使主要使用漢語拼音編碼的計算機小鍵盤漢字輸入變得更為快捷和便利。
但是,在日常生活中,人們對在不同設(shè)備上需要使用不同的漢字輸入方法,如在PC機上使用智能ABC(itABC),而在手機上使用T9(或者T9ABC)輸入法,需要重新學習輸入規(guī)則,需要重新建立個人詞庫等感到十分不便,他們迫切希望能有一種通用的漢字輸入方法,以使在使用任何諸如計算機、手機、PDA、遙控器、智能家電等所有需要用到漢字的設(shè)備上,在輸入任何漢字、阿拉伯數(shù)字、英文字母、標點符號等中文信息以及世界上其他任何國家的語言文字的時候,都可以使用同一種輸入方法??梢韵胂螅绻婺苋缛藗兯?,發(fā)明出這種輸入方法,那么,今后無論用戶在任何領(lǐng)域處理中文信息,都可使用該輸入法進行輸入,不用重新學習輸入規(guī)則、不用重新建立個人詞庫、不用操心需要多家公司提供技術(shù)支持和售后服務等諸多問題,等等,一切后顧之憂都可拋之腦后。本發(fā)明就試圖在此方面進行有益的嘗試。
此外,無論是拼音混合輸入技術(shù)(中國專利ZL 95102608.9),還是小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3),一方面,對不認識的漢字,尚不能直接用音碼輸入,還需要查字典,或者切換到其他輸入方法進行輸入;另一方面,單字詞的輸入效率明顯偏低,如輸入“yi”僅僅在GB 2312-80中就有超過100個重碼,在GB 18030中重碼數(shù)量更是大大增加。人們迫切希望改進上述兩項技術(shù),從根本上改善單字詞的輸入方法,解決這兩個難題。
發(fā)明內(nèi)容
定義一種新型的計算機、手機、PDA、遙控器、智能家電、電子書、手持終端、固定電話等設(shè)備的通用鍵盤,包括大鍵盤和/或小鍵盤,取拼音混合輸入技術(shù)(中國專利ZL 95102608.9)定義的30個音碼,并將其按照拼音混合輸入技術(shù)(中國專利ZL 95102608.9)的定義分布在大鍵盤“a”、“b”、“c”、“d”、“e”、“f”、“g”、“h”、“i”、“j”、“k”、“l(fā)”、“m”、“n”、“o”、“p”、“q”、“r”、“s”、“t”、“u”、“v”、“w”、“x”、“y”、“z”、“;”、“,”、“.”、“/”這30個鍵上,以及按照小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3)的定義分布在小鍵盤1、2、3、4、5、6、7、8、9、0這10個數(shù)字鍵上,按照國家標準將橫“一”、豎“丨”、撇“丿”、點“丶”、折“乛”這五個筆畫分別定義在大鍵盤以及小鍵盤“1”、“2”、“3”、“4”、“5”這5個數(shù)字鍵上,按照國家標準將陰平1、陽平2、上聲3、去聲4、輕聲5這五個聲調(diào)碼分別定義在大鍵盤以及小鍵盤“1”、“2”、“3”、“4”、“5”這5個數(shù)字鍵上,使用小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3)的編碼規(guī)則對所有詞進行編碼,或者用本發(fā)明所定義的部首碼和字身碼對單字詞進行編碼,或者用漢字的音碼+部首碼的第一碼+字身碼的第一碼對單字詞進行編碼,在大鍵盤或者小鍵盤上依次擊鍵輸入漢字。同時,兼容編碼標點符號、阿拉伯數(shù)字、英文詞、混合詞等。
本發(fā)明所述的新型的計算機、手機、PDA、遙控器、智能家電、電子書、手持終端、固定電話等的漢語通用鍵盤包括(1)大鍵盤的定義在任何qwerty大鍵盤上,定義“v”鍵上同時標記逗號(“,”),“u”鍵上同時標記斜杠(“/”),“i”鍵上同時標記分號(“;”);同時,定義“,”鍵上同時標記“ch”(或者 以下凡是在編碼中均標示為“,”),“.”鍵上同時標記“ng”(或者η,以下凡是在編碼中均標示為 或者“η”),“/”鍵上同時標記“zh”(或者 以下凡是在編碼中均標示為“/”),“;”鍵上同時標記“sh”(或者 以下凡是在編碼中均標示為“;”)。
(2)小鍵盤的定義在PC等鍵盤上的小鍵盤使用類似手機的數(shù)字分布定義,即將原普通PC鍵盤上的小鍵盤定義的第一行789、第二行456、第三行123中的第一行和第三行對調(diào),也就是變?yōu)榈谝恍?23、第二行456、第三行789。
(3)以上大鍵盤和小鍵盤可任意組合,即可以只使用大鍵盤(小鍵盤不使用或者使用原小鍵盤),也可以只使用小鍵盤(大鍵盤不使用或者使用原定義),當然,推薦在計算機上兩者同時使用。
本發(fā)明所述的計算機漢字輸入方法包括(1)音碼定義同小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3)。
(2)詞的編碼規(guī)則同小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3)。
(3)單字詞除可按照小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3)編碼外,還可以按照下述的漢字的部首—字身音碼輸入方法進行輸入取部首的一個集合,該部首集合必須包含橫“一”、豎“丨”、撇“丿”、點“丶”、折“乛”這五個單筆部首。對這五個筆畫按照橫1豎2撇3點4折5的國家標準進行編碼,構(gòu)成其部首碼。對該部首集合中的其他部首每個部首確定一個唯一的讀音,將該讀音按照小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3)轉(zhuǎn)換為音碼,構(gòu)成該部首的部首碼。任何一個漢字的部首對應的部首碼就是該漢字的部首碼。
如果一個漢字是無字身的漢字,即該漢字就是所確定部首集合中的部首之一,如“匚”,或者就是由一個部首的變體構(gòu)成的,如“孑”或者“孓”,則該漢字的編碼就是該部首對應的部首碼。
對于有字身的漢字,即除無字身的漢字外的其他漢字,則部首之外的部分構(gòu)成該漢字的字身。對部首取部首碼,對字身取字身碼。部首碼加字身碼就是該漢字的編碼,具體的取碼順序與部首和字身的相對位置相一致,但最長取6碼(即按規(guī)則取碼后略去第6碼以后的部分)。
字身碼的具體取法如下a)如果字身是由1個部分組成的,且該部分是一個部首或者一個漢字,則取該部首的部首碼或該漢字的音碼,構(gòu)成該字身的字身碼。字身既是一個部首同時又是一個漢字的,按照是一個部首處理。
例如“漢”的部首為“氵”,部首碼為“;ui”,字身為“又”,字身碼為“you”,由于“氵”在前,“又”在后,所以“漢”的編碼為“;uiyou”(如果取“漢”的部首為“又”,則其部首碼為“you”,字身為“氵”,字身碼為“;ui”,由于“氵”在前,“又”在后,所以“漢”的編碼同樣為“;uiyou”)。
再如“旦”的編碼為“ri1”,其部首是“日”,部首碼為“ri”,字身是一個部首橫“一”,字身碼為“1”。
b)否則,如果字身是由1個部分組成的,則按順序逐筆取筆畫,最多取6和部首碼碼長之差個編碼。
例如“禺”的部首為豎“丨”,部首碼為“2”,部首碼長度為1;字身為一個部分,按筆順逐筆取6-1=5碼,即“51125”,則“禺”的編碼為“251125”。
再如“我”的部首為撇“丿”,部首碼為“3”,部首碼長度為1;字身為一個部分,按筆順逐筆取6-1=5碼,即“15153”,則“我”的編碼為“315153”。
c)對于其他任何情況,即字身為2個或者2個以上部分,則對每一個部分按照下述規(guī)則取一碼構(gòu)成該漢字的字身碼構(gòu)成部首的部分取該部首所對應的部首碼的第一碼,構(gòu)成一個漢字的部分取該漢字音碼的第一碼,其他部分取該部分第一筆所對應的部首碼。
如“能”的部首為“厶”,部首碼為“si”,字身為“月匕匕”,字身碼為“ybb”,則“能”的編碼為“siybb”。再如“繁”的部首為“糸”,部首碼為“jiao”,字身為“每”mei“攵”fan,則“繁”的編碼為“mfjiao”。
又如“孬”的部首碼為橫1,字身為“不”的字身+“好”,則“孬”的編碼為部首碼橫“1”+“不”的字身的第一碼撇“3”+“好”的音碼的第一碼“h”,也就是“13h”。
再如“哉”的部首為“戈”,字身為“十口”,“戈”位于“十口”的中間,其編碼為“;gek”(按照先后順序,先取“十”的音碼的第一碼“;”,再取“哉”的部首碼“ge”,最后取“口”的音碼的第一碼“k”)。
上述編碼為規(guī)范碼。對于上述c),如果一個漢字的字型是左右型,但其規(guī)范碼的部首不是位于其左邊或者右邊的全部部分,而左邊或者右邊的全部部分可以構(gòu)成一個漢字;或者一個漢字的字型是上下型,但其規(guī)范碼的部首不是位于其上邊或者下邊的全部部分,而上邊或者下邊的全部部分可以構(gòu)成一個漢字,則將該漢字視為虛擬的部首按照上述規(guī)范碼編碼的規(guī)則分別取部首碼和字身碼,構(gòu)成容錯碼。當然,具有容錯碼的漢字一定具有規(guī)范碼。
如“孬”可虛擬“不”為部首,相應的字身為“好”,則容錯碼為“buhao”;或者虛擬“好”為部首,相應的字身為“不”,結(jié)果同樣為“buhao”。
再如“夥”的規(guī)范碼為“gxxi”,部首為右下腳的夕,字身為果夕,符合容錯碼的條件,則其容錯碼為虛擬“果”為部首,相應的字身為“多”,則結(jié)果為“guoduo”;或者虛擬“多”為部首,相應的字身為“果”,則結(jié)果同樣為“guoduo”。
(4)單字詞還可以按照下述方法輸入對于無字身的漢字,編碼為該漢字的音碼+部首碼的第一碼。如“木”的編碼為“mum”;對于有字身的漢字,編碼為該漢字的音碼+部首碼的第一碼+字身碼的第一碼。如“編”的編碼為“bianjb”。
(5)對于標點符號采用下述方法編碼所有中文標點符號按照其讀音所對應的音碼的第一碼編碼輸入。
如逗號“,”或者其半角方式“,”編碼為“d”,句號“?!被蛘咂浒虢切问健?”編碼為“j”。
此外,在大鍵盤上還可以直接用v鍵輸入“,”,用u鍵輸入“/”,用i鍵輸入“;”。其他標點符號在大鍵盤上也可按照一般PC機漢字輸入法(如智能ABC等)的約定輸入。
(6)對于英文詞采用下述方法編碼對每個英文字母視為一個虛擬漢字,編碼為其本身,然后對該英文詞按照小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3)的編碼規(guī)則進行編碼。
如“china”編碼為“china”,“microsoft”編碼為“microt”。
(7)對于阿拉伯數(shù)字采用下述方法編碼對每一個阿拉伯數(shù)字視為一個虛擬漢字,編碼為其本身,數(shù)字長度為1-6的,編碼就是該數(shù)字本身,如“2003”編碼為“2003”;長度大于6的,每6個或少于6個數(shù)字為一組分組輸入,如“20031111”編碼為“200311”+“11”。
(8)對于混合詞采用下述方法編碼對混合詞中除漢字外的英文、阿拉伯數(shù)字、希臘字母等等的各種信息,每一個都視為一個虛擬漢字,編碼為其本身,然后對該混合詞按照小鍵盤拼音混合輸入技術(shù)(中國發(fā)明專利申請03153755.3)的編碼規(guī)則進行編碼。
如“aol公司”編碼為“aolgsi”,“智能abc”編碼為“/nabc”,“microsoft公司”編碼為“micros”。再如“l(fā)xd@znabc.com”編碼為“l(fā)xdazm”、“www.hhpy.com”編碼為“wwwdhm”、“hhpy.com”編碼為“hhpydm”,“α粒子”編碼為“alizi3”,“№1”編碼為“no1”。又如“2003年”編碼為“2003ni”,“11月11日”編碼為“11y11r”。(網(wǎng)址、郵箱地址中的“.”定義為“d”,即拼音“dian”或者英文“dot”的首字母)(9)上述方法也都具有小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3)定義的簡碼形式任何一個詞的編碼可省去其除第一碼外的最后一碼,或最后兩碼,或最后三碼,或最后四碼,或最后五碼,構(gòu)成詞的簡碼。
(10)上述方法在大鍵盤上采用編碼的本身逐鍵鍵入,在小鍵盤上則需要根據(jù)小鍵盤的定義轉(zhuǎn)換為數(shù)字逐鍵鍵入。如“編碼”在大鍵盤上輸入“bianma”即可,在小鍵盤上則需要轉(zhuǎn)換為數(shù)字(如采用小鍵盤拼音混合輸入技術(shù)實施方法二所定義的小鍵盤,則為“242662”)。
為提高大鍵盤上的漢字輸入速度,本方法對上述方法作如下改進(以下稱本改進方法為大鍵盤改進方案1)(1)音碼定義按照拼音混合輸入技術(shù)確定,即音碼=音碼I+音碼II,或者音碼I+音碼III,或者音碼I+音碼IV。
如“音”的音碼為“yin”或者“yk”,“鍵”的音碼“jian”或者“jx”或者“js”。
(2)用構(gòu)成單字詞的漢字的音碼或者標準漢語拼音,順序擊鍵輸入單字詞。
如“音”的編碼為“yin”或者“yk”,“鍵”的音碼“jian”或者“jx”或者“js”,“幫”的編碼為“ba.”或者“b;”或者“bang”。
(3)用組成雙字詞的兩個漢字的音碼(長于6碼的取前6碼),順序擊鍵輸入雙字詞。
如“鍵盤”的編碼為“jianpa”,或者“jxpan”,或者“jspan”,或者“jianps”,或者“jxps”,或者“jsps”,等等。
(4)用首字的音碼I+后兩個漢字的音碼(長于6碼的取前6碼),順序擊鍵輸入三字詞。
如“計算機”的編碼為“jsuanj”,或者“jswji”。
(5)用前三個漢字的音碼I+最后一個漢字的音碼的前三碼,順序擊鍵輸入四字詞。如“計算機系”的編碼為 (6)用前四個漢字的音碼I+最后一個漢字音碼的前兩碼,順序擊鍵輸入五字詞。
如“計算機語言”的編碼為“jsjyya”,或者“jsjyys”。
為進一步提高大鍵盤上的漢字輸入速度,本方法可對大鍵盤改進方案1進一步作如下改進(以下稱本改進方案為大鍵盤改進方案2)(1)由2-4個漢字組成的詞如其編碼長度不足6碼,則在其編碼后加最后一個漢字的聲調(diào)碼。
如“編碼”當編碼為“bxma”時長度不足6碼,則可在“bxma”后加“碼”的聲調(diào)碼“3”,結(jié)果為“bxma3”。
(2)對于無字身的漢字,編碼為該漢字的音碼+部首碼的第一碼。對于有字身的漢字,編碼為該漢字的音碼+部首碼的第一碼+字身碼的第一碼。
如“巾”的編碼為“jinj”,或者“jkj”。
如“編”的編碼為“bianjb”,或者“bxjb”。
(3)單字詞還可用部首—字身音碼輸入方法(含規(guī)范碼和容錯碼)輸入,其中凡是部首碼和字身碼用到音碼的,音碼定義按照拼音混合輸入技術(shù)的音碼定義確定。
如“鍵”的編碼可為“jinjia”,或者 或者 等等,“能”的編碼為“siybb”。
上述大鍵盤改進方案1和大鍵盤改進方案2中的編碼也都具有簡碼形式任何一個詞的編碼可省去其除第一碼外的最后一碼,或最后兩碼,或最后三碼,或最后四碼,或最后五碼,構(gòu)成詞的簡碼。
具體實施例方式
實施方法一采用大鍵盤,不使用小鍵盤。
部首采用中國文字改革委員會、國家出版局1983年版《漢字統(tǒng)一部首表》(草案),共有部首201個。部首與部首碼的對應關(guān)系如下
編碼規(guī)則同小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3)的實施方法一。則“法”編碼為“fa”,或者“;uiqu”,或者“fa;q”;“方”編碼為“faη”,或“fang”,或者“wen35”,或者“faηw3”;“方法”編碼為“faηfa3”;“計算機”編碼為“jsuanj”;“不進則退”編碼為“bjztui”;“印度尼西亞”編碼為“ydnxya”;“中華人民共和國”編碼為“/hrmgg”,“aol公司”編碼為“aolgsi”,“α粒子”編碼為“alizi3”等。
當然,以上編碼具有簡碼形式。例如“法”的簡碼為“f”;“方法”的簡碼可為“faηf”;“計算機”的簡碼可為“jsuan”;“不進則退”的簡碼可為“bjzt”;“印度尼西亞”的簡碼可為“ydnxy”;“中華人民共和國”的簡碼可為“/hrm”,“aol公司”編碼為“aolgs”,“α粒子”編碼為“aliz”等。
實施方法二采用小鍵盤拼音混合輸入技術(shù)(中國專利申請03153755.3)實施方法二所定義的小鍵盤,不使用大鍵盤。部首與部首碼的定義以及編碼規(guī)則同本申請的實施方法一。
則“法”編碼為“32”(fa),或者“08478”(;uiqu),或者“3207”(fa;q);“方”編碼為“320”(faη),或“3264”(fang),或者“93635”(wen35),或者“32093”(faηw3);“方法”編碼為“320323”(faηfa3);“計算機”編碼為“578265”(jsuanj);“不進則退”編碼為“259884”(bjztui);“印度尼西亞”編碼為“936992”(ydnxya);“中華人民共和國”編碼為“147644”(/hrmgg),“aol公司”編碼為“26574”(aolgsi),“α粒子”編碼為“254943”(alizi3)等。
當然,以上編碼具有簡碼形式。例如“法”的簡碼為“3”(f);“方法”的簡碼可為“3203”(faηf);“計算機”的簡碼可為“578”(jsu);“不進則退”的簡碼可為“2598”(bjzt);“印度尼西亞”的簡碼可為“93699”(ydnxy);“中華人民共和國”的簡碼可為“1476”(/hrm),“aol公司”編碼為“26547”(aolgs),“α粒子”編碼為“2549”(aliz)等。
實施方法三采用大鍵盤和小鍵盤。大鍵盤的編碼規(guī)則采用大鍵盤改進方案1和大鍵盤改進方案2。小鍵盤的編碼規(guī)則同實施方法二。(以下括號內(nèi)的為大鍵盤上的編碼,括號外的為小鍵盤上的編碼)則“法”編碼為32(fa),或者08478(;uiqu、;bqu),或者3207(fa;q);“方”編碼為320(faη、f;),或3264(fang),或者93635(wen35、wd35),或者32093(faηw3、f;w3);“方法”編碼為320323(faηfa3、f;fa3);“計算機”編碼為578265(jsuanj、jswji);“不進則退”編碼為259884(biztui、bjztb4);“印度尼西亞”編碼為936992(ydnxya);“中華人民共和國”編碼為147644(/hrmgg),“aol公司”編碼為26574(aolgsi),“α粒子”編碼為254943(alizi3)等。
當然,以上編碼具有簡碼形式。例如“法”的簡碼為3(f);“方法”的簡碼可為3203(faηf、f;f);“計算機”的簡碼可為578(jsu、jsw);“不進則退”的簡碼可為2598(bjzt);“印度尼西亞”的簡碼可為93699(ydnxy);“中華人民共和國”的簡碼可為1476(/hrm),“aol公司”編碼為26547(aolgs),“α粒子”編碼為2549(aliz)等。
本發(fā)明與現(xiàn)有技術(shù)相比,具有以下顯著優(yōu)點1、以詞為單位輸入,任何詞碼長最多6碼,平均碼長短,重碼率低,輸入效率高;2、附和漢字和漢語的傳統(tǒng)知識,科學、系統(tǒng)、合理,學習的起點低,編碼自然流暢,易學易用;3、通用性強,可對所有漢字和各種非漢字信息編碼輸入,有助于普通話的推行與傳播,有助于漢語文化的傳播;4、該輸入法還有一個其他任何輸入法無法比擬的巨大優(yōu)勢,就是其在PC上與在手機等設(shè)備上具有相同的編碼規(guī)則和類似的輸入習慣,個人詞庫也完全可以實現(xiàn)共享,最大限度地減輕了用戶的學習負擔,大大方便了用戶。
權(quán)利要求
1.一種以詞為單位的漢字的通用計算機輸入方法,根據(jù)漢語拼音歸納出音碼及聲調(diào)碼,并將所有漢字拆解為部首+字身的形式,分別用音碼或者筆畫標記部首或者字身,構(gòu)成漢字的部首碼和字身碼,用漢字的音碼及聲調(diào)碼,以及漢字的部首碼和字身碼,以詞為單位按規(guī)則依次擊鍵輸入漢字,其特征在于1-1所述的漢語通用鍵盤包括在任何qwerty大鍵盤上,“v”鍵上同時標記逗號(“,”),“u”鍵上同時標記斜杠(“/”),“i”鍵上同時標記分號(“;”);“,”鍵上同時標記“ch”(或者 ),“.”鍵上同時標記“ng”(或者η),“/”鍵上同時標記“zh”(或者 ),“;”鍵上同時標記“sh”(或者 );1-2取拼音混合輸入技術(shù)定義的30個音碼,并將其按照拼音混合輸入技術(shù)的定義分布在大鍵盤“a”、“b”、“c”、“d”、“e”、“f”、“g”、“h”、“i”、“j”、“k”、“l(fā)”、“m”、“n”、“o”、“p”、“q”、“r”、“s”、“t”、“u”、“v”、“w”、“x”、“y”、“z”、“;”、“,”、“.”、“/”這30個鍵上,將橫“一”、豎“丨”、撇“丿”、點“丶”、折“乛”這五個筆畫分別定義在大鍵盤“1”、“2”、“3”、“4”、“5”這5個數(shù)字鍵上,將陰平1、陽平2、上聲3、去聲4、輕聲5這五個聲調(diào)碼分別定義在大鍵盤“1”、“2”、“3”、“4”、“5”這5個數(shù)字鍵上;1-3音碼定義同小鍵盤拼音混合輸入技術(shù);1-4詞的編碼同小鍵盤拼音混合輸入技術(shù);1-5標點符號的編碼所有中文標點符號按照其讀音所對應的音碼的第一碼編碼輸入;1-6英文詞的編碼對每個英文字母視為一個虛擬漢字,編碼為其本身,然后對該英文詞按照小鍵盤拼音混合輸入技術(shù)的編碼規(guī)則進行編碼;1-7阿拉伯數(shù)字的編碼對每一個阿拉伯數(shù)字視為一個虛擬漢字,編碼為其本身,數(shù)字長度為1-6的,編碼就是該數(shù)字本身;長度大于6的,每6個或少于6個數(shù)字為一組分組輸入;1-8混合詞的編碼對混合詞中除漢字外的英文、阿拉伯數(shù)字等各種信息每一個都視為一個虛擬漢字,編碼為其本身,然后對該混合詞按照小鍵盤拼音混合輸入技術(shù)的編碼規(guī)則進行編碼;1-9上述編碼使用編碼的原碼逐鍵鍵入。
2.如權(quán)利要求1所述的一種以詞為單位的漢字的通用計算機輸入方法,其特征在于單字詞還可按照下述方法輸入2-1取包含橫“一”、豎“丨”、撇“丿”、點“丶”、折“乛”這五個單筆部首的一個部首集合,對橫“一”、豎“丨”、撇“丿”、點“丶”、折“乛”這五個單筆部首按照橫1豎2撇3點4折5編碼,構(gòu)成其部首碼;對該部首集合中的其他部首每個部首確定一個唯一的讀音,將該讀音按照小鍵盤拼音混合輸入技術(shù)音碼的定義轉(zhuǎn)換為音碼,構(gòu)成該部首的部首碼;對任何一個漢字按照通用方法取部首,該部首對應的部首碼就是該漢字的部首碼;2-2如果一個漢字是所確定部首集合中的部首之一,或者是由一個部首的變體構(gòu)成的,則該漢字的編碼就是該部首對應的部首碼;2-3對于有字身的漢字,部首之外的部分構(gòu)成該漢字的字身;對部首取部首碼,對字身取字身碼;部首碼加字身碼就是該漢字的編碼,具體的取碼順序與部首和字身的相對位置相一致,但最長取6碼,即按規(guī)則取碼后略去第6碼以后的部分;2-4字身碼的具體取法如下2-4-1如果字身是由1個部分組成的,且該部分是一個部首或一個漢字,則取該部首的部首碼或該漢字的音碼,構(gòu)成該字身的字身碼;字身既是一個部首同時又是一個漢字的,按照是一個部首處理;2-4-2如果字身是由1個部分組成的,且該部分既不是一個部首,也不是一個漢字,則先確定該漢字部首碼的碼長,然后按順序逐筆對字身取筆畫,最多取6和該漢字的部首碼碼長之差個編碼;2-4-3如果字身為2個或者2個以上部分,則對每個部分分別取一碼構(gòu)成該漢字的字身碼構(gòu)成部首的部分取該部首所對應的部首碼的第一碼,構(gòu)成一個漢字的部分取該漢字音碼的第一碼,其他部分取該部分第一筆對應的部首碼;2-5對于上述2-4-3,如果一個漢字的字型是左右型,但其規(guī)范碼的部首不是位于其左邊或者右邊的全部部分,而左邊或者右邊的全部部分可以構(gòu)成一個漢字;或者一個漢字的字型是上下型,但其規(guī)范碼的部首不是位于其上邊或者下邊的全部部分,而上邊或者下邊的全部部分可以構(gòu)成一個漢字,則該漢字具有容錯碼2-5-1將上述可以構(gòu)成漢字的部分視為虛擬的部首,取其音碼構(gòu)成漢字的虛擬部首碼;2-5-2取漢字的虛擬部首外的部分視為虛擬字身,按照2-4的規(guī)則對虛擬字身進行編碼,定義編碼結(jié)果為虛擬字身碼;2-5-3按照2-3的規(guī)則組合漢字的虛擬部首碼和漢字的虛擬字身碼,構(gòu)成漢字的容錯碼。
3.如權(quán)利要求1、2所述的一種以詞為單位的漢字的通用計算機輸入方法,其特征在于單字詞還可以按照下述方法輸入對于無字身的漢字,編碼為該漢字的音碼+部首碼的第一碼;對于有字身的漢字,編碼為該漢字的音碼+部首碼的第一碼+字身碼的第一碼。
4.如權(quán)利要求1、2、3所述的一種以詞為單位的漢字的通用計算機輸入方法,其特征在于部首采用1983年版《漢字統(tǒng)一部首表》(草案),與部首碼的對應關(guān)系如下
。
5.如權(quán)利要求1、2、3、4所述的一種以詞為單位的漢字的通用計算機輸入方法,其特征在于任何一個詞的編碼可省去其除第一碼外的最后一碼、兩碼、三碼、四碼或五碼,構(gòu)成詞的簡碼。
6.如權(quán)利要求1、2、3、4、5所述的一種以詞為單位的漢字的通用計算機輸入方法,其特征在于使用小鍵盤輸入6-1在小鍵盤上使用類似手機的數(shù)字分布定義,即將原普通PC鍵盤上的小鍵盤定義的第一行789、第二行456、第三行123中的第一行和第三行對調(diào),也就是變?yōu)榈谝恍?23、第二行456、第三行789;將30個音碼按照小鍵盤拼音混合輸入技術(shù)鍵盤分布的定義分布在小鍵盤1、2、3、4、5、6、7、8、9、0這10個數(shù)字鍵上,將橫“一”、豎“丨”、撇“丿”、點“丶”、折“乛”這五個筆畫分別定義在小鍵盤“1”、“2”、“3”、“4”、“5”這5個數(shù)字鍵上,將陰平1、陽平2、上聲3、去聲4、輕聲5這五個聲調(diào)碼分別定義在小鍵盤“1”、“2”、“3”、“4”、“5”這5個數(shù)字鍵上;6-2將權(quán)利要求1-5所述的編碼全部根據(jù)上述小鍵盤的定義逐鍵轉(zhuǎn)換為數(shù)字編碼,然后在小鍵盤上逐鍵鍵入。
7.如權(quán)利要求1、2、3、4、5所述的一種以詞為單位的漢字的通用計算機輸入方法,其特征在于在大鍵盤上由1-5個漢字組成的詞的編碼規(guī)則如下7-1音碼定義按照拼音混合輸入技術(shù)確定;7-2用構(gòu)成單字詞的漢字的音碼或者標準漢語拼音,順序擊鍵輸入單字詞;7-3用組成雙字詞的兩個漢字的音碼(長于6碼的取前6碼),順序擊鍵輸入雙字詞;7-4用首字的音碼I+后兩個漢字的音碼(長于6碼的取前6碼),順序擊鍵輸入三字詞;7-5用前三個漢字的音碼I+最后一個漢字的音碼的前三碼,順序擊鍵輸入四字詞;7-6用前四個漢字的音碼I+最后一個漢字音碼的前兩碼,順序擊鍵輸入五字詞。
8.如權(quán)利要求7所述的一種以詞為單位的漢字的通用計算機輸入方法,其特征在于由2-4個漢字組成的詞如其編碼長度不足6碼,則在其編碼后加最后一個漢字的聲調(diào)碼。
9.如權(quán)利要求7、8所述的一種以詞為單位的漢字的通用計算機輸入方法,其特征在于單字詞還可采用下述方法輸入對于無字身的漢字,編碼為該漢字的音碼+部首碼的第一碼;對于有字身的漢字,編碼為該漢字的音碼+部首碼的第一碼+字身碼的第一碼。
10.如權(quán)利要求7、8、9所述的一種以詞為單位的漢字的通用計算機輸入方法,其特征在于單字詞還可用權(quán)利要求2所述的部首一字身方法輸入,其中凡是部首碼和字身碼用到音碼的,音碼定義按照拼音混合輸入技術(shù)的音碼定義確定。
全文摘要
本發(fā)明屬于中文信息處理在漢字及相關(guān)信息處理領(lǐng)域方面的應用,是在ZL 95102608.9和專利申請03153755.3基礎(chǔ)上再創(chuàng)造所產(chǎn)生的發(fā)明。針對目前不同設(shè)備輸入法不同、不認識漢字無法直接用音碼輸入及單字詞輸入效率低的問題,根據(jù)漢語拼音歸納出音碼及聲調(diào)碼,并將所有漢字拆解為部首+字身形式,分別用音碼或筆畫標記部首或字身,構(gòu)成漢字的部首碼和字身碼,用漢字的音碼及聲調(diào)碼,以及漢字的部首碼和字身碼,以詞為單位按規(guī)則依次擊鍵輸入漢字。本發(fā)明碼長短,重碼率低,輸入效率高;科學、系統(tǒng)、合理,學習起點低,易學易用,編碼自然流暢;通用性強,可編碼所有漢字和非漢字信息;在各種設(shè)備上編碼規(guī)則相同、輸入習慣類似、個人詞庫共享,可有效減輕用戶的學習負擔。
文檔編號G06F3/023GK1542594SQ20031011342
公開日2004年11月3日 申請日期2003年11月10日 優(yōu)先權(quán)日2003年11月10日
發(fā)明者劉向東 申請人:劉向東