專利名稱:中文詞組輸入法的制作方法
發(fā)明拼音縮寫ZWCZ本發(fā)明是一種計(jì)算機(jī)漢字輸入方案,隸屬于計(jì)算機(jī)文字應(yīng)用范疇,主要作用于各種計(jì)算機(jī)中文操作系統(tǒng)。
目前,作用于我國(guó)計(jì)算機(jī)中文操作平臺(tái)的鍵盤漢字輸入法,絕大部分是四碼或四碼以上編制,它們?cè)诓煌潭壬洗嬖谥幋a臃腫、字詞相互重碼屏蔽,需判別碼、操作繁瑣等弊端,給人們的學(xué)習(xí)、應(yīng)用帶來(lái)了一定的困難;而僅有的幾個(gè)三碼編制的鍵盤輸入法,又存在著單字重碼多、詞組少、不能兼容承接目前流行的五筆字型輸入法等缺陷。本發(fā)明的目的,在于克服上述弊端,開(kāi)發(fā)出比目前各種輸入法效率更高、更科學(xué)規(guī)范、易學(xué)實(shí)用、且兼容承接五筆字型輸入法的中文詞組輸入方案,讓計(jì)算機(jī)親近人們,讓人們走近計(jì)算機(jī),促進(jìn)我國(guó)計(jì)算機(jī)事業(yè)的普及和發(fā)展。
本發(fā)明是一種以詞組輸入為主導(dǎo),以單字輸入為基礎(chǔ)的漢字鍵盤輸入系統(tǒng),它綜合運(yùn)用三維定位檢索技術(shù)、碼長(zhǎng)分區(qū)技術(shù)和通用的高頻先見(jiàn)技術(shù),由特定的鍵盤字根設(shè)置方案、字詞編碼方案、詞庫(kù)設(shè)置方案、操作輸入方案和兼容承接方案所組成,具有編碼短、學(xué)習(xí)容易、操作簡(jiǎn)便、輸入快捷、定位準(zhǔn)確等特點(diǎn)。
一,技術(shù)要點(diǎn)1,三維定位檢索技術(shù)。
本發(fā)明的三維定位檢索技術(shù)是獨(dú)創(chuàng)技術(shù),主要作用是通過(guò)三個(gè)不同方向、僅用三個(gè)碼元對(duì)所需單字進(jìn)行立體定位檢索,具有檢索快捷、定位準(zhǔn)確、簡(jiǎn)約科學(xué)的特點(diǎn)。
三維定位檢索技術(shù)的每一維檢索方向,可以從各種不同的角度進(jìn)行,如音碼輸入法中的聲母、韻母、聲調(diào),形碼輸入法中的字首、字腹、字尾等。檢索方向角度不同,其檢索目標(biāo)就不同;檢索方向角度差距越大,其檢索結(jié)果越準(zhǔn)確。
三維定位檢索技術(shù)的每一維檢索方向,可以劃分成不同的段級(jí);劃分的段級(jí)越細(xì),其檢索結(jié)果就越精確,所得的重碼率就越低。
三維定位檢索技術(shù)的另一個(gè)顯著特點(diǎn),就是三鍵定位,即只需三次擊鍵就可以所需的單字檢索出來(lái)。凡是采用三維定位檢索技術(shù)的輸入法,其單字最大碼長(zhǎng)為3,國(guó)標(biāo)一二級(jí)字庫(kù)的6763個(gè)漢字均可用三鍵檢索得出。
就計(jì)算機(jī)鍵盤而論,從A到Z這二十六個(gè)可編碼的鍵位中,單鍵無(wú)重碼編碼空間為26個(gè),二鍵無(wú)重碼編碼空間為676個(gè),三鍵無(wú)重碼編碼空間為17576個(gè),四鍵無(wú)重碼編碼空間為456976個(gè)。顯然,在以6763個(gè)漢字的國(guó)標(biāo)GB-2312字庫(kù)為編碼對(duì)象(或以15000個(gè)漢字的GBK大字符集為編碼對(duì)象)的輸入法中,用單鍵或二鍵進(jìn)行編碼的做法是不現(xiàn)實(shí)的,而用四鍵或四鍵以上進(jìn)行編碼,又顯得過(guò)于臃腫。只有三鍵編碼,才是最恰當(dāng)?shù)淖龇?。可以說(shuō)以三鍵編碼的三維定位檢索技術(shù),是鍵盤漢字輸入法中最科學(xué)、最簡(jiǎn)約的單字檢索技術(shù)。
通過(guò)無(wú)數(shù)次實(shí)踐和篩選,本發(fā)明確定了自己的三維定位檢索方向,即是漢字字形的第一個(gè)部首、漢字字形的最后一個(gè)部首和漢字拼音的第一個(gè)字母,簡(jiǎn)稱字首、字尾、音首。每一檢索方向又根據(jù)計(jì)算機(jī)鍵盤可編碼鍵位分為26個(gè)段級(jí)。一維檢索的26個(gè)編碼空間全部分配給一級(jí)簡(jiǎn)碼使用,二維檢索的676個(gè)編碼空間分配給二級(jí)簡(jiǎn)碼使用,三維檢索的17576個(gè)編碼空間分配給單字完全編碼使用,國(guó)標(biāo)一二級(jí)字庫(kù)6763個(gè)漢字(或GBK字庫(kù)15000個(gè)漢字)均可用三鍵擊出,且重碼率極低。
2,碼長(zhǎng)分區(qū)技術(shù)應(yīng)用于本發(fā)明的碼長(zhǎng)分區(qū)技術(shù),同樣是獨(dú)創(chuàng)技術(shù),其特點(diǎn)是將單字與詞組分配在不同碼元長(zhǎng)度的編碼區(qū)域,從根本上避免字詞之間相互重碼,或相互屏蔽的弊端。
就本發(fā)明而論,其特征是①,三碼一字,四碼一詞單字編碼全部設(shè)置在3個(gè)及3個(gè)以下的碼元區(qū)域內(nèi),詞組編碼全部設(shè)置在4個(gè)碼元的區(qū)域內(nèi)。
②,3鍵及3鍵以內(nèi)的編碼區(qū)域全部分配給單字使用,4鍵編碼區(qū)域全部分配給詞組使用。
③,字詞編碼區(qū)域既相對(duì)獨(dú)立,又互為補(bǔ)充,字詞之間輸入無(wú)需按鍵切換。
3,高頻先見(jiàn)技術(shù)。
高頻先見(jiàn),即就是在漢字編碼排列中,將常用的單字或詞組放在最前面,由此保證常用字和常用詞可以不加選擇地?fù)舫觥?br>
高頻先見(jiàn)技術(shù)有動(dòng)態(tài)調(diào)頻和靜態(tài)調(diào)頻兩種方式。本發(fā)明采用的是靜態(tài)調(diào)頻方式。
二,鍵盤方案1,鍵盤字根方案鍵盤字根方案,是指輸入法字根與計(jì)算機(jī)鍵盤鍵位的對(duì)應(yīng)方案。
字根是構(gòu)成漢字形狀的最基本單位,每個(gè)漢字都可以看成由不同的字根所組成。本發(fā)明以漢字的規(guī)范偏旁部首為基準(zhǔn),兼容五筆字型輸入法,設(shè)置字根200個(gè),并根據(jù)筆劃起勢(shì)特征將這些字根分為“橫、豎、撇、捺、折”五個(gè)基本區(qū)和一個(gè)特例區(qū),以對(duì)應(yīng)計(jì)算機(jī)鍵盤的具體鍵位。
“橫”劃起筆的字根分別對(duì)應(yīng)計(jì)算機(jī)鍵盤的“G、F、D、S、A”鍵位,區(qū)位號(hào)相應(yīng)為“11、12、13、14、15”;“豎”劃起筆的字根分別對(duì)應(yīng)計(jì)算機(jī)鍵盤的“H、J、K、L、M”鍵位,區(qū)位號(hào)相應(yīng)為“21、22、23、24、25”;“撇”劃起筆的字根分別對(duì)應(yīng)計(jì)算機(jī)鍵盤的“T、R、E、W、Q”鍵位,區(qū)位號(hào)相應(yīng)為“31、32、33、34、35”;“捺”劃起筆的字根分別對(duì)應(yīng)計(jì)算機(jī)鍵盤的“Y、U、I、O、P”鍵位,區(qū)位號(hào)相應(yīng)為“41、42、43、44、45”;“折”劃起筆的字根分別對(duì)應(yīng)計(jì)算機(jī)鍵盤的“N、B、V、C、X”鍵位,區(qū)位號(hào)相應(yīng)為“51、52、53、54、55”;“扌”“寸”“才”“車”“力”“皮”“兒”這七個(gè)字根對(duì)應(yīng)計(jì)算機(jī)鍵盤的“Z”鍵位,區(qū)位號(hào)為“60”。
具體鍵位字根方案見(jiàn)附
圖1。
查詢通配鍵為“*”鍵,任何編碼均可通過(guò)該鍵進(jìn)行查詢或通配。
2,字詞編碼方案本發(fā)明一種是以字形為主、音形結(jié)合的漢字輸入法,根據(jù)三維定位檢索、碼長(zhǎng)分區(qū)、高頻先見(jiàn)的原則而確定字詞編碼方案。
編碼碼元ABCDEFGHIJKLMNOPQRSTUVWXYZ選擇碼元1234567890通配查詢碼*單字最大碼長(zhǎng)3詞組碼長(zhǎng)4編碼標(biāo)識(shí)<
編碼表達(dá)式[字詞標(biāo)識(shí)]={[排序標(biāo)識(shí)][單字序號(hào)][音形標(biāo)識(shí)][碼元序號(hào)]+……[排序標(biāo)識(shí)][單字序號(hào)][音形標(biāo)識(shí)][碼元序號(hào)]}編碼規(guī)則本發(fā)明編碼規(guī)則分為單字編碼與詞組編碼兩部份,共8條規(guī)則①,單字編碼本發(fā)明單字編碼方案分為鍵名字、一級(jí)簡(jiǎn)碼、二級(jí)簡(jiǎn)碼、成字字根、全碼5條規(guī)則(1),鍵名字。在本發(fā)明中,計(jì)算機(jī)鍵盤的每一個(gè)鍵位都可由一個(gè)漢字所代表,這一代表鍵位的漢字就是“鍵名字”。本發(fā)明的鍵名字兼容五筆字型輸入法,編碼規(guī)則是鍵名字=所在鍵位+所在鍵位+所在鍵位即在鍵名字的所在鍵位上連擊三下。
表達(dá)式為j=0000+0000+0000本發(fā)明的鍵名字有26個(gè)王ggg 土fff 大ddd 木sss 工aaa目hhh 日jjj 口kkk 田lll 山mmm禾ttt 白rrr 月eee 人www 金qqq言yyy 立uuu 水iii 火ooo 之PPP已nnn 子bbb 女vvv 又ccc 纟xxx力zzz(2),一級(jí)簡(jiǎn)碼。僅有一個(gè)碼元的編碼稱之為一級(jí)簡(jiǎn)碼,本發(fā)明一級(jí)簡(jiǎn)碼兼容五筆字型輸入法,編碼規(guī)則是一級(jí)簡(jiǎn)碼=字首或一級(jí)簡(jiǎn)碼=次字首即取單字內(nèi)部形碼正序的第一個(gè)字根或第二個(gè)字根。
表達(dá)式為y=p0s1或y=p0s2本發(fā)明一級(jí)簡(jiǎn)碼有26個(gè)一g 地f 在d 要s 工a上h 是b 中k 國(guó)l 同m和t 的r 有e 人w 我q
主y 產(chǎn)u 不i 為o 這p民n 了b 發(fā)v 以c 經(jīng)x打z(3),二級(jí)簡(jiǎn)碼。由二個(gè)碼元組成的編碼稱之為二級(jí)簡(jiǎn)碼,編碼規(guī)則是二級(jí)簡(jiǎn)碼=字首+字尾即取其單字內(nèi)部形碼的正序第一個(gè)字根和逆序第一個(gè)字根。表達(dá)式為e=pos1+nos1本發(fā)明設(shè)置二級(jí)簡(jiǎn)碼665個(gè),具體見(jiàn)附圖2附圖2中,單字編碼為該字所在行碼元加該字所在列碼元。
本發(fā)明是設(shè)置二級(jí)簡(jiǎn)碼數(shù)量最多的漢字鍵盤輸入法之一?!阪I盤輸入法中,能夠設(shè)置的二級(jí)簡(jiǎn)碼越多,則意味其字根設(shè)置越均勻,其操作效率越高。
(4),成字字根。在本發(fā)明所設(shè)置的200個(gè)字根中,除了26個(gè)鍵名字之外,還有103個(gè)字根能夠獨(dú)立成為漢字。這些能夠獨(dú)立成為一個(gè)漢字的字根,就是所謂的“成字字根”。其編碼規(guī)則是成字字根=所在鍵位+首筆+末筆即先擊這個(gè)成字字根所在的鍵位,然后再擊這個(gè)字根的第一筆劃和最后筆劃的鍵位。
表達(dá)式為c=0000+poa1+nos1本發(fā)明成字字根一共95個(gè)一ggg 王ggg 五ggg 戔ggt 歹ggy 二fgg 十fgh 干fgh 士fgg雨fgy 古dgg 石dgg 三dgg 廠dgt 犬dgy 耒dgy 丁sgh 西sgg酉sgg 可sgh 廿agg 七agn 弋a(chǎn)gy 戈agt 革agh 上hhg 止hhg_hhn 卜hhy 曰jhg 蟲(chóng)jhy 早jhh 川kth 甲lhh 四lhg 皿lhg骨mhg 由mhg 貝mhy 巾mhh 舟tyy 身ttt 竹tth 手rth 斤rth氣rtn 用eth 乃etn 豸ett 豕egy 八wty 兒qtn 魚(yú)qtg 夕qty廣yyt 戶yyt 方y(tǒng)yn 文yyy 六uyy 門uyn 辛uyh 羊uyh 小ihy米o(hù)yy 業(yè)oyg 乙nnn 己nnn 巳nnn 尸nnt 心nyy 羽nng 了bnh也bnn 耳bgg 孔bng 彐vng 臼vtg 九vtn 刀vnt 巴cnn 馬cng
幺xny 母xny 毋xnt 匕xtn 弓xnn 寸xgy 皮xny 車xgh 幾xtn才zgt 幾ztn 車zgh 寸zgy 皮nhy其實(shí),上述不少成字字根是二級(jí)簡(jiǎn)碼,只要鍵入首、次兩碼就已足夠。
漢字偏旁部首的編碼規(guī)則與成字字根相同。在這個(gè)意義上來(lái)說(shuō),漢字偏旁部首也是成字字根。除上述成字字根之外,可由鍵盤擊出的偏旁部首還有40個(gè)匚agn 艸agh 廾agh 卩bnh 阝bnh 凵bnh 丨h(huán)hl 口lhg 彡ett一ggl 丿ttl 丶yyl 亻wth 氵iyg 刂jhh 門mhn 忄nyy 灬oyy冖pyn 宀pyn 礻P(guān)yy 衤Pyy 辶Pyy 廴pny 勹qtn 钅qtn 饣qtn犭qtt 扌xgg 彳tth 丿ttt 夊tty 攵tty 冫uyg 疒uyg 丬uyh巛vnn 亠yyg 讠yyn ムcny(5),全碼。全碼是指由三個(gè)碼元編制的單字完全編碼。在本發(fā)明中,每一個(gè)漢字都有其完金編碼,編碼規(guī)則是單字完全編碼=字首+字尾+音首即取單字內(nèi)部形碼的正序第一個(gè)字根、逆序第一個(gè)字根和音碼的正序第一個(gè)碼元。
表達(dá)式為q=p0s1+n0s1+p0i1完全編碼是三維定位檢索技術(shù)在本發(fā)明中的應(yīng)用代表作,字首、字尾碼元對(duì)應(yīng)字根所在鍵位,音首碼元對(duì)應(yīng)計(jì)算機(jī)鍵盤的英文鍵位。(“ü”拼音字母對(duì)應(yīng)“V”鍵位。)在一定意義上,鍵名字和成字字根是完全編碼的兩個(gè)特例。
②,詞組編碼根據(jù)碼長(zhǎng)分區(qū)的原則,本發(fā)明的詞組編碼全部分配在四個(gè)碼元的范圍內(nèi),它分為二字詞、三字詞、四字及四字以上詞3條規(guī)則。
(1),二字詞。
二字詞編碼規(guī)則為二字詞=首字字首+首字字尾+次字字首+次字字尾。
即二字詞依次取各字的首碼和次碼。
表達(dá)式為
ce2=p101+p102+p201+p202(2),三字詞。三字詞編碼規(guī)則為三字詞=首字字首+次字字首+末字字首+末字字尾即三字詞依次取各字的首碼,再加末字的次碼。表達(dá)式為“ce3=p101+p201+p301+p302(3),四字及四字以上詞。四字及四字以上詞編碼規(guī)則為四字及四字以上詞=首字首字+次字字首+第三字字首+末字字首即四字及四字以上詞依次取首、次、三、末字的首碼。表達(dá)式為ca4=p101+p201+p301+n1013,詞庫(kù)設(shè)置方案詞庫(kù)是本發(fā)明的有機(jī)組成部分,它的設(shè)立有三個(gè)特殊意義①,提高連續(xù)文本的輸入效率;②,免除單字重碼的制約;③,減少文字輸入的錯(cuò)誤。
本發(fā)明的詞庫(kù)設(shè)置具備下列特性①,豐富性。本發(fā)明的詞庫(kù)設(shè)置以現(xiàn)代漢語(yǔ)詞典為藍(lán)本,兼收并蓄其它口語(yǔ)、俚語(yǔ)、常用語(yǔ),詞庫(kù)總條目68000條,其中二字詞43000條,三字詞10000條,四字及四字以上詞15000條。
②,實(shí)用性。詞組收錄注重實(shí)用性,除收錄現(xiàn)代漢語(yǔ)詞典所載正式詞組外,同時(shí)收錄各種由名詞、動(dòng)詞、付詞、介詞組成的非正式詞組,保障一般文稿的詞組覆蓋率高達(dá)95%以上。
③,新穎性。本發(fā)明貼近實(shí)際,貼近時(shí)代,詞庫(kù)的設(shè)置收錄現(xiàn)有時(shí)代用語(yǔ)和流行用語(yǔ),使詞庫(kù)設(shè)置能夠適應(yīng)現(xiàn)代社會(huì)的實(shí)際操作需要。
4,輸入操作方案①,單字輸入。
(1),鍵名字,連續(xù)按擊三次相應(yīng)鍵位,再按一下空格鍵;(2),一級(jí)簡(jiǎn)碼按擊相應(yīng)鍵位一下,再按一下空格鍵;(3),二級(jí)簡(jiǎn)碼依次按擊首、次字根相應(yīng)鍵位,再按一下空格鍵;(4),全碼依次按擊首、次、末碼元相應(yīng)鍵位,再按一下空格鍵。
(5),成字字根按照編碼依次按擊相應(yīng)碼元鍵位,再按一下空格鍵。
其中,一級(jí)簡(jiǎn)碼、二級(jí)簡(jiǎn)碼沒(méi)有重碼。其它編碼輸入如出現(xiàn)重碼,按空格鍵則首字自動(dòng)定位到屏幕光標(biāo)位置;如需輸入其它單字則按數(shù)字鍵進(jìn)行選擇。
②,詞組輸入。
(1),依次按擊詞組碼元相應(yīng)鍵位,四碼一詞。
(2),詞組輸入如出現(xiàn)重碼,按空格鍵則首位詞組自動(dòng)定位到屏幕光標(biāo)位置;如需輸入其它詞組則按數(shù)字鍵進(jìn)行選擇。
③,全文輸入(1),詞組輸入為主,單字輸入為輔。
(2),詞組輸入應(yīng)盡可能以二字詞和四字詞為主。在實(shí)際操作中,二字詞和四字詞的使用頻率最高,本發(fā)明對(duì)二字詞和四字詞的覆蓋率,也高達(dá)95%以上。
(3),作為輔助補(bǔ)充部分的單字輸入,應(yīng)盡可能以一級(jí)簡(jiǎn)碼、二級(jí)簡(jiǎn)碼輸入為主。因?yàn)檫@二種編碼漢字使用頻率最高,同時(shí)它們均無(wú)重碼,有利于提高文字輸入速度。
5,兼容承接方案目前,86版的五筆字型輸入法是我國(guó)應(yīng)用范圍最廣、實(shí)用性最強(qiáng)的鍵盤輸入法,70%以上的計(jì)算機(jī)裝有五筆字型輸入法, 50%以上的計(jì)算機(jī)操作者在使用五筆字型輸入法。目前市面許多輸入法都因無(wú)法兼容、承接五筆字型輸入法而導(dǎo)致其使用的局限性。本發(fā)明作為一種全新的輸入法,在全面堅(jiān)持漢字規(guī)范的基礎(chǔ)上,盡可能地對(duì)五筆字型輸入法進(jìn)行兼容承接,并為此作出大量的工作,力求使五筆字型使用者在只需稍微學(xué)習(xí)的前提下就能迅速掌握本發(fā)明。
五筆字型輸入法是一種四碼編制、純形碼的輸入法,而本發(fā)明是一種三碼編制、音形結(jié)合的輸入法,但仔細(xì)分析本發(fā)明的編碼方案可以發(fā)現(xiàn),本發(fā)明所謂的“音形結(jié)合”,主要是指單字完全編碼中“字首+字尾+音首”規(guī)則,如果使用詞組輸入避開(kāi)“音首”部分,或以“*”通配鍵代替“音首”,則本發(fā)明變成了純形碼的輸入法。這就為本發(fā)明兼容、承接五筆字型輸入法奠下了堅(jiān)實(shí)的基礎(chǔ)。
本發(fā)明對(duì)五筆字型輸入法的兼容,首先在鍵盤字根方案上進(jìn)行兼容。本發(fā)明人在對(duì)五筆字型的鍵盤字根方案進(jìn)行了大量的去蕪存菁、去粗存精的工作,具體如下①,汲取五筆字型鍵位分區(qū)的做法,以更為直觀、形象、規(guī)范的200個(gè)字根全面兼容五筆字型的130個(gè)字根;②,增設(shè)“Z”字碼元鍵位,編碼碼元由二十五個(gè)增加二十六個(gè);③,移動(dòng)字根將“扌”“寸”“才”“車”“幾”“力”七個(gè)字根分別由原“R”“F”“L”“M”“L”鍵位移到“Z”鍵位;④,改變通配查詢鍵鍵位通配查詢鍵由“Z”鍵位改為“*”鍵位;⑤,增設(shè)“身”“舟”“業(yè)”“皮”“犭”“豸”“骨”“皮”“戶”“_”“革”“魚(yú)”“羊”“礻”“衤”“歹”“酉”“耒”“氣”“?!薄敖怼薄拔恪薄澳浮薄捌ぁ薄皻狻薄白摺薄翱伞薄安拧倍藗€(gè)成字字根,既使用戶更加直觀簡(jiǎn)便,同時(shí)又兼容五筆字型輸入法在組成上述字根時(shí)所需的兩個(gè)字根。
由于上述五項(xiàng)改變,本發(fā)明在兼容、承接五筆字型輸入法方面已經(jīng)變得非常簡(jiǎn)單。五筆字型使用者只要稍微學(xué)習(xí)就可以熟練掌握本發(fā)明,主要是注意下面三點(diǎn)(1),注意“字首+字尾+音首”的三維編碼規(guī)則鍵名字是原來(lái)的鍵名字,一級(jí)簡(jiǎn)碼是原來(lái)的一級(jí)簡(jiǎn)碼,二級(jí)簡(jiǎn)碼是“第一個(gè)序根+最后字根”,完全編碼是“第一個(gè)字根+最后字根+拼音的第一個(gè)字母”,成字字根是“所在鍵位+首筆+末筆”。
(2)在遇到“身”“舟”“業(yè)”“皮”“犭”“豸”“骨”“皮”“戶”“_”“革”“魚(yú)”“羊”“礻”“衤”“歹”“酉”“耒”“氣”“?!薄敖怼薄拔恪薄澳浮薄捌ぁ薄皻狻薄白摺薄安拧薄翱伞边@二十八個(gè)部首時(shí),再也不必將它們柝為兩個(gè)字根,而只需按擊原來(lái)的第一個(gè)字根鍵位則可。
(3),注意鍵位移動(dòng)情況通配鍵由“Z”鍵位移到“*”鍵位;“皮”“幾”“寸”“才”“車”“扌”“力”部首分別由原來(lái)的“H”“M”“F”“L”“R”“L”鍵位移到現(xiàn)在的“Z”鍵位。
本發(fā)明兼容五筆字型輸入法,但不等于五筆字型輸入法。它與五筆字型輸入法相比,存在著許多明顯的區(qū)別(1),字根數(shù)量五筆字型輸入法130個(gè),本發(fā)明200個(gè);(2),二級(jí)簡(jiǎn)碼數(shù)量五筆字型輸入法588個(gè),本發(fā)明665個(gè);
(3),單字最大碼長(zhǎng),五筆字型輸入法4碼,本發(fā)明3碼;(4),是否需要判別碼五筆字型輸入法需要本發(fā)明不需要;(5),是否需要背誦字根口訣五筆字型輸入法需要,本發(fā)明不鼓勵(lì);(6),單字重碼率五筆字型輸入法少,本發(fā)明較少;(7),詞組重碼率五筆字型輸入法較少,本發(fā)明最少;(8),字詞之間是否屏蔽五筆字型輸入法部分屏蔽,本發(fā)明不屏蔽(9),字詞之間是否重碼五筆字型輸入法部分重碼,本發(fā)明不重碼;(10),詞庫(kù)條目設(shè)置五筆字型輸入法少,本發(fā)明6.8萬(wàn)條(11),是否易于學(xué)習(xí)五筆字型輸入法較難,本發(fā)明較易;(12),是否易于使用五筆字型輸入法好用,本發(fā)明更好用;(13),熟練輸入法速度五筆字型輸入法每分鐘120-150字,本發(fā)明每分鐘150-180字。
可以說(shuō)本發(fā)明與五筆字型輸入法(包括1998年5月推出的98王碼)相比,除了單字重碼率指標(biāo)略為不及之外,其它指標(biāo)均全面勝出,并且更易更快更強(qiáng),提高效率達(dá)25%左右。
本發(fā)明不但全面兼容承接五筆字型輸入法,同時(shí)也全面兼容承接本人于98年5月開(kāi)發(fā)完成的漢字詞組輸入法。它們?cè)谧指O(shè)置、鍵名字、一級(jí)簡(jiǎn)碼、四字詞編碼方面完全兼容,在二級(jí)簡(jiǎn)碼、全碼、二字詞、三字詞、通配查詢鍵、編碼規(guī)則等方面存在差異。漢字詞組輸入法使用者同樣只需稍微學(xué)習(xí),也可以立即掌握本發(fā)明,且重碼更少,效率更高。
四,獨(dú)特的優(yōu)勢(shì)本發(fā)明是一項(xiàng)獨(dú)創(chuàng)的輸入法,也是一項(xiàng)博采眾長(zhǎng)的技術(shù)方案,它集中眾多漢字輸入法的長(zhǎng)處,形成自己獨(dú)特的風(fēng)格和優(yōu)勢(shì),具有編碼短,學(xué)習(xí)容易、操作簡(jiǎn)便、輸入快捷等特點(diǎn)。
①,編碼短本發(fā)明采取三維定位檢索技術(shù),國(guó)標(biāo)一二級(jí)字庫(kù)每一漢字均可用三鍵就可擊出,如上其一、二級(jí)簡(jiǎn)碼和龐大的詞庫(kù),使連續(xù)文本輸入擊鍵次數(shù)達(dá)到最少程度,平均碼長(zhǎng)僅2.1,是我國(guó)目前編碼最短,按鍵次數(shù)最少、輸入速度最快的鍵盤輸入法。
②,通用性強(qiáng)本發(fā)明中單字輸入采用三碼編制技術(shù),內(nèi)核精巧,占用內(nèi)存小,運(yùn)行速度快,輕松運(yùn)行于2M內(nèi)存、80286以上PC機(jī)型。在32M以上內(nèi)存的多能奔騰、奔騰二代高檔機(jī)型上,更能充分發(fā)揮其32位數(shù)據(jù)傳輸技術(shù)的強(qiáng)勁威力,使本發(fā)明浩瀚詞組得到淋漓盡致的發(fā)揮,如虎添翼。
本發(fā)明與現(xiàn)有中文操作平臺(tái)融為一體,支持中文操作平臺(tái)的各種優(yōu)良特性和所有應(yīng)用軟件,幾乎沒(méi)有任何軟件在加載本發(fā)明的情況下不能運(yùn)行。
③,學(xué)習(xí)容易、操作簡(jiǎn)便(1),本發(fā)明三碼一字,編碼短。易為人們所掌握;(2),本發(fā)明字根以漢字規(guī)范偏旁部首為基準(zhǔn),形象直觀,符合漢字內(nèi)部的拆分規(guī)則;(3),本發(fā)明鍵盤字根方案分布規(guī)范,點(diǎn)、橫、豎、撇、捺、折彎鉤俱有相應(yīng)的鍵位區(qū)域,設(shè)置均勻、合理、規(guī)律性強(qiáng);(4),本發(fā)明兼容五筆字型的鍵盤方案,凡會(huì)使用五筆字型輸入法的人只需稍微學(xué)習(xí),就能輕松掌握本發(fā)明;(5),本發(fā)明完全摒棄判別碼,大幅度減輕人們的學(xué)習(xí)負(fù)擔(dān)。
④,輸入快鍵本發(fā)明以詞組輸入為主、單字輸入為輔,通篇文稿幾乎可以完全使用詞組實(shí)現(xiàn)快速輸入。它以下列條件作為支持(1),詞組豐富。本發(fā)明以現(xiàn)代漢語(yǔ)詞典為藍(lán)本,兼收并蓄其它口語(yǔ)、俚語(yǔ)、楹聯(lián)、常用語(yǔ)。除了正式詞組之外,同時(shí)收錄實(shí)際操作所需的各式非正式詞組,詞組設(shè)置六萬(wàn)八千條。適應(yīng)實(shí)際操作需要。
(2),碼長(zhǎng)分區(qū)。本發(fā)明三碼一字,四碼一詞,從根本上免除字詞輸出相互屏蔽或互相重碼的矛盾,詞組輸入完全不受單字輸入的牽制,通篇文稿幾乎可以實(shí)現(xiàn)純?cè)~組輸入,詞組覆蓋率高達(dá)95%以上。
(3),低重碼。目前市面上形碼輸入法的詞組取碼是采用“字首+次字首”模式,這樣使字首相同的漢字,在組詞時(shí)因碼元重復(fù)而以致造成詞組重碼較多的現(xiàn)象,如五筆字型輸入法中的“qtqt”碼元,就有“狡猾”“猙獰”“狠狠”“猖狂”“猖獗”“逛逛”“狐貍”“狼狽”“狼狗”“狩獵”“獼猴”“急先鋒”十二個(gè)重碼,而“qgqg”碼元,也有“鱷魚(yú)”“鯉魚(yú)”“鯧魚(yú)””等無(wú)數(shù)個(gè)魚(yú)類詞組重碼;作為開(kāi)創(chuàng)電腦輸入法三維定位檢索技術(shù)新紀(jì)元的本發(fā)明,詞組取碼是“字首+字尾”形式,從根本上均勻分布了詞組編碼,使詞組重碼大幅度降低,如“狡猾”的碼元是“qqqe”,“猙獰”的碼元是“qhqs”,“狐貍”的碼元是“qrqf”……;“鱷魚(yú)”的碼元是“qnqg”,“鯉魚(yú)”的碼元是“qfqg”,“鯧魚(yú)”的碼元是“qjqg”,重碼極低。
(4),定位準(zhǔn)確。本發(fā)明一方面不象有些智能輸入法或語(yǔ)音輸入法那樣在整句輸入后得重新返回修改,而是將所需字詞直接定位到屏幕光標(biāo)位置上,使用起來(lái)令人油然而起“飛流直下三千尺,疑是銀河落九天”的痛快淋漓之感。
本發(fā)明最大的優(yōu)勢(shì)就是快捷、準(zhǔn)確的詞組輸入。
⑤,廣闊的市場(chǎng)前景目前,各種語(yǔ)音輸入法、手寫輸入法、掃瞄輸入法風(fēng)起云涌,層出不窮。與這些新崛起的非鍵盤輸入法相比,本發(fā)明除了在輸入速度、舒適程度兩項(xiàng)指標(biāo)略為不及之外,其它硬件適應(yīng)性、軟件適應(yīng)性、所需硬件條件、所需軟件條件、所需環(huán)境要求、通用性、輸入正確率等指標(biāo)卻毫不遜色,綜合指標(biāo)甚至是略勝一等,可以毫不夸張地說(shuō),本發(fā)明不但在功能、操作、實(shí)用程度方面全面勝出目前的各種鍵盤輸入法,而且具有其它非鍵盤輸入法所不能比擬的實(shí)用性、先進(jìn)性,它完全不失為我國(guó)最具有實(shí)用價(jià)值的鍵盤輸入法之一,可能是最好的中文輸入法!據(jù)有關(guān)部門統(tǒng)計(jì)目前我國(guó)的現(xiàn)有微機(jī)數(shù)量在2000萬(wàn)到2500萬(wàn)臺(tái)之間,每年以25-50%的速度增長(zhǎng)(1996年、1997年我國(guó)微機(jī)增長(zhǎng)率均超過(guò)50%),預(yù)計(jì)到2000年,我國(guó)微機(jī)擁有數(shù)量可達(dá)3000萬(wàn)臺(tái)。作為綜合性能極具前茅的本發(fā)明,完全有能力在林林總總的輸入法中贏得自己的一席之地,并使新用戶自愿加入到使用本發(fā)明的行列中來(lái)。
另外,有電腦就有鍵盤,無(wú)鍵盤則不成為電腦。至少在未來(lái)的十年內(nèi),鍵盤還是計(jì)算機(jī)的基本設(shè)備之一;鍵盤輸入法(包括本發(fā)明)仍將是計(jì)算機(jī)文字輸入的主要方法??梢哉f(shuō)本發(fā)明蘊(yùn)含著巨大的社會(huì)效益和經(jīng)濟(jì)效益,蘊(yùn)含著不可估量的發(fā)展空間,它擁有廣闊的市場(chǎng)前景!五,實(shí)現(xiàn)的途徑本發(fā)明作為一種鍵盤輸入方案,各種中文操作平臺(tái)均為它的實(shí)現(xiàn)提供了有效的工具,如UCDOS的Limd,TWAY的Keytooo。美國(guó)Microsoft公司與我國(guó)新天地電子信息技術(shù)研究所合作的簡(jiǎn)體中文版Windows3.2碼表生成器,也是實(shí)現(xiàn)本發(fā)明的一種方式之一。通過(guò)該輸入法生成器,可以生成具有自己個(gè)性、與Windows操作系統(tǒng)風(fēng)格一致、并能充分發(fā)揮Windows操作系統(tǒng)優(yōu)良特性的中文詞組輸入法。
具體步驟如下1,創(chuàng)建中文詞組輸入法碼表源文件①,啟動(dòng)中文Windows3.2系統(tǒng),雙擊“附件”,再雙擊“書(shū)寫器”。
②,根據(jù)Windows3.2輸入法格式,和本發(fā)明的一級(jí)簡(jiǎn)碼、二級(jí)簡(jiǎn)碼、全碼、成字字根和詞組的編碼規(guī)則,按照編碼碼元排序,建立以TXT為后綴的純文本碼表源文件[Description]Name=中文詞組MaxCodes=4UsedCodes=abcdefghijklmnopqrstuvwxyzWildChar=*Sort=0[Text]-g的r……二fg三dg鍵qvj盤tlp……馬cng皿lbg
……中文khyy詞組ykxg……專利局ftnk申請(qǐng)表jyge……中文詞組kyyx蔚為壯觀ayuc……中文詞組輸入法kyyi中華人民共和國(guó)kwwl……③,退出,另存為Windows\system\zwcz.txt。
2,創(chuàng)建中文詞組輸入法①,雙擊“主群組”中的“碼表生成器”;②,單擊“瀏覽”按鈕,選擇Windows\system\zwcz.txt碼表源文件,單擊“轉(zhuǎn)換”按鈕;③,轉(zhuǎn)換完成,單擊“完成”按鈕,即生成ZWCZ.MB碼表文件。
④,退出碼表生成器,啟動(dòng)控制面板程序,選擇“輸入方法”圖標(biāo),打開(kāi)“輸入方法對(duì)話框;⑤,選擇“通用碼表輸入法”,單擊“選用”按鈕,在“所選輸入方法”對(duì)話框中單擊“設(shè)置”按鈕,打開(kāi)通用碼表對(duì)話框;⑥,單擊“安裝”按鈕,選擇ZWCZ.ME文件,按“確定”按鍵;此時(shí),屏幕最下方顯示出本發(fā)明的輸入窗口。退出“輸入法”對(duì)話框和控制面板,即可使用本發(fā)明進(jìn)行漢字輸入了。
由上述方法產(chǎn)生的中文詞組輸入法,是Windows 3.X簡(jiǎn)體中文版輸入法文件,它除了可以在Pwindows3.x系統(tǒng)上使用之外,還可以安裝到簡(jiǎn)體中文版Windowa95、Windows97、Windows98系統(tǒng)中使用,具體步驟如下
①,將ZWCZ.MB文件復(fù)制到裝有PWindows9x系統(tǒng)機(jī)型的WINDOWS\SYSTEM目錄下;⑦,單擊“開(kāi)始”按鈕,指向“程序”、“附件”,再單擊“輸入法生成器”。
③,單擊“打開(kāi)文件”按鈕,將ZWCZ.MB碼表詞庫(kù)文件打開(kāi)。
④,單擊“逆轉(zhuǎn)換”,生成符合PWindows9x格式的新碼表源文件ZWCZ.TXT。
⑤,選擇“創(chuàng)建輸入法”標(biāo)簽,單擊“瀏覽”,選擇ZWCZ.TXT碼表源文件,填入“中文詞組”等輸入法信息,然后單擊“確定”。
⑥,單擊“轉(zhuǎn)換”按鈕,重新生成新的ZWCZ.MB的碼表文件。
⑦,單擊“創(chuàng)建”按鈕,添入版本號(hào)和機(jī)構(gòu)名稱。
⑧,單擊“用戶給定”選項(xiàng),再單擊“瀏覽”按鈕,分別選擇自己喜愛(ài)的圖標(biāo)(ICO文件)、位圖(BMP)及幫助文件(HLP文件)。
⑨,單擊“確定”按鈕,即可生成一個(gè)具有用戶自己個(gè)性、與PWindows9x中文版風(fēng)格保持一致、并能充分發(fā)揮PWindows9x各種優(yōu)良特性的中文詞組輸入法文件(ZWCZ.IME)。
⑩,生成輸入法后,系統(tǒng)將提示是否安裝。選擇安裝后,系統(tǒng)將自動(dòng)安裝輸入法。此時(shí),新生成的中文詞組輸入法即添加到中文Windows9x系統(tǒng)中,操作者就可以象使用其它預(yù)裝的輸入法一樣使用這一新生成的輸入法了。
(附上述美國(guó)Microsoft公司PWindows9x輸入法生成器的碼表逆轉(zhuǎn)換,除了可將本發(fā)明碼表文件反編譯為文本文件、由此重新編譯為符合PWindows9x格式的碼表文件之外,還可以由此對(duì)本發(fā)明字根設(shè)置、字詞編碼、詞庫(kù)設(shè)置進(jìn)行全面的檢索和審查。)(全文完)
權(quán)利要求
1,一種計(jì)算機(jī)文字輸入系統(tǒng),其特征在于以三維定位檢索技術(shù)、碼長(zhǎng)分區(qū)技術(shù)、高頻先見(jiàn)技術(shù)為依托,由特定的鍵盤字根設(shè)置方案、字詞編碼方案、詞庫(kù)設(shè)置方案、操作輸入方案和兼容承接方案組成,三碼一字,四碼一詞,音形結(jié)合,具有編碼短、學(xué)習(xí)容易、操作簡(jiǎn)便、輸入快捷、定位準(zhǔn)確的特點(diǎn)。
2,根據(jù)權(quán)利要求1的鍵盤字根方案,其特征是①,字根以漢字規(guī)范部首為標(biāo)準(zhǔn),設(shè)置數(shù)目200個(gè);②,字根根據(jù)其筆劃起勢(shì)特征分為“橫、豎、撇、捺、折”五大區(qū)和一個(gè)特例區(qū);③,“橫”劃起筆字根對(duì)應(yīng)計(jì)算機(jī)鍵盤G、F、D、S、A鍵位;“豎”劃起筆字根對(duì)應(yīng)計(jì)算機(jī)鍵盤H、J、L、L、M鍵位;“撇”劃起筆字根對(duì)應(yīng)計(jì)算機(jī)鍵盤T、R、E、W、 Q鍵位;“捺”劃起筆字根對(duì)應(yīng)計(jì)算機(jī)鍵盤Y、U、I、O、P鍵位;“折”劃起筆字根對(duì)應(yīng)計(jì)算機(jī)鍵盤N、B、V、C、X鍵位;“扌”“寸”“才”“車”“力”“皮”“幾”字根對(duì)應(yīng)計(jì)算機(jī)的Z鍵位。④,通配查詢鍵為“*”。
3,根據(jù)權(quán)利要求1的編碼方案,其特征是①,編碼方案分為單字編碼與詞組編碼二大類,共八條規(guī)則;單字編碼規(guī)則為鍵名字=所在鍵位+所在鍵位+所在鍵位一級(jí)簡(jiǎn)碼=字首或一級(jí)簡(jiǎn)碼=次字首二級(jí)簡(jiǎn)碼=字首+次字首成字字根=所在鍵位+首筆+末筆完全編碼=字首+字尾+音首詞組編碼規(guī)則為二字詞=首字字首+首字字尾+次字字首+次字字尾三字詞=首字字首+次字字首+末字字首+末字字尾四字及四字以上詞=首字字首+次字字首+三字字首+末字字首②,設(shè)置鍵名字26個(gè),設(shè)置一級(jí)簡(jiǎn)碼26個(gè),設(shè)置二級(jí)簡(jiǎn)碼665個(gè),設(shè)置成字字根95個(gè)。
4,根據(jù)權(quán)利要求1的詞庫(kù)設(shè)置方案,其特征是①,詞庫(kù)總條目大于68000條;②,二字詞條目大于43000條;③,三字詞條目大于10000條;④,四字及四字以上詞條目大于15000條。
5,根據(jù)權(quán)利要求1的設(shè)計(jì)說(shuō)明文件,其特征是①,對(duì)權(quán)利要求1發(fā)展概況的闡述;②,對(duì)權(quán)利要求1功能特點(diǎn)的闡述;③,對(duì)權(quán)利要求1技術(shù)方案的闡述;④,對(duì)權(quán)利要求1操作方法的闡述⑤,對(duì)權(quán)利要求1安裝方案的闡述;⑥,對(duì)權(quán)利要求1升級(jí)方案的闡述。
6,根據(jù)權(quán)利要求1的字詞編碼詞典,其特征是①,對(duì)權(quán)利要求1發(fā)展概況的簡(jiǎn)述;②,對(duì)權(quán)利要求1功能特點(diǎn)的簡(jiǎn)述;③,對(duì)權(quán)利要求1技術(shù)方案的簡(jiǎn)述;④,對(duì)權(quán)利要求1操作方法的簡(jiǎn)述⑤,分類排列權(quán)利要求1的單字編碼;⑥,分類排列權(quán)利要求1的詞組編碼。
7,根據(jù)權(quán)利要求1的兼容承接方案,其特征是①,兼容承接五筆字型輸入法;②,兼容承接漢字詞組輸入法。
8,一種計(jì)算機(jī)文字的定位檢索技術(shù),其特征是①,三維檢索——從三個(gè)不同方向?qū)h字進(jìn)行立體交叉定位檢索,每個(gè)方向又根據(jù)計(jì)算機(jī)鍵盤A至Z鍵位分為26個(gè)段級(jí);②,三鍵定位——最多三個(gè)碼元即確定具體漢字,單字編碼最大碼長(zhǎng)為3。
9,根據(jù)權(quán)利要求7的計(jì)算機(jī)文字檢索方案,其特征是①,第一維檢索方向是單字內(nèi)部的第一個(gè)部首,第二維檢索方向是單字內(nèi)部的最后一個(gè)部首,第三維檢索方向是單字拼音的第一個(gè)字母;②,一維檢索的26個(gè)編碼空間全部分配給一級(jí)簡(jiǎn)碼使用,二維檢索的676個(gè)編碼空間分配給二級(jí)簡(jiǎn)碼使用,三維檢索的17576編碼空間分配給單字完全編碼使用;③,國(guó)標(biāo)一二級(jí)字庫(kù)6763個(gè)漢字均可用三個(gè)碼元表示。
10,一種劃分字詞編碼長(zhǎng)度的技術(shù)方案,其特征是①,三碼一字,四碼一詞單字編碼全部設(shè)置在3個(gè)及3個(gè)以下的碼元區(qū)域內(nèi),詞組編碼全部設(shè)置在4個(gè)碼元的區(qū)域內(nèi);②,3鍵及3鍵以內(nèi)的編碼區(qū)域全部分配給單字使用,4鍵編碼區(qū)域全部分配給詞組使用;③,字詞編碼區(qū)域既相對(duì)獨(dú)立,又互為補(bǔ)充,字詞輸入無(wú)需按鍵切換。
全文摘要
一種以詞組輸入為主導(dǎo)、以單字輸入為基礎(chǔ)的計(jì)算機(jī)漢字輸入系統(tǒng),綜合運(yùn)用三維定位檢索技術(shù)、碼長(zhǎng)分區(qū)技術(shù)、高頻先見(jiàn)技術(shù),以形為主、音形結(jié)合,三碼一字,四碼一詞,字詞輸出渾然一體,自帶68000條目詞庫(kù),詞組覆蓋率高達(dá)95%以上,從根本上解決一般輸入法中編碼長(zhǎng)、字詞重碼(或屏蔽)、不能兼容五筆字型等矛盾,具有編碼短、重碼低、學(xué)習(xí)易、詞組豐富、輸入快捷、定位準(zhǔn)確、通用性好等特點(diǎn),既好學(xué)又好用,比五筆字型輸入法(98王碼)提高效率約百分之二十五,可能是一種最好的中文鍵盤輸入法。
文檔編號(hào)G06F3/023GK1236914SQ9910151
公開(kāi)日1999年12月1日 申請(qǐng)日期1999年1月1日 優(yōu)先權(quán)日1999年1月1日
發(fā)明者鐘明華 申請(qǐng)人:鐘明華