專(zhuān)利名稱(chēng):形碼數(shù)碼合一漢字編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是一種形碼數(shù)碼合一漢字編碼方案,它屬于漢字信息技術(shù)領(lǐng)域,適用于漢字計(jì)算機(jī)輸入及字典編排。
對(duì)比已有的技術(shù),首先我們很明確的是漢字實(shí)質(zhì)上是由筆劃和字形確定的,只有形碼才能做到高效率且重碼少。這也是繁瑣難記的五筆字形編碼法能成氣候的原因。只要方塊字不被廢除,形碼的這一優(yōu)勢(shì)就不會(huì)被動(dòng)搖。另一方面漢字又一特征是每個(gè)字的筆劃數(shù),這一漢字信息一直未被很好利用。專(zhuān)利1042784A和1081002A的發(fā)明雖然注意到這一特征,但用得不巧,未能利用計(jì)算機(jī)自動(dòng)得知這一信息。
本發(fā)明的目的就是要將漢字的字形信息和筆劃數(shù)信息自然地結(jié)合在一起,使?jié)h字輸入既保持高效率低重碼的優(yōu)點(diǎn),又使它變得簡(jiǎn)單易記,真正達(dá)到一看就懂,無(wú)需培訓(xùn),人人會(huì)用的目的。
本發(fā)明的設(shè)計(jì)方案是把字根分為三十組,分別安排在三十個(gè)鍵位上。字根的分組原則為同一鍵上的各字根有相同的筆劃數(shù),重碼少且便于記憶。字根安排如附表1所示。
每個(gè)漢字編碼形式為***?,其中*代表字根,?是0—5的一位數(shù),這數(shù)字表示已鍵入字根外的剩余筆劃數(shù)。碼長(zhǎng)為自由式,標(biāo)準(zhǔn)碼長(zhǎng)為四。每按下一個(gè)字根鍵時(shí)計(jì)算機(jī)同時(shí)記下這字根鍵名和字根筆劃數(shù)。當(dāng)按下末位數(shù)字鍵時(shí),計(jì)算機(jī)知道該字的輸入已經(jīng)結(jié)束。計(jì)算機(jī)把各字根筆劃和末位剩余筆劃數(shù)加起來(lái)給出筆劃數(shù)信息并使筆劃計(jì)數(shù)器清零等待下一個(gè)字的輸入。一般由三個(gè)字根和總筆劃數(shù)就足以確定一個(gè)漢字。例如“黃”字,計(jì)算機(jī)內(nèi)部安排為艸,一,田,八→黃,實(shí)際上敲四鍵艸,一,田,2即V,-,S,2四鍵或艸,田,八,1即V,S,R,1四鍵都能正確得到“黃”字。但如果少鍵入一個(gè)字根如艸,田,3即V,S,3,雖也能得到“黃”字,一般情況下將會(huì)出現(xiàn)重碼。
數(shù)字6—9用于消除短碼字中的重碼,例如“只”、“叭”和“嘰”僅憑KR兩鍵難以區(qū)分,它們?yōu)閷\字根重碼字。正確輸入法為KRφ=只,KR6φ=叭;KR7φ=嘰。又例如Rφ=人;R9φ=兒;R8φ=入。數(shù)字6—9不參與筆劃計(jì)數(shù),只用于消除重碼。還有一些由于字根擺放位置不同的重碼字如回和呂,旭和旮等,它們?yōu)榻Y(jié)構(gòu)性重碼字。我們用數(shù)字8來(lái)標(biāo)記具有上、下離散字根的那個(gè)字。例如KKφ=回;KK8φ=呂;ABφ=旭,AB8φ=旮。
極大部份漢字都由附表1字根按離散和相接的方式構(gòu)成,它們形成自然拆分,如“知”拆分為亻,大,口;少數(shù)字由字根相交構(gòu)成需人工拆分。拆分方法按左右,上下,先外后內(nèi)的次序,取大優(yōu)先,兼顧直觀。例如“甲”拆為日,丨而不拆為口,十。本發(fā)明可提供一百個(gè)字的拆分示例,看了示例可正確輸入各部首和漢字。
正確輸入漢字的口訣為認(rèn)準(zhǔn)首字根,活選中間字根,兼顧末字根。由首字根和總筆劃數(shù)計(jì)算機(jī)立刻就把要找的字縮到了很小的范圍。中間部分抓住主要字根而把次要筆劃歸結(jié)到尾數(shù)中去。有些重要字根如“辶”常在字尾出現(xiàn),不要把它們當(dāng)尾數(shù)處理。為了提高效率,當(dāng)首字根為單筆劃而后續(xù)字根有三個(gè)以上時(shí),規(guī)定這單筆劃不作字根而歸結(jié)到尾數(shù)中去。
本方案比其它方案能容納更多的一級(jí)、二級(jí)簡(jiǎn)碼字。字符鍵加空格鍵就給出該鍵左邊的一級(jí)字。對(duì)借用的四個(gè)非字母鍵,每一鍵加空格鍵就給出它自己的原來(lái)字符。對(duì)一些字根較多的常用漢字,規(guī)定頭兩個(gè)字根加空格鍵就給出該字。如“做”,RA加空格鍵就給出這字。本方案還有另一類(lèi)一級(jí)二級(jí)碼字。符號(hào)鍵加數(shù)字零給出該鍵右邊的第一字。還有很多的字,例如“扯”,按CD鍵加數(shù)字零給出這字且沒(méi)有重碼。雖然有些筆劃較多的字需四鍵以上,但由于有大量的只需二鍵或三鍵的常用字,本方案的輸入效率是相當(dāng)高的。
由于字根的精心安排,本方案在標(biāo)準(zhǔn)碼長(zhǎng)下的靜態(tài)重碼率小于百分之三。對(duì)專(zhuān)職人員,由于少量重碼可用二級(jí)簡(jiǎn)碼來(lái)避開(kāi),記住二級(jí)碼可實(shí)現(xiàn)盲打。
對(duì)詞組輸入沿用通常方法,兩字詞每字取兩碼加空格鍵結(jié)束。三字詞前二字各取一字根末字取兩字根加空格鍵結(jié)束。多字詞每字取一字根等。凡字根鍵連擊四次以上再加空格鍵時(shí),計(jì)算機(jī)自動(dòng)知道該輸入為詞組輸入,不會(huì)與單體字混淆。
本方案可兼容中文西文輸入,凡出現(xiàn)大寫(xiě)字母時(shí),自動(dòng)轉(zhuǎn)到西文輸入;凡出現(xiàn)句點(diǎn)時(shí),自動(dòng)回到中文方式。
本方案適用于編排字典,也容易移植到繁體字的計(jì)算機(jī)漢字輸入上。
本發(fā)明的優(yōu)點(diǎn)及效果本發(fā)明漢字編碼方案輸入效率高,重碼少,便于記憶與掌握;可實(shí)現(xiàn)盲打、可以輸入詞組、且不與單體字混淆;中西文兼容,且可以自動(dòng)轉(zhuǎn)化,本發(fā)明輸入漢字外還適用于編排字典或移植到繁體字的計(jì)算機(jī)漢字輸入上。
實(shí)施例,請(qǐng)見(jiàn)本發(fā)明的設(shè)計(jì)方案及附表1所示內(nèi)容。
附表1 字根及鍵位分配
權(quán)利要求
1.一種適用于計(jì)算機(jī)輸入及字典編排的形碼數(shù)碼合一漢字編碼方案,其特征在于由一個(gè)字的字根信息加總筆劃數(shù)信息決定所選擇的漢字。
2.按照權(quán)利要求1所述的編碼方案,其特征在于把一些組字能力強(qiáng)的字根分為若干組并安排在不同鍵位上,每一個(gè)鍵位上的一組字根均有相同的筆劃數(shù)。
3.按照權(quán)利要求1所述的編碼方案,其特征在于每按下一鍵計(jì)算機(jī)同時(shí)記下鍵名和字根筆劃數(shù)信息。
4.按照權(quán)利要求1所述的編碼方案,其特征在于輸入的末一鍵為數(shù)字鍵,這一數(shù)字表示除鍵入的字根外該輸入字還剩下的筆劃數(shù)。
全文摘要
本發(fā)明是一種形碼數(shù)碼合一的漢字編碼方案。本方案把字根分為三十組分別安排在三十鍵位上,每組字根均有相同的筆劃數(shù)及相似外形。標(biāo)準(zhǔn)輸入形式為***?,*代表字根,每按一字根鍵計(jì)算機(jī)同時(shí)記下鍵名和該字根筆劃數(shù)。?為一位數(shù),表示除鍵入的字根外該字的剩余筆劃數(shù)。計(jì)算機(jī)把筆劃數(shù)相加,由字的筆劃數(shù)及字根信息認(rèn)出該字。本方案易學(xué)易記、效率高重碼少。單字和詞組、中文和西文可混合輸入,是理想的編碼方案。
文檔編號(hào)G06F3/023GK1115053SQ9510679
公開(kāi)日1996年1月17日 申請(qǐng)日期1995年6月30日 優(yōu)先權(quán)日1995年6月30日
發(fā)明者黃湘友 申請(qǐng)人:黃湘友