專利名稱:計(jì)算機(jī)漢字信息合成碼輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子計(jì)算機(jī)漢字信息編碼輸入方法。
背景技術(shù):
信息是在有效傳播情況下能夠消除不確定性的中介象征。計(jì)算機(jī)漢字輸入法就是要尋求到能夠最大限度消除不確定性的一種編碼作為中介象征,從而達(dá)到充分有效地傳播交流的目標(biāo)。計(jì)算機(jī)漢字輸入“萬(wàn)碼奔騰”,為達(dá)成這一目標(biāo)展開(kāi)了篳路藍(lán)縷的拓荒鋪路工作,也產(chǎn)生了形碼、聲碼、形聲碼等不同類別的正在應(yīng)用的編碼。但是,已有的各種輸入方法都沒(méi)有全面滿足記憶量極小、輸入速度極快、重碼率極低的高難度要求。
另一方面,千百年來(lái),在我國(guó)民間廣泛流傳一種區(qū)分和表述姓氏的說(shuō)法。例如弓長(zhǎng)張,立早章;耳東陳,禾口程;廣口唐,共田八黃,三橫王……。今天的信息時(shí)代,正在面臨計(jì)算機(jī)漢字輸入的上述瓶頸,萬(wàn)“碼”奔騰而魚(yú)龍混雜;這些編碼輸入方法都未能汲取民間智慧,不利于推廣應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是,針對(duì)現(xiàn)有技術(shù)存在的不足,提出一種計(jì)算機(jī)漢字信息合成碼輸入法,它汲取民間智慧,博采眾碼長(zhǎng)處,具有易懂易學(xué)、記憶量小、輸入速度快、重碼率極低的特點(diǎn)。
本發(fā)明的技術(shù)解決方案是,所述計(jì)算機(jī)漢字信息合成碼輸入法的組成為
1、漢字部件碼元及其在標(biāo)準(zhǔn)鍵盤(pán)上的鍵位分布 所述漢字部件碼元,還包括國(guó)家頒布的GB2312字表中具有組成另一漢字能力的字,其相應(yīng)的代碼鍵是與該字漢語(yǔ)拼音首字母相同的英文字母鍵;再則,筆畫(huà)橫“一”、提 讀若“一(YI)”,設(shè)為I鍵;豎“丨”讀若“RI(人立)”,設(shè)為I鍵;撇“丿”讀“PIE”,設(shè)為P鍵;點(diǎn)“丶”讀若“WEN(文點(diǎn))”,設(shè)為W鍵;捺“”讀“NA”,設(shè)為N鍵;其他折筆分別對(duì)應(yīng)相關(guān)部首的鍵位。
2、形成碼表(漢字編碼輸入)的規(guī)則2.1 碼表分出優(yōu)選碼和容許碼兩大類別;優(yōu)選碼由一、二、三鍵簡(jiǎn)碼組成,容許碼由三鍵碼、四鍵碼組成,容許用戶多種合理的思路打字;2.2 優(yōu)選碼的具體組成2.2.1 一鍵簡(jiǎn)碼由鍵面26個(gè)字母對(duì)應(yīng)的最高頻字的漢語(yǔ)拼音頭字母組成;2.2.2 二鍵簡(jiǎn)碼由26×26個(gè)字母組合范圍內(nèi)對(duì)應(yīng)的常用字的漢語(yǔ)拼音頭字母組成;2.2.3 三鍵簡(jiǎn)碼由26×26×26個(gè)字母組合范圍內(nèi)對(duì)應(yīng)的較常用字的漢語(yǔ)拼音頭字母組成;其中——第一碼漢字首部件碼元的漢語(yǔ)拼音頭字母;第二碼漢字次部件碼元的漢語(yǔ)拼音頭字母;第三碼漢字的漢語(yǔ)拼音頭字母;2.3 容許碼的具體組成2.3.1 容許碼的三鍵簡(jiǎn)碼,第一、二碼類似優(yōu)選碼三鍵簡(jiǎn)碼的第一、二碼,但是容許第三碼編入漢字再次部件碼元的漢語(yǔ)拼音頭字母,或者漢字的漢語(yǔ)拼音頭字母。
2.3.2 容許碼的四鍵碼,第一、二碼類似優(yōu)選碼三鍵簡(jiǎn)碼的第一、二碼,但是容許第三碼編入漢字再次部件碼元的漢語(yǔ)拼音頭字母;容許第四碼編入漢字最末部件碼元的漢語(yǔ)拼音頭字母,或者漢字的漢語(yǔ)拼音頭字母。
3、用戶漢字輸入取碼口訣及其字例說(shuō)明3.1 分合兼顧音形義,順次拆取字部畫(huà)。要求兼顧漢字字音、字形、字義的分析與合成,并且按照筆順次序,比較合理地拆取被編碼漢字包含的部件字、偏旁部首、筆畫(huà)。
例① 音的合成gxk,部件聲母+部件聲母+整字聲母。
形的合成艮,通常不必分出部件 義的合成艮,取義“止”;止于心者,盡心、坦率、誠(chéng)懇;合成“懇”的本義。
如果用戶讀不出首部件的聲母,可以啟動(dòng)“?”鍵立刻得到解答和屏顯。
3.2 多避連擊可簡(jiǎn)省,常碼不成取變碼。同音連擊可能造成重碼,運(yùn)用簡(jiǎn)化和省略的取碼方法,盡量避開(kāi)連擊,變通打字。
例② 盡可能避免連擊bb,省略“半”字中的“”,字義的合成更加貼切。
例③ 省略“人”、“口”,作用同例②。
3.3 筆畫(huà)似部讀成部,部畫(huà)象字讀成字。拆取的部件盡量看成可以發(fā)出聲音的字,或者是鍵面分布的部件。(超越鍵面或者需要合并處理的部首、筆畫(huà)歸入V鍵)例④ “王”“象”“王”, 象“刂”。
例⑤ 象“幾”。
例⑥ 合并處理,擊V鍵,不超過(guò)三碼即可出字。
3.4 低頻多拆高頻就,隔件從俗可合成。使用頻率很低的字可以合理拆成四碼字,高頻字、常用字就勢(shì)省碼,被其他部件隔開(kāi)的部件,也可以按照民間習(xí)俗合起來(lái)取碼。
例⑦ 街,高頻字,多利用原意合成。
例⑧ 黃,高頻字,從簡(jiǎn)編成三碼;百姓中有“共田八”之說(shuō),從俗取“共”;改錯(cuò)為“由”。
例⑨ 蹩,低頻使用字;“敝”件不拆,容易與高頻字“遍”字發(fā)生重碼,低頻多拆,先取字聲。如果打字時(shí)沒(méi)有拆打,可能在“容許碼”里允許用戶不拆擊碼(bzb),由屏幕顯示重碼字(遍、蹩)后再作選擇。
進(jìn)一步說(shuō)明——1.本發(fā)明的合成碼采集漢字信息的主要特征,部件聲+整字聲合成編碼。每字一到四碼,每碼都可以咨詢作答,平均碼長(zhǎng)不超過(guò)三碼。在GB2312即國(guó)標(biāo)6763個(gè)漢字的范圍里,優(yōu)選碼幾乎都可以三鍵以內(nèi)出字。記憶量小,輸入速度快,優(yōu)選輸入無(wú)重碼。它給漢字盲打、漢語(yǔ)語(yǔ)詞和語(yǔ)句的輸入等預(yù)留了技術(shù)接口,也給其他輸入方式如語(yǔ)音、書(shū)寫(xiě)、掃描預(yù)留了技術(shù)接口,特別便利多種情況下兒童對(duì)漢字的趣味認(rèn)知和組織國(guó)內(nèi)外的漢字漢語(yǔ)教學(xué),相應(yīng)的軟件試用和教學(xué)實(shí)驗(yàn)正在展開(kāi)過(guò)程中。
2.合成碼采集GB2312范圍里的每一個(gè)漢字,分別取用它們音、形、義信息的主要特征,考慮漢字使用頻率分一、二、三、四鍵編碼。它大規(guī)模簡(jiǎn)化碼元和取碼規(guī)則,在鍵面上合理分布碼元,將取碼規(guī)則和碼元稱謂,編成口訣幫助用戶記憶,必要時(shí)附錄代表字舉例加以說(shuō)明。
本發(fā)明中,鍵面碼元由56類多筆部首(內(nèi)含相關(guān)筆畫(huà)用彩色筆勾出),構(gòu)成26組碼元對(duì)應(yīng)鍵面26個(gè)拼音字母(詳見(jiàn)上述“鍵面分布”),每組平均2.15個(gè)碼元。這些碼元在具體的漢字結(jié)構(gòu)中還可以根據(jù)編碼需要繼續(xù)拆分組合。
除了“V”鍵對(duì)應(yīng)的“舟”、“月”部首有特殊用途單獨(dú)成字外,其它部首、筆畫(huà)都沒(méi)有單獨(dú)成字。凡是單獨(dú)成字的部畫(huà),或者指定讀音的部畫(huà)(在“鍵面分布”說(shuō)明中逐一列出),分別按照讀音和取碼規(guī)則歸屬鍵位。
合成碼碼元的鍵位分布,盡量依據(jù)漢字字、部、畫(huà)的聲母頭母鍵位(多音字、部取其中一種)合理分布。為了均衡鍵位容量,頭字母丫聲字按韻頭字母分派U、I、O三鍵,其中yuè音節(jié)分派V鍵位;頭字母Z、C、S聲字E韻頭分派E鍵,De音節(jié)字分派E鍵;頭字母S聲字A韻頭分派A鍵,Z聲字O韻頭分派V鍵;頭字母M聲字O韻頭分派O鍵位。助記口訣是——Y聲分韻UIO,派送yuè音V鍵位。
ZCS聲E韻歸,派送De音E鍵位。
S聲A韻歸A鍵,Z聲O韻歸V鍵。
M聲O韻送O鍵,減負(fù)分工共作為。
圖示如下—— Yue音節(jié)→V De音節(jié)→D 3.配合一鍵簡(jiǎn)碼字(字母旁邊加點(diǎn)的字),可以憑借聯(lián)想和想象,用下面的口訣助記碼元鍵位——文烏 W類L 言 丫余歸韻頭。
心底 X母M三 A峰撇P 草類 C青Q 尤 O容廿N 寶冰 B手S 耳 E位虎H 人立 R匡K 示 I兼竹Z 絞絲 J刀D 雨 U旁飯F(tuán) 國(guó)光 G同T 舟 V合成萬(wàn)能。
4.“容許”域限4.1 在GB2312字庫(kù)即6763個(gè)漢字的范圍里,容許出現(xiàn)若干優(yōu)選碼以外的大體合理的3碼、4碼字。
4.2 容許碼必須包含被編碼的某個(gè)漢字音、形、義的主要特征。
4.3 容許碼不違背上述技術(shù)方案的框架要求。
4.4 容許在任意一個(gè)漢字的編碼中用“?”鍵咨詢,限問(wèn)一碼。
4.5 容許向合成碼碼表反饋信息,提供選碼,使合成碼不斷完善并定期改版。
5.本發(fā)明的技術(shù)原理包括語(yǔ)言文字學(xué)原理、認(rèn)知心理學(xué)原理和教育美學(xué)原理。
語(yǔ)言文字學(xué)原理。語(yǔ)言是人類社會(huì)最基本的信息載體,它保存和傳遞人類文明成果,維系和發(fā)展民族的文化特征。文字是記錄和傳達(dá)語(yǔ)言的書(shū)面符號(hào),種類不同的文字分別具有表意、表音、兼表意音三大功能。漢字是記錄和傳達(dá)漢語(yǔ)的書(shū)面符號(hào),通常用線條組成塊狀形體兼表意音。計(jì)算機(jī)漢字編碼的實(shí)質(zhì),就是采用人機(jī)對(duì)話的中介符號(hào),實(shí)現(xiàn)人機(jī)之間的信息轉(zhuǎn)換。合成碼從漢字形體入手,分析并綜合了漢字信息的主要特征進(jìn)行編碼,與計(jì)算機(jī)通用鍵面達(dá)成了合理的對(duì)應(yīng)關(guān)系,發(fā)揮了中介符號(hào)便利人機(jī)對(duì)話的重大功能。
認(rèn)知心理學(xué)原理。認(rèn)知心理學(xué)采用信息加工的觀點(diǎn)研究心理過(guò)程,把人看作是一個(gè)主動(dòng)的信息加工者,通過(guò)嚴(yán)格控制的實(shí)驗(yàn)室研究和被試的主觀報(bào)告,研究人對(duì)外界信息的內(nèi)部加工,掌握人們認(rèn)識(shí)客觀事物與獲得知識(shí)的活動(dòng)規(guī)律。合成碼方案認(rèn)同并且完善了這一原理。它主要通過(guò)優(yōu)選碼的嚴(yán)格控制和容許碼的寬泛涵蓋,通過(guò)網(wǎng)絡(luò)及時(shí)采集和統(tǒng)計(jì)用戶的選項(xiàng)碼結(jié)果,也就是用戶對(duì)漢字信息主動(dòng)加工的結(jié)果,動(dòng)態(tài)性地隨時(shí)研討和優(yōu)化方案,以便更好地適應(yīng)用戶心理。這樣做,就可以在廣泛調(diào)查、統(tǒng)計(jì)、分析的基礎(chǔ)上,使合成碼不斷得到改進(jìn)和升級(jí),不斷接近人們的認(rèn)知心理和識(shí)字、寫(xiě)字、解字、打字的實(shí)際趨向,汲取大眾信息加工和傳播互動(dòng)所形成的集體智慧,引導(dǎo)信息處理乃至識(shí)字教育中漢字認(rèn)知的比較盲目的個(gè)人行為。
教育美學(xué)原理。合成碼的功用不限于計(jì)算機(jī)漢字輸入,更為廣泛深遠(yuǎn)的影響在于漢字、漢語(yǔ)的教學(xué)教育活動(dòng),乃至信息社會(huì)里的其它教育教學(xué)活動(dòng)。個(gè)人的精神發(fā)育理應(yīng)是人類精神發(fā)育的簡(jiǎn)捷的復(fù)演,這一富有哲思和美感的“精神復(fù)演論”,對(duì)于當(dāng)代社會(huì)運(yùn)用計(jì)算機(jī)和網(wǎng)絡(luò)等信息手段組織教育教學(xué)活動(dòng),無(wú)疑具有教育美學(xué)等方面的理論啟示和實(shí)踐感召的力量。合成碼的編譯過(guò)程,恰恰是對(duì)古往今來(lái)漢字造字、用字、品字過(guò)程中的文化精神的歷練與復(fù)演。抓住漢字信息的主要特征分析與合成,在信息加工的科學(xué)把握和藝術(shù)處理上,也能夠?yàn)樾畔⒌慕逃τ煤兔缹W(xué)價(jià)值提供范例。
6. 本發(fā)明作為計(jì)算機(jī)漢字信息合成的輸入方法,它在漢字輸入的難點(diǎn)上取得了標(biāo)志性的突破。下面,試以目前應(yīng)用面最廣的“五筆字型”碼作出對(duì)比說(shuō)明。本發(fā)明特點(diǎn)有(1)記憶容量小,學(xué)習(xí)難度低。對(duì)比如下表 (2)平均碼長(zhǎng)小,輸入速度快。
在GB2312字庫(kù)共6763個(gè)漢字的范圍里,合成碼幾乎做到了三碼擊鍵即可在屏幕上顯示漢字,四碼字不到200個(gè)。平均碼長(zhǎng)為2.92,其中優(yōu)選碼無(wú)重碼,容許碼自由度大,輸入速度大大超過(guò)現(xiàn)行應(yīng)用碼?!拔骞P字型”不少是四碼出字,平均碼長(zhǎng)為3.27,輸入速度整體上要比合成碼低。
(3)合成碼的優(yōu)選碼無(wú)重碼,容許碼重碼率低于3%?!拔骞P字型”重碼率3.79%(GB2312編碼內(nèi))。
(4)合成碼兼顧音形義多方面的合成,貼近漢字文化,相對(duì)符合字理字據(jù)、認(rèn)知心理和群眾習(xí)慣,具有漢字、漢語(yǔ)教育再度開(kāi)發(fā)并且形成產(chǎn)業(yè)長(zhǎng)鏈的價(jià)值。
由以上可知,本發(fā)明為一種計(jì)算機(jī)漢字信息合成碼輸入法,它汲取了民間智慧,又博采眾碼長(zhǎng)處,具有易懂易學(xué)、記憶量小、輸入速度快、重碼率極低的特點(diǎn)。
具體實(shí)施例方式
按照本發(fā)明的技術(shù)方案,編成電子計(jì)算機(jī)漢字編碼輸入程序,用于計(jì)算機(jī)中文(漢字)信息處理。
按照本發(fā)明的技術(shù)方案,編成漢字信息合成手冊(cè),用于合成碼輸入法培訓(xùn)和漢字學(xué)習(xí)輔助用書(shū)。
參照本發(fā)明的技術(shù)方案,編成漢字文化動(dòng)漫故事,用于合成漢字和漢語(yǔ)的數(shù)字動(dòng)漫處理,帶動(dòng)相關(guān)產(chǎn)業(yè)。
權(quán)利要求
1.一種計(jì)算機(jī)漢字信息合成碼輸入法,其特征組成為(1)漢字部件碼元及其在標(biāo)準(zhǔn)鍵盤(pán)上的鍵位分布 所述漢字部件碼元,還包括國(guó)家頒布的GB2312字表中具有組成另一漢字能力的字,其相應(yīng)的代碼鍵是與該字漢語(yǔ)拼音首字母相同的英文字母鍵;再則,筆畫(huà)橫“一”、提 設(shè)為I鍵;豎“丨”設(shè)為I鍵;撇“丿”設(shè)為P鍵;點(diǎn)“丶”設(shè)為W鍵;捺“”設(shè)為N鍵;其余折筆分別對(duì)應(yīng)相關(guān)部首的鍵位。(2)形成碼表的規(guī)則碼表分出優(yōu)選碼和容許碼兩大類別;優(yōu)選碼由一、二、三鍵簡(jiǎn)碼組成,容許碼由三鍵碼、四鍵碼組成;所述優(yōu)選碼的具體組成是a.一鍵簡(jiǎn)碼由鍵面26個(gè)字母對(duì)應(yīng)的最高頻字的漢語(yǔ)拼音頭字母組成;b.二鍵簡(jiǎn)碼由26×26個(gè)字母組合范圍內(nèi)對(duì)應(yīng)的常用字的漢語(yǔ)拼音頭字母組成;c.三鍵簡(jiǎn)碼由26×26×26個(gè)字母組合范圍內(nèi)對(duì)應(yīng)的較常用字的漢語(yǔ)拼音頭字母組成;其中——第一碼漢字首部件碼元的漢語(yǔ)拼音頭字母;第二碼漢字次部件碼元的漢語(yǔ)拼音頭字母;第三碼漢字的漢語(yǔ)拼音頭字母;所述容許碼的具體組成是a.容許碼的三鍵簡(jiǎn)碼,第一、二碼類似優(yōu)選碼三鍵簡(jiǎn)碼的第一、二碼,容許第三碼編入漢字再次部件碼元的漢語(yǔ)拼音頭字母,或者漢字的漢語(yǔ)拼音頭字母;b.容許碼的四鍵碼,第一、二碼類似優(yōu)選碼三鍵簡(jiǎn)碼的第一、二碼,容許第三碼編入漢字再次部件碼元的漢語(yǔ)拼音頭字母;容許第四碼編入漢字最末部件碼元的漢語(yǔ)拼音頭字母,或者漢字的漢語(yǔ)拼音頭字母。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)漢字信息合成碼輸入法,它的取碼規(guī)則是a.兼顧漢字字音、字形、字義的分析與合成,并且按照筆順次序,比較合理地拆取被編碼漢字包含的部件字、偏旁部首、筆畫(huà);b.同音連擊可能造成重碼,運(yùn)用簡(jiǎn)化和省略的取碼方法,盡量避開(kāi)連擊,變通打字;c.拆取的部件盡量看成可以發(fā)出聲音的字,或者是鍵面分布的部件;d.將使用頻率很低的字合理拆成四碼字,高頻字、常用字就勢(shì)省碼,被其他部件隔開(kāi)的部件,可按照民間習(xí)俗合起來(lái)取碼。
3.根據(jù)權(quán)利要求1和2形成起來(lái)的具體實(shí)施方式
和方法。
全文摘要
一種計(jì)算機(jī)漢字信息合成碼輸入法,它主要包括(1)鍵面碼元由56類多筆部首構(gòu)成26組碼元對(duì)應(yīng)鍵面26個(gè)拼音字母,還包括國(guó)家頒布的GB2312字表中具有組成另一漢字能力的字,其相應(yīng)的代碼鍵是與該字漢語(yǔ)拼音首字母相同的英文字母鍵;(2)形成碼表的規(guī)則優(yōu)選碼由一、二、三鍵簡(jiǎn)碼組成,它們分別由鍵面26個(gè)字母對(duì)應(yīng)的最高頻字、常用字、較常用字的漢語(yǔ)拼音頭字母組成;三鍵簡(jiǎn)碼的第一、二、三碼分別是漢字首部件碼元、漢字次部件碼元、漢字的漢語(yǔ)拼音頭字母。本合成碼輸入法汲取了民間智慧,又博采眾碼長(zhǎng)處,具有易懂易學(xué)、記憶量小、輸入速度快、重碼率極低的特點(diǎn)。
文檔編號(hào)G06F3/023GK101030102SQ20061003129
公開(kāi)日2007年9月5日 申請(qǐng)日期2006年3月3日 優(yōu)先權(quán)日2006年3月3日
發(fā)明者程大琥 申請(qǐng)人:程大琥