專利名稱:中文1-4位數(shù)字快速分類輸入法的制作方法
概述人類生存于社會(huì)必然要進(jìn)行各種各樣活動(dòng),有活動(dòng)就會(huì)產(chǎn)生各種各樣信息,有信息,就得有記錄和傳遞信息的手段。
中華以其歷史和人口而論,不僅是一個(gè)文化古國(guó),也是一個(gè)信息大國(guó)。古人從結(jié)繩記事事到發(fā)明文字,從造紙筆到發(fā)明活字印刷,經(jīng)歷了一個(gè)又一個(gè)偉大的歷程,攀登了一個(gè)又一個(gè)更新信息傳遞方式的科技高峰。當(dāng)西方發(fā)明的無(wú)線電波跨洲越洋的時(shí)候,中國(guó)開(kāi)始有了用阿拉伯?dāng)?shù)字作為標(biāo)志記錄漢字的編碼-電報(bào)號(hào)碼。電報(bào)碼只有四位數(shù)字,按流水帳排列,具有號(hào)碼短,占用內(nèi)存空間少,兼有唯一性等優(yōu)點(diǎn);但其號(hào)碼之間無(wú)規(guī)律可尋,十分遺憾!開(kāi)放改革以來(lái),當(dāng)電腦悄悄進(jìn)入中國(guó)市場(chǎng)的時(shí)候,為了解決中文見(jiàn)字識(shí)碼的難題,國(guó)內(nèi)外掀起了一股研究漢字編碼的熱潮,探究人員之多,提出的方案之多,令人眼花撩亂,無(wú)所適從。
正如其它許多科學(xué)領(lǐng)域一樣,漢字編碼也是一個(gè)萬(wàn)花筒般的世界,有許多表達(dá)方式,有其自身的規(guī)律與特點(diǎn),有許多至今還深藏著不為人們認(rèn)識(shí)的學(xué)問(wèn),需要人們不斷地挖掘開(kāi)拓,去總結(jié)分析,去研究創(chuàng)新。
漢字編碼的方式盡管多種多樣,都離不開(kāi)從音、形、義方面取素材和使用字母或數(shù)字編碼的方式;從音素方面取材,有聲母、韻母;音節(jié)和聲調(diào)。
按字形編碼,有字形結(jié)構(gòu)碼、筆形筆順碼、部件并疊碼、四角筆形碼、對(duì)角筆形碼、首尾筆形碼、三角號(hào)碼、邊緣號(hào)碼、右文號(hào)碼等。
按拼音編碼,有單拼碼雙拼碼、以字取詞碼、以詞取字碼、純音碼、音形結(jié)合碼、首音尾形碼、詞組拼音碼等。
目前國(guó)內(nèi)外很多編碼方案都是以字形編碼為主,而影響較大,用戶較多的編碼也是字形編碼,使用二十多個(gè)字母鍵,對(duì)應(yīng)一百幾十個(gè)字根,每個(gè)漢字須擊四位或五位字母號(hào)碼;為了減少同碼,對(duì)不足四位字母號(hào)碼的漢字,還需附加末筆與漢字結(jié)構(gòu)代碼聯(lián)合組成的字型碼(還有同碼時(shí),則再按數(shù)字鍵選取)。
上述方案,都存在著眾多字根對(duì)應(yīng)眾多字母的缺點(diǎn),用戶普遍反映就是難學(xué)難記;為什么難學(xué)難記的東西卻能廣泛擁有市場(chǎng)?因?yàn)椤?〉上述方案都抓住了漢字有目共睹的特征-漢字書(shū)寫(xiě)過(guò)程中眾所皆知、宏觀直筆覺(jué)的形體。
〈2〉上述方案都出現(xiàn)得比較早,當(dāng)別的方案還沒(méi)有出現(xiàn),或者還沒(méi)有機(jī)會(huì)實(shí)施的時(shí)候,它們已經(jīng)沖出社會(huì),滿足了計(jì)算機(jī)饑不擇食,急不可待的市場(chǎng)需求。
〈3〉上述方案在宣傳,爭(zhēng)取社會(huì)支持和經(jīng)營(yíng)技藝方面都很成功。
〈4〉有些使用《筆形》編碼的方案,方法較簡(jiǎn)單,易學(xué),易記;用戶數(shù)量和知名度卻不如《字型碼》,其原因就在于筆形編碼不如部件編碼宏觀,數(shù)字號(hào)碼較長(zhǎng),輸入速度必然慢,所以難以推廣。
〈5〉按拼音輸入的編碼方案,由于同碼率較高,影響輸入速度。在研制和推廣使用方面,工作做得還不夠,有待今后探索完善。
究竟用戶心里是怎么想的呢?舊有的用戶也許因?yàn)橐呀?jīng)闖過(guò)了初學(xué)編碼時(shí)的難關(guān),認(rèn)為再學(xué)一套新的編碼實(shí)屬一種多余的負(fù)擔(dān)。而對(duì)于那些更為大量的,不斷涌現(xiàn)的新用戶又是如何想的呢?他們是否希望從事編碼研究的科學(xué)工作者再加把勁,將漢字編碼-這種應(yīng)用于現(xiàn)代尖端科技(電腦)的輸入方法搞得更簡(jiǎn)易一些?更精粹一些?更符合事物規(guī)律和更適應(yīng)社會(huì)需求一些?這是毫無(wú)疑異的!隨著電子計(jì)算機(jī)的廣泛應(yīng)用,電腦已開(kāi)始進(jìn)入我國(guó)的普通家庭,漢字編碼作為一種處理文字的方法和工具,不僅不會(huì)消失,而且還將得到更充分的發(fā)展。人們迫切需要有一種更加簡(jiǎn)易快速的,同時(shí)又能處理大量專業(yè)詞語(yǔ)的輸入方法。
總言之,時(shí)代向我們提出了新的要求,八十年代以單字輸入為主的電腦編碼顯然已落后,九十年代的中文電腦,應(yīng)該是以詞語(yǔ)為主要輸入手段的電腦,用戶不僅要求在單字編碼易學(xué)、易記和快速輸入方面有所突破和創(chuàng)新,而且要求在詞語(yǔ)處理方面狠下功夫,開(kāi)拓出各類專業(yè)用戶都樂(lè)于使用的、新的一代編碼。
長(zhǎng)江滾滾向東流,后浪超前浪;人類科技的歷史,總是在不斷開(kāi)拓創(chuàng)新中前進(jìn)的,落后的事物必被先進(jìn)的事物所代替。
《中文1-4位數(shù)字快速分類輸入法》,簡(jiǎn)稱《分類碼》,是筆者經(jīng)過(guò)十余年不斷琢磨出來(lái)的初步成果,下面分章作詳細(xì)介紹。
第一章漢字快速分類輸入法第一節(jié) 茫茫字海上下求索中文是世界各大語(yǔ)系之冠,它不僅歷史悠久,內(nèi)涵豐富;流通地域廣泛,而且用它來(lái)傳遞信息的人口也最多,自然地形成了一個(gè)宏大的漢字文化圈。
中文由音、形、義三個(gè)部分組成,中文有字、詞、句之分;所謂漢字編碼,或者中文輸入法,就是通過(guò)對(duì)中文音形義和字詞句的研究,分析其規(guī)律和特點(diǎn),用數(shù)字或字母作代碼,并將其應(yīng)用于電腦輸入等領(lǐng)域的科學(xué)。
漢字編碼是一項(xiàng)十分費(fèi)時(shí)而又艱巨的工作,搞漢字編碼的人都會(huì)遇到三多三難的問(wèn)題字多,詞多,同碼多;尋求理想方案難,處理同碼難,,實(shí)施方案難。
筆者從事漢字編碼業(yè)余研究十余年,探索過(guò)各種各樣的編碼途徑和方式,深知其中底蘊(yùn),有過(guò)不少得失和體會(huì);1983年3月,筆者在成都召開(kāi)的全國(guó)首屆漢字編碼專業(yè)學(xué)術(shù)研討會(huì)上,公開(kāi)了《邊緣號(hào)碼點(diǎn)字法》論文,提出了漢字五筆劃點(diǎn) 橫 豎 撇 角 一丨 丿口1 2 3 4 5
根據(jù)這五種筆劃編碼,筆者第一個(gè)提出了五筆形碼中,每?jī)晒P結(jié)合,對(duì)應(yīng)一個(gè)電腦鍵位,同時(shí)設(shè)計(jì)了按一鍵雙值,快速輸入的方案。因?yàn)?×5=25共有二十五個(gè)雙值鍵,例如11 12 13 14 15,21 22 23 24 25……51 52 53 54 55。
在該論文中,筆者首先提出了詞組編碼,依詞組筆型作跨欄跳躍式編碼3 5 4 5↑ ↑ ↑ ↑中 國(guó) 人 民=3545在該論文中,筆者還提到了部件編碼-雖多擊鍵四下,例如合=人-口 ?。解嗳?口 洽=氵人-口 拾=扌人-口筆者上述眾多的編碼技術(shù)和精華,很快就被后來(lái)很有影響的方案博采使用,特別是“一鍵雙值”的理論與方法,已被國(guó)內(nèi)外十幾個(gè)稍有名氣的方案效仿使用。
研討會(huì)后七年來(lái),筆者一直埋頭追求著世界上數(shù)字號(hào)碼最短的、識(shí)辨能力最強(qiáng)的、方法更加簡(jiǎn)易的方案,因而制定了非常苛刻的指標(biāo)〈1〉搞編碼,最好搞字形編碼。字形編碼有形可依,一目了然,容易掌握。
〈2〉字形編碼,最好按0-9鍵位編碼。字根越少,越容易學(xué);越容易記。
〈3〉0-9編碼,最好用1-4位號(hào)碼;字、詞兼容,詞為重點(diǎn);號(hào)碼越短越好。
〈4〉在0-9字形碼基礎(chǔ)上,同時(shí)兼容音碼和音形結(jié)合碼。
大家都知道,電報(bào)號(hào)碼按流水帳排序,也要四位數(shù)字,而作為供電腦使用的漢字編碼,不僅要求做到見(jiàn)字識(shí)碼,還有成千上萬(wàn)中文詞匯需要處理,想用1-4位數(shù)字解決問(wèn)題,此不是異想天開(kāi)嗎?有時(shí)候,筆者走在街上,看到許多數(shù)字號(hào)碼;車牌,郵政編碼,電話號(hào)碼……阿拉伯?dāng)?shù)字廣泛的妙用引起了筆者極大的興趣,同時(shí)也感到困惑不解,為什么同一號(hào)碼能夠同時(shí)維系眾多不同的事物,又不會(huì)引起錯(cuò)亂混淆?漢字編碼實(shí)際運(yùn)用起來(lái)又如何?這上邊有無(wú)值得借鑒和能夠引起啟迪的地方?長(zhǎng)江與黃河都是源自同一地方,流向同一目的地,中間卻遇到了分水嶺,走上了分道揚(yáng)鑣殊途同歸的道路。這里邊有無(wú)值得借鑒和能夠引起啟迪的地方?帶著這些問(wèn)題思考編碼,筆者終于發(fā)現(xiàn)了在簡(jiǎn)易的數(shù)字號(hào)碼后面,有眾多的通途和出口;在簡(jiǎn)易的拼音號(hào)的后面,是茫茫的辭海世界;人們只要將26個(gè)字母鍵看成大劇院散場(chǎng)時(shí)同時(shí)敞開(kāi)的一個(gè)個(gè)太平門(mén),而不只是看成字根鍵,這樣,用1-4位數(shù)字號(hào)碼處理成千上萬(wàn)中文字詞的夢(mèng)想就可以實(shí)現(xiàn)了,《中文1-4位數(shù)字快速分類法》簡(jiǎn)稱《分類碼》就是這樣設(shè)計(jì)出來(lái)的。
《分類碼》長(zhǎng)期孜孜以求的理想方案是字根少,號(hào)碼短;既宏觀,又簡(jiǎn)單;易學(xué),易用,易快;同時(shí)又能處理數(shù)以萬(wàn)計(jì)的不同專業(yè)詞語(yǔ),做到字碼與詞碼同形分道;全碼與簡(jiǎn)碼同時(shí)兼容;高頻詞窗口與專業(yè)詞窗口同時(shí)開(kāi)辟;用戶窗口與特殊窗口連帶推出;音碼與形碼同時(shí)使用?!嗄晷难c精華,開(kāi)拓出前所未有的漢字編碼新天地;研制出世界上數(shù)字號(hào)碼最短的,處理中文詞語(yǔ)最多的,形聲兼容功能獨(dú)特的,新的一代中文電腦輸入法。
第二節(jié) 漢字基本筆畫(huà)世界上任何事物都有一個(gè)起點(diǎn),世界上任何一種文字都有一個(gè)由點(diǎn)到線,由線到面的組合過(guò)程;《新華字典》部首檢字目錄中歸納的五種漢字基本筆畫(huà)點(diǎn) 橫 豎 撇 彎
一丨 丿乙漢字折彎勾(乙)筆劃形狀較多,但是細(xì)心觀察,還是有規(guī)律可循的,人們只要依其收筆方向跟蹤,就會(huì)發(fā)現(xiàn),它不是向左邊彎,就是向右邊勾。實(shí)踐證明,將漢字的折筆分成左彎和右勾是科學(xué)的,有利于減少編碼方案中的同碼。
通過(guò)上述分析和考慮,結(jié)合《分類碼》的設(shè)計(jì)特點(diǎn)和需求,確定了此方案中的六種漢字基本筆畫(huà)及代號(hào)如下橫 豎 點(diǎn) 撇 彎 勾一丨
丿了 乙1 2 3 4 5 6左彎用(了)字表示,包括(
);右勾用(乙)字表示,包括(ㄥ
乚凵)想了解和使用《分類碼》輸入方法的用戶,在初次接觸《分類碼》的時(shí)候,務(wù)必認(rèn)明以上六種漢字基本筆畫(huà)和代號(hào),因?yàn)檫@六種基本筆畫(huà)是字形編碼方案的核心,其應(yīng)用范圍十分廣泛,許多編碼表中沒(méi)有的字根都須借助于這些基本筆畫(huà)來(lái)完成。
根據(jù)上述筆形代號(hào)和漢字書(shū)寫(xiě)時(shí)的先后次序,人們不難得出上=丨-- 弓=
巳=
-乚夕=丿
丶也=
丨乚=211 =515 =516 =453 =526么=丿ㄥ丶 下=-丨丶 力=丿 子=了- 兒=丿乚=463 =123 =54 =51 =46
第三節(jié) 漢字結(jié)構(gòu)特點(diǎn)長(zhǎng)期以來(lái),人們都認(rèn)為漢字的結(jié)構(gòu)十分復(fù)雜,其實(shí)這是只看表面現(xiàn)象,未加仔細(xì)分析的誤解。有些編碼方案,為了減少同碼,執(zhí)意將漢字的結(jié)構(gòu)分成四、五類;七、八類;甚至十幾、二十類;將難記難學(xué)的東西交給用戶,這是不可取的。
《分類碼》經(jīng)過(guò)長(zhǎng)期研究分析,認(rèn)為漢字的結(jié)構(gòu)只有兩大類上下結(jié)構(gòu)和左右結(jié)構(gòu),所謂連體字和邊圍字,實(shí)際上都屬上下結(jié)構(gòu)的范圍,其書(shū)寫(xiě)時(shí)都是先上后下的。所謂(川)字形結(jié)構(gòu),實(shí)際上也屬左右結(jié)構(gòu)范圍,其書(shū)寫(xiě)時(shí)都是先左后右的。
〈1〉上下結(jié)構(gòu)(包括連體字和邊圍)舉例中(先口后丨)文(上亠下X)山(上丨下凵)夷(上-中弓下人)學(xué)(上下子)問(wèn)(上門(mén)下口)國(guó)(上囗下玉)家(上宀下豕)通(上甬下之)用(上冂下 )公(上八下厶)司(上中一下口)露(上雨下路)劈(上辟下刀)氛(上氣下分)束(上一中口下小)麝(上鹿下射)攀(上樊下手)蔓(上艸下曼)遜(上孫下之)〈2〉左右結(jié)構(gòu)(包括左中右組合字)舉例編(左纟右扁)碼(左石右馬)科(左禾右斗)技(左扌右支)群(左君右羊)體(左亻右本)鸚(左嬰右鳥(niǎo))鵡(左武右鳥(niǎo))魎(左鬼右兩)飚(左風(fēng)右焱)梅(左木右每)釗(左金右刂)湖(氵古月)衙(彳吾亍)鴻(氵工鳥(niǎo))鍘(金貝刂)《分類碼》就是根據(jù)上述兩類字型結(jié)構(gòu)設(shè)計(jì)編碼的。上下結(jié)構(gòu)漢字編碼時(shí),一定先取上邊號(hào)碼,再取下邊號(hào)碼;左右結(jié)構(gòu)漢字編碼時(shí),一定先取左邊號(hào)碼,再取右邊號(hào)碼。為了提高你的判斷能力,請(qǐng)你多找一些形狀不同的漢字分析它們屬于大類型結(jié)構(gòu)中哪一類,分析它們的上邊或左邊是由哪些部首或大的偏旁漢字組成的,這將有助于你盡快掌握電腦《分類碼》輸入技術(shù)。
第四節(jié)《分類碼》字根與代號(hào)有些編碼方案,為了追求編碼字根簡(jiǎn)單易記,把(工、月、水、火、土…)等常用的偏旁部首也丟掉了,有些編碼方案,為了追求宏觀與快速,幾乎把所有的漢字偏旁都搬到字母鍵上;編碼鍵位多,鍵上對(duì)應(yīng)的字根多,使用時(shí)必然難學(xué)難記,作為專業(yè)使用還可以,作為大眾碼推廣,就值得斟酌了。
本方案在設(shè)計(jì)過(guò)程中,分析比較了上述方案的特點(diǎn)與利弊,故此決定(1)不搞單純的,零碎的筆劃編碼。
(2)不搞眾多字根不加選擇地兼收并蓄的部件編碼。
(3)六個(gè)基本筆畫(huà)配帶常用字根編碼,字根必須精心篩選。
(4)基本筆畫(huà)與常用字根用中文數(shù)目字對(duì)應(yīng),串成口訣,聯(lián)想記憶。
(5)對(duì)編碼表中沒(méi)有收入的字根,采用按首尾碼規(guī)則拆分處理。
《分類碼》字根總表
《分類碼》字根口訣一橫日工廠,二豎月目門(mén);
三點(diǎn)水寶心,四撇火田皿;
五彎土女士,六勾金廣言;
七草木匕首,八幾人小竹;
九十手串叉,零臼口母圍。
第五節(jié) 單字編碼規(guī)則(1)根據(jù)字根先后次序及有大取大無(wú)大取小的原則,取“一、二、三、尾”碼;遇到前邊部首或偏旁字超過(guò)兩碼時(shí),只需取其首尾碼。例如黃=艸口十八 碼=一口一 電=曰乚 腦=月亠乂凵=7098 =1051 =16 =2696漢=氵又 字=宀了一 春=三人日 雷=一丶田=39 =351 =381 =134科=丿木丶十學(xué)=小
了一技=扌十又術(shù)=木丶=4739 =8251 =999 =73開(kāi)=一廾花=艸亻七結(jié)=ㄥ
士口果=田木=17 =787 =6150 =47熟=孰灬 磨=麻一口 ?。侥? 通=甬之=634 =6710 =789 =5963蛇=蟲(chóng)宀匕 鵡=武丿一 魎=鬼一人 飚=風(fēng)火火=0337 =2341 =4318 =8944型=刑土 警=敬言 影=景丿丿 剃=弟刂=155 =796 =1844 =8425
(2)單字編碼有三個(gè)分道鍵b.n.m.用戶敲完一組正確的號(hào)碼后找不到所需字時(shí),可按這三個(gè)鍵提取,而且越常用的字越置于前面。例如零=0 口=0b 母=0n 臼=0M 回=00 呂=00B九=9 十=9B 串=9n 叉=9M 八=8 人=8N您=883 恣=883B 慫=883n 方=645 鋰=645B(3)高頻字簡(jiǎn)碼為了壓縮碼長(zhǎng),達(dá)到快速輸入的目的,〈分類碼〉除了常規(guī)碼外,對(duì)一百多個(gè)使用頻度較高的漢字附加了簡(jiǎn)碼;簡(jiǎn)碼只取開(kāi)首一個(gè)字根碼,然后分別按字母鍵分道結(jié)束,例如(0)國(guó)=0v 因=0c 圖=0x 別=0z(1)不=1v 是=1c 要=1x 可=1z(2)師=2v 軍=2c 此=2x 無(wú)=2z(3)為=3v 定=3c 活=3x 家=3z(4)的=4v 很=4c 和=4x 象=4z(5)她=5v 那=5c 都=5x 好=5z(6)這=6v 能=6c 被=6x 發(fā)=6z(7)勞=7v 關(guān)=7c 較=7x 劃=7z(8)黨=8v 便=8c 管=8x 常=8z(9)我=9v 存=9c 在=9x 有=9z壹=1f 貳=2f 叁=3f 肆=4f 伍=5f陸=6f 柒=7f 捌=8f 玖=9f 拾=0f
第二章詞組快速分類輸入法第一節(jié) ZXCV常用詞語(yǔ)輸入窗口有些編碼(例如區(qū)位碼或電報(bào)碼),輸入,“科學(xué)”一詞,須按七、八下電腦鍵;輸入“全國(guó)人民代表大會(huì)”則須按幾十下電腦鍵。
有些字母輸入方案,字母對(duì)應(yīng)的字根較多,除難學(xué)難記外,由于字詞同形編碼,按同一空格鍵結(jié)束,互相干擾,詞碼只能間種于字碼的空隙中,因此處理詞匯的能力極有限。
《分類碼》經(jīng)過(guò)多年研究,創(chuàng)立了中文字詞先按數(shù)字鍵編碼,然后按字母鍵分道揚(yáng)鑣結(jié)束的處理技術(shù),至使電腦僅用1-4位數(shù)字號(hào)碼就能處理成千上萬(wàn)的中文詞語(yǔ)。其中字母鍵z.x.c.v屬常用詞輸入窗口,重點(diǎn)用于處理國(guó)標(biāo)五千詞和另外數(shù)千條應(yīng)用較高的詞語(yǔ),其編碼規(guī)則如下(A)雙字詞編碼《頭尾頭尾》,先取這兩個(gè)字首尾碼,再按字母V或C鍵結(jié)束漢字=3931V 編碼=6711V 中文=0269V 信息=8643V面向=1240V 用戶=2930V 精心=823V 文章=6969V黃碼=7811V 電腦=1626V 科學(xué)=4981V 技術(shù)=9973V詞組=6061V 世界=7642V 計(jì)算=6984V 中心=023V(B)三字詞編碼《頭頭頭》,先取這三個(gè)字首碼,再按字母X或Z鍵結(jié)束
廣東?。?78Z 廣州市=636X 加拿大=581Z 多倫多=484X國(guó)務(wù)院=045X 辦公室=583X 生產(chǎn)科=464Z 電焊工=141X馬克思=594X 孫中山=502X 毛澤東=437X 周恩來(lái)=201X美麗的=714X 可愛(ài)的=144X 評(píng)論員=660Z 新技術(shù)=697X(C)三字以上的詞語(yǔ)編碼《頭頭頭…頭》先取一、二、三、尾字首碼,再按字母X或Z鍵結(jié)束廣州日?qǐng)?bào)=6319x 羊城晚報(bào)=7519x 中山大學(xué)=0218x清華大學(xué)=3818x 京粵電腦=6412x 四通電腦=4512x長(zhǎng)城電腦=4512z 漢字編碼=3361x 哈爾濱市=0436x環(huán)境保護(hù)=1589x 聚精會(huì)神=1886z 大有可為=1913x科學(xué)技術(shù)=4897x 法律顧問(wèn)=3412x 港澳同胞=3322x中外合資=0488x 國(guó)家專利局=0320x 電子工業(yè)部=1516x呼和浩特市=0436z 新華通訊社=6856z 為人民服務(wù)=3804x國(guó)家經(jīng)濟(jì)委員會(huì)=0368x 據(jù)不完全統(tǒng)計(jì)=9136x汽車工業(yè)公司=3715x 廣西壯族自治區(qū)=6181x建筑材料工業(yè)局=5870x 新疆維吾爾族=6566x中華全國(guó)總工會(huì)=0888x 中國(guó)農(nóng)業(yè)銀行=0024Z(D)常用詞窗口,有四百組高頻詞簡(jiǎn)碼,方法很簡(jiǎn)單,先取所需前后二字開(kāi)首一碼,然后按字母鍵V.C.X.Z鍵結(jié)束。例如
第二節(jié) QWER自然事物詞語(yǔ)輸入窗口人類是善于思維和善于創(chuàng)造的群體,人類將自身以外的世界通稱為自然界,自然界有日月、星空、山脈、森林、海洋;有動(dòng)物、植物、昆蟲(chóng)、細(xì)菌、火山、洪水和氣候變化等物象……將研究和解釋自然界的各種學(xué)說(shuō)稱為自然科學(xué)。自然科學(xué)包括天文、地理、地質(zhì)、生物、化學(xué)、數(shù)學(xué)、醫(yī)學(xué)……等。
在《分類碼》輸入法中,筆者將上述自然物質(zhì)和有關(guān)學(xué)說(shuō)通稱為自然事物。將處理上述詞語(yǔ)的q.w.e.r窗口稱為自然事物輸入窗口。
編碼時(shí),先按0-9筆形碼,再按字母r.e.w.q鍵結(jié)束,其中r.e二鍵為雙字詞結(jié)束鍵;w.q二鍵為多字詞結(jié)束鍵。編碼方法與常用詞語(yǔ)編碼相同。例如
第三節(jié) TYUI人類事物詞語(yǔ)輸入窗口與自然事物相反,字母TYUI是《分類碼》用作處理人類本身和人類精神產(chǎn)品及物質(zhì)產(chǎn)品的詞語(yǔ)窗口,其中包括人體結(jié)構(gòu),人際關(guān)系,民族文化,宗教信仰,理論學(xué)說(shuō),知名人物;建筑住宅,物質(zhì)產(chǎn)品;哲學(xué),歷史經(jīng)濟(jì),法律,軍事,文學(xué),音樂(lè),舞蹈,體育,藝術(shù)……等方面的主要詞語(yǔ)。其編碼方法與上面窗口相同其中t.y為雙字詞結(jié)束鍵;u.i為多字詞結(jié)束鍵。透過(guò)人類事物窗口,用戶可以找到許多國(guó)標(biāo)沒(méi)有收入的詞語(yǔ)。例如
人類事物詞語(yǔ)窗口也有幾百組簡(jiǎn)碼,例如
第四節(jié) GHJK時(shí)空環(huán)境詞語(yǔ)輸入窗口從哲學(xué)的高度上看,宇宙是由諸多不斷變化發(fā)展著的物質(zhì)組成的,任何物質(zhì)的存在(無(wú)論是人類或者自然物)都離不開(kāi)時(shí)間和空間,呈現(xiàn)在我們眼前的是極其壯觀而又無(wú)比深邃的世界。物質(zhì)無(wú)限!時(shí)間無(wú)限??!空間無(wú)限?。?!我們偉大的祖先用于描述時(shí)間和空間的詞語(yǔ)非常豐富,有宏觀的,有微觀的;有整集的,有局部的;有遙遠(yuǎn)的,有眼前的;時(shí)間方面有光年、時(shí)代、朝代、世紀(jì)、年度、四季、歲月、星期、今天、明天、鐘點(diǎn)、分秒……等等??臻g方面有宇宙、太空、銀河、星際、地球、大陸、國(guó)家、省份、城鎮(zhèn)、區(qū)鄉(xiāng)、廠礦、學(xué)校、科室、桌面、書(shū)中、眼里……等。凡涉及時(shí)間,空間和場(chǎng)地環(huán)境的主要詞語(yǔ)均可在本窗口內(nèi)提取取,編碼規(guī)則與上述窗口相同,結(jié)束鍵是雙字詞按g.h鍵;多字詞按j.k鍵。
通過(guò)上述各窗口,用戶可以看將中文詞匯按詞義分類處理,也是本方案刻金融追求的又一特輯式。茲將本窗口詞組舉例如下時(shí)間=1321g 空間=3121g 宇宙=3539g 光年=8689g星空=1131g 星際=1158g 世紀(jì)=7666g 朝代=9283g歲月=232g 年代=8983g 今年=8589g 明年=1289g本月=712g 上月=212g 中旬=0241g 下旬=1341g前天=7528g 后天=4028g 上午=2189g 下午=1389g這里=6345g 那里=5245g 附近=5343g 對(duì)面=9312g四方=465g 地方=5665g 中央=0228g 城市=5362g鄉(xiāng)村=6473g 山里=2645g 海上=3021g 現(xiàn)在=1695g將來(lái)=8317g 國(guó)家=0338g 政府=1963g 工廠=11g機(jī)關(guān)=7878g 學(xué)校=8179g 商店=6060g 公司=8350g車間=7921g 班組=1561g 床下=6713g 桌上=2721g碗里=1645h 盆中=8402g 路上=0021g 途中=8302g眼里=2845g 心里=345g 桌子上=252j 書(shū)本中=570j我家里=934j 大禮堂=168j 辦公室=583j 中秋節(jié)=047j
星期天=172k 瞬時(shí)間=212j 墨西哥=411j 游泳場(chǎng)=335j很久以前=4467j 我小時(shí)候=9818h 少年時(shí)代=8818j黃金時(shí)代=7618j 末代皇朝=9849j 大江南北=1392j五湖四海=5343j 天涯海角=2334j時(shí)空環(huán)境窗口的詞組也有數(shù)百個(gè)簡(jiǎn)碼,例如時(shí)間=12g 空間=32g 環(huán)境=15g 場(chǎng)地=55g 地方=56g地區(qū)=51g 國(guó)家=03g 邊防=55h 國(guó)界=04g 年度=86g時(shí)代=18g 世紀(jì)=76g 城市=56h 農(nóng)村=27g 長(zhǎng)江=43g黃河=73g 賓館=34g 旅店=66g第五節(jié) LOP用戶自存與企業(yè)管理詞語(yǔ)輸入窗口我國(guó)有十一億人口,有幾千萬(wàn)職工,每人都有自己的名字,各人都有自己的職業(yè),每種職業(yè)都有自己特殊的專業(yè)詞語(yǔ);隨著社會(huì)的發(fā)展,新的詞語(yǔ)還在不斷增生,面對(duì)數(shù)以百萬(wàn)計(jì)的人名和物名,即使配置上幾百兆的電腦,也無(wú)能為力,但是你不必?fù)?dān)心,《分類碼》發(fā)明的字、詞分道揚(yáng)鑣輸入技術(shù),為用戶找到了前所沒(méi)有的理想通道,假如你單位要處理幾千職工的人事檔案;假如你的電腦要對(duì)上萬(wàn)種特殊料材或?qū)I(yè)名詞進(jìn)行分類檢索,有了分類碼就不用再發(fā)愁了。
在《分類碼》方案中,字母鍵LOP作為用戶自存詞語(yǔ)和企業(yè)管理詞語(yǔ)分類輸入窗口,其中“L”屬用戶自造詞組輸入窗口,用戶可根據(jù)各自的需求,存貯和處理本單位專用詞語(yǔ)及職工名單,方法是開(kāi)機(jī)后,先起動(dòng)中文系統(tǒng)和HM回車,再鍵入字母鍵“LOP”回車,根據(jù)屏幕提示,用戶便可進(jìn)行造詞處理。用戶造詞數(shù)量可多達(dá)一萬(wàn)以上,而且還可以隨時(shí)刪改,編碼規(guī)則與其窗口相同。例如,要輸入“李國(guó)華-檔案”二詞,可錄入李國(guó)華=718L 檔案=7237L字母鍵“OP”用于機(jī)關(guān)、廠礦、商業(yè)、銀行、海關(guān)、稅務(wù)、會(huì)計(jì)、出納等詞,其結(jié)束鍵一律先取O后取P。
〈1〉高頻詞碼,舉例企業(yè)=88O 管理=81O 工資=18O 報(bào)表=99O 會(huì)計(jì)=86O出納=66O 銀行=64O 帳號(hào)=20O 投資=98O 金額=63P成本=17O 核算=78P 五金=56O 產(chǎn)品=60O 商品=60P工人=18O 收入=64P 支出=96O 合同=82O 預(yù)算=58O支票=91O 匯票=31O 材料=78O 規(guī)格=27O〈2〉全詞碼,舉例郵匯=0236O 零件=089O 噸位=0687O 原料=1889O成品=1300O 股份=2984O 盧布=2492O 定額=3838O利息=4543O 利率=4569O 超支=5099O 赤字=5831O庫(kù)存=6991O 保險(xiǎn)=8751O 索賠=9820O 中藥房=073O口腔科=024O 工商稅=164O 吞吐量=201O 測(cè)檢員=370O所得稅=444O 退休金=186O 經(jīng)手人=698O 公關(guān)部=876O中小修理=0881O 工商管理=1681O 農(nóng)業(yè)銀行=2864O恒生指數(shù)=3189O 生產(chǎn)計(jì)劃=4667O 生產(chǎn)費(fèi)用=4652O超級(jí)市場(chǎng)=5665O 原始數(shù)據(jù)=1589O 證券交易=6861O
商標(biāo)注冊(cè)=6732O 轉(zhuǎn)口貿(mào)易=7041O 保險(xiǎn)公司=8585O工商所得稅=1644O 勞動(dòng)服務(wù)公司=7225O 會(huì)計(jì)師事務(wù)所=8624O第六節(jié) ASDF其它詞語(yǔ)輸入窗口其它詞語(yǔ)包括通常使用的動(dòng)詞、形容詞、數(shù)量詞、感嘆詞、助詞和成語(yǔ)等詞類。動(dòng)詞方面,諸如歡呼、吶喊、微笑、鼓掌、玩弄、眨眼、奔跑等;形容詞方面,諸如美麗、可愛(ài)、天真、冷淡、傲慢、美麗的、可愛(ài)的、認(rèn)真的、吝嗇的、靜悄悄的等;數(shù)量詞方面,諸如公尺、公里、華里、毫米、壹貳叁肆伍陸柒捌玖拾、斤兩噸、元角分、十八、二十八、三十八等;感嘆詞方面,諸如哎呀、咿呀、哈哈、嘿嘿等;助詞方面,諸如可是、可能、但是、應(yīng)該、也許、必然、或者、很可能、不可能、不必要、當(dāng)然是等;成語(yǔ)方面,諸如躡手躡腳、大聲疾呼、閉目養(yǎng)神、杯弓蛇影、三思而行、隔岸觀火、席地而坐、笨鳥(niǎo)先飛、十里長(zhǎng)亭、入木三分等。
本窗口編碼方法同上,其中FD為雙字詞結(jié)束鍵;SA為多字詞結(jié)束鍵;數(shù)量詞結(jié)束鍵一律用F。舉例如下壹=1F 貳=2F 叁=3F 肆=4F 伍=5F 陸=6F 柒=7F 捌=8F 玖=9F 拾=0F 噸=0D 角=4D 十二=12F 十三=13F 八十=80F 九十九=99F光榮=8677F 偉大=8518F 美麗=7813F 可愛(ài)=1549F漂亮=3868F 丑怪=5535F 歡呼=9809F 鼓舞=5989F睡覺(jué)=2586F 起床=5667F 公里=8345F 公升=8347F
非常=2382F 細(xì)心=643F 瀏覽=3526F聰明的=114S 愚蠢的=434S 喝倒彩=084S 很美麗=471S很認(rèn)真=469S 有道理=871S 不一定=113S 既然是=121S一定是=131A 真高興=968S 慢慢地=335S 悄悄地=335S靜靜地=995S 吹牛皮=045S 喝倒彩=084S跚跚來(lái)遲=0010S 正襟危坐=1648S 悲歡離合=2968S定神觀望=3696S 愛(ài)不釋手=4149S 盡收眼底=0626S飛檐走壁=6750S 兒女情長(zhǎng)=4534S 輾轉(zhuǎn)反側(cè)=7748S光彩奪目=8412S 人才濟(jì)濟(jì)=8933S 人杰地靈=8755S盡收眼底=0626S飛檐走壁=6750S 兒女情長(zhǎng)=4534S 輾轉(zhuǎn)反側(cè)=7748S光彩奪目=8412S 人才濟(jì)濟(jì)=8933S 人杰地靈=8755S光彩奪目=8412S 人才濟(jì)濟(jì)=8933S 人杰地靈=8755S
權(quán)利要求
1.<中文1-4位數(shù)字快速分類輸入法>簡(jiǎn)稱<分類碼>;本發(fā)明既是一種新穎的漢字編碼,也是一種功能獨(dú)特的中文電腦處理系統(tǒng),本系統(tǒng)除了配備通常系統(tǒng)必需的存儲(chǔ)器,顯示器,輸出系列等部件外,其主要技術(shù)特征是電腦終端機(jī)通用鍵盤(pán)上的數(shù)字鍵和字母鍵與<分類碼>設(shè)計(jì)的中文字、詞對(duì)照表相適應(yīng);根據(jù)<分類碼>中字、詞分道揚(yáng)鑣的處理技術(shù)進(jìn)行編碼輸入電腦0--9屬中文字符鍵,A--Z屬字、詞分道揚(yáng)鑣結(jié)束鍵,有諸種內(nèi)容不同的詞語(yǔ)輸入窗口。0--9鍵上的中文字根,用中文(零--九)串成口訣,攜帶記憶。字、詞數(shù)字編碼,碼長(zhǎng)1--4碼,按照上述方法,同一短小的號(hào)碼,可同時(shí)處理幾個(gè)乃至幾十個(gè)不同的字、詞信息,此外,<分類碼>首次提出了“偏旁字取首尾”的宏觀壓縮編碼新技術(shù),以及“詞組分類編碼”技術(shù)。
2.根據(jù)權(quán)利要求1,〈分類碼〉數(shù)字鍵上的字根,可隨時(shí)調(diào)整,使其更為簡(jiǎn)易合理。
3.根據(jù)權(quán)利要求1,〈分類碼〉字母鍵上的鍵位,概括了說(shuō)明書(shū)中所介紹的各種詞語(yǔ)窗口。
4.根據(jù)權(quán)利要求1,〈分類碼〉可用同樣的方式處理繁體字和國(guó)標(biāo)字符集外字符。
5.根據(jù)權(quán)利要求1,〈分類碼〉字形編碼方案特點(diǎn)是數(shù)字號(hào)碼在前,字母結(jié)束鍵在后,因此,〈分類碼〉對(duì)拼音輸入碼無(wú)需任何轉(zhuǎn)換就可以同時(shí)兼容,使本系統(tǒng)成為處理中文能力特強(qiáng)的,方法比較簡(jiǎn)易的多功能電腦系統(tǒng)。
6.根據(jù)權(quán)利要求1,〈分類碼〉中文系統(tǒng),不僅可以做成軟磁盤(pán),漢卡;還能研制成功能獨(dú)特的專用電腦。
全文摘要
本發(fā)明,(中文1-4位數(shù)字快速分類輸入法)簡(jiǎn)稱(分類碼)是目前世界上數(shù)字號(hào)碼最短、處理中文詞語(yǔ)最多的中文電腦輸入方案,已在AST電腦試驗(yàn)成功,并研制出適用于各中文電腦系統(tǒng)使用的軟件,已進(jìn)入實(shí)用階段。方案的特點(diǎn)是(1)中文數(shù)目字和常用字根對(duì)應(yīng)0-9鍵位,串成口訣,方便聯(lián)系記憶。(2)取碼方式新穎、宏觀;方法易學(xué)易快;號(hào)碼較短。(3)字詞同形編碼,然后按字母鍵分道揚(yáng)鑣結(jié)束。(4)1-4位數(shù)字編碼,可同時(shí)處理繁、簡(jiǎn)兩種漢字。(5)根據(jù)不同字母分道揚(yáng)鑣技術(shù),可處理數(shù)以萬(wàn)計(jì)的各種專業(yè)詞語(yǔ)。
文檔編號(hào)G06F3/023GK1058661SQ90106610
公開(kāi)日1992年2月12日 申請(qǐng)日期1990年8月2日 優(yōu)先權(quán)日1990年8月2日
發(fā)明者黃宗炯 申請(qǐng)人:黃宗炯