亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種編碼部件和表形部件一致的漢字編碼法的制作方法

文檔序號(hào):6603753閱讀:480來源:國知局
專利名稱:一種編碼部件和表形部件一致的漢字編碼法的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)中文信息處理,特別是一種編碼部件和表形部件一致的漢字編碼法。
目前,關(guān)于漢字編碼的方案已研制出千余種,共分三類,即形碼、音碼和音形碼(含形音碼)。其中形碼最多,形碼共具的優(yōu)點(diǎn)是輸入速度快,不足之處是難學(xué)易忘,很難實(shí)現(xiàn)與中小學(xué)識(shí)字教育相結(jié)合,或多或少存在不規(guī)范的問題。1996年第2期中文信息雜志的本刊專訊--《規(guī)范碼及規(guī)范化大綱面世》一文指出‘一些不規(guī)范的方案對(duì)祖國語言文字形成了或多或少的“污染”,對(duì)中小學(xué)識(shí)字教育產(chǎn)生一定的干擾。.......中文信息學(xué)會(huì)意識(shí)到這一問題地嚴(yán)重性,希望開展規(guī)范化的漢字編碼及計(jì)算機(jī)漢字輸入系統(tǒng)的研究’。
漢字形碼(含音形碼和形音碼)能與中小學(xué)識(shí)字教育結(jié)合的必備條件是除識(shí)別碼外,每個(gè)漢字的輸入部件都和表形部件相同。目前,已推廣使用的形碼(含音形碼和形音碼)沒有一種能與中小學(xué)識(shí)字教育很好結(jié)合的根本原因在于只取漢字的一部份表形部件作為編碼部件給漢字編碼。這種做法的最大缺點(diǎn)在于那些含表形部件不是編碼部件的漢字(如五筆字型中含非基本字根的漢字),機(jī)寫字和規(guī)范字的差別大且其差別難以用簡單且易掌握的規(guī)律確定,使用者很難用規(guī)范字書寫知識(shí)去把握機(jī)寫字寫法,因此,難使識(shí)字、寫字、查字、打字四者結(jié)合,即難實(shí)現(xiàn)中小學(xué)識(shí)字教育與漢字輸入電腦教育相結(jié)合。此外,用機(jī)寫字和規(guī)范字差別大的編碼方案解決計(jì)算機(jī)漢字輸入問題不利于中文信息處理中的語言文字規(guī)范化、標(biāo)準(zhǔn)化。只用一部分表形部件給漢字編碼存在的另一較大缺點(diǎn)是,這種做法要求使用者必須死死記準(zhǔn)哪些部件能參加編碼,哪些不能,不能的如何外理,否則拆字編碼就不能順利進(jìn)行。這么做不僅增加了拆字編碼的思維難度,也增大了掌握編碼方法所花的記憶量,是現(xiàn)有行碼方案難學(xué)易忘的主要原因之一。另外,現(xiàn)有形碼方案還不同程度的存在著拆字不規(guī)范,編碼部件鍵位安排規(guī)律性不強(qiáng)、記憶方法不夠合理等不足之處。
本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)中的不足,提供一種易于實(shí)現(xiàn)與中小學(xué)識(shí)字教育相結(jié)合的、拆字編碼規(guī)范的兼有讓計(jì)算機(jī)提供漢字部件構(gòu)字信息、字音信息和漢字使用頻度信息的、編碼部件和表形部件一致的漢字編碼輸入法。
本發(fā)明是這樣實(shí)現(xiàn)的
(1)把按指定拆分規(guī)則拆規(guī)范漢字所得的全部表形部件按某確定字形信息或字音信息歸類。(2)把具有同一確定字形信息或字音信息的部件放在同一鍵上(一個(gè)鍵上可以放一種或數(shù)種各具相同信息的部件)并配以適當(dāng)?shù)淖R(shí)別碼給漢字編碼,找出取簡碼后產(chǎn)生重碼數(shù)量多累計(jì)使用頻度高的部件。(3)將步驟(2)中找出的取簡碼后產(chǎn)生重碼數(shù)量多累計(jì)使用頻度高的部件調(diào)到取簡碼后產(chǎn)生重碼數(shù)量少,累計(jì)使用頻度低的鍵上。得到取簡碼后重碼數(shù)量少累計(jì)使用頻度低的編碼。
沒有調(diào)動(dòng)鍵位的部件叫一般部件,這種部件數(shù)量很多,其鍵位能用部件具有的某字形信息或字音信息確定,調(diào)動(dòng)鍵位的部件叫定位部件,這種部件不多,其鍵位用部件所在鍵位的坐標(biāo)確定。
本發(fā)明改變了現(xiàn)行形碼(含音形碼)只取漢字的一部份表形部件給漢字編碼的傳統(tǒng)做法、改變了現(xiàn)行形碼慣用的漢字拆分辦法及輸入部件的鍵位安排和記憶辦法。使按指定拆分規(guī)則拆每個(gè)規(guī)范漢字所得表形部件個(gè)個(gè)都能一筆不變就可參加編碼,和現(xiàn)行形碼相比,在以下七個(gè)方面有不同。
一、拆字編碼思維難度小,易使中小學(xué)識(shí)字教育與漢字輸入電腦教育相結(jié)合。用本發(fā)明的編碼法給漢字編碼,除識(shí)別碼外每個(gè)漢字的編碼部件都和表形部件相同,機(jī)寫字和規(guī)范字的差別僅在編碼部件不足者只要按編碼規(guī)則加識(shí)別碼即可。使用者容易用規(guī)范漢字書寫知識(shí)把握機(jī)寫漢字的寫法,易實(shí)現(xiàn)識(shí)字、寫字、查字、打字四者融合。
二、花記憶量小且有利于規(guī)范漢字的推廣使用。因按指定拆分規(guī)則拆規(guī)范漢字所得表形部件個(gè)個(gè)都能一筆不變就可參加編碼且部件選取按規(guī)范字書寫規(guī)律進(jìn)行,掌握本法必須先掌握規(guī)范漢字的寫法,所以掌握本法和掌握規(guī)范字寫法能緊密聯(lián)系,這么做有利于規(guī)范漢字的推廣使用。掌握本法,使用者不須死記哪些部件能參加編碼,哪些不能,不能的怎么辦,要緊的是會(huì)寫規(guī)范字、記得并會(huì)用本法的漢字拆分原則,能將所輸漢字的規(guī)范字拆為該漢字的編碼部件。所用部件的鍵位絕大多數(shù)能用部件所具字形信息或字音信息確定,須死記鍵位的定位部件量少常用易記,因此掌握本法花的記憶量能減小。
三、取簡碼后大量識(shí)別碼被取消,簡碼字和規(guī)范字的差別也小,輸入部件少于表形部件的漢字少了的部份一律少在最后。使用者容易記住自己常用漢字的簡碼字。
四、本編碼法的漢字部件結(jié)構(gòu)庫是天然的漢字結(jié)構(gòu)信息庫,能讓計(jì)算機(jī)解決漢字部件構(gòu)字信息的提供問題,用本編碼法建立的漢字輸入系統(tǒng)有讓計(jì)算機(jī)快速準(zhǔn)確提供漢字部件構(gòu)字信息、拼音信息和字頻信息的功能,給使用者(特別是中小學(xué)語文教師和有關(guān)研究人員)了解含任意指定字形信息或字音信息的漢字情況及解決有關(guān)語言文字規(guī)范化方面的問題帶來方便。
五、本編碼法的漢字部件結(jié)構(gòu)庫是天然的漢字結(jié)構(gòu)信息庫,可開發(fā)出能讓計(jì)算機(jī)快速準(zhǔn)確提供漢字部件構(gòu)字信息,拼音信息和漢字使用頻度信息的編碼研制軟件,反應(yīng)編碼質(zhì)量的統(tǒng)計(jì)數(shù)據(jù)能用計(jì)算機(jī)提供,編碼質(zhì)量評(píng)側(cè)能用計(jì)算機(jī)進(jìn)行。
六、用本編碼法所得編碼解決漢字輸入問題易實(shí)現(xiàn)識(shí)字、寫字、查字、打字四者結(jié)合,因此本編碼也能用于解決字(詞)典和其它工具書(包括電腦字詞典和工具書)的漢字和漢字詞語的索引問題,也可用于給繁體字編碼。
七、用本編碼法給漢字編碼,漢字分為單部件字、二部件字、三部件字、四部件字四種,給每種字設(shè)一個(gè)識(shí)別碼,能增加簡碼空間,使一級(jí)簡碼字和二級(jí)簡碼字的數(shù)量與使用頻度顯著增加,使取簡碼后的重碼字?jǐn)?shù)量和使用頻度減少,給要求快速輸入漢字的使用者提供方便。
用編碼部件和表形部件一致的漢字編碼方法給漢字編碼,方法靈活。具體表現(xiàn)在用鍵數(shù)量可多可少,25--40鍵都行(少用鍵就得適當(dāng)多用定位部件);給每個(gè)漢字編碼用的編碼部件(字形信息或字音信息)的數(shù)量也可多可少;可以用等長碼也可以用不等長碼;確定一般部件鍵位的信息可以是字形信息也可以音形混合使用(有名稱者用部件的音信息、無名稱者用部件的字形信息或規(guī)定的音信息);用字形信息給漢字編碼時(shí),確定一般部件鍵位的字形信息可以是部件的起筆筆形和筆畫數(shù),也可以是部件的一二筆筆形或首尾筆筆形等;識(shí)別碼的選用可用字形信息,也可用字音信息;用字形信息作識(shí)別碼時(shí),識(shí)別碼的鍵位可用指定部件的指定筆畫和指定筆畫與指定部件的其它筆畫間的關(guān)系定,也可用其它字形信息定;定位部件的用量可多可少,在編碼所用鍵位數(shù)量和碼長相同的情況下,對(duì)同一辦法適當(dāng)多用定位部件可在平均每字擊鍵次數(shù)(靜態(tài)字平均碼長)達(dá)同一指標(biāo)的前提下使重碼字?jǐn)?shù)量和重碼字的累計(jì)使用頻度減?。蝗『喆a也隨要達(dá)到的目的不同而可有所差別,部份定位部件的選取和鍵位安排也可根據(jù)不同要求而有變動(dòng)。運(yùn)用本發(fā)明開發(fā)得到的相應(yīng)編碼研制軟件研制漢字編碼,每個(gè)方案設(shè)計(jì)者都容易根據(jù)漢字結(jié)構(gòu)實(shí)際和應(yīng)用實(shí)際的需要對(duì)方案中的做法進(jìn)行調(diào)整。
以下結(jié)合實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳述
取30鍵用起筆筆形和筆畫數(shù)確定一般部件的鍵位并用四個(gè)編碼部件給漢字編碼時(shí),可取計(jì)算機(jī)主鍵盤上的以下三十個(gè)字符鍵給漢字編碼。它們是Q、W、E、R、T;Y、U、I、O、P;A、S、D、F、G;H、J、K、L、;Z、X、C、V、B;N、M、<、>、?。此30鍵分六行十列,自左至右,左五列的列碼依次記為4、3、2、1、0;右五列的列碼依次記為0、1、2、3、4;自下而上,左三行的行碼依次記為3、1、5;右三行的行碼依次記為4、2、6。列碼為m行碼為n的鍵記為mn鍵,安排在該鍵上的編碼部件的碼值為mn。如B、N、G、H、T、Y六鍵的列碼都為0,它們所在之行的行碼依次為3、4、1、2、5、6,因此它們的鍵位碼依次記為03、04、01、02、05、06。其余各字符鍵的鍵位碼見表1(取30鍵用起筆筆形和筆畫數(shù)確定一般部件的鍵位時(shí),定位部件、一般部件及筆畫識(shí)別碼的一種安排情況表)。表1定位部件、一般部件及筆畫識(shí)別碼的安排情況表
←鍵帽字符 說明一般部件標(biāo)志中,
②表←鍵位碼 示折起筆二畫的一般部件、
⑤表示←定位部件 折起筆五畫的一般部件、
⑥表示折←一般部件標(biāo)志 起筆六畫和六畫以上的一般部件,余←筆畫識(shí)別碼標(biāo)志 類推。筆畫識(shí)別碼標(biāo)志見說明書第9頁。漢字拆分原則、部件鍵位碼確定辦法、識(shí)別碼確定辦法及編碼規(guī)則分別說明如下。
1、漢字拆分原則
本發(fā)明的漢字拆分原則是根據(jù)漢字結(jié)構(gòu)特點(diǎn)及用本發(fā)明開發(fā)得到的漢字編碼研制軟件提供的漢字部件構(gòu)字信息,本著結(jié)合實(shí)際、方便應(yīng)用和有利于輸入速度提高的原則進(jìn)行制定的。在正式敘述漢字拆分原則前,先對(duì)所用幾個(gè)術(shù)語的含義進(jìn)行說明。
部件漢字中可通過不拆相交筆畫得到的有一定搭配關(guān)系的筆畫結(jié)構(gòu)叫漢字的部件。同含于兩個(gè)或兩個(gè)以上漢字的部件叫該兩個(gè)或兩個(gè)以上漢字的公部件,只含于一個(gè)漢字之中的部件叫孤立部件(公部件和孤立部件統(tǒng)稱部件)。
最大公部件能按書寫順序從兩個(gè)或兩個(gè)以上規(guī)范漢字的相同部位中通過不拆相交筆畫得到的最大筆畫集合叫該兩個(gè)或兩個(gè)以上漢字的最大公部件,如都、煮、翥能從字首通過不拆相交筆畫拆出的最大筆畫組合是“者”,者是它們的最大公部件;此外者也是諸、著、暑、署、堵、睹、賭等字的最大公部件。亮、亭、毫、膏、豪、毫等六字能從字首通過不拆相交筆畫拆得的最大筆畫集合是“
”,
是以上各字的最大公部件件。
自然塊在有明顯相離關(guān)系的筆畫結(jié)構(gòu)(漢字部件)構(gòu)成的漢字中,每一與其他筆畫結(jié)構(gòu)有相離關(guān)系的筆畫結(jié)構(gòu)都叫該漢字的一個(gè)自然塊。為簡化問題的解決,漢字中的最大成字只算一個(gè)自然塊。如茍、敬、警三字都是二自然塊字。在茍字中,艸和句各為一個(gè)自然塊。敬字中,茍和攵各為一個(gè)自然塊,警字中敬和言各為一個(gè)自然塊。又如亭、毫、豪、毫四字是四自然塊字,膏是五自然塊字,亮是三自然塊字(其中冗是一個(gè)自然塊)。
一般部件的鍵位用漢字的字形信息確定且每字都以四個(gè)字形信息進(jìn)行編碼的漢字拆分的基本原則是
用規(guī)范字拆、按自然塊分、拆分不拆交,每字最多只拆四個(gè)部件。不足四個(gè)者,有滿足條件的相連關(guān)系也可拆,達(dá)到或超過四個(gè)自然塊的漢字要按滿足拆四個(gè)部件的條件進(jìn)行拆并,使其得到3-4個(gè)部件。無論“拆”還是“并”都要注意,要按規(guī)范漢字的書寫規(guī)律拆并,要兼顧漢字的間架結(jié)構(gòu),不要使字體顯得零亂;兼顧成字優(yōu)先、定位部件優(yōu)先、拆相同部件優(yōu)先、拆在后的自然塊優(yōu)先,只含于一個(gè)漢字的孤立部件一般不拆。除規(guī)范字書寫中允許的筆形變化(如土作左偏旁時(shí)末筆橫改提,木作左偏旁時(shí)未筆捺改點(diǎn)等規(guī)定)外,任一漢字拆成幾個(gè)部件后,不僅筆形不變,總筆畫數(shù)也不變。如曹只拆
日,不拆一冂
日;張只拆弓長,不拆弓丿
;攀拆木爻木
,不拆林爻大手;亥只拆
人,不拆亠∠丿人;襻拆衤
大手,不拆衤
;兆只拆
,不拆
兒。
除此基本原則外,根據(jù)漢字特點(diǎn),為離散編碼,方便記憶和掌握,對(duì)一般漢字,還有以下三條規(guī)定。
1)為首的三個(gè)部件一般不能構(gòu)成小于該漢字的最大成字及小于該漢字與其它漢字共有的最大公部件。
如警只拆茍攵言,不拆艸句攵言;磨只拆廣林口,不拆廣木木石; 亮只拆
冖幾,不拆亠口冖幾;都只拆
日阝,不拆十
日阝;
游拆氵方子,漩拆氵方疋(兼顧間架結(jié)構(gòu),作特殊處理)。
2)對(duì)有2個(gè)自然塊的漢字,一般情況下,當(dāng)后一自然塊能拆三個(gè)部件時(shí),前一自然塊不拆,拆后一自然塊為三部件,得四部件;當(dāng)后一自然塊能拆二部件時(shí),若前一自然塊能拆首部件是非單筆部件的兩個(gè)部件,則首尾各拆兩個(gè)部件得四部件,否則前一自然塊不拆,只取三個(gè)部件;當(dāng)后一自然塊不能拆時(shí),只要前一自然塊可拆,一般拆前一自然塊為兩個(gè)部件,得三個(gè)部件。如矮拆矢丿木女,不拆大禾女;豁拆害八人口,不拆

口;搞拆扌
冂口,不拆扌亠口
;禁拆木木二小,不拆木木一
潮拆氵十早月,不拆氵
十月;淡拆氵火火,不拆氵火丷人;稱拆禾
小,不拆丿木
小;和拆丿木口,不拆禾口;
頌拆八厶貝,不拆公冂人(首塊可拆的二自然塊字中“頁”拆貝為特定)。
3)對(duì)有3個(gè)可拆自然塊的漢字,一般按成字優(yōu)先、定位優(yōu)先、拆相同部件優(yōu)先、拆后優(yōu)先(拆在后的自然塊優(yōu)先)、拆同碼部件優(yōu)先等原則考慮拆分。如蓖拆艸囟
匕,不拆艸丿
比;攙拆扌免丶丶,不拆扌ク
;岸拆山廠一十,不拆丨凵廠干;澈拆氵
攵,不拆氵育乂;粱拆氵刅丷木,不拆氵刀
米;敷拆甫方乂,不拆甫丶萬攵;嘉拆吉力口,不拆士口加;掇拆扌又又雙,不拆扌雙又又;另有少數(shù)特殊拆分的漢字拆分情況這里不再細(xì)述。
2、部件鍵位碼的確定
(1)、定位部件的鍵位碼的確定
定位部件的鍵位碼等于該定位部件所定之鍵的鍵位碼,表1給出了一種用30鍵取每個(gè)漢字的四個(gè)字形信息作編碼部件給漢字編碼,以筆畫信息作識(shí)別碼并將所有折筆的列碼定為0時(shí)使用的19個(gè)定位部件,此表中點(diǎn)起筆的定位部件最少,只有“氵”一個(gè),定在D鍵,鍵位碼是21;豎起筆的定位部件有“口”和“日”兩個(gè),口定在A鍵,鍵位碼是41;日定在H鍵,鍵位碼是02;其余定位部件所在鍵位及鍵位碼詳見表1(就目前所得結(jié)果而言,只取空格鍵作結(jié)束碼,用表1給出的19個(gè)定位部件給GB2312(80)的6763個(gè)漢字編碼時(shí),取簡碼后可使重碼字總數(shù)小于35組,累計(jì)使用頻度小于百分之0.01)。
(2)、一般部件鍵位碼的確定
用部件的起筆筆形和筆畫數(shù)確定一般部件的鍵位時(shí),一般部件的列碼和行碼分別由部件的起筆筆形和筆畫數(shù)定。這里就表1的安排進(jìn)行說明,用表1中的定位部件給漢字編碼時(shí),一般部件的列碼取法為折0、橫1、點(diǎn)2、撇3、豎4(其中折含所有折筆)。一般部件的行碼由部件的筆畫數(shù)定。具體規(guī)定是五畫和不足五畫的一般部件,鍵位碼的行碼數(shù)等于部件的筆畫數(shù)。六畫與六畫以上的一般部件,鍵位碼的行碼一律為6。如子、習(xí)、飛、女、鄉(xiāng)、小等部件都是折起筆(列碼都為0),都有3畫(行碼都為3),它們的鍵位碼都為03;干、亍、
、工、大、萬、才、寸等部件都是橫起筆(列碼都為1),都有3畫(行碼都為3),它們的鍵位碼都是13;言、辛、
米、享、良、京、鹿等部件都是點(diǎn)起筆(列碼都為2)筆畫數(shù)都達(dá)到或超過6畫(行碼都為6),它們的鍵位碼都為26;長、升、手、勿、月等部件都是撇起筆(列碼都為3),都有4畫(行碼都為4),它們的鍵位碼都是34;業(yè)、申、目、由、田、冉、皿等部件都是豎起筆(列碼都為4),都有5畫(行碼都為5),它們的鍵位碼都為45。
3、識(shí)別碼的確定
用漢字的四個(gè)字形信息作編碼部件給漢字編碼時(shí),對(duì)不足四個(gè)部件的漢字,要根據(jù)編碼規(guī)則,增加識(shí)別碼。用指定筆畫信息作識(shí)別碼并用簡碼進(jìn)行輸入時(shí),識(shí)別碼的添加規(guī)定是單部件字連加三個(gè)相同的識(shí)別碼,二部件字連加兩個(gè)相同的識(shí)別碼,三部件字加一個(gè)識(shí)別碼。當(dāng)末部件是單筆部件時(shí),識(shí)別碼就取單筆部件碼;當(dāng)末部件不為單筆部件時(shí),識(shí)別碼的列碼由末部件的末筆筆形確定,行碼由末部件的未筆與末部件的其它筆畫的關(guān)系定。使用表1中的定位部件時(shí),識(shí)別碼的列碼規(guī)定是折(フ)0、橫(一)1、點(diǎn)(丶)2、撇(丿)3、豎(丨)4(其中橫含提、點(diǎn)含捺、折含所有折筆);識(shí)別碼的行碼規(guī)定是分筆為3,交筆為5,單連筆為2,雙連筆為4,多連筆為6,點(diǎn)無雙連筆和多連筆,規(guī)定位于框和半框內(nèi)的點(diǎn)筆行碼為4。
分筆指部件中與其它筆畫有明顯相離關(guān)系的筆畫。如寸、小、心、必等部件的末筆都是點(diǎn)(列碼都為2)與其它筆畫都有明顯相離關(guān)系(行碼都為3),它們的筆畫識(shí)別碼的鍵位碼是23;
交筆指部件中與其它筆畫有明顯相交關(guān)系的筆畫,如車、豐、開、韋等部件的末筆都是豎(列碼為4)都與其它筆畫有相交關(guān)系(行碼為5),它們的筆畫識(shí)別碼的鍵位碼是45。
單連筆指部件中與其它筆畫只在某一點(diǎn)處有不為相交關(guān)系的接觸點(diǎn)的筆畫,如刀、才、犭、鄉(xiāng)、勿等部件的末筆都是撇(列碼為3),與部件中的其它筆畫都只在一個(gè)點(diǎn)處有不為相交關(guān)系的接觸(行碼為2),它們的筆畫識(shí)別碼的鍵位碼都是32;
雙連筆指部件中與其它筆畫在兩個(gè)不同點(diǎn)處有不為相交關(guān)系的接觸的筆畫,例如口、日、業(yè)、
月等部件的末筆都是橫(列碼都為1)與部件中的其它筆畫都在兩個(gè)不同點(diǎn)處有不為交的接觸(行碼都為4),它們的筆畫識(shí)別碼的鍵位碼都是14;
多連筆指部件中與其它筆畫在三個(gè)或三個(gè)以上不同點(diǎn)處有不為交的接觸的筆畫,如由、田、皿、等部件的末筆都是橫(列碼都為1),與其它筆畫都在三個(gè)或三個(gè)以上不同點(diǎn)處有不為交的接觸(行碼為6),它們的筆畫識(shí)別碼的鍵位碼為16。部件勺、兩、雨、瓦、舟、母等的末筆都是點(diǎn)(列碼為2),都在框和半框內(nèi)(行碼都為4),它們的筆畫識(shí)別碼的鍵位碼是24。
為便于檢查識(shí)別,在下邊敘述筆畫識(shí)別碼的編碼規(guī)則時(shí),將末筆筆畫為
(所有折)、一(含提)、丶(含捺)、丿(撇)、丨(豎)的分筆依次表為
;交筆依次表為
單連筆依次表為
;雙連筆依次表為
;多連筆依次表為
4、編碼規(guī)則
用漢字的四個(gè)字形信息給漢字編碼,取指定部件的指定筆畫信息作識(shí)別碼并用簡碼進(jìn)行輸入時(shí)的編碼規(guī)則
(一)單部件字部件碼+識(shí)別碼+識(shí)別碼+識(shí)別碼(二)二部件字首部件碼+尾部件碼+識(shí)別碼+識(shí)別碼(三)三部件字首部件碼+中部件碼+尾部件碼+識(shí)別碼(四)四部件字首部件碼+二部件碼+三部件碼+四部件碼例(一)單部件字(1)單筆單部件字一 -- 一 一 一 11 11 11 11;乙 -- 乙 乙 乙 乙 03 03 03 03。(2)二筆與二筆以上的單部件字民 -- 民
05 05 05 05;禹 -- 禹
36 24 24 24;事 -- 事
16 05 05 05;飛 -- 飛
03 22 22 22。(二)二部件字(1)末部件是單筆部件的二部件字
丕 -- 不 一 一 一 14 11 11 11;勺 -- 勹丶丶丶 32 21 21 21;
札 -- 木    06 01 01 01;尺 -- 尸 03 21 21 21。(2)末部件是二筆或二筆以上的二部件字
即 --

05 02 44 44;那 --

04 02 44 44 ;
每 --  母
32 05 24 24;射 -- 身 寸
36 13 23 23。(三)三部件字(1)末部件是單筆部件的三部件字
誠 -- 讠戊
22 15 01 01;矛 --
丿丿02 02 31 31;
鈔 -- 钅
丿丿31 43 31 31;查 -- 木 日 一 一 06 02 11 11。(2)末部件是二筆或二筆以上的三部件字
漲 -- 氵弓長
21 04 34 22;弊 --
攵 廾
46 34 13 45;
槽 -- 本

06 16 02 14;雅 -- 牙 亻
14 01 26 12。(四)四部件字
舞 -- 

32 16 33 13;暨 --
日 一 05 14 02 11;
藏 -- 艸

11 16 12 44;寡 -- 宀
八 刀 23 16 32 02。
上例中,給含表1所示定位部件的漢字編碼時(shí),定位部件的鍵位碼就按表1中的規(guī)定取。
對(duì)編碼占用著的標(biāo)點(diǎn)符號(hào)鍵上的標(biāo)點(diǎn)符號(hào),其輸入問題用方便記憶和擊鍵的編碼解決。
漢字頻度取自山東教育出版社出版高更生等編《現(xiàn)代漢語知識(shí)大詞典》。
權(quán)利要求
1、一種編碼部件和表形部件一致的漢字編碼法,其特征在于除識(shí)別碼外,每個(gè)漢字的編碼部件都和該漢字的表形部件相同。
2、根據(jù)權(quán)利要求1所述的編碼法,其特征在于將按指定拆分規(guī)則拆規(guī)范漢字所得的全部表形部件分為一般部件和與輸入鍵盤鍵位相結(jié)合的定位部件。
3、根據(jù)權(quán)利要求1或2所述的編碼法,其特征在于一般部件的鍵位用各部件所具有的字形信息或字音信息確定,定位部件的鍵位由部件所定鍵位的坐標(biāo)確定。
4、根據(jù)權(quán)利要求1所述的編碼法,其特征在于限定每個(gè)漢字最多能拆的部件數(shù)不能超過給每個(gè)漢字編碼的字形信息數(shù)或字音信息數(shù)。
5、根據(jù)權(quán)利要求1所述的編碼法,其特征在于識(shí)別碼取為字形信息時(shí),識(shí)別碼的鍵位用指定部件的指定筆畫和該指定筆畫與指定部件的其它筆畫間的關(guān)系確定。
6、根據(jù)權(quán)利要求1所述的編碼法,其特征在于對(duì)須加兩個(gè)和兩個(gè)以上識(shí)別碼的漢字,給同一漢字所加的各識(shí)別碼是相同的識(shí)別碼。
7、根據(jù)權(quán)利要求1所述的編碼法,其特征在于使計(jì)算機(jī)有提供漢字部件構(gòu)字信息、拼音信息和漢字使用頻度信息的功能。
全文摘要
本發(fā)明是一種編碼部件和表形部件一致的漢字編碼法,其特征在于除識(shí)別碼外,每個(gè)漢字的編碼部件都和該漢字的表形部件相同。將按指定拆分規(guī)則拆規(guī)范漢字所得的全部表形間件分為一般部件和與輸入鍵盤鍵位相結(jié)合的定位部件。本發(fā)明改變了現(xiàn)行形碼(含音形碼)只取漢字的一部分表形部件給漢字編碼的傳統(tǒng)做法,改變了現(xiàn)行形碼慣用的漢字拆分辦法及輸入部件的鍵位安排和記憶辦法。其思維維度小,記憶量小且有利于規(guī)范漢字的推廣使用。
文檔編號(hào)G06F3/023GK1193767SQ9710271
公開日1998年9月23日 申請(qǐng)日期1997年3月18日 優(yōu)先權(quán)日1997年3月18日
發(fā)明者徐祖華 申請(qǐng)人:徐祖華
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1