專利名稱:常用字不拆分的編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種中文信息處理技術(shù)三碼以上的常用字不拆分的編碼方法。
背景技術(shù):
目前漢字的輸入方法是“漢語拼音”和“五筆字型”輸入方法。漢語拼音輸入漢字的優(yōu)點(diǎn)易學(xué)習(xí),只要會(huì)拼音就會(huì)打字。缺點(diǎn)是重碼多,容易產(chǎn)生別字。大量的同音字翻頁時(shí)一不留神翻過去,倒回重來,影響打字速度,浪費(fèi)人們的寶貴時(shí)間。盡管有了狂拼輸入漢字的新方法,提高了打字速度,卻依然存在著修改、翻頁、檢字的麻煩和別字的缺陷;特別是簽訂協(xié)議打印出的合同文書的別字,在經(jīng)濟(jì)全球化的今天,將會(huì)造成不可估量的損失。更為嚴(yán)重的是,容易造成“提筆忘字”。五筆字型輸入漢字的優(yōu)點(diǎn)打字速度快,重碼率低,適合大批量處理文字。不足之處是,有些漢字的拆分,違背了漢字常規(guī)的書寫習(xí)慣,不利于漢字教學(xué),并且增加了沉重的學(xué)習(xí)、記憶負(fù)擔(dān),長(zhǎng)時(shí)間不用,極容易忘記。
發(fā)明內(nèi)容
目前的漢字編碼一般是用“五筆字型”和“漢語拼音”輸入漢字?!拔骞P字型”學(xué)習(xí)難,“漢語拼音”打字慢,使?jié)h字輸入不盡完美?!缎畔⑻幚碛肎B13000.1字符集漢字部件規(guī)范》將二萬多個(gè)漢字拆分為560個(gè)部件。在280個(gè)基礎(chǔ)部件漢字中,可拆分的漢字104個(gè)(略),二畫、交重、部分交重和不拆分的漢字111個(gè)(二十丁廠七卜八人入乂匕幾兒九刁了力刀乃又厶乜丈巾丸子孑孓也女豐井韋車屯中甘丹尹口曰曰日世凸凹目申甲電由冊(cè)弗母史吏曲串事五弋及牙戈內(nèi)專長(zhǎng)氏為夬丑書本戔戊戉央必民西夷舟艮甫且皿更兩耳里我身垂重大萬夕久門丫之不止月心業(yè)丘臣臼州非),交重的非常用字63個(gè)(廿市丐丏卅旡禸冘卐卍爿毋冉冎束曳缶聿帇镸酉豕豖疌采臾禺禹<繁體、專用字35個(gè)>)。非漢字基礎(chǔ)部件280個(gè)(丨亅丿丶乛乚ナ匚丂
冂勹亠冫丷冖マ巜丩卩凵丌廾尢囗彡夊丬彐屮彑巛耂爫灬肀歺曱甴乑癶襾戼丳刂 阝彳亻讠辶艸扌饣犭忄氵宀辶纟攵夂衤礻钅疒虍豸糹飠覀罒
……)。
[丨丂凵勹丩屮巛彐口癶肀氺
曱攵戼丳……都是有音可讀的漢字,因不常用,與現(xiàn)代漢語無意義,或者說是被現(xiàn)代漢語淘汰的漢字,本發(fā)明視作“非漢字基礎(chǔ)部件”,并無嚴(yán)格上意義上的“非漢字”] 用漢字的“聲母”,交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”和一畫、二畫、交重、部分交重和不拆分的漢字的“漢語拼音字母”綜合編碼,使?jié)h字重碼少,別字率低,容易學(xué)習(xí),不易忘記。本發(fā)明之目的就是提供一種三碼以上的常用字不拆分的編碼方法,其編碼方法解決的技術(shù)方案是 1.用漢字的“聲母(b c d f g h j k l m n p q r s t w x y z和零聲母a e o——下同)”分別作第一碼,再用該字拆分后常用字(變形漢字、《漢字偏旁名稱表》部首讀音——下同)的“聲母”或者交重的非常用字的“代碼(u——下同)”或者非漢字基礎(chǔ)部件的“代碼(a o e u——下同)”作二、三、四碼編碼。最后一碼是非常用字用最后一個(gè)常用字的“聲母”(非漢字基礎(chǔ)部件的“代碼”——下同)編碼。
2.能拆分的非常用字,用該字的“聲母”作首碼,該字拆分后常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼第一組。第二組用該字首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼(a、o、e、u、v——下同)”作首碼,二、三、四碼與第一組“二、三、四碼”的編碼方法相同。交重的非常用字獨(dú)立作字時(shí),先用該字全拼的漢語拼音字母編碼第一組,不夠四碼最后一碼是啥補(bǔ)啥,超過四碼舍棄,“zh、ch、sh”用“z、c、s”編碼,韻母“ü”用“u”編碼。第二組用該字首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”作首碼,二、三、四碼用“u”編碼。
3.二畫、交重、部分交重和不拆分的常用字,獨(dú)立作字時(shí)用該字全拼的漢語拼音字母編碼,不夠四碼最后一碼是啥補(bǔ)啥,超過四碼舍棄,韻母“ü”用“u”編碼;與其它漢字、部件組合時(shí)用其“聲母”編碼,“zh、ch、sh”用“z、c、s”編碼。
4.交重的異音字用其全拼的漢語拼音字母編碼;能拆分的異音字雙重編碼。
5.左邊是上下、上中下結(jié)構(gòu)的漢字——左邊不拆分。
6.二字詞用二字的“聲母”作第一、二碼,再用前一個(gè)字拆分后第一碼和后一個(gè)字拆分后第二碼的“聲母”作第三、四碼編碼;三字詞、四字詞用每個(gè)字的“聲母”編碼;五字以上詞用前三個(gè)字和最后一個(gè)字的“聲母”編碼;詞中的非常用字用“u”編碼。二畫、交重、部分交重和不拆分的常用字用其“聲母”編碼,“zh、ch、sh”用“z、c、s”編碼。
7.用“i”作一-五畫非漢字基礎(chǔ)部件的首碼,一、二、三、四、五畫的非漢字基礎(chǔ)部件分別用“a、b、c、d、e”作第二碼,一、二、三、四、五畫的非漢字基礎(chǔ)部件的首筆“—橫(a),丨豎(o)、丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”,分別作第三碼,不夠四碼最后一碼是啥補(bǔ)啥。用“ii”作六-十畫非漢字基礎(chǔ)部件的第一、二碼,六、七、八、九、十畫的非漢字基礎(chǔ)部件分別用“a、b、c、d、e”作第三碼,六、七、八、九、十畫的非漢字基礎(chǔ)部件的首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”分別作六、七、八、九、十畫的第四碼 編碼與鍵盤上的字母鍵相對(duì)應(yīng),手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字直接按鍵盤上相應(yīng)的字母鍵。
其編碼方法是 一、常用字編碼方法。
1.先用常用字的“聲母”作首碼,再用該字拆分后剛好三碼的常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼。
2.先用常用字的“聲母”作首碼,再用該字拆分后超過三碼的第一、二個(gè)和最后一個(gè)常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼。最后一碼是非常用字用最后一個(gè)常用字的“聲母”編碼。
3.先用常用字的“聲母”作首碼,再用該字拆分后只有二碼的常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三碼編碼,不夠四碼最后一碼是啥補(bǔ)啥, 二、非常用字編碼方法。
1.能拆分的非常用字,用該字的“聲母”作首碼,該字拆分后常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼第一組。第二組用非常用字的首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”作首碼,二、三、四碼與第一組“二、三、四碼”編碼方法相同。
2.交重的非常用字獨(dú)立作字時(shí),用該字全拼的漢語拼音字母編碼第一組,不夠四碼最后一碼是啥補(bǔ)啥,超過四碼舍棄,“zh、ch、sh”用“z、c、s”編碼,韻母“ü”用“u”編碼。第二組用該字首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”作首碼,二、三、四碼用“u”編碼。
三、二畫、交重、部分交重和不拆分的常用字編碼方法。
二畫、交重、部分交重和不拆分的常用字,獨(dú)立作字時(shí)用該字全拼的漢語拼音字母編碼,不夠四碼最后一碼是啥補(bǔ)啥,超過四碼舍棄,韻母“ü”用“u”編碼,與其它漢字、部件組合時(shí)用其“聲母”編碼,“zh、ch、sh”用“z、c、s”編碼。
四、異音字編碼方法。
1.交重的異音字與“二畫、交重、部分交重和不拆分的常用字”編碼方法相同。
2.能拆分的異音字與“常用字、能拆分的非常用字”的編碼方法相同。區(qū)別是用該字不同讀音的“聲母”雙重編碼。
五、“左不拆”的漢字編碼方法。
左邊是上下、上中下結(jié)構(gòu)的漢字左邊不拆分。
六、詞編碼方法。
1.二字詞用二字的“聲母”作第一、二碼,再用前一個(gè)字拆分后第一碼常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”和后一個(gè)字拆分后最后一碼常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作三、四碼編碼;第三碼是“左不拆”的,仍然適用單字“左不拆”的規(guī)定;第四碼是非常用字用最后一個(gè)常用字的“聲母”(部件的“代碼”)編碼;詞中的非常用字用“u”編碼。詞中二畫、交重、部分交重和不拆分的常用字用其“聲母”編碼,“zh、ch、sh”用“z、c、s”編碼。
2.三字詞用每個(gè)字的“聲母”編碼,不足四碼最后一碼是啥補(bǔ)啥。
3.四字詞用每個(gè)字的“聲母”編碼。
4.五字以上詞用前三個(gè)字和最后一個(gè)字的“聲母”編碼。
5.詞中的非常用字用“u”編碼。
七、非漢字基礎(chǔ)部件編碼方法。
1.用“i”作一-五畫非漢字基礎(chǔ)部件的首碼,一、二、三、四、五畫的非漢字基礎(chǔ)“部件”分別用“a、b、c、d、e”作第二碼,一、二、三、四、五畫的非漢字基礎(chǔ)部件的首筆“—橫(a),丨豎(o)、丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”,分別作第三碼,不夠四碼最后一碼是啥補(bǔ)啥。
2.用“ii”作六-十畫非漢字基礎(chǔ)部件的第一、二碼,六、七、八、九、十畫的非漢字基礎(chǔ)“部件”分別用“a、b、c、d、e”作第三碼,六、七、八、九、十畫的非漢字基礎(chǔ)部件的首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”分別作六、七、八、九、十畫的第四碼。
按照上述編碼方法,手機(jī)輸入漢字按數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。不需死記硬背口訣、規(guī)則,編碼短,重碼少,打字快,容易學(xué),不易忘記,不會(huì)造成“提筆忘字”,是一種高效、好學(xué)、好用的漢字編碼方法。
有益效果快捷實(shí)用、科學(xué)規(guī)范、重碼率低、學(xué)習(xí)記憶負(fù)擔(dān)小、不提筆忘字;不管是老年中年人,還是青年少年人,甚至是學(xué)齡前兒童,只要會(huì)漢語拼音,會(huì)操作手機(jī)、電子字詞典和計(jì)算機(jī),一學(xué)就會(huì),一勞永逸;對(duì)鞏固漢字的記憶、運(yùn)用能力,提高識(shí)字水平和中華民族整體文化素質(zhì);對(duì)簡(jiǎn)繁體漢字統(tǒng)一編碼,統(tǒng)一注音會(huì)起到促進(jìn)作用;告別昔日“別字滿天飛”、“無錯(cuò)不成書”的時(shí)代。
具體實(shí)施例方式 以下結(jié)合具體情況對(duì)本發(fā)明的具體實(shí)施方式
作詳細(xì)說明。
根據(jù)技術(shù)方案要求 1.先用常用字的“聲母”作首碼,再用該字拆分后剛好三碼的常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼。手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
2.用常用字的“聲母”作首碼,再用該字拆分后三碼以上的第一、二個(gè)和最后一個(gè)常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼。最后一碼是非常用字用最后一個(gè)常用字的“聲母”編碼。手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
3.先用常用字的“聲母”作首碼,再用該字拆分后不夠三碼的常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三碼編碼,不夠四碼最后一碼是啥補(bǔ)啥。手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
4.能拆分的非常用字,用該字的“聲母”作首碼,再用該字拆分后常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼第一組。第二組用非常用字的首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”作首碼,二、三、四碼與第一組編碼方法相同。手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
5.交重的非常用字獨(dú)立作字時(shí),先用該字全拼的漢語拼音字母編碼第一組,不夠四碼最后一碼是啥補(bǔ)啥,超過四碼舍棄,“zh、ch、sh”用“z、c、s”編碼,韻母“ü”用“u”編碼。第二組用非常用字的首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”作首碼,二、三、四碼用“u”編碼。手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
6.二畫、交重、部分交重和不拆分的常用字,獨(dú)立作字時(shí)用該字全拼的漢語拼音字母編碼,不夠四碼最后一碼是啥補(bǔ)啥,超過四碼舍棄,韻母“ü”用“u”編碼;與其它漢字、部件組合時(shí)用其“聲母”編碼,“zh、ch、sh”用“z、c、s”編碼。手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字詞、典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
7.交重的異音字與“二畫、交重、部分交重和不拆分的常用字”的編碼方法相同。輸入時(shí),手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
8.能拆分的異音字與“常用字、非常用字”的編碼方法相同。區(qū)別是用該字不同讀音的“聲母”雙重編碼。輸入時(shí),手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
9.左邊是上下、上中下結(jié)構(gòu)的漢字——左邊不拆分。輸入時(shí),手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
10.二字詞用二字的“聲母”作第一、二碼,再用前一個(gè)字拆分后第一碼和后一個(gè)字拆分后第二碼的“聲母”作第三、四碼編碼。輸入時(shí),手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
11.三字詞用每個(gè)字的聲母編碼,不足四碼最后一碼是啥補(bǔ)啥。輸入時(shí),手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
12.四字詞用每個(gè)字的聲母編碼。輸入時(shí),手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
13.五字以上詞用前三個(gè)字和最后一個(gè)字的聲母編碼。輸入時(shí),手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
14.詞中的非常用字用“u”編碼。輸入時(shí),手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
15.用“i”作一-五畫非漢字基礎(chǔ)部件的首碼,一、二、三、四、五畫的非漢字基礎(chǔ)“部件”分別用“a、b、c、d、e”作第二碼,一、二、三、四、五畫的非漢字基礎(chǔ)部件的首筆“—橫(a),丨豎(o)、丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”,分別作第三碼,不夠四碼最后一碼是啥補(bǔ)啥。用“ii”作六-十畫非漢字基礎(chǔ)部件的第一、二碼,六、七、八、九、十畫的非漢字基礎(chǔ)“部件”分別用“a、b、c、d、e”作第三碼,六、七、八、九、十畫的非漢字基礎(chǔ)部件的首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”分別作六、七、八、九、十畫的第四碼。輸入時(shí),手機(jī)輸入漢字按相應(yīng)的數(shù)字鍵,電子字、詞典和計(jì)算機(jī)輸入漢字按鍵盤上相應(yīng)的字母鍵。
具體實(shí)施方式
分述如下 一、常用字編碼 1.常用字拆分后剛好三碼的漢字編碼方法。
先用常用字的“聲母”作首碼,再用該字拆分后剛好三碼的常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼 如“碧”字,拆分為“王,白,石”,用“碧”字的“聲母b”作首碼,再用“碧”字拆分后“王,白,石”三個(gè)字的“聲母w,b,s”作二、三、四碼編碼。碧編碼bwbs. 如“幫”字,拆分為“(216)阝巾”。用“幫”字“聲母b”作首碼,再用“幫”字拆分后變形漢字“豐(216)”的“聲母f”,《漢字偏旁名稱表》中的部首“阝”旁讀音的“聲母e”和常用字“巾”字的“聲母j”作二、三、四碼編碼。幫,編碼bfej. [括號(hào)中的阿拉伯?dāng)?shù)字(216)為“漢字基礎(chǔ)部件表”中部件的序號(hào),取代該非漢字基礎(chǔ)部件。因計(jì)算機(jī)字庫中沒有這一類部件,即使利用刮、貼手法復(fù)印出來,也為日后公布時(shí)打不出該部件而留下缺憾。故用“漢字基礎(chǔ)部件表”中該部件的序號(hào)取代該基礎(chǔ)部件。以下括號(hào)內(nèi)的數(shù)字均為“漢字基礎(chǔ)部件表”中該部件的序號(hào)] 棒-木(152),編碼bmue.用“棒”字的“聲母b”作第一碼,再用“棒”字拆分后“木”字旁讀音的“聲母m”,四畫以上的非漢字基礎(chǔ)部件“”的“代碼u”和三畫的非漢字基礎(chǔ)部件(152)的“代碼e”作二、三、四碼編碼。
離-文凵禸/亠兇禸,編碼lwou.loxu.用“離”字的“聲母l”作第一碼,再用“離”字拆分后“文”字的“聲母w”和二畫的非漢字基礎(chǔ)部件“凵”的“代碼o”和交重的非常用字“禸”的“代碼u”作二、三、四碼編碼?!半x”字上部“亠ㄨ凵”三個(gè)部件即可組成“文凵”還可組成“亠兇”雙重編碼,使不同拆分編碼的人都能正確打出該字。
2.常用字拆分后三碼以上的漢字編碼方法。
先用常用字的“聲母”作首碼,再用該字拆分后超過三碼的第一、二個(gè)和最后一個(gè)常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼 用“贏”字的“聲母y”作第一碼,再用“贏”字拆分后第一、二碼“亡,口”聲母wk”和最后一碼“凡”字的“聲母f”作二、三、四碼編碼。贏,編碼ywkf. 最后一碼是非常用字用最后一個(gè)常用字的“聲母”編碼 用“寇”字的“聲母k”作第一碼,再用“寇”字拆分后部首“宀”頭讀音的“聲母b”,“元”字的“聲母y”,最后一碼“支”字是非常用字用常用字“又”字的“聲母y”作二、三、四碼編碼???,編碼kbyy. 3.常用字拆分后只有二碼的漢字編碼方法。
先用常用字的“聲母”作首碼,再用該字拆分后的常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三碼編碼,不夠四碼最后一碼是啥補(bǔ)啥。
陽-阝 日,編碼yerr. 漢-氵 又,編碼hsyy. 枕-木 冘,編碼zmuu. 字-宀 子,編碼zbzz. 編碼明確后按相應(yīng)的數(shù)字鍵、字母鍵,所需漢字自動(dòng)給出。以下各部分的編碼輸入方法均同上。
二、非常用字編碼 1.能拆分的非常用字編碼方法。
能拆分的非常用字,用該字的“聲母”作首碼,再用該字拆分后常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼第一組 非常用字“檄”字,按照常用字的編碼方法先編碼第一組xmbw.供認(rèn)識(shí)“檄”字的人打字。如果不認(rèn)識(shí)“檄”字,用“檄”字的首筆“—(橫)”的“代碼a”作第一碼,再用“檄”字拆分后的“木,白,攵”的“聲母m,b,w”編碼第二組ambw. 第二組用非常用字的首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”作首碼,二、三、四碼編碼與第一組編碼方法相同 “靨”拆分為廠犬面,編碼ycqm.acqm. “羈”拆分為罒革馬,編碼jsgm.osgm. “簟”拆分為西早,編碼dzxz.ezxz. “旄”拆分為方毛,編碼mfom.ufom. “媛”拆分為女(134)友,編碼ynuy.vnuy. 2.交重的非常用字編碼方法。
交重的非常用字獨(dú)立作字時(shí),用該字全拼的漢語拼音字母編碼第一組,不夠四碼最后一碼是啥補(bǔ)啥,超過四碼舍棄,“zh、ch、sh”用“z、c、s”編碼,韻母“ü”用“u”編碼 廿-編碼nian.auuu. 冉-編碼rann.ouuu. 禹-編碼yuuu.euuu. 冘-編碼yinn.uuuu. 第二組用該字首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”作首碼,第二、三、四碼用“u”編碼 “度”拆分為廣廿又,編碼dguy. “苒”拆分為艸冉,編碼rcuu.acuu. “律”拆分為彳 聿,編碼lruu. “拽”拆分為扌曳,編碼zsuu.asuu. “暨”拆分為(211)旡旦,編碼juud.vuud. 三、二畫、交重、部分交重和不拆分的漢字編碼 二畫、交重、部分交重和不拆分的常用字,獨(dú)立作字時(shí)用該字全拼的漢語拼音字母編碼,不夠四碼最后一碼是啥補(bǔ)啥,超過四碼舍棄,韻母“ü”用“u”編碼 幾-編碼jiii. 女-編碼nuuu. 屯-編碼tunn. 心-編碼xinn. 丘-編碼qiuu. 臣-編碼chen. 州-編碼zhou. 長(zhǎng)-編碼chan. 與其它漢字、部件組合時(shí)用其“聲母”編碼,“zh、ch、sh”用“z、c、s”編碼 “機(jī)”拆分為木幾,編碼jmjj. “純”拆分為纟屯,編碼cstt. 四、異音字編碼 1.交重的異音字與“二畫、交重、部分交重和不拆分的漢字”編碼方法相同。
重chong.zhong,編碼chon.zhon. 車che.ju,編碼chee.juuu. 長(zhǎng)chang.zhang,編碼chan.zhan. 萬wan.mo,編碼wann.mooo. 2.能拆分的異音字與“常用字、非常用字的”編碼方法相同。區(qū)別是用該字不同讀音的“聲母”雙重編碼。
“會(huì)”拆分為人二厶,編碼hres.kres. “彈”拆分為弓丷(298),編碼dgou.tgou. “行”拆分為彳一丁,編碼xryd.hryd. “調(diào)”拆分為讠 冂 口,編碼dyok.tyok. 五、“左不拆”的漢字編碼 左邊是上下、上中下結(jié)構(gòu)的漢字左邊部分不拆分。
1.左邊是常用字的,用其“聲母”編碼 “勵(lì)”拆分為厲力,編碼llll. “期”拆分為其月,編碼qqyy. “割”拆分為害刂,編碼ghdd. “郗”拆分為希阝,編碼xxee.exee.2.左邊是非常用字的,用“u”編碼。
“彭”拆分為壴彡,編碼cuey.vuey. “歃”拆分為臿人,編碼suor.euor. 3.是“非漢字”的分別用該部件的“代碼”編碼。
“改”拆分為(129)攵,編碼goww. “毀”拆分為*幾又,編碼hujy. 六、詞編碼 1.二字詞編碼方法。
二字詞用二字的“聲母”作第一、二碼,再用前一個(gè)字拆分后第一碼常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”和后一個(gè)字拆分后最后一碼常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作三、四碼編碼;第三碼是“左不拆”的,仍然適用單字“左不拆”的規(guī)定;第四碼是非常用字用最后一個(gè)常用字的“聲母”(部件的“代碼”)編碼;詞中的非常用字用“u”編碼;詞中二畫、交重、部分交重和不拆分的常用字用其“聲母”編碼,是“zh、ch、sh”用“z、c、s”編碼。
①第一、二、三、四碼是常用字的,用其“聲母”編碼。
如和諧-禾皆編碼hxhj. 貪戀-今心編碼tljx. 對(duì)話-又舌編碼dhys. 道德-首心編碼ddsx. ②第一、二碼是非常用字除用該詞的“聲母”編碼外,再用“u”作第二組編碼。
如奢侈scdd.sudd.ucdd.uudd. 斟酌zzss.zzus.uzss.uuss. 褻瀆xdom.xuom.udom.uuom. 淫穢yhss.yuss.uyss.uuss. ③第三、四碼是非常用字用“u”編碼。
如函授-氶 受編碼hsus. 雛形-芻 彡編碼cxue.uxue. 叫嚷-口(86)編碼jrku. 澆灌-氵(88)編碼jgsu. 最后一碼是“亍?;軌峁鐚爡螘j曷孚殳奐皃番舛亢咅妾糸隹襄袞”非常用字的,用最后一個(gè)常用字的“聲母(非漢字基礎(chǔ)部件的‘代碼’)”編碼。
④二畫、交重、部分交重和不拆分的常用字用其“聲母”編碼,“zh、ch、sh”用“z、c、s”編碼。
如母女-母女,編碼mnmn. 耳目-耳目,編碼emem. 長(zhǎng)城-長(zhǎng)成,編碼cccc. 歷史-廠史,編碼lscs. ⑤第三、四碼是“部首、變形漢字”的,用其讀音的“聲母”編碼。
如街道-彳辶,編碼jdrz. 零散-
攵,編碼lsyw. 著重-羊重,編碼zzyz. 比武-(43)止,編碼bwoz. ⑥第三碼左邊是“上下”、上中下”、“半包圍”結(jié)構(gòu)的漢字,仍然適用單字“左不拆”的規(guī)定編碼。
如朝霞-又,編碼zxuy. 敬愛-茍友,編碼jauy. 殿堂-*土,編碼dtut. 毀滅-*火,編碼hmuh. ⑦第四碼是非漢字(也不是部件)的,用最后一碼常用字的“聲母”或者部件的“代碼”編碼。
如升降-丿(228),編碼sjae. 維修-纟 彡,編碼wxse. 衣服-亠 又,編碼yfoy. 選擇-先(152),編碼xzxe. ⑧異音字編碼。
如重慶-重 大,編碼cqcd. 重量-重 里,編碼zlzl. 沉降-氵(228),編碼cjge. 投降-扌(228),編碼txse. 2.三字詞編碼方法。
三字詞取每個(gè)字的聲母編碼,不足四碼最后一碼是啥補(bǔ)啥。
計(jì)算機(jī)-編碼jsjj. 托兒所-編碼tess. 閉門羹-編碼bmgg.bmuu. 微生物-編碼wsww. 贍養(yǎng)費(fèi)-編碼syff.uyff. 肇事人-編碼zsrr.usrr. 3.四字詞編碼方法 四字詞取每個(gè)字的聲母編碼。
兩袖清風(fēng)-編碼lxqf. 天長(zhǎng)地久-編碼tcdj. 和諧社會(huì)-編碼hxsh. 瞠目結(jié)舌-編碼cmjs.umjs. 剛愎自用-編碼gbzy.guzy. 4.五字以上詞編碼方法 五字以上詞取前三個(gè)字和最后一個(gè)字的聲母編碼。
新華通訊社-編碼xhts. 上海合作組織-編碼shhz, 中華人民共和國一編碼zhrg. 新疆維吾爾自治區(qū)-編碼xjwq. 中國共產(chǎn)主義青年團(tuán)中央委員會(huì)-編碼zggh. 5.詞中非常用字編碼方法 詞中的非常用字用“u”編碼。
奇葩-編碼qpdb.qudb. 奢侈-編碼scdd.ucdd.sudd.uudd. 虔誠-編碼qchc.uchc. 褻瀆-編碼xdom.udom.xuom.uuom. 同仇敵愾-編碼tcdk.tcdu. 面面相覷-編碼mmxq.mmxu. 七、基礎(chǔ)部件漢字編碼 1.一-五畫非漢字基礎(chǔ)部件編碼方法。
用“i”作一-五畫非漢字基礎(chǔ)部件的首碼,一、二、三、四、五畫的非漢字基礎(chǔ)部件分別用“a、b、c、d、e”作第二碼,一、二、三、四、五畫的非漢字基礎(chǔ)部件的首筆“一橫(a),丨豎(o)、丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”,分別作第三碼,不夠四碼最后一碼是啥補(bǔ)啥。
一畫的基礎(chǔ)部件編碼 一編碼iaaa(一) 亅編碼iaoo(丨亅) 丿編碼iaee(丿) 丶編碼iauu(丶……) 乛編碼iavv(乛乚……) 二畫的基礎(chǔ)部件編碼 一編碼ibaa(丆ナ匚……) 亅編碼iboo(
刂冂……) 丿編碼ibee(亻勹……) 丶編碼ibuu(亠丷冫冖讠……) 乛編碼ibvv(丩卩阝廴凵巜……) 三畫的基礎(chǔ)部件編碼 一編碼icaa(丌艸廾尢扌丂……) 亅編碼icoo(……) 丿編碼icee(彡犭彳夂饣亇……) 丶編碼icuu(忄丬氵宀辶……) 乛編碼icvv(卪彑彐屮纟巛……) 四畫的基礎(chǔ)部件編碼 一編碼idaa(耂
……) 亅編碼idoo(冃……) 爫編碼idee(攵牜爫……) 丶編碼iduu(灬礻……) 乛編碼idvv(肀……) 五畫的基礎(chǔ)部件編碼 一編碼ieaa(……) 亅編碼ieoo(罒覀歺氺……) 丿編碼ieee(钅……) 丶編碼ieuu(疒衤……) 乛編碼ievv(癶疋……) 第一碼“i”代表一-五畫的非漢字基礎(chǔ)部件。
第二碼“a、b、c、d、e”分別代表一、二、三、四、五畫的非漢字基礎(chǔ)部件。
第三碼“a、o、e、u、v”分別為首筆“橫、豎、撇、點(diǎn)、折”的“代碼”。
第四碼與第三碼同。即不足四碼最后一碼是啥補(bǔ)啥。
2.六-十畫非漢字基礎(chǔ)部件編碼方法。
用“ii”作六-十畫非漢字基礎(chǔ)部件的第一、二碼,六、七、八、九、十畫的非漢字基礎(chǔ)部件分別用“a、b、c、d、e”作第三碼,六、七、八、九、十畫的非漢字基礎(chǔ)部件的首筆“—橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),乛折(v)”的“代碼”分別作六、七、八、九、十畫的第四碼。
六畫的基礎(chǔ)部件編碼 一iiaa(*……) 丨iiao(虍……) 丿iiae(乑……) 丶iiau(……) 乛iiav(*……) 七畫的基礎(chǔ)部件編碼 一iiba(*……) 丨iibo(囬……) 丿iibe(豸……) 丶iibu(*……) 乛iibv(*……) 八畫的基礎(chǔ)部件編碼 一iica(……) 丨iico(*……) 丿iice(*) 丶iicu(*……) 乛iicv(*) 九畫的基礎(chǔ)部件編碼 一iida(*) 丨iido(*……) 丿iide(*……) 丶iidu(*) 十畫的基礎(chǔ)部件編碼 一iiea(*) 丨iieo(*……) 丿iiee(*……) 乛iiev(*) [因字庫中沒有該“非漢字基礎(chǔ)部件”,故用“*”號(hào)代表] 第一、二碼“ii”代表六-十畫的非漢字基礎(chǔ)部件。
第三碼“a、b、c、d、e”分別代表六、七、八、九、十畫的非漢字基礎(chǔ)部件。
第四碼“a、o、e、u、v”分別為首筆“橫、豎、撇、點(diǎn)、折”的“代碼”。
以上漢字編碼方法,依照《漢字基礎(chǔ)部件表》、《現(xiàn)代漢語通用字筆順規(guī)范》、《普通話異詞審音表》等標(biāo)準(zhǔn)、規(guī)范規(guī)定,對(duì)GB18030《信息技術(shù)信息交換用漢字編碼字符集的擴(kuò)充》21003個(gè)漢字進(jìn)行編碼。一個(gè)漢字拆分出三碼以上——常用字不拆分,構(gòu)成了漢字拆分編碼常用字的完整性,使?jié)h字編碼減少別字、不“提筆忘字”同時(shí)得到解決。
權(quán)利要求
1.一種中文信息處理技術(shù)三碼以上的常用字不拆分的編碼方法,用漢字的聲母、代碼,漢語拼音字母編碼;其特征在于,用常用字的“聲母”作首碼,再用該字拆分后常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼,編碼與鍵盤上的字母鍵相對(duì)應(yīng),輸入時(shí)直接按相應(yīng)的字母鍵;
能拆分的非常用字,用該字的“聲母”作首碼,再用該字拆分后常用字的“聲母”或者非漢字基礎(chǔ)部件的“代碼”或者交重的非常用字的“代碼”作二、三、四碼編碼第一組,第二組用非常用字的首筆“一橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),折(v)”的“代碼”作首碼,二、三、四碼與第一組編碼方法相同,輸入時(shí)直接按相應(yīng)的字母鍵;
交重的非常用字獨(dú)立作字時(shí),先用該字全拼的漢語拼音字母編碼第一組,不夠四碼最后一碼是啥補(bǔ)啥,超過四碼舍棄,“zh、ch、sh”用“z、c、s”編碼,韻母“ü”用“u”編碼;第二組用該字首筆“一橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),折(v)”的“代碼”作首碼,二、三、四碼用“u”編碼,輸入時(shí)直接按相應(yīng)的字母鍵;
二畫、交重、部分交重和不拆分的常用字,獨(dú)立作字時(shí)用該字全拼的漢語拼音字母編碼,不夠四碼最后一碼是啥補(bǔ)啥,超過四碼舍棄,韻母“ü”用“u”編碼;與其它漢字、部件組合時(shí)用其“聲母”編碼,“zh、ch、sh”用“z、c、s”編碼,輸入時(shí)直接按相應(yīng)的字母鍵;
左邊是上下、上中下結(jié)構(gòu)的漢字——左邊不拆分,輸入時(shí)直接按相應(yīng)的字母鍵;
二字詞用二字的“聲母”作第一、二碼,再用前一個(gè)字拆分后第一碼常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”和后一個(gè)字拆分后最后一碼常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作三、四碼編碼;第三碼是“左不拆”的,仍然適用單字“左不拆”的規(guī)定;第四碼是非常用字用最后一個(gè)常用字的“聲母”(部件的“代碼”)編碼;三字詞用每個(gè)字的“聲母”編碼,不夠四碼最后一碼是啥補(bǔ)啥;四字詞用每個(gè)字的“聲母”編碼;五字以上詞用前三個(gè)字和最后一個(gè)字的“聲母”編碼;詞中的非常用字用“u”編碼;詞中二畫、交重、部分交重和不拆分的常用字用其“聲母”編碼,是“zh、ch、sh”用“z、c、s”編碼,輸入時(shí)直接按相應(yīng)的字母鍵;
用“i”作一-五畫非漢字基礎(chǔ)部件的首碼,一、二、三、四、五畫的非漢字基礎(chǔ)部件分別用“a、b、c、d、e”作第二碼,一、二、三、四、五畫的非漢字基礎(chǔ)部件的首筆“一橫(a),丨豎(o)、丿撇(e),丶點(diǎn)(u),折(v)”的“代碼”,分別作第三碼,不夠四碼最后一碼是啥補(bǔ)啥。用“ii”作六一十畫的非漢字基礎(chǔ)部件的第一、二碼,六、七、八、九、十畫的非漢字基礎(chǔ)部件分別用“a、b、c、d、e”作第三碼,六、七、八、九、十畫的非漢字基礎(chǔ)部件的首筆“一橫(a),丨豎(o),丿撇(e),丶點(diǎn)(u),折(v)”的“代碼”分別作六、七、八、九、十畫的第四碼,輸入時(shí)直接按相應(yīng)的字母鍵。
全文摘要
本發(fā)明是一種信息處理技術(shù)三碼以上常用字不拆分的編碼方法,目前漢字的輸入方法是“漢語拼音”和“五筆字型”。其編碼方法是用漢字的聲母分別作首碼,再用該字拆分后常用字的聲母或者交重的非常用字的代碼或者非漢字基礎(chǔ)部件的代碼作二、三、四碼編碼。能拆分的非常用字,用該字的聲母作首碼,再用該字拆分后常用字的聲母或者交重的非常用字的代碼或者非漢字基礎(chǔ)部件的代碼作二、三、四碼編碼第一組。第二組用該字首筆一丨丿丶乛的代碼作首碼,二、三、四碼與第一組編碼方法相同。交重的非常用字用該字全拼的漢語拼音字母編碼第一組,第二組用該字首筆一丨丿丶乛的代碼作首碼,二、三、四碼用u編碼。輸入漢字按鍵盤上相應(yīng)的字母鍵。
文檔編號(hào)G06F3/023GK101114199SQ200710055089
公開日2008年1月30日 申請(qǐng)日期2007年9月3日 優(yōu)先權(quán)日2007年9月3日
發(fā)明者袁長(zhǎng)寶, 王惠芳 申請(qǐng)人:袁長(zhǎng)寶, 王惠芳