亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一套漢字編碼輸入法及其鍵盤和檢字法的制作方法

文檔序號:6416856閱讀:374來源:國知局
專利名稱:一套漢字編碼輸入法及其鍵盤和檢字法的制作方法
技術(shù)領(lǐng)域
本發(fā)明主要是一套漢字拆分方案及根據(jù)此方案設(shè)計的漢字編碼和檢索方案。此次申請專利是利用國內(nèi)優(yōu)先權(quán),對原發(fā)明在規(guī)范性和易記性方面做了更好的處理,并根據(jù)主次關(guān)系對原發(fā)明做了些取舍,省去了些次要成分,突出了重點。
目前,雖然漢字編碼方案很多,但簡單的方案重碼多、輸入慢,重碼少、輸入速度快的方案又難學(xué)、難記?!缎氯A字典》用的“部首檢字法”既沒和計算機漢字輸入方法相聯(lián)系,又沒利用本發(fā)明的檢字法查字簡單、快速。
現(xiàn)今漢字編碼研究的兩大主題應(yīng)是普及性和規(guī)范性,但大部分效率高的形碼方案既不簡單,又不規(guī)范。國家語委1997年先后發(fā)布了《現(xiàn)代漢語通用字筆順規(guī)范》和《信息處理用GB13000.1字符集漢字部件規(guī)范》?!豆P順規(guī)范》以大部分人在中小學(xué)學(xué)習(xí)中養(yǎng)成的書寫習(xí)慣為基礎(chǔ),很容易為人們所接受?!恫考?guī)范》以“從形出發(fā),尊重理據(jù),立足現(xiàn)代,參考歷史”為基本原則,以近年來有關(guān)計算機編碼技術(shù)和漢字構(gòu)形的理論研究為理論基礎(chǔ),對漢字編碼研究有著重要的指導(dǎo)作用。自從今年5月18日我對此發(fā)明第一次申請專利以后,我就開始給專家寫信聯(lián)系,有幸收到北京信息工程學(xué)院陳一凡教授贈送的《部件規(guī)范》和載有漢字編碼研究重要信息的一期《計算機世界》。之后,我就開始對《部什規(guī)范》進行了認真的研究,盡可能使我的發(fā)明在完全服從《筆順規(guī)范》的情況下也服從《部件規(guī)范》。近期我對發(fā)明的處理都是以《部件規(guī)范》和陳一凡教授的《漢字鍵盤輸入技術(shù)與理論基礎(chǔ)》中“字根統(tǒng)計表”為基礎(chǔ),通過對《筆順規(guī)范》中7000漢字細心統(tǒng)計而設(shè)計。我認為通過我的處理,已使?jié)h字編碼更加簡化,且盡可能保留了常用部件的形體完整性。
現(xiàn)今形碼方案難學(xué)的最主要原因一般是記憶量較大。漢字是音、形、義的結(jié)合體,而只有拼音字母能與英文鍵盤的鍵位有直接聯(lián)系。所以以往主有些編碼方案在安排鍵位時也考慮了部件的拼音,以增強易記性。但目前按照部件的拼音安排鍵位的純粹形碼方案非常少(“認知碼”是其中一種)。因為僅那樣處理的話,肯定會使鍵位分配不均,易產(chǎn)生重碼;而且一般形碼方案利用部件較多,很難處理。其實,漢語是一種非常完美、詞匯豐富的語言,不僅可以利用部件本身的拼音,還可以種用部件的聯(lián)想詞匯的拼音與鍵盤的鍵位發(fā)生聯(lián)系。由于本發(fā)明選用部件較少,更容易這樣處理。本發(fā)明利用部件的拼音和部件聯(lián)想詞的拼音安排鍵位,只需先知道部件的名稱,然后再看幾便聯(lián)想詞,就可以記住每個部件的鍵位對應(yīng)關(guān)系。而且本發(fā)明已盡可能使部件在鍵位上分配均勻(發(fā)明人已把每部件對7000通用字的組字數(shù)統(tǒng)計出),重碼也會很少。
現(xiàn)今還沒有100%服從《筆順規(guī)范》的“部件拆分”形碼方案(包括《部件規(guī)范》對漢字的拆分)。僅從以下三字的普遍拆分方法即可說明(1)回口,口。(2)叵匚,口。(3)或戈,口,一。固然這樣給人的映象很合理,但缺點有二①對于說明“按照筆順進行拆分”的方案,未達到規(guī)則的統(tǒng)一。②對于未提及“筆順問題”的方案,沒達到《部件規(guī)范》和《筆順規(guī)范》的統(tǒng)一。當然,統(tǒng)一也要合理,應(yīng)達到簡單、無歧義。本發(fā)明“100%在筆順規(guī)范下取大舍小”的原則,本身就是在《筆順規(guī)范》下無歧義的拆分規(guī)則。本發(fā)明“拆分舉例”中即有“回,叵,或”三字的拆分,請看是否簡單。
自從東漢許慎發(fā)明“部首檢字法”,一直沿用至今,還沒有一種字形檢字法能真正取代它的地位。王云五的“四角號碼檢字法”雖說對熟練人員使用很方便,但因有一定的記憶量,一般人認真學(xué)的并不多。即使看著它的檢字表,不熟悉的人也不容易檢索。本發(fā)明結(jié)合自身拆分方案的特點,借鑒“四角號碼檢字法”的有益經(jīng)驗,設(shè)計了自己的號碼檢字法。本檢字法的特點是不需記憶,只需通過檢字表中首、末部件的號碼即可進行漢字檢索。與“部首檢字法”相比,本檢字法對漢字分配更均勻,檢索更方便,且無歧義,不需“難檢字表”。
本發(fā)明的目的在于提供編碼簡單易學(xué)、重碼少、速度快的計算機漢字編碼方案和通用與字典和電腦,易學(xué)、易用的漢字檢索方案。
本發(fā)明的指導(dǎo)思想是“強化首、末兩部件對漢字的區(qū)分,弱化拆分規(guī)則,100%服從筆順規(guī)范,兼顧各項指標?!北景l(fā)明的優(yōu)點是易學(xué)、易記,對漢字拆分方法唯一。如果中國人都學(xué)會用本發(fā)明的方法,就都能以規(guī)范的筆順書寫漢字。
下面按照“概念→漢字拆分方案→漢字編碼方案→漢字檢索方案→說明和設(shè)想”的順序介紹本發(fā)明。
一、概念(一)首部件、二部件、三部件、未部件本發(fā)明把漢字的首筆所在部件和末筆所在部件分開處理,并分別稱為“首部件”和“末部件”。稱漢字除去首部件后,剩余部分的首部件為“二部件”。稱漢字除去首部件和二部件后,剩余部分的首部件為“三部件”。(“首部件”、“二部件”、“三部件”、“未部件”再原專利申請文件中分別稱為“一筆”、“二筆”、“三筆”、“后筆”。根據(jù)中國中文信息學(xué)會石云程前輩的建議,我把它們改成了更直觀的稱謂)顯然,二部件和三部件的形式仍是首部件。末部件在漢字拆分中最多只用一次,它在編碼方案中起到強化區(qū)分漢字的作用,相當與“識別碼”。各部件的選取嚴格遵循“100%在筆順規(guī)范下取大舍小”的原則。在本發(fā)明的“托音”編碼方案中,發(fā)明人在處理時就同時考慮到了首部件和末部件的鍵位均勻性,記憶鍵位時并不需區(qū)分首部件和未部什,記熟鍵位后再了解那些可作為首部件,那些可作為末部件。因為首部件和末部件的選取是根據(jù)漢字本身的特點,所以記熟鍵位后再區(qū)分記憶,并不困難。首、末部件分開處理的最大好處是強化區(qū)分漢字,減少重碼(首、末部件分開處理,其實就是對漢字兩次強化區(qū)分)。
(二)部件名稱本發(fā)明共選取122個部件,它們的名稱分兩種情況1、成字部件共60個,以字本身為其名十廠土三大工寸木王車歹石耳酉革口山巾日貝止目田蟲骨人八匕兒幾千月氣牛禾白矢舟魚廣門火心立米又力刀尸女馬弓子小巳巴二旦皿鳥。2、非成字部件共62個,它們的名稱選取分三種情況①以下48個部件是《部件規(guī)范》中部件,它們的名稱取自北京語言文字大學(xué)邢紅兵、崔永華、張善的《對部件稱說的建議》一(橫)丆(頁字頭)艸(草字頭)扌(提手)(青字頭)覀(要字頭)丨(豎) (占字頭)ㄇ(奐字腰)幾(同字框)(尚字頭)罒(羅字頭)丿(撇)亻(單立人)(臥人)乂(艾字底) (欠字頭,注“角字頭”也并入了此部件)勹(包字頭) (反字頭) (周字框)彳(雙立人)犭(犬旁)饣(食旁) (告字頭)钅(金旁)(竹字頭)丶(點)氵(兩點水)讠(言旁)冖(禿寶蓋)亠(京字頭)丷(倒八字)氵(三點水)忄(豎心)宀(寶蓋)辶(走之)(興字頭)礻(示旁)疒(病字旁)衤(衣補)厶(私字邊) (絲字角)纟(絞絲)ㄒ(下字)卩(單耳)灬(橫四點)(豎鉤) (倉字底);②以下4個部件的名稱取自許多字典、資料中的通俗稱法 (雨字頭) (足字旁)乛(折)(豎彎鉤);③以下部件是根據(jù)本發(fā)明的特點選取,發(fā)明人自己取名ク(夕字頭)ㄅ(鳥頭) (皮字頭)阝(耳朵) (國字底) (魚字底) (橫上點) (衣尾)ㄑ(水尾) (見字底)。
原發(fā)明文件中把“折”分為“左折”和“右折”,把“點”分為“內(nèi)點”和“外點”。經(jīng)過發(fā)明人對7000通用字細心統(tǒng)計,以“乛(折)”為末部件的字分一組就夠了,不必分極107旋轉(zhuǎn)。經(jīng)傳遞機械112將電機111的旋轉(zhuǎn)力傳送到驅(qū)動輥110的軸110a,使驅(qū)動輥110旋轉(zhuǎn)。當然,與檢測電極107旋轉(zhuǎn)一致,顯影輥41也被驅(qū)動,旋轉(zhuǎn)起來。
在上述結(jié)構(gòu)中,使用壓力機械109,以預(yù)定的壓力F將顯影輥41緊貼在檢測電極107上。檢測電極107的直徑與實際顯影中使用的光電導(dǎo)體1的直徑相同,壓力F也與實際顯影中使顯影輥壓在光電導(dǎo)體上的壓力相同。另外,當顯影輥41被壓在檢測電極107上時形成的嚙合部位的接觸面積(S1)也與實際顯影中顯影輥壓在光電導(dǎo)體上時形成的接觸面積相同。然后,電機111旋轉(zhuǎn),驅(qū)動顯影輥41旋轉(zhuǎn)預(yù)定的旋轉(zhuǎn)次數(shù)。
在這種狀態(tài)下,從電路106向顯影輥41的旋轉(zhuǎn)軸41a提供偏壓,并利用安培表102進行測量,安培表102串接在檢測電極107和大地之間,從而可以確定電阻值。這樣,就可以在接近工作狀態(tài)的條件下,測量本發(fā)明中顯影輥41的電阻值。
根據(jù)本發(fā)明,為了檢驗顯影輥的電阻值的作用,在一個實施例中采用了一系列的顯影輥,接下來將說明這一實施例。(實施例2)對于顯影輥41的電阻層,所述顯影輥比如兩種將碳黑分散在聚氨酯樹脂中制成的電子導(dǎo)電型的顯影輥(A、B)和一種底層是聚氨酯樹脂的離子導(dǎo)電型的顯影輥(C),利用圖8所示的測量裝置,測量了這些顯影輥在周邊方向上電阻值的不均勻性,并在表2中給出了各個顯影輥電阻值(Rd)的平均值、最大值和最小值。當所提供的電壓為10V時,利用安培表102測量電流值,從而可以給出電阻值,所使用的安培表102為R6871,由Advantest制造。
(上表中電阻值的單位為MΩ)。
顯影輥41的外型已在實施例1中描述過了,它的外徑為34mm,電阻層46的厚度Dd為8mm,軸向長度為320mm,當壓力F為1kg時,所形<p>(二)拆分舉例請結(jié)合表1及以上介紹的拆分規(guī)則理解以下漢字的拆分(1)一一(首部件直接識別),一(無二部件,用首部件代替),一(無三部件,用二部件代替),一(末部件直接識別)。(2)早日,十,十(無三部件,用二部件代替),十(末部件直接識別)。(3)久ク,丶,丶,丶。(4)我丿,扌,乛,
。(如果把“”作為“丨”,首部件應(yīng)是“千”,很不符合人的心理)(5)于,一,一,乛(“”在首部件中屬于折筆),(“”是單獨的末部件)。(6)無一,一,丿,
。(7)也乛,丨,乛(“”在首部件中屬于折筆),(“”是單獨的末部件)。(8)中口,丨,丨,十。(9)華亻,丿,乛,十。(10)人人,人,人,人。(11)民乛,一,乛,乛。(12)共艸,,八,八。(13)和禾,口,口,口。(14)國ㄇ,王,丶,
。(15)專一,一,乛,丶。(16)利禾,丨,乛,。(17)局尸,乛,口,口。(18)英艸,ㄇ,大,大。(19)雄一,丿,厶,土。(20)叵一,口,乛,乛。(21)或一,口,一,
三、漢字編碼方案根據(jù)本發(fā)明的漢字拆分方案把部件定義在鍵盤的鍵位上,依拆分出部件的鍵位對應(yīng)關(guān)系進行漢字編碼。本發(fā)明在設(shè)計編碼方案時考慮到易學(xué)性、重碼率及特殊需要,特在附圖中具體設(shè)計了四種鍵位安排,它們對應(yīng)的“鍵位映射圖”分別為附

圖1、圖2、圖4和圖5。除圖4外,其余各圖中大寫字母后標的是首部件,小寫字母后標的是末部件。大小寫字母在編碼時并無區(qū)別,在此的主要作用是幫助人們識別首部件和末部件。
對于“托音”方案,記憶鍵位時,并不必區(qū)分首部件和未部件,記熟鍵位后,才需了解那些可作為首部件,那些可作為末部件。首部件用于前面拆分,末部件僅用于最后識別。
(一)托音(Ⅰ)方案“托音”就是把部件定義在其聲碼鍵上。如果全部托音處理,記憶量將最小。但這樣會使各鍵位上部件的組字頻度不均勻,易產(chǎn)生重碼。所以發(fā)明人在此方案中對部件做了簡單處理。如附圖1所示,大部分部件定義在其聲碼鍵上,僅對有“下劃線”的部件做了鍵位處理。處理分兩種情況①定義在其聯(lián)想詞、句中有“下劃線”字的聲碼鍵上氵(水中危險,注意安全)→a,月(月兒)→e,忄十石山(豎立信心,翻越十座石山)→f,丨(豎立)→1,
(足球先生)→x,(堅鉤)→g,(豎彎鉤)→w。②根據(jù)其聯(lián)想詞、句中有“下劃線”字的諧音記憶鍵位艸(愛護草坪)→i,钅(金口玉言)→o,扌(右手)→u,木(木圍墻)→v。通過以上助記詞和部件本身的聲碼,就可以很容易地記憶每個部件的鍵位對應(yīng)關(guān)系。
單字的一般編碼輸入規(guī)則依次擊漢字首部件、二部件、三部件、末部件所對應(yīng)的鍵位可輸入單字。漢字拆分及編碼舉例(1)武一,一,止,
;其編碼為hhzh。(2)漢氵,又,又,又;其編碼為ayyy。(3)工工,工,工,工;其編碼為gggg。(4)業(yè)丨,丨,丷,一;其編碼為lldh。(5)大大,大,大,大;其編碼為dddd。(6)學(xué),冖,子,子;其編碼為xtzz。
簡碼①一級簡碼首部件+空格,共26個。②二級簡碼首部件+末部件+空格,共26×22=572個。③三級簡碼首部件+二部件+末部件+空格,可設(shè)計26×26×22=14872個(當然,符合規(guī)則的要少許多)。
詞碼①二字詞第一字首部件+第一字末部件+第二字首部件+第二字末部件。例如“中國”的編碼為kshg。②三字詞第一字首部件+第二字首部件+第三字首部件+第三字未部件。例如“專利局”的編碼為hhsk。③四字以上詞第一字首部件+第二字首部件+第三字首都件+最后一字首部件。例如“萬眾一心”的編碼為hrhx。
(二)托音(Ⅱ)方案此方案的鍵位處理與托音(Ⅰ)沒有聯(lián)系,學(xué)習(xí)兩種方案中的任一種即可為漢字編碼。只是托音(Ⅱ)對部件分配更均勻,理論上重碼應(yīng)更少。記憶量雖說比托音(Ⅰ)稍大一點兒,但也不是很大,而且也都有助記詞。如附圖2所示,也極107旋轉(zhuǎn)。經(jīng)傳遞機械112將電機111的旋轉(zhuǎn)力傳送到驅(qū)動輥110的軸110a,使驅(qū)動輥110旋轉(zhuǎn)。當然,與檢測電極107旋轉(zhuǎn)一致,顯影輥41也被驅(qū)動,旋轉(zhuǎn)起來。
在上述結(jié)構(gòu)中,使用壓力機械109,以預(yù)定的壓力F將顯影輥41緊貼在檢測電極107上。檢測電極107的直徑與實際顯影中使用的光電導(dǎo)體1的直徑相同,壓力F也與實際顯影中使顯影輥壓在光電導(dǎo)體上的壓力相同。另外,當顯影輥41被壓在檢測電極107上時形成的嚙合部位的接觸面積(S1)也與實際顯影中顯影輥壓在光電導(dǎo)體上時形成的接觸面積相同。然后,電機111旋轉(zhuǎn),驅(qū)動顯影輥41旋轉(zhuǎn)預(yù)定的旋轉(zhuǎn)次數(shù)。
在這種狀態(tài)下,從電路106向顯影輥41的旋轉(zhuǎn)軸41a提供偏壓,并利用安培表102進行測量,安培表102串接在檢測電極107和大地之間,從而可以確定電阻值。這樣,就可以在接近工作狀態(tài)的條件下,測量本發(fā)明中顯影輥41的電阻值。
根據(jù)本發(fā)明,為了檢驗顯影輥的電阻值的作用,在一個實施例中采用了一系列的顯影輥,接下來將說明這一實施例。(實施例2)對于顯影輥41的電阻層,所述顯影輥比如兩種將碳黑分散在聚氨酯樹脂中制成的電子導(dǎo)電型的顯影輥(A、B)和一種底層是聚氨酯樹脂的離子導(dǎo)電型的顯影輥(C),利用圖8所示的測量裝置,測量了這些顯影輥在周邊方向上電阻值的不均勻性,并在表2中給出了各個顯影輥電阻值(Rd)的平均值、最大值和最小值。當所提供的電壓為10V時,利用安培表102測量電流值,從而可以給出電阻值,所使用的安培表102為R6871,由Advantest制造。
(上表中電阻值的單位為MΩ)。
顯影輥41的外型已在實施例1中描述過了,它的外徑為34mm,電阻層46的厚度Dd為8mm,軸向長度為320mm,當壓力F為1kg時,所形法。
(一)兩部號碼檢字法1、如果字典按照表2中首、末部件的組合號碼由小到大的順序進行編排,可以通過以下例字介紹檢索過程(1)一(首部件),
(末部什);它們對應(yīng)的組合號碼為“1-24”。(2)紫止,八;它們對應(yīng)的組合號碼為“8-19”。(3)千千,十;它們對應(yīng)的組合號碼為“15-9”。(4)紅纟,工;它們對應(yīng)的組合號碼為“25-6”??稍谧值涞南鄳?yīng)號碼(可以號碼做頁碼)中找到以上各字。2、如果字典以其它方式編排,可把表2作為“初級檢字表”。再設(shè)計一個“具體檢字表”,“具體檢字表”中包含字典中所有漢字,并按首、末部件的組合號碼由小到大的順序進行編排,每字后標出此字在字典正文中的頁碼,同一號碼的字按筆畫由少到多的順序進行編排。在“初級檢字表”的每一部件組合后標出此組合在“具體檢字表”中的頁碼。檢索漢字時,先在“初級檢字表”中查出漢字的首部件號碼在“具體檢字表”中的頁碼和末部件號碼,然后再在“具體檢字表”中的相應(yīng)頁碼找到此首部件號碼,再順次找到末部件號碼,即可檢索此漢字。例如檢索“籍”從“初級檢字表”(即表2)中查得首部件“”的號碼是“17”,它在的“具體檢字表”中頁碼是“34”(虛擬的),未部件“日”的號碼是“4”。然后翻到“具體檢字表”第34頁,即可找到首部件號碼“17”,再順次找到末部件號碼“4”,即可很快找到此字。表2
(二)三部號碼檢字法即按照漢字的首部件、二部件、末部件在表2中的組合號碼進行漢字檢索,方法與“兩部號碼檢字法”類似,只是對漢字的區(qū)分更細一些。
(三)四部號碼檢字法即按照漢字的首部件、二部件、三部件、末部件在表2中的組合號碼進行漢字檢索,方法也與“兩部號碼檢字法”類似,此檢字法對漢字區(qū)分幾乎沒有重碼。
(四)編碼檢字法此檢字法需要字典按照本發(fā)明漢字編碼的英文字母組合或數(shù)字組合順序進行編排,根據(jù)本發(fā)明的漢字編碼進行漢字檢索。此檢字法主要針對“托音”方案(因“托音”方案的記憶量都很小,很利于推廣應(yīng)用)。
當然,以上檢索方案如果不設(shè)計“初級檢字表”和“具體檢字表”,若想利用表2或“編碼檢字法”進行漢字檢索,都需要按相應(yīng)號碼或編碼順序編排的字典做支持。
五、說明和設(shè)想以上介紹的把漢字拆分為首部件、二部件、三部件、末部件的方案可稱為“漢字四部件拆分方案”;把漢字拆分為首部件、二部件、三部件、四部件的方案可稱為“漢字前四部件拆分方案”;同理可推廣出“漢字二部什拆分方案”即把漢字拆分為首部什、末部件“漢字三部件拆分方案”即把漢字拆分為首部件、二部件、末部件。根據(jù)這些漢字拆分方案和前面介紹的鍵位對應(yīng)關(guān)系都可設(shè)計相應(yīng)的編碼方案。每種編碼方案又都可利用于“編碼檢字法”。其實,經(jīng)過發(fā)明人的處理,僅利用首、末兩部件,根據(jù)前面所述任一種字母鍵位對應(yīng)關(guān)系都會比“雙拼方案”分配漢字均勻,而且“托音”方案的鍵位關(guān)系也比“雙拼”容易記憶。
如果把部件全部定義在其聲碼鍵上,根據(jù)本發(fā)明的漢字拆分方案設(shè)計編碼方案,可稱為“全托音漢字編碼方案”。發(fā)明人研究“托音”方案最先就是從“全托音”開始的,并根據(jù)“漢字四部件拆分方案”編了“碼表原文件”,在windows98的“輸入法生成器”中生成了輸入法,且進行了“詞條排序”。根據(jù)排序結(jié)果統(tǒng)計,即使“全托音”,對GB2312-80中6763個漢字也有一半以上的字沒有重碼。有重碼的字一個重碼一般也不超過5個字。所以“全托音漢字編碼方案”對于“編碼檢字法”也是根適用的(因為檢字法本身對重碼要求就不高)。
漢字是音、形、義的結(jié)合體,而漢字編碼主要利用音和形。字形對于人的視覺是最直觀的,而音對于人的感覺是最直觀的。我們看到一個漢字時,首先想到的是它的音。所以形碼方案托音處理是很符合人的心理特點的。但由于以往漢字編碼方案所用部件較多,托音較難處理重碼問題。本發(fā)明設(shè)計的漢字拆分方法對部件需求較少,為托音的形碼方案的處理提供了方便。
把本發(fā)明設(shè)計的任一種鍵位對應(yīng)關(guān)系標在鍵盤的鍵位上,即是本發(fā)明的鍵盤。
本發(fā)明涉及的方案較多,發(fā)明人認為,“全托音漢字編碼方案”和“兩部號碼檢字法”很適于小學(xué)生學(xué)習(xí);其它方案都具有普適性。發(fā)明人建議把“托音(Ⅱ)”作為一種標準的漢字編碼和檢索方案應(yīng)用于初中以上程度的學(xué)校教育。
現(xiàn)今世界漢字還不統(tǒng)一,發(fā)明人僅是通過7000通用字進行的處理,以后還會進一步對繁體字和繁、簡大字庫進行處理。因為常用繁、簡部件之間一般有對應(yīng)關(guān)系,所以把繁體部件與同源的簡化部件對應(yīng)起來,即可用于繁體字。當然,如果能在全世界推廣簡化字,將是最好的辦法。
因為此次申請專利是利用國內(nèi)優(yōu)先權(quán),所以原專利文件中已公開的某些內(nèi)容在此就不多提了。那次申請文件中許多處理方法也許也有一點兒價值,發(fā)明人在此僅對其簡碼設(shè)計和音形碼的設(shè)想再做些敘述。
對于105鍵英文鍵盤,主鍵區(qū)除了26個字母鍵外,數(shù)字鍵、符號鍵和功能鍵共49個,可選20個易擊的鍵作為簡碼結(jié)束鍵(如果我們不輸完一個漢字,不可能輸任何信息,所以作為簡碼結(jié)束鍵不會與原功能發(fā)生沖突)。①零級簡碼可選未定義首部件的鍵作“零級簡碼鍵”,擊一鍵可輸入漢字。因《字頻統(tǒng)計表》中,僅“的、一”兩字的累頻就達5.48%,如果把它們作為“零級簡碼”,雖然數(shù)量少,但對輸入速度影響應(yīng)該不小。②一級簡碼以“托音(Ⅱ)”為例,首部件+20個簡碼結(jié)束鍵中任一鍵,共26×20=520個。③二級簡碼仍以“托音(Ⅱ)”為例,首部件+末部件+20個簡碼結(jié)束鍵中任一鍵,可設(shè)計26×26×20=13520個(根據(jù)發(fā)明人對部件的統(tǒng)計處理可以推斷,起碼應(yīng)有5000以上的字會符合規(guī)則)。因二級簡碼已經(jīng)夠多了,所以三級簡碼仍按原方法即可。
根據(jù)本發(fā)明的托音方案,原號利申請文什中依漢字的拼音聲母、首部件、末部件進行漢字編的方案也是一種很易學(xué)、易記的方案。雖說錢任舉先生的“錢碼”在形式上與這種處理方法相同,但“首部件”和“末部件”在本發(fā)明中是兩個特殊的定義,也是本發(fā)明拆分方案的重要特征。而且本發(fā)明的托音處理本身就與眾不同。由于本發(fā)明的“托音”方案很容易記憶,即使對全拼方案,最后再加入本發(fā)明的首部件,也是一種很簡單的方法,而且可以大大降低重碼,在全拼和首部件之間可用“,”隔開,以作區(qū)別。
本發(fā)明對推行《筆順規(guī)范》具有推動作用。因為僅僅一筆一劃地在教育中教學(xué)生以規(guī)范的筆順書寫漢字并不是一件很容易的事情。通過部件的編碼,人們可以從電腦輸入中產(chǎn)生興趣,不得不去學(xué)習(xí)《筆順規(guī)范》,以便正確輸入漢字。所以《筆順規(guī)范》對本發(fā)明具有指導(dǎo)作用,本發(fā)明對《筆順規(guī)范》又具有推動作用。
漢字編碼研究是一項系統(tǒng)工程,以上僅是發(fā)明人提供的自己對漢字處理的設(shè)計,也許還很不完善,希望社會各界來共同完善它。
權(quán)利要求
9.根據(jù)權(quán)利要求3所述漢字檢索方案,本發(fā)明設(shè)計了“部件號碼檢字法”,其特征是①分別為“首部件”和“末部件”進行了分組編號;②利用備部件的號碼組合進行漢字檢索。
10.根據(jù)權(quán)利要求3所述漢字檢索方案,本發(fā)明中“編碼檢字法”的特征是根據(jù)本發(fā)明的漢字編碼進行漢字檢索。
全文摘要
本發(fā)明是一套簡單易學(xué)的漢字編碼和檢索方案,100%服從國家語委制定的《現(xiàn)代漢語通用字筆順規(guī)范》。本發(fā)明根據(jù)部件名稱第一字的拼音和少量部件聯(lián)想詞中某字的拼音安排鍵位,只需知道部件名稱,并看幾遍聯(lián)想詞,就可熟記所有部件的鍵位對應(yīng)關(guān)系,非常容易記憶。本發(fā)明以國家語委制定的《漢字部件規(guī)范》和專家書中的“字根統(tǒng)計表”為依據(jù),盡可能選用常用、規(guī)范的部件,使用規(guī)范的名稱。共選用122個常用部件,且無變形,非常利于中小學(xué)識字教育。
文檔編號G06F3/023GK1233794SQ9911630
公開日1999年11月3日 申請日期1999年1月4日 優(yōu)先權(quán)日1998年5月18日
發(fā)明者王小軍 申請人:王小軍
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1