專利名稱:漢字形聲碼編碼方案的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于計算機漢字輸入的由漢語拼音的聲母代碼加韻母代碼加部首代碼構(gòu)成的漢字形聲碼編碼方案。
當今時代,信息技術(shù)正在社會生活各個領(lǐng)域起著越來越重要的作用。但是,以形、音、義相結(jié)合為其特征的漢字卻無法在以西文字母為基礎(chǔ)的計算機鍵盤上直接使用,也無法直接用字母發(fā)電報,因而引發(fā)人們研究創(chuàng)造各種編碼來處理這一難題。然而目前現(xiàn)有的編碼還不盡如人意,存在著重碼多,記憶繁雜,操作不便等問題,例如目前的漢語拼音全拼輸入法,輸入一組編碼后,其重碼字有的多達幾十個,如輸入全拼碼“zhang”后,會出現(xiàn)“張、章、鄣、獐、嫜、彰、嫜、璋、樟……”25個,使用很不方便,限制了漢字信息化的發(fā)展。
本發(fā)明的任務(wù)是創(chuàng)造出一種既保留了漢語拼音的基本要素,又保留了漢字意義部分的簡便、快捷、無重碼的計算機漢字輸入方案,并可直接用于收、發(fā)拼音化電子郵件。
本發(fā)明用26個英文字母編碼,其構(gòu)成公式為聲母代碼+韻母代碼+部首代碼=編碼下面結(jié)合附表和具體實施方式
對本發(fā)明作進一步的詳細說明表1是本發(fā)明漢字形聲碼編碼方案《聲母代碼表》表2是本發(fā)明漢字形聲碼編碼方案《韻母代碼表》表3是本發(fā)明漢字形聲碼編碼方案《部首代碼表》表4是本發(fā)明漢字形聲碼編碼方案《十四個極常用字代碼表》本發(fā)明提出用一個聲母代碼加一個韻母代碼,僅用兩個鍵即可達到漢語拼音全拼的效果,韻母“in”與“ing”及“”與“un”除外。詳見表1,表2。
例1,[樟,zhang],聲母“zh”的代碼為“u”,見表1《聲母代碼表》,韻母“ang”的代碼為“h”,見表2《韻母代碼表》,所以,“樟”字的雙拼代碼“uh”,即uh=zhang。
例2,[蒸,zheng],聲母“zh”的代碼為“u”,韻母“eng”的代碼為“g”,見表2《韻母代碼表》,所以“蒸”字的雙拼代碼為“ug”,即ug=zheng。
本發(fā)明提出在一個聲母代碼加一個韻母代碼的基礎(chǔ)上再加一個或兩個部首代碼,其組成的編碼即與漢字一一對應(yīng)。
本發(fā)明所取部首與《新華字典》的部首基本一致,每組編碼最多用四個鍵代表一個漢字。
例3,[法,fa],聲母為“f”,其代碼為“f”,韻母“a”,代碼為“a”,部首“氵”,其代碼為“s”,見表3《部首代碼表》。
按公式,“法”字編碼即為f+a+s=fas例4,[張,zhang],聲母為“zh”,其代碼為“u”,見表1《聲母代碼表》,韻母“ang”的代碼為“h”,見表2《韻母代碼表》,部首“弓”,其代碼為“gp”,見表3《部首代碼表》。
按公式,“張”字編碼即為u+h+gp=uhgp.
部首中的獨體字,獨立使用時,不另行編碼。
例5,[王,wang],部首中“王”的代碼為“w”,見表3《部首代碼表》,單獨用“王”字時,代碼也是“w”。
當某些漢字,它們的拼音和部首都相同時,需要用兩條簡單的規(guī)則加以區(qū)分。
規(guī)則之一當該重碼字的部首代碼為單個時,再加上單個代碼“a”或“b”或“c”等。
例6,[苻,fu],聲母為“f”,韻母“u”,部首代碼為“c”,見表3《部首代碼表》。,聲母為“f”,韻母“u”,部首代碼為“c”。,聲母為“f”,韻母“u”,部首代碼為“c”。
則苻=f+u+c=fuc;芙=f+u+c+a=fuca;茯=f+u+c+b=fucb;規(guī)則之二如該重碼字的部首代碼為雙,則該部首代碼不用,另用一個統(tǒng)一代碼“e”,再加一個代碼“a”,或“b”或“c”等。
例7,[轆,lu],其代碼構(gòu)成為聲母代碼“l(fā)”,韻母代碼“u”,加部首代碼為“cz”,見表3《部首代碼表》。因為部首“車”的代碼是雙鍵,故“cz”改成“e”。,聲母為“l(fā)”,韻母“u”,部首代碼為“cz”,因為部首代碼是雙鍵,所以“cz”改為“e”,又因“輅”字代碼“l(fā)ue”與“轆”字代碼“l(fā)ue”重碼,所以,在“輅”字代碼后再加一個代碼“a”。
則轆=l+u+e=lue;輅=l+u+e+a=luea;在本發(fā)明漢字形聲碼編碼方案的運作中,需改為“e”代碼的字占1998年版《新華字典》上所有單字編碼的2.34%,共186個,而且許多字并不常用。如偶然碰到這樣的字,可在編程時設(shè)置提示窗,幫助記憶。
本人根據(jù)漢字的使用頻率,對一些極常用的字,選用一至二個字母為代碼,使用者只需直接使用表中代碼即可。見表4《十四個極常用字代碼表》。
繁體字與簡體字的編碼規(guī)則相同,但需另做版本。當繁體字與簡體字部首相同時,該繁體字與簡體字的編碼一致。
例8,[層,ceng],聲母“c”,韻母“eng”,代碼“g”,部首“尸”,代碼“sv”。,聲母“c”,韻母“eng”,代碼“g”,部首“尸”,代碼“sv”。
所以,層=c+g+sv=cgsv;層=c+g+sv=cgsv;如果繁體字與簡體字的部首完全不同,則根據(jù)繁體字的部首,另行編碼。
例9,[豐,feng],聲母“f”,韻母“eng”,其代碼“g”,部首“丨”,代碼“sl”,見表3《部首代碼表》。,聲母“f”,韻母“eng”,其代碼“g”,部首“豆”,代碼“do”,見表3《部首代碼表》。
則豐=f+g+sl=fgsl;豐=f+g+do=fgdo;在編碼時,如遇到多音字,取其較常用的發(fā)音編碼。
用本發(fā)明可做成(1)雙拼盤(聲母代碼+韻母代碼);(2)形聲字碼盤(聲母代碼+韻母代碼+部首代碼);(3)形聲詞碼盤(形聲字碼+聲母代碼);例10,[張燈結(jié)彩,zhang deng jie cai],其構(gòu)成代碼為張燈結(jié)彩=uhgp+d+j+c=uhgpdjc.
本發(fā)明簡便、易學、易記。表1《聲母代碼表》及表2《韻母代碼表》中凡單個聲母及單個韻母(除外),其代碼即漢語拼音本身的聲母字母和韻母字母,使用者只需記憶其余30個拼音代碼。詳見表1、表2。
表3《部首代碼表》中的雙鍵代碼,其首字母是該部首名稱的聲母。例如弓字旁,它的聲母為“g”,所以部首代碼為“gp”,只有22個雙鍵部首例外?!恫渴状a表》中的184個部首代碼,其中有143個是獨體字,單獨使用時,不另行編碼。
本發(fā)明在西文計算機鍵盤上輸入后,可直接跳出所需漢字,無重碼,并可實行盲打。由于本發(fā)明采用26個英文字母編碼,大小寫不混編,也不用標點符號等鍵編碼,所以本發(fā)明在需要時,可以直接作為拼音文字,連續(xù)成段地打出。
因本發(fā)明將繁體字也編成代碼,所以適用于一切使用漢字的地方和個人。本發(fā)明亦可直接用于收、發(fā)拼音化電子郵件,其功效與發(fā)電報相似。
權(quán)利要求
1.由一個聲母代碼加一個韻母代碼再加一個或兩個部首代碼構(gòu)成的漢字形聲碼編碼方案,用26個英文字母編碼,其特征在于大小寫不混編;僅用兩個鍵可基本達到漢語拼音全拼的效果,其特征為一個聲母代碼(表1)加一個韻母代碼(表2);在此基礎(chǔ)上再加一個或兩個部首代碼(表3),即構(gòu)成漢字形聲碼編碼,與漢字一一對應(yīng);當某些漢字的拼音與部首都相同時,則用兩條規(guī)則來區(qū)分,其中,當該重碼字的部首代碼為單時,再加一個代碼;當該重碼字的部首代碼為雙時,該部首代碼不用,另用一個統(tǒng)一代碼,再加一個代碼。
2.根據(jù)權(quán)利要求1所述的漢字形聲碼編碼方案,其特征在于聲母代碼表(表1)中的聲母“zh”,“ch”,“sh”的代碼“u”,“v”,“i”,三者之間可以互換,但不能用其它字母代替。
3.根據(jù)權(quán)利要求1所述的漢字形聲碼編碼方案,其特征在于韻母代碼表(表2)中的復(fù)韻母代碼,只有“o”是元音字母,其余都是輔音字母,其中重復(fù)所用的字母代碼,所代的復(fù)韻母,除了“in”與“ing”,“ü”與“un”這兩對外,在同一聲母段拼音中不重復(fù)出現(xiàn),并且排除了漢語拼音方案韻母表中的韻母“uen”、“ueng”,合并了韻母“uan”與“üan”。
4.根據(jù)權(quán)利要求1所述的漢字形聲碼編碼方案,其特征在于部首代碼表(表3)中的代碼與兩條規(guī)則中所用的代碼互不重復(fù)。
全文摘要
本發(fā)明漢字形聲碼編碼方案是計算機漢字輸入的一種編碼方式。本方案用26個英文字母編碼,大小寫不混編,其構(gòu)成公式為:聲母代碼十韻母代碼十部首代碼。僅用二個鍵可基本達到漢語拼音全拼的效果,再加一或二個部首代碼鍵,就與漢字一一對應(yīng)。當某些漢字的拼音與部首都相同時,用二條簡單規(guī)則區(qū)分。每組編碼最多用四個鍵代表一個漢字,無重碼。本發(fā)明可做成形聲字碼盤,雙拼盤及詞碼盤,并可直接用于網(wǎng)絡(luò)電子郵件,功效與發(fā)電報相似。
文檔編號G06F3/023GK1312497SQ0110554
公開日2001年9月12日 申請日期2001年3月5日 優(yōu)先權(quán)日2001年3月5日
發(fā)明者張振華 申請人:張振華