亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

全漢字二十六碼元表形碼的字素分類編碼法的制作方法

文檔序號(hào):6598273閱讀:274來源:國(guó)知局
專利名稱:全漢字二十六碼元表形碼的字素分類編碼法的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于漢字信息處理領(lǐng)域。本編碼方案可供計(jì)算機(jī)輸入漢字,可作為字典的查字法,也可作為電報(bào)的代用碼。
現(xiàn)有技術(shù)資料見中國(guó)專利《漢字表形符號(hào)和字素(即部件)分類編編碼法》,專利號(hào)85105556,它提出了漢字表形符號(hào)和字素(即部件)分類編碼法;中國(guó)專利申請(qǐng)《中、日、朝漢字字母譜系表》申請(qǐng)?zhí)?9102862、5,它是第一個(gè)專利的改進(jìn)。
本發(fā)明是在上述專利的基礎(chǔ)上進(jìn)行改進(jìn),把原設(shè)計(jì)的三十一碼元(A-Z,1-5)改為二十六碼元,(A-Z)使?jié)h字表形符號(hào)更適應(yīng)國(guó)際習(xí)慣,解決了全部漢字(包括中國(guó)的簡(jiǎn)體字、繁體字、日本和南朝鮮的漢字)在信息化時(shí)代的各方面用途。
本發(fā)明從簡(jiǎn)、繁二體漢字以及日本、南朝鮮漢字中,按照確定的規(guī)則,整理出全部字根(即字素),構(gòu)成漢字的全部字根表,作為漢字的拼形字母,本發(fā)明將漢字字根分為六種類型離聚、交叉、包圍、通擋、多腳和字架,形成從“型”到“式”到“類”的分類系統(tǒng)。本發(fā)明采用二十六個(gè)拉丁字母作為字根類的代號(hào),并利用字根代號(hào)和字根之間具有外形相似的象形性,進(jìn)行字根的分類、記憶和輸入。
本發(fā)明的全漢字二十六碼元表形碼的字素分類編碼法,可以采用““二十六碼元表形碼”作為漢字字典索引,直接查閱漢字,這是字典查字法的一項(xiàng)突破,對(duì)漢-外字典將是最佳查字方法。
本發(fā)明的表1至表4的內(nèi)容如下表1部件分類表;
表2單筆畫分類;
表3組合部件分類;
表4二十六碼元表形碼順序排列表。
建立漢字字母譜系有三個(gè)關(guān)鍵;(一)從全部漢字中拆取字根,提取具體字母清單;(二)將具體字母進(jìn)行特征分類,建立分類譜系;(三)給具體字母類設(shè)計(jì)代號(hào)建立代表字母(A-Z二十六個(gè)拉丁字母為代表字母)。
一、提取具體字母清單具體字母的定義漢字的直接拼字單位,叫做具體字母(簡(jiǎn)稱部件)。如“同”由“冂、一、口”等三個(gè)具體字母拼成。
拆取具體字母的規(guī)則如下(一)橫直交叉的筆畫不拆,算一個(gè)部件,如“聿、事、冊(cè)、世”等都是,斜交叉的筆畫也不拆,算一個(gè)部件如“耂、
、(匆)下(斥)等,在“大、木、尤”等筆畫基礎(chǔ)上加上交叉筆畫結(jié)構(gòu)也不拆,如夫、夬、;本、未、末、果;
、等也算一個(gè)部件。歸納之所有交叉的筆畫一律不拆。
(二)封閉結(jié)構(gòu)不拆,如“囗、凹、田、母、……”。封閉框內(nèi)部的筆畫和框架分開的要拆開,如“囡”拆為囗、女。
(三)交叉結(jié)構(gòu)或封閉結(jié)構(gòu)上面可以粘連橫筆(不是全部,需考慮具體部件結(jié)構(gòu)習(xí)慣和歸類的統(tǒng)一需要)如“干、土、王、西、瓦……”等算一個(gè)部件。
(四)附在上述部件上的撇筆和捺筆一律拆開,如“千”拆為“丿、十”,“白”拆為“丿、日”,“尺”拆為“尸、\”……,“烏、鳥、
”三個(gè)部件為了保持漢字習(xí)慣的完整性作一例外。
(五)漢字中的天然間隙是拆字的基本界線。但是下列二種間隙不能作為拆字界線(1)筆畫之間雖有分離,但是存在平行或向心的形式如“刂、彡、氵、巛、灬、……”等,算一個(gè)部件。
(2)左右兩塊,形狀相似,方向相反,其間雖有間隙,不可拆開,如“北、非、
、……”等,算一個(gè)部件。
(六)附在部件上的點(diǎn)筆是否拆開,按下列規(guī)定處理(1)粘連的點(diǎn)筆不拆開的可有以下幾個(gè)“
、蟲、厶、禸、、專、髟、”即粘在臥式右端;折式左端的點(diǎn)筆不拆,粘在立式筆畫下端的點(diǎn)筆要拆,如“即”拆為“
、丶”。
(2)分離的點(diǎn)筆一般都拆,但是常用的部首及共同類結(jié)構(gòu)中的點(diǎn)筆不拆。列舉于下“礻、衤、忄、宀、門、廣、疒、辶、讠、
、亠、主、六、方、
、立、圭、弋、戈、戔、
”。
(3)有些點(diǎn)筆含在某部件內(nèi),構(gòu)成固定型式的不拆。如“叉、
、母、羽、
、月、丹、
、、
、心、必、臼”等。
(七)分離的橫筆、斜橫筆(提筆、撇筆)一般都拆開,只有下列常用部首及其同類結(jié)構(gòu)不拆,如“纟、彳、與、馬、鳥、
、……”等。
(八)由粘連的筆畫構(gòu)成的結(jié)構(gòu),可成為一個(gè)部件,但粘的型式應(yīng)該統(tǒng)一,如“弓”的部件統(tǒng)一于“W”代號(hào)中,故不需拆為“
、ㄅ”,(“
、ㄅ”二部件雖也可歸入“C”及“k”代號(hào)中,但由于已統(tǒng)一在“W”代號(hào)故不得拆分。)如“乍”因“”、“
”之間雖然粘連,但型式不一致,“”歸v;“
”歸k;故應(yīng)分為兩個(gè)部件,又如“疋”中也由于“
”,“人”粘連型式不一致故應(yīng)分為二個(gè)部件。
(九)“戈”部的字,如果橫筆左端的上、下有其它筆畫,這個(gè)橫筆要斷開,左筆的橫筆可以跟它的上、下筆畫組成另一個(gè)部件。例如“或”應(yīng)拆為一、口、一、戈。
二、建立分類譜系按漢字的部件特征進(jìn)行分類,分為離聚、交叉、包圍、通擋、多腳和字架六種基本型,然后按次要特征逐級(jí)細(xì)分,形成從“型”到“式”到“類”的分類系統(tǒng)。
三、建立代表字母(即代號(hào))采用象形的原則,如用“×”代表“單交叉類”,用“x”代表反向?qū)ΨQ類,然后用“一字多型”的規(guī)律,讓“×”和“x”合并在一個(gè)鍵上,算作一個(gè)代號(hào),這樣可以使較多的“具體字母”的類合并為較少的“代表字母”,便于字根的分類、記憶和輸入。其中本發(fā)明新提出的重要規(guī)則有四面包圍封閉框非直角=A;
分離的二筆畫類=B;
分離的三筆畫類=C;
分離的四筆畫類=D。
用字母譜系表制定的漢字編碼叫作“表形符號(hào)編碼”,簡(jiǎn)稱“表形碼”,用二十六碼元制定的漢字編碼叫作“二十六碼元表形碼”,考慮到不同用戶的需要,“二十六碼元表形碼”有兩種版本,(1)國(guó)內(nèi)版本(用漢語拼音區(qū)別重碼);(2)海外版本(用四類字形區(qū)別重碼)。在現(xiàn)有技術(shù)中,對(duì)用漢語拼音區(qū)別重碼的國(guó)內(nèi)版本已有介紹,而本發(fā)明提出了用四類字形區(qū)別重碼的海外版本。有關(guān)海外版的說明如下1.本發(fā)明采用1-0、①-⑤15個(gè)鍵為副空格鍵(亦稱序位鍵),其作用類似空格鍵,可作為漢字碼元輸入的結(jié)束標(biāo)志。例如代號(hào)A中含有單碼字“又、叉、母、女、及、毋”(表形碼漢字形式部件)媽、戲、雙、奶、一、勸、圣(含有A代號(hào)的簡(jiǎn)碼字),擊“A”并空格結(jié)束時(shí),說明欄中呈現(xiàn)“又1、叉2、母3、女4、及5、毋6、媽7、戲8、雙9、奶0、一①、勸②、圣③、×④、×⑤、”(A④、A⑤的簡(jiǎn)碼字由其他代號(hào)補(bǔ)足)15個(gè)字供選擇上屏。當(dāng)掌握序位法后,即可擊“A3”,屏幕上顯示“母”字,擊“A8”,屏幕上顯示“戲”字,擊“A③”,屏幕上顯示“圣”字,不出現(xiàn)單碼字重碼。
1-0是鍵盤上的1、2、3、4、5、6、7、8、9、0鍵,①-⑤是特定鍵,即鍵盤上的符號(hào)鍵“/”特定為①;“·”特定為②;“,”特定為③;“√”特定為④;“;”特定為⑤鍵。
2、四類字型區(qū)分法它完全依靠字型區(qū)分重碼。
(1)二碼漢字的結(jié)構(gòu)分單列和雙列二種。
如“各”是單列,“如”是雙列。
(2)二碼漢字最后一個(gè)部件是由漢字形式部件組成稱“字式”,例如“示”字最后部件“小”,是字式,最后一個(gè)部件是非漢字部件組成,稱符號(hào)部件故稱“符式”,例如“彤”是符式,從二列,二式形成四類字型區(qū)分法,例如“姐”是雙列字式,區(qū)別代號(hào)是②,編碼是AB②;
“示”是單列字式,區(qū)別代號(hào)是③,編碼是BC③;
“彤”是雙列符式,區(qū)別代號(hào)是2,編碼是GC2;
“少”是單列符式,區(qū)別代號(hào)是3,編碼是CJ3;這就是“四類區(qū)別法”。
三碼的漢字只分“雙列”,“單列”二種,單列區(qū)別代號(hào)是③,雙列區(qū)別代號(hào)是②,三列字如“伽”屬單數(shù),歸單列,區(qū)別代號(hào)也是③,例如“怒”字是三碼字,是單列(中間沒有直通分離溝),故編號(hào)是AAu③;
“嫩”字是三碼字,三列結(jié)構(gòu),歸單列,故編號(hào)是AMA③;
“娟”字是三碼字,雙列結(jié)構(gòu),故編號(hào)是AOG②;
“處”字是三碼字,單列結(jié)構(gòu),故編號(hào)是ALI③;
“艱”字是三碼字,雙列結(jié)構(gòu),故編號(hào)是APK②;
采用單碼字的序位法,二碼字的四類區(qū)別法,三碼字的二列區(qū)別后,仍存在某些重碼字,我們采用一種是“不常用字區(qū)別法”,即在二碼字不常用字后加0或9,例如“
”屬不常用字,它與“扣”重碼,則把“
”字列入“另冊(cè)”,即用0或9作為區(qū)別碼,“
”字編碼是FO0,“扣”的編碼仍是FO②于此區(qū)別,三碼字中如仍有重碼則用簡(jiǎn)碼加以區(qū)別,例如“姓、妊”的編碼都是AJY,是重碼字,現(xiàn)把比較常用的“姓”編為簡(jiǎn)碼(采用頭尾二碼)用④區(qū)別,即編號(hào)為AY④,“妊”仍按照原來編碼為AJY②。此外還有四碼字的重碼字,對(duì)常用字編為簡(jiǎn)碼,(采用頭尾二碼)例如榜,耪二字的編碼都是MINH,“榜”是常用字改為簡(jiǎn)碼,用④為區(qū)別字,這樣“榜”的編碼是“MH④”,“耪”字仍是MINH編碼。上述方法均有專門明細(xì)表記憶不多則基本消除一一、二級(jí)字的重碼。
關(guān)于十五類簡(jiǎn)碼說明本發(fā)明采用1-0,①-⑤十五個(gè)數(shù)字的區(qū)別碼,除了單碼字外,每一種單碼中仍有26×26=676個(gè)雙碼符號(hào),全部組成雙碼簡(jiǎn)碼字共10140組,除在“四類區(qū)別法”,三碼重碼簡(jiǎn)碼,四碼重碼簡(jiǎn)碼采用一部份外仍有九千余詞組。本發(fā)明采用分類詞組辦法,使用、記憶都很方便。
例如①序位中26個(gè)單碼用于數(shù)字,即一A①,二B①,三C①,四Q①,五E①,六I①,七L①,八J①,九N①,十X①,百D①,千K①,萬T①,億Z①,壹Y①,貳S①,叁U①,肆F①,伍G①,陸P①,柒M①,捌W①,玖H①,拾V①,○O①,零R①,則①序位中的二碼全部作為數(shù)字簡(jiǎn)碼(詞組首尾二字的首碼為簡(jiǎn)碼)。例如“二十五”BE①,“六十七”IL①,“一百”AD①,“壹拾伍”YG①。例如我國(guó)人口普查后總數(shù)為十一億三千○一萬七千三百八十一人,運(yùn)用本序位詞組可編成XA①Z①IK①O①AT①LK①CD①JA①V①,非常簡(jiǎn)便。除此之外,序位1中的676組簡(jiǎn)碼專供用數(shù)字開頭的詞組。例如“十一屆三中全會(huì)”XV1,“萬有引力”TX1,“八五規(guī)劃”BS1,“一靠政策,二靠科學(xué),三靠投入”AV1,“一呼百應(yīng)”AJ1……。
序位2中的676組簡(jiǎn)碼專供政、法用語;
例如“馬克思列寧主義”KI2,“毛澤東思想”JM2,“社會(huì)主義”LI2,“最高人民法院”DP2……。
序位3中的676組簡(jiǎn)碼專供經(jīng)濟(jì)用語;
例如“計(jì)劃經(jīng)濟(jì)”IC3,“市場(chǎng)”IY3,“金融機(jī)構(gòu)”VM3……。
序位4中的676組簡(jiǎn)碼專供自然科學(xué)用語;
序位5中的676組簡(jiǎn)碼專供工業(yè)用語;
序位6中的676組簡(jiǎn)碼專供農(nóng)、林、牧、魚、業(yè)用語;
序位7中的676組簡(jiǎn)碼專供商業(yè)、文教衛(wèi)生用語;
序位8中的676組簡(jiǎn)碼專供軍事、體育方面用語;
序位9中的676組簡(jiǎn)碼專供日常生活用語;
序位0中的676組簡(jiǎn)碼專供其它用語;
序位①數(shù)字用詞(已舉例)序位②中的676組簡(jiǎn)碼專供中國(guó)名人名字用簡(jiǎn)碼;
例如毛澤東JV②,江澤民CP②,小平AT②,李鵬MG②,蔣介石HT②,李登輝MC②……等。
序位③中的676組簡(jiǎn)碼專供國(guó)際名人名字用簡(jiǎn)碼;
序位④中的676組簡(jiǎn)碼專供中外地名;
序位⑤中的676組簡(jiǎn)碼專供中外單位名稱;
例如中華人民共和國(guó)Fu⑤,國(guó)務(wù)院uP⑤,冶金部BI⑤……等。
表1-1 全漢字字母譜系表(26碼元表形碼)部件分類表
表4-1 全漢字字母譜系(26碼元表形碼)順序排列表
表4-2
注①單筆②多筆③組合④繁體⑤日、朝漢字
權(quán)利要求
1.本發(fā)明屬于漢字字根編碼計(jì)算機(jī)輸入技術(shù),它從簡(jiǎn)繁二體漢字以及日本漢字、南朝鮮漢字中,按照確定的規(guī)則,整理出全部的字根(即字素),構(gòu)成漢字的全部字根表,作為漢字的拼形字母;本發(fā)明的特征在于漢字字根分為六種類型離聚、交叉、包圍、通擋、多腳和字架,形成從“型”到“式”到“類”的分類系統(tǒng);采用二十六個(gè)拉丁字母作為字根類的代號(hào),并利用字根代號(hào)和字根之間具有外形相似的象形性,便于字根的分類、記憶和輸入。
2.根據(jù)權(quán)利要求1所述的漢字字根編碼計(jì)算機(jī)輸入技術(shù),其特征在于抓住漢字字根和拉丁字母之間的象形性的聯(lián)系,其中最重要的有四面包圍封閉框非直角=A;分離的二筆畫類=B;分離的三筆畫類=C;分離的四筆畫類=D。
3.根據(jù)權(quán)利要求1所述的漢字字根編碼計(jì)算機(jī)輸入技術(shù),其特征在于采用“四類字型區(qū)分法”,不用漢語拼音,完全依靠字型區(qū)分重碼,加上十五類簡(jiǎn)碼字(大部分是高頻字)的運(yùn)用,在漢字電腦輸入中基本消除一、二級(jí)字的重碼。
4.本發(fā)明的全漢字二十六碼元表形碼的字素分類編碼法,可以采用“二十六碼元表形碼”作為漢字字典索引,直接查閱漢字。
全文摘要
本發(fā)明屬于漢字字根編碼計(jì)算機(jī)輸入技術(shù),它從簡(jiǎn)繁二體,漢字以及日本漢字、南朝鮮漢字中,按照確定的規(guī)則,整理出全部字根表,作為漢字的拼形字母,采用二十六個(gè)拉丁字母作為字根類的代號(hào),并利用字根的分類、記憶和輸入。用此法可作為漢字字典索引,直接查閱漢字。
文檔編號(hào)G06F3/023GK1064162SQ91100828
公開日1992年9月2日 申請(qǐng)日期1991年2月12日 優(yōu)先權(quán)日1991年2月12日
發(fā)明者陳錢潮, 陳宗文, 陳向南 申請(qǐng)人:陳錢潮, 陳宗文, 陳向南
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1