專利名稱:三分鐘碼的制作方法
技術領域:
本發(fā)明為一種普及型計算機漢字編碼,也可用于詞典排序等方面。
現(xiàn)有的幾百種漢字編碼,多半按傳統(tǒng)方法把漢字分成筆畫、部件(或叫作部首、字根、字元等)、單字三級。由于部件既多且亂,難以規(guī)范,以致形成混亂,不便應用。
本發(fā)明提供一種對拼音和字形知識要求極低、三分鐘內(nèi)即可學會的漢字編碼,故取名為《三分鐘碼》。
本發(fā)明的技術方案是用漢字讀音的首字母(以下稱作“音碼”)、筆畫和作構字部件用的單字(以下稱作“成字”)的讀音首字母(以下稱作“形碼”)給漢字編碼,不足4碼時加字的首、末筆畫代碼。
附圖
為本發(fā)明的首、末筆畫代碼表。
下面結(jié)合附圖對本發(fā)明作進一步描述常規(guī)4碼取字的音碼和該字首、二、末三形的代碼。這里的“形”包括筆畫和成字。筆畫分“一、丨、丿、丶、乛、”(橫、豎、撇、點、折)5種,“”(捺)作“丶”(點)處理,取碼D。成字取大不取小。如“丁”拆作“一、亅”,故“丁”的前三碼為DIIZ;又如“贛”的首、二、末三形取“章、丿、貢”,不取“立、日、貝”,故“贛”的4碼為GZPG。不足4碼和末形為筆畫時,取字的首、末筆畫代碼作第4碼。(詳見附圖)如“丁”的首、末筆畫為“一、亅”,其代碼為T,故“丁”的4碼為DHZT;又如“拔”的首、二、末三形為“扌、友、丶”,末形為筆畫(丶),不取,改取首、末筆畫“一、丶”,其代碼為R,故“拔”的4碼為BHYR,其中H表首形“扌”的起筆筆畫“一”(橫)。
本發(fā)明對GB二級字作生字處理用V作標識碼,后三碼取法同上。如“齄”可編碼為VBCA,其中V表二級字(代音碼),B、C為“鼻、查”的形碼,A為首、末筆畫“丿、一”的代碼。識得二級字的人也可將其作熟字處理,但要將首、末筆畫代碼改為末筆筆畫碼“一、丨”取碼I(象形),“丿、丶、乛”取碼U。如“齄”的末筆筆畫為“一”,取碼I,故“齄”的熟字碼為ZBCH;又如“朕”的末筆筆畫為“”,取碼U,故“朕”的熟字碼為ZYGU。
本發(fā)明按字的使用頻度和慣例取一、二、三級簡碼。如D-(的),DH-(大),MNM-(媽)。
本發(fā)明的復音詞語編碼格式如下1.二字的如DNRY(電腦),其中DN為=字的音碼,R表“電”的首形“日”,Y表“腦”的首形“月”。
2.三字的如ZJLW(總經(jīng)理),其中前三碼為三字的音碼,末尾的W表“理”的首形“王”。
3.更多字的如SHZY(社會主義),4碼依次為4字的音碼;又如ZHRG(中華人民共和國),4碼依次為一、二、三、末4字即“中、華、人、國”的音碼。
本發(fā)明的主要優(yōu)點是將漢字的拆分從傳統(tǒng)的三級簡化為二級,避開了因概念不清、界限模糊、既多且亂、難以把握的“部件”所造成的種種麻煩和紛爭,使編碼規(guī)則變得十分簡單,無兩可性,不用記憶,也不會忘記,便于普及推廣。
本發(fā)明的主要缺點是成字的數(shù)量較大,給識字不多的人在取音碼時造成困難;重碼率也較高,不利于快速盲打輸入。但作為一種普及型漢字編碼,本發(fā)明的優(yōu)點明顯、突出,具有較大推廣價值。
權利要求
《三分鐘碼》為一種普及型計算機漢字編碼。本發(fā)明取字、筆畫和作構字部件用的成字的拼音首字母給漢字編碼,不足4碼時加字的首、末筆畫代碼,規(guī)則簡單,易學好用,便于推廣。1.一種用字、筆畫和作構字部件用的成字的拼音首字母給漢字編碼的《三分鐘碼》,其特征在于將漢字的拆分從傳統(tǒng)的筆畫、部件(或叫作部首、字根、字元等)、單字三級簡化為筆畫和成字二級,易于編碼,無兩可性,也不會忘記。
2.根據(jù)權利1所述的《三分鐘碼》,其特征在于i)不足4碼或字的末形為筆畫時,取字的首、末筆畫代碼。2)雙字詞取兩字的音碼加兩字的首形碼,即“音音形形”,而不是流行的“音形音形”。
全文摘要
《三分鐘碼》為一種普及型計算機漢字編碼,取字、筆畫和作構字部件用的成字的拼音首字母給漢字編碼,不足4碼或字的末形為筆畫時,取字的首、末筆畫代碼。其主要技術特征是將漢字的拆分從傳統(tǒng)的筆畫、部件和單字三級簡化為筆畫和成字兩極,擺脫了概念不清、界限模糊、既多且亂、難以把握的“部件”所造成的種種麻煩和紛爭,規(guī)則簡單,無兩可性,易學好用,便于推廣。本發(fā)明可應用于計算機漢字輸入和詞典排序等方面。
文檔編號G06F3/023GK1160884SQ9611687
公開日1997年10月1日 申請日期1996年4月1日 優(yōu)先權日1996年4月1日
發(fā)明者夏東明 申請人:夏東明