專利名稱:七形定義漢字形碼編碼方法
技術領域:
本發(fā)明涉及電腦領域中的漢字形碼編碼方法。
我國漢字為方塊字形,按形編碼已成為漢字電腦輸入的一大特點。目前電腦漢字的形碼輸入都是把字根進行無規(guī)律的簡單歸類,難學難記。例如五筆字型中代碼為G的集合內的王旁青頭戔(兼)五一,五個字根。這五個字根之間沒有內在聯系和統(tǒng)一規(guī)律,全靠硬性記憶。而且按這類無科學分類的字根結合來編碼,其固定代碼集合內的字根一個也不能多,一個也不能少,不適合漢字演變的需要,而七形定義漢字形碼編碼可以把所有筆畫,偏旁部首和所有漢字(包括繁體字)的筆畫組合有規(guī)律的統(tǒng)一起來,凡符合某七形形碼定義的筆畫組合都符合該定義代碼,非常靈活規(guī)律強,不隨漢字演變而改動。
針對上述漢字編碼中的實際情況,本發(fā)明的目的在于向公眾提供一種能按漢字筆畫分布與組合規(guī)律,科學地按定義編漢字形碼的方法,解決目前漢字電腦輸入不能按簡單、準確統(tǒng)一的定義來進行編碼的瓶頸問題。
實現本發(fā)明的目的的技術方案是,按照漢字筆畫的分布與組合規(guī)律,將漢字的所有筆畫、偏旁部首及漢字的首形或尾形分為線形、散形、單筆畫連形、折筆畫連形、平行對稱形、封閉形和五行形共七大形態(tài),七大形態(tài)又按定義分為二十六種分形,再配以相應的二十六個大寫英文字母編碼,即得七形定義(形)碼。此種編碼方法把筆畫、偏旁部首和所有漢字(包括繁體字)的筆畫組合統(tǒng)一起來,一個定義確定一個代碼,規(guī)律性極強,便于學習和記憶。
本發(fā)明另一技術特征是,漢字形碼編碼以上述七形定義形碼為主,其具體方案有單漢字的形碼編碼由首形碼+尾形碼+音形碼共三碼組成;
雙字詞語的形碼編碼由第一個漢字的首形碼+尾形碼+第二個漢字的首形碼+尾形碼共四碼組成;三字詞語的形碼編碼由第一個漢字的首形碼+第二個漢字的首形碼+第三個漢字的首形碼+尾形碼;四字詞組的形碼編碼分別取第一、第二、第三、第四個漢字的直形碼共四碼組成;多字詞組的形碼編碼分別取第一、第二、第三和最后一個漢字的首形共四碼位組成;上述的首形碼是指一個漢字以首筆畫為中心符合前述七形定義編碼規(guī)則的形碼;上述尾形碼是指一個漢字以末筆畫為中心符合前述七形定義編碼規(guī)則的形碼;上述音碼是指漢字的聲母碼。
下面結合實施例詳細說明本發(fā)明。
本發(fā)明是在研究筆畫在漢字或偏旁部首中的分布與組合規(guī)律的基礎之上完成的。因此有必要先對筆畫的基本特點和組合規(guī)律加以分析。一、對漢字筆畫特點和組合規(guī)律的分析(一)、筆畫的基本特點1、筆畫是一條連續(xù)的不間斷的直線線段或曲線線段。
例一 丨 丿
乚
亅丶丿2、所有獨立的筆畫都具有兩個端點——即筆畫的起點和終點。
例
以上箭頭所指為筆畫的端點——起點和終點。
3、所有獨立的筆畫都具有線形特征,所謂線形是指象一條線一樣無論是直線,還是曲線都只有兩個端點。(點筆畫可看作是兩個端點的距離非常近的線形)。
(二)、筆畫的組合規(guī)律1、散形組合由至少兩條或兩條以上的獨立筆畫組合成互不連接有規(guī)律的分散狀態(tài)。
例字冷斗情尚認問形熱例形冫
忄 讠門彡灬非上一行韻母及對應數碼在聲母u、v、x、i后表示i行韻母;韻母oc在聲母g、k、h、y后表示韻母iong;聲母g、k、h、y在韻母xi 9 oc后分別表示聲母j、q、x、y;0除外的數碼韻母和韻母xi在聲母b、p、m、d、t、n、l后面表示i行韻母;9除外的數碼韻母和韻母uv在聲母g、k、h、r、a、z、o、c、e、s后面表示u行韻母;其它聲韻組合、韻母接i、u行發(fā)音括號內的數碼韻母重碼時失效。如音節(jié)óǒái ǎi分別用yo’yc’yg’yk’表示,規(guī)則拼式y(tǒng)6y6y7y7表示失效。音節(jié)fǒu用fq’表示規(guī)則拼式fg表示失效。
特定音節(jié)韻母oc5、2、3、8在聲母dt后分別表示韻母uo uan uen ong uei;(其中duǎn和diǎ兩音節(jié)重嗎規(guī)定音節(jié)diǎ用d51表示)韻母oc、mf在聲母nl后分別表示韻母uo uen;韻母l、數碼韻母255聲母n相拼分別表示音節(jié)nünue nuannong;韻母k7、3、字母0、5與聲母r相拼分別表示音節(jié)lülüe luan long;聲母g k h y與韻母xi9相拼分別表示音節(jié)ji0qi0xi0yi0,音節(jié)ji1qi1xi1yi1由規(guī)則拼式表示;音節(jié)zhi chi shi ri zi ci si的韻母用xi9;此外以下特定音節(jié)列對照表一覽本方案 y4y4yl yhyh’ yr’ yr yuy0y0yv iuj0i0iv原方案 ér ěr èr
yū0yú0yǔ0yù0yū1yú1yǔ1yù1本方案ac aiecei be’ bs bife’ fsf0fvfy原方案zhì0zhì1shì0shì1bó bì0bi1fú0fù0fú1fú1fiào本方案d5te l5l5’ l9ligo’k7hc’ ao’ zc原方案dá tuō lí0lì0lí1lì1gé kuí huě zhuó zuò<p>表5
實施例6在這個實施例中,隔離片從多種已被冷軋、退火和回火軋的鋼片制備(0.8mm厚)。通過選擇鋼的種類和退火的方法給予鋼片足夠的拉伸強度和屈服點。通過用有各種表面粗糙性的輥(進行冷軋和回火軋)給予隔離片足夠的表面粗糙度(Ra)。
回火軋鋼片進行鋅電鍍(20g/m2Zn),隨后用酪酸鹽處理(有20mg/m2的Cr)。
電鍍的硅酸鹽處理的鋼片用含100重量份的環(huán)氧樹脂和5重量份(作為固體)的硅氧烷樹脂的樹脂溶液涂層。烘焙后,樹脂溶液變成樹脂涂層薄膜,3μm厚,起到隔離涂層的作用。通過改變三聚氰胺樹脂(能與環(huán)氧樹脂交聯)的量和烘焙溫度調節(jié)樹脂涂層薄膜的硬度。
根據下面方法檢測因而得到的隔離片。附帶地,在這個實施例中所有的樣品都發(fā)現接觸角大于15°,這是通過上述實施例1使用的檢測接觸角的同樣檢測確定的。
(1)拉伸特性樣品檢測了拉伸和屈服點,這是根據JIS Z2241(對金屬材料的拉伸檢測方法)使用在JIS Z201規(guī)定的樣品進行的。沒有一定的屈服點的樣品被認為<p>表2-2
<p>表聚合實驗的結果
蠟的比例通過凝膠滲透色譜測定,溶劑1,2,4-三氯苯,溫度140℃。
17-甲基雄甾烯的合成
薄氏等[Daniel Bertin和Lucien Nedelac,Memoires Presentes a laSociete Chimique,1964,No.345,p.2140]。
因此,可合成的化合物包括上述化合物,以及它們衍生出的化合物;即,與A1,A3,A4,A5,A8,A9,A10或A11結合的在1α,2α,4,6α,6β,7α,16或17位帶有甲基的N1,以及帶有17-甲基的A2和A6。
鹵代雄甾烯
美國專利3,413,321。<p>表1
表1
表1
表1
表1
表1
表1
例字 首形+尾形+音=碼字 首形+尾形+音=碼方(丶)
f AOF 談 (讠) (火) T EZT舌(亻) (口) S IRS 冷 (冫) (マ) L CML岡(冂) (ㄨ) G BJG 提
T KIT果(田) (木) G TWG 獵
(日) L LSL(2)、如果一個漢字為多音字其音碼可取任一拼音聲母。
例字 碼 字 碼 字 碼 字 碼重 IPC參 NDC校 EJX惡 REE重 IPZ參 NDS校 WJJ惡 REW(3)、對于沒有讀音的偏旁部首或字根的輸入在首尾碼后加字母V,作為音碼。
例首形碼尾形碼音碼首形碼尾形碼音碼(A AV) (X XV)(A AV) (A IV)(N AV) (E EV)(B BV) (L AV)國標所屬6763個漢字編碼見七形定義音形碼表。
(4)、繁體字是漢字文化的一部分。為了研究和使用的需要,如港、澳、臺地區(qū)由于各種原因仍然大量地使用繁體字,所以解決繁體字的輸入具有重要的意義,而七形定義形碼既能輸入簡化漢字又能輸入繁體漢字。
繁體漢字的輸入方法與簡化字的輸入方法一樣也是取以首筆畫為中心符合七形定義形碼的形碼為首形碼,取以末筆畫為中心符合七形定義形碼的形碼為尾形碼。取漢字的拼音聲母為音碼。
例馬(OAM) 車(NGC) 間(ESJ) 見(BLJ)馬(VDM) 車(GGC) 間(SVJ) 見(TKJ)在實際操作輸入中,繁體字的輸入不是經常性的。所以應把簡化字與繁體字分為兩級,如果需要輸入繁體字則可以用功能鍵來轉換,以提高簡化字的輸入速度。
(5)、在對半包圍(匠字框)或全包圍口(大口框)的形碼中,如果漢字的首形和尾形為同一體,則首形碼取首形,尾形碼取以次末筆畫為中心符合七形定義形碼的形碼。
例 字首形 尾形 碼 字 首形 尾形 碼首區(qū)匚ㄨBJQ首樞 木匚WBS尾匠匚BGJ尾筐 匚HBK一回口口RRH異咽 口口RRY體圍口
ROW體恩 口心REE2、詞匯碼編碼輸入使用詞組輸入會使?jié)h字的輸入速度更快。所有的詞匯碼都是四碼位。詞匯在代碼的取碼規(guī)則分為以下四種類型。
(1)、雙字詞雙字詞的編碼取法為依次序取每個單字符合七形定義的首形+尾形,共四碼組成。
例詞組首形+尾形+首形+尾形=碼漢字 氵+ 又 + 宀 +
=(YMFK)中華 中 + 中 + 亻 + 十 =(SSIG)關心 丷 +
+
+
=(CHEE)戰(zhàn)場
+ 丶 +
+
=(GAZO)(2)、三字詞三字詞的編碼取法為取前兩個字的首形碼,取最后一個漢字的首形碼和尾形碼共四碼組成。例詞 組首形+首形+首形+尾形=碼計算機 讠 + + 木 + 幾 =(EHWB)中國人 中 + 口 + 人 + 人 =(SRJJ)共青團
+ + 口 +
=(RPRL)司令部
+
+ 立 + 阝=(AJDB)
(3)、四字詞四字詞組的編碼,分別取四個單字的首形碼共四碼組成。
例詞組 首形+ 首形+ 首形 + 首形 =碼科學技術 亻 +
+
+ 木 =(IFKW)五筆字型
+ + 宀 + 開 = (HHFU)生產關系 +
+ 丷 +
=(HDCN)人民日報 人 + 民 + 日 +
=(JVSK)(4)、多字詞多字詞組的編碼,分別取第一、第二、第三、及最后一個字的首形碼,共四碼組成。
例詞組首形+首形+首形+首形=碼中國人民解放軍中 + 口 + 人 + 冖 =(SRJB)寧夏回族自治區(qū)宀 +
+ 口 + 匚 =(FHRB)3、單字與詞組混合輸入七形定義碼可實現純單字輸入,也可以實現單字與詞組混合輸入。由于單字輸入是三個碼位所以混合輸入時要在單字的三個碼位后加擊一個空格健。
例單字 單字 詞組=單字碼 +單字碼 +詞組碼我是 學生=LAO空格+SIS空格+FKHP4、重碼處理七形定義音形碼的純單字輸入由于只使用了首形碼+尾形碼+音碼共三個碼位組成,所以重碼只占國標6763個漢字的三分之二左右。大部分為兩個字,三個字一組的重碼,四個字至九個字一組的重碼極少如采用高頻漢字先上屏幕的原則,則有60-70%左右的漢字只需擊三次鍵就能完成七形定義音形碼的純單字輸入,實現了漢字易學易記快速輸入的目的。詞組重碼的輸入用選擇鍵進行選擇。
(二)、七形混合定義音形碼漢字編碼輸入法本發(fā)明七形定義形碼是完全按定義對筆畫組合進行歸類的取碼方法。此種取碼方法可以把筆畫、偏旁部首和所有漢字(包括繁體字)的筆畫組合統(tǒng)一起來,一個定義確定一個代碼規(guī)律性極強。但由于漢字的結構復雜,一方面要求取碼有易學易記和規(guī)律性極強的特點,另一方面又要求重碼極少甚至是無重碼。我們以七形定義碼為主體調整部分偏旁部首的筆畫組合,就成為一套七形混合定義編碼。與上述七形定義形碼相比一是擴大了編碼的空間容量,二是減少了重碼。
1、七形混合定義編碼方法(1)把心(心字底)從鉤散形分離出來歸入五行中的金行(钅心代碼X)。
(2)、把辶(走字底)從順時針折筆連形中分離出來歸入五行中的水行(氵,代碼Y)。
(3)、把筆畫組合人字形(包括人從眾貝頁亥字的尾形)從斜斜連形中分離出來歸入豎平行對稱形(艸,人從眾貝頁亥代碼Q)。
(4)把尾形點(丶)從筆畫線形中分離出來歸入混散形(廣疒宀
,代碼F)。
(5)、把偏旁部首(竹字頭)從橫斜連形中分離出來歸入斜斜連形(,ㄨ
代碼J)。
(6)、把偏旁部首足(足字旁)從單直封閉形中分離出來歸入斜鉤連形(足,
代碼L)。
2、七形混合定義音形碼漢字編碼輸入混合定義音形碼的純單字輸入、詞組輸入、繁體字輸入與七形定義音形碼的輸入方法相同,不同的是調整后的筆畫組合和偏旁部首不能按定義取碼。
例七形定義音形碼 七形混合定義音形碼思——TES 思——TXS過——KMG 過——KYG貝——BJB 貝——BQB寸——KAC 寸——KFC龍——HAL 龍——HFL筆——HKB 筆——JKB
表1
表權利要求
1.一種電腦漢字形碼的編碼方法,其特征在于它將漢字的所有筆畫、偏旁部首及漢字的首形或尾形按筆畫的分布與組合規(guī)律分為線形、散形、單筆畫連形、折筆畫連形、平行對稱形、封閉形和五行形七大形態(tài),此七大形態(tài)又按定義分為二十六分形,配以相應的二十六個大寫英文字為編碼。
2.如權利要求1所述的電腦漢字形碼的編碼方法,其特征在于七大形態(tài)下屬的二十六分形分別為線形分為筆畫線形、組合線形;散形分為雙散形、多散形、鉤散形、混合散形;單筆畫連形分為橫豎連形、橫斜連形、豎斜連形、斜斜連形、直鉤連形、斜鉤與鉤鉤連形;折筆畫連形分為順時針折筆畫連形、逆時針折筆畫連形、折鉤筆畫連形;平行對稱形分為橫平行對稱形、豎平行對稱形;封閉形分為單直封閉形、雙直封閉形、多直封閉形、斜封閉形、鉤封閉形;五行形分為金行、木行、水行、火行、土行。
3.如權利要求1、2所述的電腦漢字形碼編碼方法,其特征在于單漢字的編碼由首形碼+尾形碼+音形碼組成;所述首形碼是一個漢字以首筆畫為中心符合上述七形定義編碼規(guī)則的形碼,所述尾形碼是一個漢字以末筆畫為中心符合上述七形定義編碼規(guī)則的形碼,所述音碼是以漢字的聲母為編碼。
4.如權利要求3所述的電腦漢字的編碼方法,其特征在于沒有讀音的偏旁部首或字根,其音碼為大寫英文字母V。
5.如權利要求1、2所述的電腦漢字形碼的編碼方法,其特征在于雙字詞語的編碼由第一個漢字的首形碼+尾形碼+第二個漢字的首形碼+尾形碼組成,三字詞語的編碼由第一個漢字的首形碼+第二個漢字的首形碼+第三個漢字的首形碼+尾形碼組成,四字詞語的編碼方法由第一、第二、第三、和第四個漢字的首形碼共四碼組成。多字詞語的編碼方法由第一個漢字、第二個漢字、第三個漢字和最后一個漢字的首形碼共四碼組成,所述首形碼是一個漢字的首筆畫為中心符合上述七形形碼定義編碼規(guī)則的形碼,所述尾形碼是一個漢字以末筆畫為中心符合上述七形形碼定義編碼規(guī)則的形碼。
全文摘要
本發(fā)明公開了一套能夠用明確、統(tǒng)一、簡單的定義來對所有漢字(包括繁體字)的形碼進行編碼的方法,它將漢字的所有筆畫、偏旁部首及漢字的首形或尾形按筆畫的分布與組合規(guī)律分為七大形態(tài)二十大分形,配以相應的二十六個大寫英文字母取漢字形碼代碼,從而解決了漢字電腦輸入不能按定義取碼的瓶頸問題。
文檔編號G06F3/023GK1245918SQ9911494
公開日2000年3月1日 申請日期1999年6月18日 優(yōu)先權日1999年6月18日
發(fā)明者廖周剛 申請人:廖周剛