亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

字塊碼暨頻度字庫(kù)的制作方法

文檔序號(hào):6407296閱讀:201來源:國(guó)知局
專利名稱:字塊碼暨頻度字庫(kù)的制作方法
技術(shù)領(lǐng)域
(讀作“梁氏”)字塊碼以方便于電子計(jì)算機(jī)的漢字應(yīng)用為主,另外可用于文字處理機(jī)、字典排序、電報(bào)通訊等。張梁字庫(kù)可取代現(xiàn)行通用Ⅰ、Ⅱ級(jí)漢字庫(kù)。排布方式的新穎且提供了知識(shí)字典、識(shí)字手冊(cè)編排的參照。
二、對(duì)編碼與字庫(kù)的解釋性說明
1°受編碼評(píng)估、計(jì)算機(jī)應(yīng)用發(fā)展趨勢(shì)、知識(shí)素質(zhì)層次、知識(shí)面等綜合因素的制約影響,迄今為止包括已較廣泛應(yīng)用于電子計(jì)算機(jī)的有關(guān)編碼,一般都不盡如人意。有的科學(xué)性不夠,不能與漢字文化協(xié)調(diào)進(jìn)步;有的應(yīng)用方式不理想,操作記憶煩瑣;有的應(yīng)用模式僵死單一,價(jià)值性不高。編碼猶如戲劇的一劇之本?;厩芳?,實(shí)施構(gòu)想層次不高,自然難以形成對(duì)計(jì)算機(jī)漢字應(yīng)用的飛躍。
2°Ⅰ、Ⅱ級(jí)字庫(kù)模式陳舊;對(duì)貯存單元浪費(fèi)驚人;音序方式與部首方式互不協(xié)調(diào);不少字常用、非常用歸類欠理想;錯(cuò)字(例如“齄”)、別字(例如“鹼”、“諮”)為數(shù)不少;已不使用的死字很多;一些使用頻度不低的字沒有收入(例如“杧”、“
”、“獴”)。余不贅述。尤為嚴(yán)重的是,相當(dāng)缺乏現(xiàn)代氣息,物理序號(hào)毫無意義。

碼起始研究于1985年,方案模式、相關(guān)理論早已成熟?,F(xiàn)配備的是貝貴琴·張學(xué)濤《漢字頻度統(tǒng)計(jì)》(88·4版)為底本,且重新整理的“張梁字庫(kù)”。對(duì)Ⅰ、Ⅱ級(jí)漢字庫(kù)結(jié)合《新華字典》篩選后,總計(jì)6144個(gè)漢字。已全部進(jìn)行了編碼。目前漢字計(jì)算機(jī)應(yīng)用的輸出、打印已相當(dāng)先進(jìn),突出問題在輸入顯示手段,
碼結(jié)合張梁字庫(kù)的軟件實(shí)施最理想有效地解決了這一問題。
三、感知
碼的預(yù)備知識(shí)
S碼以英語字母為碼元,取碼為有關(guān)音節(jié)第一字母,一般四碼等長(zhǎng)。但由軟件實(shí)施,總體碼長(zhǎng)可遠(yuǎn)小于4。
1、筆劃分類橫(H),豎(S),撇(P),點(diǎn)(D),捺(N),提(T),鉤(G),折(Z)。
其中前六種運(yùn)筆方向基本不變,運(yùn)筆方向改變且?guī)с^的即為“鉤”(比如“
”、“
”),否則便為“折”(比如“
”、“
”)。
2、字形分類(1)近字字形。例如“
”、“
”,與相關(guān)字對(duì)應(yīng)(相當(dāng)于“羊”、“牛”)。
(2)、“特征詞”字形。例如“犭”(反犬旁),“灬”(四點(diǎn)底),即與“特征字”對(duì)應(yīng)(相當(dāng)于“犬”、“點(diǎn)”)。
(3)不可讀字形。例如“
”、“
”,碼元對(duì)應(yīng)于字母O。
3、基本字形表[筆畫變形明顯可辨的不收入,比如“
(牛)”,等等]
①比較熟悉的基本字形表
上述字形很容易建立與對(duì)應(yīng)字的確定性關(guān)聯(lián)
②不太熟悉的基本字形表(一般為發(fā)明人定義)
上述字形只要稍看幾遍也就熟悉了,不難建立共識(shí)。有的字形不等于絕對(duì)不可分。比如“
→白、兒”、“系→幺、小”,等等。
4、發(fā)明人定義的理論系列
-單位字指習(xí)慣意義上的可讀性字根。
-字塊地位特殊的筆畫,結(jié)構(gòu)明顯的字形,單位字或筆畫、字形、單位字的一定組合結(jié)構(gòu)。比如“繼”、“
”、“米”、“
”都是字塊;“徽”,“彳”、“山”、“
”、“幺”、“小”、“攵”也都可看作字塊;“徽”習(xí)慣上也看作三個(gè)單位字塊;“德”則有五個(gè)單位字塊。
在熟悉字塊理論系列后,字的單位字塊的劃分就有了顯然性。
-字型字塊指最小的不可分拆的可讀性單位字塊。簡(jiǎn)稱“定型”字。定型字不一定是筆畫較少或字形獨(dú)體的字。不便分拆往往為主要特征。比如“谷”、“豆”、“舞”、“囊”等等。定型字中可含有單位字。但是定型字只有一個(gè)單位字塊。
不可分字形不妨叫作“字形字”(正象單細(xì)胞生物有的介于動(dòng)植物一樣,字“冘”、字形“
”等介于可讀不可讀之間,發(fā)明人統(tǒng)之為“字形字”)。因此,“孑”單個(gè)時(shí)是字,作偏旁時(shí)是字形字。
含有一個(gè)、二個(gè)、三個(gè)單位字塊的漢字分別叫作“一維”、“二維”、“三維”字;多于三個(gè)單位字塊的漢字便是“多維”字(如是比擬于1~多維空間)。發(fā)明人規(guī)定字的辨析以三維分拆為基礎(chǔ)(這是介于二維-習(xí)慣的思維模式-以及四維或多維(比如支秉彝的“見字識(shí)碼”)的最理想適用的分拆模式)。
-字元字塊專指單個(gè)字時(shí)可分、成為字的一部分時(shí)不分的可讀字。簡(jiǎn)稱“字元字”。比如“內(nèi)→冂、人”但“鈉→钅、內(nèi)”;“或→戈、口、
”但“域→土、或”;等等。由是,原來“字元”的概念涵義不復(fù)存在。
-島狀字塊指與周圍有明顯隔斷分界的字塊。“疆”因此含七個(gè)單位字塊。島狀特征是辨析漢字分拆的最顯著標(biāo)志之一。
-界狀字塊指與周圍有明顯分界但不隔斷的字塊。比如單位字與單位字的界離(“古→十、口”);偏旁部首與非規(guī)則字塊的界離(免→
,兼→
);單位字與特殊字形的界離(縣→且、厶,至→
、土);等等。界狀分隔也是漢字分拆的最顯著標(biāo)志之一。界狀與島狀的相差猶如骨隙的大小,是漢字分拆(庖丁解牛)的關(guān)鍵所在。這樣,“錦”是三維字清晰醒目。
-對(duì)狀字塊需具下述特點(diǎn)(ⅰ)兩字塊大致左右對(duì)稱(ⅱ)不含明顯的字(字形)(ⅲ)或組合成字,或成為字的一部分時(shí)地位不很顯著。比如“
”、“
”大致左右對(duì)稱?!奥选?、“兆”不含明顯的字(字形),且為單個(gè)字(與“印”,“北”)不同,前者有字形“卩”;后者含字“匕”。“兜”中的“[]”地位不很顯著,但“麗”中的“
”為單位字塊。
由此可見,對(duì)狀字塊范疇的本質(zhì)是與碼元的對(duì)應(yīng)關(guān)系。而不是出現(xiàn)在漢字中的結(jié)構(gòu)形式。讓對(duì)狀字塊與一個(gè)碼元相對(duì)應(yīng)顯然比較適宜合理。因此,“非”是一維字,“印”是二維字,“兜”、“麗”都是三維字。由是,成字(包括可讀字形)與否往往是考察分拆的前提。同時(shí),什么樣的字為定型字至為重要。它們一般為下述四種類型范疇
(1)疊粘類這是最好識(shí)辨的。比如“垂”、“柬”、“再”、“丈”等等。往往俗稱獨(dú)體字。其中“橫”不具特殊意義(因此“再”不宜“一、冉”,但“滅→一、火”為好)。
(2)離散類比如“川”、“豆”、“二”、“父”、“谷”、“今”、“氣”、“司”、“心”、“俞”,等等。多偏重形的結(jié)構(gòu)穩(wěn)定性與取碼方便。
(3)聚合類比如“州”、“予”、“魚”,等等。聚合類適于較多的為取碼明確簡(jiǎn)便,減少辨析麻煩的字?!俺唷薄ⅰ岸?、“發(fā)”、“亥”、“欠”、“舞”、“襄”、“以”、“亦”等皆是。仍需注意的是,界狀結(jié)構(gòu)的字不應(yīng)看作聚合類定型字。比如“兼→
”,“單→
”,“至→
、土”,等等。其中“
(草字頭)”、“
(八字頭)”。不可讀字形對(duì)應(yīng)于O。
(4)固化類帶有明顯的規(guī)定性。比如“風(fēng)”、“可”、“鹿”、“四”、“田”、“元”、“云”、“卡”、“出”,等等。
四、
編碼方案及輔助理論
1、三維模式的道理與依據(jù)
(ⅰ)三維的漢字相當(dāng)可觀,可以說不亞于二分字。二分的某一結(jié)構(gòu)往往還是二分(ⅱ)三維方式有傳統(tǒng)影響性。比如“劉”姓繁體為“卯、金、刀→劉”;“土、口→袁”“刀、口→邵”等也是著眼于三維(ⅲ)人們的信息感知,對(duì)三個(gè)來源的反應(yīng)恰到好處(ⅳ)三維方式更理想充分地利用編碼元素,致使重碼率劇低(ⅴ)發(fā)明人的理論系列與對(duì)策措施使三維編碼有簡(jiǎn)便而完滿成立的基礎(chǔ)與條件。
2、編碼方案
字的讀音的第一字母為第一碼。其他三碼按筆畫或單位字塊的書寫順序依次給出。不可讀字塊取碼為O。
①對(duì)于三維字,三個(gè)單位字塊的讀音的第一個(gè)字母分別為第二、三、四碼。比如“拋→PSJL”;“徽→HROW”;“麗→LYOO”。
②對(duì)于二維字,第二、三碼按字塊給出不變,第四碼以第二字塊收筆筆畫特征字讀音第一字母取代。比如“匝→ZKJS”。
③對(duì)于一維字,第二碼按字塊(亦即該字本身)給出不變,第三碼對(duì)應(yīng)起筆,第四碼對(duì)應(yīng)收筆。比如“事→SSHG”。原字只有一筆,第四碼取O。比如“一→YYHO”、“乙→YYGO”。原字不具筆畫,第三碼也取O。比如“○→LLOO”。
有些特高頻字為提高使用速率,軟件實(shí)施時(shí)可特殊處理。比如“的”,可打它的物理序號(hào)1(即0001);“了”,可打入L。即知道物理序號(hào)的,可直接敲數(shù)字鍵給出;字母編碼的最常用字亦少于四碼。
④對(duì)于多維字,按第一、二、末個(gè)單位字塊對(duì)應(yīng)第二、三、四碼。這樣,對(duì)多維字的感知速率等同于三維字。由是,能按多維分拆的字多維處理,有助于平滑碼元的相對(duì)集中,減少重碼率。比如“樊”→FMOD”,“垢→GTCK”,“櫥→CMCC”,“疆→JGTY”。
注意由于某些可讀字過于冷僻,已作字形看待。這類字對(duì)應(yīng)碼元亦為O。如上述“爻”;再比如“冘”、“亍”、“乇”,等等。
對(duì)于配備詞庫(kù)的軟件系統(tǒng),找詞編碼相當(dāng)于字碼的“延伸”。即對(duì)于四個(gè)字以上的詞組,按第一、二、三、四(末)個(gè)漢字取碼。比如“中華人民共和國(guó)(ZHRG)”;“南京大學(xué)(NJDX)”。三個(gè)字的詞組,第四碼以第三個(gè)字的收筆取代。比如“黑龍江(HLJH)”。兩個(gè)字的詞組,則前一個(gè)字起筆取代第三碼,后字收筆取代第四碼。比如“中國(guó)(ZGSH)”。
3、有關(guān)輔助理論
有了字塊系列概念與三維模式基礎(chǔ),把握了定型字的四種類型范疇,一般地,對(duì)漢字進(jìn)行編碼已相當(dāng)簡(jiǎn)便。我們可對(duì)任意的短文、句式、字詞進(jìn)行編碼實(shí)踐,能馬上感受方案的方便易學(xué),確定性強(qiáng)。
為使?jié)h字分拆能更為準(zhǔn)確、迅速。再加強(qiáng)輔助理論如下
在可否分方面,發(fā)明人規(guī)范
(1)“負(fù)負(fù)得正”原則一個(gè)字由兩個(gè)不全為近字字形字的字塊構(gòu)成,才視之為定型字。比如“甸→勹、田”,“包→勹、已”;但“勺”,“勿”,“匆”等為定型字。這樣,你是否感到“臣”與“叵”、“區(qū)”等確有區(qū)別?
(2)辨、速優(yōu)先原則筆畫有“輕重”之分。比如“刃→刀、丶”,“辦→力、丶、丶”;“壓→廠、土、丶”與“凡”、“為”、“厭”不同,后者為定型字。這樣,“少”與“午”,“百”與“亞”,區(qū)分有可辨的感覺嗎?
這類情形多出現(xiàn)于字元字,它們成為字的一部分,一般也就不需分拆。
這樣,感覺因素與科學(xué)嚴(yán)謹(jǐn)相結(jié)合,加強(qiáng)了分拆與否的明確性。比如“辦”的兩點(diǎn)由簡(jiǎn)化而來;“滅”的橫有“指事”意味;“百”是形聲結(jié)構(gòu);等等。
在速率方面,注意恰當(dāng)?shù)哪:庾R(shí)。比如“戊、戉、戌、戍、成、咸、威、戚”等都不再分拆。由是,“乖→千、
、匕”,“乘”為定型定?!八?、爻、爻”,“噩”為定型字。
在怎樣分方面,發(fā)明人規(guī)范
(3)形、頻優(yōu)先原則“男”與“果”由于有否分界而成為二維字與一維字?!白摺彪m是習(xí)慣意義上的偏旁部首,但在發(fā)明人的“界狀”概念中淡化了?!巴健?、“徙”不都是三維字嗎?“容”宜“宀、谷”不能作“穴寶蓋”處理。因?yàn)椤肮取笔嵌ㄐ妥智掖_實(shí)“寶蓋頭”形式好。
成為定型字或字形字的單位字塊結(jié)構(gòu)叫作“絕定穩(wěn)定結(jié)構(gòu)”。某些字塊的可分析結(jié)構(gòu)叫作“相對(duì)穩(wěn)定結(jié)構(gòu)”?!白摺笔窍鄬?duì)穩(wěn)定的,“谷”是絕對(duì)穩(wěn)定的。
下述字(形)例都成了相對(duì)穩(wěn)定的結(jié)構(gòu)了
弟、第;古、舌、
;充、棄;卒、率;競(jìng)、竟;夋、
;等等。這樣,把它們看作是可分拆的,不僅在理論上是應(yīng)當(dāng)?shù)呐c必須的,而且在實(shí)踐上是可感知的與清晰的,更有多方面的優(yōu)化編碼質(zhì)量的好處。
“形”的方面。另外還要注意框架結(jié)構(gòu)的包容程度。比如“筒→
”,但“源→氵、廠、白、小”。注意“
”結(jié)構(gòu)上方字形的可辨程度。比如“膏→
、口、
、口、月”。但“骨→
、月”。
對(duì)于“頻”的認(rèn)識(shí)遇到一個(gè)字時(shí),首先考慮三分;再確定屬于獨(dú)體、二分、多維的哪一種情況。在三維劃分時(shí),“填”應(yīng)當(dāng)“土、直、八”比“土、十、具、”好。這表明島狀結(jié)構(gòu)具有獨(dú)立優(yōu)勢(shì)?!霸睉?yīng)當(dāng)“氵、木、旦”比“氵、杳、一”好。僅管后者各呈島狀結(jié)構(gòu),還是遜于習(xí)慣性理解的作用。
(4)“分散協(xié)調(diào)”原則在三維模式下,
“地位協(xié)調(diào)”例如“敢→
、耳、攵”,“蒙→
、一、豕”。醒目的筆畫、字形、可讀字地位平等。
“形態(tài)協(xié)調(diào)”例如“候→亻、丨、
”,“贏→亡、口、
”。
“字義協(xié)調(diào)”例如“觸→
、用、蟲”,“解→角、刀、牛”;“踐→口、止、戔”,“路→、攵、口”。界狀字塊的分聚真是既靈活又自然。
由是,“器”絕不作“哭、口、口”而作“
、犬、
”;“蠢”絕不作“
、日、
”而作“春、蟲、蟲”,等等。這就是協(xié)調(diào)的作用。
“維變協(xié)調(diào)”一個(gè)字以三維為基礎(chǔ),卻是看上去怎樣恰當(dāng)就怎樣分。下面的一些字現(xiàn)在看起來,三維結(jié)構(gòu)蠻不錯(cuò)
貴(中、一、貝);蚓(蟲、弓、丨);虱(乙、丿、蟲);壓(廠、土、丶);養(yǎng)(
);或(戈、口、
);局(尸、
、口);繼(
)
下面的一些字,也真是多維結(jié)構(gòu)好
疑;能;德;鐐;瀑;棱;峻;…
五、結(jié)合張梁字庫(kù)關(guān)于
碼的軟件實(shí)施構(gòu)想(關(guān)鍵框圖部分見附圖
)
1、有關(guān)數(shù)據(jù)庫(kù)的建立(視機(jī)型設(shè)備從簡(jiǎn)或從略)
①?gòu)埩鹤謳?kù)點(diǎn)陣數(shù)據(jù)區(qū)
亦即Ⅰ、Ⅱ級(jí)字庫(kù)全部按張梁字庫(kù)編排。這樣,6144個(gè)漢字共192K字節(jié),比原字庫(kù)節(jié)省近34K(其中單元浪費(fèi)近14K,不用漢字近20K)。適于芯片處理。字庫(kù)四級(jí)二擋第一級(jí)為經(jīng)常用字,前512個(gè)漢字為最常用字,后512個(gè)漢字為常用字。第二級(jí)為次常用字,前512個(gè)漢字為較常用字,后512個(gè)漢字為尚常用字。第三級(jí)為基本用字,前1024個(gè)漢字為頻高字,后1024個(gè)漢字為頻低字。第四級(jí)為冷僻用字,前1024個(gè)漢字為稀用字,后1024個(gè)漢字為罕用字。張梁大字庫(kù)則可擴(kuò)充至8192個(gè)漢字共258K;第五級(jí)為備用字,前1024個(gè)漢字為準(zhǔn)保留字,后1024個(gè)漢字為可淘汰字。
②聯(lián)綿字?jǐn)?shù)據(jù)區(qū)
這里的聯(lián)綿字特指給出第一個(gè)字,后續(xù)字唯一的二字詞組。這樣,輸出第一個(gè)字,第二個(gè)字隨之輸出而不需敲鍵。比如“氆(5084)氆(5085)”、“倜(5101)儻(5102)”,等等。DATA按…,5084,5101?!帕?。
③一碼、二碼、三碼鍵對(duì)應(yīng)字?jǐn)?shù)據(jù)區(qū)
為使部分最常用漢字的輸入顯示更為迅速,有些字可只對(duì)應(yīng)一、二、三個(gè)碼元,比如“是(S)”,“了(L)”,“不(B)”,等等。

編碼區(qū)
四個(gè)字母四個(gè)數(shù)字連排,四個(gè)字母即
碼,四個(gè)數(shù)字即字庫(kù)序號(hào)。同碼字按貝貴琴、張學(xué)濤《漢字頻度統(tǒng)計(jì)》前后為序。為方便使用,可含歧音字。
⑤含*編碼數(shù)據(jù)區(qū)
用戶對(duì)具體字編碼某一碼元含混不清時(shí)(比如“罡”不知其讀音),可鍵入*取代(即按*SZH),則ASZH,BSZH,…存在的對(duì)應(yīng)字按字典編排,以供檢索。*為第二、三、四碼時(shí)如法泡制。
⑥詞組區(qū)
編排方式相當(dāng)于
編碼區(qū)。比如“中華人民共和國(guó)ZHRG0080007900840085012700450081”;“南京大學(xué)NJDX0475047700900150”;“黑龍江HLJH063013660712”;等等。
⑦碼本檢字(符)區(qū)
由于字庫(kù)序號(hào)的應(yīng)用意義增強(qiáng),查找序號(hào)可按512個(gè)漢字滿屏顯示按鍵切換給出,其中包括所有漢字結(jié)束以后的全部字符區(qū)(也可直接切換轉(zhuǎn)入)。字符計(jì)為各類偏旁,各有關(guān)常用字母(比如希臘字母π、α、β等),各種符號(hào)(比如±,≥,→, ( )/() ,§,△,
等)。個(gè)別字檢字可按筆畫數(shù)(兩個(gè)數(shù)字),首尾最小單位字塊(兩個(gè)字母)方式查找,比如“罡(10SZ)”,“(17CT)”。
2、結(jié)合框圖的軟件創(chuàng)新功能
①當(dāng)前字±i功能
按加號(hào)鍵+時(shí),再按+則輸出+;不按+再按數(shù)字鍵i(1≤i≤9),則輸出當(dāng)前字序號(hào)+i的對(duì)應(yīng)漢字。按減號(hào)鍵-時(shí),再按-則輸出-;不按-再按i則輸出當(dāng)前字序號(hào)-i的對(duì)應(yīng)漢字。
②局部重復(fù)功能
按進(jìn)格鍵→時(shí),再按→,右行一格且恢復(fù)原對(duì)應(yīng)格字符;不按→再按1~4的數(shù)字鍵,則當(dāng)前字按1~4個(gè)字重復(fù)給出(不含標(biāo)點(diǎn))。比如“反反復(fù)復(fù),反反復(fù)復(fù)”,操作方式為
鍵入“反”,鍵入“→1”,鍵入“復(fù)”,鍵入“→1”,鍵入“,”,鍵入“→4”。③聯(lián)綿字功能(已述,略)。
④四個(gè)字母含*鍵檢索漢字功能(已述,略)。
⑤序號(hào)式、編碼式輸入漢字不切換功能。直接打數(shù)字時(shí),物理序號(hào)對(duì)應(yīng)漢字隨之顯示,除認(rèn)可外,二位數(shù)對(duì)應(yīng)漢字覆蓋一位數(shù)對(duì)應(yīng)漢字,三位數(shù)、四位數(shù)相同。字母編碼不足4碼亦安排認(rèn)可鍵。
比如鍵入“1”(0001),輸出“的”,再鍵入“3”(即0013),輸出“定”覆蓋“的”;再鍵入“2”(0132),“合”取代“定”;再鍵入“4”(即1324),“螺”取代“合”。又比如鍵入“L”且認(rèn)可,則輸出“了”。
六、有關(guān)數(shù)據(jù)分析看
碼的特色
1、GB-1Z部323個(gè)漢字,單碼字256個(gè),占79.3%,余下的是26個(gè)碼對(duì)應(yīng)兩個(gè)漢字;一個(gè)碼對(duì)應(yīng)3個(gè)漢字,兩個(gè)碼對(duì)應(yīng)5個(gè)漢字。雖多次校正變動(dòng)。但統(tǒng)計(jì)數(shù)據(jù)基本不變,漢字相對(duì)于用碼之比為1.13(注意這是發(fā)明人給出的檢測(cè)指標(biāo),比值為1沒有重碼),重碼率驚人的理想。其他聲部會(huì)更好!這是用碼元素多(26個(gè)字母約20個(gè)),使用充分,平滑程度好,信息容量大(20×20×20×20),編碼法則理想等本質(zhì)因素確定的。
2、《漢字常用字表》3500個(gè)漢字的分維情形是,一維字261個(gè),二維字1295個(gè),三維字1765個(gè),多維字179個(gè)。分別占7.5%,37%,50.4%,4%,5.1%,可見三維字占一半強(qiáng);加上二維字占總量近90%。這往往也是對(duì)全部漢字形成的基本數(shù)據(jù)。確定了正確用碼的總體優(yōu)勢(shì)。
3、張梁字庫(kù)共6144個(gè)漢字,其中單碼字4841個(gè),占78.8%。六千多個(gè)字相對(duì)于GB-1Z部三百多個(gè)字,單字比值仍差不多。一碼最多對(duì)應(yīng)漢字為7個(gè)。大體1對(duì)7(2個(gè)),1對(duì)6(2個(gè)),1對(duì)5(4個(gè)),1對(duì)4(29)個(gè),…字/碼上界僅為1.17。與三百多字檢測(cè)的1.13仍相差無幾。
碼的優(yōu)越,字?jǐn)?shù)越多,體現(xiàn)得越充分。結(jié)合碼長(zhǎng)小于4的技術(shù)處理,重碼率會(huì)更低。結(jié)合軟件方式的詞組處理,聯(lián)想功能,特別是加進(jìn)重碼自動(dòng)消除技術(shù),重碼現(xiàn)象忽略不計(jì)。
4、
碼除上述重碼率極低,理論性、科學(xué)性強(qiáng),新穎獨(dú)創(chuàng),學(xué)用簡(jiǎn)便外,結(jié)合軟件實(shí)施,明顯的優(yōu)越性還表現(xiàn)在
(1)輸入方式靈活先進(jìn),可適應(yīng)面廣,效率特高。且表現(xiàn)真正含義上的低擊鍵率。
(2)鍵盤操作與原計(jì)算機(jī)西文操作協(xié)諧。不需任何輔助設(shè)施與規(guī)定性鍵盤記憶。
(3)機(jī)型可高可低,軟件系統(tǒng)可強(qiáng)可弱,對(duì)操作人員專業(yè)要求不高,由于字庫(kù)序號(hào)的積累性自然記憶,專業(yè)文字處理可臻每分鐘更多的出字?jǐn)?shù)。
(4)
碼相對(duì)于文字改革、識(shí)字教學(xué)、文化普及及其他方面的應(yīng)用(比如字典排序、資料索引等)反過來促進(jìn)計(jì)算機(jī)漢字的普及推廣。
七、張梁字庫(kù)的應(yīng)用意義
1、張梁字庫(kù)實(shí)施于計(jì)算機(jī)軟件時(shí),第一次使字庫(kù)的序號(hào)有了應(yīng)用價(jià)值。按字頻字義的許多字詞連排,極為有助于操作人員的自然記憶,增強(qiáng)擊鍵效率(比如“總統(tǒng)”、“老板律師”、“和平”等,用戶第一次使用就能形成永久性關(guān)聯(lián)?!纈功能大有用武之地)。
2、經(jīng)常用字、次常用字、基本用字、冷僻用字的分級(jí)分檔使操作員對(duì)任何出現(xiàn)的漢字容易形成一個(gè)位置歸宿。由于常用字?jǐn)?shù)量少,使用機(jī)會(huì)多,又排在前面,更為有助于熟悉編碼甚至序號(hào)。從漢字文化的角度出發(fā),又便于了解字的屬性,減少冷僻字的使用。從長(zhǎng)遠(yuǎn)的觀點(diǎn)看,更有助于漢字的動(dòng)態(tài)精減?;蛘呖梢赃@樣說,若干年后的字庫(kù)規(guī)模會(huì)再小些。
3、字義編排使大到姓與名、地名,化學(xué)元素,生物群體;小至色彩,形容詞組等等相對(duì)集中,給經(jīng)常操作人員造成便利。從漢字文化的角度出發(fā),又便于學(xué)習(xí)時(shí)對(duì)同類事物的信息感知,豐富知識(shí),增多閱歷,減少對(duì)頻度很低的字的錯(cuò)誤理解或想當(dāng)然的認(rèn)識(shí)(這些字往往一字單義)。
4、張梁字庫(kù)給新穎的字典編排提供了模式。其結(jié)構(gòu)的關(guān)聯(lián)性、層次性,又使人們對(duì)復(fù)雜事物的客觀存在方式與人為組織方式在思想方法上提供豐富而深刻的啟示。
總之,熟悉的操作員與偶爾的上機(jī)者都能在使用過程中受益。
八、應(yīng)用考慮及有關(guān)參考件

碼及其相關(guān)知識(shí)(包括筆畫分類、字形字處理、字塊理論、漢字分拆原則等)宜盡早納入教材教學(xué)內(nèi)容,作為統(tǒng)一使用的漢字編碼,讓全民族受益于中文信息處理。
2°編碼發(fā)明人擬寫有《漢字與漢字編碼》講座13講,由漢字的起源、構(gòu)成特點(diǎn)到對(duì)漢字各有關(guān)要素的分析、
碼方案及其應(yīng)用意義、張梁字庫(kù)的特點(diǎn)與使用價(jià)值,對(duì)了解、認(rèn)識(shí)漢字文字科學(xué),參與漢字文字變革與漢字信息應(yīng)用,其動(dòng)態(tài)、趨向等等有相當(dāng)?shù)闹?。有關(guān)雜志已連載發(fā)表,建議盡早出版單行本,宣傳推廣。
3°為結(jié)合漢字應(yīng)有的讀音、字形等變革整理,發(fā)明人擬編寫《實(shí)驗(yàn)字典》,建議有關(guān)方面能積極扶助盡早實(shí)施。
4°建議資料類索引按
排序,極大地增加翻檢的有效率。
5°建議電報(bào)通訊與計(jì)算機(jī)設(shè)備關(guān)聯(lián),通過
碼的媒介直接傳輸不需轉(zhuǎn)譯(即發(fā)報(bào)方輸入的是編碼,接受方得到的是漢字)。
附參考件
1°在江蘇代辦處的查新證明。
2°關(guān)于提前公開與實(shí)質(zhì)審查吁請(qǐng)書。
權(quán)利要求
1、依據(jù)《漢字頻度統(tǒng)計(jì)》編匯的張梁字庫(kù)及其特點(diǎn)(特別是結(jié)構(gòu)、相關(guān)數(shù)值等)。
2、
碼的有關(guān)預(yù)備知識(shí)(筆畫分類-8種;字形分類-近字字形、特征詞(字)字形、不可讀字形3種;字塊理論系列-字塊、單位字塊、定型字(塊)、字形字(塊)、維、字元字(塊)、島狀字塊、界狀字塊、對(duì)狀字塊,還包括定型字的疊粘類、離散類、聚合類、固化類四種類型范疇)。
3、
碼的方案法則及輔助理論(漢字可否分拆與怎樣分拆的“負(fù)負(fù)得正”、“辨、速優(yōu)先”、“形、頻優(yōu)先”、“分聚協(xié)調(diào)”四種法則,絕對(duì)穩(wěn)定結(jié)構(gòu)與相對(duì)穩(wěn)定結(jié)構(gòu))。
4、結(jié)合張梁字庫(kù)的
碼軟件實(shí)施構(gòu)想(包括框圖)。
5、
碼暨張梁字庫(kù)的應(yīng)用考慮細(xì)則(應(yīng)用面,實(shí)現(xiàn)應(yīng)用的具體措施)。
6、碼本設(shè)計(jì)與檢字方法。
7、
碼的方案特征是以三維劃分為基礎(chǔ),以單位字塊的書寫為序,以英語字母為碼元,一般為四碼。不可讀字塊對(duì)應(yīng)于O,整個(gè)字讀音第一字母為第一碼。
(1)三維劃分時(shí),三個(gè)字塊讀音第一字母分別對(duì)應(yīng)第二、三、四碼。比如“拋→PSJL”;“贏→YWKO”。
(2)只能二分時(shí),兩個(gè)字塊對(duì)應(yīng)第二、三碼不變;第四碼可按第二字塊收筆筆畫特征字讀音第一字母取代。比如“匝→ZKJS”。
(3)獨(dú)體(包括定義為“定型字”的不可分字)時(shí),原字對(duì)應(yīng)于第二碼不變;第三、四碼按字的起筆與收筆取代。比如“事→SSHG”。一筆字第四碼取O。比如“一→YYHO”。不具筆畫則第三碼也為O。比如“O→LLOO”。
(4)多維字按一、二、末個(gè)單位字塊取碼。比如“疆→JGTY”。
(5)用于組詞時(shí),可看作字碼法則的“延伸”。即按第一、二、三、四(末)個(gè)字定碼。比如“中華人民共和國(guó)→ZHRG”,“南京大學(xué)→NJDX”。三個(gè)字時(shí)第四碼用第三個(gè)字收筆取代。兩個(gè)字則前一個(gè)字起筆取代第三碼;后字收筆取代第四碼。
全文摘要
(讀作“梁氏”)碼是以發(fā)明人獨(dú)創(chuàng)的“字塊”理論系列及字體三維劃分為基礎(chǔ)的音形綜合碼。最顯明優(yōu)點(diǎn)是方便易學(xué),重碼率低。張梁字庫(kù)據(jù)《漢字頻度統(tǒng)計(jì)》結(jié)合GB字庫(kù)篩選、按字頻字義編排,最顯著特點(diǎn)是序號(hào)有應(yīng)用意義。兩者實(shí)施于軟件,最主要特色體現(xiàn)為輸入的快速靈活簡(jiǎn)便。框圖設(shè)計(jì)提供了數(shù)字輸入編碼輸入不切換,能給出聯(lián)綿字等重要新穎手段。不附加設(shè)施,明顯增強(qiáng)操作擊鍵效率。碼、張梁字庫(kù)在字典編排、資料索引、電報(bào)通訊等都有理想應(yīng)用,與文化教育相輔相成。
文檔編號(hào)G06F3/023GK1105132SQ9311423
公開日1995年7月12日 申請(qǐng)日期1993年11月10日 優(yōu)先權(quán)日1992年11月17日
發(fā)明者梁開華, 張學(xué)濤 申請(qǐng)人:梁開華, 張學(xué)濤
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1