專利名稱:計算機漢字信息處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機漢字信息處理方法。
宇航出版社1987年12月出版的《計算機中文信息處理》一書第216至218以及第283至284頁,講述了現(xiàn)有計算機漢字信息處理由于二字節(jié)核心系統(tǒng)與單字節(jié)核心系統(tǒng)不統(tǒng)一,使?jié)h字信息不能直接進入西文DOS核心處理系統(tǒng);而且存貯碼、運算碼和傳輸碼不統(tǒng)一,降低了漢字信息處理系統(tǒng)的效率和中西文兼容性,增加系統(tǒng)開銷,也影響計算機的中文化。
本發(fā)明的目的是提供一種讓漢字信息以單字節(jié)代碼符號的形式,直接進入核心處理系統(tǒng)的計算機漢字信息處理方法;本發(fā)明的另一個目的是提供一種存貯碼、運算碼和傳輸碼相統(tǒng)一,交換碼和處理碼相一致的計算機漢字信息處理方法;本發(fā)明還有一個目的是提供一種中西文信息從輸入、處理到輸出完全兼容又不產(chǎn)生二義性現(xiàn)象的計算機漢字信息處理方法。
本發(fā)明的目的可以由下述方案來實現(xiàn)一種計算機漢字信息處理方法,包括漢字信息的輸入、處理和輸出,用24個形碼符號、聲母和韻母組成漢字編碼,通過鍵盤輸入,漢字信息以單字節(jié)形式進入DOS系統(tǒng),經(jīng)過處理,由國標(biāo)交換碼轉(zhuǎn)換輸出文字,其中,(1)專利號ZL92100557.1的發(fā)明使用24個形碼符號,本發(fā)明在它的基礎(chǔ)上增加八個符號①
表示左右結(jié)構(gòu)的漢字,如“盟”、“壁”的上半部分;②
表示上下結(jié)構(gòu)的漢字,如“意”、“曼”的上半部分;③
表示“卜”形結(jié)構(gòu)的漢字,如“上、“占”的上半部分;
④
表示“丬”形結(jié)構(gòu)的偏旁和漢字,如“妝”、“壯”的左部分。
⑤
表示“興”字形結(jié)構(gòu)的漢字,其特點是“一橫”將字體分為上下兩部分,如“兵”、“云”、“衣”等字。
⑥
表示“系”、“纟”、
“幺”、“么”之類的字或偏旁,如“幻”、“紊”、“么”等字。
⑦
表示
“彡”、“及”形結(jié)構(gòu)的字或偏旁,如“楊”、“彬”、“級”等字的右邊部分。
⑧
表示“受”、“黨”、“當(dāng)”等字的頂上部分。
(2)使用的中西文兼容鍵盤如圖2所示,將漢字拼音聲母、韻母和形碼符號直接設(shè)置在美式標(biāo)準(zhǔn)鍵盤上。漢字輸入方法和專利ZL92100557.1的輸入方法相同。
(3)七位體制ASCII中文代碼頁將聲母、韻母和形碼符號安排在ASCII字符集的擴充位內(nèi),成為七位編碼體制中文代碼頁。將雙聲母zh、sh、ch分別安排在大寫英文字母A、I、U位內(nèi);單韻母a、e、i、o(包括uo)、u分別用小寫英寫字母a、e、i、o、u代替;單聲母由對應(yīng)的大寫英文字母代替;32個形碼符號安排在192-223位內(nèi);復(fù)合韻母安排在169-191位內(nèi);其它符號不變動。
(4)用中文代碼重寫西文DOS,使其接受中文信息指令,成為中西文兼容的DOS。
為了能夠適用八位編碼體制,本發(fā)明還設(shè)計了EBCDIC中文代碼頁。如圖4所示,將聲母、韻母和形碼符號直接安排在EBCDIC字符集中,使之成為EBCDIC中文代碼頁。其中,聲母均以“11”開頭;韻母均以“10”開頭;形碼符號均以“01”開頭,從而避免出現(xiàn)二義性現(xiàn)象。
本發(fā)明克服了現(xiàn)有計算機漢字信息處理方法的中文DOS只能掛在西文DOS之外的問題,中文信息的處理碼用單字節(jié)表示,能夠直接進入西文DOS的核心系統(tǒng),大大減少了外部碼向內(nèi)部碼轉(zhuǎn)換的過程,使存貯碼、運算碼和傳輸碼相統(tǒng)一,實現(xiàn)基因生成級的DOS核心系統(tǒng)中西文兼容,加快了漢字信息的處理速度,節(jié)省內(nèi)存和硬件成本;同時,該中文代碼可以成為計算機操作語言和程序設(shè)計語言的工具,為各種中文化計算機程序設(shè)計語言的出現(xiàn)鋪平道路。
圖1是增32個形碼符號圖。
圖2是中西文兼容鍵盤圖。
圖3是ASCII中文代碼頁。
圖4是EBCDIC中文代碼頁。
圖5是本發(fā)明的漢字信息處理系統(tǒng)結(jié)構(gòu)圖。
下面結(jié)合附圖加以說明。
本發(fā)明將漢字變成類似西文的聲形字母符號,安排在鍵盤上和ASCII字符集內(nèi),成為中西文兼容鍵盤和ASCII中文代碼頁,再用漢字代碼改寫鍵盤驅(qū)動程序以及與代碼頁相關(guān)的DOS系統(tǒng)文件,裝入中文代碼頁,并通過將中文代碼指令和程序設(shè)計語言裝入DOS核心的BIOS、MS-DOS、shell等文件各程序中,完成DOS核心的中西文兼容。改寫DOS的過程是把中文代碼程序用語及命令用語和原英文用語填寫在同一個程序中。中文用語將和原英文用語具有同樣的功能,被系統(tǒng)接受并執(zhí)行。進入DOS核心的是單字節(jié)中文處理碼,存貯碼、運算碼和傳輸碼相統(tǒng)一,漢字信息處理速度快,效率高,節(jié)省內(nèi)存和硬件成本。
本發(fā)明的漢字編碼輸入順序很類似音韻形碼的輸入順序,而且同國標(biāo)GB2312交換碼中的聲韻形筆劃排列順序基本類似,可以通過查表的方式來實現(xiàn)從外到內(nèi)或從內(nèi)到外的代碼轉(zhuǎn)換過程。
權(quán)利要求
1.一種計算機漢字信息處理方法,包括漢字信息的輸入、處理和輸出,用24個形碼符號、聲母和韻母組成漢字編碼,通過鍵盤輸入,漢字信息以七位代碼制單字節(jié)形式進入DOS系統(tǒng),經(jīng)過內(nèi)部處理,由國標(biāo)交換碼轉(zhuǎn)換輸出文字,其特征在于(1)增加八個形碼符號
(2)使用的鍵盤為
(3)中西文兼容的七位編碼體系A(chǔ)SCII代碼頁
(4)用中文代碼重寫西文DOS,使其承認(rèn)中文信息指令,成為中西文兼容的DOS系統(tǒng)。
2.一種計算機漢字信息處理方法,包括漢字信息的輸入、處理和輸出,用24個形碼符號、聲母和韻母組成漢字編碼,通過鍵盤輸入,漢字信息以八位代碼制單字節(jié)形式進入DOS系統(tǒng),經(jīng)過內(nèi)部處理,由國標(biāo)交換碼轉(zhuǎn)換輸出文字,其特征在于(1)增加八個形碼符號
(2)使用的鍵盤為
(3)中西文兼容的八位編碼體系EBCDIC代碼頁
(4)用中文代碼重寫西文DOS,使其承認(rèn)中文信息指令,成為中西文兼容的DOS系統(tǒng)。
全文摘要
本發(fā)明涉及計算機漢字信息處理方法,需要解決現(xiàn)有中文DOS不能進入西文DOS核心系統(tǒng)的問題,漢字以32個形碼符號、聲母和聲韻母為編碼符號,將三種代碼符號分別設(shè)置在鍵盤上并裝入ASCII字符集和EBCDIC字符集,成為中文代碼頁,修改相關(guān)程序和文件,使計算機系統(tǒng)承認(rèn)中文代碼頁,成為中西文兼容的單字節(jié)核心系統(tǒng),存貯碼、運算碼和傳輸碼相統(tǒng)一,提高處理效率,節(jié)約內(nèi)存和硬件開銷,為中西文完全兼容鋪平道路。
文檔編號G06F3/023GK1153342SQ96102618
公開日1997年7月2日 申請日期1996年1月23日 優(yōu)先權(quán)日1996年1月23日
發(fā)明者苗三反 申請人:苗三反