專利名稱:基于筆順的二進制碼組合式漢字資料處理方法及系統(tǒng)的制作方法
技術領域:
本發(fā)明是有關一種漢字取碼裝置與方法,尤指一種可將每一個漢字符號轉換成一個可供機器解讀的二進位數(shù)據(jù)碼組合,以達到漢字直接處理及傳遞目的,更明確而言,本發(fā)明揭露一個新穎的資料處理及傳遞方法,以取得一串可供機器解讀的二進位數(shù)據(jù)碼組合,來達到直接處理及傳遞漢字資料的目的。
因為漢字組合又多又復雜,所以要用一般電腦系統(tǒng)來處理漢字非常困難;每一個漢字都需要一個特別圖案的代號,為了處理文字的方便,凡有字母的語言都可以用二進位數(shù)據(jù)碼來代表某一個字母,例如用ASCII來代表英文字母。但是對漢字來講,以前的嘗試仍然不能解決許多技術上的難題;例如用漢字做電腦程式語言、或用二進位數(shù)據(jù)碼,如ASCII,來處理及傳遞漢字資料至今仍舊沒有實際可行的方法。
這與英文成為一個強烈的對比,因為英文單字皆是由二十六個字母所組合,但漢字卻按著文體的不同,常用的漢字大約有8,000至20,000之多,除了這許多字之外,每一個漢字的筆劃和組法都不同。
雖然漢字有這許多的學習困難,但對于受過教育的人類腦筋和智慧而言是可以有望得以解決的,而且受過教育的人們亦能藉此推廣傳統(tǒng)文化;但是對電腦來講,機器的學習能力及解讀種種不同的平面圖案符號仍舊是一困難盲點,是有待解決的問題。
世界上有許多民族使用漢字,例如中國人、日本人、韓國人等等;漢字應用在電腦界的種種不便是這些民族參與發(fā)展資訊工業(yè)的一大障礙,尤其是并不是每個人都懂英文。如果這個障礙可以解決,不單是這些民族可以分享電腦科技的成果,即使是不懂英文的人也可以參與推展電腦科技,讓全球人們皆享受科技的成果。
美國專利第2,950,800號的發(fā)明者Caldwell在他的專利“IdeographicType Composition Machine”(08/30/1960公告)里揭露了一部機器如何利用鍵盤來選漢字。為了揀字的方便,發(fā)明者Caldwell用少數(shù)的鍵來代表每一個漢字,結果是每一個漢字都可以用一個符號組合來代表,面每一個符號代表一個筆劃或字根。既然每一個漢字都有筆劃的順序,則每一個漢字都可以用這些筆劃符號的組合來代表。Caldwell引用了31個符號來代表這些筆劃或字根,Caldwell也用二進位數(shù)據(jù)碼來代表這些符號,而這些二進位數(shù)據(jù)碼的大小是按筆劃出現(xiàn)的頻率來排列的。
Caldwell的發(fā)明貢獻一些有用的概念,但可惜的是這項發(fā)明只注重于如何制造一個鍵盤供排版機使用,并沒有語言學上的基礎以供漢字自動化科技的應用,例如直接撰寫漢字電腦程式語言?;谝恍┗疽氐娜毕菔惯@項發(fā)明不能完美的應用在處理及傳遞漢字資料上,類似的應用應基于完全由漢字程式推衍而來的一種可供機器解讀的指令。
另一個美國專利第4,689,743號是“Method and Apparatus for Validatingthe Electronic Encoding of an Character”(08/25/1987公告),發(fā)明者Chiu揭露了一個方法及儀器來解讀漢字數(shù)據(jù)碼。每個漢字照筆順及筆劃來編碼,每個輸入的漢字先經(jīng)過一個復雜的分析器來定該字的復雜度,然后照該字的編碼在一系列的標準表格內把這個漢字找出來,因為有可能找到好幾個不同的字,所以用最類似的字作為揀字的標準。Chiu的發(fā)明提供了一個更精確的電腦編碼揀字法,但此項發(fā)明并不能教我們如何制造一套以二進位數(shù)據(jù)碼來代表漢字的資料處理及傳遞系統(tǒng)。
美國專利第4,951,202號“Oriental Language Processing System”內,發(fā)明者Yan揭露了一套處理漢、日、韓文字的系統(tǒng)。這些文字可以用一個小鍵盤輸入到一個資料處理器內,每個字的編碼包含了發(fā)音部份及進一步的揀字部份,這些碼輸入后,相對的字就可以被這個資料處理器顯示出來。發(fā)明者Yan的發(fā)明代表了用發(fā)音碼或字行碼來代表漢字的方法,但是因為漢字的發(fā)音并不一致,如對任何一個字中文發(fā)音大都不同于日文發(fā)音,所以這套方法雖然比較間接,但也不適用跨國的漢字資料處理及傳遞系統(tǒng)上。
所以我們仍然需要找到一種方法來設計一套以漢字為程式語言的資料處理及傳遞系統(tǒng),這套系統(tǒng)最好是非常直覺好用及跨國使用,也可以與現(xiàn)有的英文系統(tǒng)相容共存。
本發(fā)明的目的在于提供一套新穎的方法與裝置,使?jié)h字可以有順序而可被用來設計為電腦程式語言,借此電腦程式語言,一套完全用漢字的資料處理及傳遞系統(tǒng)可以被制造出來。本發(fā)明的另一目的是提供一套方法與裝置,有肯定的筆劃順序來分析及組織漢字,讓種種不同的資料處理及傳遞可以直接用漢字來操作,而不需經(jīng)過另外翻譯外語的麻煩手續(xù)。扼要的說,本發(fā)明提供一套方法與裝置,利用二進位數(shù)據(jù)碼組合來代表漢字,使?jié)h字可適用于資料處理及傳遞的應用上。
本發(fā)明所提供的一種基于筆順的二進制碼組合式漢字資料處理方法,其特征在于,它含有以下步驟(1).定出一套字庫漢字排列的方法;a.定出漢字的標準筆劃群b.標準筆劃群中每一個漢字筆劃各用一組互不相同的二進位數(shù)碼表示從而形成一個標準筆劃表以供漢字編碼器用;c.定出漢字筆劃的書寫程序以形成一個筆順規(guī)則表以供漢字編碼器用;d.漢字編碼器用標準筆劃表來決定每一個漢字的筆劃代號組合;e.漢字排列器把漢字編碼器所產生的各個漢字筆劃代號組合按代號的順序排列以分漢字的先后秩序;(2).定出漢字資料的處理方法a.按標準筆劃表和筆順規(guī)則表把漢字資料中的每個漢字分解成該字的筆劃組合;b.按標準筆劃表把各個漢字的一連串筆劃組合轉換為二進位數(shù)碼組合使得每個漢字按順序可以由二進位數(shù)碼組合定出以供機器解讀。
它還涉及一種國際網(wǎng)絡網(wǎng)址或其他的網(wǎng)站網(wǎng)址中漢字的處理方法,其步驟如下(1)按標準筆劃表和筆順規(guī)則表把這些漢字網(wǎng)址轉換成二進位數(shù)碼組合按網(wǎng)址中漢字的順序排列存到資料庫中;
(2)接納網(wǎng)絡使用者輸入的漢字網(wǎng)址,然后把該網(wǎng)址轉換或相應的二進位數(shù)據(jù)碼組合;(3)把該二進位數(shù)碼組合對照存在資料庫中的網(wǎng)址以利于資料傳遞。
所述的標準筆劃表由以下六組共21個筆劃構成a.橫提捺拖一, b.直點千川丨,丶, c.母女將元 d.子又君 e.小猊氏 f.成氣兮 勹。
所述的筆順規(guī)則表由以下三組筆順方式構成a.由上到下,如“言”;b.由左到右,如“川”;c.由中到左再到右,如“小”。
所述的一套漢字資料的處理方法含有以下具體步驟(1).接納使用者的漢字符號記錄單;(2).根據(jù)由漢字字形構造規(guī)則表和筆順規(guī)則表組成的字形辨認的規(guī)則表認出每一個漢字的形狀及字根,以得出其字根群;(3).按照標準筆劃表及筆順規(guī)則表得出每一個字根的筆劃,同時把它按字根的次序串連起來;(4).把上述筆劃串中的每一個筆劃轉換為一組二進制碼;(5).把這些字一一地按筆劃排列出來就可得到一個按順序排列的用二進制碼組表示的漢字符號記錄單。
本發(fā)明所提供的一種基于筆順的二進制碼組合式漢字資料處理系統(tǒng),其特征在于它含有一個可用每一個字的筆劃組合以認出該字,也可把漢字按筆劃及筆順的秩序排列出來的漢字資料處理器,它由一個包含了可以供按筆劃及筆順排列漢字用的字匯及語句分析器的漢字程式編輯器以及一個包含了多數(shù)漢字資料的資料庫,在該資料庫中漢字的資料是照該資料名稱的漢字來排列的,而這些漢字名稱的排列是照該名稱的筆劃及筆順的秩序求得的。
它包含了一個可以供漢字資料輸入用的鍵盤,該鍵盤中每一個特定的鍵都對應著標準筆劃表中的每一個筆劃。
它包含一個電話撥號鍵盤,標準筆劃表上的所有筆劃都被分配在該鍵盤的各鍵上,每一個鍵可代表數(shù)個筆劃,以便用一句由漢字組成的話來代表一組電話號碼。
它還含有一個漢字網(wǎng)絡瀏覽器,以便可經(jīng)一個服務站去和一個網(wǎng)絡相連,該網(wǎng)絡包含有一個備有漢字索引的漢字資料庫的網(wǎng)絡網(wǎng)址服務站,以便實現(xiàn)漢字資料的傳送。
試驗證明它可達到預期的目的。
圖1是漢字的筆劃、名稱、發(fā)音及其意義示意圖;圖2是漢字的筆劃及組合,可用筆劃編的詩詞及故事示意圖;圖3用英文寫的程式、用漢字寫的程式及與其相對應的二進位數(shù)據(jù)碼實施例對照表;圖4是本發(fā)明一漢字程式語言實施例的編輯程式流程圖;圖5是電腦網(wǎng)路傳輸協(xié)定的組織架構圖;圖6是網(wǎng)路資料庫系統(tǒng)概略示意圖;圖7是本發(fā)明一漢字黃頁實施例排列圖解;圖8是運用本發(fā)明方法的一漢字鍵盤實施例示意圖;圖9是運用本發(fā)明方法的一漢字電話鍵盤實施例示意圖;圖10是本發(fā)明一漢字順序處理示意圖;圖11是本發(fā)明一漢字字形處理示意圖圖12是本發(fā)明一漢字筆劃順序規(guī)則示意圖;圖13是本發(fā)明一排列漢字順序處理實施例流程圖;圖14是本發(fā)明的方法在國際網(wǎng)絡上漢字資料庫應用示意圖;圖15、16是ASCII碼圖形符號表。
實施例圖1所示的表格有七欄,第一欄列出漢字各筆劃;第二欄列出該筆劃的ASCII代碼;第三欄列出該筆劃下筆方向;第四欄列出該筆劃的名稱;第五欄列出該筆劃的注音;第六欄則列出該筆劃的拼音。每一個筆劃可以用一個二進位數(shù)據(jù)碼來代表,例如第一筆“一”可以用十六進位數(shù)據(jù)碼(ASCII)中的“41”來代表,也就是相等于英文“A”的ASCII數(shù)據(jù)碼;依此類推則所有的筆劃都有與其相對等的ASCII編碼。以后會提到的第三圖內的Ⅰ編碼就是此法利用的實例。
圖1所示的筆劃名稱中,有些筆劃是由寫法得名,有些是選第一筆為該筆劃的字得名,有些是因無第一筆是該筆劃的字而選有含該筆劃的字得名,目的是達成一篇口決,以便于記憶。
圖2所示則是進一步的解析這個口決的組合,此圖分為四欄;第一欄是筆劃,第二欄是口決詞語,第三欄是該詞的拼音,第四欄是該詞的意義。該口決可編成一篇故事內容而有助記憶。另外值得一提的是這些筆劃在表內的位置是照著筆劃的形象和落筆的方向來排列的。第一行是由左到右的筆劃;第二行是由上到下的筆劃;第三行則是往右彎的筆劃;第四行是往左彎的筆劃;第五行是有直鉤的筆劃;而第六行是有斜鉤的筆劃。將這些筆劃按寫法來予以分類也是幫助處理及記憶的方法。
當我們將每一個漢字用該字的筆劃來代表,而我們也定出了筆劃的先后秩序,所以每一個漢字就可以用二進位數(shù)據(jù)碼組來代表。
因為每一個漢字可以用二進位數(shù)據(jù)碼組來代表,這樣漢字就可以適用于電腦程式語言的設計。圖3是一個如此應用的例子,第一部份是以一個英文撰寫的程式語言,而第二部份則是與該英文程式對等的一個用漢字撰寫的程式語言。第三部份是取了第二部份漢字程式內的一句程式指令來解開成為二進位數(shù)據(jù)碼組合的實例。照這樣解開的漢字程式指令就可以交給一個漢字程式編輯器以程式來處理。
本發(fā)明的一個主要目的在于提供了漢字排列的順序。當漢字照該順序以二進位數(shù)據(jù)碼來代表后,漢字的排列就可以自動化。還有照筆劃排列的好處是有相同筆劃的字都會自然的排列到一起,并且提供了一套處理漢字資訊與傳遞的環(huán)境。
圖4是提供了一個編輯漢字程式的好例子。該圖是一個擁有三步驟的漢字程式編輯器的主要組合和流程。輸入這編輯資料就是一篇以二進位數(shù)據(jù)碼來代表的漢字程式,是屬于電腦的高階語言。此圖中方塊100代表編輯器;它包含了四個部份;方塊105代表字匯分析器。字匯分析器105的功用是將漢字程式轉換成一系列的符號。這些符號被語句分析器110來處理,以成為電腦內部的執(zhí)行語句,方塊115號代表代碼分析器,它進一步的把電腦內部執(zhí)行語句轉化成易于分析的內部程式。這內部程式可直接的被代碼產生器120轉換成機器可執(zhí)行的指令。
為了要達成上述的目的,編輯器100必須搭配編輯資料庫130,這資料庫包含了符號表135、常數(shù)表140、資料組織表145及其他相關資料表150等等。
這編輯資料庫130提供程式編輯器所須要的資料,因為漢字可以用本發(fā)明所提供的方法來順序排列,所以字匯分析器105及語句分析器110可以用這些表來產生電腦內部所須的指令。
所以本發(fā)明揭露了一套方法及裝置,具有系統(tǒng)與肯定順序的來分析及組織漢字,讓種種不同的資料處理及傳遞可以直接用漢字來操作。
本發(fā)明包含了以下幾個步驟(a)定出一套二進位數(shù)據(jù)碼組來代表漢字的筆劃;(b)每個漢字可以根據(jù)該字的筆順排列的筆劃組合來代表;(c)該筆劃組合可以化為二進位數(shù)據(jù)碼組合。由此在裝置與裝置之間就可以傳遞漢字資訊。如此每個漢字都可以有組織及有順序的代表出來。
圖5是兩部電腦連線的示意圖,電腦通訊界有公認的電腦與電腦間通訊層面的標準協(xié)定;例如OSI協(xié)定(OPEN SYSTEM INTERFACE)所公布的標準即包含了七個層面,就是實體層(physical)、資料連接層(datalink)、網(wǎng)路層(network)、傳輸層(transport)、會談層(session)、陳述層(presentation)、及應用層(application)。每個層面都有互通訊息的規(guī)范。一旦連上了線,電子資訊就可以化整為零的分割成許多更小的電訊封包。每一個電訊封包都有自己開頭的落款及資料。所有的通訊規(guī)范和電訊封包都是由二進位數(shù)據(jù)碼組合起來,以供在通訊傳輸中處理。由于本發(fā)明中可以讓漢字轉化成二進位數(shù)據(jù)碼組合,所以漢字亦可以直接相容于現(xiàn)有的電子通訊系統(tǒng)內。用漢字為規(guī)范的通訊也因為漢字可以化成二進位數(shù)據(jù)碼組合,故能成為將來網(wǎng)絡溝通的管道,電訊資料也因此可以包含漢字。更重要的是網(wǎng)絡的漢字地址可以按漢字的順序排列起來,而排列的結果是將類似的字排到一處,使人查詢時可以更方便的瀏覽類似的漢字網(wǎng)址。
圖6是網(wǎng)絡資料系統(tǒng)200的概略示意圖。方框210-1,201-2,201-3代表連接該網(wǎng)絡資料系統(tǒng)的客戶電腦;它們透過一個服務站230與網(wǎng)絡資料庫220聯(lián)接。每一個客戶都有自己所需要的資料和查詢條件,資料庫220有數(shù)個磁碟機以存放資料。若資料系統(tǒng)照本發(fā)明所提供的方法來排列漢字而產生索引表,這些索引表將帶給查詢者莫大的方便,因為即使查詢失敗,資料庫仍然可以提供類似的字給查詢者以利瀏覽。
同時依照本發(fā)明提供的方法,因為所有的漢字都可以用二進位數(shù)據(jù)碼組合來代表,所有以英文為基礎的技術都可以相同的應用在漢字的環(huán)境內。其實漢字用本發(fā)明的方法后已經(jīng)字母化了。
圖7是一個運用本發(fā)明的漢字黃頁實施例。該表是照本發(fā)明所提供的筆劃順序排列出來的,這些網(wǎng)址可以成為某資料庫的索引。漢字經(jīng)過類似的排列就可以編成例如黃頁電話簿或種種不同歸門別類的索引。此圖就是一個很好的例子。這些索引一旦公布在網(wǎng)絡上、或光碟上、或網(wǎng)絡的資料庫上,就可以非常方便的查詢。
其實一旦漢字運用本發(fā)明所揭露方法來代表的話,每一個筆劃就等于一個字母。當漢字字母化后,英文鍵盤就可以加以改良而成為一漢字鍵盤,如圖8所示即為如此。該圖中所顯示的筆劃鍵位只是許多可能的設計之一。鍵位的設計可以因筆劃出現(xiàn)的頻率或是按打字速度的需求而有所調整。
同樣的在圖9中所顯示的即為一漢字電話鍵盤,其也可以如類似英文電話鍵盤的方式來設計排列。為了記電話號碼,每一個電話號碼的數(shù)字可以用某個筆劃來代表,進而用某個字來代表這筆劃。這樣就可用一句話來代表一串電話號碼。
請參閱圖10,300號方框是一個排列漢字順序系統(tǒng)。該系統(tǒng)包含了一個筆劃順序產生器(300號方框),它的功用是把輸入的漢字轉換成這個字的一連串的筆劃。它需要用到如圖1所示的標準筆劃表(304號方框),還有如圖12所示的筆劃順序規(guī)則(306號方框)。它還包含一個基本字根分析器(305號方框),把每個字按圖11所顯示的字形規(guī)則(309號方框)解析成一個字根群。接下來基本字根分析器(305號方框)用識別技術確定這字的字根。圖11中列舉了許多字根組合的例子,由一個字根到五個字根等等。每一個漢字都是由字根所組成的。當這些字根被確定以后,每個字根都有自己的筆劃。圖12列舉了幾個定義筆劃順序的規(guī)則,這些規(guī)則不但適用于字根,也適用于字的本身,包含了由上到下,由左到右,還有由中到左再到右的態(tài)樣,總之這些規(guī)則有助于解析每個漢字筆劃的組合。這過程分成三個階段(1)辨認字根;(2)辨認字根的順序;(3)辨認字根的筆劃。這樣一來每個漢字都可被解析成為一串筆劃組合(312號方框),然后這些組合就可以交給筆劃次序排序器(320號方框)來進行排列的工作。
所以筆劃符號(324號方框)、筆劃順序規(guī)則(306號方框)可以被應用在漢字排序器的流程中,把一些須要按程序排列的單字(301號方框)化成該字的筆劃組合(312號方框),然后傳給筆劃次序排序器(320號方框)。因為每個漢字都有了一連串數(shù)字來代表,所以這筆劃次序排序器(320號方框)就可按筆劃字義表(316號方框)來將這些漢字按筆劃的順序排列出來(324號方框)。
圖13是本發(fā)明一排列漢字先后順序實施實施例的流程示意圖,步驟開始后,第一步是先接納使用者的記錄單(301號方框),然后經(jīng)由字形辨認(410號方框)來認出每一個字的字形及字根,這步驟需要用字形辨認的規(guī)則表(307號方框) (請再參閱圖11、12所示),而為每一個字產生出該字的字根群(309號方框)。該字根群經(jīng)下步(415號方框)的解析而得到每一個字根的筆劃,將這些筆劃按字根的次序串連起來就可以取得該字所有的筆劃(312號方框)。每一個筆劃都可以一對一的轉換成一個二進位數(shù)據(jù)碼420,當所有的字都如此分析后,最后的手續(xù)就是將這些字一一的按筆劃排列出來,如此就得到一個按順序排列的漢字單來。
因此圖10顯示出本發(fā)明提供了一個漢字處理機(300號方框)的技術。該處理機可以接受任何漢字(301號方框),然后按順序將它們排列出來。該處理機包含了一個漢字編碼器310來為每一個字編碼,然后排序器(320號方框)就可以按所編的碼將漢字順序的排列出來。該編碼器包含了筆劃轉換器(310號方框)。該筆劃轉換器包含了標準筆劃表(304號方框)及筆劃順序規(guī)則表(306號方框)。依照這兩個表該編碼器就可以為每一個漢字編出該字的筆劃組合來(312號方框)。該編碼器也包含一個筆劃字義表(316號方框),讓每一個筆劃都可以轉換成它的二進位數(shù)據(jù)碼。
本發(fā)明揭露一個漢字排列順序的方法,可以處理任何漢字,此法包含了以下的步驟(a)提供標準筆劃表(304號方框);此表涵蓋了筆劃的定義及筆劃的代號。將此表容入漢字編碼器內(310號方框),以使其能將任何漢字(301號方框)編碼;(b)提供筆劃順序規(guī)則表(306號方框);將此表容入漢字編碼器內(310號方框),則該編碼器310就可以決定某字筆劃的筆順;(c)利用編碼器(310號方框)將標準筆劃表(304號方框)及筆劃順序規(guī)則表(306號方框)聯(lián)合起來解析每一個漢字成為該字的筆劃組合;(d)用漢字筆劃次序排序器(324號方框)將以上各字的筆劃組合按程序一一排列出來;(e)按本發(fā)明提供的方法設計出來的機器還包含了一個處理國際網(wǎng)絡漢字網(wǎng)址的排列方法;(f)將這些漢字網(wǎng)址按本發(fā)明揭露的漢字秩序納入一個資料庫的表格里;(g)將如些存檔的表格存入一個國際網(wǎng)絡系統(tǒng)內;(h)接納國際網(wǎng)絡使用者的漢字網(wǎng)址,并將該漢字網(wǎng)址轉換成該網(wǎng)址的二進位數(shù)據(jù)碼;(i)將此二進位數(shù)據(jù)碼與已存檔的網(wǎng)址表對照以達到網(wǎng)上快速傳輸及通訊的目的。當然,照本發(fā)明提供的方法也可設計出另一套機器可以將所有的漢字網(wǎng)址存檔起來。
照本發(fā)明提供的方法漢字可以順序排列也可以編成索引。所以用此法可以設計出一個漢字網(wǎng)絡瀏覽器,搜索器,或是其他軟體工具。這些工具都可用以網(wǎng)絡上,如圖14所示,此圖舉出一個漢字瀏覽器(520號方框)為例;該瀏覽器設置在一臺電腦(510號方框)內;該電腦與網(wǎng)絡(505號方框)連線成為網(wǎng)絡系統(tǒng)的一部份。該瀏覽器(520號方框)透過一個服務站(525號方框)接到國際網(wǎng)絡上。這網(wǎng)絡系統(tǒng)也包含了一個網(wǎng)絡網(wǎng)址指南服務站(530號方框)。該網(wǎng)址指南服務站也包含了備有索引的漢字資料庫。如圖14所示,此漢字資料庫可含次層資料庫,如備有索引的使用者名冊,搜集使用者的姓名,所屬單位,各服務站的名稱及網(wǎng)址。這些網(wǎng)址也可以繼續(xù)的分類例如政府機構,商業(yè)團體或是環(huán)保機構等等。因為照本發(fā)明所提供的機器與方法,漢字可以字母化而可以將分門別類的操作自動化。
故此本發(fā)明提供了一套新穎的儀器及方法以提供漢字字母化的處理及傳輸。漢字字母化避開了用圖案式處理漢字的困難及復雜性,這正是先前存在的已知技術所忽略的。更確實的說,本發(fā)明提供了一套新穎的儀器及方法來處理及傳遞漢字,使?jié)h字可以依次序排列,正如其他有字母的語言(如英文)。更有者,漢字字母化后漢字就可以被應用來設計出一套程式設計語言。還有在機器內直接用字母化的漢字可免去以往需要由英翻漢、或由漢翻英種種的不便。
圖15、16提供了一個ASCII碼圖形符號表,本發(fā)明采用十六進制值,即HEXA DECIMAL VALUE。
權利要求
1.一種基于筆順的二進制碼組合式漢字資料處理方法,其特征在于,它含有以下步驟(1).定出一套字庫漢字排列的方法;a.定出漢字的標準筆劃群b.標準筆劃群中每一個漢字筆劃各用一組互不相同的二進位數(shù)碼表示從而形成一個標準筆劃表以供漢字編碼器用;c.定出漢字筆劃的書寫程序以形成一個筆順規(guī)則表以供漢字編碼器用;d.漢字編碼器用標準筆劃表來決定每一個漢字的筆劃代號組合;e.漢字排列器把漢字編碼器所產生的各個漢字筆劃代號組合按代號的順序排列以分漢字的先后秩序;(2).定出漢字資料的處理方法a.按標準筆劃表和筆順規(guī)則表把漢字資料中的每個漢字分解成該字的筆劃組合;b.按標準筆劃表把各個漢字的一連串筆劃組合轉換為二進位數(shù)碼組合使得每個漢字按順序可以由二進位數(shù)碼組合定出以供機器解讀。
2.根據(jù)權利要求1所述的基于筆順的二進制碼組合式漢字資料處理方法,其特征在于它還涉及一種國際網(wǎng)絡網(wǎng)址或其他的網(wǎng)站網(wǎng)址中漢字的處理方法,其步驟如下(1)按標準筆劃表和筆順規(guī)則表把這些漢字網(wǎng)址轉換成二進位數(shù)碼組合按網(wǎng)址中漢字的順序排列存到資料庫中;(2)接納網(wǎng)絡使用者輸入的漢字網(wǎng)址,然后把該網(wǎng)址轉換或相應的二進位數(shù)據(jù)碼組合;(3)把該二進位數(shù)碼組合對照存在資料庫中的網(wǎng)址以利于資料傳遞。
3.根據(jù)權利要求1所述的基于筆順的二進制碼組合式漢字資料處理方法,其特征在于所述的標準筆劃表由以下六組共21個筆劃構成a.橫提捺拖一, b.直點千川丨,丶, c.母女將元; d.子又君 e.小猊氏 f.成氣兮 ,勹
4.根據(jù)權利要求1所述的基于筆順的二進制碼組合式漢字資料處理方法,其特征在于所述的筆順規(guī)則表由以下三組筆順方式構成a.由上到下,如“言”;b.由左到右,如“川”;c.由中到左再到右,如“小”。
5.根據(jù)權利要求1所述的基于筆順的二進制碼組合式漢字資料處理方法,其特征在于所述的一套漢字資料的處理方法含有以下具體步驟(1).接納使用者的漢字符號記錄單;(2).根據(jù)由漢字字形構造規(guī)則表和筆順規(guī)則表組成的字形辨認的規(guī)則表認出每一個漢字的形狀及字根,以得出其字根群;(3).按照標準筆劃表及筆順規(guī)則表得出每一個字根的筆劃,同時把它按字根的次序串連起來;(4).把上述筆劃串中的每一個筆劃轉換為一組二進制碼;(5).把這些字一一地按筆劃排列出來就可得到一個按順序排列的用二進制碼組表示的漢字符號記錄單。
6.一種基于筆順的二進制碼組合式漢字資料處理系統(tǒng),其特征在于它含有一個可用每一個字的筆劃組合以認出該字,也可把漢字按筆劃及筆順的秩序排列出來的漢字資料處理器,它由一個包含了可以供按筆劃及筆順排列漢字用的字匯及語句分析器的漢字程式編輯器以及一個包含了多數(shù)漢字資料的資料庫,在該資料庫中漢字的資料是照該資料名稱的漢字來排列的,而這些漢字名稱的排列是照該名稱的筆劃及筆順的秩序求得的。
7.根據(jù)權利要求5所述的基于筆順的二進制碼組合式漢字資料處理系統(tǒng),其特征在于它包含了一個可以供漢字資料輸入用的鍵盤,該鍵盤中每一個特定的鍵都對應著標準筆劃表中的一個筆劃。
8.根據(jù)權利要求5所述的基于筆順的二進制碼組合式漢字資料處理系統(tǒng),其特征在于它包含一個電話撥號鍵盤,標準筆劃表上的所有筆劃都被分配在該鍵盤的各鍵上,每一個鍵可代表數(shù)個筆劃,以便用一句由漢字組成的話來代表一組電話號碼。
9.根據(jù)權利要求5所述的基于筆順的二進制碼組合式漢字資料處理系統(tǒng),其特征在于它還含有一個漢字網(wǎng)絡瀏覽器,以便可經(jīng)一個服務站去和一個網(wǎng)絡相連,該網(wǎng)絡包含有一個備有漢字索引的漢字資料庫的網(wǎng)絡網(wǎng)址服務站,以便實現(xiàn)漢字資料的傳送。
全文摘要
一種基于筆順的二進制碼組合式漢字資料處理方法及系統(tǒng)屬于漢字輸入領域,其特征在于,它含有以下步驟:1.為漢字的每一個筆劃定下一個二進制碼組;2.按筆順規(guī)則把漢字分解成筆劃組合;3.把該筆劃組合轉換成一列串可供機器解讀的二進制碼組合;4.把一列串二進制碼組合按資料中漢字的順序排列起來,并以此作為漢字處理系統(tǒng)處理及傳遞漢字資料的基礎。它可以和現(xiàn)有的英文系統(tǒng)相容而且非常直覺好用及跨國使用。
文檔編號G06F17/28GK1302031SQ9912734
公開日2001年7月4日 申請日期1999年12月30日 優(yōu)先權日1999年12月30日
發(fā)明者蔣祖中 申請人:蔣祖中