專利名稱:漢字輸入方法、小型數(shù)字鍵盤及漢字輸入系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及漢字輸入領(lǐng)域,尤其適用于在小型數(shù)字鍵盤上進(jìn)行漢字輸入。
背景技術(shù):
漢語作為一種象形語言,其最小語言元素被稱為漢字,同時(shí)能夠表音和 表意,與英語的字母元素存在根本上的差異,因此,使用中文的處理設(shè)備的 一個(gè)主要課題是如何有效率的進(jìn)行漢字輸入。由于漢語系統(tǒng)由數(shù)千個(gè)復(fù)雜 的漢字構(gòu)成,因此想要?jiǎng)?chuàng)造出一個(gè)包括所有漢字的大鍵盤是不切實(shí)際的;因 此,在過去的三十年里所涌現(xiàn)出的百種以上的中文輸入法,都是通過高級(jí)計(jì) 算機(jī)圖形用戶界面將多個(gè)鍵字組合變換為一個(gè)獨(dú)立的漢字。
這些中文輸入法按照編碼標(biāo)準(zhǔn),可以主要被分為三種類型
任意編碼(Arbitrary Codes)輸入法;例如,區(qū)位碼和電報(bào)輸入法是典 型的任意編碼輸入法,其需要用戶死記硬背每一個(gè)漢字的無規(guī)則編碼,明顯 難以普及,因此已逐漸不再被使用;
發(fā)音編碼(Pronunciation-based)輸入法;其中,拼音法是最廣為應(yīng)用的 發(fā)音編碼輸入法,而注音輸入法和粵拼輸入法分別是臺(tái)灣和香港地區(qū)常用的 發(fā)音編碼輸入法;
結(jié)構(gòu)編碼(Structure-based)輸入法;例如,倉頡、五筆就是兩種眾所周 知的結(jié)構(gòu)編碼輸入法。
傳統(tǒng)的結(jié)構(gòu)編碼輸入法,如上面提到的倉頡、五筆, 一般都是使用柯蒂 鍵盤上26個(gè)羅馬字母鍵,按照部首和筆畫來表現(xiàn)漢字結(jié)構(gòu)的。但是,隨著 小型的手持?jǐn)?shù)字設(shè)備的發(fā)展,包括PDA、移動(dòng)電話、數(shù)碼相機(jī)以及家用智能 系統(tǒng),對(duì)于有效的文本輸入技術(shù)的要求不斷提高。由于這些手持?jǐn)?shù)字設(shè)備往 往只提供有小型的數(shù)字鍵盤,因此其漢字輸入法不能簡單地套用普通PC所 采用的基于柯蒂鍵盤的羅馬字母輸入。由此,基于數(shù)字鍵盤的結(jié)構(gòu)編碼輸入方法,比如九方Q9,縱橫輸入法 CKC以及筆畫輸入法(Stroke Method)被設(shè)計(jì)出來,以數(shù)字鍵0-9代表筆畫 或者部首來編碼漢字,既可以適用于手持?jǐn)?shù),設(shè)備的數(shù)字鍵盤,也可以適用 于PC的數(shù)字小鍵盤。同時(shí),發(fā)音編碼輸入法也可以在數(shù)字鍵盤上加以沿用。
即便如此,我們?nèi)匀浑y以找到任何一種漢字輸入法,其能夠同時(shí)滿足易 學(xué)性、輸入的高效性以及小型數(shù)字鍵盤適用性等方面的要求,下面就對(duì)現(xiàn)有 的漢字輸入法加以簡單分析
(1) 發(fā)音編碼輸入法
具有簡單易學(xué)的優(yōu)點(diǎn),用戶無需了解這些漢字的寫法即可實(shí)現(xiàn)輸入;以
拼音法為例,其簡單的使用拼音表作為漢字轉(zhuǎn)化的字典,對(duì)于熟知普通話
(Mandarin)的人們來說,這種輸入法顯然非常簡單易學(xué);粵拼和注音對(duì)于 香港和臺(tái)灣地區(qū)的使用者來講,具有同樣的優(yōu)勢(shì);
但是,發(fā)音編碼輸入法重碼率高,并由此導(dǎo)致了輸入速度方面的局限, 原因在于許多漢字具有相同的發(fā)音;仍以拼音法為例,要輸入"漢"字,我們 需要輸入拼音字母"han"來實(shí)現(xiàn),但同時(shí),我們將得到一張有100或者更多備 選字的列表;統(tǒng)計(jì)顯示,平均每一個(gè)拼音對(duì)應(yīng)著17個(gè)不同的漢字,這是一 個(gè)相對(duì)很高的重碼率,限制了拼音法的最大輸入效率;尤其對(duì)于顯示長度有 限的小型數(shù)字設(shè)備而言,這一缺陷表現(xiàn)的尤為明顯。
(2) 使用柯蒂鍵盤的結(jié)構(gòu)編碼輸入法,其使用羅馬字母鍵來映射漢字 部首和筆畫,以適用于繁體漢字輸入的倉頡和適用于簡體漢字輸入的五筆為 代表
具有快速輸入的特點(diǎn);以五筆為例,其最重要的優(yōu)勢(shì)在于其重碼率相當(dāng) 低,大部分的普通漢字都具有唯一的五筆編碼,因此, 一些普通的漢字僅需 要2個(gè)鍵字即可實(shí)現(xiàn)輸入,最多需要4個(gè),且輸入五筆碼后不再需要進(jìn)行進(jìn) 一步的選擇處理,這是一個(gè)非常顯著的特點(diǎn),由此帶來了非常高的輸入速度; 通過優(yōu)化,五筆輸入方法可以擴(kuò)展為最多四個(gè)鍵字輸入多個(gè)漢字或者詞組, 一個(gè)受過訓(xùn)練的使用者能夠每分鐘輸入超過100個(gè)漢字;倉頡碼雖然重碼率 稍高于五筆,但與注音輸入法相比,其在輸入速度方面的優(yōu)勢(shì)仍然非常明顯;
但上述輸入法顯然無法推廣到數(shù)字鍵上;同時(shí),上述輸入法還存在一個(gè) 主要缺陷,就是難學(xué)而易忘。大部分的使用者在開始學(xué)習(xí)時(shí)都要經(jīng)歷一段艱苦的時(shí)期,上述輸入法的鍵字定義和復(fù)雜的輸入規(guī)則非常難以記憶。
(3)使用數(shù)字鍵的結(jié)構(gòu)編碼輸入法,如前面提到的九方Q9,縱橫輸入
法CKC和筆畫輸入法
其中,Q9輸入法和CKC輸入法分別使用9個(gè)數(shù)字鍵(l to 9)和10個(gè)鍵(O to 9)來輸入漢字。以CKC輸入法為例,其將構(gòu)成漢字的所有可能筆畫分為 10組,分別定義在數(shù)字0-9之一上,然后按照四角筆畫的順序四碼實(shí)現(xiàn)漢字 輸入。這種情況下,用戶需要記憶9個(gè)或者10個(gè)鍵分別對(duì)應(yīng)的鍵字,而每 一個(gè)鍵上往往映射有非常多的部首或者筆畫,這對(duì)于并非頻繁使用中文輸入 系統(tǒng)的人來說并非易事;特別是在在CKC中,用戶還需要學(xué)習(xí)新的漢字分 解方式;
目前移動(dòng)電話上最流行的漢字輸入法是筆畫輸入法,由于它是一種完全 的基于筆畫的漢字編碼方法,因此十分易學(xué);其中,簡體漢字的24個(gè)筆畫
和繁體漢字的41個(gè)筆畫被基于它們的形狀分為5種基本筆畫類型,如下 □Horizontal stroke [橫]:一 □Vertical stroke [豎]:I
□ Left-Falling stroke幽J □Right-Falling or dot strokes [,々、掠]:、
□ Turning stroke [折]:, 每一類筆畫類型被分配給一個(gè)數(shù)字鍵, 一般情況下,使用數(shù)字鍵1到5。
由于筆畫輸入法的編碼是基于手寫漢字的筆畫順序,熟悉漢語的人們?cè)趯W(xué)寫 漢字的過程中已經(jīng)對(duì)其有了充分了解,因此極大的降低了筆畫輸入法的學(xué)習(xí) 難度;但是,對(duì)于一些具有很多筆畫的復(fù)雜漢字,采用筆畫輸入法將是一個(gè) 非常耗時(shí)的工作,例如,采用筆畫輸入法輸入"中文輸入法"(括號(hào)中為與簡 體漢字存在區(qū)別的繁體漢字)的編碼如下
國中I I
隱文、一j 、
國輸一 H 、一 I i一一 I I
(輸一 I "一一 H 、一 I ,一一 I I ) 畫入J 、顯然,對(duì)于具有較少筆畫的簡單漢字,比如"入",筆畫輸入法是非常有 效的;但對(duì)于具有較多筆畫的復(fù)雜漢字,比如"輸/輸",就需要很多次的擊 鍵輸入;由于筆畫輸入法中漢字編碼使用可變長度,這明顯降低了具有許多 筆畫的復(fù)雜漢字的輸入速度。
綜上所述,目前仍然沒有任何一種簡單的漢字輸入法,它能夠在易學(xué)性、 輸入的高效性以及小型數(shù)字鍵盤適用性等方面同時(shí)具有優(yōu)勢(shì)。我們?nèi)匀辉趯?找這樣一種易學(xué)、易用的輸入法,它能夠在PC的數(shù)字小鍵盤或者其他手持 數(shù)字設(shè)備的數(shù)字鍵盤上像輸入英文一樣方便的輸入漢字。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例旨在提供能夠同時(shí)在易學(xué)性、輸入的高效性以及小型數(shù) 字鍵盤適用性方面具有優(yōu)勢(shì)的漢字輸入方案。
為實(shí)現(xiàn)上述目的,本發(fā)明的實(shí)施例提供了一種漢字輸入方法,用于將漢 字通過一定步驟轉(zhuǎn)換為能夠通過小型數(shù)字鍵盤輸入到處理器并為其所識(shí)別 的漢字編碼;該一定步驟包括
51、 將需要輸入的漢字分解為以下6種基本筆畫類型橫、豎、撇、點(diǎn) 捺、順折和反折;
52、 進(jìn)行小型數(shù)字鍵盤設(shè)置,包括在
-[9]鍵中選擇6個(gè)鍵,所述 漢字編碼的集合包括所述6個(gè)鍵的鍵字;以及,分別建立所述6個(gè)鍵到 上述基本筆畫類型的映射;以及,
53、 至多輸入所述漢字的6個(gè)基本筆畫的編碼到處理器。
其中,該小型數(shù)字鍵盤可以為柯蒂Q(mào)WERTY鍵盤的數(shù)字小鍵盤或者手 持?jǐn)?shù)字設(shè)備的數(shù)字鍵盤。
較佳的,步驟S1中分解的基本筆畫類型組成如下 橫至少包括一 。
I J;
點(diǎn)捺至少包括'、 、
順折至少包括n;7l—""h、,11"L》3U; 反折至少包括Lh(^7^aLL^A、、w。
豎至少包括 撇至少包括該步驟S2中在
-[9懷中選擇6個(gè)鍵可以為數(shù)字鍵[l]-[6];則建立到基
本筆畫類型的映射的步驟包括建立數(shù)字鍵[l]到基本筆畫類型橫的映射,建
立數(shù)字鍵[2]到基本筆畫類型豎的映射,建立數(shù)字鍵[3]到基本筆畫類型撇的映 射,建立數(shù)字鍵[4]到基本筆畫類型點(diǎn)捺的映射,建立數(shù)字鍵[5]到基本筆畫類 型順折的映射,以及,建立數(shù)字鍵[6]到基本筆畫類型反折的映射。
該需要輸入的漢字可以為單個(gè)漢字或者詞組;則步驟S2中進(jìn)行小型 數(shù)字鍵盤設(shè)置的步驟還包括設(shè)置單字完成鍵,用于標(biāo)識(shí)單個(gè)漢字的輸入完 成;設(shè)置詞組完成鍵,用于標(biāo)識(shí)詞組輸入完成;其中,所述詞組完成鍵包括 二字詞組完成鍵和多字詞組完成鍵;貝lj,該步驟S3之后還包括鍵入相應(yīng) 的完成鍵。
其中,對(duì)于柯蒂鍵盤的數(shù)字小鍵盤,可以設(shè)置數(shù)字鍵[O]為單字完成 鍵,對(duì)于手持?jǐn)?shù)字設(shè)備的數(shù)字鍵盤,可以設(shè)置中央控制按鈕為單字完成鍵; 以及,可以設(shè)置數(shù)字鍵[7]為二字詞組完成鍵,設(shè)置數(shù)字鍵[8]為多字詞組 完成鍵。
較佳的,步驟S3可以包括對(duì)于單個(gè)漢字,如果需要輸入的漢字其全 部筆畫數(shù)不多于6碼的,按照其書寫順序逐個(gè)輸入其相應(yīng)的基本筆畫編碼; 對(duì)于其全部筆畫數(shù)多于6碼的,選擇輸入其前三劃和后三劃的筆畫編碼,或 者,選擇輸入其前四劃和后二劃的筆畫編碼。
以及,對(duì)于詞組,選擇輸入其第一字至多前三劃的筆畫編碼和最后一 字至多后三劃的筆畫編碼;或者,選擇輸入其第一字至多前四劃的筆畫編碼 和最后一字至多后二劃的筆畫編碼。
本發(fā)明的實(shí)施例還提供了一種小型數(shù)字鍵盤,其
-[9]鍵中的6個(gè)鍵 用于輸入漢字編碼,并分別映射以下6種基本筆畫類型橫、豎、撇、點(diǎn) 捺、順折和反折。
其中,該小型數(shù)字鍵盤可以為柯蒂Q(mào)WERTY鍵盤的數(shù)字小鍵盤或者
手持?jǐn)?shù)字設(shè)備的數(shù)字鍵盤。
較佳的,該用于輸入漢字編碼的6個(gè)鍵可以為數(shù)字鍵[l]-[6];其中, 數(shù)字鍵[l]映射基本筆畫類型橫,數(shù)字鍵[2]映射基本筆畫類型豎,數(shù)字鍵[3] 映射基本筆畫類型撇,數(shù)字鍵[4]映射基本筆畫類型點(diǎn)捺,數(shù)字鍵[5]映射 基本筆畫類型順折,以及,數(shù)字鍵[6]映射基本筆畫類型反折。該小型數(shù)字鍵盤可以設(shè)有單字完成鍵和詞組完成鍵;具體而言,對(duì) 于柯蒂鍵盤的數(shù)字小鍵盤,數(shù)字鍵
為單字完成鍵,對(duì)于手持?jǐn)?shù)字設(shè)備的 數(shù)字鍵盤,中央控制按鈕為單字完成鍵;以及,數(shù)字鍵[7]為二字詞組完 成鍵,數(shù)字鍵[8]為多字詞組完成鍵。
本發(fā)明的實(shí)施例還提供了一種漢字輸入系統(tǒng),包括
如上所述的小型數(shù)字鍵盤;
漢字編碼數(shù)據(jù)庫,用于保存漢字及其編碼;其中,該漢字編碼的集 合包括該小型數(shù)字鍵盤中被選擇的6個(gè)鍵的鍵字;
處理器,分別與該小型數(shù)字鍵盤和漢字編碼數(shù)據(jù)庫連接,用于將該小型 數(shù)字鍵盤輸入的漢字編碼在該漢字編碼數(shù)據(jù)庫中執(zhí)行匹配,并返回匹配的漢字。
較佳的,該漢字編碼數(shù)據(jù)庫可以包括單個(gè)漢字子庫以及詞組子庫,該處 理器根據(jù)該小型數(shù)字鍵盤輸入的單字完成鍵或詞組完成鍵,分別在相應(yīng)的字 庫中執(zhí)行匹配。
其中,該詞組子庫可以包括二字詞組子庫和多字詞組字庫。 由上述技術(shù)方案可知,本發(fā)明的實(shí)施例通過使用區(qū)區(qū)六個(gè)基本筆畫類型 和至多6碼輸入,具有以下有益效果
1、 能夠提供6+62+63+65+66 = 55,986個(gè)編碼,為繁體漢字(13,500字) 和簡體漢字(6,500字)提供足夠的編碼空間,重碼率低;
2、 快速輸入;
3、 支持小型數(shù)字鍵盤;
4、 易學(xué)易用。
通過以下參照附圖對(duì)優(yōu)選實(shí)施例的說明,本發(fā)明的上述以及其它目的、 特征和優(yōu)點(diǎn)將更加明顯。
圖1為本發(fā)明所提供的漢字輸入方法一實(shí)施例的流程圖; 圖2為本發(fā)明所提供的小型數(shù)字鍵盤的一實(shí)施例-柯蒂鍵盤的數(shù)字小鍵 盤的示意圖3為本發(fā)明所提供的小型數(shù)字鍵盤的一實(shí)施例-移動(dòng)終端的數(shù)字鍵盤的示意圖。
具體實(shí)施例方式
下面將詳細(xì)描述本發(fā)明的具體實(shí)施例。應(yīng)當(dāng)注意,這里描述的實(shí)施例只 用于舉例說明,并不用于限制本發(fā)明。
首先,必須說明的是,現(xiàn)代處理器中所存在的兩種主要漢字編碼方式分
別是國家標(biāo)準(zhǔn)GB以及Big5;其中,GB是中華人民共和國和新加坡的標(biāo)準(zhǔn), 包括大約6,500簡體漢字,Big5主要在香港和臺(tái)灣使用,包括大約13,500繁 體漢字。這兩個(gè)數(shù)字--6,500和13,500-對(duì)于漢字編碼的重碼率參數(shù)是非常重 要的,我們?cè)趯?shí)施例中將結(jié)合這兩個(gè)數(shù)字說明本發(fā)明所提供的漢字輸入方法 的優(yōu)點(diǎn)。
一般來說,為了解決輸入復(fù)雜漢字所存在的編碼過長的問題,我們可以 考慮采用固定長度編碼。如果采用上面提及的、基于5種基本鍵字的筆畫輸 入法,其固定長度的編碼空間將是非常有限的。例如,如果使用5碼,那么 編碼空間僅為3,905 (=5+52+53+54+55),遠(yuǎn)遠(yuǎn)難以滿足編碼6,500個(gè)簡體和 13,500個(gè)繁體漢字的編碼需求;如果使用6碼來提供19,530的編碼空間 (=5+52+53+54+55+56),雖然勉強(qiáng)能夠滿足繁體漢字的基本要求,但是重碼率 將很高;可行的編碼方式是7碼,提供97,655 (=5+52+53+54+55+56+57)的編碼 空間,這遠(yuǎn)遠(yuǎn)超出了繁體漢字13,500的要求,從而能夠有效的降低重碼率, 但是,7碼的長度會(huì)導(dǎo)致輸入速度的降低。
為了在編碼空間和輸入速度之間進(jìn)行平衡,本發(fā)明所提供了一種漢字輸 入方法,其相比于筆畫輸入法多提供了一種筆畫類型,并采用至多6碼輸入, 即Six-Digit Base-6,可以簡稱G6輸入法。下面我們結(jié)合具體的實(shí)施例加以 描述。
請(qǐng)結(jié)合圖1,顯示了本發(fā)明提供的漢字輸入方法一實(shí)施例的流程圖,該 漢字輸入方法用于將漢字通過一定步驟轉(zhuǎn)換為能夠通過小型數(shù)字鍵盤輸入 到處理器并為其所識(shí)別的漢字編碼;其中,該小型數(shù)字鍵盤可以為柯蒂 QWERTY鍵盤的數(shù)字小鍵盤或者手持?jǐn)?shù)字設(shè)備的數(shù)字鍵盤。
具體的,該一定步驟包括
Sl、將需要輸入的漢字分解為以下6種基本筆畫類型,如下橫(Horizontal strokes)、豎(Vertical strokes)、撇(Left-Falling strokes)、 點(diǎn)捺(Right-Falling strokes or dot strokes) 、 J頃折(Clockwise Turning strokes)和反折(Anticlockwise Turning strokes);為了幫助使用,這6種 基本筆畫類型可以在小型數(shù)字鍵盤上分別標(biāo)示如下一、I 、 j 、 、 、 7 以及厶。
可以看出,G6的6種基本筆畫類型相較于筆畫輸入法的5種筆畫類 型而言更加對(duì)稱,即每一種筆畫都具有與其對(duì)應(yīng)的筆畫橫和豎,撇和 捺,順折和反折。因此,這6種基本筆畫類型并不會(huì)比筆畫輸入法的5 種筆畫類型難于記憶。為了幫助記憶,我們還可以采用一個(gè)非常簡單的 中文口訣來表示這六種基本筆畫類型 一橫二豎三撇四點(diǎn)五順六反。
較佳的,每一種基本筆畫類型的組成如下
(1) 基本筆畫類型"橫"至少包括一 /;
(2) 基本筆畫類型"豎"至少包括I J ; 一些漢字在編碼過程中往往存在是否需要在豎劃上進(jìn)行加鉤變化的
疑惑,比如示和少,并由此導(dǎo)致了編碼的混亂;為了避免這一問題,本 發(fā)明在基本筆畫類型"豎"中包括了"J "。
(3) 基本筆畫類型"撇"至少包括Z );
(4) 基本筆畫類型"點(diǎn)捺"至少包括'、 、;
(5) 基本筆畫類型"順折"至少包括n^i—、、:U"L"L》31〕;
其中,歸入"順折"的筆畫標(biāo)準(zhǔn)為,該筆畫發(fā)生至少一次轉(zhuǎn)折,且其 第一次轉(zhuǎn)折是順時(shí)針的;由于只有第一次轉(zhuǎn)折被作為識(shí)別的標(biāo)識(shí),因此 對(duì)上述一些復(fù)雜筆畫進(jìn)行分類并不困難。
(6) 基本筆畫類型"反折"至少包括Lh^^^LLL^^V、";
其中,歸入該類的筆畫標(biāo)準(zhǔn)為,該筆畫發(fā)生至少一次轉(zhuǎn)折,且其第 一次轉(zhuǎn)折是逆時(shí)針的;同樣的,由于只有第一次轉(zhuǎn)折被作為識(shí)別的標(biāo)識(shí), 因此對(duì)上述一些復(fù)雜筆畫進(jìn)行分類并不困難。
S2、進(jìn)行小型數(shù)字鍵盤設(shè)置,包括在
-[9]鍵中選擇6個(gè)鍵,該漢 字編碼的集合包括這6個(gè)鍵的鍵字;以及,分別建立這6個(gè)鍵到上述基 本筆畫類型的映射;
作為一個(gè)具體實(shí)施例,本步驟中在
-[9]鍵中選擇的6個(gè)鍵為數(shù)字鍵[1]-[6];該建立到基本筆畫類型的映射的步驟包括建立數(shù)字鍵[l]到基本 筆畫類型"橫"的映射,建立數(shù)字鍵[2]到基本筆畫類型"豎"的映射,建立數(shù)字
鍵[3]到基本筆畫類型"撇"的映射,建立數(shù)字鍵[4]到基本筆畫類型"點(diǎn)捺"的 映射,建立數(shù)字鍵[5]到基本筆畫類型"順折,的映射,以及,建立數(shù)字鍵[6] 到基本筆畫類型"反折"的映射。當(dāng)然,本領(lǐng)域技術(shù)人員可以理解,上述數(shù)字 鍵的選擇并不是唯一的。
同時(shí)需要說明的是,為了提高輸入速度,大部分漢字輸入系統(tǒng)在輸入第 一個(gè)漢字時(shí)都提供有關(guān)聯(lián)漢字列表,用戶可以從列表中選擇相關(guān)聯(lián)的漢字。 實(shí)際上,當(dāng)存在大量關(guān)聯(lián)漢字供用戶選擇時(shí),這種關(guān)聯(lián)漢字的方式并非十分 有效;另一種提高輸入速度的方法是同時(shí)輸入超過一個(gè)漢字的信息,尤其是 輸入一個(gè)詞組。
本發(fā)明提供的漢字輸入方法同時(shí)支持詞組模式,即需要輸入的漢字 為單個(gè)漢字或者詞組。為了進(jìn)行區(qū)分,本步驟中進(jìn)行小型數(shù)字鍵盤設(shè)置的 步驟還包括設(shè)置單字完成鍵,用于標(biāo)識(shí)單個(gè)漢字的輸入完成;
設(shè)置詞組完成鍵,用于標(biāo)識(shí)詞組輸入完成;其中,所述詞組完成鍵包括 二字詞組完成鍵和多字詞組完成鍵。
作為具體實(shí)施例,對(duì)于柯蒂鍵盤的數(shù)字小鍵盤,可以設(shè)置數(shù)字鍵
為單 字完成鍵,對(duì)于手持?jǐn)?shù)字設(shè)備的數(shù)字鍵盤,可以設(shè)置中央控制按鈕為單字完 成鍵;以及,設(shè)置數(shù)字鍵[7]為二字詞組完成鍵,設(shè)置數(shù)字鍵[8]為多字詞組完 成鍵。
S3、至多輸入所述漢字的6個(gè)基本筆畫的編碼到處理器。 為了實(shí)現(xiàn)高速輸入,本發(fā)明提供的漢字輸入方法使用至多6碼來編碼漢 字;這樣,通過六種筆畫類型和使用最大6碼輸入,能夠提供6+62+63+65+66 =55,986的編碼空間,遠(yuǎn)大于6,500和13,500,足以滿足繁體和簡體漢字的 編碼需要。
具體的,由于輸入的漢字可能為單個(gè)漢字或者詞組,詞組又可能分為二 字詞組或多字詞組,因此下面我們分別加以討論。
XI.對(duì)于單個(gè)漢字的情況,當(dāng)需要輸入的漢字的全部筆畫數(shù)多于6碼時(shí) 可以選擇輸入其前三劃和后三劃的筆畫編碼(簡稱(3+3)規(guī)則),或者,選 擇輸入其前四劃和后二劃的筆畫編碼;其中,(3+3)規(guī)則是使用前三劃和后三劃,即頭三尾三來編碼漢字,前
三劃是第一、二、三劃,后三劃是倒數(shù)第三、二、 一劃。例如,這種規(guī)則下,
"中文輸入法"(括號(hào)中為與簡體漢字存在區(qū)別的繁體漢字)的編碼是
中| 7 — I =2512 文、一 j 、 = 4134
輸 一厶I 一 I I = 162/22 (輸一 I 7 — I | = 入)、=34
法、、——厶、=441/64
可以看出,這種6碼對(duì)于輸入復(fù)雜漢字是非常高效的,同時(shí)不影響簡單 漢字的快速輸入;進(jìn)一步舉例如下(括號(hào)中為與簡體漢字存在區(qū)別的繁體漢 字)
經(jīng)/_厶——I 一66U^ (經(jīng) 濟(jì)、、一 、j I =441^2 (濟(jì) 國I 7—一 、 一 =251/^ (國 家、、7 j ) 、 =445334
基本上,前三劃被用來識(shí)別復(fù)雜漢字的部首, 一般來說,使用三劃能夠 區(qū)分大部分漢字的部首,尤其對(duì)于簡體漢字而言;另外,后三劃被用來確定 具有相似或相同部首的漢字。
假設(shè)具有某一相同部首的復(fù)雜漢字有300個(gè),那么當(dāng)我們基于6種基本 筆畫類型使用后三劃時(shí),我們平均能夠得到3 00/63=3個(gè)重碼。由于這種重碼 率少于9,因此最終備選的同碼漢字列表很容易提供給用戶,是一種對(duì)用戶 而言非常友善的界面。
顯然,這種(3+3)規(guī)則的特點(diǎn)使本發(fā)明所提供的漢字輸入方法具有相當(dāng) 高的速度。
另外,(4+2)規(guī)則也可以被用來作為漢字編碼,但重碼率要稍高于(3+3) 規(guī)則,在此不再贅述。
X2.對(duì)于二字詞組,由于大部分中文詞組由兩個(gè)漢字組成,本發(fā)明所提 供的漢字輸入方法為所有的二字詞組提供了專門的數(shù)據(jù)庫。通過使用(3)+(3) 規(guī)則,當(dāng)需要輸入的漢字的全部筆畫數(shù)多于6碼時(shí),二字詞組編碼同樣是非 常簡單的包括第一個(gè)漢字的至多前三劃和第二個(gè)漢字的至多后三劃構(gòu)成6碼。下面是一些二字詞組按照上述規(guī)則的編碼(括號(hào)中為與簡體詞組存在區(qū) 別的繁體詞組)
輸入(一/_ I )+0 、) = 16234
(輸入:(一 I 7)+(J 、)=125^/) 中國(I 7—)+( — 、 一"2517W
(中國(l 7—)+(、〗一)=251^^) 香港U — l)+( 7—厶)=3125" 經(jīng)濟(jì)(A厶一)+( 、 j I ) = 661^2
(經(jīng)濟(jì):(/_△、)+( I——)=6642")
由于G6單個(gè)漢字編碼的最小長度是1,因此2字詞組編碼的最小長度 是2,最大長度是6。實(shí)際上,需要一個(gè)專門的詞組標(biāo)識(shí)鍵來表明并非單個(gè) 漢字而是詞組的輸入,根據(jù)本實(shí)施例步驟S2的設(shè)置,是由[7]鍵來實(shí)現(xiàn)這一 目的。
X3.包括多于兩個(gè)字的詞組被認(rèn)為是多字詞組,我們同樣使用(3)+(3)規(guī) 則對(duì)其進(jìn)行編碼。其中,包括第一個(gè)漢字的至多前三劃和最后一個(gè)漢字的至 多后三劃構(gòu)成6碼。下面是一些多字詞組按照上述規(guī)則的編碼(括號(hào)中為與 簡體詞組存在區(qū)別的繁體詞組)
輸入法(一/_ I )+( —/_ 、 ) = 162J似 (輸入法(一 I —厶、)=125/")
中國人:(I 7—)+(〗、)=251^ (中國人(I 7—)+( J 、) = 251") 經(jīng)濟(jì)學(xué)(厶/_一)+( 7 1—)=6615^
(經(jīng)濟(jì)學(xué)(/_/_、)+( 7 I —)=66452" 與眾同樂(一厶一)+(l J 、)=1612W
(與眾同樂:(一l 7) +(| j 、)=1252 4) 一日千里(一)+( I —一)=12U 香港特別行政區(qū)U — I )+( j 、厶"312J" (香港特別行政區(qū)(j 一 I )+( 7—厶)=3薦6) 中華人民共和國(l 7—) + ( —、一) = 251^7 (中華人民共和國(l 7—) + ( 、 )一) = 251^1 )可以看出,本發(fā)明提供的漢字輸入方法能夠支持中文詞組編碼,從而顯
著的提高輸入速度;例如,如果用戶以簡體漢字逐字輸入"香港特別行政區(qū)" 的編碼,共需要40碼來輸入7個(gè)字,而采用本發(fā)明提供的詞組編碼,就能 夠以平均每個(gè)字少于一碼的編碼方式實(shí)現(xiàn)多字詞組的輸入。同時(shí),這種詞組
編碼的規(guī)則也是易記易用的。
相應(yīng)的,本發(fā)明的實(shí)施例還提供了小型數(shù)字鍵盤,可以為柯蒂Q(mào)WERTY 鍵盤的數(shù)字小鍵盤或者手持?jǐn)?shù)字設(shè)備的數(shù)字鍵盤。
具體的,該小型數(shù)字鍵盤的
-[9]鍵中的6個(gè)鍵用于輸入漢字編碼,并 分別映射以下6種基本筆畫類型橫、豎、撇、點(diǎn)捺、順折和反折。作為一 具體實(shí)施例,該用于輸入漢字編碼的6個(gè)鍵可以為數(shù)字鍵[l]-[6];其中,數(shù) 字鍵[l]映射基本筆畫類型橫,數(shù)字鍵[2]映射基本筆畫類型豎,數(shù)字鍵[3]映 射基本筆畫類型撇,數(shù)字鍵[4]映射基本筆畫類型點(diǎn)捺,數(shù)字鍵[5]映射基本 筆畫類型順折,以及,數(shù)字鍵[6]映射基本筆畫類型反折。
同時(shí),為了支持對(duì)單個(gè)漢字的輸入和詞組輸入的區(qū)分,該小型數(shù)字鍵盤 還設(shè)有單字完成鍵和詞組完成鍵。
請(qǐng)結(jié)合圖2,顯示了柯蒂鍵盤的數(shù)字小鍵盤的示意圖。其中,數(shù)字鍵[O] 為單字完成鍵,當(dāng)用戶編碼鍵入單個(gè)漢字后,可以通過[O]鍵通知處理器鍵入 完成;此時(shí),如果具有該編碼的漢字超過一個(gè),那么系統(tǒng)將顯示所有的編碼 以備選擇,用戶可以使用數(shù)字"l-9"鍵進(jìn)行最終選擇。同時(shí),鍵[O]還可以作為 "空格(Space)"鍵在漢字間輸入空格。
另外,[Enter]鍵可以作為單字完成鍵的輔助鍵,用來加速常用單字的輸 入。因?yàn)槌S米侄酁橹卮a字選字列表的頭一個(gè)字,所以用戶如從界面得知或 己知要輸入的單字是列表的首個(gè)字,就可以直接使用[Enter]鍵輸入這個(gè)常用 單字而無須再使用數(shù)字"1 -9"鍵進(jìn)行最終選擇。
此外,數(shù)字鍵[7]為二字詞組完成鍵,數(shù)字鍵[8]為多字詞組完成鍵,數(shù)字 鍵[9]可以作為標(biāo)點(diǎn)鍵。
以及,用戶可以使用"-"鍵來"Page Up"(上一頁)和"+"鍵來"Page Down"(下一頁)。進(jìn)一步的,","鍵可以被用于"刪除Delete上一輸入"以及"" 鍵可以作為"萬用字"來幫助用戶更容易和迅速的輸入漢字編碼。同時(shí),柯蒂鍵盤的數(shù)字小鍵盤的其他功能可以沿用。
請(qǐng)結(jié)合圖3,顯示了移動(dòng)終端的數(shù)字鍵盤的示意圖。其中,該鍵盤上大 部分鍵的設(shè)置與圖2所示的數(shù)字小鍵盤相同,僅僅"單字完成鍵"一般被設(shè)在 中央控制按鈕上。此外,[#]被作為中英文切換鍵,刪除可以設(shè)計(jì)在兩邊控制 按鈕上。
同時(shí),移動(dòng)終端的數(shù)字鍵盤的其他功能可以沿用。
相應(yīng)的,本發(fā)明的實(shí)施例還提供了一種漢字輸入系統(tǒng),包括 如上所述的小型數(shù)字鍵盤;
漢字編碼數(shù)據(jù)庫,用于保存漢字及其編碼;其中,該漢字編碼的集 合包括該小型數(shù)字鍵盤中被選擇的6個(gè)鍵的鍵字;
處理器,分別與所述小型數(shù)字鍵盤和漢字編碼數(shù)據(jù)庫連接,用于將該小 型數(shù)字鍵盤輸入的漢字編碼在漢字編碼數(shù)據(jù)庫中執(zhí)行匹配,并返回匹配的漢 字。
具體來說,該漢字編碼數(shù)據(jù)庫可以包括單個(gè)漢字子庫以及詞組子庫,處 理器根據(jù)小型數(shù)字鍵盤輸入的單字完成鍵或詞組完成鍵,分別在相應(yīng)的字庫 中執(zhí)行匹配。
其中,詞組子庫包括二字詞組子庫和多字詞組字庫。
綜上所述,本發(fā)明所提供的漢字輸入方案適用于具有柯蒂鍵盤的PC上 和具有小的12鍵數(shù)字鍵盤的小型數(shù)字設(shè)備上,漢字和詞組使用區(qū)區(qū)六個(gè)基 本筆畫類型和至多6碼輸入,具有低重碼率和高速輸入的特點(diǎn),且其非常易 學(xué)和易記,因此,為計(jì)算機(jī)和小型數(shù)字設(shè)備的漢字處理提供了強(qiáng)大的支持工 具。
雖然已參照幾個(gè)典型實(shí)施例描述了本發(fā)明,但應(yīng)當(dāng)理解,所用的術(shù)語是 說明和示例性、而非限制性的術(shù)語。由于本發(fā)明能夠以多種形式具體實(shí)施而 不脫離發(fā)明的精神或?qū)嵸|(zhì),所以應(yīng)當(dāng)理解,上述實(shí)施例不限于任何前述的細(xì) 節(jié),而應(yīng)在隨附權(quán)利要求所限定的精神和范圍內(nèi)廣泛地解釋,因此落入權(quán)利 要求或其等效范圍內(nèi)的全部變化和改型都應(yīng)為隨附權(quán)利要求所涵蓋。
權(quán)利要求
1.一種漢字輸入方法,用于將漢字通過一定步驟轉(zhuǎn)換為能夠通過小型數(shù)字鍵盤輸入到處理器并為其所識(shí)別的漢字編碼;其特征在于,所述一定步驟包括S1、將需要輸入的漢字分解為以下6種基本筆畫類型橫、豎、撇、點(diǎn)捺、順折和反折;S2、進(jìn)行小型數(shù)字鍵盤設(shè)置,包括在
-[9]鍵中選擇6個(gè)鍵,所述漢字編碼的集合包括所述6個(gè)鍵的鍵字;以及,分別建立所述6個(gè)鍵到上述基本筆畫類型的映射;以及,S3、至多輸入所述漢字的6個(gè)基本筆畫的編碼到處理器。
2. 根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征在于,所述小型數(shù) 字鍵盤為柯蒂Q(mào)WERTY鍵盤的數(shù)字小鍵盤或者手持?jǐn)?shù)字設(shè)備的數(shù)字鍵 盤。
3. 根據(jù)權(quán)利要求1或2所述的漢字輸入方法,其特征在于,所述步驟Sl中分解的基本筆畫類型組成如下 橫至少包括一 。 I J ;豎至少包括 撇至少包括 點(diǎn)捺至少包括 順折至少包括 反折至少包括
4. 根據(jù)權(quán)利要求1或2所述的漢字輸入方法, 驟S2中在
-[9]鍵中選擇6個(gè)鍵為數(shù)字鍵[l]-[6]; 類型的映射的步驟包括建立數(shù)字鍵[l]到基本筆畫類型橫的映射,建立數(shù) 字鍵[2]到基本筆畫類型豎的映射,建立數(shù)字鍵[3]到基本筆畫類型撇的映射,建立數(shù)字鍵[4]到基本筆畫類型點(diǎn)捺的映射,建立數(shù)字鍵[5]到基本筆畫類型 順折的映射,以及,建立數(shù)字鍵[6]到基本筆畫類型反折的映射。
5. 根據(jù)權(quán)利要求1或2所述的漢字輸入方法,其特征在于,所述需 要輸入的漢字為單個(gè)漢字或者詞組;則所述步驟S2中進(jìn)行小型數(shù)字鍵盤其特征在于,所述步 所述建立到基本筆畫設(shè)置的步驟還包括設(shè)置單字完成鍵,用于標(biāo)識(shí)單個(gè)漢字的輸入完成;設(shè)置詞組完成鍵,用于標(biāo)識(shí)詞組輸入完成;其中,所述詞組完成鍵包括 二字詞組完成鍵和多字詞組完成鍵;貝U,所述步驟S3之后還包括鍵入相應(yīng)的完成鍵。
6. 根據(jù)權(quán)利要求5所述的漢字輸入方法,其特征在于,對(duì)于柯蒂鍵盤 的數(shù)字小鍵盤,設(shè)置數(shù)字鍵
為單字完成鍵,對(duì)于手持?jǐn)?shù)字設(shè)備的數(shù)字鍵 盤,設(shè)置中央控制按鈕為單字完成鍵;以及,設(shè)置數(shù)字鍵[7]為二字詞組 完成鍵,設(shè)置數(shù)字鍵[8]為多字詞組完成鍵。
7. 根據(jù)權(quán)利要求1或2所述的漢字輸入方法,其特征在于,所述步驟 S3包括對(duì)于單個(gè)漢字,如果需要輸入的漢字其全部筆畫數(shù)不多于6碼的, 按照其書寫順序逐個(gè)輸入其相應(yīng)的基本筆畫編碼;對(duì)于其全部筆畫數(shù)多于6 碼的,選擇輸入其前三劃和后三劃的筆畫編碼,或者,選擇輸入其前四劃和 后二劃的筆畫編碼。
8. 根據(jù)權(quán)利要求7所述的漢字輸入方法,其特征在于,對(duì)于詞組, 選擇輸入其第一字至多前三劃的筆畫編碼和最后一字至多后三劃的筆畫編 碼;或者,選擇輸入其第一字至多前四劃的筆畫編碼和最后一字至多后二劃 的筆畫編碼。
9. 一種小型數(shù)字鍵盤,其特征在于,其
-[9]鍵中的6個(gè)鍵用于輸入 漢字編碼,并分別映射以下6種基本筆畫類型橫、豎、撇、點(diǎn)捺、順折 和反折。
10. 根據(jù)權(quán)利要求9所述的小型數(shù)字鍵盤,其特征在于,為柯蒂 QWERTY鍵盤的數(shù)字小鍵盤或者手持?jǐn)?shù)字設(shè)備的數(shù)字鍵盤。
11. 根據(jù)權(quán)利要求9或10所述的小型數(shù)字鍵盤,其特征在于,所述 用于輸入漢字編碼的6個(gè)鍵為數(shù)字鍵[l]-[6];其中,數(shù)字鍵[l]映射基本筆 畫類型橫,數(shù)字鍵[2]映射基本筆畫類型豎,數(shù)字鍵[3]映射基本筆畫類型 撇,數(shù)字鍵[4]映射基本筆畫類型點(diǎn)捺,數(shù)字鍵[5]映射基本筆畫類型順折, 以及,數(shù)字鍵[6]映射基本筆畫類型反折。
12. 根據(jù)權(quán)利要求9或10所述的小型數(shù)字鍵盤,其特征在于,其設(shè) 有單字完成鍵和詞組完成鍵。
13. 根據(jù)權(quán)利要求12所述的小型數(shù)字鍵盤,其特征在于,對(duì)于柯蒂鍵 盤的數(shù)字小鍵盤,數(shù)字鍵
為單字完成鍵,對(duì)于手持?jǐn)?shù)字設(shè)備的數(shù)字鍵盤, 中央控制按鈕為單字完成鍵;以及,數(shù)字鍵[7]為二字詞組完成鍵,數(shù)字 鍵[8]為多字詞組完成鍵。
14. 一種漢字輸入系統(tǒng),其特征在于,包括 如權(quán)利要求9-13任一所述的小型數(shù)字鍵盤;漢字編碼數(shù)據(jù)庫,用于保存漢字及其編碼;其中,所述漢字編碼的 集合包括所述小型數(shù)字鍵盤中被選擇的6個(gè)鍵的鍵字;處理器,分別與所述小型數(shù)字鍵盤和漢字編碼數(shù)據(jù)庫連接,用于將 所述小型數(shù)字鍵盤輸入的漢字編碼在所述漢字編碼數(shù)據(jù)庫中執(zhí)行匹配, 并返回匹配的漢字。
15. 根據(jù)權(quán)利要求14所述的漢字輸入系統(tǒng),其特征在于,所述漢字 編碼數(shù)據(jù)庫包括單個(gè)漢字子庫以及詞組子庫,所述處理器根據(jù)所述小型 數(shù)字鍵盤輸入的單字完成鍵或詞組完成鍵,分別在相應(yīng)的字庫中執(zhí)行匹 配。
16. 根據(jù)權(quán)利要求15所述的漢字輸入系統(tǒng),其特征在于,所述詞組 子庫包括二字詞組子庫和多字詞組字庫。
全文摘要
本發(fā)明公開了一種漢字輸入方法,一種小型數(shù)字鍵盤以及一種漢字輸入系統(tǒng)。該漢字輸入方法用于將漢字通過一定步驟轉(zhuǎn)換為能夠通過小型數(shù)字鍵盤輸入到處理器并為其所識(shí)別的漢字編碼,包括將需要輸入的漢字分解為以下6種基本筆畫類型橫、豎、撇、點(diǎn)捺、順折和反折;進(jìn)行小型數(shù)字鍵盤設(shè)置,包括在
-[9]鍵中選擇6個(gè)鍵,所述漢字編碼的集合包括所述6個(gè)鍵的鍵字;以及,分別建立所述6個(gè)鍵到上述基本筆畫類型的映射;至多輸入所述漢字的6個(gè)基本筆畫的編碼到處理器。通過本發(fā)明,能夠?qū)崿F(xiàn)漢字在小型數(shù)字鍵盤上的高速輸入,且易學(xué)易用。
文檔編號(hào)G06F3/023GK101556505SQ20081008867
公開日2009年10月14日 申請(qǐng)日期2008年4月10日 優(yōu)先權(quán)日2008年4月10日
發(fā)明者布禮文 申請(qǐng)人:香港城市大學(xué)