專利名稱:數(shù)字鍵盤數(shù)碼為中心的模糊邏輯多語種輸入系統(tǒng)和方法
技術領域:
5 本發(fā)明是一種在計算機和手機數(shù)字鍵盤上利用模糊邏輯的原理,以數(shù)碼作為模糊
的介質(zhì),采用先模糊、后精確的設計理念,優(yōu)先預測、顯示多種合理組合中的高頻字 詞,同時支持由數(shù)字編碼串轉換為漢語拼音串或拼音文字的字母組合串,進而以拼音 串或字母組合串作為介質(zhì),精確査找、縮小、鎖定和選擇候選字詞的范圍,并依靠單 一引擎、同一界面、模塊化的技術設計,通過數(shù)字編碼串、字母組合串進行搜索、査 10找,實現(xiàn)多語種快速輸入的人機交互系統(tǒng)和方法。
本發(fā)明適用于手機、PDA、小靈通、IPTV、機頂盒、遙控器、IP信息電話、稅控 收款機、游戲機、飛機載用空中電話、車載電話等數(shù)字鍵盤電子設備。
背景技術:
15 現(xiàn)代信息技術是以西方語言文字為基礎發(fā)展起來的,PC鍵盤由英文打字機演變
過來。在PC鍵盤上,語言符號(字母、筆畫等)與每個鍵位之間是一對一的關系, 如英文的26個字母和漢語拼音中的字母分別對應PC鍵盤的26個鍵位。
以手機等電子產(chǎn)品為主的數(shù)字鍵盤與PC鍵盤的突出區(qū)別在于前者的鍵位少(1—0 十個數(shù)字鍵),26個英文字母分別設定在標準數(shù)字鍵盤數(shù)'字鍵2—9共八個鍵位上,
20平均每個鍵位上附有3—4個字母。在字母較多的語言中(如阿拉伯語、泰語等),數(shù) 字鍵盤上一個鍵位需要設定更多個字母或字符??梢?,無論是英文字母還是漢語拼音, 在PC鍵盤上字母與鍵位的分布和對應關系非常清晰,通過按鍵可以準確地得到所需 拼音字母序列組合,進而査找和鎖定所需字詞的范圍;但在數(shù)字鍵盤上, 一個數(shù)字鍵 位上設定有3個或4個字母, 一組按鍵序列往往產(chǎn)生多種合理的拼音或字母組合,無
25法實現(xiàn)象PC鍵盤上那樣精確的效果和目標。換言之,PC鍵盤上的按鍵與字母(符) 之間是一種清晰的對應關系,而數(shù)字鍵盤上的按鍵與字母(符)之間是多種合理組合 的對應關系。因此,由于受硬件設備自身的限制,數(shù)字鍵盤同PC鍵盤的輸入存在一 定的差異。如PC鍵盤上的輸入可以一步到位實現(xiàn)準確化,數(shù)字鍵盤上就無法做到直 接的精確化受數(shù)字鍵盤一對多個字母對應關系的影響,預測功能在數(shù)字鍵盤上的優(yōu)
勢明顯高于在PC鍵盤上作用;中文輸入方法中的簡拼和混拼(全拼、簡拼混合使用) 在PC上能夠得到很好的發(fā)揮,但在數(shù)字鍵盤上卻難以發(fā)揮作用,等等。
現(xiàn)有數(shù)字鍵盤輸入技術基本仿照和沿用pc輸入求精確的基本設計思路,通過按鍵 與編碼之間的精細化和準確性,進行編碼輸入信息的精確化査找,達到鎖定所需候選 內(nèi)容的目的。但是,由于數(shù)字鍵盤的鍵位與起所代表的字符之間存在著一對多的關系, 僅僅通過按鍵達到精確的目的具有一定的困難。
為了達到精細化和準確化的目的,現(xiàn)有技術通常包括兩種按鍵的類型和方法一
種是多次按鍵法(multi touch),即通過多次按鍵,在一個鍵位上幾個字母之間進行
挑選, 一步一步、 一個層次一個層次地進行精細化篩選,査找、鎖定和選擇所需字母,
如數(shù)字鍵2上有字母A、 B、 C,按一下2得到A,連續(xù)按兩下2得到字母B,連續(xù)按 三下2得到字母C。這種方法雖然可以精確挑選到所需的字母,但多次按鍵所需的按 鍵次數(shù)非常多,操作煩雜,輸入速度慢;同時多次按鍵又限制了預測功能的發(fā)揮。
另一種方法是一次按鍵法(one touch),即每個字母只按一鍵,不必在每個鍵位 上的幾個字母之間進行挑選,通過合理組合的原則和預測功能,將可能與按鍵相匹配 的字母串或字詞預測并顯示出來,進而鎖定和選擇所需字詞。例如,在中文拼音模式 下輸入"楊",就分別按拼音串"yang"所對應的數(shù)字鍵9264,與9264相匹配的wang、 yang、 zang等拼音組合就出現(xiàn)在候選行中。然后通過移動光標選擇yang,同時排除 wang、 zang等,使候選的范圍縮小到y(tǒng)ang的范圍內(nèi),直至從中找到"楊"。
雖然一次按鍵法比多次按鍵法減少了按鍵次數(shù),但由于一次按鍵每個字母只按一 鍵的方式必然會產(chǎn)生多種合理的組合,且候選行中每次只能顯示默認或光標所對應的 字母組合相匹配的候選字詞,于是就需要通過移動光標,借用拼音編碼串逐步查找和 鎖定候選的范圍和字詞。這種逐步精細化的過程使每一次的預測和查找出的范圍只能 精確到與所選擇的拼音串相匹配,或者是wang,或者是yang,或者是zang,只能是 其中之一,不能預測出其它合理組合相匹配的候選字詞。在wang下只能是"王、往" 等而不能是"楊、陽"等,反之,在yang下預測的只能是"楊、陽"等而不能是"王、 往"等。
可見,基于PC精確化設計理念的現(xiàn)有數(shù)字鍵盤輸入技術,要求在多個字母、多種 組合、多個層次中進行挑選和不斷細化,這些操作過程不僅增加按鍵次數(shù),同時難以 使所有合理組合中最常用的字詞在高頻先見的原則下被優(yōu)先預測和顯示出來,難以充 分發(fā)揮高頻先見的特點和優(yōu)勢。現(xiàn)有技術的缺點具體表現(xiàn)在
1. 一次只能預鍘和顯示多種組合中與一種組合相匹配的高頻字詞,與多種組合中的
其它組合相匹配的高頻字詞無法被同歩、實時的預滅和顯示。
現(xiàn)有數(shù)字鍵盤輸入技術沿用PC鍵盤輸入技術的精確化設計理念,在輸入過程中, 通過按2-9數(shù)字鍵,編碼區(qū)都會出現(xiàn)拼音字母。數(shù)字鍵盤一個鍵位對多個字母(符) 的特點,使按鍵輸入后可以有多個合理的組合。但候選區(qū)顯示的只能是與光標所示或 所默認的拼音字母相匹配和對應的字詞?,F(xiàn)有技術將這些合理的拼音組合顯示在候選 行中,或通過一個外加的顯示框顯示出來,通過移動光標進行選擇,確定范圍。如按 下數(shù)字鍵9264,只能得到與wang、 yang、 zang中某一個相匹配的候選字詞。如果默 認的拼音組合不是所需的,就需要通過移動光標,先鎖定所需的拼音組合,然后再進 行選擇。這種操作必然增加按鍵次數(shù)。
另外,在輸入過程中,把同按鍵相匹配的所有拼音串都顯示在候選行中,需要占 用顯示空間,阻礙更多其它候選字詞的出現(xiàn),如按鍵輸入9264,其合理的拼音組合 包括wang、 yang、 zang等,這三個拼音串本身占用一定的屏幕顯示空間,影響候選 漢字的出現(xiàn)。.雖然有的輸入方案為了克服這一缺點,專門設定一個顯示拼音串的浮動 窗口,將拼音串放在該窗口中顯示。但是浮動窗口同樣需要占用屏幕的空間位置,同 時在操作過程中又需要在浮動窗口中的拼音串之間進行不斷的切換和選擇,影響輸入 速度;
輸入的過程是一個不斷排除的過程。隨著編碼區(qū)編碼(如拼音字母)的輸入,候 選內(nèi)容也會相應改變,候選范圍逐漸縮小,同時系統(tǒng)會自動搜尋同編碼相匹配的候選 內(nèi)容。但是這種改變均只能在一種拼音組合對應的漢字范圍內(nèi),而不會顯示具有相同 編碼的其它合理拼音組合相匹配的高頻字詞。也就是說,在現(xiàn)有技術中系統(tǒng)預測和顯 示的候選字只能是多個組合中的某一種相匹配的候選字。如果默認的拼音串不是所需 字詞的拼音,就需要通過移動光標,先選定所需的拼音串或開頭的拼音串,通過這個 拼音串縮小候選的范圍,直至找到所需的候選字詞。
2.精確化的設計理念,為英文或其它拼音文字在數(shù)字鍵盤上的輸入帶來諸多的不便。
在英文等拼音文字中,單詞是由字母組合而成的最小的表義單位,其排列形式是 橫向的序列。英文的26個字母被設定在2—9八個數(shù)字鍵位上。一次按鍵的輸入方法, 要求系統(tǒng)支持預測功能,通過預測達到快速搜索和隨定候選內(nèi)容。但是一次按鍵法一 個字母只按一鍵,相同字母組合的數(shù)量和重碼率必然非常高。如在英文模式下輸入 266,可能的合理組合包括以amo, ann, bom, bon, com, con等開始的幾十個甚至數(shù) 百個單詞。精確化的方法要求顯示精確的字母組合,即amo、 ann、 bom、 bon,、 com、 con等字母組合中的某一種組合及其由該組合開始的候選詞語。 一次只能顯示 默認或光標所對應的字母組合相匹配的候選詞語。如果默認的組合不是所需的,就需 要通過移動光標,先選定所需的組合,縮小候選的范圍,直至找到所需的候選字詞。 由于英文由字母橫向組合成詞的序列較長,占用的顯示空間位置較大, 一般一個頁面 平均只能顯示5個詞左右,査找、鎖定所需的詞語就更困難,必然需要多次翻頁,才 能找到所需的詞語。
顯然,現(xiàn)有技術基于精確化的設計理念,其多次按鍵法要求的按鍵次數(shù)多,操作 煩雜,預測功能難以發(fā)揮作用;其一次按鍵法,每次只能預測以一種字母組合開始的 候選詞語。如果當前默認的不是所需的詞語,需要通過多次翻頁查找所需的候選詞語, 使預測功能在輸入英文和其它拼音文字中受到很大的限制,預測的優(yōu)勢更難以發(fā)揮作 用,給快速査找、縮小和鎖定所需詞語的候選范圍帶來巨大的困難。
3.精確化的設計理念難以實現(xiàn)中文拼音的混拼輸入
漢語拼音的組合規(guī)律非常強,漢語拼音字母可以組合成417個音節(jié)。因此,在PC 鍵盤上, 一個拼音字母同一個鍵位相對應拼音輸入的編碼方案和方法可以是全拼,即 輸入詞組中每個字的全部拼音字母,或者是簡拼,即只支持利用每個字的首音字母作 為編碼進行輸入,或者是混拼,即全拼、簡拼混合使用。現(xiàn)有數(shù)字鍵盤輸入技術的精 確化設計理念通常只支持合理的拼音組合,即全拼輸入法,個別設計方案支持簡拼。 由于混拼輸入方法是模糊邏輯的一種具體表現(xiàn)形式,與精確化的設計理念相悖,現(xiàn)有 數(shù)字鍵盤輸入技術無法支持混拼輸入。
但是,現(xiàn)代漢語中的文本主要以詞組、短語為主,詞組在中文文本中占72%以上。 現(xiàn)有數(shù)字鍵盤輸入技術只支持單字輸入、單字預測、單字聯(lián)想、逐字上屏,要輸入詞 組、短語、短句,需要分別逐字輸入其中每一個單字或單詞,沒有實現(xiàn)短語、短句的 快速輸入、連續(xù)輸入。這種方法破壞人們思維的連續(xù)性,違背人們使用和理解語言的 習慣,必然增加人腦負擔,影響輸入速度。
發(fā)明內(nèi)容
本發(fā)明的目的是利用模糊邏輯的方法,改變現(xiàn)有數(shù)字鍵盤輸入技術仿照和沿用PC 鍵盤從精確到精確所產(chǎn)生的一些缺點,解決現(xiàn)有技術中的無法使多種合理組合中的高
頻字詞被同步、實時預測和顯示的不足;克服拼音文字中字母組合重碼率高、占用空 間大,無法快速搜索、査找和鎖定所需候選詞語;創(chuàng)新一套符合數(shù)字鍵盤軟硬件特點, 支持全球多種語言直接、快速輸入的系統(tǒng)和方法。
模糊邏輯及其特點
模糊邏輯(Fuzzy Logic)是在多值邏輯基礎上發(fā)展起來的,認為事物在形態(tài)和類 屬方面具有亦此亦彼、模棱兩可的模糊性,承認真值的中間過渡性,相鄰中介之間相 互交叉和滲透的特征。
模糊邏輯區(qū)別于二元邏輯,但并不是要取W代之二元邏輯,而是讓人們知道如何 權變。二元邏輯的教條就是或左或右,而不能既左又右,也排除了中間的灰色成份。 模糊邏輯的目的并不是"混亂的邏輯",不是讓多種對應關系之間變得模模糊糊,而 是為了 "梳理混亂的邏輯",用模糊的方法去描述客觀存在的一對多的對應關系,提 供一個具有充分彈性的自然的系統(tǒng)介質(zhì),揭示數(shù)字鍵盤同語言符號之間多種關系這一
模糊現(xiàn)象的本質(zhì)和規(guī)律,在充滿模糊性的對應關系之間架起了--座可以通融的橋梁。 有了模糊邏輯,計算機就可以跨越兩極的邊界,在"灰色"中間地帶發(fā)揮作用;還可 以在信息有限的條件下,兼收并蓄,在泥沙混雜的情況下因勢利導,得出精確的答案。
模糊是相對于精確而言的。過份精確還可能導致過于克板、缺乏靈活性。模糊思 維也不是要放棄精確,而是"當事物變得復雜的時候,精確的陳述就會失去其精確的 內(nèi)涵。模糊邏輯體現(xiàn)了人腦模糊思維的邏輯特征,通過模仿人的思維方式來表示和分 析不確定、不精確信息的方法和工具,它為自然語言的語義表達提供了一個具有充分 彈性的自然的系統(tǒng)工具。
本發(fā)明的創(chuàng)新要點
本發(fā)明的具體創(chuàng)新要點包括
1.采用數(shù)字化編碼,利用數(shù)字編碼作為編碼區(qū)顯示當前已輸編碼的手段,無論在任 何模式下,按鍵后在編碼區(qū)默認顯示的均為數(shù)字編碼,用數(shù)字來表現(xiàn)和描述語言字母 (符)同鍵位之間對應關系的模糊特征,即一個數(shù)字可以同時代表幾個字母(符)同 鍵位之間的對應關系。利用數(shù)字的模糊特點作為模糊的介質(zhì),由系統(tǒng)査找、預測和顯 示所有合理組合相匹配的高頻字詞,使這些合理組合中的高頻字詞被優(yōu)先預測,并依 據(jù)各自的使用頻率混合排列在候選內(nèi)容行中,克服現(xiàn)有技術中一次只能預測和顯示多 種字母組合中的一種字母組合相匹配的高頻詞語,不能同屏、同步顯示符合數(shù)字編碼 的所有拼音象對應的高頻字詞。
據(jù)統(tǒng)計,現(xiàn)代漢語中人均使用的常用字約為2 — 3千個漢字,短信輸入中的人均 用字大約在1500字之間。這些漢字被分布在417個音節(jié)的組合中。模糊邏輯的方法 基本能夠解決短信、郵件等日常交流,特別是短信交流中80%的常用高頻漢字的要 求。因此,模糊邏輯的方法有助于促進高頻先見作用的有效發(fā)揮,實現(xiàn)數(shù)字鍵盤中文 快速輸入。
數(shù)字編碼作為模糊邏輯的介質(zhì)的理論根據(jù)
1)數(shù)字鍵盤的特點上其通用性和規(guī)律性。阿拉伯數(shù)字0—9被全球不同國家、不 同民族、不同語言廣泛采用;標準的數(shù)字鍵盤及其產(chǎn)品也通用于全球;數(shù)字鍵 位的排列順序和結構非常規(guī)范;無論是拼音文字還是表意文字,其語言字符或 編碼形式均同數(shù)字鍵盤的鍵位存在著一種有規(guī)律的對應映射關系,即鍵位上的
數(shù)字與語言符號之間的對應關系。在輸入過蓰中,iE蓉是通過按相應的數(shù)字鍵 來輸入不同語言中的字母(符)。因此,數(shù)字就成為體現(xiàn)這種規(guī)律和對應關系 的最直接、最形象的媒介和載體。
2) 數(shù)字化編碼是一種模糊邏輯和方法的具體體現(xiàn),使一次按鍵的操作方式在全球 語言輸入中達到統(tǒng)一。無論一個數(shù)字鍵位上對應的是哪種語言文字符號,無論 一個鍵位上有多少字母(符),每個數(shù)字鍵都只需按一次,便以高頻先見的原 則預測和顯示與該數(shù)字編碼相匹配的字詞。統(tǒng)一數(shù)字化編碼顯示和一次按鍵, 有助于高頻先見設計思想在技術上得到充分的實現(xiàn)。
3) 由于文字與數(shù)字的對應關系準確且有很強的規(guī)律性,數(shù)字編碼作為模糊理論的 介質(zhì),使所有語言文字的編碼均以數(shù)字編碼為媒介,通過功能鍵調(diào)用不同的模 塊單元,搜索出與己輸入的數(shù)字編碼相匹配的文字信息,并顯示查找到的文字 信息。例如,在拼音模式下,直接按所需漢字的拼音所對應的數(shù)字鍵,每鍵一 個字母,從第一鍵開始,候選內(nèi)容就會同步作出相應的變化,系統(tǒng)自動排列該 組數(shù)字鍵可以組成的全部有效的拼音組合,而是在編碼區(qū)顯示數(shù)字組合串,在 候選區(qū)直接顯示出與該數(shù)字(串)相匹配的所有拼音組合中頻率最高的常用漢 字。
4) 現(xiàn)有數(shù)字鍵盤輸入技術基于精確化的設計理念,而混拼是一種模糊邏輯的表現(xiàn) 形式,因此以精確為基礎的現(xiàn)有輸入方法在數(shù)字鍵盤上沒有一個表示模糊的介 質(zhì),以數(shù)字為中心的編碼理論為之創(chuàng)造了條件。混合拼音輸入的模糊性主要表 現(xiàn)在
a. 混拼指全拼和簡拼的混合使用,混拼本身就是模糊邏輯的具體表現(xiàn)之 一。同時,簡拼輸入中首音輸入的方法同樣是模糊邏輯和模糊方法的具 體表現(xiàn)之一。簡拼在方法上是一字一碼,碼指每個字的首音字母,而首 音字母既可以是聲母,也可以是韻母,二者均作為"聲母"的功能使用, 模糊了只有聲母才能被視為"首音"的狀況,不需要在韻母前增加隔音 符,而是使用韻母直接作為"聲母"使用;
b. 采用數(shù)字作為幾個字母中模糊的"介質(zhì)",不需要在字母之間進行精確 化的挑選,首先求常用、高頻,而弱化絕對準確,在依據(jù)全拼、簡拼、 混拼的編碼規(guī)則下,實現(xiàn)詞組、短語的層面中組合的高頻先見,在詞組、 短語的層面實現(xiàn)組合的合理性和高頻先見的科學性;
現(xiàn)代漢語的文本72%以上是由詞、短語組成。中文全拼輸入詞語,需要輸 入該詞語中每個字的全部拼音,按鍵次數(shù)多、輸入速度慢;而簡拼輸入詞語借用 每個字的首音字母作為編碼的依據(jù), 一字一碼,編碼簡單,但是重碼率高?;炱?是一種相對"自由"的中文詞語輸入方法,其編碼依據(jù)和兼顧全拼和簡拼中的特 點,允許全拼和簡拼的混合使用,交叉使用。因此,混拼的包容性較強,是模糊
邏輯的具體表現(xiàn)形式之一,混拼在炔速輸入詢語中的優(yōu)勢非常明顯。
2.模糊邏輯的方法帶來的問題
模糊與精確相對的,模糊邏輯的方法解決了數(shù)字鍵盤輸入技術中的一些主要缺點,
克服了現(xiàn)有技術中只能體現(xiàn)數(shù)字與字母(符)之間單一組合中的關系, 一次只能預測 和顯示單一組合相匹配的高頻字詞,實現(xiàn)了多種組合中的所有高頻字詞能夠真正依據(jù)
各自使用頻率的次序被同步査找、預測和顯示出來,使高頻先見得到最大程度的發(fā)揮。 同時,數(shù)字作為幾個字母中的介質(zhì),不需要挑選,在詞組、短語的層面實現(xiàn)所有組合 的高頻字詞被同步預測和顯示,基本能夠解決中文短信、郵件交流中80%常用字詞 的快速預測和顯示問題,加快輸入的速度。
但是,同步預測和顯示多種組合所有高頻字詞的模糊邏輯方法也同時帶來一些問 題,尤其是在一定程度上影響了使用頻率較低的非常用字詞的快速預測和顯示-
1) 數(shù)字編碼因為其一對多的模糊特性,在快速預測、縮小和鎖定一些不常用的 單字(詞)的能力上有一定的困難。特別是由于這些字詞的使用頻率較低,通過糊糊 邏輯和高頻先見的方法,難以快速將這些字詞預測、鎖定和顯示在候選行中。如要輸 入漢字"臧",按下數(shù)字鍵9264后,與多種組合wang、 yang、 zang相匹配的候選字 詞會依據(jù)這些字詞自身的使用頻率混合排列在候選的范圍內(nèi)。由于"臧"的使用頻率 較低,需要不斷翻頁才能在多種組合的混合候選中找到,這樣必然增加操作的程序, 影響輸入的速度;
2) 模糊邏輯方法的不足在由字母組合成詞的拼音文字中顯得更為突出。在英文 等拼音文字中,相同字母組合的重碼率非常高,同時單詞是橫向的組合序列,占用顯 示空間很大,要鎖定候選詞需要通過翻頁才能找到所需的詞語。英文的26個字母被 設定在2 — 9八個數(shù)字鍵位上。 一次按鍵的輸入方法,通過預測達到快速搜索和隨定 候選內(nèi)容。但是一次按鍵法一個字母只按一鍵,相同字母合理組合的的數(shù)量和重碼率 必然非常高。如在英文模式下輸入266,可能的合理組合包括以amo、 ann、 bom、 bon、 com、 con等開始的幾十個甚至數(shù)百個單詞。由于英文由字母橫向組合成詞的序列較 長,占用顯示空間很大,占用的顯示空間位置較大, 一般一個頁面平均只能顯示5 個詞左右,査找、鎖定所需的詞語就更困難,必然需要多次翻頁。
3.創(chuàng)新一種由數(shù)字編碼串轉換為拼音編碼串或字母組合串的機制
模糊同精確使相對而言的。過份精確還可能導致過于克板、缺乏靈活性。利用數(shù) 碼的模糊性,不是為了放棄精確性,而是為了 "梳理混亂的邏輯",解決數(shù)字鍵盤一 對多的組合關系,提供了一個具有彈性的自然的系統(tǒng)介質(zhì),揭示數(shù)字鍵盤同語言符號 之間多種關系模糊現(xiàn)象的本質(zhì)和規(guī)律,在充滿模糊性的對應關系之間架起了一座可以 通融的橋梁。為了解決模糊帶來的上述問題,本發(fā)明創(chuàng)新一種由數(shù)字編碼串轉換為拼
音編碼串或字母組合串的機制和方法。具一體^S1在;
1) 為了快速査找到不常用的字詞,本發(fā)明創(chuàng)新一種從模糊到精確的轉換方法,即由 數(shù)碼編碼串轉換為拼音串/字母組合串的方法,通過拼音編碼串/字母組合串快速縮小
和鎖定候選范圍,實現(xiàn)快速査找和鎖定所需字詞的目的。這樣就形成了一套先模糊、 后精確,先預測和顯示所有組合中的常用字詞,后精確鎖定某一種組合中常用字詞的 方法;
由數(shù)字編碼串轉換為拼音編碼串或字母組合串的機制和操作方法是通過功能鍵 啟動這種轉換程序,幫助將數(shù)字組合串轉換為字母組合串,為多種合理組合的快速縮 小和鎖定所霈范圍創(chuàng)造了條件。如漢語拼音能夠組合成417個基本音節(jié),為了更方便 快捷地輸入字、詞、短語,還可以先輸入該字的拼音所對應的數(shù)字鍵,通過數(shù)字串作 為模糊邏輯的介質(zhì),預測和顯示多種合理組合中所有高頻詞語。如要輸入漢字"臧", 按下數(shù)字鍵9264后,與多種組合wang、 yang、 zang相匹配的候選字詞會依據(jù)這些字 詞自身的使用頻率混合排列在候選的范圍內(nèi)。由于"臧"的使用頻率較低,需要不斷 翻頁才能在多種組合的混合候選字詞中找到。這時,可以通過啟動功能鍵,將數(shù)字編 碼9264轉換為拼音編碼串zang,使候選縮小在zang的范圍,快速査找和確認"臧"; (參見附圖1)
2) 數(shù)字編碼串轉換為拼音串/字母組合串的方法同樣適應于英文和其它拼音文字。在 英文模式下,同樣可以通過字母組合確定所需詞語的范圍,如按鍵輸入數(shù)字編碼266, 便產(chǎn)生一對多的對應關系,266對應amo、 ann、 bom、 bon、 com、 con等合理組合。 通過本發(fā)明中的數(shù)碼轉換成字母串的方法,同樣可以鎖定和縮小候選的范圍。
為了實現(xiàn)在拼音文字中由數(shù)碼轉換成字母組合串的功能,以達到快速快速縮小和 鎖定所需的字詞,本發(fā)明在英文和其它拼音文字中創(chuàng)新增加一個由該語種中構詞前綴 或常用字母組合構成的"中間介質(zhì)"環(huán)節(jié),利用英文和其它拼音文字中字母組合的關 系和規(guī)律和類型,將相同的字母組合和類型的字母串視作為一種"中間介質(zhì)",通過 "中間介質(zhì)"的環(huán)節(jié)進行搜索、縮小和鎖定候選的范圍。同時排除具有相同字母組合 與鍵位關系的其它字母組合。
這種"中間介質(zhì)"的具體實施方法與漢語中的數(shù)字編碼轉換為拼音編碼串的原理 和操作方法相同。漢語拼音以拼音字母組合作為"介質(zhì)",由數(shù)字編碼串轉換為拼音 字母組合串,縮小和精確候選的范圍。在系統(tǒng)數(shù)據(jù)庫中需要存儲一個同數(shù)字編碼相對 應的拼音編碼串數(shù)據(jù),以便需要轉換時使用;英文及拼音文字以字母組合作為"介質(zhì)", 由數(shù)字編碼串轉換為字母組合串,利用字母組合的"中間環(huán)節(jié)",縮小候選范圍,實 現(xiàn)快速査找和鎖定所需字詞的目的。例如,要輸入英文communication,首先按數(shù)字 鍵266,編碼區(qū)顯示數(shù)字編碼266,候選區(qū)顯示由266開始的組合中所有相匹配的高 頻詞語,但是為了盡快鎖定所需的詞語,可通過本發(fā)明中創(chuàng)新的由數(shù)字編碼轉換為字 母組合編碼的機制,將編碼區(qū)中的數(shù)字組合266轉換為其可能對應的諸如amo、 ann、 bom、 bon、 com、 con等字母組合串,通過功能鍵首先選定com,這時候選區(qū)中就鎖定 在以com開始的詞語中,同時排除了amo、 ann、 bo屯、bo0 con等字母組合相匹配的 候選詞語。(參見附圖2)在系統(tǒng)數(shù)據(jù)庫中需要創(chuàng)建和存儲一個同數(shù)字編碼相對應的 字母組合編碼串系統(tǒng)數(shù)據(jù),以便需要轉換時使用。這個字母組合系統(tǒng)數(shù)據(jù)由英文(或 其它拼音文字)中的幾十個或幾百個組合能力強、使用頻率高的字母組合組成,這些 字母組合往往是英文或相關語言的構詞前綴或詞匯中開首的字母串,如英文的cora-、 con-、 th-、 spr-、 som-、 pre-、 in-、 int-、 eng-等常用的前綴或字母組合串。通過 這些字母組合串來索引和鎖定候選的范圍,同時排除多種對應關系中的其它組合???見,字母組合"中間介質(zhì)"是英文和其它拼音文字中快速鎖定某一種字母組合的有效 方法,而由數(shù)字編碼組合轉換為字母組合的機制是通過"中間介質(zhì)"環(huán)節(jié)實現(xiàn)快速鎖 定候選內(nèi)容的具體手段。
采用先數(shù)碼,然后轉換為拼音串或字母組合串的方法,使全球語言文字能夠在輸 入部分(輸入方法和編碼)統(tǒng)一在數(shù)字上,編碼區(qū)中當前編碼提示部分統(tǒng)一為數(shù)碼, 操作方式統(tǒng)一為一次按鍵,統(tǒng)一使用同步預測多種組合中所有高頻字詞等功能。
這種機制同現(xiàn)有技術的主要區(qū)別在于本發(fā)明采用先模糊后精確,而現(xiàn)有技術是
從精確到精確。模糊邏輯的方法已經(jīng)解決了絕大多數(shù)的常用字詞,而從數(shù)字編碼串轉
換到拼音/字母串的機制,又有效地解決了 20%左右的不常用字詞的快速搜尋和鎖 定。其次,通過智能和自學習的支持,不常用的字詞的頻率會不斷的調(diào)整,成為用戶 的自定義的字詞或個性化的數(shù)據(jù)庫和使用頻率。因此,數(shù)字編碼串轉換為拼音/字母 串的機制是從模糊轉換到精確的過程的一種有效的手段。
另外,通過本發(fā)明中創(chuàng)新的有規(guī)律的拼音文字中的"中間環(huán)節(jié)",借用字母組合的 規(guī)律和類型,快速在多種組合中査找、鎖定所選組合的詞語,解決拼音文字字母組合 重碼率高帶來的問題,減少査找過程中翻頁的次數(shù),使預測在拼音文字的輸入過程中 發(fā)揮更有效的作用。
可見,本發(fā)明中的創(chuàng)新方案既能夠確保在數(shù)字編碼的情況下使所有合理組合中的 高頻字詞優(yōu)選顯示出來,同時又能夠通過轉換,利用拼音串或字母組合串作為介質(zhì), 幫助準確、快速在多種合理組合中縮小和鎖定候選范圍,快速查找所需的字詞。這種 設計理念為拼音文字和表意文字在數(shù)字鍵盤上的快速輸入創(chuàng)造了一套統(tǒng)一的、有效的 方法。
數(shù)字編碼串轉換為拼音串/字母組合串的操作方法
1.按數(shù)字鍵,編碼區(qū)初始顯示的均為數(shù)字,以數(shù)字編碼作為模糊邏輯的介質(zhì),優(yōu)先、 同步預測和顯示多種組合中所有高頻字詞。如果所需輸入的是不常用的字詞, 一種方 法是通過不斷的翻頁査找,直至找到該字詞;另一種方法是通過本發(fā)明創(chuàng)新的數(shù)字編 碼串轉換為拼音串/字母組合串的機制,通過按右(左)方向鍵,使編碼區(qū)中數(shù)字編
碼轉換為拼音串或字母組合串,每次顯示一個有,效的拼音寧母組合,滾動式地進行左
右移動,直至選定所需的拼音組合串或字母組合串,進而通過拼音串或字母組合串縮 小和鎖定候選的范圍,査找和選定所需的字詞。另外,更換和選擇字母組合的轉換方 式是滾動式的, 一次按鍵更換一個,字母組合的排列順序既可以是按照字母A—Z有 規(guī)律的排列,也可以是按照各種組合的組字(詞)的能力和使用頻率進行排列。同時 字母組合完畢后還可以最后返回到數(shù)字編碼串狀態(tài),實現(xiàn)數(shù)字和拼音字母組合之間滾 動式的循環(huán)轉換和顯示。
對符合按鍵字母組合的合理候選根據(jù)模糊理論均以高頻先見顯示,這種顯示方法 使多種合理組合中的頻率最高的常用漢字優(yōu)先、同步、混合排列和顯示,避免了現(xiàn)有 技術中按鍵輸入后只能顯示多種組合中的一種組合的常用字詞,雖然是常用字,但仍 然需要在拼音組合之間精確選擇后才能得到預測、顯示和確認。
2. 功能鍵的設定采用二元邏輯和方法,使用左、右方向鍵將數(shù)字編碼轉換為拼音編 碼串或拼音文字字母組合串等,滾動式的進行更換內(nèi)容。左右方向鍵作為起點,其中 通過按右方向鍵時轉換順序為正序,從頭到尾,即從A到B、 C的方向移動;而按左 方向鍵的轉換順序為逆序,從尾到頭,即從該鍵位上的最后一個字母向前移動(從C 到B、 A的方向移動)。這種以候選字母組合中頭尾作為起點,分別進行正序和逆序進 行移動的雙向選擇,方向性強,規(guī)律性強,靈活性強,為快速鎖定所需的拼音串創(chuàng)造 了雙向選擇的條件,克服了現(xiàn)有輸入技術中光標單向移動的缺點。由于拼音串的設置 順序完全同字母順序一致,規(guī)律性強,容易判斷和選擇;如在漢語拼音模式下輸入 9264 (腦g'兩,羅g),右鍵直接出現(xiàn)wang,左鍵直接出現(xiàn)zang,等,規(guī)律性非常 強,同時減少了從wang到y(tǒng)ang再到zang的移動光標進行選擇的步驟;
3. 字母串顯示規(guī)則字母串顯示的規(guī)則可以靈活設定。 一種方法是顯示的字母數(shù)量 與數(shù)字的數(shù)量等同。每次按鍵,編碼區(qū)接收一個編碼信息,按鍵次數(shù)的多少,編碼區(qū) 數(shù)字編碼的個數(shù)和每個對應的有效的拼音字母組合長度相同,即字母串的長度為等 長,同所輸入的數(shù)碼串在字母數(shù)量上完全一致,使用左右方向鍵將數(shù)字串轉換為拼音 串,候選字詞的內(nèi)容就只限于同拼音串相匹配的字詞,即候選字詞隨著拼音串的轉換 同時進行相應的轉換;當只按一次數(shù)字鍵2-9時,也就是說編碼區(qū)只顯示一個數(shù)字時, 通過按右(左)方向鍵,顯示數(shù)字鍵2-9上的字母,如果單個字母為有效拼音,如a, 候選區(qū)預測和顯示與拼音對應或開首的候選字詞;也就是說按一個數(shù)字鍵(如2鍵, 2鍵上字母為abc),編碼區(qū)首先顯示數(shù)字(2),按右方向鍵,編碼區(qū)顯示2鍵上的字 母a,候選區(qū)顯示符合拼音a的候選字詞,再按一次右方向鍵,顯示字母b,通過預 測功能,候選行中顯示字母為b的常用字詞,同理再按右方向鍵,顯示字母c,再按
右方向鍵,又回到顯示數(shù)字;
同時,字母串的長度也可以為不等長,即同所輸入的數(shù)碼串在字母數(shù)量上不完全 一致,可以提前預測編碼以此開首的更長的拼音編碼串及其候選字詞。如,按鍵輸入 92后,候選行中便出現(xiàn)與92等長或由92開首的拼音組合wa、 ya、 za、 wan、 yan、 zai、 yao、 zao、 wang、 yang、 zang等。然后選擇所需的字詞的拼音組合,進而縮小 把候選的范圍。
4.拼音字母串直接上屏:在本方案中,數(shù)字、拼音字母串或字母組合串均可直接上屏, 而不需要轉換到相關模式完成,實現(xiàn)在同一界面下多種功能和符號的直接、快速輸入-
1) 當編碼區(qū)是數(shù)字編碼時,通過按*鍵可是數(shù)字直接上屏;
2) 當通過右(左)方向鍵轉換為拼音串時,通過按*鍵也可編碼區(qū)中的拼音串直 接上屏,而不需要專門設置相關輸入模式,也不需要轉換到相關模式下完成 拼音字母串上屏;
模糊邏輯方法的技術實現(xiàn)及其工作原理
本發(fā)明中模糊邏輯的方法之所以能夠得以順利、有效的實施,其技術上支撐來自 與采用了單一引擎、同一界面和模塊化設計等技術設計理念。單一引擎本身就具有模
糊的特點,不分語言體系、不區(qū)分語言文字的形式,把所有的語言文字都視為人機交 互的一套符號系統(tǒng),這種符號同數(shù)字鍵盤存在著一種對應關系,這種關系可以通過數(shù) 字進行編碼,并可以通過技術上的創(chuàng)新和模塊化的設計,使每個模塊都是獨立的,語 言模塊同系統(tǒng)相分離,使得系統(tǒng)可以根據(jù)要求增加或刪除某些模塊。由于語言特點和 編碼方案的復雜性,如漢語中就有拼音、筆畫、注音、部件等多種編碼方案,各種編 碼方案均可以轉換為世界通用的阿拉伯數(shù)字的編碼形式,利用數(shù)字化編碼,實現(xiàn)數(shù)字 鍵盤輸入技術對全球語言的通用性、萬能性。
本發(fā)明中模,原理的要點和特征在于(參見附圖3、附圖4)
1.數(shù)字編碼的模糊性本發(fā)明以數(shù)碼為中心,釆用數(shù)字化對全球語言符號及其同
數(shù)字鍵盤鍵位之間對應關系 杼1^馬,用數(shù)字來表瑰*^#述語言字符同鍵位之
間對應關系之間的模糊性特征,即一個數(shù)字可以同時代表同幾個語言字符(字 母)之間的對應關系,實現(xiàn)不同語言符號的編碼在輸入層面(輸入方法和編碼) 達到統(tǒng)一利用數(shù)字與多種組合的模糊關系,在任何模式下均使用數(shù)字碼顯示 當前已輸?shù)木幋a,使編碼區(qū)的編碼初始狀態(tài)顯示得到統(tǒng)一;使全球語言符號與 數(shù)字鍵位的對應關系,使一次按鍵的操作方式在全球語言輸入按鍵上達到統(tǒng) 一;采用Unicode使不同語言的計算機內(nèi)部碼(計算機內(nèi)碼)和輸出層面得到 統(tǒng)一。另外,內(nèi)部碼和外部碼(輸入層面編碼)的統(tǒng)一性為單一引擎、同一界 面實現(xiàn)多功能、多語種的輸入創(chuàng)造了必要條件。不論何種語言或者編碼方案, 輸入均為數(shù)字編碼串,輸出均為Unicode編碼所對應的語言文字符號。
本發(fā)明采用數(shù)字化編碼使外部編碼(輸入法編碼、鍵盤對應關系等)和輸入 得到了統(tǒng)一,數(shù)字的模糊性為數(shù)字串轉換為本地化編碼形式(拼音串/字母組合串) 創(chuàng)造了條件,借助這種模糊性特征作為輸入、顯示、轉換、數(shù)據(jù)存儲等的介質(zhì), 同系統(tǒng)中的Unicode編碼進行直接連接,使全球語言能夠在輸入部分統(tǒng)一在數(shù)字 編碼上,在輸出部分統(tǒng)一在Unicode編碼上
輸入法編碼 (數(shù)字化)
本地化編碼(初始為"數(shù)字化",轉換后為拼音串/字母串)
計算機內(nèi)部碼 (Unicode)
輸出 (Unicode)
2.借用模糊邏輯,在設計理念上不是以精確化為唯一目標,不在一個鍵位幾個字 母之間進行挑選,而是用數(shù)字作為模糊理論的支點,以及數(shù)字與幾種可能之間 的關系,在輸入中的預測和聯(lián)想借用高頻先見的基本原則, 一次到位的預測和 顯示。如要用中文拼音輸入"臧",在輸入編碼92后,搜索模塊不僅搜索同 92相對等的內(nèi)容,同時搜索并預測出以92開首的編碼更長的內(nèi)容,這些內(nèi)容 會按照高頻先見的原則被預測出來"挖、雅、完、燕、王、楊、力—"等,而不 需要通過"wa、 ya、 za、、 yan、 zai、 yao、 zao、 wang、 yang、 zang、',等拼音
組合進行一步步的選定而預測*數(shù)字的模糊性特征、既可提高査找速度,簡化 操作過程,省去在多個字母中選擇的環(huán)節(jié),同時非常有助于"高頻先見"原則
的實現(xiàn);但是,如果需要通過精確査找頻率相對低的字詞(如"臧"),減少重 碼率,縮小候選的范圍,可以在輸入數(shù)字編碼后,按左(右)方向鍵,啟動轉
換模塊,系統(tǒng)將與拼音編碼串zang相匹配的字詞搜索出來,由顯示模塊將編 碼區(qū)的數(shù)字變?yōu)橄鄳钠匆艚M合,按倒(順)序且拼音組合由長(短)到短(長) 排列顯示,移動光標選擇所需的拼音組合,同時,查詢單元將所輸入的數(shù)字編 碼與轉換后的拼音串在數(shù)據(jù)庫中的文字編碼進行對比,査找出相應的文字,顯 示單元顯示査找到的文字信息。候選區(qū)與數(shù)字對應的所有高頻字變?yōu)樗x定的 拼音組合對應的內(nèi)容,也是以高頻先見的規(guī)則顯示,候選范圍明顯縮小,這個 操作步驟有利于快速査找所需字,減少了翻屏次數(shù),大大提高了輸入速度。
3.數(shù)據(jù)存儲的方式
1) 輸入部分在不同語言中均為數(shù)字編碼,因此,編碼均使用數(shù)碼形式進行存 儲。同時支持不同語言和輸入方案中附加的特殊編碼數(shù)據(jù)的存儲。例如, 在中文數(shù)據(jù)庫中存儲一套與數(shù)字編碼相對應的漢語拼音編碼串,以便在需 要時作為由數(shù)字編碼轉換為拼音串的的介質(zhì);在英文和其它拼音文字中, 增加和存儲一套與字母組合相對應的字母組合編碼串,作為由數(shù)字編碼轉 換為字母組合串的介質(zhì),用以搜索、縮小和鎖定候選范圍。
這些拼音串和字母組合編碼串的存儲形式不是字母串本身,而是通過 一套有規(guī)律的符號或標記代替這些字母組合串,如英文的字母組合
com, con等等是通過一個數(shù)字串進行存儲,如com可以對應數(shù)字符號1, con 對應數(shù)字2, tom對應數(shù)字3,等等,這種方法既可以有效快速査找和鎖定 候選,同時又能節(jié)省字母組合串本身占用的空間。在搜索的和査找的過程 中,系統(tǒng)中的搜索模塊不需要精確的去查找com或con,而是首先査找一 種以266為標記的合理組合中所有高頻詞語。這樣不僅有助于數(shù)據(jù)存儲和 壓縮的優(yōu)化,同時可以快速搜索到所需的詞語范圍和具體詞語。不求精確, 而是模糊的概念,通過功能鍵啟動轉換模塊后,系統(tǒng)會在數(shù)據(jù)庫中進行查 找,找出與數(shù)字串相匹配的字母串,再通過字母串縮小搜索的范圍,鎖定 候選的內(nèi)容。
2) 系統(tǒng)數(shù)據(jù)庫中的詞匯部分在不同語言均以Unicode的形式存儲。任何語S
的詞匯數(shù)據(jù)庫都統(tǒng)一在Ufiico(k編,式下,議毫免沖突的Unicode來表
示,而不必為每個語言的個性編碼進行考慮,既降低程序的復雜度,又能 夠被主流系統(tǒng)、硬件平臺所支持。由于內(nèi)部碼直接使用Unicode的方式存 儲,因此輸出的候選不需要通過中間環(huán)節(jié)轉換,而是以Unicode編碼串, 直接輸出并被系統(tǒng)顯示出來。 3) 從上述可以看出,無論是拼音文字和表意文字在系統(tǒng)數(shù)據(jù)庫中都存儲一個 中間的介質(zhì)形式進行存儲。但是這個中間環(huán)節(jié)部分是一個可選擇的環(huán)節(jié)。 一般情況下,并不需要啟動和運用數(shù)碼轉換為拼音串或字母串就可快速獲 得所需的字詞。只有在輸入不常用的字詞時,才需借用"中間環(huán)節(jié)",通過 拼音編碼串或字母組合串逐步細化和選定候選內(nèi)容。
4.搜尋模塊的工作原理啟動轉換環(huán)節(jié)的操作是通過按功能鍵(左右方向鍵, 也可設定在其它功能鍵上)。不按轉換鍵,査找和搜索就依據(jù)數(shù)字編碼直接進 入Unicode數(shù)據(jù)庫中選擇與之相匹配的候選字詞;按下轉換鍵,查找和搜索就 依據(jù)轉換后的拼音串或字母組合串進入Unicode數(shù)據(jù)庫中選擇與之相匹配的 候選字詞。
在本發(fā)明的設計方案里,無論哪種語言,輸入部分都以數(shù)字進行編碼,在 搜索過程中,可以直接的與用戶所輸入的按鍵編碼相直接對應,減少將數(shù)字編 碼轉換為本地化編碼(拼音串/字母組合串)的過程,提高搜索效率。通過按 數(shù)字鍵輸入編碼串,編碼串初始以數(shù)字串顯示,并被記錄在一個緩存中,既可 以直接顯示緩存中存儲的數(shù)字串,也可以通過轉換以其它形式(拼音串或字母 組合串)顯示,顯示輸入的本地化編碼串。也可以將上述的兩種情況結合起來, 默認情況下顯示數(shù)字編碼串,但在用戶需要的情況下,通過功能鍵啟動轉換程 序,使之轉換拼音編碼串、字母組合串等。
這種針對數(shù)字鍵盤設計以直接數(shù)字編碼+ (拼音串/字母組合串)+ Unicode 存儲的設計方案,使模糊到精確的轉換得以實現(xiàn),同時使多種語言之間的轉換、 多種語言混合輸入、數(shù)字轉換為拼音串/字母串等原本復雜的輸入過程變得統(tǒng) 一、和諧、方便、直接。
搜索模塊的主要功能是接收用戶的按鍵指令,對不同按鍵的指令作出響 應,以確定和啟動相關的程序和模式。其響應機制為在輸入過程中,每次按 鍵輸入編碼后,編碼仍然以數(shù)字形式存放在緩存區(qū)中,同時査找模塊以默認所 在模式的形式,開始在相關模塊和數(shù)據(jù)中進行運行和搜索,選擇出與之相匹配
的候選內(nèi)容,等待選擇。這樣,在未確認上屏之前,已'輸入的當前編碼和候選 內(nèi)容均屬于緩存的狀態(tài)。當使用功能鍵轉換功能或模式后,原來的搜索狀態(tài)就 即刻停止,新指令指向的功能和模式就馬上啟動,系統(tǒng)將根據(jù)編碼的規(guī)則搜索 和判斷出對應的詞語內(nèi)容
5. 功饞鍵的啟動和操作啟動轉換模塊的操作是通過按本發(fā)明中設定功能鍵 (左右方向鍵),如圖3所示,圖中的菱形,使程序啟動相關模塊,選擇和顯
示與之相連的不同數(shù)據(jù)庫。但轉換是可以循環(huán)的,數(shù)字編碼串在轉換時始終在 緩存中保留。這個被保留的數(shù)字串,始終是在不同語言中和不同顯示形式中進 行査找和轉換的依據(jù)。
按鍵輸入的數(shù)字串首先進入緩存中,按左右方向鍵鍵啟動轉換模塊后,數(shù) 字串就會轉換為拼音串/字母組合串,并指令程序依據(jù)轉換后的拼音串/字母組 合串在系統(tǒng)數(shù)據(jù)庫中進行搜索和査找。使原本寬泛的一對多的對應關系變得 更加精細、準確,快速鎖定所需內(nèi)容。
6. 混拼的工作原理混拼體現(xiàn)了拼音組合規(guī)則的模糊性,使編碼與搜索、査找 可以建立在模糊的規(guī)則基礎上,跳出來拼音組合只能精確的局限性,是混合拼 音輸入有規(guī)律可循,只要符合數(shù)字組合條件,就可以被查找出來。
對于短語、短句,則可連續(xù)輸入其中每個漢字對應的全部拼音編碼(全拼), 系統(tǒng)可能會提前預測并顯示出相應的漢字。也可只輸入每個漢字的首字母,即 按第一個字的第一個字母所在的數(shù)字鍵,系統(tǒng)搜索出分布在這個鍵上的所有字 母,再按第二個字的第一個字母所在的數(shù)字鍵,系統(tǒng)會將這個字母所在的數(shù)字 鍵上的所有字母與上一次搜索出的所有字母進行排列組合,并搜索出與這些首 字母組合對應的詞組(簡拼),還可以輸入詞組、短語中一部分字的全拼和另 一部分字的首字母(混拼)。利用這一靈活的輸入方法,由于編碼區(qū)中顯示的 是拼音對應的數(shù)字,使得編碼區(qū)的數(shù)字增加,本方法支持同步預測,同步顯示, 即候選內(nèi)容會隨著每一次按鍵作出相應的改變,但候選內(nèi)容是符合編碼區(qū)的數(shù) 字對應的所有有效拼音組合規(guī)律的高頻詞,而不會局限于某一個拼音組合。(參 見附圖5)
本發(fā)明創(chuàng)新的效果和優(yōu)越性
1.本發(fā)明的技術創(chuàng)新,通過模糊作為基礎,必要時采用精確的設計理念和方法,實
現(xiàn)語言與科技在數(shù)字鍵盤上自然和餾約完美,,尋找數(shù)字鍵盤輸入技術的通用性,
使表音文字和表意文字等都能夠采用統(tǒng)一的設計理念和操作方法,實現(xiàn)多種語言文字 輸入的一體化。使單一引擎、同一界面多語種、多功能的的具體實現(xiàn)得以更加完善,
更加合理;使數(shù)字鍵盤中鍵位與字母(符) 一對多、按鍵組合一對多的模糊性得到充 分挖掘;同時克服了現(xiàn)有技術中只能單一査找、單一預測、單一顯示的不足,創(chuàng)新出 一套解決數(shù)字鍵盤鍵位少、按鍵組合中一對多的重碼率高的完整方案,使多種組合中 的所有高頻字詞能夠在第一時間直接被預測和顯示出來,達到快速輸入的目標;
2. 在拼音文字中,采用一種特殊的方法和"中間環(huán)節(jié)"的設置,通過字母組合串作 為介質(zhì),搜索、査找和鎖定相匹配關系的詞語,解決了英語等拼音文字中字母組合重 碼率高、高頻詞語難遇被快速搜索、預測、鎖定和顯示的缺點;
3. 使?jié)h語拼音中的輸入更加靈活,更富有包容性,使全拼、簡拼、尤其是混拼輸入 在數(shù)字鍵盤上成為可能,使?jié)h字的全拼和簡拼在單一引擎中、同一界面上混合使用, 充分發(fā)揮語言的內(nèi)在規(guī)律;實現(xiàn)更為快捷、直接,能夠在同一界面下完成。實現(xiàn)詞組、 短語、短句混合輸入、快速輸入的方法;
4. 實現(xiàn)了數(shù)字、字母串、數(shù)字串等在同一界面、同一模式下直接上屏,克服了現(xiàn)有 的數(shù)字鍵盤輸入技術需要設置相關模式、并需要切換到相關模式下才能完成這些功能 的局限性和不足。
附圖l本發(fā)明中數(shù)字編碼串轉換為中文拼音編碼串的方式和效果 附圖2英文和其它拼音文字中增設字母組合串的原理和效果 附圖3本發(fā)明中數(shù)字編碼串轉換為拼音串或字母組合串實例流程圖 附圖4本發(fā)明中數(shù)字編碼串轉換為拼音串或字母組合串工作流程圖 附圖5中文拼音混拼的實例和效果
具體實施例
為了對本發(fā)明中利用模糊邏輯的原理,以數(shù)碼作為模糊的介質(zhì),釆用先模糊、
后精確的設計理念,優(yōu)先預測、顯承^>臺理組含中的髙滅字詞,同時支持由數(shù)字編 碼串轉換為精確的中文拼音串或拼音文字的字母組合串,進而以拼音串或字母組合串 作為介質(zhì),精確査找、縮小、鎖定和選擇候選字詞的范圍,并通過單一引擎、同一界 面、模塊化的技術設計,幫助數(shù)字編碼串轉換為拼音串和字母組合串,進行搜索、査 找等技術創(chuàng)新及其方法做進一步的闡述,下面結合附圖和實例進行詳細說明
數(shù)字0—9同拼音、英文字母、筆畫的對應關系,完全依照其在手機等數(shù)字鍵盤設
備上的標準分布設定
數(shù)字碼2—9對應拼音、英文字母2 abc、 3 def 、 4ghi、 5 jkl、 6 mno、 7 pqrs、 8 tuv (U)、 9 wxyz;
數(shù)字碼1一5對應漢字的筆畫編碼1—(橫)、2| (豎)、3 J (撇)、4 、(點)、 5"(折)。
附圖1在中文拼音模式下以輸入"臧"為例,說明數(shù)字編碼轉換為拼音編碼串之間 的操作方式,以及從模糊到精確的過程和對候選內(nèi)容產(chǎn)生的效果
1) 在拼音模式下,輸入"臧"的拼音zang,(按數(shù)字鍵9264),得到的使與9264 相匹配的包括"王、網(wǎng)、楊、陽、葬、藏"等在內(nèi)的幾十個候選字;
2) 按左/右方向鍵,編碼區(qū)由數(shù)字編碼9264轉換為拼音組合wang,yang,zang;
3) 使用右鍵數(shù)字編碼9264轉換為wang,候選范圍縮小在"網(wǎng)、王、往、忘等 范圍內(nèi),同時排除了與yang、 zang相匹配的候選字詞
4) 按左鍵,數(shù)字編碼9264轉換為zang,候選范圍縮小在"藏、葬、臟、臧" 等范圍內(nèi),同時排除了與wang、 yang相匹配的候選字詞。
附圖2以輸入英文communication為例,說明在拼音文字中增設"中間介質(zhì)"之一環(huán) 節(jié)對快速搜索和縮小候選范圍的必要性和可行性-
1) 首先按數(shù)字鍵266,編碼區(qū)顯示數(shù)字編碼266,候選區(qū)顯示由266開始的組合 中所有相匹配的高頻詞語,但是為了盡快鎖定所需的詞語,可通過本發(fā)明中創(chuàng) 新的由數(shù)字編碼轉換為字母組合編碼的機制
2) 將編碼區(qū)中的數(shù)字組合266轉換為其可能對應的諸如amo、 ann、 bom、 bon、 com、 con等字母組合串,
3) 通過功能鍵首先選定com,這時候選區(qū)中就鎖定在以com開始的詞語中,同時 排除了amo、 ann、 bom、 bon、 con等字母組合相匹配的候選詞語。可見,字母 組合"中間環(huán)節(jié)"是英文和其它拼音文字中快速鎖定某一種字母組合的有效方
法,而由數(shù)字編碼組合轉換為字母組合的執(zhí)制是!i^;"中向環(huán)節(jié)"實現(xiàn)快速鎖 定候選內(nèi)容的具體手段。
4)英文及拼音文字以字母組合作為"介質(zhì)",由數(shù)字編碼碼串轉換為字母組合串, 利用字母組合的"中間環(huán)節(jié)",縮小候選范圍,實現(xiàn)快速査找和鎖定所需字詞 的目的。
附圖3數(shù)字編碼串轉換為拼音串或字母組合從串的實例流程圖。如圖3所示,當用 戶按鍵輸入9264,編碼區(qū)初始直接顯示數(shù)字串9264,候選區(qū)顯示與9264相匹配的所
有高頻字詞"王、忘、楊、臟"等。當通過按鍵啟動轉換功能后,編碼區(qū)顯示的就是 拼音串(一次一種拼音串),如wang,候選區(qū)就顯示拼音串wang所對應的候選字詞
"王、忘、網(wǎng)、往"等。通過功能鍵(左右方向鍵)可以移動并選擇為yang、 zang等拼音串,候選字詞的范圍也隨之改變。
附圖4數(shù)字編碼串轉換為拼音串或字母組合從串的工作流程圖。如圖3所示,當用 戶按下某一功能鍵時,搜索模塊便對其作出判斷,并根據(jù)按鍵功能向系統(tǒng)發(fā)出指令信 息,然后系統(tǒng)就可以根據(jù)指令信息作出相應的反應。搜索和反應是系統(tǒng)為了區(qū)分各種 不同功能而設置的計算機系統(tǒng)可以直接識別的指令,是應用程序?qū)τ脩舻陌存I操作出 響應的橋梁。應用程序接收指令后,首先對指令內(nèi)容進行判斷,根據(jù)指令的不同作出 相應的響應動作,如顯示輸入結果、轉換輸入模式、數(shù)字上屏等。
附圖5以使用拼音輸入"打電話"為例,說明模糊關系在拼音輸入的靈活性、包容 性和重要性。其輸入和操作有多種不同的方式,以下列3種為例
方法1:使用全拼連續(xù)輸入"dadianhua"(按數(shù)字鍵323426482),候選內(nèi)容隨著 每一次按鍵作相應改變,在輸入過程中,依據(jù)高頻先見"打電話"被優(yōu)先預測和顯示 出來,然后直接選擇和確認上屏;
方法2:使用簡拼連續(xù)輸入"ddh"(按數(shù)字鍵334),同樣依據(jù)高頻先見,"打電話" 同樣被優(yōu)先預測和顯示出來,然后直接選擇和確認上屏;
方法3:使用混拼就可以有"dadhua"(按數(shù)字鍵323482)、 "dadianh"(按數(shù)字鍵 3234264)、 "ddianh"(按數(shù)字鍵334264)等多種組合方式,同樣依據(jù)高頻先見,"打 電話"同樣可以被預測和顯示出來,然后直接選擇和確認上屏。
權利要求
1、一種數(shù)字鍵盤多語種輸入系統(tǒng),其特征在于該系統(tǒng)利用模糊邏輯的原理,以數(shù)碼作為模糊的介質(zhì),優(yōu)先預測、顯示多種合理組合中的所有高頻字詞,同時創(chuàng)新一種從模糊轉換到精確的方法,將數(shù)字編碼串轉換為漢語拼音串或拼音文字的字母組合串,進而以拼音串或字母組合串作為介質(zhì),精確查找、縮小、鎖定和選擇候選字詞的范圍,并依靠單一引擎、同一界面、模塊化的技術設計,實現(xiàn)數(shù)字編碼串轉換為拼音串或字母組合串,進而實現(xiàn)快速搜索、查找、預測、顯示和輸入多種語言文字。
2、 根據(jù)權利要求1的輸入系統(tǒng),其特征在于所述數(shù)字編碼串指采用數(shù)字化對 10 全球多種語言進行編碼,利用數(shù)字表現(xiàn)和描述語言字母(符)同鍵位之間對應關系的模糊特征作為模糊的介質(zhì),由系統(tǒng)査找、預測和顯示所有合理 組合相匹配的高頻字詞,并依據(jù)這些字詞各自的使用頻率混合排列和顯示 在候選行中。
3、 根據(jù)權利要求l的輸入系統(tǒng)中的轉換方法,其特征在于所述的從模糊到精 15 確的轉換方法包括由數(shù)碼串轉換為拼音串的方法,通過拼音編碼串快速縮小和鎖定候選范圍,實現(xiàn)快速查找和鎖定所需字詞的目的。形成了一套 先模糊、后精確,先預測和顯示所有組合中的常用字詞,后精確鎖定模一 種組合中常用字詞的方法。
4、 根據(jù)權利要求l的輸入系統(tǒng)中的轉換方法,其特征在于所述的從模糊到精 20 確的轉換方法同樣包括數(shù)字編碼轉換為字母組合串的方法,適應于英文和其它拼音文字。在英文和其它拼音文字編碼中創(chuàng)新增加一個由該語言中構 詞前綴或常用字母組合構成的字母組合"中間介質(zhì)"環(huán)節(jié),通過"中間介 質(zhì)"環(huán)節(jié)的引導和索引進行搜索、縮小和鎖定候選字母組合范圍。
5、 根據(jù)權利要求l的輸入系統(tǒng)中的轉換方法,其特征在于所述的功能鍵的設 25 定采用二元邏輯和方法,使用功能鍵(左、右方向鍵)將數(shù)字編碼串轉換為拼音編碼串或拼音文字字母組合串等,滾動式地更換內(nèi)容。功能鍵的選 擇方向順序可以是正序,也可以為逆序。
6、 根據(jù)權利要求l的輸入系統(tǒng)中的轉換方法,其特征在于數(shù)字、拼音字母串 或字母組合串均可直接上屏。
全文摘要
本發(fā)明是一種在計算機和手機數(shù)字鍵盤上利用模糊邏輯的原理,以數(shù)碼作為模糊的介質(zhì),采用先模糊、后精確的設計理念,優(yōu)先預測、顯示多種合理組合中的高頻字詞,同時支持由數(shù)字編碼串轉換為漢語拼音串或拼音文字的字母組合串,進而以拼音串或字母組合串作為介質(zhì),精確查找、縮小、鎖定和選擇候選字詞的范圍,并依靠單一引擎、同一界面、模塊化的技術設計,通過數(shù)字編碼串、字母組合串進行搜索、查找,實現(xiàn)多語種快速輸入的人機交互系統(tǒng)和方法。
文檔編號G06F17/30GK101114195SQ200610103488
公開日2008年1月30日 申請日期2006年7月25日 優(yōu)先權日2006年7月25日
發(fā)明者王孝軍 申請人:北京優(yōu)耐數(shù)碼科技有限公司