專利名稱::采用時(shí)序歧義編碼的解碼方法以及采用該方法的裝置的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種解碼方法及一種解碼裝置,尤其涉及一種使用含糊編碼的解碼方法以及一各使用該解碼方法的裝置。
背景技術(shù):
:當(dāng)今,各種智能設(shè)備功能強(qiáng)大且可制作得很小以方便攜帶,例如行動(dòng)電話、MP3播放機(jī)等等。由于尺寸受到限制,這些裝置的人機(jī)介面設(shè)計(jì)面臨巨大挑戰(zhàn)。以文字輸入為例,當(dāng)前的解決手段包括傳統(tǒng)的多次擊鍵輸入法、預(yù)測(cè)式輸入法以及微型標(biāo)準(zhǔn)鍵盤(pán)。傳統(tǒng)的多次擊鍵輸入法(例如ABC輸入法)簡(jiǎn)單,但是輸入效率低且很難使用。微型標(biāo)準(zhǔn)鍵盤(pán)的設(shè)計(jì)假定用戶都很熟悉傳統(tǒng)的標(biāo)準(zhǔn)鍵盤(pán)而且很容易適應(yīng)微型鍵盤(pán)。然而第一個(gè)假定只適用于電腦用戶,許多未成年人在習(xí)慣標(biāo)準(zhǔn)鍵盤(pán)之前就已經(jīng)先習(xí)慣了手機(jī)輸入法。盡管這種設(shè)計(jì)相較于分散排布或按字母順序排布的方式來(lái)說(shuō)可以幫助電腦用戶更容易找到字母,然而過(guò)小的尺寸使得微型鍵盤(pán)的易用性大為降低。另一方面,預(yù)測(cè)式輸入法可很大程度上減少輸入每個(gè)字母所需按鍵的次數(shù)。然而預(yù)測(cè)式輸入法同樣引入一些新的問(wèn)題a)在用戶輸入時(shí)預(yù)測(cè)文字隨機(jī)變化;b)用戶在輸入時(shí)很難檢測(cè)其輸入的正確性而且誤輸入的回復(fù)處置讓用戶非常惱火;c)如果該輸入法預(yù)設(shè)的字典內(nèi)沒(méi)有所要輸入的詞則用戶需要切換至其他輸入法(例如多次擊鍵輸入法)重新輸入;以及d)總體來(lái)說(shuō),預(yù)測(cè)式輸入法就人的感知或其自身表現(xiàn)皆為不可預(yù)測(cè)且不可靠的。在一組映射(mapping)中,編碼序列與解碼序列被對(duì)應(yīng)起來(lái),且映射中的每個(gè)編碼序列為一個(gè)字串。如果一個(gè)字串對(duì)應(yīng)于多個(gè)映射則稱為具有空間歧義。圖1A與圖1B示出空間歧義編碼的例子,其中圖1A所示為先前技術(shù)所使用的通用鍵盤(pán),圖1B所示為該鍵盤(pán)的歧義編碼。鍵區(qū)100內(nèi)包括多個(gè)數(shù)字按鍵101及特殊功能鍵104,105。傳統(tǒng)的歧義編碼方式將數(shù)個(gè)解碼字串組成一個(gè)解碼字串集合并將該解碼字串集合指定給一個(gè)編碼字串集合。在對(duì)應(yīng)至編碼字元集的域后,單純基于該域的知識(shí)即可將群組化的字元區(qū)分開(kāi)來(lái)。此過(guò)程可看做是一種損失編碼過(guò)程。為回復(fù)丟失的資訊,可生成所有可能的組合而讓用戶去從中選擇一個(gè)正確的組合。多次擊鍵輸入法通過(guò)讓用戶在每次輸入時(shí)選擇所想要輸入的字元以在字元層級(jí)上解決歧義編碼的問(wèn)題。而傳統(tǒng)的預(yù)測(cè)式輸入法則在單詞的層級(jí)上解決歧義編碼的問(wèn)題。以圖1B中所示輸入"HOME"為例,輸入序列"4663"的一個(gè)編碼字元110代表一個(gè)集合103中的一個(gè)解碼字元112。交聯(lián)網(wǎng)絡(luò)lll顯示所有相鄰編碼字元的組合。由于輸入序列的組合有M'L種,其中M為字元集合的大小,L為輸入字串的長(zhǎng)度,因此不可能一一列舉所有的組合(本例中組合僅為3~4=81種,然而一但L=IO,則組合數(shù)為3~10=59049種)?!阏f(shuō)來(lái),語(yǔ)言學(xué)知識(shí)能用來(lái)大幅度減少輸出的數(shù)量。最常用的作法就是提供一個(gè)字典用于與輸出進(jìn)行匹配并輸出匹配結(jié)果供用戶選擇。然而,即使導(dǎo)入了語(yǔ)言學(xué),輸入序列"4663"仍然可以多種方式去解釋,例如"HOME"、"GOOD"、"GONE"、"HOOD"、"HOOF"、"HONE"、"GOOF"、"I匪E"、"INNE"、"HOND"、"INOF"與"GOOE"。換句話說(shuō),傳統(tǒng)的輸入方法與裝置中,有太多可能結(jié)果使得用戶不能高效的輸入單詞。有鑒于此,有必要提供一種更好的編碼規(guī)則,以及一種可輕易實(shí)現(xiàn)并被用戶接受的解碼方法。
發(fā)明內(nèi)容本發(fā)明的目的就是在提供一種可有效減少可選項(xiàng)的采用時(shí)序歧義的解碼方法。本發(fā)明的再一目的是提供一種可有效減少可選項(xiàng)的采用時(shí)序歧義的解碼裝置。為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明提供一種解碼方法,其用于將編碼序列映射至解碼序列,每個(gè)編碼序列包括至少一個(gè)選自編碼字元集的字元,每個(gè)解碼序列包括至少一個(gè)選自被非語(yǔ)標(biāo)語(yǔ)言使用的解碼字元集的解碼字元,該解碼方法包括接收輸入的編碼字元,以及將輸入的編碼字元組合至一個(gè)輸入序列的末尾,其中該輸入序列為時(shí)序歧義的,從而該輸入序列可被解析成至少兩個(gè)不同的編碼序列組合,且每個(gè)編碼序列組合包括該編碼序列中的至少一個(gè)。本發(fā)明還提供一種解碼裝置,其包括一鍵盤(pán),用于輸入一個(gè)包括至少一個(gè)選自一編碼字元集的字元的輸入序列;一輸出裝置,用于選擇性輸出一輸出序列,該輸出序列包括至少一選自一解碼字元集的解碼字元,其中該輸出序列是根據(jù)該輸入序列而生成;以及一解碼裝置,包括將編碼序列映射至解碼序列的映射,每個(gè)編碼序列包括至少一個(gè)選自該編碼字元集的編碼字元,每個(gè)解碼序列包括至少一個(gè)選自該解碼字元集的解碼字元,該映射是用于根據(jù)該輸入序列的至少一部分而將該輸入序列映射至該輸出序列,其中,當(dāng)一個(gè)字元藉由該鍵盤(pán)輸入時(shí),該解碼裝置將該輸入的編碼字元組合至該輸入序列的尾端,該輸入序列為時(shí)序歧義的,從而該輸入序列可被解析為至少兩個(gè)不同的編碼序列組合。本發(fā)明還提供一種解碼方法,其包括維持一將多個(gè)編碼序列映射至多個(gè)解碼序列的映射,每個(gè)編碼序列包括至少一個(gè)選自一編碼字元集的字元,每個(gè)解碼序列包括至少一個(gè)選自一被非語(yǔ)標(biāo)語(yǔ)言使用的解碼字元集的字元;接收一或多個(gè)編碼字元到一輸入序列中;如果該輸入序列長(zhǎng)度大于一則生成多個(gè)編碼序列組合;選擇該編碼序列組合中的一個(gè);根據(jù)該映射將該選擇的編碼序列組合映射至一輸出序列;及輸出該輸出序列。本發(fā)明提供的解碼方法以及解碼裝置因采用時(shí)序歧義編碼,因此輸出的可選項(xiàng)目的數(shù)量將被大幅減少。為讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附圖式,作詳細(xì)說(shuō)明如下。圖1A為先前技術(shù)中通用的鍵盤(pán)示意圖。圖IB為空間歧義映射關(guān)系示意圖。圖2為本發(fā)明實(shí)施例提供的裝置的電路方框圖。圖3A為本發(fā)明實(shí)施例提供的部分編碼規(guī)則示意圖。圖3B演示本發(fā)明實(shí)施例中輸入"HOME"時(shí)的時(shí)序歧義。圖4為本發(fā)明實(shí)施例提供的編碼字元序列與解碼字元序列映射規(guī)則示意圖。圖5A為本發(fā)明實(shí)施例提供的語(yǔ)言學(xué)時(shí)序歧義消解流程圖。圖5B為本發(fā)明實(shí)施例提供的采用語(yǔ)言學(xué)二元統(tǒng)計(jì)模型計(jì)算語(yǔ)言學(xué)分值的流程圖。圖6為本發(fā)明實(shí)施例提供的具有中間形態(tài)的基于形狀的映射關(guān)系圖。圖7為本發(fā)明實(shí)施例提供的時(shí)序歧義消解的流程圖。圖8為本發(fā)明實(shí)施例提供的文字輸入系統(tǒng)結(jié)構(gòu)框圖。圖9A-9I為本發(fā)明實(shí)施例中輸入并采用字典檢索消除"WORK"的歧義示意圖。20:解碼裝置200:鍵盤(pán)230:解碼器232:映射250:輸出裝置320:序歹lJ"38"302:"E"303:"B"312:"3"313:"8"308:輸入序列309:片段序列317、318:字元316、320:片段600:鍵盤(pán)字母表601:英文字母表602:中間形狀604:破壞性操作402:解碼字元403、404、405:按鍵800:用戶801:顯示裝置802:鍵盤(pán)803:序列分割器804:時(shí)序歧義片段化模塊805:語(yǔ)言頻率模塊806:樂(lè)觀歧義消解模塊807:語(yǔ)言學(xué)時(shí)序歧義消解模塊808:字典模塊809:輸入控制模塊820:文字輸入821:時(shí)序片段化序列822:控制輸入823:預(yù)測(cè)查詢824:預(yù)測(cè)結(jié)果具體實(shí)施例方式圖2所示為本發(fā)明一實(shí)施例提供的解碼裝置電路方框圖。本實(shí)施例中,解碼裝置20包括一鍵盤(pán)200,一解碼器230及一輸出裝置250。鍵盤(pán)200用于輸入一個(gè)輸入序列,該輸入序列包括至少一個(gè)選自編碼字元集的編碼字元。解碼裝置230藉由第一通道耦合至鍵盤(pán)200使得由鍵盤(pán)200輸入的輸入序列可被解碼器230接收。另外,解碼器230包括一映射232使得其接收的輸入序列可依據(jù)該映射232轉(zhuǎn)換為輸出序列。輸出裝置250藉由第二通道耦合至解碼器230從而使得由映射232生成的輸出序列可顯示于其上。鍵盤(pán)200可為一個(gè)具有多個(gè)按鍵的輸入裝置,每個(gè)按鍵表示選自一個(gè)編碼字元集的一個(gè)編碼字元。為了減少按鍵的數(shù)量,需要于K〈N時(shí)將數(shù)量為K的鍵盤(pán)字母表(例如編碼字元集)與數(shù)量為N的字母表(例如解碼字元表)對(duì)應(yīng)起來(lái)。為清楚說(shuō)明,但應(yīng)理解其并不限制本發(fā)明的范圍,圖2中所示的鍵盤(pán)200為當(dāng)前行動(dòng)電話中常用的普通鍵盤(pán)。鍵盤(pán)200包括分別表示數(shù)字0-9的按鍵202-220,以及分別表示特殊符號(hào)的按鍵222與224。本實(shí)施例中,編碼字元集包括10個(gè)數(shù)字字元以及兩個(gè)特殊字元。解碼字元集包括26個(gè)英文字母。假定映射232可將由選自編碼字元集的字元組成的多個(gè)編碼序列中的每個(gè)對(duì)應(yīng)于相應(yīng)的由選自解碼字元集的至少一個(gè)字元組成的解碼序列,其中每個(gè)編碼序列為一個(gè)字串,那么在每個(gè)字串對(duì)應(yīng)于多個(gè)解碼序列時(shí)則稱此種情形為空間歧義(SpatiallyAmbiguous),而在每個(gè)用于產(chǎn)生字串的輸入序列具有多個(gè)解釋時(shí)則稱此種情形為時(shí)序歧義(TemporallyAmbiguous)??臻g歧義已經(jīng)于
背景技術(shù):
部分進(jìn)行討論,而時(shí)序歧義則詳細(xì)說(shuō)明如下。對(duì)于固定長(zhǎng)度編碼,一個(gè)編碼序列中每個(gè)固定長(zhǎng)度為M的編碼字元代表一個(gè)字串并對(duì)應(yīng)于一個(gè)解碼字元的解碼序列。對(duì)于可變長(zhǎng)度編碼,經(jīng)常使用無(wú)前綴編碼從而使解碼器能清楚識(shí)別每個(gè)字串。如果使用非無(wú)前綴編碼,則需要使用一個(gè)預(yù)定的超時(shí)或超時(shí)消除記號(hào)(劃界按鍵)以清楚地辯識(shí)出每個(gè)想要的字串。超時(shí)消除記號(hào)方法將導(dǎo)入額外的按鍵動(dòng)作,因此并不實(shí)用。盡管超時(shí)法可避免額外的按鍵動(dòng)作,惟,其因需要用戶等待而降低效率。當(dāng)一個(gè)輸入序列對(duì)應(yīng)于多個(gè)時(shí)序解釋時(shí)則存在時(shí)序歧義。為向傳統(tǒng)可變長(zhǎng)度編碼規(guī)則中導(dǎo)入時(shí)序歧義,可忽略超時(shí)與超時(shí)消除訊號(hào)的要求。如圖3A、圖3B所示,其中圖3A所示為本發(fā)明實(shí)施例提供的部分編碼規(guī)則,圖3B演示輸入"H0ME"時(shí)產(chǎn)生的時(shí)序歧義。例如,序列"38"320可被解釋為代表'M'301的相連的字串"3_8"311或者兩個(gè)分別表示'E'302與'B,303的字串"3"312以及"8"313。對(duì)于一個(gè)輸入序列,可以根據(jù)時(shí)序歧義規(guī)則將其打斷成幾個(gè)片段以使兩個(gè)片段中相鄰的字元共同形成的字串(亦稱為編碼序列)在解碼規(guī)則中沒(méi)有對(duì)應(yīng)的解碼序列。如果一個(gè)片段的長(zhǎng)度大于一則其具有多個(gè)時(shí)序解釋。以圖3B中的為例,輸入序列308以虛線框?yàn)榻绫淮驍喑删哂卸鄠€(gè)片段的時(shí)序片段化序列309,每個(gè)片段中具有多個(gè)字元。而圖3A所示的編碼規(guī)則中沒(méi)有對(duì)應(yīng)于兩個(gè)相鄰字元317、318組成的字串"03"的解碼序列。因此兩個(gè)片段316、320能從時(shí)序上被區(qū)分開(kāi)來(lái)。時(shí)序打斷的具體過(guò)程可以逐個(gè)檢查輸入序列中的每個(gè)字元看其與下一個(gè)字元的組合在編碼規(guī)則中是否具有對(duì)應(yīng)的解碼序列,如果有,則當(dāng)前字元被累積起來(lái),如果沒(méi)有則把當(dāng)前字元與先前累積的字元構(gòu)成一個(gè)時(shí)序歧義片段。歧義編碼的長(zhǎng)度可定義為該時(shí)序歧義片段的長(zhǎng)度。如果一個(gè)時(shí)序歧義片段長(zhǎng)度為l則其不具有時(shí)序歧義。另外,部分輸入序列可以僅根據(jù)編碼規(guī)則而消除歧義。以圖4所示的編碼規(guī)則為例,由于字串"09"并沒(méi)有對(duì)應(yīng)的解碼序列,因此輸入序列"09"可識(shí)別為"0:9"。亦即根據(jù)該編碼規(guī)則"09"直接對(duì)應(yīng)于"OR"而無(wú)須語(yǔ)言學(xué)的手段去解決時(shí)序歧義,以下將詳細(xì)進(jìn)行說(shuō)明。較佳的實(shí)施例中,該編碼規(guī)則為可變長(zhǎng)度編碼從而解碼字元可以為一個(gè)數(shù)字或兩個(gè)數(shù)字進(jìn)行編碼。兩位數(shù)字具有10*10種組合,在大多數(shù)情形下已經(jīng)足夠?qū)λ薪獯a字元進(jìn)行編碼。因此如果真需使用到三位數(shù)字,可以保持最少量使用并加以特殊處理?!獋€(gè)時(shí)序歧義片段的合法組合即代表一個(gè)可唯一解碼的無(wú)歧義的輸入序列。在編碼規(guī)則中為了枚舉一個(gè)時(shí)序歧義片段的所有合法組合,可以枚舉所有的組合使得該時(shí)序歧義片段的歧義長(zhǎng)度為N,且每個(gè)字元可與前一個(gè)或下一個(gè)字元相連但不為同時(shí)相連。兩個(gè)相連的字元構(gòu)成一個(gè)兩位數(shù)字編碼,而一個(gè)不與其他字元相連的字元構(gòu)成一個(gè)一位編碼。如果一個(gè)字元同時(shí)與前一個(gè)字元及后一個(gè)字元相連則其屬于三位編碼,則其為不合法組合且需要特殊處理。例如,假定"l"表示字元,"-"表示不相連,而"+"表示相連。則一個(gè)序列1111可列舉出5種組合1-1-1-1、1-1-1+1、1-1+1-1、1+1-1-1、及1+1-1+1。對(duì)于長(zhǎng)度為K的連接其所能列舉的數(shù)目如下O:C(N,O)l:C(N-l,l)2:C(N-2,2)...K:C(N-K,K)N/2如果N二IO,則組合數(shù)目為C(10,0)+C(9,l)+C(8,2)+C(7,3)+C(6,4)+C(5,5)=1+9+28+35+15+1=89。相較于傳統(tǒng)的空間歧義,對(duì)于長(zhǎng)度為10的字串其組合數(shù)為3~10=59049,因此將其全部枚舉明顯不實(shí)際。對(duì)于一個(gè)給定的序列,如果其時(shí)序歧義長(zhǎng)度為N(根據(jù)具有57,000個(gè)單詞的字典計(jì)算N不太可能大于8,因此可設(shè)定允許最大時(shí)序歧義長(zhǎng)度為8,而對(duì)很少的例外采用查字典的方式解決),可以在2'(8-1)種可能的組合中忽略具有兩個(gè)連接的字元的非法組合而枚舉出所有可能合法的組合。很明顯相較于先前技術(shù),從組合數(shù)量考量本發(fā)明所提出的時(shí)序歧義方法為更好的解決方案。在一個(gè)實(shí)施例中,時(shí)序歧義可以采用類似于傳統(tǒng)方法中解決空間歧義時(shí)查字典的方法解決。時(shí)序歧義比傳統(tǒng)的空間歧義更容易區(qū)分。本實(shí)施例中采用的字典包括約39000個(gè)單詞,而僅有50個(gè)編碼序列對(duì)應(yīng)于兩個(gè)單詞,而且沒(méi)有對(duì)應(yīng)于兩個(gè)以上單詞的情況。換句話說(shuō),該字典中99.87%的單詞可以被唯一識(shí)別。傳統(tǒng)的空間歧義編碼方法可提供有限的幾個(gè)選擇,而本發(fā)明只有一個(gè)可選項(xiàng)因此可大幅度降低考慮的腦力過(guò)程。例如,在傳統(tǒng)的空間歧義編碼方法中,想要輸入"HOME"需要檢查12個(gè)單詞,然而采用本發(fā)明的編碼方法則只有一個(gè)單詞"HOME"符合該編碼。即使在最壞的情形下,也只有一個(gè)可選單詞。從此角度考量,用戶可快速選擇所想輸入的單詞。對(duì)于少數(shù)幾個(gè)對(duì)應(yīng)于兩個(gè)可選單詞的編碼而需要用戶去選擇其中的一個(gè)以無(wú)歧義的時(shí)候,其中一個(gè)解決方法是使用一個(gè)特殊功能鍵,例如'*'在各個(gè)可選單詞中進(jìn)行滾動(dòng)選擇以讓用戶選擇其中的一個(gè)。由于可選單詞數(shù)量很少,另一種可行的方法是同時(shí)顯示可選單詞。而單詞出現(xiàn)的順序則基于詞頻統(tǒng)計(jì)或語(yǔ)言學(xué)權(quán)值計(jì)算。理論上可以采用語(yǔ)言學(xué)的方法去解決空間歧義問(wèn)題,然而由于可能組合以冪級(jí)數(shù)增長(zhǎng)因此無(wú)法實(shí)現(xiàn)。與之相反,語(yǔ)言學(xué)可順利應(yīng)用于時(shí)序歧義以減少檢索字典的動(dòng)作。如圖5A與圖5B所示,其中圖5A為本發(fā)明一實(shí)例提供的采用語(yǔ)言學(xué)去解決時(shí)序歧義的流程圖,圖5B為本發(fā)明一實(shí)施例提供的采用二元統(tǒng)計(jì)模型(2-gramstatistics)計(jì)算語(yǔ)言學(xué)權(quán)值的流程圖。而具體的過(guò)程將詳細(xì)說(shuō)明如下。參閱圖5A,采用語(yǔ)言學(xué)解決時(shí)序歧義編碼的方法包括取得一個(gè)時(shí)序歧義片段,并將該片段的前一個(gè)片段的最后一個(gè)字元作為"pre",將該片段后一個(gè)片段的第一個(gè)字元作為"post"(步驟511)。枚舉所有對(duì)應(yīng)于該時(shí)序歧義片段的所有可能組合,而每個(gè)列舉項(xiàng)為一個(gè)無(wú)歧義的輸入序列(步驟513)。然后初始化一個(gè)臨時(shí)最大語(yǔ)言學(xué)分值SMAX及相應(yīng)的無(wú)歧義的序列EnumMAX(步驟515)。每個(gè)列舉項(xiàng)在步驟517中開(kāi)始處理。對(duì)于每個(gè)列舉項(xiàng)計(jì)算其語(yǔ)言學(xué)分值以得到一結(jié)果S0(步驟519)。如果S0>SMAX則值SMAX與E皿mMAX被更新(步驟521與523)。處理完所有的列舉項(xiàng)后,最大語(yǔ)言學(xué)分值SMAX為實(shí)際的最大值并將E皿mMAX返回(步驟525)。圖5B所示為采用語(yǔ)言學(xué)頻率模塊的語(yǔ)言學(xué)二元統(tǒng)計(jì)模型(2-gramstatistics)計(jì)算語(yǔ)言學(xué)分值的方法,其可用于計(jì)算接收的無(wú)歧義的輸入序列SD的語(yǔ)言學(xué)分值。在步驟540中進(jìn)行初始化。初始化完成后對(duì)輸入序列進(jìn)行解碼得到包括解碼字元的解碼字元序列(步驟542)。依次處理所有的解碼字元(步驟544與546)。對(duì)于每個(gè)解碼字元,將當(dāng)前字元與下一個(gè)字元組合成一個(gè)二元字串(步驟548)。查找該二元字串的分值S1并累積(accumulate)在語(yǔ)言學(xué)分值SO中(步驟550與552),其中所謂的累積可以為相加、相乘或者其他標(biāo)準(zhǔn)。例如,對(duì)于解碼字元序列"H0ME",需要計(jì)算二元字串"H0"、"0M"及"ME"的分值。在該解碼字元序列中的第個(gè)解碼字元處理完成后返回累積的語(yǔ)言學(xué)分值SO(步驟554)。上述采用語(yǔ)言學(xué)解決時(shí)序歧義的方法返回的由編碼字元組成的無(wú)歧義的輸入序列E皿mMAX可以被解碼成唯一的解碼序列。要檢測(cè)一個(gè)單詞的預(yù)測(cè)(prediction)時(shí),可以首先將其編碼成編碼字元序列然后進(jìn)行語(yǔ)言時(shí)序歧義消除的相關(guān)操作。如果一個(gè)單詞的預(yù)測(cè)為其單詞本身,則稱其為命中而無(wú)須再查字典。命中率被定義為一個(gè)單詞集合中能直接命中的單詞的比率。為減少檢索字典的開(kāi)銷,那些可以采用語(yǔ)言學(xué)解決的單詞可以從存儲(chǔ)的字典中去除,如此可大幅減少字典的大小。在一個(gè)實(shí)施例里,僅保存約3100個(gè)單詞的字典即可達(dá)到對(duì)一個(gè)具有57,000個(gè)單詞的字典中的36,000個(gè)低頻單詞的命中率為81.3%,且對(duì)其余的單詞命中率為100%的效果。進(jìn)一步地,可通過(guò)目標(biāo)語(yǔ)言知識(shí)去提高命中率。語(yǔ)言學(xué)分值可以用目標(biāo)語(yǔ)言的知識(shí)去作補(bǔ)償。例如,英語(yǔ)中,三個(gè)連續(xù)的輔音(除了以"S"結(jié)束的復(fù)數(shù)形式)很少見(jiàn)。在此種情形下可減少其語(yǔ)言學(xué)分值以避免匹配錯(cuò)誤的單詞。而具體減少多少分值則可以用心調(diào)整以提高總體的命中率。如果具有三個(gè)連續(xù)輔音的單詞被這種調(diào)整機(jī)制錯(cuò)誤地忽略掉,那么還可以通過(guò)在字典中檢索的方式將其找尋回來(lái)。樂(lè)觀時(shí)序歧義消解方法是采用啟發(fā)式機(jī)制(heuristics)而不枚舉所有的組合的語(yǔ)言時(shí)序歧義消解方法。本發(fā)明應(yīng)用貪婪法則來(lái)提供樂(lè)觀歧義消解,例如對(duì)于任何歧義情形可優(yōu)選最長(zhǎng)的匹配序列。如按照?qǐng)D4的編碼規(guī)則"10"可以為對(duì)應(yīng)于"I0"的"1:0"或者對(duì)應(yīng)于"10"的D,此種情形下根據(jù)貪婪法則應(yīng)選擇"D"。當(dāng)采用樂(lè)觀時(shí)序歧義消解時(shí),應(yīng)當(dāng)首先按照樂(lè)觀歧義消解生成無(wú)歧義的輸入序列。而該無(wú)歧義的輸入序列的語(yǔ)言學(xué)分值則采用圖5B所示的方法求得。當(dāng)累積的分值符合某特定標(biāo)準(zhǔn)時(shí),例如累積的分值大于最小可接受值,則其解碼結(jié)果可輸出給用戶。一旦累積的語(yǔ)言學(xué)分值小于或等于最小可接受值,則啟動(dòng)上述語(yǔ)言時(shí)序歧義消解過(guò)程以得到最好的猜詞結(jié)果。上述編碼規(guī)則中可使用多種將編碼字元集映射至解碼字元集的映射。其中的一種可為基于形狀的映射。很多先前技術(shù),例如美國(guó)第4008793號(hào)、4877405號(hào)、5307267號(hào)、6837633號(hào)、6874960號(hào)、7098919號(hào)、4173753號(hào)、5305207號(hào)、5790055號(hào)、6362752號(hào)、6686907號(hào)、6766179號(hào)、5982303號(hào)、及6753794號(hào)專利均揭示基于形狀的映射關(guān)系。本發(fā)明提供一種新的基于形狀的映射方法。盡管對(duì)字元編碼具有大量的研究,然而并未有人于編碼規(guī)則中使用變形操作。根據(jù)本發(fā)明的一個(gè)實(shí)施例,一個(gè)編碼序列可包括至少兩個(gè)編碼字元,而該編碼序列中的一個(gè)正式字元的預(yù)定形狀改變類型是利用在其后并與其相鄰的字元表示。本發(fā)明提供的基于形狀的映射的操作可分為無(wú)操作、變換操作、建構(gòu)操作、破壞性操作以及變形操作。無(wú)操作于編碼字元與解碼字元基本相同時(shí)使用。變換操作包括旋轉(zhuǎn)、鏡像、縮小等等。建構(gòu)操作包括基于筆劃的操作或形狀的組合。破壞性操作包括筆劃移除、剪切(例如不按照筆劃建構(gòu)的分割動(dòng)作)與開(kāi)口(例如,打斷封閉的區(qū)域)。變形操作于編碼字元與對(duì)應(yīng)的解碼字元可以采用中間形狀關(guān)聯(lián)起來(lái)的情形時(shí)使用。圖6示出本發(fā)明的一個(gè)較佳實(shí)施例。第一行為鍵盤(pán)字母表(編碼字元集的一個(gè)實(shí)例)600。第二行為正常英文字母表(解碼字元集的一個(gè)實(shí)例)601。第三行為英文字母(解碼字元)與數(shù)字(編碼字元)之間的中間形狀602。第四行為包括數(shù)字或數(shù)字組合的映射關(guān)系603。第三行中指向箭頭所指的'4'表示破壞性操作604。'C'列中的破壞性操作604為"剪切"操作而其余為"開(kāi)口"動(dòng)作。根據(jù)本發(fā)明提供的基于形狀的映射關(guān)系,可以很容易將解碼字元(第二行)翻譯成中間形態(tài)(第三行),最后得到相對(duì)應(yīng)的一或多個(gè)編碼數(shù)字(第四行)。很容易看出還可進(jìn)行相反的過(guò)程,即將一或多個(gè)編碼數(shù)字翻譯成解碼字元。圖4中所示的編碼規(guī)則可從圖6提供的基于形狀的映射衍生出來(lái),以下將詳細(xì)說(shuō)明。該編碼規(guī)則(或映射關(guān)系)401包括多個(gè)解碼字元402。而解碼字元402可能對(duì)應(yīng)于由按鍵403產(chǎn)生的單字元字串或者由按鍵404、405產(chǎn)生的二字元字串。應(yīng)注意的是,盡管'G'可以根據(jù)形狀的組合編碼為"67",但其同樣可以按照變形操作編碼為"6"。圖4中的結(jié)果編碼為"6"。一般來(lái)說(shuō),生成更有意義的編碼的規(guī)則是以包含更多形狀資訊的編碼為優(yōu)先。如此可使人們更加容易通過(guò)形狀來(lái)識(shí)別第一編碼與第二編碼。例如'Q'為'0'與'1'的組合,然而'0'包含更多的形狀資訊,因此'Q'的編碼應(yīng)為"01"。根據(jù)本發(fā)明,用戶無(wú)須再看著鍵盤(pán)去輸入文字,而可以直接使用鍵盤(pán)上的數(shù)字按照記憶輸入。而由于無(wú)須使用任何特殊的標(biāo)記,因此動(dòng)電話或鍵盤(pán)的制造廠商無(wú)須對(duì)現(xiàn)有設(shè)計(jì)作任何變更即可直接應(yīng)用本發(fā)明。在輸入時(shí)用戶可直觀地檢查想要的銨鈕是否真正的被選擇了。以'Q'的解碼為例,如果在輸入第一個(gè)編碼后不顯示'Q'而顯示相關(guān)的形狀例如'0'用戶即可意識(shí)到前一次按鍵是錯(cuò)誤的需要更正。在正確的輸入'0'與'l'后,可以預(yù)期會(huì)被解碼成'Q',然而根據(jù)編碼規(guī)則同樣可能被解碼成序列"01"。在兩種情形下,顯示結(jié)果均與輸入序列"01"相關(guān)而不象傳統(tǒng)的預(yù)測(cè)式輸入法中的跳躍式選項(xiàng)。因此解碼結(jié)構(gòu)使得本發(fā)明的方法更加可靠并更具可預(yù)測(cè)性。對(duì)于每個(gè)解碼字元,會(huì)生成被設(shè)計(jì)決策接受的所有可能編碼序列(每個(gè)編碼序列皆由編碼字元所組成)。根據(jù)設(shè)計(jì)決策,每個(gè)選項(xiàng)具有一個(gè)相關(guān)的權(quán)重。一般來(lái)說(shuō),對(duì)于較佳的選項(xiàng)具有較高的權(quán)重。基于形狀的字串枚舉意指具有基于形狀的設(shè)計(jì)決策的字串枚舉。多級(jí)字串枚舉意指不同設(shè)計(jì)決策的等級(jí)結(jié)構(gòu)。在一個(gè)多級(jí)字串枚舉的實(shí)施例中,每個(gè)解碼字元對(duì)應(yīng)的編碼字元的所有可能編碼序列都被生成。可能的編碼序列可以分為幾個(gè)邏輯解釋,例如形狀關(guān)聯(lián)、文化關(guān)聯(lián)或者其他任何可以接受的關(guān)聯(lián)。在進(jìn)行如上述的多級(jí)字串枚舉的字串枚舉之后,將做進(jìn)一步分析以決定可以接受的分配。在一個(gè)實(shí)施例中,會(huì)從目標(biāo)語(yǔ)言文獻(xiàn)中生成一個(gè)一元(LinguisticUnigram)語(yǔ)言表以及一個(gè)二元(2-gram)語(yǔ)言表,其中高頻字母根據(jù)該一元語(yǔ)言表指定單編碼字元。如果較佳的形狀分配的出現(xiàn)的頻率較低則將其重新指定至一個(gè)雙編碼字元,而該單編碼字元?jiǎng)t可以被改為指定至另一個(gè)高頻率解碼字元。例如初始的分配中'Z'與'N'分別被指定為('Z',〃2〃)與('N',〃2@〃),但是由于'N'具有更高的頻率,因此'Z'可被重新指定為('Z',〃22〃),而N則被指定為('N',〃2〃)。該二元語(yǔ)言表可用于防止這種分配動(dòng)作導(dǎo)入更多的歧義。例如,在下列的表l中,"12"為編碼"D"的一個(gè)選項(xiàng)。參考WilliamSoukoreffandScottMacKenzie,LinguisticDiagramFrequencyTables(http://dynamicnetservices.com/_wi11/academic/bit95.tables,html)中的bit95二元語(yǔ)言表,可以發(fā)現(xiàn)二元片段"IN"具有更高的頻率,可能的情況下應(yīng)當(dāng)盡量避免。如果"12"是根據(jù)某種設(shè)計(jì)決策選定的,語(yǔ)言學(xué)分值補(bǔ)償可用于減少此種指派所導(dǎo)入的歧義。如表1所示,編碼字元與解碼字元之間可能的映射關(guān)系可分成多種類別,其包括基本相同關(guān)系、變換關(guān)系、變形關(guān)系、組成關(guān)系與破壞性關(guān)系。進(jìn)一步地,在下列表中"'"代表破壞性操作。符號(hào)"@"代表變換操作中的旋轉(zhuǎn),"%"代表變換操作中的鏡象,'7"代表"0R",而被"_"包圍則表示較不值得考慮的指派。表1<table>tableseeoriginaldocumentpage13</column></row><table><table>tableseeoriginaldocumentpage14</column></row><table>可采用上述兩種映射方法來(lái)指派編碼是很重要的一件事,這兩種映射方法的其中一種是通過(guò)考量每個(gè)解碼字元的頻率而將編碼序列指派給一個(gè)解碼字元,而另一種映射方法則是通過(guò)考量由字串枚舉提供的可能映射而將編碼序列指派給一個(gè)解碼字元。這兩種映射方法可按任意順序進(jìn)行。例如,表2中給出了編碼指派的結(jié)果以及由一階統(tǒng)計(jì)(First-OrderStatistics)提供的基于一元語(yǔ)言統(tǒng)計(jì)的沖突解決方法。關(guān)于一階統(tǒng)計(jì)可參考網(wǎng)址為http://www,data-compression,com/english.html的相關(guān)內(nèi)容(StatisticalDistributionsofEnglishText)。在此可以看到一些高頻率解碼字元例如"A"、"E"、"I"、"0"、"R"、"S"、及"T"被指派一元(或單字元)編碼序列。而一些基他字元,例如"B"與"G"由于其分別與編碼字元"8"與"6"非常相似而被指派一元編碼序列。解碼字元"Z"首先被指派一元編碼"2"。然而,由于一元編碼字元"2"可以作為解碼字元"N"的映射,而且根據(jù)語(yǔ)言學(xué)統(tǒng)計(jì)結(jié)果"N"的出現(xiàn)頻率比"Z"高很多,因此一元編碼字元"2"被重新指派給解碼字元"N",而解碼字元"Z"被重新指派成二元編碼字元"22"。表2<table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table>另一種可能的映射同樣可以考慮利用。在一個(gè)實(shí)施例中,指派按照基本相同、變換關(guān)系、變形關(guān)系、組成關(guān)系、及破壞性關(guān)系的順序進(jìn)行。結(jié)果顯示在表3中。表3<table>tableseeoriginaldocumentpage16</column></row><table><table>tableseeoriginaldocumentpage17</column></row><table>由于解碼字元"C"、"D"、"H","K",及"X"的可能映射關(guān)系,表3中的編碼序列的組合提供72種選擇。用于表示對(duì)正式編碼字元進(jìn)行的操作的操作符號(hào)可以任意選擇。例如,代表鏡象操作的操作符號(hào)可以選用8或O,代表旋轉(zhuǎn)操作的操作符號(hào)可選用6或9,代表破壞性操作的操作符號(hào)可選用其他任意數(shù)字。在一個(gè)實(shí)施例中,數(shù)字"8"因?yàn)榭雌饋?lái)像是兩個(gè)互為鏡象的"o"而被選為代表鏡象操作的操作符號(hào),數(shù)字"6"代表旋轉(zhuǎn)操作是因?yàn)閿?shù)字"6"像一個(gè)漩渦。數(shù)字"4"代表催毀操作是因?yàn)閿?shù)字"4"像剌。相應(yīng)地,最終的映射關(guān)系如表4所示。表4<table>tableseeoriginaldocumentpage17</column></row><table><table>tableseeoriginaldocumentpage18</column></row><table>可以理解,編碼字元與解碼字元之間的映射關(guān)系還可包括表4所示以外的指派。然而該指派可以由以下各項(xiàng)來(lái)決定枚舉所有可接受的可能的映射、決定操作符號(hào)以及至少一種選自基于形狀的映射分值、為消除輸入序列歧義所需保存字典的大小、解碼序列的歧義長(zhǎng)度分布、樂(lè)觀時(shí)序歧義消解的命中率、語(yǔ)言學(xué)時(shí)序歧義消解命中率、樂(lè)觀時(shí)序歧義消解與語(yǔ)言學(xué)時(shí)序歧義消解共同使用的命中率、根據(jù)解碼序列頻率的命中率分布、從一階統(tǒng)計(jì)計(jì)算得到的每字母所需要按鍵數(shù)、自然語(yǔ)言集的優(yōu)化以及時(shí)序歧義測(cè)量的標(biāo)準(zhǔn)。對(duì)于所有枚舉出的可接受組合,可以根據(jù)上述某個(gè)特定的標(biāo)準(zhǔn)計(jì)算得到權(quán)重分值以進(jìn)行自動(dòng)選擇,或者,只要其能滿足上述標(biāo)準(zhǔn),亦可進(jìn)行手動(dòng)選擇?;谛螤畹挠成渑c時(shí)序歧義編碼規(guī)則在文字輸入系統(tǒng)中可獨(dú)立工作,亦可共同工作。圖7所示為本發(fā)明一實(shí)施例的時(shí)序歧義消解流程圖。圖8所示為本發(fā)明一實(shí)施例提供的文字輸入系統(tǒng)結(jié)構(gòu)方框圖。參閱圖7與圖8,用戶800通過(guò)啟動(dòng)鍵盤(pán)802輸入一個(gè)輸入序列。輸入序列分割器803將輸入序列分為文字輸入820與控制輸入822??刂戚斎?22被輸出至輸入控制模塊809,而文字輸入820則被送往時(shí)序歧義片段化模塊804。時(shí)序歧義消除操作從步驟701開(kāi)始,此時(shí)文字輸入820會(huì)被送往時(shí)序歧義片段化模塊804。文字輸入820經(jīng)過(guò)時(shí)序歧義片段化模塊804處理生成時(shí)序片段化序列821(步驟703)。在步驟705中,時(shí)序片段化序列821的每個(gè)片段利用"pre"字元(即前一個(gè)片段的最后一個(gè)字元)以及"post"字元(即后一個(gè)片段的第一個(gè)字元)來(lái)進(jìn)行處理。步驟707中,如果還有片段需要處理,則利用保存于語(yǔ)言頻率模塊805中的統(tǒng)計(jì)結(jié)果,藉由樂(lè)觀歧義消解模塊806(步驟709)來(lái)處理當(dāng)前片段。在步驟711中,如果根據(jù)步驟709的結(jié)果計(jì)算得到的語(yǔ)言學(xué)分值大于預(yù)定的值Q2,則無(wú)歧義的輸入序列被接受并在步驟720中解碼。否則,則啟動(dòng)語(yǔ)言學(xué)時(shí)序歧義消解模塊807以選擇最佳的無(wú)歧義的輸入序列(步驟713)。所有從該時(shí)序歧義片段中生成的無(wú)歧義的輸入序列于步驟722中鏈接起來(lái)以生成預(yù)測(cè)結(jié)果824,并通過(guò)輸出控制模塊809輸出至顯示裝置801。如果所有的片段處理完成并且操作流程從步驟707分支到步驟715,則輸入序列的語(yǔ)言學(xué)分值在步驟715中計(jì)算。如果步驟715的結(jié)果小于另一個(gè)預(yù)定值Q1,則假定預(yù)測(cè)是不可接受的而需要從輸出控制模塊809向字典模塊808輸出預(yù)測(cè)查詢823進(jìn)行字典檢索以尋找更好的預(yù)測(cè)結(jié)果(步驟719)。否則,在步驟717中,檢查用戶是否請(qǐng)求某個(gè)可選項(xiàng)。如果沒(méi)有這種請(qǐng)求,則暗示用戶接受當(dāng)前預(yù)測(cè)結(jié)果,否則即啟動(dòng)字典檢索(步驟719)。在字典檢索后,其中一個(gè)匹配結(jié)果被用來(lái)取代步驟724中的預(yù)測(cè)結(jié)果,而且用戶在步驟726中可以利用一個(gè)特殊功能鍵例如"*"選擇并確認(rèn)所想要的單詞。在另一個(gè)實(shí)施例中,輸出控制模塊809可直接耦合至輸入序列分割器803甚至鍵盤(pán)802以直接接收文字輸入820以及控制輸入822。其接收的的文字輸入820以及控制輸入822可發(fā)送給字典模塊808以檢索匹配的編碼序列以輸出相應(yīng)的解碼序列??梢岳斫?,本發(fā)明的組件可以設(shè)置成客戶端-服務(wù)器(C/S)模式,即通過(guò)一通訊管道以進(jìn)行上述耦合或連接,并以預(yù)定的通訊協(xié)定來(lái)傳輸訊息。根據(jù)這些資料作為輸入的模塊是否需要存在,時(shí)序歧義片段化模塊可以同時(shí)被復(fù)制于客戶端以及服務(wù)器上。時(shí)序歧義片段化模塊的輸出可如較佳的實(shí)施例中描述的那樣被直接導(dǎo)引到消費(fèi)模塊中或者亦可以瀑布(waterfall)方式輸出。本發(fā)明中采用的鍵盤(pán)包括多個(gè)響應(yīng)于用戶觸動(dòng)的按鍵。該按鍵響應(yīng)于用戶引起的光、聽(tīng)力、觸覺(jué)、味覺(jué)以及氣味中的一種物理量的變化。該鍵盤(pán)還可為任意鍵盤(pán)字元序列的輸出。另外,該顯示裝置可選自視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、味覺(jué)、或者嗅覺(jué)顯示裝置。如圖7所示,盡管在較佳的實(shí)施例中所有的時(shí)序歧義消解方法都使用過(guò),然而這些方法的各種組合同樣可用。在一個(gè)極端的情形下,通過(guò)重定向"NO"分支707至結(jié)束狀態(tài)可以完全忽略字典檢索動(dòng)作。參閱圖gA-圖9G,其所示為根據(jù)本發(fā)明一實(shí)施例中顯示輸入并用字典檢索消除"WORK"的歧義的過(guò)程。本實(shí)施例中所使用的編碼規(guī)則(編碼序列與解碼序列之間的映射關(guān)系)如圖6所示。在圖9A中,用戶輸入該輸入序列的第一個(gè)編碼字元"3",根據(jù)圖6,輸出裝置顯示"E"的中間形態(tài)。然后如圖9B所示,用戶輸入該輸入序列的第二個(gè)編碼字元"6",而輸出裝置于原來(lái)顯示"E"的中間形態(tài)的地方顯示"W"的中間形態(tài)。根據(jù)圖4的編碼規(guī)則,輸入序列"36"可能被解碼成兩個(gè)解碼字元"EG"而不是"W"。然而本實(shí)施例中還進(jìn)行樂(lè)觀時(shí)序歧義消解,因此在具有歧義時(shí)將優(yōu)先選擇最長(zhǎng)的編碼序列。相應(yīng)地,具有兩字元編碼序列"36"的解碼字元"W"相比于每個(gè)字元具有一元編碼序列的解碼字元"EG"為更佳的選擇。如圖9C所示,當(dāng)使用者繼續(xù)輸入該編碼序列的第三個(gè)編碼字元"0"時(shí),編碼字元"0"應(yīng)為該輸入序列的另一個(gè)片段,因?yàn)闆](méi)有對(duì)應(yīng)于輸入序列"60"的編碼序列。相應(yīng)地,輸出設(shè)置進(jìn)一步顯示"O"的中間形態(tài)。然后,用戶進(jìn)一步輸入該輸入序列的第四個(gè)編碼字元"9",而因?yàn)闆](méi)有對(duì)應(yīng)于輸入序列"09"的編碼序列,所以此編碼字元同樣被認(rèn)為是一個(gè)片段。相應(yīng)地,如圖9D所示,由于解碼字元R對(duì)應(yīng)于由編碼字元"9"構(gòu)成的編碼序列,所以輸出裝置進(jìn)一步顯示解碼字元"R"的中間形態(tài)。當(dāng)使用者輸入第五個(gè)編碼字元"8",如圖9E所示,由于二元編碼序列"98"對(duì)應(yīng)于解碼字元"P",而根據(jù)樂(lè)觀時(shí)序歧義消解,"P"是一個(gè)更好的選擇,因此原來(lái)顯示的"R"的中間形態(tài)變化為"P"的中間形態(tài)。然后,用戶進(jìn)一步輸入第六個(gè)字元"4"時(shí),如圖9F所示,由于解碼字元"R"先于輸入編碼字元"4"時(shí)決定的,因此編碼序列"984"被分割成"98:4",輸出設(shè)備進(jìn)一步顯示解碼字元"A"的中間形態(tài)。此種情形下顯示失敗的預(yù)測(cè)結(jié)果"WOPA"。此時(shí)使用者可以通過(guò)輸入一個(gè)編碼字元"*"以調(diào)用字典檢索來(lái)糾正錯(cuò)誤。字典檢索讓輸出裝置顯示對(duì)應(yīng)于編碼序列"360984"的匹配解碼序列"WORK"的中間形態(tài)。連續(xù)輸入"*"會(huì)接著枚舉出其他所有匹配的結(jié)果。由于在此種情形下僅有一個(gè)可選單詞可用,因此可以很快確認(rèn)所想要的單詞。然而,錯(cuò)誤的預(yù)測(cè)結(jié)果還可用其他方式去糾正。例如,如圖9E、圖9H及圖9I所示的劃界控制。如上所述,輸出裝置于對(duì)使用者輸入由編碼字元組成的編碼序列"36098"進(jìn)行時(shí)序歧義消解后顯示編碼序列"WOP"的中間形態(tài)?!┦褂谜甙l(fā)現(xiàn)錯(cuò)誤的預(yù)測(cè),可提供一特殊功能按鍵,例如"#"作為劃界控制符。本實(shí)施例中,使用者可輸入編碼序列"##"以啟動(dòng)其作為劃界控制編碼序列。相應(yīng)地,當(dāng)用戶于輸入序列"36098"后輸入編碼序列"##"時(shí),如圖8所示,劃界控制編碼序列"##"被分割為控制輸入。因此,輸出控制模塊809向樂(lè)觀時(shí)序歧義消解模塊806與/或語(yǔ)言學(xué)時(shí)序歧義消解模塊807發(fā)送請(qǐng)求以改變編碼片段"98"為新的解釋"9:8"。如圖9H所示,輸出裝置因此于顯示解碼字元"P"的中間形態(tài)的位置顯示解碼字元"R"的中間形態(tài)。編碼字元"4"于編碼字元"##"后輸入,因此其與編碼字元"8"組合到一起作為文字輸入"84"并最終解碼為"K"。因此如圖91所示,最終顯示的是解碼字元"K"的中間形態(tài)。傳統(tǒng)的預(yù)測(cè)式輸入法中,對(duì)于可選項(xiàng)的確認(rèn)需要使用者去選擇,不然訊息具有多種歧義而難以閱讀。另外,在輸入過(guò)程中的打字錯(cuò)誤不能回復(fù)并可能導(dǎo)致完全不可讀的短訊。簡(jiǎn)言之,傳統(tǒng)方法在無(wú)反饋狀況下無(wú)法使用。本發(fā)明由于采用腦力記憶取代對(duì)照表,因此可以應(yīng)用于無(wú)回饋打字。并且無(wú)須等待超時(shí)或者采用超時(shí)訊息去區(qū)分前后輸入字串。另外,可選單詞可通過(guò)視覺(jué)顯示的方式加以校正,因此輸入時(shí)可采用延遲回饋打字方式,使用者可先接受非預(yù)期的預(yù)測(cè)字詞然后事后手動(dòng)去校正它。在極端情形下,所有的輸入并不需要預(yù)測(cè)以及后期確認(rèn)的動(dòng)作。雖然本發(fā)明已以較佳實(shí)施例揭露如上,然其并非用以限定本發(fā)明,任何熟習(xí)此技20藝者,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作些許的更動(dòng)與潤(rùn)飾,因此本發(fā)明的保護(hù)范圍當(dāng)視后附的申請(qǐng)專利范圍所界定為準(zhǔn)。權(quán)利要求一種解碼方法,其用于將多個(gè)編碼序列映射至多個(gè)解碼序列,每個(gè)編碼序列包括至少一個(gè)選自編碼字元集的字元,每個(gè)解碼序列包括至少一個(gè)選自被非語(yǔ)標(biāo)語(yǔ)言使用的解碼字元集的解碼字元,其特征在于該解碼方法包括接收輸入的編碼字元;以及將該輸入的編碼字元組合至一輸入序列的末尾,其中該輸入序列為時(shí)序歧義的,從而該輸入序列具有被解析成至少兩個(gè)不同的編碼序列組合的可能性,每個(gè)編碼序列組合包括該編碼序列中的至少一個(gè)。2.如權(quán)利要求1所述的解碼方法,其特征在于其中解析該輸入序列時(shí)是通過(guò)匹配一字典來(lái)進(jìn)行,該字典包括該編碼序列與該解碼序列之間的可接受關(guān)聯(lián)。3.如權(quán)利要求1所述的解碼方法,其特征在于其中解析該輸入序列時(shí)是采用語(yǔ)言學(xué)模型。4.如權(quán)利要求3所述的解碼方法,其特征在于其中該語(yǔ)言學(xué)模型對(duì)該編碼序列組合進(jìn)行語(yǔ)言學(xué)分值計(jì)算。5.如權(quán)利要求1所述的解碼方法,其特征在于其中解析該輸入序列時(shí)采用啟發(fā)式語(yǔ)言學(xué)模型,從而使得該語(yǔ)言學(xué)分值計(jì)算可僅應(yīng)用于一部分編碼序列。6.如權(quán)利要求5所述的解碼方法,其特征在于其中該啟發(fā)式語(yǔ)言學(xué)模型采用貪婪法則,以取該編碼序列組合中最長(zhǎng)的匹配作為該編碼序列的映射。7.如權(quán)利要求1所述的解碼方法,其特征在于進(jìn)一步包括一決定步驟當(dāng)該輸入序列最后兩個(gè)字元于該映射中不為任何編碼序列的一部分時(shí),將該輸入序列中位于輸入的編碼字元之前的編碼字元組成為一個(gè)片段序列。8.—種裝置,其特征在于包括一鍵盤(pán),用于輸入包括選自一編碼字元集的至少一個(gè)字元的一輸入序列;一輸出裝置,用于選擇性輸出一輸出序列,該輸出序列包括選自一解碼字元集的至少一解碼字元,其中該輸出序列是依據(jù)該輸入序列生成;以及一解碼裝置,包括將多個(gè)編碼序列映射至多個(gè)解碼序列的一映射,每個(gè)編碼序列包括選自該編碼字元集的至少一個(gè)編碼字元,每個(gè)解碼序列包括選自該解碼字元集的至少一個(gè)解碼字元,該映射用于根據(jù)該輸入序列的至少一部分將該輸入序列映射至該輸出序列,其中,當(dāng)一個(gè)編碼字元藉由該鍵盤(pán)輸入時(shí),該解碼裝置將該輸入的編碼字元組合至該輸入序列的尾端,該輸入序列為時(shí)序歧義而使該輸入序列有被解析為至少兩個(gè)不同的編碼序列組合的可能性。9.如權(quán)利要求8所述的裝置,其特征在于,其中,該解碼裝置進(jìn)一步包括耦合至該鍵盤(pán)的一輸入序列分割器,其用于接收該輸入序列并將該輸入序列分割成一個(gè)文字輸入及一個(gè)控制輸入。10.如權(quán)利要求9所述的裝置,其特征在于,其中,該映射包括一時(shí)序歧義片段化模塊,耦合至該輸入序列分割器以接收該文字輸入,并于該文字輸入最后兩個(gè)字元不構(gòu)成任一編碼序列的一部分時(shí)生成一時(shí)序片段化序列;一語(yǔ)言學(xué)頻率模塊,用以保存多個(gè)統(tǒng)計(jì);以及一語(yǔ)言學(xué)時(shí)序歧義消解模塊,耦合于該時(shí)序歧義片段化模塊與該語(yǔ)言學(xué)頻率模塊,用于根據(jù)該些統(tǒng)計(jì)來(lái)計(jì)算該時(shí)序片段化序列中的每個(gè)片段的編碼序列組合的分值,該分值用于決定該解碼序列的預(yù)測(cè)結(jié)果。11.如權(quán)利要求io所述的裝置,其特征在于,其中,該解碼裝置進(jìn)一步包括一輸出控制模塊,其耦合至該語(yǔ)言學(xué)時(shí)序歧義消除模塊以接收并向該輸出裝置輸出解碼序列,該輸出控制模塊更耦合至該時(shí)序歧義片段化模塊以接收該時(shí)序片段化序列。12.如權(quán)利要求11所述的裝置,其特征在于,其中,該映射進(jìn)一包括一字典模塊,其耦合于該輸出控制模塊,用于接收該時(shí)序片段化序列并從一字典中尋找與該時(shí)序片段化序列對(duì)應(yīng)的解碼序列。13.如權(quán)利要求IO所述的裝置,其特征在于,其中,該映射進(jìn)一步包括一樂(lè)觀時(shí)序歧義消解模塊,其耦合至該時(shí)序歧義片段化模塊與該語(yǔ)言學(xué)頻率模塊,用于根據(jù)該些統(tǒng)計(jì)以計(jì)算該時(shí)序片段化序列中的每個(gè)片段的每個(gè)編碼序列組合的分值,該分值計(jì)算僅適用于一部分編碼序列組合。14.如權(quán)利要求9所述的裝置,其特征在于,其中,該映射包括一時(shí)序歧義片段化模塊,其耦合至該輸入序列分割器以接收該文字輸入,并當(dāng)該輸入序列最后兩個(gè)字元不構(gòu)成任何編碼序列一部分時(shí)生成一時(shí)序片段化序列;一語(yǔ)言學(xué)模塊,用于保存多個(gè)統(tǒng)計(jì);以及一樂(lè)觀時(shí)序歧義消解模塊,其耦合至該時(shí)序歧義片段化模塊及該語(yǔ)言學(xué)頻率模塊,用于計(jì)算該時(shí)序片段化序列中的每個(gè)片段的每個(gè)編碼序列組合的分值,并且該分值計(jì)算僅適用于一部分編碼序列組合。15.如權(quán)利要求9所述的裝置,其特征在于,其中,該映射包括一輸出裝置,其耦合于該輸入序列分割器,用于接收該文字輸入與控制輸入。16.如權(quán)利要求15所述的裝置,其特征在于,其中,該映射進(jìn)一步包括一字典模塊,其耦合至該輸出控制模塊,用于接收該文字輸入并從一字典中檢索與該文字輸入對(duì)應(yīng)的解碼序列。17.—種解碼方法,其特征在于包括維持將多個(gè)編碼序列映射至多個(gè)解碼序列的一映射,每個(gè)編碼序列包括選自一編碼字元集的至少一個(gè)編碼字元,每個(gè)解碼序列包括選自被非語(yǔ)標(biāo)語(yǔ)言使用的一解碼字元集的至少一個(gè)解碼字元;接收一或多個(gè)編碼字元到一輸入序列中;如果該輸入序列長(zhǎng)度大于一則生成多個(gè)編碼序列組合;選擇該編碼序列組合中的一個(gè);根據(jù)該映射將該選擇的編碼序列組合映射至一輸出序列;以及輸出該輸出序列。18.如權(quán)利要求17所述的解碼方法,其特征在于其中該映射的一部分作為一字典,其中該字曲包括該編碼序列與該解碼序列之間的可能關(guān)聯(lián)。19.如權(quán)利要求17所述的解碼方法,其特征在于,其中,選擇該些編碼序列組合中的一個(gè)的步驟重復(fù)進(jìn)行以選擇多個(gè)編碼序列,使得被選擇的該些編碼序列組合根據(jù)該映射對(duì)應(yīng)于多個(gè)輸出序列。20.如權(quán)利要求19所述的解碼方法,其特征在于其中該輸出序列被選擇性輸出并按照從一給定文獻(xiàn)中出現(xiàn)的頻率順序排列。21.如權(quán)利要求19所述的解碼方法,其特征在于其中該輸出序列被選擇性輸出并且按照語(yǔ)言學(xué)分值高低順序排列。22.如權(quán)利要求17所述的解碼方法,其特征在于其中選擇其中一個(gè)編碼序列是由語(yǔ)言學(xué)模型決定。23.如權(quán)利要求22所述的解碼方法,其特征在于其中該語(yǔ)言學(xué)模型是對(duì)該編碼序列組合進(jìn)行語(yǔ)言學(xué)分值計(jì)算。24.如權(quán)利要求17所述的解碼方法,其特征在于其中選擇其中一個(gè)編碼序列時(shí)由啟發(fā)式語(yǔ)言學(xué)模型決定,以使該語(yǔ)言學(xué)分值計(jì)算可僅應(yīng)用于一部分編碼序列。25.如權(quán)利要求24所述的解碼方法,其特征在于其中該啟發(fā)式為語(yǔ)言學(xué)模型采用貪婪法則,以取該編碼序列組合中最長(zhǎng)的匹配作為該編碼序列的映射。26.如權(quán)利要求17所述的解碼方法,其特征在于其中該映射的一部分作為編碼規(guī)則,該編碼規(guī)則將該編碼序列映射至該解碼序列。27.如權(quán)利要求26所述的解碼方法,其特征在于進(jìn)一步包括于選擇其中一個(gè)編碼片段之前的一片段化步驟,該片段化步驟根據(jù)該編碼規(guī)則從該輸入序列生成至少一個(gè)片段化序列,且該些編碼序列組合之一是根據(jù)該片段化序列來(lái)進(jìn)行選擇。28.如權(quán)利要求27所述的解碼方法,其特征在于其中該片段化步驟包括a.從該輸入序列的開(kāi)頭開(kāi)始;b.形成由當(dāng)前字元與當(dāng)前字元的下一個(gè)字元組成的長(zhǎng)度為2的一字串;c.驗(yàn)證該字串是否在該編碼規(guī)則中;d.如果該字串在該編碼規(guī)則中,累積當(dāng)前字元并于下個(gè)字元上進(jìn)行步驟b與c;以及e.如果該字串不存在于該編碼規(guī)則中,用累積的字元與當(dāng)前字元鏈接以生成該片段化序列,并從下一個(gè)字元開(kāi)始重新進(jìn)行該片段化步驟。全文摘要一種解碼方法及解碼裝置,該解碼方法用于將多個(gè)編碼序列映射至多個(gè)被非語(yǔ)標(biāo)語(yǔ)言使用的解碼序列。該解碼方法接收輸入的編碼字元并將其組合至一輸入序列的末尾,其中該輸入序列為時(shí)序歧義的,從而該輸入序列可被解析成至少兩個(gè)不同的編碼序列組合,每個(gè)編碼序列組合包括該編碼序列中的至少一個(gè)。文檔編號(hào)G06F3/023GK101720457SQ200880014020公開(kāi)日2010年6月2日申請(qǐng)日期2008年4月30日優(yōu)先權(quán)日2007年4月30日發(fā)明者陳仁德申請(qǐng)人:陳仁德