鍵盤上速記接口中改進的文本輸入的制作方法

文檔序號：6569293閱讀：230來源：國知局

專利名稱：鍵盤上速記接口中改進的文本輸入的制作方法
技術領域：
本發(fā)明一般涉及基于詞典的文本輸入和文本預測系統(tǒng)。更特別地，本發(fā)明涉及使用鍵盤上速記(shorthand-on-keyboard )的文本輸入，通過在屏上圖形鍵盤上繪制幾何圖案而輸入單詞的有效方法。
背景技術：
圖形鍵盤上的速記(以下稱為"鍵盤上速記")或作為圖形的鍵盤上速記(sokgraph: Shorthand on a Keyboard as Graph )表示在沒有物理鍵盤的情況下高效地輸入文本的輸入方法和系統(tǒng)，其通常使用指示筆(stylus)。鍵盤上速記使得用戶能夠在圖形鍵盤上描繪字母或功能鍵而將單詞和命令輸入計算機中。富有經驗的用戶部分地或完全地記住鍵盤布局上經常使用的單詞和命令的幾何圖案，并可例如使用數(shù) 字筆，基于記憶回想繪制這些圖案?；趩卧~級識別的文本輸入系統(tǒng)-諸如鍵盤上速記和手寫/語音識別-以及文本預測系統(tǒng)都依靠于用于定義這些系統(tǒng)識別的單詞集合的某些形式的詞典。將用戶的輸入與詞典中的選項相匹配。沒有被包括在詞典中的單詞通常不被自動識別。在這樣的情形中，必須提供特殊模式。例如，在鍵盤上速記中，用戶可以最初檢查候選項列表(N 最佳列表N-bestlist)。如果候選項列表中沒有選項是想要的單詞，則用戶判斷所繪制的圖案是否不正確。如果所繪制的圖案是正確的，則用戶認識到想要的單詞不在詞典中。然后，用戶通過敲擊各個字母而向詞典中輸入新單詞。理想地，詞典包括特定用戶需要寫的所有單詞，不多也不少。詞典太大或太小都可能對用戶產生麻煩。較大的詞典可能產生某些挑戰(zhàn)，因為這會由于對于每個用戶輸入可能存在大量干擾項(distracter)而降低識別精確性。在任何語言中，往往存在核心的一組詞匯對于所有個體是公共的。在這個核心集合之
外，單詞往往是專用于特定個體的。例如，工程師可能撰寫包括高度技術性的術語和特定領域或商業(yè)領域的縮寫的電子郵件。對于其他用戶，這些專用術語可能是不相干的，并可能在識別過程中引入干擾，
從而使得識別過程健壯性(robust)較差。
較小的詞典通常是健壯性更好的詞典，因為如果想要的單詞在詞典中，則用戶輸入更可能被正確識別。較小的詞典為用戶輸入提供更大的靈活性和容錯(tolerance)，從而允許輸入與期望的輸入選項的理想形式相比是不精確和不準確的。小詞典的另一優(yōu)勢在于搜索空間較小。因此，小詞典允許減小搜索的等待時間(latency)。這在處理能力嚴重受限的移動設備中尤為重要。
然而，當小詞典不包含用戶所需的單詞時，用戶經驗可能無效。用戶在輸入之前不知道單詞是否在詞典中，從而對于用戶導致不確定性。在單詞被不正確地輸入或單詞不在詞典中時都可能發(fā)生傳統(tǒng)系統(tǒng)
不能識別該單詞。因此，用戶可能很難判斷單詞為何沒有被識別。一般地，用戶不可能知道單詞是否在詞典中，除非反復嘗試該單詞。當用戶確定該單詞不在詞典中時，用戶經識別系統(tǒng)所提供的接口，通過前面所述的敲擊而將該單詞添加到詞典。較小的詞典要求用戶更頻繁地向詞典添加單詞。
對于詞典大小問題有多個傳統(tǒng)解決方案。通常使用的方法是使用大詞典，然后利用更高級的語言規(guī)則-諸如單詞級三元組模型 (word-level trigram-model)-來濾除非常不可能的候選項。語言模型的不利方面通常是產生和有效使用大語言模型的額外開銷。而且，語言模型可能引入誤差，并錯誤地濾除想要的單詞。如果語言模型是一般性的而非為特定用戶定制的，則這個問題尤為突出。實踐中，語言模型的有效定制很難。而且，語言模型很難與已經具有高精度的識別技術—諸如鍵盤上速記—結合。
另一傳統(tǒng)方法通過挖掘用戶所產生的書面文本-例如所寫的電子郵件和其他文獻-而為用戶創(chuàng)建定制的詞典。雖然該方法確實得到對于特定用戶更精確設計的詞典，但用戶所產生的先前書寫文集可能太少而不足以涵蓋所有期望的單詞。而且，在實踐中，很難編寫能夠打開并閱讀用戶可能正在使用的所有各種電子郵件和文件格式的計算機程序代碼。該方法經常要求用戶定位并選擇先前撰寫的文件，這對
用戶是不方便的。定制的詞典也可能難以在不同設備間轉移(carry over)。
雖然這些傳統(tǒng)解決方案對于它們想要達到的目的是足夠的，但期望找到一種解決方案，其使得詞典能夠對于用戶期望的輸入具有數(shù)量相對少的無關干擾項，但允許很容易訪問用戶可能需要的幾乎所有單詞，包括多數(shù)用戶很少使用的更專業(yè)的單詞。總之，期望將用戶可能需要的所有單詞包括在非常大的詞典中。然而，非常大的詞典意味著對于相同的匹配閾值，更多單詞與在鍵盤上繪制的圖案匹配，從而降低了輸入系統(tǒng)中的信噪比。因此，較大的詞典對于用戶對應于更小的靈活性和健壯性。因此，需要一種用于鍵盤上速記系統(tǒng)的詞典配置來平衡使用的容易性與靈活性和健壯性。
對于傳統(tǒng)鍵盤上速記輸入方法的另一挑戰(zhàn)是要求在單詞級準確
地輸入文本，一次一個單詞。一些單詞很長。對于相對新的用戶而言，
可能在認知方面很難以一個筆劃(stroke)通過鍵盤上速記繪出長單
詞。該困難在其中與英語相比長的復合詞更常見的某些歐洲語言中特
別突出。而且，如果普通詞綴可以被繪制為相對于單詞的詞干單獨的
筆劃，則用戶可能發(fā)現(xiàn)輸入更方便。例如，為了以鍵盤上速記書寫單
詞"working，，，用戶可能希望在圖形鍵盤上繪制w-o-r-k圖案，然后繪
制i-n-g并將這二者組合為一個單詞。因此，需要高效的系統(tǒng)和方法來
如用戶所期望的那樣自動地將鍵盤上的局部單詞("skographs")組合為一個單詞。
因此需要一種改進的鍵盤上速記接口中的文本輸入。

發(fā)明內容
本發(fā)明公開了一種系統(tǒng)、計算機程序產品、和相關方法(在此被總稱為"系統(tǒng)"或"本系統(tǒng)")，用于改進鍵盤上速記接口上的文本輸入。本系統(tǒng)包括核心詞典和擴充詞典。核心詞典包括一種語言中的常用詞
匯。根據(jù)本系統(tǒng)的應用，核心詞典通常包括大約5000到15000個單詞。擴充詞典包括沒有被包括在核心詞典中的單詞。擴充詞典包括大約 30000到100000個單詞。
核心詞典允許本系統(tǒng)在識別比劃(gesture)中將常用單詞作為排序最高的候選單詞，從而提供與較小詞典相關的更健壯的識別性能。只有來自核心詞典的單詞在本系統(tǒng)中可被直接輸出。附加的候選單詞可從擴充詞典中獲取，從而允許用戶在候選項列表中找到較不熟悉的單詞，但僅通過菜單選擇。本系統(tǒng)增強了單詞識別精確度，而不犧牲從大詞典中選擇單詞。核心詞典為用戶輸入提供了更大的靈活性和容錯，以相對于想要的輸入選項的理想形式是不精確和不準確的。
本系統(tǒng)還包括識別模塊、預排序模塊和排序模塊。識別模塊產生對應于輸入圖案的候選單詞的N最佳列表。預排序模塊按照預定標準對這些N最佳候選單詞排序。排序模塊調整對候選單詞的N最佳列表的排序，以將從核心詞典得到的單詞設定為比從擴充詞典中得到的單詞更高，從而生成排序后的單詞候選項列表。僅核心詞典中的單詞作為本系統(tǒng)的輸出被呈現(xiàn)。本系統(tǒng)僅在N最佳列表中列出在擴充詞典中找到的候選單詞；這些單詞需要用戶選擇以成為輸出。一旦用戶從N 最佳列表中選擇，來自擴充詞典的單詞就被收錄到核心詞典中。
更特別地，在一個優(yōu)選實施例中，僅核心詞典中的單詞被識別系統(tǒng)輸出。擴充詞典中的單詞僅可在N最佳列表中被列出，并需要明確的用戶選擇才被輸出。一旦被選擇，擴充詞典中的單詞就也被收錄到核心詞典中。
在用戶所比劃的單詞不在核心詞典的詞匯中的情形下，本系統(tǒng)減小了對用戶的額外負擔。與不確定該單詞是否被包括在詞典中或系統(tǒng) 是否誤識別該輸入不同，用戶可以掃描N最佳列表并選擇期望的候選單詞。
本系統(tǒng)還包括拼接模塊和復合單詞模塊。拼接模塊使用戶可以分別輸入長單詞的各部分；本系統(tǒng)自動地將作為"sokgraph"的單詞和單詞部分組合為用戶想要的一個單詞。單詞部分可以是諸如"work"這樣的詞干和諸如"ing"或"pre，，這樣的詞綴。復合單詞模塊組合兩個或多個普通的較短單詞，其中這些較短單詞的拼接形成長單詞，諸如英語中的short和hand。將幾個短單詞拼接為一個復合詞在某些歐洲語言中更常見，諸如瑞典語或德語。
本系統(tǒng)允許用戶交互來調整單詞1和單詞2的拼接和組合單詞的拆開。當用戶點擊拼接單詞、例如"smokefree，，時，菜單選項"分解為 "somkefree，"，或等效選擇被提供給用戶?？商鎿Q地，筆跡運動、諸如劃過單詞smokefree的向下運動可被定義為分解命令。對于由于低置信度而無動作的可拼接單詞，菜單選項被嵌入單詞1和單詞2。當用戶點擊單詞i時，選項"向右對齊(snap to right)"或等效選項可選擇。可替換地，諸如劃過單詞1和單詞2 二者的圓團這樣筆比劃(pen gesture )被定義為將這兩個單詞結合為一個拼接的長單詞的命令。

將參考以下說明書、權利要求書、和附圖更詳細地說明本發(fā)明的各特征和及其實現(xiàn)方式，其中附圖標記在適當?shù)牡胤奖恢貜褪褂靡灾?示所標記對象之間的對應關系，且其中
圖1是其中可使用本發(fā)明的單詞圖案識別系統(tǒng)的示例性操作環(huán)境的示意圖2是圖1的單詞圖案識別系統(tǒng)的高級架構的方框圖3的流程圖示出了圖l和2的單詞圖案識別系統(tǒng)在按照核心詞
典或擴充詞典中的位置對候選單詞排序中的操作方法；
圖4的示意圖示出了由圖l和圖2的單詞圖案識別系統(tǒng)所生成的
N最佳列表，其中來自核心詞典的單詞和來自擴充詞典的單詞被不同
地顯示；
圖5的示意圖示出了由圖l和圖2的單詞圖案識別系統(tǒng)所生成的 N最佳列表，其中來自核心詞典的單詞被分組且被排序為比來自擴充詞典的單詞的排序高；
圖6的流程圖示出了圖l和圖2的單詞圖案識別系統(tǒng)在以語言適當方式將單詞候選項識別為后綴或前綴并將所識別的前綴或后綴拼接
到所識別單詞的操作方法；
圖7的流程圖示出了圖l和圖2的單詞圖案識別系統(tǒng)在將單詞組
合為復合詞中的操作方法；
圖8包括圖8A、 8B和8C，并表現(xiàn)了示出圖1和圖2的單詞圖案識別系統(tǒng)的菜單的視圖，其中菜單使用戶能夠將復合詞分解為詞干和后綴；
圖9的視圖示出了用戶在圖l和圖2的單詞圖案識別系統(tǒng)所提供
的復合詞上形成的筆比劃，其中筆比劃將復合詞分解為詞干和后綴；
圖10包括圖IOA、 10B和10C,并表現(xiàn)了示出圖1和圖2的單詞圖案識別系統(tǒng)的菜單的視圖，其中菜單被應用于詞干以使用戶能夠將詞干和后綴組合為復合詞；
圖11的視圖示出了圖1和圖2的單詞圖案識別系統(tǒng)的菜單，其中菜單被應用于后綴，從而使用戶能夠將詞干和后綴組合為復合詞；以及
圖12的視圖示出了用戶在圖1和圖2的單詞圖案識別系統(tǒng)所呈現(xiàn)的詞千和后綴上形成的筆比劃，其中筆比劃將詞千和后綴組合為復合單詞。
具體實施例方式
下面的定義和解釋提供了關于本發(fā)明技術領域的背景信息，并且是為了有利于對本發(fā)明的理解，而不限制本發(fā)明的范疇
詞典定義可與識別系統(tǒng)中的用戶輸入匹配的可識別元素的集合。
PDA:個人數(shù)字助理口袋大小的個人計算機。PDA通常存儲電話號碼、約會、和要做事情列表。某些PDA具有小鍵盤；其他PDA 只具有用于在虛擬鍵盤上輸入和輸出的特殊筆。Sokgraph:作為圖形的鍵盤上速記。虛擬鍵盤上單詞的圖案表示。虛擬鍵盤具有觸摸屏交互能力的計算機模擬鍵盤，其能夠被用來替代或補充使用按鍵輸入(keyed entry)的鍵盤。虛擬按鍵通常用指示筆連續(xù)敲擊。虛擬鍵盤也被稱為圖形鍵盤、屏上鍵盤、或指示筆鍵盤。
圖1示出了示例性的整體環(huán)境，其中可使用按照本發(fā)明的用于改進鍵盤上速記接口中的文本輸入的系統(tǒng)、計算機程序產品、和相關方法(單詞圖案識別系統(tǒng)IO或"系統(tǒng)10")。系統(tǒng)10包括通常被嵌入計算機內或安裝在計算機上的軟件程序代碼或計算機程序產品。安裝有系統(tǒng)10的計算機可以是移動設備、諸如PDA 15或蜂窩電話20。系統(tǒng) 10也可被安裝在諸如平板計算機26、觸摸屏監(jiān)視器30、電子白板35、和數(shù)字筆40這樣的設備中。
系統(tǒng)10可被安裝在輔助設備45所表示的任何使用用于輸入的虛擬鍵盤或類似接口的設備上。系統(tǒng)10可被保存在合適的存儲介質、諸如磁盤、CD、硬驅等設備上。
系統(tǒng)10根據(jù)用戶在圖形鍵盤上所構成的筆劃的形狀和位置確定單詞。系統(tǒng)10發(fā)送所確定的單詞到軟件接收器，諸如應用程序、操作系統(tǒng)等。
圖2示出系統(tǒng)10的高級分層結構。系統(tǒng)10包括詞典205。詞典 205包括核心詞典210和擴充詞典215。核心詞典210包括一種語言中的常用單詞。根據(jù)系統(tǒng)10的應用，核心詞典210通常包括大約5000 到15000個單詞。擴充詞典215包括沒有被包括在核心詞典210中的單詞。擴充詞典215包括大約30000到100000個單詞。
系統(tǒng)10還包括識別模塊220、預排序模塊225、和選擇器/排序模塊230。識別模板220生成與輸入圖案235對應的候選單詞的N最佳列表。預排序模塊225按照預定標準對這N最佳候選單詞排序。排序模塊230調整對N最佳列表的候選單詞的排序，以將從核心詞典210 得到的單詞設置為放置得比從擴充詞典215得到的單詞高，從而生成排序后的單詞候選項列表。如前面所解釋的那樣，從擴充詞典得到的單詞不被輸出；僅來自核心詞典的詞被輸出。
系統(tǒng)10還包括拼接模塊245和復合詞模塊250。拼接模塊245 拼接從排序后的單詞候選項列表240中所選擇的單詞；例如拼接"ing" 與"code"形成"coding"。復合詞模塊250將從排序后的單詞候選項列表240中所選擇的單詞組合為更大的單詞。輸出單詞255是從排序后的單詞候選項列表240中選擇、并在需要時被拼接模塊245和復合詞模塊250處理的單詞。僅核心詞典210中的單詞被系統(tǒng)IO作為輸出單詞255呈現(xiàn)。系統(tǒng)10只在N最佳列表中列出在擴充詞典215中找到的候選單詞；這些單詞需要用戶選擇才成為輸出單詞255。一旦被用戶選擇，系統(tǒng)10就將來自擴充詞典215的單詞錄入核心詞典210。
系統(tǒng)10調節(jié)識別模塊220對輸入圖案235的識別以適應用戶的詞匯，同時保持識別系統(tǒng)中的最大信噪比。系統(tǒng)10允許核心詞典210 和擴充詞典215參與識別模塊220的識別過程。然而，僅核心詞典210 中的單詞直接進入識別模塊220的輸出；這些單詞是缺省輸出。與輸入圖案235匹配的擴充詞典215中的單詞僅被列在"N最佳"列表中，供用戶選擇。當用戶從N最佳列表中選擇這些候選單詞中的一個來取代缺省輸出時，所選單詞被錄入到核心詞典210中。在單詞被錄入到核心詞典210后，當被錄入的單詞與輸入圖案235匹配時，該詞可直接進入識別模塊的輸出。
圖3示出了系統(tǒng)10生成與輸入圖案235匹配的候選項的N最佳列表的方法300。用戶在鍵盤上速記接口上比劃一個單詞(步驟305 )。識別模塊220生成單詞候選項的N最佳列表(步驟310 );預排序模塊225根據(jù)諸如置信值或相似性度量這樣的標準，對來自核心詞典210 和擴充詞典215的單詞候選項的N最佳列表排序(步驟315)。
排序模塊230判斷候選單詞的N最佳列表中排序最高的單詞是否是從核心詞典210得到的(判斷步驟320)。如果是，則排序模塊230 輸出單詞候選項的排序后的N最佳列表作為排序后的單詞候選項列表 (步驟325)。如果候選單詞的N最佳列表中排序最高的候選項沒有出現(xiàn)在核心詞典210中，則排序模塊230搜索候選單詞的N最佳列表以定位從核心詞典210中所得到的排序最高的單詞候選項(步驟330 )。如果在候選單詞的N最佳列表中找到從核心詞典210中得到的單詞候選項(判斷步驟335)，則排序模塊230輸出單詞候選項的排序后的N最佳列表作為排序后的單詞候選項列表240。否則，排序模塊 230將所找到的單詞候選項移動至單詞候選項的N最佳列表中的最高排序位置(步驟335)。排序模塊輸出單詞候選項的排序后的N最佳列表作為排序后的單詞候選項列表240 (步驟340)。
為了允許用戶選擇沒有被最高排序的候選單詞，用戶接口部件顯示用戶從中可以看到與輸入圖案235密切匹配的可選候選單詞的次最佳候選項列表(N最佳列表)。在一個實施例中，候選單詞在列表上的位置是由與候選單詞相關的排序決定的，與候選單詞是在核心詞典 210中還是在擴充詞典215中發(fā)現(xiàn)的無關，例外情形是，除了在核心詞典中沒有任何單詞與用戶輸入匹配時最高排序的單詞必須總在核心詞典中找到。在另一實施例中，候選單詞按詞典起源分組；即，來自核心詞典210的候選單詞被分組在一起，而來自擴充詞典215的候選單詞被分組在一起。
候選單詞的起源可選地可以通過強調與候選單詞相關聯(lián)的不同感知特征來指示，以有利于識別候選單詞的來源，例如來自核心詞典或來自擴充詞典。示例性的感知特征例如包括顏色、背景底紋、黑體、斜體等。如果用戶沒有選擇單詞，則系統(tǒng)IO輸出來自核心詞典的候選單詞的N最佳列表中排序最高的單詞。如果用戶沒有選擇單詞，則系統(tǒng)IO輸出來自核心詞典的候選單詞的N最佳列表中排序最高的單詞。
從擴充詞典215中得到的單詞從候選單詞的N最佳列表訪問。因此，顯著地增強了系統(tǒng)10在生成排序最高的候選項時的容錯度，因為系統(tǒng)所顯示的排序最高的候選項是從較小的核心詞典210得到的。對于在核心詞典210中沒有找到所期望的單詞這樣的罕見情形，用戶激活N最佳列表并選擇所期望的候選項。
圖4示出了由排序模塊230所生成的示例性的候選單詞的N最佳列表400。來自核心詞典210的候選單詞包括候選單詞1 405、候選單詞2 410、和候選單詞3 415,被總稱為核心候選單詞420。來自擴充詞典215的候選單詞包括候選單詞4 425、候選單詞5 430、候選詞6 435、候選單詞7 440、和候選單詞8 445,被總稱為擴充候選單詞450。核心候選單詞420和擴充候選單詞450以不同的強調方式被顯示。
在該例中，核心候選單詞420以粗體文本示出，而擴充候選單詞 450以斜體文本示出。任何形式的加重都可被用于區(qū)分核心候選單詞 420和擴充候選單詞450，諸如文本顏色、顏色背景、底紋等。示例性的候選單詞的N最佳列表400中的候選單詞按照識別模塊220所給出的排序被定位，例外情形是除非核心詞典中沒有單詞與用戶輸入匹配，否則為從核心詞典210得到的單詞保留最高單詞候選項位置455，在該情形中，最高單詞候選項位置455可由來自擴充詞典的單詞占據(jù)。
圖5示出一個實施例，其中示例性的N最佳列表500包括按照來源和按照識別模塊220所提供的排序標準排序的候選單詞。對于圖4, 核心候選單詞420和擴充候選單詞450以不同的強調方式被顯示。在該例子中，核心候選單詞420以粗體文本示出，而擴充候選單詞450 以斜體文本示出。
在用戶所比劃的單詞不在核心詞典210的詞匯中的情形下，系統(tǒng) 10顯著地減小了對用戶的額外負擔。不是不能確定該單詞是否被包括在核心詞典210中或系統(tǒng)是否誤識別該輸入，相反，用戶可掃描N最
佳列表并選擇所期望的候選單詞。
對于本領域技術人員而言，顯然，將單詞劃分到多個單獨的詞典是一個簡單概念性模型的實現(xiàn)?？商鎿Q地，詞典205可被概念化為由頻率或先驗概率排序的多個層，核心詞典層和擴充詞典層。當從N最佳候選項接口選擇來自擴充詞典層的單詞時，所選單詞的頻率或先驗概率被調整到閾值或其他標準，效果是所選單詞被調整為屬于核心層。
系統(tǒng)10還使用戶能夠分開輸入長單詞的各部分；系統(tǒng)IO自動地將局部"sokgraphs，，組合為用戶想要的一個單詞。單詞部分可以是諸如 "wor k"這樣的詞干和諸如"ing"這樣的后綴、或兩個或多個普通的較短單詞，這些較短單詞的拼接形成一個長單詞，諸如英語中的short和 hand。將幾個短單詞拼接為一個復合單詞在某些歐洲語言、諸如瑞典語或德語中更常見。
拼接是基于單獨識別拼接單詞中所涉及的部分。對于詞干加后綴的情形，用戶最初比劃表示詞干的單詞輸入圖案235，然后比劃后綴的輸入圖案235。例如，對于單詞"coding"，用戶最初寫"code"的比劃，然后寫"ing"的比劃。對于鍵盤上的輸入軌跡，識別模塊220找出最優(yōu) 匹配，并將這些匹配輸出到具有字符串S(i)的N最佳列表，其中ie[l， Nl，其中字符串的排序i表示識別模塊220對所選字符串與輸入圖案 235匹配的置信度。排序i-l的字符串是識別模塊220的首選項。識別模塊220在臨時緩存器中存儲最后的N最佳列表。被緩存的常規(guī)單詞(詞干)的N最佳列表被表示為S0。
在一個實施例中，后綴被存儲在被稱作可拼接后綴的列表中，其 sokgraph 、即圖形鍵盤上的幾何圖案以與普通單詞sokgraph相同的方式被表示。例如，對于后綴"ing"，其sokgraph是從i鍵開始到n鍵并在g鍵上結束的連續(xù)跡線。除了后綴"ing"被存儲在可拼接后綴的列表中之外，系統(tǒng)以與任何其他sokgraph相同的方式識別 sokgraph"ing"的輸入圖案235?？商鎿Q地，后綴和普通單詞二者可被存儲在同一詞典中，但具有用于區(qū)分后綴和普通單詞的標識符。在一個實施例中，可拼接后綴被存儲在查詢表中，其中每個后綴條目、諸如"ing，，與一系列指針相關聯(lián)，這些指針指向詞典中以該后綴結束的條目。
圖6示出了系統(tǒng)10將可拼接后綴與詞干單詞組合的方法600。用戶在鍵盤上速記接口上比劃單詞(步驟605)。拼接模塊245獲得對于單詞候選項的輸出N最佳列表240排序最高的單詞(步驟610)。拼接模塊245判斷所獲得的單詞是否是可拼接的后綴，例如通過比較所獲得的單詞與可拼接后綴列表(判斷步驟615)。如果所獲得的單詞不是可拼接后綴，則拼接模塊245不采取任何動作(步驟620)。
如果所獲得的單詞是可拼接后綴，則拼接模塊245找到以所確定的可拼接后綴結束的拼接候選項(步驟625)。拼接模塊245從每個拼接候選項剝離可拼接后綴(步驟630 )。以當前后綴結束的單詞(例如"ing，，)并表示為S1(0 (例如coding或working )以及它們的被剝離后綴的剩余部分,皮表示為S2(i)(如cod或work)。
拼接模塊245計算剝離后的拼接候選項與可拼接后綴之間的字符串編輯距離(string edit distance )(特別地使用Wagner-Fisher算法的Morgan編輯誤差)(步驟635 )。然后將剩余部分S柳與被緩存的N最佳列表中的首選項So(i)匹配。因為S。包含整個單詞，而不是單詞片段(例如S。d,code)，所以匹配不準確。系統(tǒng)10使用編輯距離 (edit-distance )(從插入、刪除、或替換單個字符中所選擇的最小數(shù) 目的編輯操作)來匹配兩個字符串，從而在S2(i) (i=l， N)中找到最接近S。d)的字符串并將其表示為S2min。拼接模塊245以相關聯(lián)的編輯距離對拼接候選項進行分類(步驟640)。拼接模塊245返回具有最小編輯距離的拼接候選項(步驟645)。
在一個可替換實施例中，單詞頻率或先驗概率、或更高級語言規(guī) 則被用于對具有相同編輯距離的拼接候選項進行排序。
對應于S柳中S2min的單詞作為選擇的拼接候選項被返回。例如 "code"對"cod" ( "coding"的剝離后部分)的編輯距離比"code"對 "work" ("working"的剝離后部分)的編輯距離小。在一個實施例中，閾值可被設定為最低的可接受編輯距離失配。
在另一實施例中，后綴不被鏈接到所有以該后綴結束的單詞。相反，在后綴被識別時，系統(tǒng)10掃描詞典205，找到以所識別的后綴結束的單詞，從所找到的單詞剝離結尾，匹配剝離后的剩余部分與前面的單詞，并如前所述選擇最密切的匹配用于拼接。這兩個實施例的區(qū) 別在于計算時間和存儲空間權衡。掃描詞典意味著不需要單獨的指針列表，因此減小了軟件代碼訪問的介質中詞典的存儲要求。另一方面，與包括以單獨的指針列表索引的詞典的系統(tǒng)相比，掃描詞典需要更多的時間來定位單詞。
系統(tǒng)10以與"詞干+后綴"相似的方式處理"前綴+詞干"。拼接模塊245最初根據(jù)單獨的前綴列表或具有前綴標識符的普通詞典從單詞候選項的排序后的列表240的輸出中識別基于前綴的單詞。拼接模塊 245然后識別前綴后面的單詞。拼接模塊245匹配包含該前綴的所有單詞，從匹配的單詞剝離該前綴，并返回最密切的匹配供拼接。
將兩個較短單詞拼接為一個長的單詞是不確定的。例如，在瑞典語中，"smoke free"和"smokefree"二者都是允許的，但它們的含義卻相反(允許吸煙與不允許吸煙)。復合詞模塊250使用統(tǒng)計交互方法處理兩個單詞的拼接。為了支持該方法，系統(tǒng)10在詞典205中存儲統(tǒng) 計信息，包括所有單詞的頻率(基于每個單詞在文集或文本中出現(xiàn)的總次數(shù))和所有雙元組(bigrams)的頻率(基于兩個有序單詞出現(xiàn)的總次數(shù))。
圖7示出系統(tǒng)10將兩個單詞組合為復合詞的方法700。方法700 檢查連續(xù)單詞對(單詞l，單詞2)(步驟705)。復合詞模塊245判斷在詞典245中是否找到組合的連續(xù)單詞(單詞1 +單詞2 =單詞3)
(判斷步驟710)。如果沒有找到組合單詞-單詞3，則復合詞模塊 250不采取動作(步驟715)。如果發(fā)現(xiàn)匹配(單詞3 =單詞1 +單詞 2)，則復合詞模塊250比較單詞3與雙元組(bigram)(單詞l，單詞2 )的頻率(步驟720 )。如果單詞3的頻率與預定閾值相比大于雙元組(單詞l,單詞2)的頻率，或單詞3的頻率相對于雙元組(單詞 1，單詞2)的頻率的比率大于預定閾值(判斷步驟725),則復合詞模塊用單詞3代替單詞1和單詞2 (步驟730 )。否則，不采取任何動作(步驟715)?？商鎿Q地，單詞3的頻率與雙元組(單詞1，單詞2) 的頻率的比較是加權比較。
系統(tǒng)10提供支持用戶交互以調整拼接和拆開的用戶接口。圖8
(圖8A，圖8B，圖8C)示出了將組合單詞拆開為兩個獨立單詞或單詞部分。示例性的屏幕805向用戶顯示了示例性的拼接單詞 "coding，，810。用戶例如通過點擊單詞"coding"810而選擇所顯示的拼接單詞"coding，，(圖8A)。選擇單詞"coding"810就顯示例如包括可選擇指令"分解為"code"和"ing""或等價選項的菜單選項815(圖8B)。如果用戶選擇菜單選項815中所示的指令，則系統(tǒng)IO將所顯示的拼接單詞"coding，，810分解為詞干"code"820和后綴"ing"825 (圖8C )。
圖9示出用于分解拼接單詞"coding"810的一個示例性的可替換的筆跡運動卯5。屏幕850向用戶顯示拼接單詞"coding"810。用戶在拼接單詞"coding"810上形成筆跡運動905。系統(tǒng)10將所顯示的拼接單詞"coding，，810分解為詞干"code，，820和后綴"ing"825，如圖8C所示。
對于由于低置信度而沒有動作的可拼接單詞，菜單選項被嵌入單詞1和單詞2中，如圖10所示。例如，屏幕805向用戶顯示單詞 l"code"1005和單詞2"ing，，1010，如圖10A所示。選擇單詞l"code"1005 就顯示包括可選擇指令"向右對齊"或等價選項的選項菜單1015 (圖 IOB)。如果用戶選擇選項菜單1015中所示出的指令"向右對齊，，，則系統(tǒng)10拼接單詞l"code"1005和單詞2"ing，，1010,從而形成拼接單詞 "coding，，1020 (圖10C )。
圖11示出在用戶選擇單詞2"ing，，1010時所顯示的一個示例性選項菜單1105。如果用戶選擇在選項菜單1105中所示出的指令"向左對齊"，則系統(tǒng)IO拼接單詞l"code，，1005和單詞2"ing，，1010，從而形成拼接單詞"coding，，1020，如圖10C所示。
圖12示出用來拼接單詞l"code"1005和單詞2"ing"1010的一個示例性可替換的筆跡運動1205。筆跡運動1205例如包括劃過單詞 l"code，，1005和單詞2"ing，，1010的圓圏。系統(tǒng)10識別筆跡運動1205 所表示的命令，并拼接單詞l"code，，1005和單詞2"ing，，1010，從而形成拼接單詞"coding，，1020，如圖10C所示。
權利要求
1.一種用于識別經鍵盤上速記接口所輸入的輸入信號的單詞識別系統(tǒng)，所述系統(tǒng)包括包括常用單詞的核心詞典；擴充詞典，包括沒有被包含在核心詞典中的單詞；識別模塊，用于識別與輸入信號相關的單詞；選擇器模塊，用于輸出來自核心詞典的與輸入信號相關的輸出單詞；以及錄入模塊，用于在用戶選擇與輸入信號相關的候選單詞后，將該候選單詞錄入核心詞典。
2. 如權利要求l所述的系統(tǒng)，還包括用戶選擇接口，用于呈現(xiàn) 來自核心詞典和擴充詞典中至少一個的與輸入信號相關的候選單詞，以供用戶選擇。
3. 如權利要求2所述的系統(tǒng)，其中用戶選擇接口以不同的感知特征列出來自核心詞典的候選單詞和來自擴充詞典的候選單詞，以便于區(qū)分。
4. 如權利要求l所述的系統(tǒng)，其中識別模塊生成來自核心詞典和擴充詞典的候選單詞的N最佳列表。
5. 如權利要求4所述的系統(tǒng)，還包括預排序模塊，用于根據(jù)至少一個標準對候選單詞的N最佳列表排序。
6. 如權利要求5所述的系統(tǒng)，其中排序模塊輸出來自核心詞典的最高排序的單詞作為候選單詞的N最佳列表中最高排序的單詞。
7. —種識別經鍵盤上速記接口輸入的輸入文本的單詞識別方法，包括在核心詞典中存儲常用單詞；在擴充詞典中存儲沒有被包含在核心詞典中的單詞；識別與輸入信號相關的單詞；輸出來自核心詞典的與輸入文本相關的輸出單詞；以及在用戶選擇與輸入文本相關的候選單詞后，將該候選單詞錄入到核心詞典中。
8. 如權利要求7所述的方法，還包括呈現(xiàn)來自核心詞典和擴充詞典中至少一個的與輸入信號相關的候選單詞，以供用戶選擇。
9. 如權利要求8所述的方法，還包括以不同的感知特征列出來自核心詞典的候選單詞和來自擴充詞典的候選單詞，以便于區(qū)分。
10. —種具有存儲在計算機可用介質上的程序代碼的計算機程序產品，用于識別經用戶輸入接口輸入的輸入信號，包括包括常用單詞的核心詞典；擴充詞典，包括沒有被包含在核心詞典中的單詞；用于識別與輸入信號相關的單詞的程序代碼；用于輸出來自核心詞典的與輸入信號相關的輸出單詞的程序代碼；以及用于在用戶選擇與輸入信號相關的候選單詞后將該候選單詞錄入核心詞典的程序代碼。
11. 如權利要求l所述的系統(tǒng)，用于允許組合輸入文本的詞干和詞綴，所述系統(tǒng)還包括拼接模塊，用于將輸入信號識別為輸入詞綴；拼接模塊還識別候選單詞作為相鄰候選單詞；復合輸出模塊，用于在詞典中檢索包含所述輸入詞綴的單詞集合；排序模塊，用于根據(jù)相似性函數(shù)對包含所述輸入詞綴的單詞集合進行排序，所述排序模塊比較包含所述輸入詞綴的單詞集合中每個詞典單詞與包含所述候選單詞和輸入詞綴的字符串；以及復合單詞模塊，用于輸出包含所述輸入詞綴的單詞集合中排序最高的詞典單詞。
12. 如權利要求11所述的系統(tǒng)，其中所述輸入詞綴是后綴。
13. 如權利要求12所述的系統(tǒng)，其中所述復合詞模塊復合所述后綴與排序最高的詞典單詞。
14. 如權利要求11所述的系統(tǒng)，其中所述輸入詞綴是前綴。
15. 如權利要求14所述的系統(tǒng)，其中所述復合詞模塊復合所述前綴和排序最高的詞典單詞。
16. 如權利要求14所述的系統(tǒng)，其中所述相似性函數(shù)包括距離函數(shù)。
17. 如權利要求14所述的系統(tǒng)，其中所述相鄰候選單詞包括在所述輸入詞綴前面的候選單詞或在所述輸入詞綴后面的候選單詞中的任意一個。
18. 如權利要求17所述的系統(tǒng)，其中如果所述輸入文本沒有被識別為輸入詞綴，則復合詞模塊創(chuàng)建由輸入文本和相鄰候選單詞的拼接而產生的字符串；判斷所述字符串在詞典中出現(xiàn)的頻率；將所述字符串的出現(xiàn)頻率分別與輸入文本和相鄰候選單詞的出現(xiàn)頻率相比較；率，則復合;模塊將輸入文本和相鄰候選單詞拼接為拼接單詞，并以所述拼接單詞代替所述字符串。
19. 如權利要求18所述的系統(tǒng)，其中字符串的出現(xiàn)頻率相對于輸入文本和相鄰候選單詞的出現(xiàn)頻率的比較是加權比較。
20. 如權利要求7所述的方法，用于允許組合輸入文本的詞干和詞綴，所述方法進一步包括將輸入文本識別為輸入詞綴；如果輸入文本被識別為輸入詞綴，則將候選單詞識別為相鄰候選單詞；在詞典中檢索包含所述輸入詞綴的單詞的集合；根據(jù)相似性函數(shù)，通過比較包含所述輸入詞綴的單詞的集合中每個詞典單詞與包含候選單詞及輸入詞綴的字符串，對包含所述輸入詞綴的單詞的集合進行排序；以及輸出包含所述輸入詞綴的單詞的集合中排序最高的詞典單詞。
21. 如權利要求19所述的方法，進一步包括復合所述后綴與排序最高的詞典單詞。
22.如權利要求10所述的計算機程序產品，用于允許組合輸入文本的詞干和詞綴，所述計算機程序產品進一步包括用于將輸入信號識別為輸入詞綴，并進一步將候選單詞識別為相鄰候選單詞的程序代碼；用于在詞典中檢索包含所述輸入詞綴的單詞的集合的程序代碼；用于按照相似性函數(shù)對包含所述輸入詞綴的單詞的集合進行排序的程序代碼，其比較包含所述輸入詞綴的單詞的集合中每個詞典單詞與包含所述候選單詞及輸入詞綴的字符串；以及用于輸出包含所述輸入詞綴的單詞集合中排序最高的詞典單詞的程序代碼。
全文摘要
一種單詞圖案識別系統(tǒng)改進了經鍵盤上速記接口輸入的文本輸入。核心詞典包括一種語言中的常用單詞；擴充詞典包括沒有包括在核心詞典中的單詞。系統(tǒng)僅直接輸出來自核心詞典的單詞。來自擴充詞典的候選單詞可在用戶選擇后被輸出并同時被錄入核心詞典中。拼接模塊使得用戶能夠分開地輸入長單詞的各部分。復合詞模塊組合兩個普通的短單詞，這兩個短單詞的組合形式一個長單詞。
文檔編號G06F3/048GK101292214SQ200680039249
公開日2008年10月22日申請日期2006年10月12日優(yōu)先權日2005年10月22日
發(fā)明者P-O·克里斯藤森, 翟樹民申請人:國際商業(yè)機器公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：翟樹民;Ｐ－Ｏ.克里斯藤森
技術所有人：國際商業(yè)機器公司
我是此專利的發(fā)明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯(lián)網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯(lián)網安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

鍵盤上速記接口中改進的文本輸入的制作方法