604包括如上關于圖1所述的ME應用102和自適應語言模型構建器108。存儲器604還可包括一個或多個其他模塊616,如操作系統(tǒng)、驅動器、應用軟件、通信軟件等等。存儲器604還可包括其他數據618,如在執(zhí)行上述功能時存儲的數據以及其他模塊616所使用的數據。存儲器604還可以包括這里描述或提及的其他數據和數據結構。例如,存儲器604可包括在導出和生成如上所述的瀏覽歷史語言模型104的過程中使用的信息。
[0070]此處所描述的示例系統(tǒng)和計算設備僅是適用于某些實現(xiàn)的示例,并且不旨在對可實現(xiàn)此處所描述的過程、組件和特征的環(huán)境、體系結構和框架的使用范圍或功能提出任何限制。因此,此處的實現(xiàn)可用于眾多環(huán)境或體系結構,并且可以在通用或專用計算系統(tǒng)或具有處理能力的其他設備中實現(xiàn)。一般而言,參考附圖描述的任何功能都可使用軟件、硬件(例如,固定邏輯電路)或這些實現(xiàn)的組合來實現(xiàn)。此處所使用的術語“模塊”、“機制”、或“組件”一般表示可被配置成實現(xiàn)規(guī)定功能的軟件、硬件或軟件和硬件的組合。例如,在軟件實現(xiàn)的情況下,術語“模塊”、“機制”或“組件”可表示當在一個或多個處理設備(例如,CPU或處理器)上執(zhí)行時執(zhí)行指定任務或操作的程序代碼(和/或聲明型指令)。程序代碼可被存儲在一個或多個計算機可讀存儲器設備或其他計算機存儲設備中。由此,此處所描述的過程、組件和模塊可由計算機程序產品來實現(xiàn)。
[0071]雖然在圖6中被示為存儲在計算設備600的存儲器604中,但ME應用102以及自適應語言模型構建器108或其各部分可以使用可由計算設備600訪問的任何形式的計算機可讀介質來實現(xiàn)。如此處所使用的,“計算機可讀介質”包括至少兩種類型的計算機可讀介質,即計算機存儲介質和通信介質。
[0072]計算機存儲介質包括以存儲如計算機可讀指令、數據結構、程序模塊或其他數據等信息的任何方法或技術實現(xiàn)的易失性和非易失性、可移動和不可移動介質。計算機存儲介質包括但不限于,RAM、ROM、EEPROM、閃存或其他存儲器技術、CD-ROM、數字多功能盤(DVD)或其他光存儲、磁帶盒、磁帶、磁盤存儲或其他磁存儲設備,或者可用于存儲信息以供計算設備訪問的任何其他非傳輸介質。
[0073]相反,通信介質可在諸如載波之類的已調制數據信號或其他傳輸機制中體現(xiàn)計算機可讀指令、數據結構、程序模塊或其他數據。如本文所定義的,計算機存儲介質不包括通信介質。
[0074]此外,本發(fā)明提供了如在附圖中描述和示出的各種示例實現(xiàn)。然而,本公開并不局限于此處所描述和示出的實現(xiàn),如本領域的技術人員所知道的那樣,可延伸至其它實現(xiàn)。在說明書中所引用的“一個實現(xiàn)”、“這個實現(xiàn)”、“這些實現(xiàn)”或“一些實現(xiàn)”意味著所描述的特定特征、結構或特性被包括在至少一個實現(xiàn)中,且在說明書中的各個位置中的這些短語的出現(xiàn)并不需要全部都引用同一實現(xiàn)。
[0075]結語
[0076]盡管用結構特征和/或方法動作專用的語言描述了本主題,但所附權利要求書中定義的主題不限于上述具體特征或動作。相反,上述具體特征和動作是作為實現(xiàn)權利要求的示例形式公開的。本發(fā)明旨在覆蓋所公開的實現(xiàn)的任一和所有改編或變型,并且所附權利要求書不應被解釋為限于說明書中所公開的具體實現(xiàn)。相反,本文的范圍完全由所附權利要求書以及這些權利要求所授權的等效技術方案的完整范圍來確定。
【主權項】
1.一種方法,包括: 基于瀏覽歷史信息生成瀏覽歷史語言模型;以及 響應于經由輸入法編輯器界面接收到拉丁文字符串,至少部分地基于所述瀏覽歷史語言模型來預測非拉丁文字符串。
2.如權利要求1所述的方法,其特征在于,所述瀏覽歷史信息至少包括高速緩存的瀏覽內容。
3.如權利要求2所述的方法,其特征在于,所述瀏覽歷史信息進一步包括實時瀏覽內容。
4.如權利要求1所述的方法,其特征在于,所預測的非拉丁文字符串基于所述瀏覽歷史語言模型和通用語言模型來確定。
5.如權利要求4所述的方法,其特征在于,所述瀏覽歷史語言模型的貢獻基于加權因子確定。
6.如權利要求5所述的方法,其特征在于,所述加權因子包括默認加權因子或用戶定義的加權因子。
7.如權利要求1所述的方法,其特征在于,進一步包括經由所述輸入法編輯器界面呈現(xiàn)所預測的非拉丁文字符串。
8.如權利要求1所述的方法,其特征在于: 所述拉丁文字符串包括拼音字符串;以及 所預測的非拉丁文字符串包括中文字符串。
9.如權利要求1所述的方法,其特征在于: 多個非拉丁文字符串與經由所述輸入法編輯器界面接收到的拉丁文字符串相關聯(lián);以及 轉換概率與所述多個非拉丁文字符串中的每個非拉丁文字符串相關聯(lián)。
10.如權利要求9所述的方法,其特征在于,預測所述非拉丁文字符串包括標識所述多個非拉丁文字符串中具有最高轉換概率的所述非拉丁文字符串。
11.如權利要求10所述的方法,其特征在于,通用語言模型將所述多個非拉丁文字符串中的第一非拉丁文字符串標識為具有所述最高轉換概率的所述非拉丁文字符串。
12.如權利要求11所述的方法,其特征在于,所述瀏覽歷史語言模型將所述多個非拉丁文字符串中的第二非拉丁文字符串標識為具有所述最高轉換概率的所述非拉丁文字符串O
13.如權利要求12所述的方法,其特征在于,由所述通用語言模型標識的所述第一非拉丁文字符串不同于由所述瀏覽歷史語言模型標識的所述第二非拉丁文字符串。
14.如權利要求1所述的方法,其特征在于,所述瀏覽歷史語言模型包括N-gram統(tǒng)計語言模型。
15.一種計算系統(tǒng),包括: 一個或多個處理器; 一個或多個存儲指令的計算機可讀介質,當所述指令被一個或多個處理器執(zhí)行時,致使所述一個或多個處理器以執(zhí)行包括以下的動作: 基于瀏覽歷史信息生成瀏覽歷史語言模型;以及 響應于經由輸入法編輯器界面接收到拉丁文字符串,至少部分地基于所述瀏覽歷史語言模型來預測非拉丁文字符串。
16.如權利要求15所述的計算系統(tǒng),其特征在于,所述動作還包括: 檢測新的瀏覽內容;以及 響應于檢測到新的瀏覽內容,處理所述新的瀏覽內容以更新所述瀏覽歷史語言模型。
17.如權利要求15所述的計算系統(tǒng),其特征在于,所述動作還包括: 周期性地監(jiān)視一個或多個瀏覽器高速緩存位置以確定新的瀏覽內容是否已經被保存到所述一個或多個瀏覽器高速緩存位置;以及 處理所述新的瀏覽內容以更新所述瀏覽歷史語言模型。
18.—個或多個維護指令的計算機可讀介質,當所述指令被一個或多個處理器執(zhí)行時,配置所述一個或多個處理器以執(zhí)行包括以下的動作: 基于瀏覽歷史信息生成瀏覽歷史語言模型;以及 響應于經由輸入法編輯器界面接收到拉丁文字符串: 基于在通用語言模型的基礎上確定的第一轉換概率和在所述瀏覽歷史語言模型的基礎上確定的第二轉換概率來確定多個非拉丁文字符串中每個非拉丁文字符串的總轉換概率,其中所述第二轉換概率對所述總轉換概率的貢獻基于加權因子加權; 基于所述總轉換概率對所述多個非拉丁文字符串排序;以及 經由所述輸入法編輯器界面顯示非拉丁文字符串的經排序的列表。
19.如權利要求18所述的一個或多個種計算機可讀介質,其特征在于,所述動作進一步包括: 接收用戶定義的加權因子;以及 將所述加權因子從默認加權因子修改成所述用戶定義的加權因子。
20.如權利要求18所述的一個或多個計算機可執(zhí)行指令,其特征在于,所述瀏覽歷史信息包括存儲在多個瀏覽器高速緩存位置處的信息,每個瀏覽器高速緩存位置與不同的瀏覽器相關聯(lián)。
【專利摘要】一些示例可以包括基于瀏覽歷史信息生成瀏覽歷史語言模型。此外,一些實現(xiàn)可以包括諸如響應于經由輸入法編輯器界面接收到拉丁文字符串,至少部分地基于瀏覽歷史語言模型來預測并呈現(xiàn)非拉丁文字符串。
【IPC分類】G06F3-01
【公開號】CN104813257
【申請?zhí)枴緾N201280075563
【發(fā)明人】M·李, X·陳
【申請人】微軟技術許可有限責任公司
【公開日】2015年7月29日
【申請日】2012年8月31日
【公告號】EP2891036A1, EP2891036A4, WO2014032265A1