用于將輸入文本從第一字符集音譯到第二字符集的技術(shù)的制作方法
【專利摘要】公開了用于進行第一字符集的輸入文本到第二字符集的音譯的計算機實現(xiàn)的技術(shù)。該技術(shù)包括接收輸入文本,以及基于多個映射標準來確定輸入文本的可能音譯的集合。每個映射標準限定第一字符集的字符到第二字符集的字符的映射。該技術(shù)還包括基于可能音譯和文本語料庫來確定目標語言的候選詞的集合。該技術(shù)還包括基于目標語言的語言模型和先前所接收的詞來確定候選詞中的每一個候選詞的似然得分。該技術(shù)還包括基于似然得分來提供一個或更多候選詞,以及接收指示候選詞之一的用戶選擇。
【專利說明】用于將輸入文本從第一字符集音譯到第二字符集的技術(shù)
【技術(shù)領(lǐng)域】
[0001] 本公開涉及用戶設(shè)備,尤其涉及用于進行按第一字符集輸入的文本到第二字符集 的音譯的技術(shù),第二字符集對應于目標語言。
【背景技術(shù)】
[0002] 此處提供的【背景技術(shù)】描述是出于總體呈現(xiàn)本公開的背景的目的。當前署名的發(fā)明 人的達到其在該【背景技術(shù)】部分中被描述的程度的工作以及說明書的并不以其它方式表明 其在提交時作為現(xiàn)有技術(shù)的各個方面既不明示也不暗示被承認為針對本公開的現(xiàn)有技術(shù)。
[0003] 用戶可以經(jīng)由諸如鍵盤的輸入設(shè)備將例如文本的信息輸入到用戶設(shè)備。然而,許 多鍵盤限于單個字符集,例如基于拉丁語的字符集。然而,由于尺寸限制,許多用戶設(shè)備 (例如移動用戶設(shè)備)可以包括限于單個字符集的部分基于QWERTY(標準打字機鍵盤)的 物理鍵盤。附加地或可替代地,用戶設(shè)備可以包括向用戶顯示信息并從用戶接收輸入的觸 摸顯示器,例如電容感測顯示器。例如,這些用戶設(shè)備可以類似于部分基于QWERTY的鍵盤 向用戶顯示字符布局。在許多實例中,輸入設(shè)備(例如諸如鍵盤和顯示的鍵盤)可能僅支 持基于拉丁語的字符。
[0004] 當用戶設(shè)備在全世界范圍由說不同語言的用戶使用時,用戶可能不能夠以對應于 其各自語言的字符集來將文本輸入到用戶設(shè)備。作為響應,用戶開發(fā)了不同的技術(shù)用于將 其各自語言的詞音譯為基于拉丁語的字符。也就是說,用戶可以以基于拉丁語的字符來輸 入文本,以表示與用戶的語言對應的字符,例如將第一字符集中的字符映射到第二集中的 字符。隨著時間推移,這些映射被采納為不同的映射標準。然而,應當理解:將第一字符集 中的字符映射到第二字符集中的字符的不同映射標準可以具有變化和不一致的情況。
【發(fā)明內(nèi)容】
[0005] 通過下文提供的詳細描述本公開適用的其它領(lǐng)域?qū)⒆兊妹黠@。應當理解,詳細描 述和具體示例僅出于說明的目的而并非意在限制本公開的范圍。
[0006] 根據(jù)本公開的一些方面,公開了用于進行輸入文本的音譯的技術(shù)。該技術(shù)可以包 括在具有一個或更多處理器的計算設(shè)備處接收第一字符集的輸入文本,以及在計算設(shè)備處 基于多個映射標準確定所述輸入文本的可能音譯的集合??赡芤糇g的集合中的每個可能音 譯對應于輸入文本到與目標語言對應的第二字符集的音譯。多個映射標準中的每個映射標 準限定第一字符集中的字符到第二字符集中的字符的映射。每個映射標準具有關(guān)聯(lián)的音譯 概率,每個音譯概率指示該音譯概率對應的映射標準適于將輸入文本音譯到第二字符集的 似然度。該技術(shù)還包括基于音譯概率來確定可能音譯中的每個可能音譯的音譯得分,音譯 得分指示該音譯得分對應的可能音譯是輸入文本的準確音譯的似然度。該技術(shù)也包括在計 算設(shè)備處基于可能音譯的集合和目標語言的文本語料庫確定目標語言的候選詞的集合。候 選詞的集合包括文本語料庫中的與可能音譯的集合中的一個可能音譯匹配的詞、與可能音 譯的集合中的一個可能音譯相似的詞以及發(fā)音與可能音譯的集合中的一個可能音譯相似 的詞。該技術(shù)還包括在計算設(shè)備處基于目標語言的語言模型和所接收的一個或更多先前詞 確定候選詞的集合中的每一個候選詞的似然得分,每個似然得分指示相應的候選詞對應于 輸入文本的概率。該技術(shù)也包括基于似然得分從計算設(shè)備提供候選詞的集合中的一個或更 多候選詞,以及接收指示候選詞之一的用戶選擇。該技術(shù)也包括在計算設(shè)備處確定多個映 射標準中所選擇的候選詞所基于的特定映射標準,以及在計算設(shè)備處基于對特定映射標準 的確定來調(diào)整音譯概率。
[0007] 在本公開的另一方面中,公開了用于進行輸入文本的音譯的技術(shù)。該技術(shù)包括在 具有一個或更多處理器的計算設(shè)備處接收第一字符集的輸入文本,以及在計算設(shè)備處基于 多個映射標準確定輸入文本的可能音譯的集合,可能音譯的集合中的每個可能音譯對應于 輸入文本到與目標語言對應的第二字符集的音譯。多個映射標準中的每個映射標準限定第 一字符集中的字符到第二字符集中的字符的映射。該技術(shù)還包括在計算設(shè)備處基于可能音 譯的集合和目標語言的文本語料庫確定目標語言的候選詞的集合,文本語料庫對應于目標 語言的已知詞的集合。該技術(shù)還包括在計算設(shè)備處基于目標語言的語言模型和所接收的一 個或更多先前詞確定候選詞的集合中的每一個候選詞的似然得分,每個似然得分指示相應 的候選詞對應于輸入文本的概率。該技術(shù)也包括基于似然得分從計算設(shè)備向用戶設(shè)備提 供候選詞的集合中的一個或更多候選詞,以及在計算設(shè)備處接收指示候選詞之一的用戶選 擇。
[0008] 在上述技術(shù)的一些實施例中,每個映射標準具有關(guān)聯(lián)的音譯概率,每個音譯概率 指示該音譯概率對應的映射標準適于將輸入文本音譯到第二字符集的似然度。
[0009] 在一些實施例中,上述技術(shù)還包括在計算設(shè)備處基于音譯概率確定可能音譯中的 每個可能音譯的音譯得分,音譯得分指示該音譯得分對應的可能音譯是輸入文本的準確音 譯的似然度。還基于音譯得分提供一個或更多候選詞。
[0010] 在一些實施例中,上述技術(shù)還包括在計算設(shè)備處確定多個映射標準中所選擇的候 選詞所基于的特定映射標準,以及在所述計算設(shè)備處基于對特定映射標準的確定來調(diào)整音 譯概率。
[0011] 在上述技術(shù)的一些實施例中,文本語料庫包括列出目標語言的多個詞的至少一個 詞典。
[0012] 在一些實施例中,上述技術(shù)還包括確定可能音譯中的一個可能音譯與文本語料庫 中的詞中的一個詞之間的相似度,以及基于相似度將該一個詞選擇性地包括在候選詞的集 合中。
[0013] 在上述技術(shù)的一些實施例中,確定候選詞的集合還包括將文本語料庫中發(fā)音與可 能音譯中的一個或更多可能音譯相似的詞包括在候選詞的集合中。
[0014] 在上述技術(shù)的一些實施例中,利用Soundex算法確定發(fā)音與一個或更多可能音譯 相似的詞。
[0015] 在上述技術(shù)的一些實施例中,語言模型是隱馬爾可夫模型。
[0016] 在上述技術(shù)的一些實施例中,用戶設(shè)備是計算設(shè)備。
[0017] 在本公開的另一方面中,公開了用于進行輸入文本的音譯的技術(shù)。該技術(shù)包括: 輸入設(shè)備,其接收指示第一字符集的輸入文本的用戶輸入;以及音譯確定模塊,其被配置為 接收輸入文本并且基于多個映射標準和輸入文本來確定輸入文本的可能音譯的集合??赡?音譯的集合中的每個可能音譯對應于輸入文本到與目標語言對應的第二字符集的音譯。多 個映射標準中的每個映射標準限定第一字符集中的字符到第二字符集中的字符的映射。該 技術(shù)還包括候選詞確定模塊,該候選詞確定模塊被配置為基于可能音譯的集合和目標語言 的文本語料庫來確定目標語言的候選詞的集合,文本語料庫對應于目標語言的已知詞的集 合。該技術(shù)還包括詞選擇模塊,該詞選擇模塊被配置為基于目標語言的語言模型和所接收 的一個或更多先前詞來確定候選詞的集合中的每個候選詞的似然得分,每個似然得分指示 該似然得分對應的候選詞對應于輸入文本的概率。詞選擇模塊還被配置為基于一個或更多 候選詞的似然得分來提供候選詞的集合中的一個或更多候選詞,以及接收指示候選詞之一 的用戶選擇。
[0018] 在上述技術(shù)的一些實施例中,每個映射標準具有關(guān)聯(lián)的音譯概率,每個音譯概率 指示該音譯概率對應的映射標準適于將輸入文本音譯到第二字符集的似然度。
[0019] 在上述技術(shù)的一些實施例中,音譯確定模塊還被配置為基于音譯概率來確定可能 音譯中的每個可能音譯的音譯得分,音譯得分指示該音譯得分對應的可能音譯是輸入文本 的準確音譯的似然度。提供一個或更多候選詞還基于音譯得分。
[0020] 在一些實施例中,所描述的技術(shù)還包括反饋模塊,該反饋模塊被配置為確定多個 映射標準中所選擇的候選詞所基于的特定映射標準,以及基于對特定映射標準的確定來調(diào) 整音譯概率。
[0021] 在上述技術(shù)的一些實施例中,文本語料庫包括列出目標語言的多個詞的至少一個 詞典。
[0022] 在上述技術(shù)的一些實施例中,候選詞確定模塊還被配置為包括確定可能音譯中的 一個可能音譯與文本語料庫中的詞中的一個詞之間的相似度,以及基于相似度將一個詞選 擇性地包括在候選詞的集合中。
[0023] 在上述技術(shù)的一些實施例中,候選詞確定模塊還被配置為將文本語料庫中發(fā)音與 可能音譯中的一個或更多可能音譯相似的詞包括在候選詞的集合中。
[0024] 在上述技術(shù)的一些實施例中,利用Soundex算法來確定發(fā)音與一個或更多可能音 譯相似的詞。
[0025] 在上述技術(shù)的一些實施例中,語言模型是隱馬爾可夫模型。
【專利附圖】
【附圖說明】
[0026] 通過詳細描述和附圖將會更加全面地理解本公開,在附圖中:
[0027] 圖1例示根據(jù)本公開的一些實現(xiàn)的與用戶設(shè)備交互的用戶的示例;
[0028] 圖2是根據(jù)本公開的一些實現(xiàn)的圖1的用戶設(shè)備的功能框圖;
[0029] 圖3是根據(jù)本公開的一些實現(xiàn)的音譯模塊的示例的功能框圖;以及
[0030] 圖4是根據(jù)本公開的一些實現(xiàn)的用于音譯文本輸入的技術(shù)的示例的流程圖。
【具體實施方式】
[0031] 現(xiàn)在參照圖1,示出了用戶設(shè)備100的示例。如圖所示,用戶設(shè)備100可以是具有 輸入設(shè)備104 (例如基于QWERTY的鍵盤或部分基于QWERTY的鍵盤)以及顯示設(shè)備105 (例 如監(jiān)視器)的非便攜式計算設(shè)備。然而,用戶設(shè)備100還可以是可以包括觸摸顯示器104 或部分基于QWERTY的鍵盤布局的移動用戶設(shè)備,諸如移動電話、膝上型計算機或平板計算 機。顯示設(shè)備105可以向用戶顯示信息,并且輸入設(shè)備104可以從用戶接收輸入。例如,用 戶可以通過在輸入設(shè)備104上打字而將信息輸入到用戶設(shè)備100。
[0032] 諸如圖1的用戶設(shè)備100的用戶設(shè)備能夠普遍購買到,并且因此可以在全世界的 許多不同國家中使用。因此,用戶設(shè)備可以被配置為以各種不同的語言和不同的字符集向 用戶顯示信息。輸入法編輯器(或稱IME)是使得用戶能夠?qū)⒉煌恼Z言輸入到用戶設(shè)備的 軟件應用。許多語言具有基于拉丁字母表的書寫系統(tǒng),例如英語、西班牙語和法語。然而, 存在具有基于不同字母表的書寫系統(tǒng)的許多其它語言。例如,俄語、保加利亞語、烏克蘭語 和波蘭語用西里爾文來書寫。此外,諸如阿拉伯語、希伯來語、烏爾都語的語言用相應的字 母表來書寫。此外,諸如漢語的一些語言可以用基于非字母表的字符來書寫。
[0033] 用戶設(shè)備100的許多輸入設(shè)備104可以被配置為接收用戶輸入的基于拉丁語字母 表的輸入。例如,許多基于QWERTY的鍵盤僅基于拉丁語。如應當理解的,用戶可能希望以 不利用基于拉丁語的字母表或具有對基于拉丁語的字母表進行擴展的字符的語言(例如 越南語)來提供文本。為此,頂E可以被配置為進行以第一字符集提供的輸入文本到第二 字符集的輸出文本的音譯,第二字符集對應于輸出文本的目標語言。例如,用戶可以以基于 拉丁語的字母表來提供俄語詞的語音拼寫,并且ME可以將輸入文本音譯為以西里爾字母 表顯不的輸出文本。
[0034] 為了進行音譯,IME可以利用一個或更多映射標準來將輸入文本從例如基于拉丁 語的第一字符集變換到第二字符集,第二字符集例如是西里爾文、希伯來語、阿拉伯語或漢 語。映射標準可以是限定從第一字符集中的字符到第二集中的字符的映射的音譯表。此外, 可以存在限定從第一字符集中的字符到第二字符集中的字符的映射的多于一個映射標準。 例如,存在至少四個不同的映射標準用于將基于拉丁語的字符音譯為西里爾文字符。這些 映射標準包括國會圖書館標準、地名委員會標準、13652-78標準以及16876-71標準。僅作 為示例,將這些映射標準提供于下文的表I中。
[0035] 表 I
[0036]
【權(quán)利要求】
1. 一種計算機實現(xiàn)的方法,包括: 在具有一個或更多處理器的計算設(shè)備處接收第一字符集的輸入文本; 在所述計算設(shè)備處基于多個映射標準確定所述輸入文本的可能音譯的集合,所述可能 音譯的集合中的每個可能音譯對應于所述輸入文本到與目標語言對應的第二字符集的音 譯,所述多個映射標準中的每個映射標準限定所述第一字符集的字符到所述第二字符集的 字符的映射,并且每個映射標準具有關(guān)聯(lián)的音譯概率,每個音譯概率指示所述音譯概率對 應的映射標準適于將所述輸入文本音譯到所述第二字符集的似然度; 基于所述音譯概率來確定所述可能音譯中的每個可能音譯的音譯得分,所述音譯得分 指示所述音譯得分對應的可能音譯是所述輸入文本的準確音譯的似然度; 在所述計算設(shè)備處基于所述可能音譯的集合和所述目標語言的文本語料庫確定所述 目標語言的候選詞的集合,其中,所述候選詞的集合包括所述文本語料庫中的與所述可能 音譯的集合中的一個可能音譯匹配的詞、與所述可能音譯的集合中的一個可能音譯相似的 詞以及發(fā)音與所述可能音譯的集合中的一個可能音譯相似的詞; 在所述計算設(shè)備處基于所述目標語言的語言模型和所接收的一個或更多先前詞確定 所述候選詞的集合中的每一個候選詞的似然得分,每個似然得分指示相應的候選詞對應于 所述輸入文本的概率; 基于所述似然得分從所述計算設(shè)備提供所述候選詞的集合中的一個或更多候選詞; 接收指示所述候選詞之一的用戶選擇; 在所述計算設(shè)備處確定所述多個映射標準中所選擇的候選詞所基于的特定映射標準; 以及 在所述計算設(shè)備處基于對所述特定映射標準的所述確定來調(diào)整所述音譯概率。
2. -種計算機實現(xiàn)的方法,包括: 在具有一個或更多處理器的計算設(shè)備處接收第一字符集的輸入文本; 在所述計算設(shè)備處基于多個映射標準確定所述輸入文本的可能音譯的集合,所述可能 音譯的集合中的每個可能音譯對應于所述輸入文本到與目標語言對應的第二字符集的音 譯,所述多個映射標準中的每個映射標準限定所述第一字符集中的字符到所述第二字符集 中的字符的映射; 在所述計算設(shè)備處基于所述可能音譯的集合和所述目標語言的文本語料庫確定所述 目標語言的候選詞的集合,所述文本語料庫對應于所述目標語言的已知詞的集合; 在所述計算設(shè)備處基于所述目標語言的語言模型和所接收的一個或更多先前詞確定 所述候選詞的集合中的每一個候選詞的似然得分,每個似然得分指示相應的候選詞對應于 所述輸入文本的概率; 基于所述似然得分從所述計算設(shè)備向用戶設(shè)備提供所述候選詞的集合中的一個或更 多候選詞;以及 在所述計算設(shè)備處接收指示所述候選詞之一的用戶選擇。
3. 根據(jù)權(quán)利要求2所述的計算機實現(xiàn)的方法,其中,每個映射標準具有關(guān)聯(lián)的音譯概 率,每個音譯概率指示所述音譯概率對應的映射標準適于將所述輸入文本音譯到所述第二 字符集的似然度。
4. 根據(jù)權(quán)利要求3所述的計算機實現(xiàn)的方法,還包括: 在所述計算設(shè)備處基于所述音譯概率確定所述可能音譯中的每個可能音譯的音譯得 分,所述音譯得分指示所述音譯得分對應的可能音譯是所述輸入文本的準確音譯的似然 度,其中,提供所述一個或更多候選詞還基于所述音譯得分。
5. 根據(jù)權(quán)利要求4所述的計算機實現(xiàn)的方法,還包括: 在所述計算設(shè)備處確定所述多個映射標準中所選擇的候選詞所基于的特定映射標準; 以及 在所述計算設(shè)備處基于對所述特定映射標準的所述確定來調(diào)整所述音譯概率。
6. 根據(jù)權(quán)利要求2所述的計算機實現(xiàn)的方法,其中,所述文本語料庫包括列出所述目 標語言的多個詞的至少一個詞典。
7. 根據(jù)權(quán)利要求6所述的計算機實現(xiàn)的方法,還包括:確定所述可能音譯中的一個可 能音譯與所述文本語料庫中的所述詞中的一個詞之間的相似度,以及基于所述相似度將所 述一個詞選擇性地包括在所述候選詞的集合中。
8. 根據(jù)權(quán)利要求2所述的計算機實現(xiàn)的方法,其中,確定所述候選詞的集合還包括:將 所述文本語料庫中發(fā)音與所述可能音譯中的一個或更多可能音譯相似的詞包括在所述候 選詞的集合中。
9. 根據(jù)權(quán)利要求9所述的計算機實現(xiàn)的方法,其中,利用Soundex算法確定來發(fā)音與一 個或更多可能音譯相似的所述詞。
10. 根據(jù)權(quán)利要求2所述的計算機實現(xiàn)的方法,其中,所述語言模型是隱馬爾可夫模 型。
11. 根據(jù)權(quán)利要求2所述的計算機實現(xiàn)的方法,其中,所述用戶設(shè)備是所述計算設(shè)備。
12. -種計算設(shè)備,包括: 輸入設(shè)備,其接收指示第一字符集的輸入文本的用戶輸入; 音譯確定模塊,其被配置為接收所述輸入文本,并且基于多個映射標準和所述輸入文 本來確定所述輸入文本的可能音譯的集合,所述可能音譯的集合中的每個可能音譯對應于 所述輸入文本到與目標語言對應的第二字符集的音譯,所述多個映射標準中的每個映射標 準限定所述第一字符集的字符到所述第二字符集的字符的映射; 候選詞確定模塊,其被配置為基于所述可能音譯的集合和所述目標語言的文本語料庫 來確定所述目標語言的候選詞的集合,所述文本語料庫對應于所述目標語言的已知詞的集 合;以及 詞選擇模塊,其被配置為: a) 基于所述目標語言的語言模型和所接收的一個或更多先前詞來確定所述候選詞的 集合中的每個候選詞的似然得分,每個似然得分指示所述似然得分對應的候選詞對應于所 述輸入文本的概率, b) 基于所述一個或更多候選詞的所述似然得分來提供所述候選詞的集合中的一個或 更多候選詞,以及 c) 接收指示所述候選詞之一的用戶選擇。
13. 根據(jù)權(quán)利要求12所述的計算設(shè)備,其中,每個映射標準具有關(guān)聯(lián)的音譯概率,每個 音譯概率指示所述音譯概率對應的映射標準適于將所述輸入文本音譯到所述第二字符集 的似然度。
14. 根據(jù)權(quán)利要求13所述的計算設(shè)備,其中,所述音譯確定模塊還被配置為基于所述 音譯概率來確定所述可能音譯中的每個可能音譯的音譯得分,所述音譯得分指示所述音譯 得分對應的可能音譯是所述輸入文本的準確音譯的似然度,其中,還基于所述音譯得分來 提供所述一個或更多候選詞。
15. 根據(jù)權(quán)利要求14所述的計算設(shè)備,還包括反饋模塊,所述反饋模塊被配置為: 確定所述多個映射標準中所選擇的候選詞所基于的特定映射標準;以及 基于對所述特定映射標準的所述確定來調(diào)整所述音譯概率。
16. 根據(jù)權(quán)利要求12所述的計算設(shè)備,其中,所述文本語料庫包括列出所述目標語言 的多個詞的至少一個詞典。
17. 根據(jù)權(quán)利要求16所述的計算設(shè)備,其中,所述候選詞確定模塊還被配置為確定所 述可能音譯中的一個可能音譯與所述文本語料庫中的所述詞中的一個詞之間的相似度,以 及基于所述相似度來選擇性地包括所述一個詞。
18. 根據(jù)權(quán)利要求12所述的計算設(shè)備,其中,所述候選詞確定模塊還被配置為包括所 述文本語料庫中發(fā)音與所述可能音譯中的一個或更多可能音譯相似的詞。
19. 根據(jù)權(quán)利要求19所述的計算設(shè)備,其中,所述候選詞確定模塊基于Soundex算法來 確定發(fā)音與一個或更多可能音譯相似的所述詞。
20. 根據(jù)權(quán)利要求12所述的計算設(shè)備,其中,所述語言模型是隱馬爾可夫模型。
【文檔編號】G06F17/30GK104272223SQ201280072741
【公開日】2015年1月7日 申請日期:2012年2月28日 優(yōu)先權(quán)日:2012年2月28日
【發(fā)明者】楊帆, 基里爾·布里亞克, 袁鋒, 廖寶華 申請人:谷歌公司