亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

確定熱詞適合度的制作方法

文檔序號:8269905閱讀:635來源:國知局
確定熱詞適合度的制作方法
【專利說明】確定熱詞適合度
[0001]相關申請的交叉引用
[0002]本申請要求于2012年7月3日提交的美國臨時專利申請第61/667,817號以及于2012年8月6日提交的美國專利申請第13/567,572號的權益,這兩個申請的通過引用全文結合于此。
技術領域
[0003]本說明書涉及熱詞適合度的確定。
【背景技術】
[0004]熱詞有時也被稱作“關注詞”或“喚醒詞”,其為用戶提供了與支持語音的計算設備開始交互的免提方式。當該計算設備檢測到用戶講出熱詞時,該設備進入接收進一步的用戶命令的準備狀態(tài)。設備制造商和軟件開發(fā)商通常提供供用戶采用以便與其設備或軟件應用進行交互的預定熱詞。

【發(fā)明內容】

[0005]根據該說明書中所描述的主題的一個創(chuàng)新方面,移動設備的用戶可以定義其自己的熱詞以便由移動設備使用。候選熱詞能夠被評估以例如確定該候選熱詞是否容易被設備與另一個詞進行混淆,或者該候選熱詞是否不適合作為熱詞使用。該評估結果被顯示給用戶,用戶隨后可以確認其是否想要指定該候選熱詞作為熱詞,或者提交不同的候選熱詞進行評估。
[0006]作為該說明書中所描述的主題的另一個創(chuàng)新方面,一種過程包括:接收對用戶所講出的候選熱詞進行編碼的語音數據;使用一種或多種預定準則對該語音數據或者候選熱詞的轉錄進行評估;使用一種或多種預定準則,基于對該語音數據或該候選熱詞的轉錄的評估而針對該候選熱詞生成熱詞適合度分數;以及提供該熱詞適合度分數的表示以便向用戶顯示。
[0007]這些方面的其它實施例包括相應的系統(tǒng)、裝置以及在計算機存儲設備上編碼的計算機程序,其被配置為執(zhí)行該方法的操作。
[0008]這些和其它實施例可選地均可以包括以下一個或多個特征。例如,該熱詞適合度分數反映候選熱詞作為熱詞使用的適合度;熱詞是用于喚醒設備的關鍵詞或關鍵短語;熱詞是用于解鎖設備的關鍵詞或關鍵短語;熱詞是語音密碼;該語音數據從用戶所操作的移動設備進行接收;生成熱詞適合度分數包括使用兩個或更多預定準則,基于對該語音數據或者該候選熱詞的轉錄的評估而針對該預定準則中的每一個預定準則生成特征分數,對該特征分數進行匯總,并且輸出經匯總的特征分數以作為熱詞適合度分數;評估該語音數據或候選熱詞的轉錄包括以幀為單位確定該語音數據的詞長度,其中較長的詞長度與較高的熱詞適合度分數相關聯;評估該語音數據或候選熱詞的轉錄包括確定與候選熱詞相關聯的音節(jié)或音素的數量,其中較大的音節(jié)或音素的數量與較高的熱詞適合度分數相關聯;評估該語音數據或候選熱詞的轉錄包括確定該候選熱詞的轉錄和與該候選熱詞共享相同語言的一個或多個其它詞之間的編輯距離,其中較小的編輯距離與較低的熱詞適合度分數相關聯;評估該語音數據或候選熱詞的轉錄包括確定針對該候選熱詞規(guī)定的發(fā)音的數量,其中較少的發(fā)音的數量與較高的熱詞適合度分數相關聯;評估該語音數據或候選熱詞的轉錄包括確定在該候選熱詞的轉錄中出現一個或多個特定音素;特定音素在該轉錄中的出現與較高的熱詞適合度分數相關聯;特定音素在該轉錄中的出現與較低的熱詞適合度分數相關聯;評估該語音數據或候選熱詞的轉錄包括確定語音識別器可用的熱詞的訓練示例的數量,其中較小的訓練示例的數量與較低的熱詞適合度分數相關聯;評估該語音數據或候選熱詞的轉錄包括確定該候選熱詞的發(fā)音在用戶對該候選熱詞的多次表達中發(fā)生變化的程度,其中較大的程度與較低的熱詞適合度分數相關聯;熱詞適合度分數的表示包括指示候選熱詞適合作為熱詞的數據;熱詞適合度分數的表示包括指示候選熱詞已經被接受作為熱詞的數據;熱詞適合度分數的表示包括熱詞適合度分數的經色彩編碼的表示;和/或熱詞適合度分數的表示包括條(bar)、量計(gauge)或儀表。
[0009]有利的實施方式可以包括以下一個或多個特征。在對熱詞進行評估時可以考慮與候選熱詞以及特定講話者(例如,設備用戶)相關的準則??梢詫Ω鞣N熱詞適合度準則進行計分并匯總,這確保了每個準則都被加以考慮,并且特定準則在熱詞評估過程期間不會占據主導。設備用戶可以在為其設備選擇熱詞時接收熱詞適合度分數以便做出知情決策。使用適當熱詞可以改進設備執(zhí)行熱詞檢測的能力,因此改善設備性能和用戶體驗。此外,使用適當熱詞可以限制出現“錯誤肯定”的熱詞檢測而錯誤地激活設備的可能性,因此節(jié)省了設備資源。
[0010]附圖和以下的描述中給出了一種或多種實施方式的細節(jié)。其它可能的特征和優(yōu)勢將由于描述、附圖和權利要求變得顯而易見。
【附圖說明】
[0011]圖1和2是可以確定所講出的熱詞的適合度的示例系統(tǒng)的示圖。
[0012]圖3是圖示用于確定所講出的關鍵詞并且用于提供適合度的表示的示例處理的流程圖。
[0013]圖4示出了一般計算機設備和一般移動計算機設備的示例。
[0014]各圖中同樣的附圖標記和標注指示同樣的元素。
【具體實施方式】
[0015]圖1是可以確定所講出的熱詞的適合度的示例系統(tǒng)100的示圖。圖1還圖示了以階段㈧至⑶所示的示例數據流。階段㈧至⑶可以以所圖示的順序進行,或者它們可以以與所圖示的順序不同的順序進行。
[0016]通常,熱詞適合度可以由系統(tǒng)100作為熱詞指定處理的一部分來確定。熱詞可以包括用戶所講出的用于與靜態(tài)、便攜式或移動計算設備進行交互或者對它們進行控制的關鍵詞或關鍵短語。例如,熱詞可以由用戶講出以發(fā)起與計算設備的通信,這通常將設備置于其可以接收另外的語音命令的狀態(tài)。例如,在檢測到所講出的熱詞時,計算設備可以執(zhí)行各種操作,包括激活(即,從休眠或空閑狀態(tài)“喚醒”)、解鎖、開啟設備應用(例如,搜索應用、地圖應用等)、加載優(yōu)選用戶設置和/或其它適當操作。
[0017]設備用戶可能想要選擇特定的詞或短語來用作其計算設備的熱詞。例如,對個人具有意義的詞或短語可以用來對設備進行定制,可以以幽默的方式對設備進行個性化,并且與設備制造商所提供的詞或短語相比用戶更易于記住或發(fā)音。此外,用戶所選擇的熱詞可以提供安全措施,特別是用作密碼。然而,一些詞或短語與其它詞或短語相比可能更容易被計算設備所檢測,并且因此可以用作更好的熱詞。如以下示例中所描述的,熱詞的可檢測性取決于與特定詞或短語相關并且與特定講話者相關的各種因素,諸如詞或短語的長度、詞或短語中所包括的音節(jié)或語音的數量、特定語音的出現、詞或短語被識別的發(fā)音的數量、講話者所講出的詞或短語發(fā)音的變化、來自各個其它講話者的詞或短語的訓練示例的可用性以及所講出的詞或短語與共享語言的其它詞或短語之間的編輯距離。每種準則可以進行打分、匯總并且向用戶輸出,因此提供候選熱詞的適合度的整體指示。例如,基于熱詞適合度分數,用戶可以在為其設備選擇熱詞時做出知情決策。
[0018]更為詳細地,系統(tǒng)100包括計算設備102 (這里在各個操作階段被示為計算設備102a、102b和102c),其能夠呈現界面104 (這里在各個操作階段被示為界面104a、104b和104c)以便向用戶顯示。計算設備102包括一個或多個處理器,其被配置為執(zhí)行由計算機可讀介質所存儲的用于執(zhí)行諸如輸入/輸出、通信、數據處理等的各種設備操作的指令。例如,計算設備102可以包括一個或多個客戶端計算設備(例如,臺式計算機、膝上型計算機、筆記本計算機、導航系統(tǒng)、智能電話和或者其它適當計算設備)和/或可以包括一個或多個服務器(例如,后端服務器集群)。例如,客戶端計算設備所接收的輸入可以在本地進行處理,或者可以被提供至后端系統(tǒng)(例如,云端)以便進行處理。作為另一個示例,該處理可以在一個或多個客戶端計算設備(例如,處于端對端配置)和/或服務器之間進行分布。
[0019]參考示例數據流,在階段(A),提示用戶講出或鍵入候選熱詞。例如,計算設備102 (這里被示為102a)可以經由界面104(這里被示為界面104a)向用戶提供指令消息“請講出您所期望的熱詞”。在當前示例中,用戶表達出候選熱詞“pizza”并且計算設備102基于該表達捕獲、編碼和/或生成語音數據110。
[0020]該語音數據110例如可以包括音頻源數據112 (例如,音頻流、數字采樣的音頻文件或者另一種適當的數據格式)、相對應的音素(Phone)集合114(即,說話聲),以及可選地包括轉錄116。例如,為了識別音素集合114(例如,在用戶表達的“pizza”中所檢測到的語音聲音),計算設備102和/或后端計算設備能夠對音頻源數據112中所包括的聲信號進行分析,并且能夠基于該分析來計算聲音特征并對其進行分類。另外,為了生成轉錄116 (例如,所轉錄的詞“pizza” ),計算設備102和/或后端計算設備能夠使用語音識別技術(例如,隱馬爾科夫模型、神經網絡或其它適當技術)將音素集合114與詞或短語相關聯。例如,在捕獲、編碼和/或生成語音數據110時,該數據可以被提供至一個或多個熱詞強度評估引擎120。
[0021]在階段(B)期間,對語音數據進行處理和評估。在當前示例中,熱詞強度評估引擎120可以處理并評估語音數據110。熱詞強度評估引擎120例如可以包括被配置為對語音數據進行處理和評估的一個或多個硬件和/或軟件組件(例如,模塊、對象、庫等),并且可以由計算設備102和/或其它相關聯的設備(例如,后端服務器、對等設備等)的一個或多個處理器執(zhí)行。
[0022]通常,可以使用各種準則來評估語音數據。例如,每種準則可以與不同的熱詞強度評估引擎相關聯,后者進而可以基于特定準則產生特征分數。每個不同的熱詞強度評估引擎例如可以評估音頻源數據、所得出的音素集合、轉錄和/或與候選熱詞相關聯的其它適當語音數據。此外,在一些實施方式中,可以對訓練示例(與講話者和/或其它講話者所講出的候選熱詞的過去表達相關聯的語音數據)進行評估。例如,訓練示例可以由訓練示例數據存儲庫122進行維護。訓練示例數據存儲庫122能夠
當前第1頁1 2 3 4 5 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1