用于一種語言識別設(shè)備的訓練或適配方法

文檔序號：2825069閱讀：271來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于一種語言識別設(shè)備的訓練或適配方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種用于一種用于遵照一個電子設(shè)備的功能行事的語音識別設(shè)備的訓練或適配方法。
背景技術(shù)：
特別地，該電器設(shè)備是一個移動電話，其中語音撥號的性能與所實現(xiàn)的設(shè)備功能相一致，其中通過一個語音輸入另一個用戶被撥叫。當用在一個機動車輛中時在其中通常提供免提裝置以進一步輔助用戶，因為他不再執(zhí)行鍵盤輸入以觸發(fā)對另一個用戶的撥叫，用戶的操作舒適性被改進。應(yīng)用的其它領(lǐng)域包括諸如電視接收機，錄像機，高保真音樂系統(tǒng)廚房設(shè)備或具有語音控制的其它設(shè)備的電子用戶設(shè)備的控制，其中各種設(shè)備功能能夠通過語音執(zhí)行，例如音量控制，電視頻道或無線電臺的選擇，或廚房設(shè)備的發(fā)動機轉(zhuǎn)速的調(diào)整。
一種語音識別設(shè)備能夠被訓練和/或適配，這樣聲音模型和相關(guān)的參數(shù)適合于新的詞句、用戶，并且如果必要的話，適合于周圍的噪聲和有關(guān)的麥克風位置。在這里，新入口被加到含有由聲音模型表示的語音識別設(shè)備詞匯的語音識別設(shè)備詞典，或者已經(jīng)存在的詞匯入口被適配。在使用隱藏的馬爾可夫模型(HMM)的語音識別設(shè)備中，隱藏的馬爾可夫模型的蛻變概率和輸出分布被調(diào)整。
在訓練期間，語音識別設(shè)備適應(yīng)于一個還沒有操作過該設(shè)備的用戶的語音輸入。這能由一個用戶在該語音識別設(shè)備的第一次使用之前或者甚至更遲的在語音輸入未被觸發(fā)的第一次使用之后發(fā)生。利用以前的語音數(shù)據(jù)實行重新訓練也是有可能的。訓練性能的不同變量是已知的，其中，例如，分布混合的估計是在固定的HMM拓撲結(jié)構(gòu)中或者同樣該數(shù)量的一個變更或者HMM狀態(tài)的轉(zhuǎn)換中發(fā)生的。
在語音識別設(shè)備的一個適配中，語音識別設(shè)備的預(yù)置參數(shù)被適配并被最佳化，其中在由一個用戶完成的訓練中該參數(shù)被預(yù)置或者以已經(jīng)執(zhí)行的適配處理為基礎(chǔ)應(yīng)用到那里；然而該參數(shù)也能夠與用戶無關(guān)地被預(yù)置。在于該用戶的聲音適配中，一個系統(tǒng)通過收集這個用戶的特殊語音數(shù)據(jù)被改進，也就是在適配期間的誤差率將降低。許多種適配方法是已知的，例如MAP(最大后驗法)，MLLR(最大似然線性回歸)，專用聲音(這種方法目前只用在復(fù)雜的結(jié)構(gòu)系統(tǒng)中)。同樣除聲音適配之外的適配形式是可能的；因此系統(tǒng)性能和這些數(shù)據(jù)的分析的改進能被實現(xiàn)，例如通過建立使用率統(tǒng)計(例如通過估計多久一條指令或電話號碼被講一次，并且結(jié)合它們所講的內(nèi)容)。
US5,805,672公開了通過具有一個語音識別設(shè)備的輔助設(shè)備實現(xiàn)在機動車輛中移動電話設(shè)備的語音撥號功能的設(shè)備。當在機動車輛中使用時，一個免提裝置被使用。如果需要語音撥號，則語音撥號模式必須首先被激活。該輔助設(shè)備然后通過語音識別設(shè)備識別在語音輸入中已學過的單詞，并給一個已識別的單詞指定一個相關(guān)的電話號碼，然后用戶相關(guān)的發(fā)音被自動地撥叫。一種訓練模式被提供，通過它的激活，被訓練的語音識別設(shè)備能夠被訓練。這個訓練模式由壓下按鍵而被激活。在訓練期間，用戶被要求說出一個名字兩次并輸入相關(guān)的電話號碼。接著用戶按下一個確定鍵，在此之后該系統(tǒng)通過語音輸出向該用戶輸出該語音識別結(jié)果(識別的名字)和相關(guān)的電話號碼。該用戶能夠繼續(xù)另一個名字的訓練。
WO00/14729公開了一種具有語音識別設(shè)備和語音撥號功能的移動電話。在這里也提供一種由開關(guān)操作起動的訓練模式。在該訓練模式期間，一個普通的訓練操作被執(zhí)行，其中通過新單詞的輸入擴展語音識別設(shè)備的詞匯。

發(fā)明內(nèi)容
本發(fā)明是基于設(shè)計該語音識別設(shè)備的訓練和/或適配以便增加用戶舒適性這個目的的。
這個目的用最初描述的方法通過下列步驟實現(xiàn)-執(zhí)行語音輸入；-通過語音識別設(shè)備處理該語音輸入以便產(chǎn)生一個語音識別結(jié)果；-如果該語音識別能被指配為該電子設(shè)備的一個功能，則完成該電子設(shè)備的指定功能；-如果對電子設(shè)備的指配功能的動作沒有導(dǎo)致一個用戶引起拒絕，則以與完成的語音輸入相關(guān)連的語音識別結(jié)果為基礎(chǔ)來訓練或適應(yīng)該語音識別設(shè)備。
依靠根據(jù)本發(fā)明的的方法訓練或適配不需要任何訓練或適配模式的起動。甚至在訓練或適應(yīng)使用之前用戶輸入的確定也不是必需的。用于該訓練或適配的語音輸入和相關(guān)連的語音識別結(jié)果的適用性寧可通過以語音識別結(jié)果為基礎(chǔ)的實際情況建立，一個可指配的設(shè)備功能通過例如運行語音撥號處理被激活，并且如果用戶不給出一個具有他表示他的拒絕的輸入，例如停止設(shè)備功能的執(zhí)行(權(quán)利要求2)，則它假設(shè)語音識別結(jié)果表示正確的語音輸入并能被用作訓練和適配。例如，用戶也能通過語音或鍵盤輸入表示其拒絕。
權(quán)利要求3涉及一種在語音識別結(jié)果被用作訓練或適配之前附加的安全措施，對于這個結(jié)果，倘若這里用戶沒有表示其拒絕，即使該語音識別結(jié)果不表示正確的語音輸入，則一個訓練操作或適配不以這個語音識別結(jié)果為基礎(chǔ)而被執(zhí)行。這個安全措施被設(shè)計為防止用戶恰好被分散注意力并且由此不能表示其拒絕的情況，即使該語音識別結(jié)果是不能令人滿意的，依據(jù)一個設(shè)備功能的想要的行為也不發(fā)生。
權(quán)利要求4涉及在權(quán)利要求3中描述的安全措施防止以不令人滿意的可靠性級別為基礎(chǔ)的訓練和適配的情況。如果，直接在語音輸入之后通過例如鍵盤輸入的另一種輸入方法完成一個輸入，這里前面的語音輸入和通過其他輸入方法完成的輸入的一個高概率將發(fā)生。為了估計其一致性，考慮到檢測沒有發(fā)生的該語音輸入和下面通過其他方法完成的輸入的情況的一個可靠性級別同樣被建立。如果該可靠性級別落在一個預(yù)定的目標范圍內(nèi)，一個訓練操作和適配被考慮語音識別結(jié)果和通過其他輸入方法完成的輸入執(zhí)行。
權(quán)利要求5，象權(quán)利要求4一樣，涉及一個語音輸入最初沒有被考慮適合于訓練或適配，不過接下來的輸入是通過另一種輸入方法完成的以便再次有一個通過其他方法完成的輸入和前面的語音輸入的同時發(fā)生的較高概率的情況。對照權(quán)利要求4，權(quán)利要求5結(jié)合在一個語音輸入之后，參照這個結(jié)果用戶使一個輸入表示其拒絕，出于這個原因，最初沒有訓練或適配發(fā)生的情況。這里在通過其他輸入方法完成該輸入之后的訓練和適配之前，利用考慮到檢測沒有發(fā)生的該語音輸入和下面通過其他方法完成的輸入的情況的一個可靠性級別實施評估。
在如權(quán)利要求6闡述的實施例中，對于每個語音識別結(jié)果至少一個可替換的語音識別結(jié)果被產(chǎn)生。如果，以最后的語音輸入和相應(yīng)的語音識別結(jié)果為基礎(chǔ)，一個訓練操作和適應(yīng)被執(zhí)行，如果最后之前的語音輸入沒有導(dǎo)致任何訓練或適配，它同樣檢查是否該語音識別結(jié)果對應(yīng)于一個對于最后之前的語音輸入的可變更的語音識別結(jié)果的最后語音輸入。如果是這種情況，它假定最后之前的語音輸入和最后的語音輸入彼此對應(yīng)。在隨后的額外訓練操作或隨后的額外適配中，語音識別設(shè)備的參數(shù)被以這樣一種方式設(shè)定，最后之前的語音輸入和最后的語音輸入都將在新的輸入操作中導(dǎo)致正確的語音識別結(jié)果，也就是導(dǎo)致對于最后的語音輸入是確定的的語音識別結(jié)果。
在如權(quán)利要求7闡述的實施例中，一個用戶在聽覺上或視覺上被通知一個語音識別結(jié)果。因此，在語音識別結(jié)果的準確度評定中，這個用戶不僅僅參考一個設(shè)備功能的性能的識別。當設(shè)備功能的性能對于該用戶是不可見的，或者他僅僅被給出關(guān)于由該語音識別設(shè)備產(chǎn)生的語音識別結(jié)果的不完全信息的時候，用戶需要額外的信息。
權(quán)利要求8和9涉及本發(fā)明在一個移動電話中的應(yīng)用。在這里，該語音識別設(shè)備特別地用于語音撥號。
權(quán)利要求10涉及一種用于實現(xiàn)根據(jù)本發(fā)明的方法的電子設(shè)備。在權(quán)利要求11中，該電子設(shè)備采用移動電話終端的形式。

參考附圖中所示的實施例的例子本發(fā)明將被做進一步描述，然而，本發(fā)明不受此限制。
圖1示出了一個移動電話終端的方框電路圖；和圖2至5示出了本發(fā)明各種變型的流程圖。
具體實施例方式
圖1示出了一個作為具有一個數(shù)字信號處理器2的移動電話終端形成的電子設(shè)備1，其首先被裝配用于語音編碼/解碼和免提信號處理(被一個功能塊3結(jié)合)并其次用于一個語音識別設(shè)備的語音識別程序的運行(功能塊4)。該移動電話終端1具有一個麥克風5和一個揚音器6，它們通過模數(shù)轉(zhuǎn)換器7和8連接到該數(shù)字信號處理器2。該移動電話終端1還含有一個微控制器9用于移動電話終端1的功能的中心控制。此外，一個存儲設(shè)備10被提供，其用于語音識別設(shè)備4的詞典11和其它數(shù)據(jù)12的存儲，在這里，為了簡化，其它數(shù)據(jù)由功能塊12結(jié)合——因為它們對于本發(fā)明不是必需的。詞典11以作為隱藏的馬爾可夫模型產(chǎn)生的聲音模型的形式含有語音識別設(shè)備4的詞匯，詞典11必須被認作語音識別設(shè)備4的一部分。移動電話終端1也包括一個鍵盤輸入單元13和一個顯示單元14。通過一個天線15，高頻信號被接收并發(fā)射通過收發(fā)信機單元16處理的高頻信號。一個信道編碼/解碼單元17被用于將被發(fā)送的信號的信道編碼或接收信號的信道解碼。一個總線系統(tǒng)18連接數(shù)字信號處理器2，微控制器9，存儲設(shè)備10，鍵盤輸入單元13，顯示單元14和信道編碼/解碼單元17。
依靠語音識別設(shè)備4通過借助于麥克風5給出的語音輸入實現(xiàn)移動電話終端1的功能是可能的。在上面舉例的情況中，通過一個語音輸入，另一個用戶的撥叫被觸發(fā)(語音撥號)。在這個過程中，一個用戶說想要被呼叫的其他用戶的任意一個電話號碼，或者他說其他用戶的名字，那些人的關(guān)聯(lián)電話號碼必須已經(jīng)預(yù)先分配給這個名字，對于這種分配任意一種單獨的語音輸入或借助于鍵盤輸入單元13的單獨的鍵盤輸入，或者鍵盤輸入和語音輸入二者能被使用。為了保證語音識別設(shè)備4的平穩(wěn)運行，語音識別設(shè)備4的訓練是必要的，也就是一個詞匯適合于應(yīng)用在問題中并存儲在必須建立的詞典11中。同樣，考慮到使該語音識別模塊適應(yīng)變更的應(yīng)用環(huán)境，稍后該已經(jīng)被訓練的語音識別設(shè)備4的聲音模塊的適配被提供。
圖2至圖5示出了用于該語音識別設(shè)備4的訓練或適配的各種實施例。
在圖2所示的配置中，首先在步驟200語音輸入模式被激活，例如通過按下一個相應(yīng)的啟動按鍵。在一個步驟201，用戶進行一個語音輸入以便他輸入他想要呼叫的另一個用戶的名字。在步驟202，在語音識別設(shè)備4的幫助下，執(zhí)行一個自動語音識別操作并產(chǎn)生一個語音識別結(jié)果。在步驟203這個語音識別結(jié)果被輸出給用戶，例如通過借助于顯示單元14的視覺輸出或者依靠一個借助于揚聲器6的聲音輸出。在步驟204，假定一個電話號碼已經(jīng)被分配給這個已識別的名字，這個電話號碼的自動撥號被立刻處理。在步驟205，進行一個關(guān)于該自動撥號是否被用戶中斷(例如在用戶識別出一個錯誤的語音識別結(jié)果并拒絕它的情況下，通過按下一個特定按鍵或講一個“停止”語音指令)的詢問，進行一個返回到步驟200和步驟201之間的點的跳轉(zhuǎn)，在那里該設(shè)備準備接收一個進一步的語音輸入。如果該語音撥號沒有被中斷，并且在步驟205給這個詢問一個否定的答案，以步驟202確定的該語音識別結(jié)果為基礎(chǔ)執(zhí)行語音識別設(shè)備4的訓練和適配。這樣對于一個進一步的語音輸入能被進行的結(jié)果，進行一個返回到步驟200和步驟201之間的點的跳轉(zhuǎn)。
在根據(jù)圖3的實施例中，最初在一個步驟300移動電話終端1的語音輸入模式被啟動。在此之后，在步驟301完成一個語音輸入，也就是在提問的情況下，一個名字被講。在步驟302，在一個語音識別操作已經(jīng)被執(zhí)行之后，在步驟303對于給用戶聽覺上或視覺上該語音識別結(jié)果被重新產(chǎn)生。這樣，如在權(quán)利要求2中已經(jīng)被示出的，具有該識別的名字的一個用戶的自動撥叫被觸發(fā)。在步驟305，進行一個關(guān)于該自動撥號是否被用戶中斷的詢問。如果是這種情況，進行一個返回到步驟300和步驟301之間的點的跳轉(zhuǎn)，因為它已經(jīng)假定該用戶以已經(jīng)認為該語音識別結(jié)果為錯誤的并拒絕它。如果自動撥號沒有被中斷，在步驟306，建立一個該語音識別結(jié)果的可靠性級別評定。在步驟307，進行一個關(guān)于是否該可靠性級別落在一個預(yù)定的目標范圍內(nèi)的詢問。如果不是這種情況，進行一個返回到步驟300和步驟301之間的點的跳轉(zhuǎn)。如果該可靠性級別落在指定的目標范圍內(nèi)，它必須假定該語音識別結(jié)果實際上正確地表示了語音輸入并且在步驟308以這個語音識別結(jié)果為基礎(chǔ)執(zhí)行訓練操作或適配。
在根據(jù)圖4的實施例中，首先在一個步驟400語音輸入模式被啟動。接著在步驟401完成一個語音輸入，也就是講他想要呼叫的一個用戶的名字。在步驟402，執(zhí)行關(guān)于該已經(jīng)被完成的語音輸入的一個語音識別操作。在步驟403該語音識別結(jié)果在聲音上或視覺上被輸出給用戶。在步驟404，具有已識別名字的一個用戶的自動撥叫被觸發(fā)。在步驟405，執(zhí)行一個關(guān)于該撥叫是否被用戶中斷的檢測。如果這是肯定青況，也就是說如果該語音識別結(jié)果被用戶識別為錯誤，則進行一個返回到步驟400和步驟401之間的點的跳轉(zhuǎn)。如果自動撥號沒有被用戶中斷，對于該語音識別結(jié)果在步驟406確定一個初始的可靠性級別。在步驟407中，建立一個關(guān)于是否這個初始的可靠性級別落在一個最初指定的目標范圍內(nèi)的詢問。如果這是肯定情況，在步驟408，以這個語音識別結(jié)果為基礎(chǔ)執(zhí)行語音識別設(shè)備4的訓練或適配。如果在步驟407這個初始的可靠性級別沒有落在一個最初指定的目標范圍內(nèi)被建立，在步驟409執(zhí)行一個關(guān)于是否通過其它輸入方法，例如通過鍵盤輸入完成隨后輸入的檢測。如果不是這種情況，再次進行一個返回到步驟400和步驟401之間的點的跳轉(zhuǎn)。然而如果在步驟409，通過其它輸入方法-也就是特別地通過鍵盤輸入-完成下面以后的直接的輸入被建立，早先的語音輸入和其后的通過其它輸入方法的輸入相互一致的可能性是很大的，也就是在一個失敗的語音撥號之后，該用戶嘗試通過借助于另一種輸入方法的輸入觸發(fā)對同一個用戶的撥叫。下面通過其它輸入方法輸入，在步驟410考慮到借助于另一種輸入方法完成的輸入，對于前面的語音識別結(jié)果一個第二可靠性級別被確定。在步驟411，執(zhí)行一個關(guān)于是否這個第二可靠性級別落在一個第二指定的目標范圍內(nèi)的檢測。如果這是肯定情況，象步驟408一樣，考慮到借助于其它輸入方法完成的輸入，以這個語音識別結(jié)果為基礎(chǔ)執(zhí)行該語音識別設(shè)備的訓練或適配。如果在步驟411，這個第二可靠性級別沒有落在一個第二指定的目標范圍內(nèi)被建立，這與依靠其它輸入方法完成的輸入和前面的語音輸入彼此不一致的驗證一致，并完成一個返回到步驟400和步驟401之間的點的跳轉(zhuǎn)。
原則上，即使在步驟405該用戶中斷一個用戶的撥叫并由此表示該語音識別結(jié)果的拒絕被建立的青況下，代替一個返回到步驟401和402之間的點的跳轉(zhuǎn)，繼續(xù)進行步驟409的詢問是可能的，如一個由虛線表示的跳轉(zhuǎn)412指示的。因此，如果其后一個輸入被立即通過另一種輸入方法完成，它再次被假定具有一個通過其它輸入方法完成的輸入和前面的語音輸入彼此對應(yīng)的高的概率級別，并且該語音識別結(jié)果不能表示正確的語音輸入。然而，即使該語音識別結(jié)果不是完全正確的，如果這里對該語音輸入和/或通過另一種輸入方法完成的輸入有一個足夠的近似性，它也能夠被用于該語音識別設(shè)備的訓練或適配，它通過基于一個可靠性級別執(zhí)行的檢測被建立。該訓練操作因此既包括包含在語音識別結(jié)果中的信息也包括包含在通過其它輸入方法完成的輸入中的信息。
最后，圖5示出了一個本發(fā)明的變化，其中應(yīng)用有區(qū)別的訓練或適配。在步驟500，該語音輸入模式被啟動，在步驟501完成一個語音輸入，也就是講一個用戶的名字，并且在步驟502通過語音識別設(shè)備4執(zhí)行一個語音識別操作，其中除該語音識別結(jié)果之外的至少一個可替換的進一步的語音識別結(jié)果被產(chǎn)生。在步驟503，該語音識別結(jié)果在聲音上或視覺上被輸出到用戶。在步驟504，關(guān)于該語音識別結(jié)果，執(zhí)行具有已識別名字的一個用戶的自動撥叫。在步驟505，執(zhí)行一個關(guān)于該撥叫是否被用戶中斷的檢測。如果這是肯定情況，進行一個返回到步驟500和步驟501之間的點的跳轉(zhuǎn)。如果這不是肯定情況，在步驟506，以這個最后的語音識別結(jié)果為基礎(chǔ)執(zhí)行語音識別設(shè)備4的訓練或適配。在一個詢問步驟507，一個關(guān)于是否這個最后的語音識別結(jié)果對應(yīng)于一個由最后之前的語音輸入確定的可替換的語音識別結(jié)果，和是否該最后之前的語音輸入導(dǎo)致了被用戶自動撥叫的停止的進一步的檢測接著被執(zhí)行。如果這些條件之一不被滿足，進行一個返回到步驟500和步驟501之間的點的跳轉(zhuǎn)。如果這兩個條件都被滿足，它假定所述對最后之前的語音輸入的可替換的語音識別實際上表示了最后之前的語音輸入的正確的語音識別結(jié)果。假如這樣的情況下，在步驟508執(zhí)行有區(qū)別的訓練或有區(qū)別的適配操作，提供最后的語音輸入和一個最后之前的表示相同的詞語或相同的詞語序列。與在詞典11輸入的相應(yīng)的詞匯相關(guān)聯(lián)的該聲音模型以這樣一種方式適應(yīng)，對于最后的語音輸入和對于最后之前的一個語音輸入語音識別設(shè)備4都將產(chǎn)生正確的語音識別結(jié)果。在步驟508被執(zhí)行之后，再次進行一個返回到步驟500和501之間的跳轉(zhuǎn)。
本發(fā)明即不限制于應(yīng)用在一個移動電話終端中，也不限制于語音撥號。依靠語音輸入一個動作能被在電子設(shè)備的另一種功能上完成，例如，在語音輸出的聲音設(shè)定上。同樣，對于一個用戶進行的語音識別的聽覺或視覺輸出來說，尤其是如果該用戶能夠從對應(yīng)于一個語音輸入的一個設(shè)備的特性，而沒有任何進一步的信息中推斷出語音識別結(jié)果的準確度，它不是絕對必需的。此外，該用戶也能表示其拒絕，另外或換句話說，通過不中斷已經(jīng)啟動的一個設(shè)備功能的預(yù)置輸入(例如于置語音或鍵盤輸入)。
權(quán)利要求
1.一種用于遵照一個電子設(shè)備(1)的功能行事的一個語音識別設(shè)備(4)的訓練或適配的方法，其中提供下列步驟執(zhí)于一個語音輸入；處理由語音識別設(shè)備(4)輸入的語音以便產(chǎn)生一個語音識別結(jié)果；如果該語音識別結(jié)果能夠被分配給電子設(shè)備(1)的一個功能，遵照該電子設(shè)備(1)的所分配的功能行事；如果遵照電子設(shè)備(1)的所分配的功能行事不能導(dǎo)致一個表示拒絕的用戶輸入，以與完成的語音輸入關(guān)聯(lián)的語音識別結(jié)果為基礎(chǔ)訓練或適配該語音識別設(shè)備(4)。
2.如權(quán)利要求1所述的方法，其特征在于，如果電子設(shè)備(1)的功能的的運行沒有被一個用戶輸入中斷，語音識別設(shè)備(4)的訓練和適配發(fā)生。
3.如權(quán)利要求1或2所述的方法，其特征在于，對于該語音識別設(shè)備(4)的一個語音識別結(jié)果，一個可靠性級別被確定，并且如果該語音識別結(jié)果的可靠性級別落在一個預(yù)定的目標范圍內(nèi)，以對應(yīng)于該完成的語音輸入的語音識別結(jié)果為基礎(chǔ)執(zhí)行該語音識別設(shè)備(4)的一個訓練或適配。
4.如權(quán)利要求1或2所述的方法，其特征在于，對于一個語音識別設(shè)備(4)的語音識別結(jié)果來說，確定一個最初的可靠性級別；如果該語音識別結(jié)果的最初的可靠性級別落在一個預(yù)定的目標范圍內(nèi)，以對應(yīng)于該完成的語音輸入的語音識別結(jié)果為基礎(chǔ)執(zhí)行該語音識別設(shè)備的(4)的訓練或適配，如果這個初始的可靠性級別沒有落在一個最初指定的目標范圍內(nèi)，并且同樣如果通過另一種輸入方法完成隨后的用戶輸入，則考慮到通過其它輸入方法完成的輸入，它提供一個對于該語音識別結(jié)果被確定的第二可靠性級別，并且如果這個第二可靠性級別落在一個第二指定的目標范圍內(nèi)，以考慮到通過另一種輸入方法完成的用戶輸入的語音識別結(jié)果為基礎(chǔ)執(zhí)行訓練操作或適配。
5.如權(quán)利要求1或2所述的方法，其特征在于，如果在一個語音輸入之后進行一個表示拒絕該語音識別結(jié)果的用戶輸入，并且隨后地通過另一種輸入方法完成一個用戶輸入，則考慮到通過其它輸入方法完成的輸入，它提供對于該語音識別結(jié)果被確定的第二可靠性級別，并且執(zhí)行語音識別設(shè)備(4)的訓練操作或適配，提供語音輸入和表示該相同的詞語或詞語序列的通過其它輸入方法完成的用戶輸入。
6.如權(quán)利要求1或2所述的方法，其特征在于，該語音識別設(shè)備(4)在每種情況下也提供至少一個可替換的語音識別結(jié)果，如果遵照分配給語音識別結(jié)果的電子設(shè)備的所功能行事不能導(dǎo)致一個表示該語音識別結(jié)果的拒絕的用戶輸入，以與最后的語音輸入關(guān)聯(lián)的語音識別結(jié)果為基礎(chǔ)執(zhí)行該語音識別設(shè)備(4)的訓練或適配，并且如果該語音識別結(jié)果對于最后之前的語音輸入對應(yīng)于一個可替換的語音識別結(jié)果并且在最后之前進行一個表示語音識別結(jié)果的拒絕的用戶輸入，執(zhí)行語音識別設(shè)備的一個進一步的訓練操作或進一步的適配，提供最后的語音識別結(jié)果和表示該相同的詞語或詞語序列的最后之前的一個。
7.如權(quán)利要求1至6的其中之一要求的方法，其特征在于提供一個語音識別結(jié)果的聽覺上或視覺上的再現(xiàn)。
8.如權(quán)利要求1至7之一所述的方法，其特征在于，該電子設(shè)備(1)是一個移動電話。
9.如權(quán)利要求8所述的方法，其特征在于，通過一個語音輸入觸發(fā)一個撥號過程。
10.一種具有語音識別設(shè)備(4)的電子設(shè)備(1)，用于遵照該電子設(shè)備的功能行事，其中該電子設(shè)備(1)和語音識別設(shè)備(4)以這樣一種方式設(shè)計，下面的步驟被用于該語音識別設(shè)備(4)的訓練或適配執(zhí)于一個語音輸入；處理由語音識別設(shè)備(4)輸入的語音以便產(chǎn)生一個語音識別結(jié)果；如果該語音識別結(jié)果能夠被分配到電子設(shè)備(1)的一個功能，遵照該電子設(shè)備(1)的所分配的功能行事；如果遵照電子設(shè)備(1)的所分配的功能行事不能導(dǎo)致一個表示拒絕的用戶輸入，以與完成的語音輸入關(guān)聯(lián)的語音識別結(jié)果為基礎(chǔ)訓練或適配該語音識別設(shè)備(4)。
11.一種具有語音識別設(shè)備(4)的移動電話終端(1)，用于遵照該移動電話終端的功能行事，其中該移動電話終端(1)和語音識別設(shè)備(4)以這樣一種方式設(shè)計，下面的步驟被用于該語音識別設(shè)備(4)的訓練或適配執(zhí)行一個語音輸入；處理由語音識別設(shè)備(4)輸入的語音以便產(chǎn)生一個語音識別結(jié)果；如果該語音識別結(jié)果能夠被分配到移動電話終端(1)的一個功能，遵照該移動電話終端(1)的所分配的功能行事；如果遵照移動電話終端(1)的所分配的功能行事不能導(dǎo)致一個表示拒絕的用戶輸入，以與完成的語音輸入關(guān)聯(lián)的語音識別結(jié)果為基礎(chǔ)訓練或適配該語音識別設(shè)備(4)。
全文摘要
本發(fā)明涉及用于遵照一個電子設(shè)備的功能行事的一個語音識別設(shè)備的訓練或適配，例如在一個移動電話中一個語音撥號的觸發(fā)。為了構(gòu)造語音識別設(shè)備訓練和/或適配以便改善用戶舒適性，提出具有下面步驟的一種方法執(zhí)行一個語音輸入；處理由語音識別設(shè)備輸入的語音以便產(chǎn)生一個語音識別結(jié)果；如果該語音識別結(jié)果能夠被分配到電子設(shè)備的一個功能，遵照該電子設(shè)備的所分配的功能行事；如果遵照電子設(shè)備的所分配的功能行事不能導(dǎo)致一個表示拒絕的用戶輸入，以與完成的語音輸入關(guān)聯(lián)的語音識別結(jié)果為基礎(chǔ)訓練或適配該語音識別設(shè)備。
文檔編號G10L15/065GK1391210SQ0212754
公開日2003年1月15日申請日期2002年5月8日優(yōu)先權(quán)日2001年5月11日
發(fā)明者V·施泰恩比斯, T·埃塞勒申請人:皇家菲利浦電子有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：V.施泰恩比斯;T.埃塞勒
技術(shù)所有人：皇家菲利浦電子有限公司
我是此專利的發(fā)明人

上一篇：具重音提示的計算機輔助詞義教學系統(tǒng)及方法
上一篇：音樂合成方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

hmm用于語音識別相關(guān)技術(shù)

語音識別設(shè)備相關(guān)技術(shù)

語音識別訓練數(shù)據(jù)相關(guān)技術(shù)

語音識別模型訓練相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于一種語言識別設(shè)備的訓練或適配方法