音音素,并且通過對語音訓練數(shù)據(jù)運行音高估計器并且利用 k均值算法將獲得的音高估計進行量化來估計其余(濁音)狀態(tài)。
[0093] 為了實現(xiàn)平滑的濾波器分量r,一些示意性實施方式使用與在梅爾頻率(Mel-frequency)范圍上均勻分布的、與正弦波形帶通濾波器交疊的初級濾波器礦。初級濾波器r 的數(shù)量應當較小W便防止濾波器部分捕獲激勵部分。通過使用針對r的平滑交疊濾波器, 將濾波器部分r限制為捕獲頻譜的平滑包絡。
[0094] 為了初始化We,示意性實施方式首先計算倒頻譜C = DCT{logS},其中,DCT代表離 散余弦變換,S是訓練數(shù)據(jù)的功率譜。消除倒頻譜的下部W去除與音素相關(guān)的信息,示意性 實施方式定義了高通濾波的頻譜,
[0095] shigh=exp(IDCT{Chigh}),
[0096] 其中,如果f〉fc,貝I
并且fc是截止頻率。we的每一個 列被初始化為濾波的頻譜的相對應的列的平均值:
[0097]
[0098] 變量U和變量g在均勻分布的情況下被隨機初始化。在初始化所述變量之后,例如 使用在等式(6)中描述的更新規(guī)則來訓練NSFDS模型。
[0099] 上述實施方式可W W多種方式中的任何方式來實施。例如,可W使用硬件、軟件或 它們的組合來實施所述實施方式。當W軟件實施時,可W在任何合適的處理器或處理器的 集合上執(zhí)行軟件代碼,不論所述處理器是在單個計算機中提供還是分布在多個計算機當 中。運種處理器可W實施為集成電路,且在集成電路部件中存在一個或更多個處理器。但 是,可W使用任何合適的形式的電路來實現(xiàn)處理器。
[0100] 另外,應當理解,計算機可W實現(xiàn)為多種形式中的任一種,諸如機架式計算機、臺 式計算機、膝上型計算機、小型計算機或平板計算機。另外,計算機可W具有一個或更多個 輸入和輸出系統(tǒng)。運些系統(tǒng)可W用來展示用戶界面等。運些計算機可W通過一個或更多個 網(wǎng)絡W任何合適的形式互連,所述網(wǎng)絡包括諸如企業(yè)網(wǎng)絡的局域網(wǎng)或諸如因特網(wǎng)的廣域 網(wǎng)。運些網(wǎng)絡可W基于任何合適的技術(shù)并且可W根據(jù)任何合適的協(xié)議來操作并且可W包括 無線網(wǎng)、有線網(wǎng)或光纖網(wǎng)。
[0101] 另外,本發(fā)明的實施方式可W實現(xiàn)為方法,已經(jīng)提供了該方法的示例。作為方法的 部分而執(zhí)行的行為可WW任何合適的方式排序。因此,可W構(gòu)建W和所例示的順序不同的 順序來執(zhí)行行為的實施方式,該實施方式可W包括同時執(zhí)行一些行為,即使在例示的實施 方式中示出為順序的行為。
[0102]在權(quán)利要求中使用修飾權(quán)利要求元素的諸如"第一"、"第二"的序數(shù)術(shù)語本身不表 示任何優(yōu)先級、優(yōu)先權(quán)或一個權(quán)利要求元素的順序在另一個權(quán)利要求元素之上或執(zhí)行方法 的行為的時間順序,而是僅用作標記W將具有特定名稱的一個權(quán)利要求元素與具有相同名 稱的另一元素(如果沒有序數(shù)術(shù)語)區(qū)別開W區(qū)分權(quán)利要求元素。
【主權(quán)項】
1. 一種用于增強輸入的有噪信號的方法,其中,所述輸入的有噪信號是清晰語音信號 與噪聲信號的混合,所述方法包括: 使用所述清晰語音信號的模型和所述噪聲信號的模型,根據(jù)所述輸入的有噪信號確定 多個序列的隱變量,所述多個序列的隱變量包括表示所述清晰語音信號的激勵分量的至少 一個序列的隱變量、表不所述清晰語音信號的濾波器分量的至少一個序列的隱變量以及表 示所述噪聲信號的至少一個序列的隱變量,其中,所述清晰語音信號的模型包括非負源-濾 波器動力學系統(tǒng)(NSFDS),該NSFDS將表示所述激勵分量的隱變量約束為在時間上統(tǒng)計地具 有依存性,并且將表示所述濾波器分量的隱變量約束為在時間上統(tǒng)計地具有依存性,并且 其中,所述多個序列的隱變量包括被確定為非負基函數(shù)的非負線性組合的隱變量;以及 使用表示所述激勵分量和所述濾波器分量的相應隱變量的乘積來生成輸出信號,其 中,所述方法的步驟由處理器執(zhí)行。2. 根據(jù)權(quán)利要求1所述的方法,其中,所述激勵分量的隱變量或所述濾波器分量的隱變 量包括形成離散狀態(tài)馬爾可夫鏈的狀態(tài)變量。3. 根據(jù)權(quán)利要求1所述的方法,其中,所述激勵分量的隱變量或所述濾波器分量的隱變 量包括形成連續(xù)狀態(tài)馬爾可夫鏈的狀態(tài)變量。4. 根據(jù)權(quán)利要求1所述的方法,其中,所述多個序列的隱變量包括表示增益分量的至少 一個序列,并且其中,所述輸出信號被生成為表示所述激勵分量和所述濾波器分量以及所 述增益分量的相應隱變量的乘積。5. 根據(jù)權(quán)利要求4所述的方法,其中,所述增益分量的序列形成馬爾可夫鏈。6. 根據(jù)權(quán)利要求4所述的方法,其中,所述增益分量的序列形成伽瑪馬爾可夫鏈。7. 根據(jù)權(quán)利要求1所述的方法,其中,所述確定使用最大后驗估計。8. 根據(jù)權(quán)利要求1所述的方法,其中,所述確定使用貝葉斯法。9. 根據(jù)權(quán)利要求1所述的方法,其中,所述確定是自適應的并且針對所述輸入的有噪信 號在線執(zhí)行。10. 根據(jù)權(quán)利要求1所述的方法,其中,所述激勵分量的隱變量或所述濾波器分量的隱 變量包括形成伽瑪馬爾可夫鏈的狀態(tài)變量。11. 根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)訓練噪聲信號的數(shù)據(jù)庫估計所述噪聲信號 的模型的參數(shù)。12. 根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)所述輸入的有噪信號估計所述噪聲信號的 模型的參數(shù)。13. 根據(jù)權(quán)利要求1所述的方法,其中,所述噪聲信號的模型是非負基函數(shù)的非負線性 組合。14. 根據(jù)權(quán)利要求1所述的方法,其中,所述噪聲信號的模型是非負動力學系統(tǒng)。15. 根據(jù)權(quán)利要求1所述的方法,其中,所述噪聲信號的模型是非負源-濾波器動力學系 統(tǒng)。16. 根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)訓練清晰語音信號的數(shù)據(jù)庫估計所述清晰 語音信號的模型的參數(shù)。17. -種用于增強輸入的有噪信號的系統(tǒng),其中,所述輸入的有噪信號是清晰語音信號 與噪聲信號的混合,所述系統(tǒng)包括: 存儲器,所述存儲器用于存儲所述清晰語音信號的模型,其中,所述清晰語音信號的模 型包括非負源-濾波器動力學系統(tǒng)(NSFDS);以及 處理器,所述處理器用于使用該NSFDS根據(jù)所述輸入的有噪信號確定多個序列的隱變 量,所述多個序列的隱變量包括表示所述清晰語音信號的激勵分量的至少一個序列的隱變 量、表示所述清晰語音信號的濾波器分量的至少一個序列的隱變量,其中,該Nsros將表示 所述激勵分量的隱變量和表示所述濾波器分量的隱變量約束為在時間上統(tǒng)計地具有依存 性,并且其中,所述多個序列的隱變量包括被確定為非負基函數(shù)的非負線性組合的隱變量, 并且所述處理器用于使用表示所述激勵分量和所述濾波器分量的相應隱變量的乘積生成 輸出信號。
【專利摘要】一種從輸入的有噪信號確定多個序列的隱變量的方法,多個序列的隱變量包括表示清晰語音信號的激勵分量的至少一個序列的隱變量、表示清晰語音信號的濾波器分量的至少一個序列的隱變量和表示噪聲信號的至少一個序列的隱變量。所述多個序列的隱變量包括被確定為非負基函數(shù)的非負線性組合的隱變量。所述確定使用清晰語音信號的模型,該模型包括將激勵分量和濾波器分量的隱變量約束為在時間上統(tǒng)計地具有依存性的非負源-濾波器動力學系統(tǒng)(NSFDS)。所述方法使用表示激勵分量和濾波器分量的相應隱變量的乘積生成輸出信號。
【IPC分類】G10L21/0208
【公開號】CN105684079
【申請?zhí)枴?br>【發(fā)明人】J·勒魯克斯, J·R·赫爾歇, U·斯木塞克里
【申請人】三菱電機株式會社
【公開日】2016年6月15日
【申請日】2014年10月8日