生成聲學(xué)模型的設(shè)備和方法和用于語(yǔ)音識(shí)別的設(shè)備和方法與流程

文檔序號(hào)：12128359閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>生成聲學(xué)模型的設(shè)備和方法和用于語(yǔ)音識(shí)別的設(shè)備和方法與流程

技術(shù)特征：

1.一種用于生成聲學(xué)模型的設(shè)備，所述設(shè)備包括：

處理器，被配置為：

通過使用噪音模型計(jì)算代表噪音數(shù)據(jù)的噪音表現(xiàn)；

通過使用包括語(yǔ)音數(shù)據(jù)和噪音數(shù)據(jù)的訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)、與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的音素串和噪音表現(xiàn)進(jìn)行訓(xùn)練，生成聲學(xué)模型。

2.如權(quán)利要求1所述設(shè)備，還包括：存儲(chǔ)器，被配置為存儲(chǔ)指令，

其中，處理器還被配置為執(zhí)行所述指令以配置處理器，來(lái)通過使用噪音模型計(jì)算代表噪音數(shù)據(jù)的噪音表現(xiàn)，并通過使用包括語(yǔ)音數(shù)據(jù)和噪音數(shù)據(jù)的訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)、與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的音素串和噪音表現(xiàn)進(jìn)行訓(xùn)練來(lái)生成聲學(xué)模型。

3.如權(quán)利要求1所述設(shè)備，其中，處理器包括：

噪音表現(xiàn)計(jì)算器，被配置為通過使用噪音模型，計(jì)算代表噪音數(shù)據(jù)的噪音表現(xiàn)；

聲學(xué)模型生成器，被配置為通過使用包括語(yǔ)音數(shù)據(jù)和噪音數(shù)據(jù)的訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)、與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的音素串和噪音表現(xiàn)進(jìn)行訓(xùn)練，生成聲學(xué)模型。

4.如權(quán)利要求3所述設(shè)備，其中，噪音表現(xiàn)計(jì)算器包括：

特征提取器，被配置為提取噪音數(shù)據(jù)的特征；

噪音建模器，被配置為通過使用噪音模型基于提取的特征，計(jì)算代表噪音數(shù)據(jù)的噪音表現(xiàn)。

5.如權(quán)利要求1所述設(shè)備，其中，使用訓(xùn)練噪音數(shù)據(jù)通過自動(dòng)編碼器預(yù)先生成噪音模型。

6.如權(quán)利要求3所述設(shè)備，其中，生成的聲學(xué)模型是基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型。

7.如權(quán)利要求1所述設(shè)備，其中，處理器被配置為：通過使用多任務(wù)學(xué)習(xí)方法生成聲學(xué)模型。

8.如權(quán)利要求1所述設(shè)備，其中，處理器通過使用從第一目標(biāo)函數(shù)和第二目標(biāo)函數(shù)的加權(quán)和得到的第三目標(biāo)函數(shù)，生成聲學(xué)模型，其中，第一目標(biāo)函數(shù)用于估計(jì)音素概率，第二目標(biāo)函數(shù)用于估計(jì)噪音表現(xiàn)。

9.如權(quán)利要求3所述設(shè)備，其中，聲學(xué)模型生成器包括：

組合器，被配置為組合語(yǔ)音數(shù)據(jù)和噪音數(shù)據(jù)以生成訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)；

特征提取器，被配置為提取生成的訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)的特征；

聲學(xué)模型訓(xùn)練器，被配置為用提取的特征、與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的音素串以及噪音表現(xiàn)，訓(xùn)練聲學(xué)模型。

10.一種生成聲學(xué)模型的方法，所述方法包括：

通過使用噪音模型計(jì)算噪音數(shù)據(jù)的噪音表現(xiàn)；

使用包括語(yǔ)音數(shù)據(jù)和噪音數(shù)據(jù)的訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)、與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的音素串和噪音表現(xiàn)，生成聲學(xué)模型。

11.如權(quán)利要求10所述方法，其中，計(jì)算噪音表現(xiàn)的步驟包括：

提取噪音數(shù)據(jù)的特征；

通過使用噪音模型基于提取的噪音數(shù)據(jù)的特征計(jì)算噪音表現(xiàn)。

12.如權(quán)利要求10所述方法，其中，通過自動(dòng)編碼器使用訓(xùn)練噪音數(shù)據(jù)預(yù)先生成噪音模型。

13.如權(quán)利要求10所述方法，其中，生成的聲學(xué)模型是基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型。

14.如權(quán)利要求10所述方法，其中，生成聲學(xué)模型的步驟包括：通過使用多任務(wù)學(xué)習(xí)方法生成聲學(xué)模型。

15.如權(quán)利要求14所述方法，其中，生成聲學(xué)模型的步驟包括：通過使用從第一目標(biāo)函數(shù)和第二目標(biāo)函數(shù)的加權(quán)和得到的第三目標(biāo)函數(shù)，生成聲學(xué)模型，其中，第一目標(biāo)函數(shù)用于估計(jì)音素概率，第二目標(biāo)函數(shù)用于估計(jì)噪音表現(xiàn)。

16.如權(quán)利要求10所述方法，其中，生成聲學(xué)模型的步驟包括：

組合語(yǔ)音數(shù)據(jù)和噪音數(shù)據(jù)以生成訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)；

提取生成的訓(xùn)練帶噪語(yǔ)音模型的特征；

用提取的特征、與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的音素串以及噪音表現(xiàn)訓(xùn)練聲學(xué)模型。

17.一種語(yǔ)音識(shí)別設(shè)備，包括：

存儲(chǔ)器，被配置為存儲(chǔ)聲學(xué)模型；

計(jì)算器，被配置為通過使用存儲(chǔ)的聲學(xué)模型計(jì)算輸入的帶噪語(yǔ)音數(shù)據(jù)的音素概率，

其中，通過使用包括語(yǔ)音數(shù)據(jù)和噪音數(shù)據(jù)的組合的訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)、與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的音素串和代表噪音數(shù)據(jù)的噪音表現(xiàn)進(jìn)行訓(xùn)練，生成聲學(xué)模型。

18.如權(quán)利要求17所述設(shè)備，其中，計(jì)算器包括：

特征提取器，被配置為提取輸入的帶噪語(yǔ)音數(shù)據(jù)的特征；

音素概率計(jì)算器，被配置為使用聲學(xué)模型計(jì)算與提取的特征對(duì)應(yīng)的音素概率。

19.如權(quán)利要求17所述設(shè)備，其中，通過使用噪音模型計(jì)算噪音表現(xiàn)。

20.如權(quán)利要求19所述設(shè)備，其中，通過自動(dòng)編碼器使用訓(xùn)練噪音數(shù)據(jù)預(yù)先生成噪音模型。

21.如權(quán)利要求17所述設(shè)備，其中，聲學(xué)模型是基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型。

22.如權(quán)利要求17所述設(shè)備，其中，通過使用多任務(wù)學(xué)習(xí)方法生成聲學(xué)模型。

23.如權(quán)利要求22所述設(shè)備，其中，通過使用從第一目標(biāo)函數(shù)和第二目標(biāo)函數(shù)的加權(quán)和得到的第三目標(biāo)函數(shù)，生成聲學(xué)模型，其中，第一目標(biāo)函數(shù)用于估計(jì)音素概率，第二目標(biāo)函數(shù)用于估計(jì)噪音表現(xiàn)。

24.如權(quán)利要求17所述設(shè)備，其中，用定義為輸入數(shù)據(jù)的訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)和定義為目標(biāo)數(shù)據(jù)的與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的音素串和噪音表現(xiàn)，生成聲學(xué)模型。

25.一種語(yǔ)音識(shí)別方法，包括：

提取輸入的帶噪語(yǔ)音數(shù)據(jù)的特征；

通過使用聲學(xué)模型，計(jì)算與提取的特征相應(yīng)的音素概率，

26.如權(quán)利要求25所述方法，其中，通過使用噪音模型計(jì)算噪音表現(xiàn)。

27.如權(quán)利要求26所述方法，其中，通過自動(dòng)編碼器使用訓(xùn)練噪音數(shù)據(jù)預(yù)先生成噪音模型。

28.如權(quán)利要求25所述方法，其中，聲學(xué)模型是基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型。

29.如權(quán)利要求25所述方法，其中，通過使用多任務(wù)學(xué)習(xí)方法生成聲學(xué)模型。

30.如權(quán)利要求29所述方法，其中，通過使用從第一目標(biāo)函數(shù)和第二目標(biāo)函數(shù)的加權(quán)和得到的第三目標(biāo)函數(shù)，生成聲學(xué)模型，其中，第一目標(biāo)函數(shù)用于估計(jì)音素概率，第二目標(biāo)函數(shù)用于估計(jì)噪音表現(xiàn)。

31.如權(quán)利要求25所述方法，其中，用定義為輸入數(shù)據(jù)的訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)和定義為目標(biāo)數(shù)據(jù)的與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的音素串和噪音表現(xiàn)，生成聲學(xué)模型。

32.一種用于生成聲學(xué)模型的設(shè)備，包括：

組合器，被配置為組合語(yǔ)音數(shù)據(jù)和噪音數(shù)據(jù)以生成訓(xùn)練帶噪語(yǔ)音數(shù)據(jù)；

特征提取器，被配置為通過將用于聲學(xué)模型訓(xùn)練的帶噪語(yǔ)音數(shù)據(jù)與其他噪音數(shù)據(jù)區(qū)別開來(lái)，從帶噪語(yǔ)音數(shù)據(jù)提取特征；

聲學(xué)模型訓(xùn)練器，被配置為用來(lái)自帶噪語(yǔ)音數(shù)據(jù)的特征、與語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的音素串和噪音表現(xiàn)，訓(xùn)練聲學(xué)模型，其中，同時(shí)執(zhí)行音素的分類和噪音表現(xiàn)的提取。

33.如權(quán)利要求32所述設(shè)備，還包括：

自動(dòng)編碼器，被配置為接收噪音數(shù)據(jù)的特征的輸入以基于接收的輸入計(jì)算輸入表現(xiàn)，并基于輸入表現(xiàn)重構(gòu)最相似于所述輸入的輸出。

34.如權(quán)利要求33所述設(shè)備，其中，自動(dòng)編碼器使用訓(xùn)練噪音數(shù)據(jù)預(yù)先生成噪音模型。

35.如權(quán)利要求32所述設(shè)備，其中，生成的聲學(xué)模型是基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁(yè)1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

語(yǔ)音識(shí)別模型相關(guān)技術(shù)

如何建立語(yǔ)音識(shí)別模型相關(guān)技術(shù)

語(yǔ)音識(shí)別自動(dòng)生成字幕相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

生成聲學(xué)模型的設(shè)備和方法和用于語(yǔ)音識(shí)別的設(shè)備和方法與流程