亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種自定義喚醒詞的語音喚醒方法及裝置與流程

文檔序號:40397667發(fā)布日期:2024-12-20 12:21閱讀:來源:國知局

技術(shù)特征:

1.一種語音喚醒方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:

3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述目標(biāo)聲學(xué)模型和所述喚醒識別器確定是否對所述語音進行響應(yīng)包括:

4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將所述語音特征和所述目標(biāo)語音特征進行對比以確定是否對所述語音進行響應(yīng)包括:

5.根據(jù)權(quán)利要求1-4任一所述的方法,其特征在于,所述根據(jù)所述目標(biāo)文本單元序列從預(yù)先訓(xùn)練的聲學(xué)模型中提取目標(biāo)聲學(xué)模型包括:

6.根據(jù)權(quán)利要求1-5所述的方法,其特征在于,所述將所述目標(biāo)喚醒詞生成所述目標(biāo)文本單元序列之前,所述方法還包括:

7.根據(jù)權(quán)利要求1-6中任一項所述的方法,其特征在于,所述目標(biāo)文本單元序列包括但不限于音素、子音素、字節(jié)對(byte?pair?encoder,bpe)編碼。

8.根據(jù)權(quán)利要求1-7所述的方法,其特征在于,所述目標(biāo)聲學(xué)模型的大小與所述目標(biāo)文本單元序列的長度正相關(guān)。

9.一種語音喚醒裝置,其特征在于,包括:

10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述語音喚醒模塊還用于:

11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述語音喚醒模塊還用于:

12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述語音喚醒模塊還用于:

13.根據(jù)權(quán)利要求9-12任一所述的裝置,其特征在于,所述目標(biāo)聲學(xué)模型提取模塊還用于:

14.根據(jù)權(quán)利要求9-13所述的裝置,其特征在于,所述裝置還包括:

15.根據(jù)權(quán)利要求9-14中任一項所述的裝置,其特征在于,所述目標(biāo)文本單元序列包括但不限于音素、子音素、字節(jié)對(byte?pair?encoder,bpe)編碼。

16.根據(jù)權(quán)利要求9-15所述的裝置,其特征在于,所述目標(biāo)聲學(xué)模型的大小與所述目標(biāo)文本單元序列的長度正相關(guān)。

17.一種設(shè)備,其特征在于,包括:

18.一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)存儲有計算機程序,當(dāng)所述計算機程序在處理器上運行時,使得所述處理器執(zhí)行如權(quán)利要求1-8任一所述的方法。

19.一種計算機程序產(chǎn)品,其特征在于,當(dāng)所述計算機程序產(chǎn)品在處理器上運行時,使得所述處理器執(zhí)行如權(quán)利要求1-8任一所述的方法。


技術(shù)總結(jié)
本申請?zhí)峁┝艘环N自定義喚醒詞的語音喚醒方法以及裝置,該方法包括:語音數(shù)據(jù)被輸入到可自定義尺寸的語音喚醒模型中,所述語音喚醒模型輸出用于確定是否進行語音喚醒的結(jié)果,所述語音喚醒模型可自定義喚醒詞,且可根據(jù)自定義喚醒詞長度確定語音喚醒模型的尺寸。該語音喚醒模型參數(shù)量少、喚醒準確率高、算力消耗少、能耗低、可直接部署于端側(cè)設(shè)備上、并且支持用戶根據(jù)需求自定義喚醒詞。

技術(shù)研發(fā)人員:鄧利群,楊玉杰,楊宇庭,周航,陳曉
受保護的技術(shù)使用者:華為技術(shù)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/19
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1