一種自定義喚醒詞的語音喚醒方法及裝置與流程

文檔序號：40397667發(fā)布日期：2024-12-20 12:21閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>一種自定義喚醒詞的語音喚醒方法及裝置與流程

技術(shù)特征：

1.一種語音喚醒方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法還包括：

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述根據(jù)所述目標(biāo)聲學(xué)模型和所述喚醒識別器確定是否對所述語音進行響應(yīng)包括：

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述將所述語音特征和所述目標(biāo)語音特征進行對比以確定是否對所述語音進行響應(yīng)包括：

5.根據(jù)權(quán)利要求1-4任一所述的方法，其特征在于，所述根據(jù)所述目標(biāo)文本單元序列從預(yù)先訓(xùn)練的聲學(xué)模型中提取目標(biāo)聲學(xué)模型包括：

6.根據(jù)權(quán)利要求1-5所述的方法，其特征在于，所述將所述目標(biāo)喚醒詞生成所述目標(biāo)文本單元序列之前，所述方法還包括：

7.根據(jù)權(quán)利要求1-6中任一項所述的方法，其特征在于，所述目標(biāo)文本單元序列包括但不限于音素、子音素、字節(jié)對(byte?pair?encoder,bpe)編碼。

8.根據(jù)權(quán)利要求1-7所述的方法，其特征在于，所述目標(biāo)聲學(xué)模型的大小與所述目標(biāo)文本單元序列的長度正相關(guān)。

9.一種語音喚醒裝置，其特征在于，包括：

10.根據(jù)權(quán)利要求9所述的裝置，其特征在于，所述語音喚醒模塊還用于：

11.根據(jù)權(quán)利要求10所述的裝置，其特征在于，所述語音喚醒模塊還用于：

12.根據(jù)權(quán)利要求11所述的裝置，其特征在于，所述語音喚醒模塊還用于：

13.根據(jù)權(quán)利要求9-12任一所述的裝置，其特征在于，所述目標(biāo)聲學(xué)模型提取模塊還用于：

14.根據(jù)權(quán)利要求9-13所述的裝置，其特征在于，所述裝置還包括：

15.根據(jù)權(quán)利要求9-14中任一項所述的裝置，其特征在于，所述目標(biāo)文本單元序列包括但不限于音素、子音素、字節(jié)對(byte?pair?encoder,bpe)編碼。

16.根據(jù)權(quán)利要求9-15所述的裝置，其特征在于，所述目標(biāo)聲學(xué)模型的大小與所述目標(biāo)文本單元序列的長度正相關(guān)。

17.一種設(shè)備，其特征在于，包括：

18.一種計算機可讀存儲介質(zhì)，所述計算機可讀存儲介質(zhì)存儲有計算機程序，當(dāng)所述計算機程序在處理器上運行時，使得所述處理器執(zhí)行如權(quán)利要求1-8任一所述的方法。

19.一種計算機程序產(chǎn)品，其特征在于，當(dāng)所述計算機程序產(chǎn)品在處理器上運行時，使得所述處理器執(zhí)行如權(quán)利要求1-8任一所述的方法。

技術(shù)總結(jié)
本申請?zhí)峁┝艘环N自定義喚醒詞的語音喚醒方法以及裝置，該方法包括：語音數(shù)據(jù)被輸入到可自定義尺寸的語音喚醒模型中，所述語音喚醒模型輸出用于確定是否進行語音喚醒的結(jié)果，所述語音喚醒模型可自定義喚醒詞，且可根據(jù)自定義喚醒詞長度確定語音喚醒模型的尺寸。該語音喚醒模型參數(shù)量少、喚醒準確率高、算力消耗少、能耗低、可直接部署于端側(cè)設(shè)備上、并且支持用戶根據(jù)需求自定義喚醒詞。

技術(shù)研發(fā)人員：鄧利群,楊玉杰,楊宇庭,周航,陳曉
受保護的技術(shù)使用者：華為技術(shù)有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細技術(shù)資料下載

當(dāng)前第2頁1 2

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種自定義喚醒詞的語音喚醒方法及裝置與流程