一種智能語音電視的音視頻播放控制方法及裝置與流程

文檔序號(hào)：40462118發(fā)布日期：2024-12-27 09:27閱讀：7來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明涉及智能電視，尤其涉及一種智能語音電視的音視頻播放控制方法及裝置。

背景技術(shù)：

1、隨著人工智能技術(shù)的發(fā)展，特別是自然語言處理和語音識(shí)別技術(shù)的進(jìn)步，智能語音電視已成為現(xiàn)代家庭娛樂的重要組成部分。智能語音電視結(jié)合了先進(jìn)的語音識(shí)別技術(shù)和互聯(lián)網(wǎng)連接功能，允許用戶通過簡單的語音指令來控制電視的各種功能，包括但不限于頻道切換、內(nèi)容搜索、播放控制等，極大地提高了用戶體驗(yàn)。

2、然而，現(xiàn)有的智能語音電視在音視頻播放方面仍然存在一些挑戰(zhàn)，例如，由于語音識(shí)別結(jié)果不準(zhǔn)確導(dǎo)致的指令執(zhí)行誤差。語音識(shí)別技術(shù)雖然已經(jīng)相當(dāng)成熟，但仍受到諸如環(huán)境噪聲、說話者的口音等因素的影響，導(dǎo)致識(shí)別結(jié)果可能出現(xiàn)偏差。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明提供一種智能語音電視的音視頻播放控制方法及裝置，以解決現(xiàn)有技術(shù)中由于語音識(shí)別結(jié)果不準(zhǔn)確導(dǎo)致的智能語音電視指令執(zhí)行誤差等問題。

2、本發(fā)明提供的智能語音電視的音視頻播放控制方法，包括：

3、接收多個(gè)用戶的初始語音指令，其中，用戶與初始語音指令為一一對(duì)應(yīng)關(guān)系；

4、分別對(duì)各個(gè)所述初始語音指令進(jìn)行去噪處理，得到多個(gè)目標(biāo)語音指令；

5、分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)所述目標(biāo)語音指令進(jìn)行語音識(shí)別，得到多個(gè)目標(biāo)識(shí)別結(jié)果；

6、分別獲取各個(gè)所述用戶的歷史播放數(shù)據(jù)和用戶類別，并根據(jù)所述歷史播放數(shù)據(jù)和所述用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù)；

7、根據(jù)所述用戶播放評(píng)價(jià)參數(shù)和所述目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻，并對(duì)所述目標(biāo)音視頻進(jìn)行播放。

8、可選的，所述分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)所述目標(biāo)語音指令進(jìn)行語音識(shí)別，得到多個(gè)目標(biāo)識(shí)別結(jié)果，之前還包括：

9、獲取樣本語音數(shù)據(jù)，對(duì)所述樣本語音數(shù)據(jù)的文本信息進(jìn)行標(biāo)注，得到樣本語音數(shù)據(jù)的標(biāo)注結(jié)果；

10、根據(jù)所述樣本語音數(shù)據(jù)和所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果，形成第一樣本數(shù)據(jù)集；

11、構(gòu)建初始語音識(shí)別模型，并采用所述第一樣本數(shù)據(jù)集訓(xùn)練所述初始語音識(shí)別模型，得到所述目標(biāo)語音識(shí)別模型。

12、可選的，所述根據(jù)所述樣本語音數(shù)據(jù)和所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果，形成第一樣本數(shù)據(jù)集，之后還包括：

13、獲取新音視頻的關(guān)聯(lián)詞，并確定所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果與所述關(guān)聯(lián)詞的詞義相似度；

14、若所述詞義相似度小于詞義相似度閾值，則獲取所述關(guān)聯(lián)詞的語音數(shù)據(jù)和所述關(guān)聯(lián)詞的文本標(biāo)注結(jié)果，形成第二樣本數(shù)據(jù)集；

15、將所述第二樣本數(shù)據(jù)集合并至所述第一樣本數(shù)據(jù)集。

16、可選的，所述根據(jù)所述樣本語音數(shù)據(jù)和所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果，形成第一樣本數(shù)據(jù)集，之后還包括：

17、提取所述用戶的口音特征和所述樣本語音數(shù)據(jù)的口音特征，并獲取所述用戶的口音特征和所述樣本語音數(shù)據(jù)的口音特征的特征相似度；

18、若所述特征相似度小于特征相似度閾值，則獲取目標(biāo)口音語音數(shù)據(jù)；

19、對(duì)所述目標(biāo)口音語音數(shù)據(jù)的文本信息進(jìn)行標(biāo)注，得到所述目標(biāo)口音語音數(shù)據(jù)的標(biāo)注結(jié)果，并根據(jù)所述目標(biāo)口音語音數(shù)據(jù)和所述目標(biāo)口音語音數(shù)據(jù)的標(biāo)注結(jié)果形成第三樣本數(shù)據(jù)集；

20、將所述第三樣本數(shù)據(jù)集合并至所述第一樣本數(shù)據(jù)集。

21、可選的，所述根據(jù)所述用戶播放評(píng)價(jià)參數(shù)和所述目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻，包括：

22、若各個(gè)目標(biāo)識(shí)別結(jié)果對(duì)應(yīng)的待播放音視頻存在不一致，則分別獲取各個(gè)所述待播放音視頻的權(quán)限類型，其中，目標(biāo)識(shí)別結(jié)果與待播放視頻為一一對(duì)應(yīng)關(guān)系；

23、分別獲取各個(gè)目標(biāo)識(shí)別結(jié)果的噪聲評(píng)價(jià)參數(shù)，并根據(jù)所述噪聲評(píng)價(jià)參數(shù)和所述權(quán)限類型確定各個(gè)待播放視頻的目標(biāo)播放評(píng)價(jià)參數(shù)；

24、根據(jù)所述用戶播放評(píng)價(jià)參數(shù)和所述目標(biāo)播放評(píng)價(jià)參數(shù)確定目標(biāo)音視頻。

25、可選的，所述根據(jù)所述噪聲評(píng)價(jià)參數(shù)和所述權(quán)限類型確定各個(gè)待播放視頻的目標(biāo)播放評(píng)價(jià)參數(shù)，包括：

26、若所述權(quán)限類型為有權(quán)限類型，則獲取有權(quán)限類型的類型評(píng)價(jià)參數(shù)，并根據(jù)所述噪聲評(píng)價(jià)參數(shù)和所述類型評(píng)價(jià)參數(shù)確定各個(gè)待播放視頻的目標(biāo)播放評(píng)價(jià)參數(shù)；

27、若所述權(quán)限類型為無權(quán)限類型，則根據(jù)所述噪聲評(píng)價(jià)參數(shù)確定各個(gè)待播放視頻的目標(biāo)播放評(píng)價(jià)參數(shù)。

28、可選的，所述根據(jù)所述歷史播放數(shù)據(jù)和所述用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù)，還包括：

29、獲取所述歷史播放數(shù)據(jù)的歷史播放評(píng)價(jià)參數(shù)；

30、若所述用戶類別為注冊類別，則獲取注冊類別的類別評(píng)價(jià)參數(shù)，并根據(jù)所述類別評(píng)價(jià)參數(shù)和所述歷史播放評(píng)價(jià)參數(shù)，得到各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù)；

31、若所述用戶類別是非注冊類別，則將所述歷史播放評(píng)價(jià)參數(shù)確定為各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù)。

32、本發(fā)明還提供一種智能語音電視的音視頻播放控制裝置，包括：

33、語音接收模塊，用于接收多個(gè)用戶的初始語音指令，其中，用戶與初始語音指令為一一對(duì)應(yīng)關(guān)系；

34、語音去噪模塊，用于分別對(duì)各個(gè)所述初始語音指令進(jìn)行去噪處理，得到多個(gè)目標(biāo)語音指令；

35、語音識(shí)別模塊，用于分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)所述目標(biāo)語音指令進(jìn)行語音識(shí)別，得到多個(gè)目標(biāo)識(shí)別結(jié)果；

36、用戶參數(shù)確定模塊，用于分別獲取各個(gè)所述用戶的歷史播放數(shù)據(jù)和用戶類別，并根據(jù)所述歷史播放數(shù)據(jù)和所述用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù)；

37、音視頻播放模塊，用于根據(jù)所述用戶播放評(píng)價(jià)參數(shù)和所述目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻，并對(duì)所述目標(biāo)音視頻進(jìn)行播放。

38、本發(fā)明還提供一種電子設(shè)備，包括：處理器及存儲(chǔ)器；

39、所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序，所述處理器用于執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)程序，以使所述電子設(shè)備執(zhí)行所述智能語音電視的音視頻播放控制方法。

40、本發(fā)明還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述所述智能語音電視的音視頻播放控制方法。

41、本發(fā)明的有益效果：本發(fā)明中的智能語音電視的音視頻播放控制方法，首先接收多個(gè)用戶的初始語音指令；其次分別對(duì)各個(gè)初始語音指令進(jìn)行去噪處理，得到多個(gè)目標(biāo)語音指令；然后分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)目標(biāo)語音指令進(jìn)行語音識(shí)別，得到多個(gè)目標(biāo)識(shí)別結(jié)果；再次分別獲取各個(gè)用戶的歷史播放數(shù)據(jù)和用戶類別，并根據(jù)歷史播放數(shù)據(jù)和用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù)；最后根據(jù)用戶播放評(píng)價(jià)參數(shù)和目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻，并對(duì)所述目標(biāo)音視頻進(jìn)行播放；本發(fā)明通過對(duì)初始語音指令進(jìn)行去噪處理，并采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)目標(biāo)語音指令進(jìn)行語音識(shí)別，使得語音識(shí)別結(jié)果更準(zhǔn)確，從而解決了現(xiàn)有技術(shù)中由于語音識(shí)別結(jié)果不準(zhǔn)確導(dǎo)致的智能語音電視指令執(zhí)行誤差等問題。本發(fā)明還通過用戶播放評(píng)價(jià)參數(shù)和目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻，使得播放的音視頻更符合用戶需求，從而提升了用戶體驗(yàn)。

技術(shù)特征：

1.一種智能語音電視的音視頻播放控制方法，其特征在于，所述方法包括：

2.根據(jù)權(quán)利要求1所述的智能語音電視的音視頻播放控制方法，其特征在于，所述分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)所述目標(biāo)語音指令進(jìn)行語音識(shí)別，得到多個(gè)目標(biāo)識(shí)別結(jié)果，之前還包括：

3.根據(jù)權(quán)利要求2所述的智能語音電視的音視頻播放控制方法，其特征在于，所述根據(jù)所述樣本語音數(shù)據(jù)和所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果，形成第一樣本數(shù)據(jù)集，之后還包括：

4.根據(jù)權(quán)利要求2所述的智能語音電視的音視頻播放控制方法，其特征在于，所述根據(jù)所述樣本語音數(shù)據(jù)和所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果，形成第一樣本數(shù)據(jù)集，之后還包括：

5.根據(jù)權(quán)利要求1所述的智能語音電視的音視頻播放控制方法，其特征在于，所述根據(jù)所述用戶播放評(píng)價(jià)參數(shù)和所述目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻，包括：

6.根據(jù)權(quán)利要求5所述的智能語音電視的音視頻播放控制方法，其特征在于，所述根據(jù)所述噪聲評(píng)價(jià)參數(shù)和所述權(quán)限類型確定各個(gè)待播放視頻的目標(biāo)播放評(píng)價(jià)參數(shù)，包括：

7.根據(jù)權(quán)利要求1所述的智能語音電視的音視頻播放控制方法，其特征在于，所述根據(jù)所述歷史播放數(shù)據(jù)和所述用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù)，包括：

8.一種智能語音電視的音視頻播放控制裝置，其特征在于，所述裝置包括：

9.一種電子設(shè)備，其特征在于，包括處理器、存儲(chǔ)器和通信總線；

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，其上存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序用于使計(jì)算機(jī)執(zhí)行如權(quán)利要求1-7中任一項(xiàng)所述的方法。

技術(shù)總結(jié)
本發(fā)明適用于智能電視技術(shù)領(lǐng)域，提供了一種智能語音電視的音視頻播放控制方法及裝置，其中，方法包括：接收多個(gè)用戶的初始語音指令，用戶與初始語音指令為一一對(duì)應(yīng)關(guān)系；分別獲取各個(gè)用戶的歷史播放數(shù)據(jù)和用戶類別，并根據(jù)歷史播放數(shù)據(jù)和用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù)；分別對(duì)各個(gè)初始語音指令進(jìn)行去噪處理，得到多個(gè)目標(biāo)語音指令；分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)目標(biāo)語音指令進(jìn)行語音識(shí)別，得到多個(gè)目標(biāo)識(shí)別結(jié)果；根據(jù)用戶播放評(píng)價(jià)參數(shù)和目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻，并對(duì)目標(biāo)音視頻進(jìn)行播放；解決了現(xiàn)有技術(shù)中由于語音識(shí)別結(jié)果不準(zhǔn)確導(dǎo)致的智能語音電視指令執(zhí)行誤差等問題。

技術(shù)研發(fā)人員：何永軍,李桃,洪小青
受保護(hù)的技術(shù)使用者：惠鑫電器（深圳）有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/26

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：何永軍,李桃,洪小青
技術(shù)所有人：惠鑫電器（深圳）有限公司
我是此專利的發(fā)明人

上一篇：一種開關(guān)電源過溫保護(hù)控制電路
上一篇：一種液壓設(shè)備供油管路除雜結(jié)構(gòu)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測試系統(tǒng)設(shè)計(jì) 2.汽車檢測系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

智能語音電視相關(guān)技術(shù)

多媒體播放控制系統(tǒng)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種智能語音電視的音視頻播放控制方法及裝置與流程