本發(fā)明涉及智能電視,尤其涉及一種智能語音電視的音視頻播放控制方法及裝置。
背景技術(shù):
1、隨著人工智能技術(shù)的發(fā)展,特別是自然語言處理和語音識(shí)別技術(shù)的進(jìn)步,智能語音電視已成為現(xiàn)代家庭娛樂的重要組成部分。智能語音電視結(jié)合了先進(jìn)的語音識(shí)別技術(shù)和互聯(lián)網(wǎng)連接功能,允許用戶通過簡單的語音指令來控制電視的各種功能,包括但不限于頻道切換、內(nèi)容搜索、播放控制等,極大地提高了用戶體驗(yàn)。
2、然而,現(xiàn)有的智能語音電視在音視頻播放方面仍然存在一些挑戰(zhàn),例如,由于語音識(shí)別結(jié)果不準(zhǔn)確導(dǎo)致的指令執(zhí)行誤差。語音識(shí)別技術(shù)雖然已經(jīng)相當(dāng)成熟,但仍受到諸如環(huán)境噪聲、說話者的口音等因素的影響,導(dǎo)致識(shí)別結(jié)果可能出現(xiàn)偏差。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種智能語音電視的音視頻播放控制方法及裝置,以解決現(xiàn)有技術(shù)中由于語音識(shí)別結(jié)果不準(zhǔn)確導(dǎo)致的智能語音電視指令執(zhí)行誤差等問題。
2、本發(fā)明提供的智能語音電視的音視頻播放控制方法,包括:
3、接收多個(gè)用戶的初始語音指令,其中,用戶與初始語音指令為一一對(duì)應(yīng)關(guān)系;
4、分別對(duì)各個(gè)所述初始語音指令進(jìn)行去噪處理,得到多個(gè)目標(biāo)語音指令;
5、分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)所述目標(biāo)語音指令進(jìn)行語音識(shí)別,得到多個(gè)目標(biāo)識(shí)別結(jié)果;
6、分別獲取各個(gè)所述用戶的歷史播放數(shù)據(jù)和用戶類別,并根據(jù)所述歷史播放數(shù)據(jù)和所述用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù);
7、根據(jù)所述用戶播放評(píng)價(jià)參數(shù)和所述目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻,并對(duì)所述目標(biāo)音視頻進(jìn)行播放。
8、可選的,所述分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)所述目標(biāo)語音指令進(jìn)行語音識(shí)別,得到多個(gè)目標(biāo)識(shí)別結(jié)果,之前還包括:
9、獲取樣本語音數(shù)據(jù),對(duì)所述樣本語音數(shù)據(jù)的文本信息進(jìn)行標(biāo)注,得到樣本語音數(shù)據(jù)的標(biāo)注結(jié)果;
10、根據(jù)所述樣本語音數(shù)據(jù)和所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果,形成第一樣本數(shù)據(jù)集;
11、構(gòu)建初始語音識(shí)別模型,并采用所述第一樣本數(shù)據(jù)集訓(xùn)練所述初始語音識(shí)別模型,得到所述目標(biāo)語音識(shí)別模型。
12、可選的,所述根據(jù)所述樣本語音數(shù)據(jù)和所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果,形成第一樣本數(shù)據(jù)集,之后還包括:
13、獲取新音視頻的關(guān)聯(lián)詞,并確定所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果與所述關(guān)聯(lián)詞的詞義相似度;
14、若所述詞義相似度小于詞義相似度閾值,則獲取所述關(guān)聯(lián)詞的語音數(shù)據(jù)和所述關(guān)聯(lián)詞的文本標(biāo)注結(jié)果,形成第二樣本數(shù)據(jù)集;
15、將所述第二樣本數(shù)據(jù)集合并至所述第一樣本數(shù)據(jù)集。
16、可選的,所述根據(jù)所述樣本語音數(shù)據(jù)和所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果,形成第一樣本數(shù)據(jù)集,之后還包括:
17、提取所述用戶的口音特征和所述樣本語音數(shù)據(jù)的口音特征,并獲取所述用戶的口音特征和所述樣本語音數(shù)據(jù)的口音特征的特征相似度;
18、若所述特征相似度小于特征相似度閾值,則獲取目標(biāo)口音語音數(shù)據(jù);
19、對(duì)所述目標(biāo)口音語音數(shù)據(jù)的文本信息進(jìn)行標(biāo)注,得到所述目標(biāo)口音語音數(shù)據(jù)的標(biāo)注結(jié)果,并根據(jù)所述目標(biāo)口音語音數(shù)據(jù)和所述目標(biāo)口音語音數(shù)據(jù)的標(biāo)注結(jié)果形成第三樣本數(shù)據(jù)集;
20、將所述第三樣本數(shù)據(jù)集合并至所述第一樣本數(shù)據(jù)集。
21、可選的,所述根據(jù)所述用戶播放評(píng)價(jià)參數(shù)和所述目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻,包括:
22、若各個(gè)目標(biāo)識(shí)別結(jié)果對(duì)應(yīng)的待播放音視頻存在不一致,則分別獲取各個(gè)所述待播放音視頻的權(quán)限類型,其中,目標(biāo)識(shí)別結(jié)果與待播放視頻為一一對(duì)應(yīng)關(guān)系;
23、分別獲取各個(gè)目標(biāo)識(shí)別結(jié)果的噪聲評(píng)價(jià)參數(shù),并根據(jù)所述噪聲評(píng)價(jià)參數(shù)和所述權(quán)限類型確定各個(gè)待播放視頻的目標(biāo)播放評(píng)價(jià)參數(shù);
24、根據(jù)所述用戶播放評(píng)價(jià)參數(shù)和所述目標(biāo)播放評(píng)價(jià)參數(shù)確定目標(biāo)音視頻。
25、可選的,所述根據(jù)所述噪聲評(píng)價(jià)參數(shù)和所述權(quán)限類型確定各個(gè)待播放視頻的目標(biāo)播放評(píng)價(jià)參數(shù),包括:
26、若所述權(quán)限類型為有權(quán)限類型,則獲取有權(quán)限類型的類型評(píng)價(jià)參數(shù),并根據(jù)所述噪聲評(píng)價(jià)參數(shù)和所述類型評(píng)價(jià)參數(shù)確定各個(gè)待播放視頻的目標(biāo)播放評(píng)價(jià)參數(shù);
27、若所述權(quán)限類型為無權(quán)限類型,則根據(jù)所述噪聲評(píng)價(jià)參數(shù)確定各個(gè)待播放視頻的目標(biāo)播放評(píng)價(jià)參數(shù)。
28、可選的,所述根據(jù)所述歷史播放數(shù)據(jù)和所述用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù),還包括:
29、獲取所述歷史播放數(shù)據(jù)的歷史播放評(píng)價(jià)參數(shù);
30、若所述用戶類別為注冊類別,則獲取注冊類別的類別評(píng)價(jià)參數(shù),并根據(jù)所述類別評(píng)價(jià)參數(shù)和所述歷史播放評(píng)價(jià)參數(shù),得到各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù);
31、若所述用戶類別是非注冊類別,則將所述歷史播放評(píng)價(jià)參數(shù)確定為各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù)。
32、本發(fā)明還提供一種智能語音電視的音視頻播放控制裝置,包括:
33、語音接收模塊,用于接收多個(gè)用戶的初始語音指令,其中,用戶與初始語音指令為一一對(duì)應(yīng)關(guān)系;
34、語音去噪模塊,用于分別對(duì)各個(gè)所述初始語音指令進(jìn)行去噪處理,得到多個(gè)目標(biāo)語音指令;
35、語音識(shí)別模塊,用于分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)所述目標(biāo)語音指令進(jìn)行語音識(shí)別,得到多個(gè)目標(biāo)識(shí)別結(jié)果;
36、用戶參數(shù)確定模塊,用于分別獲取各個(gè)所述用戶的歷史播放數(shù)據(jù)和用戶類別,并根據(jù)所述歷史播放數(shù)據(jù)和所述用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù);
37、音視頻播放模塊,用于根據(jù)所述用戶播放評(píng)價(jià)參數(shù)和所述目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻,并對(duì)所述目標(biāo)音視頻進(jìn)行播放。
38、本發(fā)明還提供一種電子設(shè)備,包括:處理器及存儲(chǔ)器;
39、所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序,所述處理器用于執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)程序,以使所述電子設(shè)備執(zhí)行所述智能語音電視的音視頻播放控制方法。
40、本發(fā)明還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述所述智能語音電視的音視頻播放控制方法。
41、本發(fā)明的有益效果:本發(fā)明中的智能語音電視的音視頻播放控制方法,首先接收多個(gè)用戶的初始語音指令;其次分別對(duì)各個(gè)初始語音指令進(jìn)行去噪處理,得到多個(gè)目標(biāo)語音指令;然后分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)目標(biāo)語音指令進(jìn)行語音識(shí)別,得到多個(gè)目標(biāo)識(shí)別結(jié)果;再次分別獲取各個(gè)用戶的歷史播放數(shù)據(jù)和用戶類別,并根據(jù)歷史播放數(shù)據(jù)和用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù);最后根據(jù)用戶播放評(píng)價(jià)參數(shù)和目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻,并對(duì)所述目標(biāo)音視頻進(jìn)行播放;本發(fā)明通過對(duì)初始語音指令進(jìn)行去噪處理,并采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)目標(biāo)語音指令進(jìn)行語音識(shí)別,使得語音識(shí)別結(jié)果更準(zhǔn)確,從而解決了現(xiàn)有技術(shù)中由于語音識(shí)別結(jié)果不準(zhǔn)確導(dǎo)致的智能語音電視指令執(zhí)行誤差等問題。本發(fā)明還通過用戶播放評(píng)價(jià)參數(shù)和目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻,使得播放的音視頻更符合用戶需求,從而提升了用戶體驗(yàn)。
1.一種智能語音電視的音視頻播放控制方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的智能語音電視的音視頻播放控制方法,其特征在于,所述分別采用預(yù)先訓(xùn)練的目標(biāo)語音識(shí)別模型對(duì)各個(gè)所述目標(biāo)語音指令進(jìn)行語音識(shí)別,得到多個(gè)目標(biāo)識(shí)別結(jié)果,之前還包括:
3.根據(jù)權(quán)利要求2所述的智能語音電視的音視頻播放控制方法,其特征在于,所述根據(jù)所述樣本語音數(shù)據(jù)和所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果,形成第一樣本數(shù)據(jù)集,之后還包括:
4.根據(jù)權(quán)利要求2所述的智能語音電視的音視頻播放控制方法,其特征在于,所述根據(jù)所述樣本語音數(shù)據(jù)和所述樣本語音數(shù)據(jù)的標(biāo)注結(jié)果,形成第一樣本數(shù)據(jù)集,之后還包括:
5.根據(jù)權(quán)利要求1所述的智能語音電視的音視頻播放控制方法,其特征在于,所述根據(jù)所述用戶播放評(píng)價(jià)參數(shù)和所述目標(biāo)識(shí)別結(jié)果確定目標(biāo)音視頻,包括:
6.根據(jù)權(quán)利要求5所述的智能語音電視的音視頻播放控制方法,其特征在于,所述根據(jù)所述噪聲評(píng)價(jià)參數(shù)和所述權(quán)限類型確定各個(gè)待播放視頻的目標(biāo)播放評(píng)價(jià)參數(shù),包括:
7.根據(jù)權(quán)利要求1所述的智能語音電視的音視頻播放控制方法,其特征在于,所述根據(jù)所述歷史播放數(shù)據(jù)和所述用戶類別確定各個(gè)用戶的用戶播放評(píng)價(jià)參數(shù),包括:
8.一種智能語音電視的音視頻播放控制裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,包括處理器、存儲(chǔ)器和通信總線;
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序用于使計(jì)算機(jī)執(zhí)行如權(quán)利要求1-7中任一項(xiàng)所述的方法。