亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種語(yǔ)音輸出方法、裝置、設(shè)備及其存儲(chǔ)介質(zhì)與流程

文檔序號(hào):40458281發(fā)布日期:2024-12-27 09:23閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.一種語(yǔ)音輸出方法,其特征在于,包括下述步驟:

2.根據(jù)權(quán)利要求1所述的語(yǔ)音輸出方法,其特征在于,所述分別對(duì)所述第一語(yǔ)音片段、第二語(yǔ)音片段和第三語(yǔ)音片段進(jìn)行預(yù)處理,獲得預(yù)處理后的第一語(yǔ)音片段、第二語(yǔ)音片段和第三語(yǔ)音片段的步驟,具體包括:

3.根據(jù)權(quán)利要求2所述的語(yǔ)音輸出方法,其特征在于,所述對(duì)當(dāng)前待處理語(yǔ)音片段進(jìn)行音頻和文本分離處理,獲得分離后成對(duì)的音頻數(shù)據(jù)和文本數(shù)據(jù)的步驟,具體包括:

4.根據(jù)權(quán)利要求1所述的語(yǔ)音輸出方法,其特征在于,所述多模態(tài)信息融合模型包括音頻特征編碼組件、文本特征編碼組件、特征向量拼接融合組件和語(yǔ)音輸出組件,在執(zhí)行所述將預(yù)處理后的第一語(yǔ)音片段、第二語(yǔ)音片段和第三語(yǔ)音片段輸入到預(yù)設(shè)的多模態(tài)信息融合模型,根據(jù)所述多模態(tài)信息融合模型預(yù)測(cè)所述第三語(yǔ)音片段的輸出情感類型的步驟之前,所述方法還包括:

5.根據(jù)權(quán)利要求4所述的語(yǔ)音輸出方法,其特征在于,所述將預(yù)處理后的第一語(yǔ)音片段、第二語(yǔ)音片段和第三語(yǔ)音片段輸入到預(yù)設(shè)的多模態(tài)信息融合模型,根據(jù)所述多模態(tài)信息融合模型預(yù)測(cè)所述第三語(yǔ)音片段的輸出情感類型的步驟,具體包括:

6.根據(jù)權(quán)利要求5所述的語(yǔ)音輸出方法,其特征在于,在執(zhí)行所述采用所述特征向量拼接融合組件,拼接融合第三語(yǔ)音片段的音頻特征編碼信息和文本特征編碼信息,獲得融合后的最終特征向量的步驟之前,所述方法還包括:

7.根據(jù)權(quán)利要求4所述的語(yǔ)音輸出方法,其特征在于,所述控制所述當(dāng)前發(fā)音對(duì)象以所述輸出情感類型輸出所述第三語(yǔ)音片段的步驟,具體包括:

8.一種語(yǔ)音輸出裝置,其特征在于,包括:

9.一種計(jì)算機(jī)設(shè)備,其特征在于,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)可讀指令,所述處理器執(zhí)行所述計(jì)算機(jī)可讀指令時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的語(yǔ)音輸出方法的步驟。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)可讀指令,所述計(jì)算機(jī)可讀指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的語(yǔ)音輸出方法的步驟。


技術(shù)總結(jié)
本申請(qǐng)實(shí)施例屬于語(yǔ)音處理技術(shù)領(lǐng)域,應(yīng)用于智能客服語(yǔ)音輸出場(chǎng)景中,涉及一種語(yǔ)音輸出方法、裝置、設(shè)備及其存儲(chǔ)介質(zhì),通過(guò)獲取一問(wèn)一答對(duì)話形式的語(yǔ)音片段;進(jìn)行預(yù)處理,獲得預(yù)處理后的語(yǔ)音片段;將預(yù)處理后的語(yǔ)音片段輸入到多模態(tài)信息融合模型,預(yù)測(cè)目標(biāo)語(yǔ)音片段的輸出情感類型;控制當(dāng)前發(fā)音對(duì)象以輸出情感類型輸出目標(biāo)語(yǔ)音片段。將所述語(yǔ)音輸出方法應(yīng)用到智能語(yǔ)音客服應(yīng)答場(chǎng)景中,使得智能語(yǔ)音客服充分考慮到上下文信息,從音頻數(shù)據(jù)和文本數(shù)據(jù)中獲取情感信息,使得輸出的語(yǔ)音片段情感更加豐富,更加貼合實(shí)際的語(yǔ)音咨詢問(wèn)答場(chǎng)景,同時(shí),在智能語(yǔ)音客服對(duì)話上,引入了情感類型,避免輸出的智能語(yǔ)音太過(guò)機(jī)械化,提升客戶的對(duì)話體驗(yàn)。

技術(shù)研發(fā)人員:張旭龍,王健宗,程寧,孫一夫
受保護(hù)的技術(shù)使用者:平安科技(深圳)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/26
當(dāng)前第2頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1