一種語(yǔ)音輸出方法、裝置、設(shè)備及其存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：40458281發(fā)布日期：2024-12-27 09:23閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>一種語(yǔ)音輸出方法、裝置、設(shè)備及其存儲(chǔ)介質(zhì)與流程

技術(shù)特征：

1.一種語(yǔ)音輸出方法，其特征在于，包括下述步驟：

2.根據(jù)權(quán)利要求1所述的語(yǔ)音輸出方法，其特征在于，所述分別對(duì)所述第一語(yǔ)音片段、第二語(yǔ)音片段和第三語(yǔ)音片段進(jìn)行預(yù)處理，獲得預(yù)處理后的第一語(yǔ)音片段、第二語(yǔ)音片段和第三語(yǔ)音片段的步驟，具體包括：

3.根據(jù)權(quán)利要求2所述的語(yǔ)音輸出方法，其特征在于，所述對(duì)當(dāng)前待處理語(yǔ)音片段進(jìn)行音頻和文本分離處理，獲得分離后成對(duì)的音頻數(shù)據(jù)和文本數(shù)據(jù)的步驟，具體包括：

4.根據(jù)權(quán)利要求1所述的語(yǔ)音輸出方法，其特征在于，所述多模態(tài)信息融合模型包括音頻特征編碼組件、文本特征編碼組件、特征向量拼接融合組件和語(yǔ)音輸出組件，在執(zhí)行所述將預(yù)處理后的第一語(yǔ)音片段、第二語(yǔ)音片段和第三語(yǔ)音片段輸入到預(yù)設(shè)的多模態(tài)信息融合模型，根據(jù)所述多模態(tài)信息融合模型預(yù)測(cè)所述第三語(yǔ)音片段的輸出情感類型的步驟之前，所述方法還包括：

5.根據(jù)權(quán)利要求4所述的語(yǔ)音輸出方法，其特征在于，所述將預(yù)處理后的第一語(yǔ)音片段、第二語(yǔ)音片段和第三語(yǔ)音片段輸入到預(yù)設(shè)的多模態(tài)信息融合模型，根據(jù)所述多模態(tài)信息融合模型預(yù)測(cè)所述第三語(yǔ)音片段的輸出情感類型的步驟，具體包括：

6.根據(jù)權(quán)利要求5所述的語(yǔ)音輸出方法，其特征在于，在執(zhí)行所述采用所述特征向量拼接融合組件，拼接融合第三語(yǔ)音片段的音頻特征編碼信息和文本特征編碼信息，獲得融合后的最終特征向量的步驟之前，所述方法還包括：

7.根據(jù)權(quán)利要求4所述的語(yǔ)音輸出方法，其特征在于，所述控制所述當(dāng)前發(fā)音對(duì)象以所述輸出情感類型輸出所述第三語(yǔ)音片段的步驟，具體包括：

8.一種語(yǔ)音輸出裝置，其特征在于，包括：

9.一種計(jì)算機(jī)設(shè)備，其特征在于，包括存儲(chǔ)器和處理器，所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)可讀指令，所述處理器執(zhí)行所述計(jì)算機(jī)可讀指令時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的語(yǔ)音輸出方法的步驟。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)可讀指令，所述計(jì)算機(jī)可讀指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的語(yǔ)音輸出方法的步驟。

技術(shù)總結(jié)
本申請(qǐng)實(shí)施例屬于語(yǔ)音處理技術(shù)領(lǐng)域，應(yīng)用于智能客服語(yǔ)音輸出場(chǎng)景中，涉及一種語(yǔ)音輸出方法、裝置、設(shè)備及其存儲(chǔ)介質(zhì)，通過(guò)獲取一問(wèn)一答對(duì)話形式的語(yǔ)音片段；進(jìn)行預(yù)處理，獲得預(yù)處理后的語(yǔ)音片段；將預(yù)處理后的語(yǔ)音片段輸入到多模態(tài)信息融合模型，預(yù)測(cè)目標(biāo)語(yǔ)音片段的輸出情感類型；控制當(dāng)前發(fā)音對(duì)象以輸出情感類型輸出目標(biāo)語(yǔ)音片段。將所述語(yǔ)音輸出方法應(yīng)用到智能語(yǔ)音客服應(yīng)答場(chǎng)景中，使得智能語(yǔ)音客服充分考慮到上下文信息，從音頻數(shù)據(jù)和文本數(shù)據(jù)中獲取情感信息，使得輸出的語(yǔ)音片段情感更加豐富，更加貼合實(shí)際的語(yǔ)音咨詢問(wèn)答場(chǎng)景，同時(shí)，在智能語(yǔ)音客服對(duì)話上，引入了情感類型，避免輸出的智能語(yǔ)音太過(guò)機(jī)械化，提升客戶的對(duì)話體驗(yàn)。

技術(shù)研發(fā)人員：張旭龍,王健宗,程寧,孫一夫
受保護(hù)的技術(shù)使用者：平安科技（深圳）有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/26

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁(yè)1 2

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種語(yǔ)音輸出方法、裝置、設(shè)備及其存儲(chǔ)介質(zhì)與流程

一種語(yǔ)音輸出方法、裝置、設(shè)備及其存儲(chǔ)介質(zhì)與流程