一種語音交互系統(tǒng)及語音交互方法與流程

文檔序號：40440546發(fā)布日期：2024-12-24 15:14閱讀：12來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及語音交互，具體為一種語音交互系統(tǒng)及語音交互方法。

背景技術(shù)：

1、音箱是整個(gè)音響系統(tǒng)的終端，其作用是把音頻電能轉(zhuǎn)換成相應(yīng)的聲能，并把它輻射到空間去。它是音響系統(tǒng)極其重要的組成部分，因?yàn)樗鼡?dān)負(fù)著把電信號轉(zhuǎn)變成聲信號供人的耳朵直接聆聽這么一個(gè)關(guān)鍵任務(wù)，可以認(rèn)為，音箱的性能高低對一個(gè)音響系統(tǒng)的放音質(zhì)量是起著關(guān)鍵作用。一般的音箱接上電源，接上外部設(shè)備，如手機(jī)、電腦、mp3等，向其輸送音頻數(shù)據(jù)時(shí)，音箱能夠根據(jù)數(shù)據(jù)進(jìn)行播放。

2、經(jīng)檢索，中國專利號為cn110503943b的專利，公開了一種語音交互方法以及語音交互系統(tǒng)。該方法包括：預(yù)處理步驟，對輸入的語音信息進(jìn)行預(yù)處理并輸出語音段；語義識別步驟，對所述預(yù)處理步驟輸出的語音段進(jìn)行語義識別并輸出語義信息；性別分類步驟，對所述預(yù)處理步驟輸出的語音段識別出用戶性別并輸出性別信息；以及融合處理步驟，融合所述性別信息和所述語義信息而獲得對于所述語音信息的個(gè)性化回復(fù)信息。根據(jù)本發(fā)明的音交互方法以及語音交互系統(tǒng)，能夠根據(jù)用戶的性別進(jìn)行區(qū)分回復(fù)，提高用戶體驗(yàn)，提高語音交互的智能化。

3、經(jīng)檢索，中國專利號為cn110503943a的專利，公開了一種語音交互方法以及語音交互系統(tǒng)。該方法包括：預(yù)處理步驟，對輸入的語音信息進(jìn)行預(yù)處理并輸出語音段；語義識別步驟，對所述預(yù)處理步驟輸出的語音段進(jìn)行語義識別并輸出語義信息；性別分類步驟，對所述預(yù)處理步驟輸出的語音段識別出用戶性別并輸出性別信息；以及融合處理步驟，融合所述性別信息和所述語義信息而獲得對于所述語音信息的個(gè)性化回復(fù)信息。根據(jù)本發(fā)明的音交互方法以及語音交互系統(tǒng)，能夠根據(jù)用戶的性別進(jìn)行區(qū)分回復(fù)，提高用戶體驗(yàn)，提高語音交互的智能化。

4、但現(xiàn)有的語音交互系統(tǒng)對于用戶的個(gè)性化需求支持不足，每個(gè)用戶都有自己的語言習(xí)慣和表達(dá)方式，而傳統(tǒng)的語音交互系統(tǒng)往往只能識別和處理標(biāo)準(zhǔn)化的語音指令，對于用戶的個(gè)性化需求難以滿足，限制了語音交互系統(tǒng)的應(yīng)用場景和用戶體驗(yàn)。基于此，本發(fā)明設(shè)計(jì)了一種語音交互系統(tǒng)及語音交互方法，以解決上述問題。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的目的在于提供一種語音交互系統(tǒng)及語音交互方法，解決了背景技術(shù)中個(gè)性化難以滿足的問題。

2、為了解決上述技術(shù)問題，本發(fā)明提供如下技術(shù)方案：一種語音交互系統(tǒng)，包括語音采集模塊、語音識別模塊、語義理解模塊、響應(yīng)生成模塊、輸出模塊和控制模塊；

3、所述語音采集模塊用于采集用戶的語音輸入，并將采集到的語音信號轉(zhuǎn)換為數(shù)字信號；

4、所述語音識別模塊與語音采集模塊配合，用于接收數(shù)字信號，對數(shù)字信號進(jìn)行語音識別處理，將數(shù)字信號轉(zhuǎn)換為文本信息；

5、所述語義理解模塊與語音識別模塊配合，用于接收文本信息，對文本信息進(jìn)行語義分析和理解，確定用戶的意圖和需求；

6、所述響應(yīng)生成模塊與語義理解模塊連接，根據(jù)用戶的意圖和需求，生成相應(yīng)的響應(yīng)文本或語音信號；

7、所述輸出模塊與響應(yīng)生成模塊配合，用于將響應(yīng)文本或語音信號輸出給用戶；

8、所述控制模塊與其他各所述模塊連接，用于協(xié)調(diào)和控制各模塊之間的數(shù)據(jù)交互和功能執(zhí)行。

9、一種語音交互系統(tǒng)的語音交互方法，

10、步驟s1：通過所述語音采集模塊采集用戶的語音輸入，并將采集到的語音信號轉(zhuǎn)換為數(shù)字信號，并輸入至所述語音識別模塊進(jìn)行語音識別處理；

11、步驟s2：所述語音識別模塊處理接收數(shù)字信號后，將語音信號轉(zhuǎn)換為文本信息，便于后續(xù)的分析與理解；

12、步驟s3：將文本信息輸入至所述語義理解模塊進(jìn)行語義分析和理解，確定用戶的意圖和需求；

13、步驟s4：根據(jù)用戶的意圖和需求，通過所述響應(yīng)生成模塊生成相應(yīng)的響應(yīng)文本或語音信號；

14、步驟s5：將響應(yīng)文本或語音信號通過所述輸出模塊輸出給用戶，所述控制模塊與各模塊連接，用于協(xié)調(diào)和控制各模塊之間的數(shù)據(jù)交互和功能執(zhí)行。

15、優(yōu)選的，所述語音采集模塊包括拾音模塊與第一主控模塊，所述拾音模塊包括多個(gè)以陣列方式排布的麥克風(fēng)，用于聲音的接收；所述語音識別模塊還包括usb接入判斷模塊。

16、優(yōu)選的，所述語音識別模塊包括cpu控制處理模塊與第二主控模塊，采用深度學(xué)習(xí)算法進(jìn)行語音識別處理，能夠識別多種語言和口音的語音信號。

17、優(yōu)選的，所述語義理解模塊包括知識庫子模塊與第三主控模塊，用于存儲與用戶意圖和關(guān)鍵信息相關(guān)的領(lǐng)域知識，輔助所述語義理解模塊進(jìn)行意圖識別和關(guān)鍵信息提取，所述第三主控模塊與cpu控制處理模塊之間為電性連接；所述語音識別處理還包括性別分類處理與統(tǒng)一處理，識別出用戶性別并輸出性別信息，并統(tǒng)一處理性別信息和語義信息而獲得對于所述語音信息的個(gè)性化回復(fù)信息。

18、優(yōu)選的，所述響應(yīng)生成模塊包括個(gè)性化響應(yīng)子模塊，用于根據(jù)用戶的個(gè)人偏好和歷史交互記錄生成個(gè)性化的響應(yīng)內(nèi)容；所述輸出模塊包括音頻口與喇叭，用于聲音的最終傳遞。

19、優(yōu)選的，所述控制模塊與cpu控制處理模塊之間為電性連接，所述控制模塊還包括濾波器模塊，用于提取與構(gòu)造濾波器的輸出聲學(xué)特征，將濾波器的輸出聲學(xué)特征以及文件輸入整體模型中進(jìn)行模型訓(xùn)練直至模型收斂。

20、優(yōu)選的，所述步驟s2中，所述語音識別模塊還包括噪聲抑制子模塊，用于對數(shù)字信號進(jìn)行噪聲抑制處理，以提高語音識別的準(zhǔn)確性。

21、優(yōu)選的，所述步驟s3中，還包括利用知識庫子模塊中的領(lǐng)域知識輔助語義理解模塊進(jìn)行意圖識別和關(guān)鍵信息提取。

22、優(yōu)選的，所述步驟s4中，還包括利用個(gè)性化響應(yīng)子模塊根據(jù)用戶的個(gè)人偏好和歷史交互記錄生成個(gè)性化的響應(yīng)內(nèi)容。

23、與現(xiàn)有技術(shù)相比，本發(fā)明所達(dá)到的有益效果是：

24、1、本發(fā)明，語義理解模塊的知識庫子模塊用于存儲與用戶意圖和關(guān)鍵信息相關(guān)的領(lǐng)域知識，為語義理解和意圖識別提供豐富的背景信息，而第三主控模塊負(fù)責(zé)控制語義理解過程，將文本信息輸入到知識庫中進(jìn)行比對和分析，確定用戶的意圖和需求，提高對使用者的適配度，滿足用戶的個(gè)性化需求。

25、2、本發(fā)明，語音識別模塊的cpu控制處理模塊作為該模塊的核心處理器，負(fù)責(zé)執(zhí)行語音識別算法，將數(shù)字信號轉(zhuǎn)換為文本信息。第二主控模塊與cpu控制處理模塊協(xié)同工作，管理整個(gè)識別過程，包括數(shù)據(jù)的接收、處理和輸出。噪聲抑制子模塊對數(shù)字信號進(jìn)行噪聲抑制處理，去除背景噪聲、回聲等干擾因素，提高語音識別的準(zhǔn)確性。

技術(shù)特征：

1.一種語音交互系統(tǒng)，包括語音采集模塊、語音識別模塊、語義理解模塊、響應(yīng)生成模塊、輸出模塊和控制模塊，其特征在于：

2.根據(jù)權(quán)利要求1所述的一種語音交互系統(tǒng)的語音交互方法，其特征在于：包括以下步驟：

3.根據(jù)權(quán)利要求1所述的一種語音交互系統(tǒng)，其特征在于：所述語音采集模塊包括拾音模塊與第一主控模塊，所述拾音模塊包括多個(gè)以陣列方式排布的麥克風(fēng)，用于聲音的接收；所述語音識別模塊還包括usb接入判斷模塊。

4.根據(jù)權(quán)利要求1所述的一種語音交互系統(tǒng)，其特征在于：所述語音識別模塊包括cpu控制處理模塊與第二主控模塊，采用深度學(xué)習(xí)算法進(jìn)行語音識別處理，能夠識別多種語言和口音的語音信號。

5.根據(jù)權(quán)利要求1所述的一種語音交互系統(tǒng)，其特征在于：所述語義理解模塊包括知識庫子模塊與第三主控模塊，用于存儲與用戶意圖和關(guān)鍵信息相關(guān)的領(lǐng)域知識，輔助所述語義理解模塊進(jìn)行意圖識別和關(guān)鍵信息提取，所述第三主控模塊與cpu控制處理模塊之間為電性連接；所述語音識別處理還包括性別分類處理與統(tǒng)一處理，識別出用戶性別并輸出性別信息，并統(tǒng)一處理性別信息和語義信息而獲得對于所述語音信息的個(gè)性化回復(fù)信息。

6.根據(jù)權(quán)利要求1所述的一種語音交互系統(tǒng)，其特征在于：所述響應(yīng)生成模塊包括個(gè)性化響應(yīng)子模塊，用于根據(jù)用戶的個(gè)人偏好和歷史交互記錄生成個(gè)性化的響應(yīng)內(nèi)容；所述輸出模塊包括音頻口與喇叭，用于聲音的最終傳遞。

7.根據(jù)權(quán)利要求1所述的一種語音交互系統(tǒng)，其特征在于：所述控制模塊與cpu控制處理模塊之間為電性連接，所述控制模塊還包括濾波器模塊，用于提取與構(gòu)造濾波器的輸出聲學(xué)特征，將濾波器的輸出聲學(xué)特征以及文件輸入整體模型中進(jìn)行模型訓(xùn)練直至模型收斂。

8.根據(jù)權(quán)利要求2所述的一種語音交互方法，其特征在于：所述步驟s2中，所述語音識別模塊還包括噪聲抑制子模塊，用于對數(shù)字信號進(jìn)行噪聲抑制處理，以提高語音識別的準(zhǔn)確性。

9.根據(jù)權(quán)利要求2所述的一種語音交互方法，其特征在于：所述步驟s3中，還包括利用知識庫子模塊中的領(lǐng)域知識輔助語義理解模塊進(jìn)行意圖識別和關(guān)鍵信息提取。

10.根據(jù)權(quán)利要求2所述的一種語音交互方法，其特征在于：所述步驟s4中，還包括利用個(gè)性化響應(yīng)子模塊根據(jù)用戶的個(gè)人偏好和歷史交互記錄生成個(gè)性化的響應(yīng)內(nèi)容。

技術(shù)總結(jié)
本發(fā)明涉及語音交互技術(shù)領(lǐng)域，且公開了一種語音交互系統(tǒng)及語音交互方法，一種語音交互系統(tǒng)，包括語音采集模塊、語音識別模塊、語義理解模塊、響應(yīng)生成模塊、輸出模塊和控制模塊；語音采集模塊用于采集用戶的語音輸入，并將采集到的語音信號轉(zhuǎn)換為數(shù)字信號；語音識別模塊與語音采集模塊配合，用于接收數(shù)字信號，對數(shù)字信號進(jìn)行語音識別處理，將數(shù)字信號轉(zhuǎn)換為文本信息。本發(fā)明，語義理解模塊的知識庫子模塊用于存儲與用戶意圖和關(guān)鍵信息相關(guān)的領(lǐng)域知識，為語義理解和意圖識別提供豐富的背景信息，而第三主控模塊負(fù)責(zé)控制語義理解過程，將文本信息輸入到知識庫中進(jìn)行比對和分析，確定用戶的意圖和需求，提高對使用者的適配度。

技術(shù)研發(fā)人員：張運(yùn)紅,楊毅,司峰,趙靜,劉國利,魯瑩瑩,周穎彤
受保護(hù)的技術(shù)使用者：中國標(biāo)準(zhǔn)化研究院
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/23

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張運(yùn)紅,楊毅,司峰,趙靜,劉國利,魯瑩瑩,周穎彤
技術(shù)所有人：中國標(biāo)準(zhǔn)化研究院
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種語音交互系統(tǒng)及語音交互方法與流程