語(yǔ)音欺詐分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：40458730發(fā)布日期：2024-12-27 09:23閱讀：9來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

語(yǔ)音欺詐分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)與流程

本發(fā)明涉及人工智能領(lǐng)域，尤其涉及一種語(yǔ)音欺詐分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、現(xiàn)有技術(shù)在語(yǔ)音欺詐分析領(lǐng)域主要依賴(lài)于傳統(tǒng)的語(yǔ)音識(shí)別和基于規(guī)則的檢測(cè)系統(tǒng)。這些方法在處理簡(jiǎn)單、直接的欺詐行為時(shí)可能有效，但在面對(duì)復(fù)雜對(duì)話和多聲道數(shù)據(jù)時(shí)，其準(zhǔn)確性和實(shí)時(shí)性往往受限。特別是，現(xiàn)有系統(tǒng)在區(qū)分雙聲道中的不同說(shuō)話人、理解隱含意圖以及適應(yīng)不斷變化的欺詐策略方面存在明顯不足。此外，大多數(shù)現(xiàn)有技術(shù)缺乏智能化分析能力，難以適應(yīng)多樣化的欺詐模式，且在用戶定制性和靈活性方面表現(xiàn)不佳，無(wú)法滿足特定行業(yè)或業(yè)務(wù)的特定需求。這些缺陷限制了現(xiàn)有技術(shù)在高風(fēng)險(xiǎn)業(yè)務(wù)場(chǎng)景中的應(yīng)用潛力，特別是在銀行和保險(xiǎn)行業(yè)中，迫切需要一種更為高效、智能的語(yǔ)音欺詐分析方法。

2、此外，在銀行和保險(xiǎn)中的多個(gè)業(yè)務(wù)場(chǎng)景，黑灰產(chǎn)和欺詐現(xiàn)象頻發(fā)，比如有專(zhuān)業(yè)的黑灰產(chǎn)團(tuán)隊(duì)進(jìn)行反催收，騙保，代理退保等業(yè)務(wù)，給銀行和保險(xiǎn)公司帶來(lái)了巨大損失，目前這種情況的識(shí)別主要依賴(lài)人工判斷，不僅效率低而且準(zhǔn)確率也難以保證，急需一種更加智能化的方法對(duì)這些欺詐現(xiàn)象進(jìn)行及時(shí)發(fā)現(xiàn)和及時(shí)預(yù)警。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明的主要目的在于提供一種語(yǔ)音欺詐分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)，旨在解決現(xiàn)有語(yǔ)音欺詐分析技術(shù)識(shí)別欺詐場(chǎng)景的效率及準(zhǔn)確率低的技術(shù)問(wèn)題。

2、為實(shí)現(xiàn)上述目的，本發(fā)明提供一種語(yǔ)音欺詐分析方法，所述語(yǔ)音欺詐分析方法包括以下步驟：

3、獲取語(yǔ)音信號(hào)，通過(guò)兩個(gè)獨(dú)立配置的麥克風(fēng)陣列從所述語(yǔ)音信號(hào)中分別采集不同來(lái)源的語(yǔ)音數(shù)據(jù)，并將所述語(yǔ)音數(shù)據(jù)分別記錄到兩個(gè)獨(dú)立且隔離的音頻通道中；

4、利用語(yǔ)音活動(dòng)檢測(cè)技術(shù)分別對(duì)兩個(gè)音頻通道中的語(yǔ)音數(shù)據(jù)進(jìn)行檢測(cè)，識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段，基于識(shí)別出語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作，將每個(gè)音頻通道中連續(xù)的語(yǔ)音數(shù)據(jù)切分為多個(gè)獨(dú)立的語(yǔ)音片段，獲取多個(gè)有效語(yǔ)音片段；

5、根據(jù)所述有效語(yǔ)音片段生成對(duì)話文本，確定所述對(duì)話文本中的待分析文本；

6、根據(jù)所述待分析文本的數(shù)據(jù)特征選擇預(yù)訓(xùn)練欺詐分析模型，根據(jù)所述待分析文本與所述預(yù)訓(xùn)練欺詐分析模型確定所述語(yǔ)音數(shù)據(jù)的欺詐概率。

7、可選地，所述根據(jù)所述有效語(yǔ)音片段生成對(duì)話文本的步驟包括：

8、識(shí)別所述有效語(yǔ)音片段在所述語(yǔ)音數(shù)據(jù)中的開(kāi)始時(shí)間與結(jié)束時(shí)間，識(shí)別所述有效語(yǔ)音片段的來(lái)源人；

9、根據(jù)所述開(kāi)始時(shí)間與所述來(lái)源人將所述有效語(yǔ)音片段排序，得到時(shí)序語(yǔ)音片段；

10、根據(jù)所述時(shí)序語(yǔ)音片段生成對(duì)話文本。

11、可選地，所述根據(jù)所述時(shí)序語(yǔ)音片段生成對(duì)話文本的步驟包括：

12、利用語(yǔ)音識(shí)別技術(shù)將所述時(shí)序語(yǔ)音片段轉(zhuǎn)為語(yǔ)音文本，根據(jù)所述來(lái)源人對(duì)所述語(yǔ)音文本進(jìn)行標(biāo)記，生成所述對(duì)話文本。

13、可選地，所述獲取語(yǔ)音信號(hào)的步驟包括：

14、選擇支持雙聲道錄音的設(shè)備，所述設(shè)備包括具有獨(dú)立左聲道和右聲道錄音功能的錄音設(shè)備；

15、設(shè)置所述錄音設(shè)備的錄音參數(shù)，包括采樣率和量化精度；

16、通過(guò)所述錄音設(shè)備的左聲道和右聲道分別錄制來(lái)自兩個(gè)不同方向或來(lái)源的音頻信號(hào)，得到雙聲道音頻信號(hào)；

17、對(duì)所述雙聲道音頻信號(hào)進(jìn)行預(yù)處理，識(shí)別所述預(yù)處理后的雙聲道音頻信號(hào)中屬于人聲的所述語(yǔ)音信號(hào)。

18、可選地，所述識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段，基于識(shí)別出語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作，將每個(gè)音頻通道中連續(xù)的語(yǔ)音數(shù)據(jù)切分為多個(gè)獨(dú)立的語(yǔ)音片段，獲取多個(gè)有效語(yǔ)音片段的步驟包括：

19、構(gòu)建語(yǔ)音識(shí)別模型，通過(guò)所述語(yǔ)音識(shí)別模型檢測(cè)所述語(yǔ)音數(shù)據(jù)的語(yǔ)音活動(dòng)指標(biāo)，識(shí)別和標(biāo)記包含語(yǔ)音活動(dòng)的時(shí)間段，生成每個(gè)語(yǔ)音片段的起始和結(jié)束時(shí)間標(biāo)記；

20、基于標(biāo)記的語(yǔ)音活動(dòng)時(shí)間段進(jìn)行分片，將每個(gè)音頻通道中的連續(xù)語(yǔ)音數(shù)據(jù)按照標(biāo)記的時(shí)間段進(jìn)行切分，切分后的每個(gè)語(yǔ)音片段對(duì)應(yīng)一個(gè)獨(dú)立的語(yǔ)音活動(dòng)時(shí)間段；

21、在分片過(guò)程中排除無(wú)意義的語(yǔ)音片段排除無(wú)意義的語(yǔ)音片段，包括靜音片段、背景噪聲以及無(wú)關(guān)的語(yǔ)氣詞；

22、獲取所述有效語(yǔ)音片段，所述有效語(yǔ)音片段為經(jīng)過(guò)過(guò)濾后的且包含實(shí)際對(duì)話內(nèi)容的語(yǔ)音數(shù)據(jù)片段。

23、可選地，所述根據(jù)所述待分析文本與所述預(yù)訓(xùn)練欺詐分析模型確定所述語(yǔ)音數(shù)據(jù)的欺詐概率的步驟包括：

24、將所述待分析文本輸入所述預(yù)訓(xùn)練欺詐分析模型，確定所述待分析文本中欺詐條款的數(shù)量；

25、根據(jù)所述欺詐條款的數(shù)量與預(yù)設(shè)欺詐策略集確定所述語(yǔ)音數(shù)據(jù)的欺詐概率。

26、可選地，所述根據(jù)所述欺詐條款的數(shù)量與預(yù)設(shè)欺詐策略集確定所述語(yǔ)音數(shù)據(jù)的欺詐概率的步驟之前，還包括：

27、獲取歷史欺詐數(shù)據(jù)，根據(jù)業(yè)務(wù)需求與所述歷史欺詐數(shù)據(jù)定義所述預(yù)設(shè)欺詐策略集。

28、進(jìn)一步地，為實(shí)現(xiàn)上述目的，本發(fā)明還提供一種語(yǔ)音欺詐分析裝置，所述語(yǔ)音欺詐分析裝置包括：

29、語(yǔ)音信號(hào)處理模塊，獲取語(yǔ)音信號(hào)，通過(guò)兩個(gè)獨(dú)立配置的麥克風(fēng)陣列從所述語(yǔ)音信號(hào)中分別采集不同來(lái)源的語(yǔ)音數(shù)據(jù)，并將所述語(yǔ)音數(shù)據(jù)分別記錄到兩個(gè)獨(dú)立且隔離的音頻通道中；

30、有效片段提取模塊，利用語(yǔ)音活動(dòng)檢測(cè)技術(shù)分別對(duì)兩個(gè)音頻通道中的語(yǔ)音數(shù)據(jù)進(jìn)行檢測(cè)，識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段，基于識(shí)別出語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作，將每個(gè)音頻通道中連續(xù)的語(yǔ)音數(shù)據(jù)切分為多個(gè)獨(dú)立的語(yǔ)音片段，獲取多個(gè)有效語(yǔ)音片段；

31、文本轉(zhuǎn)換模塊，根據(jù)所述有效語(yǔ)音片段生成對(duì)話文本，確定所述對(duì)話文本中的待分析文本；

32、欺詐分析模塊，根據(jù)所述待分析文本的數(shù)據(jù)特征選擇預(yù)訓(xùn)練欺詐分析模型，根據(jù)所述待分析文本與所述預(yù)訓(xùn)練欺詐分析模型確定所述語(yǔ)音數(shù)據(jù)的欺詐概率。

33、進(jìn)一步地，為實(shí)現(xiàn)上述目的，本發(fā)明還提供一種語(yǔ)音欺詐分析設(shè)備，所述語(yǔ)音欺詐分析設(shè)備包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的語(yǔ)音欺詐分析程序，所述語(yǔ)音欺詐分析程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述所述的語(yǔ)音欺詐分析方法的步驟。

34、進(jìn)一步地，為實(shí)現(xiàn)上述目的，本發(fā)明還提供一種存儲(chǔ)介質(zhì)，所述存儲(chǔ)介質(zhì)上存儲(chǔ)有語(yǔ)音欺詐分析程序，所述語(yǔ)音欺詐分析程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的語(yǔ)音欺詐分析方法的步驟。

35、本發(fā)明涉及一種語(yǔ)音欺詐分析方法，通過(guò)獲取語(yǔ)音信號(hào)，通過(guò)兩個(gè)獨(dú)立配置的麥克風(fēng)陣列分別采集不同來(lái)源的語(yǔ)音數(shù)據(jù)，并將這些語(yǔ)音數(shù)據(jù)記錄到兩個(gè)獨(dú)立且隔離的音頻通道中；利用語(yǔ)音活動(dòng)檢測(cè)技術(shù)對(duì)兩個(gè)音頻通道中的語(yǔ)音數(shù)據(jù)進(jìn)行檢測(cè)，識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段，基于語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作，并提取多個(gè)有效的語(yǔ)音片段；根據(jù)提取的有效語(yǔ)音片段生成對(duì)話文本，并在生成的文本中篩選出待分析的文本部分；根據(jù)待分析文本的數(shù)據(jù)特征選擇預(yù)訓(xùn)練的欺詐分析模型，并通過(guò)分析模型確定語(yǔ)音數(shù)據(jù)的欺詐概率。本發(fā)明能夠?qū)崿F(xiàn)對(duì)語(yǔ)音信號(hào)的精準(zhǔn)處理與分析，顯著提高語(yǔ)音數(shù)據(jù)的質(zhì)量和欺詐檢測(cè)的準(zhǔn)確性，適用于復(fù)雜的語(yǔ)音交互場(chǎng)景。

技術(shù)特征：

1.一種語(yǔ)音欺詐分析方法，其特征在于，所述語(yǔ)音欺詐分析方法包括以下步驟：

2.如權(quán)利要求1所述的語(yǔ)音欺詐分析方法，其特征在于，所述根據(jù)所述有效語(yǔ)音片段生成對(duì)話文本的步驟包括：

3.如權(quán)利要求2中所述的語(yǔ)音欺詐分析方法，其特征在于，所述根據(jù)所述時(shí)序語(yǔ)音片段生成對(duì)話文本的步驟包括：

4.如權(quán)利要求1所述的語(yǔ)音欺詐分析方法，其特征在于，所述獲取語(yǔ)音信號(hào)的步驟包括：

5.如權(quán)利要求1所述的語(yǔ)音欺詐分析方法，其特征在于，所述識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段，基于識(shí)別出語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作，將每個(gè)音頻通道中連續(xù)的語(yǔ)音數(shù)據(jù)切分為多個(gè)獨(dú)立的語(yǔ)音片段，獲取多個(gè)有效語(yǔ)音片段的步驟包括：

6.如權(quán)利要求1所述的語(yǔ)音欺詐分析方法，其特征在于，所述根據(jù)所述待分析文本與所述預(yù)訓(xùn)練欺詐分析模型確定所述語(yǔ)音數(shù)據(jù)的欺詐概率的步驟包括：

7.如權(quán)利要求6所述的語(yǔ)音欺詐分析方法，其特征在于，所述根據(jù)所述欺詐條款的數(shù)量與預(yù)設(shè)欺詐策略集確定所述語(yǔ)音數(shù)據(jù)的欺詐概率的步驟之前，還包括：

8.一種語(yǔ)音欺詐分析裝置，其特征在于，所述語(yǔ)音欺詐分析裝置包括：

9.一種語(yǔ)音欺詐分析設(shè)備，其特征在于，所述語(yǔ)音欺詐分析設(shè)備包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器上并可以在所述處理器上運(yùn)行的語(yǔ)音欺詐分析程序，所述語(yǔ)音欺詐分析程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的語(yǔ)音欺詐分析方法的步驟。

10.一種存儲(chǔ)介質(zhì)，其特征在于，所述存儲(chǔ)介質(zhì)上存儲(chǔ)有語(yǔ)音欺詐分析程序，所述語(yǔ)音欺詐分析程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的語(yǔ)音欺詐分析方法的步驟。

技術(shù)總結(jié)
本發(fā)明涉及一種語(yǔ)音欺詐分析方法，通過(guò)獲取語(yǔ)音信號(hào)，通過(guò)兩個(gè)獨(dú)立配置的麥克風(fēng)陣列分別采集不同來(lái)源的語(yǔ)音數(shù)據(jù)，并將這些語(yǔ)音數(shù)據(jù)記錄到兩個(gè)獨(dú)立且隔離的音頻通道中；利用語(yǔ)音活動(dòng)檢測(cè)技術(shù)對(duì)兩個(gè)音頻通道中的語(yǔ)音數(shù)據(jù)進(jìn)行檢測(cè)，識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段，基于語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作，并提取多個(gè)有效的語(yǔ)音片段；根據(jù)提取的有效語(yǔ)音片段生成對(duì)話文本，并在生成的文本中篩選出待分析的文本部分；根據(jù)待分析文本的數(shù)據(jù)特征選擇預(yù)訓(xùn)練的欺詐分析模型，并通過(guò)分析模型確定語(yǔ)音數(shù)據(jù)的欺詐概率。本發(fā)明能夠?qū)崿F(xiàn)對(duì)語(yǔ)音信號(hào)的精準(zhǔn)處理與分析，顯著提高語(yǔ)音數(shù)據(jù)的質(zhì)量和欺詐檢測(cè)的準(zhǔn)確性，適用于復(fù)雜的語(yǔ)音交互場(chǎng)景。

技術(shù)研發(fā)人員：賀亞運(yùn),王健宗,彭俊清,張旭龍
受保護(hù)的技術(shù)使用者：平安科技（深圳）有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/26

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：賀亞運(yùn),王健宗,彭俊清,張旭龍
技術(shù)所有人：平安科技（深圳）有限公司
我是此專(zhuān)利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語(yǔ)音欺詐分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)與流程

語(yǔ)音欺詐分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)與流程