本發(fā)明涉及人工智能領(lǐng)域,尤其涉及一種語(yǔ)音欺詐分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、現(xiàn)有技術(shù)在語(yǔ)音欺詐分析領(lǐng)域主要依賴(lài)于傳統(tǒng)的語(yǔ)音識(shí)別和基于規(guī)則的檢測(cè)系統(tǒng)。這些方法在處理簡(jiǎn)單、直接的欺詐行為時(shí)可能有效,但在面對(duì)復(fù)雜對(duì)話和多聲道數(shù)據(jù)時(shí),其準(zhǔn)確性和實(shí)時(shí)性往往受限。特別是,現(xiàn)有系統(tǒng)在區(qū)分雙聲道中的不同說(shuō)話人、理解隱含意圖以及適應(yīng)不斷變化的欺詐策略方面存在明顯不足。此外,大多數(shù)現(xiàn)有技術(shù)缺乏智能化分析能力,難以適應(yīng)多樣化的欺詐模式,且在用戶定制性和靈活性方面表現(xiàn)不佳,無(wú)法滿足特定行業(yè)或業(yè)務(wù)的特定需求。這些缺陷限制了現(xiàn)有技術(shù)在高風(fēng)險(xiǎn)業(yè)務(wù)場(chǎng)景中的應(yīng)用潛力,特別是在銀行和保險(xiǎn)行業(yè)中,迫切需要一種更為高效、智能的語(yǔ)音欺詐分析方法。
2、此外,在銀行和保險(xiǎn)中的多個(gè)業(yè)務(wù)場(chǎng)景,黑灰產(chǎn)和欺詐現(xiàn)象頻發(fā),比如有專(zhuān)業(yè)的黑灰產(chǎn)團(tuán)隊(duì)進(jìn)行反催收,騙保,代理退保等業(yè)務(wù),給銀行和保險(xiǎn)公司帶來(lái)了巨大損失,目前這種情況的識(shí)別主要依賴(lài)人工判斷,不僅效率低而且準(zhǔn)確率也難以保證,急需一種更加智能化的方法對(duì)這些欺詐現(xiàn)象進(jìn)行及時(shí)發(fā)現(xiàn)和及時(shí)預(yù)警。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的主要目的在于提供一種語(yǔ)音欺詐分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),旨在解決現(xiàn)有語(yǔ)音欺詐分析技術(shù)識(shí)別欺詐場(chǎng)景的效率及準(zhǔn)確率低的技術(shù)問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供一種語(yǔ)音欺詐分析方法,所述語(yǔ)音欺詐分析方法包括以下步驟:
3、獲取語(yǔ)音信號(hào),通過(guò)兩個(gè)獨(dú)立配置的麥克風(fēng)陣列從所述語(yǔ)音信號(hào)中分別采集不同來(lái)源的語(yǔ)音數(shù)據(jù),并將所述語(yǔ)音數(shù)據(jù)分別記錄到兩個(gè)獨(dú)立且隔離的音頻通道中;
4、利用語(yǔ)音活動(dòng)檢測(cè)技術(shù)分別對(duì)兩個(gè)音頻通道中的語(yǔ)音數(shù)據(jù)進(jìn)行檢測(cè),識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段,基于識(shí)別出語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作,將每個(gè)音頻通道中連續(xù)的語(yǔ)音數(shù)據(jù)切分為多個(gè)獨(dú)立的語(yǔ)音片段,獲取多個(gè)有效語(yǔ)音片段;
5、根據(jù)所述有效語(yǔ)音片段生成對(duì)話文本,確定所述對(duì)話文本中的待分析文本;
6、根據(jù)所述待分析文本的數(shù)據(jù)特征選擇預(yù)訓(xùn)練欺詐分析模型,根據(jù)所述待分析文本與所述預(yù)訓(xùn)練欺詐分析模型確定所述語(yǔ)音數(shù)據(jù)的欺詐概率。
7、可選地,所述根據(jù)所述有效語(yǔ)音片段生成對(duì)話文本的步驟包括:
8、識(shí)別所述有效語(yǔ)音片段在所述語(yǔ)音數(shù)據(jù)中的開(kāi)始時(shí)間與結(jié)束時(shí)間,識(shí)別所述有效語(yǔ)音片段的來(lái)源人;
9、根據(jù)所述開(kāi)始時(shí)間與所述來(lái)源人將所述有效語(yǔ)音片段排序,得到時(shí)序語(yǔ)音片段;
10、根據(jù)所述時(shí)序語(yǔ)音片段生成對(duì)話文本。
11、可選地,所述根據(jù)所述時(shí)序語(yǔ)音片段生成對(duì)話文本的步驟包括:
12、利用語(yǔ)音識(shí)別技術(shù)將所述時(shí)序語(yǔ)音片段轉(zhuǎn)為語(yǔ)音文本,根據(jù)所述來(lái)源人對(duì)所述語(yǔ)音文本進(jìn)行標(biāo)記,生成所述對(duì)話文本。
13、可選地,所述獲取語(yǔ)音信號(hào)的步驟包括:
14、選擇支持雙聲道錄音的設(shè)備,所述設(shè)備包括具有獨(dú)立左聲道和右聲道錄音功能的錄音設(shè)備;
15、設(shè)置所述錄音設(shè)備的錄音參數(shù),包括采樣率和量化精度;
16、通過(guò)所述錄音設(shè)備的左聲道和右聲道分別錄制來(lái)自兩個(gè)不同方向或來(lái)源的音頻信號(hào),得到雙聲道音頻信號(hào);
17、對(duì)所述雙聲道音頻信號(hào)進(jìn)行預(yù)處理,識(shí)別所述預(yù)處理后的雙聲道音頻信號(hào)中屬于人聲的所述語(yǔ)音信號(hào)。
18、可選地,所述識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段,基于識(shí)別出語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作,將每個(gè)音頻通道中連續(xù)的語(yǔ)音數(shù)據(jù)切分為多個(gè)獨(dú)立的語(yǔ)音片段,獲取多個(gè)有效語(yǔ)音片段的步驟包括:
19、構(gòu)建語(yǔ)音識(shí)別模型,通過(guò)所述語(yǔ)音識(shí)別模型檢測(cè)所述語(yǔ)音數(shù)據(jù)的語(yǔ)音活動(dòng)指標(biāo),識(shí)別和標(biāo)記包含語(yǔ)音活動(dòng)的時(shí)間段,生成每個(gè)語(yǔ)音片段的起始和結(jié)束時(shí)間標(biāo)記;
20、基于標(biāo)記的語(yǔ)音活動(dòng)時(shí)間段進(jìn)行分片,將每個(gè)音頻通道中的連續(xù)語(yǔ)音數(shù)據(jù)按照標(biāo)記的時(shí)間段進(jìn)行切分,切分后的每個(gè)語(yǔ)音片段對(duì)應(yīng)一個(gè)獨(dú)立的語(yǔ)音活動(dòng)時(shí)間段;
21、在分片過(guò)程中排除無(wú)意義的語(yǔ)音片段排除無(wú)意義的語(yǔ)音片段,包括靜音片段、背景噪聲以及無(wú)關(guān)的語(yǔ)氣詞;
22、獲取所述有效語(yǔ)音片段,所述有效語(yǔ)音片段為經(jīng)過(guò)過(guò)濾后的且包含實(shí)際對(duì)話內(nèi)容的語(yǔ)音數(shù)據(jù)片段。
23、可選地,所述根據(jù)所述待分析文本與所述預(yù)訓(xùn)練欺詐分析模型確定所述語(yǔ)音數(shù)據(jù)的欺詐概率的步驟包括:
24、將所述待分析文本輸入所述預(yù)訓(xùn)練欺詐分析模型,確定所述待分析文本中欺詐條款的數(shù)量;
25、根據(jù)所述欺詐條款的數(shù)量與預(yù)設(shè)欺詐策略集確定所述語(yǔ)音數(shù)據(jù)的欺詐概率。
26、可選地,所述根據(jù)所述欺詐條款的數(shù)量與預(yù)設(shè)欺詐策略集確定所述語(yǔ)音數(shù)據(jù)的欺詐概率的步驟之前,還包括:
27、獲取歷史欺詐數(shù)據(jù),根據(jù)業(yè)務(wù)需求與所述歷史欺詐數(shù)據(jù)定義所述預(yù)設(shè)欺詐策略集。
28、進(jìn)一步地,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種語(yǔ)音欺詐分析裝置,所述語(yǔ)音欺詐分析裝置包括:
29、語(yǔ)音信號(hào)處理模塊,獲取語(yǔ)音信號(hào),通過(guò)兩個(gè)獨(dú)立配置的麥克風(fēng)陣列從所述語(yǔ)音信號(hào)中分別采集不同來(lái)源的語(yǔ)音數(shù)據(jù),并將所述語(yǔ)音數(shù)據(jù)分別記錄到兩個(gè)獨(dú)立且隔離的音頻通道中;
30、有效片段提取模塊,利用語(yǔ)音活動(dòng)檢測(cè)技術(shù)分別對(duì)兩個(gè)音頻通道中的語(yǔ)音數(shù)據(jù)進(jìn)行檢測(cè),識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段,基于識(shí)別出語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作,將每個(gè)音頻通道中連續(xù)的語(yǔ)音數(shù)據(jù)切分為多個(gè)獨(dú)立的語(yǔ)音片段,獲取多個(gè)有效語(yǔ)音片段;
31、文本轉(zhuǎn)換模塊,根據(jù)所述有效語(yǔ)音片段生成對(duì)話文本,確定所述對(duì)話文本中的待分析文本;
32、欺詐分析模塊,根據(jù)所述待分析文本的數(shù)據(jù)特征選擇預(yù)訓(xùn)練欺詐分析模型,根據(jù)所述待分析文本與所述預(yù)訓(xùn)練欺詐分析模型確定所述語(yǔ)音數(shù)據(jù)的欺詐概率。
33、進(jìn)一步地,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種語(yǔ)音欺詐分析設(shè)備,所述語(yǔ)音欺詐分析設(shè)備包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的語(yǔ)音欺詐分析程序,所述語(yǔ)音欺詐分析程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述所述的語(yǔ)音欺詐分析方法的步驟。
34、進(jìn)一步地,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有語(yǔ)音欺詐分析程序,所述語(yǔ)音欺詐分析程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的語(yǔ)音欺詐分析方法的步驟。
35、本發(fā)明涉及一種語(yǔ)音欺詐分析方法,通過(guò)獲取語(yǔ)音信號(hào),通過(guò)兩個(gè)獨(dú)立配置的麥克風(fēng)陣列分別采集不同來(lái)源的語(yǔ)音數(shù)據(jù),并將這些語(yǔ)音數(shù)據(jù)記錄到兩個(gè)獨(dú)立且隔離的音頻通道中;利用語(yǔ)音活動(dòng)檢測(cè)技術(shù)對(duì)兩個(gè)音頻通道中的語(yǔ)音數(shù)據(jù)進(jìn)行檢測(cè),識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段,基于語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作,并提取多個(gè)有效的語(yǔ)音片段;根據(jù)提取的有效語(yǔ)音片段生成對(duì)話文本,并在生成的文本中篩選出待分析的文本部分;根據(jù)待分析文本的數(shù)據(jù)特征選擇預(yù)訓(xùn)練的欺詐分析模型,并通過(guò)分析模型確定語(yǔ)音數(shù)據(jù)的欺詐概率。本發(fā)明能夠?qū)崿F(xiàn)對(duì)語(yǔ)音信號(hào)的精準(zhǔn)處理與分析,顯著提高語(yǔ)音數(shù)據(jù)的質(zhì)量和欺詐檢測(cè)的準(zhǔn)確性,適用于復(fù)雜的語(yǔ)音交互場(chǎng)景。
1.一種語(yǔ)音欺詐分析方法,其特征在于,所述語(yǔ)音欺詐分析方法包括以下步驟:
2.如權(quán)利要求1所述的語(yǔ)音欺詐分析方法,其特征在于,所述根據(jù)所述有效語(yǔ)音片段生成對(duì)話文本的步驟包括:
3.如權(quán)利要求2中所述的語(yǔ)音欺詐分析方法,其特征在于,所述根據(jù)所述時(shí)序語(yǔ)音片段生成對(duì)話文本的步驟包括:
4.如權(quán)利要求1所述的語(yǔ)音欺詐分析方法,其特征在于,所述獲取語(yǔ)音信號(hào)的步驟包括:
5.如權(quán)利要求1所述的語(yǔ)音欺詐分析方法,其特征在于,所述識(shí)別并標(biāo)記每個(gè)音頻通道中的語(yǔ)音活動(dòng)時(shí)間段,基于識(shí)別出語(yǔ)音活動(dòng)時(shí)間段對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行分片操作,將每個(gè)音頻通道中連續(xù)的語(yǔ)音數(shù)據(jù)切分為多個(gè)獨(dú)立的語(yǔ)音片段,獲取多個(gè)有效語(yǔ)音片段的步驟包括:
6.如權(quán)利要求1所述的語(yǔ)音欺詐分析方法,其特征在于,所述根據(jù)所述待分析文本與所述預(yù)訓(xùn)練欺詐分析模型確定所述語(yǔ)音數(shù)據(jù)的欺詐概率的步驟包括:
7.如權(quán)利要求6所述的語(yǔ)音欺詐分析方法,其特征在于,所述根據(jù)所述欺詐條款的數(shù)量與預(yù)設(shè)欺詐策略集確定所述語(yǔ)音數(shù)據(jù)的欺詐概率的步驟之前,還包括:
8.一種語(yǔ)音欺詐分析裝置,其特征在于,所述語(yǔ)音欺詐分析裝置包括:
9.一種語(yǔ)音欺詐分析設(shè)備,其特征在于,所述語(yǔ)音欺詐分析設(shè)備包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器上并可以在所述處理器上運(yùn)行的語(yǔ)音欺詐分析程序,所述語(yǔ)音欺詐分析程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的語(yǔ)音欺詐分析方法的步驟。
10.一種存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)上存儲(chǔ)有語(yǔ)音欺詐分析程序,所述語(yǔ)音欺詐分析程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一項(xiàng)所述的語(yǔ)音欺詐分析方法的步驟。