本技術屬于人工智能,具體涉及一種財產線索挖掘方法、裝置、計算機設備及存儲介質。
背景技術:
1、在金融領域內,不良資產指的是已陷入違約狀態(tài)或確認無法償還的債務資產,這類資產因其難以直接轉化為現金流或變現價值極低,往往給金融機構及債權人帶來沉重負擔。為了減輕這一負擔并維護債權人權益,有效清收不良資產顯得尤為重要。而在這一過程中,核心任務在于深入挖掘債務人的財產線索,這些線索是追回欠款、減少損失的關鍵所在。
2、目前,金融機構在應對不良資產時,主要依賴自催、訴訟及委托第三方催收這三種策略,而策略能否有效實施依賴于能否成功挖掘并確認債務人的可執(zhí)行財產線索。因此,面對經營困境重重甚至瀕臨破產的企業(yè)債務人,尋找并確認可執(zhí)行的有效財產線索成為了追償工作的重中之重。
3、在技術層面,傳統(tǒng)機器學習技術如支持向量機、神經網絡等,雖已被應用于財產線索的挖掘,并取得了一定成效,但其局限性也日益顯現。這些方法高度依賴于復雜的人工特征工程,這不僅增加了操作的難度與成本,還使得模型的表現易受數據質量及樣本規(guī)模的限制。
4、因此,探索更加高效、智能且適應性強的技術手段,以優(yōu)化財產線索挖掘過程,成為不良資產清收領域亟待解決的問題。
技術實現思路
1、本技術實施例的目的在于提出一種財產線索挖掘方法、裝置、計算機設備及存儲介質,以解決現有財產線索挖掘方案存在的高度依賴于復雜的人工特征工程,增加了操作的難度與成本,以及使得模型的表現易受數據質量及樣本規(guī)模的限制的技術問題。
2、為了解決上述技術問題,本技術實施例提供一種財產線索挖掘方法,采用了如下所述的技術方案:
3、一種財產線索挖掘方法,財產線索挖掘方法應用于財產線索挖掘平臺,財產線索挖掘平臺包括文本處理模型和線索分類模型,財產線索挖掘方法包括:
4、接收財產線索挖掘指令,獲取待處理財產案件的案件文本,得到待處理案件文本;
5、將待處理案件文本導入財產線索挖掘平臺,提取待處理案件文本的摘要信息,得到摘要文本;
6、使用文本處理模型中的詞嵌入矩陣對摘要文本進行語義編碼,得到語義特征向量;
7、基于語義特征向量構建文本特征序列,使用線索分類模型中的卷積核對文本特征序列進行局部卷積操作,得到局部特征向量;
8、對語義特征向量和局部特征向量進行拼接,得到特征融合向量;
9、基于特征融合向量確定與待處理財產案件匹配的目標財產線索標簽,并輸出目標財產線索標簽。
10、進一步地,在使用文本處理模型中的詞嵌入矩陣對摘要文本進行語義編碼,得到語義特征向量的步驟之前,還包括:
11、從預設的案件數據庫中獲取第一歷史案件文本;
12、對第一歷史案件文本進行關鍵詞提取,并從第一歷史案件文本的關鍵詞提取結果中篩選法律分詞文本;
13、將法律分詞文本導入預設文本處理模型的原始詞表;
14、對原始詞表進行向量化處理,得到詞嵌入矩陣。
15、進一步地,在對原始詞表進行向量化處理,得到詞嵌入矩陣的步驟之后,還包括:
16、從預設的案件數據庫中獲取第二歷史案件文本,并對第二歷史案件文本進行數據標注;
17、基于標注后的第二歷史案件文本構建訓練數據集和測試數據集;
18、使用訓練數據集對預設文本處理模型進行預訓練;
19、使用測試數據集對完成預訓練的預設文本處理模型進行模型性能測試。
20、進一步地,文本處理模型為基于transformer架構的預訓練語言模型,transformer架構包括若干層編碼層和若干層解碼層結構,使用訓練數據集對預設文本處理模型進行預訓練的步驟,具體包括:
21、通過詞嵌入矩陣將訓練數據集中歷史案件文本映射為向量表示形式,并構建訓練樣本特征矩陣;
22、將訓練樣本特征矩陣按照特征層級關系依次導入transformer架構的若干層編碼層中,以進行訓練樣本特征的編碼操作;
23、獲取編碼層輸出的特征編碼結果,并將特征編碼結果輸入到解碼層中,以進行編碼特征的解碼操作;
24、獲取特征解碼結果,并將特征解碼結果與歷史案件文本的第一真實標簽進行比較,得到第一預測誤差,其中,第一真實標簽為標注的文本語義標簽;
25、基于第一預測誤差對transformer架構的參數進行迭代更新,直至模型擬合,得到預設文本處理模型。
26、進一步地,線索分類模型為基于文本卷積神經網絡架構的預訓練神經網絡模型,文本卷積神經網絡中預設有若干個卷積核,在基于語義特征向量構建文本特征序列,使用線索分類模型中的卷積核對文本特征序列進行局部卷積操作,得到局部特征向量的步驟之前,還包括:
27、對編碼層輸出的特征編碼結果進行解析,得到編碼層輸出的特征編碼向量;
28、基于特征編碼向量構建特征編碼序列;
29、在預設線索分類模型中的若干個卷積核中確定適配的目標卷積核;
30、使用目標卷積核對特征編碼序列進行局部卷積操作,得到局部編碼向量;將特征編碼向量和局部編碼向量進行拼接,得到編碼融合向量;
31、基于特征融合向量確定與歷史案件文本匹配的財產線索標簽,得到歷史財產線索標簽;
32、將歷史財產線索標簽與歷史案件文本的第二真實標簽進行比較,得到第二預測誤差,其中,第二真實標簽為標注的財產線索標簽;
33、基于第二預測誤差對線索分類模型的參數進行迭代更新,直至模型擬合,得到預設文本處理模型。
34、進一步地,基于特征編碼向量構建特征編碼序列的步驟,具體包括:
35、對特征編碼向量進行篩選,獲取高階特征編碼向量;
36、基于高階特征編碼向量構建特征編碼序列。
37、進一步地,在基于第二預測誤差對線索分類模型的參數進行迭代更新,
38、直至模型擬合,得到預設文本處理模型的步驟之后,還包括:
39、為文本處理模型和線索分類模型配置初始模型權重參數;
40、設置交叉熵損失函數,并基于第一預測誤差和第二預測誤差,且以最小化交叉熵損失函數為優(yōu)化目標,動態(tài)更新初始模型權重參數,得到最優(yōu)模型權重參數;
41、基于最優(yōu)模型權重參數在財產線索挖掘平臺中配置文本處理模型和線索分類模型。
42、為了解決上述技術問題,本技術實施例還提供一種財產線索挖掘裝置,采用了如下所述的技術方案:
43、一種財產線索挖掘裝置,財產線索挖掘裝置運行于財產線索挖掘平臺,財產線索挖掘平臺包括文本處理模型和線索分類模型,財產線索挖掘裝置包括:
44、文本提取模塊,用于接收財產線索挖掘指令,獲取待處理財產案件的案件文本,得到待處理案件文本;
45、摘要提取模塊,用于將待處理案件文本導入財產線索挖掘平臺,提取待處理案件文本的摘要信息,得到摘要文本;
46、語義編碼模塊,用于使用文本處理模型中的詞嵌入矩陣對摘要文本進行語義編碼,得到語義特征向量;
47、局部卷積模塊,用于基于語義特征向量構建文本特征序列,使用線索分類模型中的卷積核對文本特征序列進行局部卷積操作,得到局部特征向量;
48、向量拼接模塊,用于對語義特征向量和局部特征向量進行拼接,得到特征融合向量;
49、線索匹配模塊,用于基于特征融合向量確定與待處理財產案件匹配的目標財產線索標簽,并輸出目標財產線索標簽。
50、為了解決上述技術問題,本技術實施例還提供一種計算機設備,采用了如下所述的技術方案:
51、一種計算機設備,包括存儲器和處理器,所述存儲器中存儲有計算機可讀指令,所述處理器執(zhí)行所述計算機可讀指令時實現如上述任一項所述的財產線索挖掘方法的步驟。
52、為了解決上述技術問題,本技術實施例還提供一種計算機可讀存儲介質,采用了如下所述的技術方案:
53、一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機可讀指令,所述計算機可讀指令被處理器執(zhí)行時實現如上述中任一項所述的財產線索挖掘方法的步驟。
54、與現有技術相比,本技術實施例主要有以下有益效果:
55、本技術公開一種財產線索挖掘方法、裝置、計算機設備及存儲介質,屬于人工智能技術領域。通過整合文本處理與線索分類兩個模型于財產線索挖掘平臺中,首先接收案件文本,提取其摘要信息,并運用文本處理模型的詞嵌入矩陣將摘要轉化為語義特征向量,隨后基于語義特征向量構建文本特征序列,并應用線索分類模型的卷積核對序列進行局部特征提取,將局部特征與語義特征融合,形成全面的特征融合向量,最終基于該融合向量精準匹配并輸出與案件相關的目標財產線索標簽。本技術通過自動化提取案件文本摘要、利用詞嵌入矩陣生成語義特征,并結合卷積操作捕捉局部特征,有效解決了傳統(tǒng)財產線索挖掘對人工特征工程的依賴,降低了操作難度與成本。同時,特征融合策略增強了模型的泛化能力,減少對數據質量與樣本規(guī)模的依賴,提高了財產線索挖掘的準確性和效率。