本技術(shù)涉及人工智能和大數(shù)據(jù),尤其涉及用戶線索挖掘方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、在保險客服領(lǐng)域中,如何促成客戶復(fù)購新品類的保險,即從存量客戶中挖掘潛在的新品客戶,這是一個重要的研究方向,相比對外挖掘潛在新用戶,對于存量客戶的線索挖掘成本更低,交易成功率更高。
2、傳統(tǒng)的線索挖掘流程,主要是通過從業(yè)務(wù)方收集關(guān)鍵詞,基于關(guān)鍵詞召回數(shù)據(jù),再由人工標(biāo)注,最后訓(xùn)練一個線索模型,利用線索模型進(jìn)行線索挖掘。
3、然而,這種方式的局限在于標(biāo)注數(shù)據(jù)完全依賴于人工,無法直接從通話文本中獲取線索,且無法主動發(fā)現(xiàn)新的線索或關(guān)鍵詞,線索挖掘效率低下,無法處理大量的歷史通話數(shù)據(jù)。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例的目的在于提出一種用戶線索挖掘方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì),以解決傳統(tǒng)線索挖掘流程無法主動發(fā)現(xiàn)新的線索以及線索挖掘效率低下,無法處理大量的歷史數(shù)據(jù)的技術(shù)問題。
2、為了解決上述技術(shù)問題,本技術(shù)實(shí)施例提供一種用戶線索挖掘方法,采用了如下所述的技術(shù)方案:
3、獲取用戶通話文本,所述用戶通話文本包括潛在用戶通話文本以及成交用戶通話文本;
4、將所述成交用戶通話文本進(jìn)行數(shù)據(jù)清洗處理,得到目標(biāo)文本數(shù)據(jù);
5、將所述目標(biāo)文本數(shù)據(jù)輸入至預(yù)設(shè)的標(biāo)簽處理大模型進(jìn)行文本關(guān)鍵詞提取處理,得到第一用戶數(shù)據(jù)標(biāo)簽,所述第一用戶數(shù)據(jù)標(biāo)簽包括若干個成交關(guān)鍵詞;
6、通過所述第一用戶數(shù)據(jù)標(biāo)簽對所述潛在用戶通話文本進(jìn)行數(shù)據(jù)召回處理,得到弱標(biāo)簽數(shù)據(jù);
7、將所述弱標(biāo)簽數(shù)據(jù)作為線索訓(xùn)練數(shù)據(jù)集,對通用模型進(jìn)行訓(xùn)練,得到線索模型;
8、將所述潛在用戶通話文本輸入所述線索模型進(jìn)行線索搜索處理,生成第二用戶數(shù)據(jù)標(biāo)簽,所述第二用戶數(shù)據(jù)標(biāo)簽包括若干個線索關(guān)鍵詞;
9、將所述第一用戶數(shù)據(jù)標(biāo)簽以及所述第二用戶數(shù)據(jù)標(biāo)簽上傳至標(biāo)簽信息庫,對所述成交關(guān)鍵詞以及所述線索關(guān)鍵詞進(jìn)行分類處理,得到用戶線索信息。
10、進(jìn)一步的,所述標(biāo)簽處理大模型包括llm模型、bce?embedding模型以及文本聚類模型,所述將所述目標(biāo)文本數(shù)據(jù)輸入至預(yù)設(shè)的標(biāo)簽處理大模型進(jìn)行文本關(guān)鍵詞提取處理,得到第一用戶數(shù)據(jù)標(biāo)簽的步驟,具體包括:
11、通過所述llm模型對所述目標(biāo)文本數(shù)據(jù)執(zhí)行prompt指令,得到目標(biāo)文本關(guān)鍵詞;
12、通過所述bce?embedding模型對所述目標(biāo)文本關(guān)鍵詞進(jìn)行embedding向量化處理,得到目標(biāo)文本向量;
13、通過所述文本聚類模型對所述目標(biāo)文本向量進(jìn)行聚類處理,得到聚類類別,所述聚類類別內(nèi)包含若干個成交關(guān)鍵詞;
14、通過所述llm模型對所述成交關(guān)鍵詞進(jìn)行類別解釋處理,生成所述第一用戶數(shù)據(jù)標(biāo)簽。
15、進(jìn)一步的,所述通過所述第一用戶數(shù)據(jù)標(biāo)簽對所述潛在用戶通話文本進(jìn)行數(shù)據(jù)召回處理,得到弱標(biāo)簽數(shù)據(jù)的步驟,具體包括:
16、對所述第一用戶數(shù)據(jù)標(biāo)簽內(nèi)的全部成交關(guān)鍵詞進(jìn)行隨機(jī)篩選,得到目標(biāo)成交關(guān)鍵詞;
17、基于所述目標(biāo)成交關(guān)鍵詞對所述潛在用戶通話文本進(jìn)行上下文定位,得到所述目標(biāo)成交關(guān)鍵詞在所述潛在用戶通話文本的文本位置信息;
18、基于所述文本位置信息對所述潛在用戶通話文本進(jìn)行上下文字段截取處理,得到文本召回數(shù)據(jù);
19、將所述文本召回數(shù)據(jù)輸入所述llm模型進(jìn)行數(shù)據(jù)標(biāo)注處理,得到所述弱標(biāo)簽數(shù)據(jù)。
20、進(jìn)一步的,所述將所述文本召回數(shù)據(jù)通過所述llm模型進(jìn)行數(shù)據(jù)標(biāo)注處理,得到所述弱標(biāo)簽數(shù)據(jù)的步驟,具體包括:
21、將所述文本召回數(shù)據(jù)通過所述文本聚類模型進(jìn)行意圖劃分處理,得到類別樣本;
22、通過所述llm模型對所述類別樣本進(jìn)行標(biāo)簽分類處理,生成目標(biāo)標(biāo)簽數(shù)據(jù);
23、計算所述目標(biāo)標(biāo)簽數(shù)據(jù)的文本置信度;
24、若所述文本置信度大于或等于預(yù)設(shè)的置信度閾值時,則對所述目標(biāo)標(biāo)簽數(shù)據(jù)進(jìn)行標(biāo)注,得到所述弱標(biāo)簽數(shù)據(jù),并將所述目標(biāo)標(biāo)簽數(shù)據(jù)保存到所述標(biāo)簽信息庫;
25、若所述文本置信度大于或等于預(yù)設(shè)的置信度閾值時,則直接將所述目標(biāo)標(biāo)簽數(shù)據(jù)保存到所述標(biāo)簽信息庫。
26、進(jìn)一步的,所述將所述弱標(biāo)簽數(shù)據(jù)作為線索訓(xùn)練數(shù)據(jù)集,對通用模型進(jìn)行訓(xùn)練,得到線索模型的步驟,具體包括:
27、對所述線索訓(xùn)練數(shù)據(jù)集進(jìn)行文本特征提取,以獲取所述線索訓(xùn)練數(shù)據(jù)集的文本標(biāo)簽特征;
28、通過所述線索訓(xùn)練數(shù)據(jù)集的文本標(biāo)簽特征估算所述線索模型的模型參數(shù);
29、將所述線索模型的模型參數(shù)導(dǎo)入到所述通用模型中,并利用所述線索訓(xùn)練數(shù)據(jù)集對所述通用模型進(jìn)行訓(xùn)練,得到所述線索模型。
30、進(jìn)一步的,所述將所述第一用戶數(shù)據(jù)標(biāo)簽以及所述第二用戶數(shù)據(jù)標(biāo)簽上傳至標(biāo)簽信息庫,并對所述成交關(guān)鍵詞以及所述線索關(guān)鍵詞進(jìn)行分類處理,得到用戶線索信息的步驟,具體包括:
31、對所述第一用戶數(shù)據(jù)標(biāo)簽內(nèi)的所有成交關(guān)鍵詞以及所述第二用戶數(shù)據(jù)標(biāo)簽內(nèi)的所有線索關(guān)鍵詞進(jìn)行遍歷,得到目標(biāo)線索數(shù)據(jù)集;
32、獲取所述目標(biāo)線索數(shù)據(jù)集內(nèi)所有關(guān)鍵詞的文本置信度,基于所述文本置信度進(jìn)行分類,得到所述用戶線索信息。
33、進(jìn)一步的,在所述將所述第一用戶數(shù)據(jù)標(biāo)簽以及所述第二用戶數(shù)據(jù)標(biāo)簽上傳至標(biāo)簽信息庫,得到用戶線索信息的步驟之后,還包括:
34、通過消息隊列將所述標(biāo)簽信息庫與監(jiān)控調(diào)度平臺進(jìn)行訂閱連接,所述監(jiān)控調(diào)度平臺包括監(jiān)控子平臺以及調(diào)度子平臺,所述監(jiān)控調(diào)度平臺通過消息隊列與所述線索模型、所述預(yù)設(shè)的標(biāo)簽處理大模型以及所述標(biāo)簽信息庫進(jìn)行數(shù)據(jù)交互;
35、通過所述監(jiān)控子平臺對所述用戶線索信息進(jìn)行數(shù)據(jù)監(jiān)控,得到線索監(jiān)控數(shù)據(jù),所述線索監(jiān)控數(shù)據(jù)包括有效線索量、標(biāo)簽的有效線索量以及標(biāo)簽置信度;
36、基于所述線索監(jiān)控數(shù)據(jù),通過所述調(diào)度子平臺的路由規(guī)則對所述標(biāo)簽信息庫進(jìn)行數(shù)據(jù)調(diào)度,得到線索調(diào)度數(shù)據(jù)。
37、為了解決上述技術(shù)問題,本技術(shù)實(shí)施例還提供一種用戶線索挖掘裝置,采用了如下所述的技術(shù)方案:
38、獲取模塊,用于獲取用戶通話文本,所述用戶通話文本包括潛在用戶通話文本以及成交用戶通話文本;
39、數(shù)據(jù)清洗模塊,用于將所述成交用戶通話文本進(jìn)行數(shù)據(jù)清洗處理,得到目標(biāo)文本數(shù)據(jù);
40、處理模塊,用于將所述目標(biāo)文本數(shù)據(jù)輸入至預(yù)設(shè)的標(biāo)簽處理大模型進(jìn)行文本關(guān)鍵詞提取處理,得到第一用戶數(shù)據(jù)標(biāo)簽,所述第一用戶數(shù)據(jù)標(biāo)簽包括若干個成交關(guān)鍵詞;
41、數(shù)據(jù)召回模塊,用于通過所述第一用戶數(shù)據(jù)標(biāo)簽對所述潛在用戶通話文本進(jìn)行數(shù)據(jù)召回處理,得到弱標(biāo)簽數(shù)據(jù);
42、訓(xùn)練模塊,用于將所述弱標(biāo)簽數(shù)據(jù)作為線索訓(xùn)練數(shù)據(jù)集,對通用模型進(jìn)行訓(xùn)練,得到預(yù)訓(xùn)練的線索模型;
43、輸入模塊,用于將所述潛在用戶通話文本輸入所述線索模型進(jìn)行線索搜索處理,生成第二用戶數(shù)據(jù)標(biāo)簽,所述第二用戶數(shù)據(jù)標(biāo)簽包括若干個線索關(guān)鍵詞;
44、分類模塊,用于將所述第一用戶數(shù)據(jù)標(biāo)簽以及所述第二用戶數(shù)據(jù)標(biāo)簽上傳至標(biāo)簽信息庫,并將所述成交關(guān)鍵詞以及所述線索關(guān)鍵詞進(jìn)行分類處理,得到用戶線索信息。
45、為了解決上述技術(shù)問題,本技術(shù)實(shí)施例還提供一種計算機(jī)設(shè)備,采用了如下所述的技術(shù)方案:
46、一種計算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器中存儲有計算機(jī)可讀指令,所述處理器執(zhí)行所述計算機(jī)可讀指令時實(shí)現(xiàn)所述的用戶線索挖掘方法的步驟。
47、為了解決上述技術(shù)問題,本技術(shù)實(shí)施例還提供一種計算機(jī)可讀存儲介質(zhì),采用了如下所述的技術(shù)方案:
48、一種計算機(jī)可讀存儲介質(zhì),其特征在于,所述計算機(jī)可讀存儲介質(zhì)上存儲有計算機(jī)可讀指令,所述計算機(jī)可讀指令被處理器執(zhí)行時實(shí)現(xiàn)所述的用戶線索挖掘方法的步驟。
49、與現(xiàn)有技術(shù)相比,本技術(shù)實(shí)施例主要有以下有益效果:
50、本技術(shù)實(shí)施例通過獲取用戶通話文本,將成交用戶通話文本進(jìn)行預(yù)處理后,輸入預(yù)設(shè)的標(biāo)簽處理大模型進(jìn)行文本關(guān)鍵詞提取處理,得到第一用戶數(shù)據(jù)標(biāo)簽,通過第一用戶數(shù)據(jù)標(biāo)簽對潛在用戶通話文本進(jìn)行數(shù)據(jù)召回處理,得到弱標(biāo)簽數(shù)據(jù),將弱標(biāo)簽數(shù)據(jù)作為線索訓(xùn)練數(shù)據(jù)集,對通用模型進(jìn)行訓(xùn)練,得到線索模型,將潛在用戶通話文本輸入線索模型進(jìn)行線索搜索處理,生成第二用戶數(shù)據(jù)標(biāo)簽,將第一用戶數(shù)據(jù)標(biāo)簽以及第二用戶數(shù)據(jù)標(biāo)簽上傳至標(biāo)簽信息庫,對成交關(guān)鍵詞以及線索關(guān)鍵詞進(jìn)行分類處理,得到用戶線索信息,實(shí)現(xiàn)了一個完整線索挖掘過程的閉環(huán),充分利用大模型的能力,使其在線索挖掘的各個子任務(wù)發(fā)揮最大優(yōu)勢,有效降低標(biāo)注成本,提高了線索挖掘的效率,還可以主動發(fā)現(xiàn)新的線索或關(guān)鍵詞,減少線索的遺漏,提高從存量客戶中挖掘的線索量。