一種基于ERNIE模型的購車意圖識別系統(tǒng)的制作方法

文檔序號：40322645發(fā)布日期：2024-12-18 12:59閱讀：7來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及電子數(shù)據(jù)處理，尤其涉及一種基于ernie模型的購車意圖識別系統(tǒng)。

背景技術(shù)：

1、隨著數(shù)字技術(shù)的發(fā)展和互聯(lián)網(wǎng)的普及，二手車市場經(jīng)歷了從傳統(tǒng)線下交易到線上平臺交易的轉(zhuǎn)變，在這個過程中，大量的用戶行為數(shù)據(jù)和交流信息被生成，為企業(yè)提供了深入了解客戶需求和優(yōu)化服務(wù)的機會，目前，市場上的二手車交易平臺主要依賴用戶直接輸入的數(shù)據(jù)來進行客戶意圖的捕捉和商品推薦，無法全面捕捉到用戶的隱性需求和更深層次的購買意圖，從而導(dǎo)致服務(wù)效率和用戶滿意度的不足，目前廣泛應(yīng)用的技術(shù)主要包括關(guān)鍵詞搜索和基礎(chǔ)的數(shù)據(jù)分析方法，例如，通過分析用戶輸入的關(guān)鍵詞來推測用戶意圖，或者通過統(tǒng)計分析用戶的點擊行為來推測其偏好，這些方法往往依賴于較為直觀的數(shù)據(jù)解讀，缺乏對用戶語言和行為背后深層次意圖的理解。

2、中國專利公開號：cn117237006a公開了一種車輛營銷方法、裝置、設(shè)備和存儲介質(zhì)；所述方法包括：獲取銷售人員與欲購車輛的第一用戶溝通得到的結(jié)構(gòu)化數(shù)據(jù)以及所述第一用戶在試乘試駕期間的非結(jié)構(gòu)化數(shù)據(jù)；基于所述結(jié)構(gòu)化數(shù)據(jù)、所述非結(jié)構(gòu)化數(shù)據(jù)、購車知識圖譜和購車決策模型，確定所述第一用戶的購車意圖；基于所述購車意圖，確定車輛營銷策略。但該方案未針對用戶語言信息進行數(shù)據(jù)分析處理，難以提高二手車交易過程中用戶購車意圖成功識別的準(zhǔn)確率。

技術(shù)實現(xiàn)思路

1、為此，本發(fā)明提供一種基于ernie模型的購車意圖識別系統(tǒng)，用以克服現(xiàn)有技術(shù)中二手車交易過程中用戶購車意圖成功識別的準(zhǔn)確率低的問題。

2、為實現(xiàn)上述目的，本發(fā)明提供一種基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述系統(tǒng)包括：

3、數(shù)據(jù)收集模塊，用以對用戶自然語言數(shù)據(jù)進行收集；

4、數(shù)據(jù)優(yōu)化模塊，用以對用戶自然語言數(shù)據(jù)進行優(yōu)化處理，得到優(yōu)化后用戶數(shù)據(jù)；

5、數(shù)據(jù)預(yù)處理模塊，用以對優(yōu)化后用戶數(shù)據(jù)進行清洗，得到預(yù)處理ernie模型數(shù)據(jù)，并將預(yù)處理ernie模型數(shù)據(jù)劃分為訓(xùn)練集、驗證集和測試集；

6、數(shù)據(jù)模型微調(diào)模塊，用以對初步ernie模型進行微調(diào)，得到微調(diào)ernie模型；

7、模型完善模塊，用以對微調(diào)ernie模型進行模型完善得到購車意圖識別模型；

8、購車意圖識別模塊，用以將實時采集的用戶自然語言數(shù)據(jù)輸入至購車意圖識別模型中，并輸出客戶意圖預(yù)測數(shù)據(jù)。

9、進一步地，所述數(shù)據(jù)優(yōu)化模塊包括：

10、數(shù)據(jù)流處理單元，用以對用戶自然語言數(shù)據(jù)進行實時處理，得到即時連續(xù)的用戶語言數(shù)據(jù)；

11、數(shù)據(jù)驗證清洗單元，用以對即時連續(xù)的用戶語言數(shù)據(jù)進行驗證修復(fù)，得到高質(zhì)量用戶語言數(shù)據(jù)；

12、自適應(yīng)數(shù)據(jù)采集單元，用以實時調(diào)整高質(zhì)量用戶語言數(shù)據(jù)的采集頻率，得到充足高質(zhì)量用戶語言數(shù)據(jù)；

13、智能化錯誤處理單元，用以自動識別所述充足高質(zhì)量用戶語言數(shù)據(jù)中的錯誤并對所述錯誤進行修復(fù)，將修復(fù)后的充足高質(zhì)量用戶語言數(shù)據(jù)作為優(yōu)化后用戶數(shù)據(jù)。

14、進一步地，所述數(shù)據(jù)流處理單元使用數(shù)據(jù)流處理技術(shù)apache?kafka對用戶自然語言數(shù)據(jù)進行實時處理，得到即時連續(xù)的用戶語言數(shù)據(jù)；

15、所述數(shù)據(jù)驗證清洗單元使用文字識別處理工具對即時連續(xù)的用戶語言數(shù)據(jù)格式和內(nèi)容進行驗證修復(fù)，得到高質(zhì)量用戶語言數(shù)據(jù)。

16、進一步地，所述自適應(yīng)數(shù)據(jù)采集單元使用api工具對高質(zhì)量用戶語言數(shù)據(jù)采集頻率和范圍進行調(diào)整，得到充足高質(zhì)量用戶語言數(shù)據(jù)；

17、所述智能化錯誤處理單元使用informatica?data?quality工具，應(yīng)用informatica?data?quality工具中的錯誤修復(fù)策略對所述充足高質(zhì)量用戶語言數(shù)據(jù)收集過程中出現(xiàn)的錯誤進行修復(fù)，得到優(yōu)化后用戶數(shù)據(jù)。

18、進一步地，所述數(shù)據(jù)預(yù)處理模塊包括：

19、結(jié)構(gòu)修正單元，用以對優(yōu)化后用戶數(shù)據(jù)進行語法結(jié)構(gòu)修正，得到修正后用戶數(shù)據(jù)；

20、去重復(fù)單元，用以去除修正后用戶數(shù)據(jù)中的個人重復(fù)數(shù)據(jù)，得到預(yù)處理ernie模型數(shù)據(jù)，并將預(yù)處理ernie模型數(shù)據(jù)劃分為訓(xùn)練集和測試集。

21、進一步地，所述結(jié)構(gòu)修正單元使用文字?jǐn)?shù)據(jù)修復(fù)工具對優(yōu)化后用戶數(shù)據(jù)進行詞匯修正、語法修正和結(jié)構(gòu)修正，得到修正后用戶數(shù)據(jù)；

22、所述去重復(fù)單元通過數(shù)據(jù)處理工具對修正后用戶數(shù)據(jù)進行去重復(fù)處理，得到預(yù)處理ernie模型數(shù)據(jù)，并將預(yù)處理ernie模型數(shù)據(jù)劃分為70％訓(xùn)練集、30％測試集。

23、進一步地，所述數(shù)據(jù)模型微調(diào)模塊，將預(yù)訓(xùn)練ernie模型的學(xué)習(xí)率p設(shè)置為p＝p0/10，設(shè)定p0為原始學(xué)習(xí)率，得到微調(diào)ernie模型。

24、進一步地，所述模型完善模塊包括：

25、意圖識別訓(xùn)練單元，用以根據(jù)訓(xùn)練集對微調(diào)ernie模型進行訓(xùn)練，將驗證集輸入訓(xùn)練后的微調(diào)ernie模型，并輸出驗證準(zhǔn)確率k；

26、模型優(yōu)化單元，用以將驗證準(zhǔn)確率k與預(yù)設(shè)準(zhǔn)確率k0進行比對，并根據(jù)比對結(jié)果對微調(diào)ernie模型實用性進行判斷，并根據(jù)判斷結(jié)果對微調(diào)ernie模型進行輸出。

27、進一步地，所述意圖識別訓(xùn)練單元，將訓(xùn)練集輸入至微調(diào)ernie模型中進行訓(xùn)練，將驗證集輸入至訓(xùn)練后的微調(diào)ernie模型，并輸出驗證準(zhǔn)確率k，其中，設(shè)定正確驗證數(shù)量為q，驗證集樣本數(shù)為q0，驗證準(zhǔn)確率k＝q/q0。

28、進一步地，所述模型優(yōu)化單元，將驗證準(zhǔn)確率k與預(yù)設(shè)準(zhǔn)確率k0進行比對，并根據(jù)比對結(jié)果對訓(xùn)練后的微調(diào)ernie模型實用性進行判斷，并根據(jù)判斷結(jié)果對微調(diào)ernie模型進行輸出，其中：

29、當(dāng)k≥k0時，判定訓(xùn)練后的微調(diào)ernie模型實用性達標(biāo)，并將訓(xùn)練后的微調(diào)ernie模型作為購車意圖識別模型進行輸出；

30、當(dāng)k＜k0時，判定訓(xùn)練后的微調(diào)ernie模型實用性不達標(biāo)，返回數(shù)據(jù)收集模塊，獲取第二用戶自然語言數(shù)據(jù)，并根據(jù)第二用戶自然語言數(shù)據(jù)對微調(diào)ernie模型進行訓(xùn)練，直至訓(xùn)練后的微調(diào)ernie模型實用性達標(biāo)。

31、與現(xiàn)有技術(shù)相比，本發(fā)明的有益效果在于，所述系統(tǒng)通過數(shù)據(jù)收集模塊對用戶自然語言數(shù)據(jù)進行收集，再經(jīng)過數(shù)據(jù)優(yōu)化模塊對用戶自然語言數(shù)據(jù)進行初步篩選優(yōu)化，得到優(yōu)化后用戶數(shù)據(jù)，再通過數(shù)據(jù)預(yù)處理模塊，對優(yōu)化后用戶數(shù)據(jù)進行去噪聲詞，語法結(jié)構(gòu)修正和去除重復(fù)數(shù)據(jù)，得到預(yù)處理ernie模型數(shù)據(jù)，并將預(yù)處理ernie模型數(shù)據(jù)輸入到數(shù)據(jù)模型微調(diào)模塊生成的微調(diào)ernie模型中生成用戶初步購車意圖預(yù)測結(jié)果，通過模型完善模塊根據(jù)用戶購車意圖預(yù)測準(zhǔn)確率對模型進行進一步調(diào)整，得到一種基于ernie模型識別用戶購車意圖的模型，從而提高對用戶購車意圖的分析效率。

技術(shù)特征：

1.一種基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述系統(tǒng)包括：

2.根據(jù)權(quán)利要求1所述的基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述數(shù)據(jù)優(yōu)化模塊包括：

3.根據(jù)權(quán)利要求2所述的基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述數(shù)據(jù)流處理單元使用數(shù)據(jù)流處理技術(shù)apache?kafka對用戶自然語言數(shù)據(jù)進行實時處理，得到即時連續(xù)的用戶語言數(shù)據(jù)；

4.根據(jù)權(quán)利要求3所述的基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述自適應(yīng)數(shù)據(jù)采集單元使用api工具對高質(zhì)量用戶語言數(shù)據(jù)采集頻率和范圍進行調(diào)整，得到充足高質(zhì)量用戶語言數(shù)據(jù)；

5.根據(jù)權(quán)利要求1所述的基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述數(shù)據(jù)預(yù)處理模塊包括：

6.根據(jù)權(quán)利要求5所述的基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述結(jié)構(gòu)修正單元使用文字?jǐn)?shù)據(jù)修復(fù)工具對優(yōu)化后用戶數(shù)據(jù)進行詞匯修正、語法修正和結(jié)構(gòu)修正，得到修正后用戶數(shù)據(jù)；

7.根據(jù)權(quán)利要求1所述的基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述數(shù)據(jù)模型微調(diào)模塊，將預(yù)訓(xùn)練ernie模型的學(xué)習(xí)率p設(shè)置為p＝p0/10，設(shè)定p0為原始學(xué)習(xí)率，得到微調(diào)ernie模型。

8.根據(jù)權(quán)利要求1所述的基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述模型完善模塊包括：

9.根據(jù)權(quán)利要求8所述的基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述意圖識別訓(xùn)練單元，將訓(xùn)練集輸入至微調(diào)ernie模型中進行訓(xùn)練，將驗證集輸入至訓(xùn)練后的微調(diào)ernie模型，并輸出驗證準(zhǔn)確率k，其中，設(shè)定正確驗證數(shù)量為q，驗證集樣本數(shù)為q0，驗證準(zhǔn)確率k＝q/q0。

10.根據(jù)權(quán)利要求9所述的基于ernie模型的購車意圖識別系統(tǒng)，其特征在于，所述模型優(yōu)化單元，將驗證準(zhǔn)確率k與預(yù)設(shè)準(zhǔn)確率k0進行比對，并根據(jù)比對結(jié)果對訓(xùn)練后的微調(diào)ernie模型實用性進行判斷，并根據(jù)判斷結(jié)果對微調(diào)ernie模型進行輸出，其中：

技術(shù)總結(jié)
本發(fā)明涉及電子數(shù)據(jù)處理技術(shù)領(lǐng)域，尤其涉及一種基于ERNIE模型的購車意圖識別系統(tǒng)，包括數(shù)據(jù)收集模塊，用以對用戶自然語言數(shù)據(jù)進行收集；數(shù)據(jù)優(yōu)化模塊，用以對用戶自然語言數(shù)據(jù)進行優(yōu)化處理；數(shù)據(jù)預(yù)處理模塊，用以對優(yōu)化后用戶數(shù)據(jù)進行清洗，并將預(yù)處理ERNIE模型數(shù)據(jù)劃分為訓(xùn)練集、驗證集和測試集；數(shù)據(jù)模型微調(diào)模塊，用以對初步ERNIE模型進行微調(diào)，得到微調(diào)ERNIE模型；模型完善模塊，用以對微調(diào)ERNIE模型進行模型完善得到購車意圖識別模型；購車意圖識別模塊，用以將實時采集的用戶自然語言數(shù)據(jù)輸入至購車意圖識別模型中。本發(fā)明提高了二手車交易過程中用戶購車意圖成功識別的準(zhǔn)確率。

技術(shù)研發(fā)人員：盧國棟,段學(xué)超
受保護的技術(shù)使用者：北京酷車易美網(wǎng)絡(luò)科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/17

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：盧國棟,段學(xué)超
技術(shù)所有人：北京酷車易美網(wǎng)絡(luò)科技有限公司
我是此專利的發(fā)明人

上一篇：一種電線電纜環(huán)切刀具及應(yīng)用方法與流程
上一篇：一種儲存組件及氣溶膠生成裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于ERNIE模型的購車意圖識別系統(tǒng)的制作方法