本發(fā)明涉及化塑產(chǎn)品推薦,尤其涉及基于用戶需求的化塑產(chǎn)品推薦方法及系統(tǒng)。
背景技術(shù):
1、化工和塑料(化塑)行業(yè)是現(xiàn)代制造業(yè)的重要組成部分,其產(chǎn)品廣泛應(yīng)用于多個(gè)領(lǐng)域,包括汽車、建筑、包裝、電子和醫(yī)療等。這一行業(yè)產(chǎn)品類型繁多,規(guī)格復(fù)雜,且每個(gè)產(chǎn)品常具備多種應(yīng)用場景和屬性特征。因此,針對(duì)用戶需求提供個(gè)性化的化塑產(chǎn)品推薦服務(wù),不僅可以提高采購效率,還能更好地滿足客戶的業(yè)務(wù)需求。
2、現(xiàn)有的化塑產(chǎn)品推薦技術(shù)主要包括以下幾個(gè)方面:基于協(xié)同過濾的推薦方法:通過分析用戶歷史行為數(shù)據(jù),找出相似用戶或相似產(chǎn)品,進(jìn)行推薦?;趦?nèi)容的推薦方法:利用產(chǎn)品屬性和用戶偏好進(jìn)行匹配。知識(shí)圖譜輔助推薦:利用領(lǐng)域知識(shí)增強(qiáng)推薦系統(tǒng)的解釋性和準(zhǔn)確性。
3、盡管上述研究在化塑產(chǎn)品推薦領(lǐng)域取得了一定進(jìn)展,但現(xiàn)有技術(shù)仍存在以下缺陷:缺乏對(duì)化塑行業(yè)專業(yè)知識(shí)的深度整合,難以準(zhǔn)確理解和匹配復(fù)雜的用戶需求;推薦過程中未充分考慮產(chǎn)品間的多維度關(guān)系和用戶行為的時(shí)序特性;對(duì)新用戶和冷啟動(dòng)問題的處理能力有限;推薦結(jié)果的個(gè)性化程度和解釋性有待提高。
4、綜上所述,現(xiàn)有的化塑產(chǎn)品推薦技術(shù)在處理復(fù)雜專業(yè)領(lǐng)域的個(gè)性化推薦問題時(shí),仍缺乏一種能夠深度融合領(lǐng)域知識(shí)、精準(zhǔn)理解用戶需求、動(dòng)態(tài)適應(yīng)市場變化的綜合解決方案。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提出了基于用戶需求的化塑產(chǎn)品推薦方法及系統(tǒng),通過構(gòu)建多維度化塑行業(yè)知識(shí)圖譜、深度語義理解用戶需求、優(yōu)化查詢條件生成、個(gè)性化排序等,以提高推薦的相關(guān)性和準(zhǔn)確性,進(jìn)而提升用戶體驗(yàn),優(yōu)化采購決策,并為化塑行業(yè)的數(shù)字化轉(zhuǎn)型提供有力支持。
2、本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
3、一方面,本發(fā)明提供了基于用戶需求的化塑產(chǎn)品推薦方法,包括:
4、s1構(gòu)建化塑行業(yè)知識(shí)圖譜;
5、s2獲取用戶歷史數(shù)據(jù)和當(dāng)前用戶需求,包括歷史搜索數(shù)據(jù)、歷史瀏覽數(shù)據(jù)、歷史交互數(shù)據(jù)和歷史交易數(shù)據(jù);
6、s3對(duì)用戶歷史數(shù)據(jù)進(jìn)行預(yù)處理,并對(duì)預(yù)處理后的用戶歷史數(shù)據(jù)進(jìn)行分析,提取歷史需求特征;
7、s4利用語義理解模型對(duì)當(dāng)前用戶需求進(jìn)行關(guān)鍵詞提取,并結(jié)合化塑行業(yè)知識(shí)圖譜,生成優(yōu)化查詢條件;
8、s5利用優(yōu)化查詢條件在化塑產(chǎn)品數(shù)據(jù)庫中進(jìn)行搜索,得到第一列表;
9、s6利用化塑行業(yè)知識(shí)圖譜對(duì)第一列表進(jìn)行個(gè)性化排序,取前k個(gè)生成推薦列表,并將推薦列表呈現(xiàn)給用戶。
10、優(yōu)選的,化塑行業(yè)知識(shí)圖譜的構(gòu)建過程包括:
11、從化塑產(chǎn)品數(shù)據(jù)庫、行業(yè)標(biāo)準(zhǔn)文檔、專家知識(shí)庫和用戶交互記錄中提取相關(guān)信息;
12、使用命名實(shí)體識(shí)別方法識(shí)別化塑產(chǎn)品、產(chǎn)品類別、屬性、屬性值、專業(yè)術(shù)語和應(yīng)用場景,采用關(guān)系抽取算法提取實(shí)體間的語義關(guān)系;
13、構(gòu)建多維度知識(shí)圖譜,包括第一維度子圖譜、第二維度子圖譜、第三維度子圖譜、第四維度子圖譜,其中第一維度子圖譜根據(jù)產(chǎn)品-產(chǎn)品類別-屬性為三元組格式進(jìn)行構(gòu)建得到,第二維度子圖譜根據(jù)產(chǎn)品-屬性-屬性值為三元組格式進(jìn)行構(gòu)建得到,第三維度子圖譜根據(jù)產(chǎn)品-專業(yè)術(shù)語-同義詞/近義詞為三元組格式進(jìn)行構(gòu)建得到,第四維度子圖譜根據(jù)產(chǎn)品-屬性-應(yīng)用場景為三元組格式進(jìn)行構(gòu)建得到;
14、采用transe算法對(duì)多維度知識(shí)圖譜進(jìn)行表示學(xué)習(xí),生成實(shí)體和關(guān)系的低維向量表示;
15、對(duì)不同維度的子圖譜進(jìn)行實(shí)體對(duì)齊和關(guān)系映射,使用圖融合算法將各個(gè)維度的子圖譜整合為統(tǒng)一的化塑行業(yè)知識(shí)圖譜。
16、優(yōu)選的,對(duì)不同維度的子圖譜進(jìn)行實(shí)體對(duì)齊和關(guān)系映射,使用圖融合算法將各個(gè)維度的子圖譜整合為統(tǒng)一的化塑行業(yè)知識(shí)圖譜,包括:
17、步驟一、對(duì)于每個(gè)子圖譜gi中的實(shí)體ei:
18、計(jì)算ei與其他子圖譜gj中所有實(shí)體ej的相似度sim(ei,ej);
19、若sim(ei,ej)>閾值t,則將ei和ej標(biāo)記為同一實(shí)體;
20、步驟二、構(gòu)建關(guān)系映射矩陣r,其中r[i][j]表示子圖譜gi中關(guān)系ri到gj中關(guān)系rj的映射,對(duì)于每對(duì)映射關(guān)系(ri,rj):
21、選擇一個(gè)統(tǒng)一的表述形式,更新r[i][j]和r[j][i];
22、步驟三、將第一維度子圖譜g1作為初始化的融合圖譜g,對(duì)于剩余維度的子圖譜gi:
23、將gi中的實(shí)體和關(guān)系添加到g中,使用步驟一和步驟二的結(jié)果處理實(shí)體或關(guān)系的重復(fù)和沖突;
24、步驟四、對(duì)于g中的每個(gè)實(shí)體e:
25、若e存在屬性值沖突,則保留時(shí)間戳最新的屬性值;
26、對(duì)于g中的每個(gè)關(guān)系r:
27、若r存在沖突,則保留置信度最高的關(guān)系;
28、步驟五、對(duì)于g中的任意兩個(gè)三元組(實(shí)體e1,關(guān)系r1,實(shí)體e2)、(實(shí)體e2,關(guān)系r2,實(shí)體e3):
29、若實(shí)體實(shí)體e1和實(shí)體e3滿足預(yù)定義的推理規(guī)則,則添加新的三元組(實(shí)體e1,關(guān)系rnew,實(shí)體e3)到g中;
30、步驟六、刪除g中的所有懸空實(shí)體和關(guān)系,對(duì)于g中的每個(gè)實(shí)體e:
31、若e的連接度<閾值k,則將e標(biāo)記為待審查;
32、步驟七、計(jì)算g中所有實(shí)體的重要度pr,對(duì)于pr低于閾值p的實(shí)體和其對(duì)應(yīng)的關(guān)系:
33、若不影響g的整體結(jié)構(gòu),則將其從g中移除;
34、步驟八、對(duì)于步驟六中標(biāo)記為待審查的實(shí)體e:
35、檢查e在其原始子圖譜中的重要度,若重要度超過閾值p,則保留e并增加其連接度,若其重要度低于閾值p,則將其移除;
36、步驟九、重復(fù)步驟一到步驟八,直至融合完成,將融合圖譜g存儲(chǔ)到圖數(shù)據(jù)庫d中,在d上建立多維索引結(jié)構(gòu),即得到化塑行業(yè)知識(shí)圖譜。
37、優(yōu)選的,步驟s3包括:
38、s31對(duì)用戶歷史數(shù)據(jù)進(jìn)行清洗,去除無效或異常數(shù)據(jù),并將格式統(tǒng)一,得到預(yù)處理后的用戶歷史數(shù)據(jù);
39、s32利用tf-idf方法從歷史搜索數(shù)據(jù)和歷史瀏覽數(shù)據(jù)中提取高頻詞,應(yīng)用word2vec模型將高頻詞轉(zhuǎn)化為向量表示,得到高頻詞向量,基于聚類算法對(duì)高頻詞向量進(jìn)行聚類,每個(gè)聚類簇表示一個(gè)用戶主題,得到用戶主題集;
40、s33從歷史瀏覽數(shù)據(jù)和歷史交互數(shù)據(jù)中提取目標(biāo)產(chǎn)品屬性,計(jì)算每個(gè)產(chǎn)品屬性的關(guān)注頻率和停留時(shí)間,生成屬性偏好向量;
41、s34對(duì)歷史交易數(shù)據(jù)中的價(jià)格分布進(jìn)行分析,計(jì)算用戶的平均成交價(jià)格和價(jià)格波動(dòng),生成價(jià)格敏感度指數(shù);
42、s35對(duì)歷史交易數(shù)據(jù)的時(shí)間序列進(jìn)行分析,識(shí)別采購周期和季節(jié)性模式,計(jì)算平均采購量和采購頻率,生成采購行為矩陣;
43、s36基于歷史搜索數(shù)據(jù)和歷史交易數(shù)據(jù),使用樸素貝葉斯分類器推斷應(yīng)用場景,計(jì)算每個(gè)應(yīng)用場景的概率得分;
44、s37計(jì)算用戶與每個(gè)用戶主題的相似度,將用戶主題集轉(zhuǎn)化為主題相似度向量,將主題相似度向量、屬性偏好向量、價(jià)格敏感度指數(shù)、采購行為矩陣、應(yīng)用場景的概率得分作為特征,對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理,并進(jìn)行加權(quán)融合,形成歷史需求特征。
45、優(yōu)選的,步驟s37還包括:對(duì)每個(gè)特征進(jìn)行時(shí)間權(quán)重計(jì)算,對(duì)每個(gè)特征應(yīng)用時(shí)間權(quán)重后進(jìn)行標(biāo)準(zhǔn)化處理,其中,時(shí)間權(quán)重的計(jì)算公式為:
46、
47、
48、式中,w為時(shí)間權(quán)重,λ為時(shí)間衰減系數(shù),t1為當(dāng)前時(shí)間,t0為特征產(chǎn)生的時(shí)間,λ0為基礎(chǔ)衰減系數(shù),ts為時(shí)間窗口。
49、優(yōu)選的,步驟s4包括:
50、s41將當(dāng)前用戶需求輸入預(yù)訓(xùn)練的語義理解模型,提取關(guān)鍵詞、語義特征向量和預(yù)測(cè)信息;
51、s42利用化塑行業(yè)知識(shí)圖譜對(duì)提取的關(guān)鍵詞進(jìn)行實(shí)體鏈接和擴(kuò)展,包括同義詞、近義詞和相關(guān)概念;
52、s43結(jié)合歷史需求特征和知識(shí)圖譜中的實(shí)體重要度,對(duì)擴(kuò)展后的關(guān)鍵詞進(jìn)行權(quán)重調(diào)整;
53、s44計(jì)算語義特征向量與歷史需求特征的相似度,并結(jié)合知識(shí)圖譜中的實(shí)體關(guān)系,得到查詢偏好;
54、s45基于權(quán)重調(diào)整后的關(guān)鍵詞和查詢偏好,結(jié)合歷史需求特征中的屬性偏好、價(jià)格敏感度和應(yīng)用場景信息,以及知識(shí)圖譜中的產(chǎn)品屬性層級(jí)結(jié)構(gòu),生成初步的查詢條件;
55、s46利用語義特征向量、預(yù)測(cè)信息和知識(shí)圖譜中的關(guān)聯(lián)規(guī)則,擴(kuò)展初步的查詢條件;
56、s47對(duì)擴(kuò)展后的查詢條件進(jìn)行相似度計(jì)算,利用知識(shí)圖譜中的約束關(guān)系去除冗余或矛盾的條件;
57、s48基于知識(shí)圖譜中的實(shí)體重要度,對(duì)剩余條件重新排序,得到最終的優(yōu)化查詢條件。
58、優(yōu)選的,語義理解模型包括輸入層、嵌入層、多層transformer編碼器、上下文增強(qiáng)層、多尺度特征提取層、自適應(yīng)池化層、多任務(wù)輸出層,其中:
59、多層transformer編碼器包含l個(gè)transformer層,每層包括多頭自注意力子層和前饋神經(jīng)網(wǎng)絡(luò)子層,多頭自注意力子層包括h個(gè)注意力頭,每個(gè)注意力頭的維度為d/h,前饋神經(jīng)網(wǎng)絡(luò)子層采用兩層全連接網(wǎng)絡(luò),中間使用gelu激活函數(shù),多層transformer編碼器的每個(gè)子層后使用ln和殘差連接;
60、上下文增強(qiáng)層采用雙向長短時(shí)記憶網(wǎng)絡(luò);
61、多尺度特征提取層包含多個(gè)不同kernel?size的一維卷積,每個(gè)卷積后接leakyrelu激活函數(shù)和最大池化操作;
62、自適應(yīng)池化層采用自注意力機(jī)制;
63、多任務(wù)輸出層包括三條分支,第一分支采用條件隨機(jī)場提取關(guān)鍵詞,第二分支利用非線性變換生成語義特征向量,第三分支為多標(biāo)簽分類器,用于生成預(yù)測(cè)信息,包括預(yù)測(cè)產(chǎn)品類別、預(yù)測(cè)屬性和預(yù)測(cè)應(yīng)用場景。
64、優(yōu)選的,語義理解模型對(duì)當(dāng)前用戶需求的處理過程為:
65、輸入層接收當(dāng)前用戶需求,將文本轉(zhuǎn)換為token序列,并添加[cls]和[sep]標(biāo)記,其中,[cls]用于捕獲整個(gè)輸入的語義信息,[sep]用于區(qū)分不同的輸入片段;
66、嵌入層對(duì)每個(gè)token生成詞嵌入、位置嵌入和分段嵌入,將三種嵌入相加,得到初始表示;
67、初始表示經(jīng)過多層transformer編碼器處理,每層包括:
68、多頭自注意力計(jì)算每個(gè)token相對(duì)于其他token的注意力權(quán)重,提取句子級(jí)語義特征。
69、前饋神經(jīng)網(wǎng)絡(luò)通過非線性變換處理注意力輸出;
70、使用雙向長短時(shí)記憶網(wǎng)絡(luò)對(duì)多層transformer編碼器的輸出進(jìn)行處理,添加上下文信息;
71、多尺度特征提取層應(yīng)用多種卷積核提取特征,將不同卷積核輸出的特征進(jìn)行拼接,得到多尺度特征;
72、自適應(yīng)池化層通過自注意機(jī)制將多尺度特征轉(zhuǎn)化為固定長度的語義表示;
73、多任務(wù)輸出層中,第一分支采用條件隨機(jī)場對(duì)每個(gè)token進(jìn)行序列標(biāo)注,輸出關(guān)鍵詞列表,第二分支將池化后的語義表示通過非線性層轉(zhuǎn)換為語義特征向量,第三分支采用多標(biāo)簽分類器對(duì)產(chǎn)品類別、關(guān)鍵屬性、應(yīng)用場景進(jìn)行結(jié)構(gòu)化預(yù)測(cè)。
74、優(yōu)選的,步驟s6包括:
75、s61基于化塑行業(yè)知識(shí)圖譜,為第一列表中的每個(gè)化塑產(chǎn)品計(jì)算與優(yōu)化查詢條件的語義相關(guān)度;
76、s62結(jié)合用戶歷史數(shù)據(jù),計(jì)算每個(gè)化塑產(chǎn)品的個(gè)性化得分;
77、s63利用化塑行業(yè)知識(shí)圖譜的多維度信息,計(jì)算化塑產(chǎn)品之間的相似度;
78、s64將語義相關(guān)度、個(gè)性化得分、相似度進(jìn)行加權(quán)組合,得到每個(gè)化塑產(chǎn)品的綜合得分,根據(jù)綜合得分對(duì)第一列表進(jìn)行重排,得到第二列表;
79、s65從第二列表中選取前k個(gè)選項(xiàng),生成推薦列表,將推薦列表呈現(xiàn)給用戶。
80、另一方面,本發(fā)明還提供基于用戶需求的化塑產(chǎn)品推薦系統(tǒng),所述系統(tǒng)用于執(zhí)行上述任一項(xiàng)所述的方法,所述系統(tǒng)包括:
81、知識(shí)圖譜構(gòu)建模塊,其配置為從化塑產(chǎn)品數(shù)據(jù)庫、行業(yè)標(biāo)準(zhǔn)文檔及專家知識(shí)庫中提取信息,利用實(shí)體識(shí)別和關(guān)系抽取形成多維度知識(shí)圖譜,并執(zhí)行實(shí)體對(duì)齊、關(guān)系映射及圖譜融合操作,以生成統(tǒng)一的化塑行業(yè)知識(shí)圖譜;
82、數(shù)據(jù)采集模塊,配置為從用戶交互活動(dòng)中獲取歷史搜索數(shù)據(jù)、瀏覽數(shù)據(jù)、交互數(shù)據(jù)和交易數(shù)據(jù);
83、預(yù)處理模塊,連接至數(shù)據(jù)采集模塊,并配置為對(duì)所獲取的用戶歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、格式標(biāo)準(zhǔn)化及異常值剔除,以生成預(yù)處理后的用戶數(shù)據(jù)集;
84、用戶建模模塊,配置為通過分析預(yù)處理后的用戶數(shù)據(jù)集,提取用戶歷史行為特征,生成用戶興趣主題、屬性偏好向量、價(jià)格敏感度指數(shù)、采購行為矩陣及應(yīng)用場景的概率得分;
85、語義理解模塊,內(nèi)置語義理解模型,包括輸入層、嵌入層、多層transformer編碼器、上下文增強(qiáng)層、多尺度特征提取層、自適應(yīng)池化層、多任務(wù)輸出層,對(duì)當(dāng)前用戶需求進(jìn)行語義解析,提取關(guān)鍵詞、語義特征向量及預(yù)測(cè)信息;
86、查詢優(yōu)化模塊,連接于語義理解模塊與知識(shí)圖譜構(gòu)建模塊之間,并配置為結(jié)合用戶歷史需求特征和化塑行業(yè)知識(shí)圖譜對(duì)用戶查詢進(jìn)行語義擴(kuò)展、權(quán)重調(diào)整及條件優(yōu)化,生成優(yōu)化查詢條件;
87、產(chǎn)品搜索模塊,配置為在化塑產(chǎn)品數(shù)據(jù)庫中依據(jù)優(yōu)化查詢條件執(zhí)行搜索操作,從而生成第一列表;
88、個(gè)性化排序模塊,其連接至產(chǎn)品搜索模塊,配置為依據(jù)語義相關(guān)度、個(gè)性化得分及產(chǎn)品相似度綜合計(jì)算每個(gè)化塑產(chǎn)品的綜合得分,以對(duì)第一列表進(jìn)行排序調(diào)整;
89、推薦生成模塊,配置為從經(jīng)過排序調(diào)整的第一列表中選擇預(yù)設(shè)數(shù)量的產(chǎn)品,以生成最終推薦列表并輸出給用戶;
90、反饋收集模塊,用于采集用戶對(duì)推薦結(jié)果的反饋,以優(yōu)化化塑行業(yè)知識(shí)圖譜。
91、本發(fā)明相對(duì)于現(xiàn)有技術(shù)具有以下有益效果:
92、(1)通過融合多維度知識(shí)圖譜、深度語義理解、查詢優(yōu)化和個(gè)性化排序,實(shí)現(xiàn)了對(duì)化塑產(chǎn)品用戶需求的精準(zhǔn)理解和匹配,顯著提高了推薦的準(zhǔn)確性和相關(guān)性,有效解決了化塑行業(yè)復(fù)雜語義環(huán)境下的產(chǎn)品推薦難題;
93、(2)通過構(gòu)建多維度化塑行業(yè)知識(shí)圖譜并進(jìn)行圖融合,系統(tǒng)性地整合了產(chǎn)品類別、屬性、專業(yè)術(shù)語和應(yīng)用場景等多方面信息,為后續(xù)的語義理解和查詢優(yōu)化提供了豐富的知識(shí)基礎(chǔ),增強(qiáng)了推薦系統(tǒng)對(duì)行業(yè)特性的把握能力;
94、(3)利用基于多層transformer編碼器的語義理解模型,結(jié)合上下文增強(qiáng)和多尺度特征提取方式,實(shí)現(xiàn)了對(duì)用戶需求的深度解析,提取出關(guān)鍵詞、語義特征向量和預(yù)測(cè)信息,大幅提升了系統(tǒng)對(duì)復(fù)雜用戶需求的理解能力;
95、(4)采用多階段查詢優(yōu)化策略,包括實(shí)體鏈接、語義擴(kuò)展、權(quán)重調(diào)整和條件生成等步驟,有效地將用戶需求轉(zhuǎn)化為優(yōu)化的查詢條件,提高了檢索效率和結(jié)果的相關(guān)性;
96、(5)通過融合語義相關(guān)度、個(gè)性化得分和產(chǎn)品相似度的綜合排序機(jī)制,實(shí)現(xiàn)了對(duì)搜索結(jié)果的個(gè)性化重排,確保了推薦列表與用戶需求的高度匹配,同時(shí)兼顧了產(chǎn)品多樣性;
97、(6)推薦系統(tǒng)通過模塊化設(shè)計(jì)和多項(xiàng)創(chuàng)新技術(shù)的集成,實(shí)現(xiàn)了從用戶需求輸入到最終推薦列表輸出的全流程智能化處理,為化塑行業(yè)用戶提供了高效、精準(zhǔn)、個(gè)性化的產(chǎn)品推薦服務(wù),顯著提升了用戶體驗(yàn)和采購決策效率。