1.一種融合供需鏈的個性化汽車推薦方法,其特征是,包括以下步驟:
Step1:構造張量-矩陣耦合數(shù)據(jù)模型;
Step1.1:構造汽車打分張量X;
Step1.2:構造車型與所屬的車系的從屬關系矩陣L、車系與汽車制造商的生產(chǎn)關系矩陣M、汽車制造商與供應商關系矩陣S、用戶購車目的矩陣P和車型配置信息矩陣T;
Step1.3:利用張量與矩陣之間、矩陣與矩陣之間維度共享關系,形成張量-矩陣耦合數(shù)據(jù)模型;
Step2:對Step1中得到的汽車打分張量X采用CP分解,得到因子矩陣A1、B1和C;對于車型與所屬的車系的從屬關系矩陣L、車系與汽車制造商的生產(chǎn)關系矩陣M、汽車制造商與供應商關系矩陣S、用戶購車目的矩陣P和車型配置信息矩陣T采用矩陣分解方法,使每個矩陣分解后都分別得到相應的若干個因子矩陣,然后構建張量X和車型與所屬的車系的從屬關系矩陣L、車系與汽車制造商的生產(chǎn)關系矩陣M、汽車制造商與供應商關系矩陣S、用戶購車目的矩陣P、車型配置信息矩陣T的聯(lián)合分解損失函數(shù)Z;利用聯(lián)合分解損失函數(shù)Z構建約束性優(yōu)化問題;
Step3:用增廣拉格朗日方法將Step2的約束性優(yōu)化問題轉化為一個無約束優(yōu)化問題;
Step4:用ADMM算法來解決Step3的無約束優(yōu)化問題,對Step1的張量-矩陣耦合數(shù)據(jù)模型進行聯(lián)合分解;
Step5:迭代計算Step4,矩陣A1,B1,C在迭代計算后,通過來還原張量X,補全其缺失值;計算出RMSE和MAE,RMSE和MAE的數(shù)值越小說明預測結果越好,預測數(shù)值與實際數(shù)值相差越小;
Step6:設置迭代過程的終止條件為達到最大迭代次數(shù)Imax或者RMSE達到閾值以下,判斷Step5中求得的RMSE或迭代次數(shù)是否滿足設定的終止條件,若滿足則循環(huán)結束,進入step7,否則返回Step4;
Step7:根據(jù)step5還原出的張量得到完整的用戶打分張量,針對不同的用戶,根據(jù)預測出來的結果,按照打分從高到低的次序依次向用戶推薦車型。
2.如權利要求1所述的一種融合供需鏈的個性化汽車推薦方法,其特征是,所述Step1.1中汽車打分張量為三階張量,分別對應維度為用戶,車型和車型評價指標;
汽車打分張量X中的元素Xijk取值范圍為1-5,表示用戶i對車型j的第k個評價指標的打分;
車型共有八個評價指標分別為空間、動力、舒適性、油耗、操控、外觀、內(nèi)飾和性價比;
汽車打分張量X是稀疏的,有缺失值,目的是更準確地預測出缺失值,為用戶提供個性化推薦。
3.如權利要求1所述的一種融合供需鏈的個性化汽車推薦方法,其特征是,所述Step1.2:
構造車型與所屬的車系的從屬關系矩陣L,矩陣L的兩個維度分別對應車型和車系,矩陣元素Ljq取值為0-1型,若為1,表示車型j屬于車系q下的產(chǎn)品;
構造車系與汽車制造商的生產(chǎn)關系矩陣M,矩陣M的兩個維度分別是車系和制造商;
構造汽車制造商與供應商關系矩陣S,矩陣S的兩個維度分別是制造商和供應商,M和S的取值也是0-1型;
構造用戶購車目的矩陣P,P的兩個維度分別是用戶和購車目的,若用戶i具有購車目的n,則Pin為1,否則為0;
構造車型配置信息矩陣T,T的兩個維度分別為車型和配置屬性;
車型與所屬的車系的從屬關系矩陣L、車系與汽車制造商的生產(chǎn)關系矩陣M、汽車制造商與供應商關系矩陣S、用戶購車目的矩陣P和車型配置信息矩陣T都是完整的,用來協(xié)助預測張量X中的缺失值。
4.如權利要求1所述的一種融合供需鏈的個性化汽車推薦方法,其特征是,Step1.3:張量和矩陣之間或者是矩陣與矩陣之間存在多個維度的共享關系:
汽車打分張量X與用戶購車目的矩陣P共享用戶維度,汽車打分張量X與車型配置信息矩陣T及車型所屬車系的從屬關系矩陣L共享車型維度,車型所屬車系的從屬關系矩陣L與車系和制造商生產(chǎn)關系矩陣M共享車系維度,車系制造商生產(chǎn)關系矩陣M與制造商和供應商供應關系矩陣S共享制造商維度,共享關系形成張量-矩陣耦合數(shù)據(jù)模型。
5.如權利要求1所述的一種融合供需鏈的個性化汽車推薦方法,其特征是,Step2:聯(lián)合分解損失函數(shù)Z:
Z=ZX+ZP+ZT+ZL+ZM+ZS; (1)
其中,ZX表示張量X進行CP分解的損失函數(shù),ZP表示矩陣P因子分解的損失函數(shù),ZT表示矩陣T因子分解的損失函數(shù),ZL表示矩陣L因子分解的損失函數(shù),ZM表示矩陣M因子分解的損失函數(shù),ZS表示矩陣S因子分解的損失函數(shù);
ZX,ZP,ZT,ZL,ZM,ZS分別定義如下:
其中,A1、B1和C是張量X通過CP分解得到的因子矩陣;A2和D為矩陣P分解得到的因子矩陣;B2和E為矩陣T分解得到的因子矩陣;B3和F1為矩陣L分解得到的因子矩陣;F2和G1為矩陣M分解得到的因子矩陣;G2和H為矩陣S分解得到的因子矩陣;λ1,λ2,λ3,λ4,λ5,λ6是正則化參數(shù),||*||F表示矩陣的F-范數(shù);X(1)是張量X按照mode-1展開得到的矩陣,⊙表示Khatri-Rao乘積;
由于張量X及矩陣P,T,L,M,S相互之間存在共享的維度,因此期望張量X和矩陣P,T,L,M,S分解得到的共享維度對應的因子矩陣是相同的,構建全局變量矩陣來對共享維度的因子矩陣作出限制。
6.如權利要求5所述的一種融合供需鏈的個性化汽車推薦方法,其特征是,所述構建全局變量矩陣來對共享維度的因子矩陣作出限制:
張量X和矩陣P共享用戶維度,期望二者分解出的對應用戶維度的因子矩陣A1和A2是相等的,定義全局變量矩陣與因子矩陣A1和A2對應;
全局變量矩陣對A1和A2作出限制如下:
同樣的,對于其他矩陣與張量間和矩陣與矩陣之間的共享維度,定義和對應相應的因子矩陣;
張量X和矩陣T、L共享車型維度,期望三者分解出的對應車型維度的因子矩陣B1,B2和B3是相等的,定義全局變量矩陣與因子矩陣B1,B2和B3對應;
全局變量矩陣對B1,B2和B3作出限制如下:
矩陣L和M共享車系維度,期望二者分解出的對應車系維度的因子矩陣F1和F2是相等的,定義全局變量矩陣與因子矩陣F1和F2對應;
全局變量矩陣對F1和F2作出限制如下:
矩陣M和S共享制造商維度,期望二者分解出的對應制造商維度的因子矩陣G1和G2是相等的,定義全局變量矩陣與因子矩陣G1和G2對應;
全局變量矩陣對G1和G2作出限制如下:
最小化代價目標函數(shù)寫為如下的約束性優(yōu)化問題:
其中,為方便寫作,用Ψ表示因子矩陣集合:
Ψ={A1,A2,B1,B2,B3,C,D,E,F1,F2,G1,G2,H};
其中,A1、B1和C是張量X通過CP分解得到的因子矩陣;A2和D為矩陣P分解得到的因子矩陣;B2和E為矩陣T分解得到的因子矩陣;B3和F1為矩陣L分解得到的因子矩陣;F2和G1為矩陣M分解得到的因子矩陣;G2和H為矩陣S分解得到的因子矩陣。
7.如權利要求1所述的一種融合供需鏈的個性化汽車推薦方法,其特征是,Step3的目標函數(shù)如下:
其中,Z為聯(lián)合分解損失函數(shù),Lρ()表示增廣拉格朗日函數(shù),其中ρ是懲罰參數(shù),為拉格朗日乘子(Lagrangian multipliers),tr()表示求矩陣的跡;Ap包括A1和A2,F(xiàn)p包括F1和F2,Gp包括G1和G2,Bq包括B1、B2和B3;為全局變量矩陣。
8.如權利要求1所述的一種融合供需鏈的個性化汽車推薦方法,其特征是,所述Step4:
對于Ψ集合中的因子矩陣,分別求Ψ集合中的因子矩陣相對與函數(shù)Lρ的偏導數(shù),使得偏導數(shù)等于0,求得因子矩陣更新公式;
其中,Ψk+1表示Ψ集合經(jīng)過第k+1次迭代更新的得到的結果;表示經(jīng)過第k次迭代更新的得到的結果;表示經(jīng)過第k次迭代更新的得到的結果;表示經(jīng)過第k次迭代更新的得到的結果;表示經(jīng)過第k次迭代更新的得到的結果;表示經(jīng)過第k次迭代更新的得到的結果;表示經(jīng)過第k次迭代更新的得到的結果;
Ψ={A1,A2,B1,B2,B3,C,D,E,F1,F2,G1,G2,H}表示因子矩陣集合,Ψk+1表示Ψ集合中的因子矩陣經(jīng)第k+1次迭代更新得到的值,為拉格朗日乘子,為避免公式(4-1)過長簡寫為表示拉格朗日乘子經(jīng)第k次迭代更新得到的值;
對于全局變量分別對函數(shù)Lρ求全局變量的偏導數(shù),使得偏導數(shù)等于0,求得全局變量矩陣更新公式;
其中,分別表示經(jīng)第k+1次迭代更新得到的值;
用公式(4-3)-公式(4-6)更新
9.如權利要求1所述的一種融合供需鏈的個性化汽車推薦方法,其特征是,Step5中:RMSE和MAE的計算公式為:
其中,ym代表是測試集中張量非缺失值的預測結果,而ym是測試集中張量打分的真實值,對應張量X中的一個元素Xijk,n代表的是測試集樣本數(shù)量。
10.一種融合供需鏈的個性化汽車推薦系統(tǒng),其特征是,包括:耦合張量-矩陣模型構建模塊、打分張量缺失值預測模塊和用戶車型推薦模塊,其中:
耦合張量-矩陣模型構建模塊,根據(jù)從汽車之家網(wǎng)站上爬取到的用戶購車信息、打分信息、車型信息以及從汽車企業(yè)網(wǎng)絡中爬取的企業(yè)供應關系抽取數(shù)據(jù),構造汽車打分張量X,構造車型與所屬的車系的從屬關系矩陣L、車系與汽車制造商的生產(chǎn)關系矩陣M、汽車制造商與供應商關系矩陣S、用戶購車目的矩陣P和車型配置信息矩陣T;構建耦合張量-矩陣模型;
打分張量缺失值預測模塊,構建聯(lián)合分解損失函數(shù)Z;利用聯(lián)合分解損失函數(shù)Z構建約束性優(yōu)化問題;用增廣拉格朗日方法將約束性優(yōu)化問題轉化為一個無約束優(yōu)化問題;用ADMM算法來解決無約束優(yōu)化問題,對張量-矩陣耦合數(shù)據(jù)模型進行聯(lián)合分解;用ADMM算法進行因子矩陣的迭代更新,最終用得到的因子矩陣還原張量,預測其缺失值;
用戶車型推薦模塊,用預測出的完整打分張量,按照用戶的需求按打分從高到低的次序依次向用戶推薦車型,實現(xiàn)個性化推薦。