本發(fā)明屬于推薦系統(tǒng),本發(fā)明涉及一種行為習(xí)慣增強(qiáng)意圖的基于會(huì)話的推薦方法及系統(tǒng)。
背景技術(shù):
1、基于會(huì)話的推薦算法旨在對(duì)匿名的、具有時(shí)序性的會(huì)話進(jìn)行下一個(gè)項(xiàng)目的預(yù)測。由于近年來對(duì)用戶隱私保護(hù)的日益完善,基于會(huì)話的推薦系統(tǒng)已逐漸成為一個(gè)熱門的研究領(lǐng)域。傳統(tǒng)的方法利用馬爾可夫鏈來編碼會(huì)話。但是,這些方法只能根據(jù)前一項(xiàng)來預(yù)測后一項(xiàng),這導(dǎo)致了對(duì)會(huì)話的整體序列信息的利用不足。為了解決這個(gè)問題,一些方法利用遞歸神經(jīng)網(wǎng)絡(luò)(rnn)來建模會(huì)話并捕獲序列中的時(shí)間關(guān)系。近年來,由于圖神經(jīng)網(wǎng)絡(luò)(gnn)在捕獲結(jié)構(gòu)特征方面的優(yōu)勢(shì),許多方法將gnn引入到特征學(xué)習(xí)過程中,取得了良好的效果。
2、然而,上述方法只考慮了項(xiàng)目之間的宏觀的聯(lián)系,而沒有利用用戶與項(xiàng)目之間復(fù)雜的行為信息,不能捕獲細(xì)粒度的用戶偏好。例如,在購物場景中,與用戶只瀏覽過的產(chǎn)品相比,用戶顯然對(duì)那些與他們已經(jīng)添加到購物車或已經(jīng)購買的產(chǎn)品更相關(guān)的產(chǎn)品更感興趣。因此,考慮行為信息能夠更好地捕捉到用戶的意圖。最近,一些方法將多行為信息引入到會(huì)話推薦中。tgt設(shè)計(jì)了時(shí)間圖transformer,通過探索行為之間的演化相關(guān)性來捕獲動(dòng)態(tài)的用戶-項(xiàng)目交互模式。mbht設(shè)計(jì)了一個(gè)多尺度transformer來學(xué)習(xí)序列的行為順序模式,并利用超圖來學(xué)習(xí)交叉行為依賴關(guān)系。embsr設(shè)計(jì)了多圖來聚合序列中的微操作,并利用擴(kuò)展的注意力機(jī)制來學(xué)習(xí)二元的行為模式。
3、盡管現(xiàn)有的方法在聚合行為信息的序列表示和挖掘行為依賴性之間的關(guān)系方面取得了良好的成就,但仍有一些問題需要解決:
4、第一,無法學(xué)習(xí)用戶級(jí)別的行為習(xí)慣。目前基于多行為的會(huì)話推薦方法僅限于在行為或項(xiàng)目級(jí)別上學(xué)習(xí)行為依賴性,而忽視了用戶級(jí)別的復(fù)雜行為依賴。行為級(jí)的依賴學(xué)習(xí)方法只建模單一行為,難以處理復(fù)雜的多行為場景。項(xiàng)目級(jí)方法雖然能夠捕獲交叉行為依賴關(guān)系,但通常只能學(xué)習(xí)二元的行為依賴或在連續(xù)時(shí)間戳下的連續(xù)行為,無法突破時(shí)間的限制。這種限制意味著他們無法捕捉到用戶對(duì)物品的全部行為習(xí)慣?,F(xiàn)有的方法沒有充分挖掘用戶級(jí)的依賴關(guān)系,而這對(duì)于準(zhǔn)確地反映用戶的意圖至關(guān)重要。
5、第二,在基于會(huì)話的推薦系統(tǒng)中,預(yù)測目標(biāo)行為下的項(xiàng)目這一任務(wù)是不合理的。目前的基于多行為的會(huì)話推薦系統(tǒng)方法通常定義一個(gè)目標(biāo)行為,并將其他行為視為輔助行為,專注于預(yù)測該目標(biāo)行為下的下一個(gè)項(xiàng)目。然而,在現(xiàn)實(shí)中,用戶在執(zhí)行目標(biāo)行為之前經(jīng)常會(huì)進(jìn)行輔助行為。這種方法可能會(huì)導(dǎo)致系統(tǒng)推薦用戶已經(jīng)交互過的項(xiàng)目,而不是新的項(xiàng)目,這與推薦系統(tǒng)的目的相矛盾,并可能會(huì)降低用戶體驗(yàn)。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提供一種行為習(xí)慣增強(qiáng)意圖的基于會(huì)話的推薦方法及系統(tǒng),通過融合會(huì)話意圖特征和會(huì)話行為習(xí)慣特征,以學(xué)習(xí)用戶真實(shí)的意圖表示,可以準(zhǔn)確預(yù)測用戶感興趣的項(xiàng)目。
2、實(shí)現(xiàn)本發(fā)明的技術(shù)方案如下:
3、一種行為習(xí)慣增強(qiáng)意圖的基于會(huì)話的推薦方法,具體過程為:
4、會(huì)話意圖特征獲?。簶?gòu)造一個(gè)全局項(xiàng)目轉(zhuǎn)換圖來提取項(xiàng)目之間的語義連接,利用門控循環(huán)單元(gru)聚合項(xiàng)目行為序列,并通過門控機(jī)制將語義連接與行為序列融合,以捕獲細(xì)粒度的用戶意圖,進(jìn)一步基于所述用戶意圖獲取細(xì)粒度行為操作的會(huì)話意圖特征;
5、會(huì)話行為習(xí)慣特征獲?。簩?huì)話項(xiàng)目指定為超圖中的超邊,并將包含在會(huì)話中發(fā)生的所有與項(xiàng)目相關(guān)的行為指定為該超邊所連接的頂點(diǎn),構(gòu)造行為習(xí)慣超圖,基于所述行為習(xí)慣超圖學(xué)習(xí)用戶級(jí)行為習(xí)慣特征;
6、會(huì)話特征融合:將所述會(huì)話意圖特征與行為習(xí)慣特征進(jìn)行融合以學(xué)習(xí)用戶真實(shí)的意圖表示,并通過該表示來預(yù)測用戶可能感興趣的項(xiàng)目。
7、進(jìn)一步地,本發(fā)明所述會(huì)話意圖特征獲取的具體過程為:
8、1.1針對(duì)會(huì)話中的項(xiàng)目,基于項(xiàng)目之間語義連接,進(jìn)行全局項(xiàng)目轉(zhuǎn)換圖構(gòu)建,得到全局高階鄰域信息的項(xiàng)目表示
9、1.2基于所述全局高階鄰域信息的項(xiàng)目表示聚合項(xiàng)目的行為序列,學(xué)習(xí)會(huì)話最終意圖的宏觀項(xiàng)目表示x,實(shí)現(xiàn)細(xì)粒度用戶意圖的捕獲;
10、1.3根據(jù)所述會(huì)話最終意圖的宏觀項(xiàng)目表示x,生成包含會(huì)話中項(xiàng)目順序信息、全局級(jí)鄰域關(guān)系和項(xiàng)目內(nèi)的細(xì)粒度行為操作的會(huì)話意圖
11、進(jìn)一步地,本發(fā)明所述步驟1.1的具體過程為:
12、首先,基于會(huì)話項(xiàng)目之間語義連接,尋找會(huì)話中每一項(xiàng)目vi的后續(xù)鄰居集合構(gòu)造全局項(xiàng)目轉(zhuǎn)換圖g;根據(jù)所述全局項(xiàng)目轉(zhuǎn)換圖g,生成歸一化鄰接矩陣ag;
13、其次,基于所述歸一化鄰接矩陣ag,利用圖卷積層對(duì)項(xiàng)目進(jìn)行全局編碼,在lg層傳播后,得到了集成了全局高階鄰域信息的項(xiàng)目表示
14、進(jìn)一步地,本發(fā)明所述步驟1.2的具體過程為:
15、首先,針對(duì)會(huì)話中每一項(xiàng)目vi對(duì)應(yīng)的行為序列hi送入門控循環(huán)單元(gru)學(xué)習(xí),將最后一個(gè)行為的隱藏狀態(tài)作為項(xiàng)目vi的行為時(shí)間特征zi,進(jìn)而得到所有項(xiàng)目的行為時(shí)間特征z=[z1,z2,…,zn];
16、其次,從所述全局高階鄰域信息的項(xiàng)目表示采樣項(xiàng)目嵌入表示e,連接所述時(shí)間特征z,實(shí)現(xiàn)行為時(shí)間特征與目標(biāo)表示的聚合;
17、再次,將聚合的信息分別送入兩個(gè)鄰接矩陣ain和aout中進(jìn)行傳播,得到兩個(gè)視圖的高階融合iin,iout
18、最后,針對(duì)所述兩個(gè)視圖的高階融合iin,iout,通過使用門控機(jī)制對(duì)項(xiàng)目嵌入和行為意圖信息進(jìn)行過濾和更新,得到了會(huì)話中最終的宏觀項(xiàng)目表示x。
19、進(jìn)一步地,本發(fā)明所述步驟1.3的具體過程為:
20、構(gòu)建了會(huì)話的意圖原型ep;
21、
22、其中,ei表示初始化的item;
23、基于所述會(huì)話意圖原型,利用門控注意層,將會(huì)話意圖原型傳遞到項(xiàng)目表示中,如下所示:
24、
25、
26、其中,αi為會(huì)話中宏觀項(xiàng)目vi的注意力權(quán)重,而為可學(xué)習(xí)參數(shù),d為嵌入向量的維度,xi為x的元素;
27、使用最后一個(gè)宏觀項(xiàng)目vi的表示作為會(huì)話的總體意圖表示:
28、
29、其中,表示會(huì)話的意圖表示,它集成了會(huì)話中項(xiàng)目的順序信息、全局級(jí)鄰域關(guān)系和項(xiàng)目內(nèi)的細(xì)粒度行為操作。
30、進(jìn)一步地,本發(fā)明所述會(huì)話行為習(xí)慣特征獲取的具體過程為:
31、2.1將會(huì)話項(xiàng)目指定為超圖中的超邊,并將包含在會(huì)話中發(fā)生的所有與項(xiàng)目相關(guān)的行為指定為該超邊所連接的頂點(diǎn),為每一會(huì)話構(gòu)建一個(gè)行為習(xí)慣超圖gh,且構(gòu)造超圖時(shí)添加了殘差連接;
32、2.2針對(duì)所述行為習(xí)慣超圖gh,利用超圖卷積的方法進(jìn)行消息傳遞,將行為習(xí)慣集成到項(xiàng)目表示中,得到超圖學(xué)習(xí)網(wǎng)絡(luò)eh;
33、2.3將所述超圖學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行平均池化處理,得到將行為習(xí)慣整合到項(xiàng)目中后融合的最終會(huì)話表示
34、進(jìn)一步地,本發(fā)明所述會(huì)話信息融合為:采用門控注意層來帶權(quán)重的實(shí)現(xiàn)相互信息融合。
35、進(jìn)一步地,本發(fā)明所述會(huì)話信息融合為:
36、
37、
38、其中,ws和bs為學(xué)習(xí)的參數(shù),es為最終的會(huì)話表示,σ(·)表示sigmoid函數(shù),表示元素級(jí)乘法運(yùn)算符。
39、進(jìn)一步地,本發(fā)明還包括優(yōu)化與預(yù)測:
40、對(duì)會(huì)話表示和項(xiàng)目嵌入進(jìn)行l(wèi)2正則化,公式如下:
41、
42、
43、其中,eg是初始化的全局項(xiàng)目嵌入;
44、計(jì)算了最終的預(yù)測結(jié)果,并采用交叉熵?fù)p失作為模型訓(xùn)練的優(yōu)化器:
45、
46、
47、其中,和yi分別表示vi項(xiàng)被預(yù)測的概率和真實(shí)值,表示模型的損失函數(shù)。
48、另一方面,本技術(shù)實(shí)施例一種行為習(xí)慣增強(qiáng)意圖的基于會(huì)話的推薦系統(tǒng),包括意圖學(xué)習(xí)模塊、行為習(xí)慣學(xué)習(xí)模塊及特征融合模塊;
49、意圖學(xué)習(xí)模塊,用于構(gòu)造一個(gè)全局項(xiàng)目轉(zhuǎn)換圖來提取項(xiàng)目之間的語義連接,聚合項(xiàng)目行為序列,并通過門控機(jī)制將語義連接與行為序列融合,以捕獲細(xì)粒度的用戶意圖,并基于所述用戶意圖進(jìn)一步獲取細(xì)粒度行為操作的會(huì)話意圖特征;
50、行為習(xí)慣學(xué)習(xí)模塊,將會(huì)話項(xiàng)目指定為超圖中的超邊,并將包含在會(huì)話中發(fā)生的所有與項(xiàng)目相關(guān)的行為指定為該超邊所連接的頂點(diǎn),構(gòu)造行為習(xí)慣超圖,基于所述行為習(xí)慣超圖學(xué)習(xí)用戶級(jí)行為習(xí)慣特征;
51、特征融合,用于將所述會(huì)話意圖特征與行為習(xí)慣特征進(jìn)行融合以學(xué)習(xí)用戶真實(shí)的意圖表示,并通過該表示來預(yù)測用戶可能感興趣的項(xiàng)目。
52、有益效果
53、第一,相比于現(xiàn)有技術(shù)在行為和項(xiàng)目層面上學(xué)習(xí)行為依賴,本發(fā)明通過構(gòu)建超圖來學(xué)習(xí)用戶級(jí)的行為依賴關(guān)系來獲取會(huì)話中的行為習(xí)慣。這樣所捕獲到的信息更加全面、具有可解釋性,更能反映用戶的意圖。
54、第二,本發(fā)明旨在發(fā)現(xiàn)用戶可能感興趣的項(xiàng)目,而不是簡單地預(yù)測可能在目標(biāo)行為下交互的項(xiàng)目。本發(fā)明構(gòu)建了一個(gè)全局圖來搜索整個(gè)語義空間,結(jié)合行為信息,學(xué)習(xí)復(fù)雜的用戶行為習(xí)慣,以便更準(zhǔn)確地捕捉用戶的意圖,同時(shí)具有更好的推薦新的物品給用戶的能力。