本發(fā)明涉及神經(jīng)網(wǎng)絡(luò),具體的是一種基于神經(jīng)霍克斯過(guò)程的在線直播行為分析方法及系統(tǒng)。
背景技術(shù):
1、在當(dāng)今電子商務(wù)的浪潮中,網(wǎng)絡(luò)直播銷售已成為一種備受歡迎的營(yíng)銷手段。盡管直播能夠聚集眾多觀眾,但觀眾的實(shí)際購(gòu)買率并不總是高,因此需要深入探究消費(fèi)者的觀看行為。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述背景技術(shù)中提到的不足,本發(fā)明的目的在于提供一種基于神經(jīng)霍克斯過(guò)程的在線直播行為分析方法及系統(tǒng)。
2、第一方面,本發(fā)明的目的可以通過(guò)以下技術(shù)方案實(shí)現(xiàn):一種基于神經(jīng)霍克斯過(guò)程的在線直播行為分析方法,方法包括以下步驟:
3、獲取在線直播數(shù)據(jù),設(shè)定固定時(shí)間段,基于每個(gè)固定時(shí)間段對(duì)在線直播數(shù)據(jù)進(jìn)行分割,得到每個(gè)固定時(shí)間段對(duì)應(yīng)事件,基于每個(gè)固定時(shí)間段對(duì)應(yīng)事件生成交互事件行為序列;
4、基于交互事件行為序列的每種事件類型的強(qiáng)度函數(shù)生成在線編碼結(jié)構(gòu),基于交互事件行為序列獲取觀看行為序列,將觀看行為序列輸入至在線編碼結(jié)構(gòu)內(nèi),得到預(yù)測(cè)的下一個(gè)行為類型,基于預(yù)測(cè)的下一個(gè)行為類型對(duì)對(duì)應(yīng)的觀看行為發(fā)生時(shí)間進(jìn)行預(yù)測(cè)。
5、結(jié)合第一方面,在第一方面的某些實(shí)現(xiàn)方式中,該方法還包括:所述基于每個(gè)固定時(shí)間段對(duì)在線直播數(shù)據(jù)進(jìn)行分割的過(guò)程:
6、給定一個(gè)固定的時(shí)間段,通過(guò)將時(shí)間段進(jìn)行分隔成一個(gè)個(gè)不交叉的時(shí)間段,每個(gè)時(shí)間段上觀察發(fā)生的事件,事件屬于類別其中,表示事件沒(méi)有發(fā)生,k表示事件的類別,k表示事件的總類別的個(gè)數(shù),交互事件集合為表示時(shí)間段發(fā)生的事件序列,其中,一個(gè)事件表示為k表示事件的類別,ti表示事件發(fā)生的確切時(shí)間點(diǎn),[ti-1,ti]時(shí)間段的劃分由事件發(fā)生的時(shí)間所確定,事件發(fā)生后,時(shí)間段自動(dòng)被劃分。
7、結(jié)合第一方面,在第一方面的某些實(shí)現(xiàn)方式中,該方法還包括:所述基于每個(gè)固定時(shí)間段對(duì)應(yīng)事件生成交互事件行為序列的過(guò)程:
8、事件序列的生成概率模型稱為多變量點(diǎn)過(guò)程,類別在時(shí)間oij發(fā)生了,在無(wú)限小的時(shí)間區(qū)間[ti,ti+dt)內(nèi)發(fā)生的概率其中發(fā)生的概率取決于歷史信息發(fā)生的概率取決于交互信息z'(l1,l2,ti),而交互信息z'(l1,l2,ti)的構(gòu)成如下:
9、z′(l1,l2,ti)=r(γ(oij),fe(lu,lw,ti),fl(lu,ti′),fl(lw,ti′),z(lu,ti′),z(lw,ti′))
10、其中,γ(ti)計(jì)算節(jié)點(diǎn)的時(shí)變表示向量的函數(shù),將交互時(shí)間ti轉(zhuǎn)化為相應(yīng)的時(shí)間向量的函數(shù);fe(lu,lw,ti)表示節(jié)點(diǎn)lu與節(jié)點(diǎn)lw的交互特征;fl(lu,ti'),fl(lw,ti')分別表示節(jié)點(diǎn)lu和lw在時(shí)間點(diǎn)oij之前的特征;z(lu,ti'),z(lw,ti')表示節(jié)點(diǎn)lu和lw在產(chǎn)生交互前的表示向量;z'(l1,l2,ti)表示計(jì)算時(shí)變向量。
11、結(jié)合第一方面,在第一方面的某些實(shí)現(xiàn)方式中,該方法還包括:當(dāng)時(shí),在時(shí)的極限為pk(ti),pk(ti)為強(qiáng)度函數(shù),所有類型的強(qiáng)度函數(shù)累計(jì)表示為
12、通過(guò)引入非線性傳遞函數(shù),確保總激活函數(shù)保持正值,并允許為負(fù),以下是修改后的公式:
13、
14、隨著時(shí)間ti增長(zhǎng),事件逐步發(fā)生,強(qiáng)度函數(shù)pk會(huì)上升或者下降,但最終會(huì)趨向于基本速率rk(ρk+0)。
15、結(jié)合第一方面,在第一方面的某些實(shí)現(xiàn)方式中,該方法還包括:所述基于交互事件行為序列的每種事件類型的強(qiáng)度函數(shù)生成在線編碼結(jié)構(gòu)的過(guò)程:
16、每種事件類型的強(qiáng)度函數(shù)pk(ti)隨時(shí)間動(dòng)態(tài)變化;隱藏狀態(tài)向量h與存儲(chǔ)單元向量c密切相關(guān);每個(gè)存儲(chǔ)單元c按照一定的衰減率δ以指數(shù)形式衰減;通過(guò)結(jié)合ode-lstm網(wǎng)絡(luò)強(qiáng)度函數(shù)的定義如下:
17、pk(ti)=rk(wkh(ti))
18、
19、將符號(hào)h(ti)簡(jiǎn)略寫成hi,c(ti)、簡(jiǎn)略寫成ci、hi是通過(guò)歷史事件序列在過(guò)去時(shí)間的統(tǒng)計(jì),ode-lstm編碼器是一種lstm,其中兩個(gè)觀測(cè)值之間的轉(zhuǎn)換由一個(gè)神經(jīng)ode給出;在每個(gè)時(shí)間間隔i,lstm單元定義如下:
20、ii=σ(wi-1ki-1+whinhi+bin)
21、fi=σ(wxfki-1+whfhi+bf)
22、oi=σ(wxoki-1+whohi+bo)
23、
24、
25、hi=oi⊙tanh(ci)
26、其中,hi是中間隱狀態(tài),為具有初始狀態(tài)hi-1和時(shí)間間隔[ti-1,ti]的ode初值問(wèn)題的解。
27、結(jié)合第一方面,在第一方面的某些實(shí)現(xiàn)方式中,該方法還包括:所述觀看行為序列定義在時(shí)間戳ti發(fā)生的行為作為一個(gè)事件包含的行為為觀看、評(píng)論下單、退出直播間;有序事件序列被表示為n是事件的總數(shù)目;
28、將直播下單的情況形式化地定義為從觀看到下單的時(shí)長(zhǎng)tx與在線總時(shí)長(zhǎng)to的比值,直播下單質(zhì)量表示為將直播下單質(zhì)量分為四個(gè)標(biāo)簽,l∈0,1,2,3,5};當(dāng)l=0,表示沒(méi)有下單,l=1,表示q∈(0.75,1],當(dāng)l=2時(shí),表示q∈(0.5,0.75],當(dāng)l=3時(shí),表示q∈(0.25,0.5],當(dāng)l=4時(shí),表示q∈(0,0.25],將質(zhì)量檢測(cè)進(jìn)行分類。
29、結(jié)合第一方面,在第一方面的某些實(shí)現(xiàn)方式中,該方法還包括:所述預(yù)測(cè)的下一個(gè)行為類型的預(yù)測(cè)過(guò)程:
30、對(duì)事件進(jìn)行時(shí)間序列建模,基于時(shí)間點(diǎn)ti之前的歷史直播序列采用強(qiáng)度函數(shù)來(lái)預(yù)測(cè)未來(lái)事件的發(fā)生,將的強(qiáng)度函數(shù)定義為:
31、
32、其中代表了在之前發(fā)生的歷史觀看行為,代表了事件的觀看行為嵌入向量,hi-1代表了經(jīng)過(guò)編碼的d維隱特征,wk代表了全連接層的權(quán)重矩陣,fp代表了激活函數(shù),激活函數(shù)采用如下公式:
33、
34、其中,s是比例超參數(shù);觀看行為作為歷史觀看序列代上的第i個(gè)條件發(fā)生的概率p表示為:
35、
36、為生存期函數(shù),定義如下:
37、
38、采用指數(shù)損失函數(shù)為下一個(gè)觀看行為發(fā)生類型的預(yù)測(cè):
39、
40、ltype是觀看行為類型的損失函數(shù)。
41、結(jié)合第一方面,在第一方面的某些實(shí)現(xiàn)方式中,該方法還包括:所述基于預(yù)測(cè)的下一個(gè)行為類型對(duì)對(duì)應(yīng)的觀看行為發(fā)生時(shí)間進(jìn)行預(yù)測(cè)的過(guò)程:
42、對(duì)于觀看行為發(fā)生時(shí)間預(yù)測(cè),預(yù)測(cè)下一個(gè)事件的觀看行為的發(fā)生的時(shí)間,基于事件和歷史觀看行為序列事件在未來(lái)某一時(shí)間發(fā)生的強(qiáng)度函數(shù)定義如下:
43、
44、然后,以給定觀看行為和歷史觀看行為序列為條件的第i次事件發(fā)生時(shí)間的概率表示為:
45、
46、下一次觀看行為的期望時(shí)間計(jì)算如下:
47、
48、使用均方誤差作為時(shí)間預(yù)測(cè)的損失函數(shù):
49、
50、事件級(jí)解碼器的損失函數(shù)由兩部分組成:一部分是預(yù)測(cè)觀看行為類型時(shí)產(chǎn)生的誤差ltype,另一部分是預(yù)測(cè)觀看行為發(fā)生時(shí)間時(shí)的誤差ltime,損失函數(shù)如下le:
51、le=ltype+ltime。
52、結(jié)合第一方面,在第一方面的某些實(shí)現(xiàn)方式中,該方法還包括:解碼器首先采用平均池化技術(shù)對(duì)事件級(jí)的表示進(jìn)行整合,從而提煉出直播間層面的綜合表示z:
53、
54、將直播間級(jí)表示作為解碼器的輸入數(shù)據(jù),這一預(yù)測(cè)基于預(yù)先定義的在線觀看質(zhì)量標(biāo)簽,采用了如下指數(shù)損失函數(shù)來(lái)衡量預(yù)測(cè)性能:
55、
56、然后,構(gòu)建總損失函數(shù),總損失函數(shù)l被構(gòu)建為事件級(jí)損失le和直播間級(jí)損失lc的累加:
57、l=le+lc。
58、第二方面,為了達(dá)到上述目的,本發(fā)明公開(kāi)了一種基于神經(jīng)霍克斯過(guò)程的在線直播行為分析系統(tǒng),包括:
59、序列生成模塊,用于獲取在線直播數(shù)據(jù),設(shè)定固定時(shí)間段,基于每個(gè)固定時(shí)間段對(duì)在線直播數(shù)據(jù)進(jìn)行分割,得到每個(gè)固定時(shí)間段對(duì)應(yīng)事件,基于每個(gè)固定時(shí)間段對(duì)應(yīng)事件生成交互事件行為序列;
60、行為分析模塊,用于基于交互事件行為序列的每種事件類型的強(qiáng)度函數(shù)生成在線編碼結(jié)構(gòu),基于交互事件行為序列獲取觀看行為序列,將觀看行為序列輸入至在線編碼結(jié)構(gòu)內(nèi),得到預(yù)測(cè)的下一個(gè)行為類型,基于預(yù)測(cè)的下一個(gè)行為類型對(duì)對(duì)應(yīng)的觀看行為發(fā)生時(shí)間進(jìn)行預(yù)測(cè)。
61、本發(fā)明的有益效果:
62、本發(fā)明通過(guò)用戶參與直播的持續(xù)時(shí)間來(lái)評(píng)估直播的質(zhì)量。接著,定義了一種直播行為序列,它能夠精確追蹤用戶在直播中的每一步互動(dòng)。此外,本發(fā)明提出的分層編解碼模型旨在提升對(duì)用戶行為和直播質(zhì)量的預(yù)測(cè)準(zhǔn)確性。最終,我們將這一模型應(yīng)用于實(shí)際的購(gòu)物平臺(tái)數(shù)據(jù)集,并通過(guò)與現(xiàn)有技術(shù)的對(duì)比,證明了本框架在預(yù)測(cè)直播觀看行為方面的優(yōu)越性。