一種用戶(hù)行為時(shí)間相關(guān)性的確定方法及裝置制造方法
【專(zhuān)利摘要】本發(fā)明實(shí)施例公開(kāi)了一種用戶(hù)行為時(shí)間相關(guān)性的確定方法及裝置,確定N個(gè)用戶(hù),其中,所述N個(gè)用戶(hù)中的任一用戶(hù)均具有第一行為A和第二行為B;在設(shè)定數(shù)量的時(shí)間片內(nèi),利用流形學(xué)習(xí)機(jī),通過(guò)圖譜理論構(gòu)造微分流形,分別對(duì)所述N個(gè)用戶(hù)中每一用戶(hù)行為進(jìn)行學(xué)習(xí),得到所述N個(gè)用戶(hù)中每一用戶(hù)對(duì)行為在時(shí)間上的學(xué)習(xí)結(jié)果序列;根據(jù)所述N個(gè)用戶(hù)中任一用戶(hù)對(duì)不同行為在時(shí)間上的學(xué)習(xí)結(jié)果序列、以及該用戶(hù)的不同行為之間的時(shí)間差,利用行為時(shí)間相關(guān)性確定單元,確定該用戶(hù)不同行為的時(shí)間相關(guān)性系數(shù)。應(yīng)用本發(fā)明實(shí)施例,通過(guò)圖譜理論構(gòu)造微分流形,在數(shù)據(jù)降維的過(guò)程中,提高了對(duì)數(shù)據(jù)離群值響應(yīng)的魯棒性,減少計(jì)算的復(fù)雜性,并確定了用戶(hù)不同行為的時(shí)間相關(guān)性。
【專(zhuān)利說(shuō)明】一種用戶(hù)行為時(shí)間相關(guān)性的確定方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,特別涉及一種用戶(hù)行為時(shí)間相關(guān)性的確定方法及裝 置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,在互聯(lián)網(wǎng)應(yīng)用的過(guò)程中,通常需要對(duì)挖掘到的用戶(hù)行為 數(shù)據(jù)進(jìn)行處理,以確定用戶(hù)行為數(shù)據(jù)之間的相關(guān)性。例如:電子商務(wù)網(wǎng)站中,用戶(hù)在線(xiàn)活躍 度和用戶(hù)的商業(yè)價(jià)值之間的相關(guān)性;在線(xiàn)教育網(wǎng)站中,學(xué)生的課堂表現(xiàn)、成績(jī)和職業(yè)發(fā)展?jié)?力之間的相關(guān)性。
[0003] 現(xiàn)有的用戶(hù)行為數(shù)據(jù)相關(guān)性的確定方法是:通過(guò)統(tǒng)計(jì)學(xué)習(xí)的方法對(duì)挖掘到的用戶(hù) 行為數(shù)據(jù)之間的相關(guān)性進(jìn)行數(shù)據(jù)處理,以確定用戶(hù)行為數(shù)據(jù)的相關(guān)性。在確定用戶(hù)行為數(shù) 據(jù)之間的相關(guān)性過(guò)程中,通常采用主成分分析或多維尺度變換等線(xiàn)性降維方法,或采用等 距映射或者局部線(xiàn)性嵌入等非線(xiàn)性降維方法對(duì)用戶(hù)行為數(shù)據(jù)進(jìn)行降維處理。
[0004] 但是,采用上述線(xiàn)性降維方法對(duì)用戶(hù)行為數(shù)據(jù)進(jìn)行降維處理,對(duì)數(shù)據(jù)離群值的響 應(yīng)魯棒性較差;采用上述非線(xiàn)性降維方法對(duì)用戶(hù)行為數(shù)據(jù)進(jìn)行降維處理,計(jì)算的復(fù)雜性較 高;并且利用統(tǒng)計(jì)學(xué)習(xí)的方法確定用戶(hù)行為之間的相關(guān)性,忽視了用戶(hù)行為在時(shí)間維度上 的關(guān)系,因此不能確定用戶(hù)不同行為的時(shí)間相關(guān)性。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實(shí)施例的目的在于提供一種用戶(hù)行為時(shí)間相關(guān)性的確定方法及裝置,以在 對(duì)用戶(hù)行為數(shù)據(jù)降維的過(guò)程中,提高對(duì)數(shù)據(jù)離群值響應(yīng)的魯棒性,減少計(jì)算的復(fù)雜性,并確 定用戶(hù)不同行為的時(shí)間相關(guān)性。
[0006] 為達(dá)到上述目的,本發(fā)明實(shí)施例公開(kāi)了一種用戶(hù)行為時(shí)間相關(guān)性的確定方法,包 括:
[0007] 確定N個(gè)用戶(hù),其中,N大于等于1,且所述N個(gè)用戶(hù)中的任一用戶(hù)均具有第一行為 A和第二行為B ;
[0008] 在設(shè)定數(shù)量的時(shí)間片內(nèi),利用第一流形學(xué)習(xí)機(jī),通過(guò)圖譜理論構(gòu)造微分流形,分別 對(duì)所述N個(gè)用戶(hù)中每一用戶(hù)的所述第一行為A進(jìn)行學(xué)習(xí),得到所述N個(gè)用戶(hù)中每一用戶(hù)對(duì) 所述第一行為A在時(shí)間上的第一學(xué)習(xí)結(jié)果序列
【權(quán)利要求】
1. 一種用戶(hù)行為時(shí)間相關(guān)性的確定方法,其特征在于,包括: 確定N個(gè)用戶(hù),其中,N大于等于1,且所述N個(gè)用戶(hù)中的任一用戶(hù)均具有第一行為A和 第二行為B; 在設(shè)定數(shù)量的時(shí)間片內(nèi),利用第一流形學(xué)習(xí)機(jī),通過(guò)圖譜理論構(gòu)造微分流形,分別對(duì)所 述N個(gè)用戶(hù)中每一用戶(hù)的所述第一行為A進(jìn)行學(xué)習(xí),得到所述N個(gè)用戶(hù)中每一用戶(hù)對(duì)所述 第一行為A在時(shí)間上的第一學(xué)習(xí)結(jié)果序列,并利用第二流形學(xué)習(xí)機(jī),通過(guò)圖譜理論 構(gòu)造微分流形,分別對(duì)所述N個(gè)用戶(hù)中每一用戶(hù)的所述第二行為B進(jìn)行學(xué)習(xí),得到所述N個(gè) 用戶(hù)中每一用戶(hù)對(duì)所述和對(duì)所述第二行為B在時(shí)間上的第二學(xué)習(xí)結(jié)果序列 根據(jù)所述N個(gè)用戶(hù)中的任一用戶(hù)對(duì)所述第一行為A的第一學(xué)習(xí)結(jié)果序列、所述第二行 為B的第二學(xué)習(xí)結(jié)果序列以及該用戶(hù)的所述第一行為A和該用戶(hù)的所述第二行為B之間的 時(shí)間差,利用行為時(shí)間相關(guān)性確定單元,確定該用戶(hù)所述第一行為A和該用戶(hù)所述第二行 為B的時(shí)間相關(guān)性系數(shù)。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在設(shè)定數(shù)量的時(shí)間片內(nèi),利用流形學(xué)習(xí) 機(jī),通過(guò)圖譜理論構(gòu)造微分流形,分別對(duì)用戶(hù)中每一用戶(hù)行為進(jìn)行學(xué)習(xí),得到所述N個(gè)用戶(hù) 中每一用戶(hù)對(duì)行為在時(shí)間上的學(xué)習(xí)結(jié)果序列,包括: 將所述N個(gè)用戶(hù)的行為數(shù)據(jù)集輸入到流形學(xué)習(xí)機(jī),其中,Xi為用戶(hù)行為數(shù) 據(jù)的一組參數(shù)組成的向量,用戶(hù)的行為數(shù)據(jù)集^包含帶標(biāo)記的用戶(hù)行為數(shù)據(jù)子集 {xj=1和未帶標(biāo)記的用戶(hù)行為數(shù)據(jù)子集{Xjf=l+1,其中,帶標(biāo)記的用戶(hù)行為數(shù)據(jù)子集 :{xj=1的學(xué)習(xí)結(jié)果序列為:{木}丨=1; 在設(shè)定數(shù)量的時(shí)間片內(nèi),通過(guò)圖譜理論構(gòu)造微分流形,根據(jù)帶標(biāo)記的用戶(hù)行為數(shù)據(jù)子 集{xd=1的學(xué)習(xí)結(jié)果序列丨+;}^,得到未帶標(biāo)記的用戶(hù)行為數(shù)據(jù)子集|^^^+1的學(xué)習(xí)結(jié) 果序列,進(jìn)而得到所述N個(gè)用戶(hù)中每一用戶(hù)對(duì)行為在時(shí)間上的學(xué)習(xí)結(jié)果序列。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述在設(shè)定數(shù)量的時(shí)間片內(nèi),通過(guò)圖譜理 論構(gòu)造微分流形,根據(jù)帶標(biāo)記的用戶(hù)行為數(shù)據(jù)子集學(xué)習(xí)結(jié)果序列I[木}|=1,得到 未帶標(biāo)記的用戶(hù)行為數(shù)據(jù)子集:的學(xué)習(xí)結(jié)果序列,進(jìn)而得到所述N個(gè)用戶(hù)中每一用 戶(hù)對(duì)行為在時(shí)間上的學(xué)習(xí)結(jié)果序列,包括: 利用所述N個(gè)用戶(hù)的行為數(shù)據(jù),構(gòu)造具有N個(gè)數(shù)據(jù)節(jié)點(diǎn)加權(quán)無(wú)向圖G,其中, 定義圖G中任意兩個(gè)數(shù)據(jù)節(jié)點(diǎn)i和j是相連的,當(dāng)且僅當(dāng)其表示的數(shù)據(jù)Xi和Xj的 距離滿(mǎn)足條件:I IXi-XjI I<e,定義圖G中邊的權(quán)重函數(shù)Wij為一個(gè)高斯核函數(shù),
,其中,e和〇2為圖譜參數(shù); 生成Gram矩陣
計(jì)算圖G的拉普拉斯矩陣L=T-W,其中,w=Iwd是權(quán)重矩陣,T是NXN對(duì)角陣,其 中,T的第ii個(gè)元I
在圖G中沒(méi)有自環(huán),即對(duì)所有的i有Wii =O的情況下,則對(duì)拉普拉斯矩陣L的第ij個(gè) 元素,有
厶 厶 入A為正則化參數(shù),Xz為本征正則化參數(shù), F為通過(guò)學(xué)習(xí)過(guò)程要找到的最佳輸入-輸出關(guān)系函數(shù)使得d=F(X),Ws(F)為經(jīng)驗(yàn)代 價(jià)函數(shù),根據(jù)最小二乘法,得出
W。(F)為正則化項(xiàng),定義1
D為線(xiàn)性微分算子, 叫工(F)為流形正則化項(xiàng),定義W1 (F) =fTLf,f= [F(X1),F(xiàn)(x2),...,F(xiàn)(xN) ]T; 根據(jù)廣義表示定理,最小化代價(jià)函數(shù)的最優(yōu)解滿(mǎn)足形式:
,將構(gòu)造的代價(jià)函數(shù)W(F)表示為矩陣形式:
其中, d為預(yù)期響應(yīng)向量,d= [Clpd2,...,+,0,...,0]、J為NxN對(duì)角陣,對(duì)角陣J的對(duì)角線(xiàn) 的 1 個(gè)單位項(xiàng)J=diag[l,1,? ? ? 1,0, ? ? ? 0]; 對(duì)所述W(a)表達(dá)式中的向量a進(jìn)行微分計(jì)算,求解出最小值對(duì)應(yīng)的a%a# = (JK+入AI+入弘廣抑,進(jìn)而得到最優(yōu)逼近函f
根據(jù)最優(yōu)逼近函數(shù),計(jì)算得到d=F(X),對(duì)于任意dm,均有:
,進(jìn)而得到所述N個(gè)用戶(hù)中每一 用戶(hù)對(duì)行為的學(xué)習(xí)結(jié)果序列均為:,進(jìn)而得到所述N個(gè)用戶(hù)中每一用戶(hù)對(duì)所述第一 行為A的學(xué)習(xí)結(jié)果序列和對(duì)所述第二行為B的學(xué)習(xí)結(jié)果序列。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述N個(gè)用戶(hù)中的任一用戶(hù)對(duì)所 述第一行為A的第一學(xué)習(xí)結(jié)果序列、所述第二行為B的第二學(xué)習(xí)結(jié)果序列以及該用戶(hù)的所 述第一行為A和該用戶(hù)的所述第二行為B之間的時(shí)間差,利用行為時(shí)間相關(guān)性確定單元,確 定該用戶(hù)所述第一行為A和該用戶(hù)所述第二行為B的時(shí)間相關(guān)性系數(shù),包括: 所述行為時(shí)間相關(guān)性確定單元,對(duì)于所述N個(gè)用戶(hù)中的第i個(gè)用戶(hù),該用戶(hù)對(duì)所述第一 行為A的學(xué)習(xí)結(jié)果序列為:對(duì)所述第二行為B的學(xué)習(xí)結(jié)果序列為:df其中,t= 1,2,3,……,df(t)和df⑴是聯(lián)合寬平穩(wěn)隨機(jī)過(guò)程,其時(shí)間平均分別為^和Ub,標(biāo)準(zhǔn)差 分別為O4和OB ; 計(jì)算該用戶(hù)所述第一行為A和該用戶(hù)所述第二行為B的時(shí)間相關(guān)性系數(shù):
其中,T為該用戶(hù)所述第一行為A和所述第二行為 B之間的時(shí)間差。
5. -種用戶(hù)行為時(shí)間相關(guān)性的確定裝置,其特征在于,包括:用戶(hù)確定單元、第一流形 學(xué)習(xí)機(jī)、第二流形學(xué)習(xí)機(jī)和行為時(shí)間相關(guān)性確定單元,其中, 所述用戶(hù)確定單元,用于確定N個(gè)用戶(hù),其中,N大于等于1,且所述N個(gè)用戶(hù)中的任一 用戶(hù)均具有第一行為A和第二行為B; 所述第一流形學(xué)習(xí)機(jī),用于在設(shè)定數(shù)量的時(shí)間片內(nèi),通過(guò)圖譜理論構(gòu)造微分流形,分別 對(duì)所述N個(gè)用戶(hù)中每一用戶(hù)的所述第一行為A進(jìn)行學(xué)習(xí),得到所述N個(gè)用戶(hù)中每一用戶(hù)對(duì) 所述第一行為A在時(shí)間上的第一學(xué)習(xí)結(jié)果序列 所述第二流形學(xué)習(xí)機(jī),用于在設(shè)定數(shù)量的時(shí)間片內(nèi),通過(guò)圖譜理論構(gòu)造微分流形,分別 對(duì)所述N個(gè)用戶(hù)中每一用戶(hù)的所述第二行為B進(jìn)行學(xué)習(xí),得到所述N個(gè)用戶(hù)中每一用戶(hù)對(duì) 所述第二行為B在時(shí)間上的第二學(xué)習(xí)結(jié)果序列 所述行為時(shí)間相關(guān)性確定單元,用于根據(jù)所述N個(gè)用戶(hù)中的任一用戶(hù)對(duì)所述第一行為A的第一學(xué)習(xí)結(jié)果序列、所述第二行為B的第二學(xué)習(xí)結(jié)果序列以及該用戶(hù)的所述第一行為A 和該用戶(hù)的所述第二行為B之間的時(shí)間差,確定該用戶(hù)所述第一行為A和該用戶(hù)所述第二 行為B的時(shí)間相關(guān)性系數(shù)。
6. 根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述第一流形學(xué)習(xí)機(jī)包括:第一學(xué)習(xí)輸入 子單元和第一學(xué)習(xí)輸出子單元,其中, 所述第一學(xué)習(xí)輸入子單元,用于接收所述N個(gè)用戶(hù)的第一行為A數(shù)據(jù)集jf=1,其 中,Xi為用戶(hù)第一行為A數(shù)據(jù)的一組參數(shù)組成的向量,用戶(hù)的第一行為A數(shù)據(jù)集 包含帶標(biāo)記的用戶(hù)第一行為A數(shù)據(jù)子集和未帶標(biāo)記的用戶(hù)第一行為A數(shù)據(jù)子 集{xf}f=;.+1,其中,帶標(biāo)記的用戶(hù)第一行為A數(shù)據(jù)子集丨的學(xué)習(xí)結(jié)果序列為: IdfYi=^ 所述第一學(xué)習(xí)輸出子單元,用于在設(shè)定數(shù)量的時(shí)間片內(nèi),通過(guò)圖譜理論構(gòu)造微分流形, 根據(jù)帶標(biāo)記的用戶(hù)第一行為A數(shù)據(jù)子集的學(xué)習(xí)結(jié)果序列Idf^=1,得到未帶標(biāo)記的 用戶(hù)第一行為A數(shù)據(jù)子集{xf}t;+1的學(xué)習(xí)結(jié)果序列; 所述第二流形學(xué)習(xí)機(jī)包括:第二學(xué)習(xí)輸入子單元和第二學(xué)習(xí)輸出子單元,其中, 所述第二學(xué)習(xí)輸入子單元,用于接收所述N個(gè)用戶(hù)的第二行為B數(shù)據(jù)集,其 中,Xi為用戶(hù)第二行為B數(shù)據(jù)的一組參數(shù)組成的向量,用戶(hù)的第二行為B數(shù)據(jù)集{xflf=i 包含帶標(biāo)記的用戶(hù)第二行為B數(shù)據(jù)子集〇cf^=1和未帶標(biāo)記的用戶(hù)第二行為B數(shù)據(jù)子 集伏,其中,帶標(biāo)記的用戶(hù)第二行為B數(shù)據(jù)子集卩fU=1的學(xué)習(xí)結(jié)果序列為: 所述第二學(xué)習(xí)輸出子單元,用于在設(shè)定數(shù)量的時(shí)間片內(nèi),通過(guò)圖譜理論構(gòu)造微分流形, 根據(jù)帶標(biāo)記的用戶(hù)第二行為B數(shù)據(jù)子集的學(xué)習(xí)結(jié)果序列fdfU=1,得到未帶標(biāo)記的 用戶(hù)第二行為B數(shù)據(jù)子集{xf}f=;+1的學(xué)習(xí)結(jié)果序列。
7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第一學(xué)習(xí)輸出子單元,具體用于: 利用所述N個(gè)用戶(hù)的行為數(shù)據(jù),構(gòu)造具有N個(gè)數(shù)據(jù)節(jié)點(diǎn)加權(quán)無(wú)向圖G,其中, 定義圖G中任意兩個(gè)數(shù)據(jù)節(jié)點(diǎn)i和j是相連的,當(dāng)且僅當(dāng)其表示的數(shù)據(jù)Xi和Xj的 距離滿(mǎn)足條件:IIXi-XjII<e,定義圖G中邊的權(quán)重函數(shù)Wij為一個(gè)高斯核函數(shù),
|,其中,e和〇2為圖譜參數(shù); 生成Gram矩陣K= 計(jì)算圖G的拉普拉斯矩陣L=T-W,其中,w=Iwd是權(quán)重矩陣,T是NXN對(duì)角陣,其 中,T的第ii個(gè)元素k= , 在圖G中沒(méi)有自環(huán),即對(duì)所有的i有Wii = 0的情況下,則對(duì)拉普拉斯矩陣L的第ij個(gè) 元素,有
入A為正則化參數(shù),Xz為本征正則化參數(shù), F為通過(guò)學(xué)習(xí)過(guò)程要找到的最佳輸入-輸出關(guān)系函數(shù)使得d=F(X),Ws(F)為經(jīng)驗(yàn)代 價(jià)函數(shù),根據(jù)最小二乘法,得出
We(F)為正則化項(xiàng),定J
D為線(xiàn)性微分算子, 叫工(F)為流形正則化項(xiàng),定義W1 (F) =fTLf,f= [F(X1),F(xiàn)(x2),...,F(xiàn)(xN) ]T; 根據(jù)廣義表示定理,最小化代價(jià)函數(shù)的最優(yōu)解滿(mǎn)足形式:
,將構(gòu)造的代價(jià)函數(shù)W(F)表示為矩陣形式: _
^ ^ >其中, d為預(yù)期響應(yīng)向量,d=[屯,d2, . . .,d,,. . .,0]、J為NXN對(duì)角陣,對(duì)角陣J的對(duì)角 線(xiàn)的 1 個(gè)單位項(xiàng)J=diag[l,1,? ? ? 1,0, ? ? ? 0]; 對(duì)所述W(a)表達(dá)式中的向量a進(jìn)行微分計(jì)算,求解出最小值對(duì)應(yīng)的a%a# = (JK+入AI+入山1(廣/(1,進(jìn)而得到最優(yōu)逼近函數(shù)
根據(jù)最優(yōu)逼近函數(shù),計(jì)算得到d=F(X),對(duì)于任意dm,均有:
,進(jìn)而得到所述N個(gè)用戶(hù)中每一 用戶(hù)對(duì)第一行為A的學(xué)習(xí)結(jié)果序列均為 所述第二學(xué)習(xí)輸出子單元,與所述第一學(xué)習(xí)輸出子單元功能相同,用于: 得到所述N個(gè)用戶(hù)中每一用戶(hù)對(duì)第二行為B的學(xué)習(xí)結(jié)果序列均為<df>f=1。
8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述行為時(shí)間相關(guān)性確定單元,具體用 于: 對(duì)于所述N個(gè)用戶(hù)中的第i個(gè)用戶(hù),該用戶(hù)對(duì)所述第一行為A的學(xué)習(xí)結(jié)果序列為:df(t),對(duì)所述第二行為B的學(xué)習(xí)結(jié)果序列為:df(t),其中,t= 1,2,3,……,df(t)和 是聯(lián)合寬平穩(wěn)隨機(jī)過(guò)程,其時(shí)間平均分別為1^和Ub,標(biāo)準(zhǔn)差分別為〇&和〇B; 計(jì)算該用戶(hù)所述第一行為A和該用戶(hù)所述第二行為B的時(shí)間相關(guān)性系數(shù):
,其中, T為該用戶(hù)所述第一行為A和所述第二行為B之間的時(shí)間差。
【文檔編號(hào)】G06F17/30GK104268217SQ201410495331
【公開(kāi)日】2015年1月7日 申請(qǐng)日期:2014年9月25日 優(yōu)先權(quán)日:2014年9月25日
【發(fā)明者】張文鑄 申請(qǐng)人:張文鑄