亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法及系統(tǒng)與流程

文檔序號(hào):11929890閱讀:359來源:國知局
用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法及系統(tǒng)與流程

本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法。



背景技術(shù):

隨著互聯(lián)網(wǎng)特別是移動(dòng)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,過去人們需要在現(xiàn)實(shí)生活中完成的很多活動(dòng)可以選擇在網(wǎng)絡(luò)上進(jìn)行,同時(shí)互聯(lián)網(wǎng)技術(shù)也為人們的日常生活提供了越來越多的新的服務(wù)和應(yīng)用?;ヂ?lián)網(wǎng)技術(shù)的廣泛使用使得在線活動(dòng)在人們的日常生活中發(fā)揮了越來越重要的作用。對(duì)于人類在互聯(lián)網(wǎng)上的行為,即用戶的在線行為,能夠預(yù)先知道用戶的下一個(gè)活動(dòng)能夠幫助開發(fā)者更好地設(shè)計(jì)以及改進(jìn)在線服務(wù)平臺(tái)。

相較于用戶在線行為預(yù)測(cè)算法的設(shè)計(jì),一個(gè)更加基本的問題是得到用戶在線行為的預(yù)測(cè)性能界,即預(yù)測(cè)算法能夠達(dá)到的預(yù)測(cè)準(zhǔn)確率的上界。該預(yù)測(cè)準(zhǔn)確率上界的計(jì)算能夠指導(dǎo)預(yù)測(cè)算法的設(shè)計(jì),幫助綜合分析算法優(yōu)化空間以及研究成本控制。

用戶在互聯(lián)網(wǎng)上的活動(dòng)呈現(xiàn)爆發(fā)特征,即在長(zhǎng)時(shí)間沒有活動(dòng)后會(huì)在短時(shí)間內(nèi)會(huì)產(chǎn)生大量的活動(dòng)。用戶在線活動(dòng)的爆發(fā)時(shí)間是刻畫用戶在線行為的關(guān)鍵維度,目前還沒有對(duì)于用戶在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度的計(jì)算方法。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的主要目的為提供一種用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法。

本發(fā)明提出一種用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法,包括以下步驟:

從用戶的歷史在線活動(dòng)時(shí)間記錄中提取爆發(fā)簇結(jié)構(gòu);

利用爆發(fā)簇結(jié)構(gòu)獲取用戶爆發(fā)時(shí)間間隔序列;

對(duì)用戶的爆發(fā)時(shí)間間隔序列進(jìn)行離散化,得到爆發(fā)時(shí)間間隔符號(hào)序列;

計(jì)算用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率;

根據(jù)用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率計(jì)算用戶在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度。

進(jìn)一步的,所述從用戶的歷史在線活動(dòng)時(shí)間記錄中提取爆發(fā)簇結(jié)構(gòu)之前,包括,

獲取所述用戶在指定平臺(tái)的所有活動(dòng)時(shí)間記錄。

進(jìn)一步的,所述從用戶的歷史在線活動(dòng)時(shí)間記錄中提取爆發(fā)簇結(jié)構(gòu)步驟,包括,

設(shè)置相關(guān)活動(dòng)的時(shí)間間隔門限,將用戶的所有活動(dòng)時(shí)間記錄劃分成爆發(fā)簇結(jié)構(gòu)。

進(jìn)一步的,所述設(shè)置相關(guān)活動(dòng)的時(shí)間間隔門限,將用戶的所有活動(dòng)時(shí)間記錄劃分成爆發(fā)簇結(jié)構(gòu)步驟,包括,

設(shè)置一個(gè)相關(guān)活動(dòng)時(shí)間間隔門限,判斷兩個(gè)活動(dòng)的時(shí)間間隔是否小于門限,

若是,則判定這兩個(gè)活動(dòng)是相關(guān)的,并將兩個(gè)活動(dòng)作為同一爆發(fā)簇;

若否,則判定這兩個(gè)活動(dòng)是不相關(guān)的。

進(jìn)一步的,所述設(shè)置相關(guān)活動(dòng)的時(shí)間間隔門限,將用戶的所有活動(dòng)時(shí)間記錄劃分成爆發(fā)簇結(jié)構(gòu)步驟,還包括,

將用戶的第一條活動(dòng)時(shí)間記錄設(shè)置為第一個(gè)爆發(fā)簇內(nèi)的第一個(gè)活動(dòng),從用戶的第二條活動(dòng)時(shí)間記錄開始,逐個(gè)進(jìn)行如下判斷,若其與前一條活動(dòng)的時(shí)間間隔小于設(shè)置的相關(guān)活動(dòng)時(shí)間間隔門限,則將其劃入到前一條活動(dòng)記錄所在簇中,若其與前一條活動(dòng)的時(shí)間間隔大于設(shè)置的相關(guān)活動(dòng)時(shí)間間隔門限,則將其作為一個(gè)新的爆發(fā)活動(dòng)簇的第一個(gè)活動(dòng),并且將其標(biāo)記為該爆發(fā)活動(dòng)簇的開始時(shí)間。

進(jìn)一步的,所述對(duì)用戶的爆發(fā)時(shí)間間隔序列進(jìn)行離散化,得到爆發(fā)時(shí)間間隔符號(hào)序列,包括,

采用等頻率離散化方法進(jìn)行離散化。

進(jìn)一步的,所述采用等頻率離散化方法進(jìn)行離散化步驟,包括:

在得到所述用戶所有的爆發(fā)時(shí)間間隔序列后,先劃分出離散區(qū)間,將用戶的各個(gè)爆發(fā)時(shí)間間隔放置于對(duì)應(yīng)的離散區(qū)間當(dāng)中,放置的規(guī)則是使爆發(fā)時(shí)間間隔大于等于放入?yún)^(qū)間的左端點(diǎn)值,同時(shí)小于放入?yún)^(qū)間的右端點(diǎn)值,放置一個(gè)爆發(fā)時(shí)間間隔后,其對(duì)應(yīng)離散區(qū)間的序號(hào)即為該爆發(fā)時(shí)間間隔對(duì)應(yīng)的離散化結(jié)果。

進(jìn)一步的,所述在得到所述用戶所有的爆發(fā)時(shí)間間隔序列后,先劃分出離散區(qū)間步驟,包括,

在爆發(fā)時(shí)間間隔的最大值和最小值之間劃分k個(gè)離散區(qū)間,區(qū)間的劃分使得所有爆發(fā)時(shí)間間隔落入各個(gè)區(qū)間內(nèi)的頻數(shù)相等,依據(jù)上述方法可以得到由小到大排列的第1,2,…,k共k個(gè)離散區(qū)間。

一種用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算系統(tǒng),其特征在于,包括:

提取單元,用于從用戶的歷史在線活動(dòng)時(shí)間記錄中提取爆發(fā)簇結(jié)構(gòu)。

獲取單元,用于利用爆發(fā)簇結(jié)構(gòu)獲取用戶爆發(fā)時(shí)間間隔序列。

離散單元,用于對(duì)用戶的爆發(fā)時(shí)間間隔序列進(jìn)行離散化,得到爆發(fā)時(shí)間間隔符號(hào)序列。

計(jì)算單元,用于計(jì)算用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率,根據(jù)用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率計(jì)算用戶在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度。

進(jìn)一步的,所述提取單元包括,

劃分模塊:設(shè)置相關(guān)活動(dòng)的時(shí)間間隔門限,將用戶的所有活動(dòng)時(shí)間記錄劃分成爆發(fā)簇結(jié)構(gòu)。

本發(fā)明的有益效果:提供了一種對(duì)于用戶在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度的計(jì)算方法,該方法能夠較好地預(yù)測(cè)用戶的下一個(gè)網(wǎng)上活動(dòng)行為,幫助開發(fā)者更好地設(shè)計(jì)以及改進(jìn)在線服務(wù)平臺(tái)。

附圖說明

圖1是本發(fā)明一實(shí)施例一種用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法的流程圖;

圖2是本發(fā)明另一實(shí)施例一種用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法的流程圖;

圖3是本發(fā)明另一實(shí)施例一種基于互聯(lián)網(wǎng)用戶數(shù)據(jù)的在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度計(jì)算系統(tǒng)的結(jié)構(gòu)框圖。

圖4是本發(fā)明一實(shí)施例一種用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法的時(shí)間間隔門限示意圖;

圖5是本發(fā)明一實(shí)施例一種用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法的時(shí)間間隔序列示意圖。

本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明。

具體實(shí)施方式

應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非特意聲明,這里使用的單數(shù)形式“一”、“一個(gè)”、“所述”和“該”也可包括復(fù)數(shù)形式。應(yīng)該進(jìn)一步理解的是,本發(fā)明的說明書中使用的措辭“包括”是指存在所述特征、整數(shù)、步驟、操作、元件和/或組件,但是并不排除存在或添加一個(gè)或多個(gè)其他特征、整數(shù)、步驟、操作、元件、組件和/或它們的組。這里使用的措辭“和/或”包括一個(gè)或更多個(gè)相關(guān)聯(lián)的列出項(xiàng)的全部或任一單元和全部組合。

本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非另外定義,這里使用的所有術(shù)語(包括技術(shù)術(shù)語和科學(xué)術(shù)語),具有與本發(fā)明所屬領(lǐng)域中的普通技術(shù)人員的一般理解相同的意義。還應(yīng)該理解的是,諸如通用字典中定義的那些術(shù)語,應(yīng)該被理解為具有與現(xiàn)有技術(shù)的上下文中的意義一致的意義,并且除非像這里一樣被特定定義,否則不會(huì)用理想化或過于正式的含義來解釋。

參照?qǐng)D1,一種用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法,包括以下步驟:

S10、從用戶的歷史在線活動(dòng)時(shí)間記錄中提取爆發(fā)簇結(jié)構(gòu);

S11、利用爆發(fā)簇結(jié)構(gòu)獲取用戶爆發(fā)時(shí)間間隔序列;

S12、對(duì)用戶的爆發(fā)時(shí)間間隔序列進(jìn)行離散化,得到爆發(fā)時(shí)間間隔符號(hào)序列;

S13、計(jì)算用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率;

S14、根據(jù)用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率計(jì)算用戶在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度。

在上述S10步驟中,爆發(fā)簇結(jié)構(gòu)能更好的反應(yīng)用戶在相近的時(shí)間上的活動(dòng)量,為S11步驟獲取時(shí)間間隔序列區(qū)分時(shí)間段提供重要的依據(jù)。

在上述S12步驟中,離散化是把無限空間中無限的個(gè)體映射到有限的空間中去,以此提高算法的時(shí)空效率,本步驟中將時(shí)間間隔序列離散化后,得到時(shí)間間隔符號(hào)序列。

在上述步驟S13步驟中,熵率就是指一個(gè)隨機(jī)源(一個(gè)會(huì)持續(xù)產(chǎn)生隨機(jī)變量的隨機(jī)過程)的隨時(shí)間的平均不確定性。一個(gè)隨機(jī)過程的熵率就是該過程平均每產(chǎn)生一個(gè)隨機(jī)變量所帶來的不確定度的大小,在步驟S12中得到時(shí)間間隔符號(hào)序列后,根據(jù)該時(shí)間間隔符號(hào)序列后,利用計(jì)算公式:

計(jì)算時(shí)間間隔符號(hào)序列的熵率,其中,Sest表示用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率,n表示用戶爆發(fā)時(shí)間間隔符號(hào)序列的長(zhǎng)度,表Λh示序列中從第個(gè)h符號(hào)開始的,且在第1到第h-1個(gè)符號(hào)構(gòu)成的子列中沒有出現(xiàn)過的最短子序列的長(zhǎng)度。

在上述步驟S14中,時(shí)間間隔符號(hào)序列的熵率,計(jì)算用戶爆發(fā)時(shí)間間隔符號(hào)序列的可預(yù)測(cè)度,計(jì)算公式:

Sest=-[Πl(fā)og2Π+(1-Π)log2(1-Π)]+(1-Π)log2(N-1)

其中,Π表示該用戶爆發(fā)時(shí)間間隔符號(hào)序列的可預(yù)測(cè)度,即預(yù)測(cè)該用戶爆發(fā)時(shí)間能夠到達(dá)的預(yù)測(cè)準(zhǔn)確率的最大值,N表示該用戶爆發(fā)時(shí)間間隔符號(hào)序列中不同符號(hào)的個(gè)數(shù),本發(fā)明給出的爆發(fā)時(shí)間可預(yù)測(cè)度結(jié)果在0到100%之間。

在本實(shí)施例中,根據(jù)用戶在某平臺(tái)上的部分或者某段活動(dòng)時(shí)間,來獲取爆發(fā)簇結(jié)構(gòu),根據(jù)爆發(fā)簇結(jié)構(gòu),獲取時(shí)間間隔序列,對(duì)時(shí)間間隔序列進(jìn)行離散化得到時(shí)間間隔符號(hào)序列,最后利用信息熵和費(fèi)諾不等式計(jì)算用戶在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度。

在本發(fā)明的一實(shí)施例中,上述爆發(fā)簇指人類進(jìn)行活動(dòng)過程中在短時(shí)間內(nèi)突發(fā)產(chǎn)生的一系列的高頻活動(dòng)。

在本發(fā)明的一實(shí)施例中,上述爆發(fā)時(shí)間間隔序列指由相鄰爆發(fā)簇開始時(shí)刻的時(shí)間間隔構(gòu)成的時(shí)間間隔序列。

在本發(fā)明的一實(shí)施例中,上述爆發(fā)時(shí)間間隔符號(hào)序列指利用離散化方法給出的爆發(fā)時(shí)間間隔與爆發(fā)時(shí)間間隔符號(hào)的對(duì)應(yīng)關(guān)系,將爆發(fā)時(shí)間間隔序列進(jìn)行符號(hào)轉(zhuǎn)化后得到的符號(hào)序列。

參照?qǐng)D2,在本發(fā)明的另一實(shí)施例中,一種用戶在線活動(dòng)爆發(fā)時(shí)間的可預(yù)測(cè)度計(jì)算方法,包括以下步驟:

S20、獲取該用戶在某平臺(tái)的所有活動(dòng)時(shí)間記錄;

S21、設(shè)置相關(guān)活動(dòng)的時(shí)間間隔門限,將用戶的所有活動(dòng)時(shí)間記錄劃分成爆發(fā)簇結(jié)構(gòu);

S22、利用爆發(fā)簇結(jié)構(gòu)獲取用戶爆發(fā)時(shí)間間隔序列;

S23、對(duì)用戶的爆發(fā)時(shí)間間隔序列采用等頻率離散化方法進(jìn)行離散化,得到爆發(fā)時(shí)間間隔符號(hào)序列;

S24、計(jì)算用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率;

S25、根據(jù)用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率計(jì)算用戶在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度。

在上述S21步驟中,設(shè)置相關(guān)活動(dòng)的時(shí)間間隔門限的方法為:

當(dāng)兩個(gè)活動(dòng)的時(shí)間間隔小于該門限,則認(rèn)為這兩個(gè)活動(dòng)是相關(guān)的,當(dāng)兩個(gè)活動(dòng)的時(shí)間間隔大于該門限,則認(rèn)為這兩個(gè)活動(dòng)是不相關(guān)的。

在上述S21步驟中,將用戶的所有活動(dòng)時(shí)間記錄劃分成爆發(fā)簇結(jié)構(gòu)的方法為:

將用戶的第一條活動(dòng)時(shí)間記錄設(shè)置為第一個(gè)爆發(fā)簇內(nèi)的第一個(gè)活動(dòng),從用戶的第二條活動(dòng)時(shí)間記錄開始,逐個(gè)進(jìn)行如下判斷,若其與前一條活動(dòng)的時(shí)間間隔小于設(shè)置的相關(guān)活動(dòng)時(shí)間間隔門限,則將其劃入到前一條活動(dòng)記錄所在簇中,若其與前一條活動(dòng)的時(shí)間間隔大于設(shè)置的相關(guān)活動(dòng)時(shí)間間隔門限,則將其作為一個(gè)新的爆發(fā)活動(dòng)簇的第一個(gè)活動(dòng),并且將其標(biāo)記為該爆發(fā)活動(dòng)簇的開始時(shí)間。

在本發(fā)明實(shí)施例中,對(duì)用戶的爆發(fā)時(shí)間間隔序列進(jìn)行離散化,得到爆發(fā)時(shí)間間隔符號(hào)序列,包括:

本實(shí)施例中S23步驟中采用等頻率離散化方法進(jìn)行離散化的方法:

在得到該用戶所有的爆發(fā)時(shí)間間隔序列后先劃分出離散區(qū)間,將用戶的各個(gè)爆發(fā)時(shí)間間隔放置于對(duì)應(yīng)的離散區(qū)間當(dāng)中,放置的規(guī)則是使爆發(fā)時(shí)間間隔大于等于放入?yún)^(qū)間的左端點(diǎn)值,同時(shí)小于放入?yún)^(qū)間的右端點(diǎn)值,放置一個(gè)爆發(fā)時(shí)間間隔后,其對(duì)應(yīng)區(qū)間的序號(hào)即為該爆發(fā)時(shí)間間隔對(duì)應(yīng)的離散化結(jié)果。其中劃分離散區(qū)間的方法為:在爆發(fā)時(shí)間間隔的最大值和最小值之間劃分k個(gè)離散區(qū)間,區(qū)間的劃分使得所有爆發(fā)時(shí)間間隔落入各個(gè)區(qū)間內(nèi)的頻數(shù)相等,依據(jù)上述方法可以得到由小到大排列的第1,2,…,k共k個(gè)離散區(qū)間。

在本發(fā)明實(shí)施例中,當(dāng)需要對(duì)某用戶在某網(wǎng)絡(luò)平臺(tái)上的爆發(fā)活動(dòng)時(shí)間可預(yù)測(cè)度計(jì)算時(shí),首先得到該用戶在該平臺(tái)的所有活動(dòng)時(shí)間記錄。得到活動(dòng)時(shí)間記錄后,首先設(shè)置一個(gè)相關(guān)活動(dòng)時(shí)間間隔門限,該門限的作用是區(qū)分兩個(gè)活動(dòng)是否相關(guān),當(dāng)兩個(gè)活動(dòng)的時(shí)間間隔小于該門限,則認(rèn)為這兩個(gè)活動(dòng)是相關(guān)的,即該兩個(gè)活動(dòng)來源于同一個(gè)爆發(fā)簇;當(dāng)兩個(gè)活動(dòng)的時(shí)間間隔大于該門限,則認(rèn)為這兩個(gè)活動(dòng)是不相關(guān)的,即該兩個(gè)活動(dòng)來源于兩個(gè)不同的爆發(fā)簇,該相關(guān)活動(dòng)時(shí)間間隔門限的取值與具體網(wǎng)絡(luò)平臺(tái)有關(guān)。

根據(jù)設(shè)置的相關(guān)活動(dòng)時(shí)間間隔門限,將用戶在該平臺(tái)的所有活動(dòng)時(shí)間記錄劃分成爆發(fā)簇結(jié)構(gòu)。對(duì)于用戶的第一條活動(dòng)時(shí)間記錄,將其設(shè)置為第一個(gè)爆發(fā)簇內(nèi)的第一個(gè)活動(dòng)。從用戶的第二條活動(dòng)時(shí)間記錄開始,逐個(gè)進(jìn)行如下判斷,若其與前一條活動(dòng)的時(shí)間間隔小于設(shè)置的相關(guān)活動(dòng)時(shí)間間隔門限,則將其劃入到前一條活動(dòng)記錄所在簇中;若其與前一條活動(dòng)的時(shí)間間隔大于設(shè)置的相關(guān)活動(dòng)時(shí)間間隔門限,則將其作為一個(gè)新的爆發(fā)活動(dòng)簇的第一個(gè)活動(dòng),并且將其標(biāo)記為該爆發(fā)活動(dòng)簇的開始時(shí)間。如圖4所示,Δt表示相關(guān)活動(dòng)時(shí)間間隔門限。

將用戶的所有活動(dòng)記錄劃分成爆發(fā)簇結(jié)構(gòu)后,可以得到用戶在該平臺(tái)所有爆發(fā)簇的開始時(shí)間,由各個(gè)簇的爆發(fā)開始時(shí)間可以得到該用戶的爆發(fā)活動(dòng)時(shí)間間隔序列,如圖5所示,τ1,τ2,τ3,τ4表示用戶爆發(fā)活動(dòng)時(shí)間間隔序列中的一部分。

在得到用戶的爆發(fā)活動(dòng)時(shí)間間隔序列后,本發(fā)明利用離散化方法對(duì)爆發(fā)活動(dòng)時(shí)間間隔進(jìn)行離散化,得到爆發(fā)活動(dòng)時(shí)間間隔符號(hào)序列,通過時(shí)間間隔符號(hào)序列計(jì)算可預(yù)測(cè)度。

由于用戶的爆發(fā)時(shí)間間隔分布具有胖尾特征,為了實(shí)現(xiàn)有效的爆發(fā)時(shí)間間隔符號(hào)化,本發(fā)明采用等頻率離散化方法進(jìn)行離散化,在得到該用戶所有的爆發(fā)時(shí)間間隔序列后,得到其爆發(fā)時(shí)間間隔的最大值和最小值。在最大值和最小值之間劃分k個(gè)離散區(qū)間,區(qū)間的劃分使得所有爆發(fā)時(shí)間間隔落入各個(gè)區(qū)間內(nèi)的頻數(shù)相等。依據(jù)上述方法可以得到由小到大排列的第1,2,…,k共k個(gè)離散區(qū)間。

在得到所有離散區(qū)間后,將用戶的各個(gè)爆發(fā)時(shí)間間隔放置于對(duì)應(yīng)的區(qū)間當(dāng)中,放置的規(guī)則是使爆發(fā)時(shí)間間隔大于等于放入?yún)^(qū)間的左端點(diǎn)值,同時(shí)小于放入?yún)^(qū)間的右端點(diǎn)值。放置一個(gè)爆發(fā)時(shí)間間隔后,其對(duì)應(yīng)區(qū)間的序號(hào)即為該爆發(fā)時(shí)間間隔對(duì)應(yīng)的離散化結(jié)果,這樣每一個(gè)爆發(fā)時(shí)間間隔都對(duì)應(yīng)一個(gè)爆發(fā)時(shí)間間隔符號(hào),時(shí)間間隔符號(hào)依次為1’,2’,…,k’,對(duì)用戶爆發(fā)時(shí)間間隔序列中的每個(gè)時(shí)間間隔都進(jìn)行離散化后,就可以將用戶的爆發(fā)時(shí)間間隔序列轉(zhuǎn)化為爆發(fā)時(shí)間間隔符號(hào)序列。

在得到用戶的爆發(fā)時(shí)間間隔符號(hào)序列后,本發(fā)明利用信息熵和費(fèi)諾不等式計(jì)算用戶在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度。計(jì)算方式如下。

首先計(jì)算用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率,計(jì)算公式如下:

其中,Sest表示用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率,n表示用戶爆發(fā)時(shí)間間隔符號(hào)序列的長(zhǎng)度,表Λh示序列中從第h個(gè)符號(hào)開始的,且在第1到第h-1個(gè)符號(hào)構(gòu)成的子列中沒有出現(xiàn)過的最短子序列的長(zhǎng)度。

在計(jì)算得到用戶爆發(fā)時(shí)間間隔序列后,利用費(fèi)諾不等式計(jì)算對(duì)應(yīng)符號(hào)序列的可預(yù)測(cè)度,即利用序列中全部歷史符號(hào)對(duì)下一個(gè)符號(hào)進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)算法能夠達(dá)到的預(yù)測(cè)準(zhǔn)確率的最大值。計(jì)算公式如下。

Sest=-[Πl(fā)og2Π+(1-Π)log2(1-Π)]+(1-Π)log2(N-1)

其中,Π表示該用戶爆發(fā)時(shí)間間隔符號(hào)序列的可預(yù)測(cè)度,即預(yù)測(cè)該用戶爆發(fā)時(shí)間能夠到達(dá)的預(yù)測(cè)準(zhǔn)確率的最大值,N表示該用戶爆發(fā)時(shí)間間隔符號(hào)序列中不同符號(hào)的個(gè)數(shù)。

參照?qǐng)D3,本發(fā)明還提供一種基于互聯(lián)網(wǎng)用戶數(shù)據(jù)的在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度計(jì)算系統(tǒng),包括:

提取單元100,用于從用戶的歷史在線活動(dòng)時(shí)間記錄中提取爆發(fā)簇結(jié)構(gòu)。

獲取單元110,用于利用爆發(fā)簇結(jié)構(gòu)獲取用戶爆發(fā)時(shí)間間隔序列。

離散單元120,用于對(duì)用戶的爆發(fā)時(shí)間間隔序列進(jìn)行離散化,得到爆發(fā)時(shí)間間隔符號(hào)序列。

計(jì)算單元130,用于計(jì)算用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率,根據(jù)用戶爆發(fā)時(shí)間間隔符號(hào)序列的熵率計(jì)算用戶在線活動(dòng)爆發(fā)時(shí)間可預(yù)測(cè)度。

在另一種實(shí)施例中,所述提取單元,用于從用戶的歷史在線活動(dòng)時(shí)間記錄中提取爆發(fā)簇結(jié)構(gòu),包括,

劃分模塊1001:設(shè)置相關(guān)活動(dòng)的時(shí)間間隔門限,將用戶的所有活動(dòng)時(shí)間記錄劃分成爆發(fā)簇結(jié)構(gòu)。

以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1