一種數(shù)據(jù)存儲方法及系統(tǒng)的制作方法
【技術領域】
[0001]本發(fā)明涉及數(shù)據(jù)信息處理技術領域,特別涉及一種數(shù)據(jù)存儲方法及系統(tǒng)。
【背景技術】
[0002]在現(xiàn)有的推薦系統(tǒng)(比如廣告系統(tǒng),或新聞推薦系統(tǒng))中,商家可以通過推薦系統(tǒng)定向地或不定向的將需要推薦的數(shù)據(jù)(比如廣告數(shù)據(jù),或新聞數(shù)據(jù)等)發(fā)送到各個用戶終端,從而達到推廣某一產(chǎn)品或告知某些信息的目的。推薦系統(tǒng)需要實時地統(tǒng)計用戶終端對接收的推薦數(shù)據(jù)的操作,即用戶行為。
[0003]現(xiàn)有技術中,推薦系統(tǒng)在統(tǒng)計用戶行為的數(shù)據(jù)時,主要是按照固定的時間周期,且以固定的維度儲存各個用戶的用戶行為的數(shù)據(jù)。
【發(fā)明內容】
[0004]本發(fā)明實施例提供一種數(shù)據(jù)存儲方法及系統(tǒng),實現(xiàn)了以多維度且多時間窗的結構儲存用戶行為的數(shù)據(jù)。
[0005]本發(fā)明實施例提供一種數(shù)據(jù)存儲方法,包括:
[0006]獲取用戶行為的數(shù)據(jù);所述用戶行為的數(shù)據(jù)中包括用戶操作數(shù)據(jù)和與應用相關的數(shù)據(jù);
[0007]按照維度調整所述用戶行為的數(shù)據(jù),使得調整后的用戶行為數(shù)據(jù)包括多組維度分別對應的用戶操作數(shù)據(jù),所述維度的信息包括在所述與應用相關的數(shù)據(jù)中;
[0008]將所述調整后的用戶行為數(shù)據(jù)儲存為多時間滑窗的存儲結構,所述多時間滑窗的存儲結構中包括:多組維度分別對應的時間窗內的用戶操作數(shù)據(jù)。
[0009]本發(fā)明實施例還提供一種數(shù)據(jù)存儲系統(tǒng),包括:
[0010]數(shù)據(jù)獲取單元,用于獲取用戶行為的數(shù)據(jù);所述用戶行為的數(shù)據(jù)中包括用戶操作數(shù)據(jù)和與應用相關的數(shù)據(jù);
[0011]調整單元,用于按照維度調整所述數(shù)據(jù)獲取單元獲取的用戶行為的數(shù)據(jù),使得調整后的用戶行為數(shù)據(jù)包括多組維度分別對應的用戶操作數(shù)據(jù),所述維度的信息包括在所述與應用相關的數(shù)據(jù)中;
[0012]儲存單元,用于將所述調整單元調整后的用戶行為數(shù)據(jù)儲存為多時間滑窗的存儲結構,所述多時間滑窗的存儲結構中包括:多組維度分別對應的時間窗內的用戶操作數(shù)據(jù)。
[0013]本發(fā)明實施例中,推薦系統(tǒng)在統(tǒng)計用戶行為的數(shù)據(jù)時,可以將獲取的用戶行為的數(shù)據(jù)調整為多組維度分別對應的用戶操作數(shù)據(jù),然后按照多維度,多時間窗的結構儲存多組維度分別對應的用戶操作數(shù)據(jù)。由于每組維度所要求的用戶操作數(shù)據(jù)的儲存時間可能不同,采用本發(fā)明實施例的方法,這樣就能靈活地將以不同維度不同時間窗統(tǒng)計的用戶行為的數(shù)據(jù)集中地儲存到一起,而不用分開儲存,可以最大程度的節(jié)省存儲空間。
【附圖說明】
[0014]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0015]圖1是本發(fā)明實施例提供的一種數(shù)據(jù)存儲方法的流程圖;
[0016]圖2是本發(fā)明實施例提供的一種數(shù)據(jù)存儲系統(tǒng)的結構示意圖;
[0017]圖3是本發(fā)明實施例提供的另一種數(shù)據(jù)存儲系統(tǒng)的結構示意圖;
[0018]圖4是本發(fā)明實施例提供的一種推薦系統(tǒng)的結構示意圖;
[0019]圖5是本發(fā)明應用實施例中提供的一種廣告系統(tǒng)的結構示意圖;
[0020]圖6是本發(fā)明實施例中的多時間滑窗的存儲結構的結構示意圖;
[0021]圖7是本發(fā)明應用實施例中一種多時間滑窗的存儲結構的示意圖;
[0022]圖8是本發(fā)明應用實施例中另一種多時間滑窗的存儲結構的示意圖;
[0023]圖9是本發(fā)明應用實施例中又一種多時間滑窗的存儲結構的示意圖。
【具體實施方式】
[0024]下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0025]本發(fā)明的說明書和權利要求書及上述附圖中的術語“第一”、“第二”、“第三” “第四”等(如果存在)是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本發(fā)明的實施例例如能夠以除了在這里圖示或描述的那些以外的順序實施。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排它的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產(chǎn)品或設備固有的其它步驟或單元。
[0026]本發(fā)明實施例提供一種數(shù)據(jù)存儲方法,主要是針對推薦系統(tǒng)比如廣告系統(tǒng),或新聞推薦系統(tǒng)等在對用戶行為進行統(tǒng)計時,對統(tǒng)計的各個用戶終端的用戶行為的數(shù)據(jù)進行的儲存,本發(fā)明實施例的方法是推薦系統(tǒng)所執(zhí)行的方法,結構示意圖如圖1所示,包括:
[0027]步驟101,獲取用戶行為的數(shù)據(jù),在用戶行為的數(shù)據(jù)中包括用戶操作數(shù)據(jù)和與應用相關的數(shù)據(jù)。
[0028]這里用戶行為是指用戶所使用的用戶終端對推薦系統(tǒng)發(fā)送的推薦數(shù)據(jù)的操作,比如對推薦數(shù)據(jù)的曝光(即選擇查看推薦數(shù)據(jù)),點贊,收藏等操作,其中,如果推薦系統(tǒng)是廣告系統(tǒng),則上述的推薦數(shù)據(jù)可以是基于某一產(chǎn)品的廣告數(shù)據(jù),如果推薦系統(tǒng)是新聞推薦系統(tǒng),則上述的推薦數(shù)據(jù)可以是新聞數(shù)據(jù)等。當推薦系統(tǒng)將推薦數(shù)據(jù)發(fā)送到用戶終端后,推薦系統(tǒng)可以定時或不定時地主動向用戶終端獲取用戶行為的數(shù)據(jù),或者用戶終端向推薦系統(tǒng)主動上報用戶行為的數(shù)據(jù)。
[0029]具體地,獲取的用戶行為的數(shù)據(jù)中可以包括兩種數(shù)據(jù),即與操作相關的用戶操作數(shù)據(jù)和與具體應用相關的數(shù)據(jù)。具體地,用戶操作數(shù)據(jù)可以包括用戶行為標識(比如用戶行為編號),用戶操作發(fā)生的時刻Tl和數(shù)量等,還可以包括用戶標識等;與具體應用相關的數(shù)據(jù)可以包括推薦位(標示推薦數(shù)據(jù)投放的位置,比如在用戶界面的底部,頂部等)、推薦數(shù)據(jù)標識(唯一標示一條推薦數(shù)據(jù))、推薦數(shù)據(jù)所描述的應用的應用標識和應用類型等,這樣每個時刻都可以對應一組用戶行為的數(shù)據(jù)。
[0030]步驟102,按照維度調整用戶行為的數(shù)據(jù),使得調整后的用戶行為數(shù)據(jù)包括多組維度分別對應的用戶操作數(shù)據(jù),其中,維度的信息包括在上述與應用相關的數(shù)據(jù)中。這里的調整是按照上述步驟101中獲取的用戶行為的數(shù)據(jù)中已有的數(shù)據(jù)進行調整,因此,得到的調整后的用戶行為數(shù)據(jù)中的所有數(shù)據(jù)都包括在上述步驟101中獲取的用戶行為的數(shù)據(jù)中。且這里的多組維度中任一組維度可以包括一個或多個維度。
[0031]這里維度的信息可以包括如下信息中的至少一個:推薦數(shù)據(jù)類型,推薦數(shù)據(jù)組類型,推薦位,推薦數(shù)據(jù)標識,推薦數(shù)據(jù)所描述的應用的應用類型和應用標識等。
[0032]具體地,如果上述步驟101中獲取的某一時刻的一組用戶行為的數(shù)據(jù)中包括n(n為大于I的自然數(shù))個維度的信息(比如推薦位和推薦數(shù)據(jù)標識等),及某一時刻的用戶操作數(shù)據(jù),則在調整用戶行為的數(shù)據(jù)時,可以將該組用戶行為的數(shù)據(jù)調整為m組子數(shù)據(jù),其中任一組子數(shù)據(jù)中包括上述該某一時刻的用戶操作數(shù)據(jù)及上述η個維度中至少一個維度的信息。其中,m小于或等于P的自然數(shù),該P是從η中分別取小于和等于η的自然數(shù)的組合數(shù)之和,比如η是2,則m為小于或等于3的自然數(shù);η是3,則m為小于或等于7的自然數(shù)。這里