亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于潛在社群的信息推薦方法

文檔序號:6363266閱讀:139來源:國知局
專利名稱:基于潛在社群的信息推薦方法
技術(shù)領域
本發(fā)明涉及信息推薦技術(shù)領域,尤其涉及一種基于潛在社群的信息推薦方法。
背景技術(shù)
隨著信息社會從“E 社會(Electronic Society) ” 向 “U 社會(Universal> User-Centric、Ubiquitous Society) ”的高級階段發(fā)展,信息推薦技術(shù)的研究將具有越來越重要的理論意義和廣闊的應用前景,能夠被應用于電子商務、數(shù)字家庭、娛樂游戲、新聞等許多領域。這種轉(zhuǎn)變的根本原因是計算環(huán)境正在實現(xiàn)從以CPU為中心的圖靈模式單機向以互聯(lián)網(wǎng)為中心的網(wǎng)絡化跨越和轉(zhuǎn)變;全球51乙移動用戶,正通過微博客、Facebook, Twitter等新興應用,以及移動設備上的各類傳感器,改變著傳統(tǒng)信息創(chuàng)造、傳遞、處理、體驗的方式。正是網(wǎng)絡化的進程加速了信息的交互與增值。2007年底,全球數(shù)字信息總量首次超出全球所擁有的存儲總量,而在隨后的3年里,云計算和物聯(lián)網(wǎng)為代表的互聯(lián)網(wǎng)應用深化,導致各類傳感器的普及和基于Web2. O的服務混搭技術(shù)的風靡,各種新生數(shù)據(jù)源如雨后春筍般涌現(xiàn)。據(jù)美國《科學》雜志最新報道,截止2011年2月,全球生成、捕獲與復制所產(chǎn)生的信息量相比2007年增長了 4倍,逼近1300EB,信息總量已經(jīng)達到了存儲能力的兩倍, 同時,信息總?cè)哂嗔恳策_到了 75%的驚人比例。這種態(tài)勢一方面給信息處理、通信和存儲能力提出更高要求;另一方面,盡管所處的信息空間在急劇膨脹,但人們真正需求的只是那些與自己的興趣、工作、專業(yè)、學習等相關的個性化信息,在信息社會的高級階段,人們已從對簡單信息的需求轉(zhuǎn)化為對有用信息和知識信息的需求,海量信息必須經(jīng)過過濾才不會對人形成困擾。如何快速、精準地為用戶提供有價值的信息服務成為當前巨大的挑戰(zhàn)性問題。 因此,海量信息推薦的重點在于如何在合適的時間、合適的地點、選擇合適的信息提供滿足用戶需求的服務。社群(Group)是目前社會媒體網(wǎng)站中非常流行的一種機制,例如Youtube、Flickr 等。用戶能夠手工創(chuàng)建Group用于實現(xiàn)資源的功能與推薦。研究發(fā)現(xiàn),超過一半的Flickr 用戶參與了至少一個Group,這表明用戶熱衷于抱團式的資源共享,同時Group又會吸引大量新用戶,提高站點的熱度。通常,每個Group包含一個或多個主題的資源,用戶若對這些主題中的部分感興趣,則可以加入這個Group,并與其中的所有用戶分享資源。不過,目前的 Group機制也存在一些不足.自組織一個主題也許對應了大量Group,如Flickr中與“鳥”相關的主題有近 3萬個。對于這種情況,用戶往往會不知錯所,迷茫于到底加入哪個group ;.多義性一個資源,無論是圖像、視頻或軟件服務,往往包含了眾多的語義信息, 用戶如何分類這些資源,并上傳到對應的Group里,一直是個問題;.潛意識性用戶經(jīng)常會意識不到自己的實際興趣,可能會錯過很多Group加入;.噪聲由于Group是一種完全自由、松散的方式構(gòu)造起來的,導致很多Group 中可能會存在一些與其主題無關的資源,或者對該主題并不是很感興趣的用戶,導致基于 Group的推薦經(jīng)常會導致錯誤。
正是由于目前Group的以上缺陷,導致了無序的資源推薦。因此,大部分研究著重于探索如何推薦合適的Group給用戶,或者將一個資源推薦到合適的Group中。不過,盡管這些方法能夠選出最適合的Group推薦給某個用戶或某個資源,大多數(shù)興趣相似的用戶可能仍然分居在不同Group中,無法進行充分的資源共享與推薦。

發(fā)明內(nèi)容
針對上述存在的技術(shù)問題,本發(fā)明的目的是提供一種基于潛在社群的信息推薦方法,實現(xiàn)準確高效而不失新穎的自動推薦。為達到上述目的,本發(fā)明采用的技術(shù)方案為一種基于潛在社群的信息推薦方法, 包含以下步驟步驟1,根據(jù)用戶歷史數(shù)據(jù)記錄來進行用戶興趣模型挖掘,包括以下步驟,步驟I. I,采用特征發(fā)現(xiàn)技術(shù)從用戶交互過的信息中挖掘出興趣;步驟I. 2,根據(jù)用戶與信息交互次數(shù)的量化,衡量用戶對興趣的感興趣程度;步驟I. 3,將用戶、興趣以及用戶對興趣的感興趣程度組織成用戶興趣模型;步驟2,基于用戶興趣模型進行潛在社群發(fā)現(xiàn),并根據(jù)社群層次關系定義對潛在社群進行社群層次關系挖掘,得到社群層次結(jié)構(gòu);所述潛在社群包括單一興趣社群和多興趣社群,一個社群的所有用戶構(gòu)成該社群的用戶集,一個社群的所有興趣構(gòu)成該社群的興趣集;所述社群層次關系定義如下,(I)若一個社群G的用戶集包含另一個社群G'的用戶集,同時社群G的興趣集被社群G,的興趣集包含,則社群G是社群G,的上位社群,社群G,是社群G的下位社群;(2)若一個上位社群和一個下位社群之間不存在別的社群,則稱為直接上位社群和直接下位社群;(3)只有直接上位社群和直接下位社群之間才有連接,并且直接上位社群通過鍵指向直接下位社群,這個鍵是直接下位社群比直接上位社群多出來的單一興趣社群編號;基于用戶興趣模型進行潛在社群發(fā)現(xiàn)包括以下步驟,步驟2. 1,根據(jù)用戶興趣模型發(fā)現(xiàn)單一興趣社群,所述單一興趣社群表示為,{(tiClk) (Yuj)}其中,tiClk為單一興趣社群的編號,\表示該社群對應的興趣,dk表示該社群對應的興趣度,Y+表示該社群對應的用戶集,dk根據(jù)該社群對應的用戶對興趣ti的感興趣程度量化得到;步驟2. 2,基于單一興趣社群迭代發(fā)現(xiàn)多興趣社群,所述多興趣社群表示為,{(Ygi) (Yuj)}其中,gi表示該社群包含的某個單一興趣社群,Ygi表示該社群對應的單一興趣社群集合,采用組合成該社群的所有單一興趣社群的編號的集合表示,即單一興趣社群編號集合Juj表示該社群對應的用戶集;所述迭代發(fā)現(xiàn)多興趣社群的實現(xiàn)方式如下,
設有單一興趣社群gi,按照i = O, I. . . Max的順序,分別組合社群gi和社群gi, gi+1. · · gMax,從中發(fā)現(xiàn)單一興趣社群編號集合包括單一興趣社群gi的編號的所有社群; 若社群gi與gj組合生成新社群,基于社群層次關系判斷新社群是否是被包含的社群,若是則去除新社群,若不是則將新社群加入社群層次關系,并將新社群和社群gi繼續(xù)與社群 gj, gj+1. . . gMax 分別組合;所述組合,是指將兩個社群的興趣集取并集,兩個社群的用戶集取交集;所述生成新社群,是指當組合所得社群的用戶集中用戶數(shù)目不小于預設閾值時, 將組合所得社群作為生成的新社群;所述包含,是指若一個社群A包含另一個社群B,則表示組合成社群B的單一興趣社群集合是組合成社群A的單一興趣社群集合的子集,社群B的用戶集是社群A的用戶集的子集;步驟3,基于社群層次關系進行推薦,包括以下步驟,步驟3. 1,挖掘待推薦項目包含的興趣;步驟3. 2,根據(jù)待推薦項目包含的興趣,按照步驟2所得社群層次關系找到滿足推薦條件的待推薦社群,將待推薦項目推送到找到的待推薦社群;步驟3. 3,記錄用戶反饋信息并更新社群層次關系。而且,步驟2. 2中,判斷新社群是否是被包含的社群的具體實現(xiàn)方式如下,設一個多興趣社群G,若多興趣社群G被包含,則在包含多興趣社群G的所有社群中,一定存在一個社群G,是其他社群的上位社群;設組合成多興趣社群G的單一興趣社群為A1,私2,…,,多興趣社群G指向單一興趣社群A1 ^Si2,…,私 的鍵分別為ip i2,. . .,in,其中η為組合成多興趣社群G的單一興趣社群總數(shù);首先定位到單一興趣社群&,然后在單一興趣社群&及單一興趣社群&的下位社群中查找鍵i2,若找到,返回鍵i2對應的社群G2,沒找到則不存在社群G',結(jié)束查找;再根據(jù)返回的社群G2查找鍵i3,若社群62的興趣集中包含i3,則返回社群G2自身,否則在社群G2 及其下位社群中查找鍵i3,找到則返回鍵i3對應的社群G3,沒找到則不存在社群G',結(jié)束查找;同樣的方法循環(huán),直到查完鍵in,找到則返回鍵in對應的社群6 作為社群G,,沒找到則不存在社群G',結(jié)束查找;若不存在社群G',則判定多興趣社群G不被包含,若找到社群G',則判斷社群 G'的用戶集是否包含多興趣社群G的用戶集,若包含則多興趣社群G是被包含的,否則多興趣社群G不被包含。而且,步驟3. 2中,查找滿足推薦條件的待推薦社群的具體方式如下,步驟a,首先將單一興趣社群列表LO中滿足推薦條件的社群加入到推薦社群列表 LI中,將不滿足推薦條件的加入到待推薦社群列表L2中;步驟b,將L2中的社群與L2中的社群組合,得到社群組合結(jié)果;步驟C,將社群組合結(jié)果在社群層次關系中查找到相應的社群加入到社群列表 L3 ;步驟c,將L3中社群與LI中社群進行比較,若包含LI中社群則從L3中剔除;步驟d,判斷L3中社群是否滿足推薦條件,將滿足推薦條件的社群加入到LI中;
步驟e,將不滿足推薦條件的社群加入到待推薦社群列表L4中;將L4中的社群繼續(xù)與L2中的社群組合得到社群組合結(jié)果,返回執(zhí)行步驟b,不斷的循環(huán)下去,直到L3或者 L4為空為止。而且,判斷一個社群是否滿足推薦條件,根據(jù)待推薦興趣組合和待推薦社群間相似度決定,計算公式如下,Sim(ot,gt)- Ps—
3 + NSCore其中,Ot表不待推薦項目包含的所有興趣構(gòu)成的待推薦興趣組合,gi表不待推薦社群的興趣集,δ是避免出現(xiàn)除零情況的參數(shù),Psc^表示待推薦興趣組合和待推薦社群的興趣集的同向度,Nscore表示待推薦興趣組合和待推薦社群的興趣集的異向度。本發(fā)明具有以下優(yōu)點和積極效果I)通過潛在Group發(fā)現(xiàn),將具有相似興趣的群體聚集在一起,并根據(jù)興趣的多少、 用戶的眾寡,實現(xiàn)不同粒度的Group層次化抽象,從而能夠?qū)崿F(xiàn)靈活的信息自動批量推送, 相比傳統(tǒng)點對點的推薦技術(shù),在效率上有大幅提升;2)在潛在Group挖掘過程中集成了協(xié)同過濾技術(shù),從而使得同一 Group中的不同用戶能夠相互間接影響、學習,從而增加信息推薦的新穎性。











圖是N 丄 score示意圖,圖]
I是本發(fā)明實施例的流程2是本發(fā)明實施例的用戶興趣模型示意3是本發(fā)明實施例的單一興趣社群示意4是本發(fā)明實施例中基于單一興趣社群迭代發(fā)現(xiàn)多興趣社群的示意5是本發(fā)明實施例中對單一興趣社群g0組合成多興趣社群的示意6是本發(fā)明實施例中多興趣社群發(fā)現(xiàn)結(jié)果的示意7是本發(fā)明實施例中社群層次關系的示意8是本發(fā)明實施例中社群層次關系生成過程中的示意9是本發(fā)明實施例中待推薦社群尋找過程中的示意10是本發(fā)明實施例中待推薦項目與待推薦社群之間匹配的示意圖,其中圖
Yi的不意圖,圖IOb是Nsetffe = Y丨+Y 2的不意圖,圖IOc是Nsetffe = Y !+ Y -Od 是 Nsetjre = Y 丨+Y 2+Y 3 的不意圖。
a、
O AHH
具體實施例方式以下結(jié)合附圖和實施例詳細說明本發(fā)明技術(shù)方案。本發(fā)明提供了一種基于潛在社群的信息推薦方法,實施例的處理流程如圖I所示收集的用戶歷史數(shù)據(jù)記錄可以保存在數(shù)據(jù)庫中,實施例通過特征發(fā)現(xiàn)技術(shù)從收集的用戶歷史數(shù)據(jù)記錄中挖掘出用戶興趣模型;然后根據(jù)用戶興趣模型進行潛在社群發(fā)現(xiàn)并挖掘出社群間的層次關系。推薦時則通過特征提取從待推薦項目中提取出待推薦興趣集合,然后結(jié)合社群層次結(jié)構(gòu)的特點,快速定位到待推薦社群;再根據(jù)推薦算法,計算待推薦社群與待推薦興趣集合間的相似度來決策是否滿足推薦條件。最后,若推薦成功,記錄用戶反饋信
8息作為新的用戶歷史數(shù)據(jù)記錄寫入數(shù)據(jù)庫,并參加下一次更新,這樣可以保持社群層次關系自動更新。為便于實施參考起見,實施例的具體步驟提供如下步驟1,根據(jù)用戶歷史數(shù)據(jù)記錄來進行用戶興趣模型挖掘,包括以下步驟步驟I. 1,根據(jù)用戶歷史數(shù)據(jù)記錄,采用特征發(fā)現(xiàn)技術(shù)從用戶交互過的信息中挖掘出興趣。針對不同信息的特點,所采用的特征發(fā)現(xiàn)方法也將有所不同,不過最終都歸結(jié)到分類問題。以圖片的特征發(fā)現(xiàn)為例,首先對圖片進行切割,然后對每一部分進行特征提取之后再與訓練集進行相似性計算,對應到Tag (語義),最后對Tag進行聚類,每一類將成為一個興趣。本發(fā)明不予贅述。步驟I. 2,根據(jù)用戶與信息交互次數(shù)的量化來衡量用戶對興趣的感興趣程度。針對不同的興趣,結(jié)合每個用戶與所有信息的交互次數(shù)來衡量用戶在該興趣上的興趣度。用戶i在興趣t上的興趣度Ai的計算公式為
權(quán)利要求
1.一種基于潛在社群的信息推薦方法,其特征在于,包含以下步驟步驟I,根據(jù)用戶歷史數(shù)據(jù)記錄來進行用戶興趣模型挖掘,包括以下步驟,步驟1.1,采用特征發(fā)現(xiàn)技術(shù)從用戶交互過的信息中挖掘出興趣;步驟I. 2,根據(jù)用戶與信息交互次數(shù)的量化,衡量用戶對興趣的感興趣程度;步驟I. 3,將用戶、興趣以及用戶對興趣的感興趣程度組織成用戶興趣模型;步驟2,基于用戶興趣模型進行潛在社群發(fā)現(xiàn),并根據(jù)社群層次關系定義對潛在社群進行社群層次關系挖掘,得到社群層次結(jié)構(gòu);所述潛在社群包括單一興趣社群和多興趣社群,一個社群的所有用戶構(gòu)成該社群的用戶集,一個社群的所有興趣構(gòu)成該社群的興趣集;所述社群層次關系定義如下,(1)若一個社群G的用戶集包含另一個社群G,的用戶集,同時社群G的興趣集被社群G,的興趣集包含,則社群G是社群G,的上位社群,社群G,是社群G的下位社群;(2)若一個上位社群和一個下位社群之間不存在別的社群,則稱為直接上位社群和直接下位社群;(3)只有直接上位社群和直接下位社群之間才有連接,并且直接上位社群通過鍵指向直接下位社群,這個鍵是直接下位社群比直接上位社群多出來的單一興趣社群編號;基于用戶興趣模型進行潛在社群發(fā)現(xiàn)包括以下步驟,步驟2. 1,根據(jù)用戶興趣模型發(fā)現(xiàn)單一興趣社群,所述單一興趣社群表示為,{(MtXOj.)}其中,4Jt為單一興趣社群的編號,h表不該社群對應的興趣,表不該社群對應的興趣度,IJ&表示該社群對應的用戶隼O根據(jù)該社群對應的用戶對興趣^的感興趣程度量化得到;步驟2. 2,基于單一興趣社群迭代發(fā)現(xiàn)多興趣社群,所述多興趣社群表示為,{(Ug^CU^·)}其中,&表示該社群包含的某個單一興趣社群,Ugi表示該社群對應的單一興趣社群集合,采用組合成該社群的所有單一興趣社群的編號的集合表示,即單一興趣社群編號集合表示該社群對應的用戶集;所述迭代發(fā)現(xiàn)多興趣社群的實現(xiàn)方式如下,設有單一興趣社群gi,按照i=0,l…Max的順序,分別組合社群gi和社群gi,gi+1… gMax,從中發(fā)現(xiàn)單一興趣社群編號集合包括單一興趣社群gi的編號的所有社群;若社群gi 與gj組合生成新社群,基于社群層次關系判斷新社群是否是被包含的社群,若是則去除新社群,若不是則將新社群加入社群層次關系,并將新社群和社群gi繼續(xù)與社群gj,gj+1… gMax分別組合;所述組合,是指將兩個社群的興趣集取并集,兩個社群的用戶集取交集;所述生成新社群,是指當組合所得社群的用戶集中用戶數(shù)目不小于預設閾值時,將組合所得社群作為生成的新社群;所述包含,是指若一個社群A包含另一個社群B,則表示組合成社群B的單一興趣社群集合是組合成社群A的單一興趣社群集合的子集,社群B的用戶集是社群A的用戶集的子集;步驟3,基于社群層次關系進行推薦,包括以下步驟,步驟3. 1,挖掘待推薦項目包含的興趣;步驟3. 2,根據(jù)待推薦項目包含的興趣,按照步驟2所得社群層次結(jié)構(gòu)查找滿足推薦條件的待推薦社群,將待推薦項目推送到找到的待推薦社群;步驟3. 3,記錄用戶反饋信息并更新社群層次關系。
2.如權(quán)利要求I所述基于潛在社群的信息推薦方法,其特征在于步驟2.2中,判斷新社群是否是被包含的社群的具體實現(xiàn)方式如下,設Iv多興趣社群G,若多興趣社群G被包含,則在包含多興趣社群G的所有社群中,一定存在一個社群G,是其他社群的上位社群;設組合成多興趣社群G的單一興趣社群為gS|,Sii,···,gifi,多興趣社群G指向單一興趣社群瑪,&,,···,& 的鍵分別力4, ·,其中λ為組合成多興趣社群G的單一興趣社群總數(shù);首先定位到單一興趣社群ft,,然后在單一興趣社群Si,及單一興趣社群島,的下位社群中查找鍵:2,若找到,返回鍵^對應的社群Q5 ,沒找到則不存在社群G',結(jié)束查找;再根據(jù)返回的社群查找鍵b ,若社群Gli的興趣集中包含&,則返回社群Gii自身,否則在社群及其下位社群中查找鍵^,找到則返回鍵13對應的社群Gii,沒找到則不存在社群G,,結(jié)束查找;同樣的方法循環(huán),直到查完鍵h,找到則返回鍵、對應的社群q作為社群G',沒找到則不存在社群G',結(jié)束查找;若不存在社群G',則判定多興趣社群G不被包含,若找到社群G',則判斷社群G'的用戶集是否包含多興趣社群G的用戶集,若包含則多興趣社群G是被包含的,否則多興趣社群G不被包含。
3.如權(quán)利要求I所述基于潛在社群的信息推薦方法,其特征在于步驟3.2中,查找滿足推薦條件的待推薦社群的具體方式如下,步驟a,首先將單一興趣社群列表LO中滿足推薦條件的社群加入到推薦社群列表LI 中,將不滿足推薦條件的加入到待推薦社群列表L2中;步驟b,將L2中的社群與L2中的社群組合,得到社群組合結(jié)果;步驟C,將社群組合結(jié)果在社群層次關系中查找到相應的社群加入到社群列表L3 ; 步驟C,將L3中社群與LI中社群進行比較,若包含LI中社群則從L3中剔除;步驟d,判斷L3中社群是否滿足推薦條件,將滿足推薦條件的社群加入到LI中;步驟e,將不滿足推薦條件的社群加入到待推薦社群列表L4中dfL4中的社群繼續(xù)與 L2中的社群組合得到社群組合結(jié)果,返回執(zhí)行步驟b,不斷的循環(huán)下去,直到L3或者L4為空為止。
4.如權(quán)利要求3所述基于潛在社群的信息推薦方法,其特征在于判斷一個社群是否滿足推薦條件,根據(jù)待推薦興趣組合和待推薦社群間相似度決定,計算公式如下,其中,A表示待推薦項目包含的所有興趣構(gòu)成的待推薦興趣組合表示待推薦社群的興趣集,<5是避免出現(xiàn)除零情況的參數(shù),表示待推薦興趣組合和待推薦社群的興趣集的同向度,過爾表示待推薦興趣組合和待推薦社群的興趣集的異向度。
全文摘要
本發(fā)明涉及信息推薦技術(shù)領域,尤其涉及一種基于潛在社群的信息推薦方法。本發(fā)明通過特征發(fā)現(xiàn)技術(shù)從用戶歷史記錄中挖掘出用戶興趣模型,并根據(jù)該模型進行潛在社群發(fā)現(xiàn)并挖掘出社群間的層次關系;然后,通過特征提取從待推薦對象中提取出可能存在的興趣集合,并結(jié)合社群層次結(jié)構(gòu)的特點,快速定位到待推薦社群;最后,計算待推薦社群與待推薦對象興趣集合間的相似度來判斷是否滿足推薦條件。本發(fā)明能夠?qū)崿F(xiàn)靈活的信息批量推送,相比傳統(tǒng)點對點的推薦技術(shù),在效率上有大幅提升;并集成了協(xié)同過濾技術(shù),增加信息推薦的新穎性。
文檔編號G06F17/30GK102609465SQ20121001234
公開日2012年7月25日 申請日期2012年1月16日 優(yōu)先權(quán)日2012年1月16日
發(fā)明者劉洋, 曾承, 賈大文 申請人:武漢大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1