亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于時間窗口興趣主題挖掘的控制方法

文檔序號:6340540閱讀:144來源:國知局
專利名稱:一種基于時間窗口興趣主題挖掘的控制方法
技術(shù)領(lǐng)域
本發(fā)明涉及用戶行為服務(wù)推薦的技術(shù)領(lǐng)域,具體地說是一種從用戶歷史行為發(fā)掘用戶興趣點實現(xiàn)為用戶推薦的算法。
背景技術(shù)
Web已成為人們獲取信息的一個重要途徑,由于Web信息的日益增長,所謂的“信息過載”問題就使得人們不得不花費大量的時間去搜索,瀏覽自己需要的信息。搜索引擎是最普遍的輔助人們檢索信息的工具如Google,Baidu等等。信息檢索技術(shù)滿足了人們一定的需求,但是由于其通用性質(zhì),仍不能滿足不同背景、不同目的和不同時期的查詢請求。尤其在電子商務(wù)領(lǐng)域如Amazon,淘寶等,如何讓用戶方便快捷獲得自己需要的產(chǎn)品,對提高企業(yè)信譽(yù)和盈利的關(guān)鍵,同時用戶的體驗也是吸引長久用戶存在的根本。個性化推薦技術(shù)就是針對這個問題而提出的,它為不同用戶提供不同的服務(wù),以滿足不同的需求。因此個性化的概念和相關(guān)研究應(yīng)運而生。對推薦系統(tǒng)的商業(yè)研究和學(xué)術(shù)研究吸引了非常多研究者的目光,到目前為止也已經(jīng)提出了很多經(jīng)典的理論如協(xié)同過濾技術(shù)(Collaborative Filtering),基于內(nèi)容的過濾(Content-based Filtering)。協(xié)同過濾技術(shù)是基于用戶對項目的顯示評分進(jìn)行,它的優(yōu)點是能夠?qū)﹄y以表達(dá)的概念進(jìn)行過濾,缺點是需要用戶主動顯示去對項目進(jìn)行評分?;趦?nèi)容的過濾是主要對用戶對項目的描述信息,利用文本處理技術(shù)來進(jìn)行分析,它的優(yōu)點是能比較準(zhǔn)確給用戶以推薦,同時它的缺陷是對文本處理需要比較高的要求,通常是通過提取關(guān)鍵字來建立相關(guān)模型進(jìn)行分析,所花費時間復(fù)雜度比較高。隨著0技術(shù)的發(fā)展,用戶已從傳統(tǒng)的網(wǎng)絡(luò)信息的接收者轉(zhuǎn)變?yōu)榫W(wǎng)絡(luò)內(nèi)容的創(chuàng)造者,用戶可以給自己感興趣的項目進(jìn)行自由標(biāo)注,產(chǎn)生的標(biāo)注用戶可以在任何地點和任何機(jī)器上都可以隨時訪問到,而不同于傳統(tǒng)收藏夾只能在本地進(jìn)行瀏覽,這是協(xié)同標(biāo)注系統(tǒng)產(chǎn)生和發(fā)展的原因。如何在社會關(guān)系網(wǎng)(Social Network)禾口協(xié)、同標(biāo)記系統(tǒng)(Collaborative Tagging System)中估戈推薦成為目前推薦系統(tǒng)的兩個新的熱點。首先,推薦系統(tǒng)的兩個主要的思想和假設(shè)就是1.相似的用戶會有相似的喜好,可通過相似用戶的記錄來為當(dāng)前用戶推薦;2.用戶之前喜歡的其之后很可能還是感興趣的?;趨f(xié)同標(biāo)注的方法可以反映用戶的興趣行為,在協(xié)同標(biāo)注系統(tǒng)中用戶可以簡單地通過對其項目進(jìn)行標(biāo)注,也可以通過其標(biāo)注進(jìn)行搜索自己感興趣的以及瀏覽其他用戶的與之相關(guān)項目。因為用戶的標(biāo)注可以反映用戶的興趣,而且用戶可能存在多個興趣點,所以對用戶進(jìn)行興趣點的發(fā)掘?qū)τ脩舢a(chǎn)生推薦具有很高的價值。對個體用戶的標(biāo)注項目的記錄以及社會對項目的標(biāo)注記錄進(jìn)行分析來發(fā)現(xiàn)用戶的興趣,它實時性高、資源開銷小,雖然用戶的部分標(biāo)注存在很大的精度,但是結(jié)合社會關(guān)系網(wǎng)可以改善用戶的標(biāo)注質(zhì)量,來提升推薦精度和準(zhǔn)確度。

發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明的目的是提供一種基于時間窗口興趣主題挖掘的控制方法以及相應(yīng)的控制裝置。根據(jù)本發(fā)明的一個方面,提供基于時間窗口興趣主題挖掘的控制方法,包括步驟a.確定用戶標(biāo)注記錄和社會標(biāo)注記錄;b.根據(jù)所述用戶標(biāo)注記錄和社會標(biāo)注記錄確定標(biāo)準(zhǔn)標(biāo)注記錄;c.根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄生成用戶興趣主題樹;d.建立窗口并確定所述窗口與所述主題樹的對應(yīng)關(guān)系;e.根據(jù)所述對應(yīng)關(guān)系計算所述主題樹的權(quán)重。根據(jù)本發(fā)明的另一個方面,還提供基于時間窗口興趣主題挖掘的控制裝置,包括裝置第一確定裝置,其用于確定用戶標(biāo)注記錄和社會標(biāo)注記錄;第二確定裝置,其用于根據(jù)所述用戶標(biāo)注記錄和社會標(biāo)注記錄確定標(biāo)準(zhǔn)標(biāo)注記錄;第一生成裝置,其用于根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄生成用戶興趣主題樹;第一處理裝置,其用于建立窗口并確定所述窗口與所述主題樹的對應(yīng)關(guān)系;第一計算裝置,其用于根據(jù)所述對應(yīng)關(guān)系計算所述主題樹的權(quán)重。本發(fā)明的目的是提供一種基于時間窗口興趣主題挖掘算法,該方法是對用戶的歷史標(biāo)注記錄和社會標(biāo)注進(jìn)行分析,對用戶的標(biāo)注建立層次樹,每棵樹代表用戶的一個興趣點,然后引入時間窗口權(quán)重來對興趣點進(jìn)行,這樣排序后的興趣點可以準(zhǔn)確實時反映用戶的興趣的多樣性和偏向性。本發(fā)明的目的是這樣實現(xiàn)的一種基于時間窗口興趣主題挖掘算法,該算法需要對用戶的歷史標(biāo)注和社會標(biāo)注記錄來進(jìn)行分析,對用戶的個人的歷史標(biāo)注記錄中用戶頻繁使用的標(biāo)注是用戶的基本興趣層次樹的根,社會的歷史標(biāo)注記錄來對用戶的標(biāo)注質(zhì)量進(jìn)行改善,然后通過興趣層次樹的根和其他標(biāo)注的關(guān)系建立用戶興趣樹,最后通過利用興趣點層次樹在協(xié)同標(biāo)注系統(tǒng)中進(jìn)行檢索形成推薦。具體操作步驟第一步通過網(wǎng)頁分析提取用戶標(biāo)注記錄和社會標(biāo)注記錄;第二步衡量用戶標(biāo)注記錄的質(zhì)量值;第三步根據(jù)用戶標(biāo)注記錄的質(zhì)量值來對用戶記錄進(jìn)行處理。如果用戶的標(biāo)注記錄的質(zhì)量值高于社會標(biāo)注記錄的質(zhì)量值,則用用戶的個人標(biāo)注記錄作為標(biāo)準(zhǔn)標(biāo)注記錄,否則使用社會標(biāo)注記錄作為標(biāo)準(zhǔn)標(biāo)注記錄,最后將標(biāo)準(zhǔn)標(biāo)注記錄確定為用戶的標(biāo)注記錄。第四步統(tǒng)計用戶關(guān)鍵字的使用頻率,并進(jìn)行排序;第五步應(yīng)用先驗概率公式來進(jìn)行建立用戶興趣主題樹;第六步對用戶使用推薦系統(tǒng)時間大小進(jìn)行分窗口 ;第七步結(jié)合所分窗口,計算各窗口的權(quán)重;第八步對用戶興趣主題樹進(jìn)行遍歷,將其映射到各窗口中,形成興趣主題樹和窗口的對應(yīng)關(guān)系;第九步計算用戶興趣主題樹權(quán)重,并對其進(jìn)行排序第十步取TOP-N用戶興趣主題樹,進(jìn)行資源的相關(guān)檢索和推薦;本發(fā)明進(jìn)一步特征在于第三步和第七步,使用先驗概率來建立層次樹,并且將用戶個性化標(biāo)注和社會標(biāo)注進(jìn)行結(jié)合。與背景技術(shù)相比,本發(fā)明有以下優(yōu)點(1)、易行性不需要參考大量用戶的比較計算。只需要對抓取的各個用戶進(jìn)行單獨的歷史標(biāo)注記錄的分析。不像傳統(tǒng)的協(xié)同過濾需要進(jìn)行大量鄰居用戶的尋找,然后才能進(jìn)行預(yù)測其興趣愛好。同時不像基于內(nèi)容的特征提取,需要引進(jìn)文本和語義的處理
O)、簡單性本算法根據(jù)用戶的各標(biāo)注頻率,利用了先驗概率公式來建立興趣主題樹,只需要掃描用戶的各個項目的標(biāo)注記錄,同樣使用社會標(biāo)注記錄可以通過其項目的JSON文件獲得,對標(biāo)注質(zhì)量比較低的用戶即使用社會標(biāo)注來進(jìn)行替代,有利于提升搜索時對用戶產(chǎn)生的推薦精度。(3)、個性化和社會化結(jié)合。在協(xié)同標(biāo)注的系統(tǒng)中,用戶標(biāo)注的記錄具有各自的特征,能夠準(zhǔn)確反映用戶的個性,但是由于標(biāo)注的自由性,用戶的標(biāo)注可能存在質(zhì)量缺陷。而社會標(biāo)注則是社會大部分人共同認(rèn)可的,具有一定的可信性。在對部分用戶用社會化的標(biāo)簽代替?zhèn)€人的標(biāo)簽,對推薦準(zhǔn)確度會有一定的提升。使得全體用戶在不失個性化的前提下,又具有社會性。


通過閱讀參照以下附圖對非限制性實施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯圖1示出根據(jù)本發(fā)明的第一實施例的,基于時間窗口興趣主題挖掘的控制方法的流程圖;圖2示出根據(jù)本發(fā)明的第二實施例的,基于時間窗口興趣主題挖掘的控制方法的流程圖;圖3示出根據(jù)本發(fā)明的第三實施例的,基于時間窗口興趣主題挖掘的控制裝置的結(jié)構(gòu)圖;圖4示出根據(jù)本發(fā)明的一個具體實施方式
的,基于時間窗口興趣主題挖掘的控制方法的原理示意圖;圖5示出根據(jù)本發(fā)明的另一個具體實施方式
的,基于時間窗口興趣主題挖掘的控制方法的原理示意圖;圖6示出根據(jù)本發(fā)明的一個具體實施方式
的,基于用戶興趣主題樹的挖掘控制方法的示意圖;圖7示出根據(jù)本發(fā)明的一個具體實施方式
的,基于時間窗口劃分主題挖掘的控制方法,主要是對挖掘出的用戶興趣主題樹進(jìn)行排序,發(fā)現(xiàn)用戶的最近真正感興趣的主題樹,這樣對最后的用戶推薦才能顯得更加的準(zhǔn)確。首先,將用戶使用該系統(tǒng)的時間按時間段進(jìn)行劃分,這樣用戶的時間就被劃分成了許多的小的時間窗口,同時對劃分的窗口進(jìn)行編號從1開始一次遞增,窗口的編號是遵循這樣的原則,用戶最近的標(biāo)注記錄是處在小窗口編號中,過去的標(biāo)注記錄建立的主題樹必定處在大窗口號的窗口中。然后將用戶的挖掘的出的興趣主題樹的支持集映射至剛才劃分的窗口中,計算相應(yīng)主題樹在窗口中的權(quán)重大小,然后為下面的TOP-N主題樹的選取提供依據(jù)。
具體實施例方式本發(fā)明公開了一種基于時間窗口興趣主題挖掘算法,本發(fā)明需要在一個實際的推薦系統(tǒng)環(huán)境中,通過對用戶項目的歷史標(biāo)注記錄和社會對該項目的標(biāo)注的記錄進(jìn)行抓取和分析,得到用戶的興趣主題樹,對其映射到時間窗口中,依此對各其進(jìn)行排序,然后對其興趣主題樹檢索資源。分析過程簡單,無需復(fù)雜算法;能夠?qū)崟r反應(yīng)用戶興趣,并給出較準(zhǔn)確的預(yù)測;將用戶個性化與社會化相結(jié)合,使得預(yù)測興趣更接近用戶真實預(yù)測。參考圖4以及圖5,本發(fā)明需要在一個實際的推薦系統(tǒng)環(huán)境中,通過對用戶項目的歷史標(biāo)注記錄和社會對該項目的標(biāo)注的記錄進(jìn)行抓取和分析,得到用戶的興趣主題樹,對其映射到時間窗口中,依此對各其進(jìn)行排序,所述的用戶興趣主題樹的建立方法,是考慮通過統(tǒng)計用戶關(guān)鍵字使用頻率,同時引入用戶標(biāo)注記錄質(zhì)量值的概念,對用戶的標(biāo)注記錄進(jìn)行相關(guān)的處理來提高用戶標(biāo)注記錄的質(zhì)量,然后,應(yīng)用先驗概率公式來判斷各關(guān)鍵字所屬層次關(guān)系,建立用戶興趣主題樹。所述的窗口大小劃分對其用戶興趣主題樹進(jìn)行映射,是考慮用戶興趣主題樹對用戶的相對重要性,根據(jù)協(xié)同過濾原理用戶對其過去感興趣的項目,在將來也有可能同樣感興趣。同時用戶的興趣存在多樣性,需對其最近感興趣的提高相應(yīng)權(quán)重,通過調(diào)整各用戶興趣主題樹來得到最后的序列進(jìn)行檢索和推薦,這樣會提高推薦的準(zhǔn)確性圖1示出根據(jù)本發(fā)明的第一實施例的,基于時間窗口興趣主題挖掘的控制方法的流程圖。具體地,在本實施例中,首先執(zhí)行步驟S210,確定用戶標(biāo)注記錄和社會標(biāo)注記錄。然后執(zhí)行步驟S211,根據(jù)所述用戶標(biāo)注記錄和社會標(biāo)注記錄確定標(biāo)準(zhǔn)標(biāo)注記錄。然后執(zhí)行步驟S212,根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄生成用戶興趣主題樹。然后執(zhí)行步驟S213,建立窗口并確定所述窗口與所述主題樹的對應(yīng)關(guān)系。然后執(zhí)行步驟S214,根據(jù)所述對應(yīng)關(guān)系計算所述主題樹的權(quán)重。然后執(zhí)行步驟S215,根據(jù)所述權(quán)重對所述主題樹進(jìn)行排序。最后執(zhí)行步驟S216,將與排序位置靠前的若干主題樹對應(yīng)的內(nèi)容推薦給用戶。在本實施例的一個變化例中,所述步驟S215以及步驟S216可以被省略。圖2示出根據(jù)本發(fā)明的第二實施例的,基于時間窗口興趣主題挖掘的控制方法的流程圖。本領(lǐng)域技術(shù)人員理解,可以將本實施理解為圖1所示實施例的一個具體實施方式
。具體地,在本實施例中,首先執(zhí)行步驟S220,從網(wǎng)頁中提取所述用戶標(biāo)注記錄和社會標(biāo)注記錄。然后執(zhí)行步驟S221,判斷所述用戶標(biāo)注記錄的質(zhì)量值是否大于所述社會標(biāo)注記錄的質(zhì)量值。進(jìn)一步地,若所述步驟S221的判斷結(jié)果是肯定的,即所述用戶標(biāo)注記錄的質(zhì)量值大于所述社會標(biāo)注記錄的質(zhì)量值,則接下來進(jìn)入步驟S2221繼續(xù)執(zhí)行;若所述步驟S221的判斷結(jié)果是否定的,即所述用戶標(biāo)注記錄的質(zhì)量值不大于所述社會標(biāo)注記錄的質(zhì)量值,則接下來進(jìn)入步驟S2222繼續(xù)執(zhí)行。其中,通過執(zhí)行步驟S2221,將所述用戶標(biāo)注記錄確定為所述標(biāo)準(zhǔn)標(biāo)注記錄。其中,通過執(zhí)行步驟S2222,將所述社會標(biāo)注記錄確定為所述標(biāo)準(zhǔn)標(biāo)注記錄。然后執(zhí)行步驟S223,根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄確定關(guān)鍵詞。然后執(zhí)行步驟S2M,統(tǒng)計所述關(guān)鍵詞的使用頻率生成頻率排序結(jié)果。然后執(zhí)行步驟S225,根據(jù)所述頻率排序結(jié)果建立所述用戶興趣樹。然后執(zhí)行步驟,對用戶使用時間大小進(jìn)行分窗口。然后執(zhí)行步驟S227,結(jié)合所有分窗口,計算各窗口的權(quán)重。然后執(zhí)行步驟,對所述用戶興趣樹進(jìn)行遍歷,將其映射到各窗口中。最后執(zhí)行步驟,根據(jù)所述對應(yīng)關(guān)系計算所述主題樹的權(quán)重。本領(lǐng)域技術(shù)人員可以將所述步驟S220理解為圖1中的所述步驟S210的具體實施方式
;將所述步驟S221、步驟S2221以及步驟S2222理解為圖1中的所述步驟S211的具體實施方式
;將所述步驟S223、步驟S2M以及步驟S225理解為圖1中的所述步驟S212的具體實施方式
;將所述步驟、步驟S227以及步驟理解為圖1中的所述步驟S213的具體實施方式
。在本實施例的一個優(yōu)選例中,所述步驟S220包括步驟“確定用戶中標(biāo)注記錄的質(zhì)量值”、以及步驟“設(shè)定標(biāo)準(zhǔn)標(biāo)注記錄的質(zhì)量值以及確定標(biāo)準(zhǔn)標(biāo)注記錄”。在本實施例的另一個優(yōu)選例中,所述步驟S225包括步驟“應(yīng)用先驗概率公式建立所述用戶興趣樹”。圖3示出根據(jù)本發(fā)明的第三實施例的,基于時間窗口興趣主題挖掘的控制裝置的結(jié)構(gòu)圖。具體地,在本實施例中,所述控制裝置4包括第一確定裝置41,其用于確定用戶標(biāo)注記錄和社會標(biāo)注記錄;第二確定裝置42,其用于根據(jù)所述用戶標(biāo)注記錄和社會標(biāo)注記錄確定標(biāo)準(zhǔn)標(biāo)注記錄;第一生成裝置43,其用于根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄生成用戶興趣主題樹;第一處理裝置44,其用于建立窗口并確定所述窗口與所述主題樹的對應(yīng)關(guān)系;第一計算裝置45,其用于根據(jù)所述對應(yīng)關(guān)系計算所述主題樹的權(quán)重。優(yōu)選地,還可以包括第一排序裝置46,其用于根據(jù)所述權(quán)重對所述主題樹進(jìn)行排序;第一推薦裝置47,其用于將與排序位置靠前的若干主題樹對應(yīng)的內(nèi)容推薦給用戶。優(yōu)選地,所述第一確定裝置41包括第一提取裝置,其用于從網(wǎng)頁中提取所述用戶標(biāo)注記錄和社會標(biāo)注記錄。優(yōu)選地,所述第二確定裝置42包括第一判斷裝置421,其用于判斷所述用戶標(biāo)注記錄的質(zhì)量值是否大于所述社會標(biāo)注記錄的質(zhì)量值;第三確定裝置422,其用于當(dāng)所述第一判斷裝置的判斷結(jié)果是肯定的時,將所述用戶標(biāo)注記錄確定為所述標(biāo)準(zhǔn)標(biāo)注記錄;第四確定裝置423,其用于當(dāng)所述第一判斷裝置的判斷結(jié)果是否定的時,將所述社會標(biāo)注記錄確定為所述標(biāo)準(zhǔn)標(biāo)注記錄。優(yōu)選地,所述第一生成裝置43包括第五確定裝置431,其用于根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄確定關(guān)鍵詞;第二處理裝置432,其用于統(tǒng)計所述關(guān)鍵詞的使用頻率生成頻率排序結(jié)果;第一建立裝置433,其用于根據(jù)所述頻率排序結(jié)果建立所述用戶興趣樹。優(yōu)選地,所述第一處理裝置44包括第三處理裝置441,其用于對用戶使用時間大小進(jìn)行分窗口 ;第二計算裝置442,其用于結(jié)合所有分窗口,計算各窗口的權(quán)重;第四處理裝置443,其用于對所述用戶興趣樹進(jìn)行遍歷,將其映射到各窗口中。在本實施例的一個優(yōu)選例中,所述第一提取裝置411包括第六確定裝置,其用于確定用戶的標(biāo)注記錄的質(zhì)量值;第一獲取裝置,其用于從網(wǎng)頁中獲取所述用戶標(biāo)注記錄和社會標(biāo)注記錄。在本實施例的另一個優(yōu)選例中,所述第一建立裝置433包括第二建立裝置,其用于應(yīng)用先驗概率公式建立所述用戶興趣樹。進(jìn)一步地,圖4示出根據(jù)本發(fā)明的一個具體實施方式
的,基于時間窗口興趣主題挖掘的控制方法的示意圖。首先我們從網(wǎng)頁中獲取所有用戶資源的標(biāo)注記錄和其社會標(biāo)注記錄,從而建立系統(tǒng)資源數(shù)據(jù)庫,然后對其用戶進(jìn)行個人數(shù)據(jù)加載和分析,計算用戶標(biāo)注記錄的質(zhì)量值來確定標(biāo)準(zhǔn)標(biāo)注記錄,如果用戶的標(biāo)注記錄的質(zhì)量值高于社會標(biāo)注記錄的質(zhì)量值,則用用戶的個人標(biāo)注記錄作為標(biāo)準(zhǔn)標(biāo)注記錄,否則使用社會標(biāo)注記錄作為標(biāo)準(zhǔn)標(biāo)注記錄,從而將標(biāo)準(zhǔn)標(biāo)注記錄確定為用戶的標(biāo)注記錄。其次,通過確定后的用戶標(biāo)注記錄來為用戶建立用戶興趣主題樹,從而為用戶建立模型,最后將興趣主題樹映射至?xí)r間窗口,同時計算各窗口的權(quán)重,對其用戶興趣主題樹排序,選取排名靠前的興趣主題樹到系統(tǒng)資源數(shù)據(jù)庫進(jìn)行資源檢索,將其檢索結(jié)果的TOP-N推薦給用戶。進(jìn)一步地,圖5示出根據(jù)本發(fā)明的另一個具體實施方式
的,基于時間窗口興趣主題挖掘的控制方法的示意圖。本領(lǐng)域技術(shù)人員理解,本圖5所示實施方式與圖2所示實施例可以通過類似的方式予以實現(xiàn)。例如,圖5所示步驟1 9可以參考圖2所示各步驟予以實現(xiàn),在此不予贅述。進(jìn)一步地,圖5所示實施方式還包括步驟10,即“計算各興趣主題樹的權(quán)重,并對其排序”,然后執(zhí)行步驟11 “取TOP-N用戶興趣主題樹,進(jìn)行資源的相關(guān)檢索”,最后進(jìn)入步驟12 “推薦資源”。本領(lǐng)域技術(shù)人員理解,上述步驟11可以通過如下方式實現(xiàn)通過該用戶對其資源的標(biāo)注記錄和對應(yīng)資源的社會標(biāo)注記錄計算用戶標(biāo)注記錄的質(zhì)量值,具體計算如下首先通過用戶某一資源標(biāo)注記錄和相應(yīng)資源的社會記錄進(jìn)行交集標(biāo)注數(shù)除以其并集的標(biāo)注數(shù)作為該資源的標(biāo)注記錄質(zhì)量,然后依此同樣方法計算出該用戶的所有資源的標(biāo)注記錄值,最后通過該用戶其所有資源標(biāo)注記錄值的平均值作為該用戶的標(biāo)注記錄質(zhì)量值,通過其和社會標(biāo)注的記錄質(zhì)量值比較來確定標(biāo)準(zhǔn)標(biāo)注記錄。比如一個用戶對一個資源的標(biāo)注如下ItemJJseHtag1, tag2, tag3, tag4)同時該資源的社會標(biāo)注記錄是 Item_Social (tag1 tag3,tag5, tag6),則該用戶對該資源的標(biāo)注質(zhì)量值是
權(quán)利要求
1.一種基于時間窗ロ興趣主題挖掘的控制方法,其特征在干,包括如下步驟a.確定用戶標(biāo)注記錄和社會標(biāo)注記錄;b.根據(jù)所述用戶標(biāo)注記錄和社會標(biāo)注記錄確定標(biāo)準(zhǔn)標(biāo)注記錄;c.根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄生成用戶興趣主題樹;d.建立窗ロ并確定所述窗ロ與所述主題樹的對應(yīng)關(guān)系;e.根據(jù)所述對應(yīng)關(guān)系計算所述主題樹的權(quán)重。
2.根據(jù)權(quán)利要求1所述的控制方法,其特征在干,所述步驟a包括如下步驟 al.從網(wǎng)頁中提取所述用戶標(biāo)注記錄和社會標(biāo)注記錄。
3.根據(jù)權(quán)利要求1或2所述的控制方法,其特征在干,所述步驟b包括如下步驟 bl.判斷所述用戶標(biāo)注記錄的質(zhì)量值是否大于所述社會標(biāo)注記錄的質(zhì)量值;b2.若所述步驟bl的判斷結(jié)果是肯定的,則將所述用戶標(biāo)注記錄確定為所述標(biāo)準(zhǔn)標(biāo)注記錄;b2'.若所述步驟bl的判斷結(jié)果是否定的,則將所述社會標(biāo)注記錄確定為所述標(biāo)準(zhǔn)標(biāo)注記錄。
4.根據(jù)權(quán)利要求1至3中任一項所述的控制方法,其特征在干,所述步驟c包括如下步驟cl.根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄確定關(guān)鍵詞;c2.統(tǒng)計所述關(guān)鍵詞的使用頻率生成頻率排序結(jié)果;c3.根據(jù)所述頻率排序結(jié)果建立所述用戶興趣樹。
5.根據(jù)權(quán)利要求4所述的控制方法,其特征在干,所述步驟c3包括如下步驟 c31.應(yīng)用先驗概率公式建立所述用戶興趣樹。
6.根據(jù)權(quán)利要求1至5中任一項所述的控制方法,其特征在干,所述步驟d包括如下步驟dl.對用戶使用時間大小進(jìn)行分窗ロ ;d2.結(jié)合所有分窗ロ,計算各窗ロ的權(quán)重;d3.對所述用戶興趣樹進(jìn)行遍歷,將其映射到各窗ロ中。
7.根據(jù)權(quán)利要求1至6中任一項所述的控制方法,其特征在于,還包括如下步驟f.根據(jù)所述權(quán)重對所述主題樹進(jìn)行排序;g.將與排序位置靠前的若干主題樹對應(yīng)的內(nèi)容推薦給用戶。
8.根據(jù)權(quán)利要求2至7中任一項所述的控制方法,其特征在干,所述步驟al包括如下步驟all.從網(wǎng)頁中獲取個人標(biāo)注記錄;al2.從網(wǎng)頁中獲取和用戶對應(yīng)資源的社會標(biāo)注記錄。
9.一種基于時間窗ロ興趣主題挖掘的控制裝置,其特征在干,包括如下裝置 第一確定裝置,其用于確定用戶標(biāo)注記錄和社會標(biāo)注記錄;第二確定裝置,其用于根據(jù)所述用戶標(biāo)注記錄和社會標(biāo)注記錄確定標(biāo)準(zhǔn)標(biāo)注記錄; 第一生成裝置,其用于根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄生成用戶興趣主題樹; 第一處理裝置,其用于建立窗ロ并確定所述窗ロ與所述主題樹的對應(yīng)關(guān)系; 第一計算裝置,其用于根據(jù)所述對應(yīng)關(guān)系計算所述主題樹的權(quán)重。
10.根據(jù)權(quán)利要求8所述的控制裝置,其特征在干,所述第一確定裝置包括如下裝置 第一提取裝置,其用于從網(wǎng)頁中提取所述用戶標(biāo)注記錄和社會標(biāo)注記錄。
11.根據(jù)權(quán)利要求8或9所述的控制裝置,其特征在干,所述第二確定裝置包括如下裝置第一判斷裝置,其用于判斷所述用戶標(biāo)注記錄的質(zhì)量值是否大于所述社會標(biāo)注記錄的質(zhì)量值;第三確定裝置,其用于當(dāng)所述第一判斷裝置的判斷結(jié)果是肯定的吋,將所述用戶標(biāo)注記錄確定為所述標(biāo)準(zhǔn)標(biāo)注記錄;第四確定裝置,其用于當(dāng)所述第一判斷裝置的判斷結(jié)果是否定的吋,將所述社會標(biāo)注記錄確定為所述標(biāo)準(zhǔn)標(biāo)注記錄。
12.根據(jù)權(quán)利要求9至11中任一項所述的控制裝置,其特征在干,所述第一生成裝置包括如下裝置第五確定裝置,其用于根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄確定關(guān)鍵詞; 第二處理裝置,其用于統(tǒng)計所述關(guān)鍵詞的使用頻率生成頻率排序結(jié)果; 第一建立裝置,其用于根據(jù)所述頻率排序結(jié)果建立所述用戶興趣樹。
13.根據(jù)權(quán)利要求12所述的控制裝置,其特征在干,所述第一建立裝置包括如下裝置 第二建立裝置,其用于應(yīng)用先驗概率公式建立所述用戶興趣樹。
14.根據(jù)權(quán)利要求9至13中任一項所述的控制裝置,其特征在干,所述第一處理裝置包括如下裝置第三處理裝置,其用于對用戶使用時間大小進(jìn)行分窗ロ ;第二計算裝置,其用于結(jié)合所有分窗ロ,計算各窗ロ的權(quán)重;第四處理裝置,其用于對所述用戶興趣樹進(jìn)行遍歷,將其映射到各窗口中。
15.根據(jù)權(quán)利要求9至14中任一項所述的控制裝置,其特征在于,還包括如下裝置 第一排序裝置,其用于根據(jù)所述權(quán)重對所述主題樹進(jìn)行排序;第一推薦裝置,其用于將與排序位置靠前的若干主題樹對應(yīng)的內(nèi)容推薦給用戶。
全文摘要
本發(fā)明提供基于時間窗口興趣主題挖掘的控制方法,包括步驟a.確定用戶標(biāo)注記錄和社會標(biāo)注記錄;b.根據(jù)所述用戶標(biāo)注記錄和社會標(biāo)注記錄確定標(biāo)準(zhǔn)標(biāo)注記錄;c.根據(jù)所述標(biāo)準(zhǔn)標(biāo)注記錄生成用戶興趣主題樹;d.建立窗口并確定所述窗口與所述主題樹的對應(yīng)關(guān)系;e.根據(jù)所述對應(yīng)關(guān)系計算所述主題樹的權(quán)重。還提供相應(yīng)的控制裝置。本發(fā)明不需要參考大量用戶的比較計算;利用了先驗概率公式來建立興趣主題樹,只需要掃描用戶的各個項目的標(biāo)注記錄;在協(xié)同標(biāo)注的系統(tǒng)中,用戶標(biāo)注的記錄具有各自的特征,能夠準(zhǔn)確反映用戶的個性。使得全體用戶在不失個性化的前提下,又具有社會性。
文檔編號G06F17/30GK102567392SQ20101061384
公開日2012年7月11日 申請日期2010年12月24日 優(yōu)先權(quán)日2010年12月24日
發(fā)明者何克勤, 張波, 林欣, 滕躍, 肖潔, 賀樑 申請人:華東師范大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1