監(jiān)測感興趣主題的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種監(jiān)測感興趣主題的方法和系統(tǒng),該方法包括:基于感興趣主題的第一集合,選擇參與所述第一集合中的一個或多個感興趣主題的至少一個關(guān)鍵節(jié)點組成的關(guān)鍵節(jié)點的組;以及監(jiān)視所述組中的一個或多個關(guān)鍵節(jié)點所發(fā)布的內(nèi)容,以找到感興趣主題的第二集合。根據(jù)本發(fā)明的各個實施例,通過基于感興趣主題的第一集合,選擇參與第一集合中的一個或多個感興趣主題的關(guān)鍵節(jié)點的組,作為要監(jiān)視的對象,從而相比于監(jiān)視所有用戶節(jié)點而減少了要監(jiān)視的節(jié)點所發(fā)布的內(nèi)容的數(shù)量,使得能夠高效、低成本和實時地找到諸如熱點新聞或熱點事件的感興趣主題。
【專利說明】監(jiān)測感興趣主題的方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及監(jiān)測感興趣主題的方法和系統(tǒng),更具體地,涉及一種在社交網(wǎng)絡(luò)中通 過選擇關(guān)鍵節(jié)點來監(jiān)測感興趣主題的方法和系統(tǒng)。
【背景技術(shù)】
[0002] 隨著諸如Twitter、微博等社交網(wǎng)絡(luò)的出現(xiàn),人與人之間的信息分享和交流變得越 來越方便。人們可以在社交網(wǎng)絡(luò)上發(fā)表帖子、轉(zhuǎn)發(fā)或評論別人發(fā)表的帖子,從而與他人分享 新聞或?qū)崟r事件的信息,并交換他們的看法。據(jù)稱,Twitter具有超過約5億的活躍用戶, 且每天廣生超過約3. 4億的tweet帖子,而新浪微博也具有超過約3億的注冊用戶,且每天 產(chǎn)生約1億條微博。監(jiān)測這些帖子或微博中的熱點新聞或事件可以幫助決策者更好地了解 公眾意愿和商業(yè)趨勢等等,但是,如何在如此巨大的帖子或微博量中監(jiān)測諸如熱點新聞或 事件的感興趣主題成為難題。傳統(tǒng)的感興趣主題的監(jiān)測是通過提取全部用戶節(jié)點的全部帖 子或微博,從所有帖子或微博中進行內(nèi)容處理、例如關(guān)鍵字檢測等,來找到諸如熱點新聞或 事件的感興趣主題,然而,這樣的大數(shù)量的內(nèi)容處理耗時且低效。
【發(fā)明內(nèi)容】
[0003] 根據(jù)本發(fā)明的一個方面,提供了一種監(jiān)測感興趣主題的方法,包括:基于感興趣主 題的第一集合,選擇參與所述第一集合中的一個或多個感興趣主題的至少一個關(guān)鍵節(jié)點來 組成關(guān)鍵節(jié)點的組;以及監(jiān)視所述組中的一個或多個關(guān)鍵節(jié)點所發(fā)布的內(nèi)容,以找到感興 趣主題的第二集合。
[0004]根據(jù)本發(fā)明的另一個方面,提供了一種監(jiān)測感興趣主題的系統(tǒng),包括:選擇裝置, 被配置為基于感興趣主題的第一集合,選擇參與所述第一集合中的一個或多個感興趣主題 的至少一個關(guān)鍵節(jié)點來組成關(guān)鍵節(jié)點的組;以及監(jiān)視裝置,被配置為監(jiān)視所述組中的一個 或多個關(guān)鍵節(jié)點所發(fā)布的內(nèi)容,以找到感興趣主題的第二集合。
[0005]根據(jù)本發(fā)明的各個方面,通過基于感興趣主題的第一集合,選擇參與第一集合中 的一個或多個感興趣主題的至少一個關(guān)鍵節(jié)點來組成關(guān)鍵節(jié)點的組,作為要監(jiān)視的對象, 從而相比于監(jiān)視所有用戶節(jié)點而減少了要監(jiān)視的節(jié)點所發(fā)布的內(nèi)容的數(shù)量,使得能夠高 效、低成本和實時地找到諸如熱點新聞或熱點事件的感興趣主題。
【專利附圖】
【附圖說明】
[0006]通過結(jié)合附圖對本公開示例性實施方式進行更詳細(xì)的描述,本公開的上述以及其 它目的、特征和優(yōu)勢將變得更加明顯,其中,在本公開示例性實施方式中,相同的參考標(biāo)號 通常代表相同部件。
[0007]圖1示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算機系統(tǒng)/服務(wù)器12的框 圖。
[000S]圖2示出了根據(jù)本發(fā)明的一個實施例的監(jiān)測感興趣主題的方法的流程圖。
[0009]圖3示出了應(yīng)用圖2所示的監(jiān)測感興趣主題的方法的框架示意例子。 _〇]圖4示出了應(yīng)用圖2所示的監(jiān)測感興趣主題的方法的時序示意例子。
[0011]圖5示出了根據(jù)本發(fā)明的另一個實施例的監(jiān)測感興趣主題的系統(tǒng)的方框圖。
【具體實施方式】
[0012] &下面將參照附圖更詳細(xì)地描述本公開的優(yōu)選實施方式。雖然附圖中顯示了本公開 的優(yōu)選實施方式,然而應(yīng)該理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施方 式所限制。相反,提供這些實施方式是為了使本公開更加透徹和完整,并且能夠?qū)⒈竟_的 泡圍兀1整地傳達給本領(lǐng)域的技術(shù)人員。
[0013]所屬【技術(shù)領(lǐng)域】的技術(shù)人員知道,本發(fā)明可以實現(xiàn)為系統(tǒng)、方法或計算機程序產(chǎn)品。 因此,本公開可以具體實現(xiàn)為以下形式,g卩:可以是完全的硬件、也可以是完全的軟件(包括 固件、駐留軟件、微代碼等),還可以是硬件和軟件結(jié)合的形式,本文一般稱為"電路"、"模 塊"或"系統(tǒng)"。此外,在一些實施例中,本發(fā)明還可以實現(xiàn)為在一個或多個計算機可讀介質(zhì) 中的計算機程^產(chǎn)品的形式,該計算機可讀介質(zhì)中包含計算機可讀的程序代碼。
[00M]可以采用一個或多個計算機可讀的介質(zhì)的任意組合。計算機可讀介質(zhì)可以是計 算機可讀信號介質(zhì)或者計算機可讀存儲介質(zhì)。計算機可讀存儲介質(zhì)例如可以是--但不限 于-電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算 機可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導(dǎo)線的電連接、便 攜式計算機磁盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(R0M)、可擦式可編程只讀存儲 器(EPROM或閃存)、光纖、便攜式緊湊磁盤只讀存儲器( CD_R〇M)、光存儲器件、磁存儲器件、 或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質(zhì)可以是任何包含或存儲程 序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
[0015]計算機可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號, 其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括--但 不限于-電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質(zhì)還可以是 計算機可讀存儲介質(zhì)以外的任何計算機可讀介質(zhì),該計算機可讀介質(zhì)可以發(fā)送、傳播或者 傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
[0016] 計算機可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括--但不限 于--無線、電線、光纜、RF等等,或者上述的任意合適的組合。
[0017]可以以一種或多種程序設(shè)計語言或其組合來編寫用于執(zhí)行本發(fā)明操作的計算機 程序代碼,所述程序設(shè)計語言包括面向?qū)ο蟮某绦蛟O(shè)計語言一諸如Java、Smalltalk、C++, 還包括常規(guī)的過程式程序設(shè)計語言一諸如" C"語言或類似的程序設(shè)計語言。程序代碼可以 完全地在用戶計算機上執(zhí)行、部分地在用戶計算機上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部 分在用戶計算機上部分在遠程計算機上執(zhí)行、或者完全在遠程計算機或服務(wù)器上執(zhí)行。在 涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網(wǎng)絡(luò)-包括局域網(wǎng)(LAN)或 廣域網(wǎng)(WAN)-連接到用戶計算機,或者,可以連接到外部計算機(例如利用因特網(wǎng)服務(wù)提 供商來通過因特網(wǎng)連接)。
[0018] 下面將參照本發(fā)明實施例的方法、裝置(系統(tǒng))和計算機程序產(chǎn)品的流程圖和/或 框圖描述本發(fā)明。應(yīng)當(dāng)理解,流程圖和/或框圖的每個方框以及流程圖和/或框圖中各方 框的組合,都可以由計算機程序指令實現(xiàn)。這些計算機程序指令可以提供給通用計算機、專 用計算機或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機器,這些計算機程序指 令通過計算機或其它可編程數(shù)據(jù)處理裝置執(zhí)行,產(chǎn)生了實現(xiàn)流程圖和/或框圖中的方框中 規(guī)定的功能/操作的裝置。
[0019] 也可以把這些計算機程序指令存儲在能使得計算機或其它可編程數(shù)據(jù)處理裝置 以特定方式工作的計算機可讀介質(zhì)中,這樣,存儲在計算機可讀介質(zhì)中的指令就產(chǎn)生出一 個包括實現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的指令裝置(instruction means)的制造品(manufacture)。
[0020] 也可以把計算機程序指令加載到計算機、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備 上,使得在計算機、其它可編程數(shù)據(jù)處理裝置或其它設(shè)備上執(zhí)行一系列操作步驟,以產(chǎn)生計 算機實現(xiàn)的過程,從而使得在計算機或其它可編程裝置上執(zhí)行的指令能夠提供實現(xiàn)流程圖 和/或框圖中的方框中規(guī)定的功能/操作的過程。
[0021] 圖1示出了適于用來實現(xiàn)本發(fā)明實施方式的示例性計算機系統(tǒng)/服務(wù)器12的框 圖。圖1顯示的計算機系統(tǒng)/服務(wù)器I 2僅僅是一個示例,不應(yīng)對本發(fā)明實施例的功能和使 用范圍帶來任何限制。
[0022] 如圖1所示,計算機系統(tǒng)/服務(wù)器I2以通用計算設(shè)備的形式表現(xiàn)。計算機系統(tǒng) /服務(wù)器12的組件可以包括但不限于:一個或者多個處理器或者處理單元16,系統(tǒng)存儲器 28,連接不同系統(tǒng)組件(包括系統(tǒng)存儲器28和處理單元16)的總線18。
[0023] 總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲器總線或者存儲器控制器, 外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉 例來說,這些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ISA)總線,微通道體系結(jié)構(gòu)(ma C) 總線,增強型ISA總線、視頻電子標(biāo)準(zhǔn)協(xié)會(VESA)局域總線以及外圍組件互連(PCI)總線。
[0024] 計算機系統(tǒng)/服務(wù)器12典型地包括多種計算機系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是 任何能夠被計算機系統(tǒng)/服務(wù)器I 2訪問的可用介質(zhì),包括易失性和非易失性介質(zhì),可移動 的和不可移動的介質(zhì)。
[0025] 系統(tǒng)存儲器28可以包括易失性存儲器形式的計算機系統(tǒng)可讀介質(zhì),例如隨機存 取存儲器(RAM)30和/或高速緩存存儲器32。計算機系統(tǒng)/服務(wù)器12可以進一步包括其 它可移動/不可移動的、易失性/非易失性計算機系統(tǒng)存儲介質(zhì)。僅作為舉例,存儲系統(tǒng)^ 可以用于讀寫不可移動的、非易失性磁介質(zhì)(圖1未顯示,通常稱為"硬盤驅(qū)動器")。盡管圖 1中未不出,可以提供用于對可移動非易失性磁盤(例如"軟盤")讀寫的磁盤驅(qū)動器,以及& 可移動非易失性光盤(例如⑶-ROM, DVD-ROM或者其它光介質(zhì))讀寫的光盤驅(qū)動器。在這勝 情況下,每個驅(qū)動器可以通過一個或者多個數(shù)據(jù)介質(zhì)接口與總線18相連。存儲器28可以 包括至少一個程序產(chǎn)品,該程序廣品具有一組(例如至少一個)程序模塊,這些程序模塊被 配置以執(zhí)行本發(fā)明各實施例的功能。 ' ^
[0026]具有一組(至少一個)程序模塊42的程序/實用工具40,可以存儲在例如存儲器 28中,這樣的程序模塊42包括--但不限于--操作系統(tǒng)、一個或者多個應(yīng)用程序其它 程序模塊以及程序數(shù)據(jù),這些示例中的每一個或某種組合中可能包栝網(wǎng)絡(luò)環(huán)境的實現(xiàn)。'程 序模塊42通常執(zhí)行本發(fā)明所描述的實施例中的功能和/或方法。 ° $
[0027]計算機系統(tǒng)/服務(wù)器I2也可以與一個或多個外部設(shè)備14 (例如鍵盤、指向設(shè)備、 顯示器24等)通信,還可與一個或者多個使得用戶能與該計算機系統(tǒng)/服務(wù)器12交互的設(shè) 備通彳曰,和/或與使得該計算機系統(tǒng)/服務(wù)器I2能與一個或多個其它計算設(shè)備進行通信的 任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(I/O)接口 22 進行。并且,計算機系統(tǒng)/服務(wù)器12還可以通過網(wǎng)絡(luò)適配器20與一個或者多個網(wǎng)絡(luò)(例如 局域網(wǎng)(LAN),廣域網(wǎng)(WAN)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器20 通過總線18與計算機系統(tǒng)/服務(wù)器12的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以 結(jié)合計算機系統(tǒng)/服務(wù)器12使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū) 動器、冗余處理單元、外部磁盤驅(qū)動陣列、RAID系統(tǒng)、磁帶驅(qū)動器以及數(shù)據(jù)備份存儲系統(tǒng)等。 [0028]現(xiàn)在參考圖2。圖2示出了根據(jù)本發(fā)明的一個實施例的監(jiān)測感興趣主題的方法200 的流程圖。圖2中的監(jiān)測感興趣主題的方法200包括:步驟S201,基于感興趣主題的第一 集合,選擇參與所述第一集合中的一個或多個感興趣主題的至少一個關(guān)鍵節(jié)點來組成關(guān)鍵 節(jié)點的組;以及步驟S202,監(jiān)視所述組中的一個或多個關(guān)鍵節(jié)點所發(fā)布的內(nèi)容,以找到感 興趣主題的第二集合。
[0029] 根據(jù)本發(fā)明的該實施例,通過基于感興趣主題的第一集合,選擇參與第一集合中 的一個或多個感興趣主題的至少一個關(guān)鍵節(jié)點來組成關(guān)鍵節(jié)點的組,作為要監(jiān)視的對象, 從而相比于監(jiān)視所有用戶節(jié)點而減少了要監(jiān)視的節(jié)點所發(fā)布的內(nèi)容的數(shù)量,使得能夠高 效、低成本和實時地找到諸如熱點新聞或熱點事件的感興趣主題。
[0030] 注意,在一個實施例中,感興趣主題的第一集合可以是在第一特定時間段1\內(nèi)的 已知感興趣主題的集合,其可以通過多種已知方式從以下信息源獲取:例如,在第一特定時 間段?\內(nèi)(例如,在星期六和星期日兩天中)累積的來自諸如央視等新聞節(jié)目的已知的新 聞、來自諸如新浪、搜狐等新聞門戶網(wǎng)站的已知的熱點新聞排名信息等、來自諸如百度、谷 歌等搜索引擎網(wǎng)站的已知的搜索關(guān)鍵字排名信息等、來自新浪微博、騰訊微博、Twitter、開 心網(wǎng)等社交網(wǎng)站的已知的熱點關(guān)注新聞事件排名信息等等。即,在第一特定時間段?\內(nèi)的 己知感興趣主題的第一集合可以包括在第一特定時間段內(nèi)的媒體的熱點新聞、搜索網(wǎng)站 的搜索排名事件、社交網(wǎng)站的熱點事件中的一種或多種。當(dāng)然,該感興趣主題的第一集合還 可以通過其他外來的導(dǎo)向性信息來獲得。如此,這樣的該感興趣主題的第一集合可以作為 在所有用戶節(jié)點中選擇少量關(guān)鍵用戶節(jié)點的基礎(chǔ)。作為一個例子,假設(shè),該感興趣主題的第 -集合是1〇個感興趣主題,{&,S 2……S10}。
[0031] 在一個實施例中,所述感興趣主題的第二集合可以是在不同于所述第一特定時間 段1\的第二特定時間段T 2內(nèi)找到的感興趣主題的集合。這只是示例,而感興趣主題的第二 集合可以是在時間上與感興趣主題的第一集合不同的集合(如上所述),也可以是在同一時 段(和τ 2相同)內(nèi)的在包含的主題上與感興趣主題的第一集合不同的集合。例如,在通過 在第一特定時間段I中收集到的感興趣主題的第一集合得到關(guān)鍵節(jié)點的組的情況下,可以 通過在第一特定時間段之后的一段時間(例如,第二特定時間段Τ 2)內(nèi)監(jiān)視該關(guān)鍵節(jié)點的 組發(fā)布的內(nèi)容,來找到在第一特定時間段L之后的一段時間(例如,第二特定時間段V內(nèi) 的新的熱點新聞事件的感興趣主題的第二集合?;蛘呃?,在通過在第一特定時間段 Τι中 收集到的感興趣主題的第一集合得到關(guān)鍵節(jié)點的組的情況下,可以仍然通過監(jiān)視該關(guān)鍵節(jié) 點的組在該第一特定時間段(?\和T 2相問)內(nèi)發(fā)布的內(nèi)各,來找到在所包含的主過上與 該感興趣主題的第一集合不同的第二集合??傊?,術(shù)語"感興趣主題的第二集合"不限于在 時間上與第一集合不同的第二集合(由于例如某些熱點新聞事件持續(xù)受到廣泛關(guān)注等,第 一集合和第二集合在所包含的主題上可能相同),還可以包括在所包含的主題上與第一集 合不同的第二集合(例如,第一集合和第二集合在時間上可能相同)。當(dāng)然,在本公開的各個 實施例中,以該"感興趣主題的第二集合"是在時間上比第一集合更新的第二集合作為例子 來進行描述,但本發(fā)明不限于此。
[0032] 在一個實施例中,還可以基于如下中的一種或多種來進行該步驟S201 :要選擇的 所述組中的關(guān)鍵節(jié)點的個數(shù)Nn。&的限制L1;以及要選擇的所述組中的關(guān)鍵節(jié)點所發(fā)布的內(nèi) 容的總數(shù)N p()St的限制L2。也就是說,在選擇關(guān)鍵節(jié)點的組的選擇步驟中,可以限制這些關(guān) 鍵節(jié)點的個數(shù)和其所發(fā)布的內(nèi)容總數(shù),從而減少監(jiān)視這些關(guān)鍵節(jié)點和其發(fā)布的內(nèi)容的工作 量,降低成本,加快找到感興趣主題的速度。當(dāng)然這種限制也不是必要的,可以根據(jù)實際情 況來決定是否進行限制、進行何種程度的限制等等。
[0033] 注意,本公開中提到的節(jié)點"發(fā)布"內(nèi)容可以包括用戶節(jié)點發(fā)表新內(nèi)容、轉(zhuǎn)發(fā)其他 用戶節(jié)點發(fā)表的內(nèi)容、評論其他用戶節(jié)點發(fā)布的內(nèi)容等等,但該"發(fā)布"不限于此,"發(fā)布"內(nèi) 容還可以包括例如參加某個熱點活動討論(例如,某個明星的專訪)、發(fā)表帖子時添加例如 涉及某個熱點事件新聞的關(guān)鍵字標(biāo)識(例如"#以色列游客拍到美人魚#"等)、以及未來可 能出現(xiàn)的其他與"產(chǎn)生"內(nèi)容相關(guān)的方式等等。
[0034] 這樣,通過已知的各個熱點新聞事件作為感興趣主題的第一集合,可以基于已知 的感興趣主題來選擇參與這些已知的感興趣主題的少量關(guān)鍵用戶節(jié)點,從而假定如此選擇 的這些少量關(guān)鍵用戶節(jié)點可能是參與已知的熱點新聞事件的活躍用戶,那么也可以推測這 樣的活躍用戶同樣也可能會持續(xù)地關(guān)注新的熱點新聞事件。在該情況下,監(jiān)視活躍的少量 關(guān)鍵用戶節(jié)點發(fā)布的內(nèi)容,可以更快速有效且低成本地找到新的熱點新聞事件的感興趣主 題的第二集合。
[0035] 在一個實施例中,該基于感興趣主題的第一集合,選擇參與所述第一集合中的一 個或多個感興趣主題的至少一個關(guān)鍵節(jié)點來組成關(guān)鍵節(jié)點的組的步驟S201可以包括:步 驟S2011(未示出),獲取參與所述第一集合中的一個或多個感興趣主題的多個參與節(jié)點;以 及步驟S2012(未示出),從所述多個參與節(jié)點中,選擇由滿足第一特定條件的至少一個參與 節(jié)點組成的組作為所述關(guān)鍵節(jié)點的組。
[0036] 如上所述,參與某一感興趣主題的參與節(jié)點可以是在從首次發(fā)布該感興趣主題開 始的第三特定時間段T 3內(nèi)、發(fā)布與該感興趣主題相關(guān)的內(nèi)容的節(jié)點。例如,一個參與節(jié)點 在首次發(fā)布感興趣主題Si開始的例如較短時間段內(nèi)發(fā)表、轉(zhuǎn)發(fā)或評論等該感興趣主題Sp 這可以一定程度上說明該參與節(jié)點對于該感興趣主題Si是活躍的。當(dāng)然,對于該第三特定 時間段τ3的長短的設(shè)置可以調(diào)整該參與節(jié)點的活躍性程度,例如,τ 3越短,所獲得的參與節(jié) 點越活躍。當(dāng)然,本發(fā)明不限于此,還可以通過其他方式來獲取參與所述感興趣主題的參與 節(jié)點,例如檢查節(jié)點發(fā)布的內(nèi)容中是否涉及感興趣主題的關(guān)鍵字、檢查用戶節(jié)點是否參加 了例如社交網(wǎng)絡(luò)上組織的該感興趣主題的熱點活動討論、未來可能出現(xiàn)的其他參與方式等 等。另外,參與所述感興趣主題的參與節(jié)點還可以通過其他時間段來獲取,例如參與節(jié)點還 可以是在對該感興趣主題討論得較為活躍或最活躍的一段時間內(nèi)發(fā)布與該感興趣主題相 關(guān)的內(nèi)容的節(jié)點,等等。當(dāng)然,該參與節(jié)點也可以與時間無關(guān),只要該節(jié)點參與過感興趣主 題的討論即可。本領(lǐng)域技術(shù)人員還可以構(gòu)想很多其他的實施方式來限定和獲取該參與節(jié) 點。 C〇〇37]該步驟S2012可以進一步減少所要監(jiān)視的節(jié)點所發(fā)布的內(nèi)容的數(shù)量。具體地,在 該步驟S2012中,從參與感興趣主題的第一集合的所有參與節(jié)點中,選擇滿足第一特定條 件的參與節(jié)點的一個組(一般少于所有參與節(jié)點)作為關(guān)鍵節(jié)點的組,因此通過監(jiān)視該少于 所有參與節(jié)點的一個組,可以減少所要監(jiān)視的內(nèi)容的數(shù)量。
[0038]當(dāng)然,該步驟S2012并非必要步驟,而該步驟S201也可以僅包括選擇參與感興趣 主題的第一集合的所有參與節(jié)點的步驟S2011,因為這樣選擇的所有參與節(jié)點也比全部注 冊的用戶節(jié)點的數(shù)量少,在一定程度上可以實現(xiàn)減少監(jiān)視的內(nèi)容的數(shù)量的效果。
[0039]在一個實施例中,該步驟S2012中的第一特定條件可以包括使得所述參與節(jié)點組 成的組覆蓋所述第一集合的覆蓋效益滿足如下中的一種:所述覆蓋效益大于第一特定閾 值;和所述覆蓋效益最大。在這里,所述覆蓋效益可以表示所述參與節(jié)點組成的組所發(fā)布的 內(nèi)容覆蓋感興趣主題的第一集合的程度。該覆蓋效益越大,則可以表示所述參與節(jié)點組成 的組所發(fā)布的內(nèi)容覆蓋感興趣主題的第一集合的程度越廣(g卩,監(jiān)視該參與節(jié)點的組所發(fā) 布的內(nèi)容可以得到更全面的感興趣主題)。
[0040] 在一個實施例中,在步驟S2012中,所述參與節(jié)點的組覆蓋所述第一集合的覆蓋 效益可以通過如下公式計算,其中,G是覆蓋效益,α、β分別是權(quán) 重常數(shù),是與所述組所覆蓋的感興趣主題相關(guān)的發(fā)布內(nèi)容的數(shù)量有關(guān)的效率系數(shù),而 是與所述組未覆蓋的感興趣主題相關(guān)的發(fā)布內(nèi)容的數(shù)量有關(guān)的廣度系數(shù)。在此,上 述公式所計算得到的所述參與節(jié)點的組覆蓋所述第一集合的覆蓋效益G可以反映所述參 與節(jié)點組成的組所發(fā)布的內(nèi)容覆蓋感興趣主題的第一集合的程度,該覆蓋效益越大,則表 示所述參與節(jié)點組成的組所發(fā)布的內(nèi)容覆蓋感興趣主題的第一集合的程度越廣(即,監(jiān)視 該參與T·點的組可以得到更全面的感興趣王題)。當(dāng)然,上述公式G=Cl 僅 是示例,本領(lǐng)域技術(shù)人員還可以構(gòu)思其他方式來反映參與節(jié)點組成的組所發(fā)布的內(nèi)容覆蓋 感興趣主題的第一集合的程度,例如G可以等于與所述組所覆蓋的感興趣主題相關(guān)的發(fā)布 內(nèi)容的數(shù)量、與所述組未覆蓋的感興趣主題相關(guān)的發(fā)布內(nèi)容的數(shù)量、或與感興趣主題的第 一集合中所有感測器主題相關(guān)的發(fā)布內(nèi)容的數(shù)量等等。
[0041] 在一個實施例中,在步驟S2012中,"所述組所覆蓋的感興趣主題"可以是在所述組 中參與所述感興趣主題的參與節(jié)點的數(shù)量大于第二特定閾值U 2的感興趣主題。例如,如上 所述,假設(shè)存在1〇個已知的感興趣主題,s2,……Si。。假設(shè),在參與所有這些感興趣主 題s P s2,……Si。的所有參與節(jié)點中選擇的某一組中,參與感興趣主題Si的參與節(jié)點的數(shù) 量為Ai,參與感興趣主題S 2的參與節(jié)點的數(shù)量為A2,……參與感興趣主題S1Q的參與節(jié)點 的數(shù)量為A 1()。其中,,因此,可以確定感興趣主題Si和Si。是該組所覆蓋的感興 趣主題。相反,"所述組未覆蓋的感興趣主題"可以是在所述組中參與所述感興趣主題的參 與節(jié)點的數(shù)量小于或等于第二特定閾值U 2的感興趣主題,在該例中,是感興趣主題S2…… S9〇
[0042] 在一個實施例中,可以通過下列公式來計算上述效率系數(shù)和廣度系數(shù) Runcovered · Λ _fk ^ -碌,一
[0043] jirt ffl]1 immverea v?/ * ^T? iy posi, i¥_f iV,
[0044] 其中,表示所述組所覆蓋的感興趣主題相關(guān)的發(fā)布內(nèi)容的數(shù)量,表示所 述組所發(fā)布的所有內(nèi)容的數(shù)量,斤丨.f表示所述組未覆蓋的感興趣主題相關(guān)的發(fā)布內(nèi)容的數(shù) 量,Nu表示所述組未覆蓋的感興趣主題的數(shù)量。當(dāng)然,這些公式僅是示例,還可以構(gòu)思其他 公式來體現(xiàn)所述組所覆蓋的感興趣主題相關(guān)的發(fā)布內(nèi)容的數(shù)量和所述組未覆蓋的感興趣 主題相關(guān)的發(fā)布內(nèi)容的數(shù)量對覆蓋效益的影響。
[0045] 可見,RMveral越大,則可以表示該組中的參與節(jié)點對于感興趣主題的第一集合的關(guān) 注效率越高,也就是說,該組中的參與節(jié)點能夠較集中地關(guān)注感興趣主題的第一集合中的 所覆蓋的感興趣主題,而Run__ d越大,則可以表示該組中的參與節(jié)點對于感興趣主題的第 一集合的關(guān)注廣度越大,也就是說,該組中的參與節(jié)點能夠更廣泛地關(guān)注在第一集合中除 了覆蓋的感興趣主題以外的其他感興趣主題。因此,可以根據(jù)關(guān)注效率和關(guān)注廣度的不同 側(cè)重,來選擇權(quán)重α、β的大小。
[0046] 在一個實施例中,監(jiān)視所述組中的一個或多個關(guān)鍵節(jié)點所發(fā)布的內(nèi)容,以找到感 興趣主題的第二集合的步驟S2〇2可以包括:步驟S2021 (未示出),獲取所述組中的一個或 多個關(guān)鍵節(jié)點在第二特定時間段T2內(nèi)所發(fā)布的內(nèi)容;步驟S2022 (未示出)比較所述所發(fā) 布的一個或多個內(nèi)容所包含的一個或多個主題的各自的內(nèi)容數(shù)量;步驟S2〇23(未示出),從 所述一個或多個主題中,添加如下的至少一個主題到所述感興趣主題的第二集合中:內(nèi)容 數(shù)量大于第三特定閾值U 3的主題;以及內(nèi)容數(shù)量從大到小排列的排名靠前的特定數(shù)量的主 題。
[0047] 在此,術(shù)語"發(fā)布的內(nèi)容所包含的一個或多個主題"可以指的是從一些發(fā)布的內(nèi)容 中提取的一個或多個主題(例如,一些內(nèi)容都包含某一主題的關(guān)鍵字、或一些內(nèi)容都包含某 一主題的完整信息等等)。例如,從包含關(guān)鍵字"#以色列游客拍到美人魚#"的內(nèi)容、包含該 以色列游客拍到美人魚的主題的完整新聞全文的內(nèi)容、包含該以色列游客拍到美人魚的主 題的視頻的內(nèi)容等等中提取主題"以色列游客拍到美人魚"。也就是說,涉及某一主題的內(nèi) 容可以相互不完全逐字相同,而是只要這些內(nèi)容在某種程度上涉及了該主題即可。從而,可 以從眾多發(fā)布的內(nèi)容中提取所包含的一個或多個主題,例如"以色列游客拍到美人魚"、"美 國河流鯉魚泛濫成災(zāi)#中國新聲代#10歲女孩唱麻全場"等等。
[0048] 通過上述步驟S202US2022和S2023,可以找到被涉及的內(nèi)容數(shù)量較多(大于某一 閾值或從大到小排列的前幾名)的某一或某些主題(作為感興趣主題的第二集合),而這樣 的某一或某些主題可以被認(rèn)為是較為熱點的感興趣主題,從而這樣的熱點的感興趣主題的 第二集合可以通過監(jiān)視少量的關(guān)鍵節(jié)點和其所發(fā)布的內(nèi)容來高效、低成本地來找到。
[0049] 在一個實施例中,可選地,方法200還可以包括:步驟S203 (未示出),基于所述感 興趣主題的第二集合,更新所述關(guān)鍵節(jié)點的組。具體地,隨著時間的推移,在某個時間段(例 如,在上述提到的第二特定時間段T 2)內(nèi),通過監(jiān)視關(guān)鍵節(jié)點的組找到感興趣主題的第二集 合,但例如在該時間段(例如,第二特定時間段τ2)之后,有些曾經(jīng)積極參與感興趣主題的第 一集合的關(guān)鍵節(jié)點可能不再是積極參與該感興趣主題的第二集合的活躍用戶了,因此,通 過基于所述感興趣主題的第二集合來更新所述關(guān)鍵節(jié)點的組,可以保持該關(guān)鍵節(jié)點的組的 活躍性。注意,該更新步驟S203可以在上述第二特定時間段T2之后進行。當(dāng)然,更新的基 礎(chǔ)也不限于該感興趣主題的第二集合,更新的基礎(chǔ)也可以是當(dāng)前的從新聞門戶網(wǎng)站、新聞 媒體、社交網(wǎng)站、搜索網(wǎng)站等已知信息源獲得的某個己知的感興趣主題的集合,本發(fā)明不限 于此。
[0050] 在一個實施例中,該基于所述感興趣主題的第二集合,更新所述關(guān)鍵節(jié)點的組的 步驟S203可以包括以下中的一種或多種:刪除滿足第二特定條件的節(jié)點;以及增加參與所 述第二集合中的一個或多個感興趣主題的新的關(guān)鍵節(jié)點。在步驟S203中的該增加新的關(guān) 鍵節(jié)點的【具體實施方式】可以與步驟S201的選擇關(guān)鍵節(jié)點的【具體實施方式】相類似,例如通 過計算覆蓋效益等等。當(dāng)然,更新關(guān)鍵節(jié)點的組的步驟S 2〇3也不限于此,本領(lǐng)域技術(shù)人員 還可以構(gòu)思更新關(guān)鍵節(jié)點的組的其他具體步驟,例如但不限于刪除水軍節(jié)點(以下還將討 論),刪除僵尸節(jié)點(以下還將討論)等。
[0051] 在一個實施例中,在該步驟S203中的上述第二特定條件可以包括以下中的一種 或多種:節(jié)點的節(jié)點質(zhì)量小于第四特定閾值;以及節(jié)點的節(jié)點質(zhì)量從小到大排列的排名靠 前。所述節(jié)點的節(jié)點質(zhì)量可以表示通過監(jiān)視該節(jié)點發(fā)布的內(nèi)容能找到一個或多個感興趣主 題的效率。節(jié)點質(zhì)量越好,則該監(jiān)視該節(jié)點能找到一個或多個期望的感興趣主題的效率越 高,即通過監(jiān)視該節(jié)點發(fā)布的越少的內(nèi)容可以找到越多的感興趣主題。當(dāng)然,該第二特定條 件還可以是其他條件,例如,發(fā)帖很少的節(jié)點可以考慮被刪除,例如,"水軍節(jié)點"或"僵尸節(jié) 點"(以下還將描述)可以考慮被刪除,等等。本領(lǐng)域技術(shù)人員可以構(gòu)想其他條件作為該第 二特定條件來刪除一些不必要的節(jié)點。
【權(quán)利要求】
1. 一種監(jiān)測感興趣主題的方法,包括: 基于感興趣主題的第一集合,選擇參與所述第一集合中的一個或多個感興趣主題的至 少一個關(guān)鍵節(jié)點來組成關(guān)鍵節(jié)點的組;以及 監(jiān)視所述組中的一個或多個關(guān)鍵節(jié)點所發(fā)布的內(nèi)容,以找到感興趣主題的第二集合。
2. 根據(jù)權(quán)利要求1所述的方法,其中,所述選擇還基于如下中的一種或多種來進行:要 選擇的所述組中的關(guān)鍵節(jié)點的個數(shù)限制;和要選擇的所述組中的關(guān)鍵節(jié)點所發(fā)布的內(nèi)容的 總數(shù)限制。
3. 根據(jù)權(quán)利要求1所述的方法,其中,所述感興趣主題的第一集合是在第一特定時間 段內(nèi)的已知感興趣主題的集合,且所述感興趣主題的第二集合是在不同于所述第一特定時 間段的第二特定時間段內(nèi)找到的感興趣主題的集合。
4. 根據(jù)權(quán)利要求1所述的方法,其中,所述基于感興趣主題的第一集合,選擇參與所述 第一集合中的一個或多個感興趣主題的至少一個關(guān)鍵節(jié)點來組成關(guān)鍵節(jié)點的組的步驟包 括: 獲取參與所述第一集合中的一個或多個感興趣主題的多個參與節(jié)點;以及 從所述多個參與節(jié)點中,選擇由滿足第一特定條件的至少一個參與節(jié)點組成的組作為 所述關(guān)鍵節(jié)點的組。
5. 根據(jù)權(quán)利要求4所述的方法,其中,所述參與所述感興趣主題的參與節(jié)點包括在從 首次發(fā)布所述感興趣主題開始的第三特定時間段內(nèi)、發(fā)布與所述感興趣主題相關(guān)的內(nèi)容的 節(jié)點。
6. 根據(jù)權(quán)利要求4所述的方法,其中,所述第一特定條件包括使得所述參與節(jié)點組成 的組覆蓋所述第一集合的覆蓋效益滿足如下中的一種:所述覆蓋效益大于第一特定閾值; 和所述覆蓋效益最大, 其中,所述覆蓋效益表示所述參與節(jié)點組成的組所發(fā)布的內(nèi)容覆蓋感興趣主題的第一 集合的程度。
7. 根據(jù)權(quán)利要求6所述的方法,其中,所述組覆蓋所述第一集合的覆蓋效益是通過如 下公式計算的: Z-' - a D _|_ Q D U '-covered ^ ?l'-uncovered, 其中,G是覆蓋效益,α、β分別是權(quán)重常數(shù), 是與所述組所覆蓋的感興趣主題相關(guān)的發(fā)布內(nèi)容的數(shù)量有關(guān)的效率系數(shù), Runc^W是與所述組未覆蓋的感興趣主題相關(guān)的發(fā)布內(nèi)容的數(shù)量有關(guān)的廣度系數(shù), 所述組所覆蓋的感興趣主題是在所述組中參與所述感興趣主題的參與節(jié)點的數(shù)量大 于第二特定閾值的感興趣主題, 所述組未覆蓋的感興趣主題是在所述組中參與所述感興趣主題的參與節(jié)點的數(shù)量小 于或等于第二特定閾值的感興趣主題。
8. 根據(jù)權(quán)利要求7所述的方法,其中,
其中, #!_表示所述組所覆蓋的感興趣主題相關(guān)的發(fā)布內(nèi)容的數(shù)量,表示所述組所發(fā)布的 所有內(nèi)容的數(shù)量,I;*表示所述組未覆蓋的感興趣主題相關(guān)的發(fā)布內(nèi)容的數(shù)量,Nu表示所 述組未覆蓋的感興趣主題的數(shù)量。
9. 根據(jù)權(quán)利要求1中的所述的方法,其中,所述監(jiān)視所述組中的一個或多個關(guān)鍵節(jié)點 所發(fā)布的內(nèi)容,以找到感興趣主題的第二集合的步驟包括: 獲取所述組中的一個或多個關(guān)鍵節(jié)點在第二特定時間段內(nèi)所發(fā)布的一個或多個內(nèi) 容; 比較所述所發(fā)布的一個或多個內(nèi)容所包含的一個或多個主題的各自的內(nèi)容數(shù)量; 從所述一個或多個主題中,添加如下的至少一個主題到所述感興趣主題的第二集合 中: 內(nèi)容數(shù)量大于第三特定閾值的主題;以及 內(nèi)容數(shù)量從大到小排列的排名靠前的特定數(shù)量的主題。
10. 根據(jù)權(quán)利要求1中的所述的方法,還包括: 基于所述感興趣主題的第二集合,更新所述關(guān)鍵節(jié)點的組。
11. 根據(jù)權(quán)利要求10所述的方法,所述基于所述感興趣主題的第二集合,更新所述關(guān) 鍵節(jié)點的組的步驟包括以下中的一種或多種: 刪除滿足第二特定條件的節(jié)點;以及 增加參與所述第二集合中的一個或多個感興趣主題的新的關(guān)鍵節(jié)點。
12. 根據(jù)權(quán)利要求11所述的方法,其中,所述第二特定條件包括以下中的一種或多種: 節(jié)點的節(jié)點質(zhì)量小于第四特定閾值;以及 節(jié)點的節(jié)點質(zhì)量從小到大排列的排名靠前, 其中,所述節(jié)點的節(jié)點質(zhì)量表示通過監(jiān)視該節(jié)點發(fā)布的內(nèi)容能找到一個或多個感興趣 主題的效率。
13. 根據(jù)權(quán)利要求12所述的方法,其中,所述節(jié)點質(zhì)量通過如下公式來計算:
其中,Q(i)表示關(guān)鍵節(jié)點i的節(jié)點質(zhì)量,a、b是常數(shù)權(quán)重, 表示關(guān)鍵節(jié)點i發(fā)布的與所述第二集合中的一個或多個感興趣主題S相關(guān)的 內(nèi)容的數(shù)量, #=(?//)表示所述關(guān)鍵節(jié)點的組中所有關(guān)鍵節(jié)點所發(fā)布的與所述第二集合中的一個 或多個感興趣主題S相關(guān)的內(nèi)容的數(shù)量, ^=(0表示該關(guān)鍵節(jié)點i所發(fā)布的所有內(nèi)容的總數(shù)量。
14. 一種監(jiān)測感興趣主題的系統(tǒng),包括: 選擇裝置,被配置為基于感興趣主題的第一集合,選擇參與所述第一集合中的一個或 多個感興趣主題的至少一個關(guān)鍵節(jié)點來組成關(guān)鍵節(jié)點的組;以及 監(jiān)視裝置,被配置為監(jiān)視所述組中的一個或多個關(guān)鍵節(jié)點所發(fā)布的內(nèi)容,以找到感興 趣主題的第二集合。
15. 根據(jù)權(quán)利要求14所述的系統(tǒng),其中,所述選擇裝置還基于如下中的一種或多種來 進行所述選擇:要選擇的所述組中的關(guān)鍵節(jié)點的個數(shù)限制;和要選擇的所述組中的關(guān)鍵節(jié) 點所發(fā)布的內(nèi)容的總數(shù)限制。
16. 根據(jù)權(quán)利要求14所述的系統(tǒng),其中,所述感興趣主題的第一集合是在第一特定時 間段內(nèi)的已知感興趣主題的集合,且所述感興趣主題的第二集合是在不同于所述第一特定 時間段的第二特定時間段內(nèi)找到的感興趣主題的集合。
17. 根據(jù)權(quán)利要求14所述的系統(tǒng),其中,所述選擇裝置包括: 獲取參與所述第一集合中的一個或多個感興趣主題的多個參與節(jié)點的裝置;以及 從所述多個參與節(jié)點中,選擇由滿足第一特定條件的至少一個參與節(jié)點組成的組作為 所述關(guān)鍵節(jié)點的組。
18. 根據(jù)權(quán)利要求17所述的系統(tǒng),其中,所述第一特定條件包括使得所述參與節(jié)點組 成的組覆蓋所述第一集合的覆蓋效益滿足如下中的一種:所述覆蓋效益大于第一特定閾 值;和所述覆蓋效益最大, 其中,所述覆蓋效益表示所述參與節(jié)點組成的組所發(fā)布的內(nèi)容覆蓋感興趣主題的第一 集合的程度。
19. 根據(jù)權(quán)利要求14中的所述的系統(tǒng),其中,所述監(jiān)視裝置包括: 獲取所述組中的一個或多個關(guān)鍵節(jié)點在第二特定時間段內(nèi)所發(fā)布的一個或多個內(nèi)容 的裝置; 比較所述所發(fā)布的一個或多個內(nèi)容所包含的一個或多個主題的各自的內(nèi)容數(shù)量的裝 置; 從所述一個或多個主題中,添加如下的至少一個主題到所述感興趣主題的第二集合中 的裝置: 內(nèi)容數(shù)量大于第三特定閾值的主題;以及 內(nèi)容數(shù)量從大到小排列的排名靠前的特定數(shù)量的主題。
20. 根據(jù)權(quán)利要求14中的所述的系統(tǒng),還包括: 更新裝置,被配置為基于所述感興趣主題的第二集合,更新所述關(guān)鍵節(jié)點的組。
【文檔編號】G06F17/30GK104252461SQ201310257892
【公開日】2014年12月31日 申請日期:2013年6月26日 優(yōu)先權(quán)日:2013年6月26日
【發(fā)明者】嚴(yán)駿馳, 王俞, 龔旻, 胡國強, 齊軼 申請人:國際商業(yè)機器公司