亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

使用加權(quán)分析動態(tài)確定社交數(shù)據(jù)網(wǎng)絡(luò)中影響者的系統(tǒng)和方法

文檔序號:10494429閱讀:606來源:國知局
使用加權(quán)分析動態(tài)確定社交數(shù)據(jù)網(wǎng)絡(luò)中影響者的系統(tǒng)和方法
【專利摘要】本發(fā)明提供了通過服務(wù)器實施的、用于確定社交網(wǎng)絡(luò)中的加權(quán)影響的系統(tǒng)和方法,包括:確定與話題相關(guān)的帖子;將每個帖子描述成以下各項中的一項或多項:回復(fù)帖子、提及帖子以及轉(zhuǎn)帖;生成用戶賬戶組,所述用戶賬戶組中包括創(chuàng)作被回復(fù)的帖子、在所述提及帖子中被提及的帖子,發(fā)布被轉(zhuǎn)帖的內(nèi)容,以及/或者創(chuàng)作與所述話題相關(guān)的一個或多個帖子的任何用戶賬戶;在相連圖中將每個所述用戶賬戶表示成所述組中的節(jié)點,并且在一個或多個節(jié)點對之間存在追隨者?被追隨者關(guān)系時,在所述節(jié)點之間建立邊緣;以及對于節(jié)點之間的每個邊緣,確定加權(quán),所述加權(quán)是以下各項中的一項或多項的函數(shù):提及帖子的數(shù)量、回復(fù)帖子的數(shù)量以及轉(zhuǎn)帖的數(shù)量。
【專利說明】使用加權(quán)分析動態(tài)確定社交數(shù)據(jù)網(wǎng)絡(luò)中影響者的系統(tǒng)和方法
相關(guān)申請的交叉引用:
[0001 ]本申請請求于2013年10月25日遞交的、標(biāo)題為“確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者的系統(tǒng)和方法,,(Systems and Methods for Determining Influencers in a Social DataNetwork)的第61/895,539號美國臨時專利申請、于2013年11月22日遞交的標(biāo)題為“確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者及其社區(qū)的系統(tǒng)和方法”(Systems and Methods for IdentifyingInfluencers and Their Communities in a Social Data Network)的第61/907,878號美國臨時專利申請,以及于2014年7月3日遞交的標(biāo)題為“使用加權(quán)分析動態(tài)地確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者的系統(tǒng)和方法”(Systems and Methods for Dynamically DeterminingInfluencers in a Social Data Network Using Weighted Analysis)的第62/020,833號美國臨時專利申請的優(yōu)先權(quán),并且該專利申請以引用方式全文并入本文。
技術(shù)領(lǐng)域
[0002]以下內(nèi)容總體上涉及分析社交網(wǎng)絡(luò)數(shù)據(jù)。
背景
[0001]近年來,社交媒體已經(jīng)成為個人和消費者在線(例如,在互聯(lián)網(wǎng)上)交互的流行方式。社交媒體還影響企業(yè)目的在于和其客戶、粉絲、和潛在客戶在線交互的方式。
[0002]獲得廣泛關(guān)注的一些特定話題的博客被識別并且用于為特定產(chǎn)品提供支持或者贊助。例如,熱門博客網(wǎng)站中的廣告位被用于推廣相關(guān)的產(chǎn)品和服務(wù)。
[0003]社交網(wǎng)絡(luò)平臺被用于影響用戶群體。社交網(wǎng)絡(luò)平臺的示例包括臉譜網(wǎng)(Facebook)、推特(Twitter)、領(lǐng)英(LinkedIn)、湯博樂(Tumblr)和拼趣(Pinterest)等熟知的品牌。社交網(wǎng)絡(luò)平臺內(nèi)的熱門或者專家人士可用于向其他人進(jìn)行推廣。隨著社交網(wǎng)絡(luò)用戶數(shù)量的增長,迅速識別熱門或者有影響力的個人變得更加困難。此外,也難以識別特定話題的有影響力的個人。在本文中,社交網(wǎng)絡(luò)中的專家或者熱門用戶均可替換地稱為“影響者”。
附圖簡要說明
[0004]現(xiàn)在參考附圖僅通過舉例方式來描述實施例,在附圖中:
[0005]圖1是社交數(shù)據(jù)網(wǎng)絡(luò)中的彼此關(guān)聯(lián)的用戶的圖示。
[0006]圖2是與計算裝置通信的服務(wù)器的示意圖。
[0007]圖3是用于基于加權(quán)關(guān)系,確定指定話題的用戶與影響者社區(qū)之間的加權(quán)關(guān)系的計算機可執(zhí)行指令的示例性實施例的流程圖。
[0008]圖4是用于基于加權(quán)關(guān)系,確定影響者的社區(qū)的計算機可執(zhí)行指令的另一個示例性實施例的流程圖。
[0009]圖5是用于基于加權(quán)關(guān)系,確定影響者的社區(qū)的計算機可執(zhí)行指令的另一個示例性實施例的流程圖。
[0010]圖6是用于獲取和存儲社交網(wǎng)絡(luò)數(shù)據(jù)的計算機可執(zhí)行指令的示例性實施例的流程圖。
[0011]圖7是索引存儲器中的示例性數(shù)據(jù)分量的框圖。
[0012]圖8是簡檔存儲器中的示例性數(shù)據(jù)分量的框圖。
[0013]圖9是話題“麥咖啡”(McCafe)的示例性話題網(wǎng)絡(luò)圖的圖解。
[0014]圖10是圖9中的話題網(wǎng)絡(luò)圖的圖解,其示出了主集群和離群值集群的分解。
[0015]圖11是用于基于社區(qū)的分解,識別和過濾話題網(wǎng)絡(luò)中的離群值的計算機可執(zhí)行指令的示例性實施例的流程圖。
[0016]圖12是用于從每個話題網(wǎng)絡(luò)識別和提供社區(qū)集群的計算機可執(zhí)行指令的示例性實施例的流程圖。
[0017]圖13A和13B示出了用于與顯示話題網(wǎng)絡(luò)內(nèi)的影響者社區(qū)的GUI進(jìn)行交互的示例性屏幕截圖,其中圖13A示出了不使用加權(quán)分析的結(jié)果,而圖13B示出了使用加權(quán)分析的結(jié)果。
[0018]圖14示出了用于使用加權(quán)分析與顯示話題網(wǎng)絡(luò)內(nèi)的影響者社區(qū)的GUI進(jìn)行交互的示例性屏幕截圖。
[0019]圖15A和15B示出了用于與顯示話題網(wǎng)絡(luò)內(nèi)的影響者社區(qū)的GUI進(jìn)行交互的示例性屏幕截圖,其中圖15A示出了不使用加權(quán)分析的結(jié)果,而圖15B示出了使用加權(quán)分析的結(jié)果。
附圖詳細(xì)說明
[0020]應(yīng)當(dāng)認(rèn)識的是,為了說明的簡化和清晰,在認(rèn)為適當(dāng)時,參考數(shù)字可在圖中被重復(fù)以指示相應(yīng)或相似的元件。此外,陳述了許多特定細(xì)節(jié),以提供對本文中所描述的實施例的透徹理解。然而,本領(lǐng)域的普通技術(shù)人員將理解的是,沒有這些特定細(xì)節(jié)也可以實踐本文中所描述的實施例。在其他情形下,沒有詳細(xì)描述公知方法、程序和部件,以不使本文中所描述的實施例難理解。并且,本說明不被認(rèn)為是限制本文中所描述的實施例的范圍。
[0021]社交聯(lián)網(wǎng)平臺包括(例如,經(jīng)由通過與社交聯(lián)網(wǎng)平臺關(guān)聯(lián)的網(wǎng)站通信的計算裝置的網(wǎng)絡(luò))生成和發(fā)布內(nèi)容供他人查看、收聽等的用戶。社交聯(lián)網(wǎng)平臺的非限定性實施例包括Facebook、Twitter、LinkedIn、Pinterest、Tumblr、博客空間、網(wǎng)站、協(xié)作性維基網(wǎng)站、在線新聞組、在線論壇、電子郵件和即時消息服務(wù)。當(dāng)前已知和未來已知的社交聯(lián)網(wǎng)平臺適用于本說明書中所述的原理。社交聯(lián)網(wǎng)平臺可以用于向平臺的用戶進(jìn)行市場營銷和廣告宣傳。已經(jīng)認(rèn)識到,難以識別與指定話題相關(guān)的用戶。這包括識別指定話題的具有影響力的用戶。
[0022]此外,還認(rèn)識到,社交網(wǎng)絡(luò)為各品牌和公司提供了向該等品牌的影響者傳達(dá)消息的巨大潛力。影響者是指對品牌感興趣,并且他們的觀點可以影響社交網(wǎng)絡(luò)中的大量受眾的人員。找到適當(dāng)?shù)挠绊懻咧?,這些影響者可以傳播、支持,或者甚至擁護(hù)該等品牌的消息。
[0023]借助社交網(wǎng)絡(luò),影響者可以輕松地向其所有追隨者(例如,使用Twitter轉(zhuǎn)發(fā)推文或者提醒回復(fù))或朋友(例如,使用Facebook分享)傳遞信息。但是,獲得顯著提醒的關(guān)鍵在于識別正確的影響者。一些圖表分析方法使用關(guān)鍵字查詢來識別在指定時間范圍內(nèi)就某品牌生成內(nèi)容(例如,推文或者帖子)的影響者。該方法考慮個人之間的追隨者-追隨(或朋友)關(guān)系,同時還識別這些個人之間的群組。使用群組,品牌可向不同受眾發(fā)送自定義消息。但是,并非所有追隨者(或者朋友)都會重視并且傳播某個人對于品牌的意見。計算機難以基于典型的數(shù)據(jù)度量來理解關(guān)注者與被關(guān)注者之間關(guān)系的重要性或者特性。
[0024]本文中還認(rèn)識到,如果將網(wǎng)絡(luò)中的所有鏈接視作同等重要,那么該等方法就無法抓住人類心理的一個重要方面。人的“信任”趨于隨時間推移而變化。例如,Amy關(guān)注Ann和Zoe (圖1)的同時,在指定時間范圍內(nèi)選擇轉(zhuǎn)發(fā)Ann的帖子,并且可能在未來的某一時候轉(zhuǎn)發(fā)Zoe的帖子。因此,即便代表的是相同的關(guān)系,但是并非網(wǎng)絡(luò)中的所有鏈接都具有同等重要性。
[0025]術(shù)語“帖子”或者“發(fā)帖”是指通過社交數(shù)據(jù)網(wǎng)絡(luò)與他人共享的內(nèi)容。帖子或者發(fā)帖可以通過向服務(wù)器或者網(wǎng)站或者網(wǎng)絡(luò)提交內(nèi)容以供他人訪問來進(jìn)行傳輸。帖子或者發(fā)帖還可以作為消息在兩個裝置之間傳輸。帖子或者發(fā)帖包括發(fā)送消息、電子郵件,在網(wǎng)站上發(fā)布評論,在博客上發(fā)布內(nèi)容,在視頻共享網(wǎng)絡(luò)中發(fā)布內(nèi)容,以及在聯(lián)網(wǎng)應(yīng)用程序中發(fā)布內(nèi)容。帖子形式包括文本、圖片、視頻、音頻及其組合。
[0026]如本文中所使用的,術(shù)語“影響者”是指主要產(chǎn)生并共享與話題相關(guān)的內(nèi)容的用戶賬戶并且被認(rèn)為對社交數(shù)據(jù)網(wǎng)絡(luò)中的其他用戶是有影響的。更具體來說,影響者是指具備以下條件的社交數(shù)據(jù)網(wǎng)絡(luò)中的個人或者實體:被視作對該話題感興趣或者生成關(guān)于該話題的內(nèi)容;擁有大量追隨者(例如,或者讀者、朋友或者訂閱者),其中的大部分對該話題感興趣,并且顯著百分?jǐn)?shù)的對該話題感興趣的關(guān)注者重視影響者對于該話題的觀點。話題的非限制性示例包括品牌、公司、產(chǎn)品、活動、位置和個人。
[0027]如本文中所使用的,術(shù)語“追隨者”是指追隨第二用戶賬戶(例如,與第一用戶賬戶的至少一個社交聯(lián)網(wǎng)平臺相關(guān)聯(lián)并且經(jīng)由計算裝置訪問的第二用戶賬戶)的第一用戶賬戶(例如,與一個或多個社交聯(lián)網(wǎng)平臺相關(guān)聯(lián)的經(jīng)由計算裝置訪問的第一用戶賬戶),這樣使得第二用戶賬戶所發(fā)帖的內(nèi)容被發(fā)布以供第一用戶賬戶閱讀、消費等。例如,當(dāng)?shù)谝挥脩糇冯S第二用戶時,第一用戶(即,追隨者)將接收第二用戶發(fā)布的內(nèi)容。對特定話題“感興趣”的用戶在本文中是指追隨特定話題的若干專家(例如,與社交聯(lián)網(wǎng)平臺相關(guān)聯(lián))的用戶賬戶。在某些情況下,追隨者與其他用戶所發(fā)帖的內(nèi)容交互(例如,通過分享或轉(zhuǎn)帖該內(nèi)容)。
[0028]公司需要識別關(guān)鍵影響者以便,例如,定位能夠潛在地傳播和支持某個品牌的消息的個人。與這些個人交互可實現(xiàn)控制某個品牌的在線消息,并且可以減少可能發(fā)生的潛在負(fù)面觀點。謹(jǐn)慎地管理本過程可實現(xiàn)在線思維占有率的指數(shù)增長,例如,在病毒式營銷活動的情況下。
[0029]確定影響者的大多數(shù)傳統(tǒng)方法關(guān)注的是簡便的可計算度量,例如追隨者或者朋友的數(shù)量,或者帖子的數(shù)量。盡管追隨者或者朋友總數(shù)可能近似于整個社交網(wǎng)絡(luò),但是就指示某個用戶或者個人相對于公司或者品牌的影響的計算度量而言,它提供的數(shù)據(jù)極少。這導(dǎo)致影響者結(jié)果存在干擾,并且篩選大量潛在用戶也較為耗時。
[0030]若干社交媒體分析公司聲稱為社交網(wǎng)絡(luò)提供影響者分?jǐn)?shù)。但是,本文中認(rèn)識到,許多公司使用的度量并不是真實的影響者度量,而是追隨者數(shù)量以及提及(例如,Twitter的“推文”、帖子、消息等)數(shù)量的代數(shù)公式。例如,一些已知方法使用這些數(shù)字的對數(shù)正態(tài)化,將大約80 %的權(quán)重分配給追隨者數(shù)量,剩余的分配給提及的數(shù)量。
[0031]使用代數(shù)公式的原因在于追隨者和提及的計數(shù)或者點數(shù)會在社交網(wǎng)絡(luò)的用戶簡檔中即時更新。因此,計算非常迅速并且易于匯報。這通常稱為權(quán)威度量或者權(quán)威分?jǐn)?shù),以便從實際影響者分析中區(qū)分出來。
[0032]在示例性實施例中,權(quán)威分?jǐn)?shù),例如,是使用若干參數(shù)的線性組合計算的,包括用戶發(fā)帖數(shù)量以及追隨同一用戶的追隨者的數(shù)量。在示例性實施例中,該線性組合還可以基于同一用戶追隨的輔助用戶的數(shù)量。
[0033]然而,權(quán)威分?jǐn)?shù)方法存在若干顯著缺點。本文中認(rèn)識到,該權(quán)威分?jǐn)?shù)是不易受情境的影響。這是與話題或者查詢無關(guān)的靜態(tài)度量。例如,不考慮話題,如紐約時報(New YorkTimes)或者美國有線電視新聞網(wǎng)(CNN)等大眾媒體渠道將獲得最高排名,因為它們就有數(shù)百萬追隨者。因此,權(quán)威分?jǐn)?shù)不易受情境的影響。
[0034]本文中還認(rèn)識到,該權(quán)威度量具有高的追隨者計數(shù)偏向。如果存在特定領(lǐng)域中具有有限數(shù)量的追隨者的定義明確的專家,但是這些追隨者也全部都是專家,則由于追隨者數(shù)量較小,他們不可能出現(xiàn)在100個結(jié)果中的前20個結(jié)果中,實際上,所有追隨者均視作擁有相等的權(quán)重,這被證實是網(wǎng)絡(luò)分析研究中的不當(dāng)假設(shè)。
[0035]如本文所述,所提出的系統(tǒng)和方法可以相對于查詢話題動態(tài)地計算影響者,并且可以說明其追隨者的影響。
[0036]還認(rèn)識到,影響者關(guān)系的遞歸性質(zhì)是大范圍實施影響者識別中的一項挑戰(zhàn)。例如,考慮包括個人A、B和C的情境,其中:A追隨B和C;B追隨C和A;并且C僅追隨A13A的影響取決于C,而C的影響又取決于A和B,等等。這樣,影響者關(guān)系具有遞歸性質(zhì)。
[0037]更一般地說,所提出的系統(tǒng)和方法提供了一種確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者的方式。在本發(fā)明的示例性系統(tǒng)和方法中,加權(quán)邊緣或者連接被用于開發(fā)網(wǎng)絡(luò)圖,并且在社交數(shù)據(jù)網(wǎng)絡(luò)中的不同用戶節(jié)點(例如,用戶賬戶)之間考慮了若干不同類型的邊緣或連接。這些類型的邊緣或者連接包括:(a)追隨者關(guān)系,即用戶追隨另一個用戶;(b)轉(zhuǎn)帖關(guān)系,即用戶重新發(fā)送或者轉(zhuǎn)帖來自另一個用戶的相同內(nèi)容;(C)回復(fù)關(guān)系,即用戶回復(fù)另一個用戶發(fā)布或者發(fā)送的內(nèi)容;以及(d)提及關(guān)系,即用戶在發(fā)帖中提及另一個用戶。
[0038]在品牌名Twitter旗下的社交網(wǎng)絡(luò)的非限定性示例中,這些關(guān)系如下:
[0039]轉(zhuǎn)推(RT):當(dāng)一個用戶分享了另一個用戶的推文時發(fā)生。記作“RT”,后跟一個空格,后跟符號@,并且后跟Twitter用戶句柄,例如“RTOABC",后跟ABC的推文。
[0040]提醒回復(fù):用戶明確回復(fù)另一個用戶的推文時發(fā)生。記作符號后跟Twitter用戶句柄,例如用戶名”,后跟任何消息。
[0041]提醒提及:一個用戶在推文中包括了另一個用戶句柄,而不打算明確回復(fù)時發(fā)生。用戶在其推文中的某個地方添加@,后跟某個Twitter用戶句柄,例如“你好0ΧΥΖ,一起聚會吧@DEF@TUV”(H1XYZ let’s partyiDEFiTUV)ο
[0042]這些關(guān)系表明了源用戶句柄對目標(biāo)用戶句柄的明確興趣。源是轉(zhuǎn)推或者提醒回復(fù)或者提醒提及的用戶句柄,目標(biāo)是消息中包含的用戶句柄。
[0043]在使用加權(quán)邊緣以識別排名最高影響者及其社區(qū)的示例中,對網(wǎng)絡(luò)鏈接加權(quán)以創(chuàng)建鏈接重要性概念,并且進(jìn)一步地,識別外部源并將其合并到社交數(shù)據(jù)網(wǎng)絡(luò)中。外部源的示例包括用戶及其轉(zhuǎn)帖舊消息或內(nèi)容發(fā)帖的活動、或用戶及其參考或提及舊消息或內(nèi)容發(fā)帖的活動。外部源的另一示例是用戶及其提及社交數(shù)據(jù)網(wǎng)絡(luò)中的話題的活動,但該話題源自另一個或輔助社交數(shù)據(jù)網(wǎng)絡(luò)。
[0044]舉例來講,在圖1考慮了特定話題的簡化追隨者網(wǎng)絡(luò)。圖1示出了具有若干類型的鏈接的社交網(wǎng)絡(luò):追隨者-追隨關(guān)系;轉(zhuǎn)帖關(guān)系,并且另一個是回復(fù)關(guān)系。盡管圖1中未示出具體示例,但是提及關(guān)系是適用的。如圖所示,由于Ray在網(wǎng)絡(luò)中具有最多數(shù)量的追隨者,因此非常具有影響力。但是,由于Ray追隨了Rick和Brie,因此他們也具有重要的影響力。在Rick與Brie之間,Rick可能是較強的影響者,因為Ray還轉(zhuǎn)帖并且回復(fù)了Rick的帖子(例如,推文或者消息)。在指定的網(wǎng)絡(luò)中,影響者可能是Rick和Ray。
[0045]如圖1中所示,考慮轉(zhuǎn)帖和回復(fù)關(guān)系(或者共享)以及追隨者(或朋友)信息可提供真實影響者的更準(zhǔn)確圖像,并且也改善了所識別的群組。
[0046]可以認(rèn)識到的是,圖中的節(jié)點代表不同的用戶賬戶,一個是Ray的用戶賬戶,另一個是Rick的用戶賬戶。箭頭方向也用于指示誰是主用戶(例如,作者、發(fā)起人、另一個人提及的人或者賬戶,被追隨者等)以及誰是二級用戶(例如,轉(zhuǎn)帖者、追隨者、回復(fù)者、進(jìn)行提及操作的人等)。例如,箭頭的頭部代表主用戶,并且箭頭的尾部代表二級用戶。
[0047]除了圖1中的每個用戶賬戶之外,提供了網(wǎng)頁排名分?jǐn)?shù)。網(wǎng)頁排名算法是谷歌用來衡量網(wǎng)絡(luò)中網(wǎng)頁的重要性的一種已知算法并且還可以應(yīng)用于衡量社交數(shù)據(jù)網(wǎng)絡(luò)中的用戶的重要性。
[0048]直覺是如果幾個專家認(rèn)為某人是專家,則她/他也是專家。然而,網(wǎng)頁排名算法得出比僅對追隨者的數(shù)量計數(shù)更好的影響力衡量。如將在下文描述的,本文中所描述的所提出的系統(tǒng)和方法可以使用網(wǎng)頁排名算法和其他類似排名算法。
[0049]所提出的系統(tǒng)和方法還認(rèn)識到,影響者可能來自外部源。“外部”源的概念可采用兩種形式。首先,即便影響者最近可能未發(fā)布指定話題的推文,但鑒于她在該話題上的影響,推特圈(Twi tter-sphere)可能繼續(xù)提及她,或者重新轉(zhuǎn)推她的一篇舊帖子。例如,運動專家可能分享他/她對于超級足球杯(Super Bowl)的觀點,并且該觀點在實際比賽之后的數(shù)月被持續(xù)討論。
[0050]第二,人們通常談?wù)撏耆珌碜跃W(wǎng)絡(luò)外部的來源的話題。例如,YouTube上托管的視頻可能被發(fā)推。在這兩種情況下,所提出的系統(tǒng)和方法旨在捕獲作為影響者的視頻/觀點源。
[0051]在一般性示例性實施例中,提供了一種加權(quán)網(wǎng)絡(luò)分析方法,以通過(I)加權(quán)網(wǎng)絡(luò)鏈接以構(gòu)成“鏈接重要性”的概念,以及(2)識別并且將一些關(guān)鍵“外部”源并入網(wǎng)絡(luò)中來識別社區(qū)及其排名最高影響者。此外,提供了所有社區(qū)的排名最高影響者的匯總列表,該列表用于幫助確定所有影響者的相對次序。社區(qū)和影響者的可視化使得最終用戶能夠了解每個影響者的規(guī)模和相對重要性以及這些影響者在其社區(qū)中的相互聯(lián)系。
[0052]轉(zhuǎn)到圖2,其中示出了所提出的系統(tǒng)的示意圖。服務(wù)器100通過網(wǎng)絡(luò)102與計算裝置101通信。服務(wù)器100獲取和分析社交網(wǎng)絡(luò)數(shù)據(jù),并且通過網(wǎng)絡(luò)將結(jié)果提供給計算裝置101。計算裝置101可以通過GUI接收用戶輸入以控制分析的參數(shù)。
[0053]可以認(rèn)識到,社交網(wǎng)絡(luò)數(shù)據(jù)包括關(guān)于社交網(wǎng)絡(luò)平臺的用戶的數(shù)據(jù),以及用戶生成或整理,或用戶生成并整理的內(nèi)容。社交網(wǎng)絡(luò)數(shù)據(jù)的非限定性示例包括用戶賬戶ID或用戶名、用戶或者用戶賬戶描述、用戶發(fā)布的消息或者其他數(shù)據(jù)、用戶與其他用戶之間的聯(lián)系、本地信息等。聯(lián)系的示例是“用戶列表”,本文中也稱為“列表”,其包括列表名稱、列表描述以及指定用戶追隨的一個或多個其他用戶。該用戶列表,例如,是由指定用戶創(chuàng)建的。
[0054]繼續(xù)圖2,服務(wù)器100包括處理器103和存儲裝置104。在一個示例性實施例中,該服務(wù)器包括一個或多個處理器以及大量存儲容量。在另一個示例性實施例中,存儲裝置104或者多個存儲裝置是用于更高讀/寫性能的固態(tài)驅(qū)動器。在另一個示例性實施例中,多個服務(wù)器被用于實施本文所描述的方法。換言之,在一個示例性實施例中,服務(wù)器100是指服務(wù)器系統(tǒng)。在另一個示例性實施例中,使用其他當(dāng)前已知的計算硬件或者未來已知的計算硬件,或者使用這兩者。
[0055]服務(wù)器100還包括通信裝置105,用于通過網(wǎng)絡(luò)102通信。網(wǎng)絡(luò)102可以是有線或者無線網(wǎng)絡(luò),或者這兩者。服務(wù)器100還包括GUI模塊106,用于通過計算裝置101顯示并且接收數(shù)據(jù)。服務(wù)器還包括:社交聯(lián)網(wǎng)數(shù)據(jù)模塊107、索引器模塊108、用戶賬戶關(guān)系模塊109、社區(qū)識別模塊112以及特征識別模塊113。如下所述,社區(qū)識別模塊112被配置成基于網(wǎng)絡(luò)圖界定社區(qū)或者數(shù)據(jù)集群。
[0056]服務(wù)器100還包括若干數(shù)據(jù)庫,包括數(shù)據(jù)存儲器116、索引存儲器117、社交圖的數(shù)據(jù)庫118、簡檔存儲器119、用于存儲社區(qū)圖信息的數(shù)據(jù)庫128,以及用于存儲每個社區(qū)的熱門特征的并且用于存儲在每個社區(qū)中搜索的預(yù)定義特征的數(shù)據(jù)庫129,這些社區(qū)由社區(qū)識別豐旲塊112界定。
[0057]社交聯(lián)網(wǎng)數(shù)據(jù)模塊107被用于接收社交聯(lián)網(wǎng)數(shù)據(jù)流。在一個示例性實施例中,數(shù)百萬新消息每天實時地輸送給社交聯(lián)網(wǎng)數(shù)據(jù)模塊107。社交聯(lián)網(wǎng)數(shù)據(jù)模塊107接收的社交聯(lián)網(wǎng)數(shù)據(jù)存儲在數(shù)據(jù)存儲器116中。
[0058]索引器模塊108對數(shù)據(jù)存儲器116中的數(shù)據(jù)執(zhí)行索引器進(jìn)程,并且將索引的數(shù)據(jù)存儲在索引存儲器117中。在一個示例性實施例中,索引存儲器117中的索引數(shù)據(jù)可以被更容易地搜索,并且索引存儲器中的標(biāo)識符可以用于檢索實際數(shù)據(jù)(例如,全部消息)。
[0059]社交圖也從社交聯(lián)網(wǎng)平臺服務(wù)器獲取到(未圖示),并且存儲在社交圖數(shù)據(jù)庫118中。在指定作為查詢的輸入的用戶時,社交圖可被用于返回追隨被查詢用戶的所有用戶。
[0060]簡檔存儲器119存儲與用戶簡檔相關(guān)的元數(shù)據(jù)。與簡檔相關(guān)的元數(shù)據(jù)的示例包括指定用戶的追隨者總數(shù),指定用戶自行公開的個人信息,指定用戶的位置信息等。簡檔存儲器119中的數(shù)據(jù)可以被查詢。
[0061]在一個示例性的實施例中,用戶賬戶關(guān)系模塊109可以使用社交圖118和簡檔存儲器119來確定哪些用戶正在追隨特定用戶。模塊109還被配置成確定用戶賬戶之間的關(guān)系,包括回復(fù)關(guān)系、提及關(guān)系以及轉(zhuǎn)帖關(guān)系。
[0062]再次參見圖2,服務(wù)器100進(jìn)一步包括社區(qū)識別模塊112,該社區(qū)識別模塊被配置成識別話題網(wǎng)絡(luò)內(nèi)的社區(qū)(例如,話題A等被查詢話題內(nèi)的信息集群)以及相關(guān)的影響者。如下文關(guān)于圖3所述,話題網(wǎng)絡(luò)示出了有影響力用戶及其關(guān)系(例如,如社交圖118所定義)的圖。社區(qū)識別模塊112的輸出包括集群(例如,編碼的顏色)的視覺識別,這些集群被定義成包含共同特征并且/或者相對于另一個社區(qū)中的實體而言,更易于受同一社區(qū)中的其他實體(例如,影響者)影響(例如,被如追隨者-被追隨者關(guān)系影響)的話題網(wǎng)絡(luò)的社區(qū)。服務(wù)器100進(jìn)一步包括特征識別t吳塊113。
[0063]特征識別模塊113被配置成從社區(qū)識別模塊112接收識別出的社區(qū),并且提供社區(qū)成員中的熱門特征(例如,談話話題)的識別。特征識別模塊113的結(jié)果可以與社區(qū)識別模塊112中提供的社區(qū)的對應(yīng)可視化在視覺上鏈接。如下所述,一方面,社區(qū)識別模塊112(例如,多個社區(qū))以及/或者特征識別模塊113(例如,每個社區(qū)內(nèi)的多個熱門特征)的結(jié)果顯示在顯示屏125上,作為對計算裝置101的輸出。另一方面,GUI模塊106被配置成從計算裝置101接收輸入,以選擇社區(qū)識別模塊112識別的特定社區(qū)。GUI模塊106之后被配置成與特征識別模塊113通信,以提供與所選社區(qū)(例如,對于所選社區(qū)內(nèi)的所有有影響力的用戶)關(guān)聯(lián)的特定特征(例如,定義熱門談話)的結(jié)果的輸出。特征識別模塊112(例如,可視化地界定所選社區(qū)的用戶中的熱門談話的關(guān)鍵字云)的結(jié)果可以與特定的所選社區(qū)以及/或者特定所選社區(qū)內(nèi)的用戶列表并排地顯示在顯示屏125上。
[0064]繼續(xù)圖2,計算裝置101包括用于通過網(wǎng)絡(luò)102與服務(wù)器100通信的通信裝置122、處理器123、存儲裝置124、顯示屏125以及互聯(lián)網(wǎng)瀏覽器126。在一個示例性實施例中,服務(wù)器100提供的GUI由計算裝置101通過互聯(lián)網(wǎng)瀏覽器顯示。在另一個示例性實施例中,計算裝置101上具有可用的分析應(yīng)用程序127,⑶I由計算裝置通過分析應(yīng)用程序127顯示。可認(rèn)識到,顯示裝置125可以是計算裝置(例如,移動裝置、平板設(shè)備、膝上型計算機)的一部分,或者可以與計算裝置(例如,臺式機等)相分離。
[0065]盡管未圖示,但是各種用戶輸入裝置(例如,觸摸屏、滾動球、光學(xué)鼠標(biāo)、按鈕、鍵盤、麥克風(fēng)等)可以用于促進(jìn)用戶與計算裝置101之間的交互。
[0066]應(yīng)認(rèn)識到,在另一個示例性實施例中,系統(tǒng)包括多個服務(wù)器。在另一個示例性實施例中,有多個計算裝置與一個或多個服務(wù)器通信。
[0067]應(yīng)認(rèn)識到,本文中例示的執(zhí)行指令的任何模塊或部件可以包括或以其他方式訪問計算機可讀介質(zhì),如存儲介質(zhì)、計算機存儲介質(zhì)、或如例如磁盤、光盤或磁帶的數(shù)據(jù)存儲裝置(可移除和/或不可移除)。計算機存儲介質(zhì)可以包括在任何方法或技術(shù)中實現(xiàn)的用于存儲信息(如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊、或其他數(shù)據(jù))的易失性和非易失性、可移除和不可移除的介質(zhì)。計算機存儲介質(zhì)的示例包括RAM、R0M、EEPR0M、閃存或其他存儲器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其他光存儲裝置、磁帶盒、磁帶、磁盤存儲裝置或其他磁性存儲裝置、或者能夠用于存儲所需信息且可以由應(yīng)用程序、模塊或兩者訪問的任何其他介質(zhì)。任何這類計算機存儲介質(zhì)可以是服務(wù)器100或者計算裝置101的一部分、或者可由其訪問或與其連接。本文中所描述的任何應(yīng)用程序或模塊可以使用計算機可讀/可執(zhí)行指令來實現(xiàn),這些指令可以由這類計算機可讀介質(zhì)存儲或以其他方式保留。
[0068]轉(zhuǎn)至圖3,其中示出了計算機可執(zhí)行指令的示例性實施例,用于確定指定話題的一個或多個影響者。圖3中所示的過程假設(shè)社交網(wǎng)絡(luò)數(shù)據(jù)可提供給服務(wù)器100,并且社交網(wǎng)絡(luò)數(shù)據(jù)包括多個用戶。在框301中,服務(wù)器100獲取表示為T的話題。例如,用戶可以通過顯示在計算裝置101處的GUI來進(jìn)入話題,并且計算裝置101將該話題發(fā)送到服務(wù)器100。在框302中,服務(wù)器使用該話題以識別與該話題相關(guān)的所有帖子。這些帖子集合共同地被表示為Pt。在示例實施例中,使用一個或多個附加搜索標(biāo)準(zhǔn),如規(guī)定時期。換言之,服務(wù)器可以僅檢查給定時段內(nèi)與話題相關(guān)的帖子。查找與特定話題相關(guān)的帖子可以用不同的方式實施,并且將在下文進(jìn)行詳細(xì)討論。
[0069]繼續(xù)圖3,服務(wù)器獲取帖子Pt的作者,并且基于排名(框303)識別前N個作者。排名最高的作者的集合由At表示。在示例實施例中,使用權(quán)威分?jǐn)?shù)識別前N個作者。其他方法和過程可以用于對作者進(jìn)行排名。例如,服務(wù)器使用網(wǎng)頁排名衡量話題網(wǎng)絡(luò)內(nèi)的用戶的重要性并且基于該衡量對用戶進(jìn)行排名??墒褂玫呐琶惴ǖ钠渌窍薅ㄐ允纠?特征向量中心性、加權(quán)度、中間狀態(tài)、樞紐和權(quán)威度量。
[0070]應(yīng)認(rèn)識到,作者是在社交網(wǎng)絡(luò)中創(chuàng)作帖子的用戶。還應(yīng)認(rèn)識到,N是自然數(shù)。N的非限制性示例值包括在3,000至5,000范圍內(nèi)的那些值??梢允褂肗的其他值。
[0071]在框304中,服務(wù)器將每個帖子Pt表征為‘回復(fù)’、‘提及’、或‘轉(zhuǎn)帖’,并且分別識別被回復(fù)的用戶、被提及的用戶、和首創(chuàng)的被轉(zhuǎn)帖(例如,被分組為回復(fù)用戶Ur、提及的用戶Um、和內(nèi)容被轉(zhuǎn)帖的用戶Urp)內(nèi)容的用戶。還可以記錄每個回復(fù)、提及、轉(zhuǎn)帖等的時間戳以便確定用戶之間的交互是否是最近的、或確定‘最近的’分級。
[0072]在框305中,服務(wù)器生成被稱為‘有興趣的用戶’的列表,該列表組合了前N個作者At和用戶Ur、Um和Urp。‘有興趣的用戶’列表或組中的用戶數(shù)量的非限制性不例包括在3,000至10,000范圍內(nèi)的那些數(shù)量。將認(rèn)識到,‘有興趣的用戶’組或列表中的用戶數(shù)量可以是其他值。
[0073]對于‘有興趣的用戶’列表中的每個用戶,服務(wù)器識別了每個用戶的追隨者(框306)。在框307中,服務(wù)器去除沒有列在該‘有興趣的用戶’列表中的追隨者,同時仍然識別出作為‘有興趣的用戶’的一部分的那些用戶之間的追隨者關(guān)系。
[0074]在框306的非限定性示例實施中,發(fā)現(xiàn)當(dāng)考慮與‘有興趣的用戶’相關(guān)聯(lián)的所有追隨者時,存在幾百萬條追隨者連接或邊緣??紤]所有這些追隨者邊緣可能耗費大量計算并且可能不揭示有影響力的交互。為了減少追隨者邊緣的數(shù)量,按照框307廢棄不是‘有興趣的用戶’的一部分的那些追隨者。
[0075]在框306和307的替代性實施例中,服務(wù)器識別局限于僅‘有興趣的用戶’組中列出的用戶的追隨者關(guān)系。
[0076]在框308中,服務(wù)器在‘有興趣的用戶’列表中的每個用戶與其追隨者之間創(chuàng)建鏈接。這樣可創(chuàng)建所有鏈接均具有相同權(quán)重(例如,1.0的權(quán)重)的追隨者-追隨網(wǎng)絡(luò)。
[0077]在框309中,在‘有興趣的用戶’列表中的每個用戶對(例如,A、B)之間,服務(wù)器識別A提及B的實例數(shù)量,A回復(fù)B的實例數(shù)量,以及A轉(zhuǎn)帖B的內(nèi)容的實例數(shù)量。可認(rèn)識到,用戶對不是一定要具有追隨者-被追隨者關(guān)系。例如,用戶A可以不追隨用戶B,但是用戶A可以提及用戶B,或者可以轉(zhuǎn)帖用戶B的內(nèi)容,或者可以回復(fù)用戶B的發(fā)帖。因此,用戶對(A、B)之間可能存在邊緣或者鏈接,即使一者不是另一者的追隨者。
[0078]此外,在框310中,在每個用戶對(例如,A,B)之間,服務(wù)器計算與用戶對A、B之間的鏈接或邊緣相關(guān)聯(lián)的權(quán)重,其中權(quán)重是至少A提及B的實例的數(shù)量、A回復(fù)B的實例的數(shù)量,以及A轉(zhuǎn)帖B的內(nèi)容的實例的數(shù)量的函數(shù)。例如,實例數(shù)量越高,加權(quán)權(quán)重越大。
[0079]在示例實施例中,在框308,如果存在追隨者-被追隨者鏈接,則邊緣的加權(quán)初始化于第一值(例如,1.0值),而如果沒有追隨者-被追隨者鏈接,則該邊緣初始化于第二值(例如,O值),其中第二值小于第一值。兩個用戶之間的每個附加活動(例如,回復(fù)、轉(zhuǎn)帖、提及)將使邊緣權(quán)重增加至最大加權(quán)值4.0。其他數(shù)量或者范圍可以被用于表示加權(quán)。
[0080]在示例實施例中,活動或?qū)嵗龜?shù)量的增加與加權(quán)的增加之間的關(guān)系的特征在于指數(shù)下降規(guī)模。例如,對于用戶對A、B,其中A追隨B,如果存在2個轉(zhuǎn)帖,則加權(quán)是2.0。如果有20個轉(zhuǎn)帖,則加權(quán)為3.9 ο如果有400個轉(zhuǎn)帖,則加權(quán)為4.0 ο應(yīng)認(rèn)識到,這些數(shù)量僅是示例,并且可以使用不同的數(shù)量和范圍。
[0081 ]在一個示例性實施例中,加權(quán)也基于交互(例如,轉(zhuǎn)帖、提及、回復(fù)等)發(fā)生的最近分級??梢酝ㄟ^確定進(jìn)行查詢的日期與發(fā)生交互的日期之間的時間差來計算‘最近’分級。例如,如果交互發(fā)生得更近,則例如加權(quán)更高。
[0082]繼續(xù)圖3,在框311中,服務(wù)器計算分別與‘有興趣的用戶’列表中的用戶及其關(guān)系對應(yīng)的節(jié)點和邊緣的網(wǎng)絡(luò)圖,其中,對這些關(guān)系或邊緣加權(quán)(例如,又稱為話題網(wǎng)絡(luò))。可以認(rèn)識到,本文應(yīng)用了圖論的原理。
[0083]在框312中,服務(wù)器在話題網(wǎng)絡(luò)中的用戶當(dāng)中識別社區(qū)(例如,C^C2,...,(:?)。這些社區(qū)的識別可以取決于,與另一個社區(qū)內(nèi)的節(jié)點相比較,一個社區(qū)內(nèi)的節(jié)點之間的連通性程度。也就是,社區(qū)是由,相對于所定義的社區(qū)外部的實體,內(nèi)部(例如,相對于同一社區(qū)中的其他節(jié)點)具有更高連通性程度的實體或節(jié)點定義的。如下定義,用于分離不同社區(qū)的連通性程度的值或閾值可以預(yù)定義(例如,社區(qū)圖數(shù)據(jù)庫128提供并且/或者從計算裝置101進(jìn)行用戶定義)。該解決方案因此定義了社區(qū)內(nèi)的節(jié)點的互連性密度。每個識別的社區(qū)圖因此是每個社區(qū)節(jié)點和邊緣(話題網(wǎng)絡(luò))的網(wǎng)絡(luò)圖的子集。一方面,社區(qū)圖進(jìn)一步顯示了社區(qū)(例如,作為節(jié)點)內(nèi)的用戶的視覺表示(用社區(qū)圖)和社區(qū)(例如,提供到圖1中的顯示屏125)內(nèi)的用戶的文本列表兩者。另一方面,根據(jù)在社區(qū)內(nèi)和/或在話題T(例如,提供到圖1中的顯示屏125)的所有社區(qū)內(nèi)的影響度,對社區(qū)內(nèi)的用戶列表的顯示進(jìn)行排名。根據(jù)框312,用戶Ut于是被分成其社區(qū)圖類別,如Uq、Uc2、...Ucn。
[0084]在框313中,針對每個給定社區(qū)(例如,C1),服務(wù)器基于給定社區(qū)內(nèi)的用戶(例如,Uc1)的社交網(wǎng)絡(luò)數(shù)據(jù)確定與該用戶相關(guān)聯(lián)的預(yù)定義特征(例如,以下各項中的一項或多項:常見的詞和短語、談話的話題、常見的位置、常見的圖片、常見的元數(shù)據(jù))的熱門特征值。所選擇的特征(例如,話題或位置)可以是用戶定義的(例如,通過從計算裝置101的輸入)和/或自動生成的(例如,基于同一話題網(wǎng)絡(luò)內(nèi)的其他社區(qū)的特征、或基于同一話題T的之前使用的特征)。在框314中,服務(wù)器輸出所識別的社區(qū)(例如,&Χ2、...Χη)以及與每個給定社區(qū)相關(guān)聯(lián)的熱門特征。所識別的社區(qū)可以作為與每個社區(qū)的預(yù)定義特征的特征值視覺關(guān)聯(lián)的社區(qū)圖輸出(例如,通過服務(wù)器以顯示在顯示屏125上)。
[0085]轉(zhuǎn)至圖4,提供了計算機可執(zhí)行指令或者處理器實施指令的另一個示例性實施例。執(zhí)行框301到311。框311之后,在框401中,服務(wù)器隨后對話題網(wǎng)絡(luò)內(nèi)的用戶進(jìn)行排名。例如,服務(wù)器使用網(wǎng)頁排名衡量話題網(wǎng)絡(luò)內(nèi)的用戶的重要性并且基于該衡量對用戶進(jìn)行排名??墒褂玫呐琶惴ǖ钠渌窍薅ㄐ允纠?特征向量中心性、加權(quán)度、中間狀態(tài)、樞紐和權(quán)威度量。
[0086]服務(wù)器識別并過濾掉話題網(wǎng)絡(luò)內(nèi)的離群值節(jié)點(框402)。離群值節(jié)點是被認(rèn)為與話題網(wǎng)絡(luò)中的較大的人群或用戶集群分開的離群值用戶。話題網(wǎng)絡(luò)中的離群值用戶或節(jié)點的集合被表示為Uo,其中Uo是‘有興趣的用戶’的子集。下文描述了關(guān)于識別和過濾離群值節(jié)點的更多的細(xì)節(jié)。
[0087]本過程繼續(xù)執(zhí)行框312到314,由此在去除離群值用戶Uo之后形成社區(qū)。
[0088]轉(zhuǎn)至圖5,提供了計算機可執(zhí)行指令或者處理器實施指令的另一個示例性實施例。執(zhí)行框301到311。在框311之后,服務(wù)器使用第一排名方法(框501)對話題網(wǎng)絡(luò)內(nèi)的用戶進(jìn)行排名。第一排名方法可以與或可以不與框401中使用的排名方法相同。完成該排名以識別針對給定話題在給定話題網(wǎng)絡(luò)中哪些用戶最有影響力。
[0089]在框502,服務(wù)器識別并過濾掉話題網(wǎng)絡(luò)內(nèi)的離群值節(jié)點(用戶Uo),其中Uo是‘有興趣的用戶’的子集。在框503,服務(wù)器使用基于在某一時期內(nèi)來自用戶的帖子的數(shù)量的第二排名方法來調(diào)整用戶Uo被去除的用戶的排名。例如,服務(wù)器確定如果與在同一時期內(nèi)第二用戶的帖子數(shù)量相比,第一用戶在上兩個月內(nèi)具有更高的帖子數(shù)量,則第一用戶的原始排名(從框501)可以提升,而第二用戶的排名保持不變或降低。
[0090]應(yīng)認(rèn)識到,基于所有用戶的網(wǎng)絡(luò)圖可以非常大。例如,可能存在數(shù)億用戶。分析用戶的整個數(shù)據(jù)集可能造成計算量非常大且耗時。因此,使用以上方法找出與話題T相關(guān)的更小的用戶集合減少了待分析的數(shù)據(jù)量。這也減少了處理時間。在示例實施例中,當(dāng)分析推特的整個社交網(wǎng)絡(luò)平臺時,已經(jīng)產(chǎn)生影響者的近實時結(jié)果。使用更小的用戶集合及相關(guān)聯(lián)的數(shù)據(jù),計算新話題網(wǎng)絡(luò)。該話題網(wǎng)絡(luò)比包含所有用戶的社交網(wǎng)絡(luò)圖更小(即,更少的節(jié)點和更少的邊緣)。基于話題網(wǎng)絡(luò)對用戶進(jìn)行排名比基于包括所有用戶的社交網(wǎng)絡(luò)圖對用戶排名快得多。
[0091]此外,識別和過濾話題網(wǎng)絡(luò)中的離群值節(jié)點有助于進(jìn)一步提高結(jié)果的品質(zhì)。
[0092]在框504之后,執(zhí)行框312到314。
[0093]圖2到圖5中所述的方法的更多細(xì)節(jié)如下所述。
[0094]獲取社交網(wǎng)絡(luò)數(shù)據(jù):
[0095]對于獲取社交網(wǎng)絡(luò)數(shù)據(jù),在一個示例性實施例中,盡管圖3到圖5中未圖示,但是服務(wù)器100獲取社交網(wǎng)絡(luò)數(shù)據(jù)。社交網(wǎng)絡(luò)數(shù)據(jù)可以使用各種方式獲取。以下是獲取社交網(wǎng)絡(luò)數(shù)據(jù)的非限定示例實施例。
[0096]轉(zhuǎn)至圖5,示出了用于獲取社交網(wǎng)絡(luò)數(shù)據(jù)的計算機可執(zhí)行指令的示例實施例。數(shù)據(jù),包括消息和元數(shù)據(jù),可以由服務(wù)器作為數(shù)據(jù)流實時(框600)地接收。例如,該數(shù)據(jù)使用壓縮行格式(框601)存儲在數(shù)據(jù)存儲器116中。在一個非限定性示例實施例中,使用MySQL數(shù)據(jù)庫。例如,框600和601由社交聯(lián)網(wǎng)數(shù)據(jù)模塊107實施。
[0097]在一個示例性實施例中,復(fù)制社交聯(lián)網(wǎng)模塊107接收的社交網(wǎng)絡(luò)數(shù)據(jù),并且社交網(wǎng)絡(luò)數(shù)據(jù)的副本存儲在多個服務(wù)器中。這有助于在分析社交網(wǎng)絡(luò)數(shù)據(jù)時進(jìn)行并行處理。換言之,一個服務(wù)器可以分析社交網(wǎng)絡(luò)數(shù)據(jù)的一個方面,而另一個服務(wù)器可以分析社交網(wǎng)絡(luò)數(shù)據(jù)的另一個方面。
[0098]服務(wù)器100使用索引器進(jìn)程(框602)對消息編制索引。例如,索引器進(jìn)程是獨立于存儲過程的單獨過程,該存儲過程包括消息在數(shù)據(jù)存儲器116中具體化的同時掃描消息。在一個示例性實施例中,索引器進(jìn)程自行在單獨的服務(wù)器上運行。這有助于并行處理。例如,索引器進(jìn)程是具體化每一天,或者其他指定時間段的索引數(shù)據(jù)表的多線程進(jìn)程。索引數(shù)據(jù)輸出并且存儲在索引存儲器117(框604)中。
[0099]簡要地轉(zhuǎn)向圖7,其中示出了示例性索引存儲器117,表中的每一行是唯一的用戶賬戶標(biāo)識符以及該天,或者該指定時間段內(nèi)產(chǎn)生的所有消息標(biāo)識符的對應(yīng)列表。除了天之夕卜,還使用其他時間段。在一個示例性實施例中,索引存儲器117中每天可讀取和寫入數(shù)百萬數(shù)據(jù)行,并且該過程可以在新數(shù)據(jù)被具體化或者添加到數(shù)據(jù)存儲器116中時發(fā)生。在一個示例性實施例中,索引存儲器117中使用了壓縮行格式。在另一個示例性實施例中,通過運行松弛的事物語義來避免死鎖,因為這樣可增加讀寫該表時多個線程的吞吐量。從背景因素來看,當(dāng)兩個或更多任務(wù)中的每個任務(wù)對其他任務(wù)嘗試鎖定的資源施加鎖定,以此來永久地彼此封鎖時,發(fā)生死鎖。
[0100]轉(zhuǎn)回圖6,服務(wù)器100進(jìn)一步獲取關(guān)于哪些用戶賬戶追隨其他用戶賬戶的信息(框603)。該過程包括識別與簡檔關(guān)聯(lián)的元數(shù)據(jù),以及將其存儲在簡檔存儲器中(塊605)。
[0101]在圖8中,簡檔存儲器119的示例示出了對于每個用戶賬戶,具有相關(guān)聯(lián)的與簡檔相關(guān)聯(lián)的元數(shù)據(jù)。例如,與簡檔相關(guān)的元數(shù)據(jù)包括用戶追隨者的總數(shù)、自我公開的個人信息、位置信息以及用戶列表。
[0102]數(shù)據(jù)獲取并且存儲之后,例如,可以分析該數(shù)據(jù),以識別專家和興趣。
[0103]確定與話題相關(guān)的帖子:
[0104]對于確定話題相關(guān)的帖子,依據(jù)框302,應(yīng)認(rèn)識到,該操作可以以多種方式發(fā)生。以下是可用于確定話題相關(guān)帖子的非限定性示例實施例。
[0?05]在一個示例性實施例中,確定與話題(例如,框302)相關(guān)帖子的操作基于Sysomos搜索引擎,并且在2009年7月10日提交的標(biāo)題為“信息發(fā)現(xiàn)和文本分析的方法和系統(tǒng)(Method and System for Informat1n Discovery and Text Analysis),,的第2009/0319518號美國專利申請公開案中有所描述,該專利申請以引用方式全文并入本文中。根據(jù)第2009/0319518號美國專利申請公開案中所述的過程,話題被用于識別特定時間間隔內(nèi)的熱門文件。具體來說,當(dāng)向第2009/0319518號美國專利申請公開案的系統(tǒng)提供話題(例如,關(guān)鍵字)時,該系統(tǒng)返回與該話題相關(guān)且熱門的相關(guān)文件(例如,帖子、推文、消息、文章等)。使用本文中所述的所提出的系統(tǒng)和方法,可執(zhí)行指令包括確定熱門文件的一個或多個作者的服務(wù)器100。這樣,一個或多個作者被識別為與指定話題相關(guān)的排名最高用戶。
[0106]對于框303,可以提供上限N以識別與指定話題相關(guān)聯(lián)的前N個用戶,其中N是自然數(shù)。在一個示例性實施例中,N是5000,但也可以使用其他數(shù)量。該前N個用戶可以根據(jù)已知或者未來已知的排名算法確定,或者使用社交媒體分析的已知或者未來已知的權(quán)威記分算法。
[0107]應(yīng)認(rèn)識到,其他示例性實施例中可以使用其他已知的以及未來已知的方式來識別與話題相關(guān)的帖子。
[0108]識別和過濾話題網(wǎng)絡(luò)中的離群值用戶:
[0109]對于識別和過濾話題網(wǎng)絡(luò)內(nèi)的離群值節(jié)點(例如,用戶),根據(jù)框402和502,應(yīng)認(rèn)識至|J,可以使用不同的計算。以下是實施框402和502的非限定示例實施例。
[0110]應(yīng)認(rèn)識到,可以通過去除有問題的離群值改進(jìn)來自話題網(wǎng)絡(luò)的數(shù)據(jù)。例如,也發(fā)生使用指麥當(dāng)勞(McDonalds)咖啡品牌的話題“麥咖啡(McCafe)”的查詢以將來自菲律賓的是具有相同名稱的卡拉ok酒吧/咖啡館的粉絲的一些用戶召回。因為它們碰巧是緊密的社區(qū),所以其影響者分?jǐn)?shù)經(jīng)常高到足以排名在關(guān)鍵的前十列表中。
[0111]轉(zhuǎn)到圖9,其中示出了展示未過濾的結(jié)果的話題網(wǎng)絡(luò)901的示例實施例的圖示。節(jié)點表示與話題McCafe相關(guān)的用戶集合。一些節(jié)點902或用戶來自菲律賓,是具有相同名稱McCafe的卡拉ok酒吧/咖啡館的粉絲。
[0112]這種現(xiàn)象有時在測試案例中發(fā)生,但不局限于話題McCafe的測試案例。在本文中應(yīng)認(rèn)識到,尋找McCafe的用戶沒有尋找McDonalds咖啡和菲律賓卡拉ok酒吧兩者,并且因此這個子網(wǎng)絡(luò)1302被認(rèn)為有噪聲。
[0113]為了實現(xiàn)降噪,在示例實施例中,服務(wù)器使用作為模塊性算法的變型的網(wǎng)絡(luò)社區(qū)檢測算法來識別和過濾話題查詢中的這些類型的離群值集群。在引用的紐曼M.E.J.(Newman,M.E.J.)(2006)的文章“網(wǎng)絡(luò)中的模塊性和社區(qū)結(jié)構(gòu)(Modularity and communitystructure in networks)”(美國國家科學(xué)院論文集103(23):8577-8696)中描述模塊性算法,其全部內(nèi)容通過引用并入本文。具體來說,該變型是考慮每個邊緣或者鏈接加權(quán)的模塊性算法的加權(quán)版本。這提高了所檢測社區(qū)的質(zhì)量,因為它可將人分組成社區(qū),不僅僅因為他們追隨他人或者被社區(qū)中的人追隨,還因為可能存在諸如回復(fù)、轉(zhuǎn)帖和提及的其他交互。
[0114]將認(rèn)識到,可以應(yīng)用其他類型的集群和社區(qū)檢測算法來確定話題網(wǎng)絡(luò)中的離群值。過濾幫助去除尋找與話題相關(guān)聯(lián)的影響者的用戶無意的或?qū)で蟮慕Y(jié)果。
[0115]如圖10中所示,相對于話題網(wǎng)絡(luò)901中的主要集群1002識別離群值集群1001。從話題網(wǎng)絡(luò)中去除用戶Uo離群值集群1001,并且主要集群1002中的剩余的用戶用于形成所輸出的影響者的排名列表。
[0116]在示例實施例中,服務(wù)器100計算以下指令以過濾掉離群值:
[0117]1.在話題網(wǎng)絡(luò)上執(zhí)行模塊性算法。
[0118]2.模塊性功能將話題網(wǎng)絡(luò)分解成多個模塊化社區(qū)或子網(wǎng)絡(luò),并且將每個節(jié)點加標(biāo)至IJX個集群/社區(qū)之一中。在示例實施例中,X〈n/2,因為社區(qū)具有不只一個成員,并且η是用戶數(shù)量,例如‘有興趣的用戶’列表中的用戶數(shù)量。
[0119]3.按社區(qū)內(nèi)的用戶的數(shù)量對社區(qū)分類,并且接受人口最多的社區(qū)。
[0120]4.當(dāng)節(jié)點人口的累積總和超過總數(shù)的80%時,從話題網(wǎng)絡(luò)中去除剩余的最小的社區(qū)。
[0121]關(guān)于圖11描述了用于識別并過濾話題網(wǎng)絡(luò)的計算機可執(zhí)行指令的一般示例實施例。可以認(rèn)識到,這些指令可以用于執(zhí)行框402和502。
[0122]在框1101中,服務(wù)器100將社區(qū)查找算法應(yīng)用于話題網(wǎng)絡(luò)從而將網(wǎng)絡(luò)分解為多個社區(qū)。用于找出社區(qū)的算法的非限制性示例包括最小割除法、分級群聚、格文-紐曼算法(Girvan-Newman algorithm)、以上參考的模塊性算法,以及基于團集(Clique-based)的方法。
[0123]在框1102中,服務(wù)器將每個節(jié)點(S卩,用戶)加標(biāo)到X個社區(qū)之一中,其中X〈n/2,并且η是話題網(wǎng)絡(luò)中的節(jié)點的數(shù)量。
[0124]在框1103中,服務(wù)器識別每個社區(qū)內(nèi)的節(jié)點的數(shù)量。
[0125]如果節(jié)點數(shù)量最大的社區(qū)還沒有被添加至經(jīng)過濾的話題網(wǎng)絡(luò)(框1104),則服務(wù)器將該社區(qū)添加至經(jīng)過濾的話題網(wǎng)絡(luò)??梢哉J(rèn)識到,首先,經(jīng)過濾的話題網(wǎng)絡(luò)包括零社區(qū),并且添加至經(jīng)過濾的話題網(wǎng)絡(luò)的第一社區(qū)是最大的社區(qū)。來自未經(jīng)過濾的話題網(wǎng)絡(luò)的同一社區(qū)不能不止一次被添加至經(jīng)過濾的話題網(wǎng)絡(luò)。
[0126]在框1105中,服務(wù)器確定經(jīng)過濾的話題網(wǎng)絡(luò)的中的節(jié)點的數(shù)量是否超過或大于原始或未經(jīng)過濾的話題網(wǎng)絡(luò)中的節(jié)點的數(shù)量的Y %。在示例實施例中,Y %是80 %。Y的其他百分比值也是適用的。如果沒有超過,則該過程環(huán)回到框1104。當(dāng)框1105的條件是真的時,該過程前進(jìn)到框1106。
[0127]通常,當(dāng)經(jīng)過濾的話題網(wǎng)絡(luò)中的節(jié)點的數(shù)量達(dá)到或超過未經(jīng)過濾的話題網(wǎng)絡(luò)中的節(jié)點的總數(shù)的多數(shù)百分比時,則已經(jīng)識別出主集群并且也識別出是離群值節(jié)點(例如,U0)的剩余節(jié)點。
[0128]在框1106中,輸出不包括離群值用戶Uo的經(jīng)過濾的話題網(wǎng)絡(luò)。
[0129]識別社區(qū)
[0130]轉(zhuǎn)至圖12,提供了用于從社交網(wǎng)絡(luò)數(shù)據(jù)識別社區(qū)的計算機可執(zhí)行指令的示例性實施例。
[0131]社交網(wǎng)絡(luò)平臺的特征是用戶追隨(或定義為朋友)另一個用戶。如之前所描述的,話題網(wǎng)絡(luò)內(nèi)的多個節(jié)點和邊緣圖示的用戶之間可存在其他類型的關(guān)系或互連性。在話題網(wǎng)絡(luò)內(nèi),影響者可以在不同程度上影響不同的用戶集群。也就是,基于關(guān)于圖12所描述的用于識別社區(qū)的過程,服務(wù)器被配置成用于識別單個話題網(wǎng)絡(luò)內(nèi)的被稱為社區(qū)的多個集群。由于影響在社交網(wǎng)絡(luò)平臺上不均勻,所以關(guān)于圖12定義的社區(qū)識別過程是有利的,因為其識別每個影響者(例如,通過使一個社區(qū)與另一個社區(qū)相關(guān)聯(lián))在話題網(wǎng)絡(luò)上的影響程度或深度。
[0132]如將在圖12中定義的,服務(wù)器被配置成用于提供不同的社區(qū)集合(例如,Cl,…,Cn)以及每個社區(qū)內(nèi)的排名最高影響者。在另一個優(yōu)選方面,服務(wù)器被配置成用于提供所有社區(qū)上的排名最高影響者的匯總列表,從而提供所有影響者的相對順序。
[0133]在框1201中,服務(wù)器被配置成用于從如之前描述的(例如,圖3到圖5)社交聯(lián)網(wǎng)數(shù)據(jù)獲取話題網(wǎng)絡(luò)圖信息。話題網(wǎng)絡(luò)以視覺方式圖示了節(jié)點,即‘有興趣的用戶’列表中的用戶集合之間的關(guān)系,該用戶集合各自被表示為話題網(wǎng)絡(luò)圖中的節(jié)點并且通過邊緣連接以表明話題網(wǎng)絡(luò)圖中的兩個用戶之間的關(guān)系(例如,追隨者關(guān)系、回復(fù)關(guān)系、提及關(guān)系、轉(zhuǎn)帖關(guān)系等)。在框1202中,服務(wù)器獲取內(nèi)部和/或外部互連性(例如,分辨率)的預(yù)定義的程度或衡量值用于定義社區(qū)之間的邊界。
[0134]在框1203中,服務(wù)器被配置成用于根據(jù)預(yù)定義的互連性程度(例如,分辨率)計算每個節(jié)點(例如,影響者)和邊緣的得分。也就是,在一個示例中,每個用戶句柄被分配一個模塊性類別標(biāo)識符(Mod ID)和一個頁面等級分?jǐn)?shù)(定義影響程度)。一方面,分辨率參數(shù)被配置成用于控制所識別的社區(qū)的密度和數(shù)量。在優(yōu)選方面,服務(wù)器利用提供2到10個社區(qū)的默認(rèn)分辨率值2。在另一方面,分辨率值是由用戶定義的(例如,通過圖2中的計算裝置101),以根據(jù)社區(qū)信息的可視化需要生成更高或更低的社區(qū)粒度。
[0135]在框1204中,服務(wù)器被配置成用于定義并輸出不同的社區(qū)集群(例如,C1J2,…,Cn),由此將用戶分區(qū)成Ucr-Ucn,這樣使得由網(wǎng)絡(luò)中的節(jié)點定義的每個用戶映射到相應(yīng)的社區(qū)。在一個示例性方面,模塊性分析用于定義社區(qū),這樣使得每個社區(qū)在社區(qū)內(nèi)的節(jié)點集群之間具有稠密的連接(高連接性),但與不同的社區(qū)中的節(jié)點具有稀疏的連接(低連接性)。在一個示例性方面,可以利用模塊性算法和/或密度算法(其衡量內(nèi)部連接性)實施社區(qū)檢測方法步驟1603-1606。此外,在一個方面,使用開源圖分析包Gephi以及/或者Javascript庫來實施結(jié)果的可視化。
[0136]在框1205中,服務(wù)器被配置成用于定義并輸出所有社區(qū)上的排名最高影響者和/或每個社區(qū)內(nèi)的排名最高影響者并且提供所有影響者的相對排序。在一個示例性方面,當(dāng)選定特定社區(qū)時,排名最高影響者在視覺上與其社區(qū)并排顯示。在又一個進(jìn)一步示例性方面,在框1205中,服務(wù)器被配置成用于提供所有社區(qū)上的所有排名最高影響者的匯總列表,以提供所有影響者的相對順序。
[0137]在框1206中,服務(wù)器被配置用于視覺上描繪并且區(qū)分每個社區(qū)集群(例如,通過顏色編碼、相對位置或者用于區(qū)分不同社區(qū)的其他視覺識別方法)。在進(jìn)一步方面,在框1206中,服務(wù)器被配置用于提供與對應(yīng)社區(qū)視覺上關(guān)聯(lián)的每個社區(qū)的排名最高影響者的集合。在又一個進(jìn)一步方面,在框1206中,服務(wù)器被配置用于改變社區(qū)圖的每個節(jié)點的大小以與對應(yīng)響應(yīng)者的分?jǐn)?shù)(例如,影響分?jǐn)?shù))對應(yīng)。作為框1206的輸出,節(jié)點的邊緣示出了每個用戶在其社區(qū)以及在不同社區(qū)之間的連接。
[0138]因此,如圖13到圖15中所示,社區(qū)和影響者(例如,每個社區(qū)內(nèi)排名的排名最高影響者以及/或者所有社區(qū)上的排名最高影響者的列表)的可視化可使得終端用戶(例如,圖2中的計算裝置101的用戶)能夠可視化其相關(guān)社區(qū)中的每個影響者的規(guī)模和相對重要性。
[0139]識別指定社區(qū)內(nèi)的熱門特征
[0140]如相對于圖3到圖5所述,在又一個進(jìn)一步方面,服務(wù)器被配置成用于,針對框1204提供的每個指定社區(qū)(例如,Cl),基于該指定社區(qū)(例如,C1)內(nèi)的用戶(例如,UCl)的社交網(wǎng)絡(luò)數(shù)據(jù),確定與其相關(guān)聯(lián)的預(yù)定義特征(例如,常見的關(guān)鍵字和短語、談話的話題、常見的位置、常見的圖像、常見的元數(shù)據(jù))的熱門特征值。因此,可以通過檢查每個社區(qū)&內(nèi)的用戶Uc1的預(yù)定義特征集合(例如,談話的話題)來定義趨勢或者共同性。在一個示例性方面,排名最高特征值的列表(例如,每個社區(qū)的所有用戶中的排名最高談話話題)在框1205中描繪,并且輸出到計算裝置101(如圖2所示),用于與每個社區(qū)關(guān)聯(lián)地顯示。
[0141]顯示社區(qū)和熱門特征
[0142]參見圖13到圖15,其中示出了從服務(wù)器的GUI模塊106提供并且輸出到計算裝置(如圖2中所示)的顯示屏125以可視化來自話題網(wǎng)絡(luò)的社區(qū)集群并且可視化每個社區(qū)中的熱門特征的屏幕截圖。服務(wù)器提供了用于選擇社區(qū)和/或話題網(wǎng)絡(luò)/特定社區(qū)內(nèi)的節(jié)點以可視化地展示每個節(jié)點(例如,用戶、社區(qū)信息以及影響程度)的詳情的交互式接口。因此,圖13到圖15示出了影響者社區(qū)及其特征(例如,在WordCloud可視化技術(shù)中的每個社區(qū)的談話)的交互式可視化。同樣如圖13到圖15中所示,每個社區(qū)(例如,由邊緣和節(jié)點組成)被可視化地與另一個社區(qū)區(qū)分開來(例如,通過顏色編碼),并且每個節(jié)點依據(jù)整個話題網(wǎng)絡(luò)內(nèi)的影響程序進(jìn)行大小調(diào)整。例如,用戶的影響程序?qū)?yīng)于社區(qū)或者話題網(wǎng)絡(luò)內(nèi)的用戶賬戶的排名。此外,通過選擇特定社區(qū)(例如,使用鼠標(biāo)或者指針視覺地選擇話題網(wǎng)絡(luò)中的社區(qū)),隨之描繪了社區(qū)值(例如,高亮顯示話題網(wǎng)絡(luò)圖內(nèi)的社區(qū),展示社區(qū)內(nèi)的排名最高影響者,并且展示所選社區(qū)的排名最高談話話題的熱門特征)。在圖13到圖15中,顯示屏(例如,圖2中的計算裝置101的屏幕)上熱門特征值的可視化被顯示成詞云,該詞云描繪了所選社區(qū)內(nèi)的排名最高談話話題以及特定社區(qū)的所有用戶中對每個話題的使用頻率指征。
[0143]例如,節(jié)點被進(jìn)行顏色編碼,以可視化地將其與其對應(yīng)的社區(qū)關(guān)聯(lián),并且每個節(jié)點的大小與其社區(qū)(顏色編碼)內(nèi)相對于整個話題網(wǎng)絡(luò)的影響者分?jǐn)?shù)成比例。選擇節(jié)點(例如,將鼠標(biāo)指針懸停在節(jié)點上方)時,Twitter句柄彈出,并且該句柄的信息顯示在屏幕上。
[0144]在另一個示例中,選擇子圖時,其可視化地高亮顯示該所選社區(qū)中的排名最高影響者,并且在屏幕上提供可視化呈現(xiàn)(例如,該社區(qū)的談話詞云)。其示出對社區(qū)行為、正面/負(fù)面情緒的見解。
[0145]示例情境:個人護(hù)理品品牌
[0146]在一個示例性實施例中,向圖3中所示的過程中輸入個人護(hù)理品品牌的名稱。圖13b中示出了使用加權(quán)分析的展示了影響者的社區(qū)網(wǎng)絡(luò)圖形輸出。個人護(hù)理品公司發(fā)布YouTube視頻,作為其一個廣告活動的一部分。該廣告活動的成功在于數(shù)百人通過Twitter分享了該YouTube視頻。圖13a示出了針對未加權(quán)的影響者圖獲取的結(jié)果的比較分析,而圖13b示出了使用加權(quán)分析的影響者圖。加權(quán)分析能夠?qū)ⅰ癥ouTube”識別成重要影響者,而未加權(quán)分析無法識別Youtube。對于將YouTube看作影響者的個人護(hù)理品公司,立即顯示該視頻廣告活動很受歡迎。
[0147]示例情境:制藥公司
[0148]在一個示例性實施例中,向圖3中所示的過程中輸入制藥公司的名稱。圖14中示出了使用加權(quán)分析的展示了影響者的社區(qū)網(wǎng)絡(luò)圖形輸出。對于制藥公司,當(dāng)出現(xiàn)重大公共關(guān)系錯誤(例如,循環(huán)出現(xiàn)關(guān)于其一種藥品的不當(dāng)信息)時,該公司需要識別出能夠幫助盡快處理該情況的影響者。例如,制藥公司已經(jīng)宣布該公司不再花錢雇傭醫(yī)生或者其他保健專家來宣傳該公司產(chǎn)品。關(guān)于該公司決定的文章出現(xiàn)在多個網(wǎng)站上:Dr.Merco Ia網(wǎng)站、紐約時報暢銷書作家,以及時代雜志(TIME)、洛杉磯時報(LA Times)、美國有線電視新聞網(wǎng)絡(luò)(CNN)、??怂剐侣?Fox News)、美國廣播公司新聞網(wǎng)(ABC News)和今日秀(Today Show)特輯中。
[0149]在圖14中,加權(quán)影響者過程將Omercola(該網(wǎng)站的推特句柄)視作該社區(qū)中談?wù)撛撛掝}的排名最高影響者之一。因此,在必要時,該制藥公司可以將‘mercola’的網(wǎng)站或者網(wǎng)站平臺視作傳播任何重要信息的重要影響者。
[0150]示例情境:超級足球杯(Super Bowl)
[0151]在一個示例性實施例中,向圖3中所示的過程中輸入話題“超級足球杯”。圖15b中示出了使用加權(quán)分析的展示了影響者的社區(qū)網(wǎng)絡(luò)圖形輸出。從背景來看,超級足球杯是美國的熱門體育事件。許多大品牌和電視頻道想要通過組織與其關(guān)聯(lián)的公共關(guān)系事件來利用超級足球杯。例如,在上一屆超級足球杯之前,脫口秀節(jié)目“艾倫秀(Ellen show)”或者“艾倫.德杰尼勒斯秀(Ellen DeGeneres Show)”將為一些賽事的獲勝者送出超級足球杯的免費門票。當(dāng)該秀的官方推特句柄“Otheellenshow”作為排名最高影響者出現(xiàn),并且存在談?wù)撛摴碴P(guān)系活動的整個社區(qū)時,可以看到該賽事的成功。圖15示出了未加權(quán)分析(圖15a)和加權(quán)分析(圖15b)獲取的結(jié)果的比較分析。加權(quán)和未加權(quán)版本均識別了談?wù)撢A得超級足球杯的免費門票的社區(qū),但是加權(quán)分析還能夠識別來源或者影響者“Otheellenshow”,如圖15b中所示。
[0152]超級足球杯案例研究。(A)描繪了識別主要談?wù)摮壸闱虮?、丹佛野馬(Broncos)與西雅圖海鷹(Seahawks)或者免費門票的影響者的舊方法。(B)描繪了除此之外還識別“theellenshow”的新方法的結(jié)果。
[0153]因此,提供了用于針對指定查詢話題識別其社交社區(qū)(基于所獲取的社交聯(lián)網(wǎng)數(shù)據(jù))內(nèi)的影響者的系統(tǒng)和方法??梢粤私獾?,影響者的特征不一,并且實際上,即便在指定的話題網(wǎng)絡(luò)內(nèi),也存在影響者的社區(qū)。本文提供的系統(tǒng)和方法被用于在可視化于網(wǎng)絡(luò)圖中的計算裝置(例如,計算裝置101)上輸出可視化以展示實體或者個人的相對影響者以及它們的對應(yīng)社區(qū)。此外,熱門特征值(例如,基于預(yù)定義的特征,例如談話的話題)被可視化地描繪在展示排名最高的或者相關(guān)的話題的每個社區(qū)的計算裝置的顯示屏上。這些話題可以描繪成每個社區(qū)談話的詞云,以可視化地展示各個社區(qū)的行為特征。
[0154]以下描述了所提出的計算系統(tǒng)和方法的一般性示例實施例。
[0155]在一個示例性實施例中,提供了一種由服務(wù)器執(zhí)行的、用于針對話題確定至少一個用戶賬戶的加權(quán)影響的方法。在另一個示例性實施例中,提供了一種服務(wù)器系統(tǒng)或者服務(wù)器,用于針對話題確定至少一個用戶賬戶的加權(quán)影響,該服務(wù)器系統(tǒng)包括處理器、存儲器和存儲在存儲器上的可執(zhí)行指令。所述方法或者指令,或者這兩者,包括:所述服務(wù)器獲取所述話題;確定一個或多個社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的帖子,所述服務(wù)器有權(quán)限訪問來自一個或多個社交數(shù)據(jù)網(wǎng)絡(luò)的數(shù)據(jù);將每個帖子描述成以下各項中的一項或多項:另一個發(fā)帖的回復(fù)帖子,另一個用戶賬戶的提及帖子,以及原始發(fā)帖的轉(zhuǎn)帖;生成用戶賬戶組,其中所述用戶賬戶組包括創(chuàng)作在所述提及帖子中被提及的發(fā)帖,發(fā)布原始發(fā)帖,創(chuàng)作與所述話題相關(guān)的一個或多個帖子,或者其任何組合的用戶賬戶;將所述組中的每個所述用戶賬戶表示成相連圖中的節(jié)點并且在一個或多個節(jié)點對之間建立邊緣;對于指定節(jié)點對之間的每個邊緣,確定加權(quán),該加權(quán)是以下各項中的一項或多項的函數(shù):是否存在追隨者-被追隨者關(guān)系,涉及指定節(jié)點對的提及帖子的數(shù)量、回復(fù)帖子的數(shù)量和轉(zhuǎn)帖的數(shù)量;并且使用每個所述節(jié)點和所述邊緣計算話題網(wǎng)絡(luò)圖,每個邊緣與加權(quán)關(guān)聯(lián)。
[0156]在一個示例性方面,當(dāng)指定節(jié)點對之間存在追隨者-被追隨者關(guān)系,則將邊緣的加權(quán)初始化成默認(rèn)值,并且基于以下各項中的任一項或者更多項進(jìn)一步調(diào)整加權(quán):涉及指定節(jié)點對的提及帖子的數(shù)量、回復(fù)帖子的數(shù)量以及轉(zhuǎn)帖的數(shù)量。
[0157]在一個示例性方面,所述方法或者指令,或者這兩者,進(jìn)一步包括:在話題網(wǎng)絡(luò)圖中對用戶賬戶進(jìn)行排名,以過濾掉話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點;在經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的用戶賬戶之間識別出至少兩個不同的社區(qū),每個社區(qū)與用戶賬戶的子集關(guān)聯(lián);識別與每個社區(qū)關(guān)聯(lián)的屬性;以及輸出與對應(yīng)屬性關(guān)聯(lián)的每個社區(qū)。
[0158]在一個示例性方面,所述方法或者指令或者這兩者進(jìn)一步包括:對每個社區(qū)內(nèi)的用戶賬戶進(jìn)行排名;以及對于每個社區(qū),提供映射到對應(yīng)社區(qū)的用戶賬戶的已排名列表。
[0159]在一個示例性方面,對用戶賬戶進(jìn)行排名進(jìn)一步包括:將每個已排名的用戶賬戶映射到對應(yīng)的社區(qū);以及輸出至少兩個社區(qū)的用戶賬戶的已排名列表。
[0160]在一個示例性方面,所述屬性與每個用戶賬戶與社交數(shù)據(jù)網(wǎng)絡(luò)的交互相關(guān)聯(lián)。
[0161]在一個示例性方面,所述屬性與用戶賬戶的屬性的組合頻率關(guān)聯(lián)地顯示。
[0162]在一個示例性方面,所述屬性是特定社區(qū)內(nèi)的用戶的談話話題的頻率。
[0163]在另一個示例性實施例中,方法由服務(wù)器實施,用于確定對話題具有影響力的至少一個用戶賬戶。所述方法包括:獲取所述話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的多個用戶賬戶;將每個所述用戶賬戶表示成相連圖中的節(jié)點,并且確定每個所述用戶賬戶之間是否存在關(guān)系;通過將每個所述用戶賬戶用作節(jié)點并且將對應(yīng)關(guān)系用作每個所述節(jié)點之間的邊緣,計算話題網(wǎng)絡(luò)圖;對話題網(wǎng)絡(luò)圖內(nèi)的用戶賬戶進(jìn)行排名,以過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點;在經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的用戶賬戶中識別出至少兩個不同的社區(qū),每個社區(qū)與用戶賬戶的子集關(guān)聯(lián);識別與每個社區(qū)關(guān)聯(lián)的屬性;以及輸出與對應(yīng)的屬性關(guān)聯(lián)的每個社區(qū)。
[0164]在一個示例性方面,所述方法進(jìn)一步包括:對每個社區(qū)內(nèi)的用戶賬戶進(jìn)行排名;以及對于每個社區(qū),提供映射到對應(yīng)社區(qū)的用戶賬戶的已排名列表。
[0165]在一個示例性方面,其中對用戶賬戶進(jìn)行排名進(jìn)一步包括:將每個已排名的用戶賬戶映射到對應(yīng)的社區(qū);以及輸出至少兩個社區(qū)的用戶賬戶的已排名列表。
[0166]在一個示例性方面,其中所述屬性與每個用戶賬戶與社交數(shù)據(jù)網(wǎng)絡(luò)的交互相關(guān)聯(lián)。
[0167]在一個示例性方面,其中所述屬性與用戶賬戶的屬性的組合頻率關(guān)聯(lián)地顯示。
[0168]在一個示例性方面,其中所述屬性是特定社區(qū)內(nèi)的用戶的談話話題的頻率。
[0169]在一個示例性實施例中,所述方法進(jìn)一步包括:在圖形用戶界面中顯示至少兩個不同的社區(qū),這兩個不同的社區(qū)包括顏色編碼的節(jié)點和邊緣,其中所述顏色編碼的節(jié)點和邊緣的至少第一部分是與第一社區(qū)關(guān)聯(lián)的第一顏色,并且所述顏色編碼的節(jié)點和邊緣的至少第二部分是與第二社區(qū)關(guān)聯(lián)的第二顏色。
[0170]在一個示例性方面,其中指定顏色編碼的節(jié)點的大小與指定顏色編碼的節(jié)點所代表的指定用戶賬戶的影響程度相關(guān)聯(lián)。
[0171]在一個示例性方面,所述方法進(jìn)一步包括顯示與指定社區(qū)關(guān)聯(lián)的詞語,這些詞語與指定社區(qū)的屬性相對應(yīng)。
[0172]在一個示例性方面,所述方法進(jìn)一步包括:在圖形用戶界面中檢測與指定社區(qū)交互的用戶控制的指針;以及以下各項中的至少一項:顯示指定社區(qū)中的一個或多個排名最高的用戶賬戶;可視化地高亮顯示指定社區(qū);以及顯示與指定社區(qū)相關(guān)聯(lián)的詞語,這些詞語與指定社區(qū)的屬性相對應(yīng)。
[0173]在另一個示例性實施例中,提供了一種用于確定對話題具有影響力的至少一個用戶賬戶的計算系統(tǒng)。所述計算系統(tǒng)包括:通信裝置;存儲器;以及處理器,所述處理器被配置用于至少:獲取所述話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的多個用戶賬戶;將每個所述用戶賬戶表示成相連圖中的節(jié)點,并且確定每個所述用戶賬戶之間是否存在關(guān)系;通過將每個所述用戶賬戶用作節(jié)點并且將對應(yīng)關(guān)系用作每個所述節(jié)點之間的邊緣,計算話題網(wǎng)絡(luò)圖;對話題網(wǎng)絡(luò)圖內(nèi)的用戶賬戶進(jìn)行排名,以過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點;在經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的用戶賬戶中識別出至少兩個不同的社區(qū),每個社區(qū)與用戶賬戶的子集關(guān)聯(lián);識別與每個社區(qū)關(guān)聯(lián)的屬性;以及輸出與對應(yīng)的屬性關(guān)聯(lián)的每個社區(qū)。
[0174]在另一個示例性實施例中,提供了一種由服務(wù)器實施、用于確定對話題具有影響力的一個或多個用戶的方法。所述方法包括:獲取話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的用戶;將每個所述用戶建模成節(jié)點,并且確定每個所述用戶之間的關(guān)系;通過將所述用戶用作節(jié)點并且將所述關(guān)系用作邊緣,計算話題網(wǎng)絡(luò)圖;對所述話題網(wǎng)絡(luò)圖內(nèi)的用戶進(jìn)行排名;識別并且過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點;以及根據(jù)其關(guān)聯(lián)的排名,輸出所述話題網(wǎng)絡(luò)圖內(nèi)剩余的用戶。
[0175]在一個示例性方面,對包含所述話題的內(nèi)容進(jìn)行消耗以及生成中的至少一者的用戶被視作與所述話題相關(guān)的用戶。
[0176]在另一個示例性方面,在所述話題網(wǎng)絡(luò)圖中,至少兩個用戶之間定義的邊緣代表所述至少兩個用戶之間的朋友連接。
[0177]在另一個示例性方面,在所述話題網(wǎng)絡(luò)圖中,至少兩個用戶之間定義的邊緣代表所述至少兩個用戶之間的追隨者-被追隨者連接,并且其中所述至少兩個用戶中的一個用戶是追隨者,而所述至少兩個用戶中的另一個用戶是被追隨者。
[0178]在另一個示例性方面,在所述話題網(wǎng)絡(luò)圖中,至少兩個用戶之間定義的邊緣代表所述至少兩個用戶之間的回復(fù)連接,并且其中所述至少兩個用戶中的一個用戶對所述至少兩個用戶中的另一個用戶的發(fā)帖做出回復(fù)。
[0179]在另一個示例性方面,在所述話題網(wǎng)絡(luò)圖中,至少兩個用戶之間定義的邊緣代表所述至少兩個用戶之間的轉(zhuǎn)帖連接,并且其中所述至少兩個用戶中的一個用戶對所述至少兩個用戶中的另一個用戶的發(fā)帖進(jìn)行轉(zhuǎn)帖。
[0180]在另一個示例性方面,所述排名包括使用頁面等級算法衡量所述話題網(wǎng)絡(luò)內(nèi)的指定用戶的重要性。
[0181]在另一個示例性方面,所述排名包括使用以下各項中的至少一項:特征向量中心性、加權(quán)度、中間狀態(tài)、樞紐以及權(quán)威度量。
[0182]在另一個示例性方面,識別和過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點包括:對所述話題網(wǎng)絡(luò)圖應(yīng)用集群算法、模塊性算法以及社區(qū)檢測算法中的至少一個,以輸出多個社區(qū);按照所述多個社區(qū)中的每個社區(qū)內(nèi)的用戶數(shù)量對所述多個社區(qū)進(jìn)行排序;選擇用戶數(shù)量最大的數(shù)量η的社區(qū),其中所述η數(shù)量的社區(qū)中的用戶累加和至少滿足所述話題網(wǎng)絡(luò)圖中的用戶總數(shù)的百分?jǐn)?shù)閾值;以及將未選擇社區(qū)中的用戶建立為離群值節(jié)點。
[0183]在另一個示例性實施例中,提供了一種用于確定對話題具有影響力的一個或多個用戶的計算系統(tǒng)。所述計算系統(tǒng)包括:通信裝置;存儲器;以及處理器。所述處理器被配置用于至少:獲取話題;確定社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的用戶;將每個所述用戶建模成節(jié)點,并且確定每個所述用戶之間的關(guān)系;通過將所述用戶用作節(jié)點并且將所述關(guān)系用作邊緣,計算話題網(wǎng)絡(luò)圖;對所述話題網(wǎng)絡(luò)圖內(nèi)的用戶進(jìn)行排名;識別并且過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點;以及根據(jù)其關(guān)聯(lián)的排名,輸出所述話題網(wǎng)絡(luò)圖內(nèi)剩余的用戶。
[0184]將認(rèn)識到,本文中所描述的系統(tǒng)和方法的示例實施例的不同特征可以用不同的方式相互組合。換言之,盡管沒有具體闡明,但根據(jù)其他示例實施例,不同的模塊、操作和部件可以一起使用。
[0185]本文中描述的所流程圖中的步驟或操作僅是示例。在不脫離本發(fā)明或這些發(fā)明的精神的情況下,這些步驟或操作可以有許多變化。例如,這些步驟可以按不同的順序進(jìn)行,或者可以添加、刪除或修改步驟。
[0186]本文所述的GUI和屏幕截圖僅用于示例說明。在不脫離本發(fā)明或這些發(fā)明的精神的情況下,圖形和交互式元素可以有許多變化。例如,該等元素可以位于不同地方,或者可以添加、刪除或者修改。
[0187]盡管已經(jīng)參照某些特定實施例對以上內(nèi)容進(jìn)行了描述,但在不脫離所附權(quán)利要求書的范圍的情況下,其各種修改對于本領(lǐng)域的技術(shù)人員而言將是明顯的。
【主權(quán)項】
1.一種通過服務(wù)器執(zhí)行的方法,所述方法用于針對話題確定至少一個用戶賬戶的加權(quán)影響,所述方法包括: 所述服務(wù)器獲取所述話題; 確定一個或多個社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的帖子,所述服務(wù)器有權(quán)限訪問來自所述一個或多個社交數(shù)據(jù)網(wǎng)絡(luò)的數(shù)據(jù); 將每個帖子描述成以下各項中的一項或多項:另一個發(fā)帖的回復(fù)帖子、另一個用戶賬戶的提及帖子,以及原始發(fā)帖的轉(zhuǎn)帖; 生成用戶賬戶組,所述用戶賬戶組中包括創(chuàng)作在所述提及帖子中被提及的帖子、發(fā)布所述原始帖子、創(chuàng)作與所述話題相關(guān)的一個或多個帖子,或者其任何組合的任何用戶賬戶; 將所述組中的每個所述用戶賬戶表示成相連圖中的節(jié)點,并且在一個或多個節(jié)點對之間建立邊緣; 對于指定節(jié)點對之間的每個邊緣,確定加權(quán),所述加權(quán)是以下各項中的一項或多項的函數(shù): 是否存在追隨者-被追隨者關(guān)系,涉及所述指定節(jié)點對的提及帖子的數(shù)量、回復(fù)帖子的數(shù)量以及轉(zhuǎn)帖的數(shù)量;以及 計算利用每個所述節(jié)點和所述邊緣的話題網(wǎng)絡(luò)圖,每個邊緣與加權(quán)關(guān)聯(lián)。2.根據(jù)權(quán)利要求1所述的方法,其中,如果所述指定節(jié)點對之間存在所述追隨者-被追隨者關(guān)系,則將所述邊緣的所述加權(quán)初始化成默認(rèn)值,并且基于以下各項中的任一項或者更多項進(jìn)一步調(diào)整所述加權(quán):涉及所述指定節(jié)點對的所述提及帖子的數(shù)量、所述回復(fù)帖子的數(shù)量以及所述轉(zhuǎn)帖的數(shù)量。3.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括: 對所述話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶進(jìn)行排名,以過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點; 在經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶中識別出至少兩個不同的社區(qū),每個社區(qū)與所述用戶賬戶的子集關(guān)聯(lián); 識別與每個社區(qū)關(guān)聯(lián)的屬性;以及 輸出與對應(yīng)屬性關(guān)聯(lián)的每個社區(qū)。4.根據(jù)權(quán)利要求3所述的方法,其進(jìn)一步包括:對每個社區(qū)內(nèi)的所述用戶賬戶進(jìn)行排名;以及對于每個社區(qū),提供映射到對應(yīng)社區(qū)的所述用戶賬戶的已排名列表。5.根據(jù)權(quán)利要求4所述的方法,其中對所述用戶賬戶進(jìn)行排名進(jìn)一步包括:將每個已排名的用戶賬戶映射到對應(yīng)的社區(qū);以及輸出所述至少兩個社區(qū)的所述用戶賬戶的已排名列表。6.根據(jù)權(quán)利要求3所述的方法,其中所述屬性與每個用戶賬戶與所述社交數(shù)據(jù)網(wǎng)絡(luò)的交互相關(guān)聯(lián)。7.根據(jù)權(quán)利要求3所述的方法,其中所述屬性與所述用戶賬戶的所述屬性的組合頻率關(guān)聯(lián)地顯不。8.根據(jù)權(quán)利要求3所述的方法,其中所述屬性是特定社區(qū)內(nèi)的用戶的談話話題的頻率。9.根據(jù)權(quán)利要求3所述的方法,其進(jìn)一步包括:在圖形用戶界面中顯示所述至少兩個不同的社區(qū),所述至少兩個不同的社區(qū)包括顏色編碼的節(jié)點和邊緣,其中所述顏色編碼的節(jié)點和邊緣的至少第一部分是與第一社區(qū)關(guān)聯(lián)的第一顏色,并且所述顏色編碼的節(jié)點和邊緣的至少第二部分是與第二社區(qū)關(guān)聯(lián)的第二顏色。10.根據(jù)權(quán)利要求9所述的方法,其中指定顏色編碼的節(jié)點的大小與所述指定顏色編碼的節(jié)點所代表的指定用戶賬戶的影響程度相關(guān)聯(lián)。11.一種用于針對話題確定至少一個用戶賬戶的加權(quán)影響的計算系統(tǒng),所述計算系統(tǒng)包括: 通信裝置; 存儲器;以及 處理器,所述處理器被配置用于至少: 獲取所述話題; 確定一個或多個社交數(shù)據(jù)網(wǎng)絡(luò)內(nèi)與所述話題相關(guān)的帖子,所述計算系統(tǒng)有權(quán)限訪問來自所述一個或多個社交數(shù)據(jù)網(wǎng)絡(luò)的數(shù)據(jù); 將每個帖子描述成以下各項中的一項或多項:另一個發(fā)帖的回復(fù)帖子、另一個用戶賬戶的提及帖子,以及原始發(fā)帖的轉(zhuǎn)帖; 生成用戶賬戶組,所述用戶賬戶組中包括創(chuàng)作在所述提及帖子中被提及的帖子、發(fā)布所述原始帖子、創(chuàng)作與所述話題相關(guān)的一個或多個帖子,或者其任何組合的任何用戶賬戶;將所述組中的每個所述用戶賬戶表示成相連圖中的節(jié)點,并且在一個或多個節(jié)點對之間建立邊緣; 對于指定節(jié)點對之間的每個邊緣,確定加權(quán),所述加權(quán)是以下各項中的一項或多項的函數(shù): 是否存在追隨者-被追隨者關(guān)系,涉及所述指定節(jié)點對的提及帖子的數(shù)量、回復(fù)帖子的數(shù)量以及轉(zhuǎn)帖的數(shù)量;以及 計算利用每個所述節(jié)點和所述邊緣的話題網(wǎng)絡(luò)圖,每個邊緣與加權(quán)關(guān)聯(lián)。12.根據(jù)權(quán)利要求11所述的計算系統(tǒng),其中,如果所述指定節(jié)點對之間存在所述追隨者-被追隨者關(guān)系,則將所述邊緣的所述加權(quán)初始化成默認(rèn)值,并且基于以下各項中的任一項或者更多項進(jìn)一步調(diào)整所述加權(quán):涉及所述指定節(jié)點對的所述提及帖子的數(shù)量、所述回復(fù)帖子的數(shù)量以及所述轉(zhuǎn)帖的數(shù)量。13.根據(jù)權(quán)利要求11所述的計算系統(tǒng),其中所述處理器進(jìn)一步被配置用于: 對所述話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶進(jìn)行排名,以過濾掉所述話題網(wǎng)絡(luò)圖內(nèi)的離群值節(jié)點; 在經(jīng)過濾的話題網(wǎng)絡(luò)圖內(nèi)的所述用戶賬戶中識別出至少兩個不同的社區(qū),每個社區(qū)與所述用戶賬戶的子集關(guān)聯(lián); 識別與每個社區(qū)關(guān)聯(lián)的屬性;以及 輸出與對應(yīng)屬性關(guān)聯(lián)的每個社區(qū)。14.根據(jù)權(quán)利要求13所述的計算系統(tǒng),其中所述處理器進(jìn)一步用于:對每個社區(qū)內(nèi)的所述用戶賬戶進(jìn)行排名;以及對于每個社區(qū),提供映射到對應(yīng)社區(qū)的所述用戶賬戶的已排名列表。15.根據(jù)權(quán)利要求14所述的計算系統(tǒng),其中對所述用戶賬戶進(jìn)行排名進(jìn)一步包括:將每個已排名的用戶賬戶映射到對應(yīng)的社區(qū);以及輸出所述至少兩個社區(qū)的所述用戶賬戶的已排名列表。16.根據(jù)權(quán)利要求13所述的計算系統(tǒng),其中所述屬性與每個用戶賬戶與所述社交數(shù)據(jù)網(wǎng)絡(luò)的交互相關(guān)聯(lián)。17.根據(jù)權(quán)利要求13所述的計算系統(tǒng),其中所述屬性與所述用戶賬戶的所述屬性的組合頻率關(guān)聯(lián)地顯不。18.根據(jù)權(quán)利要求13所述的計算系統(tǒng),其中所述屬性是特定社區(qū)內(nèi)的用戶的談話話題的頻率。19.根據(jù)權(quán)利要求13所述的計算系統(tǒng),其進(jìn)一步包括顯示裝置,并且其中所述處理器進(jìn)一步被配置用于:在圖形用戶界面中顯示所述至少兩個不同的社區(qū),所述至少兩個不同的社區(qū)包括顏色編碼的節(jié)點和邊緣,其中所述顏色編碼的節(jié)點和邊緣的至少第一部分是與第一社區(qū)關(guān)聯(lián)的第一顏色,并且所述顏色編碼的節(jié)點和邊緣的至少第二部分是與第二社區(qū)關(guān)聯(lián)的第二顏色。20.根據(jù)權(quán)利要求19所述的計算系統(tǒng),其中指定顏色編碼的節(jié)點的大小與所述指定顏色編碼的節(jié)點所代表的指定用戶賬戶的影響程度相關(guān)聯(lián)。
【文檔編號】G06Q50/00GK105849763SQ201480070176
【公開日】2016年8月10日
【申請日】2014年10月23日
【發(fā)明人】愛德華·東晉·金, 布萊恩·佳利·耿, 干乍那·帕德馬納班
【申請人】西斯摩斯公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1