一種基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈的方法
【專利摘要】本發(fā)明公開了一種基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈的方法,包括:建立特征向量步驟;計算朋友之間的曼哈頓距離步驟;選定核心朋友步驟;劃分社團步驟;社團優(yōu)化調(diào)整步驟。本發(fā)明先使用節(jié)點屬性進行初步的社團劃分,然后利用網(wǎng)絡結(jié)構(gòu)信息對于劃分結(jié)果進一步優(yōu)化調(diào)整,充分利用在線社交網(wǎng)絡中可以獲取到的信息,能夠獲得更加準確的社團劃分結(jié)果,從而實現(xiàn)對用戶的朋友圈自動分組,能夠有效完善社交網(wǎng)絡平臺功能,適用于社交網(wǎng)絡平臺功能的應用和優(yōu)化。
【專利說明】—種基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈的方法
【技術領域】
[0001]本發(fā)明屬于數(shù)據(jù)處理【技術領域】,尤其是涉及一種根據(jù)社交網(wǎng)絡中用戶朋友圈中朋友的檔案信息,進行分組劃分,然后利用朋友圈中朋友連接關系對分組進行優(yōu)化的朋友圈分組方法。
【背景技術】
[0002]社會網(wǎng)絡是指社會個體成員之間因為互動而形成的相對穩(wěn)定的關系體系,這些個體成員擁有共同的興趣、同屬某一特定的主題或是共有某種屬性。隨著社交網(wǎng)絡的發(fā)展,我們可能在一個社交網(wǎng)絡平臺上擁有幾百甚至上千在線朋友組成的朋友圈,我們“粉”(建立社交關系)的人會產(chǎn)生大量的信息,為了處理信息過載問題,就需要管理我們的個人社交網(wǎng)絡。當社交朋友數(shù)量越來越龐大時,對朋友圈進行分組就成為必然。而當前的社交網(wǎng)絡平臺中沒有提供自動分組功能,對于在社交平臺上擁有上千乃至上萬朋友的用戶來說,手工對朋友圈進行分組是一件耗時費力的事情。
【發(fā)明內(nèi)容】
[0003]為解決上述問題,本發(fā)明公開了基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈的方法,它先采用朋友圈中用戶的檔案信息作為依據(jù)進行粗略的分組,然后利用朋友圈的網(wǎng)絡結(jié)構(gòu)對分組進行調(diào)整,實現(xiàn)對于朋友圈自動分組的功能。
[0004]為了達到上述目的,本發(fā)明提供如下技術方案:
[0005]一種基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈的方法,包括以下步驟:
[0006]建立特征向量:根據(jù)當前用戶朋友圈中每個朋友的檔案信息建立朋友的特征向量;
[0007]計算朋友之間的曼哈頓距離:先對兩個朋友之間的特征向量取并,然后對得到的結(jié)果向量取模;
[0008]選定核心朋友:選取與其他任意朋友距離都小于閾值α的朋友作為核心;
[0009]劃分社團:針對每個核心朋友,找到其余用戶與核心朋友共同的特征,根據(jù)共同特征擴展具有相同特征的朋友形成社團;
[0010]社團優(yōu)化調(diào)整:將朋友調(diào)整至與其連接數(shù)最大的分組中。
[0011]進一步的,所述特征向量包括以下信息中的至少一種:年齡、性別、所在地、出生地、教育經(jīng)歷、工作單位、工作地點、愛好。
[0012]優(yōu)選的,閾值α的取值范圍如下:1/3特征向量維度數(shù)彡閾值α ( 1/2特征向量維度數(shù)。
[0013]具體的,所述特征向量維度數(shù)與建立特征向量步驟中選取的檔案信息數(shù)量一致。
[0014]具體的,所述社團優(yōu)化調(diào)整步驟具體為:計算每個朋友與其所屬的多個分組的連接數(shù),選其最大連接數(shù)的分組作為該朋友的分組,循環(huán)迭代,直到分組不再發(fā)生變化或者達到一定的次數(shù)。
[0015]與現(xiàn)有技術相比,本發(fā)明具有如下優(yōu)點和有益效果:
[0016]本發(fā)明基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈,有效組織個人朋友圈,從而可以過濾冗雜無用的信息,有效避免信息過載問題。本發(fā)明先使用節(jié)點屬性進行初步的社團劃分,然后利用網(wǎng)絡結(jié)構(gòu)信息對于劃分結(jié)果進一步優(yōu)化調(diào)整,充分利用在線社交網(wǎng)絡中可以獲取到的用戶檔案信息和結(jié)構(gòu)信息,能夠獲得更加準確的社團劃分結(jié)果,從而實現(xiàn)對用戶的朋友圈自動分組,避免有一方信息缺失時帶來的缺陷。本發(fā)明能夠有效完善社交網(wǎng)絡平臺功能,適合于各類社交網(wǎng)絡平臺給用戶提供自動分組朋友圈的功能,適用于社交網(wǎng)絡平臺功能的應用和優(yōu)化。
【專利附圖】
【附圖說明】
[0017]圖1為本發(fā)明的步驟流程圖。
【具體實施方式】
[0018]以下將結(jié)合具體實施例對本發(fā)明提供的技術方案進行詳細說明,應理解下述【具體實施方式】僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。
[0019]本發(fā)明步驟流程圖如圖1所示,具體包括如下步驟:
[0020]步驟10,采用個人用戶在某一社交網(wǎng)絡的朋友圈中朋友檔案信息中的各類信息——如年齡、性別、所在地、出生地、教育經(jīng)歷、工作單位、工作地點、愛好等等建立朋友圈中每個朋友的特征向量Xi,Xi = (X1, X2,..., Xm),其中Xj (I彡j彡m)是檔案信息中某一信息的整數(shù)表示,比如I代表男性O代表女性。假設朋友圈中有N個朋友,則i e [0,N),根據(jù)選取檔案信息的項數(shù)特征向量有相應的維度m,在同一朋友圈中為朋友建立特征向量時應選取相同的檔案信息。
[0021]步驟20,計算任意兩個朋友之間的曼哈頓距離du ((Iij表示朋友i與朋友j之間的曼哈頓距離)。計算兩個特征向量的曼哈頓距離本質(zhì)上就是計算兩個用戶擁有相同特征的多少,在同一社團的用戶更傾向于有更多的相同特征。曼哈頓距離的計算方法是:先對兩個特征向量取并,然后對得到的結(jié)果向量取模,即du = I |\&χ」I。
[0022]步驟30,選取與朋友圈中其他所有朋友的曼哈頓距離都小于α的朋友作為核心朋友。這樣選出來的朋友具有獨特的特征,和其他朋友相互之間擁有同樣特征的可能性最小,能夠相互區(qū)分開,根據(jù)這樣的核心擴展能夠得到較好的社團劃分結(jié)果。α的取值根據(jù)步驟10中建立的特征向量維度的大小來選取,一般是經(jīng)驗值。朋友圈中的朋友聯(lián)系得松散,閾值α的取值就要小一些;朋友圈中的朋友聯(lián)系得緊密,閾值α的取值就要相應大一些,一般以選在特征向量維度數(shù)的1/3到1/2之間為佳。
[0023]步驟40,基于核心朋友,尋找其余朋友與核心朋友的共同特征并進行分組。當找到當前用戶與核心朋友共同的特征時,當記錄特征在特征向量Xi中的位置,以此為根據(jù)在其余非核心朋友中繼續(xù)尋找擁有這些特征的朋友擴展進一個分組中,并標識該分組為Ck(k e [O, K),K是核心朋友的總數(shù),k表示當前核心朋友的標號),本方法允許一個朋友屬于多個社團。這些特征標示著這個分組(即社團)的特征,比如一個核心朋友與當前用戶有著類似的年齡和相同的大學教育經(jīng)歷,那么這個核心朋友擴展出的分組必定是當前用戶的大學同學;對每一個核心朋友進行此項操作,遍歷每一個用戶,形成初步的社團劃分結(jié)果。
[0024]步驟50,檔案信息不全或者出于隱私考慮并不對外公開,上述步驟就不能有效劃分了,所以在本步驟利用朋友的連接關系,對于前邊得到的社團進行調(diào)整。
[0025]使用朋友圈的網(wǎng)絡結(jié)構(gòu)對分組調(diào)整。
[0026]步驟501,計算每一個朋友相對于每一個分組Ck中的朋友有邊相連(即指人與人之間具有關聯(lián))的連接數(shù),存儲到Iik中,其中i表示第i個朋友,k表示第k個分組,Iik表示第i個朋友與社團Ck中的多少個朋友有邊相連。
[0027]步驟502,找出當前朋友i與所有分組的連接數(shù)最大的那個分組的標號(即朋友i的Iik最大時的k值)。如果指朋友i未被劃分到連接數(shù)最大的那個分組中,那么調(diào)整這個朋友的分組為連接數(shù)最大的分組,轉(zhuǎn)到步驟501循環(huán)迭代,直到分組不再發(fā)生變化或者迭代達到一定的次數(shù)。
[0028]本發(fā)明方案所公開的技術手段不僅限于上述實施方式所公開的技術手段,還包括由以上技術特征任意組合所組成的技術方案。應當指出,對于本【技術領域】的普通技術人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也視為本發(fā)明的保護范圍。
【權利要求】
1.一種基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈的方法,其特征在于,包括以下步驟: 建立特征向量:根據(jù)當前用戶朋友圈中每個朋友的檔案信息建立朋友的特征向量;計算朋友之間的曼哈頓距離:先對兩個朋友之間的特征向量取并,然后對得到的結(jié)果向量取模; 選定核心朋友:選取與其他任意朋友距離都小于閾值α的朋友作為核心; 劃分社團:針對每個核心朋友,找到其余用戶與核心朋友共同的特征,根據(jù)共同特征擴展具有相同特征的朋友形成社團; 社團優(yōu)化調(diào)整:將朋友調(diào)整至與其連接數(shù)最大的分組中。
2.根據(jù)權利要求1所述的基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈的方法,其特征在于,所述特征向量包括以下信息中的至少一種:年齡、性別、所在地、出生地、教育經(jīng)歷、工作單位、工作地點、愛好。
3.根據(jù)權利要求1或2所述的基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈的方法,其特征在于,所述閾值α的取值范圍如下:1/3特征向量維度數(shù)<閾值α ( 1/2特征向量維度數(shù)。
4.根據(jù)權利要求3所述的基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈的方法,其特征在于:所述特征向量維度數(shù)與建立特征向量步驟中選取的檔案信息數(shù)量一致。
5.根據(jù)權利要求1或2所述的基于網(wǎng)絡結(jié)構(gòu)優(yōu)化的節(jié)點屬性劃分朋友圈的方法,其特征在于:所述社團優(yōu)化調(diào)整步驟具體為:計算每個朋友與其所屬的多個分組的連接數(shù),選其最大連接數(shù)的分組作為該朋友的分組,循環(huán)迭代,直到分組不再發(fā)生變化或者達到一定的次數(shù)。
【文檔編號】G06F17/30GK104391887SQ201410629873
【公開日】2015年3月4日 申請日期:2014年11月10日 優(yōu)先權日:2014年11月10日
【發(fā)明者】馬廷淮, 王耀, 唐美麗, 薛羽, 鐘水明, 曹杰 申請人:南京信息工程大學