實現(xiàn)關(guān)聯(lián)信息節(jié)點可視化追蹤的數(shù)據(jù)處理方法
【專利摘要】本發(fā)明涉及互聯(lián)網(wǎng)信息處理技術(shù)領(lǐng)域,特別涉及實現(xiàn)關(guān)聯(lián)信息節(jié)點可視化追蹤的數(shù)據(jù)處理方法。本發(fā)明方法通過設(shè)置字段等方式,從海量的信息中分析出目標主體以及與目標主體直接相關(guān)的關(guān)聯(lián)信息形成,根據(jù)直接關(guān)聯(lián)關(guān)系抽象出一度關(guān)聯(lián)關(guān)系,形成對應(yīng)的數(shù)據(jù)記錄;根據(jù)不同數(shù)據(jù)記錄中的相同的信息單元逐級擴展關(guān)聯(lián)信息;并在關(guān)聯(lián)關(guān)系數(shù)據(jù)的基礎(chǔ)上,使用可視化工具,將關(guān)聯(lián)關(guān)系可視化、圖譜化,圖譜路徑清晰可實現(xiàn)關(guān)聯(lián)節(jié)點的逐一追蹤,為相關(guān)的數(shù)據(jù)分析提供參考,極大的節(jié)省了用戶用于相關(guān)數(shù)據(jù)分析的人力和時間成本。在目標背景分析、市場調(diào)研、市場風險防控、產(chǎn)品推廣、廣告?zhèn)鞑サ葢?yīng)用領(lǐng)域具有極高的使用價值。
【專利說明】
實現(xiàn)關(guān)聯(lián)信息節(jié)點可視化追蹤的數(shù)據(jù)處理方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及互聯(lián)網(wǎng)信息處理技術(shù)領(lǐng)域,特別涉及實現(xiàn)關(guān)聯(lián)信息節(jié)點可視化追蹤的數(shù)據(jù)處理方法。
【背景技術(shù)】
[0002]今世界早就進入了信息時代,隨著信息的爆發(fā)式增長和積累,大數(shù)據(jù)時代已近來臨,作為大數(shù)據(jù)最重要的特點:數(shù)據(jù)量大和價值密度低卻是困擾如此海量數(shù)據(jù)信息挖掘利用的難題。實際上在紛繁復(fù)雜的信息海洋中,某些信息之間的聯(lián)系往往比與其他信息之間的聯(lián)系要緊密得多,而這些具有某種緊密聯(lián)系的信息往往反映的是現(xiàn)實生活中的人與人之間或者團體之間的特定關(guān)系,這些特定關(guān)系會使其在相關(guān)的社會或者經(jīng)濟活動中相互影響或者牽制。
[0003]針對特定的信息目標,如何分析該目標與其他目標之間的關(guān)聯(lián)關(guān)系在很多領(lǐng)域具有更加實際的意義,因為具有關(guān)聯(lián)關(guān)系的目標在進行各種活動時往往比單獨的簡單個體具有更大的影響面,而且具有關(guān)聯(lián)關(guān)系的目標在對外建立各種活動時,受到內(nèi)部的關(guān)聯(lián)關(guān)系的相互牽制或者支持,會比簡單目標的活動軌跡更加復(fù)雜。
[0004]在這樣的背景下,通過數(shù)據(jù)挖掘在海量的數(shù)據(jù)信息中分析出與目標信息相關(guān)聯(lián)的信息,并通過數(shù)據(jù)可視化工具將信息之間的關(guān)聯(lián)關(guān)系直觀的展示出來,將極大的節(jié)省用戶用于數(shù)據(jù)整理和數(shù)據(jù)分析所耗費的人力、物力;在目標背景分析、市場調(diào)研、市場風險防控、產(chǎn)品推廣、廣告?zhèn)鞑サ葢?yīng)用領(lǐng)域具有極高的使用價值。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于克服現(xiàn)有技術(shù)中所存在的上述不足,提供實現(xiàn)關(guān)聯(lián)信息節(jié)點可視化追蹤的數(shù)據(jù)處理方法,本發(fā)明方法通過設(shè)置字段等方式,從海量的信息中分析出目標主體以及與目標主體直接相關(guān)的關(guān)聯(lián)信息形成,根據(jù)直接關(guān)聯(lián)關(guān)系成一度關(guān)聯(lián)關(guān)系,形成對應(yīng)的數(shù)據(jù)記錄;根據(jù)不同數(shù)據(jù)記錄中的相同的信息單元逐級擴展關(guān)聯(lián)信息;并在關(guān)聯(lián)關(guān)系數(shù)據(jù)的基礎(chǔ)上,使用可視化工具,將關(guān)聯(lián)關(guān)系可視化、圖譜化,為相關(guān)的數(shù)據(jù)分析提供參考,極大的節(jié)省了用戶用于相關(guān)數(shù)據(jù)分析的人力和時間成本。
[0006]為實現(xiàn)上述目的,本發(fā)明實現(xiàn)關(guān)聯(lián)信息節(jié)點可視化追蹤的數(shù)據(jù)處理方法,包括以下步驟:
[0007](I)從原始數(shù)據(jù)中的每條基礎(chǔ)數(shù)據(jù)中,根據(jù)設(shè)置的字段提取出對應(yīng)的信息,形成相應(yīng)的數(shù)據(jù)記錄;
[0008](2)在一條數(shù)據(jù)記錄中包含第一信息和第二信息,其中第二信息為第一信息的一度關(guān)聯(lián)信息;在第二數(shù)據(jù)記錄中包括第二信息和第三信息,其中第三信息是第二信息的一度關(guān)聯(lián)信息;
[0009](3)將所述第三信息抽象成第一信息的二度關(guān)聯(lián)信息;
[0010]依次類推,抽象出以第一信息為起點的N度關(guān)聯(lián)信息,其中N>1;
[0011](4)根據(jù)所述步驟(3)形成的關(guān)聯(lián)關(guān)系,利用可視化工具將第一信息抽象成O級節(jié)點,將第二信息作為第一信息的I級子節(jié)點擴展到第一信息節(jié)點的外圍,將第三信息作為第二信息的I級子節(jié)點擴展到第二信息節(jié)點的外圍;
[0012]依次類推,擴展出以第一信息節(jié)點為中心的各級節(jié)點依次擴展在對應(yīng)上一級節(jié)點外圍的關(guān)聯(lián)圖譜;各級母節(jié)點與子節(jié)點之間用邊來連接。
[0013]進一步的,關(guān)聯(lián)關(guān)系的建立遵循廣度優(yōu)先原則。
[0014]進一步的,關(guān)聯(lián)圖譜繪制的節(jié)點擴展遵循廣度優(yōu)先原則。
[0015]作為一種優(yōu)選,其可視化過程為:將目標信息置于可視化圖的中心;將相同級數(shù)的節(jié)點分散在一個圓周上,并圍繞在上一級節(jié)點圍成的圓的外面。
[0016]進一步的,所述關(guān)聯(lián)圖譜中,使用不同的顏色和,或不同形狀來區(qū)分各級節(jié)點。
[0017]進一步的,所述關(guān)聯(lián)圖譜中,使用不同顏色和,或不同形狀來區(qū)分不同類型的節(jié)點。
[0018]作為一種優(yōu)選,所述步驟(4)中所采用的可視化工具為:yEd、D3或者jcharts。
[0019]進一步的,所關(guān)聯(lián)圖譜通過Web端口提供給用戶查詢使用。
[0020]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果:本實現(xiàn)關(guān)聯(lián)信息節(jié)點可視化追蹤的數(shù)據(jù)處理方法,通過設(shè)置字段等方式,從海量的信息中分析出目標主體以及與目標主體直接相關(guān)的關(guān)聯(lián)信息形成,根據(jù)直接關(guān)聯(lián)關(guān)系成一度關(guān)聯(lián)關(guān)系,形成對應(yīng)的數(shù)據(jù)記錄;根據(jù)不同數(shù)據(jù)記錄中的相同的信息單元逐級擴展關(guān)聯(lián)信息;整理出目標信息的關(guān)聯(lián)關(guān)系數(shù)據(jù);并在關(guān)聯(lián)關(guān)系數(shù)據(jù)的基礎(chǔ)上,使用可視化工具,將關(guān)聯(lián)關(guān)系可視化、圖譜化,達到關(guān)聯(lián)路徑清晰、關(guān)聯(lián)節(jié)點可延路徑逐一追蹤的作用,為相關(guān)的數(shù)據(jù)分析提供參考,極大的節(jié)省了用戶用于相關(guān)數(shù)據(jù)分析的人力和時間成本。
[0021]并且本發(fā)明在關(guān)聯(lián)信息圖譜化的基礎(chǔ)上,通過顏色和圖形將屬于不同關(guān)聯(lián)級數(shù)或者類型的節(jié)點區(qū)分開來,豐富了關(guān)聯(lián)圖譜顯示的數(shù)據(jù)信息內(nèi)容和層次。使得用戶只通過關(guān)聯(lián)圖譜可以清楚的分別出每個節(jié)點的級別和類型,進一步節(jié)省了數(shù)據(jù)整理分析的人力物力成本。在數(shù)據(jù)信息挖取,目標信息背景分析,關(guān)聯(lián)問題追蹤和分析等領(lǐng)域具有廣闊的應(yīng)用前景。
【附圖說明】
:
[0022]圖1是實現(xiàn)關(guān)聯(lián)信息節(jié)點可視化追蹤的數(shù)據(jù)處理方法的實現(xiàn)步驟示意圖。
[0023]圖2為本發(fā)明方法關(guān)聯(lián)信息計算原理示意圖。
[0024]圖3為實施例根據(jù)字段提取的數(shù)據(jù)記錄示意圖。
[0025]圖4為一度關(guān)聯(lián)關(guān)系不意圖。
[0026]圖5為以a為O級節(jié)點可視化3度關(guān)聯(lián)圖譜示意圖。
[0027]圖6為以f為O級節(jié)點的可視化3度關(guān)聯(lián)圖譜示意圖。
[0028]圖7為以k為O級節(jié)點的可視化3度關(guān)聯(lián)圖譜示意圖。
【具體實施方式】
[0029]下面結(jié)合試驗例及【具體實施方式】對本發(fā)明作進一步的詳細描述。但不應(yīng)將此理解為本發(fā)明上述主題的范圍僅限于以下的實施例,凡基于本
【發(fā)明內(nèi)容】
所實現(xiàn)的技術(shù)均屬于本發(fā)明的范圍。
[0030]本發(fā)明提供實現(xiàn)關(guān)聯(lián)信息節(jié)點可視化追蹤的數(shù)據(jù)處理方法,包括如圖1所示的以下步驟:
[0031](I)從原始數(shù)據(jù)中的每條基礎(chǔ)數(shù)據(jù)中,根據(jù)設(shè)置的字段提取出對應(yīng)的信息,形成相應(yīng)的數(shù)據(jù)記錄;字段的設(shè)置根據(jù)數(shù)據(jù)分析的目的而定,比如將目標信息設(shè)定為企業(yè)名稱,而其他信息設(shè)置為企業(yè)相關(guān)的董事、高管和投資人;在相關(guān)網(wǎng)頁中或者企業(yè)信息后,就可以通過設(shè)置上述字段將各個企業(yè)的中的基本信息提取出來。再根據(jù)各個公司相關(guān)信息中的共同信息就可以建立每個企業(yè)的關(guān)聯(lián)背景信息。
[0032](2)在一條數(shù)據(jù)記錄中包含第一信息和第二信息,其中第二信息為第一信息的一度關(guān)聯(lián)信息;在第二數(shù)據(jù)記錄中包括第二信息和第三信息,其中第三信息是第二信息的一度關(guān)聯(lián)信息;其中所述第一信息、第二信息以及第三信息是指信息的內(nèi)容,不代表信息的順序。
[0033](3)將所述第三信息抽象成第一信息的二度關(guān)聯(lián)信息;依次類推,抽象出以第一信息為起點的N度關(guān)聯(lián)信息,其中N多I。通過本發(fā)明方法所述步驟(3)可以目標信息為起點(起點的選擇根據(jù)分析需要來設(shè)置),逐級查找出與目標信息相關(guān)聯(lián)的其他信息和關(guān)聯(lián)度數(shù),關(guān)聯(lián)信息的計算原理如圖2所示。
[0034](4)根據(jù)所述步驟(3)形成的關(guān)聯(lián)關(guān)系,利用可視化工具將第一信息抽象成O級節(jié)點,將第二信息作為第一信息的I級子節(jié)點擴展到第一信息節(jié)點的外圍,將第三信息作為第二信息的I級子節(jié)點擴展到第二信息節(jié)點的外圍;依次類推,擴展出以第一信息節(jié)點為中心的各級節(jié)點依次擴展在對應(yīng)上一級節(jié)點外圍的關(guān)聯(lián)圖譜;各級母節(jié)點與子節(jié)點之間用邊來連接。在分析出關(guān)聯(lián)信息的基礎(chǔ)上,將關(guān)聯(lián)信息之間的關(guān)聯(lián)關(guān)系通過可視化、圖譜化的方式直觀的展示出來,方便用戶的信息查找和問題分析。并且用戶可以根據(jù)關(guān)聯(lián)圖譜中的關(guān)聯(lián)路徑可以方便的實現(xiàn)關(guān)聯(lián)關(guān)系的節(jié)點追蹤。
[0035]進一步的,關(guān)聯(lián)關(guān)系的建立和關(guān)聯(lián)圖譜的繪制遵循廣度優(yōu)先原則。廣度優(yōu)先原則擴展節(jié)點的順序是將某一層上的所有節(jié)點都搜索到之后才向下一層搜索;這樣擴展節(jié)點的好處在于,所形成的圖譜以目標信息為中心逐級擴展節(jié)點,用戶根據(jù)分析深度的需要選擇展示的關(guān)聯(lián)圖譜節(jié)點最高級數(shù),在選擇的級數(shù)以內(nèi),更夠顯示全部節(jié)點而不會出現(xiàn)遺漏,方便用戶根據(jù)需要獲得所需的全量數(shù)據(jù)。
[0036]進一步的,在進行關(guān)聯(lián)圖譜繪制時,將已計算過的O級節(jié)點打上墓碑標記(即在下一級關(guān)聯(lián)信息搜索時,不再計算該節(jié)點;這樣的做法可以有效的避免閉合路徑重復(fù)路徑的出現(xiàn),保證關(guān)聯(lián)圖譜精煉簡潔),搜索出各I級節(jié)點的關(guān)聯(lián)信息,并將其抽象為對應(yīng)I級節(jié)點的子節(jié)點,并將其定義為2級節(jié)點,并將各I級節(jié)點打上墓碑標記。
[0037]作為一種優(yōu)選,其可視化過程為:將目標信息置于可視化圖的中心;將相同級數(shù)的節(jié)點分散在一個圓周上,并圍繞在上一級節(jié)點圍成的圓的外面。將相同級數(shù)的節(jié)點分散在一個圓周上,并圍繞在上一級節(jié)點圍成的圓的外面。這樣圖譜顯示方式,節(jié)點層次感很強,方便用戶直觀了解目標信息的關(guān)聯(lián)信息分布情況。
[0038]進一步的,所述關(guān)聯(lián)圖譜中,使用不同的顏色和,或不同形狀來區(qū)分各級節(jié)點。將不同級別的節(jié)點用對應(yīng)顏色或者形狀來表示,便于用戶進行相應(yīng)的區(qū)分,使得節(jié)點的關(guān)聯(lián)圖譜中顯示的信息更加豐富,分析更加直觀簡潔。
[0039]進一步的,所述關(guān)聯(lián)圖譜中,使用不同顏色和,或不同形狀來區(qū)分不同類型的節(jié)點。根據(jù)用戶的相關(guān)字段設(shè)置,提取出來的關(guān)聯(lián)信息對應(yīng)的節(jié)點類型可能不同,例如企業(yè)為目標信息分析其背景時,對應(yīng)的投資者或者股東可能是企業(yè)也有可能是自然人,將這些不同類型的節(jié)點使用不同顏色和或者形狀來表示,便于用戶進行相應(yīng)的區(qū)分的,進而便于根據(jù)步同的節(jié)點類型來進行相關(guān)問題的歸類和追蹤。
[°04°] 作為一種優(yōu)選,所述步驟(4)中所采用的可視化工具為:yEd、D3、Google ChartAPI或者 jcharts ο
[0041]進一步的,所關(guān)聯(lián)圖譜通過Web端口提供給用戶查詢使用。為了方便問題的分析,節(jié)省相關(guān)從業(yè)人員的重復(fù)性勞動,通過本發(fā)明方法實習的可視化關(guān)聯(lián)圖譜可以網(wǎng)頁查詢的方式提供給用戶,這樣用戶在進行目標信息分析時,不再需在龐大的基礎(chǔ)數(shù)據(jù)中要逐個查找資料,逐個的去構(gòu)建關(guān)聯(lián)關(guān)系,再逐個的去分析目標信息的龐大關(guān)聯(lián)網(wǎng)絡(luò),而是通過網(wǎng)頁直接查詢經(jīng)過本發(fā)明方法實現(xiàn)的目標信息的關(guān)聯(lián)圖譜,縮短數(shù)據(jù)分析時間提高決策制定的效率。
[0042]實施例1
[0043]在原始數(shù)據(jù)中經(jīng)過字段(設(shè)置的字段包括:第一字段、第二字段、第三字段)提取,提取出來3條數(shù)據(jù)記錄,如圖3所示:其中第一數(shù)據(jù)記錄包含的根據(jù)第一字段提取的內(nèi)容a,第二字段提取的內(nèi)容b,第三字段所對應(yīng)的信息內(nèi)容為c、d、e;第二條數(shù)據(jù)記錄中包含根據(jù)第一字段提取的內(nèi)容f,第二字段提取的內(nèi)容g、h第三字段對應(yīng)的信息內(nèi)容c、d、1、j ;第三條數(shù)據(jù)記錄中包含的根據(jù)第一字段提取內(nèi)容k,第二字段提取的內(nèi)容a、d,第三字段對應(yīng)的信息內(nèi)容l、m、n、o。以第一字段對應(yīng)的信息為目標信息,則分別構(gòu)建出的以a、f、k為目標信息的一度關(guān)聯(lián)關(guān)系為如圖4所示,(a-b)(a-c)(a-d) (a_e), (f-g) (f~h) (f-c) (f-d) (f-1) (f-j),(k-a)(k-d)(k-l)(k-m)(k-n)(k-o),根據(jù)本發(fā)明關(guān)聯(lián)關(guān)系的計算方式可以得到以a、f、k為目標信息的二度關(guān)聯(lián)關(guān)系為(a-c-f) (a-d-f),(f-c-a) (f-d-a),(k_a_b) (k_a_c) (k-a-d)(k_a_e),(k_d_a) (k_d_f),三度關(guān)耳關(guān)關(guān)系為(a_c_f_g) (a_c_f_h) (a_c_f_d) (a_c_f_i) (a_c-f-j)、(a-d-f-g)(a-d-f-h)(a_d_f_c)(a_d_f_i)(a_d_f_j),(f_c_a_b)(f_c_a_d)(f_c_a_e)(f-d-a-b)(f_d_a_c)(f_d_a_e);(k_a_c_f)(k-a-d-f)(k_d_f_g)(k_d_f_h)(k_d_f_c)
(k-d-f-1) (k-d-f-j)......將上述關(guān)聯(lián)關(guān)系中的?目息抽象成節(jié)點,并米用可視化工具,繪制出以a、f、k為O級節(jié)點的三級以內(nèi)的關(guān)聯(lián)圖譜,分別如圖5、圖6、圖7所示。
[0044]使用例如yEd、jcharts、D3、Google Chart API等可視化工具以目標信息對應(yīng)的O節(jié)點為中心,逐級擴展子節(jié)點,將下一級節(jié)點擴展到上一節(jié)點的外圍;最終形成以目標信息為中心的關(guān)聯(lián)圖譜。實際上針對每個目標信息的個度關(guān)聯(lián)信息可能都是多個的,而且隨著關(guān)聯(lián)度數(shù)的增加,擴展出來的關(guān)聯(lián)信息數(shù)量更多;多度關(guān)聯(lián)信息圖譜均可以按照上述過程逐級擴展出來。
[0045]盡管上面對本發(fā)明說明性的【具體實施方式】進行了描述,以便于本技術(shù)領(lǐng)的技術(shù)人員理解本發(fā)明,但應(yīng)該清楚,本發(fā)明不限于【具體實施方式】的范圍,對本技術(shù)領(lǐng)域的普通技術(shù)人員來講,只要各種變化在所附的權(quán)利要求限定和確定的本發(fā)明的精神和范圍內(nèi),這些變化時顯而易見的,一切利用本發(fā)明構(gòu)思的發(fā)明創(chuàng)造均在保護之列。
【主權(quán)項】
1.實現(xiàn)關(guān)聯(lián)信息節(jié)點可視化追蹤的數(shù)據(jù)處理方法,其特征在于,包括以下實現(xiàn)步驟: (1)從原始數(shù)據(jù)中的每條基礎(chǔ)數(shù)據(jù)中,根據(jù)設(shè)置的字段提取出對應(yīng)的信息,形成相應(yīng)的數(shù)據(jù)記錄; (2)在一條數(shù)據(jù)記錄中包含第一信息和第二信息,其中第二信息為第一信息的一度關(guān)聯(lián)信息;在第二數(shù)據(jù)記錄中包括第二信息和第三信息,其中第三信息是第二信息的一度關(guān)聯(lián)信息; (3)將所述第三信息抽象成第一信息的二度關(guān)聯(lián)信息; 依次類推,抽象出以第一信息為起點的N度關(guān)聯(lián)信息,其中N>1; (4)根據(jù)所述步驟(3)形成的關(guān)聯(lián)關(guān)系,利用可視化工具將第一信息抽象成O級節(jié)點,將第二信息作為第一信息的I級子節(jié)點擴展到第一信息節(jié)點的外圍,將第三信息作為第二信息的I級子節(jié)點擴展到第二信息節(jié)點的外圍; 依次類推,擴展出以第一信息節(jié)點為中心的各級節(jié)點依次擴展在對應(yīng)上一級節(jié)點外圍的關(guān)聯(lián)圖譜;各級母節(jié)點與子節(jié)點之間用邊來連接。2.如權(quán)利要求1所述的方法,其特征在于,所述步驟(3)中,關(guān)聯(lián)關(guān)系的建立遵循廣度優(yōu)先原則。3.如權(quán)利要求1所述的方法,其特征在于,所述步驟(4)中,關(guān)聯(lián)圖譜繪制的節(jié)點擴展遵循廣度優(yōu)先原則。4.如權(quán)利要求1至3之一所述的方法,其特征在于,其可視化過程為:將目標信息置于可視化圖的中心;將相同級數(shù)的節(jié)點分散在一個圓周上,并圍繞在上一級節(jié)點圍成的圓的外面。5.如權(quán)利要求4所述的方法,其特征在于,所述關(guān)聯(lián)圖譜中,使用不同的顏色和,或不同形狀來區(qū)分各級節(jié)點。6.如權(quán)利要求5所述的方法,其特征在于,所述關(guān)聯(lián)圖譜中,使用不同顏色和,或不同形狀來區(qū)分不同類型的節(jié)點。7.如權(quán)利要求6所述的方法,其特征在于,所述步驟(4)中所采用的可視化工具為:yEd、D3 或者 jcharts。8.如權(quán)利要求7所述的方法,其特征在于,所關(guān)聯(lián)圖譜通過Web端口提供給用戶查詢使用。
【文檔編號】G06F17/30GK105930461SQ201610255483
【公開日】2016年9月7日
【申請日】2016年4月21日
【發(fā)明人】何宏靖, 范東來
【申請人】成都數(shù)聯(lián)銘品科技有限公司