亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

多數(shù)據(jù)源的信息處理裝置、服務(wù)器及方法

文檔序號(hào):9579266閱讀:323來(lái)源:國(guó)知局
多數(shù)據(jù)源的信息處理裝置、服務(wù)器及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種多數(shù)據(jù)源的信息處理裝置、服務(wù)器及方法。
【背景技術(shù)】
[0002]隨著信息技術(shù)的不斷發(fā)展,各個(gè)技術(shù)領(lǐng)域中的信息量也越來(lái)越大。在很多情形下,需要使用多個(gè)數(shù)據(jù)源中的信息。例如,查詢多個(gè)科技平臺(tái)中的數(shù)據(jù),政府部門進(jìn)行信息統(tǒng)計(jì)、企業(yè)內(nèi)部進(jìn)行信息整合分析等?,F(xiàn)有的查詢和統(tǒng)計(jì)分析方法一般需要對(duì)多個(gè)數(shù)據(jù)源進(jìn)行逐個(gè)查詢和統(tǒng)計(jì)分析。
[0003]應(yīng)該注意,上面對(duì)技術(shù)背景的介紹只是為了方便對(duì)本發(fā)明的技術(shù)方案進(jìn)行清楚、完整的說(shuō)明,并方便本領(lǐng)域技術(shù)人員的理解而闡述的。不能僅僅因?yàn)檫@些方案在本發(fā)明的【背景技術(shù)】部分進(jìn)行了闡述而認(rèn)為上述技術(shù)方案為本領(lǐng)域技術(shù)人員所公知。

【發(fā)明內(nèi)容】

[0004]上述現(xiàn)有的查詢和統(tǒng)計(jì)分析方法,由于需要對(duì)多個(gè)數(shù)據(jù)源進(jìn)行逐個(gè)查詢和統(tǒng)計(jì)分析,查詢和統(tǒng)計(jì)分析的效率較低,可用信息量較少且準(zhǔn)確性較差。
[0005]本發(fā)明實(shí)施例提供一種多數(shù)據(jù)源的信息處理裝置、服務(wù)器及方法,通過(guò)對(duì)同一實(shí)體進(jìn)行判定以及鏈接外部資源進(jìn)行擴(kuò)展屬性,并且以迭代的方式進(jìn)行上述判定和鏈接,能夠有效的進(jìn)行多數(shù)據(jù)源的信息整合,提高信息的準(zhǔn)確性和全面性。
[0006]根據(jù)本發(fā)明實(shí)施例的第一方面,提供一種多數(shù)據(jù)源的信息處理裝置,所述裝置包括:第一判定單元,所述第一判定單元用于對(duì)至少兩個(gè)數(shù)據(jù)源中的信息進(jìn)行同一實(shí)體的判定;鏈接單元,所述鏈接單元用于將所述至少兩個(gè)數(shù)據(jù)源中的實(shí)體鏈接到預(yù)先設(shè)定的外部資源中;第一擴(kuò)展單元,所述第一擴(kuò)展單元用于根據(jù)外部資源中的信息對(duì)所述實(shí)體的屬性進(jìn)行擴(kuò)展;第二判定單元,所述第二判定單元用于判斷屬性擴(kuò)展后的信息是否滿足預(yù)先設(shè)定的條件,當(dāng)所述屬性擴(kuò)展后的信息不滿足預(yù)先設(shè)定的條件時(shí),將屬性擴(kuò)展后的信息用于進(jìn)行所述同一實(shí)體的判定,當(dāng)所述屬性擴(kuò)展后的信息滿足預(yù)先設(shè)定的條件時(shí),將所述屬性擴(kuò)展后的信息輸出。
[0007]根據(jù)本發(fā)明實(shí)施例的第二方面,提供一種服務(wù)器,所述服務(wù)器包括根據(jù)本發(fā)明實(shí)施例的第一方面所述的多數(shù)據(jù)源的信息處理裝置。
[0008]根據(jù)本發(fā)明實(shí)施例的第三方面,提供一種多數(shù)據(jù)源的信息處理方法,所述方法包括:對(duì)至少兩個(gè)數(shù)據(jù)源中的信息進(jìn)行同一實(shí)體的判定;將所述至少兩個(gè)數(shù)據(jù)源中的實(shí)體鏈接到預(yù)先設(shè)定的外部資源中;根據(jù)外部資源中的信息對(duì)所述實(shí)體的屬性進(jìn)行擴(kuò)展;判斷屬性擴(kuò)展后的信息是否滿足預(yù)先設(shè)定的條件,當(dāng)所述屬性擴(kuò)展后的信息不滿足預(yù)先設(shè)定的條件時(shí),將屬性擴(kuò)展后的信息用于進(jìn)行所述同一實(shí)體的判定,當(dāng)所述屬性擴(kuò)展后的信息滿足預(yù)先設(shè)定的條件時(shí),將所述屬性擴(kuò)展后的信息輸出。
[0009]本發(fā)明的有益效果在于:通過(guò)對(duì)同一實(shí)體進(jìn)行判定以及鏈接外部資源進(jìn)行擴(kuò)展屬性,并且以迭代的方式進(jìn)行上述判定和鏈接,能夠有效的進(jìn)行多數(shù)據(jù)源的信息整合,提高信息的準(zhǔn)確性和全面性。
[0010]參照后文的說(shuō)明和附圖,詳細(xì)公開了本發(fā)明的特定實(shí)施方式,指明了本發(fā)明的原理可以被采用的方式。應(yīng)該理解,本發(fā)明的實(shí)施方式在范圍上并不因而受到限制。在所附權(quán)利要求的精神和條款的范圍內(nèi),本發(fā)明的實(shí)施方式包括許多改變、修改和等同。
[0011]針對(duì)一種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其它實(shí)施方式中使用,與其它實(shí)施方式中的特征相組合,或替代其它實(shí)施方式中的特征。
[0012]應(yīng)該強(qiáng)調(diào),術(shù)語(yǔ)“包括/包含”在本文使用時(shí)指特征、整件、步驟或組件的存在,但并不排除一個(gè)或更多個(gè)其它特征、整件、步驟或組件的存在或附加。
【附圖說(shuō)明】
[0013]所包括的附圖用來(lái)提供對(duì)本發(fā)明實(shí)施例的進(jìn)一步的理解,其構(gòu)成了說(shuō)明書的一部分,用于例示本發(fā)明的實(shí)施方式,并與文字描述一起來(lái)闡釋本發(fā)明的原理。顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。在附圖中:
[0014]圖1是本發(fā)明實(shí)施例1的多數(shù)據(jù)源的信息處理裝置的結(jié)構(gòu)示意圖;
[0015]圖2是本發(fā)明實(shí)施例1的第一判定單元的結(jié)構(gòu)示意圖;
[0016]圖3是本發(fā)明實(shí)施例1的進(jìn)行同一實(shí)體的判定的方法流程圖;
[0017]圖4是本發(fā)明實(shí)施例1的鏈接單元的結(jié)構(gòu)示意圖;
[0018]圖5是本發(fā)明實(shí)施例1的將至少兩個(gè)數(shù)據(jù)源中的實(shí)體鏈接到預(yù)先設(shè)定的外部資源中的方法流程圖;
[0019]圖6是本發(fā)明實(shí)施例1的第一擴(kuò)展單元的結(jié)構(gòu)示意圖;
[0020]圖7是本發(fā)明實(shí)施例1的根據(jù)外部資源中的信息對(duì)該實(shí)體的屬性進(jìn)行擴(kuò)展的方法流程圖;
[0021]圖8是本發(fā)明實(shí)施例1的翻譯單元的結(jié)構(gòu)示意圖;
[0022]圖9是本發(fā)明實(shí)施例1的對(duì)多種語(yǔ)言的實(shí)體進(jìn)行翻譯的方法流程圖;
[0023]圖10是本發(fā)明實(shí)施例1的融合單元的結(jié)構(gòu)示意圖;
[0024]圖11是本發(fā)明實(shí)施例1的對(duì)至少兩個(gè)數(shù)據(jù)源中的信息進(jìn)行相同屬性的融合的方法流程圖;
[0025]圖12是本發(fā)明實(shí)施例2的服務(wù)器的系統(tǒng)構(gòu)成的一示意框圖;
[0026]圖13是本發(fā)明實(shí)施例3的多數(shù)據(jù)源的信息處理方法的流程圖;
[0027]圖14是本發(fā)明實(shí)施例4的多數(shù)據(jù)源的信息處理方法的流程圖。
【具體實(shí)施方式】
[0028]參照附圖,通過(guò)下面的說(shuō)明書,本發(fā)明的前述以及其它特征將變得明顯。在說(shuō)明書和附圖中,具體公開了本發(fā)明的特定實(shí)施方式,其表明了其中可以采用本發(fā)明的原則的部分實(shí)施方式,應(yīng)了解的是,本發(fā)明不限于所描述的實(shí)施方式,相反,本發(fā)明包括落入所附權(quán)利要求的范圍內(nèi)的全部修改、變型以及等同物。
[0029]實(shí)施例1
[0030]圖1是本發(fā)明實(shí)施例1的多數(shù)據(jù)源的信息處理裝置的結(jié)構(gòu)示意圖。如圖1所示,該裝置100包括:第一判定單元101、鏈接單元102、第一擴(kuò)展單元103以及第二判定單元104,其中,
[0031]第一判定單元101用于對(duì)至少兩個(gè)數(shù)據(jù)源中的信息進(jìn)行同一實(shí)體的判定;
[0032]鏈接單元102用于將至少兩個(gè)數(shù)據(jù)源中的實(shí)體鏈接到預(yù)先設(shè)定的外部資源中;
[0033]第一擴(kuò)展單元103用于根據(jù)外部資源中的信息對(duì)該實(shí)體的屬性進(jìn)行擴(kuò)展;
[0034]第二判定單元104用于判斷屬性擴(kuò)展后的信息是否滿足預(yù)先設(shè)定的條件,當(dāng)該屬性擴(kuò)展后的信息不滿足預(yù)先設(shè)定的條件時(shí),將屬性擴(kuò)展后的信息用于進(jìn)行該同一實(shí)體的判定,當(dāng)該屬性擴(kuò)展后的信息滿足預(yù)先設(shè)定的條件時(shí),將該屬性擴(kuò)展后的信息輸出。
[0035]由上述實(shí)施例可知,通過(guò)對(duì)同一實(shí)體進(jìn)行判定以及鏈接外部資源進(jìn)行擴(kuò)展屬性,并且以迭代的方式進(jìn)行上述判定和鏈接,能夠有效的進(jìn)行多數(shù)據(jù)源的信息整合,提高信息的準(zhǔn)確性和全面性。
[0036]在本實(shí)施例中,該至少兩個(gè)數(shù)據(jù)源可以包括本領(lǐng)域的任一種或多種數(shù)據(jù)源,例如,數(shù)據(jù)庫(kù)、EXCEL表格、CSV文件、CRC文件等。其中,該至少兩個(gè)數(shù)據(jù)源可以存儲(chǔ)在該多數(shù)據(jù)源的信息處理裝置的外部,也可以存儲(chǔ)在該多數(shù)據(jù)源的信息處理裝置中,本發(fā)明實(shí)施例不對(duì)數(shù)據(jù)源的存儲(chǔ)位置進(jìn)行限制。
[0037]在本實(shí)施例中,該實(shí)體可以包括本領(lǐng)域的任一種或多種實(shí)體,例如,人名、地名或機(jī)構(gòu)名等。本發(fā)明實(shí)施例不對(duì)實(shí)體的具體類型和數(shù)量進(jìn)行限定。
[0038]在本實(shí)施例中,對(duì)同一實(shí)體進(jìn)行判定可以包括兩種情形:不同的變體是否指向同一實(shí)體、以及同一實(shí)體是否具有歧義從而實(shí)際上表示不同的實(shí)體。但本發(fā)明實(shí)施例不限于這兩種情形。
[0039]其中,對(duì)于不同的變體是否指向同一實(shí)體,例如,同一個(gè)人名、機(jī)構(gòu)名或地名可能有不同的描述方法,因此存在多種變體,從而需要將其指向同一實(shí)體;對(duì)于同一實(shí)體是否具有歧義從而實(shí)際上表示不同的實(shí)體,例如,同一個(gè)人名實(shí)際上可能指向不同的人,或者同一個(gè)地名實(shí)際上可能指向不同的地點(diǎn),需要將其分開代表不同的實(shí)體。
[0040]在本實(shí)施例中,可使用現(xiàn)有的任一種方法對(duì)至少兩個(gè)數(shù)據(jù)源中的信息進(jìn)行同一實(shí)體的判定。以下對(duì)本發(fā)明實(shí)施例的進(jìn)行同一實(shí)體的判定的方法進(jìn)行示例性的說(shuō)明。
[0041]圖2是本實(shí)施例的第一判定單元的結(jié)構(gòu)示意圖。如圖2所示,該第一判定單元101包括:建立單元201、分組單元202以及分離單元203,其中,
[0042]建立單元201用于比較各個(gè)實(shí)體之間的相似程度,將相似度大于預(yù)先設(shè)定的閾值的實(shí)體聚在一起,從而建立候選池;
[0043]分組單元202用于根據(jù)與該實(shí)體相關(guān)的其他列的信息,對(duì)候選池中的信息進(jìn)行合并與區(qū)分,利用聚類方法劃分出各個(gè)不同的候選實(shí)體組;
[0044]分離單元203用于利用基于規(guī)則的方法,將該候選實(shí)體組的信息中的含有互斥屬性的實(shí)體進(jìn)行分離。
[0045]圖3是本實(shí)施例的進(jìn)行同一實(shí)體的判定的方法流程圖。如圖3所示,該方法包括:
[0046]步驟301:比較各個(gè)實(shí)體之間的相似程度,將相似度大于預(yù)先設(shè)定的閾值的實(shí)體聚在一起,從而建立候選池;
[0047]步驟302:根據(jù)與該實(shí)體相關(guān)的其他列的信息,對(duì)候選池中的信息進(jìn)
當(dāng)前第1頁(yè)1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1