本申請(qǐng)涉及數(shù)據(jù)處理領(lǐng)域,具體而言,涉及一種知識(shí)庫(kù)核對(duì)方法和裝置。
背景技術(shù):
現(xiàn)代社會(huì)處于信息爆炸的時(shí)代,對(duì)信息的及時(shí)獲取無(wú)論對(duì)個(gè)人還是對(duì)企業(yè)、政府、科研機(jī)構(gòu),都是非常重要的。一些企業(yè)、政府或者科研機(jī)構(gòu)因此建立了知識(shí)庫(kù),來(lái)儲(chǔ)存一些重要信息。然而,在建立知識(shí)庫(kù)的過程中,由于某些原因,可能會(huì)出現(xiàn)一些錯(cuò)誤,例如儲(chǔ)存了一些錯(cuò)誤的數(shù)據(jù)。這些錯(cuò)誤的數(shù)據(jù)會(huì)嚴(yán)重影響知識(shí)庫(kù)中信息的精確度。
目前,主要依靠人工去獲取多個(gè)對(duì)比數(shù)據(jù)源,將對(duì)比數(shù)據(jù)源中的信息與知識(shí)庫(kù)中的信息進(jìn)行核對(duì),進(jìn)而判斷是否需要對(duì)知識(shí)庫(kù)中的信息進(jìn)行更改,由于知識(shí)庫(kù)中信息量龐大,因此使用人工耗時(shí)耗力,遺漏率高且容易出錯(cuò)。
針對(duì)上述的問題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)實(shí)施例提供了一種知識(shí)庫(kù)核對(duì)方法和裝置,以至少解決現(xiàn)有技術(shù)中人工核對(duì)知識(shí)庫(kù)費(fèi)時(shí)費(fèi)力,遺漏率高且容易出錯(cuò)的技術(shù)問題。
根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面,提供了一種知識(shí)庫(kù)核對(duì)方法,包括:獲取對(duì)比數(shù)據(jù)源的信息;將所述對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到匹配結(jié)果;以及根據(jù)所述匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作。
進(jìn)一步地,所述對(duì)比數(shù)據(jù)源的數(shù)量為m,將所述對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到匹配結(jié)果,根據(jù)所述匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作包括:將第i個(gè)所述對(duì)比數(shù)據(jù)源的信息與所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第i匹配結(jié)果,并根據(jù)所述第i匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到第i目標(biāo)知識(shí)庫(kù);以及將第i+1個(gè)所述對(duì)比數(shù)據(jù)源的信息與所述第i目標(biāo)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第i+1匹配結(jié)果,并根據(jù)所述第i+1匹配結(jié)果對(duì)所述第i目標(biāo)知識(shí)庫(kù)的信息進(jìn)行操作,其中,i依次取1至m-1。
進(jìn)一步地,將第i個(gè)所述對(duì)比數(shù)據(jù)源的信息與所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配, 得到第i匹配結(jié)果,并根據(jù)所述第i匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到第i目標(biāo)知識(shí)庫(kù)包括:依次將第i個(gè)所述對(duì)比數(shù)據(jù)源的每一條信息與所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配;每匹配一次,根據(jù)當(dāng)前次的匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行一次操作,并將操作后的所述待核對(duì)知識(shí)庫(kù)作為下一次進(jìn)行匹配的所述待核對(duì)知識(shí)庫(kù),直至將第i個(gè)所述對(duì)比數(shù)據(jù)源的最后一條信息與所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配;以及根據(jù)與所述最后一條信息對(duì)應(yīng)的匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到所述第i目標(biāo)知識(shí)庫(kù)。
進(jìn)一步地,根據(jù)所述匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作包括:在所述匹配結(jié)果表示所述對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息相匹配的情況下,確認(rèn)所述待核對(duì)知識(shí)庫(kù)的信息維持不變;以及在所述匹配結(jié)果表示所述對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不相匹配的情況下,根據(jù)接收到的指令對(duì)所述待核對(duì)知識(shí)庫(kù)進(jìn)行操作。
進(jìn)一步地,在所述匹配結(jié)果表示所述對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不相匹配的情況下,根據(jù)接收到的指令對(duì)所述待核對(duì)知識(shí)庫(kù)進(jìn)行操作包括:在所述指令的指令標(biāo)識(shí)為第一預(yù)設(shè)標(biāo)識(shí)的情況下,利用所述對(duì)比數(shù)據(jù)源的信息更新所述待核對(duì)知識(shí)庫(kù)的信息;以及在所述指令的指令標(biāo)識(shí)為第二預(yù)設(shè)標(biāo)識(shí)的情況下,確認(rèn)所述待核對(duì)知識(shí)庫(kù)的信息維持不變。
根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面,提供了一種知識(shí)庫(kù)核對(duì)裝置,包括:獲取單元,用于獲取對(duì)比數(shù)據(jù)源的信息;匹配單元,用于將所述對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到匹配結(jié)果;以及操作單元,用于根據(jù)所述匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作。
進(jìn)一步地,所述對(duì)比數(shù)據(jù)源的數(shù)量為m,所述匹配單元包括:第i匹配子單元,用于將第i個(gè)所述對(duì)比數(shù)據(jù)源的信息與所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第i匹配結(jié)果,所述操作單元包括:第i操作子單元,用于根據(jù)所述第i匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到第i目標(biāo)知識(shí)庫(kù);所述匹配單元還包括:第i+1匹配子單元,用于將第i+1個(gè)所述對(duì)比數(shù)據(jù)源的信息與所述第i目標(biāo)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第i+1匹配結(jié)果,所述操作單元還包括:第i+1操作子單元,用于根據(jù)所述第i+1匹配結(jié)果對(duì)所述第i目標(biāo)知識(shí)庫(kù)的信息進(jìn)行操作,其中,i依次取1至m-1。
進(jìn)一步地,所述第i匹配子單元包括:匹配模塊,用于依次將第i個(gè)所述對(duì)比數(shù)據(jù)源的每一條信息與所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,所述第i操作子單元包括:第一操作模塊,用于在所述匹配模塊每匹配一次的情況下,根據(jù)當(dāng)前次的匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行一次操作,并將操作后的所述待核對(duì)知識(shí)庫(kù)作為下一次 進(jìn)行匹配的所述待核對(duì)知識(shí)庫(kù),直至所述匹配模塊將第i個(gè)所述對(duì)比數(shù)據(jù)源的最后一條信息與所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配;以及第二操作模塊,用于根據(jù)與所述最后一條信息對(duì)應(yīng)的匹配結(jié)果對(duì)所述待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到所述第i目標(biāo)知識(shí)庫(kù)。
進(jìn)一步地,所述操作單元包括:確認(rèn)子單元,用于在所述匹配結(jié)果表示所述對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息相匹配的情況下,確認(rèn)所述待核對(duì)知識(shí)庫(kù)的信息維持不變;以及操作子單元,用于在所述匹配結(jié)果表示所述對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不相匹配的情況下,根據(jù)接收到的指令對(duì)所述待核對(duì)知識(shí)庫(kù)進(jìn)行操作。
進(jìn)一步地,所述操作子單元包括:更新模塊,用于在所述匹配結(jié)果表示所述對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不相匹配的情況下,在所述指令的指令標(biāo)識(shí)為第一預(yù)設(shè)標(biāo)識(shí)的情況下,利用所述對(duì)比數(shù)據(jù)源的信息更新所述待核對(duì)知識(shí)庫(kù)的信息;以及確認(rèn)模塊,用于在所述匹配結(jié)果表示所述對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不相匹配的情況下,在所述指令的指令標(biāo)識(shí)為第二預(yù)設(shè)標(biāo)識(shí)的情況下,確認(rèn)所述待核對(duì)知識(shí)庫(kù)的信息維持不變。
在本申請(qǐng)實(shí)施例中,采用獲取對(duì)比數(shù)據(jù)源的信息,將對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到匹配結(jié)果,根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作。通過獲取用來(lái)和待核對(duì)知識(shí)庫(kù)進(jìn)行對(duì)照的對(duì)比數(shù)據(jù)源的信息,將對(duì)比數(shù)據(jù)源中的信息和待核對(duì)知識(shí)庫(kù)中的信息進(jìn)行對(duì)比,得到匹配結(jié)果,再根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,達(dá)到了自動(dòng)進(jìn)行知識(shí)庫(kù)信息核對(duì)的目的,實(shí)現(xiàn)了高效準(zhǔn)確核對(duì)知識(shí)庫(kù)的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)中人工核對(duì)知識(shí)庫(kù)費(fèi)時(shí)費(fèi)力,遺漏率高且容易出錯(cuò)的技術(shù)問題。
附圖說明
此處所說明的附圖用來(lái)提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
圖1是根據(jù)本申請(qǐng)實(shí)施例的知識(shí)庫(kù)核對(duì)方法的流程圖;
圖2是根據(jù)本申請(qǐng)實(shí)施例所提供的知識(shí)庫(kù)核對(duì)方法進(jìn)行知識(shí)庫(kù)的核對(duì)的一種流程圖;
圖3是根據(jù)本申請(qǐng)實(shí)施例所提供的知識(shí)庫(kù)核對(duì)方法進(jìn)行知識(shí)庫(kù)的核對(duì)的另一種流程圖;以及
圖4是根據(jù)本申請(qǐng)實(shí)施例的知識(shí)庫(kù)核對(duì)裝置的示意圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本申請(qǐng)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分的實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù)的范圍。
需要說明的是,本申請(qǐng)的說明書和權(quán)利要求書及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請(qǐng)的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
根據(jù)本申請(qǐng)實(shí)施例,提供了一種知識(shí)庫(kù)核對(duì)方法的實(shí)施例,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
圖1是根據(jù)本申請(qǐng)實(shí)施例的知識(shí)庫(kù)核對(duì)方法的流程圖,如圖1所示,該方法包括如下步驟:
步驟S102,獲取對(duì)比數(shù)據(jù)源的信息。
步驟S104,將對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到匹配結(jié)果。
步驟S106,根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作。
在本申請(qǐng)實(shí)施例中,對(duì)比數(shù)據(jù)源可以是第三方數(shù)據(jù)源,該第三方數(shù)據(jù)源用于對(duì)待核對(duì)知識(shí)庫(kù)進(jìn)行信息核對(duì),待核對(duì)知識(shí)庫(kù)還可以具體是知識(shí)圖譜。待核對(duì)知識(shí)庫(kù)是需要進(jìn)行核對(duì)的知識(shí)庫(kù),由于某些原因,待核對(duì)知識(shí)庫(kù)中的信息有一部分是錯(cuò)誤的,需要將待核對(duì)知識(shí)庫(kù)中正確的信息加以確認(rèn),將錯(cuò)誤的信息找出來(lái)并改正。對(duì)比數(shù)據(jù)源是用來(lái)和待核對(duì)知識(shí)庫(kù)進(jìn)行對(duì)照的數(shù)據(jù)庫(kù)。對(duì)比數(shù)據(jù)源中有一些信息和待核對(duì)知識(shí)庫(kù)中的信息是相同或相似的,例如二者都記錄了某公司的地址和成立時(shí)間。根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,對(duì)待核對(duì)知識(shí)庫(kù)中的信息進(jìn)行操作可以是添加新 的信息,刪除錯(cuò)誤的信息,確認(rèn)正確的信息,更改已有的信息,等等。
例如,待核對(duì)知識(shí)庫(kù)中有一條信息I1如表1所示,對(duì)比數(shù)據(jù)源中有一條信息I2如表2所示。
表1
表2
將待核對(duì)知識(shí)庫(kù)中的信息I1和對(duì)比數(shù)據(jù)源中的信息I2中表示公司名稱的字段進(jìn)行匹配,得到匹配度100%,因此信息I1和信息I2表示的是同一個(gè)公司的信息。將信息I1和信息I2中表示公司地址的字段進(jìn)行匹配,發(fā)現(xiàn)匹配度100%,此時(shí),不更改待核對(duì)知識(shí)庫(kù)。將信息I1和信息I2中表示公司聯(lián)系方式的字段進(jìn)行匹配,發(fā)現(xiàn)匹配度為0,由人工核對(duì)后,發(fā)現(xiàn)待核對(duì)知識(shí)庫(kù)的信息I1缺少公司聯(lián)系方式的信息,將對(duì)比數(shù)據(jù)源中的信息I2中的“010-85999899”添加到信息I1表示公司聯(lián)系方式的字段,此時(shí),更新后的待核對(duì)知識(shí)庫(kù)中的信息I1如表2所示。
再例如,待核對(duì)知識(shí)庫(kù)中有一條信息I3如表3所示,對(duì)比數(shù)據(jù)源中有一條信息I4如表4所示。
表3
表4
將待核對(duì)知識(shí)庫(kù)中的信息I3和對(duì)比數(shù)據(jù)源中的信息I4中表示公司名稱的字段進(jìn)行匹配,得到匹配度100%,因此信息I1和信息I2表示的是同一個(gè)公司的信息。將信息I3和信息I4中表示總部地點(diǎn)的字段進(jìn)行匹配,發(fā)現(xiàn)匹配度100%,此時(shí),不更改待核對(duì)知識(shí)庫(kù)。將信息I3和信息I4中表示公司聯(lián)系方式的字段進(jìn)行匹配,發(fā)現(xiàn)匹配度100%,此時(shí),不更改待核對(duì)知識(shí)庫(kù)。將信息I3和信息I4中表示成立時(shí)間的字段進(jìn)行匹配,發(fā)現(xiàn)匹配度很低,由人工核查后發(fā)現(xiàn)匯源公司的成立時(shí)間是1992年,即待核對(duì)知識(shí)庫(kù)中的信息正確,而對(duì)比數(shù)據(jù)源中的信息錯(cuò)誤,此時(shí),不更改待核對(duì)知識(shí)庫(kù)。
通過獲取用來(lái)和待核對(duì)知識(shí)庫(kù)進(jìn)行對(duì)照的對(duì)比數(shù)據(jù)源的信息,將對(duì)比數(shù)據(jù)源中的信息和待核對(duì)知識(shí)庫(kù)中的信息進(jìn)行對(duì)比,得到匹配結(jié)果,再根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,達(dá)到了自動(dòng)進(jìn)行知識(shí)庫(kù)信息核對(duì)的目的,實(shí)現(xiàn)了高效準(zhǔn)確核對(duì)知識(shí)庫(kù)的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)中人工核對(duì)知識(shí)庫(kù)費(fèi)時(shí)費(fèi)力,遺漏率高且容易出錯(cuò)的技術(shù)問題。
可選地,在本申請(qǐng)實(shí)施例中,可以采用多個(gè)對(duì)比數(shù)據(jù)源來(lái)核對(duì)待核對(duì)知識(shí)庫(kù)中的信息,假設(shè)對(duì)比數(shù)據(jù)源的數(shù)量為m,m一般為10以內(nèi)的數(shù)值,通常可以取2至3,當(dāng)然,在不十分注重核對(duì)速度和效率的情況下,為了進(jìn)一步提高核對(duì)的精確度,還可以將m的取值設(shè)置為大于3的其它自然數(shù),但是,如果m取值太大的話,會(huì)導(dǎo)致運(yùn)算量超大,嚴(yán)重影響核對(duì)的效率。對(duì)于采用多個(gè)對(duì)比數(shù)據(jù)源的情況,將對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到匹配結(jié)果,根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作包括:將第i個(gè)對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第i匹配結(jié)果,并根據(jù)第i匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到第i目標(biāo)知識(shí)庫(kù);以及然后將第i+1個(gè)對(duì)比數(shù)據(jù)源的信息與第i目標(biāo)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第i+1匹配結(jié)果,并根據(jù)第i+1匹配結(jié)果對(duì)第i目標(biāo)知識(shí)庫(kù)的信息進(jìn)行操作,其中,i依次取1至m-1。
即,對(duì)比數(shù)據(jù)源有多個(gè)。將第1個(gè)對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第1匹配結(jié)果,根據(jù)第1匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到第1目標(biāo)知識(shí)庫(kù)。此時(shí),第1目標(biāo)知識(shí)庫(kù)為待核對(duì)知識(shí)庫(kù)。
將第2個(gè)對(duì)比數(shù)據(jù)源的信息與第1目標(biāo)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第2匹配結(jié)果,根據(jù)第2匹配結(jié)果對(duì)第1目標(biāo)知識(shí)庫(kù)的信息進(jìn)行操作,得到第2目標(biāo)知識(shí)庫(kù)。此時(shí),第2目標(biāo)知識(shí)庫(kù)為待核對(duì)知識(shí)庫(kù)。
將第3個(gè)對(duì)比數(shù)據(jù)源的信息與第2目標(biāo)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第3匹配結(jié)果,根據(jù)第3匹配結(jié)果對(duì)第2目標(biāo)知識(shí)庫(kù)的信息進(jìn)行操作,得到第3目標(biāo)知識(shí)庫(kù)。此時(shí),第3目標(biāo)知識(shí)庫(kù)為待核對(duì)知識(shí)庫(kù)。之后的步驟以此類推,直到將第m個(gè)對(duì)比數(shù)據(jù)源的信息與第m-1目標(biāo)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第m匹配結(jié)果,根據(jù)第m匹配結(jié)果對(duì)第m-1目標(biāo)知識(shí)庫(kù)的信息進(jìn)行操作,得到第m目標(biāo)知識(shí)庫(kù),其中,m為對(duì)比數(shù)據(jù)源的數(shù)量。
由于對(duì)比數(shù)據(jù)源中的信息也可能有錯(cuò)誤,因此使用多個(gè)數(shù)據(jù)源與待核對(duì)知識(shí)庫(kù)一一對(duì)比能夠有效提高信息的可信度。并且每對(duì)比完一個(gè)數(shù)據(jù)源,就根據(jù)匹配結(jié)果將待核對(duì)知識(shí)庫(kù)中的信息進(jìn)行操作,及時(shí)更新了待核對(duì)知識(shí)庫(kù),提高了核對(duì)的效率和準(zhǔn)確率。
可選地,利用任意一個(gè)對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息進(jìn)行核對(duì)過程中,可以利用該對(duì)比數(shù)據(jù)源中的每一條信息進(jìn)行一一核對(duì),以利用第i個(gè)對(duì)比數(shù)據(jù)源的信息對(duì)知識(shí)庫(kù)中的信息進(jìn)行核對(duì)為例進(jìn)行說明,將第i個(gè)對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第i匹配結(jié)果,并根據(jù)第i匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到第i目標(biāo)知識(shí)庫(kù)包括如下步驟:
依次將第i個(gè)對(duì)比數(shù)據(jù)源的每一條信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,其中,每匹配一次,根據(jù)當(dāng)前次的匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行一次操作,并將操作后的待核對(duì)知識(shí)庫(kù)作為下一次進(jìn)行匹配的待核對(duì)知識(shí)庫(kù),直至將第i個(gè)對(duì)比數(shù)據(jù)源的最后一條信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配;然后,根據(jù)與最后一條信息對(duì)應(yīng)的匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到第i目標(biāo)知識(shí)庫(kù)。
可選地,根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作包括:在匹配結(jié)果表示對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息相匹配的情況下,確認(rèn)待核對(duì)知識(shí)庫(kù)的信息維持不變;以及在匹配結(jié)果表示對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不相匹配的情況下,根據(jù)接收到的指令對(duì)待核對(duì)知識(shí)庫(kù)進(jìn)行操作。
當(dāng)匹配結(jié)果表明對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息相匹配的情況下,此時(shí),不對(duì)待核對(duì)知識(shí)庫(kù)的信息做任何改變。當(dāng)匹配結(jié)果表明對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)的信息不匹配的情況下,由人工核對(duì)信息,判斷待核對(duì)知識(shí)庫(kù)中的信息是否正確,根據(jù)判斷結(jié)果,發(fā)出指令,該指令用來(lái)對(duì)待核對(duì)知識(shí)庫(kù)進(jìn)行操作。
對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息相匹配可以有兩種方式:一種是對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息完全相同,另一種是對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息不完全相同,但匹配度高于閾值。閾值為提前設(shè)置的數(shù)值,匹配度大于或等于閾值即表明對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息為相同含義的信息??梢岳米址钠ヅ鋪?lái)計(jì)算兩條信息之間的匹配度。
例如,對(duì)比數(shù)據(jù)源中有一條信息是“A公司的成立時(shí)間是2005年5月1日”,待核對(duì)知識(shí)庫(kù)中也有一條信息是“A公司的成立時(shí)間是2005年5月1日”,使用預(yù)設(shè)的方法計(jì)算這兩條信息之間的匹配度之后,發(fā)現(xiàn)匹配度為100%,此時(shí),不對(duì)待核對(duì)知識(shí)庫(kù)中的信息做任何改變。
再例如,對(duì)比數(shù)據(jù)源中有一條信息是“A公司的成立時(shí)間是2005年5月1日”,待核對(duì)知識(shí)庫(kù)中有一條信息是“A公司的建立時(shí)間是2005年5月1日”,使用預(yù)設(shè)的方法計(jì)算這兩條信息之間的匹配度之后,發(fā)現(xiàn)匹配度高于閾值,因此,這兩條信息相匹配,此時(shí),不對(duì)待核對(duì)知識(shí)庫(kù)中的信息做任何改變。
當(dāng)匹配結(jié)果表明對(duì)比數(shù)據(jù)源中的信息和待核對(duì)知識(shí)庫(kù)中的信息不匹配,則由人工審核待核對(duì)知識(shí)庫(kù)中的信息是否正確。
例如,對(duì)比數(shù)據(jù)源中有一條信息是“B公司的成立時(shí)間是2005年5月1日”,待核對(duì)知識(shí)庫(kù)中有一條信息是“B公司的成立時(shí)間是1998年6月8日”,使用預(yù)設(shè)的方法計(jì)算這兩條信息之間的匹配度之后,發(fā)現(xiàn)匹配度低于閾值,因此,這兩條信息不匹配。由人工對(duì)B公司的成立時(shí)間進(jìn)行查詢和確定,發(fā)現(xiàn)B公司的成立時(shí)間是2005年5月1日,此時(shí),將待核對(duì)知識(shí)庫(kù)中的信息“B公司的成立時(shí)間是1998年6月8日”更改為“B公司的成立時(shí)間是2005年5月1日”。
可選地,在匹配結(jié)果表示對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不相匹配的情況下,根據(jù)接收到的指令對(duì)待核對(duì)知識(shí)庫(kù)進(jìn)行操作包括:在指令的指令標(biāo)識(shí)為第一預(yù)設(shè)標(biāo)識(shí)的情況下,利用對(duì)比數(shù)據(jù)源的信息更新待核對(duì)知識(shí)庫(kù)的信息;以及在指令的指令標(biāo)識(shí)為第二預(yù)設(shè)標(biāo)識(shí)的情況下,確認(rèn)待核對(duì)知識(shí)庫(kù)的信息維持不變。
當(dāng)對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不匹配的情況下,由人工進(jìn)行核對(duì)。
當(dāng)人工發(fā)現(xiàn)待核對(duì)知識(shí)庫(kù)中的信息錯(cuò)誤,而對(duì)比數(shù)據(jù)源中的信息正確的情況下,發(fā)出指令標(biāo)識(shí)為第一預(yù)設(shè)標(biāo)識(shí)的指令,該指令用于指示將待核對(duì)知識(shí)庫(kù)中錯(cuò)誤的信息更改為對(duì)比數(shù)據(jù)源中相對(duì)應(yīng)的正確的信息。
當(dāng)人工發(fā)現(xiàn)待核對(duì)知識(shí)庫(kù)中的信息正確,而對(duì)比數(shù)據(jù)源中的信息錯(cuò)誤的情況下,發(fā)出指令標(biāo)識(shí)為第二預(yù)設(shè)標(biāo)識(shí)的指令,該指令用于指示確認(rèn)待核對(duì)知識(shí)庫(kù)中的信息維 持不變。
第一預(yù)設(shè)標(biāo)識(shí)和第二預(yù)設(shè)標(biāo)識(shí)可以有多種表示形式。
例如,計(jì)算機(jī)在計(jì)算出待核對(duì)知識(shí)庫(kù)的某條信息和對(duì)比數(shù)據(jù)源的相應(yīng)的信息之間的匹配度之后,由于匹配度小于閾值,計(jì)算機(jī)彈出信息框“是否需要更改待核對(duì)知識(shí)庫(kù)中的這條數(shù)據(jù)?”
信息框下面有選擇區(qū)域,選擇區(qū)域具有兩種標(biāo)識(shí),分別為“Y”和“N”?!癥”表示第一預(yù)設(shè)標(biāo)識(shí),如果核對(duì)人員點(diǎn)擊“Y”,就會(huì)發(fā)出更改知識(shí)庫(kù)的指令,計(jì)算機(jī)接收到該條指令后,知識(shí)庫(kù)中的內(nèi)容就會(huì)更改;“N”表示第二預(yù)設(shè)標(biāo)識(shí),如果核對(duì)人員點(diǎn)擊“N”,就會(huì)發(fā)出確認(rèn)知識(shí)庫(kù)中的內(nèi)容維持不變的指令,計(jì)算機(jī)接收到該條指令后,知識(shí)中的內(nèi)容維持不變。
也可以用“√”表示第一預(yù)設(shè)標(biāo)識(shí),用“×”表示第二預(yù)設(shè)標(biāo)識(shí),等等。
圖2是根據(jù)本申請(qǐng)實(shí)施例所提供的知識(shí)庫(kù)核對(duì)方法進(jìn)行知識(shí)庫(kù)的核對(duì)的一種流程圖。如圖2所示,利用該方法進(jìn)行知識(shí)庫(kù)的核對(duì)主要包括以下步驟:
步驟S202,獲取多個(gè)對(duì)比數(shù)據(jù)源的信息。步驟S202的具體實(shí)施方式與步驟S102相同。
步驟S204,將多個(gè)對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,匹配不成功時(shí),由人工進(jìn)行審核并發(fā)出指令。步驟S204的具體實(shí)施方式與步驟S104相同。
步驟S206,接收指令,根據(jù)指令對(duì)待核對(duì)知識(shí)庫(kù)中的信息進(jìn)行操作。步驟S206的具體實(shí)施方式與步驟S106相同。
通過上述步驟,實(shí)現(xiàn)了高效準(zhǔn)確核對(duì)知識(shí)庫(kù)的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)中人工核對(duì)知識(shí)庫(kù)費(fèi)時(shí)費(fèi)力,遺漏率高且容易出錯(cuò)的技術(shù)問題。
圖3是根據(jù)本申請(qǐng)實(shí)施例所提供的知識(shí)庫(kù)核對(duì)方法進(jìn)行知識(shí)庫(kù)的核對(duì)的另一種流程圖。如圖3所示,利用該方法進(jìn)行知識(shí)庫(kù)的核對(duì)主要包括以下步驟:
步驟S302,獲取對(duì)比數(shù)據(jù)源1至對(duì)比數(shù)據(jù)源n的信息,并設(shè)置i=1。步驟S302的具體實(shí)施方式與上述步驟S102相同。
步驟S304,計(jì)算對(duì)比數(shù)據(jù)源i的某條信息與待核對(duì)知識(shí)庫(kù)相應(yīng)的信息的匹配度。步驟S304的具體實(shí)施方式與上述步驟S104相同。
步驟S306,判斷匹配度是否大于或等于閾值。如果匹配度大于或等于閾值,執(zhí)行步驟S308;如果匹配度小于閾值,執(zhí)行步驟S310。
步驟S308,維持待核對(duì)知識(shí)庫(kù)的信息不變。
步驟S310,根據(jù)接收到的指令對(duì)待核對(duì)知識(shí)庫(kù)進(jìn)行操作。步驟S306至步驟S310的具體實(shí)施方式與上述步驟S106相同。
步驟S312,判斷對(duì)比數(shù)據(jù)源i的所有信息是否均與待核對(duì)知識(shí)庫(kù)相應(yīng)的信息匹配完畢。如果判斷出對(duì)比數(shù)據(jù)源i中的所有信息均與待核對(duì)知識(shí)庫(kù)相應(yīng)的信息匹配完畢的情況下,執(zhí)行步驟S314;如果判斷出對(duì)比數(shù)據(jù)源i中存在信息未與待核對(duì)知識(shí)庫(kù)相應(yīng)的信息匹配的情況下,執(zhí)行步驟S304。
步驟S314,判斷i與n是否相等。如果判斷出i與n不相等,執(zhí)行步驟S316;如果判斷出i與n相等,說明n個(gè)對(duì)比數(shù)據(jù)源均已經(jīng)與待核對(duì)知識(shí)庫(kù)對(duì)比完畢,結(jié)束。
步驟S316,將i+1的值賦值給i。
通過上述步驟,實(shí)現(xiàn)了高效準(zhǔn)確核對(duì)知識(shí)庫(kù)的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)中人工核對(duì)知識(shí)庫(kù)費(fèi)時(shí)費(fèi)力,遺漏率高且容易出錯(cuò)的技術(shù)問題。
根據(jù)本申請(qǐng)實(shí)施例,還提供了一種知識(shí)庫(kù)核對(duì)裝置。該知識(shí)庫(kù)核對(duì)裝置可以執(zhí)行上述知識(shí)庫(kù)核對(duì)方法,上述知識(shí)庫(kù)核對(duì)方法也可以通過該知識(shí)庫(kù)核對(duì)裝置實(shí)施。
圖4是根據(jù)本申請(qǐng)實(shí)施例的知識(shí)庫(kù)核對(duì)裝置的示意圖,如圖4所示,該知識(shí)庫(kù)核對(duì)裝置主要包括獲取單元10、匹配單元20和操作單元30,其中:
獲取單元10用于獲取對(duì)比數(shù)據(jù)源的信息。
匹配單元20用于將對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到匹配結(jié)果。
操作單元30用于根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作。
在本申請(qǐng)實(shí)施例中,對(duì)比數(shù)據(jù)源可以是第三方數(shù)據(jù)源,該第三方數(shù)據(jù)源用于對(duì)待核對(duì)知識(shí)庫(kù)進(jìn)行信息核對(duì),待核對(duì)知識(shí)庫(kù)還可以具體是知識(shí)圖譜。待核對(duì)知識(shí)庫(kù)是需要進(jìn)行核對(duì)的知識(shí)庫(kù),由于某些原因,待核對(duì)知識(shí)庫(kù)中的信息有一部分是錯(cuò)誤的,需要將待核對(duì)知識(shí)庫(kù)中正確的信息加以確認(rèn),將錯(cuò)誤的信息找出來(lái)并改正。對(duì)比數(shù)據(jù)源是用來(lái)和待核對(duì)知識(shí)庫(kù)進(jìn)行對(duì)照的數(shù)據(jù)庫(kù)。對(duì)比數(shù)據(jù)源中有一些信息和待核對(duì)知識(shí)庫(kù)中的信息是相同或相似的,例如二者都記錄了某公司的地址和成立時(shí)間。根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,對(duì)待核對(duì)知識(shí)庫(kù)中的信息進(jìn)行操作可以是添加新的信息,刪除錯(cuò)誤的信息,確認(rèn)正確的信息,更改已有的信息,等等。
例如,待核對(duì)知識(shí)庫(kù)中有一條信息I1如上表1所示,對(duì)比數(shù)據(jù)源中有一條信息 I2如上表2所示。
將待核對(duì)知識(shí)庫(kù)中的信息I1和對(duì)比數(shù)據(jù)源中的信息I2中表示公司名稱的字段進(jìn)行匹配,得到匹配度100%,因此信息I1和信息I2表示的是同一個(gè)公司的信息。將信息I1和信息I2中表示公司地址的字段進(jìn)行匹配,發(fā)現(xiàn)匹配度100%,此時(shí),不更改待核對(duì)知識(shí)庫(kù)。將信息I1和信息I2中表示公司聯(lián)系方式的字段進(jìn)行匹配,發(fā)現(xiàn)匹配度為0,由人工核對(duì)后,發(fā)現(xiàn)待核對(duì)知識(shí)庫(kù)的信息I1缺少公司聯(lián)系方式的信息,將對(duì)比數(shù)據(jù)源中的信息I2中的“010-85999899”添加到信息I1表示公司聯(lián)系方式的字段,此時(shí),更新后的待核對(duì)知識(shí)庫(kù)中的信息I1如表2所示。
再例如,待核對(duì)知識(shí)庫(kù)中有一條信息I3如上表3所示,對(duì)比數(shù)據(jù)源中有一條信息I4如上表4所示。
將待核對(duì)知識(shí)庫(kù)中的信息I3和對(duì)比數(shù)據(jù)源中的信息I4中表示公司名稱的字段進(jìn)行匹配,得到匹配度100%,因此信息I1和信息I2表示的是同一個(gè)公司的信息。將信息I3和信息I4中表示總部地點(diǎn)的字段進(jìn)行匹配,發(fā)現(xiàn)匹配度100%,此時(shí),不更改待核對(duì)知識(shí)庫(kù)。將信息I3和信息I4中表示公司聯(lián)系方式的字段進(jìn)行匹配,發(fā)現(xiàn)匹配度100%,此時(shí),不更改待核對(duì)知識(shí)庫(kù)。將信息I3和信息I4中表示成立時(shí)間的字段進(jìn)行匹配,發(fā)現(xiàn)匹配度很低,由人工核查后發(fā)現(xiàn)匯源公司的成立時(shí)間是1992年,即待核對(duì)知識(shí)庫(kù)中的信息正確,而對(duì)比數(shù)據(jù)源中的信息錯(cuò)誤,此時(shí),不更改待核對(duì)知識(shí)庫(kù)。
通過獲取用來(lái)和待核對(duì)知識(shí)庫(kù)進(jìn)行對(duì)照的對(duì)比數(shù)據(jù)源的信息,將對(duì)比數(shù)據(jù)源中的信息和待核對(duì)知識(shí)庫(kù)中的信息進(jìn)行對(duì)比,得到匹配結(jié)果,再根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,達(dá)到了自動(dòng)進(jìn)行知識(shí)庫(kù)信息核對(duì)的目的,實(shí)現(xiàn)了高效準(zhǔn)確核對(duì)知識(shí)庫(kù)的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)中人工核對(duì)知識(shí)庫(kù)費(fèi)時(shí)費(fèi)力,遺漏率高且容易出錯(cuò)的技術(shù)問題。
可選地,在本申請(qǐng)實(shí)施例中,可以采用多個(gè)對(duì)比數(shù)據(jù)源來(lái)核對(duì)待核對(duì)知識(shí)庫(kù)中的信息,假設(shè)對(duì)比數(shù)據(jù)源的數(shù)量為m,匹配單元20主要包括第i匹配子單元和第i+1匹配子單元,操作單元30主要包括第i操作子單元和第i+1操作子單元。第i匹配子單元用于將第i個(gè)對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第i匹配結(jié)果,第i操作子單元用于根據(jù)第i匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到第i目標(biāo)知識(shí)庫(kù);第i+1匹配子單元用于將第i+1個(gè)對(duì)比數(shù)據(jù)源的信息與第i目標(biāo)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第i+1匹配結(jié)果,第i+1操作子單元用于根據(jù)第i+1匹配結(jié)果對(duì)第i目標(biāo)知識(shí)庫(kù)的信息進(jìn)行操作,其中,i依次取1至m-1。
即,對(duì)比數(shù)據(jù)源有多個(gè)。將第1個(gè)對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行 匹配,得到第1匹配結(jié)果,根據(jù)第1匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到第1目標(biāo)知識(shí)庫(kù)。此時(shí),第1目標(biāo)知識(shí)庫(kù)為待核對(duì)知識(shí)庫(kù)。
將第2個(gè)對(duì)比數(shù)據(jù)源的信息與第1目標(biāo)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第2匹配結(jié)果,根據(jù)第2匹配結(jié)果對(duì)第1目標(biāo)知識(shí)庫(kù)的信息進(jìn)行操作,得到第2目標(biāo)知識(shí)庫(kù)。此時(shí),第2目標(biāo)知識(shí)庫(kù)為待核對(duì)知識(shí)庫(kù)。
將第3個(gè)對(duì)比數(shù)據(jù)源的信息與第2目標(biāo)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第3匹配結(jié)果,根據(jù)第3匹配結(jié)果對(duì)第2目標(biāo)知識(shí)庫(kù)的信息進(jìn)行操作,得到第3目標(biāo)知識(shí)庫(kù)。此時(shí),第3目標(biāo)知識(shí)庫(kù)為待核對(duì)知識(shí)庫(kù)。之后的步驟以此類推,直到將第m個(gè)對(duì)比數(shù)據(jù)源的信息與第m-1目標(biāo)知識(shí)庫(kù)的信息進(jìn)行匹配,得到第m匹配結(jié)果,根據(jù)第m匹配結(jié)果對(duì)第m-1目標(biāo)知識(shí)庫(kù)的信息進(jìn)行操作,得到第m目標(biāo)知識(shí)庫(kù),其中,m為對(duì)比數(shù)據(jù)源的數(shù)量。
由于對(duì)比數(shù)據(jù)源中的信息也可能有錯(cuò)誤,因此使用多個(gè)對(duì)比數(shù)據(jù)源與待核對(duì)知識(shí)庫(kù)一一對(duì)比能夠有效提高信息的可信度。并且每對(duì)比完一個(gè)數(shù)據(jù)源,就根據(jù)匹配結(jié)果將待核對(duì)知識(shí)庫(kù)中的信息進(jìn)行操作,及時(shí)更新了待核對(duì)知識(shí)庫(kù),提高了核對(duì)的效率和準(zhǔn)確率。
可選地,利用任意一個(gè)對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息進(jìn)行核對(duì)過程中,可以利用該對(duì)比數(shù)據(jù)源中的每一條信息進(jìn)行一一核對(duì),以利用第i個(gè)對(duì)比數(shù)據(jù)源的信息對(duì)知識(shí)庫(kù)中的信息進(jìn)行核對(duì)為例進(jìn)行說明,第i匹配子單元包括匹配模塊,第i操作子單元包括第一操作模塊和第二操作模塊。
其中,匹配模塊用于依次將第i個(gè)對(duì)比數(shù)據(jù)源的每一條信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配。第一操作模塊用于在匹配模塊每匹配一次的情況下,根據(jù)當(dāng)前次的匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行一次操作,并將操作后的待核對(duì)知識(shí)庫(kù)作為下一次進(jìn)行匹配的待核對(duì)知識(shí)庫(kù),直至匹配模塊將第i個(gè)對(duì)比數(shù)據(jù)源的最后一條信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配;第二操作模塊用于根據(jù)與最后一條信息對(duì)應(yīng)的匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作,得到第i目標(biāo)知識(shí)庫(kù)。
可選地,操作單元30包括確定子單元和操作子單元,該確認(rèn)子單元用于在匹配結(jié)果表示對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息相匹配的情況下,確認(rèn)待核對(duì)知識(shí)庫(kù)的信息維持不變;該操作子單元用于在匹配結(jié)果表示對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不相匹配的情況下,根據(jù)接收到的指令對(duì)待核對(duì)知識(shí)庫(kù)進(jìn)行操作。
當(dāng)匹配結(jié)果表明對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息相匹配的情況下,此時(shí),不對(duì)待核對(duì)知識(shí)庫(kù)的信息做任何改變。當(dāng)匹配結(jié)果表明對(duì)比數(shù)據(jù)源中的信息與 待核對(duì)知識(shí)庫(kù)的信息不匹配的情況下,由人工核對(duì)信息,判斷待核對(duì)知識(shí)庫(kù)中的信息是否正確,根據(jù)判斷結(jié)果,發(fā)出指令,該指令用來(lái)對(duì)待核對(duì)知識(shí)庫(kù)進(jìn)行操作。
對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息相匹配可以有兩種方式:一種是對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息完全相同,另一種是對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息不完全相同,但匹配度高于閾值。閾值為提前設(shè)置的數(shù)值,匹配度大于或等于閾值即表明對(duì)比數(shù)據(jù)源中的信息與待核對(duì)知識(shí)庫(kù)中的信息為相同含義的信息??梢岳米址钠ヅ鋪?lái)計(jì)算兩條信息之間的匹配度。
例如,對(duì)比數(shù)據(jù)源中有一條信息是“A公司的成立時(shí)間是2005年5月1日”,待核對(duì)知識(shí)庫(kù)中也有一條信息是“A公司的成立時(shí)間是2005年5月1日”,使用預(yù)設(shè)的方法計(jì)算這兩條信息之間的匹配度之后,發(fā)現(xiàn)匹配度為100%,此時(shí),不對(duì)待核對(duì)知識(shí)庫(kù)中的信息做任何改變。
再例如,對(duì)比數(shù)據(jù)源中有一條信息是“A公司的成立時(shí)間是2005年5月1日”,待核對(duì)知識(shí)庫(kù)中有一條信息是“A公司的建立時(shí)間是2005年5月1日”,使用預(yù)設(shè)的方法計(jì)算這兩條信息之間的匹配度之后,發(fā)現(xiàn)匹配度高于閾值,因此,這兩條信息相匹配,此時(shí),不對(duì)待核對(duì)知識(shí)庫(kù)中的信息做任何改變。
當(dāng)匹配結(jié)果表明對(duì)比數(shù)據(jù)源中的信息和待核對(duì)知識(shí)庫(kù)中的信息不匹配,則由人工審核待核對(duì)知識(shí)庫(kù)中的信息是否正確。
例如,對(duì)比數(shù)據(jù)源中有一條信息是“B公司的成立時(shí)間是2005年5月1日”,待核對(duì)知識(shí)庫(kù)中有一條信息是“B公司的成立時(shí)間是1998年6月8日”,使用預(yù)設(shè)的方法計(jì)算這兩條信息之間的匹配度之后,發(fā)現(xiàn)匹配度低于閾值,因此,這兩條信息不匹配。由人工對(duì)B公司的成立時(shí)間進(jìn)行查詢和確定,發(fā)現(xiàn)B公司的成立時(shí)間是2005年5月1日,此時(shí),將待核對(duì)知識(shí)庫(kù)中的信息“B公司的成立時(shí)間是1998年6月8日”更改為“B公司的成立時(shí)間是2005年5月1日”。
可選地,操作子單元包括更新模塊和確定模塊,其中,更新模塊用于在匹配結(jié)果表示對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不相匹配的情況下,在指令的指令標(biāo)識(shí)為第一預(yù)設(shè)標(biāo)識(shí)的情況下,利用對(duì)比數(shù)據(jù)源的信息更新待核對(duì)知識(shí)庫(kù)的信息;確認(rèn)模塊用于在匹配結(jié)果表示對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不相匹配的情況下,在指令的指令標(biāo)識(shí)為第二預(yù)設(shè)標(biāo)識(shí)的情況下,確認(rèn)待核對(duì)知識(shí)庫(kù)的信息維持不變。
當(dāng)對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息不匹配的情況下,由人工進(jìn)行核對(duì)。
當(dāng)人工發(fā)現(xiàn)待核對(duì)知識(shí)庫(kù)中的信息錯(cuò)誤,而對(duì)比數(shù)據(jù)源中的信息正確的情況下,發(fā)出指令標(biāo)識(shí)為第一預(yù)設(shè)標(biāo)識(shí)的指令,該指令用于指示將待核對(duì)知識(shí)庫(kù)中錯(cuò)誤的信息 更改為對(duì)比數(shù)據(jù)源中相對(duì)應(yīng)的正確的信息。
當(dāng)人工發(fā)現(xiàn)待核對(duì)知識(shí)庫(kù)中的信息正確,而對(duì)比數(shù)據(jù)源中的信息錯(cuò)誤的情況下,發(fā)出指令標(biāo)識(shí)為第二預(yù)設(shè)標(biāo)識(shí)的指令,該指令用于指示確認(rèn)待核對(duì)知識(shí)庫(kù)中的信息維持不變。
第一預(yù)設(shè)標(biāo)識(shí)和第二預(yù)設(shè)標(biāo)識(shí)可以有多種表示形式。
例如,計(jì)算機(jī)在計(jì)算出待核對(duì)知識(shí)庫(kù)的某條信息和對(duì)比數(shù)據(jù)源的相應(yīng)的信息之間的匹配度之后,由于匹配度小于閾值,計(jì)算機(jī)彈出信息框“是否需要更改待核對(duì)知識(shí)庫(kù)中的這條數(shù)據(jù)?”
信息框下面有選擇區(qū)域,選擇區(qū)域具有兩種標(biāo)識(shí),分別為“Y”和“N”?!癥”表示第一預(yù)設(shè)標(biāo)識(shí),如果核對(duì)人員點(diǎn)擊“Y”,就會(huì)發(fā)出更改知識(shí)庫(kù)的指令,計(jì)算機(jī)接收到該條指令后,知識(shí)庫(kù)中的內(nèi)容就會(huì)更改;“N”表示第二預(yù)設(shè)標(biāo)識(shí),如果核對(duì)人員點(diǎn)擊“N”,就會(huì)發(fā)出確認(rèn)知識(shí)庫(kù)中的內(nèi)容維持不變的指令,計(jì)算機(jī)接收到該條指令后,知識(shí)庫(kù)中的內(nèi)容維持不變。
也可以用“√”表示第一預(yù)設(shè)標(biāo)識(shí),用“×”表示第二預(yù)設(shè)標(biāo)識(shí),等等。
所述知識(shí)庫(kù)核對(duì)裝置包括處理器和存儲(chǔ)器,上述獲取單元10、匹配單元20和操作單元30等均作為程序單元存儲(chǔ)在存儲(chǔ)器中,由處理器執(zhí)行存儲(chǔ)在存儲(chǔ)器中的上述程序單元來(lái)實(shí)現(xiàn)相應(yīng)的功能。
處理器中包含內(nèi)核,由內(nèi)核去存儲(chǔ)器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個(gè)或以上,通過調(diào)整內(nèi)核參數(shù)來(lái)自動(dòng)進(jìn)行知識(shí)庫(kù)信息的核對(duì)。
存儲(chǔ)器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM),存儲(chǔ)器包括至少一個(gè)存儲(chǔ)芯片。
本申請(qǐng)還提供了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時(shí),適于執(zhí)行初始化有如下方法步驟的程序代碼:獲取對(duì)比數(shù)據(jù)源的信息。將對(duì)比數(shù)據(jù)源的信息與待核對(duì)知識(shí)庫(kù)的信息進(jìn)行匹配,得到匹配結(jié)果。根據(jù)匹配結(jié)果對(duì)待核對(duì)知識(shí)庫(kù)的信息進(jìn)行操作。
上述本申請(qǐng)實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
在本申請(qǐng)的上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過其它的方式實(shí)現(xiàn)。其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基于這樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所述僅是本申請(qǐng)的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說,在不脫離本申請(qǐng)?jiān)淼那疤嵯拢€可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本申請(qǐng)的保護(hù)范圍。