專利名稱:識別新商業(yè)伙伴的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種識別新商業(yè)伙伴的系統(tǒng)和方法。
背景技術(shù):
商業(yè)能夠與成百上千的商業(yè)伙伴進(jìn)行合作。這些商業(yè)伙伴可以是客戶、供應(yīng)商、或服務(wù)提供商,并且可以是公司或個人。這樣的商業(yè)通常使用執(zhí)行各種企業(yè)管理應(yīng)用的計(jì)算機(jī)系統(tǒng)來管理他們的活動。在這些計(jì)算機(jī)系統(tǒng)中,商業(yè)產(chǎn)生存儲例如關(guān)于其商業(yè)伙伴的信息的數(shù)據(jù)記錄。例如,商業(yè)伙伴記錄可以包括商業(yè)伙伴代碼以及關(guān)于該商業(yè)伙伴的各種屬性的數(shù)據(jù)。這樣的商業(yè)伙伴記錄可能被記錄在所述應(yīng)用所使用的內(nèi)部商業(yè)伙伴數(shù)據(jù)庫中。
在所述內(nèi)部商業(yè)伙伴數(shù)據(jù)庫中的數(shù)據(jù)的管理會涉及大量費(fèi)用。商業(yè)可以有若干雇員代表來定期地(regularly)尋求(solicit)新的商業(yè)伙伴。這些工作中的一些可能是多余的。例如,一個雇員可能尋求到與伙伴的新的聯(lián)系,并認(rèn)為該伙伴是新的,但是實(shí)際上它已經(jīng)被注冊在內(nèi)部商業(yè)伙伴數(shù)據(jù)庫中。顯然,如果商業(yè)在數(shù)據(jù)庫中保存了代表同一商業(yè)伙伴的多個數(shù)據(jù)記錄,則可能出現(xiàn)問題。但是,如果系統(tǒng)沒有保存一個新的商業(yè)伙伴的新的伙伴記錄,則可能出現(xiàn)另外的問題并造成收入損失。對于很大的實(shí)現(xiàn)來講,系統(tǒng)用戶必須花費(fèi)相當(dāng)可觀的時間來確定新找到的商業(yè)伙伴是否涉及到已經(jīng)保存在數(shù)據(jù)庫中的已有的商業(yè)伙伴記錄,或者該新找到的商業(yè)伙伴還沒有存儲在該數(shù)據(jù)庫中的任何伙伴記錄中。如果新找到的商業(yè)伙伴是“真是新的”,則應(yīng)當(dāng)在數(shù)據(jù)庫中創(chuàng)建新的商業(yè)伙伴記錄,并應(yīng)當(dāng)分配新的商業(yè)伙伴代碼。
假定手動瀏覽巨大的商業(yè)伙伴記錄數(shù)據(jù)庫的費(fèi)用很高,則本領(lǐng)域需要一種方法和系統(tǒng),用于自動識別已有的商業(yè)伙伴,并從已有的商業(yè)伙伴中區(qū)分出新的商業(yè)伙伴。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個方面,提供一種用于識別商業(yè)伙伴的方法,包括接收第一實(shí)體的至少一個屬性;比較所述第一實(shí)體的所述至少一個屬性與先前存儲在已有數(shù)據(jù)庫中的第二實(shí)體的對應(yīng)屬性;計(jì)算所述第一實(shí)體和所述第二實(shí)體之間的差別率,并且如果所述差別率超過第一預(yù)定閾值,則將所述第一實(shí)體作為新商業(yè)伙伴進(jìn)行存儲。
根據(jù)本發(fā)明的另一個方面,提供一種用于識別商業(yè)伙伴的系統(tǒng),包括存儲器單元,用于臨時存儲第一實(shí)體的至少一個屬性;已有數(shù)據(jù)庫,用于存儲第二實(shí)體的至少一個屬性;和商業(yè)伙伴識別單元,用于比較所述第一實(shí)體的至少一個屬性與所述第二實(shí)體的對應(yīng)屬性,并計(jì)算在所述第一實(shí)體和所述第二實(shí)體之間的差別率。
根據(jù)本發(fā)明的再一個方面,提供一種確定是否允許新數(shù)據(jù)記錄進(jìn)入數(shù)據(jù)庫的方法,包括接收代表潛在的新的商業(yè)伙伴的數(shù)據(jù),比較所接收的數(shù)據(jù)與先前存儲的商業(yè)伙伴的數(shù)據(jù)記錄,其中所述潛在的新的商業(yè)伙伴的數(shù)據(jù)和所述數(shù)據(jù)記錄,每一個包括各組屬性,并且其中當(dāng)各個屬性中的數(shù)據(jù)非空時,所述比較對來自所述接收的數(shù)據(jù)和所述數(shù)據(jù)記錄的相似類型的屬性進(jìn)行比較;基于所述比較,確定在所接收的數(shù)據(jù)和至少一個所述記錄之間是否存在相似性;并且如果所接收的數(shù)據(jù)與所有先前存儲的數(shù)據(jù)記錄不同,則將所接收的數(shù)據(jù)存儲到數(shù)據(jù)庫中。
圖1例示了根據(jù)本發(fā)明的實(shí)施例的用于識別新的商業(yè)伙伴的系統(tǒng)的框圖。
圖2例示了根據(jù)本發(fā)明的實(shí)施例的用于識別新的商業(yè)伙伴的方法的流程圖。
具體實(shí)施例方式
本發(fā)明提供了一種方法,用于確定被商業(yè)伙伴數(shù)據(jù)庫的用戶相信為新的、新找到的商業(yè)伙伴是否與已經(jīng)保存在內(nèi)部商業(yè)伙伴數(shù)據(jù)庫中的已有商業(yè)伙伴記錄匹配,或者新找到的商業(yè)伙伴可能真是新的,因此需要作為新的記錄被存儲到商業(yè)伙伴數(shù)據(jù)庫中。關(guān)于新找到的商業(yè)伙伴的信息被存儲在稱為“資源池”(sourcing pool)的臨時存儲器中。商業(yè)伙伴識別單元比較存儲在資源池中的信息與已經(jīng)存儲在商業(yè)伙伴數(shù)據(jù)庫中的每個已有商業(yè)伙伴記錄的信息,并計(jì)算它們之間的差別率(difference rate)。商業(yè)伙伴識別單元然后將該差別率與經(jīng)驗(yàn)值進(jìn)行比較?;诮?jīng)驗(yàn)值,商業(yè)伙伴識別單元決定是否從資源池中將該信息自動導(dǎo)入數(shù)據(jù)庫中。
圖1例示了根據(jù)本發(fā)明的實(shí)施例的系統(tǒng)100的框圖。系統(tǒng)100可以包括資源池101、商業(yè)伙伴識別單元102和商業(yè)伙伴數(shù)據(jù)庫103。如圖所示,資源池101可以臨時存儲關(guān)于新找到的商業(yè)伙伴的信息。商業(yè)伙伴數(shù)據(jù)庫可以存儲關(guān)于已經(jīng)注冊在系統(tǒng)中的已有商業(yè)伙伴的伙伴記錄1031。商業(yè)伙伴識別單元102可以執(zhí)行在資源池101中的數(shù)據(jù)與數(shù)據(jù)庫103中的伙伴記錄1031之間的比較,以確定資源池101中的信息是否可能代表新的商業(yè)伙伴。
如以下更加具體地講,商業(yè)伙伴識別單元102可以比較資源池101中的信息與存儲在商業(yè)伙伴數(shù)據(jù)庫103中的每個已有的商業(yè)伙伴記錄,并計(jì)算每次比較的差別率。商業(yè)伙伴識別單元102可以比較每次比較的差別率與閾值,由此來確定是否將資源池中的信息自動導(dǎo)入數(shù)據(jù)庫103。
請注意,數(shù)據(jù)庫103存儲代表已有商業(yè)伙伴的信息的伙伴記錄。伙伴記錄可以包括諸如像商業(yè)伙伴代碼的識別號碼、聯(lián)絡(luò)信息等的數(shù)據(jù)。
在一個實(shí)施例中,資源池可以從自動的外部數(shù)據(jù)源接收關(guān)于新識別的商業(yè)伙伴的數(shù)據(jù)。示范的數(shù)據(jù)源可以包括例如因特網(wǎng)、搜索引擎、B2B網(wǎng)站、應(yīng)用程序、文件或另一個數(shù)據(jù)庫。在這個實(shí)施例中,系統(tǒng)100可以是一個全自治系統(tǒng),其能夠填充(populate)商業(yè)伙伴數(shù)據(jù)庫103而人工監(jiān)督(manualoversight)最少或沒有人工監(jiān)督。
圖2例示了根據(jù)本發(fā)明的實(shí)施例的用于識別新的商業(yè)伙伴的方法200的流程圖。在步驟201,商業(yè)伙伴識別單元102可以在資源池中采用關(guān)于新找到的商業(yè)伙伴的信息。從步驟202a、202b到202n,商業(yè)伙伴識別單元102在數(shù)據(jù)庫103中搜索具有類似或相關(guān)于所采樣的伙伴數(shù)據(jù)的信息的已有商業(yè)伙伴記錄。在一個實(shí)施例中,在步驟202a,商業(yè)伙伴識別單元102可以識別在資源池中可用的最特有的(distinctive)識別信息(例如,鄧氏(Data UniversalNumbering System)編號或納稅ID),并在數(shù)據(jù)庫103中搜索對應(yīng)項(xiàng)(correspondence)。如果來自數(shù)據(jù)庫的已有商業(yè)伙伴記錄匹配來自資源池101的特有識別符,則處理前進(jìn)到方框203。否則,在步驟202b,商業(yè)伙伴識別單元102可以用在資源池101中可用的下一個最特有的識別信息(例如,伙伴的名稱)在數(shù)據(jù)庫103中進(jìn)行搜索。同樣,如果出現(xiàn)匹配,處理前進(jìn)到方框203。否則,商業(yè)伙伴識別單元102可以用資源池101中的其它特有的識別信息(例如,電話號碼、傳真號碼、網(wǎng)站地址、聯(lián)絡(luò)人、以注冊的投資、和/或地址)在數(shù)據(jù)庫103中搜索對應(yīng)項(xiàng)。如果沒有找到類似于資源池中的新識別的商業(yè)伙伴數(shù)據(jù)的已有商業(yè)伙伴記錄,則在205,該資源池中的伙伴數(shù)據(jù)可以被分配商業(yè)伙伴代碼并作為新的伙伴記錄而被存儲在數(shù)據(jù)庫中。
在圖2的實(shí)施例中,即使新找到的商業(yè)伙伴與內(nèi)部數(shù)據(jù)庫中的已有商業(yè)伙伴有相同的DUNS編號或相同的名稱,商業(yè)伙伴識別單元不需要將它們自動看作同一個公司。取而代之的是,商業(yè)伙伴識別單元可以通過計(jì)算在資源池101中新找到的商業(yè)伙伴的采樣數(shù)據(jù)與已有商業(yè)伙伴記錄之間的差別率來驗(yàn)證DUNS編號的精確度,來證明(account for)在新找到的商業(yè)伙伴的DUNS編號或名稱中的可能錯誤。在步驟202a到202n的搜索是為了在內(nèi)部數(shù)據(jù)庫103中尋找已有商業(yè)伙伴,以便將其與資源池中新找到的商業(yè)伙伴進(jìn)行比較。
另一方面,如果數(shù)據(jù)庫中的已有商業(yè)伙伴具有一些與新找到的商業(yè)伙伴的信息類似的信息,在步驟203,商業(yè)伙伴識別單元102可以計(jì)算兩者之間的差別率。如表1所示,商業(yè)伙伴識別單元可以將商業(yè)伙伴的信息放到特定的序列中,并匹配新找到的商業(yè)伙伴與已有商業(yè)伙伴的信息。在方框203,商業(yè)伙伴識別單元比較新找到的商業(yè)伙伴與已有商業(yè)伙伴的相同類型的信息,即,公司名稱與公司名稱比較,行業(yè)與行業(yè)比較等。
表1在字段的基礎(chǔ)上,值α表示在新識別的商業(yè)伙伴的采樣數(shù)據(jù)的字段數(shù)據(jù)與已有商業(yè)伙伴記錄的相應(yīng)字段數(shù)據(jù)之間存在匹配的實(shí)例數(shù)量。例如,如果新找到的商業(yè)伙伴的公司名稱匹配已有商業(yè)伙伴的公司名稱,則α可以被分配值0(即,α=0)。否則,α=1。
在一個實(shí)施例中,不同的字段(例如,不同類型的伙伴信息)可以根據(jù)它們的特有性和/或重要性被分配不同的加權(quán)等級。例如,DUNS數(shù)據(jù)通常被認(rèn)為是公司可用的最特有的識別信息,所以它的加權(quán)等級被設(shè)置為DIF=5。公司的行業(yè)通??梢员徽J(rèn)為比DUNS編號的特有性低,因此可以被分配加權(quán)等級DIF=4。類似的,公司名稱可以被分配加權(quán)等級DIF=3,地址數(shù)據(jù)被分配加權(quán)等級DIF=2,而電話和傳真號碼碼被分配加權(quán)等級DIF=1。
這里給出的加權(quán)等級只是為了示例。應(yīng)當(dāng)理解可以使用不同的識別信息,例如,公司網(wǎng)站、聯(lián)系人、注冊的投資。此外,可以不同地分配加權(quán)等級DIF。
然后商業(yè)伙伴識別單元102可以計(jì)算兩組商業(yè)伙伴數(shù)據(jù)之間的差別率。
在一個實(shí)施例中,根據(jù)以下公式計(jì)算差別率SigmaSigma=(Σ(DIF*α)2)...(1)]]>其中DIF代表加權(quán)等級,而α代表資源池中的新識別的商業(yè)伙伴的特定類型信息和數(shù)據(jù)庫中的已有商業(yè)伙伴的特定類型信息是否相同。
在一個實(shí)施例中,數(shù)據(jù)庫中的已有商業(yè)伙伴具有類似于新找到的商業(yè)伙伴的名稱,如表2所示。
表2在這個例子中,可用于新找到的商業(yè)伙伴的唯一信息是它的名稱,其類似于數(shù)據(jù)庫中的已有商業(yè)伙伴。由于兩個名字不是完全相同,所以α=1,并且公司名稱的加權(quán)等級為3。因此,兩個商業(yè)伙伴之間的差別率為Sigma=(Σ(DIF*α)2)=(Σ(3*1)2)=3]]>在這個實(shí)施例中,如果缺少特定類型的信息,則商業(yè)伙伴識別單元不需要考慮它。
在圖3所示的例子中,新找到的商業(yè)伙伴具有與數(shù)據(jù)庫中的已有商業(yè)伙伴相同的名稱,但是兩個商業(yè)伙伴具有不同的DUNS編號。
表3兩個商業(yè)伙伴具有相同的公司名稱,因此對于公司名稱來說,α=0。公司名稱的加權(quán)等級DIF=3。
兩個商業(yè)伙伴具有不同的DUNS編號,因此對于DUNS編號來說,α=1。DUNS編號的加權(quán)等級為5。因此,兩個商業(yè)伙伴之間的差別率為Sigma=(Σ(DIF*α)2)=(Σ(3*0)2,(5*1)2)=5]]>在表4所示的例子中,新找到的商業(yè)伙伴和數(shù)據(jù)庫中的已有商業(yè)伙伴具有相同的行業(yè)、電話號碼和傳真號碼,但是具有不同的名稱和地址。
表4根據(jù)對表2和表3的相同的分析,兩個公司的差比率為Sigma=(Σ(DIF*α)2)=(Σ(3*1)2,(4*0)2,(2*1)2,(1*0)2,(1*1)2)=3.74]]>應(yīng)當(dāng)理解,計(jì)算差別率的公式只是為了舉例??梢允褂闷渌愋偷墓健?br>
在步驟204,差別率可以與經(jīng)驗(yàn)數(shù)值(empirical number)比較。在一個實(shí)施例中,經(jīng)驗(yàn)數(shù)值為5。如果差別率不小于5,則兩個商業(yè)伙伴被認(rèn)為絕對不同,則在步驟205,新找到的商業(yè)伙伴被分配商業(yè)伙伴代碼,并且其信息被自動導(dǎo)入數(shù)據(jù)庫。如果差別率小于5,在步驟206,商業(yè)伙伴識別單元可以將兩個商業(yè)伙伴的信息示出給商業(yè)伙伴數(shù)據(jù)庫的用戶,以便他可以自己看這些信息,并決定是否將資源池中的新識別的商業(yè)伙伴的信息導(dǎo)入數(shù)據(jù)庫。
為了進(jìn)一步支持用戶的做決定,在一個實(shí)施例中,如果5>Sigma>3,商業(yè)伙伴識別單元可以將兩個商業(yè)伙伴的信息示出給用戶,并提示用戶考慮資源池102中的數(shù)據(jù)是否應(yīng)當(dāng)被作為新商業(yè)伙伴而被保存到數(shù)據(jù)庫103中。如果差別率不大于3,則商業(yè)伙伴識別單元判定兩個商業(yè)伙伴可能是相同的,所以不需要將它們的信息示出給用戶。
雖然以上參考一些實(shí)施例詳細(xì)描述了本發(fā)明,但是在本發(fā)明的范圍和精神內(nèi)的各種變化對本領(lǐng)域技術(shù)人員來講都是清楚的。例如,雖然以公司來描述實(shí)施例,但是所說的商業(yè)伙伴也可以是個人。如果商業(yè)伙伴是個人,則識別信息可以是它們的姓名、ID號碼、職業(yè)等。
權(quán)利要求
1.一種用于識別商業(yè)伙伴的方法,包括接收第一實(shí)體的至少一個屬性;比較所述第一實(shí)體的所述至少一個屬性與先前存儲在已有數(shù)據(jù)庫中的第二實(shí)體的對應(yīng)屬性;計(jì)算所述第一實(shí)體和所述第二實(shí)體之間的差別率,并且如果所述差別率超過第一預(yù)定閾值,則將所述第一實(shí)體作為新商業(yè)伙伴進(jìn)行存儲。
2.如權(quán)利要求1所述的方法,還包括給所述至少一個屬性分配加權(quán)等級。
3.如權(quán)利要求2所述的方法,其中用所述至少一個屬性的加權(quán)等級來計(jì)算所述差別率。
4.如權(quán)利要求2所述的方法,其中所述至少一個屬性是公司的鄧氏(DataUniversal Numbering System,DUNS)編號。
5.如權(quán)利要求2所述的方法,其中所述至少一個屬性是個人的識別號碼。
6.如權(quán)利要求2所述的方法,其中所述第一預(yù)定閾值是經(jīng)驗(yàn)值。
7.如權(quán)利要求2所述的方法,還包括在差別率在所述第一預(yù)定閾值和第二預(yù)定閾值之間時,將所述第一和第二實(shí)體的屬性呈現(xiàn)給已有數(shù)據(jù)庫的用戶,以使用戶能夠決定所述第一實(shí)體是否是新的商業(yè)伙伴。
8.一種用于識別商業(yè)伙伴的系統(tǒng),包括存儲器單元,用于臨時存儲第一實(shí)體的至少一個屬性;已有數(shù)據(jù)庫,用于存儲第二實(shí)體的至少一個屬性;和商業(yè)伙伴識別單元,用于比較所述第一實(shí)體的至少一個屬性與所述第二實(shí)體的對應(yīng)屬性,并計(jì)算在所述第一實(shí)體和所述第二實(shí)體之間的差別率。
9.如權(quán)利要求8所述的系統(tǒng),其中所述商業(yè)伙伴識別單元還分配加權(quán)等級給所述至少一個屬性。
10.如權(quán)利要求9所述的系統(tǒng),其中所述商業(yè)伙伴識別單元用所述至少一個屬性的加權(quán)等級來計(jì)算所述差比率。
11.如權(quán)利要求9所述的系統(tǒng),其中所述商業(yè)伙伴識別單元還比較所述差別率和經(jīng)驗(yàn)值。
12.如權(quán)利要求11所述的系統(tǒng),其中所述商業(yè)伙伴識別單元還在所述差別率和所述經(jīng)驗(yàn)值滿足第一要求時,確定所述第一實(shí)體是新的商業(yè)伙伴。
13.如權(quán)利要求12所述的系統(tǒng),其中如果所述第一實(shí)體是新的商業(yè)伙伴,則所述商業(yè)伙伴識別單元還將其保存到已有數(shù)據(jù)庫中。
14.如權(quán)利要求11所述的系統(tǒng),其中所述商業(yè)伙伴識別單元還在所述差別率和所述經(jīng)驗(yàn)值滿足第二要求時,確定所述第一實(shí)體不是新的商業(yè)伙伴。
15.如權(quán)利要求11所述的系統(tǒng),其中所述商業(yè)伙伴識別單元還將所述第一和第二實(shí)體的屬性呈現(xiàn)給用戶,以使用戶能夠決定所述第一實(shí)體是否是新的商業(yè)伙伴。
16.一種確定是否允許新數(shù)據(jù)記錄進(jìn)入數(shù)據(jù)庫的方法,包括接收代表潛在的新的商業(yè)伙伴的數(shù)據(jù),比較所接收的數(shù)據(jù)與先前存儲的商業(yè)伙伴的數(shù)據(jù)記錄,其中所述潛在的新的商業(yè)伙伴的數(shù)據(jù)和所述數(shù)據(jù)記錄,每一個包括各自的屬性集,并且其中當(dāng)各個屬性中的數(shù)據(jù)非空時,所述比較對來自所述接收的數(shù)據(jù)和所述數(shù)據(jù)記錄的相似類型的屬性進(jìn)行比較;基于所述比較,確定在所接收的數(shù)據(jù)和至少一個所述記錄之間是否存在相似性;并且如果所接收的數(shù)據(jù)與所有先前存儲的數(shù)據(jù)記錄不同,則將所接收的數(shù)據(jù)存儲到數(shù)據(jù)庫中。
17.如權(quán)利要求16所述的方法,還包括在將所接收的數(shù)據(jù)存儲到所述數(shù)據(jù)庫中時,給所接收的數(shù)據(jù)分配新的商業(yè)伙伴代碼。
18.如權(quán)利要求16所述的方法,還包括給屬性分配加權(quán)等級。
19.如權(quán)利要求18所述的方法,其中通過以下面的等式計(jì)算差別率來確定所述相似性(Σ(DIF*α)2),]]>其中DIF為屬性的加權(quán)等級,并且當(dāng)潛在的新的商業(yè)伙伴的屬性不同于先前存儲的數(shù)據(jù)記錄的相似類型的屬性時,α=1。
20.如權(quán)利要求19所述的方法,其中如果所述差別率超過了預(yù)定閾值,則所接收的數(shù)據(jù)不同于先前存儲的數(shù)據(jù)記錄。
全文摘要
一種用于在將由外部資源新找到的商業(yè)伙伴的信息輸入內(nèi)部數(shù)據(jù)庫之前,確定新找到的商業(yè)伙伴是否與保存在內(nèi)部數(shù)據(jù)庫中的已有商業(yè)伙伴相同的方法。關(guān)于來自外部資源的新找到的商業(yè)伙伴的信息被臨時存儲在資源池中。商業(yè)伙伴識別單元比較新找到的商業(yè)伙伴的信息與存儲在內(nèi)部數(shù)據(jù)庫中的已有商業(yè)伙伴的信息,并計(jì)算差別率。然后商業(yè)伙伴識別單元比較差別率與經(jīng)驗(yàn)值。根據(jù)在差別率與經(jīng)驗(yàn)值之間的關(guān)系,商業(yè)伙伴識別單元決定是否將關(guān)于新找到的商業(yè)伙伴的信息導(dǎo)入數(shù)據(jù)庫中。
文檔編號G06F17/30GK101046874SQ20071009212
公開日2007年10月3日 申請日期2007年4月2日 優(yōu)先權(quán)日2006年3月31日
發(fā)明者陳方寧, 徐天 申請人:Sap股份公司