專利名稱:基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法
技術(shù)領(lǐng)域:
本發(fā)明涉及企業(yè)信用評(píng)估方法,尤其涉及一種基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法。
背景技術(shù):
隨著經(jīng)濟(jì)全球化,企業(yè)在經(jīng)營中所涉及的因素越來越多,準(zhǔn)確對(duì)企業(yè)信用進(jìn)行評(píng)估需要充分利用包括各級(jí)地方政府的財(cái)政、稅務(wù)、工商部門以及各個(gè)銀行、企業(yè)內(nèi)部各自已積累的大量數(shù)據(jù)。利用分布式隱私保護(hù)數(shù)據(jù)挖掘的方法可以從存放在政府不同部門或企業(yè)內(nèi)部的數(shù)據(jù)中發(fā)現(xiàn)更多潛在有用的知識(shí),不但可以大大降低因知識(shí)不確定而帶來的決策風(fēng)險(xiǎn),而且可以為企業(yè)信用評(píng)估提供更加科學(xué)合理的依據(jù)。
傳統(tǒng)的企業(yè)信用評(píng)估方法主要是利用一些評(píng)估模型或者專家知識(shí),然后針對(duì)具體的企業(yè)案例進(jìn)行評(píng)估。該方法雖然操作簡(jiǎn)單,成本低廉,但是評(píng)價(jià)中所依據(jù)知識(shí)的數(shù)據(jù)來源單一,這個(gè)問題嚴(yán)重影響了評(píng)估結(jié)果的質(zhì)量。目前雖然有個(gè)別企業(yè)利用自己的數(shù)據(jù)以挖掘知識(shí)輔助企業(yè)信用評(píng)估,但這種挖掘所依據(jù)知識(shí)的數(shù)據(jù)來源單一,這嚴(yán)重影響了評(píng)估結(jié)果的質(zhì)量,另一方面,如果簡(jiǎn)單地對(duì)參與評(píng)估的各部門利用分布式數(shù)據(jù)挖掘進(jìn)行知識(shí)發(fā)現(xiàn),會(huì)對(duì)各部分的數(shù)據(jù)安全造成泄漏,造成各部門因?yàn)閷?duì)各自數(shù)據(jù)的隱私考慮,不愿意或不允許提供自己的私有數(shù)據(jù),這嚴(yán)重阻礙了全面、真實(shí)知識(shí)的獲取和挖掘,從而影響了評(píng)估質(zhì)量。因此,傳統(tǒng)的企業(yè)信用評(píng)估方法無法滿足實(shí)際的需要。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法。
它的步驟如下1)利用智能Agent技術(shù)以及P2P和Grid技術(shù)構(gòu)建適合多個(gè)部門需要的大規(guī)模分布式數(shù)據(jù)挖掘架構(gòu);2)通過安全多方計(jì)算和密碼學(xué)技術(shù)使得各部門能夠通過分布式網(wǎng)絡(luò)來協(xié)同挖掘隱私保護(hù)數(shù)據(jù);3)通過隱私保護(hù)數(shù)據(jù)挖掘所產(chǎn)生的挖掘知識(shí)輔助企業(yè)信用評(píng)估。
本發(fā)明利用了分布式數(shù)據(jù)挖掘的技術(shù),同時(shí)強(qiáng)調(diào)用戶的隱私保護(hù),從實(shí)際的需求出發(fā)充分考慮到了傳統(tǒng)方法存在的不足,明確給出了利用數(shù)據(jù)挖掘方法,特別是保護(hù)用戶隱私的數(shù)據(jù)挖掘方法以輔助實(shí)現(xiàn)企業(yè)信用評(píng)估,充分利用各個(gè)組織的數(shù)據(jù),不需要數(shù)據(jù)進(jìn)行集中處理,促進(jìn)了數(shù)據(jù)的共享,解決了評(píng)價(jià)過程中所依據(jù)知識(shí)的數(shù)據(jù)來源單一以及在數(shù)據(jù)挖掘過程中缺少數(shù)據(jù)隱私保護(hù)機(jī)制的問題。因此,本發(fā)明的方法不僅可操作性強(qiáng),而且在實(shí)現(xiàn)上具有較高的準(zhǔn)確性和安全性。
圖1是本發(fā)明大規(guī)模分布式數(shù)據(jù)挖掘架構(gòu)圖;圖2是本發(fā)明部門內(nèi)部層次網(wǎng)絡(luò)圖;圖3是本發(fā)明P2P網(wǎng)絡(luò)中數(shù)據(jù)處理關(guān)系圖;圖4是本發(fā)明數(shù)據(jù)挖掘輔助信用評(píng)估圖。
具體實(shí)施例方式
本發(fā)明所述的利用智能Agent技術(shù)(Jennings N R,Sycara K,and Wooldridge M.Aroadmap of agent research and development.Autonomous Agents and Multi-Agent Systems.1275-306,1998.)以及P2P(Singh M P.Peer-to-Peer Computing for information systems.In Proc.Of AP2PC 2002.July 2002.pp.15-20)和Grid技術(shù)(Foster I,Kesselman C,Tuecke S.TheAnatomy of the GridEnabling Scalable Virtual Organizations.International J.SupercomputerApplications,15(3),2001)構(gòu)建適合多個(gè)部門需要的大規(guī)模分布式數(shù)據(jù)挖掘架構(gòu)這種分布式架構(gòu)是一種虛擬和動(dòng)態(tài)的層次架構(gòu),稅務(wù)、銀行、電力不同部門之間通過Grid技術(shù)來進(jìn)行網(wǎng)絡(luò)構(gòu)建,這些參與到Grid中的結(jié)點(diǎn)具有強(qiáng)大的處理能力和高速的網(wǎng)絡(luò)帶寬;每個(gè)部門內(nèi)部利用P2P技術(shù)構(gòu)建虛擬的層次網(wǎng)絡(luò),借助Agent技術(shù),部門內(nèi)部的每個(gè)結(jié)點(diǎn)能夠動(dòng)態(tài)加入或離開系統(tǒng)當(dāng)一個(gè)結(jié)點(diǎn)加入系統(tǒng)時(shí),它連接到一個(gè)已經(jīng)存在的結(jié)點(diǎn),同時(shí)可以被其他系統(tǒng)中已經(jīng)存在的結(jié)點(diǎn)連接;當(dāng)一個(gè)結(jié)點(diǎn)離開系統(tǒng)時(shí),它通知它所連接的結(jié)點(diǎn)和連接到它的結(jié)點(diǎn)以使得網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)能夠動(dòng)態(tài)調(diào)整。對(duì)于網(wǎng)絡(luò)中的每個(gè)結(jié)點(diǎn),其具有Agent的特點(diǎn),當(dāng)它接收網(wǎng)絡(luò)中的信息后,利用其自身所具有的私有數(shù)據(jù)和所處的狀態(tài)來轉(zhuǎn)換和處理這些信息,并把經(jīng)過處理和轉(zhuǎn)換的信息放入共享數(shù)據(jù)庫中,然后通過發(fā)送/接收分配器將數(shù)據(jù)和信息發(fā)送到網(wǎng)絡(luò)中的其它結(jié)點(diǎn)。
所述的通過安全多方計(jì)算(Du W.and Atallah,M.J.Secure multi-party computationproblems and their applicationsa review and open problems.InProceedings of the 2001 workshopon New security paradigms,pp.13-22,2001.)和密碼學(xué)技術(shù)(Goldreich O,Micali S,WigdersonA.How to paly any mental game-a completeness theorem for protocols with honest majority.In19th ACM Symposium on the Theory of Computing,pp.218-229,1987)使得各部門之間能夠通過分布式網(wǎng)絡(luò)來協(xié)同挖掘隱私保護(hù)數(shù)據(jù)首先針對(duì)關(guān)聯(lián)規(guī)則挖掘、聚類挖掘、決策樹挖掘不同的數(shù)據(jù)挖掘算法抽取其中通用的操作;其次設(shè)計(jì)這些通用操作的高效方法,重點(diǎn)是設(shè)計(jì)分布式環(huán)境下安全求和、并、交、數(shù)量積操作;最后利用這些操作設(shè)計(jì)高效的隱私保護(hù)數(shù)據(jù)挖掘算法以進(jìn)行數(shù)據(jù)挖掘獲取知識(shí)補(bǔ)充知識(shí)庫。
所述的通過隱私保護(hù)數(shù)據(jù)挖掘所產(chǎn)生的挖掘知識(shí)輔助企業(yè)信用評(píng)估基于信用評(píng)估模型,同時(shí)利用隱私保護(hù)數(shù)據(jù)挖掘算法所獲得的“IF-THEN”規(guī)則知識(shí)在企業(yè)信用評(píng)估的過程當(dāng)中輔助金融領(lǐng)域?qū)<疫M(jìn)行更加準(zhǔn)確和客觀的企業(yè)信用評(píng)估。
基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法的步驟如下1)利用智能Agent技術(shù)以及P2P和Grid技術(shù)構(gòu)建適合多個(gè)部門需要的大規(guī)模分布式數(shù)據(jù)挖掘架構(gòu)(如圖1所示)。不同部門之間(例如稅務(wù)、銀行、電力等)通過Grid技術(shù)來進(jìn)行網(wǎng)絡(luò)構(gòu)建,這些參與到Grid中的結(jié)點(diǎn)(超級(jí)結(jié)點(diǎn))具有強(qiáng)大的處理能力和高速的網(wǎng)絡(luò)帶寬。如圖2所示,每個(gè)部門(例如稅務(wù)、銀行等)內(nèi)部利用P2P技術(shù)構(gòu)建虛擬的層次網(wǎng)絡(luò),借助Agent技術(shù),部門內(nèi)部的每個(gè)結(jié)點(diǎn)(一般結(jié)點(diǎn))能夠動(dòng)態(tài)加入或離開系統(tǒng)當(dāng)一個(gè)結(jié)點(diǎn)加入系統(tǒng)時(shí),它連接到一個(gè)已經(jīng)存在的結(jié)點(diǎn),同時(shí)可以被存在的其他結(jié)點(diǎn)連接;當(dāng)一個(gè)結(jié)點(diǎn)離開系統(tǒng)時(shí),它通知它所連接的結(jié)點(diǎn)和連接到它的結(jié)點(diǎn)以使得網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)能夠動(dòng)態(tài)調(diào)整。對(duì)于網(wǎng)絡(luò)中的每個(gè)結(jié)點(diǎn),其具有Agent的特點(diǎn),當(dāng)它接收網(wǎng)絡(luò)中的信息后,利用其本身所具有的私有數(shù)據(jù)和所處的狀態(tài)來轉(zhuǎn)換和處理這些信息,并把經(jīng)過處理和轉(zhuǎn)換的信息放入共享數(shù)據(jù)庫中,然后通過發(fā)送/接收分配器將數(shù)據(jù)和信息發(fā)送到網(wǎng)絡(luò)中的其它結(jié)點(diǎn)(如圖3所示)。
2)通過安全多方計(jì)算和密碼學(xué)技術(shù)使得各部門之間能夠通過分布式網(wǎng)絡(luò)來協(xié)同挖掘隱私保護(hù)數(shù)據(jù);首先針對(duì)不同的數(shù)據(jù)挖掘算法(關(guān)聯(lián)規(guī)則挖掘、聚類挖掘、決策樹挖掘)抽取其中通用的操作;其次設(shè)計(jì)這些通用操作的高效方法(重點(diǎn)是設(shè)計(jì)分布式環(huán)境下安全求和、并、交、數(shù)量積操作);最后利用這些操作設(shè)計(jì)高效的隱私保護(hù)數(shù)據(jù)挖掘算法以進(jìn)行數(shù)據(jù)挖掘獲取知識(shí)補(bǔ)充知識(shí)庫。
3)通過隱私保護(hù)數(shù)據(jù)挖掘所產(chǎn)生的挖掘知識(shí)輔助企業(yè)信用評(píng)估。在信用評(píng)估實(shí)際當(dāng)中,基于信用評(píng)估模型,同時(shí)利用隱私保護(hù)數(shù)據(jù)挖掘算法所獲得的知識(shí)(例如,“IF-THEN”規(guī)則等)在企業(yè)信用評(píng)估的過程當(dāng)中輔助金融領(lǐng)域?qū)<疫M(jìn)行更加準(zhǔn)確和客觀的企業(yè)信用評(píng)估。
實(shí)施例為了能夠?qū)ζ髽I(yè)甲進(jìn)行信用評(píng)估,我們需要利用部門A、B和C的數(shù)據(jù),處于隱私的考慮,這些部門不愿意將本部門所擁有的數(shù)據(jù)和信息提供給對(duì)方也不愿意將自己部門的信息提供給一個(gè)中心結(jié)點(diǎn),為此,需要利用隱私保護(hù)數(shù)據(jù)挖掘來進(jìn)行挖掘。
假設(shè)部門A、B和C內(nèi)部擁有眾多的結(jié)點(diǎn),因此這些內(nèi)部的結(jié)點(diǎn)各自也具有不同的隱私級(jí)別和各自的私有數(shù)據(jù),為了能夠綜合集成這些內(nèi)部結(jié)點(diǎn)所形成的數(shù)據(jù),我們需要利用本專利中所提及的大規(guī)模分布式數(shù)據(jù)挖掘架構(gòu),利用Agent技術(shù)以及P2P技術(shù)構(gòu)建部門內(nèi)部層次網(wǎng)絡(luò)圖,不同的內(nèi)部結(jié)點(diǎn)可以在保護(hù)自己私有數(shù)據(jù)的前提下,分層將自己所儲(chǔ)存的數(shù)據(jù)向上層遞交,最后匯總于每個(gè)部門的超級(jí)結(jié)點(diǎn),然后在這些超級(jí)結(jié)點(diǎn)之間利用隱私保護(hù)數(shù)據(jù)挖掘技術(shù)來挖掘關(guān)聯(lián)信息(IF-THEN規(guī)則)、將數(shù)據(jù)進(jìn)行聚類和分類,形成歸納知識(shí)以輔助金融領(lǐng)域?qū)<覍?duì)企業(yè)進(jìn)行信用評(píng)估。
權(quán)利要求
1.一種基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法,它的步驟如下1)利用智能Agent技術(shù)以及P2P和Grid技術(shù)構(gòu)建適合多個(gè)部門需要的大規(guī)模分布式數(shù)據(jù)挖掘架構(gòu);2)通過安全多方計(jì)算和密碼學(xué)技術(shù)使得各部門能夠通過分布式網(wǎng)絡(luò)來協(xié)同挖掘隱私保護(hù)數(shù)據(jù);3)通過隱私保護(hù)數(shù)據(jù)挖掘所產(chǎn)生的挖掘知識(shí)輔助企業(yè)信用評(píng)估。
2.根據(jù)權(quán)利要求1所述的一種基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法,其特征在于所述的利用智能Agent技術(shù)以及P2P和Grid技術(shù)構(gòu)建適合多個(gè)部門需要的大規(guī)模分布式數(shù)據(jù)挖掘架構(gòu)這種分布式架構(gòu)是一種虛擬和動(dòng)態(tài)的層次架構(gòu),不同部門之間通過Grid技術(shù)來進(jìn)行網(wǎng)絡(luò)構(gòu)建,這些參與到Grid中的結(jié)點(diǎn)具有強(qiáng)大的處理能力和高速的網(wǎng)絡(luò)帶寬;每個(gè)部門內(nèi)部利用P2P技術(shù)構(gòu)建虛擬的層次網(wǎng)絡(luò),借助Agent技術(shù),部門內(nèi)部的每個(gè)結(jié)點(diǎn)能夠動(dòng)態(tài)加入或離開系統(tǒng)當(dāng)一個(gè)結(jié)點(diǎn)加入系統(tǒng)時(shí),它連接到一個(gè)已經(jīng)存在的結(jié)點(diǎn),同時(shí)被其他系統(tǒng)中已經(jīng)存在的結(jié)點(diǎn)連接;當(dāng)一個(gè)結(jié)點(diǎn)離開系統(tǒng)時(shí),它通知它所連接的結(jié)點(diǎn)和連接到它的結(jié)點(diǎn)以使得網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)能夠動(dòng)態(tài)調(diào)整,對(duì)于網(wǎng)絡(luò)中的每個(gè)結(jié)點(diǎn),其具有Agent的特點(diǎn),當(dāng)它接收網(wǎng)絡(luò)中的信息后,利用其自身所具有的私有數(shù)據(jù)和所處的狀態(tài)來轉(zhuǎn)換和處理這些信息,并把經(jīng)過處理和轉(zhuǎn)換的信息放入共享數(shù)據(jù)庫中,然后通過發(fā)送/接收分配器將數(shù)據(jù)和信息發(fā)送到網(wǎng)絡(luò)中的其它結(jié)點(diǎn)。
3.根據(jù)權(quán)利要求2所述的一種基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法,其特征在于所述的不同部門為稅務(wù)、銀行、電力部門。
4.根據(jù)權(quán)利要求1所述的一種基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法,其特征在于所述的通過安全多方計(jì)算和密碼學(xué)技術(shù)使得各部門之間能夠通過分布式網(wǎng)絡(luò)來協(xié)同挖掘隱私保護(hù)數(shù)據(jù)首先針對(duì)不同的數(shù)據(jù)挖掘算法抽取其中通用的操作;其次設(shè)計(jì)這些通用操作的高效方法,重點(diǎn)是設(shè)計(jì)分布式環(huán)境下安全求和、并、交、數(shù)量積操作;最后利用這些操作設(shè)計(jì)高效的隱私保護(hù)數(shù)據(jù)挖掘算法以進(jìn)行數(shù)據(jù)挖掘獲取知識(shí)補(bǔ)充知識(shí)庫。
5.根據(jù)權(quán)利要求4所述的一種基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法,其特征在于所述的不同的數(shù)據(jù)挖掘算法為關(guān)聯(lián)規(guī)則挖掘、聚類挖掘、決策樹挖掘算法。
6.根據(jù)權(quán)利要求1所述的一種基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法,其特征在于所述的通過隱私保護(hù)數(shù)據(jù)挖掘所產(chǎn)生的挖掘知識(shí)輔助企業(yè)信用評(píng)估基于信用評(píng)估模型,同時(shí)利用隱私保護(hù)數(shù)據(jù)挖掘算法所獲得的知識(shí)在企業(yè)信用評(píng)估的過程當(dāng)中輔助金融領(lǐng)域?qū)<疫M(jìn)行更加準(zhǔn)確和客觀的企業(yè)信用評(píng)估。
7.根據(jù)權(quán)利要求6所述的一種基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法,其特征在于所述的獲得的知識(shí)為“IF-THEN”規(guī)則。
全文摘要
本發(fā)明公開了一種基于分布式隱私保護(hù)數(shù)據(jù)挖掘的企業(yè)信用評(píng)估方法,它的步驟如下1)利用智能Agent以及P2P和Grid技術(shù)構(gòu)建適合多個(gè)部門需要的大規(guī)模分布式數(shù)據(jù)挖掘架構(gòu);2)通過安全多方計(jì)算和密碼學(xué)技術(shù)使得各部門能夠通過分布式網(wǎng)絡(luò)來協(xié)同挖掘隱私保護(hù)數(shù)據(jù);3)通過隱私保護(hù)數(shù)據(jù)挖掘所產(chǎn)生的挖掘知識(shí)輔助企業(yè)信用評(píng)估。本發(fā)明利用了分布式數(shù)據(jù)挖掘技術(shù),強(qiáng)調(diào)用戶隱私保護(hù),明確給出了利用保護(hù)用戶隱私的數(shù)據(jù)挖掘方法以輔助實(shí)現(xiàn)企業(yè)信用評(píng)估,促進(jìn)了數(shù)據(jù)的共享,解決了評(píng)價(jià)過程中所依據(jù)知識(shí)的數(shù)據(jù)來源單一以及在數(shù)據(jù)挖掘過程中缺少數(shù)據(jù)隱私保護(hù)機(jī)制的問題。因此,本發(fā)明的方法不僅可操作性強(qiáng),而且在實(shí)現(xiàn)上具有較高的準(zhǔn)確性和安全性。
文檔編號(hào)G06F17/30GK1804886SQ20061004924
公開日2006年7月19日 申請(qǐng)日期2006年1月24日 優(yōu)先權(quán)日2006年1月24日
發(fā)明者蔣云良, 徐從富, 王金龍, 姜飛, 毛福鋼 申請(qǐng)人:浙江大學(xué), 湖州師范學(xué)院, 成路集團(tuán)有限公司