亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

數(shù)據(jù)流通系統(tǒng)及方法與流程

文檔序號:12596470閱讀:1521來源:國知局
數(shù)據(jù)流通系統(tǒng)及方法與流程

本發(fā)明涉及數(shù)據(jù)流通領域,尤其涉及一種數(shù)據(jù)流通系統(tǒng)及方法。



背景技術:

在數(shù)據(jù)流通領域,數(shù)據(jù)流通是指數(shù)據(jù)供應方向數(shù)據(jù)需求方提供數(shù)據(jù)的行為,其中,所述數(shù)據(jù)是數(shù)據(jù)供應方經(jīng)過沉淀、購買、抓取或其他合法手段獲得的。

首先,在數(shù)據(jù)流通領域,普遍存在海量非結構化的數(shù)據(jù)結構難以統(tǒng)一和沒有規(guī)范標的物的問題,不同的數(shù)據(jù)提供方的數(shù)據(jù)結構不同。在數(shù)據(jù)流通和數(shù)據(jù)管理過程中,由于流通數(shù)據(jù)的數(shù)據(jù)結構不統(tǒng)一,需要對流通數(shù)據(jù)進行規(guī)約、整合、分類。

其次,數(shù)據(jù)的收集、處理、交易及應用都面臨著違法的風險。如何在隱私保護基礎上促進數(shù)據(jù)資源的流動,是目前面臨的現(xiàn)實問題,亟需開展理論研究。在數(shù)據(jù)流通監(jiān)管的層面,亟需通過技術手段減小數(shù)據(jù)流通監(jiān)測的計算量和成本。



技術實現(xiàn)要素:

本發(fā)明解決的技術問題是如何減小數(shù)據(jù)流通監(jiān)測的計算量和成本。

為解決上述技術問題,本發(fā)明實施例提供一種數(shù)據(jù)流通系統(tǒng),所述數(shù)據(jù)流通系統(tǒng)包括:

數(shù)據(jù)標簽定義模塊,適于接收運營方對流通數(shù)據(jù)的維度主鍵和標簽值的定義,所述流通數(shù)據(jù)具有多個第一維度,所述多個第一維度包括所述維度主鍵和所述標簽值;流通數(shù)據(jù)掛牌模塊,適于接收供應方選擇的所述標簽值以及基于所述多個第一維度填寫的所述流通數(shù)據(jù);流通數(shù)據(jù)查詢模塊,適于接收需求方的查詢條件,并基于所述查詢條件對所述流通數(shù)據(jù)進行查詢和篩選,確定所需流通數(shù)據(jù);電子合同生成模塊,適于在確定所述所需流通數(shù)據(jù)后,生成電子合同,所述電子合同包括所述所需流通數(shù)據(jù)且具備多個第二維度,所述多個第二維度包括所述所需流通數(shù)據(jù)的多個第一維度。

可選的,所述數(shù)據(jù)流通系統(tǒng)還包括:合同分類統(tǒng)計模塊,適于基于所述多個第二維度對所述電子合同進行統(tǒng)計,以實現(xiàn)對所述流通數(shù)據(jù)的監(jiān)測。

可選的,所述多個第一維度還包括主體標識、流通限制條件、時間約束條件和價格約束條件。

可選的,所述多個第二維度還選自:所述電子合同的生成時間、訂單數(shù)量、所述所需流通數(shù)據(jù)的供應方信息以及所述所需流通數(shù)據(jù)的需求方信息。

可選的,所述流通數(shù)據(jù)查詢模塊在所述查詢條件與所述流通數(shù)據(jù)的主體標識、維度主鍵、標簽值、流通限制條件、時間約束條件和價格約束條件相匹配時,將所述流通數(shù)據(jù)作為所述所需流通數(shù)據(jù)。

可選的,所述流通限制條件可以包括以下一種或多種:對象描述、關鍵詞、語種、來源行業(yè)、加工方式、敏感度、可識別性、授權方式、應用場景、遍歷方式約束、覆蓋度、成員約束、行業(yè)約束、企業(yè)性質約束、數(shù)據(jù)來源、質量評分、安全評分、風險評分。

可選的,所述合同分類統(tǒng)計模塊包括:合同獲取子模塊,適于基于預設條件選取待統(tǒng)計數(shù)據(jù),所述待統(tǒng)計數(shù)據(jù)包括多個電子合同,每一電子合同對應一個數(shù)據(jù)集;聚類子模塊,適于基于所述多個第二維度對多個數(shù)據(jù)集進行聚類,得到聚類結果,所述聚類結果包括多個數(shù)據(jù)集合,每一數(shù)據(jù)集合包括至少一個數(shù)據(jù)集;篩選子模塊,適于在所述多個數(shù)據(jù)集合中篩選出異常集合。

可選的,所述篩選子模塊計算所述聚類結果中所有數(shù)據(jù)集合中數(shù)據(jù)集數(shù)量的平均值以及標準差,并在當前數(shù)據(jù)集合的數(shù)據(jù)集數(shù)量與所述平均值的差值與所述標準差比值小于設定閾值時,判定所述當前數(shù)據(jù)集合為所述異常集合。

可選的,所述聚類子模塊包括:選取子模塊,適于從所述待統(tǒng)計數(shù)據(jù)中選取設定數(shù)量的所述數(shù)據(jù)集作為初始聚類中心;第一計算子模塊,適于計算其他數(shù)據(jù)集與所述初始聚類中心的距離;劃分子模塊,適于將所述其他數(shù)據(jù)集劃分至距離最近的所述初始聚類中心所在的集合;迭代子模塊,適于迭代更新每一集合的聚類中心,并計算所述其他數(shù)據(jù)集與所述聚類中心的距離并劃分至距離最近的所述聚類中心所在的集合,直至所有集合收斂,得到聚類結果。

可選的,所述聚類子模塊采用K-prototypes算法進行聚類。

為解決上述技術問題,本發(fā)明實施例還公開了一種數(shù)據(jù)流通方法,數(shù)據(jù)流通方法包括:接收運營方對流通數(shù)據(jù)的維度主鍵和標簽值的定義,所述流通數(shù)據(jù)具有多個第一維度,所述多個第一維度包括所述維度主鍵和標簽值;接收供應方選擇的所述標簽值以及基于所述多個第一維度填寫的所述流通數(shù)據(jù);接收需求方的查詢條件,并基于所述查詢條件對所述流通數(shù)據(jù)進行查詢和篩選,確定所需流通數(shù)據(jù);在確定所述所需流通數(shù)據(jù)后,生成電子合同,所述電子合同包括所述所需流通數(shù)據(jù)且具備多個第二維度,所述多個第二維度包括所述所需流通數(shù)據(jù)的多個第一維度。

可選的,所述數(shù)據(jù)流通方法還包括:基于所述多個第二維度對所述電子合同進行統(tǒng)計,以實現(xiàn)對所述流通數(shù)據(jù)的監(jiān)測。

可選的,所述多個第一維度還包括主體標識、流通限制條件、時間約束條件和價格約束條件。

可選的,所述多個第二維度還選自:所述電子合同的生成時間、訂單數(shù)量、所述所需流通數(shù)據(jù)的供應方信息以及所述所需流通數(shù)據(jù)的需求方信息。

可選的,在所述查詢條件與所述流通數(shù)據(jù)的主體標識、維度主鍵、標簽值、流通限制條件、時間約束條件和價格約束條件相匹配時,將所述流通數(shù)據(jù)作為所述所需流通數(shù)據(jù)。

可選的,所述流通限制條件可以包括以下一種或多種:對象描述、關鍵詞、語種、來源行業(yè)、加工方式、敏感度、可識別性、授權方式、應用場景、遍歷方式約束、覆蓋度、成員約束、行業(yè)約束、企業(yè)性質約束、數(shù)據(jù)來源、質量評分、安全評分、風險評分。

可選的,所述基于所述多個第二維度對所述電子合同進行統(tǒng)計包括:基于預設條件選取待統(tǒng)計數(shù)據(jù),所述待統(tǒng)計數(shù)據(jù)包括多個電子合同,每一電子合同對應一個數(shù)據(jù)集;基于所述多個第二維度對多個數(shù)據(jù)集進行聚類,得到聚類結果,所述聚類結果包括多個數(shù)據(jù)集合,每一數(shù)據(jù)集合包括至少一個數(shù)據(jù)集;在所述多個數(shù)據(jù)集合中篩選出異常集合。

可選的,所述在所述多個數(shù)據(jù)集合中篩選出異常集合包括:計算所述聚類結果中所有數(shù)據(jù)集合中數(shù)據(jù)集數(shù)量的平均值以及標準差;在當前數(shù)據(jù)集合的數(shù)據(jù)集數(shù)量與所述平均值的差值與所述標準差比值小于設定閾值時,判定所述當前數(shù)據(jù)集合為所述異常集合。

可選的,所述基于所述多個第二維度對多個數(shù)據(jù)集進行聚類包括:從所述待統(tǒng)計數(shù)據(jù)中選取設定數(shù)量的所述數(shù)據(jù)集作為初始聚類中心;計算其他數(shù)據(jù)集與所述初始聚類中心的距離;將所述其他數(shù)據(jù)集劃分至距離最近的所述初始聚類中心所在的集合;迭代更新每一集合的聚類中心,并計算所述其他數(shù)據(jù)集與所述聚類中心的距離并劃分至距離最近的所述聚類中心所在的集合,直至所有集合收斂,得到聚類結果。

可選的,采用K-prototypes算法進行聚類。

與現(xiàn)有技術相比,本發(fā)明實施例的技術方案具有以下有益效果:

本發(fā)明技術方案的數(shù)據(jù)流通系統(tǒng)包括數(shù)據(jù)標簽定義模塊、流通數(shù)據(jù)掛牌模塊、流通數(shù)據(jù)查詢模塊和電子合同生成模塊。本發(fā)明技術方案首先通過數(shù)據(jù)標簽定義模塊對流通數(shù)據(jù)的維度主鍵和標簽值進行定義;然后通過流通數(shù)據(jù)掛牌模塊基于所述多個第一維度填寫所述流通數(shù)據(jù),至此,流通數(shù)據(jù)可以進行流通。然后通過流通數(shù)據(jù)查詢模塊接收需求方的查詢條件,并基于所述查詢條件和對流通數(shù)據(jù)進行查詢和篩選,確定所需流通數(shù)據(jù);也就是說,需求方根據(jù)其查詢條件在流通數(shù)據(jù)中獲得了所需流通數(shù)據(jù),通過使用規(guī)范的數(shù)據(jù)結構進行查詢和篩選,可以實現(xiàn)流通數(shù)據(jù)的分級分類管理,以及各類流通數(shù)據(jù)的標準化的數(shù)據(jù)掛牌和數(shù)據(jù)流通,使得數(shù)據(jù)流通的掛牌和流通環(huán)節(jié)可查詢和可追溯;最后通過電子合同生成模塊生成電子合同,保證供應方和需求方之間數(shù)據(jù)流通的合法性。由于流通數(shù)據(jù)在流通中的各個環(huán)節(jié)均基于規(guī)范的多個第一維度進行,無需進行復雜的轉換、整合等處理,有利于限制計算量和成本。

進一步地,數(shù)據(jù)流通系統(tǒng)還包括合同分類統(tǒng)計模塊,合同分類統(tǒng)計模塊適于基于所述多個第二維度對所述電子合同進行統(tǒng)計,以實現(xiàn)對所述流通數(shù)據(jù)的監(jiān)測。本發(fā)明技術方案實現(xiàn)了在海量數(shù)據(jù)流通的場景中,確定與常規(guī)行為不一致的異常數(shù)據(jù)流通行為,或者確定可能發(fā)生風險的異常數(shù)據(jù)流通行為;通過對異常數(shù)據(jù)的挖掘,進而實現(xiàn)對流通數(shù)據(jù)的監(jiān)管。

進一步,所述合同分類統(tǒng)計模塊可以包括:合同獲取子模塊,適于基于預設條件選取待統(tǒng)計數(shù)據(jù),所述待統(tǒng)計數(shù)據(jù)包括多個電子合同,每一電子合同對應一個數(shù)據(jù)集;聚類子模塊,適于基于所述多個第二維度對多個數(shù)據(jù)集進行聚類,得到聚類結果,所述聚類結果包括多個數(shù)據(jù)集合,每一數(shù)據(jù)集合包括至少一個數(shù)據(jù)集;篩選子模塊,適于在所述多個數(shù)據(jù)集合中篩選出異常集合。本發(fā)明技術方案通過聚類子模塊對電子合同進行聚類,并通過篩選子模塊進行篩選,從而確定異常集合,也就是確定異常流通數(shù)據(jù),實現(xiàn)了對流通數(shù)據(jù)的監(jiān)測。

附圖說明

圖1是本發(fā)明實施例一種數(shù)據(jù)流通系統(tǒng)的結構示意圖;

圖2是本發(fā)明實施例另一種數(shù)據(jù)流通系統(tǒng)的結構示意圖

圖3是圖2所示的合同分類統(tǒng)計單元的結構示意圖;

圖4是本發(fā)明實施例一種數(shù)據(jù)流通方法的流程圖。

具體實施方式

如背景技術中所述,在數(shù)據(jù)流通領域,普遍存在海量非結構化的數(shù)據(jù)結構難以統(tǒng)一和沒有規(guī)范標的物的問題,不同的數(shù)據(jù)提供方的數(shù)據(jù)結構不同。在數(shù)據(jù)流通和數(shù)據(jù)管理過程中,由于流通數(shù)據(jù)的數(shù)據(jù)結構不統(tǒng)一,需要對流通數(shù)據(jù)進行轉換、整合、分類等處理,導致計算量和成本增加。

本發(fā)明實施例首先通過數(shù)據(jù)標簽定義模塊對流通數(shù)據(jù)的維度主鍵和標簽值進行定義;然后通過流通數(shù)據(jù)掛牌模塊基于所述多個第一維度填寫所述流通數(shù)據(jù)。然后通過流通數(shù)據(jù)查詢模塊接收需求方的查詢條件,并基于所述查詢條件對流通數(shù)據(jù)進行查詢和篩選,確定所需流通數(shù)據(jù);也就是說,需求方根據(jù)其查詢條件在流通數(shù)據(jù)中獲得了所需流通數(shù)據(jù),通過使用規(guī)范的數(shù)據(jù)結構進行查詢和篩選,可以實現(xiàn)流通數(shù)據(jù)的分級分類管理,以及各類流通數(shù)據(jù)的標準化的數(shù)據(jù)掛牌和數(shù)據(jù)流通,使得數(shù)據(jù)流通的掛牌和流通環(huán)節(jié)可查詢和可追溯;最后通過電子合同生成模塊生成電子合同,保證供應方和需求方之間數(shù)據(jù)流通的合法性。由于流通數(shù)據(jù)在流通中的各個環(huán)節(jié)均基于規(guī)范的多個第一維度進行,無需進行復雜的轉換、整合等處理,有利于限制計算量和成本。

為使本發(fā)明的上述目的、特征和優(yōu)點能夠更為明顯易懂,下面結合附圖對本發(fā)明的具體實施例做詳細的說明。

圖1是本發(fā)明實施例一種數(shù)據(jù)流通系統(tǒng)的結構示意圖。

圖1所示的數(shù)據(jù)流通系統(tǒng)10可以包括數(shù)據(jù)標簽定義模塊101、流通數(shù)據(jù)掛牌模塊102、流通數(shù)據(jù)查詢模塊103和電子合同生成模塊104。

其中,數(shù)據(jù)標簽定義模塊101適于接收運營方對流通數(shù)據(jù)的維度主鍵和標簽值的定義,所述流通數(shù)據(jù)具有多個第一維度,所述多個第一維度包括所述維度主鍵和所述標簽值;流通數(shù)據(jù)掛牌模塊102適于接收供應方選擇的所述標簽值,并基于所述多個第一維度填寫所述流通數(shù)據(jù);流通數(shù)據(jù)查詢模塊103適于接收需求方的查詢條件,并基于所述查詢條件和對所述流通數(shù)據(jù)進行查詢和篩選,確定所需流通數(shù)據(jù);電子合同生成模塊104適于在確定所述所需流通數(shù)據(jù)后,生成電子合同,所述電子合同包括所述所需流通數(shù)據(jù)且具備多個第二維度,所述多個第二維度包括所述所需流通數(shù)據(jù)的多個第一維度。

具體實施中,數(shù)據(jù)標簽定義模塊101可以集成于運營方終端,可以接收運營方的流通數(shù)據(jù)標準,流通數(shù)據(jù)標準可以包括運營方定義的流通數(shù)據(jù)的維度主鍵和標簽值,其中,標簽值可以是維度主鍵下的多個可選值。具體而言,可以定義維度主鍵的名稱、維度主鍵的分類、標簽值的類型和標簽值的數(shù)值。具體地,維度主鍵可以作為流通數(shù)據(jù)的標簽,那么標簽值與維度主鍵相對應,標簽值可以是維度主鍵的值。例如,在維度主鍵為年齡時,標簽值為年齡值或年齡所在的數(shù)值范圍。

具體實施中,流通數(shù)據(jù)掛牌模塊102可以集成于供應方終端,可以接收供應方的操作數(shù)據(jù),操作數(shù)據(jù)可以包括供應方選擇的標簽值,以及供應方基于所述多個第一維度填寫的流通數(shù)據(jù)。至此,流通數(shù)據(jù)可用于流通,以供需求方進行查詢和選擇。

具體實施中,流通數(shù)據(jù)查詢模塊103可以集成于需求方終端,可以接收需求方的操作數(shù)據(jù),操作數(shù)據(jù)可以包括需求方查詢條件,并基于查詢條件和多個第一維度在所有流通數(shù)據(jù)中進行查詢和篩選;在流通數(shù)據(jù)滿足查詢條件時,則該流通數(shù)據(jù)為需求方需要的所需流通數(shù)據(jù)。

具體實施中,電子合同生成模塊104可以集成于運營方終端和監(jiān)管方終端,還可以集成于供應方終端和需求方終端,電子合同生成模塊104可以在確定所述所需流通數(shù)據(jù)后,生成電子合同。其中,所述電子合同包括所述所需流通數(shù)據(jù),所述電子合同具備多個第二維度,所述多個第二維度包括所述所需流通數(shù)據(jù)的多個第一維度。在供應方和需求方接收到電子合同并簽訂后,流通數(shù)據(jù)可以在供應方和需求方之間進行流通。具體而言,供應方可以將流通數(shù)據(jù)提交給數(shù)據(jù)配送裝置進行數(shù)據(jù)配送。更近一步地,還可以對數(shù)據(jù)流通的日志進行存儲。

本發(fā)明實施例的數(shù)據(jù)流通系統(tǒng)中,需求方根據(jù)其查詢條件和所述多個第一維度在流通數(shù)據(jù)中獲得了所需流通數(shù)據(jù),通過使用規(guī)范的數(shù)據(jù)結構進行查詢和篩選,可以實現(xiàn)流通數(shù)據(jù)的分級分類管理,以及各類流通數(shù)據(jù)的標準化的數(shù)據(jù)掛牌和數(shù)據(jù)流通,使得數(shù)據(jù)流通的掛牌和流通環(huán)節(jié)可查詢和可追溯;最后通過電子合同生成模塊生成電子合同,保證供應方和需求方之間數(shù)據(jù)流通的合法性。由于流通數(shù)據(jù)在流通中的各個環(huán)節(jié)均基于規(guī)范的多個第一維度進行,無需進行復雜的轉換、整合等處理,有利于限制計算量和成本。

本發(fā)明一具體實施例中,所述多個第一維度可以對應流通數(shù)據(jù)的多個維度。所述多個第一維度可以包括主體標識、所述維度主鍵、所述標簽值、流通限制條件、時間約束條件和價格約束條件。具體而言,流通限制條件、時間約束條件和價格約束條件可以用以約束數(shù)據(jù)供應方和數(shù)據(jù)需求方的數(shù)據(jù)流通;也就是說,只有在流通限制條件、時間約束條件和價格約束條件約束的范圍內(nèi),數(shù)據(jù)供應方和數(shù)據(jù)需求方才可以進行數(shù)據(jù)流通。

需要說明的是,所述多個第一維度可以根據(jù)實際的應用環(huán)境進行適應性的配置,本發(fā)明實施例對此不做限制。

進一步地,主體標識可以表示流通數(shù)據(jù)的唯一標識,例如手機號、身份證、銀行卡號、國際移動設備標識號等。

進一步地,維度主鍵可以包括維度主鍵名稱、維度主鍵的分類和標簽描述。維度主鍵的分類可以包括:屬性、行為、關系、評價等;標簽描述可以表示流通數(shù)據(jù)的標簽描述信息和約束條件。

進一步地,標簽值可以表示流通數(shù)據(jù)維度主鍵的賦值。標簽值的類型可以包括單值列表、多值列表、分段、命中、數(shù)據(jù)項等。

進一步地,流通限制條件可以包括流通對象條件、流通遍歷條件、數(shù)據(jù)應用范圍、數(shù)據(jù)用途、數(shù)據(jù)應用方式、數(shù)據(jù)應用時限。

進一步地,時間約束條件可以包括更新頻率、供應周期和數(shù)據(jù)留存期限。具體地,更新頻率表示流通數(shù)據(jù)的更新頻率,例如30日;統(tǒng)計周期可以表示流通數(shù)據(jù)的統(tǒng)計時間范圍,例如30日;數(shù)據(jù)留存期限可以表示供應方允許需求方在接收到流通數(shù)據(jù)后,留存數(shù)據(jù)的時間,例如60日。

進一步地,價格約束條件可以包括計費方式和掛牌價格。具體地,不同形式的流通數(shù)據(jù)可以具備不同的計費方式。計費方式可以包括:按次計費、階梯式計費、包月計費、包月階梯式計費等;掛牌價格可以包括:供應方和需求方的掛牌價格,例如1元。

優(yōu)選地,所述流通限制條件可以包括以下一種或多種:對象描述、關鍵詞、語種、來源行業(yè)、加工方式、敏感度、可識別性、授權方式、應用場景、遍歷方式約束、覆蓋度、成員約束、行業(yè)約束、企業(yè)性質約束、數(shù)據(jù)來源、質量評分、安全評分、風險評分。

具體而言,對象描述可以表示流通數(shù)據(jù)的描述性信息;關鍵詞可以表示流通數(shù)據(jù)的關鍵詞語;語種可以表示流通數(shù)據(jù)的所采用的語種;來源行業(yè)可以表示流通數(shù)據(jù)來源的國民經(jīng)濟行業(yè);加工方式可以表示供應方對流通數(shù)據(jù)的加工方式的約束性描述,影響數(shù)據(jù)質量和數(shù)據(jù)價值,例如,直接計算和間接計算;敏感度可以表示流通數(shù)據(jù)的主體標識的敏感程度,例如可以分類為敏感數(shù)據(jù)和普通數(shù)據(jù);可識別性可以表示流通數(shù)據(jù)的標簽賦值關聯(lián)到個體的程度,例如,直接識別,間接識別;授權方式可以表示流通數(shù)據(jù)的用戶的驗證方式,例如可以分類為無須授權和一般授權;應用場景可以表示流通數(shù)據(jù)的應用場景約束;遍歷方式約束可以用于供應方對流通數(shù)據(jù)及所對應個體的數(shù)據(jù)隱私安全風險進行約束,對單一需求方對流通數(shù)據(jù)遍歷方式進行約束;覆蓋度可以表示流通數(shù)據(jù)的覆蓋度的描述;成員約束可以表示供應方對需求方成員的約束;行業(yè)約束可以表示供應方對需求方行業(yè)的約束;企業(yè)性質約束可以表示供應方對需求方企業(yè)性質的約束;數(shù)據(jù)來源可以表示供應方數(shù)據(jù)來源的約束性描述,影響質量評分和數(shù)據(jù)價值,例如,沉淀的數(shù)據(jù)、購買的數(shù)據(jù)、抓取的數(shù)據(jù)、其他合法手段獲得的數(shù)據(jù);質量評分可以表示對流通數(shù)據(jù)的質量評分,例如,供應方自評,第三方評估,需求方后評估;安全評分可以表示對流通數(shù)據(jù)的安全評分;風險評分可以表示對流通數(shù)據(jù)的風險評分。

作為一個非限制性的例子,數(shù)據(jù)標簽定義模塊101可以接收運營方定義的維度主鍵的名稱、維度主鍵的分類、標簽值的類型和標簽值。

流通數(shù)據(jù)掛牌模塊102確定的流通數(shù)據(jù)可以包括主體標識、所述維度主鍵、所述標簽值、流通限制條件、時間約束條件和價格約束條件。

流通數(shù)據(jù)查詢模塊103接收到的查詢條件中,可以包括主體標識、所述維度主鍵、所述標簽值、流通限制條件、時間約束條件和價格約束條件的一種或多種。

電子合同生成模塊104在需求方查詢流通數(shù)據(jù)并且匹配成功后,生成電子合同,電子合同可以包括流通數(shù)據(jù)的主體標識、所述維度主鍵、所述標簽值、流通限制條件、時間約束條件和價格約束條件。

進一步而言,流通數(shù)據(jù)掛牌模塊102還可以對流通數(shù)據(jù)進行維護。具體地,可以是新增流通數(shù)據(jù)、修改流通數(shù)據(jù)、刪除流通數(shù)據(jù)和導出流通數(shù)據(jù)。在新增流通數(shù)據(jù)時,流通數(shù)據(jù)掛牌模塊102可以接收供應方填寫的流通數(shù)據(jù)的主體標識、維度主鍵、標簽值、流通限制條件、時間約束條件和價格約束條件。修改流通數(shù)據(jù)時,流通數(shù)據(jù)掛牌模塊102可以接收供應方修改的已掛牌流通數(shù)據(jù)的主體標識、維度主鍵、標簽值、流通限制條件、時間約束條件和價格約束條件。導出流通數(shù)據(jù)時,流通數(shù)據(jù)掛牌模塊102可以用于供應方將已掛牌流通數(shù)據(jù)的主體標識、維度主鍵、標簽值、流通限制條件、時間約束條件和價格約束條件以文件形式導出并下載。

圖2是本發(fā)明實施例另一種數(shù)據(jù)流通系統(tǒng)的結構示意圖。

圖2所示的數(shù)據(jù)流通系統(tǒng)20可以包括數(shù)據(jù)標簽定義模塊201、流通數(shù)據(jù)掛牌模塊202、流通數(shù)據(jù)查詢模塊203、電子合同生成模塊204和合同分類統(tǒng)計模塊205。

其中,數(shù)據(jù)標簽定義模塊201適于接收運營方對流通數(shù)據(jù)的維度主鍵和標簽值的定義,所述流通數(shù)據(jù)具有多個第一維度,所述多個第一維度包括所述維度主鍵和所述標簽值;流通數(shù)據(jù)掛牌模塊202適于接收供應方選擇的所述標簽值,并基于所述多個第一維度填寫所述流通數(shù)據(jù);流通數(shù)據(jù)查詢模塊203適于接收需求方的查詢條件,并基于所述查詢條件對流通數(shù)據(jù)進行查詢和篩選,確定所需流通數(shù)據(jù);電子合同生成模塊204適于在確定所述所需流通數(shù)據(jù)后,生成電子合同,所述電子合同包括所述所需流通數(shù)據(jù)且具備多個第二維度,所述多個第二維度包括所述所需流通數(shù)據(jù)的多個第一維度。

本實施例中數(shù)據(jù)標簽定義模塊201、流通數(shù)據(jù)掛牌模塊202、流通數(shù)據(jù)查詢模塊203和電子合同生成模塊204的具體實施方式,可參照圖1所示的數(shù)據(jù)標簽定義模塊101、流通數(shù)據(jù)掛牌模塊102、流通數(shù)據(jù)查詢模塊103和電子合同生成模塊104,此處不再贅述。

本實施例中,合同分類統(tǒng)計模塊205可以集成于監(jiān)管方終端,還可以集成于運營方終端、供應方終端和需求方終端。合同分類統(tǒng)計模塊205可以用以基于所述多個第二維度對所述電子合同進行統(tǒng)計,以實現(xiàn)對所述流通數(shù)據(jù)的監(jiān)測。

本實施例中,合同分類統(tǒng)計單元205可以統(tǒng)計所有電子合同,基于電子合同的多個維度,也即從不同層面進行統(tǒng)計,確定有異常行為的流通數(shù)據(jù),進行統(tǒng)計和監(jiān)管。例如,統(tǒng)計出每個地域、行業(yè)或企業(yè)等層面的異常流通數(shù)據(jù)。

具體實施中,請參照圖3,合同分類統(tǒng)計單元205可以包括合同獲取子模塊301、聚類子模塊302和篩選子模塊303。合同獲取子模塊301適于基于預設條件選取待統(tǒng)計數(shù)據(jù),所述待統(tǒng)計數(shù)據(jù)包括多個電子合同,每一電子合同對應一個數(shù)據(jù)集;聚類子模塊302適于基于所述多個第二維度對多個數(shù)據(jù)集進行聚類,得到聚類結果,所述聚類結果包括多個數(shù)據(jù)集合,每一數(shù)據(jù)集合包括至少一個數(shù)據(jù)集;篩選子模塊303適于在所述多個數(shù)據(jù)集合中篩選出異常集合。

具體地,篩選子模塊303計算所述聚類結果中所有數(shù)據(jù)集合中數(shù)據(jù)集數(shù)量的平均值以及標準差,并在當前數(shù)據(jù)集合的數(shù)據(jù)集數(shù)量與所述平均值的差值與所述標準差比值小于設定閾值時,判定所述當前數(shù)據(jù)集合為所述異常集合。

進一步而言,聚類子模塊302可以包括選取子模塊3021、第一計算子模塊3022、劃分子模塊3023和迭代子模塊3024。

其中,選取子模塊3021適于從所述待統(tǒng)計數(shù)據(jù)中選取設定數(shù)量的所述數(shù)據(jù)集作為初始聚類中心;第一計算子模塊3022適于計算其他數(shù)據(jù)集與所述初始聚類中心的距離;劃分子模塊3023適于將所述其他數(shù)據(jù)集劃分至距離最近的所述初始聚類中心所在的集合;迭代子模塊3024適于迭代更新每一集合的聚類中心,并計算所述其他數(shù)據(jù)集與所述聚類中心的距離并劃分至距離最近的所述聚類中心所在的集合,直至所有集合收斂,得到聚類結果。

具體而言,合同獲取子模塊301在存儲有電子合同的數(shù)據(jù)庫中,根據(jù)預設條件選擇待統(tǒng)計數(shù)據(jù)。具體而言,可以根據(jù)數(shù)據(jù)約束條件(將所述數(shù)據(jù)約束條件表示為Cdata)和層約束條件(將所述層約束條件表示為Clevel)進行選??;數(shù)據(jù)約束條件Cdata可以對應流通數(shù)據(jù)的標簽值,層約束條件Clevel可以表示電子合同的維度的粒度。例如,數(shù)據(jù)約束條件Cdata為“行業(yè)=廣告”,Clevel為“l(fā)evel地域=市,level時間=月”,那么,數(shù)據(jù)集(將所述數(shù)據(jù)集表示為Ci)Ci=Cdata∩Clevel表示選取的待統(tǒng)計數(shù)據(jù)為廣告行業(yè)的流通數(shù)據(jù),并且是在地域上按照地級市的粒度,在時間上按照月的粒度來選取的。

在待統(tǒng)計數(shù)據(jù)中,合同分類統(tǒng)計單元205可以從海量數(shù)據(jù)中確定流通數(shù)據(jù)的異常流通行為。例如,篩選子模塊在海量廣告行業(yè)的流通數(shù)據(jù)中可能會確定敏感數(shù)據(jù)的孤立點,而孤立點可以代表異常的數(shù)據(jù)流通行為,因此可以通過對異常點進行抽樣監(jiān)督,來監(jiān)測數(shù)據(jù)流通過程。

本發(fā)明一具體實施例中,聚類子模塊302可以采用K-prototypes算法進行聚類,并基于聚類結果找到孤立點。

具體實施中,對于待統(tǒng)計數(shù)據(jù)中的多個數(shù)據(jù)集,包括多個維度。具體而言,多個維度可以包括無序的標稱屬性和有序的數(shù)值屬性。例如,標稱屬性可以包括:主體標識分類={手機號、身份證、銀行卡……}、維度主鍵分類={屬性、行為、關系、評價}、標簽賦值類型={單值列表、多值列表、分段、命中、數(shù)據(jù)項目}、來源行業(yè)={金融、汽車、旅游……}、加工方式={直接計算、間接計算}、應用場景={征信、營銷、智慧城市、行業(yè)資訊……}、覆蓋度={上海、北京、廣州……}、授權方式={無須授權、一般授權}、敏感性={高、中、低}、可識別性={直接識別、間接識別}、計價方式={按次計費、階梯式計費、包月計費、包月階梯式計費}等;數(shù)值屬性可以包括:統(tǒng)計周期(日)、更新頻率(日)、掛牌價格(元),訂單數(shù)量(個)。

具體地,待統(tǒng)計數(shù)據(jù)X中可以包括n個數(shù)據(jù)集,n為大于0的正整數(shù),Xi表示n個數(shù)據(jù)集中的第i個數(shù)據(jù)集;數(shù)據(jù)集Xi={Xi1,Xi2,…,Xis,Xi(s+1),Xi(s+2),…,Xit},其中,Xi1,Xi2,…,Xis表示數(shù)據(jù)集Xi的標稱屬性,Xi(s+1),Xi(s+2),…,Xit表示數(shù)據(jù)集Xi的數(shù)值屬性,s為大于0的正整數(shù),t為大于0的正整數(shù)。

具體地,在待統(tǒng)計數(shù)據(jù)中隨機選擇p個數(shù)據(jù)集作為初始聚類中心,記為{V1,V2,V3…Vp},p為大于0的正整數(shù)。每一初始聚類中心Vl可以包括多個屬性Vl={Vl1,Vl2,…,Vls,Vl(s+1),Vl(s+2),…,Vlt};每一初始聚類中心對應一個類,記為C={C1,C2,C3…Cp}。計算剩余數(shù)據(jù)集與各個類中初始聚類中心{V1,2,V3…Vp}的距離,將剩余數(shù)據(jù)集劃分到距離最小的類集合中。進一步地,在計算距離時,為了避免將標稱屬性有序化,設d種不同值的標稱屬性為一個d維正交向量,d為大于0的正整數(shù)。標稱屬性的距離計算公式為其中,δ(Xij,Vlj)表示標稱屬性Xij到標稱屬性Vlj向量分量概率的曼哈頓距離。數(shù)值屬性的距離測量公式為:數(shù)據(jù)集Xi與初始聚類集合中心Vi的距離d(Xi,Vl),計算公式如下:其中,γ為設定系數(shù)。

具體地,在對剩余數(shù)據(jù)集劃分完成后,更新各個類集合中的初始聚中心。更新初始聚類中心時,對于數(shù)值屬性,計算各個類集合中所有數(shù)據(jù)集的均值;對標稱屬性,取各個類中所有數(shù)據(jù)集出現(xiàn)概率最高的值;選取數(shù)值屬性為均值,標稱屬性為概率最高的值對應的數(shù)據(jù)集作為新的聚類中心。然后重新計算剩余數(shù)據(jù)集到當前聚類中心的距離,并將剩余數(shù)據(jù)集劃分到該聚類中心對應的類集合。

重復上述過程,直到類集合收斂,得到聚類結果,也即類集合C={C1,C2,C3…Cp}。至此,聚類過程結束。

具體地,篩選子模塊在聚類結果中確定異常集合,也即孤立點。更具體地,計算所有數(shù)據(jù)集合中數(shù)據(jù)集的數(shù)量|Ci|的均值μ和方差σ2,確定的數(shù)據(jù)集C′={C′1,C′2,…C′e},其中,ε為設定閾值;該數(shù)據(jù)集C′為孤立點?;诖?,可以做抽樣調(diào)查對數(shù)據(jù)流通進行監(jiān)管。

本發(fā)明實施例可以基于存儲電子合同的數(shù)據(jù)庫,從不同層面,統(tǒng)計出每個地域、行業(yè)或公司的異常交易情況,以進行實時監(jiān)管。

圖4是本發(fā)明實施例一種數(shù)據(jù)流通方法的流程圖。

圖4所示的數(shù)據(jù)流通方法可以包括以下步驟:

步驟S401:接收運營方對流通數(shù)據(jù)的維度主鍵和標簽值的定義;

步驟S402:接收供應方選擇的所述標簽值以及基于所述多個第一維度填寫的所述流通數(shù)據(jù);

步驟S403:接收需求方的查詢條件,并基于所述查詢條件對所述流通數(shù)據(jù)進行查詢和篩選,確定所需流通數(shù)據(jù);

步驟S404:在確定所述所需流通數(shù)據(jù)后,生成電子合同。

其中,所述流通數(shù)據(jù)具有多個第一維度,所述多個第一維度包括所述維度主鍵和標簽值;所述電子合同包括所述所需流通數(shù)據(jù)且具備多個第二維度,所述多個第二維度包括所述所需流通數(shù)據(jù)的多個第一維度。

具體實施中,所述多個第一維度還可以包括主體標識、流通限制條件、時間約束條件和價格約束條件。具體而言,所述流通限制條件可以包括以下一種或多種:對象描述、關鍵詞、語種、來源行業(yè)、加工方式、敏感度、可識別性、授權方式、應用場景、遍歷方式約束、覆蓋度、成員約束、行業(yè)約束、企業(yè)性質約束、數(shù)據(jù)來源、質量評分、安全評分、風險評分。

具體實施中,多個第二維度還可以選自:所述電子合同的生成時間、訂單數(shù)量、所述所需流通數(shù)據(jù)的供應方信息以及所述所需流通數(shù)據(jù)的需求方信息。

具體實施中,在步驟S403中,在所述查詢條件與所述流通數(shù)據(jù)的主體標識、維度主鍵、標簽值、流通限制條件、時間約束條件和價格約束條件相匹配時,將所述流通數(shù)據(jù)作為所述所需流通數(shù)據(jù)。

優(yōu)選地,所述數(shù)據(jù)流通方法還可以包括以下步驟:基于所述多個第二維度對所述電子合同進行統(tǒng)計,以實現(xiàn)對所述流通數(shù)據(jù)的監(jiān)測。具體而言,上述步驟還可以包括以下步驟:基于預設條件選取待統(tǒng)計數(shù)據(jù),所述待統(tǒng)計數(shù)據(jù)包括多個電子合同,每一電子合同對應一個數(shù)據(jù)集;基于所述多個第二維度對多個數(shù)據(jù)集進行聚類,得到聚類結果,所述聚類結果包括多個數(shù)據(jù)集合,每一數(shù)據(jù)集合包括至少一個數(shù)據(jù)集;在所述多個數(shù)據(jù)集合中篩選出異常集合。進一步而言,計算所述聚類結果中所有數(shù)據(jù)集合中數(shù)據(jù)集數(shù)量的平均值以及標準差;在當前數(shù)據(jù)集合的數(shù)據(jù)集數(shù)量與所述平均值的差值與所述標準差比值小于設定閾值時,判定所述當前數(shù)據(jù)集合為所述異常集合。

具體實施中,基于所述多個第二維度對多個數(shù)據(jù)集進行聚類可以包括以下步驟:從所述待統(tǒng)計數(shù)據(jù)中選取設定數(shù)量的所述數(shù)據(jù)集作為初始聚類中心;計算其他數(shù)據(jù)集與所述初始聚類中心的距離;將所述其他數(shù)據(jù)集劃分至距離最近的所述初始聚類中心所在的集合;迭代更新每一集合的聚類中心,并計算所述其他數(shù)據(jù)集與所述聚類中心的距離并劃分至距離最近的所述聚類中心所在的集合,直至所有集合收斂,得到聚類結果。

更近一步地,可以采用K-prototypes算法進行聚類。通過采用K-prototypes算法可以實現(xiàn)數(shù)據(jù)集中數(shù)值數(shù)據(jù)之間距離的計算,以及非數(shù)值數(shù)據(jù)之間距離的計算,進而實現(xiàn)數(shù)據(jù)集之間的聚類。

需要說明的是,也可以采用其他任意可實施的算法實現(xiàn)聚類過程,本發(fā)明實施例對此不做限制。

本發(fā)明實施例的具體實施方式可參照圖1至圖3所示的實施例,此處不再贅述。

本領域普通技術人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程序來指令相關的硬件來完成,該程序可以存儲于以計算機可讀存儲介質中,存儲介質可以包括:ROM、RAM、磁盤或光盤等。

雖然本發(fā)明披露如上,但本發(fā)明并非限定于此。任何本領域技術人員,在不脫離本發(fā)明的精神和范圍內(nèi),均可作各種更動與修改,因此本發(fā)明的保護范圍應當以權利要求所限定的范圍為準。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1