分布式多點(diǎn)數(shù)據(jù)抽取方法
【專利摘要】本發(fā)明具體涉及分布式多點(diǎn)數(shù)據(jù)抽取方法;包括以下步驟:步驟101:首先針對外部數(shù)據(jù)源DB及字段結(jié)構(gòu)建立數(shù)據(jù)源表,步驟102:建立數(shù)據(jù)源表;步驟103的建立內(nèi)部數(shù)據(jù)源表;步驟104:選取需引入數(shù)據(jù)字段和步驟105:添加數(shù)據(jù)表定位字段GUID,步驟106:生成內(nèi)部數(shù)據(jù)源表結(jié)構(gòu);步驟107:GUID定位碼生成器,步驟108:生成帶定位碼的內(nèi)部數(shù)據(jù)源表;步驟109:建立程序定位數(shù)據(jù)表,步驟110:約束條件智能生成器,步驟111:用戶錄入篩選條件,步驟112:單元格位置標(biāo)注篩選條件及顏色,步驟113:由GUID標(biāo)識(shí)表名、字段名、記錄條件、時(shí)間、客戶名;步驟114的GUID條件,步驟115:生成SELECT;步驟116:獲取目標(biāo)數(shù)據(jù),步驟117:聚類分析判斷;步驟118:分析報(bào)告表;讓用戶獲取需要的任何數(shù)量的篩選數(shù)據(jù)結(jié)果。
【專利說明】分布式多點(diǎn)數(shù)據(jù)抽取方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理【技術(shù)領(lǐng)域】,具體涉及分布式多點(diǎn)數(shù)據(jù)抽取方法。
【背景技術(shù)】
[0002]通常數(shù)據(jù)分析技術(shù)的主要方式,是通過數(shù)據(jù)篩選,獲取滿足條件的數(shù)據(jù)元素。目前,實(shí)現(xiàn)數(shù)據(jù)分析篩選,在SQL、Access, Oracle等數(shù)據(jù)平臺(tái)中,是通過編制程序語句實(shí)現(xiàn)數(shù)據(jù)篩選,其優(yōu)勢是可以通過其語句函數(shù)等,編制程序?qū)懻Z句實(shí)現(xiàn)各種篩選結(jié)果。但并不能在其數(shù)據(jù)平臺(tái)上直接通過鼠標(biāo)或鍵盤點(diǎn)擊指令界面化操作,實(shí)現(xiàn)數(shù)據(jù)篩選,不能直接構(gòu)建出將篩選條件與數(shù)據(jù)元素綁定并記載。在Excel軟件中,可以設(shè)置篩選條件獲取篩選結(jié)果,但用戶篩選條件無法保存,更不能將篩選條件與單元格綁定;其他現(xiàn)有中外應(yīng)用或?qū)S密浖?,公開發(fā)表的信息中也未出現(xiàn)上述權(quán)利要求涉及到的分布式多點(diǎn)數(shù)據(jù)抽取技術(shù)。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的為了解決上述問題,提供了分布式多點(diǎn)數(shù)據(jù)抽取方法。
[0004]為實(shí)現(xiàn)上述目的,本發(fā)明提供了分布式多點(diǎn)數(shù)據(jù)抽取方法,包括以下步驟:
[0005]步驟101:首先針對外部數(shù)據(jù)源DB及字段結(jié)構(gòu)建立數(shù)據(jù)源表,針對步驟102中的建立數(shù)據(jù)源表進(jìn)行判斷是否要進(jìn)入步驟103的建立內(nèi)部數(shù)據(jù)源表,如果不需要建立內(nèi)部數(shù)據(jù)源表,則進(jìn)入步驟107:⑶ID定位碼生成器;如果需要建立內(nèi)部數(shù)據(jù)源表,那么進(jìn)入步驟104:選取需引入數(shù)據(jù)字段和步驟105:添加數(shù)據(jù)表定位字段⑶ID,再進(jìn)入步驟106:生成內(nèi)部數(shù)據(jù)源表結(jié)構(gòu);接著進(jìn)入步驟107:⑶ID定位碼生成器,由⑶ID定位碼生成器對生成內(nèi)部數(shù)據(jù)源表結(jié)構(gòu)進(jìn)行處理,然后進(jìn)入步驟108:生成帶定位碼的內(nèi)部數(shù)據(jù)源表;針對生成帶定位碼的內(nèi)部數(shù)據(jù)源表進(jìn)入步驟109:建立程序定位數(shù)據(jù)表,對建立程序定位數(shù)據(jù)表進(jìn)行判定是否要生成步驟110:約束條件智能生成器,如果否,則進(jìn)入步驟113:由GUID標(biāo)識(shí)表名、字段名、記錄條件、時(shí)間、客戶名;如果是,則進(jìn)入步驟110:約束條件智能生成器,再進(jìn)入步驟111:用戶錄入篩選條件,由約束條件智能生成器對用戶錄入篩選條件進(jìn)行判斷是否符合,如果符合條件則進(jìn)入步驟112:單元格位置標(biāo)注篩選條件及顏色,如果不符合條件則進(jìn)入步驟113:由GUID標(biāo)識(shí)表名、字段名、記錄條件、時(shí)間、客戶名;由步驟113生成步驟114的⑶ID條件,針對⑶ID條件進(jìn)入步驟115:生成SELECT ;從而進(jìn)入步驟116:獲取目標(biāo)數(shù)據(jù),針對獲取的目標(biāo)數(shù)據(jù)進(jìn)入步驟117:聚類分析判斷;最終針對由聚類分析判斷得出步驟118:分析報(bào)告表。
[0006]本發(fā)明具有以下有益效果:采用本發(fā)明的方法,可在不編寫程序語句的情況下,讓用戶能完整的設(shè)定任何數(shù)量的數(shù)據(jù)篩選條件,獲取需要的任何數(shù)量的篩選數(shù)據(jù)結(jié)果,且將任何數(shù)量的篩選條件組合記載于數(shù)據(jù)表中。
【專利附圖】
【附圖說明】
[0007]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0008]圖1為本發(fā)明分布式多點(diǎn)數(shù)據(jù)抽取方法處理流程圖。
【具體實(shí)施方式】
[0009]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0010]參見圖1,本發(fā)明提供了分布式多點(diǎn)數(shù)據(jù)抽取方法,包括以下步驟:
[0011]步驟101:首先針對外部數(shù)據(jù)源DB及字段結(jié)構(gòu)建立數(shù)據(jù)源表,針對步驟102中的建立數(shù)據(jù)源表進(jìn)行判斷是否要進(jìn)入步驟103的建立內(nèi)部數(shù)據(jù)源表,如果不需要建立內(nèi)部數(shù)據(jù)源表,則進(jìn)入步驟107:⑶ID定位碼生成器;如果需要建立內(nèi)部數(shù)據(jù)源表,那么進(jìn)入步驟104:選取需引入數(shù)據(jù)字段和步驟105:添加數(shù)據(jù)表定位字段⑶ID,再進(jìn)入步驟106:生成內(nèi)部數(shù)據(jù)源表結(jié)構(gòu);接著進(jìn)入步驟107:⑶ID定位碼生成器,由⑶ID定位碼生成器對生成內(nèi)部數(shù)據(jù)源表結(jié)構(gòu)進(jìn)行處理,然后進(jìn)入步驟108:生成帶定位碼的內(nèi)部數(shù)據(jù)源表;針對生成帶定位碼的內(nèi)部數(shù)據(jù)源表進(jìn)入步驟109:建立程序定位數(shù)據(jù)表,對建立程序定位數(shù)據(jù)表進(jìn)行判定是否要生成步驟110:約束條件智能生成器,如果否,則進(jìn)入步驟113:由GUID標(biāo)識(shí)表名、字段名、記錄條件、時(shí)間、客戶名;如果是,則進(jìn)入步驟110:約束條件智能生成器,再進(jìn)入步驟111:用戶錄入篩選條件,由約束條件智能生成器對用戶錄入篩選條件進(jìn)行判斷是否符合,如果符合條件則進(jìn)入步驟112:單元格位置標(biāo)注篩選條件及顏色,如果不符合條件則進(jìn)入步驟113:由⑶ID標(biāo)識(shí)表名、字段名、記錄條件、時(shí)間、客戶名;由步驟113生成步驟114的⑶ID條件,針對⑶ID條件進(jìn)入步驟115:生成SELECT ;從而進(jìn)入步驟116:獲取目標(biāo)數(shù)據(jù),針對獲取的目標(biāo)數(shù)據(jù)進(jìn)入步驟117:聚類分析判斷;最終針對由聚類分析判斷得出步驟118:分析報(bào)告表。二維數(shù)據(jù)表中,以單元格位置信息為綁定點(diǎn),記載用戶所設(shè)定的數(shù)據(jù)分析篩選的條件,并將行的各單元格已經(jīng)設(shè)置的若干個(gè)數(shù)據(jù)篩選條件進(jìn)行數(shù)理邏輯關(guān)聯(lián),應(yīng)用數(shù)據(jù)篩選語句抽取滿足組合條件的數(shù)據(jù)樣本。而若干個(gè)單元格和數(shù)據(jù)行形成的篩選條件集合,將用戶需要篩選的數(shù)據(jù),以語句方式完整的與各數(shù)據(jù)單元關(guān)聯(lián),形式上分布于數(shù)據(jù)單元中,形成分布式多點(diǎn)數(shù)據(jù)抽取技術(shù)。
[0012]本發(fā)明舉例說明:二維數(shù)據(jù)設(shè)列標(biāo)識(shí)X和行標(biāo)識(shí)Y:
[0013]列集合X= {XI,X2, X3, X4, X5......Xnj
[0014]行集合Y= {YI, Y2, Y3, Y4, Y5......Ynj
[0015]X1X2X3X4X5......Xn
[0016]
【權(quán)利要求】
1.分布式多點(diǎn)數(shù)據(jù)抽取方法,其特征在于:包括以下步驟: 步驟101:首先針對外部數(shù)據(jù)源DB及字段結(jié)構(gòu)建立數(shù)據(jù)源表,針對步驟102中的建立數(shù)據(jù)源表進(jìn)行判斷是否要進(jìn)入步驟103的建立內(nèi)部數(shù)據(jù)源表,如果不需要建立內(nèi)部數(shù)據(jù)源表,則進(jìn)入步驟107:⑶ID定位碼生成器;如果需要建立內(nèi)部數(shù)據(jù)源表,那么進(jìn)入步驟104:選取需引入數(shù)據(jù)字段和步驟105:添加數(shù)據(jù)表定位字段GUID,再進(jìn)入步驟106:生成內(nèi)部數(shù)據(jù)源表結(jié)構(gòu);接著進(jìn)入步驟107:⑶ID定位碼生成器,由⑶ID定位碼生成器對生成內(nèi)部數(shù)據(jù)源表結(jié)構(gòu)進(jìn)行處理,然后進(jìn)入步驟108:生成帶定位碼的內(nèi)部數(shù)據(jù)源表;針對生成帶定位碼的內(nèi)部數(shù)據(jù)源表進(jìn)入步驟109:建立程序定位數(shù)據(jù)表,對建立程序定位數(shù)據(jù)表進(jìn)行判定是否要生成步驟110:約束條件智能生成器,如果否,則進(jìn)入步驟113:由GUID標(biāo)識(shí)表名、字段名、記錄條件、時(shí)間、客戶名;如果是,則進(jìn)入步驟110:約束條件智能生成器,再進(jìn)入步驟111:用戶錄入篩選條件,由約束條件智能生成器對用戶錄入篩選條件進(jìn)行判斷是否符合,如果符合條件則進(jìn)入步驟112:單元格位置標(biāo)注篩選條件及顏色,如果不符合條件則進(jìn)入步驟113:由⑶ID標(biāo)識(shí)表名、字段名、記錄條件、時(shí)間、客戶名;由步驟113生成步驟114的⑶ID條件,針對⑶ID條件進(jìn)入步驟115:生成SELECT ;從而進(jìn)入步驟116:獲取目標(biāo)數(shù)據(jù),針對獲取的目標(biāo)數(shù)據(jù)進(jìn)入步驟117:聚類分析判斷;最終針對由聚類分析判斷得出步驟118:分析報(bào)告表。
【文檔編號(hào)】G06F17/30GK103970880SQ201410208607
【公開日】2014年8月6日 申請日期:2014年5月17日 優(yōu)先權(quán)日:2014年5月17日
【發(fā)明者】白崇明 申請人:白崇明