本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體地說是一種基于政府?dāng)?shù)據(jù)的綜合治理服務(wù)的方法。
背景技術(shù):
隨著政府?dāng)?shù)據(jù)量的增長、數(shù)據(jù)價(jià)值挖掘需求的增加,數(shù)據(jù)管理難度逐步加大,政府大數(shù)據(jù)安全問題也開始展現(xiàn)。數(shù)據(jù)共享平臺(tái)、數(shù)據(jù)開放平臺(tái)、政府大數(shù)據(jù)中心的建設(shè),讓各級(jí)政府部門感受到政府大數(shù)據(jù)帶來的價(jià)值與無限前景,認(rèn)識(shí)到政府大數(shù)據(jù)的重要性和必要性。各級(jí)政府部門對(duì)數(shù)據(jù)的共享、開放范圍的要求逐步提高,對(duì)數(shù)據(jù)種類的需求逐步提升,對(duì)數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全的要求也逐步增強(qiáng),造成數(shù)據(jù)管理過程中的數(shù)據(jù)梳理、數(shù)據(jù)抽取、數(shù)據(jù)采集、數(shù)據(jù)清洗和數(shù)據(jù)安全管理難度逐漸增大,數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)檢索、數(shù)據(jù)碰撞、數(shù)據(jù)探索、查詢比對(duì)等功能要求也不斷增多,對(duì)政府大數(shù)據(jù)管理平臺(tái)的建設(shè)提出更高要求。
數(shù)據(jù)治理是對(duì)數(shù)據(jù)資產(chǎn)的管理行使權(quán)利和控制的活動(dòng)集合(規(guī)劃、監(jiān)控和執(zhí)行)。數(shù)據(jù)治理能夠職能的指導(dǎo)其他數(shù)據(jù)管理職能如何執(zhí)行。目前,針對(duì)政府?dāng)?shù)據(jù)的數(shù)據(jù)治理服務(wù),通常以各委辦單位業(yè)務(wù)系統(tǒng)形式存在,工程龐大復(fù)雜的同時(shí),治理服務(wù)的形式與內(nèi)容過于單一,會(huì)出現(xiàn)各類數(shù)據(jù)問題,例如數(shù)據(jù)目錄不夠標(biāo)準(zhǔn),多源數(shù)據(jù)未能融合,數(shù)據(jù)質(zhì)量無法保證,數(shù)據(jù)安全機(jī)制不全等等。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的技術(shù)任務(wù)是提供一種基于政府?dāng)?shù)據(jù)的綜合治理服務(wù)的方法。
本發(fā)明的技術(shù)任務(wù)是按以下方式實(shí)現(xiàn)的,該方法由“理”數(shù)據(jù)和“治”數(shù)據(jù)兩部分實(shí)現(xiàn),其中“理”數(shù)據(jù)為基礎(chǔ),“治”數(shù)據(jù)為手段;
“理”數(shù)據(jù)是對(duì)政府?dāng)?shù)據(jù)進(jìn)行有序標(biāo)準(zhǔn)化的規(guī)劃設(shè)計(jì),對(duì)政府所掌握的數(shù)據(jù)資產(chǎn)的梳理;包括數(shù)據(jù)采集、數(shù)據(jù)梳理、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)規(guī)劃設(shè)計(jì)、數(shù)據(jù)管理五個(gè)模塊;
“治”數(shù)據(jù)是通過工具化方式或者定制化服務(wù),管理解決數(shù)據(jù)流轉(zhuǎn)過程中每個(gè)環(huán)節(jié)產(chǎn)生的問題;包括數(shù)據(jù)整理、數(shù)據(jù)檢測(cè)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)探索、數(shù)據(jù)展現(xiàn)、數(shù)據(jù)發(fā)布、創(chuàng)新應(yīng)用以及數(shù)據(jù)評(píng)估十個(gè)模塊。
所述的數(shù)據(jù)采集是對(duì)政府各級(jí)單位數(shù)據(jù)、政務(wù)服務(wù)網(wǎng)、政務(wù)信息資源目錄平臺(tái)以及公共服務(wù)企業(yè)進(jìn)行采集;
所述的數(shù)據(jù)梳理是對(duì)政府部門業(yè)務(wù)進(jìn)行分析,根據(jù)區(qū)域政府的各委辦單位業(yè)務(wù)模型構(gòu)建梳理信息資源目錄;
所述的數(shù)據(jù)標(biāo)準(zhǔn)是梳理完善政府業(yè)務(wù)模型的數(shù)據(jù)資源目錄后,建設(shè)基于政府業(yè)務(wù)的數(shù)據(jù)管理標(biāo)準(zhǔn)、數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)與數(shù)據(jù)分級(jí)標(biāo)準(zhǔn);
所述的數(shù)據(jù)規(guī)劃設(shè)計(jì)包括業(yè)務(wù)產(chǎn)品規(guī)劃設(shè)計(jì)和數(shù)據(jù)運(yùn)營規(guī)劃設(shè)計(jì),業(yè)務(wù)產(chǎn)品規(guī)劃設(shè)計(jì)包括大數(shù)據(jù)中心、數(shù)據(jù)開放平臺(tái)、數(shù)據(jù)共享平臺(tái)的產(chǎn)品規(guī)劃;數(shù)據(jù)運(yùn)營規(guī)劃設(shè)計(jì)包括內(nèi)容、流量、用戶、產(chǎn)品的運(yùn)營設(shè)計(jì);
所述的數(shù)據(jù)管理是指對(duì)政府?dāng)?shù)據(jù)來源、數(shù)據(jù)編目、數(shù)據(jù)存儲(chǔ)以及數(shù)據(jù)檢索的綜合控制過程。
所述的數(shù)據(jù)采集方式為:webservice接口、數(shù)據(jù)交換、網(wǎng)絡(luò)爬蟲三種方式。
所述的梳理信息資源目錄包括數(shù)據(jù)的開放共享目錄,基礎(chǔ)庫資源目錄和主題庫資源目錄。
所述的數(shù)據(jù)來源是指對(duì)多委辦部門數(shù)據(jù)目錄的把控;數(shù)據(jù)編目是指對(duì)多層級(jí)數(shù)據(jù)目錄進(jìn)行合理編碼;數(shù)據(jù)存儲(chǔ)是對(duì)數(shù)據(jù)倉庫的設(shè)計(jì)與搭建,包括數(shù)據(jù)開放平臺(tái)以及數(shù)據(jù)共享平臺(tái)搭建;數(shù)據(jù)檢索是對(duì)多類政府?dāng)?shù)據(jù)的全文檢索能力。
所述的數(shù)據(jù)整理是對(duì)多源多類型數(shù)據(jù)的預(yù)處理過程,對(duì)非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化管理,對(duì)原始數(shù)據(jù)的分析化管理;對(duì)原始數(shù)據(jù)中存在時(shí)間屬性的提供定制化存儲(chǔ)方式,對(duì)原始數(shù)據(jù)中存在地理空間屬性的提供坐標(biāo)化轉(zhuǎn)換處理;
所述的數(shù)據(jù)檢測(cè)包括數(shù)據(jù)質(zhì)量檢測(cè)和數(shù)據(jù)沖突檢測(cè);數(shù)據(jù)質(zhì)量檢測(cè)是按設(shè)定規(guī)則對(duì)數(shù)據(jù)質(zhì)量的評(píng)估;數(shù)據(jù)沖突檢測(cè)要求針對(duì)數(shù)據(jù)中的重復(fù)數(shù)據(jù)、不同數(shù)據(jù)集中的重復(fù)數(shù)據(jù)進(jìn)行匹配和排除的操作,以避免數(shù)據(jù)差異和數(shù)據(jù)沖突的產(chǎn)生;
所述的數(shù)據(jù)質(zhì)量是通過數(shù)據(jù)清洗與數(shù)據(jù)加工完成對(duì)數(shù)據(jù)質(zhì)量的把控;數(shù)據(jù)質(zhì)量是基于數(shù)據(jù)檢測(cè)的結(jié)果對(duì)數(shù)據(jù)質(zhì)量做的提升工作方法包括對(duì)空缺值處理、違規(guī)值處理、噪聲值處理;數(shù)據(jù)加工要求在不改變數(shù)據(jù)內(nèi)容和數(shù)據(jù)邏輯的前提下進(jìn)行;數(shù)據(jù)加工主要功能是數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)拆分合并;
所述的數(shù)據(jù)安全分為數(shù)據(jù)脫敏與數(shù)據(jù)溯源;數(shù)據(jù)脫敏又稱數(shù)據(jù)漂白、數(shù)據(jù)去隱私化或數(shù)據(jù)變形,是指對(duì)某些敏感信息通過脫敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù);數(shù)據(jù)溯源是對(duì)數(shù)據(jù)的來源進(jìn)行記錄,對(duì)數(shù)據(jù)采集、加工和裝載過程中產(chǎn)生的元數(shù)據(jù)實(shí)時(shí)記錄到數(shù)據(jù)庫中,追溯單節(jié)點(diǎn)與相關(guān)節(jié)點(diǎn)的邏輯關(guān)系;
所述的數(shù)據(jù)分析是指運(yùn)用多種統(tǒng)計(jì)方法對(duì)數(shù)據(jù)進(jìn)行有目標(biāo)的剖析并且進(jìn)行數(shù)據(jù)解釋的過程;
所述的數(shù)據(jù)探索通過數(shù)據(jù)關(guān)聯(lián)、碰撞、比對(duì)的工具化手段完成在海量數(shù)據(jù)資源里挖掘數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系;
所述的數(shù)據(jù)展現(xiàn)根據(jù)應(yīng)用形式不同提供多樣的數(shù)據(jù)展現(xiàn)服務(wù),包括html5應(yīng)用開發(fā)、web應(yīng)用開發(fā)、可視化交互開發(fā)、數(shù)字大屏開發(fā)、安卓或ios客戶端開發(fā);根據(jù)數(shù)據(jù)內(nèi)容不同提供圖表、時(shí)間序列圖、地圖、流程圖、矩陣、網(wǎng)狀關(guān)系圖、信息圖的可視化數(shù)據(jù)方案;
所述的數(shù)據(jù)發(fā)布提供定制化的數(shù)據(jù)下載服務(wù)和數(shù)據(jù)接口服務(wù);
所述的創(chuàng)新應(yīng)用提供政府四大基礎(chǔ)庫的建設(shè);整合政府多源多維度數(shù)據(jù),提供民生熱點(diǎn)問題創(chuàng)新應(yīng)用;
所述的數(shù)據(jù)評(píng)估提供對(duì)區(qū)域政府?dāng)?shù)據(jù)開放水平體系和方法的評(píng)估服務(wù),對(duì)每個(gè)信息維度設(shè)置具體的評(píng)價(jià)指標(biāo),按照標(biāo)準(zhǔn)對(duì)各個(gè)指標(biāo)項(xiàng)評(píng)估。
所述的數(shù)據(jù)探索分為三個(gè)步驟:數(shù)據(jù)篩選、模型選擇、數(shù)據(jù)解釋。
所述的數(shù)據(jù)脫敏的規(guī)則存在可恢復(fù)與不可恢復(fù)兩類。
所述的信息維度為:綜合政府扶持力度、開放門戶網(wǎng)站建設(shè)、開放數(shù)據(jù)質(zhì)量三個(gè)。
本發(fā)明的一種基于政府?dāng)?shù)據(jù)的綜合治理服務(wù)的方法和現(xiàn)有技術(shù)相比,具有以下特點(diǎn):
1)打破數(shù)據(jù)孤島,推動(dòng)政府開放數(shù)據(jù);
2)理清政府?dāng)?shù)據(jù)資產(chǎn),消除政府?dāng)?shù)據(jù)不一致性;
3)政府?dāng)?shù)據(jù)有統(tǒng)一的統(tǒng)籌設(shè)計(jì)與規(guī)范標(biāo)準(zhǔn);
4)保障政府?dāng)?shù)據(jù)安全,彌補(bǔ)數(shù)據(jù)管理漏洞;
5)提高政府?dāng)?shù)據(jù)質(zhì)量,提升政府決策能力;
6)增強(qiáng)政府對(duì)數(shù)據(jù)分析、探索、可視化綜合能力;
7)豐富政府?dāng)?shù)據(jù)應(yīng)用形式,完善數(shù)據(jù)開放評(píng)估體系。
附圖說明
附圖1為一種基于政府?dāng)?shù)據(jù)的綜合治理服務(wù)的方法的數(shù)據(jù)治理架構(gòu)圖;
附圖2為一種基于政府?dāng)?shù)據(jù)的綜合治理服務(wù)的方法的“理”數(shù)據(jù)模型圖;
附圖3為一種基于政府?dāng)?shù)據(jù)的綜合治理服務(wù)的方法的“治”數(shù)據(jù)模型圖。
具體實(shí)施方式
實(shí)施例1:
該基于政府?dāng)?shù)據(jù)的綜合治理服務(wù)的方法由“理”數(shù)據(jù)和“治”數(shù)據(jù)兩部分實(shí)現(xiàn),其中“理”數(shù)據(jù)為基礎(chǔ),“治”數(shù)據(jù)為手段;
“理”數(shù)據(jù)是對(duì)政府?dāng)?shù)據(jù)進(jìn)行有序標(biāo)準(zhǔn)化的規(guī)劃設(shè)計(jì),對(duì)政府所掌握的數(shù)據(jù)資產(chǎn)的梳理;包括數(shù)據(jù)采集、數(shù)據(jù)梳理、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)規(guī)劃設(shè)計(jì)、數(shù)據(jù)管理五個(gè)模塊;
所述的數(shù)據(jù)采集是對(duì)政府各級(jí)單位數(shù)據(jù)、政務(wù)服務(wù)網(wǎng)、政務(wù)信息資源目錄平臺(tái)以及公共服務(wù)企業(yè)進(jìn)行采集;數(shù)據(jù)采集方式為:webservice接口、數(shù)據(jù)交換、網(wǎng)絡(luò)爬蟲三種方式;
所述的數(shù)據(jù)梳理是對(duì)政府部門業(yè)務(wù)進(jìn)行分析,根據(jù)區(qū)域政府的各委辦單位業(yè)務(wù)模型構(gòu)建梳理信息資源目錄;包括數(shù)據(jù)的開放共享目錄,基礎(chǔ)庫資源目錄和主題庫資源目錄;
所述的數(shù)據(jù)標(biāo)準(zhǔn)是梳理完善政府業(yè)務(wù)模型的數(shù)據(jù)資源目錄后,建設(shè)基于政府業(yè)務(wù)的數(shù)據(jù)管理標(biāo)準(zhǔn)、數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)與數(shù)據(jù)分級(jí)標(biāo)準(zhǔn);
所述的數(shù)據(jù)規(guī)劃設(shè)計(jì)包括業(yè)務(wù)產(chǎn)品規(guī)劃設(shè)計(jì)和數(shù)據(jù)運(yùn)營規(guī)劃設(shè)計(jì),業(yè)務(wù)產(chǎn)品規(guī)劃設(shè)計(jì)包括大數(shù)據(jù)中心、數(shù)據(jù)開放平臺(tái)、數(shù)據(jù)共享平臺(tái)的產(chǎn)品規(guī)劃;數(shù)據(jù)運(yùn)營規(guī)劃設(shè)計(jì)包括內(nèi)容、流量、用戶、產(chǎn)品的運(yùn)營設(shè)計(jì);
所述的數(shù)據(jù)管理是指對(duì)政府?dāng)?shù)據(jù)來源、數(shù)據(jù)編目、數(shù)據(jù)存儲(chǔ)以及數(shù)據(jù)檢索的綜合控制過程;所述的數(shù)據(jù)來源是指對(duì)多委辦部門數(shù)據(jù)目錄的把控;數(shù)據(jù)編目是指對(duì)多層級(jí)數(shù)據(jù)目錄進(jìn)行合理編碼;數(shù)據(jù)存儲(chǔ)是對(duì)數(shù)據(jù)倉庫的設(shè)計(jì)與搭建,包括數(shù)據(jù)開放平臺(tái)以及數(shù)據(jù)共享平臺(tái)搭建;數(shù)據(jù)檢索是對(duì)多類政府?dāng)?shù)據(jù)的全文檢索能力。
“治”數(shù)據(jù)是通過工具化方式或者定制化服務(wù),管理解決數(shù)據(jù)流轉(zhuǎn)過程中每個(gè)環(huán)節(jié)產(chǎn)生的問題;包括數(shù)據(jù)整理、數(shù)據(jù)檢測(cè)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)探索、數(shù)據(jù)展現(xiàn)、數(shù)據(jù)發(fā)布、創(chuàng)新應(yīng)用以及數(shù)據(jù)評(píng)估十個(gè)模塊。
所述的數(shù)據(jù)整理是對(duì)多源多類型數(shù)據(jù)的預(yù)處理過程,對(duì)非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化管理,對(duì)原始數(shù)據(jù)的分析化管理;對(duì)原始數(shù)據(jù)中存在時(shí)間屬性的提供定制化存儲(chǔ)方式,對(duì)原始數(shù)據(jù)中存在地理空間屬性的提供坐標(biāo)化轉(zhuǎn)換處理;
所述的數(shù)據(jù)檢測(cè)包括數(shù)據(jù)質(zhì)量檢測(cè)和數(shù)據(jù)沖突檢測(cè);數(shù)據(jù)質(zhì)量檢測(cè)是按設(shè)定規(guī)則對(duì)數(shù)據(jù)質(zhì)量的評(píng)估;數(shù)據(jù)沖突檢測(cè)要求針對(duì)數(shù)據(jù)中的重復(fù)數(shù)據(jù)、不同數(shù)據(jù)集中的重復(fù)數(shù)據(jù)進(jìn)行匹配和排除的操作,以避免數(shù)據(jù)差異和數(shù)據(jù)沖突的產(chǎn)生;
所述的數(shù)據(jù)質(zhì)量是通過數(shù)據(jù)清洗與數(shù)據(jù)加工完成對(duì)數(shù)據(jù)質(zhì)量的把控;數(shù)據(jù)質(zhì)量是基于數(shù)據(jù)檢測(cè)的結(jié)果對(duì)數(shù)據(jù)質(zhì)量做的提升工作方法包括對(duì)空缺值處理、違規(guī)值處理、噪聲值處理;數(shù)據(jù)加工要求在不改變數(shù)據(jù)內(nèi)容和數(shù)據(jù)邏輯的前提下進(jìn)行;數(shù)據(jù)加工主要功能是數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)拆分合并;
所述的數(shù)據(jù)安全分為數(shù)據(jù)脫敏與數(shù)據(jù)溯源;數(shù)據(jù)脫敏又稱數(shù)據(jù)漂白、數(shù)據(jù)去隱私化或數(shù)據(jù)變形,所述的數(shù)據(jù)脫敏的規(guī)則存在可恢復(fù)與不可恢復(fù)兩類,是指對(duì)某些敏感信息通過脫敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù);數(shù)據(jù)溯源是對(duì)數(shù)據(jù)的來源進(jìn)行記錄,對(duì)數(shù)據(jù)采集、加工和裝載過程中產(chǎn)生的元數(shù)據(jù)實(shí)時(shí)記錄到數(shù)據(jù)庫中,追溯單節(jié)點(diǎn)與相關(guān)節(jié)點(diǎn)的邏輯關(guān)系;
所述的數(shù)據(jù)分析是指運(yùn)用多種統(tǒng)計(jì)方法對(duì)數(shù)據(jù)進(jìn)行有目標(biāo)的剖析并且進(jìn)行數(shù)據(jù)解釋的過程;
所述的數(shù)據(jù)探索通過數(shù)據(jù)關(guān)聯(lián)、碰撞、比對(duì)的工具化手段完成在海量數(shù)據(jù)資源里挖掘數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系;所述的數(shù)據(jù)探索分為三個(gè)步驟:數(shù)據(jù)篩選、模型選擇、數(shù)據(jù)解釋。
所述的數(shù)據(jù)展現(xiàn)根據(jù)應(yīng)用形式不同提供多樣的數(shù)據(jù)展現(xiàn)服務(wù),包括html5應(yīng)用開發(fā)、web應(yīng)用開發(fā)、可視化交互開發(fā)、數(shù)字大屏開發(fā)、安卓或ios客戶端開發(fā);根據(jù)數(shù)據(jù)內(nèi)容不同提供圖表、時(shí)間序列圖、地圖、流程圖、矩陣、網(wǎng)狀關(guān)系圖、信息圖的可視化數(shù)據(jù)方案;
所述的數(shù)據(jù)發(fā)布提供定制化的數(shù)據(jù)下載服務(wù)和數(shù)據(jù)接口服務(wù);
所述的創(chuàng)新應(yīng)用提供政府四大基礎(chǔ)庫(人口、法人、自然資源與空間地理、宏觀經(jīng)濟(jì))的建設(shè);整合政府多源多維度數(shù)據(jù),提供如房產(chǎn)樓盤、餐飲企業(yè)、學(xué)區(qū)地圖、意見反饋等多類民生熱點(diǎn)問題創(chuàng)新應(yīng)用;
所述的數(shù)據(jù)評(píng)估提供對(duì)區(qū)域政府?dāng)?shù)據(jù)開放水平體系和方法的評(píng)估服務(wù),對(duì)每個(gè)信息維度設(shè)置具體的評(píng)價(jià)指標(biāo),按照標(biāo)準(zhǔn)對(duì)各個(gè)指標(biāo)項(xiàng)評(píng)估;所述的信息維度為:綜合政府扶持力度、開放門戶網(wǎng)站建設(shè)、開放數(shù)據(jù)質(zhì)量三個(gè)。
通過上面具體實(shí)施方式,所述技術(shù)領(lǐng)域的技術(shù)人員可容易的實(shí)現(xiàn)本發(fā)明。但是應(yīng)當(dāng)理解,本發(fā)明并不限于上述的幾種具體實(shí)施方式。在公開的實(shí)施方式的基礎(chǔ)上,所述技術(shù)領(lǐng)域的技術(shù)人員可任意組合不同的技術(shù)特征,從而實(shí)現(xiàn)不同的技術(shù)方案。