本發(fā)明有關(guān)于一種實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析系統(tǒng)與方法。
背景技術(shù):
:關(guān)于串流數(shù)據(jù)的紀(jì)錄或分析系統(tǒng)與方法,已存在若干種現(xiàn)有技術(shù),然而其各自有其力有未逮的短處。首先,目前已存在一種跨層日志記錄追蹤系統(tǒng)與方法可以取得不同的日志數(shù)據(jù)源,紀(jì)錄大量的日志數(shù)據(jù)和存取軌跡,并且作為犯罪追查的用途。然而,此方法雖然可可以紀(jì)錄日志數(shù)據(jù),但卻無(wú)法對(duì)紀(jì)錄進(jìn)行分析,以及產(chǎn)制分析結(jié)果供管理者參考。關(guān)于日志數(shù)據(jù)記錄方法,是一種實(shí)時(shí)針對(duì)指定影像進(jìn)行壓縮和儲(chǔ)存日志數(shù)據(jù)的方法;然而,其雖然可以紀(jì)錄日志數(shù)據(jù),也無(wú)法對(duì)紀(jì)錄進(jìn)行分析及產(chǎn)制分析結(jié)果。最后,現(xiàn)存一種計(jì)量通訊網(wǎng)絡(luò)流量方法,是可以側(cè)錄方式紀(jì)錄封包,并適應(yīng)不同種類的封包進(jìn)行紀(jì)錄,但相同的,分析及產(chǎn)制分析結(jié)果供管理者參考同樣是無(wú)法透過此方法達(dá)成。故應(yīng)可知提供一種可以分析且產(chǎn)制結(jié)果,并非僅有紀(jì)錄的實(shí)時(shí)串流數(shù)據(jù)系統(tǒng),是此領(lǐng)域所急需的技術(shù)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明提供一種實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析系統(tǒng),包含:一紀(jì)錄數(shù)據(jù)搜集裝置,與外部在線網(wǎng)頁(yè)服務(wù)器或外部在線數(shù)據(jù)庫(kù)服務(wù)器連接,并依據(jù)格式解析被儲(chǔ)存于外部在線網(wǎng)頁(yè)服務(wù)器或外部在線數(shù)據(jù)庫(kù)服務(wù)器中的外部多個(gè)使用者透過各自用戶設(shè)備發(fā)出的網(wǎng)絡(luò)服務(wù)要求以及被回復(fù)紀(jì)錄;多個(gè)分布式數(shù)據(jù)庫(kù),是用以儲(chǔ)存經(jīng)該紀(jì)錄數(shù)據(jù)搜集裝置解析后的用戶網(wǎng)絡(luò)服務(wù)要求與回復(fù)紀(jì)錄;一快取數(shù)據(jù)庫(kù),是用以提供快速先行暫存以加速運(yùn)算進(jìn)程的設(shè)備;一數(shù)據(jù)探勘主模塊,包含有多個(gè)探勘子模塊且個(gè)別提供模塊化的相異算法和演算邏輯用以進(jìn)行運(yùn)算和分析;一紀(jì)錄數(shù)據(jù)分析模塊,與外部管理者設(shè)備連接,該紀(jì)錄數(shù)據(jù)分析模塊是由管理者操控或自主聯(lián)機(jī)至該數(shù)據(jù)探勘主模塊并選定合適的探勘子模塊,并指派進(jìn)行運(yùn)算任務(wù)的設(shè)備;至少一分布式計(jì)算裝置,各該分布式計(jì)算裝置自各該分布式數(shù)據(jù)庫(kù)獲取用戶網(wǎng)絡(luò)服務(wù)要求與回復(fù)紀(jì)錄并依據(jù)被該紀(jì)錄數(shù)據(jù)分析模塊所選定的探勘子模塊以及被指派的運(yùn)算任務(wù)以分派給其內(nèi)部運(yùn)算模塊分別執(zhí)行,并將所獲取的運(yùn)算及分析計(jì)算結(jié)果暫存于該快取數(shù)據(jù)庫(kù);以及一組合節(jié)點(diǎn)裝置,自該分布式計(jì)算裝置中的各節(jié)點(diǎn)設(shè)備以及各分布式計(jì)算模塊擷取并整合產(chǎn)生一分析結(jié)果,再將該分析結(jié)果回傳紀(jì)錄數(shù)據(jù)分析模塊。其中,該紀(jì)錄數(shù)據(jù)搜集裝置將通過至少一私鑰、一公鑰以及一任意整數(shù)值來(lái)對(duì)網(wǎng)絡(luò)服務(wù)要求以及回復(fù)紀(jì)錄數(shù)據(jù)進(jìn)行加密,而各該分布式計(jì)算裝置則直接對(duì)密文狀態(tài)的網(wǎng)絡(luò)服務(wù)要求以及回復(fù)紀(jì)錄數(shù)據(jù)進(jìn)行計(jì)算并產(chǎn)生運(yùn)算結(jié)果,該組合節(jié)點(diǎn)裝置具備相對(duì)應(yīng)的各該私鑰、該公鑰以及該任意整數(shù)值對(duì)該分析結(jié)果進(jìn)行解密。其中,該數(shù)據(jù)探勘主模塊還包含:一最近鄰居探勘子模塊,是以k最近鄰居法(k-nearestneighborsmethod)的邏輯進(jìn)行演算的分布式計(jì)算模塊;以及一多元線性回歸探勘子模塊,是以多元線性回歸(multifactorlineregressionmethod)的邏輯進(jìn)行演算的分布式計(jì)算模塊。其中,各該分布式計(jì)算裝置還各自包含:多個(gè)節(jié)點(diǎn)設(shè)備,依據(jù)該紀(jì)錄數(shù)據(jù)分析模塊選定的探勘子模塊指派給多個(gè)分布式計(jì)算模塊,多個(gè)節(jié)點(diǎn)設(shè)備并向各該分布式數(shù)據(jù)庫(kù)獲取紀(jì)錄數(shù)據(jù)且進(jìn)行分派,其中,各該分布式計(jì)算模塊依據(jù)探勘子模塊的運(yùn)算進(jìn)程進(jìn)行運(yùn)算及分析紀(jì)錄數(shù)據(jù)。本發(fā)明提出一種實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析系統(tǒng)是由系統(tǒng)外部的多個(gè)使用者設(shè)備、多個(gè)在線網(wǎng)頁(yè)服務(wù)器、多個(gè)在線數(shù)據(jù)庫(kù)服務(wù)器以及多個(gè)管理者設(shè)備,以及本發(fā)明的系統(tǒng)內(nèi)部的一紀(jì)錄數(shù)據(jù)搜集裝置、多個(gè)分布式數(shù)據(jù)庫(kù)、一紀(jì)錄數(shù)據(jù)分析模塊、一數(shù)據(jù)探勘主模塊、一分布式計(jì)算裝置、一快取數(shù)據(jù)庫(kù)、以及一組合節(jié)點(diǎn)裝置構(gòu)成。多個(gè)外部使用者設(shè)備,使用者可操作這些使用者設(shè)備聯(lián)機(jī)至在線網(wǎng)頁(yè)服務(wù)器,以向在線網(wǎng)頁(yè)服務(wù)器要求網(wǎng)絡(luò)服務(wù)和相關(guān)信息與應(yīng)用。多個(gè)外部在線網(wǎng)頁(yè)服務(wù)器,主要依用戶設(shè)備傳送的網(wǎng)絡(luò)服務(wù)要求向在線數(shù)據(jù)庫(kù)服務(wù)器存取所需相關(guān)數(shù)據(jù)后提供網(wǎng)絡(luò)服務(wù)和相關(guān)信息給外部用戶設(shè)備,其也針對(duì)所有網(wǎng)絡(luò)服務(wù)要求進(jìn)行紀(jì)錄并將網(wǎng)絡(luò)服務(wù)使用紀(jì)錄傳送至紀(jì)錄數(shù)據(jù)處理設(shè)備進(jìn)行解析和儲(chǔ)存。多個(gè)外部在線數(shù)據(jù)庫(kù)服務(wù)器設(shè)備:在線數(shù)據(jù)庫(kù)服務(wù)器設(shè)備可接收在線網(wǎng)頁(yè)服務(wù)器設(shè)備的數(shù)據(jù)庫(kù)操作要求,并依其要求回復(fù)相關(guān)信息。并且針對(duì)每個(gè)數(shù)據(jù)庫(kù)操作要求進(jìn)行紀(jì)錄,并可將數(shù)據(jù)庫(kù)操作紀(jì)錄傳送至紀(jì)錄數(shù)據(jù)搜集裝置進(jìn)行解析和儲(chǔ)存。一紀(jì)錄數(shù)據(jù)搜集裝置,用以解析來(lái)自在線網(wǎng)頁(yè)服務(wù)器和在線數(shù)據(jù)庫(kù)服務(wù)器的紀(jì)錄并依其紀(jì)錄的格式進(jìn)行解析后分別儲(chǔ)存至分布式數(shù)據(jù)庫(kù)中,紀(jì)錄數(shù)據(jù)搜集裝置也可選擇性的具備加密功能,其包含有至少一私鑰、至少一公鑰、至少一任意整數(shù)值,即是解析后再透過上述三者以對(duì)數(shù)據(jù)進(jìn)行加密后再儲(chǔ)存至分布式數(shù)據(jù)庫(kù)中。多個(gè)分布式數(shù)據(jù)庫(kù)主要可儲(chǔ)存經(jīng)解析后的網(wǎng)絡(luò)服務(wù)使用紀(jì)錄和數(shù)據(jù)庫(kù)操作紀(jì)錄,當(dāng)分布式計(jì)算裝置進(jìn)行分布式計(jì)算和紀(jì)錄分析時(shí),提供紀(jì)錄數(shù)據(jù)供分布式計(jì)算裝置運(yùn)算。多個(gè)外部管理者設(shè)備,管理者操作管理者設(shè)備聯(lián)機(jī)至紀(jì)錄數(shù)據(jù)分析模塊,并經(jīng)紀(jì)錄數(shù)據(jù)分析模塊聯(lián)機(jī)至數(shù)據(jù)探勘主模塊以選擇適合的探勘子模塊,再指派予分布式計(jì)算裝置進(jìn)行運(yùn)算。一紀(jì)錄數(shù)據(jù)分析模塊,由管理者手動(dòng)或自動(dòng)聯(lián)機(jī)至數(shù)據(jù)主探勘模塊并選擇其下適合的探勘子模塊,再指派予分布式計(jì)算裝置進(jìn)行運(yùn)算,紀(jì)錄數(shù)據(jù)分析模塊并可向組合節(jié)點(diǎn)裝置取得運(yùn)算結(jié)果。一數(shù)據(jù)主探勘模塊,可包含多個(gè)探勘子模塊以供分布式計(jì)算裝置進(jìn)行運(yùn)算和分析。多個(gè)分布式計(jì)算裝置,可向分布式數(shù)據(jù)庫(kù)取得紀(jì)錄數(shù)據(jù),并依選定的數(shù)據(jù)探勘模塊進(jìn)行指派任務(wù)給多個(gè)節(jié)點(diǎn)設(shè)備和分布式計(jì)算模塊,分別進(jìn)行運(yùn)算和分析,分布式計(jì)算裝置并可將計(jì)算結(jié)果暫存于快取數(shù)據(jù)庫(kù),分布式計(jì)算裝置也可選擇性的具有密文計(jì)算的功能,用以對(duì)密文數(shù)據(jù)進(jìn)行運(yùn)算。多個(gè)快取數(shù)據(jù)庫(kù),用以儲(chǔ)存分布式計(jì)算裝置暫存各個(gè)紀(jì)錄數(shù)據(jù)的要求分析運(yùn)算結(jié)果或相關(guān)參數(shù),以作日后加速運(yùn)算應(yīng)用。一組合節(jié)點(diǎn)裝置,用以擷取分布式計(jì)算裝置各個(gè)運(yùn)算結(jié)果以進(jìn)行整合和分析,再將分析結(jié)果回傳予紀(jì)錄數(shù)據(jù)分析模塊,相同地,組合節(jié)點(diǎn)裝置也可額外配備解密功能,其具備有與紀(jì)錄數(shù)據(jù)搜集裝置相對(duì)應(yīng)的各該私鑰、該公鑰以及該任意整數(shù)值,才可對(duì)經(jīng)分布式計(jì)算裝置密文計(jì)算得出的結(jié)果進(jìn)行解密,解密后提供明文數(shù)據(jù)回傳至紀(jì)錄數(shù)據(jù)分析模塊。本發(fā)明的實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析方法,其主要步驟包含下述的六步驟。紀(jì)錄在線數(shù)據(jù)步驟:一紀(jì)錄數(shù)據(jù)搜集裝置將自外部在線網(wǎng)頁(yè)服務(wù)器和外部在線數(shù)據(jù)庫(kù)服務(wù)器中搜集并儲(chǔ)存外部多個(gè)用戶發(fā)出的網(wǎng)絡(luò)服務(wù)要求以及回復(fù)紀(jì)錄。存入分布式數(shù)據(jù)庫(kù)步驟:紀(jì)錄數(shù)據(jù)搜集裝置將前述網(wǎng)絡(luò)服務(wù)要求以及回復(fù)紀(jì)錄儲(chǔ)存至多個(gè)分布式數(shù)據(jù)庫(kù)。選擇數(shù)據(jù)探勘模塊步驟:外部管理者與一紀(jì)錄數(shù)據(jù)分析模塊連接,以經(jīng)由該紀(jì)錄數(shù)據(jù)分析模塊對(duì)一數(shù)據(jù)探勘主模塊進(jìn)行請(qǐng)求自多個(gè)探勘子模塊中選擇以使用。指派工作予分布式計(jì)算裝置步驟:該數(shù)據(jù)探勘主模塊將按照外部管理者選擇的探勘子模塊以指派多個(gè)分布式計(jì)算裝置對(duì)用戶網(wǎng)絡(luò)服務(wù)要求與回復(fù)紀(jì)錄進(jìn)行運(yùn)算。暫存至快取數(shù)據(jù)庫(kù)裝置步驟:各該分布式計(jì)算裝置產(chǎn)出的運(yùn)算結(jié)果將被暫存至一快取數(shù)據(jù)庫(kù),以備未來(lái)分析使用?;貍髋c顯示運(yùn)算結(jié)果:與各該分布式計(jì)算裝置連接的一組合節(jié)點(diǎn)裝置將運(yùn)算結(jié)果整合成一分析結(jié)果,并透過該紀(jì)錄數(shù)據(jù)分析模塊傳輸至外部管理者設(shè)備以呈現(xiàn)該分析結(jié)果予外部使用者。而本發(fā)明的實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析方法也具備加解密的功能,其中,該紀(jì)錄數(shù)據(jù)搜集裝置將通過至少一私鑰、一公鑰以及一任意整數(shù)值來(lái)對(duì)網(wǎng)絡(luò)服務(wù)要求以及回復(fù)紀(jì)錄數(shù)據(jù)進(jìn)行加密,而各該分布式計(jì)算裝置則直接對(duì)密文狀態(tài)的網(wǎng)絡(luò)服務(wù)要求以及回復(fù)紀(jì)錄數(shù)據(jù)進(jìn)行計(jì)算并產(chǎn)生運(yùn)算結(jié)果,該組合節(jié)點(diǎn)裝置具備相對(duì)應(yīng)的各該私鑰、該公鑰以及該任意整數(shù)值對(duì)該分析結(jié)果進(jìn)行解密提供給外部管理者。綜上所述,可知本發(fā)明的實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析系統(tǒng)與方法可實(shí)時(shí)紀(jì)錄及解析在線網(wǎng)絡(luò)服務(wù)要求紀(jì)錄數(shù)據(jù)和數(shù)據(jù)庫(kù)操作紀(jì)錄數(shù)據(jù),也可透過選擇不同的數(shù)據(jù)探勘子模塊以進(jìn)行紀(jì)錄數(shù)據(jù)分析。本發(fā)明更結(jié)合分布式計(jì)算裝置和分布式數(shù)據(jù)庫(kù),以實(shí)時(shí)進(jìn)行分布式計(jì)算,而額外的快取數(shù)據(jù)庫(kù),則提供暫存分布式計(jì)算裝置的運(yùn)算結(jié)果和相關(guān)參數(shù),以提升往后的分析效率。且本發(fā)明可選擇性的利用加解密方法,以將數(shù)據(jù)加密后再儲(chǔ)存至分布式數(shù)據(jù)庫(kù),使數(shù)據(jù)安全性得以確保,并且也可以于資料處于密文狀態(tài)下進(jìn)行運(yùn)算,令運(yùn)算效率更提升。附圖說明圖1為本發(fā)明實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析系統(tǒng)架構(gòu)圖。圖2為本發(fā)明實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)含加解密分析方法的方法步驟圖。附圖標(biāo)記說明:101使用者設(shè)備102在線網(wǎng)頁(yè)服務(wù)器103在線數(shù)據(jù)庫(kù)服務(wù)器104管理者設(shè)備105紀(jì)錄數(shù)據(jù)搜集裝置106分布式數(shù)據(jù)庫(kù)107紀(jì)錄數(shù)據(jù)分析模塊108數(shù)據(jù)探勘主模塊109分布式計(jì)算裝置110快取數(shù)據(jù)庫(kù)111組合節(jié)點(diǎn)裝置1081最近鄰居探勘子模塊1082多元加權(quán)線性回歸探勘子模塊s201~s208方法步驟。具體實(shí)施方式以下將以實(shí)施例結(jié)合圖式對(duì)本發(fā)明進(jìn)行進(jìn)一步說明,有鑒于對(duì)實(shí)時(shí)而大量數(shù)據(jù)運(yùn)算以及分析的需求提升,本發(fā)明即提供一種實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析系統(tǒng),本發(fā)明的運(yùn)作所需整體系統(tǒng)的架構(gòu)如下,如圖1所示:系統(tǒng)外部的多個(gè)使用者設(shè)備101、多個(gè)在線網(wǎng)頁(yè)服務(wù)器102、多個(gè)在線數(shù)據(jù)庫(kù)服務(wù)器103以及多個(gè)管理者設(shè)備104,以及本發(fā)明的系統(tǒng)內(nèi)部的一紀(jì)錄數(shù)據(jù)搜集裝置105、多個(gè)分布式數(shù)據(jù)庫(kù)106、一紀(jì)錄數(shù)據(jù)分析模塊107、一數(shù)據(jù)探勘主模塊108、多個(gè)分布式計(jì)算裝置109、一快取數(shù)據(jù)庫(kù)110、以及一組合節(jié)點(diǎn)裝置111組成,而數(shù)據(jù)探勘主模塊108更可包含一最近鄰居探勘子模塊1081以及一多元加權(quán)線性回歸探勘子模塊1082。其中,本發(fā)明的紀(jì)錄數(shù)據(jù)搜集裝置是可運(yùn)用splunk或logstash等工具實(shí)施,其是用以收集在線網(wǎng)頁(yè)服務(wù)器和在線數(shù)據(jù)庫(kù)服務(wù)器傳輸而來(lái)的紀(jì)錄數(shù)據(jù)。而本發(fā)明的分布式數(shù)據(jù)庫(kù)可結(jié)合nosql基礎(chǔ)的hbase或mongodb進(jìn)行開發(fā),其功能是為可較永久的儲(chǔ)存紀(jì)錄數(shù)據(jù)搜集裝置傳來(lái)的相關(guān)紀(jì)錄數(shù)據(jù)。而本發(fā)明分布式計(jì)算裝置是運(yùn)用hadoop或mongodb中的mapreduce開發(fā)模型以高效地將數(shù)據(jù)進(jìn)行分割以及合并,可大幅提升運(yùn)算分析速度。另外,本發(fā)明更設(shè)置有快取數(shù)據(jù)庫(kù),用以因應(yīng)實(shí)時(shí)大量數(shù)據(jù)運(yùn)算的負(fù)載需求,可同時(shí)搜集各異類數(shù)據(jù)來(lái)源且進(jìn)行實(shí)時(shí)分析和運(yùn)算,并可避免重復(fù)運(yùn)算并將數(shù)據(jù)回饋予外部管理者。更詳細(xì)來(lái)說,前述本發(fā)明的實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析系統(tǒng)各部分可解釋如下:外部多個(gè)使用者設(shè)備:所述用戶設(shè)備得為個(gè)人計(jì)算機(jī)、平板、智能型手機(jī)、個(gè)人數(shù)字助理、車載設(shè)備等電子裝置,該些裝置可運(yùn)用設(shè)置于其上的瀏覽器組件(如internetexplorer、chrome、firefox、safari等瀏覽器)或其他可與網(wǎng)絡(luò)聯(lián)機(jī)的應(yīng)用程序以聯(lián)機(jī)至在線網(wǎng)頁(yè)服務(wù)器,并透過在線網(wǎng)頁(yè)服務(wù)器提出網(wǎng)絡(luò)服務(wù)要求和信息應(yīng)用需求。外部多個(gè)在線網(wǎng)頁(yè)服務(wù)器:該些在線網(wǎng)頁(yè)服務(wù)器可透過微軟internetinformationservices(iis)、apache等網(wǎng)頁(yè)服務(wù)器組件進(jìn)行開發(fā),以架設(shè)提供多種網(wǎng)絡(luò)服務(wù)功能的網(wǎng)頁(yè)提供外部用戶進(jìn)行操作,在線網(wǎng)頁(yè)服務(wù)器可依外部用戶設(shè)備傳送來(lái)的網(wǎng)絡(luò)服務(wù)要求和信息應(yīng)用需求以向在線數(shù)據(jù)庫(kù)服務(wù)器獲取被要求的數(shù)據(jù)后,再提供相對(duì)應(yīng)的網(wǎng)絡(luò)服務(wù)和信息至外部用戶設(shè)備,而在線網(wǎng)頁(yè)服務(wù)器也會(huì)紀(jì)錄每個(gè)網(wǎng)絡(luò)服務(wù)要求,可依據(jù)服務(wù)器組件分別儲(chǔ)存網(wǎng)絡(luò)服務(wù)使用紀(jì)錄數(shù)據(jù)(如iislog或apachelog)且將網(wǎng)絡(luò)服務(wù)使用紀(jì)錄數(shù)據(jù)傳送至紀(jì)錄數(shù)據(jù)搜集裝置進(jìn)行解析并儲(chǔ)存。多個(gè)在線數(shù)據(jù)庫(kù)服務(wù)器:在線數(shù)據(jù)庫(kù)服務(wù)器設(shè)備得運(yùn)用微軟sqlserver、mysql、oracledb、ibmdb2、postgresql等數(shù)據(jù)庫(kù)服務(wù)器組件進(jìn)行實(shí)作開發(fā),并提供各種數(shù)據(jù)庫(kù)操作方法(至少包含有新增、修改、刪除、查詢等)以令在線網(wǎng)頁(yè)服務(wù)器得以存??;可接收在線網(wǎng)頁(yè)服務(wù)器設(shè)備的數(shù)據(jù)庫(kù)操作要求,并依其要求回復(fù)相關(guān)信息。并且針對(duì)每個(gè)數(shù)據(jù)庫(kù)操作要求進(jìn)行紀(jì)錄,并可分別依不同的數(shù)據(jù)庫(kù)組件產(chǎn)生數(shù)據(jù)庫(kù)操作紀(jì)錄,且將數(shù)據(jù)庫(kù)操作紀(jì)錄傳送至紀(jì)錄數(shù)據(jù)處理設(shè)備進(jìn)行解析和儲(chǔ)存。一紀(jì)錄數(shù)據(jù)搜集裝置:紀(jì)錄數(shù)據(jù)搜集裝置得運(yùn)用splunk、logstash等紀(jì)錄和解析組件進(jìn)行實(shí)作開發(fā),并提供各種紀(jì)錄數(shù)據(jù)解析模塊(至少包含有網(wǎng)絡(luò)服務(wù)使用紀(jì)錄數(shù)據(jù)解析模塊和數(shù)據(jù)庫(kù)操作紀(jì)錄數(shù)據(jù)解析模塊)予用戶使用;其中,網(wǎng)絡(luò)服務(wù)使用紀(jì)錄數(shù)據(jù)解析模塊至少有iislog或apachelog解析功能,以解析來(lái)自在線網(wǎng)頁(yè)服務(wù)器的紀(jì)錄;此外,數(shù)據(jù)庫(kù)操作紀(jì)錄數(shù)據(jù)解析模也包含有微軟sqlserverlog等解析功能,可解析來(lái)自在線數(shù)據(jù)庫(kù)服務(wù)器的紀(jì)錄;當(dāng)紀(jì)錄數(shù)據(jù)搜集裝置解析完成后再依其紀(jì)錄格式進(jìn)行解析后分別儲(chǔ)存至分布式數(shù)據(jù)庫(kù)中;舉一實(shí)例來(lái)說,可如下表一所示的范例為一iislog紀(jì)錄數(shù)據(jù),紀(jì)錄數(shù)據(jù)搜集裝置解析此數(shù)據(jù),以分別獲取該紀(jì)錄數(shù)據(jù)的紀(jì)錄日期為2015-08-18、紀(jì)錄時(shí)間為09:12:15、客戶端ip為10.144.198.130、服務(wù)器端ip為10.144.192.1、連結(jié)埠號(hào)為80、要求的網(wǎng)絡(luò)服務(wù)是為”/index.html”、響應(yīng)狀態(tài)代碼則為200、客戶端使用瀏覽器為mozilla/4.0+(compatible;msie+5.5;+windows+2000+server),紀(jì)錄數(shù)據(jù)搜集裝置也可選擇性的具備加密功能,其包含有至少一私鑰、至少一公鑰、至少一任意整數(shù)值,即是解析后再透過上述三者以對(duì)數(shù)據(jù)進(jìn)行加密后再儲(chǔ)存至分布式數(shù)據(jù)庫(kù)中。表一:多個(gè)分布式數(shù)據(jù)庫(kù):分布式數(shù)據(jù)庫(kù)得運(yùn)用hbase、mongodb等分布式數(shù)據(jù)庫(kù)元作實(shí)作開發(fā),用以儲(chǔ)存及操作巨量數(shù)據(jù)并可具備叢集互相備援以支持紀(jì)錄數(shù)據(jù)分析和處理;分布式數(shù)據(jù)庫(kù)主要是儲(chǔ)存經(jīng)紀(jì)錄數(shù)據(jù)搜集裝置解析后的網(wǎng)絡(luò)服務(wù)使用紀(jì)錄和數(shù)據(jù)庫(kù)操作紀(jì)錄,并可于分布式計(jì)算裝置進(jìn)行運(yùn)算分析時(shí)持續(xù)提供紀(jì)錄數(shù)據(jù)以維持運(yùn)算進(jìn)程。多個(gè)管理者設(shè)備:管理者設(shè)備得為個(gè)人計(jì)算機(jī)、平板、智能型手機(jī)、個(gè)人數(shù)字助理等裝置,設(shè)備中并有瀏覽器組件(得為internetexplorer、chrome、firefox、safari等瀏覽器)或其他可聯(lián)機(jī)的應(yīng)用程序聯(lián)機(jī)至紀(jì)錄數(shù)據(jù)搜集裝置,并經(jīng)由紀(jì)錄數(shù)據(jù)搜集裝置聯(lián)機(jī)至數(shù)據(jù)探勘主模塊,以選擇適合的探勘子模塊來(lái)指派予分布式計(jì)算裝置進(jìn)行運(yùn)算,最后,再由組合節(jié)點(diǎn)裝置整合運(yùn)算結(jié)果并回傳數(shù)據(jù)分析模塊,由數(shù)據(jù)分析模塊回復(fù)予外部管理者設(shè)備。一紀(jì)錄數(shù)據(jù)分析模塊:紀(jì)錄數(shù)據(jù)分析模塊得為一具有網(wǎng)絡(luò)服務(wù)的服務(wù)器,可經(jīng)由網(wǎng)絡(luò)服務(wù)的接口與外部管理者設(shè)備、數(shù)據(jù)探勘主模塊、組合節(jié)點(diǎn)裝置相介接并傳送及接收數(shù)據(jù);紀(jì)錄數(shù)據(jù)分析模塊得由管理者以手動(dòng)或自動(dòng)方式聯(lián)機(jī)至數(shù)據(jù)探勘主模塊,以并選擇適合的探勘子模塊并指派予分布式計(jì)算裝置進(jìn)行運(yùn)算,以及向組合節(jié)點(diǎn)裝置取得運(yùn)算結(jié)果。一數(shù)據(jù)主探勘模塊:數(shù)據(jù)探勘主模塊也為一具有網(wǎng)絡(luò)服務(wù)的服務(wù)器,可經(jīng)網(wǎng)絡(luò)服務(wù)接口與探勘子模塊、分布式計(jì)算裝置介接且傳送接收數(shù)據(jù),其可包含多個(gè)探勘子模塊以供分布式計(jì)算裝置進(jìn)行運(yùn)算和分析;其中,至少包含有最近鄰居探勘子模塊,是以k個(gè)最近鄰居法(k-nearestneighborsmethod)的邏輯進(jìn)行演算的分布式計(jì)算模塊,以及多元線性回歸探勘子模塊,是以多元線性回歸(multifactorlineregressionmethod)的邏輯進(jìn)行演算的分布式計(jì)算模塊,故數(shù)據(jù)主探勘模塊將可依選定的探勘子模塊指派給分布式計(jì)算裝置進(jìn)行運(yùn)算分析。至少一分布式計(jì)算裝置:分布式計(jì)算裝置得運(yùn)用hadoop、mongodb等分布式計(jì)算元作進(jìn)行實(shí)作開發(fā),并至少包含有多個(gè)節(jié)點(diǎn)設(shè)備、多個(gè)分布式計(jì)算模塊以分析巨量數(shù)據(jù)。其中,節(jié)點(diǎn)設(shè)備可依紀(jì)錄數(shù)據(jù)分析設(shè)備選定的數(shù)據(jù)探勘模塊產(chǎn)生多個(gè)分布式計(jì)算模塊,并可向分布式數(shù)據(jù)庫(kù)裝置取得紀(jì)錄數(shù)據(jù),指派予分布式計(jì)算模塊進(jìn)行分析;分布式計(jì)算模塊依選定的探勘子模塊分別進(jìn)行運(yùn)算和分析紀(jì)錄數(shù)據(jù)。例如,運(yùn)用hadoop或mongodb所提供的mapreduce分布式計(jì)算模塊分別依指派的探勘子模塊依任務(wù)執(zhí)行分布式計(jì)算,再將運(yùn)算結(jié)果整合傳送至組合節(jié)點(diǎn)裝置,各該分布式計(jì)算裝置也被選擇性的設(shè)置有密文計(jì)算的功能,可用以對(duì)密文狀態(tài)的數(shù)據(jù)進(jìn)行運(yùn)算。至少一快取數(shù)據(jù)庫(kù):快取數(shù)據(jù)庫(kù)是運(yùn)用關(guān)系數(shù)據(jù)庫(kù)或非關(guān)系數(shù)據(jù)庫(kù)組件以實(shí)施,用以儲(chǔ)存分布式計(jì)算裝置暫存各個(gè)紀(jì)錄數(shù)據(jù)分析運(yùn)算結(jié)果以及相關(guān)參數(shù),以加速運(yùn)算使用;舉例來(lái)說,在分布式計(jì)算裝置執(zhí)行最近鄰居探勘子模塊的分散運(yùn)算后,將取得相似度最高的多個(gè)筆紀(jì)錄數(shù)據(jù),并將各該紀(jì)錄數(shù)據(jù)傳送至快取數(shù)據(jù)庫(kù)以儲(chǔ)存,在往后的運(yùn)算時(shí)可先自快取數(shù)據(jù)庫(kù)中獲取相似度最高的多個(gè)筆紀(jì)錄數(shù)據(jù)以比對(duì)分析。另舉例來(lái)說,若分布式計(jì)算裝置執(zhí)行多元線性回歸探勘子模塊的分布式計(jì)算后,可產(chǎn)生線性回歸模型參數(shù)(包含斜率或截距)儲(chǔ)存至快取數(shù)據(jù)庫(kù),而往后實(shí)時(shí)運(yùn)算進(jìn)程中可利用快取數(shù)據(jù)庫(kù)中所儲(chǔ)存的線性回歸模型參數(shù),快取數(shù)據(jù)庫(kù)更被寫入新紀(jì)錄數(shù)據(jù)或刪除舊紀(jì)錄數(shù)據(jù)來(lái)避免重復(fù)計(jì)算的冗時(shí),當(dāng)可大幅提升整體運(yùn)算效率。一組合節(jié)點(diǎn)設(shè)備:組合節(jié)點(diǎn)設(shè)備也為一具有網(wǎng)絡(luò)服務(wù)的服務(wù)器,經(jīng)由網(wǎng)絡(luò)服務(wù)接口與紀(jì)錄數(shù)據(jù)搜集裝置、分布式計(jì)算裝置介接以傳送接收數(shù)據(jù),其擷取分布式計(jì)算裝置所產(chǎn)生的各運(yùn)算結(jié)果以整合分析,再將其分析結(jié)果回傳予紀(jì)錄數(shù)據(jù)分析模塊,另外,組合節(jié)點(diǎn)裝置也可具解密功能,儲(chǔ)存有與紀(jì)錄數(shù)據(jù)搜集裝置相對(duì)應(yīng)的私鑰、公鑰以及任意整數(shù)值,使其得以對(duì)經(jīng)分布式計(jì)算裝置密文計(jì)算得出的結(jié)果進(jìn)行解密,解密后提供明文數(shù)據(jù)回傳至紀(jì)錄數(shù)據(jù)分析模塊。以下所揭露的另一實(shí)施例也是關(guān)于本發(fā)明的實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析系統(tǒng),該系統(tǒng)架構(gòu)中至少包含有一紀(jì)錄數(shù)據(jù)搜集裝置、多個(gè)分布式數(shù)據(jù)庫(kù)、一數(shù)據(jù)探勘主模塊、多個(gè)分布式計(jì)算裝置、一組合節(jié)點(diǎn)設(shè)備、以及多個(gè)快取數(shù)據(jù)庫(kù);其中,數(shù)據(jù)主探勘模塊包含有最近鄰居探勘子模塊,其得以運(yùn)用k最近鄰居法進(jìn)行網(wǎng)絡(luò)紀(jì)錄數(shù)據(jù)分析的演算以產(chǎn)生定位信息,其系統(tǒng)運(yùn)作如下所述。系統(tǒng)包含一紀(jì)錄數(shù)據(jù)搜集裝置,用以收集智能型手機(jī)回報(bào)的經(jīng)緯度坐標(biāo)數(shù)據(jù)(即訓(xùn)練位置,在實(shí)施例中有m個(gè)位置)和基地臺(tái)訊號(hào)強(qiáng)度集合數(shù)據(jù),紀(jì)錄數(shù)據(jù)搜集裝置并紀(jì)錄和解析上述數(shù)據(jù),其紀(jì)錄每個(gè)訓(xùn)練位置(l={l1,l2,...,lm})以及訓(xùn)練位置對(duì)應(yīng)的基地臺(tái)訊號(hào)強(qiáng)度集合數(shù)據(jù)(ci={c1i,c2i,...,cni})于分布式數(shù)據(jù)庫(kù)中;其中,cji代表集合中第j個(gè)基地臺(tái)的訊號(hào)強(qiáng)度,j=1,…,n(在實(shí)施例中設(shè)有n個(gè)基地臺(tái));接著,往后當(dāng)智能型手機(jī)移動(dòng)時(shí),智能型手機(jī)可測(cè)量及回報(bào)其附近的基地訊號(hào)強(qiáng)度集合(r={r1,r2,...,rn}),并將由系統(tǒng)中數(shù)據(jù)主探勘模塊、分布式計(jì)算裝置、快取數(shù)據(jù)庫(kù)以最近鄰居探勘子模塊來(lái)計(jì)算基地訊號(hào)強(qiáng)度集合r與分布式數(shù)據(jù)庫(kù)中所有位置及其訊號(hào)強(qiáng)度集合交叉比對(duì)以估算出智能型手機(jī)當(dāng)時(shí)可能的位置。系統(tǒng)包含多個(gè)分布式數(shù)據(jù)庫(kù)裝置,是用以儲(chǔ)存每個(gè)訓(xùn)練位置(l={l1,l2,...,lm})及其對(duì)應(yīng)的基地臺(tái)訊號(hào)強(qiáng)度集合數(shù)據(jù)(ci={c1i,c2i,...,cni});當(dāng)分布式計(jì)算裝置在進(jìn)行運(yùn)算和紀(jì)錄分析時(shí),分布式數(shù)據(jù)庫(kù)則提供其紀(jì)錄數(shù)據(jù)。系統(tǒng)更包含一數(shù)據(jù)主探勘模塊,其至少具備一最近鄰居探勘子模塊,是用以評(píng)估每一個(gè)訊號(hào)強(qiáng)度集合r的位置loc(r);在本實(shí)施例中是應(yīng)用歐幾里得距離(euclideandistance)運(yùn)算方法,是采用下列公式(1)來(lái)將訊號(hào)強(qiáng)度集合(r={r1,r2,...,rn})與數(shù)據(jù)庫(kù)中的每一個(gè)位置li及其訊號(hào)強(qiáng)度集合(ci={c1i,c2i,...,cni})進(jìn)行距離(dist(r,ci))的計(jì)算,再針對(duì)每一個(gè)訓(xùn)練位置同樣進(jìn)行歐幾里得距離運(yùn)算,再透過公式(2)找出訊號(hào)強(qiáng)度最接近的位置h1以及其他最接近的共k個(gè)位置(即{h1,h2,...,hk}),而數(shù)據(jù)主探勘模塊會(huì)將最近鄰居探勘子模塊指派予分布式計(jì)算裝置來(lái)執(zhí)行。公式(1):公式(2):多個(gè)分布式計(jì)算裝置可以包含有多個(gè)節(jié)點(diǎn)設(shè)備,而每個(gè)節(jié)點(diǎn)設(shè)備須對(duì)應(yīng)至少一分布式計(jì)算模塊,分布式計(jì)算模塊可依數(shù)據(jù)主探勘模塊選定使用的探勘子模塊進(jìn)行運(yùn)算,在此實(shí)施例中,分布式數(shù)據(jù)庫(kù)中共具有m個(gè)位置(即有m筆數(shù)據(jù)需進(jìn)行比對(duì)),故可將此m筆數(shù)據(jù)均勻分派至每個(gè)節(jié)點(diǎn)設(shè)備再由每個(gè)節(jié)點(diǎn)設(shè)備中的分布式計(jì)算模塊分別執(zhí)行最近鄰居探勘子模塊,以多任務(wù)分別取得最接近的共k個(gè)位置(即{h1,h2,...,hk}),最接近的k個(gè)位置信息將再被傳送至組合節(jié)點(diǎn)裝置,以供組合節(jié)點(diǎn)裝置運(yùn)算產(chǎn)生最終的位置信息。而就如前所述,組合節(jié)點(diǎn)設(shè)備可接收來(lái)自分布式計(jì)算裝置運(yùn)算所運(yùn)算信息以進(jìn)行整合和產(chǎn)生分析的結(jié)果,就此實(shí)施例所說,組合節(jié)點(diǎn)設(shè)備是接收多個(gè)節(jié)點(diǎn)設(shè)備下的分布式計(jì)算模塊分別計(jì)算所得到的k個(gè)位置,再?gòu)募现斜葘?duì)以取得k個(gè)絕對(duì)接近位置,運(yùn)用下列公式(3)來(lái)產(chǎn)生訊號(hào)強(qiáng)度集合(r={h1,h2,...,hk})所對(duì)應(yīng)的位置信息l(r);公式(3):多個(gè)快取數(shù)據(jù)庫(kù)主要是用以儲(chǔ)存由分布式計(jì)算裝置運(yùn)算的結(jié)果和相關(guān)參數(shù)以供后續(xù)分析可快速取用以提升效率;在此實(shí)施例中,快取數(shù)據(jù)庫(kù)將由每個(gè)節(jié)點(diǎn)設(shè)備取得最接近的q×k個(gè)位置信息(其中q×k小于m且q為一正整數(shù))及其所對(duì)應(yīng)的基地臺(tái)訊號(hào)集合并儲(chǔ)存起來(lái),若之后須分析相同智能型手機(jī)回報(bào)的基地臺(tái)訊號(hào)強(qiáng)度集合時(shí),即可對(duì)快取數(shù)據(jù)庫(kù)中最接近的q×k個(gè)位置信息及其對(duì)應(yīng)的基地臺(tái)訊號(hào)集合進(jìn)行分析,而不須再重新比對(duì)原始的m筆數(shù)據(jù)。另外,該數(shù)據(jù)可用以分析智能型手機(jī)移動(dòng)的速度,例如,當(dāng)智能型手機(jī)移動(dòng)速度緩慢抑或靜止時(shí),q值可被設(shè)定為極小值(如:1),而當(dāng)智能型手機(jī)快速移動(dòng)時(shí),q值可被設(shè)定為較大的數(shù)值。以下所揭露的另一實(shí)施例也是本發(fā)明的一種實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析系統(tǒng),該系統(tǒng)架構(gòu)中至少包含有一紀(jì)錄數(shù)據(jù)搜集裝置、多個(gè)分布式數(shù)據(jù)庫(kù)、一數(shù)據(jù)探勘主模塊、多個(gè)分布式計(jì)算裝置、一組合節(jié)點(diǎn)設(shè)備、以及多個(gè)快取數(shù)據(jù)庫(kù);其中,數(shù)據(jù)主探勘模塊包含有最近多元線性回歸探勘子模塊,其得以運(yùn)用多元線性回歸模塊進(jìn)行交通紀(jì)錄數(shù)據(jù)分析的演算以產(chǎn)出交通預(yù)測(cè)信息,其系統(tǒng)運(yùn)作如下所述;其中,數(shù)據(jù)探勘模塊裝置至少包含有多元線性回歸模塊,并得以運(yùn)用多元線性回歸模塊進(jìn)行交通紀(jì)錄數(shù)據(jù)分析,并且產(chǎn)制交通預(yù)測(cè)信息,詳述如下。系統(tǒng)包含一紀(jì)錄數(shù)據(jù)搜集裝置,用以收集設(shè)置于清潔車上的車載設(shè)備回傳的到站時(shí)間信息,并由紀(jì)錄數(shù)據(jù)搜集裝置解析到站時(shí)間信息以運(yùn)算產(chǎn)生清潔車途經(jīng)由站到站之間的旅行時(shí)間,例如:欲表示第r筆資料的第i-n-j個(gè)清運(yùn)站到第i-n個(gè)清運(yùn)站間的旅行時(shí)間為tri-n-j,i-n;紀(jì)錄數(shù)據(jù)搜集裝置是將如前述計(jì)算的每個(gè)旅行時(shí)間集合儲(chǔ)存至分布式數(shù)據(jù)庫(kù),以供后續(xù)分析的運(yùn)用。系統(tǒng)包含多個(gè)分布式數(shù)據(jù)庫(kù)裝置,在此實(shí)施例中,分布式數(shù)據(jù)庫(kù)是運(yùn)用hbase、mongodb等分布式數(shù)據(jù)庫(kù)組件開發(fā),以儲(chǔ)存每個(gè)站到站之間的旅行時(shí)間。系統(tǒng)更包含一數(shù)據(jù)主探勘模塊,其至少具備一多元線性回歸探勘子模塊,用以運(yùn)算產(chǎn)生清潔車由各站到站之間旅行時(shí)間的關(guān)聯(lián)性(如斜率、截距等);在本實(shí)施例中,是以分析歷史數(shù)據(jù)中的m筆數(shù)據(jù)來(lái)產(chǎn)生k個(gè)加權(quán)線性回歸模型為范例;第i-n個(gè)清運(yùn)點(diǎn)到第i個(gè)清運(yùn)點(diǎn)的預(yù)測(cè)旅行時(shí)間(tr′1-n,1)可以運(yùn)用多元加權(quán)線性回歸模型(如公式(4)所示)進(jìn)行運(yùn)算獲得,在運(yùn)行時(shí)間中主要將會(huì)依據(jù)第i-n個(gè)清運(yùn)點(diǎn)的前k個(gè)清運(yùn)點(diǎn)到達(dá)第i-n個(gè)清運(yùn)點(diǎn)的旅行時(shí)間(即{ti-n-1,i-n,ti-n-2,i-n,…,ti-n-k,i-n})協(xié)同已經(jīng)過訓(xùn)練的多元加權(quán)線性回歸模型,以預(yù)測(cè)第i-n個(gè)清運(yùn)點(diǎn)到第i個(gè)清運(yùn)點(diǎn)的預(yù)測(cè)旅行時(shí)間(如公式(5)所示)。公式(4):其中,其中,其中,公式(5):多個(gè)分布式計(jì)算裝置可以包含有多個(gè)節(jié)點(diǎn)設(shè)備,而每個(gè)節(jié)點(diǎn)設(shè)備須對(duì)應(yīng)至少一分布式計(jì)算模塊,分布式計(jì)算模塊可依數(shù)據(jù)主探勘模塊選定使用的探勘子模塊進(jìn)行運(yùn)算,在此實(shí)施例中,因多元加權(quán)線性回歸探勘子模塊的模型大多利用加以及乘等運(yùn)算因子且具結(jié)合律的特性,舉例來(lái)說可以依照歷史數(shù)據(jù)m筆的筆數(shù)均勻分配任務(wù)至各個(gè)節(jié)點(diǎn)設(shè)備,再于每個(gè)節(jié)點(diǎn)設(shè)備中的分布式計(jì)算模塊分別執(zhí)行多元加權(quán)線性回歸,或是依待產(chǎn)制的k個(gè)加權(quán)線性回歸模型平均分配于各節(jié)點(diǎn)設(shè)備,各節(jié)點(diǎn)設(shè)備中的分布式計(jì)算模塊將分別執(zhí)行各個(gè)多元加權(quán)線性回歸探勘子模塊;且在運(yùn)算完畢之后,分布式計(jì)算裝置會(huì)將各多元加權(quán)線性回歸模型的斜率(如)、截距(如)、以及權(quán)重(如)分別儲(chǔ)存于快取數(shù)據(jù)庫(kù)中以供后續(xù)分析使用。而就如前所述,組合節(jié)點(diǎn)設(shè)備可接收來(lái)自分布式計(jì)算裝置運(yùn)算所得到的信息并進(jìn)行整合以產(chǎn)生分析結(jié)果;在本實(shí)施例中,組合節(jié)點(diǎn)設(shè)備可接收多個(gè)節(jié)點(diǎn)設(shè)備分別計(jì)算所得出的k個(gè)加權(quán)線性回歸模型及其相關(guān)參數(shù)(即斜率、截距以及權(quán)重),再透過公式(5)的方式運(yùn)算產(chǎn)生第i-n個(gè)清運(yùn)點(diǎn)到第i個(gè)清運(yùn)點(diǎn)的預(yù)測(cè)旅行時(shí)間。在此實(shí)施例中,多個(gè)快取數(shù)據(jù)庫(kù)主要將由各個(gè)節(jié)點(diǎn)設(shè)備計(jì)算得出的各個(gè)多元加權(quán)線性回歸模型的斜率、截距以及其權(quán)重分別儲(chǔ)存于各該快取數(shù)據(jù)庫(kù)當(dāng)中以作為分析的數(shù)據(jù),此外,當(dāng)后續(xù)輸入的數(shù)據(jù)有異動(dòng)時(shí),因多元加權(quán)線性回歸模型應(yīng)主要為加法及乘法運(yùn)算且可能具結(jié)合律等數(shù)學(xué)特性,故若是搭配快取數(shù)據(jù)庫(kù)中暫存的歷史數(shù)據(jù),只需要加入新增的數(shù)據(jù)或減去被刪除的數(shù)據(jù)即可快速調(diào)整多元加權(quán)線性回歸模型所利用的斜率、截距或權(quán)重,而非再費(fèi)時(shí)重新計(jì)算原始的m筆數(shù)據(jù)以提升效率。以下所揭露的另一實(shí)施例也是本發(fā)明的實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析方法的另一實(shí)施例,主要是在原先的實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析系統(tǒng)上增加具備密文計(jì)算功能而生的實(shí)時(shí)串流紀(jì)錄數(shù)據(jù)分析方法,如圖2中所示,此方法主要包含有八步驟,分別為步驟s201:紀(jì)錄在線數(shù)據(jù)步驟、步驟s202:數(shù)據(jù)加密步驟、步驟s203:存入分布式數(shù)據(jù)庫(kù)步驟、步驟s204:選擇數(shù)據(jù)探勘子模塊步驟、步驟s205:指派工作予分布式計(jì)算裝置并進(jìn)行密文計(jì)算步驟、步驟s206:暫存運(yùn)算結(jié)果至快取數(shù)據(jù)庫(kù)步驟、步驟s207:回傳和解密步驟以及步驟s208:顯示結(jié)果步驟等八步驟,各步驟的詳細(xì)實(shí)施內(nèi)容將敘述在以下實(shí)施例中。步驟s201:紀(jì)錄在線數(shù)據(jù)步驟:紀(jì)錄數(shù)據(jù)搜集裝置將把外部在線網(wǎng)頁(yè)服務(wù)器和外部在線數(shù)據(jù)庫(kù)服務(wù)器的服務(wù)要求以及響應(yīng)紀(jì)錄搜集并儲(chǔ)存至分布式數(shù)據(jù)庫(kù);例如:車載機(jī)1(外部使用者設(shè)備)于09:00:00、09:03:20、09:07:00等三時(shí)間分別抵達(dá)站點(diǎn)1、站點(diǎn)2、站點(diǎn)3;車載機(jī)2(外部使用者設(shè)備)于10:00:00、10:04:00、10:08:10等時(shí)點(diǎn)分別抵達(dá)站點(diǎn)1、站點(diǎn)2、站點(diǎn)3;另外,車載機(jī)3(外部使用者設(shè)備)于11:00:00、11:03:30、11:07:20等三時(shí)點(diǎn)分別到達(dá)相同的站點(diǎn)1、站點(diǎn)2、站點(diǎn)3;以及,車載機(jī)4(外部使用者設(shè)備)于12:00:00、12:03:40等兩時(shí)點(diǎn)分別抵達(dá)站點(diǎn)1、站點(diǎn)2,即如下表二中所示。下列為表二,表示車載機(jī)到站時(shí)間:站點(diǎn)1站點(diǎn)2站點(diǎn)3車載機(jī)109:00:0009:03:2009:07:00車載機(jī)210:00:0010:04:0010:08:10車載機(jī)311:00:0011:03:3011:07:20車載機(jī)412:00:0012:03:40而當(dāng)上述四部車載機(jī)(外部使用者設(shè)備)到達(dá)各站點(diǎn)時(shí),將經(jīng)由中間件(例如:restfulapi)回報(bào)車載機(jī)的位置信息和時(shí)間信息傳輸至外部在線網(wǎng)頁(yè)服務(wù)器和外部在線數(shù)據(jù)庫(kù)服務(wù)器,而紀(jì)錄數(shù)據(jù)搜集裝置將可對(duì)這些位置信息和時(shí)間信息紀(jì)錄進(jìn)行儲(chǔ)存及分析,以計(jì)算出站到站時(shí)間之間的旅行時(shí)間,舉例來(lái)說:車載機(jī)1從站點(diǎn)1到站點(diǎn)2的旅行時(shí)間(t1,2)為200秒、從站點(diǎn)2到站點(diǎn)3的旅行時(shí)間(t2,3)為220秒,就如下表三所示。下列為表三,是用以表示站到站之間的旅行時(shí)間(單位:秒):站點(diǎn)1-站點(diǎn)2站點(diǎn)2-站點(diǎn)3車載機(jī)1200220車載機(jī)2240250車載機(jī)3210230車載機(jī)4220步驟s202:數(shù)據(jù)加密步驟:紀(jì)錄數(shù)據(jù)搜集裝置搜集到外部在線網(wǎng)頁(yè)服務(wù)器和外部在線數(shù)據(jù)庫(kù)服務(wù)器的位置信息和時(shí)間信息紀(jì)錄后,即會(huì)透過一加密算法對(duì)數(shù)據(jù)進(jìn)行加密;紀(jì)錄數(shù)據(jù)搜集裝置應(yīng)計(jì)算所站到站之間的旅行時(shí)間,再分別計(jì)算出t1,2乘上t2,3的值以及t1,2平方的值,以產(chǎn)生到站時(shí)間的相關(guān)參數(shù)值,如表四所示。下列為表四,呈現(xiàn)到站時(shí)間的相關(guān)參數(shù)值:t1,2×t2,3t1,2t2,3t1,22車載機(jī)14400020022040000車載機(jī)26000024025057600車載機(jī)34830021023044100數(shù)據(jù)加密步驟中,接著,紀(jì)錄數(shù)據(jù)搜集裝置則可運(yùn)用默認(rèn)的一私鑰p、一公鑰q、一任意整數(shù)值z(mì)等參數(shù)值,再通過下列公式(6)對(duì)相關(guān)參數(shù)值進(jìn)行加密,在本實(shí)施例中假設(shè)私鑰p的值為39,916,801、公鑰q的值為112,909、任意整數(shù)值z(mì)的值則為7,而計(jì)算的結(jié)果舉例來(lái)說:原為明文數(shù)據(jù)的數(shù)值44,000經(jīng)由參數(shù)值及公式加密后可得出密文數(shù)據(jù)279,461,607,而其它范例結(jié)果則整理如下表五所示。公式(6):f(x)=(x+p×z)mod(p×q),其中,x為原始的相關(guān)參數(shù)值,mod運(yùn)算則為以后項(xiàng)的值作為前項(xiàng)的值的除數(shù)以取余數(shù)的模除運(yùn)算。下列為表五,呈現(xiàn)加密后的相關(guān)參數(shù)值:t1,2×t2,3t1,2t2,3t1,22車載機(jī)1279,461,607279,417,807279,417,807279,457,607車載機(jī)2279,477,607279,417,847279,417,847279,475,207車載機(jī)3279,465,907279,417,817279,417,817279,461,707步驟s203:存入分布式數(shù)據(jù)庫(kù)步驟:本發(fā)明的紀(jì)錄數(shù)據(jù)搜集裝置可選擇性地將數(shù)據(jù)以明文或密文方式儲(chǔ)存至多個(gè)分布式數(shù)據(jù)庫(kù)中,而在本實(shí)施例中,紀(jì)錄數(shù)據(jù)搜集裝置是將表五所呈現(xiàn)的加密后的相關(guān)參數(shù)值儲(chǔ)存至各該分布式數(shù)據(jù)庫(kù)中,而本發(fā)明可在數(shù)據(jù)庫(kù)中儲(chǔ)存密文的功能,是一種有效防范數(shù)據(jù)庫(kù)被侵入或數(shù)據(jù)被竊取時(shí)數(shù)據(jù)立即外泄的風(fēng)險(xiǎn)的方法。步驟s204:選擇數(shù)據(jù)探勘子模塊步驟:外部管理者可通過外部管理者設(shè)備聯(lián)機(jī)至紀(jì)錄數(shù)據(jù)分析裝置,經(jīng)由紀(jì)錄數(shù)據(jù)分析設(shè)備存取數(shù)據(jù)探勘主模塊,以選擇外部管理者其欲使用的探勘子模塊,在此一實(shí)施例中,外部管理者是選擇了使用多元線性回歸子模塊,故后續(xù)的范例將繼續(xù)以多元線性回歸子模塊作為分析和運(yùn)算的主要工具。步驟s205:指派工作予分布式計(jì)算裝置并進(jìn)行密文計(jì)算步驟:數(shù)據(jù)探勘主模塊可依照外部管理者選擇使用的探勘子模塊,以指派多個(gè)分布式計(jì)算裝置執(zhí)行運(yùn)算分析,并由各該分布式計(jì)算裝置之下的多個(gè)分布式計(jì)算模塊對(duì)被分配的紀(jì)錄數(shù)據(jù)進(jìn)行計(jì)算,且分布式計(jì)算裝置是采可以直接處理密文的方式對(duì)密文狀態(tài)的紀(jì)錄數(shù)據(jù)進(jìn)行處理。其中,各該分布式計(jì)算裝置將可依外部管理者所選定的多元線性回歸子模塊,通過前述的公式(4)以及公式(5)等等的運(yùn)算需求,以其下分屬的多個(gè)分布式計(jì)算模塊分別進(jìn)行運(yùn)算以加總所需的參數(shù)值,加總后結(jié)果如下表六所示;在本實(shí)施例中,是以計(jì)算一組回歸子模塊參數(shù)a和b舉例說明,但本發(fā)明的運(yùn)用不以此例為限,故各該分布式計(jì)算裝置可平行利用各該分布式計(jì)算模塊來(lái)進(jìn)行大量的回歸子模塊參數(shù)運(yùn)算。下列為表六,呈現(xiàn)加密后相關(guān)參數(shù)值的加總:t1,2×t2,3t1,2t2,3t1,22加總838,405,121838,253,471838,253,471838,394,521步驟s206:暫存運(yùn)算結(jié)果至快取數(shù)據(jù)庫(kù)步驟:各該分布式計(jì)算裝置運(yùn)算結(jié)果會(huì)被暫存至快取數(shù)據(jù)庫(kù),快取數(shù)據(jù)庫(kù)也可為多個(gè),暫存院算結(jié)果的目的主要是用以令往后數(shù)據(jù)分析效率提升;在本實(shí)施例中,已加總完車載機(jī)1、車載機(jī)2、車載機(jī)3的資料,而這加總結(jié)果將被暫存至快取數(shù)據(jù)庫(kù)裝置,后續(xù)若需使用時(shí)可直接套用加總結(jié)果,并不需要再重新加總車載機(jī)1、車載機(jī)2、車載機(jī)3的數(shù)據(jù),當(dāng)可節(jié)省許多時(shí)間。步驟s207:回傳和解密步驟:各該分布式計(jì)算裝置將把運(yùn)算完結(jié)果回傳至組合節(jié)點(diǎn)裝置,并由組合節(jié)點(diǎn)裝置以與加密方式相同的參數(shù)值將密文數(shù)據(jù)進(jìn)行解密并整合為分析結(jié)果。當(dāng)組合節(jié)點(diǎn)設(shè)備收到分布式計(jì)算裝置運(yùn)算結(jié)果后,得運(yùn)用與紀(jì)錄數(shù)據(jù)處理設(shè)備相同的一私鑰p、一公鑰q、一任意整數(shù)值z(mì),運(yùn)用公式(7)進(jìn)行解密,在此實(shí)施例中設(shè)定私鑰p為39,916,801、公鑰q為112,909、任意整數(shù)值z(mì)為7。如:加總后結(jié)果的密文838,405,121經(jīng)由解密后得到明文為152,300,整理如表七所示。公式(7):g(x)=(x)mod(p),其中mod也為模除運(yùn)算。下列為表七,呈現(xiàn)解密后相關(guān)參數(shù)值的加總:t1,2×t2,3t1,2t2,3t1,22加總152,300650700141,700而透過上表七所示的解密后的加總數(shù)據(jù)以及已知的數(shù)據(jù)筆數(shù)3筆(m=3),可運(yùn)用前述公式(4)分別計(jì)算出a和b參數(shù),如下列計(jì)算式(8)所示,而后透過下列計(jì)算式(9)以預(yù)測(cè)計(jì)算車載機(jī)4從站點(diǎn)2到站點(diǎn)3所需的旅行時(shí)間,其結(jié)果估計(jì)約為236秒,故推知車載機(jī)4到達(dá)站點(diǎn)3的預(yù)測(cè)到站時(shí)間應(yīng)為12:07:36。公式(8):而公式(9):0.730769×220+75=235.7692≈236步驟s208:顯示結(jié)果步驟:組合節(jié)點(diǎn)裝置將運(yùn)算結(jié)果傳送至紀(jì)錄數(shù)據(jù)分析模塊,再由紀(jì)錄數(shù)據(jù)分析模塊通知外部管理者設(shè)備以于外部管理者設(shè)備上呈現(xiàn)本次分析結(jié)果;而本實(shí)施例中,當(dāng)組合節(jié)點(diǎn)裝置計(jì)算出預(yù)測(cè)結(jié)果后,會(huì)將預(yù)測(cè)結(jié)果傳送至紀(jì)錄數(shù)據(jù)分析模塊,再由紀(jì)錄數(shù)據(jù)分析模塊通知外部管理者設(shè)備,以于外部管理者設(shè)備上呈現(xiàn)出車載機(jī)4到達(dá)站點(diǎn)3的預(yù)測(cè)到站時(shí)間為12:07:36給外部管理者知悉。綜上所述,本發(fā)明于技術(shù)思想上實(shí)屬創(chuàng)新,也具備先前技術(shù)不及的多種功效,已充分符合新穎性及進(jìn)步性的法定發(fā)明專利要件,爰依法提出專利申請(qǐng),懇請(qǐng)貴局核準(zhǔn)本件發(fā)明專利申請(qǐng)案以勵(lì)發(fā)明,至感德便。當(dāng)前第1頁(yè)12