亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

利用視窗操作系統(tǒng)的IE瀏覽器進行網(wǎng)絡(luò)數(shù)據(jù)采集方法與流程

文檔序號:12596494閱讀:914來源:國知局
利用視窗操作系統(tǒng)的IE瀏覽器進行網(wǎng)絡(luò)數(shù)據(jù)采集方法與流程

本發(fā)明申請的技術(shù)屬于網(wǎng)絡(luò)數(shù)據(jù)交換中的信息獲取方法技術(shù)領(lǐng)域,具體是針對使用視窗操作系統(tǒng)及IE瀏覽器進行上網(wǎng)操作時,獲取網(wǎng)絡(luò)瀏覽數(shù)據(jù)和信息的方法。



背景技術(shù):

隨著Web技術(shù)及Web應(yīng)用的高速發(fā)展,大數(shù)據(jù)時代的來臨,對各種Web應(yīng)用網(wǎng)站,特別社交平臺的監(jiān)控、各個公司的輿論監(jiān)控、用戶數(shù)據(jù)采集、大數(shù)據(jù)挖掘的應(yīng)用越來越廣泛;各行各業(yè)也越來越依賴互聯(lián)網(wǎng)并對互聯(lián)網(wǎng)信息高度依賴。但是,互聯(lián)網(wǎng)的數(shù)據(jù)都是海量的,如何提取需要的數(shù)據(jù)成為一個技術(shù)上的瓶頸。

此外,還有一種情況是需要對個人上網(wǎng)信息的了解和分析。通常,用戶上網(wǎng)行為的信息數(shù)據(jù)內(nèi)容抓取可以使用wireshark軟件類似的方法實現(xiàn)。Wireshark(前稱Ethereal)是一個網(wǎng)絡(luò)封包分析軟件。網(wǎng)絡(luò)封包分析軟件的功能是擷取網(wǎng)絡(luò)封包,并盡可能顯示出最為詳細的網(wǎng)絡(luò)封包資料。Wireshark使用WinPCAP作為接口,直接與網(wǎng)卡進行數(shù)據(jù)報文交換。通過Winpcap抓取網(wǎng)卡數(shù)據(jù)包來獲取上網(wǎng)行為數(shù)據(jù)的辦法實現(xiàn)簡單,抓取內(nèi)容完整。但如果抓取HTTPS網(wǎng)址網(wǎng)站的數(shù)據(jù)內(nèi)容時,該方式抓取數(shù)據(jù)內(nèi)容都為SSL加密后數(shù)據(jù),使用wireshark軟件查看數(shù)據(jù)內(nèi)容為亂碼。為此,還原網(wǎng)址網(wǎng)站數(shù)據(jù)內(nèi)容必須進行SSL解密,但是SSL解密需要永遠不會公布的私鑰,故該方式還原數(shù)據(jù)內(nèi)容不能實現(xiàn)。

計算機編程中常用的一種方法是“鉤子”技術(shù)方法,該方法實際上是一段程序,即是一個處理消息的程序段,通過系統(tǒng)調(diào)用,把它掛入系統(tǒng)。每當(dāng)特定的消息發(fā)出,在沒有到達目的窗口前,鉤子程序就先捕獲該消息,亦即鉤子函數(shù)先得到控制權(quán)。這時鉤子函數(shù)即可以加工處理(改變)該消息,也可以不作處理而繼續(xù)傳遞該消息,還可以強制結(jié)束消息的傳遞。鉤子也可以理解為WINDOWS留給我們的后門,比如你想控制鍵盤,在DOS時代很簡單通過INT即可,而WINDOWS時代不允許我們直接操作硬件;由于WINDOWS是消息驅(qū)動,所以我們可以攔截鍵盤消息以達到控制鍵盤的目的。控制自己進程的消息固然很簡單,但是要控制所有進程消息就要利用鉤子了。將鉤子函數(shù)放在DLL中,所有的有關(guān)鍵盤的消息都必須經(jīng)過鉤子函數(shù)過濾,這樣你就可以為所欲為了。

本申請的技術(shù)方案就是將鉤子函數(shù)的特點用于網(wǎng)絡(luò)數(shù)據(jù)的獲取中,通過鉤子函數(shù)的運行方式進行實現(xiàn)網(wǎng)絡(luò)瀏覽器在運行操作過程中各種信息的獲取和采集,為后續(xù)個人用戶的上網(wǎng)分析提供數(shù)據(jù)參考。



技術(shù)實現(xiàn)要素:

由于現(xiàn)有的HTTPS網(wǎng)址網(wǎng)站進行訪問的過程中,網(wǎng)頁發(fā)送和接收的數(shù)據(jù)內(nèi)容經(jīng)過SSL加密,而普通wireshark軟件方法抓取的網(wǎng)址數(shù)據(jù)內(nèi)容都是經(jīng)過SSL加密后數(shù)據(jù),而SSL加密方式的破解難度高,難以對截獲的SSL數(shù)據(jù)內(nèi)容進行SSL解密進而還原數(shù)據(jù)內(nèi)容。

本發(fā)明提出一種在Windows系統(tǒng)IE瀏覽器上通過鉤子技術(shù)的采集HTTPS網(wǎng)址網(wǎng)站上網(wǎng)數(shù)據(jù)的方法。實現(xiàn)上述發(fā)明目的技術(shù)方案為:利用視窗操作系統(tǒng)的IE瀏覽器進行網(wǎng)絡(luò)數(shù)據(jù)采集方法,該方法步驟如下:(1)視窗操作系統(tǒng)啟動,利用HOOK技術(shù)向操作系統(tǒng)注入動態(tài)鏈接庫(DLL)模塊;(2)IE瀏覽器啟動,IE瀏覽器自動加載步驟1所注入動態(tài)鏈接庫(DLL)模塊;(3)IE瀏覽器打開網(wǎng)站網(wǎng)址進行上網(wǎng)操作,步驟1所注入動態(tài)鏈接庫(DLL)模塊獲取、采集IE瀏覽器本地端上的網(wǎng)頁請求和響應(yīng)的HTTP網(wǎng)絡(luò)數(shù)據(jù);(4)步驟1所注入動態(tài)鏈接庫(DLL)模塊對步驟3截獲的HTTP網(wǎng)絡(luò)數(shù)據(jù)保存到本地;(4)IE瀏覽器退出關(guān)閉,IE瀏覽器自動卸載步驟1所注入動態(tài)鏈接庫(DLL)模塊;(5)視窗操作系統(tǒng)關(guān)機,再使用HOOK技術(shù)向系統(tǒng)反注入步驟1所注入動態(tài)鏈接庫(DLL)模塊。上述方法中,在windows平臺終端電腦上運行本發(fā)明軟件后,使用鉤子技術(shù)向windows系統(tǒng)注入本發(fā)明DLL模塊文件;當(dāng)用戶使用IE瀏覽器進行上網(wǎng)行為操作時,注入的DLL模塊將截獲上網(wǎng)行為而產(chǎn)生的數(shù)據(jù)內(nèi)容,并判斷是否為配置項中待采集網(wǎng)頁的數(shù)據(jù)內(nèi)容;最后保存截獲配置項中待采集網(wǎng)頁的數(shù)據(jù)內(nèi)容。利用該方法可以采集記錄用戶訪問指定的HTTPS網(wǎng)址網(wǎng)頁的情況,也可以用于采集記錄用戶使用訪問內(nèi)部HTTPS網(wǎng)頁使用內(nèi)部信息的使用情況,就能夠有效的追查一些保密信息泄漏的責(zé)任人。

本申請對視窗操作系統(tǒng)的最低版本有要求,即所用視窗操作系統(tǒng)是window XP以上版本的操作系統(tǒng)。該版本以上的操作系統(tǒng)占據(jù)個人操作系統(tǒng)的99%以上,因此應(yīng)用范圍更為廣泛,具有普適性。

在上述利用視窗操作系統(tǒng)的IE瀏覽器進行網(wǎng)絡(luò)數(shù)據(jù)采集方法的步驟(3)中,獲取、采集得到的HTTP網(wǎng)絡(luò)數(shù)據(jù)包括網(wǎng)頁內(nèi)容信息及上網(wǎng)瀏覽者實現(xiàn)瀏覽事件發(fā)生的信息,即使用IE瀏覽器上網(wǎng)操作的所有信息都被步驟(1)中注入的鉤子模塊所記錄,避免信息遺漏。如果步驟(1)中注入的鉤子模塊后,在若在采集HTTP網(wǎng)絡(luò)數(shù)據(jù)時發(fā)生數(shù)據(jù)獲取不能成功的狀況時,將不成功的信息記載至日志文件中以便后續(xù)分析。

上述方法在使用的過程中,步驟(1)中注入的鉤子模塊是由多個鉤子函數(shù)的鉤子鏈所構(gòu)成的集合,各個鉤子函數(shù)之間相互配合實現(xiàn)最終的多信息采集功能。

上述方法在視窗系統(tǒng)啟動時,本發(fā)明軟件使用HOOK技術(shù)向系統(tǒng)注入步驟(1)中所述鉤子模塊DLL。在IE瀏覽器啟動的同時,步驟(1)中注入的鉤子模塊將被IE瀏覽器同步加載起來,使用IE瀏覽器的任何操作都和步驟(1)中注入的鉤子模塊鉤子函數(shù)的網(wǎng)絡(luò)數(shù)據(jù)的獲取保持同步運行,避免數(shù)據(jù)收集中的遺漏。

附圖說明

圖1是鉤子函數(shù)注入和反注入的流程圖。

圖2鉤子注入模塊在IE瀏覽器中截獲采集數(shù)據(jù)信息流程圖。

具體實施方式

為更清楚說明本發(fā)明技術(shù)方案,下面具體進行介紹。如圖1所示是本發(fā)明技術(shù)方案的鉤子函數(shù)注入和反注入過程的流程,首先在視窗操作系統(tǒng)啟動后,利用HOOK技術(shù)向視窗系統(tǒng)注入鉤子模塊DLL。在IE瀏覽器啟動時,IE瀏覽器將會自動加載的注入的動態(tài)鏈接庫DLL實現(xiàn)鉤子函數(shù)登記,將鉤子函數(shù)和IE瀏覽器的啟動實現(xiàn)綁定,即實現(xiàn)圖中的HOOK注入DLL過程;如圖2所示,在本發(fā)明軟件完成鉤子模塊DLL注入后,當(dāng)用戶開啟IE瀏覽器開始運行時,IE瀏覽器將自動加載注入的鉤子模塊DLL,鉤子函數(shù)獲取、采集HTTP網(wǎng)頁數(shù)據(jù)信息;鉤子模塊DLL中鉤子函數(shù)將截獲的HTTPS網(wǎng)頁數(shù)據(jù)信息進行保存,如果遇到不能保存的信息,則鉤子函數(shù)將不能保存的網(wǎng)頁地址或操作作為日志文件保存;用戶在退出關(guān)閉IE瀏覽器時,IE瀏覽器將同時將鉤子模塊DLL和鉤子函數(shù)一起卸載過程,隨瀏覽器運行的停止而停止;最后視窗操作系統(tǒng)停止運行時,關(guān)閉本發(fā)明軟件的進程并進行鉤子模塊DLL的注銷,如圖1后兩步。本申請的技術(shù)方案中,采用鉤子程序的方式將IE瀏覽器的操作信息實現(xiàn)同步動態(tài)獲取,獲取的數(shù)據(jù)信息均為未通過SSL加密,降低傳統(tǒng)數(shù)據(jù)信息獲取后需要進行解密的困難,在上網(wǎng)信息獲取上達到了簡化。

以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明實質(zhì)內(nèi)容上所作的任何修改、等同替換和簡單改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1