本發(fā)明涉及通信領(lǐng)域,尤其涉及一種網(wǎng)絡訪問的管理方法及裝置。
背景技術(shù):
近年來,隨著互聯(lián)網(wǎng)技術(shù)與移動通信技術(shù)的迅速發(fā)展,網(wǎng)絡應用逐漸變得更加豐富,隨之而來的,用戶進行網(wǎng)絡訪問的方式也發(fā)生了巨大變化,從早期的用戶僅能通過網(wǎng)頁瀏覽訪問網(wǎng)絡,發(fā)展到如今用戶可以通過包括網(wǎng)絡搜索、郵件收發(fā)、論壇訪問、即時通訊軟件通訊、網(wǎng)絡儲存等一系列方式對網(wǎng)絡進行訪問。豐富的網(wǎng)絡應用雖然能夠為用戶提供更豐富的網(wǎng)絡內(nèi)容并使用戶訪問網(wǎng)絡更加便捷,但同時也帶來了一系列的問題,例如當用戶在禁止使用部分網(wǎng)絡應用的場景下隨意使用網(wǎng)絡應用進行網(wǎng)絡訪問時,可能造成部分信息外泄或造成通信鏈路堵塞使網(wǎng)絡訪問效率降低。因此,網(wǎng)絡運營商和網(wǎng)絡管理員需要根據(jù)自身的需求對用戶的網(wǎng)絡訪問進行管理。
通常情況下對網(wǎng)絡訪問進行管理,可以為當獲取到網(wǎng)絡訪問的數(shù)據(jù)時,根據(jù)預先設(shè)定的管理方法從該網(wǎng)絡訪問的數(shù)據(jù)中提取需要的內(nèi)容并進行解析以獲取關(guān)鍵字段,以便于根據(jù)關(guān)鍵字段對該網(wǎng)絡訪問進行管理。其中,提取需要的內(nèi)容以及對該內(nèi)容進行解析的過程通常是和網(wǎng)絡訪問的類型強相關(guān)的,若網(wǎng)絡訪問的類型發(fā)生變更或同時存在多個類型的網(wǎng)絡訪問,那么上述預先設(shè)定的管理方法無法從網(wǎng)絡訪問的數(shù)據(jù)中提取相應的內(nèi)容并進行相應的解析。雖然在出現(xiàn)上述問題時可以重新設(shè)定新的管理方法,但進行重新設(shè)定的過程往往耗時較多,并且也無法在同時存在多個類型的網(wǎng)絡訪問時,根據(jù)網(wǎng)絡訪問的數(shù)據(jù)獲取與網(wǎng)絡訪問的類型對應的關(guān)鍵字段,從而降低了管理網(wǎng)絡訪問的效率,并損害了用戶體驗。
技術(shù)實現(xiàn)要素:
本申請?zhí)峁┮环N網(wǎng)絡訪問的管理方法及裝置,能夠在同時存在多個類型的網(wǎng)絡訪問時,根據(jù)網(wǎng)絡訪問的數(shù)據(jù)獲取與網(wǎng)絡訪問的類型對應的關(guān)鍵字段。
為達到上述目的,本申請采用如下技術(shù)方案:
第一方面,本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理方法,包括:獲取網(wǎng)絡訪問的數(shù)據(jù),并根據(jù)網(wǎng)絡訪問的數(shù)據(jù)確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則;根據(jù)數(shù)據(jù)流規(guī)則篩選解析函數(shù),并根據(jù)篩選出的解析函數(shù)獲取網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段,關(guān)鍵字段用于管理網(wǎng)絡訪問。
第二方面,本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理裝置,包括:獲取模塊,被配置為獲取網(wǎng)絡訪問的數(shù)據(jù);處理模塊,被配置為根據(jù)網(wǎng)絡訪問的數(shù)據(jù)確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則;處理模塊還被配置為,根據(jù)數(shù)據(jù)流規(guī)則篩選解析函數(shù),并根據(jù)篩選出的解析函數(shù)獲取網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段,關(guān)鍵字段用于管理網(wǎng)絡訪問。
本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理方法及裝置,通過確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,并根據(jù)該數(shù)據(jù)流規(guī)則篩選解析函數(shù),根據(jù)篩選出的解析函數(shù)獲取網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段,由于該數(shù)據(jù)流規(guī)則可以篩選解析函數(shù),并且被篩選的解析函數(shù)可以包括對應多個數(shù)據(jù)流規(guī)則的解析函數(shù),因此即使同時存在多個類型的網(wǎng)絡訪問,本發(fā)明提供的網(wǎng)絡訪問的管理方法仍能夠根據(jù)網(wǎng)絡訪問的數(shù)據(jù)獲取與該網(wǎng)絡訪問的類型對應的關(guān)鍵字段,從而能夠根據(jù)該關(guān)鍵字段管理該網(wǎng)絡訪問,因此提高了管理網(wǎng)絡訪問的效率,并改善了用戶體驗。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明的實施例所提供的一種網(wǎng)絡訪問的管理方法的示意性流程圖;
圖2為本發(fā)明的另一實施例所提供的一種網(wǎng)絡訪問的管理方法的示意性流程圖;
圖3為本發(fā)明的實施例所提供的一種網(wǎng)絡訪問的管理裝置的示意性結(jié)構(gòu)圖;
圖4為本發(fā)明的另一實施例所提供的一種網(wǎng)絡訪問的管理裝置的示意性結(jié)構(gòu)圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
為了便于清楚描述本發(fā)明實施例的技術(shù)方案,在本發(fā)明的實施例中,采用了“第一”、“第二”等字樣對功能和作用基本相同的相同項或相似項進行區(qū)分,本領(lǐng)域技術(shù)人員可以理解“第一”、“第二”等字樣并不是在對數(shù)量和執(zhí)行次序進行限定。
近年來,隨著互聯(lián)網(wǎng)技術(shù)與移動通信技術(shù)的迅速發(fā)展,網(wǎng)絡應用逐漸變得更加豐富,這使得人們上網(wǎng)的行為方式也發(fā)生了巨大變化,從早期的用戶僅能通過網(wǎng)頁瀏覽訪問網(wǎng)絡,發(fā)展到如今用戶可以通過包括網(wǎng)絡搜索、郵件收發(fā)、論壇訪問、即時通訊軟件通訊、網(wǎng)絡儲存等一系列方式對網(wǎng)絡進行訪問。而隨著移動互聯(lián)網(wǎng)時代的到來,這些應用的類型和數(shù)量以及網(wǎng)絡用戶在互聯(lián)網(wǎng)上表現(xiàn)出來的行為更加趨于多樣化。這種趨勢在豐富了網(wǎng)絡內(nèi)容的同時,也帶來了不少弊端,如企業(yè)機密信息外泄、員工工作效率降低等。因此,網(wǎng)絡運營商和網(wǎng)絡提供者對用戶所進行的網(wǎng)絡訪問的管理已經(jīng)成為越來越迫切的需求。這種需求意味著不僅需要識別用戶的網(wǎng)絡訪問,更需要對網(wǎng)絡訪問中的非法行為進行控制。
網(wǎng)絡訪問管理技術(shù)在近幾年的快速發(fā)展過程中,所能識別和控制的網(wǎng)絡訪問的數(shù)據(jù)日漸豐富。其中通過識別和記錄網(wǎng)絡層源目的網(wǎng)絡協(xié)議(英文全稱:Internet Protocol,英文簡稱:IP)信息、傳輸層協(xié)議、源目的端口信息等,能夠做到事后有記錄可查,同時結(jié)合內(nèi)網(wǎng)IP地址可以劃分或認證系統(tǒng)中的組織結(jié)構(gòu)區(qū)分不同的用戶類型,并且可以根據(jù)傳輸層源目的端口信息簡單區(qū)分不同的應用類型,如超文本傳輸協(xié)議(英文全稱:HyperText Transfer Protocol,英文簡稱:HTTP)、簡單郵件傳輸協(xié)議(英文全稱:Simple Mail Transfer Protocol,英文簡稱:SMTP)、文件傳輸協(xié)議(英文全稱:File Transfer Protocol,英文簡稱:FTP)等,從而定制不同的上網(wǎng)行為策略。
統(tǒng)一資源定位符(英文全稱:Uniform Resource Locator,英文簡稱:URL)是一種對從互聯(lián)網(wǎng)上得到的資源的位置和訪問方法的一種簡潔的表示,是互聯(lián)網(wǎng)上標準資源的地址?;ヂ?lián)網(wǎng)上的每個文件都有一個唯一的URL,它包含的信息指出文件的位置以及瀏覽器應該怎么處理它?;綰RL包含模式(或稱協(xié)議)、服務器名稱(或IP地址)、路徑和文件名,如“協(xié)議://授權(quán)/路徑?查詢”。URL分類即是根據(jù)授權(quán)/路徑字段區(qū)分出不同的應用類型,如新聞、論壇、郵箱、銀行或者色情、賭博等非法類型。深度分組檢測(英文全稱:Deep Packet Inspection,英文簡稱:DPI)技術(shù)是相對普通報文檢測而言的一種新的檢測技術(shù),即對網(wǎng)絡第七層,也即應用層的內(nèi)容(凈荷)進行深度分析,從而根據(jù)應用層的凈荷特征識別其應用類型或內(nèi)容。如傳統(tǒng)端口類型識別僅是根據(jù)傳輸層TCP協(xié)議的80端口識別出是HTTP協(xié)議的網(wǎng)頁瀏覽應用,而DPI技術(shù)則能夠根據(jù)HTTP協(xié)議載荷中的特征字符串,如mail.163.com(識別為網(wǎng)頁郵箱),識別出具體應用類型。隨著URL分類和DPI技術(shù)的發(fā)展,用戶的普通網(wǎng)頁瀏覽行為可以被近一步細分,識別出新聞類、科技類、社交類、郵箱類以及各種非法類別,非網(wǎng)頁類應用,如游戲、辦公、下載、視頻等行為也可被進一步識別,借助應用層信息的細分,上網(wǎng)行為管理設(shè)備能夠針對用戶的不同行為定制策略,從而審計和控制上網(wǎng)用戶的合法和非法行為。進一步的,針對同一種應用類型,用戶的不同行為和行為內(nèi)容要求可以被進一步細分,如社交微博類應用,從而區(qū)分出瀏覽、發(fā)帖、回復、附件上傳等不同行為,例如郵箱類應用可以識別出發(fā)件人、收件人、郵件標題、正文、附件等,不同的行為內(nèi)容能夠匹配特定的特征庫關(guān)鍵字,然后定義相應的放行或阻斷策略。
盡管上網(wǎng)行為管理技術(shù)發(fā)展到今天,已經(jīng)能夠很精細地控制和管理用戶的上網(wǎng)行為,但是隨著WEB3.0和移動互聯(lián)網(wǎng)時代的到來,上網(wǎng)行為管理技術(shù)開始面臨各種新的挑戰(zhàn),各種應用發(fā)生了翻天覆地的變化(例如同一種應用可能出現(xiàn)了PC端、Android移動版、IOS移動版等不同形式),應用協(xié)議、數(shù)據(jù)格式也出現(xiàn)了大范圍的更新和改變(例如傳統(tǒng)WEB郵箱的附件形式逐步轉(zhuǎn)變?yōu)榫W(wǎng)盤類的附件形式),應用的數(shù)量迅速發(fā)展,人們的要求不斷提高(例如用戶希望不僅能識別出某一行為的IP地址,而且希望能夠知道這一行為的用戶帳號、ID等虛擬身份信息)。面對這種局勢,由于現(xiàn)有網(wǎng)絡訪問的管理方法在獲取到網(wǎng)絡訪問的數(shù)據(jù)時會根據(jù)預先設(shè)定從該網(wǎng)絡訪問的數(shù)據(jù)中提取需要的字段并進行協(xié)議解析,以便于根據(jù)解析后的字段對該網(wǎng)絡訪問進行管理,其中提取需要的字段以及對字段進行協(xié)議解析的過程通常是和網(wǎng)絡訪問的類型強相關(guān)的,若網(wǎng)絡訪問的類型發(fā)生變更,那么上述網(wǎng)絡訪問的管理方法無法根據(jù)預先設(shè)定從類型發(fā)生變更后的網(wǎng)絡訪問的數(shù)據(jù)中提取相應的字段信息并進行相應的解析。雖然在出現(xiàn)上述問題時可以重新對所提取的字段以及用于解析的協(xié)議進行設(shè)定,但進行重新設(shè)定的過程往往耗時較多,降低了管理網(wǎng)絡訪問的效率,并損害了用戶體驗。
針對上述問題,本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理方法,能夠根據(jù)網(wǎng)絡訪問的數(shù)據(jù)確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,并根據(jù)該數(shù)據(jù)流規(guī)則提取并解析所提取的網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段,從而能夠提取并解析不同類型的網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段,以便于根據(jù)該關(guān)鍵字段管理不同類型的網(wǎng)絡訪問,提高了管理網(wǎng)絡訪問的效率并改善了用戶體驗。
如附圖1所示,本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理方法,其特征在于,包括:
101、獲取網(wǎng)絡訪問的數(shù)據(jù)。
具體的,所述網(wǎng)絡訪問的數(shù)據(jù)可以為用戶使用應用進行網(wǎng)絡訪問時,該應用與網(wǎng)絡間交互的數(shù)據(jù)。示例性的,當用戶通過新浪微博應用發(fā)布微博時,新浪微博應用向?qū)姆掌鞫怂鶄鬏數(shù)臄?shù)據(jù)可以被認為是網(wǎng)絡訪問的數(shù)據(jù)。
102、根據(jù)網(wǎng)絡訪問的數(shù)據(jù)確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則。
其中數(shù)據(jù)流規(guī)則用于指示網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段以及用于解析關(guān)鍵字段的解析協(xié)議。
具體的,根據(jù)網(wǎng)絡訪問的數(shù)據(jù)確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,可以為根據(jù)網(wǎng)絡訪問的數(shù)據(jù)確定該網(wǎng)絡訪問對應的應用的類型,即通過該網(wǎng)絡訪問的數(shù)據(jù)進行網(wǎng)絡訪問的應用的類型,并確定與該類型對應的數(shù)據(jù)流規(guī)則。
網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段可以為網(wǎng)絡訪問的數(shù)據(jù)中特定的字段,數(shù)據(jù)流規(guī)則可以通過指示該特定字段的字段信息、數(shù)據(jù)類型(整型、字符型)或長度來指示該關(guān)鍵字段。解析關(guān)鍵字段的解析協(xié)議可以為能夠?qū)⒃撽P(guān)鍵字段解析為指定格式的協(xié)議。
示例性的,當網(wǎng)絡訪問為郵箱類型的應用所進行的網(wǎng)絡訪問時,數(shù)據(jù)流規(guī)則可以通過檢索指定字符確定網(wǎng)絡訪問的數(shù)據(jù)中的特定字段例如發(fā)件人字段、收件人字段、標題字段、附件字段等,同時數(shù)據(jù)流規(guī)則還可以分別指定特定字段的數(shù)據(jù)類型(整型、字符型)或長度以便于進一步在網(wǎng)絡訪問的數(shù)據(jù)中確定特定字段。
進一步的,數(shù)據(jù)流規(guī)則所指示的特定字段可以包括三類,其中每一類特定字段需要能夠指定數(shù)據(jù)類型(整型、字符型)和長度。為了保證描述信息的簡潔,可以采用指示特定字段的類型和特定字段的長度前綴的方式,特定字段的長度通??梢灶A先設(shè)置好,不需要顯示描述。
示例性的,特定字段可以包括應用關(guān)鍵字段、報文相關(guān)信息字段以及普通變量字段,其中,應用關(guān)鍵字段為需要進行審計存入數(shù)據(jù)庫或者進行精細化策略控制的應用信息,例如論壇發(fā)帖的標題、正文等,示例性的,應用關(guān)鍵字段可以為:$str_title、$str_content。報文相關(guān)信息字段可以為鏈路層MAC地址信息、網(wǎng)絡層IP地址信息、傳輸層協(xié)議、端口信息、應用層載荷、長度等,報文相關(guān)信息字段可視為常量,一般不做修改。示例性的,報文相關(guān)信息字段可以為:@str_smac、@int_sip、@int_proto、@int_sport、@str_payload、@int_payloadlen。普通變量字段可以為整型變量、字符串變量,普通變量字段一般作為關(guān)鍵字段提取過程中暫存信息使用,保存臨時數(shù)據(jù)或計算結(jié)果,也可作為條件判斷、循環(huán)控制的臨時變量。示例性的,普通變量字段可以為int0、int1、str0、str1。
需要說明的是,數(shù)據(jù)流規(guī)則所指示的特定字段的長度可以根據(jù)數(shù)據(jù)流規(guī)則對應的網(wǎng)絡訪問類型的決定,例如報文相關(guān)信息字段的長度通常是固定,普通變量字段的長度能夠被預先設(shè)定。本發(fā)明的實施例并不對數(shù)據(jù)流規(guī)則的組織形式進行具體限定,數(shù)據(jù)流規(guī)則的組織形式可以包括鍵值對、可擴展標記語言(英文全稱:Extensible Markup Language,英文簡稱:XML)或JavaScript對象表示法(英文全稱:JavaScript Object Notation,英文簡稱:JSON)等
103、根據(jù)數(shù)據(jù)流規(guī)則篩選解析函數(shù),根據(jù)篩選出的解析函數(shù)獲取網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段并對關(guān)鍵字段進行解析。
具體的,由于根據(jù)數(shù)據(jù)流規(guī)則可以獲取用于獲取所述網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段以及用于解析所述關(guān)鍵字段的解析協(xié)議,因此根據(jù)數(shù)據(jù)流規(guī)則篩選出的解析函數(shù)也可以理解為將數(shù)據(jù)流規(guī)則所指示的內(nèi)容,該解析函數(shù)用于從對應的網(wǎng)絡訪問的數(shù)據(jù)中提取對應的關(guān)鍵字段并解析對應的關(guān)鍵字段,也可以理解將數(shù)據(jù)流規(guī)則所指示的處理邏輯進行抽象,定義出一個個語義獨立的函數(shù)即篩選出的解析函數(shù),該解析函數(shù)用于從對應的網(wǎng)絡訪問的數(shù)據(jù)中提取對應的關(guān)鍵字段并解析對應的關(guān)鍵字段。根據(jù)數(shù)據(jù)流規(guī)則篩選解析函數(shù),可以為根據(jù)數(shù)據(jù)流規(guī)則從預設(shè)的多個解析函數(shù)中刪選出需要的解析函數(shù),該預設(shè)的多個解析函數(shù)可以認為包括與多個數(shù)據(jù)流規(guī)則對應的技術(shù)函數(shù),篩選出的解析函數(shù)可以認為與網(wǎng)絡訪問對應,篩選出的解析函數(shù)可以從網(wǎng)絡訪問的數(shù)據(jù)中提取需要的數(shù)據(jù)并進行解析以獲取解析后的關(guān)鍵字段,篩選出的解析函數(shù)也可以將網(wǎng)絡訪問的數(shù)據(jù)進行解析并從解析后的網(wǎng)絡訪問的數(shù)據(jù)中提取需要的部分以獲取解析后的關(guān)鍵字段。
需要說明的是,獲取獨立的解析后的關(guān)鍵字段也可以被抽象為通過獨立的解析函數(shù)實現(xiàn),用于獲取多個解析后的關(guān)鍵字段可以被認為包括一個或多個獨立的解析函數(shù)的邏輯組合。
示例性的,篩選出的解析函數(shù)提取網(wǎng)絡訪問的數(shù)據(jù)中的需要的部分后,可以對所提取的部分進行URL解碼以獲取關(guān)鍵字段。
本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理方法,通過確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,并根據(jù)該數(shù)據(jù)流規(guī)則篩選解析函數(shù),根據(jù)篩選出的解析函數(shù)獲取網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段并對關(guān)鍵字段進行解析,由于該數(shù)據(jù)流規(guī)則可以篩選解析函數(shù),并且被篩選的解析函數(shù)可以包括對應多個數(shù)據(jù)流規(guī)則的解析函數(shù),因此即使同時存在多個類型的網(wǎng)絡訪問,本發(fā)明提供的網(wǎng)絡訪問的管理方法仍能夠根據(jù)網(wǎng)絡訪問的數(shù)據(jù)獲取與該網(wǎng)絡訪問的類型對應的解析后的關(guān)鍵字段,從而能夠根據(jù)該解析后的關(guān)鍵字段管理該網(wǎng)絡訪問,因此提高了管理網(wǎng)絡訪問的效率,并改善了用戶體驗。
具體的,如附圖2所示,本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理方法,其特征在于,包括:
201、獲取網(wǎng)絡訪問的數(shù)據(jù)。
具體內(nèi)容參照上述實施例中步驟101,在此不再贅述。
202、確定網(wǎng)絡訪問的數(shù)據(jù)的應用節(jié)點,并根據(jù)應用節(jié)點在網(wǎng)絡訪問的數(shù)據(jù)中確定網(wǎng)絡訪問的數(shù)據(jù)的報文載荷。
203、將網(wǎng)絡訪問的數(shù)據(jù)的報文載荷與特征字符串進行匹配以確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則。
其中,特征字符串與數(shù)據(jù)流規(guī)則對應。
具體的,可以對網(wǎng)絡訪問的數(shù)據(jù)進行識別以確定該網(wǎng)絡訪問的類型,并根據(jù)該網(wǎng)絡訪問的類型查找應用結(jié)點哈希表以確定網(wǎng)絡訪問的數(shù)據(jù)的應用節(jié)點,并根據(jù)該應用節(jié)點在網(wǎng)絡訪問的數(shù)據(jù)中確定網(wǎng)絡訪問的數(shù)據(jù)的報文載荷。
將網(wǎng)絡訪問的數(shù)據(jù)的報文載荷與特征字符串進行匹配以確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,可以為對網(wǎng)絡訪問的數(shù)據(jù)的應用層載荷部分進行特征字符串多模匹配,當網(wǎng)絡訪問的數(shù)據(jù)匹配中某一數(shù)據(jù)流規(guī)則對應的特征字符串后,確定該網(wǎng)絡訪問與該數(shù)據(jù)流規(guī)則對應。
更進一步的,當網(wǎng)絡訪問的數(shù)據(jù)匹配中某一數(shù)據(jù)流規(guī)則對應的特征字符串后,可以對網(wǎng)絡訪問的數(shù)據(jù)進行IP地址、傳輸層協(xié)議和端口的檢查,以便于根據(jù)檢測結(jié)果進一步確定是否命中該某一數(shù)據(jù)流規(guī)則,特征字符串還可以增加與或非的語義,以滿足更復雜的篩選條件。若對網(wǎng)絡訪問的數(shù)據(jù)進行匹配的次數(shù)超過匹配報文數(shù)量仍然沒有命中數(shù)據(jù)流規(guī)則,則放行網(wǎng)絡訪問的數(shù)據(jù)。
示例性的,當網(wǎng)絡訪問的類型為新浪微博時,可以確定網(wǎng)絡訪問的數(shù)據(jù)的應用節(jié)點,并根據(jù)應用節(jié)點在網(wǎng)絡訪問的數(shù)據(jù)中確定網(wǎng)絡訪問的數(shù)據(jù)的報文載荷,將網(wǎng)絡訪問的數(shù)據(jù)的報文載荷匹配新浪微博對應的數(shù)據(jù)流規(guī)則對應的特征字符串,如果命中“POST/aj/mblog/add”,則進一步匹配傳輸層協(xié)議、目的端口等信息,若進一步的匹配結(jié)果滿足要求,則確認命中新浪微博發(fā)帖數(shù)據(jù)流規(guī)則,其它微博瀏覽類數(shù)據(jù)流則無法命中,避免進入應用關(guān)鍵字段提取的深度處理。
204、根據(jù)數(shù)據(jù)流規(guī)則篩選解析函數(shù),并根據(jù)篩選出的解析函數(shù)獲取網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段并進行解析。
具體內(nèi)容參照上述實施例中步驟103。
進一步的,可以將完成獲取解析后的關(guān)鍵字段的解析函數(shù)組合稱為函數(shù)鏈,當網(wǎng)絡訪問的數(shù)據(jù)包含多個關(guān)鍵字段信息時,該網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則可以用于指示多個函數(shù)鏈,其中每個關(guān)鍵字段可以均對應有特征字符串標識,特征字符串標識可以作為函數(shù)鏈執(zhí)行的入口。根據(jù)與數(shù)據(jù)流規(guī)則對應的解析函數(shù)解析網(wǎng)絡訪問的數(shù)據(jù)以獲取關(guān)鍵字段,可以為調(diào)用與數(shù)據(jù)流規(guī)則對應的函數(shù)鏈,然后遍歷執(zhí)行函數(shù)鏈下的解析函數(shù),完成關(guān)鍵字段提取以及解析。其中函數(shù)鏈下的解析函數(shù)中,每個解析函數(shù)的代碼實現(xiàn)是統(tǒng)一的,可以以指針的形式作為解析函數(shù)數(shù)據(jù)結(jié)構(gòu)的成員,其它的成員可以包括解析函數(shù)要操作的參數(shù)結(jié)構(gòu)體。每個解析函數(shù)的數(shù)據(jù)結(jié)構(gòu)在其所屬的函數(shù)鏈中可以擁有索引信息,當函數(shù)鏈執(zhí)行時,會保存當前解析函數(shù)的索引信息,可以通過改變函數(shù)鏈的當前函數(shù)索引實現(xiàn)循環(huán)和條件判斷等。
需要說明的是,可以在網(wǎng)絡訪問的數(shù)據(jù)中查找關(guān)鍵字段并通過與數(shù)據(jù)流規(guī)則對應的解析函數(shù)對關(guān)鍵字段進行解析。當確定網(wǎng)絡訪問的數(shù)據(jù)中不包括關(guān)鍵字段并且網(wǎng)絡訪問的數(shù)據(jù)為跨報文傳輸時,獲取再次到來的所述網(wǎng)絡訪問的數(shù)據(jù),并在獲取再次到來的所述網(wǎng)絡訪問的數(shù)據(jù)中查找關(guān)鍵字段并通過與數(shù)據(jù)流規(guī)則對應的解析函數(shù)對查找到的關(guān)鍵字段進行解析。
具體的,由于在實際應用中,關(guān)鍵字段可能被分在多個網(wǎng)絡訪問的數(shù)據(jù)報文進行傳輸即網(wǎng)絡訪問的數(shù)據(jù)為跨報文傳輸,而網(wǎng)絡訪問的數(shù)據(jù)報文在傳輸中又存在亂序的情況,因此,可以將收到的網(wǎng)絡訪問的數(shù)據(jù)進行緩存,并在確定網(wǎng)絡訪問的數(shù)據(jù)中不包括關(guān)鍵字段并且網(wǎng)絡訪問的數(shù)據(jù)為跨報文傳輸時,等待再次到來的網(wǎng)絡訪問的數(shù)據(jù),當獲取再次到來的網(wǎng)絡訪問的數(shù)據(jù)時,在再次到來的網(wǎng)絡訪問的數(shù)據(jù)中查找關(guān)鍵字段并通過與數(shù)據(jù)流規(guī)則對應的解析函數(shù)對查找到的關(guān)鍵字段進行解析。其中確定網(wǎng)絡訪問的數(shù)據(jù)中不包括關(guān)鍵字段并且網(wǎng)絡訪問的數(shù)據(jù)為跨報文傳輸,可以為在網(wǎng)絡訪問的數(shù)據(jù)查找開始特征字符串,并將開始特征字符串和結(jié)束特征字符串之間的字段確定為關(guān)鍵字段,當在網(wǎng)絡訪問的數(shù)據(jù)查找到開始特征字符串但直至當前數(shù)據(jù)報文結(jié)束仍未查找到結(jié)束特征字符串,則確定網(wǎng)絡訪問的數(shù)據(jù)為跨報文傳輸。
示例性的,當網(wǎng)絡訪問的類型為新浪微博時,可以根據(jù)與新浪微博對應的數(shù)據(jù)流規(guī)則的特征字符串匹配網(wǎng)絡訪問的數(shù)據(jù)報文,當命中“&text=”時,依次執(zhí)行數(shù)據(jù)流規(guī)則對應的函數(shù)鏈中的解析函數(shù),讀取“&text=”之后的信息存入$str_content動態(tài)映射后的應用關(guān)鍵字段數(shù)據(jù)結(jié)構(gòu),直到結(jié)束特征串標識“&”出現(xiàn)。若當前網(wǎng)絡訪問的數(shù)據(jù)報文讀取結(jié)束仍未找到結(jié)束特征串,則說明出現(xiàn)跨報文情況,因此保存函數(shù)鏈的當前函數(shù)索引為讀取字符串動作的索引,以及報文已經(jīng)讀取的長度等信息,函數(shù)鏈轉(zhuǎn)為掛起狀態(tài)。當該網(wǎng)絡訪問的下一個數(shù)據(jù)報文到來時,函數(shù)鏈從掛起狀態(tài)恢復為運行狀態(tài),從之前保存的當前函數(shù)索引開始繼續(xù)執(zhí)行讀取字符串動作,完成關(guān)鍵字段的提取及解析。
205、將解析后的關(guān)鍵字段儲存為預設(shè)格式,預設(shè)格式與網(wǎng)絡訪問對應。
具體的,解析后的關(guān)鍵字段可以儲存為指定的數(shù)據(jù)庫記錄以便于進一步審計,解析后的關(guān)鍵字段也可以作為精細化策略控制單元的輸入。精細化策略控制單元可以根據(jù)解析后的關(guān)鍵字段是否包含非法信息進行阻斷,也可以根據(jù)解析后的關(guān)鍵字段本身進行阻斷,從而實現(xiàn)精細化行為管理。
本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理方法,通過確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,并根據(jù)該數(shù)據(jù)流規(guī)則篩選解析函數(shù),根據(jù)篩選出的解析函數(shù)獲取網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段并進行解析,由于該數(shù)據(jù)流規(guī)則可以篩選解析函數(shù),并且被篩選的解析函數(shù)可以包括對應多個數(shù)據(jù)流規(guī)則的解析函數(shù),因此即使同時存在多個類型的網(wǎng)絡訪問,本發(fā)明的實施例仍能夠根據(jù)網(wǎng)絡訪問的數(shù)據(jù)獲取與該網(wǎng)絡訪問的類型對應的解析后的關(guān)鍵字段,從而能夠根據(jù)該解析后的關(guān)鍵字段管理該網(wǎng)絡訪問,因此提高了管理網(wǎng)絡訪問的效率,并改善了用戶體驗。
如附圖3所示,本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理裝置301,其特征在于,包括:
獲取模塊302,被配置為獲取網(wǎng)絡訪問的數(shù)據(jù)。
具體的,所述網(wǎng)絡訪問的數(shù)據(jù)可以為用戶使用應用進行網(wǎng)絡訪問時,該應用與網(wǎng)絡間交互的數(shù)據(jù)。示例性的,當用戶通過新浪微博應用發(fā)布微博時,新浪微博應用向?qū)姆掌鞫怂鶄鬏數(shù)臄?shù)據(jù)可以被認為是網(wǎng)絡訪問的數(shù)據(jù)。
處理模塊303,被配置為根據(jù)網(wǎng)絡訪問的數(shù)據(jù)確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則。
其中數(shù)據(jù)流規(guī)則用于指示網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段以及用于解析關(guān)鍵字段的解析協(xié)議。
具體的,根據(jù)網(wǎng)絡訪問的數(shù)據(jù)確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,可以為根據(jù)網(wǎng)絡訪問的數(shù)據(jù)確定該網(wǎng)絡訪問對應的應用的類型,即通過該網(wǎng)絡訪問的數(shù)據(jù)進行網(wǎng)絡訪問的應用的類型,并確定與該類型對應的數(shù)據(jù)流規(guī)則。
網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段可以為網(wǎng)絡訪問的數(shù)據(jù)中特定的字段,數(shù)據(jù)流規(guī)則可以通過指示該特定字段的字段信息、數(shù)據(jù)類型(整型、字符型)或長度來指示該關(guān)鍵字段。解析關(guān)鍵字段的解析協(xié)議可以為能夠?qū)⒃撽P(guān)鍵字段解析為指定格式的協(xié)議。
示例性的,當網(wǎng)絡訪問為郵箱類型的應用所進行的網(wǎng)絡訪問時,數(shù)據(jù)流規(guī)則可以通過檢索指定字符確定網(wǎng)絡訪問的數(shù)據(jù)中的特定字段例如發(fā)件人字段、收件人字段、標題字段、附件字段等,同時數(shù)據(jù)流規(guī)則還可以分別指定特定字段的數(shù)據(jù)類型(整型、字符型)或長度以便于進一步在網(wǎng)絡訪問的數(shù)據(jù)中確定特定字段。
進一步的,數(shù)據(jù)流規(guī)則所指示的特定字段可以包括三類,其中每一類特定字段需要能夠指定數(shù)據(jù)類型(整型、字符型)和長度。為了保證描述信息的簡潔,可以采用指示特定字段的類型和特定字段的長度前綴的方式,特定字段的長度通??梢灶A先設(shè)置好,不需要顯示描述。
示例性的,特定字段可以包括應用關(guān)鍵字段、報文相關(guān)信息字段以及普通變量字段,其中,應用關(guān)鍵字段為需要進行審計存入數(shù)據(jù)庫或者進行精細化策略控制的應用信息,例如論壇發(fā)帖的標題、正文等,示例性的,應用關(guān)鍵字段可以為:$str_title、$str_content。報文相關(guān)信息字段可以為鏈路層MAC地址信息、網(wǎng)絡層IP地址信息、傳輸層協(xié)議、端口信息、應用層載荷、長度等,報文相關(guān)信息字段可視為常量,一般不做修改。示例性的,報文相關(guān)信息字段可以為:@str_smac、@int_sip、@int_proto、@int_sport、@str_payload、@int_payloadlen。普通變量字段可以為整型變量、字符串變量,普通變量字段一般作為關(guān)鍵字段提取過程中暫存信息使用,保存臨時數(shù)據(jù)或計算結(jié)果,也可作為條件判斷、循環(huán)控制的臨時變量。示例性的,普通變量字段可以為int0、int1、str0、str1。
需要說明的是,數(shù)據(jù)流規(guī)則所指示的特定字段的長度可以根據(jù)數(shù)據(jù)流規(guī)則對應的網(wǎng)絡訪問類型的決定,例如報文相關(guān)信息字段的長度通常是固定,普通變量字段的長度能夠被預先設(shè)定。本發(fā)明的實施例并不對數(shù)據(jù)流規(guī)則的組織形式進行具體限定,數(shù)據(jù)流規(guī)則的組織形式可以包括鍵值對、可擴展標記語言(英文全稱:Extensible Markup Language,英文簡稱:XML)或JavaScript對象表示法(英文全稱:JavaScript Object Notation,英文簡稱:JSON)等
處理模塊303還被配置為,根據(jù)數(shù)據(jù)流規(guī)則篩選解析函數(shù),根據(jù)篩選出的解析函數(shù)獲取網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段并對關(guān)鍵字段進行解析,解析后的關(guān)鍵字段用于管理網(wǎng)絡訪問。
具體的,由于根據(jù)數(shù)據(jù)流規(guī)則可以獲取用于獲取所述網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段以及用于解析所述關(guān)鍵字段的解析協(xié)議,因此根據(jù)數(shù)據(jù)流規(guī)則篩選出的解析函數(shù)也可以理解為將數(shù)據(jù)流規(guī)則所指示的內(nèi)容,該解析函數(shù)用于從對應的網(wǎng)絡訪問的數(shù)據(jù)中提取對應的關(guān)鍵字段并解析對應的關(guān)鍵字段,也可以理解將數(shù)據(jù)流規(guī)則所指示的處理邏輯進行抽象,定義出一個個語義獨立的函數(shù)即篩選出的解析函數(shù),該解析函數(shù)用于從對應的網(wǎng)絡訪問的數(shù)據(jù)中提取對應的關(guān)鍵字段并解析對應的關(guān)鍵字段。根據(jù)數(shù)據(jù)流規(guī)則篩選解析函數(shù),可以為根據(jù)數(shù)據(jù)流規(guī)則從預設(shè)的多個解析函數(shù)中刪選出需要的解析函數(shù),該預設(shè)的多個解析函數(shù)可以認為包括與多個數(shù)據(jù)流規(guī)則對應的技術(shù)函數(shù),篩選出的解析函數(shù)可以認為與網(wǎng)絡訪問對應,篩選出的解析函數(shù)可以從網(wǎng)絡訪問的數(shù)據(jù)中提取需要的數(shù)據(jù)并進行解析以獲取解析后的關(guān)鍵字段,篩選出的解析函數(shù)也可以將網(wǎng)絡訪問的數(shù)據(jù)進行解析并從解析后的網(wǎng)絡訪問的數(shù)據(jù)中提取需要的部分以獲取解析后的關(guān)鍵字段。
需要說明的是,獲取獨立的解析后的關(guān)鍵字段也可以被抽象為通過獨立的解析函數(shù)實現(xiàn),用于獲取多個解析后的關(guān)鍵字段可以被認為包括一個或多個獨立的解析函數(shù)的邏輯組合。
示例性的,篩選出的解析函數(shù)提取網(wǎng)絡訪問的數(shù)據(jù)中的需要的部分后,可以對所提取的部分進行URL解碼以獲取關(guān)鍵字段。
本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理裝置,通過確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,根據(jù)該數(shù)據(jù)流規(guī)則篩選解析函數(shù),根據(jù)篩選出的解析函數(shù)獲取網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段并對關(guān)鍵字段進行解析,由于該數(shù)據(jù)流規(guī)則可以篩選解析函數(shù),并且被篩選的解析函數(shù)可以包括對應多個數(shù)據(jù)流規(guī)則的解析函數(shù),因此即使同時存在多個類型的網(wǎng)絡訪問,本發(fā)明提供的網(wǎng)絡訪問的管理裝置仍能夠根據(jù)網(wǎng)絡訪問的數(shù)據(jù)獲取與該網(wǎng)絡訪問的類型對應的解析后的關(guān)鍵字段,從而能夠根據(jù)該解析后的關(guān)鍵字段管理該網(wǎng)絡訪問,因此提高了管理網(wǎng)絡訪問的效率,并改善了用戶體驗。
具體的,處理模塊303具體被配置為:
確定網(wǎng)絡訪問的數(shù)據(jù)的應用節(jié)點,并根據(jù)應用節(jié)點在網(wǎng)絡訪問的數(shù)據(jù)中確定網(wǎng)絡訪問的數(shù)據(jù)的報文載荷,將網(wǎng)絡訪問的數(shù)據(jù)的報文載荷與特征字符串進行匹配以確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,特征字符串與數(shù)據(jù)流規(guī)則對應。
具體的,可以對網(wǎng)絡訪問的數(shù)據(jù)進行識別以確定該網(wǎng)絡訪問的類型,并根據(jù)該網(wǎng)絡訪問的類型查找應用結(jié)點哈希表以確定網(wǎng)絡訪問的數(shù)據(jù)的應用節(jié)點,并根據(jù)該應用節(jié)點在網(wǎng)絡訪問的數(shù)據(jù)中確定網(wǎng)絡訪問的數(shù)據(jù)的報文載荷。
將網(wǎng)絡訪問的數(shù)據(jù)的報文載荷與特征字符串進行匹配以確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,可以為對網(wǎng)絡訪問的數(shù)據(jù)的應用層載荷部分進行特征字符串多模匹配,當網(wǎng)絡訪問的數(shù)據(jù)匹配中某一數(shù)據(jù)流規(guī)則對應的特征字符串后,確定該網(wǎng)絡訪問與該數(shù)據(jù)流規(guī)則對應。
更進一步的,當網(wǎng)絡訪問的數(shù)據(jù)匹配中某一數(shù)據(jù)流規(guī)則對應的特征字符串后,可以對網(wǎng)絡訪問的數(shù)據(jù)進行IP地址、傳輸層協(xié)議和端口的檢查,以便于根據(jù)檢測結(jié)果進一步確定是否命中該某一數(shù)據(jù)流規(guī)則,特征字符串還可以增加與或非的語義,以滿足更復雜的篩選條件。若對網(wǎng)絡訪問的數(shù)據(jù)進行匹配的次數(shù)超過匹配報文數(shù)量仍然沒有命中數(shù)據(jù)流規(guī)則,則放行網(wǎng)絡訪問的數(shù)據(jù)。
示例性的,當網(wǎng)絡訪問的類型為新浪微博時,可以確定網(wǎng)絡訪問的數(shù)據(jù)的應用節(jié)點,并根據(jù)應用節(jié)點在網(wǎng)絡訪問的數(shù)據(jù)中確定網(wǎng)絡訪問的數(shù)據(jù)的報文載荷,將網(wǎng)絡訪問的數(shù)據(jù)的報文載荷匹配新浪微博對應的數(shù)據(jù)流規(guī)則對應的特征字符串,如果命中“POST/aj/mblog/add”,則進一步匹配傳輸層協(xié)議、目的端口等信息,若進一步的匹配結(jié)果滿足要求,則確認命中新浪微博發(fā)帖數(shù)據(jù)流規(guī)則,其它微博瀏覽類數(shù)據(jù)流則無法命中,避免進入應用關(guān)鍵字段提取的深度處理。
具體的,處理模塊303具體被配置為:
在網(wǎng)絡訪問的數(shù)據(jù)中查找關(guān)鍵字段并通過與數(shù)據(jù)流規(guī)則對應的解析函數(shù)對查找到的關(guān)鍵字段進行解析;
當確定已查找的網(wǎng)絡訪問的數(shù)據(jù)中不包括關(guān)鍵字段并且網(wǎng)絡訪問的數(shù)據(jù)為跨報文傳輸時,獲取再次到來的網(wǎng)絡訪問的數(shù)據(jù),并在再次到來的網(wǎng)絡訪問的數(shù)據(jù)中查找關(guān)鍵字段并通過與數(shù)據(jù)流規(guī)則對應的解析函數(shù)對查找到的關(guān)鍵字段進行解析。
具體的,由于在實際應用中,關(guān)鍵字段可能被分在多個網(wǎng)絡訪問的數(shù)據(jù)報文進行傳輸即網(wǎng)絡訪問的數(shù)據(jù)為跨報文傳輸,而網(wǎng)絡訪問的數(shù)據(jù)報文在傳輸中又存在亂序的情況,因此,可以將收到的網(wǎng)絡訪問的數(shù)據(jù)進行緩存,并在確定網(wǎng)絡訪問的數(shù)據(jù)中不包括關(guān)鍵字段并且網(wǎng)絡訪問的數(shù)據(jù)為跨報文傳輸時,等待再次到來的網(wǎng)絡訪問的數(shù)據(jù),當獲取再次到來的網(wǎng)絡訪問的數(shù)據(jù)時,在再次到來的網(wǎng)絡訪問的數(shù)據(jù)中查找關(guān)鍵字段并通過與數(shù)據(jù)流規(guī)則對應的解析函數(shù)對關(guān)鍵字段進行解析。其中確定網(wǎng)絡訪問的數(shù)據(jù)中不包括關(guān)鍵字段并且網(wǎng)絡訪問的數(shù)據(jù)為跨報文傳輸,可以為在網(wǎng)絡訪問的數(shù)據(jù)查找開始特征字符串,并將開始特征字符串和結(jié)束特征字符串之間的字段確定為關(guān)鍵字段,當在網(wǎng)絡訪問的數(shù)據(jù)查找到開始特征字符串但直至當前數(shù)據(jù)報文結(jié)束仍未查找到結(jié)束特征字符串,則確定網(wǎng)絡訪問的數(shù)據(jù)為跨報文傳輸。
可以將完成獲取關(guān)鍵字段的解析函數(shù)組合稱為函數(shù)鏈,當網(wǎng)絡訪問的數(shù)據(jù)包含多個關(guān)鍵字段信息時,該網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則可以用于指示多個函數(shù)鏈,其中每個關(guān)鍵字段可以均對應有特征字符串標識,特征字符串標識可以作為函數(shù)鏈執(zhí)行的入口。根據(jù)與數(shù)據(jù)流規(guī)則對應的解析函數(shù)解析網(wǎng)絡訪問的數(shù)據(jù)以獲取解析后的關(guān)鍵字段,可以為調(diào)用與數(shù)據(jù)流規(guī)則對應的函數(shù)鏈,然后遍歷執(zhí)行函數(shù)鏈下的解析函數(shù),完成關(guān)鍵字段提取以及解析。其中函數(shù)鏈下的解析函數(shù)中,每個解析函數(shù)的代碼實現(xiàn)是統(tǒng)一的,可以以指針的形式作為解析函數(shù)數(shù)據(jù)結(jié)構(gòu)的成員,其它的成員可以包括解析函數(shù)要操作的參數(shù)結(jié)構(gòu)體。每個解析函數(shù)的數(shù)據(jù)結(jié)構(gòu)在其所屬的函數(shù)鏈中可以擁有索引信息,當函數(shù)鏈執(zhí)行時,會保存當前解析函數(shù)的索引信息,可以通過改變函數(shù)鏈的當前函數(shù)索引實現(xiàn)循環(huán)和條件判斷等。
示例性的,當網(wǎng)絡訪問的類型為新浪微博時,可以根據(jù)與新浪微博對應的數(shù)據(jù)流規(guī)則的特征字符串匹配網(wǎng)絡訪問的數(shù)據(jù)報文,當命中“&text=”時,依次執(zhí)行數(shù)據(jù)流規(guī)則對應的函數(shù)鏈中的解析函數(shù),讀取“&text=”之后的信息存入$str_content動態(tài)映射后的應用關(guān)鍵字段數(shù)據(jù)結(jié)構(gòu),直到結(jié)束特征串標識“&”出現(xiàn)。若當前網(wǎng)絡訪問的數(shù)據(jù)報文讀取結(jié)束仍未找到結(jié)束特征串,則說明出現(xiàn)跨報文情況,因此保存函數(shù)鏈的當前函數(shù)索引為讀取字符串動作的索引,以及報文已經(jīng)讀取的長度等信息,函數(shù)鏈轉(zhuǎn)為掛起狀態(tài)。當該網(wǎng)絡訪問的下一個數(shù)據(jù)報文到來時,函數(shù)鏈從掛起狀態(tài)恢復為運行狀態(tài),從之前保存的當前函數(shù)索引開始繼續(xù)執(zhí)行讀取字符串動作,完成關(guān)鍵字段的提取及解析。
具體的,如附圖4所示,網(wǎng)絡訪問的管理裝置301還包括儲存模塊304;
所述處理模塊303還被配置為:
控制儲存模塊304將解析后的關(guān)鍵字段儲存為預設(shè)格式,預設(shè)格式與網(wǎng)絡訪問對應。
具體的,解析后的關(guān)鍵字段可以儲存為指定的數(shù)據(jù)庫記錄以便于進一步審計,解析后的關(guān)鍵字段也可以作為精細化策略控制單元的輸入。精細化策略控制單元可以根據(jù)解析后的關(guān)鍵字段是否包含非法信息進行阻斷,也可以根據(jù)解析后的關(guān)鍵字段本身進行阻斷,從而實現(xiàn)精細化行為管理。
本發(fā)明的實施例提供了一種網(wǎng)絡訪問的管理裝置,通過確定與網(wǎng)絡訪問對應的數(shù)據(jù)流規(guī)則,并根據(jù)該數(shù)據(jù)流規(guī)則篩選解析函數(shù),根據(jù)篩選出的解析函數(shù)獲取網(wǎng)絡訪問的數(shù)據(jù)中的關(guān)鍵字段并進行解析,由于該數(shù)據(jù)流規(guī)則可以篩選解析函數(shù),并且被篩選的解析函數(shù)可以包括對應多個數(shù)據(jù)流規(guī)則的解析函數(shù),因此即使同時存在多個類型的網(wǎng)絡訪問,本發(fā)明的實施例仍能夠根據(jù)網(wǎng)絡訪問的數(shù)據(jù)獲取與該網(wǎng)絡訪問的類型對應的解析后的關(guān)鍵字段,從而能夠根據(jù)該解析后的關(guān)鍵字段管理該網(wǎng)絡訪問,因此提高了管理網(wǎng)絡訪問的效率,并改善了用戶體驗。
通過以上的實施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可以用硬件實現(xiàn),或固件實現(xiàn),或它們的組合方式來實現(xiàn)。當使用軟件實現(xiàn)時,可以將上述功能存儲在計算機可讀介質(zhì)中或作為計算機可讀介質(zhì)上的一個或多個指令或代碼進行傳輸。計算機可讀介質(zhì)包括計算機存儲介質(zhì)和通信介質(zhì),其中通信介質(zhì)包括便于從一個地方向另一個地方傳送計算機程序的任何介質(zhì)。存儲介質(zhì)可以是計算機能夠存取的任何可用介質(zhì)。以此為例但不限于:計算機可讀介質(zhì)可以包括隨機存儲器(英文全稱:Random Access Memory,英文簡稱:RAM)、只讀存儲器(英文全稱:Read Only Memory,英文簡稱:ROM)、電可擦可編程只讀存儲器(英文全稱:Electrically Erasable Programmable Read Only Memory,英文簡稱:EEPROM)、只讀光盤(英文全稱:Compact Disc Read Only Memory,英文簡稱:CD-ROM)或其他光盤存儲、磁盤存儲介質(zhì)或者其他磁存儲設(shè)備、或者能夠用于攜帶或存儲具有指令或數(shù)據(jù)結(jié)構(gòu)形式的期望的程序代碼并能夠由計算機存取的任何其他介質(zhì)。此外。任何連接可以適當?shù)某蔀橛嬎銠C可讀介質(zhì)。例如,如果軟件是使用同軸電纜、光纖光纜、雙絞線、數(shù)字用戶專線(英文全稱:Digital Subscriber Line,英文簡稱:DSL)或者諸如紅外線、無線電和微波之類的無線技術(shù)從網(wǎng)站、服務器或者其他遠程源傳輸?shù)模敲赐S電纜、光纖光纜、雙絞線、DSL或者諸如紅外線、無線和微波之類的無線技術(shù)包括在計算機可讀介質(zhì)的定義中。
通過以上的實施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,當以軟件方式實現(xiàn)本發(fā)明時,可以將用于執(zhí)行上述方法的指令或代碼存儲在計算機可讀介質(zhì)中或通過計算機可讀介質(zhì)進行傳輸。計算機可讀介質(zhì)包括計算機存儲介質(zhì)和通信介質(zhì),其中通信介質(zhì)包括便于從一個地方向另一個地方傳送計算機程序的任何介質(zhì)。存儲介質(zhì)可以是計算機能夠存取的任何可用介質(zhì)。以此為例但不限于:計算機可讀介質(zhì)可以包括RAM、ROM、電可擦可編程只讀存儲器(全稱:electrically erasable programmable read-only memory,簡稱:EEPROM)、光盤、磁盤或者其他磁存儲設(shè)備、或者能夠用于攜帶或存儲具有指令或數(shù)據(jù)結(jié)構(gòu)形式的期望的程序代碼并能夠由計算機存取的任何其他介質(zhì)。
以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應所述以權(quán)利要求的保護范圍為準。