一種用于對web應用進行安全處理的方法與設備的制作方法
【專利摘要】本發(fā)明的目的是提供一種用于對web應用進行安全處理的方法與設備,其中,處理設備獲取待處理的web應用;通過對該web應用的應用相關信息進行特征識別,確定所述web應用的應用特征信息;根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息;根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。與現(xiàn)有技術相比,本發(fā)明通過對待處理的web應用進行特征識別,根據(jù)所識別的應用特征信息,確定與其相對應的安全相關信息,進而根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理;從而提高了對web應用的安全處理效率,節(jié)約了web安全處理的處理資源,還縮短了用戶訪問web應用的響應時間,從而提高了用戶獲取數(shù)據(jù)的效率,改善了用戶的使用體驗。
【專利說明】一種用于對web應用進行安全處理的方法與設備
【技術領域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)【技術領域】,尤其涉及一種用于對web應用進行安全處理的技術。
【背景技術】
[0002]當前,對于web應用進行安全處理,主要通過對所述web應用進行漏洞掃描等方式進行。然而利用漏洞掃描對所述web應用進行處理會消耗大量的時間,如對一個網(wǎng)站的掃描時間約為半天到一天,消耗時間長,處理效率低。
[0003]因此,對于大量的、具有不同框架或模板的web應用來說,利用普通的漏洞掃描器會由于沒有針對性而導致掃描時間過長,同時無法做到及時反饋,影響了 web應用的改進與更新,進而可能由于所述web應用中所存在的安全問題導致更嚴重的后果。
[0004]因此,如何解決目前不同的web應用由于如框架、模板、版本等不一樣導致的掃描時間長且無法及時反饋,成為本領域技術人員亟待解決的問題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的是提供一種用于對web應用進行安全處理的方法與設備。
[0006]根據(jù)本發(fā)明的一個方面,提供了一種用于對web應用進行安全處理的方法,其中,該方法包括以下步驟:
[0007]a獲取待處理的web應用;
[0008]b通過對所述web應用的應用相關信息進行特征識別,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息;
[0009]c根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應;
[0010]d根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。
[0011]根據(jù)本發(fā)明的另一方面,還提供了一種用于對web應用進行安全處理的處理設備,其中,該設備包括:
[0012]獲取裝置,用于獲取待處理的web應用;
[0013]識別裝置,用于通過對所述web應用的應用相關信息進行特征識別,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息;
[0014]確定裝置,用于根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應;
[0015]處理裝置,用于根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。
[0016]與現(xiàn)有技術相比,本發(fā)明通過對待處理的web應用進行特征識別,根據(jù)所識別的應用特征信息,確定與其相對應的安全相關信息,進而根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理;從而提高了對web應用的安全處理效率,節(jié)約了 web安全處理的處理資源,還縮短了用戶訪問web應用的響應時間,從而提高了用戶獲取數(shù)據(jù)的效率,改善了用戶的使用體驗。
[0017]而且,本發(fā)明還可以根據(jù)所述web應用的頁面特征信息,對所述web應用的應用特征信息進行確定;進一步地,還可以根據(jù)參考頁面特征信息,對所述web應用的應用特征信息進行確定;進一步地,還可以對頁面應用相關信息進行獲?。粡亩盟鲰撁嫣卣餍畔?,提高了對web應用的應用特征信息的準確度,進而提高了安全處理效率,節(jié)約了 web安全處理的處理資源,還縮短了用戶訪問web應用的響應時間,從而提高了用戶獲取數(shù)據(jù)的效率,改善了用戶的使用體驗。
[0018]而且,本發(fā)明還可以根據(jù)所述web應用的候選應用特征信息所對應的可信度信息,對所述web應用的應用特征信息進行確定;進一步地,可利用貝葉斯評判獲取平滑的可信度信息;從而利用所述可信度信息,提高了對web應用的安全處理效率,節(jié)約了 web安全處理的處理資源,還縮短了用戶訪問web應用的響應時間,從而提高了用戶獲取數(shù)據(jù)的效率,改善了用戶的使用體驗。
[0019]而且,本發(fā)明還可以根據(jù)安全相關信息中的掃描應用信息,對所述web應用執(zhí)行對應的掃描應用;或是根據(jù)安全相關信息中的安全配置信息,對所述web應用執(zhí)行或更新對應的安全配置,從而進一步細化了所述安全處理的類型,進而提高了對web應用的安全處理效率,節(jié)約了 web安全處理的處理資源,還縮短了用戶訪問web應用的響應時間,從而提高了用戶獲取數(shù)據(jù)的效率,改善了用戶的使用體驗。
[0020]而且,本發(fā)明還可以將安全處理的執(zhí)行結(jié)果發(fā)送至所述web應用所對應的目標應用,從而提高了安全處理的反饋效率,保證了 web應用的安全性,節(jié)約了 web安全處理的處理資源,還縮短了用戶訪問web應用的響應時間,從而提高了用戶獲取數(shù)據(jù)的效率,改善了用戶的使用體驗。
【專利附圖】
【附圖說明】
[0021]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
[0022]圖1示出根據(jù)本發(fā)明一個方面的一種用于對web應用進行安全處理的處理設備示意圖;
[0023]圖2示出根據(jù)本發(fā)明一個優(yōu)選實施例的一種用于對web應用進行安全處理的處理設備不意圖;
[0024]圖3示出根據(jù)本發(fā)明另一個優(yōu)選實施例的一種用于對web應用進行安全處理的處理設備示意圖;
[0025]圖4示出根據(jù)本發(fā)明另一個方面的一種用于對web應用進行安全處理的方法流程圖;
[0026]圖5示出根據(jù)本發(fā)明一個優(yōu)選實施例的一種用于對web應用進行安全處理的方法流程圖;
[0027]圖6示出根據(jù)本發(fā)明另一個優(yōu)選實施例的一種用于對web應用進行安全處理的方法流程圖。
[0028]附圖中相同或相似的附圖標記代表相同或相似的部件?!揪唧w實施方式】
[0029]下面結(jié)合附圖對本發(fā)明作進一步詳細描述。
[0030]圖1示出根據(jù)本發(fā)明一個方面的一種用于對web應用進行安全處理的處理設備示意圖;其中,該處理設備包括獲取裝置11、識別裝置12、確定裝置13、處理裝置14。具體地,獲取裝置11獲取待處理的web應用;識別裝置12通過對所述web應用的應用相關信息進行特征識別,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息;確定裝置13根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應;處理裝置14根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。在此,所述處理設備包括但不限于網(wǎng)絡設備、用戶設備、或網(wǎng)絡設備與用戶設備通過網(wǎng)絡相集成所構(gòu)成的設備。其中,所述網(wǎng)絡設備其包括但不限于計算機、網(wǎng)絡主機、單個網(wǎng)絡服務器、多個網(wǎng)絡服務器集或多個服務器構(gòu)成的云;在此,云由基于云計算(CloudComputing)的大量計算機或網(wǎng)絡服務器構(gòu)成,其中,云計算是分布式計算的一種,由一群松散耦合的計算機集組成的一個虛擬超級計算機。所述用戶設備其包括但不限于任何一種可與用戶通過鍵盤、遙控器、觸摸板、或聲控設備進行人機交互的電子產(chǎn)品,例如計算機、智能手機、PDA、游戲機、或IPTV等。所述網(wǎng)絡包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡、無線自組織網(wǎng)絡(Ad Hoc網(wǎng)絡)等。本領域技術人員應能理解,其他的處理設備同樣適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并在此以引用方式包含于此。
[0031]上述各裝置之間是持續(xù)不斷工作的,在此,本領域技術人員應理解“持續(xù)”是指上述各裝置分別實時地,或者按照設定的或?qū)崟r調(diào)整的工作模式要求,進行待處理的web應用的獲取、應用特征信息的確定、安全相關信息的確定、web應用的安全處理等,直至處理設備停止獲取待處理的web應用。
[0032]其中,獲取裝置11獲取待處理的web應用。具體地,獲取裝置11通過基于各種通信協(xié)議(Communications Protocol),通過各種數(shù)據(jù)傳輸接口,與其他能夠提供所述待處理的web應用的設備,如web應用數(shù)據(jù)庫或是web應用系統(tǒng)等進行交互,獲取待處理的web應用。其中,所述web應用包括但不限于網(wǎng)頁、網(wǎng)站、web應用系統(tǒng)(如鐵路售票系統(tǒng))等。在此,“通信協(xié)議”包括計算機通信的傳送協(xié)議,如TCP/IP、UDP、FTP、ICMP、NetBEn等,或者存在于計算機中的其他形式通信,例如面向?qū)ο缶幊汤锩鎸ο笾g的通信或操作系統(tǒng)內(nèi)不同程序或計算機不同模塊之間的消息傳送協(xié)議。
[0033]識別裝置12通過對所述web應用的應用相關信息進行特征識別,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。具體地,識別裝置12通過根據(jù)所獲取的待處理的web應用,對所述應用的應用相關信息進行提取,其中,所述應用相關信息如web應用的內(nèi)容信息、web應用的標簽、web應用的關鍵字信息、web應用的代碼信息,或者通過對所述web應用所對應的web頁面的源代碼進行分析,獲取所述web頁面的Title (標題)、Meta信息、文本內(nèi)容、Powered By等信息,并作為所述應用相關信息;根據(jù)所述應用相關信息,如利用web指紋識別方式,對所述代碼信息進行分析,例如將所述代碼中的關鍵字與應用特征信息相匹配等方式,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息、服務器版本、編程語言、第三方應用等;其中,服務器版本如Apache、Lighttpd,nginx等,編程語言如PHP、JAVA以及其他,第三方應用如Discuz、phpwind、wordpress、BLOG、phpcms、Ecshop、Joomla 等,常用框架如 THINKPHP、Struts、CakePHP> YII 等,常用模板如Smarty等。
[0034]確定裝置13根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應。具體地,確定裝置13根據(jù)識別裝置12所確定的所述web應用的應用特征信息,如所述web應用的框架相關信息或模板相關信息,確定與所述應用特征信息相對應的安全相關信息,從而確定了與所述web應用相對應的安全相關信息,其中,所述安全相關信息包括但不限于與所述框架或模板相對應的安全通知、與所述web應用相對應的掃描應用信息、所述安全相關信息包括與所述web應用相對應的掃描應用信息等。例如,將所述web應用特征信息中的模板信息與包含安全相關信息的數(shù)據(jù)庫進行匹配,確定與所述模板相對應的安全信息為存在安全隱患,則確定裝置13確定與所述web應用相對應的安全相關信息為危險,并可提示所述web應用進行掃描。
[0035]處理裝置14根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。具體地,所述處理裝置14可根據(jù)所述安全相關信息,對所述web應用進行如漏洞掃描或根據(jù)安全相關信息來更新安全配置等處理方式;或者通過漏洞掃描,當掃描出現(xiàn)問題后,對所述web應用的安全配置進行更新,或者直接升級所述web應用。
[0036]優(yōu)選地,當所述安全相關信息包括與所述web應用相對應的掃描應用信息時,所述處理裝置14還可以根據(jù)所述掃描應用信息,對所述web應用執(zhí)行對應的掃描應用。具體地,當所述安全相關信息包括與所述web應用的框架或模板相對應的掃描應用信息時,所述處理裝置14可以針對特定的框架或模板,僅執(zhí)行與所述框架或模板相對應的掃描操作。
[0037]優(yōu)選地,當所述安全相關信息包括與所述web應用相對應的安全配置信息時,所述處理裝置14還可以根據(jù)所述安全配置信息,對所述web應用執(zhí)行或更新對應的安全配置。具體地,當所述安全相關信息包括與所述web應用的框架或模板相對應的安全配置信息時,所述處理裝置14還可以根據(jù)與所述web應用的框架或模板相對應的安全配置信息,對所述web應用執(zhí)行或更新對應的安全配置。例如,根據(jù)外部或其他應用獲知的相關安全事件而確定的安全配置更新,對該web應用的相關配置進行更新。
[0038]優(yōu)選地,所述處理設備還包括發(fā)送裝置(未示出),其中,所述發(fā)送裝置將所述安全處理的執(zhí)行結(jié)果,發(fā)送至所述web應用所對應的目標應用。具體地,所述發(fā)送裝置將所述安全處理的執(zhí)行結(jié)果,如所述安全相關信息和/或所述web應用的安全處理的完成度、漏洞信息等,通過郵件、短信、系統(tǒng)消息等方式,發(fā)送與所述web應用所對應的目標應用中。其中,所述目標應用包括但不限于與所述web應用相關聯(lián)的人員(如所述web應用的開發(fā)人員或測試人員等)的相應接收應用(如所述web開發(fā)人員的郵箱等)、與所述web應用的應用特征信息相關聯(lián)的其他web應用或者其他程序等。
[0039]圖2不出根據(jù)本發(fā)明一個優(yōu)選實施例的一種用于對web應用進行安全處理的處理設備示意圖;其中,該處理設備包括獲取裝置11’、識別裝置12’、確定裝置13’、處理裝置14’,其中,所述識別裝置12’包括信息獲取單元121’和第一特征確定單元122’。具體地,獲取裝置11’獲取待處理的web應用;信息獲取單元121’獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù);第一特征確定單元122’根據(jù)所述應用頁面數(shù)據(jù)中所包含的頁面特征信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息;確定裝置13’根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應;處理裝置14’根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。其中,所述獲取裝置11’、確定裝置13’、處理裝置14’分別與圖1所示對應裝置相同或基本相同,故此處不再贅述,并通過引用的方式包含于此。
[0040]上述各裝置之間是持續(xù)不斷工作的,在此,本領域技術人員應理解“持續(xù)”是指上述各裝置分別實時地,或者按照設定的或?qū)崟r調(diào)整的工作模式要求,進行待處理的web應用的獲取、應用相關信息的確定、應用特征信息的確定、安全相關信息的確定、web應用的安全處理等,直至處理設備停止獲取待處理的web應用。
[0041]信息獲取單元121’獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù)。具體地,信息獲取單元121’通過利用如屏幕抓取或web抓取框架等方式,抓取所述web應用的站點信息和/或web頁面中的結(jié)構(gòu)化數(shù)據(jù),例如,信息獲取單元121’先獲取所述web應用的URL信息,對所述URL信息中可獲取的鏈接進行跟蹤,獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù)。
[0042]在此,所述獲取方式包括但不限于以下一種或多種獲取方式:
[0043]1:快速連接提取
[0044]通過利用如正則表達式等編寫連接提取,以用于鏈接的提取,該方式的優(yōu)點是速度快,缺點是對html語義的解析不足,易把注釋里的鏈接也包含進來。另外基于javascript重定向url也需進行提取。
[0045]2:爬蟲抓取
[0046]例如通過對url進行分析,獲取url是否包含”? ”判斷一個網(wǎng)頁是否為動態(tài)網(wǎng)頁,獲取非動態(tài)網(wǎng)頁的url地址,更優(yōu)選地,可通過設置閾值的方式,獲取定量的url地址,以實現(xiàn)爬蟲抓取。
[0047]3:增量抓取
[0048]由于針對多個網(wǎng)站的爬蟲很難一次性把所有網(wǎng)頁爬取下來,并且網(wǎng)頁也處于不斷更新的狀態(tài)中,爬取是一個動態(tài)的過程,因此還可以支持對網(wǎng)頁的動態(tài)增量抓取,從而及時獲取所述web應用的應用相關信息,進而進行特征識別。
[0049]第一特征確定單元122’根據(jù)所述應用頁面數(shù)據(jù)中所包含的頁面特征信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。具體地,第一特征確定單元122’通過根據(jù)所述應用頁面數(shù)據(jù),確定所述應用頁面數(shù)據(jù)中所包含的頁面特征信息,其中,所述頁面特征信息包括但不限于頁面關鍵字、文件的MD5、URL的關鍵字或URL的Tag模式;根據(jù)所述頁面特征信息,通過匹配或查詢等方式,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。例如,一般的web應用在html、jS、CSS等文件中包含若干特征代碼,因此可以采用特征代碼匹配模式。比如wordpress如果沒有進行隱藏的話,在robots,txt 中會包含 wp-admin 等,首頁 index, php 中會包含 generator = wordpress 3.xx,所述3.XX為版本號,頁面中會包含wp-content路徑等。所述“wp-admin”或“generator =wordpress”或“wp-content”等可作為頁面關鍵字。其他的應用也有類似的關鍵字,如discuz、dedecms、phpwind等在頁面中都會發(fā)現(xiàn)一些固定的特征代碼;根據(jù)所述特征代碼,可以通過特征代碼匹配模式,確定所述web應用的應用特征信息。
[0050]優(yōu)選地,所述第一特征確定單元122’還可以根據(jù)所述應用頁面數(shù)據(jù)中所含的頁面特征信息,并結(jié)合所述應用頁面數(shù)據(jù)的參考頁面數(shù)據(jù)的參考頁面特征信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。具體地,所述第一特征確定單元122’還可以通過獲取所述應用頁面數(shù)據(jù)的一個或多個參考頁面數(shù)據(jù),通過將所述應用頁面數(shù)據(jù)中所含的頁面特征信息、與所述參考頁面數(shù)據(jù)的參考頁面特征信息進行匹配、對比等方式,例如將所述應用頁面數(shù)據(jù)與參考頁面數(shù)據(jù)的特征信息中不同或相同的部分,結(jié)合所述參考頁面數(shù)據(jù)的數(shù)據(jù)量或參考頁面在整個web應用中的位置信息等方式,確定為所述web應用的應用特征信息。其中,所述參考頁面可以與所述應用頁面屬于同一個web應用,也可以為與所述web應用的網(wǎng)頁或頁面鄰近或相似的鏈接等。例如,當所述參考頁面可以與所述應用頁面屬于同一個web應用時,應用頁面數(shù)據(jù)為http://baidu.com/wordpress/login.action,其對應的參考頁面數(shù)據(jù)包括如下三條數(shù)據(jù)信息:http://baidu.com/discuz/loginl.action、http://baidu.com/discuz/login2.action、http://baidu.com/discuz/login3.action,則可以據(jù)此確定對于整個 web應用而言,所述web應用的應用特征信息為discuz,而非wordpress。
[0051]優(yōu)選地,所述信息獲取單元121’還可以據(jù)頁面獲取規(guī)則,獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù)。具體地,所述信息獲取單元121’還可以根據(jù)預定或設置的頁面獲取規(guī)則,獲取特定的頁面,進而獲取特定的應用頁面數(shù)據(jù),從而獲取所述web應用的應用相關信息。
[0052]其中,所述頁面獲取規(guī)則包括以下至少任一項:
[0053]-所述web應用的頁面數(shù)據(jù)的數(shù)據(jù)類型信息,如制定抓取特定類型的數(shù)據(jù),如js、css、html 等;
[0054]-所述web應用的應用頁面的頁面類型信息,其中,所述頁面類型信息包括但不限于靜態(tài)網(wǎng)頁或動態(tài)網(wǎng)頁,或gif、jpg、png等類型等,因此可以獲取其中一種或多種頁面,如僅獲取靜態(tài)頁面等;
[0055]-所述web應用的應用頁面的頁面數(shù)量閾值,其中,所述頁面數(shù)量閾值可根據(jù)系統(tǒng)預置或用戶自定義等方式,例如僅獲取頁面數(shù)量閾值M個網(wǎng)頁,超過M個網(wǎng)頁后則不再獲?。?br>
[0056]-所述web應用的應用頁面的頁面更新信息,例如,僅獲取具有頁面更新信息的應用頁面等。
[0057]圖3示出根據(jù)本發(fā)明另一個優(yōu)選實施例的一種用于對web應用進行安全處理的處理設備示意圖;其中,該處理設備包括獲取裝置11”、識別裝置12”、確定裝置13”、處理裝置14”,其中,所述識別裝置12”包括候選特征確定單元123”和第二特征確定單元124”。具體地,獲取裝置11”獲取待處理的web應用;候選特征確定單元123”通過對所述web應用的應用相關信息進行特征識別,確定所述web應用所對應的多個候選應用特征信息;第二特征確定單元124”根據(jù)所述候選應用特征信息所對應的可信度信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息;確定裝置13”根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應;處理裝置14”根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。其中,所述獲取裝置11”、確定裝置13”、處理裝置14”分別與圖1所示對應裝置相同或基本相同,故此處不再贅述,并通過引用的方式包含于此。
[0058]上述各裝置之間是持續(xù)不斷工作的,在此,本領域技術人員應理解“持續(xù)”是指上述各裝置分別實時地,或者按照設定的或?qū)崟r調(diào)整的工作模式要求,進行待處理的web應用的獲取、候選應用特征信息的確定、應用特征信息的確定、安全相關信息的確定、web應用的安全處理等,直至處理設備停止獲取待處理的web應用。
[0059]候選特征確定單元123”通過對所述web應用的應用相關信息進行特征識別,確定所述web應用所對應的多個候選應用特征信息。具體地,所述候選特征確定單元123”通過對所述web應用的應用相關信息進行特征識別,通過對所述web應用中的如網(wǎng)頁或網(wǎng)站等進行特征識別,確定所述web應用所對應的多個候選應用特征信息。其中,所述候選應用信息包括但不限于所述web應用所使用的模板或框架相關信息等。其中,所述確定方式與圖1或圖2中所述識別裝置12或識別裝置12’的確定方式相同或相似,此處不再贅述,并以引用的形式包含于此。
[0060]第二特征確定單元124”根據(jù)所述候選應用特征信息所對應的可信度信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。具體地,所述第二特征確定單元124”通過根據(jù)所述候選應用特征信息,通過在如規(guī)則數(shù)據(jù)庫中查詢等方式,確定與所述候選應用特征信息相對應的可信度信息,通過根據(jù)所述可信度信息,對所述應用特征信息進行確定;在此,所述可信度信息表示所述應用相關信息與其所對應的候選應用特征信息的準確度,所述規(guī)則數(shù)據(jù)庫中的每一條規(guī)則即表示所述應用相關信息與其所對應的候選應用特征信息的對應關系,并包含該對應關系的可信度信息。
[0061]例如,根據(jù)機器學習或統(tǒng)計訓練,對所述規(guī)則數(shù)據(jù)庫中的規(guī)則的可信度信息進行訓練,如經(jīng)過N次訓練,規(guī)則I匹配成功M次,其中,如果正確的次數(shù)為L次,則該條規(guī)則的可信度為L/M。
[0062]假定匹配中有規(guī)則1、規(guī)則2和規(guī)則3,其中規(guī)則I的可信度為90%、規(guī)則2的可信度為80%、規(guī)則3的可信度為70%,可以通過利用例如公式I對所述應用特征信息的可信度進行計算,以避免簡單的對規(guī)則的可信度進行平均或求和,所導致的可信度不準:
[0063]T(Ri) ≤ P ≤ 100%(公式 1)
[0064]其中,Ri為匹配中的規(guī)則中可信度最大的一條規(guī)則。
[0065]假設對所述web應用進行識別,識別出來一個可能的結(jié)果為discuz,并匹配到兩條規(guī)則I和2。假設所有規(guī)則均相互獨立,設同時出現(xiàn)規(guī)則I和2為事件A,設規(guī)則出現(xiàn)后結(jié)論正確為事件B。規(guī)則1、2在樣本中出現(xiàn)的概率為P1、P2,可信度為T1、T2。則利用公式2進行可信度計算:
[0066]P = Ρ(Β|Α) = P (AB) /P (A) =......= (P1*P2) * (Tl* (1-Τ1) *T2) / (Ρ1*Ρ2)
[0067](公式 2)
[0068]因此,可信度與規(guī)則出現(xiàn)的概率無關,故可得出結(jié)論:[0069]P = Tl* (1-Tl) *T2 = Τ1+Τ2_Τ1*Τ2(公式 3)
[0070]即規(guī)則1、2的可信度之和減去兩者重疊部分產(chǎn)生的可信度。
[0071]同理對于3條規(guī)則的匹配:
[0072]P = Τ1+Τ2+Τ3-Τ1*Τ2-Τ2*Τ3-Τ1*Τ3+Τ1*Τ2*Τ3(公式 4)
[0073]同理對于N條規(guī)則,依然滿足T (Ri) < = P < = 100%。
[0074]優(yōu)選地,所述第二特征確定單元124”還可以當所述候選應用特征信息所對應的可信度信息低于可信度閾值時,通過貝葉斯評判對該候選應用特征信息所對應的可信度信息進行平滑處理,以獲得對應的平滑可信度信息;根據(jù)所述平滑可信度信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。具體地,所述候選應用特征信息所對應的可信度信息可能低于可信度閾值,例如,當所獲取的可信度較低,或由于所述規(guī)則的數(shù)量較少,而導致可信度較低而低于所述可信度閾值;其中,所述可信度閾值可根據(jù)系統(tǒng)閾值或機器學習或用戶設置獲得。
[0075]所述第二特征確定單元124”通過利用貝葉斯評判對所述該候選應用特征信息所對應的可信度信息進行平滑處理,其中,所述貝葉斯平滑處理如公式5所示:
[0076]New_possibiIity = ((avg_num_rules*avg_possibility) + (this_num_rules*this_possibility))/(avg_num_rules+this_num_rules)
[0077](公式 5)
[0078]其中,avg_possibility表示所述web應用的可信度的平均值;this_possibility表示待計算的所述web應用的可信度;avg_num_rules表示平均每個web應用命中的規(guī)則數(shù);this_num_rules表示待識別的web應用的命中規(guī)則數(shù)。從而可以實現(xiàn):
[0079]1、對于只有極少規(guī)則匹配成功的web應用,可信度與該少數(shù)規(guī)則的可信度相差越大;
[0080]2、對于有多數(shù)規(guī)則匹配成功的web應用,可信度與該少數(shù)規(guī)則的可信度相差越小。
[0081]最后,所述第二特征確定單元124”通過根據(jù)所獲取的平滑可信度信息,確定所述web應用的應用特征信息。其中,所述確定方式與所述圖3所對應的第二特征確定單元124”的確定方式相同或相似,此處不再贅述,并以引用的形式包含于此。
[0082]圖4示出根據(jù)本發(fā)明另一個方面的一種用于對web應用進行安全處理的方法流程圖。具體地,在步驟Si中,處理設備獲取待處理的web應用;在步驟s2中,處理設備通過對所述web應用的應用相關信息進行特征識別,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息;在步驟S3中,處理設備根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應;在步驟s4中,處理設備根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。
[0083]上述各步驟之間是持續(xù)不斷工作的,在此,本領域技術人員應理解“持續(xù)”是指上述各步驟分別實時地,或者按照設定的或?qū)崟r調(diào)整的工作模式要求,進行待處理的web應用的獲取、應用特征信息的確定、安全相關信息的確定、web應用的安全處理等,直至處理設備停止獲取待處理的web應用。
[0084]其中,在步驟Si中,處理設備獲取待處理的web應用。具體地,在步驟si中,處理設備通過基于各種通信協(xié)議(CommunicationsProtocol),通過各種數(shù)據(jù)傳輸接口,與其他能夠提供所述待處理的web應用的設備,如web應用數(shù)據(jù)庫或是web應用系統(tǒng)等進行交互,獲取待處理的web應用。其中,所述web應用包括但不限于網(wǎng)頁、網(wǎng)站、web應用系統(tǒng)(如鐵路售票系統(tǒng))等。在此,“通信協(xié)議”包括計算機通信的傳送協(xié)議,如TCP/IP、UDP、FTP、ICMP、NetBEUI等,或者存在于計算機中的其他形式通信,例如面向?qū)ο缶幊汤锩鎸ο笾g的通信或操作系統(tǒng)內(nèi)不同程序或計算機不同模塊之間的消息傳送協(xié)議。
[0085]在步驟s2中,處理設備通過對所述web應用的應用相關信息進行特征識別,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。具體地,在步驟s2中,處理設備通過根據(jù)所獲取的待處理的web應用,對所述應用的應用相關信息進行提取,其中,所述應用相關信息如web應用的內(nèi)容信息、web應用的標簽、web應用的關鍵字信息、web應用的代碼信息,或者通過對所述web應用所對應的web頁面的源代碼進行分析,獲取所述web頁面的Title (標題)、Meta信息、文本內(nèi)容、Powered By等信息,并作為所述應用相關信息;根據(jù)所述應用相關信息,如利用web指紋識別方式,對所述代碼信息進行分析,例如將所述代碼中的關鍵字與應用特征信息相匹配等方式,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息、服務器版本、編程語言、第三方應用等;其中,服務器版本如Apache、Lighttpd、nginx等,編程語言如PHP、JAVA以及其他,第三方應用如Discuz、phpwind、wordpress、BLOG、phpcms、Ecshop、Joomla 等,常用框架如 THINKPHP、Struts、CakePHP> YII等,常用模板如Smarty等。
[0086]在步驟s3中,處理設備根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應。具體地,在步驟s3中,處理設備根據(jù)步驟s2中所確定的所述web應用的應用特征信息,如所述web應用的框架相關信息或模板相關信息,確定與所述應用特征信息相對應的安全相關信息,從而確定了與所述web應用相對應的安全相關信息,其中,所述安全相關信息包括但不限于與所述框架或模板相對應的安全通知、與所述web應用相對應的掃描應用信息、所述安全相關信息包括與所述web應用相對應的掃描應用信息等。例如,將所述web應用特征信息中的模板信息與包含安全相關信息的數(shù)據(jù)庫進行匹配,確定與所述模板相對應的安全信息為存在安全隱患,則在步驟S3中,處理設備確定與所述web應用相對應的安全相關信息為危險,并可提示所述web應用進行掃描。
[0087]在步驟s4中,處理設備根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。具體地,在步驟s4中,處理設備可根據(jù)所述安全相關信息,對所述web應用進行如漏洞掃描或根據(jù)安全相關信息來更新安全配置等處理方式;或者通過漏洞掃描,當掃描出現(xiàn)問題后,對所述web應用的安全配置進行更新,或者直接升級所述web應用。
[0088]優(yōu)選地,當所述安全相關信息包括與所述web應用相對應的掃描應用信息時,在步驟s4中,處理設備還可以根據(jù)所述掃描應用信息,對所述web應用執(zhí)行對應的掃描應用。具體地,當所述安全相關信息包括與所述web應用的框架或模板相對應的掃描應用信息時,在步驟s4中,處理設備可以針對特定的框架或模板,僅執(zhí)行與所述框架或模板相對應的掃描操作。
[0089]優(yōu)選地,當所述安全相關信息包括與所述web應用相對應的安全配置信息時,在步驟s4中,處理設備還可以根據(jù)所述安全配置信息,對所述web應用執(zhí)行或更新對應的安全配置。具體地,當所述安全相關信息包括與所述web應用的框架或模板相對應的安全配置信息時,在步驟s4中,處理設備還可以根據(jù)與所述web應用的框架或模板相對應的安全配置信息,對所述web應用執(zhí)行或更新對應的安全配置。例如,根據(jù)外部或其他應用獲知的相關安全事件而確定的安全配置更新,對該web應用的相關配置進行更新。
[0090]優(yōu)選地,所述處理設備還包括步驟s5 (未示出),其中,在步驟s5中,處理設備將所述安全處理的執(zhí)行結(jié)果,發(fā)送至所述web應用所對應的目標應用。具體地,在步驟s5中,處理設備將所述安全處理的執(zhí)行結(jié)果,如所述安全相關信息和/或所述web應用的安全處理的完成度、漏洞信息等,通過郵件、短信、系統(tǒng)消息等方式,發(fā)送與所述web應用所對應的目標應用中。其中,所述目標應用包括但不限于與所述web應用相關聯(lián)的人員(如所述web應用的開發(fā)人員或測試人員等)的相應接收應用(如所述web開發(fā)人員的郵箱等)、與所述web應用的應用特征信息相關聯(lián)的其他web應用或者其他程序等。
[0091]圖5示出根據(jù)本發(fā)明一個優(yōu)選實施例的一種用于對web應用進行安全處理的方法流程圖。具體地,在步驟Si’中,處理設備獲取待處理的web應用;在步驟s21’中,處理設備獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù);在步驟s22’中,處理設備根據(jù)所述應用頁面數(shù)據(jù)中所包含的頁面特征信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息;在步驟S3’中,處理設備根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應;在步驟s4’中,處理設備根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。其中,所述步驟sI’、步驟S3’、步驟s4’分別與圖4所示對應步驟相同或基本相同,故此處不再贅述,并通過引用的方式包含于此。
[0092]上述各步驟之間是持續(xù)不斷工作的,在此,本領域技術人員應理解“持續(xù)”是指上述各步驟分別實時地,或者按照設定的或?qū)崟r調(diào)整的工作模式要求,進行待處理的web應用的獲取、應用相關信息的確定、應用特征信息的確定、安全相關信息的確定、web應用的安全處理等,直至處理設備停止獲取待處理的web應用。
[0093]在步驟s21’中,處理設備獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù)。具體地,信在步驟s21’中,處理設備通過利用如屏幕抓取或web抓取框架等方式,抓取所述web應用的站點信息和/或web頁面中的結(jié)構(gòu)化數(shù)據(jù),例如,在步驟s21’中,處理設備先獲取所述web應用的URL信息,對所述URL信息中可獲取的鏈接進行跟蹤,獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù)。
[0094]在此,所述獲取方式包括但不限于以下一種或多種獲取方式:
[0095]1:快速連接提取
[0096]通過利用如正則表達式等編寫連接提取,以用于鏈接的提取,該方式的優(yōu)點是速度快,缺點是對html語義的解析不足,易把注釋里的鏈接也包含進來。另外基于javascript重定向url也需進行提取。
[0097]2:爬蟲抓取
[0098]例如通過對url進行分析,獲取url是否包含”? ”判斷一個網(wǎng)頁是否為動態(tài)網(wǎng)頁,獲取非動態(tài)網(wǎng)頁的url地址,更優(yōu)選地,可通過設置閾值的方式,獲取定量的url地址,以實現(xiàn)爬蟲抓取。
[0099]3:增量抓取
[0100]由于針對多個網(wǎng)站的爬蟲很難一次性把所有網(wǎng)頁爬取下來,并且網(wǎng)頁也處于不斷更新的狀態(tài)中,爬取是一個動態(tài)的過程,因此還可以支持對網(wǎng)頁的動態(tài)增量抓取,從而及時獲取所述web應用的應用相關信息,進而進行特征識別。
[0101]在步驟S22’中,處理設備根據(jù)所述應用頁面數(shù)據(jù)中所包含的頁面特征信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。具體地,在步驟s22’中,處理設備通過根據(jù)所述應用頁面數(shù)據(jù),確定所述應用頁面數(shù)據(jù)中所包含的頁面特征信息,其中,所述頁面特征信息包括但不限于頁面關鍵字、文件的MD5、URL的關鍵字或URL的Tag模式;根據(jù)所述頁面特征信息,通過匹配或查詢等方式,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。例如,一般的web應用在html、js、css等文件中包含若干特征代碼,因此可以采用特征代碼匹配模式。比如wordpress如果沒有進行隱藏的話,在robots, txt中會包含wp-admin等,首頁index, php中會包含generator =wordpress 3.xx,所述3.xx為版本號,頁面中會包含wp-content路徑等。所述“wp-admin”或“generator = wordpress”或“wp-content”等可作為頁面關鍵字。其他的應用也有類似的關鍵字,如discuz、dedecms、phpwind等在頁面中都會發(fā)現(xiàn)一些固定的特征代碼;根據(jù)所述特征代碼,可以通過特征代碼匹配模式,確定所述web應用的應用特征信息。
[0102]優(yōu)選地,在步驟s22’中,處理設備還可以根據(jù)所述應用頁面數(shù)據(jù)中所含的頁面特征信息,并結(jié)合所述應用頁面數(shù)據(jù)的參考頁面數(shù)據(jù)的參考頁面特征信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。具體地,在步驟s22’中,處理設備還可以通過獲取所述應用頁面數(shù)據(jù)的一個或多個參考頁面數(shù)據(jù),通過將所述應用頁面數(shù)據(jù)中所含的頁面特征信息、與所述參考頁面數(shù)據(jù)的參考頁面特征信息進行匹配、對比等方式,例如將所述應用頁面數(shù)據(jù)與參考頁面數(shù)據(jù)的特征信息中不同或相同的部分,結(jié)合所述參考頁面數(shù)據(jù)的數(shù)據(jù)量或參考頁面在整個web應用中的位置信息等方式,確定為所述web應用的應用特征信息。其中,所述參考頁面可以與所述應用頁面屬于同一個web應用,也可以為與所述web應用的網(wǎng)頁或頁面鄰近或相似的鏈接等。例如,當所述參考頁面可以與所述應用頁面屬于同一個web應用時,應用頁面數(shù)據(jù)為http://baidu.com/wordpress/login.action,其對應的參考頁面數(shù)據(jù)包括如下三條數(shù)據(jù)信息:http://baidu.com/discuz/loginl.action、http://baidu.com/discuz/login2.action、http://baidu.com/discuz/login3.action,則可以據(jù)此確定對于整個 web 應用而言,所述web應用的應用特征信息為discuz,而非wordpress。
[0103]優(yōu)選地,在步驟s21’中,處理設備還可以據(jù)頁面獲取規(guī)則,獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù)。具體地,在步驟s21’中,處理設備還可以根據(jù)預定或設置的頁面獲取規(guī)則,獲取特定的頁面,進而獲取特定的應用頁面數(shù)據(jù),從而獲取所述web應用的應用相關信息。
[0104]其中,所述頁面獲取規(guī)則包括以下至少任一項:
[0105]-所述web應用的頁面數(shù)據(jù)的數(shù)據(jù)類型信息,如制定抓取特定類型的數(shù)據(jù),如js、css、html 等;
[0106]-所述web應用的應用頁面的頁面類型信息,其中,所述頁面類型信息包括但不限于靜態(tài)網(wǎng)頁或動態(tài)網(wǎng)頁,或gif、jpg、png等類型等,因此可以獲取其中一種或多種頁面,如僅獲取靜態(tài)頁面等;
[0107]-所述web應用的應用頁面的頁面數(shù)量閾值,其中,所述頁面數(shù)量閾值可根據(jù)系統(tǒng)預置或用戶自定義等方式,例如僅獲取頁面數(shù)量閾值M個網(wǎng)頁,超過M個網(wǎng)頁后則不再獲??;
[0108]-所述web應用的應用頁面的頁面更新信息,例如,僅獲取具有頁面更新信息的應用頁面等。
[0109]圖6不出根據(jù)本發(fā)明另一個優(yōu)選實施例的一種用于對web應用進行安全處理的方法流程圖。具體地,在步驟Si”中,處理設備獲取待處理的web應用;在步驟s23”中,處理設備通過對所述web應用的應用相關信息進行特征識別,確定所述web應用所對應的多個候選應用特征信息;在步驟s24”中,處理設備根據(jù)所述候選應用特征信息所對應的可信度信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息;在步驟S3”中,處理設備根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應;在步驟s4”中,處理設備根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。其中,所述步驟Si”、步驟S3”、步驟s4”分別與圖4所示對應步驟相同或基本相同,故此處不再贅述,并通過引用的方式包含于此。
[0110]上述各步驟之間是持續(xù)不斷工作的,在此,本領域技術人員應理解“持續(xù)”是指上述各步驟分別實時地,或者按照設定的或?qū)崟r調(diào)整的工作模式要求,進行待處理的web應用的獲取、候選應用特征信息的確定、應用特征信息的確定、安全相關信息的確定、web應用的安全處理等,直至處理設備停止獲取待處理的web應用。
[0111]在步驟s23”中,處理設備通過對所述web應用的應用相關信息進行特征識別,確定所述web應用所對應的多個候選應用特征信息。具體地,在步驟s23”中,處理設備通過對所述web應用的應用相關信息進行特征識別,通過對所述web應用中的如網(wǎng)頁或網(wǎng)站等進行特征識別,確定所述web應用所對應的多個候選應用特征信息。其中,所述候選應用信息包括但不限于所述web應用所使用的模板或框架相關信息等。其中,所述確定方式與圖4或圖5中所述步驟s2或步驟s2’的確定方式相同或相似,此處不再贅述,并以引用的形式包含于此。
[0112]在步驟s24”中,處理設備根據(jù)所述候選應用特征信息所對應的可信度信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。具體地,在步驟s24”中,處理設備通過根據(jù)所述候選應用特征信息,通過在如規(guī)則數(shù)據(jù)庫中查詢等方式,確定與所述候選應用特征信息相對應的可信度信息,通過根據(jù)所述可信度信息,對所述應用特征信息進行確定;在此,所述可信度信息表示所述應用相關信息與其所對應的候選應用特征信息的準確度,所述規(guī)則數(shù)據(jù)庫中的每一條規(guī)則即表示所述應用相關信息與其所對應的候選應用特征信息的對應關系,并包含該對應關系的可度息。
[0113]例如,根據(jù)機器學習或統(tǒng)計訓練,對所述規(guī)則數(shù)據(jù)庫中的規(guī)則的可信度信息進行訓練,如經(jīng)過N次訓練,規(guī)則I匹配成功M次,其中,如果正確的次數(shù)為L次,則該條規(guī)則的可信度為L/M。
[0114] 假定匹配中有規(guī)則1、規(guī)則2和規(guī)則3,其中規(guī)則I的可信度為90%、規(guī)則2的可信度為80%、規(guī)則3的可信度為70%,可以通過利用例如公式6對所述應用特征信息的可信度進行計算,以避免簡單的對規(guī)則的可信度進行平均或求和,所導致的可信度不準:
[0115]T(Ri) ^ P ^ 100%(公式 6)
[0116]其中,Ri為匹配中的規(guī)則中可信度最大的一條規(guī)則。
[0117]假設對所述web應用進行識別,識別出來一個可能的結(jié)果為discuz,并匹配到兩條規(guī)則I和2。假設所有規(guī)則均相互獨立,設同時出現(xiàn)規(guī)則I和2為事件A,設規(guī)則出現(xiàn)后結(jié)論正確為事件B。規(guī)則1、2在樣本中出現(xiàn)的概率為P1、P2,可信度為T1、T2。則利用公式7進行可信度計算:
[0118]P = P(B|A) =P (AB)/P (A) =......= (P1*P2) * (Tl* (1—Τ1) *T2) / (Ρ1*Ρ2)
[0119](公式 7)
[0120]因此,可信度與規(guī)則出現(xiàn)的概率無關,故可得出結(jié)論:
[0121]P = T1*(1-T1)*T2 = Τ1+Τ2_Τ1*Τ2(公式 8)
[0122]即規(guī)則1、2的可信度之和減去兩者重疊部分產(chǎn)生的可信度。
[0123]同理當匹配到3條規(guī)則時:
[0124]P = Τ1+Τ2+Τ3-Τ1*Τ2-Τ2*Τ3-Τ1*Τ3+Τ1*Τ2*Τ3(公式 9)
[0125]同理對于N條規(guī)則,依然滿足T (Ri) <=P<=100%。
[0126]優(yōu)選地,在步驟s24”中,處理設備還可以當所述候選應用特征信息所對應的可信度信息低于可信度閾值時,通過貝葉斯評判對該候選應用特征信息所對應的可信度信息進行平滑處理,以獲得對應的平滑可信度信息;根據(jù)所述平滑可信度信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。具體地,所述候選應用特征信息所對應的可信度信息可能低于可信度閾值,例如,當所獲取的可信度較低,或由于所述規(guī)則的數(shù)量較少,而導致可信度較低而低于所述可信度閾值;其中,所述可信度閾值可根據(jù)系統(tǒng)閾值或機器學習或用戶設置獲得。
[0127]在步驟s24”中,處理設備通過利用貝葉斯評判對所述該候選應用特征信息所對應的可信度信息進行平滑處理,其中,所述貝葉斯平滑處理如公式9所示:
[0128]New_possibi I ity = ((avg_num_rules*avg_possibility) + (this_num_rules*this_possibility))/(avg_num_rules+this_num_rules)
[0129](公式 9)
[0130]其中,avg_possibility表示所述web應用的可信度的平均值;this_possibility表示待計算的所述web應用的可信度;avg_num_rules表示平均每個web應用命中的規(guī)則數(shù);this_num_rules表示待識別的web應用的命中規(guī)則數(shù)。從而可以實現(xiàn):
[0131]1、對于只有極少規(guī)則匹配成功的web應用,可信度與該少數(shù)規(guī)則的可信度相差越大;
[0132]2、對于有多數(shù)規(guī)則匹配成功的web應用,可信度與該少數(shù)規(guī)則的可信度相差越小。
[0133]最后,所述第二特征確定單元124”通過根據(jù)所獲取的平滑可信度信息,確定所述web應用的應用特征信息。其中,所述確定方式與所述圖3所對應的第二特征確定單元124”的確定方式相同或相似,此處不再贅述,并以引用的形式包含于此。
[0134]對于本領域技術人員而言,顯然本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權利要求而不是上述說明限定,因此旨在將落在權利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應將權利要求中的任何附圖標記視為限制所涉及的權利要求。此夕卜,顯然“包括” 一詞不排除其他單元或步驟,單數(shù)不排除復數(shù)。裝置權利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟件或者硬件來實現(xiàn)。第一,第二等詞語用來表示名稱,而并不表示任何特定的順序。
【權利要求】
1.一種用于對web應用進行安全處理的方法,其中,該方法包括以下步驟: a獲取待處理的web應用; b通過對所述web應用的應用相關信息進行特征識別,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息; c根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應; d根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。
2.根據(jù)權利要求1所述的方法,其中,所述步驟b包括: b 1獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù); b2根據(jù)所述應用頁面數(shù)據(jù)中所包含的頁面特征信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。
3.根據(jù)權利要求2所述的方法,其中,所述步驟b2包括: -根據(jù)所述應用頁面數(shù)據(jù)中所含的頁面特征信息,并結(jié)合所述應用頁面數(shù)據(jù)的參考頁面數(shù)據(jù)的參考頁面特征信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。
4.根據(jù)權利要求2或3所述的方法,其中,所述步驟bl包括: -根據(jù)頁面獲取規(guī)則,獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù);其中,所述頁面獲取規(guī)則包括以下至少任一項: -所述web應用的頁面數(shù)據(jù)的數(shù)據(jù)類型信息; -所述web應用的應用頁面的頁面類型信息; -所述web應用的應用頁面的頁面數(shù)量閾值; -所述web應用的應用頁面的頁面更新信息。
5.根據(jù)權利要求1至4中任一項所述的方法,其中,所述步驟b包括: -通過對所述web應用的應用相關信息進行特征識別,確定所述web應用所對應的多個候選應用特征信息; b3根據(jù)所述候選應用特征信息所對應的可信度信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。
6.根據(jù)權利要求5所述的方法,其中,所述步驟b3包括: -當所述候選應用特征信息所對應的可信度信息低于可信度閾值時,通過貝葉斯評判對該候選應用特征信息所對應的可信度信息進行平滑處理,以獲得對應的平滑可信度信息; -根據(jù)所述平滑可信度信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。
7.根據(jù)權利要求1至6中任一項所述的方法,其中,所述安全相關信息包括與所述web應用相對應的掃描應用信息; 其中,所述步驟d包括: -根據(jù)所述掃描應用信息,對所述web應用執(zhí)行對應的掃描應用。
8.根據(jù)權利要求1至7中任一項所述的方法,其中,所述安全相關信息包括與所述web應用相對應的安全配置信息; 其中,所述步驟d包括: -根據(jù)所述安全配置信息,對所述web應用執(zhí)行或更新對應的安全配置。
9.根據(jù)權利要求1至8中任一項所述的方法,其中,該方法還包括: -將所述安全處理的執(zhí)行結(jié)果,發(fā)送至所述web應用所對應的目標應用。
10.一種用于對web應用進行安全處理的處理設備,其中,該設備包括: 獲取裝置,用于獲取待處理的web應用; 識別裝置,用于通過對所述web應用的應用相關信息進行特征識別,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息; 確定裝置,用于根據(jù)所述web應用特征信息,確定與所述web應用相對應的安全相關信息,其中,所述安全相關信息與所述應用特征信息相對應; 處理裝置,用于根據(jù)所述安全相關信息,對所述web應用進行對應的安全處理。
11.根據(jù)權利要求9所述的處理設備,其中,所述識別裝置包括: 信息獲取單元,用于獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù); 第一特征確定單元,用于根據(jù)所述應用頁面數(shù)據(jù)中所包含的頁面特征信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。
12.根據(jù)權利要求11所述的處理設備,其中,所述第一特征確定單元用于: -根據(jù)所述應用頁面數(shù)據(jù)中所含的頁面特征信息,并結(jié)合所述應用頁面數(shù)據(jù)的參考頁面數(shù)據(jù)的參考頁面特征信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。
13.根據(jù)權利要求11或12所述的處理設備,其中,所述信息獲取單元用于: -根據(jù)頁面獲取規(guī)則,獲取所述web應用的應用相關信息,其中,所述應用相關信息包括所述web應用的應用頁面數(shù)據(jù);其中,所述頁面獲取規(guī)則包括以下至少任一項: -所述web應用的頁面數(shù)據(jù)的數(shù)據(jù)類型信息; -所述web應用的應用頁面的頁面類型信息; -所述web應用的應用頁面的頁面數(shù)量閾值; -所述web應用的應用頁面的頁面更新信息。
14.根據(jù)權利要求10至13中任一項所述的處理設備,其中,所述識別裝置包括: 候選特征確定單元,用于通過對所述web應用的應用相關信息進行特征識別,確定所述web應用所對應的多個候選應用特征信息; 第二特征確定單元,用于根據(jù)所述候選應用特征信息所對應的可信度信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。
15.根據(jù)權利要求14所述的處理設備,其中,所述第二特征確定單元用于: -當所述候選應用特征信息所對應的可信度信息低于可信度閾值時,通過貝葉斯評判對該候選應用特征信息所對應的可信度信息進行平滑處理,以獲得對應的平滑可信度信息; -根據(jù)所述平滑可信度信息,確定所述web應用的應用特征信息,其中,所述應用特征信息包括所述web應用的框架相關信息或模板相關信息。
16.根據(jù)權利要求10至15中任一項所述的處理設備,其中,所述安全相關信息包括與所述web應用相對應的掃描應用信息; 其中,所述處理裝置用于: -根據(jù)所述掃描應用信息,對所述web應用執(zhí)行對應的掃描應用。
17.根據(jù)權利要求10至16中任一項所述的處理設備,其中,所述安全相關信息包括與所述web應用相對應的安全配置信息; 其中,所述處理裝置用于: -根據(jù)所述安全配置信息,對所述web應用執(zhí)行或更新對應的安全配置。
18.根據(jù)權利要求10至17中任一項所述的處理設備,其中,該設備還包括: 發(fā)送裝置,用于將所述安全處理的執(zhí) 行結(jié)果,發(fā)送至所述web應用所對應的目標應用。
【文檔編號】G06F21/57GK103902913SQ201210586180
【公開日】2014年7月2日 申請日期:2012年12月28日 優(yōu)先權日:2012年12月28日
【發(fā)明者】周向榮 申請人:百度在線網(wǎng)絡技術(北京)有限公司