專利名稱:基于Hits算法的Web搜索結(jié)果安全性排序方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡安全技術(shù)領(lǐng)域,特別是一種基于Hits算法的Web捜索結(jié)果安全性排序方法。
背景技術(shù):
隨著Internet的迅速發(fā)展,Web資源成指數(shù)級增長使得對Web資源的管理顯得更加困難。如今,大量隱藏著木馬、病毒和非法廣告等程序的惡意網(wǎng)頁在Web網(wǎng)絡中泛濫。這些網(wǎng)頁采取作弊手段,利用搜索引擎的局限性,使得有些惡意頁面隱藏在搜索結(jié)果排名較靠前的位置,這樣極大可能危及用戶計算機以及其他終端的信息安全。由此可見,解決和改善Web安全的問題已經(jīng)是迫在眉睫。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于Hits算法的Web搜索結(jié)果安全性排序方法,該方法有利于降低惡意網(wǎng)頁在搜索結(jié)果中的排序,從而降低訪問到不安全網(wǎng)頁的概率。本發(fā)明采用的技術(shù)方案是一種基于Hits算法的Web搜索結(jié)果安全性排序方法,建立一個惡意特征庫F ( Z1 , Z2 , Z3 ,…,fn ),所述惡意特征庫包含/ 種網(wǎng)絡病毒、木馬、漏洞在網(wǎng)頁中出現(xiàn)的特征碼,將所述惡意特征庫的各特征碼分別表示成由 個分量組成的向量形式,即= ( fn,,…,4 ),其中i e {1,2,ep;然后,基于Hits算法,按如下步驟進行網(wǎng)頁安全性排序
步驟I :將搜索主題提交給基于文本的搜索引擎,從返回結(jié)果網(wǎng)頁的集合中取前(個網(wǎng)頁的集合,記為根集ガ;向所述根集ガ中加入被根集ガ引用的網(wǎng)頁和引用根集ガ的網(wǎng)頁,對內(nèi)在鏈接和不相關(guān)鏈接進行處理后,將根集ガ擴展成集合G ;以集合G中的Hub網(wǎng)頁為頂點集V1,以Authority網(wǎng)頁為頂點集F2,V1中的網(wǎng)頁到V2中的網(wǎng)頁的超鏈接為邊集萬,形成一個二分有向圖S = ( K1,K2,萬),對K1中任ー頂點v用h(v)表示網(wǎng)頁r的Hub值,對V2中的任ー頂點《,用a (W)表示網(wǎng)頁w的Authority值,初始時A (r) =a (w) =1 ;
步驟2 :對y執(zhí)行I操作,修改它的a (y),對r執(zhí)行0操作,修改它的h(v),I操作、0操作分別為
I操作
權(quán)利要求
1.一種基于Hits算法的Web搜索結(jié)果安全性排序方法,其特征在于建立一個惡意特征庫A ( Z1 , Z2 , Z3 ,…,fn ),所述惡意特征庫包含種網(wǎng)絡病毒、木馬、漏洞在網(wǎng)頁中出現(xiàn)的特征碼,將所述惡意特征庫的各特征碼分別表示成由《個分量組成的向量形式,即= ( fn,fi2,fn,...,4 ),其中 i e {1,2,…,/ },/;. e 尸;然后,基于 Hits算法,按如下步驟進行網(wǎng)頁安全性排序 步驟I :將搜索主題提交給基于文本的搜索引擎,從返回結(jié)果網(wǎng)頁的集合中取前 個網(wǎng)頁的集合,記為根集W ;向所述根集W中加入被根集W引用的網(wǎng)頁和引用根集W的網(wǎng)頁,對內(nèi)在鏈接和不相關(guān)鏈接進行處理后,將根集/P擴展成集合^ ;以集合^中的Hub網(wǎng)頁為頂點集V1,以Authority網(wǎng)頁為頂點集F2,V1中的網(wǎng)頁到V2中的網(wǎng)頁的超鏈接為邊集萬,形成一個二分有向圖S = ( K1,K2,萬),對K1中任一頂點K,用A卜)表示網(wǎng)頁r的Hub值,對V2中的任一頂點《,用a ( )表示網(wǎng)頁 的Authority值,初始時力(r) =a ( ) =1 ; 步驟2 :對 執(zhí)行I操作,修改它的a (u),對r執(zhí)行O操作,修改它的A (K),I操作、O操作分別為 I操作
全文摘要
本發(fā)明涉及網(wǎng)絡安全技術(shù)領(lǐng)域,特別是一種基于Hits算法的Web搜索結(jié)果安全性排序方法,其特征在于建立一個惡意特征庫F(f1,f2,f3,…,fn),所述惡意特征庫包含n種網(wǎng)絡病毒、木馬、漏洞在網(wǎng)頁中出現(xiàn)的特征碼,將所述惡意特征庫的各特征碼fx表示成由m個分量組成的向量形式,即fx=(fx1,fx2,fx3,…,fxm),其中x∈{1,2,…,n},fx∈F,各個分量所占權(quán)重用f’x來表示;然后,基于Hits算法,結(jié)合向量空間模型和惡意特征庫,進行網(wǎng)頁搜索結(jié)果安全性排序。該方法有利于降低惡意網(wǎng)頁在搜索結(jié)果中的排序,從而降低訪問到不安全網(wǎng)頁的概率。
文檔編號G06F17/30GK102663077SQ201210095140
公開日2012年9月12日 申請日期2012年3月31日 優(yōu)先權(quán)日2012年3月31日
發(fā)明者許力, 郭揚富, 陳志德 申請人:福建師范大學