廣告過濾方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及瀏覽器領(lǐng)域,具體而言,涉及一種廣告過濾方法和裝置。
【背景技術(shù)】
[0002] 在瀏覽器上,廣告過濾插件adblock是一個廣泛應(yīng)用的廣告過濾插件。其基本 原理是設(shè)置一系列的過濾規(guī)則,在瀏覽器發(fā)出資源請求之前,先檢查其統(tǒng)一資源定位符 (Uniform Resource Locator,簡稱url)是否命中某條過濾規(guī)則,如果命中某條過濾規(guī)則, 可以確定瀏覽器請求的資源為廣告,瀏覽器無需請求該資源。
[0003] 為了達到較好的過濾效果,通常需要設(shè)置較多的過濾規(guī)則,比如adblock提供的 過濾規(guī)則就超過2萬條。目前的瀏覽器廣告過濾方法是:當(dāng)用戶通過瀏覽器輸入某個url 時,利用該url逐個對過濾規(guī)則進行匹配,如果匹配上某個過濾規(guī)則,則返回true (表示需 要進行廣告過濾),否則返回false (表示不需要進行廣告過濾)。由于在瀏覽器中設(shè)置有 大量的廣告的過濾規(guī)則,在瀏覽器每一次網(wǎng)絡(luò)請求時,與大量的過濾規(guī)則逐個進行匹配,使 得廣告過濾時性能開銷較大,同時由于過濾規(guī)則數(shù)量大,導(dǎo)致每次廣告過濾時間長。
[0004] 針對現(xiàn)有技術(shù)中由于過濾規(guī)則數(shù)量大導(dǎo)致每次廣告過濾時間長的問題,目前尚未 提出有效的解決方案。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的主要目的在于提供一種廣告過濾方法和裝置,以解決由于過濾規(guī)則數(shù)量 大導(dǎo)致每次廣告過濾時間長問題。
[0006] 為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種廣告過濾方法。根據(jù)本 發(fā)明的瀏覽器廣告過濾方法包括:獲取在瀏覽器中輸入的統(tǒng)一資源定位符;利用廣告過濾 規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配;如果所述統(tǒng)一資源定位符與所述關(guān)鍵字匹 配,則將所述統(tǒng)一資源定位符與所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則進行匹配;以及如果所述 統(tǒng)一資源定位符與所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則匹配,則利用所述廣告過濾規(guī)則進行廣 告過濾。
[0007] 進一步地,在所述利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配之 前,所述瀏覽器廣告過濾方法還包括:獲取與所述廣告過濾規(guī)則對應(yīng)的關(guān)鍵字;建立與所 述廣告過濾規(guī)則對應(yīng)的關(guān)鍵字的字典樹;其中,所述利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng) 一資源定位符進行匹配步驟包括:獲取所述字典樹中的關(guān)鍵字;判斷所述統(tǒng)一資源定位符 與所述字典樹中的關(guān)鍵字是否匹配。
[0008] 進一步地,所述獲取與所述廣告過濾規(guī)則對應(yīng)的關(guān)鍵字包括:讀取所述廣告過濾 規(guī)則的文件;從所述廣告過濾規(guī)則的文件中提取所述關(guān)鍵字;所述建立與廣告過濾規(guī)則對 應(yīng)的關(guān)鍵字的字典樹包括:建立所述關(guān)鍵字與所述廣告過濾規(guī)則的對應(yīng)關(guān)系;根據(jù)提取的 關(guān)鍵字建立所述字典樹。
[0009] 進一步地,所述利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配包 括:判斷所述統(tǒng)一資源定位符與所述廣告過濾規(guī)則的關(guān)鍵字是否匹配,其中,如果判斷出所 述統(tǒng)一資源定位符與所述廣告過濾規(guī)則的關(guān)鍵字匹配,則將所述關(guān)鍵字對應(yīng)的廣告過濾規(guī) 則轉(zhuǎn)換為正則表達式;將所述統(tǒng)一資源定位符與所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則進行匹配 包括:將所述統(tǒng)一資源定位符與所述正則表達式進行匹配;其中,如果所述統(tǒng)一資源定位 符與所述正則表達式匹配,則輸出所述正則表達式對應(yīng)的廣告過濾規(guī)則,通過輸出的所述 正則表達式對應(yīng)的廣告過濾規(guī)則進行廣告過濾。
[0010] 進一步地,在所述獲取在瀏覽器中輸入的統(tǒng)一資源定位符之后,所述瀏覽器廣告 過濾方法還包括:將所述統(tǒng)一資源定位符傳入分段器;在所述分段器中對所述統(tǒng)一資源定 位符進行分段,得到多個分段字符;其中,所述利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源 定位符進行匹配包括:逐個將所述多個分段字符與關(guān)鍵字匹配器中的關(guān)鍵字進行匹配。
[0011] 為了實現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種廣告過濾裝置。根據(jù)本發(fā) 明的瀏覽器廣告過濾裝置包括:第一獲取單元,用于獲取在瀏覽器中輸入的統(tǒng)一資源定位 符;第一匹配單元,用于利用廣告過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配;第 二匹配單元,用于當(dāng)所述統(tǒng)一資源定位符與所述關(guān)鍵字匹配時,將所述統(tǒng)一資源定位符與 所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則進行匹配;以及過濾單元,用于當(dāng)所述統(tǒng)一資源定位符與 所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則匹配時,利用所述廣告過濾規(guī)則進行廣告過濾。
[0012] 進一步地,所述瀏覽器廣告過濾裝置還包括:第二獲取單元,用于在所述利用廣告 過濾規(guī)則的關(guān)鍵字對所述統(tǒng)一資源定位符進行匹配之前,獲取與所述廣告過濾規(guī)則對應(yīng)的 關(guān)鍵字;建立單元,用于建立與所述廣告過濾規(guī)則對應(yīng)的關(guān)鍵字的字典樹;其中,所述第一 匹配單元包括:獲取模塊,用于獲取所述字典樹中的關(guān)鍵字;第一判斷模塊,用于判斷所述 統(tǒng)一資源定位符與所述字典樹中的關(guān)鍵字是否匹配。
[0013] 進一步地,所述第二獲取單元包括:讀取模塊,用于讀取所述廣告過濾規(guī)則的文 件;提取模塊,用于從所述廣告過濾規(guī)則的文件中提取所述關(guān)鍵字;所述建立單元包括:第 一建立模塊,用于建立所述關(guān)鍵字與所述廣告過濾規(guī)則的對應(yīng)關(guān)系;第二建立模塊,用于根 據(jù)提取的關(guān)鍵字建立所述字典樹。
[0014] 進一步地,所述第一匹配單元包括:第二判斷模塊,用于判斷所述統(tǒng)一資源定位符 與所述廣告過濾規(guī)則的關(guān)鍵字是否匹配,其中,如果判斷出所述統(tǒng)一資源定位符與所述廣 告過濾規(guī)則的關(guān)鍵字匹配,則將所述關(guān)鍵字對應(yīng)的廣告過濾規(guī)則轉(zhuǎn)換為正則表達式;所述 第二匹配單元包括:第一匹配模塊,用于將所述統(tǒng)一資源定位符與所述正則表達式進行匹 配;所述過濾單元還用于當(dāng)所述統(tǒng)一資源定位符與所述正則表達式匹配時,輸出所述正則 表達式對應(yīng)的廣告過濾規(guī)則,通過輸出的所述正則表達式對應(yīng)的廣告過濾規(guī)則進行廣告過 濾。
[0015] 進一步地,所述瀏覽器廣告過濾裝置包括:傳入單元,用于在獲取在瀏覽器中輸入 的統(tǒng)一資源定位符之后,將所述統(tǒng)一資源定位符傳入分段器;分段單元,用于在所述分段器 中對所述統(tǒng)一資源定位符進行分段,得到多個分段字符;其中,所述第一匹配單元包括:第 二匹配模塊,用于逐個將所述多個分段字符與關(guān)鍵字匹配器中的關(guān)鍵字進行匹配。
[0016] 通過本發(fā)明實施例,先利用廣告過濾規(guī)則的關(guān)鍵字對url進行匹配,再將匹配到 關(guān)鍵字的url與關(guān)鍵字對應(yīng)的廣告過濾規(guī)則進行匹配,避免將url與所有的廣告過濾規(guī)則 一一進行匹配,減少了匹配的廣告過濾規(guī)則的數(shù)量,從而解決了由于過濾規(guī)則數(shù)量大導(dǎo)致 每次廣告過濾時間長問題,達到了減少廣告過濾時間的效果。
【附圖說明】
[0017] 構(gòu)成本申請的一部分的附圖用來提供對本發(fā)明的進一步理解,本發(fā)明的示意性實 施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
[0018] 圖1是根據(jù)本發(fā)明第一實施例的廣告過濾裝置的示意圖;
[0019] 圖2是根據(jù)本發(fā)明第二實施例的廣告過濾裝置的示意圖;
[0020] 圖3是根據(jù)本發(fā)明第三實施例的廣告過濾裝置的示意圖;
[0021] 圖4是根據(jù)本發(fā)明第一實施例的廣告過濾方法的流程圖;
[0022] 圖5是根據(jù)本發(fā)明第二實施例的廣告過濾方法的流程圖;以及
[0023] 圖6是根據(jù)本發(fā)明實施例的一種優(yōu)選的廣告過濾方法的流程圖。
【具體實施方式】
[0024] 需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相 互組合。下面將參考附圖并結(jié)合實施例來詳細說明本發(fā)明。
[0025] 為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實施例中的 附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是 本發(fā)明一部分的實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù) 人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應(yīng)當(dāng)屬于本發(fā)明保護的范 圍。
[0026] 需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語"第一"、"第 二"等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使 用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實施例。此外,術(shù)語"包括"和 "具有"以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元 的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有 清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
[0027] 本發(fā)明實施例提供了 一種廣告過濾裝置。
[0028] 圖1是根據(jù)本發(fā)明第一實施例的瀏覽器廣告過濾裝置的示意圖。如圖1所示,該 瀏覽器廣告過濾裝置包括第一獲取單元10、第一匹配單元20、第二匹配單元30和過濾單元 40。
[0029] 第一獲取單元10用于獲取在瀏覽器中輸入的統(tǒng)一資源定位符。
[0030] 瀏覽器可以是個人計算機上的(personal computer,簡稱PC)瀏覽器,也可以 是移動終端上的瀏覽器,用戶可以在瀏覽器上輸入統(tǒng)一資源定位符(Uniform Resource Locator,簡稱url