亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種惡意廣告識(shí)別方法及裝置制造方法

文檔序號(hào):6509198閱讀:198來源:國(guó)知局
一種惡意廣告識(shí)別方法及裝置制造方法
【專利摘要】本發(fā)明實(shí)施例公開了一種惡意廣告識(shí)別方法,包括:獲取信息源;第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng);掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告;其中,所述N為大于或者等于2的整數(shù),所述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素。相應(yīng)地,本發(fā)明實(shí)施例提供一種惡意廣告識(shí)別裝置。本發(fā)明實(shí)施例可以快速有效地識(shí)別出惡意廣告。
【專利說明】一種惡意廣告識(shí)別方法及裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,尤其涉及一種惡意廣告識(shí)別方法及裝置

【背景技術(shù)】
[0002]目前互聯(lián)網(wǎng)中傳輸?shù)男畔⒃粗袝?huì)存在一些惡意廣告信息,而目前識(shí)別惡意廣告的方法主要是將信息源切割為多個(gè)信息單元,再通過聚集分別對(duì)各個(gè)信息單元進(jìn)行惡意廣告識(shí)別。
[0003]上述技術(shù)中聚集是通過惡意廣告的聚集度為識(shí)別的,而在實(shí)際應(yīng)用中,每個(gè)信息單元包括的惡意廣告的數(shù)量是不同,即每個(gè)信息單元的惡意廣告聚集度是不同的,例如:信息單元I包括3個(gè)惡意廣告,信息單元2包括4個(gè)惡意廣告,信息單元3包括2個(gè)惡意廣告,信息單元4包括O個(gè)惡意廣告。當(dāng)上述技術(shù)識(shí)別惡意廣告的聚集度為3時(shí),就只能識(shí)別出信息單元I和信息單元2中的惡意廣告,當(dāng)然上述技術(shù)中可以將聚集度為2,這樣就可以識(shí)別出所有惡意廣告,但隨著聚集度的降低,識(shí)別惡意廣告的過程就會(huì)越滯后。例如:信息單元長(zhǎng)度為30秒,那么聚集度為2的識(shí)別過程就為比聚集度為3的識(shí)別過程滯后30秒??梢姡壳皭阂鈴V告識(shí)別的技術(shù)容易漏識(shí)別一部分聚集度相對(duì)低的惡意廣告,且識(shí)別的滯后時(shí)間比較長(zhǎng)。即目前惡意廣告識(shí)別的技術(shù)無法快速有效地識(shí)別出惡意廣告。


【發(fā)明內(nèi)容】

[0004]本發(fā)明實(shí)施例提供了一種惡意廣告識(shí)別方法及裝置,可以快速有效地識(shí)別出惡意廣告。
[0005]第一方面,本發(fā)明實(shí)施例提供一種惡意廣告識(shí)別方法,包括:
[0006]獲取信息源;
[0007]將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng);
[0008]掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告;其中,所述N為大于或者等于2的整數(shù),所述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素。
[0009]第二方面,本發(fā)明實(shí)施例提供惡意廣告識(shí)別裝置,包括:獲取單元、滑動(dòng)單元和掃描單元,其中:
[0010]所述獲取單元,用于獲取信息源;
[0011]所述滑動(dòng)單元,用于將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng);
[0012]所述掃描單元,用于掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告;其中,所述N為大于或者等于2的整數(shù),所述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素。
[0013]上述技術(shù)方案中,獲取信息源;將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng);掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告。相比現(xiàn)有技術(shù),本發(fā)明實(shí)施例可以對(duì)將信息源劃分為更多的信息單元,且是以滑動(dòng)的方式進(jìn)行掃描,從而可以快速有效地識(shí)別出惡意廣告。

【專利附圖】

【附圖說明】
[0014]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0015]圖1是本發(fā)明實(shí)施例提供的一種惡意廣告識(shí)別方法的流程示意圖;
[0016]圖2是本發(fā)明實(shí)施例提供的另一種惡意廣告識(shí)別方法的流程示意圖;
[0017]圖3是本發(fā)明實(shí)施例提供的可選的滑動(dòng)示意圖;
[0018]圖4是本發(fā)明實(shí)施例提供的一種惡意廣告識(shí)別裝置的結(jié)構(gòu)示意圖;
[0019]圖5是本發(fā)明實(shí)施例提供的另一種惡意廣告識(shí)別裝置的結(jié)構(gòu)示意圖;
[0020]圖6是本發(fā)明實(shí)施例提供的另一種惡意廣告識(shí)別裝置的結(jié)構(gòu)示意圖;
[0021]圖7是本發(fā)明實(shí)施例提供的另一種惡意廣告識(shí)別裝置的結(jié)構(gòu)示意圖;
[0022]圖8是本發(fā)明實(shí)施例提供的另一種惡意廣告識(shí)別裝置的結(jié)構(gòu)示意圖;
[0023]圖9是本發(fā)明實(shí)施例提供的另一種惡意廣告識(shí)別裝置的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0024]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0025]本發(fā)明實(shí)施例中的信息源具體可以是網(wǎng)絡(luò)上傳輸?shù)男畔⒃矗以撔畔⒃纯梢允窃跁r(shí)間上為連續(xù)信息源,例如:一段語音、一段視頻等。
[0026]另外,本發(fā)明實(shí)施例中,滑動(dòng)窗口滑動(dòng)的速度可以是理解為每個(gè)滑動(dòng)的時(shí)長(zhǎng),例如:滑動(dòng)窗口以I秒/次的滑動(dòng)速度進(jìn)行滑動(dòng),即滑動(dòng)窗口每次滑動(dòng)的時(shí)長(zhǎng)為I秒。且本發(fā)明實(shí)施例中,滑動(dòng)窗口每次滑動(dòng)的間隔時(shí)間可以是根據(jù)用戶操作或者根據(jù)識(shí)別出的惡意廣告的數(shù)量進(jìn)行調(diào)整的,例如:滑動(dòng)窗口每隔3秒或者I秒滑動(dòng)一次,即滑動(dòng)窗口每隔3秒或者I秒滑動(dòng)一次,即滑動(dòng)窗口每次停頓的時(shí)長(zhǎng)為3秒或者I秒。
[0027]圖1是本發(fā)明實(shí)施例提供的一種惡意廣告識(shí)別方法的流程示意圖,如圖1所示,包括以下步驟:
[0028]S101、獲取信息源。
[0029]具體可以是接收網(wǎng)絡(luò)服務(wù)器發(fā)送的信息源,或者接收通信終端發(fā)送的信息源。
[0030]S102、將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng)。
[0031]可選的,上述第一時(shí)長(zhǎng)可以是用戶設(shè)置的,也可以預(yù)設(shè)指定的。例如:30秒時(shí)長(zhǎng)的滑動(dòng)窗口。上述信息源的第一端和第二端具體可以是信息源的兩端點(diǎn),例如,起始端和終端。
[0032]S103、掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告;其中,所述N為大于或者等于2的整數(shù),所述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素。
[0033]需要說明的是,步驟S102和步驟S103可以是同時(shí)執(zhí)行的。
[0034]可選的,上述N可以是用戶設(shè)置的,也可以預(yù)設(shè)指定的。由于上述滑動(dòng)窗口是一個(gè)時(shí)長(zhǎng)的滑動(dòng)窗口,而信息源為一個(gè)時(shí)間連續(xù)的信息源,即滑動(dòng)窗口每次滑動(dòng)到一個(gè)位置都會(huì)覆蓋信息源中的一部分,該覆蓋的部分就為一個(gè)信息單元?;瑒?dòng)窗口需要經(jīng)常W次從信息源的第一端滑動(dòng)到第二端,那么就可以獲取到W個(gè)信息單元,當(dāng)然這W個(gè)信息單元可以是存在重復(fù)的部分,例如:滑動(dòng)窗口滑動(dòng)的速度小于上述第一時(shí)長(zhǎng)時(shí)(即滑動(dòng)窗口每次滑動(dòng)的時(shí)長(zhǎng)小于上述第一時(shí)長(zhǎng)),那么這W個(gè)信息單元就存在重復(fù)的信息元素。例如:滑動(dòng)窗口滑動(dòng)的速度大于或者等于上述第一時(shí)長(zhǎng)時(shí)(即滑動(dòng)窗口每次滑動(dòng)的時(shí)長(zhǎng)大于或者等于上述第一時(shí)長(zhǎng)),那么這W個(gè)信息單元就不存在重復(fù)的信息元素。
[0035]可選的,上述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素可以理解為,上述多個(gè)相似的信息元素彼此之間的相似度大于第一閾值,例如:上述多個(gè)相似的信息元素為多個(gè)相同的信息元素,或者多個(gè)相似度大于90%的信息元素。在實(shí)際應(yīng)用中惡意廣告都是以重復(fù)或者相似的信息元素出現(xiàn),從而步驟S103可以將上述多個(gè)相似的信息元素確定為惡意廣告。
[0036]可選的,上述技術(shù)中由于將信息源劃分為多個(gè)信息單元,再對(duì)每信息單元進(jìn)行惡意廣告識(shí)別,從而更加容易將惡意廣告組合在信息單元內(nèi),以便識(shí)別出來。
[0037]可選的,上述方法可以應(yīng)用于任何具體通信功能的終端,即該終端可以實(shí)現(xiàn)上述方法,例如:平板電腦、手機(jī)、電子閱讀器、遙控器、個(gè)人計(jì)算機(jī)(Personal Computer, PC)、筆記本電腦、車載設(shè)備、網(wǎng)絡(luò)電視、可穿戴設(shè)備等具有網(wǎng)絡(luò)功能的智能設(shè)備。
[0038]上述技術(shù)方案中,獲取信息源;將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng);掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告。相比現(xiàn)有技術(shù),本發(fā)明實(shí)施例可以對(duì)將信息源劃分為更多的信息單元,且是以滑動(dòng)的方式進(jìn)行掃描,從而可以快速有效地識(shí)別出惡意廣告。
[0039]圖2是本發(fā)明實(shí)施例提供的另一種惡意廣告識(shí)別方法的流程示意圖,如圖2所示,包括以下步驟:
[0040]S201、獲取信息源。
[0041]S202、將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng)。
[0042]S203、掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告;其中,所述N為大于或者等于2的整數(shù),所述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素。
[0043]作為一種可選的實(shí)施方式,所述方法還可以包括:
[0044]S204、根據(jù)識(shí)別出的惡意廣告的數(shù)量及時(shí)調(diào)整識(shí)別參數(shù);其中識(shí)別參考包括如下至少一項(xiàng):
[0045]上述滑動(dòng)窗口的時(shí)長(zhǎng)、上述滑動(dòng)窗口的滑動(dòng)速度和上述用于識(shí)別出惡意廣告的聚集度(例如:N)。
[0046]步驟S202以及步驟S203再可以通過調(diào)整后的參考繼續(xù)滑動(dòng)和識(shí)別惡意廣告。具體的過程請(qǐng)參考下面的實(shí)施方式。
[0047]需要說明的是,步驟S202和步驟S203可以是一直在執(zhí)行的,直到滑動(dòng)窗口滑動(dòng)到上述第二端,且步驟S203掃描完滑動(dòng)窗口滑動(dòng)到第二端時(shí)覆蓋的信息單元。而步驟S204可以是在步驟S202和步驟S203開始執(zhí)行到結(jié)束執(zhí)行中的任意至少一個(gè)時(shí)間點(diǎn)執(zhí)行的。即可以多次調(diào)整上述識(shí)別參數(shù)。
[0048]作為一種可選的實(shí)施方式,步驟S202可以包括:
[0049]將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第三端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第二閾值。
[0050]將所述第二時(shí)間長(zhǎng)的所述滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第三端向所述信息源的第二端滑動(dòng),所述第二時(shí)長(zhǎng)比所述第一時(shí)長(zhǎng)要長(zhǎng)。
[0051]例如:上述第一時(shí)長(zhǎng)為30秒,那么上述第二時(shí)長(zhǎng)就可以大于30秒,例如:60秒。由于滑動(dòng)窗口的時(shí)長(zhǎng)越長(zhǎng),那么所覆蓋的信息單元的時(shí)長(zhǎng)就越長(zhǎng),這樣信息單元內(nèi)包括的惡意廣告的數(shù)量可能就越多,從而更加容易識(shí)別出惡意廣告。具體可以如圖3所示,30秒時(shí)長(zhǎng)的滑動(dòng)窗口 301從信息源302的第一端向第二端滑動(dòng),當(dāng)滑動(dòng)窗口 301滑動(dòng)到第一位置時(shí),步驟S203以為3的聚集度(即上述N為3)可以識(shí)別出惡意廣告303和304,如果滑動(dòng)窗口 301以該時(shí)長(zhǎng)一直滑動(dòng)下去,這樣惡意廣告305是不可以被識(shí)別出的,因?yàn)楫?dāng)滑動(dòng)窗口301滑動(dòng)到第二位置時(shí),步驟S203只能掃描到2個(gè)相似的信息元素,由于小于3所以不能識(shí)別出惡意廣告305。但如果將滑動(dòng)窗口 301調(diào)整60秒時(shí)長(zhǎng)的滑動(dòng)窗口 306,這樣當(dāng)滑動(dòng)窗口 306滑動(dòng)到第三位置時(shí),滑動(dòng)窗口 306所覆蓋的信息單元就包括4個(gè)惡意廣告(惡意廣告304和惡意廣告305),從而步驟S203可以識(shí)別出惡意廣告304和惡意廣告305。
[0052]其中,上述第三端可以是預(yù)先設(shè)置好的,也可以是用戶根據(jù)實(shí)際情況設(shè)置的。上述第二閾值可以是預(yù)先設(shè)置好的,也可以是用戶根據(jù)實(shí)際情況設(shè)置的。上述第一端為起始端,第三端為時(shí)間點(diǎn)為100秒的端,即第一端到第三端為0-100秒的時(shí)長(zhǎng),例如:上述第二閾值為10。即信息源的0-100秒的時(shí)長(zhǎng)時(shí)識(shí)別出的惡意廣告數(shù)量小于10個(gè)時(shí),執(zhí)行將所述第二時(shí)間長(zhǎng)的所述滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第三端向所述信息源的第二端滑動(dòng)的步驟。
[0053]該實(shí)施方式中,可以根據(jù)識(shí)別出的惡意廣告數(shù)量及時(shí)調(diào)整滑動(dòng)窗口的時(shí)長(zhǎng),當(dāng)然上述僅列出將滑動(dòng)窗口的時(shí)長(zhǎng)調(diào)長(zhǎng)的實(shí)現(xiàn)方式,本實(shí)施例中還可以調(diào)短滑動(dòng)窗口的時(shí)長(zhǎng),例如,識(shí)別出的惡意廣告過多時(shí),就可以調(diào)短滑動(dòng)窗口的時(shí)長(zhǎng),以更加細(xì)致地識(shí)別惡意廣生口 ο
[0054]作為一種可選的實(shí)施方式,步驟S203可以包括:
[0055]在所述滑動(dòng)窗口從所述信息源的第一端滑動(dòng)至所述信息源的第四端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素;其中,所述信息源的第四端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第三閾值;
[0056]在所述滑動(dòng)窗口從所述信息源的第四端滑動(dòng)至所述信息源的第二端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于H的多個(gè)相似的信息元素;其中,所述H小于所述N,且所述H為大于或者等于2的整數(shù)。
[0057]其中,上述第三閾值可以是預(yù)先設(shè)置的,也可以是用戶根據(jù)實(shí)際情況而設(shè)置的。
[0058]該實(shí)施方式中,可以實(shí)現(xiàn)當(dāng)識(shí)別出的惡意廣告的數(shù)量過少時(shí),將聚集度調(diào)低,從而可以識(shí)別出更多的惡意廣告,例如:第四端與所述第一端之間采用的聚集度為N(例如:N為4),那么第四端與所述第一端之間采用的聚集度就可以為H (例如:N為3)。
[0059]作為一種可選的實(shí)施方式,步驟S203可以包括:
[0060]在所述滑動(dòng)窗口從所述信息源的第一端滑動(dòng)至所述信息源的第五端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素;其中,所述信息源的第五端與所述第一端之間識(shí)別出的惡意廣告數(shù)量大于第四閾值;
[0061]在所述滑動(dòng)窗口從所述信息源的第五端滑動(dòng)至所述信息源的第二端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于M的多個(gè)相似的信息元素;其中,所述M大于所述N,且所述M為大于或者等于2的整數(shù)。
[0062]其中,上述第四閾值可以是預(yù)先設(shè)置的,也可以是用戶根據(jù)實(shí)際情況而設(shè)置的。
[0063]該實(shí)施方式中,可以實(shí)現(xiàn)當(dāng)識(shí)別出的惡意廣告的數(shù)量過多時(shí),將聚集度調(diào)高,從而可以更加快速地識(shí)別出惡意廣告,因?yàn)閻阂鈴V告過多時(shí),聚集度高調(diào)同樣可以識(shí)別出惡意廣告,且識(shí)別速度要快。例如:第五端與所述第一端之間采用的聚集度為N (例如:N為4),那么第五端與所述第一端之間采用的聚集度就可以為W (例如:N為5)。
[0064]作為一種可選的實(shí)施方式,步驟S202可以包括:
[0065]將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第六端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第五閾值;
[0066]將所述滑動(dòng)窗口以所述第二滑動(dòng)速度從所述信息源的第六端向所述信息源的第二端滑動(dòng),所述第二滑動(dòng)速度快于所述第一滑動(dòng)速度。
[0067]其中,上述第五閾值可以是預(yù)先設(shè)置的,也可以是用戶根據(jù)實(shí)際情況而設(shè)置的。
[0068]該實(shí)施方式中,可以實(shí)現(xiàn)當(dāng)識(shí)別出的惡意廣告的數(shù)量過少時(shí),就可以將滑動(dòng)窗口的滑動(dòng)速度調(diào)快,即將滑動(dòng)窗口每次滑動(dòng)的時(shí)長(zhǎng)調(diào)長(zhǎng),例如:原來每次滑動(dòng)I秒,現(xiàn)在調(diào)成每次滑動(dòng)3秒等。這樣可以更加快速地掃描信息源中的惡意廣告,因?yàn)橐呀?jīng)識(shí)別出的惡意廣告比較少,這樣信息源所有的惡意廣告也比較少,即使滑動(dòng)窗口每次滑動(dòng)的時(shí)長(zhǎng)比較長(zhǎng),也可以掃描出全部的惡意廣告。
[0069]作為一種可選的實(shí)施方式,步驟S202可以包括:
[0070]將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第五端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量大于第六閾值;
[0071]將所述滑動(dòng)窗口以所述第三滑動(dòng)速度從所述信息源的第七端向所述信息源的第二端滑動(dòng),所述第三滑動(dòng)速度慢于所述第一滑動(dòng)速度。
[0072]其中,上述第六閾值可以是預(yù)先設(shè)置的,也可以是用戶根據(jù)實(shí)際情況而設(shè)置的。
[0073]該實(shí)施方式中,可以實(shí)現(xiàn)當(dāng)識(shí)別出的惡意廣告的數(shù)量過大時(shí),就可以將滑動(dòng)窗口的滑動(dòng)速度調(diào)慢,即將滑動(dòng)窗口每次滑動(dòng)的時(shí)長(zhǎng)調(diào)短,例如:原來每次滑動(dòng)2秒,現(xiàn)在調(diào)成每次滑動(dòng)I秒等。這樣可以將信息源劃分出更多的信息單元,從而可以更有可能將多個(gè)惡意廣告集中在信息單元內(nèi),以更加有效識(shí)別出惡意廣告。
[0074]上述技術(shù)方案中,在上面實(shí)施例的基本上增加了多種可選的實(shí)施方式,且都可以實(shí)現(xiàn)快速有效地識(shí)別出惡意廣告。
[0075]下面為本發(fā)明裝置實(shí)施例,本發(fā)明裝置實(shí)施例用于執(zhí)行本發(fā)明方法實(shí)施例一至二實(shí)現(xiàn)的方法,為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,具體技術(shù)細(xì)節(jié)未揭示的,請(qǐng)參照本發(fā)明實(shí)施例一和實(shí)施例二。
[0076]圖4是本發(fā)明實(shí)施例提供的一種惡意廣告識(shí)別裝置的結(jié)構(gòu)示意圖,如圖4所示,包括:獲取單元41、滑動(dòng)單元42和掃描單元43,其中:
[0077]獲取單元41,用于獲取信息源。
[0078]具體可以是接收網(wǎng)絡(luò)服務(wù)器發(fā)送的信息源,或者接收通信終端發(fā)送的信息源。
[0079]滑動(dòng)單元42,用于將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng)。
[0080]可選的,上述第一時(shí)長(zhǎng)可以是用戶設(shè)置的,也可以預(yù)設(shè)指定的。例如:30秒時(shí)長(zhǎng)的滑動(dòng)窗口。上述信息源的第一端和第二端具體可以是信息源的兩端點(diǎn),例如,起始端和終端。
[0081]掃描單元43,用于掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告;其中,所述N為大于或者等于2的整數(shù),所述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素。
[0082]可選的,上述N可以是用戶設(shè)置的,也可以預(yù)設(shè)指定的。由于上述滑動(dòng)窗口是一個(gè)時(shí)長(zhǎng)的滑動(dòng)窗口,而信息源為一個(gè)時(shí)間連續(xù)的信息源,即滑動(dòng)窗口每次滑動(dòng)到一個(gè)位置都會(huì)覆蓋信息源中的一部分,該覆蓋的部分就為一個(gè)信息單元。滑動(dòng)窗口需要經(jīng)常W次從信息源的第一端滑動(dòng)到第二端,那么就可以獲取到W個(gè)信息單元,當(dāng)然這W個(gè)信息單元可以是存在重復(fù)的部分,例如:滑動(dòng)窗口滑動(dòng)的速度小于上述第一時(shí)長(zhǎng)時(shí)(即滑動(dòng)窗口每次滑動(dòng)的時(shí)長(zhǎng)小于上述第一時(shí)長(zhǎng)),那么這W個(gè)信息單元就存在重復(fù)的信息元素。例如:滑動(dòng)窗口滑動(dòng)的速度大于或者等于上述第一時(shí)長(zhǎng)時(shí)(即滑動(dòng)窗口每次滑動(dòng)的時(shí)長(zhǎng)大于或者等于上述第一時(shí)長(zhǎng)),那么這W個(gè)信息單元就不存在重復(fù)的信息元素。
[0083]可選的,上述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素可以理解為,上述多個(gè)相似的信息元素彼此之間的相似度大于第一閾值,例如:上述多個(gè)相似的信息元素為多個(gè)相同的信息元素,或者多個(gè)相似度大于90%的信息元素。在實(shí)際應(yīng)用中惡意廣告都是以重復(fù)或者相似的信息元素出現(xiàn),從而掃描單元43可以將上述多個(gè)相似的信息元素確定為惡意廣告。
[0084]可選的,上述技術(shù)中由于將信息源劃分為多個(gè)信息單元,再對(duì)每信息單元進(jìn)行惡意廣告識(shí)別,從而更加容易將惡意廣告組合在信息單元內(nèi),以便識(shí)別出來。
[0085]可選的,上述裝置可以應(yīng)用于任何具體通信功能的終端,即該終端可以包括上述裝置,例如:平板電腦、手機(jī)、電子閱讀器、遙控器、個(gè)人計(jì)算機(jī)(Personal Computer, PC)、筆記本電腦、車載設(shè)備、網(wǎng)絡(luò)電視、可穿戴設(shè)備等具有網(wǎng)絡(luò)功能的智能設(shè)備。
[0086]上述技術(shù)方案中,獲取信息源;將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng);掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告。相比現(xiàn)有技術(shù),本發(fā)明實(shí)施例可以對(duì)將信息源劃分為更多的信息單元,且是以滑動(dòng)的方式進(jìn)行掃描,從而可以快速有效地識(shí)別出惡意廣告。
[0087]圖5是本發(fā)明實(shí)施例提供的另一種惡意廣告識(shí)別裝置的結(jié)構(gòu)示意圖,如圖5所示,包括:獲取單元51、滑動(dòng)單元52、掃描單元53,其中:
[0088]獲取單元51,用于獲取信息源。
[0089]滑動(dòng)單兀52,用于將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng)。
[0090]掃描單元53,用于掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告;其中,所述N為大于或者等于2的整數(shù),所述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素。
[0091]作為一種可選的實(shí)施方式,所述裝置還可以包括:
[0092]調(diào)整單元54,用于根據(jù)識(shí)別出的惡意廣告的數(shù)量及時(shí)調(diào)整識(shí)別參數(shù);其中識(shí)別參考包括如下至少一項(xiàng):
[0093]上述滑動(dòng)窗口的時(shí)長(zhǎng)、上述滑動(dòng)窗口的滑動(dòng)速度和上述用于識(shí)別出惡意廣告的聚集度(例如:N)。
[0094]滑動(dòng)單元52以及掃描單元53再可以通過調(diào)整后的參考繼續(xù)滑動(dòng)和識(shí)別惡意廣告。具體的過程請(qǐng)參考下面的實(shí)施方式。
[0095]作為一種可選的實(shí)施方式,滑動(dòng)單元52可以包括:
[0096]第一滑動(dòng)子單兀521,用于將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第三端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第二閾值;
[0097]第二滑動(dòng)單元522,用于將所述第二時(shí)間長(zhǎng)的所述滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第三端向所述信息源的第二端滑動(dòng),所述第二時(shí)長(zhǎng)比所述第一時(shí)長(zhǎng)要長(zhǎng)。
[0098]作為一種可選的實(shí)施方式,如圖6所示,掃描單元53可以包括:
[0099]第一掃描子單元531,用于在所述滑動(dòng)窗口從所述信息源的第一端滑動(dòng)至所述信息源的第四端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素;其中,所述信息源的第四端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第三閾值;
[0100]第二掃描子單元532,用于在所述滑動(dòng)窗口從所述信息源的第四端滑動(dòng)至所述信息源的第二端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于H的多個(gè)相似的信息元素;其中,所述H小于所述N,且所述H為大于或者等于2的整數(shù)。
[0101]作為一種可選的實(shí)施方式,如圖7所示,掃描單元53包括:
[0102]第三掃描子單元533,用于在所述滑動(dòng)窗口從所述信息源的第一端滑動(dòng)至所述信息源的第五端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素;其中,所述信息源的第五端與所述第一端之間識(shí)別出的惡意廣告數(shù)量大于第四閾值;
[0103]第四掃描子單元534,用于在所述滑動(dòng)窗口從所述信息源的第五端滑動(dòng)至所述信息源的第二端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于M的多個(gè)相似的信息元素;其中,所述M大于所述N,且所述M為大于或者等于2的整數(shù)。
[0104]作為一種可選的實(shí)施方式,如圖8所示,滑動(dòng)單元52可以包括:
[0105]第三滑動(dòng)子單元523,用于將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第六端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第五閾值;
[0106]第四滑動(dòng)子單元524,用于將所述滑動(dòng)窗口以所述第二滑動(dòng)速度從所述信息源的第六端向所述信息源的第二端滑動(dòng),所述第二滑動(dòng)速度快于所述第一滑動(dòng)速度。
[0107]作為一種可選的實(shí)施方式,如圖9所示,滑動(dòng)單元52可以包括:
[0108]第五滑動(dòng)子單元525,用于將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第五端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量大于第六閾值;
[0109]第六滑動(dòng)子單元526,用于將所述滑動(dòng)窗口以所述第三滑動(dòng)速度從所述信息源的第七端向所述信息源的第二端滑動(dòng),所述第三滑動(dòng)速度慢于所述第一滑動(dòng)速度。
[0110]上述技術(shù)方案中,在上面實(shí)施例的基本上增加了多種可選的實(shí)施方式,且都可以實(shí)現(xiàn)快速有效地識(shí)別出惡意廣告。
[0111]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(Read-Only Memory, ROM)或隨機(jī)存取存儲(chǔ)器(Random AccessMemory,簡(jiǎn)稱 RAM)等。
[0112]以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。
【權(quán)利要求】
1.一種惡意廣告識(shí)別方法,其特征在于,包括: 獲取信息源; 將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng); 掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告;其中,所述N為大于或者等于2的整數(shù),所述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素。
2.如權(quán)利要求1所述的方法,其特征在于,所述將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng),包括: 將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第三端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第二閾值; 調(diào)整所述滑動(dòng)窗口的時(shí)長(zhǎng)調(diào)整為第二時(shí)長(zhǎng) 將所述第二時(shí)間長(zhǎng)的所述滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第三端向所述信息源的第二端滑動(dòng),所述第二時(shí)長(zhǎng)比所述第一時(shí)長(zhǎng)要長(zhǎng)。
3.如權(quán)利要求1所述的方法,其特征在于,所述掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,包括: 在所述滑動(dòng)窗口從所述信息源的第一端滑動(dòng)至所述信息源的第四端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素;其中,所述信息源的第四端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第三閾值; 在所述滑動(dòng)窗口從所述信息源的第四端滑動(dòng)至所述信息源的第二端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于H的多個(gè)相似的信息元素;其中,所述H小于所述N,且所述H為大于或者等于2的整數(shù)。
4.如權(quán)利要求1所述的方法,其特征在于,所述掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素,包括: 在所述滑動(dòng)窗口從所述信息源的第一端滑動(dòng)至所述信息源的第五端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于N的多個(gè)相似的信息元素;其中,所述信息源的第五端與所述第一端之間識(shí)別出的惡意廣告數(shù)量大于第四閾值; 在所述滑動(dòng)窗口從所述信息源的第五端滑動(dòng)至所述信息源的第二端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于M的多個(gè)相似的信息元素;其中,所述M大于所述N,且所述M為大于或者等于2的整數(shù)。
5.如權(quán)利要求1、3或4所述的方法,其特征在于,所述將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng),包括: 將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第六端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第五閾值; 將所述滑動(dòng)窗口以所述第二滑動(dòng)速度從所述信息源的第六端向所述信息源的第二端滑動(dòng),所述第二滑動(dòng)速度快于所述第一滑動(dòng)速度。
6.如權(quán)利要求1、3或4所述的方法,其特征在于,所述將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng),包括: 將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第五端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量大于第六閾值; 將所述滑動(dòng)窗口以所述第三滑動(dòng)速度從所述信息源的第七端向所述信息源的第二端滑動(dòng),所述第三滑動(dòng)速度慢于所述第一滑動(dòng)速度。
7.—種惡意廣告識(shí)別裝置,其特征在于,包括:獲取單元、滑動(dòng)單元和掃描單元,其中: 所述獲取單元,用于獲取信息源; 所述滑動(dòng)單元,用于將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第二端滑動(dòng); 所述掃描單元,用于掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于~的多個(gè)相似的信息元素,并確定所述多個(gè)相似的信息元素為惡意廣告;其中,所述~為大于或者等于2的整數(shù),所述多個(gè)相似的信息元素是指相似度大于第一閾值的多個(gè)信息元素。
8.如權(quán)利要求7所述的裝置,其特征在于,所述滑動(dòng)單元包括: 第一滑動(dòng)子單兀,用于將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第三端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第二閾值; 第二滑動(dòng)單元,用于將所述第二時(shí)間長(zhǎng)的所述滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第三端向所述信息源的第二端滑動(dòng),所述第二時(shí)長(zhǎng)比所述第一時(shí)長(zhǎng)要長(zhǎng)。
9.如權(quán)利要求7所述的裝置,其特征在于,所述掃描單元包括: 第一掃描子單元,用于在所述滑動(dòng)窗口從所述信息源的第一端滑動(dòng)至所述信息源的第四端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于~的多個(gè)相似的信息元素;其中,所述信息源的第四端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第三閾值; 第二掃描子單元,用于在所述滑動(dòng)窗口從所述信息源的第四端滑動(dòng)至所述信息源的第二端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于只的多個(gè)相似的信息元素;其中,所述0小于所述I且所述0為大于或者等于2的整數(shù)。
10.如權(quán)利要求7所述的裝置,其特征在于,所述掃描單元包括: 第三掃描子單元,用于在所述滑動(dòng)窗口從所述信息源的第一端滑動(dòng)至所述信息源的第五端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于~的多個(gè)相似的信息元素;其中,所述信息源的第五端與所述第一端之間識(shí)別出的惡意廣告數(shù)量大于第四閾值; 第四掃描子單元,用于在所述滑動(dòng)窗口從所述信息源的第五端滑動(dòng)至所述信息源的第二端時(shí),掃描所述滑動(dòng)窗口每個(gè)停頓時(shí)所覆蓋的所述信息源的信息單元中數(shù)量大于或者等于1的多個(gè)相似的信息元素;其中,所述1大于所述I且所述1為大于或者等于2的整數(shù)。
11.如權(quán)利要求7、9或10所述的裝置,其特征在于,所述滑動(dòng)單元包括: 第三滑動(dòng)子單元,用于將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第六端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量小于第五閾值; 第四滑動(dòng)子單元,用于將所述滑動(dòng)窗口以所述第二滑動(dòng)速度從所述信息源的第六端向所述信息源的第二端滑動(dòng),所述第二滑動(dòng)速度快于所述第一滑動(dòng)速度。
12.如權(quán)利要求7、9或10所述的裝置,其特征在于,所述滑動(dòng)單元包括: 第五滑動(dòng)子單兀,用于將第一時(shí)長(zhǎng)的滑動(dòng)窗口以第一滑動(dòng)速度從所述信息源的第一端向所述信息源的第五端滑動(dòng),所述信息源的第三端與所述第一端之間識(shí)別出的惡意廣告數(shù)量大于第六閾值; 第六滑動(dòng)子單元,用于將所述滑動(dòng)窗口以所述第三滑動(dòng)速度從所述信息源的第七端向所述信息源的第二端滑動(dòng),所述第三滑動(dòng)速度慢于所述第一滑動(dòng)速度。
【文檔編號(hào)】G06F21/56GK104424436SQ201310381536
【公開日】2015年3月18日 申請(qǐng)日期:2013年8月28日 優(yōu)先權(quán)日:2013年8月28日
【發(fā)明者】沈飛, 周斌, 稂衡峰, 趙立, 謝波, 劉婷婷, 楊正朋 申請(qǐng)人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1