本發(fā)明涉及網(wǎng)絡(luò)
技術(shù)領(lǐng)域:
,特別是涉及一種網(wǎng)頁內(nèi)容更新速度對比方法和裝置。
背景技術(shù):
:隨著網(wǎng)絡(luò)技術(shù)以及移動終端技術(shù)的發(fā)展,各種網(wǎng)絡(luò)服務(wù)應(yīng)用為人們提供多樣的網(wǎng)絡(luò)服務(wù),例如,視頻網(wǎng)站提供視頻觀看服務(wù),小說網(wǎng)站提供小說瀏覽服務(wù),新聞網(wǎng)站則提供時事新聞閱覽服務(wù),等等。網(wǎng)絡(luò)服務(wù)的推出時間至關(guān)重要,關(guān)系到用戶體驗(yàn),從而影響到網(wǎng)站的用戶擁有量。例如,用戶往往更加青睞于第一時間更新電視劇劇集的視頻網(wǎng)站、第一時間更新小說章節(jié)的小說網(wǎng)站、以及第一時間公布時事新聞的新聞網(wǎng)站等等。網(wǎng)站之間激烈的競爭決定了各個網(wǎng)站需要評估自己網(wǎng)站與競爭對手更新網(wǎng)絡(luò)服務(wù)內(nèi)容的速度差異,以便根據(jù)該速度差異做出相關(guān)決策,例如,提升自身應(yīng)用服務(wù)性能等;另外,用戶也存在知道該速度差異的需求,以方便用戶去網(wǎng)絡(luò)服務(wù)內(nèi)容更新速度更快的網(wǎng)站享受相應(yīng)的服務(wù)。傳統(tǒng)的方法一般通過提取網(wǎng)頁內(nèi)容中明確指出的發(fā)布時間來確定網(wǎng)頁內(nèi)容的更新時間,而由于該發(fā)布時間由網(wǎng)站人員進(jìn)行人工設(shè)置,因此存在不準(zhǔn)確的風(fēng)險(xiǎn),從而導(dǎo)致網(wǎng)頁內(nèi)容更新速度對比結(jié)果的不準(zhǔn)確性。技術(shù)實(shí)現(xiàn)要素:基于此,有必要提供一種可獲得準(zhǔn)確對比結(jié)果的網(wǎng)頁內(nèi)容更新速度對比方法和裝置。一種網(wǎng)頁內(nèi)容更新速度對比方法,包括以下步驟:獲取待對比關(guān)鍵字;循環(huán)向各個目標(biāo)網(wǎng)站請求所述關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁;分目標(biāo)網(wǎng)站提取本次循環(huán)請求到的搜索結(jié)果網(wǎng)頁相對于上一次循環(huán)請求到 的搜索結(jié)果網(wǎng)頁更新的所述關(guān)鍵字對應(yīng)的內(nèi)容條目;若提取到更新的內(nèi)容條目,則以本次循環(huán)處理時間作為該內(nèi)容條目的更新時間,記錄相應(yīng)目標(biāo)網(wǎng)站、所述關(guān)鍵字、該內(nèi)容條目以及該更新時間的對應(yīng)關(guān)系;對比目標(biāo)網(wǎng)站之間更新所述關(guān)鍵字對應(yīng)的相同內(nèi)容條目的更新時間;根據(jù)對比結(jié)果生成目標(biāo)網(wǎng)站之間更新所述關(guān)鍵字對應(yīng)的相同內(nèi)容條目的更新差異數(shù)據(jù)。一種網(wǎng)頁內(nèi)容更新速度對比裝置,包括對比關(guān)鍵字獲取模塊,用于獲取待對比關(guān)鍵字;關(guān)鍵字搜索網(wǎng)頁請求模塊,用于循環(huán)向各個目標(biāo)網(wǎng)站請求所述關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁;更新內(nèi)容條目提取模塊,用于分目標(biāo)網(wǎng)站提取所述關(guān)鍵字搜索網(wǎng)頁請求模塊本次循環(huán)請求到的搜索結(jié)果網(wǎng)頁相對于所述更新內(nèi)容條目提取模塊上一次循環(huán)請求到的搜索結(jié)果網(wǎng)頁更新的所述關(guān)鍵字對應(yīng)的內(nèi)容條目;記錄模塊,用于若提取到更新的內(nèi)容條目,則以本次循環(huán)處理時間作為該內(nèi)容條目的更新時間,記錄相應(yīng)目標(biāo)網(wǎng)站、所述關(guān)鍵字、該內(nèi)容條目以及該更新時間的對應(yīng)關(guān)系;更新時間對比模塊,用于對比目標(biāo)網(wǎng)站之間更新所述關(guān)鍵字對應(yīng)的相同內(nèi)容條目的更新時間;更新差異數(shù)據(jù)生成模塊,用于根據(jù)對比結(jié)果生成目標(biāo)網(wǎng)站之間更新所述關(guān)鍵字對應(yīng)的相同內(nèi)容條目的更新差異數(shù)據(jù)。上述網(wǎng)頁內(nèi)容更新速度對比方法和裝置,循環(huán)向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,并提取搜索結(jié)果網(wǎng)頁更新的內(nèi)容條目,從而可監(jiān)測到目標(biāo)網(wǎng)站是否更新了內(nèi)容條目以及更新了哪些內(nèi)容條目,上述方法和裝置將本次循環(huán)處理時間作為更新的內(nèi)容條目的更新時間,該時間實(shí)際相當(dāng)于該更新的內(nèi)容條目被監(jiān)測到的時間,由于上述方法和裝置循環(huán)向各個目標(biāo)網(wǎng)站請求關(guān)鍵字 對應(yīng)的搜索結(jié)果網(wǎng)頁,因此上述方法和裝置監(jiān)測到更新的內(nèi)容條目的時間非常近似于該更新的內(nèi)容條目實(shí)際發(fā)布的時間,該實(shí)際發(fā)布的時間相當(dāng)于實(shí)際更新的時間,因此,上述方法和裝置可以準(zhǔn)確地獲取到內(nèi)容條目的更新時間,并根據(jù)準(zhǔn)確的更新時間來對比目標(biāo)網(wǎng)站之間網(wǎng)頁內(nèi)容的更新速度,從而可以獲得準(zhǔn)確的對比結(jié)果。附圖說明圖1為一個實(shí)施例中可運(yùn)行本申請的網(wǎng)頁內(nèi)容更新速度對比方法的終端或服務(wù)器的部分結(jié)構(gòu)框圖;圖2為一個實(shí)施例中的網(wǎng)頁內(nèi)容更新速度對比方法的流程示意圖;圖3為一個實(shí)施例中設(shè)置存儲待對比關(guān)鍵字的過程的流程示意圖;圖4為一個實(shí)施例中圖2中的步驟S206的流程示意圖;圖5為一個實(shí)施例中的網(wǎng)頁內(nèi)容更新速度對比方法的流程示意圖;圖6為一個實(shí)施例中的網(wǎng)頁內(nèi)容更新速度對比裝置的結(jié)構(gòu)示意圖;圖7為一個實(shí)施例中的網(wǎng)頁內(nèi)容更新速度對比裝置的結(jié)構(gòu)示意圖;圖8為一個實(shí)施例中更新內(nèi)容條目提取模塊的結(jié)構(gòu)示意圖;圖9為一個實(shí)施例中的網(wǎng)頁內(nèi)容更新速度對比裝置的結(jié)構(gòu)示意圖;圖10為一個實(shí)施例中的網(wǎng)頁內(nèi)容更新速度對比裝置的結(jié)構(gòu)示意圖。具體實(shí)施方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。圖1為一個實(shí)施例中可運(yùn)行本申請的網(wǎng)頁內(nèi)容更新速度對比方法的終端或服務(wù)器的部分結(jié)構(gòu)框圖。如圖1所示,在一個實(shí)施例中,該服務(wù)器包括通過系統(tǒng)總線連接的處理器、存儲介質(zhì)、內(nèi)存和網(wǎng)絡(luò)接口;其中,網(wǎng)絡(luò)接口用于與網(wǎng)絡(luò)進(jìn)行通信,內(nèi)存用于緩存數(shù)據(jù),存儲介質(zhì)中存儲有操作系統(tǒng)、數(shù)據(jù)庫以及用于實(shí)現(xiàn)本申請所述的網(wǎng)頁內(nèi)容更新速度對比方法的軟件指令;數(shù)據(jù)庫可用于存儲 待對比關(guān)鍵字等本申請所述的網(wǎng)頁內(nèi)容更新速度對比方法所需要數(shù)據(jù)的或者中間處理過程產(chǎn)生的數(shù)據(jù);處理器協(xié)調(diào)各部件的工作并執(zhí)行這些指令以實(shí)現(xiàn)本申請所述的網(wǎng)頁內(nèi)容更新速度對比方法。本領(lǐng)域技術(shù)人員可以理解,圖1中示出的結(jié)構(gòu),僅僅是與本申請方案相關(guān)的部分結(jié)構(gòu)的框圖,并不構(gòu)成對本申請方案所應(yīng)用于其上的終端或服務(wù)器的限定,具體的終端或服務(wù)器可以包括比圖中所示更多或更少的部件,或者組合某些部件,或者具有不同的部件布置。如圖2所示,在一個實(shí)施例中,一種網(wǎng)頁內(nèi)容更新速度對比方法,包括以下步驟:步驟S202,獲取待對比關(guān)鍵字。在一個實(shí)施例中,待對比關(guān)鍵字的數(shù)量可包括一個或多個。當(dāng)待對比關(guān)鍵字的數(shù)量包括多個時,可分別對每一個待對比關(guān)鍵字進(jìn)行如下步驟S204至步驟S212所述的處理過程。下述過程中涉及到將兩個內(nèi)容條目進(jìn)行比較時,指的是將同一關(guān)鍵字對應(yīng)的內(nèi)容條目進(jìn)行比較。在一個實(shí)施例中,待對比關(guān)鍵字可被預(yù)先進(jìn)行設(shè)置并進(jìn)行存儲。在一個實(shí)施例中,可搜索指定領(lǐng)域或指定類別熱度超過閾值的關(guān)鍵字作為待對比關(guān)鍵字。例如,可搜索視頻類別熱度超過閾值的視頻名作為待對比關(guān)鍵字,其中,視頻名可對應(yīng)但不限于電視劇名稱或電影名稱等。在另一個實(shí)施例中,可獲取指定網(wǎng)絡(luò)排行榜中排行在前預(yù)設(shè)位的關(guān)鍵字作為待對比關(guān)鍵字。例如,可搜索音樂排行榜排行在前預(yù)設(shè)位音樂名稱作為待對比關(guān)鍵字,等等。在一個實(shí)施例中,在步驟202之前,上述網(wǎng)頁內(nèi)容更新速度對比方法還包括設(shè)置存儲待對比關(guān)鍵字的過程;如圖3所示,在一個實(shí)施例中,該過程包括以下步驟:步驟S302,獲取預(yù)設(shè)的網(wǎng)頁內(nèi)容分類類別。在一個實(shí)施例中,網(wǎng)頁內(nèi)容分類類別包括但不限于視頻、小說、音樂、新聞等。步驟S304,向各個目標(biāo)網(wǎng)站請求網(wǎng)頁內(nèi)容。在一個實(shí)施例中,目標(biāo)網(wǎng)站的URL信息可被預(yù)先設(shè)置并進(jìn)行存儲。在一個實(shí)施例中,可向各個目標(biāo)網(wǎng)站請求網(wǎng)站首頁的網(wǎng)頁內(nèi)容。具體的,可向各個目標(biāo)網(wǎng)站發(fā)送包含網(wǎng)站首頁的URL地址的網(wǎng)頁拉取請求,并接收各個目標(biāo)網(wǎng)站返回的首頁對應(yīng)的源代碼。步驟S306,爬取各個目標(biāo)網(wǎng)站的網(wǎng)頁內(nèi)容中各個類別對應(yīng)的關(guān)鍵字。在一個實(shí)施例中,可從各個目標(biāo)網(wǎng)站的首頁源代碼中提取各個類別對應(yīng)的網(wǎng)頁URL地址。進(jìn)一步的,可向目標(biāo)網(wǎng)站發(fā)送包含類別對應(yīng)的網(wǎng)頁URL地址的網(wǎng)頁拉取請求,并接收目標(biāo)網(wǎng)站返回的類別對應(yīng)的網(wǎng)頁源代碼。該過程相當(dāng)于用戶打開目標(biāo)網(wǎng)站的首頁,進(jìn)一步在首頁點(diǎn)擊類別對應(yīng)的鏈接,從而瀏覽器接收到目標(biāo)網(wǎng)站返回的類別對應(yīng)的網(wǎng)頁源代碼。在一個實(shí)施例中,可在源代碼中提取類別對應(yīng)的html標(biāo)簽內(nèi)href字段對應(yīng)的網(wǎng)頁URL地址。例如,以下源代碼中,類別“娛樂”對應(yīng)的html標(biāo)簽內(nèi)href字段對應(yīng)的網(wǎng)頁URL地址為“http://yule.iqiyi.com/”,則可提取該網(wǎng)頁URL地址為類別“娛樂”對應(yīng)的網(wǎng)頁URL地址:<h3><ahref="http://yule.iqiyi.com/"><spanrseat="娛樂">娛樂</span><spanclass="icon-more"rseat="娛樂更多">更多<em>>;</em></span></a></h3>。進(jìn)一步的,可從類別對應(yīng)的網(wǎng)頁源代碼中提取符合預(yù)設(shè)規(guī)則的html標(biāo)簽內(nèi)指定字段對應(yīng)的關(guān)鍵字,從而得到類別對應(yīng)的關(guān)鍵字。進(jìn)一步的,還可以從類別對應(yīng)的網(wǎng)頁源代碼中提取類別包含的子類別對應(yīng)的網(wǎng)頁鏈接,并向?qū)?yīng)目標(biāo)網(wǎng)站發(fā)送包含該網(wǎng)頁鏈接的網(wǎng)頁拉取請求,以及接收目標(biāo)網(wǎng)站返回的相應(yīng)的網(wǎng)頁源代碼;循環(huán)該過程,直到爬取到類別包含的所有子孫類別對應(yīng)的網(wǎng)頁源代碼,并在爬取過程中從接收到的網(wǎng)頁源代碼中提取符合預(yù)設(shè)規(guī)則的html標(biāo)簽內(nèi)指定字段對應(yīng)的關(guān)鍵字作為類別對應(yīng)的關(guān)鍵字。其中,類別包含的子孫類別包括:子類別以及從子類別分支出來的所有類別。步驟S308,在提取到的關(guān)鍵字中過濾重復(fù)的關(guān)鍵字。步驟S310,將過濾后剩余的關(guān)鍵字存儲為待對比關(guān)鍵字。在一個實(shí)施例中,可按照待對比關(guān)鍵字對應(yīng)的類別而分類別存儲待對比關(guān)鍵字。步驟S204,循環(huán)向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁。關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁相當(dāng)于在目標(biāo)網(wǎng)站內(nèi)搜索關(guān)鍵字可獲得的網(wǎng)頁。例如,若用戶在某一目標(biāo)網(wǎng)站的搜索輸入框內(nèi)輸入某一關(guān)鍵字,點(diǎn)擊搜索按鈕后,相應(yīng)的結(jié)果網(wǎng)頁即可呈現(xiàn)在用戶面前,該網(wǎng)頁即為搜索關(guān)鍵字獲得的網(wǎng)頁。在一個實(shí)施例中,在向某一個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁的過程中,可按照預(yù)設(shè)的規(guī)則生成網(wǎng)頁鏈接,該網(wǎng)頁鏈接表示向目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁;進(jìn)一步向目標(biāo)網(wǎng)站發(fā)送包含該網(wǎng)頁鏈接的網(wǎng)頁拉取請求,以及接收目標(biāo)網(wǎng)站返回的網(wǎng)頁源代碼,即關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁對應(yīng)的源代碼。例如,向URL地址為“http://www.iqiyi.com”的目標(biāo)網(wǎng)站請求關(guān)鍵字“奔跑吧兄弟”對應(yīng)的搜索結(jié)果網(wǎng)頁,則可生成如下網(wǎng)頁鏈接:http://so.iqiyi.com/so/q_奔跑吧兄弟?source=input;而向該目標(biāo)網(wǎng)站請求關(guān)鍵字“熊出沒”對應(yīng)的搜索結(jié)果網(wǎng)頁,則可生成如下網(wǎng)頁鏈接:http://so.iqiyi.com/so/q_熊出沒?source=input;其中,兩個網(wǎng)頁鏈接的所包含的關(guān)鍵字不同。向各個目標(biāo)網(wǎng)站分別請求上述關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁后,針對搜索結(jié)果網(wǎng)頁執(zhí)行步驟S206和S208相應(yīng)的處理,繼續(xù)向各個目標(biāo)網(wǎng)站分別請求上述關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,以及繼續(xù)針對搜索結(jié)果網(wǎng)頁執(zhí)行步驟S206和S208相應(yīng)的處理,循環(huán)該請求過程及處理過程,直到預(yù)設(shè)的循環(huán)結(jié)束條件被觸發(fā)。在一個實(shí)施例中,向所有目標(biāo)網(wǎng)站分別請求一次關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,并針對該搜索結(jié)果網(wǎng)頁進(jìn)行步驟S206和S208相應(yīng)的處理,稱之為一次循環(huán),或一次循環(huán)過程。在一個實(shí)施例中,步驟S204步驟包括以下步驟:每間隔預(yù)設(shè)時長向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,該預(yù)設(shè)時長不超過閾值。例如,每間隔1分鐘向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,等等。在一個實(shí)施例中,預(yù)設(shè)時長所不超過的閾值為一個較小的數(shù)值;從而可達(dá)到近似于實(shí)時監(jiān)測目標(biāo)網(wǎng)站所更新的網(wǎng)頁內(nèi)容的效果。步驟S206,分目標(biāo)網(wǎng)站提取本次循環(huán)請求到的搜索結(jié)果網(wǎng)頁相對于上一次循環(huán)請求到的搜索結(jié)果網(wǎng)頁更新的關(guān)鍵字對應(yīng)的內(nèi)容條目。在一個實(shí)施例中,步驟S206可將同一目標(biāo)網(wǎng)站對應(yīng)的本次循環(huán)請求到的搜索結(jié)果網(wǎng)頁與上一次循環(huán)請求到的搜索結(jié)果網(wǎng)頁進(jìn)行對比,提取該目標(biāo)網(wǎng)站所更新的關(guān)鍵字對應(yīng)的內(nèi)容條目。如圖4所示,在一個實(shí)施例中,步驟S206包括以下步驟:步驟S402,提取本次循環(huán)請求到的各個搜索結(jié)果網(wǎng)頁中關(guān)鍵字對應(yīng)的最新的內(nèi)容條目。在一個實(shí)施例中,可在搜索結(jié)果網(wǎng)頁源代碼的預(yù)設(shè)的指定位置提取關(guān)鍵字對應(yīng)的最新的內(nèi)容條目。關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁中包含關(guān)鍵字對應(yīng)的搜索結(jié)果列表。搜索結(jié)果列表中可能既包含精確匹配的搜索結(jié)果又包含模糊匹配的搜索結(jié)果。在一個實(shí)施例中,可過濾掉搜索結(jié)果列表中與關(guān)鍵字模糊匹配的搜索結(jié)果,保留精確匹配的搜索結(jié)果。在一些網(wǎng)站中,關(guān)鍵字對應(yīng)的最新的內(nèi)容條目排列在搜索結(jié)果列表的位置相對于其它的內(nèi)容條目靠前。因此,在一個實(shí)施例中,可從搜索結(jié)果網(wǎng)頁源代碼中關(guān)鍵字對應(yīng)的過濾了模糊匹配的搜索結(jié)果的搜索結(jié)果列表數(shù)據(jù)中,提取處于第一位置的內(nèi)容條目作為關(guān)鍵字對應(yīng)的最新的內(nèi)容條目。而在另一些網(wǎng)站中,關(guān)鍵字對應(yīng)的最新的內(nèi)容條目包含預(yù)設(shè)的指定字段,例如“更新至”等表示最新內(nèi)容的字段。因此,在一個實(shí)施例中,可從搜索結(jié)果網(wǎng)頁源代碼中關(guān)鍵字對應(yīng)的搜索結(jié)果列表數(shù)據(jù)中提取預(yù)設(shè)的指定字段對應(yīng)的內(nèi)容條目作為關(guān)鍵字對應(yīng)的最新的內(nèi)容條目。步驟S404,分目標(biāo)網(wǎng)站比較提取到的最新的內(nèi)容條目與最近記錄的內(nèi)容條目是否相同。其中,對于當(dāng)前提取到的某一目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的最新的內(nèi)容條目,可將該最新的內(nèi)容條目與最近記錄的該目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的內(nèi)容條目是否相同。步驟S406,獲取與最近記錄的內(nèi)容條目不同的提取到的最新的內(nèi)容條目作為相應(yīng)目標(biāo)網(wǎng)站的更新的內(nèi)容條目。若當(dāng)前提取到的某一目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的最新的內(nèi)容條目與最近記錄的該目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的內(nèi)容條目不同,則可獲取當(dāng)前提取到的最新的內(nèi)容條目作為關(guān)鍵字對應(yīng)的該目標(biāo)網(wǎng)站所更新的內(nèi)容條目。在一個實(shí)施例中,可每提取到一個目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的最新的內(nèi)容條目,即將當(dāng)前提取到的最新的內(nèi)容條目與最近記錄的該目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的內(nèi)容條目進(jìn)行比較,判斷二者是否相同,若不同,則獲取當(dāng)前提取到的最新的內(nèi)容條目作為該目標(biāo)網(wǎng)站的更新的關(guān)鍵字對應(yīng)的內(nèi)容條目。在另一個實(shí)施例中,可先提取到所有目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的最新的內(nèi)容條目,然后將提取到的每一個目標(biāo)網(wǎng)站的最新的內(nèi)容條目與最近記錄的相應(yīng)目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的內(nèi)容條目進(jìn)行比較。步驟S208,若提取到目標(biāo)網(wǎng)站更新的關(guān)鍵字對應(yīng)的內(nèi)容條目,則以本次循環(huán)處理時間作為該內(nèi)容條目的更新時間,記錄相應(yīng)目標(biāo)網(wǎng)站、該關(guān)鍵字、該內(nèi)容條目以及該更新時間的對應(yīng)關(guān)系。在一個實(shí)施例中,若提取到本次循環(huán)請求到的某一目標(biāo)網(wǎng)站的搜索結(jié)果網(wǎng)頁相對于上一次循環(huán)請求到的該目標(biāo)網(wǎng)站的搜索結(jié)果網(wǎng)頁所更新的關(guān)鍵字對應(yīng)的內(nèi)容條目,則該內(nèi)容條目的本次循環(huán)處理時間可為本次循環(huán)中接收到該搜索結(jié)果網(wǎng)頁的接收時間,也可以為當(dāng)前時間,或者,也可以為該接收時間或當(dāng)前時間的一個微小波動范圍內(nèi)的時間,即與該接收時間或當(dāng)前時間相關(guān)不超過一個小的范圍內(nèi)的時間。步驟S210,對比目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的相同內(nèi)容條目的更新時間。在一個實(shí)施例中,可將兩目標(biāo)網(wǎng)站更新關(guān)鍵字對應(yīng)的相同內(nèi)容條目的更新時間相減,得到相差時間。步驟S212,根據(jù)對比結(jié)果生成目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的相同內(nèi)容條 目的更新差異數(shù)據(jù)。更新差異數(shù)據(jù)包括但不限于圖表數(shù)據(jù)等,圖表數(shù)據(jù)對應(yīng)于表格、曲線圖、柱形圖等多種表現(xiàn)形式。在一個實(shí)施例中,待對比關(guān)鍵字包含多個不同類別的關(guān)鍵字,可分類別生成更新差異數(shù)據(jù)。在一個實(shí)施例中,上述網(wǎng)頁內(nèi)容更新速度對比方法,還包括以下步驟:將更新差異數(shù)據(jù)發(fā)送到指定郵箱或指定應(yīng)用程序接口。自動將更新差異數(shù)據(jù)發(fā)送到指定郵箱可以用于通知相關(guān)用戶了解更新差異數(shù)據(jù)。而自動將更新差異數(shù)據(jù)發(fā)送給指定應(yīng)用程序接口,可方便應(yīng)用程序接口對更新差異數(shù)據(jù)進(jìn)行預(yù)設(shè)邏輯的處理。在一個實(shí)施例中,上述網(wǎng)頁內(nèi)容更新速度對比方法,還包括以下步驟:根據(jù)更新差異數(shù)據(jù)對應(yīng)的表現(xiàn)形式展示更新差異數(shù)據(jù);等等。其中,例如,更新差異數(shù)據(jù)為表格數(shù)據(jù),則以表格的表現(xiàn)形式展示更新差異數(shù)據(jù),等等。在一個實(shí)施例中,上述網(wǎng)頁內(nèi)容更新速度對比方法,還包括以下步驟:提取內(nèi)容條目的特征標(biāo)識;在上述記錄內(nèi)容條目以及比較內(nèi)容條目的步驟中,以內(nèi)容條目的特征標(biāo)識為準(zhǔn)進(jìn)行記錄及比較。在一個實(shí)施例中,可在內(nèi)容條目中的預(yù)設(shè)的指定位置提取內(nèi)容條目的特征標(biāo)識。例如,可在內(nèi)容條目對應(yīng)的html標(biāo)簽中提取title字段對應(yīng)的內(nèi)容作為內(nèi)容條目的特征標(biāo)識。在一個實(shí)施例中,還可將特征標(biāo)識按照預(yù)設(shè)的處理邏輯進(jìn)行格式化,使得特征標(biāo)識符合預(yù)設(shè)的格式。例如,一內(nèi)容條目對應(yīng)的html源代碼如下所示:<aclass="album_link"data-playsrc-elem="firstlink"target="_blank"data-searchpingback-elem="link"data-searchpingback-param="ptype=1-3-1"href="http://www.iqiyi.com/v_19rro0o1ds.html#vfrm=2-3-0-1"data-pb="rtgt=iqiyi&p2=9000"title="2015-02-24:奔跑吧兄弟之指壓板極限任務(wù)虐趴眾人"data-tvlist-elem="">2015-02-24:指壓板極限任務(wù)虐趴眾人 </a>;可從中提取title字段對應(yīng)的內(nèi)容“2015-02-24:奔跑吧兄弟之指壓板極限任務(wù)虐趴眾人”作為內(nèi)容條目的特征標(biāo)識,進(jìn)一步的,可將2015-02-24格式化為20150224以滿足統(tǒng)一的格式。在一個實(shí)施例中,可對內(nèi)容條目進(jìn)行語義分析,以獲得內(nèi)容條目的特征標(biāo)識。例如,可通過語義分析工具對內(nèi)容條目進(jìn)行語義分析。例如,目標(biāo)網(wǎng)站為新聞網(wǎng)站,提取某一目標(biāo)網(wǎng)站更新的關(guān)鍵字對應(yīng)的內(nèi)容條目后,可對內(nèi)容條目進(jìn)行語義分析,得到內(nèi)容條目的特征標(biāo)識。從而在比較兩個目標(biāo)網(wǎng)站對同一關(guān)鍵字對應(yīng)的相同的內(nèi)容條目的更新速度時,可比較該兩個目標(biāo)網(wǎng)站對同一關(guān)鍵字對應(yīng)的相同的特征標(biāo)識的更新速度。圖5為一個實(shí)施例中的網(wǎng)頁內(nèi)容更新速度對比方法的流程示意圖。如圖5所示,上述網(wǎng)頁內(nèi)容更新速度對比方法包括以下步驟:步驟S502,獲取待對比關(guān)鍵字。步驟S504,循環(huán)向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁。步驟S506,提取本次循環(huán)請求到的各個搜索結(jié)果網(wǎng)頁中關(guān)鍵字對應(yīng)的最新的內(nèi)容條目。步驟S508,分目標(biāo)網(wǎng)站比較提取到的最新的特征標(biāo)識與最近記錄的特征標(biāo)識是否相同。步驟S510,獲取與最近記錄的特征標(biāo)識不同的提取到的最新的特征標(biāo)識作為相應(yīng)目標(biāo)網(wǎng)站的更新的特征標(biāo)識。步驟S512,若提取到更新的特征標(biāo)識,則以本次循環(huán)處理時間作為該特征標(biāo)識的更新時間,記錄相應(yīng)目標(biāo)網(wǎng)站、該關(guān)鍵字、該特征標(biāo)識以及該更新時間的對應(yīng)關(guān)系。步驟S514,對比目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的相同特征標(biāo)識的更新時間。步驟S516,根據(jù)對比結(jié)果生成目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的相同特征標(biāo)識的更新差異數(shù)據(jù)。在一個實(shí)施例中,可獲取特征標(biāo)識對應(yīng)的內(nèi)容條目,根據(jù)目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的同一特征標(biāo)識的更新時間的對比結(jié)果,生成目標(biāo)網(wǎng)站之間更新 關(guān)鍵字對應(yīng)的該特征標(biāo)識對應(yīng)的內(nèi)容條目的更新差異數(shù)據(jù)。以下結(jié)合一個具體的應(yīng)用場景來說明上述的網(wǎng)頁內(nèi)容更新速度對比方法。在一個實(shí)施例中,上述的網(wǎng)頁內(nèi)容更新速度對比方法用于對比目標(biāo)網(wǎng)站視頻劇集的更新速度和小說的更新速度。一個視頻劇集往往包括多集或者多期,需要對比目標(biāo)網(wǎng)站更新視頻劇集的更新時間。而一部小說往往包括多個章節(jié),需要對比目標(biāo)網(wǎng)站更新小說章節(jié)的更新時間。具體過程如下:(1)獲取預(yù)先存儲的視頻劇集類別的待對比關(guān)鍵字和小說類別的待對比關(guān)鍵字。獲取到的待對比關(guān)鍵字如下表1所示。表1視頻劇集名稱小說書名大聲說出來2015活人禁地幸福在哪里很純很曖昧前傳健康大不同師士傳說華夏微電影仙逆Imaybesometime...超級醫(yī)生綠箭俠殺神色啦抗日之鐵血軍魂大牌駕到超級島主橙路劇場版1但愿回到過去都市仙醫(yī)食來運(yùn)轉(zhuǎn)山村奇人傳對表1中的每一個關(guān)鍵字進(jìn)行如步驟(2)~(7)類似的處理,步驟(2)~(7)中以關(guān)鍵字“大聲說出來2015”為例進(jìn)行說明。(2)向目標(biāo)網(wǎng)站請求“大聲說出來2015”對應(yīng)的搜索結(jié)果網(wǎng)頁:按照預(yù)設(shè)的規(guī)則生成網(wǎng)頁鏈接,該網(wǎng)頁鏈接表示向目標(biāo)網(wǎng)站請求“大聲說出來2015”對應(yīng)的搜索結(jié)果網(wǎng)頁;進(jìn)一步向目標(biāo)網(wǎng)站發(fā)送包含該網(wǎng)頁鏈接的網(wǎng)頁拉取請求, 以及接收目標(biāo)網(wǎng)站返回的網(wǎng)頁源代碼,即“大聲說出來2015”對應(yīng)的搜索結(jié)果網(wǎng)頁的源代碼。以目標(biāo)網(wǎng)站的首頁URL地址是“http://www.iqiyi.com”為例,可生成如下網(wǎng)頁鏈接:http://so.iqiyi.com/so/q_大聲說出來2015?source=input;該網(wǎng)頁鏈接表示向該目標(biāo)網(wǎng)站請求“大聲說出來2015”對應(yīng)的搜索結(jié)果網(wǎng)頁。(3)從目標(biāo)網(wǎng)站接收到的“大聲說出來2015”對應(yīng)的搜索結(jié)果網(wǎng)頁的源代碼所包含的搜索結(jié)果列表數(shù)據(jù)中過濾模糊匹配的搜索結(jié)果,從過濾后的搜索結(jié)果列表數(shù)據(jù)中提取第一位置的內(nèi)容條目作為該目標(biāo)網(wǎng)站中“大聲說出來2015”對應(yīng)的最新的內(nèi)容條目。(4)從“大聲說出來2015”對應(yīng)的最新的內(nèi)容條目html標(biāo)簽中提取title字段對應(yīng)的內(nèi)容作為該最新的內(nèi)容條目的特征標(biāo)識,即“大聲說出來2015”對應(yīng)的最新的特征標(biāo)識。例如,“大聲說出來2015”對應(yīng)的最新的內(nèi)容條目html如下所示:<liclass="album_item"><aclass="album_link"data-playsrc-elem="firstlink"target="_blank"data-searchpingback-elem="link"data-searchpingback-param="ptype=1-3-1"href="http://vod.kankan.com/v/70/70367/470137.shtml?id=731100"data-pb="rtgt=kankan&p2=9000"title="2015-03-22:女友惡作劇致男友跳樓致骨折"data-tvlist-elem="">data-tvlist-elem="">2015-03-22:女友惡作劇致男友跳樓致骨折</a></li>??蓮闹刑崛itle字段對應(yīng)的內(nèi)容“2015-03-22:女友惡作劇致男友跳樓致骨折”作為該最新的內(nèi)容條目的特征標(biāo)識,得到“大聲說出來2015”對應(yīng)的最新的特征標(biāo)識。(5)將特征標(biāo)識按照預(yù)設(shè)的處理邏輯進(jìn)行格式化,使得特征標(biāo)識符合預(yù)設(shè)的格式。例如,去掉日期中包含的短橫線,以及去掉特征標(biāo)識中包含的冒號、引號等預(yù)設(shè)的特殊符號,等等,得到格式化后的特征標(biāo)識為:“20150322女友惡作劇 致男友跳樓致骨折”。(6)比較“20150322女友惡作劇致男友跳樓致骨折”與最近記錄的目標(biāo)網(wǎng)站對應(yīng)的特征標(biāo)識是否相同,若不同,則以步驟(3)中接收到源代碼的時間作為更新時間,或者以當(dāng)前時間作為更新時間。例如,更新時間為2015年03月26日16:29,則將“http://www.iqiyi.com”、“大聲說出來2015”、“20150322女友惡作劇致男友跳樓致骨折”和“2015年03月26日16:29”分別作為目標(biāo)網(wǎng)站的URL、關(guān)鍵字、特征標(biāo)識及更新時間,記錄它們之間的對應(yīng)關(guān)系。循環(huán)執(zhí)行步驟(2)~(6),直到預(yù)設(shè)的循環(huán)結(jié)束條件被觸發(fā)。(7)對比目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的相同特征標(biāo)識的更新時間,根據(jù)對比結(jié)果生成目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的相同特征標(biāo)識的更新差異數(shù)據(jù)。在一個實(shí)施例中,可將兩目標(biāo)網(wǎng)站更新關(guān)鍵字對應(yīng)的相同特征標(biāo)識的更新時間相減,得到更新相差時間。例如,可生成如下所示的更新差異數(shù)據(jù)表格。其中,更新相差時間為正,則說明第一目標(biāo)網(wǎng)站的更新時間晚于第二目標(biāo)網(wǎng)站的更新時間;更新相差時間為負(fù),則說明第一目標(biāo)網(wǎng)站的更新時間早于第二目標(biāo)網(wǎng)站的更新時間。如圖6所示,在一個實(shí)施例中,一種網(wǎng)頁內(nèi)容更新速度對比裝置,包括對 比關(guān)鍵字獲取模塊602、關(guān)鍵字搜索網(wǎng)頁請求模塊604、更新內(nèi)容條目提取模塊606、記錄模塊608、更新時間對比模塊610和更新差異數(shù)據(jù)生成模塊612,其中:對比關(guān)鍵字獲取模塊602用于獲取待對比關(guān)鍵字。在一個實(shí)施例中,待對比關(guān)鍵字的數(shù)量可包括一個或多個。關(guān)鍵字搜索網(wǎng)頁請求模塊604、更新內(nèi)容條目提取模塊606、記錄模塊608、更新時間對比模塊610和更新差異數(shù)據(jù)生成模塊612,可分別對每一個待對比關(guān)鍵字進(jìn)行處理;其中涉及到將兩個內(nèi)容條目進(jìn)行比較時,指的是將同一關(guān)鍵字對應(yīng)的內(nèi)容條目進(jìn)行比較。如圖7所示,在一個實(shí)施例中,上述網(wǎng)頁內(nèi)容更新速度對比裝置還包括對比關(guān)鍵字設(shè)置存儲模塊702,用于設(shè)置以及存儲待對比關(guān)鍵字。在一個實(shí)施例中,對比關(guān)鍵字設(shè)置存儲模塊702可搜索指定領(lǐng)域或指定類別熱度超過閾值的關(guān)鍵字作為待對比關(guān)鍵字。例如,可搜索視頻類別熱度超過閾值的視頻名作為待對比關(guān)鍵字,其中,視頻名可對應(yīng)但不限于電視劇名稱或電影名稱等。在一個實(shí)施例中,對比關(guān)鍵字設(shè)置存儲模塊702可獲取指定網(wǎng)絡(luò)排行榜中排行在前預(yù)設(shè)位的關(guān)鍵字作為待對比關(guān)鍵字。例如,可搜索音樂排行榜排行在前預(yù)設(shè)位音樂名稱作為待對比關(guān)鍵字,等等。在一個實(shí)施例中,對比關(guān)鍵字設(shè)置存儲模塊702用于獲取預(yù)設(shè)的網(wǎng)頁內(nèi)容分類類別,向各個目標(biāo)網(wǎng)站請求網(wǎng)頁內(nèi)容,爬取各個目標(biāo)網(wǎng)站的網(wǎng)頁內(nèi)容中各個類別對應(yīng)的關(guān)鍵字,在提取到的關(guān)鍵字中過濾重復(fù)的關(guān)鍵字,以及將過濾后剩余的關(guān)鍵字存儲為待對比關(guān)鍵字。在一個實(shí)施例中,網(wǎng)頁內(nèi)容分類類別包括但不限于視頻、小說、音樂、新聞等。在一個實(shí)施例中,目標(biāo)網(wǎng)站的URL信息可被預(yù)先設(shè)置并進(jìn)行存儲。在一個實(shí)施例中,對比關(guān)鍵字設(shè)置存儲模塊702可向各個目標(biāo)網(wǎng)站請求網(wǎng)站首頁的網(wǎng)頁內(nèi)容。具體的,可向各個目標(biāo)網(wǎng)站發(fā)送包含網(wǎng)站首頁的URL地址的網(wǎng)頁拉取請求,并接收各個目標(biāo)網(wǎng)站返回的首頁對應(yīng)的源代碼。在一個實(shí)施例中,對比關(guān)鍵字設(shè)置存儲模塊702可從各個目標(biāo)網(wǎng)站的首頁源代碼中提取各個類別對應(yīng)的網(wǎng)頁URL地址。進(jìn)一步的,對比關(guān)鍵字設(shè)置存儲模塊702可向目標(biāo)網(wǎng)站發(fā)送包含類別對應(yīng)的網(wǎng)頁URL地址的網(wǎng)頁拉取請求,并接收目標(biāo)網(wǎng)站返回的類別對應(yīng)的網(wǎng)頁源代碼。在一個實(shí)施例中,對比關(guān)鍵字設(shè)置存儲模塊702可在源代碼中提取類別對應(yīng)的html標(biāo)簽內(nèi)href字段對應(yīng)的網(wǎng)頁URL地址。進(jìn)一步的,對比關(guān)鍵字設(shè)置存儲模塊702可從類別對應(yīng)的網(wǎng)頁源代碼中提取符合預(yù)設(shè)規(guī)則的html標(biāo)簽內(nèi)指定字段對應(yīng)的關(guān)鍵字,從而得到類別對應(yīng)的關(guān)鍵字。進(jìn)一步的,對比關(guān)鍵字設(shè)置存儲模塊702還可以從類別對應(yīng)的網(wǎng)頁源代碼中提取類別包含的子類別對應(yīng)的網(wǎng)頁鏈接,并向?qū)?yīng)目標(biāo)網(wǎng)站發(fā)送包含該網(wǎng)頁鏈接的網(wǎng)頁拉取請求,以及接收目標(biāo)網(wǎng)站返回的相應(yīng)的網(wǎng)頁源代碼;循環(huán)該過程,直到爬取到類別包含的所有子孫類別對應(yīng)的網(wǎng)頁源代碼,并在爬取過程中從接收到的網(wǎng)頁源代碼中提取符合預(yù)設(shè)規(guī)則的html標(biāo)簽內(nèi)指定字段對應(yīng)的關(guān)鍵字作為類別對應(yīng)的關(guān)鍵字。其中,類別包含的子孫類別包括:子類別以及從子類別分支出來的所有類別。在一個實(shí)施例中,對比關(guān)鍵字設(shè)置存儲模塊702可按照待對比關(guān)鍵字對應(yīng)的類別而分類別存儲待對比關(guān)鍵字。關(guān)鍵字搜索網(wǎng)頁請求模塊604用于循環(huán)向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁。關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁相當(dāng)于在目標(biāo)網(wǎng)站內(nèi)搜索關(guān)鍵字可獲得的網(wǎng)頁。例如,若用戶在某一目標(biāo)網(wǎng)站的搜索輸入框內(nèi)輸入某一關(guān)鍵字,點(diǎn)擊搜索按鈕后,相應(yīng)的結(jié)果網(wǎng)頁即可呈現(xiàn)在用戶面前,該網(wǎng)頁即為搜索關(guān)鍵字獲得的網(wǎng)頁。在一個實(shí)施例中,關(guān)鍵字搜索網(wǎng)頁請求模塊604在向某一個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁的過程中,可按照預(yù)設(shè)的規(guī)則生成網(wǎng)頁鏈接,該網(wǎng)頁鏈接表示向目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁;進(jìn)一步向目標(biāo)網(wǎng)站發(fā) 送包含該網(wǎng)頁鏈接的網(wǎng)頁拉取請求,以及接收目標(biāo)網(wǎng)站返回的網(wǎng)頁源代碼,即關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁對應(yīng)的源代碼。關(guān)鍵字搜索網(wǎng)頁請求模塊604向各個目標(biāo)網(wǎng)站分別請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁后,更新內(nèi)容條目提取模塊606和記錄模塊608可針對搜索結(jié)果網(wǎng)頁進(jìn)行相應(yīng)的處理;進(jìn)一步的,關(guān)鍵字搜索網(wǎng)頁請求模塊604可繼續(xù)向各個目標(biāo)網(wǎng)站分別請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,以及更新內(nèi)容條目提取模塊606和記錄模塊608可繼續(xù)針對搜索結(jié)果網(wǎng)頁進(jìn)行相應(yīng)的處理,直到預(yù)設(shè)的循環(huán)結(jié)束條件被觸發(fā)。在一個實(shí)施例中,關(guān)鍵字搜索網(wǎng)頁請求模塊604向所有目標(biāo)網(wǎng)站分別請求一次關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,并且更新內(nèi)容條目提取模塊606和記錄模塊608針對搜索結(jié)果網(wǎng)頁進(jìn)行相應(yīng)的處理,稱之為一次循環(huán),或一次循環(huán)過程。關(guān)鍵字搜索網(wǎng)頁請求模塊604用于每間隔預(yù)設(shè)時長向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,該預(yù)設(shè)時長不超過閾值。例如,每間隔1分鐘向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,等等。在一個實(shí)施例中,預(yù)設(shè)時長所不超過的閾值為一個較小的數(shù)值;從而可達(dá)到近似于實(shí)時監(jiān)測目標(biāo)網(wǎng)站所更新的網(wǎng)頁內(nèi)容的效果。更新內(nèi)容條目提取模塊606用于分目標(biāo)網(wǎng)站提取本次循環(huán)請求到的搜索結(jié)果網(wǎng)頁相對于上一次循環(huán)請求到的搜索結(jié)果網(wǎng)頁更新的關(guān)鍵字對應(yīng)的內(nèi)容條目。在一個實(shí)施例中,更新內(nèi)容條目提取模塊606,可將同一目標(biāo)網(wǎng)站對應(yīng)的本次循環(huán)請求到的搜索結(jié)果網(wǎng)頁與上一次循環(huán)請求到的搜索結(jié)果網(wǎng)頁進(jìn)行對比,提取該目標(biāo)網(wǎng)站所更新的關(guān)鍵字對應(yīng)的內(nèi)容條目。如圖8所示,在一個實(shí)施例中,更新內(nèi)容條目提取模塊606包括最新條目提取模塊802、比較模塊804和更新條目獲取模塊806,其中:最新條目提取模塊802用于提取本次循環(huán)請求到的各個搜索結(jié)果網(wǎng)頁中關(guān)鍵字對應(yīng)的最新的內(nèi)容條目。在一個實(shí)施例中,最新條目提取模塊802可在搜索結(jié)果網(wǎng)頁源代碼的預(yù)設(shè) 的指定位置提取關(guān)鍵字對應(yīng)的最新的內(nèi)容條目。關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁中包含關(guān)鍵字對應(yīng)的搜索結(jié)果列表。搜索結(jié)果列表中可能既包含精確匹配的搜索結(jié)果又包含模糊匹配的搜索結(jié)果。在一個實(shí)施例中,最新條目提取模塊802可過濾掉搜索結(jié)果列表中與關(guān)鍵字模糊匹配的搜索結(jié)果,保留精確匹配的搜索結(jié)果。在一些網(wǎng)站中,關(guān)鍵字對應(yīng)的最新的內(nèi)容條目排列在搜索結(jié)果列表的位置相對于其它的內(nèi)容條目靠前。因此,在一個實(shí)施例中,最新條目提取模塊802可從搜索結(jié)果網(wǎng)頁源代碼中關(guān)鍵字對應(yīng)的過濾了模糊匹配的搜索結(jié)果的搜索結(jié)果列表數(shù)據(jù)中,提取處于第一位置的內(nèi)容條目作為關(guān)鍵字對應(yīng)的最新的內(nèi)容條目。而在另一些網(wǎng)站中,關(guān)鍵字對應(yīng)的最新的內(nèi)容條目包含預(yù)設(shè)的指定字段,例如“更新至”等表示最新內(nèi)容的字段。因此,在一個實(shí)施例中,最新條目提取模塊802可從搜索結(jié)果網(wǎng)頁源代碼中關(guān)鍵字對應(yīng)的搜索結(jié)果列表數(shù)據(jù)中提取預(yù)設(shè)的指定字段對應(yīng)的內(nèi)容條目作為關(guān)鍵字對應(yīng)的最新的內(nèi)容條目。比較模塊804用于分目標(biāo)網(wǎng)站比較提取到的最新的內(nèi)容條目與最近記錄的內(nèi)容條目是否相同。其中,對于當(dāng)前提取到的某一目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的最新的內(nèi)容條目,比較模塊804可將該最新的內(nèi)容條目與最近記錄的該目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的內(nèi)容條目是否相同。更新條目獲取模塊806用于獲取與最近記錄的內(nèi)容條目不同的提取到的最新的內(nèi)容條目作為相應(yīng)目標(biāo)網(wǎng)站的更新的內(nèi)容條目。若當(dāng)前提取到的某一目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的最新的內(nèi)容條目與最近記錄的該目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的內(nèi)容條目不同,則更新條目獲取模塊806可獲取當(dāng)前提取到的最新的內(nèi)容條目作為關(guān)鍵字對應(yīng)的該目標(biāo)網(wǎng)站所更新的內(nèi)容條目。在一個實(shí)施例中,可每當(dāng)最新條目提取模塊802提取到一個目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的最新的內(nèi)容條目,比較模塊804即將當(dāng)前提取到的最新的內(nèi)容條目與最近記錄的該目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的內(nèi)容條目進(jìn)行比較,判斷二者是否相 同,若不同,則更新條目獲取模塊806可獲取當(dāng)前提取到的最新的內(nèi)容條目作為該目標(biāo)網(wǎng)站的更新的關(guān)鍵字對應(yīng)的內(nèi)容條目。在另一個實(shí)施例中,最新條目提取模塊802可先提取到所有目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的最新的內(nèi)容條目,然后比較模塊804將提取到的每一個目標(biāo)網(wǎng)站的最新的內(nèi)容條目與最近記錄的相應(yīng)目標(biāo)網(wǎng)站的關(guān)鍵字對應(yīng)的內(nèi)容條目進(jìn)行比較。記錄模塊608用于若提取到目標(biāo)網(wǎng)站更新的關(guān)鍵字對應(yīng)的內(nèi)容條目,則以本次循環(huán)處理時間作為該內(nèi)容條目的更新時間,記錄相應(yīng)目標(biāo)網(wǎng)站、該關(guān)鍵字、該內(nèi)容條目以及該更新時間的對應(yīng)關(guān)系。在一個實(shí)施例中,若提取到本次循環(huán)請求到的某一目標(biāo)網(wǎng)站的搜索結(jié)果網(wǎng)頁相對于上一次循環(huán)請求到的該目標(biāo)網(wǎng)站的搜索結(jié)果網(wǎng)頁所更新的關(guān)鍵字對應(yīng)的內(nèi)容條目,則該內(nèi)容條目的本次循環(huán)處理時間可為本次循環(huán)中接收到該搜索結(jié)果網(wǎng)頁的接收時間,也可以為當(dāng)前時間,或者,也可以為該接收時間或當(dāng)前時間的一個微小波動范圍內(nèi)的時間,即與該接收時間或當(dāng)前時間相關(guān)不超過一個小的范圍內(nèi)的時間。更新時間對比模塊610用于對比目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的相同內(nèi)容條目的更新時間。在一個實(shí)施例中,更新時間對比模塊610可將兩目標(biāo)網(wǎng)站更新關(guān)鍵字對應(yīng)的相同內(nèi)容條目的更新時間相減,得到相差時間。更新差異數(shù)據(jù)生成模塊612用于根據(jù)對比結(jié)果生成目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的相同內(nèi)容條目的更新差異數(shù)據(jù)。更新差異數(shù)據(jù)包括但不限于圖表數(shù)據(jù)等,圖表數(shù)據(jù)對應(yīng)于表格、曲線圖、柱形圖等多種表現(xiàn)形式。在一個實(shí)施例中,待對比關(guān)鍵字包含多個不同類別的關(guān)鍵字,更新差異數(shù)據(jù)生成模塊612可分類別生成更新差異數(shù)據(jù)。如圖9所示,在一個實(shí)施例中,上述網(wǎng)頁內(nèi)容更新速度對比裝置,還包括更新差異數(shù)據(jù)處理模塊902,用于將更新差異數(shù)據(jù)發(fā)送到指定郵箱或指定應(yīng)用程序接口。自動將更新差異數(shù)據(jù)發(fā)送到指定郵箱可以用于通知相關(guān)用戶了解更新差異數(shù)據(jù)。而自動將更新差異數(shù)據(jù)發(fā)送給指定應(yīng)用程序接口,可方便應(yīng)用程序接口對更新差異數(shù)據(jù)進(jìn)行預(yù)設(shè)邏輯的處理。在一個實(shí)施例中,更新差異數(shù)據(jù)處理模塊902用于根據(jù)更新差異數(shù)據(jù)對應(yīng)的表現(xiàn)形式展示更新差異數(shù)據(jù);等等。其中,例如,更新差異數(shù)據(jù)為表格數(shù)據(jù),則更新差異數(shù)據(jù)處理模塊902可以表格的表現(xiàn)形式展示更新差異數(shù)據(jù),等等。如圖10所示,在一個實(shí)施例中,上述網(wǎng)頁內(nèi)容更新速度對比裝置還包括特征模塊提取模塊1002,用于提取內(nèi)容條目的特征標(biāo)識;上述模塊涉及到記錄內(nèi)容條目以及比較內(nèi)容條目的過程中,以內(nèi)容條目的特征標(biāo)識為準(zhǔn)進(jìn)行記錄及比較。在一個實(shí)施例中,特征模塊提取模塊1002可在內(nèi)容條目中的預(yù)設(shè)的指定位置提取內(nèi)容條目的特征標(biāo)識。例如,可在內(nèi)容條目對應(yīng)的html標(biāo)簽中提取title字段對應(yīng)的內(nèi)容作為內(nèi)容條目的特征標(biāo)識。在一個實(shí)施例中,特征模塊提取模塊1002還用于將特征標(biāo)識按照預(yù)設(shè)的處理邏輯進(jìn)行格式化,使得特征標(biāo)識符合預(yù)設(shè)的格式。在一個實(shí)施例中,特征模塊提取模塊1002用于對內(nèi)容條目進(jìn)行語義分析,以獲得內(nèi)容條目的特征標(biāo)識。例如,可通過語義分析工具對內(nèi)容條目進(jìn)行語義分析。在一個實(shí)施例中,對比關(guān)鍵字獲取模塊602用于獲取待對比關(guān)鍵字。關(guān)鍵字搜索網(wǎng)頁請求模塊604用于循環(huán)向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁。最新條目提取模塊802用于提取本次循環(huán)請求到的各個搜索結(jié)果網(wǎng)頁中關(guān)鍵字對應(yīng)的最新的內(nèi)容條目。比較模塊804用于分目標(biāo)網(wǎng)站比較提取到的最新的特征標(biāo)識與最近記錄的特征標(biāo)識是否相同。更新條目獲取模塊806用于獲取與最近記錄的特征標(biāo)識不同的提取到的最 新的特征標(biāo)識作為相應(yīng)目標(biāo)網(wǎng)站的更新的特征標(biāo)識。記錄模塊608用于若提取到更新的特征標(biāo)識,則以本次循環(huán)處理時間作為該特征標(biāo)識的更新時間,記錄相應(yīng)目標(biāo)網(wǎng)站、該關(guān)鍵字、該特征標(biāo)識以及該更新時間的對應(yīng)關(guān)系。更新時間對比模塊610用于對比目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的相同特征標(biāo)識的更新時間。更新差異數(shù)據(jù)生成模塊612用于根據(jù)對比結(jié)果生成目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的相同特征標(biāo)識的更新差異數(shù)據(jù)。在一個實(shí)施例中,更新差異數(shù)據(jù)生成模塊612還可獲取特征標(biāo)識對應(yīng)的內(nèi)容條目,根據(jù)目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的同一特征標(biāo)識的更新時間的對比結(jié)果,生成目標(biāo)網(wǎng)站之間更新關(guān)鍵字對應(yīng)的該特征標(biāo)識對應(yīng)的內(nèi)容條目的更新差異數(shù)據(jù)。上述網(wǎng)頁內(nèi)容更新速度對比方法和裝置,循環(huán)向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,并提取搜索結(jié)果網(wǎng)頁更新的內(nèi)容條目,從而可監(jiān)測到目標(biāo)網(wǎng)站是否更新了內(nèi)容條目以及更新了哪些內(nèi)容條目,上述方法和裝置將本次循環(huán)處理時間作為更新的內(nèi)容條目的更新時間,該時間實(shí)際相當(dāng)于該更新的內(nèi)容條目被監(jiān)測到的時間,由于上述方法和裝置循環(huán)向各個目標(biāo)網(wǎng)站請求關(guān)鍵字對應(yīng)的搜索結(jié)果網(wǎng)頁,因此上述方法和裝置監(jiān)測到更新的內(nèi)容條目的時間非常近似于該更新的內(nèi)容條目實(shí)際發(fā)布的時間,該實(shí)際發(fā)布的時間相當(dāng)于實(shí)際更新的時間,因此,上述方法和裝置可以準(zhǔn)確地獲取到內(nèi)容條目的更新時間,并根據(jù)準(zhǔn)確的更新時間來對比目標(biāo)網(wǎng)站之間網(wǎng)頁內(nèi)容的更新速度,從而可以獲得準(zhǔn)確的對比結(jié)果。以上所述實(shí)施例的各技術(shù)特征可以進(jìn)行任意的組合,為使描述簡潔,未對上述實(shí)施例中的各個技術(shù)特征所有可能的組合都進(jìn)行描述,然而,只要這些技術(shù)特征的組合不存在矛盾,都應(yīng)當(dāng)認(rèn)為是本說明書記載的范圍。以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì), 但并不能因此而理解為對發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。當(dāng)前第1頁1 2 3