專利名稱:事件獲取的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種事件獲取的方法及裝置。
背景技術(shù):
目前,采用的事件獲取方法是錄入員通過網(wǎng)絡(luò)瀏覽器,訪問多個事件數(shù)據(jù)源網(wǎng)站,在網(wǎng)頁上查找事件信息,該事件信息包括事件的文字內(nèi)容和對應(yīng)的圖片,然后錄入到事件信息系統(tǒng)中。還要將事件信息重復(fù)保存到Excel表格中,用于存檔,耗費人力。現(xiàn)有技術(shù)采用多次完成對所有數(shù)據(jù)源的數(shù)據(jù)獲取,當(dāng)獲取某一數(shù)據(jù)源的效率下降到某一閾值時,停止當(dāng)前數(shù)據(jù)源的數(shù)據(jù)獲取,并開始獲取下一個數(shù)據(jù)源的數(shù)據(jù),依次類推直到把所有待集成數(shù)據(jù)源都獲取一遍;然后再重復(fù)上述過程,直到所有待集成數(shù)據(jù)源都已達到結(jié)束條件。在實現(xiàn)上述現(xiàn)有技術(shù)方案的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中存在如下問題現(xiàn)有技術(shù)獲取到大量無用信息,事件獲取效率很低。
發(fā)明內(nèi)容
本發(fā)明的實施例提供一種事件獲取的方法及裝置,實現(xiàn)了在指定數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域獲取事件信息,提高了事件獲取效率。為達到上述目的,本發(fā)明的實施例采用如下技術(shù)方案一種事件獲取的方法,包括獲取指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域;根據(jù)預(yù)先設(shè)置的事件的獲取周期以及事件關(guān)鍵詞,在所述指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域中獲取事件信息。一種事件獲取的裝置,包括獲取單元,用于獲取指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域;所述獲取單元,還用于根據(jù)預(yù)先設(shè)置的事件的獲取周期以及事件關(guān)鍵詞,在所述指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域中獲取事件信息。本發(fā)明實施例提供的事件獲取的方法及裝置,通過網(wǎng)頁結(jié)構(gòu)信息獲取指定的數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域,在指定的數(shù)據(jù)源以及數(shù)據(jù)源的指定區(qū)域中按照預(yù)先設(shè)置的事件的獲取周期查找預(yù)先設(shè)置的事件關(guān)鍵詞,并獲取包含事件關(guān)鍵詞的事件信息?,F(xiàn)有技術(shù)在獲取事件信息時,獲取了大量無用信息。而本發(fā)明的技術(shù)方案,實現(xiàn)了在指定數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域獲取事件信息,提高了事件獲取效率。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明一實施例中提供的一種事件獲取方法的流程圖;圖2為本發(fā)明另一實施例中提供的一種事件獲取方法的流程圖;圖3為本發(fā)明另一實施例中提供的一種事件獲取裝置的組成框圖;圖4為本發(fā)明另一實施例中提供的一種事件獲取裝置的組成框圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。本發(fā)明一實施例提供了一種事件獲取的方法,如圖1所示,該方法包括101、獲取指定數(shù)據(jù)源以及該指定數(shù)據(jù)源的指定區(qū)域。其中,指定數(shù)據(jù)源包括但不限定為網(wǎng)頁,指定數(shù)據(jù)源的指定區(qū)域包括一個或若干個鏈接,通過該鏈接可獲取事件信息??蛇x的,上述的事件信息優(yōu)選為交通事件信息??蛇x的,在執(zhí)行本步驟之前,確定當(dāng)前網(wǎng)頁結(jié)構(gòu)信息,并根據(jù)該網(wǎng)頁結(jié)構(gòu)信息獲取指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域。值得說明的是,此處網(wǎng)頁結(jié)構(gòu)信息,指示所要獲取的事件在該網(wǎng)頁中的位置,即數(shù)據(jù)源所在位置。網(wǎng)頁結(jié)構(gòu)信息還指示,能夠概述所要獲取的事件的重要信息出現(xiàn)的位置,該重要信息出現(xiàn)的位置包括標(biāo)題、首段等,此處事件的重要信息出現(xiàn)的位置即指定數(shù)據(jù)源的制定區(qū)域。例如,在網(wǎng)頁中包括娛樂、時政、天氣等事件,所要獲取事件為交通事件,而交通事件在該網(wǎng)頁中一般出現(xiàn)在時政框的第一欄中,且在交通事件中重要信息一般出現(xiàn)在標(biāo)題,則時政框的第一欄為指定數(shù)據(jù)源,該指定數(shù)據(jù)源的標(biāo)題為指定數(shù)據(jù)源的指定區(qū)域。此示例只是獲取指定數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域的一種實現(xiàn)方法,本發(fā)明實施例對此不進行限制。進一步的,對于不同的網(wǎng)頁其網(wǎng)頁結(jié)構(gòu)是不同的,也就是說,數(shù)據(jù)源以及數(shù)據(jù)源的指定區(qū)域在不同網(wǎng)頁中的位置是不同的。若當(dāng)前的網(wǎng)頁結(jié)構(gòu)發(fā)生變化時,需重新根據(jù)網(wǎng)頁結(jié)構(gòu)信息獲取指定數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域。102、根據(jù)預(yù)先設(shè)置的事件的獲取周期以及事件關(guān)鍵詞,在指定數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域中獲取事件信息。值得說明的是,由于不同交通事件的發(fā)生的概率、頻率不同,本步驟中的設(shè)置事件的獲取周期,即為每個事件設(shè)置周期。事件關(guān)鍵詞為事件特征的概述。例如,交通事件的關(guān)鍵詞包括施工、限行、追尾等。施工類事件的獲取周期可設(shè)置為5天,限行的獲取周期可設(shè)置為2天,追尾的獲取周期可設(shè)置為I小時。此處,只是設(shè)置事件的獲取周期以及事件關(guān)鍵詞的一種實現(xiàn)方法,本發(fā)明實施例對此不進行限制。此外,本步驟中提到的事件信息包括事件的文字描述或圖片??蛇x的,本步驟的具體實現(xiàn)方式包括根據(jù)設(shè)置的事件關(guān)鍵詞,判斷指定數(shù)據(jù)源的指定區(qū)域中是否包含任意一個或多個事件關(guān)鍵詞;當(dāng)確定指定數(shù)據(jù)源的指定區(qū)域中的事件信息中包含至少一個事件關(guān)鍵詞時,獲取并保存該事件信息。進一步的,獲取當(dāng)前所述指定數(shù)據(jù)源的指定區(qū)域的事件信息,并與存儲的所述指定區(qū)域中的事件信息進行比對,比對結(jié)果的描述如下當(dāng)獲取的當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息與存儲的指定數(shù)據(jù)源的指定區(qū)域中的事件信息不同時,確定該當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息為新的事件信息,并存儲所述新的事件信息。當(dāng)獲取的當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息中不能包括存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的全部事件信息時,在所述當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中獲取不到,且已存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的事件信息上添加標(biāo)識。其中,此處提到的標(biāo)識包括但不限定為刪除標(biāo)記。值得說明的是,此處獲取的當(dāng)前所述指定數(shù)據(jù)源的指定區(qū)域的事件信息,與存儲的指定數(shù)據(jù)源的指定區(qū)域中的事件信息,包括在同一數(shù)據(jù)源的同一指定區(qū)域中,不同事件的獲取周期獲取的事件信息。如果當(dāng)前周期獲取的事件信息與之前周期獲取的事件信息相同時,則確定當(dāng)前事件信息不是新的事件,不進行存儲;如果確定當(dāng)前周期獲取的事件信息與之前周期獲取的事件信息不同時,則確定當(dāng)前周期獲取的事件信息為新的事件信息,并存儲該新的事件信息;如果存儲的之前周期獲取的事件信息中,在當(dāng)前周期獲取的事件信息中不存在時,確定之前周期獲取的事件信息在網(wǎng)頁的該指定區(qū)域中被刪除,則在存儲的之前周期獲取的事件信息中添加刪除標(biāo)記。其中,刪除標(biāo)記用于指示用戶之前周期獲取的事件信息在之前獲取該事件信息的指定數(shù)據(jù)源的指定區(qū)域中已經(jīng)被刪除。例如,在指定數(shù)據(jù)源的指定區(qū)域中按照周期獲取事件信息時,在第一周期獲取到4個事件信息分別為A、B、C、D,并將這四個事件信息進行存儲,但在第二周期中獲取到三個事件信息分別為A、B、D,此時與第一周期獲取的事件信息相比缺少了 C,則在已存儲的事件信息C上添加刪除標(biāo)記。
進一步的,在執(zhí)彳丁完步驟102之后,還包括第一步確定存儲的事件信息的文字描述與圖片的對應(yīng)關(guān)系,并存儲該事件信息的文字描述、圖片以及事件信息的文字描述與圖片的對應(yīng)關(guān)系。可選的,為加快運行以及查找速率,創(chuàng)建第一數(shù)據(jù)庫,用于存儲事件信息的文字描述,在硬盤中創(chuàng)建指定目錄存儲事件信息的圖片。在該第一數(shù)據(jù)庫中,按照存儲事件信息的
時間,依次為事件信息進行編號,該編號包括但不限定為1、2、3......則在第一數(shù)據(jù)庫中
存儲的信息包括存儲事件信息的時間、事件的類型、存儲的事件信息發(fā)生的時間、事件信息的文字描述、事件信息的編號等。其中事件信息的類型包括但不限定使用事件關(guān)鍵詞表示。事件信息的文字描述與事件信息的圖片的對應(yīng)關(guān)系包括但不限定使用命名規(guī)則表示,該命名規(guī)則為事件信息的文字描述與事件信息的圖片的索引。第二步根據(jù)預(yù)設(shè)提取規(guī)則獲取所述事件信息的文字描述,并根據(jù)事件信息的文字描述與圖片的對應(yīng)關(guān)系,查看所述事件信息的圖片。其中,預(yù)設(shè)提取規(guī)則包括,用戶按最近“一天”、“一周”、“一個月”、“三個月”、“一年”
等規(guī)則提取事件信息。提取的事件信息主要包括事件信息的編號以及事件信息的文字描述,根據(jù)實際情況還可以包括其余任意一種或幾種信息。本實施例只是描述了預(yù)設(shè)提取原則的一種實現(xiàn)方式,根據(jù)實際情況包括其它提取原則,本發(fā)明實施例對此不進行限制。值得說明的是,根據(jù)事件信息的文字描述與圖片的對應(yīng)關(guān)系,查看所述事件信息的圖片,是為了保證提取的事件信息的可靠性。第三步將根據(jù)預(yù)設(shè)提取規(guī)則獲取所述事件信息的文字描述進行存儲。值得說明的是,結(jié)合上述第一步、第二步的描述,在第二步中確定事件信息的可靠性之后,將從第一數(shù)據(jù)庫中獲取的事件信息存儲到第二數(shù)據(jù)庫中。優(yōu)選的,本實施例中,在指定數(shù)據(jù)源以及指定數(shù)據(jù)源的制定區(qū)域中獲取事件信息包括但不限定使用爬蟲程序?qū)崿F(xiàn)。本發(fā)明實施例提供的事件獲取的方法,通過網(wǎng)頁結(jié)構(gòu)信息獲取指定的數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域,在指定的數(shù)據(jù)源以及數(shù)據(jù)源的指定區(qū)域中按照預(yù)先設(shè)置的事件的獲取周期查找預(yù)先設(shè)置的事件關(guān)鍵詞,并獲取包含事件關(guān)鍵詞的事件信息。現(xiàn)有技術(shù)在獲取事件信息時,獲取了大量無用信息。而本發(fā)明的技術(shù)方案,實現(xiàn)了在指定數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域獲取事件信息,提高了事件獲取效率。本發(fā)明另一實施例提供了一種獲取事件信息的方法,該方法可應(yīng)用于具體實例中。本實施例以獲取交通事件信息為例,事件關(guān)鍵詞施工,其對應(yīng)的事件的獲取周期分別為一天,如圖2所示,在該具體實例中該方法包括201、確定網(wǎng)頁結(jié)構(gòu)信息。其中,網(wǎng)頁結(jié)構(gòu)信息的相關(guān)內(nèi)容與上一實施例步驟101中的描述相同,在此不再重復(fù)說明。202、根據(jù)網(wǎng)頁結(jié)構(gòu)信息獲取指定數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域。值得說明的是,結(jié)合上一實施例步驟101中的描述,本實施以指定數(shù)據(jù)源為時政框的第一欄,指定數(shù)據(jù)源的指定區(qū)域為首段為例。203、判斷首段中是否包含事件關(guān)鍵詞施工。值得說明的是,如果首段中不含施工,執(zhí)行步驟204,如果首段中包含施工則執(zhí)行步驟205及其后續(xù)步驟。204、停止獲取事件信息。205、獲取事件信息,將事件信息的文字描述存儲到第一數(shù)據(jù)庫,將事件信息的圖片存儲到硬盤指定目錄下,并確定事件信息的文字描述與圖片的對應(yīng)關(guān)系。其中,事件信息的文字描述與圖片的對應(yīng)關(guān)系包括使用命名規(guī)則表示,命名規(guī)則的相關(guān)內(nèi)容與上述實施例步驟102中的描述相同,在此不再重復(fù)說明。值得說明的是,本步驟中,第一數(shù)據(jù)庫中存儲的內(nèi)容與上一實施例步驟102中的相關(guān)描述相同,在此不再重復(fù)說明。按照本實施確定的事件的獲取周期為I天,在下一周期中,繼續(xù)獲取事件信息。206、將本周期獲取的事件信息與上述步驟205獲取的事件信息進行比對。值得說明的是,本步驟中進行比對指,對在不同周期獲取的事件信息的文字描述進行對比,當(dāng)比對結(jié)果為文字描述相同時,不對本周期獲取的事件信息進行存儲;當(dāng)比對結(jié)果為文字描述不同時,執(zhí)行下述步驟207 ;當(dāng)比對結(jié)果為本周期獲取的事件信息缺少之前存儲的事件信息時,執(zhí)行步驟208。207、將本周期獲取的事件信息的文字描述存儲到第一數(shù)據(jù)庫中,將對應(yīng)的圖片存儲到對應(yīng)的硬盤目錄下。
值得說明的是,本步驟中事件信息的文字描述與事件信息的圖片的存儲在上一實施例步驟102中已有相關(guān)描述,在此不再重復(fù)說明。
208、在本周期未獲取到,且在之前周期已存儲的該指定區(qū)域中的事件信息上添加標(biāo)識。
其中,標(biāo)識的相關(guān)描述在上一實施例的步驟102中相關(guān)描述相同,在此不再重復(fù)說明。
209、按照最近“一周”的提取規(guī)則在第一數(shù)據(jù)庫中提取事件信息的文字描述等信息,并根據(jù)事件信息的文字描述與圖片的對應(yīng)關(guān)系,查看硬盤目錄下的圖片。
其中,第一數(shù)據(jù)庫中存儲的信息的內(nèi)容與上一實施例步驟102中相關(guān)描述相同, 在此不再重復(fù)說明。
值得說明的是,查看事件/[目息的圖片是為保證事件彳目息的可 目度,在確認事件/[目息的真實性之后,執(zhí)行步驟210。
210、將按照最近“一周”的提取規(guī)則在第一數(shù)據(jù)庫中提取事件信息的文字描述等信息存儲到第二數(shù)據(jù)庫中。
本發(fā)明實施例提供的事件獲取的方法,通過網(wǎng)頁結(jié)構(gòu)信息獲取指定的數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域,在指定的數(shù)據(jù)源以及數(shù)據(jù)源的指定區(qū)域中按照預(yù)先設(shè)置的事件的獲取周期查找預(yù)先設(shè)置的事件關(guān)鍵詞,并獲取包含事件關(guān)鍵詞的事件信息?,F(xiàn)有技術(shù)在獲取事件信息時,獲取了大量無用信息。而本發(fā)明的技術(shù)方案,實現(xiàn)了在指定數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域獲取事件信息,提高了事件獲取效率。
進一步的,本發(fā)明另一實施例提供了一種事件獲取的裝置,如圖3所示,該裝置包括獲取單元31 ;該裝置還包括確定單元32。
獲取單元31,用于獲取指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域。
所述獲取單元31,還用于 根據(jù)預(yù)先設(shè)置的事件的獲取周期以及事件關(guān)鍵詞,在所述指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域中獲取事件信息。
確定單元32,用于在所述獲取單元31獲取所述獲取指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域之前,確定當(dāng)前網(wǎng)頁結(jié)構(gòu)信息,并根據(jù)所述網(wǎng)頁結(jié)構(gòu)信息獲取所述指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域。
可選的,如圖4所示,所述獲取單元31包括判斷子單元311、獲取子單元312 ;該裝置還包括比對單元33、添加單元34、查看單元35、存儲單元36。
判斷子單元311,用于根據(jù)事件關(guān)鍵詞,判斷所述獲取單元31獲取的所述指定數(shù)據(jù)源的指定區(qū)域中是否包含任意一個或多個所述事件關(guān)鍵詞。
獲取子單元312,用于當(dāng)所述判斷子單元311確定所述指定數(shù)據(jù)源的指定區(qū)域中包含至少一個所述事件關(guān)鍵詞時,獲取并保存所述指定區(qū)域中的事件信息。
所述獲取單元31,還用于在獲取并保存所述指定區(qū)域中的事件信息之后,獲取當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息。
比對單元33,用于將所述獲取單元31獲取的所述當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息與存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的事件信息進行比對。
所述確定單元32,還用于根據(jù)所述比對單元33中當(dāng)獲取的當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息與存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的事件信息不同時,確定所述 當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息為新的事件信息,并存儲所述新的事件信息。
添加單元34,用于根據(jù)所述比對單元33中,當(dāng)所述獲取單元31獲取的當(dāng)前指定數(shù) 據(jù)源的指定區(qū)域中的事件信息中不能包括所述獲取單元31存儲的所述指定數(shù)據(jù)源的指定 區(qū)域中的全部事件信息時,在所述當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中獲取不到,且已存儲的所 述指定數(shù)據(jù)源的指定區(qū)域中的事件信息上添加標(biāo)識。
可選的,所述確定單元32,還用于確定存儲的所述事件信息的文字描述與圖片的 對應(yīng)關(guān)系,并存儲所述事件信息的文字描述、圖片以及事件信息的文字描述與圖片的對應(yīng) 關(guān)系。
所述獲取單元31,還用于根據(jù)預(yù)設(shè)提取規(guī)則獲取所述事件信息的文字描述。
查看單元35,用于根據(jù)所述獲取單元31獲取的所述事件信息的文字描述與圖片 的對應(yīng)關(guān)系,查看所述事件信息的圖片。
存儲單元36,用于將所述獲取單元31根據(jù)預(yù)設(shè)提取規(guī)則獲取所述事件信息的文 字描述進行存儲。
本發(fā)明實施例提供的事件獲取的裝置,通過網(wǎng)頁結(jié)構(gòu)信息獲取指定的數(shù)據(jù)源以及 指定數(shù)據(jù)源的指定區(qū)域,在指定的數(shù)據(jù)源以及數(shù)據(jù)源的指定區(qū)域中按照預(yù)先設(shè)置的事件的 獲取周期查找預(yù)先設(shè)置的事件關(guān)鍵詞,并獲取包含事件關(guān)鍵詞的事件信息?,F(xiàn)有技術(shù)在獲 取事件信息時,獲取了大量無用信息。而本發(fā)明的技術(shù)方案,實現(xiàn)了在指定數(shù)據(jù)源以及指定 數(shù)據(jù)源的指定區(qū)域獲取事件信息,提高了事件獲取效率。
通過以上的實施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借 助軟件加必需的通用硬件的方式來實現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳 的實施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部 分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在可讀取的存儲介質(zhì)中,如計 算機的軟盤,硬盤或光盤等,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機, 服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述的方法。
以上所述,僅為本發(fā)明的具體實施方式
,但本發(fā)明的保護范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準(zhǔn)。
權(quán)利要求
1.一種事件獲取的方法,其特征在于,包括 獲取指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域; 根據(jù)預(yù)先設(shè)置的事件的獲取周期以及事件關(guān)鍵詞,在所述指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域中獲取事件信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述獲取指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域之前,包括 確定當(dāng)前網(wǎng)頁結(jié)構(gòu)信息,并根據(jù)所述網(wǎng)頁結(jié)構(gòu)信息獲取所述指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)預(yù)先設(shè)置的事件的獲取周期以及事件關(guān)鍵詞,在所述指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域中獲取事件信息,包括 根據(jù)所述事件關(guān)鍵詞,判斷所述指定數(shù)據(jù)源的指定區(qū)域中是否包含任意一個或多個所述事件關(guān)鍵詞; 當(dāng)確定所述指定數(shù)據(jù)源的指定區(qū)域中包含至少一個所述事件關(guān)鍵詞時,獲取并保存所述指定區(qū)域中的事件信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在所述獲取并保存所述指定區(qū)域中的事件信息之后,還包括 獲取當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息,并與存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的事件信息進行比對; 若獲取的當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息與存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的事件信息不同時,確定所述當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息為新的事件信息,并存儲所述新的事件信息; 若獲取的當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息中不能包括存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的全部事件信息時,在所述當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中獲取不到,且已存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的事件信息上添加標(biāo)識。
5.根據(jù)權(quán)利要求1-4任意一項所述的方法,其特征在于,還包括 確定存儲的所述事件信息的文字描述與圖片的對應(yīng)關(guān)系,并存儲所述事件信息的文字描述、圖片以及事件信息的文字描述與圖片的對應(yīng)關(guān)系; 根據(jù)預(yù)設(shè)提取規(guī)則獲取所述事件信息的文字描述,并根據(jù)所述事件信息的文字描述與圖片的對應(yīng)關(guān)系,查看所述事件信息的圖片; 將所述根據(jù)預(yù)設(shè)提取規(guī)則獲取所述事件信息的文字描述進行存儲。
6.一種事件獲取的裝置,其特征在于,包括 獲取單元,用于獲取指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域; 所述獲取單元,還用于根據(jù)預(yù)先設(shè)置的事件的獲取周期以及事件關(guān)鍵詞,在所述指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域中獲取事件信息。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,該裝置還包括 確定單元,用于在所述獲取單元獲取所述獲取指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域之前,確定當(dāng)前網(wǎng)頁結(jié)構(gòu)信息,并根據(jù)所述網(wǎng)頁結(jié)構(gòu)信息獲取所述指定數(shù)據(jù)源以及所述指定數(shù)據(jù)源的指定區(qū)域。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述獲取單元包括 判斷子單元,用于根據(jù)所述事件關(guān)鍵詞,判斷所述獲取單元獲取的所述指定數(shù)據(jù)源的指定區(qū)域中是否包含任意一個或多個所述事件關(guān)鍵詞; 獲取子單元,用于當(dāng)所述判斷子單元確定所述指定數(shù)據(jù)源的指定區(qū)域中包含至少一個所述事件關(guān)鍵詞時,獲取并保存所述指定區(qū)域中的事件信息。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,該裝置還包括 所述獲取單元,還用于在獲取并保存所述指定區(qū)域中的事件信息之后,獲取當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息; 比對單元,用于將所述獲取單元獲取的所述當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息與存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的事件信息進行比對; 所述確定單元,還用于根據(jù)所述比對單元中當(dāng)獲取的當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息與存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的事件信息不同時,確定所述當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息為新的事件信息,并存儲所述新的事件信息; 添加單元,用于根據(jù)所述比對單元中,當(dāng)所述獲取單元獲取的當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中的事件信息中不能包括所述獲取單元存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的全部事件信息時,在所述當(dāng)前指定數(shù)據(jù)源的指定區(qū)域中獲取不到,且已存儲的所述指定數(shù)據(jù)源的指定區(qū)域中的事件信息上添加標(biāo)識。
10.根據(jù)權(quán)利要求6-9任意一項所述的裝置,其特征在于, 所述確定單元,還用于確定存儲的所述事件信息的文字描述與圖片的對應(yīng)關(guān)系,并存儲所述事件信息的文字描述、圖片以及事件信息的文字描述與圖片的對應(yīng)關(guān)系; 所述獲取單元,還用于根據(jù)預(yù)設(shè)提取規(guī)則獲取所述事件信息的文字描述; 查看單元,用于根據(jù)所述獲取單元獲取的所述事件信息的文字描述與圖片的對應(yīng)關(guān)系,查看所述事件信息的圖片; 存儲單元,用于將所述獲取單元根據(jù)預(yù)設(shè)提取規(guī)則獲取所述事件信息的文字描述進行存儲。
全文摘要
本發(fā)明公開了一種事件獲取的方法及裝置,涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,實現(xiàn)了在指定數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域獲取事件信息,提高了事件獲取效率。本發(fā)明包括通過網(wǎng)頁結(jié)構(gòu)信息獲取指定的數(shù)據(jù)源以及指定數(shù)據(jù)源的指定區(qū)域,在指定的數(shù)據(jù)源以及數(shù)據(jù)源的指定區(qū)域中按照預(yù)先設(shè)置的事件的獲取周期查找預(yù)先設(shè)置的事件關(guān)鍵詞,并獲取包含事件關(guān)鍵詞的事件信息。本發(fā)明實施例主要應(yīng)用于事件獲取流程中。
文檔編號G06F17/30GK103049576SQ201310003769
公開日2013年4月17日 申請日期2013年1月5日 優(yōu)先權(quán)日2013年1月5日
發(fā)明者王曉瑄, 李建軍 申請人:北京世紀(jì)高通科技有限公司