本發(fā)明涉及通信領(lǐng)域,尤其涉及一種網(wǎng)絡(luò)郵件數(shù)據(jù)的搜集方法及系統(tǒng)。
背景技術(shù):
互聯(lián)網(wǎng)(internet),是由一些使用公用語言互相通信的計(jì)算機(jī)連接而成的全球網(wǎng)絡(luò),即廣域網(wǎng)、局域網(wǎng)及單機(jī)按照一定的通訊協(xié)議組成的國際計(jì)算機(jī)網(wǎng)絡(luò)?;ヂ?lián)網(wǎng)是一種公用信息的載體,這種大眾傳媒比以往的任何一種通訊媒體都要快?;ヂ?lián)網(wǎng)中的郵件數(shù)據(jù)是海量的郵件數(shù)據(jù),如何依據(jù)該海量的郵件數(shù)據(jù)搜集是一個(gè)研究方向,現(xiàn)有技術(shù)無法實(shí)現(xiàn)網(wǎng)絡(luò)郵件數(shù)據(jù)的搜集。
技術(shù)實(shí)現(xiàn)要素:
本申請?zhí)峁┮环N網(wǎng)絡(luò)郵件數(shù)據(jù)的搜集方法。其解決現(xiàn)有技術(shù)的技術(shù)方案無法對網(wǎng)絡(luò)郵件數(shù)據(jù)進(jìn)行搜集的缺點(diǎn)。
一方面,提供一種網(wǎng)絡(luò)郵件數(shù)據(jù)的搜集方法,所述方法包括如下步驟:
獲取需要搜集的網(wǎng)絡(luò)郵件數(shù)據(jù)的類別;
在網(wǎng)絡(luò)郵件數(shù)據(jù)中抓取與該類別相同的搜集郵件數(shù)據(jù);
獲取該收集郵件數(shù)據(jù)的關(guān)鍵詞,按該關(guān)鍵詞將搜集郵件數(shù)據(jù)進(jìn)行分別存儲。
可選的,所述方法還包括:
將該存儲的文件夾以類別和關(guān)鍵詞命名。
可選的,所述方法還包括:
統(tǒng)計(jì)相同關(guān)鍵詞出現(xiàn)的次數(shù)。
第二方面,提供一種網(wǎng)絡(luò)郵件數(shù)據(jù)的搜集系統(tǒng),所述系統(tǒng)包括:
獲取單元,用于獲取需要搜集的網(wǎng)絡(luò)郵件數(shù)據(jù)的類別;
抓取單元,用于在網(wǎng)絡(luò)郵件數(shù)據(jù)中抓取與該類別相同的搜集郵件數(shù)據(jù);
分類單元,用于獲取該收集郵件數(shù)據(jù)的關(guān)鍵詞,按該關(guān)鍵詞將搜集郵件數(shù)據(jù)進(jìn)行分別存儲。
可選的,所述系統(tǒng)還包括:
命名單元,用于將該存儲的文件夾以類別和關(guān)鍵詞命名。
可選的,所述系統(tǒng)還包括:
統(tǒng)計(jì)單元,用于統(tǒng)計(jì)相同關(guān)鍵詞出現(xiàn)的次數(shù)。
本發(fā)明提供的技術(shù)方案獲取需要搜集的網(wǎng)絡(luò)郵件數(shù)據(jù)的類別,在網(wǎng)絡(luò)郵件數(shù)據(jù)中抓取與該類別相同的搜集郵件數(shù)據(jù),獲取該收集郵件數(shù)據(jù)的關(guān)鍵詞,按該關(guān)鍵詞將搜集郵件數(shù)據(jù)進(jìn)行分別存儲,所以其具有對網(wǎng)絡(luò)郵件數(shù)據(jù)有效搜集的優(yōu)點(diǎn)。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明第一較佳實(shí)施方式提供的一種網(wǎng)絡(luò)郵件數(shù)據(jù)的搜集方法的流程圖;
圖2為本發(fā)明第二較佳實(shí)施方式提供的一種網(wǎng)絡(luò)郵件數(shù)據(jù)的搜集系統(tǒng)的結(jié)構(gòu)圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
請參考圖1,圖1是本發(fā)明第一較佳實(shí)施方式提出的一種網(wǎng)絡(luò)郵件數(shù)據(jù)的搜集方法,該方法如圖1所示,包括如下步驟:
步驟S101、獲取需要搜集的網(wǎng)絡(luò)郵件數(shù)據(jù)的類別;
步驟S102、在網(wǎng)絡(luò)郵件數(shù)據(jù)中抓取與該類別相同的搜集郵件數(shù)據(jù);
步驟S103、獲取該收集郵件數(shù)據(jù)的關(guān)鍵詞,按該關(guān)鍵詞將搜集郵件數(shù)據(jù)進(jìn)行分別存儲。
本發(fā)明提供的技術(shù)方案獲取需要搜集的網(wǎng)絡(luò)郵件數(shù)據(jù)的類別,在網(wǎng)絡(luò)郵件數(shù)據(jù)中抓取與該類別相同的搜集郵件數(shù)據(jù),獲取該收集郵件數(shù)據(jù)的關(guān)鍵詞,按該關(guān)鍵詞將搜集郵件數(shù)據(jù)進(jìn)行分別存儲,所以其具有對網(wǎng)絡(luò)郵件數(shù)據(jù)有效搜集的優(yōu)點(diǎn)。
可選的,上述方法在步驟S103之后還可以包括:
將該存儲的文件夾以類別和關(guān)鍵詞命名。
可選的,上述方法在步驟S103之后還可以包括:
統(tǒng)計(jì)相同關(guān)鍵詞出現(xiàn)的次數(shù)。
請參考圖2,圖2是本發(fā)明第二較佳實(shí)施方式提出的一種網(wǎng)絡(luò)郵件數(shù)據(jù)的搜集系統(tǒng),該系統(tǒng)包括:
獲取單元201,用于獲取需要搜集的網(wǎng)絡(luò)郵件數(shù)據(jù)的類別;
抓取單元202,用于在網(wǎng)絡(luò)郵件數(shù)據(jù)中抓取與該類別相同的搜集郵件數(shù)據(jù);
分類單元203,用于獲取該收集郵件數(shù)據(jù)的關(guān)鍵詞,按該關(guān)鍵詞將搜集郵件數(shù)據(jù)進(jìn)行分別存儲。
本發(fā)明提供的技術(shù)方案獲取需要搜集的網(wǎng)絡(luò)郵件數(shù)據(jù)的類別,在網(wǎng)絡(luò)郵件數(shù)據(jù)中抓取與該類別相同的搜集郵件數(shù)據(jù),獲取該收集郵件數(shù)據(jù)的關(guān)鍵詞,按該關(guān)鍵詞將搜集郵件數(shù)據(jù)進(jìn)行分別存儲,所以其具有對網(wǎng)絡(luò)郵件數(shù)據(jù)有效搜集的優(yōu)點(diǎn)。
可選的,上述系統(tǒng)還可以包括:
命名單元204,用于將該存儲的文件夾以類別和關(guān)鍵詞命名。
可選的,上述系統(tǒng)還可以包括:
統(tǒng)計(jì)單元205,用于統(tǒng)計(jì)相同關(guān)鍵詞出現(xiàn)的次數(shù)。
需要說明的是,對于前述的各個(gè)方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某一些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳細(xì)描述的部分,可以參見其他實(shí)施例的相關(guān)描述。
本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲于一計(jì)算機(jī)可讀存儲介質(zhì)中,存儲介質(zhì)可以包括:閃存盤、只讀存儲器(英文:Read-Only Memory,簡稱:ROM)、隨機(jī)存取器(英文:Random Access Memory,簡稱:RAM)、磁盤或光盤等。
以上對本發(fā)明實(shí)施例所提供的內(nèi)容下載方法及相關(guān)設(shè)備、系統(tǒng)進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。