的POI名稱和地址信息以及180個P3的POI名稱和地址信息分別是否相同。
[0094]分配單元424當POI數(shù)據(jù)發(fā)生變更時,根據(jù)網(wǎng)頁頁面的用戶關(guān)注度,并結(jié)合網(wǎng)頁頁面中包括的POI數(shù)據(jù)的個數(shù),將網(wǎng)頁頁面的用戶關(guān)注度平均分配至該網(wǎng)頁頁面中的各POI數(shù)據(jù)。
[0095]具體地,當網(wǎng)頁頁面中任一 POI數(shù)據(jù)發(fā)生變更時,根據(jù)網(wǎng)頁頁面的用戶關(guān)注度,并結(jié)合網(wǎng)頁頁面中包括的POI數(shù)據(jù)的個數(shù),通過計算n/m可確定各個POI數(shù)據(jù)的用戶關(guān)注度;其中,網(wǎng)頁頁面的用戶關(guān)注度為n,網(wǎng)頁頁面中包含的POI數(shù)據(jù)的個數(shù)為m。
[0096]可選地,當?shù)刂沸畔l(fā)生未變更時,將網(wǎng)頁頁面的用戶關(guān)注度作為該網(wǎng)頁頁面中包括的各POI數(shù)據(jù)的用戶關(guān)注度。
[0097]在此,若一個網(wǎng)頁頁面中出現(xiàn)的POI數(shù)據(jù)自始至終沒有發(fā)生過變化,則此網(wǎng)頁頁面中的各個POI數(shù)據(jù)應(yīng)該直接繼承網(wǎng)頁的用戶關(guān)注度;例如,一篇新聞報道網(wǎng)頁中出現(xiàn)過一個公司的多個分公司名稱及相應(yīng)的分公司地址信息,即多個POI數(shù)據(jù),則這篇新聞網(wǎng)頁中的各個POI數(shù)據(jù)可直接繼承網(wǎng)頁的用戶關(guān)注度。再例如,一個團購類網(wǎng)頁頁面,此網(wǎng)頁頁面中的團購信息包含多個POI數(shù)據(jù),而該團購類網(wǎng)頁頁面中的POI數(shù)據(jù)是會隨著時間的變化發(fā)生變化,故該多個POI數(shù)據(jù)是不應(yīng)該直接繼承網(wǎng)頁的用戶關(guān)注度,而可根據(jù)網(wǎng)頁頁面中包含的POI數(shù)據(jù)的個數(shù)來平均分配網(wǎng)頁頁面的用戶關(guān)注度。
[0098]參照圖3,篩選模塊330基于各POI數(shù)據(jù)的用戶關(guān)注度,對POI數(shù)據(jù)進行篩選。
[0099]具體地,通過比較各個POI數(shù)據(jù)的用戶關(guān)注度與關(guān)注度閾值的關(guān)系,對POI數(shù)據(jù)進行篩選。例如,判斷各個POI數(shù)據(jù)的用戶關(guān)注度與關(guān)注度閾值的大小關(guān)系,當POI數(shù)據(jù)的用戶關(guān)注度大于或等于關(guān)注度閾值時,確定該POI數(shù)據(jù)為可信POI數(shù)據(jù),當POI數(shù)據(jù)的用戶關(guān)注度小于關(guān)注度閾值時,確定該POI數(shù)據(jù)為不可信POI數(shù)據(jù),濾除該POI數(shù)據(jù)。
[0100]本技術(shù)領(lǐng)域技術(shù)人員可以理解,本發(fā)明包括涉及用于執(zhí)行本申請中所述操作中的一項或多項的設(shè)備。這些設(shè)備可以為所需的目的而專門設(shè)計和制造,或者也可以包括通用計算機中的已知設(shè)備。這些設(shè)備具有存儲在其內(nèi)的計算機程序,這些計算機程序選擇性地激活或重構(gòu)。這樣的計算機程序可以被存儲在設(shè)備(例如,計算機)可讀介質(zhì)中或者存儲在適于存儲電子指令并分別耦聯(lián)到總線的任何類型的介質(zhì)中,所述計算機可讀介質(zhì)包括但不限于任何類型的盤(包括軟盤、硬盤、光盤、⑶-ROM、和磁光盤)、ROM (Read-Only Memory,只讀存儲器)、RAM (Random Access Memory,隨即存儲器)、EPROM (Erasable ProgrammableRead-Only Memory,可擦寫可編程只讀存儲器)、EEPROM(ElectricalIy ErasableProgrammable Read-Only Memory,電可擦可編程只讀存儲器)、閃存、磁性卡片或光線卡片。也就是,可讀介質(zhì)包括由設(shè)備(例如,計算機)以能夠讀的形式存儲或傳輸信息的任何介質(zhì)。
[0101]本技術(shù)領(lǐng)域技術(shù)人員可以理解,可以用計算機程序指令來實現(xiàn)這些結(jié)構(gòu)圖和/或框圖和/或流圖中的每個框以及這些結(jié)構(gòu)圖和/或框圖和/或流圖中的框的組合。本技術(shù)領(lǐng)域技術(shù)人員可以理解,可以將這些計算機程序指令提供給通用計算機、專業(yè)計算機或其他可編程數(shù)據(jù)處理方法的處理器來實現(xiàn),從而通過計算機或其他可編程數(shù)據(jù)處理方法的處理器來執(zhí)行本發(fā)明公開的結(jié)構(gòu)圖和/或框圖和/或流圖的框或多個框中指定的方案。
[0102]本技術(shù)領(lǐng)域技術(shù)人員可以理解,本發(fā)明中已經(jīng)討論過的各種操作、方法、流程中的步驟、措施、方案可以被交替、更改、組合或刪除。進一步地,具有本發(fā)明中已經(jīng)討論過的各種操作、方法、流程中的其他步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。進一步地,現(xiàn)有技術(shù)中的具有與本發(fā)明中公開的各種操作、方法、流程中的步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。
[0103]以上所述僅是本發(fā)明的部分實施方式,應(yīng)當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。
【主權(quán)項】
1.一種篩選興趣點POI數(shù)據(jù)的方法,其特征在于,包括: 獲取包括POI數(shù)據(jù)的網(wǎng)頁頁面及所述網(wǎng)頁頁面的用戶關(guān)注度; 根據(jù)所述網(wǎng)頁頁面的用戶關(guān)注度,確定該網(wǎng)頁頁面中包括的POI數(shù)據(jù)的用戶關(guān)注度; 基于各POI數(shù)據(jù)的用戶關(guān)注度,對POI數(shù)據(jù)進行篩選。2.根據(jù)權(quán)利要求1所述的篩選興趣點POI數(shù)據(jù)的方法,其中,獲取所述網(wǎng)頁頁面的用戶關(guān)注度的步驟,進一步包括: 根據(jù)所述網(wǎng)頁頁面在第一時長內(nèi)的用戶訪問次數(shù)和/或平均每次瀏覽時長,獲取所述網(wǎng)頁頁面的用戶關(guān)注度。3.根據(jù)權(quán)利要求1或2所述的篩選興趣點POI數(shù)據(jù)的方法,其中,當所述網(wǎng)頁頁面中僅包括一個POI數(shù)據(jù)時,根據(jù)所述網(wǎng)頁頁面的用戶關(guān)注度,確定該網(wǎng)頁頁面中包括的POI數(shù)據(jù)的用戶關(guān)注度的步驟,進一步包括: 將所述網(wǎng)頁頁面的用戶關(guān)注度作為該網(wǎng)頁頁面中包括的POI數(shù)據(jù)的用戶關(guān)注度。4.根據(jù)權(quán)利要求1或2所述的篩選興趣點POI數(shù)據(jù)的方法,其中,當所述網(wǎng)頁頁面中包括多個POI數(shù)據(jù)時,根據(jù)所述網(wǎng)頁頁面的用戶關(guān)注度,確定該網(wǎng)頁頁面中包括的POI數(shù)據(jù)的用戶關(guān)注度的步驟,進一步包括: 按照預(yù)定頻率抓取第二時長內(nèi)所述網(wǎng)頁頁面中的頁面內(nèi)容; 提取每次抓取到的頁面內(nèi)容中的POI數(shù)據(jù); 判斷所述第二時長所述網(wǎng)頁頁面的頁面內(nèi)容中POI數(shù)據(jù)是否發(fā)生變更; 當POI數(shù)據(jù)發(fā)生變更時,根據(jù)所述網(wǎng)頁頁面的用戶關(guān)注度,并結(jié)合所述網(wǎng)頁頁面中包括的POI數(shù)據(jù)的個數(shù),將所述網(wǎng)頁頁面的用戶關(guān)注度平均分配至該網(wǎng)頁頁面中的各POI數(shù)據(jù)。5.根據(jù)權(quán)利要求4所述的篩選興趣點POI數(shù)據(jù)的方法,其特征在于,當POI數(shù)據(jù)發(fā)生未變更時,將所述網(wǎng)頁頁面的用戶關(guān)注度作為該網(wǎng)頁頁面中包括的各POI數(shù)據(jù)的用戶關(guān)注度。6.一種篩選興趣點POI數(shù)據(jù)的裝置,其特征在于,包括: 獲取模塊,用于獲取包括POI數(shù)據(jù)的網(wǎng)頁頁面及所述網(wǎng)頁頁面的用戶關(guān)注度; 確定模塊,用于根據(jù)所述網(wǎng)頁頁面的用戶關(guān)注度,確定該網(wǎng)頁頁面中包括的POI數(shù)據(jù)的用戶關(guān)注度; 篩選模塊,用于基于各POI數(shù)據(jù)的用戶關(guān)注度,對POI數(shù)據(jù)進行篩選。7.根據(jù)權(quán)利要求6所述的篩選興趣點POI數(shù)據(jù)的裝置,其中,所述獲取模塊具體用于根據(jù)所述網(wǎng)頁頁面在第一時長內(nèi)的用戶訪問次數(shù)和/或平均每次瀏覽時長,獲取所述網(wǎng)頁頁面的用戶關(guān)注度。8.根據(jù)權(quán)利要求6或7所述的篩選興趣點POI數(shù)據(jù)的裝置,其中,當所述網(wǎng)頁頁面中僅包括一個POI數(shù)據(jù)時,所述確定模塊具體用于將所述網(wǎng)頁頁面的用戶關(guān)注度作為該網(wǎng)頁頁面中包括的POI數(shù)據(jù)的用戶關(guān)注度。9.根據(jù)權(quán)利要求6或7所述的篩選興趣點POI數(shù)據(jù)的裝置,其中,當所述網(wǎng)頁頁面中包括多個POI數(shù)據(jù)時,所述確定模塊進一步包括: 抓取單元,用于按照預(yù)定頻率抓取第二時長內(nèi)所述網(wǎng)頁頁面中的頁面內(nèi)容; 提取單元,用于提取每次抓取到的頁面內(nèi)容中的POI數(shù)據(jù); 判斷單元,用于判斷所述第二時長所述網(wǎng)頁頁面的頁面內(nèi)容中POI數(shù)據(jù)是否發(fā)生變更; 分配單元,用于當POI數(shù)據(jù)發(fā)生變更時,根據(jù)所述網(wǎng)頁頁面的用戶關(guān)注度,并結(jié)合所述網(wǎng)頁頁面中包括的POI數(shù)據(jù)的個數(shù),將所述網(wǎng)頁頁面的用戶關(guān)注度平均分配至該網(wǎng)頁頁面中的各POI數(shù)據(jù)。10.根據(jù)權(quán)利要求9所述的篩選興趣點POI數(shù)據(jù)的裝置,其特征在于,當POI數(shù)據(jù)發(fā)生未變更時,所述確定模塊具體用于將所述網(wǎng)頁頁面的用戶關(guān)注度作為該網(wǎng)頁頁面中包括的各POI數(shù)據(jù)的用戶關(guān)注度。
【專利摘要】本發(fā)明提供了一種篩選興趣點POI數(shù)據(jù)的方法,包括:獲取包括POI數(shù)據(jù)的網(wǎng)頁頁面及網(wǎng)頁頁面的用戶關(guān)注度;根據(jù)網(wǎng)頁頁面的用戶關(guān)注度,確定該網(wǎng)頁頁面中包括的POI數(shù)據(jù)的用戶關(guān)注度;基于各POI數(shù)據(jù)的用戶關(guān)注度,對POI數(shù)據(jù)進行篩選。由于用戶關(guān)注度越高的POI數(shù)據(jù),其包含信息的準確率越高,同時,網(wǎng)頁頁面的用戶關(guān)注度可直接反應(yīng)網(wǎng)頁頁面包括的各項信息的可信度和價值度,對于網(wǎng)頁頁面中包括的POI數(shù)據(jù),網(wǎng)頁頁面的用戶關(guān)注度也可以在很大程度上反應(yīng)POI數(shù)據(jù)的用戶關(guān)注度;因此,依據(jù)本發(fā)明的技術(shù)方案進行POI數(shù)據(jù)的篩選,可根據(jù)POI數(shù)據(jù)的用戶關(guān)注度篩選出準確率較高的POI數(shù)據(jù),解決了現(xiàn)有技術(shù)中難以從互聯(lián)網(wǎng)中收集到的較為準確的大量POI數(shù)據(jù)的問題。
【IPC分類】G06F17/30
【公開號】CN105069079
【申請?zhí)枴緾N201510463432
【發(fā)明人】王智廣, 魏少俊
【申請人】北京奇虎科技有限公司, 奇智軟件(北京)有限公司
【公開日】2015年11月18日
【申請日】2015年7月31日