亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

選擇興趣點(diǎn)poi數(shù)據(jù)的方法及裝置的制造方法_2

文檔序號(hào):9396891閱讀:來(lái)源:國(guó)知局
它可以直接連接或耦接到其他元件,或者也可以存在中間元件。此外,這里使用的“連接”或“耦接”可以包括無(wú)線連接或無(wú)線耦接。這里使用的措辭“和/或”包括一個(gè)或更多個(gè)相關(guān)聯(lián)的列出項(xiàng)的全部或任一單元和全部組合。
[0055]本技術(shù)領(lǐng)域技術(shù)人員可以理解,除非另外定義,這里使用的所有術(shù)語(yǔ)(包括技術(shù)術(shù)語(yǔ)和科學(xué)術(shù)語(yǔ)),具有與本發(fā)明所屬領(lǐng)域中的普通技術(shù)人員的一般理解相同的意義。還應(yīng)該理解的是,諸如通用字典中定義的那些術(shù)語(yǔ),應(yīng)該被理解為具有與現(xiàn)有技術(shù)的上下文中的意義一致的意義,并且除非像這里一樣被特定定義,否則不會(huì)用理想化或過(guò)于正式的含義來(lái)解釋。
[0056]圖1為本發(fā)明一個(gè)實(shí)施例中選擇興趣點(diǎn)POI數(shù)據(jù)的方法的流程示意圖。
[0057]步驟SllO:獲取包括具有相同的名稱(chēng)信息的不同POI數(shù)據(jù)的多個(gè)網(wǎng)頁(yè)頁(yè)面;步驟S120:提取多個(gè)網(wǎng)頁(yè)頁(yè)面中的用戶(hù)關(guān)注度信息;步驟S130:根據(jù)各網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息,確定該網(wǎng)頁(yè)頁(yè)面中包括的一個(gè)或多個(gè)POI數(shù)據(jù)所對(duì)應(yīng)的用戶(hù)關(guān)注度;步驟S140:基于用戶(hù)關(guān)注度對(duì)多個(gè)網(wǎng)頁(yè)頁(yè)面中包括的具有相同名稱(chēng)信息的多個(gè)POI數(shù)據(jù)進(jìn)行排序;步驟S150:基于POI數(shù)據(jù)的排序選擇一個(gè)或多個(gè)所述POI數(shù)據(jù),作為對(duì)應(yīng)該相同的名稱(chēng)信息的可信POI數(shù)據(jù)。
[0058]本發(fā)明的技術(shù)方案中,對(duì)包括具有相同的名稱(chēng)信息的不同POI數(shù)據(jù)的多個(gè)網(wǎng)頁(yè)頁(yè)面,根據(jù)多個(gè)網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息來(lái)確定其中包括的POI數(shù)據(jù)所對(duì)應(yīng)的用戶(hù)關(guān)注度,再基于用戶(hù)關(guān)注度對(duì)POI數(shù)據(jù)進(jìn)行排序,進(jìn)而根據(jù)排序結(jié)果從中選擇對(duì)應(yīng)該相同的名稱(chēng)信息的可信POI數(shù)據(jù);由于用戶(hù)關(guān)注度越高的POI數(shù)據(jù),其包含信息的準(zhǔn)確率越高,同時(shí),網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度可直接反應(yīng)網(wǎng)頁(yè)頁(yè)面包括的各項(xiàng)信息的可信度和價(jià)值度,對(duì)于網(wǎng)頁(yè)頁(yè)面中包括的POI數(shù)據(jù),網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度也可以在很大程度上反應(yīng)POI數(shù)據(jù)的用戶(hù)關(guān)注度;因此,根據(jù)用戶(hù)關(guān)注度可從具有相同的名稱(chēng)信息的不同POI數(shù)據(jù)中選擇出可信度較高的POI數(shù)據(jù),解決了現(xiàn)有技術(shù)難以甄別出哪個(gè)POI數(shù)據(jù)中的名稱(chēng)信息對(duì)應(yīng)的地址信息是準(zhǔn)確的問(wèn)題,提高了對(duì)收集POI數(shù)據(jù)的準(zhǔn)確率。
[0059]步驟SllO:獲取包括具有相同的名稱(chēng)信息的不同POI數(shù)據(jù)的多個(gè)網(wǎng)頁(yè)頁(yè)面。
[0060]具體地,獲取包括POI數(shù)據(jù)的網(wǎng)頁(yè)頁(yè)面;基于一個(gè)名稱(chēng)信息,在各個(gè)網(wǎng)頁(yè)頁(yè)面包括的POI數(shù)據(jù)中進(jìn)行匹配,確定包括該名稱(chēng)信息的網(wǎng)頁(yè)頁(yè)面;對(duì)于包括該名稱(chēng)信息的網(wǎng)頁(yè)頁(yè)面,判斷其各自包括的POI數(shù)據(jù)中的地址信息是否相同,并提取具有不同地址信息的多個(gè)網(wǎng)頁(yè)頁(yè)面。
[0061]其中,獲取包括POI數(shù)據(jù)的網(wǎng)頁(yè)頁(yè)面的步驟具體包括:
[0062]從互聯(lián)網(wǎng)中獲取多個(gè)POI數(shù)據(jù);爬取包括地址信息的多個(gè)網(wǎng)頁(yè)頁(yè)面;將多個(gè)POI數(shù)據(jù)中的地址信息及多個(gè)網(wǎng)頁(yè)頁(yè)面包含的地址信息分別歸一化為經(jīng)瑋度信息;基于同一經(jīng)瑋度信息,在多個(gè)POI數(shù)據(jù)的經(jīng)瑋度信息與多個(gè)網(wǎng)頁(yè)頁(yè)面中經(jīng)瑋度信息中進(jìn)行匹配;對(duì)于具有相同經(jīng)瑋度信息的POI數(shù)據(jù)及網(wǎng)頁(yè)頁(yè)面,根據(jù)該P(yáng)OI數(shù)據(jù)對(duì)應(yīng)的POI名稱(chēng)在該網(wǎng)頁(yè)頁(yè)面中進(jìn)行查找,確定該網(wǎng)頁(yè)頁(yè)面中是否包括該P(yáng)OI數(shù)據(jù)的POI名稱(chēng);當(dāng)該網(wǎng)頁(yè)頁(yè)面中包括該P(yáng)OI數(shù)據(jù)的POI名稱(chēng)時(shí),確定該網(wǎng)頁(yè)頁(yè)面包括該興趣點(diǎn)POI數(shù)據(jù)。
[0063]步驟S120:提取多個(gè)網(wǎng)頁(yè)頁(yè)面中的用戶(hù)關(guān)注度信息。
[0064]具體地,提取所述多個(gè)網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息的步驟具體包括:
[0065]根據(jù)各網(wǎng)頁(yè)頁(yè)面在第一時(shí)長(zhǎng)內(nèi)的用戶(hù)訪問(wèn)次數(shù)和/或平均每次瀏覽時(shí)長(zhǎng),獲取各網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息。
[0066]其中,用戶(hù)訪問(wèn)次數(shù)可為用戶(hù)對(duì)指向網(wǎng)頁(yè)頁(yè)面的鏈接的點(diǎn)擊次數(shù)。
[0067]例如,根據(jù)各網(wǎng)頁(yè)頁(yè)面的頁(yè)面標(biāo)識(shí)在用戶(hù)歷史訪問(wèn)記錄中查詢(xún),確定在第一時(shí)長(zhǎng)內(nèi),如近30日內(nèi),各網(wǎng)頁(yè)頁(yè)面對(duì)應(yīng)鏈接的用戶(hù)點(diǎn)擊次數(shù)和/或該網(wǎng)頁(yè)頁(yè)面的平均每次瀏覽時(shí)長(zhǎng),隨后基于關(guān)注度計(jì)算公式,通過(guò)對(duì)用戶(hù)點(diǎn)擊次數(shù)和/或平均每次瀏覽時(shí)長(zhǎng)賦予相應(yīng)的權(quán)重進(jìn)行加權(quán)計(jì)算,來(lái)確定各網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息;其中,用戶(hù)歷史訪問(wèn)記錄中包括網(wǎng)頁(yè)頁(yè)面對(duì)應(yīng)鏈接的用戶(hù)點(diǎn)擊和/或用戶(hù)對(duì)網(wǎng)頁(yè)頁(yè)面的瀏覽記錄。
[0068]步驟S130:根據(jù)各網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息,確定該網(wǎng)頁(yè)頁(yè)面中包括的一個(gè)或多個(gè)POI數(shù)據(jù)所對(duì)應(yīng)的用戶(hù)關(guān)注度。
[0069]可選地,當(dāng)網(wǎng)頁(yè)頁(yè)面中僅包括一個(gè)POI數(shù)據(jù)時(shí),根據(jù)各網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息,確定該網(wǎng)頁(yè)頁(yè)面中包括的一個(gè)或多個(gè)POI數(shù)據(jù)所對(duì)應(yīng)的用戶(hù)關(guān)注度的方式具體為:將該網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息作為該網(wǎng)頁(yè)頁(yè)面中包括的一個(gè)POI數(shù)據(jù)的用戶(hù)關(guān)注度。
[0070]可選地,如圖2所示,當(dāng)網(wǎng)頁(yè)頁(yè)面中包括多個(gè)POI數(shù)據(jù)時(shí),根據(jù)各網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息,確定各網(wǎng)頁(yè)頁(yè)面中包括的一個(gè)或多個(gè)POI數(shù)據(jù)所對(duì)應(yīng)的用戶(hù)關(guān)注度的步驟,進(jìn)一步包括步驟S231(圖中未示出)、步驟S232(圖中未示出)、步驟S233(圖中未示出)、步驟S234(圖中未示出)和步驟S235(圖中未示出)。
[0071]步驟S231:按照預(yù)定頻率抓取第二時(shí)長(zhǎng)內(nèi)各網(wǎng)頁(yè)頁(yè)面中的頁(yè)面內(nèi)容;步驟S232:提取每次抓取到的頁(yè)面內(nèi)容中的POI數(shù)據(jù);步驟S233:判斷第二時(shí)長(zhǎng)內(nèi)各網(wǎng)頁(yè)頁(yè)面的頁(yè)面內(nèi)容中POI數(shù)據(jù)是否發(fā)生變更;步驟S234:基于判斷結(jié)果選擇相應(yīng)的關(guān)注度分配規(guī)則;步驟S235:基于相應(yīng)的關(guān)注度分配規(guī)則,根據(jù)各網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度,并結(jié)合各網(wǎng)頁(yè)頁(yè)面中包括的POI數(shù)據(jù)的個(gè)數(shù),確定各網(wǎng)頁(yè)頁(yè)面中包括的多個(gè)POI數(shù)據(jù)的用戶(hù)關(guān)注度。
[0072]步驟S231:按照預(yù)定頻率抓取第二時(shí)長(zhǎng)內(nèi)各網(wǎng)頁(yè)頁(yè)面中的頁(yè)面內(nèi)容。
[0073]具體地,對(duì)于包括多個(gè)POI數(shù)據(jù)的網(wǎng)頁(yè)頁(yè)面,可利用網(wǎng)絡(luò)爬蟲(chóng)類(lèi)的程序,從互聯(lián)網(wǎng)中按照預(yù)定頻率抓取在第二時(shí)長(zhǎng)內(nèi)該網(wǎng)頁(yè)頁(yè)面的頁(yè)面內(nèi)容,如以I次/日的頻率,抓取180日內(nèi)該網(wǎng)頁(yè)頁(yè)面的頁(yè)面內(nèi)容。
[0074]步驟S232:提取每次抓取到的頁(yè)面內(nèi)容中的POI數(shù)據(jù)。
[0075]例如,對(duì)于首次抓取到的頁(yè)面內(nèi)容,從中提取文本內(nèi)容,并在文本內(nèi)容中查找“地址”、“位于”或“坐落于”等可能包括地址信息的地址關(guān)鍵詞;提取地址關(guān)鍵詞附近的文本片段;根據(jù)設(shè)定的分隔符以及片段長(zhǎng)度對(duì)文本片段進(jìn)行分割,比如文本片段距離地址關(guān)鍵詞的文本長(zhǎng)度大于設(shè)定的閾值、和/或文本片段出現(xiàn)設(shè)定的分隔符(比如空格、逗號(hào)、句號(hào)等),則對(duì)文本片段進(jìn)行分割;將分割結(jié)果中,分割處(例如分隔符處)與地址關(guān)鍵詞之間的文本片段,作為該網(wǎng)頁(yè)頁(yè)面中與地址關(guān)鍵詞相關(guān)聯(lián)的文本信息;隨后,對(duì)于各個(gè)文本信息,從各個(gè)文本信息中提取出地址信息,并基于各個(gè)地址信息,分別提取距離其各自最近的名稱(chēng)作為POI名稱(chēng),即提取到各個(gè)POI數(shù)據(jù)。對(duì)于之后抓取到的頁(yè)面內(nèi)容,可基于首次已確定的POI數(shù)據(jù)所在的頁(yè)面位置處直接提取。
[0076]步驟S233:判斷第二時(shí)長(zhǎng)內(nèi)各網(wǎng)頁(yè)頁(yè)面的頁(yè)面內(nèi)容中POI數(shù)據(jù)是否發(fā)生變更。
[0077]具體地,以I次/日的頻率抓取到180日內(nèi)網(wǎng)頁(yè)頁(yè)面的頁(yè)面內(nèi)容,即180張?jiān)摼W(wǎng)頁(yè)頁(yè)面的頁(yè)面內(nèi)容,比較從180張網(wǎng)頁(yè)頁(yè)面的頁(yè)面內(nèi)容中提到的各個(gè)POI數(shù)據(jù)是否相同,若相同則確定POI數(shù)據(jù)發(fā)生未變更。例如,一個(gè)網(wǎng)頁(yè)頁(yè)面中包括三個(gè)POI數(shù)據(jù),用P1、P2和P3表示;P1的POI名稱(chēng)為大董烤鴨店(團(tuán)結(jié)湖店),P2的POI名稱(chēng)為大董烤鴨店(東四十條店),P3的POI名稱(chēng)為大董烤鴨店(玉淵潭店);以I次/日的頻率抓取到180日內(nèi)該網(wǎng)頁(yè)頁(yè)面的180張頁(yè)面內(nèi)容,提取該180張頁(yè)面內(nèi)容中P1、P2和P3分別對(duì)應(yīng)的POI名稱(chēng)和地址信息,即比較180個(gè)Pl的POI名稱(chēng)和地址信息、180個(gè)P2的POI名稱(chēng)和地址信息以及180個(gè)P3的POI名稱(chēng)和地址信息分別是否相同。
[0078]步驟S234:基于判斷結(jié)果選擇相應(yīng)的關(guān)注度分配規(guī)則。
[0079]其中,關(guān)注度分配規(guī)則包括:當(dāng)POI數(shù)據(jù)未發(fā)生變更時(shí),選擇將網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息作為該網(wǎng)頁(yè)頁(yè)面中包括的各POI數(shù)據(jù)的用戶(hù)關(guān)注度的關(guān)注度分配規(guī)則;當(dāng)POI數(shù)據(jù)發(fā)生變更時(shí),選擇將網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度信息平均分配至該網(wǎng)頁(yè)頁(yè)面中包括的各POI數(shù)據(jù)的用戶(hù)關(guān)注度的關(guān)注度分配規(guī)則。
[0080]步驟S235:基于相應(yīng)的關(guān)注度分配規(guī)則,根據(jù)各網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度,并結(jié)合各網(wǎng)頁(yè)頁(yè)面中包括的POI數(shù)據(jù)的個(gè)數(shù),確定各網(wǎng)頁(yè)頁(yè)面中包括的多個(gè)POI數(shù)據(jù)的用戶(hù)關(guān)注度。
[0081]當(dāng)POI數(shù)據(jù)發(fā)生未變更時(shí),將網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度作為該網(wǎng)頁(yè)頁(yè)面中包括的各POI數(shù)據(jù)的用戶(hù)關(guān)注度。
[0082]當(dāng)POI數(shù)據(jù)發(fā)生變更時(shí),根據(jù)網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度,并結(jié)合網(wǎng)頁(yè)頁(yè)面中包括的POI數(shù)據(jù)的個(gè)數(shù),將網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度平均分配至該網(wǎng)頁(yè)頁(yè)面中的各POI數(shù)據(jù)。
[0083]具體地,當(dāng)網(wǎng)頁(yè)頁(yè)面中任一 POI數(shù)據(jù)發(fā)生變更時(shí),根據(jù)網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度,并結(jié)合網(wǎng)頁(yè)頁(yè)面中包括的POI數(shù)據(jù)的個(gè)數(shù),通過(guò)計(jì)算n/m可確定各個(gè)POI數(shù)據(jù)的用戶(hù)關(guān)注度;其中,網(wǎng)頁(yè)頁(yè)面的用戶(hù)關(guān)注度為n,網(wǎng)頁(yè)頁(yè)面中包含的POI數(shù)據(jù)的個(gè)數(shù)為m。
[0084]參照?qǐng)D1,步驟S140:基于用戶(hù)關(guān)注度對(duì)多個(gè)網(wǎng)頁(yè)頁(yè)面中包括的具有相同名稱(chēng)信息的多個(gè)POI數(shù)據(jù)進(jìn)行排序。
[0085]具體地,將多個(gè)網(wǎng)頁(yè)頁(yè)面中包括的具有相同名稱(chēng)信息的多個(gè)POI數(shù)據(jù)
當(dāng)前第2頁(yè)1 2 3 4 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1