亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于搜索引擎獲取ip地址歸屬地的方法和裝置的制作方法

文檔序號:6589384閱讀:171來源:國知局
專利名稱:一種基于搜索引擎獲取ip地址歸屬地的方法和裝置的制作方法
一種基于搜索引擎獲取IP地址歸屬地的方法和裝置
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)協(xié)議(IP)地址定位技術(shù),尤其涉及一種基于搜索引擎獲取IP地址歸屬地的方法和裝置。
背景技術(shù)
隨著搜索引擎技術(shù)的不斷發(fā)展,搜索引擎的地域擴展功能也越來越受到人們的重視?!暗赜驍U展功能”即搜索引擎指根據(jù)用戶所在的地理位置向用戶返回具有地域特性的搜索結(jié)果,例如,位于北京的用戶搜索查詢詞為“天氣”,則搜索引擎會向其返回北京的天氣預(yù)報信息,與此類似的“地域擴展功能”能夠智能地更加準(zhǔn)確地滿足用戶需求。而實現(xiàn)“地域擴展功能”的關(guān)鍵點之一就是確定用戶IP地址的歸屬地。現(xiàn)有的方法中,通常只有網(wǎng)絡(luò)運營商能夠掌握其所轄IP地址的歸屬地,即需要IP地址歸屬地信息的公司只能通過商業(yè)合作向網(wǎng)絡(luò)運營商等第三方來獲取,增加了一定的成本。

發(fā)明內(nèi)容有鑒于此,本發(fā)明提供了一種基于搜索引擎獲取IP地址歸屬地的方法和裝置,能夠準(zhǔn)確獲得IP地址所在的地理位置信息。具體技術(shù)方案如下:一種基于搜索引擎獲取IP地址歸屬地的方法,該方法包括:S1、獲取一段時間內(nèi)的用戶搜索記錄,所述用戶搜索記錄包括用戶標(biāo)識(ID)、查詢詞和用戶IP地址,并識別所述用戶搜索記錄的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~;S2、利用預(yù)先標(biāo)注IP地址歸屬地的用戶搜索記錄作為樣本訓(xùn)練得到所述帶有地域?qū)傩缘脑~的置信度;S3、根據(jù)所述用戶搜索記錄中的用戶ID、所識別出的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~和所述帶有地域?qū)傩缘脑~的置信度,確定該IP地址的歸屬地。根據(jù)本發(fā)明一優(yōu)選實施示例,步驟SI中識別所述用戶搜索記錄的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~具體包括:S11、對所述用戶搜索記錄中的查詢詞進行分詞,識別其中的地名詞;S12、提取查詢詞中的非地名分詞,將與地名詞在查詢詞中的共現(xiàn)率高于預(yù)設(shè)閾值的非地名分詞作為帶有地域?qū)傩缘脑~。根據(jù)本發(fā)明一優(yōu)選實施例,所述步驟S12后還包括:S13、對所述帶有地域?qū)傩缘脑~進行詞義分析,提取詞義權(quán)重值高于預(yù)設(shè)閾值的帶有地域?qū)傩缘脑~。根據(jù)本發(fā)明一優(yōu)選實施例,所述步驟S13后還包括:S14、根據(jù)帶有地域?qū)傩缘脑~的所屬類別,對所述步驟S13提取出的帶有地域?qū)傩缘脑~進行歸一化處理。
根據(jù)本發(fā)明一優(yōu)選實施例,所述步驟S2具體包括:
根據(jù)公式
權(quán)利要求
1.一種基于搜索引擎獲取互聯(lián)網(wǎng)協(xié)議IP地址歸屬地的方法,其特征在于,該方法包括: 51、獲取一段時間內(nèi)的用戶搜索記錄,所述用戶搜索記錄包括用戶標(biāo)識ID、查詢詞和用戶IP地址,并識別所述用戶搜索記錄的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~; 52、利用預(yù)先標(biāo)注IP地址歸屬地的用戶搜索記錄作為樣本訓(xùn)練得到所述帶有地域?qū)傩缘脑~的置信度; 53、根據(jù)所述用戶搜索記錄中的用戶ID、所識別出的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~和所述帶有地域?qū)傩缘脑~的置信度,確定該IP地址的歸屬地。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟SI中識別所述用戶搜索記錄的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~具體包括: 511、對所述用戶搜索記錄中的查詢詞進行分詞,識別其中的地名詞; 512、提取查詢詞中的非地名分詞,將與地名詞在查詢詞中的共現(xiàn)率高于預(yù)設(shè)閾值的非地名分詞作為帶有地域?qū)傩缘脑~。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟S12后還包括: 513、對所述帶有地域?qū)傩缘脑~進行詞義分析,提取詞義權(quán)重值高于預(yù)設(shè)閾值的帶有地域?qū)傩缘脑~。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟S13后還包括: 514、根據(jù)帶有地域?qū)傩缘脑~的所屬類別,對所述步驟S13提取出的帶有地域?qū)傩缘脑~進行歸一化處理。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S2具體包括: 根據(jù)公式
6.根據(jù)權(quán)利要求1至5任一權(quán)項所述的方法,其特征在于,步驟S3中所述確定該IP地址的歸屬地為: 按照預(yù)先設(shè)定的規(guī)則計算用戶IP地址歸屬于所述地名詞對應(yīng)的各地域的第一權(quán)重值,根據(jù)該第一權(quán)重值確定該IP地址的歸屬地。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在所述按照預(yù)先設(shè)定的規(guī)則計算用戶IP地址歸屬于所述地名詞對應(yīng)的各地域的第一權(quán)重值時,具體包括: 根據(jù)公式
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)該第一權(quán)重值確定該IP地址的歸屬地為: 將用戶IP地址歸屬于所述地名詞對應(yīng)的各地域的第一權(quán)重值中,第一權(quán)重值最高的地域作為該IP地址的歸屬地。
9.根據(jù)權(quán)利要求6所述的方法,其特征在于,該方法還包括: S4、根據(jù)預(yù)先獲取的一段時間內(nèi)的用戶在地圖搜索引擎中設(shè)置的默認(rèn)城市信息以及用戶ID,按照預(yù)先設(shè)定的規(guī)則計算IP地址歸屬于各個地域的第二權(quán)重值; 所述根據(jù)該第一權(quán)重值確定該IP地址的歸屬地具體為: 整合IP地址歸屬于各個地域的第一權(quán)重值和第二權(quán)重值,得到IP地址的最終歸屬地。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述計算IP地址歸屬于各個地域的第二權(quán)重值,具體包括: 將所述預(yù)先獲取的用戶在地圖搜索引擎中設(shè)置的默認(rèn)城市屬于某一地域的用戶ID數(shù)與總的用戶ID數(shù)的比例作為IP地址歸屬于所述某一地域的第二權(quán)重值。
11.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述整合IP地址歸屬于各個地域的第一權(quán)重值和第二權(quán)重值,得到IP地址的最終歸屬地具體包括: 將IP地址歸屬于各個地域的第一權(quán)重值和第二權(quán)重值相乘,得到IP地址歸屬于各個地域的綜合權(quán)重值,并將綜合權(quán)重值最高的地域作為IP地址的歸屬地。
12.一種基于搜索 引擎獲取IP地址歸屬地的裝置,其特征在于,該裝置包括: 預(yù)處理單元,用于獲取一段時間內(nèi)的用戶搜索記錄,所述用戶搜索記錄包括用戶ID、查詢詞和用戶IP地址,并識別所述用戶搜索記錄的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~; 訓(xùn)練單元,用于利用預(yù)先標(biāo)注IP地址歸屬地的用戶搜索記錄作為樣本訓(xùn)練得到所述帶有地域?qū)傩缘脑~的置信度; 判別單元,用于根據(jù)所述用戶搜索記錄中的用戶ID、所識別出的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~和所述帶有地域?qū)傩缘脑~的置信度,確定該IP地址的歸屬地。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述預(yù)處理單元在識別所述用戶搜索記錄的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~時,具體執(zhí)行: 521、對所述用戶搜索記錄中的查詢詞進行分詞,識別其中的地名詞; 522、提取查詢詞中的非地名分詞,將與地名詞在查詢詞中的共現(xiàn)率高于預(yù)設(shè)閾值的非地名分詞作為帶有地域?qū)傩缘脑~。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述預(yù)處理單元在執(zhí)行S22后,還執(zhí)行: 523、對所述帶有地域?qū)傩缘脑~進行詞義分析,提取詞義權(quán)重值高于預(yù)設(shè)閾值的帶有地域?qū)傩缘脑~。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述預(yù)處理單元在執(zhí)行S23后,還執(zhí)行: 524、根據(jù)帶有地域?qū)傩缘脑~的所屬類別,對所述步驟S23提取出的帶有地域?qū)傩缘脑~進行歸一化處理。
16.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述訓(xùn)練單元具體執(zhí)行:根據(jù)公式
17.根據(jù)權(quán)利要求12至16任一權(quán)項所述的裝置,其特征在于,所述判別單元在確定該IP地址的歸屬地時,具體執(zhí)行: 按照預(yù)先設(shè)定的規(guī)則計算用戶IP地址歸屬于所述地名詞對應(yīng)的各地域的第一權(quán)重值,根據(jù)該第一權(quán)重值確定該IP地址的歸屬地。
18.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述判別單元按照預(yù)先設(shè)定的規(guī)則計算用戶IP地址歸屬于所述地名詞對應(yīng)的各地域的第一權(quán)重值時,具體執(zhí)行: 根據(jù)公式
19.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述判別單元根據(jù)該第一權(quán)重值確定該IP地址的歸屬地時,具體執(zhí)行: 將用戶IP地址歸屬于所述地名詞對應(yīng)的各地域的第一權(quán)重值中,第一權(quán)重值最高的地域作為該IP地址的歸屬地。
20.根據(jù)權(quán)利要求17所述的裝置,其特征在于,該裝置還包括: 地圖信息判別單元,用于根據(jù)預(yù)先獲取的一段時間內(nèi)的用戶在地圖搜索引擎中設(shè)置的默認(rèn)城市信息以及用戶ID,按照預(yù)先設(shè)定的規(guī)則計算IP地址歸屬于各個地域的第二權(quán)重值; 所述判別單元根據(jù)該第一權(quán)重值確定該IP地址的歸屬地時,具體執(zhí)行: 整合IP地址歸屬于各個地域的第一權(quán)重值和第二權(quán)重值,得到IP地址的最終歸屬地。
21.根據(jù)權(quán)利要求20所述的裝置,其特征在于,所述地圖信息判別單元計算IP地址歸屬于各個地域的第二權(quán)重值時,具體執(zhí)行: 將所述預(yù)先獲取的用戶在地圖搜索引擎中設(shè)置的默認(rèn)城市屬于某一地域的用戶ID數(shù)與總的用戶ID數(shù)的比例作為IP地址歸屬于所述某一地域的第二權(quán)重值。
22.根據(jù)權(quán)利要求20所述的裝置,其特征在于,所述判別單元整合IP地址歸屬于各個地域的第一權(quán)重值和第二權(quán)重值,得到IP地址的最終歸屬地時,具體執(zhí)行: 將IP地址歸屬于各個地域的第一權(quán)重值和第二權(quán)重值相乘,得到IP地址歸屬于各個地域的綜合權(quán)重值,并將綜合權(quán)重值最高的地域作為IP地址的歸屬地。
全文摘要
本發(fā)明提供了一種基于搜索引擎獲取IP地址歸屬地的方法和裝置,其中方法包括S1.獲取一段時間內(nèi)的用戶搜索記錄,所述用戶搜索記錄包括用戶ID、查詢詞和用戶IP地址,并識別所述用戶搜索記錄的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~;S2.利用預(yù)先標(biāo)注IP地址歸屬地的用戶搜索記錄作為樣本訓(xùn)練得到所述帶有地域?qū)傩缘脑~的置信度;S3.根據(jù)所述用戶搜索記錄中的用戶ID、所識別出的查詢詞中的地名詞以及帶有地域?qū)傩缘脑~和所述帶有地域?qū)傩缘脑~的置信度,確定該IP地址的歸屬地。本發(fā)明能夠基于搜索引擎準(zhǔn)確獲取用戶IP地址的歸屬地。
文檔編號G06F17/30GK103207901SQ20131009128
公開日2013年7月17日 申請日期2013年3月21日 優(yōu)先權(quán)日2013年3月21日
發(fā)明者阮星華, 才鑫 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1