亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

通過計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法及裝置的制造方法

文檔序號(hào):9235519閱讀:476來源:國知局
通過計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其設(shè)及一種針對(duì)文本內(nèi)容的信息處理方法及裝 置。
【背景技術(shù)】
[0002] 當(dāng)前,網(wǎng)絡(luò)上的信息數(shù)量龐大,且來源豐富。W新聞文章為例,用戶從各種信息源 可獲得大量的新聞,在用戶非常關(guān)屯、某些區(qū)域相關(guān)的新聞的情況下,如何將與用戶關(guān)屯、的 地域相關(guān)的新聞推薦給用戶,是一個(gè)急需解決的技術(shù)難題。
[0003] 現(xiàn)有技術(shù)中,采用與預(yù)先建立的地理信息知識(shí)庫進(jìn)行關(guān)鍵詞匹配的方法提取文章 的至少一個(gè)候選地理信息及對(duì)應(yīng)的計(jì)數(shù)結(jié)果,將計(jì)數(shù)結(jié)果較高的候選地理信息作為所述文 章的地理信息,根據(jù)文章的地理信息為用戶推薦與地域相關(guān)的文章。
[0004] 在實(shí)現(xiàn)上述提取文章的地理信息的過程中,會(huì)發(fā)生將高級(jí)地理信息和低級(jí)地理信 息(例如廣東省和深圳市)混合計(jì)算的情況,導(dǎo)致提取的文章的地理信息不準(zhǔn)確。此外,無 法提取文章中隱含的地理信息,例如當(dāng)文章中出現(xiàn)"海淀區(qū)"時(shí),其隱含的地理信息"北京 市"無法被提取出來,導(dǎo)致提取的文章的地理信息不準(zhǔn)確。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明的目的在于提供一種通過計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法及裝置,W較準(zhǔn)確的 提取與文章內(nèi)容相關(guān)的分級(jí)地理信息。
[0006] 根據(jù)本發(fā)明的一方面,本發(fā)明提供一種通過計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法,所述方 法包括:獲取文章的文本信息;從所述文本信息提取至少一個(gè)原始地理名詞;從預(yù)先建立 的分級(jí)地理信息知識(shí)庫分別提取與所述原始地理名詞相應(yīng)的分級(jí)地理位置信息,所述分級(jí) 地理位置信息包括與所述原始地理名詞相匹配的同級(jí)地理名詞W及其所屬的各行政劃分 級(jí)別的上級(jí)地理名詞;根據(jù)提取的所述原始地理名詞W及所述分級(jí)地理位置信息分別對(duì)提 取的所述分級(jí)地理位置信息進(jìn)行可信度評(píng)分;將所述可信度評(píng)分超過預(yù)定的可信度闊值的 分級(jí)地理位置信息標(biāo)注為與所述文章相關(guān)的地理信息。
[0007] 優(yōu)選地,所述根據(jù)提取的所述原始地理名詞W及所述分級(jí)地理位置信息分別對(duì)提 取的所述分級(jí)地理位置信息進(jìn)行可信度評(píng)分的處理包括:根據(jù)提取的所述原始地理名詞W 及所述分級(jí)地理位置信息分別從提取的所述分級(jí)地理位置信息獲取至少兩個(gè)地理名詞評(píng) 定指標(biāo)的值;根據(jù)獲取的所述至少兩個(gè)地理名詞評(píng)定指標(biāo)的值分別對(duì)提取的所述分級(jí)地理 位置信息進(jìn)行可信度評(píng)分。
[000引進(jìn)一步地,所述地理名詞評(píng)定指標(biāo)包括;提取的所述同級(jí)地理名詞的行政劃分級(jí) 別W及多個(gè)所述同級(jí)地理名詞所屬的各行政劃分級(jí)別的上級(jí)地理名詞的重合度。
[0009] 優(yōu)選地,所述從預(yù)先建立的分級(jí)地理信息知識(shí)庫分別提取與所述原始地理名詞相 應(yīng)的分級(jí)地理位置信息的處理包括:根據(jù)預(yù)先建立的地理信息簡(jiǎn)稱全稱映射表從所述預(yù)先 建立的分級(jí)地理信息知識(shí)庫分別提取與所述原始地理名詞相應(yīng)的分級(jí)地理位置信息。
[0010] 可選地,所述地理名詞評(píng)定指標(biāo)還包括提取的所述同級(jí)地理名詞對(duì)應(yīng)的原始地理 名詞的簡(jiǎn)稱全稱完整度。
[0011] 可選地,所述地理名詞評(píng)定指標(biāo)還包括提取的所述同級(jí)地理名詞對(duì)應(yīng)的原始地理 名詞的提取位置。
[0012] 進(jìn)一步地,所述文本信息包括所述文章的標(biāo)題和正文;所述原始地理名詞的提取 位置包括至少一個(gè)W下位置:所述標(biāo)題、所述正文的開頭、所述正文的結(jié)尾和所述正文除開 頭和結(jié)尾外的其余部分。
[0013] 可選地,所述地理名詞評(píng)定指標(biāo)還包括提取的同級(jí)地理名詞對(duì)應(yīng)的原始地理名詞 的出現(xiàn)次數(shù)。
[0014] 優(yōu)選地,所述根據(jù)獲取的所述至少兩個(gè)地理名詞評(píng)定指標(biāo)的值分別對(duì)提取的所述 分級(jí)地理位置信息進(jìn)行可信度評(píng)分的處理包括;根據(jù)所述至少兩個(gè)地理名詞評(píng)定指標(biāo)的值 分別為提取的所述同級(jí)地理名詞賦予權(quán)值;根據(jù)為提取的所述同級(jí)地理名詞賦予的權(quán)值分 別對(duì)所述同級(jí)地理名詞對(duì)應(yīng)的分級(jí)地理位置信息進(jìn)行可信度評(píng)分。
[0015] 根據(jù)本發(fā)明的另一方面,本發(fā)明還提供一種用于信息處理的裝置,所述裝置包括: 文本信息獲取單元,用于獲取文章的文本信息;原始地理名詞提取單元,用于從所述文本信 息提取至少一個(gè)原始地理名詞;分級(jí)地理位置信息提取單元,用于從預(yù)先建立的分級(jí)地理 信息知識(shí)庫分別提取與所述原始地理名詞相應(yīng)的分級(jí)地理位置信息,所述分級(jí)地理位置信 息包括與所述原始地理名詞相匹配的同級(jí)地理名詞W及其所屬的各行政劃分級(jí)別的上級(jí) 地理名詞;可信度評(píng)分單元,用于根據(jù)提取的所述原始地理名詞W及所述分級(jí)地理位置信 息分別對(duì)提取的所述分級(jí)地理位置信息進(jìn)行可信度評(píng)分;地理信息標(biāo)注單元,用于將所述 可信度評(píng)分超過預(yù)定的可信度闊值的分級(jí)地理位置信息標(biāo)注為與所述文章相關(guān)的地理信 息。
[0016] 優(yōu)選地,所述可信度評(píng)分單元包括:地理名詞評(píng)定指標(biāo)值獲取單元,用于根據(jù)提取 的所述原始地理名詞W及所述分級(jí)地理位置信息分別從提取的所述分級(jí)地理位置信息獲 取至少兩個(gè)地理名詞評(píng)定指標(biāo)的值;可信度評(píng)分子單元,用于根據(jù)獲取的所述至少兩個(gè)地 理名詞評(píng)定指標(biāo)的值分別對(duì)提取的所述分級(jí)地理位置信息進(jìn)行可信度評(píng)分。
[0017] 進(jìn)一步地,所述地理名詞評(píng)定指標(biāo)包括;提取的所述同級(jí)地理名詞的行政劃分級(jí) 別W及多個(gè)所述同級(jí)地理名詞所屬的各行政劃分級(jí)別的上級(jí)地理名詞的重合度。
[0018] 優(yōu)選地,所述分級(jí)地理位置信息提取單元包括;分級(jí)地理位置信息提取子單元,用 于根據(jù)預(yù)先建立的地理信息簡(jiǎn)稱全稱映射表從所述預(yù)先建立的分級(jí)地理信息知識(shí)庫分別 提取與所述原始地理名詞相應(yīng)的分級(jí)地理位置信息。
[0019] 可選地,所述地理名詞評(píng)定指標(biāo)還包括提取的所述同級(jí)地理名詞對(duì)應(yīng)的原始地理 名詞的簡(jiǎn)稱全稱完整度。
[0020] 可選地,所述地理名詞評(píng)定指標(biāo)還包括提取的所述同級(jí)地理名詞對(duì)應(yīng)的原始地理 名詞的提取位置。
[0021] 進(jìn)一步地,所述文本信息包括所述文章的標(biāo)題和正文;所述原始地理名詞的提取 位置包括至少一個(gè)W下位置:所述標(biāo)題、所述正文的開頭、所述正文的結(jié)尾和所述正文除開 頭和結(jié)尾外的其余部分。
[0022] 可選地,所述地理名詞評(píng)定指標(biāo)還包括提取的同級(jí)地理名詞對(duì)應(yīng)的原始地理名詞 的出現(xiàn)次數(shù)。
[0023] 優(yōu)選地,所述可信度評(píng)分子單元包括;權(quán)值賦值模塊,用于根據(jù)所述至少兩個(gè)地理 名詞評(píng)定指標(biāo)的值分別為提取的所述同級(jí)地理名詞賦予權(quán)值;可信度評(píng)分模塊,用于根據(jù) 為提取的所述同級(jí)地理名詞賦予的權(quán)值分別對(duì)所述同級(jí)地理名詞對(duì)應(yīng)的分級(jí)地理位置信 息進(jìn)行可信度評(píng)分。
[0024] 本發(fā)明提供的通過計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法及裝置,從分級(jí)地理信息知識(shí)庫提 取與文章的文本信息中的原始地理名詞相應(yīng)的分級(jí)地理位置信息,并對(duì)所述分級(jí)地理位置 信息進(jìn)行可信度評(píng)分,將可信度評(píng)分超過預(yù)定的可信度闊值的分級(jí)地理位置信息標(biāo)注為與 所述文章相關(guān)的地理信息。由于在處理過程中考慮了地理位置信息的行政劃分級(jí)別,且獲 取與提取的原始地理名詞相對(duì)應(yīng)的同級(jí)地理名詞W及各上級(jí)地理名詞,因此可較準(zhǔn)確地獲 取到與文章內(nèi)容相關(guān)的地理信息,并且獲取的地理信息是較完整的包括各行政級(jí)別的地理 信息。
【附圖說明】
[0025] 圖1是示出本發(fā)明示例性實(shí)施例通過計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法的流程示意圖;
[0026] 圖2是示出在信息系統(tǒng)中基于地理位置的文章推薦頁面示意圖;
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1