亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法

文檔序號:6579393閱讀:398來源:國知局
專利名稱:一種網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)和信息處理技術(shù),尤其涉及一種網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)的發(fā)展,特別是互聯(lián)網(wǎng)自媒體(微博)時(shí)代的到來,網(wǎng)絡(luò)輿情信息的數(shù)量再一次暴增,由于網(wǎng)絡(luò)輿情往往帶有強(qiáng)烈的地域特性,因此需要將輿情信息按照一定的規(guī)則分地域整理。目前,地域識別方法一般依賴于單純的地名分析來判斷文本的地域?qū)傩裕@樣很難應(yīng)對一些二義性的地名詞,而且容易把一些特定的機(jī)構(gòu)識別為地名標(biāo)記,例如北 京大學(xué),上海大學(xué)等。同時(shí)難以應(yīng)對短文本的信息的按地域歸類處理,特別是微博這類短文本的地域識別。

發(fā)明內(nèi)容
有鑒于此,本發(fā)明的主要目的在于提供一種網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,解決網(wǎng)絡(luò)輿情與地域相關(guān)的識別問題,實(shí)現(xiàn)不同粒度需要的地域相關(guān)度計(jì)算需求。為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的一種網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,構(gòu)建一包含全國性地名的詞庫,并消除詞庫的二義性;該方法包括多層次相似度計(jì)算的過程及多層級地址融合的過程;所述多層次相似度計(jì)算的過程,包括A、初始化不同層級的地址詞權(quán)重,針對不同層級的地址詞設(shè)定不同的初始權(quán)重;B、根據(jù)全局信息調(diào)整地址詞的權(quán)重、根據(jù)局部信息調(diào)整地址詞的權(quán)重和根據(jù)額外信息調(diào)整地址詞的權(quán)重的步驟;以及,C、計(jì)算地區(qū)相似度的步驟;所述多層級地址融合的過程,包括D、執(zhí)行自底向上的層級相似度的傳遞步驟,以實(shí)現(xiàn)低層級地區(qū)的相似度向上層級地區(qū)的傳遞;E、融合多層級的相似度,重新計(jì)算地區(qū)相似度的步驟;以及,F(xiàn)、進(jìn)行地區(qū)排序的步驟。其中,步驟A所述地址詞權(quán)重Wp的計(jì)算公式如下Wp = WL(p);其中P為地址詞,L(p)為所在的層級。所述步驟B中根據(jù)全局信息調(diào)整地址詞權(quán)重Wp的計(jì)算公式如下Wp=Wp^F1 (t, S,O, c);其中=F1O為函數(shù),t為根據(jù)地址詞所處的標(biāo)題或正文,s為段落,O為位置,c為地址詞出現(xiàn)次數(shù)。所述步驟B中根據(jù)局部信息調(diào)整地址詞權(quán)重Wp的計(jì)算公式如下
Wp=Wp^F2 (context);其中,context為地址詞上下文信息。所述步驟B中根據(jù)額外信息調(diào)整地址詞權(quán)重Wp的計(jì)算公式如下Wp=Wp^F3(k, np);其中,k為根據(jù)地址詞的先驗(yàn)知識,np為人口信息。步驟C所述計(jì)算地區(qū)相似度Si的公式如下
權(quán)利要求
1.一種網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,構(gòu)建一包含全國性地名的詞庫,并消除詞庫的二義性;其特征在于,該方法包括多層次相似度計(jì)算的過程及多層級地址融合的過程;所述多層次相似度計(jì)算的過程,包括 A、初始化不同層級的地址詞權(quán)重,針對不同層級的地址詞設(shè)定不同的初始權(quán)重; B、根據(jù)全局信息調(diào)整地址詞的權(quán)重、根據(jù)局部信息調(diào)整地址詞的權(quán)重和根據(jù)額外信息調(diào)整地址詞的權(quán)重的步驟;以及, C、計(jì)算地區(qū)相似度的步驟; 所述多層級地址融合的過程,包括 D、執(zhí)行自底向上的層級相似度的傳遞步驟,以實(shí)現(xiàn)低層級地區(qū)的相似度向上層級地區(qū)的傳遞; E、融合多層級的相似度,重新計(jì)算地區(qū)相似度的步驟;以及, F、進(jìn)行地區(qū)排序的步驟。
2.根據(jù)權(quán)利要求1所述網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,其特征在于,步驟A所述地址詞權(quán)重Wp的計(jì)算公式如下Wp=Wl(P); 其中Φ為地址詞,L(p)為所在的層級。
3.根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,其特征在于,所述步驟B中根據(jù)全局信息調(diào)整地址詞權(quán)重Wp的計(jì)算公式如下 Wp=Wp^F1 (t, S,ο, c); 其中T1O為函數(shù),t為根據(jù)地址詞所處的標(biāo)題或正文,s為段落,ο為位置,c為地址詞出現(xiàn)次數(shù)。
4.根據(jù)權(quán)利要求1所述網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,其特征在于,所述步驟B中根據(jù)局部信息調(diào)整地址詞權(quán)重Wp的計(jì)算公式如下 Wp=Wp^F2 (context);其中,context為地址詞上下文信息。
5.根據(jù)權(quán)利要求1所述網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,其特征在于,所述步驟B中根據(jù)額外信息調(diào)整地址詞權(quán)重Wp的計(jì)算公式如下 Wp=Wp*F3(k, np)其中,k為根據(jù)地址詞的先驗(yàn)知識,np為人口信息。
6.根據(jù)權(quán)利要求1所述網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,其特征在于,步驟C所述計(jì)算地區(qū)相似度Si的公式如下 J I 其中P為統(tǒng)計(jì)地區(qū)i對應(yīng)地址詞,η為地區(qū)所含地址詞個(gè)數(shù)。
7.根據(jù)權(quán)利要求1所述網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,其特征在于,步驟D所述的自底向上的層級相似度的傳遞的步驟中,計(jì)算地區(qū)相似度的公式如下 SjLi=Sj* α (片); 其中α為傳遞關(guān)系,j屬于i地區(qū)下的低層地區(qū)。
8.根據(jù)權(quán)利要求1所述網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,其特征在于,步驟E所述重新計(jì)算地區(qū)相似度的公式如下
全文摘要
本發(fā)明公開了一種網(wǎng)絡(luò)輿情地域相關(guān)度的計(jì)算方法,該方法包括多層次相似度計(jì)算的過程及多層級地址融合的過程;所述多層次相似度計(jì)算的過程A、初始化不同層級的地址詞權(quán)重,針對不同層級的地址詞設(shè)定不同的初始權(quán)重;B、根據(jù)全局信息調(diào)整地址詞的權(quán)重、根據(jù)局部信息調(diào)整地址詞的權(quán)重和根據(jù)額外信息調(diào)整地址詞的權(quán)重的步驟;C、計(jì)算地區(qū)相似度的步驟;所述多層級地址融合的過程D、執(zhí)行自底向上的層級相似度的傳遞步驟,以實(shí)現(xiàn)低層級地區(qū)的相似度向上層級地區(qū)的傳遞;E、融合多層級的相似度,重新計(jì)算地區(qū)相似度的步驟;F、進(jìn)行地區(qū)排序的步驟。利用本發(fā)明,能夠解決網(wǎng)絡(luò)輿情與地域相關(guān)的識別問題,實(shí)現(xiàn)不同粒度需要的地域相關(guān)度計(jì)算需求。
文檔編號G06F17/27GK103020038SQ20121057314
公開日2013年4月3日 申請日期2012年12月25日 優(yōu)先權(quán)日2012年12月25日
發(fā)明者宮天翔, 王敏, 史佳佳, 楊之光, 楊青 申請人:人民搜索網(wǎng)絡(luò)股份公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1