技術(shù)總結(jié)
本發(fā)明公開(kāi)了一種基于點(diǎn)互信息的微博表情符號(hào)的情感計(jì)算方法。步驟如下:(1)爬取大規(guī)模新浪微博并進(jìn)行過(guò)濾,只保留同時(shí)包含表情符號(hào)和情感詞的微博;(2)對(duì)微博進(jìn)行預(yù)處理,對(duì)前接否定詞、程度詞的情感詞進(jìn)行組合操作并計(jì)算其情感值;(3)對(duì)預(yù)處理后的微博抽取?“表情符號(hào)?情感詞”共現(xiàn)對(duì)并組成共現(xiàn)對(duì)集合;(4)計(jì)算表情符號(hào)在“表情符號(hào)?情感詞”共現(xiàn)對(duì)集合中與每個(gè)共現(xiàn)情感詞的點(diǎn)互信息;(5)計(jì)算每個(gè)表情符號(hào)的初始情感值;(6)對(duì)表情符號(hào)的初始情感值進(jìn)行標(biāo)準(zhǔn)化處理。該方法利用共現(xiàn)情感詞與表情符號(hào)的點(diǎn)互信息來(lái)計(jì)算并標(biāo)準(zhǔn)化表情符號(hào)的情感值,其方法簡(jiǎn)單直觀,結(jié)果準(zhǔn)確。
技術(shù)研發(fā)人員:陳雪;郭峻材
受保護(hù)的技術(shù)使用者:上海大學(xué)
文檔號(hào)碼:201610961250
技術(shù)研發(fā)日:2016.10.28
技術(shù)公布日:2017.03.15