技術(shù)總結(jié)
本發(fā)明涉及一種大數(shù)據(jù)環(huán)境下異構(gòu)數(shù)據(jù)實(shí)時(shí)檢索方法,通過搭建海量數(shù)據(jù)索引云服務(wù),實(shí)現(xiàn)索引存儲(chǔ)負(fù)載的均衡化;通過優(yōu)化異構(gòu)數(shù)據(jù)內(nèi)容解析算法,使其解析更準(zhǔn)確;在運(yùn)用textrank時(shí)考慮到每一個(gè)頂點(diǎn)即詞的權(quán)重,再進(jìn)行下一步的投票以及迭代的操作來獲取文章的特征詞;在進(jìn)行taxtrank提取關(guān)鍵詞之前,先對(duì)數(shù)據(jù)集中的文檔進(jìn)行每個(gè)詞的權(quán)重計(jì)算,之后將這個(gè)詞的權(quán)重值作為textrank每個(gè)詞輸入,進(jìn)行下一步的計(jì)算。
技術(shù)研發(fā)人員:陳瑞;藍(lán)飛翔;張宏;左浩雷;蔣志鴻
受保護(hù)的技術(shù)使用者:北京航天長(zhǎng)峰科技工業(yè)集團(tuán)有限公司
文檔號(hào)碼:201510704836
技術(shù)研發(fā)日:2015.10.27
技術(shù)公布日:2017.05.03