技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了一種文本信息的創(chuàng)新度評(píng)估方法,對(duì)爬取的文本數(shù)據(jù)進(jìn)行分詞預(yù)處理;使用預(yù)處理數(shù)據(jù)訓(xùn)練LDA模型,實(shí)現(xiàn)以行業(yè)為主題的分類,用以把不同行業(yè)的文本進(jìn)行區(qū)分,使得訓(xùn)練好的模型包含每個(gè)行業(yè)類別的關(guān)鍵詞的模型文件;按照時(shí)間順序,構(gòu)建一個(gè)由預(yù)處理數(shù)據(jù)里的抽取的關(guān)鍵知識(shí)和技術(shù)信息組成的知識(shí)網(wǎng)絡(luò),并且每隔固定時(shí)間不斷更新;使用按照時(shí)間排序的預(yù)處理數(shù)據(jù),提取每一篇文獻(xiàn)的屬性信息,并構(gòu)建一個(gè)文獻(xiàn)文本結(jié)構(gòu)網(wǎng)絡(luò),并確定各個(gè)文獻(xiàn)的創(chuàng)新類型;利用訓(xùn)練好的LDA模型分析專利數(shù)據(jù)里面的技術(shù)和知識(shí)關(guān)鍵詞分別屬于的行業(yè),綜合文獻(xiàn)文本結(jié)構(gòu)網(wǎng)絡(luò)的屬性信息,構(gòu)成多維度指標(biāo)以評(píng)估創(chuàng)新度。
技術(shù)研發(fā)人員:郭偉;張盤龍;鹿旭東;崔立真
受保護(hù)的技術(shù)使用者:山東大學(xué)
技術(shù)研發(fā)日:2017.07.05
技術(shù)公布日:2017.11.03