技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明提供一種改進詞向量模型的語義計算方法,包括以下步驟:S1:語料預(yù)處理;S2:詞性標(biāo)注,對語料預(yù)處理后得到的詞語進行標(biāo)注詞性;S3:向量初始化,對詞性標(biāo)注后得到的詞語和詞性進行向量化;S4:上下文向量整合,對詞語的上下文詞語向量及詞性向量進行計算整合;S5:構(gòu)建哈夫曼樹并訓(xùn)練網(wǎng)絡(luò),優(yōu)化目標(biāo)函數(shù)并判斷誤差是否達到閾值;S6:向量獲取,獲取詞語向量和詞性向量;S7:向量應(yīng)用,應(yīng)用詞語向量和詞性向量進行語義計算。相比于現(xiàn)有技術(shù),本發(fā)明在向量中加入了詞性的因素,并對現(xiàn)有的Word2vec模型進行改進。同時,根據(jù)該改進后的模型進行了創(chuàng)新的應(yīng)用,拓展了Word2vec進行語義計算的功能。
技術(shù)研發(fā)人員:劉志煌;劉冶;李宏浩;傅自豪;鄺秋華
受保護的技術(shù)使用者:廣州赫炎大數(shù)據(jù)科技有限公司
技術(shù)研發(fā)日:2017.06.15
技術(shù)公布日:2017.10.24