技術(shù)特征:
技術(shù)總結(jié)
本申請實(shí)施例公開了詞向量處理方法、裝置以及電子設(shè)備。所述方法包括:對語料分詞得到各詞;確定所述各詞對應(yīng)的各n元倉頡碼字符,所述n元倉頡碼字符表征其對應(yīng)的詞的連續(xù)n個(gè)倉頡碼字符;建立并初始化所述各詞的詞向量,以及所述各詞對應(yīng)的各n元倉頡碼字符的倉頡碼字符向量;根據(jù)所述詞向量、所述倉頡碼字符向量,以及分詞后的所述語料,對所述詞向量和所述倉頡碼字符向量進(jìn)行訓(xùn)練。利用本申請實(shí)施例,可以實(shí)現(xiàn)通過詞對應(yīng)的n元倉頡碼字符更精細(xì)地表現(xiàn)該詞的特征,尤其可以表現(xiàn)該詞的字形形態(tài)特征,進(jìn)而有利于提高中文詞的詞向量的準(zhǔn)確度,實(shí)用效果較好。
技術(shù)研發(fā)人員:曹紹升;周俊
受保護(hù)的技術(shù)使用者:阿里巴巴集團(tuán)控股有限公司
技術(shù)研發(fā)日:2017.06.09
技術(shù)公布日:2017.10.13