技術(shù)總結(jié)
本申請(qǐng)公開了一種模型訓(xùn)練方法及裝置和錯(cuò)別字識(shí)別方法及裝置。其中,該模型訓(xùn)練方法包括:從預(yù)設(shè)文本數(shù)據(jù)源中提取文本信息,其中,預(yù)設(shè)文本數(shù)據(jù)源中所包含的文本為不包含有錯(cuò)別字的文本;確定出文本信息中每個(gè)詞語(yǔ)對(duì)應(yīng)的詞向量,其中,詞向量為用于唯一表示詞語(yǔ)的多維數(shù)組;以文本信息中的語(yǔ)句為單位,將每條語(yǔ)句中的每個(gè)詞語(yǔ)對(duì)應(yīng)的詞向量輸入到記憶神經(jīng)網(wǎng)絡(luò),訓(xùn)練得到神經(jīng)網(wǎng)絡(luò)模型,其中,神經(jīng)網(wǎng)絡(luò)模型用于識(shí)別文本中的錯(cuò)別字。本申請(qǐng)解決了現(xiàn)有技術(shù)中文本中錯(cuò)別字的識(shí)別率低的技術(shù)問(wèn)題。
技術(shù)研發(fā)人員:劉粉香
受保護(hù)的技術(shù)使用者:北京國(guó)雙科技有限公司
文檔號(hào)碼:201510850128
技術(shù)研發(fā)日:2015.11.27
技術(shù)公布日:2017.06.09