技術(shù)總結(jié)
本發(fā)明公開(kāi)了一種基于貝葉斯分詞算法的中文地址語(yǔ)義標(biāo)注方法,包括步驟S1:預(yù)設(shè)置針對(duì)中文地址數(shù)據(jù)進(jìn)行語(yǔ)義標(biāo)注的標(biāo)注關(guān)系表;步驟S2:獲取預(yù)切分、標(biāo)注好的訓(xùn)練語(yǔ)料;步驟S3:對(duì)訓(xùn)練語(yǔ)料進(jìn)行統(tǒng)計(jì)學(xué)習(xí)得到詞頻詞典、標(biāo)注關(guān)系詞典、標(biāo)注模式表;步驟S4:輸入待標(biāo)注地址字符串進(jìn)行全切分;步驟S5:根據(jù)詞頻詞典及貝葉斯分詞算法獲取概率最大的分詞方案;步驟S6:根據(jù)標(biāo)注關(guān)系詞典對(duì)分詞方案進(jìn)行標(biāo)注得到標(biāo)注結(jié)果。標(biāo)注關(guān)系表設(shè)定了一個(gè)規(guī)范化的標(biāo)注模板;通過(guò)統(tǒng)計(jì)學(xué)習(xí)訓(xùn)練語(yǔ)料獲得了包含詞頻詞典、標(biāo)注關(guān)系詞典以及標(biāo)注模式表的數(shù)據(jù)庫(kù);根據(jù)前述訓(xùn)練數(shù)據(jù)庫(kù)匹配得到標(biāo)注好的具有語(yǔ)義信息的中文地址,快速準(zhǔn)確地完成了針對(duì)中文地址數(shù)據(jù)的語(yǔ)義解析。
技術(shù)研發(fā)人員:黃爽;李曉林;謝婷婷;嚴(yán)柯;劉志杰;段艷會(huì);張玉敏
受保護(hù)的技術(shù)使用者:武漢工程大學(xué)
文檔號(hào)碼:201610880863
技術(shù)研發(fā)日:2016.10.09
技術(shù)公布日:2017.03.22