技術編號:11691031
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明涉及文本處理領域,尤其涉及一種中文分詞方法及裝置。背景技術中文分詞是指將一個語句中的漢字序列拆分成多個單獨的詞語,而分詞就是將連續(xù)的字序列按照特定的規(guī)則重新組合成詞序列的過程。目前,通常是按照自然詞語對語句進行分詞。例如,“蘭州拉面”分詞后的結(jié)果為“蘭州”、“拉面”,雖然分詞后的兩個詞均符合中文邏輯,但是“蘭州”、“拉面”并不能體現(xiàn)特定語境下的中文含義,導致對語句進行分詞的精度較低。發(fā)明內(nèi)容有鑒于此,本發(fā)明實施例提供一種中文分詞方法及裝置,主要目的是提高對語句進行中文分詞的精度。借由上述技...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權(quán),增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。