技術(shù)總結(jié)
本發(fā)明實(shí)施例提供了一種分詞方法及裝置、檢索方法及裝置,用于提高文本分詞的準(zhǔn)確性,提高搜索命中概率。其中,所述分詞方法包括:將待分詞文本進(jìn)行分詞,并和預(yù)測詞典中的詞進(jìn)行匹配,得到第一次分詞結(jié)果和未登錄字;以所述未登錄字為基礎(chǔ),向前或向后截取一段文本作為與所述未登錄字對(duì)應(yīng)的未登錄詞;判斷所述未登錄詞是否已存在于所述第一次分詞結(jié)果中,當(dāng)所述第一次分詞結(jié)果中沒有所述未登錄詞時(shí),將所述未登錄詞添加到第一次分詞結(jié)果中,得到作為最終分詞結(jié)果的第二次分詞結(jié)果,以使得根據(jù)所述第二次分詞結(jié)果和用戶輸入的關(guān)鍵字找到多個(gè)與所述關(guān)鍵字相關(guān)的分詞。
技術(shù)研發(fā)人員:鄭佳棟;王生;李欣;周大良;王偉
受保護(hù)的技術(shù)使用者:方正國際軟件(北京)有限公司;方正國際軟件有限公司
文檔號(hào)碼:201510850300
技術(shù)研發(fā)日:2015.11.27
技術(shù)公布日:2017.06.09