技術(shù)總結(jié)
本發(fā)明提出了一種檢索方法和一種檢索系統(tǒng),其中,所述方法包括:在接收到對(duì)微博語料集合中的微博文檔進(jìn)行檢索的查詢語句時(shí),根據(jù)所述查詢語句創(chuàng)建與所述查詢語句相應(yīng)的原始查詢模型;識(shí)別所述查詢語句中的目標(biāo)實(shí)體;根據(jù)與所述目標(biāo)實(shí)體相應(yīng)的目標(biāo)實(shí)體主題模型、所述原始查詢模型和根據(jù)所述微博文檔集合中的每條微博文檔建立的微博文檔語言模型,對(duì)所述原始查詢模型進(jìn)行擴(kuò)展,以得到擴(kuò)展查詢模型;統(tǒng)計(jì)所述擴(kuò)展查詢模型與所述微博文檔語言模型之間的相似度,以根據(jù)所述相似度確定所述查詢語句的目標(biāo)檢索結(jié)果。通過本發(fā)明的技術(shù)方案,使用戶可以準(zhǔn)確地在微博文檔中檢索得到目標(biāo)檢索結(jié)果,從而提高了準(zhǔn)確率,同時(shí)還可以增強(qiáng)檢索的魯棒性。
技術(shù)研發(fā)人員:強(qiáng)閏偉;范非凡;呂超;楊建武
受保護(hù)的技術(shù)使用者:北京大學(xué);北大方正集團(tuán)有限公司;北京北大方正電子有限公司
文檔號(hào)碼:201510272225
技術(shù)研發(fā)日:2015.05.25
技術(shù)公布日:2017.01.04