技術(shù)總結(jié)
本發(fā)明提供一種基于用戶搜索日志的興趣實(shí)體獲得方法及裝置。本發(fā)明實(shí)施例通過對(duì)待匹配的Session段中所包括的每個(gè)所述用戶搜索日志的query和title進(jìn)行切詞處理,以獲得每個(gè)所述用戶搜索日志的第一term,進(jìn)而根據(jù)預(yù)先設(shè)置的實(shí)體庫,匹配出與每個(gè)所述用戶搜索日志的第一term相關(guān)的候選實(shí)體,使得能夠利用所述Session段的特征、所述候選實(shí)體的特征、以及所述Session段與所述候選實(shí)體的關(guān)聯(lián)特征中的至少一項(xiàng),對(duì)所述候選實(shí)體進(jìn)行過濾,以獲得興趣實(shí)體,由于采用相關(guān)匹配方法即匹配出與每個(gè)所述用戶搜索日志的第一term相關(guān)的候選實(shí)體,而不再采用完整匹配方法即直接匹配出完整的興趣實(shí)體的名稱,從而提高了興趣實(shí)體的召回率。
技術(shù)研發(fā)人員:戴岱;李大任
受保護(hù)的技術(shù)使用者:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
文檔號(hào)碼:201310298364
技術(shù)研發(fā)日:2013.07.16
技術(shù)公布日:2017.06.06