,形成與用戶問句序列對應(yīng)的核心詞序列包括: 通過依存分析提取用戶輸入的每個問句的核心詞,形成與所述用戶問句序列對應(yīng)的核心詞序列。4.根據(jù)權(quán)利要求3所述的信息推薦方法,其特征在于,所述通過依存分析提取用戶輸入的每個問句的核心詞,包括: 通過依存分析獲取所述用戶輸入的每個問句中的各個詞語之間的依存關(guān)系,利用依存關(guān)系找到每個問句的主語和賓語; 當(dāng)所述主語為名詞時,將所述主語作為核心詞; 否則,將所述賓語作為核心詞。5.根據(jù)權(quán)利要求1所述的信息推薦方法,其特征在于,所述關(guān)聯(lián)問句序列信息庫通過從知識庫中進(jìn)行關(guān)聯(lián)問句序列挖掘獲得,所述知識庫用于存儲問答交互事務(wù)。6.根據(jù)權(quán)利要求1所述的信息推薦方法,其特征在于,所述關(guān)聯(lián)問句序列信息庫通過統(tǒng)計和記錄出現(xiàn)頻次較高的用戶輸入的問句序列獲得。7.根據(jù)權(quán)利要求1所述的信息推薦方法,其特征在于,所述從關(guān)聯(lián)問句序列信息庫中搜索與所述核心詞序列對應(yīng)的目標(biāo)關(guān)聯(lián)問句序列,包括: 從所述關(guān)聯(lián)問句序列信息庫中查找與所述核心詞序列相似度最高的規(guī)則序列,作為所述目標(biāo)關(guān)聯(lián)問句序列。8.根據(jù)權(quán)利要求5所述的語義推薦的方法,其特征在于,所述關(guān)聯(lián)問句序列信息庫通過從知識庫中進(jìn)行關(guān)聯(lián)問句序列挖掘獲得,包括: 對所述知識庫中每一個問答交互事務(wù)中的每個問句進(jìn)行分詞; 對分詞后的每個問句通過依存分析提取核心詞,將所述知識庫中每個所述問答交互事務(wù)中的每個問句的核心詞保存,得到所述知識庫的問句事務(wù)集; 獲取與所述知識庫中每個所述問句事務(wù)集的核心詞強關(guān)聯(lián)規(guī)則對應(yīng)的關(guān)聯(lián)問句序列,形成所述關(guān)聯(lián)問句序列信息庫。9.根據(jù)權(quán)利要求8所述的信息推薦方法,其特征在于,所述對分詞后的每個問句通過依存分析提取核心詞,包括: 通過依存分析獲取所述分詞后的每個問句中各個詞語之間的依存關(guān)系,利用依存關(guān)系找到所述有效問句的主語和賓語; 當(dāng)所述主語為名詞時,將所述主語作為核心詞; 否則,將所述賓語作為核心詞。10.根據(jù)權(quán)利要求8所述的信息推薦方法,其特征在于,所述獲取與所述知識庫中每個所述問句事務(wù)集的核心詞強關(guān)聯(lián)規(guī)則對應(yīng)的關(guān)聯(lián)問句序列,包括: 根據(jù)每個所述問答交互事務(wù)中的核心詞,通過Apr1ri或FP-Tree方法獲取所述問句事務(wù)集中的核心詞強關(guān)聯(lián)規(guī)則,并根據(jù)所述核心詞強關(guān)聯(lián)規(guī)則獲取對應(yīng)的所述關(guān)聯(lián)問句序列。11.根據(jù)權(quán)利要求1所述的信息推薦方法,其特征在于,所述目標(biāo)關(guān)聯(lián)問句序列包括的關(guān)聯(lián)問句的數(shù)目大于η。12.根據(jù)權(quán)利要求1或11所述的信息推薦方法,其特征在于,所述η大于或等于3。13.根據(jù)權(quán)利要求1所述的信息推薦方法,其特征在于,還包括:采用以下方式與用戶進(jìn)行前面η次問答交互: 接收用戶的當(dāng)前問句; 從知識庫中搜索與所述當(dāng)前問句對應(yīng)的候選問句集; 分別計算所述候選問句集中每個問句與所述當(dāng)前問句的相似度值; 當(dāng)計算得到的最大相似度值大于相似度閾值時,向用戶提供所述最大相似度值對應(yīng)的問句的答案信息。14.一種信息推薦裝置,其特征在于,包括: 用戶問句核心詞序列獲取單元,適于當(dāng)與用戶進(jìn)行η次問答交互后,接收用戶的當(dāng)前問句,并提取用戶輸入的每個問句對應(yīng)的核心詞,形成與用戶問句序列對應(yīng)的核心詞序列;其中η為大于0的自然數(shù); 候選問句集查找單元,適于從知識庫中搜索與所述當(dāng)前問句對應(yīng)的候選問句集;目標(biāo)關(guān)聯(lián)問句序列查找單元,適于從關(guān)聯(lián)問句序列信息庫中搜索與所述核心詞序列對應(yīng)的目標(biāo)關(guān)聯(lián)問句序列,并從所述目標(biāo)關(guān)聯(lián)問句序列中提取與所述當(dāng)前問句對應(yīng)的當(dāng)前關(guān)聯(lián)冋句; 相似度計算單元,分別計算所述候選問句集中每個問句以及所述當(dāng)前關(guān)聯(lián)問句與所述當(dāng)前問句的相似度值; 答案信息推薦單元,適于當(dāng)計算得到的最大相似度值大于相似度閾值時,向用戶提供所述最大相似度值對應(yīng)的問句的答案信息;否則,當(dāng)計算得到的最大相似度值小于相似度閾值時,向用戶提供所述當(dāng)前關(guān)聯(lián)問句的答案信息; 關(guān)聯(lián)問句序列信息庫獲取單元,適于獲取所述關(guān)聯(lián)問句序列信息庫,以供查找所述目標(biāo)關(guān)聯(lián)冋句序列。15.根據(jù)權(quán)利要求14所述的信息推薦裝置,其特征在于,所述相似度計算單元在進(jìn)行所述相似度值的計算時,所述當(dāng)前關(guān)聯(lián)問句的權(quán)重大于所述候選問句集中每個問句的權(quán)重。16.根據(jù)權(quán)利要求14所述的信息推薦裝置,其特征在于,所述用戶問句核心詞序列獲取單元:適于通過依存分析提取用戶輸入的每個問句的核心詞,形成與所述用戶問句序列對應(yīng)的核心詞序列。17.根據(jù)權(quán)利要求16所述的信息推薦裝置,其特征在于,所述用戶問句核心詞序列獲取單元適于:通過依存分析獲取所述用戶輸入的每個問句中的各個詞語之間的依存關(guān)系,利用依存關(guān)系找到每個問句的主語和賓語;當(dāng)所述主語為名詞時,將所述主語作為核心詞;否則,將所述賓語作為核心詞。18.根據(jù)權(quán)利要求14所述的信息推薦裝置,其特征在于,所述關(guān)聯(lián)問句序列信息庫通過所述關(guān)聯(lián)問句序列信息庫獲取單元從知識庫中進(jìn)行關(guān)聯(lián)問句序列挖掘獲得,所述知識庫用于存儲問答交互事務(wù)。19.根據(jù)權(quán)利要求14所述的信息推薦裝置,其特征在于,所述關(guān)聯(lián)問句序列信息庫通過所述關(guān)聯(lián)問句序列信息庫獲取單元統(tǒng)計和記錄出現(xiàn)頻次較高的用戶輸入的問句序列獲得。20.根據(jù)權(quán)利要求14所述的信息推薦裝置,其特征在于,所述目標(biāo)關(guān)聯(lián)問句序列查找單元,適于從所述關(guān)聯(lián)問句序列信息庫中查找與所述核心詞序列相似度最高的規(guī)則序列,作為所述目標(biāo)關(guān)聯(lián)問句序列。21.根據(jù)權(quán)利要求18所述的信息推薦裝置,其特征在于,所述關(guān)聯(lián)問句序列信息庫獲取單元包括:分詞單元、核心詞提取單元和關(guān)聯(lián)問句序列獲取單元; 所述分詞單元,適于對所述知識庫中每一個問答交互事務(wù)中的每個問句進(jìn)行分詞; 所述核心詞提取單元,適于對分詞后的每個問句通過依存分析提取核心詞,將所述知識庫中每個所述問答交互事務(wù)中的每個問句的核心詞保存,得到所述知識庫的問句事務(wù)集; 所述關(guān)聯(lián)問句序列獲取單元,適于獲取與所述知識庫中每個所述問句事務(wù)集的核心詞強關(guān)聯(lián)規(guī)則對應(yīng)的關(guān)聯(lián)問句序列,形成所述關(guān)聯(lián)問句序列信息庫。22.根據(jù)權(quán)利要求21所述的信息推薦裝置,其特征在于,所述核心詞提取單元適于:通過依存分析獲取所述分詞后的每個問句中各個詞語之間的依存關(guān)系,利用依存關(guān)系找到所述有效問句的主語和賓語;當(dāng)所述主語為名詞時,將所述主語作為核心詞;否則,將所述賓語作為核心詞。23.根據(jù)權(quán)利要求21所述的信息推薦裝置,其特征在于,所述關(guān)聯(lián)問句序列獲取單元適于:根據(jù)每個所述問答交互事務(wù)中的核心詞,通過Apr1ri或FP-Tree方法獲取所述問句事務(wù)集中的核心詞強關(guān)聯(lián)規(guī)則,并根據(jù)所述核心詞強關(guān)聯(lián)規(guī)則獲取對應(yīng)的所述關(guān)聯(lián)問句序列。24.根據(jù)權(quán)利要求14所述的信息推薦裝置,其特征在于,所述目標(biāo)關(guān)聯(lián)問句序列包括的關(guān)聯(lián)問句的數(shù)目大于η。25.根據(jù)權(quán)利要求14或24所述的信息推薦裝置,其特征在于,所述η大于或等于3。26.根據(jù)權(quán)利要求14所述的信息推薦裝置,其特征在于,還包括:前η次問答交互單元,適于接收用戶的當(dāng)前問句,從知識庫中搜索與所述當(dāng)前問句對應(yīng)的候選問句集;分別計算所述候選問句集中每個問句與所述當(dāng)前問句的相似度值;當(dāng)計算得到的最大相似度值大于相似度閾值時,向用戶提供所述最大相似度值對應(yīng)的問句的答案信息。
【專利摘要】一種信息推薦方法及裝置,所述方法包括:當(dāng)與用戶進(jìn)行n次問答交互后,接收用戶的當(dāng)前問句,并提取用戶的每個問句對應(yīng)的核心詞,形成與用戶問句序列對應(yīng)的核心詞序列;從知識庫中搜索與當(dāng)前問句對應(yīng)的候選問句集;從關(guān)聯(lián)問句序列信息庫中搜索與核心詞序列對應(yīng)的目標(biāo)關(guān)聯(lián)問句序列,并從所述目標(biāo)關(guān)聯(lián)問句序列中提取與當(dāng)前問句對應(yīng)的當(dāng)前關(guān)聯(lián)問句;分別計算所述候選問句集中每個問句及所述當(dāng)前關(guān)聯(lián)問句與當(dāng)前問句的相似度值;當(dāng)計算得到的最大相似度值大于相似度閾值時,向用戶提供最大相似度值對應(yīng)問句的答案信息;否則,當(dāng)最大相似度值小于相似度閾值時,提供當(dāng)前關(guān)聯(lián)問句的答案信息。上述方案使推薦給用戶的答案信息準(zhǔn)確率和召回率得到提高。
【IPC分類】G06F17/30
【公開號】CN105354300
【申請?zhí)枴緾N201510746440
【發(fā)明人】張昊, 朱頻頻
【申請人】上海智臻智能網(wǎng)絡(luò)科技股份有限公司
【公開日】2016年2月24日
【申請日】2015年11月5日