一種信息推薦方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息交互技術(shù)領(lǐng)域,特別涉及一種信息推薦方法及裝置。
【背景技術(shù)】
[0002]在信息交互技術(shù)領(lǐng)域,基于輸入的問句,系統(tǒng)通過對(duì)問句的分析和計(jì)算,可以返回與輸入問句相關(guān)的信息。例如,在網(wǎng)頁搜索技術(shù)中,搜索引擎采用關(guān)鍵字匹配的方式返回包含所搜索關(guān)鍵字的網(wǎng)頁,以向用戶推薦相關(guān)的信息。相比之下,基于問答系統(tǒng)的信息交互方式更能向用戶提供其想獲取的答案信息,較少用戶的進(jìn)一步搜索,提升了用戶的交互體驗(yàn)。
[0003]準(zhǔn)確率和召回率是評(píng)價(jià)自動(dòng)問答系統(tǒng)的技術(shù)指標(biāo)。準(zhǔn)確率是指問答系統(tǒng)做出正確應(yīng)答的次數(shù)占總共應(yīng)答次數(shù)的比率,召回率是指自動(dòng)問答系統(tǒng)做出正確應(yīng)答的次數(shù)占知識(shí)庫中存在正確應(yīng)答數(shù)目的比率。
[0004]但目前以自然語言為基礎(chǔ)的問答交互系統(tǒng)對(duì)用戶輸入問句的語義理解能力較差,使得推薦給用戶的信息還存在準(zhǔn)確率和召回率較低的問題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明要解決的技術(shù)問題是提供一種信息推薦方法及裝置,使得推薦給用戶的答案信息準(zhǔn)確率和召回率得到提高。
[0006]為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供一種信息推薦方法,包括:
[0007]當(dāng)與用戶進(jìn)行η次問答交互后,接收用戶的當(dāng)前問句,并提取用戶輸入的每個(gè)問句對(duì)應(yīng)的核心詞,形成與用戶問句序列對(duì)應(yīng)的核心詞序列;其中η為大于0的自然數(shù);
[0008]從知識(shí)庫中搜索與所述當(dāng)前問句對(duì)應(yīng)的候選問句集;
[0009]從關(guān)聯(lián)問句序列信息庫中搜索與所述核心詞序列對(duì)應(yīng)的目標(biāo)關(guān)聯(lián)問句序列,并從所述目標(biāo)關(guān)聯(lián)問句序列中提取與所述當(dāng)前問句對(duì)應(yīng)的當(dāng)前關(guān)聯(lián)問句;
[0010]分別計(jì)算所述候選問句集中每個(gè)問句以及所述當(dāng)前關(guān)聯(lián)問句與所述當(dāng)前問句的相似度值;
[0011]當(dāng)計(jì)算得到的最大相似度值大于相似度閾值時(shí),向用戶提供所述最大相似度值對(duì)應(yīng)的問句的答案信息;
[0012]否則,當(dāng)計(jì)算得到的最大相似度值小于相似度閾值時(shí),向用戶提供所述當(dāng)前關(guān)聯(lián)問句的答案信息。
[0013]可選地,在進(jìn)行所述相似度值的計(jì)算時(shí),所述當(dāng)前關(guān)聯(lián)問句的權(quán)重大于所述候選問句集中每個(gè)問句的權(quán)重。
[0014]可選地,所述提取每個(gè)問句對(duì)應(yīng)的核心詞,形成與用戶問句序列對(duì)應(yīng)的核心詞序列包括:
[0015]通過依存分析提取用戶輸入的每個(gè)問句的核心詞,形成與所述用戶問句序列對(duì)應(yīng)的核心詞序列。
[0016]可選地,所述通過依存分析提取用戶輸入的每個(gè)問句的核心詞,包括:
[0017]通過依存分析獲取所述用戶輸入的每個(gè)問句中的各個(gè)詞語之間的依存關(guān)系,利用依存關(guān)系找到每個(gè)問句的主語和賓語;
[0018]當(dāng)所述主語為名詞時(shí),將所述主語作為核心詞;
[0019]否則,將所述賓語作為核心詞。
[0020]可選地,所述關(guān)聯(lián)問句序列信息庫通過從知識(shí)庫中進(jìn)行關(guān)聯(lián)問句序列挖掘獲得,所述知識(shí)庫用于存儲(chǔ)問答交互事務(wù)。
[0021]可選地,所述關(guān)聯(lián)問句序列信息庫通過統(tǒng)計(jì)和記錄出現(xiàn)頻次較高的用戶輸入的問句序列獲得。
[0022]可選地,所述從關(guān)聯(lián)問句序列信息庫中搜索與所述核心詞序列對(duì)應(yīng)的目標(biāo)關(guān)聯(lián)問句序列,包括:
[0023]從所述關(guān)聯(lián)問句序列信息庫中查找與所述核心詞序列相似度最高的規(guī)則序列,作為所述目標(biāo)關(guān)聯(lián)問句序列。
[0024]可選地,所述關(guān)聯(lián)問句序列信息庫通過從知識(shí)庫中進(jìn)行關(guān)聯(lián)問句序列挖掘獲得,包括:
[0025]對(duì)所述知識(shí)庫中每一個(gè)問答交互事務(wù)中的每個(gè)問句進(jìn)行分詞;
[0026]對(duì)分詞后的每個(gè)問句通過依存分析提取核心詞,將所述知識(shí)庫中每個(gè)所述問答交互事務(wù)中的每個(gè)問句的核心詞保存,得到所述知識(shí)庫的問句事務(wù)集;
[0027]獲取與所述知識(shí)庫中每個(gè)所述問句事務(wù)集的核心詞強(qiáng)關(guān)聯(lián)規(guī)則對(duì)應(yīng)的關(guān)聯(lián)問句序列,形成所述關(guān)聯(lián)問句序列信息庫。
[0028]可選地,所述對(duì)分詞后的每個(gè)問句通過依存分析提取核心詞,包括:
[0029]通過依存分析獲取所述分詞后的每個(gè)問句中各個(gè)詞語之間的依存關(guān)系,利用依存關(guān)系找到所述有效問句的主語和賓語;
[0030]當(dāng)所述主語為名詞時(shí),將所述主語作為核心詞;
[0031 ] 否則,將所述賓語作為核心詞。
[0032]可選地,所述獲取與所述知識(shí)庫中每個(gè)所述問句事務(wù)集的核心詞強(qiáng)關(guān)聯(lián)規(guī)則對(duì)應(yīng)的關(guān)聯(lián)冋句序列,包括:
[0033]根據(jù)每個(gè)所述問答交互事務(wù)中的核心詞,通過Apr1ri或FP-Tree方法獲取所述問句事務(wù)集中的核心詞強(qiáng)關(guān)聯(lián)規(guī)則,并根據(jù)所述核心詞強(qiáng)關(guān)聯(lián)規(guī)則獲取對(duì)應(yīng)的所述關(guān)聯(lián)問句序列。
[0034]可選地,所述目標(biāo)關(guān)聯(lián)問句序列包括的關(guān)聯(lián)問句的數(shù)目大于η。
[0035]可選地,所述η大于或等于3。
[0036]可選地,所述信息推薦方法采用以下方式與用戶進(jìn)行前面η次問答交互:
[0037]接收用戶的當(dāng)前問句;
[0038]從知識(shí)庫中搜索與所述當(dāng)前問句對(duì)應(yīng)的候選問句集;
[0039]分別計(jì)算所述候選問句集中每個(gè)問句與所述當(dāng)前問句的相似度值;
[0040]當(dāng)計(jì)算得到的最大相似度值大于相似度閾值時(shí),向用戶提供所述最大相似度值對(duì)應(yīng)的問句的答案信息。
[0041]本發(fā)明實(shí)施例還提供了一種信息推薦裝置,包括:
[0042]用戶問句核心詞序列獲取單元,適于當(dāng)與用戶進(jìn)行η次問答交互后,接收用戶的當(dāng)前問句,并提取用戶輸入的每個(gè)問句對(duì)應(yīng)的核心詞,形成與用戶問句序列對(duì)應(yīng)的核心詞序列;其中η為大于0的自然數(shù);
[0043]候選問句集查找單元,適于從知識(shí)庫中搜索與所述當(dāng)前問句對(duì)應(yīng)的候選問句集;
[0044]目標(biāo)關(guān)聯(lián)問句序列查找單元,適于從關(guān)聯(lián)問句序列信息庫中搜索與所述核心詞序列對(duì)應(yīng)的目標(biāo)關(guān)聯(lián)問句序列,并從所述目標(biāo)關(guān)聯(lián)問句序列中提取與所述當(dāng)前問句對(duì)應(yīng)的當(dāng)如關(guān)聯(lián)冋句;
[0045]相似度計(jì)算單元,分別計(jì)算所述候選問句集中每個(gè)問句以及所述當(dāng)前關(guān)聯(lián)問句與所述當(dāng)前問句的相似度值;
[0046]答案信息推薦單元,適于當(dāng)計(jì)算得到的最大相似度值大于相似度閾值時(shí),向用戶提供所述最大相似度值對(duì)應(yīng)的問句的答案信息;否則,當(dāng)計(jì)算得到的最大相似度值小于相似度閾值時(shí),向用戶提供所述當(dāng)前關(guān)聯(lián)問句的答案信息;
[0047]關(guān)聯(lián)問句序列信息庫獲取單元,適于獲取所述關(guān)聯(lián)問句序列信息庫,以供查找所述目標(biāo)關(guān)聯(lián)問句序列。
[0048]可選地,所述相似度計(jì)算單元在進(jìn)行所述相似度值的計(jì)算時(shí),所述當(dāng)前關(guān)聯(lián)問句的權(quán)重大于所述候選問句集中每個(gè)問句的權(quán)重。
[0049]可選地,所述用戶問句核心詞序列獲取單元:適于通過依存分析提取用戶輸入的每個(gè)問句的核心詞,形成與所述用戶問句序列對(duì)應(yīng)的核心詞序列。
[0050]可選地,所述用戶問句核心詞序列獲取單元適于:通過依存分析獲取所述用戶輸入的每個(gè)問句中的各個(gè)詞語之間的依存關(guān)系,利用依存關(guān)系找到每個(gè)問句的主語和賓語;當(dāng)所述主語為名詞時(shí),將所述主語作為核心詞;否則,將所述賓語作為核心詞。
[0051]可選地,所述關(guān)聯(lián)問句序列信息庫通過所述關(guān)聯(lián)問句序列信息庫獲取單元從知識(shí)庫中進(jìn)行關(guān)聯(lián)問句序列挖掘獲得,所述知識(shí)庫用于存儲(chǔ)問答交互事務(wù)。
[0052]可選地,所述關(guān)聯(lián)問句序列信息庫通過所述關(guān)聯(lián)問句序列信息庫獲取單元統(tǒng)計(jì)和記錄出現(xiàn)頻次較高的用戶輸入的問句序列獲得。
[0053]可選地,所述目標(biāo)關(guān)聯(lián)問句序列查找單元,適于從所述關(guān)聯(lián)問句序列信息庫中查找與所述核心詞序列相似度最高的規(guī)則序列,作為所述目標(biāo)關(guān)聯(lián)問句序列。
[0054]可選地,所述關(guān)聯(lián)問句序列信息庫獲取單元包括:分詞單元、核心詞提取單元和關(guān)聯(lián)問句序列獲取單元;
[0055]所述分詞單元,適于對(duì)所述知識(shí)庫中每一個(gè)問答交互事務(wù)中的每個(gè)問句進(jìn)行分詞;
[0056]所述核心詞提取單元,適于對(duì)分詞后的每個(gè)問句通過依存分析提取核心詞,將所述知