亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

問答頁面相關(guān)問題推薦方法及裝置制造方法

文檔序號:6640214閱讀:213來源:國知局
問答頁面相關(guān)問題推薦方法及裝置制造方法
【專利摘要】本發(fā)明提供了一種問答頁面相關(guān)問題推薦方法及裝置。其中,該方法包括:根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與搜索詞相關(guān)的至少一個相關(guān)問題;根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選;根據(jù)相關(guān)問題的篩選結(jié)果,確定推薦給用戶的相關(guān)問題。依據(jù)本發(fā)明實(shí)施例的問答頁面相關(guān)問題推薦方法,能夠得到更準(zhǔn)確、更貼合用戶需要的相關(guān)問題,因此能夠提高問答頁面檢索的準(zhǔn)確性。
【專利說明】問答頁面相關(guān)問題推薦方法及裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及搜索【技術(shù)領(lǐng)域】,特別是涉及一種問答頁面相關(guān)問題推薦方法及裝置。

【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,互聯(lián)網(wǎng)數(shù)據(jù)早已呈現(xiàn)爆炸性增長的趨勢,人們對知識的需求越來越渴望,越來越多的人們開始使用搜索引擎搜索來滿足對未知知識的查詢與搜索。大型搜索引擎(比如谷歌google、360、百度等)可以很方便快捷的提供相關(guān)問答的搜索。其中相關(guān)問答搜索是指用戶輸入一個問題,搜索引擎檢索與該問題相對應(yīng)的答案。在不同的問答知識頁面,不僅提供了針對用戶輸入的問題進(jìn)行回答的相關(guān)答復(fù)內(nèi)容,還提供了與當(dāng)前問答頁面的用戶輸入問題相關(guān)的問題鏈接,供用戶參考使用,方便用戶在進(jìn)行問答搜索時從不同角度綜合得到該問題的解決答案。
[0003]例如:當(dāng)前問答頁面的搜索問題為:“感冒咳嗽怎么辦? ”在當(dāng)前問答頁面為用戶推薦的相關(guān)問題可以包括:“感冒怎么辦? ”,“感冒咳嗽流鼻涕怎么辦? ”,“小孩感冒咳嗽怎么辦? ”,等等。
[0004]現(xiàn)有技術(shù)中獲取相關(guān)問題時,一般是根據(jù)用戶輸入的搜索詞作為核心詞來進(jìn)行獲取的,這種方式比較簡單直接,但獲取到的相關(guān)問題與用戶輸入的問題的相關(guān)度并不是很好,往往不能很好地滿足用戶的需求,也就是說,其所獲取的相關(guān)問題與用戶真正想要獲得的問題答案之間的匹配度比較差,導(dǎo)致問答頁面問題檢索的準(zhǔn)確性比較差,與用戶需求的貼合性比較差,不能解決用戶想在當(dāng)前問答頁面查看與所檢索的問題更貼近的、更吻合的問題答案的檢索匹配需求。
[0005]因此,如何獲取更合適的相關(guān)問題推薦給用戶,成為問答頁面相關(guān)問題獲取推薦過程中亟待解決的技術(shù)問題。


【發(fā)明內(nèi)容】

[0006]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的問答頁面相關(guān)問題推薦方法及裝置。
[0007]依據(jù)本發(fā)明的一個方面,提供了一種問答頁面相關(guān)問題推薦方法,包括:根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與所述搜索詞相關(guān)的至少一個相關(guān)問題;根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的所述相關(guān)問題進(jìn)行篩選;根據(jù)所述相關(guān)問題的篩選結(jié)果,確定問答頁面推薦給用戶的相關(guān)問題。
[0008]可選地,所述至少一個預(yù)設(shè)規(guī)則包括下列至少之一:根據(jù)核心詞對所述相關(guān)問題進(jìn)行篩選;根據(jù)用戶的瀏覽行為日志對所述相關(guān)問題進(jìn)行篩選;根據(jù)用戶的搜索點(diǎn)擊行為日志對所述相關(guān)問題進(jìn)行篩選。
[0009]可選地,所述根據(jù)核心詞對所述相關(guān)問題進(jìn)行篩選,包括:獲取與所述搜索詞對應(yīng)的問答頁面;提取所述問答頁面中的核心詞,并根據(jù)所述核心詞篩選所述相關(guān)問題。
[0010]可選地,提取所述問答頁面中的至少一個核心詞,包括:從問答頁面中提取核心詞候選串;對所述核心詞候選串進(jìn)行分詞,提取各個候選串分詞的分類特征;根據(jù)所述分類特征篩選各個候選串分詞是否是核心詞。
[0011]可選地,從問答頁面中提取核心詞候選串,包括:從所述問答頁面的標(biāo)題中提取核心詞候選串;和/或,從所述問答頁面的頁面內(nèi)容中,提取與所述搜索詞相關(guān)的字符串,作為核心詞候選串。
[0012]可選地,提取與所述搜索詞相關(guān)的字符串,包括:對所述搜索詞進(jìn)行分詞;從所述問答頁面的頁面內(nèi)容中提取包括至少一個搜索詞分詞的字符串。
[0013]可選地,根據(jù)所述分類特征篩選各個候選串分詞是否是核心詞,包括:根據(jù)所述分類特征對候選串分詞進(jìn)行分類,根據(jù)分類結(jié)果確定各個候選串分詞是否是核心詞;所述分類特征包括下列特征中的至少一種:名詞、熱度詞表、超鏈接、相關(guān)問題共現(xiàn)率、文檔詞頻。
[0014]可選地,根據(jù)分類結(jié)果確定各個候選串分詞是否是核心詞,具體包括:針對每個分類,將該分類中各個候選串分詞與用戶輸入的搜索詞進(jìn)行匹配,篩選出匹配度最高的設(shè)定數(shù)量的候選串分詞,作為所述核心詞;針對每個分類,根據(jù)該分類中各個候選串分詞的使用頻率統(tǒng)計值,篩選出所述使用頻率統(tǒng)計值最高的設(shè)定數(shù)量的候選串分詞,作為所述核心詞;其中,候選串分詞的使用頻率統(tǒng)計值包括下列參數(shù)之一:被搜索次數(shù)、被點(diǎn)擊次數(shù)、曾作為核心詞的次數(shù)、曾作為搜索詞的次數(shù)。
[0015]可選地,所述根據(jù)用戶的瀏覽行為日志對所述相關(guān)問題進(jìn)行篩選,包括:根據(jù)選定時間段內(nèi)用戶的瀏覽行為日志,確定獲取的所述相關(guān)問題的瀏覽權(quán)重;根據(jù)所述瀏覽權(quán)重對所述相關(guān)問題進(jìn)行排序;根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選。
[0016]可選地,所述根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選,包括:根據(jù)所述排序結(jié)果提取第一預(yù)定個數(shù)個所述相關(guān)問題。
[0017]可選地,所述根據(jù)選定時間段內(nèi)用戶的瀏覽行為日志,確定獲取的所述相關(guān)問題的瀏覽權(quán)重,包括:根據(jù)瀏覽所述相關(guān)問題的瀏覽用戶,對獲取的相關(guān)問題進(jìn)行分組;其中,每個相關(guān)問題分組中包括一個瀏覽用戶對應(yīng)的部分或者全部相關(guān)問題;在每個相關(guān)問題分組中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重;獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)瀏覽權(quán)重,將獲取到的相關(guān)瀏覽權(quán)重進(jìn)行加權(quán),得到獲取的每個相關(guān)問題的瀏覽權(quán)重。
[0018]可選地,根據(jù)瀏覽所述相關(guān)問題的瀏覽用戶,對獲取的相關(guān)問題進(jìn)行分組,包括:根據(jù)選定時間段內(nèi)的瀏覽行為日志,得到每個瀏覽用戶的瀏覽特征向量{T1、T2、……、T1、Ti+1、……、Τη},其中,Ti表示一個相關(guān)問題。
[0019]可選地,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重,包括:在每個相關(guān)問題分組中,根據(jù)瀏覽用戶瀏覽每個相關(guān)問題的瀏覽時間對該相關(guān)問題分組中的所有相關(guān)問題進(jìn)行排序;根據(jù)排序結(jié)果中,劃分瀏覽時間間隔小于預(yù)設(shè)的時間間隔閾值的相關(guān)問題至同一會話組;在每個會話組中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重。
[0020]可選地,所述瀏覽特征向量中的元素Ti的屬性包括下列參數(shù)中的至少一個:問答頁面的生成時間、答案數(shù)、好評數(shù)、差評數(shù)、問答長度、用戶瀏覽時間、用戶停留時間等。
[0021]可選地,所述根據(jù)用戶的搜索點(diǎn)擊行為日志對所述相關(guān)問題進(jìn)行篩選,包括:根據(jù)選定時間段內(nèi)用戶的搜索點(diǎn)擊日志,確定獲取的所述相關(guān)問題的點(diǎn)擊權(quán)重;根據(jù)所述點(diǎn)擊權(quán)重對獲取的相關(guān)問題進(jìn)行排序;根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選。
[0022]可選地,所述根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選,包括:根據(jù)所述排序結(jié)果提取第二預(yù)定個數(shù)個所述相關(guān)問題。
[0023]可選地,根據(jù)設(shè)定時間段內(nèi)用戶的搜索點(diǎn)擊日志,確定獲取的所述相關(guān)問題的點(diǎn)擊權(quán)重,包括:根據(jù)所述相關(guān)問題對應(yīng)的查詢請求串,對獲取的所述相關(guān)問題進(jìn)行分組;其中,每個相關(guān)問題分組中包括一個查詢請求串對應(yīng)的部分或全部相關(guān)問題;在每個相關(guān)問題分組中,計算組中每個相關(guān)問題與組中其他相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重;獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)點(diǎn)擊權(quán)重,將獲取到的相關(guān)點(diǎn)擊權(quán)重進(jìn)行加權(quán),得到獲取的每個相關(guān)問題的點(diǎn)擊權(quán)重。
[0024]可選地,根據(jù)所述相關(guān)問題對應(yīng)的查詢請求串,對獲取的所述相關(guān)問題進(jìn)行分組,包括:根據(jù)所述相關(guān)問題對應(yīng)的查詢請求串,得到每個查詢請求串的點(diǎn)擊特征向量{T1、T2、……、T1、Ti+l、……、Τη},其中Ti表示一個相關(guān)問題。
[0025]可選地,點(diǎn)擊特征向量中的元素Ti的屬性包括下列參數(shù)中的至少一個:問答頁面的生成時間、答案數(shù)、好評數(shù)、差評數(shù)、問答長度、展示次數(shù)、被點(diǎn)擊次數(shù)等。
[0026]依據(jù)本發(fā)明的另一方面,還提供了一種問答頁面相關(guān)問題推薦裝置,包括:獲取器,適于根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與所述搜索詞相關(guān)的至少一個相關(guān)問題;篩選器,適于根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的所述相關(guān)問題進(jìn)行篩選;推薦器,適于根據(jù)所述相關(guān)問題的篩選結(jié)果,確定問答頁面推薦給用戶的相關(guān)問題。
[0027]可選地,所述篩選器還包括:第一篩選模塊,適于根據(jù)用戶的瀏覽行為日志對所述相關(guān)問題進(jìn)行篩選;第二篩選模塊,適于根據(jù)用戶的搜索點(diǎn)擊行為日志對所述相關(guān)問題進(jìn)行篩選;第三篩選模塊,適于根據(jù)核心詞對所述相關(guān)問題進(jìn)行篩選;。
[0028]可選地,所述第三篩選模塊還還包括:獲取單元,適于獲取與所述搜索詞對應(yīng)的問答頁面;提取單元,適于提取所述問答頁面中的核心詞;確定單元,適于根據(jù)所述核心詞篩選所述相關(guān)問題。
[0029]可選地,所述提取單元還適于:從問答頁面中提取核心詞候選串;對所述核心詞候選串進(jìn)行分詞,提取各個候選串分詞的分類特征;根據(jù)所述分類特征篩選各個候選串分詞是否是核心詞。
[0030]可選地,所述提取單元還適于:從所述問答頁面的標(biāo)題中提取核心詞候選串;和/或,從所述問答頁面的頁面內(nèi)容中,提取與所述搜索詞相關(guān)的字符串,作為核心詞候選串。
[0031]可選地,所述提取單元還適于:對所述搜索詞進(jìn)行分詞;從所述問答頁面的頁面內(nèi)容中提取包括至少一個搜索詞分詞的字符串。
[0032]可選地,所述提取單元還適于:根據(jù)所述分類特征對候選串分詞進(jìn)行分類,根據(jù)分類結(jié)果確定各個候選串分詞是否是核心詞;所述分類特征包括下列特征中的至少一種:名詞、熱度詞表、超鏈接、相關(guān)問題共現(xiàn)率、文檔詞頻。
[0033]可選地,所述提取單元還適于:針對每個分類,將該分類中各個候選串分詞與用戶輸入的搜索詞進(jìn)行匹配,篩選出匹配度最高的設(shè)定數(shù)量的候選串分詞,作為所述核心詞;針對每個分類,根據(jù)該分類中各個候選串分詞的使用頻率統(tǒng)計值,篩選出所述使用頻率統(tǒng)計值最高的設(shè)定數(shù)量的候選串分詞,作為所述核心詞;其中,候選串分詞的使用頻率統(tǒng)計值包括下列參數(shù)之一:被搜索次數(shù)、被點(diǎn)擊次數(shù)、曾作為核心詞的次數(shù)、曾作為搜索詞的次數(shù)。
[0034]可選地,所述第一篩選模塊還包括:第一權(quán)重確定單元,適于根據(jù)選定時間段內(nèi)用戶的瀏覽行為日志,確定獲取的所述相關(guān)問題的瀏覽權(quán)重;第一排序單元,適于根據(jù)所述瀏覽權(quán)重對獲取的相關(guān)問題進(jìn)行排序;第一篩選單元,適于根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選。
[0035]可選地,所述第一篩選單元還適于:根據(jù)所述排序結(jié)果提取第一預(yù)定個數(shù)個所述相關(guān)問題。
[0036]可選地,所述第一權(quán)重確定單元還適于:根據(jù)瀏覽所述相關(guān)問題的瀏覽用戶,對獲取的相關(guān)問題進(jìn)行分組;其中,每個相關(guān)問題分組中包括一個瀏覽用戶對應(yīng)的部分或者全部相關(guān)問題;在每個相關(guān)問題分組中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重;獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)瀏覽權(quán)重,將獲取到的相關(guān)瀏覽權(quán)重進(jìn)行加權(quán),得到獲取的每個相關(guān)問題的瀏覽權(quán)重。
[0037]可選地,所述第一權(quán)重確定單元還適于:根據(jù)選定時間段內(nèi)的瀏覽行為日志,得到每個瀏覽用戶的瀏覽特征向量{T1、T2、……、T1、Ti+l、……、Tn},其中,Ti表示一個相關(guān)冋題。
[0038]可選地,所述第一權(quán)重確定單元還適于:在每個相關(guān)問題分組中,根據(jù)瀏覽用戶瀏覽每個相關(guān)問題的瀏覽時間對該相關(guān)問題分組中的所有相關(guān)問題進(jìn)行排序;根據(jù)排序結(jié)果中,劃分瀏覽時間間隔小于預(yù)設(shè)的時間間隔閾值的相關(guān)問題至同一會話組;在每個會話組中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重。
[0039]可選地,所述第二篩選模塊還包括:第二權(quán)重確定單元,適于根據(jù)選定時間段內(nèi)用戶的搜索點(diǎn)擊日志,確定獲取的所述相關(guān)問題的點(diǎn)擊權(quán)重;第二排序單元,適于根據(jù)所述點(diǎn)擊權(quán)重對獲取的相關(guān)問題進(jìn)行排序;第二篩選單元,適于根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選。
[0040]可選地,所述第二權(quán)重確定單元還適于:根據(jù)所述相關(guān)問題對應(yīng)的查詢請求串,對獲取的所述相關(guān)問題進(jìn)行分組;其中,每個相關(guān)問題分組中包括一個查詢請求串對應(yīng)的部分或全部相關(guān)問題;在每個相關(guān)問題分組中,計算組中每個相關(guān)問題與組中其他相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重;獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)點(diǎn)擊權(quán)重,將獲取到的相關(guān)點(diǎn)擊權(quán)重進(jìn)行加權(quán),得到獲取的每個相關(guān)問題的點(diǎn)擊權(quán)重。
[0041]可選地,所述第二權(quán)重確定單元還適于:根據(jù)所述相關(guān)問題對應(yīng)的查詢請求串,得到每個查詢請求串的點(diǎn)擊特征向量{Tl、Τ2、......、Τη},實(shí)現(xiàn)對獲取的相關(guān)問題進(jìn)行分組;
其中Ti表示一個相關(guān)問題。
[0042]可選地,所述第二權(quán)重確定單元還適于:
[0043]得到的點(diǎn)擊特征向量中的元素Ti的屬性包括下列參數(shù)中的至少一個:
[0044]問答頁面的生成時間、答案數(shù)、好評數(shù)、差評數(shù)、問答長度、展示次數(shù)、被點(diǎn)擊次數(shù)等。
[0045]依據(jù)本發(fā)明實(shí)施例的問答頁面相關(guān)問題推薦方法,能夠根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與搜索詞相關(guān)的至少一個相關(guān)問題,并根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選,根據(jù)篩選結(jié)果確定推薦給用戶的相關(guān)問題??芍?,依據(jù)本發(fā)明實(shí)施例的問答頁面相關(guān)問題推薦方法,在獲取到與搜索詞相關(guān)的相關(guān)問題后,利用預(yù)設(shè)規(guī)則對相關(guān)問題進(jìn)行篩選,得到能夠更好地反映用戶輸入的搜索詞的相關(guān)問題,從而獲取到用戶真正想要獲得的問題答案。另外,本例中利用至少一個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選,即,本例中可以利用多個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選。而利用多個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行多次篩選,能夠得到更準(zhǔn)確、更貼合用戶需要的相關(guān)問題,因此能夠提高問答頁面檢索的準(zhǔn)確性。
[0046]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
[0047]根據(jù)下文結(jié)合附圖對本發(fā)明具體實(shí)施例的詳細(xì)描述,本領(lǐng)域技術(shù)人員將會更加明了本發(fā)明的上述以及其他目的、優(yōu)點(diǎn)和特征。

【專利附圖】

【附圖說明】
[0048]通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0049]圖1示出了根據(jù)本發(fā)明一個實(shí)施例的問答頁面相關(guān)問題推薦方法的處理流程圖;
[0050]圖2示出了根據(jù)本發(fā)明一個實(shí)施例的根據(jù)核心詞篩選相關(guān)問題并推薦的處理流程圖;
[0051]圖3示出了根據(jù)本發(fā)明另一個實(shí)施例的根據(jù)核心詞篩選相關(guān)問題并推薦的處理流程圖;
[0052]圖4示出了根據(jù)本發(fā)明又一個實(shí)施例的根據(jù)核心詞篩選相關(guān)問題并推薦的處理流程圖;
[0053]圖5示出了根據(jù)本發(fā)明一個實(shí)施例的根據(jù)用戶的瀏覽行為日志對相關(guān)問題進(jìn)行篩選并推薦的處理流程圖;
[0054]圖6示出了根據(jù)本發(fā)明另一個實(shí)施例的根據(jù)用戶的瀏覽行為日志對相關(guān)問題進(jìn)行篩選并推薦的處理流程圖;
[0055]圖7示出了根據(jù)本發(fā)明一個實(shí)施例的根據(jù)用戶的搜索點(diǎn)擊行為日志對相關(guān)問題進(jìn)行篩選并推薦的處理流程圖;
[0056]圖8示出了根據(jù)本發(fā)明另一個實(shí)施例的根據(jù)用戶的搜索點(diǎn)擊行為日志對相關(guān)問題進(jìn)行篩選并推薦的處理流程圖;
[0057]圖9示出了根據(jù)本發(fā)明一個實(shí)施例的實(shí)現(xiàn)問答頁面相關(guān)問題推薦的系統(tǒng)環(huán)境示意圖;
[0058]圖10示出了根據(jù)本發(fā)明一個優(yōu)選實(shí)施例的根據(jù)以上三項(xiàng)預(yù)設(shè)規(guī)則對相關(guān)問題進(jìn)行篩選并推薦的處理流程示意圖;
[0059]圖11示出了根據(jù)本發(fā)明一個實(shí)施例的問答頁面相關(guān)問題推薦裝置的結(jié)構(gòu)示意圖;以及
[0060]圖12示出了根據(jù)本發(fā)明一個優(yōu)選實(shí)施例的問答頁面相關(guān)問題推薦裝置的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0061]下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0062]為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供了一種問答頁面相關(guān)問題推薦方法。圖1示出了根據(jù)本發(fā)明一個實(shí)施例的問答頁面相關(guān)問題推薦方法的處理流程圖。參見圖1,該流程至少包括步驟S102至步驟S106。
[0063]步驟S102、根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與搜索詞相關(guān)的至少一個相關(guān)問題;
[0064]步驟S104、根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選;
[0065]步驟S106、根據(jù)相關(guān)問題的篩選結(jié)果,確定問答頁面推薦給用戶的相關(guān)問題。
[0066]依據(jù)本發(fā)明實(shí)施例的問答頁面相關(guān)問題推薦方法,能夠根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與搜索詞相關(guān)的至少一個相關(guān)問題,并根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選,根據(jù)篩選結(jié)果確定推薦給用戶的相關(guān)問題??芍?,依據(jù)本發(fā)明實(shí)施例的問答頁面相關(guān)問題推薦方法,在獲取到與搜索詞相關(guān)的相關(guān)問題后,利用預(yù)設(shè)規(guī)則對相關(guān)問題進(jìn)行篩選,得到能夠更好地反映用戶輸入的搜索詞的相關(guān)問題,從而獲取到用戶真正想要獲得的問題答案。另外,本例中利用至少一個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選,即,本例中可以利用多個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選。而利用多個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行多次篩選,能夠得到更準(zhǔn)確、更貼合用戶需要的相關(guān)問題,因此能夠提高問答頁面檢索的準(zhǔn)確性。
[0067]上文提及,為保證能夠?yàn)橛脩籼峁└N合用戶需求的檢索結(jié)果,本發(fā)明實(shí)施例根據(jù)至少一個預(yù)設(shè)規(guī)則對與搜索詞相關(guān)的相關(guān)問題進(jìn)行篩選。本例中,對相關(guān)問題進(jìn)行篩選所依據(jù)的預(yù)設(shè)規(guī)則可以是任意能夠?qū)ο嚓P(guān)問題進(jìn)行進(jìn)一步篩選的規(guī)則。例如,預(yù)設(shè)規(guī)則可以是根據(jù)用戶行為日志對相關(guān)問題進(jìn)行篩選,還可以是根據(jù)搜索詞與相關(guān)問題的貼合程度對相關(guān)問題進(jìn)行篩選。
[0068]本發(fā)明實(shí)施例中,優(yōu)選根據(jù)以下預(yù)設(shè)規(guī)則對相關(guān)問題進(jìn)行篩選:
[0069](I)根據(jù)核心詞對相關(guān)問題進(jìn)行篩選;
[0070](2)根據(jù)用戶的瀏覽行為日志對相關(guān)問題進(jìn)行篩選;
[0071](3)根據(jù)用戶的搜索點(diǎn)擊行為日志對相關(guān)問題進(jìn)行篩選。
[0072]另外,本例中可以僅根據(jù)以上預(yù)設(shè)規(guī)則中的一項(xiàng)對相關(guān)問題進(jìn)行篩選,還可以根據(jù)以上預(yù)設(shè)規(guī)則中的幾項(xiàng)或全部對相關(guān)問題進(jìn)行篩選。之后,根據(jù)篩選結(jié)果確定推薦給用戶的相關(guān)問題。在根據(jù)以上預(yù)設(shè)規(guī)則中的幾項(xiàng)或全部對相關(guān)問題進(jìn)行篩選時,先根據(jù)各預(yù)設(shè)規(guī)則分別對相關(guān)問題進(jìn)行篩選,之后擬合各個篩選結(jié)果得到推薦給用戶的相關(guān)問題,可見,在根據(jù)多個預(yù)設(shè)規(guī)則對相關(guān)問題進(jìn)行篩選時,仍舊需要進(jìn)行單個預(yù)設(shè)規(guī)則對相關(guān)問題進(jìn)行篩選的過程。因此,本例中,對根據(jù)各個預(yù)設(shè)規(guī)則分別對相關(guān)問題進(jìn)行篩選,并根據(jù)篩選結(jié)果確定推薦給用戶的相關(guān)問題的過程進(jìn)行介紹。
[0073](I)根據(jù)核心詞對相關(guān)問題進(jìn)行篩選,并根據(jù)篩選結(jié)果確定推薦的相關(guān)問題。
[0074]現(xiàn)有技術(shù)中,僅根據(jù)搜索詞進(jìn)行檢索,存在由于檢索時在搜索詞中提取的核心詞不合適,而導(dǎo)致不能獲取到匹配度較高的、更貼合用戶需求的問答問題答案的問題,因此,本例中,首先獲取與搜索詞對應(yīng)的問答頁面。其次,提取問答頁面中的核心詞,并根據(jù)提取的核心詞篩選相關(guān)問題。
[0075]實(shí)施例一
[0076]圖2示出了根據(jù)本發(fā)明一個實(shí)施例的根據(jù)核心詞篩選相關(guān)問題并推薦的處理流程圖。參見圖2,該流程包括如下步驟:
[0077]步驟S201:根據(jù)用戶輸入的搜索詞獲取對應(yīng)的問答頁面及相關(guān)問題。
[0078]步驟S202:從問答頁面中提取核心詞候選串。
[0079]提取核心詞時,從問答頁面中提取用于確定核心詞的核心詞候選串,從候選串中篩選出符合條件的核心詞。
[0080]從問答頁面中提取核心詞候選串,可以從問答頁面的標(biāo)題中提取核心詞候選串,也可以從問答頁面的頁面內(nèi)容中提取,或者從問答頁面的標(biāo)題和問答頁面的頁面內(nèi)容中提取。
[0081]從問答頁面中提取核心詞候選串,包括:獲取與用戶輸入的搜索詞對應(yīng)的問答頁面;從獲取的問答頁面的標(biāo)題中提取核心詞候選串。和/或從獲取的問答頁面的頁面內(nèi)容中,提取與用戶輸入的搜索詞相關(guān)的字符串,作為核心詞候選串。
[0082]步驟S203:對提取的核心詞候選串進(jìn)行分詞,提取各個候選串分詞的分類特征。
[0083]提取到問答頁面的核心詞候選串后,進(jìn)行分詞處理,將每一個候選串分詞劃分為若干候選串分詞,并提取出這些候選串分詞的分類特征。其中,候選串分詞的分類特征包括下列特征中的至少一種:名詞、熱度詞表、超鏈接、相關(guān)問題共現(xiàn)率、文檔詞頻等等。
[0084]步驟S204:根據(jù)提取出的分類特征篩選各個候選串分詞是否是核心詞。
[0085]提取出候選串分詞的分類特征后,根據(jù)分類特征對候選串分詞進(jìn)行分類,并根據(jù)分類結(jié)果確定各個候選串分詞是否是核心詞。
[0086]如上所述,候選串分詞的分類特征包括名詞、熱度詞表、超鏈接、相關(guān)問題共現(xiàn)率、文檔詞頻等特征中的至少一種,則可以候選串分詞中所有的名詞歸為一類,將候選串分詞中在熱度詞表中的分詞歸為一類,將候選串分詞匯中是超級鏈接的分詞歸為一類,或者也可以將候選串分詞中在熱度詞表中的所有名詞歸為一類,……,等等。
[0087]對候選串分詞進(jìn)行分類后,可以根據(jù)分類結(jié)果,進(jìn)行核心詞的篩選,比如,根據(jù)各個分類中各個候選串分詞與用戶輸入的搜索詞的匹配程度進(jìn)行篩選,或者根據(jù)各個分類中各個候選串分詞的使用頻率統(tǒng)計值等因素進(jìn)行篩選,或者綜合考慮上述各種因素進(jìn)行篩選。
[0088]其中,候選串分詞的使用頻率統(tǒng)計值包括下列參數(shù)之一:被搜索次數(shù)、被點(diǎn)擊次數(shù)、曾作為核心詞的次數(shù)、曾作為搜索詞的次數(shù)??梢越?shù)據(jù)庫,統(tǒng)計候選串分詞被用戶搜索的次數(shù),被用戶點(diǎn)擊的次數(shù)曾經(jīng)被確定為核心詞的次數(shù)、曾經(jīng)被用戶用作搜索詞的次數(shù)等。
[0089]步驟S205:利用步驟S204中確定的核心詞篩選步驟S201中獲取到的相關(guān)問題。
[0090]實(shí)施例二
[0091]圖3示出了根據(jù)本發(fā)明另一個實(shí)施例的根據(jù)核心詞篩選相關(guān)問題并推薦的處理流程圖,如圖3所示,包括如下步驟:
[0092]步驟S301:獲取與用戶輸入的搜索詞對應(yīng)的問答頁面及相關(guān)問題。
[0093]例如:用戶輸入搜索詞“孩子感冒咳嗽怎么辦? ”,根據(jù)該搜索詞獲取到對應(yīng)的問答頁面,獲取到的問答頁面上有問答頁面的標(biāo)題,至少一個問題答案,至少一個相關(guān)問題。比如相關(guān)問題可以是“孩子感冒咳嗽怎么辦? ”,“小兒感冒咳嗽用什么藥比較好呢? ”。
[0094]步驟S302:從獲取的問答頁面的標(biāo)題中提取核心詞候選串。
[0095]本實(shí)施例中以從問答頁面的標(biāo)題中提取核心詞候選串為例,比如,提取到的核心詞候選串可以是“孩子感冒咳嗽怎么辦”。
[0096]實(shí)際操作中還可以從問答頁面的問答內(nèi)容、相關(guān)問題等頁面內(nèi)容中提取核心詞候選串。
[0097]步驟S303:對提取的核心詞候選串進(jìn)行分詞,提取各個候選串分詞的分類特征。
[0098]對提取的核心詞候選串“孩子感冒咳嗽怎么辦”進(jìn)行分詞,例如,可以分詞為孩子”、“感冒”、“咳嗽”、“怎么辦”等候選串分詞。
[0099]對分詞出的候選串分詞進(jìn)行分類特征提取,例如“孩子”這個候選串分詞的分類特征包括:是名詞等;“感冒”、“咳嗽”這兩個候選串分詞的分類特征包括:是名詞、是熱度詞表中的詞、是超鏈接等;“怎么辦”這個候選串分詞的分類特征包括是超鏈接等。
[0100]步驟S304:根據(jù)提取的分類特征對候選串分詞進(jìn)行分類。
[0101]根據(jù)提取的分類特征對上述分詞出的“孩子”、“感冒”、“咳嗽”、“怎么辦”等候選串分詞進(jìn)行分類,例如孩子”、“感冒”、“咳嗽”都是名詞,歸為一類;將“感冒”、“咳嗽”都是熱度詞表中的詞,歸為一類;“感冒”、“咳嗽”、“怎么辦”都是超鏈接,歸為一類。
[0102]步驟S305:針對每個分類,將該分類中各個候選串分詞與用戶輸入的搜索詞進(jìn)行匹配。
[0103]對候選串分詞進(jìn)行分類后,分別針對每個分類,與用戶輸入的搜索詞進(jìn)行匹配。
[0104]沿用上邊的例子,根據(jù)上邊的分類,將名詞分類、熱度詞表分類和超鏈接分類中的各個候選串分詞分別與用戶輸入的搜索詞進(jìn)行匹配。
[0105]步驟S306:篩選出匹配度最高的設(shè)定數(shù)量的候選串分詞,作為核心詞。
[0106]沿用上邊的例子,篩選出匹配度較高的2個候選串分詞為:“感冒”、“咳嗽”,則確定“感冒”、“咳嗽”為核心詞;或篩選出匹配度較高的3個候選串分詞為:“感冒”、“咳嗽”、“孩子”,則確定“感冒”、“咳嗽”、“孩子”為核心詞。
[0107]步驟S307:根據(jù)確定的核心詞篩選相關(guān)問題。
[0108]沿用上邊的例子,根據(jù)核心詞“感冒”、“咳嗽”、“孩子”篩選得到相關(guān)問題“孩子感冒咳嗽怎么辦? ”。
[0109]上述實(shí)施例中所列舉的搜索詞、問答頁面標(biāo)題等都屬于簡單的舉例,實(shí)際應(yīng)用中用戶輸入的檢索詞可能會更簡單,而根據(jù)問答頁面獲取到的候選串分詞的數(shù)量可能會更多,匹配過程可能會更復(fù)雜,從而能夠更好地發(fā)揮本發(fā)明方法的作用,在此不再一一列舉。
[0110]上述步驟S305和步驟S306實(shí)現(xiàn)了根據(jù)分類結(jié)果確定各個候選串分詞是否是核心
1.^] ο
[0111]上述實(shí)施例二中的步驟S305和步驟S306可替換為下面步驟S405和步驟S406所公開的篩選方式。
[0112]實(shí)施例三
[0113]圖4示出了根據(jù)本發(fā)明又一個實(shí)施例的根據(jù)核心詞篩選相關(guān)問題并推薦的處理流程圖,如圖4所示,該流程包括如下步驟:
[0114]步驟S401:獲取與用戶輸入的搜索詞對應(yīng)的問答頁面及相關(guān)問題。
[0115]例如:用戶輸入搜索詞“孩子感冒咳嗽怎么辦? ”,根據(jù)該搜索詞獲取到對應(yīng)的問答頁面,獲取到的問答頁面上有問答頁面的標(biāo)題,至少一個問題答案,至少一個相關(guān)問題。比如,問答答案中可能包括“選擇正確的感冒(咳嗽)藥”、“感冒止咳的中藥”等描述,相關(guān)問題可以是“孩子感冒咳嗽怎么辦? ”、“小兒感冒咳嗽用什么藥比較好呢? ”等問題。
[0116]步驟S402:從獲取的問答頁面的頁面內(nèi)容中,提取與用戶輸入的搜索詞相關(guān)的字符串,作為核心詞候選串。
[0117]對用戶輸入的搜索詞進(jìn)行分詞,從獲取的問答頁面的頁面內(nèi)容中提取包括至少一個搜索詞分詞的字符串。
[0118]沿用上邊的例子,對用戶輸入的搜索詞“孩子感冒咳嗽怎么辦? ”進(jìn)行分詞,例如可以分詞為“孩子”、“感冒”、“咳嗽”、“怎么辦”等搜索詞分詞。
[0119]本實(shí)施例中以從問答頁面的頁面內(nèi)容中提取核心詞候選串為例,可以從問答頁面的問答內(nèi)容、相關(guān)問題等頁面內(nèi)容中提取包括“孩子”、“感冒”、“咳嗽”、“怎么辦”中至少一個搜索詞分詞的字符串作為核心詞候選串。例如,提取到的核心詞候選串可以有孩子感冒咳嗽怎么辦”、“選擇正確的感冒(咳嗽)藥”、“感冒止咳的中藥”、“小兒感冒咳嗽怎么辦? ”、“小兒感冒咳嗽用什么藥比較好呢? ”等等。
[0120]步驟S403:對提取的核心詞候選串進(jìn)行分詞,提取各個候選串分詞的分類特征。
[0121]沿用上邊的例子,對提取的核心詞候選串“孩子感冒咳嗽怎么辦”進(jìn)行分詞,例如,可以分詞為孩子”、“感冒”、“咳嗽”、“怎么辦”等候選串分詞。對提取的核心詞候選串“選擇正確的感冒(咳嗽)藥”進(jìn)行分詞,例如,可以分詞為選擇”、“正確的”、“感冒”、“咳嗽”、“藥”等候選串分詞。對提取的核心詞候選串“感冒止咳的中藥”進(jìn)行分詞,例如,可以分詞為:“感冒”、“止咳”、“中藥”等候選串分詞。依次對提取的核心詞候選串進(jìn)行分詞,此處不再列舉。
[0122]對分詞出的候選串分詞進(jìn)行分類特征提取,例如“孩子”這個候選串分詞的分類特征包括:是名詞等;“感冒”、“咳嗽”這兩個候選串分詞的分類特征包括:是名詞、是熱度詞表中的詞、是超鏈接等;“中藥”、“藥”這兩個候選串分詞的分類特征包括:是名詞等;“止咳”這個候選串分詞的分類特征包括:是熱度詞表中的詞等;“怎么辦”這個候選串分詞的分類特征包括:是超鏈接等??傊瑢Ψ衷~出的所有候選串分詞都進(jìn)行分類特征提取,此處不再對上邊舉例中的各候選串列舉其分類特征。
[0123]步驟S404:根據(jù)提取的分類特征對候選串分詞進(jìn)行分類。
[0124]根據(jù)提取的分類特征對上述分詞出的“孩子”、“感冒”、“咳嗽”、“怎么辦”、“選擇”、“正確的”、“藥”、“止咳”、“中藥”等候選串分詞進(jìn)行分類,例如孩子”、“感冒”、“咳嗽”、“中藥”、“藥”都是名詞,歸為一類;將“感冒”、“咳嗽”、“止咳”都是熱度詞表中的詞,歸為一類;“感冒”、“咳嗽”、“怎么辦”都是超鏈接,歸為一類??傊?,對分詞出的所有候選串分詞都根據(jù)分類特征進(jìn)行分類,此處不再對上邊舉例中的各候選串一一列舉其分類。
[0125]步驟S405:針對每個分類,確定該分類中各個候選串分詞的使用頻率統(tǒng)計值。
[0126]沿用上邊的例子,在名詞分類中、熱度詞表中的詞分類、超鏈接分類中,分別確定各候選串分詞的使用頻率統(tǒng)計值。
[0127]其中,候選串分詞的使用頻率統(tǒng)計值可以根據(jù)各候選串分詞被用戶搜索的次數(shù)、被用戶點(diǎn)擊的次數(shù)、曾經(jīng)被確定為核心詞的次數(shù)、曾經(jīng)被作為搜索詞的次數(shù)等因素中的至少一種因素進(jìn)行統(tǒng)計。
[0128]步驟S406:根據(jù)各個候選串分詞的使用頻率統(tǒng)計值,篩選出使用頻率統(tǒng)計值最高的設(shè)定數(shù)量的候選串分詞,作為核心詞。
[0129]沿用上邊的例子,篩選出使用頻率統(tǒng)計值最高的3個候選串分詞為:“感冒”、“咳嗽”、“止咳”,則確定“感冒”、“咳嗽”、“止咳”為核心詞;或篩選出使用頻率統(tǒng)計值最高的3個候選串分詞為感冒”、“咳嗽”、“孩子”,則確定“感冒”、“咳嗽”、“孩子”為核心詞。
[0130]步驟S407:根據(jù)確定的核心詞對相關(guān)問題進(jìn)行篩選。
[0131]沿用上邊的例子,根據(jù)確定的核心詞“感冒”、“咳嗽”、“孩子”篩選得到相關(guān)問題“孩子感冒咳嗽怎么辦? ”。
[0132]上述步驟S405和步驟S406實(shí)現(xiàn)了根據(jù)分類結(jié)果確定各個候選串分詞是否是核心
!?r] ο
[0133](2)根據(jù)用戶的瀏覽行為日志對相關(guān)問題進(jìn)行篩選,并根據(jù)篩選結(jié)果確定推薦給用戶的相關(guān)問題。
[0134]本發(fā)明實(shí)施例中,通過對若干歷史用戶的瀏覽行為進(jìn)行分析,并根據(jù)分析結(jié)果對相關(guān)問題進(jìn)行篩選,獲取到與用戶真正想要獲得的問題答案匹配度更好的相關(guān)問題。
[0135]實(shí)施例四
[0136]圖5示出了根據(jù)本發(fā)明一個實(shí)施例的根據(jù)用戶的瀏覽行為日志對相關(guān)問題進(jìn)行篩選并推薦的處理流程圖。參見圖5,該流程包括如下步驟:
[0137]步驟S501:根據(jù)來自第一用戶的搜索詞,獲取數(shù)據(jù)庫中與來自第一用戶的搜索詞相關(guān)的至少一個相關(guān)問題。
[0138]第一用戶輸入搜索詞進(jìn)行問答檢索,生成問答頁面時,生成的問答頁面中包括但不限于問答頁面的標(biāo)題、至少一個問題答案,至少一個相關(guān)問題。在獲取到第一用戶輸入的搜索詞后,從數(shù)據(jù)庫中獲取若干相關(guān)問題,這些相關(guān)問題為數(shù)據(jù)庫中第二用戶瀏覽的問答頁面中的問答問題或問答頁面中的相關(guān)問題。
[0139]其中,第一用戶是指當(dāng)前用戶,第二用戶是指歷史用戶。
[0140]步驟S502:根據(jù)選定時間段內(nèi)第二用戶的瀏覽行為日志,確定獲取的相關(guān)問題的瀏覽權(quán)重。
[0141]從數(shù)據(jù)庫中獲取上述步驟S501中獲取到的相關(guān)問題對應(yīng)的第二用戶的瀏覽行為日志。對瀏覽行為日志進(jìn)行分析,確定相關(guān)問題的瀏覽權(quán)重。確定瀏覽權(quán)重的過程中,可以對獲取的相關(guān)問題,計算彼此之間的相關(guān)瀏覽權(quán)重,根據(jù)計算出來的相關(guān)瀏覽權(quán)重,對同一相關(guān)問題的相關(guān)瀏覽權(quán)重進(jìn)行加權(quán)處理,得到各相關(guān)問題的瀏覽權(quán)重。
[0142]優(yōu)選的,也可以根據(jù)設(shè)定的分組條件對獲取的相關(guān)問題進(jìn)行分組,在各個相關(guān)問題分組中,分別計算各相關(guān)問題與組中其他相關(guān)問題的相關(guān)瀏覽權(quán)重,然后綜合各組的計算結(jié)果,對各組中出現(xiàn)的同一相關(guān)問題的相關(guān)瀏覽權(quán)重進(jìn)行加權(quán)處理,得到各相關(guān)問題的瀏覽權(quán)重。
[0143]下面的實(shí)施例二中,以根據(jù)瀏覽用戶進(jìn)行分組為例,說明相關(guān)問題的瀏覽權(quán)重的確定過程。
[0144]步驟S503:根據(jù)確定的瀏覽權(quán)重對獲取的相關(guān)問題進(jìn)行排序。
[0145]根據(jù)確定出的各相關(guān)問題的瀏覽權(quán)重,對各相關(guān)問題進(jìn)行排序。比如可以按照瀏覽權(quán)重從高到低的順序進(jìn)行排序。對相關(guān)問題進(jìn)行排序時,可以對獲取所有的相關(guān)問題一起進(jìn)行排序,也可以按照不同的瀏覽用戶在個瀏覽用戶分組中分別排序,或者按照其他的規(guī)則排序。
[0146]步驟S504:根據(jù)獲取的相關(guān)問題的排序結(jié)果,對相關(guān)問題進(jìn)行篩選,進(jìn)而根據(jù)篩選結(jié)果確定推薦給第一用戶的相關(guān)問題。
[0147]根據(jù)對相關(guān)問題的排序結(jié)果,按照設(shè)定的推薦規(guī)則,篩選相關(guān)問題,并將篩選得到的相關(guān)問題推薦給用戶。比如,根據(jù)排序結(jié)果將所有的相關(guān)問題中瀏覽權(quán)重最高的設(shè)定數(shù)量的相關(guān)問題篩選出作為篩選結(jié)果推薦給用戶;或者在各瀏覽用戶對應(yīng)的相關(guān)問題中分別篩選出設(shè)定數(shù)量的相關(guān)問題作為篩選結(jié)果推薦給第一用戶。
[0148]實(shí)施例五
[0149]本發(fā)明另一個實(shí)施例的根據(jù)用戶的瀏覽行為日志對相關(guān)問題進(jìn)行篩選的處理的流程如圖6所示。參見圖6,該流程包括如下步驟:
[0150]步驟S601:根據(jù)來自第一用戶的搜索詞,獲取數(shù)據(jù)庫中與來自第一用戶的搜索詞相關(guān)的至少一個相關(guān)問題。
[0151]例如:第一用戶輸入搜索詞“孩子感冒怎么辦? ”,根據(jù)該搜索詞生成對應(yīng)的問答頁面,生成的問答頁面上有問答頁面的標(biāo)題,至少一個問題答案,至少一個相關(guān)問題。比如:相關(guān)問題可以是“小兒感冒咳嗽怎么辦? ”、“小兒感冒發(fā)燒怎么辦? ”、“小兒感冒咳嗽用什么藥比較好呢? ”、“小兒感冒鼻塞怎么辦? ”、“寶寶感冒咳嗽怎么辦”、“寶寶感冒咳嗽流鼻涕怎么辦”、“寶寶感冒咳嗽用什么藥比較好呢?”、“寶寶感冒鼻塞怎么辦”、“兒童感冒咳嗽怎么辦”、“兒童感冒鼻塞怎么辦”、“兒童感冒發(fā)燒怎么辦”等等。
[0152]這些相關(guān)問題為數(shù)據(jù)庫中存儲的歷史用戶曾經(jīng)瀏覽過的問答頁面上的問答問題或問答頁面上的相關(guān)問題。
[0153]步驟S602:根據(jù)瀏覽所述相關(guān)問題的瀏覽用戶,對獲取的相關(guān)問題進(jìn)行分組。
[0154]對獲取的相關(guān)問題進(jìn)行分組時,每個相關(guān)問題分組中包括一個瀏覽用戶對應(yīng)的部分或者全部相關(guān)問題。
[0155]可選的,根據(jù)選定時間段內(nèi)的瀏覽行為日志,得到每個瀏覽用戶的瀏覽特征向量{T1、T2、……、T1、Ti+l、……、Τη},其中,Ti表示一個相關(guān)問題。
[0156]其中,瀏覽特征向量中的元素Ti的屬性包括下列參數(shù)中的至少一個:
[0157]問答頁面的生成時間、答案數(shù)、好評數(shù)、差評數(shù)、問答長度、用戶瀏覽時間、用戶停留時間等。
[0158]沿用上邊的例子,對上邊獲取到的各相關(guān)問題進(jìn)行分組如下:
[0159]“小兒感冒咳嗽怎么辦? ”、“小兒感冒咳嗽用什么藥比較好呢? ”、“寶寶感冒咳嗽怎么辦”、“寶寶感冒咳嗽用什么藥比較好呢?”、“兒童感冒咳嗽怎么辦”被同一個瀏覽用戶瀏覽過,歸為一組。
[0160]“小兒感冒發(fā)燒怎么辦? ”、“兒童感冒發(fā)燒怎么辦”、“小兒感冒鼻塞怎么辦? ”、“寶寶感冒鼻塞怎么辦”、“兒童感冒鼻塞怎么辦”被同一個瀏覽用戶瀏覽過,歸為一組。
[0161]“小兒感冒鼻塞怎么辦? ”、“寶寶感冒咳嗽流鼻涕怎么辦”、“寶寶感冒鼻塞怎么辦”、“兒童感冒鼻塞怎么辦”被同一個瀏覽用戶瀏覽過,歸為一組。
[0162]......
[0163]以此類推,對所有獲取的相關(guān)問題進(jìn)行分組,實(shí)現(xiàn)將被同一用戶瀏覽過的相關(guān)問題歸為一組。
[0164]步驟S603:在各相關(guān)問題分組中,計算組中各相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重。
[0165]根據(jù)上述各瀏覽用戶的瀏覽特征向量{T1、T2、……、T1、Ti+l、……、Tn},利用如下公式計算每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重W(Ti,Ti+1):
[0166]log (al/(I Time (i) - Time (i+1) | +a2))
[0167]其中,Time(i) 一個問答問題的用戶瀏覽時間;
[0168]Time (i+1)為組中其它問答問題的用戶瀏覽時間;
[0169]al,a2為經(jīng)驗(yàn)值常數(shù)。
[0170]當(dāng)然,也可以計算組中各相關(guān)問題Ti與組中其他相關(guān)問題T1-1的相關(guān)瀏覽權(quán)重I
[0171]沿用上邊的例子,針對每個分組,分別計算每個相關(guān)問題與組中其他相關(guān)問題的,例如,針對瀏覽用戶相同的第一個相關(guān)問題分組,分別計算“小兒感冒咳嗽怎么辦?”、“小兒感冒咳嗽用什么藥比較好呢?”、“寶寶感冒咳嗽怎么辦”、“寶寶感冒咳嗽用什么藥比較好呢? ”、“兒童感冒咳嗽怎么辦”與組中其他相關(guān)問題的相關(guān)瀏覽權(quán)重。其他相關(guān)問題分組也同樣進(jìn)行計算。
[0172]進(jìn)一步可選的,計算組中各相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重,包括:在各相關(guān)問題分組中,根據(jù)瀏覽用戶瀏覽各相關(guān)問題的瀏覽時間對該相關(guān)問題分組中的所有相關(guān)問題進(jìn)行排序;根據(jù)排序結(jié)果中,劃分瀏覽時間間隔小于預(yù)設(shè)的時間間隔閾值的相關(guān)問題至同一會話組;在各會話組中,計算組中各相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重。
[0173]也就是說,對于瀏覽用戶相同的相關(guān)問題分組中的用戶,可以進(jìn)一步根據(jù)瀏覽時間劃分出不同的會話組(sess1n),同一會話組中的相關(guān)問題的瀏覽時間差小于等于某個設(shè)定的時間閾值??梢愿鶕?jù)瀏覽用戶的瀏覽特征向量進(jìn)行sess1n劃分。在同一 sess1n內(nèi),計算相關(guān)問題的瀏覽權(quán)重。
[0174]步驟S604:獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)瀏覽權(quán)重,將獲取到的相關(guān)瀏覽權(quán)重進(jìn)行加權(quán),得到獲取的各相關(guān)問題的瀏覽權(quán)重。
[0175]上邊計算出各相關(guān)問題分組中的各相關(guān)問題的相關(guān)瀏覽權(quán)重后,將各相關(guān)問題分組中相同的相關(guān)問題提取出來,例如,對于“小兒感冒鼻塞怎么辦?”這個相關(guān)問題,在瀏覽用戶相同的第一個相關(guān)問題分組和第三個相關(guān)問題中計算得到的相關(guān)瀏覽權(quán)重進(jìn)行加權(quán)。
[0176]可選的,可以把同一相關(guān)問題在不同相關(guān)問題分組中計算得到的相關(guān)瀏覽權(quán)重直接進(jìn)行相加,也可以分別乘上相應(yīng)的權(quán)重系數(shù)后在進(jìn)行相加,也可以通過其它的加權(quán)規(guī)則進(jìn)行加權(quán)處理。
[0177]步驟S605:根據(jù)確定出的相關(guān)問題的瀏覽權(quán)重對獲取的相關(guān)問題進(jìn)行排序。
[0178]沿用上邊的例子,以獲取所有的相關(guān)問題一起進(jìn)行排序?yàn)槔?,按照瀏覽權(quán)重從高到低的順序進(jìn)行排序,得到排序結(jié)果如下:
[0179]“小兒感冒發(fā)燒怎么辦? ”、“小兒感冒咳嗽怎么辦? ”、“寶寶感冒咳嗽流鼻涕怎么辦”、“寶寶感冒咳嗽怎么辦”“兒童感冒發(fā)燒怎么辦”、“小兒感冒咳嗽用什么藥比較好呢? ”、“小兒感冒鼻塞怎么辦? ”、“寶寶感冒咳嗽用什么藥比較好呢? ”、“寶寶感冒鼻塞怎么辦”、“兒童感冒咳嗽怎么辦”、“兒童感冒鼻塞怎么辦”。
[0180]步驟S606:根據(jù)獲取的相關(guān)問題的排序結(jié)果,對相關(guān)問題進(jìn)行篩選,進(jìn)而根據(jù)篩選結(jié)果確定推薦給第一用戶的相關(guān)問題。
[0181]根據(jù)排序結(jié)果,篩選出瀏覽權(quán)重最高的前幾個問題作為篩選結(jié)果推薦給第一用戶,加入到根據(jù)用戶輸入的搜索詞生成的問答頁面中。
[0182]例如:將“小兒感冒發(fā)燒怎么辦? ”、“小兒感冒咳嗽怎么辦? ”、“寶寶感冒咳嗽流鼻涕怎么辦”、“寶寶感冒咳嗽怎么辦” “兒童感冒發(fā)燒怎么辦”作為相關(guān)問題加入到問答頁面中。
[0183](3)根據(jù)用戶的搜索點(diǎn)擊行為日志對相關(guān)問題進(jìn)行篩選,并根據(jù)篩選結(jié)果確定推薦給用戶的相關(guān)問題。
[0184]本發(fā)明實(shí)施例中,通過對若干歷史用戶的搜索點(diǎn)擊行為進(jìn)行分析,并根據(jù)分析結(jié)果對相關(guān)問題進(jìn)行篩選,獲取到與用戶真正想要獲得的問題答案匹配度更好的相關(guān)問題。
[0185]實(shí)施例六
[0186]圖7示出了根據(jù)本發(fā)明一個實(shí)施例的根據(jù)用戶的搜索點(diǎn)擊行為日志對相關(guān)問題進(jìn)行篩選并推薦的處理流程圖。參見圖7,該流程包括如下步驟:
[0187]步驟S701:根據(jù)來自第一用戶的搜索詞,獲取數(shù)據(jù)庫中與來自第一用戶的搜索詞相關(guān)的至少一個相關(guān)問題。
[0188]第一用戶輸入搜索詞進(jìn)行問答檢索,生成問答頁面時,生成的問答頁面中包括但不限于問答頁面的標(biāo)題、至少一個問題答案,至少一個相關(guān)問題。在獲取到第一用戶輸入的搜索詞后,從數(shù)據(jù)庫中獲取若干相關(guān)問題,這些相關(guān)問題為數(shù)據(jù)庫中第二用戶搜索點(diǎn)擊的問答頁面中的問答問題或問答頁面中的相關(guān)問題。
[0189]其中,第一用戶是指當(dāng)前用戶,第二用戶是指歷史用戶。
[0190]步驟S702:根據(jù)選定時間段內(nèi)第二用戶的搜索行為日志,確定獲取的相關(guān)問題的點(diǎn)擊權(quán)重。
[0191]從數(shù)據(jù)庫中獲取上述步驟S701中獲取到的相關(guān)問題對應(yīng)的第二用戶的搜索行為日志。對搜索行為日志進(jìn)行分析,確定相關(guān)問題的點(diǎn)擊權(quán)重。確定擊權(quán)重的過程中,可以對獲取的相關(guān)問題,計算彼此之間的相關(guān)點(diǎn)擊權(quán)重,根據(jù)計算出來的相關(guān)點(diǎn)擊權(quán)重,對同一相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重進(jìn)行加權(quán)處理,得到各相關(guān)問題的點(diǎn)擊權(quán)重。
[0192]優(yōu)選的,也可以根據(jù)設(shè)定的分組條件對獲取的相關(guān)問題進(jìn)行分組,在各個相關(guān)問題分組中,分別計算各相關(guān)問題與組中其他相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重,然后綜合各組的計算結(jié)果,對各組中出現(xiàn)的同一相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重進(jìn)行加權(quán)處理,得到各相關(guān)問題的點(diǎn)擊權(quán)重。
[0193]下面的實(shí)施例二中,以根據(jù)查詢請求串進(jìn)行分組為例,說明相關(guān)問題的點(diǎn)擊權(quán)重的確定過程。
[0194]步驟S703:根據(jù)確定出的相關(guān)問題的點(diǎn)擊權(quán)重對獲取的相關(guān)問題進(jìn)行排序。
[0195]根據(jù)確定出的各相關(guān)問題的點(diǎn)擊權(quán)重,對各相關(guān)問題進(jìn)行排序。比如可以按照點(diǎn)擊權(quán)重從高到低的順序進(jìn)行排序。對相關(guān)問題進(jìn)行排序時,可以對獲取所有的相關(guān)問題一起進(jìn)行排序,也可以按照不同的查詢請求串在各查詢串分組中分別排序,或者按照其他的規(guī)則排序。
[0196]步驟S704:根據(jù)獲取的相關(guān)問題的排序結(jié)果,對相關(guān)問題進(jìn)行篩選,進(jìn)而根據(jù)篩選結(jié)果確定推薦給第一用戶的相關(guān)問題。
[0197]根據(jù)對相關(guān)問題的排序結(jié)果,按照設(shè)定的推薦規(guī)則,篩選相關(guān)問題,并將篩選得到的相關(guān)問題推薦給第一用戶。比如,根據(jù)排序結(jié)果將所有的相關(guān)問題中點(diǎn)擊權(quán)重最高的設(shè)定數(shù)量的相關(guān)問題篩選出作為篩選結(jié)果推薦給第一用戶;或者在各查詢請求串對應(yīng)的相關(guān)問題中分別篩選出設(shè)定數(shù)量的相關(guān)問題作為篩選結(jié)果推薦給第一用戶。
[0198]實(shí)施例七
[0199]圖8示出了根據(jù)本發(fā)明另一個實(shí)施例的根據(jù)用戶的搜索點(diǎn)擊行為日志對相關(guān)問題進(jìn)行篩選并推薦的處理流程圖。參見圖8,該流程包括如下步驟:
[0200]步驟S801:根據(jù)來自第一用戶的搜索詞,獲取數(shù)據(jù)庫中與來自第一用戶的搜索詞相關(guān)的至少一個相關(guān)問題。
[0201]例如:第一用戶輸入搜索詞“孩子感冒怎么辦? ”,根據(jù)該搜索詞生成對應(yīng)的問答頁面,生成的問答頁面上有問答頁面的標(biāo)題,至少一個問題答案,至少一個相關(guān)問題。比如:相關(guān)問題可以是“小兒感冒咳嗽怎么辦? ”、“小兒感冒發(fā)燒怎么辦? ”、“小兒感冒咳嗽用什么藥比較好呢? ”、“小兒感冒鼻塞怎么辦? ”、“寶寶感冒咳嗽怎么辦” “寶寶感冒咳嗽流鼻涕怎么辦”、“寶寶感冒咳嗽用什么藥比較好呢?”、“寶寶感冒鼻塞怎么辦”、“兒童感冒咳嗽怎么辦”、“兒童感冒鼻塞怎么辦”、“兒童感冒發(fā)燒怎么辦”等等。
[0202]這些相關(guān)問題為數(shù)據(jù)庫中存儲的歷史用戶曾經(jīng)搜索過的問答頁面上的問答問題或問答頁面上的相關(guān)問題。
[0203]步驟S802:根據(jù)獲取的相關(guān)問題對應(yīng)的查詢請求串,對獲取的相關(guān)問題進(jìn)行分組。
[0204]對獲取的相關(guān)問題進(jìn)行分組時,每個相關(guān)問題分組中包括一個查詢請求串對應(yīng)的部分或全部相關(guān)問題。
[0205]可選的,根據(jù)獲取的相關(guān)問題對應(yīng)的查詢請求串,得到各查詢請求串的點(diǎn)擊特征向量{T1、T2、……、T1、Ti+l、……、Τη},其中Ti表示一個相關(guān)問題。從而實(shí)現(xiàn)對獲取的相關(guān)問題進(jìn)行分組。
[0206]其中,點(diǎn)擊特征向量中的元素Ti的屬性包括下列參數(shù)中的至少一個:問答頁面的生成時間、答案數(shù)、好評數(shù)、差評數(shù)、問答長度、展示次數(shù)、被點(diǎn)擊次數(shù)等。
[0207]沿用上邊的例子,對上邊獲取到的各相關(guān)問題進(jìn)行分組如下:
[0208]“小兒感冒咳嗽怎么辦? ”、“小兒感冒發(fā)燒怎么辦? ”、“小兒感冒咳嗽用什么藥比較好呢? ”、“小兒感冒鼻塞怎么辦? ”對應(yīng)的查詢請求串為“小兒感冒”,歸為一組。
[0209]“寶寶感冒咳嗽怎么辦”、“寶寶感冒咳嗽流鼻涕怎么辦”、“寶寶感冒咳嗽用什么藥比較好呢? ”、“寶寶感冒鼻塞怎么辦”對應(yīng)的查詢請求串為“寶寶感冒”,歸為一組;
[0210]“兒童感冒咳嗽怎么辦”、“兒童感冒鼻塞怎么辦”、“兒童感冒發(fā)燒怎么辦”對應(yīng)的查詢請求串為“兒童感冒”,歸為一組;
[0211]“小兒感冒咳嗽怎么辦? ”、“小兒感冒咳嗽用什么藥比較好呢? ”,“寶寶感冒咳嗽怎么辦”,“寶寶感冒咳嗽流鼻涕怎么辦”、“寶寶感冒咳嗽用什么藥比較好呢?”、“兒童感冒咳嗽怎么辦”對應(yīng)的查詢請求串為“感冒咳嗽”,歸為一組;
[0212]“小兒感冒發(fā)燒怎么辦? ”、“小兒感冒發(fā)燒怎么辦? ”、“兒童感冒發(fā)燒怎么辦”對應(yīng)的查詢請求串為“感冒發(fā)燒”,歸為一組;
[0213]“小兒感冒鼻塞怎么辦? ”、“寶寶感冒鼻塞怎么辦”、“兒童感冒鼻塞怎么辦”對應(yīng)的查詢請求串為“感冒鼻噻”,歸為一組;
[0214]......
[0215]以此類推,對所有獲取的相關(guān)問題進(jìn)行分組,實(shí)現(xiàn)將查詢請求串相同的相關(guān)問題歸為一組。
[0216]步驟S803:在各相關(guān)問題分組中,計算組中各相關(guān)問題與組中其他相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重。
[0217]根據(jù)上述生成的各查詢請求串的點(diǎn)擊特征向量{T1、T2、……、T1、Ti+l、……、Tn},利用如下公式計算組中各相關(guān)問題Ti與組中其他相關(guān)問題Ti+Ι的相關(guān)點(diǎn)擊權(quán)重W(Ti,Ti+I):
[0218]ff = P((Ti) I查詢請求串)*P((Ti+I) I查詢請求串)
[0219]其中,Ti表示一個相關(guān)問題;
[0220]Ti+I表示點(diǎn)擊特征向量中包括的其他問答問題;
[0221]P((Ti) |查詢請求串)表示使用查詢請求串時得到Ti的概率;
[0222]P((Ti+I) |查詢請求串)表示使用查詢請求串時得到Ti+I的概率。
[0223]當(dāng)然,也可以計算組中各相關(guān)問題Ti與組中其他相關(guān)問題T1-1的相關(guān)點(diǎn)擊權(quán)重I
[0224]沿用上邊的例子,針對每個分組,分別計算每個相關(guān)問題與組中其他相關(guān)問題的,例如,針對查詢請求串為“小兒感冒”的相關(guān)問題分組,分別計算“小兒感冒咳嗽怎么辦? ”、“小兒感冒發(fā)燒怎么辦? ”、“小兒感冒咳嗽用什么藥比較好呢? ”、“小兒感冒鼻塞怎么辦? ”與組中其他相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重。其他相關(guān)問題分組也同樣進(jìn)行計算。
[0225]步驟S804:獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)點(diǎn)擊權(quán)重,將獲取到的相關(guān)點(diǎn)擊權(quán)重進(jìn)行加權(quán),得到獲取的各相關(guān)問題的點(diǎn)擊權(quán)重。
[0226]上邊計算出各相關(guān)問題分組中的各相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重后,將各相關(guān)問題分組中相同的相關(guān)問題提取出來,例如,對于“小兒感冒咳嗽怎么辦?”這個相關(guān)問題,在查詢請求串為“小兒感冒”的相關(guān)問題分組和在查詢請求串為“感冒咳嗽”的相關(guān)問題分組中計算得到的相關(guān)點(diǎn)擊權(quán)重進(jìn)行加權(quán)。
[0227]可選的,可以把同一相關(guān)問題在不同相關(guān)問題分組中計算得到的相關(guān)點(diǎn)擊權(quán)重直接進(jìn)行相加,也可以分別乘上相應(yīng)的權(quán)重系數(shù)后在進(jìn)行相加,也可以通過其它的加權(quán)規(guī)則進(jìn)行加權(quán)處理。
[0228]步驟S805:根據(jù)確定出的相關(guān)問題的點(diǎn)擊權(quán)重對獲取的相關(guān)問題進(jìn)行排序。
[0229]沿用上邊的例子,以獲取所有的相關(guān)問題一起進(jìn)行排序?yàn)槔凑拯c(diǎn)擊權(quán)重從高到低的順序進(jìn)行排序,得到排序結(jié)果如下:
[0230]“小兒感冒咳嗽怎么辦? ”、“小兒感冒發(fā)燒怎么辦? ”、“寶寶感冒咳嗽怎么辦”、“兒童感冒發(fā)燒怎么辦”、“寶寶感冒咳嗽流鼻涕怎么辦”、“小兒感冒咳嗽用什么藥比較好呢? ”、“小兒感冒鼻塞怎么辦? ”、“寶寶感冒咳嗽用什么藥比較好呢? ”、“寶寶感冒鼻塞怎么辦”、“兒童感冒咳嗽怎么辦”、“兒童感冒鼻塞怎么辦”。
[0231]步驟S806:根據(jù)獲取的相關(guān)問題的排序結(jié)果,對相關(guān)問題進(jìn)行篩選,進(jìn)而根據(jù)篩選結(jié)果確定推薦給第一用戶的相關(guān)問題。
[0232]根據(jù)排序結(jié)果,篩選出點(diǎn)擊權(quán)重最高的前幾個問題作為篩選結(jié)果推薦給第一用戶,加入到根據(jù)用戶輸入的搜索詞生成的問答頁面中。
[0233]例如:將“小兒感冒咳嗽怎么辦? ”、“小兒感冒發(fā)燒怎么辦? ”、“寶寶感冒咳嗽怎么辦”、“兒童感冒發(fā)燒怎么辦”、“寶寶感冒咳嗽流鼻涕怎么辦”作為相關(guān)問題加入到問答頁面中。
[0234]上述根據(jù)用戶的瀏覽性為日志和/或搜索點(diǎn)擊行為日志對相關(guān)問題進(jìn)行篩選和/或推薦的流程中,根據(jù)數(shù)據(jù)庫中的歷史數(shù)據(jù),分析歷史用戶瀏覽各個相關(guān)問題的瀏覽行為,和/或點(diǎn)擊各個相關(guān)問題的搜索點(diǎn)擊行為,確定相關(guān)問題的瀏覽權(quán)重參數(shù)和/或點(diǎn)擊權(quán)重參數(shù),從而確定向用戶推薦相關(guān)問題的推薦優(yōu)先級,從而獲取到與用戶輸入的搜索詞匹配度更高的相關(guān)問題,在當(dāng)前問答頁面為用戶提供與用戶需求的貼合性更好、更符合用戶需求的相關(guān)問題,提高問答頁面問題檢索的準(zhǔn)確性。
[0235]針對本發(fā)明實(shí)施例根據(jù)用戶的瀏覽性為日志和/或搜索點(diǎn)擊行為日志對相關(guān)問題進(jìn)行篩選和/或推薦的方法,實(shí)現(xiàn)問答頁面相關(guān)問題推薦的系統(tǒng)環(huán)境示意如圖9所示。該系統(tǒng)包括數(shù)據(jù)庫,存儲若干第二用戶(歷史用戶)的相關(guān)問題,問答頁面問題推薦裝置能夠獲取第一用戶輸入的搜索詞,并根據(jù)搜索詞從數(shù)據(jù)庫獲取若干歷史用戶瀏覽和/或搜索點(diǎn)擊過的相關(guān)問題及相關(guān)問題的歷史數(shù)據(jù),通過對歷史數(shù)據(jù)的分析處理,實(shí)現(xiàn)獲取更優(yōu)的相關(guān)問題推薦給第一用戶。
[0236]上文對分別根據(jù)各預(yù)設(shè)規(guī)則對相關(guān)問題進(jìn)行篩選,并根據(jù)篩選結(jié)果推薦相關(guān)問題的過程進(jìn)行了介紹。本例中,當(dāng)根據(jù)預(yù)設(shè)規(guī)則中的幾項(xiàng)或全部對相關(guān)問題進(jìn)行篩選時,首先根據(jù)各個預(yù)設(shè)規(guī)則分別對相關(guān)問題進(jìn)行篩選,其次,擬合各個篩選結(jié)果,得到推薦給用戶的相關(guān)問題。如圖10示出了根據(jù)本發(fā)明一個優(yōu)選實(shí)施例的根據(jù)以上三項(xiàng)預(yù)設(shè)規(guī)則對相關(guān)問題進(jìn)行篩選并推薦的處理流程示意圖。參見圖10,該流程包括如下步驟:
[0237]步驟S1001:獲取與用戶輸入的搜索詞對應(yīng)的相關(guān)問題。
[0238]例如,用戶輸入搜索詞“小兒感冒怎么辦”,根據(jù)該搜索詞獲取到對應(yīng)的相關(guān)問題。例如,獲取到的相關(guān)問題包括:
[0239]“小兒感冒咳嗽怎么辦”;
[0240]“孩子感冒流鼻涕怎么辦”;
[0241]“感冒的癥狀是什么”;
[0242]“寶寶感冒的常見問題有什么”;
[0243]“感冒發(fā)燒怎么辦”;
[0244]“小兒感冒病因有什么”;
[0245]“兒童感冒有沒有食療”;
[0246]“怎樣停止咳嗽”。
[0247]步驟S1002:根據(jù)核心詞對相關(guān)問題進(jìn)行篩選。
[0248]當(dāng)提取到核心詞為“小兒”、“感冒”,根據(jù)該核心詞篩選到的相關(guān)問題為:
[0249]“小兒感冒咳嗽怎么辦”;
[0250]“小兒感冒病因有什么”。
[0251]步驟S1003:根據(jù)用戶的瀏覽行為日志對相關(guān)問題進(jìn)行篩選。
[0252]對步驟S1001中提及的各個相關(guān)問題進(jìn)行瀏覽權(quán)重值的計算,并根據(jù)得到的瀏覽權(quán)重值對各個相關(guān)問題進(jìn)行排序,得到排序結(jié)果為:
[0253]“小兒感冒咳嗽怎么辦”;
[0254]“怎樣停止咳嗽”;
[0255]“小兒感冒病因有什么”;
[0256]“兒童感冒有沒有食療”;
[0257]“寶寶感冒的常見問題有什么”;
[0258]“感冒發(fā)燒怎么辦”;
[0259]“孩子感冒流鼻涕怎么辦”;
[0260]“感冒的癥狀是什么”。
[0261]根據(jù)排序結(jié)果提取3個相關(guān)問題,即得到的篩選結(jié)果為:
[0262]“小兒感冒咳嗽怎么辦”;
[0263]“怎樣停止咳嗽”;
[0264]“小兒感冒病因有什么”。
[0265]步驟S1004:根據(jù)用戶的搜索點(diǎn)擊行為日志對相關(guān)問題進(jìn)行篩選。
[0266]對步驟S1001中提及的各個相關(guān)問題進(jìn)行搜索點(diǎn)擊權(quán)重值的計算,并根據(jù)得到的搜索點(diǎn)擊權(quán)重值對各個相關(guān)問題進(jìn)行排序,得到排序結(jié)果為:
[0267]“怎樣停止咳嗽”;
[0268]“孩子感冒流鼻涕怎么辦”;
[0269]“小兒感冒咳嗽怎么辦”;
[0270]“小兒感冒病因有什么”;
[0271]“兒童感冒有沒有食療”;
[0272]“寶寶感冒的常見問題有什么”;
[0273]“感冒發(fā)燒怎么辦”;
[0274]“感冒的癥狀是什么”。
[0275]根據(jù)排序結(jié)果提取3個相關(guān)問題,即篩選結(jié)果為:
[0276]“怎樣停止咳嗽”;
[0277]“孩子感冒流鼻涕怎么辦”;
[0278]“小兒感冒咳嗽怎么辦”。
[0279]步驟S1005:根據(jù)步驟S1002、步驟S1003以及步驟S1004中得到的各個篩選結(jié)果,確定推薦給用戶的相關(guān)問題。
[0280]優(yōu)選地,本例中可以對步驟S1002、步驟S1003以及步驟S1004中得到的各個篩選結(jié)果進(jìn)行整理排序。例如,得到的三個篩選結(jié)果中均包括相關(guān)問題“小兒感冒咳嗽怎么辦”。再例如,得到的三個篩選結(jié)果中的兩個篩選結(jié)果包括“小兒感冒病因有什么”及“怎樣停止咳嗽”。若在問答頁面中推薦給用戶的相關(guān)問題可以是:
[0281]“小兒感冒咳嗽怎么辦”;
[0282]“小兒感冒病因有什么”;
[0283]“怎樣停止咳嗽”。
[0284]需要說明的是,上例中提及的各個篩選結(jié)果,和/或步驟S1005中確定推薦的相關(guān)問題均為示例,不能夠代表實(shí)際應(yīng)用中得到的篩選結(jié)果和/或確定推薦的相關(guān)問題。
[0285]基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提供了一種問答頁面相關(guān)問題推薦裝置,該裝置的結(jié)構(gòu)如圖11所示,包括獲取器1110、篩選器1120以及推薦器1130。
[0286]現(xiàn)介紹本發(fā)明實(shí)施例的問答頁面相關(guān)問題推薦裝置的各器件或組成的功能以及各部分間的連接關(guān)系:
[0287]獲取器1110,適于根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與搜索詞相關(guān)的至少一個相關(guān)問題;
[0288]篩選器1120,與獲取器1110相耦合,適于根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選;
[0289]推薦器1130,與篩選器1120相耦合,適于根據(jù)相關(guān)問題的篩選結(jié)果,確定問答頁面推薦給用戶的相關(guān)問題。
[0290]圖12示出了根據(jù)本發(fā)明一個優(yōu)選實(shí)施例的問答頁面相關(guān)問題推薦裝置的結(jié)構(gòu)示意圖。參見圖12,篩選器1120還包括:
[0291]第一篩選模塊1121,與獲取器1110以及推薦器1130分別耦合,適于根據(jù)用戶的瀏覽行為日志對相關(guān)問題進(jìn)行篩選;
[0292]第二篩選模塊1122,與獲取器1110以及推薦器1130分別耦合,適于根據(jù)用戶的搜索點(diǎn)擊行為日志對相關(guān)問題進(jìn)行篩選;
[0293]第三篩選模塊1123,與獲取器1110以及推薦器1130分別耦合,適于根據(jù)核心詞對相關(guān)問題進(jìn)行篩選。
[0294]在一個優(yōu)選的實(shí)施例中,第三篩選模塊1123還包括:
[0295]獲取單元11231,適于獲取與搜索詞對應(yīng)的問答頁面;
[0296]提取單元11232,與提取單元11231相耦合,適于提取問答頁面中的核心詞;
[0297]確定單元11233,與提取單元11232相親合,適于根據(jù)核心詞篩選相關(guān)問題。
[0298]在一個優(yōu)選的實(shí)施例中,提取單元11232還適于:
[0299]從問答頁面中提取核心詞候選串;
[0300]對核心詞候選串進(jìn)行分詞,提取各個候選串分詞的分類特征;
[0301]根據(jù)分類特征篩選各個候選串分詞是否是核心詞。
[0302]在一個優(yōu)選的實(shí)施例中,提取單元11232還適于:
[0303]從問答頁面的標(biāo)題中提取核心詞候選串;和/或
[0304]從問答頁面的頁面內(nèi)容中,提取與搜索詞相關(guān)的字符串,作為核心詞候選串。
[0305]在一個優(yōu)選的實(shí)施例中,提取單元11232還適于:
[0306]對搜索詞進(jìn)行分詞;
[0307]從問答頁面的頁面內(nèi)容中提取包括至少一個搜索詞分詞的字符串。
[0308]在一個優(yōu)選的實(shí)施例中,提取單元11232還適于:
[0309]根據(jù)分類特征對候選串分詞進(jìn)行分類,根據(jù)分類結(jié)果確定各個候選串分詞是否是核心詞;
[0310]分類特征包括下列特征中的至少一種:名詞、熱度詞表、超鏈接、相關(guān)問題共現(xiàn)率、文檔詞頻。
[0311]在一個優(yōu)選的實(shí)施例中,提取單元11232還適于:
[0312]針對每個分類,將該分類中各個候選串分詞與用戶輸入的搜索詞進(jìn)行匹配,篩選出匹配度最高的設(shè)定數(shù)量的候選串分詞,作為核心詞;
[0313]針對每個分類,根據(jù)該分類中各個候選串分詞的使用頻率統(tǒng)計值,篩選出使用頻率統(tǒng)計值最高的設(shè)定數(shù)量的候選串分詞,作為核心詞;其中,候選串分詞的使用頻率統(tǒng)計值包括下列參數(shù)之一:被搜索次數(shù)、被點(diǎn)擊次數(shù)、曾作為核心詞的次數(shù)、曾作為搜索詞的次數(shù)。
[0314]在一個優(yōu)選的實(shí)施例中,第一篩選模塊1121還包括:
[0315]第一權(quán)重確定單元11211,適于根據(jù)選定時間段內(nèi)用戶的瀏覽行為日志,確定獲取的相關(guān)問題的瀏覽權(quán)重;
[0316]第一排序單元11212,與權(quán)重確定單元11211相耦合,適于根據(jù)瀏覽權(quán)重對獲取的相關(guān)冋題進(jìn)彳丁排序;
[0317]第一篩選單元11213,與排序單元11212相耦合,適于根據(jù)排序結(jié)果對相關(guān)問題進(jìn)行篩選。
[0318]在一個優(yōu)選的實(shí)施例中,第一篩選單元11213還適于:根據(jù)排序結(jié)果提取第一預(yù)定個數(shù)個相關(guān)問題。
[0319]在一個優(yōu)選的實(shí)施例中,第一權(quán)重確定單元11211還適于:
[0320]根據(jù)瀏覽相關(guān)問題的瀏覽用戶,對獲取的相關(guān)問題進(jìn)行分組;其中,每個相關(guān)問題分組中包括一個瀏覽用戶對應(yīng)的部分或者全部相關(guān)問題;
[0321]在每個相關(guān)問題分組中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重;
[0322]獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)瀏覽權(quán)重,將獲取到的相關(guān)瀏覽權(quán)重進(jìn)行加權(quán),得到獲取的每個相關(guān)問題的瀏覽權(quán)重。
[0323]在一個優(yōu)選的實(shí)施例中,第一權(quán)重確定單元11211還適于:
[0324]根據(jù)選定時間段內(nèi)的瀏覽行為日志,得到每個瀏覽用戶的瀏覽特征向量{T1、T2、……、T1、Ti+l、……、Τη},其中,Ti表示一個相關(guān)問題。
[0325]在一個優(yōu)選的實(shí)施例中,第一權(quán)重確定單元11211還適于:
[0326]在每個相關(guān)問題分組中,根據(jù)瀏覽用戶瀏覽每個相關(guān)問題的瀏覽時間對該相關(guān)問題分組中的所有相關(guān)問題進(jìn)行排序;
[0327]根據(jù)排序結(jié)果中,劃分瀏覽時間間隔小于預(yù)設(shè)的時間間隔閾值的相關(guān)問題至同一會話組;
[0328]在每個會話組中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重。
[0329]在一個優(yōu)選的實(shí)施例中,第二篩選模塊1122還包括:
[0330]第二權(quán)重確定單元11221,適于根據(jù)選定時間段內(nèi)用戶的搜索點(diǎn)擊日志,確定獲取的相關(guān)問題的點(diǎn)擊權(quán)重;
[0331]第二排序單元11222,與第二權(quán)重確定單元11221相耦合,適于根據(jù)點(diǎn)擊權(quán)重對獲取的相關(guān)問題進(jìn)行排序;
[0332]第二篩選單元11223,與第二排序單元11222相耦合,適于根據(jù)排序結(jié)果對相關(guān)問題進(jìn)行篩選。
[0333]在一個優(yōu)選的實(shí)施例中,第二權(quán)重確定單元11221還適于:
[0334]根據(jù)相關(guān)問題對應(yīng)的查詢請求串,對獲取的相關(guān)問題進(jìn)行分組;其中,每個相關(guān)問題分組中包括一個查詢請求串對應(yīng)的部分或全部相關(guān)問題;
[0335]在每個相關(guān)問題分組中,計算組中每個相關(guān)問題與組中其他相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重;
[0336]獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)點(diǎn)擊權(quán)重,將獲取到的相關(guān)點(diǎn)擊權(quán)重進(jìn)行加權(quán),得到獲取的每個相關(guān)問題的點(diǎn)擊權(quán)重。
[0337]在一個優(yōu)選的實(shí)施例中,第二權(quán)重確定單元11221還適于:
[0338]根據(jù)相關(guān)問題對應(yīng)的查詢請求串,得到每個查詢請求串的點(diǎn)擊特征向量{Tl、T2、……、Τη},實(shí)現(xiàn)對獲取的相關(guān)問題進(jìn)行分組;其中Ti表示一個相關(guān)問題。
[0339]在一個優(yōu)選的實(shí)施例中,第二權(quán)重確定單元11221還適于:
[0340]得到的點(diǎn)擊特征向量中的元素Ti的屬性包括下列參數(shù)中的至少一個:
[0341]問答頁面的生成時間、答案數(shù)、好評數(shù)、差評數(shù)、問答長度、展示次數(shù)、被點(diǎn)擊次數(shù)等。
[0342]根據(jù)上述任意一個實(shí)施例或多個實(shí)施例的組合,本發(fā)明實(shí)施例能夠達(dá)到如下有益效果:
[0343]依據(jù)本發(fā)明實(shí)施例的問答頁面相關(guān)問題推薦方法,能夠根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與搜索詞相關(guān)的至少一個相關(guān)問題,并根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選,根據(jù)篩選結(jié)果確定推薦給用戶的相關(guān)問題??芍?,依據(jù)本發(fā)明實(shí)施例的問答頁面相關(guān)問題推薦方法,在獲取到與搜索詞相關(guān)的相關(guān)問題后,利用預(yù)設(shè)規(guī)則對相關(guān)問題進(jìn)行篩選,得到能夠更好地反映用戶輸入的搜索詞的相關(guān)問題,從而獲取到用戶真正想要獲得的問題答案。另外,本例中利用至少一個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選,即,本例中可以利用多個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行篩選。而利用多個預(yù)設(shè)規(guī)則對獲取的相關(guān)問題進(jìn)行多次篩選,能夠得到更準(zhǔn)確、更貼合用戶需要的相關(guān)問題,因此能夠提高問答頁面檢索的準(zhǔn)確性。
[0344]在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
[0345]類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實(shí)施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0346]本領(lǐng)域那些技術(shù)人員可以理解,可以對實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在與該實(shí)施例不同的一個或多個設(shè)備中。可以把實(shí)施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
[0347]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
[0348]本發(fā)明的各個部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個或者多個處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的裝置或者設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機(jī)程序和計算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲在計算機(jī)可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0349]應(yīng)該注意的是上述實(shí)施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
[0350]至此,本領(lǐng)域技術(shù)人員應(yīng)認(rèn)識到,雖然本文已詳盡示出和描述了本發(fā)明的多個示例性實(shí)施例,但是,在不脫離本發(fā)明精神和范圍的情況下,仍可根據(jù)本發(fā)明公開的內(nèi)容直接確定或推導(dǎo)出符合本發(fā)明原理的許多其他變型或修改。因此,本發(fā)明的范圍應(yīng)被理解和認(rèn)定為覆蓋了所有這些其他變型或修改。
[0351]本發(fā)明還公開了 Al.—種問答頁面相關(guān)問題推薦方法,包括:
[0352]根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與所述搜索詞相關(guān)的至少一個相關(guān)問題;
[0353]根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的所述相關(guān)問題進(jìn)行篩選;
[0354]根據(jù)所述相關(guān)問題的篩選結(jié)果,確定問答頁面推薦給用戶的相關(guān)問題。
[0355]A2.根據(jù)Al所述的方法,其中,所述至少一個預(yù)設(shè)規(guī)則包括下列至少之一:
[0356]根據(jù)核心詞對所述相關(guān)問題進(jìn)行篩選;
[0357]根據(jù)用戶的瀏覽行為日志對所述相關(guān)問題進(jìn)行篩選;
[0358]根據(jù)用戶的搜索點(diǎn)擊行為日志對所述相關(guān)問題進(jìn)行篩選。
[0359]A3.根據(jù)A2所述的方法,其中,所述根據(jù)核心詞對所述相關(guān)問題進(jìn)行篩選,包括:
[0360]獲取與所述搜索詞對應(yīng)的問答頁面;
[0361]提取所述問答頁面中的核心詞,并根據(jù)所述核心詞篩選所述相關(guān)問題。
[0362]Α4.根據(jù)A3所述的方法,其中,提取所述問答頁面中的至少一個核心詞,包括:
[0363]從問答頁面中提取核心詞候選串;
[0364]對所述核心詞候選串進(jìn)行分詞,提取各個候選串分詞的分類特征;
[0365]根據(jù)所述分類特征篩選各個候選串分詞是否是核心詞。
[0366]Α5.根據(jù)Α4所述的方法,其中,從問答頁面中提取核心詞候選串,包括:
[0367]從所述問答頁面的標(biāo)題中提取核心詞候選串;和/或
[0368]從所述問答頁面的頁面內(nèi)容中,提取與所述搜索詞相關(guān)的字符串,作為核心詞候選串。
[0369]Α6.根據(jù)Α5所述的方法,其中,提取與所述搜索詞相關(guān)的字符串,包括:
[0370]對所述搜索詞進(jìn)行分詞;
[0371]從所述問答頁面的頁面內(nèi)容中提取包括至少一個搜索詞分詞的字符串。
[0372]Α7.根據(jù)Α4至Α6任一項(xiàng)所述的方法,其中,根據(jù)所述分類特征篩選各個候選串分詞是否是核心詞,包括:
[0373]根據(jù)所述分類特征對候選串分詞進(jìn)行分類,根據(jù)分類結(jié)果確定各個候選串分詞是否是核心詞;
[0374]所述分類特征包括下列特征中的至少一種:名詞、熱度詞表、超鏈接、相關(guān)問題共現(xiàn)率、文檔詞頻。
[0375]Α8.根據(jù)Α7所述的方法,其中,根據(jù)分類結(jié)果確定各個候選串分詞是否是核心詞,具體包括:
[0376]針對每個分類,將該分類中各個候選串分詞與用戶輸入的搜索詞進(jìn)行匹配,篩選出匹配度最高的設(shè)定數(shù)量的候選串分詞,作為所述核心詞;
[0377]針對每個分類,根據(jù)該分類中各個候選串分詞的使用頻率統(tǒng)計值,篩選出所述使用頻率統(tǒng)計值最高的設(shè)定數(shù)量的候選串分詞,作為所述核心詞;其中,候選串分詞的使用頻率統(tǒng)計值包括下列參數(shù)之一:被搜索次數(shù)、被點(diǎn)擊次數(shù)、曾作為核心詞的次數(shù)、曾作為搜索詞的次數(shù)。
[0378]Α9.根據(jù)Α2所述的方法,其中,所述根據(jù)用戶的瀏覽行為日志對所述相關(guān)問題進(jìn)行篩選,包括:
[0379]根據(jù)選定時間段內(nèi)用戶的瀏覽行為日志,確定獲取的所述相關(guān)問題的瀏覽權(quán)重;
[0380]根據(jù)所述瀏覽權(quán)重對所述相關(guān)問題進(jìn)行排序;
[0381]根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選。
[0382]Α10.根據(jù)Α9所述的方法,其中,所述根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選,包括:
[0383]根據(jù)所述排序結(jié)果提取第一預(yù)定個數(shù)個所述相關(guān)問題。
[0384]All.根據(jù)A9或A10所述的方法,其中,所述根據(jù)選定時間段內(nèi)用戶的瀏覽行為日志,確定獲取的所述相關(guān)問題的瀏覽權(quán)重,包括:
[0385]根據(jù)瀏覽所述相關(guān)問題的瀏覽用戶,對獲取的相關(guān)問題進(jìn)行分組;其中,每個相關(guān)問題分組中包括一個瀏覽用戶對應(yīng)的部分或者全部相關(guān)問題;
[0386]在每個相關(guān)問題分組中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重;
[0387]獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)瀏覽權(quán)重,將獲取到的相關(guān)瀏覽權(quán)重進(jìn)行加權(quán),得到獲取的每個相關(guān)問題的瀏覽權(quán)重。
[0388]A12.根據(jù)All所述的方法,其中,根據(jù)瀏覽所述相關(guān)問題的瀏覽用戶,對獲取的相關(guān)問題進(jìn)行分組,包括:
[0389]根據(jù)選定時間段內(nèi)的瀏覽行為日志,得到每個瀏覽用戶的瀏覽特征向量{Tl、T2、……、T1、Ti+l、……、Τη},其中,Ti表示一個相關(guān)問題。
[0390]Α13.根據(jù)Α12所述的方法,其中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重,包括:
[0391]在每個相關(guān)問題分組中,根據(jù)瀏覽用戶瀏覽每個相關(guān)問題的瀏覽時間對該相關(guān)問題分組中的所有相關(guān)問題進(jìn)行排序;
[0392]根據(jù)排序結(jié)果中,劃分瀏覽時間間隔小于預(yù)設(shè)的時間間隔閾值的相關(guān)問題至同一會話組;
[0393]在每個會話組中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重。
[0394]Α14.根據(jù)Α12或Α13所述的方法,其中,所述瀏覽特征向量中的元素Ti的屬性包括下列參數(shù)中的至少一個:
[0395]問答頁面的生成時間、答案數(shù)、好評數(shù)、差評數(shù)、問答長度、用戶瀏覽時間、用戶停留時間等。
[0396]Α15.根據(jù)Α2所述的方法,其中,所述根據(jù)用戶的搜索點(diǎn)擊行為日志對所述相關(guān)問題進(jìn)行篩選,包括:
[0397]根據(jù)選定時間段內(nèi)用戶的搜索點(diǎn)擊日志,確定獲取的所述相關(guān)問題的點(diǎn)擊權(quán)重;
[0398]根據(jù)所述點(diǎn)擊權(quán)重對獲取的相關(guān)問題進(jìn)行排序;
[0399]根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選。
[0400]Α16.根據(jù)Α15所述的方法,其中,所述根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選,包括:
[0401]根據(jù)所述排序結(jié)果提取第二預(yù)定個數(shù)個所述相關(guān)問題。
[0402]Α17.根據(jù)Α15或Α16所述的方法,其中,根據(jù)設(shè)定時間段內(nèi)用戶的搜索點(diǎn)擊日志,確定獲取的所述相關(guān)問題的點(diǎn)擊權(quán)重,包括:
[0403]根據(jù)所述相關(guān)問題對應(yīng)的查詢請求串,對獲取的所述相關(guān)問題進(jìn)行分組;其中,每個相關(guān)問題分組中包括一個查詢請求串對應(yīng)的部分或全部相關(guān)問題;
[0404]在每個相關(guān)問題分組中,計算組中每個相關(guān)問題與組中其他相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重;
[0405]獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)點(diǎn)擊權(quán)重,將獲取到的相關(guān)點(diǎn)擊權(quán)重進(jìn)行加權(quán),得到獲取的每個相關(guān)問題的點(diǎn)擊權(quán)重。
[0406]Α18.根據(jù)Α17所述的方法,其中,根據(jù)所述相關(guān)問題對應(yīng)的查詢請求串,對獲取的所述相關(guān)問題進(jìn)行分組,包括:
[0407]根據(jù)所述相關(guān)問題對應(yīng)的查詢請求串,得到每個查詢請求串的點(diǎn)擊特征向量{Tl、Τ2、……、T1、Ti+l、……、Τη},其中Ti表示一個相關(guān)問題。
[0408]Α19.根據(jù)Α18所述的方法,其中,點(diǎn)擊特征向量中的元素Ti的屬性包括下列參數(shù)中的至少一個:
[0409]問答頁面的生成時間、答案數(shù)、好評數(shù)、差評數(shù)、問答長度、展示次數(shù)、被點(diǎn)擊次數(shù)等。
[0410]本發(fā)明還公開了 B20.—種問答頁面相關(guān)問題推薦裝置,包括:
[0411 ] 獲取器,適于根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與所述搜索詞相關(guān)的至少一個相關(guān)問題;
[0412]篩選器,適于根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的所述相關(guān)問題進(jìn)行篩選;
[0413]推薦器,適于根據(jù)所述相關(guān)問題的篩選結(jié)果,確定問答頁面推薦給用戶的相關(guān)問題。
[0414]B21.根據(jù)B20所述的裝置,其中,所述篩選器還包括:
[0415]第一篩選模塊,適于根據(jù)用戶的瀏覽行為日志對所述相關(guān)問題進(jìn)行篩選;
[0416]第二篩選模塊,適于根據(jù)用戶的搜索點(diǎn)擊行為日志對所述相關(guān)問題進(jìn)行篩選;
[0417]第三篩選模塊,適于根據(jù)核心詞對所述相關(guān)問題進(jìn)行篩選。
[0418]B22.根據(jù)B21所述的裝置,其中,所述第三篩選模塊還包括:
[0419]獲取單元,適于獲取與所述搜索詞對應(yīng)的問答頁面;
[0420]提取單元,適于提取所述問答頁面中的核心詞;
[0421]確定單元,適于根據(jù)所述核心詞篩選所述相關(guān)問題。
[0422]B23.根據(jù)B22所述的裝置,其中,所述提取單元還適于:
[0423]從問答頁面中提取核心詞候選串;
[0424]對所述核心詞候選串進(jìn)行分詞,提取各個候選串分詞的分類特征;
[0425]根據(jù)所述分類特征篩選各個候選串分詞是否是核心詞。
[0426]B24.根據(jù)B23所述的裝置,其中,所述提取單元還適于:
[0427]從所述問答頁面的標(biāo)題中提取核心詞候選串;和/或
[0428]從所述問答頁面的頁面內(nèi)容中,提取與所述搜索詞相關(guān)的字符串,作為核心詞候選串。
[0429]B25.根據(jù)B24所述的裝置,其中,所述提取單元還適于:
[0430]對所述搜索詞進(jìn)行分詞;
[0431]從所述問答頁面的頁面內(nèi)容中提取包括至少一個搜索詞分詞的字符串。
[0432]B26.根據(jù)B23至B25任一項(xiàng)所述的裝置,其中,所述提取單元還適于:
[0433]根據(jù)所述分類特征對候選串分詞進(jìn)行分類,根據(jù)分類結(jié)果確定各個候選串分詞是否是核心詞;
[0434]所述分類特征包括下列特征中的至少一種:名詞、熱度詞表、超鏈接、相關(guān)問題共現(xiàn)率、文檔詞頻。
[0435]B27.根據(jù)B26所述的裝置,其中,所述提取單元還適于:
[0436]針對每個分類,將該分類中各個候選串分詞與用戶輸入的搜索詞進(jìn)行匹配,篩選出匹配度最高的設(shè)定數(shù)量的候選串分詞,作為所述核心詞;
[0437]針對每個分類,根據(jù)該分類中各個候選串分詞的使用頻率統(tǒng)計值,篩選出所述使用頻率統(tǒng)計值最高的設(shè)定數(shù)量的候選串分詞,作為所述核心詞;其中,候選串分詞的使用頻率統(tǒng)計值包括下列參數(shù)之一:被搜索次數(shù)、被點(diǎn)擊次數(shù)、曾作為核心詞的次數(shù)、曾作為搜索詞的次數(shù)。
[0438]B28.根據(jù)B21所述的裝置,其中,所述第一篩選模塊還包括:
[0439]第一權(quán)重確定單元,適于根據(jù)選定時間段內(nèi)用戶的瀏覽行為日志,確定獲取的所述相關(guān)問題的瀏覽權(quán)重;
[0440]第一排序單元,適于根據(jù)所述瀏覽權(quán)重對獲取的相關(guān)問題進(jìn)行排序;
[0441]第一篩選單元,適于根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選。
[0442]B29.根據(jù)B28所述的裝置,其中,所述第一篩選單元還適于:
[0443]根據(jù)所述排序結(jié)果提取第一預(yù)定個數(shù)個所述相關(guān)問題。
[0444]B30.根據(jù)B28或B29所述的裝置,其中,所述第一權(quán)重確定單元還適于:
[0445]根據(jù)瀏覽所述相關(guān)問題的瀏覽用戶,對獲取的相關(guān)問題進(jìn)行分組;其中,每個相關(guān)問題分組中包括一個瀏覽用戶對應(yīng)的部分或者全部相關(guān)問題;
[0446]在每個相關(guān)問題分組中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重;
[0447]獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)瀏覽權(quán)重,將獲取到的相關(guān)瀏覽權(quán)重進(jìn)行加權(quán),得到獲取的每個相關(guān)問題的瀏覽權(quán)重。
[0448]B31.根據(jù)B30所述的裝置,其中,所述第一權(quán)重確定單元還適于:
[0449]根據(jù)選定時間段內(nèi)的瀏覽行為日志,得到每個瀏覽用戶的瀏覽特征向量{Tl、T2、……、T1、Ti+l、……、Τη},其中,Ti表示一個相關(guān)問題。
[0450]Β32.根據(jù)Β31所述的裝置,其中,所述第一權(quán)重確定單元還適于:
[0451]在每個相關(guān)問題分組中,根據(jù)瀏覽用戶瀏覽每個相關(guān)問題的瀏覽時間對該相關(guān)問題分組中的所有相關(guān)問題進(jìn)行排序;
[0452]根據(jù)排序結(jié)果中,劃分瀏覽時間間隔小于預(yù)設(shè)的時間間隔閾值的相關(guān)問題至同一會話組;
[0453]在每個會話組中,計算組中每個相關(guān)問題與組中其它相關(guān)問題的相關(guān)瀏覽權(quán)重。
[0454]Β33.根據(jù)Β21所述的裝置,其中,所述第二篩選模塊還包括:
[0455]第二權(quán)重確定單元,適于根據(jù)選定時間段內(nèi)用戶的搜索點(diǎn)擊日志,確定獲取的所述相關(guān)問題的點(diǎn)擊權(quán)重;
[0456]第二排序單元,適于根據(jù)所述點(diǎn)擊權(quán)重對獲取的相關(guān)問題進(jìn)行排序;
[0457]第二篩選單元,適于根據(jù)排序結(jié)果對所述相關(guān)問題進(jìn)行篩選。
[0458]Β34.根據(jù)Β33所述的裝置,其中,所述第二權(quán)重確定單元還適于:
[0459]根據(jù)所述相關(guān)問題對應(yīng)的查詢請求串,對獲取的所述相關(guān)問題進(jìn)行分組;其中,每個相關(guān)問題分組中包括一個查詢請求串對應(yīng)的部分或全部相關(guān)問題;
[0460]在每個相關(guān)問題分組中,計算組中每個相關(guān)問題與組中其他相關(guān)問題的相關(guān)點(diǎn)擊權(quán)重;
[0461]獲取同一相關(guān)問題在各相關(guān)問題分組中計算得到的相關(guān)點(diǎn)擊權(quán)重,將獲取到的相關(guān)點(diǎn)擊權(quán)重進(jìn)行加權(quán),得到獲取的每個相關(guān)問題的點(diǎn)擊權(quán)重。
[0462]Β35.根據(jù)Β34所述的裝置,其中,所述第二權(quán)重確定單元還適于:
[0463]根據(jù)所述相關(guān)問題對應(yīng)的查詢請求串,得到每個查詢請求串的點(diǎn)擊特征向量{Tl、Τ2、……、Τη},實(shí)現(xiàn)對獲取的相關(guān)問題進(jìn)行分組;其中Ti表示一個相關(guān)問題。
[0464]Β36.根據(jù)Β34所述的裝置,其中,所述第二權(quán)重確定單元還適于:
[0465]得到的點(diǎn)擊特征向量中的元素Ti的屬性包括下列參數(shù)中的至少一個:
[0466]問答頁面的生成時間、答案數(shù)、好評數(shù)、差評數(shù)、問答長度、展示次數(shù)、被點(diǎn)擊次數(shù)等。
【權(quán)利要求】
1.一種問答頁面相關(guān)問題推薦方法,包括: 根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與所述搜索詞相關(guān)的至少一個相關(guān)問題; 根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的所述相關(guān)問題進(jìn)行篩選; 根據(jù)所述相關(guān)問題的篩選結(jié)果,確定問答頁面推薦給用戶的相關(guān)問題。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述至少一個預(yù)設(shè)規(guī)則包括下列至少之一: 根據(jù)核心詞對所述相關(guān)問題進(jìn)行篩選; 根據(jù)用戶的瀏覽行為日志對所述相關(guān)問題進(jìn)行篩選; 根據(jù)用戶的搜索點(diǎn)擊行為日志對所述相關(guān)問題進(jìn)行篩選。
3.根據(jù)權(quán)利要求1-2任一項(xiàng)所述的方法,其中,所述根據(jù)核心詞對所述相關(guān)問題進(jìn)行篩選,包括: 獲取與所述搜索詞對應(yīng)的問答頁面; 提取所述問答頁面中的核心詞,并根據(jù)所述核心詞篩選所述相關(guān)問題。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其中,提取所述問答頁面中的至少一個核心詞,包括: 從問答頁面中提取核心詞候選串; 對所述核心詞候選串進(jìn)行分詞,提取各個候選串分詞的分類特征; 根據(jù)所述分類特征篩選各個候選串分詞是否是核心詞。
5.根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法,其中,從問答頁面中提取核心詞候選串,包括: 從所述問答頁面的標(biāo)題中提取核心詞候選串;和/或 從所述問答頁面的頁面內(nèi)容中,提取與所述搜索詞相關(guān)的字符串,作為核心詞候選串。
6.根據(jù)權(quán)利要求1-5任一項(xiàng)所述的方法,其中,提取與所述搜索詞相關(guān)的字符串,包括: 對所述搜索詞進(jìn)行分詞; 從所述問答頁面的頁面內(nèi)容中提取包括至少一個搜索詞分詞的字符串。
7.—種問答頁面相關(guān)問題推薦裝置,包括: 獲取器,適于根據(jù)來自用戶的搜索詞,獲取數(shù)據(jù)庫與所述搜索詞相關(guān)的至少一個相關(guān)冋題; 篩選器,適于根據(jù)至少一個預(yù)設(shè)規(guī)則對獲取的所述相關(guān)問題進(jìn)行篩選; 推薦器,適于根據(jù)所述相關(guān)問題的篩選結(jié)果,確定問答頁面推薦給用戶的相關(guān)問題。
8.根據(jù)權(quán)利要求7所述的裝置,其中,所述篩選器還包括: 第一篩選模塊,適于根據(jù)用戶的瀏覽行為日志對所述相關(guān)問題進(jìn)行篩選; 第二篩選模塊,適于根據(jù)用戶的搜索點(diǎn)擊行為日志對所述相關(guān)問題進(jìn)行篩選; 第三篩選模塊,適于根據(jù)核心詞對所述相關(guān)問題進(jìn)行篩選。
9.根據(jù)權(quán)利要求7-8任一項(xiàng)所述的裝置,其中,所述第三篩選模塊還包括: 獲取單元,適于獲取與所述搜索詞對應(yīng)的問答頁面; 提取單元,適于提取所述問答頁面中的核心詞; 確定單元,適于根據(jù)所述核心詞篩選所述相關(guān)問題。
10.根據(jù)權(quán)利要求7-9任一項(xiàng)所述的裝置,其中,所述提取單元還適于:從問答頁面中提取核心詞候選串;對所述核心詞候選串進(jìn)行分詞,提取各個候選串分詞的分類特征;根據(jù)所述分類特征篩選各個候選串分詞是否是核心詞。
【文檔編號】G06F17/30GK104462553SQ201410828866
【公開日】2015年3月25日 申請日期:2014年12月25日 優(yōu)先權(quán)日:2014年12月25日
【發(fā)明者】沈亮, 周偉, 梁任鵬, 項(xiàng)碧波 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1