搜索結(jié)果的展現(xiàn)方法和裝置制造方法
【專利摘要】本發(fā)明提出一種搜索結(jié)果的展現(xiàn)方法和裝置,該搜索結(jié)果的展現(xiàn)方法包括接收用戶輸入的搜索詞;根據(jù)所述搜索詞,獲取搜索結(jié)果,所述搜索結(jié)果包括聚合推薦結(jié)果以及與所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由;向所述用戶展現(xiàn)所述搜索結(jié)果。該方法能夠提高用戶查找結(jié)果的效率,并提高可靠性。
【專利說明】搜索結(jié)果的展現(xiàn)方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,尤其涉及一種搜索結(jié)果的展現(xiàn)方法和裝置。
【背景技術(shù)】
[0002]用戶經(jīng)常在互聯(lián)網(wǎng)的海量信息中搜索需要的信息,搜索引擎漸漸成為必不可少的工具?;ヂ?lián)網(wǎng)中普通存在觀點推薦需求的問題,例如,“孕婦能吃什么水果”、“孕婦吃什么海產(chǎn)品補(bǔ)鋅”等。目前,對于此類問題,用戶輸入搜索詞后,搜索引擎向用戶返回的搜索結(jié)果通常是多個網(wǎng)頁的鏈接,用戶通過點擊鏈接,查看頁面內(nèi)容,自行尋找和歸納答案。
[0003]但是,這種方式效率比較低且缺乏可靠性。
【發(fā)明內(nèi)容】
[0004]本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0005]為此,本發(fā)明的一個目的在于提出一種搜索結(jié)果的展現(xiàn)方法,該方法可以提高用戶獲取搜索結(jié)果的效率,且提高搜索結(jié)果的可靠性。
[0006]本發(fā)明的另一個目的在于提出一種搜索結(jié)果的展現(xiàn)裝置。
[0007]為達(dá)到上述目的,本發(fā)明第一方面實施例提出的搜索結(jié)果的展現(xiàn)方法,包括:接收用戶輸入的搜索詞;根據(jù)所述搜索詞,獲取搜索結(jié)果,所述搜索結(jié)果包括聚合推薦結(jié)果以及與所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由;向所述用戶展現(xiàn)所述搜索結(jié)果。
[0008]本發(fā)明第一方面實施例提出的搜索結(jié)果的展現(xiàn)方法,通過直接給出聚合推薦結(jié)果,可以減少用戶查找時間,提高搜索結(jié)果的查找效率;并且,本實施例通過給出推薦理由,可以在用戶查找時有所依據(jù),提高搜索結(jié)果的可靠性。
[0009]為達(dá)到上述目的,本發(fā)明第二方面實施例提出的搜索結(jié)果的展現(xiàn)裝置,包括:接收模塊,用于接收用戶輸入的搜索詞;獲取模塊,用于根據(jù)所述搜索詞,獲取搜索結(jié)果,所述搜索結(jié)果包括聚合推薦結(jié)果以及與所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由;展現(xiàn)模塊,用于向所述用戶展現(xiàn)所述搜索結(jié)果。
[0010]本發(fā)明第二方面實施例提出的搜索結(jié)果的展現(xiàn)裝置,通過直接給出聚合推薦結(jié)果,可以減少用戶查找時間,提高搜索結(jié)果的查找效率;并且,本實施例通過給出推薦理由,可以在用戶查找時有所依據(jù),提高搜索結(jié)果的可靠性。
[0011]為達(dá)到上述目的,本發(fā)明第三方面實施例提出的客戶端設(shè)備,包括:殼體、處理器、存儲器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內(nèi)部,處理器和存儲器設(shè)置在電路板上;電源電路,用于為客戶端設(shè)備的各個電路或器件供電;存儲器用于存儲可執(zhí)行程序代碼;處理器通過讀取存儲器中存儲的可執(zhí)行程序代碼來運行與可執(zhí)行程序代碼關(guān)聯(lián)的程序,以用于執(zhí)行以下步驟:接收用戶輸入的搜索詞;根據(jù)所述搜索詞,獲取搜索結(jié)果,所述搜索結(jié)果包括聚合推薦結(jié)果以及與所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由;向所述用戶展現(xiàn)所述搜索結(jié)果。
[0012]本發(fā)明第三方面實施例提出的客戶端設(shè)備,通過直接給出聚合推薦結(jié)果,可以減少用戶查找時間,提高搜索結(jié)果的查找效率;并且,本實施例通過給出推薦理由,可以在用戶查找時有所依據(jù),提高搜索結(jié)果的可靠性。
[0013]本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
【專利附圖】
【附圖說明】
[0014]本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解,其中:
[0015]圖1是本發(fā)明一實施例提出的搜索結(jié)果的展現(xiàn)方法的流程示意圖;
[0016]圖2是本發(fā)明實施例中展現(xiàn)搜索結(jié)果的一種展現(xiàn)示意圖;
[0017]圖3是本發(fā)明實施例中展現(xiàn)搜索結(jié)果的另一種展現(xiàn)示意圖;
[0018]圖4是本發(fā)明實施例中展現(xiàn)搜索結(jié)果的另一種展現(xiàn)示意圖;
[0019]圖5是本發(fā)明實施例中展現(xiàn)搜索結(jié)果的另一種展現(xiàn)示意圖;
[0020]圖6是本發(fā)明另一實施例提出的搜索結(jié)果的展現(xiàn)方法的流程示意圖;
[0021]圖7是本發(fā)明實施例中觀點聚合處理的流程示意圖;
[0022]圖8是本發(fā)明實施例中離線流程的處理示意圖;
[0023]圖9是本發(fā)明實施例中實例化搜索詞的流程示意圖;
[0024]圖10是本發(fā)明實施例中聚類處理的流程示意圖;
[0025]圖11是本發(fā)明實施例中觀點分析的流程示意圖;
[0026]圖12是本發(fā)明另一實施例提出的搜索結(jié)果的展現(xiàn)裝置的結(jié)構(gòu)示意圖;
[0027]圖13是本發(fā)明另一實施例提出的搜索結(jié)果的展現(xiàn)裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0028]下面詳細(xì)描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反,本發(fā)明的實施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
[0029]圖1是本發(fā)明一實施例提出的搜索結(jié)果的展現(xiàn)方法的流程示意圖,該方法包括:
[0030]Sll:搜索引擎接收用戶輸入的搜索詞。
[0031]其中,本發(fā)明實施例中處理的搜索詞可以具體為答案是實體類型的搜索詞,例如,搜索詞是“孕婦能吃什么水果”或者“孕婦吃什么海產(chǎn)品補(bǔ)鋅”等這類問題。
[0032]這類問題的答案通常是實體類型,實體(entity)是客觀世界中存在的且可互相區(qū)分的事物,實體可以是人也可以是物體實物,或者,也可以是抽象概念。例如,“蘋果”、“梨”、“蝦”等這些都屬于實體。
[0033]S12:搜索引擎根據(jù)所述搜索詞,獲取搜索結(jié)果,所述搜索結(jié)果包括聚合推薦結(jié)果以及與所述聚合推薦結(jié)果對應(yīng)的推薦理由。
[0034]相關(guān)技術(shù)中,搜索引擎得到的搜索結(jié)果通常是網(wǎng)頁的鏈接,例如,向用戶展現(xiàn)“孕婦能吃什么水果_百度知道”這一鏈接結(jié)果,用戶需要點擊該鏈接后進(jìn)入相應(yīng)的百度知道的頁面,進(jìn)而在該百度知道的頁面上查找結(jié)果。
[0035]而本發(fā)明實施例中獲取的搜索結(jié)果包括的是具體的聚合推薦結(jié)果,例如相關(guān)技術(shù)中在上述的百度知道的頁面上展現(xiàn)的是“蘋果”、“梨”這些結(jié)果,而本實施例直接獲取“蘋果”、“梨”這些聚合推薦結(jié)果,而不再需要用戶進(jìn)入頁面后才看到。
[0036]另外,本發(fā)明實施例中不僅給出聚合推薦結(jié)果,還會給出這些聚合推薦結(jié)果的理由,例如,“蘋果”有多少人推薦,“梨”有多少人推薦等。或者,推薦理由也可以是網(wǎng)友的回答,例如“蘋果富含VC,對寶寶好”等?;蛘?,推薦理由也可以是從網(wǎng)友回答的問題中提取的關(guān)鍵字,例如對應(yīng)“蘋果”的推薦理由是“富含VC”。
[0037]S13:搜索引擎向所述用戶展現(xiàn)所述搜索結(jié)果。
[0038]其中,根據(jù)用戶所使用的設(shè)備的不同,具體的展現(xiàn)形式也可以不同。
[0039]具體的,如果在個人電腦(Personal Computer, PC)上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在同一個頁面上進(jìn)行展現(xiàn)。
[0040]進(jìn)一步的,在PC上展現(xiàn)時可以為純標(biāo)簽(TAG)形式或者配圖形式。
[0041]例如,參見圖2,給出了在PC上以純標(biāo)簽形式展現(xiàn)的搜索結(jié)果,其中,當(dāng)用戶搜索“北京特產(chǎn)”時,可以直接顯示“北京烤鴨”、“六必居醬菜”這些聚合推薦結(jié)果,并且在聚合推薦結(jié)果所在頁面上還顯示相應(yīng)的推薦理由,例如,“北京烤鴨”有27人推薦,以及網(wǎng)友對于“北京烤鴨”這一問題的回答。
[0042]參見圖3,給出了在PC上以配圖形式展現(xiàn)的搜索結(jié)果,其中,當(dāng)用戶搜索“女性為主角的電影”時,可以直接顯示“瘋狂原始人”、“毒戰(zhàn)”這些聚合推薦結(jié)果,并且在聚合推薦結(jié)果所在頁面上還顯示相應(yīng)的推薦理由,例如,“瘋狂原始人”有7人推薦,以及網(wǎng)友對于“瘋狂原始人”這一問題的回答。
[0043]進(jìn)一步的,推薦理由可以采用如下方式展現(xiàn):
[0044]I)默認(rèn)展現(xiàn)第一個推薦理由,點擊圖標(biāo)重新搜索推薦理由;
[0045]2)默認(rèn)展現(xiàn)第一個實體的推薦理由,點擊圖標(biāo)切換推薦理由;
[0046]3)默認(rèn)不展現(xiàn)推薦理由,點擊實體后觸發(fā)該實體關(guān)聯(lián)的推薦理由。
[0047]另一方面,如果在移動設(shè)備上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在不同的頁面上進(jìn)行展現(xiàn),其中,展現(xiàn)所述推薦理由的頁面是展現(xiàn)所述聚合推薦結(jié)果的頁面的下一級頁面。
[0048]例如,參見圖4,給出了在移動設(shè)備上展現(xiàn)的搜索結(jié)果,其中,當(dāng)用戶搜索孕婦能吃什么水果時,可以直接顯示“蘋果”、“香蕉”這些聚合推薦結(jié)果。
[0049]由于移動設(shè)備的顯示限制,聚合推薦結(jié)果對應(yīng)的理由通常不能與聚合推薦結(jié)果在同一頁面顯示,此時,可以點擊包含聚合推薦結(jié)果的頁面進(jìn)入下一級頁面,例如,參見圖5,當(dāng)點擊母嬰知識這一頁面后可以進(jìn)入下一級頁面,在該頁面上可以顯示具體的推薦理由,例如,用戶回答“蘋果很好的,一天吃一個,生出寶寶皮膚會好很白。都可以吃的,但是不要過量吃…”。
[0050]當(dāng)然,可以理解的是,在展現(xiàn)時除了展現(xiàn)上述得到的聚合推薦結(jié)果和推薦理由外,還可以展現(xiàn)目前已有的結(jié)果,例如,如圖2所示,還可以展現(xiàn)“北京特產(chǎn)_百度百科”這一頁面鏈接等。
[0051] 進(jìn)一步的,可以建立每個聚合推薦結(jié)果與其他網(wǎng)頁的鏈接,以便通過選中聚合推薦結(jié)果后跳轉(zhuǎn)到另一頁面。例如,建立聚合推薦結(jié)果與購買網(wǎng)站的鏈接關(guān)系,這樣就可以當(dāng)選中某個聚合推薦結(jié)果后就可以跳轉(zhuǎn)到相應(yīng)網(wǎng)站去購買。
[0052]本實施例通過直接給出聚合推薦結(jié)果,可以減少用戶查找時間,提高搜索結(jié)果的查找效率;并且,本實施例通過給出推薦理由,可以在用戶查找時有所依據(jù),提高搜索結(jié)果的可靠性。
[0053]圖6是本發(fā)明另一實施例提出的搜索結(jié)果的展現(xiàn)方法的流程示意圖,該方法包括:
[0054]S61:用戶輸入搜索詞(query)。
[0055]S62:對搜索詞進(jìn)行分析。
[0056]其中,對搜索詞進(jìn)行分析不僅包括基礎(chǔ)分析,還包括針對問題需求的分析。
[0057]基礎(chǔ)分析包括:分詞、詞性標(biāo)注、專名識別、字詞(term)重要性等。
[0058]針對問題需求的分析包括:問題類型分析和答案類型分析。
[0059]問題類型分析用于目標(biāo)問答對的篩選;答案類型分析用于后續(xù)的實體觀點抽取,以便根據(jù)搜索詞所需要的實體類型抽取相應(yīng)的實體。
[0060]問題類型分析可以包括:識別用戶輸入的搜索詞是否屬于適合為用戶推薦實體的搜索詞,當(dāng)用戶輸入的搜索詞屬于適合為用戶推薦實體的搜索詞時再進(jìn)行后續(xù)流程。例如,搜索詞為“孕婦吃什么海產(chǎn)品補(bǔ)鋅”時,由于其答案將是“三文魚”等這些實體答案,因此,可以確定該搜索詞屬于適合為用戶推薦實體的搜索詞,對其進(jìn)行后續(xù)處理。再例如,搜索詞是“孕婦是否應(yīng)該吃海產(chǎn)品”時,由于其答案將是“是”、“否”這些非實體的答案,因此,可以確定該搜索詞不屬于適合為用戶推薦實體的搜索詞,此時對其不再進(jìn)行本發(fā)明實施例中的后續(xù)處理。
[0061]具體的,問題類型分析時可以根據(jù)搜索詞中包含的分詞來確定是否適合進(jìn)行實體推薦,例如,如上所述的,當(dāng)搜索詞包含“什么”這類詞時可以確定為適合實體推薦的,或者,當(dāng)搜索詞包含“是否”這類詞時可以確定為不適合實體推薦的。當(dāng)然,上述的問題類型分析的方式只是一種舉例,可以根據(jù)實際需要設(shè)定相應(yīng)的規(guī)則。
[0062]答案類型分析可以包括:識別需求類型詞(Lexical Answer Type,LAT),以便根據(jù)需求類型詞找到用戶需要的實體類型。例如,“孕婦吃什么海產(chǎn)品補(bǔ)鋅”中,需求類型詞為
“海產(chǎn)品”。
[0063]具體的,答案類型分析時可以將與“什么”相關(guān)聯(lián)的詞確定為需求類型詞,如上述的“海產(chǎn)品”。當(dāng)然,上述的答案類型分析的方式只是一種舉例,可以根據(jù)實際需要設(shè)定相應(yīng)的規(guī)則。
[0064]S63:觀點聚合系統(tǒng)在用戶輸入的搜索詞屬于適合為用戶推薦實體的搜索詞時,根據(jù)所述搜索詞進(jìn)行觀點聚合處理,得到搜索結(jié)果,搜索結(jié)果包括聚合推薦結(jié)果和對應(yīng)的推
薦理由。
[0065]其中,該步驟可以將歷史數(shù)據(jù)中與該搜索詞相關(guān)的網(wǎng)友回答進(jìn)行聚合,以得到聚合推薦結(jié)果和推薦理由,具體處理過程可以參見后續(xù)描述。另外,“對應(yīng)的”也可以稱為“關(guān)聯(lián)的”。
[0066]S64:觀點聚合系統(tǒng)將得到的搜索結(jié)果輸出給顯示裝置,由顯示裝置向用戶展現(xiàn)搜索結(jié)果。[0067]具體展現(xiàn)方式可以參見S13,本實施例不再贅述。下面具體描述觀點聚合處理的流程。
[0068]參見圖7,觀點聚合處理的流程可以包括:
[0069]S71:根據(jù)用戶輸入的搜索詞,從倒排(BS)索引庫中,獲取與該搜索詞關(guān)聯(lián)的搜索詞實例,并計算每個搜索詞實例與搜索詞之間的語義相似度數(shù)值,將語義相似度數(shù)值大于設(shè)定閾值的搜索詞實例確定為擴(kuò)展搜索詞。
[0070]其中,倒排索引庫可以是離線方式預(yù)先建立的,具體建立過程可以參見后續(xù)實施例。倒排索引庫中存儲搜索詞和搜索詞實例的關(guān)聯(lián)關(guān)系,通過一搜索詞,可以在該倒排索引庫中找到關(guān)聯(lián)的多個搜索詞實例,具體返回的可以是每個搜索詞實例的標(biāo)識(queryid)。
[0071]S72:從Q-Q正排索引庫中,獲取與該擴(kuò)展搜索詞關(guān)聯(lián)的問題和第一特征數(shù)據(jù)。
[0072]其中,Q-Q正排索引庫也可以是離線方式預(yù)先建立的,具體建立過程可以參見后續(xù)實施例。
[0073]Q-Q正排索引庫存儲搜索詞和問題之間的關(guān)聯(lián)關(guān)系,具體可以是queryid-questionid的關(guān)聯(lián)信息。給定queryid,得到相關(guān)questionid和第一特征數(shù)據(jù),第一特征數(shù)據(jù)包括語義相似度、用戶行為等,為在線排序提供特征數(shù)據(jù)。
[0074]S73:從Q-A正排索引庫中,獲取與該問題關(guān)聯(lián)的答案和第二特征數(shù)據(jù)。
[0075]其中,Q-A正排索引庫也可以是離線方式預(yù)先建立的,具體建立過程可以參見后續(xù)實施例。
[0076]Q-A正排索引庫存儲問題和答案的關(guān)聯(lián)關(guān)系,具體可以是questionid-answer的關(guān)聯(lián)信息。給定questionid,得到關(guān)聯(lián)的answer和第二特征數(shù)據(jù),包括實體,用戶觀點、實體相關(guān)度、候選實體的被推薦次數(shù)、候選實體-需求類型詞匹配度、候選實體上下文-query匹配度等特征。
[0077]S74:進(jìn)行在線實體抽取和相關(guān)度計算,得到篩選后的實體。
[0078]由于存在query和question差異化問題,線下計算不能完全覆蓋所有情況,因此需要對差異大的query和question線上重新計算。
[0079]例如,針對“孕婦吃什么海產(chǎn)品補(bǔ)鋅”這一搜索詞,獲取的答案可能是一段話,如“魚類是很好的補(bǔ)鋅食品”,但經(jīng)過實體抽取后可以抽取出魚類。類似的,根據(jù)其他答案還可以抽取出貝類、堅果、水果、三文魚、蝦皮、牛奶等實體。具體的,可以通過挖掘食物列表,從答案中抽取出魚類、貝類、堅果、水果、三文魚、蝦皮、牛奶等實體。抽取后得到的實體可以稱為候選實體。
[0080]相關(guān)度計算用于計算候選實體和用戶輸入的搜索詞是否相關(guān),具體可以包括:
[0081]a)根據(jù)對搜索詞進(jìn)行分析后得到的需求類型詞,在候選實體中去除不屬于需求類型詞的實體。例如,需要類型詞為“海產(chǎn)品”,則選擇屬于海產(chǎn)品的實體,即魚類、貝類、蝦皮、三文魚,去掉“堅果、水果、牛奶”。
[0082]具體的,可以計算每個候選實體與需求類型詞的語義匹配度,即“魚、堅果、水果、蝦皮、牛奶”等候選實體與“海產(chǎn)品”的匹配度,去除匹配度數(shù)值低于設(shè)定閾值的候選實體。
[0083]匹配度的具體計算方法如下:(1)實體關(guān)聯(lián)的多個類型與需求類型詞之間embedding向量的平均相似度加權(quán)。(2)需求類型詞關(guān)聯(lián)的多個實例與候選實體之間embedding向量的平均相似度加權(quán),其中,需求類型詞的實例可以通過XXX is a***這樣的模板來挖掘。
[0084]b)根據(jù)候選實體的上下文,去除語義上與需求類型詞的匹配度小于設(shè)定閾值的候選實體。例如,“蝦皮”雖然與需求類型詞“海產(chǎn)品”在類型上相匹配,但回答中說的是“蝦皮補(bǔ)鈣”,語義不匹配,因此去掉“蝦皮”,保留“魚類、貝類、三文魚”。
[0085]具體根據(jù)上下文計算匹配度可以包括:首先,通過依存句法分析樹找到和“海產(chǎn)品”有依存關(guān)系的term作為上下文,再根據(jù)該term計算匹配度,計算匹配度的具體計算公式如下:
[0086]語義匹配度W(i|海產(chǎn)品_>蝦皮)=term⑴的重要性打分*答案命中打分(θ|?)*與蝦皮的位置距離*否定關(guān)系打分(O 11)*傾向性分析(0-1),該公式表示在第i個term作為實體上下文時,海產(chǎn)品和蝦皮的語義匹配度打分,其中傾向性分析表示蝦皮前后的情感詞分類打分,該打分可以根據(jù)靜態(tài)統(tǒng)計生成。
[0087]此外,“補(bǔ)鈣”等上下文可作為推薦理由的關(guān)鍵詞候選,在產(chǎn)品展現(xiàn)中使用。
[0088]c)計算候選實體之間的上下位關(guān)系,例如,將“三文魚”歸為“魚類”,最終呈現(xiàn)的答案為:魚類(如三文魚)、貝類。這種上下文關(guān)系可以通過數(shù)據(jù)挖掘?qū)崿F(xiàn),挖掘的來源包括百科的tag、無結(jié)構(gòu)化文本等。比如百科詞條“三文魚”就有一個tag字段“魚類”。
[0089]S75:對篩選后的實體進(jìn)行排序。
[0090]其中,可以根據(jù)第一特征數(shù)據(jù)和第二特征數(shù)據(jù),對篩選后的實體進(jìn)行排序。
[0091]排序可以具體 包括:首先,根據(jù)用戶行為、實體相關(guān)度、語義相似度等多維特征,利用GBRank等已有的排序系統(tǒng),對問答對做排序,通過閾值截斷方法得到相關(guān)性高的問答對。在此基礎(chǔ)上,以問答對中的實體為基準(zhǔn),對答案做排序。具體特征如下=Query-問答對的用戶點擊、候選實體被推薦次數(shù)、候選實體-需求類型詞匹配度、候選實體上下文-query匹配度。基于以上特征,利用GBRank等已有的排序系統(tǒng),對答案進(jìn)行排序。
[0092]S76:對排序后的實體進(jìn)行聚合統(tǒng)計。
[0093]例如,可以包括統(tǒng)計每個實體對應(yīng)的答案的推薦個數(shù),根據(jù)推薦個數(shù)進(jìn)行逆序排列,逆序排列后的答案可以作為推薦理由進(jìn)行展現(xiàn)。例如,對于“瘋狂機(jī)器人”這一聚合推薦結(jié)果,“壁小花小姐”的用戶觀點的推薦個數(shù)最多,則在網(wǎng)友回答中將“壁小花小姐”的觀點排列在第一位。
[0094]上述實施例中采用的倒排索引庫、Q-Q正排索引庫和Q-A正排索引庫可以是采用離線流程建立的。
[0095]圖8是本發(fā)明實施例中離線流程的處理示意圖,包括:
[0096]S81:確定目標(biāo)搜索詞。
[0097]其中,可以逐一將歷史數(shù)據(jù)中的每個屬于適合為用戶推薦實體的搜索詞確定為目標(biāo)搜索詞,以便滿足后續(xù)用戶在線搜索不同搜索詞時的需要。
[0098]S82:對該目標(biāo)搜索詞進(jìn)行實例化,得到該目標(biāo)搜索詞關(guān)聯(lián)的搜索詞實例,并將該目標(biāo)搜索詞和該搜索詞實例對應(yīng)存儲在倒排索引庫中。
[0099]其中,可以通過用戶點擊日志等基礎(chǔ)數(shù)據(jù),對目標(biāo)query做實例化挖掘,具體流程可以參見圖9,該流程S90包括:
[0100]S91:從點擊日志獲取目標(biāo)query發(fā)生點擊的統(tǒng)一資源定符(Uniform ResoureLocator, URL)。[0101]S92:根據(jù)該點擊URL進(jìn)行站點挖掘。
[0102]S93:根據(jù)站點挖掘獲取目標(biāo)站點。
[0103]其中,可以通過簡單頻次統(tǒng)計得到目標(biāo)站點,其中目標(biāo)站點表示主需求的站點,多為垂直問答類網(wǎng)站。
[0104]S94:根據(jù)目標(biāo)站點獲取該目標(biāo)搜索詞關(guān)聯(lián)的搜索詞實例。
[0105]其中,可以反向挖掘目標(biāo)站點在點擊日志中關(guān)聯(lián)的query集合,將該query集合確定為目標(biāo)搜索詞關(guān)聯(lián)的query實例。其中,當(dāng)目標(biāo)站點是綜合類站點,可以進(jìn)一步進(jìn)行問題分類。
[0106]S95:在站點挖掘時,進(jìn)行問答對挖掘,獲取問答對數(shù)據(jù)。
[0107]其中,站點挖掘的同時,可以通過站點去挖掘網(wǎng)頁中的問答對資源,獲取問答對數(shù)據(jù)。
[0108]S96:對問答對數(shù)據(jù)進(jìn)行預(yù)處理和問題分類處理,得到問題實例,將該問題實例也作為目標(biāo)搜索詞關(guān)聯(lián)的搜索詞實例。
[0109]其中,預(yù)處理可以是指問題去噪,分類后生成問題實例,補(bǔ)充到query實例中。
[0110]S83:對搜索詞實例和問答對數(shù)據(jù)進(jìn)行聚類處理,得到聚類后的搜索詞和聚類后的問題,并將聚類后的搜索詞和聚類后的問題關(guān)聯(lián)存儲在Q-Q正排索引庫中。
[0111]其中,參見圖10,聚類處理可以包括問題聚類SlOl和搜索詞實例聚類S102。
[0112]對于同一個網(wǎng)頁,存在多種鏈接方式,導(dǎo)致url的多樣性,這就需要做url歸一化,問題聚類的目的便是如此。通過對問題和答案的聚合(這里沒用hash去重,是因為頁面更新或是title截斷都會出現(xiàn)問題和答案的細(xì)微變化,導(dǎo)致url歸一不到一起),將url歸一到唯一的地址,既可以減少死鏈,又可以擴(kuò)大有效頁面的召回。url歸一化的主站點是一致的,以主站為key切分,可以提升效率,使用已有的k-means系統(tǒng)即可滿足需求。
[0113]Query實例聚類是將挖掘的實例化query做聚合,用于彌補(bǔ)搜索引擎點擊過于集中造成的召回不足問題(絕大多數(shù)的點擊行為都發(fā)生在前3頁)。以根據(jù)term重要性排序,已不可省term為key切分?jǐn)?shù)據(jù),可使用已有的k_means系統(tǒng)。
[0114]S84:根據(jù)問答對數(shù)據(jù),獲取Q-A原始數(shù)據(jù),并對Q-A原始數(shù)據(jù)進(jìn)行觀點分析,得到更新后的Q-A數(shù)據(jù),并將更新后的Q-A數(shù)據(jù)關(guān)聯(lián)存儲在Q-A正排庫中。
[0115]參見圖11,觀點分析主要包括實體抽取Slll和相關(guān)度計算SI 12。
[0116]觀點分析依據(jù)問題表述,從回答中抽取答案實體并計算實體與query的相關(guān)度。如,問題(孕婦吃什么海產(chǎn)品補(bǔ)鋅?)-回答(魚類、貝類、堅果、水果等補(bǔ)鋅,魚類中三文魚尤其好;蝦皮、牛奶能補(bǔ)鈣)。
[0117]其中,離線的觀點分析與在線的觀點分析的原理一致,可以包括:
[0118](I)實體抽取:從問答對的回答出抽取實體,例如,可以通過挖掘食物列表,從回答中抽取出魚類、貝類、堅果、水果、三文魚、蝦皮、牛奶等實體。
[0119](2)實體相關(guān)度計算。相關(guān)度計算用于計算候選實體和用戶輸入的搜索詞是否相關(guān),具體可以包括:
[0120]a)根據(jù)對搜索詞進(jìn)行分析后得到的需求類型詞,在候選實體中去除不屬于需求類型詞的實體。例如,需要類型詞為“海產(chǎn)品”,則選擇屬于海產(chǎn)品的實體,即魚類、貝類、蝦皮、三文魚,去掉“堅果、水果、牛奶”。[0121]具體的,可以計算每個候選實體與需求類型詞的語義匹配度,即“魚、堅果、水果、蝦皮、牛奶”等候選實體與“海產(chǎn)品”的匹配度,去除匹配度數(shù)值低于設(shè)定閾值的候選實體。
[0122]匹配度的具體計算方法如下:(1)實體關(guān)聯(lián)的多個類型與需求類型詞之間embedding向量的平均相似度加權(quán)。(2)需求類型詞關(guān)聯(lián)的多個實例與候選實體之間embedding向量的平均相似度加權(quán),其中,需求類型詞的實例可以通過XXX is a***這樣的模板來挖掘。
[0123]b)根據(jù)候選實體的上下文,去除語義上與需求類型詞的匹配度小于設(shè)定閾值的候選實體。例如,“蝦皮”雖然與需求類型詞“海產(chǎn)品”在類型上相匹配,但回答中說的是“蝦皮補(bǔ)鈣”,語義不匹配,因此去掉“蝦皮”,保留“魚類、貝類、三文魚”。
[0124]具體根據(jù)上下文計算匹配度可以包括:首先,通過依存句法分析樹找到和“海產(chǎn)品”有依存關(guān)系的term作為上下文,再根據(jù)該term計算匹配度,計算匹配度的具體計算公式如下:
[0125]語義匹配度W(i|海產(chǎn)品_>蝦皮)=term⑴的重要性打分*答案命中打分(θ|?)*與蝦皮的位置距離*否定關(guān)系打分(O 11)*傾向性分析(0-1),該公式表示在第i個term作為實體上下文時,海產(chǎn)品和蝦皮的語義匹配度打分,其中傾向性分析表示蝦皮前后的情感詞分類打分,該打分可以根據(jù)靜態(tài)統(tǒng)計生成。
[0126]此外,“補(bǔ)鈣”等上下文可作為推薦理由的關(guān)鍵詞候選,在產(chǎn)品展現(xiàn)中使用。
[0127]c)計算候選實體之間的上下位關(guān)系,例如,將“三文魚”歸為“魚類”,最終呈現(xiàn)的答案為:魚類(如三文魚)、貝類。這種上下文關(guān)系可以通過數(shù)據(jù)挖掘?qū)崿F(xiàn),挖掘的來源包括百科的tag、無結(jié)構(gòu)化文本等。比如百科詞條“三文魚”就有一個tag字段“魚類”。
[0128]本實施例通過直接給出實體答案,可以減少用戶的閱讀成本,一目了然;通過提供推薦理由,可以有統(tǒng)計數(shù)據(jù)和證據(jù),可靠性高,容易讓人信服,可輔助用戶決策;通過對搜索詞、問題、答案的多重聚類處理,一方面可以擴(kuò)大搜索詞的影響面,另一方面補(bǔ)充豐富答案數(shù)據(jù),降低長尾搜索帶來的數(shù)據(jù)稀疏影響,在擴(kuò)大影響面的同時,根據(jù)用戶行為、語義相似度等特征有效控制轉(zhuǎn)義風(fēng)險。
[0129]圖12是本發(fā)明另一實施例提出的搜索結(jié)果的展現(xiàn)裝置的結(jié)構(gòu)示意圖,該裝置120包括接收模塊121、獲取模塊122和展現(xiàn)模塊123。
[0130]接收模塊121用于接收用戶輸入的搜索詞;
[0131]其中,本發(fā)明實施例中處理的搜索詞可以具體為答案是實體類型的搜索詞,例如,搜索詞是“孕婦能吃什么水果”或者“孕婦吃什么海產(chǎn)品補(bǔ)鋅”等這類問題。
[0132]這類問題的答案通常是實體類型,實體(entity)是客觀世界中存在的且可互相區(qū)分的事物,實體可以是人也可以是物體實物,或者,也可以是抽象概念。例如,“蘋果”、“梨”、“蝦”等這些都屬于實體。
[0133]獲取模塊122用于根據(jù)所述搜索詞,獲取搜索結(jié)果,所述搜索結(jié)果包括聚合推薦結(jié)果以及與所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由;
[0134]相關(guān)技術(shù)中,搜索引擎得到的搜索結(jié)果通常是網(wǎng)頁的鏈接,例如,向用戶展現(xiàn)“孕婦能吃什么水果_百度知道”這一鏈接結(jié)果,用戶需要點擊該鏈接后進(jìn)入相應(yīng)的百度知道的頁面,進(jìn)而在該百度知道的頁面上查找結(jié)果。
[0135]而本發(fā)明實施例中獲取的搜索結(jié)果包括的是具體的聚合推薦結(jié)果,例如相關(guān)技術(shù)中在上述的百度知道的頁面上展現(xiàn)的是“蘋果”、“梨”這些結(jié)果,而本實施例直接獲取“蘋果”、“梨”這些聚合推薦結(jié)果,而不再需要用戶進(jìn)入頁面后才看到。
[0136]另外,本發(fā)明實施例中不僅給出聚合推薦結(jié)果,還會給出這些聚合推薦結(jié)果的理由,例如,“蘋果”有多少人推薦,“梨”有多少人推薦等?;蛘?,推薦理由也可以是網(wǎng)友的回答,例如“蘋果富含VC,對寶寶好”等?;蛘?,推薦理由也可以是從網(wǎng)友回答的問題中提取的關(guān)鍵字,例如對應(yīng)“蘋果”的推薦理由是“富含VC”。
[0137]展現(xiàn)模塊123用于向所述用戶展現(xiàn)所述搜索結(jié)果。
[0138]其中,根據(jù)用戶所使用的設(shè)備的不同,具體的展現(xiàn)形式也可以不同。
[0139]一個實施例中,所述展現(xiàn)模塊123具體用于:
[0140]如果在PC上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在同一個頁面上進(jìn)行展現(xiàn);或者,
[0141]如果在移動設(shè)備上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在不同的頁面上進(jìn)行展現(xiàn),其中,展現(xiàn)所述推薦理由的頁面是展現(xiàn)所述聚合推薦結(jié)果的頁面的下一級頁面。
[0142]具體的,如果在個人電腦(Personal Computer, PC)上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在同一個頁面上進(jìn)行展現(xiàn)。
[0143]進(jìn)一步的,在PC上展現(xiàn)時可以為純標(biāo)簽(TAG)形式或者配圖形式。
[0144]例如,參見圖2,給出了在PC上以純標(biāo)簽形式展現(xiàn)的搜索結(jié)果,其中,當(dāng)用戶搜索“北京特產(chǎn)”時,可以直接顯示“北京烤鴨”、“六必居醬菜”這些聚合推薦結(jié)果,并且在聚合推薦結(jié)果所在頁面上還顯示相應(yīng)的推薦理由,例如,“北京烤鴨”有27人推薦,以及網(wǎng)友對于“北京烤鴨”這一問題的回答。
[0145]參見圖3,給出了在PC上以配圖形式展現(xiàn)的搜索結(jié)果,其中,當(dāng)用戶搜索“女性為主角的電影”時,可以直接顯示“瘋狂原始人”、“毒戰(zhàn)”這些聚合推薦結(jié)果,并且在聚合推薦結(jié)果所在頁面上還顯示相應(yīng)的推薦理由,例如,“瘋狂原始人”有7人推薦,以及網(wǎng)友對于“瘋狂原始人”這一問題的回答。
[0146]進(jìn)一步的,推薦理由可以采用如下方式展現(xiàn):
[0147]I)默認(rèn)展現(xiàn)第一個推薦理由,點擊圖標(biāo)重新搜索推薦理由;
[0148]2)默認(rèn)展現(xiàn)第一個實體的推薦理由,點擊圖標(biāo)切換推薦理由;
[0149]3)默認(rèn)不展現(xiàn)推薦理由,點擊實體后觸發(fā)該實體關(guān)聯(lián)的推薦理由。
[0150]另一方面,如果在移動設(shè)備上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在不同的頁面上進(jìn)行展現(xiàn),其中,展現(xiàn)所述推薦理由的頁面是展現(xiàn)所述聚合推薦結(jié)果的頁面的下一級頁面。
[0151]例如,參見圖4,給出了在移動設(shè)備上展現(xiàn)的搜索結(jié)果,其中,當(dāng)用戶搜索孕婦能吃什么水果時,可以直接顯示“蘋果”、“香蕉”這些聚合推薦結(jié)果。
[0152] 由于移動設(shè)備的顯示限制,聚合推薦結(jié)果對應(yīng)的理由通常不能與聚合推薦結(jié)果在同一頁面顯示,此時,可以點擊包含聚合推薦結(jié)果的頁面進(jìn)入下一級頁面,例如,參見圖5,當(dāng)點擊母嬰知識這一頁面后可以進(jìn)入下一級頁面,在該頁面上可以顯示具體的推薦理由,例如,用戶回答“蘋果很好的,一天吃一個,生出寶寶皮膚會好很白。都可以吃的,但是不要過量吃…”。[0153]當(dāng)然,可以理解的是,在展現(xiàn)時除了展現(xiàn)上述得到的聚合推薦結(jié)果和推薦理由外,還可以展現(xiàn)目前已有的結(jié)果,例如,如圖2所示,還可以展現(xiàn)“北京特產(chǎn)_百度百科”這一頁面鏈接等。
[0154]進(jìn)一步的,可以建立每個聚合推薦結(jié)果與其他網(wǎng)頁的鏈接,以便通過選中聚合推薦結(jié)果后跳轉(zhuǎn)到另一頁面。例如,建立聚合推薦結(jié)果與購買網(wǎng)站的鏈接關(guān)系,這樣就可以當(dāng)選中某個聚合推薦結(jié)果后就可以跳轉(zhuǎn)到相應(yīng)網(wǎng)站去購買。
[0155]本實施例通過直接給出聚合推薦結(jié)果,可以減少用戶查找時間,提高搜索結(jié)果的查找效率;并且,本實施例通過給出推薦理由,可以在用戶查找時有所依據(jù),提高搜索結(jié)果的可靠性。
[0156]圖13是本發(fā)明另一實施例提出的搜索結(jié)果的展現(xiàn)裝置的結(jié)構(gòu)示意圖,在上一實施例的基礎(chǔ)上,本實施例中,所述獲取模塊122包括:分析單元,用于對所述搜索詞進(jìn)行分析,所述分析包括問題類型分析,所述問題類型分析用于判斷所述搜索詞是否屬于適合為用戶推薦實體的搜索詞;觀點聚合單元,用于在所述搜索詞屬于適合為用戶推薦實體的搜索詞時,根據(jù)所述搜索詞進(jìn)行觀點聚合處理,得到所述搜索結(jié)果。
[0157]其中,對搜索詞進(jìn)行分析不僅包括基礎(chǔ)分析,還包括針對問題需求的分析。
[0158]基礎(chǔ)分析包括:分詞、詞性標(biāo)注、專名識別、字詞(term)重要性等。
[0159]針對問題需求的分析包括:問題類型分析和答案類型分析。
[0160]問題類型分析用于目標(biāo)問答對的篩選;答案類型分析用于后續(xù)的實體觀點抽取,以便根據(jù)搜索詞所需要的實體類型抽取相應(yīng)的實體。
[0161]問題類型分析可以包括:識別用戶輸入的搜索詞是否屬于適合為用戶推薦實體的搜索詞,當(dāng)用戶輸入的搜索詞屬于適合為用戶推薦實體的搜索詞時再進(jìn)行后續(xù)流程。例如,搜索詞為“孕婦吃什么海產(chǎn)品補(bǔ)鋅”時,由于其答案將是“三文魚”等這些實體答案,因此,可以確定該搜索詞屬于適合為用戶推薦實體的搜索詞,對其進(jìn)行后續(xù)處理。再例如,搜索詞是“孕婦是否應(yīng)該吃海產(chǎn)品”時,由于其答案將是“是”、“否”這些非實體的答案,因此,可以確定該搜索詞不屬于適合為用戶推薦實體的搜索詞,此時對其不再進(jìn)行本發(fā)明實施例中的后續(xù)處理。
[0162]具體的,問題類型分析時可以根據(jù)搜索詞中包含的分詞來確定是否適合進(jìn)行實體推薦,例如,如上所述的,當(dāng)搜索詞包含“什么”這類詞時可以確定為適合實體推薦的,或者,當(dāng)搜索詞包含“是否”這類詞時可以確定為不適合實體推薦的。當(dāng)然,上述的問題類型分析的方式只是一種舉例,可以根據(jù)實際需要設(shè)定相應(yīng)的規(guī)則。
[0163]答案類型分析可以包括:識別需求類型詞(Lexical Answer Type,LAT),以便根據(jù)需求類型詞找到用戶需要的實體類型。例如,“孕婦吃什么海產(chǎn)品補(bǔ)鋅”中,需求類型詞為
“海產(chǎn)品”。
[0164]具體的,答案類型分析時可以將與“什么”相關(guān)聯(lián)的詞確定為需求類型詞,如上述的“海產(chǎn)品”。當(dāng)然,上述的答案類型分析的方式只是一種舉例,可以根據(jù)實際需要設(shè)定相應(yīng)的規(guī)則。
[0165]一個實施例中,所述分析還包括答案類型分析,所述答案類型分析用于確定所述搜索詞的需求類型詞,所述觀點聚合單元具體用于:
[0166]從預(yù)先建立的倒排索引庫中,獲取與所述搜索詞關(guān)聯(lián)的搜索詞實例,并計算每個搜索詞實例與所述搜索詞之間的語義相似度數(shù)值,將語義相似度數(shù)值大于設(shè)定閾值的搜索詞實例確定為擴(kuò)展搜索詞,所述倒排索引庫中存儲搜索詞及與搜索詞關(guān)聯(lián)的搜索詞實例;
[0167]其中,倒排索引庫可以是離線方式預(yù)先建立的,具體建立過程可以參見后續(xù)實施例。倒排索引庫中存儲搜索詞和搜索詞實例的關(guān)聯(lián)關(guān)系,通過一搜索詞,可以在該倒排索引庫中找到關(guān)聯(lián)的多個搜索詞實例,具體返回的可以是每個搜索詞實例的標(biāo)識(queryid)。
[0168]從預(yù)先建立的Q-Q正排索引庫中,獲取與所述擴(kuò)展搜索詞關(guān)聯(lián)的問題和第一特征數(shù)據(jù),所述Q-Q正排索引庫中存儲搜索詞及與搜索詞關(guān)聯(lián)的問題和第一特征數(shù)據(jù);
[0169]其中,Q-Q正排索引庫也可以是離線方式預(yù)先建立的,具體建立過程可以參見后續(xù)實施例。
[0170]Q-Q正排索引庫存儲搜索詞和問題之間的關(guān)聯(lián)關(guān)系,具體可以是queryid-questionid的關(guān)聯(lián)信息。給定queryid,得到相關(guān)questionid和第一特征數(shù)據(jù),第一特征數(shù)據(jù)包括語義相似度、用戶行為等,為在線排序提供特征數(shù)據(jù)。
[0171]從預(yù)先建立的Q-A正排索引庫中,獲取與所述問題關(guān)聯(lián)的答案和第二特征數(shù)據(jù),所述Q-A正排索引庫中存儲問題及與問題關(guān)聯(lián)的答案和第二特征數(shù)據(jù);
[0172]其中,Q-A正排索引庫也可以是離線方式預(yù)先建立的,具體建立過程可以參見后續(xù)實施例。
[0173]Q-A正排索引庫存儲問題和答案的關(guān)聯(lián)關(guān)系,具體可以是questionid-answer的關(guān)聯(lián)信息。給定questionid,得到關(guān)聯(lián)的answer和第二特征數(shù)據(jù),包括實體,用戶觀點、實體相關(guān)度、候選實體的被推薦次數(shù)、候選實體-需求類型詞匹配度、候選實體上下文-query匹配度等特征。
[0174]根據(jù)所述需求類型詞對所述獲取的答案進(jìn)行觀點分析,得到在線的候選實體,以及每個在線的候選實體的相關(guān)度;
[0175]由于存在query和question差異化問題,線下計算不能完全覆蓋所有情況,因此需要對差異大的query和question線上重新計算。
[0176]例如,針對“孕婦吃什么海產(chǎn)品補(bǔ)鋅”這一搜索詞,獲取的答案可能是一段話,如“魚類是很好的補(bǔ)鋅食品”,但經(jīng)過實體抽取后可以抽取出魚類。類似的,根據(jù)其他答案還可以抽取出貝類、堅果、水果、三文魚、蝦皮、牛奶等實體。具體的,可以通過挖掘食物列表,從答案中抽取出魚類、貝類、堅果、水果、三文魚、蝦皮、牛奶等實體。抽取后得到的實體可以稱為候選實體。
[0177]相關(guān)度計算用于計算候選實體和用戶輸入的搜索詞是否相關(guān),具體可以包括:
[0178]a)根據(jù)對搜索詞進(jìn)行分析后得到的需求類型詞,在候選實體中去除不屬于需求類型詞的實體。例如,需要類型詞為“海產(chǎn)品”,則選擇屬于海產(chǎn)品的實體,即魚類、貝類、蝦皮、三文魚,去掉“堅果、水果、牛奶”。
[0179]具體的,可以計算每個候選實體與需求類型詞的語義匹配度,即“魚、堅果、水果、蝦皮、牛奶”等候選實體與“海產(chǎn)品”的匹配度,去除匹配度數(shù)值低于設(shè)定閾值的候選實體。
[0180]匹配度的具體計算方法如下:(1)實體關(guān)聯(lián)的多個類型與需求類型詞之間embedding向量的平均相似度加權(quán)。(2)需求類型詞關(guān)聯(lián)的多個實例與候選實體之間embedding向量的平均相似度加權(quán),其中,需求類型詞的實例可以通過XXX is a***這樣的模板來挖掘。[0181]b)根據(jù)候選實體的上下文,去除語義上與需求類型詞的匹配度小于設(shè)定閾值的候選實體。例如,“蝦皮”雖然與需求類型詞“海產(chǎn)品”在類型上相匹配,但回答中說的是“蝦皮補(bǔ)鈣”,語義不匹配,因此去掉“蝦皮”,保留“魚類、貝類、三文魚”。
[0182]具體根據(jù)上下文計算匹配度可以包括:首先,通過依存句法分析樹找到和“海產(chǎn)品”有依存關(guān)系的term作為上下文,再根據(jù)該term計算匹配度,計算匹配度的具體計算公式如下:
[0183]語義匹配度W(i|海產(chǎn)品_>蝦皮)=term⑴的重要性打分*答案命中打分(θ|?)*與蝦皮的位置距離*否定關(guān)系打分(O 11)*傾向性分析(0-1),該公式表示在第i個term作為實體上下文時,海產(chǎn)品和蝦皮的語義匹配度打分,其中傾向性分析表示蝦皮前后的情感詞分類打分,該打分可以根據(jù)靜態(tài)統(tǒng)計生成。
[0184]此外,“補(bǔ)鈣”等上下文可作為推薦理由的關(guān)鍵詞候選,在產(chǎn)品展現(xiàn)中使用。
[0185]c)計算候選實體之間的上下位關(guān)系,例如,將“三文魚”歸為“魚類”,最終呈現(xiàn)的答案為:魚類(如三文魚)、貝類。這種上下文關(guān)系可以通過數(shù)據(jù)挖掘?qū)崿F(xiàn),挖掘的來源包括百科的tag、無結(jié)構(gòu)化文本等。比如百科詞條“三文魚”就有一個tag字段“魚類”。
[0186]根據(jù)所述第一特征值、所述第二特征數(shù)據(jù)和所述每個在線的候選實體的相關(guān)度,對所述在線的候選實體進(jìn)行排序,并將排序后的候選實體確定為聚合推薦結(jié)果;
[0187]其中,可以根據(jù)第一特征數(shù)據(jù)和第二特征數(shù)據(jù),對篩選后的實體進(jìn)行排序。
[0188]排序可以具體包括:首先,根據(jù)用戶行為、實體相關(guān)度、語義相似度等多維特征,利用GBRank等已有的排序系統(tǒng),對問答對做排序,通過閾值截斷方法得到相關(guān)性高的問答對。在此基礎(chǔ)上,以問答對中的實體為基準(zhǔn),對答案做排序。具體特征如下=Query-問答對的用戶點擊、候選實體被推薦次數(shù)、候選實體-需求類型詞匹配度、候選實體上下文-query匹配度?;谝陨咸卣鳎肎BRank等已有的排序系統(tǒng),對答案進(jìn)行排序。
[0189]對每個聚合推薦結(jié)果對應(yīng)的答案進(jìn)行聚合統(tǒng)計,得到所述聚合推薦結(jié)果對應(yīng)的推薦理由。
[0190]例如,可以包括統(tǒng)計每個實體對應(yīng)的答案的推薦個數(shù),根據(jù)推薦個數(shù)進(jìn)行逆序排列,逆序排列后的答案可以作為推薦理由進(jìn)行展現(xiàn)。例如,對于“瘋狂機(jī)器人”這一聚合推薦結(jié)果,“壁小花小姐”的用戶觀點的推薦個數(shù)最多,則在網(wǎng)友回答中將“壁小花小姐”的觀點排列在第一位。
[0191]參見圖13,該裝置還可以包括用于建立所述倒排索引庫的第一離線處理模塊124。第一離線處理模塊124具體用于:
[0192]確定目標(biāo)搜索詞;
[0193]其中,可以逐一將歷史數(shù)據(jù)中的每個屬于適合為用戶推薦實體的搜索詞確定為目標(biāo)搜索詞,以便滿足后續(xù)用戶在線搜索不同搜索詞時的需要。
[0194]根據(jù)點擊日志,獲取所述目標(biāo)搜索詞發(fā)生點擊的URL ;
[0195]根據(jù)所述URL進(jìn) 行站點挖掘;
[0196]根據(jù)所述站點挖掘的處理結(jié)果,獲取所述目標(biāo)搜索詞對應(yīng)的搜索詞實例;
[0197]將所述目標(biāo)搜索詞和所述目標(biāo)搜索詞對應(yīng)的搜索詞實例,關(guān)聯(lián)存儲在所述倒排索引庫中。
[0198]其中,可以通過用戶點擊日志等基礎(chǔ)數(shù)據(jù),對目標(biāo)query做實例化挖掘。[0199]一個實施例中,所述第一離線處理模塊進(jìn)一步具體用于:
[0200]根據(jù)所述站點挖掘確定目標(biāo)站點,并將所述目標(biāo)站點在點擊日志中關(guān)聯(lián)的搜索詞集合,確定為所述目標(biāo)搜索詞對應(yīng)的搜索詞實例;和/或,
[0201]根據(jù)所述站點挖掘在每個所述URL關(guān)聯(lián)的頁面上進(jìn)行問答對挖掘,獲取問答對數(shù)據(jù);對所述問答對數(shù)據(jù)進(jìn)行預(yù)處理和分類后生成問題實例;確定所述問題實例為所述目標(biāo)搜索詞對應(yīng)的搜索詞實例。
[0202]其中,可以通過簡單頻次統(tǒng)計得到目標(biāo)站點,其中目標(biāo)站點表示主需求的站點,多為垂直問答類網(wǎng)站。
[0203]其中,可以反向挖掘目標(biāo)站點在點擊日志中關(guān)聯(lián)的query集合,將該query集合確定為目標(biāo)搜索詞關(guān)聯(lián)的query實例。其中,當(dāng)目標(biāo)站點是綜合類站點,可以進(jìn)一步進(jìn)行問題分類。
[0204]其中,站點挖掘的同時,可以通過站點去挖掘網(wǎng)頁中的問答對資源,獲取問答對數(shù)據(jù)。
[0205]其中,預(yù)處理可以是指問題去噪,分類后生成問題實例,補(bǔ)充到query實例中。
[0206]一個實施例中,該裝置還可以包括用于建立所述Q-Q正排索引庫的第二離線處理模塊125,所述第二離線處理模塊125具體用于:
[0207]采用URL歸一化的方式,對所述問答對數(shù)據(jù)進(jìn)行問題聚類,得到聚類后的問題;
[0208]對于同一個網(wǎng)頁,存在多種鏈接方式,導(dǎo)致url的多樣性,這就需要做url歸一化,問題聚類的目的便是如此。通過對問題和答案的聚合(這里沒用hash去重,是因為頁面更新或是title截斷都會出現(xiàn)問題和答案的細(xì)微變化,導(dǎo)致url歸一不到一起),將url歸一到唯一的地址,既可以減少死鏈,又可以擴(kuò)大有效頁面的召回。url歸一化的主站點是一致的,以主站為key切分,可以提升效率,使用已有的k-means系統(tǒng)即可滿足需求。
[0209]對搜索詞實例進(jìn)行實例聚類,得到聚類后的搜索詞;
[0210]Query實例聚類是將挖掘的實例化query做聚合,用于彌補(bǔ)搜索引擎點擊過于集中造成的召回不足問題(絕大多數(shù)的點擊行為都發(fā)生在前3頁)。以根據(jù)term重要性排序,已不可省term為key切分?jǐn)?shù)據(jù),可使用已有的k-means系統(tǒng)。
[0211]根據(jù)所述聚類后的搜索詞和所述聚類后的問題確定所述第一特征數(shù)據(jù),并將所述聚類后的搜索詞和所述聚類后的問題及所述第一特征數(shù)據(jù)關(guān)聯(lián)存儲在Q-Q正排索引庫中。
[0212]—個實施例中,所述觀點聚合單元進(jìn)一步具體用于:
[0213]對獲取的答案進(jìn)行實體抽取,獲取候選實體;
[0214]對所述候選實體進(jìn)行相關(guān)度計算,得到所述候選實體的相關(guān)度。
[0215]—個實施例中,所述觀點聚合單元進(jìn)一步具體用于:
[0216]計算所述候選實體與需求類型詞的語義相關(guān)度,以去除不屬于需求類型詞的候選實體;
[0217]計算所述候選實體的上下文與搜索詞的語義相關(guān)度,以去除上下文與搜索詞不匹配的候選實體。
[0218]本實施例的裝置可以具體為執(zhí)行上述方法的裝置,因此,相應(yīng)流程可以參見上述方法的描述,在此不再贅述。
[0219]本實施例通過直接給出實體答案,可以減少用戶的閱讀成本,一目了然;通過提供推薦理由,可以有統(tǒng)計數(shù)據(jù)和證據(jù),可靠性高,容易讓人信服,可輔助用戶決策;通過對搜索詞、問題、答案的多重聚類處理,一方面可以擴(kuò)大搜索詞的影響面,另一方面補(bǔ)充豐富答案數(shù)據(jù),降低長尾搜索帶來的數(shù)據(jù)稀疏影響,在擴(kuò)大影響面的同時,根據(jù)用戶行為、語義相似度等特征有效控制轉(zhuǎn)義風(fēng)險。
[0220]本發(fā)明實施例還提供了一種客戶端設(shè)備,該客戶端設(shè)備包括殼體、處理器、存儲器、電路板和電源電路,其中,電路板安置在殼體圍成的空間內(nèi)部,處理器和存儲器設(shè)置在電路板上;電源電路,用于為客戶端設(shè)備的各個電路或器件供電;存儲器用于存儲可執(zhí)行程序代碼;處理器通過讀取存儲器中存儲的可執(zhí)行程序代碼來運行與可執(zhí)行程序代碼關(guān)聯(lián)的程序,以用于執(zhí)行以下步驟:
[0221]SlT:接收用戶輸入的搜索詞。
[0222]其中,本發(fā)明實施例中處理的搜索詞可以具體為答案是實體類型的搜索詞,例如,搜索詞是“孕婦能吃什么水果”或者“孕婦吃什么海產(chǎn)品補(bǔ)鋅”等這類問題。
[0223]這類問題的答案通常是實體類型,實體(entity)是客觀世界中存在的且可互相區(qū)分的事物,實體可以是人也可以是物體實物,或者,也可以是抽象概念。例如,“蘋果”、“梨”、“蝦”等這些都屬于實體。
[0224]S12’:根據(jù)所述搜索詞,獲取搜索結(jié)果,所述搜索結(jié)果包括聚合推薦結(jié)果以及與所述聚合推薦結(jié)果對應(yīng)的推薦理由。
[0225]相關(guān)技術(shù)中,搜索引擎得到的搜索結(jié)果通常是網(wǎng)頁的鏈接,例如,向用戶展現(xiàn)“孕婦能吃什么水果_百度知道”這一鏈接結(jié)果,用戶需要點擊該鏈接后進(jìn)入相應(yīng)的百度知道的頁面,進(jìn)而在該百度知道的頁面上查找結(jié)果。
[0226]而本發(fā)明實施例中獲取的搜索結(jié)果包括的是具體的聚合推薦結(jié)果,例如相關(guān)技術(shù)中在上述的百度知道的頁面上展現(xiàn)的是“蘋果”、“梨”這些結(jié)果,而本實施例直接獲取“蘋果”、“梨”這些聚合推薦結(jié)果,而不再需要用戶進(jìn)入頁面后才看到。
[0227]另外,本發(fā)明實施例中不僅給出聚合推薦結(jié)果,還會給出這些聚合推薦結(jié)果的理由,例如,“蘋果”有多少人推薦,“梨”有多少人推薦等?;蛘?,推薦理由也可以是網(wǎng)友的回答,例如“蘋果富含VC,對寶寶好”等?;蛘?,推薦理由也可以是從網(wǎng)友回答的問題中提取的關(guān)鍵字,例如對應(yīng)“蘋果”的推薦理由是“富含VC”。
[0228]S13’:向所述用戶展現(xiàn)所述搜索結(jié)果。
[0229]其中,根據(jù)用戶所使用的設(shè)備的不同,具體的展現(xiàn)形式也可以不同。
[0230]具體的,如果在個人電腦(Personal Computer, PC)上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在同一個頁面上進(jìn)行展現(xiàn)。
[0231]進(jìn)一步的,在PC上展現(xiàn)時可以為純標(biāo)簽(TAG)形式或者配圖形式。
[0232]例如,參見圖2,給出了在PC上以純標(biāo)簽形式展現(xiàn)的搜索結(jié)果,其中,當(dāng)用戶搜索“北京特產(chǎn)”時,可以直接顯示“北京烤鴨”、“六必居醬菜”這些聚合推薦結(jié)果,并且在聚合推薦結(jié)果所在頁面上還顯示相應(yīng)的推薦理由,例如,“北京烤鴨”有27人推薦,以及網(wǎng)友對于“北京烤鴨”這一問題的回答。
[0233]參見圖3,給出了在PC上以配圖形式展現(xiàn)的搜索結(jié)果,其中,當(dāng)用戶搜索“女性為主角的電影”時,可以直接顯示“瘋狂原始人”、“毒戰(zhàn)”這些聚合推薦結(jié)果,并且在聚合推薦結(jié)果所在頁面上還顯示相應(yīng)的推薦理由,例如,“瘋狂原始人”有7人推薦,以及網(wǎng)友對于“瘋狂原始人”這一問題的回答。
[0234]進(jìn)一步的,推薦理由可以采用如下方式展現(xiàn):
[0235]I)默認(rèn)展現(xiàn)第一個推薦理由,點擊圖標(biāo)重新搜索推薦理由;
[0236]2)默認(rèn)展現(xiàn)第一個實體的推薦理由,點擊圖標(biāo)切換推薦理由;
[0237]3)默認(rèn)不展現(xiàn)推薦理由,點擊實體后觸發(fā)該實體關(guān)聯(lián)的推薦理由。
[0238]另一方面,如果在移動設(shè)備上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在不同的頁面上進(jìn)行展現(xiàn),其中,展現(xiàn)所述推薦理由的頁面是展現(xiàn)所述聚合推薦結(jié)果的頁面的下一級頁面。
[0239]例如,參見圖4,給出了在移動設(shè)備上展現(xiàn)的搜索結(jié)果,其中,當(dāng)用戶搜索孕婦能吃什么水果時,可以直接顯示“蘋果”、“香蕉”這些聚合推薦結(jié)果。
[0240]由于移動設(shè)備的顯示限制,聚合推薦結(jié)果對應(yīng)的理由通常不能與聚合推薦結(jié)果在同一頁面顯示,此時,可以點擊包含聚合推薦結(jié)果的頁面進(jìn)入下一級頁面,例如,參見圖5,當(dāng)點擊母嬰知識這一頁面后可以進(jìn)入下一級頁面,在該頁面上可以顯示具體的推薦理由,例如,用戶回答“蘋果很好的,一天吃一個,生出寶寶皮膚會好很白。都可以吃的,但是不要過量吃…”。
[0241]當(dāng)然,可以理解的是,在展現(xiàn)時除了展現(xiàn)上述得到的聚合推薦結(jié)果和推薦理由外,還可以展現(xiàn)目前已有的結(jié) 果,例如,如圖2所示,還可以展現(xiàn)“北京特產(chǎn)_百度百科”這一頁面鏈接等。
[0242]進(jìn)一步的,可以建立每個聚合推薦結(jié)果與其他網(wǎng)頁的鏈接,以便通過選中聚合推薦結(jié)果后跳轉(zhuǎn)到另一頁面。例如,建立聚合推薦結(jié)果與購買網(wǎng)站的鏈接關(guān)系,這樣就可以當(dāng)選中某個聚合推薦結(jié)果后就可以跳轉(zhuǎn)到相應(yīng)網(wǎng)站去購買。
[0243]本實施例通過直接給出聚合推薦結(jié)果,可以減少用戶查找時間,提高搜索結(jié)果的查找效率;并且,本實施例通過給出推薦理由,可以在用戶查找時有所依據(jù),提高搜索結(jié)果的可靠性。
[0244]另一實施例中,處理器通過讀取存儲器中存儲的可執(zhí)行程序代碼來運行與可執(zhí)行程序代碼關(guān)聯(lián)的程序,以用于執(zhí)行以下步驟:
[0245]S61’:接收用戶輸入的搜索詞(query)。
[0246]S62’:對搜索詞進(jìn)行分析。
[0247]其中,對搜索詞進(jìn)行分析不僅包括基礎(chǔ)分析,還包括針對問題需求的分析。
[0248]基礎(chǔ)分析包括:分詞、詞性標(biāo)注、專名識別、字詞(term)重要性等。
[0249]針對問題需求的分析包括:問題類型分析和答案類型分析。
[0250]問題類型分析用于目標(biāo)問答對的篩選;答案類型分析用于后續(xù)的實體觀點抽取,以便根據(jù)搜索詞所需要的實體類型抽取相應(yīng)的實體。
[0251]問題類型分析可以包括:識別用戶輸入的搜索詞是否屬于適合為用戶推薦實體的搜索詞,當(dāng)用戶輸入的搜索詞屬于適合為用戶推薦實體的搜索詞時再進(jìn)行后續(xù)流程。例如,搜索詞為“孕婦吃什么海產(chǎn)品補(bǔ)鋅”時,由于其答案將是“三文魚”等這些實體答案,因此,可以確定該搜索詞屬于適合為用戶推薦實體的搜索詞,對其進(jìn)行后續(xù)處理。再例如,搜索詞是“孕婦是否應(yīng)該吃海產(chǎn)品”時,由于其答案將是“是”、“否”這些非實體的答案,因此,可以確定該搜索詞不屬于適合為用戶推薦實體的搜索詞,此時對其不再進(jìn)行本發(fā)明實施例中的后續(xù)處理。
[0252]具體的,問題類型分析時可以根據(jù)搜索詞中包含的分詞來確定是否適合進(jìn)行實體推薦,例如,如上所述的,當(dāng)搜索詞包含“什么”這類詞時可以確定為適合實體推薦的,或者,當(dāng)搜索詞包含“是否”這類詞時可以確定為不適合實體推薦的。當(dāng)然,上述的問題類型分析的方式只是一種舉例,可以根據(jù)實際需要設(shè)定相應(yīng)的規(guī)則。
[0253]答案類型分析可以包括:識別需求類型詞(Lexical Answer Type,LAT),以便根據(jù)需求類型詞找到用戶需要的實體類型。例如,“孕婦吃什么海產(chǎn)品補(bǔ)鋅”中,需求類型詞為
“海產(chǎn)品”。
[0254]具體的,答案類型分析時可以將與“什么”相關(guān)聯(lián)的詞確定為需求類型詞,如上述的“海產(chǎn)品”。當(dāng)然,上述的答案類型分析的方式只是一種舉例,可以根據(jù)實際需要設(shè)定相應(yīng)的規(guī)則。
[0255]S63’:通過觀點聚合系統(tǒng)在用戶輸入的搜索詞屬于適合為用戶推薦實體的搜索詞時,根據(jù)所述搜索詞進(jìn)行觀點聚合處理,得到搜索結(jié)果,搜索結(jié)果包括聚合推薦結(jié)果和對應(yīng)的推薦理由。
[0256]其中,該步驟可以將歷史數(shù)據(jù)中與該搜索詞相關(guān)的網(wǎng)友回答進(jìn)行聚合,以得到聚合推薦結(jié)果和推薦理由,具體處理過程可以參見后續(xù)描述。
[0257]S64’:將觀點聚合系統(tǒng)得到的搜索結(jié)果輸出給顯示裝置,由顯示裝置向用戶展現(xiàn)搜索結(jié)果。
[0258]具體展現(xiàn)方式可以參見S13’,本實施例不再贅述。下面具體描述觀點聚合處理的流程。
[0259]觀點聚合處理的流程可以包括:
[0260]S71’:根據(jù)用戶輸入的搜索詞,從倒排(BS)索引庫中,獲取與該搜索詞關(guān)聯(lián)的搜索詞實例,并計算每個搜索詞實例與搜索詞之間的語義相似度數(shù)值,將語義相似度數(shù)值大于設(shè)定閾值的搜索詞實例確定為擴(kuò)展搜索詞。
[0261]其中,倒排索引庫可以是離線方式預(yù)先建立的,具體建立過程可以參見后續(xù)實施例。倒排索引庫中存儲搜索詞和搜索詞實例的關(guān)聯(lián)關(guān)系,通過一搜索詞,可以在該倒排索引庫中找到關(guān)聯(lián)的多個搜索詞實例,具體返回的可以是每個搜索詞實例的標(biāo)識(queryid)。
[0262]S72’:從Q-Q正排索引庫中,獲取與該擴(kuò)展搜索詞關(guān)聯(lián)的問題和第一特征數(shù)據(jù)。
[0263]其中,Q-Q正排索引庫也可以是離線方式預(yù)先建立的,具體建立過程可以參見后續(xù)實施例。
[0264]Q-Q正排索引庫存儲搜索詞和問題之間的關(guān)聯(lián)關(guān)系,具體可以是queryid-questionid的關(guān)聯(lián)信息。給定queryid,得到相關(guān)questionid和第一特征數(shù)據(jù),第一特征數(shù)據(jù)包括語義相似度、用戶行為等,為在線排序提供特征數(shù)據(jù)。
[0265]S73’:從Q-A正排索引庫中,獲取與該問題關(guān)聯(lián)的答案和第二特征數(shù)據(jù)。
[0266]其中,Q-A正排索引庫也可以是離線方式預(yù)先建立的,具體建立過程可以參見后續(xù)實施例。
[0267]Q-A正排索引庫存儲問題和答案的關(guān)聯(lián)關(guān)系,具體可以是questionid-answer的關(guān)聯(lián)信息。給定questionid,得到關(guān)聯(lián)的answer和第二特征數(shù)據(jù),包括實體,用戶觀點、實體相關(guān)度、候選實體的被推薦次數(shù)、候選實體-需求類型詞匹配度、候選實體上下文-query匹配度等特征。
[0268]S74’:進(jìn)行在線實體抽取和相關(guān)度計算,得到篩選后的實體。
[0269]由于存在query和question差異化問題,線下計算不能完全覆蓋所有情況,因此需要對差異大的query和question線上重新計算。
[0270]例如,針對“孕婦吃什么海產(chǎn)品補(bǔ)鋅”這一搜索詞,獲取的答案可能是一段話,如“魚類是很好的補(bǔ)鋅食品”,但經(jīng)過實體抽取后可以抽取出魚類。類似的,根據(jù)其他答案還可以抽取出貝類、堅果、水果、三文魚、蝦皮、牛奶等實體。具體的,可以通過挖掘食物列表,從答案中抽取出魚類、貝類、堅果、水果、三文魚、蝦皮、牛奶等實體。抽取后得到的實體可以稱為候選實體。
[0271]相關(guān)度計算用于計算候選實體和用戶輸入的搜索詞是否相關(guān),具體可以包括:
[0272]a)根據(jù)對搜索詞進(jìn)行分析后得到的需求類型詞,在候選實體中去除不屬于需求類型詞的實體。例如,需要類型詞為“海產(chǎn)品”,則選擇屬于海產(chǎn)品的實體,即魚類、貝類、蝦皮、三文魚,去掉“堅果、水果、牛奶”。
[0273]具體的,可以計算每個候選實體與需求類型詞的語義匹配度,即“魚、堅果、水果、蝦皮、牛奶”等候選實體與“海產(chǎn)品”的匹配度,去除匹配度數(shù)值低于設(shè)定閾值的候選實體。
[0274]匹配度的具體計算方法如下:(1)實體關(guān)聯(lián)的多個類型與需求類型詞之間embedding向量的平均相似度加權(quán)。(2)需求類型詞關(guān)聯(lián)的多個實例與候選實體之間embedding向量的平均相似度加權(quán),其中,需求類型詞的實例可以通過XXX is a***這樣的模板來挖掘。
[0275]b)根據(jù)候選實體的上下文,去除語義上與需求類型詞的匹配度小于設(shè)定閾值的候選實體。例如,“蝦皮”雖然與需求類型詞“海產(chǎn)品”在類型上相匹配,但回答中說的是“蝦皮補(bǔ)鈣”,語義不匹配,因此去掉“蝦皮”,保留“魚類、貝類、三文魚”。
[0276]具體根據(jù)上下文計算匹配度可以包括:首先,通過依存句法分析樹找到和“海產(chǎn)品”有依存關(guān)系的term作為上下文,再根據(jù)該term計算匹配度,計算匹配度的具體計算公式如下:
[0277]語義匹配度W(i|海產(chǎn)品_>蝦皮)=term⑴的重要性打分*答案命中打分(θ|?)*與蝦皮的位置距離*否定關(guān)系打分(O 11)*傾向性分析(0-1),該公式表示在第i個term作為實體上下文時,海產(chǎn)品和蝦皮的語義匹配度打分,其中傾向性分析表示蝦皮前后的情感詞分類打分,該打分可以根據(jù)靜態(tài)統(tǒng)計生成。
[0278]此外,“補(bǔ)鈣”等上下文可作為推薦理由的關(guān)鍵詞候選,在產(chǎn)品展現(xiàn)中使用。
[0279]c)計算候選實體之間的上下位關(guān)系,例如,將“三文魚”歸為“魚類”,最終呈現(xiàn)的答案為:魚類(如三文魚)、貝類。這種上下文關(guān)系可以通過數(shù)據(jù)挖掘?qū)崿F(xiàn),挖掘的來源包括百科的tag、無結(jié)構(gòu)化文本等。比如百科詞條“三文魚”就有一個tag字段“魚類”。
[0280]S75’:對篩選后的實體進(jìn)行排序。
[0281]其中,可以根據(jù)第一特征數(shù)據(jù)和第二特征數(shù)據(jù),對篩選后的實體進(jìn)行排序。
[0282] 排序可以具體包括:首先,根據(jù)用戶行為、實體相關(guān)度、語義相似度等多維特征,利用GBRank等已有的排序系統(tǒng),對問答對做排序,通過閾值截斷方法得到相關(guān)性高的問答對。在此基礎(chǔ)上,以問答對中的實體為基準(zhǔn),對答案做排序。具體特征如下=Query-問答對的用戶點擊、候選實體被推薦次數(shù)、候選實體-需求類型詞匹配度、候選實體上下文-query匹配度?;谝陨咸卣鳎肎BRank等已有的排序系統(tǒng),對答案進(jìn)行排序。
[0283]S76’:對排序后的實體進(jìn)行聚合統(tǒng)計。
[0284]例如,可以包括統(tǒng)計每個實體對應(yīng)的答案的推薦個數(shù),根據(jù)推薦個數(shù)進(jìn)行逆序排列,逆序排列后的答案可以作為推薦理由進(jìn)行展現(xiàn)。例如,對于“瘋狂機(jī)器人”這一聚合推薦結(jié)果,“壁小花小姐”的用戶觀點的推薦個數(shù)最多,則在網(wǎng)友回答中將“壁小花小姐”的觀點排列在第一位。
[0285]上述實施例中采用的倒排索引庫、Q-Q正排索引庫和Q-A正排索引庫可以是采用離線流程建立的。
[0286]離線流程的處理示意圖可以包括:
[0287]S81’:確定目標(biāo)搜索詞。
[0288]其中,可以逐一將歷史數(shù)據(jù)中的每個屬于適合為用戶推薦實體的搜索詞確定為目標(biāo)搜索詞,以便滿足后續(xù)用戶在線搜索不同搜索詞時的需要。
[0289]S82’:對該目標(biāo)搜索詞進(jìn)行實例化,得到該目標(biāo)搜索詞關(guān)聯(lián)的搜索詞實例,并將該目標(biāo)搜索詞和該搜索詞實例對應(yīng)存儲在倒排索引庫中。
[0290]其中,可以通過用戶點擊日志等基礎(chǔ)數(shù)據(jù),對目標(biāo)query做實例化挖掘,具體流程可以包括:
[0291]S91’:從點擊日志獲取目標(biāo)query發(fā)生點擊的統(tǒng)一資源定符(UniformResoureLocator, URL)。
[0292]S92’:根據(jù)該點擊URL進(jìn)行站點挖掘。
[0293]S93’:根據(jù)站點挖掘獲取目標(biāo)站點。
[0294]其中,可以通過簡單頻次統(tǒng)計得到目標(biāo)站點,其中目標(biāo)站點表示主需求的站點,多為垂直問答類網(wǎng)站。
[0295]S94’:根據(jù)目標(biāo)站點獲取該目標(biāo)搜索詞關(guān)聯(lián)的搜索詞實例。
[0296]其中,可以反向挖掘目標(biāo)站點在點擊日志中關(guān)聯(lián)的query集合,將該query集合確定為目標(biāo)搜索詞關(guān)聯(lián)的query實例。其中,當(dāng)目標(biāo)站點是綜合類站點,可以進(jìn)一步進(jìn)行問題分類。
[0297]S95’:在站點挖掘時,進(jìn)行問答對挖掘,獲取問答對數(shù)據(jù)。
[0298]其中,站點挖掘的同時,可以通過站點去挖掘網(wǎng)頁中的問答對資源,獲取問答對數(shù)據(jù)。
[0299]S96’:對問答對數(shù)據(jù)進(jìn)行預(yù)處理和問題分類處理,得到問題實例,將該問題實例也作為目標(biāo)搜索詞關(guān)聯(lián)的搜索詞實例。
[0300]其中,預(yù)處理可以是指問題去噪,分類后生成問題實例,補(bǔ)充到query實例中。
[0301]S83’:對搜索詞實例和問答對數(shù)據(jù)進(jìn)行聚類處理,得到聚類后的搜索詞和聚類后的問題,并將聚類后的搜索詞和聚類后的問題關(guān)聯(lián)存儲在Q-Q正排索引庫中。
[0302]其中,聚類處理可以包括問題聚類101’和搜索詞實例聚類102’。
[0303]對于同一個網(wǎng)頁,存在多種鏈接方式,導(dǎo)致url的多樣性,這就需要做url歸一化,問題聚類的目的便是如此。通過對問題和答案的聚合(這里沒用hash去重,是因為頁面更新或是title截斷都會出現(xiàn)問題和答案的細(xì)微變化,導(dǎo)致url歸一不到一起),將url歸一到唯一的地址,既可以減少死鏈,又可以擴(kuò)大有效頁面的召回。url歸一化的主站點是一致的,以主站為key切分,可以提升效率,使用已有的k-means系統(tǒng)即可滿足需求。
[0304]Query實例聚類是將挖掘的實例化query做聚合,用于彌補(bǔ)搜索引擎點擊過于集中造成的召回不足問題(絕大多數(shù)的點擊行為都發(fā)生在前3頁)。以根據(jù)term重要性排序,已不可省term為key切分?jǐn)?shù)據(jù),可使用已有的k-means系統(tǒng)。
[0305]S84’:根據(jù)問答對數(shù)據(jù),獲取Q-A原始數(shù)據(jù),并對Q-A原始數(shù)據(jù)進(jìn)行觀點分析,得到更新后的Q-A數(shù)據(jù),并將更新后的Q-A數(shù)據(jù)關(guān)聯(lián)存儲在Q-A正排庫中。
[0306] 觀點分析主要包括實體抽取111’和相關(guān)度計算112’。
[0307]觀點分析依據(jù)問題表述,從回答中抽取答案實體并計算實體與query的相關(guān)度。如,問題(孕婦吃什么海產(chǎn)品補(bǔ)鋅?)-回答(魚類、貝類、堅果、水果等補(bǔ)鋅,魚類中三文魚尤其好;蝦皮、牛奶能補(bǔ)鈣)。
[0308]其中,離線的觀點分析與在線的觀點分析的原理一致,可以包括:
[0309]( I)實體抽取:從問答對的回答出抽取實體,例如,可以通過挖掘食物列表,從回答中抽取出魚類、貝類、堅果、水果、三文魚、蝦皮、牛奶等實體。
[0310](2)實體相關(guān)度計算。相關(guān)度計算用于計算候選實體和用戶輸入的搜索詞是否相關(guān),具體可以包括:
[0311]a)根據(jù)對搜索詞進(jìn)行分析后得到的需求類型詞,在候選實體中去除不屬于需求類型詞的實體。例如,需要類型詞為“海產(chǎn)品”,則選擇屬于海產(chǎn)品的實體,即魚類、貝類、蝦皮、三文魚,去掉“堅果、水果、牛奶”。
[0312]具體的,可以計算每個候選實體與需求類型詞的語義匹配度,即“魚、堅果、水果、蝦皮、牛奶”等候選實體與“海產(chǎn)品”的匹配度,去除匹配度數(shù)值低于設(shè)定閾值的候選實體。
[0313]匹配度的具體計算方法如下:(1)實體關(guān)聯(lián)的多個類型與需求類型詞之間embedding向量的平均相似度加權(quán)。(2)需求類型詞關(guān)聯(lián)的多個實例與候選實體之間embedding向量的平均相似度加權(quán),其中,需求類型詞的實例可以通過XXX is a***這樣的模板來挖掘。
[0314]b)根據(jù)候選實體的上下文,去除語義上與需求類型詞的匹配度小于設(shè)定閾值的候選實體。例如,“蝦皮”雖然與需求類型詞“海產(chǎn)品”在類型上相匹配,但回答中說的是“蝦皮補(bǔ)鈣”,語義不匹配,因此去掉“蝦皮”,保留“魚類、貝類、三文魚”。
[0315]具體根據(jù)上下文計算匹配度可以包括:首先,通過依存句法分析樹找到和“海產(chǎn)品”有依存關(guān)系的term作為上下文,再根據(jù)該term計算匹配度,計算匹配度的具體計算公式如下:
[0316]語義匹配度W(i|海產(chǎn)品_>蝦皮)=term⑴的重要性打分*答案命中打分(θ|?)*與蝦皮的位置距離*否定關(guān)系打分(O 11)*傾向性分析(0-1),該公式表示在第i個term作為實體上下文時,海產(chǎn)品和蝦皮的語義匹配度打分,其中傾向性分析表示蝦皮前后的情感詞分類打分,該打分可以根據(jù)靜態(tài)統(tǒng)計生成。
[0317]此外,“補(bǔ)鈣”等上下文可作為推薦理由的關(guān)鍵詞候選,在產(chǎn)品展現(xiàn)中使用。
[0318]c)計算候選實體之間的上下位關(guān)系,例如,將“三文魚”歸為“魚類”,最終呈現(xiàn)的答案為:魚類(如三文魚)、貝類。這種上下文關(guān)系可以通過數(shù)據(jù)挖掘?qū)崿F(xiàn),挖掘的來源包括百科的tag、無結(jié)構(gòu)化文本等。比如百科詞條“三文魚”就有一個tag字段“魚類”。
[0319]本實施例通過直接給出實體答案,可以減少用戶的閱讀成本,一目了然;通過提供推薦理由,可以有統(tǒng)計數(shù)據(jù)和證據(jù),可靠性高,容易讓人信服,可輔助用戶決策;通過對搜索詞、問題、答案的多重聚類處理,一方面可以擴(kuò)大搜索詞的影響面,另一方面補(bǔ)充豐富答案數(shù)據(jù),降低長尾搜索帶來的數(shù)據(jù)稀疏影響,在擴(kuò)大影響面的同時,根據(jù)用戶行為、語義相似度等特征有效控制轉(zhuǎn)義風(fēng)險。
[0320]需要說明的是,在本發(fā)明的描述中,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本發(fā)明的描述中,除非另有說明,“多個”的含義是兩個或兩個以上。
[0321 ] 流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實施例所屬【技術(shù)領(lǐng)域】的技術(shù)人員所理解。
[0322]應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。
[0323]本【技術(shù)領(lǐng)域】的普通技術(shù)人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。
[0324]此外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中。
[0325]上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
[0326]在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。
[0327]盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實施例進(jìn)行變化、修改、替換和變型。
【權(quán)利要求】
1.一種搜索結(jié)果的展現(xiàn)方法,其特征在于,包括: 接收用戶輸入的搜索詞; 根據(jù)所述搜索詞,獲取搜索結(jié)果,所述搜索結(jié)果包括聚合推薦結(jié)果以及與所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由; 向所述用戶展現(xiàn)所述搜索結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述搜索詞,獲取搜索結(jié)果,包括: 對所述搜索詞進(jìn)行分析,所述分析包括問題類型分析,所述問題類型分析用于判斷所述搜索詞是否屬于適合為用戶推薦實體的搜索詞; 在所述搜索詞屬于適合為用戶推薦實體的搜索詞時,根據(jù)所述搜索詞進(jìn)行觀點聚合處理,得到所述搜索結(jié)果。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述分析還包括答案類型分析,所述答案類型分析用于確定所述搜索詞的需求類型詞,所述根據(jù)所述搜索詞進(jìn)行觀點聚合處理,包括: 從預(yù)先建立的倒排索引庫中,獲取與所述搜索詞關(guān)聯(lián)的搜索詞實例,并計算每個搜索詞實例與所述搜索詞之間的語義相似度數(shù)值,將語義相似度數(shù)值大于設(shè)定閾值的搜索詞實例確定為擴(kuò)展搜索詞,所述倒排索引庫中存儲搜索詞及與搜索詞關(guān)聯(lián)的搜索詞實例; 從預(yù)先建立的Q-Q正排索引庫中,獲取與所述擴(kuò)展搜索詞關(guān)聯(lián)的問題和第一特征數(shù)據(jù),所述Q-Q正排索引庫中存儲搜索詞及與搜索詞關(guān)聯(lián)的問題和第一特征數(shù)據(jù); 從預(yù)先建立的Q-A正排索引庫中,獲取與所述問題關(guān)聯(lián)的答案和第二特征數(shù)據(jù),所述Q-A正排索引庫中存儲問題及與問題關(guān)聯(lián)的答案和第二特征數(shù)據(jù); 根據(jù)所述需求類型詞對所述獲取的答案進(jìn)行觀點分析,得到在線的候選實體,以及每個在線的候選實體的相關(guān)度; 根據(jù)所述第一特征值、所述第二特征數(shù)據(jù)和所述每個在線的候選實體的相關(guān)度,對所述在線的候選實體進(jìn)行排序,并將排序后的候選實體確定為聚合推薦結(jié)果; 對每個聚合推薦結(jié)果對應(yīng)的答案進(jìn)行聚合統(tǒng)計,得到所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括:建立所述倒排索引庫,所述建立所述倒排索引庫,包括: 確定目標(biāo)搜索詞; 根據(jù)點擊日志,獲取所述目標(biāo)搜索詞發(fā)生點擊的URL ; 根據(jù)所述URL進(jìn)行站點挖掘; 根據(jù)所述站點挖掘的處理結(jié)果,獲取所述目標(biāo)搜索詞對應(yīng)的搜索詞實例; 將所述目標(biāo)搜索詞和所述目標(biāo)搜索詞對應(yīng)的搜索詞實例,關(guān)聯(lián)存儲在所述倒排索引庫中。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述站點挖掘的處理結(jié)果,獲取所述目標(biāo)搜索詞對應(yīng) 的搜索詞實例,包括: 根據(jù)所述站點挖掘確定目標(biāo)站點,并將所述目標(biāo)站點在點擊日志中關(guān)聯(lián)的搜索詞集合,確定為所述目標(biāo)搜索詞對應(yīng)的搜索詞實例;和/或,根據(jù)所述站點挖掘在每個所述URL關(guān)聯(lián)的頁面上進(jìn)行問答對挖掘,獲取問答對數(shù)據(jù);對所述問答對數(shù)據(jù)進(jìn)行預(yù)處理和分類后生成問題實例;確定所述問題實例為所述目標(biāo)搜索詞對應(yīng)的搜索詞實例。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,還包括:建立所述Q-Q正排索引庫,所述建立所述Q-Q正排索引庫,包括: 采用URL歸一化的方式,對所述問答對數(shù)據(jù)進(jìn)行問題聚類,得到聚類后的問題; 對搜索詞實例進(jìn)行實例聚類,得到聚類后的搜索詞; 根據(jù)所述聚類后的搜索詞和所述聚類后的問題確定所述第一特征數(shù)據(jù),并將所述聚類后的搜索詞和所述聚類后的問題及所述第一特征數(shù)據(jù)關(guān)聯(lián)存儲在Q-Q正排索引庫中。
7.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述觀點分析,包括: 對獲取的答案進(jìn)行實體抽取,獲取候選實體; 對所述候選實體進(jìn)行相關(guān)度計算,得到所述候選實體的相關(guān)度。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述對所述候選實體進(jìn)行相關(guān)度計算,包括: 計算所述候選實體與需求類型詞的語義相關(guān)度,以去除不屬于需求類型詞的候選實體; 計算所述候選實體的上下文與搜索詞的語義相關(guān)度,以去除上下文與搜索詞不匹配的候選實體。
9.根據(jù)權(quán)利要求1至8任一項所述的方法,其特征在于,所述向用戶展現(xiàn)搜索結(jié)果,包括: 如果在PC上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在同一個頁面上進(jìn)行展現(xiàn);或者, 如果在移動設(shè)備上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在不同的頁面上進(jìn)行展現(xiàn),其中,展現(xiàn)所述推薦理由的頁面是展現(xiàn)所述聚合推薦結(jié)果的頁面的下一級頁面。
10.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述推薦理由包括如下項中的至少一項: 對每個聚合推薦結(jié)果對應(yīng)的答案進(jìn)行用戶推薦統(tǒng)計后,得到的推薦個數(shù); 每個聚合推薦結(jié)果對應(yīng)的作為答案的用戶觀點; 對每個聚合推薦結(jié)果對應(yīng)的作為答案的用戶觀點進(jìn)行關(guān)鍵字提取,將提取的關(guān)鍵字確定為所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由。
11.一種搜索結(jié)果的展現(xiàn)裝置,其特征在于, 包括: 接收模塊,用于接收用戶輸入的搜索詞; 獲取模塊,用于根據(jù)所述搜索詞,獲取搜索結(jié)果,所述搜索結(jié)果包括聚合推薦結(jié)果以及與所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由; 展現(xiàn)模塊,用于向所述用戶展現(xiàn)所述搜索結(jié)果。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述獲取模塊包括: 分析單元,用于對所述搜索詞進(jìn)行分析,所述分析包括問題類型分析,所述問題類型分析用于判斷所述搜索詞是否屬于適合為用戶推薦實體的搜索詞;觀點聚合單元,用于在所述搜索詞屬于適合為用戶推薦實體的搜索詞時,根據(jù)所述搜索詞進(jìn)行觀點聚合處理,得到所述搜索結(jié)果。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述分析還包括答案類型分析,所述答案類型分析用于確定所述搜索詞的需求類型詞,所述觀點聚合單元具體用于: 從預(yù)先建立的倒排索引庫中,獲取與所述搜索詞關(guān)聯(lián)的搜索詞實例,并計算每個搜索詞實例與所述搜索詞之間的語義相似度數(shù)值,將語義相似度數(shù)值大于設(shè)定閾值的搜索詞實例確定為擴(kuò)展搜索詞,所述倒排索引庫中存儲搜索詞及與搜索詞關(guān)聯(lián)的搜索詞實例; 從預(yù)先建立的Q-Q正排索引庫中,獲取與所述擴(kuò)展搜索詞關(guān)聯(lián)的問題和第一特征數(shù)據(jù),所述Q-Q正排索引庫中存儲搜索詞及與搜索詞關(guān)聯(lián)的問題和第一特征數(shù)據(jù); 從預(yù)先建立的Q-A正排索引庫中,獲取與所述問題關(guān)聯(lián)的答案和第二特征數(shù)據(jù),所述Q-A正排索引庫中存儲問題及與問題關(guān)聯(lián)的答案和第二特征數(shù)據(jù); 根據(jù)所述需求類型詞對所述獲取的答案進(jìn)行觀點分析,得到在線的候選實體,以及每個在線的候選實體的相關(guān)度; 根據(jù)所述第一特征值、所述第二特征數(shù)據(jù)和所述每個在線的候選實體的相關(guān)度,對所述在線的候選實體進(jìn)行排序,并將排序后的候選實體確定為聚合推薦結(jié)果; 對每個聚合推薦結(jié)果對應(yīng)的答案進(jìn)行聚合統(tǒng)計,得到所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,還包括:用于建立所述倒排索引庫的第一離線處理模塊,所述第一離線處理模塊具體用于: 確定目標(biāo)搜索詞; 根據(jù)點擊日志,獲取所述目標(biāo)搜索詞發(fā)生點擊的URL ; 根據(jù)所述URL進(jìn)行站點挖掘; 根據(jù)所述站點挖掘的處理結(jié)果,獲取所述目標(biāo)搜索詞對應(yīng)的搜索詞實例; 將所述目標(biāo)搜索詞和所述目標(biāo)搜索詞對應(yīng)的搜索詞實例,關(guān)聯(lián)存儲在所述倒排索引庫中。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述第一離線處理模塊進(jìn)一步具體用于: 根據(jù)所述站點挖掘確定目標(biāo)站點,并將所述目標(biāo)站點在點擊日志中關(guān)聯(lián)的搜索詞集合,確定為所述目標(biāo)搜索詞對應(yīng)的搜索詞實例;和/或, 根據(jù)所述站點挖掘在每個所述URL關(guān)聯(lián)的頁面上進(jìn)行問答對挖掘,獲取問答對數(shù)據(jù);對所述問答對數(shù)據(jù)進(jìn)行預(yù)處理和分類后生成問題實例;確定所述問題實例為所述目標(biāo)搜索詞對應(yīng)的搜索詞實例。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,還包括:用于建立所述Q-Q正排索引庫的第二離線處理模塊,所述第二離線處理模塊具體用于: 采用URL歸一化的方式,對所述問答對數(shù)據(jù)進(jìn)行問題聚類,得到聚類后的問題; 對搜索詞實例進(jìn)行實例聚類,得到聚類后的搜索詞; 根據(jù)所述聚類后的搜索詞和所述聚類后的問題確定所述第一特征數(shù)據(jù),并將所述聚類后的搜索詞和所述聚類后的問題及所述第一特征數(shù)據(jù)關(guān)聯(lián)存儲在Q-Q正排索引庫中。
17.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述觀點聚合單元進(jìn)一步具體用于:對獲取的答案進(jìn)行實體抽取,獲取候選實體; 對所述候選實體進(jìn)行相關(guān)度計算,得到所述候選實體的相關(guān)度。
18.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述觀點聚合單元進(jìn)一步具體用于: 計算所述候選實體與需求類型詞的語義相關(guān)度,以去除不屬于需求類型詞的候選實體; 計算所述候選實體的上下文與搜索詞的語義相關(guān)度,以去除上下文與搜索詞不匹配的候選實體。
19.根據(jù)權(quán)利要求11至18任一項所述的裝置,其特征在于,所述展現(xiàn)模塊具體用于: 如果在PC上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在同一個頁面上進(jìn)行展現(xiàn);或者, 如果在移動設(shè)備上展現(xiàn)搜索結(jié)果,則將所述聚合推薦結(jié)果和所述推薦理由在不同的頁面上進(jìn)行展現(xiàn),其中,展現(xiàn)所述推薦理由的頁面是展現(xiàn)所述聚合推薦結(jié)果的頁面的下一級頁面。
20.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述觀點聚合單元得到的所述推薦理由包括如下項中的至少一項: 對每個聚合推薦結(jié)果對應(yīng)的答案進(jìn)行用戶推薦統(tǒng)計后,得到的推薦個數(shù); 每個聚合推薦結(jié)果對應(yīng)的作為答案的用戶觀點; 對每個聚合推薦結(jié)果對應(yīng)的作為答案的用戶觀點進(jìn)行關(guān)鍵字提取,將提取的關(guān)鍵字確定為所述聚合推薦結(jié)果關(guān)聯(lián)的推薦理由。
【文檔編號】G06F17/30GK103914543SQ201410134350
【公開日】2014年7月9日 申請日期:2014年4月3日 優(yōu)先權(quán)日:2014年4月3日
【發(fā)明者】張偉萌, 劉濤, 陳楠, 趙輝, 何伯磊, 饒思維, 陳堅忠, 付冬, 胡小博, 王文琳, 廖毅, 譚玉佩, 忻舟, 馬艷軍 申請人:北京百度網(wǎng)訊科技有限公司