本申請涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種基于深度問答的查詢結(jié)果的展現(xiàn)方法和裝置。
背景技術(shù):
深度問答(Deep question and answer),是指理解人類的語言,智能識別問題的含義,并從海量的互聯(lián)網(wǎng)數(shù)據(jù)中提取問題的答案。
相關(guān)技術(shù)中,當用戶檢索一個醫(yī)療查詢(query)的時候,搜索引擎可以提供給用戶很多網(wǎng)頁信息,用戶需要一個一個點擊進去才能獲取這些網(wǎng)頁內(nèi)的信息,而且答案存在不同觀點時,用戶需要很長時間來閱讀和比較才能獲取想要的答案。上述情形用戶檢索效率偏低,用戶體驗較差。
技術(shù)實現(xiàn)要素:
本申請旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本申請的一個目的在于提出一種基于深度問答的查詢結(jié)果的展現(xiàn)方法,該方法可以提高用戶檢索效率,提升用戶體驗。
本申請的另一個目的在于提出一種基于深度問答的查詢結(jié)果的展現(xiàn)裝置。
為達到上述目的,本申請第一方面實施例提出的基于深度問答的查詢結(jié)果的展現(xiàn)方法,包括:接收查詢,所述查詢?yōu)轭A(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢;獲取與所述查詢對應(yīng)的聚合結(jié)果的短觀點,每個聚合結(jié)果根據(jù)同一個觀點簇內(nèi)的觀點句所在的網(wǎng)頁聚合得到,聚合結(jié)果的短觀點根據(jù)對應(yīng)的觀點簇內(nèi)的觀點句得到;展現(xiàn)所述聚合結(jié)果的短觀點。
本申請第一方面實施例提出的基于深度問答的查詢結(jié)果的展現(xiàn)方法,通過獲取并展現(xiàn)查詢對應(yīng)的聚合結(jié)果的短觀點,可以對網(wǎng)頁進行聚合并提取其中的短觀點,從而可以提高用戶檢索效率,提升用戶體驗。
為達到上述目的,本申請第二方面實施例提出的基于深度問答的查詢結(jié)果的展現(xiàn)裝置,包括:接收模塊,用于接收查詢,所述查詢?yōu)轭A(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢;獲取模塊,用于獲取與所述查詢對應(yīng)的聚合結(jié)果的短觀點,每個聚合結(jié)果根據(jù)同一個觀點簇內(nèi)的觀點句所在的網(wǎng)頁聚合得到,聚合結(jié)果的短觀點根據(jù)對應(yīng)的觀點簇內(nèi)的觀點句得到;第一展現(xiàn)模塊,用于展現(xiàn)所述聚合結(jié)果的短觀點。
本申請第二方面實施例提出的基于深度問答的查詢結(jié)果的展現(xiàn)裝置,通過獲取并展現(xiàn)查詢對應(yīng)的聚合結(jié)果的短觀點,可以對網(wǎng)頁進行聚合并提取其中的短觀點,從而可以提高用戶檢索效率,提升用戶體驗。
本申請實施例還提出了一種設(shè)備,包括:一個或多個處理器;用于存儲一個或多個程序的存儲器;當所述一個或多個程序被所述一個或多個處理器執(zhí)行時,使得所述一個或多個處理器執(zhí)行本申請第一方面實施例任一項所述的方法。
本申請實施例還提出了一種非臨時性計算機可讀存儲介質(zhì),當所述存儲介質(zhì)中的一個或多個程序由設(shè)備的一個或多個處理器執(zhí)行時,使得所述一個或多個處理器執(zhí)行本申請第一方面實施例任一項所述的方法。
本申請實施例還提出了一種計算機程序產(chǎn)品,當所述計算機程序產(chǎn)品被設(shè)備中的一個或多個處理器執(zhí)行時,使得所述一個或多個處理器執(zhí)行本申請第一方面實施例任一項所述的方法。
本申請附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本申請的實踐了解到。
附圖說明
本申請上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解,其中:
圖1是本申請一個實施例提出的基于深度問答的查詢結(jié)果的展現(xiàn)方法的流程示意圖;
圖2是本申請實施例中一種查詢結(jié)果的展現(xiàn)效果示意圖;
圖3是是本申請另一個實施例提出的基于深度問答的查詢結(jié)果的展現(xiàn)方法的流程示意圖;
圖4是本申請實施例中用戶選擇一個聚合結(jié)果后的一種展現(xiàn)效果示意圖;
圖5是本申請實施例中獲取與查詢對應(yīng)的聚合結(jié)果的短觀點的方法流程示意圖;
圖6是本申請一個實施例提出的基于深度問答的查詢結(jié)果的展現(xiàn)裝置的結(jié)構(gòu)示意圖;
圖7是本申請另一個實施例提出的基于深度問答的查詢結(jié)果的展現(xiàn)裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面詳細描述本申請的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本申請,而不能理解為對本申請的限制。相反,本申請的實施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
圖1是本申請一個實施例提出的基于深度問答的查詢結(jié)果的展現(xiàn)方法的流程示意圖。
如圖1所示,本實施例的方法包括:
S11:接收查詢(query),所述查詢?yōu)轭A(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢。
例如,用戶以語音、文本等形式在客戶端中輸入查詢,之后客戶端可以將用戶輸入的查詢發(fā)送給搜索引擎,從而搜索引擎可以接收到客戶端發(fā)送的查詢。
搜索引擎在接收到客戶端發(fā)送的查詢后,可以先判斷該查詢是否為預(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢,在判斷結(jié)果為是時執(zhí)行后續(xù)流程,否則依照通常的檢索流程進行。
預(yù)設(shè)領(lǐng)域例如為醫(yī)療領(lǐng)域,預(yù)設(shè)類型例如包括:“怎么辦”、“為什么”、“癥狀”等。
具體可以采用字符串匹配的方式,比如預(yù)先設(shè)置醫(yī)療領(lǐng)域的詞典,如果查詢中包含該詞典中的詞或其近似詞則表明查詢?yōu)轭A(yù)設(shè)領(lǐng)域的查詢;另外,如果查詢中包括上述各類型的詞,如包含“怎么辦”、“為什么”、“癥狀”等詞或其近似詞,則表明查詢?yōu)轭A(yù)設(shè)類型的查詢。
S12:獲取與所述查詢對應(yīng)的聚合結(jié)果的短觀點,每個聚合結(jié)果根據(jù)同一個觀點簇內(nèi)的觀點句所在的網(wǎng)頁聚合得到,聚合結(jié)果的短觀點根據(jù)對應(yīng)的觀點簇內(nèi)的觀點句得到。
搜索引擎在確定查詢?yōu)轭A(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢后,可以先獲取與查詢對應(yīng)的網(wǎng)頁,再對網(wǎng)頁進行處理得到聚合結(jié)果及其短觀點。短觀點是指用于代表聚合結(jié)果的一段文字且該一段文字包含的字數(shù)小于預(yù)設(shè)值,如小于20個字。
搜索結(jié)果獲取聚合結(jié)果及其短觀點的具體內(nèi)容可以參見后續(xù)描述。
S13:展現(xiàn)所述聚合結(jié)果的短觀點。
搜索引擎在獲取到聚合結(jié)果及其短觀點后,可以將其發(fā)送給客戶端,從而由客戶端展現(xiàn)給用戶。
圖2給出了一種查詢結(jié)果的展現(xiàn)示意圖,如圖2所示,用戶輸入查詢21后,搜索引擎可以獲取到與查詢對應(yīng)的多個聚合結(jié)果,并確定每個聚合結(jié)果的短觀點,之后搜索引擎可以將各個聚合結(jié)果的短觀點發(fā)送給客戶端,由客戶端進行展現(xiàn),如圖2所示,客戶端可以展現(xiàn)給用戶多個聚合結(jié)果的短觀點22。
進一步的,在得到聚合結(jié)果后,根據(jù)聚合結(jié)果的短觀點生成摘要信息,并對應(yīng)所述聚合結(jié)果展現(xiàn)對應(yīng)的摘要信息。在具體實施時,可以每個聚合結(jié)果均展現(xiàn)摘要信息,或者也可以對應(yīng)部分聚合結(jié)果展現(xiàn)摘要信息。例如,如圖2所示,對應(yīng)第一個聚合結(jié)果展現(xiàn)相應(yīng)的摘要信息23。
在根據(jù)短觀點生成摘要信息時,例如,獲取短觀點所在的文件片段,將該文件片段與所在的段首組合,形成摘要信息。
一些實施例中,如圖3所示,基于深度問答的查詢結(jié)果的展現(xiàn)方法還可以包括:
S14:接收到對聚合結(jié)果的選擇指令后,展現(xiàn)選擇的聚合結(jié)果對應(yīng)的網(wǎng)頁信息。
每個聚合結(jié)果的短觀點可以分別位于一個可點擊的展現(xiàn)項中,當用戶點擊某個聚合結(jié)果的短觀點所在的展現(xiàn)項時,則表明用戶選擇了該展現(xiàn)項所對應(yīng)的聚合結(jié)果,之后可以展現(xiàn)相應(yīng)的網(wǎng)頁信息。
例如,用戶點擊圖2所示的“常見觀點1”對應(yīng)的展現(xiàn)項后,可以展現(xiàn)如圖4所示的頁面,該頁面中包括“常見觀點1”對應(yīng)的網(wǎng)頁信息41,也就是“常見觀點1”所屬的觀點簇內(nèi)的觀點句所在的網(wǎng)頁的信息。
本實施例中,通過獲取并展現(xiàn)查詢對應(yīng)的聚合結(jié)果的短觀點,可以對網(wǎng)頁進行聚合并提取其中的短觀點,從而可以提高用戶檢索效率,提升用戶體驗。
圖5是本申請實施例中獲取與查詢對應(yīng)的聚合結(jié)果的短觀點的方法流程示意圖。
如圖5所示,本實施例的方法包括:
S51:對接收的查詢進行識別,判斷所述查詢是否為預(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢,若是執(zhí)行S53及其后續(xù)步驟,否則執(zhí)行S52。
預(yù)設(shè)領(lǐng)域例如為醫(yī)療領(lǐng)域,預(yù)設(shè)類型例如包括:“怎么辦”、“為什么”、“癥狀”等。
具體可以采用字符串匹配的方式,比如預(yù)先設(shè)置醫(yī)療領(lǐng)域的詞典,如果查詢中包含該詞典中的詞或其近似詞則表明查詢?yōu)轭A(yù)設(shè)領(lǐng)域的查詢;另外,如果查詢中包括上述各類型的詞,如包含“怎么辦”、“為什么”、“癥狀”等詞或其近似詞,則表明查詢?yōu)轭A(yù)設(shè)類型的查詢。
S52:按照通常檢索方式進行檢索。
例如,獲取與查詢對應(yīng)的網(wǎng)頁并在搜索結(jié)果頁上展現(xiàn)一條一條的網(wǎng)頁信息。
S53:在預(yù)先建立的網(wǎng)頁資源庫中獲取與所述查詢對應(yīng)的網(wǎng)頁。
本實施例中,網(wǎng)頁資源庫包括兩個部分:
第一部分:通用網(wǎng)頁資源庫,也就是目前查詢使用的網(wǎng)頁資源庫。
第一部分和通常檢索時使用的網(wǎng)頁資源庫相同。
第二部分:所述預(yù)設(shè)領(lǐng)域的垂類網(wǎng)頁資源庫。
例如,第二部分為醫(yī)療領(lǐng)域的垂類網(wǎng)頁資源庫。
第二部分的網(wǎng)頁資源庫可以通過引入相關(guān)的資源方合作獲取高質(zhì)量數(shù)據(jù)。
這兩部分數(shù)據(jù)中,第一部分是傳統(tǒng)搜索的網(wǎng)頁庫,優(yōu)點是網(wǎng)頁資源很多,并且有經(jīng)過用戶長期點調(diào)之后的網(wǎng)頁排序來保證top網(wǎng)頁的質(zhì)量,但是缺點是對于垂類而言,有些優(yōu)質(zhì)資源無法利用他的結(jié)構(gòu)化信息來排序,從而導(dǎo)致有的優(yōu)質(zhì)資源其實排名靠后。第二部分垂類網(wǎng)頁庫可以通過合作引入高質(zhì)量的數(shù)據(jù)。通過使用上述兩部分的網(wǎng)頁資源庫,可以既保證資源數(shù)量,又可以保證資源質(zhì)量。
進一步的,對于第二部分的網(wǎng)頁,可以離線抽取網(wǎng)頁中的短觀點,并記錄在正排檢索庫中,從而可以減少在線抽取短觀點的時間,提升系統(tǒng)效率。
S54:在所述網(wǎng)頁中抽取觀點句。
以醫(yī)療領(lǐng)域的查詢?yōu)槔煌愋偷牟樵兺ǔ?yīng)不同的觀點句。例如,對于“怎么辦”這種類型的查詢,相應(yīng)的觀點句通常是“喂寶寶點媽咪愛試試”、“多鍛煉身體”這種動作指引的句子;對于“為什么”這種類型的查詢,相應(yīng)的觀點句通常是“因為吃多了”、“天冷導(dǎo)致的感冒”或者直接是疾病詞,如“感冒”;對于“癥狀”這種類型的查詢,相應(yīng)的觀點句是明確的疾病癥狀,通過癥狀詞詞典較好判斷。
在網(wǎng)頁中抽取觀點句時,可以基于機器學(xué)習抽取觀點句。
具體的,對于每個網(wǎng)頁,對網(wǎng)頁進行分句,得到網(wǎng)頁中的句子,之后先判斷句子是否為短句,如將字數(shù)小于預(yù)設(shè)值的句子確定為短句,再基于機器學(xué)習判斷短句是否為觀點句,從而得到網(wǎng)頁中的觀點句。對應(yīng)非短句則可以不進行后續(xù)判斷直接認為不是觀點句。
在判斷一個短句是否為觀點句時,可以采用分類器進行,例如,可以預(yù)先對應(yīng)每種類型建立一種分類器,如“怎么辦”對應(yīng)一種分類器,“為什么”對應(yīng)一種分類器,“癥狀”對應(yīng)一種分類器,之后選擇與查詢所屬類型對應(yīng)的分類器,提取短句的特征,將提取的特征作為選擇的分類器的輸入,分類器輸出為短句的置信度,置信度通常是位于0~1之間的值,如果置信度大于預(yù)設(shè)值則表明相應(yīng)的短句為觀點句。
各類型的分類器可以預(yù)先通過訓(xùn)練生成。例如,收集各類型查詢對應(yīng)的答案句子,并對答案句子進行是否為觀點句的標注,并提取答案句子的特征,依據(jù)提取的特征和標注結(jié)果進行訓(xùn)練,生成相應(yīng)類型的分類器。
對于“怎么辦”類型的問題,由于句式通常是動作指引類型,所以主要使用的特征包括臨近的動詞加名詞組合、形容詞加動詞組合、副詞加動詞組合、一些模板(如“建議(.+?)”等)、弱模板加后面的動詞(因為“多(.+?)$”單獨匹配可能帶來很多噪聲,但是配合鄰接的動詞,如“多“加”運動”,則能減少很多噪聲)、ngram特征、句首詞、句尾詞、上下文是否是引導(dǎo)句、以及一些賓語前置組合等特征。上述的“建議(.+?)”、“多(.+?)$”表示正則表達式匹配,當然也可以設(shè)置為其他匹配方式。
對于“為什么”類型的問題,根據(jù)句式特點,主要使用的特征有模板特征(如“因為”、“導(dǎo)致”等)、上下文是否為引導(dǎo)句、ngram特征、句首尾詞、命中的一些疾病詞、離線挖掘的疾病常見原因詞典的匹配情況、基于word2vec的問答相關(guān)性計算等特征。
對于“癥狀”類型的問題,由于答案絕大部分都是一些名詞,因此方法主要是利用癥狀詞典匹配,以及癥狀模板。離線挖掘癥狀詞詞典的方法主要是利用一些癥狀的模板,比如“有(.+?)的癥狀”離線處理大批的數(shù)據(jù),將命中的部分進行分詞、統(tǒng)計,可以得到大量的癥狀詞詞典。
S55:對所述觀點句進行聚合和歸一化,得到觀點簇及其短觀點;
由于希望展現(xiàn)給用戶的是網(wǎng)友觀點的集合,而自然網(wǎng)頁中這些網(wǎng)友觀點雖然是一致的,但是文字卻不盡相同,所以需要進行聚合和歸一化。
聚合的方法大致是一個層次聚類的思路,首先計算觀點句之間的相似度,基于相似度進行聚類,然后基于聚類得到的各類的關(guān)鍵詞,對關(guān)鍵詞相同的類進行合并,將合并后的每個類作為一個觀點簇。在計算相似度時,可以基于觀點句包含的字的字向量和分詞的詞向量進行相似度,取兩者的最大值作為相似度數(shù)值,從而可以召回盡量多數(shù)量的相似內(nèi)容。每個類的關(guān)鍵詞可以根據(jù)類中詞的TF-IDF值確定,比如將類中TF-IDF值最大的詞作為該類的關(guān)鍵詞,其中,TF值為局部信息,即詞在相應(yīng)的某個類中的出現(xiàn)頻率,IDF值為全局信息,如根據(jù)所有類的信息確定一個詞的IDF值。
歸一化的目的是選取一個文字說法比較好的觀點來代表整個簇,方法大致是對觀點簇內(nèi)的各觀點句,判斷各觀點句的邊界是否光滑,并且是否有一些冗余部分,如果觀點簇內(nèi)沒有很好的觀點句,則會已有的觀點句進行處理,如去掉冗余的語氣助詞等成分,從而將邊界光滑且沒有冗余部分的內(nèi)容作為相應(yīng)觀點簇的短觀點。句子邊界是否光滑主要依據(jù)句式模板判斷,比如符合句式模板則表明句子邊界光滑,句式模板如“建議…”,則相應(yīng)的,如果一個句子是“建議你喝水”則表明邊界光滑,否則,如果一個句子是“我個人建議你喝水”則表明句子邊界不光滑。冗余部分的判斷可以依據(jù)是否包含冗余詞判斷,即如果包含冗余詞則表明句子有冗余部分,冗余詞可以預(yù)先配置,如一些語氣助詞“啊”、“呢”等。
在得到觀點簇的短觀點后,還可以對觀點簇內(nèi)原有的觀點句進行過濾,例如計算原有觀點句與短觀點之間的相似度,去除相似度數(shù)值小于預(yù)設(shè)值的原有觀點句,從而將剩余的觀點句用于后續(xù)運算。通過過濾可以保證觀點簇內(nèi)觀點和觀點簇的短觀點語義相近。
S56:對所述觀點簇進行簇外和簇內(nèi)排序和選擇,得到選擇后的觀點簇和選擇后的觀點簇內(nèi)的觀點句所在的網(wǎng)頁,以及,將每個選擇后的觀點簇內(nèi)的觀點句所在的網(wǎng)頁聚合成一個聚合結(jié)果,并將每個選擇后的觀點簇的短觀點確定為對應(yīng)的聚合結(jié)果的短觀點。
在得到上述的觀點簇后,可以先進行簇外排序,即對各觀點簇之間進行排序,排序算法可以設(shè)置,例如根據(jù)觀點簇內(nèi)包括的觀點句的輸入、每個觀點句的置信度、觀點句是否有信息量等進行。在對各觀點簇之間進行排序后,可以選擇排序在前的預(yù)設(shè)個數(shù)的觀點簇作為選擇后的觀點簇。
在得到選擇后的觀點簇后,可以對每個選擇后的觀點簇內(nèi)的觀點句所在的網(wǎng)頁進行排序,排序算法可以設(shè)置,例如網(wǎng)頁包含權(quán)威專家的問答、網(wǎng)頁是質(zhì)量高的網(wǎng)站提供的,則相應(yīng)網(wǎng)頁排序在前。在對各網(wǎng)頁進行排序后,可以選擇排序在前的預(yù)設(shè)個數(shù)的網(wǎng)頁作為選擇后的網(wǎng)頁。其中,觀點簇對應(yīng)的預(yù)設(shè)個數(shù)與網(wǎng)頁對應(yīng)的預(yù)設(shè)個數(shù)相互獨立,可以相同或不同。
對應(yīng)每個觀點簇得到選擇后的網(wǎng)頁后,可以將這些選擇后的網(wǎng)頁聚合得到一個聚合結(jié)果,并將該觀點簇的短觀點作為相應(yīng)的聚合結(jié)果的短觀點。
如上,搜索引擎可以得到各聚合結(jié)果及其短觀點,之后搜索引擎可以將各聚合結(jié)果的短觀點發(fā)送給客戶端,以供客戶端展現(xiàn)給用戶,因此用戶可以看到經(jīng)過聚合和提取后的簡短信息,以提高檢索效率和用戶體驗。以及,用戶在選擇一個聚合結(jié)果后,搜索引擎可以將用戶選擇的聚合結(jié)果對應(yīng)的網(wǎng)頁信息發(fā)送給客戶端,由客戶端展現(xiàn)給用戶,之后用戶可以根據(jù)需要查看每種短觀點對應(yīng)的更詳細的網(wǎng)頁信息。
圖6是本申請一個實施例提出的基于深度問答的查詢結(jié)果的展現(xiàn)裝置的結(jié)構(gòu)示意圖。
如圖6所示,本實施例的裝置60包括:接收模塊61、獲取模塊62和第一展現(xiàn)模塊63。
接收模塊61,用于接收查詢,所述查詢?yōu)轭A(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢;
獲取模塊62,用于獲取與所述查詢對應(yīng)的聚合結(jié)果的短觀點,每個聚合結(jié)果根據(jù)同一個觀點簇內(nèi)的觀點句所在的網(wǎng)頁聚合得到,聚合結(jié)果的短觀點根據(jù)對應(yīng)的觀點簇內(nèi)的觀點句得到;
第一展現(xiàn)模塊63,用于展現(xiàn)所述聚合結(jié)果的短觀點。
一些實施例中,參見圖7,該裝置60還包括:
第二展現(xiàn)模塊64,用于接收到對聚合結(jié)果的選擇指令后,展現(xiàn)選擇的聚合結(jié)果對應(yīng)的網(wǎng)頁信息。
一些實施例中,參見圖7,所述獲取模塊62包括:
查詢識別子模塊621,用于對接收的查詢進行識別,判斷所述查詢是否為預(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢,以便在所述查詢?yōu)轭A(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢時,觸發(fā)如下子模塊執(zhí)行;
檢索子模塊622,用于在預(yù)先建立的網(wǎng)頁資源庫中獲取與所述查詢對應(yīng)的網(wǎng)頁;
觀點句抽取子模塊623,用于在所述網(wǎng)頁中抽取觀點句;
觀點句處理子模塊624,用于對所述觀點句進行聚合和歸一化,得到觀點簇及其短觀點;
觀點簇處理子模塊625,用于對所述觀點簇進行簇外和簇內(nèi)排序和選擇,得到選擇后的觀點簇和選擇后的觀點簇內(nèi)的觀點句所在的網(wǎng)頁,以及,將每個選擇后的觀點簇內(nèi)的觀點句所在的網(wǎng)頁聚合成一個聚合結(jié)果,并將每個選擇后的觀點簇的短觀點確定為對應(yīng)的聚合結(jié)果的短觀點。
一些實施例中,所述觀點簇處理子模塊625還用于:在得到聚合結(jié)果后,根據(jù)聚合結(jié)果的短觀點生成摘要信息;
所述第一展現(xiàn)模塊623還用于:對應(yīng)所述聚合結(jié)果展現(xiàn)摘要信息。
一些實施例中,所述網(wǎng)頁資源庫包括:
通用網(wǎng)頁資源庫;以及,
所述預(yù)設(shè)領(lǐng)域的垂類網(wǎng)頁資源庫。
一些實施例中,所述觀點句抽取子模塊623具體用于:
對所述網(wǎng)頁進行分句,得到所述網(wǎng)頁中的句子;
如果所述句子為短句,則基于機器學(xué)習判斷所述短句是否為觀點句;
如果所述短句為觀點句,則將所述短句作為所述網(wǎng)頁中的觀點句。
一些實施例中,所述觀點句處理子模塊624具體用于:
計算觀點句之間的相似度,并根據(jù)相似度對觀點句進行聚類,得到多個類;確定每個類的關(guān)鍵詞,并對關(guān)鍵詞相同的類進行合并,將合并后的每個類作為一個觀點簇;
對觀點簇內(nèi)的觀點句進行歸一化,得到觀點簇的短觀點。
可以理解的是,本實施例的裝置與上述方法實施例對應(yīng),具體內(nèi)容可以參見方法實施例的相關(guān)描述,在此不再詳細說明。
本實施例中,通過獲取并展現(xiàn)查詢對應(yīng)的聚合結(jié)果的短觀點,可以對網(wǎng)頁進行聚合并提取其中的短觀點,從而可以提高用戶檢索效率,提升用戶體驗。
本申請實施例還提出了一種設(shè)備,包括:一個或多個處理器;用于存儲一個或多個程序的存儲器;當所述一個或多個程序被所述一個或多個處理器執(zhí)行時,使得所述一個或多個處理器執(zhí)行:接收查詢,所述查詢?yōu)轭A(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢;獲取與所述查詢對應(yīng)的聚合結(jié)果的短觀點,每個聚合結(jié)果根據(jù)同一個觀點簇內(nèi)的觀點句所在的網(wǎng)頁聚合得到,聚合結(jié)果的短觀點根據(jù)對應(yīng)的觀點簇內(nèi)的觀點句得到;展現(xiàn)所述聚合結(jié)果的短觀點。
可以理解的是,如果該設(shè)備為用戶側(cè)的終端設(shè)備,則具體接收用戶輸入的查詢,以及獲取服務(wù)端發(fā)送的與所述查詢對應(yīng)的聚合結(jié)果的短觀點,以及展現(xiàn)所述聚合結(jié)果的短觀點?;蛘?,如果該設(shè)備為服務(wù)端的設(shè)備時,則具體接收客戶端發(fā)送的查詢,獲取與查詢對應(yīng)的聚合結(jié)果的短觀點,以及將聚合結(jié)果的短觀點發(fā)送給客戶端,通過客戶端展現(xiàn)所述聚合結(jié)果的短觀點。
本申請實施例還提出了一種非臨時性計算機可讀存儲介質(zhì),當所述存儲介質(zhì)中的一個或多個程序由設(shè)備的一個或多個處理器執(zhí)行時,使得所述一個或多個處理器執(zhí)行:接收查詢,所述查詢?yōu)轭A(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢;獲取與所述查詢對應(yīng)的聚合結(jié)果的短觀點,每個聚合結(jié)果根據(jù)同一個觀點簇內(nèi)的觀點句所在的網(wǎng)頁聚合得到,聚合結(jié)果的短觀點根據(jù)對應(yīng)的觀點簇內(nèi)的觀點句得到;展現(xiàn)所述聚合結(jié)果的短觀點。
本申請實施例還提出了一種計算機程序產(chǎn)品,當所述計算機程序產(chǎn)品被設(shè)備中的一個或多個處理器執(zhí)行時,使得所述一個或多個處理器執(zhí)行:接收查詢,所述查詢?yōu)轭A(yù)設(shè)領(lǐng)域的預(yù)設(shè)類型的查詢;獲取與所述查詢對應(yīng)的聚合結(jié)果的短觀點,每個聚合結(jié)果根據(jù)同一個觀點簇內(nèi)的觀點句所在的網(wǎng)頁聚合得到,聚合結(jié)果的短觀點根據(jù)對應(yīng)的觀點簇內(nèi)的觀點句得到;展現(xiàn)所述聚合結(jié)果的短觀點。
可以理解的是,上述各實施例中相同或相似部分可以相互參考,在一些實施例中未詳細說明的內(nèi)容可以參見其他實施例中相同或相似的內(nèi)容。
需要說明的是,在本申請的描述中,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本申請的描述中,除非另有說明,“多個”的含義是指至少兩個。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本申請的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本申請的實施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
應(yīng)當理解,本申請的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。
本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。
此外,在本申請各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質(zhì)中。
上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本申請的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。
盡管上面已經(jīng)示出和描述了本申請的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本申請的限制,本領(lǐng)域的普通技術(shù)人員在本申請的范圍內(nèi)可以對上述實施例進行變化、修改、替換和變型。