網(wǎng)頁摘要生成方法、展示方法及相應裝置的制造方法
【技術領域】
[0001]本發(fā)明實施例涉及互聯(lián)網(wǎng)技術領域,尤其涉及網(wǎng)頁摘要生成方法、展示方法及相應裝置。
【背景技術】
[0002]目前,搜索引擎在接收到包含有查詢語句的搜索請求之后,會基于該查詢語句進行網(wǎng)頁搜索工作,以得到與查詢語句關聯(lián)的多個網(wǎng)頁,進而在對得到的多個網(wǎng)頁進行打分及排序后,將經(jīng)過排序后的多個網(wǎng)頁的鏈接信息,作為搜索結果展示給終端用戶。其中,所展示的任意一個網(wǎng)頁的鏈接信息通常包括:用于描述該網(wǎng)頁主要內(nèi)容以及網(wǎng)站名稱的標題;涵蓋了該網(wǎng)頁主要內(nèi)容和關鍵詞匯的摘要(通常在80個字以內(nèi));以及其他的一些信息,例如最后抓取網(wǎng)頁的日期和時間。
[0003]圖1A是現(xiàn)有技術提供的一種展示給終端用戶的搜索結果中的一個網(wǎng)頁的鏈接信息示意圖。如圖1A所示,該網(wǎng)頁的鏈接信息中的標題101為“無線路由器怎么設置?美國網(wǎng)件設置美國網(wǎng)件路由器_商都社區(qū)”,摘要102為“無線路由器怎么設置?美國網(wǎng)件設置美國網(wǎng)件路由器,無線路由器怎么設置? NETGEIR美國美國網(wǎng)件重投中國市場,……”。
[0004]其中,對于網(wǎng)頁的鏈接信息中的摘要的生成過程而言,現(xiàn)有技術通常采用如下方法得到:在接收到包含有查詢語句的搜索請求,并基于該查詢語句進行網(wǎng)頁搜索,得到多個網(wǎng)頁之后,針對所得到的各個網(wǎng)頁,將該查詢語句與得到的網(wǎng)頁的文本數(shù)據(jù)進行相似度匹配,取出文本數(shù)據(jù)中和該查詢語句相似度高的內(nèi)容,作為網(wǎng)頁的摘要。
[0005]但是,在研宄的過程當中發(fā)明人發(fā)現(xiàn)上述現(xiàn)有技術存在如下缺陷:通過現(xiàn)有技術所生成的網(wǎng)頁摘要,往往是用戶輸入的查詢語句中的詞匯或者近義詞所在的句子片段,網(wǎng)頁摘要是和查詢語句相似的,因此對于查詢語句是問題類型的查詢語句而言,所得到的搜索結果中的網(wǎng)頁摘要里面經(jīng)常會出現(xiàn)沒有太多含義的詞匯,并不能達到向用戶提示重要信息的作用;并且由于摘要的長度又是有限的,其他摘要內(nèi)容相應的就很少了,所以很多其他有用的信息不能夠被展示出來。例如,圖1A是在查詢語句為“無線路由器怎么辦”下所搜索到的一個網(wǎng)頁,顯然該網(wǎng)頁的摘要內(nèi)容都是與“無線路由器怎么辦”相似的句子,并沒有給出關鍵信息。
【發(fā)明內(nèi)容】
[0006]本發(fā)明實施例提供網(wǎng)頁摘要生成方法、展示方法及相應裝置,以使得所生成的網(wǎng)頁摘要可以包含有有意義的重要信息,對用戶輸入的查詢語句起到很好的提示作用,提升用戶的搜索體驗。
[0007]一方面,本發(fā)明實施例提供了一種網(wǎng)頁摘要生成方法,該方法包括:
[0008]獲取問題類型的歷史查詢語句對應的歷史搜索結果中的網(wǎng)頁;
[0009]確定所述網(wǎng)頁中包含的至少一組答案類數(shù)據(jù);
[0010]基于所確定的答案類數(shù)據(jù),生成所述網(wǎng)頁的摘要。
[0011]另一方面,本發(fā)明實施例提供了一種網(wǎng)頁摘要展示方法,該方法包括:
[0012]獲取本次搜索請求中包含的問題類型的查詢語句對應的搜索結果中的網(wǎng)頁;
[0013]獲取預先存儲的所述網(wǎng)頁的摘要,添加至所述網(wǎng)頁的鏈接信息中,其中所述摘要為根據(jù)上述所述的網(wǎng)頁摘要生成方法得到的摘要;
[0014]對所述搜索結果中的網(wǎng)頁的鏈接信息進行展示。
[0015]再一方面,本發(fā)明實施例還提供了一種網(wǎng)頁摘要生成裝置,該裝置包括:
[0016]網(wǎng)頁獲取模塊,用于獲取問題類型的歷史查詢語句對應的歷史搜索結果中的網(wǎng)頁;
[0017]答案類數(shù)據(jù)確定模塊,用于確定所述網(wǎng)頁中包含的至少一組答案類數(shù)據(jù);
[0018]網(wǎng)頁摘要生成模塊,用于基于所確定的答案類數(shù)據(jù),生成所述網(wǎng)頁的摘要。
[0019]再一方面,本發(fā)明實施例還提供了一種網(wǎng)頁摘要展示裝置,該裝置包括:
[0020]網(wǎng)頁獲取模塊,用于獲取本次搜索請求中包含的問題類型的查詢語句對應的搜索結果中的網(wǎng)頁;
[0021]摘要獲取模塊,用于獲取預先存儲的所述網(wǎng)頁的摘要,添加至所述網(wǎng)頁的鏈接信息中,其中所述摘要為根據(jù)上述所述的網(wǎng)頁摘要生成裝置得到的摘要;
[0022]展示模塊,用于對所述搜索結果中的網(wǎng)頁的鏈接信息進行展示。
[0023]本發(fā)明實施例提供的技術方案,針對問題類型的歷史查詢語句的歷史搜索結果中的網(wǎng)頁,并非是將網(wǎng)頁中與查詢語句相似的內(nèi)容作為網(wǎng)頁的摘要,而是通過一定手段抽取網(wǎng)頁中的答案類數(shù)據(jù),進而基于該答案類數(shù)據(jù)來生成網(wǎng)頁的摘要,因此可使得所生成的網(wǎng)頁摘要可以包含有有意義的重要信息,對用戶輸入的查詢語句起到很好的提示作用,提升用戶的搜索體驗。
[0024]另外,本發(fā)明實施例還提供一種網(wǎng)頁摘要生成方法及裝置,以使得所生成的網(wǎng)頁摘要可以包含有有意義的重要信息,對用戶輸入的查詢語句起到很好的提示作用,提升用戶的搜索體驗。
[0025]一方面,本發(fā)明實施例提供了一種網(wǎng)頁摘要生成方法,該方法包括:
[0026]獲取本次搜索請求中包含的問題類型的查詢語句對應的搜索結果中的多個網(wǎng)頁,并構建詞表,其中所述詞表由所述多個網(wǎng)頁的文本內(nèi)容中頻次統(tǒng)計特征值滿足設定條件的分詞組成;
[0027]將所述多個網(wǎng)頁中的一個網(wǎng)頁作為目標網(wǎng)頁,根據(jù)所述詞表計算所述目標網(wǎng)頁的文本內(nèi)容中的分句的重要度;
[0028]基于所述重要度,從所述目標網(wǎng)頁的文本內(nèi)容中抽取數(shù)據(jù),作為所述目標網(wǎng)頁的摘要。
[0029]另一方面,本發(fā)明實施例還提供了一種網(wǎng)頁摘要生成裝置,該裝置包括:
[0030]網(wǎng)頁獲取模塊,用于獲取本次搜索請求中包含的問題類型的查詢語句對應的搜索結果中的多個網(wǎng)頁,并構建詞表,其中所述詞表由所述多個網(wǎng)頁的文本內(nèi)容中頻次統(tǒng)計特征值滿足設定條件的分詞組成;
[0031]分句重要度計算模塊,用于將所述多個網(wǎng)頁中的一個網(wǎng)頁作為目標網(wǎng)頁,根據(jù)所述詞表計算所述目標網(wǎng)頁的文本內(nèi)容中的分句的重要度;
[0032]網(wǎng)頁摘要生成模塊,用于基于所述重要度,從所述目標網(wǎng)頁的文本內(nèi)容中抽取數(shù)據(jù),作為所述目標網(wǎng)頁的摘要。
[0033]在本發(fā)明實施例中,在獲取到本次搜索請求中包含的問題類型的查詢語句對應的搜索結果中的多個網(wǎng)頁之后,生成所獲取的單個網(wǎng)頁的摘要時,并不是如現(xiàn)有技術那樣,簡單地將該網(wǎng)頁中與查詢語句具有很高相似度的相關內(nèi)容,作為該網(wǎng)頁的摘要,而是綜合考慮所實時獲取到的多個網(wǎng)頁中的文本內(nèi)容,基于這些網(wǎng)頁中頻次統(tǒng)計特征值滿足設定條件的分詞,來計算單個網(wǎng)頁的文本內(nèi)容中的分句的重要度,進而基于所述重要度從單個網(wǎng)頁的文本內(nèi)容中抽取數(shù)據(jù),作為單個網(wǎng)頁的摘要。針對問題類型的查詢語句對應的搜索結果而言,由于所基于的多個網(wǎng)頁中頻次統(tǒng)計特征值滿足設定條件的分詞,例如出現(xiàn)頻次高于設定閾值的分詞,最可能是與查詢語句所屬問題對應的答案類的數(shù)據(jù),因此根據(jù)這些分詞生成的網(wǎng)頁摘要可以包含有有意義的重要信息,對用戶輸入的查詢語句起到很好的提示作用,提升用戶的搜索體驗。
【附圖說明】
[0034]圖1A是現(xiàn)有技術提供的一種展示給終端用戶的搜索結果中的一個網(wǎng)頁的鏈接信息示意圖;
[0035]圖1B是本發(fā)明實施例一提供的一種網(wǎng)頁摘要生成方法的流程示意圖;
[0036]圖2是本發(fā)明實施例二提供的一種網(wǎng)頁摘要生成方法的流程示意圖;
[0037]圖3A是本發(fā)明實施例三提供的一種網(wǎng)頁摘要生成方法的流程示意圖;
[0038]圖3B是本發(fā)明實施例三提供的一種網(wǎng)頁的部分內(nèi)容的顯示示意圖;
[0039]圖4A是本發(fā)明實施例四提供的一種網(wǎng)頁摘要展示方法的流程示意圖;
[0040]圖4B-圖4F是本發(fā)明實施例四提供的各種網(wǎng)頁摘要的展示示意圖;
[0041]圖5是本發(fā)明實施例五提供的一種網(wǎng)頁摘要生成裝置的結構示意圖;
[0042]圖6是本發(fā)明實施例六提供的一種網(wǎng)頁摘要展示裝置的結構示意圖;
[0043]圖7是本發(fā)明實施例七提供的一種網(wǎng)頁摘要生成方法的流程示意圖;
[0044]圖8是本發(fā)明實施例八提供的一種網(wǎng)頁摘要生成方法的流程示意圖;
[0045]圖9A是本發(fā)明實施例九提供的一種網(wǎng)頁摘要生成方法的流程示意圖;
[0046]圖9B是本發(fā)明實施例九提供的與問題類型為步驟類型的某條查詢語句所關聯(lián)的一個網(wǎng)頁的摘要顯示示意圖;
[0047]圖10是本發(fā)明實施例十提供的一種網(wǎng)頁摘要生成方法的流程示意圖;
[0048]圖11是本發(fā)明實施例十一提供的一種網(wǎng)頁摘要生成方法的流程示意圖;
[0049]圖12是本發(fā)明實施例十二提供的一種網(wǎng)頁摘要生成裝置的結構示意圖。
【具體實施方式】
[0050]下面結合附圖和實施例對本發(fā)明作進一步的詳細說明??梢岳斫獾氖牵颂幩枋龅木唧w實施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關的部分而非全部結構。
[0051]實施例一
[0052]圖1B是本發(fā)明實施例一提供的一種網(wǎng)頁摘要生成方法的流程示意圖,本實施例可適用于生成問題類型的歷史查詢語句對應的歷史搜索結果中的網(wǎng)頁的摘要的情況。該方法可以由網(wǎng)頁摘要生成裝置來執(zhí)行,所述裝置由軟件實現(xiàn),并可集成于搜索引擎中,或作為搜索引擎的子程序。參見圖1B,本實施例提供的網(wǎng)頁摘要生成方法具體包括如下操作:
[0053]操作110、獲取問題類型的歷史查詢語句對應的歷史搜索結果中的網(wǎng)頁;
[0054]操作120、確定網(wǎng)頁中包含的至少一組答案類數(shù)據(jù);
[0055]操作130、基于所確定的答案類數(shù)據(jù),生成網(wǎng)頁的摘要。
[0056]在現(xiàn)有技術中,生成網(wǎng)頁摘要的方法通常是在線實時生成的,也即在接收到包含有查詢語句的搜索請求后,會基于該查詢語句進行網(wǎng)頁搜索工作,以得到與查詢語句關聯(lián)的多個網(wǎng)頁,進而針對所得到的各個網(wǎng)頁,將該查詢語句與得到的網(wǎng)頁的文本數(shù)據(jù)進行相似度匹配,取出文本數(shù)據(jù)中和該查詢語句相似度高的內(nèi)容,作為網(wǎng)頁的摘要。顯然,通過該方式所生成的網(wǎng)頁摘要,僅僅是一些與查詢語句相似的文本內(nèi)容,這尤其對于查詢語句為問題類型的查詢語句而言,所得到的網(wǎng)頁摘要里面經(jīng)常會出現(xiàn)沒有太多含義的詞匯,并不能達到向用戶提示重要信息的作用。
[0057]針對上述現(xiàn)有技術存在的弊端,本實施例提供一種線下生成網(wǎng)頁摘要的解決方案,基于從網(wǎng)頁中提取出的答案類數(shù)據(jù),而非與實時接收的查詢語句相似的內(nèi)容,來得到網(wǎng)頁摘要,這樣可以保證所得到的網(wǎng)頁摘要可以包含有有意義的重要信息,對用戶輸入的查詢語句起到很好的提示作用,提升用戶的搜索體驗。
[0058]在本實施例中,每進行完一次網(wǎng)頁搜索工作后,可將網(wǎng)頁搜索所對應的查詢語句,與基于該查詢語句進行搜索得到的多個網(wǎng)頁(也即搜索結果),建立關聯(lián)關系,存儲至搜索統(tǒng)計日志中。執(zhí)行完畢多次網(wǎng)頁搜索工作之后,搜索統(tǒng)計日志中會記錄有多組關聯(lián)關系,每組關聯(lián)關系中的查詢語句可視為歷史查詢語句,基于該歷史查詢語句進行搜索得到的搜索結果可視為歷史搜索結果。
[0059]在觸發(fā)了對網(wǎng)頁生成摘要方法的執(zhí)行操作后,可遍歷搜索統(tǒng)計日志中的各組關聯(lián)關系,查找其中所包含的所有問題類型的歷史查詢語句,進而分別針對查找到的各條歷史查詢語句,執(zhí)行如下操作:
[0060]獲取與當前歷史查詢語句對應的歷史搜索結果中的各個網(wǎng)頁;
[0061]確定各個網(wǎng)頁中包含的至少一組答案類數(shù)據(jù);
[0062]分別針對各個網(wǎng)頁,基于所確定的當前網(wǎng)頁中包含的至少一組答案類數(shù)據(jù),生成當前網(wǎng)頁的摘要。
[0063]具體的,對問題類型的歷史查詢語句的查找過程,可以是:基于已有的