專利名稱:一種基于界面返回的搜索方法和裝置的制作方法
一種基于界面返回的搜索方法和裝置
技術(shù)領(lǐng)域:
本發(fā)明涉及搜索引擎技術(shù),尤其涉及一種基于界面返回的搜索方法和裝置。
背景技術(shù):
搜索引擎已經(jīng)成為當(dāng)今互聯(lián)網(wǎng)領(lǐng)域中不可缺少的核心技術(shù),如今,大量的用戶都習(xí)慣于利用搜索引擎來查詢所需求的信息或訪問相關(guān)的頁面。搜索引擎的技術(shù)從誕生至今已經(jīng)過了許多改進(jìn)和發(fā)展,其中,如何準(zhǔn)確便捷的滿足用戶需求、改善用戶體驗一直是各個搜索引擎網(wǎng)站探索的重點。目前網(wǎng)頁搜索引擎提供的服務(wù)通常是,先由用戶輸入查詢詞后確認(rèn)搜索,之后根據(jù)該查詢詞的搜索結(jié)果,向用戶返回相關(guān)頁面的鏈接以及摘要等,用戶根據(jù)需求點擊某一鏈接來訪問對應(yīng)的網(wǎng)頁。分析用戶的上網(wǎng)行為后可以發(fā)現(xiàn),許多用戶會通過某一查詢詞搜索到相關(guān)網(wǎng)頁后,訪問該網(wǎng)頁來使用該網(wǎng)頁的一些固定功能,或者通過某一查詢詞來搜索相關(guān)新聞,例如,用戶會搜索快遞公司的主頁,來查詢快遞單的情況。如果直接在用戶輸入查詢詞時向用戶返回相關(guān)網(wǎng)頁的界面,并能讓用戶在該界面執(zhí)行相應(yīng)操作,或者,在用戶輸入查詢詞時向用戶返回相關(guān)信息的瀏覽界面,便可以更加迅速地響應(yīng)用戶的需求,能夠節(jié)約用戶的時間。
發(fā)明內(nèi)容本發(fā)明提供了一種基于界面返回的搜索方法和裝置,能夠在用戶搜索某一查詢詞時,直接返回相關(guān)網(wǎng)頁的界面。具體技術(shù)方案如下:
一種基于界面返回的搜索方法,從預(yù)先獲取的網(wǎng)頁信息中提取網(wǎng)頁片段以及對應(yīng)的描述并存入網(wǎng)頁片段庫;該方法包括:接收到用戶在檢索頁面輸入的查詢詞時,在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段,并在所述檢索頁面返回檢索到的網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,從預(yù)先獲取的網(wǎng)頁信息中提取的網(wǎng)頁片段包括:導(dǎo)航網(wǎng)頁片段、瀏覽性網(wǎng)頁片段或功能性網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,所述導(dǎo)航網(wǎng)頁片段的提取包括:提取同一站點下不同頁面中編碼結(jié)構(gòu)以及內(nèi)容相同的部分作為導(dǎo)航網(wǎng)頁片段;所述功能性網(wǎng)頁片段的提取包括:根據(jù)網(wǎng)頁源代碼中的交互標(biāo)簽,提取網(wǎng)頁中對應(yīng)的交互片段作為功能性網(wǎng)頁片段;所述瀏覽性網(wǎng)頁片段的提取包括:根據(jù)網(wǎng)頁的DOM樹的結(jié)構(gòu)以及內(nèi)容,提取網(wǎng)頁中對應(yīng)的瀏覽性網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,當(dāng)所述導(dǎo)航網(wǎng)頁片段中有指向某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項時,在所述網(wǎng)頁片段庫中保存該選項的URL與所述某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的對應(yīng)關(guān)系;
當(dāng)用戶在導(dǎo)航網(wǎng)頁片段中選擇所述指向某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項時,在所述網(wǎng)頁片段庫中檢索并返回與該選項的URL對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,當(dāng)所述功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中有返回某導(dǎo)航網(wǎng)頁片段的選項時,在所述網(wǎng)頁片段庫中保存該選項的URL與所述某導(dǎo)航網(wǎng)頁片段的對應(yīng)關(guān)系;當(dāng)用戶在功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中選擇返回某導(dǎo)航網(wǎng)頁片段的選項時,在所述網(wǎng)頁片段庫中檢索并返回與該選項的URL對應(yīng)的導(dǎo)航網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,在將提取的網(wǎng)頁片段以及對應(yīng)的描述存入網(wǎng)頁片段庫之后,還包括:根據(jù)所述網(wǎng)頁片段庫中所保存的網(wǎng)頁片段的描述之間的相似度,對所保存的網(wǎng)頁片段進(jìn)行去重處理。根據(jù)本發(fā)明一優(yōu)選實施例,在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段具體包括:從所述網(wǎng)頁片段庫中檢索出一個或多個權(quán)重值高于預(yù)設(shè)閾值的網(wǎng)頁片段,其中,描述與所述用戶輸入的查詢詞匹配程度越高的網(wǎng)頁片段的權(quán)重值越高。根據(jù)本發(fā)明一優(yōu)選實施例,所述網(wǎng)頁片段的權(quán)重值還結(jié)合網(wǎng)頁片段所屬網(wǎng)頁的實時熱度和歷史熱度來獲取。根據(jù)本發(fā)明一優(yōu)選實施例,在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段時,采用與所述用戶輸入的查詢詞的長度所對應(yīng)的檢索策略在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,在所述檢索頁面返回檢索到的網(wǎng)頁片段的同時,還返回所述用戶輸入的查詢詞在搜索引擎中的搜索結(jié)果。一種基于界面返回的搜索裝置,該裝置包括:建庫單元,用于從預(yù)先獲取的網(wǎng)頁信息中提取網(wǎng)頁片段以及對應(yīng)的描述并存入網(wǎng)頁片段庫;檢索單元,用于接收到用戶在檢索頁面輸入的查詢詞時,在所述網(wǎng)頁片段庫中檢索與用戶輸入的查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段,并在所述檢索頁面返回檢索到的網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,所述建庫單元從預(yù)先獲取的網(wǎng)頁信息中提取的網(wǎng)頁片段包括:導(dǎo)航網(wǎng)頁片段、瀏覽性網(wǎng)頁片段或功能性網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,所述建庫單元在提取導(dǎo)航網(wǎng)頁片段時,具體執(zhí)行:提取同一站點下不同頁面中編碼結(jié)構(gòu)以及內(nèi)容相同的部分作為導(dǎo)航網(wǎng)頁片段;所述建庫單元在提取功能性網(wǎng)頁片段時,具體執(zhí)行:根據(jù)網(wǎng)頁源代碼中的交互標(biāo)簽,提取網(wǎng)頁中對應(yīng)的交互片段作為功能性網(wǎng)頁片段;所述建庫單元在提取瀏覽性網(wǎng)頁片段時,具體執(zhí)行:根據(jù)網(wǎng)頁的DOM樹的結(jié)構(gòu)以及內(nèi)容,提取網(wǎng)頁中對應(yīng)的瀏覽性網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,當(dāng)所述導(dǎo)航網(wǎng)頁片段中有指向某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項時,所述建庫單元在所述網(wǎng)頁片段庫中保存該選項的URL與所述某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的對應(yīng)關(guān)系;當(dāng)用戶在導(dǎo)航網(wǎng)頁片段中選擇所述指向某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項時,所述檢索單元在所述網(wǎng)頁片段庫中檢索并返回與該選項的URL對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,當(dāng)所述功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中有返回某導(dǎo)航網(wǎng)頁片段的選項時,所述建庫單元在所述網(wǎng)頁片段庫中保存該選項的URL與所述某導(dǎo)航網(wǎng)頁片段的對應(yīng)關(guān)系;當(dāng)用戶在功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中選擇返回某導(dǎo)航網(wǎng)頁片段的選項時,所述檢索單元在所述網(wǎng)頁片段庫中檢索并返回與該選項的URL對應(yīng)的導(dǎo)航網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,所述建庫單元在將提取的網(wǎng)頁片段以及對應(yīng)的描述存入網(wǎng)頁片段庫之后,還執(zhí)行:根據(jù)所述網(wǎng)頁片段庫中所保存的網(wǎng)頁片段的描述之間的相似度,對所保存的網(wǎng)頁片段進(jìn)行去重處理。根據(jù)本發(fā)明一優(yōu)選實施例,所述檢索單元在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段具體執(zhí)行:從所述網(wǎng)頁片段庫中檢索出一個或多個權(quán)重值高于預(yù)設(shè)閾值的網(wǎng)頁片段,其中,描述與所述用戶輸入的查詢詞匹配程度越高的網(wǎng)頁片段的權(quán)重值越高。根據(jù)本發(fā)明一優(yōu)選實施例,所述網(wǎng)頁片段的權(quán)重值還結(jié)合網(wǎng)頁片段所屬網(wǎng)頁的實時熱度和歷史熱度來獲取。 根據(jù)本發(fā)明一優(yōu)選實施例,所述檢索單元在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段時,采用與所述用戶輸入的查詢詞的長度所對應(yīng)的檢索策略在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的所對應(yīng)的網(wǎng)頁片段。根據(jù)本發(fā)明一優(yōu)選實施例,所述檢索單元在所述檢索頁面返回檢索到的網(wǎng)頁片段的同時,還返回所述用戶輸入的查詢詞在搜索引擎中的搜索結(jié)果。由以上技術(shù)方案可以看出,本發(fā)明通過建立網(wǎng)頁片段庫來保存所抓取到的各個網(wǎng)頁的片段以及對應(yīng)描述,能夠在用戶輸入查詢詞時獲取匹配的網(wǎng)頁片段并以界面形式返回。本發(fā)明使得用戶在輸入查詢詞時,能夠?qū)崟r獲取到相應(yīng)的網(wǎng)頁片段界面,并能直接在網(wǎng)頁片段界面中執(zhí)行相應(yīng)操作或者瀏覽相關(guān)信息,可見,本發(fā)明能夠更加迅速地響應(yīng)用戶的需求,節(jié)約用戶的時間。
圖1為本發(fā)明實施例一所提供的基于界面返回的搜索方法流程圖;圖2為本發(fā)明實施例一所提供的建立網(wǎng)頁片段庫的方法流程圖;圖3為本發(fā)明實施例一所提供的導(dǎo)航網(wǎng)頁片段示例圖;圖4為本發(fā)明實施例一所提供的功能性網(wǎng)頁片段示例圖;圖5為本發(fā)明實施例二所提供的基于界面返回的搜索裝置示意圖。
具體實施方式為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和具體實施例對本發(fā)明進(jìn)行詳細(xì)描述。本發(fā)明主要包括建庫和檢索兩部分內(nèi)容,建庫即指預(yù)先獲取各個網(wǎng)頁的信息,并提取網(wǎng)頁片段以及對應(yīng)的描述來建立網(wǎng)頁片段庫;檢索即指根據(jù)用戶輸入的查詢詞向用戶返回匹配的網(wǎng)頁片段。下面將通過實施例對本發(fā)明的具體內(nèi)容進(jìn)行詳細(xì)闡述。實施例一圖1為本發(fā)明實施例一所提供的基于界面返回的搜索方法流程圖,如圖1所示,該方法包括:S101、獲取網(wǎng)頁信息,從所獲取的網(wǎng)頁信息中提取網(wǎng)頁片段以及對應(yīng)的描述并存入網(wǎng)頁片段庫中。為了能夠在用戶搜索關(guān)鍵詞時直接以界面形式向用戶返回對應(yīng)的網(wǎng)頁片段,需要先建立一個保存有各個網(wǎng)頁片段的網(wǎng)頁片段庫。網(wǎng)頁片段庫可以包括:各個網(wǎng)頁導(dǎo)航或者菜單信息的網(wǎng)頁片段,以及各個網(wǎng)頁的功能性網(wǎng)頁片段和瀏覽性網(wǎng)頁片段,其中,某一網(wǎng)頁的導(dǎo)航(或者菜單信息)的網(wǎng)頁片段中的導(dǎo)航或者菜單選項可以對應(yīng)該網(wǎng)頁相應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段。在獲取各個網(wǎng)頁片段的同時,可以提取出網(wǎng)頁片段的描述,以便于后續(xù)步驟能根據(jù)用戶輸入的查詢詞與網(wǎng)頁片段的描述的匹配度獲取符合用戶需求的網(wǎng)頁片段。如圖2所示,建立網(wǎng)頁片段庫具體可以通過下述步驟來實現(xiàn):S1011、預(yù)先獲取各個網(wǎng)頁信息,根據(jù)預(yù)先設(shè)定的規(guī)則提取網(wǎng)頁的導(dǎo)航網(wǎng)頁片段,并提取對應(yīng)的描述,存入網(wǎng)頁片段庫中。網(wǎng)頁信息可以利用網(wǎng)絡(luò)爬蟲來獲取,之后,對所獲取的網(wǎng)頁的源代碼進(jìn)行預(yù)處理,通過編碼轉(zhuǎn)換,將所獲取的源代碼統(tǒng)一為UTF-8編碼,過濾其中的邊框廣告等無關(guān)內(nèi)容。之后,比較同一個站點下的不同頁面的編碼結(jié)構(gòu)和內(nèi)容以及樹結(jié)構(gòu),認(rèn)為其中不同頁面下的編碼結(jié)構(gòu)以及內(nèi)容相同的部分為該站點的導(dǎo)航(或者菜單信息),提取該部分的網(wǎng)頁代碼作為導(dǎo)航網(wǎng)頁片段代碼,并分析該站點的站點名、標(biāo)題等信息,從中提取關(guān)鍵詞作為與所提取的該站點的導(dǎo)航或者菜單信息網(wǎng)頁片段對應(yīng)的描述,將所提取的導(dǎo)航網(wǎng)頁片段代碼與描述形成對應(yīng)關(guān)系后存入網(wǎng)頁片段庫。S1012、根據(jù)預(yù)先設(shè)定的規(guī)則,提取網(wǎng)頁的瀏覽性網(wǎng)頁片段和功能性網(wǎng)頁片段以及對應(yīng)的描述,存入網(wǎng)頁片段庫中。針對提取了導(dǎo)航網(wǎng)頁片段后的網(wǎng)頁的剩余片段或者沒有導(dǎo)航網(wǎng)頁片段的網(wǎng)頁,根據(jù)網(wǎng)頁代碼中的標(biāo)簽來判斷該網(wǎng)頁中的片段屬于瀏覽性還是功能性。瀏覽性網(wǎng)頁片段即指向用戶提供特定信息瀏覽服務(wù)(如新聞)的網(wǎng)頁片段,功能性網(wǎng)頁片段即指向用戶提供特定功能服務(wù)(如查詢快遞訂單)的網(wǎng)頁片段。通常,向用戶提供特定的功能服務(wù)都需要與網(wǎng)站后臺進(jìn)行交互,S卩,功能性網(wǎng)頁片段通常需要與網(wǎng)站后臺進(jìn)行交互, 因此,可以根據(jù)網(wǎng)頁的源代碼中是否存在涉及到與后臺進(jìn)行交互的標(biāo)簽來判斷網(wǎng)頁片段屬于瀏覽性還是功能性,若網(wǎng)頁的源代碼中存在涉及到與后臺進(jìn)行交互的標(biāo)簽,則該網(wǎng)頁的片段為功能性網(wǎng)頁片段,若網(wǎng)頁的源代碼中不存在涉及到與后臺進(jìn)行交互的標(biāo)簽,則該網(wǎng)頁的片段為瀏覽性網(wǎng)頁片段。涉及到與后臺進(jìn)行交互的標(biāo)簽可以依據(jù)在代碼語法規(guī)則中各個標(biāo)簽的作用來確定,例如,form標(biāo)簽即為HTML語言中常用的與后臺進(jìn)行交互的標(biāo)簽,此外,input、checkbox、ext、radio、password、button等也均為涉及到與后臺進(jìn)行交互的標(biāo)簽。針對功能性網(wǎng)頁片段,根據(jù)網(wǎng)頁源代碼中的from標(biāo)簽等涉及到提交的標(biāo)簽,提取網(wǎng)頁中對應(yīng)的交互片段的代碼作為功能性網(wǎng)頁片段代碼,并提取相關(guān)的文字信息或者關(guān)鍵詞作為該交互片段對應(yīng)的描述,將所提取的功能性網(wǎng)頁片段代碼與描述形成對應(yīng)關(guān)系后存入網(wǎng)頁片段庫。針對瀏覽性網(wǎng)頁片段,根據(jù)網(wǎng)頁的DOM樹的結(jié)構(gòu)以及內(nèi)容,提取網(wǎng)頁中對應(yīng)的瀏覽信息片段代碼,并提取相關(guān)的文字信息或者關(guān)鍵詞作為該瀏覽信息片段對應(yīng)的描述,將所提取的瀏覽性網(wǎng)頁片段代碼與描述形成對應(yīng)關(guān)系后存入網(wǎng)頁片段庫。其中,所提取的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段對應(yīng)的描述可以來自下述內(nèi)容:所提取的網(wǎng)頁代碼中的title標(biāo)簽對應(yīng)的內(nèi)容;或者,所提取的網(wǎng)頁代碼中的meta元素的內(nèi)容;或者,分析DOM樹后得到的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段對應(yīng)的父節(jié)點的內(nèi)容;或者,功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段對應(yīng)的面包屑路徑的內(nèi)容(面包屑路徑為網(wǎng)頁層級屬性鏈接組成的線性鏈接標(biāo)示)。更進(jìn)一步地,當(dāng)所提取的導(dǎo)航網(wǎng)頁片段中的導(dǎo)航或者菜單選項指向某一對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段時,獲取導(dǎo)航網(wǎng)頁片段中的指向該功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項的URL,并將該URL與該功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段形成對應(yīng)關(guān)系后保存至網(wǎng)頁片段庫。通過在網(wǎng)頁片段庫中保存功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段與導(dǎo)航或者菜單選項URL的對應(yīng)關(guān)系,能夠使得用戶在返回的導(dǎo)航網(wǎng)頁片段中選擇某一選項時,能夠根據(jù)URL在網(wǎng)頁片段庫中檢索對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段并返回給用戶。更進(jìn)一步地,當(dāng)所提取的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中存在返回導(dǎo)航界面(或返回主頁)的選項時,獲取功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中返回導(dǎo)航界面選項的URL,并在網(wǎng)頁片段庫中保存該URL與相應(yīng)的導(dǎo)航網(wǎng)頁片段的對應(yīng)關(guān)系。通過上述步驟S1011-S1012能夠建立保存有導(dǎo)航網(wǎng)頁片段、瀏覽性網(wǎng)頁片段和功能性網(wǎng)頁片段以及對應(yīng)的描述的網(wǎng)頁片段庫,網(wǎng)頁片段庫中還可以進(jìn)一步包括瀏覽性網(wǎng)頁片段或功能性網(wǎng)頁片段與導(dǎo)航網(wǎng)頁片段中相應(yīng)選項的URL的對應(yīng)關(guān)系,以及導(dǎo)航網(wǎng)頁片段與瀏覽性網(wǎng)頁片段或功能性網(wǎng)頁片段中相應(yīng)選項的URL的對應(yīng)關(guān)系。更進(jìn)一步地,為了能夠更為準(zhǔn)確地向用戶返回網(wǎng)頁片段,上述建立網(wǎng)頁片段庫的方法還可以包括步驟S1013。S1013、根據(jù)網(wǎng)頁片段庫中的網(wǎng)頁片段對應(yīng)的描述的相似度,對已保存的網(wǎng)頁片段進(jìn)行去重處理。比較網(wǎng)頁片段庫中所保存的各個網(wǎng)頁片段對應(yīng)的描述,對其中相似度高于預(yù)先設(shè)定范圍的網(wǎng)頁片段進(jìn)行去重處理,可以根據(jù)實際需要保留其中與描述契合度最高的網(wǎng)頁片段或者保留其中更為熱門的網(wǎng)頁。相似度即的各個網(wǎng)頁片段對應(yīng)的描述中的文字信息的相似度。通過上述步驟SlOl能夠建立網(wǎng)頁片段庫,為了保證向用戶返回結(jié)果的準(zhǔn)確性,可以通過人工對所保存的網(wǎng)頁片段進(jìn)行進(jìn)一步審核,同時,也可以通過人工將系統(tǒng)未能準(zhǔn)確抓取的熱門網(wǎng)頁片段添加到網(wǎng)頁片段庫中。S102、在網(wǎng)頁片段庫中檢索與用戶輸入的查詢詞匹配的網(wǎng)頁片段的描述,并返回對應(yīng)的網(wǎng)頁片段。根據(jù)用戶輸入的查詢詞在所建立的網(wǎng)頁片段庫中保存的記錄里檢索與之匹配的網(wǎng)頁片段的描述,并返回對應(yīng)的網(wǎng)頁片段,可以為每個網(wǎng)頁片段設(shè)定權(quán)重,若某個網(wǎng)頁片段的描述與查詢詞的匹配程度越高,那么該網(wǎng)頁片段的權(quán)重值也越高,最后以界面形式向用戶返回一個或多個權(quán)重值高于預(yù)設(shè)閾值的網(wǎng)頁片段。更進(jìn)一步地,由于用戶輸入的查詢詞與網(wǎng)頁片段的描述匹配的準(zhǔn)確度通常與查詢詞的長度有關(guān),即,查詢詞的長度越長,就越能準(zhǔn)確分析用戶的查詢需求,同時與網(wǎng)頁片段描述的匹配也越精確,因此,可以根據(jù)用戶輸入查詢詞的長度來設(shè)定不同的返回策略??梢砸韵率銮闆r為例設(shè)定返回策略:1、當(dāng)用戶輸入的查詢詞長度小于預(yù)設(shè)的第一長度閾值時。當(dāng)用戶輸入的查詢詞長度較短(小于預(yù)設(shè)的第一長度閾值時)時,無法準(zhǔn)確分析用戶需求,因此可以以界面形式向用戶返回與查詢詞匹配的導(dǎo)航網(wǎng)頁片段,由用戶從導(dǎo)航網(wǎng)頁片段中選擇其需要的功能或者瀏覽選項,具體可以是:若存在與用戶輸入的查詢詞一個或多個權(quán)重值大于預(yù)設(shè)的第一權(quán)重閾值的導(dǎo)航網(wǎng)頁片段,則以界面形式向用戶返回該一個或多個導(dǎo)航網(wǎng)頁片段。2、當(dāng)用戶輸入的查詢詞長度大于預(yù)設(shè)的第一長度閾值且小于預(yù)設(shè)的第二長度閾值時。當(dāng)用戶輸入的查詢詞長度大于預(yù)設(shè)的第一長度閾值且小于預(yù)設(shè)的第二長度閾值時,可以初步分析用戶的需求屬于瀏覽性還是功能性,具體可以根據(jù)用戶輸入的查詢詞來判定,若存在與用戶輸入的查詢詞匹配的一個或多個權(quán)重值大于預(yù)設(shè)的第二權(quán)重閾值的瀏覽性網(wǎng)頁片段,則抽取該一個或多個瀏覽性網(wǎng)頁片段的前N個字段以界面形式返回給用戶,其中N為預(yù)設(shè)的正整數(shù);若存在與用戶輸入的查詢詞匹配的一個或多個權(quán)重值大于預(yù)設(shè)的第二權(quán)重閾值的功能性網(wǎng)頁片段,則抽取該一個或多個功能性網(wǎng)頁片段的交互片段并以界面形式返回給用戶。3、當(dāng)用戶輸入的查詢詞長度大于預(yù)設(shè)的第三長度閾值時。當(dāng)用戶輸入的查詢詞較長(大于預(yù)設(shè)的第三長度閾值時)時,可以準(zhǔn)確分析用戶的查詢需求,若存在與用戶輸入的查詢詞匹配的一個或多個權(quán)重值大于預(yù)設(shè)的第三權(quán)重閾值的瀏覽性網(wǎng)頁片段時,則以界面形式向用戶返回該一個或多個瀏覽性網(wǎng)頁片段;若存在與用戶輸入的查詢詞匹配的一個或多個權(quán)重值大于預(yù)設(shè)的第三權(quán)重閾值的功能性網(wǎng)頁片段時,則以界面形式向用戶返回該一個或多個功能性網(wǎng)頁片段。上述為結(jié)合用戶輸入的查詢詞的長度向用戶返回匹配的網(wǎng)頁片段的策略示例,在實際應(yīng)用中可以根據(jù)需要指定不同的策略,本發(fā)明對此不做限制。需要說明的是,由于網(wǎng)頁片段庫保存的網(wǎng)頁片段均為代碼的形式,在向用戶返回時,需要對網(wǎng)頁片段進(jìn)行重新渲染才能將其以界面形式展現(xiàn),渲染可以通過按照W3C規(guī)則對網(wǎng)頁片段進(jìn)行重寫來實現(xiàn),可以在向用戶返回結(jié)果的過程中實時渲染,也可以對返回頻次較高的網(wǎng)頁片段結(jié)果進(jìn)行渲染后緩存,需要時直接返回緩存的結(jié)果。更進(jìn)一步地,在根據(jù)用戶輸入的查詢詞向用戶以界面形式返回網(wǎng)頁片段的同時,還可以以界面形式向用戶返回該查詢詞的搜索結(jié)果,即,可以將該檢索詞通過搜索引擎搜索后得到的前N個結(jié)果以界面形式返回給用戶,其中N為預(yù)設(shè)的正整數(shù)??梢詫⑶癗個搜索結(jié)果的超鏈接、摘要以及URL按照W3C規(guī)則包裝為HTML片段后以界面形式返回給用戶,之后用戶可以直接點擊其中的超鏈接來訪問對應(yīng)的網(wǎng)頁。更進(jìn)一步地,在獲取與用戶輸入的查詢詞匹配的網(wǎng)頁片段的過程中,可以結(jié)合網(wǎng)頁片段所在網(wǎng)頁在搜索引擎中的實時熱度和歷史熱度來生成網(wǎng)頁片段的權(quán)值Weight,例如,可以利用Weight=aX Sim+b X History (page) +c X Now (page)來得到網(wǎng)頁片段的權(quán)值,其中,Sim為網(wǎng)頁片段的描述與用戶輸入查詢詞的相似度,History(Page)為網(wǎng)頁片段所在網(wǎng)頁的歷史熱度,Now(page)為網(wǎng)頁片段所在網(wǎng)頁的實時熱度,a、b、c為預(yù)設(shè)的系數(shù)。同時,還可以進(jìn)一步在用戶輸入查詢詞時,返回相關(guān)的聯(lián)想詞,這部分為現(xiàn)有技術(shù),在此不過多贅述。本發(fā)明可以當(dāng)用戶在搜索框內(nèi)輸入查詢詞時,實時向用戶以界面形式返回網(wǎng)頁片段,當(dāng)用戶開始輸入查詢詞時,可以在網(wǎng)頁片段庫中檢索匹配的導(dǎo)航網(wǎng)頁片段并以界面形式在搜索框下返回給用戶,之后用戶可以選擇導(dǎo)航網(wǎng)頁中的導(dǎo)航或者菜單選項,根據(jù)用戶的選擇,在網(wǎng)頁片段庫中檢索對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段并以界面形式在搜索框下返回給用戶,同時,可以將用戶在搜索框中輸入的查詢詞自動變換成與所返回的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的描述所對應(yīng)的查詢詞。例如,如圖3所示示例,用戶在搜索框中輸入“匯通”,則可以以界面形式在搜索框下向用戶返回“匯通快運”主頁的導(dǎo)航網(wǎng)頁片段,之后若用戶選擇了導(dǎo)航選項中的“網(wǎng)點分布”這一選項,則可以以界面形式在搜索框下向用戶返回匯通快運的“網(wǎng)點分布”功能性網(wǎng)頁片段,同時,搜索框中的查詢詞也自動由“匯通”變換為“匯通網(wǎng)點分布”。用戶也可以從“網(wǎng)點分布”的網(wǎng)頁片段中選擇返回主頁,此時將重新向用戶返回匯通快運主頁的導(dǎo)航網(wǎng)頁片段,同時,搜索框中的查詢詞也自動由匯通“匯通網(wǎng)點分布”變換為“匯通”。用戶也可以進(jìn)一步豐富查詢詞的內(nèi)容來獲得較為精確的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段。例如,如圖4所示示例,用戶可以直接輸入“匯通查詢”,則可以直接以界面形式在搜索框下向用戶返回匯通快運的“查快遞單“的功能性網(wǎng)頁片段。用戶可以通過修改查詢詞來切換所返回的網(wǎng)頁片段,例如,用戶輸入“匯通”時,向用戶返回的是“匯通快運”主頁的導(dǎo)航網(wǎng)頁片段,用戶可以進(jìn)一步輸入“匯通查詢”,此時,向用戶返回的是匯通快運的“查快遞單”功能性網(wǎng)頁片段,若用戶刪除所輸入查詢詞“匯通查詢”中的“查詢”,則將重新向用戶返回“匯通快運”主頁的導(dǎo)航網(wǎng)頁片段。實施例二圖5為本發(fā)明實施例二所提供的基于界面返回的搜索裝置示意圖,如圖5所示,該裝置包括:建庫單元10和檢索單元20。建庫單元10,用于從預(yù)先獲取的網(wǎng)頁信息中提取網(wǎng)頁片段以及對應(yīng)的描述并存入網(wǎng)頁片段庫。為了能夠在用戶搜索關(guān)鍵詞時直接以界面形式向用戶返回對應(yīng)的網(wǎng)頁片段,需要建庫單元10先建立一個保存有各個網(wǎng)頁片段的網(wǎng)頁片段庫。網(wǎng)頁片段庫可以包括:各個網(wǎng)頁導(dǎo)航或者菜單信息的網(wǎng)頁片段,以及各個網(wǎng)頁的功能性網(wǎng)頁片段和瀏覽性網(wǎng)頁片段,其中,某一網(wǎng)頁的導(dǎo)航(或者菜單信息)的網(wǎng)頁片段中的導(dǎo)航或者菜單選項可以對應(yīng)該網(wǎng)頁相應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段。在獲取各個網(wǎng)頁片段的同時,建庫單元10可以提取出網(wǎng)頁片段的描述,以便于后續(xù)步驟能根據(jù)用戶輸入的查詢詞與網(wǎng)頁片段的描述的匹配度獲取符合用戶需求的網(wǎng)頁片段。建庫單元10具體可以執(zhí)行下述操作來建立網(wǎng)頁片段庫:S2011、預(yù)先獲取各個網(wǎng)頁信息,根據(jù)預(yù)先設(shè)定的規(guī)則提取網(wǎng)頁的導(dǎo)航網(wǎng)頁片段,并提取對應(yīng)的描述,存入網(wǎng)頁片段庫中。網(wǎng)頁信息可以利用網(wǎng)絡(luò)爬蟲來獲取,之后,對所獲取的網(wǎng)頁的源代碼進(jìn)行預(yù)處理,通過編碼轉(zhuǎn)換,將所獲取的源代碼統(tǒng)一為UTF-8編碼,過濾其中的邊框廣告等無關(guān)內(nèi)容。之后,比較同一個站點下的不同頁面的編碼結(jié)構(gòu)和內(nèi)容以及樹結(jié)構(gòu),認(rèn)為其中不同頁面下的編碼結(jié)構(gòu)以及內(nèi)容相同的部分為該站點的導(dǎo)航(或者菜單信息),提取該部分的網(wǎng)頁代碼作為導(dǎo)航網(wǎng)頁片段代碼,并分析該站點的站點名、標(biāo)題等信息,從中提取關(guān)鍵詞作為與所提取的該站點的導(dǎo)航或者菜單信息網(wǎng)頁片段對應(yīng)的描述,將所提取的導(dǎo)航網(wǎng)頁片段代碼與描述形成對應(yīng)關(guān)系后存入網(wǎng)頁片段庫。S2012、根據(jù)預(yù)先設(shè)定的規(guī)則,提取網(wǎng)頁的瀏覽性網(wǎng)頁片段和功能性網(wǎng)頁片段以及對應(yīng)的描述,存入網(wǎng)頁片段庫中。針對提取了導(dǎo)航網(wǎng)頁片段后的網(wǎng)頁的剩余片段或者沒有導(dǎo)航網(wǎng)頁片段的網(wǎng)頁,根據(jù)網(wǎng)頁代碼中的標(biāo)簽來判斷該網(wǎng)頁中的片段屬于瀏覽性還是功能性。瀏覽性網(wǎng)頁片段即指向用戶提供特定信息瀏覽服務(wù)(如新聞)的網(wǎng)頁片段,功能性網(wǎng)頁片段即指向用戶提供特定功能服務(wù)(如查詢快遞訂單)的網(wǎng)頁片段。通常,向用戶提供特定的功能服務(wù)都需要與網(wǎng)站后臺進(jìn)行交互,即,功能性網(wǎng)頁片段通常需要與網(wǎng)站后臺進(jìn)行交互,因此,可以根據(jù)網(wǎng)頁的源代碼中是否存在涉及到與后臺進(jìn)行交互的標(biāo)簽來判斷網(wǎng)頁片段屬于瀏覽性還是功能性,若網(wǎng)頁的源代碼中存在涉及到與后臺進(jìn)行交互的標(biāo)簽,則該網(wǎng)頁的片段為功能性網(wǎng)頁片段,若網(wǎng)頁的源代碼中不存在涉及到與后臺進(jìn)行交互的標(biāo)簽,則該網(wǎng)頁的片段為瀏覽性網(wǎng)頁片段。涉及到與后臺進(jìn)行交互的標(biāo)簽可以依據(jù)在代碼語法規(guī)則中各個標(biāo)簽的作用來確定,例如,form標(biāo)簽即為HTML語言中常用的與后臺進(jìn)行交互的標(biāo)簽,此外,input、checkbox、ext、radio、password、button等也均為涉及到與后臺進(jìn)行交互的標(biāo)簽。針對功能性網(wǎng)頁片段,根據(jù)網(wǎng)頁源代碼中的from標(biāo)簽等涉及到提交的標(biāo)簽,提取網(wǎng)頁中對應(yīng)的交互片段的代碼作為功能性網(wǎng)頁片段代碼,并提取相關(guān)的文字信息或者關(guān)鍵詞作為該交互片段對應(yīng)的描述,將所提取的功能性網(wǎng)頁片段代碼與描述形成對應(yīng)關(guān)系后存入網(wǎng)頁片段庫。針對瀏覽性網(wǎng)頁片段,根據(jù)網(wǎng)頁的DOM樹的結(jié)構(gòu)以及內(nèi)容,提取網(wǎng)頁中對應(yīng)的瀏覽信息片段代碼,并提取相關(guān)的文字信息或者關(guān)鍵詞作為該瀏覽信息片段對應(yīng)的描述,將所提取的瀏覽性網(wǎng)頁片段代碼與描述形成對應(yīng)關(guān)系后存入網(wǎng)頁片段庫。其中,所提取的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段對應(yīng)的描述可以是來自下述內(nèi)容:所提取的網(wǎng)頁代碼中的title標(biāo)簽對應(yīng)的內(nèi)容;或者,所提取的網(wǎng)頁代碼中的meta元素的內(nèi)容;或者,分析DOM樹后得到的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段對應(yīng)的父節(jié)點的內(nèi)容;或者,功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段對應(yīng)的面包屑路徑的內(nèi)容(面包屑路徑為網(wǎng)頁層級屬性鏈接組成的線性鏈接標(biāo)示)。更進(jìn)一步地,當(dāng)所提取的導(dǎo)航網(wǎng)頁片段中的導(dǎo)航或者菜單選項指向某一對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段時,獲取導(dǎo)航網(wǎng)頁片段中的指向該功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項的URL,并將該URL與該功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段形成對應(yīng)關(guān)系后保存至網(wǎng)頁片段庫。通過在網(wǎng)頁片段庫中保存功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段與導(dǎo)航或者菜單選項URL的對應(yīng)關(guān)系,能夠使得用戶在返回的導(dǎo)航網(wǎng)頁片段中選擇某一選項時,能夠根據(jù)URL在網(wǎng)頁片段庫中檢索對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段并返回給用戶。更進(jìn)一步地,當(dāng)所提取的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中存在返回導(dǎo)航界面(或返回主頁)的選項時,獲取功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中返回導(dǎo)航界面選項的URL,并在網(wǎng)頁片段庫中保存該URL與相應(yīng)的導(dǎo)航網(wǎng)頁片段的對應(yīng)關(guān)系。通過執(zhí)行上述操作S2011-S2012,建庫單元10能夠建立保存有導(dǎo)航網(wǎng)頁片段、瀏覽性網(wǎng)頁片段和功能性網(wǎng)頁片段以及對應(yīng)的描述的網(wǎng)頁片段庫,網(wǎng)頁片段庫中還可以進(jìn)一步包括瀏覽性網(wǎng)頁片段或功能性網(wǎng)頁片段與導(dǎo)航網(wǎng)頁片段中相應(yīng)選項的URL的對應(yīng)關(guān)系,以及導(dǎo)航網(wǎng)頁片段與瀏覽性網(wǎng)頁片段或功能性網(wǎng)頁片段中相應(yīng)選項的URL的對應(yīng)關(guān)系。更進(jìn)一步地,為了能夠更為準(zhǔn)確地向用戶返回網(wǎng)頁片段,建庫單元10還可以執(zhí)行操作S2013。S2013、根據(jù)網(wǎng)頁片段庫中的網(wǎng)頁片段對應(yīng)的描述的相似度,對已保存的網(wǎng)頁片段進(jìn)行去重處理。比較網(wǎng)頁片段庫中所保存的各個網(wǎng)頁片段對應(yīng)的描述,對其中相似度高于預(yù)先設(shè)定范圍的網(wǎng)頁片段進(jìn)行去重處理,可以根據(jù)實際需要保留其中與描述契合度最高的網(wǎng)頁片段或者保留其中更為熱門的網(wǎng)頁。相似度即的各個網(wǎng)頁片段對應(yīng)的描述中的文字信息的相似度。通過執(zhí)行上述操作,建庫單元10能夠建立網(wǎng)頁片段庫,為了保證向用戶返回結(jié)果的準(zhǔn)確性,可以通過人工對所保存的網(wǎng)頁片段進(jìn)行進(jìn)一步審核,同時,也可以通過人工將系統(tǒng)未能準(zhǔn)確抓取的熱門網(wǎng)頁片段添加到網(wǎng)頁片段庫中。檢索單元20,用于在所述網(wǎng)頁片段庫中檢索與用戶輸入的查詢詞匹配的描述,并以界面形式返回對應(yīng)的網(wǎng)頁片段。檢索單元20根據(jù)用戶輸入的查詢詞在所建立的網(wǎng)頁片段庫中保存的記錄里檢索與之匹配的網(wǎng)頁片段的描述,并返回對應(yīng)的網(wǎng)頁片段,檢索單元20可以為每個網(wǎng)頁片段設(shè)定權(quán)重,若某個網(wǎng)頁片段的描述與查詢詞的匹配程度越高,那么該網(wǎng)頁片段的權(quán)重值也越高,最后以界面形式向用戶返回一個或多個權(quán)重值高于預(yù)設(shè)閾值的網(wǎng)頁片段。更進(jìn)一步地,由于用戶輸入的查詢詞與網(wǎng)頁片段的描述匹配的準(zhǔn)確度通常與查詢詞的長度有關(guān),即,查詢詞的長度越長,就越能準(zhǔn)確分析用戶的查詢需求,同時與網(wǎng)頁片段描述的匹配也越精確,因此,檢索單元20可以根據(jù)用戶輸入查詢詞的長度來設(shè)定不同的返回策略??梢砸韵率銮闆r為例設(shè)定返回策略:1、當(dāng)用戶輸入的查詢詞長度小于預(yù)設(shè)的第一長度閾值時。當(dāng)用戶輸入的查詢詞長度較短(小于預(yù)設(shè)的第一長度閾值時)時,無法準(zhǔn)確分析用戶需求,因此可以以界面形式向用戶返回與查詢詞匹配的導(dǎo)航網(wǎng)頁片段,由用戶從導(dǎo)航網(wǎng)頁片段中選擇其需要的功能或者瀏覽選項,具體可以是:若存在與用戶輸入的查詢詞一個或多個權(quán)重值大于預(yù)設(shè)的第一權(quán)重閾值的導(dǎo)航網(wǎng)頁片段,則以界面形式向用戶返回該一個或多個導(dǎo)航網(wǎng)頁片段。2、當(dāng)用戶輸入的查詢詞長度大于預(yù)設(shè)的第一長度閾值且小于預(yù)設(shè)的第二長度閾值時。當(dāng)用戶輸入的查詢詞長度大于預(yù)設(shè)的第一長度閾值且小于預(yù)設(shè)的第二長度閾值時,可以初步分析用戶的需求屬于瀏覽性還是功能性,具體可以根據(jù)用戶輸入的查詢詞來判定,若存在與用戶輸入的查詢詞匹配的一個或多個權(quán)重值大于預(yù)設(shè)的第二權(quán)重閾值的瀏覽性網(wǎng)頁片段,則抽取該一個或多個瀏覽性網(wǎng)頁片段的前N個字段以界面形式返回給用戶,其中N為預(yù)設(shè)的正整數(shù);若存在與用戶輸入的查詢詞匹配的一個或多個權(quán)重值大于預(yù)設(shè)的第二權(quán)重閾值的功能性網(wǎng)頁片段,則抽取該一個或多個功能性網(wǎng)頁片段的交互片段并以界面形式返回給用戶。3、當(dāng)用戶輸入的查詢詞長度大于預(yù)設(shè)的第三長度閾值時。當(dāng)用戶輸入的查詢詞較長(大于預(yù)設(shè)的第三長度閾值時)時,可以準(zhǔn)確分析用戶的查詢需求,若存在與用戶輸入的查詢詞匹配的一個或多個權(quán)重值大于預(yù)設(shè)的第三權(quán)重閾值的瀏覽性網(wǎng)頁片段時,則以界面形式向用戶返回該一個或多個瀏覽性網(wǎng)頁片段;若存在與用戶輸入的查詢詞匹配的一個或多個權(quán)重值大于預(yù)設(shè)的第三權(quán)重閾值的功能性網(wǎng)頁片段時,則以界面形式向用戶返回該一個或多個功能性網(wǎng)頁片段。上述為結(jié)合用戶輸入的查詢詞的長度向用戶返回匹配的網(wǎng)頁片段的策略示例,在實際應(yīng)用中可以根據(jù)需要指定不同的策略,本發(fā)明對此不做限制。需要說明的是,由于網(wǎng)頁片段庫保存的網(wǎng)頁片段均為代碼的形式,在向用戶返回時,檢索單元20需要對網(wǎng)頁片段進(jìn)行重新渲染才能將其以界面形式展現(xiàn),渲染可以通過按照W3C規(guī)則對網(wǎng)頁片段進(jìn)行重寫來實現(xiàn),可以在向用戶返回結(jié)果的過程中實時渲染,也可以對返回頻次較高的網(wǎng)頁片段結(jié)果進(jìn)行渲染后緩存,需要時直接返回緩存的結(jié)果。更進(jìn)一步地,在根據(jù)用戶輸入的查詢詞向用戶以界面形式返回網(wǎng)頁片段的同時,檢索單元20還可以以界面形式向用戶返回該查詢詞的搜索結(jié)果,即,可以將該檢索詞通過搜索引擎搜索后得到的前N個結(jié)果以界面形式返回給用戶,其中N為預(yù)設(shè)的正整數(shù)??梢詫⑶癗個搜索結(jié)果的超鏈接、摘要以及URL按照W3C規(guī)則包裝為HTML片段后以界面形式返回給用戶,之后用戶可以直接點擊其中的超鏈接來訪問對應(yīng)的網(wǎng)頁。更進(jìn)一步地,在獲取與用戶輸入的查詢詞匹配的網(wǎng)頁片段的過程中,檢索單元20可以結(jié)合網(wǎng)頁片段所在網(wǎng)頁在搜索引擎中的實時熱度和歷史熱度來生成網(wǎng)頁片段的權(quán)值Weight,例如,可以利用 Weight=aX Sim+b XHistory (page) +c X Now (page)來得到網(wǎng)頁片段的權(quán)值,其中,Sim為網(wǎng)頁片段的描述與用戶輸入查詢詞的相似度,History (page)為網(wǎng)頁片段所在網(wǎng)頁的歷史熱度,Now(page)為網(wǎng)頁片段所在網(wǎng)頁的實時熱度,a、b、c為預(yù)設(shè)的系數(shù)。同時,檢索單元20還可以進(jìn)一步在用戶輸入查詢詞時,返回相關(guān)的聯(lián)想詞,這部分為現(xiàn)有技術(shù),在此不過多贅述。本發(fā)明可以當(dāng)用戶在搜索框內(nèi)輸入查詢詞時,實時向用戶以界面形式返回網(wǎng)頁片段,當(dāng)用戶開始輸入查詢詞時,可以在網(wǎng)頁片段庫中檢索匹配的導(dǎo)航網(wǎng)頁片段并以界面形式在搜索框下返回給用戶,之后用戶可以選擇導(dǎo)航網(wǎng)頁中的導(dǎo)航或者菜單選項,根據(jù)用戶的選擇,在網(wǎng)頁片段庫中檢索對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段并以界面形式在搜索框下返回給用戶,同時,可以將用戶在搜索框中輸入的查詢詞自動變換成與所返回的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的描述所對應(yīng)的查詢詞。例如,用戶在搜索框中輸入“匯通”,則以界面形式在搜索框下向用戶返回“匯通快運”主頁的導(dǎo)航網(wǎng)頁片段,之后若用戶選擇了導(dǎo)航選項中的“網(wǎng)點分布”這一選項,則以界面形式在搜索框下向用戶返回匯通快運的“網(wǎng)點分布”功能性網(wǎng)頁片段,同時,搜索框中的查詢詞也自動由“匯通”變換為“匯通網(wǎng)點分布”,用戶也可以從“網(wǎng)點分布”的網(wǎng)頁片段中選擇返回主頁,此時將重新向用戶返回匯通快運主頁的導(dǎo)航網(wǎng)頁片段,同時,搜索框中的查詢詞也自動由匯通“匯通網(wǎng)點分布”變換為“匯通”。用戶也可以進(jìn)一步豐富查詢詞的內(nèi)容,隨著用戶所輸入的查詢詞的內(nèi)容越來越多,可以向用戶返回較為精確的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段。例如,用戶可以直接輸入“匯通網(wǎng)點分布”,則可以直接以界面形式在搜索框下向用戶返回匯通快運的“網(wǎng)點分布”功能性網(wǎng)頁片段。用戶可以通過修改查詢詞來切換所返回的網(wǎng)頁片段,例如,用戶輸入“匯通”時,向用戶返回的是“匯通快運”主頁的導(dǎo)航網(wǎng)頁片段,用戶可以進(jìn)一步輸入“匯通網(wǎng)點分布”,此時,向用戶返回的是匯通快運的“網(wǎng)點分布”功能性網(wǎng)頁片段,若用戶刪除“匯通網(wǎng)點分布”中的“網(wǎng)點分布”,則將重新向用戶返回“匯通快運”主頁的導(dǎo)航網(wǎng)頁片段。以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
權(quán)利要求
1.一種基于界面返回的搜索方法,其特征在于,從預(yù)先獲取的網(wǎng)頁信息中提取網(wǎng)頁片段以及對應(yīng)的描述并存入網(wǎng)頁片段庫;該方法包括: 接收到用戶在檢索頁面輸入的查詢詞時,在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段,并在所述檢索頁面返回檢索到的網(wǎng)頁片段。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,從預(yù)先獲取的網(wǎng)頁信息中提取的網(wǎng)頁片段包括: 導(dǎo)航網(wǎng)頁片段、瀏覽性網(wǎng)頁片段或功能性網(wǎng)頁片段。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述導(dǎo)航網(wǎng)頁片段的提取包括:提取同一站點下不同頁面中編碼結(jié)構(gòu)以及內(nèi)容相同的部分作為導(dǎo)航網(wǎng)頁片段; 所述功能性網(wǎng)頁片段的提取包括:根據(jù)網(wǎng)頁源代碼中的交互標(biāo)簽,提取網(wǎng)頁中對應(yīng)的交互片段作為功能性網(wǎng)頁片段; 所述瀏覽性網(wǎng)頁片段的提取包括:根據(jù)網(wǎng)頁的DOM樹的結(jié)構(gòu)以及內(nèi)容,提取網(wǎng)頁中對應(yīng)的瀏覽性網(wǎng)頁片段。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,當(dāng)所述導(dǎo)航網(wǎng)頁片段中有指向某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項時,在所述網(wǎng)頁片段庫中保存該選項的URL與所述某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的對應(yīng)關(guān)系; 當(dāng)用戶在導(dǎo)航網(wǎng)頁片段中選擇所述指向某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項時,在所述網(wǎng)頁片段庫中檢索并返回與該選項的URL對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,當(dāng)所述功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中有返回某導(dǎo)航網(wǎng)頁片段的選項時,在所述網(wǎng)頁片段庫中保存該選項的URL與所述某導(dǎo)航網(wǎng)頁片段的對應(yīng)關(guān)系; 當(dāng)用戶在功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中選擇返回某導(dǎo)航網(wǎng)頁片段的選項時,在所述網(wǎng)頁片段庫中檢索并返回與該選項的URL對應(yīng)的導(dǎo)航網(wǎng)頁片段。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,在將提取的網(wǎng)頁片段以及對應(yīng)的描述存入網(wǎng)頁片段庫之后,還包括: 根據(jù)所述網(wǎng)頁片段庫中所保存的網(wǎng)頁片段的描述之間的相似度,對所保存的網(wǎng)頁片段進(jìn)行去重處理。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段具體包括: 從所述網(wǎng)頁片段庫中檢索出一個或多個權(quán)重值高于預(yù)設(shè)閾值的網(wǎng)頁片段,其中,描述與所述用戶輸入的查詢詞匹配程度越高的網(wǎng)頁片段的權(quán)重值越高。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述網(wǎng)頁片段的權(quán)重值還結(jié)合網(wǎng)頁片段所屬網(wǎng)頁的實時熱度和歷史熱度來獲取。
9.根據(jù)權(quán)利要求1、7或8所述的方法,其特征在于,在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段時,采用與所述用戶輸入的查詢詞的長度所對應(yīng)的檢索策略在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述檢索頁面返回檢索到的網(wǎng)頁片段的同時,還返回所述用戶輸入的查詢詞在搜索引擎中的搜索結(jié)果。
11.一種基于界面返回的搜索裝置,其特征在于,該裝置包括: 建庫單元,用于從預(yù)先獲取的網(wǎng)頁信息中提取網(wǎng)頁片段以及對應(yīng)的描述并存入網(wǎng)頁片段庫; 檢索單元,用于接收到用戶在檢索頁面輸入的查詢詞時,在所述網(wǎng)頁片段庫中檢索與用戶輸入的查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段,并在所述檢索頁面返回檢索到的網(wǎng)頁片段。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述建庫單元從預(yù)先獲取的網(wǎng)頁信息中提取的網(wǎng)頁片段包括: 導(dǎo)航網(wǎng)頁片段、瀏覽性網(wǎng)頁片段或功能性網(wǎng)頁片段。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述建庫單元在提取導(dǎo)航網(wǎng)頁片段時,具體執(zhí)行:提取同一站點下不同頁面中編碼結(jié)構(gòu)以及內(nèi)容相同的部分作為導(dǎo)航網(wǎng)頁片段; 所述建庫單元在提取功能性網(wǎng)頁片段時,具體執(zhí)行:根據(jù)網(wǎng)頁源代碼中的交互標(biāo)簽,提取網(wǎng)頁中對應(yīng)的交互片段作為功能性網(wǎng)頁片段; 所述建庫單元在提取瀏覽性網(wǎng)頁片段時,具體執(zhí)行:根據(jù)網(wǎng)頁的DOM樹的結(jié)構(gòu)以及內(nèi)容,提取網(wǎng)頁中對應(yīng)的瀏覽性網(wǎng)頁片段。
14.根據(jù)權(quán)利要求12或13所述的裝置,其特征在于,當(dāng)所述導(dǎo)航網(wǎng)頁片段中有指向某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項時,所述建庫單元在所述網(wǎng)頁片段庫中保存該選項的URL與所述某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的對應(yīng)關(guān)系; 當(dāng)用戶在導(dǎo)航網(wǎng)頁片段中選擇所述指向某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項時,所述檢索單元在所述網(wǎng) 頁片段庫中檢索并返回與該選項的URL對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段。
15.根據(jù)權(quán)利要求12或13所述的裝置,其特征在于,當(dāng)所述功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中有返回某導(dǎo)航網(wǎng)頁片段的選項時,所述建庫單元在所述網(wǎng)頁片段庫中保存該選項的URL與所述某導(dǎo)航網(wǎng)頁片段的對應(yīng)關(guān)系; 當(dāng)用戶在功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中選擇返回某導(dǎo)航網(wǎng)頁片段的選項時,所述檢索單元在所述網(wǎng)頁片段庫中檢索并返回與該選項的URL對應(yīng)的導(dǎo)航網(wǎng)頁片段。
16.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述建庫單元在將提取的網(wǎng)頁片段以及對應(yīng)的描述存入網(wǎng)頁片段庫之后,還執(zhí)行: 根據(jù)所述網(wǎng)頁片段庫中所保存的網(wǎng)頁片段的描述之間的相似度,對所保存的網(wǎng)頁片段進(jìn)行去重處理。
17.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述檢索單元在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段具體執(zhí)行: 從所述網(wǎng)頁片段庫中檢索出一個或多個權(quán)重值高于預(yù)設(shè)閾值的網(wǎng)頁片段,其中,描述與所述用戶輸入的查詢詞匹配程度越高的網(wǎng)頁片段的權(quán)重值越高。
18.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述網(wǎng)頁片段的權(quán)重值還結(jié)合網(wǎng)頁片段所屬網(wǎng)頁的實時熱度和歷史熱度來獲取。
19.根據(jù)權(quán)利要求11、17或18中任一項所述的裝置,其特征在于,所述檢索單元在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段時,采用與所述用戶輸入的查詢詞的長度所對應(yīng)的檢索策略在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的所對應(yīng)的網(wǎng)頁片段。
20.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述檢索單元在所述檢索頁面返回檢索到的網(wǎng)頁片段的同時,還返 回所述用戶輸入的查詢詞在搜索引擎中的搜索結(jié)果。
全文摘要
本發(fā)明提供了一種基于界面返回的搜索方法和裝置,其中方法包括S101.獲取網(wǎng)頁信息,從所獲取的網(wǎng)頁信息中提取網(wǎng)頁片段以及對應(yīng)的描述并存入網(wǎng)頁片段庫中;S102.在網(wǎng)頁片段庫中檢索與用戶輸入的查詢詞匹配的網(wǎng)頁片段的描述,并返回對應(yīng)的網(wǎng)頁片段。本發(fā)明能夠在用戶搜索某一查詢詞時,直接返回相關(guān)網(wǎng)頁的界面,能夠更加迅速地響應(yīng)用戶的需求、節(jié)約用戶的時間。
文檔編號G06F17/30GK103092945SQ20131001032
公開日2013年5月8日 申請日期2013年1月11日 優(yōu)先權(quán)日2013年1月11日
發(fā)明者賈晨輝 申請人:北京百度網(wǎng)訊科技有限公司