亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

失效網(wǎng)址搜索方法和裝置的制作方法

文檔序號(hào):6379083閱讀:302來(lái)源:國(guó)知局
專利名稱:失效網(wǎng)址搜索方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)訪問技術(shù)領(lǐng)域,具體涉及一種失效網(wǎng)址搜索方法,以及一種失效網(wǎng)址搜索裝置。
背景技術(shù)
伴隨互聯(lián)網(wǎng)的普及和網(wǎng)上信息的爆炸式增長(zhǎng),搜索引擎越來(lái)越引起人們的重視, 目前,搜索引擎技術(shù)成為僅次于門戶的互聯(lián)網(wǎng)第二大核心技術(shù)。
在使用搜索引擎進(jìn)行網(wǎng)頁(yè)搜索時(shí),點(diǎn)擊某一搜索結(jié)果可能會(huì)出現(xiàn)無(wú)法訪問的情況,這是因?yàn)榛ヂ?lián)網(wǎng)上的網(wǎng)頁(yè)經(jīng)常發(fā)生變化,當(dāng)被搜索到的網(wǎng)頁(yè)被刪除或死鏈時(shí),直接點(diǎn)擊鏈接無(wú)法查看網(wǎng)頁(yè)的內(nèi)容。
在這種情況下,如果用戶需要繼續(xù)查看該無(wú)法訪問的網(wǎng)頁(yè)的內(nèi)容,用戶不得不重新查找相應(yīng)的網(wǎng)址或搜索相關(guān)的內(nèi)容,搜索效率低下,用戶體驗(yàn)非常差,并且增加了客戶端與服務(wù)器的資源耗費(fèi)。
因此,本領(lǐng)域技術(shù)人員需要解決的技術(shù)問題是提供一種搜索機(jī)制,能夠在用戶點(diǎn)擊搜索結(jié)果失敗時(shí)保證用戶正常瀏覽該網(wǎng)頁(yè)的內(nèi)容。發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種基于失效網(wǎng)址搜索方法和相應(yīng)的搜索裝置。
依據(jù)本發(fā)明的一個(gè)方面,提供了一種失效網(wǎng)址搜索方法,包括
采集多臺(tái)用戶設(shè)備的瀏覽器收藏夾的網(wǎng)址信息,保存所述網(wǎng)址信息至數(shù)據(jù)庫(kù),所述網(wǎng)址信息包括網(wǎng)址的網(wǎng)頁(yè)快照;
瀏覽器接收搜索請(qǐng)求并將所述搜索請(qǐng)求發(fā)送至服務(wù)器;
服務(wù)器在數(shù)據(jù)庫(kù)中抓取與所述搜索請(qǐng)求相關(guān)的網(wǎng)頁(yè)形成搜索結(jié)果返回給瀏覽器;
瀏覽器展示所述搜索結(jié)果;
判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址是否為失效網(wǎng)址;
若所述搜索結(jié)果的網(wǎng)址為失效網(wǎng)址,服務(wù)器在數(shù)據(jù)庫(kù)中查找匹配的網(wǎng)頁(yè)快照,并返回至瀏覽器。
可選地,所述網(wǎng)頁(yè)快照為服務(wù)器獲取所述網(wǎng)頁(yè)的代碼保存生成,或?yàn)椋谒龇?wù)器獲取該網(wǎng)頁(yè)的代碼保存不成功時(shí),通知瀏覽器將對(duì)應(yīng)的網(wǎng)頁(yè)的代碼上傳生成。
可選地,所述判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址是否為失效網(wǎng)址的步驟包括
瀏覽器將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器;
服務(wù)器對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析生成響應(yīng)消息返回瀏覽器;
瀏覽器解析所述響應(yīng)消息,提取對(duì)應(yīng)網(wǎng)址的HTTP狀態(tài)碼;
瀏覽器依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
可選地,所述判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址是否為失效網(wǎng)址的步驟包括
瀏覽器將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器;
服務(wù)器對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析,提取對(duì)應(yīng)網(wǎng)址中的HTTP狀態(tài)碼;
服務(wù)器依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
根據(jù)本發(fā)明的另一方面,提供了一種失效網(wǎng)址搜索裝置,包括
網(wǎng)址信息采集模塊,適于采集多臺(tái)用戶設(shè)備的瀏覽器收藏夾的網(wǎng)址信息,保存所述網(wǎng)址信息至數(shù)據(jù)庫(kù),所述網(wǎng)址信息包括網(wǎng)址的網(wǎng)頁(yè)快照;
搜索請(qǐng)求接收模塊,適于接收搜索請(qǐng)求,并根據(jù)所述搜索請(qǐng)求返回搜索結(jié)果;
失效網(wǎng)址判斷模塊,適于判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址是否為失效網(wǎng)址;
網(wǎng)頁(yè)快照獲取模塊,適于在所述搜索結(jié)果的網(wǎng)址為失效網(wǎng)址時(shí),服務(wù)器在數(shù)據(jù)庫(kù)中查找匹配的網(wǎng)頁(yè)快照,并返回至瀏覽器;
其中,所述搜索請(qǐng)求接收模塊包括
位于瀏覽器的搜索請(qǐng)求發(fā)送子模塊,適于接收搜索請(qǐng)求并將所述搜索請(qǐng)求發(fā)送至服務(wù)器;
位于服務(wù)器的搜索結(jié)果返回子模塊,適于在數(shù)據(jù)庫(kù)中抓取與所述搜索請(qǐng)求相關(guān)的網(wǎng)頁(yè)形成搜索結(jié)果返回給瀏覽器;
位于瀏覽器的搜索結(jié)果展示子模塊,適于展示所述搜索結(jié)果。
可選地,所述網(wǎng)頁(yè)快照為服務(wù)器獲取所述網(wǎng)頁(yè)的代碼保存生成,或?yàn)?,在所述服?wù)器獲取該網(wǎng)頁(yè)的代碼保存不成功時(shí),通知瀏覽器將對(duì)應(yīng)的網(wǎng)頁(yè)的代碼上傳生成。
可選地,所述失效網(wǎng)址判斷模塊包括
位于瀏覽器的第一網(wǎng)址發(fā)送子模塊,適于將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器;
位于服務(wù)器的響應(yīng)消息返回子模塊,適于對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析生成響應(yīng)消息返回瀏覽器;
位于瀏覽器的HTTP狀態(tài)碼獲取子模塊,適于解析所述響應(yīng)消息,提取對(duì)應(yīng)網(wǎng)址的 HTTP狀態(tài)碼;
位于瀏覽器的網(wǎng)址判定子模塊,適于依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
可選地,所述失效網(wǎng)址判斷模塊包括
位于瀏覽器的第二網(wǎng)址發(fā)送子模塊,適于將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器;
位于服務(wù)器的HTTP狀態(tài)碼獲取子模塊,適于對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析,提取對(duì)應(yīng)網(wǎng)址中的HTTP狀態(tài)碼;
位于服務(wù)器的網(wǎng)址判定子模塊,適于依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
根據(jù)本發(fā)明的一種基于收藏夾的搜索方法可以提供一種基于收藏夾的收藏機(jī)制, 由此解決了針對(duì)搜索請(qǐng)求得到的搜索結(jié)果無(wú)法正常訪問的問題取得了保證用戶正常瀏覽所述無(wú)法正常訪問的搜索結(jié)果的網(wǎng)頁(yè)內(nèi)容,提高搜索效率的有益效果。
上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說(shuō)明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式
。


通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中
圖I示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種失效網(wǎng)址搜索方法實(shí)施例的步驟流程圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種失效網(wǎng)址搜索裝置實(shí)施例的結(jié)構(gòu)框圖。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
本發(fā)明實(shí)施例的核心構(gòu)思之一在于,通過(guò)采集多臺(tái)用戶設(shè)備中瀏覽器收藏夾的網(wǎng)址信息和所述網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)快照,將網(wǎng)址信息和網(wǎng)頁(yè)快照保存至數(shù)據(jù)庫(kù)。當(dāng)針對(duì)搜索請(qǐng)求返回相應(yīng)的搜索結(jié)果時(shí),判斷所述搜索結(jié)果是否為失效網(wǎng)址,若是,服務(wù)器返回網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)快照給瀏覽器。
參照?qǐng)D1,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的失效網(wǎng)址搜索方法實(shí)施例的步驟流程圖,具體可以包括以下步驟
步驟101 :采集多臺(tái)用戶設(shè)備的瀏覽器收藏夾的網(wǎng)址信息,保存所述網(wǎng)址信息至數(shù)據(jù)庫(kù),所述網(wǎng)址信息包括網(wǎng)址的網(wǎng)頁(yè)快照;
網(wǎng)頁(yè)快照,英文名叫Web Cache,網(wǎng)頁(yè)緩存。搜索引擎在收錄網(wǎng)頁(yè)時(shí),對(duì)網(wǎng)頁(yè)進(jìn)行備份,存在自己的服務(wù)器緩存里,當(dāng)用戶在搜索引擎中點(diǎn)擊“網(wǎng)頁(yè)快照”鏈接時(shí),搜索引擎將 Spider(蜘蛛)系統(tǒng)當(dāng)時(shí)所抓取并保存的網(wǎng)頁(yè)內(nèi)容展現(xiàn)出來(lái),稱為“網(wǎng)頁(yè)快照”。在本發(fā)明中,所述網(wǎng)頁(yè)快照可以由服務(wù)器獲取所述網(wǎng)頁(yè)的代碼保存生成,或者,可以在所述服務(wù)器獲取該網(wǎng)頁(yè)的代碼保存不成功時(shí),通知瀏覽器將對(duì)應(yīng)的網(wǎng)頁(yè)的代碼上傳生成。也就是說(shuō),網(wǎng)頁(yè)快照在服務(wù)器側(cè)的展現(xiàn)為一些網(wǎng)頁(yè)代碼。
網(wǎng)頁(yè)代碼就是指在網(wǎng)頁(yè)制作過(guò)程中需要用到的一些特殊的“語(yǔ)言”,設(shè)計(jì)人員通過(guò)對(duì)這些“語(yǔ)言”進(jìn)行組織編排制作出網(wǎng)頁(yè),然后由瀏覽器對(duì)代碼進(jìn)行“翻譯”后才是我們最終看到的效果。目前制作網(wǎng)頁(yè)時(shí)常用的代碼有HTML,JavaScript,ASP,PHP,CGI等,其中HTML 是最基礎(chǔ)的網(wǎng)頁(yè)代碼。所述網(wǎng)頁(yè)代碼可以由服務(wù)器在解析瀏覽器的請(qǐng)求消息時(shí)直接獲??; 或者,所述網(wǎng)頁(yè)代碼也可以在瀏覽器解析服務(wù)器返回的響應(yīng)消息時(shí)獲取,然后將網(wǎng)頁(yè)代碼上傳至服務(wù)器。使用服務(wù)器來(lái)獲取網(wǎng)頁(yè)代碼的好處是這樣可以節(jié)省用戶的上網(wǎng)流量,最小地耗用用戶帶寬,當(dāng)服務(wù)器保存網(wǎng)頁(yè)代碼失敗的時(shí)候,可以通知瀏覽器獲取網(wǎng)頁(yè)代碼上傳, 服務(wù)器再對(duì)所述網(wǎng)頁(yè)代碼進(jìn)行保存,瀏覽器上傳所述網(wǎng)頁(yè)代碼時(shí)可以采用壓縮代碼的方式將所述網(wǎng)頁(yè)代碼上傳,這樣也可以降低上傳的流浪,減少帶寬。
在具體實(shí)現(xiàn)中,一種服務(wù)器保存網(wǎng)頁(yè)代碼不成功的情況可以是一些網(wǎng)站為了防止自己內(nèi)容被其他人惡意盜用,會(huì)在自己服務(wù)器上做一些訪問限制,例如限定其他機(jī)器對(duì)它6的訪問頻率,這樣服務(wù)器就不能直接保存網(wǎng)頁(yè)代碼,在具體實(shí)現(xiàn)中,服務(wù)器可以將網(wǎng)頁(yè)代碼進(jìn)行哈希算法得到網(wǎng)站內(nèi)容驗(yàn)證串,將所述網(wǎng)站內(nèi)容驗(yàn)證串與預(yù)設(shè)的保存檢驗(yàn)接口中的網(wǎng)站內(nèi)容驗(yàn)證串進(jìn)行比較判斷服務(wù)器保存網(wǎng)頁(yè)代碼是否成功,如果所述網(wǎng)站內(nèi)容驗(yàn)證串存在于預(yù)設(shè)的保存檢驗(yàn)接口中則服務(wù)器保存網(wǎng)頁(yè)代碼成功,否則,服務(wù)器保存代碼不成功。本領(lǐng)域技術(shù)人員采用其他方式均是可以的,本發(fā)明對(duì)此不作限制。
瀏覽器在采集多臺(tái)用戶設(shè)備的瀏覽器收藏夾的網(wǎng)址信息后,將網(wǎng)址信息保存在數(shù)據(jù)庫(kù)中以供后續(xù)的搜索使用。在具體實(shí)現(xiàn)中,本發(fā)明可以用兩個(gè)數(shù)據(jù)庫(kù)保存網(wǎng)址信息,一個(gè)是內(nèi)容數(shù)據(jù)庫(kù),一個(gè)是網(wǎng)頁(yè)快照數(shù)據(jù)庫(kù),網(wǎng)頁(yè)快照數(shù)據(jù)庫(kù)用于保存網(wǎng)址的網(wǎng)頁(yè)快照,內(nèi)容數(shù)據(jù)庫(kù)用戶保存網(wǎng)址除網(wǎng)頁(yè)快照外的其他信息;或者,本發(fā)明也可以建立一個(gè)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)中包括兩張表,一張用于存儲(chǔ)網(wǎng)頁(yè)快照,一張用于存儲(chǔ)網(wǎng)頁(yè)快照以外的內(nèi)容,本領(lǐng)域技術(shù)人員應(yīng)該可以理解,上述的網(wǎng)址信息存儲(chǔ)方式僅僅是本發(fā)明的示例,本領(lǐng)域技術(shù)人員可以采用其他存儲(chǔ)方法進(jìn)行存儲(chǔ),本發(fā)明在此不作限制。
步驟102 :瀏覽器接收搜索請(qǐng)求并將所述搜索請(qǐng)求發(fā)送至服務(wù)器;
步驟103 :服務(wù)器在數(shù)據(jù)庫(kù)中抓取與所述搜索請(qǐng)求相關(guān)的網(wǎng)頁(yè)形成搜索結(jié)果返回給瀏覽器;
例如,當(dāng)用戶在瀏覽器中進(jìn)行關(guān)鍵詞搜索時(shí),瀏覽器接收用戶的搜索的關(guān)鍵詞后將關(guān)鍵詞發(fā)送給服務(wù)器,服務(wù)器根據(jù)所述關(guān)鍵詞到所述內(nèi)容數(shù)據(jù)庫(kù)中抓取跟關(guān)鍵詞相關(guān)的網(wǎng)頁(yè)內(nèi)容形成搜索結(jié)果返回給瀏覽器。在具體實(shí)現(xiàn)中,搜索結(jié)果可以按照網(wǎng)頁(yè)的權(quán)重進(jìn)行排序然后返回,也可以按照其他方法進(jìn)行排序返回,本發(fā)明在此不作限制。
步驟104 :瀏覽器展示所述搜索結(jié)果。
步驟105 :判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址是否為失效網(wǎng)址;
當(dāng)用戶需要查看某個(gè)搜索結(jié)果時(shí),瀏覽器或服務(wù)器首先判斷所述搜索結(jié)果對(duì)應(yīng)的網(wǎng)址能否正常訪問,如果所述網(wǎng)址不能正常訪問,則將網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)快照展示給用戶。
一般情況下,采用HTTP狀態(tài)碼(HTTP Status Code)來(lái)判斷網(wǎng)址的有效性。HTTP 狀態(tài)碼由三位十進(jìn)制數(shù)字組成,用以指出網(wǎng)頁(yè)訪問請(qǐng)求的成功或失敗,如果失敗則指出原因。HTTP狀態(tài)碼分分五種類型,由其第一位數(shù)字表示
以I開頭的3位數(shù)字代碼,包括100 (客戶端應(yīng)當(dāng)繼續(xù)發(fā)送請(qǐng)求)、101 (服務(wù)器已經(jīng)理解了客戶端的請(qǐng)求,并將通過(guò)Upgrade (升級(jí))消息頭通知客戶端采用不同的協(xié)議來(lái)完成這個(gè)請(qǐng)求)、102 (由 WebDAV (Web-based Distributed Authoring and Versioning, 一種基于HTTP I. I協(xié)議的通信協(xié)議)擴(kuò)展的狀態(tài)碼,代表處理將被繼續(xù)執(zhí)行),表示請(qǐng)求已被接受,需要繼續(xù)處理,這類響應(yīng)是臨時(shí)響應(yīng),只包含狀態(tài)行和某些可選的響應(yīng)頭信息,并以空行結(jié)束,但是由于HTTP/1. O協(xié)議中沒有定義任何以I開頭的狀態(tài)碼,所以除非在某些試驗(yàn)條件下,服務(wù)器禁止向此類客戶端發(fā)送此類狀態(tài)碼的響應(yīng);
以2開頭的3位數(shù)字代碼,包括200 (請(qǐng)求已成功,請(qǐng)求所希望的響應(yīng)頭或數(shù)據(jù)體將隨此響應(yīng)返回)、201 (請(qǐng)求已經(jīng)被實(shí)現(xiàn),而且有一個(gè)新的資源已經(jīng)依據(jù)請(qǐng)求的需要而建立)、202 (服務(wù)器已接受請(qǐng)求,但尚未處理)、203 (服務(wù)器已成功處理了請(qǐng)求,但返回的實(shí)體頭部元信息不是在原始服務(wù)器上有效的確定集合,而是來(lái)自本地或者第三方的拷貝)、 204(服務(wù)器成功處理了請(qǐng)求,但不需要返回任何實(shí)體內(nèi)容,并且希望返回更新了的元信息)、205 (服務(wù)器成功處理了請(qǐng)求,且沒有返回任何內(nèi)容)、206 (服務(wù)器已經(jīng)成功處理了部分GET請(qǐng)求)、207(由WebDAV (RFC2518)擴(kuò)展的狀態(tài)碼,代表之后的消息體將是一個(gè)XML消息),表示請(qǐng)求已成功被服務(wù)器接收、理解、并接受;
以3開頭的3位數(shù)字代碼,300 (用戶或?yàn)g覽器能夠自行選擇一個(gè)首選的地址進(jìn)行重定向)、301 (被請(qǐng)求的資源已永久移動(dòng)到新位置,并且將來(lái)任何對(duì)此資源的引用都應(yīng)該使用本響應(yīng)返回的若干個(gè)URI (通用資源標(biāo)志符)之一)、302 (請(qǐng)求的資源現(xiàn)在臨時(shí)從不同的URI響應(yīng)請(qǐng)求)、303(對(duì)應(yīng)當(dāng)前請(qǐng)求的響應(yīng)可以在另一個(gè)URI上被找到,而且客戶端應(yīng)當(dāng)采用GET的方式訪問那個(gè)資源)、304(如果客戶端發(fā)送了一個(gè)帶條件的GET請(qǐng)求且該請(qǐng)求已被允許,而文檔的內(nèi)容(自上次訪問以來(lái)或者根據(jù)請(qǐng)求的條件)并沒有改變,則服務(wù)器應(yīng)當(dāng)返回這個(gè)狀態(tài)碼)、305(被請(qǐng)求的資源必須通過(guò)指定的代理才能被訪問)、306(在最新版的規(guī)范中,306狀態(tài)碼已經(jīng)不再被使用)、307(請(qǐng)求的資源現(xiàn)在臨時(shí)從不同的URI響應(yīng)請(qǐng)求),表示需要客戶端采取進(jìn)一步的操作才能完成請(qǐng)求,通常,這些狀態(tài)碼用來(lái)重定向,后續(xù)的請(qǐng)求地址(重定向目標(biāo))在本次響應(yīng)的位置域中指明;
以4開頭的3位數(shù)字代碼,包括400 (語(yǔ)義有誤,當(dāng)前請(qǐng)求無(wú)法被服務(wù)器理解,請(qǐng)求參數(shù)有誤)、401 (當(dāng)前請(qǐng)求需要用戶驗(yàn)證)、402 (該狀態(tài)碼是為了將來(lái)可能的需求而預(yù)留的)、403 (服務(wù)器已經(jīng)理解請(qǐng)求,但是拒絕執(zhí)行它)、404 (請(qǐng)求失敗,請(qǐng)求所希望得到的資源未被在服務(wù)器上發(fā)現(xiàn))、405 (請(qǐng)求行中指定的請(qǐng)求方法不能被用于請(qǐng)求相應(yīng)的資源)、406(請(qǐng)求的資源的內(nèi)容特性無(wú)法滿足請(qǐng)求頭中的條件,因而無(wú)法生成響應(yīng)實(shí)體)、 407 (與401響應(yīng)類似,只不過(guò)客戶端必須在代理服務(wù)器上進(jìn)行身份驗(yàn)證)、408 (請(qǐng)求超時(shí))、409(由于和被請(qǐng)求的資源的當(dāng)前狀態(tài)之間存在沖突,請(qǐng)求無(wú)法完成)、410(被請(qǐng)求的資源在服務(wù)器上已經(jīng)不再可用,而且沒有任何已知的轉(zhuǎn)發(fā)地址)、411 (服務(wù)器拒絕在沒有定義Content-Length頭的情況下接受請(qǐng)求)、412(服務(wù)器在驗(yàn)證在請(qǐng)求的頭字段中給出先決條件時(shí),沒能滿足其中的一個(gè)或多個(gè))、413 (服務(wù)器拒絕處理當(dāng)前請(qǐng)求,因?yàn)樵撜?qǐng)求提交的實(shí)體數(shù)據(jù)大小超過(guò)了服務(wù)器愿意或者能夠處理的范圍)、414(請(qǐng)求的URI長(zhǎng)度超過(guò)了服務(wù)器能夠解釋的長(zhǎng)度,因此服務(wù)器拒絕對(duì)該請(qǐng)求提供服務(wù))、415 (對(duì)于當(dāng)前請(qǐng)求的方法和所請(qǐng)求的資源,請(qǐng)求中提交的實(shí)體并不是服務(wù)器中所支持的格式,因此請(qǐng)求被拒絕)、 416 (如果請(qǐng)求中包含了 Range請(qǐng)求頭,并且Range中指定的任何數(shù)據(jù)范圍都與當(dāng)前資源的可用范圍不重合,同時(shí)請(qǐng)求中又沒有定義If-Range請(qǐng)求頭,那么服務(wù)器就應(yīng)當(dāng)返回416狀態(tài)碼)、417(在請(qǐng)求頭Expect中指定的預(yù)期內(nèi)容無(wú)法被服務(wù)器滿足,或者這個(gè)服務(wù)器是一個(gè)代理服務(wù)器,它有明顯的證據(jù)證明在當(dāng)前路由的下一個(gè)節(jié)點(diǎn)上,Expect的內(nèi)容無(wú)法被滿足)、421 (從當(dāng)前客戶端所在的IP地址到服務(wù)器的連接數(shù)超過(guò)了服務(wù)器許可的最大范圍)、 422 (請(qǐng)求格式正確,但是由于含有語(yǔ)義錯(cuò)誤,無(wú)法響應(yīng))、424(由于之前的某個(gè)請(qǐng)求發(fā)生的錯(cuò)誤,導(dǎo)致當(dāng)前請(qǐng)求失敗)、425 (在WebDav Advanced Collections草案中定義,但是未出現(xiàn)在((WebDAV順序集協(xié)議》(RFC 3658)中)、426 (客戶端應(yīng)當(dāng)切換到TLS/1. O)、449 (由微軟擴(kuò)展,代表請(qǐng)求應(yīng)當(dāng)在執(zhí)行完適當(dāng)?shù)牟僮骱筮M(jìn)行重試),表示客戶端看起來(lái)可能發(fā)生了錯(cuò)誤,妨礙了服務(wù)器的處理;
以5開頭的3位數(shù)字代碼,包括500(服務(wù)器遇到了一個(gè)未曾預(yù)料的狀況,導(dǎo)致了它無(wú)法完成對(duì)請(qǐng)求的處理)、501 (服務(wù)器不支持當(dāng)前請(qǐng)求所需要的某個(gè)功能)、502 (作為網(wǎng)關(guān)或者代理工作的服務(wù)器嘗試執(zhí)行請(qǐng)求時(shí),從上游服務(wù)器接收到無(wú)效的響應(yīng))、503 (由于臨時(shí)的服務(wù)器維護(hù)或者過(guò)載,服務(wù)器當(dāng)前無(wú)法處理請(qǐng)求)、504(作為網(wǎng)關(guān)或者代理工作的服務(wù)器嘗試執(zhí)行請(qǐng)求時(shí),未能及時(shí)從上游服務(wù)器收到響應(yīng))、505 (服務(wù)器不支持,或者拒絕支持在請(qǐng)求中使用的HTTP版本)、506 (由《透明內(nèi)容協(xié)商協(xié)議》(RFC 2295)擴(kuò)展,代表服務(wù)器存在內(nèi)部配置錯(cuò)誤)、507 (服務(wù)器無(wú)法存儲(chǔ)完成請(qǐng)求所必須的內(nèi)容)、509 (服務(wù)器達(dá)到帶寬限制)、510(獲取資源所需要的策略并沒有沒滿足),表示服務(wù)器在處理請(qǐng)求的過(guò)程中有錯(cuò)誤或者異常狀態(tài)發(fā)生,也有可能是服務(wù)器意識(shí)到以當(dāng)前的軟硬件資源無(wú)法完成對(duì)請(qǐng)求的處理。
在本發(fā)明的一種優(yōu)選實(shí)施例中,所述步驟103可以包括如下子步驟
子步驟S21 :瀏覽器將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器;
子步驟S22 :服務(wù)器對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析生成響應(yīng)消息返回瀏覽器;
子步驟S23 :瀏覽器解析所述響應(yīng)消息,提取對(duì)應(yīng)網(wǎng)址的HTTP狀態(tài)碼;
子步驟S24 :瀏覽器依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
在本發(fā)明的另一種優(yōu)選實(shí)施例中,所述步驟103可以包括如下子步驟
子步驟S31 :瀏覽器將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器;
子步驟S32 :服務(wù)器對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析,提取對(duì)應(yīng)網(wǎng)址中的HTTP狀態(tài)碼;
子步驟S33 :服務(wù)器依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
作為本實(shí)施例的一種優(yōu)選示例,狀態(tài)碼為200、301、302、304的狀態(tài)可以視為網(wǎng)址鏈接成功網(wǎng)頁(yè)正常打開的狀態(tài),其余的狀態(tài)碼可以視為失效網(wǎng)址的狀態(tài)碼。
實(shí)際上,上述從瀏覽器側(cè)或者服務(wù)器側(cè)獲取HTTP狀態(tài)碼的方式可以是在瀏覽器側(cè)或者服務(wù)器側(cè)生成獨(dú)立的線程或者進(jìn)程進(jìn)行捕獲HTTP狀態(tài)碼,而本領(lǐng)域技術(shù)人員應(yīng)當(dāng)可以理解,以上獲取HTTP狀態(tài)碼的方式僅是一種示例,本領(lǐng)域技術(shù)人員可以采取其他方式來(lái)實(shí)現(xiàn)均是可以的,本發(fā)明在此不作限制。
步驟106 :若所述搜索結(jié)果的網(wǎng)址為失效網(wǎng)址,服務(wù)器在數(shù)據(jù)庫(kù)中查找匹配的網(wǎng)頁(yè)快照,并返回至瀏覽器。
實(shí)際上,若是在瀏覽器端判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址為失效網(wǎng)址時(shí),瀏覽器將所述搜索結(jié)果的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)快照獲取請(qǐng)求發(fā)送至服務(wù)器,服務(wù)器在所述網(wǎng)頁(yè)快照數(shù)據(jù)庫(kù)中查找與網(wǎng)頁(yè)快照獲取請(qǐng)求匹配的網(wǎng)頁(yè)快照返回瀏覽器;
若是在服務(wù)器端判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址為失效網(wǎng)址時(shí),服務(wù)器直接從網(wǎng)頁(yè)快照數(shù)據(jù)庫(kù)中查找與網(wǎng)頁(yè)快照獲取請(qǐng)求匹配的網(wǎng)頁(yè)快照返回瀏覽器。
需要說(shuō)明的是,對(duì)于方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
參照?qǐng)D2,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的失效網(wǎng)址搜索裝置實(shí)施例的結(jié)構(gòu)框圖, 具體可以包括以下模塊
網(wǎng)址信息采集模塊201,適于采集多臺(tái)用戶設(shè)備的瀏覽器收藏夾的網(wǎng)址信息,保存所述網(wǎng)址信息至數(shù)據(jù)庫(kù),所述網(wǎng)址信息包括網(wǎng)址的網(wǎng)頁(yè)快照;9
網(wǎng)頁(yè)快照,英文名叫Web Cache,網(wǎng)頁(yè)緩存。搜索引擎在收錄網(wǎng)頁(yè)時(shí),對(duì)網(wǎng)頁(yè)進(jìn)行備份,存在自己的服務(wù)器緩存里,當(dāng)用戶在搜索引擎中點(diǎn)擊“網(wǎng)頁(yè)快照”鏈接時(shí),搜索引擎將 Spider(蜘蛛)系統(tǒng)當(dāng)時(shí)所抓取并保存的網(wǎng)頁(yè)內(nèi)容展現(xiàn)出來(lái),稱為“網(wǎng)頁(yè)快照”。在本發(fā)明中,所述網(wǎng)頁(yè)快照可以由服務(wù)器獲取所述網(wǎng)頁(yè)的代碼保存生成,或者,可以在所述服務(wù)器獲取該網(wǎng)頁(yè)的代碼保存不成功時(shí),通知瀏覽器將對(duì)應(yīng)的網(wǎng)頁(yè)的代碼上傳生成。也就是說(shuō),網(wǎng)頁(yè)快照在服務(wù)器側(cè)的展現(xiàn)為一些網(wǎng)頁(yè)代碼。
網(wǎng)頁(yè)代碼就是指在網(wǎng)頁(yè)制作過(guò)程中需要用到的一些特殊的“語(yǔ)言”,設(shè)計(jì)人員通過(guò)對(duì)這些“語(yǔ)言”進(jìn)行組織編排制作出網(wǎng)頁(yè),然后由瀏覽器對(duì)代碼進(jìn)行“翻譯”后才是我們最終看到的效果。目前制作網(wǎng)頁(yè)時(shí)常用的代碼有HTML,JavaScript,ASP,PHP,CGI等,其中HTML 是最基礎(chǔ)的網(wǎng)頁(yè)代碼。所述網(wǎng)頁(yè)代碼可以由服務(wù)器在解析瀏覽器的請(qǐng)求消息時(shí)直接獲??; 或者,所述網(wǎng)頁(yè)代碼也可以在瀏覽器解析服務(wù)器返回的響應(yīng)消息時(shí)獲取,然后將網(wǎng)頁(yè)代碼上傳至服務(wù)器。使用服務(wù)器來(lái)獲取網(wǎng)頁(yè)代碼的好處是這樣可以節(jié)省用戶的上網(wǎng)流量,最小地耗用用戶帶寬,當(dāng)服務(wù)器保存網(wǎng)頁(yè)代碼失敗的時(shí)候,可以通知瀏覽器獲取網(wǎng)頁(yè)代碼上傳, 服務(wù)器再對(duì)所述網(wǎng)頁(yè)代碼進(jìn)行保存,瀏覽器上傳所述網(wǎng)頁(yè)代碼時(shí)可以采用壓縮代碼的方式將所述網(wǎng)頁(yè)代碼上傳,這樣也可以降低上傳的流浪,減少帶寬。
瀏覽器在采集多臺(tái)用戶設(shè)備的瀏覽器收藏夾的網(wǎng)址信息后,將網(wǎng)址信息保存在數(shù)據(jù)庫(kù)中以供后續(xù)的搜索使用。在具體實(shí)現(xiàn)中,本發(fā)明可以用兩個(gè)數(shù)據(jù)庫(kù)保存網(wǎng)址信息,一個(gè)是內(nèi)容數(shù)據(jù)庫(kù),一個(gè)是網(wǎng)頁(yè)快照數(shù)據(jù)庫(kù),網(wǎng)頁(yè)快照數(shù)據(jù)庫(kù)用于保存網(wǎng)址的網(wǎng)頁(yè)快照,內(nèi)容數(shù)據(jù)庫(kù)用戶保存網(wǎng)址除網(wǎng)頁(yè)快照外的其他信息;或者,本發(fā)明也可以建立一個(gè)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)中包括兩張表,一張用于存儲(chǔ)網(wǎng)頁(yè)快照,一種用于存儲(chǔ)網(wǎng)頁(yè)快照以外的內(nèi)容,本領(lǐng)域技術(shù)人員應(yīng)該可以理解,上述的網(wǎng)址信息存儲(chǔ)方式僅僅是本發(fā)明的示例,本領(lǐng)域技術(shù)人員可以采用其他存儲(chǔ)方法進(jìn)行存儲(chǔ),本發(fā)明在此不作限制。
搜索請(qǐng)求接收模塊202,適于接收搜索請(qǐng)求,并根據(jù)所述搜索請(qǐng)求返回搜索結(jié)果;
在本發(fā)明的一種優(yōu)選實(shí)施例中,所述搜索請(qǐng)求接收模塊202可以包括如下子模塊
位于瀏覽器的搜索請(qǐng)求發(fā)送子模塊,適于接收搜索請(qǐng)求并將所述搜索請(qǐng)求發(fā)送至服務(wù)器;
位于服務(wù)器的搜索結(jié)果返回子模塊,適于在數(shù)據(jù)庫(kù)中抓取與所述搜索請(qǐng)求相關(guān)的網(wǎng)頁(yè)形成搜索結(jié)果返回給瀏覽器;
位于瀏覽器的搜索結(jié)果展示子模塊,適于展示所述搜索結(jié)果。
失效網(wǎng)址判斷模塊203,適于判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址是否為失效網(wǎng)址;
當(dāng)用戶需要查看某個(gè)搜索結(jié)果時(shí),瀏覽器或服務(wù)器首先判斷所述搜索結(jié)果對(duì)應(yīng)的網(wǎng)址能否正常訪問,如果所述網(wǎng)址不能正常訪問,則將網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)快照展示給用戶。
一般情況下,采用HTTP狀態(tài)碼(HTTP Status Code)來(lái)判斷網(wǎng)址的有效性。HTTP 狀態(tài)碼由三位十進(jìn)制數(shù)字組成,用以指出網(wǎng)頁(yè)訪問請(qǐng)求的成功或失敗,如果失敗則指出原因。
在本發(fā)明的一種優(yōu)選實(shí)施例中,所述失效網(wǎng)址判斷模塊203可以包括如下子模塊
位于瀏覽器的第一網(wǎng)址發(fā)送子模塊,適于將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器;
位于服務(wù)器的響應(yīng)消息返回子模塊,適于對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析生成響應(yīng)消息返回瀏覽器;
位于瀏覽器的HTTP狀態(tài)碼獲取子模塊,適于解析所述響應(yīng)消息,提取對(duì)應(yīng)網(wǎng)址的 HTTP狀態(tài)碼;
位于瀏覽器的網(wǎng)址判定子模塊,適于依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
在本發(fā)明的另一種優(yōu)選實(shí)施例中,所述失效網(wǎng)址判斷模塊203可以包括如下子模塊
位于瀏覽器的第二網(wǎng)址發(fā)送子模塊,適于將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器;
位于服務(wù)器的HTTP狀態(tài)碼獲取子模塊,適于對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析,提取對(duì)應(yīng)網(wǎng)址中的HTTP狀態(tài)碼;
位于服務(wù)器的網(wǎng)址判定子模塊,適于依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
實(shí)際上,上述從瀏覽器側(cè)或者服務(wù)器側(cè)獲取HTTP狀態(tài)碼的方式可以是在瀏覽器側(cè)或者服務(wù)器側(cè)生成獨(dú)立的線程或者進(jìn)程進(jìn)行捕獲HTTP狀態(tài)碼,而本領(lǐng)域技術(shù)人員應(yīng)當(dāng)可以理解,以上獲取HTTP狀態(tài)碼的方式僅是一種示例,本領(lǐng)域技術(shù)人員可以采取其他方式來(lái)實(shí)現(xiàn)均是可以的,本發(fā)明在此不作限制。
網(wǎng)頁(yè)快照獲取模塊204,適于在所述搜索結(jié)果的網(wǎng)址為失效網(wǎng)址時(shí),服務(wù)器在數(shù)據(jù)庫(kù)中查找匹配的網(wǎng)頁(yè)快照,并返回至瀏覽器。
實(shí)際上,若是在瀏覽器端判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址為失效網(wǎng)址時(shí),瀏覽器將所述搜索結(jié)果的網(wǎng)址對(duì)應(yīng)的網(wǎng)頁(yè)快照獲取請(qǐng)求發(fā)送至服務(wù)器,服務(wù)器在所述網(wǎng)頁(yè)快照數(shù)據(jù)庫(kù)中查找與網(wǎng)頁(yè)快照獲取請(qǐng)求匹配的網(wǎng)頁(yè)快照返回瀏覽器;
若是在服務(wù)器端判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址為失效網(wǎng)址時(shí),服務(wù)器直接從網(wǎng)頁(yè)快照數(shù)據(jù)庫(kù)中查找與網(wǎng)頁(yè)快照獲取請(qǐng)求匹配的網(wǎng)頁(yè)快照返回瀏覽器。
對(duì)于圖2的系統(tǒng)實(shí)施例而言,由于其與圖I的方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部分說(shuō)明即可。
在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。 各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
在此處所提供的說(shuō)明書中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書的理解。
類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式
的權(quán)利要求書由此明確地并入該具體實(shí)施方式
,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中。可以把實(shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的基于收藏夾的搜索設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中, 不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
權(quán)利要求
1.一種失效網(wǎng)址搜索方法,包括 采集多臺(tái)用戶設(shè)備的瀏覽器收藏夾的網(wǎng)址信息,保存所述網(wǎng)址信息至數(shù)據(jù)庫(kù),所述網(wǎng)址信息包括網(wǎng)址的網(wǎng)頁(yè)快照; 瀏覽器接收搜索請(qǐng)求并將所述搜索請(qǐng)求發(fā)送至服務(wù)器; 服務(wù)器在數(shù)據(jù)庫(kù)中抓取與所述搜索請(qǐng)求相關(guān)的網(wǎng)頁(yè)形成搜索結(jié)果返回給瀏覽器; 瀏覽器展示所述搜索結(jié)果; 判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址是否為失效網(wǎng)址; 若所述搜索結(jié)果的網(wǎng)址為失效網(wǎng)址,服務(wù)器在數(shù)據(jù)庫(kù)中查找匹配的網(wǎng)頁(yè)快照,并返回至瀏覽器。
2.如權(quán)利要求I所述的方法,所述網(wǎng)頁(yè)快照為服務(wù)器獲取所述網(wǎng)頁(yè)的代碼保存生成,或?yàn)椋谒龇?wù)器獲取該網(wǎng)頁(yè)的代碼保存不成功時(shí),通知瀏覽器將對(duì)應(yīng)的網(wǎng)頁(yè)的代碼上傳生成。
3.如權(quán)利要求I或2所述的方法,所述判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址是否為失效網(wǎng)址的步驟包括 瀏覽器將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器; 服務(wù)器對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析生成響應(yīng)消息返回瀏覽器; 瀏覽器解析所述響應(yīng)消息,提取對(duì)應(yīng)網(wǎng)址的HTTP狀態(tài)碼; 瀏覽器依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
4.如權(quán)利要求I或2所述的方法,所述判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址是否為失效網(wǎng)址的步驟包括 瀏覽器將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器; 服務(wù)器對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析,提取對(duì)應(yīng)網(wǎng)址中的HTTP狀態(tài)碼; 服務(wù)器依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
5.一種失效網(wǎng)址搜索裝置,包括 網(wǎng)址信息采集模塊,適于采集多臺(tái)用戶設(shè)備的瀏覽器收藏夾的網(wǎng)址信息,保存所述網(wǎng)址信息至數(shù)據(jù)庫(kù),所述網(wǎng)址信息包括網(wǎng)址的網(wǎng)頁(yè)快照; 搜索請(qǐng)求接收模塊,適于接收搜索請(qǐng)求,并根據(jù)所述搜索請(qǐng)求返回搜索結(jié)果; 失效網(wǎng)址判斷模塊,適于判斷訪問某個(gè)搜索結(jié)果的網(wǎng)址是否為失效網(wǎng)址; 網(wǎng)頁(yè)快照獲取模塊,適于在所述搜索結(jié)果的網(wǎng)址為失效網(wǎng)址時(shí),服務(wù)器在數(shù)據(jù)庫(kù)中查找匹配的網(wǎng)頁(yè)快照,并返回至瀏覽器; 其中,所述搜索請(qǐng)求接收模塊包括 位于瀏覽器的搜索請(qǐng)求發(fā)送子模塊,適于接收搜索請(qǐng)求并將所述搜索請(qǐng)求發(fā)送至服務(wù)器; 位于服務(wù)器的搜索結(jié)果返回子模塊,適于在數(shù)據(jù)庫(kù)中抓取與所述搜索請(qǐng)求相關(guān)的網(wǎng)頁(yè)形成搜索結(jié)果返回給瀏覽器; 位于瀏覽器的搜索結(jié)果展示子模塊,適于展示所述搜索結(jié)果。
6.如權(quán)利要求5所述的裝置,所述網(wǎng)頁(yè)快照為服務(wù)器獲取所述網(wǎng)頁(yè)的代碼保存生成,或?yàn)椋谒龇?wù)器獲取該網(wǎng)頁(yè)的代碼保存不成功時(shí),通知瀏覽器將對(duì)應(yīng)的網(wǎng)頁(yè)的代碼上傳生成。
7.如權(quán)利要求5或6所述的裝置,所述失效網(wǎng)址判斷模塊包括 位于瀏覽器的第一網(wǎng)址發(fā)送子模塊,適于將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器;位于服務(wù)器的響應(yīng)消息返回子模塊,適于對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析生成響應(yīng)消息返回瀏覽器; 位于瀏覽器的HTTP狀態(tài)碼獲取子模塊,適于解析所述響應(yīng)消息,提取對(duì)應(yīng)網(wǎng)址的HTTP狀態(tài)碼; 位于瀏覽器的網(wǎng)址判定子模塊,適于依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
8.如權(quán)利要求5或6所述的裝置,所述失效網(wǎng)址判斷模塊包括 位于瀏覽器的第二網(wǎng)址發(fā)送子模塊,適于將所述搜索結(jié)果的網(wǎng)址發(fā)送至服務(wù)器;位于服務(wù)器的HTTP狀態(tài)碼獲取子模塊,適于對(duì)所述搜索結(jié)果的網(wǎng)址進(jìn)行解析,提取對(duì)應(yīng)網(wǎng)址中的HTTP狀態(tài)碼; 位于服務(wù)器的網(wǎng)址判定子模塊,適于依據(jù)所述HTTP狀態(tài)碼判定網(wǎng)址訪問請(qǐng)求是否為失效網(wǎng)址的訪問請(qǐng)求。
全文摘要
本發(fā)明公開了一種失效網(wǎng)址搜索方法和裝置,其中所述裝置包括網(wǎng)址信息采集模塊;搜索請(qǐng)求接收模塊;失效網(wǎng)址判斷模塊;網(wǎng)頁(yè)快照獲取模塊;其中,所述搜索請(qǐng)求接收模塊包括位于瀏覽器的搜索請(qǐng)求發(fā)送子模塊,適于接收搜索請(qǐng)求并將所述搜索請(qǐng)求發(fā)送至服務(wù)器;位于服務(wù)器的搜索結(jié)果返回子模塊,適于在數(shù)據(jù)庫(kù)中抓取與所述搜索請(qǐng)求相關(guān)的網(wǎng)頁(yè)形成搜索結(jié)果返回給瀏覽器;位于瀏覽器的搜索結(jié)果展示子模塊,適于展示所述搜索結(jié)果。本發(fā)明可以在用戶點(diǎn)擊搜索結(jié)果失敗時(shí)保證用戶正常瀏覽該網(wǎng)頁(yè)的內(nèi)容。
文檔編號(hào)G06F17/30GK102929984SQ20121039798
公開日2013年2月13日 申請(qǐng)日期2012年10月18日 優(yōu)先權(quán)日2012年10月18日
發(fā)明者趙飛 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1