專(zhuān)利名稱(chēng):一種提供網(wǎng)絡(luò)資源的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及瀏覽器技術(shù)領(lǐng)域,特別是涉及一種提供網(wǎng)絡(luò)資源的方法及系統(tǒng)。
背景技術(shù):
用戶(hù)在使用瀏覽器瀏覽網(wǎng)頁(yè)或者在網(wǎng)頁(yè)中下載文件時(shí),經(jīng)常會(huì)存在訪問(wèn)網(wǎng)頁(yè)不成功或者下載文件失敗的情況。例如,用戶(hù)點(diǎn)擊某網(wǎng)頁(yè)的鏈接訪問(wèn)該網(wǎng)頁(yè)時(shí),會(huì)存在該鏈接是死鏈,該網(wǎng)頁(yè)無(wú)法顯示的現(xiàn)象,或者該鏈接不是死鏈,但是頁(yè)面上的內(nèi)容已經(jīng)被刪除的現(xiàn)象,或者由于網(wǎng)速太慢而導(dǎo)致網(wǎng)頁(yè)無(wú)法打開(kāi)的現(xiàn)象,以至于請(qǐng)求不到想要的網(wǎng)頁(yè)。又如,用戶(hù)訪問(wèn)的網(wǎng)頁(yè)具有圖片時(shí),可能會(huì)出現(xiàn)網(wǎng)頁(yè)上的圖片無(wú)法正常顯示,以至于用戶(hù)無(wú)法獲取到該網(wǎng)頁(yè)的完整信息。再如,用戶(hù)點(diǎn)擊某個(gè)網(wǎng)頁(yè)上的文件下載鏈接想下載文件,但是無(wú)法下載成功,等等??梢?jiàn),現(xiàn)有技術(shù)在向用戶(hù)提供網(wǎng)絡(luò)資源時(shí),存在成功率低的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明提供一種提供網(wǎng)絡(luò)資源的方法及系統(tǒng),能夠提高提供網(wǎng)絡(luò)資源的成功率。本發(fā)明提供了如下方案一種提供網(wǎng)絡(luò)資源的方法,包括識(shí)別無(wú)效網(wǎng)絡(luò)資源;利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;將所述替代網(wǎng)絡(luò)資源提供給用戶(hù)。優(yōu)選的,所述無(wú)效網(wǎng)絡(luò)資源包括無(wú)效網(wǎng)頁(yè),或者網(wǎng)頁(yè)中的無(wú)效頁(yè)面元素,或者無(wú)效下載文件。優(yōu)選的,所述識(shí)別無(wú)效網(wǎng)絡(luò)資源包括讀取頁(yè)面內(nèi)容,通過(guò)識(shí)別頁(yè)面內(nèi)容中的錯(cuò)誤提示信息,識(shí)別無(wú)效網(wǎng)絡(luò)資源。優(yōu)選的,所述識(shí)別無(wú)效網(wǎng)絡(luò)資源包括根據(jù)用戶(hù)的訪問(wèn)歷史記錄,識(shí)別無(wú)效網(wǎng)絡(luò)資源。優(yōu)選的,所述特征信息包括所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息。優(yōu)選的,所述利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源包括在搜索引擎中搜索所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的網(wǎng)絡(luò)快照,將所述網(wǎng)絡(luò)快照作為所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;或者在瀏覽器的服務(wù)器緩存中搜索所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的緩存內(nèi)容,將所述緩存內(nèi)容作為所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;或者
在點(diǎn)對(duì)點(diǎn)P2P網(wǎng)絡(luò)中查找其他用戶(hù)之前保存的與所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的網(wǎng)絡(luò)資源,將所述查找到的網(wǎng)絡(luò)資源作為所述替代網(wǎng)絡(luò)資源。優(yōu)選的,所述特征信息包括所述無(wú)效網(wǎng)絡(luò)資源的鏈接文本,所述利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源包括在搜索引擎中搜索所述鏈接文本對(duì)應(yīng)的網(wǎng)絡(luò)資源,根據(jù)所述搜索到的網(wǎng)絡(luò)資源確定所述替代網(wǎng)絡(luò)資源。優(yōu)選的,所述特征信息還包括所述無(wú)效網(wǎng)絡(luò)資源的引用頁(yè)信息,所述根據(jù)所述搜索到的網(wǎng)絡(luò)資源確定所述替代網(wǎng)絡(luò)資源包括利用所述引用頁(yè)信息對(duì)所述搜索到的網(wǎng)絡(luò)資源進(jìn)行過(guò)濾,并確定所述替代網(wǎng)絡(luò)資源。優(yōu)選的,所述將所述替代網(wǎng)絡(luò)資源提供給用戶(hù)包括當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí),利用所述替代網(wǎng)絡(luò)資源替換所述無(wú)效網(wǎng)絡(luò)資源,將所述替代網(wǎng)絡(luò)資源展現(xiàn)在原無(wú)效網(wǎng)絡(luò)資源所在的頁(yè)面中;和/ 或,當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí),在新建的窗口或標(biāo)簽頁(yè)中展現(xiàn)所述替代網(wǎng)絡(luò)資源;和/ 或,當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效下載文件時(shí),將所述替代網(wǎng)絡(luò)資源傳輸給用戶(hù)。一種提供網(wǎng)絡(luò)資源的系統(tǒng),包括識(shí)別單元,用于識(shí)別出無(wú)效網(wǎng)絡(luò)資源;替代查找單元,用于利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;替代提供單元,用于將所述替代網(wǎng)絡(luò)資源提供給用戶(hù)。優(yōu)選的,所述無(wú)效網(wǎng)絡(luò)資源包括無(wú)效網(wǎng)頁(yè),或者網(wǎng)頁(yè)中的無(wú)效頁(yè)面元素,或者無(wú)效下載文件。優(yōu)選的,所述識(shí)別單元包括第一識(shí)別單元,用于讀取頁(yè)面內(nèi)容,通過(guò)識(shí)別頁(yè)面內(nèi)容中的錯(cuò)誤提示信息,識(shí)別無(wú)效網(wǎng)絡(luò)資源。優(yōu)選的,所述讀第一識(shí)別單元包括模板比對(duì)子單元,用于讀取頁(yè)面內(nèi)容,將所述頁(yè)面內(nèi)容與預(yù)置的規(guī)則模板進(jìn)行比對(duì),識(shí)別出頁(yè)面內(nèi)容中的錯(cuò)誤提示信息。優(yōu)選的,所述識(shí)別單元包括第二識(shí)別單元,用于根據(jù)用戶(hù)的訪問(wèn)歷史記錄,識(shí)別出無(wú)效網(wǎng)絡(luò)資源。優(yōu)選的,所述替代查找單元,具體用于利用所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源。優(yōu)選的,所述替代查找單元包括第一查找子單元,用于在搜索引擎中搜索所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的快照,將所述快照作為所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)
6絡(luò)資源;或者第二查找子單元,用于在瀏覽器的服務(wù)器緩存中搜索所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的緩存內(nèi)容,將所述緩存內(nèi)容作為所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;或者第三查找子單元,用于在點(diǎn)對(duì)點(diǎn)P2P網(wǎng)絡(luò)中查找其他用戶(hù)之前保存的與所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的網(wǎng)絡(luò)資源,將所述查找到的網(wǎng)絡(luò)資源作為所述替代網(wǎng)絡(luò)資源。優(yōu)選的,所述特征信息包括所述無(wú)效網(wǎng)絡(luò)資源的鏈接文本,所述替代查找單元包括第四查找子單元,用于在搜索引擎中搜索所述鏈接文本對(duì)應(yīng)的網(wǎng)絡(luò)資源,根據(jù)所述搜索到的網(wǎng)絡(luò)資源確定所述替代網(wǎng)絡(luò)資源。優(yōu)選的,所述特征信息還包括所述無(wú)效網(wǎng)絡(luò)資源的引用頁(yè)信息,所述第四查找子單元具體用于利用所述引用頁(yè)信息對(duì)所述搜索到的網(wǎng)絡(luò)資源進(jìn)行過(guò)濾,并確定所述替代網(wǎng)絡(luò)資源。優(yōu)選的,所述替代提供單元包括第一提供子單元,用于當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí), 利用所述替代網(wǎng)絡(luò)資源替換所述無(wú)效網(wǎng)絡(luò)資源,將所述替代網(wǎng)絡(luò)資源展現(xiàn)在原無(wú)效網(wǎng)絡(luò)資源所在的頁(yè)面中;禾口/ 或,第二提供子單元,用于當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí), 在新建的窗口或標(biāo)簽頁(yè)中展現(xiàn)所述替代網(wǎng)絡(luò)資源;和/ 或,第三提供子單元,用于當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效下載文件時(shí),將所述替代網(wǎng)絡(luò)資源傳輸給用戶(hù)。根據(jù)本發(fā)明提供的具體實(shí)施例,本發(fā)明公開(kāi)了以下技術(shù)效果本發(fā)明實(shí)施例由于能夠識(shí)別出無(wú)效網(wǎng)絡(luò)資源,并獲取相應(yīng)的替代網(wǎng)絡(luò)資源,因此, 當(dāng)出現(xiàn)無(wú)效網(wǎng)絡(luò)資源時(shí),可以將替代網(wǎng)絡(luò)資源提供給用戶(hù),避免僅向用戶(hù)展現(xiàn)一個(gè)帶有錯(cuò)誤提示的頁(yè)面或者顯示為“紅叉”的圖片,因此,可以提高提供網(wǎng)絡(luò)資源的成功率,從用戶(hù)應(yīng)用的角度而言,可以更好地滿(mǎn)足用戶(hù)的需求,提高用戶(hù)獲得所需網(wǎng)絡(luò)資源的成功率。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是無(wú)效網(wǎng)絡(luò)資源示意圖;圖2是本發(fā)明實(shí)施例提供的方法的流程圖;圖3是本發(fā)明實(shí)施例提供的系統(tǒng)的示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明實(shí)施例針對(duì)現(xiàn)有技術(shù)中一些無(wú)法成功提供網(wǎng)絡(luò)資源的情況,通過(guò)對(duì)瀏覽器增加新的功能,給出了相應(yīng)的解決方法。為了解決該問(wèn)題,首先需要識(shí)別出無(wú)效的網(wǎng)絡(luò)資源。在本發(fā)明實(shí)施例中,網(wǎng)絡(luò)資源可以包括網(wǎng)頁(yè)、網(wǎng)頁(yè)中的圖片、音視頻、供下載的文件(通常在網(wǎng)頁(yè)中以鏈接的形式存在,在該文件有效的情況下,點(diǎn)擊該鏈接時(shí),可以彈出一個(gè)對(duì)話(huà)框,提示用戶(hù)設(shè)定文件保存路徑等信息)等等;關(guān)于無(wú)效的網(wǎng)絡(luò)資源,從廣義上講可以包括所有沒(méi)有正常顯示或播放的資源,即用戶(hù)通過(guò)瀏覽器看到的內(nèi)容并不是用戶(hù)所真正需要的內(nèi)容。在本發(fā)明實(shí)施例中,無(wú)效的網(wǎng)絡(luò)資源可以包括無(wú)效網(wǎng)頁(yè)、網(wǎng)頁(yè)中的無(wú)效頁(yè)面元素或者無(wú)效下載文件等。具體而言,可以包括沒(méi)有正常顯示的網(wǎng)頁(yè)、頁(yè)面內(nèi)容被刪除的網(wǎng)頁(yè)、網(wǎng)頁(yè)中顯示為“紅叉”的圖片、網(wǎng)頁(yè)中顯示為防盜鏈偽圖的圖片、網(wǎng)頁(yè)中無(wú)法正常下載的文件等寸。如何使瀏覽器識(shí)別出這些無(wú)效的網(wǎng)絡(luò)資源是一個(gè)關(guān)鍵問(wèn)題,因此,下面首先示例性地介紹幾種識(shí)別無(wú)效網(wǎng)絡(luò)資源的方法。方法一、第一種識(shí)別無(wú)效網(wǎng)絡(luò)資源的方法可以是通過(guò)服務(wù)器返回的錯(cuò)誤碼來(lái)識(shí)別。這里的服務(wù)器是指提供網(wǎng)絡(luò)資源的服務(wù)器,例如,網(wǎng)頁(yè)所在的網(wǎng)站服務(wù)器,提供圖片的服務(wù)器等;當(dāng)出現(xiàn)錯(cuò)誤時(shí),服務(wù)器會(huì)通過(guò)HTTP協(xié)議向客戶(hù)端返回錯(cuò)誤碼,指明內(nèi)容無(wú)效以及無(wú)效的原因。例如,如圖1所示,當(dāng)用戶(hù)訪問(wèn)某網(wǎng)頁(yè)時(shí),服務(wù)器可能會(huì)返回一個(gè)錯(cuò)誤提示頁(yè)面,其中在“11”處提示了“找不到網(wǎng)頁(yè)”,并且提示出要查看的內(nèi)容可能已經(jīng)被刪除、名稱(chēng)已被更改,或者暫時(shí)不可用,同時(shí),在“12”處顯示出錯(cuò)誤碼為400。又如,如果服務(wù)器返回的錯(cuò)誤碼為404b,則證明該錯(cuò)誤是由于無(wú)法找到文件而造成的,通常是由于正在搜索的網(wǎng)頁(yè)可能已經(jīng)刪除、更名或暫時(shí)不可用,換言之,如果服務(wù)器端無(wú)法找到相應(yīng)的文件,則會(huì)向客戶(hù)端返回404b錯(cuò)誤。如,當(dāng)用戶(hù)訪問(wèn)的網(wǎng)頁(yè)已經(jīng)被刪除時(shí),用戶(hù)看到的將是一個(gè)帶有“該頁(yè)面無(wú)法顯示”等提示信息的網(wǎng)頁(yè),同時(shí),還在該網(wǎng)頁(yè)中顯示出“錯(cuò)誤碼404b”。因此,從瀏覽器端檢測(cè)HTTP返回的錯(cuò)誤碼即可,通過(guò)識(shí)別這些錯(cuò)誤碼即可識(shí)別出無(wú)效的網(wǎng)絡(luò)資源。需要說(shuō)明的是,這種方法對(duì)于無(wú)效網(wǎng)頁(yè)、圖片、供下載文件的識(shí)別都能夠適用。其中,對(duì)于文件無(wú)法成功被下載的情況(其原因可能是網(wǎng)頁(yè)中原本提供某個(gè)文件的下載,但是后來(lái)又撤掉了這個(gè)文件),用戶(hù)點(diǎn)擊該文件的鏈接時(shí),將被跳轉(zhuǎn)到一個(gè)無(wú)效網(wǎng)頁(yè)上,并且服務(wù)器仍可以在該網(wǎng)頁(yè)上提供相應(yīng)的錯(cuò)誤碼信息。可見(jiàn),當(dāng)下載文件無(wú)效時(shí),最終可以得到一個(gè)網(wǎng)頁(yè),通過(guò)識(shí)別該網(wǎng)頁(yè)頁(yè)面內(nèi)容中的錯(cuò)誤提示信息,就可以識(shí)別出無(wú)效下載文件,所以對(duì)無(wú)效網(wǎng)頁(yè)的識(shí)別方法同樣適用對(duì)無(wú)效待下載文件的識(shí)別方法。當(dāng)然,在一些特殊情況下,網(wǎng)絡(luò)資源可能確實(shí)是無(wú)效的,但是本發(fā)明實(shí)施例可以不對(duì)其進(jìn)行處理。例如,當(dāng)用戶(hù)不具有訪問(wèn)某網(wǎng)頁(yè)的權(quán)限時(shí),用戶(hù)也會(huì)得到一個(gè)無(wú)效的網(wǎng)頁(yè), 網(wǎng)頁(yè)中可能也會(huì)包含相應(yīng)的錯(cuò)誤碼;例如,403. 6錯(cuò)誤是由于IP地址被拒絕而造成的,即如果服務(wù)器中有不能訪問(wèn)該站點(diǎn)的IP地址列表,并且某用戶(hù)當(dāng)前使用的IP地址在該列表中時(shí),服務(wù)器就會(huì)返回這條403. 6錯(cuò)誤信息。本發(fā)明實(shí)施例可以將這種錯(cuò)誤排除在識(shí)別的范
8圍之外,即,當(dāng)涉及到由于訪問(wèn)權(quán)限等非客觀因素造成的無(wú)效時(shí),本發(fā)明實(shí)施例可以不予處理。具體實(shí)現(xiàn)時(shí),由于各種錯(cuò)誤碼代表的含義是固定的,因此可以預(yù)先根據(jù)需要設(shè)置需要統(tǒng)計(jì)的錯(cuò)誤碼,得到一個(gè)錯(cuò)誤碼列表,該錯(cuò)誤碼列表中可以保存各個(gè)錯(cuò)誤碼的編號(hào),以及對(duì)應(yīng)的無(wú)效網(wǎng)絡(luò)資源的類(lèi)型;當(dāng)服務(wù)器返回某錯(cuò)誤碼時(shí),先判斷該錯(cuò)誤碼是否在預(yù)置的錯(cuò)誤碼列表之內(nèi),如果是,再將對(duì)應(yīng)的網(wǎng)絡(luò)資源識(shí)別為無(wú)效的網(wǎng)絡(luò)資源。方法二、在某些情況下,當(dāng)網(wǎng)絡(luò)資源沒(méi)有正常顯示或播放時(shí),服務(wù)器也可能不會(huì)返回錯(cuò)誤碼。例如,如果是網(wǎng)站相應(yīng)的功能模塊尚未完成、網(wǎng)站被關(guān)閉正在維護(hù)等原因,則該網(wǎng)頁(yè)也無(wú)法正常顯示,但是在HTTP返回碼上是正常的;又如,當(dāng)網(wǎng)頁(yè)中的其他內(nèi)容都正常顯示,只有圖片沒(méi)有正常顯示,此時(shí)服務(wù)器也不會(huì)返回錯(cuò)誤碼。雖然服務(wù)器不會(huì)返回錯(cuò)誤碼,但是針對(duì)上述各種情況都會(huì)有相應(yīng)的提示信息,例如,對(duì)于無(wú)效網(wǎng)頁(yè),可能在頁(yè)面中提示“該網(wǎng)頁(yè)正在維護(hù)”等;或者,對(duì)于網(wǎng)頁(yè)中的無(wú)效圖片, 可能會(huì)在無(wú)效圖片上顯示一個(gè)“紅叉”等;或者,對(duì)于無(wú)效下載文件,在跳轉(zhuǎn)后的網(wǎng)頁(yè)中也可能給出“該文件已經(jīng)被刪除”等文字提示信息,等等。因此,對(duì)于這種無(wú)效的網(wǎng)絡(luò)資源,可以利用這些提示信息進(jìn)行識(shí)別。具體實(shí)現(xiàn)時(shí),可以預(yù)先將各種錯(cuò)誤信息進(jìn)行分類(lèi),并對(duì)每一類(lèi)錯(cuò)誤信息建立提示內(nèi)容的規(guī)則模板,例如,“網(wǎng)頁(yè)正在維護(hù)”、“紅叉”、“文件被刪除,,等都可以作為一個(gè)規(guī)則模板,同時(shí)還可以預(yù)先設(shè)置各規(guī)則模板對(duì)應(yīng)的無(wú)效網(wǎng)絡(luò)資源的類(lèi)型;瀏覽器在識(shí)別無(wú)效網(wǎng)絡(luò)資源時(shí),可以將網(wǎng)頁(yè)上的內(nèi)容與各個(gè)模板進(jìn)行匹配,如果匹配上,則證明是此類(lèi)的無(wú)效內(nèi)容。例如,某規(guī)則模板為“網(wǎng)頁(yè)正在維護(hù)”,其對(duì)應(yīng)的無(wú)效網(wǎng)絡(luò)資源的類(lèi)型為 “無(wú)效網(wǎng)頁(yè)”;則在識(shí)別無(wú)效網(wǎng)絡(luò)資源的過(guò)程中,只要某網(wǎng)頁(yè)的頁(yè)面內(nèi)容中出現(xiàn)了“網(wǎng)頁(yè)正在維護(hù)”的字樣,則認(rèn)為出現(xiàn)了無(wú)效網(wǎng)絡(luò)資源,并且該無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)。同樣,對(duì)于無(wú)效的待下載文件,由于點(diǎn)擊鏈接后會(huì)彈出一個(gè)網(wǎng)頁(yè),顯示出相應(yīng)的提示信息,因此也可以采用該方法。另外,當(dāng)一個(gè)網(wǎng)站引用源自另一個(gè)網(wǎng)站的圖片時(shí),很容易出現(xiàn)圖片顯示為防盜鏈警告圖片的情況,即此時(shí)服務(wù)器返回的圖片內(nèi)容將不是原始圖片本身,而是內(nèi)容類(lèi)似“該圖片為盜鏈”的警告圖片。針對(duì)這種無(wú)效圖片的識(shí)別,也可以采用規(guī)則模板的方式實(shí)現(xiàn)。具體的,可以預(yù)先對(duì)每一個(gè)網(wǎng)站的防盜鏈警告圖片建立數(shù)字簽名,形成一個(gè)數(shù)字簽名庫(kù)。當(dāng)瀏覽器在識(shí)別無(wú)效圖片時(shí),可以將圖片的數(shù)字簽名與數(shù)字簽名庫(kù)進(jìn)行對(duì)照,如果與數(shù)字簽名庫(kù)中的某數(shù)字簽名相同,則說(shuō)明是存在此類(lèi)的無(wú)效內(nèi)容。其中,在建立規(guī)則模板時(shí),可以采用人工的方法,即根據(jù)經(jīng)驗(yàn)人為地建立一些規(guī)則模板;為了提高建立規(guī)則模板的效率,還可以通過(guò)服務(wù)器抓取的手段,輔助以人工檢查;例如,當(dāng)服務(wù)器發(fā)現(xiàn)一個(gè)站點(diǎn)下的很多頁(yè)面內(nèi)容相同時(shí),則這些頁(yè)面很可能就是無(wú)效頁(yè)面,并將這些頁(yè)面作為候選的無(wú)效頁(yè)面,然后再由人工對(duì)候選的無(wú)效頁(yè)面進(jìn)行審核并總結(jié)出規(guī)則模板。關(guān)于數(shù)字簽名庫(kù),由于也屬于規(guī)則模板的一種,因此具體的建立方法也與上述方法類(lèi)似,如,首先可以通過(guò)服務(wù)器進(jìn)行抓取,當(dāng)服務(wù)器發(fā)現(xiàn)某個(gè)站點(diǎn)引用的很多圖片內(nèi)容都相同時(shí),則可以認(rèn)為這些圖片可能是無(wú)效圖片,然后由人工進(jìn)行審核處理。需要說(shuō)明的是,使用規(guī)則模板的方法進(jìn)行識(shí)別時(shí),同樣可能存在一些特殊情況,例如,對(duì)于“您不具有訪問(wèn)該地址的權(quán)限”等提示信息,由于仍然涉及到權(quán)限問(wèn)題,因此,可以
9不對(duì)其進(jìn)行處理。具體的實(shí)現(xiàn)方法與比較簡(jiǎn)單,不針對(duì)這類(lèi)錯(cuò)誤建立規(guī)則模板即可,因此, 瀏覽器也不會(huì)發(fā)現(xiàn)這類(lèi)錯(cuò)誤,更不會(huì)對(duì)其進(jìn)行相應(yīng)的處理??傊谇笆龇椒ㄒ患胺椒ǘ?,都是通過(guò)識(shí)別頁(yè)面內(nèi)容中的錯(cuò)誤提示信息,來(lái)識(shí)別出無(wú)效網(wǎng)絡(luò)資源。其中,在方法一中,頁(yè)面內(nèi)容中的錯(cuò)誤提示信息是指錯(cuò)誤碼,在方法二中,頁(yè)面容中的錯(cuò)誤提示信息是指文本或圖片(如無(wú)效圖片上顯示的“紅叉”等)信息。需要說(shuō)明的是,關(guān)于方法一中的錯(cuò)誤碼列表,由于其目的也是使得瀏覽器獲知識(shí)別出頁(yè)面內(nèi)容中的錯(cuò)誤提示信息,因此,實(shí)際上可以看作是方法二中使用的規(guī)則模板中的一種。方法三、在該方法三中,還可以利用用戶(hù)的訪問(wèn)歷史建立無(wú)效網(wǎng)絡(luò)資源庫(kù),然后利用該庫(kù)來(lái)識(shí)別無(wú)效網(wǎng)絡(luò)資源。例如,針對(duì)待下載文件這種網(wǎng)絡(luò)資源,可以采用以下識(shí)別方法根據(jù)用戶(hù)之前的下載記錄,保存一份無(wú)效文件下載鏈接的庫(kù);當(dāng)某個(gè)屬于該庫(kù)的鏈接出現(xiàn)跳轉(zhuǎn)的時(shí)候,則認(rèn)為是無(wú)效的。即,在初始狀態(tài)下(無(wú)效文件下載鏈接庫(kù)為空時(shí)),可以根據(jù)前文所述的方法一或方法二來(lái)識(shí)別是否存在無(wú)效文件下載的情況,如果發(fā)現(xiàn)了無(wú)效的文件下載,則將該文件對(duì)應(yīng)的鏈接記錄到無(wú)效文件下載鏈接庫(kù)中;這樣,在后續(xù)的識(shí)別過(guò)程中,可以首先在該庫(kù)中查詢(xún)是否存在該文件的下載鏈接,如果存在,則認(rèn)為該文件時(shí)無(wú)效文件。同樣,對(duì)于網(wǎng)頁(yè)、網(wǎng)頁(yè)中的圖片等其他無(wú)效頁(yè)面元素,也可以采用類(lèi)似的方法來(lái)進(jìn)行識(shí)別。以上所述介紹了幾種識(shí)別無(wú)效網(wǎng)絡(luò)資源的方法,當(dāng)然在實(shí)際應(yīng)用中,還可以采用其他的識(shí)別方法,這里并不做限定。從前文所述可以看出,導(dǎo)致出現(xiàn)上述無(wú)效網(wǎng)絡(luò)資源的原因可能是訪問(wèn)的網(wǎng)頁(yè)被管理員刪除了,或者網(wǎng)站正在維護(hù)而導(dǎo)致網(wǎng)頁(yè)暫時(shí)不可用,或者網(wǎng)絡(luò)擁塞導(dǎo)致服務(wù)器無(wú)法響應(yīng),或者網(wǎng)速比較慢等等。也即,在正常情況下,用戶(hù)是應(yīng)該獲取到這些網(wǎng)絡(luò)資源的。在本發(fā)明實(shí)施例中,在識(shí)別出無(wú)效網(wǎng)絡(luò)資源之后,還可以獲取替代網(wǎng)絡(luò)資源,然后將這些替代網(wǎng)絡(luò)資源提供給用戶(hù),以盡量使得提供的網(wǎng)絡(luò)資源的準(zhǔn)確率提高,從用戶(hù)應(yīng)用的角度來(lái)講,也可以盡可能地滿(mǎn)足用戶(hù)的需求。需要說(shuō)明的是,各種網(wǎng)絡(luò)資源,無(wú)論是網(wǎng)頁(yè)、網(wǎng)頁(yè)中的圖片、待下載文件等等,都具有自己的定位信息,都可以利用該定位信息在網(wǎng)絡(luò)中進(jìn)行定位。定位信息的具體表示方法可能有多種,這里可以不進(jìn)行限定,只要能夠唯一定位到一個(gè)網(wǎng)絡(luò)資源即可。例如,定位信息可以包括目前常用的統(tǒng)一資源標(biāo)識(shí)符(Uniform Resource Identifier,URI)、統(tǒng)一資源定位符(UniformResource Locator,URL)、統(tǒng)一資源名稱(chēng)(Uniform Resource Name,URN)、 統(tǒng)一資源引用符(Uniform Resource Citation,URC),當(dāng)然也可以是將來(lái)可能研究出來(lái)的某種新的定位信息,等等。為方便描述,本發(fā)明實(shí)施例中均以URL為例進(jìn)行介紹。當(dāng)某些網(wǎng)絡(luò)資源無(wú)效時(shí),這些網(wǎng)絡(luò)資源的URL是有效的(如圖1中所示,雖然當(dāng)前網(wǎng)頁(yè)沒(méi)有正常顯示,但是“13”指示的地址欄處依然可以顯示出該網(wǎng)頁(yè)的URL),即瀏覽器能夠獲取到這些無(wú)效網(wǎng)絡(luò)資源的URL,然后就可以利用該URL來(lái)獲取相應(yīng)的替代網(wǎng)絡(luò)資源,并提供給用戶(hù)。其中,利用無(wú)效網(wǎng)絡(luò)資源的URL來(lái)獲取替代網(wǎng)絡(luò)資源的具體方法可以有多種,下面也僅示例性地介紹幾種。方法一、在介紹該方法一之前,首先介紹一下搜索引擎的工作原理。通常,在搜索引擎的搜索入口中輸入查詢(xún)?cè)~時(shí),搜索引擎能夠針對(duì)查詢(xún)?cè)~給出相應(yīng)的搜索結(jié)果,在日常應(yīng)用中,這些搜索結(jié)果通常為多個(gè)網(wǎng)頁(yè)的鏈接。為了達(dá)到該目的,需要預(yù)先盡可能地收集網(wǎng)
10絡(luò)中的所有網(wǎng)頁(yè),并且每找到一張網(wǎng)頁(yè),都要將該網(wǎng)頁(yè)當(dāng)前的內(nèi)容復(fù)制下來(lái),放入自己的網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中,到最后,它就把網(wǎng)絡(luò)中幾乎所有的網(wǎng)頁(yè)都收羅到這個(gè)網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中了,這個(gè)數(shù)據(jù)庫(kù)中包含了所有被復(fù)制下來(lái)的網(wǎng)頁(yè)內(nèi)容,這些被復(fù)制下來(lái)的網(wǎng)頁(yè)內(nèi)容稱(chēng)為網(wǎng)頁(yè)快照。實(shí)際上,搜索引擎的網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中不僅可以包括網(wǎng)頁(yè)快照,還可以包括各種網(wǎng)絡(luò)資源的快照。需要說(shuō)明的是,快照中的內(nèi)容僅僅是對(duì)應(yīng)網(wǎng)頁(yè)被找到時(shí)顯示的內(nèi)容,通常是通過(guò)保存該網(wǎng)頁(yè)當(dāng)時(shí)的HTML代碼,如果此后該網(wǎng)頁(yè)的內(nèi)容發(fā)生了變化,該快照的內(nèi)容也是不變的。因此,即使此后將網(wǎng)頁(yè)中的某網(wǎng)絡(luò)資源被刪除,該網(wǎng)頁(yè)快照中仍然會(huì)存在該被刪除的內(nèi)容。另外,搜索引擎的網(wǎng)頁(yè)數(shù)據(jù)庫(kù)中,除了保存有快照,還保存有網(wǎng)絡(luò)資源的URL及網(wǎng)頁(yè)標(biāo)題、摘要等內(nèi)容,并且各部分內(nèi)容之間具有對(duì)應(yīng)關(guān)系。例如,當(dāng)用戶(hù)輸入查詢(xún)?cè)~之后,搜索引擎給出的結(jié)果中,對(duì)于一個(gè)網(wǎng)頁(yè)而言,可能既包括以網(wǎng)頁(yè)標(biāo)題為鏈接文本的鏈接,又包括以網(wǎng)頁(yè)URL為鏈接文本的鏈接,兩者都可以作為網(wǎng)頁(yè)的入口,即用戶(hù)點(diǎn)擊這兩個(gè)鏈接都可以跳轉(zhuǎn)到該網(wǎng)頁(yè);同時(shí),還包括以“網(wǎng)頁(yè)快照”為鏈接文本的鏈接,該鏈接是該網(wǎng)頁(yè)的快照的入口,即當(dāng)點(diǎn)擊該鏈接時(shí),將跳轉(zhuǎn)到該網(wǎng)頁(yè)的快照頁(yè)面?;谝陨纤?,本發(fā)明實(shí)施例可以利用搜索引擎的快照來(lái)提供無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源。具體實(shí)現(xiàn)時(shí),可以利用通用的搜索引擎或者有合作關(guān)系的搜索引擎來(lái)實(shí)現(xiàn)。其中,在使用通用的搜索引擎時(shí),可以在識(shí)別出無(wú)效網(wǎng)絡(luò)資源后,直接由瀏覽器將該網(wǎng)絡(luò)資源的URL作為關(guān)鍵字在通用搜索引擎中進(jìn)行搜索,在搜索結(jié)果頁(yè)中獲取“網(wǎng)頁(yè)快照”的鏈接,訪問(wèn)該鏈接便可以得到替代內(nèi)容。該方法對(duì)于網(wǎng)頁(yè)被刪除、網(wǎng)頁(yè)暫時(shí)無(wú)法訪問(wèn)或者由于網(wǎng)絡(luò)繁忙網(wǎng)頁(yè)服務(wù)器拒絕響應(yīng)等原因造成的網(wǎng)頁(yè)無(wú)法正常顯示的情況,比較適用。對(duì)于無(wú)效的圖片等網(wǎng)頁(yè)中的部分內(nèi)容,由于通用的搜索引擎通??赡懿惶峁┲苯訉?duì)圖片URL的搜索結(jié)果,因此,在這種方法下,如果無(wú)效的網(wǎng)絡(luò)資源是網(wǎng)頁(yè)中的頁(yè)面元素, 則無(wú)法通過(guò)直接將該資源的URL在搜索引擎中搜索而得到替代內(nèi)容,一種可行的方案可以是將該無(wú)效的網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的URL在搜索引擎中搜索,將相應(yīng)的搜索結(jié)果作為原無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的替代內(nèi)容。在使用有合作關(guān)系的搜索引擎時(shí),可以由合作的搜索引擎服務(wù)器,直接向?yàn)g覽器提供訪問(wèn)快照的入口,瀏覽器將無(wú)效網(wǎng)絡(luò)資源的URL作為關(guān)鍵字,直接訪問(wèn)搜索引擎服務(wù)器提供的快照入口,獲取替代內(nèi)容。具體的實(shí)現(xiàn)方法與使用通用的搜索引擎時(shí)相似,不同之處僅在于,由于與搜索引擎具有合作關(guān)系,因此,可以充分地利用快照資源,即對(duì)于網(wǎng)頁(yè)中存在無(wú)效圖片的情況,可以直接利用該圖片的URL進(jìn)行搜索,獲取相應(yīng)的圖片快照。方法二、由于有的瀏覽器為了提高訪問(wèn)網(wǎng)頁(yè)的速度,提供了“全網(wǎng)加速”功能,為實(shí)現(xiàn)該功能,會(huì)在服務(wù)器中存放網(wǎng)絡(luò)上各個(gè)URL (包括網(wǎng)頁(yè)、圖片等)在過(guò)去時(shí)刻的Cache (緩存)。即只要有用戶(hù)訪問(wèn)過(guò)某URL,就將該URL對(duì)應(yīng)的網(wǎng)頁(yè)中的內(nèi)容緩存在瀏覽器的服務(wù)器中,以便其他用戶(hù)在訪問(wèn)同樣的URL時(shí),可以直接從緩存中取出相應(yīng)的數(shù)據(jù),從而提升訪問(wèn)速度。因此,本發(fā)明實(shí)施例也可以通過(guò)訪問(wèn)該緩存來(lái)獲取替代內(nèi)容。具體實(shí)現(xiàn)時(shí),可以由瀏覽器的服務(wù)器提供訪問(wèn)緩存的接口,這樣,在需要獲取替代內(nèi)容時(shí),就可以直接利用無(wú)效網(wǎng)絡(luò)資源的URL在緩存中進(jìn)行搜索,接下來(lái)的實(shí)現(xiàn)過(guò)程與在搜索引擎中搜索相似。當(dāng)然,由于是服務(wù)器直接將訪問(wèn)緩存的入口提供給瀏覽器,因此,對(duì)于無(wú)效圖片等網(wǎng)絡(luò)資源,也可以直接利用網(wǎng)絡(luò)資源的URL進(jìn)行搜索獲取替代內(nèi)容。方法三、對(duì)于無(wú)效下載文件,可以采用P2P(peer-to-peer,點(diǎn)對(duì)點(diǎn))的方式來(lái)獲取替代網(wǎng)絡(luò)資源。其中,P2P又稱(chēng)為對(duì)等互聯(lián)網(wǎng)絡(luò)技術(shù),是一種用于不同PC(Personal Computer,個(gè)人計(jì)算機(jī))用戶(hù)之間,不經(jīng)過(guò)中繼設(shè)備直接交換數(shù)據(jù)或服務(wù)的技術(shù)。在P2P網(wǎng)絡(luò)中,PC用戶(hù)可以直接連接到其他用戶(hù)的計(jì)算機(jī),而不需要連接到服務(wù)器上再進(jìn)行瀏覽與下載。在本發(fā)明實(shí)施例中,就可以構(gòu)建一個(gè)P2P網(wǎng)絡(luò)(基于公開(kāi)協(xié)議和自有協(xié)議的均可),用戶(hù)每下載一個(gè)文件,就可以在P2P網(wǎng)絡(luò)共享這一文件。這樣,只要有用戶(hù)下載過(guò)某文件,即使該文件此后被刪除,也可以通過(guò)在P2P網(wǎng)絡(luò)中查找這一文件并獲取。例如,當(dāng)瀏覽器識(shí)別出某無(wú)效下載文件時(shí),就可以向P2P網(wǎng)絡(luò)服務(wù)器發(fā)起請(qǐng)求,并向P2P網(wǎng)絡(luò)服務(wù)器提供該無(wú)效下載文件的URL,P2P網(wǎng)絡(luò)服務(wù)器利用該URL查找到曾經(jīng)成功下載過(guò)該文件的用戶(hù),如果找到,就可以向?yàn)g覽器返回響應(yīng)信息,瀏覽器收到該響應(yīng)消息就認(rèn)為找到了替代文件。當(dāng)然,該方法對(duì)于獲取無(wú)效網(wǎng)頁(yè)、網(wǎng)頁(yè)中無(wú)效網(wǎng)絡(luò)資源的替代內(nèi)容都是有效的,具體的,對(duì)于無(wú)效網(wǎng)頁(yè),可以為用戶(hù)提供其他用戶(hù)之前訪問(wèn)時(shí)的網(wǎng)頁(yè)內(nèi)容,對(duì)于網(wǎng)頁(yè)中的無(wú)效頁(yè)面元素,可以為用戶(hù)提供其他用戶(hù)之前訪問(wèn)時(shí)的頁(yè)面元素。需要說(shuō)明的是,通過(guò)P2P方式查找替代網(wǎng)絡(luò)資源時(shí),從某個(gè)或某些用戶(hù)處查找到替代網(wǎng)絡(luò)資源后,替代網(wǎng)絡(luò)資源仍然保存在這些用戶(hù)的本地,通過(guò)P2P網(wǎng)絡(luò),用戶(hù)之間可以直接完成網(wǎng)絡(luò)資源的傳輸,對(duì)此,后續(xù)會(huì)有較為詳細(xì)地介紹。以上介紹了利用無(wú)效網(wǎng)絡(luò)資源的URL來(lái)獲取替代網(wǎng)絡(luò)資源的方法,在實(shí)際應(yīng)用中,也可以利用無(wú)效網(wǎng)絡(luò)資源的其他特征信息來(lái)獲取替代網(wǎng)絡(luò)資源。例如,對(duì)于無(wú)效網(wǎng)頁(yè)或無(wú)效下載文件,還可以利用該無(wú)效網(wǎng)頁(yè)或指該無(wú)效下載文件的Ancho rtext (鏈接文本), 來(lái)獲取替代網(wǎng)絡(luò)資源。其中,鏈接文本是指一條鏈接上顯示出的文字內(nèi)容,例如,在個(gè)人網(wǎng)站上把中央電視臺(tái)(www.cctv.com)作為新聞?lì)l道的鏈接,訪問(wèn)者通過(guò)點(diǎn)擊網(wǎng)站上“新聞?lì)l道”這一鏈接可以進(jìn)入http://WWW. cctv. com網(wǎng)站,那么“新聞?lì)l道”這幾個(gè)字就是中央電視臺(tái)網(wǎng)站首頁(yè)的鏈接文本。如果用戶(hù)是通過(guò)點(diǎn)擊某鏈接來(lái)打開(kāi)某網(wǎng)頁(yè)或者下載某文件,則瀏覽器可以獲取到這些網(wǎng)頁(yè)或文件的鏈接文本,由于鏈接文本通常能作為對(duì)所指向網(wǎng)頁(yè)頁(yè)面內(nèi)容的評(píng)估,因此鏈接文本通常能精確地描述所指向網(wǎng)頁(yè)的頁(yè)面內(nèi)容,因此,也可以作為網(wǎng)絡(luò)資源的一項(xiàng)特征信息。在當(dāng)網(wǎng)絡(luò)資源無(wú)效時(shí),可以利用這些鏈接文本在搜索引擎中獲取與該無(wú)效網(wǎng)絡(luò)資源相近的其他網(wǎng)絡(luò)資源,作為替代網(wǎng)絡(luò)資源提供給用戶(hù)。為了使得提供的替代網(wǎng)絡(luò)資源盡量滿(mǎn)足用戶(hù)的需求,在使用無(wú)效網(wǎng)絡(luò)資源的鏈接文本獲取替代網(wǎng)絡(luò)資源時(shí),還可以利用無(wú)效網(wǎng)絡(luò)資源的Referrer(引用頁(yè))作為輔助信息。其中,Referrer用戶(hù)指示哪個(gè)網(wǎng)頁(yè)添加的該無(wú)效網(wǎng)絡(luò)資源的鏈接。當(dāng)瀏覽器向web 服務(wù)器發(fā)送請(qǐng)求的時(shí)候,一般會(huì)帶上Referrer信息,告訴服務(wù)器該請(qǐng)求是從哪個(gè)頁(yè)面鏈接過(guò)來(lái)的,也就是讓網(wǎng)站知道是從那個(gè)網(wǎng)頁(yè)進(jìn)入其站點(diǎn)的;服務(wù)器籍此可以獲得一些信息用于處理,比如從用戶(hù)A的主頁(yè)上鏈接到用戶(hù)B的主頁(yè),那么,用戶(hù)B主頁(yè)的服務(wù)器就能夠從 HTTPReferrer中統(tǒng)計(jì)出每天有多少用戶(hù)通過(guò)點(diǎn)擊用戶(hù)A主頁(yè)上的鏈接訪問(wèn)用戶(hù)B的主頁(yè)。由于頁(yè)面中增加的鏈接通常都會(huì)和頁(yè)面本身的內(nèi)容有一定的關(guān)系,例如,服裝的行業(yè)網(wǎng)站上會(huì)增加一些同行網(wǎng)站的鏈接或者一些做服裝的知名企業(yè)的鏈接等等,因此,在
12利用無(wú)效網(wǎng)絡(luò)資源的鏈接文本進(jìn)行搜索獲取替代資源的過(guò)程中,可以利用無(wú)效網(wǎng)絡(luò)資源的 Referrer信息對(duì)搜索結(jié)果進(jìn)行過(guò)濾,將與引用頁(yè)的內(nèi)容完全不相關(guān)的搜索結(jié)果過(guò)濾掉,還可以根據(jù)搜索結(jié)果與引用頁(yè)內(nèi)容的相關(guān)程度,從搜索結(jié)果中選擇最優(yōu)的替代網(wǎng)絡(luò)資源,并提供給用戶(hù)。這樣,可以提高替代網(wǎng)絡(luò)資源滿(mǎn)足用戶(hù)需求的概率。當(dāng)然,在其他實(shí)施例中,在查找替代資源時(shí),也可以將無(wú)效網(wǎng)絡(luò)資源的URL、 Anchor, Referrer作為一個(gè)整體去描述用戶(hù)需求,以便進(jìn)一步提高替代網(wǎng)絡(luò)資源滿(mǎn)足用戶(hù)需求的概率。按照上述方法識(shí)別出無(wú)效網(wǎng)絡(luò)資源,并獲取到相應(yīng)的替代內(nèi)容之后,就可以將獲取到的替代內(nèi)容展現(xiàn)給用戶(hù)了。這樣,用戶(hù)能夠看到的將不再僅僅是帶有錯(cuò)誤提示信息的頁(yè)面,或者頁(yè)面中的“紅叉”等,而是可以看到自己想要看到的內(nèi)容。具體的提供替代內(nèi)容方式也可以有多種,例如,對(duì)于無(wú)效網(wǎng)頁(yè)的替代內(nèi)容,由于也是一個(gè)網(wǎng)頁(yè),用戶(hù)的原意是通過(guò)瀏覽器看到該網(wǎng)頁(yè)中的內(nèi)容,因此,需要將替代網(wǎng)頁(yè)展現(xiàn)給用戶(hù)。為此,可以直接在新的窗口或標(biāo)簽頁(yè)中顯示該網(wǎng)頁(yè),或者在原無(wú)效網(wǎng)頁(yè)所在的標(biāo)簽頁(yè)中進(jìn)行跳轉(zhuǎn),即從原無(wú)效網(wǎng)頁(yè)直接跳轉(zhuǎn)到替代的網(wǎng)頁(yè)。對(duì)于網(wǎng)頁(yè)中的無(wú)效頁(yè)面元素,與無(wú)效網(wǎng)頁(yè)類(lèi)似,同意需要將替代網(wǎng)絡(luò)資源展現(xiàn)給用戶(hù)。為此,可以通過(guò)改寫(xiě)無(wú)效頁(yè)面元素所在原網(wǎng)頁(yè)的HTML代碼等方式,將獲取到的替代網(wǎng)絡(luò)資源展現(xiàn)在原網(wǎng)頁(yè)中原無(wú)效頁(yè)面元素的位置,或者,也可以新建一個(gè)窗口或標(biāo)簽頁(yè),在該新建的窗口或標(biāo)簽頁(yè)中僅顯示出該替代網(wǎng)絡(luò)資源也是可行的。對(duì)于無(wú)效下載文件,用戶(hù)的原意是通過(guò)瀏覽器將文件下載到本地,因此,在提供替代文件時(shí),可以直接通過(guò)調(diào)用P2P網(wǎng)絡(luò),由其他用戶(hù)將該文件傳輸?shù)皆撚脩?hù)的本地即可。例如,在通過(guò)P2P網(wǎng)絡(luò)查找到替代文件之后,瀏覽器可以向用戶(hù)顯示提示消息,如“瀏覽器為您找到了替代文件,是否下載到本地? ”,如果用戶(hù)同意下載,還可以提供一個(gè)界面(可以是對(duì)話(huà)框等形式)供用戶(hù)選擇文件的保存路徑,用戶(hù)選擇完畢之后,就可以由其他用戶(hù)通過(guò) P2P的方式將文件傳輸?shù)皆撚脩?hù)的本地。當(dāng)然,也可以不顯示提示消息,直接通過(guò)P2P網(wǎng)絡(luò)將替代文件傳輸?shù)皆撚脩?hù)的本地;或者,也可以在向P2P網(wǎng)絡(luò)服務(wù)器發(fā)起請(qǐng)求之前,提示用戶(hù)將要通過(guò)P2P網(wǎng)絡(luò)獲取該文件,在用戶(hù)同意的情況下,再進(jìn)行后續(xù)的操作。此外,需要說(shuō)明的是,前述幾種替代資源的提供方式,可以根據(jù)實(shí)際需要只選擇其中的任意一種(比如只針對(duì)頁(yè)面元素或者只針對(duì)下載文件提供替代網(wǎng)絡(luò)資源),或者任意幾種組合(比如無(wú)論對(duì)頁(yè)面元素還是下載文件都提供替代網(wǎng)絡(luò)資源)。綜上可見(jiàn),參見(jiàn)圖2,本發(fā)明實(shí)施例提供的提供網(wǎng)絡(luò)資源的方法可以包括以下步驟S201 識(shí)別無(wú)效網(wǎng)絡(luò)資源。具體的識(shí)別方法包括上述介紹的多種具體實(shí)施方式
。S202:利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源。以上可以利用、以便得到替代網(wǎng)絡(luò)資源的各種無(wú)效網(wǎng)絡(luò)資源的信息(比如上述提到的定位信息、鏈接文本、引用頁(yè)信息)都可以視為是無(wú)效網(wǎng)絡(luò)資源的特征信息,在獲知這些無(wú)效網(wǎng)絡(luò)資源的特征信息后,都可以依據(jù)其中的至少一種來(lái)查找無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源。S203 將所述替代網(wǎng)絡(luò)資源提供給用戶(hù)。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以
13通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中, 該程序在執(zhí)行時(shí),包括如下步驟識(shí)別出無(wú)效網(wǎng)絡(luò)資源;利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;將所述替代網(wǎng)絡(luò)資源提供給用戶(hù)。所述的存儲(chǔ)介質(zhì),如R0M/RAM、磁碟、光盤(pán)等。與本發(fā)明實(shí)施例提供的提供網(wǎng)絡(luò)資源的方法相對(duì)應(yīng),本發(fā)明實(shí)施例還提供了一種提供網(wǎng)絡(luò)資源的系統(tǒng),參見(jiàn)圖3,該系統(tǒng)包括識(shí)別單元301,用于識(shí)別出無(wú)效網(wǎng)絡(luò)資源;替代查找單元302,用于利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;替代提供單元303,用于將所述替代網(wǎng)絡(luò)資源提供給用戶(hù)。其中,所述無(wú)效網(wǎng)絡(luò)資源包括無(wú)效網(wǎng)頁(yè),或者網(wǎng)頁(yè)中的無(wú)效頁(yè)面元素,或者無(wú)效下載文件。在識(shí)別無(wú)效網(wǎng)絡(luò)資源時(shí),識(shí)別單元301可以包括第一識(shí)別單元,用于讀取頁(yè)面內(nèi)容,通過(guò)識(shí)別頁(yè)面內(nèi)容中的錯(cuò)誤提示信息,識(shí)別無(wú)效網(wǎng)絡(luò)資源。具體的,所述讀第一識(shí)別單元包括模板比對(duì)子單元,用于讀取頁(yè)面內(nèi)容,將所述頁(yè)面內(nèi)容與預(yù)置的規(guī)則模板進(jìn)行比對(duì),識(shí)別出頁(yè)面內(nèi)容中的錯(cuò)誤提示信息。在其他方法中,識(shí)別單元301也可以包括第二識(shí)別單元,用于根據(jù)用戶(hù)的訪問(wèn)歷史記錄,識(shí)別出無(wú)效網(wǎng)絡(luò)資源。查找替代網(wǎng)絡(luò)資源的方法也可以有多種,具體的,所述特征信息包括所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息,替代查找單元302可以包括第一查找子單元,用于在搜索引擎中搜索所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的快照,將所述快照作為所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;或者第二查找子單元,用于在瀏覽器的服務(wù)器緩存中搜索所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的緩存內(nèi)容,將所述緩存內(nèi)容作為所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;或者第三查找子單元,用于在P2P網(wǎng)絡(luò)中查找其他用戶(hù)之前保存的與所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的網(wǎng)絡(luò)資源,將所述查找到的網(wǎng)絡(luò)資源作為所述替代網(wǎng)絡(luò)資源?;蛘?,特征信息也可以是無(wú)效網(wǎng)絡(luò)資源的鏈接文本,相應(yīng)的,替代查找單元302可以包括第四查找子單元,用于在搜索引擎中搜索所述鏈接文本對(duì)應(yīng)的網(wǎng)絡(luò)資源,根據(jù)所述搜索到的網(wǎng)絡(luò)資源確定所述替代網(wǎng)絡(luò)資源。為了提高替代網(wǎng)絡(luò)資源的準(zhǔn)確性,特征信息還可以包括無(wú)效網(wǎng)絡(luò)資源的引用頁(yè)信息,此時(shí),第四查找子單元具體可以用于利用所述引用頁(yè)信息對(duì)所述搜索到的網(wǎng)絡(luò)資源進(jìn)行過(guò)濾,并確定所述替代網(wǎng)絡(luò)資源。
向用戶(hù)提供替代網(wǎng)絡(luò)資源時(shí)也可以有多種方法,其中,當(dāng)無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí),替代提供單元303可以包括第一提供子單元,用于當(dāng)無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí),利用所述替代網(wǎng)絡(luò)資源替換所述無(wú)效網(wǎng)絡(luò)資源,將所述替代網(wǎng)絡(luò)資源展現(xiàn)在原無(wú)效網(wǎng)絡(luò)資源所在的頁(yè)面中;或者第二提供子單元,用于當(dāng)無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí),在新建的窗口或標(biāo)簽頁(yè)中展現(xiàn)所述替代網(wǎng)絡(luò)資源。當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效下載文件時(shí),替代提供單元303可以包括第三提供子單元,用于當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效下載文件時(shí),將所述替代網(wǎng)絡(luò)資源傳輸給用戶(hù)。此外,需要說(shuō)明的是,前述幾種提供子單元可以根據(jù)實(shí)際需要任意選擇其中一種, 或者任意組合。比如只針對(duì)頁(yè)面元素提供替代網(wǎng)絡(luò)資源,那么就可以只選擇第一提供子單元和/或第二提供子單元;又例如,只針對(duì)下載文件提供替代網(wǎng)絡(luò)資源,那么可以只選擇第三提供子單元;再例如,如果對(duì)頁(yè)面元素和下載文件都提供替代網(wǎng)絡(luò)資源,那么可以只選擇第一提供子單元和第三提供子單元,或者只選擇第二提供子單元和第三提供子單元,或者也可以第一、第二、第三提供子單元都選擇。以上對(duì)本發(fā)明所提供的一種提供網(wǎng)絡(luò)資源的方法及系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會(huì)有改變之處。綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
1權(quán)利要求
1.一種提供網(wǎng)絡(luò)資源的方法,其特征在于,包括 識(shí)別無(wú)效網(wǎng)絡(luò)資源;利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源; 將所述替代網(wǎng)絡(luò)資源提供給用戶(hù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述無(wú)效網(wǎng)絡(luò)資源包括無(wú)效網(wǎng)頁(yè),或者網(wǎng)頁(yè)中的無(wú)效頁(yè)面元素,或者無(wú)效下載文件。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述識(shí)別無(wú)效網(wǎng)絡(luò)資源包括 讀取頁(yè)面內(nèi)容,通過(guò)識(shí)別頁(yè)面內(nèi)容中的錯(cuò)誤提示信息,識(shí)別無(wú)效網(wǎng)絡(luò)資源。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述識(shí)別無(wú)效網(wǎng)絡(luò)資源包括 根據(jù)用戶(hù)的訪問(wèn)歷史記錄,識(shí)別無(wú)效網(wǎng)絡(luò)資源。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述特征信息包括所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息, 查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源包括在搜索引擎中搜索所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的網(wǎng)絡(luò)快照,將所述網(wǎng)絡(luò)快照作為所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;或者在瀏覽器的服務(wù)器緩存中搜索所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的緩存內(nèi)容,將所述緩存內(nèi)容作為所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;或者在點(diǎn)對(duì)點(diǎn)P2P網(wǎng)絡(luò)中查找其他用戶(hù)之前保存的與所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的網(wǎng)絡(luò)資源,將所述查找到的網(wǎng)絡(luò)資源作為所述替代網(wǎng)絡(luò)資源。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述特征信息包括所述無(wú)效網(wǎng)絡(luò)資源的鏈接文本,所述利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源包括在搜索引擎中搜索所述鏈接文本對(duì)應(yīng)的網(wǎng)絡(luò)資源,根據(jù)所述搜索到的網(wǎng)絡(luò)資源確定所述替代網(wǎng)絡(luò)資源。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述特征信息還包括所述無(wú)效網(wǎng)絡(luò)資源的引用頁(yè)信息,所述根據(jù)所述搜索到的網(wǎng)絡(luò)資源確定所述替代網(wǎng)絡(luò)資源包括利用所述引用頁(yè)信息對(duì)所述搜索到的網(wǎng)絡(luò)資源進(jìn)行過(guò)濾,并確定所述替代網(wǎng)絡(luò)資源。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述替代網(wǎng)絡(luò)資源提供給用戶(hù)包括當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí),利用所述替代網(wǎng)絡(luò)資源替換所述無(wú)效網(wǎng)絡(luò)資源,將所述替代網(wǎng)絡(luò)資源展現(xiàn)在原無(wú)效網(wǎng)絡(luò)資源所在的頁(yè)面中; 和/或,當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí),在新建的窗口或標(biāo)簽頁(yè)中展現(xiàn)所述替代網(wǎng)絡(luò)資源; 和/或,當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效下載文件時(shí),將所述替代網(wǎng)絡(luò)資源傳輸給用戶(hù)。
10.一種提供網(wǎng)絡(luò)資源的系統(tǒng),其特征在于,包括識(shí)別單元,用于識(shí)別出無(wú)效網(wǎng)絡(luò)資源;替代查找單元,用于利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;替代提供單元,用于將所述替代網(wǎng)絡(luò)資源提供給用戶(hù)。
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述無(wú)效網(wǎng)絡(luò)資源包括無(wú)效網(wǎng)頁(yè),或者網(wǎng)頁(yè)中的無(wú)效頁(yè)面元素,或者無(wú)效下載文件。
12.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述識(shí)別單元包括第一識(shí)別單元,用于讀取頁(yè)面內(nèi)容,通過(guò)識(shí)別頁(yè)面內(nèi)容中的錯(cuò)誤提示信息,識(shí)別無(wú)效網(wǎng)絡(luò)資源。
13.根據(jù)權(quán)利要求12所述的系統(tǒng),其特征在于,所述讀第一識(shí)別單元包括模板比對(duì)子單元,用于讀取頁(yè)面內(nèi)容,將所述頁(yè)面內(nèi)容與預(yù)置的規(guī)則模板進(jìn)行比對(duì),識(shí)別出頁(yè)面內(nèi)容中的錯(cuò)誤提示信息。
14.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述識(shí)別單元包括第二識(shí)別單元,用于根據(jù)用戶(hù)的訪問(wèn)歷史記錄,識(shí)別出無(wú)效網(wǎng)絡(luò)資源。
15.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于所述替代查找單元,具體用于利用所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源。
16.根據(jù)權(quán)利要求15所述的系統(tǒng),其特征在于,所述替代查找單元包括第一查找子單元,用于在搜索引擎中搜索所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的快照,將所述快照作為所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;或者第二查找子單元,用于在瀏覽器的服務(wù)器緩存中搜索所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的緩存內(nèi)容,將所述緩存內(nèi)容作為所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;或者第三查找子單元,用于在點(diǎn)對(duì)點(diǎn)P2P網(wǎng)絡(luò)中查找其他用戶(hù)之前保存的與所述無(wú)效網(wǎng)絡(luò)資源的定位信息或所述無(wú)效網(wǎng)絡(luò)資源所在網(wǎng)頁(yè)的定位信息對(duì)應(yīng)的網(wǎng)絡(luò)資源,將所述查找到的網(wǎng)絡(luò)資源作為所述替代網(wǎng)絡(luò)資源。
17.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述特征信息包括所述無(wú)效網(wǎng)絡(luò)資源的鏈接文本,所述替代查找單元包括第四查找子單元,用于在搜索引擎中搜索所述鏈接文本對(duì)應(yīng)的網(wǎng)絡(luò)資源,根據(jù)所述搜索到的網(wǎng)絡(luò)資源確定所述替代網(wǎng)絡(luò)資源。
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其特征在于,所述特征信息還包括所述無(wú)效網(wǎng)絡(luò)資源的引用頁(yè)信息,所述第四查找子單元具體用于利用所述引用頁(yè)信息對(duì)所述搜索到的網(wǎng)絡(luò)資源進(jìn)行過(guò)濾,并確定所述替代網(wǎng)絡(luò)資源。
19.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述替代提供單元包括第一提供子單元,用于當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí),利用所述替代網(wǎng)絡(luò)資源替換所述無(wú)效網(wǎng)絡(luò)資源,將所述替代網(wǎng)絡(luò)資源展現(xiàn)在原無(wú)效網(wǎng)絡(luò)資源所在的頁(yè)面中;和/或,第二提供子單元,用于當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效網(wǎng)頁(yè)或網(wǎng)頁(yè)中的頁(yè)面元素時(shí),在新建的窗口或標(biāo)簽頁(yè)中展現(xiàn)所述替代網(wǎng)絡(luò)資源; 和/或,第三提供子單元,用于當(dāng)所述無(wú)效網(wǎng)絡(luò)資源為無(wú)效下載文件時(shí),將所述替代網(wǎng)絡(luò)資源傳輸給用戶(hù)。
全文摘要
本發(fā)明公開(kāi)了一種提供網(wǎng)絡(luò)資源的方法及系統(tǒng),其中,所述方法包括識(shí)別出無(wú)效網(wǎng)絡(luò)資源;利用所述無(wú)效網(wǎng)絡(luò)資源的特征信息,查找所述無(wú)效網(wǎng)絡(luò)資源的替代網(wǎng)絡(luò)資源;將所述替代網(wǎng)絡(luò)資源提供給用戶(hù)。通過(guò)本發(fā)明,能夠提高提供網(wǎng)絡(luò)資源的成功率。
文檔編號(hào)G06F17/30GK102200980SQ20101013337
公開(kāi)日2011年9月28日 申請(qǐng)日期2010年3月25日 優(yōu)先權(quán)日2010年3月25日
發(fā)明者蔣又新 申請(qǐng)人:北京搜狗科技發(fā)展有限公司