用于處理網(wǎng)頁數(shù)據(jù)的方法、裝置和系統(tǒng)的制作方法
【專利摘要】本公開內(nèi)容涉及用于處理網(wǎng)頁數(shù)據(jù)的方法、裝置和系統(tǒng)。該方法包括:響應(yīng)于一網(wǎng)頁被打開,向網(wǎng)絡(luò)側(cè)設(shè)備發(fā)送包含在所述網(wǎng)頁中的鏈接;從所述網(wǎng)絡(luò)側(cè)設(shè)備接收組標(biāo)識(shí),所述組標(biāo)識(shí)是由所述網(wǎng)絡(luò)側(cè)設(shè)備根據(jù)所述鏈接確定的、用于指示所述鏈接所屬的分組;確定是否有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組;以及響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。借助于網(wǎng)絡(luò)側(cè)設(shè)備確定的組標(biāo)識(shí)和用戶終端本地的鏈接,能夠提前通知用戶指向重復(fù)網(wǎng)頁內(nèi)容的鏈接,從而有效地避免用戶重復(fù)瀏覽相同或相近的內(nèi)容。因此,能夠節(jié)省系統(tǒng)資源,并提高用戶體驗(yàn)。
【專利說明】用于處理網(wǎng)頁數(shù)據(jù)的方法、裝置和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息處理領(lǐng)域,并且更具體地,涉及信息處理領(lǐng)域中用于處理網(wǎng)頁數(shù)據(jù)的方法、裝置和系統(tǒng)。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)技術(shù)的發(fā)展和網(wǎng)絡(luò)資源的豐富,越來越多的用戶選擇通過網(wǎng)絡(luò)來獲取信息。然而,不同的鏈接可能指向具有相同或相近內(nèi)容的網(wǎng)頁,這使得用戶可能重復(fù)瀏覽基本上相同的信息,從而浪費(fèi)用戶的時(shí)間并影響用戶的體驗(yàn)。
[0003]例如,在A網(wǎng)頁上可能存在多個(gè)涉及新聞的鏈接,在B網(wǎng)頁上可能存在多個(gè)涉及新聞的鏈接。如果A網(wǎng)頁上的某鏈接與B網(wǎng)頁上的某鏈接指向的網(wǎng)頁內(nèi)容相同或相近,但兩者題目不同,那么,在用戶已瀏覽了 A網(wǎng)頁上的該鏈接之后,由于用戶很難根據(jù)鏈接來提前判斷兩個(gè)鏈接指向的內(nèi)容是否相似,因此當(dāng)用戶再次點(diǎn)開B網(wǎng)頁上的該鏈接時(shí),用戶將發(fā)現(xiàn)B網(wǎng)頁上的該鏈接指向的內(nèi)容已經(jīng)被瀏覽過。這樣的重復(fù)內(nèi)容將浪費(fèi)用戶的時(shí)間并影響用戶的體驗(yàn)。而且,諸如計(jì)算機(jī)、移動(dòng)設(shè)備之類的電子設(shè)備對(duì)于重復(fù)內(nèi)容的多次顯示,不僅效率低下,而且將浪費(fèi)無需為多次顯示重復(fù)內(nèi)容而消耗的系統(tǒng)資源。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供了用于處理網(wǎng)頁數(shù)據(jù)的方法、裝置和系統(tǒng),能夠有效地避免網(wǎng)絡(luò)重復(fù)處理用戶對(duì)相同或相近的網(wǎng)頁內(nèi)容的點(diǎn)擊,從而節(jié)省系統(tǒng)資源,并提高網(wǎng)絡(luò)處理效率和運(yùn)行速度。
[0005]根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于處理網(wǎng)頁數(shù)據(jù)的方法,包括:響應(yīng)于一網(wǎng)頁被打開,向網(wǎng)絡(luò)側(cè)設(shè)備發(fā)送包含在所述網(wǎng)頁中的鏈接;從所述網(wǎng)絡(luò)側(cè)設(shè)備接收組標(biāo)識(shí),所述組標(biāo)識(shí)是由所述網(wǎng)絡(luò)側(cè)設(shè)備根據(jù)所述鏈接確定的、用于指示所述鏈接所屬的分組;確定是否有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組;以及響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
[0006]根據(jù)本發(fā)明的另一方面,提供了一種用于處理網(wǎng)頁數(shù)據(jù)的方法,包括:接收來自用戶終端的包含在網(wǎng)頁中的鏈接;以及響應(yīng)于確定所述鏈接屬于至少一個(gè)預(yù)定分組中的一個(gè)預(yù)定分組,將該預(yù)定分組的組標(biāo)識(shí)發(fā)送給所述用戶終端,以使所述用戶終端響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
[0007]根據(jù)本發(fā)明的再一方面,提供了一種用于處理網(wǎng)頁數(shù)據(jù)的裝置,包括:發(fā)送部件,被配置為響應(yīng)于一網(wǎng)頁被打開,向網(wǎng)絡(luò)側(cè)設(shè)備發(fā)送包含在所述網(wǎng)頁中的鏈接;接收部件,被配置為從所述網(wǎng)絡(luò)側(cè)設(shè)備接收組標(biāo)識(shí),所述組標(biāo)識(shí)是由所述網(wǎng)絡(luò)側(cè)設(shè)備根據(jù)所述鏈接確定的、用于指示所述鏈接所屬的分組;確定部件,被配置為確定是否有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組;以及提示部件,被配置為響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。[0008]根據(jù)本發(fā)明的又一方面,提供了一種用于處理網(wǎng)頁數(shù)據(jù)的裝置,包括:接收部件,被配置為接收來自用戶終端的包含在網(wǎng)頁中的鏈接;以及發(fā)送部件,被配置為響應(yīng)于確定所述鏈接屬于至少一個(gè)預(yù)定分組中的一個(gè)預(yù)定分組,將該預(yù)定分組的組標(biāo)識(shí)發(fā)送給所述用戶終端,以使所述用戶終端響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
[0009]根據(jù)本發(fā)明的又一方面,提供了一種用于處理網(wǎng)頁數(shù)據(jù)的系統(tǒng),包括用戶終端和網(wǎng)絡(luò)側(cè)設(shè)備。所述用戶終端被配置為響應(yīng)于一網(wǎng)頁被打開,向所述網(wǎng)絡(luò)側(cè)設(shè)備發(fā)送包含在所述網(wǎng)頁中的鏈接;從所述網(wǎng)絡(luò)側(cè)設(shè)備接收組標(biāo)識(shí),所述組標(biāo)識(shí)是由所述網(wǎng)絡(luò)側(cè)設(shè)備根據(jù)所述鏈接確定的、用于指示所述鏈接所屬的分組;確定是否有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組;響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。所述網(wǎng)絡(luò)側(cè)設(shè)備被配置為接收來自所述用戶終端的包含在所述網(wǎng)頁中的所述鏈接;響應(yīng)于確定所述鏈接屬于至少一個(gè)預(yù)定分組中的一個(gè)預(yù)定分組,將該預(yù)定分組的組標(biāo)識(shí)發(fā)送給所述用戶終端。
[0010]根據(jù)上述技術(shù)方案,通過利用被打開網(wǎng)頁中所包含的鏈接及其所屬分組的組標(biāo)識(shí),可以確定是否有已瀏覽鏈接也屬于該分組,并在已瀏覽鏈接屬于該分組的情況下向用戶提示該鏈接指向的網(wǎng)頁內(nèi)容已被瀏覽過。這樣,借助于網(wǎng)絡(luò)側(cè)設(shè)備確定的組標(biāo)識(shí)和用戶終端本地的已瀏覽鏈接,能夠提前通知用戶指向重復(fù)網(wǎng)頁內(nèi)容的鏈接,從而有效地避免網(wǎng)絡(luò)重復(fù)處理用戶對(duì)相同或相近的內(nèi)容的點(diǎn)擊。因此,能夠節(jié)省系統(tǒng)資源,并提高網(wǎng)絡(luò)處理速度,提升網(wǎng)絡(luò)處理能力。
【專利附圖】
【附圖說明】
[0011]通過結(jié)合附圖對(duì)本公開示例性實(shí)施方式進(jìn)行更詳細(xì)的描述,本公開的上述以及其它目的、特征和優(yōu)勢(shì)將變得更加明顯,其中,在本公開示例性實(shí)施方式中,相同的參考標(biāo)號(hào)通常代表相同部件。
[0012]圖1表示根據(jù)本發(fā)明一實(shí)施例的云計(jì)算節(jié)點(diǎn);
[0013]圖2表示根據(jù)本發(fā)明一實(shí)施例的云計(jì)算環(huán)境;
[0014]圖3表示根據(jù)本發(fā)明一實(shí)施例的抽象模型層;
[0015]圖4示出了根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的方法的流程圖;
[0016]圖5示出了根據(jù)本發(fā)明實(shí)施例的指向具有相同或相近網(wǎng)頁內(nèi)容的鏈接的例子。
[0017]圖6示出了根據(jù)本發(fā)明實(shí)施例的用于確定已瀏覽鏈接屬于組標(biāo)識(shí)指示的分組的方法的流程圖;
[0018]圖7示出了根據(jù)本發(fā)明實(shí)施例的用于生成字符串編碼和組標(biāo)識(shí)的計(jì)算結(jié)構(gòu)的例子的不意圖;
[0019]圖8示出了根據(jù)本發(fā)明實(shí)施例的存儲(chǔ)已瀏覽鏈接的方式的例子。
[0020]圖9示出了根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的另一方法的流程圖;
[0021]圖10示出了根據(jù)本發(fā)明實(shí)施例的用于確定分組及其對(duì)應(yīng)的組標(biāo)識(shí)的方法的流程圖;
[0022]圖11示出了根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的再一方法的流程圖;
[0023]圖12示出了根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的裝置的結(jié)構(gòu)框圖;[0024]圖13示出了根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的另一裝置的結(jié)構(gòu)框圖;
[0025]圖14示出了根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的再一裝置的結(jié)構(gòu)框圖;
[0026]圖15示出了根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的又一裝置的結(jié)構(gòu)框圖;
[0027]圖16示出了根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的系統(tǒng)的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0028]下面將參照附圖更詳細(xì)地描述本公開的優(yōu)選實(shí)施方式。雖然附圖中顯示了本公開的優(yōu)選實(shí)施方式,然而應(yīng)該理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施方式所限制。相反,提供這些實(shí)施方式是為了使本公開更加透徹和完整,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0029]首先應(yīng)當(dāng)理解,盡管本公開包括關(guān)于云計(jì)算的詳細(xì)描述,但其中記載的技術(shù)方案的實(shí)現(xiàn)卻不限于云計(jì)算環(huán)境,而是能夠結(jié)合現(xiàn)在已知或以后開發(fā)的任何其它類型的計(jì)算環(huán)境而實(shí)現(xiàn)。
[0030]云計(jì)算是一種服務(wù)交付模式,用于對(duì)共享的可配置計(jì)算資源池進(jìn)行方便、按需的網(wǎng)絡(luò)訪問??膳渲糜?jì)算資源是能夠以最小的管理成本或與服務(wù)提供者進(jìn)行最少的交互就能快速部署和釋放的資源,例如可以是網(wǎng)絡(luò)、網(wǎng)絡(luò)帶寬、服務(wù)器、處理、內(nèi)存、存儲(chǔ)、應(yīng)用、虛擬機(jī)和服務(wù)。這種云模式可以包括至少五個(gè)特征、至少三個(gè)服務(wù)模型和至少四個(gè)部署模型。
[0031]特征包括:
[0032]按需自助式服務(wù):云的消費(fèi)者在無需與服務(wù)提供者進(jìn)行人為交互的情況下能夠單方面自動(dòng)地按需部署諸如服務(wù)器時(shí)間和網(wǎng)絡(luò)存儲(chǔ)等的計(jì)算能力。
[0033]廣泛的網(wǎng)絡(luò)接入:計(jì)算能力可以通過標(biāo)準(zhǔn)機(jī)制在網(wǎng)絡(luò)上獲取,這種標(biāo)準(zhǔn)機(jī)制促進(jìn)了通過不同種類的瘦客戶機(jī)平臺(tái)或厚客戶機(jī)平臺(tái)(例如移動(dòng)電話、膝上型電腦、個(gè)人數(shù)字助理PDA)對(duì)云的使用。
[0034]資源池:提供者的計(jì)算資源被歸入資源池并通過多租戶(mult1-tenant)模式服務(wù)于多重消費(fèi)者,其中按需將不同的實(shí)體資源和虛擬資源動(dòng)態(tài)地分配和再分配。一般情況下,消費(fèi)者不能控制或甚至并不知曉所提供的資源的確切位置,但可以在較高抽象程度上指定位置(例如國家、州或數(shù)據(jù)中心),因此具有位置無關(guān)性。
[0035]迅速彈性:能夠迅速、有彈性地(有時(shí)是自動(dòng)地)部署計(jì)算能力,以實(shí)現(xiàn)快速擴(kuò)展,并且能迅速釋放來快速縮小。在消費(fèi)者看來,用于部署的可用計(jì)算能力往往顯得是無限的,并能在任意時(shí)候都能獲取任意數(shù)量的計(jì)算能力。
[0036]可測(cè)量的服務(wù):云系統(tǒng)通過利用適于服務(wù)類型(例如存儲(chǔ)、處理、帶寬和活躍用戶帳號(hào))的某種抽象程度的計(jì)量能力,自動(dòng)地控制和優(yōu)化資源效用??梢员O(jiān)測(cè)、控制和報(bào)告資源使用情況,為服務(wù)提供者和消費(fèi)者雙方提供透明度。
[0037]服務(wù)模型如下:
[0038]軟件即服務(wù)(SaaS):向消費(fèi)者提供的能力是使用提供者在云基礎(chǔ)架構(gòu)上運(yùn)行的應(yīng)用。可以通過諸如網(wǎng)絡(luò)瀏覽器的瘦客戶機(jī)接口(例如基于網(wǎng)絡(luò)的電子郵件)從各種客戶機(jī)設(shè)備訪問應(yīng)用。除了有限的特定于用戶的應(yīng)用配置設(shè)置外,消費(fèi)者既不管理也不控制包括網(wǎng)絡(luò)、服務(wù)器、操作系統(tǒng)、存儲(chǔ)、乃至單個(gè)應(yīng)用能力等的底層云基礎(chǔ)架構(gòu)。
[0039]平臺(tái)即服務(wù)(PaaS):向消費(fèi)者提供的能力是在云基礎(chǔ)架構(gòu)上部署消費(fèi)者創(chuàng)建或獲得的應(yīng)用,這些應(yīng)用利用提供者支持的程序設(shè)計(jì)語言和工具創(chuàng)建。消費(fèi)者既不管理也不控制包括網(wǎng)絡(luò)、服務(wù)器、操作系統(tǒng)或存儲(chǔ)的底層云基礎(chǔ)架構(gòu),但對(duì)其部署的應(yīng)用具有控制權(quán),對(duì)應(yīng)用托管環(huán)境配置可能也具有控制權(quán)。
[0040]基礎(chǔ)架構(gòu)即服務(wù)(IaaS):向消費(fèi)者提供的能力是消費(fèi)者能夠在其中部署并運(yùn)行包括操作系統(tǒng)和應(yīng)用的任意軟件的處理、存儲(chǔ)、網(wǎng)絡(luò)和其他基礎(chǔ)計(jì)算資源。消費(fèi)者既不管理也不控制底層的云基礎(chǔ)架構(gòu),但是對(duì)操作系統(tǒng)、存儲(chǔ)和其部署的應(yīng)用具有控制權(quán),對(duì)選擇的網(wǎng)絡(luò)組件(例如主機(jī)防火墻)可能具有有限的控制權(quán)。
[0041]部署模型如下:
[0042]私有云:云基礎(chǔ)架構(gòu)單獨(dú)為某個(gè)組織運(yùn)行。云基礎(chǔ)架構(gòu)可以由該組織或第三方管理并且可以存在于該組織內(nèi)部或外部。
[0043]共同體云:云基礎(chǔ)架構(gòu)被若干組織共享并支持有共同利害關(guān)系(例如任務(wù)使命、安全要求、政策和合規(guī)考慮)的特定共同體。共同體云可以由共同體內(nèi)的多個(gè)組織或第三方管理并且可以存在于該共同體內(nèi)部或外部。
[0044]公共云:云基礎(chǔ)架構(gòu)向公眾或大型產(chǎn)業(yè)群提供并由出售云服務(wù)的組織擁有。
[0045]混合云:云基礎(chǔ)架構(gòu)由兩個(gè)或更多部署模型的云(私有云、共同體云或公共云)組成,這些云依然是獨(dú)特的實(shí)體,但是通過使數(shù)據(jù)和應(yīng)用能夠移植的標(biāo)準(zhǔn)化技術(shù)或私有技術(shù)(例如用于云之間的負(fù)載平衡的云突發(fā)流量分擔(dān)技術(shù))綁定在一起。
[0046]云計(jì)算環(huán)境是面向服務(wù)的,特點(diǎn)集中在無狀態(tài)性、低耦合性、模塊性和語意的互操作性。云計(jì)算的核心是包含互連節(jié)點(diǎn)網(wǎng)絡(luò)的基礎(chǔ)架構(gòu)。
[0047]現(xiàn)在參考圖1,其中顯示了云計(jì)算節(jié)點(diǎn)的一個(gè)例子。圖1顯示的云計(jì)算節(jié)點(diǎn)10僅僅是適合的云計(jì)算節(jié)點(diǎn)的一個(gè)示例,不應(yīng)對(duì)本發(fā)明實(shí)施例的功能和使用范圍帶來任何限制??傊?,云計(jì)算節(jié)點(diǎn)10能夠被用來實(shí)現(xiàn)和/或執(zhí)行以上所述的任何功能。
[0048]云計(jì)算節(jié)點(diǎn)10具有計(jì)算機(jī)系統(tǒng)/服務(wù)器12,其可與眾多其它通用或?qū)S糜?jì)算系統(tǒng)環(huán)境或配置一起操作。眾所周知,適于與計(jì)算機(jī)系統(tǒng)/服務(wù)器12 —起操作的計(jì)算系統(tǒng)、環(huán)境和/或配置的例子包括但不限于:個(gè)人計(jì)算機(jī)系統(tǒng)、服務(wù)器計(jì)算機(jī)系統(tǒng)、瘦客戶機(jī)、厚客戶機(jī)、手持或膝上設(shè)備、基于微處理器的系統(tǒng)、機(jī)頂盒、可編程消費(fèi)電子產(chǎn)品、網(wǎng)絡(luò)個(gè)人電腦、小型計(jì)算機(jī)系統(tǒng)、大型計(jì)算機(jī)系統(tǒng)和包括上述任意系統(tǒng)的分布式云計(jì)算技術(shù)環(huán)境,等
坐寸ο
[0049]計(jì)算機(jī)系統(tǒng)/服務(wù)器12可以在由計(jì)算機(jī)系統(tǒng)執(zhí)行的計(jì)算機(jī)系統(tǒng)可執(zhí)行指令(諸如程序模塊)的一般語境下描述。通常,程序模塊可以包括執(zhí)行特定的任務(wù)或者實(shí)現(xiàn)特定的抽象數(shù)據(jù)類型的例程、程序、目標(biāo)程序、組件、邏輯、數(shù)據(jù)結(jié)構(gòu)等。計(jì)算機(jī)系統(tǒng)/服務(wù)器12可以在通過通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備執(zhí)行任務(wù)的分布式云計(jì)算環(huán)境中實(shí)施。在分布式云計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備的本地或遠(yuǎn)程計(jì)算系統(tǒng)存儲(chǔ)介質(zhì)上。
[0050]如圖1所示,云計(jì)算節(jié)點(diǎn)10中的計(jì)算機(jī)系統(tǒng)/服務(wù)器12以通用計(jì)算設(shè)備的形式表現(xiàn)。計(jì)算機(jī)系統(tǒng)/服務(wù)器12的組件可以包括但不限于:一個(gè)或者多個(gè)處理器或者處理單元16,系統(tǒng)存儲(chǔ)器28,連接不同系統(tǒng)組件(包括系統(tǒng)存儲(chǔ)器28和處理單元16)的總線18。
[0051]總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)器總線或者存儲(chǔ)器控制器,外圍總線,圖形加速端口,處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。舉例來說,這些體系結(jié)構(gòu)包括但不限于工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ISA)總線,微通道體系結(jié)構(gòu)(MAC)總線,增強(qiáng)型ISA總線、視頻電子標(biāo)準(zhǔn)協(xié)會(huì)(VESA)局域總線以及外圍組件互連(PCI)總線。
[0052]計(jì)算機(jī)系統(tǒng)/服務(wù)器12典型地包括多種計(jì)算機(jī)系統(tǒng)可讀介質(zhì)。這些介質(zhì)可以是能夠被計(jì)算機(jī)系統(tǒng)/服務(wù)器12訪問的任意可獲得的介質(zhì),包括易失性和非易失性介質(zhì),可移動(dòng)的和不可移動(dòng)的介質(zhì)。
[0053]系統(tǒng)存儲(chǔ)器28可以包括易失性存儲(chǔ)器形式的計(jì)算機(jī)系統(tǒng)可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)器(RAM)30和/或高速緩存存儲(chǔ)器32。計(jì)算機(jī)系統(tǒng)/服務(wù)器12可以進(jìn)一步包括其它可移動(dòng)/不可移動(dòng)的、易失性/非易失性計(jì)算機(jī)系統(tǒng)存儲(chǔ)介質(zhì)。僅作為舉例,存儲(chǔ)系統(tǒng)34可以用于讀寫不可移動(dòng)的、非易失性磁介質(zhì)(圖1未顯示,通常稱為“硬盤驅(qū)動(dòng)器”)。盡管圖1中未示出,可以提供用于對(duì)可移動(dòng)非易失性磁盤(例如“軟盤”)讀寫的磁盤驅(qū)動(dòng)器,以及對(duì)可移動(dòng)非易失性光盤(例如⑶-ROM,DVD-ROM或者其它光介質(zhì))讀寫的光盤驅(qū)動(dòng)器。在這些情況下,每個(gè)驅(qū)動(dòng)器可以通過一個(gè)或者多個(gè)數(shù)據(jù)介質(zhì)接口與總線18相連。存儲(chǔ)器28可以包括至少一個(gè)程序產(chǎn)品,該程序產(chǎn)品具有一組(例如至少一個(gè))程序模塊,這些程序模塊被配置以執(zhí)行本發(fā)明各實(shí)施例的功能。
[0054]具有一組(至少一個(gè))程序模塊42的程序/實(shí)用工具40,可以存儲(chǔ)在存儲(chǔ)器28中,這樣的程序模塊42包括但不限于操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。程序模塊42通常執(zhí)行本發(fā)明所描述的實(shí)施例中的功能和/或方法。
[0055]計(jì)算機(jī)系統(tǒng)/服務(wù)器12也可以與一個(gè)或多個(gè)外部設(shè)備14 (例如鍵盤、指向設(shè)備、顯示器24等)通信,還可與一個(gè)或者多個(gè)使得用戶能與該計(jì)算機(jī)系統(tǒng)/服務(wù)器12交互的設(shè)備通信,和/或與使得該計(jì)算機(jī)系統(tǒng)/服務(wù)器12能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如網(wǎng)卡,調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(I/O)接口 22進(jìn)行。并且,計(jì)算機(jī)系統(tǒng)/服務(wù)器12還可以通過網(wǎng)絡(luò)適配器20與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(LAN),廣域網(wǎng)(WAN)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器20通過總線18與計(jì)算機(jī)系統(tǒng)/服務(wù)器12的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,其它硬件和/或軟件模塊可以與計(jì)算機(jī)系統(tǒng)/服務(wù)器12—起操作,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤驅(qū)動(dòng)陣列、RAID系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)
坐寸ο
[0056]現(xiàn)在參考圖2,其中顯示了示例性的云計(jì)算環(huán)境50。如圖所示,云計(jì)算環(huán)境50包括云計(jì)算消費(fèi)者使用的本地計(jì)算設(shè)備可以與其相通信的一個(gè)或者多個(gè)云計(jì)算節(jié)點(diǎn)10,本地計(jì)算設(shè)備例如可以是個(gè)人數(shù)字助理(PDA)或移動(dòng)電話54A,臺(tái)式電腦54B、筆記本電腦54C和/或汽車計(jì)算機(jī)系統(tǒng)54N。云計(jì)算節(jié)點(diǎn)10之間可以相互通信。可以在包括但不限于如上所述的私有云、共同體云、公共云或混合云或者它們的組合的一個(gè)或者多個(gè)網(wǎng)絡(luò)中將云計(jì)算節(jié)點(diǎn)10進(jìn)行物理或虛擬分組(圖中未顯示)。這樣,云的消費(fèi)者無需在本地計(jì)算設(shè)備上維護(hù)資源就能請(qǐng)求云計(jì)算環(huán)境50提供的基礎(chǔ)架構(gòu)即服務(wù)(IaaS)、平臺(tái)即服務(wù)(PaaS)和/或軟件即服務(wù)(SaaS)。應(yīng)當(dāng)理解,圖2顯示的各類計(jì)算設(shè)備54A-N僅僅是示意性的,云計(jì)算節(jié)點(diǎn)10以及云計(jì)算環(huán)境50可以與任意類型網(wǎng)絡(luò)上和/或網(wǎng)絡(luò)可尋址連接的任意類型的計(jì)算設(shè)備(例如使用網(wǎng)絡(luò)瀏覽器)通信。
[0057]現(xiàn)在參考圖3,其中顯示了云計(jì)算環(huán)境50 (圖2)提供的一組功能抽象層。首先應(yīng)當(dāng)理解,圖3所示的組件、層以及功能都僅僅是示意性的,本發(fā)明的實(shí)施例不限于此。如圖3所示,提供下列層和對(duì)應(yīng)功能:
[0058]硬件和軟件層60包括硬件和軟件組件。硬件組件的例子包括:主機(jī),例如IBM?zSeries ?系統(tǒng);基于RISC(精簡(jiǎn)指令集計(jì)算機(jī))體系結(jié)構(gòu)的服務(wù)器,例如IBM pSeries?系統(tǒng);IBM xSeries?系統(tǒng);IBM BladeCenter ?系統(tǒng);存儲(chǔ)設(shè)備;網(wǎng)絡(luò)和網(wǎng)絡(luò)組件。軟件組件的例子包括:網(wǎng)絡(luò)應(yīng)用服務(wù)器軟件,例如IBM WebSphere⑩應(yīng)用服務(wù)器軟件;數(shù)據(jù)庫軟件,例如 IBM DB2 ?數(shù)據(jù)庫軟件。(IBM, zSeries, pSeries, xSeries, BladeCenter, WebSphere 以及DB2是國際商業(yè)機(jī)器公司在全世界各地的注冊(cè)商標(biāo))。
[0059]虛擬層62提供一個(gè)抽象層,該層可以提供下列虛擬實(shí)體的例子:虛擬服務(wù)器、虛擬存儲(chǔ)、虛擬網(wǎng)絡(luò)(包括虛擬私有網(wǎng)絡(luò))、虛擬應(yīng)用和操作系統(tǒng),以及虛擬客戶端。
[0060]在一個(gè)示例中,管理層64可以提供下述功能:資源供應(yīng)功能:提供用于在云計(jì)算環(huán)境中執(zhí)行任務(wù)的計(jì)算資源和其它資源的動(dòng)態(tài)獲??;計(jì)量和定價(jià)功能:在云計(jì)算環(huán)境內(nèi)對(duì)資源的使用進(jìn)行成本跟蹤,并為此提供帳單和發(fā)票。在一個(gè)例子中,該資源可以包括應(yīng)用軟件許可。安全功能:為云的消費(fèi)者和任務(wù)提供身份認(rèn)證,為數(shù)據(jù)和其它資源提供保護(hù)。用戶門戶功能:為消費(fèi)者和系統(tǒng)管理員提供對(duì)云計(jì)算環(huán)境的訪問。服務(wù)水平管理功能:提供云計(jì)算資源的分配和管理,以滿足必需的服務(wù)水平。服務(wù)水平協(xié)議(SLA)計(jì)劃和履行功能--為根據(jù)SLA預(yù)測(cè)的對(duì)云計(jì)算資源未來需求提供預(yù)先安排和供應(yīng)。
[0061]工作負(fù)載層66提供云計(jì)算環(huán)境可能實(shí)現(xiàn)的功能的示例。在該層中,可提供的工作負(fù)載或功能的示例包括:地圖繪制與導(dǎo)航;軟件開發(fā)及生命周期管理;虛擬教室的教學(xué)提供;數(shù)據(jù)分析處理;交易處理;以及網(wǎng)頁內(nèi)容重復(fù)提示。 [0062]首先參照?qǐng)D4,描述根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的方法200的流程圖。
[0063]如圖4所示,在步驟S210中,響應(yīng)于一網(wǎng)頁被打開,向網(wǎng)絡(luò)側(cè)設(shè)備發(fā)送包含在該網(wǎng)頁中的鏈接;在步驟S215中,從網(wǎng)絡(luò)側(cè)設(shè)備接收組標(biāo)識(shí),所述組標(biāo)識(shí)是由網(wǎng)絡(luò)側(cè)設(shè)備根據(jù)所述鏈接確定的、用于指示所述鏈接所屬的分組;在步驟S220中,確定是否有已瀏覽鏈接屬于該組標(biāo)識(shí)指示的分組;以及在步驟S230中,響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
[0064]具體而言,例如,方法200可以由能夠與網(wǎng)絡(luò)側(cè)設(shè)備通信的諸如計(jì)算機(jī)、移動(dòng)電話之類的用戶終端執(zhí)行。更具體地,方法200可以由安裝在用戶終端中能夠與網(wǎng)絡(luò)側(cè)設(shè)備通信的客戶端執(zhí)行。該客戶端可以是瀏覽器,也可以是瀏覽器的插件。網(wǎng)絡(luò)側(cè)設(shè)備可以是網(wǎng)絡(luò)中的一個(gè)設(shè)備(例如服務(wù)器),也可以是網(wǎng)絡(luò)(例如云網(wǎng)絡(luò))中的多個(gè)設(shè)備構(gòu)成的整體。例如,網(wǎng)絡(luò)側(cè)設(shè)備可以是圖2中的一個(gè)或多個(gè)云計(jì)算節(jié)點(diǎn)10,用戶終端可以是圖2中的個(gè)人數(shù)字助理(PDA)或移動(dòng)電話54A,臺(tái)式電腦54B、筆記本電腦54C以及汽車計(jì)算機(jī)系統(tǒng)54N中的任一個(gè)。
[0065]當(dāng)一個(gè)網(wǎng)頁被打開時(shí),用戶終端可以通過解析該網(wǎng)頁的諸如HTML (HyperTextMarkup Language,超文本標(biāo)記語言)的編程語言來確定該網(wǎng)頁中包含的鏈接,并將鏈接發(fā)送給網(wǎng)絡(luò)側(cè)設(shè)備。這里的“鏈接”用于指示從一個(gè)網(wǎng)頁到另一個(gè)網(wǎng)頁的連接關(guān)系。通過點(diǎn)擊一個(gè)網(wǎng)頁上的鏈接,可以打開該鏈接指向的另一個(gè)網(wǎng)頁。鏈接在網(wǎng)頁上可以表現(xiàn)為字符串、文本、圖片、符號(hào)等。從技術(shù)角度來看,鏈接可以是諸如URL (Uniform Resource Locator,統(tǒng)一資源定位符)、URI (Uniform Resource Identifier,統(tǒng)一資源標(biāo)識(shí)符)、IP地址之類的用于唯一識(shí)別該鏈接所指向內(nèi)容的標(biāo)識(shí)符。為了描述的方便,下文中以URL作為鏈接的例子進(jìn)行描述。例如,一個(gè)新聞鏈接在網(wǎng)頁上可以表現(xiàn)為“XX技術(shù)取得重大突破”,從技術(shù)角度來看該新聞鏈接可以是“http://news.AAA.com/123, html”。
[0066]網(wǎng)絡(luò)側(cè)設(shè)備接收到用戶終端發(fā)送的鏈接之后,可以通過查找預(yù)先存儲(chǔ)在網(wǎng)絡(luò)側(cè)設(shè)備的屬于同一分組的鏈接和該分組的組標(biāo)識(shí)之間的對(duì)應(yīng)關(guān)系,來確定用戶終端發(fā)送的鏈接屬于哪個(gè)分組,并將相應(yīng)分組的組標(biāo)識(shí)返回給用戶終端。
[0067]被劃分在同一分組中的鏈接指向具有相同或相近內(nèi)容的網(wǎng)頁。例如,在圖5中示出了劃分在組標(biāo)識(shí)為Gl的分組中的兩個(gè)鏈接URLl和URL2分別指向的網(wǎng)頁P(yáng)l和P2的內(nèi)容的例子。URLl出現(xiàn)在網(wǎng)頁Wl中,URL2出現(xiàn)在網(wǎng)頁W2中。URLl在網(wǎng)頁Wl中表現(xiàn)為“標(biāo)題1”,URL2在網(wǎng)頁W2中表現(xiàn)為“標(biāo)題2”,“標(biāo)題I”和“標(biāo)題2”可以不同。從技術(shù)角度來看,例如,URLl 可以是“http://news.AAA.com/123.html”,URL2 可以是“http://text.BBB.com/af56.html”。當(dāng)在網(wǎng)頁Wl中點(diǎn)擊表現(xiàn)為“標(biāo)題I”的URLl時(shí),網(wǎng)頁P(yáng)l打開。當(dāng)在網(wǎng)頁W2中點(diǎn)擊表現(xiàn)為“標(biāo)題2”的URL2時(shí),網(wǎng)頁P(yáng)2打開。在該例子中,網(wǎng)頁P(yáng)l和P2具有相同或相近的內(nèi)容。此外,URLl與URL2甚至可以相同,在這種情況下,URLl指向的網(wǎng)頁P(yáng)l與URL2指向的網(wǎng)頁P(yáng)2,是同一個(gè)網(wǎng)頁。
[0068]目前已經(jīng)存在多種已知方法來判斷網(wǎng)頁內(nèi)容是否相同或相近。例如,對(duì)于給定的兩個(gè)網(wǎng)頁P(yáng)l和P2,首先將網(wǎng)頁P(yáng)l和P2中諸如圖片、圖標(biāo)之類的非文本內(nèi)容去除,然后對(duì)網(wǎng)頁P(yáng)l和P2中的文字內(nèi)容進(jìn)行比對(duì),當(dāng)基本上相同的內(nèi)容超過某一比例(例如全部文本內(nèi)容的80%)時(shí),認(rèn)為這兩個(gè)網(wǎng)頁的內(nèi)容相同或相近?;旧舷嗤膬?nèi)容可以是完全一致的內(nèi)容,也可以是差異程度在預(yù)定范圍內(nèi)的內(nèi)容,還可以是在界定一句話的前后兩個(gè)標(biāo)點(diǎn)符號(hào)之間的預(yù)定個(gè)數(shù)個(gè)文本一致的該句話的內(nèi)容。
[0069]用戶終端接收到組標(biāo)識(shí)之后,可以確定已瀏覽鏈接中是否存在一個(gè)已瀏覽鏈接屬于接收到的組標(biāo)識(shí)指示的分組,例如可以通過圖6所示的方法300中的步驟來實(shí)現(xiàn)。
[0070]在步驟S310中,將與已瀏覽鏈接對(duì)應(yīng)的字符串編碼和所述組標(biāo)識(shí)進(jìn)行比較。其中,與已瀏覽鏈接對(duì)應(yīng)的字符串編碼是通過對(duì)該已瀏覽鏈接利用與根據(jù)劃分在同一分組中的所有鏈接得到該分組的組標(biāo)識(shí)的函數(shù)相同的函數(shù)而得到的。
[0071 ] 具體而言,存儲(chǔ)在用戶終端中的與已瀏覽鏈接對(duì)應(yīng)的字符串編碼和存儲(chǔ)在網(wǎng)絡(luò)側(cè)設(shè)備中的分組的組標(biāo)識(shí)是采用相同的函數(shù)生成的。該相同的函數(shù)分別存儲(chǔ)在用戶終端和網(wǎng)絡(luò)側(cè)設(shè)備中。例如,可以采用與Bloom濾波器類似的計(jì)算結(jié)構(gòu)來生成字符串編碼和組標(biāo)識(shí)。
[0072]根據(jù)本發(fā)明的實(shí)施例,計(jì)算字符串編碼和組標(biāo)識(shí)的函數(shù)可以是至少一個(gè)哈希(Hash)函數(shù),每個(gè)哈希函數(shù)的形式不同。當(dāng)處理一個(gè)鏈接時(shí),可以將該鏈接分別輸入到每個(gè)哈希函數(shù)。每個(gè)哈希函數(shù)對(duì)該鏈接的ASCII編碼、IP地址編碼等唯一表示該鏈接的數(shù)據(jù)進(jìn)行處理,并輸出基于該鏈接的值。哈希函數(shù)輸出的值用于指導(dǎo)如何生成字符串編碼或組標(biāo)識(shí)。例如,可以采用圖6所示的計(jì)算結(jié)構(gòu)來生成字符串編碼或組標(biāo)識(shí)。
[0073]在生成一個(gè)鏈接對(duì)應(yīng)的字符串編碼的情況下,預(yù)先為該鏈接設(shè)置一個(gè)m位的全O的初始字符串編碼。將該鏈接(例如URL)分別輸入到k個(gè)哈希函數(shù)。哈希函數(shù)I至哈希函數(shù)k可以分別輸出取值范圍在O至(m — I)內(nèi)的整數(shù)hi至hk。hi至hk中的每一個(gè)將初始字符串編碼中的相應(yīng)位置置I。另一方面,如果初始字符串編碼的各位置全1,那么hi至hk中的每一個(gè)將初始字符串編碼中的相應(yīng)位置置O。
[0074]舉例而言,當(dāng)用戶終端處存儲(chǔ)的作為“http://news.AAA.com/123, html”的已瀏覽鏈接URLl對(duì)應(yīng)的ASCII編碼為“FC068E932”時(shí),將該ASCII編碼輸入3個(gè)哈希函數(shù),分別得到3、7和9。那么,初始字符串編碼“0000-0000-0000”被設(shè)置為“0001-0001-0100”,作為鏈接URLl對(duì)應(yīng)的字符串編碼。
[0075]在生成一個(gè)分組的組標(biāo)識(shí)的情況下,預(yù)先為該分組設(shè)置一個(gè)m位的全O的初始字符串編碼。針對(duì)該分組中包含的所有η個(gè)鏈接中的每一個(gè),將每個(gè)鏈接分別輸入到k個(gè)哈希函數(shù)。對(duì)于每個(gè)鏈接,哈希函數(shù)I至哈希函數(shù)k可以分別輸出取值范圍在O至(m — I)內(nèi)的整數(shù)hi至hk。hi至hk中的每一個(gè)將初始字符串編碼中的相應(yīng)位置置I。如果多個(gè)鏈接經(jīng)過k個(gè)哈希函數(shù)處理而需要對(duì)同一位置置1,那么該位置只被置I 一次。也就是說,如果該位置初次被置I以后,就不再對(duì)其進(jìn)行改變。與上述類似,另一方面,如果初始字符串編碼的各位置全1,那么hi至hk中的每一個(gè)將初始字符串編碼中的相應(yīng)位置置O。
[0076]舉例而言,當(dāng)一個(gè)分組中包含的作為“http://news.AAA.com/123, html”的鏈接URL2 和作為 “http://text.BBB.com/af56.html” 的鏈接 URL3 對(duì)應(yīng)的 ASCII 編碼分別為“FC068E932”和“AEF586G0C”時(shí),將這兩個(gè)ASCII編碼依次輸入3個(gè)哈希函數(shù),分別得到3、7和9以及O、3和10。那么,初始字符串編碼“0000-0000-0000”被設(shè)置為“1001-0001-0110”,作為該分組的組標(biāo)識(shí)Gl。
[0077]當(dāng)用戶終端處的初始字符串編碼為全O時(shí),網(wǎng)絡(luò)側(cè)設(shè)備處的初始字符串編碼也為
0。反之,當(dāng)用戶終端處的初始字符串編碼為全I(xiàn)時(shí),網(wǎng)絡(luò)側(cè)設(shè)備處的初始字符串編碼也為
1。并且,用戶終端處的初始字符串編碼的長(zhǎng)度與網(wǎng)絡(luò)側(cè)設(shè)備處的初始字符串編碼的長(zhǎng)度相等。[0078]在網(wǎng)絡(luò)側(cè)設(shè)備處通過利用k個(gè)哈希函數(shù)來將包含η個(gè)鏈接的分組表示為m位的向量,可以用簡(jiǎn)單的高效數(shù)據(jù)結(jié)構(gòu)來表征分組中各成員,從而有利于成員關(guān)系的查詢。哈希函數(shù)的使用可以將輸入的鏈接等概率地映射到[0,m-l]的范圍內(nèi),從而盡可能地避免多個(gè)不同的鏈接被映射到相同的編碼位置而引入過大的誤差。
[0079]已知的Bloom濾波器用于查詢成員關(guān)系所導(dǎo)致的誤判率(False Positive)約為(1- e_kbAl)k,當(dāng)k = ln2(m/n)時(shí)可以得到最小的誤判率。因此,在根據(jù)本發(fā)明實(shí)施例的結(jié)構(gòu)中,可以利用上述已知結(jié)論來合理地確定m、n和k。例如,可以設(shè)置能夠被劃分到同一個(gè)分組中的鏈接為1000個(gè),需要同時(shí)輸入同一鏈接的哈希函數(shù)為5個(gè),字符串編碼和組標(biāo)識(shí)的長(zhǎng)度均為10000位。
[0080]在步驟S320中,將與組標(biāo)識(shí)匹配的字符串編碼對(duì)應(yīng)的已瀏覽鏈接確定為屬于該組標(biāo)識(shí)指示的分組。
[0081]字符串編碼和組標(biāo)識(shí)匹配可以是在初始字符串編碼為全O的情況下,已瀏覽鏈接對(duì)應(yīng)的字符串編碼被置I的位置對(duì)應(yīng)于組標(biāo)識(shí)中的位置也被置I?;蛘?,字符串編碼和組標(biāo)識(shí)匹配可以是在初始字符串編碼為全I(xiàn)的情況下,已瀏覽鏈接對(duì)應(yīng)的字符串編碼被置O的位置對(duì)應(yīng)于組標(biāo)識(shí)中的位置也被置O。
[0082]根據(jù)本發(fā)明的一個(gè)實(shí)施例,可以采用以下方式來確定已瀏覽鏈接是否屬于組標(biāo)識(shí)指示的分組。在初始字符串編碼全為O的情況下,首先,可以確定在與已瀏覽鏈接對(duì)應(yīng)的字符串編碼中被置為I的位置(例如Al、A4和A5)。然后,確定組標(biāo)識(shí)在這些位置(例如Al、A4和A5)處的值,并將所確定的值與I進(jìn)行比較。如果組標(biāo)識(shí)在這些位置處的值也被置為1,則確定該已瀏覽鏈接屬于組標(biāo)識(shí)指示的分組。另一方面,在初始字符串編碼全為I的情況下,首先,可以確定在與已瀏覽鏈接對(duì)應(yīng)的字符串編碼中被置為O的位置(例如B1、B4和B5)。然后,確定組標(biāo)識(shí)在這些位置(例如B1、B4和B5)處的值,并將所確定的值與O進(jìn)行比較。如果組標(biāo)識(shí)在這些位置處的值也被置為O,則確定該已瀏覽鏈接屬于組標(biāo)識(shí)指示的分組。
[0083]在上述例子中,由于用戶終端處的已瀏覽鏈接URLl對(duì)應(yīng)的字符串編碼“0001-0001-0100”被置I的位置在包含鏈接URL2和URL3的分組的組標(biāo)識(shí)Gl “1001-0001-0110”中也被置1,所以該已瀏覽鏈接屬于該分組。
[0084]為了能夠確定步驟S310中的與鏈接對(duì)應(yīng)的字符串編碼,用戶終端可以在打開一個(gè)網(wǎng)頁時(shí),將這個(gè)網(wǎng)頁的鏈接與其對(duì)應(yīng)的字符串編碼關(guān)聯(lián)地存儲(chǔ)為瀏覽歷史記錄。
[0085]舉例來說,在打開鏈接URLl ^http://news.AAA.com/123, html”的網(wǎng)頁P(yáng)l的情況下(例如,點(diǎn)擊該網(wǎng)頁的鏈接,或者在地址欄中直接輸入上述鏈接或其IP地址、域名等),該網(wǎng)頁P(yáng)l的鏈接URLl變?yōu)橐褳g覽鏈接。此時(shí),針對(duì)該網(wǎng)頁的鏈接URLl利用如圖7所示的結(jié)構(gòu)計(jì)算出字符串編碼“0001-0001-0100”,并將URLl和“0001-0001-0100”關(guān)聯(lián)地存儲(chǔ)為瀏覽歷史記錄。
[0086]此外,根據(jù)本發(fā)明的一個(gè)實(shí)施例,用戶終端還可以將與被打開的網(wǎng)頁有關(guān)的瀏覽信息與該網(wǎng)頁的鏈接關(guān)聯(lián)地存儲(chǔ)。例如,用戶終端可以將被打開網(wǎng)頁的鏈接、該鏈接對(duì)應(yīng)的字符串編碼以及對(duì)于該網(wǎng)頁的瀏覽信息共同關(guān)聯(lián)存儲(chǔ)為瀏覽歷史記錄。網(wǎng)頁的瀏覽信息可以表征用戶瀏覽該網(wǎng)頁的時(shí)間、地點(diǎn)、該網(wǎng)頁的來源等中的一項(xiàng)或多項(xiàng)。在圖8中以URLl為例示出了如何存儲(chǔ)已瀏覽鏈接。當(dāng)作為“http://news.AAA.com/123, html”的URLl被點(diǎn)擊而打開時(shí),可以記錄URLl所指向網(wǎng)頁的來源AAA和瀏覽時(shí)間2013年2月7日,作為瀏覽信息。
[0087]在記錄有瀏覽信息的情況下,用戶終端可以通過輸出與步驟S320中確定的已瀏覽鏈接相關(guān)聯(lián)的瀏覽信息來向用戶提示網(wǎng)頁中包含的某鏈接指向的網(wǎng)頁內(nèi)容已經(jīng)被瀏覽過。
[0088]例如,如圖5所示,假設(shè)用戶已經(jīng)點(diǎn)擊網(wǎng)頁Wl中包含的鏈接URLl ^http://news.AAA.com/123, html”并瀏覽了該鏈接URLl指向的網(wǎng)頁P(yáng)1。當(dāng)用戶終端新打開另一網(wǎng)頁W2時(shí),用戶終端將新打開的網(wǎng)頁W2中包含的鏈接URL2 “http://text.BBB.com/af56.html”發(fā)送到網(wǎng)絡(luò)側(cè)設(shè)備。網(wǎng)絡(luò)側(cè)設(shè)備向用戶終端返回該鏈接URL2所屬分組的組標(biāo)識(shí)“1001-0001-0110”。由于在用戶終端處存儲(chǔ)的已瀏覽鏈接中鏈接URLl對(duì)應(yīng)的字符串編碼“0001-0001-0100”匹配于URL2所屬分組的組標(biāo)識(shí)“ 1001-0001-0110”,因此可以說明“URL2指向的網(wǎng)頁內(nèi)容與URLl指向的網(wǎng)頁內(nèi)容基本上相同。由于URLl對(duì)應(yīng)的網(wǎng)頁內(nèi)容已被瀏覽,因此可以在鏈接URL2的“標(biāo)題2”附近輸出與URLl相關(guān)聯(lián)的瀏覽信息(例如來源AAA)來向用戶提示內(nèi)容已經(jīng)瀏覽過。當(dāng)然,也可以通過將指向的內(nèi)容已被瀏覽但是還未在網(wǎng)頁上點(diǎn)擊的鏈接(例如URL2改變顏色、字體、增加動(dòng)畫等,來提示該鏈接指向的網(wǎng)頁內(nèi)容已被瀏覽。
[0089]上述以網(wǎng)頁W2中包含一個(gè)鏈接URL2為例進(jìn)行了描述。當(dāng)網(wǎng)頁中包含多于一個(gè)的鏈接時(shí),用戶終端可以將這些鏈接都發(fā)送給網(wǎng)絡(luò)側(cè)設(shè)備,網(wǎng)絡(luò)側(cè)設(shè)備返回這些鏈接各自對(duì)應(yīng)的組標(biāo)識(shí),以用于用戶終端分別針對(duì)網(wǎng)頁中的每個(gè)鏈接判斷內(nèi)容是否被瀏覽過。
[0090]通過借助于組標(biāo)識(shí)來幫助判斷不同的鏈接是否指向相同或相近的網(wǎng)頁內(nèi)容,可以有效地避免用戶反復(fù)瀏覽重復(fù)內(nèi)容,并避免用戶終端反復(fù)顯示重復(fù)內(nèi)容。因此,能夠節(jié)省系統(tǒng)資源,并提高用戶體驗(yàn)。
[0091]上面從用戶終端一側(cè)對(duì)本發(fā)明實(shí)施例的方法進(jìn)行了描述,下面將從網(wǎng)絡(luò)側(cè)設(shè)備一側(cè)對(duì)本發(fā)明實(shí)施例的方法進(jìn)行描述。網(wǎng)絡(luò)側(cè)設(shè)備可以是指任意網(wǎng)絡(luò)中的一個(gè)或多個(gè)設(shè)備,例如可以是一個(gè)或多個(gè)服務(wù)器。當(dāng)網(wǎng)絡(luò)側(cè)設(shè)備包含多個(gè)設(shè)備時(shí),將這些設(shè)備作為一個(gè)整體作為該網(wǎng)絡(luò)側(cè)設(shè)備。例如,在云網(wǎng)絡(luò)中,網(wǎng)絡(luò)側(cè)設(shè)備可以由多個(gè)節(jié)點(diǎn)構(gòu)成。
[0092]在圖9所示的根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的方法500中,在步驟S510中,接收來自用戶終端的包含在網(wǎng)頁中的鏈接;以及在步驟S520中,響應(yīng)于確定該鏈接屬于至少一個(gè)預(yù)定分組中的一個(gè)預(yù)定分組,將該預(yù)定分組的組標(biāo)識(shí)發(fā)送給用戶終端,以使用戶終端響應(yīng)于確定有已瀏覽鏈接屬于組標(biāo)識(shí)指示的分組,提示包含在該網(wǎng)頁中的該鏈接指向的網(wǎng)頁內(nèi)容已被瀏覽過。其中,屬于同一個(gè)預(yù)定分組的鏈接指向的網(wǎng)頁內(nèi)容相同或相近。
[0093]步驟S510和S520中的操作可以參考上述結(jié)合圖4至圖8進(jìn)行的描述。網(wǎng)絡(luò)側(cè)設(shè)備通過向用戶終端返回網(wǎng)頁中可能被點(diǎn)擊的鏈接所屬分組的組標(biāo)識(shí),可以幫助用戶終端確定該鏈接指向的內(nèi)容是否已經(jīng)被瀏覽過,從而避免用戶重復(fù)瀏覽相同或相近內(nèi)容,并避免用戶終端反復(fù)顯示重復(fù)內(nèi)容。從而,提高用戶體驗(yàn),并節(jié)省系統(tǒng)資源。
[0094]根據(jù)本發(fā)明的一個(gè)實(shí)施例,網(wǎng)絡(luò)側(cè)設(shè)備可以預(yù)先通過圖10所示的方法600來確定預(yù)定分組及其對(duì)應(yīng)的組標(biāo)識(shí)。
[0095]在步驟S610中,對(duì)已知鏈接指向的網(wǎng)頁內(nèi)容進(jìn)行抓取。具體而言,網(wǎng)絡(luò)側(cè)設(shè)備可以抓取所有已知的鏈接指向的全部網(wǎng)頁內(nèi)容。
[0096]在步驟S620中,通過計(jì)算步驟S610中抓取的網(wǎng)頁內(nèi)容的相似性,對(duì)這些已知鏈接進(jìn)行分組,以使得被劃分在同一分組中的鏈接指向的網(wǎng)頁內(nèi)容相同或相近。
[0097]計(jì)算網(wǎng)頁內(nèi)容相似性的方法可以采用上文中描述的已知方法。接著,可以將判斷出的指向相同或相近網(wǎng)頁內(nèi)容的鏈接劃分到一個(gè)分組中??梢岳靡阎木垲惙椒ǜ鶕?jù)網(wǎng)頁內(nèi)容的相似性對(duì)鏈接進(jìn)行聚類,從而得到不同的分組。例如,可以根據(jù)網(wǎng)頁內(nèi)容的相似程度將代表不同鏈接的點(diǎn)表示在同一坐標(biāo)系中,并將兩點(diǎn)間距離在預(yù)定閾值之內(nèi)的點(diǎn)劃分到一個(gè)分組中。
[0098]在步驟S630中,對(duì)于在步驟S620中得到的每一個(gè)分組,根據(jù)該分組中的所有鏈接生成該分組的組標(biāo)識(shí),并將該分組的組標(biāo)識(shí)與該分組中的所有鏈接關(guān)聯(lián)地存儲(chǔ)。
[0099]例如,可以通過對(duì)分組中的所有鏈接利用至少一個(gè)哈希函數(shù)來生成該分組的組標(biāo)識(shí)。具體而言,可以將將劃分在分組中的所有鏈接中的每一個(gè)輸入到該至少一個(gè)哈希函數(shù),以使得該至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該分組設(shè)置的全O的初始字符串編碼中的相應(yīng)位置置1,或者,以使得該至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該分組設(shè)置的全I(xiàn)的初始字符串編碼中的相應(yīng)位置置O。具體操作可以參考上文的描述。
[0100]根據(jù)本發(fā)明的一個(gè)實(shí)施例,如果網(wǎng)絡(luò)側(cè)設(shè)備沒有找到在步驟S610中接收到的鏈接所屬分組的組標(biāo)識(shí),也就是說該鏈接還沒有被分類,則網(wǎng)絡(luò)側(cè)設(shè)備可以對(duì)該鏈接進(jìn)行分類。具體而言,根據(jù)該鏈接指向的網(wǎng)頁內(nèi)容和已有的預(yù)定分組(即,步驟S610中的至少一個(gè)預(yù)定分組)中的鏈接指向的網(wǎng)頁內(nèi)容的相似性,對(duì)該鏈接進(jìn)行分類。
[0101]如果該鏈接可以被分類到一個(gè)預(yù)定分組中,則對(duì)該預(yù)定分組的組標(biāo)識(shí)進(jìn)行更新。例如,將該鏈接也輸入到如圖7所示那樣的計(jì)算結(jié)構(gòu),根據(jù)哈希函數(shù)的輸出結(jié)果將該預(yù)定分組的組標(biāo)識(shí)中的相應(yīng)位置置I (在初始字符串編碼為全O的情況下)或置O (在初始字符串編碼為全I(xiàn)的情況下)。
[0102]如果該鏈接不能被劃分在任何一個(gè)預(yù)定分組中,則針對(duì)該鏈接單獨(dú)生成一個(gè)新的分組,并計(jì)算該新的分組的組標(biāo)識(shí),然后將該組標(biāo)識(shí)與該鏈接關(guān)聯(lián)地存儲(chǔ)。
[0103]通過對(duì)組標(biāo)識(shí)進(jìn)行不斷地更新,可以跟蹤在網(wǎng)絡(luò)中出現(xiàn)的新的內(nèi)容,從而有利于更全面地判斷不同的鏈接是否指向相同或相近的網(wǎng)頁內(nèi)容,由此更有效地向用戶提示重復(fù)網(wǎng)頁內(nèi)容的出現(xiàn),進(jìn)一步避免用戶終端打開具有重復(fù)內(nèi)容的網(wǎng)頁而浪費(fèi)系統(tǒng)資源。
[0104]接下來,結(jié)合圖11從系統(tǒng)層面描述根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)以避免重復(fù)瀏覽相同或相近網(wǎng)頁內(nèi)容的方法700的流程圖。
[0105]在步驟S705中,用戶終端打開新的網(wǎng)頁。
[0106]在步驟S710中,用戶終端列舉該網(wǎng)頁中包含的鏈接。
[0107]在步驟S715中,用戶終端確定鏈接是否對(duì)應(yīng)包含文本的網(wǎng)頁內(nèi)容。例如,通過參考鏈接的后綴等來判斷是否對(duì)應(yīng)包含文本的網(wǎng)頁內(nèi)容。如果鏈接不對(duì)應(yīng)包含文本的網(wǎng)頁內(nèi)容(例如,該鏈接是關(guān)于音頻、圖片和/或視頻內(nèi)容的鏈接),則前進(jìn)到步驟S720,反之,前進(jìn)到步驟S725。這里,包含文本的網(wǎng)頁內(nèi)容是指主要部分或超過50 %的內(nèi)容是文本或其它字符串的網(wǎng)頁內(nèi)容。
[0108]在步驟S720中,丟棄不對(duì)應(yīng)包含文本的網(wǎng)頁內(nèi)容的鏈接。
[0109]在步驟S725中,對(duì)于對(duì)應(yīng)包含文本的網(wǎng)頁內(nèi)容的鏈接,在用戶終端本地查看該鏈接是否已被瀏覽。例如,在瀏覽歷史記錄中查找該鏈接是否存儲(chǔ)在其中。
[0110]在步驟S730中,如果該鏈接存儲(chǔ)在瀏覽歷史記錄中,則對(duì)于該鏈接標(biāo)注“重復(fù)內(nèi)容”或其它用于提示其內(nèi)容已被瀏覽過的信息。當(dāng)然,也可以通過改變顏色、字體等來進(jìn)行提示。
[0111]注意,步驟S715、S720和S725也可以不執(zhí)行。
[0112]在步驟S735中,如果該鏈接沒有存儲(chǔ)在瀏覽歷史記錄中,則用戶終端將該鏈接(例如URL)發(fā)送到網(wǎng)絡(luò)側(cè)設(shè)備(例如云網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn)或由多個(gè)節(jié)點(diǎn)構(gòu)成的整體)。
[0113]在步驟S740中,網(wǎng)絡(luò)側(cè)設(shè)備確定該鏈接是否有對(duì)應(yīng)的組標(biāo)識(shí)。如果網(wǎng)絡(luò)側(cè)設(shè)備確定該鏈接有對(duì)應(yīng)的組標(biāo)識(shí),則前進(jìn)到步驟S745,反之,則前進(jìn)到步驟S760和S775。
[0114]在步驟S745中,獲取該鏈接對(duì)應(yīng)的組標(biāo)識(shí),例如m位的利用k個(gè)哈希函數(shù)生成的字符串編碼。
[0115]在步驟S750中,網(wǎng)絡(luò)側(cè)設(shè)備將該組標(biāo)識(shí)發(fā)送給用戶終端。
[0116]在步驟S755中,用戶終端將該組標(biāo)識(shí)和存儲(chǔ)在本地的與已瀏覽鏈接對(duì)應(yīng)的字符串編碼進(jìn)行比較,以確定是否存在已瀏覽鏈接屬于該組標(biāo)識(shí)指示的分組。
[0117]如果在步驟S755中確定存在已瀏覽鏈接屬于該組標(biāo)識(shí)指示的分組,則前進(jìn)到步驟S730中來提示對(duì)應(yīng)包含文本的網(wǎng)頁內(nèi)容的該鏈接指向的網(wǎng)頁內(nèi)容已被瀏覽過。反之,則不進(jìn)行操作。
[0118]在步驟S760中,由于該鏈接沒有對(duì)應(yīng)的組標(biāo)識(shí),因此網(wǎng)絡(luò)側(cè)設(shè)備抓取該鏈接指向的網(wǎng)頁內(nèi)容。
[0119]在步驟S765中,網(wǎng)絡(luò)側(cè)設(shè)備根據(jù)內(nèi)容相似性對(duì)該鏈接進(jìn)行分類。[0120]在步驟S770中,更新該鏈接被劃分在的分組的組標(biāo)識(shí)。
[0121]在步驟S775中,網(wǎng)絡(luò)側(cè)設(shè)備向用戶終端返回用于指示該鏈接沒有所屬分組的消息,由此提示用戶終端該鏈接指向的網(wǎng)頁內(nèi)容沒有被瀏覽過。步驟S775只要在步驟S740之后執(zhí)行即可,與其它步驟之間沒有時(shí)間限制關(guān)系。當(dāng)然,也可以不執(zhí)行步驟S775。
[0122]在步驟S780中,用戶終端將在步驟S705中新打開的網(wǎng)頁的鏈接和該鏈接對(duì)應(yīng)的字符串編碼關(guān)聯(lián)地存儲(chǔ)在瀏覽歷史記錄中。雖然在圖11中示出步驟S780在步驟S770之后執(zhí)行,但是步驟S780只要在步驟S705之后執(zhí)行即可,與其它步驟之間沒有時(shí)間限制關(guān)系。
[0123]根據(jù)本發(fā)明實(shí)施例提供的用于處理網(wǎng)頁數(shù)據(jù)的方法,可以向用戶提示重復(fù)網(wǎng)頁內(nèi)容,從而可以避免用戶在點(diǎn)擊鏈接時(shí)看到已瀏覽過的內(nèi)容而引起的時(shí)間浪費(fèi)和體驗(yàn)降低,并同時(shí)可以避免用戶終端打開具有重復(fù)內(nèi)容的網(wǎng)頁而造成的資源浪費(fèi)。由于在用戶終端和網(wǎng)絡(luò)側(cè)設(shè)備之間傳遞組標(biāo)識(shí)而不是屬于同一分組的鏈接,因此可以節(jié)省網(wǎng)絡(luò)帶寬。并且,由于可以用通過哈希函數(shù)計(jì)算得到的字符串編碼來表示組信息,因此可以用盡可能少的數(shù)據(jù)量表示了盡可能多的信息,從而可以提高信息傳輸?shù)男?。此外,在用戶終端處,由于只需要將已瀏覽鏈接對(duì)應(yīng)的字符串編碼與組標(biāo)識(shí)進(jìn)行比較,以確定是否有相同或相近內(nèi)容已被瀏覽,因此可以使用戶終端快速進(jìn)行重復(fù)內(nèi)容的檢測(cè),并簡(jiǎn)化用戶終端處的判斷過程,從而進(jìn)一步節(jié)省系統(tǒng)開銷。另外,由于能夠借助于瀏覽信息來可視化地對(duì)重復(fù)內(nèi)容進(jìn)行提示,可以在避免瀏覽重復(fù)內(nèi)容的基礎(chǔ)上進(jìn)一步提聞?dòng)脩趔w驗(yàn)。
[0124]接下來,將描述根據(jù)本發(fā)明實(shí)施例的能夠?qū)崿F(xiàn)上述方法的用于處理網(wǎng)頁數(shù)據(jù)的裝置800至1100和系統(tǒng)1200的結(jié)構(gòu)框圖。
[0125]如圖12所示,用于處理網(wǎng)頁數(shù)據(jù)的裝置800可以是用戶終端,也可以是用戶終端中安裝的客戶端或其他功能模塊。裝置800可以包括發(fā)送部件810、接收部件815、確定部件820和提示部件830。發(fā)送部件810可被配置為響應(yīng)于一網(wǎng)頁被打開,向網(wǎng)絡(luò)側(cè)設(shè)備發(fā)送包含在所述網(wǎng)頁中的鏈接。接收部件815可被配置為從所述網(wǎng)絡(luò)側(cè)設(shè)備接收組標(biāo)識(shí),所述組標(biāo)識(shí)是由所述網(wǎng)絡(luò)側(cè)設(shè)備根據(jù)所述鏈接確定的、用于指示所述鏈接所屬的分組。確定部件820可被配置為確定是否有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組。提示部件830可被配置為響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
[0126]發(fā)送部件810、接收部件815、確定部件820和提示部件830的上述和其他操作和/或功能可以參考上述參考圖4至圖11進(jìn)行了描述,為了避免重復(fù),在此不再贅述。
[0127]根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的裝置通過利用網(wǎng)絡(luò)側(cè)設(shè)備返回的組標(biāo)識(shí)和本地的鏈接,能夠提前通知用戶指向重復(fù)網(wǎng)頁內(nèi)容的鏈接,從而有效地避免用戶重復(fù)瀏覽相同或相近的內(nèi)容。因此,能夠節(jié)省系統(tǒng)資源,并提高用戶體驗(yàn)。
[0128]圖13所示的用于處理網(wǎng)頁數(shù)據(jù)的裝置900中的發(fā)送部件910、接收部件915、確定部件920和提示部件930與圖12所示的裝置800中的發(fā)送部件810、接收部件815、確定部件820和提不部件830基本相同。
[0129]根據(jù)本發(fā)明的一個(gè)實(shí)施例,確定部件920包括比較單元922和確定單元924。比較單元922可被配置為將與已瀏覽鏈接對(duì)應(yīng)的字符串編碼和所述組標(biāo)識(shí)進(jìn)行比較。確定單元924可被配置將與所述組標(biāo)識(shí)匹配的字符串編碼對(duì)應(yīng)的已瀏覽鏈接確定為屬于所述組標(biāo)識(shí)指示的分組。其中,與已瀏覽鏈接對(duì)應(yīng)的字符串編碼是通過對(duì)該已瀏覽鏈接利用與根據(jù)劃分在同一分組中的所有鏈接得到該分組的組標(biāo)識(shí)的函數(shù)相同的函數(shù)而得到的。
[0130]根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述函數(shù)可以為至少一個(gè)哈希函數(shù)。與已瀏覽鏈接對(duì)應(yīng)的字符串編碼可以通過如下方式得到:將該已瀏覽鏈接輸入到所述至少一個(gè)哈希函數(shù),以使得所述至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該已瀏覽鏈接設(shè)置的全為第一值的初始字符串編碼中的相應(yīng)位置置為第二值。并且,分組的組標(biāo)識(shí)可以通過如下方式得到:將劃分在同一分組中的所有鏈接中的每一個(gè)輸入到所述至少一個(gè)哈希函數(shù),以使得所述至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該分組設(shè)置的全為第一值的初始字符串編碼中的相應(yīng)位置置為第二值。其中,第一值和第二值可以是從O和I中選擇的值,并且第二值與第一值不同。
[0131 ] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,可以將鏈接的ASCII編碼或IP地址編碼輸入到所述至少一個(gè)哈希函數(shù)。
[0132]根據(jù)本發(fā)明的一個(gè)實(shí)施例,比較單元922可被配置為確定在與已瀏覽鏈接對(duì)應(yīng)的字符串編碼中被置為第二值的位置,以及確定組標(biāo)識(shí)在所確定的位置處的值,并將所述值與第二值進(jìn)行比較。在該情況下,確定單元924可被配置為響應(yīng)于確定所述組標(biāo)識(shí)在所確定的位置處的值也被置為第二值,確定該已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組。
[0133]根據(jù)本發(fā)明的一個(gè)實(shí)施例,裝置900還可以包括存儲(chǔ)部件940。存儲(chǔ)部件940可被配置為在網(wǎng)頁被打開的情況下,將該網(wǎng)頁的鏈接和與該網(wǎng)頁的鏈接對(duì)應(yīng)的字符串編碼關(guān)聯(lián)地存儲(chǔ)為瀏覽歷史記錄。
[0134]根據(jù)本發(fā)明的一個(gè)實(shí)施例,存儲(chǔ)部件940具體可被配置為將該網(wǎng)頁的鏈接、與該網(wǎng)頁的鏈接對(duì)應(yīng)的字符串編碼以及對(duì)于該網(wǎng)頁的瀏覽信息關(guān)聯(lián)地存儲(chǔ)為瀏覽歷史記錄。在該情況下,提示部件930可被配置為通過輸出與該已瀏覽鏈接相關(guān)聯(lián)的瀏覽信息來提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
[0135]比較單元922、確定單元924、提示部件930和存儲(chǔ)部件940的上述和其他操作和/或功能可以參考上述結(jié)合圖4至圖11描述的內(nèi)容,為了避免重復(fù),在此不再贅述。
[0136]本發(fā)明實(shí)施例提供的用于處理網(wǎng)頁數(shù)據(jù)的裝置可以向用戶提示重復(fù)網(wǎng)頁內(nèi)容,從而可以避免用戶在點(diǎn)擊鏈接時(shí)看到已瀏覽過的內(nèi)容而引起的時(shí)間浪費(fèi)和體驗(yàn)降低,并同時(shí)可以避免用戶終端打開具有重復(fù)內(nèi)容的網(wǎng)頁而造成的資源浪費(fèi)。由于在該裝置和網(wǎng)絡(luò)側(cè)設(shè)備之間傳遞組標(biāo)識(shí)而不是屬于同一分組的鏈接,因此可以節(jié)省網(wǎng)絡(luò)帶寬。并且,由于可以用通過哈希函數(shù)計(jì)算得到的字符串編碼來表示組信息,因此可以用盡可能少的數(shù)據(jù)量表示盡可能多的信息,從而可以提高信息傳輸?shù)男?。此外,在該裝置處,由于只需要將已瀏覽鏈接對(duì)應(yīng)的字符串編碼與組標(biāo)識(shí)進(jìn)行比較,以確定是否有相同或相近內(nèi)容已被瀏覽,因此可以使該裝置快速進(jìn)行重復(fù)內(nèi)容的檢測(cè),并簡(jiǎn)化該裝置處的判斷過程,從而進(jìn)一步節(jié)省系統(tǒng)開銷。另外,由于能夠借助于瀏覽信息來可視化地對(duì)重復(fù)內(nèi)容進(jìn)行提示,可以在避免瀏覽重復(fù)內(nèi)容的基礎(chǔ)上進(jìn)一步提聞?dòng)脩趔w驗(yàn)。
[0137]如圖14所示,用于處理網(wǎng)頁數(shù)據(jù)的裝置1000可以是網(wǎng)絡(luò)側(cè)設(shè)備,也可以是安裝在網(wǎng)絡(luò)側(cè)設(shè)備中的功能模塊。裝置1000可以包括接收部件1010和發(fā)送部件1020。接收部件1010可被配置為接收來自用戶終端的包含在網(wǎng)頁中的鏈接。發(fā)送部件1020可被配置為響應(yīng)于確定所述鏈接屬于至少一個(gè)預(yù)定分組中的一個(gè)預(yù)定分組,將該預(yù)定分組的組標(biāo)識(shí)發(fā)送給所述用戶終端,以使所述用戶終端響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
[0138]接收部件1010和發(fā)送部件1020的上述和其他操作和/或功能可以參考上述結(jié)合圖4至圖11進(jìn)行的描述,為了避免重復(fù),在此不再贅述。
[0139]根據(jù)本發(fā)明實(shí)施例提供的用于處理網(wǎng)頁數(shù)據(jù)的裝置通過向用戶終端返回網(wǎng)頁中可能被點(diǎn)擊的鏈接所屬分組的組標(biāo)識(shí),可以幫助用戶終端確定該鏈接指向的內(nèi)容是否已經(jīng)被瀏覽過,從而避免用戶重復(fù)瀏覽相同或相近內(nèi)容,并避免用戶終端反復(fù)顯示重復(fù)內(nèi)容。從而,提高用戶體驗(yàn),并節(jié)省系統(tǒng)資源。
[0140]圖15所示的用于處理網(wǎng)頁數(shù)據(jù)的裝置1100中的接收部件1110和發(fā)送部件1120與圖14所示的裝置1000中的接收部件1010和發(fā)送部件1020基本相同。
[0141 ] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,裝置1100還可以包括抓取部件1130、劃分部件1140和生成部件1150。抓取部件1130看被配置為對(duì)已知鏈接指向的網(wǎng)頁內(nèi)容進(jìn)行抓取。劃分部件1140可被配置為通過計(jì)算所述網(wǎng)頁內(nèi)容的相似性,對(duì)所述已知鏈接進(jìn)行劃分,以使得被劃分在同一分組中的鏈接指向的網(wǎng)頁內(nèi)容相同或相近,其中,劃分得到所述至少一個(gè)預(yù)定分組。生成部件1150可被配置為對(duì)于每一個(gè)分組,根據(jù)該分組中的所有鏈接生成該分組的組標(biāo)識(shí),并將該分組的組標(biāo)識(shí)與該分組中的所有鏈接關(guān)聯(lián)地存儲(chǔ)。
[0142]根據(jù)本發(fā)明的一個(gè)實(shí)施例,生成部件1150具體可被配置為通過對(duì)該分組中的所有鏈接利用至少一個(gè)哈希函數(shù)來生成該分組的組標(biāo)識(shí)。該分組的組標(biāo)識(shí)可以通過如下方式得到:將劃分在該分組中的所有鏈接中的每一個(gè)輸入到所述至少一個(gè)哈希函數(shù),以使得所述至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該分組設(shè)置的全為第一值的初始字符串編碼中的相應(yīng)位置置為第二值。其中,第一值和第二值可以是從O和I中選擇的值,并且第二值與第一值不同。
[0143]根據(jù)本發(fā)明的一個(gè)實(shí)施例,裝置1100還可以包括獲取部件1160、分類部件1170和更新部件1180。獲取部件1160可被配置為響應(yīng)于確定所述鏈接未屬于任何預(yù)定分組,獲取所述鏈接指向的網(wǎng)頁內(nèi)容。分類部件1170可被配置為根據(jù)所述鏈接指向的網(wǎng)頁內(nèi)容和所述至少一個(gè)預(yù)定分組中的鏈接指向的網(wǎng)頁內(nèi)容的相似性,對(duì)所述鏈接進(jìn)行分類。更新部件1180可被配置為響應(yīng)于所述鏈接被劃分到一個(gè)預(yù)定分組中,更新該預(yù)定分組的組標(biāo)識(shí)。
[0144]抓取部件1130、劃分部件1140、生成部件1150、獲取部件1160、分類部件1170和更新部件1180的上述和其他操作和/或功能可以參考上述結(jié)合圖4至圖11進(jìn)行的描述,為了避免重復(fù),在此不再贅述。
[0145]本發(fā)明實(shí)施例提供的用于處理網(wǎng)頁數(shù)據(jù)的裝置通過對(duì)組標(biāo)識(shí)進(jìn)行不斷地更新,可以跟蹤在網(wǎng)絡(luò)中出現(xiàn)的新的內(nèi)容,從而有利于更全面地判斷不同的鏈接是否指向相同或相近的網(wǎng)頁內(nèi)容,由此更有效地向用戶提示重復(fù)網(wǎng)頁內(nèi)容的出現(xiàn),進(jìn)一步避免用戶終端打開具有重復(fù)內(nèi)容的網(wǎng)頁而浪費(fèi)系統(tǒng)資源。
[0146]圖16示出了根據(jù)本發(fā)明實(shí)施例的用于處理網(wǎng)頁數(shù)據(jù)的系統(tǒng)1200。系統(tǒng)1200可以包括用戶終端1210和網(wǎng)絡(luò)側(cè)設(shè)備1220。用戶終端1210可以用于響應(yīng)于一網(wǎng)頁被打開,向網(wǎng)絡(luò)側(cè)設(shè)備1220發(fā)送包含在所述網(wǎng)頁中的鏈接;從網(wǎng)絡(luò)側(cè)設(shè)備1220接收組標(biāo)識(shí),所述組標(biāo)識(shí)是由網(wǎng)絡(luò)側(cè)設(shè)備1220根據(jù)所述鏈接確定的、用于指示所述鏈接所屬的分組;確定是否有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組;響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。網(wǎng)絡(luò)側(cè)設(shè)備1220可以用于接收來自用戶終端1210的包含在所述網(wǎng)頁中的所述鏈接;響應(yīng)于確定所述鏈接屬于至少一個(gè)預(yù)定分組中的一個(gè)預(yù)定分組,將該預(yù)定分組的組標(biāo)識(shí)發(fā)送給所述用戶終端。用戶終端1210和網(wǎng)絡(luò)側(cè)設(shè)備1220的上述和其他操作和/或功能可以參考上述結(jié)合圖4至圖11進(jìn)行的描述,為了避免重復(fù),在此不再贅述。
[0147]以上已經(jīng)描述了本發(fā)明的各實(shí)施例,上述說明是示例性的,并非窮盡性的,并且也不限于所披露的各實(shí)施例。在不偏離所說明的各實(shí)施例的范圍和精神的情況下,對(duì)于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來說許多修改和變更都是顯而易見的。本文中所用術(shù)語的選擇,旨在最好地解釋各實(shí)施例的原理、實(shí)際應(yīng)用或?qū)κ袌?chǎng)中的技術(shù)的改進(jìn),或者使本【技術(shù)領(lǐng)域】的其它普通技術(shù)人員能理解本文披露的各實(shí)施例。
【權(quán)利要求】
1.一種用于處理網(wǎng)頁數(shù)據(jù)的方法,包含: 響應(yīng)于一網(wǎng)頁被打開,向網(wǎng)絡(luò)側(cè)設(shè)備發(fā)送包含在所述網(wǎng)頁中的鏈接; 從所述網(wǎng)絡(luò)側(cè)設(shè)備接收組標(biāo)識(shí),所述組標(biāo)識(shí)是由所述網(wǎng)絡(luò)側(cè)設(shè)備根據(jù)所述鏈接確定的、用于指示所述鏈接所屬的分組; 確定是否有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組;以及 響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述確定是否有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組包含: 將與已瀏覽鏈接對(duì)應(yīng)的字符串編碼和所述組標(biāo)識(shí)進(jìn)行比較; 將與所述組標(biāo)識(shí)匹配的字符串編碼對(duì)應(yīng)的已瀏覽鏈接確定為屬于所述組標(biāo)識(shí)指示的分組, 其中,與已瀏覽鏈接對(duì)應(yīng)的字符串編碼是通過對(duì)該已瀏覽鏈接利用與根據(jù)劃分在同一分組中的所有鏈接得到該分組的組標(biāo)識(shí)的函數(shù)相同的函數(shù)而得到的。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述函數(shù)為至少一個(gè)哈希函數(shù), 與已瀏覽鏈接對(duì)應(yīng)的字符串編碼通過如下方式得到:將該已瀏覽鏈接輸入到所述至少一個(gè)哈希函數(shù),以使得所述至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該已瀏覽鏈接設(shè)置的全為第一值的初始字符串編碼中的相應(yīng)位置置為第二值,以及 分組的組標(biāo)識(shí)通過如下方式得到:將劃分在同一分組中的所有鏈接中的每一個(gè)輸入到所述至少一個(gè)哈希函數(shù),以使得所述至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該分組設(shè)置的全為第一值的初始字符串編碼中的相應(yīng)位置置為第二值, 其中,所述第一值和所述第二值是從O和I中選擇的值,并且所述第二值與所述第一值不同。
4.根據(jù)權(quán)利要求3所述的方法,其中,將鏈接輸入到所述至少一個(gè)哈希函數(shù)包含將該鏈接的ASCII編碼或IP地址編碼輸入到所述至少一個(gè)哈希函數(shù)。
5.根據(jù)權(quán)利要求3所述的方法,其中,所述將與已瀏覽鏈接對(duì)應(yīng)的字符串編碼和所述組標(biāo)識(shí)進(jìn)行比較包含: 確定在所述與已瀏覽鏈接對(duì)應(yīng)的字符串編碼中被置為第二值的位置;以及 確定所述組標(biāo)識(shí)在所確定的位置處的值,并將所述值與第二值進(jìn)行比較, 所述將與所述組標(biāo)識(shí)匹配的字符串編碼對(duì)應(yīng)的已瀏覽鏈接確定為屬于所述組標(biāo)識(shí)指示的分組包含: 響應(yīng)于確定所述組標(biāo)識(shí)在所確定的位置處的值也被置為第二值,確定該已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組。
6.根據(jù)權(quán)利要求2所述的方法,還包含: 在所述網(wǎng)頁被打開的情況下,將該網(wǎng)頁的鏈接和與該網(wǎng)頁的鏈接對(duì)應(yīng)的字符串編碼關(guān)聯(lián)地存儲(chǔ)為瀏覽歷史記錄。
7.根據(jù)權(quán)利要求6所述的方法,其中,所述將該網(wǎng)頁的鏈接和與該網(wǎng)頁的鏈接對(duì)應(yīng)的字符串編碼關(guān)聯(lián)地存儲(chǔ)為瀏覽歷史記錄包含: 將該網(wǎng)頁的鏈接、與該網(wǎng)頁的鏈接對(duì)應(yīng)的字符串編碼以及對(duì)于該網(wǎng)頁的瀏覽信息關(guān)聯(lián)地存儲(chǔ)為瀏覽歷史記錄, 其中,所述提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過包含:通過輸出與該已瀏覽鏈接相關(guān)聯(lián)的瀏覽信息來提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
8.一種用于處理網(wǎng)頁數(shù)據(jù)的方法,包含: 接收來自用戶終端的包含在網(wǎng)頁中的鏈接;以及 響應(yīng)于確定所述鏈接屬于至少一個(gè)預(yù)定分組中的一個(gè)預(yù)定分組,將該預(yù)定分組的組標(biāo)識(shí)發(fā)送給所述用戶終端,以使所述用戶終端響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
9.根據(jù)權(quán)利要求8所述的方法,其中,在所述響應(yīng)于確定所述鏈接屬于至少一個(gè)預(yù)定分組中的一個(gè)預(yù)定分組、將該預(yù)定分組的組標(biāo)識(shí)發(fā)送給所述用戶終端之前,包含: 對(duì)已知鏈接指向的網(wǎng)頁內(nèi)容進(jìn)行抓??; 通過計(jì)算所述網(wǎng)頁內(nèi)容的相似性,對(duì)所述已知鏈接進(jìn)行劃分,以使得被劃分在同一分組中的鏈接指向的網(wǎng)頁內(nèi)容相同或相近,其中,劃分得到所述至少一個(gè)預(yù)定分組;以及對(duì)于每一個(gè)分組,根據(jù)該分組中的所有鏈接生成該分組的組標(biāo)識(shí),并將該分組的組標(biāo)識(shí)與該分組中的所有鏈接關(guān)聯(lián)地存儲(chǔ)。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述根據(jù)該分組中的所有鏈接生成該分組的組標(biāo)識(shí)包含: 通過對(duì)該分組中的所有鏈接利用至少一個(gè)哈希函數(shù)來生成該分組的組標(biāo)識(shí), 其中,該分組的組標(biāo)識(shí)通過如下方式得到:將劃分在該分組中的所有鏈接中的每一個(gè)輸入到所述至少一個(gè)哈希函數(shù),以使得所述至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該分組設(shè)置的全為第一值的初始字符串編碼中的相應(yīng)位置置為第二值, 其中,所述第一值和所述第二值是從O和I中選擇的值,并且所述第二值與所述第一值不同。
11.根據(jù)權(quán)利要求8所述的方法,還包含: 響應(yīng)于確定所述鏈接未屬于任何預(yù)定分組,獲取所述鏈接指向的網(wǎng)頁內(nèi)容; 根據(jù)所述鏈接指向的網(wǎng)頁內(nèi)容和所述至少一個(gè)預(yù)定分組中的鏈接指向的網(wǎng)頁內(nèi)容的相似性,對(duì)所述鏈接進(jìn)行分類; 響應(yīng)于所述鏈接被劃分到一個(gè)預(yù)定分組中,更新該預(yù)定分組的組標(biāo)識(shí)。
12.一種用于處理網(wǎng)頁數(shù)據(jù)的裝置,包含: 發(fā)送部件,被配置為響應(yīng)于一網(wǎng)頁被打開,向網(wǎng)絡(luò)側(cè)設(shè)備發(fā)送包含在所述網(wǎng)頁中的鏈接; 接收部件,被配置為從所述網(wǎng)絡(luò)側(cè)設(shè)備接收組標(biāo)識(shí),所述組標(biāo)識(shí)是由所述網(wǎng)絡(luò)側(cè)設(shè)備根據(jù)所述鏈接確定的、用于指示所述鏈接所屬的分組; 確定部件,被配置為確定是否有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組;以及提示部件,被配置為響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
13.根據(jù)權(quán)利要求12所述的裝置,其中,所述確定部件包含: 比較單元,被配置將與已瀏覽鏈接對(duì)應(yīng)的字符串編碼和所述組標(biāo)識(shí)進(jìn)行比較;確定單元,被配置為將與所述組標(biāo)識(shí)匹配的字符串編碼對(duì)應(yīng)的已瀏覽鏈接確定為屬于所述組標(biāo)識(shí)指示的分組,其中,與已瀏覽鏈接對(duì)應(yīng)的字符串編碼是通過對(duì)該已瀏覽鏈接利用與根據(jù)劃分在同一分組中的所有鏈接得到該分組的組標(biāo)識(shí)的函數(shù)相同的函數(shù)而得到的。
14.根據(jù)權(quán)利要求13所述的裝置,其中,所述函數(shù)為至少一個(gè)哈希函數(shù), 與已瀏覽鏈接對(duì)應(yīng)的字符串編碼通過如下方式得到:將該已瀏覽鏈接輸入到所述至少一個(gè)哈希函數(shù),以使得所述至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該已瀏覽鏈接設(shè)置的全為第一值的初始字符串編碼中的相應(yīng)位置置為第二值,以及 分組的組標(biāo)識(shí)通過如下方式得到:將劃分在同一分組中的所有鏈接中的每一個(gè)輸入到所述至少一個(gè)哈希函數(shù),以使得所述至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該分組設(shè)置的全為第一值的初始字符串編碼中的相應(yīng)位置置為第二值, 其中,所述第一值和所述第二值是從O和I中選擇的值,并且所述第二值與所述第一值不同。
15.根據(jù)權(quán)利要求14所述的裝置,其中,將鏈接輸入到所述至少一個(gè)哈希函數(shù)包含將該鏈接的ASCII編碼或IP地址編碼輸入到所述至少一個(gè)哈希函數(shù)。
16.根據(jù)權(quán)利要求14所述的裝置,其中,所述比較單元被配置為確定在所述與已瀏覽鏈接對(duì)應(yīng)的字符串編碼中被置為第二值的位置,以及確定所述組標(biāo)識(shí)在所確定的位置處的值,并將所述值與第 二值進(jìn)行比較; 所述確定單元被配置為響應(yīng)于確定所述組標(biāo)識(shí)在所確定的位置處的值也被置為第二值,確定該已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組。
17.根據(jù)權(quán)利要求13所述的裝置,還包含: 存儲(chǔ)部件,被配置為在所述網(wǎng)頁被打開的情況下,將該網(wǎng)頁的鏈接和與該網(wǎng)頁的鏈接對(duì)應(yīng)的字符串編碼關(guān)聯(lián)地存儲(chǔ)為瀏覽歷史記錄。
18.根據(jù)權(quán)利要求17所述的裝置,其中,所述存儲(chǔ)部件被配置為將該網(wǎng)頁的鏈接、與該網(wǎng)頁的鏈接對(duì)應(yīng)的字符串編碼以及對(duì)于該網(wǎng)頁的瀏覽信息關(guān)聯(lián)地存儲(chǔ)為瀏覽歷史記錄, 其中,所述提示部件被配置為通過輸出與該已瀏覽鏈接相關(guān)聯(lián)的瀏覽信息來提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
19.一種用于處理網(wǎng)頁數(shù)據(jù)的裝置,包含: 接收部件,被配置為接收來自用戶終端的包含在網(wǎng)頁中的鏈接;以及 發(fā)送部件,被配置為響應(yīng)于確定所述鏈接屬于至少一個(gè)預(yù)定分組中的一個(gè)預(yù)定分組,將該預(yù)定分組的組標(biāo)識(shí)發(fā)送給所述用戶終端,以使所述用戶終端響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過。
20.根據(jù)權(quán)利要求19所述的裝置,還包含: 抓取部件,被配置為對(duì)已知鏈接指向的網(wǎng)頁內(nèi)容進(jìn)行抓?。? 劃分部件,被配置為通過計(jì)算所述網(wǎng)頁內(nèi)容的相似性,對(duì)所述已知鏈接進(jìn)行劃分,以使得被劃分在同一分組中的鏈接指向的網(wǎng)頁內(nèi)容相同或相近,其中,劃分得到所述至少一個(gè)預(yù)定分組;以及 生成部件,被配置為對(duì)于每一個(gè)分組,根據(jù)該分組中的所有鏈接生成該分組的組標(biāo)識(shí),并將該分組的組標(biāo)識(shí)與該分組中的所有鏈接關(guān)聯(lián)地存儲(chǔ)。
21.根據(jù)權(quán)利要求20所述的裝置,其中,所述生成部件被配置為通過對(duì)該分組中的所有鏈接利用至少一個(gè)哈希函數(shù)來生成該分組的組標(biāo)識(shí), 其中,該分組的組標(biāo)識(shí)通過如下方式得到:將劃分在該分組中的所有鏈接中的每一個(gè)輸入到所述至少一個(gè)哈希函數(shù),以使得所述至少一個(gè)哈希函數(shù)中的每一個(gè)輸出的結(jié)果將預(yù)先針對(duì)該分組設(shè)置的全為第一值的初始字符串編碼中的相應(yīng)位置置第二值, 其中,所述第一值和所述第二值是從O和I中選擇的值,并且所述第二值與所述第一值不同。
22.根據(jù)權(quán)利要求19所述的裝置,還包含: 獲取部件,被配置為響應(yīng)于確定所述鏈接未屬于任何預(yù)定分組,獲取所述鏈接指向的網(wǎng)頁內(nèi)容; 分類部件,被配置為根據(jù)所述鏈接指向的網(wǎng)頁內(nèi)容和所述至少一個(gè)預(yù)定分組中的鏈接指向的網(wǎng)頁內(nèi)容的相似性,對(duì)所述鏈接進(jìn)行分類; 更新部件,被配置為響應(yīng)于所述鏈接被劃分到一個(gè)預(yù)定分組中,更新該預(yù)定分組的組標(biāo)識(shí)。
23.一種用于處理網(wǎng)頁數(shù)據(jù)的系統(tǒng),包含用戶終端和網(wǎng)絡(luò)側(cè)設(shè)備,其中: 所述用戶終端被 配置為響應(yīng)于一網(wǎng)頁被打開,向所述網(wǎng)絡(luò)側(cè)設(shè)備發(fā)送包含在所述網(wǎng)頁中的鏈接;從所述網(wǎng)絡(luò)側(cè)設(shè)備接收組標(biāo)識(shí),所述組標(biāo)識(shí)是由所述網(wǎng)絡(luò)側(cè)設(shè)備根據(jù)所述鏈接確定的、用于指示所述鏈接所屬的分組;確定是否有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組;響應(yīng)于確定有已瀏覽鏈接屬于所述組標(biāo)識(shí)指示的分組,提示所述包含在所述網(wǎng)頁中的鏈接所指向的網(wǎng)頁內(nèi)容已被瀏覽過;以及 所述網(wǎng)絡(luò)側(cè)設(shè)備被配置為接收來自所述用戶終端的包含在所述網(wǎng)頁中的所述鏈接;響應(yīng)于確定所述鏈接屬于至少一個(gè)預(yù)定分組中的一個(gè)預(yù)定分組,將該預(yù)定分組的組標(biāo)識(shí)發(fā)送給所述用戶終端。
【文檔編號(hào)】G06F17/30GK104021124SQ201310064517
【公開日】2014年9月3日 申請(qǐng)日期:2013年2月28日 優(yōu)先權(quán)日:2013年2月28日
【發(fā)明者】段東旭, 包勝華, 孫長(zhǎng)華, 錢偉紅 申請(qǐng)人:國際商業(yè)機(jī)器公司