網(wǎng)頁模板生成方法和服務(wù)器的制造方法
【專利摘要】本發(fā)明公開了一種網(wǎng)頁模板生成方法和服務(wù)器。該網(wǎng)頁模板生成方法包括:采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù),根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板。通過本發(fā)明,解決了現(xiàn)有技術(shù)中的網(wǎng)頁模板生成方法對(duì)目標(biāo)網(wǎng)站依賴性比較強(qiáng)的問題,降低了網(wǎng)頁模板生成方法對(duì)目標(biāo)網(wǎng)站的依賴性。
【專利說明】網(wǎng)頁模板生成方法和服務(wù)器
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動(dòng)瀏覽器領(lǐng)域,具體而言,涉及一種網(wǎng)頁模板生成方法和服務(wù)器。
【背景技術(shù)】
[0002]針對(duì)網(wǎng)頁瀏覽,在現(xiàn)有技術(shù)中提出了一種壓縮技術(shù),通過擴(kuò)展HTTP請(qǐng)求,允許網(wǎng)站提供模板和增量文件,在客戶端訪問相同模板網(wǎng)頁時(shí),僅第一次需要下載模板,其它請(qǐng)求僅需要下載增量文件,使用增量文件和模板文件重建原始頁面,從而減少客戶端的訪問流量。因此,該技術(shù)可以利用多網(wǎng)頁之間的相同部分來壓縮流量。
[0003]發(fā)明人發(fā)現(xiàn)該技術(shù)的缺陷在于目標(biāo)網(wǎng)站必須支持該協(xié)議,對(duì)目標(biāo)網(wǎng)站的依賴性比較強(qiáng),并且需要目標(biāo)網(wǎng)站自己提供模板和對(duì)應(yīng)的增量文件,這也是該壓縮技術(shù)不能廣泛推廣的原因之一。
[0004]另外,現(xiàn)有技術(shù)的自動(dòng)生成模板的方式主要是依據(jù)解析網(wǎng)頁DOM (DocumentObject Model)樹結(jié)構(gòu),提取公共部分,此方法計(jì)算量大,不易提取,兼容性不強(qiáng)。而且,現(xiàn)有的常用的模板生成程序是對(duì)單個(gè)網(wǎng)站的,處理規(guī)模小。
[0005]針對(duì)現(xiàn)有技術(shù)中的網(wǎng)頁模板生成方法對(duì)目標(biāo)網(wǎng)站依賴性比較強(qiáng)的問題,目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的主要目的在于提供一種網(wǎng)頁模板生成方法和服務(wù)器,以解決現(xiàn)有技術(shù)中的網(wǎng)頁模板生成方法對(duì)目標(biāo)網(wǎng)站依賴性比較強(qiáng)的問題。
[0007]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了 一種網(wǎng)頁模板生成方法。根據(jù)本發(fā)明的網(wǎng)頁模板生成方法包括:采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù);根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板;根據(jù)生成的網(wǎng)頁模板生成模板索引。
[0008]進(jìn)一步地,在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后,網(wǎng)頁模板生成方法還包括:向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布網(wǎng)頁模板和模板索引;多個(gè)模板服務(wù)器分別存儲(chǔ)網(wǎng)頁模板和模板索引;多個(gè)模板服務(wù)器中的第一模板服務(wù)器利用模板索引檢索與網(wǎng)頁匹配的網(wǎng)頁模板,向多個(gè)模板服務(wù)器中除第一模板服務(wù)器之外的其它模板服務(wù)器提供與網(wǎng)頁匹配的模板。
[0009]進(jìn)一步地,向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布網(wǎng)頁模板和模板索引包括:在生成多個(gè)網(wǎng)頁模板和模板索引之后;計(jì)算多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率;判斷整體差異率是否大于預(yù)設(shè)整體差異率閾值;如果判斷出整體差異率大于預(yù)設(shè)整體差異率閾值,則發(fā)布網(wǎng)頁模板和模板索引;如果判斷出整體差異率不大于預(yù)設(shè)整體差異率閾值,則不發(fā)布網(wǎng)頁模板和模板索引。
[0010]進(jìn)一步地,根據(jù)生成的網(wǎng)頁模板生成模板索引包括:選取質(zhì)量符合預(yù)定質(zhì)量條件的模板;確定模板適用的URL路徑;WURL路徑中選取質(zhì)量符合預(yù)定質(zhì)量條件的模板適用的URL路徑;將選取的路徑轉(zhuǎn)換成模板索引。[0011]進(jìn)一步地,在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后,網(wǎng)頁模板生成方法還包括:判斷網(wǎng)頁模板的數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量;如果判斷出網(wǎng)頁模板的數(shù)量達(dá)到預(yù)設(shè)數(shù)量,則計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率;將覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板進(jìn)行對(duì)比;如果小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值,則將小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板合并。
[0012]進(jìn)一步地,將覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板進(jìn)行對(duì)比包括:將多個(gè)網(wǎng)頁模板按照覆蓋率大小進(jìn)行由大到小的排序;將排在后面的網(wǎng)頁模板與排在前面的網(wǎng)頁模板進(jìn)行對(duì)比。
[0013]進(jìn)一步地,根據(jù)生成的網(wǎng)頁模板生成模板索引包括:存儲(chǔ)多個(gè)網(wǎng)頁模板;計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率;判斷每個(gè)路徑下的網(wǎng)頁模板的覆蓋率的總和是否達(dá)到第二預(yù)設(shè)覆蓋率閾值;刪除網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板。
[0014]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種網(wǎng)頁模板生成服務(wù)器。根據(jù)本發(fā)明的網(wǎng)頁模板生成服務(wù)器包括:采集單元,用于采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù);生成單元,用于根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板;索引單元,用于根據(jù)生成的網(wǎng)頁模板生成模板索引。
[0015]進(jìn)一步地,網(wǎng)頁模板生成服務(wù)器還包括:發(fā)布單元,用于在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后,向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布網(wǎng)頁模板和模板索引;存儲(chǔ)單元,用于在多個(gè)模板服務(wù)器分別存儲(chǔ)網(wǎng)頁模板和模板索引;模板檢索單元,用于利用模板索引檢索與網(wǎng)頁匹配的網(wǎng)頁模板,向其它服務(wù)器提供與網(wǎng)頁匹配的模板。
[0016]進(jìn)一步地,發(fā)布單元包括:計(jì)算模塊,用于計(jì)算多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率;判斷模塊,用于判斷整體差異率是否大于預(yù)設(shè)整體差異率閾值;發(fā)布模塊,用于在判斷出整體差異率大于預(yù)設(shè)整體差異率閾值,發(fā)布網(wǎng)頁模板,在判斷出整體差異率不大于預(yù)設(shè)整體差異率閾值,不發(fā)布網(wǎng)頁模板。
[0017]進(jìn)一步地,索引單元包括:模板選取模塊,用于選取質(zhì)量符合預(yù)定質(zhì)量條件的模板;模板路徑推導(dǎo)模塊,用于確定模板適用的URL路徑;模板路徑剪枝模塊,用于從URL路徑中選取質(zhì)量符合預(yù)定質(zhì)量條件的模板適用的URL路徑;模板索引生成模塊,用于將選取的路徑轉(zhuǎn)換成模板索引。
[0018]進(jìn)一步地,網(wǎng)頁模板生成服務(wù)器還包括:判斷單元,用于在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后判斷網(wǎng)頁模板的數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量;計(jì)算單元,用于在判斷出網(wǎng)頁模板的數(shù)量達(dá)到預(yù)設(shè)數(shù)量時(shí),計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率;對(duì)比單元,用于將覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板進(jìn)行對(duì)比;合并單元,用于在小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值,將小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板合并。
[0019]進(jìn)一步地,對(duì)比單元包括:排序模塊,用于將多個(gè)網(wǎng)頁模板按照覆蓋率大小進(jìn)行由大到小的排序;對(duì)比模塊,用于將排在后面的網(wǎng)頁模板與排在前面的網(wǎng)頁模板進(jìn)行對(duì)比。
[0020]進(jìn)一步地,索引單元包括:存儲(chǔ)模塊,用于在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后,存儲(chǔ)多個(gè)網(wǎng)頁模板;計(jì)算模塊,用于計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率;第三判斷模塊,用于判斷每個(gè)路徑下的網(wǎng)頁模板的覆蓋率的總和是否達(dá)到第二預(yù)設(shè)覆蓋率閾值;刪除模塊,用于刪除網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板。
[0021 ] 通過本發(fā)明,采用采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù),根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板,解決了現(xiàn)有技術(shù)中的網(wǎng)頁模板生成方法對(duì)目標(biāo)網(wǎng)站依賴性比較強(qiáng)的問題,進(jìn)而達(dá)到了降低網(wǎng)頁模板生成方法對(duì)目標(biāo)網(wǎng)站的依賴性的效果。
【專利附圖】
【附圖說明】
[0022]構(gòu)成本申請(qǐng)的一部分的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0023]圖1是根據(jù)本發(fā)明第一實(shí)施例的網(wǎng)頁模板生成方法的流程圖;
[0024]圖2是根據(jù)本發(fā)明第二實(shí)施例的網(wǎng)頁模板生成方法的流程圖;
[0025]圖3是根據(jù)本發(fā)明第三實(shí)施例的網(wǎng)頁模板生成方法的流程圖;
[0026]圖4是根據(jù)本發(fā)明第四實(shí)施例的網(wǎng)頁模板生成方法的流程圖;
[0027]圖5是根據(jù)本發(fā)明第一實(shí)施例的網(wǎng)頁模板生成服務(wù)器的示意圖;
[0028]圖6是根據(jù)本發(fā)明第二實(shí)施例的網(wǎng)頁模板生成服務(wù)器的示意圖;
[0029]圖7是根據(jù)本發(fā)明第三實(shí)施例的網(wǎng)頁模板生成服務(wù)器的示意圖;以及
[0030]圖8是根據(jù)本發(fā)明第四實(shí)施例的網(wǎng)頁模板生成服務(wù)器的示意圖。
【具體實(shí)施方式】
[0031]需要說明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。
[0032]為了使本【技術(shù)領(lǐng)域】的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
[0033]需要說明的是,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
[0034]本發(fā)明實(shí)施例提供了 一種網(wǎng)頁模板生成方法。
[0035]圖1是根據(jù)本發(fā)明第一實(shí)施例的網(wǎng)頁模板生成方法的流程圖。如圖所示,該網(wǎng)頁模板生成方法包括如下步驟:
[0036]步驟S101,采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)。采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)是需要瀏覽網(wǎng)頁的網(wǎng)頁數(shù)據(jù),網(wǎng)頁的網(wǎng)頁數(shù)據(jù)來自一個(gè)客戶端或多個(gè)客戶端,采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以是來自一個(gè)客戶端的一個(gè)或者多個(gè)網(wǎng)頁的網(wǎng)頁數(shù)據(jù),采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)還可以是相同域名或不同域名下網(wǎng)頁的數(shù)據(jù)。存儲(chǔ)這些采集到的網(wǎng)頁數(shù)據(jù)。[0037]需要說明的是,采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以根據(jù)用戶瀏覽網(wǎng)頁的需要進(jìn)行采集,上述網(wǎng)頁的網(wǎng)頁數(shù)據(jù)的來源只是為了舉例說明可以采集上述來源的網(wǎng)頁的數(shù)據(jù),并不用于限定在采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)過程中一定要采集上述所有網(wǎng)頁來源的所有網(wǎng)頁的網(wǎng)頁數(shù)據(jù)。
[0038]步驟S102,根據(jù)采集到的網(wǎng)頁數(shù)據(jù)生成該網(wǎng)頁的網(wǎng)頁模板。
[0039]生成網(wǎng)頁模板可以利用一種局部敏感的哈希算法(simhash)算法計(jì)算生成。具體地,可以利用simhash算法對(duì)網(wǎng)頁數(shù)據(jù)生成一個(gè)N位的哈希值,對(duì)生成的N位哈希值通過隨機(jī)散列取前綴的方法生成T個(gè)標(biāo)簽值,對(duì)每個(gè)標(biāo)簽值從同域名下的網(wǎng)頁模板中查找網(wǎng)頁模板,如果找到合適的網(wǎng)頁模板,可以將查找到的網(wǎng)頁模板作為需要瀏覽網(wǎng)頁的網(wǎng)頁模板進(jìn)行增量數(shù)據(jù)的傳輸,如果沒有找到合適的網(wǎng)頁模板,可以將需要瀏覽的網(wǎng)頁模板作為網(wǎng)頁模板存儲(chǔ)在模板庫中。
[0040]步驟S103,根據(jù)生成的網(wǎng)頁模板生成模板索引。為了模板調(diào)用方便,根據(jù)生成的網(wǎng)頁模板生成模板索引,利用模板索引查找匹配的網(wǎng)頁模板。
[0041]由于通過上述方法生成的網(wǎng)頁模板可能會(huì)導(dǎo)致出現(xiàn)相同或相似的網(wǎng)頁模板,這些相同或相似的模板可能存儲(chǔ)在不同的客戶端中,為了使得到的網(wǎng)頁模板減少存儲(chǔ)空間的占用以及使得得到的網(wǎng)頁模板更加有代表性,可以保留相同或相似的網(wǎng)頁模板中的其中一個(gè),將其余相同或相似的模板刪除。
[0042]在該實(shí)施例中,在建立網(wǎng)頁模板時(shí),可以利用采集到的網(wǎng)頁數(shù)據(jù)建立該網(wǎng)頁的網(wǎng)頁模板,這樣,模板的建立不依賴于特定的目標(biāo)網(wǎng)站,降低了對(duì)目標(biāo)網(wǎng)站的依賴性,能夠針對(duì)任何的目標(biāo)網(wǎng)站建立相應(yīng)的網(wǎng)頁模板。
[0043]圖2是根據(jù)本發(fā)明第二實(shí)施例的網(wǎng)頁模板生成方法的流程圖。如圖所述,該網(wǎng)頁模板生成方法包括如下步驟:
[0044]步驟S201,采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)。采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以是需要瀏覽網(wǎng)頁的網(wǎng)頁數(shù)據(jù),網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以來自一個(gè)客戶端或多個(gè)客戶端,采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以是來自一個(gè)客戶端的一個(gè)或者多個(gè)網(wǎng)頁的網(wǎng)頁數(shù)據(jù),采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)還可以是相同域名或不同域名下網(wǎng)頁的數(shù)據(jù)。
[0045]需要說明的是,采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以根據(jù)用戶瀏覽網(wǎng)頁的需要進(jìn)行采集,上述網(wǎng)頁的網(wǎng)頁數(shù)據(jù)的來源只是為了舉例說明可以采集上述來源的網(wǎng)頁的數(shù)據(jù),并不用于限定在采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)過程中一定要采集上述所有網(wǎng)頁來源的所有網(wǎng)頁的網(wǎng)頁數(shù)據(jù)。
[0046]步驟S202,根據(jù)采集到的網(wǎng)頁數(shù)據(jù)生成該網(wǎng)頁的網(wǎng)頁模板。
[0047]由于通過上述步驟生成的模板不止一個(gè),為了能夠獲得與用戶瀏覽的網(wǎng)頁匹配的網(wǎng)頁模板,還需要對(duì)生成的網(wǎng)頁模板進(jìn)行篩選。為了篩選方便,首先執(zhí)行以下步驟S203至步驟S205。
[0048]步驟S203,向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布網(wǎng)頁模板和模板索引。在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后,可以向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布網(wǎng)頁模板。其中,多個(gè)模板服務(wù)器可以向不同的網(wǎng)站提供網(wǎng)頁模板。
[0049]步驟S204,多個(gè)模板服務(wù)器分別存儲(chǔ)網(wǎng)頁模板和模板索引。多個(gè)模板服務(wù)器分別存儲(chǔ)接收到的網(wǎng)頁模板,這樣,在多個(gè)模板服務(wù)器中的每個(gè)模板服務(wù)器中都存在網(wǎng)頁模板,需要在該網(wǎng)頁模板的基礎(chǔ)上傳輸網(wǎng)頁數(shù)據(jù)的時(shí)候,可以選擇多個(gè)模板服務(wù)器中的網(wǎng)絡(luò)狀況較好的模板服務(wù)器中的網(wǎng)頁模板進(jìn)行增量數(shù)據(jù)的傳輸,從而增加了調(diào)用網(wǎng)頁模板的方便性和可靠性。
[0050]步驟S205,多個(gè)模板服務(wù)器中的第一模板服務(wù)器利用模板索引檢索與網(wǎng)頁匹配的網(wǎng)頁模板,向該多個(gè)模板服務(wù)器中除第一模板服務(wù)器外的其它模板服務(wù)器提供與網(wǎng)頁匹配的模板,第一模板服務(wù)器可以為多個(gè)模板服務(wù)器中的任意一個(gè)模板服務(wù)器。利用模板索弓I快速確定一個(gè)網(wǎng)頁請(qǐng)求是否匹配服務(wù)器中存儲(chǔ)的網(wǎng)頁模板,并且根據(jù)請(qǐng)求網(wǎng)頁的網(wǎng)址確定匹配的網(wǎng)頁模板。在確定與網(wǎng)頁匹配的網(wǎng)頁模板之后,將匹配的網(wǎng)頁模板發(fā)送至其他模板服務(wù)器。
[0051]考慮到上述過程要處理的數(shù)據(jù)量極大,可以使用Hadoop等分布式計(jì)算框架構(gòu)建程序,使用HBase等大數(shù)據(jù)量存儲(chǔ)服務(wù)。另外,為了增加可靠性,發(fā)明實(shí)施例的網(wǎng)頁模板生成方法例如采集網(wǎng)頁數(shù)據(jù)、生成網(wǎng)頁模板、網(wǎng)頁模板發(fā)布和網(wǎng)頁模板檢索等,都可以在多個(gè)服務(wù)器上部署,使得多個(gè)服務(wù)器協(xié)同服務(wù),即本發(fā)明的網(wǎng)頁模板生成服務(wù)器的功能可以由多個(gè)共同服務(wù)器完成。
[0052]圖3是根據(jù)本發(fā)明第三實(shí)施例的網(wǎng)頁模板生成方法的流程圖。該圖所示實(shí)施例可以作為圖2所示實(shí)施例中步驟S203向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布網(wǎng)頁模板和模板索引的優(yōu)選實(shí)施方式,在執(zhí)行圖2所示步驟S202之后,執(zhí)行以下步驟:
[0053]步驟S301,在生成多個(gè)網(wǎng)頁模板之后,建立多個(gè)網(wǎng)頁模板的索引。在生成多個(gè)網(wǎng)頁模板之后,為了方便查找網(wǎng)頁模板建立多個(gè)網(wǎng)頁模板索引。網(wǎng)頁模板索引可以通過網(wǎng)址或者域名來索引網(wǎng)頁模板。具體地,為了提高索引網(wǎng)頁模板的準(zhǔn)確性,可以利用生成行標(biāo)簽值或者域名的MD5值獲得網(wǎng)頁模板的索引。
[0054]步驟S302,計(jì)算多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率。為了避免網(wǎng)頁模板的變動(dòng)較小時(shí)更換網(wǎng)頁模板重新生成增量文件而造成的資源浪費(fèi),因此計(jì)算多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率。
[0055]步驟S303,判斷整體差異率是否大于預(yù)設(shè)整體差異率閾值。判斷多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率是否大于預(yù)設(shè)整體差異率閾值,如果多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率大于預(yù)設(shè)整體差異率閾值,則網(wǎng)頁模板變動(dòng)較大,直接發(fā)布網(wǎng)頁模板,如果多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率小于預(yù)設(shè)整體差異率閾值,則網(wǎng)頁模板變動(dòng)較小,不發(fā)布網(wǎng)頁模板。
[0056]步驟S304,如果判斷出整體差異率大于預(yù)設(shè)整體差異率閾值,則發(fā)布網(wǎng)頁模板。如果多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率大于預(yù)設(shè)整體差異閾值,表示生成的多個(gè)網(wǎng)頁模板的集合較歷史模板集合的變動(dòng)較大,可以發(fā)布網(wǎng)頁模板。
[0057]步驟S305,如果判斷出整體差異率不大于預(yù)設(shè)整體差異率閾值,則不發(fā)布網(wǎng)頁模板。如果多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率小于預(yù)設(shè)整體差異閾值,表示生成的多個(gè)網(wǎng)頁模板的集合較歷史模板集合的變動(dòng)較小,可以基于歷史模板進(jìn)行增量文件傳輸,可以不發(fā)布網(wǎng)頁模板。
[0058]為了方便在生成的網(wǎng)頁模板中與網(wǎng)頁匹配的網(wǎng)頁模板,根據(jù)生成的網(wǎng)頁模板生成模板索引,生成模板索引的方法如下:
[0059]首先,選取質(zhì)量符合預(yù)定質(zhì)量條件的模板。在生成的網(wǎng)頁模板中查找符合預(yù)定質(zhì)量條件的模板,其中,預(yù)定質(zhì)量條件可以是模板對(duì)用戶訪問的網(wǎng)頁的覆蓋率大于預(yù)定閾值,質(zhì)量符合預(yù)定質(zhì)量條件的模板相較于質(zhì)量不符合預(yù)定質(zhì)量條件的模板能夠節(jié)約差量數(shù)據(jù)的傳輸量。
[0060]其次,確定模板適用的URL路徑。根據(jù)模板使用的URL路徑查找該路徑下的所有網(wǎng)頁模板,從而能夠提高查找網(wǎng)頁模板的速度。
[0061]再次,從URL路徑中選取質(zhì)量符合預(yù)定質(zhì)量條件的模板適用的URL路徑。由于短路徑的模板的覆蓋度更好,因此查找URL路徑可以從距離根目錄最近的短路徑開始查找。
[0062]最后,將選取的路徑轉(zhuǎn)換成模板索引。將根據(jù)URL路徑選取的網(wǎng)頁模板的路徑與用戶訪問的網(wǎng)頁相對(duì)應(yīng),形成模板索引。
[0063]圖4是根據(jù)本發(fā)明第四實(shí)施例的網(wǎng)頁模板生成方法的流程圖。如圖所示,該圖所示實(shí)施例可以作為圖1所示實(shí)施例的優(yōu)選實(shí)施方式,具體步驟如下:
[0064]步驟S401,采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)。采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以是需要瀏覽網(wǎng)頁的網(wǎng)頁數(shù)據(jù),網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以來自一個(gè)客戶端或多個(gè)客戶端,采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以是來自一個(gè)客戶端的一個(gè)或者多個(gè)網(wǎng)頁的網(wǎng)頁數(shù)據(jù),采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)還可以是相同域名或不同域名下網(wǎng)頁的數(shù)據(jù)。
[0065]步驟S402,判斷網(wǎng)頁模板的數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量。在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后,需要判斷網(wǎng)頁模板的數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量,如果判斷出網(wǎng)頁模板的數(shù)量沒有達(dá)到預(yù)設(shè)數(shù)量,可以繼續(xù)根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板,如果判斷出網(wǎng)頁模板的數(shù)量達(dá)到預(yù)設(shè)數(shù)量,可以計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率。
[0066]步驟S403,如果判斷出網(wǎng)頁模板的數(shù)量達(dá)到預(yù)設(shè)數(shù)量,則計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率。模板覆蓋率是衡量生成的網(wǎng)頁模板質(zhì)量的重要指標(biāo),模板覆蓋率可以是一個(gè)網(wǎng)站內(nèi),網(wǎng)頁模板能夠應(yīng)用到網(wǎng)站內(nèi)的網(wǎng)頁上的數(shù)量與該網(wǎng)站全部網(wǎng)頁數(shù)量的比值,模板覆蓋率越大,能應(yīng)用到該網(wǎng)站內(nèi)網(wǎng)頁的數(shù)量也就越多。模板覆蓋率不僅可以衡量一個(gè)網(wǎng)站的網(wǎng)站模板質(zhì)量,還可以衡量某一個(gè)路徑下的網(wǎng)頁模板的質(zhì)量。例如,某個(gè)網(wǎng)頁模板的網(wǎng)站覆蓋率不是很高,但是在某個(gè)路徑下的覆蓋率很高,該網(wǎng)頁模板在實(shí)際應(yīng)用中也能達(dá)到很好的效果。
[0067]步驟S404,將覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板進(jìn)行對(duì)比。在計(jì)算出每個(gè)網(wǎng)頁模板的覆蓋率之后,為了避免網(wǎng)頁模板變動(dòng)較小的情況下重新選擇相似的網(wǎng)頁模板進(jìn)行增量文件傳輸,可以比較覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的模板與覆蓋率大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板。
[0068]步驟S405,如果小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值,則將小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板合并。小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率可以是兩個(gè)模板以open-vcdiff算法算出兩個(gè)網(wǎng)頁模板的差值與小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的大小的比值,小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率可以用來衡量小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異程度。
[0069]如果小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值,則認(rèn)為小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板相似,將小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板合并,合并的過程可以是將小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的數(shù)據(jù)合并到大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的數(shù)據(jù)中。[0070]優(yōu)選地,為了方便的將將覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板進(jìn)行對(duì)比,可以將多個(gè)網(wǎng)頁模板按照覆蓋率大小進(jìn)行由大到小的排序,然后將排在后面的網(wǎng)頁模板與排在前面的網(wǎng)頁模板進(jìn)行對(duì)比。
[0071]在對(duì)多個(gè)網(wǎng)頁模板按照覆蓋率大小進(jìn)行由大到小的排序之后,通過對(duì)隊(duì)列中的網(wǎng)頁模板進(jìn)行兩兩比較或者逐個(gè)比較,能夠?qū)⒕W(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值的網(wǎng)頁模板合并。
[0072]在將網(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值的網(wǎng)頁模板合并之后,根據(jù)網(wǎng)頁的網(wǎng)址或者域名得到網(wǎng)頁模板索引將該網(wǎng)頁模板數(shù)據(jù)和網(wǎng)頁模板索引都發(fā)布出去。
[0073]為了方便存儲(chǔ)和調(diào)用,優(yōu)選地,根據(jù)生成的網(wǎng)頁模板生成模板索引包括如下步驟:
[0074]步驟S501,存儲(chǔ)多個(gè)網(wǎng)頁模板。為了方便模板的調(diào)用,在生成網(wǎng)頁的網(wǎng)頁模板之后,存儲(chǔ)生成的多個(gè)網(wǎng)頁模板。
[0075]步驟S502,計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率。由于接近根目錄的模板通常具有更好的覆蓋率,查找模板的時(shí)候優(yōu)先處理接近根目錄的模板,因此在計(jì)算多個(gè)網(wǎng)頁模板的時(shí)候,首先將生成的網(wǎng)頁模板按照路徑深度進(jìn)行排序,短路徑相對(duì)于深路徑的網(wǎng)頁模板的排列位置更靠近根目錄。
[0076]由于已經(jīng)對(duì)多個(gè)網(wǎng)頁模板按照路徑深度進(jìn)行排序,在計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率時(shí)可以計(jì)算一個(gè)路徑下每個(gè)網(wǎng)頁模板的覆蓋率。其中,每個(gè)網(wǎng)頁模板的覆蓋率可以是該網(wǎng)頁模板相對(duì)于整個(gè)路徑下的所有網(wǎng)頁模板的覆蓋率。
[0077]為了便于使用覆蓋率較大的網(wǎng)頁模板進(jìn)行增量文件的傳輸,可以按覆蓋率從高到低進(jìn)行排序。同時(shí),在同一路徑下網(wǎng)頁模板數(shù)量較多時(shí),可以按照路徑深度從長到短的順序截取一定數(shù)量的網(wǎng)頁模板,避免同一路徑下網(wǎng)頁模板數(shù)量較多降低計(jì)算速度。
[0078]步驟S503,判斷每個(gè)路徑下的網(wǎng)頁模板的覆蓋率的總和是否達(dá)到第二預(yù)設(shè)覆蓋率閾值。
[0079]在計(jì)算出每個(gè)網(wǎng)頁模板的覆蓋率之后,判斷每個(gè)路徑下的網(wǎng)頁模板的覆蓋率的總和是否達(dá)到第二預(yù)設(shè)覆蓋率閾值,如果達(dá)到第二預(yù)設(shè)覆蓋率閾值保留此路徑;如果判斷出每個(gè)路徑下的網(wǎng)頁模板的覆蓋率總和沒有達(dá)到第二預(yù)設(shè)覆蓋率閾值,則將網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板刪除。
[0080]步驟S504,刪除網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板。由于網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值,那么網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板都不需要再進(jìn)行處理和使用,因此可以將網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板刪除,以節(jié)省存儲(chǔ)資源。
[0081]通過上述步驟S501至步驟S504能夠根據(jù)生成的網(wǎng)頁模板生成模板索引。從而在用戶訪問網(wǎng)頁時(shí)可以利用模板索引查找匹配的網(wǎng)頁模板。
[0082]圖5是根據(jù)本發(fā)明第一實(shí)施例的網(wǎng)頁模板生成服務(wù)器的示意圖,該網(wǎng)頁模板生成服務(wù)器可以和前述實(shí)施例中的模板服務(wù)器為同一個(gè)服務(wù)器。如圖所示,該網(wǎng)頁模板生成服務(wù)器包括采集單元10、生成單元30和索引單元60。
[0083]采集單元10用于采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)。采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以是需要瀏覽網(wǎng)頁的網(wǎng)頁數(shù)據(jù),網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以來自一個(gè)客戶端或多個(gè)客戶端,采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以是來自一個(gè)客戶端的一個(gè)或者多個(gè)網(wǎng)頁的網(wǎng)頁數(shù)據(jù),采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)還可以是相同域名或不同域名下網(wǎng)頁的數(shù)據(jù)。存儲(chǔ)這些采集到的網(wǎng)頁數(shù)據(jù)。
[0084]需要說明的是,采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)可以根據(jù)用戶瀏覽網(wǎng)頁的需要進(jìn)行采集,上述網(wǎng)頁的網(wǎng)頁數(shù)據(jù)的來源只是為了舉例說明可以采集上述來源的網(wǎng)頁的數(shù)據(jù),并不用于限定在采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù)過程中一定要采集上述所有網(wǎng)頁來源的所有網(wǎng)頁的網(wǎng)頁數(shù)據(jù)。
[0085]生成單元30用于根據(jù)采集到的網(wǎng)頁數(shù)據(jù)生成該網(wǎng)頁對(duì)應(yīng)的模板,例如,可以根據(jù)網(wǎng)頁的網(wǎng)頁數(shù)據(jù)生成該網(wǎng)頁的網(wǎng)頁模板。
[0086]生成網(wǎng)頁模板可以利用一種局部敏感的哈希算法(simhash)算法計(jì)算生成。具體地,可以利用simhash算法對(duì)網(wǎng)頁數(shù)據(jù)生成一個(gè)N位的哈希值,對(duì)生成的N位哈希值通過隨機(jī)散列取前綴的方法生成T個(gè)標(biāo)簽值,對(duì)每個(gè)標(biāo)簽值從同域名下的網(wǎng)頁模板中查找網(wǎng)頁模板,如果找到合適的網(wǎng)頁模板,可以將查找到的網(wǎng)頁模板作為需要瀏覽網(wǎng)頁的網(wǎng)頁模板進(jìn)行增量數(shù)據(jù)的傳輸,如果沒有找到合適的網(wǎng)頁模板,可以將需要瀏覽的網(wǎng)頁模板作為網(wǎng)頁模板存儲(chǔ)在模板庫中。
[0087]索引單元60用于根據(jù)生成的網(wǎng)頁模板生成模板索引。索引單元能夠根據(jù)生成的網(wǎng)頁模板可以建立網(wǎng)頁模板的URL路徑與模板的映射關(guān)系,將該映射關(guān)系作為模板索引。
[0088]由于通過上述方法生成的網(wǎng)頁模板可能會(huì)導(dǎo)致出現(xiàn)相同或相似的網(wǎng)頁模板,這些相同或相似的模板可能存儲(chǔ)在不同的客戶端中,為了使得到的網(wǎng)頁模板減少存儲(chǔ)空間的占用以及使得得到的網(wǎng)頁模板更加有代表性,可以保留相同或相似的網(wǎng)頁模板中的其中一個(gè),將其余相同或相似的模板刪除。
[0089]在該實(shí)施例中,在建立網(wǎng)頁模板時(shí),可以利用采集到的網(wǎng)頁數(shù)據(jù)建立該網(wǎng)頁的網(wǎng)頁模板,這樣,模板的建立不依賴于特定的目標(biāo)網(wǎng)站,降低了對(duì)目標(biāo)網(wǎng)站的依賴性,能夠針對(duì)任何的目標(biāo)網(wǎng)站建立相應(yīng)的網(wǎng)頁模板。
[0090]圖6是根據(jù)本發(fā)明第二實(shí)施例的網(wǎng)頁模板生成服務(wù)器的示意圖。該實(shí)施例可以作為圖5所示實(shí)施例的優(yōu)選實(shí)施方式,如圖所示,該網(wǎng)頁模板生成服務(wù)器包括采集單元10、生成單元30、發(fā)布單元40、存儲(chǔ)單元50、索引單元60和模板檢索單元20。
[0091]發(fā)布單元40用于在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后,向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布網(wǎng)頁模板。在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后,可以向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布網(wǎng)頁模板。其中,多個(gè)模板服務(wù)器可以向多個(gè)網(wǎng)站發(fā)送網(wǎng)頁模板,還可以采集來自多個(gè)網(wǎng)站的網(wǎng)頁數(shù)據(jù)。
[0092]存儲(chǔ)單元50用于在多個(gè)模板服務(wù)器分別存儲(chǔ)網(wǎng)頁模板。多個(gè)模板服務(wù)器分別存儲(chǔ)接收到的網(wǎng)頁模板,這樣,在多個(gè)模板服務(wù)器中的每個(gè)模板服務(wù)器中都存在網(wǎng)頁模板,需要在該網(wǎng)頁模板的基礎(chǔ)上傳輸網(wǎng)頁數(shù)據(jù)的時(shí)候,可以選擇多個(gè)模板服務(wù)器中的網(wǎng)絡(luò)狀況的模板服務(wù)器中的網(wǎng)頁模板進(jìn)行增量數(shù)據(jù)的傳輸,從而增加了基于網(wǎng)頁模板加載網(wǎng)頁數(shù)據(jù)的方便性和可靠性。
[0093]索引單元60用于根據(jù)生成的網(wǎng)頁模板生成模板索引。索引單元能夠根據(jù)生成的網(wǎng)頁模板可以建立網(wǎng)頁模板的URL路徑與模板的映射關(guān)系,將該映射關(guān)系作為模板索引。
[0094]模板檢索單元20用于利用模板索引檢索與網(wǎng)頁匹配的網(wǎng)頁模板,向其它服務(wù)器提供與網(wǎng)頁匹配的模板。利用模板索引快速確定一個(gè)網(wǎng)頁請(qǐng)求是否匹配服務(wù)器中存儲(chǔ)的網(wǎng)頁模板,并且根據(jù)請(qǐng)求網(wǎng)頁的網(wǎng)址確定匹配的網(wǎng)頁模板。在多個(gè)模板生成服務(wù)器中的任意一個(gè)模板生成服務(wù)器在確定與網(wǎng)頁匹配的網(wǎng)頁模板之后,將匹配的網(wǎng)頁模板發(fā)送至多個(gè)模板生成服務(wù)器中的其他服務(wù)器。
[0095]考慮到上述過程要處理的數(shù)據(jù)量極大,可以使用Hadoop等分布式計(jì)算框架構(gòu)建程序,使用HBase等大數(shù)據(jù)量存儲(chǔ)服務(wù)。另外,為了增加可靠性,發(fā)明實(shí)施例的網(wǎng)頁模板生成方法例如采集網(wǎng)頁數(shù)據(jù)、生成網(wǎng)頁模板、網(wǎng)頁模板發(fā)布和網(wǎng)頁模板檢索等,都可以在多個(gè)服務(wù)器上部署,使得多個(gè)服務(wù)器協(xié)同服務(wù)。即本發(fā)明的網(wǎng)頁模板生成服務(wù)器的功能可以由多個(gè)共同服務(wù)器完成。不同的功能模板可以部署在不同的服務(wù)器中。也可以在不同的服務(wù)器中部署相同的功能模塊。
[0096]優(yōu)選地,為了生成模板索引,上述索引單元60包括模板選取模塊、模板路徑推導(dǎo)模塊、模板路徑剪枝模塊和模板索弓I生成模塊。
[0097]模板選取模塊用于選取質(zhì)量符合預(yù)定質(zhì)量條件的模板。在生成的網(wǎng)頁模板中查找符合預(yù)定質(zhì)量條件的模板,其中,預(yù)定質(zhì)量條件可以是模板對(duì)用戶訪問的網(wǎng)頁的覆蓋率大于預(yù)定閾值,質(zhì)量符合預(yù)定質(zhì)量條件的模板相較于質(zhì)量不符合預(yù)定質(zhì)量條件的模板能夠節(jié)約差量數(shù)據(jù)的傳輸量。
[0098]模板路徑推導(dǎo)模塊用于確定模板適用的URL路徑。根據(jù)模板使用的URL路徑查找該路徑下的所有網(wǎng)頁模板,從而能夠提高查找網(wǎng)頁模板的速度。
[0099]模板路徑剪枝模塊用于從URL路徑中選取質(zhì)量符合預(yù)定質(zhì)量條件的模板適用的URL路徑。由于短路徑的模板的覆蓋度更好,因此查找URL路徑可以從距離根目錄最近的短路徑開始查找。
[0100]模板索弓I生成模塊用于將選取的路徑轉(zhuǎn)換成模板索弓I。將根據(jù)URL路徑選取的網(wǎng)頁模板的路徑與用戶訪問的網(wǎng)頁相對(duì)應(yīng),形成模板索引。
[0101]圖7是根據(jù)本發(fā)明第三實(shí)施例的網(wǎng)頁模板生成服務(wù)器的示意圖。該實(shí)施例可以作為圖5所示實(shí)施例的優(yōu)選實(shí)施方式,如圖所示,該網(wǎng)頁模板生成服務(wù)器包括采集單元10、生成單元30、發(fā)布單元40、存儲(chǔ)單元50和索引單元60,其中,發(fā)布單元40包括計(jì)算模塊401、判斷模塊402和發(fā)布模塊403。
[0102]計(jì)算模塊401用于計(jì)算多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率。為了避免網(wǎng)頁模板的變動(dòng)較小時(shí)更換網(wǎng)頁模板重新生成增量文件而造成的資源浪費(fèi),因此計(jì)算多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率。
[0103]判斷模塊402用于判斷整體差異率是否大于預(yù)設(shè)整體差異率閾值。判斷多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率是否大于預(yù)設(shè)整體差異率閾值,如果多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率大于預(yù)設(shè)整體差異率閾值,則網(wǎng)頁模板變動(dòng)較大,直接發(fā)布網(wǎng)頁模板,如果多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率小于預(yù)設(shè)整體差異率閾值,則網(wǎng)頁模板變動(dòng)較小,不發(fā)布網(wǎng)頁模板。
[0104]發(fā)布模塊403用于在判斷出整體差異率大于預(yù)設(shè)整體差異率閾值,發(fā)布網(wǎng)頁模板,在判斷出整體差異率不大于預(yù)設(shè)整體差異率閾值,不發(fā)布網(wǎng)頁模板。如果多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率大于預(yù)設(shè)整體差異閾值,表示生成的多個(gè)網(wǎng)頁模板的集合較歷史模板集合的變動(dòng)較大,可以發(fā)布網(wǎng)頁模板。如果多個(gè)網(wǎng)頁模板的集合與歷史模板集合的整體差異率小于預(yù)設(shè)整體差異閾值,表示生成的多個(gè)網(wǎng)頁模板的集合較歷史模板集合的變動(dòng)較小,可以基于歷史模板進(jìn)行增量文件傳輸,可以不發(fā)布網(wǎng)頁模板。
[0105]圖8是根據(jù)本發(fā)明第四實(shí)施例的網(wǎng)頁模板生成服務(wù)器的示意圖。如圖所示,該網(wǎng)頁模板生成服務(wù)器包括采集單元10、生成單元30、判斷單元60、計(jì)算單元70、對(duì)比單元80和合并單元90。其中,圖8所示的采集單元10、和生成單元30的功能與圖5所示實(shí)施例中的采集單元10、和生成單元30的功能相同,在此不做贅述。
[0106]判斷單元60用于在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后判斷網(wǎng)頁模板的數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量。在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后,需要判斷網(wǎng)頁模板的數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量,如果判斷出網(wǎng)頁模板的數(shù)量沒有達(dá)到預(yù)設(shè)數(shù)量,可以繼續(xù)根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板,如果判斷出網(wǎng)頁模板的數(shù)量達(dá)到預(yù)設(shè)數(shù)量,可以計(jì)算每個(gè)網(wǎng)頁模
板的覆蓋率。
[0107]計(jì)算單元70用于在判斷出網(wǎng)頁模板的數(shù)量達(dá)到預(yù)設(shè)數(shù)量時(shí),計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率。模板覆蓋率是衡量生成的網(wǎng)頁模板質(zhì)量的重要指標(biāo),模板覆蓋率可以是一個(gè)網(wǎng)站內(nèi),網(wǎng)頁模板能夠應(yīng)用到網(wǎng)站內(nèi)的網(wǎng)頁上的數(shù)量與該網(wǎng)站全部網(wǎng)頁數(shù)量的比值,模板覆蓋率越大,該網(wǎng)頁模板能夠應(yīng)用到該網(wǎng)站內(nèi)網(wǎng)頁的數(shù)量也就越多。模板覆蓋率不僅可以衡量一個(gè)網(wǎng)站的網(wǎng)站模板質(zhì)量,還可以衡量某一個(gè)路徑下的網(wǎng)頁模板的質(zhì)量。例如,某個(gè)網(wǎng)頁模板的網(wǎng)站覆蓋率不是很高,但是在某個(gè)路徑下的覆蓋率很高,該網(wǎng)頁模板在實(shí)際應(yīng)用中也能達(dá)到很好的效果。
[0108]對(duì)比單元80用于將覆蓋率小于預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板進(jìn)行對(duì)比。在計(jì)算出每個(gè)網(wǎng)頁模板的覆蓋率之后,為了避免網(wǎng)頁模板變動(dòng)較小的情況下重新選擇相似的網(wǎng)頁模板進(jìn)行增量文件傳輸,可以比較覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的模板與覆蓋率大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板。
[0109]合并單元90用于在小于預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值,將小于預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板合并。小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率可以是兩個(gè)模板以open-vcdiff算法算出兩個(gè)網(wǎng)頁模板的差值與小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的大小的比值,小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率可以用來衡量小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異程度。
[0110]如果小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值,則認(rèn)為小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板相似,將小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板合并,合并的過程可以是將小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的數(shù)據(jù)合并到大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的數(shù)據(jù)中。
[0111]優(yōu)選地,為了方便的將將覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板進(jìn)行對(duì)比,對(duì)比單元80包括排序模塊和對(duì)比模塊,其中,排序模塊,用于將多個(gè)網(wǎng)頁模板按照覆蓋率大小進(jìn)行由大到小的排序;對(duì)比模塊,用于將排在后面的網(wǎng)頁模板與排在前面的網(wǎng)頁模板進(jìn)行對(duì)比。
[0112]在對(duì)多個(gè)網(wǎng)頁模板按照覆蓋率大小進(jìn)行由大到小的排序之后,通過對(duì)隊(duì)列中的網(wǎng)頁模板進(jìn)行兩兩比較或者逐個(gè)比較,能夠?qū)⒕W(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值的網(wǎng)頁模板合并。
[0113]在將網(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值的網(wǎng)頁模板合并之后,可以根據(jù)網(wǎng)頁的網(wǎng)址或者域名得到網(wǎng)頁模板索引,可以將該網(wǎng)頁模板數(shù)據(jù)和網(wǎng)頁模板索引都發(fā)布出去。
[0114]為了方便存儲(chǔ)和調(diào)用,索引單元60還包括:存儲(chǔ)模塊、計(jì)算模塊、第三判斷模塊和刪除t吳塊。
[0115]存儲(chǔ)模塊,用于在根據(jù)網(wǎng)頁數(shù)據(jù)生成網(wǎng)頁的網(wǎng)頁模板之后,存儲(chǔ)多個(gè)網(wǎng)頁模板.為了方便模板的調(diào)用,在生成網(wǎng)頁的網(wǎng)頁模板之后,存儲(chǔ)生成的多個(gè)網(wǎng)頁模板。
[0116]計(jì)算模塊,用于計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率。由于接近根目錄的模板通常具有更好的覆蓋率,查找模板的時(shí)候優(yōu)先處理接近根目錄的模板,因此在計(jì)算多個(gè)網(wǎng)頁模板的時(shí)候,首先將生成的網(wǎng)頁模板按照路徑深度進(jìn)行排序,短路徑相對(duì)于深路徑的網(wǎng)頁模板的排列位置更靠近根目錄。
[0117]由于已經(jīng)對(duì)多個(gè)網(wǎng)頁模板按照路徑深度進(jìn)行排序,在計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率時(shí)可以計(jì)算一個(gè)路徑下每個(gè)網(wǎng)頁模板的覆蓋率。其中,每個(gè)網(wǎng)頁模板的覆蓋率可以是該網(wǎng)頁模板相對(duì)于整個(gè)路徑下的所有網(wǎng)頁模板的覆蓋率。
[0118]為了便于使用覆蓋率較大的網(wǎng)頁模板進(jìn)行增量文件的傳輸,可以按覆蓋率從高到低進(jìn)行排序。同時(shí),在同一路徑下網(wǎng)頁模板數(shù)量較多時(shí),可以按照路徑深度從長到短的順序截取一定數(shù)量的網(wǎng)頁模板,避免同一路徑下網(wǎng)頁模板數(shù)量較多降低計(jì)算速度。
[0119]第三判斷模塊,用于判斷每個(gè)路徑下的網(wǎng)頁模板的覆蓋率的總和是否達(dá)到預(yù)設(shè)覆蓋率閾值。在計(jì)算出每個(gè)網(wǎng)頁模板的覆蓋率之后,判斷每個(gè)路徑下的網(wǎng)頁模板的覆蓋率的總和是否達(dá)到第二預(yù)設(shè)覆蓋率閾值,如果達(dá)到第二預(yù)設(shè)覆蓋率閾值保留此路徑;如果判斷出每個(gè)路徑下的網(wǎng)頁模板的覆蓋率總和沒有達(dá)到第二預(yù)設(shè)覆蓋率閾值,則將網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板刪除。
[0120]刪除模塊,用于刪除網(wǎng)頁模板的覆蓋率的總和未達(dá)到預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板。由于網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值,那么網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板都不需要再進(jìn)行處理和使用,因此可以將網(wǎng)頁模板的覆蓋率的總和未達(dá)到第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板刪除,以節(jié)省存儲(chǔ)資源。
[0121]顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
[0122]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種網(wǎng)頁模板生成方法,其特征在于,包括: 采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù); 根據(jù)所述網(wǎng)頁數(shù)據(jù)生成所述網(wǎng)頁的網(wǎng)頁模板; 根據(jù)生成的所述網(wǎng)頁模板生成模板索引。
2.根據(jù)權(quán)利要求1所述的網(wǎng)頁模板生成方法,其特征在于,在根據(jù)所述網(wǎng)頁數(shù)據(jù)生成所述網(wǎng)頁的網(wǎng)頁模板之后,所述網(wǎng)頁模板生成方法還包括: 向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布所述網(wǎng)頁模板和所述模板索引; 所述多個(gè)模板服務(wù)器分別存儲(chǔ)所述網(wǎng)頁模板和所述模板索引;以及所述多個(gè)模板服務(wù)器中的第一模板服務(wù)器利用所述模板索引檢索與所述網(wǎng)頁匹配的網(wǎng)頁模板,向所述多個(gè)模板服務(wù)器中除所述第一模板服務(wù)器之外的其它模板服務(wù)器提供所述與所述網(wǎng)頁匹配的模板。
3.根據(jù)權(quán)利要求2所述的網(wǎng)頁模板生成方法,其特征在于,向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布所述網(wǎng)頁模板和所述模板索引包括: 在生成多個(gè)所述網(wǎng)頁模板和所述模板索引之后; 計(jì)算多個(gè)所述網(wǎng)頁模板的集合與歷史模板集合的整體差異率; 判斷所述整體差異率是否大于預(yù)設(shè)整體差異率閾值; 如果判斷出所述整體差異率大于所述預(yù)設(shè)整體差異率閾值,則發(fā)布所述網(wǎng)頁模板和所述模板索引;以及 如果判斷出所述整體差異率不大于所述預(yù)設(shè)整體差異率閾值,則不發(fā)布所述網(wǎng)頁模板和所述模板索引。
4.根據(jù)權(quán)利要求1所述的網(wǎng)頁模板生成方法,其特征在于,根據(jù)生成的所述網(wǎng)頁模板生成模板索引包括: 選取質(zhì)量符合預(yù)定質(zhì)量條件的模板; 確定模板適用的URL路徑; 從所述URL路徑中選取質(zhì)量符合所述預(yù)定質(zhì)量條件的模板適用的URL路徑;以及 將選取的路徑轉(zhuǎn)換成模板索引。
5.根據(jù)權(quán)利要求1所述的網(wǎng)頁模板生成方法,其特征在于,在根據(jù)所述網(wǎng)頁數(shù)據(jù)生成所述網(wǎng)頁的網(wǎng)頁模板之后,所述網(wǎng)頁模板生成方法還包括: 判斷所述網(wǎng)頁模板的數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量; 如果判斷出所述網(wǎng)頁模板的數(shù)量達(dá)到所述預(yù)設(shè)數(shù)量,則計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率;將覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板進(jìn)行對(duì)比;以及 如果小于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值,則將小于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板合并。
6.根據(jù)權(quán)利要求5所述的網(wǎng)頁模板生成方法,其特征在于,將覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板進(jìn)行對(duì)比包括: 將多個(gè)所述網(wǎng)頁模板按照覆蓋率大小進(jìn)行由大到小的排序;以及 將排在后面的網(wǎng)頁模板與排在前面的網(wǎng)頁模板進(jìn)行對(duì)比。
7.根據(jù)權(quán)利要求1所述的網(wǎng)頁模板生成方法,其特征在于,根據(jù)生成的所述網(wǎng)頁模板生成模板索引包括: 存儲(chǔ)多個(gè)所述網(wǎng)頁模板; 計(jì)算每個(gè)所述網(wǎng)頁模板的覆蓋率; 判斷每個(gè)路徑下的所述網(wǎng)頁模板的覆蓋率的總和是否達(dá)到第二預(yù)設(shè)覆蓋率閾值;以及刪除所述網(wǎng)頁模板的覆蓋率的總和未達(dá)到所述第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁模板。
8.—種網(wǎng)頁模板生成服務(wù)器,其特征在于,包括: 采集單元,用于采集網(wǎng)頁的網(wǎng)頁數(shù)據(jù); 生成單元,用于根據(jù)所述網(wǎng)頁數(shù)據(jù)生成所述網(wǎng)頁的網(wǎng)頁模板;以及 索引單元,用于根據(jù)生成的所述網(wǎng)頁模板生成模板索引。
9.根據(jù)權(quán)利要求8所述的網(wǎng)頁模板生成服務(wù)器,其特征在于,所述網(wǎng)頁模板生成服務(wù)器還包括: 發(fā)布單元,用于在根據(jù)所述網(wǎng)頁數(shù)據(jù)生成所述網(wǎng)頁的網(wǎng)頁模板之后,向提供網(wǎng)頁模板的多個(gè)模板服務(wù)器發(fā)布所述網(wǎng)頁模板和所述模板索引; 存儲(chǔ)單元,用于在所述多個(gè)模板服務(wù)器分別存儲(chǔ)所述網(wǎng)頁模板和所述模板索引;以及模板檢索單元,用于利用所述模板索引檢索與所述網(wǎng)頁匹配的網(wǎng)頁模板,向其它服務(wù)器提供與所述網(wǎng)頁匹配的模板。
10.根據(jù)權(quán)利要求9所述的網(wǎng)頁模板生成服務(wù)器,其特征在于,所述發(fā)布單元包括: 計(jì)算模塊,用于計(jì)算多個(gè)所述網(wǎng)頁模板的集合與歷史模板集合的整體差異率; 判斷模塊,用于判斷所述整體差異率是否大于預(yù)設(shè)整體差異率閾值;以及發(fā)布模塊,用于在判斷出所述整體差異率大于所述預(yù)設(shè)整體差異率閾值,發(fā)布所述網(wǎng)頁模板,在判斷出所述整體差異率不大于所述預(yù)設(shè)整體差異率閾值,不發(fā)布所述網(wǎng)頁模板。
11.根據(jù)權(quán)利要求9所述的網(wǎng)頁模板生成服務(wù)器,其特征在于,所述索引單元包括: 模板選取模塊,用于選取質(zhì)量符合預(yù)定質(zhì)量條件的模板; 模板路徑推導(dǎo)模塊,用于確定模板適用的URL路徑; 模板路徑剪枝模塊,用于從所述URL路徑中選取質(zhì)量符合所述預(yù)定質(zhì)量條件的模板適用的URL路徑;以及 模板索引生成模塊,用于將選取的路徑轉(zhuǎn)換成模板索引。
12.根據(jù)權(quán)利要求9所述的網(wǎng)頁模板生成服務(wù)器,其特征在于,所述網(wǎng)頁模板生成服務(wù)器還包括: 判斷單元,用于在根據(jù)所述網(wǎng)頁數(shù)據(jù)生成所述網(wǎng)頁的網(wǎng)頁模板之后判斷所述網(wǎng)頁模板的數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量; 計(jì)算單元,用于在判斷出所述網(wǎng)頁模板的數(shù)量達(dá)到所述預(yù)設(shè)數(shù)量時(shí),計(jì)算每個(gè)網(wǎng)頁模板的覆蓋率; 對(duì)比單元,用于將覆蓋率小于第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板進(jìn)行對(duì)比;以及 合并單元,用于在小于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板的差異率小于預(yù)設(shè)差異率閾值,將小于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板與大于所述第一預(yù)設(shè)覆蓋率閾值的網(wǎng)頁模板合并。
13.根據(jù)權(quán)利要求12所述的網(wǎng)頁模板生成服務(wù)器,其特征在于,所述對(duì)比單元包括: 排序模塊,用于將多個(gè)所述網(wǎng)頁模板按照覆蓋率大小進(jìn)行由大到小的排序;以及 對(duì)比模塊,用于將排在后面的網(wǎng)頁模板與排在前面的網(wǎng)頁模板進(jìn)行對(duì)比。
14.根據(jù)權(quán)利要求9所述的網(wǎng)頁模板生成服務(wù)器,其特征在于,所述索引單元包括: 存儲(chǔ)模塊,用于在根據(jù)所述網(wǎng)頁數(shù)據(jù)生成所述網(wǎng)頁的網(wǎng)頁模板之后,存儲(chǔ)多個(gè)所述網(wǎng)頁模板; 計(jì)算模塊,用于計(jì)算每個(gè)所述網(wǎng)頁模板的覆蓋率; 第三判斷模塊,用于判斷每個(gè)路徑下的所述網(wǎng)頁模板的覆蓋率的總和是否達(dá)到第二預(yù)設(shè)覆蓋率閾值;以及 刪除模塊,用于刪除所述網(wǎng)頁模板的覆蓋率的總和未達(dá)到所述第二預(yù)設(shè)覆蓋率閾值的路徑下的網(wǎng)頁 模板。
【文檔編號(hào)】G06F17/30GK103605770SQ201310612915
【公開日】2014年2月26日 申請(qǐng)日期:2013年11月26日 優(yōu)先權(quán)日:2013年11月26日
【發(fā)明者】翟光亞, 鄭海洪, 周向根 申請(qǐng)人:優(yōu)視科技有限公司