亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

保存網(wǎng)頁(yè)完整內(nèi)容的方法、系統(tǒng)及相應(yīng)的客戶端和服務(wù)器的制造方法

文檔序號(hào):7988300閱讀:176來(lái)源:國(guó)知局
保存網(wǎng)頁(yè)完整內(nèi)容的方法、系統(tǒng)及相應(yīng)的客戶端和服務(wù)器的制造方法
【專利摘要】本申請(qǐng)公開了一種保存網(wǎng)頁(yè)完整內(nèi)容的方法、系統(tǒng)以及對(duì)應(yīng)的客戶端和中轉(zhuǎn)服務(wù)器。所述客戶端獲取瀏覽器所解析的當(dāng)前所展示網(wǎng)頁(yè)的DOM樹和所有非內(nèi)聯(lián)樣式數(shù)據(jù),遍歷所述DOM樹,將非內(nèi)聯(lián)樣式數(shù)據(jù)轉(zhuǎn)換成每個(gè)DOM元素的內(nèi)聯(lián)樣式數(shù)據(jù),并保存在對(duì)應(yīng)元素的自定義屬性中,之后將所述DOM樹上傳到中轉(zhuǎn)服務(wù)器;中轉(zhuǎn)服務(wù)器接收客戶端上傳的DOM樹,根據(jù)該DOM樹中的圖片標(biāo)簽抓取網(wǎng)頁(yè)中的圖片數(shù)據(jù),按照云端服務(wù)器要求的格式,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件,并將格式文件上傳到云端服務(wù)器保存。利用本發(fā)明,可以實(shí)現(xiàn)利用移動(dòng)終端將網(wǎng)頁(yè)的完整內(nèi)容高效、快速地保存到云端服務(wù)器,同時(shí)又可以節(jié)約移動(dòng)終端的機(jī)器資源開銷和網(wǎng)絡(luò)帶寬資源。
【專利說(shuō)明】保存網(wǎng)頁(yè)完整內(nèi)容的方法、系統(tǒng)及相應(yīng)的客戶端和服務(wù)器
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及網(wǎng)頁(yè)數(shù)據(jù)處理【技術(shù)領(lǐng)域】,尤其涉及一種保存網(wǎng)頁(yè)完整內(nèi)容的方法、系統(tǒng)及相應(yīng)的客戶端和服務(wù)器。
【背景技術(shù)】
[0002]網(wǎng)絡(luò)瀏覽器簡(jiǎn)稱瀏覽器,是指萬(wàn)維網(wǎng)(Web)服務(wù)的客戶端瀏覽程序,瀏覽器在訪問網(wǎng)頁(yè)時(shí),可以向Web服務(wù)器發(fā)送各種請(qǐng)求,并對(duì)從服務(wù)器發(fā)來(lái)的超文本信息和各種多媒體數(shù)據(jù)格式進(jìn)行解析、顯示和播放,從而將網(wǎng)頁(yè)展示在終端屏幕上。
[0003]用戶在通過(guò)瀏覽器訪問網(wǎng)頁(yè)時(shí),往往希望能把當(dāng)前瀏覽的網(wǎng)頁(yè)的完整內(nèi)容保存下來(lái),在以后希望重新瀏覽該網(wǎng)頁(yè)時(shí),即使不訪問該網(wǎng)頁(yè)的發(fā)布服務(wù)器也可以正常瀏覽該網(wǎng)頁(yè)的完整內(nèi)容。為了滿足這一需求,現(xiàn)有的大部分瀏覽器都有將當(dāng)前瀏覽的網(wǎng)頁(yè)的完整內(nèi)各保存在本地終端(如計(jì)算機(jī)或移動(dòng)終端)上的功能。
[0004]但是目前隨著各種電子終端的普及,用戶往往會(huì)擁有多個(gè)具有數(shù)據(jù)處理功能的電子終端,并可采用各個(gè)電子終端上的瀏覽器網(wǎng)瀏覽網(wǎng)頁(yè)。例如在辦公室使用臺(tái)式計(jì)算機(jī)瀏覽網(wǎng)頁(yè),在家里使用筆記本電腦瀏覽網(wǎng)頁(yè),外出時(shí)又使用移動(dòng)終端(例如智能手機(jī)、掌上電腦、平板電腦等)瀏覽網(wǎng)頁(yè),如果還是將當(dāng)前瀏覽的網(wǎng)頁(yè)的完整內(nèi)容只保存在本地終端,那么當(dāng)用戶更換電子終端后,由于當(dāng)前電子終端本地中沒有保存網(wǎng)頁(yè),因此用戶需要重新瀏覽該網(wǎng)頁(yè)時(shí),還需要訪問該網(wǎng)頁(yè)的發(fā)布服務(wù)器才可以正常瀏覽到該網(wǎng)頁(yè)的完整內(nèi)容,如果該發(fā)布服務(wù)器出現(xiàn)問題則無(wú)法再次瀏覽該網(wǎng)頁(yè)。
[0005]為了解決這個(gè)問題,目前出現(xiàn)了一種在云端保存網(wǎng)頁(yè)完整內(nèi)容的技術(shù)方案,例如Evernote云端筆記系統(tǒng)。該技術(shù)方案中包括云端服務(wù)器和客戶端,所述客戶端作為計(jì)算機(jī)(PC)瀏覽器的插件安裝在計(jì)算機(jī)瀏覽器上,用于對(duì)該計(jì)算機(jī)當(dāng)前瀏覽的網(wǎng)頁(yè)的完整內(nèi)容(包括具體內(nèi)容信息和樣式信息)進(jìn)行直接提取,并轉(zhuǎn)換成所述云端服務(wù)器要求的指定格式的文件,該指定格式的文件中包含了網(wǎng)頁(yè)的排版內(nèi)容、樣式信息、圖片資源數(shù)據(jù)這些構(gòu)成網(wǎng)頁(yè)的完整內(nèi)容;轉(zhuǎn)換完畢后,再將該指定格式的文件上傳到云端服務(wù)器進(jìn)行保存,用戶可以憑借帳號(hào)來(lái)訪問該云端服務(wù)器。在用戶以后希望重新瀏覽保存過(guò)的具有完整內(nèi)容的網(wǎng)頁(yè)時(shí),不需要再訪問該網(wǎng)頁(yè)的發(fā)布服務(wù)器,而是登錄所述云端服務(wù)器,訪問該云端服務(wù)器中保存的網(wǎng)頁(yè)即可。這樣即使該網(wǎng)頁(yè)的發(fā)布服務(wù)器出現(xiàn)問題也可以再次瀏覽該網(wǎng)頁(yè)的完整內(nèi)容,而且不必受到終端的限制,例如用戶利用辦公室電腦將網(wǎng)頁(yè)保存到云端服務(wù)器,在家里使用筆記本電腦同樣可以訪問到該云端服務(wù)器中保存的網(wǎng)頁(yè)。
[0006]但是上述技術(shù)方案只能適用于計(jì)算機(jī)即桌面平臺(tái),無(wú)法適用于機(jī)器性能很差的移動(dòng)終端即移動(dòng)平臺(tái),例如智能手機(jī)、掌上電腦、平板電腦等,因?yàn)樗隹蛻舳说霓D(zhuǎn)換工作對(duì)機(jī)器資源的開銷太大,將上述技術(shù)方案直接移植到移動(dòng)終端上,即直接將所述客戶端安裝在移動(dòng)終端上,且采用現(xiàn)有方法對(duì)網(wǎng)頁(yè)進(jìn)行提取轉(zhuǎn)換,會(huì)導(dǎo)致移動(dòng)終端資源開銷大、運(yùn)行效率低的技術(shù)問題;同時(shí),由于網(wǎng)頁(yè)的所有內(nèi)容(包括所有的文字和圖片資源)的提取和轉(zhuǎn)換工作在客戶端完成,并且要將所有內(nèi)容由客戶端上傳到云端服務(wù)器,因此會(huì)耗費(fèi)大量的網(wǎng)絡(luò)帶寬資源,而移動(dòng)終端的網(wǎng)絡(luò)帶寬資源又是相對(duì)稀少且昂貴的。

【發(fā)明內(nèi)容】

[0007]有鑒于此,本發(fā)明的主要目的在于提供一種保存網(wǎng)頁(yè)完整內(nèi)容的方法、系統(tǒng)及相應(yīng)的客戶端和服務(wù)器,可以實(shí)現(xiàn)利用移動(dòng)終端將網(wǎng)頁(yè)的完整內(nèi)容高效、快速地保存到云端服務(wù)器,同時(shí)又可以節(jié)約移動(dòng)終端的機(jī)器資源開銷和網(wǎng)絡(luò)帶寬資源。
[0008]本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0009]一種保存網(wǎng)頁(yè)完整內(nèi)容的方法,包括:
[0010]客戶端獲取瀏覽器所解析的當(dāng)前所展示網(wǎng)頁(yè)的文檔對(duì)象模型DOM樹;并獲取該網(wǎng)頁(yè)的所有非內(nèi)聯(lián)樣式數(shù)據(jù);
[0011]客戶端遍歷所述DOM樹,將所述非內(nèi)聯(lián)樣式數(shù)據(jù)轉(zhuǎn)換成所述DOM樹中每個(gè)DOM元素的內(nèi)聯(lián)樣式數(shù)據(jù),并將轉(zhuǎn)換后的內(nèi)聯(lián)樣式數(shù)據(jù)保存在對(duì)應(yīng)DOM元素的自定義屬性中;
[0012]客戶端將所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹上傳到中轉(zhuǎn)服務(wù)器;
[0013]中轉(zhuǎn)服務(wù)器接收客戶端上傳的所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹;
[0014]中轉(zhuǎn)服務(wù)器根據(jù)所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹中的圖片標(biāo)簽抓取網(wǎng)頁(yè)中的圖片數(shù)據(jù);
[0015]中轉(zhuǎn)服務(wù)器按照云端服務(wù)器要求的格式,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件;
[0016]中轉(zhuǎn)服務(wù)器將所述轉(zhuǎn)換后的格式文件上傳到所述云端服務(wù)器保存。
[0017]一種保存網(wǎng)頁(yè)完整內(nèi)容的系統(tǒng),該系統(tǒng)包括客戶端和中轉(zhuǎn)服務(wù)器;
[0018]所述客戶端包括第一模塊、第二模塊和第三模塊;
[0019]所述第一模塊用于獲取瀏覽器所解析的當(dāng)前所展示網(wǎng)頁(yè)的文檔對(duì)象模型DOM樹;并獲取該網(wǎng)頁(yè)的所有非內(nèi)聯(lián)樣式數(shù)據(jù);
[0020]所述第二模塊用于遍歷所述DOM樹,將所述非內(nèi)聯(lián)樣式數(shù)據(jù)轉(zhuǎn)換成所述DOM樹中每個(gè)DOM元素的內(nèi)聯(lián)樣式數(shù)據(jù),并將轉(zhuǎn)換后的內(nèi)聯(lián)樣式數(shù)據(jù)保存在對(duì)應(yīng)DOM元素的自定義屬性中;
[0021]所述第三模塊用于將所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹上傳到中轉(zhuǎn)服務(wù)器;
[0022]所述中轉(zhuǎn)服務(wù)器包括第四模塊、第五模塊、第六模塊和第七模塊;
[0023]所述第四模塊用于接收客戶端上傳的所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹;
[0024]所述第五模塊用于根據(jù)所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹中的圖片標(biāo)簽抓取網(wǎng)頁(yè)中的圖片數(shù)據(jù);
[0025]所述第六模塊用于按照云端服務(wù)器要求的格式,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件;
[0026]所述第七模塊用于將所述轉(zhuǎn)換后的格式文件上傳到所述云端服務(wù)器保存。
[0027]—種客戶端,該客戶端包括第一模塊、第二模塊和第三模塊;
[0028]所述第一模塊用于獲取瀏覽器所解析的當(dāng)前所展示網(wǎng)頁(yè)的DOM樹;并獲取該網(wǎng)頁(yè)的所有非內(nèi)聯(lián)樣式數(shù)據(jù);
[0029]所述第二模塊用于遍歷所述DOM樹,將所述非內(nèi)聯(lián)樣式數(shù)據(jù)轉(zhuǎn)換成所述DOM樹中每個(gè)DOM元素的內(nèi)聯(lián)樣式數(shù)據(jù),并將轉(zhuǎn)換后的內(nèi)聯(lián)樣式數(shù)據(jù)保存在對(duì)應(yīng)DOM元素的自定義屬性中;
[0030]所述第三模塊用于將所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹上傳到中轉(zhuǎn)服務(wù)器。
[0031]—種中轉(zhuǎn)服務(wù)器,其特征在于,該中轉(zhuǎn)服務(wù)器包括第四模塊、第五模塊、第六模塊和第七模塊;
[0032]所述第四模塊用于接收客戶端上傳的經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹;
[0033]所述第五模塊用于根據(jù)所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹中的圖片標(biāo)簽抓取網(wǎng)頁(yè)中的圖片數(shù)據(jù);
[0034]所述第六模塊用于按照云端服務(wù)器要求的格式,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件;
[0035]所述第七模塊用于將所述轉(zhuǎn)換后的格式文件上傳到所述云端服務(wù)器保存。
[0036]與現(xiàn)有技術(shù)相比,本發(fā)明采用客戶端和中轉(zhuǎn)服務(wù)器共同處理的方式來(lái)完成對(duì)網(wǎng)頁(yè)完整內(nèi)容(包括具體內(nèi)容信息和樣式信息)提取轉(zhuǎn)換并保存到指定云端服務(wù)器的過(guò)程。其中,網(wǎng)頁(yè)中不需要過(guò)多消耗機(jī)器資源的字符信息和樣式信息的提取工作由客戶端來(lái)完成,而需要消耗大量機(jī)器資源和帶寬資源的依照云端服務(wù)器要求格式的格式轉(zhuǎn)換工作、圖片抓取工作、以及將格式文件上傳到云端服務(wù)器的工作由中轉(zhuǎn)服務(wù)器來(lái)完成,這樣的客戶端安裝在移動(dòng)終端上,就可以實(shí)現(xiàn)利用移動(dòng)終端將網(wǎng)頁(yè)的完整內(nèi)容高效、快速地保存到云端服務(wù)器,同時(shí)又可以節(jié)約移動(dòng)終端的機(jī)器資源。同時(shí),網(wǎng)頁(yè)中圖片的抓取工作由中轉(zhuǎn)服務(wù)器來(lái)完成,從而避免了移動(dòng)終端上傳數(shù)據(jù)量較大的圖片資源給服務(wù)器的過(guò)程,節(jié)約了移動(dòng)終端的網(wǎng)絡(luò)帶寬資源。
【專利附圖】

【附圖說(shuō)明】
[0037]圖1為本發(fā)明所述保存網(wǎng)頁(yè)完整內(nèi)容的方法的一種流程圖;
[0038]圖2為本發(fā)明所述保存網(wǎng)頁(yè)完整內(nèi)容的系統(tǒng)的一種組成示意圖。
【具體實(shí)施方式】
[0039]下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明再作進(jìn)一步詳細(xì)的說(shuō)明
[0040]圖1為本發(fā)明所述保存網(wǎng)頁(yè)完整內(nèi)容的方法的一種流程圖。參見圖1,該方法主要包括:
[0041]101、客戶端獲取瀏覽器所解析的當(dāng)前在瀏覽器上所展示出的網(wǎng)頁(yè)的文檔對(duì)象模型(DOM)樹;并獲取該網(wǎng)頁(yè)的所有非內(nèi)聯(lián)樣式數(shù)據(jù)。
[0042]所述D0M,是W3C組織推薦的處理可擴(kuò)展置標(biāo)語(yǔ)言的標(biāo)準(zhǔn)編程接口,DOM可以以一種獨(dú)立于平臺(tái)和語(yǔ)言的方式訪問和修改一個(gè)文檔的內(nèi)容和結(jié)構(gòu)。換句話說(shuō),這是表示和處理一個(gè)超文本標(biāo)記語(yǔ)言(HTML, Hypertext Markup Language)或可擴(kuò)展標(biāo)記語(yǔ)言(XML,Extensible Markup Language)的常用方法,而網(wǎng)頁(yè)的本質(zhì)就是由HTML或XML文檔構(gòu)成,DOM樹中包含了網(wǎng)頁(yè)中的完整的內(nèi)容和結(jié)構(gòu),DOM樹包含的是字符信息,數(shù)據(jù)量較小。
[0043]此步驟101中,所述DOM樹由瀏覽器內(nèi)核經(jīng)過(guò)解析處理(包括渲染,加載javascript引擎等處理)得到的DOM樹,客戶端可以以插件的形式安裝到移動(dòng)終端的瀏覽器中,可以直接獲取該瀏覽器內(nèi)核所解析出的瀏覽器當(dāng)前所展示網(wǎng)頁(yè)的DOM樹。
[0044]例如在移動(dòng)終端的瀏覽器中,所述瀏覽器內(nèi)核通常為Webkit瀏覽器內(nèi)核,本發(fā)明可以從Webkit瀏覽器內(nèi)核獲取所述DOM樹。
[0045]此步驟101中,所述客戶端獲取所述網(wǎng)頁(yè)的所有非內(nèi)聯(lián)樣式數(shù)據(jù),具體包括:
[0046]獲取所述網(wǎng)頁(yè)中style標(biāo)簽內(nèi)所包含的非內(nèi)聯(lián)級(jí)聯(lián)樣式表(CSS, CascadingStyleSheet)數(shù)據(jù);
[0047]和/或,根據(jù)所述網(wǎng)頁(yè)中I ink標(biāo)簽內(nèi)指定的外部CSS文件地址,訪問該外部CSS文件,從該外部CSS文件中獲取非內(nèi)聯(lián)CSS數(shù)據(jù)。例如具體可以是通過(guò)Javascript獲取要當(dāng)所展示的網(wǎng)頁(yè)中l(wèi)ink標(biāo)簽內(nèi)跨域的CSS文件URL,然后通過(guò)瀏覽器下載上述CSS文件,并用Javascript動(dòng)態(tài)的在原link標(biāo)簽位置創(chuàng)建style標(biāo)簽,并插入CSS文本內(nèi)容,所述style標(biāo)簽內(nèi)插入的CSS文本內(nèi)容就是所要獲取的所述網(wǎng)頁(yè)的非內(nèi)聯(lián)樣式數(shù)據(jù)。
[0048]102、客戶端遍歷所述DOM樹,將所述非內(nèi)聯(lián)樣式數(shù)據(jù)轉(zhuǎn)換成所述DOM樹中每個(gè)DOM元素的內(nèi)聯(lián)樣式數(shù)據(jù),并將轉(zhuǎn)換后的內(nèi)聯(lián)樣式數(shù)據(jù)保存在對(duì)應(yīng)DOM元素的自定義屬性中。
[0049]下面以一個(gè)具體的例子來(lái)說(shuō)明上述步驟101和102的一種具體的處理方法。
[0050]比如有個(gè)當(dāng)前所要保存的網(wǎng)頁(yè)的DOM樹如下:
[0051]
【權(quán)利要求】
1.一種保存網(wǎng)頁(yè)完整內(nèi)容的方法,其特征在于,包括: 客戶端獲取瀏覽器所解析的當(dāng)前所展示網(wǎng)頁(yè)的文檔對(duì)象模型DOM樹;并獲取該網(wǎng)頁(yè)的所有非內(nèi)聯(lián)樣式數(shù)據(jù); 客戶端遍歷所述DOM樹,將所述非內(nèi)聯(lián)樣式數(shù)據(jù)轉(zhuǎn)換成所述DOM樹中每個(gè)DOM元素的內(nèi)聯(lián)樣式數(shù)據(jù),并將轉(zhuǎn)換后的內(nèi)聯(lián)樣式數(shù)據(jù)保存在對(duì)應(yīng)DOM元素的自定義屬性中; 客戶端將所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹上傳到中轉(zhuǎn)服務(wù)器; 中轉(zhuǎn)服務(wù)器接收客戶端上傳的所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹; 中轉(zhuǎn)服務(wù)器根據(jù)所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹中的圖片標(biāo)簽抓取網(wǎng)頁(yè)中的圖片數(shù)據(jù);中轉(zhuǎn)服務(wù)器按照云端服務(wù)器要求的格式,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件; 中轉(zhuǎn)服務(wù)器將所述轉(zhuǎn)換后的格式文件上傳到所述云端服務(wù)器保存。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述客戶端獲取所述網(wǎng)頁(yè)的所有非內(nèi)聯(lián)樣式數(shù)據(jù),具體包括: 獲取所述網(wǎng)頁(yè)中style標(biāo)簽內(nèi)所包含的非內(nèi)聯(lián)級(jí)聯(lián)樣式表CSS數(shù)據(jù); 和/或,根據(jù)所述網(wǎng)頁(yè)中l(wèi)ink標(biāo)簽內(nèi)指定的外部CSS文件地址,訪問該外部CSS文件,從該外部CSS文件中獲取非 內(nèi)聯(lián)CSS數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述客戶端遍歷所述DOM樹,將所述非內(nèi)聯(lián)樣式數(shù)據(jù)轉(zhuǎn)換成所述DOM樹中每個(gè)DOM元素的內(nèi)聯(lián)樣式數(shù)據(jù),并將轉(zhuǎn)換后的內(nèi)聯(lián)樣式數(shù)據(jù)保存在對(duì)應(yīng)DOM元素的自定義屬性中,具體包括: 客戶端遍歷所述DOM樹中的每一個(gè)DOM元素,對(duì)于每一個(gè)元素,具體包括: 獲取應(yīng)用在該元素上的所有CSS屬性名;獲取每個(gè)CSS屬性名的值;把最終獲取到的CSS屬性名及其值保存在該元素的一個(gè)自定義屬性中。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于, 該方法進(jìn)一步包括:所述客戶端將指定的云端服務(wù)器的標(biāo)識(shí)上傳到中轉(zhuǎn)服務(wù)器;所述中轉(zhuǎn)服務(wù)器中保存至少一種云端服務(wù)器的格式信息,并進(jìn)一步接收客戶端上傳的指定的云端服務(wù)器的標(biāo)識(shí); 所述中轉(zhuǎn)服務(wù)器按照云端服務(wù)器要求的格式,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件,具體包括:中轉(zhuǎn)服務(wù)器根據(jù)所述客戶端上傳的指定云端服務(wù)器的標(biāo)識(shí)查找該云端服務(wù)器的格式信息,之后再按照該云端服務(wù)器的格式信息要求,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件。
5.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,所述中轉(zhuǎn)服務(wù)器按照云端服務(wù)器要求的格式,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件,具體包括: 所述中轉(zhuǎn)服務(wù)器按照云端服務(wù)器所要求的標(biāo)簽和屬性的格式,遍歷所述DOM樹中的標(biāo)簽和屬性,將云端服務(wù)器不允許的標(biāo)簽和屬性過(guò)濾掉,將云端服務(wù)器允許但需要替換的標(biāo)簽和屬性按照云端服務(wù)器提供的標(biāo)簽和屬性標(biāo)識(shí)進(jìn)行替換,將所述遍歷處理后的DOM樹轉(zhuǎn)換為云端服務(wù)器指定格式的文本文件; 將所述圖片數(shù)據(jù)置入所述文本文件,將所述置入了圖片數(shù)據(jù)的文本文件作為云端服務(wù)器所要求的格式文件;或者,將所述圖片數(shù)據(jù)與所述文本文件打包成云端服務(wù)器所要求的格式文件。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述中轉(zhuǎn)服務(wù)器按照云端服務(wù)器要求的格式,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件的過(guò)程中,進(jìn)一步包括:中轉(zhuǎn)服務(wù)器利用散列算法計(jì)算所述圖片數(shù)據(jù)對(duì)應(yīng)的散列標(biāo)識(shí),利用該散列標(biāo)識(shí)替換所述DOM樹中對(duì)應(yīng)圖片的原有標(biāo)識(shí)。
7.—種保存網(wǎng)頁(yè)完整內(nèi)各的系統(tǒng),其特征在于,該系統(tǒng)包括客戶端和中轉(zhuǎn)服務(wù)器; 所述客戶端包括第一模塊、第二模塊和第三模塊; 所述第一模塊用于獲取瀏覽器所解析的當(dāng)前所展示網(wǎng)頁(yè)的文檔對(duì)象模型DOM樹;并獲取該網(wǎng)頁(yè)的所有非內(nèi)聯(lián)樣式數(shù)據(jù); 所述第二模塊用于遍歷所述DOM樹,將所述非內(nèi)聯(lián)樣式數(shù)據(jù)轉(zhuǎn)換成所述DOM樹中每個(gè)DOM元素的內(nèi)聯(lián)樣式數(shù)據(jù),并將轉(zhuǎn)換后的內(nèi)聯(lián)樣式數(shù)據(jù)保存在對(duì)應(yīng)DOM元素的自定義屬性中; 所述第三模塊用于將所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹上傳到中轉(zhuǎn)服務(wù)器; 所述中轉(zhuǎn)服務(wù)器包括第四模塊、第五模塊、第六模塊和第七模塊; 所述第四模塊用于接收客戶端上傳的所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹; 所述第五模塊用于根據(jù)所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹中的圖片標(biāo)簽抓取網(wǎng)頁(yè)中的圖片數(shù)據(jù); 所述第六模塊用于按照云端服務(wù)器要求的格式,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件; 所述第七模塊用于將所述轉(zhuǎn)換后的格式文件上傳到所述云端服務(wù)器保存。
8.一種客戶端,其特征在于,該客戶端包括第一模塊、第二模塊和第三模塊; 所述第一模塊用于獲取瀏覽器所解析的當(dāng)前所展示網(wǎng)頁(yè)的DOM樹;并獲取該網(wǎng)頁(yè)的所有非內(nèi)聯(lián)樣式數(shù)據(jù); 所述第二模塊用于遍歷所述DOM樹,將所述非內(nèi)聯(lián)樣式數(shù)據(jù)轉(zhuǎn)換成所述DOM樹中每個(gè)DOM元素的內(nèi)聯(lián)樣式數(shù)據(jù),并將轉(zhuǎn)換后的內(nèi)聯(lián)樣式數(shù)據(jù)保存在對(duì)應(yīng)DOM元素的自定義屬性中; 所述第三模塊用于將所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹上傳到中轉(zhuǎn)服務(wù)器。
9.根據(jù)權(quán)利要求8所述的客戶端,其特征在于,所述第三模塊進(jìn)一步用于將指定的云端服務(wù)器的標(biāo)識(shí)上傳到中轉(zhuǎn)服務(wù)器。
10.一種中轉(zhuǎn)服務(wù)器,其特征在于,該中轉(zhuǎn)服務(wù)器包括第四模塊、第五模塊、第六模塊和第七模塊; 所述第四模塊用于接收客戶端上傳的經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹; 所述第五模塊用于根據(jù)所述經(jīng)過(guò)轉(zhuǎn)換處理的DOM樹中的圖片標(biāo)簽抓取網(wǎng)頁(yè)中的圖片數(shù)據(jù); 所述第六模塊用于按照云端服務(wù)器要求的格式,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件; 所述第七模塊用于將所述轉(zhuǎn)換后的格式文件上傳到所述云端服務(wù)器保存。
11.根據(jù)權(quán)利要求10所述的中轉(zhuǎn)服務(wù)器,其特征在于, 所述第四模塊進(jìn)一步用于:接收客戶端上傳的指定的云端服務(wù)器的標(biāo)識(shí);所述第六模塊具體用于:保存兩種以上云端服務(wù)器的格式信息,根據(jù)所述客戶端上傳的指定云端服務(wù)器的標(biāo)識(shí)查找該云端服務(wù)器的格式信息,之后再按照該云端服務(wù)器的格式信息要求,將所述DOM樹和抓取到的圖片數(shù)據(jù)轉(zhuǎn)換成該云端服務(wù)器所要求的格式文件。
12.根據(jù)權(quán)利要求10或11所述的中轉(zhuǎn)服務(wù)器,其特征在于,所述第六模塊具體用于:按照云端服務(wù)器所要求的標(biāo)簽和屬性的格式,遍歷所述DOM樹中的標(biāo)簽和屬性,將云端服務(wù)器不允許的標(biāo)簽和屬性過(guò)濾掉,將云端服務(wù)器允許但需要替換的標(biāo)簽和屬性按照云端服務(wù)器提供的標(biāo)簽和屬性標(biāo)識(shí)進(jìn)行替換,將所述遍歷處理后的DOM樹轉(zhuǎn)換為云端服務(wù)器指定格式的文本文件;將所述圖片數(shù)據(jù)置入所述文本文件,將所述置入了圖片數(shù)據(jù)的文本文件作為云端服務(wù)器所要求的格式文件;或者,將所述圖片數(shù)據(jù)與所述文本文件打包成云端服務(wù)器所要求的格式文件。
13.根據(jù)權(quán)利要求12所述的中轉(zhuǎn)服務(wù)器,其特征在于,所述第六模塊進(jìn)一步用于:利用散列算法計(jì)算所述圖片數(shù)據(jù)對(duì)應(yīng)的散列標(biāo)識(shí),利用該散列標(biāo)識(shí)替換所述DOM樹中對(duì)應(yīng)圖片的原有標(biāo) 識(shí)。
【文檔編號(hào)】H04L29/08GK103902571SQ201210578711
【公開日】2014年7月2日 申請(qǐng)日期:2012年12月27日 優(yōu)先權(quán)日:2012年12月27日
【發(fā)明者】程亮, 潘農(nóng)菲, 安婷婷, 谷琦 申請(qǐng)人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1