專利名稱::一種移動(dòng)終端訪問網(wǎng)頁的方法及裝置的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及互聯(lián)網(wǎng)TOB應(yīng)用領(lǐng)域,更具體地,涉及一種移動(dòng)終端訪問網(wǎng)頁的方法及裝置。
背景技術(shù):
:時(shí)下無論是時(shí)分同步的碼分多址(TD-SCDMA),寬頻碼分多址(WCDMA),還是CDMA技術(shù)(CDMA2000)都能提供超過1兆的上行速度,移動(dòng)終端訪問Web服務(wù)已不再受限于帶寬資源。伴隨著3G網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大以及用戶群體的持續(xù)增多,3G與TOB2.0結(jié)合的移動(dòng)互聯(lián)網(wǎng)應(yīng)用逐漸成為手機(jī)用戶的業(yè)務(wù)選擇。然而幾乎所有的WEB應(yīng)用都是針對計(jì)算機(jī)上網(wǎng)(PC-Internet)用戶設(shè)計(jì),大多數(shù)移動(dòng)終端上網(wǎng)(Mobile-Internet)用戶受限于移動(dòng)終端的硬件處理能力,例如打開網(wǎng)頁緩慢,狹小的屏幕不能合適地展示網(wǎng)頁,并不理想的腳本語言解析能力等等。圖1所示,移動(dòng)終端瀏覽雅虎首頁的情況,針對PC-Internet設(shè)計(jì)的TOB頁面不適合在移動(dòng)終端上呈現(xiàn),用戶不得不頻繁地移動(dòng)光標(biāo)以閱讀網(wǎng)頁信息。另外由于網(wǎng)頁中含有大量的圖片,用戶利用移動(dòng)終端登錄網(wǎng)頁時(shí)必然花費(fèi)較多的等待時(shí)間。目前在解決移動(dòng)終端訪問TOB應(yīng)用方面有以下兩個(gè)研究方向A)瀏覽器通過瀏覽器的內(nèi)置處理引擎對用戶瀏覽的網(wǎng)頁進(jìn)行預(yù)處理,例如調(diào)整圖片格式,改變文字大小等等,基于WindowsMobile、AndroicUiPhoneOS等操作系統(tǒng)開發(fā)的瀏覽器可以為用戶提供諸如觸屏、頁面縮放等操作,方便用戶使用。B)設(shè)計(jì)適合移動(dòng)終端的網(wǎng)頁部分大型網(wǎng)站,如雅虎、新浪等門戶站點(diǎn),除了傳統(tǒng)的WAP展現(xiàn)方式,還設(shè)計(jì)了適合移動(dòng)終端瀏覽的WEB頁面,此類網(wǎng)頁在代碼中減少或去除大量的腳本語言,并且設(shè)計(jì)人員對HTML和CSS語句也進(jìn)行相應(yīng)的調(diào)整。但是,現(xiàn)有的解決移動(dòng)終端訪問TOB技術(shù)依然存在許多問題。a)瀏覽器將所有對網(wǎng)頁的處理都放在移動(dòng)終端進(jìn)行,對移動(dòng)終端的硬件性能以及操作系統(tǒng)有較高的要求,在中低端手機(jī)上無法使用。b)設(shè)計(jì)適合手機(jī)用戶瀏覽的網(wǎng)頁可以解決WEB頁面在“小屏幕”的手機(jī)終端的呈現(xiàn)問題,但是對于大部分的WEB應(yīng)用而言,服務(wù)提供商并不會(huì)提供這種僅針對手機(jī)用戶的網(wǎng)頁。另外中低端手機(jī)由于自身處理能力不足,在訪問這樣的WEB頁面時(shí)也顯得捉襟見肘??傊壳巴ㄟ^移動(dòng)終端訪問TOB頁面受到移動(dòng)終端硬件性能的明顯影響。
發(fā)明內(nèi)容本發(fā)明實(shí)施例提出一種移動(dòng)終端訪問網(wǎng)頁的方法,使移動(dòng)終端訪問TOB頁面不受自身硬件性能的影響。本發(fā)明實(shí)施例還提出一種移動(dòng)終端訪問網(wǎng)頁的裝置,使移動(dòng)終端訪問TOB頁面不受自身硬件性能的影響。本發(fā)明實(shí)施例的技術(shù)方案如下一種移動(dòng)終端訪問網(wǎng)頁的裝置,該裝置包括縮略圖生成器,將TOB網(wǎng)站的WEB頁面生成JPG格式的縮略圖片,發(fā)送至頁面調(diào)整器;結(jié)構(gòu)解析器,將WEB網(wǎng)站的TOB頁面的代碼解析為DOM樹,并將DOM樹發(fā)送至噪點(diǎn)分離器;噪點(diǎn)分離器,對DOM樹進(jìn)行梳理,將梳理后的DOM樹發(fā)送至頁面區(qū)域塊生成器;頁面區(qū)域塊生成器,由梳理后的DOM樹生成區(qū)域Block塊,并將Block塊發(fā)送至頁面調(diào)整器;頁面調(diào)整器,分析Block塊得到鏈接代碼、圖片和文字,將鏈接代碼、圖片和文字發(fā)送至移動(dòng)終端。所述頁面區(qū)域塊生成器包括,分割單元,將梳理后的DOM樹分割成至少一個(gè)獨(dú)立的Block;整合單元,依據(jù)獨(dú)立的Block類型的類型和屬性整合獨(dú)立的Block,得到Block塊;存儲(chǔ)單元,獲取Block塊的信息并寫入數(shù)據(jù)庫,并將Block塊發(fā)送至頁面調(diào)整器。所述頁面調(diào)整器包括,提取單元,由Block獲得超文本鏈接標(biāo)識語言HTML代碼;判斷單元,判斷HTML代碼中含有鏈接,進(jìn)一步判斷鏈接中是否有關(guān)鍵詞,有關(guān)鍵詞時(shí),則將鏈接標(biāo)為“high”,記錄鏈接代碼;否則保存默認(rèn)配置,記錄鏈接代碼;導(dǎo)出單元,從判斷單元中導(dǎo)出鏈接代碼后,輸出鏈接代碼;排列單元,由Block塊得到圖片和文字,按照先圖片后文字的順序排列并輸出。一種移動(dòng)終端訪問網(wǎng)頁的方法,該方法包括將WEB頁面轉(zhuǎn)化為JPG格式的縮略圖片;根據(jù)WEB頁面代碼生成DOM樹;梳理DOM樹;將梳理后DOM樹的節(jié)點(diǎn)劃分為至少一個(gè)區(qū)域Block塊;分析Block塊得到鏈接代碼、圖片和文字,將鏈接代碼、圖片和文字,以及縮略圖片發(fā)送至移動(dòng)終端。所述梳理DOM樹包括,清理由kript和CSS語言標(biāo)簽構(gòu)成的節(jié)點(diǎn)。所述劃分包括,將梳理后的DOM樹分割成至少一個(gè)獨(dú)立的Block;依據(jù)獨(dú)立的Block類型和屬性整合獨(dú)立的Block,得到Block塊;獲取Block塊的信息并寫入數(shù)據(jù)庫。所述將梳理后的DOM樹分割成至少一個(gè)獨(dú)立的Block包括,以前序遍歷的方式對梳理后DOM樹進(jìn)行檢索,將標(biāo)簽節(jié)點(diǎn)及其子生成樹中的節(jié)點(diǎn)歸屬為一個(gè)Blcok。所述依據(jù)獨(dú)立的Block的類型和屬性整合獨(dú)立的Block包括,按照前序遍歷的方式對所述梳理后DOM樹進(jìn)行第二次遍歷,將同為Block類型且屬性相同的兄弟節(jié)點(diǎn)整合在一起,生成Block塊。所述Block是在同一個(gè)TOB頁面中具有同種屬性且內(nèi)容關(guān)聯(lián)的信息共同體。所述分析包括,由Block塊獲得超文本鏈接標(biāo)識語言HTML代碼;判斷HTML代碼中含有鏈接,進(jìn)一步判斷鏈接中是否有關(guān)鍵詞,有關(guān)鍵詞時(shí),則將鏈接標(biāo)為“high”,記錄鏈接代碼;否則保存默認(rèn)配置,記錄鏈接代碼;導(dǎo)出鏈接代碼后,輸出鏈接代碼;由Block塊獲得圖片和文字,按照先圖片后文字的順序排列并輸出。從上述技術(shù)方案中可以看出,TOB網(wǎng)站由移動(dòng)終端的WEB訪問請求返回WEB頁面;由本發(fā)明實(shí)施例的裝置先將WEB頁面生成JPG格式的縮略圖片并發(fā)送至頁面調(diào)整器;再采用網(wǎng)頁分割技術(shù)將WEB頁面的代碼解析為DOM樹;對DOM樹進(jìn)行梳理后,生成至少一個(gè)Block塊;分析各Block塊得到其鏈接分層和內(nèi)容分層,由鏈接分層得到鏈接代碼,由內(nèi)容分層得到圖片和文字;將鏈接代碼、圖片和文字,以及縮略圖片發(fā)送至移動(dòng)終端。移動(dòng)終端不需要直接處理龐大WEB網(wǎng)頁,僅需要顯示縮略圖片和解析對硬件性能要求不高的Block塊鏈接代碼、圖片和文字,即可輕松流暢地訪問WEB網(wǎng)頁,使得移動(dòng)終端訪問WEB頁面不受自身硬件性能的影響。圖1為現(xiàn)有技術(shù)中移動(dòng)終端訪問雅虎首頁示意圖;圖2為本發(fā)明實(shí)施例移動(dòng)終端訪問網(wǎng)頁的裝置結(jié)構(gòu)示意圖;圖3為本發(fā)明實(shí)施例中DOM樹圖;圖4為本發(fā)明實(shí)施例中頁面區(qū)域示意圖;圖5為本發(fā)明實(shí)施例中分層網(wǎng)絡(luò)結(jié)構(gòu)示意圖;圖6為本發(fā)明實(shí)施例移動(dòng)終端訪問網(wǎng)頁的方法流程示意圖;圖7為本發(fā)明實(shí)施例中的Block坐標(biāo)圖;圖8為本發(fā)明實(shí)施例的移動(dòng)終端訪問雅虎首頁示意圖;圖9為本發(fā)明實(shí)施例的移動(dòng)終端訪問WEB網(wǎng)頁時(shí)分層網(wǎng)絡(luò)結(jié)構(gòu)頁面示意圖。具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)表達(dá)得更加清楚明白,下面結(jié)合附圖及具體實(shí)施例對本發(fā)明再作進(jìn)一步詳細(xì)的說明。在本發(fā)明實(shí)施例中,在WAP網(wǎng)關(guān)中設(shè)置本發(fā)明實(shí)施例的裝置,按本發(fā)明實(shí)施例的方法先將網(wǎng)站返回的WEB網(wǎng)頁生成JPG格式的縮略圖片;并對WEB整個(gè)網(wǎng)頁的代碼解析,生成完整的DOM樹;對該DOM樹進(jìn)行梳理,梳理后的DOM樹劃分為多個(gè)獨(dú)立的Block,將多個(gè)獨(dú)立的Block重新組合為Block塊,再由Block塊得到鏈接代碼、圖片和文字;并將鏈接代碼、圖片和文字,以及之前生成的WEB網(wǎng)頁縮略圖片發(fā)送至移動(dòng)終端。移動(dòng)終端的瀏覽器顯示縮略圖片并解析鏈接代碼、圖片和文字,得以流暢地訪問WEB網(wǎng)頁,從而保證了移動(dòng)終端訪問WEB頁面不受自身硬件性能的影響。圖1是本發(fā)明移動(dòng)終端訪問網(wǎng)頁的裝置結(jié)構(gòu)示意圖,該裝置包括縮略圖生成器201(ThumbnailGenerator),結(jié)構(gòu)解析器202(StructureProcessor),噪點(diǎn)分離器203(NoiseEliminator),頁面區(qū)域塊生成器204(PageBlocker)以及頁面調(diào)整器205(PageTailor)??s略圖生成器201在瀏覽網(wǎng)頁時(shí),用戶從使用習(xí)慣上需要先了解整個(gè)頁面?zhèn)鬟_(dá)的信息,用戶會(huì)根據(jù)信息選擇自己感興趣的內(nèi)容??s略圖生成器的作用就是根據(jù)WEB網(wǎng)站返回的WEB頁面生成JPG格式的縮略圖片,即網(wǎng)頁快照??s生成器將縮略圖片發(fā)送至頁面調(diào)整器,待頁面調(diào)整器得到由處理WEB網(wǎng)頁得到的鏈接代碼、圖片和文字后,頁面調(diào)整器再將縮略圖片、鏈接代碼、圖片和文字發(fā)送至移動(dòng)終端。這樣處理的優(yōu)勢有以下幾點(diǎn)1)更好的兼容性。正常的WEB頁面中常常含有大量的腳本語言和Flash動(dòng)畫,腳本語言包括JavMcript和Ajax。這些腳本語言在移動(dòng)終端操作系統(tǒng)中不能很好地解析,有的甚至無法解析,但是JPG格式的縮略圖片在目前幾乎所有的移動(dòng)終端上都能夠正常顯7J\ο2)更快的下載速率。正常的WEB頁面中含有大量的圖片,這些圖片下載到移動(dòng)終端時(shí)將耗費(fèi)較多時(shí)間,如果只發(fā)送WEB頁面的縮略圖片到移動(dòng)終端將大大減少時(shí)間,為用戶提供更快的下載速率。結(jié)構(gòu)解析器202任何一個(gè)網(wǎng)頁都是基于HTML語法結(jié)構(gòu)編寫的,依照DocumentObiectModelLevel2HTMLSpecification(Version1.0)標(biāo)準(zhǔn),結(jié)構(gòu)解析器將整個(gè)網(wǎng)頁的代碼解析為如圖3所示完整的DOM樹。圖3中由超文本鏈接標(biāo)識語言(HTML)解析為頭部(HEAD)、標(biāo)題(TITLE)、輔助標(biāo)簽(META)和主體(BODY)、表格(TABLE)、行(TR)、單元格(TD)、換行(BR)和數(shù)據(jù)(DATA)。噪點(diǎn)分離器203網(wǎng)頁設(shè)計(jì)者在制作網(wǎng)頁時(shí)為了能夠讓頁面美觀和向用戶提供豐富的互動(dòng)體驗(yàn)常常在HTML代碼中加入腳本語言和CSS語句等。但是這些都是針對PC-Internet用戶做出的設(shè)計(jì),對Mobile-Internet用戶并不完全適用,部分中低端的移動(dòng)終端根本不支持腳本語言的解析。為了解決這個(gè)問題,噪點(diǎn)分離器對DOM樹進(jìn)行梳理。梳理的原則是將由義!^?仏CSS語言標(biāo)簽構(gòu)成的節(jié)點(diǎn)進(jìn)行清理,這樣DOM樹保留的節(jié)點(diǎn)是干凈的HTML標(biāo)簽節(jié)點(diǎn)。中低端移動(dòng)終端的瀏覽器在解析這樣的WEB頁面時(shí)不必?fù)?dān)心腳本語言的兼容性問題。對于高端移動(dòng)終端而言,其操作系統(tǒng)以及使用的瀏覽器能夠?qū)δ_本語言以及CSS語句有效解析,用戶可以根據(jù)使用意愿來選擇是否清理掉這些節(jié)點(diǎn)。頁面區(qū)域塊生成器204“Block”的概念在HTML語法中并不存在,本發(fā)明中將“Block”定義為在同一個(gè)WEB頁面中具有同種屬性且內(nèi)容關(guān)聯(lián)的信息共同體。每一個(gè)Block中的信息組件都處于相同的頁面中,這些信息組件在呈現(xiàn)方式上具有用戶感知的一致性。頁面區(qū)域塊生成器的作用就是根據(jù)梳理后的DOM樹生成多個(gè)獨(dú)立的Block,D0M樹中的所有節(jié)點(diǎn)將被歸入Block塊中。頁面區(qū)域塊生成器包括分割單元、整合單元和存儲(chǔ)單元。分割單元,將梳理后的DOM樹分割成多個(gè)獨(dú)立的Block;整合單元,依據(jù)獨(dú)立的Block的類型和屬性整合獨(dú)立的Block,得到Block塊;存儲(chǔ)單元,獲取Block塊的信息并寫入數(shù)據(jù)庫。從圖4中可以了解到該頁面可以劃分為5個(gè)Block塊,即5個(gè)區(qū)域。在對Block進(jìn)行了定義后需要解決的是如何將DOM樹中的節(jié)點(diǎn)劃分到Block塊中,具體方法在步驟608中詳述。頁面調(diào)整器205通過了頁面區(qū)域塊生成器的處理,正常的TOB頁面已經(jīng)被分割為Block塊,現(xiàn)在需要做的就是將頁面進(jìn)行調(diào)整。在頁面內(nèi)容的重新組合中使用分層網(wǎng)絡(luò)結(jié)構(gòu)的思想,即將一個(gè)Block分為內(nèi)容分層ContentLayer和鏈接分層LinkLayer,不同的層承載不同的信息。圖5是分層網(wǎng)絡(luò)結(jié)構(gòu)示意圖。頁面調(diào)整器將分層后得到的鏈接代碼、排列好的圖片和文字,以及由縮略圖生成器201生成的JPG格式的縮略圖片發(fā)送至移動(dòng)終端。頁面調(diào)整器是由提取單元、判斷單元、導(dǎo)出單元和排列單元組成。提取單元,由Block塊獲得超文本鏈接標(biāo)識語言HTML代碼;判斷單元,判斷HTML代碼中是否含有鏈接,如果有鏈接,則進(jìn)一步判斷鏈接中是否有關(guān)鍵詞,有關(guān)鍵詞時(shí),則將鏈接標(biāo)為“high”,記錄鏈接代碼;沒有關(guān)鍵詞,則保持默認(rèn)配置,記錄鏈接代碼;否則,判斷沒有鏈接。導(dǎo)出單元,從判斷單元中導(dǎo)出鏈接代碼;排列單元,由Block塊得到圖片和文字,按照先圖片后文字的順序排列并輸出??s略圖生成器將網(wǎng)站返回的TOB網(wǎng)頁生成JPG格式的縮略圖片;結(jié)構(gòu)解析器將整個(gè)網(wǎng)頁的代碼解析為完整的DOM樹發(fā)送至噪點(diǎn)分離器;噪點(diǎn)分離器對該DOM樹進(jìn)行梳理;由頁面區(qū)域塊生成器將梳理后的DOM樹劃分為多個(gè)獨(dú)立的Block;頁面調(diào)整器重新組合獨(dú)立的Block得到Block塊,由Block塊分層得到鏈接代碼、排列好的圖片和文字,將鏈接代碼、排列好的圖片和文字,以及縮略圖生成器生成的縮略圖發(fā)送至移動(dòng)終端。圖6是本發(fā)明實(shí)施例移動(dòng)終端訪問網(wǎng)頁的方法流程示意圖,具體包括以下步驟步驟601、用戶在移動(dòng)終端的瀏覽器中輸入網(wǎng)址后提交TOB訪問請求,該請求發(fā)送到WAP網(wǎng)關(guān)處。步驟602、WAP網(wǎng)關(guān)在與用戶的移動(dòng)終端完成連接后通過解析用戶提交的WEB訪問請求中的相應(yīng)字段獲悉用戶移動(dòng)終端的硬件參數(shù),可以根據(jù)該硬件參數(shù)確定用戶終端的顯示能力以及噪聲解析器中清理節(jié)點(diǎn)的種類。另外WAP網(wǎng)關(guān)將用戶的TOB訪問請求封裝成請求消息后發(fā)送到WEB服務(wù)器端。步驟603、WEB服務(wù)器根據(jù)請求消息向WAP網(wǎng)關(guān)反饋響應(yīng)消息,響應(yīng)消息中包括用戶移動(dòng)終端請求的WEB頁面。步驟604、WAP網(wǎng)關(guān)接受到響應(yīng)消息后,首先將WEB頁面?zhèn)魉偷娇s略圖生成器。步驟605、縮略圖生成器將TOB頁面轉(zhuǎn)化為JPG格式的縮略圖片,同時(shí)將縮略圖片發(fā)送至頁面調(diào)整器。縮略圖生成器中將WEB網(wǎng)頁轉(zhuǎn)化為JPG格式的圖片的方法是現(xiàn)有技術(shù),在此不再贅述。步驟606、結(jié)構(gòu)解析器根據(jù)原始的TOB頁面代碼解析生成DOM樹,然后將DOM樹作為參數(shù)發(fā)送至噪點(diǎn)分離器做進(jìn)一步處理。由網(wǎng)頁代碼解析生成DOM樹是現(xiàn)有技術(shù),在此不再贅述。步驟607、噪點(diǎn)分離器利用現(xiàn)有的遍歷技術(shù)將由kript和CSS語言標(biāo)簽構(gòu)成的DOM樹節(jié)點(diǎn)清理掉,生成梳理后DOM樹。將梳理后DOM樹發(fā)送至頁面區(qū)域塊生成器。步驟608、頁面區(qū)域塊生成器根據(jù)梳理后DOM樹將節(jié)點(diǎn)劃分為多個(gè)的Block塊,待處理完成后將Block塊發(fā)送至由頁面調(diào)整器。其中,根據(jù)梳理后DOM樹將節(jié)點(diǎn)劃分為多個(gè)的Block塊的方法具體包括以下步驟步驟6081、將梳理后DOM樹分割成多個(gè)獨(dú)立的Block。以梳理后DOM樹為基礎(chǔ),以前序遍歷的方式對梳理后DOM樹進(jìn)行檢索。將“table”、“diV”、“form”等標(biāo)簽節(jié)點(diǎn)及其子生成樹中的節(jié)點(diǎn)歸屬為一個(gè)Block,并將此節(jié)點(diǎn)的類型設(shè)置為Block類型。前序遍歷首先訪問根節(jié)點(diǎn)然后遍歷左子樹,最后遍歷右子樹。在遍歷左、右子樹時(shí),仍然先訪問根節(jié)點(diǎn),然后遍歷左子樹,最后遍歷右子樹。步驟6082、依據(jù)獨(dú)立的Block類型和屬性整合獨(dú)立的Block,得到Block塊。通過步驟6081的檢索后,梳理后DOM樹中所有“table”、“diV”、“f0rm”等標(biāo)簽節(jié)點(diǎn)及其子生成樹中的節(jié)點(diǎn)已被歸屬為相應(yīng)的區(qū)域,其節(jié)點(diǎn)類型已被標(biāo)示為Block類型。返回到根節(jié)點(diǎn),開始對梳理后DOM樹的第二次遍歷,這次遍歷仍然按照前序遍歷的方式進(jìn)行,目的是將同為Block類型且屬性相同的兄弟節(jié)點(diǎn)整合在一起,生成Block塊。步驟6083、獲取Block塊的信息并寫入數(shù)據(jù)庫中。分析每個(gè)Block塊以獲取屬性信息,這些屬性信息會(huì)填入表IBlockList中。表1作為數(shù)據(jù)庫表結(jié)構(gòu),作用是在數(shù)據(jù)庫中建立每個(gè)頁面區(qū)域的數(shù)據(jù)檔案。通過數(shù)據(jù)檔案將每個(gè)Block塊中對應(yīng)的HTML代碼以及需要加載的信息都一一記錄下來,用戶在多個(gè)頁面間切換時(shí)便不需要重復(fù)切割頁面,只需從數(shù)據(jù)庫中讀取相應(yīng)的信息。表權(quán)利要求1.一種移動(dòng)終端訪問網(wǎng)頁的裝置,其特征在于,該裝置包括縮略圖生成器,將WEB網(wǎng)站的TOB頁面生成JPG格式的縮略圖片,發(fā)送至頁面調(diào)整器;結(jié)構(gòu)解析器,將WEB網(wǎng)站的TOB頁面的代碼解析為DOM樹,并將DOM樹發(fā)送至噪點(diǎn)分離器;噪點(diǎn)分離器,對DOM樹進(jìn)行梳理,將梳理后的DOM樹發(fā)送至頁面區(qū)域塊生成器;頁面區(qū)域塊生成器,由梳理后的DOM樹生成區(qū)域Block塊,并將Block塊發(fā)送至頁面調(diào)整器;頁面調(diào)整器,分析Block塊得到鏈接代碼、圖片和文字,將鏈接代碼、圖片和文字發(fā)送至移動(dòng)終端。2.根據(jù)權(quán)利要求1所述移動(dòng)終端訪問網(wǎng)頁的裝置,其特征在于,所述頁面區(qū)域塊生成器包括,分割單元,將梳理后的DOM樹分割成至少一個(gè)獨(dú)立的Block;整合單元,依據(jù)獨(dú)立的Block類型的類型和屬性整合獨(dú)立的Block,得到Block塊;存儲(chǔ)單元,獲取Block塊的信息并寫入數(shù)據(jù)庫,并將Block塊發(fā)送至頁面調(diào)整器。3.根據(jù)權(quán)利要求1所述移動(dòng)終端訪問網(wǎng)頁的裝置,其特征在于,所述頁面調(diào)整器包括,提取單元,由Block獲得超文本鏈接標(biāo)識語言HTML代碼;判斷單元,判斷HTML代碼中含有鏈接,進(jìn)一步判斷鏈接中是否有關(guān)鍵詞,有關(guān)鍵詞時(shí),則將鏈接標(biāo)為“high”,記錄鏈接代碼;否則保存默認(rèn)配置,記錄鏈接代碼;導(dǎo)出單元,從判斷單元中導(dǎo)出鏈接代碼后,輸出鏈接代碼;排列單元,由Block塊得到圖片和文字,按照先圖片后文字的順序排列并輸出。4.一種移動(dòng)終端訪問網(wǎng)頁的方法,其特征在于,該方法包括將TOB頁面轉(zhuǎn)化為JPG格式的縮略圖片;根據(jù)WEB頁面代碼生成DOM樹;梳理DOM樹;將梳理后DOM樹的節(jié)點(diǎn)劃分為至少一個(gè)區(qū)域Block塊;分析Block塊得到鏈接代碼、圖片和文字,將鏈接代碼、圖片和文字,以及縮略圖片發(fā)送至移動(dòng)終端。5.根據(jù)權(quán)利要求4所述移動(dòng)終端訪問網(wǎng)頁的方法,其特征在于,所述梳理DOM樹包括,清理由kript和CSS語言標(biāo)簽構(gòu)成的節(jié)點(diǎn)。6.根據(jù)權(quán)利要求4所述移動(dòng)終端訪問網(wǎng)頁的方法,其特征在于,所述劃分包括,將梳理后的DOM樹分割成至少一個(gè)獨(dú)立的Block;依據(jù)獨(dú)立的Block類型和屬性整合獨(dú)立的Block,得到Block塊;獲取Block塊的信息并寫入數(shù)據(jù)庫。7.據(jù)權(quán)利要求6所述移動(dòng)終端訪問網(wǎng)頁的方法,其特征在于,所述將梳理后的DOM樹分割成至少一個(gè)獨(dú)立的Block包括,以前序遍歷的方式對梳理后DOM樹進(jìn)行檢索,將標(biāo)簽節(jié)點(diǎn)及其子生成樹中的節(jié)點(diǎn)歸屬為一個(gè)Blcok。8.據(jù)權(quán)利要求7所述移動(dòng)終端訪問網(wǎng)頁的方法,其特征在于,所述依據(jù)獨(dú)立的Block的類型和屬性整合獨(dú)立的Block包括,按照前序遍歷的方式對所述梳理后DOM樹進(jìn)行第二次遍歷,將同為Block類型且屬性相同的兄弟節(jié)點(diǎn)整合在一起,生成Block塊。9.根據(jù)權(quán)利要求6至8中任意一項(xiàng)所述移動(dòng)終端訪問網(wǎng)頁的方法,其特征在于,所述Block是在同一個(gè)WEB頁面中具有同種屬性且內(nèi)容關(guān)聯(lián)的信息共同體。10.根據(jù)權(quán)利要求4所述移動(dòng)終端訪問網(wǎng)頁的方法,其特征在于,所述分析包括,由Block塊獲得超文本鏈接標(biāo)識語言HTML代碼;判斷HTML代碼中含有鏈接,進(jìn)一步判斷鏈接中是否有關(guān)鍵詞,有關(guān)鍵詞時(shí),則將鏈接標(biāo)為“high”,記錄鏈接代碼;否則保存默認(rèn)配置,記錄鏈接代碼;導(dǎo)出鏈接代碼后,輸出鏈接代碼;由Block塊獲得圖片和文字,按照先圖片后文字的順序排列并輸出。全文摘要一種移動(dòng)終端訪問網(wǎng)頁的裝置,該裝置包括縮略圖生成器,將WEB網(wǎng)站的WEB頁面生成JPG格式的縮略圖片,發(fā)送至頁面調(diào)整器;結(jié)構(gòu)解析器,將WEB網(wǎng)站的WEB頁面的代碼解析為DOM樹,并將DOM樹發(fā)送至噪點(diǎn)分離器;噪點(diǎn)分離器,對DOM樹梳理,將梳理后的DOM樹發(fā)送頁面區(qū)域塊生成器;頁面區(qū)域塊生成器,由梳理后的DOM樹生成區(qū)域Block塊,并將Block塊發(fā)送至頁面調(diào)整器;頁面調(diào)整器,分析Block塊得到鏈接代碼、圖片和文字,將鏈接代碼、圖片和文字,以及縮略圖片發(fā)送至移動(dòng)終端。本文還公開了一種移動(dòng)終端訪問網(wǎng)頁的方法。應(yīng)用本發(fā)明實(shí)施例以后,可以使移動(dòng)終端訪問WEB頁面不受自身硬件性能的影響。文檔編號G06F17/30GK102065114SQ20091023819公開日2011年5月18日申請日期2009年11月17日優(yōu)先權(quán)日2009年11月17日發(fā)明者李汶嵇申請人:中國移動(dòng)通信集團(tuán)重慶有限公司