專利名稱:一種網(wǎng)頁(yè)分割方法和網(wǎng)頁(yè)分割裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及互聯(lián)網(wǎng)4支術(shù),更具體地說(shuō),涉及一種網(wǎng)頁(yè)分割方法和網(wǎng)頁(yè)分割 裝置。
背景技術(shù):
移動(dòng)通信技術(shù)大大改變了人們的日常生活方式,移動(dòng)電話也早已從昂貴的 奢侈品轉(zhuǎn)變成了人們?nèi)粘I畹幕窘M成部分。經(jīng)過(guò)多年的發(fā)展,移動(dòng)通信4支 術(shù)不僅已經(jīng)能夠毫不費(fèi)力的在用戶之間建立語(yǔ)音通信,而且還能實(shí)現(xiàn)用戶之間 筒單的消息(例如短消息)傳遞。而最新的移動(dòng)通信技術(shù)更是能夠?qū)崿F(xiàn)用戶對(duì) 互聯(lián)網(wǎng)的移動(dòng)訪問(wèn)。
然而,受限于移動(dòng)電話自身的性能,現(xiàn)有移動(dòng)電話多半只能訪問(wèn)專門構(gòu)建 的面向移動(dòng)終端的互聯(lián)網(wǎng)站點(diǎn)。此類互聯(lián)網(wǎng)站點(diǎn)所提供的網(wǎng)頁(yè)采用面向移動(dòng)電
話的特定格式(例如WML格式),以便能夠在移動(dòng)電話上輕松顯示。而對(duì)于 更為廣大用戶所接受的基于HTML格式的互聯(lián)網(wǎng)網(wǎng)頁(yè),大多數(shù)移動(dòng)電話都無(wú) 法正常顯示。這是因?yàn)椋磺暗幕贖TML格式的互聯(lián)網(wǎng)網(wǎng)頁(yè)采用了大量的 特效技術(shù),顯示這種網(wǎng)頁(yè)所需的數(shù)據(jù)處理能力大大超出了一般移動(dòng)電話的能 力。同時(shí),這種互聯(lián)網(wǎng)網(wǎng)頁(yè)會(huì)產(chǎn)生大量的流量,這一點(diǎn)對(duì)于基于流量計(jì)費(fèi)的移 動(dòng)用戶而言非常致命。
為4更于移動(dòng)用戶i方問(wèn)HTML網(wǎng)頁(yè),頁(yè)面分割:技術(shù)應(yīng)運(yùn)而生。這種頁(yè)面分 割才支術(shù)可將HTML網(wǎng)頁(yè)分割成多個(gè)WML格式的子網(wǎng)頁(yè),以〗更于移動(dòng)用戶選 擇訪問(wèn)。然而,現(xiàn)有的頁(yè)面分割技術(shù)是基于對(duì)文本的平面切割,這難免會(huì)對(duì)網(wǎng) 頁(yè)的原有結(jié)構(gòu)造成纟艮大的破壞。此外,現(xiàn)有頁(yè)面分割技術(shù)的分割效率也不甚理 想。
因此,需要一種頁(yè)面分割解決方案,能夠有效克服現(xiàn)有技術(shù)之中存在的上述缺陷。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題在于,針對(duì)現(xiàn)有頁(yè)面分割技術(shù)會(huì)破壞網(wǎng)頁(yè)結(jié)構(gòu)以 及分割效率不高的缺陷,提供一種網(wǎng)頁(yè)分割方法和網(wǎng)頁(yè)分割裝置。
本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是 構(gòu)造一種網(wǎng)頁(yè)分割方法,用于對(duì)原始網(wǎng)頁(yè)進(jìn)行分割,包括 DOM樹構(gòu)建步驟,包括構(gòu)建所述原始網(wǎng)頁(yè)對(duì)應(yīng)的DOM樹; 脈絡(luò)集合構(gòu)建步驟,包括分別構(gòu)建該DOM樹中每一葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)
集合,該脈絡(luò)集合中包含該DOM樹的根節(jié)點(diǎn)、該葉子節(jié)點(diǎn)以及根節(jié)點(diǎn)與該葉
子節(jié)點(diǎn)之間的每一中間節(jié)點(diǎn);
合并步驟,包括以首葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第一基準(zhǔn)集合,以首葉
子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第二基準(zhǔn)集合,執(zhí)行合并才喿作,該
合并操作包括
51、 生成第一基準(zhǔn)集合和第二基準(zhǔn)集合的合集;
52、 判斷步驟S1中生成的合集所對(duì)應(yīng)網(wǎng)頁(yè)的大小是否超過(guò)預(yù)先設(shè)置 的閾值,
若是,則
521、 依據(jù)第一基準(zhǔn)集合中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之 間的所屬關(guān)系構(gòu)建DOM樹,再依據(jù)該DOM樹生成對(duì)應(yīng)的分割 網(wǎng)頁(yè);
522、 判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉 子節(jié)點(diǎn),若是,則以第二基準(zhǔn)集合對(duì)第一基準(zhǔn)集合進(jìn)行替換更新, 以第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì) 第二基準(zhǔn)集合進(jìn)行替換更新,然后回到步驟Sl;若否,則依據(jù) 第二基準(zhǔn)集合中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之間的所屬關(guān)系 構(gòu)建DOM樹,再依據(jù)該DOM樹生成對(duì)應(yīng)的分割網(wǎng)頁(yè);
若否,則判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn),若 是,則以該合集對(duì)第一基準(zhǔn)合集進(jìn)行替換更新,以第二基準(zhǔn)集合所 對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì)第二基準(zhǔn)集合進(jìn)行替換
更新,然后回到步驟S1;若否,則以該合集中的各個(gè)節(jié)點(diǎn)及該各個(gè) 節(jié)點(diǎn)彼此之間的所屬關(guān)系構(gòu)建DOM樹,再依據(jù)該DOM樹生成對(duì) 應(yīng)的分割網(wǎng)頁(yè)。
在本發(fā)明提供的網(wǎng)頁(yè)分割方法中,在所述合并操作之后,所述方法還包括, 排序步驟,包括依據(jù)生成順序?qū)ι傻姆指罹W(wǎng)頁(yè)進(jìn)行排序。
在本發(fā)明提供的網(wǎng)頁(yè)分割方法中,在4^據(jù)生成順序?qū)ι傻姆指罹W(wǎng)頁(yè)進(jìn)行 排序之后,所述排序步驟還包括在每一分割網(wǎng)頁(yè)中設(shè)置該分割網(wǎng)頁(yè)的后繼分割 網(wǎng)頁(yè)的鏈4妻。
在本發(fā)明提供的網(wǎng)頁(yè)分割方法中,所述原始網(wǎng)頁(yè)采用下列格式之中的至少 一種
HTML;
WML;
XHTML。
在本發(fā)明提供的網(wǎng)頁(yè)分割方法中,所述分割網(wǎng)頁(yè)采用下列格式之中的至少 一種
HTML;
WML;
XHTML。
本發(fā)明還提供了一種網(wǎng)頁(yè)分割裝置,用于對(duì)原始網(wǎng)頁(yè)進(jìn)行分割,包括 DOM樹構(gòu)建模塊,用于構(gòu)建所述原始網(wǎng)頁(yè)對(duì)應(yīng)的DOM樹; 脈絡(luò)集合構(gòu)建模塊,用于分別構(gòu)建該DOM樹中每一葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)
集合,該脈絡(luò)集合中包含該DOM樹的根節(jié)點(diǎn)、該葉子節(jié)點(diǎn)以及根節(jié)點(diǎn)與該葉
子節(jié)點(diǎn)之間的每一中間節(jié)點(diǎn);
合并模塊,用于以首葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為笫一基準(zhǔn)集合,以首葉
子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第二基準(zhǔn)集合,執(zhí)行合并操作,包52、 判斷步驟S1中生成的合集所對(duì)應(yīng)網(wǎng)頁(yè)的大小是否超過(guò)預(yù)先設(shè)置
若是,則
S21 、依據(jù)第一基準(zhǔn)集合中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之 間的所屬關(guān)系構(gòu)建DOM樹,再依據(jù)該DOM樹生成對(duì)應(yīng)的分割 網(wǎng)頁(yè);
S22、判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉 子節(jié)點(diǎn),若是,則以第二基準(zhǔn)集合對(duì)第一基準(zhǔn)集合進(jìn)行替換更新, 以第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì) 第二基準(zhǔn)集合進(jìn)行替換更新,然后回到步驟Sl;若否,則依據(jù) 第二基準(zhǔn)集合中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之間的所屬關(guān)系 構(gòu)建DOM樹,再依據(jù)該DOM樹生成對(duì)應(yīng)的分割網(wǎng)頁(yè); 若否,則
判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié) 點(diǎn),若是,則以該合集對(duì)第一基準(zhǔn)合集進(jìn)行替換更新,以第二基 準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì)第二基準(zhǔn) 集合進(jìn)行替換更新,然后回到步驟Sl;若否,則以該合集中的 各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之間的所屬關(guān)系構(gòu)建DOM樹,再依 據(jù)該DOM初t生成對(duì)應(yīng)的分割網(wǎng)頁(yè)。 在本發(fā)明提供的網(wǎng)頁(yè)分割裝置中,還包括 排序模塊,用于依據(jù)生成順序?qū)ι傻姆指罹W(wǎng)頁(yè)進(jìn)行排序。 在本發(fā)明提供的網(wǎng)頁(yè)分割裝置中,所述排序才莫塊還用于在仿i^生成順序?qū)?生成的分割網(wǎng)頁(yè)進(jìn)行排序之后,在每一分割網(wǎng)頁(yè)中設(shè)置該分割網(wǎng)頁(yè)的后繼分割 網(wǎng)頁(yè)的鏈接。
在本發(fā)明提供的網(wǎng)頁(yè)分割裝置中,所述原始網(wǎng)頁(yè)采用下列格式之中的至少
的閾值,
一種HTMLj
WML;
XHTML。
在本發(fā)明提供的網(wǎng)頁(yè)分割裝置中,所述分割網(wǎng)頁(yè)采用下列格式之中的至少 一種
HTML; WML; XHTML 。
實(shí)施本發(fā)明的技術(shù)方案,具有以下有益效果通過(guò)對(duì)原始網(wǎng)頁(yè)構(gòu)建DOM 樹并依據(jù)該DOM樹來(lái)對(duì)網(wǎng)頁(yè)進(jìn)行分割,本發(fā)明提供的網(wǎng)頁(yè)分割方法和網(wǎng)頁(yè)分 割裝置能夠大大P條低分割操作對(duì)網(wǎng)頁(yè)結(jié)構(gòu)造成的破壞。此外,本發(fā)明提供的技 術(shù)方案實(shí)現(xiàn)簡(jiǎn)單,因此效率更高。
下面將結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,附圖中
圖l是依據(jù)本發(fā)明一較佳實(shí)施例的網(wǎng)頁(yè)分割方法的流程圖2是依據(jù)本發(fā)明一較佳實(shí)施例的DOM樹的示意圖3是依據(jù)本發(fā)明一較佳實(shí)施例的合并方法的流程圖4是依據(jù)本發(fā)明一較佳實(shí)施例的網(wǎng)頁(yè)分割裝置的邏輯結(jié)構(gòu)示意圖。
具體實(shí)施例方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí) 施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅 僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明提供了一種網(wǎng)頁(yè)分割方法和網(wǎng)頁(yè)分割裝置。通過(guò)對(duì)原始網(wǎng)頁(yè)構(gòu)建 DOM樹并依據(jù)該DOM樹來(lái)對(duì)網(wǎng)頁(yè)進(jìn)行分割,本發(fā)明提供的網(wǎng)頁(yè)分割方法和 網(wǎng)頁(yè)分割裝置能夠大大P爭(zhēng)低分割操作對(duì)網(wǎng)頁(yè)結(jié)構(gòu)造成的破壞。此外,本發(fā)明提 供的技術(shù)方案實(shí)現(xiàn)簡(jiǎn)單,因此效率更高。下面就結(jié)合附圖和具體實(shí)施例來(lái)對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)描述。
圖1是依據(jù)本發(fā)明一較佳實(shí)施例的網(wǎng)頁(yè)分割方法100的流程圖。如圖1 所示,網(wǎng)頁(yè)分割方法IOO開始于步驟102。
隨后,在下一步驟104,執(zhí)行DOM樹構(gòu)建步驟,包括構(gòu)建原始網(wǎng)頁(yè)對(duì)應(yīng) 的DOM (Document Object Model,文檔對(duì)象模型)樹。有關(guān)依據(jù)網(wǎng)頁(yè)構(gòu)建對(duì) 應(yīng)的DOM樹的方法已經(jīng)在現(xiàn)有技術(shù)中做了清楚的描述,因此本文不再贅述。
在具體實(shí)現(xiàn)過(guò)程中,原始網(wǎng)頁(yè)可以采用HTML、 WML、 XHTML等眾多 網(wǎng)頁(yè)格式之中的至少一種。
隨后,在下一步驟106,執(zhí)行脈絡(luò)集合構(gòu)建步驟,包括分別構(gòu)建步驟104 之中構(gòu)建的DOM樹中每一葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合,其中,該脈絡(luò)集合中包 含該DOM樹的根節(jié)點(diǎn)、該葉子節(jié)點(diǎn)以及根節(jié)點(diǎn)與該葉子節(jié)點(diǎn)之間的每一中間 節(jié)點(diǎn)。
圖2是依據(jù)本發(fā)明一較佳實(shí)施例的DOM樹的示意圖。依照上文對(duì)脈絡(luò)集 合的定義,如圖2所示,在圖2中,葉子節(jié)點(diǎn)10的脈絡(luò)集合中包括節(jié)點(diǎn)10、 節(jié)點(diǎn)5、節(jié)點(diǎn)2和節(jié)點(diǎn)1;葉子節(jié)點(diǎn)14的脈絡(luò)集合中包括節(jié)點(diǎn)14、節(jié)點(diǎn)11、 節(jié)點(diǎn)5、節(jié)點(diǎn)2和節(jié)點(diǎn)1;葉子節(jié)點(diǎn)15的脈絡(luò)集合中包括節(jié)點(diǎn)15、節(jié)點(diǎn)ll、 節(jié)點(diǎn)5、節(jié)點(diǎn)2和節(jié)點(diǎn)1;葉子節(jié)點(diǎn)6的脈絡(luò)集合中包括節(jié)點(diǎn)6、節(jié)點(diǎn)2和節(jié) 點(diǎn)1;葉子節(jié)點(diǎn)12的脈絡(luò)集合中包括節(jié)點(diǎn)12、節(jié)點(diǎn)7、節(jié)點(diǎn)3和節(jié)點(diǎn)1;葉子 節(jié)點(diǎn)8的脈絡(luò)集合中包括節(jié)點(diǎn)8、節(jié)點(diǎn)3和節(jié)點(diǎn)1;葉子節(jié)點(diǎn)13的脈絡(luò)集合中 包括節(jié)點(diǎn)13、節(jié)點(diǎn)9、節(jié)點(diǎn)4和節(jié)點(diǎn)1。
現(xiàn)在回到方法100,在步驟106之后,開始執(zhí)行步驟108,執(zhí)行合并操作, 包括依據(jù)生成的脈絡(luò)集合執(zhí)行合并操作,生成分割網(wǎng)頁(yè)。有關(guān)合并操作的具體 內(nèi)容將在下文結(jié)合圖3進(jìn)行詳細(xì)描述。
圖3是依據(jù)本發(fā)明一較佳實(shí)施例的合并方法300的流程圖。如圖3所示, 方法300開始于步驟302。
隨后,在下一步驟304,以首葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第一基準(zhǔn)集合, 以首葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第二基準(zhǔn)集合,計(jì)算第一基 準(zhǔn)集合和第二基準(zhǔn)集合的合集。在具體實(shí)現(xiàn)過(guò)程中,生成的DOM樹的結(jié)構(gòu)與網(wǎng)頁(yè)的結(jié)構(gòu)保持一致,因此 節(jié)點(diǎn)之間的相對(duì)位置關(guān)系可反映出節(jié)點(diǎn)對(duì)應(yīng)的內(nèi)容在網(wǎng)頁(yè)中的位置關(guān)系。在具 體實(shí)現(xiàn)過(guò)程中,可依照生成的DOM樹中各個(gè)葉子節(jié)點(diǎn)的排序來(lái)執(zhí)行合并操作。 例如,以圖2中的DOM樹為例,各個(gè)葉子節(jié)點(diǎn)的排序?yàn)?,?jié)點(diǎn)10、節(jié)點(diǎn)14、 節(jié)點(diǎn)15、節(jié)點(diǎn)12、節(jié)點(diǎn)8、節(jié)點(diǎn)13。如此一來(lái)可知,節(jié)點(diǎn)10為首葉子節(jié)點(diǎn), 其對(duì)應(yīng)的脈絡(luò)集合為第一基準(zhǔn)集合。節(jié)點(diǎn)IO的后繼葉子節(jié)點(diǎn)為節(jié)點(diǎn)14,其對(duì) 應(yīng)的脈絡(luò)集合為第二基準(zhǔn)集合。如此一來(lái),第一基準(zhǔn)集合和第二基準(zhǔn)集合的合 集包括節(jié)點(diǎn)10、葉子節(jié)點(diǎn)14、節(jié)點(diǎn)11、節(jié)點(diǎn)5、節(jié)點(diǎn)2和節(jié)點(diǎn)1。
隨后,在下一步驟306,判斷步驟304中生成的合集所對(duì)應(yīng)的網(wǎng)頁(yè)大小是 否超過(guò)預(yù)先設(shè)置的閾值,若是,則轉(zhuǎn)到步驟308,否則轉(zhuǎn)到步驟316。
本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,DOM樹中的每一節(jié)點(diǎn)都代表網(wǎng)頁(yè)之中的一 定內(nèi)容。因此,依據(jù)生成的合集可以預(yù)估該合集所對(duì)應(yīng)網(wǎng)頁(yè)的大小。在此之后, 可判斷該網(wǎng)頁(yè)的大小是否超過(guò)預(yù)先設(shè)置的閾值,若是,則轉(zhuǎn)到步驟308,否則 轉(zhuǎn)到步驟316。
如上文所述,若在步驟306中判斷生成的合集所對(duì)應(yīng)的網(wǎng)頁(yè)的大小超過(guò)預(yù) 先設(shè)置的閾值,則轉(zhuǎn)到步驟308,依據(jù)第一基準(zhǔn)集合構(gòu)建DOM樹,據(jù)此生成 對(duì)應(yīng)的分割網(wǎng)頁(yè),然后轉(zhuǎn)到步驟310。
在具體實(shí)現(xiàn)過(guò)程中,可依據(jù)第一基準(zhǔn)集合中包含的各個(gè)節(jié)點(diǎn)以及這些節(jié)點(diǎn) 之間的所屬關(guān)系來(lái)構(gòu)建DOM樹。其中,構(gòu)建DOM樹的具體方法已經(jīng)在現(xiàn)有 技術(shù)中做了清楚的描述,因此本文不再贅述。
在構(gòu)建DOM樹之后,依據(jù)該DOM樹生成對(duì)應(yīng)的網(wǎng)頁(yè)。為便于描述,區(qū) 別于原始網(wǎng)頁(yè),對(duì)依據(jù)DOM樹生成的網(wǎng)頁(yè)記作分割網(wǎng)頁(yè)。在具體實(shí)現(xiàn)過(guò)程中, 可對(duì)步驟306中提到的閾值進(jìn)行設(shè)定,使得葉子節(jié)點(diǎn)的大小都小于該閾值。由 此可見,本發(fā)明生成的分割網(wǎng)頁(yè)的大小都小于預(yù)先設(shè)置的閾值。
隨后,在下一步驟310,判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后 繼葉子節(jié)點(diǎn),若是,則轉(zhuǎn)到步驟314,否則轉(zhuǎn)到步驟312。
如上文所述,若在步驟310判斷存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼 葉子節(jié)點(diǎn),則轉(zhuǎn)到步驟314,以第二基準(zhǔn)集合對(duì)第一基準(zhǔn)集合進(jìn)行替換更新,以第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì)第二基準(zhǔn)集合
進(jìn)行替換更新,然后返回步驟304。
如上文所述,若在步驟310判斷不存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后 繼葉子節(jié)點(diǎn),則轉(zhuǎn)到步驟312,依據(jù)第二基準(zhǔn)集合構(gòu)建DOM樹,據(jù)此生成對(duì) 應(yīng)的分割網(wǎng)頁(yè),然后轉(zhuǎn)到步驟322。
如上文所述,若在步驟306判斷步驟304中生成的合集所對(duì)應(yīng)的網(wǎng)頁(yè)大小 未超過(guò)預(yù)先設(shè)置的閾值,若是,則轉(zhuǎn)到步驟316,判斷是否存在第二基準(zhǔn)集合 所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn),若是,則轉(zhuǎn)到步驟320,否則,則轉(zhuǎn)到步驟 318。
如上文所述,若在步驟316判斷存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼 葉子節(jié)點(diǎn),則轉(zhuǎn)到步驟320,以該合集對(duì)第一基準(zhǔn)合集進(jìn)行替換更新,以第二 基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì)第二基準(zhǔn)集合進(jìn)行替 換更新,然后返回步驟304。
如上文所述,若在步驟316判斷不存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后 繼葉子節(jié)點(diǎn),則轉(zhuǎn)到步驟318,依據(jù)該合集構(gòu)建DOM樹,據(jù)此生成對(duì)應(yīng)的分 割網(wǎng)頁(yè),然后轉(zhuǎn)到步驟322。
最后,方法300結(jié)束于步驟322。
在具體實(shí)現(xiàn)過(guò)程中,可依據(jù)每一葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合生成對(duì)應(yīng)的分割 網(wǎng)頁(yè)。然而,如此一來(lái)可能會(huì)導(dǎo)致分割原始網(wǎng)頁(yè)得到的分割網(wǎng)頁(yè)數(shù)量眾多,反 而給用戶瀏覽帶來(lái)麻煩。因此,在上述方法300中,通過(guò)基于葉子節(jié)點(diǎn)的排序 對(duì)相鄰葉子節(jié)點(diǎn)的脈絡(luò)集合進(jìn)行合并,來(lái)降低最終生成的分割網(wǎng)頁(yè)的數(shù)量。但 是,合并的脈絡(luò)集合所對(duì)應(yīng)的分割網(wǎng)頁(yè)的大小不能超出預(yù)先設(shè)定的閾值,因此, 通過(guò)步驟306中的判斷過(guò)程,來(lái)對(duì)合并步驟進(jìn)行優(yōu)化。優(yōu)化的結(jié)果就是,若合 集對(duì)應(yīng)的網(wǎng)頁(yè)大小未超過(guò)預(yù)先設(shè)定的閾值,則將該合集與后繼節(jié)點(diǎn)的脈絡(luò)集合 進(jìn)行合并,然后重新判斷合集所對(duì)應(yīng)網(wǎng)頁(yè)的大小是否超過(guò)預(yù)設(shè)閾值,依此類推。
然而,若合集對(duì)應(yīng)的網(wǎng)頁(yè)大小超過(guò)預(yù)先設(shè)定的闞值,則說(shuō)明無(wú)法對(duì)葉子節(jié) 點(diǎn)對(duì)應(yīng)的脈絡(luò)集合進(jìn)行合并,在這種情況下,需要對(duì)前一葉子節(jié)點(diǎn)單獨(dú)生成分 割網(wǎng)頁(yè),而對(duì)后一葉子節(jié)點(diǎn)重新執(zhí)行上述合并及判斷操作,即將后一葉子節(jié)點(diǎn)與其后繼葉子節(jié)點(diǎn)進(jìn)行合并,然后判斷合集對(duì)應(yīng)網(wǎng)頁(yè)的大小是否超過(guò)閾值,以 此類推。
在具體實(shí)現(xiàn)過(guò)程中,生成的分割網(wǎng)頁(yè)可以采用HTML、 WML、 XHTML 等眾多網(wǎng)頁(yè)格式之中的至少一種。
經(jīng)過(guò)圖3的合并操作,可生成由圖2中虛線框內(nèi)各節(jié)點(diǎn)所構(gòu)建的網(wǎng)頁(yè)(由 單獨(dú)一個(gè)葉子節(jié)點(diǎn)所對(duì)應(yīng)脈絡(luò)集合構(gòu)建的網(wǎng)頁(yè)),也可生成由圖2中實(shí)線框內(nèi) 各節(jié)點(diǎn)所構(gòu)建的網(wǎng)頁(yè)(由一個(gè)以上葉子節(jié)點(diǎn)所對(duì)應(yīng)脈絡(luò)集合的合集構(gòu)建的網(wǎng) 頁(yè))。
在具體實(shí)現(xiàn)過(guò)程中,還可在圖3所示的合并操作之后,執(zhí)行排序步驟,包 括依據(jù)各個(gè)分割網(wǎng)頁(yè)的生成順序,對(duì)生成的分割網(wǎng)頁(yè)進(jìn)行排序,以便生成的分 割網(wǎng)頁(yè)可依該順序輸出。在具體實(shí)現(xiàn)過(guò)程中,在依據(jù)生成順序?qū)ι傻姆指罹W(wǎng) 頁(yè)進(jìn)行排序之后,排序步驟還可包括在每一分割網(wǎng)頁(yè)中設(shè)置該分割網(wǎng)頁(yè)的后繼 分割網(wǎng)頁(yè)的鏈接,以方便用戶在分割網(wǎng)頁(yè)之間進(jìn)行切換。
本發(fā)明還提供了一種網(wǎng)頁(yè)分割裝置,下面就結(jié)合圖4對(duì)其進(jìn)行詳細(xì)描述。
圖4是依據(jù)本發(fā)明一較佳實(shí)施例的網(wǎng)頁(yè)分割裝置400的邏輯結(jié)構(gòu)示意圖。 如圖4所示,網(wǎng)頁(yè)分割裝置400包括DOM樹構(gòu)建模塊402、脈絡(luò)集合構(gòu)建才莫 塊404、合并^t塊406。作為可選的,網(wǎng)頁(yè)分割裝置400還可包括排序^t塊408。
DOM樹構(gòu)建模塊402用于構(gòu)建所述原始網(wǎng)頁(yè)對(duì)應(yīng)的DOM樹。有關(guān)DOM 樹的構(gòu)建已經(jīng)在前文做了清楚的描述,因此此處不再贅述。
脈絡(luò)集合構(gòu)建模塊404用于分別構(gòu)建該DOM樹中每一葉子節(jié)點(diǎn)對(duì)應(yīng)的脈 絡(luò)集合,該脈絡(luò)集合中包含該DOM樹的根節(jié)點(diǎn)、該葉子節(jié)點(diǎn)以及根節(jié)點(diǎn)與該 葉子節(jié)點(diǎn)之間的每一中間節(jié)點(diǎn)。有關(guān)脈絡(luò)集合的構(gòu)建已經(jīng)在前文做了清楚的描 述,因此此處不再贅述。
合并模塊,用于以首葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第一基準(zhǔn)集合,以首葉 子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第二基準(zhǔn)集合,執(zhí)行合并操作,包 括
51、 生成第一基準(zhǔn)集合和第二基準(zhǔn)集合的合集;
52、 判斷步驟S1中生成的合集所對(duì)應(yīng)網(wǎng)頁(yè)的大小是否超過(guò)預(yù)先設(shè)置的閾值,
若是,則
S21 、依據(jù)第一基準(zhǔn)集合中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之 間的所屬關(guān)系構(gòu)建DOM樹,再依據(jù)該DOM杉于生成對(duì)應(yīng)的分割 網(wǎng)頁(yè);
S22、判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉 子節(jié)點(diǎn),若是,則以第二基準(zhǔn)集合對(duì)第 一基準(zhǔn)集合進(jìn)行替換更新, 以第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì) 第二基準(zhǔn)集合進(jìn)行替換更新,然后回到步驟Sl;若否,則依據(jù) 第二基準(zhǔn)集合中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之間的所屬關(guān)系 構(gòu)建DOM樹,再仿4t該DOM樹生成對(duì)應(yīng)的分割網(wǎng)頁(yè); 若否,則
判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié) 點(diǎn),若是,則以該合集對(duì)第一基準(zhǔn)合集進(jìn)行替換更新,以第二基 準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì)第二基準(zhǔn) 集合進(jìn)行替換更新,然后回到步驟Sl;若否,則以該合集中的 各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之間的所屬關(guān)系構(gòu)建DOM樹,再依 據(jù)該DOM樹生成對(duì)應(yīng)的分割網(wǎng)頁(yè)。
因此此處不再贅述。
排序模塊408用于依據(jù)生成順序?qū)ι傻姆指罹W(wǎng)頁(yè)進(jìn)行排序。作為可選 的,排序模塊408還用于在依據(jù)生成順序?qū)ι傻姆指罹W(wǎng)頁(yè)進(jìn)行排序之后,在 每一分割網(wǎng)頁(yè)中設(shè)置該分割網(wǎng)頁(yè)的后繼分割網(wǎng)頁(yè)的鏈接。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā) 明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明 的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種網(wǎng)頁(yè)分割方法,用于對(duì)原始網(wǎng)頁(yè)進(jìn)行分割,其特征在于,包括DOM樹構(gòu)建步驟,包括構(gòu)建所述原始網(wǎng)頁(yè)對(duì)應(yīng)的DOM樹;脈絡(luò)集合構(gòu)建步驟,包括分別構(gòu)建該DOM樹中每一葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合,該脈絡(luò)集合中包含該DOM樹的根節(jié)點(diǎn)、該葉子節(jié)點(diǎn)以及根節(jié)點(diǎn)與該葉子節(jié)點(diǎn)之間的每一中間節(jié)點(diǎn);合并步驟,包括以首葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第一基準(zhǔn)集合,以首葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第二基準(zhǔn)集合,執(zhí)行合并操作,該合并操作包括S1、生成第一基準(zhǔn)集合和第二基準(zhǔn)集合的合集;S2、判斷步驟S1中生成的合集所對(duì)應(yīng)網(wǎng)頁(yè)的大小是否超過(guò)預(yù)先設(shè)置的閾值,若是,則S21、依據(jù)第一基準(zhǔn)集合中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之間的所屬關(guān)系構(gòu)建DOM樹,再依據(jù)該DOM樹生成對(duì)應(yīng)的分割網(wǎng)頁(yè);S22、判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn),若是,則以第二基準(zhǔn)集合對(duì)第一基準(zhǔn)集合進(jìn)行替換更新,以第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì)第二基準(zhǔn)集合進(jìn)行替換更新,然后回到步驟S1;若否,則依據(jù)第二基準(zhǔn)集合中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之間的所屬關(guān)系構(gòu)建DOM樹,再依據(jù)該DOM樹生成對(duì)應(yīng)的分割網(wǎng)頁(yè);若否,則判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn),若是,則以該合集對(duì)第一基準(zhǔn)合集進(jìn)行替換更新,以第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì)第二基準(zhǔn)集合進(jìn)行替換更新,然后回到步驟S1;若否,則以該合集中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之間的所屬關(guān)系構(gòu)建DOM樹,再依據(jù)該DOM樹生成對(duì)應(yīng)的分割網(wǎng)頁(yè)。
2、 根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)分割方法,其特征在于,在所述合并操作 之后,所述方法還包括,排序步驟,包括依據(jù)生成順序?qū)ι傻姆指罹W(wǎng)頁(yè)進(jìn)行 排序。
3、 根據(jù)權(quán)利要求2所述的網(wǎng)頁(yè)分割方法,其特征在于,在依據(jù)生成順序 對(duì)生成的分割網(wǎng)頁(yè)進(jìn)行排序之后,所述排序步驟還包括在每一分割網(wǎng)頁(yè)中設(shè)置 該分割網(wǎng)頁(yè)的后繼分割網(wǎng)頁(yè)的鏈接。
4、 根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)分割方法,其特征在于,所述原始網(wǎng)頁(yè)采 用下列格式之中的至少一種HTML;WML;XHTML。
5、 根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)分割方法,其特征在于,所述分割網(wǎng)頁(yè)采 用下列格式之中的至少一種HTML; WML; XHTML 。
6、 一種網(wǎng)頁(yè)分割裝置,用于對(duì)原始網(wǎng)頁(yè)進(jìn)行分割,其特征在于,包括 DOM樹構(gòu)建才莫塊,用于構(gòu)建所述原始網(wǎng)頁(yè)對(duì)應(yīng)的DOM樹; 脈絡(luò)集合構(gòu)建模塊,用于分別構(gòu)建該DOM樹中每一葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合,該脈絡(luò)集合中包含該DOM樹的根節(jié)點(diǎn)、該葉子節(jié)點(diǎn)以及根節(jié)點(diǎn)與該葉 子節(jié)點(diǎn)之間的每一中間節(jié)點(diǎn);合并模塊,用于以首葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第一基準(zhǔn)集合,以首葉 子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合作為第二基準(zhǔn)集合,執(zhí)行合并操作,包 括S1、 生成第一基準(zhǔn)集合和第二基準(zhǔn)集合的合集;S2、 判斷步驟S1中生成的合集所對(duì)應(yīng)網(wǎng)頁(yè)的大小是否超過(guò)預(yù)先設(shè)置的閾值,若是,則,521、 依據(jù)第一基準(zhǔn)集合中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之 間的所屬關(guān)系構(gòu)建DOM樹,再依據(jù)該DOM樹生成對(duì)應(yīng)的分割 網(wǎng)頁(yè);,522、 判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉 子節(jié)點(diǎn),若是,則以第二基準(zhǔn)集合對(duì)第一基準(zhǔn)集合進(jìn)行替換更新, 以第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì) 第二基準(zhǔn)集合進(jìn)行替換更新,然后回到步驟SI;若否,則依據(jù) 第二基準(zhǔn)集合中的各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之間的所屬關(guān)系 構(gòu)建DOM樹,再依據(jù)該DOM杉于生成對(duì)應(yīng)的分割網(wǎng)頁(yè);若否,則判斷是否存在第二基準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié) 點(diǎn),若是,則以該合集對(duì)第一基準(zhǔn)合集進(jìn)行替換更新,以第二基 準(zhǔn)集合所對(duì)應(yīng)葉子節(jié)點(diǎn)的后繼葉子節(jié)點(diǎn)的脈絡(luò)集合對(duì)第二基準(zhǔn) 集合進(jìn)行替換更新,然后回到步驟SI;若否,則以該合集中的 各個(gè)節(jié)點(diǎn)及該各個(gè)節(jié)點(diǎn)彼此之間的所屬關(guān)系構(gòu)建DOM樹,再依 據(jù)該DOM樹生成對(duì)應(yīng)的分割網(wǎng)頁(yè)。
7、 根據(jù)權(quán)利要求6所述的網(wǎng)頁(yè)分割裝置,其特征在于,還包括 排序模塊,用于^^據(jù)生成順序?qū)ι傻姆指罹W(wǎng)頁(yè)進(jìn)行排序。
8、 根據(jù)權(quán)利要求7所述的網(wǎng)頁(yè)分割裝置,其特征在于,所述排序才莫塊還 用于在依據(jù)生成順序?qū)ι傻姆指罹W(wǎng)頁(yè)進(jìn)行排序之后,在每一分割網(wǎng)頁(yè)中設(shè)置 該分割網(wǎng)頁(yè)的后繼分割網(wǎng)頁(yè)的鏈接。
9、 根據(jù)權(quán)利要求6所述的網(wǎng)頁(yè)分割裝置,其特征在于,所述原始網(wǎng)頁(yè)釆 用下列格式之中的至少一種HTML;WML;XHTML。
10、根據(jù)權(quán)利要求6所述的網(wǎng)頁(yè)分割裝置,其特征在于,所述分割網(wǎng)頁(yè)采 用下列格式之中的至少一種 HTML; WML; XHTML 。
全文摘要
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù),針對(duì)現(xiàn)有頁(yè)面分割技術(shù)會(huì)破壞網(wǎng)頁(yè)結(jié)構(gòu)以及分割效率不高的缺陷,提供一種網(wǎng)頁(yè)分割方法和網(wǎng)頁(yè)分割裝置。網(wǎng)頁(yè)分割方法包括DOM樹構(gòu)建步驟,包括構(gòu)建所述原始網(wǎng)頁(yè)對(duì)應(yīng)的DOM樹;脈絡(luò)集合構(gòu)建步驟,包括分別構(gòu)建該DOM樹中每一葉子節(jié)點(diǎn)對(duì)應(yīng)的脈絡(luò)集合,該脈絡(luò)集合中包含該DOM樹的根節(jié)點(diǎn)、該葉子節(jié)點(diǎn)以及根節(jié)點(diǎn)與該葉子節(jié)點(diǎn)之間的每一中間節(jié)點(diǎn);合并步驟。本發(fā)明還提供了一種網(wǎng)頁(yè)分割裝置。通過(guò)對(duì)原始網(wǎng)頁(yè)構(gòu)建DOM樹并依據(jù)該DOM樹來(lái)對(duì)網(wǎng)頁(yè)進(jìn)行分割,本發(fā)明提供的網(wǎng)頁(yè)分割方法和網(wǎng)頁(yè)分割裝置能夠大大降低分割操作對(duì)網(wǎng)頁(yè)結(jié)構(gòu)造成的破壞。此外,本發(fā)明提供的技術(shù)方案實(shí)現(xiàn)簡(jiǎn)單,因此效率更高。
文檔編號(hào)G06F17/30GK101655874SQ20091018987
公開日2010年2月24日 申請(qǐng)日期2009年9月4日 優(yōu)先權(quán)日2009年9月4日
發(fā)明者關(guān)學(xué)功, 劉明軍, 張嘯雄, 朱章厚, 王有為, 趙建鵬 申請(qǐng)人:卓望數(shù)碼技術(shù)(深圳)有限公司