專利名稱:基于移動通訊設備終端的網(wǎng)頁頁面排版方法及系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及移動通訊設備終端相關技術領域,特別是基于移動通訊設備終端的網(wǎng)頁頁面排版方法及系統(tǒng)。
背景技術:
目前手機瀏覽器采用的服務器排版技術,一般都是通過某種固定的機器算法來對 Web頁面進行處理,轉(zhuǎn)換為適宜于手機屏幕顯示的頁面,這種轉(zhuǎn)換由于缺乏人工的干預,很多情況下效果是不理想的,比如一個Web頁面中往往只有一部分關鍵內(nèi)容是用戶真正關注的,而這種機器自動轉(zhuǎn)換往往不能準確知道這些關鍵內(nèi)容,并且這種自動轉(zhuǎn)換產(chǎn)生出來的頁面,其內(nèi)容布局往往不夠理想,不能帶來很好的用戶體驗。
發(fā)明內(nèi)容
本發(fā)明的第一個發(fā)明目的在于提供一種基于移動通訊設備終端的網(wǎng)頁頁面排版方法,以解決現(xiàn)有技術對網(wǎng)頁頁面自動排版內(nèi)容不能突出用戶關注區(qū)域的技術問題。為了實現(xiàn)本發(fā)明的第一個發(fā)明目的,采用的技術方案如下 一種基于移動通訊設備終端的網(wǎng)頁頁面排版方法,所述方法包括 移動通訊設備終端向中轉(zhuǎn)服務器發(fā)送網(wǎng)頁訪問請求;
中轉(zhuǎn)服務器根據(jù)網(wǎng)頁訪問請求獲取第一網(wǎng)頁頁面,根據(jù)第一網(wǎng)頁頁面的網(wǎng)頁頁面特征計算第一網(wǎng)頁頁面特征值;
中轉(zhuǎn)服務器從特征值數(shù)據(jù)庫中搜索與第一網(wǎng)頁頁面特征值相關的第一排版輔助數(shù)據(jù), 中轉(zhuǎn)服務器根據(jù)第一排版輔助數(shù)據(jù)對第一網(wǎng)頁頁面進行排版得到第一排版網(wǎng)頁頁面,并向移動通訊設備終端返回第一排版網(wǎng)頁頁面。作為一種優(yōu)選方案,所述第一網(wǎng)頁頁面特征包括第一網(wǎng)頁頁面的域名信息、文檔結(jié)構信息及關鍵內(nèi)容信息。作為進一步的優(yōu)選方案,所述第一排版輔助數(shù)據(jù)包括第一目標頁面模板,所述第一目標頁面模板為基于與第一網(wǎng)頁頁面特征值相關聯(lián)的網(wǎng)頁文檔結(jié)構而生成的用于描述目標頁面的頁面元素布局框架的描述信息,中轉(zhuǎn)服務器根據(jù)目標頁面模板對第一網(wǎng)頁頁面進行排版,把第一網(wǎng)頁頁面的頁面元素采用與目標頁面模板中相應的頁面元素進行布局。作為進一步的優(yōu)選方案,所述第一排版輔助數(shù)據(jù)包括第一頁面區(qū)域權重信息,所述第一頁面區(qū)域權重信息為多個用戶對第一網(wǎng)頁頁面各個區(qū)域的關注權重,中轉(zhuǎn)服務器根據(jù)每個區(qū)域的關注權重選擇權重處理方式進行處理。作為再進一步的優(yōu)選方案,所述各個區(qū)域的關注權重與多個用戶對第一網(wǎng)頁頁面各個區(qū)域的瀏覽時間的統(tǒng)計值成正比。作為更進一步的優(yōu)選方案,所述第一網(wǎng)頁頁面包括第四區(qū)域,如果對第一網(wǎng)頁頁面的第四區(qū)域的瀏覽用戶數(shù)超過預先設定的瀏覽統(tǒng)計閾值,則計算第四區(qū)域的關注權重, 否則不記錄第四區(qū)域的關注權重。
作為再進一步的優(yōu)選方案,所述方法包括三種權重處理方法,分別為第一權重處理方式、第二權重處理方式和第三權重處理方式,其中
第一權重處理方式,包括對于關注權重在第一權重區(qū)域范圍內(nèi)的第一區(qū)域,刪除第一區(qū)域;
第二權重處理方式,包括對于關注權重值第二權重區(qū)域范圍內(nèi)的第二區(qū)域,減少第二區(qū)域的字體。 第三權重處理方式,包括對于關注權重值第三權重區(qū)域范圍內(nèi)的第三區(qū)域,則加大第三區(qū)域的字體。本發(fā)明的第二個發(fā)明目的,在于提供一種基于移動通訊設備終端的網(wǎng)頁頁面排版系統(tǒng)及其中轉(zhuǎn)服務器,以實現(xiàn)本發(fā)明的第一個發(fā)明目的所提供的網(wǎng)頁頁面排版方法。為了實現(xiàn)本發(fā)明的第二個發(fā)明目的,采用的技術方案如下
一種基于移動通訊設備終端的網(wǎng)頁頁面排版系統(tǒng)的中轉(zhuǎn)服務器,所述中轉(zhuǎn)服務器包
括
根據(jù)移動通訊設備終端發(fā)送的網(wǎng)頁訪問請求從目標服務器獲取第一網(wǎng)頁頁面的獲取模塊;
根據(jù)網(wǎng)頁頁面的網(wǎng)頁頁面特征計算第一網(wǎng)頁頁面特征值的頁面特征值計算模塊; 特征值數(shù)據(jù)庫,保存多個與網(wǎng)頁頁面特征值相關的排版輔助數(shù)據(jù); 從特征值數(shù)據(jù)庫中搜索與網(wǎng)頁頁面特征值相關的第一排版輔助數(shù)據(jù),中轉(zhuǎn)服務器根據(jù)第一排版輔助數(shù)據(jù)對網(wǎng)頁頁面進行排版得到第一排版網(wǎng)頁頁面,并向移動通訊設備終端返回所述第一排版網(wǎng)頁頁面的排版模塊。一種基于移動通訊設備終端的網(wǎng)頁頁面排版系統(tǒng),所述系統(tǒng)包括
設置在移動通訊設備終端,用于向中轉(zhuǎn)服務器轉(zhuǎn)發(fā)網(wǎng)頁訪問請求的轉(zhuǎn)發(fā)模塊; 設置在中轉(zhuǎn)服務器,根據(jù)網(wǎng)頁訪問請求獲取第一網(wǎng)頁頁面,根據(jù)第一網(wǎng)頁頁面的網(wǎng)頁頁面特征計算第一網(wǎng)頁頁面特征值的頁面特征值計算模塊;
設置在中轉(zhuǎn)服務器,從特征值數(shù)據(jù)庫中搜索與第一網(wǎng)頁頁面特征值相關的第一排版輔助數(shù)據(jù),中轉(zhuǎn)服務器根據(jù)第一排版輔助數(shù)據(jù)對第一網(wǎng)頁頁面進行排版得到第一排版網(wǎng)頁頁面,并向移動通訊設備終端返回第一排版網(wǎng)頁頁面的排版模塊。本發(fā)明通過對多用戶的瀏覽特點進行統(tǒng)計,能夠通過很大幅度優(yōu)化服務器排版頁面的內(nèi)容與顯示效果,提高用戶體驗。
圖1為本發(fā)明實施例的流程圖; 圖2為本發(fā)明實施例的系統(tǒng)結(jié)構圖。
具體實施例方式下面結(jié)合附圖和實施例對本發(fā)明做進一步詳細的說明。如圖1所示為本發(fā)明實施例的流程圖。步驟SllO 移動通訊設備終端向中轉(zhuǎn)服務器轉(zhuǎn)發(fā)網(wǎng)頁訪問請求;
步驟S120 中轉(zhuǎn)服務器根據(jù)網(wǎng)頁訪問請求獲取第一網(wǎng)頁頁面,根據(jù)第一網(wǎng)頁頁面的域名信息、文檔結(jié)構信息及關鍵內(nèi)容信息計算第一網(wǎng)頁頁面特征值;
步驟S130 中轉(zhuǎn)服務器從特征值數(shù)據(jù)庫中搜索與第一網(wǎng)頁頁面特征值相關的第一排版輔助數(shù)據(jù),中轉(zhuǎn)服務器根據(jù)第一排版輔助數(shù)據(jù)對第一網(wǎng)頁頁面進行排版得到第一排版網(wǎng)頁頁面,并向移動通訊設備終端返回第一排版網(wǎng)頁頁面。頁面的特征值是一系統(tǒng)特征的集合,并非一個單純的數(shù)值,兩個頁面是否相似的比較,不是分別計算其特征值再將其值比較大小,而是按照預先設定的權值,對各個特征的相似度加權得到綜合的相似度。最簡單的一種特征值計算規(guī)則可以為1對兩頁面的域名做從左至右的字符串比較,將相同字符數(shù)/最大字符串作為其相似度;2統(tǒng)計頁面根標簽中各個子標簽的(比如td)的個數(shù),以及特定標簽下面子標簽個數(shù),然后用類似于(max(count (tdl),count (td2)) - count (tdl) + count(td2))/max(count (tdl), count (td2))的方法計算某標簽相似度,對統(tǒng)計的各個標簽進行加權平均,這些特征都可以作為特征值,在網(wǎng)頁匹配的時候使用這些特征值進行相似度計算。所述的關鍵內(nèi)容是指該頁面的正文內(nèi)容,對于大部分的網(wǎng)頁,可以通過一些列的規(guī)則來獲取關鍵內(nèi)容,例如可以定義這樣一條規(guī)則,從DOM TREE中將頁面中一塊區(qū)域的內(nèi)容取出并計算包含的超鏈接個數(shù),一般鏈接較多的區(qū)域不是關鍵內(nèi)容。關于關鍵內(nèi)容的獲取,業(yè)界也有可供參考的較成熟的方法,例如基于視覺獲取關鍵內(nèi)容,基于標記窗獲取關鍵內(nèi)容,或者基于雙層決策算法獲取關鍵內(nèi)容等等。上述第一排版輔助數(shù)據(jù)包括第一目標頁面模板和第一頁面區(qū)域權重信息 第一目標頁面模板為基于與第一網(wǎng)頁頁面特征值相關聯(lián)的網(wǎng)頁文檔結(jié)構而生成的用
于描述目標頁面的頁面元素布局框架的描述信息,中轉(zhuǎn)服務器根據(jù)目標頁面模板對第一網(wǎng)頁頁面進行排版,把第一網(wǎng)頁頁面的頁面元素采用與目標頁面模板中相同的頁面元素進行布局。頁面模板的產(chǎn)生方式可以是這樣的,對于一些熱門的頁面,可以預先制作頁面模板,同時提供讓熱心用戶制作并上傳模板的途徑。對同一特征值的網(wǎng)頁可能會存在多種頁面模板,用戶可以主動指定使用的模板,如果無指定則使用評分最高的模板。第一頁面區(qū)域權重信息為多個用戶對第一網(wǎng)頁頁面各個區(qū)域的關注權重,區(qū)域權重信息是通過對用戶瀏覽頁面的行為進行統(tǒng)計,并上傳到特定的服務器進行分析得到,中轉(zhuǎn)服務器根據(jù)每個區(qū)域的關注權重選擇權重處理方式進行處理。各個區(qū)域的關注權重與多個用戶對第一網(wǎng)頁頁面各個區(qū)域的瀏覽時間的統(tǒng)計值成正比。比如用戶總是快速跳過的區(qū)域權重最低,而停留時間較久或者有一些附加操作的頁面區(qū)域則權重較高。該類信息是基于對大量用戶瀏覽同特征值網(wǎng)頁時行為的一個統(tǒng)計, 因此需要設置一個有效性閾值,只有當統(tǒng)計量達標時才生效。上述的權重處理方式有三種
包括第一權重處理方式,包括對于關注權重在第一權重區(qū)域范圍內(nèi)的第一區(qū)域,刪除第一區(qū)域,優(yōu)選地,第一權重區(qū)域范圍為低于閾值1,當關注權值低于閾值1,則去掉第一區(qū)域內(nèi)容;
作為再進一步的優(yōu)選方案,所述方法包括第二權重處理方式,包括對于關注權重值第二權重區(qū)域范圍內(nèi)的第二區(qū)域,減少第二區(qū)域的字體,優(yōu)選地,第一權重區(qū)域范圍為高于閾值1但是低于閾值2,如果高于閾值1但是低于閾值2,則減小其字體或者使用不醒目的顏色。作為再進一步的優(yōu)選方案,所述方法包括第三權重處理方式,包括對于關注權重值第三權重區(qū)域范圍內(nèi)的第三區(qū)域,則加大第三區(qū)域的字體,優(yōu)選地,第三權重區(qū)域范圍為高于閾值3但低于閾值4,如果高于閾值3但低于閾值4,則加大其字體或使用醒目的顏色。 同時對于高于閾值3的區(qū)域,需要檢測是其相似區(qū)域是否有不在目標頁面中的,如果有則重新將其加入目標頁面。對于高于閾值2但是低于閾值3,則不改變區(qū)域里面的內(nèi)容。如圖2所示為本發(fā)明實施例的結(jié)構示意圖。一種基于移動通訊設備終端的網(wǎng)頁頁面排版系統(tǒng)200,所述系統(tǒng)200包括 設置在移動通訊設備終端,用于向中轉(zhuǎn)服務器轉(zhuǎn)發(fā)網(wǎng)頁訪問請求的轉(zhuǎn)發(fā)模塊210 ;
設置在中轉(zhuǎn)服務器,根據(jù)網(wǎng)頁訪問請求獲取第一網(wǎng)頁頁面,根據(jù)第一網(wǎng)頁頁面的網(wǎng)頁頁面特征計算第一網(wǎng)頁頁面特征值的頁面特征值計算模塊220 ;
設置在中轉(zhuǎn)服務器的特征值數(shù)據(jù)庫230,用于保存多個與網(wǎng)頁頁面特征值相關的排版輔助數(shù)據(jù);
設置在中轉(zhuǎn)服務器,從特征值數(shù)據(jù)庫230中搜索與第一網(wǎng)頁頁面特征值相關的第一排版輔助數(shù)據(jù),中轉(zhuǎn)服務器根據(jù)第一排版輔助數(shù)據(jù)對第一網(wǎng)頁頁面進行排版得到第一排版網(wǎng)頁頁面,并向移動通訊設備終端返回第一排版網(wǎng)頁頁面的排版模塊M0。下面舉一個具體實現(xiàn)方式為例子。手機瀏覽器向中間件服務器請求訪問某小說頁面,該頁面中存在浮動廣告及結(jié)構復雜的導航菜單。中間件服務器需要首先計算該頁面的特征值,并查詢是否有輔助排版信息。如果有模板,則根據(jù)最高評分模板的描述將相應的頁面內(nèi)容取出來填入模板并生成目標頁面。模板描述中,可以舍棄掉入廣告元素,并只顯示一級導航內(nèi)容,同時將小說文字設置為特定的字號并居左顯示。如果沒有模板,但是有區(qū)域權重數(shù)據(jù),則先按照原算法生成一個目標頁面,如果生成的目標頁面中,某區(qū)域權值低于閾值1,則去掉該區(qū)域內(nèi)容,如果高于閾值1但是低于閾值2,則減小其字體或者使用不醒目的顏色,如果高于閾值2但是低于閾值3,則不改變,如果高于閾值3但低于閾值4,則加大其字體或使用醒目的顏色。同時對于高于閾值3的區(qū)域,需要檢測是其相似區(qū)域是否有不在目標頁面中的,如果有則重新將其加入目標頁面。
權利要求
1.一種基于移動通訊設備終端的網(wǎng)頁頁面排版方法,其特征在于,所述方法包括移動通訊設備終端向中轉(zhuǎn)服務器發(fā)送網(wǎng)頁訪問請求;中轉(zhuǎn)服務器根據(jù)所述網(wǎng)頁訪問請求從目標服務器獲取第一網(wǎng)頁頁面,根據(jù)第一網(wǎng)頁頁面的網(wǎng)頁頁面特征計算第一網(wǎng)頁頁面特征值;中轉(zhuǎn)服務器從特征值數(shù)據(jù)庫中搜索與第一網(wǎng)頁頁面特征值相關的第一排版輔助數(shù)據(jù), 中轉(zhuǎn)服務器根據(jù)第一排版輔助數(shù)據(jù)對第一網(wǎng)頁頁面進行排版得到第一排版網(wǎng)頁頁面,并向移動通訊設備終端返回所述第一排版網(wǎng)頁頁面。
2.根據(jù)權利要求1所述的網(wǎng)頁頁面排版方法,其特征在于,所述第一網(wǎng)頁頁面特征包括第一網(wǎng)頁頁面的域名信息、文檔結(jié)構信息及關鍵內(nèi)容信息。
3.根據(jù)權利要求1或2所述的網(wǎng)頁頁面排版方法,其特征在于,所述第一排版輔助數(shù)據(jù)包括第一目標頁面模板,所述第一目標頁面模板為基于與第一網(wǎng)頁頁面特征值相關聯(lián)的網(wǎng)頁文檔結(jié)構而生成的用于描述目標頁面的頁面元素布局框架的描述信息。
4.根據(jù)權利要求3所述的網(wǎng)頁頁面排版方法,其特征在于,所述中轉(zhuǎn)服務器根據(jù)第一排版輔助數(shù)據(jù)對第一網(wǎng)頁頁面進行排版得到第一排版網(wǎng)頁頁面具體包括將所述第一網(wǎng)頁頁面中的頁面元素采用與所述第一目標頁面模板中相應的頁面元素進行布局。
5.根據(jù)權利要求1或2所述的網(wǎng)頁頁面排版方法,其特征在于,所述第一排版輔助數(shù)據(jù)包括第一頁面區(qū)域權重信息,所述第一頁面區(qū)域權重信息為多個用戶對第一網(wǎng)頁頁面各個區(qū)域的關注權重,中轉(zhuǎn)服務器根據(jù)每個區(qū)域的關注權重選擇權重處理方式進行處理。
6.根據(jù)權利要求5所述的網(wǎng)頁頁面排版方法,其特征在于,所述各個區(qū)域的關注權重與多個用戶對第一網(wǎng)頁頁面各個區(qū)域的瀏覽時間的統(tǒng)計值成正比。
7.根據(jù)權利要求6所述的網(wǎng)頁頁面排版方法,其特征在于,所述第一網(wǎng)頁頁面包括第四區(qū)域,如果對第一網(wǎng)頁頁面的第四區(qū)域的瀏覽用戶數(shù)超過預先設定的瀏覽統(tǒng)計閾值,則計算第四區(qū)域的關注權重,否則不記錄第四區(qū)域的關注權重。
8.根據(jù)權利要求5所述的網(wǎng)頁頁面排版方法,其特征在于,所述方法包括三種權重處理方法,分別為第一權重處理方式、第二權重處理方式和第三權重處理方式,其中第一權重處理方式,包括對于關注權重在第一權重區(qū)域范圍內(nèi)的第一區(qū)域,刪除第一區(qū)域;第二權重處理方式,包括對于關注權重值第二權重區(qū)域范圍內(nèi)的第二區(qū)域,減少第二區(qū)域的字體;第三權重處理方式,包括對于關注權重值第三權重區(qū)域范圍內(nèi)的第三區(qū)域,則加大第三區(qū)域的字體。
9.一種基于移動通訊設備終端的網(wǎng)頁頁面排版系統(tǒng)的中轉(zhuǎn)服務器,其特征在于,所述中轉(zhuǎn)服務器包括根據(jù)移動通訊設備終端發(fā)送的網(wǎng)頁訪問請求從目標服務器獲取第一網(wǎng)頁頁面的獲取模塊;根據(jù)網(wǎng)頁頁面的網(wǎng)頁頁面特征計算第一網(wǎng)頁頁面特征值的頁面特征值計算模塊;特征值數(shù)據(jù)庫,保存多個與網(wǎng)頁頁面特征值相關的排版輔助數(shù)據(jù);從特征值數(shù)據(jù)庫中搜索與網(wǎng)頁頁面特征值相關的第一排版輔助數(shù)據(jù),中轉(zhuǎn)服務器根據(jù)第一排版輔助數(shù)據(jù)對網(wǎng)頁頁面進行排版得到第一排版網(wǎng)頁頁面,并向移動通訊設備終端返回所述第一排版網(wǎng)頁頁面的排版模塊。
10. 一種基于移動通訊設備終端的網(wǎng)頁頁面排版系統(tǒng),其特征在于,所述系統(tǒng)包括 設置在移動通訊設備終端,用于向中轉(zhuǎn)服務器轉(zhuǎn)發(fā)網(wǎng)頁訪問請求的轉(zhuǎn)發(fā)模塊; 設置在中轉(zhuǎn)服務器,根據(jù)網(wǎng)頁訪問請求獲取第一網(wǎng)頁頁面,根據(jù)第一網(wǎng)頁頁面的網(wǎng)頁頁面特征計算第一網(wǎng)頁頁面特征值的頁面特征值計算模塊;設置在中轉(zhuǎn)服務器,從特征值數(shù)據(jù)庫中搜索與第一網(wǎng)頁頁面特征值相關的第一排版輔助數(shù)據(jù),中轉(zhuǎn)服務器根據(jù)第一排版輔助數(shù)據(jù)對第一網(wǎng)頁頁面進行排版得到第一排版網(wǎng)頁頁面,并向移動通訊設備終端返回第一排版網(wǎng)頁頁面的排版模塊。
全文摘要
本發(fā)明涉及移動通訊設備終端相關技術領域,特別是基于移動通訊設備終端的網(wǎng)頁頁面排版方法及系統(tǒng)。所述方法包括移動通訊設備終端向中轉(zhuǎn)服務器轉(zhuǎn)發(fā)網(wǎng)頁訪問請求;中轉(zhuǎn)服務器根據(jù)網(wǎng)頁訪問請求獲取第一網(wǎng)頁頁面,根據(jù)第一網(wǎng)頁頁面的網(wǎng)頁頁面特征計算第一網(wǎng)頁頁面特征值;中轉(zhuǎn)服務器從特征值數(shù)據(jù)庫中搜索與第一網(wǎng)頁頁面特征值相關的第一排版輔助數(shù)據(jù),中轉(zhuǎn)服務器根據(jù)第一排版輔助數(shù)據(jù)對第一網(wǎng)頁頁面進行排版得到第一排版網(wǎng)頁頁面,并向移動通訊設備終端返回第一排版網(wǎng)頁頁面。本發(fā)明通過對多用戶的瀏覽特點進行統(tǒng)計,能夠通過很大幅度優(yōu)化服務器排版頁面的內(nèi)容與顯示效果,提高用戶體驗。
文檔編號G06F17/30GK102184240SQ20111012584
公開日2011年9月14日 申請日期2011年5月16日 優(yōu)先權日2011年5月16日
發(fā)明者易壬俊, 梁捷 申請人:廣州市動景計算機科技有限公司