專利名稱:網(wǎng)絡內(nèi)容在電紙書上的展示方法
技術領域:
本發(fā)明涉及一種展示方法,特別涉及一種利用電子墨水在電紙書上展示網(wǎng)絡內(nèi)容
的方法。
背景技術:
科學技術的發(fā)展,使得E-Ink技術越來越多的應用于顯示閱讀方面。E-Ink—般稱 之為電子墨水技術(電泳式電子紙),它是一種屏幕技術,E-Ink的電子紙由電子墨水及兩 片基板所組成,它上面涂有一種由無數(shù)微小的透明顆粒組成的電子墨水,顆粒直徑只有人 的頭發(fā)絲的一半大小。只要調整顆粒內(nèi)的染料和微型粒子的顏色,便能夠使電子墨水展現(xiàn) 色彩和圖案來。當這種電子墨水被涂到紙、布或其他平面物體上后,人們只要適當?shù)貙λ?以電擊,就能使數(shù)以億計的顆粒變幻顏色,從而根據(jù)人們的設定不斷地改變所顯現(xiàn)的圖案 和文字。電子墨水具有包括刷新速度快、易讀性,柔性,廉價制造和低功耗的優(yōu)點。
隨著電子墨水技術的日益流行以及人們對互聯(lián)網(wǎng)信息的依賴,在移動設備上方便 即時的查看互聯(lián)網(wǎng)信息已經(jīng)成為大眾的需求。但由于大多數(shù)網(wǎng)頁仍然是為PC計算機的標 準顯示器而設計的,他們在移動設備上的顯示存在著缺陷第一,由于移動設備的屏幕受硬 件限制,較寬的網(wǎng)頁在較小的設備上無法很好的顯示,需要根據(jù)顯示屏對網(wǎng)頁進行優(yōu)化和 過濾,比如黑白屏和彩色屏,大屏和小屏,電子紙屏和LCD屏;第二,由于移動設備的目的性 更強,而且網(wǎng)絡運營商往往會按照流量收費,因此移動用戶對于內(nèi)容的選擇性更加強烈,需 要根據(jù)內(nèi)容對網(wǎng)頁進行優(yōu)化和過濾,比如是否顯示廣告,是否顯示不適合閱讀的內(nèi)容;第 三,由于移動設備對于電池要求較高,需要通過優(yōu)化網(wǎng)頁達到節(jié)能的目的;第四,由于互聯(lián) 網(wǎng)信息的及時性特征,上述的優(yōu)化和過濾需要在一定時間內(nèi)完成,否則不能滿足快速閱讀 的需求;第五,雖然目前市場上部分網(wǎng)頁推出了移動設備版本,比如WAP版、3G版、RSS版,但 是這些網(wǎng)站只是所有網(wǎng)站中的鳳毛麟角,而且他們不能靈活的根據(jù)不同的移動設備進行靈 活的優(yōu)化。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術的不足,提供一種網(wǎng)絡內(nèi)容在電紙書上的展示方 法,以滿足客戶對于網(wǎng)頁易讀性,費用低和低功耗的需求。 為了達到上述目的,本發(fā)明采用的技術方案是一種網(wǎng)絡內(nèi)容在電紙書上的展示 方法,用于即時展示適應移動設備的網(wǎng)頁,依次由頁面分解、選擇過濾、頁面單元過濾、頁面 整合渲染四個步驟組成。原始頁面經(jīng)過頁面提取后分割為一系列頁面單元,根據(jù)從頁面單 元的信息,確定頁面的具體分類從而選擇過濾器。之后,通過選定的過濾器過濾設備不支持 的頁面單元,過濾移動設備用戶不需要的頁面單元(比如導航條,用戶評論等)。最后,系統(tǒng) 將篩選過后的頁面單元整合后發(fā)往客戶端并重新渲染,在客戶端設備上顯示適合以電紙書 為代表的移動設備閱讀的頁面。 與現(xiàn)有技術相比,本發(fā)明的有益效果是第一、適用性范圍廣,可以轉化互聯(lián)網(wǎng)上
3的所有網(wǎng)頁;第二、靈活。本方法通過簡單的配置,可以使用于不同的移動設備;第三、提 高了移動設備顯示屏的適用范圍,比如,使得電子油墨(E-Ink)等不適合瀏覽網(wǎng)頁的屏幕, 可以容易的瀏覽網(wǎng)頁;第四、增強了用戶體驗,減少了與用戶無關的內(nèi)容,節(jié)約了流量費用; 第五、速度快,用戶基本不會體會出來延遲。
圖l為本發(fā)明的原理框圖;
圖2為本發(fā)明的系統(tǒng)結構圖。
具體實施例方式
本發(fā)明的設計方案在于克服現(xiàn)有技術的不足,提供一種網(wǎng)絡內(nèi)容在電紙書上的展 示方法,以滿足客戶對網(wǎng)頁易讀性、費用低和低功耗的需求。下面結合實施例參照附圖進行 詳細說明,以便對本發(fā)明的技術特征及優(yōu)點進行更深入的詮釋。 本發(fā)明的原理框圖如圖l所述,依次由頁面分解、選擇過濾、頁面單元過濾、頁面 整合渲染四個步驟組成。原始頁面經(jīng)過頁面提取后分割為一系列頁面單元,根據(jù)從頁面單 元的信息,確定頁面的具體分類從而選擇過濾器。之后,通過選定的過濾器過濾設備不支持 的頁面單元,過濾移動設備用戶不需要的頁面單元(比如導航條,用戶評論等)。最后,系統(tǒng) 將篩選過后的頁面單元整合后發(fā)往客戶端并重新渲染,在客戶端設備上顯示適合以電紙書 為代表的移動設備閱讀的頁面。 下面結合圖進行進一步說明,如圖2所示,該方法所所依托的系統(tǒng)依次由數(shù)據(jù)獲
取層、分解層、選擇過濾層、過濾層、數(shù)據(jù)重組層和數(shù)據(jù)整合渲染層組成,整個轉換過程可以
分為四個步驟 步驟一頁面分解 基本功能將頁面分解為一系列頁面單元。 輸入原始頁面的亂(Uniform/Universal Resource Locator的縮寫,統(tǒng)一資源 也被稱為網(wǎng)頁地址,是因特網(wǎng)上標準的資源的地址)。 輸出一個頁面單元的集合,其中絕大多數(shù)頁面單元可以通過renderengine的 API (Application Programming Interface,應用程序編程接口 )直接訪問。
頁面分解步驟由數(shù)據(jù)獲取層和分解層共同組成。對于每一個需要處理的網(wǎng)頁。系 統(tǒng)將原始頁面轉化為若干頁面單元的集合,并收集每個頁面單元的內(nèi)容和位置信息。每一 個頁面單元都是一個基本信息單位,并在渲染后的頁面上占據(jù)一定的位置。 一個鏈接、一個 文字域、一個表格或者一個圖面都是頁面單元。每一個頁面單元都包含其在頁面顯示位置 的信息。 一個頁面單元還能夠同時包含其他頁面單元。同時并行使用三個開源html渲染 引擎,渲染引擎將下載下來的html頁面直接轉化為頁面單元的集合,而最終使用的頁面單 元集合就是三個渲染結果的交集。從而確保頁面不出現(xiàn)非標準展示的信息。
步驟二選擇過濾 基本功能根據(jù)從頁面單元等信息,確定需要使用的過濾器。
輸入信息原始頁面數(shù)據(jù)、頁面單元集合數(shù)據(jù)。
輸出信息需要使用的過濾器。
因為并不是所有的頁面單元都適合在移動設備上展示的,所以需要對頁面單元集 合中的元素進行過濾,篩除不適合在便攜式設備上展示的內(nèi)容。比如Flash或者GIF動畫, 就非常不適合在使用E-ink屏幕技術的電紙書閱讀器上觀看。此時,我們選擇使用一系列 的過濾器去篩選頁面單元中不適合在電紙閱讀器上觀看的部分。 系統(tǒng)主要包括三種類型的過濾器。第一類過濾器是和頁面的分類結果相關的,只 有當一個頁面被分為特殊的分類的時候,這種過濾器才會被觸發(fā),我們稱這類過濾器為"分 類過濾器";第二類過濾器是和特定的現(xiàn)實設備相關的,我們稱這類過濾器為設備過濾器, 這類過濾器的主要作用是去掉那些無法和電紙書設備顯示模式兼容的頁面單元;第三類過 濾器是內(nèi)容過濾器,這類過濾器完全按照頁面單元所包含的內(nèi)容來決定是否保留對應的頁 面單元。 其中對于分類過濾器的選擇方法如下根據(jù)從頁面對象抓取的信息,對輸入網(wǎng)頁 進行分類,不同類型的網(wǎng)站對信息的處理方式是非常不同的。根據(jù)從頁面單元中提取出來 的信息,為頁面標定類別,并把頁面的類別作為重要的參數(shù),使用在對頁面單元過濾器的選 擇中。 頁面分類步驟通過對頁面單元的分析,決定特定網(wǎng)頁歸屬的類別。 一般情況下, 頁面的分類按照以下步驟進行首先通過對頁面單元的統(tǒng)計得到分類的參數(shù)。每一個參數(shù) 可以是數(shù)值型,也可以是字符串型。比如,一個頁面對應的標題頁面單元的文字內(nèi)容,就是 作為頁面分類的一個參數(shù)。通過收集分類參數(shù)的值并代入事先訓練好的分類模型,就可以 通過自動化的方式得到頁面的類別信息。實現(xiàn)過程中,一個頁面的分類標簽可以是新聞,博 客,電子商務等品類中的一個。而每一個分類標簽,都有自己獨有的頁面單元過濾器,這些 過濾器會在下一步中,用來過濾特定的頁面單元。
步驟三頁面單元過濾 基本功能應用過濾器減少需要展示的頁面單元的數(shù)量。
輸入頁面單元的集合以及選中的過濾器集合。
輸出一個精簡過的頁面單元集合。
在現(xiàn)實生活中,通過應用過濾器的方式減少需要顯示的頁面單元的數(shù)量。每一個
過濾器都會攔截滿足特定條件的頁面單元,使其無法最終在用戶終端顯示出來。
步驟四頁面重組整合渲染 基本功能將篩選過后的頁面單位重組整合后發(fā)往客戶端,并重新渲染展示。
輸入保存在服務器上的頁面單元集合。
輸出在客戶端設備上顯示處理過的頁面。 根據(jù)終端設備的配置和用戶的使用偏好,對過濾后的頁面進行重新渲染。 一旦頁 面單元過濾完成,剩下被選中的頁面單元就需要重新進行組合,以便在客戶端設備上展示 出來??梢杂靡韵聝煞N方式展示新頁面第一,剩余的頁面元素按照一定的邏輯規(guī)則寫入業(yè) 界標準的數(shù)據(jù)格式,這樣的數(shù)據(jù)傳到客戶端一后,會按照標準的流程對頁面的內(nèi)容進行渲 染和展示;第二,頁面單元集合被直接送到了客戶端設備,由客戶端設備直接進行調整傳來 頁面元素的標記位置。 頁面重渲染采用分步的方式,篩選之后的頁面單元集合首先轉化成為XML數(shù)據(jù)文 件,傳輸?shù)娇蛻舳艘院蟾鶕?jù)客戶端的具體設置重新組織展示出來。在系統(tǒng)中,最終顯示界面可能存在兩種情況一是一系列頭條消息的列表,用戶隨便點擊一個就可以直接看到相關 的內(nèi)容頁面;二是經(jīng)過簡化過的內(nèi)容頁面,在這個頁面中,用戶可以看到經(jīng)過精簡過的頁面 內(nèi)容。
權利要求
一種網(wǎng)絡內(nèi)容在電紙書上的展示方法,用于即時展示適應移動設備的網(wǎng)頁,其特征在于該方法依次由頁面分解、選擇過濾、頁面單元過濾、頁面重組整合渲染四個步驟組成。
2. 根據(jù)權利要求1所述的網(wǎng)絡內(nèi)容在電紙書上的展示方法,其特征在于所述的步驟依托于依次由數(shù)據(jù)獲取層、分解層、選擇過濾層、過濾層、數(shù)據(jù)重組層和數(shù)據(jù)整合渲染層組成的系統(tǒng)。
3. 根據(jù)權利要求2所述的網(wǎng)絡內(nèi)容在電紙書上的展示方法,其特征在于所述的數(shù)據(jù)提取層和分解層組成了頁面分解步驟,頁面經(jīng)過頁面提取后成為原始數(shù)據(jù)提供給分解層,分解層通過渲染引擎將頁面直接轉化為頁面單元的集合。
4. 根據(jù)權利要求3所述的網(wǎng)絡內(nèi)容在電紙書上的展示方法,其特征在于所述的經(jīng)過數(shù)據(jù)分解的頁面單元進入選擇過濾層,根據(jù)設備信息,以及頁面的分類,選擇合適的過濾器。
5. 根據(jù)權利要求4所述的網(wǎng)絡內(nèi)容在電紙書上的展示方法,其特征在于所述的頁面單元經(jīng)過選擇的過濾器,進行基于分類的過濾,基于設備的過濾以及基于內(nèi)容的過濾。
6. 根據(jù)權利要求5所述的網(wǎng)絡內(nèi)容在電紙書上的展示方法,其特征在于所述的經(jīng)過過濾的頁面單元進入數(shù)據(jù)重組層,對數(shù)據(jù)進行實體檢測、協(xié)同式聚類、個性化語意分析、時間序列分析,從而將無序的網(wǎng)頁單元整合成為有序的集合。
7. 根據(jù)權利要求6所述的網(wǎng)絡內(nèi)容在電紙書上的展示方法,其特征在于所述的經(jīng)過數(shù)據(jù)重組的頁面單元集合進入位于數(shù)據(jù)整合層,將篩選過后的頁面單元整合成為一個整體。
8. 根據(jù)權利要求7所述的網(wǎng)絡內(nèi)容在電紙書上的展示方法,其特征在于所述的經(jīng)過整合后的頁面單元在在客戶端設備上顯示成為適合移動設備閱讀的頁面。
9. 根據(jù)權利要求1 8所述的網(wǎng)絡內(nèi)容在電紙書上的展示方法,其特征在于整個轉換過程在服務器端完成,用時少于1秒。
全文摘要
本發(fā)明公開了一種網(wǎng)絡內(nèi)容在電紙書上的展示方法,用于即時展示適應移動設備的網(wǎng)頁,依次由頁面分解、選擇過濾、頁面單元過濾、頁面整合渲染四個步驟組成。原始頁面經(jīng)過頁面提取后分割為一系列頁面單元,根據(jù)從頁面單元搜集的信息、設備的特性以及頁面的具體分類選擇過濾器,通過選定的過濾器過濾設備不支持的頁面單元以及移動設備用戶不需要的頁面單元。最后,系統(tǒng)將篩選過后的頁面單元重組整合后發(fā)往客戶端并重新渲染,在客戶端設備上顯示。本發(fā)明具有適用性范圍廣、靈活、讀取方便快捷、節(jié)省流量費用等優(yōu)點,可以滿足各種移動設備用戶的需求,特別是對于電紙書類使用特殊屏幕的產(chǎn)品尤為適用。
文檔編號G06F17/30GK101794301SQ201010104330
公開日2010年8月4日 申請日期2010年2月1日 優(yōu)先權日2010年2月1日
發(fā)明者黃崢 申請人:東莞市樂其網(wǎng)絡科技有限公司