基于文檔頁面內容的圖像轉換方法及系統(tǒng)的制作方法【專利摘要】本發(fā)明的基于文檔頁面內容的圖像轉換方法及系統(tǒng),對所述頁面文檔內容進行劃分,得到顏色單一區(qū)域和顏色復雜區(qū)域;將顏色單一區(qū)域內的頁面內容轉換成適于壓縮顏色單一的第一格式圖像并存儲;將顏色復雜區(qū)域內的頁面內容轉換成適于壓縮顏色復雜的第二格式圖像并存儲;這樣通過對文檔頁面內容從類型上進行劃分,不同類型的頁面內容轉換成相應格式的圖像,保證文檔頁面內容中的文字和圖像信息的顯示效果?!緦@f明】基于文檔頁面內容的圖像轉換方法及系統(tǒng)【
技術領域:
】[0001]本發(fā)明涉及信息處理領域,具體是一種基于文檔頁面內容的圖像轉換方法及系統(tǒng)。【
背景技術:
】[0002]版式文檔,是版面呈現(xiàn)效果固定的電子文檔格式,比如PDF或者CAJ格式的文檔,版式文檔的呈現(xiàn)與設備無關,在各種設備上閱讀、打印或印刷時,其版面的呈現(xiàn)結果都是一致的;因此能夠很好地展示豐富的頁面效果,但是閱讀版式文檔時需要有一些相應模塊來對其進行解析、展示,即需要一個閱讀器,大大限制了版式文檔的使用。尤其是在網絡閱讀中,不能要求用戶都安裝閱讀器或ActiveX插件,因此,只能將版式文檔的內容直接轉換為圖像,以圖像的方式進行統(tǒng)一展示。[0003]版式文檔支持非常豐富的版面元素,包含大量圖片和文字,從而導致用單一的圖像格式不能對這些版面元素提供很好的展示效果。比如,使用JPG圖像格式對版式文檔進行轉換時,由于JPG壓縮方案不能很好地處理顏色較少的區(qū)域或處理純色區(qū)域,會導致版式文檔中的文字部分顯示效果不佳;同樣,使用PNG對版式文檔進行轉換時,一般會首先進行顏色取樣,然后再進行無損壓縮,在顏色取樣的過程中,為減少數(shù)據(jù)量,會損失相當數(shù)量的顏色值,導致最終解壓后的包含豐富顏色的圖像顯示失真?!?br/>發(fā)明內容】[0004]為此,本發(fā)明所要解決的是現(xiàn)有將版式文檔轉換成單一的圖像文件帶來的顯示效果失真的技術問題,提供一種基于文檔頁面內容的圖像轉換方法及系統(tǒng)。[0005]為解決上述技術問題,本發(fā)明采用的技術方案如下:[0006]-種基于文檔頁面內容的圖像轉換方法,包括如下步驟:[0007]區(qū)域劃分:對所述頁面文檔內容進行劃分,得到顏色單一區(qū)域和顏色復雜區(qū)域;[0008]將顏色單一區(qū)域內的頁面內容轉換成適于壓縮顏色單一內容的第一格式圖像;[0009]將顏色復雜區(qū)域內的頁面內容轉換成適于壓縮顏色復雜內容的第二格式圖像。[0010]所述的一種基于文檔頁面內容的圖像轉換方法,所述區(qū)域劃分步驟具體包括:[0011]將頁面元素為文字類型的區(qū)域劃分為顏色單一區(qū)域;[0012]將頁面元素為圖像類型的區(qū)域劃分為顏色復雜區(qū)域。[0013]所述的一種基于文檔頁面內容的圖像轉換方法,所述區(qū)域劃分步驟具體包括:[0014]將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為顏色單一區(qū)域;[0015]將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復雜區(qū)域。[0016]所述的一種基于文檔頁面內容的圖像轉換方法,所述頁面元素所在的區(qū)域根據(jù)所述頁面元素的位置、大小和縮放信息確定。[0017]所述的一種基于文檔頁面內容的圖像轉換方法,所述第一格式圖像為PNG圖像。[0018]所述的一種基于文檔頁面內容的圖像轉換方法,所述第二格式圖像為JPG圖像。[0019]所述的一種基于文檔頁面內容的圖像轉換方法,所述存儲按照以下步驟進行:[0020]將轉換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;[0021]將轉換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;[0022]在每個圖像的開始存儲的位置建立索引信息;[0023]將同一文檔頁面對應的多個所述第一格式圖像和所述第二格式圖像存儲在一個數(shù)據(jù)文件中。[0024]所述的一種基于文檔頁面內容的圖像轉換方法,還包括以下瀏覽器顯示的步驟:[0025]從所述數(shù)據(jù)文件中讀取每一個所述第一格式圖像和第二格式圖像的位置;[0026]根據(jù)每一個所述第一格式圖像和第二格式圖像的位置構建動態(tài)網頁信息;讀取每一個所述第一格式圖像和第二格式圖像的數(shù)據(jù)顯示在構建的所述動態(tài)網頁的對應位置上。[0027]同時提供一種基于文檔頁面內容的圖像轉換系統(tǒng),包括:[0028]區(qū)域劃分模塊,對所述頁面文檔內容進行劃分,得到顏色單一區(qū)域和顏色復雜區(qū)域;[0029]圖像轉換模塊,將顏色單一區(qū)域內的頁面內容轉換成適于壓縮顏色單一內容的第一格式圖像并存儲;將顏色復雜區(qū)域內的頁面內容轉換成適于壓縮顏色復雜內容的第二格式圖像并存儲。[0030]所述的一種基于文檔頁面內容的圖像轉換系統(tǒng),所述區(qū)域劃分模塊具體包括:[0031]顏色單一區(qū)域劃分子模塊:用于將文字類型的所述頁面元素所在的區(qū)域劃分為顏色單一區(qū)域;[0032]顏色復雜區(qū)域劃分子模塊:用于將圖像類型的所述頁面元素所在的區(qū)域劃分為顏色復雜區(qū)域。[0033]所述的一種基于文檔頁面內容的圖像轉換系統(tǒng),所述區(qū)域劃分模塊具體包括:[0034]顏色單一區(qū)域獲取子模塊,用于將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為顏色單一區(qū)域;[0035]顏色復雜區(qū)域獲取子模塊,用于將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復雜區(qū)域。[0036]所述的一種基于文檔頁面內容的圖像轉換系統(tǒng),還包括根據(jù)所述頁面元素的位置、大小和縮放信息確定所述頁面元素所在的區(qū)域的子模塊。[0037]所述的一種基于文檔頁面內容的圖像轉換系統(tǒng),所述圖像轉換模塊中的所述第一格式圖像為PNG圖像。[0038]所述的一種基于文檔頁面內容的圖像轉換系統(tǒng),所述圖像轉換模塊中的所述第二格式圖像為JPG圖像。[0039]所述的一種基于文檔頁面內容的圖像轉換系統(tǒng),所述圖像轉換模塊具體包括存儲子模塊,所述存儲子模塊具體包括:[0040]第一存儲子模塊,用于將轉換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;[0041]第二存儲子模塊,用于將轉換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;[0042]索引模塊,用于在每個圖像的開始存儲的位置建立索引信息;[0043]第三存儲子模塊,用于將將同一文檔頁面對應的多個所述第一格式圖像和所述第二格式圖像存儲在一個數(shù)據(jù)文件中。[0044]所述的一種基于文檔頁面內容的圖像轉換系統(tǒng),還包括瀏覽器顯示模塊,所述瀏覽器顯示模塊具體包括:[0045]位置讀取子模塊,用于從所述數(shù)據(jù)文件中讀取每一個所述第一格式圖像和第二格式圖像的位置;[0046]動態(tài)網頁構建子模塊,用于根據(jù)每一個所述第一格式圖像和第二格式圖像的位置構建動態(tài)網頁信息;[0047]顯示子模塊,用于讀取每一個所述第一格式圖像和第二格式圖像的數(shù)據(jù)并顯示在構建的所述動態(tài)網頁的對應位置上。[0048]本發(fā)明的上述技術方案相比現(xiàn)有技術具有以下優(yōu)點:[0049](1)本發(fā)明的基于文檔頁面內容的圖像轉換方法及系統(tǒng),對所述頁面文檔內容進行劃分,得到顏色單一區(qū)域和顏色復雜區(qū)域,將顏色單一區(qū)域內的頁面內容轉換成適于壓縮顏色單一內容的第一格式圖像并存儲;將顏色復雜區(qū)域內的頁面內容轉換成適于壓縮顏色復雜內容的第二格式圖像并存儲;這樣通過對文檔頁面內容從顏色是否復雜進行劃分,不同的頁面內容轉換成相應格式的圖像,保證文檔頁面內容中的文字和圖像信息的顯示效果。[0050](2)本發(fā)明的基于文檔頁面內容的圖像轉換方法及系統(tǒng)中,根據(jù)所述文檔頁面的元數(shù)據(jù)信息進行區(qū)域劃分,具體是根據(jù)類型是文字還是圖像進行區(qū)域劃分,能更進一步簡化區(qū)域劃分的步驟,減少區(qū)域劃分的工作量,方便實施。[0051](3)本發(fā)明的基于文檔頁面內容的圖像轉換方法及系統(tǒng)中,所述第一格式圖像為PNG圖像,這樣能保證文字的顯示效果,同時,能夠達到較大的壓縮率,減少圖像數(shù)據(jù)的存儲空間和在網絡上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉換的性能。[0052](3)本發(fā)明的基于文檔頁面內容的圖像轉換方法及系統(tǒng)中,所述第二格式圖像為JPG圖像,一方面,選用JPG格式能保證圖像的顯示效果,同時,能夠達到較大的壓縮率,大大減少圖像數(shù)據(jù)的存儲空間和在網絡上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉換的性能。[0053](4)本發(fā)明的基于文檔頁面內容的圖像轉換方法及系統(tǒng)中,將轉換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;將轉換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;在每個圖像的開始存儲的位置建立索引信息;將同一文檔頁面對應的多個所述第一格式圖像和所述第二格式圖像存儲在一個數(shù)據(jù)文件中??紤]不同信息的特殊性,針對確定的規(guī)則信息選用定長方式存儲,針對變量信息采用不定長方式存儲,方便實用;而且,通過索引信息的建立,提供高效的圖數(shù)據(jù)讀取方式;通過將不同的圖像存儲在一個數(shù)據(jù)文件中,便于緩存,也避免一個圖像存儲成一個文件產生的大量零散小文件,影響后續(xù)文件讀取的性能,以及可能造成文件的丟失。[0054](5)本發(fā)明的基于文檔頁面內容的圖像轉換方法及系統(tǒng)中,根據(jù)每一個所述第一格式圖像和第二格式圖像的位置構建動態(tài)網頁信息;讀取每一個所述第一格式圖像和第二格式圖像的數(shù)據(jù)顯示在構建的所述動態(tài)網頁的對應位置上?!緦@綀D】【附圖說明】[0055]為了使本發(fā)明的內容更容易被清楚的理解,下面根據(jù)本發(fā)明的具體實施例并結合附圖,對本發(fā)明作進一步詳細的說明,其中[0056]圖1為本發(fā)明一個實施例的一種基于文檔頁面內容的圖像轉換方法的方法流程圖;[0057]圖2為本發(fā)明另一個實施例的一種基于文檔頁面內容的圖像轉換方法的方法流程圖;[0058]圖3為本發(fā)明一個版式文檔的頁面示意圖;[0059]圖4為圖3使用本發(fā)明一個實施例的基于文檔頁面內容的圖像轉換方法轉換后的區(qū)域示意圖;[0060]圖5為本發(fā)明一個實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng)的結構框圖;[0061]圖6為本發(fā)明另一個實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng)的結構框圖?!揪唧w實施方式】[0062]實施例1[0063]參見圖1所示,為本發(fā)明一個實施例的一種基于文檔頁面內容的圖像轉換方法,包括如下步驟:[0064]區(qū)域劃分:對頁面文檔內容進行劃分,得到顏色單一區(qū)域和顏色復雜區(qū)域。[0065]將顏色單一區(qū)域內的頁面內容轉換成適于壓縮顏色單一內容的第一格式圖像并存儲。將顏色復雜區(qū)域內的頁面內容轉換成適于壓縮顏色復雜內容的第二格式圖像并存儲。[0066]本發(fā)明中,適于壓縮指適于壓縮顯示,解壓縮后內容的顯示基本不失真。[0067]本實施例的基于文檔頁面內容的圖像轉換方法,對頁面文檔內容進行劃分,得到顏色單一區(qū)域和顏色復雜區(qū)域,將顏色單一區(qū)域內的頁面內容轉換成適于壓縮顏色單一內容的第一格式圖像并存儲;將顏色復雜區(qū)域內的頁面內容轉換成適于壓縮顏色復雜內容的第二格式圖像并存儲;這樣通過對文檔頁面內容從顏色是否復雜進行劃分,不同的頁面內容轉換成相應格式的圖像,保證文檔頁面內容中的文字和圖像信息的顯示效果。[0068]實施例2[0069]參見圖2所示,作為本發(fā)明其他實施例的一種基于文檔頁面內容的圖像轉換方法,在實施例1的基礎上,區(qū)域劃分步驟具體包括:[0070]獲取文檔頁面的元數(shù)據(jù)信息;其中,元數(shù)據(jù)信息包括頁面元素的類型、位置、大小和縮放信息,頁面元素的類型包括文字(其中表格中的文字也歸為文字類型)和圖像。本實施例中,文檔為版式文檔,當然,其他格式的文檔只要包括必要的元數(shù)據(jù)信息,也可使用本發(fā)明的圖像轉換方法進行處理,同樣能實現(xiàn)本發(fā)明的目的。[0071]根據(jù)元數(shù)據(jù)信息提取文檔頁面的頁面元素的類型。[0072]根據(jù)頁面元素的位置、大小和縮放信息確定每個頁面元素的區(qū)域,即頁面元素所在的區(qū)域。[0073]將頁面元素為文字類型的區(qū)域劃分為顏色單一區(qū)域;將頁面元素為圖像類型的區(qū)域劃分為顏色復雜區(qū)域。[0074]本實施例中,根據(jù)文檔頁面的元數(shù)據(jù)信息進行區(qū)域劃分,具體是根據(jù)類型是文字還是圖像進行區(qū)域劃分,能更進一步簡化區(qū)域劃分的步驟,減少區(qū)域劃分的工作量,方便實施。[0075]實施例3[0076]作為本發(fā)明其他實施例的一種基于文檔頁面內容的圖像轉換方法,在實施例1的基礎上,區(qū)域劃分步驟具體包括:[0077]獲取文檔頁面的元數(shù)據(jù)信息;其中,元數(shù)據(jù)信息包括頁面元素的顏色值、位置、大小和縮放信息。[0078]根據(jù)頁面元素的位置、大小和縮放信息確定每個頁面元素的區(qū)域,即確定每個頁面元素的區(qū)域。[0079]將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為為顏色單一區(qū)域;將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復雜區(qū)域。[0080]優(yōu)選地,可以將多個直接相鄰的顏色單一或者復雜的區(qū)域合并生成一個大的顏色單一或者復雜的區(qū)域,這樣可以減少壓縮操作的次數(shù),提高整個文檔頁面的轉換效率。[0081]本實施例中區(qū)域劃分通過統(tǒng)計區(qū)域內的頁面元素的顏色值獲取,如果區(qū)域內的內容的顏色值不超過256種,則判定該頁面元素所在區(qū)域為顏色單一區(qū)域;反之,如果區(qū)域內的內容的顏色值超過256種,則判定為顏色復雜區(qū)域。通過統(tǒng)計預定范圍內的內容的顏色值的方法進行區(qū)域劃分統(tǒng)計顏色值的工作量較大,操作起來相對繁瑣,但是更準確,通用性更強。[0082]實施例4[0083]作為本發(fā)明其他實施例的一種基于文檔頁面內容的圖像轉換方法,在上述任一實施例的基礎上,第一格式圖像為PNG圖像,其中PNG的全稱為PortableNetworkGraphicFormat,意思為可移植網絡圖形格式。優(yōu)選地,第一格式圖像為8BitPNG圖像,這樣,用SBit對取樣后的顏色值進行存儲,最多存儲256中顏色,能達到更大的壓縮率,減少數(shù)據(jù)量。作為本發(fā)明其他實施例的第一格式圖像也可為Gif格式或者Tiff格式的圖像,同樣能實現(xiàn)本發(fā)明保證文字清晰顯示的模塊,而且還具有一定的壓縮率優(yōu)勢。[0084]第一格式圖像為PNG圖像,這樣能保證文字的顯示效果,同時,能夠達到較大的壓縮率,減少圖像數(shù)據(jù)的存儲空間和在網絡上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉換的性能。[0085]實施例5[0086]作為本發(fā)明其他的一種基于文檔頁面內容的圖像轉換方法,在上述任意一個實施例的基礎上,第二格式圖像為JPG圖像。JPG全名是JPEG,全稱為JointPhotographicExpertsGROUP,是由國際標準組織(ISO:InternationalStandardizationOrganization)和國際電話電報咨詢委員會(CCITT:ConsultationCommiteeoftheInternationalTelephoneandTelegraph)為靜態(tài)圖像所建立的第一個國際數(shù)字圖像壓縮標準,也是至今一直在使用的、應用最廣的圖像壓縮標準。JPEG格式可在10:1到20:1的比率下輕松地壓縮文件,而圖片質量不會下降。JPEG壓縮可以很好地處理寫實攝影作品。[0087]第二格式圖像為JPG圖像,一方面,選用JPG格式能保證圖像的顯示效果,同時,能夠達到較大的壓縮率,大大減少圖像數(shù)據(jù)的存儲空間和在網絡上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉換的性能。[0088]實施例6[0089]作為本發(fā)明其他實施例的一種基于文檔頁面內容的圖像轉換方法,在上述任一實施例的基礎上,存儲按照以下步驟進行:[0090]將轉換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;[0091]將轉換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;[0092]在每個圖像的開始存儲的位置建立索引信息;[0093]將同一文檔頁面對應的多個第一格式圖像和第二格式圖像存儲在一個數(shù)據(jù)文件中。[0094]將轉換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;將轉換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;在每個圖像的開始存儲的位置建立索引信息;將同一文檔頁面對應的多個第一格式圖像和第二格式圖像存儲在一個數(shù)據(jù)文件中??紤]不同信息的特殊性,針對確定的規(guī)則信息選用定長方式存儲,針對變量信息采用不定長方式存儲,方便實用;而且,通過索引信息的建立,提供高效的圖數(shù)據(jù)讀取方式;通過將不同的圖像存儲在一個數(shù)據(jù)文件中,便于緩存,也避免一個圖像存儲成一個文件產生的大量零散小文件影響后續(xù)文件讀取的性能,以及可能造成文件的丟失。[0095]實施例7[0096]作為本發(fā)明其他實施例的一種基于文檔頁面內容的圖像轉換方法,在上述實施例6的基礎上,還包括以下瀏覽器顯示的步驟:[0097]從數(shù)據(jù)文件中讀取每一個第一格式圖像和第二格式圖像的位置;[0098]根據(jù)每一個第一格式圖像和第二格式圖像的位置構建動態(tài)網頁信息;讀取每一個第一格式圖像和第二格式圖像的數(shù)據(jù)顯示在構建的動態(tài)網頁的對應位置上。[0099]根據(jù)每一個第一格式圖像和第二格式圖像的位置構建動態(tài)網頁信息;讀取每一個第一格式圖像和第二格式圖像的數(shù)據(jù)顯示在構建的動態(tài)網頁的對應位置上。[0100]實施例8[0101]參見圖5所示,為本發(fā)明一個實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng),包括:[0102]區(qū)域劃分模塊,對頁面文檔內容進行劃分,得到顏色單一區(qū)域和顏色復雜區(qū)域;[0103]圖像轉換模塊,將顏色單一區(qū)域內的頁面內容轉換成適于壓縮顏色單一內容的第一格式圖像并存儲;將顏色復雜區(qū)域內的頁面內容轉換成適于壓縮顏色復雜內容的第二格式圖像并存儲。[0104]本實施例的基于文檔頁面內容的圖像轉換系統(tǒng),對頁面文檔內容進行劃分,得到顏色單一區(qū)域和顏色復雜區(qū)域,將顏色單一區(qū)域內的頁面內容轉換成適于壓縮顏色單一內容的第一格式圖像并存儲;將顏色復雜區(qū)域內的頁面內容轉換成適于壓縮顏色復雜內容的第二格式圖像并存儲;這樣通過對文檔頁面內容從顏色是否復雜進行劃分,不同的頁面內容轉換成相應格式的圖像,保證文檔頁面內容中的文字和圖像信息的顯示效果。[0105]實施例9[0106]參見圖6所示,為本發(fā)明一個實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng),在實施例8的基礎上,區(qū)域劃分模塊具體包括:[0107]元數(shù)據(jù)信息獲取子模塊,用于獲取文檔頁面的元數(shù)據(jù)信息;其中,元數(shù)據(jù)信息包括頁面元素的類型、位置、大小和縮放信息,頁面元素的類型包括文字和圖像。[0108]區(qū)域確定子模塊,用于根據(jù)頁面元素的位置、大小和縮放信息確定每個頁面元素的區(qū)域。[0109]區(qū)域劃分子模塊,用于根據(jù)區(qū)域將文檔頁面包括的不同類型的頁面元素劃分為多個區(qū)域;區(qū)域劃分子模塊具體包括:顏色單一區(qū)域劃分子模塊和顏色復雜區(qū)域劃分子模塊:其中,顏色單一區(qū)域劃分子模塊:用于將頁面元素為文字類型的區(qū)域劃分為顏色單一區(qū)域;顏色復雜區(qū)域劃分子模塊,用于將頁面元素為圖像類型的區(qū)域劃分為顏色復雜區(qū)域。[0110]本實施例中,根據(jù)文檔頁面的元數(shù)據(jù)信息進行區(qū)域劃分,具體是根據(jù)類型是文字還是圖像進行區(qū)域劃分,能更進一步簡化區(qū)域劃分的步驟,減少區(qū)域劃分的工作量,方便實施。[0111]實施例10[0112]作為本發(fā)明一個實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng),在實施例8的基礎上,區(qū)域劃分模塊具體包括:[0113]元數(shù)據(jù)信息獲得子模塊,用于獲取文檔頁面的元數(shù)據(jù)信息;其中,元數(shù)據(jù)信息包括頁面元素的顏色值、位置、大小和縮放信息;[0114]區(qū)域界定子模塊,用于根據(jù)頁面元素的位置、大小和縮放信息確定每個頁面元素的區(qū)域;[0115]區(qū)域獲取子模塊,具體包括顏色單一區(qū)域獲取子模塊和顏色復雜區(qū)域獲取子模塊,其中,顏色單一區(qū)域獲取子模塊,用于將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為顏色單一區(qū)域;顏色復雜區(qū)域獲取子模塊,用于將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復雜區(qū)域。[0116]本實施例中區(qū)域劃分通過統(tǒng)計區(qū)域內的頁面元素的顏色值獲取,如果區(qū)域內的內容的顏色值不超過256種,則判定頁面元素所在的區(qū)域為顏色單一區(qū)域;反之,如果區(qū)域內的內容的顏色值超過256種,則判定為顏色復雜區(qū)域。通過統(tǒng)計預定范圍內的內容的顏色值的方法進行區(qū)域劃分統(tǒng)計顏色值的工作量較大,操作起來相對繁瑣,但是更準確,通用性更強。[0117]實施例11[0118]作為本發(fā)明其他實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng),在上述任一實施例的基礎上,圖像轉換模塊中的第一格式圖像為PNG圖像。[0119]第一格式圖像為PNG圖像,這樣能保證文字的顯示效果,同時,能夠達到較大的壓縮率,減少圖像數(shù)據(jù)的存儲空間和在網絡上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉換的性能。[0120]實施例12[0121]作為本發(fā)明其他實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng),在上述任意一個實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng)的基礎上,圖像轉換模塊中的第二格式圖像為JPG圖像。[0122]第二格式圖像為JPG圖像,一方面,選用JPG格式能保證圖像的顯示效果,同時,能夠達到較大的壓縮率,大大減少圖像數(shù)據(jù)的存儲空間和在網絡上的傳輸時間;兼顧到了顯示效果、數(shù)據(jù)文件的大小以及轉換的性能。[0123]實施例13[0124]作為本發(fā)明其他實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng),在上述任意一個實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng)的基礎上,圖像轉換模塊具體包括存儲子模塊,存儲子模塊具體包括:[0125]第一存儲子模塊,用于將轉換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲。[0126]第二存儲子模塊,用于將轉換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲。[0127]索引模塊,用于在每個圖像的開始存儲的位置建立索引信息。[0128]第三存儲子模塊,用于將將同一文檔頁面對應的多個第一格式圖像和第二格式圖像存儲在一個數(shù)據(jù)文件中。[0129]本實施例中,將轉換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;將轉換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;在每個圖像的開始存儲的位置建立索引信息;將同一文檔頁面對應的多個第一格式圖像和第二格式圖像存儲在一個數(shù)據(jù)文件中。考慮不同信息的特殊性,針對確定的規(guī)則信息選用定長方式存儲,針對變量信息采用不定長方式存儲,方便實用;而且,通過索引信息的建立,提供高效的圖數(shù)據(jù)讀取方式;通過將不同的圖像存儲在一個數(shù)據(jù)文件中,便于緩存,也避免一個圖像存儲成一個文件產生的大量零散小文件影響后續(xù)文件讀取的性能,以及可能造成文件的丟失。[0130]實施例14[0131]作為本發(fā)明其他實施例的一種基于文檔頁面內容的圖像轉換系統(tǒng),在上述實施例13的基礎上,還包括瀏覽器顯示子模塊,瀏覽器顯示子模塊具體包括:[0132]位置讀取子模塊,用于從數(shù)據(jù)文件中讀取每一個第一格式圖像和第二格式圖像的位置;[0133]動態(tài)網頁構建子模塊,用于根據(jù)每一個第一格式圖像和第二格式圖像的位置構建動態(tài)網頁信息;[0134]顯示子模塊,用于讀取每一個第一格式圖像和第二格式圖像的數(shù)據(jù)并顯示在構建的動態(tài)網頁的對應位置上。[0135]下面結合圖3和圖4所示的版式頁面示例,對本發(fā)明的基于文檔頁面內容的圖像轉換方法和系統(tǒng)進行具體說明:[0136]以圖3中所示的文檔頁面為例,該頁面根據(jù)元數(shù)據(jù)的不同被劃分為四個部分:文字部分1、圖像部分2、文字部分3和文字部分4,每部分被最終轉換成一張圖像,其中圖像部分2被轉換成適于顏色單一的的PNG圖像,其他三部分被轉換成適于壓縮顏色復雜的JPG圖像,各張圖像的詳細信息如下表所示:[0137]【權利要求】1.一種基于文檔頁面內容的圖像轉換方法,其特征在于,包括如下步驟:區(qū)域劃分:對所述頁面文檔內容進行劃分,得到顏色單一區(qū)域和顏色復雜區(qū)域;將顏色單一區(qū)域內的頁面內容轉換成適于壓縮顏色單一內容的第一格式圖像;將顏色復雜區(qū)域內的頁面內容轉換成適于壓縮顏色復雜內容的第二格式圖像。2.根據(jù)權利要求1所述的一種基于文檔頁面內容的圖像轉換方法,其特征在于,所述區(qū)域劃分步驟具體包括:將頁面元素為文字類型的區(qū)域劃分為顏色單一區(qū)域;將頁面元素為圖像類型的區(qū)域劃分為顏色復雜區(qū)域。3.根據(jù)權利要求1所述的一種基于文檔頁面內容的圖像轉換方法,其特征在于,所述區(qū)域劃分步驟具體包括:將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為顏色單一區(qū)域;將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復雜區(qū)域。4.根據(jù)權利要求2或3所述的一種基于文檔頁面內容的圖像轉換方法,其特征在于,所述頁面元素所在的區(qū)域根據(jù)所述頁面元素的位置、大小和縮放信息確定。5.根據(jù)權利要求1-4任一所述的一種基于文檔頁面內容的圖像轉換方法,其特征在于,所述第一格式圖像為PNG圖像。6.根據(jù)權利要求1-5任一所述的一種基于文檔頁面內容的圖像轉換方法,其特征在于,所述第二格式圖像為JPG圖像。7.根據(jù)權利要求1-6任一所述的一種基于文檔頁面內容的圖像轉換方法,其特征在于,所述存儲按照W下步驟進行:將轉換后的第一格式圖像和第二格式圖像的位置和大小用定長方式存儲;將轉換后的第一格式圖像和第二格式圖像的數(shù)據(jù)按照不定長方式存儲;在每個圖像的開始存儲的位置建立索引信息;將同一文檔頁面對應的多個所述第一格式圖像和所述第二格式圖像存儲在一個數(shù)據(jù)文件中。8.根據(jù)權利要求7所述的一種基于文檔頁面內容的圖像轉換方法,其特征在于,還包括W下瀏覽器顯示的步驟:從所述數(shù)據(jù)文件中讀取每一個所述第一格式圖像和第二格式圖像的位置;根據(jù)每一個所述第一格式圖像和第二格式圖像的位置構建動態(tài)網頁信息;讀取每一個所述第一格式圖像和第二格式圖像的數(shù)據(jù)顯示在構建的所述動態(tài)網頁的對應位置上。9.一種基于文檔頁面內容的圖像轉換系統(tǒng),其特征在于,包括:區(qū)域劃分模塊,對所述頁面文檔內容進行劃分,得到顏色單一區(qū)域和顏色復雜區(qū)域;圖像轉換模塊,將顏色單一區(qū)域內的頁面內容轉換成適于壓縮顏色單一內容的第一格式圖像并存儲;將顏色復雜區(qū)域內的頁面內容轉換成適于壓縮顏色復雜內容的第二格式圖像并存儲。10.根據(jù)權利要求9所述的一種基于文檔頁面內容的圖像轉換系統(tǒng),其特征在于,所述區(qū)域劃分模塊具體包括:顏色單一區(qū)域劃分子模塊:用于將文字類型的所述頁面元素所在的區(qū)域劃分為顏色單一區(qū)域;顏色復雜區(qū)域劃分子模塊:用于將圖像類型的所述頁面元素所在的區(qū)域劃分為顏色復雜區(qū)域。11.根據(jù)權利要求9所述的一種基于文檔頁面內容的圖像轉換系統(tǒng),其特征在于,所述區(qū)域劃分模塊具體包括:顏色單一區(qū)域獲取子模塊,用于將頁面元素的顏色值少于或者等于256種的區(qū)域劃分為顏色單一區(qū)域;顏色復雜區(qū)域獲取子模塊,用于將頁面元素的顏色值多于256種的區(qū)域劃分為顏色復雜區(qū)域。12.根據(jù)權利要求10或11所述的一種基于文檔頁面內容的圖像轉換系統(tǒng),其特征在于,還包括根據(jù)所述頁面元素的位置、大小和縮放信息確定所述頁面元素所在的區(qū)域的子模塊。【文檔編號】G06T9/00GK104462159SQ201310450959【公開日】2015年3月25日申請日期:2013年9月25日優(yōu)先權日:2013年9月25日【發(fā)明者】童征宇,董寧,徐劍波申請人:北大方正集團有限公司,北京方正阿帕比技術有限公司