專利名稱:一種報紙數(shù)字化版面信息的裁剪與拼裝的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于數(shù)字圖書館與數(shù)字報刊應(yīng)用領(lǐng)域,具體涉及一種報紙數(shù)字化版面信息
的裁剪與拼裝的方法及系統(tǒng)。
背景技術(shù):
目前,隨著計算機網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字報刊以它信息量大、時效性高、便于檢索、收藏、管理的優(yōu)勢獲得了人們的青睞。同時,隨著web2.0時代的到來,數(shù)字媒體的用戶個性化數(shù)據(jù)再加工技術(shù)_數(shù)字報剪報技術(shù)也越來越受到人們的關(guān)注和期待。
傳統(tǒng)紙質(zhì)剪報技術(shù)缺點明顯,面對數(shù)字報刊更是束手無策。傳統(tǒng)剪報是用一把剪刀,從一張完好的報紙或者一本嶄新的刊物里直接將所需文章剪裁下來,然后用漿糊把它們拼湊在一起。這種做法破壞了報紙和刊物的完整性,降低了其保存利用的價值。同時,剪報制作者不能對剪裁下來的文章進行再加工,并且傳遞方式單一。數(shù)字報刊剪報技術(shù)的出現(xiàn)正好能夠解決上述存在的問題。 報紙信息作為平面媒體資訊的重要來源顯得格外重要,但是目前的數(shù)字報只提供
原文和原版面圖信息是不夠的,當(dāng)報紙資訊文章獨立被檢索和使用時,它的出處佐證圖片
顯得格外重要,通過使用本方法也可以解決上述問題。
目前數(shù)字報刊剪報技術(shù)的實現(xiàn),主要采用如下方案 將圖片形式的報紙版面反解為電子文本,并根據(jù)一定的人工標(biāo)注住息將待剪的報道以文本方式抽取出來,提供給讀者的是報道文本。由于并未將待剪報道保持原來的形狀以版面圖片子圖的形式裁剪出來,無法將各裁剪出的報道進行拼接,所以并未實現(xiàn)真正意義上的剪報。 以上剪報方案,未達到模擬讀者紙質(zhì)剪報習(xí)慣,保持原報紙報道排版樣式,按讀者興趣分類管理剪報、排版打印的效果和初衷。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的是提供一種報紙數(shù)字化版面信息的裁剪與拼裝的方法及系統(tǒng),該方法及系統(tǒng)能夠模擬紙質(zhì)剪報,根據(jù)用戶點擊裁剪報紙數(shù)字化版面上的文章報道,從而實現(xiàn)面向讀者提供個性化數(shù)字剪報功能的目的。
為達到以上目的,本發(fā)明采用的技術(shù)方案是 —種報紙數(shù)字化版面信息的裁剪與拼裝的方法,包括以下步驟 步驟一,圖片定位裁剪模塊將圖片形式的報紙數(shù)字化版面中讀者需要裁剪的目標(biāo)
文章包括其涉及的圖片按其在報紙中所呈現(xiàn)的形狀完整的裁剪下來,形成只包含此目標(biāo)文
章區(qū)域的新圖片; 步驟二,多圖片拼接模塊將用戶裁剪下來的多個圖片進行拼接; 步驟三,打印成簿模塊對拼接后的圖片進行輸出或打印。 進一步,步驟一中,對目標(biāo)文章區(qū)域進行裁剪的方法包括以下步驟
4
(1)用戶選定需要裁剪的目標(biāo)文章,系統(tǒng)獲得目標(biāo)文章區(qū)域的外接矩形;
(2)按外接矩形邊界進行裁剪,將目標(biāo)文章外接矩形位置信息同本版面所有其它文章外接矩形位置進行比較計算,判斷是否有交集,如果是,則得到交集區(qū)域,否則轉(zhuǎn)入步驟(5); (3)將交集區(qū)域位置信息與目標(biāo)文章的熱點信息進行比較計算,從而判斷交集區(qū)域是否屬于目標(biāo)文章,如果是,轉(zhuǎn)入步驟(5),否則轉(zhuǎn)入步驟(4); (4)計算獲得交集區(qū)域,并將不屬于目標(biāo)文章的交集區(qū)域設(shè)置底色為白色,生成一幅新的圖片作為裁剪后的文章圖片; (5)保存裁剪后文章圖片并記錄裁剪邊界位置信息。更進一步,步驟(1)中,系統(tǒng)獲得目標(biāo)文章區(qū)域的外接矩形的方法如下系統(tǒng)首先獲得該目標(biāo)文章的ID,然后從數(shù)據(jù)庫中讀取該目標(biāo)文章的熱點信息,在熱點信息中找出橫、縱坐標(biāo)的最小值與最大值,最后組合成為能夠覆蓋此目標(biāo)文章全部區(qū)域的最小矩形的四個頂點的坐標(biāo),該最小矩形為目標(biāo)文章區(qū)域的外接矩形。 進一步,步驟二中,用戶將裁剪好的文章的圖片分類保存,當(dāng)用戶希望對多張圖片進行拼接排版時,選擇某一分類,系統(tǒng)將分類中所有用戶保存的圖片讀至瀏覽器頁面一側(cè)候選區(qū)。 更進一步,步驟二中,拼接的畫布默認大小為A4,并且能夠自定義設(shè)置。拼接時采用Flash技術(shù),將候選區(qū)的剪切圖片拖至畫布區(qū),自由擺放,如有重疊則由用戶設(shè)置層次。在畫布上拼接的剪切圖片的圖片信息放在緩沖區(qū),用戶關(guān)閉瀏覽器時排版信息清除。
進一步,步驟三中,對拼接后的圖片進行輸出或打印的方法包括以下步驟
首先將用戶排版的畫布上的每個剪切圖片按ID從數(shù)據(jù)庫中讀出相應(yīng)標(biāo)題和文章正文建立關(guān)聯(lián),將各文章標(biāo)題按照位置自上至下自左至右順序,依次排列形成目錄;
然后按照目錄順序?qū)⑽恼抡陌次恼路猪撆帕谐晌臋n,將排列的頁數(shù)加至目錄項中; 最后將畫布上排版好的拼接圖片信息、目錄、文章正文輸出保存或傳給打印機,由打印機打印輸出。 —種報紙數(shù)字化版面信息的裁剪與拼裝的系統(tǒng),包括以下模塊 圖片定位裁剪模塊,用于將圖片形式的報紙版面中讀者需要裁剪的文章包括其涉
及的圖片按其在報紙中所呈現(xiàn)的形狀完整的裁剪下來,形成只包含此文章區(qū)域的新圖片; 用于將用戶裁剪下來的多個圖片進行拼接的多圖片拼接模塊; 用于對拼接后的圖片進行輸出或打印的打印成簿模塊。 本發(fā)明的效果在于采用本發(fā)明所述的方法和系統(tǒng),可以有效地根據(jù)用戶點擊裁剪報紙數(shù)字化版面上的文章報道,分類保存、在線排版、打印,達到了模擬紙質(zhì)剪報,面向讀者提供個性化剪報功能的初衷。
圖1是本發(fā)明所述系統(tǒng)的結(jié)構(gòu)圖; 圖2是本發(fā)明所述方法中圖片定位裁剪方法的流程圖。
具體實施例方式
下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步地描述。
如圖1所示,一種報紙數(shù)字化版面信息的裁剪與拼裝的系統(tǒng),包括以下模塊 圖片定位裁剪模塊ll,多圖片拼接模塊12,打印成簿模塊模塊13。 所述的圖片定位裁剪模塊11用于將圖片形式的報紙版面中讀者需要裁剪的文章
包括其涉及的圖片按其在報紙中所呈現(xiàn)的形狀完整的裁剪下來,形成只包含此文章區(qū)域的
新圖片。 所述的多圖片拼接模塊12用于將用戶裁剪下來的多個圖片進行拼接。 所述的打印成簿模塊13對拼接后的圖片進行輸出或打印。 如圖2所示,一種報紙數(shù)字化版面信息的裁剪與拼裝的方法,包括以下步驟 步驟一,圖片定位裁剪模塊將圖片形式的報紙版面中讀者需要裁剪的目標(biāo)文章包
括其涉及的圖片按其在報紙中所呈現(xiàn)的形狀完整的裁剪下來,形成只包含此目標(biāo)文章區(qū)域
的新圖片。 本實施例中,由于報紙中每篇文章的顯示形狀大部分呈矩形,但也有許多呈不規(guī)則形狀或分離的幾個子圖,所以使用最大拼接算法來確定需要裁剪的目標(biāo)文章的正確區(qū)域。 數(shù)據(jù)庫中存有每份報紙各個版面中每個文字塊及圖片的位置信息。要求每個文字塊及圖片的形狀都為矩形,如呈不規(guī)則形狀,將被拆分成多個不相交的矩形。為每個矩形單元保存四個頂點的位置坐標(biāo)。在數(shù)字報出版前,排版人員將手工設(shè)置各矩形單元的關(guān)聯(lián)-即每篇文章由哪些矩形組成。因此將在數(shù)據(jù)庫中保存每份報紙各個版面上每篇文章的ID,以及組成這篇文章區(qū)域的所有矩形單元的頂點坐標(biāo)值,將這些坐標(biāo)值的集合稱作該文章的熱點信息。 本實施例中,使用最大拼接算法來確定需要裁剪的目標(biāo)文章的正確區(qū)域的方法包括以下步驟 (1)當(dāng)用戶選定需要裁剪的目標(biāo)文章后,系統(tǒng)獲得該目標(biāo)文章的ID,從數(shù)據(jù)庫中讀取該目標(biāo)文章的熱點信息S21,在熱點信息中找出橫、縱坐標(biāo)的最小值與最大值,組合成為能夠覆蓋此目標(biāo)文章全部區(qū)域的最小矩形的四個頂點的坐標(biāo),稱此矩形為目標(biāo)文章區(qū)域的外接矩形; (2)按外接矩形邊界進行裁剪S22,將目標(biāo)文章外接矩形位置信息同本版面所有其它文章外接矩形位置進行比較計算,判斷是否有交集S23,如果是,則得到交集區(qū)域,否則轉(zhuǎn)入步驟(5); (3)將交集區(qū)域位置信息與目標(biāo)文章的熱點信息進行比較計算S24,從而判斷交集區(qū)域是否屬于目標(biāo)文章,如果是,轉(zhuǎn)入步驟(5),否則轉(zhuǎn)入步驟(4); (4)計算獲得交集區(qū)域S26,并將不屬于目標(biāo)文章的交集區(qū)域設(shè)置底色為白色
S27,生成一幅新的圖片作為裁剪后的文章圖片; (5)保存裁剪后文章圖片并記錄裁剪邊界位置信息。 以上文章圖片生成過程也可以實現(xiàn)通過計算機自動批量的完成生成某份報紙所有文章的出處圖片的應(yīng)用。 步驟二,多圖片拼接模塊將用戶裁剪下來的多個圖片進行拼接。
本實施例中,用戶首先將裁剪好的文章的圖片分類保存。當(dāng)用戶希望對多張圖片進行拼接排版時,選擇某一分類,系統(tǒng)將分類中所有用戶保存圖片讀至瀏覽器頁面一側(cè)候選區(qū)。 為方便操作及交互采用Flash技術(shù),用戶可將候選區(qū)的圖片拖至畫布區(qū),自由擺放,如重疊可由用戶設(shè)置層次。畫布默認大小為A4,可自定義設(shè)置。畫布上圖片擺放圖片信息放在緩沖區(qū),用戶關(guān)閉瀏覽器排版信息清除。
步驟三,打印成簿模塊對拼接后的圖片進行輸出或打印。 本實施例中,首先將用戶排版的畫布上的每個剪切圖片按ID從數(shù)據(jù)庫中讀出相應(yīng)標(biāo)題和文章正文建立關(guān)聯(lián),將各文章標(biāo)題按照位置自上至下自左至右順序,依次排列形成目錄。然后按照目錄順序?qū)⑽恼抡陌次恼路猪撆帕谐晌臋n,將排列的頁數(shù)加至目錄項中。最后將畫布上排版好的拼接圖片信息、目錄、文章正文輸出保存或傳給打印機,由打印機打印輸出。 本發(fā)明具體應(yīng)用的實例 用戶在提供數(shù)字報刊剪報的數(shù)字報網(wǎng)站注冊后,為用戶按用戶ID開辟相應(yīng)的剪報存儲空間。用戶瀏覽某報紙版面時,瀏覽器頁面左上方顯示出該版面的圖象。當(dāng)用戶鼠標(biāo)移動至某篇文章上,捕捉鼠標(biāo)信息獲得文章位置信息,傳給服務(wù)器端,查詢出相應(yīng)文章ID及熱點信息,計算出文章區(qū)域的邊界,返回客戶端,此時版面圖象上相應(yīng)的邊界繪制的熱區(qū)顯示,即在文章區(qū)域完整范圍用紅色線條畫出的邊框。 讀者在熱區(qū)中點擊鼠標(biāo)右鍵出現(xiàn)下拉框中選擇"剪報",服務(wù)器端獲得剪報消息后,調(diào)用后臺裁剪程序,具體方法見關(guān)鍵技術(shù)"圖片定位裁剪"。同時瀏覽器頁面內(nèi)用戶裁剪的文章熱區(qū)邊界上出現(xiàn)小剪刀剪裁的動畫。后臺裁剪程序執(zhí)行完畢時小剪刀動畫結(jié)束。動畫時間默認最低時間為2秒,最長10秒。如10秒內(nèi)后臺程序未能執(zhí)行完畢或是響應(yīng),瀏覽器端跳出裁剪失敗提示。 后臺裁剪程序執(zhí)行完成后,將所生成的文章圖片與用戶ID建立關(guān)聯(lián),存放至個人剪報空間。用戶可以對個人剪報空間瀏覽,可以對圖片進行分類。當(dāng)用戶新建分類時將分類名與用戶ID建立關(guān)聯(lián),服務(wù)器端建立相應(yīng)的以分類名類名的子目錄,將用戶分類的圖片存至相應(yīng)目錄下。 瀏覽器界面設(shè)置"七巧拼接"按鈕,用戶點擊后進入Flash操作界面,從服務(wù)器端
讀取圖片,顯示在界面左側(cè),用戶可以自由拖拽拼接。具體方法見"多圖片拼接"。 拼接后用戶選擇打印,則可將剪報打印成簿,第一頁為拼接好的A4圖片,第二頁
為文章標(biāo)題目錄,后依次為每篇文章內(nèi)容。 本發(fā)明所述的方法及系統(tǒng)并不限于具體實施方式
中所述的實施例,本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案得出其他的實施方式,同樣屬于本發(fā)明的技術(shù)創(chuàng)新范圍。
權(quán)利要求
一種報紙數(shù)字化版面信息的裁剪與拼裝的方法,包括以下步驟步驟一,圖片定位裁剪模塊將圖片形式的報紙數(shù)字化版面中讀者需要裁剪的目標(biāo)文章包括其涉及的圖片按其在報紙中所呈現(xiàn)的形狀完整的裁剪下來,形成只包含此目標(biāo)文章區(qū)域的新圖片;步驟二,多圖片拼接模塊將用戶裁剪下來的多個圖片進行拼接;步驟三,打印成簿模塊對拼接后的圖片進行輸出或打印。
2. 如權(quán)利要求1所述的一種報紙數(shù)字化版面信息的裁剪與拼裝的方法,其特征在于, 步驟一中,對目標(biāo)文章區(qū)域進行裁剪的方法包括以下步驟(1) 用戶選定需要裁剪的目標(biāo)文章,系統(tǒng)獲得目標(biāo)文章區(qū)域的外接矩形;(2) 按外接矩形邊界進行裁剪,將目標(biāo)文章外接矩形位置信息同本版面所有其它文 章外接矩形位置進行比較計算,判斷是否有交集,如果是,則得到交集區(qū)域,否則轉(zhuǎn)入步驟 (5);(3) 將交集區(qū)域位置信息與目標(biāo)文章的熱點信息進行比較計算,從而判斷交集區(qū)域是 否屬于目標(biāo)文章,如果是,轉(zhuǎn)入步驟(5),否則轉(zhuǎn)入步驟(4);(4) 計算獲得交集區(qū)域,并將不屬于目標(biāo)文章的交集區(qū)域設(shè)置底色為白色,生成一幅新 的圖片作為裁剪后的文章圖片;(5) 保存裁剪后文章圖片并記錄裁剪邊界位置信息。
3. 如權(quán)利要求2所述的一種報紙數(shù)字化版面信息的裁剪與拼裝的方法,其特征在于, 步驟(1)中,系統(tǒng)獲得目標(biāo)文章區(qū)域的外接矩形的方法如下系統(tǒng)首先獲得該目標(biāo)文章的 ID,然后從數(shù)據(jù)庫中讀取該目標(biāo)文章的熱點信息,在熱點信息中找出橫、縱坐標(biāo)的最小值與 最大值,最后組合成為能夠覆蓋此目標(biāo)文章全部區(qū)域的最小矩形的四個頂點的坐標(biāo),該最 小矩形為目標(biāo)文章區(qū)域的外接矩形。
4. 如權(quán)利要求1至3之一所述的一種報紙數(shù)字化版面信息的裁剪與拼裝的方法,其特 征在于步驟二中,用戶將裁剪好的文章的圖片分類保存,當(dāng)用戶希望對多張圖片進行拼接 排版時,選擇某一分類,系統(tǒng)將分類中所有用戶保存的圖片讀至瀏覽器頁面一側(cè)候選區(qū)。
5. 如權(quán)利要求4所述的一種報紙數(shù)字化版面信息的裁剪與拼裝的方法,其特征在于步驟二中,拼接的畫布默認大小為A4,并且能夠自定義設(shè)置。
6. 如權(quán)利要求5所述的一種報紙數(shù)字化版面信息的裁剪與拼裝的方法,其特征在于拼接時采用Flash技術(shù),將候選區(qū)的剪切圖片拖至畫布區(qū),自由擺放,如有重疊則由用戶設(shè) 置層次。
7. 如權(quán)利要求6所述的一種報紙數(shù)字化版面信息的裁剪與拼裝的方法,其特征在于 在畫布上拼接的剪切圖片的圖片信息放在緩沖區(qū),用戶關(guān)閉瀏覽器時排版信息清除。
8. 如權(quán)利要求1至3之一所述的一種報紙數(shù)字化版面信息的裁剪與拼裝的方法,其特征在于,步驟三中,對拼接后的圖片進行輸出或打印的方法包括以下步驟首先將用戶排版的畫布上的每個剪切圖片按ID從數(shù)據(jù)庫中讀出相應(yīng)標(biāo)題和文章正文 建立關(guān)聯(lián),將各文章標(biāo)題按照位置自上至下自左至右順序,依次排列形成目錄;然后按照目錄順序?qū)⑽恼抡陌次恼路猪撆帕谐晌臋n,將排列的頁數(shù)加至目錄項中; 最后將畫布上排版好的拼接圖片信息、目錄、文章正文輸出保存或傳給打印機,由打印 機打印輸出。
9. 一種報紙數(shù)字化版面信息的裁剪與拼裝的系統(tǒng),包括以下模塊圖片定位裁剪模塊,用于將圖片形式的報紙版面中讀者需要裁剪的文章包括其涉及的 圖片按其在報紙中所呈現(xiàn)的形狀完整的裁剪下來,形成只包含此文章區(qū)域的新圖片; 用于將用戶裁剪下來的多個圖片進行拼接的多圖片拼接模塊; 用于對拼接后的圖片進行輸出或打印的打印成簿模塊。
全文摘要
本發(fā)明涉及一種報紙數(shù)字化版面信息的裁剪與拼裝的方法及系統(tǒng),屬于數(shù)字圖書館與數(shù)字報刊領(lǐng)域。現(xiàn)有的方法和系統(tǒng)只能夠支持數(shù)字報刊的整版瀏覽和存儲,并不能提供以新聞報道為單位的裁剪技術(shù)來提供原文的佐證,更沒有面向用戶的個性化的剪報、收藏等功能。本發(fā)明所述的系統(tǒng)由三個核心模塊組成圖片定位裁剪模塊,多圖片拼接模塊,打印成簿模塊。采用本發(fā)明所述的方法和系統(tǒng),可以實現(xiàn)數(shù)字報刊在線裁剪、自由拼接、按類存儲、打印成簿等功能,為用戶提供個性化的數(shù)字報刊剪報服務(wù)。
文檔編號G06T11/60GK101739705SQ200810226958
公開日2010年6月16日 申請日期2008年11月21日 優(yōu)先權(quán)日2008年11月21日
發(fā)明者劉艷珠, 吳艷偉, 孫賡, 耿曉笛, 趙東巖 申請人:北大方正集團有限公司;北京方正阿帕比技術(shù)有限公司;北京大學(xué)