專利名稱:一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于信息處理技術(shù)領(lǐng)域,具體涉及一種反解版式文件后得到的圖片和圖說(shuō)
的自動(dòng)關(guān)聯(lián)方法。
背景技術(shù):
中國(guó)專利申請(qǐng)(申請(qǐng)?zhí)?00710179938. 4 ;
公開日期2008. 06. 25)公開了"一種 基于PDF的復(fù)雜版面的標(biāo)引方法",該方法能夠從版式文件中提取到文字塊的集合。文字塊 中包含了相應(yīng)的文字內(nèi)容,字號(hào)大小,字體名稱以及該文字塊的區(qū)域位置信息,并通過(guò)區(qū)域
位置計(jì)算得到文字信息的排版類型。文字信息的排版類型一般有以下幾種從左到右的豎
排、從右到左的豎排、豎排無(wú)方向、從左到右的橫排、從右到左的橫排等。根據(jù)文字塊的字號(hào) 大小標(biāo)定文字塊的屬性為標(biāo)題或正文,以及文字塊的序號(hào)等。然而,該方法沒(méi)有獲取圖片 塊,以及圖片塊與對(duì)應(yīng)的圖片文字說(shuō)明(即圖說(shuō))之間的關(guān)聯(lián)關(guān)系,需要人工進(jìn)行關(guān)聯(lián)操 作,工作量大,效率低。 中國(guó)專利申請(qǐng)(申請(qǐng)?zhí)?00610112710. 9 ;
公開日期2007. 02. 14)公開了"一種 提取見報(bào)資料數(shù)據(jù)信息的方法",該方法能夠根據(jù)版式文件的版面信息結(jié)構(gòu)來(lái)提取版式文 件中的數(shù)據(jù),并通過(guò)版式文件的版面信息和稿件區(qū)域信息自動(dòng)提取出稿件間的關(guān)聯(lián)關(guān)系。
這種方法的缺點(diǎn)是版式文件必須存儲(chǔ)稿件內(nèi)部之間的關(guān)聯(lián)關(guān)系,如果版式文件沒(méi)有存儲(chǔ) 稿件內(nèi)部之間的關(guān)聯(lián)關(guān)系,則這種方法就失去了效用。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的是提供一種反解版式文件后得到的圖 片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,該方法能夠?qū)崿F(xiàn)將反解任何版式文件后獲得的圖片與該圖片的 圖說(shuō)自動(dòng)關(guān)聯(lián)起來(lái),減少人工操作工作量,提高效率。 為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為一種反解版式文件后得到的圖片 和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,包括以下步驟 (1)從反解版式文件后得到的文字塊集合{S}中取出一個(gè)與已取文字塊不同的屬 性為正文的文字塊; (2)在反解版式文件后得到的圖片塊集合{P}中查找與步驟(1)中取出的文字 塊近鄰的圖片塊,如果沒(méi)有一個(gè)圖片塊與該文字塊近鄰,則轉(zhuǎn)至步驟(3),如果僅有一個(gè)圖 片塊與該文字塊近鄰,則將此文字塊作為該圖片塊的候選圖說(shuō),如果有兩個(gè)或兩個(gè)以上的 圖片塊與該文字塊近鄰,則篩選出位置最好的圖片塊,將此文字塊作為該圖片塊的候選圖 說(shuō); (3)重復(fù)以上步驟,直到文字塊集合{S}中的所有文字塊被取出一次; (4)確定圖片塊集合{P}中每一個(gè)圖片塊的圖說(shuō);如果一個(gè)圖片塊的候選圖說(shuō)僅
有一個(gè),則將該候選圖說(shuō)作為該圖片塊的圖說(shuō);如果一個(gè)圖片塊的候選圖說(shuō)為多個(gè),則篩選
出最合適的候選圖說(shuō)作為該圖片塊的圖說(shuō)。
如上所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,步驟(2)中 在圖片塊集合{P}中查找與文字塊近鄰的圖片塊的方法為判斷圖片塊與文字塊是否在水 平方向上或者在豎直方向上近鄰,如果在水平方向上或者在豎直方向上近鄰,則圖片塊與 文字塊近鄰。 如上所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,其中,所述 的判斷圖片塊與文字塊是否在水平方向上或者在豎直方向上近鄰的方法包括以下步驟
假設(shè)文字塊左上角點(diǎn)坐標(biāo)為(&, Y》、右下角點(diǎn)坐標(biāo)為(X/ , Y/ ),圖片塊左上 角點(diǎn)坐標(biāo)為(X2, Y》,右下角點(diǎn)坐標(biāo)為(X2' , Y2');文字塊的寬度W二X/ -A,圖片塊 的寬度W' =X2' -^;文字塊的高度11 = Y/ -l,圖片塊的高度H' =Y2' -Y"所有文 字塊的字號(hào)的平均值為AvgFontSize ;圖說(shuō)與圖片塊之間的有效距離DistThreshold = C^AvgFontSize,其中Q為文字塊與圖片塊之間的間距系數(shù),1 < Q < 5 ;下述min函數(shù)表 示取兩者的較小值,max函數(shù)表示取兩者的較大值,D為延伸距離,O《D《10,單位為磅;
①計(jì)算圖片塊與文字塊的重疊度
在水平方向上的重疊度0verlapX的計(jì)算公示為Overl即X = (min(X/ , X2' )-max(X丄,X2))/(max(X丄',X2' )-min(Xn X2)),
在豎直方向上的重疊度0verl即Y的計(jì)算公示為Overl即Y = (min(Y/ , Y2' )-max(Y丄,Y2))/(max(Y丄',Y2' )-min(Yn Y2));
②判斷Y! > Y廠D且Y/《Y2' +D且X! > X2_D且X!'《X2' +D是否成立;如果 成立,則繼續(xù)判斷0verl即Y是否大于0verl即X,若大于,則圖片塊與文字塊在水平方向上 近鄰,否則圖片塊與文字塊在豎直方向上近鄰;如果不成立,則計(jì)算圖片塊與文字塊在水平 方向上的重疊距離DistX, DistX = max(X" X2)-min(X/ ,X2'); ③判斷Y! > Y2-D且Y/《Y2' +DiW<W'且DistX < DistThreshold是否成 立,如果成立,則圖片塊與文字塊在水平方向上近鄰;否則計(jì)算圖片塊與文字塊的最大距離 DistXMax,如果X丄< 乂2,貝纟DistXMax = X廠X"否則DistXMax = |X2' -X/ | ;
④判斷> Y2_D且'《Y2 ' +D且W < W '且DistXMax < W ' /2是否成 立,如果成立,則圖片塊與文字塊在水平方向上近鄰;否則,計(jì)算DistY, DistY 二max(Yp Y2)-min(Y/ ,Y2'); ⑤判斷^ ^X廠D且X/《X2' +DiH<H'且文字塊的排版類型為從左到右的 橫排或者從右到左的橫排且DistY〈 DistThreshold是否成立,如果成立,則圖片塊與文字 塊在豎直方向上近鄰,否則圖片塊與文字塊即不在水平方向上也不在豎直方向上近鄰。
如上所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,其中,所述 的Q的值為1.2,所述的D的值為3。 如上所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,步驟(2)中 所述的篩選出位置最好的圖片塊的方法包括以下步驟 假設(shè)步驟(1)中取出的文字塊為T,與T臨近的圖片塊集合為(TPh位置最好的圖 片塊為PZ ; ①分別計(jì)算出{TP}中所有的圖片塊的圖說(shuō)類型PicType,以及T和{TP}中所有的 圖片塊之間的距離Dist ;所述的圖片塊的圖說(shuō)類型是指文字塊相對(duì)于圖片塊的位置,包括 文字塊在圖片塊的上側(cè)、文字塊在圖片塊的左側(cè)、文字塊在圖片塊的右側(cè)和文字塊在圖片塊的下側(cè); ②從{TP}中任意取出一個(gè)圖片塊P,并將取出的圖片塊從{TP}中刪除;另PZ = P ; ③從{TP}中任意取出一個(gè)圖片塊PN,將PN從{TP}中刪除;從PZ和PN中篩選出 一個(gè)位置較好的圖片塊,如果PN位置較好,則另PZ = PN ; 從PZ和PN中篩選出一個(gè)位置較好的圖片塊的方法為假設(shè)PZ的圖說(shuō)類型為 PicTypeZ, PN的圖說(shuō)類型為PicTypeN, T與PZ之間的距離為DistZ, T與PN之間的距離為 DistN ; 如果滿足下列條件之一,則PN比PZ位置好 條件a. PicTypeN與PicTypeZ相同且DistN < DistZ, 條件b.PicTypeN為文字塊在圖片塊的右側(cè)且PicTypeZ為文字塊在圖片塊的左側(cè) 且DistN < DistZ, 條件c. PicTypeN的優(yōu)先級(jí)高于PicTypeZ且PicTypeN為文字塊在圖片塊的右側(cè) 與PicTypeZ為文字塊在圖片塊的左側(cè)兩者不同時(shí)成立;其中,文字塊在圖片塊的下側(cè)的優(yōu) 先級(jí)高于文字塊在圖片塊的左側(cè)和右側(cè),文字塊在圖片塊的左側(cè)或右側(cè)的優(yōu)先級(jí)高于文字 塊在圖片塊的上側(cè); 判斷{TP}是否為空,如果為空,則PZ即為位置最好的圖片塊;否則,轉(zhuǎn)至步驟③。 如上所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,步驟①中計(jì)
算圖片塊的圖說(shuō)類型以及文字塊與圖片塊之間的距離的方法包括以下步驟 如果文字塊與圖片塊在水平方向上近鄰 a.計(jì)算文字塊中心的橫坐標(biāo)CenterT = (X一X/ )/2 ;計(jì)算圖片塊中心的橫坐標(biāo) CenterPic = (X2+X2' )/2 ; b.判斷CenterT < CenterPic是否成立,如果成立,則PicType為文字塊在圖片塊 的左側(cè),文字塊與圖片塊的距離Dist = X廠Center ;如果不成立,則PicType為文字塊在圖 片塊的右側(cè),文字塊與圖片塊距離Dist = Center-X2';
如果文字塊與圖片塊在豎直方向上近鄰 a.計(jì)算文字塊中心的縱坐標(biāo)CenterT = (Y一Y/ )/2 ;計(jì)算圖片塊中心的縱坐標(biāo) CenterPic = (Y2+Y2' )/2 ; b.判斷CenterT < CenterPic是否成立,如果成立,則PicType為文字塊在圖片塊 的上側(cè),文字塊與圖片塊的距離Dist = Y廠Center ;如果不成立,則PicType為文字塊在圖 片塊的下側(cè),文字塊與圖片塊距離Dist = Center-Y2'。 如上所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,步驟(4)中 當(dāng)一個(gè)圖片塊的候選圖說(shuō)為多個(gè)時(shí),篩選出最合適的文字塊作為該圖片塊的圖說(shuō)的方法包 括以下步驟 假設(shè)一個(gè)圖片塊的候選圖說(shuō)集合為{L}; ①將{L}中圖說(shuō)類型相同的文字塊合并成為一個(gè)文字塊,合并后的文字塊的重疊
度為被合并的文字塊與圖片塊的重疊度之和,權(quán)重為被合并的文字塊的個(gè)數(shù); ②從合并后的{L}中挑選出權(quán)重值最大的文字塊作為圖片塊的圖說(shuō),如果權(quán)重值最大的文字塊為多個(gè),則比較權(quán)重值最大的多個(gè)文字塊與圖片塊的重疊度,將與圖片塊重 疊度最大的文字塊作為圖片塊的圖說(shuō)。 本發(fā)明所述的方法,通過(guò)對(duì)反解版式文件后得到的文字塊與圖片塊之間位置關(guān)系 等的計(jì)算,無(wú)需了解版式文件的版面信息結(jié)構(gòu)便能夠自動(dòng)在圖片與該圖片的圖說(shuō)之間建立 關(guān)聯(lián),減少了人工進(jìn)行確認(rèn)和關(guān)聯(lián)操作的工作量,提高了效率。
圖1是本發(fā)明所述的方法流程圖; 圖2是具體實(shí)施方式
中文字塊與圖片塊位置關(guān)系示意圖; 圖3是具體實(shí)施方式
中當(dāng)文字塊有兩個(gè)或兩個(gè)以上的圖片塊與其近鄰時(shí)篩選出 位置最好的圖片塊的流程圖。
具體實(shí)施例方式
下面結(jié)合具體實(shí)施方式
和附圖對(duì)本發(fā)明進(jìn)行詳細(xì)描述。 本發(fā)明所述的圖說(shuō)是指對(duì)圖片塊進(jìn)行說(shuō)明的一個(gè)或多個(gè)文字塊。圖說(shuō)具有不同的 類型,包括圖說(shuō)在圖片塊的上側(cè)、圖說(shuō)在圖片塊的左側(cè)、圖說(shuō)在圖片塊的右側(cè)和圖說(shuō)在圖片 塊的下側(cè)。圖說(shuō)的類型是根據(jù)文字塊與圖片塊中心點(diǎn)之間的位置關(guān)系確定的,即圖說(shuō)在圖 片塊的上側(cè)是指位于圖片塊中心點(diǎn)的上側(cè),圖說(shuō)在圖片塊的左側(cè)是指位于圖片塊中心點(diǎn)的 左側(cè),圖說(shuō)在圖片塊的右側(cè)是指位于圖片塊中心點(diǎn)的右側(cè),圖說(shuō)在圖片塊的下側(cè)是指位于 圖片塊中心點(diǎn)的下側(cè),包括圖說(shuō)在圖片塊內(nèi)的情形。如圖2中文字塊l和文字塊2在圖片 塊的上側(cè),文字塊3和文字塊4在圖片塊的下側(cè),文字塊5、文字塊6和文字塊7在圖片塊的 左側(cè),文字塊8和文字塊9在圖片塊的右側(cè)。 圖1出示本發(fā)明所述的反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法的流 程,包括以下步驟。 假設(shè)從反解版式文件后,得到的文字塊結(jié)合為{S},圖片塊集合為{P}。
(1)從文字塊集合{S}中取出一個(gè)與已取文字塊不同的屬性為正文的文字塊。
(2)在反解版式文件后得到的圖片塊集合{P}中查找與步驟(1)中取出的文字塊
近鄰的圖片塊。如果沒(méi)有一個(gè)圖片塊與該文字塊近鄰,則轉(zhuǎn)至步驟(3)。如果僅有一個(gè)圖片
塊與該文字塊近鄰,則將此文字塊作為該圖片塊的候選圖說(shuō)。如果有兩個(gè)或兩個(gè)以上的圖
片塊與該文字塊近鄰,則篩選出位置最好的圖片塊,將此文字塊作為該圖片塊的候選圖說(shuō)。 在圖片塊集合{P}中查找與文字塊近鄰的圖片塊的方法為判斷圖片塊與文字塊
是否在水平方向上或者在豎直方向上近鄰,如果在水平方向上或者在豎直方向上近鄰,則
圖片塊與文字塊近鄰。如圖2中,文字塊1、文字塊2、文字塊3和文字塊4與圖片塊在豎直
方向上近鄰,文字塊5、文字塊6、文字塊7、文字塊8和文字塊9在水平方向上近鄰,判斷的
方法如下所述。 假設(shè)文字塊左上角點(diǎn)坐標(biāo)為(&, Y》、右下角點(diǎn)坐標(biāo)為(X/ , Y/ ),圖片塊左上 角點(diǎn)坐標(biāo)為(X2, Y》,右下角點(diǎn)坐標(biāo)為(X2' ,Y2')。文字塊的寬度W二X/ -X"圖片塊 的寬度W' =X2' -X2。文字塊的高度H二Y/ -l,圖片塊的高度H' =Y2' -Y2。所有文 字塊的字號(hào)的平均值為AvgFontSize。圖說(shuō)與圖片塊之間的有效距離DistThreshold =C^AvgFontSize,其中Q為文字塊與圖片塊之間的間距系數(shù),1 < Q < 5,本實(shí)施方式中Q =1.2。下述min函數(shù)表示取兩者的較小值,max函數(shù)表示取兩者的較大值。下述D為延伸 距離,即文字塊超出圖片塊寬度或高度所允許的距離,0《D《IO,單位為磅。本實(shí)施方式 中,D取值為3, D的值可以在取值范圍內(nèi)進(jìn)行調(diào)整。 判斷圖片塊與文字塊是否在水平方向上或者在豎直方向上近鄰的方法包括以下 步驟。 ①計(jì)算圖片塊與文字塊的重疊度 在水平方向上的重疊度0verlapX的計(jì)算公示為Overl即X = (min(X/ , X2' )-max(X丄,X2))/(max(X丄',X2' )-min(Xn X2));
在豎直方向上的重疊度Overl即Y的計(jì)算公示為Overl即Y = (min(Y/ , Y2' )—max(Y!, Y2))/(max(Y!' ,Y2' )—min(Y!, Y2))。
②判斷> Y2_D且'《Y2' +D且X! > X2_D且X!'《X2' +D是否成立;如果 成立,則繼續(xù)判斷0verl即Y是否大于0verl即X,若大于,則圖片塊與文字塊在水平方向上 近鄰,否則圖片塊與文字塊在豎直方向上近鄰;如果不成立,則計(jì)算圖片塊與文字塊在水平 方向上的重疊距離DistX, DistX = max(X" X2)-min(X/ ,X2')。 ③判斷Y! > Y2-D且Y/《Y2' +DiW<W'且DistX < DistThreshold是否成 立,如果成立,則圖片塊與文字塊在水平方向上近鄰;否則計(jì)算圖片塊與文字塊的最大距離 DistXMax,如果X丄< 乂2,貝纟DistXMax = X廠X"否則DistXMax = |X2' -X/ | ;
④判斷> Y2_D且'《Y2 ' +D且W < W '且DistXMax < W ' /2是否成 立,如果成立,則圖片塊與文字塊在水平方向上近鄰;否則,計(jì)算DistY, DistY 二max(Yp Y2)-min(Y/ ,Y2'); ⑤判斷^ ^X廠D且X/《X2' +DiH<H'且文字塊的排版類型為從左到右的 橫排或者從右到左的橫排且DistY〈 DistThreshold是否成立,如果成立,則圖片塊與文字 塊在豎直方向上近鄰,否則圖片塊與文字塊即不在水平方向上也不在豎直方向上近鄰。
圖3出示了當(dāng)文字塊有兩個(gè)或兩個(gè)以上的圖片塊與該文字塊近鄰時(shí),篩選出位置 最好的圖片塊的流程,包括以下步驟。假設(shè)步驟(1)中取出的文字塊為T,與T臨近的圖片 塊集合為(TPh位置最好的圖片塊為PZ。 ①分別計(jì)算出{TP}中所有的圖片塊的圖說(shuō)類型PicType,以及T和{TP}中所有的 圖片塊之間的距離Dist。 如果文字塊與圖片塊在水平方向上近鄰 a.計(jì)算文字塊中心的橫坐標(biāo)CenterT = (X一X/ )/2 ;計(jì)算圖片塊中心的橫坐標(biāo) CenterPic = (X2+X2' )/2 ; b.判斷CenterT〈 CenterPic是否成立,如果成立,則PicType為文字塊在圖片塊 的左側(cè),文字塊與圖片塊的距離Dist = X廠Center ;如果不成立,則PicType為文字塊在圖 片塊的右側(cè),文字塊與圖片塊距離Dist = Center-X2'。
如果文字塊與圖片塊在豎直方向上近鄰 a.計(jì)算文字塊中心的縱坐標(biāo)CenterT = (Y一^ ' )/2,計(jì)算圖片塊中心的縱坐標(biāo) CenterPic = (Y2+Y2' )/2 ; b.判斷CenterT < CenterPic是否成立;如果成立,則PicType為文字塊在圖片塊的上側(cè),文字塊與圖片塊的距離Dist = Y廠Center ;如果不成立,則PicType為文字塊在 圖片塊的下側(cè),文字塊與圖片塊距離Dist = Center-Y2'。 ②從{TP}中任意取出一個(gè)圖片塊P,并將取出的圖片塊從{TP}中刪除;另PZ = P。 ③從{TP}中任意取出一個(gè)圖片塊PN,將PN從{TP}中刪除;從PZ和PN中篩選出 一個(gè)位置較好的圖片塊,如果PN位置較好,則另PZ = PN。 從PZ和PN中篩選出一個(gè)位置較好的圖片塊的方法為假設(shè)PZ的圖說(shuō)類型為 PicTypeZ, PN的圖說(shuō)類型為PicTypeN, T與PZ之間的距離為DistZ, T與PN之間的距離為 DistN ; 如果滿足下列條件之一,則PN比PZ位置好 條件a. PicTypeN與PicTypeZ相同且DistN < DistZ ; 條件b.PicTypeN為文字塊在圖片塊的右側(cè)且PicTypeZ為文字塊在圖片塊的左側(cè) 且DistN < DistZ ; 條件c. PicTypeN的優(yōu)先級(jí)高于PicTypeZ且PicTypeN為文字塊在圖片塊的右側(cè) 與PicTypeZ為文字塊在圖片塊的左側(cè)兩者不同時(shí)成立;其中,文字塊在圖片塊的下側(cè)的優(yōu) 先級(jí)高于文字塊在圖片塊的左側(cè)和右側(cè),文字塊在圖片塊的左側(cè)或右側(cè)的優(yōu)先級(jí)高于文字 塊在圖片塊的上側(cè)。
判斷{TP}是否為空,如果為空,則PZ即為位置最好的圖片塊;否則,轉(zhuǎn)至步驟③。
(3)重復(fù)步驟(1)和步驟(2),直到文字塊集合{S}中的所有文字塊被取出一次。
(4)確定圖片塊集合{P}中每一個(gè)圖片塊的圖說(shuō)。如果一個(gè)圖片塊的候選圖說(shuō)僅 有一個(gè),則將該候選圖說(shuō)作為該圖片塊的圖說(shuō)。如果一個(gè)圖片塊的候選圖說(shuō)為多個(gè),則篩選 出最合適的候選圖說(shuō)作為該圖片塊的圖說(shuō),并將該圖片塊的其他候選圖說(shuō)重新添加到文字 塊集合{S}中。 當(dāng)圖片塊的候選圖說(shuō)為多個(gè)時(shí),篩選出最合適的候選圖說(shuō)的方法包括以下步驟, 假設(shè)一個(gè)圖片塊的候選圖說(shuō)集合為仏}。 ①將{L}中圖說(shuō)類型相同的文字塊合并成為一個(gè)文字塊,合并后的文字塊與圖片 塊的重疊度為被合并的文字塊與圖片塊的重疊度之和,權(quán)重為被合并的文字塊的個(gè)數(shù)。如 圖2中,將文字塊1與文字塊2合并成一個(gè)文字塊,合并后文字塊與圖片塊的重疊度為文字 塊1與圖片塊的重疊度和文字塊2與圖片塊的重疊度之和,合并后文字塊的權(quán)重為2 ;將文 字塊3和文字塊4合并成一個(gè)文字塊,重疊度為文字塊3、文字塊4與圖片塊重疊度之和,權(quán) 重為2 ;將文字塊5、文字塊6和文字塊7合并為一個(gè)文字塊,重疊度為文字塊5、文字塊6、 文字塊7與圖片塊重疊度之和,權(quán)重為3 ;將文字塊8和文字塊9合并為一個(gè)文字塊,重疊 度為文字塊8、文字塊9與圖片塊重疊度之和,權(quán)重為2。 ②從合并后的{L}中挑選出權(quán)重值最大的文字塊作為圖片塊的圖說(shuō),如果權(quán)重值 最大的文字塊為多個(gè),則比較權(quán)重值最大的多個(gè)文字塊與圖片塊的重疊度,將與圖片塊重 疊度最大的文字塊作為圖片塊的圖說(shuō)。如圖2中,由文字塊5、文字塊6和文字塊7合并的 文字塊權(quán)重值最大,將其作為圖片塊的圖說(shuō)。 本發(fā)明所述的方法并不限于上述具體實(shí)施方式
,本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案得出其他的實(shí)施方式,同樣屬于本發(fā)明的技術(shù)創(chuàng)新范圍。
權(quán)利要求
一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,包括以下步驟(1)從反解版式文件后得到的文字塊集合{S}中取出一個(gè)與已取文字塊不同的屬性為正文的文字塊;(2)在反解版式文件后得到的圖片塊集合{P}中查找與步驟(1)中取出的文字塊近鄰的圖片塊,如果沒(méi)有一個(gè)圖片塊與該文字塊近鄰,則轉(zhuǎn)至步驟(3),如果僅有一個(gè)圖片塊與該文字塊近鄰,則將此文字塊作為該圖片塊的候選圖說(shuō),如果有兩個(gè)或兩個(gè)以上的圖片塊與該文字塊近鄰,則篩選出位置最好的圖片塊,將此文字塊作為該圖片塊的候選圖說(shuō);(3)重復(fù)以上步驟,直到文字塊集合{S}中的所有文字塊被取出一次;(4)確定圖片塊集合{P}中每一個(gè)圖片塊的圖說(shuō);如果一個(gè)圖片塊的候選圖說(shuō)僅有一個(gè),則將該候選圖說(shuō)作為該圖片塊的圖說(shuō);如果一個(gè)圖片塊的候選圖說(shuō)為多個(gè),則篩選出最合適的候選圖說(shuō)作為該圖片塊的圖說(shuō)。
2. 如權(quán)利要求1所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,其特征在于,步驟(2)中在圖片塊集合{P}中查找與文字塊近鄰的圖片塊的方法為判斷圖片塊與文字塊是否在水平方向上或者在豎直方向上近鄰,如果在水平方向上或者在豎直方向上近鄰,則圖片塊與文字塊近鄰。
3. 如權(quán)利要求2所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,其特征在于,所述的判斷圖片塊與文字塊是否在水平方向上或者在豎直方向上近鄰的方法包括以下步驟假設(shè)文字塊左上角點(diǎn)坐標(biāo)為(XpY》、右下角點(diǎn)坐標(biāo)為(X/ ,Y/ ),圖片塊左上角點(diǎn)坐標(biāo)為(&,Y》,右下角點(diǎn)坐標(biāo)為(X2' ,Y2');文字塊的寬度W二X/ -A,圖片塊的寬度W'=X2' -^;文字塊的高度11 = 1' -l,圖片塊的高度H' =Y2' _Y2 ;所有文字塊的字號(hào)的平均值為AvgFontSize ;圖說(shuō)與圖片i央之間的有效距離DistThreshold = C^AvgFontSize,其中Q為文字塊與圖片塊之間的間距系數(shù),l < Q < 5 ;下述min函數(shù)表示取兩者的較小值,max函數(shù)表示取兩者的較大值,D為延伸距離,O《D《10,單位為磅;① 計(jì)算圖片塊與文字塊的重疊度在水平方向上的重疊度OverlapX的計(jì)算公示為<formula>formula see original document page 2</formula>在豎直方向上的重疊度OverlapY的計(jì)算公示為Overl即<formula>formula see original document page 2</formula>② 判斷> Y廠D且Y/《Y2'十D且Xi > X廠D且X/《X2' +0是否成立;如果成立,則繼續(xù)判斷0verl即Y是否大于0verl即X,若大于,則圖片塊與文字塊在水平方向上近鄰,否則圖片塊與文字塊在豎直方向上近鄰;如果不成立,則計(jì)算圖片塊與文字塊在水平方向上的重疊距離DistX,<formula>formula see original document page 2</formula>③ 判斷Yi^Y2-D且Y/《Y2' +DiW<W'且DistX < DistThreshold是否成立,如果成立,則圖片塊與文字塊在水平方向上近鄰;否則計(jì)算圖片塊與文字塊的最大距離DistXMax,如果X! < X2,則<formula>formula see original document page 2</formula>否則<formula>formula see original document page 2</formula> 判斷Y: > Y2-D且Y/《Y2' +DiW<W'且DistMax〈W' /2是否成立,如果成立,則圖片塊與文字塊在水平方向上近鄰;否則,計(jì)算圖片塊與文字塊在豎直方向上的重疊距離DistY,<formula>formula see original document page 2</formula>⑤判斷&^X2-D且X/《X2' +DiH<H'且文字塊的排版類型為從左到右的橫排 或者從右到左的橫排且DistY〈DistThreshold是否成立,如果成立,則圖片塊與文字塊在 豎直方向上近鄰,否則圖片塊與文字塊即不在水平方向上也不在豎直方向上近鄰。
4. 如權(quán)利要求3所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,其特 征在于所述的Q的值為1.2。
5. 如權(quán)利要求3所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,其特 征在于所述的D的值為3。
6. 如權(quán)利要求3至5之一所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方 法,其特征在于,步驟(2)中所述的篩選出位置最好的圖片塊的方法包括以下步驟假設(shè)步驟(1)中取出的文字塊為T,與T臨近的圖片塊集合為(TPh位置最好的圖片塊 為PZ ;① 分別計(jì)算出{TP}中所有的圖片塊的圖說(shuō)類型PicType,以及T和{TP}中所有的圖片 塊之間的距離Dist ;所述的圖片塊的圖說(shuō)類型是指文字塊相對(duì)于圖片塊的位置,包括文字 塊在圖片塊的上側(cè)、文字塊在圖片塊的左側(cè)、文字塊在圖片塊的右側(cè)和文字塊在圖片塊的② 從{TP}中任意取出一個(gè)圖片塊P,并將取出的圖片塊從{TP}中刪除;另PZ = P ;③ 從{TP}中任意取出一個(gè)圖片塊PN,將PN從{TP}中刪除;從PZ和PN中篩選出一個(gè) 位置較好的圖片塊,如果PN位置較好,則另PZ = PN ;從PZ和PN中篩選出一個(gè)位置較好的圖片塊的方法為假設(shè)PZ的圖說(shuō)類型為 PicTypeZ, PN的圖說(shuō)類型為PicTypeN, T與PZ之間的距離為DistZ, T與PN之間的距離為 DistN ;如果滿足下列條件之一,則PN比PZ位置好條件a. PicTypeN與PicTypeZ相同且DistN < DistZ,條件b. PicTypeN為文字塊在圖片塊的右側(cè)且PicTypeZ為文字塊在圖片塊的左側(cè)且 DistN < DistZ,條件c. PicTypeN的優(yōu)先級(jí)高于PicTypeZ且PicTypeN為文字塊在圖片塊的右側(cè)與 PicTypeZ為文字塊在圖片塊的左側(cè)兩者不同時(shí)成立;其中,文字塊在圖片塊的下側(cè)的優(yōu)先 級(jí)高于文字塊在圖片塊的左側(cè)和右側(cè),文字塊在圖片塊的左側(cè)或右側(cè)的優(yōu)先級(jí)高于文字塊 在圖片塊的上側(cè); 判斷{TP}是否為空,如果為空,則PZ即為位置最好的圖片塊;否則,轉(zhuǎn)至步驟③。
7. 如權(quán)利要求6所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,其特 征在于,步驟①中計(jì)算圖片塊的圖說(shuō)類型以及文字塊與圖片塊之間的距離的方法包括以下步驟如果文字塊與圖片塊在水平方向上近鄰a. 計(jì)算文字塊中心的橫坐標(biāo)CenterT = (X,^ ' )/2 ;計(jì)算圖片塊中心的橫坐標(biāo) CenterPic = (X2+X2' )/2 ;b. 判斷CenterT < CenterPic是否成立,如果成立,則PicType為文字塊在圖片塊的左 側(cè),文字塊與圖片塊的距離Dist = X廠Center ;如果不成立,則PicType為文字塊在圖片塊 的右側(cè),文字塊與圖片塊距離Dist = Center-X2';如果文字塊與圖片塊在豎直方向上近鄰a. 計(jì)算文字塊中心的縱坐標(biāo)CenterT二 (Y,^ ' )/2 ;計(jì)算圖片塊中心的縱坐標(biāo) CenterPic = (Y2+Y2' )/2 ;b. 判斷CenterT < CenterPic是否成立,如果成立,則PicType為文字塊在圖片塊的上 側(cè),文字塊與圖片塊的距離Dist = Y廠Center ;如果不成立,則PicType為文字塊在圖片塊 的下側(cè),文字塊與圖片塊距離Dist = Center-Y2'。
8.如權(quán)利要求7所述的一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,其特 征在于,步驟(4)中當(dāng)一個(gè)圖片塊的候選圖說(shuō)為多個(gè)時(shí),篩選出最合適的文字塊作為該圖 片塊的圖說(shuō)的方法包括以下步驟假設(shè)一個(gè)圖片塊的候選圖說(shuō)集合為仏};① 將{L}中圖說(shuō)類型相同的文字塊合并成為一個(gè)文字塊,合并后的文字塊與圖片塊的 重疊度為被合并的文字塊與圖片塊的重疊度之和,權(quán)重為被合并的文字塊的個(gè)數(shù);② 從合并后的{L}中挑選出權(quán)重值最大的文字塊作為圖片塊的圖說(shuō),如果權(quán)重值最大 的文字塊為多個(gè),則比較權(quán)重值最大的多個(gè)文字塊與圖片塊的重疊度,將與圖片塊重疊度 最大的文字塊作為圖片塊的圖說(shuō)。
全文摘要
本發(fā)明公開了一種反解版式文件后得到的圖片和圖說(shuō)的自動(dòng)關(guān)聯(lián)方法,屬于信息處理技術(shù)領(lǐng)域?,F(xiàn)有技術(shù)中,建立反解版式文件后獲得的圖片和圖說(shuō)的關(guān)聯(lián)關(guān)系需要人工進(jìn)行關(guān)聯(lián)操作,或者需要版式文件中存儲(chǔ)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,工作量大,效率低。本發(fā)明所述方法將文字塊集合中每一個(gè)屬性為正文的文字塊與圖片塊集合中所有圖片塊比較,篩選出位置最好的圖片塊,將文字塊作為該圖片塊的候選圖說(shuō);然后確定圖片塊集合中每一個(gè)圖片塊的圖說(shuō);如果一個(gè)圖片塊的候選圖說(shuō)為多個(gè),則篩選出最合適的候選圖說(shuō)作為該圖片塊的圖說(shuō)。采用本發(fā)明所述方法能夠自動(dòng)在反解任何一種版式文件后獲得的圖片與圖說(shuō)之間建立關(guān)聯(lián),減少了人工關(guān)聯(lián)的工作量,提高了效率。
文檔編號(hào)G06F17/21GK101714149SQ200810223698
公開日2010年5月26日 申請(qǐng)日期2008年10月8日 優(yōu)先權(quán)日2008年10月8日
發(fā)明者徐劍波, 王輝, 董寧 申請(qǐng)人:北大方正集團(tuán)有限公司;北京方正阿帕比技術(shù)有限公司