亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

從可移植電子文檔中提取光柵圖像的方法和設(shè)備的制作方法

文檔序號:6578402閱讀:281來源:國知局

專利名稱::從可移植電子文檔中提取光柵圖像的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及一種從可移植電子文檔中提取光柵圖像的方法和設(shè)備,更具體地說,本發(fā)明涉及一種通過分析可移植電子文檔的格式來提取其中的光柵圖像的方法和設(shè)備。
背景技術(shù)
:可移植電子文檔,如PDF及PS格式,在日常辦公工作中被廣泛應(yīng)用??梢浦搽娮游臋n是一類用于表示文檔的電子文檔格式,這類電子文檔的生成及打印、顯示等輸出操作可以基于不同的應(yīng)用軟件、硬件以及操作系統(tǒng)??梢浦搽娮游臋n定義了兩種描述光柵圖像的方式,內(nèi)聯(lián)圖像以及ImageXObject。與內(nèi)聯(lián)圖像對應(yīng)的PDF命令以及圖像數(shù)據(jù)都存放于頁內(nèi)容流中,而與ImageXObject對應(yīng)的PDF命令存放于頁內(nèi)容流中,圖像數(shù)據(jù)存放于頁資源中。區(qū)別于通過描述圖像中的一系列控制點并連接控制點之間的路徑來描述圖像的矢量圖像,光柵圖像也叫位圖,通過描述圖像中每個象素的顏色信息來表示該圖像。從可移植電子文檔中提取諸如段落、表格的成份還是困難的工作。比如,利用AdobeAcrobat能從PDF格式文檔中提取光柵圖像,但提取結(jié)果有時并不能令人滿意。首先,內(nèi)聯(lián)光柵圖像不能被提取。例如,Adobe的AcrobatReader只能提取ImageXObject光柵圖像。其次,在PDF格式文檔中,一個視覺上完整的光柵圖像往往表示為相連接的多個圖像片斷,AdobeAcrobat會提取多個圖像片斷,而不是一個完整的圖像。而且,在PDF格式文檔中,表格的分割線往往被表示為多個細長的光柵圖像,AdobeAcrobat會把這些用于表示表格線的光柵圖像也提取出來。而這種細長的分割線通常不是感知意義上的內(nèi)容,例如,在利用圖像檢索來進行文檔檢索的情況下,作為分割線的這樣的細長的光柵圖像并無檢索意義上的顯著特征,用戶一般并不希望將其提取出來。根據(jù)美國專利6801673B2,PDF格式文檔中的詞被提取。該專利通過查找文字片斷中的詞分隔字符(空格)來提取詞或者是判斷相鄰文字片斷之間的距離,如果該距離大于一定閾值,則相鄰的文字片斷就被分為兩個詞。該專利的輸入是一個PDF格式文檔,輸出是該文檔所包含的詞的集合。美國專利申請5832530A提出了一種從PDF格式文檔中提取內(nèi)容片斷的工具。首先,用戶在PDF瀏覽界面拖拽一個矩形,該工具提取該矩形內(nèi)包含的PDF格式文檔內(nèi)容片斷,并將提取的內(nèi)容片斷存儲為一個新的PDF格式文檔。該工具提取和粘貼PDF命令,諸如圖片、表格信息等等的具有感知意義的文檔內(nèi)容并沒有提取。
發(fā)明內(nèi)容考慮到現(xiàn)有技術(shù)方案中的缺陷,本發(fā)明提出了相應(yīng)的解決方案。本發(fā)明提供一種通過分析可移植電子文檔的格式來提取其中的光柵圖像的方法和設(shè)備。根據(jù)本發(fā)明的一個方面,一種從可移植電子文檔中提取光柵圖像的方法,包含以4下步驟a)解析可移植電子文檔的格式以獲取每頁中與光柵圖像相關(guān)的命令和資源;b)處理所述命令和資源來提取候選光柵圖像;c)合并相連接的候選光柵圖像;以及d)去除虛警光柵圖像。根據(jù)本發(fā)明的另一個方面,一種從可移植電子文檔中提取光柵圖像的設(shè)備,包括文檔解析裝置,用于解析可移植電子文檔的格式以獲取每頁中與光柵圖像相關(guān)的命令和資源;候選光柵圖像提取裝置,用于處理所述命令和資源來提取候選光柵圖像;光柵圖像合并裝置,用于合并相連接的候選光柵圖像;以及虛警光柵圖像去除裝置,用于去除虛警光柵圖像。本發(fā)明的實施例能夠應(yīng)用于文檔處理和文檔理解領(lǐng)域。諸如文檔內(nèi)容提取、文檔重用以及文檔檢索。例如,光柵圖像的提取可以應(yīng)用于文檔重用以及文檔檢索系統(tǒng)中。根據(jù)本發(fā)明的實施例,通過分析可移植電子文檔的格式來從可移植電子文檔提取其中的光柵圖像,實現(xiàn)了不論內(nèi)聯(lián)光柵圖像還是ImageXObject光柵圖像均可提取,且視覺上完整的光柵圖像將作為一個完整的圖像提取,并排除了作為非感知意義上的內(nèi)容的細長分割線。通過閱讀結(jié)合附圖考慮的以下本發(fā)明的優(yōu)選實施例的詳細描述,將更好地理解本發(fā)明的以上和其他目標、特征、優(yōu)點和技術(shù)及工業(yè)重要性。圖1示出根據(jù)本發(fā)明實施例的從可移植電子文檔中提取光柵圖像的計算機系統(tǒng)的硬件配置。圖2示出按照本發(fā)明實施例的從可移植電子文檔中提取光柵圖像的方法的總體流程圖。圖3示出從可移植電子文檔中提取與光柵圖像相關(guān)的命令和資源的方法的流程。圖4示出提取候選光柵圖像的方法的流程。圖5示出合并相連接的候選光柵圖像的方法的流程。圖6示出去除虛警光柵圖像的方法的流程。圖7示出PDF格式文檔的樹狀文檔結(jié)構(gòu)及頁內(nèi)容流的示例。圖8A和圖8B示出對相連接的光柵圖像進行合并的示例,其中圖8A示出合并前的相連接的多個光柵圖像,圖8B示出的光柵圖像合并后的結(jié)果。圖9示出用于判斷候選光柵圖像是否相連接的參數(shù)的示意圖。具體實施例方式本專利用于從可移植電子文檔中提取光柵圖像。這里,可移植電子文檔的格式包括Adobe公司的PDF(PortableDocumentFormat)、PS(PostScript)等。提取的光柵圖像可用于文檔重用或者是文檔檢索等應(yīng)用。本實施例描述了如何從PDF格式文檔中提取光柵圖像,然而,本領(lǐng)域技術(shù)人員可以認識到,本發(fā)明能夠應(yīng)用于任何類型的可移植電子文檔。圖1示出根據(jù)本發(fā)明實施例的從可移植電子文檔中提取光柵圖像的計算機系統(tǒng)的硬件配置。如圖1所示,從PDF格式文檔中提取光柵圖像的計算機系統(tǒng)10包括計算機11、鍵盤16、監(jiān)視器17、打印機18、軟盤驅(qū)動器19、網(wǎng)絡(luò)接入器20、及硬盤驅(qū)動器21。計算機11包括數(shù)據(jù)總線12、隨機存取存儲器(RAM)13、只讀存儲器(ROM)14、中央處理器15、及外設(shè)總線22。根據(jù)從隨機存取存儲器13接到的指令,中央處理器15控制輸入數(shù)據(jù)的接收和處理、以及向監(jiān)視器17或者其他外設(shè)的輸出。在本實施例中,中央處理器15的一種功能是處理輸入的PDF格式文檔,提取該文檔中包含的光柵圖像。所提取的光柵圖像可以由中央處理器15中的其他應(yīng)用程序使用。中央處理器15通過數(shù)據(jù)總線12來訪問隨機存取存儲器13和只讀存儲器14。隨機存取存儲器13可以由中央處理器15用作可讀寫的內(nèi)存,用來作為各個進程的工作區(qū)及可變數(shù)據(jù)的存儲區(qū)。只讀存儲器14存儲PDF格式文檔、光柵圖像提取程序、及其他的用于提取光柵圖像的程序。外設(shè)總線22用于訪問與計算機11相連的輸入設(shè)備、輸出設(shè)備及存儲設(shè)備等外圍設(shè)備。在本實施例中,所述外圍設(shè)備包括監(jiān)視器17、打印機18、軟盤驅(qū)動器19、網(wǎng)絡(luò)接入器20、及硬盤驅(qū)動器21。監(jiān)視器17通過外設(shè)總線22來顯示中央處理器15輸出的數(shù)據(jù)和圖像,它可以是柵格式(或者可以稱為點陣式)顯示設(shè)備,如CRT或者LCD顯示器。打印機18把中央處理器輸入的數(shù)據(jù)和圖像打印到紙張或者與紙張相似的介質(zhì)。為了在如監(jiān)視器17或打印機18等的輸出設(shè)備上顯示PDF格式文檔,計算機系統(tǒng)10需要進行從PDF格式文檔到其對應(yīng)圖像表示的轉(zhuǎn)換。在其他的實施例中,也可以在如打印機18等的輸出設(shè)備中包括中央處理器或類似的處理器,以實現(xiàn)從類似的PDF格式文檔到圖像的轉(zhuǎn)換。軟盤驅(qū)動器19及硬盤驅(qū)動器21用來存儲PDF格式文檔。通過軟盤驅(qū)動器19,PDF格式文檔可以在不同的計算機系統(tǒng)之間傳遞;硬盤驅(qū)動器21的存儲空間更大,而且訪問速度更快。其他的存儲設(shè)備,諸如閃存(Flashmemory),也可以用來存儲PDF格式文檔以供計算機系統(tǒng)10訪問。計算機系統(tǒng)10通過網(wǎng)絡(luò)接入器20在網(wǎng)絡(luò)上發(fā)送數(shù)據(jù)并接收來自其他計算機系統(tǒng)的數(shù)據(jù)。用戶可以通過鍵盤16等等輸入指令給計算機系統(tǒng)10。圖2示出按照本發(fā)明實施例的從可移植電子文檔中提取光柵圖像的方法的總體流程圖。如圖2所示,按照本實施例的從例如PDF格式文檔的可移植電子文檔中提取光柵圖像的方法30總體上包括下列操作。在步驟S31,提取與光柵圖像相關(guān)的命令和資源,在步驟S32,提取候選光柵圖像,在步驟S33,合并相連接光柵圖像,在步驟S34,去除虛警光柵圖像。具體地,在步驟S31,在內(nèi)存中載入PDF格式文檔,解析PDF格式文檔格式以提取與光柵圖像相關(guān)的命令和資源。在步驟S32,處理所提取的命令和資源以提取候選光柵圖像,并保存在候選光柵圖像列表中。這里所謂“提取”包括圖像位置、尺寸的計算、以及根據(jù)PDF格式文檔中指定的圖像編碼方式來對圖像數(shù)據(jù)進行的解碼。在PDF格式文檔中,定義了兩種類型的光柵圖像,包括ImageXObject以及內(nèi)聯(lián)圖像(InlineImage)0在本實施例中,這兩類光柵圖像被分別處理并存放于不同的候選光柵圖像列表。在步驟S33,比較候選光柵圖像列表中的不同光柵圖像,合并相連接的小的光柵圖像成為大的光柵圖像。最后,在步驟S34,刪除候選光柵圖像列表中用于表示分隔線或是表格線的細長光柵圖像。圖3具體示出從可移植電子文檔中提取與光柵圖像相關(guān)的命令和資源的方法即圖2中步驟S31的流程。如圖3所示,在提取與光柵圖像相關(guān)的命令和資源的過程中,首先,在步驟S311,將PDF格式文檔載入內(nèi)存。之后,在步驟S312,解析PDF格式文檔的格式結(jié)構(gòu),構(gòu)建文檔樹狀結(jié)構(gòu),該樹狀結(jié)構(gòu)使得能夠方便地對每頁文檔的內(nèi)容流以及資源進行訪問及6獲取。例如,圖7示出PDF格式文檔的樹狀文檔結(jié)構(gòu)及頁內(nèi)容流的示例,圖7中左側(cè)外框所示為該文檔第一頁的資源,左側(cè)內(nèi)框所示為該頁資源中的一個圖像資源,右側(cè)框所示為該頁對應(yīng)內(nèi)容流片斷。之后,在步驟S313中,順序載入PDF格式文檔每頁的內(nèi)容流和資源,判斷該頁是否為最后一頁,直至到達最后一頁。在步驟S314,根據(jù)相應(yīng)頁的內(nèi)容流的編碼方式對該頁的內(nèi)容流解碼。根據(jù)PDF格式文檔說明書(其定義了PDF格式應(yīng)遵循的規(guī)范),PDF格式文檔支持多種內(nèi)容流編碼方式,諸如FlateDecode及LZWDecode等。在步驟S314,利用該PDF格式文檔所采用的編碼方式來解碼,所解碼的PDF內(nèi)容流由PDF命令集合構(gòu)成。在步驟S315,逐條解析解碼后的PDF內(nèi)容流中的命令,從命令集合中提取與光柵圖像相關(guān)的命令。PDF格式文檔說明書對ImageXObject及內(nèi)聯(lián)圖像定義了不同的存儲機制和顯示命令。例如,命令“cm100001004090”用來控制光柵圖像起始點(40,90)以及圖像顯示大小(100*100);命令“DoImgl”根據(jù)命令“cm”中指定的位置和尺寸來顯示ImageXObject光柵圖像Imgl。作為ImageXObject光柵圖像,與Imgl對應(yīng)的圖像數(shù)據(jù)存放于該頁的資源中。命令“Bi”開始形成內(nèi)聯(lián)圖像對象,命令“ID”用來描述內(nèi)聯(lián)圖像數(shù)據(jù),命令“EI,表示結(jié)束內(nèi)聯(lián)圖像數(shù)據(jù),并且顯示該內(nèi)聯(lián)圖像。與ImageObjextX不同,內(nèi)聯(lián)圖像數(shù)據(jù)直接存放在頁內(nèi)容流中,因此并非從頁的資源中提取,而從頁內(nèi)容流中直接提取。因此,在步驟S316,在光柵圖像為ImageXObject圖像的情況下,從每頁的資源中提取與光柵圖像相關(guān)的資源,在光柵圖像為內(nèi)聯(lián)圖像的情況下,從解碼的內(nèi)容流中提取與光柵圖像相關(guān)的資源。圖4示出提取候選光柵圖像的方法即圖2中步驟S32的流程。如圖4所示,在步驟S321,逐條載入所提取的與光柵圖像相關(guān)的命令。在步驟S322,判斷哪個或哪些命令是圖像顯示命令。根據(jù)PDF格式文檔說明書,對應(yīng)于ImageXObject的顯示命令是“Do”,對應(yīng)于內(nèi)聯(lián)圖像的顯示命令是“EI”,每個圖像顯示命令用于在PDF頁面顯示一個光柵圖像。在步驟S323,獲取與當(dāng)前顯示命令對應(yīng)的候選光柵圖像的位置和尺寸信息。PDF格式文檔中,光柵圖像的位置和尺寸信息是由命令“cmabcdef”所定義的一個仿射變換所確定的。其中,“cm”表示命令,“abcdef”為參數(shù)。根據(jù)“abcd”,可以獲得圖像的尺寸和旋轉(zhuǎn)信息,參數(shù)“ef”確定圖像相對于頁面起始點的坐標。例如,根據(jù)命令“cm100001004090","4090”為光柵圖像起始點,圖像大小為100*100,旋轉(zhuǎn)角度為0。在步驟S324,根據(jù)該PDF文檔所指定的編碼方式來對候選光柵圖像的圖像數(shù)據(jù)進行解碼,來提取候選光柵圖像。這里,ImageXObject的編碼方式存放在其對應(yīng)的圖像資源中,而內(nèi)聯(lián)圖像對應(yīng)的編碼方式存放在頁內(nèi)容流中的“BI”、“EI”命令對之內(nèi)。在步驟S325,把提取的ImageXObjet光柵圖像和內(nèi)聯(lián)光柵圖像分別存放到不同的候選光柵圖像列表。圖5示出合并相連接的候選光柵圖像的方法即圖2中步驟S33的流程,用來把相連接的小的光柵圖像合并為大的光柵圖像。在PDF格式文檔中,一個視覺上完整的圖像往往被表示為多個小的相互連接的光柵圖像。ImageXObjet光柵圖像和內(nèi)聯(lián)光柵圖像分別針對不同的候選光柵圖像列表,在此,針對不同的候選光柵圖像列表,分別進行合并處理。首先,在步驟S331,針對某個候選光柵圖像列表,根據(jù)候選光柵圖像的位置信息對列表中的候選光柵圖像進行排序。這里,第一個圖像是圖像起始點和頁面起始點最近的圖像,第二個圖像是圖像起始點和第一個圖像起始點最近的圖像,以此類推,直到列表中所有圖像被排序。在步驟S332,設(shè)置圖像標號參數(shù)IMG_INDEX為0,設(shè)置圖像參數(shù)⑶R_IMG為圖像列表中與標號IMG_INDEX對應(yīng)的圖像。在步驟S333,設(shè)置圖像參數(shù)NEXT_IMG為候選光柵圖像列表中對7應(yīng)于標號IMG_INDEX+1的圖像,即該列表中與⑶R_IMG相鄰的下一圖像。在步驟S334,比較和NEXT_IMG的位置信息來判斷他們是否為相連接圖像。如果這兩個圖像在垂直方向上相近,例如小于給定的第一閾值,并且在水平方向上有較長重疊,例如大于給定的第二閾值,則判斷他們?yōu)橄噙B接圖像。在本實施例中,可以設(shè)定為,如果gap<thre_gap并且qv^rlctpvin茫rmn{width\,width!)>thre-overlaPPinS則這兩個圖像被判斷為相連接圖像,否則為非連接圖像。參數(shù)gap、overlapping、widthl、width2、thre_gap、及thre_overlapping白勺定義如圖9所示,widthl為圖像CUR_IMG的寬度,width2為圖像NEXT_IMG的寬度,gap是兩個圖像在垂直方向上的距離,overlapping是兩個圖像在水平方向上的重疊區(qū)域長度,第一閾值thre_gap及第二閾值thre_overlapping可根據(jù)不同的應(yīng)用設(shè)定,例如,thre_gap=2以及thre_overlapping=0.4。如果步驟S334中判斷兩個圖像為相連接圖像,則在步驟S335合并CUR_IMG和NEXT_IMG,并把圖像參數(shù)CUR_IMG設(shè)置為合并后的圖像,設(shè)置IMG_INDEX為IMG_INDEX+1。這里,圖像合并包括圖像位置、圖像尺寸的合并以及圖像數(shù)據(jù)的合并。本實施例中,利用以下公式(1)(4)來計算第一幅圖像和第二幅圖像合并后的圖像的位置。new_startx=min(start_xl,start_x2)(1)new_starty=min(start_yl,start_y2)(2)new_endx=max(end_xl,end_x2)(3)new_endy=max(end_yl,end_y2)(4)其中,new_startX為合并后光柵圖像的起始點χ方向坐標,new_starty為合并后光柵圖像的起始點y方向坐標,new_endx為合并后光柵圖像的末端點χ方向坐標,new_endy為合并后光柵圖像的末端點y方向坐標;start_xl為合并前的第一幅圖像的起始點χ方向坐標,start_yl為合并前的第一幅圖像的起始點y方向坐標,end_xl為合并前的第一幅圖像的末端點χ方向坐標,end_yl為合并前的第一幅圖像的末端點y方向坐標;Start_X2為合并前的第二幅圖像的起始點χ方向坐標,start_y2為合并前的第二幅圖像的起始點y方向坐標,end_x2為合并前的第二幅圖像的末端點χ方向坐標,end_y2為合并前的第二幅圖像的末端點y方向坐標。在合并圖像數(shù)據(jù)過程中,第一幅圖像和第二幅圖像的數(shù)據(jù)分別粘貼到合并圖像中對應(yīng)的位置,合并圖像中剩余的空白區(qū)域用黑像素填充。如果在步驟S334中判斷圖像CUR_IMG和NEXT_IMG為非連接圖像,即不相連接,則在步驟S336中,把圖像添加到第二候選光柵圖像列表,稱其為第二候選光柵圖像列表,以區(qū)別于原候選光柵圖像列表。在步驟S337,設(shè)置參數(shù)CUR_IMG為原候選光柵圖像列表中的候選光柵圖像序列中標號為CUR_INDEX+1的圖像,并設(shè)置參數(shù)CUR_INDEX為CUR_INDEX+1。在步驟S338,檢測原候選光柵圖像列表中是否還有圖像,如果有,則進入步驟S333繼續(xù)處理,否則進入步驟S339,添加圖像到第二候選光柵圖像列表,之后結(jié)束處理。上述圖像合并過程對于ImageXObject和內(nèi)聯(lián)圖像序列分別處理。圖8A和圖8B示出對相連接的光柵圖像進行合并的示例,其中圖8A示出合并前的相連接的多個光柵圖像,圖8B示出的光柵圖像合并后的結(jié)果。圖6示出去除虛警光柵圖像的方法即圖2中步驟S34的流程,用來去除新產(chǎn)生的第二候選光柵圖像列表中細長的以及非常小的光柵圖像。在PDF格式文檔中,光柵圖像可以被用來表示文檔分隔線、表格線、項目符號等,而這類光柵圖像通常不是感知意義上的內(nèi)容,并無檢索意義上的顯著特征,因而不是本發(fā)明所要提取的光柵圖像。在步驟S341,構(gòu)建下述表達式(5)來作為判斷第二候選光柵圖像列表中的每個圖像是否應(yīng)該被作為虛警圖像而刪除的標準。首先,根據(jù)頁面尺寸以及該頁中最小字符尺寸來計算閾值threl,例如,threl=max(page_height/100,smallest_char_height),其中page_height是該頁高度,smallest_char_height是該頁中最小字符的高度。此外,閾值thre2和thre3可以根據(jù)對光柵圖像的高寬比例的要求來設(shè)定,例如,thre2=0.1及thre3=10。(Width<threlandheight<threl)or((width<threl||height<threl)&&(width/height<thre2width/height>thre3))(5)在步驟S342,如果某個光柵圖像的寬度width和高度height滿足公式(5),則判斷該光柵圖像為虛警圖像并將其刪除。之后,第二候選光柵圖像列表的光柵圖像序列中剩余的光柵圖像為最終提取的PDF格式文檔的光柵圖像。本發(fā)明也可以實施為從可移植電子文檔中提取光柵圖像的設(shè)備,用來執(zhí)行按照本發(fā)明上述實施例的從可移植電子文檔中提取光柵圖像的方法。其中,文檔解析裝置用于解析可移植電子文檔的格式以獲取每頁中與光柵圖像相關(guān)的命令和資源,執(zhí)行上述步驟S31的處理。候選光柵圖像提取裝置用于處理所述命令和資源來提取候選光柵圖像,執(zhí)行上述步驟S32的處理。光柵圖像合并裝置用于合并相連接的候選光柵圖像,執(zhí)行上述步驟S33的處理。虛警光柵圖像去除裝置用于去除虛警光柵圖像,執(zhí)行上述步驟S34的處理。具體地,在所述文檔解析裝置中,獲取裝置用于解析可移植電子文檔的格式,獲得每頁的內(nèi)容流及資源,執(zhí)行上述步驟S312的處理。解碼裝置用于對每頁的內(nèi)容流進行解碼,獲得命令集合,執(zhí)行上述步驟S314的處理。命令提取裝置用于從所述命令集合中提取與光柵圖像相關(guān)的命令,執(zhí)行上述步驟S315的處理。資源提取裝置用于提取與光柵圖像相關(guān)的資源,執(zhí)行上述步驟S316的處理。所述候選光柵圖像提取裝置判斷出所述命令中的圖像顯示命令,提取候選光柵圖像的位置及尺寸信息,根據(jù)該可移植電子文檔中指定的編碼方式對候選光柵圖像解碼,把候選光柵圖像存儲在候選光柵圖像列表中,執(zhí)行上述步驟S322S325的處理。在所述光柵圖像合并裝置中,排序裝置用于在存儲了候選光柵圖像的候選光柵圖像列表中,根據(jù)候選光柵圖像的位置對候選光柵圖像進行排序,執(zhí)行上述步驟S331S333的處理。判斷裝置用于比較候選光柵圖像列表中兩個相鄰的候選光柵圖像的位置,如果該兩個候選光柵圖像在垂直方向的距離小于第一給定閾值,并且在水平方向上重疊區(qū)域大于第二給定閾值,則判斷該兩個候選光柵圖像為相連接的候選光柵圖像,并合并相連接的候選光柵圖像,并且進一步判斷合并后的候選光柵圖像與其在候選光柵圖像列表中的下一候選光柵圖像是否為相連接的候選光柵圖像,并合并相連接的候選光柵圖像,執(zhí)行上述步驟S334S335的處理。添加裝置用于把判斷為與其下一候選光柵圖像不相連接的候選光柵圖像添加到第二候選光柵圖像列表,執(zhí)行上述步驟S336S337的處理。本領(lǐng)域技術(shù)人員可以認識到,盡管在上述的某些說明中以PDF文檔為例來進行描述,然而,上述實施方式不取決于PDF文檔的任何特殊性質(zhì),因而可以應(yīng)用于任何可移植電子文檔。在說明書中說明的一系列操作能夠通過硬件、軟件、或者硬件與軟件的組合來執(zhí)行。當(dāng)由軟件執(zhí)行該一系列操作時,可以把其中的計算機程序安裝到內(nèi)置于專用硬件的計算機中的存儲器中,使得計算機執(zhí)行該計算機程序?;蛘撸梢园延嬎銠C程序安裝到能夠執(zhí)行各種類型的處理的通用計算機中,使得計算機執(zhí)行該計算機程序。例如,可以把計算機程序預(yù)先存儲到作為記錄介質(zhì)的硬盤或者R0M(只讀存儲器)中?;蛘撸梢耘R時或者永久地存儲(記錄)計算機程序到可移動記錄介質(zhì)中,諸如軟盤、⑶-ROM(光盤只讀存儲器)、M0(磁光)盤、DVD(數(shù)字多功能盤)、磁盤、或半導(dǎo)體存儲器。可以把這樣的可移動記錄介質(zhì)作為封裝軟件提供。本發(fā)明已經(jīng)參考具體實施例進行了詳細說明。然而,很明顯,在不背離本發(fā)明的精神的情況下,本領(lǐng)域技術(shù)人員能夠?qū)嵤├龍?zhí)行更改和替換。換句話說,本發(fā)明用說明的形式公開,而不是被限制地解釋。要判斷本發(fā)明的要旨,應(yīng)該考慮所附的權(quán)利要求。10權(quán)利要求一種從可移植電子文檔中提取光柵圖像的方法,包含以下步驟a)解析可移植電子文檔的格式以獲取每頁中與光柵圖像相關(guān)的命令和資源;b)處理所述命令和資源來提取候選光柵圖像;c)合并相連接的候選光柵圖像;以及d)去除虛警光柵圖像。2.按照權(quán)利要求1所述的方法,其中,步驟a)包括以下步驟al)解析可移植電子文檔的格式,獲得每頁的內(nèi)容流及資源;a2)對每頁的內(nèi)容流進行解碼,獲得命令集合;a3)從所述命令集合中提取與光柵圖像相關(guān)的命令;以及a4)提取與光柵圖像相關(guān)的資源。3.按照權(quán)利要求1所述的方法,其中,步驟b)包括判斷出所述命令中的圖像顯示命令,提取候選光柵圖像的位置及尺寸信息,根據(jù)該可移植電子文檔中指定的編碼方式對候選光柵圖像解碼,把候選光柵圖像存儲在候選光柵圖像列表中。4.按照權(quán)利要求1所述的方法,其中,在b)步驟中,所提取的候選光柵圖像包括ImageXObject圖像和內(nèi)聯(lián)圖像,該ImageXObject圖像和內(nèi)聯(lián)圖像分別存儲在不同的候選光柵圖像列表。5.按照權(quán)利要求1所述的方法,其中,步驟c)包括以下步驟cl)在存儲了候選光柵圖像的候選光柵圖像列表中,根據(jù)候選光柵圖像的位置對候選光柵圖像進行排序;c2)比較候選光柵圖像列表中兩個相鄰的候選光柵圖像的位置,如果該兩個候選光柵圖像在垂直方向的距離小于第一給定閾值,并且在水平方向上重疊區(qū)域大于第二給定閾值,則判斷該兩個候選光柵圖像為相連接的候選光柵圖像,并合并相連接的候選光柵圖像;c3)對合并后的候選光柵圖像與其在候選光柵圖像列表中的下一候選光柵圖像重復(fù)步驟c2)的操作;c4)把判斷為與其下一候選光柵圖像不相連接的候選光柵圖像添加到第二候選光柵圖像列表。6.按照權(quán)利要求5所述的方法,其中,所述合并相連接的候選光柵圖像的過程包括圖像位置、圖像尺寸、及圖像數(shù)據(jù)的合并,合并后的候選光柵圖像中的空白區(qū)域用黑像素填充。7.按照權(quán)利要求1所述的方法,其中,在步驟d)中,根據(jù)文檔頁面尺寸、該頁最小文字尺寸、及對圖像的高寬比例的要求來判斷候選光柵圖像是否為虛警光柵圖像。8.—種從可移植電子文檔中提取光柵圖像的設(shè)備,包括文檔解析裝置,用于解析可移植電子文檔的格式以獲取每頁中與光柵圖像相關(guān)的命令和資源;候選光柵圖像提取裝置,用于處理所述命令和資源來提取候選光柵圖像;光柵圖像合并裝置,用于合并相連接的候選光柵圖像;以及虛警光柵圖像去除裝置,用于去除虛警光柵圖像。9.按照權(quán)利要求8所述的設(shè)備,其中,所述文檔解析裝置包括獲取裝置,用于解析可移植電子文檔的格式,獲得每頁的內(nèi)容流及資源;解碼裝置,用于對每頁的內(nèi)容流進行解碼,獲得命令集合;命令提取裝置,用于從所述命令集合中提取與光柵圖像相關(guān)的命令;以及資源提取裝置,用于提取與光柵圖像相關(guān)的資源。10.按照權(quán)利要求8所述的設(shè)備,其中,所述候選光柵圖像提取裝置判斷出所述命令中的圖像顯示命令,提取候選光柵圖像的位置及尺寸信息,根據(jù)該可移植電子文檔中指定的編碼方式對候選光柵圖像解碼,把候選光柵圖像存儲在候選光柵圖像列表中。11.按照權(quán)利要求8所述的設(shè)備,其中,所述候選光柵圖像提取裝置所提取的候選光柵圖像包括ImageXObject圖像和內(nèi)聯(lián)圖像,該ImageXObject圖像和內(nèi)聯(lián)圖像分別存儲在不同的候選光柵圖像列表。12.按照權(quán)利要求8所述的設(shè)備,其中,所述光柵圖像合并裝置包括排序裝置,用于在存儲了候選光柵圖像的候選光柵圖像列表中,根據(jù)候選光柵圖像的位置對候選光柵圖像進行排序;判斷裝置,用于比較候選光柵圖像列表中兩個相鄰的候選光柵圖像的位置,如果該兩個候選光柵圖像在垂直方向的距離小于第一給定閾值,并且在水平方向上重疊區(qū)域大于第二給定閾值,則判斷該兩個候選光柵圖像為相連接的候選光柵圖像,并合并相連接的候選光柵圖像,并且進一步判斷合并后的候選光柵圖像與其在候選光柵圖像列表中的下一候選光柵圖像是否為相連接的候選光柵圖像,并合并相連接的候選光柵圖像;添加裝置,用于把判斷為與其下一候選光柵圖像不相連接的候選光柵圖像添加到第二候選光柵圖像列表。13.按照權(quán)利要求12所述的設(shè)備,其中,對相連接的候選光柵圖像的合并包括圖像位置、圖像尺寸、及圖像數(shù)據(jù)的合并,以及合并后的候選光柵圖像中的空白區(qū)域用黑像素填充。14.按照權(quán)利要求8所述的設(shè)備,其中,所述虛警光柵圖像去除裝置根據(jù)文檔頁面尺寸、該頁最小文字尺寸、及對圖像的高寬比例的要求來判斷候選光柵圖像是否為虛警光柵圖像。全文摘要本發(fā)明提供一種通過分析可移植電子文檔的格式來提取其中的光柵圖像的方法和設(shè)備。一種從可移植電子文檔中提取光柵圖像的方法,包含以下步驟a)解析可移植電子文檔的格式以獲取每頁中與光柵圖像相關(guān)的命令和資源;b)處理所述命令和資源來提取候選光柵圖像;c)合并相連接的候選光柵圖像;以及d)去除虛警光柵圖像。本發(fā)明實現(xiàn)了不論內(nèi)聯(lián)光柵圖像還是ImageXObject光柵圖像均可提取,且視覺上完整的光柵圖像將作為一個完整的圖像提取,并排除了作為非感知意義上的內(nèi)容的細長分割線。文檔編號G06K9/20GK101901341SQ20091014174公開日2010年12月1日申請日期2009年5月25日優(yōu)先權(quán)日2009年5月25日發(fā)明者井上浩一,徐文暉,杜成,長谷川史裕申請人:株式會社理光
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1