專利名稱:用于檢測(cè)頁(yè)邊界的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理方法及其裝置。更具體地,本發(fā)明涉及用于檢測(cè)在中心部分具有裝訂彎曲(curvature)的書本文檔圖像的頁(yè)邊界的方法及其裝置,所述方法及其裝置主要應(yīng)用于從平板掃描儀、MFP等得到的圖像。
背景技術(shù):
圖像掃描儀的一個(gè)問題是,當(dāng)掃描儀掃描展開的書本文檔時(shí),書本的裝訂部分上升到玻璃臺(tái)板之上并由此離開掃描儀的焦平面。因此,裝訂部分的圖像畸變、變暗、模糊或劣化,這在本領(lǐng)域中是公知的。對(duì)于相對(duì)厚的書本文檔,所述問題變得更加嚴(yán)重。為了補(bǔ)償裝訂部分中的圖像劣化,檢測(cè)準(zhǔn)確的頁(yè)邊界對(duì)于基于圖像處理的補(bǔ)償技術(shù)是非常重要的步驟。例如,日本專利公開No. 5-161000、No. 5-161001、No. 5-161002和 No. 6-164852中公開的技術(shù)需要通過檢測(cè)頁(yè)邊界來測(cè)量整個(gè)文檔頁(yè)的高度,并然后在整個(gè)彎曲的頁(yè)上執(zhí)行校正。但是,以上的文獻(xiàn)都沒有教導(dǎo)用于檢測(cè)頁(yè)邊界的特定方法。美國(guó)專利No. 6330050B1公開了一種頁(yè)邊界識(shí)別手段,所述頁(yè)邊界識(shí)別手段在預(yù)先選擇的范圍上逐條圖像行地比較圖像亮度數(shù)據(jù)與自適應(yīng)閾值,以由此計(jì)算頁(yè)邊界的位置。但是,所公開的手段的目的僅在于找到裝訂部分中的頁(yè)邊界,并且不能應(yīng)對(duì)一些復(fù)雜的圖像。例如,對(duì)于具有比書本頁(yè)(book page)大的書本封面(book cover)的書本文檔圖像, 所述手段可能會(huì)失敗。并且,以上的文獻(xiàn)均不涉及找到垂直頁(yè)邊界的問題。鑒于以上的情況,需要一種用于檢測(cè)書本文檔圖像的頁(yè)邊界的方法及其裝置,所述方法及其裝置能夠準(zhǔn)確地檢測(cè)書本文檔圖像的全部頁(yè)邊界,并且/或者能夠應(yīng)對(duì)許多種類的復(fù)雜情況,包括上述的大的書本封面、存在于頁(yè)邊界附近的其它干擾物等。
發(fā)明內(nèi)容
因此,本發(fā)明的目的是提供一種用于檢測(cè)頁(yè)邊界的方法及其裝置,其中,能夠準(zhǔn)確地檢測(cè)書本文檔圖像的全部頁(yè)邊界。本發(fā)明的另一目的是提供一種用于檢測(cè)頁(yè)邊界的方法及其裝置,其中,能夠應(yīng)對(duì)許多種類的復(fù)雜情況,包括比書本頁(yè)大的書本封面、存在于頁(yè)邊界附近的其它的干擾物等。根據(jù)本發(fā)明的第一方面,提供一種用于檢測(cè)書本文檔圖像的頁(yè)邊界的方法,所述方法包括邊緣圖像檢測(cè)步驟,用于從書本文檔圖像檢測(cè)邊緣圖像;水平頁(yè)邊界檢測(cè)步驟, 用于檢測(cè)邊緣圖像上的頂頁(yè)邊界和底頁(yè)邊界;裝訂中心線檢測(cè)步驟,用于通過尋找左頁(yè)和右頁(yè)在頂頁(yè)邊界和底頁(yè)邊界上的交點(diǎn)來檢測(cè)裝訂中心線;頁(yè)寬度確定步驟,用于確定書本文檔圖像的頁(yè)寬度;和垂直頁(yè)邊界確定步驟,用于通過使用頂頁(yè)邊界、底頁(yè)邊界、裝訂中心線和頁(yè)寬度來確定左頁(yè)邊界和右頁(yè)邊界。水平頁(yè)邊界檢測(cè)步驟還包含直線段檢測(cè)步驟,用于檢測(cè)邊緣圖像上的多條直線段;直線部分選擇步驟,用于從所述多條直線段選擇頂頁(yè)邊界和底頁(yè)邊界的直線部分;和彎曲部分檢測(cè)步驟,用于基于頂頁(yè)邊界和底頁(yè)邊界的直線部分來檢測(cè)邊緣圖像上的頂頁(yè)邊界和底頁(yè)邊界的彎曲部分。 優(yōu)選地,在直線段檢測(cè)步驟中,執(zhí)行在后面描述的預(yù)處理。 優(yōu)選地,在直線部分選擇步驟中,基于在后面描述的一些選擇準(zhǔn)則來執(zhí)行選擇。根據(jù)本發(fā)明的第二方面,提供一種用于檢測(cè)書本文檔圖像的頁(yè)邊界的裝置,所述裝置包括邊緣圖像檢測(cè)部件,用于從書本文檔圖像檢測(cè)邊緣圖像;水平頁(yè)邊界檢測(cè)部件, 用于檢測(cè)邊緣圖像上的頂頁(yè)邊界和底頁(yè)邊界;裝訂中心線檢測(cè)部件,用于通過尋找左頁(yè)和右頁(yè)在頂頁(yè)邊界和底頁(yè)邊界上的交點(diǎn)來檢測(cè)裝訂中心線;頁(yè)寬度確定部件,用于確定書本文檔圖像的頁(yè)寬度;和垂直頁(yè)邊界確定部件,用于通過使用頂頁(yè)邊界、底頁(yè)邊界、裝訂中心線和頁(yè)寬度來確定左頁(yè)邊界和右頁(yè)邊界。水平頁(yè)邊界檢測(cè)部件還包含直線段檢測(cè)部件,用于檢測(cè)邊緣圖像上的多條直線段;直線部分選擇部件,用于從所述多條直線段選擇頂頁(yè)邊界和底頁(yè)邊界的直線部分;和彎曲部分檢測(cè)部件,用于基于頂頁(yè)邊界和底頁(yè)邊界的直線部分來檢測(cè)邊緣圖像上的頂頁(yè)邊界和底頁(yè)邊界的彎曲部分。優(yōu)選地,在直線段檢測(cè)部件中,執(zhí)行在后面描述的預(yù)處理。優(yōu)選地,在直線部分選擇部件中,基于后面描述的一些選擇準(zhǔn)則來執(zhí)行選擇。從參照附圖對(duì)示例性實(shí)施例的以下詳細(xì)描述,本發(fā)明的進(jìn)一步的目的、特征和優(yōu)點(diǎn)將變得明顯。
被包含于說明書中并構(gòu)成其一部分的附圖示出本發(fā)明的實(shí)施例,并與描述一起用于解釋本發(fā)明的原理。圖1示出示例性的書本文檔圖像。圖2示出書本文檔圖像的頁(yè)模型。圖3是表示實(shí)現(xiàn)根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法的示例性一般過程的流程圖。圖4示出圖1所示的書本文檔圖像的邊緣圖像。圖5是表示根據(jù)本發(fā)明的水平頁(yè)邊界檢測(cè)步驟的示例性過程的流程圖。圖6示出在頁(yè)邊界附近存在干擾物的情況下選擇水平頁(yè)邊界的直線部分的原理。圖7示出跟蹤水平頁(yè)邊界的彎曲部分的過程。圖8 (a)示出檢測(cè)頁(yè)角點(diǎn)(corner point)的示意性過程,圖8 (b)示出檢測(cè)頁(yè)角點(diǎn)的示例過程。圖9示出根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法的一個(gè)示例性結(jié)果。圖10示出根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法的另一個(gè)示例性結(jié)果。圖11是表示根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)裝置的示例性一般配置的框圖。圖12是表示根據(jù)本發(fā)明的水平頁(yè)邊界檢測(cè)部件的示例性配置的框圖。
具體實(shí)施例方式現(xiàn)在參照附圖詳細(xì)描述本發(fā)明的示例性實(shí)施例。應(yīng)注意,除非另外特別說明,否則,在實(shí)施例中闡述的組件和步驟不限制本發(fā)明的范圍。以下的描述在本質(zhì)上僅是解釋性的,決不是意在限制本發(fā)明、其應(yīng)用或用途。
本領(lǐng)域技術(shù)人員已知的技術(shù)、方法和裝置可能不被詳細(xì)討論,但在適當(dāng)?shù)那闆r下意在成為說明書的一部分。頁(yè)模型圖1示出從圖像掃描儀獲得的示例性展開書本文檔圖像。從圖1明顯可見,圖像具有左頁(yè)和右頁(yè),并且,中心裝訂部分的圖像在一定程度上畸變、變暗、模糊或劣化。并且, 在頁(yè)邊界附近存在干擾物,在這種情況下為標(biāo)簽和大的書本封面。圖2示出書本文檔圖像的頁(yè)模型。在圖2中,附圖標(biāo)記A和B分別表示左頁(yè)和右頁(yè)。附圖標(biāo)記C表示左頁(yè)和右頁(yè)在頂頁(yè)邊界和底頁(yè)邊界上的交點(diǎn)。另外,附圖標(biāo)記1表示裝訂中心線,附圖標(biāo)記2表示水平頁(yè)邊界,其中,頂側(cè)的為頂頁(yè)邊界,底側(cè)的為底頁(yè)邊界。從圖2可以看出,可通過兩個(gè)部分來模擬各水平頁(yè)邊界直線部分加和裝訂中心線1附近的彎曲部分2b。并且,在頂頁(yè)邊界上,彎曲部分在直線部分之下;而在底頁(yè)邊界上,彎曲部分在直線部分之上。并且,附圖標(biāo)記3表示包含左頁(yè)邊界和右頁(yè)邊界的垂直頁(yè)邊界。垂直頁(yè)邊界可大致被視為直線。最后,附圖標(biāo)記W表示右頁(yè)的頁(yè)寬度,其是裝訂中心線和右頁(yè)邊界之間的垂直距離。類似地定義左頁(yè)的頁(yè)寬度。附圖標(biāo)記H表示右頁(yè)的頁(yè)高度,其是右頁(yè)的頂頁(yè)邊界和底頁(yè)邊界之間的垂直距離。類似地定義左頁(yè)的頁(yè)高度。以下,將基于圖2所示的頁(yè)模型來描述根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法及裝置。頁(yè)邊界檢測(cè)方法將參照?qǐng)D3來描述根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法的一般過程。圖3是表示實(shí)現(xiàn)根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法的示例性一般過程的流程圖300。在步驟310處,從輸入的書本文檔圖像檢測(cè)邊緣圖像。在步驟320處,從所述邊緣圖像檢測(cè)包含頂頁(yè)邊界和底頁(yè)邊界的水平頁(yè)邊界。在步驟330處,通過尋找左頁(yè)和右頁(yè)在頂頁(yè)邊界和底頁(yè)邊界上的交點(diǎn)來檢測(cè)裝訂中心線。在步驟340處,確定書本文檔圖像的頁(yè)寬度。在步驟350處,基于頂頁(yè)邊界、底頁(yè)邊界、裝訂中心線和頁(yè)寬度來確定包含左頁(yè)邊界和右頁(yè)邊界的垂直頁(yè)邊界。最后,通過上述步驟的實(shí)施,對(duì)于輸入的書本文檔圖像確定了全部的和準(zhǔn)確的頁(yè)邊界?;谟靡陨戏绞酱_定的全部的頁(yè)邊界,可進(jìn)一步校正代表中心裝訂部分的圖像部分的畸變。圖3中的流程圖簡(jiǎn)要示出根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法的基本步驟。以下,將更加詳細(xì)地描述以上各步驟的示例性過程。第一步驟即步驟310是從輸入的書本文檔圖像檢測(cè)邊緣圖像。在圖像處理的領(lǐng)域中,許多的邊緣檢測(cè)算法是公知的,諸如Sobel算子、Carmy算子等。在產(chǎn)生的二值邊緣圖像中,各像素代表所述點(diǎn)是否是邊緣點(diǎn)。在各邊緣點(diǎn)處,圖像亮度急劇變化,或者更正式而言,具有明顯的不連續(xù)性。圖4示出圖1所示的書本文檔圖像的示例性邊緣圖像。下面,將參照?qǐng)D5更加詳細(xì)地描述根據(jù)本發(fā)明的檢測(cè)水平頁(yè)邊界的示例性過程。如圖5的流程圖500所示,首先,在步驟510處,檢測(cè)邊緣圖像上的多條直線段。如圖像處理領(lǐng)域的技術(shù)人員公知的那樣,可通過對(duì)于邊緣圖像執(zhí)行例如Hough變換來容易地檢測(cè)多條直線段。
在本發(fā)明中,為了使直線段檢測(cè)處理更快并且為了僅檢測(cè)非常可能處于水平頁(yè)邊界上的直線段,優(yōu)選采用對(duì)于邊緣圖像的以下預(yù)處理。這里,假定書本文檔圖像的背景區(qū)域是黑色的;并且,在背景區(qū)域中不存在許多噪聲。在邊緣圖像的頂側(cè),可以如下實(shí)施處理。對(duì)于邊緣圖像的各列,從頂?shù)降走M(jìn)行尋找,并且,僅保留所遇到的前幾個(gè)邊緣點(diǎn)(例如,前三個(gè)邊緣點(diǎn))。還應(yīng)注意,這里,要求各保留的邊緣點(diǎn)在其頂側(cè)具有較暗的顏色并在其底側(cè)具有較亮的顏色。從圖1明顯可見該預(yù)處理的原理。在圖1所示的書本文檔圖像中,由于存在尺寸比書本頁(yè)大的書本封面,因此所遇到的第一個(gè)邊緣點(diǎn)可能不屬于頂頁(yè)邊界;而是,它可能屬于書本封面。在其它的情形下,還存在所遇到的第一個(gè)邊緣點(diǎn)可能屬于頁(yè)邊界附近存在的干擾物的可能性。因此,需要保留首先遇到的幾個(gè)邊緣點(diǎn)。并且,由于書本文檔圖像的背景區(qū)域是黑色的,屬于諸如書本封面的物體的圖像區(qū)域通常較亮,并且,屬于頁(yè)邊界近旁的圖像區(qū)域甚至更亮,因此,在頂頁(yè)邊界的情況下,要求各保留的邊緣點(diǎn)的頂側(cè)具有較暗的顏色,而其底側(cè)具有較亮的顏色。邊緣圖像的底側(cè)的情況類似。但是,這里,對(duì)于邊緣圖像的各列,作為替代從底到頂進(jìn)行尋找,并且,僅保留所遇到的前幾個(gè)邊緣點(diǎn)(例如,前三個(gè)邊緣點(diǎn))。另一不同在于, 要求各保留的邊緣點(diǎn)在其底側(cè)具有較暗的顏色并在其頂側(cè)具有較亮的顏色,這與頂側(cè)的情況相反。順便說一句,在以上的預(yù)處理中,當(dāng)從頂?shù)降讓ふ視r(shí)或當(dāng)從底到頂尋找時(shí),對(duì)于邊緣圖像的各列保留前三個(gè)邊緣點(diǎn)。但是,應(yīng)注意,所保留的邊緣點(diǎn)的數(shù)量?jī)H是示例性的,并不意在限制本發(fā)明的保護(hù)范圍。實(shí)際上,取決于實(shí)際的情形,本領(lǐng)域技術(shù)人員可采取兩個(gè)邊緣點(diǎn)、四個(gè)邊緣點(diǎn)或更多個(gè)邊緣點(diǎn)。在以上的預(yù)處理之后,通過僅僅使用從頂?shù)降讓ふ視r(shí)所保留的邊緣點(diǎn)和從底到頂尋找時(shí)所保留的邊緣點(diǎn),來檢測(cè)多條直線段。例如,對(duì)于所有保留的邊緣點(diǎn)執(zhí)行Hough變換,以得到多條直線段。以上的預(yù)處理之后的Hough變換的計(jì)算量顯著減少,這可有助于提高本發(fā)明的頁(yè)邊界檢測(cè)方法的處理速度。下面,在步驟520處,從步驟510中檢測(cè)的多條直線段之中選擇頂頁(yè)邊界和底頁(yè)邊界的直線部分。從所述多條檢測(cè)的直線段,選擇四條直線段作為分別與左頁(yè)的頂頁(yè)邊界和底頁(yè)邊界以及右頁(yè)的頂頁(yè)邊界和底頁(yè)邊界對(duì)應(yīng)的水平頁(yè)邊界的直線部分。選擇準(zhǔn)則如下。a)在頂側(cè),左頁(yè)的頂頁(yè)邊界的直線段和右頁(yè)的頂頁(yè)邊界的直線段(其構(gòu)成直線段對(duì))大致處于同一條直線上(它們不必要正好處于同一條直線上)。類似的準(zhǔn)則適用于底側(cè)。也就是說,在底側(cè),左頁(yè)的底頁(yè)邊界的直線段和右頁(yè)的底頁(yè)邊界的直線段大致處于同一條直線上。b)在頂側(cè),如果多于一個(gè)的直線段對(duì)滿足準(zhǔn)則a),那么計(jì)算上面的直線段對(duì)和下面的直線段對(duì)之間的垂直距離。如果所計(jì)算的垂直距離比預(yù)定閾值D(例如,50個(gè)像素,但是,可基于實(shí)際的情形和需要來確定該閾值)大,那么選擇上面的直線段對(duì)作為頂頁(yè)邊界的直線部分;否則,選擇下面的直線段對(duì)作為頂頁(yè)邊界的直線部分。另一方面,在底側(cè),在多于一個(gè)的直線段對(duì)滿足準(zhǔn)則a)的情況下,如果所計(jì)算的垂直距離比預(yù)定閾值D大,那么選擇下面的直線段對(duì)作為底頁(yè)邊界的直線部分;否則,選擇上面的直線段對(duì)作為底頁(yè)邊界的直線部分。順便說一句,當(dāng)在步驟510處檢測(cè)直線段時(shí),可以進(jìn)行控制,以確保對(duì)于左頁(yè)的頂側(cè)和底側(cè)中的每一個(gè)以及對(duì)于右頁(yè)的頂側(cè)和底側(cè)中的每一個(gè)檢測(cè)到最多兩條直線段。例如,對(duì)于圖4中的邊緣圖像的左上部分,如果檢測(cè)到三條或更多條直線段,那么僅保留兩條最長(zhǎng)的。在這種情況下,最多兩個(gè)直線段對(duì)可能滿足準(zhǔn)則a)。但是,對(duì)于本領(lǐng)域技術(shù)人員很顯然的是,本發(fā)明不限于此。圖6示出從滿足以上準(zhǔn)則a)的多個(gè)直線段對(duì)選擇水平頁(yè)邊界的直線部分的例子。 在圖6中,除了代表頂頁(yè)邊界的直線段對(duì)以外,左頁(yè)和右頁(yè)的頂部的粗體印刷直線對(duì)也可被檢測(cè)為另外的直線段對(duì)。在這種情況下,這兩對(duì)之間的垂直距離比預(yù)定閾值D大,由此, 適當(dāng)?shù)剡x擇上面的直線段對(duì)作為頂頁(yè)邊界的直線部分。另一方面,在圖6的底側(cè),適當(dāng)?shù)剡x擇下面的直線段對(duì)作為底頁(yè)邊界的直線部分。與此相對(duì)照,回過來參照?qǐng)D1,在左頁(yè)和右頁(yè)的頂部不存在這樣的粗體印刷直線對(duì),而是存在尺寸比書本頁(yè)大的書本封面,由此,書本封面也在書本文檔圖像中顯示出來。 因此,在圖1中,除了代表頂頁(yè)邊界的直線段對(duì)以外,代表書本封面的、在頂頁(yè)邊界近旁的直線段對(duì)也可被檢測(cè)為另外的直線段對(duì) 。在這種情況下,這兩對(duì)之間的垂直距離比預(yù)定閾值D小,由此,適當(dāng)?shù)剡x擇下面的直線段對(duì)作為頂頁(yè)邊界的直線部分。并且,應(yīng)注意,在圖1 中,在書本頁(yè)的頂部的標(biāo)簽也可被檢測(cè)為潛在的直線段的候選。但是,在標(biāo)簽的情況下,其垂直距離將比預(yù)定閾值D大,由此,與水平頁(yè)邊界附近的粗體印刷直線對(duì)的情況類似,代表標(biāo)簽的直線段將不被選擇為頂頁(yè)邊界的直線部分。以上的準(zhǔn)則確保,即使當(dāng)存在書本封面或干擾物(諸如水平頁(yè)邊界附近的標(biāo)簽和粗體印刷直線對(duì))時(shí),仍可適當(dāng)?shù)囟ㄎ徽_的水平頁(yè)邊界。因此,與現(xiàn)有技術(shù)中的頁(yè)邊界檢測(cè)方法相比,根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法能夠應(yīng)對(duì)各種更復(fù)雜的情況。在選擇水平頁(yè)邊界的直線部分之后,在步驟530處,基于頂頁(yè)邊界和底頁(yè)邊界的直線部分,在邊緣圖像上檢測(cè)頂頁(yè)邊界和底頁(yè)邊界的彎曲部分。更具體而言,可根據(jù)直線部分和彎曲部分之間的位置關(guān)系來跟蹤彎曲部分。圖7 作為例子給出左頁(yè)的頂頁(yè)邊界的情況。所述過程可被如下實(shí)施。從左頁(yè)的頂頁(yè)邊界的直線部分上的初始點(diǎn)(例如,所述初始點(diǎn)可位于裝訂中心線附近,但是,其位置不限于此),向著右下方向(參見圖7中的箭頭F)尋找邊緣點(diǎn),以得到左頁(yè)的頂頁(yè)邊界的彎曲部分??深愃频貦z測(cè)右頁(yè)的頂頁(yè)邊界、左頁(yè)的底頁(yè)邊界和右頁(yè)的底頁(yè)邊界的彎曲部分(將分別向著左下方向、右上方向和左上方向進(jìn)行尋找)。到現(xiàn)在為止,檢測(cè)到水平頁(yè)邊界。下面,根據(jù)圖3的流程圖的步驟330,檢測(cè)裝訂中心線。如圖7所示,可容易地確定左頁(yè)和右頁(yè)在水平頁(yè)邊界上的交點(diǎn)(圖7僅示出頂頁(yè)邊界上的交點(diǎn)C)。在確定交點(diǎn)(例如如圖7所示的頂側(cè)的交點(diǎn)C)之后,通過畫出通過該交點(diǎn)并且與水平頁(yè)邊界(例如,頂頁(yè)邊界)的直線部分正交的直線,來確定裝訂中心線。順便說一句,雖然采用頂側(cè)的交點(diǎn)和頂頁(yè)邊界的直線部分來檢測(cè)裝訂中心線的以上過程可能更準(zhǔn)確,但是本發(fā)明不限于此。另外,在理論上,也可通過連接頂頁(yè)邊界上的交點(diǎn)和底頁(yè)邊界上的交點(diǎn)來檢測(cè)裝訂中心線。但是,由于通常難以精確地找到交點(diǎn),因此該過程可能不是非常準(zhǔn)確。
9
在檢測(cè)到裝訂中心線之后,如圖3所示,在步驟340處確定書本文檔圖像的頁(yè)寬度。為了確定頁(yè)寬度,可采用各種過程。例如,用于得到頁(yè)寬度的一種方法是從用戶界面得到書本文檔的寬高比的值。之后,根據(jù)頂頁(yè)邊界和底頁(yè)邊界的直線部分之間的垂直距離來計(jì)算頁(yè)高度。最后,可根據(jù)所獲得的寬高比和所計(jì)算的頁(yè)高度來計(jì)算頁(yè)寬度。用于得到頁(yè)寬度的另一種方法基于頁(yè)角點(diǎn)的檢測(cè)。圖8(a)作為例子給出左上頁(yè)角點(diǎn)的情況,但是,本領(lǐng)域技術(shù)人員很容易想到,可通過類似的方法檢測(cè)包括右上頁(yè)角點(diǎn)、 左下頁(yè)角點(diǎn)和右下頁(yè)角點(diǎn)的所有其它頁(yè)角點(diǎn)。在圖8(a)中,左上頁(yè)角點(diǎn)G是兩條線Ll和 L2的交點(diǎn)。更具體而言,線Ll是左頁(yè)的頂頁(yè)邊界的直線部分。線L2由以下的過程確定 (在圖8(a)的情況下向左)尋找與線Ll連接的邊緣點(diǎn);去除處于線Ll上的邊緣點(diǎn);最后, 在去除之后剩余的所找到的邊緣點(diǎn)上擬合直線,以獲得線L2。在獲得線Ll和L2之后,可通過線Ll和L2的交點(diǎn)容易地確定左上頁(yè)角點(diǎn)G。圖8(b)示出檢測(cè)頁(yè)角點(diǎn)的示例過程,其與圖8 (a)中檢測(cè)頁(yè)角點(diǎn)的示意性過程對(duì)應(yīng)。一旦檢測(cè)到頁(yè)角點(diǎn),就能夠容易地根據(jù)所檢測(cè)到的頁(yè)角點(diǎn)和所檢測(cè)到的裝訂中心線來計(jì)算頁(yè)寬度。更具體而言,頁(yè)寬度是所檢測(cè)到的頁(yè)角點(diǎn)和裝訂中心線之間的垂直距離。要注意,由于掃描變形,左頁(yè)的頁(yè)寬度和右頁(yè)的頁(yè)寬度可能不相同。因此,在基于頁(yè)角點(diǎn)的檢測(cè)來得到頁(yè)寬度的以上方法中,需要分開地計(jì)算左頁(yè)和右頁(yè)的頁(yè)寬度(順便說一句,雖然采用頂側(cè)的頁(yè)角點(diǎn)的過程可能更準(zhǔn)確,但是本發(fā)明不限于此)。相比而言,在基于寬高比和頁(yè)高度來得到頁(yè)寬度的以上方法中,僅需要執(zhí)行一次計(jì)算。應(yīng)注意,上述方法在本質(zhì)上僅是解釋性的。下面,根據(jù)圖3的流程圖,基于在以上的各步驟320-340中獲得的頂頁(yè)邊界、底頁(yè)邊界、裝訂中心線和頁(yè)寬度來確定垂直頁(yè)邊界。更具體而言,可如下實(shí)施找到垂直頁(yè)邊界的示例性過程。通過參照裝訂中心線和頁(yè)寬度來確定垂直頁(yè)邊界的水平位置(參照?qǐng)D幻。然后,可通過畫出在確定的水平位置處與水平頁(yè)邊界的直線部分正交的兩條垂直線(一條用于左頁(yè)邊界,另一條用于右頁(yè)邊界), 來確定垂直頁(yè)邊界。在先前已在步驟340中檢測(cè)到頁(yè)角點(diǎn)的情況下,可通過畫出在一個(gè)左頁(yè)角點(diǎn)和一個(gè)右頁(yè)角點(diǎn)處與水平頁(yè)邊界的直線部分正交的兩條垂直線,來直接確定垂直頁(yè)邊界(順便說一句,雖然采用頂側(cè)的頁(yè)角點(diǎn)的過程可能更準(zhǔn)確,但是本發(fā)明不限于此)。在這種情況下,不必在步驟;340中確定頁(yè)寬度。圖9和圖10示出本發(fā)明的頁(yè)邊界檢測(cè)的示例性結(jié)果。更具體而言,圖9示出使用本發(fā)明的方法所獲得的圖1中的書本文檔圖像的頁(yè)邊界檢測(cè)結(jié)果。圖10示出使用本發(fā)明的方法所獲得的另一書本文檔圖像的頁(yè)邊界檢測(cè)結(jié)果。與圖9中的書本相比,圖10中的書本相對(duì)薄。從這些圖可以看出,即使在存在書本封面(參照?qǐng)D9)或頁(yè)邊界附近的干擾物(參照?qǐng)D9和圖10中的標(biāo)簽)的各種復(fù)雜情況下,根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法仍可準(zhǔn)確地檢測(cè)書本文檔圖像的全部頁(yè)邊界。與現(xiàn)有技術(shù)的頁(yè)邊界檢測(cè)方法相比,這是大大有利的。頁(yè)邊界檢測(cè)裝置以下,將簡(jiǎn)要描述根據(jù)本發(fā)明的示例性的頁(yè)邊界檢測(cè)裝置。圖11是表示根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)裝置的示例性一般配置的框圖。從圖11可以看出,根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)裝置1100可包含邊緣圖像檢測(cè)部件1110、水平頁(yè)邊界檢測(cè)部件1120、裝訂中心線檢測(cè)部件1130、頁(yè)寬度確定部件1140和垂直頁(yè)邊界確定部件1150。顯然,頁(yè)邊界檢測(cè)裝置1100還可根據(jù)實(shí)際需要而包含圖11中沒有示出的其它部件。邊緣圖像檢測(cè)部件1110被配置為從輸入的書本文檔圖像檢測(cè)邊緣圖像。邊緣圖像檢測(cè)部件1110所采用的邊緣檢測(cè)方法可以是Sobel算子、Canny算子等。水平頁(yè)邊界檢測(cè)部件1120被配置為從邊緣圖像檢測(cè)頂頁(yè)邊界和底頁(yè)邊界。圖12 是表示根據(jù)本發(fā)明的水平頁(yè)邊界檢測(cè)部件的示例性一般配置的框圖。圖12所示的水平頁(yè)邊界檢測(cè)部件1200包含直線段檢測(cè)部件1210、直線部分選擇部件1220和彎曲部分檢測(cè)部件1230。更具體而言,直線段檢測(cè)部件1210優(yōu)選在上述的預(yù)處理之后檢測(cè)邊緣圖像上的多條直線段。直線部分選擇部件1220通過應(yīng)用上述的選擇準(zhǔn)則a)和b),從所檢測(cè)到的多條直線段之中選擇頂頁(yè)邊界和底頁(yè)邊界的直線部分。彎曲部分檢測(cè)部件1230基于頂頁(yè)邊界和底頁(yè)邊界的直線部分,來檢測(cè)邊緣圖像上的頂頁(yè)邊界和底頁(yè)邊界的彎曲部分。最終,可通過水平頁(yè)邊界檢測(cè)部件1120來檢測(cè)水平頁(yè)邊界?,F(xiàn)在返回到圖11。裝訂中心線檢測(cè)部件1130被配置為通過尋找左頁(yè)和右頁(yè)在頂頁(yè)邊界和底頁(yè)邊界上的交點(diǎn)來檢測(cè)裝訂中心線。頁(yè)寬度確定部件1140被配置為確定書本文檔圖像的頁(yè)寬度。頁(yè)寬度確定部件 1140可采用各種不同的方法來確定頁(yè)寬度。一種方法是從用戶界面得到書本文檔的寬高比的值,根據(jù)頂邊界和底邊界的直線部分之間的垂直距離來計(jì)算頁(yè)高度,并且根據(jù)寬高比和頁(yè)高度來獲得頁(yè)寬度。另一種方法基于如前所述的頁(yè)角點(diǎn)的檢測(cè)。垂直頁(yè)邊界確定部件1150被配置為基于分別由水平頁(yè)邊界檢測(cè)部件1120、裝訂中心線檢測(cè)部件1130和頁(yè)寬度確定部件1140所確定的頂頁(yè)邊界和底頁(yè)邊界、裝訂中心線以及頁(yè)寬度,來確定左頁(yè)邊界和右頁(yè)邊界。應(yīng)注意,所有以上的部件都是用于實(shí)施本發(fā)明的頁(yè)邊界檢測(cè)方法的示例性優(yōu)選模塊。但是,以上并沒有窮盡性地描述用于實(shí)施各步驟的模塊。一般地,在存在執(zhí)行某過程的步驟的情況下,就存在用于實(shí)施同一過程的相應(yīng)的功能模塊或部件。另外,應(yīng)注意,在圖11和圖12中,可將兩個(gè)或更多個(gè)部件組合成一個(gè)部件,只要可以實(shí)現(xiàn)它們的功能即可;另一方面,可將任何一個(gè)部件分成多個(gè)部件,只要可以實(shí)現(xiàn)類似的功能即可。可以以各種方式實(shí)施本發(fā)明的頁(yè)邊界檢測(cè)方法和裝置。例如,可以通過軟件、硬件、固件或它們的任意組合來實(shí)施本發(fā)明的頁(yè)邊界檢測(cè)方法和裝置。此外,在一些實(shí)施例中,本發(fā)明還可被實(shí)施為記錄在記錄介質(zhì)中的程序,包括用于實(shí)施根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法的機(jī)器可讀指令。因此,本發(fā)明還涵蓋存儲(chǔ)用于實(shí)施根據(jù)本發(fā)明的頁(yè)邊界檢測(cè)方法的程序的記錄介質(zhì)。雖然已參照示例性實(shí)施例描述了本發(fā)明,但應(yīng)理解,本發(fā)明不限于所公開的示例性實(shí)施例。對(duì)于本領(lǐng)域技術(shù)人員顯然的是,可在不背離本發(fā)明的范圍和精神的條件下修改以上的示例性實(shí)施例。所附的權(quán)利要求的范圍應(yīng)被賦予最寬的解釋,以包含所有這樣的修改以及等同的結(jié)構(gòu)和功能。
權(quán)利要求
1.一種用于檢測(cè)書本文檔圖像的頁(yè)邊界的方法,包括 邊緣圖像檢測(cè)步驟,用于從書本文檔圖像檢測(cè)邊緣圖像;水平頁(yè)邊界檢測(cè)步驟,用于檢測(cè)邊緣圖像上的頂頁(yè)邊界和底頁(yè)邊界; 裝訂中心線檢測(cè)步驟,用于通過尋找左頁(yè)和右頁(yè)在頂頁(yè)邊界和底頁(yè)邊界上的交點(diǎn)來檢測(cè)裝訂中心線;頁(yè)寬度確定步驟,用于確定書本文檔圖像的頁(yè)寬度;和垂直頁(yè)邊界確定步驟,用于通過使用頂頁(yè)邊界、底頁(yè)邊界、裝訂中心線和頁(yè)寬度來確定左頁(yè)邊界和右頁(yè)邊界。
2.根據(jù)權(quán)利要求1的方法,其中,水平頁(yè)邊界檢測(cè)步驟還包括 直線段檢測(cè)步驟,用于檢測(cè)邊緣圖像上的多條直線段;直線部分選擇步驟,用于從所述多條直線段選擇頂頁(yè)邊界和底頁(yè)邊界的直線部分;和彎曲部分檢測(cè)步驟,用于基于頂頁(yè)邊界和底頁(yè)邊界的直線部分來檢測(cè)邊緣圖像上的頂頁(yè)邊界和底頁(yè)邊界的彎曲部分。
3.根據(jù)權(quán)利要求2的方法,其中,在直線段檢測(cè)步驟中,執(zhí)行以下的預(yù)處理對(duì)于邊緣圖像的各列,從頂?shù)降讓ふ也⑶覂H保留所遇到的前幾個(gè)邊緣點(diǎn),其中,要求從頂?shù)降讓ふ視r(shí)的各保留的邊緣點(diǎn)在其頂側(cè)具有較暗的顏色并在其底側(cè)具有較亮的顏色,并且對(duì)于邊緣圖像的各列,從底到頂尋找并且僅保留所遇到的前幾個(gè)邊緣點(diǎn),其中,要求從底到頂尋找時(shí)的各保留的邊緣點(diǎn)在其底側(cè)具有較暗的顏色并在其頂側(cè)具有較亮的顏色;其中,通過僅使用從頂?shù)降讓ふ視r(shí)保留的邊緣點(diǎn)和從底到頂尋找時(shí)保留的邊緣點(diǎn),來檢測(cè)所述多條直線段。
4.根據(jù)權(quán)利要求2的方法,其中,基于以下的選擇準(zhǔn)則來執(zhí)行直線部分選擇步驟a)在頂側(cè),左頁(yè)的頂頁(yè)邊界的直線段和右頁(yè)的頂頁(yè)邊界的直線段大致處于同一條直線上,并且,在底側(cè),左頁(yè)的底頁(yè)邊界的直線段和右頁(yè)的底頁(yè)邊界的直線段大致處于同一條直 ^^ —t- b)在頂側(cè),在多于一個(gè)的直線段對(duì)滿足準(zhǔn)則a)的情況下,如果上面的直線段對(duì)和下面的直線段對(duì)之間的垂直距離比預(yù)定閾值大,那么選擇上面的直線段對(duì)作為頂頁(yè)邊界的直線部分,否則,選擇下面的直線段對(duì)作為頂頁(yè)邊界的直線部分;在底側(cè),在多于一個(gè)的直線段對(duì)滿足準(zhǔn)則a)的情況下,如果上面的直線段對(duì)和下面的直線段對(duì)之間的垂直距離比預(yù)定閾值大,那么選擇下面的直線段對(duì)作為底頁(yè)邊界的直線部分,否則,選擇上面的直線段對(duì)作為底頁(yè)邊界的直線部分。
5.根據(jù)權(quán)利要求1的方法,其中,頁(yè)寬度確定步驟還包括 從用戶界面獲得書本文檔的寬高比的值;根據(jù)頂頁(yè)邊界和底頁(yè)邊界的直線部分之間的垂直距離來確定書本文檔圖像的頁(yè)高度;和根據(jù)寬高比和頁(yè)高度來計(jì)算頁(yè)寬度。
6.根據(jù)權(quán)利要求1的方法,其中,頁(yè)寬度確定步驟還包括根據(jù)頂頁(yè)邊界和底頁(yè)邊界來檢測(cè)邊緣圖像上的書本文檔圖像的頁(yè)角點(diǎn);和根據(jù)頁(yè)角點(diǎn)和裝訂中心線來計(jì)算頁(yè)寬度。
7.根據(jù)權(quán)利要求1的方法,其中,在垂直頁(yè)邊界確定步驟中,通過參照裝訂中心線和頁(yè)寬度來確定垂直頁(yè)邊界的水平位置,并且,通過畫出在所確定的水平位置處與水平頁(yè)邊界的直線部分正交的兩條垂直線來確定垂直頁(yè)邊界。
8.一種用于檢測(cè)書本文檔圖像的頁(yè)邊界的裝置,包括 邊緣圖像檢測(cè)部件,用于從書本文檔圖像檢測(cè)邊緣圖像;水平頁(yè)邊界檢測(cè)部件,用于檢測(cè)邊緣圖像上的頂頁(yè)邊界和底頁(yè)邊界; 裝訂中心線檢測(cè)部件,用于通過尋找左頁(yè)和右頁(yè)在頂頁(yè)邊界和底頁(yè)邊界上的交點(diǎn)來檢測(cè)裝訂中心線;頁(yè)寬度確定部件,用于確定書本文檔圖像的頁(yè)寬度;和垂直頁(yè)邊界確定部件,用于通過使用頂頁(yè)邊界、底頁(yè)邊界、裝訂中心線和頁(yè)寬度來確定左頁(yè)邊界和右頁(yè)邊界。
9.根據(jù)權(quán)利要求8的裝置,其中,水平頁(yè)邊界檢測(cè)部件還包括 直線段檢測(cè)部件,用于檢測(cè)邊緣圖像上的多條直線段;直線部分選擇部件,用于從所述多條直線段選擇頂頁(yè)邊界和底頁(yè)邊界的直線部分;和彎曲部分檢測(cè)部件,用于基于頂頁(yè)邊界和底頁(yè)邊界的直線部分來檢測(cè)邊緣圖像上的頂頁(yè)邊界和底頁(yè)邊界的彎曲部分。
10.根據(jù)權(quán)利要求9的裝置,其中,在直線段檢測(cè)部件中,執(zhí)行以下的預(yù)處理對(duì)于邊緣圖像的各列,從頂?shù)降讓ふ也⑶覂H保留所遇到的前幾個(gè)邊緣點(diǎn),其中,要求從頂?shù)降讓ふ視r(shí)的各保留的邊緣點(diǎn)在其頂側(cè)具有較暗的顏色并在其底側(cè)具有較亮的顏色,并且對(duì)于邊緣圖像的各列,從底到頂尋找并且僅保留所遇到的前幾個(gè)邊緣點(diǎn),其中,要求從底到頂尋找時(shí)的各保留的邊緣點(diǎn)在其底側(cè)具有較暗的顏色并在其頂側(cè)具有較亮的顏色;其中,在直線段檢測(cè)部件中,通過僅使用從頂?shù)降讓ふ視r(shí)保留的邊緣點(diǎn)和從底到頂尋找時(shí)保留的邊緣點(diǎn),來檢測(cè)所述多條直線段。
11.根據(jù)權(quán)利要求9的裝置,其中,直線部分選擇部件基于以下的選擇準(zhǔn)則來選擇頂頁(yè)邊界和底頁(yè)邊界的直線部分a)在頂側(cè),左頁(yè)的頂頁(yè)邊界的直線段和右頁(yè)的頂頁(yè)邊界的直線段大致處于同一條直線上,并且,在底側(cè),左頁(yè)的底頁(yè)邊界的直線段和右頁(yè)的底頁(yè)邊界的直線段大致處于同一條直 ^^ —t- b)在頂側(cè),在多于一個(gè)的直線段對(duì)滿足準(zhǔn)則a)的情況下,如果上面的直線段對(duì)和下面的直線段對(duì)之間的垂直距離比預(yù)定閾值大,那么選擇上面的直線段對(duì)作為頂頁(yè)邊界的直線部分,否則,選擇下面的直線段對(duì)作為頂頁(yè)邊界的直線部分;在底側(cè),在多于一個(gè)的直線段對(duì)滿足準(zhǔn)則a)的情況下,如果上面的直線段對(duì)和下面的直線段對(duì)之間的垂直距離比預(yù)定閾值大,那么選擇下面的直線段對(duì)作為底頁(yè)邊界的直線部分,否則,選擇上面的直線段對(duì)作為底頁(yè)邊界的直線部分。
12.根據(jù)權(quán)利要求8的裝置,其中,頁(yè)寬度確定部件還包括 從用戶界面獲得書本文檔的寬高比的值的部件;根據(jù)頂頁(yè)邊界和底頁(yè)邊界的直線部分之間的垂直距離來確定書本文檔圖像的頁(yè)高度的部件;和根據(jù)寬高比和頁(yè)高度來計(jì)算頁(yè)寬度的部件。
13.根據(jù)權(quán)利要求8的裝置,其中,頁(yè)寬度確定部件還包括根據(jù)頂頁(yè)邊界和底頁(yè)邊界來檢測(cè)邊緣圖像上的書本文檔圖像的頁(yè)角點(diǎn)的部件;和根據(jù)頁(yè)角點(diǎn)和裝訂中心線來計(jì)算頁(yè)寬度的部件。
14.根據(jù)權(quán)利要求8的裝置,其中,在垂直頁(yè)邊界確定部件中,通過參照裝訂中心線和頁(yè)寬度來確定垂直頁(yè)邊界的水平位置,并且,通過畫出在所確定的水平位置處與水平頁(yè)邊界的直線部分正交的兩條垂直線來確定垂直頁(yè)邊界。
全文摘要
本發(fā)明公開了一種用于檢測(cè)頁(yè)邊界的方法和裝置,其能夠準(zhǔn)確地檢測(cè)全部頁(yè)邊界并應(yīng)對(duì)許多種類的復(fù)雜情況。所述方法包括邊緣圖像檢測(cè)步驟,用于從書本文檔圖像檢測(cè)邊緣圖像;水平頁(yè)邊界檢測(cè)步驟,用于檢測(cè)邊緣圖像上的頂頁(yè)邊界和底頁(yè)邊界;裝訂中心線檢測(cè)步驟,用于通過尋找左頁(yè)和右頁(yè)在頂頁(yè)邊界和底頁(yè)邊界上的交點(diǎn)來檢測(cè)裝訂中心線;頁(yè)寬度確定步驟,用于確定書本文檔圖像的頁(yè)寬度;和垂直頁(yè)邊界確定步驟,用于通過使用頂頁(yè)邊界、底頁(yè)邊界、裝訂中心線和頁(yè)寬度來確定左頁(yè)邊界和右頁(yè)邊界。
文檔編號(hào)H04N1/00GK102196112SQ201010116618
公開日2011年9月21日 申請(qǐng)日期2010年3月1日 優(yōu)先權(quán)日2010年3月1日
發(fā)明者胥立豐 申請(qǐng)人:佳能株式會(huì)社