圖像處理裝置和方法
【專利摘要】本公開(kāi)涉及一種圖像處理裝置和方法。根據(jù)本公開(kāi)的圖像處理裝置包括:輸入單元,用于對(duì)圖像中包含的對(duì)象圖像執(zhí)行點(diǎn)擊以獲得點(diǎn)擊點(diǎn);計(jì)算單元,用于計(jì)算所述圖像的邊緣圖;估計(jì)單元,用于基于所述點(diǎn)擊點(diǎn)和所述邊緣圖,估計(jì)所述對(duì)象圖像的顏色模型;對(duì)象分類單元,用于基于所述邊緣圖和所述顏色模型,對(duì)所述圖像中的每個(gè)像素進(jìn)行分類,以獲得所述圖像的二值圖像;以及檢測(cè)單元,用于基于所述二值圖像,檢測(cè)包含所述對(duì)象圖像的區(qū)域。根據(jù)本公開(kāi)的圖像處理裝置和方法,可以提高檢測(cè)對(duì)象圖像的邊界的精度,從而便利于從圖像中去除對(duì)象圖像,使得處理后的圖像更加美觀。
【專利說(shuō)明】圖像處理裝置和方法【技術(shù)領(lǐng)域】
[0001]本公開(kāi)涉及圖像處理的【技術(shù)領(lǐng)域】,具體地涉及用于檢測(cè)諸如手指圖像之類的對(duì)象圖像的邊界的裝置和方法。
【背景技術(shù)】
[0002]這個(gè)部分提供了與本公開(kāi)有關(guān)的背景信息,這不一定是現(xiàn)有技術(shù)。
[0003]當(dāng)例如使用頂置式掃描儀掃描書(shū)本時(shí),用戶會(huì)用手指按住書(shū)本的兩側(cè)來(lái)完成掃描過(guò)程。在校正后的書(shū)本掃描圖像上,手指會(huì)出現(xiàn)在書(shū)本的兩側(cè)邊界上。這使得校正后的圖像很不美觀。因此,有必要去除校正圖像上的手指圖像。
[0004]為了去除手指圖像,通常需要采取兩個(gè)步驟:首先,檢測(cè)出手指區(qū)域;其次,去除手指區(qū)域。顯然,自動(dòng)地檢測(cè)并去除手指區(qū)域是有用的。然而,考慮到書(shū)本內(nèi)容具有各種類型并且手指可能接觸到書(shū)本內(nèi)容,難以準(zhǔn)確地檢測(cè)出手指區(qū)域。
【發(fā)明內(nèi)容】
[0005]這個(gè)部分提供了本公開(kāi)的一般概要,而不是其全部范圍或其全部特征的全面披露。
[0006]本公開(kāi)的目的在于提供一種圖像處理裝置和圖像處理方法,其能夠提高檢測(cè)諸如手指圖像之類的對(duì)象圖像的 邊界的精度,從而便利于從圖像中去除對(duì)象圖像,使得處理后的圖像更加美觀。
[0007]根據(jù)本公開(kāi)的一方面,提供了一種圖像處理裝置,該裝置包括:輸入單元,用于對(duì)圖像中包含的對(duì)象圖像執(zhí)行點(diǎn)擊以獲得點(diǎn)擊點(diǎn);計(jì)算單元,用于計(jì)算所述圖像的邊緣圖;估計(jì)單元,用于基于所述點(diǎn)擊點(diǎn)和所述邊緣圖,估計(jì)所述對(duì)象圖像的顏色模型;對(duì)象分類單元,用于基于所述邊緣圖和所述顏色模型,對(duì)所述圖像中的每個(gè)像素進(jìn)行分類,以獲得所述圖像的二值圖像;以及檢測(cè)單元,用于基于所述二值圖像,檢測(cè)包含所述對(duì)象圖像的區(qū)域。
[0008]根據(jù)本公開(kāi)的另一方面,提供了一種圖像處理方法,該方法包括:對(duì)圖像中包含的對(duì)象圖像執(zhí)行點(diǎn)擊以獲得點(diǎn)擊點(diǎn);計(jì)算所述圖像的邊緣圖;基于所述點(diǎn)擊點(diǎn)和所述邊緣圖,估計(jì)所述對(duì)象圖像的顏色模型;基于所述邊緣圖和所述顏色模型,對(duì)所述圖像中的每個(gè)像素進(jìn)行分類,以獲得所述圖像的二值圖像;以及基于所述二值圖像,檢測(cè)包含所述對(duì)象圖像的區(qū)域。
[0009]根據(jù)本公開(kāi)的另一方面,提供了一種程序產(chǎn)品,該程序產(chǎn)品包括存儲(chǔ)在其中的機(jī)器可讀指令代碼,其中,所述指令代碼當(dāng)由計(jì)算機(jī)讀取和執(zhí)行時(shí),能夠使所述計(jì)算機(jī)執(zhí)行根據(jù)本公開(kāi)的圖像處理方法。
[0010]根據(jù)本公開(kāi)的另一方面,提供了一種機(jī)器可讀存儲(chǔ)介質(zhì),其上攜帶有根據(jù)本公開(kāi)的程序產(chǎn)品。
[0011]根據(jù)本公開(kāi)的圖像處理裝置和方法需要與用戶進(jìn)行交互以獲取關(guān)于點(diǎn)擊點(diǎn)的信息。進(jìn)一步,根據(jù)本公開(kāi)的圖像處理裝置和方法借助于顏色信息和邊緣信息兩者來(lái)檢測(cè)諸如手指圖像之類的對(duì)象圖像的邊界。由此,根據(jù)本公開(kāi)的圖像處理裝置和方法可以提高檢測(cè)對(duì)象圖像的邊界的精度,從而便利于從圖像中去除對(duì)象圖像,使得處理后的圖像更加美觀。
[0012]從在此提供的描述中,進(jìn)一步的適用性區(qū)域?qū)?huì)變得明顯。這個(gè)概要中的描述和特定例子只是為了示意的目的,而不旨在限制本公開(kāi)的范圍。
【專利附圖】
【附圖說(shuō)明】
[0013]在此描述的附圖只是為了所選實(shí)施例的示意的目的而非全部可能的實(shí)施,并且不旨在限制本公開(kāi)的范圍。在附圖中:
[0014]圖1 (a)和圖1 (b)為本公開(kāi)的技術(shù)方案所針對(duì)的圖像的例子的示意圖;
[0015]圖2為根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置的框圖;
[0016]圖3為根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置的應(yīng)用的例子的示意圖;
[0017]圖4為根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置中的計(jì)算單元的框圖;
[0018]圖5為根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置中的估計(jì)單元的框圖;
[0019]圖6 (a)至圖6 (d)為根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置中的估計(jì)單元中的擴(kuò)展區(qū)域獲取單元的應(yīng)用的例子的示意圖;
[0020]圖7為根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置中的檢測(cè)單元的框圖;
[0021]圖8 (a)至圖8 (d)為根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置中的檢測(cè)單元的應(yīng)用的例子的意圖;
[0022]圖9為根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置中的檢測(cè)單元中的膨脹單元的應(yīng)用的例子的意圖;
[0023]圖10為根據(jù)本公開(kāi)的實(shí)施例的圖像處理方法的流程圖;以及
[0024]圖11為其中可以實(shí)現(xiàn)根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置和方法的通用個(gè)人計(jì)算機(jī)的示例性結(jié)構(gòu)的框圖。
[0025]雖然本公開(kāi)容易經(jīng)受各種修改和替換形式,但是其特定實(shí)施例已作為例子在附圖中示出,并且在此詳細(xì)描述。然而應(yīng)當(dāng)理解的是,在此對(duì)特定實(shí)施例的描述并不打算將本公開(kāi)限制到公開(kāi)的具體形式,而是相反地,本公開(kāi)目的是要覆蓋落在本公開(kāi)的精神和范圍之內(nèi)的所有修改、等效和替換。要注意的是,貫穿幾個(gè)附圖,相應(yīng)的標(biāo)號(hào)指示相應(yīng)的部件。
【具體實(shí)施方式】
[0026]現(xiàn)在參考附圖來(lái)更加充分地描述本公開(kāi)的例子。以下描述實(shí)質(zhì)上只是示例性的,而不旨在限制本公開(kāi)、應(yīng)用或用途。
[0027]提供了示例實(shí)施例,以便本公開(kāi)將會(huì)變得詳盡,并且將會(huì)向本領(lǐng)域技術(shù)人員充分地傳達(dá)其范圍。闡述了眾多的特定細(xì)節(jié)如特定部件、裝置和方法的例子,以提供對(duì)本公開(kāi)的實(shí)施例的詳盡理解。對(duì)于本領(lǐng)域技術(shù)人員而言將會(huì)明顯的是,不需要使用特定的細(xì)節(jié),示例實(shí)施例可以用許多不同的形式來(lái)實(shí)施,它們都不應(yīng)當(dāng)被解釋為限制本公開(kāi)的范圍。在某些示例實(shí)施例中,沒(méi)有詳細(xì)地描述眾所周知的過(guò)程、眾所周知的結(jié)構(gòu)和眾所周知的技術(shù)。
[0028]圖1 (a)和圖1 (b)不出了本公開(kāi)的技術(shù)方案所針對(duì)的圖像的例子。當(dāng)例如使用頂置式掃描儀掃描書(shū)本B時(shí),用戶會(huì)用左手LH和右手RH的手指按住書(shū)本的兩側(cè)來(lái)完成掃描過(guò)程,這樣一來(lái)就會(huì)獲得如圖1 (a)所示的圖像??梢允褂帽绢I(lǐng)域已知的方法對(duì)獲得的圖像進(jìn)行校正。例如,可以提取圖像的上下邊界,然后通過(guò)從曲面到平面的變換而得到校正后的圖像。在圖1 (b)中示出了校正后的圖像的例子。如圖1 (b)所示,在校正后的書(shū)本掃描圖像上,手指圖像F會(huì)出現(xiàn)在書(shū)本的兩側(cè)邊界上,并且手指圖像F可能接觸到書(shū)本內(nèi)容T。這使得校正后的圖像很不美觀。因此,有必要去除校正圖像上的手指圖像F。
[0029]為了去除手指圖像F,通常需要采取兩個(gè)步驟:首先,檢測(cè)出手指區(qū)域;其次,去除手指區(qū)域。使用本公開(kāi)的技術(shù)方案,可以提高檢測(cè)出如圖1 (b)所示的手指區(qū)域的精度,從而便利于去除手指區(qū)域,使得校正后的書(shū)本掃描圖像更加美觀。
[0030]如圖2所示,根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置200可以包括輸入單元210、計(jì)算單元220、估計(jì)單元230、對(duì)象分類單元240和檢測(cè)單元250。
[0031]輸入單元210可以點(diǎn)擊圖像中包含的對(duì)象圖像以獲得點(diǎn)擊點(diǎn)。例如,如圖3的左側(cè)所示,在從校正后的圖像中裁剪的包含手指圖像F的圖像I上,輸入單元210可以對(duì)手指圖像F執(zhí)行點(diǎn)擊以獲得點(diǎn)擊點(diǎn)P。這樣一來(lái)就可以明確的是,點(diǎn)擊點(diǎn)P位于手指區(qū)域之內(nèi)。輸入單元210可以是諸如鼠標(biāo)之類的能夠執(zhí)行點(diǎn)擊功能的任何裝置,本公開(kāi)對(duì)此并沒(méi)有特殊限制。
[0032]計(jì)算單元220可以計(jì)算圖像I的邊緣圖。邊緣圖是關(guān)于圖像I的邊緣信息的圖。邊緣信息指示了圖像I上的像素是否是邊緣像素。計(jì)算單元220可以基于圖像I的像素信息和通過(guò)輸入單元210獲得的點(diǎn)擊點(diǎn)P的信息來(lái)計(jì)算邊緣圖,也可以僅基于圖像I的像素信息來(lái)計(jì)算邊緣圖,這一點(diǎn)稍后會(huì)詳細(xì)地描述。
[0033]基于通過(guò)輸入單元210獲得的點(diǎn)擊點(diǎn)P和由計(jì)算單元220計(jì)算的邊緣圖,估計(jì)單元230可以估計(jì)手指圖像(對(duì)象圖像)F的顏色模型。
[0034]進(jìn)一步,基于由計(jì)算單元220計(jì)算的邊緣圖和由估計(jì)單元230估計(jì)的顏色模型,對(duì)象分類單元240可以對(duì)圖像I中的每個(gè)像素進(jìn)行分類,以獲得圖像I的二值圖像。在二值圖像中,圖像I的每個(gè)像素被簡(jiǎn)單地劃分為手指(對(duì)象)像素和非手指(對(duì)象)像素。
[0035]進(jìn)而,基于通過(guò)對(duì)象分類單元240獲得的二值圖像,檢測(cè)單元250可以檢測(cè)包含手指圖像F的區(qū)域。在理想情況下,如圖3的右側(cè)所示,可以獲得用陰影部分表示的手指區(qū)域。
[0036]在根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置200中,在獲得圖像的二值圖像時(shí),既利用了手指圖像的顏色模型又利用了圖像的邊緣圖。進(jìn)一步,在估計(jì)手指圖像的顏色模型時(shí),既利用了點(diǎn)擊點(diǎn)的信息又利用了圖像的邊緣圖。由此可以大大提高手指區(qū)域的檢測(cè)精度,從而便利于從圖像中去除手指圖像,使得處理后的圖像更加美觀。
[0037]為了更好地理解本公開(kāi)的技術(shù)方案,下面針對(duì)圖2所示的圖像處理裝置200的相應(yīng)部件進(jìn)行更加詳細(xì)地描述。
[0038]圖4為根據(jù)本公開(kāi)的實(shí)施例的圖像處理裝置中的計(jì)算單元400的框圖。圖4所示的計(jì)算單元400對(duì)應(yīng)于圖2所示的計(jì)算單元220。
[0039]計(jì)算單元400可以包括距離計(jì)算單元410、距離梯度計(jì)算單元420和邊緣分類單元430。
[0040]距離計(jì)算單元410可以計(jì)算圖像I (參見(jiàn)圖3)中的每個(gè)像素的顏色和點(diǎn)擊點(diǎn)P的顏色之間的距離以獲得距離圖。點(diǎn)擊點(diǎn)P的顏色可以是點(diǎn)擊點(diǎn)P處的像素的顏色,或者可以是包含點(diǎn)擊點(diǎn)P的預(yù)定區(qū)域之內(nèi)的像素的平均顏色。[0041]具體地,假定圖像I的寬度和高度分別為Wtl和Iv點(diǎn)擊點(diǎn)P在圖像I中的坐標(biāo)為(Xclick? yelic;k),并且點(diǎn)擊點(diǎn)P的顏色表不為Color
click (rclick,SclickJ ^click^ °^click'' Sclick
和bdic;k分別是點(diǎn)擊點(diǎn)P的顏色的R值、G值和B值。距離計(jì)算單元410可以通過(guò)以下公式(I)來(lái)計(jì)算圖像I中的每個(gè)像素(Xi, Yi)的顏色colorxi,yi和點(diǎn)擊點(diǎn)P的顏色color?!g的距離disty:
[0042](Iistij j = I colorxijyi_colorclick , I ^ Yi ^ h0, I ^ Xi ^ W0 (I)
[0043]這樣一來(lái),就可以獲得圖像I的距離圖。
[0044]進(jìn)一步,距離梯度計(jì)算單元420可以向通過(guò)距離計(jì)算單元410獲得的距離圖施加梯度算子(例如Sobel算子)以獲得距離梯度圖像GracU。,。計(jì)算梯度圖像的方法在本領(lǐng)域中是眾所周知的,因此本公開(kāi)在此不再詳細(xì)描述。
[0045]進(jìn)而,基于通過(guò)距離梯度計(jì)算單元420獲得的距離梯度圖像Gradeliek,邊緣分類單元430可以將圖像I中的具有大于預(yù)定距離梯度閾值的距離梯度的像素分類為邊緣像素,并且將圖像I中的其它像素分類為非邊緣像素,從而獲得圖像I的邊緣圖。特別地,邊緣分類單元430可以通過(guò)以下公式(2)來(lái)獲得圖像I的邊緣圖:
【權(quán)利要求】
1.一種圖像處理裝置,包括: 輸入單元,用于對(duì)圖像中包含的對(duì)象圖像執(zhí)行點(diǎn)擊以獲得點(diǎn)擊點(diǎn); 計(jì)算單元,用于計(jì)算所述圖像的邊緣圖; 估計(jì)單元,用于基于所述點(diǎn)擊點(diǎn)和所述邊緣圖,估計(jì)所述對(duì)象圖像的顏色模型; 對(duì)象分類單元,用于基于所述邊緣圖和所述顏色模型,對(duì)所述圖像中的每個(gè)像素進(jìn)行分類,以獲得所述圖像的二值圖像;以及 檢測(cè)單元,用于基于所述二值圖像,檢測(cè)包含所述對(duì)象圖像的區(qū)域。
2.根據(jù)權(quán)利要求1所述的裝置,其中,所述計(jì)算單元包括: 距離計(jì)算單元,用于計(jì)算所述圖像中的每個(gè)像素的顏色和所述點(diǎn)擊點(diǎn)的顏色之間的距離以獲得距離圖; 距離梯度計(jì)算單元,用于向所述距離圖施加梯度算子以獲得距離梯度圖像;以及邊緣分類單元,用于將所述圖像中的具有大于預(yù)定距離梯度閾值的距離梯度的像素分類為邊緣像素,并且將所述圖像中的其它像素分類為非邊緣像素。
3.根據(jù)權(quán)利要求1所述的裝 置,其中,所述計(jì)算單元包括: 距離計(jì)算單元,用于計(jì)算所述圖像中的每個(gè)像素的顏色和所述點(diǎn)擊點(diǎn)的顏色之間的距離以獲得距離圖; 距離梯度計(jì)算單元,用于向所述距離圖施加梯度算子以獲得距離梯度圖像; 灰度轉(zhuǎn)換單元,用于將所述圖像從彩色圖像轉(zhuǎn)換成灰度圖像; 亮度梯度計(jì)算單元,用于向所述灰度圖像施加梯度算子以獲得亮度梯度圖像;以及邊緣分類單元,用于將所述圖像中的具有大于預(yù)定距離梯度閾值的距離梯度或者具有大于預(yù)定亮度梯度閾值的亮度梯度的像素分類為邊緣像素,并且將所述圖像中的其它像素分類為非邊緣像素。
4.根據(jù)權(quán)利要求1所述的裝置,其中,所述估計(jì)單元包括: 擴(kuò)展區(qū)域獲取單元,用于基于所述點(diǎn)擊點(diǎn)和所述邊緣圖,獲得包含所述點(diǎn)擊點(diǎn)的擴(kuò)展區(qū)域,所述擴(kuò)展區(qū)域位于所述對(duì)象圖像之內(nèi);以及 顏色模型獲取單元,用于基于所述擴(kuò)展區(qū)域之內(nèi)的每個(gè)像素的顏色,獲得所述對(duì)象圖像的顏色模型。
5.根據(jù)權(quán)利要求4所述的裝置,其中,所述擴(kuò)展區(qū)域獲取單元包括: 設(shè)置單元,用于設(shè)置包含所述點(diǎn)擊點(diǎn)的最大擴(kuò)展區(qū)域; 第一搜索單元,用于從所述點(diǎn)擊點(diǎn)開(kāi)始在水平方向上向左搜索第一個(gè)邊界像素作為所述擴(kuò)展區(qū)域的左側(cè)邊界像素; 第二搜索單元,用于從所述點(diǎn)擊點(diǎn)開(kāi)始在水平方向上向右搜索第一個(gè)邊界像素作為所述擴(kuò)展區(qū)域的右側(cè)邊界像素; 第三搜索單元,用于針對(duì)水平方向上的在所述左側(cè)邊界像素和所述右側(cè)邊界像素之間的每個(gè)基準(zhǔn)像素,從所述基準(zhǔn)像素開(kāi)始在垂直方向上向上搜索第一個(gè)邊界像素作為所述擴(kuò)展區(qū)域的上側(cè)邊界像素;以及 第四搜索單元,用于從所述基準(zhǔn)像素開(kāi)始在垂直方向上向下搜索第一個(gè)邊界像素作為所述擴(kuò)展區(qū)域的下側(cè)邊界像素,其中, 所述擴(kuò)展區(qū)域獲取單元以所述最大擴(kuò)展區(qū)域之內(nèi)的每個(gè)像素為中心設(shè)置滑動(dòng)窗口,對(duì)所述滑動(dòng)窗口中的邊緣像素的數(shù)目進(jìn)行計(jì)數(shù),并且將滿足所述滑動(dòng)窗口中的邊緣像素的數(shù)目大于預(yù)定閾值這一條件的像素定義為所述邊界像素。
6.根據(jù)權(quán)利要求1所述的裝置,其中,所述對(duì)象分類單元將所述圖像中的作為所述邊緣圖中的非邊緣像素并且與所述顏色模型的距離小于顏色閾值的像素分類為對(duì)象像素,并且將所述圖像中的其它像素分類為非對(duì)象像素。
7.根據(jù)權(quán)利要求1所述的裝置,其中,所述檢測(cè)單元包括:噪聲去除單元,用于去除所述二值圖像中的噪聲部分。
8.根據(jù)權(quán)利要求7所述的裝置,其中,所述噪聲去除單元包括: 連通域分析單元,用于對(duì)所述二值圖像執(zhí)行連通域分析算法,以獲得所述二值圖像中的連通域,所述連通域中的像素均為對(duì)象像素;以及 像素轉(zhuǎn)換單元,用于如果所述連通域滿足以下條件中的任何一個(gè),則將所述連通域中的對(duì)象像素全部轉(zhuǎn)換為非對(duì)象像素: 所述連通域的面積小于預(yù)定面積; 所述連通域的寬高比大于預(yù)定比率; 所述對(duì)象圖像位于所述圖像的左側(cè),并且所述連通域的左側(cè)邊界與所述圖像的左側(cè)邊界之間的距離大于預(yù)定閾值;或者 所述對(duì)象圖像位于所述圖像的右側(cè),并且所述連通域的右側(cè)邊界與所述圖像的右側(cè)邊界之間的距離大于預(yù)定閾值。
9.根據(jù)權(quán)利要求8所述的裝置,其中,所述檢測(cè)單元進(jìn)一步包括: 連通域處理單元,用于根據(jù)所述點(diǎn)擊點(diǎn)獲得所述點(diǎn)擊點(diǎn)所在的連通域,并在垂直方向上搜索附近的連通域;以及 填充單元,用于對(duì)包含所述點(diǎn)擊點(diǎn)的連通域與搜索到的連通域進(jìn)行填充操作,以得到填充連通域。
10.一種圖像處理方法,包括: 對(duì)圖像中包含的對(duì)象圖像執(zhí)行點(diǎn)擊以獲得點(diǎn)擊點(diǎn); 計(jì)算所述圖像的邊緣圖; 基于所述點(diǎn)擊點(diǎn)和所述邊緣圖,估計(jì)所述對(duì)象圖像的顏色模型; 基于所述邊緣圖和 所述顏色模型,對(duì)所述圖像中的每個(gè)像素進(jìn)行分類,以獲得所述圖像的二值圖像;以及 基于所述二值圖像,檢測(cè)包含所述對(duì)象圖像的區(qū)域。
【文檔編號(hào)】G06T7/00GK103971361SQ201310048270
【公開(kāi)日】2014年8月6日 申請(qǐng)日期:2013年2月6日 優(yōu)先權(quán)日:2013年2月6日
【發(fā)明者】謝術(shù)富, 何源, 孫俊 申請(qǐng)人:富士通株式會(huì)社