亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

目標(biāo)完整性檢測(cè)方法及裝置與流程

文檔序號(hào):12472099閱讀:430來(lái)源:國(guó)知局
目標(biāo)完整性檢測(cè)方法及裝置與流程

本發(fā)明涉及圖像處理領(lǐng)域,更具體地涉及一種目標(biāo)完整性檢測(cè)方法和裝置。



背景技術(shù):

隨著圖像處理技術(shù)的不斷發(fā)展和計(jì)算設(shè)備計(jì)算能力的不斷增強(qiáng),越來(lái)越多的應(yīng)用場(chǎng)景需要對(duì)圖像中目標(biāo)的完整性進(jìn)行自動(dòng)檢測(cè)。例如,當(dāng)用戶辦理銀行、通訊等要求實(shí)名認(rèn)證的相關(guān)手續(xù)時(shí),常需要將自己的身份相關(guān)證件的圖像存檔留作記錄。由于存檔的證件圖像日后需要調(diào)用,因此對(duì)圖像的質(zhì)量有要求。其中一項(xiàng)重要要求為圖像中證件的完整性。以身份證為例,通常要求:1.證件在圖像中完整可見,沒(méi)有手指等障礙物遮擋。2.證件不缺角。

現(xiàn)有的圖像中目標(biāo)完整性檢測(cè)方案中,通常是檢測(cè)圖像中目標(biāo)的邊緣并與真實(shí)值比對(duì),以直接確定目標(biāo)是否完整。但是當(dāng)圖像中存在復(fù)雜的背景,特別是存在文字、條紋等干擾時(shí),難以得到諸如證件的目標(biāo)的清晰邊緣,因而無(wú)法準(zhǔn)確判斷是否滿足完整性要求。

以身份證為例,圖1a和圖1b分別示出了現(xiàn)有技術(shù)中的包括身份證的原始圖像以及經(jīng)邊緣檢測(cè)的該圖像。如圖1b所示,身份證的邊緣已經(jīng)與其他背景的邊緣相混淆,因而難以定位圖像中身份證的位置。因此,判斷圖像中身份證是否完整是有困難的。也就是說(shuō),對(duì)于現(xiàn)有的目標(biāo)完整性檢測(cè)方案來(lái)說(shuō),當(dāng)原始圖像中除了目標(biāo)外,還包括復(fù)雜的背景,特別是文字、條紋等干擾時(shí),難以得到目標(biāo)的清晰的真實(shí)邊緣,因此難以準(zhǔn)確檢測(cè)目標(biāo)在圖像中是否完整。



技術(shù)實(shí)現(xiàn)要素:

考慮到上述問(wèn)題而提出了本發(fā)明。本發(fā)明提供了一種目標(biāo)完整性檢測(cè)方法和裝置,通過(guò)基于神經(jīng)網(wǎng)絡(luò)而獲得的熱力圖來(lái)確定目標(biāo)在原始圖像中是否完整,能夠?qū)υ紙D像中的雜亂背景等干擾信號(hào)魯棒。此外,在神經(jīng)網(wǎng)絡(luò)得到熱力圖的前提下,后續(xù)處理只需要幾步相對(duì)簡(jiǎn)單的圖像處理操作,從而提高了整個(gè)方案的易用性。

根據(jù)本發(fā)明一方面,提供了一種目標(biāo)完整性檢測(cè)方法,包括:

將包括目標(biāo)的原始圖像輸入至神經(jīng)網(wǎng)絡(luò),以獲得所述原始圖像的熱力圖,其中所述熱力圖的像素值表示了所述原始圖像中相應(yīng)位置的像素屬于所述目標(biāo)的概率;

根據(jù)所述熱力圖確定所述目標(biāo)在所述原始圖像中的邊緣;以及

根據(jù)所述邊緣確定所述目標(biāo)在所述原始圖像中是否完整。

示例性地,其中所述目標(biāo)的完整拍攝輪廓是四邊形,所述根據(jù)所述邊緣確定所述目標(biāo)在所述原始圖像中是否完整包括:

對(duì)所述邊緣進(jìn)行直線擬合,以獲得表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程;

計(jì)算所述4個(gè)直線方程所表示的直線所圍住的四邊形面積;以及

根據(jù)所述邊緣所圍住的圖形的面積和所述四邊形面積確定所述目標(biāo)在所述原始圖像中是否完整。

示例性地,所述根據(jù)所述邊緣所圍住的圖形的面積和所述四邊形面積確定所述目標(biāo)在所述原始圖像中是否完整包括:

計(jì)算所述邊緣所圍住的圖形的面積與所述四邊形面積的比值,在所述比值大于預(yù)定閾值的情況下,確定所述目標(biāo)在所述原始圖像中是完整的。

示例性地,所述對(duì)所述邊緣進(jìn)行直線擬合,以獲得表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程包括:

確定所述邊緣上的每個(gè)點(diǎn)在所述邊緣上的2個(gè)最近相鄰點(diǎn),并分別計(jì)算該點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量;

根據(jù)所述邊緣上的每個(gè)點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量以及該點(diǎn)的位置對(duì)所述邊緣上的所有點(diǎn)進(jìn)行聚類;以及

確定點(diǎn)最多的4個(gè)類所對(duì)應(yīng)的直線方程,以作為所述表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程。

示例性地,所述聚類采用K均值聚類。

示例性地,所述根據(jù)所述熱力圖確定所述目標(biāo)在所述原始圖像中的邊緣包括:

將所述熱力圖二值化;以及

針對(duì)經(jīng)二值化的熱力圖進(jìn)行邊緣檢測(cè),以獲得所述目標(biāo)在所述原始圖像中的邊緣。

示例性地,所述方法還包括:

利用已經(jīng)標(biāo)注了其中目標(biāo)的訓(xùn)練圖像對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以獲得所述神經(jīng)網(wǎng)絡(luò)。

根據(jù)本發(fā)明另一方面,還提供了一種目標(biāo)完整性檢測(cè)裝置,包括:

熱力圖獲得模塊,用于將包括目標(biāo)的原始圖像輸入至神經(jīng)網(wǎng)絡(luò),以獲得所述原始圖像的熱力圖,其中所述熱力圖的像素值表示了所述原始圖像中相應(yīng)位置的像素屬于所述目標(biāo)的概率;

邊緣確定模塊,用于根據(jù)所述熱力圖確定所述目標(biāo)在所述原始圖像中的邊緣;以及

完整性確定模塊,用于根據(jù)所述邊緣確定所述目標(biāo)在所述原始圖像中是否完整。

示例性地,其中所述目標(biāo)的完整拍攝輪廓是四邊形,所述完整性確定模塊包括:

直線擬合單元,用于對(duì)所述邊緣進(jìn)行直線擬合,以獲得表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程;

完整面積計(jì)算單元,用于計(jì)算所述4個(gè)直線方程所表示的直線所圍住的四邊形面積;以及

完整性確定單元,用于根據(jù)所述邊緣所圍住的圖形的面積和所述四邊形面積確定所述目標(biāo)在所述原始圖像中是否完整。

示例性地,所述完整性確定單元進(jìn)一步用于計(jì)算所述邊緣所圍住的圖形的面積與所述四邊形面積的比值,并且,在所述比值大于預(yù)定閾值的情況下,確定所述目標(biāo)在所述原始圖像中是完整的。

示例性地,所述直線擬合單元包括:

偏移矢量確定子單元,用于確定所述邊緣上的每個(gè)點(diǎn)在所述邊緣上的2個(gè)最近相鄰點(diǎn),并分別計(jì)算該點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量;

聚類子單元,用于根據(jù)所述邊緣上的每個(gè)點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量以及該點(diǎn)的位置對(duì)所述邊緣上的所有點(diǎn)進(jìn)行聚類;以及

直線確定子單元,用于確定點(diǎn)最多的4個(gè)類所對(duì)應(yīng)的直線方程,以作為所述表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程。

示例性地,所述聚類采用K均值聚類。

示例性地,所述邊緣確定模塊包括:

二值化單元,用于將所述熱力圖二值化;以及

邊緣檢測(cè)單元,用于針對(duì)經(jīng)二值化的熱力圖進(jìn)行邊緣檢測(cè),以獲得所述目標(biāo)在所述原始圖像中的邊緣。

示例性地,所述裝置還包括:

訓(xùn)練模塊,用于利用已經(jīng)標(biāo)注了其中目標(biāo)的訓(xùn)練圖像對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以獲得所述神經(jīng)網(wǎng)絡(luò)。

上述方法和裝置在檢測(cè)原始圖像中目標(biāo)的完整性時(shí),能夠?qū)υ紙D像中的雜亂背景等干擾信號(hào)魯棒。此外,在神經(jīng)網(wǎng)絡(luò)得到熱力圖的前提下,后續(xù)處理只需要幾步相對(duì)簡(jiǎn)單的圖像處理操作,從而提高了整個(gè)方案的易用性。

附圖說(shuō)明

通過(guò)結(jié)合附圖對(duì)本發(fā)明實(shí)施例進(jìn)行更詳細(xì)的描述,本發(fā)明的上述以及其它目的、特征和優(yōu)勢(shì)將變得更加明顯。附圖用來(lái)提供對(duì)本發(fā)明實(shí)施例的進(jìn)一步理解,并且構(gòu)成說(shuō)明書的一部分,與本發(fā)明實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中,相同的參考標(biāo)號(hào)通常代表相同或相似部件或步驟。

圖1a和圖1b分別示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的包括身份證的原始圖像以及經(jīng)邊緣檢測(cè)的該圖像;

圖2示出了用于實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的用于目標(biāo)完整性檢測(cè)方法和裝置的示例電子設(shè)備的示意性框圖;

圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法的示意性流程圖;

圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的神經(jīng)網(wǎng)絡(luò)的示意性框圖;

圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的神經(jīng)網(wǎng)絡(luò)所獲得的熱力圖;

圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的經(jīng)二值化的熱力圖;

圖7示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的熱力圖的邊緣檢測(cè)結(jié)果示意圖;

圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的根據(jù)目標(biāo)在原始圖像中的邊緣確定目標(biāo)在原始圖像中是否完整的示意性流程圖;

圖9示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的對(duì)目標(biāo)在原始圖像中的邊緣進(jìn)行直線擬合的示意性流程圖;

圖10示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的擬合目標(biāo)的邊緣所獲得的直線的示意圖;

圖11示出了根據(jù)本發(fā)明另一實(shí)施例的目標(biāo)完整性檢測(cè)方法的示意性流程圖;

圖12示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)裝置的示意性框圖;

圖13示出了根據(jù)本發(fā)明另一實(shí)施例的目標(biāo)完整性檢測(cè)裝置的示意性框圖;

圖14示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的完整性確定模塊的示意性框圖;以及

圖15是根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)設(shè)備的示意性框圖。

具體實(shí)施方式

為了使得本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更為明顯,下面將參照附圖詳細(xì)描述根據(jù)本發(fā)明的示例實(shí)施例。顯然,所描述的實(shí)施例僅僅是本發(fā)明的一部分實(shí)施例,而不是本發(fā)明的全部實(shí)施例,應(yīng)理解,本發(fā)明不受這里描述的示例實(shí)施例的限制。基于本發(fā)明中描述的本發(fā)明實(shí)施例,本領(lǐng)域技術(shù)人員在沒(méi)有付出創(chuàng)造性勞動(dòng)的情況下所得到的所有其它實(shí)施例都應(yīng)落入本發(fā)明的保護(hù)范圍之內(nèi)。

首先,參照?qǐng)D2來(lái)描述用于實(shí)現(xiàn)本發(fā)明實(shí)施例的目標(biāo)完整性檢測(cè)方法和裝置的示例電子設(shè)備200。

如圖2所示,電子設(shè)備200包括一個(gè)或多個(gè)處理器202、一個(gè)或多個(gè)存儲(chǔ)裝置204、輸入裝置206和輸出裝置208,這些組件通過(guò)總線系統(tǒng)210和/或其它形式的連接機(jī)構(gòu)(未示出)互連。應(yīng)當(dāng)注意,圖2所示的電子設(shè)備200的組件和結(jié)構(gòu)只是示例性的,而非限制性的,根據(jù)需要,所述電子設(shè)備也可以具有其他組件和結(jié)構(gòu)。

所述處理器202可以是中央處理單元(CPU)或者具有數(shù)據(jù)處理能力和/或指令執(zhí)行能力的其它形式的處理單元,并且可以控制所述電子設(shè)備200中的其它組件以執(zhí)行期望的功能。

所述存儲(chǔ)裝置204可以包括一個(gè)或多個(gè)計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品可以包括各種形式的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如易失性存儲(chǔ)器和/或非易失性存儲(chǔ)器。所述易失性存儲(chǔ)器例如可以包括隨機(jī)存取存儲(chǔ)器(RAM)和/或高速緩沖存儲(chǔ)器(cache)等。所述非易失性存儲(chǔ)器例如可以包括只讀存儲(chǔ)器(ROM)、硬盤、閃存等。在所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上可以存儲(chǔ)一個(gè)或多個(gè)計(jì)算機(jī)程序指令,處理器202可以運(yùn)行所述程序指令,以實(shí)現(xiàn)下文所述的本發(fā)明實(shí)施例中(由處理器實(shí)現(xiàn))的計(jì)算機(jī)功能以及/或者其它期望的功能。在所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中還可以存儲(chǔ)各種應(yīng)用程序和各種數(shù)據(jù),例如所述應(yīng)用程序使用和/或產(chǎn)生的各種數(shù)據(jù)等。

所述輸入裝置206可以是用來(lái)接收用戶所輸入的指令以及采集數(shù)據(jù)的裝置,并且可以包括鍵盤、鼠標(biāo)、麥克風(fēng)、觸摸屏和圖像采集裝置等中的一個(gè)或多個(gè)。

所述輸出裝置208可以向外部(例如用戶)輸出各種信息(例如圖像或聲音),并且可以包括顯示器、揚(yáng)聲器等中的一個(gè)或多個(gè)。

上述輸入裝置206和輸出裝置208主要用于與用戶交互,電子設(shè)備200也可以不包括二者。

在很多實(shí)際應(yīng)用場(chǎng)景中,需要對(duì)圖像中的目標(biāo)進(jìn)行完整性檢測(cè),即確定目標(biāo)在圖像中是否完整。該目標(biāo)可以包括諸如身份證的各種證件、各種票據(jù)以及各種紙質(zhì)文件等。

下面,將參考圖3描述根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法300。

在步驟S320中,將包括目標(biāo)的原始圖像輸入至神經(jīng)網(wǎng)絡(luò),以獲得該原始圖像的熱力圖。

目標(biāo)可以是期望確定其在圖像中的完整性的任何物體??蛇x地,目標(biāo)的完整拍攝輪廓是封閉的規(guī)則圖形。目標(biāo)的完整拍攝輪廓是指與目標(biāo)在圖像中的完整邊緣相對(duì)應(yīng)的輪廓。對(duì)于三維物體,根據(jù)圖像采集裝置拍攝目標(biāo)的角度不同,目標(biāo)的完整拍攝輪廓也不同。對(duì)于同一類目標(biāo),通常具有相同或類似的完整拍攝輪廓。例如,如果目標(biāo)是證件或票據(jù)等紙件,其完整拍攝輪廓一般是其平面擺放時(shí)所呈現(xiàn)的矩形。具體地,對(duì)于身份證,其完整拍攝輪廓大體是長(zhǎng)度和寬度分別為85.6毫米和54.0毫米的矩形。證件或票據(jù)等紙件的完整拍攝輪廓是封閉的規(guī)則圖形。規(guī)則圖形例如是矩形、三角形、橢圓形、方形、圓形、平行四邊形等??蛇x地,目標(biāo)的完整拍攝輪廓由平滑的線條構(gòu)成。例如,證件或票據(jù)等目標(biāo)的輪廓一般為平滑的直線。

針對(duì)完整拍攝輪廓是封閉的規(guī)則圖形的目標(biāo)實(shí)施本發(fā)明,特別是針對(duì)完整拍攝輪廓由平滑的線條構(gòu)成的目標(biāo)實(shí)施本發(fā)明,可以更好地確保完整性檢測(cè)的準(zhǔn)確性。

原始圖像的熱力圖的每個(gè)像素值表示了原始圖像中相應(yīng)位置的像素屬于待檢測(cè)目標(biāo)的概率。熱力圖可顯性、直觀地將像素屬于待檢測(cè)目標(biāo)的概率通過(guò)不同顏色區(qū)塊呈現(xiàn)??蛇x地,熱力圖是灰度圖。示例性地,熱力圖中的像素值越大,那么原始圖像中相應(yīng)位置的像素屬于待檢測(cè)目標(biāo)的概率越大;否則,反之。熱力圖也可以是彩色圖。例如,像素越趨近于紅色,那么原始圖像中相應(yīng)位置的像素屬于待檢測(cè)目標(biāo)的概率越大;像素越趨近于藍(lán)色,那么原始圖像中相應(yīng)位置的像素屬于待檢測(cè)目標(biāo)的概率越小。

神經(jīng)網(wǎng)絡(luò)是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。神經(jīng)網(wǎng)絡(luò)依靠模型的復(fù)雜程度,通過(guò)調(diào)整神經(jīng)網(wǎng)絡(luò)內(nèi)部大量節(jié)點(diǎn)之間相互連接的關(guān)系,從而達(dá)到處理信息的目的。神經(jīng)網(wǎng)絡(luò)適于處理復(fù)雜的、無(wú)法簡(jiǎn)單地用函數(shù)處理的計(jì)算。而圖像數(shù)據(jù)本身不僅數(shù)據(jù)量大,而且其沒(méi)有簡(jiǎn)單的規(guī)律性,利用神經(jīng)網(wǎng)絡(luò)可以更好地識(shí)別原始圖像中的目標(biāo),生成相應(yīng)的熱力圖。

在此步驟中,將包括目標(biāo)的原始圖像輸入神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)輸出該原始圖像的熱力圖。示例性地,如圖4所示,該神經(jīng)網(wǎng)絡(luò)400例如包括2個(gè)卷積層(第一卷積層和第二卷積層),每個(gè)卷積層可以是16個(gè)通道、并且采用3x3卷積核。示例性地,該神經(jīng)網(wǎng)絡(luò)采用sigmoid函數(shù)作為激活函數(shù)。具體地,如圖4所示,首先,將包括目標(biāo)的原始圖像輸入至神經(jīng)網(wǎng)絡(luò)。然后,將經(jīng)過(guò)第一卷積層(例如,16個(gè)通道、3x3卷積核的卷積層)提取的第一特征數(shù)據(jù)輸入至Sigmoid激活函數(shù),得到第二特征數(shù)據(jù)。再將所述第二特征數(shù)據(jù)輸入至第二卷積層,從而得到該神經(jīng)網(wǎng)絡(luò)400的輸出——該原始圖像的熱力圖。

應(yīng)該理解的是,圖4中所示的神經(jīng)網(wǎng)絡(luò)是示例性的,根據(jù)實(shí)際的應(yīng)用和需求,可以靈活地設(shè)定該神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。

圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的將圖1a所示的原始圖像輸入神經(jīng)網(wǎng)絡(luò)400所獲得的熱力圖。如圖5所示,越可能是目標(biāo)的位置,熱力圖中像素的亮度越大,即像素越白;越不可能是目標(biāo)的位置,對(duì)應(yīng)的熱力圖中像素的亮度越低,即像素越黑。

在步驟S340中,根據(jù)步驟S320所獲得的熱力圖確定目標(biāo)在所述原始圖像中的邊緣。

因?yàn)闊崃D的像素值表示了原始圖像中相應(yīng)位置的像素屬于目標(biāo)的概率,所以,從像素位置的角度來(lái)說(shuō),熱力圖中的邊緣對(duì)應(yīng)于目標(biāo)在原始圖像中的邊緣??梢岳脽崃D的邊緣來(lái)確定目標(biāo)在原始圖像中的邊緣。

在一個(gè)示例中,可直接針對(duì)所述熱力圖做邊緣檢測(cè),以確定目標(biāo)在原始圖像中的邊緣。也就是說(shuō),通過(guò)對(duì)熱力圖做邊緣檢測(cè),可以標(biāo)識(shí)熱力圖中的亮度變化明顯的像素。熱力圖的這些亮度變化明顯的像素標(biāo)識(shí)了目標(biāo)在原始圖像中的邊緣。

在另一個(gè)示例中,可以首先將所述熱力圖進(jìn)行二值化。該二值化的過(guò)程是圖像分割的過(guò)程。經(jīng)二值化的熱力圖將僅包括像素值分別為0和255的像素。圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的經(jīng)二值化的熱力圖。該經(jīng)二值化的熱力圖是針對(duì)圖5所示的熱力圖進(jìn)行二值化所獲得的。示例性地,可以利用基于閾值的分割算法、基于區(qū)域的分割算法等將熱力圖進(jìn)行二值化。如圖6所示,其中白色部分是目標(biāo)部分,黑色部分是背景部分。對(duì)于得到的二值化的熱力圖,可以在圖中尋找連通分量以獲得目標(biāo)所在的色塊。

然后,針對(duì)經(jīng)二值化的熱力圖中得到的色塊提取邊緣進(jìn)行邊緣檢測(cè)。該邊緣檢測(cè)可以采用Laplacian算子、Roberts算子、Sobel算子和Canny算子等。圖7示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的熱力圖的邊緣檢測(cè)結(jié)果。該邊緣檢測(cè)結(jié)果是針對(duì)圖6所示的經(jīng)二值化的熱力圖中得到的色塊提取邊緣進(jìn)行邊緣檢測(cè)所獲得的。

首先對(duì)熱力圖進(jìn)行二值化,然后再進(jìn)行邊緣檢測(cè),能夠獲得目標(biāo)在原始圖像中的、更合理、無(wú)毛刺的邊緣,從而保證目標(biāo)完整性檢測(cè)的準(zhǔn)確性。

在步驟S360中,根據(jù)步驟S340所確定的目標(biāo)在原始圖像中的邊緣確定目標(biāo)在原始圖像中是否完整。目標(biāo)在原始圖像中的邊緣可以大體勾勒出目標(biāo)在原始圖像中的位置以及形態(tài),從而確定目標(biāo)在原始圖像中是否完整。

對(duì)于諸如證件、票據(jù)以及文件等近似平面矩形的物體來(lái)說(shuō),其在原始圖像中的完整邊緣一定是四邊形。如果這類物體在原始圖像中的邊緣不是四邊形,那么可以確定目標(biāo)在原始圖像中是不完整的。例如,假設(shè)在步驟S340中所確定的一個(gè)身份證在原始圖像中的邊緣是五邊形,如圖7所示,那么可以確定目標(biāo)在原始圖像中是缺角的。

上述目標(biāo)完整性檢測(cè)方法300中,通過(guò)基于神經(jīng)網(wǎng)絡(luò)而獲得的熱力圖來(lái)確定目標(biāo)在原始圖像中是否完整,能夠?qū)υ紙D像中的雜亂背景等干擾信號(hào)魯棒。此外,在神經(jīng)網(wǎng)絡(luò)得到熱力圖的前提下,后續(xù)處理只需要幾步相對(duì)簡(jiǎn)單的圖像處理操作,從而提高了整個(gè)方案的易用性。

圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的上述步驟S360的示意性流程圖。該流程主要應(yīng)用于完整拍攝輪廓是四邊形的目標(biāo),例如證件、票據(jù)以及文件等。如圖8所示,根據(jù)步驟S340所確定的目標(biāo)在原始圖像中的邊緣確定目標(biāo)在原始圖像中是否完整可以包括以下步驟。

步驟S862,對(duì)所述邊緣進(jìn)行直線擬合,以獲得表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程??梢酝ㄟ^(guò)該4個(gè)直線方程之間的角度和位置關(guān)系確定并選擇它們之間的4個(gè)交點(diǎn),該4個(gè)交點(diǎn)可以構(gòu)成一個(gè)四邊形的4個(gè)頂點(diǎn)??梢杂眠@4個(gè)交點(diǎn)的坐標(biāo)來(lái)表示這4個(gè)直線方程。

在一個(gè)實(shí)施例中,可以采用對(duì)特定目標(biāo)函數(shù)進(jìn)行優(yōu)化的方式來(lái)獲得該直線方程,例如計(jì)算所述邊緣上的像素點(diǎn)到直線的距離(平方和),使得該距離最小的直線即為擬合直線,也即表示目標(biāo)在原始圖像中的完整拍攝輪廓的直線。

步驟S864,計(jì)算所述4個(gè)直線方程所表示的直線所圍住的四邊形面積。在4個(gè)直線方程是用其4個(gè)交點(diǎn)表示的情況中,這4個(gè)交點(diǎn)構(gòu)成以其為頂點(diǎn)的四邊形,即這些直線方程所對(duì)應(yīng)的直線所圍住的四邊形。然后,計(jì)算這些直線所圍住的四邊形的面積。這些直線所圍住的四邊形的面積可以表示如果目標(biāo)是完整的話,其在原始圖像中應(yīng)占有的面積。該面積可以用直線方程所圍住的四邊形內(nèi)部的像素的個(gè)數(shù)來(lái)表示。

步驟S866,根據(jù)所述邊緣所圍住的圖形的面積和所述四邊形面積確定所述目標(biāo)在所述原始圖像中是否完整。

步驟S340所確定的目標(biāo)在原始圖像中的邊緣如圖7所示,計(jì)算該邊緣所圍住的圖形的面積。該邊緣所圍住的圖形的面積表示了目標(biāo)在原始圖像中實(shí)際占有的面積。該面積也可以用該邊緣所圍住的圖形內(nèi)部的像素的個(gè)數(shù)來(lái)表示。

可選地,可以計(jì)算該邊緣所圍住的圖形的面積與步驟S864所確定的四邊形面積的比值。如果該比值大于預(yù)定閾值,那么可以確定目標(biāo)在原始圖像中是完整的。否則,確定目標(biāo)在原始圖像中是不完整的。該預(yù)定閾值可以根據(jù)應(yīng)用場(chǎng)景來(lái)預(yù)先設(shè)定,例如75%-95%之間的任意值。

上述利用多邊形面積來(lái)確定目標(biāo)在原始圖像中是否完整的方案,實(shí)現(xiàn)容易并且準(zhǔn)確性強(qiáng)。

替代地,除了利用多邊形面積來(lái)確定目標(biāo)在原始圖像中是否完整,還可以通過(guò)如下過(guò)程確定目標(biāo)在原始圖像中是否完整。首先,對(duì)所述邊緣進(jìn)行直線擬合,以獲得表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程。該過(guò)程與上述步驟S862類似,為了簡(jiǎn)潔,不再贅述。然后,根據(jù)該4個(gè)直線方程所確定的四邊形上的像素與所述邊緣上的相應(yīng)像素的位置偏差來(lái)確定目標(biāo)在原始圖像中是否完整。如果該4個(gè)直線方程所確定的四邊形上的像素與所述邊緣上的相應(yīng)像素之間的位置偏差較小,那么確定目標(biāo)在原始圖像中完整。否則,確定目標(biāo)在原始圖像中不完整。

圖9示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的上述步驟S862的示意性流程圖。如圖9所示,步驟S862可以包括以下步驟。

步驟S862a,首先,確定步驟S340所確定的邊緣上的每個(gè)點(diǎn)在所述邊緣上的2個(gè)最近相鄰點(diǎn),然后,分別計(jì)算邊緣上的該點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量??梢岳斫?,根據(jù)邊緣檢測(cè)的方法的不同,邊緣上的每個(gè)點(diǎn)可以是圖像上的像素點(diǎn),也可能不是像素點(diǎn),例如是亞像素點(diǎn)等。以邊緣上的點(diǎn)和其最近相鄰點(diǎn)這兩個(gè)點(diǎn)為端點(diǎn),可以構(gòu)成一個(gè)偏移矢量。該偏移矢量在一定程度上可以表示邊緣在該點(diǎn)的切線的方向。對(duì)于邊緣上的點(diǎn)可以是非像素點(diǎn)的情況,邊緣上的點(diǎn)與其最近相鄰點(diǎn)的偏移矢量與水平線的夾角可能是0度、30度、45度等任意角度。對(duì)于邊緣上的點(diǎn)是像素點(diǎn)的情況,可以首先利用反鋸齒算法來(lái)將邊緣抗鋸齒化,然后再計(jì)算每個(gè)點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量。

步驟S862b,根據(jù)步驟S862a所計(jì)算的邊緣上的每個(gè)點(diǎn)與其在邊緣上的最近相鄰點(diǎn)所構(gòu)成的偏移矢量以及該點(diǎn)的位置對(duì)所述邊緣上的所有點(diǎn)進(jìn)行聚類。

對(duì)于目標(biāo)的邊緣上的每個(gè)點(diǎn)來(lái)說(shuō),其所屬的偏移矢量可以表明邊緣在該點(diǎn)的切線的方向。在原始圖像中,目標(biāo)的邊緣的每條邊彼此方向可能不同。例如,在身份證是目標(biāo)的情況中,身份證的長(zhǎng)邊和其短邊在原始圖像中的方向是一定不同的。在對(duì)邊緣上的點(diǎn)進(jìn)行聚類時(shí),考慮每個(gè)點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量的因素,可以有效地將屬于不同方向的邊上的點(diǎn)分類到不同的類。

當(dāng)然,在原始圖像中,目標(biāo)的邊緣中可能包括方向相同或近似的邊。例如,在目標(biāo)包括身份證的情況中,目標(biāo)在原始圖像中可能呈現(xiàn)了一個(gè)梯形的形狀。此時(shí),梯形中包括兩個(gè)平行的邊。在對(duì)邊緣上的點(diǎn)進(jìn)行聚類時(shí),考慮每個(gè)點(diǎn)的位置的因素,可以有效地將邊緣上的所有點(diǎn)進(jìn)行分類,即使那些點(diǎn)屬于邊緣的相同或相似方向的邊。

例如,可以將邊緣上的所有點(diǎn)分類為k個(gè)類。可選地,根據(jù)實(shí)際應(yīng)用,k可以是4至10之間的任意整數(shù)??蛇x地,該聚類方法采用K均值聚類。K均值聚類方法實(shí)現(xiàn)容易,并且能夠合理的對(duì)偏移矢量進(jìn)行分類,從而保證了目標(biāo)完整性檢測(cè)的準(zhǔn)確性。

步驟S862c,確定點(diǎn)最多的4個(gè)類所對(duì)應(yīng)的直線方程,以作為所述表示所述目標(biāo)在原始圖像中的完整拍攝輪廓的4個(gè)直線方程。點(diǎn)最多的4個(gè)類所對(duì)應(yīng)的直線方程所表示的直線即可示出目標(biāo)在原始圖像中的完整輪廓。圖10示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的所確定的直線方程所表示的直線,該直線是擬合圖7所示的目標(biāo)的邊緣所獲得的。

如前步驟S864和步驟S866所述,根據(jù)這些直線方程所表示的直線所圍住的四邊形面積和邊緣所圍住的圖形的面積,可以確定目標(biāo)在原始圖像中是否完整。因?yàn)榍罢呖梢员硎灸繕?biāo)在原始圖像中完整的情況下所占面積,后者可以表示目標(biāo)在原始圖像中實(shí)際所占面積,所以,二者相差越少,目標(biāo)在原始圖像中越完整。

示例性地,可以計(jì)算直線方程所表示的直線所圍住的四邊形面積和邊緣所圍住的圖形的面積的比值。如果該比值大于預(yù)定閾值,那么可以確定目標(biāo)在原始圖像中是完整的。否則,確定目標(biāo)在原始圖像中是不完整的。

圖11示出了根據(jù)本發(fā)明另一實(shí)施例的目標(biāo)完整性檢測(cè)方法1100的示意性流程圖。如圖11所示,與上述目標(biāo)完整性檢測(cè)方法300相比,目標(biāo)完整性檢測(cè)方法1100增加了步驟S1110。方法1100中的步驟S1120、步驟S1140和步驟S1160分別與方法300中的對(duì)應(yīng)步驟類似,為了簡(jiǎn)潔,在此不再贅述。

在步驟S1110中,利用已經(jīng)標(biāo)注了其中目標(biāo)的訓(xùn)練圖像對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以獲得上述用于獲得熱力圖的神經(jīng)網(wǎng)絡(luò)。

首先,接收已經(jīng)標(biāo)注了其中目標(biāo)的訓(xùn)練圖像。該目標(biāo)包括例如身份證件??梢赃x擇有一些代表性的身份證件圖片,例如完整的身份證件圖片以及不完整的身份證件圖片作為訓(xùn)練圖像。訓(xùn)練圖像中標(biāo)注出了目標(biāo)的部分。所標(biāo)注的部分包括目標(biāo)的內(nèi)部,但不包括目標(biāo)的缺角等缺失部分,即,按照訓(xùn)練圖像中目標(biāo)的實(shí)際形狀進(jìn)行標(biāo)注。該標(biāo)注過(guò)程可以包括但不限于手動(dòng)標(biāo)注。

然后,利用所接收的訓(xùn)練圖像訓(xùn)練初始神經(jīng)網(wǎng)絡(luò),以獲得上述用于獲得熱力圖的神經(jīng)網(wǎng)絡(luò)。

將訓(xùn)練圖像輸入至初始神經(jīng)網(wǎng)絡(luò),以獲得訓(xùn)練圖像的熱力圖。根據(jù)神經(jīng)網(wǎng)絡(luò)獲得的熱力圖和訓(xùn)練圖像上的標(biāo)注目標(biāo),計(jì)算神經(jīng)網(wǎng)絡(luò)的損失函數(shù)值。對(duì)于每個(gè)訓(xùn)練圖像,期望神經(jīng)網(wǎng)絡(luò)獲得的熱力圖和訓(xùn)練圖像上的標(biāo)注目標(biāo)一致。神經(jīng)網(wǎng)絡(luò)獲得的熱力圖和訓(xùn)練圖像上的標(biāo)注目標(biāo)差異越大,那么所計(jì)算的損失函數(shù)值越大,這表明越需要調(diào)整神經(jīng)網(wǎng)絡(luò)的當(dāng)前參數(shù),以獲得更準(zhǔn)確的識(shí)別結(jié)果。不斷調(diào)整神經(jīng)網(wǎng)絡(luò)的參數(shù),直至損失函數(shù)值滿足預(yù)設(shè)條件和/或迭代次數(shù)大于閾值。此時(shí),停止對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練并獲得訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)以用于獲得圖像的熱力圖。

可以將損失函數(shù)值滿足預(yù)設(shè)條件以及迭代次數(shù)小于閾值這兩個(gè)條件中的一個(gè)或二者作為訓(xùn)練執(zhí)行結(jié)束的條件。損失函數(shù)值滿足預(yù)設(shè)條件表示當(dāng)前的神經(jīng)網(wǎng)絡(luò)可以獲得一個(gè)相對(duì)準(zhǔn)確的識(shí)別結(jié)果。增加迭代次數(shù)的約束條件可以使得系統(tǒng)能夠適時(shí)停止運(yùn)算,避免無(wú)謂的計(jì)算,提高計(jì)算效率。

上述目標(biāo)完整性檢測(cè)方法1100利用了訓(xùn)練的方式來(lái)獲得用于獲得熱力圖的神經(jīng)網(wǎng)絡(luò)。這可以獲得可靠性和實(shí)用性更強(qiáng)的神經(jīng)網(wǎng)絡(luò),由此保證目標(biāo)完整性檢測(cè)的準(zhǔn)確性。

圖12示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)裝置1200的示意性框圖。如圖12所示,所述裝置1200可以包括熱力圖獲得模塊1220、邊緣確定模塊1240和完整性確定模塊1260。

熱力圖獲得模塊1220用于將包括目標(biāo)的原始圖像輸入至神經(jīng)網(wǎng)絡(luò),以獲得所述原始圖像的熱力圖,其中所述熱力圖的像素值表示了所述原始圖像中相應(yīng)位置的像素屬于所述目標(biāo)的概率。熱力圖獲得模塊1220可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的步驟S320和步驟S1120。

邊緣確定模塊1240用于根據(jù)所述熱力圖確定所述目標(biāo)在所述原始圖像中的邊緣。邊緣確定模塊1240可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的步驟S340和步驟S1140。

完整性確定模塊1260用于根據(jù)所述邊緣確定所述目標(biāo)在所述原始圖像中是否完整。完整性確定模塊1260可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的步驟S360和步驟S1160。

上述目標(biāo)完整性檢測(cè)裝置1200,在檢測(cè)原始圖像中目標(biāo)的完整性時(shí),能夠?qū)υ紙D像中的雜亂背景等干擾信號(hào)魯棒。此外,在神經(jīng)網(wǎng)絡(luò)得到熱力圖的前提下,后續(xù)處理只需要幾步相對(duì)簡(jiǎn)單的圖像處理操作,從而提高了整個(gè)方案的易用性。

圖13示出了根據(jù)本發(fā)明另一實(shí)施例的目標(biāo)完整性檢測(cè)裝置1300的示意性框圖。如圖13所示,相比于上述裝置1200,裝置1300中還包括訓(xùn)練模塊1310。裝置1300中的熱力圖獲得模塊1320、邊緣確定模塊1340和完整性確定模塊1360分別與裝置1200中的對(duì)應(yīng)模塊類似,為了簡(jiǎn)潔,在此不再贅述。

訓(xùn)練模塊1310用于利用已經(jīng)標(biāo)注了其中目標(biāo)的訓(xùn)練圖像對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以獲得用于獲得原始圖像的熱力圖的神經(jīng)網(wǎng)絡(luò)。

示例性地,所述邊緣確定模塊1240或1340包括二值化單元和邊緣檢測(cè)單元。

二值化單元用于將所述熱力圖二值化。二值化單元可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的熱力圖二值化過(guò)程。

邊緣檢測(cè)單元用于針對(duì)經(jīng)二值化的熱力圖進(jìn)行邊緣檢測(cè),以獲得所述目標(biāo)在所述原始圖像中的邊緣。邊緣檢測(cè)單元可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的經(jīng)二值化的熱力圖邊緣檢測(cè)過(guò)程。

示例性地,所述目標(biāo)的完整拍攝輪廓是四邊形。圖14示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的完整性確定模塊的示意性框圖。所述完整性確定模塊1460包括直線擬合單元1462、完整面積計(jì)算單元1464和完整性確定單元1466。

直線擬合單元1462用于對(duì)所述邊緣進(jìn)行直線擬合,以獲得表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程。直線擬合單元1462可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的步驟S862。

完整面積計(jì)算單元1464用于計(jì)算所述4個(gè)直線方程所表示的直線所圍住的四邊形面積。完整面積計(jì)算單元1464可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的步驟S864。

完整性確定單元1466用于根據(jù)所述邊緣所圍住的圖形的面積和所述四邊形面積確定所述目標(biāo)在所述原始圖像中是否完整。示例性的,完整性確定單元1466進(jìn)一步用于計(jì)算所述邊緣所圍住的圖形的面積與所述四邊形面積的比值。并且,在所述比值大于預(yù)定閾值的情況下,完整性確定單元1466確定所述目標(biāo)在所述原始圖像中是完整的。完整性確定單元1466可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的步驟S866。

示例性地,所述直線擬合單元1462包括偏移矢量確定子單元、聚類子單元和直線確定子單元。

偏移矢量確定子單元用于確定所述邊緣上的每個(gè)點(diǎn)在所述邊緣上的2個(gè)最近相鄰點(diǎn),并分別計(jì)算該點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量。偏移矢量確定子單元可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的步驟S862a。

聚類子單元用于根據(jù)所述邊緣上的每個(gè)點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量以及該點(diǎn)的位置對(duì)所述邊緣上的所有點(diǎn)進(jìn)行聚類。示例性地,所述聚類采用K均值聚類。聚類子單元可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的步驟S862b。

直線確定子單元用于確定點(diǎn)最多的4個(gè)類所對(duì)應(yīng)的直線方程,以作為所述表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程。直線確定子單元可以由圖2所示的電子設(shè)備中的處理器202運(yùn)行存儲(chǔ)裝置204中存儲(chǔ)的程序指令來(lái)實(shí)現(xiàn),并且可以執(zhí)行根據(jù)本發(fā)明一個(gè)實(shí)施例的目標(biāo)完整性檢測(cè)方法中的步驟S862c。

本領(lǐng)域普通技術(shù)人員通過(guò)閱讀上文關(guān)于目標(biāo)完整性檢測(cè)方法的詳細(xì)描述,能夠理解上述目標(biāo)完整性檢測(cè)裝置的結(jié)構(gòu)、實(shí)現(xiàn)以及優(yōu)點(diǎn),因此這里不再贅述。

本領(lǐng)域普通技術(shù)人員可以意識(shí)到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來(lái)實(shí)現(xiàn)。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。

圖15示出了根據(jù)本發(fā)明實(shí)施例的目標(biāo)完整性檢測(cè)設(shè)備1500的示意性框圖。該目標(biāo)完整性檢測(cè)設(shè)備1500可以針對(duì)圖像進(jìn)行目標(biāo)完整性的檢測(cè)。目標(biāo)完整性檢測(cè)設(shè)備1500包括輸入裝置1510、存儲(chǔ)裝置1520、處理器1530以及輸出裝置1540。

所述輸入裝置1510用于接收用戶所輸入的操作指令以及采集數(shù)據(jù)。輸入裝置1510可以包括鍵盤、鼠標(biāo)、麥克風(fēng)、觸摸屏和圖像采集裝置等中的一個(gè)或多個(gè)。

所述存儲(chǔ)裝置1520存儲(chǔ)用于實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的目標(biāo)完整性檢測(cè)方法中的相應(yīng)步驟的程序代碼。

所述處理器1530用于運(yùn)行所述存儲(chǔ)裝置1520中存儲(chǔ)的程序代碼,以執(zhí)行根據(jù)本發(fā)明實(shí)施例的目標(biāo)完整性檢測(cè)方法的相應(yīng)步驟,并且用于實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的目標(biāo)完整性檢測(cè)裝置中的熱力圖獲得模塊1220、邊緣確定模塊1240和完整性確定模塊1260。

在一個(gè)實(shí)施例中,在所述程序代碼被所述處理器1530運(yùn)行時(shí)使所述目標(biāo)完整性檢測(cè)設(shè)備1500執(zhí)行以下步驟:

將包括目標(biāo)的原始圖像輸入至神經(jīng)網(wǎng)絡(luò),以獲得所述原始圖像的熱力圖,其中所述熱力圖的像素值表示了所述原始圖像中相應(yīng)位置的像素屬于所述目標(biāo)的概率;

根據(jù)所述熱力圖確定所述目標(biāo)在所述原始圖像中的邊緣;以及

根據(jù)所述邊緣確定所述目標(biāo)在所述原始圖像中是否完整。

示例性地,所述目標(biāo)的完整拍攝輪廓是四邊形。在所述程序代碼被所述處理器1530運(yùn)行時(shí)使所述目標(biāo)完整性檢測(cè)設(shè)備1500執(zhí)行根據(jù)所述邊緣確定所述目標(biāo)在所述原始圖像中是否完整的步驟包括:

對(duì)所述邊緣進(jìn)行直線擬合,以獲得表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程;

計(jì)算所述4個(gè)直線方程所表示的直線所圍住的四邊形面積;以及

根據(jù)所述邊緣所圍住的圖形的面積和所述四邊形面積確定所述目標(biāo)在所述原始圖像中是否完整。

示例性地,在所述程序代碼被所述處理器1530運(yùn)行時(shí)使所述目標(biāo)完整性檢測(cè)設(shè)備1500執(zhí)行的根據(jù)所述邊緣所圍住的圖形的面積和所述四邊形面積確定所述目標(biāo)在所述原始圖像中是否完整的步驟包括:

計(jì)算所述邊緣所圍住的圖形的面積與所述四邊形面積的比值,在所述比值大于預(yù)定閾值的情況下,確定所述目標(biāo)在所述原始圖像中是完整的。

示例性地,在所述程序代碼被所述處理器1530運(yùn)行時(shí)使所述目標(biāo)完整性檢測(cè)設(shè)備1500執(zhí)行的對(duì)所述邊緣進(jìn)行直線擬合以獲得表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程的步驟包括:

確定所述邊緣上的每個(gè)點(diǎn)在所述邊緣上的2個(gè)最近相鄰點(diǎn),并分別計(jì)算該點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量;

根據(jù)所述邊緣上的每個(gè)點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量以及該點(diǎn)的位置對(duì)所述邊緣上的所有點(diǎn)進(jìn)行聚類;以及

確定點(diǎn)最多的4個(gè)類所對(duì)應(yīng)的直線方程,以作為所述表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程。

示例性地,所述聚類采用K均值聚類。

示例性地,在所述程序代碼被所述處理器1530運(yùn)行時(shí)使所述目標(biāo)完整性檢測(cè)設(shè)備1500執(zhí)行的根據(jù)所述熱力圖確定所述目標(biāo)在所述原始圖像中的邊緣的步驟包括:

將所述熱力圖二值化;以及

針對(duì)經(jīng)二值化的熱力圖進(jìn)行邊緣檢測(cè),以獲得所述目標(biāo)在所述原始圖像中的邊緣。

示例性地,在所述程序代碼被所述處理器1530運(yùn)行時(shí)還使所述目標(biāo)完整性檢測(cè)設(shè)備1500執(zhí)行以下步驟:

利用已經(jīng)標(biāo)注了其中目標(biāo)的訓(xùn)練圖像對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以獲得所述神經(jīng)網(wǎng)絡(luò)。

此外,根據(jù)本發(fā)明實(shí)施例,還提供了一種存儲(chǔ)介質(zhì),在所述存儲(chǔ)介質(zhì)上存儲(chǔ)了程序指令,在所述程序指令被計(jì)算機(jī)或處理器運(yùn)行時(shí)用于執(zhí)行本發(fā)明實(shí)施例的目標(biāo)完整性檢測(cè)方法的相應(yīng)步驟,并且用于實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的目標(biāo)完整性檢測(cè)裝置中的相應(yīng)模塊。所述存儲(chǔ)介質(zhì)例如可以包括智能電話的存儲(chǔ)卡、平板電腦的存儲(chǔ)部件、個(gè)人計(jì)算機(jī)的硬盤、只讀存儲(chǔ)器(ROM)、可擦除可編程只讀存儲(chǔ)器(EPROM)、便攜式緊致盤只讀存儲(chǔ)器(CD-ROM)、USB存儲(chǔ)器、或者上述存儲(chǔ)介質(zhì)的任意組合。所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的任意組合。

在一個(gè)實(shí)施例中,所述計(jì)算機(jī)程序指令被計(jì)算機(jī)或處理器運(yùn)行時(shí),使得所述計(jì)算機(jī)或處理器執(zhí)行以下步驟:

將包括目標(biāo)的原始圖像輸入至神經(jīng)網(wǎng)絡(luò),以獲得所述原始圖像的熱力圖,其中所述熱力圖的像素值表示了所述原始圖像中相應(yīng)位置的像素屬于所述目標(biāo)的概率;

根據(jù)所述熱力圖確定所述目標(biāo)在所述原始圖像中的邊緣;以及

根據(jù)所述邊緣確定所述目標(biāo)在所述原始圖像中是否完整。

示例性地,所述目標(biāo)的完整拍攝輪廓是四邊形。在所述計(jì)算機(jī)程序指令被所述計(jì)算機(jī)或處理器運(yùn)行時(shí)使計(jì)算機(jī)或處理器執(zhí)行的根據(jù)所述邊緣確定所述目標(biāo)在所述原始圖像中是否完整的步驟包括:

對(duì)所述邊緣進(jìn)行直線擬合,以獲得表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程;

計(jì)算所述4個(gè)直線方程所表示的直線所圍住的四邊形面積;以及

根據(jù)所述邊緣所圍住的圖形的面積和所述四邊形面積確定所述目標(biāo)在所述原始圖像中是否完整。

示例性地,在所述計(jì)算機(jī)程序指令被所述計(jì)算機(jī)或處理器運(yùn)行時(shí)使計(jì)算機(jī)或處理器執(zhí)行的根據(jù)所述邊緣所圍住的圖形的面積和所述四邊形面積確定所述目標(biāo)在所述原始圖像中是否完整包括:

計(jì)算所述邊緣所圍住的圖形的面積與所述四邊形面積的比值,在所述比值大于預(yù)定閾值的情況下,確定所述目標(biāo)在所述原始圖像中是完整的。

示例性地,在所述計(jì)算機(jī)程序指令被所述計(jì)算機(jī)或處理器運(yùn)行時(shí)使計(jì)算機(jī)或處理器執(zhí)行的對(duì)所述邊緣進(jìn)行直線擬合以獲得表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程的步驟包括:

確定所述邊緣上的每個(gè)點(diǎn)在所述邊緣上的2個(gè)最近相鄰點(diǎn),并分別計(jì)算該點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量;

根據(jù)所述邊緣上的每個(gè)點(diǎn)與其最近相鄰點(diǎn)所構(gòu)成的偏移矢量以及該點(diǎn)的位置對(duì)所述邊緣上的所有點(diǎn)進(jìn)行聚類;以及

確定點(diǎn)最多的4個(gè)類所對(duì)應(yīng)的直線方程,以作為所述表示所述目標(biāo)在所述原始圖像中的完整拍攝輪廓的4個(gè)直線方程。

示例性地,所述聚類采用K均值聚類。

示例性地,在所述計(jì)算機(jī)程序指令被所述計(jì)算機(jī)或處理器運(yùn)行時(shí)使計(jì)算機(jī)或處理器執(zhí)行的根據(jù)所述熱力圖確定所述目標(biāo)在所述原始圖像中的邊緣的步驟包括:

將所述熱力圖二值化;以及

針對(duì)經(jīng)二值化的熱力圖進(jìn)行邊緣檢測(cè),以獲得所述目標(biāo)在所述原始圖像中的邊緣。

在一個(gè)實(shí)施例中,所述計(jì)算機(jī)程序指令在被計(jì)算機(jī)或處理器運(yùn)行時(shí)還使得所述計(jì)算機(jī)或處理器執(zhí)行以下步驟:

利用已經(jīng)標(biāo)注了其中目標(biāo)的訓(xùn)練圖像對(duì)初始神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以獲得所述神經(jīng)網(wǎng)絡(luò)。

根據(jù)本發(fā)明實(shí)施例的目標(biāo)完整性檢測(cè)設(shè)備中的各模塊可以通過(guò)根據(jù)本發(fā)明實(shí)施例的處理器運(yùn)行在存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)程序指令來(lái)實(shí)現(xiàn),或者可以在根據(jù)本發(fā)明實(shí)施例的計(jì)算機(jī)程序產(chǎn)品的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)的計(jì)算機(jī)指令被計(jì)算機(jī)或處理器運(yùn)行時(shí)實(shí)現(xiàn)。

根據(jù)本發(fā)明實(shí)施例的目標(biāo)完整性檢測(cè)方法及裝置、目標(biāo)完整性檢測(cè)設(shè)備以及存儲(chǔ)介質(zhì),可以針對(duì)圖像進(jìn)行各種目標(biāo)的較準(zhǔn)確完整性檢測(cè)。

盡管這里已經(jīng)參考附圖描述了示例實(shí)施例,應(yīng)理解上述示例實(shí)施例僅僅是示例性的,并且不意圖將本發(fā)明的范圍限制于此。本領(lǐng)域普通技術(shù)人員可以在其中進(jìn)行各種改變和修改,而不偏離本發(fā)明的范圍和精神。所有這些改變和修改意在被包括在所附權(quán)利要求所要求的本發(fā)明的范圍之內(nèi)。

本領(lǐng)域普通技術(shù)人員可以意識(shí)到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來(lái)實(shí)現(xiàn)。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。

在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的設(shè)備實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)設(shè)備,或一些特征可以忽略,或不執(zhí)行。

在此處所提供的說(shuō)明書中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書的理解。

類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本發(fā)明并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該本發(fā)明的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如相應(yīng)的權(quán)利要求書所反映的那樣,其發(fā)明點(diǎn)在于可以用少于某個(gè)公開的單個(gè)實(shí)施例的所有特征的特征來(lái)解決相應(yīng)的技術(shù)問(wèn)題。因此,遵循具體實(shí)施方式的權(quán)利要求書由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。

本領(lǐng)域的技術(shù)人員可以理解,除了特征之間相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。

此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。

本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的目標(biāo)完整性檢測(cè)裝置中的一些模塊的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。

應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。

以上所述,僅為本發(fā)明的具體實(shí)施方式或?qū)唧w實(shí)施方式的說(shuō)明,本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求的保護(hù)范圍為準(zhǔn)。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1