亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

物體檢測方法和物體檢測裝置與流程

文檔序號:12006410閱讀:168來源:國知局
物體檢測方法和物體檢測裝置與流程
本發(fā)明涉及一種用于在執(zhí)行高速檢測處理的同時保持精確度的方法以及一種物體檢測裝置。

背景技術(shù):
作為從圖像中檢測目標(biāo)的傳統(tǒng)方法之一,有這樣一種方法,該方法包括:利用預(yù)先學(xué)習(xí)的模型執(zhí)行檢測處理;基于檢測結(jié)果限制進(jìn)行目標(biāo)搜索的層的范圍;然后基于更準(zhǔn)確的模型執(zhí)行檢測處理。日本專利申請JP4498296討論了這樣一種方法,該方法包括:在分層圖像上執(zhí)行第一檢測;然后針對下一個輸入圖像僅在從第一檢測中檢測出的相同的分層圖像上執(zhí)行第二檢測。但是,根據(jù)日本專利申請JP4498296討論的方法,被搜索的層僅限于同一層,但是對于下一個輸入圖像同一層并不總是具有最高的被檢測的可能性。另外,如果在第一檢測和第二檢測中使用了不同的模型,那么很可能檢測到的目標(biāo)中的層并不總是在第一檢測和第二檢測中的同一層,因此導(dǎo)致了這樣的問題:整體上的檢測精確度被降低了。

技術(shù)實現(xiàn)要素:
本發(fā)明的一個方面提供了一種物體檢測方法,其包括:圖像的圖像獲取步驟,其獲取包括目標(biāo)物體;分層圖像生成步驟,其通過以多個不同的比例尺放大和/或縮小所述圖像而生成多個分層圖像;第一檢測步驟,其從每個所述分層圖像檢測目標(biāo)物體的至少一部分區(qū)域作為第一檢測區(qū)域;選擇步驟,其基于檢測到的第一檢測區(qū)域和預(yù)先學(xué)習(xí)的學(xué)習(xí)數(shù)據(jù)選擇所述分層圖像的至少一層;第二檢測步驟,其檢測在選擇步驟中選擇的分層圖像中的目標(biāo)物體的至少一部分區(qū)域作為第二檢測區(qū)域;以及合成步驟,其將在第一檢測步驟中檢測到的檢測結(jié)果和在第二檢測步驟中檢測到的檢測結(jié)果合成。根據(jù)本發(fā)明的示例性實施方式,可以加快整個處理而同時保持監(jiān)測的精確度。根據(jù)下述示例性實施例的詳細(xì)描述并結(jié)合附圖,本發(fā)明的其他特征及各方面將顯而易見。附圖說明附圖包含在說明書中并構(gòu)成說明書的一部分,附圖描述了本發(fā)明的示例性實施方式、特征和各方面,并和說明書一起用于解釋本發(fā)明的原理。圖1展示了本發(fā)明的第一示例性實施方式的物體檢測裝置的配置。圖2展示了本發(fā)明的第一示例性實施方式的物體檢測方法的一個處理步驟。圖3展示了本發(fā)明的第一示例性實施方式的物體檢測方法的一個處理步驟。圖4展示了本發(fā)明的第一示例性實施方式的物體檢測方法的一個處理步驟。圖5展示了本發(fā)明的第一示例性實施方式的物體檢測方法的一個處理步驟。圖6展示了本發(fā)明的第一示例性實施方式的物體檢測方法的一個處理步驟。圖7是流程圖,展示了本發(fā)明的第一示例性實施方式的物體檢測方法的處理步驟。圖8展示了本發(fā)明的第二示例性實施方式的物體檢測裝置的配置。圖9展示了本發(fā)明的第二示例性實施方式的物體檢測方法的一個處理步驟。圖10展示了本發(fā)明的第二示例性實施方式的物體檢測方法的一個處理步驟。圖11展示了本發(fā)明的第二示例性實施方式的物體檢測方法的一個處理步驟。圖12展示了本發(fā)明的第二示例性實施方式的物體檢測方法的一個處理步驟。圖13展示了本發(fā)明的第二示例性實施方式的物體檢測方法的一個處理步驟。圖14展示了本發(fā)明的第二示例性實施方式的物體檢測方法的一個處理步驟。圖15展示了本發(fā)明的第三示例性實施方式的物體檢測裝置的配置。圖16展示了本發(fā)明的第三示例性實施方式的物體檢測方法的一個處理步驟。具體實施方式以下將結(jié)合附圖詳細(xì)描述本發(fā)明的各種示例性實施方式、特征以及各方面。本發(fā)明的第一示例性實施方式的物體檢測方法是用于穩(wěn)定地檢測存在于圖像中的目標(biāo)的方法。圖像獲取單元可以利用使用照相機(jī)、視頻照相機(jī)或網(wǎng)絡(luò)照相機(jī)捕捉的圖像,或者利用預(yù)先捕捉并存儲的圖像。下面根據(jù)下述例子來描述本示例性實施方式:所述例子捕捉包括人的圖像,并檢測用戶希望從獲取的圖像中檢測的人。在本示例性實施方式中,檢測目標(biāo)是人,但不限于此。例如,本發(fā)明也可用于檢測動物或植物等。圖1展示了本示例性實施方式的物體檢測裝置100的輪廓。如圖1所示,本示例性實施方式的物體檢測裝置100包括圖像獲取單元101、特征量生成單元102、第一檢測單元103、第一估計單元104、層限制單元105、第二檢測單元106、第二估計單元107以及合成單元108。圖像獲取單元101從照相機(jī)或者從預(yù)先捕捉的圖像中獲取圖像。然后獲取的圖像被發(fā)送至特征量生成單元102。特征量生成單元102通過以圖2所示的預(yù)定比例尺放大/縮小圖像獲取單元101獲取的圖像生成分層圖像201,并為每個分層圖像生成一個特征量。這里,術(shù)語“分層圖像”是指通過以預(yù)定比例尺放大/縮小圖像生成的圖像。生成的特征量可以是梯度方向直方圖(HOG)特征量、類哈爾(Haar-like)特征量、色彩特征量或者通過將上述特征量合成而生成的圖像。生成的層特征量被輸入至第一檢測單元103和層限制單元105。第一檢測單元103執(zhí)行對每個分層圖像201的特征量進(jìn)行檢測處理,所述特征量201由特征量生成單元102生成。如圖3所示,在本示例性實施方式中,第一檢測單元103基于分層圖像302的特征量檢測人的頭部周圍區(qū)域,所述分層圖像302是分層圖像201的其中之一。這里所說的術(shù)語“頭部周圍區(qū)域”用于表示不僅包括人的頭部、甚至還包括肩膀的區(qū)域。檢測目標(biāo)不限于人的頭部周圍區(qū)域,也可以是胳膊、軀干、腿等。另外,在本示例性實施方式中,檢測處理是在單個圖像層上執(zhí)行的,但是也可以在更多或者所有分層圖像上執(zhí)行。作為檢測物體的方法,可利用已知的技術(shù)執(zhí)行檢測處理,例如《HOG+超向量機(jī)》(SuperVectorMachine,SVM)(引用文獻(xiàn):《人體檢測的梯度方向直方圖(HistogramsofOrientedGradientsforHumanDetection)》,作者N.Dalal,發(fā)表于2005年的《計算機(jī)視覺與模式識別》(CVPR))、《隱式形狀模型》(ISM)(《利用隱式形狀模型分類和分割組合對象(CombinedObjectCategorizationandSegmentationwithanImplicitShapeModel)》,作者B.Leibe,發(fā)表于2004年的“計算機(jī)視覺歐洲大會”(ECCV))或《隱生超向量機(jī)》(Latent-SVM)(《ObjectDetectionwithDiscriminativelyTrainedPartBasedModels》,作者P.Felzenszwalb、R.Girshick、D.McAllester、D.Ramanan,發(fā)表于電氣及電子工程師學(xué)會的《模式分析及機(jī)器智能》(PAMI),2010年第9期第32卷)。第一檢測單元103檢測分層圖像302的特征量的結(jié)果303,所述分層圖像302是分層圖像201的其中之一。另外,第一檢測單元103也可以執(zhí)行檢測處理,用于檢測由圖像獲取單元101獲取的圖像上的目標(biāo)物體的區(qū)域。在此情況下,第一檢測單元103可利用已知的技術(shù)執(zhí)行檢測處理,例如模式匹配。由第一檢測單元103檢測到的頭部周圍區(qū)域的檢測結(jié)果303被發(fā)送給第一估計單元104。第一估計單元104利用從第一檢測單元103獲取的檢測結(jié)果303估計特定部分區(qū)域。在本示例性實施方式中,第一估計單元104估計頭部區(qū)域作為特定部分區(qū)域。正如下文所述,術(shù)語“頭部區(qū)域”僅用于表示頭部,而上面描述的頭部周圍區(qū)域是指不僅包括頭部、甚至還包括肩膀的區(qū)域。在本示例性實施方式中,第一檢測單元103檢測頭部周圍區(qū)域,而第一估計單元104僅估計頭部區(qū)域。但是,不用說,如果第一檢測單元103檢測到了頭部周圍區(qū)域以外的區(qū)域,那么第一估計單元104估計的區(qū)域就不再是頭部區(qū)域了。下文將描述用于估計頭部區(qū)域的方法。作為估計頭部區(qū)域的方法,可以利用頭部周圍區(qū)域的檢測結(jié)果303的位置坐標(biāo),根據(jù)下列等式(1)計算出頭部區(qū)域:在等式(1)中,x1和y1代表檢測結(jié)果303的左上角的坐標(biāo),x2和y2代表檢測結(jié)果303的右下角的坐標(biāo)。在等式(1)中,“A”代表以矩陣形式表達(dá)的檢測結(jié)果,所述矩陣由包括從頭部到肩膀的區(qū)域的根濾波器以及多個各自代表根濾波器的一部分的部分濾波器3031-3034組成。另外,在檢測結(jié)果被轉(zhuǎn)換成矩陣形式時,能夠計算出每個部分濾波器3031-3034的中心坐標(biāo)以及被檢測位置處的檢測結(jié)果303的中心坐標(biāo)之間的差值。作為差值的坐標(biāo)的橫坐標(biāo)由檢測結(jié)果303的寬度w標(biāo)準(zhǔn)化,縱坐標(biāo)由檢測結(jié)果303的高度h標(biāo)準(zhǔn)化。各個部分濾波器3031-3034的標(biāo)準(zhǔn)化后的中心坐標(biāo)x,y以矩陣形式表示(行包括一個檢測結(jié)果的每個部分濾波器的標(biāo)準(zhǔn)化后的坐標(biāo),列包括每個檢測結(jié)果)。也就是等式(1)中的“A”。在等式(1)中,“p”代表基于通過對學(xué)習(xí)數(shù)據(jù)以及頭部的實際尺寸執(zhí)行檢測處理而得到的檢測結(jié)果由用于頭部區(qū)域的尺寸的線性預(yù)測的各種系數(shù)(與標(biāo)準(zhǔn)化后的各個部分濾波器的中心坐標(biāo)相乘的一系列系數(shù))組成的矢量。術(shù)語“學(xué)習(xí)數(shù)據(jù)”是指一組圖像,每張圖像都顯示預(yù)先準(zhǔn)備的人的圖像。如圖3所示,第一估計單元104估計頭部檢測結(jié)果303中的頭部區(qū)域,然后可以獲取估計結(jié)果304。作為估計結(jié)果的頭部區(qū)域304被輸出至層限制單元105以及合成單元108?;谔卣髁可蓡卧?02生成的特征量以及由第一估計單元104估計的頭部區(qū)域304,層限制單元105判定第二檢測單元106將執(zhí)行檢測處理的層。作為判定方法,層限制單元105利用等式(2)計算所述層。圖4展示了作為檢測結(jié)果的直方圖的分布圖表405,在所述檢測結(jié)果中,關(guān)于上述學(xué)習(xí)數(shù)據(jù),橫軸對應(yīng)于第一檢測單元103的檢測結(jié)果的層,縱軸對應(yīng)于第二檢測單元106檢測到的層。另外,圖4展示了作為檢測結(jié)果的直方圖的分布圖表406,在所述檢測結(jié)果中,關(guān)于上述學(xué)習(xí)數(shù)據(jù),橫軸對應(yīng)于第一估計單元104估計的頭部區(qū)域的寬度尺寸中的線性預(yù)測估計的層,縱軸對應(yīng)于第二檢測單元106檢測到的結(jié)果的層。如圖4所示,基于頭部區(qū)域的尺寸顯示適合檢測的層的分布??梢源_定,利用頭部區(qū)域估計結(jié)果層的分布在圖表中被限制了。根據(jù)上述確定的內(nèi)容,基于從學(xué)習(xí)數(shù)據(jù)中獲取的分布圖表406,利用最小平方法能夠計算出系數(shù)coeff。在等式(2)中,“A”代表通過求學(xué)習(xí)數(shù)據(jù)中的頭部區(qū)域的尺寸的對數(shù)得到的結(jié)果組成的矩陣,“B”代表由第二檢測單元106的檢測結(jié)果中的層組成的矩陣。利用計算出的系數(shù)coeff,根據(jù)等式(3)可確定層。層=coeff1*log(寬度)+coeff2*log(高度)+coeff3(3)在等式(3)中,“寬度”代表頭部區(qū)域的寬度,“高度”代表頭部區(qū)域的高度。僅對分層圖像507的特征量執(zhí)行檢測處理,分層圖像507的特征量與從等式(3)獲得的層一致或最接近。不對層509的特征量執(zhí)行檢測處理,層509是不同于分層圖像507的層。被限制的分層圖像507被輸出至第二檢測單元106?;谔卣髁可蓡卧?02和層限制單元105,第二檢測單元106僅對被限制的分層圖像507的特征量執(zhí)行檢測處理。本示例性實施方式檢測人的整個身體。更不用說,由第二檢測單元106檢測的目標(biāo)不限于人的整個身體。作為檢測處理方法,通過滑動模型508的窗口在各個位置處執(zhí)行檢測處理,所述模型508已經(jīng)通過學(xué)習(xí)方法被預(yù)先學(xué)習(xí)過,例如SVM或增強(qiáng)法。如圖6所示,通過檢測處理獲取檢測結(jié)果610-612。獲取的檢測結(jié)果610-612被輸出至第二估計單元107。第二估計單元107估計第二檢測單元106獲取的、以矩形區(qū)域的形式表示的各個檢測結(jié)果610-612中的特定部分區(qū)域。在本示例性實施方式中,第二估計單元107估計頭部區(qū)域作為特定部分。更不用說,由第二估計單元107估計的特定部分不限于頭部區(qū)域,也可以是和第一估計單元104估計的區(qū)域相同的區(qū)域。這是因為合成單元108(下文將描述)能夠?qū)⒌谝还烙媶卧?04估計的區(qū)域和第二估計單元107估計的區(qū)域合成。作為估計的方法,可以通過第一估計單元104利用等式(1)計算出特定部分區(qū)域。如圖6所示,以計算出的矩形區(qū)域表示的頭部區(qū)域620-622被輸出至合成單元108。合成單元108將第一估計單元104獲取的頭部區(qū)域203以及第二估計單元107獲取的頭部區(qū)域620-622合成,然后輸出最終的檢測結(jié)果。作為合成方法,合成單元108計算頭部區(qū)域203和各個頭部區(qū)域620-622之間的重合度,然后選擇具有最高重合度的頭部區(qū)域作為從其中檢測相同目標(biāo)的幀。如圖6所示,頭部區(qū)域203和頭部區(qū)域620具有最高重合度,因此選擇這兩個檢測結(jié)果作為一個組合,然后檢測結(jié)果610被作為最終檢測結(jié)果輸出。檢測結(jié)果611-612被判定為錯誤檢測,因此不會被輸出。本示例性實施方式的配置方式就是這樣。下面,結(jié)合圖7所示的流程圖描述本示例性實施方式的物體檢測裝置100執(zhí)行的處理。本流程圖的程序代碼被存儲在未示出的存儲器中,例如隨機(jī)存取存儲器(RAM)或只讀存儲器(ROM),并由未示出的中央處理單元(CPU)等讀取、執(zhí)行。在步驟S100中,開始整個處理。首先,處理推進(jìn)至步驟S101,在該步驟中圖像獲取單元101從照相機(jī)或圖像文件中等獲取圖像。獲取到的圖像被發(fā)送至特征量生成單元102。然后,處理推進(jìn)至步驟S102。在步驟S102中,通過對圖像獲取單元101獲取的圖像執(zhí)行圖像放大/縮小處理,特征量生成單元102生成分層圖像201,并生成各分層圖像的特征量。生成的特征量可以是HOG特征量、類哈爾特征量或色彩特征量。作為上述處理的結(jié)果,可以獲得層特征量。生成的特征量被輸出至第一檢測單元103以及層限制單元105。然后,處理推進(jìn)至步驟S103。在步驟S103中,第一檢測單元103執(zhí)行檢測處理。第一檢測單元103對分層圖像302的特征量執(zhí)行檢測處理,所述特征量是分層圖像201的特征量之一。另外,第一檢測單元103可對分層圖像201的生成的特征量執(zhí)行檢測處理,或例如通過模式匹配對圖像獲取單元101獲取的圖像執(zhí)行檢測處理。作為檢測方法,第一檢測單元103利用已知的技術(shù),例如HOG+SVM或ISM。另外在本示例性實施方式中,第一檢測單元103檢測人的頭部區(qū)域。但是,本發(fā)明不限于此。經(jīng)過檢測處理獲得的檢測結(jié)果303被輸出至第一估計單元104。然后,處理推進(jìn)至步驟S104。在步驟S104中,判定是否可以獲得第一檢測結(jié)果。如果沒有檢測結(jié)果(在步驟S104中為“否”),那么處理結(jié)束。如果有檢測結(jié)果(在步驟S104中為“是”),那么處理推進(jìn)至步驟S105。在步驟S105中,第一估計單元104從第一檢測單元103獲取的檢測結(jié)果303中估計特定部分區(qū)域。在本示例性實施方式中,第一估計單元104估計頭部區(qū)域作為特定部分。但是在本發(fā)明中,特定部分區(qū)域不限于頭部區(qū)域。第一估計單元104利用等式(1)估計檢測結(jié)果303中的頭部區(qū)域304。完成整個頭部區(qū)域估計處理后,獲取的頭部區(qū)域304被輸出至層限制單元105和合成單元108。然后,處理推進(jìn)至步驟S106。在步驟S106中,層限制單元105限制這樣的層:在該層上,利用第一估計單元104估計的頭部區(qū)域304,第二檢測單元106將對特征量生成單元102生成的特征量執(zhí)行檢測處理。作為限制層的方法,層限制單元105利用等式(2)計算系數(shù),同時通過合成第一估計單元104和第二估計單元107獲取的結(jié)果設(shè)置最終結(jié)果,作為學(xué)習(xí)數(shù)據(jù),并根據(jù)等式(3)計算頭部區(qū)域的線性預(yù)測中的層和所述系數(shù)。這樣就有可能確定最適合于第二檢測單元106執(zhí)行檢測處理的層的特征量。如圖5所示,根據(jù)確定的層將被執(zhí)行檢測處理的分層圖像507的特征量和未被執(zhí)行檢測處理的分層圖像509的特征量分離。然后,處理推進(jìn)至步驟S107。在步驟S107中,第二檢測單元106執(zhí)行檢測處理。作為檢測方法,通過滑動模型508的窗口在各個位置處執(zhí)行檢測處理,所述模型508已經(jīng)通過學(xué)習(xí)方法被預(yù)先學(xué)習(xí)過,例如SVM或增強(qiáng)法。另外,在本示例性實施方式中,所述模型檢測人的整個身體,但本發(fā)明不限于人的整個身體。如圖6所示,經(jīng)過第二檢測單元106的檢測處理后,獲取檢測結(jié)果610-612。檢測結(jié)果610-612被輸出至第二估計單元107。然后,處理推進(jìn)至步驟S108。在步驟S108中,第二估計單元107從第二檢測單元106獲取的檢測結(jié)果610-612中的每一個估計特定部分。在本示例性實施方式中,第二估計單元107估計頭部區(qū)域作為特定部分,但是本發(fā)明不限于此。作為估計頭部區(qū)域的方法,第二估計單元107通過第一估計單元104利用等式(1)執(zhí)行估計。如圖6所示,由第二估計單元107估計的頭部區(qū)域估計結(jié)果610-612被獲取。獲取的頭部區(qū)域估計結(jié)果610-612被輸出至合成單元108。然后,處理推進(jìn)至步驟S109。在步驟S109中,合成單元108將第一估計單元104估計的頭部區(qū)域203和第二估計單元107估計的頭部區(qū)域620-622合成。作為合成處理方法,合成單元108計算頭部區(qū)域203和頭部區(qū)域620-622中的每一個之間的重合度,然后選擇具有最高重合度的合成結(jié)果作為從其中檢測相同目標(biāo)的頭部幀。如圖6所示,頭部區(qū)域203和頭部區(qū)域620具有最高重合度,因此選擇這兩個檢測幀作為一個組合,然后檢測結(jié)果610被作為最終檢測結(jié)果輸出。另外,檢測結(jié)果611-612被合成單元108作為虛假檢測處理。然后,整個處理結(jié)束。圖8展示了本發(fā)明第二示例性實施方式的物體檢測裝置800的輪廓。如圖8所示,物體檢測裝置800包括圖像獲取單元801、特征量生成單元802、具有多個檢測模型的第一檢測單元803、第一估計單元804、層限制單元805、具有多個檢測模型的第二檢測單元806、第二估計單元807以及合成單元808。圖像獲取單元801從照相機(jī)或者從預(yù)先捕捉的圖像中獲取圖像901。然后獲取的圖像901被發(fā)送至特征量生成單元802。特征量生成單元802通過以圖10所示的預(yù)定比例尺放大/縮小圖像獲取單元801獲取的圖像901生成分層圖像1002,并為分層圖像1002的每層生成一個特征量。生成的特征量可以是HOG特征量、類哈爾(Haar-like)特征量或色彩特征量。生成的層特征量被輸入至第一檢測單元803和層限制單元805。第一檢測單元803對特征量執(zhí)行檢測處理。如圖10所示,第一檢測單元803具有多個人的頭部區(qū)域作為模型,并通過滑動每個模型的窗口在每個位置處對分層圖像1001的特征量執(zhí)行檢測處理,從而檢測目標(biāo)物體的區(qū)域。在本示例性實施方式中,第一檢測單元803檢測人的頭部周圍區(qū)域。這里所說的術(shù)語“頭部周圍區(qū)域”用于表示不僅包括人的頭部、甚至還包括肩膀的區(qū)域。檢測目標(biāo)不限于人的頭部周圍區(qū)域,也可以是胳膊、軀干、腿等。利用在第一示例性實施方式中描述的已知技術(shù)檢測頭部區(qū)域。第一檢測單元803檢測分層圖像1001的特征量中的結(jié)果1104-1106。檢測結(jié)果1104-1106被發(fā)送至第一估計單元804。第一估計單元804基于第一檢測單元803獲取的頭部周圍區(qū)域的檢測結(jié)果1104-1106估計特定部分區(qū)域。在本示例性實施方式中,第一估計單元804估計頭部區(qū)域,但本發(fā)明不限于此。作為估計頭部區(qū)域的方法,可以利用第一檢測單元803的檢測結(jié)果的位置坐標(biāo)通過以下等式(4)獲得頭部區(qū)域:在等式(4)中,x1和y1代表檢測結(jié)果的左上角的坐標(biāo),x2和y2代表檢測結(jié)果的右下角的坐標(biāo)。在等式(4)中,“A”代表矩陣,所述矩陣是基于中心坐標(biāo)和根濾波器的尺寸將單次檢測結(jié)果中的部分濾波器的左上角的坐標(biāo)和右下角的坐標(biāo)標(biāo)準(zhǔn)化處理后得到的值轉(zhuǎn)換而來的。另外,“Pm”代表從學(xué)習(xí)中獲取的系數(shù)組成的矢量(“m”代表模型的序號)。此時,每個模型的“Pm”的參數(shù)是這樣計算出來的:對具有作為正確答案的頭部幀以及作為一組的第二檢測單元806的一幀的學(xué)習(xí)數(shù)據(jù)執(zhí)行最小平方法。如圖11所示,頭部區(qū)域的估計結(jié)果1114-1116被從頭部區(qū)域的檢測結(jié)果1104-1106中評估出來。頭部區(qū)域的估計結(jié)果1114-1116被輸出至層限制單元805和合成單元808。層限制單元805確定這樣的層:在該層上,根據(jù)第一估計單元804估計的頭部幀1114-1116,第二檢測單元806將對分層圖像1002的特征量執(zhí)行檢測處理。圖12展示了從合成單元808輸出的關(guān)于學(xué)習(xí)數(shù)據(jù)的最終檢測結(jié)果的分布情況,每個分布圖代表當(dāng)時的頭部區(qū)域的尺寸以及對應(yīng)于檢測到從第二檢測單元806輸出結(jié)果的特征量的層。分布圖1201代表處于直立位置的人的整個身體。分布圖1202代表處于前傾位置的人的整個身體。分布圖1203代表處于蹲坐位置的人的整個身體。如果有不同于上述方式的姿勢,不同的層適合于從頭部區(qū)域的尺寸中估計。因此,對于每個模型而言,都用最小平方法獲得系數(shù),所述系數(shù)可根據(jù)等式(5)計算出:在等式(5)中,“Am”代表通過求每個模型的學(xué)習(xí)數(shù)據(jù)中的頭部幀的尺寸的對數(shù)得到的結(jié)果組成的矩陣,“Bm”代表由第二檢測單元806對每個模型的檢測結(jié)果中的層組成的矩陣。利用計算出的系數(shù),根據(jù)等式(6)計算出會被執(zhí)行檢測處理的層。層m=coeff1m*log(寬度)+coeff2m*log(高度)+coeff3m(6)通過計算該頭部區(qū)域的系數(shù)的加權(quán)和,判定最適合將由第二檢測單元806執(zhí)行的檢測處理的層是有可能的。如圖13所示,根據(jù)確定的層1307,將被執(zhí)行檢測處理的層1307和未被執(zhí)行檢測處理的層1308分離。取決于特征量生成單元802和層限制單元805,第二檢測單元806僅對被限制的分層圖像1307執(zhí)行檢測處理。如圖13所示,作為檢測處理方法,通過滑動每個模型1309的窗口在各個位置處執(zhí)行檢測處理,所述模型1309已經(jīng)通過學(xué)習(xí)方法被預(yù)先學(xué)習(xí)過,例如SVM或增強(qiáng)法。在本示例性實施方式中,所述模型檢測人的整個身體,但是本發(fā)明不限于此。另外,在本示例性實施方式中,例如,第二檢測單元806利用某個模型檢測處于直立位置的人,而利用另一個模型檢測處于蹲坐位置的人。利用這種方式,第二檢測單元806可以利用不同的模型檢測姿勢改變的人的身體。如圖14所示,通過檢測處理,具有不同姿勢的人的整個身體的檢測結(jié)果1410-1415被獲取。獲取的檢測結(jié)果1410-1415被輸出至第二估計單元807。第二估計單元807從第二檢測單元806獲取的檢測結(jié)果1410-1415中估計特定部分區(qū)域。在本示例性實施方式中,第二估計單元807估計頭部區(qū)域,但是本發(fā)明不限于此。更不用說,由第二估計單元807估計的特定部分區(qū)域也不限于頭部區(qū)域,也可以和第一估計單元804估計的區(qū)域相同。這是因為合成單元808(下文描述)將第一估計單元804估計的區(qū)域和第二估計單元807估計的區(qū)域合成。作為估計方法,第二估計單元807利用等式(4)估計每個模型的頭部區(qū)域,等式(4)也被第一估計單元804使用。然后,獲取的頭部幀1420-1425被輸出至合成單元808。合成單元808以與第一示例性實施方式相似的方式將第一估計單元804的頭部區(qū)域1114-1116和第二估計單元807的頭部區(qū)域1420-1425合成。最后,在本示例性實施方式中,區(qū)域1410、1411、1412被作為最終檢測結(jié)果輸出。本示例性實施方式的配置就是這樣。圖15展示了本發(fā)明的第三示例性實施方式的物體檢測裝置1500的輪廓。如圖15所示,物體檢測裝置1500包括以下單元:圖像獲取單元801、特征量生成單元802、具有多個檢測模型的第一檢測單元803、第一估計單元804、層/范圍限制單元1505、具有多個檢測模型的第二檢測單元1506、第二估計單元807以及合成單元808。在本示例性實施方式中,在層/范圍限制單元1505限制層以及第二檢測單元1506將利用的各模型的檢測處理范圍以后,第二檢測單元1506根據(jù)所述限制執(zhí)行檢測處理。層/范圍限制單元1505判定分層圖像的特征量,在所述分層圖像上,基于從第一估計單元804獲取的頭部區(qū)域的估計尺寸和位置,對各模型執(zhí)行檢測處理。首先,層/范圍限制單元1505利用等式(6)計算層,以便計算處于直立位置的人的分層圖像1601。然后,層/范圍限制單元1505判定從頭部估計區(qū)域位置1602起的檢測處理范圍1604,以及判定模型1603的濾波器尺寸,從而允許徹底檢索包括以頭部估計區(qū)域位置1602為中心的、頭部估計區(qū)域位置1602的上、下、右、左方的模型1603的濾波器的范圍。此時,檢測處理范圍1604可以作為一個區(qū)域存儲在存儲器中,或者作為地圖保存,在該地圖中檢測處理范圍1604的內(nèi)部被標(biāo)示出來。第二檢測單元1506僅利用對應(yīng)于判定的檢測處理范圍1604的模型執(zhí)行檢測處理。類似地,對于處于蹲坐位置的人,層/范圍限制單元1505關(guān)注于分層圖像1605的特征量,并判定從頭部區(qū)域1606的位置起的檢測處理范圍1608,以及判定模型1607的尺寸。對于處于前傾位置的人,層/范圍限制單元1505也關(guān)注于分層圖像1609的特征量,并判定從頭部區(qū)域1610的位置起的檢測處理范圍1612,以及判定模型1611的尺寸。根據(jù)上述配置,可以加快整個檢測處理。上文已描述了示例性實施方式的各種情況,作為第一至第三實施方式,但這是僅僅是下述配置的例子而已。基于下述配置的其他實施方式也在本發(fā)明的范圍內(nèi)。首先,獲取包括目標(biāo)物體的圖像(圖像獲取步驟)。然后,以多個不同的放大率放大/縮小所述圖像,以生成分層圖像(分層圖像生成步驟)。然后,基于所述分層圖像檢測目標(biāo)物體的至少一部分區(qū)域(第一檢測步驟)。然后,基于在第一檢測步驟中檢測的第一檢測區(qū)域估計第一特定部分區(qū)域(第一估計步驟)。然后,基于第一特定部分區(qū)域和預(yù)先學(xué)習(xí)的學(xué)習(xí)數(shù)據(jù)限制分層圖像的層(層限制步驟)。然后,在層限制步驟中被限制的層的分層圖像中檢測目標(biāo)物體的至少一部分區(qū)域(第二檢測步驟)。然后,基于在第二檢測步驟中檢測的第二檢測區(qū)域估計第二特定部分區(qū)域(第二估計步驟)。然后,將在第一估計步驟中估計的估計結(jié)果和在第二估計步驟中估計的估計結(jié)果合成,以確定合成結(jié)果,作為目標(biāo)物體的特定部分區(qū)域(合成步驟)。雖然上文已詳細(xì)描述了多個示例性實施方式,但是本發(fā)明也可通過以下列形式實施,例如系統(tǒng)、裝置、方法、程序或存儲介質(zhì)。特別地,本發(fā)明可以應(yīng)用在由多個裝置組成的系統(tǒng)中或由單個設(shè)備組成的裝置中。本發(fā)明的各方面還可以通過系統(tǒng)或裝置的、用于讀出并執(zhí)行記錄在存儲介質(zhì)(例如,非臨時性計算機(jī)可讀存儲介質(zhì))上的計算機(jī)可執(zhí)行指令以完成本發(fā)明中一個或多個實施方式功能的計算機(jī)來實現(xiàn);所述發(fā)明的各方面也可以通過方法來實現(xiàn),該方法的各步驟由系統(tǒng)或裝置的計算機(jī)、通過如從存儲介質(zhì)讀出并執(zhí)行計算機(jī)可執(zhí)行指令以完成本發(fā)明一個或多個實施方式功能來執(zhí)行。計算機(jī)可以包括中央處理單元(CPU)、微處理單元(MPU)及其他電路中的一個或多個,也可以包括獨立計算機(jī)網(wǎng)絡(luò)或獨立計算機(jī)處理器網(wǎng)絡(luò)。計算機(jī)可執(zhí)行指令可以從例如網(wǎng)絡(luò)或存儲介質(zhì)提供給計算機(jī)。存儲介質(zhì)可以包括例如硬盤、隨機(jī)存取存儲器(RAM)、只讀存儲器(ROM)及分布式計算系統(tǒng)存儲器、光盤(例如激光唱片(CD)、數(shù)字化通用光盤(DVD)或藍(lán)光光盤(BD)TM)、閃存裝置、存儲卡等中的一個或多個。雖然已經(jīng)結(jié)合示例性實施方式描述了本發(fā)明,應(yīng)當(dāng)認(rèn)識到,本發(fā)明并不局限于公開的示例性實施方式。下列權(quán)利要求的范圍應(yīng)當(dāng)適合最廣泛的解釋,以便囊括所有改動、等同結(jié)構(gòu)和功能。
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1