亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

對象搜尋裝置、視頻顯示裝置和對象搜尋方法

文檔序號:7894796閱讀:143來源:國知局
專利名稱:對象搜尋裝置、視頻顯示裝置和對象搜尋方法
技術(shù)領(lǐng)域
本發(fā)明的實施方式涉及用于搜尋畫面幀中的對象的對象搜尋裝置、視頻顯示裝置和對象搜尋方法。
背景技術(shù)
已經(jīng)提出了用于檢測畫面幀中的人臉的技術(shù)。由于畫面幀每秒改變幾十次,所以檢測各幀的整個畫面幀區(qū)域上的人臉的處理應(yīng)以相當(dāng)高的速度來執(zhí)行。相應(yīng)地,已經(jīng)提出了集中在對象很可能存在于畫面幀中的色域上并且搜尋限定色域中的對象的技術(shù)。然而,在本技術(shù)中,由于當(dāng)限定色域時一些對象被排除,而難以提高對象搜尋精確度。近來,能夠顯示立體視頻的三維TV已經(jīng)迅速普及,但三維視頻數(shù)據(jù)由于與現(xiàn)有電視機的兼容性及其價格的問題,而不能作為視頻源廣泛地使用。相應(yīng)地,在許多情況下,三維TV執(zhí)行將現(xiàn)有二維視頻數(shù)據(jù)轉(zhuǎn)換為偽三維視頻數(shù)據(jù)的處理。在該情況下,需要搜尋二維視頻數(shù)據(jù)的各畫面幀中的特征對象并且將深度信息添加到該特征對象。然而,如上所述,對象搜尋處理需要許多時間,因此可能存在不需許多時間來相對于各畫面幀產(chǎn)生深度信息的情況。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個實施方式,提供了一種對象搜尋裝置,包括對象搜尋單元,被構(gòu)造為搜尋包括在畫面幀中的對象;對象位置校正單元,被構(gòu)造為校正包括由對象搜尋單元搜尋到的對象的對象區(qū)域的位置,使得對象位于對象區(qū)域的中心處;對象區(qū)域校正單元,被構(gòu)造為調(diào)整對象區(qū)域的區(qū)域尺寸,使得對象區(qū)域中除了對象以外的背景區(qū)域變得最?。灰约白鴺?biāo)檢測器,被構(gòu)造為基于由對象區(qū)域校正單元所校正的對象區(qū)域來檢測對象的坐標(biāo)位置。根據(jù)本發(fā)明的另一實施方式,還提供了一種視頻顯示裝置,包括接收處理器,被構(gòu)造為接收廣播波,并且對廣播波執(zhí)行解碼處理和預(yù)定圖像處理以產(chǎn)生幀視頻數(shù)據(jù);顯示裝置,被構(gòu)造為顯示視差數(shù)據(jù);以及對象搜尋裝置,該對象搜尋裝置包括對象搜尋單元,被構(gòu)造為搜尋包括在畫面幀中的對象;對象位置校正單元,被構(gòu)造為校正包括由對象搜尋單元搜尋到的對象的對象區(qū)域的位置,使得對象位于對象區(qū)域的中心處;對象區(qū)域校正單元,被構(gòu)造為調(diào)整對象區(qū)域的區(qū)域尺寸,使得對象區(qū)域中除了對象以外的背景區(qū)域變得最小;以及坐標(biāo)檢測器,被構(gòu)造為基于由對象區(qū)域校正單元所校正的對象區(qū)域來檢測對象的坐標(biāo)位置,其中,對象搜尋單元被構(gòu)造為搜尋包括在分割幀視頻數(shù)據(jù)中的對象,分割幀視頻數(shù)據(jù)是通過將幀視頻數(shù)據(jù)劃分為多個數(shù)據(jù)塊來獲得的。根據(jù)本發(fā)明的又一方面,還提供了一種對象搜尋方法,包括搜尋包括在畫面幀中的對象;校正包括搜尋到的對象的對象區(qū)域的位置,使得對象位于對象區(qū)域的中心處;調(diào)整對象區(qū)域的區(qū)域尺寸,使得對象區(qū)域中除了對象以外的背景區(qū)域變得最小;以及基于所校正的對象區(qū)域來檢測對象的坐標(biāo)位置。


圖I是示出了具有對象搜尋裝置I的視頻顯示裝置2的示意結(jié)構(gòu)的實例的框圖。圖2是示出了深度信息生成器7和三維數(shù)據(jù)生成器8的實例的詳細框圖。圖3是示意性地示出了由圖I的對象搜尋裝置I所執(zhí)行的處理操作的示圖。圖4是示出了由對象搜尋單元3所執(zhí)行的處理操作的實例的流程圖。圖5是示出了串聯(lián)連接的多個識別裝置的實例的示圖。圖6是示出了由對象位置校正器4所執(zhí)行的處理操作的實例的流程圖。
圖7是示出了當(dāng)擴大對象搜尋區(qū)域時的實例的流程圖。圖8是示出了當(dāng)縮小對象搜尋區(qū)域時的實例的流程圖。
具體實施例方式對象搜尋裝置具有對象搜尋單元,被構(gòu)造為搜尋包括在畫面幀中的對象;對象位置校正單元,被構(gòu)造為校正包括由對象搜尋單元所搜尋的對象的對象區(qū)域的位置,使得對象位于對象區(qū)域的中心處;對象區(qū)域校正單元,被構(gòu)造為調(diào)整對象區(qū)域的區(qū)域尺寸,使得對象區(qū)域中除了對象以外的背景區(qū)域變得最??;以及坐標(biāo)檢測器,被構(gòu)造為基于由對象區(qū)域校正單元所校正的對象區(qū)域來檢測對象的坐標(biāo)位置?,F(xiàn)將參考附圖對實施方式作出解釋。圖I是示出了具有根據(jù)本實施方式的對象搜尋裝置I的視頻顯示裝置2的示意性結(jié)構(gòu)的框圖。首先,將解釋對象搜尋裝置I的內(nèi)部結(jié)構(gòu)。圖I的對象搜尋裝置I具有對象搜尋單元3、對象位置校正器4、對象區(qū)域校正器
5、坐標(biāo)檢測器6、深度信息生成器7和三維數(shù)據(jù)生成器8。對象搜尋單元3搜尋包括在一個畫面幀的幀視頻數(shù)據(jù)中的對象。對象搜尋單元3將包括所搜尋對象的像素區(qū)域設(shè)定為對象區(qū)域。當(dāng)在畫面幀中包括多個對象時,對象搜尋單元3搜尋所有對象,并且設(shè)定各對象的對象區(qū)域。對象位置校正器4校正對象區(qū)域的位置,使得對象位于對象區(qū)域的中心處。對象區(qū)域校正器5調(diào)整對象區(qū)域的區(qū)域尺寸,使得對象區(qū)域中除了對象以外的背景區(qū)域變得最小。即,對象區(qū)域校正器5使與對象尺寸相對應(yīng)的對象區(qū)域尺寸最佳化。坐標(biāo)檢測器6基于由對象區(qū)域校正器5所校正的對象區(qū)域來檢測對象的坐標(biāo)位置。深度信息生成器7生成由坐標(biāo)檢測器6所檢測的對象相對應(yīng)的深度信息。然后,三維數(shù)據(jù)生成器8基于由坐標(biāo)檢測器6所檢測的對象及其深度信息來產(chǎn)生對象的三維視頻數(shù)據(jù)。三維視頻數(shù)據(jù)包括右眼視差數(shù)據(jù)和左眼視差數(shù)據(jù),并且根據(jù)情況可包括多視差數(shù)據(jù)。
深度信息生成器7和三維數(shù)據(jù)生成器8并不一定不可或缺。當(dāng)不需要記錄或再現(xiàn)三維視頻數(shù)據(jù)時,可省略深度信息生成器7和三維數(shù)據(jù)生成器8。圖2為深度信息生成器7和三維數(shù)據(jù)生成器8的詳細框圖。如圖2所示,深度信息生成器7具有深度模板存儲器(depth template storage) 11、深度映射生成器12和深度映射校正器13。三維數(shù)據(jù)生成器8具有差異轉(zhuǎn)換器(disparity converter) 14和視差圖像生成器15。深度模板存儲器11存儲與各對象類型相對應(yīng)的、描述各對象的各像素的深度值的深度模板。深度映射生成器12從深度模板存儲器11讀取與坐標(biāo)檢測器6所檢測的對象相對 應(yīng)的深度模板,并且產(chǎn)生將深度值與從圖像處理器22提供的幀視頻數(shù)據(jù)的各像素相關(guān)的深度映射。深度映射校正器13通過使用各像素周邊像素對深度映射上的各像素執(zhí)行加權(quán)平滑來校正各像素的深度值。三維數(shù)據(jù)生成器8中的差異轉(zhuǎn)換器14通過從深度映射中的各像素的深度值獲得各像素的差異向量來產(chǎn)生描述各像素的差異向量的差異映射。視差圖像生成器15使用輸入圖像和差異映射來產(chǎn)生視差圖像。例如,圖I的視頻顯示裝置2為三維TV,并且其除了具有圖I的對象搜尋裝置I以夕卜,還具有接收處理器21、圖像處理器22和三維顯示裝置23。接收處理器21將由天線(未示出)接收到的廣播信號解調(diào)為基帶信號,并且對基帶信號執(zhí)行解碼處理。圖像處理器22對通過接收處理器21的信號執(zhí)行去噪處理等,并且產(chǎn)生要提供給圖I的對象搜尋裝置I的幀視頻數(shù)據(jù)。三維顯示裝置23具有顯示面板24,具有以矩陣方式配置的像素;和光線控制元件25,具有被配置為面對顯示面板24以控制來自各像素的光線的多個出射瞳(exitpupil)。例如,顯示面板24可被形成為液晶面板、等離子顯示面板或者EL(電致發(fā)光)面板。光線控制元件25通常被稱為視差屏障,并且光線控制元件25的各出射瞳控制光線,使得從同一位置的不同角度可以看到不同的圖像。具體地,具有多個狹縫的狹縫板或者透鏡片(柱面透鏡陣列)被用于僅創(chuàng)建左右視差(水平視差),以及針孔陣列(pinhole lens)或者透鏡陣列被用于進一步創(chuàng)建上下視差(垂直視差)。即,各出射瞳均為狹縫板的狹縫、柱面透鏡陣列的柱面透鏡、針孔陣列的針孔或者透鏡陣列伺服的透鏡。盡管根據(jù)本實施方式的三維顯示裝置23具有包含多個出射瞳的光線控制元件25,但透射式液晶顯示器等可被用作三維顯示裝置23以電子地產(chǎn)生視差屏障并且電子可變地控制屏障圖案的形狀和位置。即,三維顯示裝置23的具體結(jié)構(gòu)沒有限制,只要顯示裝置可顯示立體圖像顯示器(下文將解釋)的圖像。此外,根據(jù)本實施方式的對象搜尋裝置I并非一定結(jié)合到電視機中。例如,對象搜尋裝置I可適用于記錄裝置,該記錄裝置將包括在由接收處理器21所接收的廣播信號中的幀視頻數(shù)據(jù)轉(zhuǎn)換為三維視頻數(shù)據(jù)并且將三維視頻數(shù)據(jù)記錄在HDD (硬盤驅(qū)動器)、光盤(例如,藍光光盤)等中。圖3是示意性地示出了由圖I的對象搜尋裝置I所執(zhí)行的處理操作的示圖。首先,如圖3的(a)所示,對象搜尋單元3搜尋畫面幀中的對象31,并且設(shè)定對象區(qū)域32,使得搜尋到的對象31包括在該對象區(qū)域中。接著,如圖3的(b)所示,對象位置校正器4移動對象區(qū)域32的位置,并且使對象31配置在對象區(qū)域32的中心處。接下來,如圖3的(c)所示,對象區(qū)域校正器5調(diào)整對象區(qū)域32的尺寸,并且使對象區(qū)域32中除了對象31以外的背景區(qū)域最小化。例如,對象區(qū)域校正器5執(zhí)行調(diào)整,使得對象區(qū)域32的輪廓與對象31的輪廓接觸。坐標(biāo)檢測器6基于具有由對象區(qū)域校正器5所調(diào)整的尺寸的對象區(qū)域32來檢測對象31的坐標(biāo)位置。圖4是示出了由對象搜尋單元3所執(zhí)行的處理操作的實例的流程圖。首先,從圖像處理器提供一個畫面幀的幀視頻數(shù)據(jù)(步驟SI),然后,執(zhí)行對象搜尋以 檢測對象(步驟
52)。這里,人臉為要搜尋的對象。當(dāng)搜尋人臉時,例如,利用使用例如類哈爾特征(Haar-like feature)的對象檢測方法。如圖5所示,該對象檢測方法使用串聯(lián)連接的多個識別裝置30,并且各識別裝置30均具有基于先前執(zhí)行的統(tǒng)計學(xué)習(xí)來識別人臉的功能。各識別裝置30均通過使用類哈爾特征、設(shè)定具有預(yù)定尺寸的像素區(qū)域作為搜尋區(qū)域的單元來執(zhí)行對象檢測。前一級識別裝置30的對象檢測的結(jié)果被輸入至后一級識別裝置30中,因此,后一級識別裝置30可更精確地搜尋人臉。因此,隨著所連接的識別裝置30的數(shù)目增加,識別性能增加,但是識別裝置30的處理時間和實施區(qū)域也增加。因此,期望在考慮可接受實施范圍和識別精確度的情況下確定所連接的識別裝置30的數(shù)目。接著,基于來自圖5的識別裝置30的輸出判斷檢測到的對象是否為人臉(步驟
53)。在上述步驟S3中,當(dāng)對象在坐標(biāo)位置(X,Y)處被判斷為人臉時,在對象周邊區(qū)域(X-x,Y-y)-(X+x,Y+y)中執(zhí)行簡化搜尋處理以搜尋臉的周邊(步驟S4)。這里,來自圖5中的多個識別裝置30的最后級中的識別裝置30的輸出未被用于搜尋臉,以及最后級之前的級別中的識別裝置30輸出被用于判斷對象是否為人臉。相應(yīng)地,不需等到從最后級中的識別裝置30輸出識別結(jié)果,這實現(xiàn)了高速處理。當(dāng)對象在坐標(biāo)位置(X,Y)處被判斷為人臉時,區(qū)域(X,Y)-(X+a, Y+b)被設(shè)定為對象區(qū)域32 ( “a”和“b”均為固定值)。在步驟S4中,對象搜尋單元3不執(zhí)行詳細搜尋,而是執(zhí)行簡化搜尋以增加處理速度,這是因為隨后由對象位置校正器4和對象區(qū)域校正器5執(zhí)行詳細搜尋。當(dāng)在畫面幀中存在多個人臉時,對每張臉執(zhí)行簡化搜尋以檢測其坐標(biāo)位置。然后,執(zhí)行合成臉部坐標(biāo)的處理以通過檢測在多個檢測到的臉部坐標(biāo)之間是否存在重疊臉來檢測任何相似度(步驟S5)。這里,在圖5中的串聯(lián)連接的識別裝置30中,相對于各重疊臉比較配置在中間級中而不是最后級中的識別裝置30的輸出,以選擇具有最大輸出值的臉部坐標(biāo)作為每一重疊臉部坐標(biāo)組中的臉部坐標(biāo)。然后,輸出每一代表坐標(biāo)作為檢測到的臉部坐標(biāo)(步驟S6)。以此方式,一對重疊臉整合為一者。圖6是示出了對象位置校正器4所執(zhí)行的處理操作的實例的流程圖。首先,對象搜尋單元3輸入包括由圖4的處理所檢測到的臉部坐標(biāo)(X,Y)的對象區(qū)域(X,Y)-(X+a,Y+b)中的色彩信息(步驟S11)。接下來,計算代表包括臉的對象區(qū)域中的色彩信息的V值的平均值Vm(步驟S12)。這里,V值表示用作代表色彩空間的三個元素的YUV之一。Y值代表亮度,U值代表藍黃軸,以及V值代表紅青軸。在步驟S12中利用V值的原因是紅色和亮度為識別人臉的重要色彩信息。在以上步驟S12中所計算的是對象搜尋區(qū)域(X,Y)_(X+a,Y+b)中心附近的區(qū)域(X+a/2-c,Y+b/2-d) -P (X+a/2+c,Y+b/2+d)中的 V 色彩信息值的平均值 Vm。這里,“c”和“d”均為用于判定靠近對象區(qū)域(其中,計算平均值)的中心的區(qū)域范圍的值?!癱” = 0. IXa以及“d”=0. lXb。注意,0.1僅為示例數(shù)字。然后,計算對象區(qū)域中的每一像素的V值與平均值Vm之差,并且使用各像素的差值作為權(quán)數(shù)(weight)來計算對象區(qū)域的重心(centroid)(均值移動量)(重心計算單元,步驟S13)。這里,X方向上的重心Sx和Y方向上的重心Sy分別由以下公式(I)和公式⑵表
/Jn o[公式I]
((Vj-Vm)1)
[e -256 xd(= Xj -xc)Sx =5-丄
x(Vj-Vm)2
[e -256
J... (I)
((V-V )2\
Yj e -256 xt/(n)-
-256
J…(2)接著,移動對象搜尋區(qū)域的位置,使得所計算的重心位置疊加在對象區(qū)域的中心上(對象區(qū)域移動單元,步驟S14)。然后,輸出移動后的對象區(qū)域的坐標(biāo)位置(步驟S15)。例如,當(dāng)原始對象區(qū)域具有坐標(biāo)位置(X,Y)-(X+a, Y+b)時,原始對象區(qū)域移動至步驟 S15 中的坐標(biāo)位置(X+Sx,Y+Sy)-(X+a+Sx, Y+b+Sy)。如上所述,圖6的對象位置校正器4移動對象區(qū)域的坐標(biāo)位置,使得與包括檢測到的人臉的對象區(qū)域的色彩信息有關(guān)的重心位置和對象區(qū)域的坐標(biāo)中心彼此相一致。即,對象位置校正器4在不改變對象區(qū)域的尺寸的情況下僅移動坐標(biāo)位置。圖7和圖8均為示出了由對象區(qū)域校正器5執(zhí)行的處理操作的實例的流程圖。對象區(qū)域校正器5的流程圖可從兩個方面來解釋。圖7是當(dāng)擴大由對象搜尋單元3所設(shè)定的對象區(qū)域時的流程圖,以及圖8是當(dāng)縮小由對象搜尋單元3所設(shè)定的對象區(qū)域時的流程圖。首先,將解釋圖7的處理。輸入具有由對象位置校正器4所校正的坐標(biāo)位置的對象區(qū)域,并且計算所校正的對象區(qū)域中的V值的平均值Vm(步驟S21)。接下來,檢測是否可在左、右、上和下方向上擴展對象區(qū)域的尺寸(附加區(qū)域設(shè)定單元、第一平均色彩計算單元,步驟S22)。下文中,將詳細解釋步驟S22的處理。在該情況下,對象區(qū)域的坐標(biāo)位置由對象位置校正器4校正為坐標(biāo)位置(X,Y)_(X+a,Y+b)。首先,使用足夠小的值k在對象區(qū)域的左側(cè)(X方向上的負側(cè))產(chǎn)生小區(qū)域(x-k,Y)-(X,Y+b)(步驟S22),并且計算小區(qū)域中的V值的平均值V,m(步驟S23)。判斷V’m是否大于VmXO. 95且小于VmX I. 05 (步驟S24),如果V’m大于VmX 0. 95且小于VmX I. 05,則通過利用小區(qū)域擴展對象區(qū)域來產(chǎn)生新對象區(qū)域(X-k,Y)-(X+a,Y+b)(步驟S25)。即,如果小區(qū)域V’m值與原始對象區(qū)域的V’m值相差在5%的范圍內(nèi),則判定在小區(qū)域中也包括人臉信息,并且將小區(qū)域添加到對象區(qū)域。相對于左側(cè)(X方向上的負側(cè))、右側(cè)(X方向上的正側(cè))、上側(cè)(Y方向上的正側(cè))和下側(cè)(Y方向上的負側(cè))順次地對對象區(qū)域執(zhí)行以上處理,以判斷是否可在對象區(qū)域的左偵U、右側(cè)、上側(cè)和下側(cè)產(chǎn)生小區(qū)域。在該情況下,如果各方向上的小區(qū)域中的V’m值與原始對象區(qū)域的V’ m值相差在5%的范圍內(nèi),則將該方向上的小區(qū)域添加到對象區(qū)域。
以此方式,對象區(qū)域可被擴展至適當(dāng)?shù)某叽?。然后,檢測所擴展的對象區(qū)域的坐標(biāo)位置(對象區(qū)域更新單元,步驟S25)。在圖8中,與圖7相反,檢測是否可從對象區(qū)域的上邊緣、下邊緣、左邊緣和右邊緣向內(nèi)剪切小區(qū)域。當(dāng)輸入具有由對象位置校正器4所校正的坐標(biāo)位置的對象區(qū)域時(步驟S31),從對象區(qū)域的上邊緣、下邊緣、左邊緣和右邊緣向內(nèi)剪切小區(qū)域(步驟S32),并且計算所剪切的小區(qū)域中的V值的平均值Vm(步驟S33)。這里,從對象區(qū)域的左邊緣向內(nèi)產(chǎn)生小區(qū)域(X,Y)-(X-k, Y),并且計算小區(qū)域中的V值的平均值V,m(步驟S33)。接下來,判斷V’m是否大于VmXO. 95且小于VmX 1.05(步驟S34)。即,在步驟S34中,檢測是否可利用小區(qū)域從上邊緣、下邊緣、左邊緣和右邊緣向內(nèi)減小對象區(qū)域的尺寸(剪切區(qū)域設(shè)定單元、第二平均色彩計算單元)。如果V’ m不大于VmX 0.95且不小于VmX I. 05,則通過利用小區(qū)域剪切對象區(qū)域來產(chǎn)生新對象區(qū)域(X+k,Y)-(X+a,Y+b)(對象區(qū)域更新單元,步驟S35)。S卩,如果小區(qū)域的r m值與原始對象區(qū)域的V’ m值相差超過5%的范圍,則判定在小區(qū)域中不包括人臉信息,并且利用小區(qū)域剪切對象區(qū)域來縮小對象區(qū)域。相對于左側(cè)(X方向上的負側(cè))、右側(cè)(X方向上的正側(cè))、上側(cè)(Y方向上的正側(cè))和下側(cè)(Y方向上的負側(cè))順次地對對象區(qū)域執(zhí)行以上處理,以判斷是否可利用小區(qū)域從上邊緣、下邊緣、左邊緣和右邊緣向內(nèi)剪切對象區(qū)域。在該情況下,如果各方向上的小區(qū)域中的V’m值與原始對象區(qū)域的V’m值相差超過5%的范圍,則通過小區(qū)域在該方向上剪切對象區(qū)域。在以上實施方式中,將對檢測人臉作為對象的實例作出解釋。然而,當(dāng)搜尋除了人臉之外的各種對象(例如,汽車等)作為對象時,可利用本實施方式。由于主色彩信息和亮度信息根據(jù)對象類型而有所不同,所以根據(jù)對象類型,可使用U值或者Y值而不是V值來計算對象區(qū)域的重心位置和小區(qū)域的平均值。如上所述,在本實施方式中,當(dāng)搜尋對象時,首先執(zhí)行簡化搜尋以設(shè)定對象周圍的對象區(qū)域,然后,校正對象區(qū)域的位置使得在對象區(qū)域的中心處配置對象,最后,調(diào)整對象區(qū)域的尺寸。以此方式,可設(shè)定適合對象尺寸的對象區(qū)域。因此,當(dāng)隨后檢測對象的移動時,由于基于具有最佳化尺寸的對象區(qū)域來執(zhí)行移動檢測,故可將應(yīng)執(zhí)行移動檢測的區(qū)域最小化,這使得處理速度增加。此外,當(dāng)通過搜尋二維視頻數(shù)據(jù)中的對象并且生成所搜尋的對象的深度信息來生成三維視頻數(shù)據(jù)時,由于基于具有最佳化尺寸的對象區(qū)域來生成深度信息,故可將應(yīng)生成深度信息的區(qū)域最小化,這使得生成深度信息的處理時間減少。以上實施方式中所解釋的對象搜尋裝置I和視頻顯示裝置2的至少一部分可以以硬件或者軟件來實施。在軟件情況下,可將實現(xiàn)對象搜尋裝置I和視頻顯示裝置2的至少部分功能的程序存儲在諸如軟盤、CD-ROM等的記錄介質(zhì)中,以被計算機讀取和執(zhí)行。記錄介質(zhì)并不限于諸如磁盤、光盤等的可移除介質(zhì),并且可為諸如硬盤裝置、內(nèi)存等的固定型記錄介質(zhì)。此外,實現(xiàn)對象搜尋裝置I和視頻顯示裝置2的至少部分功能的程序可通過諸如互聯(lián)網(wǎng)的通信線路(包括無線電通信)來分配。此外,該程序可經(jīng)加密、調(diào)制和壓縮以通過有線線路或者諸如互聯(lián)網(wǎng)的無線電鏈路或者通過記錄介質(zhì)(將程序存儲在其中)來分配。盡管已經(jīng)描述了某些實施方式,但是這些實施方式僅以實例方式呈現(xiàn),并且不旨在限制發(fā)明的范圍。事實上,本文所述的新型方法和系統(tǒng)可以各種其他形式來體現(xiàn);此外,在不脫離本發(fā)明的精神的前提下,可對本文所述的方法和系統(tǒng)的形式進行各種省略、替換和改變。所附權(quán)利要求及其等價物旨在包含這些形式或者修改,只要它們均在本發(fā)明的范·圍和精神之內(nèi)。
權(quán)利要求
1.一種對象搜尋裝置,包括 對象搜尋單元,被構(gòu)造為搜尋包括在畫面幀中的對象; 對象位置校正單元,被構(gòu)造為校正包括由所述對象搜尋單元搜尋到的所述對象的對象區(qū)域的位置,使得所述對象位于所述對象區(qū)域的中心處; 對象區(qū)域校正單元,被構(gòu)造為調(diào)整所述對象區(qū)域的區(qū)域尺寸,使得所述對象區(qū)域中除了所述對象以外的背景區(qū)域變得最??;以及 坐標(biāo)檢測器,被構(gòu)造為基于由所述對象區(qū)域校正單元所校正的所述對象區(qū)域來檢測所述對象的坐標(biāo)位置。
2.根據(jù)權(quán)利要求I所述的對象搜尋裝置, 其中,所述對象位置校正單元包括 重心計算單元,被構(gòu)造為計算所述對象區(qū)域的重心位置;以及對象區(qū)域移動單元,被構(gòu)造為移動所述對象區(qū)域,使得所述對象區(qū)域的中心與由所述重心計算單元計算出的所述重心位置相一致。
3.根據(jù)權(quán)利要求2所述的對象搜尋裝置, 其中,所述重心計算單元被構(gòu)造為計算與所述對象區(qū)域的色彩信息相關(guān)的重心位置。
4.根據(jù)權(quán)利要求I所述的對象搜尋裝置, 其中,所述對象搜尋單元被構(gòu)造為通過使用類哈爾特征來搜尋人臉作為所述對象。
5.根據(jù)權(quán)利要求I所述的對象搜尋裝置, 其中,所述對象區(qū)域校正單元包括 附加區(qū)域設(shè)定單元,被構(gòu)造為通過在所述對象區(qū)域的周圍添加附加區(qū)域來設(shè)定新對象區(qū)域; 第一平均色彩計算單元,被構(gòu)造為計算所述附加區(qū)域的平均色彩和所述對象區(qū)域的平均色彩;以及 第一對象區(qū)域更新單元,被構(gòu)造為當(dāng)由所述第一平均色彩計算單元計算出的平均色彩之間的差的絕對值為預(yù)定值以下時,采用所述新對象區(qū)域。
6.根據(jù)權(quán)利要求I所述的對象搜尋裝置, 其中,所述對象區(qū)域校正單元包括 剪切區(qū)域設(shè)定單元,被構(gòu)造為通過剪切所述對象區(qū)域的周邊區(qū)域來設(shè)定新對象區(qū)域;第二平均色彩計算單元,被構(gòu)造為計算所述周邊區(qū)域的平均色彩和所述對象區(qū)域的平均色彩;以及 第二對象區(qū)域更新單元,被構(gòu)造為當(dāng)由所述第二平均色彩計算單元計算出的平均色彩之間的差的絕對值為預(yù)定值以下時,采用所述新對象區(qū)域。
7.根據(jù)權(quán)利要求I所述的對象搜尋裝置,還包括 深度信息生成器,被構(gòu)造為生成具有由所述坐標(biāo)檢測器檢測到的坐標(biāo)位置的對象的深度信息;以及 三維數(shù)據(jù)生成器,被構(gòu)造為基于由所述深度信息生成器生成的對應(yīng)于所述對象的深度信息來生成用于三維地顯示所述對象的視差數(shù)據(jù)。
8.一種視頻顯示裝置,包括 接收處理器,被構(gòu)造為接收廣播波,并且對所述廣播波執(zhí)行解碼處理和預(yù)定圖像處理以產(chǎn)生幀視頻數(shù)據(jù); 顯示裝置,被構(gòu)造為顯示視差數(shù)據(jù);以及 對象搜尋裝置, 所述對象搜尋裝置包括 對象搜尋單元,被構(gòu)造為搜尋包括在畫面幀中的對象; 對象位置校正單元,被構(gòu)造為校正包括由所述對象搜尋單元搜尋到的所述對象的對象區(qū)域的位置,使得所述對象位于所述對象區(qū)域的中心處; 對象區(qū)域校正單元,被構(gòu)造為調(diào)整所述對象區(qū)域的區(qū)域尺寸,使得所述對象區(qū)域中除了所述對象以外的背景區(qū)域變得最小;以及 坐標(biāo)檢測器,被構(gòu)造為基于由所述對象區(qū)域校正單元所校正的所述對象區(qū)域來檢測所述對象的坐標(biāo)位置, 其中,所述對象搜尋單元被構(gòu)造為搜尋包括在分割幀視頻數(shù)據(jù)中的所述對象,所述分割幀視頻數(shù)據(jù)是通過將所述幀視頻數(shù)據(jù)劃分為多個數(shù)據(jù)塊來獲得的。
9.根據(jù)權(quán)利要求8所述的視頻顯示裝置, 其中,所述對象位置校正單元包括 重心計算單元,被構(gòu)造為計算所述對象區(qū)域的重心位置;以及對象區(qū)域移動單元,被構(gòu)造為移動所述對象區(qū)域,使得所述對象區(qū)域的中心與所述重心計算單元計算出的所述重心位置相一致。
10.根據(jù)權(quán)利要求9所述的視頻顯示裝置, 其中,所述重心計算單元被構(gòu)造為計算與所述對象區(qū)域的色彩信息相關(guān)的重心位置。
11.根據(jù)權(quán)利要求8所述的視頻顯示裝置, 其中,所述對象搜尋單元被構(gòu)造為通過使用類哈爾特征來搜尋人臉作為所述對象。
12.根據(jù)權(quán)利要求8所述的視頻顯示裝置, 其中,所述對象區(qū)域校正單元包括 附加區(qū)域設(shè)定單元,被構(gòu)造為通過在所述對象區(qū)域的周圍添加附加區(qū)域來設(shè)定新對象區(qū)域; 第一平均色彩計算單元,被構(gòu)造為計算所述附加區(qū)域的平均色彩和所述對象區(qū)域的平均色彩;以及 第一對象區(qū)域更新單元,被構(gòu)造為當(dāng)由所述第一平均色彩計算單元計算出的平均色彩之間的差的絕對值為預(yù)定值以下時,采用所述新對象區(qū)域。
13.根據(jù)權(quán)利要求8所述的視頻顯示裝置, 其中,所述對象區(qū)域校正單元包括 剪切區(qū)域設(shè)定單元,被構(gòu)造為通過剪切所述對象區(qū)域的周邊區(qū)域來設(shè)定新對象區(qū)域;第二平均色彩計算單元,被構(gòu)造為計算所述周邊區(qū)域的平均色彩和所述對象區(qū)域的平均色彩;以及 第二對象區(qū)域更新單元,被構(gòu)造為當(dāng)由所述第二平均色彩計算單元計算出的平均色彩之間的差的絕對值為預(yù)定值以下時,采用所述新對象區(qū)域。
14.根據(jù)權(quán)利要求8所述的視頻顯示裝置,還包括 深度信息生成器,被構(gòu)造為生成具有由所述坐標(biāo)檢測器檢測到的坐標(biāo)位置的對象的深度信息;以及 三維數(shù)據(jù)生成器,被構(gòu)造為基于由所述深度信息生成器生成的對應(yīng)于所述對象的深度信息來生成用于三維地顯示所述對象的視差數(shù)據(jù)。
15.—種對象搜尋方法,包括 搜尋包括在畫面幀中的對象; 校正包括搜尋到的所述對象的對象區(qū)域的位置,使得所述對象位于所述對象區(qū)域的中心處; 調(diào)整所述對象區(qū)域的區(qū)域尺寸,使得所述對象區(qū)域中除了所述對象以外的背景區(qū)域變得最??;以及 基于校正后的對象區(qū)域來檢測所述對象的坐標(biāo)位置。
16.根據(jù)權(quán)利要求15所述的方法, 其中,校正所述對象區(qū)域的所述位置包括 計算所述對象區(qū)域的重心位置;以及 移動所述對象區(qū)域,使得所述對象區(qū)域的中心與計算出的所述對象區(qū)域的重心位置相一致。
17.根據(jù)權(quán)利要求16所述的方法, 其中,計算所述重心位置包括計算與所述對象區(qū)域的色彩信息相關(guān)的重心位置。
18.根據(jù)權(quán)利要求15所述的方法, 其中,搜尋所述對象包括通過使用類哈爾特征來搜尋人臉作為所述對象。
19.根據(jù)權(quán)利要求15所述的方法, 其中,校正所述對象搜尋區(qū)域的位置包括 通過在所述對象區(qū)域的周圍添加附加區(qū)域來設(shè)定新對象區(qū)域; 計算所述附加區(qū)域的平均色彩和所述對象區(qū)域的平均色彩;以及 當(dāng)計算出的平均色彩之間的差的絕對值為預(yù)定值以下時,采用所述新對象區(qū)域。
20.根據(jù)權(quán)利要求15所述的方法, 其中,校正所述對象區(qū)域包括 通過剪切所述對象區(qū)域的周邊區(qū)域來設(shè)定新對象區(qū)域; 計算所述周邊區(qū)域的平均色彩和所述對象區(qū)域的平均色彩;以及 當(dāng)計算出的平均色彩之間的差的絕對值為預(yù)定值以下時,采用所述新對象區(qū)域。
全文摘要
本發(fā)明公開了對象搜尋裝置、視頻顯示裝置以及對象搜尋方法,該對象搜尋裝置具有對象搜尋單元,被構(gòu)造為搜尋包括在畫面幀中的對象;對象位置校正單元,被構(gòu)造為校正包括對象搜尋單元搜尋到的對象的對象區(qū)域的位置,使得對象位于對象區(qū)域的中心處;對象區(qū)域校正單元,被構(gòu)造為調(diào)整對象區(qū)域的區(qū)域尺寸,使得對象區(qū)域中除了對象以外的背景區(qū)域變得最小;以及坐標(biāo)檢測器,被構(gòu)造為基于對象區(qū)域校正單元所校正的對象區(qū)域來檢測對象的坐標(biāo)位置。
文檔編號H04N13/00GK102968630SQ20121013317
公開日2013年3月13日 申請日期2012年4月28日 優(yōu)先權(quán)日2011年8月31日
發(fā)明者松岡薰, 山田貢己 申請人:株式會社東芝
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1