專利名稱:對象識別方法和對象識別設備的制作方法
技術領域:
本發(fā)明一般地涉及圖像處理與模式識別。具體而言,本發(fā)明涉及一種能夠?qū)D像中的對象進行識別的方法和設備以及其中設置了該設備的移動終端。
背景技術:
近年來,人機交互技術得到了迅猛的發(fā)展。其中非接觸式人機交互的一項關鍵技術是基于圖像或視頻的自動手勢識別。手部檢測是手勢識別系統(tǒng)的前端模塊。對于手機、平板電腦等計算能力有限的移動設備,快速而高效的手部檢測方法尤為重要。現(xiàn)有技術中的手 部檢測方法通過一個訓練好的兩類分類器將待處理的圖像窗口分為手或非手類。而精確的手部定位是通過一個尺度可變的滑動(掃描)窗口在整幅圖像中掃描,尋找分類器輸出響應最高的位置。因為在一幅圖像中存在大量的候選窗口,這種逐一判斷的搜索策略極大的增加了計算負擔。例如,一幅320x240像素的QVGA圖像包含超過100萬候選窗口。對nXn的圖像,候選窗口數(shù)目將以η~4的倍數(shù)增長。不同尺度的、不同位置的大量候選窗口帶來的巨大計算量,對于計算能力有限的移動設備顯然是難以承受的。手部檢測的實時性不好,導致用戶體驗較差。
發(fā)明內(nèi)容
在下文中給出了關于本發(fā)明的簡要概述,以便提供關于本發(fā)明的某些方面的基本理解。應當理解,這個概述并不是關于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。本發(fā)明的目的是針對現(xiàn)有技術的上述問題,提出了一種能夠?qū)D像中對象進行識別的方法和設備。該方案能夠快速、準確地從圖像中識別具有特定的顏色分布特征和特定的輪廓特征的對象。為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種對象識別方法,用于識別具有特定的顏色分布特征和特定的輪廓特征的對象,所述方法包括如下步驟:根據(jù)顏色分布特征,提取輸入圖像中的輪廓;根據(jù)所述輪廓的特征以及所述顏色分布特征,確定掃描窗;以及對所確定的掃描窗對應的圖像部分分類,確定其是否包含對象。根據(jù)本發(fā)明的一個具體實施例,所述對象為具有相對穩(wěn)定的顏色分布范圍的對象,所述提取步驟包括:對于具有顏色值(r,g,b)的像素X,計算其顏色響應值V =kl*r+k2*g+k3*b,并基于顏色響應值V提取候選對象輪廓,其中系數(shù)kl、k2、k3滿足OKk
I彡 1.2,-0.4 彡 k2 彡-0.6,-0.4 彡 k3 彡-0.6。根據(jù)本發(fā)明的一個具體實施例,所述對象為具有相對穩(wěn)定的顏色分布范圍的對象,所述提取步驟包括:對于具有顏色值(r,g,b)的像素X,計算RGB空間中向量55在軸M上的投影,并基于投影值V提取候選對象輪廓;其中,向量品的起點為RGB空間的原點(O,O,O),終點為像素X對應的點(r,g,b);軸5反經(jīng)過點D(0,-k2/kl,-k3/kl)和點R(r,0,0),并由0指向1 ,其中系數(shù)1^1、1^2、1^3滿足0.8彡1^1彡1.2,-0.4彡k2彡-0.6,-0.4彡k3彡
_0.6 ο根據(jù)本發(fā)明的一個具體實施例,所述確定掃描窗的步驟包括:對于具有不同尺度和位置的候選掃描窗,確定其所對應的像素區(qū)域是否符合所述特定的顏色分布特征和所述特定的輪廓特征;將 其所對應的像素區(qū)域符合所述特定的顏色分布特征和所述特定的輪廓特征的候選掃描窗保留作為所確定的掃描窗。根據(jù)本發(fā)明的一個具體實施例,所述特定的輪廓特征包括:所提取的輪廓與所述掃描窗具有特定位置關系。所述特定的顏色分布特征包括:所述掃描窗內(nèi)特定區(qū)域具有或者不具有特定的顏色。根據(jù)本發(fā)明的一個具體實施例,所述對象包括張開的手;所述特定位置關系包括:與所述掃描窗的中心點具有預定位置關系的點在所提取的輪廓內(nèi);所述顏色分布特征包括:所述中心點對應的像素具有膚色。根據(jù)本發(fā)明的另一個方面,提供了一種對象識別設備,用于識別具有特定的顏色分布特征和特定的輪廓特征的對象,所述設備包括:輪廓提取裝置,用于根據(jù)顏色分布特征提取輸入圖像中的輪廓;掃描窗確定裝置,用于根據(jù)所述輪廓的特征以及所述顏色分布特征確定掃描窗;以及對象確定裝置,用于對所確定的掃描窗對應的圖像部分分類,確定其是否包含對象。根據(jù)本發(fā)明的一個具體實施例,所述對象為具有相對穩(wěn)定的顏色分布范圍的對象,所述輪廓提取裝置被配置為:對于具有顏色值(r,g,b)的像素X,計算其顏色響應值V=kl*r+k2*g+k3*b,并基于顏色響應值v提取候選對象輪廓,其中系數(shù)kl、k2、k3滿足0.8彡 kl 彡 1.2,-0.4 彡 k2 彡-0.6,-0.4 彡 k3 彡-0.6。根據(jù)本發(fā)明的一個具體實施例,所述掃描窗確定裝置被配置為:對于具有不同尺度和位置的候選掃描窗,確定其所對應的像素區(qū)域是否符合所述特定的顏色分布特征和所述特定的輪廓特征;將其所對應的像素區(qū)域符合所述特定的顏色分布特征和所述特定的輪廓特征的候選掃描窗保留作為所確定的掃描窗。根據(jù)本發(fā)明的再一個方面,還提供了一種移動終端,其包括根據(jù)本發(fā)明的對象識別設備。另外,根據(jù)本發(fā)明的另一方面,還提供了一種存儲介質(zhì)。所述存儲介質(zhì)包括機器可讀的程序代碼,當在信息處理設備上執(zhí)行所述程序代碼時,所述程序代碼使得所述信息處理設備執(zhí)行根據(jù)本發(fā)明的上述方法。此外,根據(jù)本發(fā)明的再一方面,還提供了一種程序產(chǎn)品。所述程序產(chǎn)品包括機器可執(zhí)行的指令,當在信息處理設備上執(zhí)行所述指令時,所述指令使得所述信息處理設備執(zhí)行根據(jù)本發(fā)明的上述方法。
參照下面結(jié)合附圖對本發(fā)明實施例的說明,會更加容易地理解本發(fā)明的以上和其它目的、特點和優(yōu)點。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似的技術特征或部件將采用相同或類似的附圖標記來表示。附圖中:
圖1示出了根據(jù)本發(fā)明的實施例的對象識別方法的各個步驟及其處理結(jié)果的示例;圖2示出了采用投影法計算彩色圖像的膚色響應值的示例;圖3示出了確定掃描窗的準則考慮的情況的示意圖;圖4示出了確定掃描窗的準則考慮的情況的示意圖;圖5示出了手部分類器的訓練流程圖;圖6示出了根據(jù)本發(fā)明的一個實施例的對象識別方法的詳細流程圖;圖7示出了圖6中步驟S601的詳細流程圖;圖8示出了根據(jù)本發(fā)明的一個實施例的對象識別設備的結(jié)構(gòu)方框圖;以及圖9示出了可用于實施根據(jù)本發(fā)明實施例的方法和設備的計算機的示意性框圖。
具體實施例方式在下文中將結(jié)合附圖對本發(fā)明的示范性實施例進行詳細描述。為了清楚和簡明起見,在說明書中并未描述實際實施方式的所有特征。然而,應該了解,在開發(fā)任何這種實際實施例的過程中必須做出很多特定于實施方式的決定,以便實現(xiàn)開發(fā)人員的具體目標,例如,符合與系統(tǒng)及業(yè)務相關的那些限制條件,并且這些限制條件可能會隨著實施方式的不同而有所改變。此外,還應該了解,雖然開發(fā)工作有可能是非常復雜和費時的,但對得益于本公開內(nèi)容的本領域技術人員來說,這種開發(fā)工作僅僅是例行的任務。在此,還需要說明的一點是,為了避免因不必要的細節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關系不大的其他細節(jié)。另外,還需要指出的是,在本發(fā)明的一個附圖或一種實施方式中描述的元素和特征可以與一個或更多個其它附圖或?qū)嵤┓绞街惺境龅脑睾吞卣飨嘟Y(jié)合。下面將參照圖6描述根據(jù)本發(fā)明的一個實施例的對象識別方法的流程。圖6示出了根據(jù)本發(fā)明的一個實施例的對象識別方法的詳細流程圖。如圖6所示,根據(jù)本發(fā)明的一個實施例的對象識別方法,用于識別具有特定的顏色分布特征和特定的輪廓特征的對象,該方法包括如下步驟:根據(jù)顏色分布特征,提取輸入圖像中的輪廓(步驟S601);根據(jù)所述輪廓的特征以及所述顏色分布特征,確定掃描窗(步驟S602);以及對所確定的掃描窗對應的圖像部分分類,確定其是否包含對象(步驟S603)??蛇x地,該方法還包括步驟:根據(jù)所述分類的結(jié)果,輸出對象所在的位置(步驟S604)。本發(fā)明識別的對象應具有特定的顏色分布特征和特定的輪廓特征,也即,根據(jù)對象所具有的顏色分布特征和輪廓特征能夠從圖像或視頻中唯一地確定該對象是否存在。例如,一名中國人的張開的手,其顏色為黃種人的膚色,該膚色具有相對穩(wěn)定的顏色分布范圍;張開的手本身具有特定的輪廓特征,如五個指頭和指頭間的虎口形成了高低不平的輪廓,且輪廓中高低不平的起伏部分位于手部區(qū)域的上方。又例如,一名白種人打出的V字手勢,其顏色為白種人的膚色,該膚色具有穩(wěn)定的顏色分布范圍字手勢具有特定的輪廓特征。本領域技術人員應能理解,本發(fā)明也適用于其它的對象,只要該對象具有可用于識別的特定的顏色分布特征和特定的輪廓特征。例如,對于握緊的拳頭,其顏色為膚色,其輪廓特征為在手部區(qū)域的上方存在高低不平的起伏部分,且該起伏部分的起伏不大。又例如,人的臉部,其顏色為膚色,其輪廓特征為在臉部區(qū)域的中上方存在兩個非膚色空洞(對應于雙眼),臉部區(qū)域中上方的兩側(cè)邊緣各有一個突出部(對應于兩個耳朵)等。再比如,工廠車間背景中,傳送帶上的產(chǎn)品通常具有固定的顏色、形狀等。本領域技術人員只要針對足以用來識別該對象的顏色分布特征和輪廓特征制定相應的識別規(guī)則,即可利用本發(fā)明對該對象進行識別。正如將從下面的具體描述中可以看出的那樣,本發(fā)明并不限于具體的識別對象,而是對于具有特定顏色分布特征和輪廓特征的對象,通過沿輪廓進行掃描來提高對象識別的速度。下面將參照圖1、2和圖7具體描述圖6中的步驟S601。圖1示出了根據(jù)本發(fā)明的實施例的對象識別方法的各個步驟及其處理結(jié)果的示例。圖2示出了采用投影法計算彩色圖像的膚色響應值的示例。圖7示出了圖6中步驟S601的詳細流程圖。首先,將輸入圖像轉(zhuǎn)換為膚色響應圖像(步驟S701)。輸入圖像例如是圖1中的圖1 (a)。在膚色響應圖像中,非膚色區(qū)域內(nèi)的像素的膚色響應值為0,膚色區(qū)域內(nèi)的像素的膚色響應值反映了該像素屬于膚色類的置信度。膚色響應值越大,該像素越可能屬于膚色類。以輸入圖像為彩色圖像為例,輸入圖像的每個像素X可由(r,g,b)表示。發(fā)明人經(jīng)大量的實驗和研究發(fā)現(xiàn),在參見圖 2的RGB空間中,對于黃色皮膚,膚色與非膚色像素在δ瓦軸上的區(qū)分度最大。因此,向量品在軸上的投影能夠反映像素X屬于黃色皮膚的膚色類的置信度。其中,像素X的像素值為(r, g, b),軸5瓦經(jīng)過點D(0, -Vk1, -kg/ki)和點尺(1',0,0),并由0指向1 。向量5又的起點為RGB空間的原點(O,O,O),終點為像素X對應的點(r, g, b),其中系數(shù) Ii1、k2、k3 滿足 0.8 彡 Ii1 彡 1.2,-0.4 彡 k2 彡-0.6,-0.4 彡 k3 彡-0.6。優(yōu)選地,I^1 = I, k2 = -0.5, k3 = -0.5。由于計算向量品在M軸上的投影的計算量較大,因此,可選用如下面公式I的簡化算法,以提高計算速度。V = k^r+ka^g+kg^b(I)其中,V是具有(r,g,b)像素值的像素X的膚色響應值,系數(shù)Hk3滿足0.8彡Ii1 ^ 1.2, -0.4 ^ k2 ^ -0.6, -0.4 ^ k3 ^ -0.6。優(yōu)選地,Ii1 = I, k2 = -0.5, k3 = -0.5。發(fā)明人通過研究發(fā)現(xiàn),還需對根據(jù)公式I計算的膚色響應值(或向量55在M軸上的投影值)進行后處理,以去除偏向紅色段的值和負值(過于遠離紅色段),使得膚色響應值能夠更準確地反映像素X屬于黃色皮膚的膚色類的置信度。后處理由下述公式2表示。
O V <= OS =卜 0<ν<Τ
O ν>=Τ(2)其中,V為根據(jù)公式I計算的膚色響應值或向量品在M軸上的投影值。s為經(jīng)后處理得到的膚色響應值。其中,閾值T可通過收集大量膚色訓練樣本做統(tǒng)計分析得到。
應注意,對于其它膚色的情形,可通過收集大量該膚色的訓練樣本做統(tǒng)計分析,從而得到對于該膚色而言,膚色與非膚色像素的區(qū)分度最大的軸(即通過統(tǒng)計分析得出系數(shù)k1、k2、k3)以及閾值τ’。通過計算向量在該軸上的投影,并類似地進行后處理(使用閾值τ’),可計算像素X針對該膚色的膚色響應值。同樣,可通過調(diào)整公式I中的r、g、b的系數(shù)(k1、k2、k3),得到對于其它膚色的投影值計算的簡化計算公式I’。應注意,以上給出的膚色響應計算方法是根據(jù)發(fā)明人的研究,提出的優(yōu)選計算方法及其簡化算法。本技術領域內(nèi)其它的膚色響應值計算方法均可在此使用,只要所計算的膚色響應值能夠反映像素X屬于某膚色類的置信度。例如,對于灰色圖像,可將屬于某一灰度值范圍的像素判斷為膚色像素。對于彩色圖像,可將像素(r,g,b)的三個顏色空間的像素值r、g、b分別屬于特定區(qū)間的像素判斷為膚色像素。經(jīng)過步驟S701,得到了由膚色響應值構(gòu)成的、輸入圖像對應的膚色響應圖像,例如圖1中的圖1(b)。接下來,在步驟S702,將膚色響應圖像二值化。二值化可采用圖像處理領域中任何二值化算法,例如全局二值化算法Otsu。經(jīng)步驟S702的處理后,可得到膚色模板,例如圖1中的圖1(c)。例如,膚色模板中值為I的像素對應的圖像像素是膚色像素,膚色模板中值為O的像素對應的圖像像素不是膚色像素。接下來,在步驟S703,去除步驟S702中得到的二值圖像中面積較小的噪聲膚色塊,并填充膚色塊中的空洞。在步驟S703中,可使用本領域內(nèi)已知的去噪和填洞的方法。經(jīng)步驟S703的處理,可得到處理后的膚色模板。例如圖1中的圖1 (d)。至此,經(jīng)步驟S701-S703的處理,得到了輸入圖像對應的膚色響應圖像和處理后的膚色模板。接下來,在步驟S704中,基于步驟S703中得到的處理后的膚色模板,提取膚色區(qū)域輪廓。由于在處理后的膚色模板中,已形成較大的連通域,因此,可使用本技術領域中的任何提取方法,提取連通域的輪廓作為膚色區(qū)域輪廓。應注意,膚色區(qū)域輪廓包括連通域邊緣附近的多個像素,即形成為封閉的像素條帶,并非是一條封閉的像素線。這是為了在后續(xù)的步驟中,對于某一坐標處的像素是否在輪廓內(nèi)進行判斷時,輪廓具有一定的變化閾值范圍,即連通域邊緣上以及邊緣附近的像素都被認為是輪廓的一部分。經(jīng)過步驟S704,可得到膚色區(qū)域的輪廓。例如圖1中的圖1 (e)所示。至此,經(jīng)過步驟S701-S704提取到了輸入圖像中的輪廓。應注意,雖然通過上述步驟S701-S704的介紹,描述了步驟S601的具體實現(xiàn)方式,但是上述給出的步驟僅是作為示例的、優(yōu)選的步驟。本領域技術人員也可使用本技術領域內(nèi)的其它方法來提取輸入圖像中的輪廓。例如,可對輸入圖像進行邊緣檢測,將檢測到的邊緣連成輪廓。下面將參照圖1、3和圖4具體描述圖6中的步驟S602。
圖3示出了確定掃描窗的準則考慮的情況的示意圖。圖4示出了確定掃描窗的準則考慮的情況的示意圖。如上所述,在現(xiàn)有技術中,往往窮舉各種尺度、各個位置的掃描窗。然后采用這些掃描窗進行掃描。由于不加選擇地使用掃描窗對圖像進行掃描,因此造成了巨大的計算量。本發(fā)明人意識到可通過對候選掃描窗進行選擇,有效地降低計算量。因此,在步驟S602中,根據(jù)所述輪廓的特征以及所述顏色分布特征,確定掃描窗。以下,仍以中國人的張開的手為例進行說明。然而,本領域技術人員應能理解,只要要識別的對象具有特定的顏色分布特征和特定的輪廓特征,兩者足以識別出對象,即可使用該顏色分布特征和輪廓特征來確定掃描窗。對于張開的手,可利用如下規(guī)則I或規(guī)則2確定掃描窗。規(guī)則1:對每一個尺度為WXh像素的候選掃描窗,判斷位于該候選掃描窗的中心點C上方、與中心點C相距必=的像素點P1,和位于中心點C上方、與中心點C相距4 =\h的像素點P2是否在步驟S602中提取的輪廓內(nèi)。w、h的最小值例如是24,最大值例如是輸入圖像的寬和高的像素數(shù)。如果像素點P1和P2中的至少一個在輪廓內(nèi),則保留該候選掃描窗,作為確定的掃描窗。否則,忽略該候選掃描窗。如圖3所示,設置Cl1的目的是檢測手指合攏的情況,而設置d2的目的是檢測手指分開的情況。也即,由于張開的手具有圖3中所示的特定的輪廓特征,因此可指定表征該特征的準則,并依據(jù)該準則進行檢測。應注意:雖然為了識別手指合攏和手指分開兩種情況下的手而給出了像素點PpP2O但并不必須同時檢測像素點P1和P2。只檢測像素點P1和P2之一時,只檢測例如手指合攏的手,也能檢測到張開的手,只是檢測到張開的手的檢出率有所降低而已。通過規(guī)則1,能夠排除其對應的像素區(qū)域不包括輪廓的掃描窗、其對應的像素區(qū)域中包括的輪廓不具有與張開的手相同的輪廓特征的掃描窗等。由于存在如圖4中所示的情形,因此,為了進一步減少不必要的掃描窗,提出了作為規(guī)則I的改進的規(guī)則2:對每一個尺度為wXh像素的候選掃描窗,判斷位于該候選掃描窗的中心點C上方、與中心點C相距名=f/2的像素點P1,和位于中心點C上方、與中心點C相距4 = M的像素點P2是否在步驟S602中提取的輪廓內(nèi),并且判斷中心點C是否是膚色像素。如果像素點P1和P2中的至少一個在輪廓內(nèi),并且中心點C是膚色像素,則保留該候選掃描窗,作為確定的掃描窗。否則,忽略該候選掃描窗。根據(jù)如上所述處理后的膚色模板,判斷中心點C是否是膚色像素。例如,處理后的膚色模板中值為I的像素對應的圖像像素是膚色像素。要求窗口中心點C必須落在膚色連通區(qū)域內(nèi),可以進一步快速略過部分非手區(qū)域,排除具有部分符合被檢測對象的輪廓特征但不符合被檢測對象的顏色分布特征的像素區(qū)域?qū)膾呙璐?。S卩,對于具有不同尺度和位置的候選掃描窗,確定其所對應的像素區(qū)域是否符合要識別的對象所具有的特定顏色分布特征和特定輪廓特征,將其所對應的像素區(qū)域符合所述特定顏色分布特征和所述特定輪廓特征的候選掃描窗保留作為所確定的掃描窗。
所述輪廓特征包括:所提取的輪廓與所述掃描窗具有特定位置關系。所述顏色分布特征包括:所述掃描窗內(nèi)特定區(qū)域具有或者不具有特定的顏色。由于通過輪廓特征和顏色特征對候選掃描窗進行了篩選,因此,所確定的掃描窗均沿著要識別的對象(如中國人的張開的手)的輪廓分布。從而,能夠沿著輪廓搜索對象,在不犧牲識別結(jié)果的質(zhì)量的情況下,大大地減少了計算量。如上所述,只要對象具有足以用來識別出該對象的顏色分布特征和輪廓特征,就可以設計相應的規(guī)則,對其進行識別。例如,對于握緊的拳頭,其顏色為膚色,其輪廓特征與張開的雙手中手指分開的情形類似,只要通過統(tǒng)計,取適當?shù)膁2的值,即可針對像素點P2 (對尺度為wXh像素的候選掃描窗,位于候選掃描窗的中心點C上方、與中心點C相距d2的像素點)對于人的臉部、工廠車間中傳送帶上的產(chǎn)品或半成品、交通攝像頭、交通信號燈、汽車牌照等其它對象,可以根據(jù)其相對穩(wěn)定的顏色分布范圍和輪廓特征,設計相應的規(guī)則,以對其進行識別。下面將參照圖5具體描述圖6中的步驟S603。圖5示出了手部分類器的訓練流程圖。在步驟S603中,對所確定的掃描窗對應的圖像部分分類,確定其是否包含對象。可通過使用訓練好的分類器實現(xiàn)步驟S603。分類器的輸入是掃描窗對應的像素區(qū)域,該像素區(qū)域可以是原始的輸入圖像,也可以是如圖1中圖1(b )例示的膚色響應圖像。只要分類器被訓練時與訓練好的分類器在使用時所接收的輸入是同一類型圖像即可。由于膚色響應圖像反映了要識別的對象的顏色分布特征,因此,采用膚色響應圖像作為輸入時,分類器的分類結(jié)果更為準確。分類器的輸出包括掃描窗對應的像素區(qū)域內(nèi)包含對象(如中國人張開的手)的置信度。分類器的訓練是事先離線進行的,可以包括如下步驟:首先,收集大量訓練圖像,并將其分類并標記為正樣本和負樣本。在對象為中國人的張開的手的情況下,正樣本是包含中國人的張開的手的各種樣本,負樣本是不含中國人的張開的手的任意背景圖像。接著,優(yōu)選地,將彩色訓練圖像轉(zhuǎn)換為膚色響應圖像。然后,用任何已知的訓練算法構(gòu)造分類器。分類器的訓練算法例如包括Adaboost、SVM 等。Adaboost 可由如下文獻獲得:Viola, P.(2002).Robust real-time object
detection.1JCV0 SVM 可由如下文獻獲得:P.H.Chen, C.J.Lin, and B.Scholkopf
A tutorial on v-support vector machines, App1.Stoch.Models.Bus.1nd.2005,21,111-136。訓練好的分類器可用于步驟S603中,以對所確定的掃描窗對應的圖像部分分類,確定其是否包含對象。在步驟S603中對掃描窗對應的圖像部分分類后,在步驟S604,根據(jù)所述分類的結(jié)果,輸出對象所在的位置。可將分類器輸出響應最高的掃描窗作為對象所在的區(qū)域,也可將被分類為確定包含對象的掃描窗對應的像素區(qū)域合并作為對象所在的區(qū)域。
圖8示出了根據(jù)本發(fā)明的一個實施例的對象識別設備的結(jié)構(gòu)方框圖。如圖8所示,根據(jù)該實施例的對象識別設備800用于識別具有特定的顏色分布特征和特定的輪廓特征的對象,該對象識別設備800包括:輪廓提取裝置801,用于根據(jù)顏色分布特征提取輸入圖像中的輪廓;掃描窗確定裝置802,用于根據(jù)所述輪廓的特征以及所述顏色分布特征確定掃描窗;以及對象確定裝置803,用于對所確定的掃描窗對應的圖像部分分類,確定其是否包含對象??蛇x地,該對象識別設備800還包括對象位置輸出裝置804,用于根據(jù)所述分類的結(jié)果輸出對象所在的位置。所述輪廓提取裝置801被配置為:對于具有顏色值(r,g,b)的像素X,計算其顏色響應值V = k1*r+k2*g+k3*b,并基于顏色響應值v提取候選對象輪廓,其中系數(shù)H k3滿足 0.8 彡 k!彡 1.2,-0.4 彡 k2 彡-0.6,-0.4 彡 k3 彡-0.6。或者,所述輪廓提取裝置801被配置為:對于具有顏色值(r,g,b)的像素X,計算RGB空間中向量在軸M上的投影,并基于投影值V提取候選對象輪廓;其中,向量55的起點為RGB空間的原點(0,0,O),終點為像素X對應的點(r,g,b);軸應經(jīng)過點D (0,_k2/kl,-k3/kl)和點 R(r,0,0),并由 D指向 R,其中系數(shù) kl、k2、k3 滿足 0.8 彡 kl ( 1.2,-0.k2 ( -0.6,-0.4 彡 k3 彡-0.6。所述輪廓提取裝置801被進一步配置為根據(jù)下述公式對投影值或顏色響應值V進行后處理
權(quán)利要求
1.一種對象識別方法,用于識別具有特定的顏色分布特征和特定的輪廓特征的對象,所述方法包括如下步驟: 根據(jù)顏色分布特征,提取輸入圖像中的輪廓; 根據(jù)所述輪廓特征以及所述顏色分布特征,利用所提取的輪廓來確定掃描窗;以及 對所確定的掃描窗對應的圖像部分分類,確定其是否包含對象。
2.如權(quán)利要求1所述的方法,其中,所述對象為具有相對穩(wěn)定的顏色分布范圍的對象,所述提取步驟包括:對于具有顏色值(r,g,b)的像素X,計算其顏色響應值V =k1*r+k2*g+k3*b,并基于顏色響應值v提取候選對象輪廓,其中系數(shù)Hk3滿足0.8彡Ii1彡1.2,-0.4 ≤ k2 ≤-0.6,-0.4 ≤ k3 ≤-0.6。
3.如權(quán)利要求1所述的方法,其中,所述對象為具有相對穩(wěn)定的顏色分布范圍的對象,所述提取步驟包括:對于具有顏色值Cr, g,b)的像素X,計算RGB空間中向量品在軸上的投影,并基于投影值V提取候選對象輪廓; 其中,向量δ艾的起點為RGB空間的原點(O,O,O),終點為像素X對應的點(r,g,b);軸M經(jīng)過點D (O,-Vk1^k3A1)和點R(r,O,O),并由D指向R,其中系數(shù)Hk3滿足0.8彡Ii1 ( 1.2,-0.4 ≤ k2 ≤-0.6,-0.4 ≤ k3 ≤-0.6。
4.如權(quán)利要求1所述的方法,其中,所述確定掃描窗的步驟包括: 對于具有不同尺度和位置的候選掃描窗,確定其所對應的像素區(qū)域是否符合所述特定的顏色分布特征和所述特定的輪廓特征; 將其所對應的像素區(qū)域符合所述特定的顏色分布特征和所述特定的輪廓特征的候選掃描窗保留作為所確定的掃描窗。
5.如權(quán)利要求4所述的方法,其中, 所述特定的輪廓特征包括:所提取的輪廓與所述掃描窗具有特定位置關系。
所述特定的顏色分布特征包括:所述掃描窗內(nèi)特定區(qū)域具有或者不具有特定的顏色。
6.如權(quán)利要求5所述的方法,其中, 所述對象包括張開的手; 所述特定位置關系包括:與所述掃描窗的中心點具有預定位置關系的點在所提取的輪廓內(nèi); 所述顏色分布特征包括:所述中心點對應的像素具有膚色。
7.一種對象識別設備,用于識別具有特定的顏色分布特征和特定的輪廓特征的對象,所述設備包括: 輪廓提取裝置,用于根據(jù)顏色分布特征提取輸入圖像中的輪廓; 掃描窗確定裝置,用于根據(jù)所述輪廓特征以及所述顏色分布特征利用所提取的輪廓來確定掃描窗;以及 對象確定裝置,用于對所確定的掃描窗對應的圖像部分分類,確定其是否包含對象。
8.如權(quán)利要求7所述的設備,其中,所述對象為具有相對穩(wěn)定的顏色分布范圍的對象,所述輪廓提取裝置被配置為:對于具有顏色值(r,g,b)的像素X,計算其顏色響應值V =k1*r+k2*g+k3*b,并基于顏色響應值v提取候選對象輪廓,其中系數(shù)Hk3滿足0.8彡Ii1彡1.2,-0.4 彡 k2 彡-0.6,-0.4 彡 k3 彡-0.6。
9.如權(quán)利要求7所述的設備,其中,所述掃描窗確定裝置被配置為:對于具有不同尺度和位置的候選掃描窗,確定其所對應的像素區(qū)域是否符合所述特定的顏色分布特征和所述特定的輪廓特征; 將其所對應的像素區(qū)域符合所述特定的顏色分布特征和所述特定的輪廓特征的候選掃描窗保留作為所確定的掃描窗。
10.一種移動終端,包 括如權(quán)利要求7-9中任一項所述的對象識別設備。
全文摘要
本發(fā)明公開了一種對象識別方法和對象識別設備。根據(jù)本發(fā)明的對象識別方法用于識別具有特定的顏色分布特征和特定的輪廓特征的對象,所述方法包括如下步驟根據(jù)顏色分布特征,提取輸入圖像中的輪廓;根據(jù)所述輪廓的特征以及所述顏色分布特征,確定掃描窗;以及對所確定的掃描窗對應的圖像部分分類,確定其是否包含對象。
文檔編號G06K9/62GK103208005SQ20121001134
公開日2013年7月17日 申請日期2012年1月13日 優(yōu)先權(quán)日2012年1月13日
發(fā)明者范偉, 皆川明洋, 孫俊, 堀田悅伸, 直井聰 申請人:富士通株式會社