專(zhuān)利名稱(chēng):基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種模式識(shí)別領(lǐng)域的方法,特別是一種基于級(jí)聯(lián)分類(lèi)和哈 夫圓變換的人眼狀態(tài)檢測(cè)方法。
技術(shù)背景人眼檢測(cè)指的是在一幅圖像中檢測(cè)人眼區(qū)域,狀態(tài)檢測(cè)指的是通過(guò)對(duì)人眼 區(qū)域的分析,判斷眼睛的睜開(kāi)和閉合狀態(tài)。人眼檢測(cè)在國(guó)內(nèi)外得到了廣泛的研 究和應(yīng)用,包括司機(jī)駕駛疲勞檢測(cè)等方面。人眼檢測(cè)的方法歸納起來(lái)包括利用 紅眼效應(yīng)定位人眼虹膜位置檢測(cè)人眼、利用眼睛灰度值較其它地方低的特性檢 測(cè)人眼、利用模板匹配的方法檢測(cè)人眼等等。但這些方法的不足之處在于,其 假設(shè)條件是在一幅人臉圖像中去檢測(cè)人眼,而且對(duì)檢測(cè)到的人眼沒(méi)做狀態(tài)檢測(cè), 對(duì)于背景較復(fù)雜的圖像,這些方法的性能和效果不夠理想。經(jīng)對(duì)現(xiàn)有技術(shù)的檢索發(fā)現(xiàn),中國(guó)專(zhuān)利申請(qǐng)?zhí)枮?3147472. l的專(zhuān)利描述了一 種基于GaborEye (加博爾眼睛)模型的人眼檢測(cè)方法,該發(fā)明專(zhuān)利涉及一種自 動(dòng)檢測(cè)人臉圖像中人眼中心位置的方法,該方法對(duì)攝像頭采集的人臉圖像采用 人臉檢測(cè)方法檢測(cè)到人臉,并選取合適的Gabor核函數(shù)對(duì)人臉進(jìn)行巻積得到 GaborEye模型,再分割出兩眼所在的區(qū)域。該方法其操作過(guò)程較復(fù)雜,非實(shí)時(shí) 檢測(cè),同時(shí)缺乏對(duì)眼睛狀態(tài)的分析判斷。發(fā)明內(nèi)容本發(fā)明針對(duì)上述現(xiàn)有技術(shù)的不足,提出了一種基于級(jí)聯(lián)分類(lèi)和哈夫圓變換 的人眼狀態(tài)檢測(cè)方法,使用橢圓膚色模型對(duì)圖像進(jìn)行膚色分割預(yù)處理,去除了 背景干擾,而且減小了級(jí)聯(lián)人眼分類(lèi)器的檢測(cè)范圍,提升了檢測(cè)速度和準(zhǔn)確率, 并使用級(jí)聯(lián)人眼分類(lèi)器得到人眼區(qū)域,綜合使用水平投影和哈夫圓變換檢測(cè)方 法分析眼睛的當(dāng)前狀態(tài)。本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的,本發(fā)明包括如下步驟
步驟一,采集人臉圖像;所述的采集人臉圖像,指的是通過(guò)攝像頭等設(shè)備采集RGB顏色空間的人臉圖像。步驟二,對(duì)于步驟一采集到的人臉圖像,使用橢圓膚色模型在YCbCr顏色 空間膚色分割得到膚色區(qū)域位置信息,具體如下① 、將步驟一中采集到的人臉圖像中每個(gè)像素點(diǎn)的RGB值(R, G, B)轉(zhuǎn)換成 (Y, Cb, Cr)值,其中,Y表示亮度信息、Cb表示藍(lán)色的色差信息、Cr表示紅 色的色差信息。② 、設(shè)置橢圓膚色模型的參數(shù);③ 、對(duì)圖像中的每個(gè)像素點(diǎn),進(jìn)行膚色分割,得到二值膚色圖像 、在二值膚色圖像的四連通膚色區(qū)域的邊界中,得到膚色區(qū)域位置信息。 步驟三,使用訓(xùn)練好的級(jí)聯(lián)人眼分類(lèi)器在步驟二提取的膚色區(qū)域位置使用 人眼檢測(cè)窗口遍歷的方式檢測(cè)矩形人眼區(qū)域,得到人眼矩形鏈表,使用矩形合 并方法合并人眼矩形鏈表中的矩形,直到?jīng)]有可以合并的矩形為止,得到合并 后的人眼矩形鏈表;所述的人眼檢測(cè)窗口遍歷的方式,指的是設(shè)定初始檢測(cè)窗口的大小,按照步 長(zhǎng)大小從膚色區(qū)域的左上角開(kāi)始向右移動(dòng),每移動(dòng)一次,便得到一個(gè)檢測(cè)窗口, 如果級(jí)聯(lián)人眼分類(lèi)器將該檢測(cè)窗口里的圖像分類(lèi)為人眼,即檢測(cè)到矩形人眼區(qū) 域,把該矩形人眼區(qū)域加到人眼矩形鏈表中,否則不做任何操作,當(dāng)窗口移至 圖像最右邊時(shí),從下一行開(kāi)始重復(fù)同樣的操作,直至窗口到達(dá)圖像最右下方, 然后以一定倍率擴(kuò)大檢測(cè)窗口,重復(fù)同樣的檢測(cè)過(guò)程,直至窗口的寬度大于指 定的寬度為止。所述的可以合并的矩形,指的是兩個(gè)矩形中,如果一個(gè)矩形中心包含在另 一個(gè)矩形之中,則這兩個(gè)矩形應(yīng)當(dāng)合并成一個(gè)矩形。所述的矩形合并方法,是指將兩個(gè)要合并的矩形的左上角坐標(biāo)值平均得到 新的坐標(biāo)值,把該坐標(biāo)值作為合并后的矩形的左上角坐標(biāo)值,同時(shí)將兩個(gè)矩形 的長(zhǎng)和寬分別平均得到新的長(zhǎng)和寬,并把新的長(zhǎng)和寬作為合并后的矩形的長(zhǎng)和 寬,這樣便確定了合并后的矩形的大小和位置,將合并后的矩形加到人眼矩形 鏈表中,并從人眼矩形鏈表中刪除對(duì)應(yīng)的兩個(gè)要合并的矩形。
步驟四,對(duì)于步驟三的合并后的人眼矩形鏈表中的每個(gè)矩形人眼區(qū)域,依 次使用Sobel (索貝爾)算子進(jìn)行邊緣檢測(cè)和二值化得到二值圖像;所述邊緣檢測(cè)和二值化,是指對(duì)矩形人眼區(qū)域,首先利用高斯濾波器濾波, 得到平滑后的灰度圖像,對(duì)灰度圖像用Sobel算子,進(jìn)行邊緣檢測(cè),得到一幅 梯度圖像,最后采用閾值法,設(shè)定閾值,遍歷該梯度圖像,將大于或等于閾值 的像素點(diǎn)作為邊緣點(diǎn),小于設(shè)定閾值的像素點(diǎn)作為背景點(diǎn),得到二值圖像。所述Sobel算子,包括水平檢測(cè)算子和垂直檢測(cè)算子,具體如下水平檢測(cè)算子^-1 —2 —10 0 01 2 1垂直檢測(cè)算子=一l 0 1 _2 0 2 _1 0 1水平檢測(cè)算子對(duì)水平方向的灰度值變化敏感,垂直檢測(cè)算子對(duì)垂直方向的灰 度值變化敏感。步驟五,對(duì)于步驟四得到的每幅二值圖像,依次使用水平投影方法檢測(cè)人 眼狀態(tài);所述水平投影方法,是指累加水平方向上邊緣點(diǎn)的數(shù)目,得到水平投影 向量,在該水平投影向量中,如果存在兩個(gè)足夠大且靠得足夠近的高峰,判斷 該人眼當(dāng)前狀態(tài)是閉眼,如果不存在兩個(gè)足夠大且靠得足夠近的高峰,則不能 確定當(dāng)前狀態(tài)為閉眼,那么跳至步驟六。所述的足夠大,指的是水平方向上邊緣點(diǎn)的數(shù)目累加值大于第一閾值,該 第一閾值的大小范圍在wx0.2和wx0.35之間,所述的w是二值圖像的寬;所述的足夠近,指的是水平投影向量的兩個(gè)高峰的下標(biāo)差值小于或等于第 二閾值,該第二閾值的大小范圍在wx0.15和wx0.25之間,所述的w是二值圖 像的寬。步驟六,如果步驟五不能確定當(dāng)前狀態(tài)是閉眼,則使用哈夫圓變換檢測(cè)方 法進(jìn)一步檢測(cè)人眼狀態(tài)。所述哈夫圓變換檢測(cè)方法,是指根據(jù)不同人眼大小和距離攝像頭遠(yuǎn)近的 關(guān)系而造成的圖像中眼睛的大小變化,選擇半徑變換范圍,使用哈夫圓變換得 到圓心位置和對(duì)應(yīng)的半徑,哈夫圓變換得到圓心位置和半徑之后,統(tǒng)計(jì)圓周上 邊緣點(diǎn)的數(shù)目和連續(xù)弧的邊緣點(diǎn)數(shù)目,并保存在數(shù)組中,統(tǒng)計(jì)數(shù)組中超過(guò)1/2
圓周的連續(xù)弧的數(shù)目M,統(tǒng)計(jì)數(shù)組中超過(guò)1/3圓周的連續(xù)弧的數(shù)目N,如果邊緣 點(diǎn)的數(shù)目大于等于20,并且M》1或N>2,判斷為睜眼,否則判斷為閉眼。 所述的連續(xù)弧,是指在圓周上間隔不超過(guò)2個(gè)像素點(diǎn)的相鄰邊緣點(diǎn)。 與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果本發(fā)明集成了圖像采集、人 眼檢測(cè)以及眼睛狀態(tài)分析,通過(guò)橢圓膚色模型進(jìn)行膚色分割,有效減小了級(jí)聯(lián) 人眼分類(lèi)器的檢測(cè)范圍,檢測(cè)速度提升了 1倍以上,使誤檢率降低到原來(lái)的一 半,準(zhǔn)確率提高了 20°/。,利用水平投影和哈夫圓變換檢測(cè)分析眼睛狀態(tài),則進(jìn)一 步分析了可能的眼睛當(dāng)前狀態(tài)。本發(fā)明實(shí)時(shí)檢測(cè)人眼和分析其狀態(tài),用于要求 注意力高度集中的工作場(chǎng)所,包括司機(jī)駕駛、工廠的監(jiān)控室等等。
圖l是本發(fā)明工作流程示意圖;圖2是本發(fā)明級(jí)聯(lián)人眼分類(lèi)器檢測(cè)流程示意圖;圖3是本發(fā)明二值圖像水平投影示意圖。
具體實(shí)施方式
下面結(jié)合附圖對(duì)本發(fā)明的實(shí)施例作詳細(xì)說(shuō)明本實(shí)施例在以本發(fā)明技術(shù)方案 為前提下進(jìn)行實(shí)施,給出了詳細(xì)的實(shí)施方式和過(guò)程,但本發(fā)明的保護(hù)范圍不限 于下述的實(shí)施例。如圖1所示,本實(shí)施例包括如下步驟.-步驟一,通過(guò)USB攝像頭采集RGB顏色空間的人臉圖像;步驟二,對(duì)于步驟一采集到的人臉圖像,使用橢圓膚色模型在YCbCr顏色 空間得到膚色區(qū)域位置信息,具體如下①將步驟一中采集到的人臉圖像中每個(gè)像素點(diǎn)的RGB值(R, G, B),通過(guò)下 式轉(zhuǎn)換成(Y, Cb, Cr)值:7 = 0.299及+ 0.587G + 0.1145< Cb=-" + ! + 128 6 3 2C產(chǎn)U —A + 128 _ 2 12 12其中,Y表示亮度信息、Cb表示藍(lán)色的色差信息、Cr表示紅色的色差信息。
所述的轉(zhuǎn)換,是指將象素中的亮度信息Y、藍(lán)色的色差信息Cb、紅色的色 差信息Cr分離出來(lái),從而減少外界光照環(huán)境對(duì)結(jié)果的影響。② 設(shè)置橢圓膚色模型的參數(shù)及其值如下式所示<formula>formula see original document page 10</formula>a是指橢圓的橫軸長(zhǎng)度,b是指橢圓的縱軸長(zhǎng)度,Cx是指膚色宇間原點(diǎn)在 YCbCr空間的Cb坐標(biāo),Cy指膚色空間原點(diǎn)在YCbCr空間的Cr坐標(biāo),9為兩個(gè) 空間的夾角,ecx為橢圓在膚色空間的X坐標(biāo),ecy為橢圓在膚色空間的Y坐標(biāo)。③ 對(duì)圖像中的每個(gè)像素點(diǎn),進(jìn)行膚色分割,得到二值膚色圖像 由該像素點(diǎn)在YCbCr空間的值為(Y, Cb, Cr)按下列公式計(jì)算該像素點(diǎn)的膚色值<formula>formula see original document page 10</formula>如果該膚色值小于l,則該像素點(diǎn)屬于膚色區(qū)域,設(shè)置二值膚色圖像中該像素點(diǎn)為膚色點(diǎn);否則不屬于膚色區(qū)域,設(shè)置二值膚色圖像中該像素點(diǎn)為背景點(diǎn)。④ 在二值膚色圖像中的四連通膚色區(qū)域的邊界中,得到膚色區(qū)域位置信息。 所述的四連通膚色區(qū)域,是指從膚色區(qū)域內(nèi)任一像素點(diǎn)出發(fā),通過(guò)上、下、左、右四個(gè)方向可以到達(dá)膚色區(qū)域內(nèi)的任意像素點(diǎn)。步驟三,使用訓(xùn)練好的級(jí)聯(lián)人眼分類(lèi)器在步驟二提取的膚色區(qū)域位置使用 人眼檢測(cè)窗口遍歷的方式檢測(cè)矩形人眼區(qū)域,得到人眼矩形鏈表,使用矩形合 并方法合并人眼矩形鏈表中的矩形,直到?jīng)]有可以合并的矩形為止,得到合并 后的人眼矩形鏈表;所述的訓(xùn)練級(jí)聯(lián)人眼分類(lèi)器,包括采集訓(xùn)練樣本和訓(xùn)練分類(lèi)器兩個(gè)過(guò)程。 所述的采集訓(xùn)練樣本,指的是采集正片樣本和采集負(fù)片樣本。正片指的是 人眼樣本,正片樣本的數(shù)量為一千到四千張,采集正片樣本指的是通過(guò)從包含 睜開(kāi)人眼的圖片中裁剪出矩形人眼區(qū)域,并經(jīng)過(guò)大小歸一化,得到24X24大小 的正片樣本;負(fù)片指的是非人眼樣本,負(fù)片的數(shù)量為正片的3到4倍,采集負(fù)
片樣本指的是從非人臉圖像如高分辨率的自然風(fēng)景圖片中截取分割出非人眼圖 片,并經(jīng)過(guò)大小歸一化,得到24X24大小的負(fù)片樣本。所述的訓(xùn)練分類(lèi)器,指的是訓(xùn)練弱分類(lèi)器、組合弱分類(lèi)器得到強(qiáng)分類(lèi)器以 及組合強(qiáng)分類(lèi)器得到級(jí)聯(lián)人眼分類(lèi)器。所述的訓(xùn)練弱分類(lèi)器指的是通過(guò)計(jì)算訓(xùn) 練樣本的Harr特征值和統(tǒng)計(jì)使用該特征值對(duì)訓(xùn)練樣本進(jìn)行分類(lèi)得到的錯(cuò)誤率, 選取出使訓(xùn)練樣本分類(lèi)錯(cuò)誤率最小的Harr特征及閾值的組合;所述的組合弱分 類(lèi)器得到強(qiáng)分類(lèi)器,指的是將弱分類(lèi)器根據(jù)AdaBoost (Adaptive Boosting,自 適應(yīng)提升)算法組合得到一個(gè)強(qiáng)分類(lèi)器;所述的組合強(qiáng)分類(lèi)器得到級(jí)聯(lián)人眼分 類(lèi)器,是指在訓(xùn)練過(guò)程中根據(jù)預(yù)先設(shè)定的級(jí)聯(lián)人眼分類(lèi)器正確率閾值(如 98.5%),調(diào)整強(qiáng)分類(lèi)器的個(gè)數(shù),直至分類(lèi)正確率達(dá)到正確率閾值時(shí)停止訓(xùn)練。所述的級(jí)聯(lián)人眼分類(lèi)器是由多個(gè)強(qiáng)分類(lèi)器組合而成,只有級(jí)聯(lián)人眼分類(lèi)器 中的所有強(qiáng)分類(lèi)器將待檢測(cè)圖像分類(lèi)為人眼時(shí),才表示級(jí)聯(lián)人眼分類(lèi)器將該檢 測(cè)圖像分類(lèi)為人眼。如圖2所示,所述的人眼檢測(cè)窗口遍歷的方式,指的是設(shè)定初始檢測(cè)窗口的 大小,如2*2,按照步長(zhǎng)大小為1從膚色區(qū)域的左上角開(kāi)始向右移動(dòng),每移動(dòng)一 次,便得到一個(gè)檢測(cè)窗口,如果級(jí)聯(lián)人眼分類(lèi)器將該檢測(cè)窗口里的圖像分類(lèi)為 人眼,即檢測(cè)到矩形人眼區(qū)域,把該矩形人眼區(qū)域加到人眼矩形鏈表中;否則 不做任何操作;當(dāng)窗口移至圖像最右邊時(shí),從下一行開(kāi)始重復(fù)同樣的操作,直 至窗口到達(dá)圖像最右下方。然后以一定倍率如1.5倍擴(kuò)大檢測(cè)窗口,此時(shí)窗口由 2*2變成3*3,重復(fù)同樣的檢測(cè)過(guò)程,直至窗口的寬度大于指定的寬度閾值20 為止。所述的可以合并的矩形,指的是兩個(gè)矩形中,如果一個(gè)矩形中心包含在另一 個(gè)矩形之中,則這兩個(gè)矩形應(yīng)當(dāng)合并成一個(gè)矩形。所述的矩形合并方法,是指將兩個(gè)要合并的矩形的左上角坐標(biāo)值平均得到 新的坐標(biāo)值,把該坐標(biāo)值作為合并后的矩形的左上角坐標(biāo)值,同時(shí)將兩個(gè)矩形 的長(zhǎng)和寬分別平均得到新的長(zhǎng)和寬,并把新的長(zhǎng)和寬作為合并后的矩形的長(zhǎng)和 寬,這樣便確定了合并后的矩形的大小和位置,將合并后的矩形加到人眼矩形 鏈表中,并從人眼矩形鏈表中刪除對(duì)應(yīng)的兩個(gè)要合并的矩形。步驟四,對(duì)于步驟三的合并后的人眼矩形鏈表中的每個(gè)矩形人眼區(qū)域,依次使用Sobel (索貝爾)算子進(jìn)行邊緣檢測(cè)和二值化得到二值圖像; 所述邊緣檢測(cè)和二值化,具體如下① 使用高斯濾波器對(duì)矩形人眼區(qū)域進(jìn)行濾波;② 使用Sobel算子進(jìn)行邊緣檢測(cè),得到一幅梯度圖像; 所述的Sobel算子,包括水平檢測(cè)算子和垂直檢測(cè)算子,具體如下:水平檢測(cè)算子:—1 一2 -l0 0 01 2 1,垂直檢測(cè)算子=-1 0 1 _2 0 2 —1 0 1水平檢測(cè)算子對(duì)水平方向的灰度值變化敏感;垂直檢測(cè)算子對(duì)垂直方向的灰 度值變化敏感。在利用Sobel邊緣檢測(cè)的過(guò)程中,取水平方向和垂直方向中的梯度絕對(duì)值最 大的作為該像素點(diǎn)的梯度值。③使用閾值法對(duì)梯度圖像進(jìn)行二值化,得到二值圖像。所述的閾值法二值化,指的是選取一個(gè)閾值等于128,大于等于128的作為 邊緣,小于128的作為背景,這樣得到的是一幅二值圖像。步驟五,對(duì)于步驟四得到的二值圖像,使用水平投影方法分析人眼狀態(tài)。所述水平投影方法分析人眼狀態(tài),具體如下① 對(duì)于步驟四中得到的二值圖像,如圖3 (a)所示,累加水平方向上邊緣 點(diǎn)的數(shù)目,得到水平投影向量,如圖3 (b)所示;② 如果在水平投影向量中存在兩個(gè)足夠大且靠得足夠近的高峰,則判斷該 人眼圖像是一幅閉眼圖像,如果不存在兩個(gè)足夠大且靠得足夠近的高峰,則不 能確定當(dāng)前狀態(tài)為閉眼,那么跳至步驟六。所述的足夠大,是指水平方向上邊緣點(diǎn)的數(shù)目累加值比閾值大12,所述的 足夠近,是指兩個(gè)水平投影向量的兩個(gè)高峰的下標(biāo)相差比閾值小8。步驟六,如果步驟五不能確定當(dāng)前狀態(tài)是閉眼,則使用哈夫圓變換檢測(cè)方 法進(jìn)一步分析人眼狀態(tài)。所述的哈夫圓變換檢測(cè)方法,具體如下①定義維度為mxn的Accumulator (累積矩陣)并設(shè)其初始值為0,其中m 是步驟四中二值圖像的高,n是步驟四中二值圖像的寬;② 根據(jù)不同人眼大小和距離攝像頭遠(yuǎn)近的關(guān)系而造成的圖像中眼睛的大小 變化,選擇半徑范圍,半徑在最小半徑rmi。和最大半徑rmax之間;本實(shí)施例在320*240的人臉圖像中,半徑r的范圍設(shè)置為[5, 20]。③ 對(duì)半徑范圍中的每個(gè)整數(shù)值半徑,遍歷步驟四中的二值圖像,忽略所有 的背景像素點(diǎn),而對(duì)每個(gè)邊緣像素點(diǎn),作哈夫圓變換,得到不同半徑對(duì)應(yīng)的圓 心坐標(biāo);所述的哈夫圓變換,具體如下a、 以圖像的左上角為原點(diǎn),建立X-Y坐標(biāo)系,其中向右為X軸正方向,向 下為Y軸正方向,X-Y坐標(biāo)系中像素點(diǎn)坐標(biāo)為(x,y),其中x是該像素點(diǎn)的X坐 標(biāo),y是該像素點(diǎn)的Y坐標(biāo),圓心位置的X坐標(biāo)范圍為最小X坐標(biāo)lowX^-r, 最大X坐標(biāo)highX =x+r,如果lowX小于0,則lowX:O;如果highX大于w-1, 則highX^-l,其中w為二值圖像的寬;b、 對(duì)[iowx, high幻中的每個(gè)整數(shù)值jc',按如下公式計(jì)算y、少",得到兩個(gè)候選圓的圓心位置0c',/)和0c',/'),其中x'指圓心位置的X坐標(biāo),;;'、/'指 的是圓心位置的Y坐標(biāo);<formula>formula see original document page 13</formula>c、 對(duì)/,如果在
之內(nèi),h為二值圖像的高,則Accumulator[:c'][ /]增1;對(duì)/',如果在[O, h-l]之內(nèi),則Accumulator[;c'] [ y"]增l;d、 通過(guò)遍歷累積矩陣?yán)鄯e矩陣Accumulator搜索到最大累積值的坐標(biāo)及其 值;如果該值大于設(shè)定的閾值10,則保存對(duì)應(yīng)的圓心位置和半徑。④ 通過(guò)選取圓周上均勻分布的40個(gè)點(diǎn),統(tǒng)計(jì)不同半徑下檢測(cè)到的圓,其圓 周上的點(diǎn)屬于邊緣點(diǎn)的數(shù)目,并取最大者及其對(duì)應(yīng)的半徑作為最終的圓心和半 徑結(jié)果;⑤ 根據(jù)檢測(cè)到的圓心位置和半徑,判斷眼睛當(dāng)前狀態(tài)。 所述的根據(jù)檢測(cè)到的圓心位置和半徑,判斷眼睛當(dāng)前狀態(tài),具體描述如下: a、統(tǒng)計(jì)圓周上邊緣點(diǎn)的數(shù)目t;b、 統(tǒng)計(jì)連續(xù)弧的邊緣點(diǎn)數(shù)目,并保存在數(shù)組Cc中,所謂連續(xù)弧,是指在 圓周上間隔不超過(guò)2個(gè)像素點(diǎn)的相鄰邊緣點(diǎn);c、 統(tǒng)計(jì)數(shù)組Cc中超過(guò)1/2圓周的連續(xù)弧的數(shù)目M,統(tǒng)計(jì)數(shù)組Cc中超過(guò) 1/3圓周的連續(xù)弧的數(shù)目N;d、 如果圓周上邊緣點(diǎn)的數(shù)目t>20且M)l或N>2,判斷為睜眼;否則判斷為閉眼。在上述步驟結(jié)束后,若判斷出閉眼,發(fā)出聲音警報(bào);如判斷出睜眼,用紅 色x標(biāo)示眼睛虹膜位置。本實(shí)施例通過(guò)橢圓膚色模型進(jìn)行膚色分割,有效減小了級(jí)聯(lián)人眼分類(lèi)器的檢 測(cè)范圍,檢測(cè)速度提升了l倍以上,使誤檢率降低到原來(lái)的一半,準(zhǔn)確率提高 了 20%,而利用水平投影和哈夫圓變換檢測(cè)分析眼睛狀態(tài),則進(jìn)一步檢測(cè)可能的 眼睛當(dāng)前狀態(tài)。
權(quán)利要求
1、一種基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè)方法,其特征在于,包括以下步驟,步驟一,采集人臉圖像;步驟二,對(duì)于步驟一采集到的人臉圖像,使用橢圓膚色模型在YCbCr顏色空間膚色分割得到膚色區(qū)域位置信息;步驟三,使用訓(xùn)練好的級(jí)聯(lián)人眼分類(lèi)器在步驟二提取的膚色區(qū)域位置使用人眼檢測(cè)窗口遍歷的方式檢測(cè)矩形人眼區(qū)域,得到人眼矩形鏈表,使用矩形合并方法合并人眼矩形鏈表中的矩形,直到?jīng)]有可以合并的矩形為止,得到合并后的人眼矩形鏈表;步驟四,對(duì)于步驟三合并后的人眼矩形鏈表中的每個(gè)矩形人眼區(qū)域,依次使用索貝爾算子進(jìn)行邊緣檢測(cè)和二值化得到二值圖像;步驟五,對(duì)于步驟四得到的每幅二值圖像,依次使用水平投影方法檢測(cè)人眼狀態(tài);步驟六,如果步驟五不能確定當(dāng)前狀態(tài)是閉眼,則使用哈夫圓變換檢測(cè)方法進(jìn)一步檢測(cè)人眼狀態(tài)。
2、 根據(jù)權(quán)利要求1所述的基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè)方法, 其特征是,所述得到膚色區(qū)域位置信息,包括如下具體步驟① 、將步驟一中采集到的人臉圖像中每個(gè)像素點(diǎn)的RGB值(R, G, B),轉(zhuǎn)換 成(Y, Cb, Cr)值,其中,Y表示亮度信息、Cb表示藍(lán)色的色差信息、Cr表示 紅色的色差信息;② 、設(shè)置橢圓膚色模型的參數(shù);③ 、對(duì)圖像中的每個(gè)像素點(diǎn),進(jìn)行膚色分割,得到二值膚色圖像; 、在二值膚色圖像的四連通膚色區(qū)域的邊界中,得到膚色區(qū)域位置信息。
3、 根據(jù)權(quán)利要求1所述的基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè)方法, 其特征是,所述的人眼檢測(cè)窗口遍歷的方式,指的是設(shè)定初始檢測(cè)窗口的大小, 按照步長(zhǎng)大小從膚色區(qū)域的左上角開(kāi)始向右移動(dòng),每移動(dòng)一次,便得到一個(gè)檢 測(cè)窗口,如果級(jí)聯(lián)人眼分類(lèi)器將該檢測(cè)窗口里的圖像分類(lèi)為人眼,即檢測(cè)到矩 形人眼區(qū)域,把該矩形人眼區(qū)域加到人眼矩形鏈表中,否則不做任何操作,當(dāng) 窗口移至圖像最右邊時(shí),從下一行開(kāi)始重復(fù)同樣的操作,直至窗口到達(dá)圖像最 右下方,然后以一定倍率擴(kuò)大檢測(cè)窗口,重復(fù)同樣的檢測(cè)過(guò)程,直至窗口的寬 度大于指定的寬度為止。
4、 根據(jù)權(quán)利要求1所述的基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè)方法, 其特征是,所述的可合并的矩形,指的是兩個(gè)矩形中,如果一個(gè)矩形中心包含 在另一個(gè)矩形之中,則這兩個(gè)矩形應(yīng)當(dāng)合并成一個(gè)矩形;所述的矩形合并方法,是指將兩個(gè)要合并的矩形的左上角坐標(biāo)值平均得到 新的坐標(biāo)值,把該坐標(biāo)值作為合并后的矩形的左上角坐標(biāo)值,同時(shí)將兩個(gè)矩形 的長(zhǎng)和寬分別平均得到新的長(zhǎng)和寬,并把新的長(zhǎng)和寬作為合并后的矩形的長(zhǎng)和 寬,這樣便確定了合并后的矩形的大小和位置,將合并后的矩形加到人眼矩形 鏈表中,并從人眼矩形鏈表中刪除對(duì)應(yīng)的兩個(gè)要合并的矩形。
5、 根據(jù)權(quán)利要求1所述的基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè)方法, 其特征是,所述邊緣檢測(cè)和二值化,是指對(duì)矩形人眼區(qū)域,首先利用高斯濾波 器濾波,得到平滑后的灰度圖像,對(duì)灰度圖像用索貝爾算子,進(jìn)行邊緣檢測(cè), 得到一幅梯度圖像,最后采用閾值法,設(shè)定閾值,遍歷該梯度圖像,將大于或 等于閾值的像素點(diǎn)作為邊緣點(diǎn),小于設(shè)定閾值的像素點(diǎn)作為背景點(diǎn),得到二值 圖像。
6、 根據(jù)權(quán)利要求1或5所述的基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè) 方法,其特征是,所述索貝爾算子,包括水平檢測(cè)算子和垂直檢測(cè)算子,具體 如下<formula>formula see original document page 3</formula>水平檢測(cè)算子對(duì)水平方向的灰度值變化敏感,垂直檢測(cè)算子對(duì)垂直方向的灰 度值變化敏感。
7、根據(jù)權(quán)利要求1所述的基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè)方法,其特征是,所述水平投影方法,是指累加水平方向上邊緣點(diǎn)的數(shù)目,得到水 平投影向量,在該水平投影向量中,如果存在兩個(gè)足夠大且靠得足夠近的高峰, 判斷該人眼當(dāng)前狀態(tài)是閉眼,如果不存在兩個(gè)足夠大且靠得足夠近的高峰,則 不能確定當(dāng)前狀態(tài)為閉眼,那么跳至步驟六。
8、 根據(jù)權(quán)利要求7所述的基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè)方法, 其特征是,所述的足夠大,指的是水平方向上邊緣點(diǎn)的數(shù)目累加值大于第一閾 值,第一閾值的大小范圍在wx0.2和wx0.35之間,所述的w是二值圖像的寬;所述的足夠近,指的是水平投影向量的兩個(gè)高峰的下標(biāo)差值小于或等于第 二閾值,第二閾值的大小范圍在wx0.15和wx0.25之間,所述的w是二值圖像 的寬。
9、 根據(jù)權(quán)利要求1所述的基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè)方法, 其特征是,所述的哈夫圓變換檢測(cè)方法,是指根據(jù)不同人眼大小和距離攝像 頭遠(yuǎn)近的關(guān)系而造成的圖像中眼睛的大小變化,選擇半徑變換范圍,使用哈夫 圓變換得到圓心位置和對(duì)應(yīng)的半徑,哈夫圓變換得到圓心位置和半徑之后,統(tǒng) 計(jì)圓周上邊緣點(diǎn)的數(shù)目和連續(xù)弧的邊緣點(diǎn)數(shù)目,并保存在數(shù)組中,統(tǒng)計(jì)數(shù)組中 超過(guò)1/2圓周的連續(xù)弧的數(shù)目M,統(tǒng)計(jì)數(shù)組中超過(guò)1/3圓周的連續(xù)弧的數(shù)目N, 如果邊緣點(diǎn)的數(shù)目大于等于20,并且M》1或N>2,判斷為睜眼,否則判斷為 閉眼。
10、 根據(jù)權(quán)利要求1或9所述的基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè) 方法,其特征是,所述的哈夫圓變換,具體如下① 以圖像的左上角為原點(diǎn),建立X-Y坐標(biāo)系,其中向右為X軸正方向,向 下為Y軸正方向,X-Y坐標(biāo)系中像素點(diǎn)坐標(biāo)為(x,y),其中x是該像素點(diǎn)的X坐 標(biāo),y是該像素點(diǎn)的Y坐標(biāo),圓心位置的X坐標(biāo)范圍為最小X坐標(biāo)lowX:x-r, 最大X坐標(biāo)highX =x+r,如果lowX小于0,則lowX=0;如果highX大于w_l, 則highX^-l,其中w為二值圖像的寬;② 對(duì)[lowX, high幻中的每個(gè)整數(shù)值x',按如下公式計(jì)算/、 /',得到兩個(gè)候選圓的圓心位置Oc',力和(JC',/'),其中x'指圓心位置的X坐標(biāo),/、;;"指 的是圓心位置的Y坐標(biāo); <formula>formula see original document page 5</formula>③ 對(duì)/,如果在[O, h-l]之內(nèi),h為二值圖像的高,則累積矩陣[;c'][ 增l;對(duì)/',如果在[O, h-l]之內(nèi),則累積矩陣[;c'][;;"]增l;④ 通過(guò)遍歷累積矩陣?yán)鄯e矩陣搜索到最大累積值的坐標(biāo)及其值,如果該值大 于設(shè)定的閾值,則保存對(duì)應(yīng)的圓心位置和半徑。
全文摘要
一種模式識(shí)別領(lǐng)域的基于級(jí)聯(lián)分類(lèi)和哈夫圓變換的人眼狀態(tài)檢測(cè)方法,包括以下步驟采集人臉圖像;使用橢圓膚色模型在YCbCr顏色空間膚色分割得到膚色區(qū)域位置信息;使用級(jí)聯(lián)人眼分類(lèi)器在膚色區(qū)域位置使用人眼檢測(cè)窗口遍歷的方式檢測(cè)矩形人眼區(qū)域,并使用矩形合并方法合并矩形,得到合并后的人眼矩形鏈表;對(duì)于合并后的人眼矩形鏈表中的每個(gè)矩形人眼區(qū)域,依次使用索貝爾算子進(jìn)行邊緣檢測(cè)和二值化得到二值圖像;對(duì)于每幅二值圖像,依次使用水平投影方法檢測(cè)人眼狀態(tài);如果還不能確定當(dāng)前狀態(tài)是閉眼,則使用哈夫圓變換檢測(cè)方法進(jìn)一步檢測(cè)人眼狀態(tài)。本發(fā)明利用膚色分割提升人眼檢測(cè)速度,跟蹤分析人的眼睛狀態(tài),適用于注意力檢測(cè)和疲勞度檢測(cè)。
文檔編號(hào)G06K9/62GK101127076SQ20071004647
公開(kāi)日2008年2月20日 申請(qǐng)日期2007年9月27日 優(yōu)先權(quán)日2007年9月27日
發(fā)明者劉決仕, 申瑞民, 晶 金, 剛 陳, 陳華曦 申請(qǐng)人:上海交通大學(xué)