專利名稱:一種二值圖像中前景圖像的定位方法及裝置的制作方法
技術領域:
本發(fā)明涉及視頻分析技術,特別涉及一種二值圖像中前景圖像的定位方法
及裝置。
背景技術:
在智能視頻監(jiān)控中,對視頻中的運動目標進行定位是大部分智能視頻分析 功能的基礎,比如在人流分析、車輛分析、運動物體跟蹤等運用中,都需要對 視頻中的運動目標進行定位。因此定位算法的效率直接影響到視頻監(jiān)控系統(tǒng)的 運行效率。對運動目標進行定位的方法有很多,其中的大部分是利用圖像相減 的方法將視頻中的背景部分去掉,將剩余部分作為前景得到二值圖像,然后對 二值圖像進行處理來定位出運動目標。由于運動目標是一個連通的區(qū)域,基于 前景像素的連通域分析就是一種簡單有效的方法。因此,獲取二值圖像的前景 圖像的效率成為對運動目標定位效率的關鍵。
現(xiàn)有技術一般基于二值圖像來進行前景圖像的處理,背景區(qū)域像素的灰度
值為0,各目標區(qū)域像素的灰度值均為1。背景通??梢钥醋魇且环鶊D像,用
來記錄一個固定的三維空間內(nèi)的長時間處于靜止狀態(tài)的物體的成像。關于背景 圖像的生成和更新,已經(jīng)提出許多的方法可以實現(xiàn)。當該固定的三維空間內(nèi)有 運動物體時,在成像時運動物體就會覆蓋一部分背景區(qū)域,這些被覆蓋的區(qū)域 就是前景,在目標檢測時通常稱前景為目標區(qū)域。除了前景之外的圖像區(qū)域則 成為背景區(qū)域?,F(xiàn)有技術有兩種比較典型的方法來進行處理。第一種是種子搜 索的算法,這種方法從上到下對二值圖像進行搜索,當找到一個前景像素(即 種子點)時,就將該像素放入堆棧。然后搜索該像素的鄰域,如果鄰域中有前 景像素,就將前景像素放入堆棧。當堆棧中每個像素的鄰域都搜索完后,就可
以用所有與種子點連通的前景像素點形成前景圖像。這種方法的實現(xiàn)相對簡
單,但是其不足在于運行效率很低,而且還需要堆棧來存放像素點,當連通 域較大時對存儲空間的要求較高。第二種方法引入掃描的思想,從左到右,從 上到下對二值圖像進行掃描。并需要標識當前正被掃描的像素與在它之前被掃 描到的若干個近鄰像素的連通性,有幾種不同的情況要分別考慮如果它的已 經(jīng)被掃描的鄰域中只有一個為1,那么將它標識為與之相連通的像素,如果它 與兩個或多個目標相連通,則可以認為這些目標實際上是一個。該算法需要兩 次掃描,第一次標識所有像素與鄰域像素的連通關系,第二次掃描將標識不同 但實際上為同一個連通區(qū)域的像素合并到一起。第二種方法不需要堆棧,只需 要兩次掃描就可以完成連通域的分析,因此比第一種方法的效率要高。但其不 足在于該方法也是基于像素來完成的,當圖像較大,前景像素較多時,效率 會下降,即,其效率受處理圖像的像素的多少制約。
發(fā)明內(nèi)容
本發(fā)明提供一種二值圖像中前景圖像的定位方法及裝置,用以提高在二值 圖^象處理中連通域的處理效率。
本發(fā)明提供了 一種二值圖像中前景圖像的定位方法,包括如下步驟
對二值圖像按區(qū)域進行劃分并在掃描后獲取各區(qū)域中的前景像素;
將同 一 區(qū)域中連續(xù)的前景像素組織為段;
將各區(qū)域中連通的段合并后獲得前景圖像。
較佳地,所述將各區(qū)域中連通的段合并具體為
將同 一 區(qū)域中連續(xù)的前景像素組織為段時對段進行標識;
將不同區(qū)域中連通的段的標識進行統(tǒng)一;
根據(jù)標識將二值圖像中標識同 一 的段進行合并。
較佳地,所述按區(qū)域進行劃分具體為以掃描時的行列為單位進行區(qū)域劃
較佳地,所述區(qū)域為掃描的一行或一列。
較佳地,所述將各區(qū)域中連通的段合并具體為
對每行進行掃描,將每行連續(xù)的前景像素組織為段,并對段進行標識; 所述將不同區(qū)域中連通的段的標識進行統(tǒng)一包括對提取出來的各段進行 連通域分析,將相鄰行中相通的段進行同樣的標識,不相通的段標識不相同; 對標識不同但相連通的段之間注明為相連通;根據(jù)注明的連通信息,將標識不 同但是屬于同 一個連通區(qū)域的段統(tǒng)一為相同的標識; 將相同標識的所有l(wèi)殳進行合并。
本發(fā)明還提供了 一種二值圖像中前景圖像的定位裝置,包括 獲取模塊,用于對二值圖像按區(qū)域進行劃分并在掃描后獲取各區(qū)域中的前 景像素;
分段模塊,用于將同 一 區(qū)域中連續(xù)的前景像素組織為段; 合并模塊,用于將各區(qū)域中連通的段合并后獲得前景圖像。
較佳地,所述合并模塊包括
標識單元,用于在所述分段模塊將同一區(qū)域中連續(xù)的前景像素組織為段時 對4殳進行標識;
標識統(tǒng)一單元,用于將不同區(qū)域中連通的段的標識進行統(tǒng)一; 合并單元,用于根據(jù)標識將二值圖像中標識同一的段進行合并。 較佳地,所述獲取模塊進一步包括區(qū)劃單元,用于以掃描時的行列為單位 進行區(qū)域劃分;
獲取模塊,用于在掃描后獲取各所述區(qū)劃單元劃分區(qū)域中的前景像素。 較佳地,所述區(qū)劃單元進一步用于以掃描時的一行或一列為單位進行區(qū)域 劃分。
較佳地,所述分段模塊進一步用于將所述獲取模塊在對每行進行掃描時, 將每行連續(xù)的前景像素組織為段;
標識單元,用于在所述分段模塊將每行連續(xù)的前景像素組織為段時,對段
進行標識;
所述標識統(tǒng)一單元包括分析子單元、標識子單元、同一子單元,其中
分析子單元,用于對提取出來的各段進行連通域分析;
標識子單元,用于根據(jù)所述分析子單元的分析將相鄰行中連通的段進行同樣的標識,不連通的段標識不相同;對標識不同但相連通的段之間注明為相連 通;
同一子單元,用于根據(jù)注明的連通信息,將標識不同但是屬于同一個連通 區(qū)域的段統(tǒng)一為相同的標識;
合并單元,用于將相同標識的所有段進行合并。 本發(fā)明有益效果如下
本發(fā)明在二值圖像中前景圖像的定位中,首先對二值圖像按區(qū)域進行劃分 并在掃描后獲取各區(qū)域中的前景像素;然后將同 一區(qū)域中連續(xù)的前景像素組織 為段;即首先利用快速掃描來將每個區(qū)域相互聯(lián)系的前景像素組織為"段", 然后對相互連通的"段"進行標識;最后根據(jù)標識將各區(qū)域中連通的段合并后 獲得前景圖像。由于將連續(xù)的前景像素組織成"段",那么對實際運算來說, 不管像素有多少,當圖像變大時,像素的數(shù)量會增加,但是"段"的數(shù)量并沒 有增加,其只存在對同一標識的"段,,的標識的處理,并不像現(xiàn)有方法基于每 個像素來進行連通域的分析,當圖像變大時,現(xiàn)有方法運算時因圖像變大而必 須去處理更多的像素,運算量也必將會大大增加,導致運算效率的降低,因為 本發(fā)明不受像素的制約,所以能夠大大提高對二值圖像的處理效率,對大圖像 的處理效果尤其明顯。
圖1為本發(fā)明實施例中所述二值圖像中前景圖像的定位方法實施流程示意
圖2為本發(fā)明實施例中所述以行來劃分區(qū)域的前景圖像定位方法實施流程示意圖3為本發(fā)明實施例中所述基于段的連通域標識示意圖4為本發(fā)明實施例中所述二值圖像中前景圖像的定位裝置結構示意圖5為本發(fā)明實施例中所述二值化后的圖像實際效果示意圖6至圖11為本發(fā)明實施例中所述實施后的實際效果示意圖。
具體實施例方式
本發(fā)明的核心思想是將二值圖像中每行的前景部分提取出來,并組織為 段。因此連通域的分析就可以基于段來實現(xiàn),而不是傳統(tǒng)的基于像素的方法來 實現(xiàn)。基于段的優(yōu)勢在于算法效率不會受圖像大小的影響。而且由于每行的各 段已經(jīng)分開,在進行標識時,只需要判斷當前段和上面一行的段之間的連通關 系,大大的提高了算法效率。下面結合附圖對本發(fā)明基于段的具體實施方式
進 行說明。
圖i為二值圖像中前景圖像的定位方法實施流程示意圖,如圖所示,在前 景圖像定位中可以包括如下步驟
步驟101、對二值圖像按區(qū)域進行劃分并在掃描后獲取各區(qū)域中的前景像
素;
步驟102、將同一區(qū)域中連續(xù)的前景像素組織為段;
步驟103、將各區(qū)域中連通的段合并后獲得前景圖像。
具體的,所述將各區(qū)域中連通的段合并可以是將同一區(qū)域中連續(xù)的前景 像素組織為段時對段進行標識;將不同區(qū)域中連通的段的標識進行統(tǒng)一;根據(jù) 標識將二值圖像中具有同 一標識的段進行合并。
其中,所述按區(qū)域進行劃分可以為以掃描時的行列為單位進行區(qū)域劃分。 當不以掃描時的行列劃分時也可以實施,比如可以先劃出特定面積作為 一個區(qū) 域,然后將這區(qū)域內(nèi)的連續(xù)前景像素點再按段組織等,然后再按段進行合并, 但這樣在判斷前景像素是否連續(xù)時會因為區(qū)域的過大、或者不規(guī)則而耗時較多,所以顯然,按掃描的行列來進行劃分時最能體現(xiàn)出本發(fā)明的效率。
下面為以行為單位劃分區(qū)域時的前景圖像的定位實施進行說明,圖2為以 行來劃分區(qū)域的前景圖4象定位方法實施流程示意圖,本例中所述區(qū)域為掃描的
一行或一列,如圖所示,此時可以按如下步驟實施
步驟201、輸入包含運動目標的二值圖像。
步驟202、從上到下,從左到右對每行進行掃描。
步驟203、將每行連續(xù)的前景像素組織為段,并記錄下來。
步驟204、對段的連通性與段的標識進行處理。
下面結合圖3對本步驟進行說明,圖3為基于段的連通域標識示意圖,如 圖所示,圓圈表示前景像素,圓圈中為該段的標識;含有圓圈的矩形框S1至 S7分別表示本例示意7段,每段中各含4個連續(xù)的前景像素,段分布在掃描的 四行中,其中S1在第一行,S2、 S3在第二行,S4、 S5、 S6在第三行,S7在 第四行,掃描時由上至下進行掃描,即由第一行開始第四行結束。
貝'J,從上到下,從左到右對提取出來的各段進行連通域分析,如杲該段不 能找到與之相連通的段,那么就設置為新標識,否則就將與之連通的段的標識 賦給該段。如果該段和多段相連通,那么就將所有連通的段中標識最小的賦給 該段,并注明所有連通的段的標識屬于同 一個連通區(qū)域。
以圖3為例,當掃描至第一段S1時,由于該段的上方?jīng)]有與之連通的段, 所以將該段標記為1。掃描至S2時,上方的Sl與之相連通,所以就將Sl的 標記賦給S2。而S3與S2并不連通,因此給S3的是新標識2,這樣從上到下, 從左到右依次進行掃描。當掃描至S5時,它的上方有兩段(Sl和S2)與之連 通,此時就將這兩段中標記最小的那個賦給當前段,即將S5的標記設置為1, 同時注明標記1和標記2同屬于一個連通區(qū)域,而S6與S3連通,因此S3的 標記賦給S6為2。
步驟205、根據(jù)注明的連通信息,將標識不同但是屬于同一個連通區(qū)域的 4爻統(tǒng)一標注為相同的標識。
本步驟中將屬于同一個區(qū)域,但是標記不同的,殳合并為相同的區(qū)域。如圖
3中的標記為1和2的段就需要合并為相同的標記,因為在將S5的標記設置為 1,同時也注明標記1和標記2同屬于一個連通區(qū)域,因此本例中標識為1、 2 的段是連通的。在確定其為同一連通區(qū)域時,便可將S1至S7都進行統(tǒng)一的標 識以便下步操作。
步驟206、將相同標識的所有段收集起來,得到所有連通的前景目標。
每行連續(xù)的前景像素組織為段,并對段進行標識;然后對提取出來的各段進行 連通域分析,將相鄰行中相通的段進行同樣的標識,不相通的段標識不相同; 對標識不同但相連通的段之間注明為相連通;根據(jù)注明的連通信息,將標識不 同但是屬于同 一個連通區(qū)域的段統(tǒng)一為相同的標識;最后將相同標識的所有段 進行合并。
本發(fā)明還提供了 一種二值圖像中前景圖像的定位裝置,結合上述對定位方 法的說明,下面對裝置的具體實施方式
進行說明。
圖4為二值圖像中前景圖像的定位裝置結構示意圖,如圖所示,裝置中可 以包括獲取模塊401 、分段模塊402 、合并模塊403;圖中還示出了 二值圖像, 其中圓圈表示前景像素,方框表示對前景像素所分的段,在裝置中
獲取模塊401用于對二值圖像按區(qū)域進行劃分并在掃描后獲取各區(qū)域中的 像素;
分段模塊402則用于將同 一 區(qū)域中連續(xù)的前景像素組織為段; 合并模塊403用于將各區(qū)域中連通的段合并后獲得前景圖像。 裝置中獲取4莫塊還可以進一步包括區(qū)劃單元,用于以掃描時的行列為單位 進行區(qū)域劃分;
獲取模塊則在掃描后獲取各所述區(qū)劃單元劃分區(qū)域中的前景像素。 實施中,區(qū)劃單元可以以掃描時的一行或一列為單位進行區(qū)域劃分。 裝置中的合并模塊403可以包括標識單元、標識統(tǒng)一單元、合并單元,其
中
標識單元,用于在所述分段模塊將同一區(qū)域中連續(xù)的前景像素組織為段時 對l殳進行標識;
標識統(tǒng)一單元,用于將不同區(qū)域中連通的段的標識進行統(tǒng)一;
合并單元,用于根據(jù)標識將二值圖像中標識同一的段進行合并。
實施中,當所述獲取^^莫塊401在對每行進行掃描時,所述分段模塊402則
用于將每行中連續(xù)的前景像素組織為段;合并模塊403中的標識單元在所述分
段模塊402將每行連續(xù)的像素組織為段時,對段進行標識;
合并模塊403中的標識統(tǒng)一單元則可以包括分析子單元、標識子單元、
同一子單元,其中
分析子單元,用于對提取出來的各段進行連通域分析;
標識子單元,用于根據(jù)所述分析子單元的分析將相鄰行中連通的段進行同
樣的標識,不連通的段標識不相同;對標識不同但相連通的段之間注明為相連
通;
同一子單元,用于根據(jù)注明的連通信息,將標識不同但是屬于同一個連通 區(qū)域的段統(tǒng)一為相同的標識;
最后合并模塊403中的合并單元將相同標識的所有段進行合并。
由上述實施例可以看出,本發(fā)明提出了可以在智能視頻監(jiān)控中會經(jīng)常用到 的運動目標快速檢測方法及裝置。本發(fā)明在二值圖像上來完成,二值圖像是用 當前幀圖像和背景圖像相減來得到。和傳統(tǒng)的基于像素點的連通域算法不同, 本發(fā)明提出的算法是基于"段"來實現(xiàn)的,即首先利用快速掃描來將每行的相 互聯(lián)系的前景像素組織為"段",然后對相互連通的"段"進行標識。該算法 對大圖像的效果尤其明顯,因為大圖像的前景像素點較多,必然導致傳統(tǒng)基于 單個像素的算法運算量增加,但是圖像增多并沒有增加每行聯(lián)系"段"的個數(shù)。 也就是說,當像素組織成"段,,后,由于要將連續(xù)的像素組織成"段,,,那么 對實際運算來說,不管像素有多少,當圖像變大時,像素的數(shù)量會增加,但是"段"的數(shù)量并沒有增加,其只存在對同一標識的"段"的標識的處理,而在 現(xiàn)有技術中,傳統(tǒng)的方法基于像素來進行連通域的分析,需要對每個像素進行 處理,所以當圖像變大時,其運算時因圖像變大而必須去處理更多的像素,運 算量也必將會大大增加,所以本發(fā)明提出的方法在對大圖像的處理上也能夠得
到較高的運行效率。
下面再以實際處理結果來說明本發(fā)明的效果。
圖5為二值化后的圖像實際效果示意圖,圖6至圖11為實施后的實際效 果示意圖,圖6至圖11中的白框和白色虛線是用本發(fā)明實際產(chǎn)生的效果,白 色矩形框為根據(jù)本發(fā)明提取的運動目標,運動軌跡以白色虛線表示。圖6至圖 11顯示的是原始的視頻圖像的效果示意,本發(fā)明處理的真實目標實際上是二值 化后的如圖5所示的其中一張圖像,白框是上圖中包含白色前景目標區(qū)域的最 小矩形。為了更好的觀察效果,將白色區(qū)域疊加到原始圖像上獲得圖6至圖11 的效果。對每個運動目標在進行了跟蹤時,便可獲得表示跟蹤軌跡的白色虛線。
從圖6至圖11中可以明顯看出本發(fā)明可以很好的提取出圖中的所有連通 的運動目標。實際中,由于提出了本發(fā)明基于段的連通域標記處理方法,大大 的提高了運動目標的定位效率。在對100張320*240的二值圖像按現(xiàn)有技術進 行測試時,運行時間為平均每張0.949495ms。而用本發(fā)明的方法平均每張的 運行時間為0.161616ms。對大的圖像,運行效率的差別則更為明顯。顯然, 由于處理效率的提高,在智能視頻監(jiān)控系統(tǒng)中,對每幀的圖像都需要進行運動 目標的檢測時,無疑可以大大提高智能視頻監(jiān)控的實時性,并易于往硬件進行 移植。
明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及 其等同技術的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權利要求
1、一種二值圖像中前景圖像的定位方法,其特征在于,包括如下步驟對二值圖像按區(qū)域進行劃分并在掃描后獲取各區(qū)域中的前景像素;將同一區(qū)域中連續(xù)的前景像素組織為段;將各區(qū)域中連通的段合并后獲得前景圖像。
2、 如權利要求1所述的方法,其特征在于,所述將各區(qū)域中連通的段合 并具體為將同 一 區(qū)域中連續(xù)的前景像素組織為段時對段進行標識; 將不同區(qū)域中連通的段的標識進行統(tǒng)一; 根據(jù)標識將二值圖像中標識同 一 的段進行合并。
3、 如權利要求1或2所述的方法,其特征在于,所述按區(qū)域進行劃分具 體為以掃描時的行列為單位進行區(qū)域劃分。
4、 如權利要求3所述的方法,其特征在于,所述區(qū)域為掃描的一行或一列。
5、 如權利要求4所述的方法,其特征在于,所述將各區(qū)域中連通的段合 并具體為對每行進行掃描,將每行連續(xù)的前景像素組織為段,并對段進行標識; 所述將不同區(qū)域中連通的段的標識進行統(tǒng)一包括對提取出來的各段進行 連通域分析,將相鄰行中連通的段進行同樣的標識,不連通的段標識不相同; 對標識不同但相連通的"l殳之間注明為相連通;根據(jù)注明的連通信息,將標識不 同但是屬于同 一個連通區(qū)域的段統(tǒng)一為相同的標識; 將相同標識的所有段進行合并。
6、 一種二值圖像中前景圖像的定位裝置,其特征在于,包括 獲取模塊,用于對二值圖像按區(qū)域進行劃分并在掃描后獲取各區(qū)域中的前景像素;分段模塊,用于將同 一 區(qū)域中連續(xù)的前景像素組織為段; 合并模塊,用于將各區(qū)域中連通的段合并后獲得前景圖像。
7、 如權利要求6所述的裝置,其特征在于,所述合并模塊包括 標識單元,用于在所述分段模塊將同一區(qū)域中連續(xù)的前景像素組織為段時對段進行標識;標識統(tǒng)一單元,用于將不同區(qū)域中連通的段的標識進行統(tǒng)一; 合并單元,用于根據(jù)標識將二值圖像中標識同一的段進行合并。
8、 如權利要求7所述的裝置,其特征在于,所述獲取模塊進一步包括區(qū) 劃單元,用于以掃描時的行列為單位進行區(qū)域劃分;獲取模塊,用于在掃描后獲取各所述區(qū)劃單元劃分區(qū)域中的前景像素。
9、 如權利要求8所述的裝置,其特征在于,所述區(qū)劃單元進一步用于以 掃描時的 一行或 一 列為單位進行區(qū)域劃分。
10、 如權利要求9所述的裝置,其特征在于,所述分段模塊進一步用于將 所述獲取模塊在對每行進行掃描時,將每行連續(xù)的前景像素組織為段;標識單元,用于在所述分段模塊將每行連續(xù)的前景像素組織為段時,對段 進行標識;所述標識統(tǒng)一單元包括分析子單元、標識子單元、同一子單元,其中 分析子單元,用于對提取出來的各段進行連通域分析;樣的標識,不連通的l史標識不相同;對標識不同4旦相連通的4更之間注明為相連 通;同一子單元,用于根據(jù)注明的連通信息,將標識不同但是屬于同一個連通 區(qū)域的#殳統(tǒng) 一 為相同的標識;合并單元,用于將相同標識的所有段進行合并。
全文摘要
本發(fā)明公開了一種二值圖像中前景圖像的定位方法及裝置,包括對二值圖像按區(qū)域進行劃分并在掃描后獲取各區(qū)域中的前景像素;將同一區(qū)域中連續(xù)的前景像素組織為段;將各區(qū)域中連通的段合并后獲得前景圖像。在智能視頻監(jiān)控系統(tǒng)中使用本發(fā)明,能夠在對每幀的圖像都需要進行運動目標的檢測時,大大提高智能視頻監(jiān)控的實時性,并易于往硬件進行移植。
文檔編號H04N7/18GK101198033SQ20071030378
公開日2008年6月11日 申請日期2007年12月21日 優(yōu)先權日2007年12月21日
發(fā)明者磊 王, 謝東海, 英 黃 申請人:北京中星微電子有限公司