本發(fā)明涉及視頻監(jiān)控技術(shù)領(lǐng)域,具體涉及一種視頻處理方法及裝置。
背景技術(shù):
隨著經(jīng)濟、社會、文化的快速發(fā)展,國內(nèi)外影響力的與日俱增,越來越多外來人口流向城市,這些人口增加在加快城市化進程的同時,也為城市管理帶來更大的挑戰(zhàn),雖然,視頻監(jiān)控對城市安全提供了技術(shù)支持,但是,目前來看,攝像頭已經(jīng)在城市中布局開來,各個攝像頭的功能較為獨立,往往是通過人工方式對每一攝像頭拍攝的視頻圖像進行逐幀查看,當需要查找與布控對象同時出現(xiàn)的人的情況下,便無法快速地確定同行者(同時出現(xiàn)的人)。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供了一種視頻處理方法及裝置,可以快速確定出同行者。
本發(fā)明實施例第一方面提供了一種視頻處理方法,包括:
獲取目標布控對象的目標人臉圖像;
獲取目標布控范圍內(nèi)所述目標人臉圖像對應的樣本圖像集;
確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像;
對所述N張視頻圖像中每一視頻圖像進行圖像分割,得到所述N個目標人臉圖像,其中,每一張視頻圖像包含一張所述目標人臉圖像;
從所述樣本圖像集中確定出以所述N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,得到P個人臉圖像,所述P為大于1的整數(shù);
將所述P個人臉圖像進行分類,得到Q個對象及每一對象對應的人臉圖像個數(shù),所述Q為小于所述P的正整數(shù);
將所述Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,所述K為小于所述Q的正整數(shù)。
結(jié)合本發(fā)明實施例第一方面,在第一方面的第一種可能實施方式中,所述獲取目標布控范圍內(nèi)所述目標人臉圖像對應的樣本圖像集,包括:
獲取用戶選取的布控時間段;
根據(jù)所述布控時間段確定所述目標人臉圖像首次出現(xiàn)時間和最后出現(xiàn)時間;
從歷史視頻庫中截取所述目標布控范圍內(nèi)處于所述首次出現(xiàn)時間與所述最后出現(xiàn)時間之間的樣本圖像集。
結(jié)合本發(fā)明實施例第一方面或第一方面的第一種可能實施方式,在第一方面的第二種可能實施方式中,所述確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像,包括:
對所述樣本圖像集進行解析,得到A張視頻圖像,所述A為大于1的整數(shù);
將所述目標人臉圖像與所述A張視頻圖像中的每一視頻圖像進行匹配,得到所述A個匹配值;
從所述A個匹配值中選取大于第二預設(shè)閾值的所述N個匹配值,并獲取其對應的視頻圖像。
結(jié)合本發(fā)明實施例第一方面的第二種可能實施方式,在第一方面的第三種可能實施方式中,所述從所述樣本圖像集中確定出以所述N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,包括:
將所述樣本圖像集中的每一視頻圖像進行圖像分割,得到X個人臉圖像,所述X為大于1的整數(shù);
獲取目標人臉圖像i對應的時間點為時間起點的所述預設(shè)時間長度內(nèi)的Y個人臉圖像,所述目標人臉圖像i為所述N個目標臉人圖像中的任一個,所述Y為正整數(shù),所述Y個人臉圖像為所述X個人臉圖像中的一部分。
結(jié)合本發(fā)明實施例第一方面或第一方面的第一種可能實施方式,在第一方面的第四種可能實施方式中,在所述將所述Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象之后,所述方法還包括:
將所述目標對象發(fā)送給終端。
本發(fā)明實施例第二方面提供了一種終端,包括:
第一獲取單元,用于獲取目標布控對象的目標人臉圖像;
第二獲取單元,用于獲取目標布控范圍內(nèi)所述目標人臉圖像對應的樣本圖像集;
第一確定單元,用于確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像;
分割單元,用于對所述N張視頻圖像中每一視頻圖像進行圖像分割,得到所述N個目標人臉圖像,其中,每一張視頻圖像包含一張所述目標人臉圖像;
第二確定單元,用于從所述樣本圖像集中確定出以所述N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,得到P個人臉圖像,所述P為大于1的整數(shù);
分類單元,用于將所述P個人臉圖像進行分類,得到Q個對象及每一對象對應的人臉圖像個數(shù),所述Q為小于所述P的正整數(shù);
第三確定單元,用于將所述Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,所述K為小于所述Q的正整數(shù)。
結(jié)合本發(fā)明實施例第二方面,在第二方面的第一種可能實施方式中,所述第二獲取單元包括:
第一獲取模塊,用于獲取用戶選取的布控時間段;
確定模塊,用于根據(jù)所述布控時間段確定所述目標人臉圖像首次出現(xiàn)時間和最后出現(xiàn)時間;
截取模塊,用于從歷史視頻庫中截取所述目標布控范圍內(nèi)處于所述首次出現(xiàn)時間與所述最后出現(xiàn)時間之間的樣本圖像集。
結(jié)合本發(fā)明實施例第二方面或第二方面的第一種可能實施方式,在第二方面的第二種可能實施方式中,所述第一確定單元包括:
解析模塊,用于對所述樣本圖像集進行解析,得到A張視頻圖像,所述A為大于1的整數(shù);
匹配模塊,用于將所述目標人臉圖像與所述A張視頻圖像中的每一視頻圖像進行匹配,得到所述A個匹配值;
選取模塊,用于從所述A個匹配值中選取大于第二預設(shè)閾值的所述N個匹配值,并獲取其對應的視頻圖像。
結(jié)合本發(fā)明實施例第二方面的第二種可能實施方式,在第二方面的第三種可能實施方式中,所述第二確定單元包括:
分割模塊,用于將所述樣本圖像集中的每一視頻圖像進行圖像分割,得到X個人臉圖像,所述X為大于1的整數(shù);
第二獲取模塊,用于獲取目標人臉圖像i對應的時間點為時間起點的所述預設(shè)時間長度內(nèi)的Y個人臉圖像,所述目標人臉圖像i為所述N個目標臉人圖像中的任一個,所述Y為正整數(shù),所述Y個人臉圖像為所述X個人臉圖像中的一部分。
結(jié)合本發(fā)明實施例第二方面或第二方面的第一種可能實施方式,在第二方面的第四種可能實施方式中,所述視頻處理裝置還包括:
發(fā)送單元,用于在所述第三確定單元將所述Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象之后,將所述目標對象發(fā)送給終端。
實施本發(fā)明實施例,具有如下有益效果:
可以看出,通過本發(fā)明實施例,獲取目標布控對象的目標人臉圖像,獲取目標布控范圍內(nèi)目標人臉圖像對應的樣本圖像集,確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像,對N張視頻圖像中每一視頻圖像進行圖像分割,得到N個目標人臉圖像,其中,每一張視頻圖像包含一張目標人臉圖像,從樣本圖像集中確定出以N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,得到P個人臉圖像,P為大于1的整數(shù),將P個人臉圖像進行分類,得到Q個對象及每一對象對應的人臉圖像個數(shù),Q為小于P的正整數(shù),將Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,K為小于Q的正整數(shù)。如此,可快速從樣本圖像集中確定同行者。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實施例提供的一種視頻處理方法的第一實施例流程示意圖;
圖2是本發(fā)明實施例提供的一種視頻處理方法的第二實施例流程示意圖;
圖3a是本發(fā)明實施例提供的一種視頻處理裝置的第一實施例結(jié)構(gòu)示意圖;
圖3b是本發(fā)明實施例提供的圖3a所描述的視頻處理裝置的第二獲取單元的結(jié)構(gòu)示意圖;
圖3c是本發(fā)明實施例提供的圖3a所描述的視頻處理裝置的第一確定單元的結(jié)構(gòu)示意圖;
圖3d是本發(fā)明實施例提供的圖3a所描述的視頻處理裝置的第二確定單元的結(jié)構(gòu)示意圖;
圖3e是本發(fā)明實施例提供的圖3a所描述的視頻處理裝置的又一結(jié)構(gòu)示意圖;
圖4是本發(fā)明實施例提供的一種視頻處理裝置的第二實施例結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明的說明書和權(quán)利要求書及所述附圖中的術(shù)語“第一”、“第二”、“第三”和“第四”等是用于區(qū)別不同對象,而不是用于描述特定順序。此外,術(shù)語“包括”和“具有”以及它們?nèi)魏巫冃危鈭D在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備沒有限定于已列出的步驟或單元,而是可選地還包括沒有列出的步驟或單元,或可選地還包括對于這些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
在本文中提及“實施例”意味著,結(jié)合實施例描述的特定特征、結(jié)構(gòu)或特性可以包含在本發(fā)明的至少一個實施例中。在說明書中的各個位置展示該短語并不一定均是指相同的實施例,也不是與其它實施例互斥的獨立的或備選的實施例。本領(lǐng)域技術(shù)人員顯式地和隱式地理解的是,本文所描述的實施例可以與其它實施例相結(jié)合。
本發(fā)明實施例所描述視頻處理裝置可以包括智能手機(如Android手機、iOS手機、Windows Phone手機等)、平板電腦、掌上電腦、筆記本電腦、移動互聯(lián)網(wǎng)設(shè)備(MID,Mobile Internet Devices)或穿戴式設(shè)備等,上述僅是舉例,而非窮舉,包含但不限于上述裝置,當然,上述視頻處理裝置還可以為服務(wù)器。
需要說明的是,本發(fā)明實施例中的視頻處理裝置可與多個攝像頭連接,每一攝像頭均可用于抓拍視頻圖像,每一攝像頭均可有一個與之對應的位置標記,或者,可有一個與之對應的編號。通常情況下,攝像頭可設(shè)置在公共場所,例如,學校、博物館、十字路口、步行街、寫字樓、車庫、機場、醫(yī)院、地鐵站、車站、公交站臺、超市、酒店、娛樂場所等等。攝像頭在拍攝到視頻圖像后,可將該視頻圖像保存到視頻處理裝置所在系統(tǒng)的存儲器。存儲器中可存儲有多個圖像庫,每一圖像庫可包含同一人的不同視頻圖像,當然,每一圖像庫還可以用于存儲一個區(qū)域的視頻圖像或者某個指定攝像頭拍攝的視頻圖像。
進一步可選地,本發(fā)明實施例中,攝像頭拍攝的每一幀視頻圖像均對應一個屬性信息,屬性信息為以下至少一種:視頻圖像的拍攝時間、視頻圖像的位置、視頻圖像的屬性參數(shù)(格式、大小、分辨率等)、視頻圖像的編號和視頻圖像中的人物特征屬性。上述視頻圖像中的人物特征屬性可包括但不僅限于:視頻圖像中的人物個數(shù)、人物位置、人物角度等等。
進一步需要說明的是,每一攝像頭采集的視頻圖像通常為動態(tài)人臉圖像,因而,本發(fā)明實施例中可以對人臉圖像的角度信息進行規(guī)劃,上述角度信息可包括但不僅限于:水平轉(zhuǎn)動角度、俯仰角或者傾斜度。例如,可定義動態(tài)人臉圖像數(shù)據(jù)要求兩眼間距不小于30像素,建議60像素以上。水平轉(zhuǎn)動角度不超過±30°、俯仰角不超過±20°、傾斜角不超過±45°。建議水平轉(zhuǎn)動角度不超過±15°、俯仰角不超過±10°、傾斜角不超過±15°。例如,還可對人臉圖像是否被其他物體遮擋進行篩選,通常情況下,飾物不應遮擋臉部主要區(qū)域,飾物如深色墨鏡、口罩和夸張首飾等,當然,也有可能攝像頭上面布滿灰塵,導致人臉圖像被遮擋。本發(fā)明實施例中的視頻圖像的圖片格式可包括但不僅限于:BMP,JPEG,JPEG2000,PNG等等,其大小可以在10-30KB之間,每一視頻圖像還可以對應一個拍攝時間、以及拍攝該視頻圖像的攝像頭統(tǒng)一編號、與人臉圖像對應的全景大圖的鏈接等信息(人臉圖像和全局圖像建立特點對應性關(guān)系文件)。
需要說明的是,本發(fā)明實施例中的對象是指某個人,例如,“張三”,張三可能是徘徊對象,只要張三在目標布控范圍內(nèi)的出現(xiàn)次數(shù)大于第一預設(shè)閾值,第一預設(shè)閾值可由用戶自行設(shè)置或者系統(tǒng)默認。按照本發(fā)明實施例,從樣本圖像集中獲取張三的人臉圖像時,可得到多張人臉圖像,在其人臉圖像的張數(shù)大于第一預設(shè)閾值的時候,則可認為張三可作為目標對象,即同行者。
請參閱圖1,為本發(fā)明實施例提供的一種視頻處理方法的第一實施例流程示意圖。本實施例中所描述的視頻處理方法,包括以下步驟:
101、獲取目標布控對象的目標人臉圖像。
其中,視頻處理裝置可接收由終端發(fā)送的目標布控對象的目標人臉圖像,或者,視頻處理裝置可自行加載目標布控對象的目標人臉圖像。
可選地,終端可與視頻處理裝置之間建立網(wǎng)絡(luò)連接,終端可將一個目標布控對象的目標人臉圖像發(fā)送給視頻處理裝置。在實際應用中,視頻處理裝置也可以自行加載目標人臉圖像,視頻處理裝置的管理員,在其身份驗證通過后,可加載至少一個目標布控對象的人臉圖像,如此,可實現(xiàn)對目標布控對象的設(shè)置。
102、獲取目標布控范圍內(nèi)所述目標人臉圖像對應的樣本圖像集。
其中,目標布控范圍可由用戶指定,或者,可以默認為某個具體范圍(例如,所有攝像頭的監(jiān)控范圍內(nèi))。視頻處理裝置可從歷史視頻庫中獲取目標布控范圍內(nèi)的所述目標人臉圖像對應的樣本圖像集。通常情況下,目標布控范圍可為一個或者多個攝像頭所在監(jiān)控范圍。
可選地,上述步驟102中,獲取目標布控范圍內(nèi)所述目標人臉圖像對應的樣本圖像集,可包括如下步驟:
21)、獲取用戶選取的布控時間段;
22)、根據(jù)所述布控時間段確定所述目標人臉圖像首次出現(xiàn)時間和最后出現(xiàn)時間;
23)、從歷史視頻庫中截取所述目標布控范圍內(nèi)處于所述首次出現(xiàn)時間與所述最后出現(xiàn)時間之間的樣本圖像集。
其中,上述樣本圖像集可為一段視頻文件,或者,多張視頻圖像組成的樣本圖像集。上述歷史視頻庫中可包含監(jiān)控范圍內(nèi)的所有攝像頭拍攝到的樣本圖像集。通常情況下,視頻的監(jiān)控時間越來,則其內(nèi)存越大,因而,可獲取用戶選取的布控時間段,針對不同的攝像頭而言,每一攝像頭的布控時間段可不一樣,當然,所有的攝像頭的布控時間段也可以一樣,具體地,依據(jù)實際情況而定。上述布控區(qū)域可為監(jiān)控范圍的部分區(qū)域,即目標布控范圍可由用戶指定的一個或者多個攝像頭的監(jiān)控區(qū)域所構(gòu)成,或者,目標布控范圍可由用戶指定的某個區(qū)域范圍內(nèi)的攝像頭所構(gòu)成。以目標布控范圍內(nèi)的一個攝像頭為例,該攝像頭可持續(xù)進行拍攝,因而,可記錄不同時刻的錄像,而用戶需要的,是布控時間段內(nèi)的樣本圖像集,因而,可從該攝像頭對應的歷史視頻庫中截取布控時間段對應的樣本圖像集。
其中,在步驟21中,用戶可輸入布控時間段,當然,可統(tǒng)一針對布控區(qū)域內(nèi)的每一攝像頭布控時間段?;蛘?,布控區(qū)域內(nèi)的每一攝像頭對應的布控時間段不一樣,因為布控對象同時出現(xiàn)在不同的攝像頭的監(jiān)控范圍內(nèi)的概率較小,因此,更多時候布控對象只會在一個時刻處于一個攝像頭的監(jiān)控范圍內(nèi)。因而,不同的攝像頭可對應不同的布控時間段。進一步地,視頻處理裝置可確定布控時間段內(nèi)目標人臉圖像首次出現(xiàn)時間(第一次出現(xiàn)的時間)和最后出現(xiàn)時間(最后一次出現(xiàn)的時間),然后,截取目標布控范圍內(nèi)處于首次出現(xiàn)時間與最后出現(xiàn)時間之間的樣本圖像集。
103、確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像。
具體實現(xiàn)中,可將樣本圖像集中的每一張視頻圖像與人臉圖像進行匹配,從而,得到多個匹配值,從這些匹配值中選取大于某一閾值的匹配值對應的視頻圖像,得到N張視頻圖像。
可選地,上述步驟103中,確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像,可包括如下步驟:
31)、對所述樣本圖像集進行解析,得到A張視頻圖像,所述A為大于1的整數(shù);
32)、將所述目標人臉圖像與所述A張視頻圖像中的每一視頻圖像進行匹配,得到所述A個匹配值;
33)、從所述A個匹配值中選取大于第二預設(shè)閾值的所述N個匹配值,并獲取其對應的視頻圖像。
其中,上述第二預設(shè)閾值可由用戶自行設(shè)置或系統(tǒng)默認。在步驟31中,可對樣本圖像集進行解析(如解碼操作),從而,得到A張視頻圖像,將目標人臉圖像與A張視頻圖像中的每一視頻圖像進行匹配,從而,可得到A個匹配值,選取A個匹配值中大于第二預設(shè)閾值的N個匹配值,并獲取其對應的視頻圖像,得到N張視頻圖像,A
104、對所述N張視頻圖像中每一視頻圖像進行圖像分割,得到所述N個目標人臉圖像,其中,每一張視頻圖像包含一張所述目標人臉圖像。
其中,可對N張視頻圖像中每一視頻圖像進行圖像分割,從而,可得到N個目標人臉圖像,即N張視頻圖像中的每一視頻圖像對應一個目標人臉圖像。
105、從所述樣本圖像集中確定出以所述N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,得到P個人臉圖像,所述P為大于1的整數(shù)。
其中,預設(shè)時間長度可由用戶指定或者系統(tǒng)默認。
可選地,上述步驟105中,從所述樣本圖像集中確定出以所述N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,包括:
51)、將所述樣本圖像集中的每一視頻圖像進行圖像分割,得到X個人臉圖像,所述X為大于1的整數(shù);
52)、獲取目標人臉圖像i對應的時間點為時間起點的所述預設(shè)時間長度內(nèi)的Y個人臉圖像,所述目標人臉圖像i為所述N個目標臉人圖像中的任一個,所述Y為正整數(shù),所述Y個人臉圖像為所述X個人臉圖像中的一部分。
其中,樣本圖像集中的每一視頻圖像中可能包含多個人臉圖像,因而,可對視頻圖像進行圖像分割之后,可得到X個人臉圖像,當然,每一人臉圖像均對應一個時間點,即得到該人臉圖像時刻的時間點,以目標人臉圖像i為例,可獲取目標人臉圖像i對應的時間點為時間起點的預設(shè)時間長度內(nèi)的Y個人臉圖像,其中,目標人臉圖像i為N個目標臉人圖像中的任一個,Y為正整數(shù),Y個人臉圖像為X個人臉圖像中的一個,如此,可對N個目標人臉圖像均可進行上述操作,從而,可得到P個人臉圖像。
106、將所述P個人臉圖像進行分類,得到Q個對象及每一對象對應的人臉圖像個數(shù),所述Q為小于所述P的正整數(shù)。
其中,可將P個人臉圖像進行分類,可得到Q個對象以及每一對象的人臉圖像個數(shù),Q為小于P的正整數(shù)。具體實現(xiàn)方式如下:視頻處理裝置可從P張人臉圖像中任意選取一張人臉圖像,以人臉圖像j為例,可將其與其他的P-1張人臉圖像進行匹配,得到P-1個匹配值,當然,該P-1個匹配值大小不一,因而,可從該P-1個匹配值中選取大于第二預設(shè)閾值的匹配值,并將其對應的人臉圖像作為第j類,如此,可以得到上述Q個類中的一個類,假設(shè)第一類中包含S個人臉圖像。進一步地,可從P張人臉圖像中剔除屬于第j類的人臉圖像,得到P-S個人臉圖像,再選取一張人臉圖像h,該人臉圖像為P-S個人臉圖像中的一個,將人臉圖像h與P-S個人臉圖像中除了人臉圖像h之外的其他圖像進行匹配,得到P-S-1個匹配值,再從該P-S-1個匹配值中選取大于第二預設(shè)閾值的匹配值,并將其對應的人臉圖像作為第h類,如此,可以得到上述Q個類中的又一個類,以此類推,可以得到上述Q個類,每一類對應一個對象。
107將所述Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,所述K為小于所述Q的正整數(shù)。
其中,因而,可從Q個對象中選取人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,即同行者,K為小于Q的正整數(shù)。
可以看出,通過本發(fā)明實施例,獲取目標布控對象的目標人臉圖像,獲取目標布控范圍內(nèi)目標人臉圖像對應的樣本圖像集,確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像,對N張視頻圖像中每一視頻圖像進行圖像分割,得到N個目標人臉圖像,其中,每一張視頻圖像包含一張目標人臉圖像,從樣本圖像集中確定出以N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,得到P個人臉圖像,P為大于1的整數(shù),將P個人臉圖像進行分類,得到Q個對象及每一對象對應的人臉圖像個數(shù),Q為小于P的正整數(shù),將Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,K為小于Q的正整數(shù)。如此,可快速從樣本圖像集中確定同行者。
與上述一致地,請參閱圖2,為本發(fā)明實施例提供的一種視頻處理方法的第二實施例流程示意圖。本實施例中所描述的視頻處理方法,包括以下步驟:
201、獲取目標布控對象的目標人臉圖像。
202、獲取目標布控范圍內(nèi)所述目標人臉圖像對應的樣本圖像集。
203、確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像。
204、對所述N張視頻圖像中每一視頻圖像進行圖像分割,得到所述N個目標人臉圖像,其中,每一張視頻圖像包含一張所述目標人臉圖像。
205、從所述樣本圖像集中確定出以所述N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,得到P個人臉圖像,所述P為大于1的整數(shù)。
206、將所述P個人臉圖像進行分類,得到Q個對象及每一對象對應的人臉圖像個數(shù),所述Q為小于所述P的正整數(shù)。
207、將所述Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,所述K為小于所述Q的正整數(shù)。
可選地,上述步驟201-步驟207的具體描述可參照圖1所描述的視頻處理方法的步驟101-步驟107的對應步驟,在此不再贅述。
208、將所述目標對象發(fā)送給終端。
其中,視頻處理裝置可將目標對象發(fā)送給至少一個終端。該至少一個終端可為布控范圍內(nèi)的終端用戶。如此,終端可在接收到目標對象之后,進行偵查或者尋找線索。
可以看出,通過本發(fā)明實施例,獲取目標布控對象的目標人臉圖像,獲取目標布控范圍內(nèi)目標人臉圖像對應的樣本圖像集,確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像,對N張視頻圖像中每一視頻圖像進行圖像分割,得到N個目標人臉圖像,其中,每一張視頻圖像包含一張目標人臉圖像,從樣本圖像集中確定出以N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,得到P個人臉圖像,P為大于1的整數(shù),將P個人臉圖像進行分類,得到Q個對象及每一對象對應的人臉圖像個數(shù),Q為小于P的正整數(shù),將Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,K為小于Q的正整數(shù),將目標對象發(fā)送給終端。如此,可快速從樣本圖像集中確定同行者。
與上述一致地,以下為實施上述視頻處理方法的裝置,具體如下:
請參閱圖3a,為本發(fā)明實施例提供的一種視頻處理裝置的第一實施例結(jié)構(gòu)示意圖。本實施例中所描述的視頻處理裝置,包括:第一獲取單元301、第二獲取單元302、第一確定單元303、分割單元304、第二確定單元305、分類單元306和第三確定單元307,具體如下:
第一獲取單元301,用于獲取目標布控對象的目標人臉圖像;
第二獲取單元302,用于獲取目標布控范圍內(nèi)所述目標人臉圖像對應的樣本圖像集;
第一確定單元303,用于確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像;
分割單元304,用于對所述N張視頻圖像中每一視頻圖像進行圖像分割,得到所述N個目標人臉圖像,其中,每一張視頻圖像包含一張所述目標人臉圖像;
第二確定單元305,用于從所述樣本圖像集中確定出以所述N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,得到P個人臉圖像,所述P為大于1的整數(shù);
分類單元306,用于將所述P個人臉圖像進行分類,得到Q個對象及每一對象對應的人臉圖像個數(shù),所述Q為小于所述P的正整數(shù);
第三確定單元307,用于將所述Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,所述K為小于所述Q的正整數(shù)。
可選地,如圖3b,圖3b為圖3a中所描述的視頻處理裝置中的第二獲取單元302的具體細化結(jié)構(gòu),所述第二獲取單元302可包括:第一獲取模塊3021、確定模塊3022和截取模塊3023,具體如下:
第一獲取模塊3021,用于獲取用戶選取的布控時間段;
確定模塊3022,用于根據(jù)所述布控時間段確定所述目標人臉圖像首次出現(xiàn)時間和最后出現(xiàn)時間;
截取模塊3023,用于從歷史視頻庫中截取所述目標布控范圍內(nèi)處于所述首次出現(xiàn)時間與所述最后出現(xiàn)時間之間的樣本圖像集。
可選地,如圖3c,圖3c為圖3a中所描述的視頻處理裝置中的第一確定單元303的具體細化結(jié)構(gòu),所述第一確定單元303可包括:解析模塊3031、匹配模塊3032和選取模塊3033,具體如下:
解析模塊3031,用于對所述樣本圖像集進行解析,得到A張視頻圖像,所述A為大于1的整數(shù);
匹配模塊3032,用于將所述目標人臉圖像與所述A張視頻圖像中的每一視頻圖像進行匹配,得到所述A個匹配值;
選取模塊3033,用于從所述A個匹配值中選取大于第二預設(shè)閾值的所述N個匹配值,并獲取其對應的視頻圖像。
可選地,如圖3d,圖3d為圖3a中所描述的視頻處理裝置中的第二確定單元305的具體細化結(jié)構(gòu),所述第二確定單元305可包括:分割模塊3051和第二獲取模塊3052,具體如下:
分割模塊3051,用于將所述樣本圖像集中的每一視頻圖像進行圖像分割,得到X個人臉圖像,所述X為大于1的整數(shù);
第二獲取模塊3052,用于獲取目標人臉圖像i對應的時間點為時間起點的所述預設(shè)時間長度內(nèi)的Y個人臉圖像,所述目標人臉圖像i為所述N個目標臉人圖像中的任一個,所述Y為正整數(shù),所述Y個人臉圖像為所述X個人臉圖像中的一部分。
可選地,如圖3e,圖3e為圖3a中所描述的視頻處理裝置的又一變型結(jié)構(gòu),所述視頻處理裝置還可包括:發(fā)送單元308,具體如下:
發(fā)送單元308,用于在所述第三確定單元307將所述Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象之后,將所述目標對象發(fā)送給終端。
可以看出,通過本發(fā)明實施例所描述的視頻處理裝置,獲取目標布控對象的目標人臉圖像,獲取目標布控范圍內(nèi)目標人臉圖像對應的樣本圖像集,確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像,對N張視頻圖像中每一視頻圖像進行圖像分割,得到N個目標人臉圖像,其中,每一張視頻圖像包含一張目標人臉圖像,從樣本圖像集中確定出以N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,得到P個人臉圖像,P為大于1的整數(shù),將P個人臉圖像進行分類,得到Q個對象及每一對象對應的人臉圖像個數(shù),Q為小于P的正整數(shù),將Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,K為小于Q的正整數(shù)。如此,可快速從樣本圖像集中確定同行者。
與上述一致地,請參閱圖4,為本發(fā)明實施例提供的一種視頻處理裝置的第二實施例結(jié)構(gòu)示意圖。本實施例中所描述的視頻處理裝置,包括:至少一個輸入設(shè)備1000;至少一個輸出設(shè)備2000;至少一個處理器3000,例如CPU;和存儲器4000,上述輸入設(shè)備1000、輸出設(shè)備2000、處理器3000和存儲器4000通過總線5000連接。
其中,上述輸入設(shè)備1000具體可為觸控面板、物理按鍵或者鼠標。
上述輸出設(shè)備2000具體可為顯示屏。
上述存儲器4000可以是高速RAM存儲器,也可為非易失存儲器(non-volatile memory),例如磁盤存儲器。上述存儲器4000用于存儲一組程序代碼,上述輸入設(shè)備1000、輸出設(shè)備2000和處理器3000用于調(diào)用存儲器4000中存儲的程序代碼,執(zhí)行如下操作:
上述處理器3000,用于:
獲取目標布控對象的目標人臉圖像;
獲取目標布控范圍內(nèi)所述目標人臉圖像對應的樣本圖像集;
確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像;
對所述N張視頻圖像中每一視頻圖像進行圖像分割,得到所述N個目標人臉圖像,其中,每一張視頻圖像包含一張所述目標人臉圖像;
從所述樣本圖像集中確定出以所述N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,得到P個人臉圖像,所述P為大于1的整數(shù);
將所述P個人臉圖像進行分類,得到Q個對象及每一對象對應的人臉圖像個數(shù),所述Q為小于所述P的正整數(shù);
將所述Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象,所述K為小于所述Q的正整數(shù)。
可選地,上述處理器3000獲取目標布控范圍內(nèi)所述目標人臉圖像對應的樣本圖像集,包括:
獲取用戶選取的布控時間段;
根據(jù)所述布控時間段確定所述目標人臉圖像首次出現(xiàn)時間和最后出現(xiàn)時間;
從歷史視頻庫中截取所述目標布控范圍內(nèi)處于所述首次出現(xiàn)時間與所述最后出現(xiàn)時間之間的樣本圖像集。
可選地,上述處理器3000確定所述樣本圖像集中包含所述目標人臉圖像匹配的N張視頻圖像
對所述樣本圖像集進行解析,得到A張視頻圖像,所述A為大于1的整數(shù);
將所述目標人臉圖像與所述A張視頻圖像中的每一視頻圖像進行匹配,得到所述A個匹配值;
從所述A個匹配值中選取大于第二預設(shè)閾值的所述N個匹配值,并獲取其對應的視頻圖像。
進一步可選地,上述處理器3000從所述樣本圖像集中確定出以所述N個目標臉人圖像中的每一目標人臉圖像對應的時間點為時間起點的預設(shè)時間長度內(nèi)的視頻圖像中出現(xiàn)的人臉圖像,包括:
將所述樣本圖像集中的每一視頻圖像進行圖像分割,得到X個人臉圖像,所述X為大于1的整數(shù);
獲取目標人臉圖像i對應的時間點為時間起點的所述預設(shè)時間長度內(nèi)的Y個人臉圖像,所述目標人臉圖像i為所述N個目標臉人圖像中的任一個,所述Y為正整數(shù),所述Y個人臉圖像為所述X個人臉圖像中的一部分。
可選地,上述處理器3000,在所述將所述Q個對象中人臉圖像個數(shù)大于第一預設(shè)閾值的K個對象作為目標對象之后,還具體用于:
將所述目標對象發(fā)送給終端。
本發(fā)明實施例還提供一種計算機存儲介質(zhì),其中,該計算機存儲介質(zhì)可存儲有程序,該程序執(zhí)行時包括上述方法實施例中記載的任何一種視頻處理方法的部分或全部步驟。
盡管在此結(jié)合各實施例對本發(fā)明進行了描述,然而,在實施所要求保護的本發(fā)明過程中,本領(lǐng)域技術(shù)人員通過查看所述附圖、公開內(nèi)容、以及所附權(quán)利要求書,可理解并實現(xiàn)所述公開實施例的其他變化。在權(quán)利要求中,“包括”(comprising)一詞不排除其他組成部分或步驟,“一”或“一個”不排除多個的情況。單個處理器或其他單元可以實現(xiàn)權(quán)利要求中列舉的若干項功能。相互不同的從屬權(quán)利要求中記載了某些措施,但這并不表示這些措施不能組合起來產(chǎn)生良好的效果。
本領(lǐng)域技術(shù)人員應明白,本發(fā)明的實施例可提供為方法、裝置(設(shè)備)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序產(chǎn)品的形式。計算機程序存儲/分布在合適的介質(zhì)中,與其它硬件一起提供或作為硬件的一部分,也可以采用其他分布形式,如通過Internet或其它有線或無線電信系統(tǒng)。
本發(fā)明是參照本發(fā)明實施例的方法、裝置(設(shè)備)和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
盡管結(jié)合具體特征及其實施例對本發(fā)明進行了描述,顯而易見的,在不脫離本發(fā)明的精神和范圍的情況下,可對其進行各種修改和組合。相應地,本說明書和附圖僅僅是所附權(quán)利要求所界定的本發(fā)明的示例性說明,且視為已覆蓋本發(fā)明范圍內(nèi)的任意和所有修改、變化、組合或等同物。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。