亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

確定圖像中的人臉區(qū)域的方法及裝置與流程

文檔序號:12365462閱讀:503來源:國知局
確定圖像中的人臉區(qū)域的方法及裝置與流程

本公開涉及圖像識別技術(shù)領(lǐng)域,特別涉及一種確定圖像中的人臉區(qū)域的方法及裝置。



背景技術(shù):

人臉檢測是一種廣泛應(yīng)用于身份認證、安全防護、媒體與娛樂、人臉搜索以及人臉識別等領(lǐng)域的圖像處理算法。

在相關(guān)技術(shù)中,通過人臉檢測算法確定圖像中的人臉區(qū)域時,通常設(shè)置一個滑動窗口,并使用該滑動窗口逐個像素移動來掃描整張圖像,每移動一個像素,即使用預設(shè)的人臉判別模型對滑動窗口中的圖像進行人臉檢測,以識別當前滑動窗口中是否存在人臉,為了能夠檢測出不同大小的人臉,通常還將整張圖像經(jīng)過多比例縮放后使用滑動窗口進行掃描。



技術(shù)實現(xiàn)要素:

本公開實施例提供了一種確定圖像中的人臉區(qū)域的方法及裝置,所述技術(shù)方案如下:

根據(jù)本公開實施例的第一方面,提供了一種確定圖像中的人臉區(qū)域的方法,該方法包括:

確定圖像中的各個顯著區(qū)域,所述顯著區(qū)域是所述圖像中具有視覺顯著性的區(qū)域;

計算所述各個顯著區(qū)域的置信度,所述置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;

根據(jù)所述各個顯著區(qū)域?qū)?yīng)的置信度確定所述圖像中的人臉區(qū)域。

可選的,所述確定圖像中的各個顯著區(qū)域,包括:

通過圖像顯著性算法確定所述圖像中的各個候選顯著區(qū)域,所述候選顯著區(qū)域是所述圖像中具有視覺顯著性的矩形區(qū)域;

將所述各個候選顯著區(qū)域中,寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域獲取為所述各個顯著區(qū)域。

可選的,所述預設(shè)寬高比區(qū)間為[0.5,2]。

可選的,所述計算所述各個顯著區(qū)域的置信度,包括:

通過卷積神經(jīng)網(wǎng)絡(luò)算法計算所述各個顯著區(qū)域的置信度。

可選的,所述根據(jù)所述各個顯著區(qū)域?qū)?yīng)的置信度確定所述圖像中的人臉區(qū)域,包括:

將所述各個顯著區(qū)域中,置信度高于置信度閾值的顯著區(qū)域確定為各個備選人臉區(qū)域;

將所述各個備選人臉區(qū)域中的重復區(qū)域剔除,獲得所述圖像中的人臉區(qū)域。

可選的,所述將所述各個備選人臉區(qū)域中的重復區(qū)域剔除,獲得所述圖像中的人臉區(qū)域,包括:

對于所述各個備選人臉區(qū)域中的兩個備選人臉區(qū)域,計算所述兩個備選人臉區(qū)域之間的交集面積與并集面積的比值;

當所述兩個備選人臉區(qū)域之間的交集面積與并集面積的比值高于預設(shè)比值時,將所述兩個備選人臉區(qū)域中置信度低的備選人臉區(qū)域剔除。

根據(jù)本公開實施例的第二方面,提供了一種確定圖像中的人臉區(qū)域的裝置,所述裝置包括:

第一區(qū)域確定模塊,用于確定圖像中的各個顯著區(qū)域,所述顯著區(qū)域是所述圖像中具有視覺顯著性的區(qū)域;

計算模塊,用于計算所述各個顯著區(qū)域的置信度,所述置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;

第二區(qū)域確定模塊,用于根據(jù)所述各個顯著區(qū)域?qū)?yīng)的置信度確定所述圖像中的人臉區(qū)域。

可選的,所述第一區(qū)域確定模塊,包括:

第一確定子模塊,用于通過圖像顯著性算法確定所述圖像中的各個候選顯著區(qū)域,所述候選顯著區(qū)域是所述圖像中具有視覺顯著性的矩形區(qū)域;

獲取子模塊,用于將所述各個候選顯著區(qū)域中,寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域獲取為所述各個顯著區(qū)域。

可選的,所述預設(shè)寬高比區(qū)間為[0.5,2]。

可選的,所述計算模塊,用于通過卷積神經(jīng)網(wǎng)絡(luò)算法計算所述各個顯著區(qū)域的置信度。

可選的,所述第二區(qū)域確定模塊,包括:

第二確定子模塊,用于將所述各個顯著區(qū)域中,置信度高于置信度閾值的顯著區(qū)域確定為各個備選人臉區(qū)域;

獲得子模塊,用于將所述各個備選人臉區(qū)域中的重復區(qū)域剔除,獲得所述圖像中的人臉區(qū)域。

可選的,所述獲得子模塊,包括:

計算子模塊,用于對于所述各個備選人臉區(qū)域中的兩個備選人臉區(qū)域,計算所述兩個備選人臉區(qū)域之間的交集面積與并集面積的比值;

剔除子模塊,用于當所述兩個備選人臉區(qū)域之間的交集面積與并集面積的比值高于預設(shè)比值時,將所述兩個備選人臉區(qū)域中置信度低的備選人臉區(qū)域剔除。

根據(jù)本公開實施例的第三方面,提供了一種確定圖像中的人臉區(qū)域的裝置,所述裝置包括:

處理器;

用于存儲所述處理器的可執(zhí)行指令的存儲器;

其中,所述處理器被配置為:

確定圖像中的各個顯著區(qū)域,所述顯著區(qū)域是所述圖像中具有視覺顯著性的區(qū)域;

計算所述各個顯著區(qū)域的置信度,所述置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;

根據(jù)所述各個顯著區(qū)域?qū)?yīng)的置信度確定所述圖像中的人臉區(qū)域。

本公開實施例提供的技術(shù)方案可以包括以下有益效果:

通過確定圖像中的各個顯著區(qū)域,顯著區(qū)域是圖像中具有視覺顯著性的區(qū)域;計算各個顯著區(qū)域的置信度,置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;根據(jù)各個顯著區(qū)域?qū)?yīng)的置信度確定圖像中的人臉區(qū)域;在檢測圖像中的人臉之前,首先從圖像中確定可能存在人臉的顯著區(qū)域,然后只對顯著區(qū)域進行人臉檢測,不需要對整幅圖像中每個區(qū)域分別進行檢測,從而極大的降低了需檢測區(qū)域的數(shù)量,達到減少檢測時間,提高人臉檢測效率的效果。

應(yīng)當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。

附圖說明

此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。

圖1是根據(jù)一示例性實施例示出的一種確定圖像中的人臉區(qū)域的方法的流程圖;

圖2是根據(jù)另一示例性實施例示出的一種確定圖像中的人臉區(qū)域的方法的流程圖;

圖3是圖2所示實施例涉及的一種圖像中的候選顯著區(qū)域的示意圖;

圖4是圖2所示實施例涉及的一種計算顯著區(qū)域的置信度的流程圖;

圖5是根據(jù)又一示例性實施例示出的一種確定圖像中的人臉區(qū)域的方法的流程圖;

圖6是圖5所示實施例涉及的一種重復區(qū)域剔除的示意圖;

圖7是根據(jù)一示例性實施例示出的一種確定圖像中的人臉區(qū)域的裝置的框圖;

圖8是根據(jù)另一示例性實施例示出的一種確定圖像中的人臉區(qū)域的裝置的框圖;

圖9是根據(jù)一示例性實施例示出的一種裝置的框圖。

具體實施方式

這里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本公開相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。

圖1是根據(jù)一示例性實施例示出的一種確定圖像中的人臉區(qū)域的方法的流程圖,該方法可以應(yīng)用于具有圖像處理能力的終端中,該終端可以是個人電腦、個人工作站、智能手機、平板電腦以及電子書閱讀器等。如圖1所示,該確定圖像中的人臉區(qū)域的方法可以包括如下幾個步驟:

在步驟101中,確定圖像中的各個顯著區(qū)域,該顯著區(qū)域是該圖像中具有視覺顯著性的區(qū)域;

在步驟102中,計算該各個顯著區(qū)域的置信度,該置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;

在步驟103中,根據(jù)該各個顯著區(qū)域?qū)?yīng)的置信度確定該圖像中的人臉區(qū)域。

可選的,該確定圖像中的各個顯著區(qū)域,包括:

通過圖像顯著性算法確定該圖像中的各個候選顯著區(qū)域,該候選顯著區(qū)域是該圖像中具有視覺顯著性的矩形區(qū)域;

將該各個候選顯著區(qū)域中,寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域獲取為該各個顯著區(qū)域。

可選的,該預設(shè)寬高比區(qū)間為[0.5,2]。

可選的,該計算該各個顯著區(qū)域的置信度,包括:

通過卷積神經(jīng)網(wǎng)絡(luò)算法計算該各個顯著區(qū)域的置信度。

可選的,該根據(jù)該各個顯著區(qū)域?qū)?yīng)的置信度確定該圖像中的人臉區(qū)域,包括:

將該各個顯著區(qū)域中,置信度高于置信度閾值的顯著區(qū)域確定為各個備選人臉區(qū)域;

將該各個備選人臉區(qū)域中的重復區(qū)域剔除,獲得該圖像中的人臉區(qū)域。

可選的,該將該各個備選人臉區(qū)域中的重復區(qū)域剔除,獲得該圖像中的人臉區(qū)域,包括:

對于該各個備選人臉區(qū)域中的兩個備選人臉區(qū)域,計算該兩個備選人臉區(qū)域之間的交集面積與并集面積的比值;

當該兩個備選人臉區(qū)域之間的交集面積與并集面積的比值高于預設(shè)比值時,將該兩個備選人臉區(qū)域中置信度低的備選人臉區(qū)域剔除。

綜上所述,本公開實施例提供的確定圖像中的人臉區(qū)域的方法,通過確定圖像中的各個顯著區(qū)域,顯著區(qū)域是圖像中具有視覺顯著性的區(qū)域;計算各個顯著區(qū)域的置信度,置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;根據(jù)各個顯著區(qū)域?qū)?yīng)的置信度確定圖像中的人臉區(qū)域;在檢測圖像中的人臉之前,首先從圖像中確定可能存在人臉的顯著區(qū)域,然后只對顯著區(qū)域進行人臉檢測,不需要對整幅圖像中每個區(qū)域分別進行檢測,從而極大的降低了需檢測區(qū)域的數(shù)量,達到減少檢測時間,提高人臉檢測效率的效果。

圖2是根據(jù)另一示例性實施例示出的一種確定圖像中的人臉區(qū)域的方法的流程圖,該方法可以應(yīng)用于具有圖像處理能力的終端中,該終端可以是個人電腦、個人工作站、智能手機、平板電腦以及電子書閱讀器等。如圖2所示,該確定圖像中的人臉區(qū)域的方法可以包括如下幾個步驟:

在步驟201中,通過圖像顯著性算法確定該圖像中的各個候選顯著區(qū)域,該候選顯著區(qū)域是該圖像中具有視覺顯著性的矩形區(qū)域。

圖像中具有視覺顯著性的區(qū)域是指圖像中一些與其周圍區(qū)域明顯不同,同時能吸引人眼注意的區(qū)域。這些具有視覺顯著性的區(qū)域中通常包含特殊的物體,包括但不限于人臉。因此,在一幅包含人臉的圖像中,人臉區(qū)域通常都是圖像中的中具有視覺顯著性的區(qū)域。

在本公開實施例中,可以通過圖像顯著性算法對圖像進行處理,來確定圖像中的具有視覺顯著性的矩形區(qū)域,這些確定的具有視覺顯著性的矩形區(qū)域即為候選顯著區(qū)域。

可選的,本公開實施例中的圖像顯著性算法可以是CPMC(constrained parametric min-cuts,約束參數(shù)最小分割)算法、MSCG(multi-scale combinatorial grouping,多尺度組合分組)算法、RPN(Region Proposal Networks,建議網(wǎng)絡(luò)區(qū)域)算法以及SS(Selective Search,選擇性搜索)算法等等。

在步驟202中,將該各個候選顯著區(qū)域中,寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域獲取為各個顯著區(qū)域。

在通過圖像顯著性算法對圖像進行處理,以確定圖像中的候選顯著區(qū)域時,除了能夠確定出人臉區(qū)域?qū)?yīng)的候選顯著區(qū)域之外,還可能會確定出有很多不包含人臉的候選顯著區(qū)域,其中有一些候選顯著區(qū)域可能過于狹長,從而脫離了人臉可能的寬高比例。因此,在本公開實施例中,在確定出圖像中的候選顯著區(qū)域之后,可以通過各個候選顯著區(qū)域的寬高比對各個候選顯著區(qū)域進行篩選,剔除寬高比不屬于預設(shè)寬高比區(qū)間的候選顯著區(qū)域,剩下的寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域即為上述各個顯著區(qū)域。其中,該預設(shè)寬高比區(qū)間為[0.5,2],即各個候選顯著區(qū)域中寬高比低于0.5或者高于2的候選顯著區(qū)域?qū)⒈惶蕹?/p>

比如,請參考圖3,其示出了本公開實施例涉及的一種圖像中的候選顯著區(qū)域的示意圖,其中,通過圖像顯著性算法確定出圖像30中的候選顯著區(qū)域,分別為對應(yīng)樹木的區(qū)域31、對應(yīng)小豬儲蓄罐的區(qū)域32、對應(yīng)攝像機的區(qū)域33、對應(yīng)長凳的區(qū)域34、對應(yīng)人物的區(qū)域35以及對應(yīng)人臉的區(qū)域36,需要說明的是,在實際應(yīng)用中,圖像中的一個物體通過圖像顯著性算法通常可以確定出多個候選顯著區(qū)域,而圖3僅以一個物體對應(yīng)一個候選顯著區(qū)域進行舉例說明。在圖3中,對應(yīng)樹木的區(qū)域31和對應(yīng)長凳的區(qū)域34的寬高比處于預設(shè)寬高比區(qū)間為[0.5,2]之外,因此,可以將區(qū)域31和區(qū)域34剔除,將剩余的區(qū)域32、33、35以及36確定為圖像30中的顯著區(qū)域。

可選的,本公開上述實施例僅以預設(shè)寬高比區(qū)間為[0.5,2]為例進行說明,在實際應(yīng)用中,上述預設(shè)寬高比區(qū)間可以根據(jù)實際應(yīng)用情況進行設(shè)置,本公開實施例對此不做限定。

在步驟203中,通過卷積神經(jīng)網(wǎng)絡(luò)算法計算該各個顯著區(qū)域的置信度,該置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率。

在圖像檢測領(lǐng)域中,卷積神經(jīng)網(wǎng)絡(luò)算法具有強大的判別能力,可以有效的提高人臉檢測的精度。本公開實施例所示的方法,在確定圖像中可能包含人臉的顯著區(qū)域后,通過卷積神經(jīng)網(wǎng)絡(luò)算法對確定出的各個顯著區(qū)域進行人臉檢測,獲得各個顯著區(qū)域的置信度,即各個顯著區(qū)域中的圖像是人臉圖像的概率。

其中,請參考圖4,其示出了本公開實施例涉及的一種計算顯著區(qū)域的置信度的流程圖,在圖4中輸入層為一個顯著區(qū)域的原始圖像C0,尺寸為55×55(像素),卷積核為3個,經(jīng)過第一次卷積計算(特征提取)后,獲得第一卷積層C1(尺寸為27×27,卷積核為96個),對第一卷積層C1進行第二次卷積計算,獲得第二卷積層C2(尺寸為13×13,卷積核為256個),以此類推,獲得第三卷積層C3(尺寸為13×13,卷積核為384個)和第四卷積層C4(尺寸為13×13,卷積核為256個),之后,按照預定的矩陣計算方法對第四卷積層C4進行矩陣運算,獲得第一全連接層FC5,該FC5是一個512維的特征向量,對FC5繼續(xù)訓練獲得第二全連接層FC6(二維特征向量),根據(jù)該二維特征向量FC6輸出最終結(jié)果(即圖4中的輸出層),即輸出該顯著區(qū)域的置信度。

在本公開上述實施例中,僅以通過卷積神經(jīng)網(wǎng)絡(luò)算法對顯著區(qū)域進行置信度計算,以計算各個顯著區(qū)域中的圖像是人臉圖像的概率為例進行說明,在實際應(yīng)用中,也可以通過其它的人臉檢測算法來計算各個顯著區(qū)域中的圖像是人臉圖像的概率,比如,可以通過模板匹配模型算法、膚色模型算法、ANN(Artificial Neural Network,人工神經(jīng)網(wǎng)絡(luò))模型算法、SVM(Support Vector Machine,支持向量機)模型算法以及Adaboost模型算法等等。

在步驟204中,根據(jù)各個顯著區(qū)域?qū)?yīng)的置信度確定該圖像中的人臉區(qū)域。

通過上述步驟計算獲得各個顯著區(qū)域?qū)?yīng)的置信度之后,即可以根據(jù)各個顯著區(qū)域的置信度來確定各個顯著區(qū)域中哪些區(qū)域包含人臉,具體的,可以確定置信度高于置信度閾值的區(qū)域包含人臉,而置信度不高于該置信度閾值的區(qū)域則不包含人臉。

此外,由于在步驟201中,圖像中的一個人臉可能確定出多個顯著區(qū)域,而經(jīng)過后續(xù)置信度計算,該人臉對應(yīng)的多個顯著區(qū)域的置信度都可能高于置信度閾值。而對應(yīng)同一個人臉的多個顯著區(qū)域,其重合面積通常也很大,對此,本公開實施例所示的方案,在確定出置信度高于置信度閾值的顯著區(qū)域后,按照顯著區(qū)域之間的重合面積比例,對確定出的顯著區(qū)域進行合并或剔除,最終獲得的區(qū)域即為該圖像中的人臉區(qū)域。

綜上所述,本公開實施例提供的確定圖像中的人臉區(qū)域的方法,通過確定圖像中的各個顯著區(qū)域,顯著區(qū)域是圖像中具有視覺顯著性的區(qū)域;計算各個顯著區(qū)域的置信度,置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;根據(jù)各個顯著區(qū)域?qū)?yīng)的置信度確定圖像中的人臉區(qū)域;在檢測圖像中的人臉之前,首先從圖像中確定可能存在人臉的顯著區(qū)域,然后只對顯著區(qū)域進行人臉檢測,不需要對整幅圖像中每個區(qū)域分別進行檢測,從而極大的降低了需檢測區(qū)域的數(shù)量,達到減少檢測時間,提高人臉檢測效率的效果。

此外,本公開實施例提供的確定圖像中的人臉區(qū)域的方法,通過圖像顯著性算法確定該圖像中的各個候選顯著區(qū)域,并將該各個候選顯著區(qū)域中,寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域獲取為各個顯著區(qū)域,按照候選顯著區(qū)域的寬高比將明顯不對應(yīng)人臉的區(qū)域剔除,避免后續(xù)對這些被剔除的區(qū)域的圖像進行不必要的檢測計算,進一步降低了需檢測區(qū)域的數(shù)量,提高人臉檢測效率。

在上述實施例中,在根據(jù)各個顯著區(qū)域?qū)?yīng)的置信度確定該圖像中的人臉區(qū)域時,對于同一人臉圖像對應(yīng)的多個顯著區(qū)域,可以通過非最大值抑制的方法進行剔除,已獲得該人臉圖像對應(yīng)的唯一一個人臉區(qū)域。該非最大值抑制的方法可以參考下面的實施例。

圖5是根據(jù)又一示例性實施例示出的一種確定圖像中的人臉區(qū)域的方法的流程圖,該方法可以應(yīng)用于具有圖像處理能力的終端中,該終端可以是個人電腦、個人工作站、智能手機、平板電腦以及電子書閱讀器等。如圖5所示,該確定圖像中的人臉區(qū)域的方法可以包括如下幾個步驟:

在步驟501中,通過圖像顯著性算法確定該圖像中的各個候選顯著區(qū)域,該候選顯著區(qū)域是該圖像中具有視覺顯著性的矩形區(qū)域。

在步驟502中,將該各個候選顯著區(qū)域中,寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域獲取為各個顯著區(qū)域。

在步驟503中,通過卷積神經(jīng)網(wǎng)絡(luò)算法計算該各個顯著區(qū)域的置信度,該置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率。

上述步驟501至503的方案可以參考圖2所示實施例中的步驟201至步驟203下的描述,此處不再贅述。

在步驟504中,將該各個顯著區(qū)域中,置信度高于置信度閾值的顯著區(qū)域確定為各個備選人臉區(qū)域。

在步驟505中,將該各個備選人臉區(qū)域中的重復區(qū)域剔除,獲得該圖像中的人臉區(qū)域。

其中,在將該各個備選人臉區(qū)域中的重復區(qū)域剔除時,對于該各個備選人臉區(qū)域中的兩個備選人臉區(qū)域,可以計算該兩個備選人臉區(qū)域之間的交集面積與并集面積的比值,并當該兩個備選人臉區(qū)域之間的交集面積與并集面積的比值高于預設(shè)比值時,將該兩個備選人臉區(qū)域中置信度低的備選人臉區(qū)域剔除。

在本公開實施例中,對于置信度高于置信度閾值的任意兩個顯著區(qū)域,若這兩個區(qū)域的交集面積與并集面積的比值高于預設(shè)比值,則說明這兩個顯著區(qū)域?qū)?yīng)同一個人臉,此時,將這兩個區(qū)域中置信度低一個區(qū)域剔除,留下置信度較高的區(qū)域。可選的,在本公開實施例中,該預設(shè)比值可以設(shè)置為0.5,或者,在實際應(yīng)用中,該預設(shè)比值也可以根據(jù)實際使用情況設(shè)置為其它數(shù)值。

請參考圖6,其示出了本公開實施例涉及的一種重復區(qū)域剔除的示意圖,在圖6中,圖像60中經(jīng)計算確定出置信度高于置信度閾值的備選人臉區(qū)域有兩個,分別為區(qū)域61a和區(qū)域61b,其中,區(qū)域61a和區(qū)域61b之間的交集面積與并集面積的比值高于0.5,且區(qū)域61a的置信度高于區(qū)域61b的置信度,此時,可以講區(qū)域61b剔除,將區(qū)域61a確定為最終的人臉區(qū)域。

綜上所述,本公開實施例提供的確定圖像中的人臉區(qū)域的方法,通過確定圖像中的各個顯著區(qū)域,顯著區(qū)域是圖像中具有視覺顯著性的區(qū)域;計算各個顯著區(qū)域的置信度,置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;根據(jù)各個顯著區(qū)域?qū)?yīng)的置信度確定圖像中的人臉區(qū)域;在檢測圖像中的人臉之前,首先從圖像中確定可能存在人臉的顯著區(qū)域,然后只對顯著區(qū)域進行人臉檢測,不需要對整幅圖像中每個區(qū)域分別進行檢測,從而極大的降低了需檢測區(qū)域的數(shù)量,達到減少檢測時間,提高人臉檢測效率的效果。

此外,本公開實施例提供的確定圖像中的人臉區(qū)域的方法,通過圖像顯著性算法確定該圖像中的各個候選顯著區(qū)域,并將該各個候選顯著區(qū)域中,寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域獲取為各個顯著區(qū)域,按照候選顯著區(qū)域的寬高比將明顯不對應(yīng)人臉的區(qū)域剔除,避免后續(xù)對這些被剔除的區(qū)域的圖像進行不必要的檢測計算,進一步降低了需檢測區(qū)域的數(shù)量,提高人臉檢測效率。

下述為本公開裝置實施例,可以用于執(zhí)行本公開方法實施例。對于本公開裝置實施例中未披露的細節(jié),請參照本公開方法實施例。

圖7是根據(jù)一示例性實施例示出的一種確定圖像中的人臉區(qū)域的裝置的框圖,該確定圖像中的人臉區(qū)域的裝置可以通過軟件、硬件或者兩者的結(jié)合實現(xiàn)成為終端的部分或全部,該終端可以是個人電腦、個人工作站、智能手機、平板電腦以及電子書閱讀器等。該確定圖像中的人臉區(qū)域的裝置可以包括:

第一區(qū)域確定模塊701,被設(shè)置為用于確定圖像中的各個顯著區(qū)域,所述顯著區(qū)域是所述圖像中具有視覺顯著性的區(qū)域;

計算模塊702,被設(shè)置為用于計算所述各個顯著區(qū)域的置信度,所述置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;

第二區(qū)域確定模塊703,被設(shè)置為用于根據(jù)所述各個顯著區(qū)域?qū)?yīng)的置信度確定所述圖像中的人臉區(qū)域。

綜上所述,本公開實施例提供的確定圖像中的人臉區(qū)域的裝置,通過確定圖像中的各個顯著區(qū)域,顯著區(qū)域是圖像中具有視覺顯著性的區(qū)域;計算各個顯著區(qū)域的置信度,置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;根據(jù)各個顯著區(qū)域?qū)?yīng)的置信度確定圖像中的人臉區(qū)域;在檢測圖像中的人臉之前,首先從圖像中確定可能存在人臉的顯著區(qū)域,然后只對顯著區(qū)域進行人臉檢測,不需要對整幅圖像中每個區(qū)域分別進行檢測,從而極大的降低了需檢測區(qū)域的數(shù)量,達到減少檢測時間,提高人臉檢測效率的效果。

圖8是根據(jù)另一示例性實施例示出的一種確定圖像中的人臉區(qū)域的裝置的框圖,該確定圖像中的人臉區(qū)域的裝置可以通過軟件、硬件或者兩者的結(jié)合實現(xiàn)成為終端的部分或全部,該終端可以是個人電腦、個人工作站、智能手機、平板電腦以及電子書閱讀器等。該確定圖像中的人臉區(qū)域的裝置可以包括:

第一區(qū)域確定模塊701,被設(shè)置為用于確定圖像中的各個顯著區(qū)域,所述顯著區(qū)域是所述圖像中具有視覺顯著性的區(qū)域;

計算模塊702,被設(shè)置為用于計算所述各個顯著區(qū)域的置信度,所述置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;

第二區(qū)域確定模塊703,被設(shè)置為用于根據(jù)所述各個顯著區(qū)域?qū)?yīng)的置信度確定所述圖像中的人臉區(qū)域。

可選的,所述第一區(qū)域確定模塊701,包括:

第一確定子模塊701a,被設(shè)置為用于通過圖像顯著性算法確定所述圖像中的各個候選顯著區(qū)域,所述候選顯著區(qū)域是所述圖像中具有視覺顯著性的矩形區(qū)域;

獲取子模塊701b,被設(shè)置為用于將所述各個候選顯著區(qū)域中,寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域獲取為所述各個顯著區(qū)域。

可選的,所述預設(shè)寬高比區(qū)間為[0.5,2]。

可選的,所述計算模塊702,被設(shè)置為用于通過卷積神經(jīng)網(wǎng)絡(luò)算法計算所述各個顯著區(qū)域的置信度。

可選的,所述第二區(qū)域確定模塊703,包括:

第二確定子模塊703a,被設(shè)置為用于將所述各個顯著區(qū)域中,置信度高于置信度閾值的顯著區(qū)域確定為各個備選人臉區(qū)域;

獲得子模塊703b,被設(shè)置為用于將所述各個備選人臉區(qū)域中的重復區(qū)域剔除,獲得所述圖像中的人臉區(qū)域。

可選的,所述獲得子模塊703b,包括:

計算子模塊703b1,被設(shè)置為用于對于所述各個備選人臉區(qū)域中的兩個備選人臉區(qū)域,計算所述兩個備選人臉區(qū)域之間的交集面積與并集面積的比值;

剔除子模塊703b2,被設(shè)置為用于當所述兩個備選人臉區(qū)域之間的交集面積與并集面積的比值高于預設(shè)比值時,將所述兩個備選人臉區(qū)域中置信度低的備選人臉區(qū)域剔除

綜上所述,本公開實施例提供的確定圖像中的人臉區(qū)域的裝置,通過確定圖像中的各個顯著區(qū)域,顯著區(qū)域是圖像中具有視覺顯著性的區(qū)域;計算各個顯著區(qū)域的置信度,置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;根據(jù)各個顯著區(qū)域?qū)?yīng)的置信度確定圖像中的人臉區(qū)域;在檢測圖像中的人臉之前,首先從圖像中確定可能存在人臉的顯著區(qū)域,然后只對顯著區(qū)域進行人臉檢測,不需要對整幅圖像中每個區(qū)域分別進行檢測,從而極大的降低了需檢測區(qū)域的數(shù)量,達到減少檢測時間,提高人臉檢測效率的效果。

此外,本公開實施例提供的確定圖像中的人臉區(qū)域的裝置,通過圖像顯著性算法確定該圖像中的各個候選顯著區(qū)域,并將該各個候選顯著區(qū)域中,寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域獲取為各個顯著區(qū)域,按照候選顯著區(qū)域的寬高比將明顯不對應(yīng)人臉的區(qū)域剔除,避免后續(xù)對這些被剔除的區(qū)域的圖像進行不必要的檢測計算,進一步降低了需檢測區(qū)域的數(shù)量,提高人臉檢測效率。

需要說明的一點是,上述實施例提供的裝置在執(zhí)行確定圖像中的人臉區(qū)域的方法時,僅以上述各個功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)實際需要而將上述功能分配由不同的功能模塊完成,即將設(shè)備的內(nèi)容結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。

關(guān)于上述實施例中的裝置,其中各個模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實施例中進行了詳細描述,此處將不做詳細闡述說明。

本公開實施例還提供一種確定圖像中的人臉區(qū)域的裝置,所述裝置包括:處理器;用于存儲所述處理器的可執(zhí)行指令的存儲器;其中,所述處理器用于執(zhí)行存儲器中存儲的可執(zhí)行指令,以實現(xiàn)上述圖1、圖2或圖5任一所示的方法的全部或者部分步驟,即所述處理器被配置為:

確定圖像中的各個顯著區(qū)域,所述顯著區(qū)域是所述圖像中具有視覺顯著性的區(qū)域;

計算所述各個顯著區(qū)域的置信度,所述置信度用于指示對應(yīng)的顯著區(qū)域中的圖像是人臉圖像的概率;

根據(jù)所述各個顯著區(qū)域?qū)?yīng)的置信度確定所述圖像中的人臉區(qū)域。

可選的,所述確定圖像中的各個顯著區(qū)域,包括:

通過圖像顯著性算法確定所述圖像中的各個候選顯著區(qū)域,所述候選顯著區(qū)域是所述圖像中具有視覺顯著性的矩形區(qū)域;

將所述各個候選顯著區(qū)域中,寬高比處于預設(shè)寬高比區(qū)間內(nèi)的候選顯著區(qū)域獲取為所述各個顯著區(qū)域。

可選的,所述預設(shè)寬高比區(qū)間為[0.5,2]。

可選的,所述計算所述各個顯著區(qū)域的置信度,包括:

通過卷積神經(jīng)網(wǎng)絡(luò)算法計算所述各個顯著區(qū)域的置信度。

可選的,所述根據(jù)所述各個顯著區(qū)域?qū)?yīng)的置信度確定所述圖像中的人臉區(qū)域,包括:

將所述各個顯著區(qū)域中,置信度高于置信度閾值的顯著區(qū)域確定為各個備選人臉區(qū)域;

將所述各個備選人臉區(qū)域中的重復區(qū)域剔除,獲得所述圖像中的人臉區(qū)域。

可選的,所述將所述各個備選人臉區(qū)域中的重復區(qū)域剔除,獲得所述圖像中的人臉區(qū)域,包括:

對于所述各個備選人臉區(qū)域中的兩個備選人臉區(qū)域,計算所述兩個備選人臉區(qū)域之間的交集面積與并集面積的比值;

當所述兩個備選人臉區(qū)域之間的交集面積與并集面積的比值高于預設(shè)比值時,將所述兩個備選人臉區(qū)域中置信度低的備選人臉區(qū)域剔除。

圖9是根據(jù)一示例性實施例示出的一種用于裝置900的框圖。例如,裝置900可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等。

參照圖9,裝置900可以包括以下一個或多個組件:處理組件902,存儲器904,電源組件906,多媒體組件908,音頻組件910,輸入/輸出(I/O)的接口912,傳感器組件914,以及通信組件916。

處理組件902通??刂蒲b置900的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關(guān)聯(lián)的操作。處理組件902可以包括一個或多個處理器920來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件902可以包括一個或多個模塊,便于處理組件902和其他組件之間的交互。例如,處理組件902可以包括多媒體模塊,以方便多媒體組件908和處理組件902之間的交互。

存儲器904被配置為存儲各種類型的數(shù)據(jù)以支持在裝置900的操作。這些數(shù)據(jù)的示例包括用于在裝置900上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器904可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。

電源組件906為裝置900的各種組件提供電力。電源組件906可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置900生成、管理和分配電力相關(guān)聯(lián)的組件。

多媒體組件908包括在所述裝置900和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中,多媒體組件908包括一個前置攝像頭和/或后置攝像頭。當裝置900處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學透鏡系統(tǒng)或具有焦距和光學變焦能力。

音頻組件910被配置為輸出和/或輸入音頻信號。例如,音頻組件910包括一個麥克風(MIC),當裝置900處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器904或經(jīng)由通信組件916發(fā)送。在一些實施例中,音頻組件910還包括一個揚聲器,用于輸出音頻信號。

I/O接口912為處理組件902和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。

傳感器組件914包括一個或多個傳感器,用于為裝置900提供各個方面的狀態(tài)評估。例如,傳感器組件914可以檢測到裝置900的打開/關(guān)閉狀態(tài),組件的相對定位,例如所述組件為裝置900的顯示器和小鍵盤,傳感器組件914還可以檢測裝置900或裝置900一個組件的位置改變,用戶與裝置900接觸的存在或不存在,裝置900方位或加速/減速和裝置900的溫度變化。傳感器組件914可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件914還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實施例中,該傳感器組件914還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。

通信組件916被配置為便于裝置900和其他設(shè)備之間有線或無線方式的通信。裝置900可以接入基于通信標準的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個示例性實施例中,通信組件916經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中,所述通信組件916還包括近場通信(NFC)模塊,以促進短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍牙(BT)技術(shù)和其他技術(shù)來實現(xiàn)。

在示例性實施例中,裝置900可以被一個或多個應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述方法。

在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器904,上述指令可由裝置900的處理器920執(zhí)行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質(zhì)可以是ROM、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。

一種非臨時性計算機可讀存儲介質(zhì),當所述存儲介質(zhì)中的指令由裝置900的處理器執(zhí)行時,使得裝置900能夠執(zhí)行如上圖1、圖2或圖5任一所示的確定圖像中的人臉區(qū)域的方法。

本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。

應(yīng)當理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1