翻拍證件圖片的識(shí)別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體而言涉及一種翻拍證件圖片的識(shí)別方法及裝 置。
【背景技術(shù)】
[0002] 隨著經(jīng)濟(jì)的發(fā)展以及互聯(lián)網(wǎng)的普及,個(gè)人征信、遠(yuǎn)程開戶等業(yè)務(wù)正逐漸成為金融、 電信和電商等行業(yè)的重要業(yè)務(wù)。在這些業(yè)務(wù)中,出于便捷、安全以及法律法規(guī)等方面的考 慮,可能需要用戶通過智能手機(jī)、平板電腦或網(wǎng)絡(luò)攝像頭等設(shè)備拍攝并上傳自己的證件圖 片(例如圖IA所示的合格身份證圖片)。
[0003] 然而,一些證件圖片不是通過對(duì)準(zhǔn)真實(shí)的證件拍攝得到的,而是通過翻拍電腦屏 幕或手機(jī)屏幕上的證件圖片而形成的。這些翻拍圖片中的證件可能不屬于用戶本人,也可 能曾經(jīng)被編輯、偽造或篡改,不具備法律效力,因此被認(rèn)定為違規(guī)證件圖片(例如圖IB所示 的翻拍身份證圖片)。
[0004] 在實(shí)際的業(yè)務(wù)中,需要一種可以鑒別此類翻拍證件圖片的有效途徑。目前,翻拍證 件圖片的鑒別都是通過人工查看和檢驗(yàn)的方式完成,尚沒有自動(dòng)化的方案、系統(tǒng)或裝置。當(dāng) 需要鑒別的證件圖片數(shù)目巨大時(shí),人工查看和檢驗(yàn)的效率和成本將成為嚴(yán)重的制約瓶頸。
【發(fā)明內(nèi)容】
[0005] 針對(duì)現(xiàn)有技術(shù)的不足,一方面,本發(fā)明提供一種翻拍證件圖片的識(shí)別方法。所述識(shí) 別方法包括:計(jì)算給定證件圖片的圖片特征;以及基于所計(jì)算的圖片特征利用訓(xùn)練好的分 類模型確定所述給定證件圖片是否為翻拍證件圖片。
[0006] 示例性地,所述分類模型的訓(xùn)練包括:構(gòu)建證件圖片數(shù)據(jù)庫(kù),所述證件圖片數(shù)據(jù)庫(kù) 包括一組證件圖片以及每個(gè)證件圖片相應(yīng)的標(biāo)簽,所述標(biāo)簽指示證件圖片是否為翻拍證件 圖片;計(jì)算所述證件圖片數(shù)據(jù)庫(kù)中的每一個(gè)證件圖片的圖片特征;基于所述標(biāo)簽和所述圖 片特征構(gòu)建訓(xùn)練集;以及采用支持向量機(jī)(SVM)模型在所述訓(xùn)練集上訓(xùn)練出所述分類模 型。
[0007] 示例性地,計(jì)算證件圖片的圖片特征包括計(jì)算證件圖片的頻譜特征、紋理特征和 顏色特征中的至少一個(gè)。
[0008] 示例性地,計(jì)算證件圖片的頻譜特征包括:將待計(jì)算的證件圖片縮放到標(biāo)準(zhǔn)尺寸; 將縮放之后得到的圖像按照RGB三通道分解為三幅圖像;分別計(jì)算所述三幅圖像的離散傅 里葉變換并取其各自的模值;將所述模值中的所有元素以列優(yōu)先的方式連接成向量,以作 為所述頻譜特征。
[0009] 示例性地,計(jì)算證件圖片的紋理特征包括計(jì)算證件圖片的詞袋模型(Bag of Words)〇
[0010] 示例性地,計(jì)算證件圖片的顏色特征包括計(jì)算證件圖片的顏色直方圖。
[0011] 另一方面,本發(fā)明還提供一種翻拍證件圖片的識(shí)別裝置。所述識(shí)別裝置包括:特征 提取模塊,用于計(jì)算給定證件圖片的圖片特征;以及圖像分類模塊,用于利用其包括的訓(xùn)練 好的分類模型、基于所計(jì)算的圖片特征確定所述給定證件圖片是否為翻拍證件圖片。
[0012] 示例性地,所述分類模型的訓(xùn)練包括:構(gòu)建證件圖片數(shù)據(jù)庫(kù),所述證件圖片數(shù)據(jù)庫(kù) 包括一組證件圖片以及每個(gè)證件圖片相應(yīng)的標(biāo)簽,所述標(biāo)簽指示證件圖片是否為翻拍證件 圖片;計(jì)算所述證件圖片數(shù)據(jù)庫(kù)中的每一個(gè)證件圖片的圖片特征;基于所述標(biāo)簽和所述圖 片特征構(gòu)建訓(xùn)練集;以及采用支持向量機(jī)模型在所述訓(xùn)練集上訓(xùn)練出所述分類模型。
[0013] 示例性地,所述特征提取模塊計(jì)算證件圖片的圖片特征包括計(jì)算證件圖片的頻譜 特征、紋理特征和顏色特征中的至少一個(gè)。
[0014] 示例性地,所述特征提取模塊計(jì)算證件圖片的頻譜特征的方法包括:將待計(jì)算的 證件圖片縮放到標(biāo)準(zhǔn)尺寸;將縮放之后得到的圖像按照RGB三通道分解為三幅圖像;分別 計(jì)算所述三幅圖像的離散傅里葉變換并取其各自的模值;將所述模值中的所有元素以列優(yōu) 先的方式連接成向量,以作為所述頻譜特征。
[0015] 本發(fā)明提供的翻拍證件圖片的識(shí)別方法及裝置通過圖像特性自動(dòng)判斷證件圖片 的類別,免去人工查看和檢驗(yàn)的過程,提高翻拍證件圖片鑒別的效率。
【附圖說明】
[0016] 本發(fā)明的下列附圖在此作為本發(fā)明的一部分用于理解本發(fā)明。附圖中示出了本發(fā) 明的實(shí)施例及其描述,用來解釋本發(fā)明的原理。
[0017] 附圖中:
[0018] 圖IA示出了合格身份證圖片的示例;
[0019] 圖IB示出了翻拍身份證圖片的示例;以及
[0020] 圖2示出了根據(jù)本發(fā)明實(shí)施例的、翻拍證件圖片的識(shí)別方法的流程圖。
【具體實(shí)施方式】
[0021] 在下文的描述中,給出了大量具體的細(xì)節(jié)以便提供對(duì)本發(fā)明更為徹底的理解。然 而,對(duì)于本領(lǐng)域技術(shù)人員而言顯而易見的是,本發(fā)明可以無需一個(gè)或多個(gè)這些細(xì)節(jié)而得以 實(shí)施。在其他的例子中,為了避免與本發(fā)明發(fā)生混淆,對(duì)于本領(lǐng)域公知的一些技術(shù)特征未進(jìn) 行描述。
[0022] 應(yīng)當(dāng)理解的是,本發(fā)明能夠以不同形式實(shí)施,而不應(yīng)當(dāng)解釋為局限于這里提出的 實(shí)施例。相反地,提供這些實(shí)施例將使公開徹底和完全,并且將本發(fā)明的范圍完全地傳遞給 本領(lǐng)域技術(shù)人員。
[0023] 在此使用的術(shù)語(yǔ)的目的僅在于描述具體實(shí)施例并且不作為本發(fā)明的限制。在此使 用時(shí),單數(shù)形式的"一"、"一個(gè)"和"所述/該"也意圖包括復(fù)數(shù)形式,除非上下文清楚指出 另外的方式。還應(yīng)明白術(shù)語(yǔ)"組成"和/或"包括",當(dāng)在該說明書中使用時(shí),確定所述特征、 整數(shù)、步驟、操作、元件和/或部件的存在,但不排除一個(gè)或更多其它的特征、整數(shù)、步驟、操 作、元件、部件和/或組的存在或添加。在此使用時(shí),術(shù)語(yǔ)"和/或"包括相關(guān)所列項(xiàng)目的任 何及所有組合。
[0024] 為了徹底理解本發(fā)明,將在下列的描述中提出詳細(xì)的步驟以及詳細(xì)的結(jié)構(gòu),以便 闡釋本發(fā)明的技術(shù)方案。本發(fā)明的較佳實(shí)施例詳細(xì)描述如下,然而除了這些詳細(xì)描述外,本 發(fā)明還可以具有其他實(shí)施方式。
[0025] 本發(fā)明的一個(gè)實(shí)施例提供一種翻拍證件圖片的識(shí)別方法,用于通過圖像特性自動(dòng) 判斷證件圖片(例如身份證圖片、護(hù)照?qǐng)D片、駕駛證圖片等)的類別(即,真實(shí)或翻拍),免 去人工查看和檢驗(yàn)的過程,提高翻拍證件圖片鑒別的效率。
[0026] 下面,參照?qǐng)D2來具體描述根據(jù)本發(fā)明的一個(gè)實(shí)施例的翻拍證件圖片的識(shí)別方 法。圖2示出了根據(jù)本發(fā)明實(shí)施例的、翻拍證件圖片的識(shí)別方法200的流程圖。如圖2所 示,翻拍證件圖片的識(shí)別方法200包括如下步驟:
[0027] 步驟201 :計(jì)算給定證件圖片的圖片特征;以及
[0028] 步驟202 :基于所計(jì)算的圖片特征利用訓(xùn)練好的分類模型確定該給定證件圖片是 否為翻拍證件圖片。
[0029] 示例性地,步驟201可以包括:計(jì)算給定證件圖片的頻譜特征、紋理特征和/或顏 色特征。由于相機(jī)感光元件與顯示器之間的波的干涉效應(yīng),通過翻拍電腦或手機(jī)屏幕上的 證件照片而得到的圖片上會(huì)出現(xiàn)明顯的周期性彩色條紋(例如見圖1B),稱為"摩爾紋"。摩 爾紋是區(qū)別真實(shí)證件圖片和翻拍證件圖片的重要線索。由于摩爾紋呈現(xiàn)周期性,在頻率域 中摩爾紋的特性會(huì)更加明顯。此外,摩爾紋的顏色也區(qū)別于正常的證件。因此,利用由于相 機(jī)感光元件與顯示器之間的波的干涉效應(yīng)而產(chǎn)生的摩爾紋,計(jì)算圖像的頻譜特征、紋理特 征和顏色特征中的至少一個(gè),可以有效提高翻拍證件圖片識(shí)別的精度。示例性地,上述三種 特征既可以獨(dú)立使用,也可以拼接起來作為組合特征使用。
[0030] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,計(jì)算證件圖片的頻譜特征可以包括如下步驟(1)~ (5):
[0031] (1)將待計(jì)算的證件圖片(例如P)縮放到標(biāo)準(zhǔn)尺寸(例如寬度為像素214、高度 為135像素)。
[0032] (2)將縮放之后得到的圖像按照RGB三通道分解為三幅圖像,例如記為PR、P e和PB。
[0033] (3)對(duì)于PR、PS和P B三幅圖像,分別計(jì)算其離散傅里葉變換,例如P R的離散傅里葉 變換的計(jì)算可以通過如下的公式進(jìn)行:
[0035] 其中匕為P R經(jīng)過離散傅里葉變換后得到的頻譜圖,u和V為頻域索引。M和N分 別為圖像匕的寬度和高度,m和η分別為圖像P R中像素水平和豎直方向的索引,j為虛數(shù) 單位。采用相同的方法,可以計(jì)算Pe和P 8的頻譜圖F 和F B。
[0036] (4) FR、Fe和F B中的每一個(gè)元素均為復(fù)數(shù)。對(duì)F R、Fe和F B中的每一個(gè)元素取模值, 得到 I IfrI I、I |FS| I 和 I IfbI I。
[0037] (5)將I |fr| |、| |Fe| I和I |fb| I中的所有元素以列優(yōu)先的方式連接成一個(gè)向量X, X即為圖像P的頻譜特征。
[0038] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,計(jì)算證件圖片的紋理特征可以包括計(jì)算證件圖片的詞 袋模型。詞袋模型是圖像紋理特征的一種統(tǒng)計(jì)表達(dá),可以有效描述圖像的整體和局部特性。 詞袋模型的計(jì)算可以包括兩個(gè)主要步驟(a)和(b):
[0039] (a)建立碼本:從一個(gè)訓(xùn)練圖像集合中隨機(jī)提取大量的圖像描述符(如SIFT、HOG 等),每個(gè)圖像描述符都是一個(gè)向量,采用K-means聚類算法對(duì)這些圖像描述符進(jìn)行聚類, 得到K個(gè)類別(K為可以調(diào)節(jié)的參數(shù),典型值為1024、2048、10000等)。聚