專利名稱:圖片內容識別方法及識別系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及計算機信息處理技術,尤其涉及一種對計算機圖片內容進行 自動識別的識別系統(tǒng)及識別方法。
背景技術:
目前的計算機互聯(lián)網身份驗證控制系統(tǒng)中,往往釆用圖片驗證碼技術來 實現(xiàn)客戶身份驗證和使用頻率控制。
圖1為一種通過圖片驗證碼實現(xiàn)身份驗
證登錄的界面示意圖。
參見圖l,用戶不但需要輸入正確的帳號101和密碼 102,而且還需從所述驗證碼圖片100中正確讀出驗證碼字符103,并輸入 到系統(tǒng),才能通過驗證并登錄到系統(tǒng)。
在對驗證碼系統(tǒng)的測試過程中,為了評估驗證碼系統(tǒng)的風險,需要一種 自動從驗證碼圖片中識別出驗證碼信息并輸入到系統(tǒng)中的測試系統(tǒng),以自動 模擬真實用戶的輸入行為,并根據驗證碼系統(tǒng)的反應對整個驗證碼系統(tǒng)進行 風險評估。在這種測試系統(tǒng)中,首先需要計算機自動對驗證碼圖片中的內容 進行識別分析,識別出其中的驗證碼字符,然后再進行后續(xù)處理。
目前的驗證碼圖片內容識別技術一般是釆用內容識別提取技術,例如文 字識別(OCR)方式。其主要方案是包括一個圖片內容識別單元,釆用人工 智能算法實現(xiàn),如手機中常見的手寫識別系統(tǒng)需要對每種文字的寫法進行學 習訓練,根據大規(guī)模的訓練集得到可應用的識別模型,在識別時需要利用人 工智能算法根據區(qū)別出每個文字的筆劃、筆順、連筆寫法等特征,給出候選 集合,人工挑選后得到識別字輸出,整個處理過程需要進行大量復雜的計算。 另外,對于驗證碼圖片中具有波浪線、噪點等干擾信息時,還需要包括一個 輔助的噪聲干擾消除單元,用于去除波浪線、噪點等干擾信息,經過噪聲干擾消除處理后的圖片內容比較干凈,圖片內容識別單元較容易識別出正確的 文字信息。
但是,目前的這種內容識別提取技術有以下缺點
1 )所述圖片內容識別單元需要綜合多種統(tǒng)計算法和人工智能算法來實 現(xiàn),計算處理過程復雜,計算量非常巨大,需要耗費大量的計算機CPU運 算開銷和系統(tǒng)資源。
2)只能從圖片中識別出特定的文字,對于圖像信息的識別存在較大的 難度。例如,如果圖片中還包括某些特定的圖案,例如包括一只羊的圖案, 則對應的驗證碼輸入可能是"羊"這個字,對于這種情況,現(xiàn)有的識別技術 是無法進行識別的。
發(fā)明內容
有鑒于此,本發(fā)明所要解決的技術問題在于提供 一種圖片內容識別方 法,以降低計算機的計算開銷和對系統(tǒng)資源的占用,并可以擴大可識別的內 容種類。
本發(fā)明所要解決的另 一 技術問題在于提供 一 種圖片內容識別系統(tǒng),以降 低計算機的計算開銷和對系統(tǒng)資源的占用,并可以擴大可識別的內容種類。
為了實現(xiàn)上述發(fā)明目的,本發(fā)明的主要技術方案為
一種圖片內容識別方法,該方法預先存儲基本圖像內容實例及其對應的 標注信息;
在進行識別時,包括
A 、從待識別的圖片中拆分出 一 個或 一 個以上基本圖像內容;
B、 將拆分出的基本圖像內容與所述實例庫中的基本圖像內容實例進行 比較,得到對應的相似度;
C、 確定與所述每一基本圖像內容相似度最高的基本圖像內容實例,并 將所述基本圖像內容實例對應的標注信息作為圖片內容識別結果輸出。
優(yōu)選的,所述存儲基本圖像內容實例及其對應的標注信息的具體方法
為
對實例圖片進行拆分,從中拆分出 一個或 一個以上基本圖像內容實例并
分別存儲;
為所述每一個基本圖像內容實例標注對應的標注信息并存儲。 優(yōu)選的,所述實例圖片為驗證碼系統(tǒng)中的驗證碼實例圖片。
優(yōu)選的,所述步驟B中,確定一個基本圖像內容及其對比的基本圖像內 容實例之間相似度的具體方法為
Bl、提取所述基本圖像內容和對比的基本圖像內容實例的關鍵參數(shù),比 較確定雙方關鍵參數(shù)的相似指數(shù);
B2、根據所述關鍵參數(shù)的相似指數(shù)確定所述基本圖像內容及其對比的基 本圖像內容實例之間的相似度。
優(yōu)選的,所述步驟B1之前進一步包括對所述基本圖像內容和/或其對 比的基本圖像內容實例進行歸一化處理,統(tǒng)一雙方的格式指標。
優(yōu)選的,所述步驟B1的關鍵參數(shù)為一個;所述步驟B2中具體為將 該關鍵參數(shù)的相似指數(shù)作為所述基本圖像內容及其對比的基本圖像內容實 例之間的相似度。
優(yōu)選的,所述步驟B1的關鍵參數(shù)為一個以上;所述步驟B2中具體為
1對所述基本圖像內容及其對比的基本圖像內容實例之間的所有關鍵參數(shù)的 相似指數(shù)進行加權計算,將計算結果作為雙方最終的相似度。
優(yōu)選的,所述關鍵參數(shù)包括以下任一種關鍵參數(shù)或任意種關鍵參數(shù)的組
合
原始圖片大小、原始色彩矩陣或灰度矩陣、經變換的色彩矩陣或灰度矩
陣、圖片明度分布信息、圖片特殊效果統(tǒng)計參數(shù)、以及原始圖片格式和內嵌
優(yōu)選的,該方法進一步統(tǒng)計所述實例庫中的基本圖像內容實例的出現(xiàn)概 率;并在步驟B得到所述每一基本圖像內容與其對比基本圖像內容實例的相
似度之后,進一步根據每一對比基本圖像內容實例的出現(xiàn)概率對相關的相似度進行加權計算,將加權計算后的相似度作為步驟c的確定依據。
一種圖片內容識別系統(tǒng),包括
實例庫,用于存儲基本圖像內容實例及其對應的標注信息;
第 一拆分模塊,用于從待識別圖片中拆分出 一個或 一個以上基本圖像內
容;
相似度比較模塊,用于將第一拆分模塊拆分出的基本圖像內容和所述實 例庫中的基本圖像內容實例進行比較,得到對應的相似度;
結果輸出模塊,用于根據所述圖片相似度比較模塊的比較結果,選擇與 所述每一基本圖像內容相似度最高的基本圖像內容實例,并將所述基本圖像 內容實例對應的標注信息作為圖片內容識別結果輸出。
優(yōu)選的,所述系統(tǒng)進一步包括
第二拆分模塊,用于從實例圖片中拆分出 一 個或 一 個以上基本圖像內容 實例,并將所述基本圖像實例存入所述實例庫中;
標注模塊,用于提供標注接口,通過標注接口接收用戶輸入的針對每一 基本圖像內容實例的標注信息,將所述基本圖像內容對應的標注信息存入所 述實例庫中。
優(yōu)選的,所述相似度比較模塊具體包括
關鍵參數(shù)相似指數(shù)確定模塊,用于針對一個基本圖像內容及其對比的基
本圖像內容實例,提取雙方的關鍵參數(shù),比較確定所述關鍵參數(shù)的相似指數(shù); 相似度確定模塊,用于根據所述關鍵參數(shù)的相似指數(shù)確定所述基本圖像 內容及其對比的基本圖像內容實例之間的相似度。
優(yōu)選的,所述相似度比較模塊進一步包括歸一化模塊,用于將所述第 一拆分模塊拆分的基本圖像內容歸一化為與所述實例庫中的實例格式指標 相一致的基本圖像內容。
優(yōu)選的,所述的關鍵參數(shù)相似指數(shù)確定模塊包括以下任一種模塊或任意 種模塊的組合
用于確定原始圖片大小相似指數(shù)的確定模塊;
用于確定原始色彩矩陣或灰度矩陣相似指數(shù)的確定模塊;
用于確定經變換的色彩矩陣或灰度矩陣相似指數(shù)的確定模塊;
用于確定圖片明度相似指數(shù)的確定模塊;
用于確定圖片特殊效果相似指數(shù)的確定模塊;
用于確定原始圖片格式和內嵌信息相似指數(shù)的確定模塊。
相對于現(xiàn)有技術,本發(fā)明采用基于圖片實例的相似度比較方式來識別圖 片內容,不需要利用人工智能算法進行內容提取計算,具有應用簡單、更新 簡單、運算復雜度低的特點,可以降低計算機cpu的計算開銷,并減少對 計算機系統(tǒng)資源的占用。同時,本發(fā)明由于收集存儲的是基本圖像內容及其 標注信息,所述基本圖像內容可以是文字內容,也可以是圖形內容,輸出的 是基本圖像內容實例的標注信息,因此既可以識別出圖片中的文字內容,又 可以識別出圖片中的圖形內容,可以擴大可識別的內容種類。
本發(fā)明應用到驗證碼圖片的識別時,可以預先收集驗證碼圖片實例,拆 分成基本圖像內容實例并進行標注,組成一個驗證碼圖片的實例庫,由于圖 片驗證碼系統(tǒng)一般都使用有限個數(shù)的文字集,如字母組合、數(shù)字組合、漢字 組合等組成驗證碼圖片,因此本發(fā)明可以較容易地收集到一個經常出現(xiàn)的文 字等基本圖像內容實例的集合,從而很容易搭建出針對某一個圖片驗證碼系 統(tǒng)的識別環(huán)境,并在圖片驗證碼系統(tǒng)進行驗證碼更新后可以很容易地完成對 應的實例庫的更新,整個識另'」系統(tǒng)的維護所需的人工和計算機資源開銷均較 小,不需要專業(yè)人員操作。
圖1為一種通過圖片驗證碼實現(xiàn)身份驗證登錄的界面示意圖2為本發(fā)明所述在實例庫中收集存儲基本圖形內容實例及其對應標 注信息的流程圖3為本發(fā)明所述將一個驗證碼實例圖片拆分成多個基本圖像內容實
例的示意圖4為本發(fā)明所述對圖片內容進行識別的一種具體實施例的流程圖5為本發(fā)明所述圖片內容識別系統(tǒng)的一種主要結構示意圖6為本發(fā)明所述圖片內容識別系統(tǒng)中包括實例收集子系統(tǒng)的一種結 構示意圖7為本發(fā)明所述相似度比較模塊的結構示意圖。
具體實施例方式
下面通過具體實施例和附圖對本發(fā)明做進 一 步詳細說明。
以下實施例以本發(fā)明所述的圖片內容識別系統(tǒng)應用到驗證碼圖片識別 中為例進行說明。
本發(fā)明所述的方法需要預先設置實例庫,其中預先收集存儲基本圖像內 容實例及其對應的標注信息。圖2為本發(fā)明所述在實例庫中收集存儲基本圖形內容實例及其對應標注信息的流程圖。參見圖2,該流程具體包括
步驟200、輸入待處理的實例圖片集合。所述待處理的圖片集合為驗證 碼生成系統(tǒng)產生的各種驗證碼實例圖片。
步驟201、對所述驗證碼實例圖片進行拆分,根據文字和圖形的最小內 容元素將實例圖片拆分成一個或一個以上基本圖像內容實例。例如,圖3為 將一個驗證碼實例圖片拆分成多個基本圖像內容實例的示意圖。參見圖3, 所述驗證碼實例圖片300中包括"K" "Z" "X" "N"四個字母,經過拆 分后,得到如圖所述的四個基本圖像內容實例301、 302、 303、 304。將所 述拆分出的基本圖像內容實例存儲實例庫中。
本步驟所述的拆分過程可以利用常用的邊界識別方法實現(xiàn),例如所述具 體的拆分方法可以是按圖片的像素數(shù)定長對圖片進行拆分,例如每隔20x30
像素為一個基本圖像內容實例;或者按照完全、部分連續(xù)背景色的方法進行 分割,例如存在條狀的連續(xù)背景色時,則按照豎向分割的字與字的間隙進行 拆分。
步驟202、將步驟201所得到的基本圖像內容實例進行標注,其中對所 有同類的基本圖形內容實例標注相同的標注信息,并將標注信息對應存入實 例庫中。例如,將類似于所述基本圖形內容實例301的所有含有"K"字的 變形圖片均標注為字符"K";將類似于所述基本圖像內容實例304的所有 含有"N"字的變形圖片均標注為字符"N"。除了對含有字符內容的基本 圖像內容實例進行標注,本發(fā)明還可以對含有圖形的基本圖像內容實例進行 標注,例如某一個基本圖像內容實例中為一只羊的圖形,則可以對應標注為 "羊"這個字符。此步驟202需人工輔助實現(xiàn)。
步驟203、判斷是否處理完成所述待處理圖片集合中的所有圖片,如果 是,則結東本流程;否則返回步驟201繼續(xù)處理。
通過圖2所述的步驟,可以在實例庫中收集存儲一系列的驗證碼實例圖 片所分解的基本圖像內容實例及其標注信息的集合,所有類似于這些驗證碼 實例圖片的待識別圖片,利用本發(fā)明都可以進行識別。
圖4為本發(fā)明所述對圖片內容進行識別的 一種具體實施例的流程圖。本 實施例中,所述待識別的圖片是一張驗證碼系統(tǒng)生成的驗證碼圖片,該流程 具體包括
步驟400、輸入待識別的驗證碼圖片。
步驟401、對待識別的驗證碼圖片進行拆分,根據文字和圖形的最小內 容元素將實例圖片拆分成一個或一個以上基本圖像內容。具體的拆分方法可 以參見步驟201。
步驟402、針對每一個拆分出的基本圖像內容,與所述實例庫中的每一 個基本圖像內容實例進行比較,得到該基本圖像內容和所述實例庫中每 一個 基本圖像內容實例間的相似度。
步驟403、確定與所述每一基本圖像內容相似度最高的基本圖像內容實 例,從所述實例庫中讀取所述每一個基本圖像內容實例對應的標注信息,將 所述標注信息作為圖片內容識別結果輸出。
如果所述待識別的驗證碼圖片拆分成 一個以上基本圖像內容,則需要按
照所述基本圖像內容在原驗證碼圖片中的順序輸出所述對應的標注信息。
在所述步驟402中,確定一個基本圖像內容及其對比的基本圖像內容實 例之間相似度的具體方法實質上是釆用圖片相似程度比較技術,此處用相似 指數(shù)來表示相似程度,即使用[O, l]區(qū)間的小數(shù)來表示相似程度。對于所述 的兩個給定的圖片,即一個基本圖像內容(即拆分出的一張包含基本內容的 圖片)及其對比的基本圖像內容實例(即一張包含基本內容的實例圖片), 相似度的比較過程包括如下步驟421至步驟423:
步驟421、將所述基本圖像內容和/或其對比的基本圖像內容實例進行歸 一化處理,統(tǒng)一對比雙方的格式指標。即對雙方的圖片大小、色彩分布等指 標進行變換,得到技術指標統(tǒng)一的圖片作為待處理圖片。例如,指定統(tǒng)一的 圖片尺寸為12xl2像素,釆用256級灰度圖表示,完成雙方的水平和縱向矯 正等歸一化處理。如果雙方的格式指標已經統(tǒng)一,則跳過本步驟421。
步驟422、提取所述基本圖像內容及其對比基本圖像內容實例的關鍵參 數(shù),逐一得到雙方關鍵參數(shù)的相似指數(shù)。
步驟423、根據所述對比雙方關鍵參數(shù)的相似指數(shù)確定所述對比雙方之 間的相似度。此處,如果所述對比的關鍵參數(shù)只有一個,則將該關鍵參數(shù)的 相似指數(shù)作為所述基本圖像內容及其對比的基本圖像內容實例之間的相似 度。如果所述對比的關鍵參數(shù)為一個以上,則需要對所述基本圖像內容及其 對比的基本圖像內容實例之間的所有關鍵參數(shù)的相似指數(shù)進行加權計算,將 計算結果作為雙方最終的相似度。
所述的關鍵參數(shù)為用于計算相似度的關鍵比較參數(shù),至少包括下列關鍵 參數(shù)之一或以下任意種關鍵參數(shù)的組合
a)原始圖片大??;b)原始色彩矩陣,如果采用灰度圖片,則為灰度矩 陣;c)經變換的色彩矩陣或灰度矩陣,其中可以丟棄掉一些瑣碎信息,例 如采用小波變換等算法或圖形壓縮算法等算法對色彩矩陣或灰度矩陣進行 變換處理;d)圖片明度分布信息;e)圖片特殊效果統(tǒng)計參數(shù),例如為突出 前景文字,背景色往往采用和前景文字有明顯區(qū)別的色彩,否則人眼較難識
別出真正的文字信息,則可以對有明顯沖突的顏色做分布統(tǒng)計,將統(tǒng)計結果
作為關鍵參數(shù);f)原始圖片格式和圖片中的內嵌信息(meta-data)。
對于上述每種關鍵參數(shù),采用現(xiàn)有成熟的比較算法即可確定所述對比雙
方的該種關鍵參數(shù)的相似指數(shù),具體可以為
對于對比雙方的原始圖片大小,其相似指數(shù)的具體確定方法可以為
(a) 原始圖片大小比較由長、寬比較兩部分組成,假設2個帶比較圖 片pl、 p2的長寬分別是Xl、 Yl和X2、 Y2,則一個常用的大小相似指數(shù) 計算方法如下
SIM(p 1 ,p2)=W1 * (X1 +X2)/(2 * max(X 1 ,X2))+W2 * (Y1 - Y2)/(2 * max( Y1 , Y2))。 其中W1、 W2為長、寬加權指數(shù), 一般都設為0.5。
(b) 對于對比雙方的原始色彩矩陣或灰度矩陣,此處以256級灰度矩 陣為例說明其相似指數(shù)的算法。假設2個帶比較的灰度矩陣均為由20x30大 小的對應圖像統(tǒng)計得來,則可以看作一個有20x30見方的點陣組成的灰度圖 塊,每一個點的灰度值有256級變化。則相似指數(shù)的獲得可以采用如下常用 辦法依次比較2個矩陣對應位置的灰度級別值,若灰度級別值的差異度小 于某一個指定閾值(如200,205之間的差值為5),則對應位置的相似計數(shù) 記為1,遍歷完全后,統(tǒng)計相似計數(shù)可得到相似指數(shù)。
(c) 對于對比雙方的經過變換的色彩、灰度矩陣,變換的目的是減少 矩陣的尺寸,如直接比較1 OOOOOx 10000000大小的矩陣,計算開銷顯然較高。 此處首先采用圖像處理和人工智能等算法,將一些瑣碎信息丟棄,則可以得 到信息損失相對較小的矩陣,如采用小波變換算法或其他圖像壓縮算法變換 后得到大小為256x256的矩陣。變換后的相似度計算方法與上述(b)的方 法相同。
(d) 對于對比雙方的圖片的明度分布信息,可以將明度分布信息存儲 于矩陣中,可以采用類似色彩矩陣的計算方法獲得相似指數(shù)。
(e) 對于對比雙方的特殊效果統(tǒng)計參數(shù), 一般用來輔助比較,非一定 必要的比較參數(shù)。這里以沖突色彩計數(shù)來舉例。所謂色彩沖突,是指肉眼觀察時,色彩表現(xiàn)有顯著沖突的鄰近像素的色彩對計數(shù),如紅藍色相鄰放在一 起較容易區(qū)分開,粉紅和紅色相鄰放置則不容易區(qū)分。根據事先定義好的沖
突色彩對統(tǒng)計集合,分別掃描2個圖像,可以獲得對應的計數(shù),由此可以獲 得對應的相似指數(shù)。
(f)對于對比雙方的原始圖片格式,就是將相同類型的圖片格式視為 一致,相似指數(shù)為l;不同類型的圖片格式視為不相似,相似指數(shù)為0,例 如bmp格式和jpg格式為不相似。圖片的內嵌信息是圖片的可選內容,如jpg 類型的內嵌信息(meta-data)包括該圖片的處理軟件名稱和版本信息;生成 曰期;圖片版權信息;光圈、快門等相機參數(shù)資料;色彩空間參數(shù)等等。對 于內嵌信息,可以采用對比上述內嵌信息是否一致,并將一致性的概率作為 內嵌信息相似指數(shù)。
以下通過具體的計算公式說明所述相似度的計算過程 <formula>complex formula see original document page 14</formula>
上述公式中,所述P1為從待識別圖片中拆分出的一個基本圖像內容圖 片,P2為實例庫中的一個基本圖像內容實例圖片,SIM(P1,P2)為P1的P2
之間的相似度,Sl、 S2........ Sn為不同的關鍵參數(shù)的相似指數(shù),Wl、
W2........ Wn為每個關鍵參數(shù)對應的加權指數(shù),可以采用小數(shù)或整數(shù),視
具體系統(tǒng)實現(xiàn)而定。
假設現(xiàn)使用三種關鍵數(shù)據,并設定Wl=W2=W3=l/3, Sl代表原始圖像 大小相似程度,S2代表基于色彩矩陣計算出的色彩分布相似程度,S3代表 有明顯視覺沖突色彩的計數(shù)。其中,每個相似指數(shù)的計算可以采用任何圖像 處理領域中的算法,唯一的要求是計算速度要能達到實時性應用的最低要 求,例如在若干ms內完成。例如,此時得到Sl=0.9, S2=0.8, S3=0.9,則最 終SIM(Pl,P2)=l/3*0.9 + 1/3*0.8 +1/3*0.9=0.86為2個圖片的最終相似度。
通過上述相似度的比較方法,可以對所述待比較的基本圖像內容和所述 實例庫中的所有實例圖片進行比較得出相應的相似度,按照相似度的高低對 所述實例圖片對應的標注信息進行排序,取其中相似度最高的實例圖片對應
的標注信息作為所述基本圖像內容對應的識別內容。如果上述P2為實例庫 中與所述P1最相似的實例圖片,其標識為字母A,則可以得到Pl為字母A 的概率是86%,其他拆分部分的識別以此類推。
下面給出一個上述識別方法的實際應用舉例,對于一個有5個文字(即5 個基本圖像內容)的驗證碼圖片,通過拆分得到5個待比較圖片,對這5個 圖片逐一和實例庫中的基本圖像內容實例圖片比較,可獲得5列按照相似度 排列的標注信息隊列,每個標注信息隊列分別按照相似程度從高到底的順序 排列,并按照某一相似闊值截斷或簡單取前十個作為待處理集合, 一般選擇 5列標注信息隊列中相似度最高的標注信息作為最終的識別結果。更進一步 的,本發(fā)明還可以統(tǒng)計所應用驗證碼系統(tǒng)的具體驗證碼的出現(xiàn)概率,并存儲 該出現(xiàn)概率,在得出所述5列標注信息隊列后,還可以根據具體驗證碼的出 現(xiàn)概率對每個標注信息對應的相似度分別做加權計算,再按照經過加權計算 后的相似度對所述5個標注信息隊列重新排列,取出所述每 一標注隊列中的 相似度最高的標注信息作為最終識別結果。
圖5為本發(fā)明所述圖片內容識別系統(tǒng)的一種主要結構示意圖。參見圖5, 該圖片內容識別系統(tǒng)包括
實例庫501,用于存儲基本圖像內容實例及其對應的標注信息。
第一拆分模塊502,用于從待識別圖片中拆分出 一個或一個以上基本圖 像內容。
相似度比較模塊503,用于將第一拆分模塊502拆分出的基本圖像內容 和所述實例庫501中的基本圖像內容實例進行比較,得到對應的相似度。
結果輸出模塊504,用于根據所述圖片相似度比較模塊503的比較結果, 選擇與所述每一基本圖像內容相似度最高的基本圖像內容實例,并將所述基 本圖像內容實例對應的標注信息作為圖片內容識別結果輸出。
為了方便從實例圖片中收集存儲基本圖像內容實例,參見圖6,所述系 統(tǒng)的 一種實施例中還進 一步包括實例收集子系統(tǒng),該實例收集子系統(tǒng)具體包 括第二拆分模塊505和標注模塊506。
所述第二拆分模塊505用于從實例圖片中拆分出一個或一個以上基本 圖像內容實例,并將所述基本圖像實例存入所述實例庫501中。
所述標注模塊506用于提供標注接口 ,通過標注接口接收用戶輸入的針
對每一基本圖像內容實例的標注信息,將所述基本圖像內容對應的標注信息
存入所述實例庫501中。
圖7為所述相似度比較模塊的結構示意圖。參見圖7,相似度比較模塊 503對待對比的基本圖像內容和基本圖像內容實例進行相似度分析計算,具 體包括
歸一化模塊701,用于將所述第一拆分模塊502拆分的基本圖像內容歸 一化為與所述實例庫501中的實例格式指標相一致的基本圖像內容。如果所 述基本圖像內容和其對比的基本圖像內容實例的格式指標已經統(tǒng)一 ,則可以 將本歸一化模塊701省略。
關鍵參數(shù)相似指數(shù)確定模塊702,用于針對一個基本圖像內容及其對比 的基本圖像內容實例,提取雙方的關鍵參數(shù),比較確定所述關鍵參數(shù)的相似 指數(shù)。
相似度確定模塊703,用于根據所述關鍵參數(shù)的相似指數(shù)確定所述基本 圖像內容及其對比的基本圖像內容實例之間的相似度。如果所述對比的關鍵 參數(shù)只有一個,則將該關鍵參數(shù)的相似指數(shù)作為所述基本圖像內容及其對比 的基本圖像內容實例之間的相似度輸出。如果所述對比的關鍵參數(shù)為一個以 上,則需要對所述基本圖像內容及其對比的基本圖像內容實例之間的所有關 鍵參數(shù)的相似指數(shù)進行加權計算,將計算結果作為雙方最終的相似度輸出。
所述的關鍵參數(shù)為用于計算相似度的關鍵比較參數(shù),與上述識別方法對 應,所述的關鍵參數(shù)相似指數(shù)確定模塊可以包括以下任一種模塊或任意種模 塊的組合
用于確定原始圖片大小相似指數(shù)的確定模塊;
用于確定原始色彩矩陣或灰度矩陣相似指數(shù)的確定模塊;
用于確定經變換的色彩矩陣或灰度矩陣相似指數(shù)的確定模塊;
用于確定圖片明度相似指數(shù)的確定模塊;
用于確定圖片特殊效果相似指數(shù)的確定模塊;
用于確定原始圖片格式和內嵌信息相似指數(shù)的確定模塊。
當然,所述相似度確定模塊703還可以采用其它關鍵參數(shù)確定對比圖片
之間的相似度,對此本發(fā)明并不作限定。
以上所述,僅為本發(fā)明較佳的具體實施方式
,但本發(fā)明的保護范圍并不
局限于此,任何熟悉該技術的人在本發(fā)明所揭露的技術范圍內,可輕易想到
的變化或替換,都應涵蓋在本發(fā)明的保護范圍之內。
權利要求
1、一種圖片內容識別方法,其特征在于,該方法預先存儲基本圖像內容實例及其對應的標注信息;在進行識別時,包括A、從待識別的圖片中拆分出一個或一個以上基本圖像內容;B、將拆分出的基本圖像內容與所述實例庫中的基本圖像內容實例進行比較,得到對應的相似度;C、確定與所述每一基本圖像內容相似度最高的基本圖像內容實例,并將所述基本圖像內容實例對應的標注信息作為圖片內容識別結果輸出。
2、 根據權利要求i所述的圖片內容識別方法,其特征在于,所述存儲基本圖像內容實例及其對應的標注信息的具體方法為對實例圖片進行拆分,從中拆分出 一個或 一個以上基本圖像內容實例并分別存儲;為所述每 一 個基本圖像內容實例標注對應的標注信息并存儲。
3、 根據權利要求2所述的圖片內容識別方法,其特征在于,所述實例圖片為驗證碼系統(tǒng)中的驗證碼實例圖片。
4、 根據權利要求1所述的圖片內容識別方法,其特征在于,所述步驟 B中,確定一個基本圖像內容及其對比的基本圖像內容實例之間相似度的具 體方法為Bl、提取所述基本圖像內容和對比的基本圖像內容實例的關鍵參數(shù),比較確定雙方關鍵參數(shù)的相似指數(shù);B2、根據所述關鍵參數(shù)的相似指數(shù)確定所述基本圖像內容及其對比的基 本圖像內容實例之間的相似度。
5、 根據權利要求4所述的圖片內容識別方法,其特征在于,所述步驟 Bl之前進一步包括對所述基本圖像內容和/或其對比的基本圖像內容實例 進行歸一化處理,統(tǒng)一雙方的格式指標。
6、 根據權利要求4所述的圖片內容識別方法,其特征在于,所述步驟Bl的關鍵參數(shù)為一個;所述步驟B2中具體為將該關鍵參數(shù)的相似指數(shù)作 為所述基本圖像內容及其對比的基本圖像內容實例之間的相似度。
7、 根據權利要求4所述的圖片內容識別方法,其特征在于,所述步驟 Bl的關鍵參數(shù)為一個以上;所述步驟B2中具體為對所述基本圖像內容及 其對比的基本圖像內容實例之間的所有關鍵參數(shù)的相似指數(shù)進行加權計算, 將計算結果作為雙方最終的相似度。
8、 根據權利要求4所述的圖片內容識別方法,其特征在于,所述關鍵 參數(shù)包括以下任 一種關鍵參數(shù)或任意種關鍵參數(shù)的組合原始圖片大小、原始色彩矩陣或灰度矩陣、經變換的色彩矩陣或灰度矩 陣、圖片明度分布信息、圖片特殊效果統(tǒng)計參數(shù)、以及原始圖片格式和內嵌 信息。
9、 根據權利要求1所述的圖片內容識別方法,其特征在于,該方法進 一步統(tǒng)計所述實例庫中的基本圖像內容實例的出現(xiàn)概率;并在步驟B得到所 述每一基本圖像內容與其對比基本圖像內容實例的相似度之后,進一步根據 每一對比基本圖像內容實例的出現(xiàn)概率對相關的相似度進行加權計算,將加 權計算后的相似度作為步驟C的確定依據。
10、 一種圖片內容識別系統(tǒng),其特征在于,包括 實例庫,用于存儲基本圖像內容實例及其對應的標注信息;第 一 拆分模塊,用于從待識別圖片中拆分出 一 個或 一 個以上基本圖像內容;相似度比較模塊,用于將第一拆分模塊拆分出的基本圖像內容和所述實例庫中的基本圖像內容實例進行比較,得到對應的相似度;結果輸出模塊,用于根據所述圖片相似度比較模塊的比較結果,選擇與 所述每一基本圖像內容相似度最高的基本圖像內容實例,并將所述基本圖像 內容實例對應的標注信息作為圖片內容識別結果輸出。
11、 根據權利要求10所述的圖片內容識別系統(tǒng),其特征在于,所述系統(tǒng)進一步包括第二拆分模塊,用于從實例圖片中拆分出一個或一個以上基本圖像內容 實例,并將所述基本圖像實例存入所述實例庫中;標注模塊,用于提供標注接口,通過標注接口接收用戶輸入的針對每一 基本圖像內容實例的標注信息,將所述基本圖像內容對應的標注信息存入所 述實例庫中。
12、 根據權利要求10所述的圖片內容識別系統(tǒng),其特征在于,所述相似度比較模塊具體包括關鍵參數(shù)相似指數(shù)確定模塊,用于針對 一 個基本圖像內容及其對比的基本圖像內容實例,提取雙方的關鍵參數(shù),比較確定所述關鍵參數(shù)的相似指數(shù);相似度確定模塊,用于根據所述關鍵參數(shù)的相似指數(shù)確定所述基本圖像 內容及其對比的基本圖像內容實例之間的相似度。
13、 根據權利要求12所述的圖片內容識別系統(tǒng),其特征在于,所述相 似度比較模塊進一步包括歸一化模塊,用于將所述第一拆分模塊拆分的基 本圖像內容歸一化為與所述實例庫中的實例格式指標相一致的基本圖像內
14、根據權利要求12所述的圖片內容識別系統(tǒng),其特征在于,所述的 關鍵參數(shù)相似指數(shù)確定模塊包括以下任一種模塊或任意種模塊的組合 用于確定原始圖片大小相似指數(shù)的確定模塊;用于確定原始色彩矩陣或灰度矩陣相似指數(shù)的確定模塊;用于確定經變換的色彩矩陣或灰度矩陣相似指數(shù)的確定模塊;用于確定圖片明度相似指數(shù)的確定模塊;用于確定圖片特殊效果相似指數(shù)的確定模塊;用于確定原始圖片格式和內嵌信息相似指數(shù)的確定模塊。
全文摘要
本發(fā)明公開了一種圖片內容識別方法和系統(tǒng)。包括預先在實例庫中存儲基本圖像內容實例及其對應的標注信息。在進行識別時,由拆分模塊從待識別的圖片中拆分出一個或一個以上基本圖像內容;由相似度比較模塊將拆分出的基本圖像內容與所述實例庫中的基本圖像內容實例進行比較,得到對應的相似度;由結果輸出模塊確定與所述每一基本圖像內容相似度最高的基本圖像內容實例,并將所述基本圖像內容實例對應的標注信息作為圖片內容識別結果輸出。利用本發(fā)明,可以降低計算機的計算開銷和對系統(tǒng)資源的占用,并可以擴大可識別的內容種類。
文檔編號G06K9/00GK101196994SQ20071030420
公開日2008年6月11日 申請日期2007年12月26日 優(yōu)先權日2007年12月26日
發(fā)明者暉 王 申請人:騰訊科技(深圳)有限公司