一種圖像識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,特別涉及一種圖像識別方法及裝置。
【背景技術(shù)】
[0002]圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。0CR(0ptical Character Recognit1n,光學(xué)字符識別)技術(shù),是圖像識別技術(shù)中的一種,在圖像內(nèi)容識別中應(yīng)用比較廣泛。
[0003]現(xiàn)有技術(shù)中主要通過OCR技術(shù)對圖像進行識別。獲取票據(jù)的圖像,通過光學(xué)手段將票據(jù)的圖像中的字符輪廓描畫出來,然后與標(biāo)準字庫中字庫模板進行對比,找到相匹配的字庫模板。
[0004]通過上述描述可見,現(xiàn)有技術(shù)中的識別方法中,總是試圖通過高對比度的圖像內(nèi)容去分析和識別字符的幾何結(jié)構(gòu),當(dāng)圖像中色彩較復(fù)雜或幾何結(jié)構(gòu)之間的色彩較接近時,字符的識別率較低。以銀行現(xiàn)金支票為例,不但票據(jù)自身的背景圖案復(fù)雜,色彩多變,而且機打編號也多以彩色為主,再加上原始圖標(biāo)、字體、印章,以及手寫文本的顏色也多有不同,如果使用傳統(tǒng)的OCR識別技術(shù)很難得到正確識別結(jié)果的。總之,圖像內(nèi)容的識別率是與圖像本身的內(nèi)容復(fù)雜度相關(guān)的,背景與文字的色彩對比度越高,包含的色彩數(shù)越少,識別率就會越高,反之則識別率越低。
【發(fā)明內(nèi)容】
[0005]有鑒于此,本發(fā)明提供了一種圖像識別方法及裝置,能夠提高圖像的識別率。
[0006]—方面,本發(fā)明提供了一種圖像識別方法,包括:預(yù)先建立數(shù)據(jù)空間,該數(shù)據(jù)空間中的一個坐標(biāo)軸為色彩軸,還包括:
[0007]S1:獲取待識別圖像中的每個像素點的色彩信息;
[0008]S2:根據(jù)所述待識別圖像的每個像素點的色彩信息,將所述待識別圖像中的每個像素點加載到所述數(shù)據(jù)空間中色彩軸的對應(yīng)位置,以形成在所述色彩軸上的至少一個圖層;
[0009]S3:對每個圖層進行識別。
[0010]進一步地,該方法包括:所述色彩信息為色彩值;
[0011]所述S2中,所述根據(jù)每個像素點的色彩信息,將所述待識別圖像中的每個像素點加載到所述數(shù)據(jù)空間中色彩軸的對應(yīng)位置,包括:將當(dāng)前像素點加載到所述色彩軸上與當(dāng)前像素點的色彩值大小相同的坐標(biāo)位置處。
[0012]進一步地,該方法包括:所述色彩信息為色彩值;
[0013]所述S2中,所述根據(jù)每個像素點的色彩信息,將所述待識別圖像中的每個像素點加載到所述數(shù)據(jù)空間中色彩軸的對應(yīng)位置,包括:設(shè)置待識別圖像中色彩值與色彩級別的一一對應(yīng)關(guān)系,將當(dāng)前像素點加載到所述色彩軸上與當(dāng)前像素點的色彩值對應(yīng)的色彩級別大小相同的坐標(biāo)位置處。
[0014]進一步地,還包括:所述數(shù)據(jù)空間中的Y軸為所述色彩軸;
[0015]所述數(shù)據(jù)空間中還包括X軸和Z軸,X軸和Z軸均為位置軸;
[0016]所述S2進一步包括:獲取所述待識別圖像中每個像素點的位置信息,根據(jù)每一個像素點的位置信息,將所述待識別圖像中的每個像素點加載到所述數(shù)據(jù)空間中X軸和Z軸的對應(yīng)位置。
[0017]進一步地,所述獲取所述待識別圖像中每個像素點的位置信息,包括:將所述待識別圖像中的一個指定像素點的坐標(biāo)設(shè)置為在X軸和Z軸的值分別為O ;根據(jù)所述待識別圖像中其他每一個像素點相對于所述指定像素點的位置,確定所述待識別圖像中其他每一個像素點在X軸和Z軸的坐標(biāo)值。
[0018]進一步地,所述S3,包括:
[0019]對每個圖層進行分割,分割出每個圖層對應(yīng)的幾何結(jié)構(gòu)和文本內(nèi)容;
[0020]還包括:根據(jù)預(yù)設(shè)的校驗信息,對分割出的幾何結(jié)構(gòu)和文本內(nèi)容進行校驗。
[0021]另一方面,本發(fā)明提供了一種圖像識別裝置,包括:
[0022]建立單元,用于建立數(shù)據(jù)空間,該數(shù)據(jù)空間中的一個坐標(biāo)軸為色彩軸;
[0023]色彩信息獲取單元,用于獲取待識別圖像中的每個像素點的色彩信息;
[0024]加載單元,用于根據(jù)所述待識別圖像的每個像素點的色彩信息,將所述待識別圖像中的每個像素點加載到所述數(shù)據(jù)空間中色彩軸的對應(yīng)位置,以形成在所述色彩軸上的至少一個圖層;
[0025]識別單元,用于對每個圖層進行識別。
[0026]進一步地,該裝置包括:所述色彩信息為色彩值;
[0027]所述加載單元,在執(zhí)行所述根據(jù)每個像素點的色彩信息,將所述待識別圖像中的每個像素點加載到所述數(shù)據(jù)空間中色彩軸的對應(yīng)位置時,具體執(zhí)行:將當(dāng)前像素點加載到所述色彩軸上與當(dāng)前像素點的色彩值大小相同的坐標(biāo)位置處。
[0028]進一步地,該裝置包括:所述色彩信息為色彩值;
[0029]所述加載單元,在執(zhí)行所述根據(jù)每個像素點的色彩信息,將所述待識別圖像中的每個像素點加載到所述數(shù)據(jù)空間中色彩軸的對應(yīng)位置時,具體執(zhí)行:設(shè)置待識別圖像中色彩值與色彩級別的一一對應(yīng)關(guān)系,將當(dāng)前像素點加載到所述色彩軸上與當(dāng)前像素點的色彩值對應(yīng)的色彩級別大小相同的坐標(biāo)位置處。
[0030]進一步地,還包括:所述數(shù)據(jù)空間中的Y軸為所述色彩軸;
[0031]所述數(shù)據(jù)空間中還包括X軸和Z軸,X軸和Z軸均為位置軸;
[0032]所述加載單元,進一步用于獲取所述待識別圖像中每個像素點的位置信息,根據(jù)每一個像素點的位置信息,將所述待識別圖像中的每個像素點加載到所述數(shù)據(jù)空間中X軸和Z軸的對應(yīng)位置。
[0033]進一步地,所述加載單元,在執(zhí)行所述獲取所述待識別圖像中每個像素點的位置信息時,具體執(zhí)行:將所述待識別圖像中的一個指定像素點的坐標(biāo)設(shè)置為在X軸和Z軸的值分別為O ;根據(jù)所述待識別圖像中其他每一個像素點相對于所述指定像素點的位置,確定所述待識別圖像中其他每一個像素點在X軸和Z軸的坐標(biāo)值。
[0034]進一步地,所述識別單元,用于對每個圖層進行分割,分割出每個圖層對應(yīng)的幾何結(jié)構(gòu)和文本內(nèi)容;
[0035]還包括:驗證單元,用于根據(jù)預(yù)設(shè)的校驗信息,對分割出的幾何結(jié)構(gòu)和文本內(nèi)容進行校驗。
[0036]本發(fā)明提供的一種圖像識別方法及裝置,建立數(shù)據(jù)空間,在該數(shù)據(jù)空間中設(shè)置有色彩軸,將待識別圖像在數(shù)據(jù)空間中的色彩軸上根據(jù)色彩信息分層,減少了每層中的色彩數(shù),減小了每個圖層的色彩的復(fù)雜度,然后對每層進行識別,提高了圖像的識別率。
【附圖說明】
[0037]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0038]圖1是本發(fā)明一實施例提供的一種圖像識別方法的流程圖;
[0039]圖2是本發(fā)明一實施例提供的另一種圖像識別方法的流程圖;
[0040]圖3是本發(fā)明一實施例提供的一種數(shù)據(jù)空間的結(jié)構(gòu)示意圖;
[0041]圖4是本發(fā)明一實施例提供的一種圖像識別裝置的示意圖;
[0042]圖5是本發(fā)明一實施例提供的另一種圖像識別裝置的示意圖。
【具體實施方式】
[0043]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例,基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0044]如圖1所示,本發(fā)明實施例提供了一種圖像識別方法,該方法可以包括以下步驟:
[0045]SO:預(yù)先建立數(shù)據(jù)空間,該數(shù)據(jù)空間中的一個坐標(biāo)軸為色彩軸;
[0046]S1:獲取待識別圖像中的每個像素點的色彩信息;
[0047]S2:根據(jù)所述待識別圖像的每個像素點的色彩信息,將所述待識別圖像中的每個