一種基于光流分析的漢字圖像查找方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)視覺(jué)與圖像處理領(lǐng)域,具體地說(shuō)是光流分析與圖像查找方法, 該方法可將用戶輸入的漢字圖像,利用光流分析與庫(kù)中的漢字圖像盡可能地對(duì)齊,然后度 量輸入圖像與庫(kù)中圖像的距離,選取若干最近距離的圖像作為輸出結(jié)果。
【背景技術(shù)】
[0002] 隨著中國(guó)國(guó)力的逐步提升,漢字文物古跡越來(lái)越受到重視,利用數(shù)字圖像采集技 術(shù),大量的漢字碑文圖像被存儲(chǔ)到數(shù)據(jù)庫(kù)中。在進(jìn)行漢字圖像的查找、修復(fù)等方面工作也逐 一展開(kāi)。傳統(tǒng)的漢字查找方式是通過(guò)一些古文專(zhuān)家進(jìn)行人工識(shí)別并以標(biāo)簽的形式對(duì)每個(gè)漢 字圖像進(jìn)行存儲(chǔ),查找的時(shí)候也是以查找標(biāo)簽的方式來(lái)搜索數(shù)據(jù)庫(kù),這需要大量的人工參 與。而且人工標(biāo)記的方式容易受到主觀判斷的影響。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明提出了一種基于光流分析的漢字圖像查找方法。主要內(nèi)部包含四個(gè)步驟: 漢字圖像的預(yù)處理與數(shù)據(jù)庫(kù)構(gòu)造;輸入圖像的預(yù)處理;利用光流分析進(jìn)行圖像對(duì)齊;度量 對(duì)齊之后的圖像的距離并選取距離最小的若干圖像作為返回結(jié)果。
【附圖說(shuō)明】
[0004] 圖1漢字圖像的預(yù)處理。
【具體實(shí)施方式】
[0005] 本發(fā)明的基于光流分析的漢字圖像查找技術(shù)采用如下步驟:
[0006] (1)漢字圖像的預(yù)處理與數(shù)據(jù)庫(kù)構(gòu)造。每個(gè)漢字從碑文等古跡圖像中分割出來(lái),用 二值化圖像表示(黑底白字),對(duì)非正方形的圖像補(bǔ)上黑色邊框形成正方形,由于圖像可能 存在著噪點(diǎn),需要對(duì)圖像進(jìn)行一定的濾波(比如中值濾波、形態(tài)學(xué)變形),然后將圖像縮小 到32x32的小圖像作為每個(gè)原始圖像的鍵值,鍵值用于查找時(shí)的圖像匹配。
[0007] (2)輸入圖像的預(yù)處理。本發(fā)明允許用戶輸入漢字和輸入漢字圖像兩種方式進(jìn)行 查找。如果用戶輸入漢字,則先將輸入的漢字用字體庫(kù)(比如隸書(shū)字體)轉(zhuǎn)換到漢字圖像, 這種方式得到的圖像可以直接縮放到32x32作為鍵值。而對(duì)于直接輸入漢字圖像的查找方 式,也需要進(jìn)行預(yù)處理,處理過(guò)程參照步驟(1)。
[0008] (3)光流分析進(jìn)行對(duì)齊。我們采用的光流分析模型如下:
[0009] E (u, v) = Edata (u, v) + a 2Esm (u, v) (I)
[0010] 式中(u, v)為待求的光流場(chǎng),u為水平位移分量,v為豎直位移分量,單位為像素, Edata為數(shù)據(jù)匹配項(xiàng)能量,E sni為平滑性能量,a為加權(quán)系數(shù)。其中:
[0011] Edata (u, v) = / Q I 111 (x, y) -I2 (x+u, y+v) | | jd Q (2)
[0013] I1,12分別為兩個(gè)匹配的圖像,Q為積分空間,(x,y)為空間坐標(biāo),數(shù)據(jù)匹配能量項(xiàng) 我們使用的是一范數(shù),這是考慮到數(shù)據(jù)庫(kù)中的漢字圖像會(huì)有噪聲,使用一范數(shù)時(shí)更加有效。
[0014] 求解此光流模型時(shí),我們首先構(gòu)造圖像金字塔,進(jìn)行由粗到細(xì)地求解,金字塔構(gòu)造 3級(jí)分別為8x8,16x16, 32x32.最初的光流場(chǎng)初始化為0,當(dāng)?shù)头直媛实墓饬鲌?chǎng)求解完成之 后,將光流場(chǎng)上采樣到高一層次分辨率作為初值進(jìn)行求解。而每個(gè)層次分辨率的求解過(guò)程 如下:
[0035]
[0036] (4)度量圖像的距離與返回結(jié)果。步驟(3)中求出光流場(chǎng)(u,v)之后,將圖像I 2 對(duì)齊到圖像I1然后度量距離,距離定義為:
[0037] DCt1, I2)=工Q I 111(X,y)_I2(x+u,y+v) I I idQ。
【主權(quán)項(xiàng)】
1. 一種基于光流分析的漢字圖像查找方法,其特征在于包括以下步驟: (1) 漢字圖像的預(yù)處理與數(shù)據(jù)庫(kù)構(gòu)造; (2) 輸入圖像的預(yù)處理; (3) 光流分析進(jìn)行對(duì)齊; (4) 度量圖像距離與返回結(jié)果。2. 如權(quán)利要求1中所述的一種基于光流分析的漢字圖像查找方法,其特征在于:所述 步驟(1),具體采用如下方法: 對(duì)每張漢字圖像,裁剪補(bǔ)齊為正方形,然后使用濾波算法去除部分噪聲,然后縮小到預(yù) 定大小作為查找時(shí)的鍵值。3. 如權(quán)利要求1中所述的一種基于光流分析的漢字圖像查找方法,其特征在于:所述 步驟(2),輸入圖像的預(yù)處理與權(quán)利要求2中相同。4. 如權(quán)利要求1中所述的一種基于光流分析的漢字圖像查找方法,其特征在于:所述 步驟(3),構(gòu)造了的光流模型中的數(shù)據(jù)項(xiàng)能量采用了 Ll范數(shù),而平滑項(xiàng)能量采用了 L2范數(shù)。5. 如權(quán)利要求1中所述的一種基于光流分析的漢字圖像查找方法,其特征在于:所述 步驟(4),度量距離使用了逐像素相減的絕對(duì)值之和的方式。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于光流分析的漢字圖像查找方法。該方法中的漢字?jǐn)?shù)據(jù)庫(kù)直接用圖像存儲(chǔ),查找時(shí)用戶輸入的也是漢字圖像。用戶輸入待查找圖像之后,先利用光流分析將輸入圖像與漢字圖像庫(kù)中的每張圖像進(jìn)行對(duì)齊,然后度量?jī)烧咧g的距離。查找結(jié)果選取距離最小的若干個(gè)圖像。
【IPC分類(lèi)】G06F17/30
【公開(kāi)號(hào)】CN105069026
【申請(qǐng)?zhí)枴緾N201510422929
【發(fā)明人】齊越, 左慶, 徐澤祥, 儲(chǔ)備, 周博生, 胡勇
【申請(qǐng)人】北京航空航天大學(xué)
【公開(kāi)日】2015年11月18日
【申請(qǐng)日】2015年7月17日