一種用于移動(dòng)終端的交互式圖像處理方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像識(shí)別技術(shù)領(lǐng)域,尤其涉及一種用于移動(dòng)終端的交互式圖像處理方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái),傳統(tǒng)的平面媒體正逐步向數(shù)字媒體平移,智能終端用戶的不同喜好決定了他們對(duì)數(shù)字報(bào)文信息需求的不同。移動(dòng)終端數(shù)字報(bào)文的版面分析和識(shí)別作為文字識(shí)別系統(tǒng)、版面圖像處理,將隨著智能終端平面數(shù)字媒體的迅速發(fā)展而變得尤為重要。
[0003]在智能移動(dòng)終端迅速而廣泛地滲透于人們生活和工作中的同時(shí),對(duì)不同類型智能移動(dòng)終端所拍攝圖像的要求日益增多,但是傳統(tǒng)的移動(dòng)終端圖像會(huì)有光照不均勻、背景復(fù)雜、污染或變形等情況,對(duì)后期圖像識(shí)別、解析造成困難。通過(guò)移動(dòng)終端拍攝圖像后,直接存儲(chǔ)下來(lái),沒(méi)有經(jīng)過(guò)任何校正、剪裁,同時(shí)常采用基于邊緣提取方法來(lái)提取拍攝文檔圖像中的文檔結(jié)構(gòu)圖像,但是當(dāng)拍攝背景比較復(fù)雜時(shí),所提取的前景圖像不準(zhǔn)確,不能夠滿足用戶的需求。
[0004]利用移動(dòng)終端往往是通過(guò)抓取文檔的部分區(qū)域來(lái)實(shí)現(xiàn)較高的準(zhǔn)確率,由于拍攝視角和尺寸限制,所拍攝的圖像往往存在較嚴(yán)重的透視變形,影響了后續(xù)處理。用戶將相機(jī)垂直于拍攝平面,這樣才能得到圖像的真實(shí)形狀,但是對(duì)用戶要求比較高,給用戶帶來(lái)較大的困難。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的其中一個(gè)目的在于提供一種用于移動(dòng)終端的交互式圖像處理方法及系統(tǒng),以解決需要用戶垂直于所需要拍攝文檔以及拍攝大尺寸文檔時(shí)圖像透視變形影響后續(xù)處理的技術(shù)問(wèn)題。
[0006]第一方面,本發(fā)明實(shí)施例提供了種用于移動(dòng)終端的交互式圖像處理方法,其特征在于,包括:
[0007]當(dāng)需要拍攝文檔時(shí),在移動(dòng)終端拍攝界面中顯示一水平提示線;
[0008]根據(jù)拍攝指令,獲得文檔圖像;
[0009]以所述水平提示線為基準(zhǔn),對(duì)所述文檔圖像進(jìn)行邊緣檢測(cè)以確定所述前景圖像。
[0010]可選地,以所述水平提示線為基準(zhǔn),對(duì)所述文檔圖像進(jìn)行邊緣檢測(cè)以確定所述前景圖像之后,所述方法還包括:
[0011]在所述移動(dòng)終端拍攝界面中所述水平提示線相對(duì)邊的頂點(diǎn)處顯示可被用戶移動(dòng)的兩個(gè)提不點(diǎn);
[0012]根據(jù)所述兩個(gè)提示點(diǎn)位置重新確定所述前景圖像的期望頂點(diǎn),得到所述前景圖像的期望形狀。
[0013]可選地,該方法還包括對(duì)所述前景圖像進(jìn)行校正的步驟:
[0014]利用透視變換方法對(duì)所述前景圖像進(jìn)行傾斜校正獲取所需要的正投影的前景圖像。
[0015]可選地,對(duì)所述文檔圖像進(jìn)行邊緣檢測(cè)以確定所述前景圖像所在區(qū)域,包括利用邊緣提取方法對(duì)所述文檔圖像進(jìn)行邊緣檢測(cè)以確定所述前景圖像所在區(qū)域。
[0016]可選地,當(dāng)無(wú)法利用邊緣提取方法對(duì)所述文檔圖像進(jìn)行邊緣檢測(cè)以確定所述前景圖像所在區(qū)域時(shí),利用色彩分析方法確定前景圖像所在區(qū)域。
[0017]可選地,利用色彩分析方法確定前景圖像所在區(qū)域,具體包括:
[0018]縮小所述文檔圖像并計(jì)算縮小后所述文檔圖像的色彩飽和度;
[0019]根據(jù)色彩飽和度對(duì)所述文檔圖像進(jìn)行圖像二值化;
[0020]對(duì)圖像二值化后的所述文檔圖像進(jìn)行填充;
[0021]對(duì)填充好的所述文檔圖像提取邊緣確定前景圖像。
[0022]可選地,當(dāng)無(wú)法利用色彩分析方法確定前景圖像所在區(qū)域時(shí),利用聯(lián)通區(qū)域分析方法確定前景圖像位置,具體包括:
[0023]對(duì)文檔圖像進(jìn)行全面紋理分析得到前景圖像;
[0024]對(duì)所述前景圖像進(jìn)行局部紋理分析得到所述前景圖像的邊緣。
[0025]第二方面,本發(fā)明實(shí)施例提供了一種用于移動(dòng)終端的交互式圖像處理系統(tǒng),其特征在于,包括:
[0026]顯示模塊,用于當(dāng)需要拍攝文檔時(shí)在移動(dòng)終端拍攝界面中顯示一水平提示線;
[0027]文檔圖像獲取模塊,用于根據(jù)拍攝指令,獲得文檔圖像;
[0028]前景圖像獲取模塊,用于以所述水平提示線為基準(zhǔn),對(duì)所述文檔圖像進(jìn)行邊緣檢測(cè)以確定所述前景圖像。
[0029]可選地,所述顯示模塊還用于在所述前景圖像獲取模塊以所述水平提示線為基準(zhǔn),對(duì)所述文檔圖像進(jìn)行邊緣檢測(cè)以確定所述前景圖像之后;
[0030]在所述移動(dòng)終端拍攝界面中所述水平提示線相對(duì)邊的頂點(diǎn)處顯示可被用戶移動(dòng)的兩個(gè)提不點(diǎn);
[0031]所述前景圖像獲取模塊還用于根據(jù)所述兩個(gè)提示點(diǎn)位置重新確定所述前景圖像的期望頂點(diǎn),得到所述前景圖像的期望形狀。
[0032]可選地,還包括期望形狀校正模塊,用于利用透視變換方法對(duì)所述前景圖像進(jìn)行傾斜校正獲取所需要的正投影的前景圖像。
[0033]本發(fā)明通過(guò)對(duì)所拍攝的文檔進(jìn)行多次手動(dòng)對(duì)齊水平提示線或者多次配準(zhǔn)期望頂點(diǎn),然后再對(duì)文檔圖像進(jìn)行邊緣提取以及期望形狀確定,并對(duì)期望形狀進(jìn)行校正得到所需要的前景圖像。通過(guò)多次對(duì)齊或者配準(zhǔn)可以不斷更新前景圖像的邊緣以提高提取前景圖像的準(zhǔn)確度,尤其適用于拍攝大尺寸文檔的情形,使用戶可以不用垂直于所需要拍攝的文檔即可得到想要的前景圖像。另外,在得到前景圖像的區(qū)域后,將該前景圖像以外的圖像背景去掉,可以提高CPU的處理速度,并且可以減少大量的存儲(chǔ)空間。
【附圖說(shuō)明】
[0034]通過(guò)參考附圖會(huì)更加清楚的理解本發(fā)明的特征和優(yōu)點(diǎn),附圖是示意性的而不應(yīng)理解為對(duì)本發(fā)明進(jìn)行任何限制,在附圖中:
[0035]圖1是本發(fā)明實(shí)施例提供的一種用于移動(dòng)終端的交互式圖像處理方法流程示意圖;
[0036]圖2示出了置于桌面上的文檔示意圖;
[0037]圖3是本發(fā)明實(shí)施例中移動(dòng)終端的拍攝界面示意圖;
[0038]圖4是本發(fā)明實(shí)施例中利用混合算法所提取出文檔圖像邊緣的情形;
[0039]圖5是本發(fā)明實(shí)施例中手動(dòng)進(jìn)行配準(zhǔn)前景圖像邊緣的示意圖;
[0040]圖6是圖5中所確定的文檔圖像邊緣位置的示意圖;
[0041]圖7是本發(fā)明實(shí)施例中校正后的前景圖像的示意圖;
[0042]圖8是本發(fā)明實(shí)施例中提供的一種用于移動(dòng)終端的交互式圖像處理系統(tǒng)框圖。
【具體實(shí)施方式】
[0043]為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點(diǎn),下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)描述。需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0044]在下面的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述的其他方式來(lái)實(shí)施,因此,本發(fā)明的保護(hù)范圍并不受下面公開(kāi)的具體實(shí)施例的限制。
[0045]第一方面,本發(fā)明提出了一種用于移動(dòng)終端的交互式圖像處理方法,如圖1所示,包括:
[0046]S100、當(dāng)需要拍攝文檔時(shí),在移動(dòng)終端拍攝界面中顯示一水平提示線;
[0047]S200、根據(jù)拍攝指令,獲得文檔圖像;
[0048]S300、以所述水平提示線為基準(zhǔn),對(duì)所述文檔圖像進(jìn)行邊緣檢測(cè)以確定所述前景圖像。
[0049]可選的,以所述水平提示線為基準(zhǔn),對(duì)所述文檔圖像進(jìn)行邊緣檢測(cè)以確定所述前景圖像之后,所述方法還包括S400:
[0050]在所述移動(dòng)終端拍攝界面中所述水平提示線相對(duì)邊的頂點(diǎn)處顯示可被用戶移動(dòng)的兩個(gè)提不點(diǎn);
[0051]根據(jù)所述兩個(gè)提示點(diǎn)位置重新確定所述前景圖像的期望頂點(diǎn),得到所述前景圖像的期望形狀。
[0052]本發(fā)明通過(guò)對(duì)所拍攝的文檔進(jìn)行手動(dòng)對(duì)齊水平提示線或者多次配準(zhǔn)期望頂點(diǎn),然后再對(duì)文檔圖像進(jìn)行邊緣提取以及期望形狀確定,并對(duì)期望形狀進(jìn)行校正得到所需要的前景圖像。通過(guò)多次對(duì)齊或者配準(zhǔn)可以不斷更新前景圖像的邊緣以提高提取前景圖像的準(zhǔn)確度,尤其適用于拍攝大尺寸文檔的情形,使用戶可以不用垂直于所需要拍攝的文檔即可得到想要的前景圖像,降低拍攝難度。另外,在得到前景圖像所在區(qū)域后,將該前景圖像以外的背景去掉,只保存所需要的前景圖像部分,可以減少大量的存儲(chǔ)空間,還可以減少處理的數(shù)據(jù)提高CPU的處理速度。
[0053]首先,介紹SlOO當(dāng)需要拍攝文檔時(shí),在移動(dòng)終端拍攝界面中顯示一水平提示線以及S200根據(jù)拍攝指令,獲得文檔圖像的步驟。
[0054]圖2是本發(fā)明實(shí)施例中移動(dòng)終端拍攝界面示意圖。如圖2所示,當(dāng)用戶需要拍攝放置在桌面I上面的文檔2時(shí),由于文檔2面積比較大,用戶不方便將移動(dòng)終端垂直于文檔2進(jìn)行拍攝。如圖3所示,用戶使用移動(dòng)終端3準(zhǔn)備拍攝文檔2時(shí),移動(dòng)終端I的拍攝界面中存在一條水平提示線4。用戶將該水平提示線4與所拍攝文檔2的底邊對(duì)齊,然后再拍攝該文檔2從而形成文檔圖像5。其中,文檔2在文檔圖像5中形成前景圖像51,桌面I在文檔圖像5中形成背景52。
[0055]其次,介紹S300以所述水平提示線為基準(zhǔn),對(duì)所述文檔圖像進(jìn)行邊緣檢測(cè)以確定所述前景圖像的步驟。
[0056]本發(fā)明實(shí)施例中,采用混合算法對(duì)該文檔圖像中的前景圖像進(jìn)行定位。其中,混合算法包括邊緣提取方法、色彩分析方法和聯(lián)通區(qū)域分析方法。并且,以水平提示線為基準(zhǔn),在進(jìn)行邊緣提取時(shí),只計(jì)算該水平提示線的一側(cè)文檔圖像即可。以水平提示線為基準(zhǔn),確定前景圖像的其他三條邊緣,去掉前景圖像所在區(qū)域外的部分,可以減少所需要處理的數(shù)據(jù),從而對(duì)降低移動(dòng)終端的硬件開(kāi)銷。
[0057]I)邊緣提取方法
[0058]文檔圖像的邊緣攜帶了該文檔圖像的基本特征。邊緣提取方法是一種常用的算法,包括但不限于Roberts算子、Sobel算子和Canny算子,利用邊緣提取方法直接尋找文檔圖像上邊緣來(lái)確定前景圖像。這種方法廣泛用于名片識(shí)別等場(chǎng)合。但是邊緣提取方法的抗噪聲性能欠佳、在背景比較復(fù)雜的情況所提取的邊緣不夠準(zhǔn)確。
[0059]2)色彩分析方法
[0060]當(dāng)文檔圖像的背景比較復(fù)雜時(shí),前景圖像的邊緣不能通過(guò)邊緣提取方法確定。因此,本發(fā)明實(shí)施例采用色彩分析方法確定前景圖像。
[0061]一般情況下,文檔圖像呈現(xiàn)白底黑字的中性色調(diào)。當(dāng)文檔圖像轉(zhuǎn)換到色度空間時(shí),前景圖像所對(duì)應(yīng)區(qū)域的色彩飽和度低,與采用背景區(qū)域存在明顯區(qū)域。該方法包括: