圖像四邊形識別的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種圖像四邊形識別的方法,對第一圖像進行四邊形識別,該四邊形識別中識別邊界的確定是通過自動方式或手動方式兩種中的至少一種來完成;記錄對所述第一圖像進行四邊形識別時四邊形的識別邊界處的圖像特征,并將該圖像特征作為第一圖像特征;在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識別邊界,并根據(jù)該相符的第二圖像的識別邊界對所述第二圖像中相應的四邊形進行識別處理或者優(yōu)先進行識別處理。本發(fā)明還公開了一種實現(xiàn)上述方法的圖像四邊形識別的裝置。本發(fā)明使得用戶進行批量操作時,對圖像四邊形識別的方法能夠適應特定的操作環(huán)境,提高了圖像四邊形識別的準確性,減少了用戶的手動操作,方便了用戶的使用。
【專利說明】圖像四邊形識別的方法和裝置
【技術領域】
[0001]本發(fā)明涉及一種圖像處理的方法,尤其是一種圖像四邊形識別的方法。本發(fā)明還涉及一種圖像處理的裝置,尤其是一種圖像四邊形識別的裝置。
【背景技術】
[0002]隨著技術的發(fā)展,圖像已經成為人們傳遞信息的重要媒介,而圖像處理技術已成為一項必不可少的工具,幫助人們進行圖像的采集和使用。圖像四邊形識別是指對圖像中的四邊形輪廓進行識別,然后可以根據(jù)識別得到的四邊形,將四邊形的部分內容與其它部分進行分離,以決定保留其中一部分圖像的圖像處理技術。這種技術目前已經被廣泛的使用。例如,用戶可以用手機拍攝名片,然后手機對名片內容進行識別,將名片中的聯(lián)系信息存入手機的通訊錄。為了使得名片的識別更加準確,人們已經采用了圖像四邊形識別技術將拍攝得到的名片從圖片中識別后進行切邊處理,只保留名片區(qū)域的圖像,而將其它背景圖像去除,然后對名片區(qū)域的圖像進行四邊形拉伸處理,得到矩形的名片圖像,然后對矩形的名片圖像進行文字識別。被經過上述處理之后的名片圖像,大大的克服了由于拍攝角度和攝像頭的鏡頭造成的失真,從而提高了識別的準確率。再例如,現(xiàn)在人們可以通過用智能手機拍攝文件的方式對文件進行掃描,而不需要去使用掃描儀。手機拍攝到文件后,使用四邊形識別技術將拍攝的文件從圖像的背景中提取出來,然后拉伸成文件原來的尺寸,例如A4紙張大小。
[0003]然而,在上述的應用中,圖像的處理一般是先通過計算機自動識別圖像中名片或文件的邊界,如圖1中,在圖像中識別出四邊形邊界ABCD,然后由用戶檢查是否需要對這些邊界進行調整,再對邊界內的部分圖像進行提取和拉伸,如圖2中,將圖1中的四邊形邊界ABCD拉伸成矩形,并將矩形邊界ABCD提取進行其它的處理。然而,名片、文件以及背景中的圖案很可能會影響計算機自動識別邊界的結果。例如,名片中如果有一條直線,如圖1和圖2中的線條EF,這條直線可能就會被識別成邊界中的一條邊,從而將四邊形邊界識別為ABFE。再例如,文件中如果有表格,該表格的外框可能就會被直接識別為文件的邊界。再例如,如果背景中有一些線條,這些線條也可能會被識別為邊界的一部分。這些圖案對自動識別的干擾越多,就會造成邊界識別的準確率越低,而隨后用戶進行調整的操作量就會越多。尤其在用戶需要使用智能手機批量進行名片識別或者文件掃描的情況下,就會為用戶帶來大量的人工操作,非常的不方便。
【發(fā)明內容】
[0004]本發(fā)明所要解決的技術問題是提供一種圖像四邊形識別的方法,以及實現(xiàn)這種圖像四邊形識別的方法所采用的圖像四邊形識別的裝置,能夠在進行批量處理時提高圖像四邊形識別的準確性,減少用戶的手動操作,方便用戶的使用。
[0005]為解決上述技術問題,本發(fā)明圖像四邊形識別的方法的技術方案是,包括以下步驟: 步驟一,對第一圖像進行四邊形識別,該四邊形識別中識別邊界的確定是通過自動方式或手動方式兩種中的至少一種來完成;
步驟二,記錄對所述第一圖像進行四邊形識別時四邊形的識別邊界處的圖像特征,并將該圖像特征作為第一圖像特征;
步驟三,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識別邊界,并根據(jù)該相符的第二圖像的識別邊界對所述第二圖像中相應的四邊形進行識別處理或者優(yōu)先進行識別處理。
[0006]本發(fā)明還提供了一種實現(xiàn)上述圖像四邊形識別的方法所采用的圖像四邊形識別的裝置,其技術方案是,基于計算機系統(tǒng),包括
第一識別部件,對第一圖像進行四邊形識別,該四邊形識別中識別邊界的確定是通過自動方式或手動方式兩種中的至少一種來完成;
圖像特征采集部件,記錄對所述第一圖像進行四邊形識別時四邊形的識別邊界處的圖像特征,并將該圖像特征作為第一圖像特征;
第二識別部件,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識別邊界,并根據(jù)該相符的第二圖像的識別邊界對所述第二圖像中相應的四邊形進行識別處理或者優(yōu)先進行識別處理。
[0007]本發(fā)明通過上述技術方案,使得用戶進行批量操作時,對圖像四邊形識別的方法能夠適應特定的操作環(huán)境,從而高效的完成圖像的四邊形識別,提高了圖像四邊形識別的準確性,減少了用戶的手動操作,方便了用戶的使用。
【專利附圖】
【附圖說明】
[0008]下面結合附圖和實施例對本發(fā)明作進一步詳細的說明:
圖1和圖2為現(xiàn)有的圖像四邊形識別的方法的示意圖。
[0009]圖3、圖4和圖5為本發(fā)明圖像四邊形識別的方法的實施例示意圖。
[0010]圖6為圖像四邊形識別的裝置的示意圖。
【具體實施方式】
[0011]本發(fā)明公開了一種圖像四邊形識別的方法,包括以下步驟:
步驟一,對第一圖像進行四邊形識別,該四邊形識別中識別邊界的確定是通過自動方式或手動方式兩種中的至少一種來完成;
步驟二,記錄對所述第一圖像進行四邊形識別時四邊形的識別邊界處的圖像特征,并將該圖像特征作為第一圖像特征;
步驟三,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識別邊界,并根據(jù)該相符的第二圖像的識別邊界對所述第二圖像中相應的四邊形進行識別處理或者優(yōu)先進行識別處理。
[0012]用戶在以拍攝方式獲取文件或名片的電子格式時,通常會在一些比較固定的環(huán)境中,例如自己的辦公室的桌子上,或者家里的桌子上,在這些環(huán)境中拍攝文件或名片時,拍攝得到的圖像一般都會有類似的背景。再有時,用戶拍攝的一套文件有很多張,或者一次性處理多個人的名片,因此可能會一次性拍攝多張文件或名片,而在進行這樣的多張拍攝時,拍攝得到的圖像也會有高度相似的背景。另外,對于一些格式文件,其文件上也會有一些特征,從而使得這些文件的圖像也會有高度相似性。
[0013]用戶使用本發(fā)明所提供的圖像切邊處理的方法,首先對第一張圖像作為第一圖像進行四邊形識別處理,如圖1所示,將圖1中的四邊形ABCD進行四邊形識別,該四邊形識別可以通過計算機系統(tǒng)自動進行,有時圖像上會有一些干擾導致計算機系統(tǒng)自動進行的四邊形識別發(fā)生錯誤,例如圖1所示的圖像中有線條EF,會造成計算機系統(tǒng)將四邊形識別為ABFE或者CDEF,因此該四邊形識別也可以由用戶手動進行操作以選擇要進行切邊的四邊形,還可以由計算機系統(tǒng)自動識別與用戶手動操作相結合的方式,由用戶對計算機系統(tǒng)自動識別的結果進行調整,進行對四邊形ABCD的四邊形識別。用戶對第一張圖像進行四邊形識別,得到相應的處理結果,如圖2所示的矩形ABCD。此外,計算機系統(tǒng)記錄了上述四邊形識別中,四邊形AB⑶邊界處的圖像特征,作為第一圖像特征。
[0014]此后,用戶對其它圖像作為第二圖像進行處理,此時計算機系統(tǒng)在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識別邊界,并根據(jù)該相符的第二圖像的識別邊界對所述第二圖像進行或者優(yōu)先進行四邊形識別。如圖3所示,計算機系統(tǒng)在第二圖像中搜索到四邊形A’ B’ C’ D’邊界處的圖像特征與所述第一圖像特征相符,因此將四邊形A’ B’ C’ D’進行識別,或者優(yōu)先選擇四邊形A’ B’ C’ D’作為待識別的四邊形,等待用戶的確認后作為識別結果,然后如圖4所示,可以將四邊形A’ B’ C’ D’提取出來并進行拉伸等其它操作。由于只有四邊形A’ B’ C’ D’邊界處的圖像特征與所述第一圖像特征相符,而一些干擾圖像特征例如線條E’ F’處的圖像特征與第一圖像特征不相符,因此不會將線條E’ F’錯誤的認為是待提取四邊形的邊界,從而提高了四邊形識別處理的準確性。
[0015]本發(fā)明中,所述第一圖像和第二圖像可以一次性獲取,也可以分多次獲取。獲取的方式可以是直接接收所述第一圖像和第二圖像的文件,也可以是通過拍攝等方式生成第一圖像和第二圖像的文件等。例如,用戶可以一次性接收或者拍攝多個圖像,然后對其中一個圖像作為第一圖像進行四邊形識別,并記錄相應的第一圖像特征,之后根據(jù)該第一圖像特征對其它的圖像進行四邊形識別處理?;蛘?,用戶還可以在以后另行接收或者拍攝其它的圖像,根據(jù)先前已經記錄的第一圖像特征,對后來節(jié)后或者拍攝的圖像進行四邊形識別處理。
[0016]本發(fā)明中,所述第一圖像可以是一個圖像,也可以是多個圖像。如果所述第一圖像包括多個圖像,則在步驟二中記錄對每個第一圖像進行四邊形識別時第一圖像的識別邊界處的第一圖像特征,步驟三中在第二圖像中搜索與其中一個第一圖像特征相符的第二圖像的識別邊界。所述步驟三中,在第二圖像中搜索與指定的第一圖像特征相符的第二圖像的識別邊界,或者在第二圖像中搜索與任意第一圖像特征相符的第二圖像的識別邊界。例如,用戶在辦公室的桌子和家中的桌子分別拍攝了不同的第一圖像并進行了四邊形識別,計算機系統(tǒng)中記錄了上述不同的第一圖像各自所對應的第一圖像特征。以后,用戶再拍攝新的第二圖像,如果新的第二圖像有符合辦公室或家中所獲取的第一圖像對應的任意第一圖像特征的識別邊界,則根據(jù)該第一圖像特征對新的第二圖像進行四邊形識別?;蛘?,用戶知道新的第二圖像的拍攝地點,例如是在辦公室的桌子上,用戶可以指定辦公室桌子拍攝的第一圖像所對應的第一圖像特征,然后根據(jù)該第一圖像特征對第二圖像進行四邊形識別。
[0017]所述第二圖像可以包括一個或多個圖像;如果所述第二圖像包括多個圖像,則重復步驟三對每個第二圖像進行處理。
[0018]所述第一圖像特征包括以下五種中的至少一種:
識別邊界在圖像上的位置,可以在第二圖像的相應位置上尋找是否有識別邊界,進行四邊形識別。
[0019]識別邊界至少一側的圖案,例如,所拍攝的文件背景上有特定的圖案,通過這些圖案可以識別圖像上哪部分是背景,哪部分是文件;或者所拍攝的文件是格式文件,上面有特定的底紋圖案,這樣也可以通過特定的底紋圖案區(qū)別背景部分和文件部分。
[0020]識別邊界至少一側的顏色,例如,所拍攝的文件背景有特定的顏色,例如在桌子上拍攝文件,桌面的顏色可以作為區(qū)分圖像中背景部分和文件部分的依據(jù);或則所拍攝的文件也有特定的顏色,也可以作為區(qū)別圖像中背景部分和文件部分的依據(jù)。
[0021]識別邊界兩側色彩的對比度,在某一個環(huán)境下拍攝文件,文件部分的圖像色彩與背景部分的色彩會有特定的對比度,將此作為第一圖像特征也可以將文件部分與背景部分區(qū)分開。
[0022]識別邊界的線條形狀參數(shù),例如對一本書的內容進行拍攝,如圖5所示,翻開的書的輪廓形狀相對比較固定,對這些輪廓線條的形狀參數(shù),例如線條的曲率、線條曲線的極值以及增減趨勢,作為第一圖像特征,從而確定第二圖像中相似的輪廓線條,作為四邊形識別邊界。
[0023]本發(fā)明還公開了一種實現(xiàn)上述圖像四邊形識別的方法所采用的圖像四邊形識別裝置,如圖6所示,基于計算機系統(tǒng),該計算機系統(tǒng)包括個人電腦、智能手機和平板電腦等,包括:
第一識別部件,對第一圖像進行四邊形識別,該四邊形識別中識別邊界的確定是通過自動方式或手動方式兩種中的至少一種來完成;
圖像特征采集部件,記錄對所述第一圖像進行四邊形識別時四邊形的識別邊界處的圖像特征,并將該圖像特征作為第一圖像特征;
第二識別部件,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識別邊界,并根據(jù)該相符的第二圖像的識別邊界對所述第二圖像中相應的四邊形進行識別處理或者優(yōu)先進行識別處理。
[0024]本發(fā)明通過上述技術方案,使得用戶進行批量操作時,對圖像四邊形識別的方法能夠適應特定的操作環(huán)境,從而高效的完成圖像的四邊形識別,提高了圖像四邊形識別的準確性,減少了用戶的手動操作,方便了用戶的使用。
[0025]以上所述僅為本發(fā)明的較佳實施例而已,并非用以限定本發(fā)明的實質技術內容范圍,本發(fā)明的實質技術內容是廣義的定義于申請的權利要求范圍中,任何他人完成的技術實體或方法,若是與申請的權利要求范圍所定義的完全相同,也或是一種等效的變更,均將被視為涵蓋于該權利要求范圍之中。
【權利要求】
1.一種圖像四邊形識別的方法,其特征在于,包括以下步驟: 步驟一,對第一圖像進行四邊形識別,該四邊形識別中識別邊界的確定是通過自動方式或手動方式兩種中的至少一種來完成; 步驟二,記錄對所述第一圖像進行四邊形識別時四邊形的識別邊界處的圖像特征,并將該圖像特征作為第一圖像特征; 步驟三,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識別邊界,并根據(jù)該相符的第二圖像的識別邊界對所述第二圖像中相應的四邊形進行識別處理或者優(yōu)先進行識別處理。
2.根據(jù)權利要求1所述的圖像四邊形識別的方法,其特征在于,還包括一次性或者分多次獲取第一圖像和第二圖像的步驟。
3.根據(jù)權利要求1所述的圖像四邊形識別的方法,其特征在于,所述第一圖像包括一個或多個圖像;如果所述第一圖像包括多個圖像,則在步驟二中記錄對每個第一圖像進行四邊形識別時第一圖像的識別邊界處的第一圖像特征,步驟三中在第二圖像中搜索與其中一個第一圖像特征相符的第二圖像的識別邊界。
4.根據(jù)權利要求3所述的圖像四邊形識別的方法,其特征在于,所述步驟三中,在第二圖像中搜索與指定的第一圖像特征相符的第二圖像的識別邊界,或者在第二圖像中搜索與任意第一圖像特征相符的第二圖像的識別邊界。
5.根據(jù)權利要求1所述的圖像四邊形識別的方法,其特征在于,所述第二圖像包括一個或多個圖像;如果所述第二圖像包括多個圖像,則重復步驟三對每個第二圖像進行處理。
6.根據(jù)權利要求1所述的圖像四邊形識別的方法,其特征在于,所述第一圖像特征包括以下幾種中的至少一種:識別邊界在圖像上的位置,識別邊界至少一側的圖案,識別邊界至少一側的顏色,識別邊界兩側色彩的對比度,識別邊界的線條形狀參數(shù)。
7.一種實現(xiàn)權利要求1-6中任意一項所述的圖像四邊形識別的方法所采用的圖像四邊形識別裝置,其特征在于,基于計算機系統(tǒng),包括 第一識別部件,對第一圖像進行四邊形識別,該四邊形識別中識別邊界的確定是通過自動方式或手動方式兩種中的至少一種來完成; 圖像特征采集部件,記錄對所述第一圖像進行四邊形識別時四邊形的識別邊界處的圖像特征,并將該圖像特征作為第一圖像特征; 第二識別部件,在第二圖像中搜索與所述第一圖像特征相符的第二圖像的識別邊界,并根據(jù)該相符的第二圖像的識別邊界對所述第二圖像中相應的四邊形進行識別處理或者優(yōu)先進行識別處理。
【文檔編號】G06T7/00GK104408427SQ201410709428
【公開日】2015年3月11日 申請日期:2014年12月1日 優(yōu)先權日:2014年12月1日
【發(fā)明者】陳鵬淵 申請人:上海合合信息科技發(fā)展有限公司