專利名稱:結(jié)合文字識別和圖像匹配的名片識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及屬于圖像處理和網(wǎng)絡(luò)應(yīng)用的技術(shù)領(lǐng)域,特別是涉及一種結(jié)合文字識別和圖像匹配的名片識別方法。
背景技術(shù):
名片是人們經(jīng)常使用的一種記載和傳遞聯(lián)系方式的媒體,在日常商務(wù)活動中往往會涉及大量的名片交換,人們通過名片交換的方式來傳遞聯(lián)系方式,跟其他人建立聯(lián)系。目前已經(jīng)在手機(jī)和微機(jī)中廣泛使用的名片識別技術(shù),即利用圖像處理和光學(xué)字符識別(OCR,Optical Character Recognition)的原理,對數(shù)碼相機(jī)拍攝或掃描儀掃描得到的名片圖像自動進(jìn)行處理和識別,然后自動提取出其中的姓名、電話、E-mail等有用信息來加入到地址簿中去,為人們在電子設(shè)備中輸入名片上記載的聯(lián)系信息提供了很大的方便。 例如多普達(dá)Touch Diamond手機(jī)中預(yù)裝的名片識別軟件?;诠鈱W(xué)字符識別原理的名片識別技術(shù)具有至少以下三方面的局限性,其一,是識別結(jié)果是不可能達(dá)到100%的準(zhǔn)確率,因而總是需要用戶在保存識別出來的信息之前先對識別結(jié)果進(jìn)行人工的檢查和校正,以保證所保存信息的正確性,否則的話,保存下來的電話號碼、E-mail地址、網(wǎng)址等等中間哪怕僅僅錯(cuò)了一個(gè)符號,也成為無效的信息了 ;其二, 是對很多個(gè)性化的背景復(fù)雜的名片,以及包含較多藝術(shù)字體的名片幾乎無法識別,即便能夠識別出來其錯(cuò)誤率也特別高;其三,是光學(xué)字符識別技術(shù)跟特定的語言的基本字符集密切相關(guān),需要針對每一種語言開發(fā)專門的光學(xué)字符識別技術(shù),比如說只支持中文字符集的光學(xué)字符識別技術(shù)就不能用來識別例如韓語、日語等其他語言的名片。為解決上述問題,業(yè)內(nèi)已有的做法是,把經(jīng)過光學(xué)字符識別獲得的可能包含錯(cuò)誤的文字信息傳遞給特定網(wǎng)站的服務(wù)器,由網(wǎng)站的服務(wù)器利用這些可能包含錯(cuò)誤的文字信息來在網(wǎng)站的服務(wù)器所預(yù)存的名片的文字信息庫中進(jìn)行查找,找出最相似的文字信息來,替換掉可能包含錯(cuò)誤的文字信息,雖然這是一種減少錯(cuò)誤的方法,但是,上述方法的問題在于在很多情況下網(wǎng)站的服務(wù)器不能根據(jù)由光學(xué)字符識別得到的文字來唯一確定這些文字屬于網(wǎng)站的服務(wù)器所保存的名片中的哪一張,或者是否屬于網(wǎng)站的服務(wù)器所保存的名片。 比如說,同一個(gè)用戶可能有多張名片,在這多張名片中只有公司和職務(wù)的信息是不同的,其它姓名、電話號碼、E-mail這些信息都是相同的,這樣如果對公司和職務(wù)的識別有誤,只是正確的識別出了姓名、電話號碼、E-mail這些信息,網(wǎng)站的服務(wù)器就不能唯一確定這些信息屬于該用戶的哪一張名片,因而,就無法確定應(yīng)該反饋哪一張名片對應(yīng)的真實(shí)文字信息給提交名片識別請求的用戶。所謂的圖像匹配是指判斷兩張圖像中拍攝的物體是不是同一個(gè)物體,學(xué)術(shù)界對圖像匹配的研究已經(jīng)有很多年了,一般的做法是找出圖像中所拍攝物體的一些特征點(diǎn), 然后依據(jù)這些特征點(diǎn)周邊一定范圍內(nèi)的像素值來得到一個(gè)特征向量,通過特征點(diǎn)和特征向量的匹配來判斷圖像中拍攝的物體是不是同一個(gè)物體,如論文“Speed-up Robust Feautre(SURF),,(Herbert Bay,Andreas Ess,Tinne Tuytelaars,Luc Van Goo1,ComputerVision and Image Understanding 110(2008)346-359)中就比較詳細(xì)描述了這樣一種方法;在另一篇學(xué)術(shù)論文"Rate-efficient, real-time cd cover recognition on a camera-phone,,(Sam S. Tsai,David Chen,Jatinder Pal Singh,Bernd Girod,Proceeding of the 16th ACM international conference on Multimedia)中則描述了一個(gè)利用圖像匹配來在10000張存在于數(shù)據(jù)庫中的⑶封面圖像中查找出與輸入的圖像最接近的那張⑶ 封面的實(shí)際系統(tǒng)。把圖像匹配的方法用到名片識別中來,簡單直觀的做法是對每張傳送給網(wǎng)站服務(wù)器要求進(jìn)行識別獲得其中包含的文字的名片圖像,提取特征然后用某種圖像匹配的算法來在服務(wù)器包含的所有名片的圖像中查找跟輸入的名片圖像最相似的那張名片,返回那張名片的文字信息給用戶。但是,這種做法存在的問題主要是其一,圖像匹配的方法速度太慢,由于服務(wù)器的數(shù)據(jù)庫中保存的名片圖像會非常龐大,一般可能需要從幾百萬,幾千萬,甚至幾個(gè)億的不同名片的圖像中查找出與輸入的圖像相同的那張名片來,另一個(gè)方面,在實(shí)際應(yīng)用中,網(wǎng)站的服務(wù)器可能每天需要處理幾十萬甚至幾百萬次的識別名片的請求,這個(gè)工作量是目前的計(jì)算硬件和圖像匹配的算法幾乎不可能完成的任務(wù)。其二,圖像匹配的方法準(zhǔn)確率不夠高。名片中包含了用戶的姓名、電話號碼、電子郵件、地址、公司名稱和職務(wù)等等,這些都是隱私性比較強(qiáng)的信息,如果用戶請求識別的是一張名片,而網(wǎng)站的服務(wù)器返回的是另一張名片對應(yīng)的文字信息,就涉及到侵犯返回的那張名片主人的隱私了。所以用圖像匹配的方法來做名片識別對識別準(zhǔn)確率的要求可以說是 100%的,這里識別準(zhǔn)確率我們是指100次成功得到了網(wǎng)站的服務(wù)器返回的文字信息的識別請求中,有多少次網(wǎng)站的服務(wù)器返回的文字信息確實(shí)就是要求進(jìn)行識別的名片圖像所包含的文字信息。但是,在保證識別準(zhǔn)確率的前提下,拒識率還要越低越好,否則這個(gè)名片識別就失去了實(shí)際使用的價(jià)值了。上述的拒識率我們是指提交給網(wǎng)站的服務(wù)器的100次名片識別請求中,有多少次被網(wǎng)站的服務(wù)器告知不能識別,不能識別的原因可能是網(wǎng)站的服務(wù)器中沒有保存所提交的那張圖像所拍攝的名片的圖像和對應(yīng)的文字信息,也可能是網(wǎng)站的服務(wù)器不能確定所提交的那張圖像拍攝的是哪張名片,因而拒絕返回對應(yīng)的文字信息。目前的圖像匹配算法要保證識別準(zhǔn)確率100%,但是,其拒識率通常會比較高。因而,如何提供一種可以結(jié)合文字識別和圖像匹配的名片識別技術(shù),以解決現(xiàn)有技術(shù)中的種種問題,已經(jīng)成為本技術(shù)領(lǐng)域從業(yè)者亟待解決的問題。
發(fā)明內(nèi)容
鑒于以上所述現(xiàn)有技術(shù)的缺點(diǎn),本發(fā)明的目的在于提供一種結(jié)合文字識別和圖像匹配的名片識別方法,可以結(jié)合文字識別和圖像匹配的名片識別技術(shù),以提高名片識別的準(zhǔn)確率和識別速度。為實(shí)現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明提供一種結(jié)合文字識別和圖像匹配的名片識別方法,應(yīng)用于至少由網(wǎng)站服務(wù)器和客戶端構(gòu)建的網(wǎng)絡(luò)系統(tǒng)中,所述網(wǎng)站服務(wù)器具有預(yù)存多張名片信息的名片資料庫,所述客戶端具有名片圖像擷取及名片識別請求功能,其特征在于,所述名片識別方法至少包括以下步驟1)所述客戶端擷取一請求名片的名片圖像,并將所述名片圖像上傳至所述網(wǎng)站服務(wù)器,并發(fā)送名片識別請求;幻所述網(wǎng)站服務(wù)器接受到該名片識別請求后,提取所述名片圖像上的文字信息和圖像特征;幻所述網(wǎng)站服務(wù)器依據(jù)提取的文字信息從所述名片資料庫中檢索與該文字信息相匹配的所有預(yù)存名片,并將檢索出的各該預(yù)存名片分別與該請求名片進(jìn)行圖像特征匹配,以自所述預(yù)存名片中篩選出候選名片;4)所述網(wǎng)站服務(wù)器依據(jù)該請求名片和各該候選名片的相似度,對應(yīng)每一候選名片生成一個(gè)相似程度的度量值力)所述網(wǎng)站服務(wù)器依據(jù)所述度量值判斷是否確定匹配結(jié)果,若是,則反饋匹配結(jié)果給所述客戶端;若否,所述網(wǎng)站服務(wù)器將與該度量值相對應(yīng)的候選名片的名片圖像通過網(wǎng)絡(luò)發(fā)送至經(jīng)由所述網(wǎng)站服務(wù)器授權(quán)的一客服端,由該客服端判斷匹配成功或匹配失敗后反饋信息給所述網(wǎng)站服務(wù)器,再由所述網(wǎng)站服務(wù)器反饋匹配結(jié)果給所述客戶端。在本發(fā)明的名片識別方法中,所述網(wǎng)站服務(wù)器中分別預(yù)設(shè)有用于與所述度量值相比對的肯定值和否定值,且所述肯定值大于所述否定值,并所述肯定值與否定值之間具有度量區(qū)間。所述度量值、肯定值、和否定值均為整數(shù)。在本發(fā)明的名片識別方法的步驟5)中,當(dāng)所述網(wǎng)站服務(wù)器確定匹配結(jié)果時(shí),所述匹配結(jié)果包括匹配成功及匹配失敗,則為,當(dāng)所述度量值大于或等于所述肯定值時(shí),所述網(wǎng)站服務(wù)器判斷匹配成功;當(dāng)所述度量值小于或等于所述否定值時(shí),所述網(wǎng)站服務(wù)器判斷匹配失敗。具體地,當(dāng)所述匹配結(jié)果為匹配成功時(shí),所述網(wǎng)站服務(wù)器反饋與該度量值相對應(yīng)的候選名片中的文字信息給所述客戶端,當(dāng)所述匹配結(jié)果為匹配失敗時(shí),所述網(wǎng)站服務(wù)器反饋名片識別失敗信息給所述客戶端。在本發(fā)明的名片識別方法的步驟5)中,當(dāng)所述網(wǎng)站服務(wù)器不能確定匹配結(jié)果時(shí), 為所述度量值落入所述度量區(qū)間中。在本發(fā)明的名片識別方法的步驟1)中,所述客戶端是通過數(shù)碼拍攝裝置或掃描裝置擷取請求名片的名片圖像。在本發(fā)明的名片識別方法的步驟2)中,所述網(wǎng)站服務(wù)器是利用光學(xué)字符識別技術(shù)提取所述名片圖像上的文字信息和圖像特征。在本發(fā)明的名片識別方法的步驟幻中,所述圖像特征匹配是匹配所述預(yù)存名片的名片圖像和請求名片的名片圖像二者的特征點(diǎn)和各該特征點(diǎn)對應(yīng)的特征向量。在本發(fā)明的名片識別方法中,所述名片資料庫中的名片信息包括預(yù)存名片的名片圖像和文字信息,所述文字信息是名片上的姓名、職稱、電話、傳真、地址、郵編、電子信箱、 網(wǎng)站地址、產(chǎn)品信息中的至少一種。如上所述,本發(fā)明的結(jié)合文字識別和圖像匹配的名片識別方法,是透過預(yù)先將名片圖像上傳到特定網(wǎng)站的服務(wù)器,由這個(gè)服務(wù)器對上傳的名片圖像結(jié)合文字識別的結(jié)果來在該網(wǎng)站已有的名片圖像中查找出對應(yīng)的圖像,并返回這個(gè)對應(yīng)的圖像中所包含的名片信息的方法,該方法結(jié)合光學(xué)字符識別技術(shù)和圖像匹配的技術(shù),能有效的處理基于光學(xué)字符識別技術(shù)無法準(zhǔn)確識別的名片,提高了使用名片識別軟件來輸入名片信息的通用性,可靠性和便利性,同時(shí)也提高了名片識別的準(zhǔn)確率和識別速度。
圖1顯示為本發(fā)明的結(jié)合文字識別和圖像匹配的名片識別方法的具體實(shí)施步驟流程圖。
具體實(shí)施例方式以下通過特定的具體實(shí)例說明本發(fā)明的實(shí)施方式,本領(lǐng)域技術(shù)人員可由本說明書所揭示的內(nèi)容輕易地了解本發(fā)明的其他優(yōu)點(diǎn)與功效。本發(fā)明還可以通過另外不同的具體實(shí)施方式
加以實(shí)施或應(yīng)用,本說明書中的各項(xiàng)細(xì)節(jié)也可以基于不同觀點(diǎn)與應(yīng)用,在不背離本發(fā)明的精神下進(jìn)行各種修飾或改變。請參閱圖1,顯示為本發(fā)明的結(jié)合文字識別和圖像匹配的名片識別方法的具體實(shí)施步驟流程圖。需要說明的是,本實(shí)施例中所提供的圖示僅以示意方式說明本發(fā)明的基本構(gòu)想,遂圖式中僅顯示與本發(fā)明中有關(guān)的組件而非按照實(shí)際實(shí)施時(shí)的組件數(shù)目、形狀及尺寸繪制,其實(shí)際實(shí)施時(shí)各組件的型態(tài)、數(shù)量及比例可為一種隨意的改變,且其組件布局型態(tài)也可能更為復(fù)雜。如圖所示,本發(fā)明提供一種結(jié)合文字識別和圖像匹配的名片識別方法,應(yīng)用于至少由網(wǎng)站服務(wù)器(未予以圖示)和客戶端(未予以圖示)構(gòu)建的網(wǎng)絡(luò)系統(tǒng)中,需要說明的是,在本實(shí)施例中,所述網(wǎng)絡(luò)系統(tǒng)還包括一個(gè)被該網(wǎng)站服務(wù)器授權(quán)的客服端(未予以圖示),在具體的實(shí)施過程中,所述客服端可以是與該網(wǎng)站服務(wù)器同一網(wǎng)站的站點(diǎn),也可以是經(jīng)由所述網(wǎng)站服務(wù)器授權(quán)的第三方網(wǎng)站站點(diǎn),在本實(shí)施例中,所述客服端暫以一臺由操作人員操作的計(jì)算機(jī)為例進(jìn)行說明,但并不局限于此。所述網(wǎng)站服務(wù)器具有預(yù)存多張名片信息的名片資料庫,所述客戶端具有名片圖像擷取及名片識別請求功能。所述名片資料庫中的名片信息包括預(yù)存名片的名片圖像和文字信息,所述文字信息是名片上的姓名、職稱、電話、傳真、地址、郵編、電子信箱、網(wǎng)站地址、產(chǎn)品信息中的至少一種。在本實(shí)施例中,所述網(wǎng)站服務(wù)器的網(wǎng)站為一個(gè)具有維護(hù)聯(lián)系人信息功能的網(wǎng)站, 該網(wǎng)站的注冊用戶可以將自己的一張或多張名片的名片信息包括文字信息和名片圖像一起保存到名片資料庫,并與自己的賬戶相互關(guān)聯(lián),所保存的名片文字信息是經(jīng)過用戶自己或者網(wǎng)站管理人員的檢查校正,保證正確的,所保存的對應(yīng)同樣的文字信息的名片圖像可以有一張或者多張,例如同一個(gè)用戶可能有多張名片,在這多張名片中只有公司和職務(wù)的信息是不同的,其它姓名、電話、電子信箱等信息都是相同的。在本實(shí)施例中,所述客戶端可以是智能手機(jī)、平板電腦、PDA等具有數(shù)據(jù)處理功能的電子設(shè)備。如圖1所示,所述名片識別方法至少包括以下步驟首先執(zhí)行步驟Si,所述客戶端擷取一請求名片的名片圖像,并將所述名片圖像上傳至所述網(wǎng)站服務(wù)器,并發(fā)送名片識別請求;在本實(shí)施例中,所述客戶端可以通過數(shù)碼拍攝裝置或掃描裝置擷取請求名片的名片圖像,再經(jīng)由網(wǎng)絡(luò)向所述網(wǎng)站服務(wù)器發(fā)送名片識別請求。接著執(zhí)行步驟S2。在另一種實(shí)施例中(未予以圖示),所述步驟Sl也可以是,所述客戶端擷取一請求名片的名片圖像,并利用光學(xué)字符識別技術(shù)提取所述名片圖像上的文字信息和圖像特征, 將所述圖像特征上傳至所述網(wǎng)站服務(wù)器,并發(fā)送名片識別請求,換言之,本說明書中的各項(xiàng)細(xì)節(jié)也可以基于不同觀點(diǎn)與應(yīng)用,在不背離本發(fā)明的精神下進(jìn)行相應(yīng)地修飾或改變。在步驟S2中,所述網(wǎng)站服務(wù)器接受到該名片識別請求后,提取所述名片圖像上的文字信息和圖像特征;在本實(shí)施例中,所述網(wǎng)站服務(wù)器是利用光學(xué)字符識別技術(shù)提取所述名片圖像上的文字信息和圖像特征,具體地,所述圖像特征為圖像中的特征點(diǎn)和每個(gè)特征點(diǎn)對應(yīng)的特征向量。接著執(zhí)行步驟S3。在步驟S3中,所述網(wǎng)站服務(wù)器依據(jù)提取的文字信息從所述名片資料庫中檢索與該文字信息相匹配的所有預(yù)存名片,在本實(shí)施例中,所述網(wǎng)站服務(wù)器利用識別出來的文字信息在該網(wǎng)站的注冊用戶保存的名片的文字信息中進(jìn)行檢索,文字檢索的目的是大幅度減少在下一步中需要依據(jù)圖像特征來進(jìn)行圖像匹配的圖像的數(shù)量,從而提高圖像匹配的速度和匹配的準(zhǔn)確率。所述利用識別出來的文字信息進(jìn)行文字檢索具體的做法就是在該網(wǎng)站的名片資料庫中注冊用戶保存的名片的文字信息中查找跟識別出來的文字中包含的姓名、職稱、電話、傳真、地址、郵編、電子信箱、網(wǎng)站地址、產(chǎn)品信息中的至少一種完全一致的預(yù)存名片。接著執(zhí)行步驟S4。需要說明的是,即使在步驟S3中利用識別出來的文字信息從所述名片資料庫中進(jìn)行檢索之后,得到的是唯一的一張與請求名片的名片圖像中識別出來的文字一致的名片,也仍然需要到步驟S4中去進(jìn)行驗(yàn)證,這是因?yàn)榇嬖谀承┣闆r下網(wǎng)站服務(wù)器不能根據(jù)由光學(xué)字符識別得到的文字來唯一確定這些文字屬于網(wǎng)站服務(wù)器所保存的名片中的哪一張, 或者是否屬于網(wǎng)站服務(wù)器所保存的名片。比如說,同一個(gè)用戶可能有多張名片,在這多張名片中只有公司和職務(wù)的信息是不同的,其它姓名,電話,電子信箱這些信息都是相同的,這樣如果對公司和職務(wù)的識別有誤,只是正確的識別出了姓名,電話,電子信箱等信息,網(wǎng)站服務(wù)器就不能唯一確定這些信息屬于用戶的哪一張名片。在步驟S4中,將檢索出的各該預(yù)存名片分別與該請求名片進(jìn)行圖像特征匹配,以自所述預(yù)存名片中篩選出候選名片;在本實(shí)施例中,所述圖像特征匹配具體是指匹配所述預(yù)存名片的名片圖像和請求名片的名片圖像二者的特征點(diǎn)和各該特征點(diǎn)對應(yīng)的特征向量。 接著執(zhí)行步驟S5。在步驟S5中,所述網(wǎng)站服務(wù)器依據(jù)該請求名片和各該候選名片的相似度,對應(yīng)每一候選名片生成一個(gè)相似程度的度量值;在本實(shí)施例中,所述網(wǎng)站服務(wù)器中分別預(yù)設(shè)有用于與所述度量值相比對的肯定值和否定值,且所述肯定值大于所述否定值,并所述肯定值與否定值之間具有度量區(qū)間,且所述度量值、肯定值、和否定值均為整數(shù)。也就是說,所述對應(yīng)的表示相似性程度的度量值是一個(gè)大于或等于0的整數(shù),兩張圖像之間相似的程度越高,或者說越有可能所拍攝的是同一個(gè)物體,則這個(gè)整數(shù)的值就越大。接著執(zhí)行步驟S6。在步驟S6中,所述網(wǎng)站服務(wù)器依據(jù)所述度量值判斷是否確定匹配結(jié)果,若是,則進(jìn)至步驟S7,若否,則進(jìn)至步驟S8,在本實(shí)施例中,當(dāng)所述網(wǎng)站服務(wù)器確定匹配結(jié)果時(shí),包括匹配成功及匹配失敗兩種匹配結(jié)果,因而,步驟S6中判斷是否確定匹配結(jié)果的實(shí)際執(zhí)行分為兩個(gè)判斷步驟,相應(yīng)地,所述步驟S7反饋匹配結(jié)果給客戶端也包括兩種結(jié)果,即匹配成功和匹配失敗,請參閱圖1中的步驟S61及S62和S71及S72。在步驟S61中,判斷所述度量值是否大于或等于所述肯定值,若是,則所述網(wǎng)站服務(wù)器判斷匹配成功,進(jìn)至步驟S71,若否,則進(jìn)至步驟S62。在步驟S71中,所述網(wǎng)站服務(wù)器反饋與該度量值相對應(yīng)的候選名片中的文字信息給所述客戶端,至此完成名片識別過程。在步驟S62中,判斷所述度量值是否小于或等于所述否定值,若是,則所述網(wǎng)站服務(wù)器判斷匹配失敗,進(jìn)至步驟S72,若否,則進(jìn)至步驟S8。在步驟S72中,所述網(wǎng)站服務(wù)器反饋名片識別失敗信息給所述客戶端,至此完成名片識別過程。在步驟S8中,所述網(wǎng)站服務(wù)器不能確定匹配結(jié)果,也就是說,所述度量值落入所述度量區(qū)間中,接著執(zhí)行步驟S9。在步驟S9中,所述網(wǎng)站服務(wù)器將與該度量值相對應(yīng)的候選名片的名片圖像通過網(wǎng)絡(luò)發(fā)送至一經(jīng)由該網(wǎng)站服務(wù)器授權(quán)的客服端,誠如前述,所述客服端可以是與該網(wǎng)站服務(wù)器同一網(wǎng)站的站點(diǎn),也可以是經(jīng)由該網(wǎng)站服務(wù)器授權(quán)的第三方網(wǎng)站站點(diǎn),在本實(shí)施例中, 所述客服端以一臺由操作人員操作的計(jì)算機(jī)為例進(jìn)行說明,由該計(jì)算機(jī)的操作人員人工判斷或選擇是不是正確的找到了與輸入的名片圖像相對應(yīng)的名片的圖像,然后根據(jù)人工選擇的結(jié)果返回給網(wǎng)站服務(wù)器。在具體的實(shí)施方式中,該計(jì)算機(jī)上只顯示請求名片的名片圖像和與該度量值相對應(yīng)的候選名片的名片圖像,操作人員決定這兩張名片圖像是不是確實(shí)拍攝了同一張名片,做出是或者否的選擇,即進(jìn)至步驟S10。在步驟SlO中,如果客服端的操作人員選擇是,也就是說這兩張名片圖像確實(shí)拍攝了同一張名片,則向網(wǎng)站服務(wù)器反饋匹配成功的信息,由所述網(wǎng)站服務(wù)器反饋與該度量值相對應(yīng)的候選名片中的文字信息給所述客戶端,至此完成名片識別過程;如果客服端的操作人員選擇否,也就是說這兩張圖像拍攝的不是同一張名片,則網(wǎng)站服務(wù)器返回給用戶名片識別失敗,即不能在網(wǎng)站服務(wù)器上找到與輸入的圖像相對應(yīng)的名片,則由所述網(wǎng)站服務(wù)器反饋名片識別失敗信息給所述客戶端,至此完成名片識別過程。本發(fā)明結(jié)合文字識別的結(jié)果和圖像匹配來進(jìn)行名片識別,利用識別出的文字來進(jìn)行檢索,縮小需要進(jìn)行匹配的圖像的數(shù)量,并提高圖像匹配的準(zhǔn)確率,而且,本發(fā)明的方法中由一客戶端的操作人員在小范圍內(nèi)選擇和決定圖像匹配的結(jié)果,從而實(shí)現(xiàn)了人工可以介入海量檢索工作的可能性,進(jìn)一步保證識別的可靠性。綜上所述,本發(fā)明的結(jié)合文字識別和圖像匹配的名片識別方法,是透過預(yù)先將名片圖像上傳到特定網(wǎng)站的服務(wù)器,由這個(gè)服務(wù)器對上傳的名片圖像結(jié)合文字識別的結(jié)果來在該網(wǎng)站已有的名片圖像中查找出對應(yīng)的圖像,并返回這個(gè)對應(yīng)的圖像中所包含的名片信息的方法,該方法結(jié)合光學(xué)字符識別技術(shù)和圖像匹配的技術(shù),能有效的處理基于光學(xué)字符識別技術(shù)無法準(zhǔn)確識別的名片,提高了使用名片識別軟件來輸入名片信息的通用性,可靠性和便利性,同時(shí)也提高了名片識別的準(zhǔn)確率和識別速度。所以,本發(fā)明有效克服了現(xiàn)有技術(shù)中的種種缺點(diǎn)而具高度產(chǎn)業(yè)利用價(jià)值。上述實(shí)施例僅例示性說明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。任何熟悉此技術(shù)的人士皆可在不違背本發(fā)明的精神及范疇下,對上述實(shí)施例進(jìn)行修飾或改變。因此,舉凡所屬技術(shù)領(lǐng)域中具有通常知識者在未脫離本發(fā)明所揭示的精神與技術(shù)思想下所完成的一切等效修飾或改變,仍應(yīng)由本發(fā)明的權(quán)利要求所涵蓋。
權(quán)利要求
1.一種結(jié)合文字識別和圖像匹配的名片識別方法,應(yīng)用于至少由網(wǎng)站服務(wù)器和客戶端構(gòu)建的網(wǎng)絡(luò)系統(tǒng)中,所述網(wǎng)站服務(wù)器具有預(yù)存多張名片信息的名片資料庫,所述客戶端具有名片圖像擷取及名片識別請求功能,其特征在于,所述名片識別方法至少包括以下步驟1)所述客戶端擷取一請求名片的名片圖像,并將所述名片圖像上傳至所述網(wǎng)站服務(wù)器,并發(fā)送名片識別請求;2)所述網(wǎng)站服務(wù)器接受到該名片識別請求后,提取所述名片圖像上的文字信息和圖像特征;3)所述網(wǎng)站服務(wù)器依據(jù)提取的文字信息從所述名片資料庫中檢索與該文字信息相匹配的所有預(yù)存名片,并將檢索出的各該預(yù)存名片分別與該請求名片進(jìn)行圖像特征匹配,以自所述預(yù)存名片中篩選出候選名片;4)所述網(wǎng)站服務(wù)器依據(jù)該請求名片和各該候選名片的相似度,對應(yīng)每一候選名片生成一個(gè)相似程度的度量值;5)所述網(wǎng)站服務(wù)器依據(jù)所述度量值判斷是否確定匹配結(jié)果,若是,則反饋匹配結(jié)果給所述客戶端;若否,所述網(wǎng)站服務(wù)器將與該度量值相對應(yīng)的候選名片的名片圖像通過網(wǎng)絡(luò)發(fā)送至經(jīng)由所述網(wǎng)站服務(wù)器授權(quán)的一客服端,由該客服端判斷匹配成功或匹配失敗后反饋信息給所述網(wǎng)站服務(wù)器,再由所述網(wǎng)站服務(wù)器反饋匹配結(jié)果給所述客戶端。
2.根據(jù)權(quán)利要求1所述的結(jié)合文字識別和圖像匹配的名片識別方法,其特征在于所述網(wǎng)站服務(wù)器中分別預(yù)設(shè)有用于與所述度量值相比對的肯定值和否定值,且所述肯定值大于所述否定值,并所述肯定值與否定值之間具有度量區(qū)間。
3.根據(jù)權(quán)利要求2所述的結(jié)合文字識別和圖像匹配的名片識別方法,其特征在于所述度量值、肯定值、和否定值均為整數(shù)。
4.根據(jù)權(quán)利要求3所述的結(jié)合文字識別和圖像匹配的名片識別方法,其特征在于于步驟5)中,當(dāng)所述網(wǎng)站服務(wù)器確定匹配結(jié)果時(shí),所述匹配結(jié)果包括匹配成功及匹配失敗, 則為,當(dāng)所述度量值大于或等于所述肯定值時(shí),所述網(wǎng)站服務(wù)器判斷匹配成功;當(dāng)所述度量值小于或等于所述否定值時(shí),所述網(wǎng)站服務(wù)器判斷匹配失敗。
5.根據(jù)權(quán)利要求4所述的結(jié)合文字識別和圖像匹配的名片識別方法,其特征在于當(dāng)所述匹配結(jié)果為匹配成功時(shí),所述網(wǎng)站服務(wù)器反饋與該度量值相對應(yīng)的候選名片中的文字信息給所述客戶端,當(dāng)所述匹配結(jié)果為匹配失敗時(shí),所述網(wǎng)站服務(wù)器反饋名片識別失敗信息給所述客戶端。
6.根據(jù)權(quán)利要求3所述的結(jié)合文字識別和圖像匹配的名片識別方法,于步驟5)中,當(dāng)所述網(wǎng)站服務(wù)器不能確定匹配結(jié)果時(shí),為所述度量值落入所述度量區(qū)間中。
7.根據(jù)權(quán)利要求1所述的結(jié)合文字識別和圖像匹配的名片識別方法,其特征在于于步驟1)中,所述客戶端是通過數(shù)碼拍攝裝置或掃描裝置擷取請求名片的名片圖像。
8.根據(jù)權(quán)利要求1所述的結(jié)合文字識別和圖像匹配的名片識別方法,其特征在于于步驟幻中,所述網(wǎng)站服務(wù)器是利用光學(xué)字符識別技術(shù)提取所述名片圖像上的文字信息和圖像特征。
9.根據(jù)權(quán)利要求1或8所述的結(jié)合文字識別和圖像匹配的名片識別方法,其特征在于 所述名片資料庫中的名片信息包括預(yù)存名片的名片圖像和文字信息,所述文字信息是名片上的姓名、職稱、電話、傳真、地址、郵編、電子信箱、網(wǎng)站地址、產(chǎn)品信息中的至少一種。
10.根據(jù)權(quán)利要求1所述的結(jié)合文字識別和圖像匹配的名片識別方法,其特征在于于步驟3)中,所述圖像特征匹配是匹配所述預(yù)存名片的名片圖像和請求名片的名片圖像二者的特征點(diǎn)和各該特征點(diǎn)對應(yīng)的特征向量。
全文摘要
本發(fā)明提供一種結(jié)合文字識別和圖像匹配的名片識別方法,應(yīng)用于由網(wǎng)站服務(wù)器和客戶端構(gòu)建的網(wǎng)絡(luò)系統(tǒng)中,至少包括以下步驟客戶端擷取一請求名片的名片圖像并上傳至網(wǎng)站服務(wù)器請求識別;網(wǎng)站服務(wù)器提取所述名片圖像上的文字信息和圖像特征后檢索與該文字信息相匹配的預(yù)存名片,并進(jìn)行圖像特征匹配以篩選出候選名片,對應(yīng)每一候選名片生成一個(gè)度量值;網(wǎng)站服務(wù)器依據(jù)度量值判斷是否確定匹配結(jié)果,若是,則反饋匹配結(jié)果給客戶端;若否,將候選名片的名片圖像通過網(wǎng)絡(luò)發(fā)送至一經(jīng)由該網(wǎng)站服務(wù)器授權(quán)的客服端,由該客服端判斷匹配結(jié)果后反饋信息給客戶端,進(jìn)而可以實(shí)現(xiàn)結(jié)合文字識別和圖像匹配的名片識別技術(shù),以提高名片識別的準(zhǔn)確率和識別速度。
文檔編號G06K9/00GK102231188SQ201110187289
公開日2011年11月2日 申請日期2011年7月5日 優(yōu)先權(quán)日2011年7月5日
發(fā)明者羅希平 申請人:上海合合信息科技發(fā)展有限公司