亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)、方法、及其應(yīng)用的制作方法

文檔序號(hào):6357589閱讀:235來(lái)源:國(guó)知局
專利名稱:基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)、方法、及其應(yīng)用的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種字符識(shí)別技術(shù),特別是涉及一種針對(duì)攝像裝置攝取的圖像的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)、方法、及其應(yīng)用。
背景技術(shù)
目前,針對(duì)攝像裝置攝取的圖像進(jìn)行字符識(shí)別的方法通常為先利用移動(dòng)電話等具有攝像裝置的便攜式電子終端設(shè)備攝取圖像,其次,將攝取到的圖像以圖片的形式傳輸給服務(wù)器,服務(wù)器利用結(jié)構(gòu)分析(LayoutAnalysis)模塊對(duì)接收到的圖片進(jìn)行分析,以提取圖片中的字符,之后服務(wù)器可以對(duì)提取出的字符進(jìn)行翻譯等處理,并將處理結(jié)果返回給電子終端設(shè)備。發(fā)明人在實(shí)現(xiàn)本發(fā)明過(guò)程中發(fā)現(xiàn)在網(wǎng)絡(luò)帶寬有限的情況下,電子終端設(shè)備向服 不論是否將攝取的圖片發(fā)送給服務(wù)器,即不論是由電子終端設(shè)備自身對(duì)圖片進(jìn)行字符識(shí)別處理,還是由服務(wù)器對(duì)圖片進(jìn)行字符識(shí)別處理,利用結(jié)構(gòu)分析模塊從整個(gè)圖片中分析出字符不但存在計(jì)算時(shí)間較長(zhǎng)、容易出現(xiàn)分析錯(cuò)誤的現(xiàn)象,而且,針對(duì)一些畫(huà)面復(fù)雜的圖片,基本上沒(méi)有辦法識(shí)別出字符。另外,用戶關(guān)注的內(nèi)容也許僅僅是圖片中的部分內(nèi)容,如個(gè)別的單詞或者某個(gè)電話等,而對(duì)整個(gè)圖片進(jìn)行字符分析無(wú)疑會(huì)造成資源的浪費(fèi)。有鑒于上述現(xiàn)有的字符識(shí)別方法存在的缺陷,本發(fā)明人基于從事此類產(chǎn)品設(shè)計(jì)制造多年豐富的實(shí)務(wù)經(jīng)驗(yàn)及專業(yè)知識(shí),并配合學(xué)理的運(yùn)用,積極加以研究創(chuàng)新,以期創(chuàng)設(shè)一種新的基于手勢(shì)動(dòng)作的字符識(shí)別裝置、方法、及其應(yīng)用,能夠克服現(xiàn)有的字符識(shí)別方法存在的問(wèn)題,使其更具有實(shí)用性。經(jīng)過(guò)不斷的研究、設(shè)計(jì),經(jīng)過(guò)反復(fù)試作樣品及改進(jìn)后,終于創(chuàng)設(shè)出確具實(shí)用價(jià)值的本發(fā)明。

發(fā)明內(nèi)容
本發(fā)明的目的在于,克服現(xiàn)有的字符識(shí)別方法存在的缺陷,而提供一種新的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)、方法、及其應(yīng)用,所要解決的技術(shù)問(wèn)題是,使字符的識(shí)別過(guò)程更加快捷,有利于字符識(shí)別應(yīng)用的推廣,非常適于實(shí)用。本發(fā)明的目的以及解決其技術(shù)問(wèn)題可以采用以下的技術(shù)方案來(lái)實(shí)現(xiàn)。依據(jù)本發(fā)明提出的一種基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng),包括攝像模塊,用于攝取圖像;顯示模塊,用于顯示所述攝取的圖像;檢測(cè)模塊,用于檢測(cè)用戶在所述顯示的圖像上所進(jìn)行的選取需要進(jìn)行字符識(shí)別的內(nèi)容的手勢(shì)動(dòng)作;區(qū)域模塊,用于根據(jù)所述檢測(cè)到的手勢(shì)動(dòng)作確定所述圖像中用戶關(guān)注的文字所在的區(qū)域;識(shí)別模塊,用于對(duì)所述區(qū)域內(nèi)的圖像進(jìn)行光學(xué)字符識(shí)別,以獲得文本格式的字符。本發(fā)明的目的以及解決其技術(shù)問(wèn)題還可以采用以下的技術(shù)措施來(lái)進(jìn)一步實(shí)現(xiàn)。較佳的,前述的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng),其中,攝像模塊、顯示模塊、和檢測(cè)模塊設(shè)置于一電子終端設(shè)備中,所述區(qū)域模塊和識(shí)別模塊設(shè)置于服務(wù)器中,且所述檢測(cè)模塊檢測(cè)到的手勢(shì)動(dòng)作的數(shù)據(jù)和所述攝像模塊攝取的圖像通過(guò)所述電子終端設(shè)備中的無(wú)線收發(fā)模塊發(fā)送給所述服務(wù)器;或者,所述攝像模塊、顯示模塊、檢測(cè)模塊和區(qū)域模塊設(shè)置于一電子終端設(shè)備中,所述識(shí)別模塊設(shè)置于服務(wù)器中,且所述區(qū)域模塊確定出的區(qū)域的圖像通過(guò)所述電子終端設(shè)備中的無(wú)線收發(fā)模塊發(fā)送給所述服務(wù)器;或者,所述各模塊均設(shè)置于一電子終端設(shè)備中。較佳的,前述的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng),其中系統(tǒng)還包括壓縮模塊,用于將攝像模塊攝取的彩色圖像壓縮為2色或者4色的圖像,并將壓縮后的圖像提供給區(qū)域模塊。較佳的,前述的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng),其中所述區(qū)域模塊包括第一子模塊用于時(shí)手勢(shì)動(dòng)作周?chē)念A(yù)定區(qū)域進(jìn)行顏色直方圖轉(zhuǎn)換,在顏色直方圖轉(zhuǎn)換后的預(yù)定區(qū)域中基于區(qū)域連通性和/或占用面積的比例確定文字所在的區(qū)域;和/或,第二子模塊,用于在手勢(shì)動(dòng)作穿過(guò)的圖像上的顏色向手勢(shì)動(dòng)作周?chē)念A(yù)定區(qū)域中進(jìn)行封閉區(qū)域顏色填充 操作,根據(jù)顏色填充操作的結(jié)果確定文字所在的區(qū)域;在所述區(qū)域模塊包括第一子模塊和第二子模塊時(shí),所述區(qū)域模塊還包括第三子模塊,用于根據(jù)第一子模塊和第二子模塊的輸出結(jié)果確定文字所在的區(qū)域。依據(jù)本發(fā)明提出的一種翻譯系統(tǒng),所述系統(tǒng)包括上述基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng),且該翻譯系統(tǒng)還包括翻譯模塊,用于對(duì)所述識(shí)別模塊識(shí)別出的文本格式的字符進(jìn)行翻譯。較佳的,前述的翻譯系統(tǒng),其中所述翻譯模塊設(shè)置于具有攝像功能的便攜式電子終端設(shè)備中或者設(shè)置于服務(wù)器中;在所述翻譯模塊設(shè)置于服務(wù)器中的情況下,所述翻譯系統(tǒng)通過(guò)其收發(fā)模塊將所述翻譯模塊的翻譯結(jié)果發(fā)送給電子終端設(shè)備,并由所述電子終端設(shè)備中的顯示模塊顯示所述翻譯結(jié)果。依據(jù)本發(fā)明提出的一種基于手勢(shì)動(dòng)作的字符識(shí)別方法,包括攝取圖像;顯示所述攝取的圖像;檢測(cè)用戶在所述顯示的圖像上所進(jìn)行的選取需要進(jìn)行字符識(shí)別的內(nèi)容的手勢(shì)動(dòng)作;根據(jù)所述檢測(cè)到的手勢(shì)動(dòng)作確定所述圖像中用戶關(guān)注的文字所在的區(qū)域;對(duì)所述區(qū)域內(nèi)的圖像進(jìn)行光學(xué)字符識(shí)別,以獲得文本格式的字符。較佳的,前述的基于手勢(shì)動(dòng)作的字符識(shí)別方法,所述根據(jù)所述檢測(cè)到的手勢(shì)動(dòng)作確定所述圖像中的文字所在的區(qū)域包括將攝取的彩色圖像壓縮為2色或者4色的圖像,并根據(jù)所述檢測(cè)到的手勢(shì)動(dòng)作確定所述壓縮后的圖像中的文字所在的區(qū)域。較佳的,前述的基于手勢(shì)動(dòng)作的字符識(shí)別方法,該手勢(shì)動(dòng)作包括畫(huà)點(diǎn)、劃線、或者劃區(qū)。依據(jù)本發(fā)明提出的一種翻譯方法,所述方法包括上述基于手勢(shì)動(dòng)作的字符識(shí)別方法,且所述翻譯方法還包括對(duì)文本格式的字符進(jìn)行翻譯,并顯示所述翻譯的結(jié)果。借由上述技術(shù)方案,本發(fā)明的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)、方法及其應(yīng)用至少具有下列優(yōu)點(diǎn)及有益效果本發(fā)明通過(guò)檢測(cè)用戶在攝取到的圖像上所進(jìn)行的選取需要進(jìn)行字符識(shí)別的內(nèi)容的手勢(shì)動(dòng)作,并根據(jù)該手勢(shì)動(dòng)作確定用戶關(guān)注的字符所在的區(qū)域,不但可以減少網(wǎng)絡(luò)的傳送時(shí)間,還可以有針對(duì)性的進(jìn)行字符識(shí)別,從而使字符識(shí)別的過(guò)程更加方便快捷,有利于字符識(shí)別技術(shù)的推廣應(yīng)用。綜上所述,本發(fā)明在技術(shù)上有顯著的進(jìn)步,并具有明顯的積極技術(shù)效果,誠(chéng)為一新穎、進(jìn)步、實(shí)用的新設(shè)計(jì)。上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉較佳實(shí)施例,并配合附圖,詳細(xì)說(shuō)明如下。


圖I為本發(fā)明的設(shè)置于電子終端設(shè)備和服務(wù)器中的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)的不意圖;圖2為本發(fā)明的設(shè)置于電子終端設(shè)備中的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)的示意圖;圖3為本發(fā)明的設(shè)置于電子終端設(shè)備和服務(wù)器中的翻譯系統(tǒng)的示意圖;圖4為本發(fā)明的設(shè)置于電子終端設(shè)備中的翻譯系統(tǒng)的示意圖;圖5為本發(fā)明的基于手勢(shì)動(dòng)作的字符識(shí)別方法的流程圖;圖6為本發(fā)明的翻譯方法的流程圖;圖7為本發(fā)明的翻譯過(guò)程的示意圖;圖8A為一彩色圖片;圖8B為一壓縮后的索引圖像;圖8C為在圖像上劃線后的結(jié)果示意圖;圖8D為在圖像上圈選出的文字示意圖;圖8E為在圖像上選取的區(qū)域;圖8F為光學(xué)字符識(shí)別示意圖;圖8G為顯示翻譯結(jié)果信息示意圖;圖9為本發(fā)明的手勢(shì)定義示意圖;圖10為本發(fā)明的手勢(shì)采集的曲線示意圖。
具體實(shí)施例方式為更進(jìn)一步闡述本發(fā)明為達(dá)成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實(shí)施例,對(duì)依據(jù)本發(fā)明提出的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)、方法及其應(yīng)用其具體實(shí)施方式
、結(jié)構(gòu)、步驟、特征及其功效,詳細(xì)說(shuō)明如后。實(shí)施例一、基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)。本發(fā)明實(shí)施例提供的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)可以設(shè)置于電子終端設(shè)備中,也可以設(shè)置于電子終端設(shè)備和、服務(wù)器中。即本發(fā)明實(shí)施例提供的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)可以具體表現(xiàn)為一具有攝像功能的電子終端設(shè)備,也可以具體表現(xiàn)為一具有攝像功能的電子終端設(shè)備和與該電子終端設(shè)備無(wú)線連接的一服務(wù)器。當(dāng)然,該服務(wù)器可以同時(shí)與多個(gè)電子終端設(shè)備均無(wú)線連接。本發(fā)明實(shí)施例中的電子終端設(shè)備可以為移動(dòng)電話、PDA (個(gè)人數(shù)字助理器)、或者掌上計(jì)算機(jī)等具有攝像功能的便攜式數(shù)字設(shè)備。本發(fā)明不限制電子終端設(shè)備的具體表現(xiàn)形式。下面結(jié)合附圖I對(duì)設(shè)置于電子終端設(shè)備和服務(wù)器中的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)進(jìn)行說(shuō)明。圖I中示出的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)中的攝像模塊I、顯示模塊2、以及檢測(cè)模塊3設(shè)置于電子終端設(shè)備中,基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)中的區(qū)域模塊4、以及識(shí)別模塊5設(shè)置于服務(wù)器中。另外,在基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)還包括壓縮模塊6的情況下,壓縮模塊6設(shè)置于電子終端設(shè)備中。攝像模塊I可以為電子終端設(shè)備本身自帶的攝像單元。攝像模塊I主要用于攝取圖像。由于現(xiàn)有的電子終端設(shè)備自帶的攝像單元攝取的圖像基本上為彩色圖像,因此,該攝像模塊I攝取的圖像通常為彩色圖像。壓縮模塊6主要用于將攝像模塊I攝取的彩色圖像壓縮為2色或者4色的圖像,壓縮后的圖像可以提供給顯示模塊2,由顯示模塊2顯示該壓縮后的圖像。在壓縮后的圖像不提供給顯示模塊2的情況下,攝像模塊I攝取的圖像直接通過(guò)顯示模塊2顯示出來(lái)。顯示模塊2主要用于顯示攝像模塊I攝取的圖像或者主要用于顯示壓縮模塊6壓 縮后的圖像。該顯示模塊2可以包括電子終端設(shè)備本身自帶的顯示屏、以及顯示驅(qū)動(dòng)模塊等。用于顯示圖像的顯示屏可以為觸摸屏,也可以為非觸摸屏。檢測(cè)模塊3主要用于檢測(cè)用戶在顯示模塊2顯示的圖像上所進(jìn)行的手勢(shì)動(dòng)作。該手勢(shì)動(dòng)作即選取需要進(jìn)行字符識(shí)別的內(nèi)容的手勢(shì)動(dòng)作。也就是說(shuō),通過(guò)該手勢(shì)動(dòng)作可以明確獲知用戶需要對(duì)顯示的圖像上的哪一部分內(nèi)容進(jìn)行字符識(shí)別。上述手勢(shì)動(dòng)作可以具體為畫(huà)點(diǎn)、劃線(如直線、或者曲線)、或者劃區(qū)(如具有封閉空間的區(qū)域)等等。在手勢(shì)動(dòng)作為劃線的情況下,用戶需要進(jìn)行字符識(shí)別的內(nèi)容是針對(duì)該線所經(jīng)過(guò)的圖像中的內(nèi)容的。檢測(cè)模塊3檢測(cè)到的手勢(shì)動(dòng)作可以是用戶利用手指或者觸筆等輔助工具在觸摸屏上所作的手勢(shì)動(dòng)作,例如,用戶利用手指在觸摸屏上劃線,該劃出的線條可以顯示在屏幕上,且該顯示的線條可以覆蓋在顯示的圖像上。檢測(cè)模塊3檢測(cè)到的手勢(shì)動(dòng)作也可以是用戶通過(guò)鍵盤(pán)在顯示屏上所作的手勢(shì)動(dòng)作等。一個(gè)具體的例子用戶利用上下左右鍵調(diào)整默認(rèn)大小的選擇框的位置,用戶利用鍵在水平方向上放大選擇框,利用鍵在垂直方向上放大選擇框,利用“確定”鍵來(lái)確定當(dāng)前的選擇框即為手勢(shì)動(dòng)作;另一個(gè)具體的例子用戶利用上下左右鍵調(diào)整默認(rèn)長(zhǎng)短的選擇線條的位置,利用鍵在水平方向上拉伸選擇線條,利用“# ”鍵在水平方向上縮短選擇線條,利用“確定”鍵來(lái)確定當(dāng)前的選擇線條即為手勢(shì)動(dòng)作。檢測(cè)模塊3檢測(cè)到的手勢(shì)動(dòng)作信息以及攝像模塊I攝取的圖像可以通過(guò)電子終端設(shè)備中的無(wú)線收發(fā)模塊向服務(wù)器發(fā)送,例如,電子終端設(shè)備中的無(wú)線收發(fā)模塊基于GPRS、3G、或者WIFI向服務(wù)器發(fā)送手勢(shì)動(dòng)作信息和圖像。另外,在基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)中包括壓縮模塊6的情況下,電子終端設(shè)備向服務(wù)器發(fā)送的信息可以是手勢(shì)動(dòng)作信息和壓縮后的圖像信息。區(qū)域模塊4主要用于接收到的手勢(shì)動(dòng)作信息和圖像信息確定圖像中用戶關(guān)注的文字(如中文、或者英文等外文、或者數(shù)字等)所在的區(qū)域。這里的用戶關(guān)注的文字所在的區(qū)域即需要進(jìn)行字符識(shí)別的圖片內(nèi)容區(qū)域。由于手勢(shì)動(dòng)作可能是劃點(diǎn)或者劃線或者劃圈等,可能并沒(méi)有將需要進(jìn)行字符識(shí)別的內(nèi)容完全覆蓋住,因此,區(qū)域模塊4需要根據(jù)手勢(shì)動(dòng)作進(jìn)行上下左右探索,以確定需要進(jìn)行字符識(shí)別的完整的內(nèi)容區(qū)域。例如,以劃線覆蓋的顏色為基準(zhǔn)在預(yù)定大小字符(如半個(gè)字符)范圍內(nèi)搜索具有相同顏色的區(qū)域。本發(fā)明中的區(qū)域模塊4可以不借助現(xiàn)有的結(jié)構(gòu)分析模塊來(lái)進(jìn)行區(qū)域的確定。區(qū)域模塊4確定出的區(qū)域可以是對(duì)圖像中的需要進(jìn)行字符識(shí)別的文字的圈選,SP勾勒出圖像中的需要進(jìn)行字符識(shí)別的文字的輪廓。區(qū)域模塊4的一個(gè)具體的例子為區(qū)域模塊4包括第一子模塊、第二子模塊和第三子模塊。第一子模塊主要用于對(duì)手勢(shì)動(dòng)作周?chē)念A(yù)定區(qū)域進(jìn)行顏色直方圖轉(zhuǎn)換,并在顏色直方圖轉(zhuǎn)換后的預(yù)定區(qū)域中基于區(qū)域連通性和/或占用面積的比例來(lái)確定用戶關(guān)注的文字所在的區(qū)域。例如,在手勢(shì)線條周?chē)?0像素寬的區(qū)域作為初始區(qū)域,對(duì)初始區(qū)域進(jìn)行顏色直方圖操作,獲得的顏色直方圖在大多數(shù)情況下有兩個(gè)主峰,即前景色和背景色,分別假設(shè)這兩種顏色為前景色,在手勢(shì)線條的上下范圍內(nèi)尋找文字的邊界,在尋找到文字的邊界后根據(jù)區(qū)域的連通性(背景傾向于連在一起)和前景色占總區(qū)域面積的比例(通常字符區(qū)域應(yīng)占總區(qū)域面積的75%以上)來(lái)確定用戶關(guān)注的文字所在的區(qū)域。當(dāng)然,前述的前景色所占的總區(qū)域面積的比例也可以為前景色與背景色的比例。針對(duì)文本顏色一致的情況,第一子模塊可以準(zhǔn)確的確定出文字所在的區(qū)域。第二子模塊主要用于在手勢(shì)動(dòng)作穿過(guò)的圖像上的顏色向手勢(shì)動(dòng)作周?chē)念A(yù)定區(qū)域中進(jìn)行封閉區(qū)域顏色填充操作,并根據(jù)顏色填充操作的結(jié)果確定用戶關(guān)注的文字所在的區(qū)域。例如,在單詞中的每個(gè)字母都是獨(dú)立顏色的情況下,顏色直方圖可能會(huì)存在若干個(gè)尖峰,第一子模塊判斷文字所在的區(qū)域較不準(zhǔn)確;第二子模塊可以在手勢(shì)線條穿越的路徑上,分別用路徑上的顏色向線條兩端進(jìn)行封閉區(qū)域顏色填充,背景色的填充結(jié)果可能是充滿整個(gè)區(qū)域且連接在一起,也可能是形成若干個(gè)小的區(qū)域(對(duì)于花色背景的情況),第二子模塊可以根據(jù)上述填充的結(jié)果確定用戶關(guān)注的文字的邊界,即確定用戶關(guān)注的文字所在的區(qū)域。
第三子模塊主要用于根據(jù)第一子模塊和第二子模塊的輸出結(jié)果確定用戶關(guān)注的文字所在的區(qū)域。在第一子模塊和第二子模塊的判斷結(jié)果不一致時(shí),第三子模塊可以采用權(quán)重值等算法來(lái)確定出用戶關(guān)注的文字所在的區(qū)域。本發(fā)明不限制第三子模塊確定用戶關(guān)注的文字所在區(qū)域時(shí)所采用的具體算法。另外,區(qū)域模塊4也可以僅包括第一子模塊和第二子模塊中的一個(gè)。還有,區(qū)域模塊4也可以采用現(xiàn)有的其它方法來(lái)確定用戶關(guān)注的文字所在的區(qū)域。需要特別說(shuō)明的是,如果區(qū)域模塊4設(shè)置在電子終端設(shè)備中,則區(qū)域模塊4確定出的字符所在的區(qū)域會(huì)通過(guò)電子終端設(shè)備中的無(wú)線收發(fā)模塊向服務(wù)器發(fā)送,例如,電子終端設(shè)備中的無(wú)線收發(fā)模塊基于GPRS、3G、或者WIFI向服務(wù)器發(fā)送區(qū)域模塊4確定出的字符所在的區(qū)域的內(nèi)容。由于電子終端設(shè)備向服務(wù)器發(fā)送的內(nèi)容僅僅是區(qū)域模塊4確定出的字符所在的區(qū)域的內(nèi)容,因此,向服務(wù)器發(fā)送的圖片的大小會(huì)遠(yuǎn)遠(yuǎn)小于電子終端設(shè)備攝取的圖像的大小,從而可以極大的節(jié)約傳輸資源、縮短傳輸時(shí)間,進(jìn)而提高用戶體驗(yàn)。識(shí)別模塊5主要用于對(duì)區(qū)域模塊4確定出的區(qū)域內(nèi)的圖像進(jìn)行光學(xué)字符識(shí)別,以獲得文本格式的字符。該文本格式的字符可以用于后續(xù)的多種應(yīng)用,如翻譯、解釋、存儲(chǔ)、朗誦、或者查詢價(jià)格等等。識(shí)別模塊5可以利用現(xiàn)有的光學(xué)字符識(shí)別技術(shù)進(jìn)行字符識(shí)別。服務(wù)器將識(shí)別模塊5識(shí)別出的文本格式的字符通過(guò)其收發(fā)模塊返回給電子終端設(shè)備,電子終端設(shè)備通過(guò)其無(wú)線收發(fā)模塊接收到服務(wù)器返回的文本格式的字符后,可以通過(guò)顯示模塊2顯示該文本格式的字符,電子終端設(shè)備還可以存儲(chǔ)該文本格式的字符。本實(shí)施例可以將電子終端設(shè)備中的無(wú)線收發(fā)模塊、以及服務(wù)器中的收發(fā)模塊作為基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)中的一部分。下面結(jié)合附圖2對(duì)設(shè)置于電子終端設(shè)備中的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)進(jìn)行說(shuō)明。圖I中示出的設(shè)置于電子終端設(shè)備中的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)具體包括攝像模塊I、顯示模塊2、檢測(cè)模塊3、區(qū)域模塊4、以及識(shí)別模塊5。另外,該基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)還包括壓縮模塊6。圖2中示出的各模塊與圖I中示出的各模塊所作的操作基本相同,其區(qū)別包括檢測(cè)模塊3檢測(cè)出的手勢(shì)動(dòng)作信息和攝像模塊I攝取的圖像信息并不會(huì)通過(guò)電子終端設(shè)備中的無(wú)線收發(fā)模塊向服務(wù)器發(fā)送,而是提供給設(shè)置在電子終端設(shè)備內(nèi)部的區(qū)域模塊4;或者區(qū)域模塊4確定出的圖像中的用戶關(guān)注的文字所在的區(qū)域并不會(huì)通過(guò)電子終端設(shè)備中的 無(wú)線收發(fā)模塊向服務(wù)器發(fā)送,而是提供給設(shè)置在電子終端設(shè)備中的識(shí)別模塊5。另外,其區(qū)別還可以包括識(shí)別模塊5獲得的文本格式的字符不再需要在電子終端設(shè)備與服務(wù)器之間傳輸,識(shí)別模塊5獲得的文本格式的字符可以直接提供給顯示模塊2進(jìn)行顯示,也可以存儲(chǔ)在電子終端設(shè)備中。實(shí)施例二、翻譯系統(tǒng)。本發(fā)明實(shí)施例提供的翻譯系統(tǒng)可以設(shè)置于電子終端設(shè)備和服務(wù)器中(如附圖3所示),也可以設(shè)置于電子終端設(shè)備中(如附圖4所示)。即本發(fā)明實(shí)施例提供的翻譯系統(tǒng)可以具體表現(xiàn)為一具有攝像功能的電子終端設(shè)備,也可以具體表現(xiàn)為一具有攝像功能的電子終端設(shè)備和與該電子終端設(shè)備無(wú)線連接的一服務(wù)器。當(dāng)然,該服務(wù)器可以同時(shí)與多個(gè)電子終端設(shè)備均無(wú)線連接。本實(shí)施例中的電子終端設(shè)備同樣可以具體為移動(dòng)電話、PDA (個(gè)人數(shù)字助理器)、或者掌上計(jì)算機(jī)等具有攝像功能的便攜式數(shù)字設(shè)備。本發(fā)明不限制電子終端設(shè)備的具體表現(xiàn)形式。本實(shí)施例的翻譯系統(tǒng)在包含有上述實(shí)施例一的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)中的各模塊之外,還包含有翻譯模塊7。翻譯系統(tǒng)中包含的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)中的各模塊所執(zhí)行的操作基本上與上述實(shí)施例中的描述相同,相同的內(nèi)容在此不再重復(fù)說(shuō)明。翻譯模塊7主要用于對(duì)將識(shí)別模塊5識(shí)別出的文本格式的字符進(jìn)行翻譯。這里的翻譯是指不同語(yǔ)言之間的翻譯,例如將外文(如英文等)翻譯為中文、或者將中文翻譯為外文、或者不同外文之間的翻譯等等。翻譯模塊7的翻譯結(jié)果應(yīng)由電子終端設(shè)備的顯示模塊2顯示出來(lái)。在翻譯模塊7設(shè)置于服務(wù)器中的情況下,翻譯模塊7的翻譯結(jié)果可以通過(guò)服務(wù)器的收發(fā)模塊向電子終端設(shè)備發(fā)送。電子終端設(shè)備中的無(wú)線收發(fā)模塊接收到服務(wù)器發(fā)送來(lái)的翻譯結(jié)果信息后,該翻譯結(jié)果信息由電子終端設(shè)備中的顯示模塊2顯示出來(lái)。顯示模塊2顯示翻譯結(jié)果信息的一個(gè)具體的例子顯示模塊2可以將翻譯結(jié)果信息顯示在攝像模塊I攝取的圖像中的相應(yīng)區(qū)域附近,例如顯示模塊2將翻譯結(jié)果信息顯示在區(qū)域模塊4確定出的區(qū)域的左上角或者右上角或者左下角或者右下角方位等等。本實(shí)施例不限制翻譯結(jié)果信息的具體顯示方式。
實(shí)施例三、基于手勢(shì)動(dòng)作的字符識(shí)別方法。該方法如附圖5所示。圖5中,步驟500、電子終端設(shè)備攝取圖像,并顯示其攝取的圖像。電子終端設(shè)備可以通過(guò)其本身自帶的攝像單元攝取圖像。由于現(xiàn)有的電子終端設(shè)備自帶的攝像單元攝取的圖像基本上為彩色圖像,因此,電子終端設(shè)備攝取的圖像通常為彩色圖像。電子終端設(shè)備可以直接顯示其攝取的彩色圖像,也可以先將其攝取的彩色圖像壓縮為2色或者4色的圖像,之后,再顯示該壓縮后的圖像。該電子設(shè)備的顯示屏可以為觸摸屏,也可以為非觸摸屏。步驟510、電子終端設(shè)備檢測(cè)用戶在該顯示的圖像上所進(jìn)行的手勢(shì)動(dòng)作,該手勢(shì)動(dòng)作即選取需要進(jìn)行字符識(shí)別的內(nèi)容的手勢(shì)動(dòng)作。也就是說(shuō),通過(guò)該手勢(shì)動(dòng)作可以明確獲知用戶需要對(duì)顯示的圖像上的哪一部分內(nèi)容進(jìn)行字符識(shí)別。 上述手勢(shì)動(dòng)作可以具體為畫(huà)點(diǎn)、劃線(如直線、或者曲線)、或者劃區(qū)(如具有封閉空間的區(qū)域)等等。在手勢(shì)動(dòng)作為劃線的情況下,用戶需要進(jìn)行字符識(shí)別的內(nèi)容是針對(duì)該線所經(jīng)過(guò)的圖像中的內(nèi)容的。電子終端設(shè)備檢測(cè)到的手勢(shì)動(dòng)作可以是用戶利用手指或者觸筆等輔助工具在觸摸屏上所作的手勢(shì)動(dòng)作,例如用戶利用手指在觸摸屏上劃線,該劃出的線條可以顯示在屏幕上,且該顯示的線條可以覆蓋在顯示的圖像上。電子終端設(shè)備檢測(cè)到的手勢(shì)動(dòng)作也可以是用戶通過(guò)鍵盤(pán)在顯示屏上所作的手勢(shì)動(dòng)作等。具體例子如上述實(shí)施例一中的描述,在此不再重復(fù)說(shuō)明。步驟520、電子終端設(shè)備向服務(wù)器發(fā)送其攝取的圖像和檢測(cè)到的手勢(shì)動(dòng)作信息。如果電子終端設(shè)備對(duì)其攝取的圖像進(jìn)行了壓縮,則電子終端設(shè)備向服務(wù)器發(fā)送的圖像應(yīng)該是壓縮后的圖像。步驟530、服務(wù)器根據(jù)接收到的手勢(shì)動(dòng)作信息和圖像信息確定圖像中用戶關(guān)注的文字(如中文、或者英文等外文、或者數(shù)字等)所在的區(qū)域。該用戶關(guān)注的文字所在的區(qū)域即需要進(jìn)行字符識(shí)別的內(nèi)容區(qū)域。由于手勢(shì)動(dòng)作可能是劃點(diǎn)或者劃線或者劃圈等,可能并沒(méi)有將需要進(jìn)行字符識(shí)別的內(nèi)容完全覆蓋住,因此,服務(wù)器需要根據(jù)手勢(shì)動(dòng)作進(jìn)行上下左右探索,以確定需要進(jìn)行字符識(shí)別的完整的內(nèi)容區(qū)域。服務(wù)器可以借助上述第一子模塊、第二子模塊、以及第三子模塊來(lái)進(jìn)行區(qū)域的確定。服務(wù)器確定出的區(qū)域可以是對(duì)圖像中的需要進(jìn)行字符識(shí)別的文字的圈選,即勾勒出圖像中的需要進(jìn)行字符識(shí)別的文字的輪廓。需要說(shuō)明的是,服務(wù)器執(zhí)行的步驟530的操作也可以由電子終端設(shè)備來(lái)執(zhí)行,在這種情況下,步驟520可以省略,且在電子終端設(shè)備執(zhí)行了步驟530之后,電子終端設(shè)備將其確定出的區(qū)域的圖片向服務(wù)器發(fā)送。由于電子終端設(shè)備向服務(wù)器發(fā)送的內(nèi)容僅僅是電子終端設(shè)備確定出的字符所在的區(qū)域的內(nèi)容,因此,電子終端設(shè)備向服務(wù)器發(fā)送的圖片的大小基本上會(huì)遠(yuǎn)遠(yuǎn)小于電子終端設(shè)備攝取的圖像的大小,從而本實(shí)施例可以極大的節(jié)約傳輸資源、縮短傳輸時(shí)間,進(jìn)而提高用戶體驗(yàn)。步驟540、服務(wù)器對(duì)上述確定出的區(qū)域進(jìn)行光學(xué)字符識(shí)別,以獲得文本格式的字符,并向電子終端設(shè)備發(fā)送該文本格式的字符。該文本格式的字符可以用于后續(xù)的多種應(yīng)用,如翻譯、解釋、存儲(chǔ)、朗誦、或者查詢價(jià)格等等。服務(wù)器可以利用現(xiàn)有的光學(xué)字符識(shí)別技術(shù)進(jìn)行字符識(shí)別。電子終端設(shè)備可以在接收到服務(wù)器返回的文本格式的字符后,顯示并存儲(chǔ)該文本格式的字符。電子終端設(shè)備可以將該文本格式的字符顯示在其攝取的圖像中的相應(yīng)區(qū)域附近。上述實(shí)施例三是以服務(wù)器進(jìn)行光學(xué)字符識(shí)別操作為例進(jìn)行描述的,如果由電子終端設(shè)備自身進(jìn)行光學(xué)字符識(shí)別操作,則可以取消上述步驟中電子終端設(shè)備與服務(wù)器之間的傳輸操作。實(shí)施例四、翻譯方法。該方法如附圖6所示。圖6中的步驟600-630與圖5中的步驟500-530基本相同,在此不再重復(fù)說(shuō)明。 步驟640、服務(wù)器對(duì)確定出的區(qū)域中的內(nèi)容進(jìn)行光學(xué)字符識(shí)別,以獲得文本格式的字符,并對(duì)該文本格式的字符進(jìn)行翻譯,之后,服務(wù)器向電子終端設(shè)備發(fā)送該翻譯的結(jié)果信
肩、O具體的,服務(wù)器可以利用現(xiàn)有的光學(xué)字符識(shí)別技術(shù)進(jìn)行字符識(shí)別,并利用現(xiàn)有的翻譯軟件進(jìn)行文本格式的字符的翻譯。電子終端設(shè)備在接收到服務(wù)器返回的翻譯結(jié)果信息后,顯示該翻譯結(jié)果信息。電子終端設(shè)備可以將該翻譯結(jié)果信息顯示在其攝取的圖像中的相應(yīng)區(qū)域附近。上述實(shí)施例四是以服務(wù)器進(jìn)行光學(xué)字符識(shí)別、以及翻譯操作為例進(jìn)行描述的,如果由電子終端設(shè)備自身進(jìn)行光學(xué)字符識(shí)別操作和翻譯操作,則可以取消上述步驟中電子終端設(shè)備與服務(wù)器之間的傳輸操作。下面結(jié)合附圖7-附圖9、以移動(dòng)電話為例對(duì)本發(fā)明實(shí)施例的包含字符識(shí)別過(guò)程在內(nèi)的翻譯過(guò)程進(jìn)行詳細(xì)說(shuō)明。附圖7是包含字符識(shí)別過(guò)程在內(nèi)的翻譯過(guò)程的示意圖。圖7中,首先,移動(dòng)電話攝取圖像。在移動(dòng)電話具有150萬(wàn)以上像素、且具有自動(dòng)聚焦功能的情況下,可以取得較好的字符識(shí)別效果。移動(dòng)電話攝取的全彩色圖像如附圖8A所示。對(duì)于200萬(wàn)像素的移動(dòng)電話,如果使用JPGE壓縮格式,則該全彩色圖像的數(shù)據(jù)量大小通常在700KB左右。在移動(dòng)電話攝取了全彩色圖像之后,對(duì)該全彩色圖像進(jìn)行壓縮。可以將該全彩色圖像根據(jù)色彩直方圖壓縮成2色或者4色的圖像(可以稱為索引圖像),如附圖SB所示。壓縮后的圖像的數(shù)據(jù)量大約在70KB左右。對(duì)于數(shù)據(jù)傳輸能力比較強(qiáng)的網(wǎng)絡(luò),如WIFI、以及3G數(shù)據(jù)網(wǎng)絡(luò),前述的壓縮步驟可以省略。移動(dòng)電話檢測(cè)用戶的手勢(shì)動(dòng)作,以獲取手勢(shì)動(dòng)作信息(也可以稱為手勢(shì)動(dòng)作數(shù)據(jù))。這里的手勢(shì)動(dòng)作(Gesture)可以定義為用戶和圖像內(nèi)容直接交互的方式。實(shí)際上,對(duì)于需要翻譯的內(nèi)容,通常用戶是有明確的翻譯目標(biāo)的,例如,該翻譯目標(biāo)可能是用戶不認(rèn)識(shí)的一個(gè)單詞,也可能是一個(gè)包含若干個(gè)單詞的短語(yǔ)的含義,甚至一句話。通過(guò)手勢(shì)動(dòng)作可以明確的表示出翻譯目標(biāo),該翻譯目標(biāo)可以稱為焦點(diǎn)。對(duì)于具有觸摸屏的移動(dòng)電話,本實(shí)施例可以涉及如附圖9所示的三種手勢(shì)動(dòng)作來(lái)確定焦點(diǎn),即點(diǎn)擊、劃線(如直線、曲線、或者斜線等)、以及選取(選取也可以稱為劃區(qū))。一個(gè)具體的例子采用劃線的手勢(shì)動(dòng)作在圖8A攝取的圖像上進(jìn)行劃線后的結(jié)果可以如附圖8C所示,即用戶需要對(duì)圖像中的“Proceedings”、“Analysis”、以及“Recognition”進(jìn)行翻譯。對(duì)于不具有觸摸屏的移動(dòng)電話,用戶可以通過(guò)鍵盤(pán)進(jìn)行點(diǎn)擊、劃線、以及選取操作,如先默認(rèn)用戶點(diǎn)擊了屏幕中央,之后根據(jù)用戶的按鍵情況確定手勢(shì)動(dòng)作數(shù)據(jù)。從數(shù)據(jù)角度來(lái)看,不同的手勢(shì)動(dòng)作對(duì)應(yīng)的手勢(shì)動(dòng)作數(shù)據(jù)的內(nèi)容并不相同對(duì)于點(diǎn)擊,手勢(shì)動(dòng)作數(shù)據(jù)是一個(gè)或多個(gè)2D的坐標(biāo)值;對(duì)于劃線,手勢(shì)動(dòng)作數(shù)據(jù)是一個(gè)或多個(gè)線段;對(duì)于選取,手勢(shì)動(dòng)作數(shù)據(jù)是一個(gè)平面范圍。檢測(cè)出的曲線的一個(gè)具體的例子如附圖10所示,即移動(dòng)電話中的應(yīng)用程序會(huì)以一個(gè)固定的時(shí)間間隔(如100ms)反復(fù)查詢指尖在屏幕上的位置(X,y),這樣,從指尖接觸屏幕到抬起的整個(gè)過(guò)程,就會(huì)得到由若干個(gè)坐標(biāo)點(diǎn)組成的序列(xl,yl), (x2,y2), ···, (xn, yn),將這些坐標(biāo)點(diǎn)連成線繪制在圖片上,就構(gòu)成了畫(huà)在單詞上的手勢(shì)動(dòng)作曲線。手勢(shì)動(dòng)作的一個(gè)具體的例子為在使用手勢(shì)動(dòng)作選擇單詞的時(shí)候,可以先通過(guò)圖片的縮放功能將待翻譯的內(nèi)容(如單詞)清晰顯示在移動(dòng)電話的屏幕上,然后,用手指從想要翻譯的單詞的第一個(gè)字母依次劃到最后一個(gè)字母,如果字母排列不是在一條直線上,可以按照字母排列的方向劃線。移動(dòng)電話將壓縮的圖像數(shù)據(jù)和手勢(shì)動(dòng)作數(shù)據(jù)作為客戶端數(shù)據(jù)向服務(wù)器傳輸。服務(wù)器接收移動(dòng)電話傳輸來(lái)的圖像數(shù)據(jù)和手勢(shì)動(dòng)作數(shù)據(jù)。服務(wù)器根據(jù)接收到的手勢(shì)動(dòng)作數(shù)據(jù)來(lái)確定焦點(diǎn)區(qū)域。焦點(diǎn)區(qū)域可以理解為在移動(dòng)電話攝取的圖像內(nèi),用戶感興趣的需要翻譯的內(nèi)容所在的區(qū)域,即用戶關(guān)注的區(qū)域,該焦點(diǎn)區(qū)域可以表示為一個(gè)或多個(gè)矩形框。根據(jù)不同的手勢(shì)動(dòng)作,服務(wù)器可以采用不同的焦點(diǎn)區(qū)域提取方式,例如對(duì)于點(diǎn)擊,服務(wù)器可以將包含點(diǎn)擊位置在內(nèi)的若干個(gè)單詞框確定為焦點(diǎn)區(qū)域;對(duì)于劃線,服務(wù)器可以將該線條劃過(guò)的若干個(gè)連續(xù)的單詞框確定為焦點(diǎn)區(qū)域;對(duì)于選取,服務(wù)器可以將選取框中包含的若干個(gè)單詞確定為焦點(diǎn)區(qū)域。在焦點(diǎn)區(qū)域的提取過(guò)程中,可以使用上述第一子模塊、第二子模塊、以及第三子模塊,以幫助準(zhǔn)確的提取焦點(diǎn)區(qū)域。在確定焦點(diǎn)區(qū)域過(guò)程中可以忽略圖像中的文字所在的背景。另外,可以根據(jù)手勢(shì)劃過(guò)區(qū)域的顏色確定文本的顧色。確定焦點(diǎn)區(qū)域的一個(gè)具體的例子包括在手勢(shì)劃過(guò)的路徑上,向路徑兩側(cè)搜索具有文本顏色的每一個(gè)字符區(qū)域的完整大小(即聯(lián)通區(qū)域)。在字符豎向O. 5個(gè)字符內(nèi)范圍、以及水平向I個(gè)字符范圍內(nèi)搜索是否還有具有該顏色的字符,如果有,則將該字符加入進(jìn)來(lái),其目的是不要漏掉字母‘i”和字母“ j”上的點(diǎn)、以及手勢(shì)沒(méi)有完全選進(jìn)來(lái)的單詞的字母。將手勢(shì)線條劃過(guò)的灰白色區(qū)域連接起來(lái)就構(gòu)成了文本的選擇范圍(即焦點(diǎn)區(qū)域)。使用第一子模塊、第二子模塊、以及第三子模塊勾勒出的單詞的輪廓的一個(gè)具體例子如附圖8D所示,則焦點(diǎn)區(qū)域的提取結(jié)果如附圖SE和附圖8F的左側(cè)所示。在提取了焦點(diǎn)區(qū)域之后,用戶需要翻譯的若干單詞就變成了若干個(gè)需要識(shí)別的包含單詞的圖像(小的圖像區(qū)域)。服務(wù)器進(jìn)行文本識(shí)別過(guò)程,即服務(wù)器將包含單詞的圖像轉(zhuǎn)換成文字本身(即文本格式的字符),文本識(shí)別過(guò)程也可以被稱為OCR(OpticalCharacter Recognition,光學(xué)字符識(shí)別),識(shí)別出的文字為計(jì)算機(jī)可以識(shí)別的字符。一個(gè)具體的例子,針對(duì)附圖8E提取的焦點(diǎn)區(qū)域進(jìn)行文本識(shí)別后的結(jié)果如附圖8F的右側(cè)所示。在文本識(shí)別后,服務(wù)器通過(guò)查詞典就可以實(shí)現(xiàn)翻譯,從而將用戶選擇的內(nèi)容翻譯為用戶預(yù)先設(shè)定的目標(biāo)語(yǔ)言。一個(gè)具體的例子,在對(duì)附圖8F的右側(cè)所示的文本格式的單詞進(jìn)行詞典查詢后,翻譯的結(jié)果具體為!Proceedings — η.論文集!Analysis — η.分析!Recognition — η.識(shí)別。附圖8F中包含“Recognition”單詞的JPEG圖片的大小是7. 6KB,如果由移動(dòng)電話來(lái)確定焦點(diǎn)區(qū)域,則即使移動(dòng)電話使用2G網(wǎng)絡(luò)也可以在不到Is的時(shí)間內(nèi)傳輸完成,從而大大的提聞了用戶體驗(yàn)。服務(wù)器將翻譯結(jié)果和翻譯結(jié)果在圖像中的位置信息作為服務(wù)器端數(shù)據(jù)向移動(dòng)電 話發(fā)送。移動(dòng)電話根據(jù)接收到的位置信息將翻譯結(jié)果顯示給用戶,在顯示過(guò)程中,移動(dòng)電話可以進(jìn)行用戶界面的顯示渲染,顯示渲染的一個(gè)具體例子如附圖8G所示。以上所述僅是本發(fā)明的較佳實(shí)施例而已,并非對(duì)本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實(shí)施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人員在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容作出些許更動(dòng)或修飾為等同變化的等效實(shí)施例,但凡是未脫離本發(fā)明技術(shù)方案的內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng),其特征在于,所述系統(tǒng)包括 攝像模塊,用于攝取圖像; 顯示模塊,用于顯示所述攝取的圖像; 檢測(cè)模塊,用于檢測(cè)用戶在所述顯示的圖像上所進(jìn)行的選取需要進(jìn)行字符識(shí)別的內(nèi)容的手勢(shì)動(dòng)作; 區(qū)域模塊,用于根據(jù)所述檢測(cè)到的手勢(shì)動(dòng)作確定所述圖像中用戶關(guān)注的文字所在的區(qū)域; 識(shí)別模塊,用于對(duì)所述區(qū)域內(nèi)的圖像進(jìn)行光學(xué)字符識(shí)別,以獲得文本格式的字符。
2.如權(quán)利要求I所述的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng),其特征在于 所述攝像模塊、顯示模塊、和檢測(cè)模塊設(shè)置于一電子終端設(shè)備中,所述區(qū)域模塊和識(shí)別模塊設(shè)置于服務(wù)器中,且所述檢測(cè)模塊檢測(cè)到的手勢(shì)動(dòng)作的數(shù)據(jù)和所述攝像模塊攝取的圖像通過(guò)所述電子終端設(shè)備中的無(wú)線收發(fā)模塊發(fā)送給所述服務(wù)器;或者 所述攝像模塊、顯示模塊、檢測(cè)模塊和區(qū)域模塊設(shè)置于一電子終端設(shè)備中,所述識(shí)別模塊設(shè)置于服務(wù)器中,且所述區(qū)域模塊確定出的區(qū)域的圖像通過(guò)所述電子終端設(shè)備中的無(wú)線收發(fā)模塊發(fā)送給所述服務(wù)器;或者 所述各模塊均設(shè)置于一電子終端設(shè)備中。
3.如權(quán)利要求2所述的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng),其特征在于,所述系統(tǒng)還包括 壓縮模塊,用于將攝像模塊攝取的彩色圖像壓縮為2色或者4色的圖像,并將壓縮后的圖像提供給區(qū)域模塊。
4.如權(quán)利要求I或2或3所述的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng),其特征在于,所述區(qū)域模塊包括 第一子模塊用于對(duì)手勢(shì)動(dòng)作周?chē)念A(yù)定區(qū)域進(jìn)行顏色直方圖轉(zhuǎn)換,在顏色直方圖轉(zhuǎn)換后的預(yù)定區(qū)域中基于區(qū)域連通性和/或占用面積的比例確定文字所在的區(qū)域;和/或第二子模塊,用于在手勢(shì)動(dòng)作穿過(guò)的圖像上的顏色向手勢(shì)動(dòng)作周?chē)念A(yù)定區(qū)域中進(jìn)行封閉區(qū)域顏色填充操作,根據(jù)顏色填充操作的結(jié)果確定文字所在的區(qū)域; 在所述區(qū)域模塊包括第一子模塊和第二子模塊時(shí),所述區(qū)域模塊還包括 第三子模塊,用于根據(jù)第一子模塊和第二子模塊的輸出結(jié)果確定文字所在的區(qū)域。
5.一種翻譯系統(tǒng),其特征在于,所述系統(tǒng)包括上述權(quán)利要求1-4中任一權(quán)利要求所述的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng),且該翻譯系統(tǒng)還包括 翻譯模塊,用于對(duì)所述識(shí)別模塊識(shí)別出的文本格式的字符進(jìn)行翻譯。
6.如權(quán)利要求5所述的翻譯系統(tǒng),其特征在于 所述翻譯模塊設(shè)置于具有攝像功能的便攜式電子終端設(shè)備中或者設(shè)置于服務(wù)器中;在所述翻譯模塊設(shè)置于服務(wù)器中的情況下,所述翻譯系統(tǒng)通過(guò)其收發(fā)模塊將所述翻譯模塊的翻譯結(jié)果發(fā)送給電子終端設(shè)備,并由所述電子終端設(shè)備中的顯示模塊顯示所述翻譯結(jié)果。
7.一種基于手勢(shì)動(dòng)作的字符識(shí)別方法,其特征在于,所述方法包括 攝取圖像; 顯示所述攝取的圖像; 檢測(cè)用戶在所述顯示的圖像上所進(jìn)行的選取需要進(jìn)行字符識(shí)別的內(nèi)容的手勢(shì)動(dòng)作;根據(jù)所述檢測(cè)到的手勢(shì)動(dòng)作確定所述圖像中用戶關(guān)注的文字所在的區(qū)域; 對(duì)所述區(qū)域內(nèi)的圖像進(jìn)行光學(xué)字符識(shí)別,以獲得文本格式的字符。
8.如權(quán)利要求7所述的基于手勢(shì)動(dòng)作的字符識(shí)別方法,其特征在于,所述根據(jù)所述檢測(cè)到的手勢(shì)動(dòng)作確定所述圖像中的文字所在的區(qū)域包括 將攝取的彩色圖像壓縮為2色或者4色的圖像,并根據(jù)所述檢測(cè)到的手勢(shì)動(dòng)作確定所述壓縮后的圖像中的文字所在的區(qū)域。
9.如權(quán)利要求7或8所述的基于手勢(shì)動(dòng)作的字符識(shí)別方法,其特征在于,所述手勢(shì)動(dòng)作包括畫(huà)點(diǎn)、劃線、或者劃區(qū)。
10.一種翻譯方法,其特征在于,所述方法包括上述權(quán)利要求7或8所述的基于手勢(shì)動(dòng)作的字符識(shí)別方法,且所述翻譯方法還包括 對(duì)所述文本格式的字符進(jìn)行翻譯,并顯示所述翻譯的結(jié)果。
全文摘要
本發(fā)明是有關(guān)于一種基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)、方法、及其應(yīng)用。其中的基于手勢(shì)動(dòng)作的字符識(shí)別系統(tǒng)具體包括攝像模塊、顯示模塊、檢測(cè)模塊、區(qū)域模塊、以及識(shí)別模塊。攝像模塊用于攝取圖像;顯示模塊用于顯示所述攝取的圖像;檢測(cè)模塊用于檢測(cè)用戶在所述顯示的圖像上所進(jìn)行的選取手勢(shì)動(dòng)作;區(qū)域模塊用于根據(jù)所述檢測(cè)到的手勢(shì)動(dòng)作確定所述圖像中用戶關(guān)注的文字所在的區(qū)域;識(shí)別模塊用于對(duì)所述區(qū)域內(nèi)的圖像進(jìn)行光學(xué)字符識(shí)別,以獲得文本格式的字符。本發(fā)明提供的技術(shù)方案能夠方便快捷準(zhǔn)確的實(shí)現(xiàn)字符識(shí)別,有利于字符識(shí)別應(yīng)用的推廣,非常適于實(shí)用。
文檔編號(hào)G06K9/20GK102737238SQ20111008459
公開(kāi)日2012年10月17日 申請(qǐng)日期2011年4月1日 優(yōu)先權(quán)日2011年4月1日
發(fā)明者馬磊 申請(qǐng)人:洛陽(yáng)磊石軟件科技有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1