專利名稱:影像識(shí)別翻譯裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種翻譯裝置,尤其涉及一種將所見物體中的文字翻譯為指 定語言的裝置。
背景技術(shù):
目前翻譯機(jī)的操作都是由使用者以輸入按鍵的方式,將所要查詢的文 字鍵入翻譯機(jī)內(nèi),再由翻譯機(jī)在其內(nèi)建的資料庫中搜尋對(duì)應(yīng)的翻譯,并將 查詢結(jié)果顯示在屏幕上供使用者査看。隨著電子科技的快速發(fā)展,市場(chǎng)上 的消費(fèi)類電子產(chǎn)品都整合了多項(xiàng)功能以提升其競(jìng)爭(zhēng)力,除了一般的拍照、 通話、上網(wǎng)等功能之外,現(xiàn)在連翻譯功能都可整合在手機(jī)或個(gè)人數(shù)字助理 等便攜式電子裝置上,而傳統(tǒng)翻譯機(jī)輸入文字的方式也從按鍵輸入發(fā)展為 手寫、語音輸入等方式,如此不僅可以方便使用者快速輸入文字,也提供 給使用者多樣化的選擇。然而,以按鍵逐字輸入或是以手寫輸入的方式非常耗費(fèi)時(shí)間,無法應(yīng) 付隨時(shí)而來的需要。此外,在現(xiàn)在的電子產(chǎn)品講究輕、薄、短、小的潮流 下,在電子產(chǎn)品上裝設(shè)鍵盤可能會(huì)因?yàn)榘存I太小而造成使用上的不方便, 若改為較大型的鍵盤或手寫板則會(huì)增加電子產(chǎn)品的體積,而降低產(chǎn)品的便 攜性及競(jìng)爭(zhēng)力。此外,使用傳統(tǒng)翻譯機(jī)査詢文字的功能是建立在使用者了解所見文 字的字母或者發(fā)音的前提下,且需配合適用的輸入法或麥克風(fēng),才能順 利地輸入,查找文字的翻譯。然而當(dāng)使用者到國外出差或者旅游時(shí),則 有可能會(huì)因?yàn)檫B所見文字的字母都看不懂,而無從査詢其翻譯,相當(dāng)?shù)?不方便。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種影像識(shí)別和翻譯裝置,包括以相機(jī)等影像獲 取裝置拍攝圖片,再利用內(nèi)建的文字識(shí)別模塊及翻譯模塊將圖片中的文字 翻譯,并將翻譯結(jié)果顯示在屏幕上。
本發(fā)明的另一個(gè)目的是提供一種影像識(shí)別及翻譯方法,首先拍攝想要 翻譯的圖片或看到的文字,在識(shí)別出其中的文字后,對(duì)照翻譯為合適的語 言,從而讓使用者了解圖片中的文字內(nèi)容。
為了達(dá)到上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供一種影像識(shí)別和翻譯裝 置,包括影像獲取單元、文字識(shí)別模塊、翻譯模塊及顯示單元。其中所述影像獲取單元用于拍攝影像,所述影像中包括屬于第一語言中的至少一個(gè)文字;文 字識(shí)別模塊則用于識(shí)別影像中的文字。此外,翻譯模塊用于將識(shí)別出的文字翻譯為第二語言;顯示單元用于顯示所述翻譯為第二語言的文字。
根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種用于便攜式電子裝置中的影像識(shí)別翻譯方法,該方法包括以下步驟首先拍攝一個(gè)影像,此影像中包括 屬于第一語言的至少一個(gè)文字,接著識(shí)別影像中的文字,然后將識(shí)別出的 文字翻譯為第二語言,最后顯示翻譯為第二語言的文字。
本發(fā)明因采用結(jié)合影像獲取單元、文字識(shí)別及翻譯模塊的結(jié)構(gòu),因 此當(dāng)使用者看到想要翻譯的文字時(shí),只要將包括這些文字的影像拍攝下 來,即可識(shí)別及翻譯為指定的語言,而達(dá)到方便使用者了解文字內(nèi)容的 目的。
本發(fā)明的影像識(shí)別和翻譯裝置及方法至少具有下列優(yōu)點(diǎn)1. 支持各國文字,避免使用者因看不懂文字,無法鍵入文字或念出文字 以查詢其翻譯所造成的困擾。2. 使用相機(jī)拍攝,可達(dá)到隨拍即用,快速翻譯的功效,縮短使用者輸入 文字的時(shí)間。3. 不需使用鍵盤輸入,因此可以縮小裝置的體積,提供使用者隨身攜帶 的便利性。4. 可整合在現(xiàn)有的手機(jī)、個(gè)人數(shù)字助理上,不會(huì)額外增加裝置的生產(chǎn)成 本。
下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步描述圖1為根據(jù)本發(fā)明的一個(gè)具體實(shí)施方式
的影像識(shí)別和翻譯裝置框圖; 圖2為根據(jù)本發(fā)明的一個(gè)具體實(shí)施方式
的影像識(shí)別和翻譯方法流程圖。
具體實(shí)施方式
為了使本發(fā)明的內(nèi)容更為明了,下面特舉實(shí)施例作為本發(fā)明確實(shí)能 夠據(jù)以實(shí)施的范例。圖1為根據(jù)本發(fā)明的一個(gè)較佳實(shí)施例的影像識(shí)別和翻譯裝置框圖。 參照?qǐng)D1,本實(shí)施例的影像識(shí)別和翻譯裝置IOO例如是一個(gè)手機(jī)、個(gè)人數(shù) 字助理、智能電話或翻譯機(jī),而其內(nèi)部則包括有影像獲取單元110、文字 識(shí)別模塊120、翻譯模塊130、顯示單元140、存儲(chǔ)單元150、語音播放 單元160,從而能夠?yàn)槭褂谜呒磿r(shí)翻譯所見圖案中的文字。影像獲取單元110用于拍攝影像,文字識(shí)別模塊120用于識(shí)別所拍 影像中的文字,翻譯模塊130則接著將識(shí)別出的文字翻譯為指定的語言, 最后顯示單元140則將翻譯出的文字顯示出來。此外,存儲(chǔ)單元150可 用于記錄所翻譯出的文字,讓使用者能夠隨時(shí)査詢,而語音播放單元160 則可將翻譯完成之文字以語音播放的形式告知使用者。圖2是根據(jù)本發(fā)明的較佳實(shí)施例的影像識(shí)別和翻譯方法流程圖。同 時(shí)參照?qǐng)D1和圖2,本實(shí)施例詳細(xì)介紹如何將物體上的文字通過本發(fā)明之 影像識(shí)別和翻譯裝置IOO翻譯成使用者所指定的語言。在步驟S110中,首先,當(dāng)使用者看到想要翻譯的圖片或者文字,例 如海報(bào)、標(biāo)示牌或者是餐廳的菜單等,即可以先用影像獲取單元110將 此物體拍攝為影像,此影像包括屬于第一語言(例如是英文)的至少一 個(gè)文字。其中,此影像獲取單元110例如是一個(gè)電荷耦合器件 (Charge-Coupled Device, CCD)相機(jī)或者是一個(gè)互補(bǔ)金屬氧化物半導(dǎo)體 Complementary Metal Oxide Semiconductor, CMOS)相機(jī),但不限于此。在步驟S120中,在拍攝完成之后,影像識(shí)別和翻譯裝置100中內(nèi)建 的文字識(shí)別模塊120即會(huì)開始識(shí)別影像中的文字。其中,使用者可以根
據(jù)其需要,在影像中圈選一個(gè)范圍,而文字識(shí)別模塊120就可只識(shí)別此 范圍內(nèi)的文字,因此能夠縮短文字識(shí)別的時(shí)間,提高文字識(shí)別的正確率。在步驟S130中,接著由影像識(shí)別和翻譯裝置100中內(nèi)建之翻譯模塊 130將文字識(shí)別模塊120所識(shí)別出的文字翻譯為指定的第二語言(例如中 文)。其中,使用者可以在影像識(shí)別和翻譯裝置IOO選取或設(shè)定所要翻 譯的語言,所述語言可包括有中文、英文、法文、西班牙文等各國語言, 可視翻譯模塊130所能支持的語言種類及數(shù)目而定,并不限制其范圍。在步驟S140中,在翻譯完成后,即可將翻譯完成的文字顯示在影像 識(shí)別和翻譯裝置100的顯示單元140上。其中,此顯示140可以是一個(gè) 液晶顯示(Liquid Crystal Display, LCD)屏幕,而其顯示方式可以是僅單 純地顯示文字,或者是顯示出原影像,并將翻譯文字覆蓋在原影像中所 翻譯文字之上等方式,亦不限制其范圍。此外,在本發(fā)明的另一個(gè)較佳實(shí)施例中,還可以將翻譯完成的文字 以語音播放方式播放,讓使用者了解其發(fā)音是與他人溝通,而此翻譯完 成的文字也可以存儲(chǔ),作為將來學(xué)習(xí)或參考用,相當(dāng)方便。以上對(duì)本發(fā)明的具體實(shí)施例進(jìn)行了描述。需要理解的是,本發(fā)明并不 局限于上述特定的實(shí)施方式,本領(lǐng)域技術(shù)人員可以在所附權(quán)利要求的范圍 內(nèi)做出各種變形或修改。因此本發(fā)明的保護(hù)范圍以權(quán)利要求書所界定的范 圍為準(zhǔn)。
權(quán)利要求
1.一種影像識(shí)別翻譯裝置,包括-影像獲取單元,用于拍攝一個(gè)影像,所述影像中包括屬于第一語言的至少一個(gè)文字;-文字識(shí)別模塊,用于識(shí)別所述影像中的所述至少一個(gè)文字;-翻譯模塊,用于將識(shí)別出的所述影像中的所述至少一個(gè)文字翻譯為第二語言;以及-顯示單元,用于顯示所述翻譯為第二語言的至少一個(gè)文字。
2. 根據(jù)權(quán)利要求1中所述的影像識(shí)別翻譯裝置,其特征在于,還包括-語音播放單元,用于語音播放所述翻譯為第二語言的至少一個(gè)文字。
3. 根據(jù)權(quán)利要求1中所述的影像識(shí)別翻譯裝置,其特征在于,還包括..-存儲(chǔ)單元,用于存儲(chǔ)所述翻譯為第二語言的至少一個(gè)文字。
4. 根據(jù)權(quán)利要求1中所述的影像識(shí)別翻譯裝置,其特征在于,該裝 置包括手機(jī)、個(gè)人數(shù)字助理、智能電話或翻譯機(jī)。
5. 根據(jù)權(quán)利要求1中所述的影像識(shí)別翻譯裝置,其特征在于,所述 影像獲取單元包括電荷藕合器件(Charge-Coupled Device, CCD)相機(jī)或 互補(bǔ)金屬氧化物半導(dǎo)體(Complementary Metal Oxide Semiconductor, CMOS)相機(jī)。
6. 根據(jù)權(quán)利要求1中所述的影像識(shí)別翻譯裝置,其特征在于,其中 所述顯示單元包括液晶顯示(Liquid Crystal Display, LCD)屏幕。
7. 根據(jù)權(quán)利要求1中所述的影像識(shí)別翻譯裝置,其特征在于,其中 所述顯示單元顯示所述翻譯為第二語言的至少一個(gè)文字的方式為單純地 顯示文字。
8. 根據(jù)權(quán)利要求1中所述的影像識(shí)別翻譯裝置,其特征在于,其中 所述顯示單元顯示所述翻譯為第二語言的至少一個(gè)文字的方式為顯示所 述影像,并將所述翻譯為第二語言的至少一個(gè)文字分別覆蓋在所述影像中 與之對(duì)應(yīng)的屬于第一語言的至少一個(gè)文字上。
9. 一種在便攜式電子裝置中用于影像識(shí)別和翻譯的方法,包括以下拍攝影像,所述影像中包括屬于第一語言的至少一個(gè)文字; b.識(shí)別所述影像中的屬于第一語言的至少一個(gè)文字;c. 將識(shí)別出的所述影像中的屬于第一語言的至少一個(gè)文字翻譯為第 ~^語曰;d. 顯示所述翻譯為第二語言的至少一個(gè)文字。
10. 根據(jù)權(quán)利要求9中所述方法,其特征在于,還包括-播放所述翻譯為第二語言的至少一個(gè)文字。
11. 根據(jù)權(quán)利要求9中所述方法,其特征在于,還包括 -存儲(chǔ)所述翻譯為第二語言的至少一個(gè)文字。
12. 根據(jù)權(quán)利要求9中所述方法,其特征在于,其中識(shí)別該屬于第一 語言的至少一個(gè)文字的步驟還包括bl.從所述影像中圈選出所要翻譯的至少一個(gè)文字; b2.識(shí)別所述圈選出的至少一個(gè)文字。
13. 根據(jù)權(quán)利要求9中所述的方法,其特征在于,所述便攜式電子裝 置包括手機(jī)、個(gè)人數(shù)字助理、智能電話或翻譯機(jī)。
14. 根據(jù)權(quán)利要求9中所述的方法,其特征在于,所述便攜式電子裝 置中的影像獲取單元包括電荷藕合器件(Charge-Coupled Device, CCD) 相機(jī)或互補(bǔ)金屬氧化物半導(dǎo)體(Complementary Metal Oxide Semiconductor, CMOS )相機(jī)。
15.根據(jù)權(quán)利要求9中所述的方法,其特征在于,所述便攜式電子裝置 中的顯示單元包括液晶顯示(Liquid Crystal Display, LCD)屏幕。
全文摘要
一種影像識(shí)別及翻譯裝置和方法,所述方法是籍由一個(gè)影像獲取單元拍攝一個(gè)影像,并用一個(gè)文字識(shí)別模塊識(shí)別所述影像中的文字,接著用一個(gè)翻譯模塊將識(shí)別出的文字翻譯為指定的語言,最后用顯示單元顯示出所翻譯出文字。本發(fā)明不僅可避免使用者因看不懂文字而無法查詢的困擾,還能夠方便使用者輸入文字,而達(dá)到隨拍即用,快速翻譯的目的。
文檔編號(hào)G06K9/20GK101127036SQ20061011557
公開日2008年2月20日 申請(qǐng)日期2006年8月14日 優(yōu)先權(quán)日2006年8月14日
發(fā)明者吳炯憲, 李明倫, 王斌銓 申請(qǐng)人:英華達(dá)股份有限公司