亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端及其方法

文檔序號(hào):7617485閱讀:291來(lái)源:國(guó)知局
專利名稱:具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端及其方法
技術(shù)領(lǐng)域
本發(fā)明涉及具有影像拍攝功能的移動(dòng)通信終端系統(tǒng),尤其涉及能夠自動(dòng)翻譯道路上標(biāo)志牌或招牌等上的文字,通過(guò)揚(yáng)聲器以語(yǔ)音傳遞的具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端及其方法。
背景技術(shù)
最近,隨著移動(dòng)通信終端(蜂窩電話、PCS(personal communicationsservice-個(gè)人通信業(yè)務(wù))電話、PDA(personal digital assistant-個(gè)人數(shù)字助理)電話等)使用人口的增加,具有更多功能及設(shè)計(jì)的終端不斷面市,最近,內(nèi)置可以方便地輸入或傳輸圖像的高像素相機(jī)的相機(jī)手機(jī)已經(jīng)成為手機(jī)的主流。
這種相機(jī)手機(jī)可以接收從終端外部安裝的相機(jī)模塊輸入的影像(靜止影像或活動(dòng)影像),在控制信號(hào)的控制下,將其保存于內(nèi)部存儲(chǔ)器或輸出及傳輸?shù)酵獠俊,F(xiàn)有技術(shù)的移動(dòng)通信終端所應(yīng)用的影像拍攝功能主要用于識(shí)別名片或雜志等文件以及將其保存于數(shù)據(jù)庫(kù),進(jìn)行檢索及管理。
但問(wèn)題是對(duì)于老人或兒童等不懂英語(yǔ)或漢字的人而言,文字識(shí)別本身是無(wú)用之物,特別是像老人等視力不好者,難以通過(guò)較小的LCD屏確認(rèn)內(nèi)容。
另外,大多數(shù)終端只處理靜止影像,含有大量?jī)?nèi)容的標(biāo)志牌或招牌等有時(shí)無(wú)法在一張照片中包括全部?jī)?nèi)容,需要拍攝多張照片構(gòu)成全景影像后識(shí)別文字。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端及其方法,能夠提取利用終端內(nèi)的影像功能拍攝的道路標(biāo)志牌或招牌上的文字,并使相應(yīng)內(nèi)容通過(guò)語(yǔ)音傳遞給用戶。
本發(fā)明的另一目的在于,當(dāng)拍攝的影像文字是漢字或外語(yǔ)時(shí),能夠在翻譯的狀態(tài)下通過(guò)語(yǔ)音輸出,從而極大地提高終端的功能性。
為實(shí)現(xiàn)上述目的,本發(fā)明的具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端,針對(duì)由用于拍攝外部影像的相機(jī)、存儲(chǔ)輸入或傳輸?shù)臄?shù)據(jù)的存儲(chǔ)器部、控制上述各功能的控制部構(gòu)成的通常的移動(dòng)通信終端,其特征是包括如下幾個(gè)部分影像識(shí)別部,識(shí)別通過(guò)上述相機(jī)拍攝的影像;文字轉(zhuǎn)換部,提取通過(guò)上述影像識(shí)別部識(shí)別的影像中包含的文字,將其轉(zhuǎn)換為文字信號(hào);語(yǔ)音轉(zhuǎn)換部,把上述文字轉(zhuǎn)換部轉(zhuǎn)換的文字信號(hào)轉(zhuǎn)換為語(yǔ)音信號(hào);語(yǔ)音輸出部,把上述語(yǔ)音轉(zhuǎn)換部轉(zhuǎn)換的語(yǔ)音輸出到外部。
而且,為實(shí)現(xiàn)上述目的,本發(fā)明的具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端的語(yǔ)音轉(zhuǎn)換方法,其特征是包括如下幾個(gè)步驟影像輸入步驟,在選擇了輸入影像的語(yǔ)音轉(zhuǎn)換模式的狀態(tài)下,輸入通過(guò)相機(jī)輸入的影像;連拍確認(rèn)步驟,確認(rèn)上述輸入的影像是否為連拍的影像;文字提取步驟,在上述輸入的影像中以圖形形態(tài)提取文字區(qū)域;文字信號(hào)轉(zhuǎn)換步驟,把上述提取的文字信號(hào)化,使其轉(zhuǎn)換為文字信號(hào);翻譯判斷步驟,針對(duì)上述轉(zhuǎn)換的文字信號(hào),判斷是否翻譯為特定語(yǔ)言;語(yǔ)音信號(hào)轉(zhuǎn)換步驟,把上述文字信號(hào)轉(zhuǎn)換為語(yǔ)音信號(hào);語(yǔ)音輸出步驟,為了把上述轉(zhuǎn)換的語(yǔ)音信號(hào)傳遞給用戶而通過(guò)語(yǔ)音輸出部輸出到外部。
本發(fā)明利用近來(lái)大多數(shù)移動(dòng)通信終端基本安裝的影像拍攝用相機(jī),提取道路的標(biāo)志牌或招牌等上出現(xiàn)的文字,使用戶可以通過(guò)語(yǔ)音了解相應(yīng)標(biāo)志牌的內(nèi)容。特別是記載有不是韓語(yǔ)的其它語(yǔ)言的文字時(shí),可以以已經(jīng)翻譯的狀態(tài)利用語(yǔ)音了解這些文字,使那些不熟悉地理的游客或不懂英語(yǔ)及漢字的兒童、老人、盲人可以很容易地了解周邊情況。


圖1是本發(fā)明語(yǔ)音轉(zhuǎn)換系統(tǒng)的結(jié)構(gòu)框圖;圖2是本發(fā)明實(shí)施例的語(yǔ)音轉(zhuǎn)換步驟順序圖;圖3是顯示本發(fā)明實(shí)施例的語(yǔ)言選擇模式的激活窗口的附圖;圖4是本發(fā)明實(shí)施例的詞典存儲(chǔ)部的數(shù)據(jù)保存形態(tài)模式圖。
其中,附圖標(biāo)記10控制部 20相機(jī)30存儲(chǔ)器部40影像識(shí)別部
50文字轉(zhuǎn)換部 60語(yǔ)音處理部61語(yǔ)音轉(zhuǎn)換部 62語(yǔ)音輸出部70文字翻譯部 80詞典存儲(chǔ)部具體實(shí)施方式
下面參照附圖,詳細(xì)說(shuō)明本發(fā)明的具體實(shí)施例。
圖1是顯示本發(fā)明運(yùn)行所需系統(tǒng)構(gòu)成的框圖,圖2是顯示本發(fā)明語(yǔ)音轉(zhuǎn)換步驟的順序圖,圖3是選擇要翻譯的語(yǔ)言所需的激活窗口示例圖,圖4是本發(fā)明系統(tǒng)詞典存儲(chǔ)部中存儲(chǔ)的文字示例的模式圖。
首先,參照?qǐng)D1,說(shuō)明本發(fā)明移動(dòng)通信終端的主要系統(tǒng)構(gòu)成,它由如下幾個(gè)部分構(gòu)成控制部10,控制終端系統(tǒng)的整體功能;相機(jī)20,拍攝外部靜止影像或活動(dòng)影像;存儲(chǔ)器部30,存儲(chǔ)通過(guò)上述相機(jī)20輸入或傳輸?shù)臄?shù)據(jù)。除了上述通常的構(gòu)成之外,其特征是還包括如下幾個(gè)部分影像識(shí)別部40,識(shí)別通過(guò)上述相機(jī)20拍攝的影像;文字轉(zhuǎn)換部50,提取通過(guò)上述影像識(shí)別部40識(shí)別的影像中包含的文字并將其轉(zhuǎn)換為文字信號(hào);語(yǔ)音轉(zhuǎn)換部(Text-to-speech)61,把上述文字轉(zhuǎn)換部50轉(zhuǎn)換的文字信號(hào)轉(zhuǎn)換為語(yǔ)音信號(hào);語(yǔ)音輸出部62,由用于把上述語(yǔ)音轉(zhuǎn)換部61轉(zhuǎn)換的語(yǔ)音輸出到外部所需的揚(yáng)聲器構(gòu)成。
為確保影像的清晰度,上述相機(jī)20安裝的是高清晰數(shù)碼相機(jī),而且,最好內(nèi)置有在黑暗處獲得明亮影像所需的閃光燈裝置和在近處拍攝遠(yuǎn)處標(biāo)志牌所需的放大(Zoom)裝置。
另外,在輸入的影像是以連續(xù)拍攝的時(shí),上述影像識(shí)別部40可以實(shí)現(xiàn)全景影像。
而且,用于執(zhí)行翻譯功能的構(gòu)成包括如下兩個(gè)部分文字翻譯部70,利用以選擇的語(yǔ)言對(duì)上述文字轉(zhuǎn)換部50轉(zhuǎn)換的文字信號(hào)進(jìn)行翻譯;詞典存儲(chǔ)部80,保存有翻譯上述文字所需的詞典數(shù)據(jù)(漢字、英語(yǔ)、日語(yǔ)等)。
另一方面,除了上述構(gòu)成之外,還有通過(guò)按鈕實(shí)現(xiàn)用戶的外部輸入的鍵輸入部和通過(guò)LCD屏進(jìn)行顯示的顯示部等,但這些構(gòu)成是通常都了解的技術(shù),可能會(huì)混淆本發(fā)明的技術(shù)要旨,所以省略了對(duì)其的構(gòu)成說(shuō)明。
下面說(shuō)明如上構(gòu)成的本發(fā)明移動(dòng)通信終端的動(dòng)作步驟及其作用效果。
如圖2的順序圖所示,當(dāng)游客、老人、兒童在陌生的地方迷路時(shí),本發(fā)明利用終端中安裝的相機(jī)20及語(yǔ)音輸出部62的揚(yáng)聲器,當(dāng)把標(biāo)志牌或招牌上寫著的文字拍攝成照片時(shí),按下終端的鍵輸入部(圖中未標(biāo)出)所安裝的運(yùn)行按鈕,開始工作。
即,如果輸入了通過(guò)相機(jī)20拍攝的招牌或標(biāo)志牌等的靜止影像,那么輸入的影像圖形在控制部10的控制下暫時(shí)保存于存儲(chǔ)器部30(步驟ST1)。
此時(shí),當(dāng)在一張照片中無(wú)法包括所有標(biāo)志牌文字時(shí),用戶實(shí)施連拍,輸入多張影像,控制部10判斷輸入的影像是否為連拍的照片(步驟ST2),當(dāng)是連拍時(shí),合并輸入的多張輸入影像,形成一張全景影像圖形狀態(tài)(步驟ST21)。
另外,當(dāng)不是連拍時(shí),影像識(shí)別部40從上述輸入的靜止影像中直接提取文字區(qū)域(步驟ST3)。即,此時(shí)利用只有文字區(qū)域具有的特性,分離背景與文字區(qū)域,從而在背景影像中只有文字區(qū)域保留圖形形態(tài)。
而且,文字轉(zhuǎn)換部50把上述提取的文字區(qū)域轉(zhuǎn)換為文字信號(hào)(步驟ST4)。
另一方面,當(dāng)上述轉(zhuǎn)換處理后的標(biāo)識(shí)牌上的文字不是韓語(yǔ)而是漢語(yǔ)或英語(yǔ)時(shí),在處理為語(yǔ)音信號(hào)之前,選擇文字翻譯功能(步驟ST5)。
此時(shí),在本發(fā)明的步驟中,為了更準(zhǔn)確地進(jìn)行判斷,可以設(shè)置兩種模式其中一種是可以先識(shí)別輸入的影像文字是韓語(yǔ)/英語(yǔ)/漢字中的哪一種,事先選擇翻譯功能,另一種是可以使用由程序自動(dòng)選擇并處理的方法。
特別是在自動(dòng)選擇模式中,由于需要從輸入的影像自動(dòng)判斷語(yǔ)言,所以最好區(qū)分各個(gè)語(yǔ)言具有的特性,反映到算法中。即,韓語(yǔ)不區(qū)分大小寫,排列時(shí)大小相似,英語(yǔ)區(qū)分大小寫,排列時(shí)大小不相同,漢字具有與韓語(yǔ)相似的特征,但大體來(lái)說(shuō)復(fù)雜的文字較多,當(dāng)對(duì)一個(gè)文字勾畫外框時(shí),文字所占據(jù)的比例比韓語(yǔ)或英語(yǔ)更大,因此,可以利用上述特征。
在本實(shí)施例中,以用戶預(yù)先指定了語(yǔ)言選擇模式的情形為中心進(jìn)行說(shuō)明。如圖3所示,在以韓語(yǔ)為基本文字的設(shè)置窗口被激活的狀態(tài)下,在首先設(shè)置好要翻譯的相應(yīng)語(yǔ)言的狀態(tài)下,如果輸入漢字或英語(yǔ)的文字信號(hào),文字翻譯部70檢索詞典存儲(chǔ)部80的數(shù)據(jù)庫(kù)中存儲(chǔ)的相應(yīng)文字,如圖4所示,將其翻譯為韓語(yǔ),執(zhí)行文字翻譯功能(步驟ST51)。
而且,如上翻譯為韓語(yǔ)或一開始便以韓語(yǔ)影像輸入的文字信號(hào)在下一步驟中被語(yǔ)音轉(zhuǎn)換部61轉(zhuǎn)換為語(yǔ)音信號(hào)(步驟ST6)。
然后,上述轉(zhuǎn)換的語(yǔ)音信號(hào)通過(guò)語(yǔ)音輸出部62的揚(yáng)聲器輸出,以語(yǔ)音傳遞給用戶,用戶從而可以認(rèn)知相應(yīng)文字(步驟ST7)。
因此,如上語(yǔ)音轉(zhuǎn)換動(dòng)作在設(shè)置狀態(tài)下可以連續(xù)進(jìn)行,如果攜帶搭載了本發(fā)明的語(yǔ)音轉(zhuǎn)換系統(tǒng)的終端,視力不好的老人或不識(shí)字的兒童可以以語(yǔ)音了解引導(dǎo)牌或招牌等上記載的引導(dǎo)語(yǔ)句,輕松地獲得地理信息。
特別是在現(xiàn)代人的日常生活中,當(dāng)有不認(rèn)識(shí)的漢語(yǔ)說(shuō)明或標(biāo)志牌時(shí),可以通過(guò)本發(fā)明很容易地以語(yǔ)音了解相應(yīng)語(yǔ)句,從而更容易理解內(nèi)容。
而且,上述參照

了本發(fā)明的特定實(shí)施例,本發(fā)明的語(yǔ)音轉(zhuǎn)換步驟及系統(tǒng)可由業(yè)內(nèi)人員進(jìn)行多種變形實(shí)施,這是不言自明的。
例如,在上述實(shí)施例中,作為要翻譯的文字,雖然已存儲(chǔ)了漢字和英語(yǔ),但這可以根據(jù)需要,使?jié)h語(yǔ)或日語(yǔ)實(shí)現(xiàn)數(shù)據(jù)化并加以保存,以此添加對(duì)相應(yīng)外語(yǔ)的翻譯功能。
另外,作為以語(yǔ)音向用戶傳遞的語(yǔ)言,雖然默認(rèn)設(shè)置為韓語(yǔ),但當(dāng)用戶是外國(guó)人時(shí),可以設(shè)置為本國(guó)語(yǔ)言,把韓語(yǔ)指定為翻譯對(duì)象文字。
因此,這樣變形的實(shí)施例不應(yīng)視為脫離本發(fā)明技術(shù)思想或發(fā)展,這種變形的實(shí)施例應(yīng)屬于本發(fā)明的權(quán)利要求書內(nèi)。
綜上所述,本發(fā)明利用近來(lái)大多數(shù)移動(dòng)通信終端基本安裝的影像拍攝用相機(jī),提取道路的標(biāo)志牌或招牌等上出現(xiàn)的文字,使用戶可以通過(guò)語(yǔ)音了解相應(yīng)標(biāo)志牌的內(nèi)容。
特別是記載有不是韓語(yǔ)的其它語(yǔ)言的文字時(shí),可以以已經(jīng)翻譯的狀態(tài)利用語(yǔ)音了解這些文字,使那些不熟悉地理的游客或不懂英語(yǔ)及漢字的兒童、老人、盲人可以很容易地了解周邊情況。
當(dāng)然,本發(fā)明還可有其它多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
權(quán)利要求
1.一種具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端,針對(duì)包括用于拍攝外部影像的相機(jī)、保存輸入或傳輸?shù)臄?shù)據(jù)的存儲(chǔ)器部、控制上述各功能的控制部的移動(dòng)通信終端,其特征在于,包括如下幾個(gè)部分影像識(shí)別部,識(shí)別通過(guò)上述相機(jī)拍攝的影像;文字轉(zhuǎn)換部,以圖形狀態(tài)提取通過(guò)上述影像識(shí)別部識(shí)別的影像中包含的文字,將其轉(zhuǎn)換為文字信號(hào);語(yǔ)音轉(zhuǎn)換部,把上述文字轉(zhuǎn)換部轉(zhuǎn)換的文字信號(hào)轉(zhuǎn)換為語(yǔ)音信號(hào);語(yǔ)音輸出部,把上述語(yǔ)音轉(zhuǎn)換部轉(zhuǎn)換的語(yǔ)音輸出到外部。
2.根據(jù)權(quán)利要求1所述的具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端,其特征在于,還包括如下部分文字翻譯部,利用選擇的語(yǔ)言對(duì)上述文字轉(zhuǎn)換部轉(zhuǎn)換的文字信號(hào)進(jìn)行翻譯;詞典存儲(chǔ)部,保存有翻譯上述文字所需的詞典數(shù)據(jù)。
3.一種具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端的語(yǔ)音轉(zhuǎn)換方法,其特征在于,包括如下幾個(gè)步驟影像輸入步驟,在選擇了輸入影像的語(yǔ)音轉(zhuǎn)換模式的狀態(tài)下,輸入通過(guò)相機(jī)輸入的影像;連拍確認(rèn)步驟,確認(rèn)上述輸入的影像是否為連拍的影像;文字提取步驟,在上述輸入的影像中以圖形形態(tài)提取文字區(qū)域;文字信號(hào)轉(zhuǎn)換步驟,把上述提取的文字信號(hào)化,使其轉(zhuǎn)換為文字信號(hào);翻譯判斷步驟,針對(duì)上述轉(zhuǎn)換的文字信號(hào),判斷是否翻譯為特定語(yǔ)言;語(yǔ)音信號(hào)轉(zhuǎn)換步驟,把上述文字信號(hào)轉(zhuǎn)換為語(yǔ)音信號(hào);語(yǔ)音輸出步驟,為了把上述轉(zhuǎn)換的語(yǔ)音信號(hào)傳遞給用戶而通過(guò)語(yǔ)音輸出部輸出到外部。
4.根據(jù)權(quán)利要求3所述的具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端的語(yǔ)音轉(zhuǎn)換方法,其特征在于,上述連拍確認(rèn)步驟還包括當(dāng)輸入的影像是連拍的影像時(shí),則實(shí)現(xiàn)全景影像的步驟。
5.根據(jù)權(quán)利要求3所述的具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端的語(yǔ)音轉(zhuǎn)換方法,其特征在于,上述判斷及翻譯步驟是當(dāng)選擇了翻譯動(dòng)作時(shí),通過(guò)相應(yīng)詞典存儲(chǔ)部把轉(zhuǎn)換的文字信號(hào)翻譯為選擇的相應(yīng)語(yǔ)言的文字信號(hào)。
全文摘要
本發(fā)明公開了一種具有把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端及其方法,本發(fā)明的把拍攝文字轉(zhuǎn)換為語(yǔ)音功能的移動(dòng)通信終端包括影像識(shí)別部,識(shí)別通過(guò)上述相機(jī)拍攝的影像;文字轉(zhuǎn)換部,以圖形形態(tài)提取通過(guò)上述影像識(shí)別部識(shí)別的影像中包含的文字,并將其轉(zhuǎn)換為文字信號(hào);語(yǔ)音轉(zhuǎn)換部,把上述文字轉(zhuǎn)換部轉(zhuǎn)換的文字信號(hào)轉(zhuǎn)換為語(yǔ)音信號(hào);語(yǔ)音輸出部,把上述語(yǔ)音轉(zhuǎn)換部轉(zhuǎn)換的語(yǔ)音輸出到外部。本發(fā)明的效果是利用最近大多數(shù)移動(dòng)通信終端中基本安裝的影像拍攝用相機(jī),如果拍攝道路標(biāo)志牌或招牌等上出現(xiàn)的文字,則使用戶可以以語(yǔ)音了解相應(yīng)標(biāo)志牌的內(nèi)容,從而使不熟悉地理的游客或不懂英語(yǔ)及漢字的兒童、老人,盲人很容易地了解周邊情況。
文檔編號(hào)H04N5/225GK1758671SQ20051006622
公開日2006年4月12日 申請(qǐng)日期2005年4月25日 優(yōu)先權(quán)日2004年10月9日
發(fā)明者林永圭 申請(qǐng)人:樂(lè)金電子(中國(guó))研究開發(fā)中心有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1