本發(fā)明涉及一種將圖片轉(zhuǎn)換為語音的方法及裝置。
背景技術(shù):
根據(jù)世界衛(wèi)生組織提供的數(shù)據(jù),中國(guó)是全世界盲人最多的國(guó)家,占全世界盲人口的18%。每年在中國(guó)約有45萬人失明,2010年中國(guó)盲人(blind)824.8萬,低視力(low vision)6727.4萬,視力殘疾(visual impairment)是兩者的總和7551.2萬。按照這個(gè)勢(shì)頭,目前的盲人,估計(jì)可能超過1300萬,也就是,每一百個(gè)人里面,就有一個(gè)盲人。對(duì)于很多人來說,閱讀和交流是件很簡(jiǎn)單的事情,然而,對(duì)于盲人來說,他們的閱讀卻要通過“聽”與“觸摸”來實(shí)現(xiàn)。社會(huì)對(duì)盲文讀物出版給予大力支持,但是“書荒仍存”,有一個(gè)重要原因就是制作成本高、印刷效率遠(yuǎn)低于普通出版物。目前,出現(xiàn)了一些幫助盲人上網(wǎng)的讀屏軟件,一定程度上可以解決盲人上網(wǎng)的困難,但對(duì)于解決閱讀紙質(zhì)書籍、同時(shí)幫助盲人與正常人交流的技術(shù)或設(shè)備還是不夠方便或低廉。
因此,有必要設(shè)計(jì)一種新的將圖片轉(zhuǎn)換為語音的方法及裝置。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種將圖片轉(zhuǎn)換為語音的方法及裝置,該裝置易于實(shí)施,結(jié)構(gòu)獨(dú)特,功能豐富,特別適合盲人使用。
發(fā)明的技術(shù)解決方案如下:
一種將圖片轉(zhuǎn)換為語音的裝置,在殼體(1)的背面設(shè)有顯示屏(2)和揚(yáng)聲器(4);
殼體內(nèi)設(shè)有主板;主板用于獲取照片,并針對(duì)照片進(jìn)行文字識(shí)別形成文本文檔,以及將文本文檔轉(zhuǎn)化為語音在揚(yáng)聲器中播放出來,以上實(shí)現(xiàn)均為現(xiàn)有成熟技術(shù);
殼體上還設(shè)有與主板相連的調(diào)音模塊和進(jìn)程控制按鍵;進(jìn)程控制按鍵包括下一首按鍵(7)、暫停/播放按鍵(9)和前一首按鍵(11);
殼體的正面設(shè)有攝像頭(16)和補(bǔ)光燈;
殼體上還設(shè)有與主板連接的位置檢測(cè)裝置。
所述的位置檢測(cè)裝置包括設(shè)置在殼體背面的導(dǎo)軌(8)以及設(shè)置在導(dǎo)軌上的滑塊(10),為穩(wěn)定起見,優(yōu)選地,導(dǎo)軌為平行的兩條;位置檢測(cè)裝置還包括設(shè)置在殼體內(nèi)的2個(gè)同步輪(15)和張?jiān)O(shè)在2個(gè)同步輪上的同步帶(14);所述的滑塊固定在同步帶上與同步帶聯(lián)動(dòng);其中一個(gè)同步輪上設(shè)有同軸的編碼盤,編碼盤輸出編碼到主板。編碼盤能記錄同步轉(zhuǎn)動(dòng)的角度,從而能間接檢測(cè)出滑塊的位移,滑塊用于播放控制,滑塊位于最左側(cè)時(shí),一篇文章從頭開始播放,滑塊位于導(dǎo)軌的正中時(shí),文章跳至50%的位置播放,更進(jìn)一步,同步輪還連接有驅(qū)動(dòng)電機(jī),文章播放時(shí),驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)同步輪旋轉(zhuǎn),使得滑塊同步移動(dòng),如播放到80%時(shí),滑塊也移動(dòng)到80%的位置。
殼體的頂部設(shè)有快門鍵(3),快門鍵用于控制攝像頭,也可以不使用快門鍵,直接在屏幕上操作,顯示屏為觸摸顯示屏。
殼體上設(shè)有USB插口(12)和SD卡插槽(13)中的至少一種;用于插入U(xiǎn)盤或SD卡等,將生成的文本文件存儲(chǔ)到存儲(chǔ)介質(zhì)中,或?qū)⑼獠康奈谋疚募ㄟ^存儲(chǔ)介質(zhì)轉(zhuǎn)移到本裝置中。
殼體上設(shè)有耳機(jī)插孔。
調(diào)壓模塊為調(diào)音按鍵或音量調(diào)節(jié)旋鈕(6)。
攝像頭的左右兩側(cè)各設(shè)有1個(gè)作為補(bǔ)光燈的主閃光燈(17);殼體背面還設(shè)有由多個(gè)輔助閃光燈(19)和一片導(dǎo)光板(18)形成的環(huán)形閃光模塊(導(dǎo)光板為回字形,由4條長(zhǎng)方形的子板依次首尾回環(huán)連接而成,每條子板下方設(shè)有2個(gè)輔助LED燈。殼體為方形殼體);
揚(yáng)聲器為2個(gè),分布在殼體背面的左右兩側(cè)。形成立體聲輸出,音質(zhì)好。
殼體內(nèi)設(shè)有電池和用于為電池充電的充電電路,殼體上設(shè)有于所述充電電路相連的充電接口(充電接口用于接電源適配器,電源適配器接220V交流市電)。
殼體內(nèi)集成有wifi模塊或移動(dòng)通信模塊(3G或4G模塊),用于通過網(wǎng)絡(luò)獲取文本資源。
一種將圖片轉(zhuǎn)換為語音的方法,采用前述的將圖片轉(zhuǎn)換為語音的裝置;包括以下步驟:
步驟1:采用攝像頭獲取帶有文字信息的圖片;
步驟2:主板上的文字識(shí)別模塊將圖片上的文字內(nèi)容轉(zhuǎn)換為文本信息,并將多個(gè)圖片上的文字信息整合到一個(gè)文本文件中;
步驟3:基于主板上的文本信息-語音轉(zhuǎn)換模塊將文本文件轉(zhuǎn)換為音頻播放。
通過本裝置可以將可視的圖片、以及包括文字的紙質(zhì)(或電子屏幕顯示)頁面實(shí)時(shí)轉(zhuǎn)換為語音輸出。
包括以下步驟:
第一步,數(shù)碼攝像機(jī)對(duì)目標(biāo)圖片進(jìn)行拍照,形成的圖片文件存儲(chǔ)到圖片存儲(chǔ)器;
第二步,圖片/文字譯碼器(即文字識(shí)別模塊)讀取圖片文件,將圖片文件轉(zhuǎn)譯處理為文本文件,形成的文本文件存儲(chǔ)到文本存儲(chǔ)器;
第三步,文字/語音合成器(即文本信息-語音轉(zhuǎn)換模塊)讀取文本文件,將文本文件轉(zhuǎn)譯和存儲(chǔ)為音頻文件,并根據(jù)該音頻文件合成出語音信號(hào);
第四步,由音頻處理放大器將音頻信號(hào)進(jìn)行放大后輸出至揚(yáng)聲器播放。
所述語音合成器內(nèi)置有文字/語音合成器,將文本文件轉(zhuǎn)換形成為音頻信號(hào)并輸出至音頻處理放大器,由揚(yáng)聲器將放大后的語音播放出來;
本裝置設(shè)有圖片/文字譯碼器,其利用類似于目前已經(jīng)具有的將帶有文字符號(hào)的圖片轉(zhuǎn)換為文本的軟件工具,如通過對(duì)掃描儀掃描得到的圖片轉(zhuǎn)換為WORD文檔或txt文檔的軟件工具,由微處理器單元控制圖片/文字譯碼器將圖片文字轉(zhuǎn)換形成文本文件、控制文字/語音合成器將文本文件轉(zhuǎn)換形成為音頻信號(hào),從而完成由圖片到語音的轉(zhuǎn)換;還設(shè)有圖片存儲(chǔ)器、文本存儲(chǔ)器,可對(duì)圖片、文本信息進(jìn)行存儲(chǔ),微處理器單元可以通過數(shù)據(jù)線、地址線對(duì)圖片或文本信息進(jìn)行選擇調(diào)用,可以具有一定的編輯功能,選擇對(duì)特定語音的播放。這樣,盲人使用起來比較方便,可以較快地學(xué)習(xí)掌握,實(shí)現(xiàn)對(duì)紙質(zhì)或電子顯示的圖片的“閱讀”。
圖片的邊緣留有一定的空白:
所述第一步設(shè)有一個(gè)拍攝完整度提醒功能,根據(jù)取景的外邊緣的灰度判斷目標(biāo)是否已經(jīng)全部進(jìn)入鏡頭,進(jìn)而通過語音提示相機(jī)鏡頭移動(dòng)的方向,包括上/下、左/右、遠(yuǎn)/近動(dòng)作指令。
所述文字/語音合成器可根據(jù)設(shè)置選擇語音的語種、男女聲、語速。
所述控制鍵盤與微處理器單元的控制信號(hào)輸入端相連,該微處理器單元通過數(shù)據(jù)/地址線與圖片/文字譯碼器、文字/語音合成器、圖片存儲(chǔ)器、文本存儲(chǔ)器的相應(yīng)數(shù)據(jù)端口或地址端口相連,并完成相應(yīng)的控制和數(shù)據(jù)調(diào)用、存儲(chǔ)動(dòng)作;
有益效果:
本發(fā)明提供了一種將圖片轉(zhuǎn)換為語音的方法及裝置,該裝置特別針對(duì)盲人群體設(shè)計(jì),比如位置檢測(cè)裝置能便于使用者手動(dòng)調(diào)節(jié)播放進(jìn)度,這一特征為本發(fā)明的最大亮點(diǎn)。另外,設(shè)置有物理按鍵,如播放鍵等,便于操作。
本裝置具有豐富的拍照功能,環(huán)形閃光模塊有利于獲取無陰影的高素質(zhì)的圖片;
本裝置具有豐富的接口和通信模塊,USB接口等便于通過有線模式傳輸文本文件,wifi模塊和移動(dòng)通信模塊便于通過無線網(wǎng)絡(luò)方式傳輸文本資源,從而極大地?cái)U(kuò)展了本產(chǎn)品的功能。
采用本裝置能方便地將紙質(zhì)的樹制作成電子書,便于攜帶,另外,具有語音播放文本信息的功能,減緩使用者的視覺疲勞,該裝置特別適用于盲人群體。
附圖說明
圖1為將圖片轉(zhuǎn)換為語音的裝置的背面結(jié)構(gòu)示意圖;
圖2為將圖片轉(zhuǎn)換為語音的裝置的正面結(jié)構(gòu)示意圖;
圖3為位置檢測(cè)裝置的結(jié)構(gòu)示意圖;
圖4為電原理框圖。
標(biāo)號(hào)說明:1-殼體,2-顯示屏,3-快門鍵,4-揚(yáng)聲器,5-充電接口,6-音量調(diào)節(jié)旋鈕,7-下一首按鍵,8-導(dǎo)軌,9-暫停/播放按鍵,10-滑塊,11-前一首按鍵,12-USB插口,13-SD卡插槽;14-同步帶,15-同步輪,16-攝像頭,17-主閃光燈,18-導(dǎo)光板,19-輔助閃光燈。
具體實(shí)施方式
以下將結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步詳細(xì)說明:
實(shí)施例1:如圖1-4.一種將圖片轉(zhuǎn)換為語音的裝置,在殼體1的背面設(shè)有顯示屏2和揚(yáng)聲器4;
殼體內(nèi)設(shè)有主板;主板用于獲取照片,并針對(duì)照片進(jìn)行文字識(shí)別形成文本文檔,以及將文本文檔轉(zhuǎn)化為語音在揚(yáng)聲器中播放出來,以上實(shí)現(xiàn)均為現(xiàn)有成熟技術(shù);
殼體上還設(shè)有與主板相連的調(diào)音模塊和進(jìn)程控制按鍵;進(jìn)程控制按鍵包括下一首按鍵7、暫停/播放按鍵9和前一首按鍵11;
殼體的正面設(shè)有攝像頭16和補(bǔ)光燈;
殼體上還設(shè)有與主板連接的位置檢測(cè)裝置。
所述的位置檢測(cè)裝置包括設(shè)置在殼體背面的導(dǎo)軌8以及設(shè)置在導(dǎo)軌上的滑塊10(為穩(wěn)定起見,導(dǎo)軌為平行的兩條);位置檢測(cè)裝置還包括設(shè)置在殼體內(nèi)的2個(gè)同步輪15和張?jiān)O(shè)在2個(gè)同步輪上的同步帶14;所述的滑塊固定在同步帶上與同步帶聯(lián)動(dòng);其中一個(gè)同步輪上設(shè)有同軸的編碼盤,編碼盤輸出編碼到主板。編碼盤能記錄同步轉(zhuǎn)動(dòng)的角度,從而能間接檢測(cè)出滑塊的位移,滑塊用于播放控制,滑塊位于最左側(cè)時(shí),一篇文章從頭開始播放,滑塊位于導(dǎo)軌的正中時(shí),文章跳至50%的位置播放,更進(jìn)一步,同步輪還連接有驅(qū)動(dòng)電機(jī),文章播放時(shí),驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)同步輪旋轉(zhuǎn),使得滑塊同步移動(dòng),如播放到80%時(shí),滑塊也移動(dòng)到80%的位置。
殼體的頂部設(shè)有快門鍵3,快門鍵用于控制攝像頭(也可以不使用快門鍵,直接在屏幕上操作,顯示屏為觸摸顯示屏)。
殼體上設(shè)有USB插口12和SD卡插槽13中的至少一種;用于插入U(xiǎn)盤或SD卡等,將生成的文本文件存儲(chǔ)到存儲(chǔ)介質(zhì)中,或?qū)⑼獠康奈谋疚募ㄟ^存儲(chǔ)介質(zhì)轉(zhuǎn)移到本裝置中。
殼體上設(shè)有耳機(jī)插孔。
調(diào)壓模塊為調(diào)音按鍵或音量調(diào)節(jié)旋鈕6。
攝像頭的左右兩側(cè)各設(shè)有1個(gè)作為補(bǔ)光燈的主閃光燈17;殼體背面還設(shè)有由多個(gè)輔助閃光燈19和一片導(dǎo)光板18形成的環(huán)形閃光模塊,導(dǎo)光板為回字形,由4條長(zhǎng)方形的子板依次首尾回環(huán)連接而成,每條子板下方設(shè)有2個(gè)輔助LED燈。殼體為方形殼體;
揚(yáng)聲器為2個(gè),分布在殼體背面的左右兩側(cè)。形成立體聲輸出,音質(zhì)好。
殼體內(nèi)設(shè)有電池和用于為電池充電的充電電路,殼體上設(shè)有于所述充電電路相連的充電接口(充電接口用于接電源適配器,電源適配器接220V交流市電)。
殼體內(nèi)集成有wifi模塊或移動(dòng)通信模塊(3G或4G模塊),用于通過網(wǎng)絡(luò)獲取文本資源。
一種將圖片轉(zhuǎn)換為語音的方法,采用前述的將圖片轉(zhuǎn)換為語音的裝置;包括以下步驟:
步驟1:采用攝像頭獲取帶有文字信息的圖片;
步驟2:主板上的文字識(shí)別模塊將圖片上的文字內(nèi)容轉(zhuǎn)換為文本信息,并將多個(gè)圖片上的文字信息整合到一個(gè)文本文件中;
步驟3:基于主板上的文本信息-語音轉(zhuǎn)換模塊將文本文件轉(zhuǎn)換為音頻播放。