亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種將圖片轉(zhuǎn)換為語音的方法及裝置與流程

文檔序號(hào):12272273閱讀:2245來源:國(guó)知局
一種將圖片轉(zhuǎn)換為語音的方法及裝置與流程

本發(fā)明涉及一種將圖片轉(zhuǎn)換為語音的方法及裝置。



背景技術(shù):

根據(jù)世界衛(wèi)生組織提供的數(shù)據(jù),中國(guó)是全世界盲人最多的國(guó)家,占全世界盲人口的18%。每年在中國(guó)約有45萬人失明,2010年中國(guó)盲人(blind)824.8萬,低視力(low vision)6727.4萬,視力殘疾(visual impairment)是兩者的總和7551.2萬。按照這個(gè)勢(shì)頭,目前的盲人,估計(jì)可能超過1300萬,也就是,每一百個(gè)人里面,就有一個(gè)盲人。對(duì)于很多人來說,閱讀和交流是件很簡(jiǎn)單的事情,然而,對(duì)于盲人來說,他們的閱讀卻要通過“聽”與“觸摸”來實(shí)現(xiàn)。社會(huì)對(duì)盲文讀物出版給予大力支持,但是“書荒仍存”,有一個(gè)重要原因就是制作成本高、印刷效率遠(yuǎn)低于普通出版物。目前,出現(xiàn)了一些幫助盲人上網(wǎng)的讀屏軟件,一定程度上可以解決盲人上網(wǎng)的困難,但對(duì)于解決閱讀紙質(zhì)書籍、同時(shí)幫助盲人與正常人交流的技術(shù)或設(shè)備還是不夠方便或低廉。

因此,有必要設(shè)計(jì)一種新的將圖片轉(zhuǎn)換為語音的方法及裝置。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明所要解決的技術(shù)問題是提供一種將圖片轉(zhuǎn)換為語音的方法及裝置,該裝置易于實(shí)施,結(jié)構(gòu)獨(dú)特,功能豐富,特別適合盲人使用。

發(fā)明的技術(shù)解決方案如下:

一種將圖片轉(zhuǎn)換為語音的裝置,在殼體(1)的背面設(shè)有顯示屏(2)和揚(yáng)聲器(4);

殼體內(nèi)設(shè)有主板;主板用于獲取照片,并針對(duì)照片進(jìn)行文字識(shí)別形成文本文檔,以及將文本文檔轉(zhuǎn)化為語音在揚(yáng)聲器中播放出來,以上實(shí)現(xiàn)均為現(xiàn)有成熟技術(shù);

殼體上還設(shè)有與主板相連的調(diào)音模塊和進(jìn)程控制按鍵;進(jìn)程控制按鍵包括下一首按鍵(7)、暫停/播放按鍵(9)和前一首按鍵(11);

殼體的正面設(shè)有攝像頭(16)和補(bǔ)光燈;

殼體上還設(shè)有與主板連接的位置檢測(cè)裝置。

所述的位置檢測(cè)裝置包括設(shè)置在殼體背面的導(dǎo)軌(8)以及設(shè)置在導(dǎo)軌上的滑塊(10),為穩(wěn)定起見,優(yōu)選地,導(dǎo)軌為平行的兩條;位置檢測(cè)裝置還包括設(shè)置在殼體內(nèi)的2個(gè)同步輪(15)和張?jiān)O(shè)在2個(gè)同步輪上的同步帶(14);所述的滑塊固定在同步帶上與同步帶聯(lián)動(dòng);其中一個(gè)同步輪上設(shè)有同軸的編碼盤,編碼盤輸出編碼到主板。編碼盤能記錄同步轉(zhuǎn)動(dòng)的角度,從而能間接檢測(cè)出滑塊的位移,滑塊用于播放控制,滑塊位于最左側(cè)時(shí),一篇文章從頭開始播放,滑塊位于導(dǎo)軌的正中時(shí),文章跳至50%的位置播放,更進(jìn)一步,同步輪還連接有驅(qū)動(dòng)電機(jī),文章播放時(shí),驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)同步輪旋轉(zhuǎn),使得滑塊同步移動(dòng),如播放到80%時(shí),滑塊也移動(dòng)到80%的位置。

殼體的頂部設(shè)有快門鍵(3),快門鍵用于控制攝像頭,也可以不使用快門鍵,直接在屏幕上操作,顯示屏為觸摸顯示屏。

殼體上設(shè)有USB插口(12)和SD卡插槽(13)中的至少一種;用于插入U(xiǎn)盤或SD卡等,將生成的文本文件存儲(chǔ)到存儲(chǔ)介質(zhì)中,或?qū)⑼獠康奈谋疚募ㄟ^存儲(chǔ)介質(zhì)轉(zhuǎn)移到本裝置中。

殼體上設(shè)有耳機(jī)插孔。

調(diào)壓模塊為調(diào)音按鍵或音量調(diào)節(jié)旋鈕(6)。

攝像頭的左右兩側(cè)各設(shè)有1個(gè)作為補(bǔ)光燈的主閃光燈(17);殼體背面還設(shè)有由多個(gè)輔助閃光燈(19)和一片導(dǎo)光板(18)形成的環(huán)形閃光模塊(導(dǎo)光板為回字形,由4條長(zhǎng)方形的子板依次首尾回環(huán)連接而成,每條子板下方設(shè)有2個(gè)輔助LED燈。殼體為方形殼體);

揚(yáng)聲器為2個(gè),分布在殼體背面的左右兩側(cè)。形成立體聲輸出,音質(zhì)好。

殼體內(nèi)設(shè)有電池和用于為電池充電的充電電路,殼體上設(shè)有于所述充電電路相連的充電接口(充電接口用于接電源適配器,電源適配器接220V交流市電)。

殼體內(nèi)集成有wifi模塊或移動(dòng)通信模塊(3G或4G模塊),用于通過網(wǎng)絡(luò)獲取文本資源。

一種將圖片轉(zhuǎn)換為語音的方法,采用前述的將圖片轉(zhuǎn)換為語音的裝置;包括以下步驟:

步驟1:采用攝像頭獲取帶有文字信息的圖片;

步驟2:主板上的文字識(shí)別模塊將圖片上的文字內(nèi)容轉(zhuǎn)換為文本信息,并將多個(gè)圖片上的文字信息整合到一個(gè)文本文件中;

步驟3:基于主板上的文本信息-語音轉(zhuǎn)換模塊將文本文件轉(zhuǎn)換為音頻播放。

通過本裝置可以將可視的圖片、以及包括文字的紙質(zhì)(或電子屏幕顯示)頁面實(shí)時(shí)轉(zhuǎn)換為語音輸出。

包括以下步驟:

第一步,數(shù)碼攝像機(jī)對(duì)目標(biāo)圖片進(jìn)行拍照,形成的圖片文件存儲(chǔ)到圖片存儲(chǔ)器;

第二步,圖片/文字譯碼器(即文字識(shí)別模塊)讀取圖片文件,將圖片文件轉(zhuǎn)譯處理為文本文件,形成的文本文件存儲(chǔ)到文本存儲(chǔ)器;

第三步,文字/語音合成器(即文本信息-語音轉(zhuǎn)換模塊)讀取文本文件,將文本文件轉(zhuǎn)譯和存儲(chǔ)為音頻文件,并根據(jù)該音頻文件合成出語音信號(hào);

第四步,由音頻處理放大器將音頻信號(hào)進(jìn)行放大后輸出至揚(yáng)聲器播放。

所述語音合成器內(nèi)置有文字/語音合成器,將文本文件轉(zhuǎn)換形成為音頻信號(hào)并輸出至音頻處理放大器,由揚(yáng)聲器將放大后的語音播放出來;

本裝置設(shè)有圖片/文字譯碼器,其利用類似于目前已經(jīng)具有的將帶有文字符號(hào)的圖片轉(zhuǎn)換為文本的軟件工具,如通過對(duì)掃描儀掃描得到的圖片轉(zhuǎn)換為WORD文檔或txt文檔的軟件工具,由微處理器單元控制圖片/文字譯碼器將圖片文字轉(zhuǎn)換形成文本文件、控制文字/語音合成器將文本文件轉(zhuǎn)換形成為音頻信號(hào),從而完成由圖片到語音的轉(zhuǎn)換;還設(shè)有圖片存儲(chǔ)器、文本存儲(chǔ)器,可對(duì)圖片、文本信息進(jìn)行存儲(chǔ),微處理器單元可以通過數(shù)據(jù)線、地址線對(duì)圖片或文本信息進(jìn)行選擇調(diào)用,可以具有一定的編輯功能,選擇對(duì)特定語音的播放。這樣,盲人使用起來比較方便,可以較快地學(xué)習(xí)掌握,實(shí)現(xiàn)對(duì)紙質(zhì)或電子顯示的圖片的“閱讀”。

圖片的邊緣留有一定的空白:

所述第一步設(shè)有一個(gè)拍攝完整度提醒功能,根據(jù)取景的外邊緣的灰度判斷目標(biāo)是否已經(jīng)全部進(jìn)入鏡頭,進(jìn)而通過語音提示相機(jī)鏡頭移動(dòng)的方向,包括上/下、左/右、遠(yuǎn)/近動(dòng)作指令。

所述文字/語音合成器可根據(jù)設(shè)置選擇語音的語種、男女聲、語速。

所述控制鍵盤與微處理器單元的控制信號(hào)輸入端相連,該微處理器單元通過數(shù)據(jù)/地址線與圖片/文字譯碼器、文字/語音合成器、圖片存儲(chǔ)器、文本存儲(chǔ)器的相應(yīng)數(shù)據(jù)端口或地址端口相連,并完成相應(yīng)的控制和數(shù)據(jù)調(diào)用、存儲(chǔ)動(dòng)作;

有益效果:

本發(fā)明提供了一種將圖片轉(zhuǎn)換為語音的方法及裝置,該裝置特別針對(duì)盲人群體設(shè)計(jì),比如位置檢測(cè)裝置能便于使用者手動(dòng)調(diào)節(jié)播放進(jìn)度,這一特征為本發(fā)明的最大亮點(diǎn)。另外,設(shè)置有物理按鍵,如播放鍵等,便于操作。

本裝置具有豐富的拍照功能,環(huán)形閃光模塊有利于獲取無陰影的高素質(zhì)的圖片;

本裝置具有豐富的接口和通信模塊,USB接口等便于通過有線模式傳輸文本文件,wifi模塊和移動(dòng)通信模塊便于通過無線網(wǎng)絡(luò)方式傳輸文本資源,從而極大地?cái)U(kuò)展了本產(chǎn)品的功能。

采用本裝置能方便地將紙質(zhì)的樹制作成電子書,便于攜帶,另外,具有語音播放文本信息的功能,減緩使用者的視覺疲勞,該裝置特別適用于盲人群體。

附圖說明

圖1為將圖片轉(zhuǎn)換為語音的裝置的背面結(jié)構(gòu)示意圖;

圖2為將圖片轉(zhuǎn)換為語音的裝置的正面結(jié)構(gòu)示意圖;

圖3為位置檢測(cè)裝置的結(jié)構(gòu)示意圖;

圖4為電原理框圖。

標(biāo)號(hào)說明:1-殼體,2-顯示屏,3-快門鍵,4-揚(yáng)聲器,5-充電接口,6-音量調(diào)節(jié)旋鈕,7-下一首按鍵,8-導(dǎo)軌,9-暫停/播放按鍵,10-滑塊,11-前一首按鍵,12-USB插口,13-SD卡插槽;14-同步帶,15-同步輪,16-攝像頭,17-主閃光燈,18-導(dǎo)光板,19-輔助閃光燈。

具體實(shí)施方式

以下將結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步詳細(xì)說明:

實(shí)施例1:如圖1-4.一種將圖片轉(zhuǎn)換為語音的裝置,在殼體1的背面設(shè)有顯示屏2和揚(yáng)聲器4;

殼體內(nèi)設(shè)有主板;主板用于獲取照片,并針對(duì)照片進(jìn)行文字識(shí)別形成文本文檔,以及將文本文檔轉(zhuǎn)化為語音在揚(yáng)聲器中播放出來,以上實(shí)現(xiàn)均為現(xiàn)有成熟技術(shù);

殼體上還設(shè)有與主板相連的調(diào)音模塊和進(jìn)程控制按鍵;進(jìn)程控制按鍵包括下一首按鍵7、暫停/播放按鍵9和前一首按鍵11;

殼體的正面設(shè)有攝像頭16和補(bǔ)光燈;

殼體上還設(shè)有與主板連接的位置檢測(cè)裝置。

所述的位置檢測(cè)裝置包括設(shè)置在殼體背面的導(dǎo)軌8以及設(shè)置在導(dǎo)軌上的滑塊10(為穩(wěn)定起見,導(dǎo)軌為平行的兩條);位置檢測(cè)裝置還包括設(shè)置在殼體內(nèi)的2個(gè)同步輪15和張?jiān)O(shè)在2個(gè)同步輪上的同步帶14;所述的滑塊固定在同步帶上與同步帶聯(lián)動(dòng);其中一個(gè)同步輪上設(shè)有同軸的編碼盤,編碼盤輸出編碼到主板。編碼盤能記錄同步轉(zhuǎn)動(dòng)的角度,從而能間接檢測(cè)出滑塊的位移,滑塊用于播放控制,滑塊位于最左側(cè)時(shí),一篇文章從頭開始播放,滑塊位于導(dǎo)軌的正中時(shí),文章跳至50%的位置播放,更進(jìn)一步,同步輪還連接有驅(qū)動(dòng)電機(jī),文章播放時(shí),驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)同步輪旋轉(zhuǎn),使得滑塊同步移動(dòng),如播放到80%時(shí),滑塊也移動(dòng)到80%的位置。

殼體的頂部設(shè)有快門鍵3,快門鍵用于控制攝像頭(也可以不使用快門鍵,直接在屏幕上操作,顯示屏為觸摸顯示屏)。

殼體上設(shè)有USB插口12和SD卡插槽13中的至少一種;用于插入U(xiǎn)盤或SD卡等,將生成的文本文件存儲(chǔ)到存儲(chǔ)介質(zhì)中,或?qū)⑼獠康奈谋疚募ㄟ^存儲(chǔ)介質(zhì)轉(zhuǎn)移到本裝置中。

殼體上設(shè)有耳機(jī)插孔。

調(diào)壓模塊為調(diào)音按鍵或音量調(diào)節(jié)旋鈕6。

攝像頭的左右兩側(cè)各設(shè)有1個(gè)作為補(bǔ)光燈的主閃光燈17;殼體背面還設(shè)有由多個(gè)輔助閃光燈19和一片導(dǎo)光板18形成的環(huán)形閃光模塊,導(dǎo)光板為回字形,由4條長(zhǎng)方形的子板依次首尾回環(huán)連接而成,每條子板下方設(shè)有2個(gè)輔助LED燈。殼體為方形殼體;

揚(yáng)聲器為2個(gè),分布在殼體背面的左右兩側(cè)。形成立體聲輸出,音質(zhì)好。

殼體內(nèi)設(shè)有電池和用于為電池充電的充電電路,殼體上設(shè)有于所述充電電路相連的充電接口(充電接口用于接電源適配器,電源適配器接220V交流市電)。

殼體內(nèi)集成有wifi模塊或移動(dòng)通信模塊(3G或4G模塊),用于通過網(wǎng)絡(luò)獲取文本資源。

一種將圖片轉(zhuǎn)換為語音的方法,采用前述的將圖片轉(zhuǎn)換為語音的裝置;包括以下步驟:

步驟1:采用攝像頭獲取帶有文字信息的圖片;

步驟2:主板上的文字識(shí)別模塊將圖片上的文字內(nèi)容轉(zhuǎn)換為文本信息,并將多個(gè)圖片上的文字信息整合到一個(gè)文本文件中;

步驟3:基于主板上的文本信息-語音轉(zhuǎn)換模塊將文本文件轉(zhuǎn)換為音頻播放。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1