本發(fā)明涉及終端應(yīng)用領(lǐng)域,尤其涉及一種文字拾取裝置和方法。
背景技術(shù):
目前,盲人或弱視人員因為視力問題在生活中存在諸多不便,例如,到餐廳吃飯時無法一個人通過紙質(zhì)菜單點菜,出門時無法自己觀看公交站牌等,當前,隨著各種終端應(yīng)用的廣泛發(fā)展,如何將終端應(yīng)用于盲人或弱視人員的生活中,幫助其解決因視力問題帶來的上述困擾,是相關(guān)技術(shù)人員亟需解決的問題。
技術(shù)實現(xiàn)要素:
本發(fā)明的主要目的在于提出了一種文字拾取裝置和方法,能夠通過終端了解文字內(nèi)容,解決了盲人或弱視人員因視力問題帶來的無法閱讀的困擾。
為實現(xiàn)上述目的,本發(fā)明提供了一種文字拾取裝置,該裝置包括:拍攝模塊和播放模塊。
拍攝模塊,用于在預(yù)設(shè)的文字拾取模式下,對自身所在終端的攝像頭前的物體進行拍攝。
播放模塊,用于將所拍攝的動態(tài)圖像中的文字轉(zhuǎn)化為語音進行播放。
可選地,該裝置還包括:檢測模塊和模式進入模塊。
檢測模塊,用于檢測文字拾取模式的觸發(fā)條件。
模式進入模塊,用于當檢測到觸發(fā)條件并確定該觸發(fā)條件有效時,進入文字拾取模式。
可選地,拍攝模塊對自身所在終端的攝像頭前的物體進行拍攝包括:
檢測攝像頭前的物體;其中該物體上與攝像頭相對的一面上包括文字信息。
根據(jù)預(yù)設(shè)條件調(diào)整焦距。
將包括文字信息的物體中文字部分的中央?yún)^(qū)域作為拍攝焦點并進行拍攝。
可選地,該裝置還包括提醒模塊。
提醒模塊,用于當該物體上與攝像頭相對的一面上不包括文字信息時,發(fā)出提醒信息。
提醒信息包括:預(yù)設(shè)位置上的馬達的振動。
可選地,預(yù)設(shè)條件包括:文字大小。
拍攝模塊根據(jù)預(yù)設(shè)條件調(diào)整焦距包括:
檢測當前焦距下動態(tài)圖像中的文字大小。
將檢測出的文字大小與預(yù)設(shè)的文字尺寸相比較。
當檢測出的文字大小與預(yù)設(shè)的文字尺寸一致時保持當前焦距。
當檢測出的文字大小與預(yù)設(shè)的文字尺寸不一致時,調(diào)整攝像頭的焦距為第一焦距,令動態(tài)圖像中的文字大小與預(yù)設(shè)的文字尺寸一致。
可選地,該裝置還包括:第一確定模塊。
第一確定模塊,用于在根據(jù)預(yù)設(shè)條件調(diào)整焦距之前,根據(jù)用戶的指紋尺寸確定預(yù)設(shè)的文字尺寸。
可選地,第一確定模塊根據(jù)用戶的指紋尺寸確定預(yù)設(shè)的文字尺寸包括:
采集用戶觸摸終端屏幕時的指紋信息;指紋信息中包括所述指紋尺寸。
從指紋尺寸中提取指紋高度和寬度。
將指紋高度和寬度確定為預(yù)設(shè)的文字尺寸中的文字高度和寬度。
可選地,該裝置還包括:第二確定模塊。
第二確定模塊,用于檢測對所拍攝的動態(tài)圖像的觸摸操作并確定觸摸位置。
播放模塊,還用于將觸摸位置處對應(yīng)的文字轉(zhuǎn)化為語音進行播放。
可選地,該裝置還包括:文字位置確定模塊。
文字位置確定模塊用于:
在確定觸摸位置之后,將觸摸位置的坐標與照片中每個文字的坐標相比較,當觸摸位置的坐標與動態(tài)圖像中任意一個文字的坐標一致時,確定觸摸位置與文字相對應(yīng);當觸摸位置的坐標與動態(tài)圖像中每個文字的坐標均不一致時,確定觸摸位置與文字不對應(yīng)。
可選地,文字位置確定模塊還用于:
在確定觸摸位置以后,當觸摸位置處沒有對應(yīng)文字時,檢測距離當前觸摸位置最近的第一文字所在的位置。
確定第一文字所在的位置與當前觸摸位置的相對方向。
控制相應(yīng)方向上的預(yù)設(shè)馬達進行振動。
可選地,播放模塊將觸摸位置處對應(yīng)的文字轉(zhuǎn)化為語音進行播放包括:
當觸摸位置處于一行文字或一列文字所在的直線上時,將一行文字或一列文字轉(zhuǎn)化為語音進行播放。
可選地,該裝置還包括:設(shè)置模塊。
設(shè)置模塊用于:
將與縱向上相鄰的文字均保持預(yù)設(shè)的第一間距,并且在橫向上處于相同的直線上的多個文字作為一行文字。
將與橫向上相鄰的文字均保持預(yù)設(shè)的第二間距,并且在縱向上處于相同的直線上的多個文字作為一行文字。
此外,為實現(xiàn)上述目的,本發(fā)明還提供了一種文字拾取方法,該方法包括:
在預(yù)設(shè)的文字拾取模式下,對終端的攝像頭前的物體進行拍攝。
將所拍攝的動態(tài)圖像中的文字轉(zhuǎn)化為語音進行播放。
可選地,該方法還包括:
檢測文字拾取模式的觸發(fā)條件。
當檢測到觸發(fā)條件并確定該觸發(fā)條件有效時,進入文字拾取模式。
可選地,對自身所在終端的攝像頭前的物體進行拍攝包括:
檢測攝像頭前的物體;其中該物體上與攝像頭相對的一面上包括文字信息。
根據(jù)預(yù)設(shè)條件調(diào)整焦距。
將包括文字信息的物體中文字部分的中央?yún)^(qū)域作為拍攝焦點并進行拍攝。
可選地,該方法還包括:
當該物體上與攝像頭相對的一面上不包括文字信息時,發(fā)出提醒信息。
該提醒信息包括:預(yù)設(shè)位置上的馬達的振動。
可選地,預(yù)設(shè)條件包括:文字大小。
根據(jù)預(yù)設(shè)條件調(diào)整焦距包括:
檢測當前焦距下動態(tài)圖像中的文字大小。
將檢測出的文字大小與預(yù)設(shè)的文字尺寸相比較。
當檢測出的文字大小與預(yù)設(shè)的文字尺寸一致時保持當前焦距。
當檢測出的文字大小與預(yù)設(shè)的文字尺寸不一致時,調(diào)整攝像頭的焦距為第一焦距,令動態(tài)圖像中的文字大小與預(yù)設(shè)的文字尺寸一致。
可選地,該方法還包括:在根據(jù)預(yù)設(shè)條件調(diào)整焦距之前,根據(jù)用戶的指紋尺寸確定預(yù)設(shè)的文字尺寸。
可選地,根據(jù)用戶的指紋尺寸確定預(yù)設(shè)的文字尺寸包括:
采集用戶觸摸終端屏幕時的指紋信息;該指紋信息中包括指紋尺寸。
從指紋尺寸中提取指紋高度和寬度。
將指紋高度和寬度確定為預(yù)設(shè)的文字尺寸中的文字高度和寬度。
可選地,該方法還包括:
檢測對所拍攝的動態(tài)圖像的觸摸操作并確定觸摸位置。
將觸摸位置處對應(yīng)的文字轉(zhuǎn)化為語音進行播放。
可選地,所述方法還包括:
在確定觸摸位置之后,將觸摸位置的坐標與照片中每個文字的坐標相比較,當觸摸位置的坐標與動態(tài)圖像中任意一個文字的坐標一致時,確定觸摸位置與文字相對應(yīng);當觸摸位置的坐標與動態(tài)圖像中每個文字的坐標均不一致時,確定觸摸位置與文字不對應(yīng)。
可選地,該方法還包括:
在確定觸摸位置以后,當觸摸位置處沒有對應(yīng)文字時,檢測距離當前觸摸位置最近的第一文字所在的位置。
確定第一文字所在的位置與當前觸摸位置的相對方向。
控制相應(yīng)方向上的預(yù)設(shè)馬達進行振動。
可選地,將觸摸位置處對應(yīng)的文字轉(zhuǎn)化為語音進行播放包括:
當觸摸位置處于一行文字或一列文字所在的直線上時,將一行文字或一列文字轉(zhuǎn)化為語音進行播放。
可選地,該方法還包括:
將與縱向上相鄰的文字均保持預(yù)設(shè)的第一間距,并且在橫向上處于相同的直線上的多個文字作為一行文字。
將與橫向上相鄰的文字均保持預(yù)設(shè)的第二間距,并且在縱向上處于相同的直線上的多個文字作為一行文字。
本發(fā)明提出了一種文字拾取裝置和方法,該裝置包括:拍攝模塊、第一確定模塊和播放模塊。拍攝模塊在預(yù)設(shè)的文字拾取模式下,對自身所在終端的攝像頭前的物體進行拍攝。播放模塊將所拍攝的動態(tài)圖像中的文字轉(zhuǎn)化為語音進行播放。通過本發(fā)明實施例方案,能夠通過終端了解文字內(nèi)容,解決了盲人或弱視人員因視力問題帶來的無法閱讀的困擾。
附圖說明
圖1為實現(xiàn)本發(fā)明各個實施例一個可選的移動終端的硬件結(jié)構(gòu)示意圖;
圖2為如圖1所示的移動終端的無線通信系統(tǒng)示意圖;
圖3為本發(fā)明實施例的文字拾取裝置組成框圖;
圖4為本發(fā)明實施例的文字拾取方法流程圖;
圖5為本發(fā)明實施例的文字拾取方法示意圖;
圖6為本發(fā)明實施例的文字拾取方法中圖像太小時用戶點擊時的示意圖;
圖7為本發(fā)明實施例的文字拾取方法中進行調(diào)焦后用戶點擊時的示意圖;
圖8為本發(fā)明實施例的文字拾取方法中卻聽提醒馬達的實施例示意圖。
本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。
具體實施方式
應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
現(xiàn)在將參考附圖描述實現(xiàn)本發(fā)明各個實施例一個可選的移動終端。在后續(xù)的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發(fā)明的說明,其本身并沒有特定的意義。因此,"模塊"與"部件"可以混合地使用。
移動終端可以以各種形式來實施。例如,本發(fā)明中描述的終端可以包括諸如移動電話、智能電話、筆記本電腦、數(shù)字廣播接收器、PDA(個人數(shù)字助理)、PAD(平板電腦)、PMP(便攜式多媒體播放器)、導航裝置等等的移動終端以及諸如數(shù)字TV、臺式計算機等等的固定終端。下面,假設(shè)終端是移動終端。然而,本領(lǐng)域技術(shù)人員將理解的是,除了特別用于移動目的的元件之外,根據(jù)本發(fā)明的實施方式的構(gòu)造也能夠應(yīng)用于固定類型的終端。
圖1為實現(xiàn)本發(fā)明各個實施例的移動終端的硬件結(jié)構(gòu)示意。
移動終端100可以包括無線通信單元110、A/V(音頻/視頻)輸入單元120、用戶輸入單元130、感測單元140、輸出單元150、存儲器160、接口單元170、控制器180和電源單元190等等。圖1示出了具有各種組件的移動終端,但是應(yīng)理解的是,并不要求實施所有示出的組件??梢蕴娲貙嵤└嗷蚋俚慕M件。將在下面詳細描述移動終端的元件。
無線通信單元110通常包括一個或多個組件,其允許移動終端100與無線通信系統(tǒng)或網(wǎng)絡(luò)之間的無線電通信。例如,無線通信單元可以包括廣播接收模塊111、移動通信模塊112、無線互聯(lián)網(wǎng)模塊113、短程通信模塊114和位置信息模塊115中的至少一個。
廣播接收模塊111經(jīng)由廣播信道從外部廣播管理服務(wù)器接收廣播信號和/或廣播相關(guān)信息。廣播信道可以包括衛(wèi)星信道和/或地面信道。廣播管理服務(wù)器可以是生成并發(fā)送廣播信號和/或廣播相關(guān)信息的服務(wù)器或者接收之前生成的廣播信號和/或廣播相關(guān)信息并且將其發(fā)送給終端的服務(wù)器。廣播信號可以包括TV廣播信號、無線電廣播信號、數(shù)據(jù)廣播信號等等。而且,廣播信號可以進一步包括與TV或無線電廣播信號組合的廣播信號。廣播相關(guān)信息也可以經(jīng)由移動通信網(wǎng)絡(luò)提供,并且在該情況下,廣播相關(guān)信息可以由移動通信模塊112來接收。廣播信號可以以各種形式存在,例如,其可以以數(shù)字多媒體廣播(DMB)的電子節(jié)目指南(EPG)、數(shù)字視頻廣播手持(DVB-H)的電子服務(wù)指南(ESG)等等的形式而存在。廣播接收模塊111可以通過使用各種類型的廣播系統(tǒng)接收信號廣播。特別地,廣播接收模塊111可以通過使用諸如多媒體廣播-地面(DMB-T)、數(shù)字多媒體廣播-衛(wèi)星(DMB-S)、數(shù)字視頻廣播-手持(DVB-H),前向鏈路媒體(MediaFLO@)的數(shù)據(jù)廣播系統(tǒng)、地面數(shù)字廣播綜合服務(wù)(ISDB-T)等等的數(shù)字廣播系統(tǒng)接收數(shù)字廣播。廣播接收模塊111可以被構(gòu)造為適合提供廣播信號的各種廣播系統(tǒng)以及上述數(shù)字廣播系統(tǒng)。經(jīng)由廣播接收模塊111接收的廣播信號和/或廣播相關(guān)信息可以存儲在存儲器160(或者其它類型的存儲介質(zhì))中。
移動通信模塊112將無線電信號發(fā)送到基站(例如,接入點、節(jié)點B等等)、外部終端以及服務(wù)器中的至少一個和/或從其接收無線電信號。這樣的無線電信號可以包括語音通話信號、視頻通話信號、或者根據(jù)文本和/或多媒體消息發(fā)送和/或接收的各種類型的數(shù)據(jù)。
無線互聯(lián)網(wǎng)模塊113支持移動終端的無線互聯(lián)網(wǎng)接入。該模塊可以內(nèi)部或外部地耦接到終端。該模塊所涉及的無線互聯(lián)網(wǎng)接入技術(shù)可以包括WLAN(無線LAN)(Wi-Fi)、Wibro(無線寬帶)、Wimax(全球微波互聯(lián)接入)、HSDPA(高速下行鏈路分組接入)等等。
短程通信模塊114是用于支持短程通信的模塊。短程通信技術(shù)的一些示例包括藍牙TM、射頻識別(RFID)、紅外數(shù)據(jù)協(xié)會(IrDA)、超寬帶(UWB)、紫蜂TM等等。
位置信息模塊115是用于檢查或獲取移動終端的位置信息的模塊。位置信息模塊的典型示例是GPS(全球定位系統(tǒng))。根據(jù)當前的技術(shù),GPS模塊115計算來自三個或更多衛(wèi)星的距離信息和準確的時間信息并且對于計算的信息應(yīng)用三角測量法,從而根據(jù)經(jīng)度、緯度和高度準確地計算三維當前位置信息。當前,用于計算位置和時間信息的方法使用三顆衛(wèi)星并且通過使用另外的一顆衛(wèi)星校正計算出的位置和時間信息的誤差。此外,GPS模塊115能夠通過實時地連續(xù)計算當前位置信息來計算速度信息。
A/V輸入單元120用于接收音頻或視頻信號。A/V輸入單元120可以包括相機121和麥克風1220,相機121對在視頻捕獲模式或圖像捕獲模式中由圖像捕獲裝置獲得的靜態(tài)圖片或視頻的圖像數(shù)據(jù)進行處理。處理后的圖像幀可以顯示在顯示單元151上。經(jīng)相機121處理后的圖像幀可以存儲在存儲器160(或其它存儲介質(zhì))中或者經(jīng)由無線通信單元110進行發(fā)送,可以根據(jù)移動終端的構(gòu)造提供兩個或更多相機1210。麥克風122可以在電話通話模式、記錄模式、語音識別模式等等運行模式中經(jīng)由麥克風接收聲音(音頻數(shù)據(jù)),并且能夠?qū)⑦@樣的聲音處理為音頻數(shù)據(jù)。處理后的音頻(語音)數(shù)據(jù)可以在電話通話模式的情況下轉(zhuǎn)換為可經(jīng)由移動通信模塊112發(fā)送到移動通信基站的格式輸出。麥克風122可以實施各種類型的噪聲消除(或抑制)算法以消除(或抑制)在接收和發(fā)送音頻信號的過程中產(chǎn)生的噪聲或者干擾。
用戶輸入單元130可以根據(jù)用戶輸入的命令生成鍵輸入數(shù)據(jù)以控制移動終端的各種操作。用戶輸入單元130允許用戶輸入各種類型的信息,并且可以包括鍵盤、鍋仔片、觸摸板(例如,檢測由于被接觸而導致的電阻、壓力、電容等等的變化的觸敏組件)、滾輪、搖桿等等。特別地,當觸摸板以層的形式疊加在顯示單元151上時,可以形成觸摸屏。
感測單元140檢測移動終端100的當前狀態(tài),(例如,移動終端100的打開或關(guān)閉狀態(tài))、移動終端100的位置、用戶對于移動終端100的接觸(即,觸摸輸入)的有無、移動終端100的取向、移動終端100的加速或減速移動和方向等等,并且生成用于控制移動終端100的操作的命令或信號。例如,當移動終端100實施為滑動型移動電話時,感測單元140可以感測該滑動型電話是打開還是關(guān)閉。另外,感測單元140能夠檢測電源單元190是否提供電力或者接口單元170是否與外部裝置耦接。感測單元140可以包括接近傳感器1410將在下面結(jié)合觸摸屏來對此進行描述。
接口單元170用作至少一個外部裝置與移動終端100連接可以通過的接口。例如,外部裝置可以包括有線或無線頭戴式耳機端口、外部電源(或電池充電器)端口、有線或無線數(shù)據(jù)端口、存儲卡端口、用于連接具有識別模塊的裝置的端口、音頻輸入/輸出(I/O)端口、視頻I/O端口、耳機端口等等。識別模塊可以是存儲用于驗證用戶使用移動終端100的各種信息并且可以包括用戶識別模塊(UIM)、客戶識別模塊(SIM)、通用客戶識別模塊(USIM)等等。另外,具有識別模塊的裝置(下面稱為"識別裝置")可以采取智能卡的形式,因此,識別裝置可以經(jīng)由端口或其它連接裝置與移動終端100連接。接口單元170可以用于接收來自外部裝置的輸入(例如,數(shù)據(jù)信息、電力等等)并且將接收到的輸入傳輸?shù)揭苿咏K端100內(nèi)的一個或多個元件或者可以用于在移動終端和外部裝置之間傳輸數(shù)據(jù)。
另外,當移動終端100與外部底座連接時,接口單元170可以用作允許通過其將電力從底座提供到移動終端100的路徑或者可以用作允許從底座輸入的各種命令信號通過其傳輸?shù)揭苿咏K端的路徑。從底座輸入的各種命令信號或電力可以用作用于識別移動終端是否準確地安裝在底座上的信號。輸出單元150被構(gòu)造為以視覺、音頻和/或觸覺方式提供輸出信號(例如,音頻信號、視頻信號、警報信號、振動信號等等)。輸出單元150可以包括顯示單元151、音頻輸出模塊152、警報單元153等等。
顯示單元151可以顯示在移動終端100中處理的信息。例如,當移動終端100處于電話通話模式時,顯示單元151可以顯示與通話或其它通信(例如,文本消息收發(fā)、多媒體文件下載等等)相關(guān)的用戶界面(UI)或圖形用戶界面(GUI)。當移動終端100處于視頻通話模式或者圖像捕獲模式時,顯示單元151可以顯示捕獲的圖像和/或接收的圖像、示出視頻或圖像以及相關(guān)功能的UI或GUI等等。
同時,當顯示單元151和觸摸板以層的形式彼此疊加以形成觸摸屏時,顯示單元151可以用作輸入裝置和輸出裝置。顯示單元151可以包括液晶顯示器(LCD)、薄膜晶體管LCD(TFT-LCD)、有機發(fā)光二極管(OLED)顯示器、柔性顯示器、三維(3D)顯示器等等中的至少一種。這些顯示器中的一些可以被構(gòu)造為透明狀以允許用戶從外部觀看,這可以稱為透明顯示器,典型的透明顯示器可以例如為TOLED(透明有機發(fā)光二極管)顯示器等等。根據(jù)特定想要的實施方式,移動終端100可以包括兩個或更多顯示單元(或其它顯示裝置),例如,移動終端可以包括外部顯示單元(未示出)和內(nèi)部顯示單元(未示出)。觸摸屏可用于檢測觸摸輸入壓力以及觸摸輸入位置和觸摸輸入面積。
音頻輸出模塊152可以在移動終端處于呼叫信號接收模式、通話模式、記錄模式、語音識別模式、廣播接收模式等等模式下時,將無線通信單元110接收的或者在存儲器160中存儲的音頻數(shù)據(jù)轉(zhuǎn)換音頻信號并且輸出為聲音。而且,音頻輸出模塊152可以提供與移動終端100執(zhí)行的特定功能相關(guān)的音頻輸出(例如,呼叫信號接收聲音、消息接收聲音等等)。音頻輸出模塊152可以包括揚聲器、蜂鳴器等等。
警報單元153可以提供輸出以將事件的發(fā)生通知給移動終端100。典型的事件可以包括呼叫接收、消息接收、鍵信號輸入、觸摸輸入等等。除了音頻或視頻輸出之外,警報單元153可以以不同的方式提供輸出以通知事件的發(fā)生。例如,警報單元153可以以振動的形式提供輸出,當接收到呼叫、消息或一些其它進入通信(incomingcommunication)時,警報單元153可以提供觸覺輸出(即,振動)以將其通知給用戶。通過提供這樣的觸覺輸出,即使在用戶的移動電話處于用戶的口袋中時,用戶也能夠識別出各種事件的發(fā)生。警報單元153也可以經(jīng)由顯示單元151或音頻輸出模塊152提供通知事件的發(fā)生的輸出。
存儲器160可以存儲由控制器180執(zhí)行的處理和控制操作的軟件程序等等,或者可以暫時地存儲己經(jīng)輸出或?qū)⒁敵龅臄?shù)據(jù)(例如,電話簿、消息、靜態(tài)圖像、視頻等等)。而且,存儲器160可以存儲關(guān)于當觸摸施加到觸摸屏時輸出的各種方式的振動和音頻信號的數(shù)據(jù)。
存儲器160可以包括至少一種類型的存儲介質(zhì),所述存儲介質(zhì)包括閃存、硬盤、多媒體卡、卡型存儲器(例如,SD或DX存儲器等等)、隨機訪問存儲器(RAM)、靜態(tài)隨機訪問存儲器(SRAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、可編程只讀存儲器(PROM)、磁性存儲器、磁盤、光盤等等。而且,移動終端100可以與通過網(wǎng)絡(luò)連接執(zhí)行存儲器160的存儲功能的網(wǎng)絡(luò)存儲裝置協(xié)作。
控制器180通常控制移動終端的總體操作。例如,控制器180執(zhí)行與語音通話、數(shù)據(jù)通信、視頻通話等等相關(guān)的控制和處理。另外,控制器180可以包括用于再現(xiàn)(或回放)多媒體數(shù)據(jù)的多媒體模塊1810,多媒體模塊1810可以構(gòu)造在控制器180內(nèi),或者可以構(gòu)造為與控制器180分離??刂破?80可以執(zhí)行模式識別處理,以將在觸摸屏上執(zhí)行的手寫輸入或者圖片繪制輸入識別為字符或圖像。
電源單元190在控制器180的控制下接收外部電力或內(nèi)部電力并且提供操作各元件和組件所需的適當?shù)碾娏Α?/p>
這里描述的各種實施方式可以以使用例如計算機軟件、硬件或其任何組合的計算機可讀介質(zhì)來實施。對于硬件實施,這里描述的實施方式可以通過使用特定用途集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理裝置(DSPD)、可編程邏輯裝置(PLD)、現(xiàn)場可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、被設(shè)計為執(zhí)行這里描述的功能的電子單元中的至少一種來實施,在一些情況下,這樣的實施方式可以在控制器180中實施。對于軟件實施,諸如過程或功能的實施方式可以與允許執(zhí)行至少一種功能或操作的單獨的軟件模塊來實施。軟件代碼可以由以任何適當?shù)木幊陶Z言編寫的軟件應(yīng)用程序(或程序)來實施,軟件代碼可以存儲在存儲器160中并且由控制器180執(zhí)行。
至此,己經(jīng)按照其功能描述了移動終端。下面,為了簡要起見,將描述諸如折疊型、直板型、擺動型、滑動型移動終端等等的各種類型的移動終端中的滑動型移動終端作為示例。因此,本發(fā)明能夠應(yīng)用于任何類型的移動終端,并且不限于滑動型移動終端。
如圖1中所示的移動終端100可以被構(gòu)造為利用經(jīng)由幀或分組發(fā)送數(shù)據(jù)的諸如有線和無線通信系統(tǒng)以及基于衛(wèi)星的通信系統(tǒng)來操作。
現(xiàn)在將參考圖2描述其中根據(jù)本發(fā)明的移動終端能夠操作的通信系統(tǒng)。
這樣的通信系統(tǒng)可以使用不同的空中接口和/或物理層。例如,由通信系統(tǒng)使用的空中接口包括例如頻分多址(FDMA)、時分多址(TDMA)、碼分多址(CDMA)和通用移動通信系統(tǒng)(UMTS)(特別地,長期演進(LTE))、全球移動通信系統(tǒng)(GSM)等等。作為非限制性示例,下面的描述涉及CDMA通信系統(tǒng),但是這樣的教導同樣適用于其它類型的系統(tǒng)。
參考圖2,CDMA無線通信系統(tǒng)可以包括多個移動終端100、多個基站(BS)270、基站控制器(BSC)275和移動交換中心(MSC)280。MSC280被構(gòu)造為與公共電話交換網(wǎng)絡(luò)(PSTN)290形成接口。MSC280還被構(gòu)造為與可以經(jīng)由回程線路耦接到基站270的BSC275形成接口?;爻叹€路可以根據(jù)若干己知的接口中的任一種來構(gòu)造,所述接口包括例如E1/T1、ATM,IP、PPP、幀中繼、HDSL、ADSL或xDSL。將理解的是,如圖2中所示的系統(tǒng)可以包括多個BSC2750。
每個BS270可以服務(wù)一個或多個分區(qū)(或區(qū)域),由多向天線或指向特定方向的天線覆蓋的每個分區(qū)放射狀地遠離BS270?;蛘?,每個分區(qū)可以由用于分集接收的兩個或更多天線覆蓋。每個BS270可以被構(gòu)造為支持多個頻率分配,并且每個頻率分配具有特定頻譜(例如,1.25MHz,5MHz等等)。
分區(qū)與頻率分配的交叉可以被稱為CDMA信道。BS270也可以被稱為基站收發(fā)器子系統(tǒng)(BTS)或者其它等效術(shù)語。在這樣的情況下,術(shù)語"基站"可以用于籠統(tǒng)地表示單個BSC275和至少一個BS270。基站也可以被稱為"蜂窩站"?;蛘?,特定BS270的各分區(qū)可以被稱為多個蜂窩站。
如圖2中所示,廣播發(fā)射器(BT)295將廣播信號發(fā)送給在系統(tǒng)內(nèi)操作的移動終端100。如圖1中所示的廣播接收模塊111被設(shè)置在移動終端100處以接收由BT295發(fā)送的廣播信號。在圖2中,示出了幾個全球定位系統(tǒng)(GPS)衛(wèi)星300。衛(wèi)星300幫助定位多個移動終端100中的至少一個。
在圖2中,描繪了多個衛(wèi)星300,但是理解的是,可以利用任何數(shù)目的衛(wèi)星獲得有用的定位信息。如圖1中所示的GPS模塊115通常被構(gòu)造為與衛(wèi)星300配合以獲得想要的定位信息。替代GPS跟蹤技術(shù)或者在GPS跟蹤技術(shù)之外,可以使用可以跟蹤移動終端的位置的其它技術(shù)。另外,至少一個GPS衛(wèi)星300可以選擇性地或者額外地處理衛(wèi)星DMB傳輸。
作為無線通信系統(tǒng)的一個典型操作,BS270接收來自各種移動終端100的反向鏈路信號。移動終端100通常參與通話、消息收發(fā)和其它類型的通信。特定基站270接收的每個反向鏈路信號被在特定BS270內(nèi)進行處理。獲得的數(shù)據(jù)被轉(zhuǎn)發(fā)給相關(guān)的BSC275。BSC提供通話資源分配和包括BS270之間的軟切換過程的協(xié)調(diào)的移動管理功能。BSC275還將接收到的數(shù)據(jù)路由到MSC280,其提供用于與PSTN290形成接口的額外的路由服務(wù)。類似地,PSTN290與MSC280形成接口,MSC與BSC275形成接口,并且BSC275相應(yīng)地控制BS270以將正向鏈路信號發(fā)送到移動終端100。
基于上述可選的移動終端硬件結(jié)構(gòu)以及通信系統(tǒng),提出本發(fā)明方法各個實施例。
如圖3所示,本發(fā)明第一實施例提出了一種文字拾取裝置1,該裝置包括:拍攝模塊01和播放模塊02。
拍攝模塊01,用于在預(yù)設(shè)的文字拾取模式下,對自身所在終端的攝像頭前的物體進行拍攝。
播放模塊02,用于將所拍攝的動態(tài)圖像中的文字轉(zhuǎn)化為語音進行播放。
可選地,該裝置還包括:檢測模塊03和模式進入模塊04。
檢測模塊03,用于檢測文字拾取模式的觸發(fā)條件。
模式進入模塊04,用于當檢測到觸發(fā)條件并確定該觸發(fā)條件有效時,進入文字拾取模式。
可選地,拍攝模塊01對自身所在終端的攝像頭前的物體進行拍攝包括:
檢測攝像頭前的物體;其中該物體上與攝像頭相對的一面上包括文字信息。
根據(jù)預(yù)設(shè)條件調(diào)整焦距。
將包括文字信息的物體中文字部分的中央?yún)^(qū)域作為拍攝焦點并進行拍攝。
可選地,該裝置還包括提醒模塊05。
提醒模塊,用于當該物體上與攝像頭相對的一面上不包括文字信息時,發(fā)出提醒信息。
提醒信息包括:預(yù)設(shè)位置上的馬達的振動。
可選地,預(yù)設(shè)條件包括:文字大小。
拍攝模塊01根據(jù)預(yù)設(shè)條件調(diào)整焦距包括:
檢測當前焦距下動態(tài)圖像中的文字大小。
將檢測出的文字大小與預(yù)設(shè)的文字尺寸相比較。
當檢測出的文字大小與預(yù)設(shè)的文字尺寸一致時保持當前焦距。
當檢測出的文字大小與預(yù)設(shè)的文字尺寸不一致時,調(diào)整攝像頭的焦距為第一焦距,令動態(tài)圖像中的文字大小與預(yù)設(shè)的文字尺寸一致。
可選地,該裝置還包括:第一確定模塊06。
第一確定模塊06,用于在根據(jù)預(yù)設(shè)條件調(diào)整焦距之前,根據(jù)用戶的指紋尺寸確定預(yù)設(shè)的文字尺寸。
可選地,第一確定模塊06根據(jù)用戶的指紋尺寸確定預(yù)設(shè)的文字尺寸包括:
采集用戶觸摸終端屏幕時的指紋信息;指紋信息中包括所述指紋尺寸。
從指紋尺寸中提取指紋高度和寬度。
將指紋高度和寬度確定為預(yù)設(shè)的文字尺寸中的文字高度和寬度。
可選地,該裝置還包括:第二確定模塊07。
第二確定模塊07,用于檢測對所拍攝的動態(tài)圖像的觸摸操作并確定觸摸位置。
播放模塊02,還用于將觸摸位置處對應(yīng)的文字轉(zhuǎn)化為語音進行播放。
可選地,該裝置還包括:文字位置確定模塊08。
文字位置確定模塊08用于:
在確定觸摸位置之后,將觸摸位置的坐標與動態(tài)圖像中每個文字的坐標相比較,當觸摸位置的坐標與動態(tài)圖像中任意一個文字的坐標一致時,確定觸摸位置與文字相對應(yīng);當觸摸位置的坐標與照片中每個文字的坐標均不一致時,確定觸摸位置與文字不對應(yīng)。
可選地,文字位置確定模塊08還用于:
在確定觸摸位置以后,當觸摸位置處沒有對應(yīng)文字時,檢測距離當前觸摸位置最近的第一文字所在的位置。
確定第一文字所在的位置與當前觸摸位置的相對方向。
控制相應(yīng)方向上的預(yù)設(shè)馬達進行振動。
可選地,播放模塊03將觸摸位置處對應(yīng)的文字轉(zhuǎn)化為語音進行播放包括:
當觸摸位置處于一行文字或一列文字所在的直線上時,將一行文字或一列文字轉(zhuǎn)化為語音進行播放。
可選地,該裝置還包括:設(shè)置模塊09。
設(shè)置模塊09用于:
將與縱向上相鄰的文字均保持預(yù)設(shè)的第一間距,并且在橫向上處于相同的直線上的多個文字作為一行文字。
將與橫向上相鄰的文字均保持預(yù)設(shè)的第二間距,并且在縱向上處于相同的直線上的多個文字作為一行文字。
此外,為實現(xiàn)上述目的,本發(fā)明還提供了一種文字拾取方法,如圖4、圖5所示,該方法包括S101-S102:
S101、在預(yù)設(shè)的文字拾取模式下,對終端的攝像頭前的物體進行拍攝。
在本發(fā)明實施例中,為了幫助盲人或弱視人員閱讀紙張、墓碑、牌照等各種物體上的文字,以便于其了解文字內(nèi)容,本發(fā)明實施例方案可以通過終端對該終端前的物體進行拍攝,并且捕捉所拍攝的動態(tài)圖像中的文字信息,將該文字信息以語音形式播放出來,解決了盲人或弱視人員因視力問題帶來的無法閱讀的困擾。
在本發(fā)明實施例中,為了與一般的拍照或拍攝動作相區(qū)別,本發(fā)明實施例方案需要在預(yù)設(shè)的模式下完成,如上述的文字拾取模式,該文字提取模式用于通過終端的攝像頭尋找位于攝像頭前的、與攝像頭相對的一面包含文字信息的物體,并對該物體進行拍攝,將拍攝的動態(tài)圖像中的文字信息轉(zhuǎn)化成語音信息進行播放。需要說明的是,在進行語音播放時不限于文字信息,還可以是數(shù)字信息、符號信息等。并且上述的動態(tài)圖像可以是通過攝像頭拍攝出來的視頻圖像,也可以是攝像頭在拍攝期間捕捉到的實時的動態(tài)圖像。
在本發(fā)明實施例中,可以通過以下方案進入該文字拾取模式。
可選地,該方法還包括S201-S202:
S201、檢測文字拾取模式的觸發(fā)條件。其中,該觸發(fā)條件包括手指操作和/或語音命令。
在本發(fā)明實施例中,終端可以實時地或周期性地檢測消息處理模式的觸發(fā)條件。另外,為了節(jié)省終端資源,還可以通過消息通知的方式獲取該觸發(fā)條件,例如,當預(yù)設(shè)的壓力傳感器、指紋識別裝置、掃描裝置、語音識別裝置以及按鍵(該案件包括硬件按鍵和軟件形式的按鍵)等檢測到某種手指操作或語音命令時發(fā)出通知消息,以便終端確認該手指操作或語音命令是否為文字拾取模式的觸發(fā)條件。需要說明的是,該觸發(fā)條件可以包括但不限于手指操作和/或語音命令。在不同的實施例中,該觸發(fā)條件可以設(shè)置為任意一種可以實施的操作或命令等。例如,該觸發(fā)條件還可以是一種凌空手勢,通過終端中預(yù)設(shè)的接近傳感器來對該凌空手勢進行檢測。
S202、當檢測到觸發(fā)條件并確定該觸發(fā)條件有效時,進入文字拾取模式。
在本發(fā)明實施例中,通過步驟S201對文字拾取模式的觸發(fā)條件進行檢測以后,還需要確定該觸發(fā)條件的有效性。例如,當檢測到某一個預(yù)設(shè)的文字拾取模式的觸發(fā)按鍵上的按動操作時,需要檢測該按動操作的持續(xù)時間,當按動操作的持續(xù)時間小于或等于預(yù)設(shè)的時間閾值時則可以確定該按動操作無效,即文字拾取模式的觸發(fā)條件無效。又例如,當預(yù)設(shè)的接近傳感器檢測到觸發(fā)消息處理模式的凌空手勢時,如果該凌空手勢的保持時間小于或等于預(yù)設(shè)的時間閾值,則同樣可以確定該凌空手勢無效,即文字拾取模式的觸發(fā)條件無效。通過本發(fā)明實施例的方案,可以有效地防止誤操作的發(fā)生。
在本發(fā)明實施例中,當確定檢測到的觸發(fā)條件有效時,便可以觸發(fā)終端進入預(yù)設(shè)的文字拾取模式了。在該文字拾取模式下,用戶可以對終端前的物體進行拍攝,以便終端將拍攝的動態(tài)圖像中的文字轉(zhuǎn)化為語音,便于向終端用戶播放。
在本發(fā)明實施例中,可以通過以下方案對終端前的物體進行拍攝。
可選地,對終端的攝像頭前的物體進行拍攝包括S301-S302:
S301、檢測攝像頭前的物體;其中該物體上與攝像頭相對的一面上包括文字信息。
在本發(fā)明實施例中,由于預(yù)設(shè)的文字拾取模式主要是為了將動態(tài)圖像中的文字進行提取,以便將問題轉(zhuǎn)化為語音進行播放。因此,在文字拾取模式下,終端進行拍攝時會檢測終端的拍攝場景中包括文字信息的物體。在本發(fā)明實施例中,可以通過預(yù)設(shè)的圖像識別系統(tǒng)完成對文字的檢測和識別過程。
可選地,該方法還包括:當該物體上與攝像頭相對的一面上不包括文字信息時,發(fā)出提醒信息。該提醒信息包括:預(yù)設(shè)位置上的馬達的振動。
在本發(fā)明實施例中,在終端拍攝之前,當終端未檢測到終端當前的場景中存在包含文字信息的物體時,為了提醒用戶變換拍攝場景,尤其是提醒盲人或弱視人員,可以發(fā)出預(yù)設(shè)的提醒信息。需要說明的是,該提醒信息可以包括以下一種或多種:鈴聲、音樂、語音、振動、閃光燈。例如,可以控制終端預(yù)設(shè)位置處的馬達產(chǎn)生振動。因為終端中可以包括一個或多個馬達,分別設(shè)置于不同的位置,以實現(xiàn)不同的功能,當終端前的物體不包括文字信息時,僅令某一預(yù)定位置的馬達產(chǎn)生振動,從而達到提醒用戶的目的。該預(yù)設(shè)位置可以是終端上的任意位置,只要方便用戶感知馬達的振動即可。
S302、根據(jù)預(yù)設(shè)條件調(diào)整焦距。
在本發(fā)明實施例中,終端在捕捉到拍攝場景中的包含文字信息的物體以后,需要根據(jù)預(yù)設(shè)的條件對終端攝像頭進行調(diào)焦,以拍攝出符合預(yù)設(shè)條件的動態(tài)圖像。
可選地,該預(yù)設(shè)條件包括:文字大小。
在本發(fā)明實施例中,可以通過調(diào)焦將文字部分的文字大小調(diào)節(jié)到合適的值,以便用戶在點擊時,防止照片中的文字太小造成點擊錯誤的現(xiàn)象發(fā)生,尤其是對于盲人和弱視人員來說,在不需要直接收聽由動態(tài)圖像中的文字信息直接轉(zhuǎn)化成的語音信息時(例如,想要鍛煉手指觸摸能力時),可以依靠手指的點擊來確定選中的文字并傾聽該文字的內(nèi)容,在看不到或看不清動態(tài)圖像中的文字的情況下,如果其文字太小,用戶容易一直點擊錯誤,如圖6所示,這勢必為用戶帶來很差的體驗感。因此,需要在拍攝之前先進行調(diào)焦,以便拍攝出的動態(tài)圖像符合要求的文字大小,方便用戶點擊。
可選地,該方法還包括:在根據(jù)預(yù)設(shè)條件調(diào)整焦距之前,根據(jù)用戶的指紋尺寸確定預(yù)設(shè)的文字尺寸。
在本發(fā)明實施例中,根據(jù)上述內(nèi)容可知,在拍攝之前,需要預(yù)先確定該文字大小的標準,以便終端在進行調(diào)焦時直接將該預(yù)設(shè)數(shù)值作為調(diào)焦的依據(jù)。由于預(yù)先確定動態(tài)圖像中的文字大小的標準是為了避免文字太小造成點擊錯誤的現(xiàn)象發(fā)生,文字太大時動態(tài)圖像內(nèi)能夠容納的文字太少。因此,在本發(fā)明實施例中,可以根據(jù)用戶手指的尺寸或大小來確定動態(tài)圖像的文字大小的標準。具體地,可以通過以下方案來實現(xiàn)。
可選地,根據(jù)用戶的指紋尺寸確定預(yù)設(shè)的文字尺寸包括S401-S402:
S401、采集用戶觸摸終端屏幕時的指紋信息;該指紋信息中包括指紋尺寸。
在本發(fā)明實施例中,終端可以根據(jù)用戶的歷史使用情況在用戶曾經(jīng)觸摸終端屏幕時即采集并保存用戶的指紋信息,也可以在預(yù)設(shè)的指紋信息采集模式下采集用戶的指紋信息,并從中獲取指紋的尺寸信息。
S402、從指紋尺寸中提取指紋高度和寬度。
在本發(fā)明實施例中,用戶的指紋尺寸中包括指紋的高度和寬度。在本發(fā)明實施例方案中,指紋高度是指獲取的指紋輪廓中縱向上輪廓線之間的距離最大值;指紋寬度是指獲取的指紋輪廓中橫向上輪廓線之間的距離最大值。由于每次進行指紋識別時獲得的指紋輪廓不可能完全相同,因此可以通過多次采集求平均值的方式獲取一個指紋高度和寬度的平均值作為指紋高度和寬度的標準值。另外,為了使得在拍攝時獲得足夠大的文字大小,可以在多次采集后從中選擇一個最大值作為指紋高度和寬度的標準值。
S403、將指紋高度和寬度確定為預(yù)設(shè)的文字尺寸中的文字高度和寬度。
在本發(fā)明實施例中,獲得了指紋高度和寬度的標準值以后,便可以將該標準的指紋高度和寬度作為確定文字尺寸的標準了。例如,直接將指紋高度和寬度作為預(yù)設(shè)的文字尺寸中的文字高度和寬度,或者將指紋高度和寬度擴大預(yù)設(shè)的比例后作為預(yù)設(shè)的文字尺寸中的文字高度和寬度。例如該預(yù)設(shè)比例可以是1%,5%等。這里該預(yù)設(shè)比例不能設(shè)置的太大,以免文字過大使得照片容納的文字太少。另外,在確定文字大小時,可以不用同時確定出文字大小中的文字高度和寬度,可以根據(jù)用戶的觸摸習慣來確定其中一項即可。例如,用戶習慣手指橫向觸摸,則可以僅確定文字的寬度;用戶習慣手指縱向觸摸,則可以僅確定文字的高度。
通過以上方案,便可以獲取拍攝時文字大小的標準了,根據(jù)該標準對攝像頭進行調(diào)焦便可以獲取適合用戶的文字動態(tài)圖像了。
在本發(fā)明實施例中,在根據(jù)文字大小進行調(diào)焦時,具體可以通過以下方案完成調(diào)焦工作。
可選地,根據(jù)預(yù)設(shè)條件調(diào)整焦距包括S401-S404:
S401、檢測當前焦距下動態(tài)圖像中的文字大小。
在本發(fā)明實施例中,根據(jù)預(yù)設(shè)的文字大小進行調(diào)焦之前,可以先檢測當前焦距下攝像頭獲取的動態(tài)圖像中的文字大小,以判斷該文字大小是否已經(jīng)符合預(yù)設(shè)的標準的文字尺寸,并且便于根據(jù)當前文字大小對動態(tài)圖像進行調(diào)整。在本發(fā)明實施例中,對于當前焦距下動態(tài)圖像中的文字大小的檢測同樣可以通過預(yù)設(shè)的圖像識別裝置進行圖像識別來實現(xiàn)。
S402、將檢測出的文字大小與預(yù)設(shè)的文字尺寸相比較。
在本發(fā)明實施例中,檢測出當前焦距下動態(tài)圖像中的文字大小以后,通過將該文字大小與預(yù)設(shè)的文字尺寸相比較獲取當前焦距下動態(tài)圖像中的文字大小的具體信息,并且針對不同的比較結(jié)果分別進行以下處理。
S403、當檢測出的文字大小與預(yù)設(shè)的文字尺寸一致時保持當前焦距。
在本發(fā)明實施例中,當檢測出的文字大小與預(yù)設(shè)的文字尺寸一致時,即檢測出的文字大小與預(yù)設(shè)的文字尺寸完全相同或差異量小于或等于預(yù)設(shè)的差異量閾值時,既可以將當前焦距作為拍攝焦距。
S404、當檢測出的文字大小與預(yù)設(shè)的文字尺寸不一致時,調(diào)整攝像頭的焦距為第一焦距,令動態(tài)圖像中的文字大小與預(yù)設(shè)的文字尺寸一致。
在本發(fā)明實施例中,當檢測出的文字大小與預(yù)設(shè)的文字尺寸不一致時,即檢測出的文字大小與預(yù)設(shè)的文字尺寸完全不相同,并且差異量大于預(yù)設(shè)的差異量閾值時,則可以對當前焦距進行調(diào)整,使得動態(tài)圖像中的文字大小與預(yù)設(shè)的文字尺寸保持一致,并將調(diào)整后的焦距,即本發(fā)明實施例方案中的第一焦距確定為拍攝焦距。
S303、將包括文字信息的物體中文字部分的中央?yún)^(qū)域作為拍攝焦點并進行拍攝。
在本發(fā)明實施例中,確定攝像頭的焦距以后,為了使得拍攝出的動態(tài)圖像以文字部分為主,可以將包括文字信息的物體中文字部分的中央?yún)^(qū)域作為拍攝焦點。
在本發(fā)明實施例中,通過以上調(diào)整便可以獲得合適的拍攝焦距和焦點了,根據(jù)該焦距和焦點進行拍攝便可以獲得適合用戶的文字圖像了。
可選地,檢測對所拍攝的動態(tài)圖像的觸摸操作并確定觸摸位置;將觸摸位置處對應(yīng)的文字轉(zhuǎn)化為語音進行播放。
在本發(fā)明實施例中,通過以上方案進行動態(tài)圖像拍攝以后,用戶便可以根據(jù)該動態(tài)圖像獲取照片中的文字信息了。
需要說明的是,終端可以通過圖像識別裝置提取動態(tài)圖像中的文字信息,并將提取的文字信息按照動態(tài)圖像中的位置進行排列,最終獲取動態(tài)圖像中文字信息的電子形式。在獲取該文字信息的電子形式以后,可以直接將該電子形式的文字信息轉(zhuǎn)化為語音信息播放出來,也可以在檢測到用戶對終端屏幕上的動態(tài)圖像的觸摸操作后將相應(yīng)的文字轉(zhuǎn)化為語音播放出來。具體地,動態(tài)圖像拍攝完畢后會顯示在終端的界面上,用戶可以對終端界面上的動態(tài)圖像進行觸摸或點擊等操作,終端對該觸摸或點擊操作進行檢測,并確定觸摸或點擊的位置,以便根據(jù)該位置確定其對應(yīng)的文字,如圖7所示。
在本發(fā)明實施例中,可以采用任意可以實施的檢測方法、算法和裝置完成上述的檢測方案,對于具體的檢測方法、算法和裝置不做限制。
在本發(fā)明實施例中,由于對于盲人或弱視人員來說,看不到或看不清屏幕動態(tài)圖像上的具體位置,因此在觸摸時很可能所觸摸的位置并沒有文字。在這種情況下,可以通過以下方案確定觸摸位置處是否存在文字。
可選地,該方法還包括:
在確定觸摸位置之后,將觸摸位置的坐標與動態(tài)圖像中每個文字的坐標相比較,當觸摸位置的坐標與動態(tài)圖像中任意一個文字的坐標一致時,確定觸摸位置與文字相對應(yīng);當觸摸位置的坐標與動態(tài)圖像中每個文字的坐標均不一致時,確定觸摸位置與文字不對應(yīng)。
在本發(fā)明實施例中,由于終端可以對屏幕上顯示的動態(tài)圖像中的文字根據(jù)屏幕左邊分別確定各個文字的坐標。同理,終端還可以確定用戶的觸摸位置的具體坐標,因此,終端可以將用戶觸摸位置的坐標與每個文字坐標相比較,這兩個坐標一致時,說明觸摸位置與文字相對應(yīng),即觸摸位置落在文字上,當這兩個坐標不一致時,說明觸摸位置與文字不對應(yīng),即觸摸位置未落在文字上。需要說明的是,在本發(fā)明實施例方案中,一致是指完全相同或者差異量小于或等于預(yù)設(shè)的差異閾值,不一致是指完全不相同或者差異量大于預(yù)設(shè)的差異閾值。
可選地,該方法還包括S501-S502:
S501、在確定觸摸位置以后,當觸摸位置處沒有對應(yīng)文字時,檢測距離當前觸摸位置最近的第一文字所在的位置。
在本發(fā)明實施例中,在觸摸位置處沒有對應(yīng)文字的情況下,需要終端對用于給予提醒,以便用戶及時進行觸摸位置的調(diào)整。在本發(fā)明實施例方案中,終端可以先檢測出距離當前的觸摸位置最近的文字,并確定出該文字在終端屏幕上的位置,以便用戶指導用戶將手指移動到相應(yīng)的位置,如圖8所示。具體指導方案可以通過下述方案實現(xiàn)。
S502、確定第一文字所在的位置與當前觸摸位置的相對方向。
在本發(fā)明實施例中,當確定出距離當前的觸摸位置最近的文字,如本發(fā)明實施例方案中的第一文字的位置信息以后,如該第一文字在終端屏幕上的坐標,便可以確定出當前觸摸位置與該第一文字的位置的相對方向,例如,十點鐘方向。
S503、控制相應(yīng)方向上的預(yù)設(shè)馬達進行振動。
在本發(fā)明實施例中,可以預(yù)先在終端上設(shè)置多個方向指示馬達,在步驟S502中確定出第一文字與當前觸摸位置的相對方向以后,便可以控制相應(yīng)方向上的預(yù)設(shè)馬達進行振動,以便指引用戶下一步需要調(diào)整的方向。在本發(fā)明實施例方案中,該馬達的具體位置的確定可以是以終端屏幕中心為起點,沿第一文字與當前觸摸位置的相對方向延伸所確定的馬達,如圖8所示。
需要說明的是,在其它實施例中還可以采用其他的指引方案,不限于上述方案。例如,可以通過語音提示的方式給予用戶指引,例如,“請向左移動”、“請向上移動”。在本發(fā)明實施例中,左邊即終端屏幕面向用戶時,橫坐標負方向所指示的方向;左邊即終端屏幕面向用戶時,橫坐標正方向所指示的方向;上邊即終端屏幕面向用戶時,縱坐標正方向所指示的方向;下邊即終端屏幕面向用戶時,縱坐標負方向所指示的方向。
S102、將觸摸位置處對應(yīng)的文字轉(zhuǎn)化為語音進行播放。
在本發(fā)明實施例中,通過以上方案檢測出用戶觸摸處的文字以后,或者指引用戶觸摸到文字以后,便可以將觸摸位置處對應(yīng)的文字轉(zhuǎn)化為語音信息進行播放了。需要說明的是,由于文字信息轉(zhuǎn)化為語音信息已經(jīng)是比較成熟的技術(shù),在此不再贅述,并且對于選擇的轉(zhuǎn)化方法、算法、軟件及裝置等均不作具體限制。
另外,對于動態(tài)圖像中的文字到語音的轉(zhuǎn)化過程可以在獲取文字動態(tài)圖像時直接進行,即在拍攝過程中直接進行,也可以在確定用戶所觸摸的文字以后再進行,具體方式可以根據(jù)用戶的應(yīng)用場景自行定義,在此不作限制。
在本發(fā)明實施例中,在獲取到文字動態(tài)圖像時直接將動態(tài)圖像中的文字信息轉(zhuǎn)化為語音信息時,可以直接對動態(tài)圖像中的文字按照預(yù)設(shè)順序,例如從上到下和/或從左到右的順序進行語音播放,也可以根據(jù)上述方案,在用戶觸摸相應(yīng)的文字時進行語音播放。為了適合兩種播放方式的隨意選擇,可以預(yù)先設(shè)置相應(yīng)的播放模式,例如,選擇播放模式和自動播放模式。在選擇播放模式下,需要檢測用戶的觸摸操作,從而對觸摸位置處對應(yīng)的文字進行播放。在自動播放模式下,還可以自動按照預(yù)設(shè)順序?qū)討B(tài)圖像中的文字進行語音播放。
另外,在上述的選擇播放模式下,為了使得用戶快速了解動態(tài)圖像中的文字內(nèi)容,提高播放效率,還可以采用以下播放方法。
可選地,將觸摸位置處對應(yīng)的文字轉(zhuǎn)化為語音進行播放包括:
當觸摸位置處于一行文字或一列文字所在的直線上時,將一行文字或一列文字轉(zhuǎn)化為語音進行播放。
在本發(fā)明實施例中,當檢測到用戶所觸摸位置對應(yīng)的文字處于一行或一列文字中時,可以直接向用戶播放該行或該列文字所對應(yīng)的內(nèi)容。另外,如果該行文字具有相鄰的一行或多行文字,可以向用戶發(fā)出提醒,例如,語音提醒,提醒用戶是否需要繼續(xù)播放下一行或上一行的文字內(nèi)容。同理,如果該行文字具有相鄰的一列或多列文字,也可以向用戶發(fā)出提醒,提醒用戶是否需要繼續(xù)播放下一列或上一列的文字內(nèi)容。用戶可以采用語音確認方式,或這預(yù)設(shè)的操作確認方式對該提醒進行反饋。終端根據(jù)反饋結(jié)果播放下一行或下一列文字內(nèi)容,或者停止播放。
在本發(fā)明實施例中,在終端對一行或一列的文字進行識別之前,需要終端預(yù)先對一行或一列的概念進行定義,以便終端根據(jù)該預(yù)先定義去確認是否存在一行或一列文字。具體可以通過以下方案實現(xiàn)。
可選地,該方法還包括:
將與縱向上相鄰的文字均保持預(yù)設(shè)的第一間距,并且在橫向上處于相同的直線上的多個文字作為一行文字。
將與橫向上相鄰的文字均保持預(yù)設(shè)的第二間距,并且在縱向上處于相同的直線上的多個文字作為一行文字。
在本發(fā)明實施例中,終端可以對動態(tài)圖像中的每個文字與相鄰文字的距離進行檢測,并且可以確定每一個文字的坐標,根據(jù)每個文字的坐標值確定哪些文字在一條直線上。因此,基于上述終端功能,并且根據(jù)行與列的概念,便可以確定出一行文字即與縱向上相鄰的文字均保持預(yù)設(shè)的第一間距,并且在橫向上處于相同的直線上的多個文字;一列文字即與橫向上相鄰的文字均保持預(yù)設(shè)的第二間距,并且在縱向上處于相同的直線上的多個文字。
在本發(fā)明實施例中,對于上述方案中的第一間距和第二間距的具體數(shù)值不做限制。該第一間距和第二間距可以根據(jù)不同的應(yīng)用場景為不同的數(shù)值。
至此,便介紹完了本發(fā)明實施例的全部基本特征,需要說明的是,上述內(nèi)容均是本發(fā)明實施例方案的一個或多個具體實施方式,在其它實施例中還可以采用其他的實施方式,任何與本發(fā)明實施例相同或相似的實施方式,以及本發(fā)明實施例的基本特征的任意組合,均在本發(fā)明實施例的保護范圍之內(nèi)。
本發(fā)明提出了一種文字拾取裝置和方法,該裝置包括:拍攝模塊和播放模塊。拍攝模塊在預(yù)設(shè)的文字拾取模式下,對自身所在終端的攝像頭前的物體進行拍攝。播放模塊將所拍攝的動態(tài)圖像中的文字轉(zhuǎn)化為語音進行播放。通過本發(fā)明實施例方案,能夠通過終端了解文字內(nèi)容,解決了盲人或弱視人員因視力問題帶來的無法閱讀的困擾。
需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。
上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。
通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實施例方法可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可以通過硬件,但很多情況下前者是更佳的實施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺終端設(shè)備(可以是手機,計算機,服務(wù)器,空調(diào)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述的方法。
以上僅為本發(fā)明的優(yōu)選實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護范圍內(nèi)。