本發(fā)明涉及通信領(lǐng)域,更具體地說,涉及一種移動終端及語音轉(zhuǎn)換方法。
背景技術(shù):
隨著帶有社交軟件的普及,越來越多的用戶通過社交軟件進(jìn)行語音聊天,在語言聊天的過程中,使用的語音可能是方言、普通話、外語等各種語言,方便人們實(shí)時進(jìn)行移動通訊的同時,語音數(shù)據(jù)同時也提供了豐富的數(shù)據(jù)資料,可以作為研究材料提供豐富的信息,但是,由于講話者使用的語音習(xí)慣多種多樣,現(xiàn)有的技術(shù)還不能將講話者的語音轉(zhuǎn)換成對應(yīng)的文字內(nèi)容。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種移動終端,能將講話者語言轉(zhuǎn)換成對應(yīng)的文字信息,生成與講話者語言對應(yīng)的完整的文字內(nèi)容,方便用戶查閱。所述移動終端包括分析模塊、轉(zhuǎn)換模塊。
分析模塊,用于獲取講話者語音,并根據(jù)所述講話者語音分析出所述講話者的語言習(xí)慣,根據(jù)所述語言習(xí)慣判斷所述講話者語音的語言種類。
轉(zhuǎn)換模塊,用于根據(jù)所述判斷出的語言種類對所述講話者語音進(jìn)行語音識別,將所述講話者語音轉(zhuǎn)換成文字內(nèi)容。
進(jìn)一步地,所述分析模塊包括方言識別模塊,所述方言識別模塊用于根據(jù)方言習(xí)慣對所述講話者語音進(jìn)行識別,判斷所述講話者語音的方言種類;及
所述轉(zhuǎn)換模塊,還用于根據(jù)判斷出的方言種類進(jìn)行語音識別,將所述講話者語音轉(zhuǎn)換成文字內(nèi)容。
進(jìn)一步地,所述分析模塊還包括外語識別模塊,所述外語識別模塊用于根據(jù)外語習(xí)慣對所述講話者語音進(jìn)行識別,判斷所述講話者語音的外語種類;及
所述轉(zhuǎn)換模塊,還用于根據(jù)判斷出的外語種類進(jìn)行語音識別,將所述講話者語音轉(zhuǎn)換成文字內(nèi)容。
進(jìn)一步地,所述移動終端還包括:
整合模塊,用于按照時間順序?qū)⑺鲋v話者的所有語音整合成完整的語音資料,并按照時間順序?qū)⑺鲅葜v者的所有語音對應(yīng)的文字內(nèi)容整合成完整的文字資料。
進(jìn)一步地,所述移動終端還包括:
顯示模塊,用于將所述完整的文字資料顯示出來;及
播放模塊,用于將所述完整的語音資料播放出來。
本發(fā)明提供的移動終端通過分析講話者的語言習(xí)慣分析出講話者語音的語言種類,根據(jù)語音種類進(jìn)行有針對性的識別處理,根據(jù)方言種類識別講話者語音的方言內(nèi)容,根據(jù)外語種類識別講話者語音的外語內(nèi)容,并將識別出來的內(nèi)容轉(zhuǎn)換成文字內(nèi)容,能生成與講話者語言對應(yīng)的完整的文字內(nèi)容,提供豐富的文字信息,方便用戶查閱,有利于用戶后續(xù)進(jìn)行相關(guān)的編輯處理。
本發(fā)明還提供一種語音轉(zhuǎn)換方法,能將講話者語言轉(zhuǎn)換成對應(yīng)的文字信息,生成與講話者語言對應(yīng)的完整的文字內(nèi)容,方便用戶查閱。所述語音轉(zhuǎn)換方法包括:
獲取講話者語音,并根據(jù)所述講話者語音分析出所述講話者的語言習(xí)慣,根據(jù)所述語言習(xí)慣判斷所述講話者語音的語言種類;及
根據(jù)所述判斷出的語言種類對所述講話者語音進(jìn)行語音識別,將所述講話者語音轉(zhuǎn)換成文字內(nèi)容。
進(jìn)一步地,所述語音轉(zhuǎn)換方法還包括:
根據(jù)方言習(xí)慣對所述講話者語音進(jìn)行識別,判斷所述講話者語音的方言種類;及
根據(jù)判斷出的方言種類進(jìn)行語音識別,將所述講話者語音轉(zhuǎn)換成文字內(nèi)容。
進(jìn)一步地,所述語音轉(zhuǎn)換方法還包括:
根據(jù)外語習(xí)慣對所述講話者語音進(jìn)行識別,判斷所述講話者語音的外語種類;及
根據(jù)判斷出的外語種類進(jìn)行語音識別,將所述講話者語音轉(zhuǎn)換成文字內(nèi)容。
進(jìn)一步地,所述語音轉(zhuǎn)換方法還包括:
按照時間順序?qū)⑺鲋v話者的所有語音整合成完整的語音資料;及
按照時間順序?qū)⑺鲅葜v者的所有語音對應(yīng)的文字內(nèi)容整合成完整的文字資料。
進(jìn)一步地,所述語音轉(zhuǎn)換方法還包括:
將所述完整的文字資料顯示出來;及
將所述完整的語音資料播放出來。
本發(fā)明提供的語音轉(zhuǎn)換方法通過分析講話者的語言習(xí)慣分析出講話者語音的語言種類,根據(jù)語音種類進(jìn)行有針對性的識別處理,根據(jù)方言種類識別講話者語音的方言內(nèi)容,根據(jù)外語種類識別講話者語音的外語內(nèi)容,并將識別出來的內(nèi)容轉(zhuǎn)換成文字內(nèi)容,能生成與講話者語言對應(yīng)的完整的文字內(nèi)容,提供豐富的文字信息,方便用戶查閱,有利于用戶后續(xù)進(jìn)行相關(guān)的編輯處理。
附圖說明
圖1為實(shí)現(xiàn)本發(fā)明各個實(shí)施例的移動終端的硬件結(jié)構(gòu)示意圖;
圖2為如圖1所示的移動終端的無線通信系統(tǒng)示意圖;
圖3是本發(fā)明實(shí)施例一移動終端的功能模塊圖;
圖4是本發(fā)明實(shí)施例二移動終端的功能模塊圖;
圖5是本發(fā)明實(shí)施例三移動終端的語音轉(zhuǎn)換示意圖;
圖6是本發(fā)明實(shí)施例四語音轉(zhuǎn)換方法的流程圖;
圖7是本發(fā)明實(shí)施例五語音轉(zhuǎn)換方法的流程圖。
本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明。
具體實(shí)施方式
應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
現(xiàn)在將參考附圖描述實(shí)現(xiàn)本發(fā)明各個實(shí)施例的移動終端。在后續(xù)的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發(fā)明的說明,其本身并沒有特定的意義。因此,"模塊"與"部件"可以混合地使用。
移動終端可以以各種形式來實(shí)施。例如,本發(fā)明中描述的終端可以包括諸如移動電話、智能電話、筆記本電腦、數(shù)字廣播接收器、PDA(個人數(shù)字助理)、PAD(平板電腦)、PMP(便攜式多媒體播放器)、導(dǎo)航裝置等等的移動終端以及諸如數(shù)字TV、臺式計算機(jī)等等的固定終端。下面,假設(shè)終端是移動終端。然而,本領(lǐng)域技術(shù)人員將理解的是,除了特別用于移動目的的元件之外,根據(jù)本發(fā)明的實(shí)施方式的構(gòu)造也能夠應(yīng)用于固定類型的終端。
圖1為實(shí)現(xiàn)本發(fā)明各個實(shí)施例的移動終端的硬件結(jié)構(gòu)示意圖。
移動終端10可以包括,但不限于,存儲器20、控制器30、無線通信單元40、輸入單元50、輸入單元60、攝像頭70、麥克風(fēng)71、接口單元80及電源單元90。圖1示出了具有各種組件的移動終端10,但是應(yīng)當(dāng)理解的是,并不要求實(shí)施所有示出的組件。可以替代地實(shí)施更多或更少的組件。將在下面詳細(xì)描述移動終端10的元件。
無線通信單元40通常包括一個或多個組件,其允許移動終端10與無線通信系統(tǒng)或網(wǎng)絡(luò)之間的無線點(diǎn)通信。例如,無線通信單元可以包括廣播接收模塊、移動通信模塊、無線互聯(lián)網(wǎng)模塊、短程通信模塊和位置信息模塊中的至少一個。
廣播接收模塊經(jīng)由廣播信道從外部廣播管理服務(wù)器接收廣播信號和/或廣播相關(guān)信息。廣播信道可以包括衛(wèi)星信道和/或地面信道。廣播管理服務(wù)器可以是生成并發(fā)送廣播信號和/或廣播相關(guān)信息的服務(wù)器或者接收之前生成的廣播信號和/或廣播相關(guān)信息并且將其發(fā)送給終端的服務(wù)器。廣播信號可以包括TV廣播信號、無線電廣播信號、數(shù)據(jù)廣播信號等等。而且,廣播信號可以進(jìn)一步包括與TV或無線電廣播信號組合的廣播信號。廣播相關(guān)信息也可以經(jīng)由移動通信網(wǎng)絡(luò)提供,并且在該情況下,廣播相關(guān)信息可以由移動通信模塊來接收。廣播信號可以以各種形式存在,例如,其可以以數(shù)字多媒體廣播(DMB)的電子節(jié)目指南(EPG)、數(shù)字視頻廣播手持(DVB-H)的電子服務(wù)指南(ESG)等等的形式而存在。廣播接收模塊可以通過使用各種類型的廣播系統(tǒng)接收信號廣播。特別地,廣播接收模塊可以通過使用諸如多媒體廣播-地面(DMB-T)、數(shù)字多媒體廣播-衛(wèi)星(DMB-S)、數(shù)字視頻廣播-手持(DVB-H),前向鏈路媒體(MediaFLO@)的數(shù)據(jù)廣播系統(tǒng)、地面數(shù)字廣播綜合服務(wù)(ISDB-T)等等的數(shù)字廣播系統(tǒng)接收數(shù)字廣播。廣播接收模塊可以被構(gòu)造為適合提供廣播信號的各種廣播系統(tǒng)以及上述數(shù)字廣播系統(tǒng)。經(jīng)由廣播接收模塊接收的廣播信號和/或廣播相關(guān)信息可以存儲在存儲器20(或者其它類型的存儲介質(zhì))中。
移動通信模塊將無線電信號發(fā)送到基站(例如,接入點(diǎn)、節(jié)點(diǎn)B等等)、外部終端以及服務(wù)器中的至少一個和/或從其接收無線電信號。這樣的無線電信號可以包括語言通話信號、視頻通話信號、或者根據(jù)文本和/或多媒體消息發(fā)送和/或接收的各種類型的數(shù)據(jù)。
無線互聯(lián)網(wǎng)模塊支持移動終端的無線互聯(lián)網(wǎng)接入。該模塊可以內(nèi)部或外部地耦接到終端。該模塊所涉及的無線互聯(lián)網(wǎng)接入技術(shù)可以包括WLAN(無線LAN)(Wi-Fi)、Wibro(無線寬帶)、Wimax(全球微波互聯(lián)接入)、HSDPA(高速下行鏈路分組接入)等等。
短程通信模塊是用于支持短程通信的模塊。短程通信技術(shù)的一些示例包括藍(lán)牙TM、射頻識別(RFID)、紅外數(shù)據(jù)協(xié)會(IrDA)、超寬帶(UWB)、紫蜂TM等等。
位置信息模塊是用于檢查或獲取移動終端的位置信息的模塊。位置信息模塊的典型示例是GPS(全球定位系統(tǒng))。根據(jù)當(dāng)前的技術(shù),GPS模塊計算來自三個或更多衛(wèi)星的距離信息和準(zhǔn)確的時間信息并且對于計算的信息應(yīng)用三角測量法,從而根據(jù)經(jīng)度、緯度和高度準(zhǔn)確地計算三維當(dāng)前位置信息。當(dāng)前,用于計算位置和時間信息的方法使用三顆衛(wèi)星并且通過使用另外的一顆衛(wèi)星校正計算出的位置和時間信息的誤差。此外,GPS模塊能夠通過實(shí)時地連續(xù)計算當(dāng)前位置信息來計算速度信息。
輸出單元50被構(gòu)造為以視覺、音頻和/或觸覺方式提供輸出信號(例如,音頻信號、視頻信號、警報信號、振動信號等等)。輸出單元50可以包括顯示單元51、音頻輸出模塊52、警報單元53等等。
顯示單元51可以顯示在移動終端10中處理的信息。例如,當(dāng)移動終端10處于電話通話模式時,顯示單元51可以顯示與通話或其它通信(例如,文本消息收發(fā)、多媒體文件下載等等)相關(guān)的用戶界面(UI)或圖形用戶界面(GUI)。當(dāng)移動終端10處于視頻通話模式或者圖像捕獲模式時,顯示單元51可以顯示捕獲的圖像和/或接收的圖像、示出視頻或圖像以及相關(guān)功能的UI或GUI等等。
同時,當(dāng)顯示單元51和觸摸板以層的形式彼此疊加以形成觸摸屏?xí)r,顯示單元51可以用作輸入裝置和輸出裝置。顯示單元51可以包括液晶顯示器(LCD)、薄膜晶體管LCD(TFT-LCD)、有機(jī)發(fā)光二極管(OLED)顯示器、柔性顯示器、三維(3D)顯示器等等中的至少一種。這些顯示器中的一些可以被構(gòu)造為透明狀以允許用戶從外部觀看,這可以稱為透明顯示器,典型的透明顯示器可以例如為TOLED(透明有機(jī)發(fā)光二極管)顯示器等等。根據(jù)特定想要的實(shí)施方式,移動終端10可以包括兩個或更多顯示單元(或其它顯示裝置),例如,移動終端可以包括外部顯示單元(未示出)和內(nèi)部顯示單元(未示出)。觸摸屏可用于檢測觸摸輸入壓力以及觸摸輸入位置和觸摸輸入面積。
音頻輸出模塊52可以在移動終端處于呼叫信號接收模式、通話模式、記錄模式、語言識別模式、廣播接收模式等等模式下時,將無線通信單元40接收的或者在存儲器20中存儲的音頻數(shù)據(jù)轉(zhuǎn)換音頻信號并且輸出為聲音。而且,音頻輸出模塊52可以提供與移動終端10執(zhí)行的特定功能相關(guān)的音頻輸出(例如,呼叫信號接收聲音、消息接收聲音等等)。音頻輸出模塊52可以包括揚(yáng)聲器、蜂鳴器等等。
警報單元53可以提供輸出以將事件的發(fā)生通知給移動終端10。典型的事件可以包括呼叫接收、消息接收、鍵信號輸入、觸摸輸入等等。除了音頻或視頻輸出之外,警報單元53可以以不同的方式提供輸出以通知事件的發(fā)生。例如,警報單元53可以以振動的形式提供輸出,當(dāng)接收到呼叫、消息或一些其它進(jìn)入通信(incoming communication)時,警報單元53可以提供觸覺輸出(即,振動)以將其通知給用戶。通過提供這樣的觸覺輸出,即使在用戶的移動電話處于用戶的口袋中時,用戶也能夠識別出各種事件的發(fā)生。警報單元53也可以經(jīng)由顯示單元51或音頻輸出模塊52提供通知事件的發(fā)生的輸出。
輸入單元60可以根據(jù)用戶輸入的命令生成鍵輸入數(shù)據(jù)以控制移動終端的各種操作。輸入單元60允許用戶輸入各種類型的信息,并且可以包括鍵盤、鍋?zhàn)衅?、觸摸板(例如,檢測由于被接觸而導(dǎo)致的電阻、壓力、電容等等的變化的觸敏組件)、滾輪、搖桿等等。特別地,當(dāng)觸摸板以層的形式疊加在顯示單元50上時,可以形成觸摸屏。在本發(fā)明的實(shí)施例中,所述輸入單元60包括觸控屏及水墨屏。攝像頭70用于拍攝圖像資料,麥克風(fēng)71用于錄取音頻資料。
接口單元80用作至少一個外部裝置與移動終端10連接可以通過的接口。例如,外部裝置可以包括有線或無線頭戴式耳機(jī)端口、外部電源(或電池充電器)端口、有線或無線數(shù)據(jù)端口、存儲卡端口、用于連接具有識別模塊的裝置的端口、音頻輸入/輸出(I/O)端口、視頻I/O端口、耳機(jī)端口等等。識別模塊可以是存儲用于驗(yàn)證用戶使用移動終端10的各種信息并且可以包括用戶識別模塊(UIM)、客戶識別模塊(SIM)、通用客戶識別模塊(USIM)等等。另外,具有識別模塊的裝置(下面稱為"識別裝置")可以采取智能卡的形式,因此,識別裝置可以經(jīng)由端口或其它連接裝置與移動終端10連接。接口單元80可以用于接收來自外部裝置的輸入(例如,數(shù)據(jù)信息、電力等等)并且將接收到的輸入傳輸?shù)揭苿咏K端10內(nèi)的一個或多個元件或者可以用于在移動終端和外部裝置之間傳輸數(shù)據(jù)。
另外,當(dāng)移動終端10與外部底座連接時,接口單元80可以用作允許通過其將電力從底座提供到移動終端10的路徑或者可以用作允許從底座輸入的各種命令信號通過其傳輸?shù)揭苿咏K端的路徑。從底座輸入的各種命令信號或電力可以用作用于識別移動終端是否準(zhǔn)確地安裝在底座上的信號。
存儲器20可以存儲由控制器30執(zhí)行的處理和控制操作的軟件程序等等,或者可以暫時地存儲己經(jīng)輸出或?qū)⒁敵龅臄?shù)據(jù)(例如,電話簿、消息、靜態(tài)圖像、視頻等等)。而且,存儲器20可以存儲關(guān)于當(dāng)觸摸施加到觸摸屏?xí)r輸出的各種方式的振動和音頻信號的數(shù)據(jù)。
存儲器20可以包括至少一種類型的存儲介質(zhì),所述存儲介質(zhì)包括閃存、硬盤、多媒體卡、卡型存儲器(例如,SD或DX存儲器等等)、隨機(jī)訪問存儲器(RAM)、靜態(tài)隨機(jī)訪問存儲器(SRAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、可編程只讀存儲器(PROM)、磁性存儲器、磁盤、光盤等等。而且,移動終端10可以與通過網(wǎng)絡(luò)連接執(zhí)行存儲器20的存儲功能的網(wǎng)絡(luò)存儲裝置協(xié)作。
控制器30通??刂埔苿咏K端的總體操作。例如,控制器30執(zhí)行與語言通話、數(shù)據(jù)通信、視頻通話等等相關(guān)的控制和處理。另外,控制器30可以包括用于再現(xiàn)(或回放)多媒體數(shù)據(jù)的多媒體模塊,多媒體模塊可以構(gòu)造在控制器30內(nèi),或者可以構(gòu)造為與控制器30分離。控制器30可以執(zhí)行模式識別處理,以將在觸摸屏上執(zhí)行的手寫輸入或者圖片繪制輸入識別為字符或圖像。
電源單元90在控制器30的控制下接收外部電力或內(nèi)部電力并且提供操作各元件和組件所需的適當(dāng)?shù)碾娏Α?/p>
這里描述的各種實(shí)施方式可以以使用例如計算機(jī)軟件、硬件或其任何組合的計算機(jī)可讀介質(zhì)來實(shí)施。對于硬件實(shí)施,這里描述的實(shí)施方式可以通過使用特定用途集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理裝置(DSPD)、可編程邏輯裝置(PLD)、現(xiàn)場可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、被設(shè)計為執(zhí)行這里描述的功能的電子單元中的至少一種來實(shí)施,在一些情況下,這樣的實(shí)施方式可以在控制器180中實(shí)施。對于軟件實(shí)施,諸如過程或功能的實(shí)施方式可以與允許執(zhí)行至少一種功能或操作的單獨(dú)的軟件模塊來實(shí)施。軟件代碼可以由以任何適當(dāng)?shù)木幊陶Z言編寫的軟件應(yīng)用程序(或程序)來實(shí)施,軟件代碼可以存儲在存儲器160中并且由控制器180執(zhí)行。
至此,己經(jīng)按照其功能描述了移動終端。下面,為了簡要起見,將描述諸如折疊型、直板型、擺動型、滑動型移動終端等等的各種類型的移動終端中的滑動型移動終端作為示例。因此,本發(fā)明能夠應(yīng)用于任何類型的移動終端,并且不限于滑動型移動終端。
如圖1中所示的移動終端10可以被構(gòu)造為利用經(jīng)由幀或分組發(fā)送數(shù)據(jù)的諸如有線和無線通信系統(tǒng)以及基于衛(wèi)星的通信系統(tǒng)來操作。
現(xiàn)在將參考圖2描述其中根據(jù)本發(fā)明的移動終端能夠操作的通信系統(tǒng)。
這樣的通信系統(tǒng)可以使用不同的空中接口和/或物理層。例如,由通信系統(tǒng)使用的空中接口包括例如頻分多址(FDMA)、時分多址(TDMA)、碼分多址(CDMA)和通用移動通信系統(tǒng)(UMTS)(特別地,長期演進(jìn)(LTE))、全球移動通信系統(tǒng)(GSM)等等。作為非限制性示例,下面的描述涉及CDMA通信系統(tǒng),但是這樣的教導(dǎo)同樣適用于其它類型的系統(tǒng)。
參考圖2,CDMA無線通信系統(tǒng)可以包括多個移動終端10、多個基站(BS)270、基站控制器(BSC)275和移動交換中心(MSC)280。MSC280被構(gòu)造為與公共電話交換網(wǎng)絡(luò)(PSTN)290形成接口。MSC280還被構(gòu)造為與可以經(jīng)由回程線路耦接到基站270的BSC275形成接口?;爻叹€路可以根據(jù)若干己知的接口中的任一種來構(gòu)造,所述接口包括例如E1/T1、ATM,IP、PPP、幀中繼、HDSL、ADSL或xDSL。將理解的是,如圖2中所示的系統(tǒng)可以包括多個BSC2750。
每個BS270可以服務(wù)一個或多個分區(qū)(或區(qū)域),由多向天線或指向特定方向的天線覆蓋的每個分區(qū)放射狀地遠(yuǎn)離BS270?;蛘撸總€分區(qū)可以由用于分集接收的兩個或更多天線覆蓋。每個BS270可以被構(gòu)造為支持多個頻率分配,并且每個頻率分配具有特定頻譜(例如,1.25MHz,5MHz等等)。
分區(qū)與頻率分配的交叉可以被稱為CDMA信道。BS270也可以被稱為基站收發(fā)器子系統(tǒng)(BTS)或者其它等效術(shù)語。在這樣的情況下,術(shù)語"基站"可以用于籠統(tǒng)地表示單個BSC275和至少一個BS270?;疽部梢员环Q為"蜂窩站"?;蛘?,特定BS270的各分區(qū)可以被稱為多個蜂窩站。
如圖2中所示,廣播發(fā)射器(BT)295將廣播信號發(fā)送給在系統(tǒng)內(nèi)操作的移動終端10。如圖1中所示的廣播接收模塊111被設(shè)置在移動終端10處以接收由BT295發(fā)送的廣播信號。在圖2中,示出了幾個全球定位系統(tǒng)(GPS)衛(wèi)星300。衛(wèi)星300幫助定位多個移動終端10中的至少一個。
在圖2中,描繪了多個衛(wèi)星300,但是理解的是,可以利用任何數(shù)目的衛(wèi)星獲得有用的定位信息。如圖1中所示的GPS模塊115通常被構(gòu)造為與衛(wèi)星300配合以獲得想要的定位信息。替代GPS跟蹤技術(shù)或者在GPS跟蹤技術(shù)之外,可以使用可以跟蹤移動終端的位置的其它技術(shù)。另外,至少一個GPS衛(wèi)星300可以選擇性地或者額外地處理衛(wèi)星DMB傳輸。
作為無線通信系統(tǒng)的一個典型操作,BS270接收來自各種移動終端10的反向鏈路信號。移動終端10通常參與通話、消息收發(fā)和其它類型的通信。特定基站270接收的每個反向鏈路信號被在特定BS270內(nèi)進(jìn)行處理。獲得的數(shù)據(jù)被轉(zhuǎn)發(fā)給相關(guān)的BSC275。BSC提供通話資源分配和包括BS270之間的軟切換過程的協(xié)調(diào)的移動管理功能。BSC275還將接收到的數(shù)據(jù)路由到MSC280,其提供用于與PSTN290形成接口的額外的路由服務(wù)。類似地,PSTN290與MSC280形成接口,MSC與BSC275形成接口,并且BSC275相應(yīng)地控制BS270以將正向鏈路信號發(fā)送到移動終端10。
基于上述移動終端硬件結(jié)構(gòu)以及通信系統(tǒng),提出本發(fā)明方法各個實(shí)施例。
請參閱圖3,圖3是本發(fā)明實(shí)施例一移動終端的功能模塊圖。圖3所示的移動終端10包括:分析模塊101、轉(zhuǎn)換模塊103。下面對各個功能模塊進(jìn)行詳細(xì)的說明。分析模塊101獲取講話者語音,并根據(jù)講話者語音分析出講話者的語言習(xí)慣,根據(jù)語言習(xí)慣判斷講話者語音的語言種類,其中,獲取講話者語音可以通過移動終端的麥克風(fēng)錄音、也可以通過網(wǎng)絡(luò)獲取講話者語音,語言習(xí)慣包括講話者的個人習(xí)慣、方言習(xí)慣、外語習(xí)慣,個人習(xí)慣包括講話者經(jīng)常使用的感嘆詞、語氣助詞。轉(zhuǎn)換模塊103根據(jù)判斷出的語言種類對講話者語音進(jìn)行語音識別,將講話者語音轉(zhuǎn)換成文字內(nèi)容。
本實(shí)施例提供的移動終端通過分析講話者的語言習(xí)慣分析出講話者語音的語言種類,根據(jù)語音種類進(jìn)行有針對性的識別處理,并將識別出來的內(nèi)容轉(zhuǎn)換成文字內(nèi)容,能生成與講話者語言對應(yīng)的完整的文字內(nèi)容,提供豐富的文字信息,方便用戶查閱,有利于用戶后續(xù)進(jìn)行相關(guān)的編輯處理。
請參閱圖4,圖4是本發(fā)明實(shí)施例二移動終端的功能模塊圖。圖4所示的移動終端10包括:分析模塊101、轉(zhuǎn)換模塊103、整合模塊109、文字顯示模塊111、播放模塊113,分析模塊101包括方言識別模塊105、外語識別模塊107。下面對各個功能模塊進(jìn)行詳細(xì)的說明。
分析模塊101獲取講話者語音,并根據(jù)講話者語音分析出講話者的語言習(xí)慣,根據(jù)語言習(xí)慣判斷講話者語音的語言種類,其中,獲取講話者語音可以通過移動終端的麥克風(fēng)錄音、也可以通過網(wǎng)絡(luò)下載講話者語音。轉(zhuǎn)換模塊103根據(jù)判斷出的語言種類對講話者語音進(jìn)行語音識別,將講話者語音轉(zhuǎn)換成文字內(nèi)容。
進(jìn)一步說明的是,演講者語音有多種類型,可以是方言、外語、普通話,其中,方言包括中國各地的方言,例如東北話、四川話、湖南話、廣東話等,外語包括英語、法語、德語、俄語等語言種類。移動終端10獲取講話者語音后,方言識別模塊105根據(jù)方言習(xí)慣對講話者語音進(jìn)行識別,判斷講話者語音的方言種類。轉(zhuǎn)換模塊103根據(jù)判斷出的方言種類進(jìn)行語音識別,將講話者語音轉(zhuǎn)換成文字內(nèi)容。移動終端10獲取講話者語音后,外語識別模塊107根據(jù)外語習(xí)慣對講話者語音進(jìn)行識別,判斷講話者語音的外語種類。轉(zhuǎn)換模塊103根據(jù)判斷出的外語種類進(jìn)行語音識別,將講話者語音轉(zhuǎn)換成文字內(nèi)容。
當(dāng)演講者語言是多個簡短的語音時,整合模塊109按照時間順序?qū)⒅v話者的所有語音整合成完整的語音資料,并按照時間順序?qū)⒀葜v者的所有語音對應(yīng)的文字內(nèi)容整合成完整的文字資料。在獲得完整的語音資料后,顯示模塊111將完整的文字資料顯示出來,便于用戶查閱,其中,顯示模塊111包括顯示屏、觸摸屏,顯示屏包括TFT液晶顯示屏、UFB液晶顯示屏、STN屏幕、有源矩陣有機(jī)發(fā)光二極體面板,觸摸屏包括電容式觸摸屏紅外線式觸摸屏、表面面波觸摸屏、MTK觸摸屏,觸摸屏接收觸摸信號控制是否顯示完整的文字內(nèi)容。播放模塊113將完整的語音資料播放出來,便于用戶能流暢的聽完所有語音資料,其中,播放模塊113還對完整的語音資料進(jìn)行去噪處理,對演講者的完整語音資料的流暢性進(jìn)行調(diào)節(jié),根據(jù)當(dāng)前的播放場景調(diào)節(jié)合適的播放音量,當(dāng)接收到播放演講者的完整語音的控制信號后,播放模塊113將處理后的語音播放出來。
本實(shí)施例提供的移動終端通過分析講話者的語言習(xí)慣分析出講話者語音的語言種類,根據(jù)語音種類進(jìn)行有針對性的識別處理,根據(jù)方言種類識別講話者語音的方言內(nèi)容,根據(jù)外語種類識別講話者語音的外語內(nèi)容,并將識別出來的內(nèi)容轉(zhuǎn)換成文字內(nèi)容,能生成與講話者語言對應(yīng)的完整的文字內(nèi)容,提供豐富的文字信息,方便用戶查閱,有利于用戶后續(xù)進(jìn)行相關(guān)的編輯處理。
參閱圖5,圖5是本發(fā)明實(shí)施例三移動終端的語音轉(zhuǎn)換示意圖。在本實(shí)施例的語音轉(zhuǎn)換示意圖中,左邊所示的移動終端10的分析模塊101獲取講話者語音,講話者語音包括A講話者的第一語音、A講話者的第三語音、B講話者的第二語音、B講話者的第四語音,根據(jù)A、B講話者語音分析出A、B講話者的語言習(xí)慣,根據(jù)A、B講話者的語言習(xí)慣分別判斷A、B講話者語音的語言種類,其中,獲取A、B講話者語音可以通過移動終端的麥克風(fēng)錄音、也可以通過網(wǎng)絡(luò)下載講話者語音。轉(zhuǎn)換模塊103根據(jù)判斷出的語言種類對A、B講話者語音進(jìn)行語音識別,將A、B講話者語音轉(zhuǎn)換成文字內(nèi)容。
進(jìn)一步說明的是,演講者語音有多種類型,可以是方言、外語、普通話等,其中,方言包括中國各地的方言,例如東北話、四川話、湖南話等,外語包括英語、法語、德語、俄語等語言種類。移動終端10獲取講話者語音后,方言識別模塊105根據(jù)方言習(xí)慣對A、B講話者語音進(jìn)行識別,判斷A、B講話者語音的方言種類。轉(zhuǎn)換模塊103根據(jù)判斷出的方言種類進(jìn)行語音識別,將A、B講話者語音轉(zhuǎn)換成文字內(nèi)容。移動終端10獲取A、B講話者語音后,外語識別模塊107根據(jù)外語習(xí)慣對A、B講話者語音進(jìn)行識別,判斷A、B講話者語音的外語種類。轉(zhuǎn)換模塊103根據(jù)判斷出的外語種類進(jìn)行語音識別,將A、B講話者語音轉(zhuǎn)換成文字內(nèi)容。
整合模塊109按照時間順序?qū)講話者的第一語音、第三語音整合成完整的語音資料,并按照時間順序?qū)⒀葜v者的所有語音對應(yīng)的文字內(nèi)容整合成完整的文字資料,文字資料包括第一文字內(nèi)容、第三文字內(nèi)容,其中第一文字內(nèi)容與第一語音的內(nèi)容相對應(yīng),第三文字內(nèi)容與第三語音的內(nèi)容相對應(yīng)。同樣地,整合模塊109按照時間順序?qū)講話者的第二語音、第四語音整合成完整的語音資料,并按照時間順序?qū)演講者的所有語音對應(yīng)的文字內(nèi)容整合成完整的文字資料,文字資料包括第二文字內(nèi)容、第四文字內(nèi)容,其中第二文字內(nèi)容與第二語音的內(nèi)容相對應(yīng),第四文字內(nèi)容與第四語音的內(nèi)容相對應(yīng),即在圖5中右圖所示的內(nèi)容。
在獲得完整的語音資料后,顯示模塊111將A講話者、B講話者的完整的文字資料顯示出來,便于用戶查閱,其中,顯示模塊111包括顯示屏、觸摸屏,顯示屏包括TFT液晶顯示屏、UFB液晶顯示屏、STN屏幕、有源矩陣有機(jī)發(fā)光二極體面板,觸摸屏可為電容式觸摸屏紅外線式觸摸屏、表面面波觸摸屏、MTK觸摸屏,觸摸屏接收觸摸信號控制是否顯示完整的文字內(nèi)容。播放模塊113將完整的語音資料播放出來,便于用戶能流暢的聽完所有語音資料,其中,播放模塊113還對完整的語音資料進(jìn)行去噪處理,對演講者的完整語音資料的流暢性進(jìn)行調(diào)節(jié),根據(jù)當(dāng)前的播放場景調(diào)節(jié)合適的播放音量,當(dāng)接收到播放演講者的完整語音的控制信號后,播放模塊113將處理后的語音播放出來。
本發(fā)明提供的移動終端通過分析講話者的語言習(xí)慣分析出講話者語音的語言種類,根據(jù)語音種類進(jìn)行有針對性的識別處理,根據(jù)方言種類識別講話者語音的方言內(nèi)容,根據(jù)外語種類識別講話者語音的外語內(nèi)容,并將識別出來的內(nèi)容轉(zhuǎn)換成文字內(nèi)容,能生成與講話者語言對應(yīng)的完整的文字內(nèi)容,提供豐富的文字信息,方便用戶查閱,有利于用戶后續(xù)進(jìn)行相關(guān)的編輯處理。
本發(fā)明還提供一種語音轉(zhuǎn)換方法,該方法應(yīng)用圖3或圖4所示的移動終端10,下面對本實(shí)施例的語音轉(zhuǎn)換方法進(jìn)行詳細(xì)介紹。
參閱圖6,圖6是本發(fā)明實(shí)施例四語音轉(zhuǎn)換方法的流程圖。
在步驟S601中,分析模塊101獲取講話者語音,并根據(jù)講話者語音分析出講話者的語言習(xí)慣,根據(jù)語言習(xí)慣判斷講話者語音的語言種類,其中,獲取講話者語音可以通過移動終端的麥克風(fēng)錄音、也可以通過網(wǎng)絡(luò)下載講話者語音。
在步驟S603中,轉(zhuǎn)換模塊103根據(jù)判斷出的語言種類對講話者語音進(jìn)行語音識別,將講話者語音轉(zhuǎn)換成文字內(nèi)容。
進(jìn)一步說明的是,演講者語音有多種類型,可以是方言、外語、普通話等,其中,方言包括中國各地的方言,例如東北話、四川話、湖南話等,外語包括英語、法語、德語、俄語等語言種類。移動終端10獲取講話者語音后,方言識別模塊105根據(jù)方言習(xí)慣對講話者語音進(jìn)行識別,判斷講話者語音的方言種類。轉(zhuǎn)換模塊103根據(jù)判斷出的方言種類進(jìn)行語音識別,將講話者語音轉(zhuǎn)換成文字內(nèi)容。移動終端10獲取講話者語音后,外語識別模塊107根據(jù)外語習(xí)慣對講話者語音進(jìn)行識別,判斷講話者語音的外語種類。轉(zhuǎn)換模塊103根據(jù)判斷出的外語種類進(jìn)行語音識別,將講話者語音轉(zhuǎn)換成文字內(nèi)容。
參閱圖7,圖7是本發(fā)明實(shí)施例五語音轉(zhuǎn)換方法的流程圖。
在步驟S701中,當(dāng)演講者語言是多個簡短的語音時,整合模塊109按照時間順序?qū)⒅v話者的所有語音整合成完整的語音資料。
在步驟S703中,整合模塊109按照時間順序?qū)⒀葜v者的所有語音對應(yīng)的文字內(nèi)容整合成完整的文字資料。
在步驟S705中,在獲得完整的語音資料后,顯示模塊111將完整的文字資料顯示出來,便于用戶查閱,其中,顯示模塊111包括顯示屏、觸摸屏,顯示屏包括TFT液晶顯示屏、UFB液晶顯示屏、STN屏幕、有源矩陣有機(jī)發(fā)光二極體面板,觸摸屏包括電容式觸摸屏紅外線式觸摸屏、表面面波觸摸屏、MTK觸摸屏,觸摸屏接收觸摸信號控制是否顯示完整的文字內(nèi)容。
在步驟S707中,播放模塊113將完整的語音資料播放出來,便于用戶能流暢的聽完所有語音資料。其中,播放模塊113還對完整的語音資料進(jìn)行去噪處理,對演講者的完整語音資料的流暢性進(jìn)行調(diào)節(jié),根據(jù)當(dāng)前的播放場景調(diào)節(jié)合適的播放音量,當(dāng)接收到播放演講者的完整語音的控制信號后,播放模塊113將處理后的語音播放出來。
補(bǔ)充說明的是,本實(shí)施例的各個步驟的順序可以改變,下面以移動終端10的分析模塊101獲取A講話者的第一語音、A講話者的第三語音、B講話者的第二語音、B講話者的第四語音后的處理過程進(jìn)行詳細(xì)說明。移動終端10的分析模塊101根據(jù)A、B講話者語音分析出A、B講話者的語言習(xí)慣,根據(jù)A、B講話者的語言習(xí)慣分別判斷A、B講話者語音的語言種類,其中,獲取A、B講話者語音可以通過移動終端的麥克風(fēng)錄音、也可以通過網(wǎng)絡(luò)下載講話者語音。轉(zhuǎn)換模塊103根據(jù)判斷出的語言種類對A、B講話者語音進(jìn)行語音識別,將A、B講話者語音轉(zhuǎn)換成文字內(nèi)容。
進(jìn)一步說明的是,演講者語音有多種類型,可以是方言、外語、普通話等。移動終端10獲取講話者語音后,方言識別模塊105根據(jù)方言習(xí)慣對A、B講話者語音進(jìn)行識別,判斷A、B講話者語音的方言種類。轉(zhuǎn)換模塊103根據(jù)判斷出的方言種類進(jìn)行語音識別,將A、B講話者語音轉(zhuǎn)換成文字內(nèi)容。移動終端10獲取A、B講話者語音后,外語識別模塊107根據(jù)外語習(xí)慣對A、B講話者語音進(jìn)行識別,判斷A、B講話者語音的外語種類。轉(zhuǎn)換模塊103根據(jù)判斷出的外語種類進(jìn)行語音識別,將A、B講話者語音轉(zhuǎn)換成文字內(nèi)容。
整合模塊109按照時間順序?qū)講話者的第一語音、第三語音整合成完整的語音資料,并按照時間順序?qū)⒀葜v者的所有語音對應(yīng)的文字內(nèi)容整合成完整的文字資料,文字資料包括第一文字內(nèi)容、第三文字內(nèi)容,其中第一文字內(nèi)容與第一語音的內(nèi)容相對應(yīng),第三文字內(nèi)容與第三語音的內(nèi)容相對應(yīng)。同樣地,整合模塊109按照時間順序?qū)講話者的第二語音、第四語音整合成完整的語音資料,并按照時間順序?qū)演講者的所有語音對應(yīng)的文字內(nèi)容整合成完整的文字資料,文字資料包括第二文字內(nèi)容、第四文字內(nèi)容,其中第二文字內(nèi)容與第二語音的內(nèi)容相對應(yīng),第四文字內(nèi)容與第四語音的內(nèi)容相對應(yīng)。
在獲得完整的語音資料后,顯示模塊111將A講話者、B講話者的完整的文字資料顯示出來,便于用戶查閱,其中,顯示模塊111包括顯示屏、觸摸屏,顯示屏包括TFT液晶顯示屏、UFB液晶顯示屏、STN屏幕、有源矩陣有機(jī)發(fā)光二極體面板,觸摸屏包括電容式觸摸屏紅外線式觸摸屏、表面面波觸摸屏、MTK觸摸屏,觸摸屏接收觸摸信號控制是否顯示完整的文字內(nèi)容。播放模塊113將完整的語音資料播放出來,便于用戶能流暢的聽完所有語音資料,其中,播放模塊113還對完整的語音資料進(jìn)行去噪處理,對演講者的完整語音資料的流暢性進(jìn)行調(diào)節(jié),根據(jù)當(dāng)前的播放場景調(diào)節(jié)合適的播放音量,當(dāng)接收到播放演講者的完整語音的控制信號后,播放模塊113將處理后的語音播放出來。
本發(fā)明提供的移動終端通過分析講話者的語言習(xí)慣分析出講話者語音的語言種類,根據(jù)語音種類進(jìn)行有針對性的識別處理,根據(jù)方言種類識別講話者語音的方言內(nèi)容,根據(jù)外語種類識別講話者語音的外語內(nèi)容,并將識別出來的內(nèi)容轉(zhuǎn)換成文字內(nèi)容,能生成與講話者語言對應(yīng)的完整的文字內(nèi)容,提供豐富的文字信息,方便用戶查閱,有利于用戶后續(xù)進(jìn)行相關(guān)的編輯處理。
以上僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。