亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種語音信息的傳輸方法、移動(dòng)終端和系統(tǒng)的制作方法

文檔序號(hào):10473600閱讀:209來源:國知局
一種語音信息的傳輸方法、移動(dòng)終端和系統(tǒng)的制作方法
【專利摘要】本發(fā)明實(shí)施例提供了一種語音信息的傳輸方法、裝置和系統(tǒng),涉及通信領(lǐng)域,以解決以錄音文件的形式傳輸語音信息需要消耗較大的數(shù)據(jù)流量的問題。技術(shù)方案包括:接收用戶輸入的原始語音信息和發(fā)送指令;對(duì)所述原始語音信息進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信息;將所述傳輸文字信息生成對(duì)應(yīng)編碼消息隊(duì)列后發(fā)送至所述發(fā)送指令對(duì)應(yīng)的接收終端。本發(fā)明實(shí)施例提供的技術(shù)方案可以應(yīng)用在即時(shí)聊天、發(fā)送語音附件等場(chǎng)景下。
【專利說明】
-種語音信息的傳輸方法、移動(dòng)終端和系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及通信領(lǐng)域,特別是設(shè)及一種語音信息的傳輸方法、移動(dòng)終端和系統(tǒng)。
【背景技術(shù)】
[0002] 隨著智能手機(jī)、平板電腦等終端的普及,與其適配的各種即時(shí)消息的社交軟件也 層出不窮,并我們的日常生活里得到了廣泛而頻繁的使用。在聯(lián)網(wǎng)狀態(tài)下,它們能夠支持文 字、語音、圖片及附件等消息的聊天和共享。相比文字消息聊天,語音信息聊天的輸入更為 便捷,也多了一份神秘感,在聊天過程中也越來越多地被用戶使用到。
[0003] 然而,由于語音信息一般是W錄音文件的形式傳輸?shù)?,因此語音信息傳輸需要消 耗較大的數(shù)據(jù)流量。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明實(shí)施例的目的在于提供一種語音信息的傳輸方法、移動(dòng)終端和系統(tǒng),W解 決W錄音文件的形式傳輸語音信息需要消耗較大的數(shù)據(jù)流量的問題。 陽〇化]為了解決上述問題,本發(fā)明公開了一種語音信息的傳輸方法,包括:接收用戶輸入 的原始語音信息和發(fā)送指令;對(duì)所述原始語音信息進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信 息;將所述傳輸文字信息生成對(duì)應(yīng)編碼消息隊(duì)列后發(fā)送至所述發(fā)送指令對(duì)應(yīng)的接收終端。
[0006] 為了解決上述問題,本發(fā)明還公開了一種語音信息的傳輸方法,包括:接收發(fā)送終 端發(fā)送的編碼消息隊(duì)列,所述編碼消息隊(duì)列由原始語音信息識(shí)別得到的傳輸文字信息生成 的,所述原始語音信息為用戶在所述發(fā)送終端上輸入的語音信息;對(duì)所述編碼消息隊(duì)列進(jìn) 行解碼,得到對(duì)應(yīng)的傳輸文字信息;對(duì)所述傳輸文字信息進(jìn)行語音合成,得到合成語音信 息;輸出所述合成語音信息。
[0007] 為了解決上述問題,本發(fā)明又提供了一種移動(dòng)終端,作為消息發(fā)送方,包括:
[0008] 錄入模塊,用于接收用戶輸入的原始語音信息和發(fā)送指令;
[0009] 識(shí)別模塊,與所述錄入模塊相連,用于對(duì)所述原始語音信息進(jìn)行語音識(shí)別,得到對(duì) 應(yīng)的傳輸文字信息;
[0010] 發(fā)送模塊,分別與所述錄入模塊和識(shí)別模塊相連,用于將所述傳輸文字信息生成 對(duì)應(yīng)編碼消息隊(duì)列后發(fā)送至所述發(fā)送指令對(duì)應(yīng)的接收終端。
[0011] 為了解決上述問題,本發(fā)明還提供一種移動(dòng)終端,作為消息接收方,包括:
[0012] 接收模塊,用于接收發(fā)送終端發(fā)送的編碼消息隊(duì)列,所述編碼消息隊(duì)列由原始語 音信息識(shí)別得到的傳輸文字信息生成的,所述原始語音信息為用戶在所述發(fā)送終端上輸入 的語音信息;
[0013] 解碼模塊,與所述接收模塊相連,用于對(duì)所述編碼消息隊(duì)列進(jìn)行解碼,得到對(duì)應(yīng)的 傳輸文字信息;
[0014] 合成模塊,與所述解碼模塊相連,用于對(duì)所述傳輸文字信息進(jìn)行語音合成,得到合 成語音信息;
[0015] 輸出模塊,與所述合成模塊相連,用于輸出所述合成語音信息。
[0016] 為了解決上述問題,本發(fā)明再提供一種語音信息的傳輸系統(tǒng),包括:
[0017] 發(fā)送終端,用于接收用戶輸入的原始語音信息和發(fā)送指令;對(duì)所述原始語音信息 進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信息;將所述傳輸文字信息生成對(duì)應(yīng)編碼消息隊(duì)列后 發(fā)送至所述發(fā)送指令對(duì)應(yīng)的接收終端;
[0018] 所述接收終端,與所述發(fā)送終端相連,用于接收所述發(fā)送終端發(fā)送的編碼消息隊(duì) 列;對(duì)所述編碼消息隊(duì)列進(jìn)行解碼,得到對(duì)應(yīng)的傳輸文字信息;對(duì)所述傳輸文字信息進(jìn)行 語音合成,得到合成語音信息;輸出所述合成語音信息。
[0019] 本發(fā)明實(shí)施例提供的語音信息的傳輸方法、移動(dòng)終端和系統(tǒng),將語音信息轉(zhuǎn)化為 文字信息后發(fā)送至接收終端;由于語音信息W文字的形式傳輸,從而減少了傳輸語音信息 所消耗的數(shù)據(jù)流量,實(shí)現(xiàn)了省流量的語音信息傳輸。進(jìn)一步地,通過減少語音中的噪聲,可 W進(jìn)一步減少流量且更準(zhǔn)確地獲得文字信息。
【附圖說明】
[0020] 圖1是本發(fā)明實(shí)施例1提供的語音信息的傳輸方法的流程圖;
[0021] 圖2是本發(fā)明實(shí)施例2提供的語音信息的傳輸方法的流程圖;
[0022] 圖3是本發(fā)明實(shí)施例3提供的移動(dòng)終端的結(jié)構(gòu)示意圖;
[0023] 圖4為圖3所示的移動(dòng)終端中識(shí)別模塊的結(jié)構(gòu)示意圖;
[0024] 圖5為圖3所示的移動(dòng)終端中發(fā)送模塊的結(jié)構(gòu)示意圖;
[00巧]圖6是本發(fā)明實(shí)施例4提供的移動(dòng)終端的結(jié)構(gòu)示意圖; 陽0%] 圖7為圖6所示的移動(dòng)終端中解碼模塊的結(jié)構(gòu)示意圖;
[0027] 圖8為圖6所示的移動(dòng)終端中合成模塊的結(jié)構(gòu)示意圖;
[0028] 圖9是本發(fā)明實(shí)施例5提供的語音信息的傳輸系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0029] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。 陽〇3〇] 實(shí)施例1
[00川如圖1所示,本發(fā)明實(shí)施例提供一種語音信息的傳輸方法,包括:
[0032] 步驟101,接收用戶輸入的原始語音信息和發(fā)送指令。
[0033] 在本實(shí)施例中,用戶終端可W通過麥克風(fēng)、耳麥等接收原始語音信息,可W通過按 鍵、觸摸屏等接收用戶輸入的發(fā)送指令。
[0034] 步驟102,對(duì)該原始語音信息進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信息。
[0035] 在本實(shí)施例中,通過步驟102進(jìn)行語音識(shí)別時(shí),可W直接對(duì)原始語音信息進(jìn)行語 音識(shí)別。為了提高語音識(shí)別率,還可W首先對(duì)原始語音信息進(jìn)行處理,得到處理語音信息; 然后對(duì)處理語音信息進(jìn)行語音識(shí)別。對(duì)原始語音信息進(jìn)行處理后識(shí)別時(shí),通過步驟102對(duì) 原始語音信息進(jìn)行語音識(shí)別,包括:將原始語音信息進(jìn)行小波變換去噪,得到去噪語音信 息;對(duì)該去噪語音信息進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信息。其中,對(duì)該去噪語音信息 進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信息,包括:對(duì)去噪語音信息進(jìn)行關(guān)鍵字識(shí)別,得到至 少一個(gè)關(guān)鍵字;根據(jù)至少一個(gè)關(guān)鍵字對(duì)去噪語音信息進(jìn)行模糊匹配,得到去噪語音信息對(duì) 應(yīng)的傳輸文字信息。該小波變換去噪使用的方法具體可W為基于小波變換的幅度闊值去噪 方法;此時(shí),對(duì)去噪語音信息進(jìn)行小波變換去噪,包括獲取小波基和小波變換分解層數(shù);根 據(jù)所述小波基和小波變換分解層數(shù)N對(duì)所述原始語音信號(hào)進(jìn)行小波分解,得到一組小波系 數(shù)Wtk;根據(jù)每層小波變換的高頻系數(shù),分別對(duì)所述一組小波系數(shù)進(jìn)行闊值處理,得到估計(jì) 小波系數(shù);獲取小波分解的最后一層的低頻系數(shù);將所述最后一層的低頻系數(shù)和所述 估計(jì)小波系數(shù)鮮,.k進(jìn)行離散小波重構(gòu),得到去噪語音信息。
[0036] 在本實(shí)施例中,含噪語音信號(hào)的數(shù)學(xué)模型:
[0037] f (t) =S (t) +n (t) (2. 1)
[0038] 其中f(t),s(t),n(t)分別代表帶噪語音、純凈語音和噪聲信號(hào)。本文中研究的噪 聲符合如下的假設(shè):
[0039] (1)噪聲是加性的,是方差為0%高斯自噪聲,服從N(0, O 2)。
[0040] (2)噪聲是局部平穩(wěn)的。局部平穩(wěn)是指一段帶噪語音中的噪聲,具有和語音段開始 前那段噪聲相同的統(tǒng)計(jì)特性,且在整個(gè)語音段中保持不變。也就是說,可W根據(jù)語音開始前 那段噪聲來估計(jì)語音中所疊加的噪聲統(tǒng)計(jì)特性。
[0041] (3)噪聲與語音統(tǒng)計(jì)獨(dú)立或不相關(guān)。
[00創(chuàng) (4)只有帶噪語音可W利用,沒有其他參考信號(hào)。
[0043] 對(duì)于語音信號(hào)f(t)來說,對(duì)其離散采樣,得到N點(diǎn)離散信號(hào)f(n),n= 1,2,3,..., N-I,其小泌巧格為
[0044]
(2.2)
[0045] Wf (j,k)即為小波系數(shù);小波指的是小波基,即小波變換的類型。目前常見的幾種 小波基,如化ar小波、Daubechies小波、Bio;rthgonal小波、Coiflets小波、Symlets小波、 Mexican化t小波、Morlet小波、]Vteyer小波。各個(gè)小波的正交性、緊支撐性、消失矩、正則 性和對(duì)稱性等性質(zhì)的不盡相同,不同的小波基對(duì)信號(hào)的描述也是不同的,小波基函數(shù)的選 擇會(huì)對(duì)降噪效果產(chǎn)生一定的影響。降噪的第一步就是選擇合適的基小波。小波基的應(yīng)用大 多是挖掘其用很少的非零小波系數(shù)去有效逼近特殊的函數(shù)類的能力,因此,要選擇最優(yōu)小 波基W產(chǎn)生最多的接近零的小波系數(shù)。比如對(duì)跳變較多的信號(hào),化ar小波基比較合用;對(duì) 由分段多項(xiàng)式結(jié)構(gòu)組成的信號(hào),Daubechies小波比較合用。
[0046] 但是在實(shí)際應(yīng)用中,直接利用化2)式計(jì)算是比較繁瑣的,況且4 (t) 一般沒有顯 式表達(dá)式,運(yùn)里需要引入雙尺度方程化3. 1)和化3. 2)式:
[0047]
[0048]
W例其中貸飯郝4 (t)分別為尺度空間和小波空間的一個(gè)標(biāo)準(zhǔn)正交基函數(shù),展開系數(shù) h。似和hi似分別為: 陽化0]
[00川由于式化3. I)和化3. 2)描述的是相鄰兩尺度空間基函數(shù)之間的關(guān)系,所W稱 此二式為二尺度方程,并且二尺度方程存在于任意相鄰兩尺度j和j-1之間,也即:
[00521
陽053] 并且展開系數(shù)h。似和hi似不隨尺度j的變化而變化,k G Z。
[0054] 借助上述的雙尺度方程,從而得到小波變換的遞歸實(shí)現(xiàn)方法: 陽化5] Sf (j+1,k) = Sf 化 k)曲化 k) (2. 3)
[0056] Wf (j+1,k) = Sf 化 k) *g 化 k) (2. 4)
[0057] 其中h和g分別是對(duì)應(yīng)于尺度函數(shù)CP(X)和小波函數(shù)4 (X)的低通和高通去噪器, Sf(0,k)為原始信號(hào)f(k),Sf(j,k)為尺度系數(shù),Wf(j,k)為小波系數(shù)。相應(yīng)地,小波變換重 構(gòu)公式為:
[0058]
(2.5)
[0059] 其中P日綜分別對(duì)應(yīng)于重構(gòu)低通和高通去噪器。
[0060] 為了方便起見,小波系數(shù)Wf化k)簡(jiǎn)記為Wtk。由于小波變換是線性變換,所W對(duì) 帶噪信號(hào)f(t) = s(t)+n(t)作離散小波變換成f(k) = s(k)+n(k)后,得到的小波系數(shù)w,,k 仍由兩部分組成,一部分是真實(shí)信號(hào)S (k)對(duì)應(yīng)的小波系數(shù),記為Uik,另一部分是噪聲n化) 對(duì)應(yīng)的小波系數(shù),記為V,,k。
[0061] 上述基于小波變換的幅度闊值去噪方法的基本原理為由于語音信息可能會(huì)滲雜 一定噪聲,因此將此音源信息經(jīng)過小波變換后,有效的語音信息會(huì)集中在小波域的低頻帶, 而噪聲則分布在所有的小波系數(shù)中。對(duì)于高頻帶,少數(shù)絕對(duì)值較大的重要的小波系數(shù),含有 語音的重要奇異特性。通過選擇一個(gè)合適的闊值,對(duì)通過小波變換后得到的各個(gè)子波作適 當(dāng)?shù)拈熤堤幚?,將小于闊值的小波系?shù)(由噪聲信號(hào)產(chǎn)生)置零,而保留大于闊值的小波系 數(shù)(由有效語音信號(hào)產(chǎn)生),從而就得到了更為"干凈"的語音信息,W提高語音識(shí)別的準(zhǔn)確 率,尤其在一些相對(duì)增雜的環(huán)境下語音識(shí)別的準(zhǔn)確率更高。
[0062] 在本實(shí)施例中,分解層次一般是3-5層,經(jīng)Matl油實(shí)驗(yàn)?zāi)M,若輸入的語音信息信 噪比大于等于20化,則分解層數(shù)N = 3,否則使N = 5。帶有噪聲的信號(hào)f (t)就是原始語音 信息,在進(jìn)行小波變換前,需要先對(duì)原始語音信息進(jìn)行離散采樣得到離散信號(hào)f(n)。注:采 樣點(diǎn)數(shù)N和小波分解層次N不是同一個(gè),采樣頻率可為8曲Z-48曲Z,分解層次3-5層。。高 頻系數(shù)指的每一層級(jí)信號(hào)分解下的高頻信號(hào)的小波系數(shù),低頻系數(shù)則指的每一層信號(hào)分解 下的低頻信號(hào)的小波系數(shù)。語音信號(hào)頻率范圍和小波分解的頻率分布決定了小波分解的層 數(shù),語音信號(hào)的頻率范圍一般為300~3400化,對(duì)于采樣率為8曲Z的語音信號(hào),如繼續(xù)進(jìn)行 第五層分解,則五級(jí)的低頻部分的頻率范圍將是0~250Hz,為無效的語音信號(hào)頻率,故一 般只做4層小波分解。 W63] 在本實(shí)施例中,每一層高頻系數(shù)選擇一個(gè)闊值。使用半軟闊值(semisoft S虹inkage)函數(shù)。對(duì)Wj,k進(jìn)行闊值處理得到估計(jì)小波系數(shù)詠!,k:
[0064] 柳65] 其中0< A i< A 2。其中,^ I和^ 2分別稱為下闊值和上闊值,至于運(yùn)兩個(gè)闊值該如 何選取,一般地可取
O為噪聲標(biāo)準(zhǔn)差,N為信號(hào)采樣點(diǎn)數(shù);而Al的選取與信 號(hào)的形式有關(guān):對(duì)于細(xì)節(jié)較多的信號(hào),可將其取得較小,運(yùn)樣有利于保持信號(hào)的細(xì)節(jié);對(duì)于 細(xì)節(jié)較少的信號(hào),一般將其取得較大,運(yùn)樣更有利于去噪。
[0066] 在本實(shí)施例中,將最后一層的低頻系數(shù)和估計(jì)小波系數(shù)進(jìn)行離散小波重構(gòu),為進(jìn) 行小波反變換,即公式2. 5。
[0067] 本語音識(shí)別模塊中定制了各領(lǐng)域相關(guān)或相似的關(guān)鍵詞庫,如成語俗語、電影電視、 生活?yuàn)蕵?、體育運(yùn)動(dòng)、城市和景點(diǎn)、藥品、自然科學(xué)、人文科學(xué)等。而日常的口語交流語句中, 一般包含兩部分信息:一個(gè)是語句的句式,如情景問候、事件咨詢或回答等;另一個(gè)則是語 句中的關(guān)鍵詞匯,例如去哪玩、吃飯、上午九點(diǎn)、下班、北京、蘭州拉面、天虹超市等等。
[0068] 關(guān)鍵字識(shí)別基于一種統(tǒng)計(jì)分析的方法,能夠更快的提取有用信息,幫助模糊匹配 的語言、語法規(guī)則定位和校準(zhǔn)。模糊匹配則是根據(jù)該語言下的日??谡Z交流和詞匯語法規(guī) 貝1J,達(dá)到介詞的補(bǔ)全或關(guān)鍵詞的修正。能夠較好的忽略小波變換去噪沒能過濾的雜音;同 時(shí),也可W自動(dòng)補(bǔ)替因小波變換去噪中丟失或變形的有效詞匯信息。
[0069] 例如小波變換去噪后通過語音合成模塊生成的文字為"今晚哪里吃飯,是在肯的 雞"。首先提取有效的一些關(guān)鍵詞匯,如"哪里"、"吃飯";然后,分析語句語法規(guī)則,判斷狀 語"今晚"和賓語"哪里"可能缺少一個(gè)"動(dòng)詞",另外根據(jù)詞庫中"哪里"的組合,存在高概 率動(dòng)賓詞匯組"去哪里"、"在哪里",因此可能生成"今晚去哪吃飯"或者"今晚在哪里吃飯"; 另一方面,分析語句總得意思是表達(dá)的飲食,所W,介詞"在"后應(yīng)該是個(gè)具有關(guān)鍵特征的名 詞,就會(huì)去飲食類的關(guān)鍵詞庫中,匹配和"肯的雞"發(fā)音相同或相似的名詞組,并根據(jù)系統(tǒng)的 使用概率統(tǒng)計(jì),選擇概率最高,也就是"肯德基";最后,因?yàn)檎Z句包含"哪里",屬于一個(gè)疑問 語句,故在名字"肯德基"后補(bǔ)上"嗎?"或者"么?"。從而最終得到的語句則可W是:"今晚 去哪里吃飯,是在肯德基嗎?","今晚在哪里吃飯,是在肯德基嗎?","今晚去哪里吃飯,是 在肯德基么?","今晚在哪里吃飯,是在肯德基么?"。當(dāng)然,運(yùn)四條語句是最終選擇概率最 高的那一個(gè)。
[0070] 其中,關(guān)鍵字識(shí)別可W基于一種統(tǒng)計(jì)分析的方法,從而能夠快速從去噪語音信息 中提取有用信息,幫助模糊匹配所使用的語言、語法規(guī)則進(jìn)行定位和校準(zhǔn);模糊匹配可W是 根據(jù)語言和語法規(guī)則進(jìn)行匹配,從而能夠較好的忽略去噪過程沒有過濾的雜音,也可W自 動(dòng)補(bǔ)替去噪過程中丟失或者變形的有效詞匯信息,從而克服語音轉(zhuǎn)換為文字時(shí)的語法、語 序的不確定性W及方言的多樣性等問題,進(jìn)而更進(jìn)一步提高語音識(shí)別能力。
[0071] 步驟103,將傳輸文字信息生成對(duì)應(yīng)編碼消息隊(duì)列后發(fā)送至發(fā)送指令對(duì)應(yīng)的接收 終端。
[0072] 在本實(shí)施例中,可W直接將傳輸文字信息生成編碼消息隊(duì)列后發(fā)送;為了防止接 收終端混淆普通文字信息和通過語音轉(zhuǎn)換得到的文字信息,還可W預(yù)先設(shè)置語音轉(zhuǎn)換標(biāo) 記,此時(shí),步驟103包括:獲取原始語音信息的語種信息;將傳輸文字信息、語種信息和預(yù)設(shè) 語音轉(zhuǎn)換標(biāo)記生成對(duì)應(yīng)的編碼消息隊(duì)列;發(fā)送編碼消息隊(duì)列至發(fā)送指令對(duì)應(yīng)的接收終端。
[0073] 在本實(shí)施例中,可W使用目前通用的十六進(jìn)制的文字編碼方式。其中,英文字符為 7位編碼(編碼位值為00),中文字符為UCS2編碼(編碼位值為08)。然后,使用編碼方式 位的保留值,如10、18,來確認(rèn)其最終是需要轉(zhuǎn)換為語音消息的文字編碼。
[0074] 在本實(shí)施例中,所有需要傳輸語音信息的場(chǎng)景,如即時(shí)聊天、發(fā)送語音附件等,均 可W直接執(zhí)行上述過程;為方便用戶使用,上述過程也可W僅在用戶指示后執(zhí)行,用戶未指 示時(shí),W現(xiàn)有方式傳輸語音信息。
[0075] 本發(fā)明實(shí)施例提供的語音信息的傳輸方法,將語音信息轉(zhuǎn)化為文字信息后發(fā)送至 接收終端;由于語音信息W文字的形式傳輸,從而減少了傳輸語音信息所消耗的數(shù)據(jù)流量, 實(shí)現(xiàn)了省流量的語音信息傳輸。進(jìn)一步地,通過減少語音中的噪聲,可W進(jìn)一步減少流量且 更準(zhǔn)確地獲得文字信息。
[0076] 實(shí)施例2
[0077] 如圖2所示,本發(fā)明實(shí)施例提供一種語音信息的傳輸方法,包括:
[0078] 步驟201,接收發(fā)送終端發(fā)送的編碼消息隊(duì)列。
[0079] 在本實(shí)施例中,步驟201中編碼消息隊(duì)列由原始語音信息去噪、識(shí)別得到的傳輸 文字信息生成的,所述原始語音信息為用戶在所述發(fā)送終端上輸入的語音信息。具體的,該 編碼消息隊(duì)列的生成過程,與本發(fā)明實(shí)施例1提供的過程相似,在此不再一一寶述。
[0080] 步驟202,對(duì)編碼消息隊(duì)列進(jìn)行解碼,得到對(duì)應(yīng)的解碼文字信息。
[0081] 在本實(shí)施例中,如果編碼消息隊(duì)列為傳輸文字信息直接生成的,則可W直接通過 步驟202對(duì)編碼消息隊(duì)列進(jìn)行解碼;如果編碼消息隊(duì)列為傳輸文字信息、語種信息和語種 轉(zhuǎn)換標(biāo)記生成的,則步驟202包括:從編碼消息隊(duì)列中去除預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記,得到第一消 息隊(duì)列;提取所述第一消息隊(duì)列中的語種信息,并從所述第一消息隊(duì)列中去除所述語種信 息,得到第二消息隊(duì)列;對(duì)所述第二消息隊(duì)列進(jìn)行解碼,得到解碼文字信息。
[0082] 步驟203,對(duì)該解碼文字信息進(jìn)行語音合成,得到合成語音信息。
[0083] 在本實(shí)施例中,通過步驟203對(duì)該解碼文字信息進(jìn)行語音合成,包括:根據(jù)所述解 碼文字信息和語種信息,獲取對(duì)應(yīng)的語音合成規(guī)則;根據(jù)所述語音合成規(guī)則從預(yù)設(shè)波形編 碼數(shù)據(jù)庫中采集波形編碼;根據(jù)預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記,將所述波形編碼進(jìn)行轉(zhuǎn)換合成,得到合 成語音信息。其中,獲取語音合成規(guī)則的方式可W為首先根據(jù)解碼文字信息和語種信息,確 定對(duì)應(yīng)的國家語言;然后根據(jù)對(duì)應(yīng)的國家語言獲取最為合適的文字發(fā)音停頓、語氣和語法 規(guī)則等語音合成規(guī)則。
[0084] 通過上述過程進(jìn)行語音合成,能夠合成出較為口語化的語音信息,從而實(shí)現(xiàn)真音 還原。
[0085] 在本實(shí)施例中,語音合成時(shí)使用目前廣泛被使用的波形拼接法。在語音合成模塊 中存放所有音節(jié)的波形編碼,每個(gè)波形編碼有對(duì)應(yīng)的索引文件,記錄了該音節(jié)的起始位置 和長(zhǎng)度,W提高數(shù)據(jù)查找匹配的速度。根據(jù)每個(gè)輸入的文字或單詞的拼音、聲調(diào)、停頓等音 律信息,從語音合成模型庫中挑選合適的波形編碼;然后判斷當(dāng)前語句中的文字對(duì)應(yīng)的國 家語言(中文或英文)和句式,獲取較為合適的文字發(fā)音停頓、語氣等,創(chuàng)建對(duì)應(yīng)音節(jié)的起 始位置和音頻速率變化規(guī)則,W調(diào)整波形數(shù)據(jù)的頻率和振幅,最終達(dá)到調(diào)節(jié)合成的語音的 音頻和語速,最后拼接起來輸出較為口語化的語音信息。
[0086] 每個(gè)音節(jié)的波形數(shù)據(jù)有運(yùn)對(duì)應(yīng)的默認(rèn)的音頻,通過文字的特性判斷其語調(diào)或語氣 等(陳述、疑問),W調(diào)整波形數(shù)據(jù)的頻率和振幅,最終達(dá)到調(diào)節(jié)合成的語音的音頻和語速, 使之顯得更符使用場(chǎng)景。
[0087] 步驟204,輸出該合成語音信息。
[0088] 本發(fā)明實(shí)施例提供的語音信息的傳輸方法,接收發(fā)送終端發(fā)送的由語音信息轉(zhuǎn)化 得到的文字信息,并對(duì)文字信息進(jìn)行解碼和語音合成,從而實(shí)現(xiàn)語音信息的傳輸;由于語音 信息W文字的形式傳輸,從而減少了傳輸語音信息所消耗的數(shù)據(jù)流量,實(shí)現(xiàn)了省流量的語 音信息傳輸。進(jìn)一步地,通過減少語音中的噪聲,可W進(jìn)一步減少流量且更準(zhǔn)確地獲得文字 f目息。
[0089] 實(shí)施例3
[0090] 如圖3所示,本發(fā)明實(shí)施例提供一種移動(dòng)終端,包括:
[0091] 錄入模塊301,用于接收用戶輸入的原始語音信息和發(fā)送指令;
[0092] 識(shí)別模塊302,與所述錄入模塊相連,用于對(duì)所述原始語音信息進(jìn)行語音識(shí)別,得 到對(duì)應(yīng)的傳輸文字信息;
[0093] 發(fā)送模塊303,分別與所述錄入模塊和識(shí)別模塊相連,用于將所述傳輸文字信息生 成對(duì)應(yīng)編碼消息隊(duì)列后發(fā)送至所述發(fā)送指令對(duì)應(yīng)的接收終端。
[0094] 在本實(shí)施例中,通過錄入模塊301、識(shí)別模塊302發(fā)送模塊303實(shí)現(xiàn)語音信息的傳 輸?shù)倪^程,與本發(fā)明實(shí)施例1提供的過程相似,在此不再一一寶述。 陽0巧]進(jìn)一步的,如圖4所示,本發(fā)明實(shí)施例提供的移動(dòng)終端中識(shí)別模塊302,包括:
[0096] 去噪子模塊3021,用于將所述原始語音信息進(jìn)行小波變換去噪,得到去噪語音信 息;
[0097] 識(shí)別子模塊3022,用于對(duì)所述去噪語音信息進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字 f目息。
[0098] 此時(shí),識(shí)別子模塊3022,包括:關(guān)鍵詞獲取單元30221,用于對(duì)所述去噪語音信息 進(jìn)行關(guān)鍵字識(shí)別,得到至少一個(gè)關(guān)鍵字;
[0099] 匹配單元30222,用于根據(jù)所述至少一個(gè)關(guān)鍵字對(duì)所述去噪語音信息進(jìn)行模糊匹 配,得到所述去噪語音信息對(duì)應(yīng)的傳輸文字信息。
[0100] 去噪子模塊3021,包括:獲取單元30211,其用于獲取小波基和小波變換分解層 數(shù); 陽101] 小波分解單元30212,其用于根據(jù)所述小波基和小波變換分解層數(shù),對(duì)所述原始語 音信號(hào)進(jìn)行小波分解,得到一組小波系數(shù); 陽102] 小波系數(shù)獲取單元30213,其用于根據(jù)每層小波變換的高頻系數(shù),分別對(duì)所述一組 小波系數(shù)進(jìn)行闊值處理,得到估計(jì)小波系數(shù); 陽103] 低頻系數(shù)獲取單元30214,其用于獲取小波分解的最后一層的低頻系數(shù);
[0104] 離散重構(gòu)單元30215,其用于將所述最后一層的低頻系數(shù)和所述估計(jì)小波系數(shù)進(jìn) 行離散小波重構(gòu),得到去噪語音信息。
[01化]在本實(shí)施例中,通過上述模塊實(shí)現(xiàn)去噪和識(shí)別的過程,與本發(fā)明實(shí)施例1提供的 過程相似,在此不再一一寶述。
[0106] 進(jìn)一步的,如圖5所示,本實(shí)施例提供的移動(dòng)終端中發(fā)送模塊303,包括: 陽107] 語音獲取單元3031,其用于獲取所述原始語音信息的語種信息;
[0108] 生成單元3032,其用于將所述傳輸文字信息、語種信息和預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記生成 對(duì)應(yīng)的編碼消息隊(duì)列; 陽109] 發(fā)送單元3033,其用于發(fā)送所述編碼消息隊(duì)列至所述發(fā)送指令對(duì)應(yīng)的接收終端。
[0110] 本發(fā)明實(shí)施例提供的移動(dòng)終端,將語音信息轉(zhuǎn)化為文字信息后發(fā)送至接收終端; 由于語音信息W文字的形式傳輸,從而減少了傳輸語音信息所消耗的數(shù)據(jù)流量,實(shí)現(xiàn)了省 流量的語音信息傳輸。進(jìn)一步地,通過減少語音中的噪聲,可W進(jìn)一步減少流量且更準(zhǔn)確地 獲得文字信息。 陽111] 實(shí)施例4 陽11引如圖6所示,本發(fā)明實(shí)施例提供一種移動(dòng)終端,包括:
[0113] 接收模塊601,用于接收發(fā)送終端發(fā)送的編碼消息隊(duì)列,所述編碼消息隊(duì)列由原始 語音信息識(shí)別得到的傳輸文字信息生成的,所述原始語音信息為用戶在所述發(fā)送終端上輸 入的語音信息;
[0114] 解碼模塊602,與所述接收模塊相連,用于對(duì)所述編碼消息隊(duì)列進(jìn)行解碼,得到對(duì) 應(yīng)的傳輸文字信息;
[0115] 合成模塊603,與所述解碼模塊相連,用于對(duì)所述傳輸文字信息進(jìn)行語音合成,得 到合成語音信息;
[0116] 輸出模塊604,與所述合成模塊相連,用于輸出所述合成語音信息。
[0117] 在本實(shí)施例中,通過接收模塊601、解碼模塊602、合成模塊603和輸出模塊604實(shí) 現(xiàn)語音信息的傳輸?shù)倪^程,與本發(fā)明實(shí)施例2提供的過程相似,在此不再一一寶述。具體 的,發(fā)送終端的結(jié)構(gòu),與本發(fā)明實(shí)施例3提供的相似,在此不再一一寶述。
[0118] 進(jìn)一步的,如圖7所示,本實(shí)施例提供的移動(dòng)終端中解碼模塊602,包括:
[0119] 第一獲取單元6021,用于從所述編碼消息隊(duì)列中去除預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記,得到第 一消息隊(duì)列; 陽120] 提取單元6022,用于提取所述第一消息隊(duì)列中的語種信息,并從所述第一消息隊(duì) 列中去除所述語種信息,得到第二消息隊(duì)列; 陽121] 解碼單元6023,用于對(duì)所述第二消息隊(duì)列進(jìn)行解碼,得到所述傳輸文字信息。
[0122] 在本實(shí)施例中,通過第一獲取單元6021、提取單元6022和解碼單元6023實(shí)現(xiàn)解碼 的過程與本發(fā)明實(shí)施例2提供的過程相似,在此不再一一寶述。
[0123] 進(jìn)一步的,如圖8所示,本實(shí)施例提供的移動(dòng)終端中合成模塊603,包括:
[0124] 獲取單元6031,用于根據(jù)所述傳輸文字信息和語種信息,獲取對(duì)應(yīng)的語音合成規(guī) 則;
[01巧]采集單元6032,用于根據(jù)所述語音合成規(guī)則從預(yù)設(shè)波形編碼數(shù)據(jù)庫中采集波形編 碼;
[01 %] 合成單元6033,用于根據(jù)預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記,將所述波形編碼進(jìn)行轉(zhuǎn)換合成,得到 合成語音信息。
[0127] 在本實(shí)施例中,通過獲取單元、采集單元和合成單元實(shí)現(xiàn)合成的過程,與本發(fā)明實(shí) 施例2提供的過程相似,在此不再一一寶述。
[0128] 本發(fā)明實(shí)施例提供的移動(dòng)終端,接收發(fā)送終端發(fā)送的由語音信息轉(zhuǎn)化得到的文字 信息,并對(duì)文字信息進(jìn)行解碼和語音合成,從而實(shí)現(xiàn)語音信息的傳輸;由于語音信息W文字 的形式傳輸,從而減少了傳輸語音信息所消耗的數(shù)據(jù)流量,實(shí)現(xiàn)了省流量的語音信息傳輸。 進(jìn)一步地,通過減少語音中的噪聲,可W進(jìn)一步減少流量且更準(zhǔn)確地獲得文字信息。 陽129] 實(shí)施例5
[0130]如圖9所示,本發(fā)明實(shí)施例提供一種語音信息的傳輸系統(tǒng),包括: 陽131] 發(fā)送終端901,用于接收用戶輸入的原始語音信息和發(fā)送指令;對(duì)所述原始語音 信息進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信息;將所述傳輸文字信息生成對(duì)應(yīng)編碼消息隊(duì) 列后發(fā)送至所述發(fā)送指令對(duì)應(yīng)的接收終端; 陽132] 所述接收終端902,與所述發(fā)送終端相連,用于接收所述發(fā)送終端發(fā)送的編碼消息 隊(duì)列;對(duì)所述編碼消息隊(duì)列進(jìn)行解碼,得到對(duì)應(yīng)的傳輸文字信息;對(duì)所述傳輸文字信息進(jìn) 行語音合成,得到合成語音信息;輸出所述合成語音信息。
[0133] 在本實(shí)施例中,發(fā)送終端901的結(jié)構(gòu)及其實(shí)現(xiàn)語音信息的傳輸?shù)倪^程,與本發(fā)明 實(shí)施例3提供的相似,在此不再一一寶述;接收終端902的結(jié)構(gòu)及其實(shí)現(xiàn)與語音信息的傳輸 的過程,與本發(fā)明實(shí)施例4提供的相似,在此不再一一寶述。
[0134] 本發(fā)明實(shí)施例提供的語音信息的傳輸系統(tǒng),將語音信息轉(zhuǎn)化為文字信息后發(fā)送至 接收終端;由于語音信息W文字的形式傳輸,從而減少了傳輸語音信息所消耗的數(shù)據(jù)流量, 實(shí)現(xiàn)了省流量的語音信息傳輸。進(jìn)一步地,通過減少語音中的噪聲,可W進(jìn)一步減少流量且 更準(zhǔn)確地獲得文字信息。
[0135] 需要說明的是,對(duì)于方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組 合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動(dòng)作順序的限制,因?yàn)橐?據(jù)本發(fā)明實(shí)施例,某些步驟可W采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該 知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所設(shè)及的動(dòng)作并不一定是本發(fā)明實(shí)施 例所必須的。 陽136] 本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與 其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。
[0137] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明實(shí)施例的實(shí)施例可提供為方法、裝置、或計(jì)算 機(jī)程序產(chǎn)品。因此,本發(fā)明實(shí)施例可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和 硬件方面的實(shí)施例的形式。而且,本發(fā)明實(shí)施例可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可 用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上 實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0138] 本發(fā)明實(shí)施例是參照根據(jù)本發(fā)明實(shí)施例的方法、終端設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序 產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框 圖中的每一流程和/或方框、W及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商?供運(yùn)些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理 終端設(shè)備的處理器W產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備的處 理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多 個(gè)方框中指定的功能的裝置。
[0139] 運(yùn)些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備 W特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包 括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方 框或多個(gè)方框中指定的功能。
[0140] 運(yùn)些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得 在計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟W產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在 計(jì)算機(jī)或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程 和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。 陽141] 盡管已描述了本發(fā)明實(shí)施例的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基 本創(chuàng)造性概念,則可對(duì)運(yùn)些實(shí)施例做出另外的變更和修改。所W,所附權(quán)利要求意欲解釋為 包括優(yōu)選實(shí)施例W及落入本發(fā)明實(shí)施例范圍的所有變更和修改。 陽142] 最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將 一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示運(yùn)些實(shí)體或操作 之間存在任何運(yùn)種實(shí)際的關(guān)系或者順序。而且,術(shù)語"包括"、"包含"或者其任何其他變體意 在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設(shè)備不僅包 括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為運(yùn)種過程、方法、物品 或者終端設(shè)備所固有的要素。在沒有更多限制的情況下,由語句"包括一個(gè)……"限定的要 素,并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要素。 [0143] W上對(duì)本發(fā)明所提供的一種調(diào)整充電電路發(fā)熱量的方法和裝置,進(jìn)行了詳細(xì)介 紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,W上實(shí)施例的說明只 是用于幫助理解本發(fā)明的方法及其核屯、思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā) 明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理 解為對(duì)本發(fā)明的限制。
【主權(quán)項(xiàng)】
1. 一種語音信息的傳輸方法,其特征在于,包括: 接收用戶輸入的原始語音信息和發(fā)送指令; 對(duì)所述原始語音信息進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信息; 將所述傳輸文字信息生成對(duì)應(yīng)編碼消息隊(duì)列后發(fā)送至所述發(fā)送指令對(duì)應(yīng)的接收終端。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述原始語音信息進(jìn)行語音識(shí)別, 得到對(duì)應(yīng)的傳輸文字信息的步驟,包括: 將所述原始語音信息進(jìn)行小波變換去噪,得到去噪語音信息; 對(duì)所述去噪語音信息進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信息。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)所述去噪語音信息進(jìn)行語音識(shí)別, 得到對(duì)應(yīng)的傳輸文字信息的步驟包括: 對(duì)所述去噪語音信息進(jìn)行關(guān)鍵字識(shí)別,得到至少一個(gè)關(guān)鍵字; 根據(jù)所述至少一個(gè)關(guān)鍵字對(duì)所述去噪語音信息進(jìn)行模糊匹配,得到所述去噪語音信息 對(duì)應(yīng)的傳輸文字信息。4. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將所述原始語音信息進(jìn)行小波變換 去噪,得到去噪語音信息的步驟包括: 獲取小波基和小波變換分解層數(shù); 根據(jù)所述小波基和小波變換分解層數(shù),對(duì)所述原始語音信號(hào)進(jìn)行小波分解,得到一組 小波系數(shù); 根據(jù)每層小波變換的高頻系數(shù),分別對(duì)所述一組小波系數(shù)進(jìn)行閾值處理,得到估計(jì)小 波系數(shù); 獲取小波分解的最后一層的低頻系數(shù); 將所述最后一層的低頻系數(shù)和所述估計(jì)小波系數(shù)進(jìn)行離散小波重構(gòu),得到去噪語音信 息。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述傳輸文字信息生成對(duì)應(yīng)編碼 消息隊(duì)列后發(fā)送至所述發(fā)送指令對(duì)應(yīng)的接收終端的步驟包括: 獲取所述原始語音信息的語種信息; 將所述傳輸文字信息、語種信息和預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記生成對(duì)應(yīng)的編碼消息隊(duì)列; 發(fā)送所述編碼消息隊(duì)列至所述發(fā)送指令對(duì)應(yīng)的接收終端。6. -種語音信息的傳輸方法,其特征在于,包括: 接收發(fā)送終端發(fā)送的編碼消息隊(duì)列,所述編碼消息隊(duì)列由原始語音信息識(shí)別得到的傳 輸文字信息生成的,所述原始語音信息為用戶在所述發(fā)送終端上輸入的語音信息; 對(duì)所述編碼消息隊(duì)列進(jìn)行解碼,得到對(duì)應(yīng)的傳輸文字信息; 對(duì)所述傳輸文字信息進(jìn)行語音合成,得到合成語音信息; 輸出所述合成語音信息。7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述對(duì)所述編碼消息隊(duì)列進(jìn)行解碼,得到 對(duì)應(yīng)的傳輸文字信息的步驟包括: 從所述編碼消息隊(duì)列中去除預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記,得到第一消息隊(duì)列; 提取所述第一消息隊(duì)列中的語種信息,并從所述第一消息隊(duì)列中去除所述語種信息, 得到第二消息隊(duì)列; 對(duì)所述第二消息隊(duì)列進(jìn)行解碼,得到所述傳輸文字信息。8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述對(duì)所述傳輸文字信息進(jìn)行語音合成, 得到合成語音信息的步驟包括: 根據(jù)所述傳輸文字信息和語種信息,獲取對(duì)應(yīng)的語音合成規(guī)則; 根據(jù)所述語音合成規(guī)則從預(yù)設(shè)波形編碼數(shù)據(jù)庫中采集波形編碼; 根據(jù)預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記,將所述波形編碼進(jìn)行轉(zhuǎn)換合成,得到合成語音信息。9. 一種移動(dòng)終端,其特征在于,包括: 錄入模塊,用于接收用戶輸入的原始語音信息和發(fā)送指令; 識(shí)別模塊,與所述錄入模塊相連,用于對(duì)所述原始語音信息進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的 傳輸文字信息; 發(fā)送模塊,分別與所述錄入模塊和識(shí)別模塊相連,用于將所述傳輸文字信息生成對(duì)應(yīng) 編碼消息隊(duì)列后發(fā)送至所述發(fā)送指令對(duì)應(yīng)的接收終端。10. 根據(jù)權(quán)利要求9所述的移動(dòng)終端,其特征在于,所述識(shí)別模塊包括: 去噪子模塊,用于將所述原始語音信息進(jìn)行小波變換去噪,得到去噪語音信息; 識(shí)別子模塊,用于對(duì)所述去噪語音信息進(jìn)行語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信息。11. 根據(jù)權(quán)利要求10所述的移動(dòng)終端,其特征在于,所述識(shí)別子模塊包括, 關(guān)鍵詞獲取單元,用于對(duì)所述去噪語音信息進(jìn)行關(guān)鍵字識(shí)別,得到至少一個(gè)關(guān)鍵字; 匹配單元,用于根據(jù)所述至少一個(gè)關(guān)鍵字對(duì)所述去噪語音信息進(jìn)行模糊匹配,得到所 述去噪語音信息對(duì)應(yīng)的傳輸文字信息。12. 根據(jù)權(quán)利要求10所述的移動(dòng)終端,其特征在于,所述去噪子模塊包括: 獲取單元,其用于獲取小波基和小波變換分解層數(shù); 小波分解單元,其用于根據(jù)所述小波基和小波變換分解層數(shù),對(duì)所述原始語音信號(hào)進(jìn) 行小波分解,得到一組小波系數(shù); 小波系數(shù)獲取單元,其用于根據(jù)每層小波變換的高頻系數(shù),分別對(duì)所述一組小波系數(shù) 進(jìn)行閾值處理,得到估計(jì)小波系數(shù); 低頻系數(shù)獲取單元,其用于獲取小波分解的最后一層的低頻系數(shù); 離散重構(gòu)單元,其用于將所述最后一層的低頻系數(shù)和所述估計(jì)小波系數(shù)進(jìn)行離散小波 重構(gòu),得到去噪語音信息。13. 根據(jù)權(quán)利要求9所述的移動(dòng)終端,其特征在于,所述發(fā)送模塊包括: 語音獲取單元,其用于獲取所述原始語音信息的語種信息; 生成單元,其用于將所述傳輸文字信息、語種信息和預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記生成對(duì)應(yīng)的編 碼消息隊(duì)列; 發(fā)送單元,其用于發(fā)送所述編碼消息隊(duì)列至所述發(fā)送指令對(duì)應(yīng)的接收終端。14. 一種移動(dòng)終端,其特征在于,包括: 接收模塊,用于接收發(fā)送終端發(fā)送的編碼消息隊(duì)列,所述編碼消息隊(duì)列由原始語音信 息識(shí)別得到的傳輸文字信息生成的,所述原始語音信息為用戶在所述發(fā)送終端上輸入的語 音信息; 解碼模塊,與所述接收模塊相連,用于對(duì)所述編碼消息隊(duì)列進(jìn)行解碼,得到對(duì)應(yīng)的傳輸 文字信息; 合成模塊,與所述解碼模塊相連,用于對(duì)所述傳輸文字信息進(jìn)行語音合成,得到合成語 首?目息; 輸出模塊,與所述合成模塊相連,用于輸出所述合成語音信息。15. 根據(jù)權(quán)利要求14所述的移動(dòng)終端,其特征在于,所述解碼模塊包括: 第一獲取單元,用于從所述編碼消息隊(duì)列中去除預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記,得到第一消息隊(duì) 列; 提取單元,用于提取所述第一消息隊(duì)列中的語種信息,并從所述第一消息隊(duì)列中去除 所述語種信息,得到第二消息隊(duì)列; 解碼單元,用于對(duì)所述第二消息隊(duì)列進(jìn)行解碼,得到所述傳輸文字信息。16. 根據(jù)權(quán)利要求15所述的移動(dòng)終端,其特征在于,所述合成模塊包括: 獲取單元,用于根據(jù)所述傳輸文字信息和語種信息,獲取對(duì)應(yīng)的語音合成規(guī)則; 采集單元,用于根據(jù)所述語音合成規(guī)則從預(yù)設(shè)波形編碼數(shù)據(jù)庫中采集波形編碼; 合成單元,用于根據(jù)預(yù)設(shè)語音轉(zhuǎn)換標(biāo)記,將所述波形編碼進(jìn)行轉(zhuǎn)換合成,得到合成語音 信息。17. -種語音信息的傳輸系統(tǒng),其特征在于,包括: 發(fā)送終端,用于接收用戶輸入的原始語音信息和發(fā)送指令;對(duì)所述原始語音信息進(jìn)行 語音識(shí)別,得到對(duì)應(yīng)的傳輸文字信息;將所述傳輸文字信息生成對(duì)應(yīng)編碼消息隊(duì)列后發(fā)送 至所述發(fā)送指令對(duì)應(yīng)的接收終端; 所述接收終端,與所述發(fā)送終端相連,用于接收所述發(fā)送終端發(fā)送的編碼消息隊(duì)列;對(duì) 所述編碼消息隊(duì)列進(jìn)行解碼,得到對(duì)應(yīng)的傳輸文字信息;對(duì)所述傳輸文字信息進(jìn)行語音合 成,得到合成語音信息;輸出所述合成語音信息。
【文檔編號(hào)】H04M1/725GK105827504SQ201510864077
【公開日】2016年8月3日
【申請(qǐng)日】2015年11月30日
【發(fā)明人】李仁軍
【申請(qǐng)人】維沃移動(dòng)通信有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1