專利名稱:一種具有語音處理效果的移動(dòng)終端及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信領(lǐng)域中移動(dòng)終端對語音的改善,特別涉及通信領(lǐng)域中一種具有語 音處理效果的移動(dòng)終端及方法。
背景技術(shù):
隨著移動(dòng)通信的發(fā)展,現(xiàn)在的手機(jī)功能越來越多,人們對于手機(jī)的要求也越來越 高。作為手機(jī)最基本的通話功能,其質(zhì)量的好壞與網(wǎng)絡(luò)商提供的信號(hào)有關(guān)。但是在同樣的 網(wǎng)絡(luò)信號(hào)下,手機(jī)軟件的配置也是影響通話質(zhì)量的重要因素?,F(xiàn)有的手機(jī)軟件中,有通過去除背景雜音來改善通話音質(zhì)的,有通過設(shè)置一定的 參數(shù)來自動(dòng)調(diào)節(jié)音量大小的,也有通過可選擇的屏蔽背景音來保護(hù)通話雙方個(gè)人隱私的。 由于人們對手機(jī)的通話功能有著各種特殊的要求,因此有必要開發(fā)新的功能來滿足不同的需求。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題在于提供一種具有語音處理效果的移動(dòng)終端及方法, 以滿足人們在通話過程中對于語音的特殊要求,可以靈活調(diào)整音色、音調(diào),語速等特征。為了解決上述問題,本發(fā)明提供了一種具有語音處理效果的移動(dòng)終端,包括音頻 輸入/輸出模塊,還包括語音提取模塊,用來獲取從主叫方傳送過來的音頻信息;音色控 制模塊,用來預(yù)設(shè)并儲(chǔ)存所需音頻信息的參數(shù);語音處理模塊,用來依據(jù)所預(yù)設(shè)的參數(shù)值對 主叫方傳送過來的音頻信息進(jìn)行參數(shù)的調(diào)整。為了解決上述問題,本發(fā)明還提供了一種具有語音處理效果的方法,應(yīng)用于移動(dòng) 終端中對音頻信息的處理,包括以下步驟(1)在所述移動(dòng)終端中預(yù)設(shè)并存儲(chǔ)所需音頻信 息的參數(shù)值;(2)當(dāng)所述移動(dòng)終端接收來電時(shí),檢測所述移動(dòng)終端音頻信息的參數(shù)信息; (3)在所述移動(dòng)終端接收來電時(shí),根據(jù)所述步驟(1)預(yù)設(shè)的設(shè)定值和所述步驟(2)檢測到的 音頻信息,對獲取的音頻信息進(jìn)行參數(shù)的調(diào)整;(4)在所述移動(dòng)終端接收來電時(shí),調(diào)用相應(yīng) 的圖片與所述調(diào)整后的音頻信息合成。可見,采用本發(fā)明的技術(shù)方案,通過調(diào)整音頻信息的參數(shù),可以獲取各種語音效 果,以滿足用戶在通話過程中對語音的特殊要求。
圖1 本發(fā)明實(shí)施例所述的具有語音處理效果的移動(dòng)終端的裝置圖;圖2 本發(fā)明實(shí)施例所述的用于手機(jī)中的主叫方的語音處理流程圖;圖3 本發(fā)明實(shí)施例所述的用于手機(jī)中的接收方的語音處理流程圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下參照附圖并舉實(shí)施例,對本發(fā)明作進(jìn)一步地詳細(xì)說明。如圖1所示,實(shí)現(xiàn)本發(fā)明所述實(shí)施例1的內(nèi)容,可以是通過具有語音處理效果的移 動(dòng)終端的裝置來實(shí)現(xiàn)。語音提取模塊11,用來獲取從主叫方傳送過來的音頻信息,輸出給音色控制模塊 12 ;音色處理模塊12,用來預(yù)設(shè)并儲(chǔ)存所需音頻信息的參數(shù),由語音處理模塊13調(diào) 用;語音處理模塊13,用來依據(jù)所預(yù)設(shè)的參數(shù)值對主叫方傳送過來的音頻信息進(jìn)行參 數(shù)的調(diào)整;語音和圖片合成模塊14,用來在接收語音時(shí)調(diào)用相應(yīng)的圖片。結(jié)合圖1,通過上述模塊的結(jié)合,本發(fā)明實(shí)施例所述的具有語音處理效果的移動(dòng)終 端的功能包括從接收方來看,當(dāng)話鈴響時(shí),語音處理模塊11獲取從主叫方傳送過來的音頻信 息,音色控制模塊12用來預(yù)設(shè)并存儲(chǔ)所需音頻信息的參數(shù),語音處理模塊13用來依據(jù)所預(yù) 設(shè)的參數(shù)值對主叫放傳送過來的音頻信息進(jìn)行參數(shù)的調(diào)整,語音和圖片合成模塊14用來 在接收語音時(shí)調(diào)用相應(yīng)的圖片,最后輸出。其中,語音處理模塊13中對參數(shù)的調(diào)整由算音 頻信息處理單元和控制音頻信息處理單元來實(shí)現(xiàn),圖1中未示出。從主叫方來看,在完成撥號(hào)后,語音處理模塊11獲取主叫方的音頻信息,音色控 制模塊12用來預(yù)設(shè)并存儲(chǔ)所需音頻信息的參數(shù),語音處理模塊13用來依據(jù)所預(yù)設(shè)的參數(shù) 值對主叫放傳送過來的音頻信息進(jìn)行參數(shù)的調(diào)整,最后輸出。其中,語音處理模塊13中對 參數(shù)的調(diào)整由算音頻信息處理單元和控制音頻信息處理單元來實(shí)現(xiàn),圖1中未示出。并且,上述音頻信息的參數(shù)調(diào)整的步驟具體如下在時(shí)域上按照時(shí)間長度改變的 要求對信號(hào)進(jìn)行插值或抽剪,然后變換到頻域,對幅度譜和相位譜分別進(jìn)行處理,分離基頻 和共振峰,并對其進(jìn)行獨(dú)立調(diào)節(jié),調(diào)節(jié)時(shí)補(bǔ)償時(shí)間長度調(diào)整對此二者的影響,最后恢復(fù)時(shí)域 信號(hào)。其中,上述基頻和共振峰位置的調(diào)整步驟具體如下在時(shí)域上按照調(diào)整因子t對 某一幀進(jìn)行數(shù)據(jù)點(diǎn)的插值或抽剪;變換到頻域,并由直角坐標(biāo)轉(zhuǎn)換到極坐標(biāo)上,得到相位譜 I和幅度譜II ;對幅度譜II提取包絡(luò),得到包絡(luò)譜III,對III在頻率軸上按照調(diào)整因子t*f 進(jìn)行縮放,得到調(diào)整過共振峰位置的包絡(luò)譜IV,f 表示基頻調(diào)整因子;對幅度譜II點(diǎn)對點(diǎn)除 以包絡(luò)譜III,得到譜V,將譜V的橫坐標(biāo)在頻率軸上按照調(diào)整因子t*p進(jìn)行縮放,然后點(diǎn)對 點(diǎn)乘以調(diào)整后的包絡(luò)譜IV,得到調(diào)整后的幅度譜VII,P表示共振峰位置調(diào)整因子;對相位 譜I,與相鄰幀的相位差進(jìn)行展開,得到兩幀之間各頻率上相位改變的實(shí)際值,該值乘以調(diào) 整因子t*p,然后對頻率軸按照調(diào)整因子t*p進(jìn)行縮放,將調(diào)整后的相位差重新累加,得到 當(dāng)前幀調(diào)整后的相位譜VIII ;將調(diào)整后的幅度譜VII和相位譜VIII變換到直角坐標(biāo),重新 變換到時(shí)域。上述頻域上對信號(hào)的基頻和共振分位置進(jìn)行獨(dú)立調(diào)整,將基頻和共振峰位置分離 開來,既可以改變語音信號(hào)的基頻及其諧波,又可以同時(shí)維持共振峰位置或?qū)舱穹逦恢?進(jìn)行隨意調(diào)整,實(shí)現(xiàn)音色和音高的獨(dú)立改變。并且,通過插值或抽剪對數(shù)字信號(hào)實(shí)現(xiàn)重采樣,從而拉長或縮短語音的時(shí)間尺度,對改變的基頻和共振峰位置進(jìn)行補(bǔ)償,實(shí)現(xiàn)單獨(dú)對語速進(jìn)行改變的效果。采用本發(fā)明所述的方案后,用戶可以根據(jù)自己的需要在通話過程中獲得特殊的音 效,可以靈活調(diào)整音色、音調(diào),語速等特征。如圖2所示,在所述移動(dòng)終端主叫撥號(hào)時(shí),具有語音處理效果的方法如下步驟111,準(zhǔn)備打手機(jī);步驟112,撥打?qū)Ψ绞謾C(jī)號(hào);步驟113,如果想獲得特殊的語音效果,則選擇音頻處理,不選擇音頻處理的話就 是原始語音輸出;步驟114,獲取主叫方語音的音頻信息的參數(shù);步驟115,對獲取的主叫方的語音進(jìn)行參數(shù)調(diào)整;步驟116,特效語音輸出;步驟117,通話結(jié)束。如圖3所示,在所述移動(dòng)終端接收主叫時(shí),具有語音處理效果的方法步驟211,準(zhǔn)備接聽手機(jī);步驟212,手機(jī)話鈴響;步驟213,如果想獲得特殊的語音和圖片效果,則選擇音頻處理,不選擇音頻處理 的話就是接收主叫方輸出的原始語音;步驟214,獲取接收方語音的音頻信息的參數(shù);步驟215,對接收方的語音進(jìn)行參數(shù)調(diào)整;步驟216,特效語音輸出;步驟217,調(diào)用相應(yīng)的圖片和特殊語音合成并一起輸出;步驟218,通話結(jié)束。所述步驟213中所述的主叫方輸出的原始語音,可以是經(jīng)過音頻處理的,也可以 是未經(jīng)過任何處理的普通語音??梢?,本發(fā)明所述的實(shí)施例1和實(shí)施例2實(shí)現(xiàn)了對語音的處理,使得用戶可以獲得 特殊的語音效果,實(shí)現(xiàn)了音色、音調(diào),語速的調(diào)整。綜上所述,以上僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。 凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的 的保護(hù)范圍之內(nèi)。
權(quán)利要求
一種具有語音處理效果的移動(dòng)終端,包括音頻輸入/輸出模塊,其特征在于,還包括語音提取模塊,用來獲取從主叫方傳送過來的音頻信息;音色控制模塊,用來預(yù)設(shè)并儲(chǔ)存所需音頻信息的參數(shù);語音處理模塊,用來依據(jù)所預(yù)設(shè)的參數(shù)值對主叫方傳送過來的音頻信息進(jìn)行參數(shù)的調(diào)整。
2.如權(quán)利要求1所述的移動(dòng)終端,其特征在于還包括圖片和語音合成模塊,用來在接 收語音時(shí)調(diào)用相應(yīng)的圖片。
3.如權(quán)利要求1所述的移動(dòng)終端,其特征在于所述語音提取模塊,進(jìn)一步用于在主叫時(shí)采集主叫方的音頻信息; 所述語音處理模塊,進(jìn)一步用于在主叫時(shí),根據(jù)所預(yù)設(shè)的參數(shù)值對提取的音頻信息進(jìn) 行參數(shù)的調(diào)整。
4.如權(quán)利要求1所述的移動(dòng)終端,其特征在于,進(jìn)一步包括語音圖片合成模塊,用于 在獲取主叫方傳送過的音頻信息時(shí),將對應(yīng)的圖片和所述音頻信息合成。
5.如權(quán)利要求1所述的移動(dòng)終端,其特征在于,所述語音處理模塊包括計(jì)算音頻信息處理單元,用于在接收來電時(shí),計(jì)算所述語音提取模塊中獲取的音頻信 息的參數(shù),并與所預(yù)設(shè)的參數(shù)值進(jìn)行比較;控制音頻信息處理單元,用于調(diào)用所述計(jì)算音頻信息處理單元的比較結(jié)果,調(diào)整所述 音頻信息的參數(shù)值。
6.一種具有語音處理效果的方法,應(yīng)用于移動(dòng)終端中對音頻信息的處理,其特征在于, 包括以下步驟(1)在所述移動(dòng)終端中預(yù)設(shè)并存儲(chǔ)所需音頻信息的參數(shù)值;(2)當(dāng)所述移動(dòng)終端接收來電時(shí),檢測所述移動(dòng)終端音頻信息的參數(shù)信息;(3)在所述移動(dòng)終端接收來電時(shí),根據(jù)所述步驟(1)預(yù)設(shè)的設(shè)定值和所述步驟(2)檢測 到的音頻信息,對獲取的音頻信息進(jìn)行參數(shù)的調(diào)整。(4)在所述移動(dòng)終端接收來電時(shí),調(diào)用相應(yīng)的圖片與所述調(diào)整后的音頻信息合成。
7.如權(quán)利要求6所述的方法,其特征在于,所述步驟(2)進(jìn)一步包括當(dāng)所述移動(dòng)終端 主叫撥號(hào)時(shí),檢測所述移動(dòng)終端音頻信息的參數(shù);所述步驟(3)中進(jìn)一步包括在所述移動(dòng)終端主叫撥號(hào)時(shí),根據(jù)所述步驟(1)設(shè)定的參 數(shù)值和所述步驟(2)檢測到的參數(shù)信息,對獲取的音頻信息進(jìn)行參數(shù)的調(diào)整。
8.如權(quán)利要求7所述的方法,其特征在于,所述音頻信息的參數(shù)調(diào)整包括在時(shí)域上按 照時(shí)間長度改變的要求對信號(hào)進(jìn)行插值或抽剪,然后變換到頻域,對幅度譜和相位譜分別 進(jìn)行處理,分離基頻和共振峰,并對其進(jìn)行獨(dú)立調(diào)節(jié),調(diào)節(jié)時(shí)補(bǔ)償時(shí)間長度調(diào)整對此二者的 影響,最后恢復(fù)時(shí)域信號(hào)。
全文摘要
本發(fā)明公開了一種具有語音處理效果的移動(dòng)終端,包括音頻輸入/輸出模塊,還包括語音提取模塊,用來獲取從主叫方傳送過來的音頻信息;音色控制模塊,用來預(yù)設(shè)并儲(chǔ)存所需音頻信息的參數(shù);語音處理模塊,用來依據(jù)所預(yù)設(shè)的參數(shù)值對主叫方傳送過來的音頻信息進(jìn)行參數(shù)的調(diào)整。本發(fā)明提供了一種具有語音處理效果的移動(dòng)終端及方法,以滿足人們在通話過程中對于語音的特殊要求,實(shí)現(xiàn)音色、音調(diào),語速的調(diào)整。
文檔編號(hào)G10L21/00GK101860617SQ200910106668
公開日2010年10月13日 申請日期2009年4月12日 優(yōu)先權(quán)日2009年4月12日
發(fā)明者程星 申請人:比亞迪股份有限公司