亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

通話音的優(yōu)化方法、裝置及通話終端與流程

文檔序號:12806169閱讀:268來源:國知局
通話音的優(yōu)化方法、裝置及通話終端與流程

本發(fā)明涉及通話語音技術(shù)領(lǐng)域,具體而言,涉及一種通話音的優(yōu)化方法、裝置及通話終端。



背景技術(shù):

目前,用戶在利用手機(jī)、電話機(jī)等通話設(shè)備進(jìn)行遠(yuǎn)程溝通時(shí),經(jīng)常會(huì)因?yàn)橥ㄔ捹|(zhì)量差而影響溝通的效果。引起通話質(zhì)量差的因素有很多種,包括小區(qū)基站問題、終端天線質(zhì)量問題、人為因素等。由小區(qū)基站或終端天線等設(shè)備因素引起的通話質(zhì)量差的問題,可通過運(yùn)營商或生產(chǎn)商進(jìn)行硬件的維修和調(diào)試得以緩解。但是人為因素是很難改變的,特別是由于通話者吐字不清晰、音質(zhì)差而引起的通話質(zhì)量差,目前仍然沒有有效的解決方式。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明實(shí)施例的目的在于提供一種通話音的優(yōu)化方法、裝置及通話終端,以緩解由于人為因素引起的通話質(zhì)量差的問題。

為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例采用的技術(shù)方案如下:

第一方面,本發(fā)明實(shí)施例提供了一種通話音的優(yōu)化方法,該方法包括:對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音;獲取去噪語音的音質(zhì)清晰值,音質(zhì)清晰值為衡量去噪語音清晰程度的參數(shù);當(dāng)音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對去噪語音進(jìn)行糾音處理;輸出糾音處理后的去噪語音。

在本發(fā)明較佳的實(shí)施例中,上述對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音,包括:獲取當(dāng)前的通話音中的聲紋特征;查找預(yù)存的目標(biāo)聲紋庫中是否有與當(dāng)前的通話音中聲紋特征匹配的目標(biāo)聲紋;如果有,根據(jù)查找到的目標(biāo)聲紋從當(dāng)前的通話音中濾除噪音;如果否,基于采樣降噪法濾除通話音中的噪音。

在本發(fā)明較佳的實(shí)施例中,上述根據(jù)查找到的目標(biāo)聲紋從當(dāng)前的通話音中濾除噪音,包括:采用設(shè)定的功率放大器對通話音進(jìn)行功率放大處理;根據(jù)目標(biāo)聲紋從放大后的通話音中濾除噪音。

在本發(fā)明較佳的實(shí)施例中,上述獲取去噪語音的音質(zhì)清晰值,包括:基于預(yù)存的通用語音對所述去噪語音進(jìn)行語音識別,將識別出的語音占所述去噪語音的比例確定為所述去噪語音的音質(zhì)清晰值;或者,通過比對的方式確定去噪語音與預(yù)存的通用語音的匹配程度;將得到的匹配程度確定為去噪語音的音質(zhì)清晰值。

在本發(fā)明較佳的實(shí)施例中,上述當(dāng)音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對去噪語音進(jìn)行糾音處理,包括:當(dāng)音質(zhì)清晰值低于設(shè)定的第一清晰閾值而高于設(shè)定的第二清晰閾值時(shí),采用預(yù)先設(shè)定的濾波器對去噪語音進(jìn)行糾音;當(dāng)音質(zhì)清晰值低于設(shè)定的第二清晰閾值時(shí),將去噪語音轉(zhuǎn)換為通用語音;其中,第一清晰閾值大于第二清晰閾值。

在本發(fā)明較佳的實(shí)施例中,上述采用預(yù)先設(shè)定的濾波器對去噪語音進(jìn)行糾音包括:獲取去噪語音的聲紋波形;查找預(yù)存的目標(biāo)聲紋庫中是否有與去噪語音的聲紋波形匹配的目標(biāo)聲紋;如果有,調(diào)用與該目標(biāo)聲紋對應(yīng)的濾波器,對聲紋波形進(jìn)行補(bǔ)強(qiáng)操作。

在本發(fā)明較佳的實(shí)施例中,上述方法還包括:當(dāng)在預(yù)存的目標(biāo)聲紋庫中未查找到與聲紋波形匹配的目標(biāo)聲紋時(shí),提取去噪語音的聲紋波形,作為目標(biāo)聲紋添加到目標(biāo)聲紋庫中;生成并存儲與聲紋波形對應(yīng)的濾波器。

在本發(fā)明較佳的實(shí)施例中,上述將去噪語音轉(zhuǎn)換為通用語音包括:提取去噪語音的音調(diào)特征和音色特征;將去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;

將文字轉(zhuǎn)換成帶有音調(diào)特征和音色特征的通用語音。

在本發(fā)明較佳的實(shí)施例中,上述將去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字,包括:確定去噪語音所屬的方言類型;采用與方言類型對應(yīng)的轉(zhuǎn)換列表,將去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;轉(zhuǎn)換列表內(nèi)設(shè)置有方言語音與通用語音的文字的對應(yīng)關(guān)系。

在本發(fā)明較佳的實(shí)施例中,上述輸出糾音處理后的去噪語音包括:當(dāng)通話音來自本地通話者時(shí),通過移動(dòng)網(wǎng)絡(luò)將糾音處理后的去噪語音傳輸至通話對端的終端;當(dāng)通話音來自通話對端時(shí),通過本地音頻設(shè)備播放糾音處理后的去噪語音。

在本發(fā)明較佳的實(shí)施例中,上述方法還包括:當(dāng)接收到當(dāng)前的通話音時(shí),檢查設(shè)定的增強(qiáng)音質(zhì)功能是否為開啟狀態(tài);如果是開啟狀態(tài),執(zhí)行對當(dāng)前的通話音進(jìn)行降噪處理的步驟。

第二方面,本發(fā)明實(shí)施例提供了一種通話音的優(yōu)化裝置,該裝置包括:降噪處理模塊,用于對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音;音質(zhì)判定模塊,用于獲取去噪語音的音質(zhì)清晰值,音質(zhì)清晰值為衡量去噪語音清晰程度的參數(shù);糾音模塊,用于當(dāng)音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對去噪語音進(jìn)行糾音處理;去噪語音輸出模塊,用于輸出糾音處理后的去噪語音。

在本發(fā)明較佳的實(shí)施例中,上述降噪處理模塊包括:聲紋特征獲取單元,用于獲取當(dāng)前的通話音中的聲紋特征;目標(biāo)聲紋匹配單元,用于查找預(yù)存的目標(biāo)聲紋庫中是否有與聲紋特征匹配的目標(biāo)聲紋;第一噪音濾除單元,用于當(dāng)目標(biāo)聲紋庫中存在與聲紋特征匹配的目標(biāo)聲紋時(shí),根據(jù)目標(biāo)聲紋從通話音中濾除噪音;第二噪音濾除單元,用于當(dāng)目標(biāo)聲紋庫中不存在與聲紋特征匹配的目標(biāo)聲紋時(shí),基于采樣降噪法濾除通話音中的噪音。

在本發(fā)明較佳的實(shí)施例中,上述第一噪音濾除單元還用于采用設(shè)定的功率放大器對通話音進(jìn)行功率放大處理;根據(jù)目標(biāo)聲紋從放大后的通話音中濾除噪音。

在本發(fā)明較佳的實(shí)施例中,上述音質(zhì)判定模塊還用于通過比對的方式確定去噪語音與預(yù)存的通用語音的匹配程度;將匹配程度確定為去噪語音的音質(zhì)清晰值。

在本發(fā)明較佳的實(shí)施例中,上述糾音模塊包括:第一糾音單元,用于當(dāng)音質(zhì)清晰值低于設(shè)定的第一清晰閾值而高于設(shè)定的第二清晰閾值時(shí),采用預(yù)先設(shè)定的濾波器對去噪語音進(jìn)行糾音;第二糾音單元,用于當(dāng)音質(zhì)清晰值低于設(shè)定的第二清晰閾值時(shí),將去噪語音轉(zhuǎn)換為通用語音;其中,第一清晰閾值大于第二清晰閾值。

在本發(fā)明較佳的實(shí)施例中,上述第一糾音單元還用于獲取去噪語音的聲紋波形;查找預(yù)存的目標(biāo)聲紋庫中是否有與聲紋波形匹配的目標(biāo)聲紋;如果有,調(diào)用與目標(biāo)聲紋對應(yīng)的濾波器,對聲紋波形進(jìn)行補(bǔ)強(qiáng)操作。

在本發(fā)明較佳的實(shí)施例中,上述第一糾音單元還用于當(dāng)在預(yù)存的目標(biāo)聲紋庫中未查找到與聲紋波形匹配的目標(biāo)聲紋時(shí),提取去噪語音的聲紋波形,作為目標(biāo)聲紋添加到目標(biāo)聲紋庫中;生成并存儲與聲紋波形對應(yīng)的濾波器。

在本發(fā)明較佳的實(shí)施例中,上述第二糾音單元還用于提取去噪語音的音調(diào)特征和音色特征;將去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;將文字轉(zhuǎn)換成帶有音調(diào)特征和音色特征的通用語音。

在本發(fā)明較佳的實(shí)施例中,上述第二糾音單元還用于確定去噪語音所屬的方言類型;采用與方言類型對應(yīng)的轉(zhuǎn)換列表,將去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;轉(zhuǎn)換列表內(nèi)設(shè)置有方言語音與通用語音的文字的對應(yīng)關(guān)系。

在本發(fā)明較佳的實(shí)施例中,上述去噪語音輸出模塊包括:對端輸出單元,用于當(dāng)通話音來自本地通話者時(shí),通過移動(dòng)網(wǎng)絡(luò)將糾音處理后的去噪語音傳輸至通話對端的終端;本地輸出單元,用于當(dāng)通話音來自通話對端時(shí),通過本地音頻設(shè)備播放糾音處理后的去噪語音。

在本發(fā)明較佳的實(shí)施例中,上述裝置還包括:啟動(dòng)模塊,用于當(dāng)接收到當(dāng)前的通話音時(shí),檢查設(shè)定的增強(qiáng)音質(zhì)功能是否為開啟狀態(tài);如果是開啟狀態(tài),執(zhí)行對當(dāng)前的通話音進(jìn)行降噪處理的步驟。

第三方面,本發(fā)明實(shí)施例提供了一種通話終端。在一個(gè)可能的設(shè)計(jì)中,通話終端的結(jié)構(gòu)中包括處理器和存儲器,存儲器中存儲有上述的通話音的優(yōu)化裝置;通話音的優(yōu)化裝置包括一個(gè)或多個(gè)由處理器執(zhí)行的軟件功能模組:降噪處理模塊,用于對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音;音質(zhì)判定模塊,用于獲取去噪語音的音質(zhì)清晰值,音質(zhì)清晰值為衡量去噪語音清晰程度的參數(shù);糾音模塊,用于當(dāng)音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對去噪語音進(jìn)行糾音處理;去噪語音輸出模塊,用于輸出糾音處理后的去噪語音。

第四方面,本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)存儲介質(zhì),用于儲存為上述通話音的優(yōu)化裝置所用的計(jì)算機(jī)軟件指令,其包含用于執(zhí)行上述方面為通話音的優(yōu)化方法所設(shè)計(jì)的程序。

與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例提供的通話音的優(yōu)化方法、裝置及通話終端,通過對當(dāng)前的通話音進(jìn)行降噪處理,并在音質(zhì)清晰值過低時(shí)對降噪后的去噪語音進(jìn)行糾音處理,不僅消除了環(huán)境噪音的干擾,還緩解了由于人為因素引起的通話質(zhì)量差的問題,提高了通話音的音質(zhì),從而提升了通話者的通話感受。

為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說明如下。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,應(yīng)當(dāng)理解,以下附圖僅示出了本發(fā)明的某些實(shí)施例,因此不應(yīng)被看作是對范圍的限定,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。

圖1是本發(fā)明一實(shí)施例提供的通話音的優(yōu)化方法的流程圖;

圖2是圖1中步驟s101的流程圖;

圖3是本發(fā)明另一實(shí)施例提供的通話音的優(yōu)化方法的流程圖;

圖4是本發(fā)明再一實(shí)施例提供的通話音的優(yōu)化方法的流程圖;

圖5是本發(fā)明一實(shí)施例提供的通話音的優(yōu)化裝置的結(jié)構(gòu)框圖;

圖6是本發(fā)明另一實(shí)施例提供的通話音的優(yōu)化裝置的結(jié)構(gòu)框圖;

圖7是本發(fā)明實(shí)施例所提供的通話終端相關(guān)的手機(jī)的部分結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。通常在此處附圖中描述和示出的本發(fā)明實(shí)施例的組件可以以各種不同的配置來布置和設(shè)計(jì)。因此,以下對在附圖中提供的本發(fā)明的實(shí)施例的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實(shí)施例?;诒景l(fā)明的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

針對現(xiàn)有技術(shù)中對人為因素所引起的通話質(zhì)量差的問題,如通話者使用方言或吐字不清晰,本發(fā)明實(shí)施例提供了一種通話音的優(yōu)化方法、裝置及通話終端。該方法或裝置可以應(yīng)用于移動(dòng)或固定的通話終端上,移動(dòng)通話終端包括但不限于手機(jī)、智能手表、膝上型便攜計(jì)算機(jī)、智能穿戴設(shè)備、平板電腦等,固定通話終端包括但不限于電話機(jī)、計(jì)算機(jī)等。上述移動(dòng)通話終端或固定通話終端處于通信網(wǎng)絡(luò)中,上述通信網(wǎng)絡(luò)可以是無線網(wǎng)絡(luò)或有線網(wǎng)絡(luò),例如無線網(wǎng)絡(luò)可以是,但不限于gsm、gprs、cdma、wi-fi(無線保真)網(wǎng)絡(luò)、2g/3g/4g網(wǎng)絡(luò)等。用戶可以通過通話終端或通話終端上安裝的軟件(如電話、qq、微信等)進(jìn)行遠(yuǎn)程通話。

實(shí)施例一

圖1示出了該實(shí)施例提供的通話音的優(yōu)化方法的流程圖。該方法可以在移動(dòng)終端上執(zhí)行,該移動(dòng)終端可以是發(fā)起呼叫端的設(shè)備,也可以是被呼叫端的設(shè)備。如圖1所示,該方法包括以下步驟:

步驟s101,對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音;

該步驟中的降噪處理主要用于濾除本地通話者或通話對端的通話者的周邊環(huán)境中的噪音。

步驟s102,獲取去噪語音的音質(zhì)清晰值,該音質(zhì)清晰值為衡量去噪語音清晰程度的參數(shù);

考慮到步驟s101中對通話音的降噪處理,通常是濾除環(huán)境噪音,無法緩解因人為因素導(dǎo)致的通話音不清晰,為了確定去噪語音能否正常輸出,本實(shí)施例引入了音質(zhì)清晰值這一參數(shù)。

具體實(shí)現(xiàn)時(shí),可以基于通用語音(標(biāo)準(zhǔn)的普通話發(fā)音)對去噪語音進(jìn)行語音識別,將識別出的語音占整個(gè)去噪語音的比例作為上述音質(zhì)清晰值,用以衡量該去噪語音清晰程度,也可以將通用語音與去噪語音的匹配程度作為上述音質(zhì)清晰值。

步驟s103,當(dāng)上述音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對去噪語音進(jìn)行糾音處理;

其中,設(shè)定的清晰閾值可以根據(jù)經(jīng)驗(yàn)選取具體的數(shù)值,該數(shù)值可以是一個(gè)百分比形式的數(shù)字,例如:90%,60%等。當(dāng)上述音質(zhì)清晰值高于或等于設(shè)定的清晰閾值時(shí),說明降噪后的去噪語音能夠滿足聽覺要求,不需要進(jìn)行糾音處理即可直接輸出;當(dāng)上述音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),說明去噪語音還不夠清晰,直接輸出后的收聽效果較差,需要進(jìn)行糾音處理。

該糾音處理可以有多種方式,針對某些字發(fā)音錯(cuò)誤導(dǎo)致的不清楚,可以直接用對應(yīng)字的正確發(fā)音替換。針對嗓音沙啞或方言等不清楚的問題,可以整體進(jìn)行語音轉(zhuǎn)文字,再文字轉(zhuǎn)語音的方式進(jìn)行糾音。

步驟s104,輸出糾音處理后的去噪語音。

由于步驟s101中的通話音可能來自本地通話者或通話對端,所以,步驟s104中輸出去噪語音也分為兩種情況,一種情況是:當(dāng)通話音來自本地通話者時(shí),通過移動(dòng)網(wǎng)絡(luò)將糾音處理后的去噪語音傳輸至通話對端的終端;另一種情況是:當(dāng)通話音來自通話對端時(shí),通過本地音頻設(shè)備播放糾音處理后的去噪語音。

該實(shí)施例提供的通話音的優(yōu)化方法,通過對當(dāng)前的通話音進(jìn)行降噪處理,并在音質(zhì)清晰值過低時(shí)對降噪后的去噪語音進(jìn)行糾音處理,不僅消除了環(huán)境噪音的干擾,還緩解了由于人為因素引起的通話質(zhì)量差的問題,提高了通話音的音質(zhì),從而提升了通話者的通話感受。

本發(fā)明實(shí)施例不僅可以對來自通話對端的對方通話者的語音進(jìn)行優(yōu)化處理,而且可以對本地通話者的語音進(jìn)行優(yōu)化處理再傳輸給對方,使通話雙方都能聽到清晰的語音,有效提高通話質(zhì)量。

其中,步驟s101的一種具體實(shí)現(xiàn)方式如圖2所示,進(jìn)一步包括如下步驟:

步驟s1011,獲取當(dāng)前的通話音中的聲紋特征。

在本實(shí)施例中,當(dāng)前的通話音包括兩種:一種來自本地通話者,一種來自一個(gè)或多個(gè)通話對端。當(dāng)該方法應(yīng)用于電話會(huì)議時(shí),本地通話者和通話對端的通話者可以是一人或多人。

由于每個(gè)人的發(fā)聲器官在尺寸和形態(tài)上各不相同,因此,每個(gè)人在講話時(shí)的聲紋圖譜也會(huì)存在一定的差異。聲紋特征是聲紋所具備的特征參數(shù),是使得聲紋可量化的參數(shù),不同的聲紋特征可以區(qū)分不同的發(fā)聲者。

步驟s1012,查找預(yù)存的目標(biāo)聲紋庫中是否有與當(dāng)前的通話音中聲紋特征匹配的目標(biāo)聲紋;如果是,執(zhí)行步驟s1013;如果否,執(zhí)行步驟s1014。

目標(biāo)聲紋庫中存儲有已錄入的通話者的語音聲紋特征,這些語音聲紋特征可以認(rèn)為是不含噪音的正確的聲紋特征。

目標(biāo)聲紋的錄入過程包括但不限于通話終端的用戶主動(dòng)錄制或通話終端在使用過程中進(jìn)行錄制。例如,在非通話模式下,通話終端的用戶近距離地直接將被錄音者的語音錄入終端,然后通話終端提取被錄音者的聲紋特征并保存為目標(biāo)聲紋;在通話模式下,通話終端記錄通話者的通話語音,然后提取該通話語音的聲紋特征并保存為該通話者的目標(biāo)聲紋。

步驟s1013,根據(jù)查找到的目標(biāo)聲紋從當(dāng)前的通話音中濾除噪音。其中,噪音的具體濾除過程可以采用如下方式實(shí)現(xiàn):

(1)采用設(shè)定的功率放大器對通話音進(jìn)行功率放大處理;例如:可以采用硬件的功率放大電路或軟件的功率放大單元對通話音進(jìn)行放大;

(2)根據(jù)上述目標(biāo)聲紋從放大后的通話音中濾除噪音。

上述通話音經(jīng)功率放大后,更容易區(qū)分語音和噪音,進(jìn)而便于按照目標(biāo)聲紋從通話音中識別出語音,將語音與噪音分離,濾除噪音。

步驟s1014,基于采樣降噪法濾除通話音中的噪音。

采樣降噪法首先獲取一段無噪音的通話音的頻率特性,然后對通話音進(jìn)行采樣,在混有噪音的音頻波形中,將上述符合該頻率特性的噪音從通話音中去除。

通過圖2的方式濾除通話音中的噪音后,可以得到更純粹的語音,使后續(xù)的糾音處理更有針對性,有助于增強(qiáng)糾音處理的效果,大幅度提高通話語音的清晰度,提高通話質(zhì)量。

實(shí)施例二

本實(shí)施例中,主要考慮人為因素導(dǎo)致的音質(zhì)不清晰中常見的兩種因素:一種是方言,一種是吐字不清楚。而這兩種因素對應(yīng)的音質(zhì)清晰值有明顯不同的區(qū)間范圍,基于此,本實(shí)施例提供了如圖3所示的通話音的優(yōu)化方法,該方法包括以下步驟:

步驟s301,對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音;

步驟s302,獲取去噪語音的音質(zhì)清晰值,該音質(zhì)清晰值為衡量去噪語音清晰程度的參數(shù),具體內(nèi)容同上述實(shí)施例中的描述,這里不再贅述;

步驟s303,判斷音質(zhì)清晰值是否低于設(shè)定的第一清晰閾值;如果是,執(zhí)行步驟s304;如果否,執(zhí)行步驟s307。

步驟s304,判斷音質(zhì)清晰值是否高于設(shè)定的第二清晰閾值;如果是,執(zhí)行步驟305;如果否,執(zhí)行步驟306。

其中,上述第一清晰閾值大于第二清晰閾值。

為了便于理解,本實(shí)施例設(shè)音質(zhì)清晰值為a,設(shè)定s1為第一清晰閾值,s2為第二清晰閾值,s1>s2。當(dāng)a≥s1時(shí),說明當(dāng)前的去噪語音足夠清楚,可以直接輸出;當(dāng)s1>a≥s2時(shí),說明當(dāng)前的去噪語音還存在吐字不清楚的問題,需要進(jìn)行濾波器糾音;當(dāng)a<s2時(shí),說明當(dāng)前的去噪語音為方言,需要轉(zhuǎn)換糾音,具體如下。

步驟s305,采用預(yù)先設(shè)定的濾波器對去噪語音進(jìn)行糾音,然后執(zhí)行步驟s307。

步驟s306,將去噪語音轉(zhuǎn)換為通用語音,然后執(zhí)行步驟s307;

步驟s307,輸出上述語音,該語音可能是步驟s301降噪處理后的去噪語音,也可能是步驟s305的過濾器糾音后的去噪語音,還可能是步驟s306中轉(zhuǎn)換處理后的通用語音。

當(dāng)a≥s1時(shí),表示去噪語音與通用語音幾乎完全匹配,說明降噪后的去噪語音能夠滿足聽覺要求,無需進(jìn)行糾音處理,可直接輸出去噪語音。

當(dāng)s1>a≥s2時(shí),說明去噪語音與通用語音大部分匹配,可認(rèn)為通話者使用的是通用語言,但某些語音存在吐字不清的問題,因此可以先采用預(yù)先設(shè)定的濾波器對去噪語音進(jìn)行糾音處理,例如:首先獲取去噪語音的聲紋波形;查找預(yù)存的目標(biāo)聲紋庫中是否有與去噪語音的聲紋波形匹配的目標(biāo)聲紋;如果有,調(diào)用與目標(biāo)聲紋對應(yīng)的濾波器,對聲紋波形進(jìn)行補(bǔ)強(qiáng)操作;如果沒有,提取去噪語音的聲紋波形,作為目標(biāo)聲紋添加到目標(biāo)聲紋庫中;生成并存儲與聲紋波形對應(yīng)的濾波器。

當(dāng)a<s2時(shí),表示去噪語音與通用語音大部分不匹配,可認(rèn)為通話者使用的不是通用語言,此時(shí),可以將去噪語音轉(zhuǎn)換為通用語音,例如:提取去噪語音的音調(diào)特征和音色特征;將去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;將文字轉(zhuǎn)換成帶有上述音調(diào)特征和音色特征的通用語音。

考慮到方言的種類很多,系統(tǒng)可以預(yù)先為每一種方言設(shè)立了一個(gè)轉(zhuǎn)換列表,轉(zhuǎn)換列表內(nèi)設(shè)置有方言語音與通用語音的文字的對應(yīng)關(guān)系。在將去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字時(shí),要先確定去噪語音所屬的方言類型;采用與方言類型對應(yīng)的轉(zhuǎn)換列表,將去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字。

本發(fā)明實(shí)施例根據(jù)去噪語音的不同清晰程度,分析引起去噪語音不清晰的原因,采用不同的糾音方式對去噪語音進(jìn)行糾音處理,能夠更有效地提高輸出的語音的清晰度。

實(shí)施例三

考慮到用戶需求的多樣化,本實(shí)施例還設(shè)置了供用戶選擇的增強(qiáng)音質(zhì)功能的控制按鍵或選項(xiàng),用戶可以根據(jù)需要選擇打開或關(guān)閉增強(qiáng)音質(zhì)功能。如果該增強(qiáng)音質(zhì)功能為打開狀態(tài),則可以執(zhí)行實(shí)施例一或?qū)嵤├械耐ㄔ捯舻膬?yōu)化方法;如果該增強(qiáng)音質(zhì)功能為關(guān)閉狀態(tài),則可以按照相關(guān)技術(shù)直接輸出當(dāng)前的通話音,或者僅對當(dāng)前的通話音進(jìn)行上述降噪處理后輸出。

參見圖4所示的通話音的優(yōu)化方法的具體流程圖,該方法包括以下步驟:

步驟s401,當(dāng)接收到當(dāng)前的通話音時(shí),判斷設(shè)定的增強(qiáng)音質(zhì)功能是否為開啟狀態(tài);如果是,執(zhí)行步驟s402,如果否,執(zhí)行步驟s405。

具體地,增強(qiáng)音質(zhì)功能的開啟包括以下方式中的一種:觸屏方式、滑屏方式、按鍵方式。用戶可以在通話接通前,開啟增強(qiáng)音質(zhì)功能,也可以在通話過程中,開啟增強(qiáng)音質(zhì)功能。

步驟s402,對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音。

為了滿足不同用戶的個(gè)性化需求,如某些用戶只需要濾除環(huán)境中的噪音,而并不需要對語音進(jìn)行轉(zhuǎn)換或糾音,在另一具體實(shí)施方式中,上述步驟s401和步驟s402的執(zhí)行順序可互換。即先對通話音進(jìn)行降噪處理,然后再判斷增強(qiáng)音質(zhì)功能是否為開啟狀態(tài);如果是,執(zhí)行步驟s403,如果否,執(zhí)行步驟s405。

步驟s403,獲取去噪語音的音質(zhì)清晰值。

步驟s404,當(dāng)音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對去噪語音進(jìn)行糾音處理。

步驟s405,輸出通話音。

由于步驟s401和步驟s402的執(zhí)行順序可互換,因此,步驟s405中輸出的通話音可能是接收到當(dāng)前的通話音,也可能是將降噪處理,濾除環(huán)境噪音后的去噪語音,還可能是步驟s404中糾音處理后的語音。

本實(shí)施例在上述兩實(shí)施例的基礎(chǔ)上,增設(shè)了可供用戶選擇的增強(qiáng)音質(zhì)功能的控制方式,使用戶可以自主打開或關(guān)閉增強(qiáng)音質(zhì)功能,滿足了用戶的個(gè)性化需求。

實(shí)施例四

與上述實(shí)施例一提供的優(yōu)化方法相對應(yīng)的,該實(shí)施例還提供了一種通話音的優(yōu)化裝置。如圖5所示,該裝置包括:

降噪處理模塊51,用于對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音;

音質(zhì)判定模塊52,用于獲取去噪語音的音質(zhì)清晰值,音質(zhì)清晰值為衡量去噪語音清晰程度的參數(shù);在一個(gè)較佳的實(shí)施例中,音質(zhì)判定模塊52還用于基于預(yù)存的通用語音對去噪語音進(jìn)行語音識別,將識別出的語音占去噪語音的比例確定為去噪語音的音質(zhì)清晰值;或者,通過比對的方式確定去噪語音與預(yù)存的通用語音的匹配程度;將匹配程度確定為去噪語音的音質(zhì)清晰值。

糾音模塊53,用于當(dāng)音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對去噪語音進(jìn)行糾音處理;

去噪語音輸出模塊54,用于輸出糾音處理后的去噪語音。

該實(shí)施例提供的通話音的優(yōu)化裝置,通過降噪處理模塊52對當(dāng)前的通話音進(jìn)行降噪處理,并在音質(zhì)清晰值低于清晰閾值時(shí),通過糾音模塊53對去噪語音進(jìn)行糾音處理,不僅可以消除環(huán)境噪音的干擾,而且能夠緩解由于人為因素引起的通話質(zhì)量差的問題,有效提高通話質(zhì)量。

實(shí)施例五

圖6示出了該實(shí)施例提供的通話音的優(yōu)化裝置的結(jié)構(gòu)框圖。如圖6所示,在圖5所示的通話音的優(yōu)化裝置的基礎(chǔ)上,降噪處理模塊51具體可以包括:

聲紋特征獲取單元511,用于獲取當(dāng)前的通話音中的聲紋特征;

目標(biāo)聲紋匹配單元512,用于查找預(yù)存的目標(biāo)聲紋庫中是否有與聲紋特征匹配的目標(biāo)聲紋;

第一噪音濾除單元513,用于當(dāng)目標(biāo)聲紋庫中存在與聲紋特征匹配的目標(biāo)聲紋時(shí),根據(jù)目標(biāo)聲紋從通話音中濾除噪音;在一具體實(shí)現(xiàn)方式中,第一噪音濾除單元513還用于采用設(shè)定的功率放大器對通話音進(jìn)行功率放大處理;根據(jù)目標(biāo)聲紋從放大后的通話音中濾除噪音。

第二噪音濾除單元514,用于當(dāng)目標(biāo)聲紋庫中不存在與聲紋特征匹配的目標(biāo)聲紋時(shí),基于采樣降噪法濾除通話音中的噪音。

糾音模塊53具體可以包括:

第一糾音單元531,用于當(dāng)音質(zhì)清晰值低于設(shè)定的第一清晰閾值而高于設(shè)定的第二清晰閾值時(shí),采用預(yù)先設(shè)定的濾波器對去噪語音進(jìn)行糾音;優(yōu)選地,第一糾音單元531還用于獲取去噪語音的聲紋波形;查找預(yù)存的目標(biāo)聲紋庫中是否有與聲紋波形匹配的目標(biāo)聲紋;如果有,調(diào)用與目標(biāo)聲紋對應(yīng)的濾波器,對聲紋波形進(jìn)行補(bǔ)強(qiáng)操作;具體來說,第一糾音單元531還用于當(dāng)在預(yù)存的目標(biāo)聲紋庫中未查找到與聲紋波形匹配的目標(biāo)聲紋時(shí),提取去噪語音的聲紋波形,作為目標(biāo)聲紋添加到目標(biāo)聲紋庫中;生成并存儲與聲紋波形對應(yīng)的濾波器。

第二糾音單元532,用于當(dāng)音質(zhì)清晰值低于設(shè)定的第二清晰閾值時(shí),將去噪語音轉(zhuǎn)換為通用語音;其中,第一清晰閾值大于第二清晰閾值;優(yōu)選地,第二糾音單元532還用于提取去噪語音的音調(diào)特征和音色特征;將去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;將文字轉(zhuǎn)換成帶有音調(diào)特征和音色特征的通用語音;具體來說,第二糾音單元532還用于確定去噪語音所屬的方言類型;采用與方言類型對應(yīng)的轉(zhuǎn)換列表,將去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;轉(zhuǎn)換列表內(nèi)設(shè)置有方言語音與通用語音的文字的對應(yīng)關(guān)系。

去噪語音輸出模塊54具體可以包括:

對端輸出單元541,用于當(dāng)通話音來自本地通話者時(shí),通過移動(dòng)網(wǎng)絡(luò)將糾音處理后的去噪語音傳輸至通話對端的終端;

本地輸出單元542,用于當(dāng)通話音來自通話對端時(shí),通過本地音頻設(shè)備播放糾音處理后的去噪語音。

在另一較佳的實(shí)施例中,上述裝置還可以包括:啟動(dòng)模塊,用于當(dāng)接收到當(dāng)前的通話音時(shí),檢查設(shè)定的增強(qiáng)音質(zhì)功能是否為開啟狀態(tài);如果是開啟狀態(tài),執(zhí)行對當(dāng)前的通話音進(jìn)行降噪處理的步驟。

上述實(shí)施例所提供的通話音的優(yōu)化裝置,其實(shí)現(xiàn)原理及產(chǎn)生的技術(shù)效果和前述實(shí)施例相同,為簡要描述,裝置實(shí)施例部分未提及之處,可參考前述方法實(shí)施例中相應(yīng)內(nèi)容。

實(shí)施例六

相應(yīng)地,本發(fā)明實(shí)施例還提供了一種通話終端,如圖7所示,為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,具體技術(shù)細(xì)節(jié)未揭示的,請參照本發(fā)明實(shí)施例方法部分。該終端可以為包括手機(jī)、平板電腦、pda(personaldigitalassistant,個(gè)人數(shù)字助理)、便攜計(jì)算機(jī)等任意終端設(shè)備,下面以通話終端為手機(jī)為例,進(jìn)行說明:

圖7示出了本發(fā)明實(shí)施例所提供的通話終端相關(guān)的手機(jī)的部分結(jié)構(gòu)示意圖。如圖7所示,該手機(jī)包括:rf(radiofrequency,射頻)電路110、存儲器120、輸入單元130、顯示單元140、傳感器150、音頻設(shè)備160、wifi(wirelessfidelity,無線保真)模塊170、處理器180、以及電源190等部件。本領(lǐng)域技術(shù)人員可以理解,圖7中示出的手機(jī)結(jié)構(gòu)并不構(gòu)成對通話終端的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。

下面結(jié)合圖7對手機(jī)的各個(gè)構(gòu)成部件進(jìn)行具體的介紹:

rf電路110可用于收發(fā)信息或通話過程中,信號的接收和發(fā)送,特別地,將基站的下行信息接收后,給處理器180處理;另外,將設(shè)計(jì)上行的數(shù)據(jù)發(fā)送給基站。通常,rf電路110包括但不限于天線、至少一個(gè)放大器、收發(fā)信機(jī)、耦合器、低噪聲放大器(lownoiseamplifier,lna)、雙工器等。此外,rf電路110還可以通過無線通信與網(wǎng)絡(luò)和其他設(shè)備通信。上述無線通信可以使用任一通信標(biāo)準(zhǔn)或協(xié)議,包括但不限于全球移動(dòng)通訊系統(tǒng)(globalsystemofmobilecommunication,gsm)、通用分組無線服務(wù)(generalpacketradioservice,gprs)、碼分多址(codedivisionmultipleaccess,cdma)、寬帶碼分多址(widebandcodedivisionmultipleaccess,wcdma)、長期演進(jìn)(longtermevolution,lte)等。

存儲器120可用于存儲軟件程序以及模塊,如本發(fā)明實(shí)施例中的通話音的優(yōu)化方法以及裝置對應(yīng)的程序指令/模塊,處理器180通過運(yùn)行存儲在存儲器120內(nèi)的軟件程序以及模塊,從而執(zhí)行手機(jī)的各種功能應(yīng)用以及數(shù)據(jù)處理,如本發(fā)明實(shí)施例提供的通話音的優(yōu)化方法。存儲器120可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序(比如聲音播放功能、微信等)等;存儲數(shù)據(jù)區(qū)可存儲根據(jù)手機(jī)的使用所創(chuàng)建的數(shù)據(jù)(比如通話者的語音、目標(biāo)聲紋庫等)等。此外,存儲器120可以包括高速隨機(jī)存取存儲器,還可以包括非易失性存儲器,例如至少一個(gè)磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。

本發(fā)明實(shí)施例的存儲器120中存儲有通話音的優(yōu)化裝置;通話音的優(yōu)化裝置包括一個(gè)或多個(gè)由處理器180執(zhí)行的軟件功能模組,通話音的優(yōu)化裝置包括:降噪處理模塊,用于對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音;音質(zhì)判定模塊,用于獲取去噪語音的音質(zhì)清晰值,音質(zhì)清晰值為衡量去噪語音清晰程度的參數(shù);糾音模塊,用于當(dāng)音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對去噪語音進(jìn)行糾音處理;去噪語音輸出模塊,用于輸出糾音處理后的去噪語音。

輸入單元130可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與手機(jī)的用戶設(shè)置以及功能控制有關(guān)的鍵信號輸入。具體地,輸入單元130可包括觸控面板131以及其他輸入設(shè)備132。觸控面板131,也稱為觸摸屏,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板131上或在觸控面板131附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動(dòng)相應(yīng)的連接裝置??蛇x的,觸控面板131可包括觸摸檢測裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測裝置檢測用戶的觸摸方位,并檢測觸摸操作帶來的信號,將信號傳送給觸摸控制器;觸摸控制器從觸摸檢測裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給處理器180,并能接收處理器180發(fā)來的命令并加以執(zhí)行(如執(zhí)行本發(fā)明實(shí)施例中的增強(qiáng)音質(zhì)功能的開啟動(dòng)作)。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實(shí)現(xiàn)觸控面板131。除了觸控面板131,輸入單元130還可以包括其他輸入設(shè)備132。具體地,其他輸入設(shè)備132可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。

顯示單元140可用于顯示由用戶輸入的信息或提供給用戶的信息以及手機(jī)的各種菜單。顯示單元140可包括顯示面板141,可選的,可以采用液晶顯示器(liquidcrystaldisplay,lcd)、有機(jī)發(fā)光二極管(organiclight-emittingdiode,oled)等形式來配置顯示面板141。進(jìn)一步的,觸控面板131可覆蓋顯示面板141,當(dāng)觸控面板131檢測到在其上或附近的觸摸操作后,傳送給處理器180以確定觸摸事件的類型,隨后處理器180根據(jù)觸摸事件的類型做處理。雖然在圖7中,觸控面板131與顯示面板141是作為兩個(gè)獨(dú)立的部件來實(shí)現(xiàn)手機(jī)的輸入和輸出功能,但是在某些實(shí)施例中,可以將觸控面板131與顯示面板141集成而實(shí)現(xiàn)手機(jī)的輸入和輸出功能。

手機(jī)還可包括至少一種傳感器150,比如光傳感器、運(yùn)動(dòng)傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來調(diào)節(jié)顯示面板141的亮度,接近傳感器可在手機(jī)移動(dòng)到耳邊時(shí),關(guān)閉顯示面板141和/或背光。作為運(yùn)動(dòng)傳感器的一種,加速計(jì)傳感器可檢測各個(gè)方向上(一般為三軸)加速度的大小,靜止時(shí)可檢測出重力的大小及方向,可用于識別手機(jī)姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計(jì)姿態(tài)校準(zhǔn))、振動(dòng)識別相關(guān)功能(比如計(jì)步器、敲擊)等;至于手機(jī)還可配置的陀螺儀、氣壓計(jì)、濕度計(jì)、溫度計(jì)、紅外線傳感器等其他傳感器,在此不再贅述。

音頻設(shè)備160、揚(yáng)聲器161,傳聲器162可提供用戶與手機(jī)之間的音頻接口。音頻設(shè)備160可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號,傳輸?shù)綋P(yáng)聲器161,由揚(yáng)聲器161轉(zhuǎn)換為聲音信號輸出;另一方面,傳聲器162將收集的聲音信號轉(zhuǎn)換為電信號,由音頻設(shè)備160接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器180處理后,經(jīng)rf電路110以發(fā)送給比如另一手機(jī)或其它通話終端,或者將音頻數(shù)據(jù)輸出至存儲器120以便進(jìn)一步處理。

wifi屬于短距離無線傳輸技術(shù),手機(jī)通過wifi模塊170可以幫助用戶通過qq、微信等app傳輸音頻,它為用戶提供了無線的寬帶互聯(lián)網(wǎng)訪問。雖然圖7示出了wifi模塊170,但是可以理解的是,其并不屬于手機(jī)的必須構(gòu)成,完全可以根據(jù)需要在不改變發(fā)明的本質(zhì)的范圍內(nèi)而省略。

處理器180是手機(jī)的控制中心,利用各種接口和線路連接整個(gè)手機(jī)的各個(gè)部分,通過運(yùn)行或執(zhí)行存儲在存儲器120內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲在存儲器120內(nèi)的數(shù)據(jù),執(zhí)行手機(jī)的各種功能和處理數(shù)據(jù),從而對手機(jī)進(jìn)行整體監(jiān)控??蛇x的,處理器180可包括一個(gè)或多個(gè)處理單元;優(yōu)選的,處理器180可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無線通信??梢岳斫獾氖?,上述調(diào)制解調(diào)處理器也可以不集成到處理器180中。

手機(jī)還包括給各個(gè)部件供電的電源190(比如電池),優(yōu)選的,電源可以通過電源管理系統(tǒng)與處理器180邏輯相連,從而通過電源管理系統(tǒng)實(shí)現(xiàn)管理充電、放電、以及功耗管理等功能。

可以理解,圖7所示的結(jié)構(gòu)僅為示意,手機(jī)還可包括比圖7中所示更多或者更少的組件,或者具有與圖7所示不同的配置。圖7中所示的各組件可以采用硬件、軟件或其組合實(shí)現(xiàn)。

于本發(fā)明實(shí)施例中,手機(jī)中安裝有客戶端,該客戶端可以是第三方應(yīng)用軟件,如qq、微信等,為用戶提供傳輸音頻的服務(wù)。

本發(fā)明實(shí)施例所提供的通話終端,其實(shí)現(xiàn)原理及產(chǎn)生的技術(shù)效果和前述方法實(shí)施例相同,為簡要描述,通話終端實(shí)施例部分未提及之處,可參考前述方法實(shí)施例中相應(yīng)內(nèi)容。

在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的終端、裝置和方法,也可以通過其它的方式實(shí)現(xiàn)。以上所描述的裝置和終端實(shí)施例僅僅是示意性的,例如,附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個(gè)實(shí)施例的裝置、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)方式中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動(dòng)作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。

另外,在本發(fā)明各個(gè)實(shí)施例中的各功能模塊或單元可以集成在一起形成一個(gè)獨(dú)立的部分,也可以是各個(gè)模塊單獨(dú)存在,也可以兩個(gè)或兩個(gè)以上模塊集成形成一個(gè)獨(dú)立的部分。

所述功能如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲在一個(gè)計(jì)算機(jī)可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲在一個(gè)存儲介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、移動(dòng)硬盤、只讀存儲器(rom,read-onlymemory)、隨機(jī)存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序,也不能理解為指示或暗示相對重要性。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。

以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。應(yīng)注意到:相似的標(biāo)號和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對其進(jìn)行進(jìn)一步定義和解釋。

以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。

本發(fā)明實(shí)施例還揭示了:

a1.一種通話音的優(yōu)化方法,包括:

對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音;

獲取所述去噪語音的音質(zhì)清晰值,所述音質(zhì)清晰值為衡量所述去噪語音清晰程度的參數(shù);

當(dāng)所述音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對所述去噪語音進(jìn)行糾音處理;

輸出糾音處理后的去噪語音。

a2.根據(jù)a1所述的方法,對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音,包括:

獲取當(dāng)前的通話音中的聲紋特征;

查找預(yù)存的目標(biāo)聲紋庫中是否有與所述聲紋特征匹配的目標(biāo)聲紋;

如果有,根據(jù)所述目標(biāo)聲紋從所述通話音中濾除噪音;

如果否,基于采樣降噪法濾除所述通話音中的噪音。

a3.根據(jù)a2所述的方法,根據(jù)所述目標(biāo)聲紋從所述通話音中濾除噪音包括:

采用設(shè)定的功率放大器對所述通話音進(jìn)行功率放大處理;

根據(jù)所述目標(biāo)聲紋從放大后的通話音中濾除噪音。

a4.根據(jù)a1所述的方法,獲取所述去噪語音的音質(zhì)清晰值包括:

基于預(yù)存的通用語音對所述去噪語音進(jìn)行語音識別,將識別出的語音占所述去噪語音的比例確定為所述去噪語音的音質(zhì)清晰值;或者,

通過比對的方式確定所述去噪語音與預(yù)存的通用語音的匹配程度;

將所述匹配程度確定為所述去噪語音的音質(zhì)清晰值。

a5.根據(jù)a1所述的方法,當(dāng)所述音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對所述去噪語音進(jìn)行糾音處理,包括:

當(dāng)所述音質(zhì)清晰值低于設(shè)定的第一清晰閾值而高于設(shè)定的第二清晰閾值時(shí),采用預(yù)先設(shè)定的濾波器對所述去噪語音進(jìn)行糾音;

當(dāng)所述音質(zhì)清晰值低于設(shè)定的第二清晰閾值時(shí),將所述去噪語音轉(zhuǎn)換為通用語音;

其中,所述第一清晰閾值大于所述第二清晰閾值。

a6.根據(jù)a5所述的方法,所述采用預(yù)先設(shè)定的濾波器對所述去噪語音進(jìn)行糾音包括:

獲取所述去噪語音的聲紋波形;

查找預(yù)存的目標(biāo)聲紋庫中是否有與所述聲紋波形匹配的目標(biāo)聲紋;

如果有,調(diào)用與所述目標(biāo)聲紋對應(yīng)的濾波器,對所述聲紋波形進(jìn)行補(bǔ)強(qiáng)操作。

a7.根據(jù)a6所述的方法,所述方法還包括:

當(dāng)在預(yù)存的目標(biāo)聲紋庫中未查找到與所述聲紋波形匹配的目標(biāo)聲紋時(shí),提取所述去噪語音的聲紋波形,作為目標(biāo)聲紋添加到所述目標(biāo)聲紋庫中;

生成并存儲與所述聲紋波形對應(yīng)的濾波器。

a8.根據(jù)a5所述的方法,將所述去噪語音轉(zhuǎn)換為通用語音包括:

提取所述去噪語音的音調(diào)特征和音色特征;

將所述去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;

將所述文字轉(zhuǎn)換成帶有所述音調(diào)特征和音色特征的通用語音。

a9.根據(jù)a8所述的方法,將所述去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字,包括:

確定所述去噪語音所屬的方言類型;

采用與所述方言類型對應(yīng)的轉(zhuǎn)換列表,將所述去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;所述轉(zhuǎn)換列表內(nèi)設(shè)置有方言語音與通用語音的文字的對應(yīng)關(guān)系。

a10.根據(jù)a1所述的方法,輸出糾音處理后的去噪語音包括:

當(dāng)所述通話音來自本地通話者時(shí),通過移動(dòng)網(wǎng)絡(luò)將糾音處理后的去噪語音傳輸至通話對端的終端;

當(dāng)所述通話音來自通話對端時(shí),通過本地音頻設(shè)備播放糾音處理后的去噪語音。

a11.根據(jù)a1-a10任一項(xiàng)所述的方法,所述方法還包括:

當(dāng)接收到當(dāng)前的通話音時(shí),檢查設(shè)定的增強(qiáng)音質(zhì)功能是否為開啟狀態(tài);

如果是開啟狀態(tài),執(zhí)行所述對當(dāng)前的通話音進(jìn)行降噪處理的步驟。

b12.一種通話音的優(yōu)化裝置,包括:

降噪處理模塊,用于對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音;

音質(zhì)判定模塊,用于獲取所述去噪語音的音質(zhì)清晰值,所述音質(zhì)清晰值為衡量所述去噪語音清晰程度的參數(shù);

糾音模塊,用于當(dāng)所述音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對所述去噪語音進(jìn)行糾音處理;

去噪語音輸出模塊,用于輸出糾音處理后的去噪語音。

b13.根據(jù)b12所述的裝置,所述降噪處理模塊包括:

聲紋特征獲取單元,用于獲取當(dāng)前的通話音中的聲紋特征;

目標(biāo)聲紋匹配單元,用于查找預(yù)存的目標(biāo)聲紋庫中是否有與所述聲紋特征匹配的目標(biāo)聲紋;

第一噪音濾除單元,用于當(dāng)所述目標(biāo)聲紋庫中存在與所述聲紋特征匹配的目標(biāo)聲紋時(shí),根據(jù)所述目標(biāo)聲紋從所述通話音中濾除噪音;

第二噪音濾除單元,用于當(dāng)所述目標(biāo)聲紋庫中不存在與所述聲紋特征匹配的目標(biāo)聲紋時(shí),基于采樣降噪法濾除所述通話音中的噪音。

b14.根據(jù)b13所述的裝置,所述第一噪音濾除單元還用于采用設(shè)定的功率放大器對所述通話音進(jìn)行功率放大處理;根據(jù)所述目標(biāo)聲紋從放大后的通話音中濾除噪音。

b15.根據(jù)b12所述的裝置,所述音質(zhì)判定模塊還用于基于預(yù)存的通用語音對所述去噪語音進(jìn)行語音識別,將識別出的語音占所述去噪語音的比例確定為所述去噪語音的音質(zhì)清晰值;或者,通過比對的方式確定所述去噪語音與預(yù)存的通用語音的匹配程度;將所述匹配程度確定為所述去噪語音的音質(zhì)清晰值。

b16.根據(jù)b12所述的裝置,所述糾音模塊包括:

第一糾音單元,用于當(dāng)所述音質(zhì)清晰值低于設(shè)定的第一清晰閾值而高于設(shè)定的第二清晰閾值時(shí),采用預(yù)先設(shè)定的濾波器對所述去噪語音進(jìn)行糾音;

第二糾音單元,用于當(dāng)所述音質(zhì)清晰值低于設(shè)定的第二清晰閾值時(shí),將所述去噪語音轉(zhuǎn)換為通用語音;

其中,所述第一清晰閾值大于所述第二清晰閾值。

b17.根據(jù)b16所述的裝置,所述第一糾音單元還用于獲取所述去噪語音的聲紋波形;查找預(yù)存的目標(biāo)聲紋庫中是否有與所述聲紋波形匹配的目標(biāo)聲紋;如果有,調(diào)用與所述目標(biāo)聲紋對應(yīng)的濾波器,對所述聲紋波形進(jìn)行補(bǔ)強(qiáng)操作。

b18.根據(jù)b17所述的裝置,所述第一糾音單元還用于當(dāng)在預(yù)存的目標(biāo)聲紋庫中未查找到與所述聲紋波形匹配的目標(biāo)聲紋時(shí),提取所述去噪語音的聲紋波形,作為目標(biāo)聲紋添加到所述目標(biāo)聲紋庫中;生成并存儲與所述聲紋波形對應(yīng)的濾波器。

b19.根據(jù)b16所述的裝置,所述第二糾音單元還用于提取所述去噪語音的音調(diào)特征和音色特征;將所述去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;將所述文字轉(zhuǎn)換成帶有所述音調(diào)特征和音色特征的通用語音。

b20.根據(jù)b19所述的裝置,所述第二糾音單元還用于確定所述去噪語音所屬的方言類型;采用與所述方言類型對應(yīng)的轉(zhuǎn)換列表,將所述去噪語音轉(zhuǎn)換成通用語音對應(yīng)的文字;所述轉(zhuǎn)換列表內(nèi)設(shè)置有方言語音與通用語音的文字的對應(yīng)關(guān)系。

b21.根據(jù)b12所述的裝置,所述去噪語音輸出模塊包括:

對端輸出單元,用于當(dāng)所述通話音來自本地通話者時(shí),通過移動(dòng)網(wǎng)絡(luò)將糾音處理后的去噪語音傳輸至通話對端的終端;

本地輸出單元,用于當(dāng)所述通話音來自通話對端時(shí),通過本地音頻設(shè)備播放糾音處理后的去噪語音。

b22.根據(jù)b12-b21任一項(xiàng)所述的裝置,所述裝置還包括:

啟動(dòng)模塊,用于當(dāng)接收到當(dāng)前的通話音時(shí),檢查設(shè)定的增強(qiáng)音質(zhì)功能是否為開啟狀態(tài);如果是開啟狀態(tài),執(zhí)行所述對當(dāng)前的通話音進(jìn)行降噪處理的步驟。

c23.一種通話終端,包括處理器和存儲器;

所述存儲器中存儲有通話音的優(yōu)化裝置;所述通話音的優(yōu)化裝置包括一個(gè)或多個(gè)由所述處理器執(zhí)行的軟件功能模組,所述通話音的優(yōu)化裝置包括:

降噪處理模塊,用于對當(dāng)前的通話音進(jìn)行降噪處理,得到去噪語音;

音質(zhì)判定模塊,用于獲取所述去噪語音的音質(zhì)清晰值,所述音質(zhì)清晰值為衡量所述去噪語音清晰程度的參數(shù);

糾音模塊,用于當(dāng)所述音質(zhì)清晰值低于設(shè)定的清晰閾值時(shí),對所述去噪語音進(jìn)行糾音處理;

去噪語音輸出模塊,用于輸出糾音處理后的去噪語音。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1