本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種音頻信號(hào)處理方法,及裝置。
背景技術(shù):
通過(guò)手機(jī)進(jìn)行直播的網(wǎng)絡(luò)應(yīng)用逐步普及,但直播與通信過(guò)中音頻信號(hào)存在較大不同之處,例如:打電話是語(yǔ)音數(shù)據(jù)的傳遞,而直播并非簡(jiǎn)單的進(jìn)行語(yǔ)音數(shù)據(jù)的傳遞,主播在直播過(guò)程中可能會(huì)唱歌或表演等,同時(shí)還可能會(huì)存在音樂(lè)伴奏或者現(xiàn)場(chǎng)伴奏等情況。
目前的音頻信號(hào)降噪處理有兩類(lèi):
一、通信類(lèi)降噪技術(shù),主要針對(duì)的是語(yǔ)音之外的噪音,通常將采集到的音頻信號(hào)區(qū)分為噪音和語(yǔ)音。進(jìn)而抑制噪音,保留語(yǔ)音。采用這種降噪方式音樂(lè)甚至歌唱等聲音很容易被混淆為噪音,導(dǎo)致抑制噪音的同時(shí),音樂(lè)等內(nèi)容嚴(yán)重受損。因此,在直播過(guò)程中的語(yǔ)音之外的唱歌、伴奏以及正常的環(huán)境音等,很容易嚴(yán)重受損。
二、音樂(lè)類(lèi)降噪技術(shù),可以比較好的保留音樂(lè),語(yǔ)音等內(nèi)容,但通常應(yīng)用于儲(chǔ)存音頻信號(hào)的修復(fù),比如舊唱盤(pán)或錄音帶進(jìn)行重新編輯或數(shù)字化時(shí),由于介質(zhì)本身的老化和當(dāng)時(shí)的技術(shù)限制,數(shù)字化后得到的數(shù)據(jù)中帶有底噪或背景噪音。因此,音樂(lè)類(lèi)降噪技術(shù)對(duì)此類(lèi)噪音進(jìn)行抑制,但對(duì)于現(xiàn)在直播中常見(jiàn)的汽車(chē)噪音,餐廳噪音,辦公室噪音則難以取得較好的抑制效果。
正是因?yàn)橐陨蟽煞N降噪方案的局限性,目前直播應(yīng)用中很多都沒(méi)有使用降噪技術(shù)。但手機(jī)直播的環(huán)境很難達(dá)到例如專(zhuān)業(yè)錄音間的高要求,因?yàn)橹辈?chǎng)地并不局限在安靜環(huán)境,例如:汽車(chē)上,餐廳里,商場(chǎng)等各種嘈雜環(huán)境都有可能成為主播進(jìn)行直播的場(chǎng)所。因此迫切需要適合直播場(chǎng)景的降噪技術(shù)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供了一種音頻信號(hào)處理方法,及裝置,用于直播應(yīng)用場(chǎng)景下,音頻信號(hào)的降噪,提升音頻信號(hào)質(zhì)量。
一方面本發(fā)明實(shí)施例提供了一種音頻信號(hào)處理方法,包括:
獲取直播過(guò)程中產(chǎn)生的待處理音頻信號(hào),從所述待處理音頻信號(hào)中提取音頻幀;
根據(jù)先驗(yàn)的音頻模型確定第一概率、第二概率以及第三概率;所述第一概率為所述音頻幀屬于語(yǔ)音的概率,所述第二概率為所述音頻幀屬于音樂(lè)的概率,所述第三概率為所述音頻幀屬于噪音的概率;
若所述第一概率小于第一門(mén)限或者所述第二概率小于第二門(mén)限,并且,所述第三概率大于第三門(mén)限,則確定所述音頻幀包含噪音;
在確定所述待處理音頻信號(hào)中包含噪音后,對(duì)屬于噪音的音頻幀進(jìn)行降噪處理。
在一個(gè)可能的實(shí)現(xiàn)方式中,所述從所述待處理音頻信號(hào)中提取音頻幀包括:
從所述待處理音頻信號(hào)中提取連續(xù)的預(yù)定個(gè)數(shù)的音頻幀;
所述第一概率為所述預(yù)定個(gè)數(shù)的音頻幀屬于語(yǔ)音的概率的算數(shù)平均值,所述第二概率為所述預(yù)定個(gè)數(shù)的音頻幀屬于音樂(lè)的概率的算數(shù)平均值,所述第三概率為所述預(yù)定個(gè)數(shù)的音頻幀屬于噪音的概率的算數(shù)平均值。
在一個(gè)可能的實(shí)現(xiàn)方式中,所述方法還包括:
若所述第一概率小于第四門(mén)限或者所述第二概率小于第五門(mén)限,并且,所述第三概率大于第六門(mén)限,則確定所述音頻幀可能包含噪音;
若所述第一概率大于第七門(mén)限,則確定所述音頻幀不包含噪音;
所述第一門(mén)限大于所述第四門(mén)限,所述第二門(mén)限大于所述第五門(mén)限,所述第六門(mén)限大于所述第三門(mén)限;所述第六門(mén)限大于所述第一門(mén)限和所述第二門(mén)限。
在一個(gè)可能的實(shí)現(xiàn)方式中,所述方法還包括:
若確定所述音頻幀包含噪音,則依據(jù)所述音頻幀包含噪音的結(jié)果更新所述音頻幀的權(quán)值;
若確定所述音頻幀可能包含噪音,則依據(jù)所述音頻幀包含的底噪更新所述音頻幀的權(quán)值。
在一個(gè)可能的實(shí)現(xiàn)方式中,所述對(duì)屬于噪音的音頻幀進(jìn)行降噪處理包括:
根據(jù)所述待處理音頻信號(hào)U以及包含噪音的音頻幀的數(shù)量V計(jì)算信噪比SNR;然后計(jì)算維納濾波器的傳遞函數(shù)H,H=SNR/(SNR+1),在頻域計(jì)算輸出的音頻信號(hào)Y,Y=H×U。
在一個(gè)可能的實(shí)現(xiàn)方式中,在所述根據(jù)先驗(yàn)的音頻模型確定第一概率、第二概率以及第三概率之前,所述方法還包括:
通過(guò)深度神經(jīng)網(wǎng)絡(luò)、隱含馬爾科夫模型或者頻譜特征聚類(lèi)的方式獲得所述先驗(yàn)的音頻模型。
二方面本發(fā)明實(shí)施例提供了一種音頻信號(hào)處理裝置,包括:
提取單元,用于獲取直播過(guò)程中產(chǎn)生的待處理音頻信號(hào),從所述待處理音頻信號(hào)中提取音頻幀;
概率確定單元,用于根據(jù)先驗(yàn)的音頻模型確定第一概率、第二概率以及第三概率;所述第一概率為所述音頻幀屬于語(yǔ)音的概率,所述第二概率為所述音頻幀屬于音樂(lè)的概率,所述第三概率為所述音頻幀屬于噪音的概率;
噪音確定單元,用于若所述第一概率小于第一門(mén)限或者所述第二概率小于第二門(mén)限,并且,所述第三概率大于第三門(mén)限,則確定所述音頻幀包含噪音;
降噪處理單元,用于在確定所述待處理音頻信號(hào)中包含噪音后,對(duì)屬于噪音的音頻幀進(jìn)行降噪處理。
在一個(gè)可能的實(shí)現(xiàn)方式中,所述提取單元,具體用于從所述待處理音頻信號(hào)中提取連續(xù)的預(yù)定個(gè)數(shù)的音頻幀;
所述概率確定單元,具體用于根據(jù)先驗(yàn)的音頻模型確定第一概率、第二概率以及第三概率;所述第一概率為所述預(yù)定個(gè)數(shù)的音頻幀屬于語(yǔ)音的概率的算數(shù)平均值,所述第二概率為所述預(yù)定個(gè)數(shù)的音頻幀屬于音樂(lè)的概率的算數(shù)平均值,所述第三概率為所述預(yù)定個(gè)數(shù)的音頻幀屬于噪音的概率的算數(shù)平均值。
在一個(gè)可能的實(shí)現(xiàn)方式中,所述噪音確定單元,還用于若所述第一概率小于第四門(mén)限或者所述第二概率小于第五門(mén)限,并且,所述第三概率大于第六門(mén)限,則確定所述音頻幀可能包含噪音;
若所述第一概率大于第七門(mén)限,則確定所述音頻幀不包含噪音;
所述第一門(mén)限大于所述第四門(mén)限,所述第二門(mén)限大于所述第五門(mén)限,所述第六門(mén)限大于所述第三門(mén)限;所述第六門(mén)限大于所述第一門(mén)限和所述第二門(mén)限。
在一個(gè)可能的實(shí)現(xiàn)方式中,所述裝置還包括:
模型更新單元,用于若確定所述音頻幀包含噪音,則依據(jù)所述音頻幀包含噪音的結(jié)果更新所述音頻幀的權(quán)值;若確定所述音頻幀可能包含噪音,則依據(jù)所述音頻幀包含的底噪更新所述音頻幀的權(quán)值。
在一個(gè)可能的實(shí)現(xiàn)方式中,所述降噪處理單元,具體用于根據(jù)所述待處理音頻信號(hào)U以及包含噪音的音頻幀的數(shù)量V計(jì)算信噪比SNR;然后計(jì)算維納濾波器的傳遞函數(shù)H,H=SNR/(SNR+1),在頻域計(jì)算輸出的音頻信號(hào)Y,Y=H×U。
在一個(gè)可能的實(shí)現(xiàn)方式中,所述裝置還包括:
模型訓(xùn)練單元,用于通過(guò)深度神經(jīng)網(wǎng)絡(luò)、隱含馬爾科夫模型或者頻譜特征聚類(lèi)的方式獲得所述先驗(yàn)的音頻模型。
從以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn):采用先驗(yàn)的音頻模型確定了音頻幀屬于語(yǔ)音的概率、屬于音樂(lè)的概率以及屬于噪音的概率,通過(guò)這些概率綜合確定了是否存在噪音,并精確定位了噪音,可以適用于直播的應(yīng)用場(chǎng)景,實(shí)現(xiàn)音頻信號(hào)的降噪,提升音頻信號(hào)質(zhì)量。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)要介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例方法流程示意圖;
圖2為本發(fā)明實(shí)施例方法流程示意圖;
圖3為本發(fā)明實(shí)施例裝置結(jié)構(gòu)示意圖;
圖4為本發(fā)明實(shí)施例裝置結(jié)構(gòu)示意圖;
圖5為本發(fā)明實(shí)施例裝置結(jié)構(gòu)示意圖;
圖6為本發(fā)明實(shí)施例終端設(shè)備結(jié)構(gòu)示意圖;
圖7為本發(fā)明實(shí)施例手機(jī)結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步地詳細(xì)描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部份實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例提供了一種音頻信號(hào)處理方法,如圖1所示,包括:
101:獲取直播過(guò)程中產(chǎn)生的待處理音頻信號(hào),從上述待處理音頻信號(hào)中提取音頻幀;
本發(fā)明實(shí)施例中音頻信號(hào)處理可以在直播源端完成,即:在對(duì)音頻信號(hào)進(jìn)行降噪處理后發(fā)送到直播接收方;如果在直播接收方執(zhí)行音頻信號(hào)處理,理論上也是可行的,直播源端數(shù)據(jù)處理量會(huì)減少,不過(guò)這樣會(huì)加大直播接收方的數(shù)據(jù)處理量;前者可以作為優(yōu)選實(shí)現(xiàn)方案。如果在直播源端執(zhí)行音頻信號(hào)處理,那么待處理音頻信號(hào)可以是直播源端的設(shè)備通過(guò)語(yǔ)音拾取設(shè)備,例如:話筒,獲得音頻信號(hào)并作為待處理音頻信號(hào)。音頻信號(hào)是以音頻的幀組成的,因此可以提取出各幀的數(shù)據(jù)。
102:根據(jù)先驗(yàn)的音頻模型確定第一概率、第二概率以及第三概率;上述第一概率為上述音頻幀屬于語(yǔ)音的概率,上述第二概率為上述音頻幀屬于音樂(lè)的概率,上述第三概率為上述音頻幀屬于噪音的概率;
先驗(yàn)的音頻模型是預(yù)先訓(xùn)練的音頻模型,用于區(qū)分音頻幀屬于哪一種類(lèi)型;在本實(shí)施例中,音頻模型基于三種音頻幀分類(lèi)訓(xùn)練,由于三種類(lèi)型的音頻幀會(huì)各自具有自身的一些頻譜特征,訓(xùn)練方式可以是深度神經(jīng)網(wǎng)絡(luò)或隱含馬爾科夫模型等,也可以采用頻譜特征聚類(lèi)的簡(jiǎn)單方法。具體如何訓(xùn)練本發(fā)明實(shí)施例不作唯一性限定。
103:若上述第一概率小于第一門(mén)限或者上述第二概率小于第二門(mén)限,并且,上述第三概率大于第三門(mén)限,則確定上述音頻幀包含噪音;
在本實(shí)施例中,第一門(mén)限和第二門(mén)限可以是同一個(gè)值,該值用于判斷不是噪音的概率,第三門(mén)限則是用于判斷是噪音的概率;第一門(mén)限和第二門(mén)限如果設(shè)置得較小,第三門(mén)限設(shè)置得較大,則會(huì)減少誤判;如果第一門(mén)限和第二門(mén)限設(shè)置較大的值,第三門(mén)限設(shè)置較小的值,則會(huì)減少漏判;具體如何設(shè)置可以通過(guò)測(cè)試來(lái)確定,本發(fā)明實(shí)施例最具體取值不作唯一性限定。
104:在確定上述待處理音頻信號(hào)中包含噪音后,對(duì)屬于噪音的音頻幀進(jìn)行降噪處理。
由于本發(fā)明實(shí)施例已經(jīng)定位到了音頻信號(hào)中包含噪音的音頻幀,因此可以準(zhǔn)確的進(jìn)行降噪處理,具體采用何種降噪處理方案,本發(fā)明實(shí)施例不作唯一性限定。
本發(fā)明實(shí)施例,采用先驗(yàn)的音頻模型確定了音頻幀屬于語(yǔ)音的概率、屬于音樂(lè)的概率以及屬于噪音的概率,通過(guò)這些概率綜合確定了是否存在噪音,并精確定位了噪音,可以適用于直播的應(yīng)用場(chǎng)景,實(shí)現(xiàn)音頻信號(hào)的降噪,提升音頻信號(hào)質(zhì)量。
可選地,在本實(shí)施例中可以通過(guò)算數(shù)平均的方式來(lái)減少誤判,具體如下:上述從上述待處理音頻信號(hào)中提取音頻幀包括:
從上述待處理音頻信號(hào)中提取連續(xù)的預(yù)定個(gè)數(shù)的音頻幀;
上述第一概率為上述預(yù)定個(gè)數(shù)的音頻幀屬于語(yǔ)音的概率的算數(shù)平均值,上述第二概率為上述預(yù)定個(gè)數(shù)的音頻幀屬于音樂(lè)的概率的算數(shù)平均值,上述第三概率為上述預(yù)定個(gè)數(shù)的音頻幀屬于噪音的概率的算數(shù)平均值。
在本實(shí)施例中,預(yù)定個(gè)數(shù)可以是10~100個(gè)音頻幀,具體如何確定這個(gè)值本發(fā)明實(shí)施例不作唯一性限定。在計(jì)算算數(shù)平均值時(shí),每個(gè)音頻幀會(huì)有一個(gè)權(quán)重值,如果對(duì)應(yīng)的音頻幀被確定為噪音的概率越大則其權(quán)重值可以設(shè)置得大一些,具體設(shè)定哪一權(quán)重值本發(fā)明實(shí)施例不作唯一性限定。舉個(gè)例子,如果預(yù)定個(gè)數(shù)為10,待處理的音頻信號(hào)從1編號(hào)到1000;以第110個(gè)音頻幀的判斷為例,那么將會(huì)獲取第101~110這10個(gè)音頻幀分別在音樂(lè)、語(yǔ)音和噪音三個(gè)維度的概率,確定其屬于噪音的概率來(lái)確定各自權(quán)重,然后計(jì)算算數(shù)平均值作為第110個(gè)音頻幀是否為噪音的依據(jù);本次噪音計(jì)算將會(huì)影響到后續(xù)9個(gè)音頻幀的判斷。
進(jìn)一步地,基于以上實(shí)施例中確定噪音的方案,還有兩種情況是可能有噪音也可能沒(méi)噪音,或者不太可能有噪音(即判斷為沒(méi)噪音),基于這兩種情況具體如下:上述方法還包括:
若上述第一概率小于第四門(mén)限或者上述第二概率小于第五門(mén)限,并且,上述第三概率大于第六門(mén)限,則確定上述音頻幀可能包含噪音;
若上述第一概率大于第七門(mén)限,則確定上述音頻幀不包含噪音;
上述第一門(mén)限大于上述第四門(mén)限,上述第二門(mén)限大于上述第五門(mén)限,上述第六門(mén)限大于上述第三門(mén)限;上述第六門(mén)限大于上述第一門(mén)限和上述第二門(mén)限。
進(jìn)一步地,基于已經(jīng)判斷有噪音或者可能包含噪音的情況,本發(fā)明實(shí)施例提供了更新權(quán)值的具體實(shí)現(xiàn)方案,采用兩種不同的更新方式避免降噪處理對(duì)語(yǔ)音和音樂(lè)造成的傷害,具體如下:上述方法還包括:
若確定上述音頻幀包含噪音,則依據(jù)上述音頻幀包含噪音的結(jié)果更新上述音頻幀的權(quán)值;
若確定上述音頻幀可能包含噪音,則依據(jù)上述音頻幀包含的底噪更新上述音頻幀的權(quán)值。
前一種更新權(quán)值的方式,會(huì)較快影響到音頻模型對(duì)音頻幀是否為噪音的判斷,后一種則較為平和。
更具體地,本發(fā)明實(shí)施例還提供了采用維納濾波器進(jìn)行降噪的具體實(shí)現(xiàn)方案,如下:上述對(duì)屬于噪音的音頻幀進(jìn)行降噪處理包括:
根據(jù)上述待處理音頻信號(hào)U以及包含噪音的音頻幀的數(shù)量V計(jì)算信噪比SNR;然后計(jì)算維納濾波器的傳遞函數(shù)H,H=SNR/(SNR+1),在頻域計(jì)算輸出的音頻信號(hào)Y,Y=H×U。
更具體地,本發(fā)明實(shí)施例還提供了先驗(yàn)的音頻模型的自動(dòng)化訓(xùn)練方案,如下:在上述根據(jù)先驗(yàn)的音頻模型確定第一概率、第二概率以及第三概率之前,上述方法還包括:
通過(guò)深度神經(jīng)網(wǎng)絡(luò)、隱含馬爾科夫模型或者頻譜特征聚類(lèi)的方式獲得上述先驗(yàn)的音頻模型。
在獲得先驗(yàn)的音頻模型后,可以通過(guò)實(shí)際測(cè)試來(lái)確定訓(xùn)練的效果,選擇較好的先驗(yàn)的音頻模型在后續(xù)判斷噪音的過(guò)程中使用。
本發(fā)明實(shí)施例進(jìn)行音頻信號(hào)的噪音抑制主要分為三個(gè)步驟,第一步是進(jìn)行信號(hào)建模,第二步是噪音分析,第二部是進(jìn)行噪音抑制;如圖2所示,具體如下:
201:首先對(duì)采集的足夠數(shù)量的音頻信號(hào)進(jìn)行預(yù)先的分類(lèi),默認(rèn)音頻信號(hào)由語(yǔ)音,音樂(lè)和噪音組成,根據(jù)先驗(yàn)的分類(lèi)結(jié)果,分別對(duì)語(yǔ)音,音樂(lè)和噪音進(jìn)行建模。得到的模型用于實(shí)時(shí)對(duì)采集的音頻信號(hào)進(jìn)行分類(lèi)。
訓(xùn)練模型的方法可以采用深度神經(jīng)網(wǎng)絡(luò)或隱含馬爾科夫模型等,也可以采用頻譜特征聚類(lèi)的簡(jiǎn)單方法。
202:根據(jù)預(yù)先訓(xùn)練好的模型對(duì)實(shí)時(shí)采集的音頻信號(hào)進(jìn)行判定后,得出每一幀分別對(duì)應(yīng)語(yǔ)音,音樂(lè)和噪音的概率。
由于每一幀信號(hào)的判定由于模型準(zhǔn)確率的問(wèn)題會(huì)有較大波動(dòng),因此可以對(duì)每一幀的判定結(jié)果作一個(gè)時(shí)間區(qū)間的平滑,根據(jù)準(zhǔn)確度,實(shí)時(shí)性等不同的上層要求,可以采用10到100幀之間長(zhǎng)度的數(shù)據(jù)來(lái)計(jì)算算術(shù)平均值,從而減少誤判。
在本實(shí)施例中,可以分成兩套實(shí)時(shí)噪音估計(jì)模型的更新方式:
一種是:根據(jù)平滑后的三種信號(hào)的概率值,當(dāng)噪音概率超過(guò)某一較高門(mén)限a,語(yǔ)音和音樂(lè)的概率低于某一較低門(mén)限b時(shí),再根據(jù)當(dāng)前的噪音概率使用當(dāng)前幀信號(hào)對(duì)上述用于實(shí)時(shí)噪音估計(jì)的模型進(jìn)行更新。因此可以快速準(zhǔn)確的更新噪音估計(jì)模型。更新模型的方式,可以通過(guò)更新算術(shù)平均值中各幀對(duì)應(yīng)的權(quán)值實(shí)現(xiàn)。
另一種是:當(dāng)前幀屬于噪音的概率高于某一較低門(mén)限c,語(yǔ)音或音樂(lè)的概率低于某一較高門(mén)限d時(shí),使用較為平緩的方式上述用于實(shí)時(shí)噪音估計(jì)的模型,只收集非常平穩(wěn)的底噪作為噪音信息。
還有一種情況是不需要更新模型的:當(dāng)前幀語(yǔ)音或音樂(lè)的概率高于某一更高的門(mén)限d時(shí),不更新上述用于實(shí)時(shí)噪音估計(jì)的模型。
203:使用維納濾波等降噪方法對(duì)當(dāng)前的音頻信號(hào)進(jìn)行降噪處理。
維納濾波過(guò)程可以是:
1.根據(jù)輸入音頻信號(hào)U和噪聲估計(jì)V的結(jié)果,計(jì)算出信噪比SNR;
2.計(jì)算維納濾波器傳遞函數(shù)H=SNR/(SNR+1);
3.在頻域計(jì)算輸出信號(hào)Y=H×U;
本發(fā)明實(shí)施例提供了對(duì)手機(jī)上錄制的語(yǔ)音,音樂(lè),噪音混合場(chǎng)景中進(jìn)行有效的降噪處理的方案,可以保護(hù)語(yǔ)音和音樂(lè)不受?chē)?yán)重?fù)p傷。
本發(fā)明實(shí)施例,在檢測(cè)噪音環(huán)節(jié),預(yù)先將音頻信號(hào)分為語(yǔ)音,噪音和音樂(lè)三類(lèi),與傳統(tǒng)語(yǔ)音噪音兩類(lèi)的方法相區(qū)分。對(duì)判定結(jié)果做一個(gè)較長(zhǎng)時(shí)間的平滑,有效減少誤判。在噪音估計(jì)環(huán)節(jié),使用兩套不同性能的估計(jì)方式,在不存在語(yǔ)音和音樂(lè)的場(chǎng)景下較快速準(zhǔn)確的更新噪音模型,在語(yǔ)音和音樂(lè)存在的場(chǎng)景下,只將最平穩(wěn)的信號(hào)認(rèn)為是噪音,避免對(duì)語(yǔ)音和音樂(lè)造成傷害。采用兩套噪音估計(jì)模型更新方式有別于使用一套估計(jì)系統(tǒng)只根據(jù)判定調(diào)整更新加權(quán)值的方法。
本發(fā)明實(shí)施例還提供了一種音頻信號(hào)處理裝置,如圖3所示,包括:
提取單元301,用于獲取直播過(guò)程中產(chǎn)生的待處理音頻信號(hào),從上述待處理音頻信號(hào)中提取音頻幀;
概率確定單元302,用于根據(jù)先驗(yàn)的音頻模型確定第一概率、第二概率以及第三概率;上述第一概率為上述音頻幀屬于語(yǔ)音的概率,上述第二概率為上述音頻幀屬于音樂(lè)的概率,上述第三概率為上述音頻幀屬于噪音的概率;
噪音確定單元303,用于若上述第一概率小于第一門(mén)限或者上述第二概率小于第二門(mén)限,并且,上述第三概率大于第三門(mén)限,則確定上述音頻幀包含噪音;
降噪處理單元304,用于在確定上述待處理音頻信號(hào)中包含噪音后,對(duì)屬于噪音的音頻幀進(jìn)行降噪處理。
本發(fā)明實(shí)施例中音頻信號(hào)處理可以在直播源端完成,即:在對(duì)音頻信號(hào)進(jìn)行降噪處理后發(fā)送到直播接收方;如果在直播接收方執(zhí)行音頻信號(hào)處理,理論上也是可行的,直播源端數(shù)據(jù)處理量會(huì)減少,不過(guò)這樣會(huì)加大直播接收方的數(shù)據(jù)處理量;前者可以作為優(yōu)選實(shí)現(xiàn)方案。如果在直播源端執(zhí)行音頻信號(hào)處理,那么待處理音頻信號(hào)可以是直播源端的設(shè)備通過(guò)語(yǔ)音拾取設(shè)備,例如:話筒,獲得音頻信號(hào)并作為待處理音頻信號(hào)。音頻信號(hào)是以音頻的幀組成的,因此可以提取出各幀的數(shù)據(jù)。
先驗(yàn)的音頻模型是預(yù)先訓(xùn)練的音頻模型,用于區(qū)分音頻幀屬于哪一種類(lèi)型;在本實(shí)施例中,音頻模型基于三種音頻幀分類(lèi)訓(xùn)練,由于三種類(lèi)型的音頻幀會(huì)各自具有自身的一些頻譜特征,訓(xùn)練方式可以是深度神經(jīng)網(wǎng)絡(luò)或隱含馬爾科夫模型等,也可以采用頻譜特征聚類(lèi)的簡(jiǎn)單方法。具體如何訓(xùn)練本發(fā)明實(shí)施例不作唯一性限定。
在本實(shí)施例中,第一門(mén)限和第二門(mén)限可以是同一個(gè)值,該值用于判斷不是噪音的概率,第三門(mén)限則是用于判斷是噪音的概率;第一門(mén)限和第二門(mén)限如果設(shè)置得較小,第三門(mén)限設(shè)置得較大,則會(huì)減少誤判;如果第一門(mén)限和第二門(mén)限設(shè)置較大的值,第三門(mén)限設(shè)置較小的值,則會(huì)減少漏判;具體如何設(shè)置可以通過(guò)測(cè)試來(lái)確定,本發(fā)明實(shí)施例最具體取值不作唯一性限定。
由于本發(fā)明實(shí)施例已經(jīng)定位到了音頻信號(hào)中包含噪音的音頻幀,因此可以準(zhǔn)確的進(jìn)行降噪處理,具體采用何種降噪處理方案,本發(fā)明實(shí)施例不作唯一性限定。
本發(fā)明實(shí)施例,采用先驗(yàn)的音頻模型確定了音頻幀屬于語(yǔ)音的概率、屬于音樂(lè)的概率以及屬于噪音的概率,通過(guò)這些概率綜合確定了是否存在噪音,并精確定位了噪音,可以適用于直播的應(yīng)用場(chǎng)景,實(shí)現(xiàn)音頻信號(hào)的降噪,提升音頻信號(hào)質(zhì)量。
可選地,在本實(shí)施例中可以通過(guò)算數(shù)平均的方式來(lái)減少誤判,具體如下:上述提取單元301,具體用于從上述待處理音頻信號(hào)中提取連續(xù)的預(yù)定個(gè)數(shù)的音頻幀;
上述概率確定單元302,具體用于根據(jù)先驗(yàn)的音頻模型確定第一概率、第二概率以及第三概率;上述第一概率為上述預(yù)定個(gè)數(shù)的音頻幀屬于語(yǔ)音的概率的算數(shù)平均值,上述第二概率為上述預(yù)定個(gè)數(shù)的音頻幀屬于音樂(lè)的概率的算數(shù)平均值,上述第三概率為上述預(yù)定個(gè)數(shù)的音頻幀屬于噪音的概率的算數(shù)平均值。
在本實(shí)施例中,預(yù)定個(gè)數(shù)可以是10~100個(gè)音頻幀,具體如何確定這個(gè)值本發(fā)明實(shí)施例不作唯一性限定。在計(jì)算算數(shù)平均值時(shí),每個(gè)音頻幀會(huì)有一個(gè)權(quán)重值,如果對(duì)應(yīng)的音頻幀被確定為噪音的概率越大則其權(quán)重值可以設(shè)置得大一些,具體設(shè)定哪一權(quán)重值本發(fā)明實(shí)施例不作唯一性限定。舉個(gè)例子,如果預(yù)定個(gè)數(shù)為10,待處理的音頻信號(hào)從1編號(hào)到1000;以第110個(gè)音頻幀的判斷為例,那么將會(huì)獲取第101~110這10個(gè)音頻幀分別在音樂(lè)、語(yǔ)音和噪音三個(gè)維度的概率,確定其屬于噪音的概率來(lái)確定各自權(quán)重,然后計(jì)算算數(shù)平均值作為第110個(gè)音頻幀是否為噪音的依據(jù);本次噪音計(jì)算將會(huì)影響到后續(xù)9個(gè)音頻幀的判斷。
進(jìn)一步地,基于以上實(shí)施例中確定噪音的方案,還有兩種情況是可能有噪音也可能沒(méi)噪音,或者不太可能有噪音(即判斷為沒(méi)噪音),基于這兩種情況具體如下:上述噪音確定單元303,還用于若上述第一概率小于第四門(mén)限或者上述第二概率小于第五門(mén)限,并且,上述第三概率大于第六門(mén)限,則確定上述音頻幀可能包含噪音;
若上述第一概率大于第七門(mén)限,則確定上述音頻幀不包含噪音;
上述第一門(mén)限大于上述第四門(mén)限,上述第二門(mén)限大于上述第五門(mén)限,上述第六門(mén)限大于上述第三門(mén)限;上述第六門(mén)限大于上述第一門(mén)限和上述第二門(mén)限。
進(jìn)一步地,基于已經(jīng)判斷有噪音或者可能包含噪音的情況,本發(fā)明實(shí)施例提供了更新權(quán)值的具體實(shí)現(xiàn)方案,采用兩種不同的更新方式避免降噪處理對(duì)語(yǔ)音和音樂(lè)造成的傷害,具體如下:如圖4所示,上述裝置還包括:
模型更新單元401,用于若確定上述音頻幀包含噪音,則依據(jù)上述音頻幀包含噪音的結(jié)果更新上述音頻幀的權(quán)值;若確定上述音頻幀可能包含噪音,則依據(jù)上述音頻幀包含的底噪更新上述音頻幀的權(quán)值。
前一種更新權(quán)值的方式,會(huì)較快影響到音頻模型對(duì)音頻幀是否為噪音的判斷,后一種則較為平和。
更具體地,本發(fā)明實(shí)施例還提供了采用維納濾波器進(jìn)行降噪的具體實(shí)現(xiàn)方案,如下:上述降噪處理單元304,具體用于根據(jù)上述待處理音頻信號(hào)U以及包含噪音的音頻幀的數(shù)量V計(jì)算信噪比SNR;然后計(jì)算維納濾波器的傳遞函數(shù)H,H=SNR/(SNR+1),在頻域計(jì)算輸出的音頻信號(hào)Y,Y=H×U。
進(jìn)一步地,本發(fā)明實(shí)施例還提供了先驗(yàn)的音頻模型的自動(dòng)化訓(xùn)練方案,如下:如圖5所示,上述裝置還包括:
模型訓(xùn)練單元501,用于通過(guò)深度神經(jīng)網(wǎng)絡(luò)、隱含馬爾科夫模型或者頻譜特征聚類(lèi)的方式獲得上述先驗(yàn)的音頻模型。
本發(fā)明實(shí)施例還提供了一種終端設(shè)備,該終端設(shè)備可以是直播的源端設(shè)備,例如:手機(jī);如圖6所示,該終端設(shè)備可以包括:音頻信號(hào)采集設(shè)備601、處理器602以及存儲(chǔ)器603等;其中存儲(chǔ)器603可以用于存儲(chǔ)音頻數(shù)據(jù),也可以用于提供處理器602執(zhí)行數(shù)據(jù)處理時(shí)所需的緩存;
上述音頻信號(hào)采集設(shè)備601,用于獲取直播過(guò)程中產(chǎn)生的待處理音頻信號(hào);
上述處理器602,用于從上述待處理音頻信號(hào)中提取音頻幀;根據(jù)先驗(yàn)的音頻模型確定第一概率、第二概率以及第三概率;上述第一概率為上述音頻幀屬于語(yǔ)音的概率,上述第二概率為上述音頻幀屬于音樂(lè)的概率,上述第三概率為上述音頻幀屬于噪音的概率;若上述第一概率小于第一門(mén)限或者上述第二概率小于第二門(mén)限,并且,上述第三概率大于第三門(mén)限,則確定上述音頻幀包含噪音;在確定上述待處理音頻信號(hào)中包含噪音后,對(duì)屬于噪音的音頻幀進(jìn)行降噪處理。
本發(fā)明實(shí)施例中音頻信號(hào)處理可以在直播源端完成,即:在對(duì)音頻信號(hào)進(jìn)行降噪處理后發(fā)送到直播接收方;如果在直播接收方執(zhí)行音頻信號(hào)處理,理論上也是可行的,直播源端數(shù)據(jù)處理量會(huì)減少,不過(guò)這樣會(huì)加大直播接收方的數(shù)據(jù)處理量;前者可以作為優(yōu)選實(shí)現(xiàn)方案。如果在直播源端執(zhí)行音頻信號(hào)處理,那么待處理音頻信號(hào)可以是直播源端的設(shè)備通過(guò)語(yǔ)音拾取設(shè)備,例如:話筒,獲得音頻信號(hào)并作為待處理音頻信號(hào)。音頻信號(hào)是以音頻的幀組成的,因此可以提取出各幀的數(shù)據(jù)。
先驗(yàn)的音頻模型是預(yù)先訓(xùn)練的音頻模型,用于區(qū)分音頻幀屬于哪一種類(lèi)型;在本實(shí)施例中,音頻模型基于三種音頻幀分類(lèi)訓(xùn)練,由于三種類(lèi)型的音頻幀會(huì)各自具有自身的一些頻譜特征,訓(xùn)練方式可以是深度神經(jīng)網(wǎng)絡(luò)或隱含馬爾科夫模型等,也可以采用頻譜特征聚類(lèi)的簡(jiǎn)單方法。具體如何訓(xùn)練本發(fā)明實(shí)施例不作唯一性限定。
在本實(shí)施例中,第一門(mén)限和第二門(mén)限可以是同一個(gè)值,該值用于判斷不是噪音的概率,第三門(mén)限則是用于判斷是噪音的概率;第一門(mén)限和第二門(mén)限如果設(shè)置得較小,第三門(mén)限設(shè)置得較大,則會(huì)減少誤判;如果第一門(mén)限和第二門(mén)限設(shè)置較大的值,第三門(mén)限設(shè)置較小的值,則會(huì)減少漏判;具體如何設(shè)置可以通過(guò)測(cè)試來(lái)確定,本發(fā)明實(shí)施例最具體取值不作唯一性限定。
由于本發(fā)明實(shí)施例已經(jīng)定位到了音頻信號(hào)中包含噪音的音頻幀,因此可以準(zhǔn)確的進(jìn)行降噪處理,具體采用何種降噪處理方案,本發(fā)明實(shí)施例不作唯一性限定。
本發(fā)明實(shí)施例,采用先驗(yàn)的音頻模型確定了音頻幀屬于語(yǔ)音的概率、屬于音樂(lè)的概率以及屬于噪音的概率,通過(guò)這些概率綜合確定了是否存在噪音,并精確定位了噪音,可以適用于直播的應(yīng)用場(chǎng)景,實(shí)現(xiàn)音頻信號(hào)的降噪,提升音頻信號(hào)質(zhì)量。
可選地,在本實(shí)施例中可以通過(guò)算數(shù)平均的方式來(lái)減少誤判,具體如下:上述處理器602,用于從上述待處理音頻信號(hào)中提取音頻幀包括:
從上述待處理音頻信號(hào)中提取連續(xù)的預(yù)定個(gè)數(shù)的音頻幀;
上述第一概率為上述預(yù)定個(gè)數(shù)的音頻幀屬于語(yǔ)音的概率的算數(shù)平均值,上述第二概率為上述預(yù)定個(gè)數(shù)的音頻幀屬于音樂(lè)的概率的算數(shù)平均值,上述第三概率為上述預(yù)定個(gè)數(shù)的音頻幀屬于噪音的概率的算數(shù)平均值。
在本實(shí)施例中,預(yù)定個(gè)數(shù)可以是10~100個(gè)音頻幀,具體如何確定這個(gè)值本發(fā)明實(shí)施例不作唯一性限定。在計(jì)算算數(shù)平均值時(shí),每個(gè)音頻幀會(huì)有一個(gè)權(quán)重值,如果對(duì)應(yīng)的音頻幀被確定為噪音的概率越大則其權(quán)重值可以設(shè)置得大一些,具體設(shè)定哪一權(quán)重值本發(fā)明實(shí)施例不作唯一性限定。舉個(gè)例子,如果預(yù)定個(gè)數(shù)為10,待處理的音頻信號(hào)從1編號(hào)到1000;以第110個(gè)音頻幀的判斷為例,那么將會(huì)獲取第101~110這10個(gè)音頻幀分別在音樂(lè)、語(yǔ)音和噪音三個(gè)維度的概率,確定其屬于噪音的概率來(lái)確定各自權(quán)重,然后計(jì)算算數(shù)平均值作為第110個(gè)音頻幀是否為噪音的依據(jù);本次噪音計(jì)算將會(huì)影響到后續(xù)9個(gè)音頻幀的判斷。
進(jìn)一步地,基于以上實(shí)施例中確定噪音的方案,還有兩種情況是可能有噪音也可能沒(méi)噪音,或者不太可能有噪音(即判斷為沒(méi)噪音),基于這兩種情況具體如下:上述處理器602,還用于若上述第一概率小于第四門(mén)限或者上述第二概率小于第五門(mén)限,并且,上述第三概率大于第六門(mén)限,則確定上述音頻幀可能包含噪音;
若上述第一概率大于第七門(mén)限,則確定上述音頻幀不包含噪音;
上述第一門(mén)限大于上述第四門(mén)限,上述第二門(mén)限大于上述第五門(mén)限,上述第六門(mén)限大于上述第三門(mén)限;上述第六門(mén)限大于上述第一門(mén)限和上述第二門(mén)限。
進(jìn)一步地,基于已經(jīng)判斷有噪音或者可能包含噪音的情況,本發(fā)明實(shí)施例提供了更新權(quán)值的具體實(shí)現(xiàn)方案,采用兩種不同的更新方式避免降噪處理對(duì)語(yǔ)音和音樂(lè)造成的傷害,具體如下:上述處理器602,還用于若確定上述音頻幀包含噪音,則依據(jù)上述音頻幀包含噪音的結(jié)果更新上述音頻幀的權(quán)值;
若確定上述音頻幀可能包含噪音,則依據(jù)上述音頻幀包含的底噪更新上述音頻幀的權(quán)值。
前一種更新權(quán)值的方式,會(huì)較快影響到音頻模型對(duì)音頻幀是否為噪音的判斷,后一種則較為平和。
更具體地,本發(fā)明實(shí)施例還提供了采用維納濾波器進(jìn)行降噪的具體實(shí)現(xiàn)方案,如下:上述處理器602,用于5、根據(jù)權(quán)利要求1至4任意一項(xiàng)所述方法,其特征在于,所述對(duì)屬于噪音的音頻幀進(jìn)行降噪處理包括:
根據(jù)上述待處理音頻信號(hào)U以及包含噪音的音頻幀的數(shù)量V計(jì)算信噪比SNR;然后計(jì)算維納濾波器的傳遞函數(shù)H,H=SNR/(SNR+1),在頻域計(jì)算輸出的音頻信號(hào)Y,Y=H×U。
進(jìn)一步地,本發(fā)明實(shí)施例還提供了先驗(yàn)的音頻模型的自動(dòng)化訓(xùn)練方案,如下:上述處理器602,還用于在上述根據(jù)先驗(yàn)的音頻模型確定第一概率、第二概率以及第三概率之前,通過(guò)深度神經(jīng)網(wǎng)絡(luò)、隱含馬爾科夫模型或者頻譜特征聚類(lèi)的方式獲得上述先驗(yàn)的音頻模型。
本發(fā)明實(shí)施例還提供了一種手機(jī),如圖7所示,為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,具體技術(shù)細(xì)節(jié)未揭示的,請(qǐng)參照本發(fā)明實(shí)施例方法部分。圖7示出的是與本發(fā)明實(shí)施例提供的終端設(shè)備相關(guān)的手機(jī)的部分結(jié)構(gòu)的框圖。參考圖7,手機(jī)包括:射頻(Radio Frequency,RF)電路710、存儲(chǔ)器720、輸入單元730、顯示單元740、傳感器750、音頻電路760、無(wú)線保真(wireless fidelity,WiFi)模塊770、處理器780、以及電源790等部件。本領(lǐng)域技術(shù)人員可以理解,圖7中示出的手機(jī)結(jié)構(gòu)并不構(gòu)成對(duì)手機(jī)的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
下面結(jié)合圖7對(duì)手機(jī)的各個(gè)構(gòu)成部件進(jìn)行具體的介紹:
RF電路710可用于收發(fā)信息或通話過(guò)程中,信號(hào)的接收和發(fā)送,特別地,將基站的下行信息接收后,給處理器780處理;另外,將設(shè)計(jì)上行的數(shù)據(jù)發(fā)送給基站。通常,RF電路710包括但不限于天線、至少一個(gè)放大器、收發(fā)信機(jī)、耦合器、低噪聲放大器(Low Noise Amplifier,LNA)、雙工器等。此外,RF電路710還可以通過(guò)無(wú)線通信與網(wǎng)絡(luò)和其他設(shè)備通信。上述無(wú)線通信可以使用任一通信標(biāo)準(zhǔn)或協(xié)議,包括但不限于全球移動(dòng)通訊系統(tǒng)(Global System of Mobile communication,GSM)、通用分組無(wú)線服務(wù)(General Packet Radio Service,GPRS)、碼分多址(Code Division Multiple Access,CDMA)、寬帶碼分多址(Wideband Code Division Multiple Access,WCDMA)、長(zhǎng)期演進(jìn)(Long Term Evolution,LTE)、電子郵件、短消息服務(wù)(Short Messaging Service,SMS)等。
存儲(chǔ)器720可用于存儲(chǔ)軟件程序以及模塊,處理器780通過(guò)運(yùn)行存儲(chǔ)在存儲(chǔ)器720的軟件程序以及模塊,從而執(zhí)行手機(jī)的各種功能應(yīng)用以及數(shù)據(jù)處理。存儲(chǔ)器720可主要包括存儲(chǔ)程序區(qū)和存儲(chǔ)數(shù)據(jù)區(qū),其中,存儲(chǔ)程序區(qū)可存儲(chǔ)操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲(chǔ)數(shù)據(jù)區(qū)可存儲(chǔ)根據(jù)手機(jī)的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲(chǔ)器720可以包括高速隨機(jī)存取存儲(chǔ)器,還可以包括非易失性存儲(chǔ)器,例如至少一個(gè)磁盤(pán)存儲(chǔ)器件、閃存器件、或其他易失性固態(tài)存儲(chǔ)器件。
輸入單元730可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與手機(jī)的用戶設(shè)置以及功能控制有關(guān)的鍵信號(hào)輸入。具體地,輸入單元730可包括觸控面板731以及其他輸入設(shè)備732。觸控面板731,也稱(chēng)為觸摸屏,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板731上或在觸控面板731附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動(dòng)相應(yīng)的連接裝置??蛇x的,觸控面板731可包括觸摸檢測(cè)裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測(cè)裝置檢測(cè)用戶的觸摸方位,并檢測(cè)觸摸操作帶來(lái)的信號(hào),將信號(hào)傳送給觸摸控制器;觸摸控制器從觸摸檢測(cè)裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給處理器780,并能接收處理器780發(fā)來(lái)的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類(lèi)型實(shí)現(xiàn)觸控面板731。除了觸控面板731,輸入單元730還可以包括其他輸入設(shè)備732。具體地,其他輸入設(shè)備732可以包括但不限于物理鍵盤(pán)、功能鍵(比如音量控制按鍵、開(kāi)關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。
顯示單元740可用于顯示由用戶輸入的信息或提供給用戶的信息以及手機(jī)的各種菜單。顯示單元740可包括顯示面板741,可選的,可以采用液晶顯示器(Liquid Crystal Display,LCD)、有機(jī)發(fā)光二極管(Organic Light-Emitting Diode,OLED)等形式來(lái)配置顯示面板741。進(jìn)一步的,觸控面板731可覆蓋顯示面板741,當(dāng)觸控面板731檢測(cè)到在其上或附近的觸摸操作后,傳送給處理器780以確定觸摸事件的類(lèi)型,隨后處理器780根據(jù)觸摸事件的類(lèi)型在顯示面板741上提供相應(yīng)的視覺(jué)輸出。雖然在圖7中,觸控面板731與顯示面板741是作為兩個(gè)獨(dú)立的部件來(lái)實(shí)現(xiàn)手機(jī)的輸入和輸入功能,但是在某些實(shí)施例中,可以將觸控面板731與顯示面板741集成而實(shí)現(xiàn)手機(jī)的輸入和輸出功能。
手機(jī)還可包括至少一種傳感器750,比如光傳感器、運(yùn)動(dòng)傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來(lái)調(diào)節(jié)顯示面板741的亮度,接近傳感器可在手機(jī)移動(dòng)到耳邊時(shí),關(guān)閉顯示面板741和/或背光。作為運(yùn)動(dòng)傳感器的一種,加速計(jì)傳感器可檢測(cè)各個(gè)方向上(一般為三軸)加速度的大小,靜止時(shí)可檢測(cè)出重力的大小及方向,可用于識(shí)別手機(jī)姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計(jì)姿態(tài)校準(zhǔn))、振動(dòng)識(shí)別相關(guān)功能(比如計(jì)步器、敲擊)等;至于手機(jī)還可配置的陀螺儀、氣壓計(jì)、濕度計(jì)、溫度計(jì)、紅外線傳感器等其他傳感器,在此不再贅述。
音頻電路760、揚(yáng)聲器761,傳聲器762可提供用戶與手機(jī)之間的音頻接口。音頻電路760可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號(hào),傳輸?shù)綋P(yáng)聲器761,由揚(yáng)聲器761轉(zhuǎn)換為聲音信號(hào)輸出;另一方面,傳聲器762將收集的聲音信號(hào)轉(zhuǎn)換為電信號(hào),由音頻電路760接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器780處理后,經(jīng)RF電路710以發(fā)送給比如另一手機(jī),或者將音頻數(shù)據(jù)輸出至存儲(chǔ)器720以便進(jìn)一步處理。
WiFi屬于短距離無(wú)線傳輸技術(shù),手機(jī)通過(guò)WiFi模塊770可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)頁(yè)和訪問(wèn)流式媒體等,它為用戶提供了無(wú)線的寬帶互聯(lián)網(wǎng)訪問(wèn)。雖然圖7示出了WiFi模塊770,但是可以理解的是,其并不屬于手機(jī)的必須構(gòu)成,完全可以根據(jù)需要在不改變發(fā)明的本質(zhì)的范圍內(nèi)而省略。
處理器780是手機(jī)的控制中心,利用各種接口和線路連接整個(gè)手機(jī)的各個(gè)部分,通過(guò)運(yùn)行或執(zhí)行存儲(chǔ)在存儲(chǔ)器720內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲(chǔ)在存儲(chǔ)器720內(nèi)的數(shù)據(jù),執(zhí)行手機(jī)的各種功能和處理數(shù)據(jù),從而對(duì)手機(jī)進(jìn)行整體監(jiān)控??蛇x的,處理器780可包括一個(gè)或多個(gè)處理單元;優(yōu)選的,處理器780可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無(wú)線通信??梢岳斫獾氖?,上述調(diào)制解調(diào)處理器也可以不集成到處理器780中。
手機(jī)還包括給各個(gè)部件供電的電源790(比如電池),優(yōu)選的,電源可以通過(guò)電源管理系統(tǒng)與處理器780邏輯相連,從而通過(guò)電源管理系統(tǒng)實(shí)現(xiàn)管理充電、放電、以及功耗管理等功能。
盡管未示出,手機(jī)還可以包括攝像頭、藍(lán)牙模塊等,在此不再贅述。
在本實(shí)施例中,音頻電路760或者輸入單元730可以作為音頻拾取設(shè)備使用,處理器780則可以對(duì)應(yīng)到前述實(shí)施例中處理器602的功能。在此不再贅述。
值得注意的是,上述裝置實(shí)施例中,所包括的各個(gè)單元只是按照功能邏輯進(jìn)行劃分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應(yīng)的功能即可;另外,各功能單元的具體名稱(chēng)也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護(hù)范圍。
另外,本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述各方法實(shí)施例中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,相應(yīng)的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。
以上僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明實(shí)施例揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。