專(zhuān)利名稱(chēng):音頻的時(shí)間伸縮方法與相關(guān)裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是有關(guān)于ー種音頻的時(shí)間伸縮方法與相關(guān)裝置,且特別是有關(guān)于ー種于低能量值音頻數(shù)據(jù)中進(jìn)行時(shí)間伸縮的音頻時(shí)間伸縮方法與相關(guān)裝置。
背景技術(shù):
網(wǎng)絡(luò)即時(shí)影音傳輸技術(shù),例如VoIP (Voice over Internet Protocol),能為使用者提供迅速且具有臨場(chǎng)感的影音多媒體服務(wù),已成為現(xiàn)代資訊廠商研發(fā)的重點(diǎn)。在網(wǎng)絡(luò)即時(shí)影音傳輸技術(shù)中,發(fā)射端會(huì)將待發(fā)送的音頻進(jìn)行取樣、數(shù)字化并編碼,形成多筆數(shù)字的音頻數(shù)據(jù),每筆音頻數(shù)據(jù)對(duì)應(yīng)音頻的ー個(gè)振幅取樣。每多筆音頻數(shù)據(jù)會(huì)被統(tǒng)一封裝于ー網(wǎng)絡(luò)封包中,再經(jīng)由網(wǎng)絡(luò)傳輸至接收端。接收端接收封包后,就可解封裝、解碼、解調(diào)出原先的數(shù)字音頻數(shù)據(jù);進(jìn)ー步進(jìn)行數(shù)字模擬轉(zhuǎn)換后,還原模擬音頻訊號(hào)并播放出 來(lái)。在發(fā)射端,各音頻數(shù)據(jù)對(duì)應(yīng)一定的取樣時(shí)序(如取樣時(shí)間間隔);因此,到了接收端,各音頻數(shù)據(jù)應(yīng)該要依照相同的取樣時(shí)序進(jìn)行數(shù)字模擬轉(zhuǎn)換,才能重建回發(fā)射端欲發(fā)出的音頻。為了要按照既定的時(shí)序進(jìn)行數(shù)字模擬轉(zhuǎn)換,接收端必須要按照一定的時(shí)序提供音頻數(shù)據(jù)至數(shù)字模擬轉(zhuǎn)換機(jī)制。不過(guò),音頻數(shù)據(jù)是由封包得到的;若封包傳輸至接收端的時(shí)序不規(guī)律,就會(huì)連帶影響接收端播放音頻的品質(zhì)。事實(shí)上,在網(wǎng)絡(luò)即時(shí)影音傳輸技術(shù)中,封包傳輸?shù)臅r(shí)序會(huì)受各種因素影響,例如抖動(dòng)(jitter)與時(shí)鐘脈沖漂移(clock drift)。當(dāng)封包經(jīng)由網(wǎng)絡(luò)傳輸時(shí),會(huì)因網(wǎng)絡(luò)協(xié)議而繞經(jīng)不同的路徑才傳輸至接收端,使封包無(wú)法依照發(fā)射的時(shí)序被傳輸至接收端;此種現(xiàn)象即為抖動(dòng)。若發(fā)射端與接收端的參考時(shí)鐘脈沖不同,也會(huì)導(dǎo)致封包傳輸時(shí)序的不一致。例如,當(dāng)協(xié)定的封包長(zhǎng)度為10ms (Ims為千分之一秒)時(shí),若發(fā)送端姆10. Olms傳送ー個(gè)語(yǔ)音封包,接收端每9. 99ms播放ー個(gè)封包,則每隔100個(gè)封包的傳輸時(shí)間,兩端的認(rèn)知時(shí)差就會(huì)達(dá)到2ms。此即為時(shí)鐘脈沖漂移。在接收端中,為了要按照既定時(shí)序提供音頻數(shù)據(jù)至數(shù)字模擬轉(zhuǎn)換機(jī)制,需視時(shí)序需求進(jìn)行音頻時(shí)間伸縮當(dāng)接收端無(wú)法由封包中及時(shí)取得音頻數(shù)據(jù)時(shí),需自行插入額外的音頻數(shù)據(jù);若封包提供的音頻數(shù)據(jù)過(guò)多而接收端無(wú)法及時(shí)緩沖吋,接收端則會(huì)移除/放棄
一些音頻數(shù)據(jù)。然而,不當(dāng)?shù)囊纛l時(shí)間伸縮操作會(huì)影響音頻播放的品質(zhì),讓接收端的使用者察覺(jué)到明顯的音頻瑕疵。
發(fā)明內(nèi)容
本發(fā)明提出一種依據(jù)音頻數(shù)據(jù)能量值而進(jìn)行時(shí)間伸縮的音頻時(shí)間伸縮方法與相關(guān)裝置,在音頻的能量值、音量較低時(shí)進(jìn)行音頻數(shù)據(jù)的插入或移除,以降低時(shí)間伸縮對(duì)音頻品質(zhì)的不良影響,讓使用者不會(huì)察覺(jué)不自然的音頻瑕疵。本發(fā)明提供一種音頻的時(shí)間伸縮方法,包括接收多筆音頻數(shù)據(jù);依據(jù)這些音頻數(shù)據(jù)的振幅大小計(jì)算一能量值;并依據(jù)能量值決定是否于這些音頻數(shù)據(jù)中進(jìn)行波形搜尋。例如,若能量值小于一臨界值,進(jìn)行波形搜尋;若能量值大于臨界值,則不進(jìn)行波形搜尋。較佳地,當(dāng)于前述音頻數(shù)據(jù)中進(jìn)行波形搜尋時(shí),依據(jù)波形相似程度而選出第一數(shù)目筆(可以是多筆)音頻數(shù)據(jù)作為可移除音頻數(shù)據(jù)。搜尋到可移除音頻數(shù)據(jù)后可將一可移除旗標(biāo)設(shè)定為一致能值。類(lèi)似地,亦依據(jù)波形相似程度而選出第二數(shù)目筆音頻數(shù)據(jù)作為可増加音頻數(shù)據(jù);搜尋到可増加音頻數(shù)據(jù)后可將一可増加旗標(biāo)設(shè)定為一致能值。在提供音頻數(shù)據(jù)至數(shù)字模擬轉(zhuǎn)換機(jī)制時(shí),可檢查一音頻庫(kù)藏(repository)。若音頻庫(kù)藏高于一水位值(water level)且可移除旗標(biāo)符合致能值,便可由前述音頻數(shù)據(jù)中將可移除音頻數(shù)據(jù)移除。類(lèi)似地,若音頻庫(kù)藏低于水位值且可増加旗標(biāo)符合致能值,于音頻數(shù)據(jù)中插入可增加音頻數(shù)據(jù)。臨界值的大小可由回授機(jī)制調(diào)整。在輸出前述音頻數(shù)據(jù)后而要處理另多筆第二音頻數(shù)據(jù)時(shí),可依據(jù)前述音頻數(shù)據(jù)(如其能量值)更新臨界值。然后,便可將第二音頻數(shù)據(jù)對(duì)應(yīng)的能量值與更新后的臨界值相比較以判斷是否要進(jìn)行波形搜尋。
本發(fā)明亦提供一種應(yīng)用音頻時(shí)間伸縮、實(shí)現(xiàn)前述時(shí)間伸縮方法的裝置,包括一能量值模塊、一波形搜尋模塊、ー決策模塊、一臨界值模塊、一旗標(biāo)暫存器與一緩沖控制模塊。能量值模塊依據(jù)各批多筆音頻數(shù)據(jù)的振幅計(jì)算ー對(duì)應(yīng)的能量值,決策模塊依據(jù)能量值的大小決定波形搜尋模塊是否對(duì)各批音頻數(shù)據(jù)進(jìn)行波形搜尋。例如,當(dāng)某批音頻數(shù)據(jù)的能量值大于臨界值,波形搜尋模塊不于該批音頻數(shù)據(jù)中進(jìn)行波形搜尋。若能量值小于臨界值,波形搜尋模塊就會(huì)在該批音頻數(shù)據(jù)中進(jìn)行波形搜尋,依據(jù)波形相似程度而在該批音頻數(shù)據(jù)中找出可移除音頻數(shù)據(jù)與可増加音頻數(shù)據(jù),而旗標(biāo)暫存器中的可移除旗標(biāo)與可増加旗標(biāo)則分別被設(shè)為致能值。緩沖控制模塊檢查音頻庫(kù)藏;若音頻庫(kù)藏高于一水位值且可移除旗標(biāo)符合致能值,緩沖控制模塊還由該批音頻數(shù)據(jù)中將可移除音頻數(shù)據(jù)移除。類(lèi)似地,若音頻庫(kù)藏低于水位值且可増加旗標(biāo)符合致能值,緩沖控制模塊更于該批音頻數(shù)據(jù)插入可増加音頻數(shù)據(jù)。臨界值模塊提供前述的臨界值。隨各批音頻數(shù)據(jù)更迭,臨界值模塊可依據(jù)先前各批音頻數(shù)據(jù)的能量值更新當(dāng)前音頻數(shù)據(jù)所對(duì)應(yīng)的臨界值。為了對(duì)本發(fā)明的上述及其他方面有更佳的了解,以下以實(shí)施例并配合附圖,作詳細(xì)說(shuō)明如下
圖I是依據(jù)本發(fā)明ー實(shí)施例而在音頻中應(yīng)用低能量部分的示意圖。圖2是依據(jù)本發(fā)明ー實(shí)施例的音頻的時(shí)間伸縮的流程示意圖。圖3是依據(jù)本發(fā)明ー實(shí)施例的音頻時(shí)間伸縮的裝置示意圖。主要元件符號(hào)說(shuō)明10:音頻時(shí)間伸縮的裝置12 :能量值模塊14:臨界值模塊16 :決策模塊18 :波形搜尋模塊
20 :緩沖控制模塊22 :旗標(biāo)暫存器100 :流程102-122 :步驟A:臨界值B:能量值addFlag、removeFlag :旗標(biāo)WV :波形Ts、Tl、T2:時(shí)段
具體實(shí)施例方式請(qǐng)參考圖1,其以一波形WV不意一音頻,其橫軸為時(shí)間。音頻中會(huì)有音量較低的部份;舉例而言,連續(xù)的語(yǔ)音由許多獨(dú)立字節(jié)組合而成,字節(jié)與字節(jié)間會(huì)有短暫的語(yǔ)音間隔;此時(shí),瞬間的能量會(huì)降低,且這時(shí)段的語(yǔ)意重要性較低。舉例而言,圖的音頻WV在時(shí)段Tl與T2中分別有兩個(gè)字節(jié),其均方根(RMS,Root Mean Square)能量值可達(dá)到-18dB與-22dB。相對(duì)地,時(shí)段Ts是兩字節(jié)間的語(yǔ)音間隔,其均方根能量值僅-34dB。希望利用這些能量值較低的時(shí)段來(lái)進(jìn)行音頻的時(shí)間伸縮,將時(shí)間伸縮對(duì)人耳聽(tīng)覺(jué)的影響盡量降低。請(qǐng)參考圖2,其所示意的系依據(jù)本發(fā)明一實(shí)施例的流程100,其可應(yīng)用在網(wǎng)絡(luò)即時(shí)影音傳輸?shù)慕邮斩?,以進(jìn)行音頻的時(shí)間伸縮。流程100的主要步驟可描述如下。步驟102 :接收ー批多筆音頻數(shù)據(jù)作為輸入。舉例而言,這多筆音頻數(shù)據(jù)可以是由接收端中的解封裝/解碼/解調(diào)機(jī)制所提供的;一批音頻數(shù)據(jù)可以是由同一封包中取得的多筆音頻數(shù)據(jù)。這些音頻數(shù)據(jù)可以是脈沖調(diào)制(Pulse Code Modulation, PCM)的音頻數(shù)據(jù)。步驟104 :依據(jù)各音頻數(shù)據(jù)的振幅大小為該批音頻數(shù)據(jù)計(jì)算ー對(duì)應(yīng)的能量值B,舉例而言,是依據(jù)該批音頻數(shù)據(jù)的振幅的均方根值計(jì)算出能量值B。步驟106 :比較能量值B與一臨界值A(chǔ) ;若能量值B小于臨界值A(chǔ),進(jìn)行至步驟108,否則進(jìn)行至步驟114。步驟108 :進(jìn)行波形搜尋,舉例而言,是依據(jù)波形相程度而于該批音頻數(shù)據(jù)中選出第一數(shù)目筆音頻數(shù)據(jù)作為可移除音頻數(shù)據(jù),亦選出第二數(shù)目筆音頻數(shù)據(jù)作為可増加音頻數(shù)據(jù)??梢瞥纛l數(shù)據(jù)和可増加音頻數(shù)據(jù)可以是相同或相異的;第一數(shù)目與第二數(shù)目可以是相同或相異的。較佳地,可依據(jù)以波形相似度為基礎(chǔ)的同步重迭累加(waveformsimilarity based synchronized overlap-add, WS0LA)演算法或類(lèi)似的衍生演算法來(lái)進(jìn)行波形搜尋,以找出可移除音頻數(shù)據(jù)與可増加音頻數(shù)據(jù)。在此批音頻數(shù)據(jù)中,若有一組音頻數(shù)據(jù)所呈現(xiàn)的波形與相鄰的另一組音頻數(shù)據(jù)相類(lèi)似,則其中一組音頻數(shù)據(jù)便可作為可移除音頻數(shù)據(jù);若在此批音頻數(shù)據(jù)中將這組音頻數(shù)據(jù)移除,可在不改變音調(diào)(Pitch)的情形下以減少音頻數(shù)據(jù)個(gè)數(shù)的方式來(lái)縮減這批音頻數(shù)據(jù)的時(shí)間。依據(jù)類(lèi)似的原理,亦可找出可增加音頻數(shù)據(jù),用以在不改變音調(diào)的情形下以增加音頻數(shù)據(jù)個(gè)數(shù)的方式延長(zhǎng)這批音頻數(shù)據(jù)的時(shí)間。
步驟110A :搜尋到可移除音頻數(shù)據(jù)后,可標(biāo)定(tag)可移除音頻數(shù)據(jù)的位置及/或起訖,并將一旗標(biāo)removeFlag (即可移除旗標(biāo))設(shè)定為邏輯真(即一致能值,圖2中標(biāo)示為 True)。步驟IlOB :若旗標(biāo)removeFlag為邏輯真,進(jìn)行至步驟114。若旗標(biāo)removeFlag仍未被設(shè)定為邏輯真,可進(jìn)行其他額外處理步驟(未圖示),例如改變波形搜尋參數(shù)以重新進(jìn)行步驟108的波形搜尋,或依據(jù)其他法則指定可移除音頻數(shù)據(jù)。步驟112A :搜尋到可増加音頻數(shù)據(jù)后,可標(biāo)定可増加音頻數(shù)據(jù)的位置及/或起訖,并將另一旗標(biāo)addFlag (即可增加旗標(biāo))設(shè)為邏輯真。步驟112B :若旗標(biāo)addFlag為邏輯真,進(jìn)行至步驟114。步驟114 :進(jìn)行緩沖控制,緩沖音頻數(shù)據(jù),準(zhǔn)備依既定時(shí)序輸出各音頻數(shù)據(jù)。步驟116 :檢查音頻庫(kù)藏,判斷緩沖中的音頻數(shù)據(jù)個(gè)數(shù)是否能及時(shí)因應(yīng)數(shù)字模擬轉(zhuǎn)換機(jī)制的時(shí)序。若音頻庫(kù)藏正常,則進(jìn)行至步驟122,并將旗標(biāo)removeFlag與addFlag重·設(shè)為邏輯偽(標(biāo)示為False)。反之,若音頻庫(kù)藏不正常而面臨緩沖的溢位(overflow)或欠位(underflow),則分別依據(jù)旗標(biāo)removeFlag與addFlag的狀態(tài)而進(jìn)行至步驟118或120。舉例而言,若音頻庫(kù)藏高于ー預(yù)設(shè)水位且旗標(biāo)removeFlag為邏輯真,便進(jìn)行至步驟118 ;若音頻庫(kù)藏低于水位且旗標(biāo)addFlag為邏輯真,便進(jìn)行至步驟120。庫(kù)藏高于水位代表音頻數(shù)據(jù)的個(gè)數(shù)過(guò)多,需移除部份的音頻數(shù)據(jù);若旗標(biāo)removeFlag為邏輯真,代表步驟110A已經(jīng)為此批音頻數(shù)據(jù)搜尋到可移除的音頻數(shù)據(jù),如此,便進(jìn)行至步驟118。若旗標(biāo)removeFlag不是邏輯真,則可進(jìn)行其他額外處置動(dòng)作(未圖示),舉例而言,依據(jù)其他法則指定可移除音頻數(shù)據(jù)。另ー方面,庫(kù)藏低于水位代表音頻數(shù)據(jù)的個(gè)數(shù)過(guò)少,需增加音頻數(shù)據(jù)的個(gè)數(shù);若旗標(biāo)addFlag為邏輯真,代表步驟112A已經(jīng)為此批音頻數(shù)據(jù)搜尋到可供増加的音頻數(shù)據(jù),故可進(jìn)行至步驟120。步驟118 :從該批音頻數(shù)據(jù)中將可移除數(shù)據(jù)移除。舉例而言,可依據(jù)步驟110A中的標(biāo)定將可移除數(shù)據(jù)去除,以縮短此批音頻數(shù)據(jù)的時(shí)間。步驟120 :將可增加數(shù)據(jù)插入至此批音頻數(shù)據(jù)中。舉例而言,可依據(jù)步驟112A中的標(biāo)定將可增加數(shù)據(jù)插入,延長(zhǎng)此批音頻數(shù)據(jù)的時(shí)間。步驟122 :輸出音頻數(shù)據(jù),舉例而言,利用接收端的數(shù)字模擬轉(zhuǎn)換機(jī)制(未圖示)輸出音頻數(shù)據(jù)。步驟124 :在為此批音頻數(shù)據(jù)提供臨界值A(chǔ)時(shí),可依據(jù)先前各批音頻數(shù)據(jù)(如其能量值)更新臨界值A(chǔ),以適應(yīng)性地調(diào)整臨界值A(chǔ)之值,使臨界值A(chǔ)能反應(yīng)音頻整體的能量極小值,足以用來(lái)鑒別音節(jié)與音節(jié)間的語(yǔ)音間隔。例如,在為第(n-1)批音頻數(shù)據(jù)進(jìn)行緩沖控制時(shí),若其對(duì)應(yīng)的能量值B[n-1]小于當(dāng)時(shí)的臨界值A(chǔ)[n-1],則在為第n批音頻數(shù)據(jù)提供臨界值A(chǔ)[n]時(shí),可使臨界值A(chǔ)[n]低于臨界值A(chǔ)[n_l]。反之,若能量值B[n_l]大于臨界值A(chǔ)[n-1],則可使臨界值A(chǔ)[n]等于臨界值A(chǔ)[n_l]。但若連續(xù)有許多批音頻數(shù)據(jù)的能量值B均大于臨界值A(chǔ),則在更新臨界值A(chǔ)時(shí)可嘗試將臨界值A(chǔ)増加。熟知本技術(shù)領(lǐng)域者可了解,可廣泛運(yùn)用其他各種可動(dòng)態(tài)調(diào)整臨界值A(chǔ)的技術(shù)來(lái)使臨界值A(chǔ)具有足夠的鑒別力。由步驟106可看出,本發(fā)明的主要精神之一,可利用音頻中能量值較低、音量較小的時(shí)段進(jìn)行音頻時(shí)間伸縮的操作,以便將時(shí)間伸縮操作所導(dǎo)致的音頻品質(zhì)瑕疵隱藏在使用者難以察覺(jué)的部份,降低時(shí)間伸縮對(duì)音頻品質(zhì)的影響。圖3顯示了依據(jù)本發(fā)明一實(shí)施例的音頻時(shí)間伸縮的裝置10,可施用圖3中的流程100以依據(jù)能量值來(lái)進(jìn)行音頻的時(shí)間伸縮。裝置10包含能量值模塊12、決策模塊16、波形搜尋模塊18、臨界值模塊14、旗標(biāo)暫存器22與緩沖控制模塊20。能量值模塊12依據(jù)各批多筆音頻數(shù)據(jù)的振幅計(jì)算對(duì)應(yīng)的能量值B,臨界值模塊14提供臨界值A(chǔ)。決策模塊16依據(jù)能量值B的大小決定波形搜尋模塊18是否對(duì)各批音頻數(shù)據(jù)進(jìn)行波形搜尋。舉例而言,當(dāng)某批音頻數(shù)據(jù)的能量值B大于臨界值A(chǔ),波形搜尋模塊18不于該批音頻數(shù)據(jù)中進(jìn)行波形搜尋。若能量值B小于臨界值A(chǔ),波形搜尋模塊18就會(huì)在該批音頻數(shù)據(jù)中進(jìn)行波形搜尋,依據(jù)波形相似程度而在該批音頻數(shù)據(jù)中找出可移除音頻數(shù)據(jù)與可増加音頻數(shù)據(jù),而旗標(biāo)暫存器22中的旗標(biāo)removeFlag與旗標(biāo)addFlag則分別被設(shè)為邏輯真的致能值。緩沖控制模塊20檢查音頻庫(kù)藏;若音頻庫(kù)藏高于一水位值且旗標(biāo)removeFlag為邏輯真,緩沖控制模塊20就可由該批音頻數(shù)據(jù)中將可移除音頻數(shù)據(jù)移除。或者,若音頻庫(kù)藏低于水位值且旗標(biāo)addFlag為邏輯真,緩沖控制模塊20就可于該批音頻數(shù)據(jù)插入可増加音頻數(shù)據(jù)。
隨各批音頻數(shù)據(jù)更迭,臨界值模塊14可依據(jù)先前各批音頻數(shù)據(jù)(如其能量值B)更新當(dāng)前音頻數(shù)據(jù)所對(duì)應(yīng)的臨界值A(chǔ)。緩沖控制模塊20可運(yùn)用于網(wǎng)絡(luò)即時(shí)影音傳輸?shù)慕邮斩?,由解封裝/解碼/解調(diào)機(jī)制(未圖示)接收數(shù)字的音頻數(shù)據(jù),并將緩沖后的音頻數(shù)據(jù)輸出至數(shù)字模擬轉(zhuǎn)換機(jī)制(未圖示)。緩沖控制模塊20的各模塊可用軟件、固件及/或硬件來(lái)實(shí)現(xiàn)??偨Y(jié)來(lái)說(shuō),本發(fā)明依據(jù)音頻數(shù)據(jù)的能量值來(lái)進(jìn)行音頻的時(shí)間伸縮,利用音頻中音量低、能量小的部份進(jìn)行時(shí)間伸縮,讓使用者難以察覺(jué)時(shí)間伸縮的操作痕跡,有效減少時(shí)間伸縮對(duì)音頻品質(zhì)的影響。前述討論雖以網(wǎng)絡(luò)即時(shí)影音傳輸為例,但本發(fā)明可廣泛運(yùn)用各種需要進(jìn)行音頻時(shí)間伸縮的應(yīng)用,舉例而言,在語(yǔ)言學(xué)習(xí)、將語(yǔ)音轉(zhuǎn)為文字等應(yīng)用中加速或延緩語(yǔ)音速度但不改變其音調(diào)。綜上所述,本發(fā)明雖以較佳實(shí)施例掲示如上,然其并非用以限定本發(fā)明。本發(fā)明所屬技術(shù)領(lǐng)域中具有通常知識(shí)者,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作各種的更動(dòng)與潤(rùn)飾。因此,本發(fā)明的保護(hù)范圍當(dāng)以權(quán)利要求書(shū)界定為準(zhǔn)。
權(quán)利要求
1.一種音頻的時(shí)間伸縮方法,包含 接收多筆第一音頻數(shù)據(jù); 依據(jù)該些第一音頻數(shù)據(jù)的振幅大小計(jì)算一能量值;以及 依據(jù)該能量值決定是否于該些第一音頻數(shù)據(jù)中進(jìn)行波形搜尋。
2.如權(quán)利要求I所述的時(shí)間伸縮方法,其特征在于,還包含 若該能量值小于一臨界值,進(jìn)行波形搜尋;以及 若該能量值大于該臨界值,不進(jìn)行波形搜尋。
3.如權(quán)利要求2所述的時(shí)間伸縮方法,其特征在于,還包含 接收多筆第二音頻數(shù)據(jù); 依據(jù)該能量值更新該臨界值;以及 依據(jù)該些第二音頻數(shù)據(jù)的振幅大小是否小于該更新后的臨界值而決定是否于該些第二音頻數(shù)據(jù)中進(jìn)行波形搜尋。
4.如權(quán)利要求I所述的時(shí)間伸縮方法,其特征在于,還包含 于該些第一音頻數(shù)據(jù)中進(jìn)行該波形搜尋時(shí),依據(jù)波形相似程度而于該些第一音頻數(shù)據(jù)中選出第一數(shù)目筆第一音頻數(shù)據(jù)作為可移除音頻數(shù)據(jù)。
5.如權(quán)利要求4所述的時(shí)間伸縮方法,其特征在于,還包含 于該些第一音頻數(shù)據(jù)中選出可移除音頻數(shù)據(jù)后,將一可移除旗標(biāo)設(shè)定為一致能值。
6.如權(quán)利要求5所述的時(shí)間伸縮方法,其特征在于,還包含 檢查一音頻庫(kù)藏; 若該音頻庫(kù)藏高于一水位值且該可移除旗標(biāo)符合該致能值,由該些第一音頻數(shù)據(jù)中將該可移除音頻數(shù)據(jù)移除。
7.如權(quán)利要求I所述的時(shí)間伸縮方法,其特征在于,還包含 于該些第一音頻數(shù)據(jù)中進(jìn)行波形搜尋時(shí),依據(jù)波形相似程度而于該些第一音頻數(shù)據(jù)中選出第二數(shù)目筆第一音頻數(shù)據(jù)作為可增加音頻數(shù)據(jù)。
8.如權(quán)利要求7所述的時(shí)間伸縮方法,其特征在于,還包含 于該些第一音頻數(shù)據(jù)中選出可增加音頻數(shù)據(jù)后,將一可增加旗標(biāo)設(shè)定為一致能值。
9.如權(quán)利要求8項(xiàng)所述的時(shí)間伸縮方法,其特征在于,還包含 檢查一音頻庫(kù)藏; 若該音頻庫(kù)藏低于一水位值且該可增加旗標(biāo)符合該致能值,于該些第一音頻數(shù)據(jù)中插入該可增加音頻數(shù)據(jù)。
10.一種音頻時(shí)間伸縮的裝置,包含 一能量值模塊,依據(jù)多筆第一音頻數(shù)據(jù)的振幅大小計(jì)算一能量值;以及一決策模塊,耦接于該能量值模塊,依據(jù)該能量值的大小決定是否對(duì)該些第一音頻數(shù)據(jù)進(jìn)行一波形搜尋。
11.如權(quán)利要求10所述的裝置,其特征在于,包含一波形搜尋模塊耦接于該決策模塊用以進(jìn)行該波形搜尋,且使得該決策模塊依據(jù)該能量值的大小決定是否對(duì)該些第一音頻數(shù)據(jù)進(jìn)行該波形搜尋。
12.如權(quán)利要求11所述的裝置,其特征在于,還包含 一臨界值模塊,提供一臨界值;其中,該決策模塊系比較該能量值與該臨界值,若該能量值小于該臨界值,則該波形搜尋模塊對(duì)該些第一音頻訊號(hào)進(jìn)行波形搜尋;否則,不以該波形搜尋模塊進(jìn)行該波形搜尋。
13.如權(quán)利要求12所述的裝置,其特征在于,當(dāng)該能量值模塊依據(jù)多筆第二音頻數(shù)據(jù)的振幅大小計(jì)算一第二能量值時(shí),該臨界值模塊依據(jù)該能量值更新該臨界值,使該決策模塊比較該第二能量值與該更新后的臨界值以決定是否利用該波形搜尋模塊對(duì)該些第二音頻數(shù)據(jù)進(jìn)行波形搜尋。
14.如權(quán)利要求11所述的裝置,其特征在于,當(dāng)該波形搜尋模塊對(duì)該些第一音頻數(shù)據(jù)進(jìn)行波形搜尋時(shí),依據(jù)波形相似程度而于該多筆第一音頻數(shù)據(jù)中選出第一數(shù)目筆第一音頻數(shù)據(jù)以作為可移除音頻數(shù)據(jù)。
15.如權(quán)利要求14所述的裝置,其特征在于,還包含一旗標(biāo)暫存器,記錄一可移除旗標(biāo);其中,當(dāng)該波形搜尋模塊選出該可移除音頻數(shù)據(jù)后,該可移除旗標(biāo)被設(shè)定為一致能值。
16.如權(quán)利要求15所述的裝置,其特征在于,還包含一緩沖控制模塊,檢查一音頻庫(kù)藏;若該音頻庫(kù)藏高于一水位值且該可移除旗標(biāo)符合該致能值,該緩沖控制模塊由該些第一音頻數(shù)據(jù)中將該可移除音頻數(shù)據(jù)移除。
17.如權(quán)利要求11所述的裝置,其特征在于,當(dāng)該波形搜尋模塊對(duì)該些第一音頻數(shù)據(jù)進(jìn)行波形搜尋時(shí),依據(jù)波形相似程度而于該多筆第一音頻數(shù)據(jù)中選出第二數(shù)目筆第一音頻數(shù)據(jù)以作為可增加音頻數(shù)據(jù)。
18.如權(quán)利要求17所述的裝置,其特征在于,包含一旗標(biāo)暫存器,記錄一可增加旗標(biāo);其中,當(dāng)該波形搜尋模塊選出該可增加音頻數(shù)據(jù)后,該可增加旗標(biāo)被設(shè)定為一致能值。
19.如權(quán)利要求18所述的裝置,其特征在于,還包含一緩沖控制模塊,檢查一音頻庫(kù)藏;若該音頻庫(kù)藏低于一水位值且該可增加旗標(biāo)符合該致能值,該緩沖控制模塊由該些第一音頻數(shù)據(jù)中插入該可增加音頻數(shù)據(jù)。
全文摘要
本發(fā)明涉及一種音頻的時(shí)間伸縮方法與相關(guān)裝置,其在接收多筆音頻數(shù)據(jù)后依據(jù)振幅大小計(jì)算一能量值,并依據(jù)能量值判斷此批音頻數(shù)據(jù)是否用于音頻時(shí)間伸縮;利用能量值較低、音量較小的音頻數(shù)據(jù)來(lái)進(jìn)行時(shí)間伸縮,減少時(shí)間伸縮對(duì)整體音頻品質(zhì)的影響。
文檔編號(hào)G11B20/12GK102708904SQ201110084859
公開(kāi)日2012年10月3日 申請(qǐng)日期2011年3月28日 優(yōu)先權(quán)日2011年3月28日
發(fā)明者連矩鋒 申請(qǐng)人:晨星半導(dǎo)體股份有限公司, 晨星軟件研發(fā)(深圳)有限公司