亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

音樂節(jié)奏檢測(cè)方法及其系統(tǒng)與流程

文檔序號(hào):11434083閱讀:440來源:國(guó)知局
音樂節(jié)奏檢測(cè)方法及其系統(tǒng)與流程

本發(fā)明涉及音頻數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種音樂節(jié)奏檢測(cè)方法及其系統(tǒng)。



背景技術(shù):

目前多數(shù)舞臺(tái)中對(duì)燈光的控制大多采用dmx控制臺(tái)進(jìn)行手工控制,極其耗費(fèi)人力成本,音頻控制燈光技術(shù)主要取代人工通過軟件來實(shí)時(shí)檢測(cè)歌曲的節(jié)奏并控制燈光。而現(xiàn)有音頻控制燈光技術(shù)對(duì)于歌曲節(jié)奏的檢測(cè)準(zhǔn)確度不高且適應(yīng)性不強(qiáng),難以達(dá)到音樂跟燈光智能互動(dòng)的目的。

在公開號(hào)為cn201210477064.1的中國(guó)專利公開文件中,其公開了一種音樂節(jié)奏檢測(cè)方法及檢測(cè)裝置,其中音樂節(jié)奏檢測(cè)方法包括:獲取被檢測(cè)音樂的音頻信號(hào);計(jì)算被檢測(cè)音樂的音頻信號(hào)與預(yù)設(shè)的音樂節(jié)奏模型的音頻信號(hào)之間的互相關(guān)函數(shù);根據(jù)被檢測(cè)音樂的類型及互相關(guān)函數(shù)曲線的各波峰位置在被檢測(cè)音樂中出現(xiàn)的次數(shù)而得到被檢測(cè)音樂中包含的預(yù)設(shè)的音樂節(jié)奏模型的數(shù)量;以及將被檢測(cè)音樂中包含的預(yù)設(shè)的音樂節(jié)奏模型的數(shù)量與預(yù)設(shè)節(jié)奏信息進(jìn)行比對(duì)而確定被檢測(cè)音樂的節(jié)奏。該對(duì)比文件通過預(yù)先建立音樂節(jié)奏模型,從而獲得被檢測(cè)音頻信號(hào)的相關(guān)函數(shù),進(jìn)而獲得被檢測(cè)音頻的節(jié)奏。采用這個(gè)檢測(cè)方法,需預(yù)先獲得音頻數(shù)據(jù),并進(jìn)行建立音樂節(jié)奏模型,增加檢測(cè)步驟與復(fù)雜度,給實(shí)際應(yīng)用帶來不便。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明所要解決的技術(shù)問題是:提出一種音樂節(jié)奏檢測(cè)方法及其系統(tǒng),可提高檢測(cè)效率和準(zhǔn)確率。

為了解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:一種音樂節(jié)奏檢測(cè)方法,包括:

獲取音樂的音頻數(shù)據(jù);

在所述音頻數(shù)據(jù)中依序獲取一音頻幀作為當(dāng)前音頻幀,將當(dāng)前音頻幀與上一音頻幀的頻譜能量和的差值,作為當(dāng)前音頻幀的能量差值并保存所述能量差值;

確定當(dāng)前音頻幀對(duì)應(yīng)的能量閾值;

獲取當(dāng)前音頻幀及其之前的與其相鄰的兩個(gè)以上連續(xù)的音頻幀的能量差值,得到三個(gè)以上的音頻幀的能量差值;

若所述三個(gè)以上的音頻幀的能量差值中存在峰值,且所述峰值大于當(dāng)前音頻幀對(duì)應(yīng)的能量閾值,則將所述峰值對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn)。

本發(fā)明還涉及一種音樂節(jié)奏檢測(cè)系統(tǒng),包括:

第一獲取模塊,用于獲取音樂的音頻數(shù)據(jù);

第二獲取模塊,用于在所述音頻數(shù)據(jù)中依序獲取一音頻幀作為當(dāng)前音頻幀,將當(dāng)前音頻幀與上一音頻幀的頻譜能量和的差值,作為當(dāng)前音頻幀的能量差值并保存所述能量差值;

確定模塊,用于確定當(dāng)前音頻幀對(duì)應(yīng)的能量閾值;

第三獲取模塊,用于獲取獲取當(dāng)前音頻幀及其之前的與其相鄰的兩個(gè)以上連續(xù)的音頻幀的能量差值,得到三個(gè)以上的音頻幀的能量差值;

標(biāo)記模塊,用于若所述三個(gè)以上的音頻幀的能量差值中存在峰值,且所述峰值大于當(dāng)前音頻幀對(duì)應(yīng)的能量閾值,則將所述峰值對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn)。

本發(fā)明的有益效果在于:根據(jù)音頻幀之間的能量差值來檢測(cè)出音頻數(shù)據(jù)中的節(jié)奏點(diǎn),可實(shí)時(shí)進(jìn)行,具有更高的準(zhǔn)確性;且無需建立模型,通過分析比較相鄰若干個(gè)音頻幀的能量差值,確定出節(jié)奏點(diǎn),提高了檢測(cè)效率;根據(jù)已處理音頻幀的能量差值自適應(yīng)調(diào)整能量閾值,使得能量閾值與當(dāng)前處理的音頻數(shù)據(jù)更加匹配,避免檢測(cè)出的節(jié)奏點(diǎn)過少或過多,進(jìn)一步提高了檢測(cè)的準(zhǔn)確性,可適用于各種類型音樂的節(jié)奏檢測(cè),具有較強(qiáng)的適應(yīng)性,魯棒性強(qiáng)。

附圖說明

圖1為本發(fā)明一種音樂節(jié)奏檢測(cè)方法的流程圖;

圖2為本發(fā)明實(shí)施例一的方法流程圖;

圖3為本發(fā)明實(shí)施例一步驟s2的方法流程圖;

圖4為本發(fā)明實(shí)施例二步驟s3的方法流程圖;

圖5為本發(fā)明一種音樂節(jié)奏檢測(cè)系統(tǒng)的結(jié)構(gòu)示意圖;

圖6為本發(fā)明實(shí)施例三的系統(tǒng)結(jié)構(gòu)示意圖。

標(biāo)號(hào)說明:

1、第一獲取模塊;2、第二獲取模塊;3、確定模塊;4、第三獲取模塊;

5、標(biāo)記模塊;6、繼續(xù)執(zhí)行模塊;7、控制模塊;

21、第一獲取單元;22、第一得到單元;23、第四計(jì)算單元;24、第二獲取單元;25、第二得到單元;26、第五計(jì)算單元;27、第三得到單元;

31、第一設(shè)置單元;32、第一計(jì)算單元;33、第二設(shè)置單元;

321、第二計(jì)算單元;322、第三計(jì)算單元。

具體實(shí)施方式

為詳細(xì)說明本發(fā)明的技術(shù)內(nèi)容、所實(shí)現(xiàn)目的及效果,以下結(jié)合實(shí)施方式并配合附圖詳予說明。

本發(fā)明最關(guān)鍵的構(gòu)思在于:根據(jù)能量差值確定節(jié)奏點(diǎn),同時(shí),實(shí)時(shí)確定音頻幀對(duì)應(yīng)的能量閾值。

請(qǐng)參閱圖1,一種音樂節(jié)奏檢測(cè)方法,包括:

獲取音樂的音頻數(shù)據(jù);

在所述音頻數(shù)據(jù)中依序獲取一音頻幀作為當(dāng)前音頻幀,將當(dāng)前音頻幀與上一音頻幀的頻譜能量和的差值,作為當(dāng)前音頻幀的能量差值并保存所述能量差值;

確定當(dāng)前音頻幀對(duì)應(yīng)的能量閾值;

獲取當(dāng)前音頻幀及其之前的與其相鄰的兩個(gè)以上連續(xù)的音頻幀的能量差值,得到三個(gè)以上的音頻幀的能量差值;

若所述三個(gè)以上的音頻幀的能量差值中存在峰值,且所述峰值大于當(dāng)前音頻幀對(duì)應(yīng)的能量閾值,則將所述峰值對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn)。

從上述描述可知,本發(fā)明的有益效果在于:可實(shí)時(shí)對(duì)音頻數(shù)據(jù)的節(jié)奏進(jìn)行檢測(cè),檢測(cè)結(jié)果的準(zhǔn)確度高,且效率高。

進(jìn)一步地,所述“確定當(dāng)前音頻幀對(duì)應(yīng)的能量閾值”具體為:

若依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)小于或等于預(yù)設(shè)幀數(shù)n,則將當(dāng)前音頻幀對(duì)應(yīng)的能量閾值設(shè)置為預(yù)設(shè)的第一能量閾值;

若依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)為預(yù)設(shè)幀數(shù)n的自然數(shù)倍,則根據(jù)第一音頻幀組中各音頻幀的能量差值,計(jì)算得到第二能量閾值,所述第一音頻幀組包括當(dāng)前音頻幀及其之前的與其相鄰的連續(xù)n-1個(gè)音頻幀;

將當(dāng)前音頻幀之后的與其相鄰的連續(xù)n個(gè)音頻幀對(duì)應(yīng)的能量閾值設(shè)置為所述第二能量閾值。

進(jìn)一步地,所述“若依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)為預(yù)設(shè)幀數(shù)n的自然數(shù)倍,則根據(jù)第一音頻幀組中各音頻幀的能量差值,計(jì)算得到第二能量閾值”具體為:

若依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)為預(yù)設(shè)幀數(shù)n的自然數(shù)倍,則根據(jù)第一音頻幀組中各音頻幀的能量差值,計(jì)算得到所述能量差值的平均值和中值;

根據(jù)所述平均值以及中值,計(jì)算得到第二能量閾值。

進(jìn)一步地,所述“根據(jù)所述平均值和中值,計(jì)算得到第二能量閾值”具體為:

根據(jù)公式δ=α×mean+β×median+γ計(jì)算得到第二能量閾值,其中,mean為所述平均值,median為所述中值,α為對(duì)應(yīng)所述平均值的權(quán)重,β為對(duì)應(yīng)所述中值的權(quán)重,γ為預(yù)設(shè)的常數(shù)。

由上述描述可知,根據(jù)一定幀數(shù)的音頻幀的能量差值的情況,實(shí)時(shí)更新音頻幀對(duì)應(yīng)能量閾值,魯棒性強(qiáng),對(duì)不同類型歌曲的節(jié)奏檢測(cè)具有較強(qiáng)的適應(yīng)性。

進(jìn)一步地,所述“若所述三個(gè)以上的音頻幀的能量差值中存在峰值,且所述峰值大于當(dāng)前音頻幀對(duì)應(yīng)的能量閾值,則將所述峰值對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn)”具體為:當(dāng)獲取的音頻幀的能量差值的數(shù)量為三時(shí),若所述三個(gè)音頻幀的能量差值滿足dn-2<dn-1且dn-1>dn,同時(shí)dn-1>δn,則將dn-1對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn);其中,δn為當(dāng)前音頻幀對(duì)應(yīng)的能量閾值,dn為當(dāng)前音頻幀的能量差值,dn-1為當(dāng)前音頻幀相鄰前一音頻幀的能量差值,dn-2為當(dāng)前音頻幀相鄰前兩音頻幀的能量差值。

進(jìn)一步地,所述“在所述音頻數(shù)據(jù)中依序獲取一音頻幀作為當(dāng)前音頻幀,將當(dāng)前音頻幀與上一音頻幀的頻譜能量和的差值,作為當(dāng)前音頻幀的能量差值并保存所述能量差值”具體為:

根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的第一個(gè)音頻幀;

對(duì)第一個(gè)音頻幀進(jìn)行傅里葉變換,得到第一個(gè)音頻幀的頻譜;

計(jì)算得到所述第一個(gè)音頻幀的頻譜在預(yù)設(shè)頻段的頻譜能量和;

根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的下一個(gè)音頻幀,作為當(dāng)前音頻幀;

對(duì)當(dāng)前音頻幀進(jìn)行傅里葉變換,得到當(dāng)前音頻幀的頻譜;

計(jì)算得到所述當(dāng)前音頻幀的頻譜在預(yù)設(shè)頻段的頻譜能量和;

將當(dāng)前音頻幀的頻譜能量和減去上一個(gè)音頻幀的頻譜能量和,得到當(dāng)前音頻幀的能量差值,并保存所述能量差值。

進(jìn)一步地,所述“將所述峰值對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn)”之后,進(jìn)一步包括:

繼續(xù)執(zhí)行所述根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的下一個(gè)音頻幀,作為當(dāng)前音頻幀的步驟。

進(jìn)一步地,所述“將所述峰值對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn)”之后,進(jìn)一步包括:

根據(jù)所述節(jié)奏點(diǎn)控制外接設(shè)備聯(lián)動(dòng),或根據(jù)節(jié)奏點(diǎn)及其對(duì)應(yīng)的音頻幀的頻譜能量和展示所述音頻數(shù)據(jù)。

由上述描述可知,檢測(cè)出節(jié)奏點(diǎn)之后運(yùn)用于外接設(shè)備的控制,如舞臺(tái)燈光的控制,可實(shí)現(xiàn)音樂與燈光智能互動(dòng)的效果;通過展示節(jié)奏點(diǎn)對(duì)應(yīng)的音頻特征,使用戶可直觀看出所述音頻數(shù)據(jù)對(duì)應(yīng)的節(jié)奏變化。

請(qǐng)參照?qǐng)D5,本發(fā)明還提出一種音樂節(jié)奏檢測(cè)系統(tǒng),包括:

第一獲取模塊,用于獲取音樂的音頻數(shù)據(jù);

第二獲取模塊,用于在所述音頻數(shù)據(jù)中依序獲取一音頻幀作為當(dāng)前音頻幀,將當(dāng)前音頻幀與上一音頻幀的頻譜能量和的差值,作為當(dāng)前音頻幀的能量差值并保存所述能量差值;

確定模塊,用于確定當(dāng)前音頻幀對(duì)應(yīng)的能量閾值;

第三獲取模塊,用于獲取獲取當(dāng)前音頻幀及其之前的與其相鄰的兩個(gè)以上連續(xù)的音頻幀的能量差值,得到三個(gè)以上的音頻幀的能量差值;

標(biāo)記模塊,用于若所述三個(gè)以上的音頻幀的能量差值中存在峰值,且所述峰值大于當(dāng)前音頻幀對(duì)應(yīng)的能量閾值,則將所述峰值對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn)。

進(jìn)一步地,所述確定模塊包括:

第一設(shè)置單元,用于若依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)小于或等于預(yù)設(shè)幀數(shù)n,則將當(dāng)前音頻幀對(duì)應(yīng)的能量閾值設(shè)置為預(yù)設(shè)的第一能量閾值;

第一計(jì)算單元,用于若依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)為預(yù)設(shè)幀數(shù)n的自然數(shù)倍,則根據(jù)第一音頻幀組中各音頻幀的能量差值,計(jì)算得到第二能量閾值,所述第一音頻幀組包括當(dāng)前音頻幀及其之前的與其相鄰的連續(xù)n-1個(gè)音頻幀;

第二設(shè)置單元,用于將當(dāng)前音頻幀之后的與其相鄰的連續(xù)n個(gè)音頻幀對(duì)應(yīng)的能量閾值設(shè)置為所述第二能量閾值。

進(jìn)一步地,所述第一計(jì)算單元包括:

第二計(jì)算單元,用于若依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)為預(yù)設(shè)幀數(shù)n的自然數(shù)倍,則根據(jù)第一音頻幀組中各音頻幀的能量差值,計(jì)算得到所述能量差值的平均值和中值;

第三計(jì)算單元,用于根據(jù)所述平均值以及中值,計(jì)算得到第二能量閾值。

進(jìn)一步地,所述第三計(jì)算單元具體用于根據(jù)公式δ=α×mean+β×median+γ計(jì)算得到第二能量閾值,其中,mean為所述平均值,median為所述中值,α為對(duì)應(yīng)所述平均值的權(quán)重,β為對(duì)應(yīng)所述中值的權(quán)重,γ為預(yù)設(shè)的常數(shù)。

進(jìn)一步地,所述標(biāo)記模塊具體用于當(dāng)獲取的音頻幀的能量差值的數(shù)量為三時(shí),若所述三個(gè)音頻幀的能量差值滿足dn-2<dn-1且dn-1>dn,同時(shí)dn-1>δn,則將dn-1對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn);其中,δn為當(dāng)前音頻幀對(duì)應(yīng)的能量閾值,dn為當(dāng)前音頻幀的能量差值,dn-1為當(dāng)前音頻幀相鄰前一音頻幀的能量差值,dn-2為當(dāng)前音頻幀相鄰前兩音頻幀的能量差值。

進(jìn)一步地,所述第二獲取模塊包括:

第一獲取單元,用于根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的第一個(gè)音頻幀;

第一得到單元,用于對(duì)第一個(gè)音頻幀進(jìn)行傅里葉變換,得到第一個(gè)音頻幀的頻譜;

第四計(jì)算單元,用于計(jì)算得到所述第一個(gè)音頻幀的頻譜在預(yù)設(shè)頻段的頻譜能量和;

第二獲取單元,用于根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的下一個(gè)音頻幀,作為當(dāng)前音頻幀;

第二得到單元,用于對(duì)當(dāng)前音頻幀進(jìn)行傅里葉變換,得到當(dāng)前音頻幀的頻譜;

第五計(jì)算單元,用于計(jì)算得到所述當(dāng)前音頻幀的頻譜在預(yù)設(shè)頻段的頻譜能量和;

第三得到單元,用于將當(dāng)前音頻幀的頻譜能量和減去上一個(gè)音頻幀的頻譜能量和,得到當(dāng)前音頻幀的能量差值,并保存所述能量差值。

進(jìn)一步地,還包括:

繼續(xù)執(zhí)行模塊,用于繼續(xù)執(zhí)行所述根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的下一個(gè)音頻幀,作為當(dāng)前音頻幀的步驟。

進(jìn)一步地,還包括:

控制模塊,用于根據(jù)所述節(jié)奏點(diǎn)控制外接設(shè)備聯(lián)動(dòng),或根據(jù)節(jié)奏點(diǎn)及其對(duì)應(yīng)的音頻幀的頻譜能量和展示所述音頻數(shù)據(jù)。

實(shí)施例一

請(qǐng)參照?qǐng)D2,本發(fā)明的實(shí)施例一為:一種音樂節(jié)奏檢測(cè)方法,包括如下步驟:

s1:獲取音樂的音頻數(shù)據(jù);進(jìn)一步地,獲取音頻數(shù)據(jù)之后對(duì)音頻數(shù)據(jù)進(jìn)行歸一化處理。所述音樂包括歌曲和伴奏。

s2:在所述音頻數(shù)據(jù)中依序獲取一音頻幀作為當(dāng)前音頻幀,將當(dāng)前音頻幀與上一音頻幀的頻譜能量和的差值,作為當(dāng)前音頻幀的能量差值dn并保存所述能量差值dn;

s3:確定當(dāng)前音頻幀對(duì)應(yīng)的能量閾值δn;在本實(shí)施例中,所述能量閾值可以為一預(yù)設(shè)的經(jīng)驗(yàn)值,同時(shí),本實(shí)施例中每個(gè)音頻幀對(duì)應(yīng)的能量閾值相同,均為所述預(yù)設(shè)的經(jīng)驗(yàn)值。

s4:獲取當(dāng)前音頻幀及其之前的與其相鄰的兩個(gè)以上連續(xù)的音頻幀,得到三個(gè)以上的音頻幀的能量差值;

s5:判斷所述三個(gè)以上的音頻幀的能量差值中是否存在峰值,且所述峰值大于當(dāng)前音頻幀對(duì)應(yīng)的能量閾值,若是,則執(zhí)行步驟s6。例如,當(dāng)獲取三個(gè)音頻幀的能量差值時(shí),即判斷是否滿足下述條件:dn-2<dn-1且dn-1>dn,同時(shí),dn-1>δn,其中,dn-1為當(dāng)前音頻幀相鄰前一音頻幀的能量差值,dn-2為當(dāng)前音頻幀相鄰前兩音頻幀的能量差值。

s6:將所述峰值對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn)。返回執(zhí)行步驟s2,直至音頻數(shù)據(jù)處理完畢。

其中,如圖3所示,步驟s2包括如下步驟:

s201:根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的第一個(gè)音頻幀;進(jìn)一步地,根據(jù)不同的采樣率設(shè)定相應(yīng)的幀長(zhǎng),例如,采樣率為44.1khz,幀長(zhǎng)為1024。

s202:對(duì)第一個(gè)音頻幀進(jìn)行傅里葉變換,得到第一個(gè)音頻幀的頻譜;

s203:計(jì)算得到所述第一個(gè)音頻幀的頻譜在預(yù)設(shè)頻段的頻譜能量和;頻段范圍可根據(jù)需求選取,比如低頻部分、中頻部分、高頻部分,也可以全頻段,本實(shí)施例在全頻段范圍內(nèi)求取頻譜能量的和,用sn表示,下標(biāo)n表示幀號(hào),從1開始計(jì)數(shù),即音頻幀對(duì)應(yīng)的序號(hào)。

s204:根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的下一個(gè)音頻幀,作為當(dāng)前音頻幀;

s205:對(duì)當(dāng)前音頻幀進(jìn)行傅里葉變換,得到當(dāng)前音頻幀的頻譜;

s206:計(jì)算得到所述當(dāng)前音頻幀的頻譜在預(yù)設(shè)頻段的頻譜能量和;

s207:將當(dāng)前音頻幀的頻譜能量和減去上一個(gè)音頻幀的頻譜能量和,得到當(dāng)前音頻幀的能量差值,并保存所述能量差值。具體地,根據(jù)公式dn=sn-sn-1計(jì)算當(dāng)前音頻幀相對(duì)上一音頻幀的能量差值。其中,對(duì)于第一個(gè)音頻幀的能量差值可忽略,也可直接將第一個(gè)音頻幀的頻譜能量值作為其能量差值。

進(jìn)一步地,步驟s6之后返回執(zhí)行步驟s204。

優(yōu)選地,步驟s6之后,還包括:根據(jù)所述節(jié)奏點(diǎn)控制外接設(shè)備聯(lián)動(dòng),或根據(jù)節(jié)奏點(diǎn)及其對(duì)應(yīng)的音頻幀的頻譜能量和展示所述音頻數(shù)據(jù)。

所述節(jié)奏點(diǎn)控制外接設(shè)備聯(lián)動(dòng)包括根據(jù)節(jié)奏點(diǎn)對(duì)燈光進(jìn)行控制。具體可以是:a、對(duì)應(yīng)一個(gè)節(jié)奏點(diǎn)閃爍一種顏色的燈;b、閃爍一種類型的燈(例如射燈);c、對(duì)應(yīng)一個(gè)節(jié)奏點(diǎn)依次閃爍兩種或多種顏色的燈;d、對(duì)應(yīng)一個(gè)節(jié)奏點(diǎn)多種類型的燈配合閃爍;e、對(duì)應(yīng)一個(gè)節(jié)奏點(diǎn)在燈光閃爍的同時(shí)配合噴水、噴氣、尖叫或鼓掌效果,使得燈光的顯示配合節(jié)奏點(diǎn)的變化而變化。

所述根據(jù)節(jié)奏點(diǎn)及其對(duì)應(yīng)的音頻幀的頻譜能量和展示所述音頻數(shù)據(jù)可以為:

使用心電圖展示所述音頻數(shù)據(jù),其中,心電圖的電位變化表示所述節(jié)奏點(diǎn)對(duì)應(yīng)音頻幀的頻譜能量和的變化,電位變化的速度表示所述節(jié)奏點(diǎn)出現(xiàn)的速度;

或者使用左右移動(dòng)的音柱圖展示所述音頻數(shù)據(jù),其中,音柱的長(zhǎng)度表示所述節(jié)奏點(diǎn)對(duì)應(yīng)音頻幀的頻譜能量和,音柱移動(dòng)的速度表示所述節(jié)奏點(diǎn)出現(xiàn)的速度;

或者使用升降變化的音柱圖展示所述音頻數(shù)據(jù),其中,音柱的攀升高度表示所述節(jié)奏點(diǎn)對(duì)應(yīng)音頻幀的頻譜能量和,音柱的升降速度表示所述節(jié)奏點(diǎn)出現(xiàn)的速度。

本實(shí)施例根據(jù)音頻幀之間的能量差值來檢測(cè)出音頻數(shù)據(jù)中的節(jié)奏點(diǎn),可實(shí)時(shí)進(jìn)行,具有更高的準(zhǔn)確性;且無需建立模型,通過分析比較相鄰若干個(gè)音頻幀的能量差值,確定出節(jié)奏點(diǎn),提高了檢測(cè)效率。檢測(cè)出節(jié)奏點(diǎn)之后運(yùn)用于外接設(shè)備的控制,如舞臺(tái)燈光的控制,可實(shí)現(xiàn)音樂與燈光智能互動(dòng)的效果;通過展示節(jié)奏點(diǎn)對(duì)應(yīng)的音頻特征,使用戶可直觀看出所述音頻數(shù)據(jù)對(duì)應(yīng)的節(jié)奏變化。

實(shí)施例二

本實(shí)施例是實(shí)施例一的進(jìn)一步拓展,相同之處不再累述,區(qū)別在于,在步驟s3中,能量閾值不是固定的。

如圖4所示,步驟s3包括如下步驟:

s301:判斷依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)是否小于或等于預(yù)設(shè)幀數(shù)n,若是,則執(zhí)行步驟s302,若否,則執(zhí)行步驟s303。

s302:將當(dāng)前音頻幀對(duì)應(yīng)的能量閾值設(shè)置為預(yù)設(shè)的第一能量閾值;

s303:判斷依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)是否為預(yù)設(shè)幀數(shù)n的自然數(shù)倍,若是,則執(zhí)行步驟s304。即獲取依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào),并判斷所述序號(hào)是否可整除預(yù)設(shè)的第一幀數(shù)。

s304:根據(jù)第一音頻幀組中各音頻幀的能量差值,計(jì)算得到第二能量閾值,所述第一音頻幀組包括當(dāng)前音頻幀及其之前的與其相鄰的連續(xù)n-1個(gè)音頻幀。即獲取當(dāng)前音頻幀及其之前的與其相鄰的連續(xù)n-1個(gè)音頻幀的能量差值;根據(jù)所述能量差值,計(jì)算得到所述能量差值的平均值和中值;根據(jù)所述平均值以及中值,計(jì)算得到第二能量閾值。具體地,根據(jù)公式δ=α×mean+β×median+γ計(jì)算得到第二能量閾值,其中,mean為所述平均值,median為所述中值,α為對(duì)應(yīng)所述平均值的權(quán)重,β為對(duì)應(yīng)所述中值的權(quán)重,γ為預(yù)設(shè)的常數(shù)。

s305:將當(dāng)前音頻幀之后的與其相鄰的連續(xù)n個(gè)音頻幀對(duì)應(yīng)的能量閾值設(shè)置為所述第二能量閾值。

例如,假設(shè)預(yù)設(shè)幀數(shù)n為150幀,則音頻數(shù)據(jù)中的前150幀,即第1幀至第150幀對(duì)應(yīng)的能量閾值均為預(yù)設(shè)的第一能量閾值;同時(shí),當(dāng)遍歷到第150幀時(shí),其序號(hào)也為預(yù)設(shè)幀數(shù)n的自然數(shù)倍,因此,獲取第150幀及其之前的與其相鄰的連續(xù)149幀的能量差值,也即第1幀至第150幀的能量差值,計(jì)算這150幀的能量差值的平均值和中值,然后通過加權(quán)計(jì)算得到第二能量閾值,并將第二能量閾值作為第150幀之后的與其相鄰的連續(xù)150幀的音頻幀,也即第151幀至第300幀對(duì)應(yīng)的能量閾值。同理,當(dāng)遍歷到第300幀時(shí),則根據(jù)第151幀至第300幀的能量差值,計(jì)算出第301幀至第450幀對(duì)應(yīng)的能量閾值,以此類推。

不同歌曲的能量范圍并不相同,同一首歌曲的不同階段能量范圍也可能有偏差,因此只設(shè)定一個(gè)統(tǒng)一閾值適應(yīng)性不強(qiáng),如果閾值偏大,則檢測(cè)出來的節(jié)奏點(diǎn)缺失,如果閾值偏小,則檢測(cè)出來的節(jié)奏點(diǎn)多余。本實(shí)施例提出一種閾值自適應(yīng)的方法,根據(jù)已處理音頻幀的能量差值調(diào)整能量閾值,使得能量閾值與當(dāng)前處理的音頻數(shù)據(jù)更加匹配,避免檢測(cè)出的節(jié)奏點(diǎn)過少或過多,進(jìn)一步提高了檢測(cè)的準(zhǔn)確性,可適用于各種類型音樂的節(jié)奏檢測(cè),具有較強(qiáng)的適應(yīng)性,魯棒性強(qiáng)。

實(shí)施例三

請(qǐng)參照?qǐng)D6,本實(shí)施例是對(duì)應(yīng)上述實(shí)施例的一種音樂節(jié)奏檢測(cè)系統(tǒng),包括:

第一獲取模塊1,用于獲取音樂的音頻數(shù)據(jù);

第二獲取模塊2,用于在所述音頻數(shù)據(jù)中依序獲取一音頻幀作為當(dāng)前音頻幀,將當(dāng)前音頻幀與上一音頻幀的頻譜能量和的差值,作為當(dāng)前音頻幀的能量差值并保存所述能量差值;

確定模塊3,用于確定當(dāng)前音頻幀對(duì)應(yīng)的能量閾值;

第三獲取模塊4,用于獲取獲取當(dāng)前音頻幀及其之前的與其相鄰的兩個(gè)以上連續(xù)的音頻幀的能量差值,得到三個(gè)以上的音頻幀的能量差值;

標(biāo)記模塊5,用于若所述三個(gè)以上的音頻幀的能量差值中存在峰值,且所述峰值大于當(dāng)前音頻幀對(duì)應(yīng)的能量閾值,則將所述峰值對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn)。

進(jìn)一步地,所述確定模塊3包括:

第一設(shè)置單元31,用于若依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)小于或等于預(yù)設(shè)幀數(shù)n,則將當(dāng)前音頻幀對(duì)應(yīng)的能量閾值設(shè)置為預(yù)設(shè)的第一能量閾值;

第一計(jì)算單元32,用于若依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)為預(yù)設(shè)幀數(shù)n的自然數(shù)倍,則根據(jù)第一音頻幀組中各音頻幀的能量差值,計(jì)算得到第二能量閾值,所述第一音頻幀組包括當(dāng)前音頻幀及其之前的與其相鄰的連續(xù)n-1個(gè)音頻幀;

第二設(shè)置單元33,用于將當(dāng)前音頻幀之后的與其相鄰的連續(xù)n個(gè)音頻幀對(duì)應(yīng)的能量閾值設(shè)置為所述第二能量閾值。

進(jìn)一步地,所述第一計(jì)算單元32包括:

第二計(jì)算單元321,用于若依序獲取的當(dāng)前音頻幀對(duì)應(yīng)的序號(hào)為預(yù)設(shè)幀數(shù)n的自然數(shù)倍,則根據(jù)第一音頻幀組中各音頻幀的能量差值,計(jì)算得到所述能量差值的平均值和中值;

第三計(jì)算單元322,用于根據(jù)所述平均值以及中值,計(jì)算得到第二能量閾值。

進(jìn)一步地,所述第三計(jì)算單元322具體用于根據(jù)公式δ=α×mean+β×median+γ計(jì)算得到第二能量閾值,其中,mean為所述平均值,median為所述中值,α為對(duì)應(yīng)所述平均值的權(quán)重,β為對(duì)應(yīng)所述中值的權(quán)重,γ為預(yù)設(shè)的常數(shù)。

進(jìn)一步地,所述標(biāo)記模塊5具體用于當(dāng)獲取的音頻幀的能量差值的數(shù)量為三時(shí),若所述三個(gè)音頻幀的能量差值滿足dn-2<dn-1且dn-1>dn,同時(shí)dn-1>δn,則將dn-1對(duì)應(yīng)的音頻幀標(biāo)記為節(jié)奏點(diǎn);其中,δn為當(dāng)前音頻幀對(duì)應(yīng)的能量閾值,dn為當(dāng)前音頻幀的能量差值,dn-1為當(dāng)前音頻幀相鄰前一幀的能量差值,dn-2為當(dāng)前音頻幀相鄰前兩幀的能量差值。

進(jìn)一步地,所述第二獲取模塊2包括:

第一獲取單元21,用于根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的第一個(gè)音頻幀;

第一得到單元22,用于對(duì)第一個(gè)音頻幀進(jìn)行傅里葉變換,得到第一個(gè)音頻幀的頻譜;

第四計(jì)算單元23,用于計(jì)算得到所述第一個(gè)音頻幀的頻譜在預(yù)設(shè)頻段的頻譜能量和;

第二獲取單元24,用于根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的下一個(gè)音頻幀,作為當(dāng)前音頻幀;

第二得到單元25,用于對(duì)當(dāng)前音頻幀進(jìn)行傅里葉變換,得到當(dāng)前音頻幀的頻譜;

第五計(jì)算單元26,用于計(jì)算得到所述當(dāng)前音頻幀的頻譜在預(yù)設(shè)頻段的頻譜能量和;

第三得到單元27,用于將當(dāng)前音頻幀的頻譜能量和減去上一個(gè)音頻幀的頻譜能量和,得到當(dāng)前音頻幀的能量差值,并保存所述能量差值。

進(jìn)一步地,還包括:

繼續(xù)執(zhí)行模塊6,用于繼續(xù)執(zhí)行所述根據(jù)預(yù)設(shè)的幀長(zhǎng),獲取所述音頻數(shù)據(jù)的下一個(gè)音頻幀,作為當(dāng)前音頻幀的步驟。

進(jìn)一步地,還包括:

控制模塊7,用于根據(jù)所述節(jié)奏點(diǎn)控制外接設(shè)備聯(lián)動(dòng),或根據(jù)節(jié)奏點(diǎn)及其對(duì)應(yīng)的音頻幀的頻譜能量和展示所述音頻數(shù)據(jù)。

綜上所述,本發(fā)明提供的一種音樂節(jié)奏檢測(cè)方法及其系統(tǒng),根據(jù)音頻幀之間的能量差值來檢測(cè)出音頻數(shù)據(jù)中的節(jié)奏點(diǎn),可實(shí)時(shí)進(jìn)行,具有更高的準(zhǔn)確性;根據(jù)已處理音頻幀的能量差值自適應(yīng)調(diào)整能量閾值,使得能量閾值與當(dāng)前處理的音頻數(shù)據(jù)更加匹配,避免檢測(cè)出的節(jié)奏點(diǎn)過少或過多,進(jìn)一步提高了檢測(cè)的準(zhǔn)確性,可適用于各種類型音樂的節(jié)奏檢測(cè),具有較強(qiáng)的適應(yīng)性,魯棒性強(qiáng);檢測(cè)出節(jié)奏點(diǎn)之后運(yùn)用于外接設(shè)備的控制,如舞臺(tái)燈光的控制,可實(shí)現(xiàn)音樂與燈光智能互動(dòng)的效果;通過展示節(jié)奏點(diǎn)對(duì)應(yīng)的音頻特征,使用戶可直觀看出所述音頻數(shù)據(jù)對(duì)應(yīng)的節(jié)奏變化。

以上所述僅為本發(fā)明的實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等同變換,或直接或間接運(yùn)用在相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1