1.一種基于魯棒性音階輪廓特征和向量機(jī)的和弦識(shí)別方法,其特征是,包括下列步驟:
1)對(duì)原始音頻信號(hào)進(jìn)行加窗預(yù)處理,得到音樂信號(hào)的分幀結(jié)果;
2)對(duì)分幀結(jié)果進(jìn)行離散余弦變換,得到原始信號(hào)的標(biāo)準(zhǔn)音頻頻譜矩陣S;
3)假設(shè)頻譜中諧波成分矩陣A和非諧波成分矩陣E是相互獨(dú)立的,那么就有:S=A+E;矩陣通過以下凸優(yōu)化問題進(jìn)行全局最優(yōu)解的求解:
其中||·||*表示矩陣的核范數(shù),即矩陣的奇異值之和;||·||1表示矩陣的一范數(shù),即所有非零元素之和;
該優(yōu)化問題通過增廣拉格朗日乘子法進(jìn)行解決;
4)為了得到魯棒性PCP特征,將矩陣A乘映射矩陣P:
P表示頻譜矩陣和由RPCP向量組成的色度矩陣chromagram之間的變換矩陣,其中fi表示音樂中12平均律所定義出來(lái)的12個(gè)音階的基頻,1≤i≤12,2π·ωj則表示時(shí)頻變換后所得到的各個(gè)頻率成分的頻率值,0≤j≤N-1,另外,
通常情況下,規(guī)定音符A4處的頻率440Hz為基準(zhǔn)頻率,并通過fA4·2b獲得其他音符處的頻率值,其中b為音符與A4之間的音程差,然后,通過映射公式(3)來(lái)對(duì)諧波矩陣A的各個(gè)頻率成分進(jìn)行映射,從而獲得魯棒音階輪廓特征向量,其中2πω對(duì)應(yīng)矩陣A每一行所對(duì)應(yīng)的頻率值,而fi則表示音樂中通用的中央八度內(nèi)12個(gè)音符所對(duì)應(yīng)的頻率,通過fA4·2b獲得;
5)采用測(cè)度學(xué)習(xí)的方法對(duì)支持向量機(jī)的高斯核函數(shù)進(jìn)行優(yōu)化:根據(jù)和弦特征的特點(diǎn),從問題本身的先驗(yàn)知識(shí)中有監(jiān)督的學(xué)習(xí)到一個(gè)距離方程,該距離方程的求解是凸優(yōu)化問題,從而使用梯度下降算法求得全局最優(yōu)解,進(jìn)而用求得的轉(zhuǎn)換矩陣最優(yōu)解對(duì)支持向量機(jī)的核函數(shù)進(jìn)行優(yōu)化,得到基于測(cè)度學(xué)習(xí)的高斯核函數(shù);
6)利用訓(xùn)練數(shù)據(jù)對(duì)測(cè)度學(xué)習(xí)支持向量機(jī)進(jìn)行訓(xùn)練,確定測(cè)度學(xué)習(xí)支持向量機(jī)中的參數(shù);
7)使用訓(xùn)練好的測(cè)度學(xué)習(xí)支持向量機(jī)對(duì)測(cè)試數(shù)據(jù)進(jìn)行識(shí)別,得到最終的識(shí)別率。