亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種演唱者音色相似的歌星推薦方法與裝置制造方法

文檔序號:2827772閱讀:523來源:國知局
一種演唱者音色相似的歌星推薦方法與裝置制造方法
【專利摘要】一種演唱者音色相似的歌星推薦方法,包括:獲得純?nèi)寺曇纛l,再對純?nèi)寺曇纛l進行預(yù)處理,然后分別提取每個純?nèi)寺曇纛l的聲音特征系數(shù)集,用聲音模型算法訓(xùn)練出對應(yīng)歌星模型;對于給定的用戶的聲音樣本,進行預(yù)處理,并提取特征系數(shù)集;然后將用戶聲音樣本的特征系數(shù)集與所有歌星模型進行匹配,找出音色最相似的歌星。本發(fā)明還提供相應(yīng)的裝置。本發(fā)明可應(yīng)用于KTV場景中,為用戶推薦與其音色相似的歌星,可以增加演唱的樂趣,并提高用戶模仿歌星音色的水平。
【專利說明】一種演唱者音色相似的歌星推薦方法與裝置
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及智能語音【技術(shù)領(lǐng)域】,具體涉及一種演唱者音色相似的歌星推薦方法與
>J-U ρ?α裝直。
【【背景技術(shù)】】
[0002]隨著智能終端的普及,人們對生活智能化服務(wù)的要求越來越高,語音智能能化服務(wù)成為人們迫切需要。
[0003]現(xiàn)有唱歌評測技術(shù)中有對演唱者“唱得準不準”的評定方法,比如音準評分技術(shù),但較少對“唱得像不像”或者“唱得像誰”作出評定。K歌系統(tǒng)的智能化迫切需要一種技術(shù),能根據(jù)用戶的聲音匹配出與其音色最接近的歌手,進而向用戶推薦相應(yīng)歌手的歌曲,從而增加用戶演唱的樂趣,并提高用戶模仿歌星音色的水平。

【發(fā)明內(nèi)容】

[0004]本發(fā)明所要解決的技術(shù)問題之一在于提供一種演唱者音色相似的歌星推薦方法,實現(xiàn)為演唱者找出與其音色相似的歌星的功能。
[0005]本發(fā)明是采用以下技術(shù)方案解決上述技術(shù)問題之一的:
[0006]一種演唱者音色相似的歌星推薦方法,包括如下步驟:
[0007]音頻庫處理:獲得所有歌星的純?nèi)寺曇纛l,再對純?nèi)寺曇纛l進行預(yù)處理,然后分別提取每個純?nèi)寺曇纛l的聲音特征系數(shù)集;
[0008]歌星模型訓(xùn)練:根據(jù)每個歌星所對應(yīng)的特征系數(shù)集,用聲音模型算法訓(xùn)練出對應(yīng)歌星模型;
[0009]音色匹配:對于給定的用戶的聲音樣本,進行預(yù)處理,并提取特征系數(shù)集;然后將用戶聲音樣本的特征系數(shù)集與所有歌星模型進行匹配,找出音色最相似的歌星。
[0010]進一步,所述歌星的純?nèi)寺曇纛l獲得方式包括:通過歌曲去伴奏方式獲得。
[0011]進一步,所述歌星模型訓(xùn)練步驟包括:首先將音頻庫中提取的所有聲音特征系數(shù)集集中在一起訓(xùn)練出通用背景模型UBM;接著根據(jù)每個歌星所對應(yīng)的特征系數(shù)集,利用通用背景模型UBM自適應(yīng)訓(xùn)練出音頻庫中所有歌星的模型。
[0012]進一步,所述音色匹配步驟中,“將用戶聲音樣本的特征系數(shù)與所有歌星模型進行匹配,找出音色最相似的歌星”的操作包括:計算用戶聲音樣本的特征系數(shù)集與歌星模型以及與通用模型UBM的對數(shù)似然比,將對數(shù)似然比最大值所對應(yīng)的歌星作為推薦歌星。
[0013]進一步,所述聲音特征系數(shù),為MFCC、LPCC、LSP、PLP中的一種。
[0014]進一步,所述音頻庫處理步驟和音色匹配步驟中的預(yù)處理步驟均依次包括:分幀、加窗、去靜音;
[0015]所述去靜音,包括如下步驟:
[0016]計算每幀的短時能量,公式為:
N-1
[0017]En = ^ [ W'(m )χ(η + m)]2

m — O
[0018]上式中,w表不窗函數(shù),χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度;
[0019]當該幀的短時能量低于某一閾值時,就認為它是靜音幀,直接去除。
[0020]進一步,所述自適應(yīng)訓(xùn)練出音頻庫中所有歌星的模型,采用貝葉斯自適應(yīng)算法,具體包括:
[0021 ] 對于UBM的第i個混合成員,計算分量i的后驗概率:
[0022]廣 W" — —^~

Lj-1wJ PAx^
[0023]其中χ表示特征系數(shù),w表示權(quán)重系數(shù);
[0024]然后計算權(quán)重、均值和方差:
TI TI Γ
[0025]ni=Y^p{i\xt), Ej(X) = -J^P(IlXl)XteM1)
,μ? ?=ιη ?=ι
[0026]接著修正舊UBM中各個高斯分布的參數(shù)Wi, μ i,W,
[0027]修正后的新權(quán)重:u'.,.=[<?,./廠+.(1-<)H:.];,;
[0028]修正后的新均值:μ.= ?;η£.(λ-) + (1 - α';')μ,;
[0029]修正后的新方差:^= α w ^ ) + (丨—< )(< +μ:)_^:
[0030]其中,Y為規(guī)則因子,用來保證&的和為I, a.',a';',a.'分別為對第i個高斯的權(quán)重、均值,方差的修正因子,

η.
[0031]<式中,rP為常數(shù),用來約束修正因子的變化尺度。

/2.十 /

?
[0032]進一步,所述計算用戶聲音樣本的特征系數(shù)集與歌星模型以及與通用模型UBM的對數(shù)似然比,公式為:
[0033]S(X) = ^Xlog ρ{χ, I Λ--.) — 1Og p{x, I ),

i
[0034]其中χ表示特征系數(shù),T表示幀數(shù),λ star, λ ubm表示歌星模型與UBM模型,P表示歌星模型或UBM模型輸出特征矢量序列的似然度。
[0035]本發(fā)明還提供一種演唱者音色相似的歌星推薦裝置,其包括:音頻庫處理模塊、歌星模型訓(xùn)練模塊和音色匹配模塊,
[0036]音頻庫處理模塊:用于獲得所有歌星的純?nèi)寺曇纛l,再對純?nèi)寺曇纛l進行預(yù)處理,然后分別提取每個純?nèi)寺曇纛l的聲音特征系數(shù)集;
[0037]歌星模型訓(xùn)練模塊:用于根據(jù)每個歌星所對應(yīng)的特征系數(shù)集,采用聲音模型算法訓(xùn)練出對應(yīng)歌星模型;
[0038]音色匹配模塊:用于對給定的用戶的聲音樣本,進行預(yù)處理,并提取特征系數(shù)集;然后將用戶聲音樣本的特征系數(shù)集與所有歌星模型進行匹配,找出音色最相似的歌星。
[0039]進一步,所述歌星的純?nèi)寺曇纛l獲得方式包括:通過歌曲去伴奏方式獲得。
[0040]進一步,所述歌星模型訓(xùn)練模塊包括:將音頻庫中提取的所有聲音特征系數(shù)集集中在一起訓(xùn)練出通用背景模型UBM ;
[0041]接著根據(jù)每個歌星所對應(yīng)的特征系數(shù)集,利用通用背景模型UBM自適應(yīng)訓(xùn)練出音頻庫中所有歌星的模型。
[0042]進一步,所述音色匹配模塊中,“將用戶聲音樣本的特征系數(shù)與所有歌星模型進行匹配,找出音色最相似的歌星”的操作包括:計算用戶聲音樣本的特征系數(shù)集與歌星模型以及與通用模型UBM的對數(shù)似然比,將對數(shù)似然比最大值所對應(yīng)的歌星作為推薦歌星。
[0043]進一步,所述聲音特征系數(shù),為MFCC、LPCC、LSP、PLP中的一種。
[0044]進一步,所述音頻庫處理模塊和音色匹配模塊中的預(yù)處理步驟均依次包括:分幀、加窗、去靜音;
[0045]所述去靜音,包括如下步驟:
[0046]計算每幀的短時能量,公式為:
N-1
[0047]五?= Σ [w(m )x(n + m)}2

m = 0
[0048]上式中,w表不窗函數(shù),χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度;
[0049]當該幀的短時能量低于某一閾值時,就認為它是靜音幀,直接去除。
[0050]進一步,所述自適應(yīng)訓(xùn)練出音頻庫中所有歌星的模型,采用貝葉斯自適應(yīng)算法,具體包括:
[0051 ] 對于UBM的第i個混合成員,計算分量i的后驗概率:

wIPiix,)
[0052]Ρ、1 \χ?)- -Γ~
[0053]其中χ表示特征系數(shù),w表示權(quán)重系數(shù);
[0054]然后計算權(quán)重、均值和方差:
[0055]Hi = [ /;(/' I X,) , E1 ⑴=士Σ 1-V K Ει (χ2)=丄 Σ P^i I Λ )
卜In /-1n t=x
[0056]接著修正舊UBM中各個高斯分布的參數(shù)Wi, μ i,σ,;,
[0057]修正后的新權(quán)重:& =[α廣/v/7>(卜<>、.];/ ;
[0058]修正后的新均值:Iii= cr;B£f(x) + (l-0//.;
[0059]修正后的新方差:(”=Q,; £■ ( γ-) + (I — α'.)(^- + jut) — μ);
[0060]其中,Υ為規(guī)則因子,用來保證&的和為1,分別為對第i個高斯的權(quán)重、均值,方差的修正因子,
[0061]af,式中,rP為常數(shù),用來約束修正因子的變化尺度。
[0062]進一步,所述計算用戶聲音樣本的特征系數(shù)集與歌星模型以及與通用模型UBM的對數(shù)似然比,公式為:
[0063]Si= ^Xlog Pixi I Λ,?,.) - *Og [Αχ, I Kn,,),

I /-1
[0064]其中χ表示特征系數(shù),T表示幀數(shù),λ star, λ ubm表示歌星模型與UBM模型,P表示歌星模型或UBM模型輸出特征矢量序列的似然度。
[0065]本發(fā)明的優(yōu)點在于:本發(fā)明提出一種演唱者音色相似的歌星推薦方法及裝置,為演唱者找出與其音色相似的歌星作為參考,增加演唱的樂趣。應(yīng)用于KTV場景中,能夠吸引大量用戶,刺激消費,并提高用戶模仿歌星音色的水平。
【【專利附圖】

【附圖說明】】
[0066]下面參照附圖結(jié)合實施例對本發(fā)明作進一步的描述。
[0067]圖1是本發(fā)明的方法音頻庫處理與歌星模型訓(xùn)練過程的流程圖。
[0068]圖2是本發(fā)明的方法中單個歌星模型訓(xùn)練流程圖。
[0069]圖3是本發(fā)明的方法音色匹配過程流程圖。
[0070]圖4是本發(fā)明的方法中音色匹配過程中計算似然比流程圖。
[0071]圖5是本發(fā)明的裝置結(jié)構(gòu)示意圖。
【【具體實施方式】】
[0072]第一實施例:
[0073]一種演唱者音色相似的歌星推薦方法,包括如下步驟:
[0074]音頻庫處理:獲得所有歌星的純?nèi)寺曇纛l,再對純?nèi)寺曇纛l進行預(yù)處理,然后分別提取每個純?nèi)寺曇纛l的聲音特征系數(shù)集;
[0075]歌星模型訓(xùn)練:根據(jù)每個歌星所對應(yīng)的特征系數(shù)集,用聲音模型算法訓(xùn)練出對應(yīng)歌星模型;
[0076]音色匹配:對于給定的用戶的聲音樣本,進行預(yù)處理,并提取特征系數(shù)集;然后將用戶聲音樣本的特征系數(shù)集與所有歌星模型進行匹配,找出音色最相似的歌星。
[0077]下面對該實施例進行詳細描述。
[0078]—種演唱者音色相似的歌星推薦方法,包括如下步驟:
[0079]S1:音頻庫處理過程(如圖1所示):
[0080]Sll:準備音頻庫,收集一定數(shù)量的歌星的若干歌曲,比如300個歌星,每個歌星5首歌曲所對應(yīng)的立體聲音頻;
[0081]S12:對音頻庫中的所有歌曲去除伴奏得到純?nèi)寺曨l,其方法可參考專利名稱為《一種立體聲音頻的處理方法與裝置》,專利申請?zhí)枮?201410263446.3的中國發(fā)明專利。該方法主要利用立體聲左右聲道之間伴奏與人聲的差異性,對伴奏進行抑制濾波,從而提取人聲。對歌曲去伴奏的目的是減少歌曲中的伴奏成分對于歌星音色模型訓(xùn)練的影響。
[0082]對音頻庫中的所有歌曲去除伴奏得到純?nèi)寺曇纛l,具體包括:
[0083]將立體聲音頻的左右聲道信號變換到頻域;
[0084]計算左聲道頻域信號與右聲道頻域信號相應(yīng)頻點對的幅度比值,對幅度比值在預(yù)設(shè)范圍內(nèi)的頻點列為待衰減的頻點,且計算左聲道頻域信號與右聲道頻域信號相應(yīng)頻點對的相位差,將相位差差值在預(yù)設(shè)范圍內(nèi)的頻點也列為待衰減的頻點;所述幅度比值的計算公式為:
[0085]kn(i) = abs (fft_frameRn(i)) /abs (fft_frameLn(i)) * (2/ π ),
[0086]公式中η = 0,1,2,..., Ν_1,表示巾貞號i = O, I, 2..., FN/2, FN表示傅里葉變換的點數(shù),相位差的計算公式為:
[0087]pn(i) = angel (fft_frameLn(i)) -angel (fft_frameRn(i)),
[0088]n = 0,1,2,…,N_1 ;i = 0,1,2,...,F(xiàn)N/2 ;
[0089]接著,篩選出待衰減的頻點,也就是將幅度比值落在一定范圍的頻點,其中頻點i符合
[0090]kn(i)〈a 或匕⑴〉^,0〈α〈0.5,0.5〈β〈1,a 取 0.4,β 取 0.6,
[0091]或?qū)⑾辔徊钪德湓谝欢ǚ秶念l點,其中i符合
[0092]pn (i) < φ 或O) > Ψ,<Φ < O, O < φ < π,這里 φ 取-0.1,滬取 0.1,列為待衰減的頻點;
[0093]對待衰減的頻點,即伴奏成分進行衰減處理,公式為:
[0094]fft_frameRn(i) = O 或 fft_frameLn(i) = O,公式中,i 為待衰減的頻點;
[0095]將衰減后的頻域信號逆變換為時域,即可得到去除伴奏后的歌曲音頻。
[0096]在其他實施方式中,也可以通過其他方法得到純?nèi)寺曇纛l,并不局限于上述算法。
[0097]在其他實施方式中,如果步驟Sll中已搜集到所有歌星的純?nèi)寺曇纛l,則略過步驟 S12。
[0098]S13:對去除伴奏后的歌曲進行預(yù)處理,包括:分幀、加窗、去靜音;
[0099]分幀,是指將音頻信號分成若干幀,每幀包括預(yù)設(shè)數(shù)量的聲音采樣點,并且相鄰幀之間有預(yù)設(shè)數(shù)量的重合采樣點;
[0100]加窗,采用加漢寧窗濾波處理,還可以是其他的加窗方式。
[0101]去靜音,包括:
[0102]計算每幀的短時能量,公式為:
N-1
[0103]En = ^l u,(m )λ.(n + m)]2

m — Q
[0104]上式中,w表不窗函數(shù),χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度;
[0105]當該幀的短時能量低于某一閾值時,就認為它是靜音幀,直接去除。靜音并不包含有效的聲音特征,因此需要去除。
[0106]S14:對預(yù)處理后的音頻提取聲音特征系數(shù)。所述聲音特征系數(shù)可以是MFCC、LPCC, LSP、PLP中的一種;MFCC是指Mel頻率倒譜系數(shù),LPCC是指線性預(yù)測倒譜系數(shù),LSP是指線譜對系數(shù),PLP是指感知線性預(yù)測系數(shù),這些系數(shù)都能很好地表征聲音的音色特征,可任選一種。本發(fā)明優(yōu)選提取MFCC或LPCC聲音特征系數(shù)。
[0107]S2:歌星模型訓(xùn)練過程,如圖1?圖2所示。
[0108]將提取的聲音特征系數(shù)集中在一起訓(xùn)練出通用背景模型UBM,并根據(jù)每個歌星所對應(yīng)的聲音特征系數(shù)集,利用背景模型UBM自適應(yīng)訓(xùn)練出音頻庫中所有歌星的模型。UBM模型其實是一個高混合度的高斯模型,其訓(xùn)練過程與GMM類似,采用EM迭代算法,這里不詳述。
[0109]自適應(yīng)訓(xùn)練出歌星的模型過程,如圖2所示,采用貝葉斯自適應(yīng)算法,具體如下:
[0110]對于UBM的第i個混合成員,計算分量i的后驗概率:
[0111]Am 財
LmwJpAx^
[0112]其中χ表示特征系數(shù),w表示權(quán)重系數(shù);
[0113]然后計算權(quán)重、均值和方差:
[0114]", = Σ /,(/1 -V,) ,Ej (.V)=丄 Z P(i 1-V, )λ:Ei (.ν?)=丄 Σ /,(/.丨 λ., ).v;
?=ιn t=1η t=x
[0115]接著修正舊UBM中各個高斯分布的參數(shù)Wi,Ui,「
[0116]修正后的新權(quán)重:IT+{\-17;)u.;.Jy ;
[0117]修正后的新均值:Κμ;= α';--(χ) + {\-α'!')μ? ;
[0118]修正后的新方差:h= a:Ei(x2) + (l-a; + //:)-μ:;
[0119]其中,Y為規(guī)則因子,用來保證&的和為I,分別為對第i個高斯的權(quán)重、均值,方差的修正因子,
[0120]< = 二.P= U.,/?,V,式中,rP為常數(shù),用來約束修正因子的變化尺度,一

Ui +
般選16。
[0121]本步驟可訓(xùn)練出一個通用UBM模型以及所有歌星的音色模型。
[0122]S3:音色匹配過程(如圖3?4所示):
[0123]S31:用戶聲音樣本處理:對于給定的用戶,即演唱者的聲音樣本,同樣進行預(yù)處理,并提取聲音特征系數(shù);
[0124]S32:接著計算提取的聲音特征系數(shù)與歌星模型以及與通用模型UBM的對數(shù)似然比(如圖4所示),將對數(shù)似然比最大值所對應(yīng)的歌星作為推薦歌星。
[0125]對數(shù)似然比的計算公式為:

Γ
[0126]S(X) = J] log p(x, I ) - log p(x, I Anlm ),
[0127]其中χ表示特征系數(shù),λ stm,Aubm表示歌星模型與UBM模型,p表示歌星模型或UBM模型輸出特征矢量序列的似然度;
[0128]此處采用時間歸一化的對數(shù)似然比,

I τ
[0129]SiX) = ~Y^ log p(x, I 人?".) - log p(x, I Aihn)。

Z 1-1
[0130]本步驟可找出與用戶音色接近的歌星作為推薦,從而增加用戶演唱的樂趣。
[0131]在其他實施方式中,也可以使用GMM、HMM等聲音模型作為歌星模型訓(xùn)練以及音色匹配的方法。
[0132]第二實施例:
[0133]一種演唱者音色相似的歌星推薦裝置,其包括:音頻庫處理模塊、歌星模型訓(xùn)練模塊和音色匹配模塊,
[0134]音頻庫處理模塊:用于獲得所有歌星的純?nèi)寺曇纛l,再對純?nèi)寺曇纛l進行預(yù)處理,然后分別提取每個純?nèi)寺曇纛l的聲音特征系數(shù)集;
[0135]歌星模型訓(xùn)練模塊:用于根據(jù)每個歌星所對應(yīng)的特征系數(shù)集,采用聲音模型算法訓(xùn)練出對應(yīng)歌星模型;
[0136]音色匹配模塊:用于對給定的用戶的聲音樣本,進行預(yù)處理,并提取特征系數(shù)集;然后將用戶聲音樣本的特征系數(shù)集與所有歌星模型進行匹配,找出音色最相似的歌星。
[0137]下面具體描述該實施例。
[0138]一種演唱者音色相似的歌星推薦裝置,如圖5所示,包括:
[0139]音頻庫處理模塊,用于對音頻庫中的所有歌曲去除伴奏得到純?nèi)寺曇纛l,再對純?nèi)寺曇纛l進行預(yù)處理,然后對預(yù)處理后的音頻提取聲音特征系數(shù);
[0140]歌星模型訓(xùn)練模塊,用于將提取的聲音特征系數(shù)集中在一起訓(xùn)練出通用背景模型UBM,并根據(jù)每個歌星所對應(yīng)的聲音特征系數(shù)集,利用背景模型UBM自適應(yīng)訓(xùn)練出音頻庫中所有歌星的模型;
[0141]音色匹配模塊,用于對給定用戶的聲音樣本進行預(yù)處理并提取聲音特征系數(shù);然后計算提取的聲音特征系數(shù)與歌星模型以及與通用模型UBM的對數(shù)似然比,將對數(shù)似然比最大值所對應(yīng)的歌星作為推薦歌星。
[0142]對音頻庫中的所有歌曲去除伴奏得到純?nèi)寺曇纛l的方法,參考專利名稱為《一種立體聲音頻的處理方法與裝置》,專利申請?zhí)枮?201410263446.3的中國發(fā)明專利。該方法主要利用立體聲左右聲道之間伴奏與人聲的差異性,對伴奏進行抑制濾波,從而提取人聲。
[0143]具體包括:
[0144]將立體聲音頻的左右聲道信號變換到頻域;
[0145]計算左聲道頻域信號與右聲道頻域信號相應(yīng)頻點對的幅度比值,對幅度比值在預(yù)設(shè)范圍內(nèi)的頻點列為待衰減的頻點,且計算左聲道頻域信號與右聲道頻域信號相應(yīng)頻點對的相位差,將相位差差值在預(yù)設(shè)范圍內(nèi)的頻點也列為待衰減的頻點;所述幅度比值的計算公式為:
[0146]kn(i) = abs (fft_frameRn(i)) /abs (fft_frameLn(i)) * (2/ π ),
[0147]公式中η = 0,1,2,..., Ν_1,表示巾貞號i = O, I, 2..., FN/2, FN表示傅里葉變換的點數(shù),相位差的計算公式為:
[0148]pn(i) = angel (fft_frameLn(i)) -angel (fft_frameRn(i)),
[0149]n = 0,1,2,…,N_1 ;i = 0,1,2,...,F(xiàn)N/2 ;
[0150]接著,篩選出待衰減的頻點,也就是將幅度比值落在一定范圍的頻點,其中頻點i符合
[0151]kn(i)〈a 或匕⑴〉^,0〈α〈0.5,0.5〈β〈1,a 取 0.4,β 取 0.6,
[0152]或?qū)⑾辔徊钪德湓谝欢ǚ秶念l點,其中i符合
[0153]ρηα)〈Φ ^ρΛ?)>φ^^<Φ<0,0<φ<π,這里 φ 取 _0.L 妒取 0.1,列為待衰減的頻點;
[0154]對待衰減的頻點,即伴奏成分進行衰減處理,公式為:
[0155]fft_frameRn(i) = O 或 fft_frameLn(i) = O,公式中,i 為待衰減的頻點;
[0156]將衰減后的頻域信號逆變換為時域,即可得到去除伴奏后的歌曲音頻。
[0157]所述聲音特征系數(shù),為MFCC、LPCC、LSP、PLP中的一種。
[0158]所述音頻庫處理模塊和音色匹配模塊中的預(yù)處理,包括:分幀、加窗、去靜音;
[0159]所述分幀,是指將音頻信號分成若干幀,每幀包括預(yù)設(shè)數(shù)量的聲音采樣點,并且相鄰幀之間有預(yù)設(shè)數(shù)量的重合采樣點;
[0160]所述加窗,是指加漢寧窗濾波處理。
[0161]所述預(yù)處理步驟中的去靜音操作,包括:
[0162]計算每幀的短時能量,公式為:

N -1
[0163]五? 二 I [ W (m ) χ (n + m )]2

m = 0
[0164]上式中,w表不窗函數(shù),χ為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度;
[0165]當該幀的短時能量低于某一閾值時,就認為它是靜音幀,直接去除。
[0166]所述歌星模型訓(xùn)練模塊中的自適應(yīng)訓(xùn)練出歌星的模型過程,采用貝葉斯自適應(yīng)算法,具體包括:
[0167]對于UBM的第i個混合成員,計算分量i的后驗概率:
Ρ(? I M _ wiPi(x,)
[0168]AM λ,.)—

LmwJ P λχ>)
[0169]其中X表示特征系數(shù),w表示權(quán)重系數(shù);
[0170]然后計算權(quán)重、均值和方差:
[0171]", = Σ I) ,eI ⑴=丄 Σ I χ丨 K.Ei (χ2)=丄 Σ 1-ν,
t-\n ?-1n.
[0172]接著修正舊UBM中各個高斯分布的參數(shù)Wi, Ui, ^
[0173]修正后的新權(quán)重:w,= |_0./ Γ + (丨-f jy
[0174]修正后的新均值:1、=⑴+ (卜0.;
[0175]修正后的新方差:=a'; Ej(χ2) + (1- a,' )(d'f + μ]) - μ];
[0176]其中,Υ為規(guī)則因子,用來保證&的和為1,,<分別為對第i個高斯的權(quán)重、均值,方差的修正因子,
PHi
[0177]< =^r7W = u’./".V,式中,rp為常數(shù),用來約束修正因子的變化尺度。

11j 十 /
[0178]所述音色匹配模塊中的對數(shù)似然比的計算公式為:
[0179]S(X) = Yj log p(x, I /I,,,,,.) - log p(x, i Anhm),

/-1
[0180]其中χ表示特征系數(shù),λ stm,λ-表示歌星模型與UBM模型,p表示歌星模型或UBM模型輸出特征矢量序列的似然度;
[0181]此處采用時間歸一化的對數(shù)似然比,
[οι82] 5(^) = 7ΣloS P1-' I K,,.) - 1Og I Khm)。

丄 t=\
[0183]本發(fā)明提出一種演唱者音色相似的歌星推薦方法及其裝置,為演唱者找出與其音色相似的歌星作為參考,可以增加演唱的樂趣。應(yīng)用于KTV場景中,能夠吸引大量用戶,刺激消費,并提高用戶模仿歌星音色的水平。
[0184]以上所述僅為本發(fā)明的較佳實施用例而已,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換以及改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種演唱者音色相似的歌星推薦方法,其特征在于:包括如下步驟: 音頻庫處理:獲得所有歌星的純?nèi)寺曇纛l,再對純?nèi)寺曇纛l進行預(yù)處理,然后分別提取每個純?nèi)寺曇纛l的聲音特征系數(shù)集; 歌星模型訓(xùn)練:根據(jù)每個歌星所對應(yīng)的特征系數(shù)集,用聲音模型算法訓(xùn)練出對應(yīng)歌星模型; 音色匹配:對于給定的用戶的聲音樣本,進行預(yù)處理,并提取特征系數(shù)集;然后將用戶聲音樣本的特征系數(shù)集與所有歌星模型進行匹配,找出音色最相似的歌星。
2.如權(quán)利要求1所述的一種演唱者音色相似的歌星推薦方法,其特征在于:所述歌星的純?nèi)寺曇纛l獲得方式包括:通過歌曲去伴奏方式獲得。
3.如權(quán)利要求1所述的一種演唱者音色相似的歌星推薦方法,其特征在于:所述歌星模型訓(xùn)練步驟包括:首先將音頻庫中提取的所有聲音特征系數(shù)集集中在一起訓(xùn)練出通用背景模型UBM ;接著根據(jù)每個歌星所對應(yīng)的特征系數(shù)集,利用通用背景模型UBM自適應(yīng)訓(xùn)練出音頻庫中所有歌星的模型。
4.如權(quán)利要求1所述的一種演唱者音色相似的歌星推薦方法,其特征在于:所述音色匹配步驟中,“將用戶聲音樣本的特征系數(shù)與所有歌星模型進行匹配,找出音色最相似的歌星”的操作包括:計算用戶聲音樣本的特征系數(shù)集與歌星模型以及與通用模型UBM的對數(shù)似然比,將對數(shù)似然比最大值所對應(yīng)的歌星作為推薦歌星。
5.如權(quán)利要求1所述的一種演唱者音色相似的歌星推薦方法,其特征在于:所述聲音特征系數(shù),為MFCC、LPCC、LSP、PLP中的一種。
6.如權(quán)利要求1所述的一種演唱者音色相似的歌星推薦方法,其特征在于:所述音頻庫處理步驟和音色匹配步驟中的預(yù)處理步驟均依次包括:分幀、加窗、去靜音; 所述去靜音,包括如下步驟: 計算每幀的短時能量,公式為:
上式中,W表不窗函數(shù),X為聲音信號,η = 0,1L, 2L,..., N為幀長,L為幀移長度; 當該幀的短時能量低于某一閾值時,就認為它是靜音幀,直接去除。
7.如權(quán)利要求3所述的一種演唱者音色相似的歌星推薦方法,其特征在于:所述自適應(yīng)訓(xùn)練出音頻庫中所有歌星的模型,采用貝葉斯自適應(yīng)算法,具體包括: 對于UBM的第i個混合成員,計算分量i的后驗概率:
其中X表示特征系數(shù),W表示權(quán)重系數(shù); 然后計算權(quán)重、均值和方差:
接著修正舊UBM中各個高斯分布的參數(shù)Wi, Ui, 4, 修正后的新權(quán)重:&Γ +(卜; 修正后的新均值:& = α;"Ε,(χ)+ {\-α;")μ? ; 修正后的新方差:片=a]Ej (χ') + (1 ){0; + μ)) - μ;; 其中,Y為規(guī)則因子,用來保證?的和為1,<,?分別為對第i個高斯的權(quán)重、均值,方差的修正因子, < == w,w,v,式中,rp為常數(shù),用來約束修正因子的變化尺度。
Tl ,十 V
8.如權(quán)利要求4所述的一種演唱者音色相似的歌星推薦方法,其特征在于:所述對數(shù)似然比的計算公式為:
= ^X1g p(x, I Λ--.) - log ρ(χ, I Λ,/--.),
Ij=i 其中χ表示特征系數(shù),T表示幀數(shù),λ star, λ ubm表示歌星模型與UBM模型,P表示歌星模型或UBM模型輸出特征矢量序列的似然度。
9.一種演唱者音色相似的歌星推薦裝置,其特征在于:包括:音頻庫處理模塊、歌星模型訓(xùn)練模塊和音色匹配模塊, 音頻庫處理模塊:用于獲得所有歌星的純?nèi)寺曇纛l,再對純?nèi)寺曇纛l進行預(yù)處理,然后分別提取每個純?nèi)寺曇纛l的聲音特征系數(shù)集; 歌星模型訓(xùn)練模塊:用于根據(jù)每個歌星所對應(yīng)的特征系數(shù)集,采用聲音模型算法訓(xùn)練出對應(yīng)歌星模型; 音色匹配模塊:用于對給定的用戶的聲音樣本,進行預(yù)處理,并提取特征系數(shù)集;然后將用戶聲音樣本的特征系數(shù)集與所有歌星模型進行匹配,找出音色最相似的歌星。
10.如權(quán)利要求9所述的一種演唱者音色相似的歌星推薦裝置,其特征在于:所述歌星的純?nèi)寺曇纛l獲得方式包括:通過歌曲去伴奏方式獲得。
11.如權(quán)利要求9所述的一種演唱者音色相似的歌星推薦裝置,其特征在于:所述歌星模型訓(xùn)練模塊包括:將音頻庫中提取的所有聲音特征系數(shù)集集中在一起訓(xùn)練出通用背景模型麗; 接著根據(jù)每個歌星所對應(yīng)的特征系數(shù)集,利用通用背景模型UBM自適應(yīng)訓(xùn)練出音頻庫中所有歌星的模型。
12.如權(quán)利要求9所述的一種演唱者音色相似的歌星推薦裝置,其特征在于:所述音色匹配模塊中,“將用戶聲音樣本的特征系數(shù)與所有歌星模型進行匹配,找出音色最相似的歌星”的操作包括:計算用戶聲音樣本的特征系數(shù)集與歌星模型以及與通用模型UBM的對數(shù)似然比,將對數(shù)似然比最大值所對應(yīng)的歌星作為推薦歌星。
13.如權(quán)利要求9所述的一種演唱者音色相似的歌星推薦方法,其特征在于:所述音頻庫處理模塊和音色匹配模塊中的預(yù)處理步驟均依次包括:分幀、加窗、去靜音; 所述去靜音,包括如下步驟: 計算每幀的短時能量,公式為: Enνν (m ) χ (η + ηι)]2
m = O 上式中,W表不窗函數(shù),X為聲音信號,η = 0,1L, 2L,..., N為巾貞長,L為巾貞移長度; 當該幀的短時能量低于某一閾值時,就認為它是靜音幀,直接去除。
14.如權(quán)利要求11所述的一種演唱者音色相似的歌星推薦裝置,其特征在于:所述自適應(yīng)訓(xùn)練出音頻庫中所有歌星的模型,采用貝葉斯自適應(yīng)算法,具體包括: 對于UBM的第i個混合成員,計算分量i的后驗概率:
LmwjPAx^ 其中χ表示特征系數(shù),w表示權(quán)重系數(shù); 然后計算權(quán)重、均值和方差:
= YjPOlxt),瓦O)=丄Σ廠GI.ν/KG(-—)=丄ΣP^i Ir,K2
n t=xη ?=χ 接著修正舊UBM中各個高斯分布的參數(shù)Wi, μ i,, 修正后的新權(quán)重: =[a]'η;/T + (\ -a; )η)]ν ;
修正后的新均值://,.= a;'%(x) + (l-a;H)"丨; 修正后的新方差:(r- =α;Ξ:(χ2) + (\-α;)(0~ +//;)-//;; 其中,Y為規(guī)則因子,用來保證&的和為1,<,?分別為對第i個高斯的權(quán)重、均值,方差的修正因子, a?=式中,rP為常數(shù),用來約束修正因子的變化尺度。
15.如權(quán)利要求12所述的一種演唱者音色相似的歌星推薦裝置,其特征在于:所述對數(shù)似然比的計算公式為:
S(x) = ^E1Og /H vi I λΜΓ) - log p(x, I Aiihiil),
I /-! 其中χ表示特征系數(shù),T表示幀數(shù),λ star, λ ubm表示歌星模型與UBM模型,P表示歌星模型或UBM模型輸出特征矢量序列的似然度。
【文檔編號】G10L25/54GK104183245SQ201410448290
【公開日】2014年12月3日 申請日期:2014年9月4日 優(yōu)先權(quán)日:2014年9月4日
【發(fā)明者】王子亮, 劉旺, 鄒應(yīng)雙, 蔡智力 申請人:福建星網(wǎng)視易信息系統(tǒng)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1