亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于演唱者聲音特質(zhì)的歌曲推薦方法與流程

文檔序號(hào):11654423閱讀:461來(lái)源:國(guó)知局
一種基于演唱者聲音特質(zhì)的歌曲推薦方法與流程

本發(fā)明涉及歌唱領(lǐng)域的音頻信號(hào)處理方法,特別是涉及一種基于演唱者聲音特質(zhì)的歌曲推薦方法。



背景技術(shù):

音樂(lè)推薦系統(tǒng)重在向用戶推薦其可能喜歡聽(tīng)的歌曲,采用的推薦技術(shù)主要可以分為基于內(nèi)容的推薦和基于協(xié)同過(guò)濾的推薦?;趦?nèi)容的推薦算法主要根據(jù)音樂(lè)自身的音頻特征進(jìn)行推薦,包括mfcc等底層特征或者旋律、節(jié)奏、流派、情感等特征?;趨f(xié)同過(guò)濾的推薦算法主要根據(jù)用戶之間的點(diǎn)播行為或者播放記錄,以用戶之間的相似性為基礎(chǔ)進(jìn)行推薦。

近年來(lái),在移動(dòng)互聯(lián)網(wǎng)應(yīng)用的快速發(fā)展和各檔大型真人音樂(lè)選秀類節(jié)目的雙重刺激下,音樂(lè)推薦系統(tǒng)從為用戶推薦喜歡聽(tīng)的歌曲這一傳統(tǒng)應(yīng)用場(chǎng)景逐漸遷移,進(jìn)而滲透進(jìn)入為用戶推薦喜歡唱的歌曲等新興應(yīng)用場(chǎng)景。

然而,應(yīng)用場(chǎng)景的遷移并沒(méi)有伴隨著音樂(lè)推薦方法的同步遷移。以唱吧app為例,app中的推薦功能推薦的歌曲以當(dāng)前熱門歌曲為主。但是,熱門歌曲并不適合所有用戶演唱。有可能歌曲音調(diào)太高了,由于用戶自身演唱音域范圍及演唱能力的限制導(dǎo)致高音部分唱不上去;也有可能歌曲適合用粗獷的、有爆發(fā)力的聲音去演繹,而用戶卻是個(gè)聲音甜美的女生。

顯然,新的推薦應(yīng)用場(chǎng)景需要新的推薦模式。在k歌的應(yīng)用場(chǎng)景下,用戶不僅僅是聽(tīng)歌曲,更重要的是能最大程度地演繹好歌曲。這是一個(gè)雙向匹配的過(guò)程,一方面,需要考慮用戶自身聲音的特質(zhì),例如用戶實(shí)際的演唱音域及聲音的音色等;另一方面,需要考慮歌曲對(duì)演唱能力的要求,例如歌曲要求的音域范圍及怎樣的音色更適合演繹該歌曲的情感等。

為了更好的介紹基于演唱者聲音特質(zhì)的歌曲推薦的概念,介紹一些相關(guān)音樂(lè)、人聲理論的基本概念。

音色:音色是指聲音在聽(tīng)覺(jué)上產(chǎn)生的某種屬性,聽(tīng)音者能夠據(jù)此判斷兩個(gè)以同樣方式呈現(xiàn)、具有相同音高和響度的聲音的不同。

音域:音域有總的音域和個(gè)別的人聲或樂(lè)器的音域兩種??偟囊粲蛑敢袅械目偡秶磸淖畹鸵舻阶罡咭舻姆秶?。個(gè)別的人聲或樂(lè)器的音域指某個(gè)人聲或某種樂(lè)器在整個(gè)音域中所能到達(dá)的最低音到最高音的范圍。樂(lè)器的音域相對(duì)固定,而人聲的音域由于每個(gè)人先天的聲帶大小,長(zhǎng)短、厚薄不同及后天有無(wú)經(jīng)過(guò)系統(tǒng)的聲樂(lè)訓(xùn)練等原因,有著較大的區(qū)別。

midi(musicalinstrumentdigitalinterface),是一種數(shù)字音樂(lè)、樂(lè)器的通信標(biāo)準(zhǔn)。midi文件可以靈活的記錄歌曲的音高及音長(zhǎng)等信息,便于計(jì)算機(jī)進(jìn)行音高的分析與處理。

cqt譜,一種音色頻率物理特征,通過(guò)中心頻率成指數(shù)分布的濾波器組,將樂(lè)音信號(hào)表示為確定音樂(lè)單音的譜能量,濾波器組的品質(zhì)因子q保持常數(shù)。

個(gè)體演唱能力包括演唱者音域范圍的寬窄及在各個(gè)音級(jí)上的音準(zhǔn)控制能力等。發(fā)聲能力是演唱能力的基礎(chǔ),醫(yī)學(xué)上利用發(fā)聲范圍檔案記錄個(gè)人的發(fā)聲音域及響度動(dòng)態(tài)范圍。專業(yè)歌手則通過(guò)系統(tǒng)的聲樂(lè)訓(xùn)練方法來(lái)提升自身的演唱能力,但普通演唱者一般不會(huì)去使用特定的訓(xùn)練方法。

因此,本申請(qǐng)基于上述分析,利用歌曲簡(jiǎn)譜和歌手清唱帶等信息,建立歌曲特征文件庫(kù),提取歌曲的演唱音域和歌手的音色特征。同時(shí)利用用戶演唱歌曲時(shí)的清唱錄音文件與歌曲的簡(jiǎn)譜信息,在音級(jí)完成質(zhì)量高的前提下,提取用戶的演唱音域和音色特征。綜合考慮用戶的演唱音域與曲庫(kù)中歌曲音域要求之間的匹配度以及用戶音色與曲庫(kù)中歌手音色之間的相似度,計(jì)算曲庫(kù)中每首歌曲對(duì)于該用戶的推薦度,并向用戶推薦推薦度高的歌曲。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明的目的是提供一種基于演唱者聲音特質(zhì)的歌曲推薦方法,對(duì)演唱者與歌手之間音域相似度以及音色相似度、歌曲推薦進(jìn)行分析。

本發(fā)明采用以下方案實(shí)現(xiàn):一種基于演唱者聲音特質(zhì)的歌曲推薦方法,包括如下步驟:

步驟s1:分析曲庫(kù)中歌曲的簡(jiǎn)譜信息,得到各個(gè)歌曲的midi音高基準(zhǔn)序列,分析出歌曲的音級(jí)分布直方圖,得到各個(gè)歌曲的演唱音域要求;

步驟s2:采用melodia算法分析用戶清唱錄音文件,得到演唱者演唱該歌曲的midi音高值序列,取得步驟s1中得到的同一歌曲的midi音高基準(zhǔn)序列,計(jì)算演唱者的基準(zhǔn)演唱能力,提取其演唱音域;

步驟s3:對(duì)歌手的清唱文件提取時(shí)頻信號(hào)表征,輸入到深度卷積神經(jīng)網(wǎng)絡(luò)中對(duì)網(wǎng)絡(luò)進(jìn)行迭代訓(xùn)練,得到訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)及人聲音色嵌入空間;

步驟s4:根據(jù)歌手的清唱文件提取時(shí)頻信號(hào)表征,將其輸入到步驟s3中訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)的輸出對(duì)應(yīng)于人聲音色嵌入空間的3維音色特征向量,將這3維音色特征向量作為原唱歌手的人聲音色表征;

步驟s5:分析演唱者的清唱聲音片段,同樣采用步驟s4的方法,得到人聲音色嵌入空間中的一組3維音色特征向量,作為演唱者人聲音色表征;

步驟s6:根據(jù)歌曲的演唱音域要求和演唱者的演唱音域,計(jì)算出用戶與歌曲之間的音域匹配度;

步驟s7:根據(jù)原唱歌手和演唱者的人聲音色表征,計(jì)算演唱者與各歌手的音色相似度;

步驟s8:根據(jù)音域匹配度和音色相似度,計(jì)算曲庫(kù)中每首歌曲對(duì)于該用戶的推薦度。

進(jìn)一步地,所述步驟s6具體包括以下步驟:

步驟s61:根據(jù)歌曲音級(jí)分布直方圖得到每個(gè)音級(jí)的權(quán)重,每個(gè)音級(jí)的權(quán)重等于該音級(jí)出現(xiàn)的次數(shù)除以該歌曲中所有音級(jí)出現(xiàn)次數(shù)的總和,計(jì)算公式的定義具體為:

其中,num(x)表示音級(jí)x在簡(jiǎn)譜中出現(xiàn)的次數(shù),xmax表示簡(jiǎn)譜中音符的最大midi值,xmin表示簡(jiǎn)譜中音符的最小midi值;

步驟s62:利用歌曲的音級(jí)分布情況與用戶在各個(gè)音級(jí)的演唱能力評(píng)估值,計(jì)算出用戶演唱音域與歌曲音域要求的匹配度,音域匹配度的計(jì)算公式的定義具體為:

其中,u(x)表示用戶在音級(jí)x上的演唱能力評(píng)估值。

進(jìn)一步地,所述步驟s7中,演唱者的聲音片段嵌入到音色嵌入空間中后,分別計(jì)算演唱者與嵌入空間中各歌手的音色相似度,音色相似度的計(jì)算公式的定義具體為:

tim_sim(u,s)=1-tanh(μ||z1-z2||2)

其中,||z1-z2||2表示兩點(diǎn)之間的歐氏距離,μ為經(jīng)驗(yàn)系數(shù),tanh為雙曲正切函數(shù)。

進(jìn)一步地,所述步驟s8中,在進(jìn)行最終的推薦時(shí),綜合考慮用戶的演唱音域與曲庫(kù)中歌曲的音域要求的匹配度以及用戶的音色與曲庫(kù)中歌手的音色相似性,計(jì)算曲庫(kù)中每首歌曲對(duì)于該用戶的推薦度,推薦度的計(jì)算公式的定義具體為:

recom(u,s)=cran_mat(u,s)+(1-c)tim_sim(u,s)

其中,recom(u,s)表示歌曲s對(duì)于用戶u的推薦度,ran_mat(u,s)表示歌曲s對(duì)于用戶u的音域匹配度,tim_sim(u,s)表示用戶u的音色與歌曲s的原唱歌手音色的相似度,c取值為0.7。

與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點(diǎn):該方法利用用戶的演唱歌曲時(shí)的清唱錄音文件與歌曲的簡(jiǎn)譜信息,在音級(jí)完成質(zhì)量高的前提下,提取用戶的演唱音域。同時(shí)利用歌曲簡(jiǎn)譜和歌手清唱帶等信息,建立歌曲特征文件庫(kù),提取歌手的演唱音域和音色特征。與利用音域的寬度計(jì)算用戶與歌曲的匹配度,但在某些情況下不適用相比,利用歌曲midi音高模型分析出歌曲的音級(jí)分布直方圖與用戶在各個(gè)音級(jí)的演唱能力評(píng)估值,計(jì)算出用戶演唱音域與歌曲音域要求的匹配度,適用范圍更廣也更準(zhǔn)確,同時(shí)用戶在演唱過(guò)程中也可以完善其演唱音域。并且借助深度卷積網(wǎng)絡(luò)強(qiáng)大的降維能力及特征學(xué)習(xí)能力,將高維的、時(shí)序的人聲頻譜特征嵌入到3維的音色嵌入空間中,從而在3維音色嵌入空間內(nèi)實(shí)現(xiàn)音色相似性的可度量性。最后綜合考慮用戶的演唱音域與曲庫(kù)中歌曲的音域要求的匹配度以及用戶的音色與曲庫(kù)中歌手的音色相似性,計(jì)算曲庫(kù)中每首歌曲對(duì)于該用戶的推薦度??梢愿鶕?jù)不同的應(yīng)用場(chǎng)景,設(shè)置不同的參數(shù)值值。從而向用戶推薦合適且推薦度高的歌曲。

附圖說(shuō)明

圖1是本發(fā)明的方法流程示意框圖。

圖2是本發(fā)明用戶u3部分歌曲推薦結(jié)果列表。

具體實(shí)施方式

下面結(jié)合附圖表及實(shí)施例對(duì)本發(fā)明做進(jìn)一步說(shuō)明。

本實(shí)施例提供一種基于演唱者聲音特質(zhì)的歌曲推薦方法,如圖1所示包括如下步驟:

步驟s1:分析曲庫(kù)中歌曲的簡(jiǎn)譜信息,得到各個(gè)歌曲的midi音高基準(zhǔn)序列,分析出歌曲的音級(jí)分布直方圖,得到各個(gè)歌曲的演唱音域要求;

步驟s2:采用melodia算法分析用戶清唱錄音文件,得到演唱者演唱該歌曲的midi音高值序列,取得步驟s1中得到的同一歌曲的midi音高基準(zhǔn)序列,計(jì)算演唱者的基準(zhǔn)演唱能力,提取其演唱音域;

步驟s3:對(duì)歌手的清唱文件提取時(shí)頻信號(hào)表征,輸入到深度卷積神經(jīng)網(wǎng)絡(luò)中對(duì)網(wǎng)絡(luò)進(jìn)行迭代訓(xùn)練,得到訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)及人聲音色嵌入空間;

步驟s4:根據(jù)歌手的清唱文件提取時(shí)頻信號(hào)表征,將其輸入到步驟s3中訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)的輸出對(duì)應(yīng)于人聲音色嵌入空間的3維音色特征向量,將這3維音色特征向量作為原唱歌手的人聲音色表征;

步驟s5:分析演唱者的清唱聲音片段,同樣采用步驟s4的方法,得到人聲音色嵌入空間中的一組3維音色特征向量,作為演唱者人聲音色表征;

步驟s6:根據(jù)歌曲的演唱音域要求和演唱者的演唱音域,計(jì)算出用戶與歌曲之間的音域匹配度;

步驟s7:根據(jù)原唱歌手和演唱者的人聲音色表征,計(jì)算演唱者與各歌手的音色相似度;

步驟s8:根據(jù)音域匹配度和音色相似度,計(jì)算曲庫(kù)中每首歌曲對(duì)于該用戶的推薦度。

在本實(shí)施例中,所述步驟s6具體包括以下步驟:

步驟s61:根據(jù)歌曲音級(jí)分布直方圖得到每個(gè)音級(jí)的權(quán)重,每個(gè)音級(jí)的權(quán)重等于該音級(jí)出現(xiàn)的次數(shù)除以該歌曲中所有音級(jí)出現(xiàn)次數(shù)的總和,計(jì)算公式的定義具體為:

其中,num(x)表示音級(jí)x在簡(jiǎn)譜中出現(xiàn)的次數(shù),xmax表示簡(jiǎn)譜中音符的最大midi值,xmin表示簡(jiǎn)譜中音符的最小midi值。

步驟s62:利用歌曲的音級(jí)分布情況與用戶在各個(gè)音級(jí)的演唱能力評(píng)估值,計(jì)算出用戶演唱音域與歌曲音域要求的匹配度,音域匹配度的計(jì)算公式的定義具體為:

其中,u(x)表示用戶在音級(jí)x上的演唱能力評(píng)估值。

在本實(shí)施例中,所述步驟s7中,演唱者的聲音片段嵌入到音色嵌入空間中后,分別計(jì)算演唱者與嵌入空間中各歌手的音色相似度,音色相似度的計(jì)算公式的定義具體為:

tim_sim(u,s)=1-tanh(μ||z1-z2||2)

其中,||z1-z2||2表示兩點(diǎn)之間的歐氏距離,μ為經(jīng)驗(yàn)系數(shù),tanh為雙曲正切函數(shù)。

在本實(shí)施例中,所述步驟s8中,在進(jìn)行最終的推薦時(shí),綜合考慮用戶的演唱音域與曲庫(kù)中歌曲的音域要求的匹配度以及用戶的音色與曲庫(kù)中歌手的音色相似性,計(jì)算曲庫(kù)中每首歌曲對(duì)于該用戶的推薦度,推薦度的計(jì)算公式的定義具體為:

recom(u,s)=cran_mat(u,s)+(1-c)tim_sim(u,s)

其中,recom(u,s)表示歌曲s對(duì)于用戶u的推薦度,ran_mat(u,s)表示歌曲s對(duì)于用戶u的音域匹配度,tim_sim(u,s)表示用戶u的音色與歌曲s的原唱歌手音色的相似度,c取值為0.7。

在本實(shí)施例中,根據(jù)以上方法給出實(shí)例,具體包括以下步驟:

步驟1:分析曲庫(kù)中歌曲的簡(jiǎn)譜信息,得到各個(gè)歌曲的midi音高基準(zhǔn)序列,分析出歌曲的音級(jí)分布直方圖,得到各個(gè)歌曲的演唱音域要求。具體步驟如下:

步驟11:搜集整理曲庫(kù)中用戶演唱歌曲的簡(jiǎn)譜,根據(jù)歌曲簡(jiǎn)譜中的調(diào)號(hào)及唱名等信息,將簡(jiǎn)譜信息轉(zhuǎn)換為對(duì)應(yīng)的midi音高值序列,并根據(jù)對(duì)應(yīng)歌曲伴奏的開(kāi)始時(shí)間、持續(xù)時(shí)間等信息,建立該歌曲的標(biāo)準(zhǔn)midi音高特征文件。

步驟12:由歌曲midi音高值序列分析出歌曲的音級(jí)分布直方圖,歌曲的音級(jí)分布直方圖統(tǒng)計(jì)了歌曲midi音高值序列中,每個(gè)音級(jí)出現(xiàn)的次數(shù),并按照音列從低到高的順序排列。因此,音級(jí)分布直方圖的最左和最右兩個(gè)音級(jí)所包含的音域部分,對(duì)應(yīng)該歌曲的演唱音域要求。

步驟2:采用melodia算法分析用戶清唱錄音文件,得到演唱者演唱該歌曲的midi音高值序列,取得曲庫(kù)中同一歌曲的midi音高基準(zhǔn)序列,計(jì)算演唱者的基準(zhǔn)演唱能力,提取其演唱音域。具體步驟如下:

步驟21:采用melodia算法分析用戶清唱錄音文件,melodia算法能自動(dòng)檢測(cè)歌曲中主要旋律的基頻f0,具體參數(shù)設(shè)置為{"minfqr":82.0,"maxfqr":1047.0,"voicing":0.2,"minpeaksalience":0.0}。將基頻f0轉(zhuǎn)換為midi音高值p,轉(zhuǎn)換公式的具體定義為:

步驟22:下面以用戶u1例,用戶u1為男性,具有一定的演唱經(jīng)驗(yàn),但是太高的音唱不上去。根據(jù)步驟11取得曲庫(kù)中同一歌曲的midi音高基準(zhǔn)序列,統(tǒng)計(jì)u1的音級(jí)x在歌曲集合中出現(xiàn)的次數(shù)及演唱者唱準(zhǔn)次數(shù)來(lái)評(píng)價(jià)音級(jí)x的完成質(zhì)量,記為β(x),累加至用戶的歷史文件中,更新用戶的演唱音域歷史記錄。計(jì)算每個(gè)音級(jí)的威爾遜置信區(qū)間下界,作為更新后的音級(jí)完成質(zhì)量。

步驟23:遍歷更新后的音級(jí)完成質(zhì)量,然后計(jì)算出基準(zhǔn)演唱能力α。α的計(jì)算公式的定義具體為:

α=mean(β(x))-std(β(x))

其中,mean(β(x))表示總音域內(nèi)各個(gè)音級(jí)完成質(zhì)量的平均值,std(β(x))表示總音域內(nèi)各個(gè)音級(jí)完成質(zhì)量的標(biāo)準(zhǔn)差。經(jīng)統(tǒng)計(jì),用戶u1演唱20首歌曲之后,各個(gè)音級(jí)的平均完成質(zhì)量為0.84,標(biāo)準(zhǔn)差為0.16,計(jì)算出其基準(zhǔn)演唱能力α為0.68。

步驟24:用<α,[xmin,xmax],sequ[β(xmin),β(xmax)],min(β(x))>表示演唱者的演唱音域,是一個(gè)五元組。其中,xmin為midi值最小的音級(jí)為,xmax為midi值最大的音級(jí),sequ[β(xmin),β(xmax)]為xmin與xmax之間的音級(jí)完成質(zhì)量序列,音質(zhì)完成質(zhì)量下界值為min(β(x))。分析得到用戶u1大于基準(zhǔn)演唱能力的最小音級(jí)為a3,最大音級(jí)為g5。而各個(gè)音級(jí)完成質(zhì)量序列值為[0.86,0.99,…],其中最小的音質(zhì)完成質(zhì)量下界值為0.28。最終得到用戶u1的演唱音域?yàn)?lt;0.68,[a3,g5],[0.86,0.99,…],0.28>。

步驟3:對(duì)歌手的清唱文件提取時(shí)頻信號(hào)表征,輸入到深度卷積神經(jīng)網(wǎng)絡(luò)中對(duì)網(wǎng)絡(luò)進(jìn)行迭代訓(xùn)練,得到訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)及人聲音色嵌入空間。具體步驟如下:

步驟31:將歌手分為15人一組,對(duì)每組歌手的清唱音頻進(jìn)行分幀,對(duì)其提取cqt特征,每一幀的cqt系數(shù)為192維,選取60幀的cqt系數(shù),構(gòu)成神經(jīng)網(wǎng)絡(luò)的輸入矩陣,矩陣大小為60*192。

步驟32:將步驟31中得到的輸入矩陣輸入到深度卷積神經(jīng)網(wǎng)絡(luò),并采用成對(duì)訓(xùn)練的方法對(duì)網(wǎng)絡(luò)進(jìn)行迭代訓(xùn)練,得到訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)及相應(yīng)的音色嵌入空間。

步驟4:根據(jù)歌手的清唱文件提取時(shí)頻信號(hào)表征,將其輸入到步驟s3中訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)的輸出對(duì)應(yīng)于人聲音色嵌入空間的3維音色特征向量,將這3維音色特征向量作為原唱歌手的人聲音色表征。具體步驟如下:

步驟41:對(duì)每一位歌手的聲音片段,采用同步驟31的方法,提取cqt特征后,得到大小為60*192的輸入矩陣。

步驟42:將步驟41得到的cqt特征輸入到步驟32訓(xùn)練好深度卷積網(wǎng)絡(luò),網(wǎng)絡(luò)的輸出對(duì)應(yīng)于人聲音色嵌入空間的3維音色特征向量,將這3維音色特征向量作為原唱歌手的人聲音色表征。

步驟5:分析演唱者的清唱聲音片段,同步驟s4方法,得到人聲音色嵌入空間中的一組3維音色特征向量,作為演唱者人聲音色表征。具體步驟如下:

步驟51:對(duì)演唱者的聲音片段,采用同步驟31的方法,提取cqt特征后,得到大小為60*192的輸入矩陣。

步驟52:將步驟51得到的cqt特征輸入到步驟32訓(xùn)練好深度卷積網(wǎng)絡(luò),網(wǎng)絡(luò)的輸出對(duì)應(yīng)于人聲音色嵌入空間的3維音色特征向量,將這3維音色特征向量作為演唱者的人聲音色表征。

步驟6:根據(jù)歌曲的演唱音域要求和演唱者的演唱音域,計(jì)算出用戶與歌曲之間的音域匹配度。具體步驟如下:

步驟61:根據(jù)歌曲音級(jí)分布直方圖得到每個(gè)音級(jí)的權(quán)重,每個(gè)音級(jí)的權(quán)重等于該音級(jí)出現(xiàn)的次數(shù)除以該歌曲中所有音級(jí)出現(xiàn)次數(shù)的總和,計(jì)算公式的定義具體為:

其中,num(x)表示音級(jí)x在簡(jiǎn)譜中出現(xiàn)的次數(shù),xmax表示簡(jiǎn)譜中音符的最大midi值,xmin表示簡(jiǎn)譜中音符的最小midi值。

步驟62:以用戶u2的演唱音域和劉若英唱的歌曲《當(dāng)愛(ài)在靠近》進(jìn)行實(shí)例分析。用戶u2,女性,其演唱音域?yàn)?lt;0.18,[f4,g5],[0.183,0.409,…],0.08>,即用戶u2在音域[f4,g5]范圍內(nèi)的各音級(jí)完成度為0.183,0.409,…,音域范圍外的演唱能力估值為0.08。該歌曲的音域要求是[d4,g5]。

計(jì)算出歌曲音級(jí)分布直方圖中每個(gè)音級(jí)的權(quán)重之后,音域匹配度等于用戶在各個(gè)音級(jí)上的演唱能力評(píng)估值乘以歌曲音級(jí)分布直方圖的權(quán)重之和。音域匹配度的計(jì)算公式的定義具體為:

其中,u(x)表示用戶在音級(jí)x上的演唱能力評(píng)估值,根據(jù)音級(jí)x是否屬于用戶的演唱音域,u(x)取不同的值。具體計(jì)算公式定義具體為:

其中,β(x)表示用戶在演唱音域內(nèi)各音級(jí)的完成質(zhì)量,min(β(x))表示用戶的音級(jí)完成質(zhì)量的最小值。

最終得到用戶u2演唱?jiǎng)⑷粲⑺母枨懂?dāng)愛(ài)在靠近》的音域匹配度為0.36。

步驟7:根據(jù)步驟4和步驟5的方法分別得到原唱歌手和演唱者在各個(gè)音色嵌入空間中的一組3維音色特征向量,利用與歌手之間的歐氏距離,分別計(jì)算與各個(gè)嵌入空間中各歌手的音色相似度。以歌手子集c8{梁靜茹,劉若英,陳小春,張學(xué)友,范瑋琪,范曉萱,tank,任賢齊}為例。

音色相似度的計(jì)算公式的定義具體為:

tim_sim(u,s)=1-tanh(μ||z1-z2||2)

其中,||z1-z2||2表示兩點(diǎn)之間的歐氏距離,μ為經(jīng)驗(yàn)系數(shù),取0.05,tanh為雙曲正切函數(shù)。歌手梁靜茹與其他歌手的相似性為{{范瑋琪:0.53},{劉若英:0.55},{范曉萱:0.55},{陳小春:0.22},{tank:0.37},{任賢齊:0.40},{張學(xué)友:0.24}}。

步驟8:在進(jìn)行最終的推薦時(shí),綜合考慮用戶的演唱音域與曲庫(kù)中歌曲的音域要求的匹配度以及用戶的音色與曲庫(kù)中歌手的音色相似性,計(jì)算曲庫(kù)中每首歌曲對(duì)于該用戶的推薦度。音域匹配度的計(jì)算如前述步驟6所示,音色相似度的計(jì)算如前述步驟7所示。以用戶u3進(jìn)行實(shí)例分析,用戶u3,男性,其演唱音域模型為<0.58,[a3,g5],[0.835,0.602,…],0.26>,即用戶u3在音域[a3,g5]范圍內(nèi)的各音級(jí)完成度為0.835,0.302,…,音域范圍外的演唱能力估值為0.26。

推薦度的計(jì)算公式的定義具體為:

recom(u,s)=cran_mat(u,s)+(1-c)tim_sim(u,s)

其中,recom(u,s)表示歌曲s對(duì)于用戶u的推薦度,ran_mat(u,s)表示歌曲s對(duì)于用戶u的音域匹配度,tim_sim(u,s)表示用戶u的音色與歌曲s的原唱歌手音色的相似度,c為常數(shù),0≤c≤1。c取值為0.7。通過(guò)歌曲s對(duì)用戶u的音域匹配度和音色相似度,計(jì)算出其推薦度,最終根據(jù)推薦度,推薦歌曲給用戶。

最終用戶u3推薦度最高的推薦歌曲詳細(xì)信息為:歌曲《十年》,歌手陳奕迅,音域要求[c4,f5]。其音域匹配度為0.84,音色相似度為0.88,最終計(jì)算匹配度0.85。圖2給出了用戶u3更全的部分推薦結(jié)果。

以上所述僅為本發(fā)明的較佳實(shí)施例,凡依本發(fā)明申請(qǐng)專利范圍所做的均等變化與修飾,皆應(yīng)屬本發(fā)明的涵蓋范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1