一種音頻文件的節(jié)奏感強度獲取方法及裝置制造方法
【專利摘要】本發(fā)明提供了一種音頻文件的節(jié)奏感強度獲取方法及裝置,該方法包括:獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值;獲取音頻文件中的所有幀的總頻譜能量;獲取第一頻譜能量之和與總頻譜能量的比值,得到所述音頻文件的頻譜能量比;根據(jù)頻譜能量均值與頻譜能量比獲取所述音頻文件的節(jié)奏感強度值。本發(fā)明實施例通過獲得設(shè)定頻段的頻譜能量均值和音頻文件的頻譜能量比,然后根據(jù)頻譜能量均值與頻譜能量比獲取所述音頻文件的節(jié)奏感強度值,實現(xiàn)對歌曲的節(jié)奏感強度進行量化,為用戶通過節(jié)奏感強度選歌提供依據(jù)。
【專利說明】一種音頻文件的節(jié)奏感強度獲取方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻處理【技術(shù)領(lǐng)域】,尤其涉及一種音頻文件的節(jié)奏感強度獲取方法及
>J-U ρ?α裝直。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)提供的歌曲的數(shù)量越來越多,動輒幾百萬,甚至上千萬。而隨著用戶對音樂的需求不斷的提高,用戶從互聯(lián)網(wǎng)上獲取歌曲的方式也有所變化,從最初用戶通過互聯(lián)網(wǎng)主動找歌,到現(xiàn)在音樂網(wǎng)站主動向用戶推薦歌曲,用戶對音樂網(wǎng)站提出的要求越來越高。
[0003]音樂網(wǎng)站通過歌曲的曲風(fēng)、流派等信息,或者通過文本挖掘的方式,為用戶推薦歌曲,例如,通過用戶的標(biāo)注信息、歌單以及用戶評論信息等,挖掘出歌曲的節(jié)奏信息,為用戶提供曲風(fēng)類似的歌曲。由于互聯(lián)網(wǎng)上,很多歌曲的曲風(fēng)、流派等信息不全,因而通過曲風(fēng)、流派只能對用戶提供較為粗放的選歌方式,通過文本挖掘的方式,不能準(zhǔn)確地對歌曲的節(jié)奏感強度進行量化,從而使得文本挖掘的方式應(yīng)用面受限。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實施例提供一種音頻文件的節(jié)奏感強度獲取方法及裝置,通過對歌曲的節(jié)奏感強度進行量化,為用戶通過節(jié)奏感強度選歌提供依據(jù)。
[0005]為達到上述目的,本發(fā)明的實施例采用如下技術(shù)方案:
[0006]一種音頻文件的節(jié)奏感強度獲取方法,該方法包括:
[0007]獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值;
[0008]獲取音頻文件中的所有幀的總頻譜能量;
[0009]獲取第一頻譜能量之和與總頻譜能量的比值,得到所述音頻文件的頻譜能量比;
[0010]根據(jù)頻譜能量均值與頻譜能量比獲取所述音頻文件的節(jié)奏感強度值。
[0011]一種音頻文件的節(jié)奏感強度獲取裝置,該裝置包括:
[0012]第一獲取模塊,用于獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值;
[0013]第二獲取模塊,用于獲取音頻文件中的所有幀的總頻譜能量;
[0014]第三獲取模塊,用于獲取第一頻譜能量之和與總頻譜能量的比值,得到音頻文件的頻譜能量比;
[0015]第四獲取模塊,用于根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強度值。
[0016]本發(fā)明實施例提供的音頻文件的節(jié)奏感強度獲取方法及裝置,通過獲得設(shè)定頻段的頻譜能量均值和音頻文件的頻譜能量比,然后根據(jù)頻譜能量均值與頻譜能量比獲取所述音頻文件的節(jié)奏感強度值,實現(xiàn)對歌曲的節(jié)奏感強度進行量化,為用戶通過節(jié)奏感強度選歌提供依據(jù)。
【專利附圖】
【附圖說明】
[0017]圖1為本發(fā)明實施例一提供的音頻文件的節(jié)奏感強度獲取方法的流程示意圖。
[0018]圖2為本發(fā)明實施例二提供的音頻文件的節(jié)奏感強度獲取方法的流程示意圖。
[0019]圖3為圖2所示實施例中步驟230具體實現(xiàn)的一個流程示意圖。
[0020]圖4為圖3所示實施例中經(jīng)過步驟231處理后的頻譜能量示意圖。
[0021]圖5為圖3所示實施例中經(jīng)過步驟232處理后的頻譜能量示意圖。
[0022]圖6為本發(fā)明實施例三提供的音頻文件的節(jié)奏感強度獲取裝置的結(jié)構(gòu)示意圖。
[0023]圖7為本發(fā)明實施例四提供的音頻文件的節(jié)奏感強度獲取裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0024]下面結(jié)合附圖對本發(fā)明實施例提供的音頻文件的節(jié)奏感強度獲取方法及裝置進行詳細描述。
[0025]很多歌曲聽起來具有明顯的節(jié)奏感,一般是通過鼓聲或者其它節(jié)奏樂器來表現(xiàn)的。而具有節(jié)奏感的歌曲,其節(jié)奏感強度也是不一樣的,例如,搖滾類歌曲具有很強的節(jié)奏感,而抒情歌曲的節(jié)奏感稍弱,還有的歌曲沒有鼓聲作為點綴,更有的歌曲幾乎沒有節(jié)奏感。本發(fā)明實施例通過對歌曲的節(jié)奏感強度進行檢測,將檢測結(jié)果作為一個明確的描述節(jié)奏強度的數(shù)值,從而滿足用戶檢索歌曲的泛需求。
[0026]本發(fā)明實施例通過對歌曲的音頻進行分析,能夠得到該歌曲的節(jié)奏感強度信息,從而使得用戶通過本發(fā)明實施例提供的節(jié)奏感強度檢索適合跳舞的歌曲。本發(fā)明實施例還可用于為用戶推薦某一類的歌曲,還可以根據(jù)用戶收藏的歌曲向用戶推薦用戶喜歡的歌曲,從而實現(xiàn)了用戶檢索歌曲的泛需求、場景分類、用戶的個性化推薦等。
[0027]實施例一:
[0028]圖1為本發(fā)明實施例一提供的音頻文件的節(jié)奏感強度獲取方法的流程示意圖,如圖1所示,本發(fā)明實施例的音頻文件的節(jié)奏感強度獲取方法包括如下步驟:
[0029]步驟110,獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值。
[0030]步驟120,獲取音頻文件中的所有幀的總頻譜能量。
[0031]步驟130,獲取第一頻譜能量之和與總頻譜能量的比值,得到音頻文件的頻譜能量比。
[0032]步驟140,根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強度值。
[0033]在步驟110中,獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值的具體處理可以為:首先對音頻文件進行解碼,以及重采樣,重采樣可直接采用國內(nèi)音樂的標(biāo)準(zhǔn)頻率44100Hz,之后對重采樣的音頻進行分幀(可設(shè)置幀長為2048,幀間隔為256),然后進行漢寧窗處理,去除漢寧窗的邊界影響,再對分幀后的音頻進行快速傅立葉變換,得到每幀音頻數(shù)據(jù)的頻譜,然后根據(jù)每幀音頻數(shù)據(jù)的頻譜計算所有幀在設(shè)定頻段的第一頻譜能量之和以及設(shè)定頻段的頻譜能量均值。其中,設(shè)定頻段的頻率范圍可以為50-150HZ,該頻段屬于語音頻譜的低頻范圍。
[0034]在步驟120中,先獲得每幀音頻數(shù)據(jù)的頻譜,然后獲取音頻文件中的所有幀的總頻譜能量。其中,獲得每幀音頻數(shù)據(jù)的頻譜可參考步驟110中相關(guān)的描述,在此不再對其進行詳細描述。
[0035]需要說明的是,本發(fā)明實施例對步驟110與步驟120的執(zhí)行順序不做限制,步驟110和步驟120的執(zhí)行順序可以互換,可以不分先后。
[0036]本發(fā)明實施例提供的音頻文件的節(jié)奏感強度獲取方法,通過獲得設(shè)定頻段的頻譜能量均值和音頻文件的頻譜能量比,然后根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強度值,實現(xiàn)對歌曲的節(jié)奏感強度進行量化,為用戶通過節(jié)奏感強度選歌提供依據(jù)。
[0037]實施例二:
[0038]圖2為本發(fā)明實施例二提供的音頻文件的節(jié)奏感強度獲取方法的流程示意圖,如圖2所示,本發(fā)明實施例的音頻文件的節(jié)奏感強度獲取方法包括如下步驟:
[0039]步驟210,獲取音頻文件中的每一幀在設(shè)定頻段的頻譜能量。
[0040]步驟220,通過音頻文件中的所有幀對應(yīng)的頻譜能量獲取設(shè)定頻段的頻譜能量的變化曲線。
[0041]步驟230,通過變化曲線獲取設(shè)定頻段的頻譜能量均值。
[0042]步驟240,獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和。
[0043]步驟250,獲取音頻文件中的所有幀的總頻譜能量。
[0044]步驟260,獲取第一頻譜能量之和與總頻譜能量的比值,得到音頻文件的頻譜能量比。
[0045]步驟270,根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強度值。
[0046]本發(fā)明實施例中,設(shè)定頻段的頻率范圍可以為50-150HZ。
[0047]在步驟210中,獲取音頻文件中的每一幀在設(shè)定頻段的頻譜能量的具體處理步驟可以為:先獲得每幀音頻數(shù)據(jù)的頻譜,然后獲取音頻文件中的每一幀在設(shè)定頻段的頻譜能量。其中,獲得每幀音頻數(shù)據(jù)的頻譜可參考實施例一的步驟110中相關(guān)的描述,在此不再進行詳細描述。
[0048]在步驟220中,將步驟210中獲取的每一幀在設(shè)定頻段的頻譜能量連接起來,可以得到一個向量,該向量描述的就是所述設(shè)定頻段的頻譜能量的變化曲線。例如:從音頻文件中的第一幀得到了設(shè)定頻段的頻譜能量ei,從第二幀得到了設(shè)定頻段的頻譜能量e2,…,從第η幀得到了設(shè)定頻段的頻譜能量%,綜合起來就得到:e1、e2、…、en#向量,從而獲得設(shè)定頻段的頻譜能量的變化曲線。
[0049]在步驟230中,在得到設(shè)定頻段的頻譜能量的變化曲線之后,需要提取出該設(shè)定頻段的周期性的能量信息,并且該設(shè)定頻段內(nèi)不同頻率的周期能量信息累加起來,例如,一首歌曲帶有兩種節(jié)奏感的樂器,存在兩個周期性的信息,該周期性的信息可能存在一個區(qū)間之內(nèi),在一個區(qū)間之內(nèi)可能是大致周期性的,或者,在節(jié)拍打得有偏差的情況下,會導(dǎo)致在下一段與當(dāng)前段的信號發(fā)生偏移,此時音頻不是完全吻合的周期性信號。本發(fā)明實施例通過步驟230獲取設(shè)定頻段的頻譜能量均值,從而將上述情形考慮在內(nèi),使得獲取到的節(jié)奏感強度更精確,具體步驟可如圖3所示。
[0050]在步驟240中,先獲得每幀音頻數(shù)據(jù)的頻譜,然后獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和。其中,獲得每幀音頻數(shù)據(jù)的頻譜可參考實施例一的步驟110中相關(guān)的描述,在此不再對其進行詳細描述。需要說明的是,步驟240也可以在步驟210-230之間的任一步驟前執(zhí)行。
[0051]在步驟250中,先獲得每幀音頻數(shù)據(jù)的頻譜,然后獲取音頻文件中的所有幀的總頻譜能量。其中,獲得每幀音頻數(shù)據(jù)的頻譜可參考實施例一的步驟110中相關(guān)的描述,在此不再對其進行詳細描述。需要說明的是,步驟250也可以在步驟210-240之間的任一步驟前執(zhí)行。
[0052]在步驟270中,根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強度值的處理可以具體為:獲取頻譜能量均值與頻譜能量的乘積,乘積為音頻文件的節(jié)奏感強度值。
[0053]圖3為步驟230的具體實現(xiàn)的一個流程示意圖。參照圖3,步驟230的具體實現(xiàn)可以包括如下步驟:
[0054]步驟231,將變化曲線進行傅立葉變換,計算傅立葉變換之后的第二頻譜能量。
[0055]步驟232,對第二頻譜能量進行傅立葉反變換,計算傅立葉反變換后的第三頻譜能量。
[0056]步驟233,計算第三頻譜能量的均值,得到設(shè)定頻段的頻譜能量均值。
[0057]以一個節(jié)奏感比較強的音頻文件的處理為示例,圖4為節(jié)奏感比較強的音頻經(jīng)過本實施例的步驟231處理后的頻譜能量示意圖,圖5為音頻經(jīng)過本實施例的步驟232處理后的頻譜能量示意圖。在圖4和圖5中,橫坐標(biāo)表示時間,具體時間與前述的分幀有關(guān),也即與音頻文件的時長有關(guān)系,縱坐標(biāo)表示采樣量化后的編碼,既可以用功率表示單位,還可以通過取對數(shù)的方式以db為單位,db表示1logx,從圖4可以看出,其第二頻譜能量(specenergy I)值比較大,隱約可見,其中具有周期性的信息。從圖5可以看出,第三頻譜能量(spec energy 2)的值較大,而且具有明顯的周期性,并且其分布非常緊密,通過步驟233中計算第三頻譜能量的均值時,得到的頻譜能量值非常大,該頻譜能量值是本發(fā)明實施例在獲取節(jié)奏感輕度時所需要的,可以用來描述節(jié)奏感強度較大的一個分量。
[0058]實施例三:
[0059]圖6為本發(fā)明實施例三提供的音頻文件的節(jié)奏感強度獲取裝置的結(jié)構(gòu)示意圖,如圖6所示,本發(fā)明實施例的音頻文件的節(jié)奏感強度獲取裝置包括:
[0060]第一獲取模塊610,用于獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值。
[0061]第二獲取模塊620,用于獲取音頻文件中的所有幀的總頻譜能量。
[0062]第三獲取模塊630,用于獲取第一頻譜能量之和與總頻譜能量的比值,得到音頻文件的頻譜能量比。
[0063]第四獲取模塊640,用于根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強度值。
[0064]第一獲取模塊610可以首先對音頻文件進行解碼,以及重采樣,重采樣可直接采用國內(nèi)音樂的標(biāo)準(zhǔn)頻率44100Hz,之后對重采樣的音頻進行分幀(可設(shè)置幀長為2048,幀間隔為256),然后進行漢寧窗處理,去除邊界影響,再進行快速傅立葉變換,得到每幀音頻數(shù)據(jù)的頻譜,然后計算所有幀在設(shè)定頻段的第一頻譜能量之和以及所述設(shè)定頻段的頻譜能量均值。其中,所述設(shè)定頻段的頻率范圍可以為50-150HZ。
[0065]第二獲取模塊620先獲得每幀音頻數(shù)據(jù)的頻譜,然后獲取所述音頻文件中的所有幀的總頻譜能量。其中,第二獲取模塊620獲得每幀音頻數(shù)據(jù)的頻譜可參考第一獲取模塊610獲得每幀音頻數(shù)據(jù)的頻譜的處理,在此不再進行詳細描述。
[0066]本發(fā)明實施例提供的音頻文件的節(jié)奏感強度獲取裝置,通過第一獲取模塊610、第二獲取模塊620以及第三獲取模塊630獲得設(shè)定頻段的頻譜能量均值和音頻文件的頻譜能量比,然后通過第四獲取模塊640根據(jù)所述頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強度值,實現(xiàn)對歌曲的節(jié)奏感強度進行量化,為用戶通過節(jié)奏感強度選歌提供依據(jù)。
[0067]實施例四:
[0068]圖7為本發(fā)明實施例四提供的音頻文件的節(jié)奏感強度獲取裝置的結(jié)構(gòu)示意圖,如圖7所示,本發(fā)明實施例的音頻文件的節(jié)奏感強度獲取裝置包括:
[0069]第一獲取模塊610,用于獲取音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取設(shè)定頻段的頻譜能量均值。
[0070]第二獲取模塊620,用于獲取音頻文件中的所有幀的總頻譜能量。
[0071]第三獲取模塊630,用于獲取第一頻譜能量之和與總頻譜能量的比值,得到音頻文件的頻譜能量比。
[0072]第四獲取模塊640,用于根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強度值。
[0073]進一步地,第一獲取模塊610可以包括以下幾個單元:
[0074]第一獲取單元611,用于獲取音頻文件中的每一幀在設(shè)定頻段的頻譜能量。
[0075]第二獲取單元612,用于通過音頻文件中的所有幀對應(yīng)的頻譜能量獲取設(shè)定頻段的頻譜能量的變化曲線。
[0076]第三獲取單元613,用于通過變化曲線獲取所述設(shè)定頻段的頻譜能量均值。
[0077]更進一步地,所述第三獲取單元613可以包括以下幾個單元:
[0078]第一計算子單元6131,用于將所述變化曲線進行傅立葉變換,計算所述傅立葉變換之后的第二頻譜能量。
[0079]第二計算子單元6132,用于對所述第二頻譜能量進行傅立葉反變換,計算所述傅立葉反變換后的第三頻譜能量。
[0080]第三計算子單元6133,用于計算所述第三頻譜能量的均值,得到所述設(shè)定頻段的頻譜能量均值。
[0081]通過上述對第一獲取模塊610及第三獲取單元613的進一步的補充所產(chǎn)生的有益技術(shù)效果可參考實施例二中步驟230中所述的有益技術(shù)效果,在此不再贅述。
[0082]進一步地,第四獲取模塊640可以包括:
[0083]第四獲取單元641,用于獲取所述頻譜能量均值與所述頻譜能量的乘積,所述乘積為所述音頻文件的節(jié)奏感強度值。
[0084]綜上所述,本發(fā)明實施例提供的音頻文件的節(jié)奏感強度獲取方法及裝置,通過獲得設(shè)定頻段的頻譜能量均值和音頻文件的頻譜能量比,然后根據(jù)頻譜能量均值與頻譜能量比獲取音頻文件的節(jié)奏感強度值,實現(xiàn)對歌曲的節(jié)奏感強度進行量化,為用戶通過節(jié)奏感強度選歌提供依據(jù)。
[0085]為了證明本發(fā)明實施例的有效性,通過近2000首歌,從其中按照曲風(fēng)、流派等分布抽取了 100首歌進行主觀評測,通過本發(fā)明實施例的技術(shù)方案獲取到的節(jié)奏感強度值有80 %左右的歌曲是準(zhǔn)確的,大概20 %的歌曲有較小程度的偏差;因此,本發(fā)明實施例完全能夠描述節(jié)奏感強度,并在工業(yè)界使用。
[0086]以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何熟悉本【技術(shù)領(lǐng)域】的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準(zhǔn)。
【權(quán)利要求】
1.一種音頻文件的節(jié)奏感強度獲取方法,其特征在于,所述方法包括: 獲取所述音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取所述設(shè)定頻段的頻譜能量均值; 獲取所述音頻文件中的所有幀的總頻譜能量; 獲取所述第一頻譜能量之和與所述總頻譜能量的比值,得到所述音頻文件的頻譜能量比; 根據(jù)所述頻譜能量均值與所述頻譜能量比獲取所述音頻文件的節(jié)奏感強度值。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述設(shè)定頻段的頻率范圍為50-150HZ。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述設(shè)定頻段的頻譜能量均值的步驟包括: 獲取所述音頻文件中的每一幀在所述設(shè)定頻段的頻譜能量; 通過所述音頻文件中的所有幀對應(yīng)的頻譜能量獲取所述設(shè)定頻段的頻譜能量的變化曲線; 通過所述變化曲線獲取所述設(shè)定頻段的頻譜能量均值。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述通過所述變化曲線獲取所述設(shè)定頻段的頻譜能量均值的步驟包括: 將所述變化曲線進行傅立葉變換,計算所述傅立葉變換之后的第二頻譜能量; 對所述第二頻譜能量進行傅立葉反變換,計算所述傅立葉反變換后的第三頻譜能量; 計算所述第三頻譜能量的均值,得到所述設(shè)定頻段的頻譜能量均值。
5.根據(jù)權(quán)利要求1-4任一所述的方法,其特征在于,所述根據(jù)所述頻譜能量均值與所述頻譜能量比獲取所述音頻文件的節(jié)奏感強度值的步驟包括: 獲取所述頻譜能量均值與所述頻譜能量的乘積,所述乘積為所述音頻文件的節(jié)奏感強度值。
6.一種音頻文件的節(jié)奏感強度獲取裝置,其特征在于,所述裝置包括: 第一獲取模塊,用于獲取所述音頻文件中的所有幀在設(shè)定頻段的第一頻譜能量之和以及獲取所述設(shè)定頻段的頻譜能量均值; 第二獲取模塊,用于獲取所述音頻文件中的所有幀的總頻譜能量; 第三獲取模塊,用于獲取所述第一頻譜能量之和與所述總頻譜能量的比值,得到所述音頻文件的頻譜能量比; 第四獲取模塊,用于根據(jù)所述頻譜能量均值與所述頻譜能量比獲取所述音頻文件的節(jié)奏感強度值。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述設(shè)定頻段的頻率范圍為50-150HZ。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第一獲取模塊包括: 第一獲取單元,用于獲取所述音頻文件中的每一幀在所述設(shè)定頻段的頻譜能量; 第二獲取單元,用于通過所述音頻文件中的所有幀對應(yīng)的頻譜能量獲取所述設(shè)定頻段的頻譜能量的變化曲線; 第三獲取單元,用于通過所述變化曲線獲取所述設(shè)定頻段的頻譜能量均值。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述第三獲取單元包括: 第一計算子單元,用于將所述變化曲線進行傅立葉變換,計算所述傅立葉變換之后的第二頻譜能量; 第二計算子單元,用于對所述第二頻譜能量進行傅立葉反變換,計算所述傅立葉反變換后的第三頻譜能量; 第三計算子單元,用于計算所述第三頻譜能量的均值,得到所述設(shè)定頻段的頻譜能量均值。
10.根據(jù)權(quán)利要求6-9任一所述的裝置,其特征在于,所述第四獲取模塊包括: 第四獲取單元,用于獲取所述頻譜能量均值與所述頻譜能量的乘積,所述乘積為所述音頻文件的節(jié)奏感強度值。
【文檔編號】G10L25/51GK104299621SQ201410524778
【公開日】2015年1月21日 申請日期:2014年10月8日 優(yōu)先權(quán)日:2014年10月8日
【發(fā)明者】王徽蓉 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司