來自音樂音頻信號(hào)的拍子、和弦和強(qiáng)拍的評估的制作方法
【專利摘要】提供了服務(wù)器系統(tǒng)500,其用于接收具有用于在該服務(wù)器系統(tǒng)處理的相關(guān)聯(lián)的音頻/音樂音軌的視頻片段。該系統(tǒng)包括:拍子跟蹤模塊,其用于識(shí)別音頻信號(hào)中的拍子時(shí)刻(ti),以及和弦變化估計(jì)模塊,其用于從在所述拍子時(shí)刻(ti)的所述音頻信號(hào)中的色度重音信息確定和弦變化似然。此外,提供了基于第一重音和第二重音的估計(jì)模塊,其用于使用各自不同算法從在所述拍子時(shí)刻(ti)的所述音頻信號(hào)確定各自的基于第一重音和第二重音的強(qiáng)拍似然值。處理的最后階段使用預(yù)定義的基于分?jǐn)?shù)的算法識(shí)別在拍子時(shí)刻(ti)出現(xiàn)的強(qiáng)拍,該預(yù)定義的基于分?jǐn)?shù)的算法采用在所述拍子時(shí)刻(ti)的和弦變化似然和所述基于第一重音和第二重音的強(qiáng)拍似然的數(shù)值表示作為輸入。
【專利說明】來自音樂音頻信號(hào)的拍子、和弦和強(qiáng)拍的評估
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及用于音頻信號(hào)分析的方法和系統(tǒng),以及特別是涉及用于識(shí)別音樂信號(hào) 中的強(qiáng)拍的方法和系統(tǒng)。
【背景技術(shù)】
[0002] 在音樂術(shù)語中,強(qiáng)拍是小節(jié)線劃分的節(jié)(還被稱為小節(jié))的第一拍或脈沖。它頻 繁地,盡管不總是,攜帶有節(jié)奏的循環(huán)的最強(qiáng)重音。因?yàn)楫?dāng)舞者使他們的移動(dòng)跟隨音樂時(shí), 音樂家演奏音樂以及為舞者伴奏,因此對于音樂家而言,強(qiáng)拍是重要的。
[0003] 有許多實(shí)際應(yīng)用,在該實(shí)際應(yīng)用中,期望的是從音樂音頻信號(hào)識(shí)別強(qiáng)拍的時(shí)間位 置。此類應(yīng)用包含:音樂推薦應(yīng)用,在音樂推薦應(yīng)用中,搜索與參考音軌類似的音樂,在唱片 節(jié)目選播員(DJ)應(yīng)用中,其中例如,要求在播放列表中的歌曲之間的無縫拍子混合過渡, 以及要求以自動(dòng)循環(huán)技術(shù)。
[0004] 在使用強(qiáng)拍以幫助同步自動(dòng)視頻場景剪輯至音樂上有意義的點(diǎn)中,已經(jīng)識(shí)別了特 別有用的應(yīng)用。例如,在從與相同音樂表演有關(guān)的不同源獲得多個(gè)視頻(具有音頻)片段的 地方,將期望的是,自動(dòng)加入來自不同源的片段以及以美觀的方式提供視頻片段,就像創(chuàng)建 專業(yè)音樂視頻的方式。在這種情況下,有利的是,將視頻鏡頭之間的切換同步到音樂強(qiáng)拍。
[0005] 以下詞語用于理解下面描述的某些概念。
[0006] 首商:首符的基本頻率(fQ)的生理關(guān)聯(lián)。
[0007] 色度(Chroma),還被稱為音級(jí)(pitch class):由屬于共同音級(jí)的整數(shù)八度分離 的音樂音高。在西方音樂中,使用12音級(jí)。
[0008] 拍子或基本拍(tactus):音樂中的時(shí)間的基本單位,它能夠被認(rèn)為是速率,當(dāng)聽 到一段音樂時(shí),大多數(shù)人在該速率將使他們的腳輕打地面。該詞語還用于表示屬于單個(gè)拍 子的音樂部分。
[0009] 音樂速度:以每分鐘拍子數(shù)(BPM)為單位表示的拍子或基本拍脈沖的速率。
[0010] 小節(jié)或小節(jié)線劃分的節(jié):被定義成給定時(shí)間期間的給定數(shù)目的拍子的時(shí)間分割。 例如,在具有4/4拍子記號(hào)的音樂中,每個(gè)小節(jié)包括4個(gè)拍子。
[0011] 強(qiáng)拍:小節(jié)或小節(jié)線劃分的節(jié)的第一拍子。
[0012] 重音或基于重音的音頻分析:分析音頻信號(hào)以檢測音樂中的事件和/或變化,包 含但不限于所有離散聲音事件的開始,尤其是長音高聲音的起始,音色(timbre)的響度中 的突然變化,以及和聲變化。以下給出進(jìn)一步的細(xì)節(jié)。
[0013] 音樂節(jié)拍的人感知涉及推斷來自音樂強(qiáng)音(即重音)的時(shí)刻的脈沖的有規(guī)律的模 式。重音是由音樂中的各種事件導(dǎo)致的,包含所有離散聲音事件的開始,尤其是長音高聲音 的起始,響度或音色中的突然變化,以及和聲變化。自動(dòng)音樂速度、拍子或強(qiáng)拍估計(jì)器可以 通過測量音樂音頻加重、估計(jì)潛在脈沖的時(shí)間段和階段以及選擇對應(yīng)于音樂速度或感興趣 的一些其它韻律水平的水平,來試圖模仿音樂節(jié)拍的人感知。因?yàn)橹匾襞c音樂中的事件有 關(guān),因此基于重音的音頻分析指的是音樂中的事件和/或變化的檢測。此類變化可以與信 號(hào)的響度、頻譜和/或音高內(nèi)容中的變化有關(guān)。作為示例,基于重音的分析可以有關(guān)于檢測 來自信號(hào)的頻譜變化、計(jì)算來自該信號(hào)的新奇度或起始檢測函數(shù)、檢測來自該信號(hào)的離散 起始或檢測該信號(hào)的音高和/或和聲內(nèi)容中的變化,例如使用色度特征。當(dāng)執(zhí)行頻譜變化 檢測時(shí),可以使用各種變換或?yàn)V波器組分解,諸如快速傅里葉變換或多速率濾波器組,或甚 至基本頻率f〇或音高顯著估計(jì)器。作為簡單示例,可以通過計(jì)算在信號(hào)上的短幀中的一組 頻帶上的信號(hào)的短時(shí)能量,以及接著計(jì)算每兩個(gè)相鄰幀之間的差,諸如歐式距離,來執(zhí)行重 音檢測。為了增加針對各種音樂類型的魯棒性,已經(jīng)開發(fā)了許多不同重音信號(hào)分析方法。
[0014] 下文中將描述的系統(tǒng)和方法利用在以下出版物中描述的背景知識(shí),通過引用將以 下出版物并入本文。
【權(quán)利要求】
1. 裝置,包括: 拍子跟蹤模塊,其用于識(shí)別音頻信號(hào)中的拍子時(shí)刻(ti); 和弦變化估計(jì)模塊,其用于從在所述拍子時(shí)刻(ti)或在所述拍子時(shí)刻(ti)之間的所述 音頻信號(hào)確定至少一個(gè)和弦變化似然; 基于第一重音的估計(jì)模塊,其用于從在所述拍子時(shí)刻(ti)或在所述拍子時(shí)刻(ti)之間 的所述音頻信號(hào)確定至少一個(gè)基于第一重音的強(qiáng)拍似然;以及 強(qiáng)拍識(shí)別器,其用于使用在所述拍子時(shí)刻(ti)或在所述拍子時(shí)刻(ti)之間的所確定的 和弦變化似然和所述基于第一重音的強(qiáng)拍似然來識(shí)別在拍子時(shí)刻(ti)出現(xiàn)的強(qiáng)拍。
2. 根據(jù)權(quán)利要求1所述的裝置,其中所述強(qiáng)拍識(shí)別器被配置為使用預(yù)定義的基于分?jǐn)?shù) 的算法,該預(yù)定義的基于分?jǐn)?shù)的算法采用在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間 的所確定的和弦變化似然和所述基于第一重音的強(qiáng)拍似然的數(shù)值表示作為輸入。
3. 根據(jù)權(quán)利要求1所述的裝置,其中所述強(qiáng)拍識(shí)別器被配置為使用基于判決的邏輯電 路,該基于判決的邏輯電路采用在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所確定 的和弦變化似然和所述基于第一重音的強(qiáng)拍似然的數(shù)值表示作為輸入。
4. 根據(jù)任何前述權(quán)利要求所述的裝置,其中所述拍子跟蹤模塊被配置為從所述音頻信 號(hào)提取重音特征以生成重音信號(hào),從所述重音信號(hào)來估計(jì)所述音頻信號(hào)的音樂速度以及從 所述音樂速度和所述重音信號(hào)來估計(jì)所述拍子時(shí)刻(t)。
5. 根據(jù)權(quán)利要求4所述的裝置,其中所述拍子跟蹤模塊被配置為:借助于基于基本頻 率(&)的顯著性分析提取色度重音特征,來生成所述重音信號(hào)。
6. 根據(jù)權(quán)利要求4所述的裝置,其中所述拍子跟蹤模塊被配置為:借助于所述音頻信 號(hào)的多速率濾波器組類型分解,來生成所述重音信號(hào)。
7. 根據(jù)權(quán)利要求2所述的裝置,其中所述拍子跟蹤模塊被配置為:借助于基于基本頻 率顯著性分析提取色度重音特征結(jié)合所述音頻信號(hào)的多速率濾波器組類型分解,生成所述 重音信號(hào)。
8. 根據(jù)任何前述權(quán)利要求所述的裝置,其中所述和弦變化估計(jì)模塊使用預(yù)定義的算 法,該預(yù)定義的算法采用在當(dāng)前拍子時(shí)刻(tj或在當(dāng)前拍子時(shí)刻(tj之間的音高色度的值 以及在之前的和/或隨后拍子時(shí)刻或在之前的和/或隨后拍子時(shí)刻之間的音高色度的一個(gè) 或多個(gè)值作為輸入。
9. 根據(jù)權(quán)利要求8所述的裝置,其中所述預(yù)定義的算法采用在所述當(dāng)前拍子時(shí)刻(tj 或在所述當(dāng)前拍子時(shí)刻Ui)之間以及在預(yù)定數(shù)目的在前和隨后拍子時(shí)刻或在預(yù)定數(shù)目的 在前和隨后拍子時(shí)刻之間的音高色度的值作為輸入,以使用差的和或相似性計(jì)算來生成和 弦變化似然。
10. 根據(jù)權(quán)利要求8或權(quán)利要求9所述的裝置,其中所述預(yù)定義的算法采用在當(dāng)前的以 及在前和/或隨后的拍子時(shí)刻或在當(dāng)前的以及在前和/或隨后的拍子時(shí)刻之間的平均音高 色度的值作為輸入。
11. 根據(jù)權(quán)利要求10所述的裝置,其中所述預(yù)定義的算法被定義成:
其中X是色度或音級(jí)的數(shù)目,y是在前拍子時(shí)刻的數(shù)目以及Z是隨后拍子時(shí)刻的數(shù)目。
12. 根據(jù)權(quán)利要求8至11中的任何一項(xiàng)所述的裝置,其中所述和弦變化估計(jì)模塊被配 置為:借助于基于基本頻率(&)的顯著性分析提取色度特征來計(jì)算所述音高色度或平均音 高色度。
13. 根據(jù)任何前述權(quán)利要求所述的裝置,所述裝置還包括:基于第二重音的估計(jì)模塊, 其用于從在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所述音頻信號(hào)確定基于第二, 不同的,重音的強(qiáng)拍似然,以及其中所述強(qiáng)拍識(shí)別器還被配置為采用所述基于第二重音的 強(qiáng)拍似然作為至所述基于分?jǐn)?shù)的算法的輸入。
14. 根據(jù)權(quán)利要求13所述的裝置,其中基于重音的估計(jì)模塊中的一個(gè)基于重音的估計(jì) 模塊被配置為將從針對所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所述音頻信號(hào)提 取色度重音特征應(yīng)用于預(yù)定義的似然算法或變換,使用基本頻率(f〇)的顯著性分析來提取 所述色度重音特征。
15. 根據(jù)權(quán)利要求14所述的裝置,其中所述基于重音的估計(jì)模塊中的另一個(gè)基于重音 的估計(jì)模塊被配置為將從所述音頻信號(hào)的多個(gè)子帶中的每個(gè)子帶提取的重音特征應(yīng)用于 預(yù)定義的似然算法或變換。
16. 根據(jù)權(quán)利要求14或權(quán)利要求15所述的裝置,其中所述重音估計(jì)模塊或每個(gè)重音估 計(jì)模塊被配置為在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間將所述重音特征應(yīng)用于 線性判別分析(LDA)變換,以獲得各自的基于重音的數(shù)字似然。
17. 根據(jù)任何前述權(quán)利要求所述的裝置,所述裝置還包括:用于在輸入到所述強(qiáng)拍識(shí) 別器之前正規(guī)化和弦變化似然以及所述基于重音的強(qiáng)拍似然或每個(gè)基于重音的強(qiáng)拍似然 的值的構(gòu)件。
18. 根據(jù)權(quán)利要求17所述的裝置,其中所述正規(guī)化構(gòu)件被配置為使用值的最大絕對值 除這些值中的每個(gè)值。
19. 根據(jù)任何前述權(quán)利要求所述的裝置,其中所述強(qiáng)拍識(shí)別器被配置為:針對一組拍 子時(shí)刻中的每個(gè)時(shí)刻,生成表示或包含所述和弦變化似然值和所述基于重音的強(qiáng)拍似然或 每個(gè)基于重音的強(qiáng)拍似然的和的分?jǐn)?shù),以及從在所述一組拍子時(shí)刻上的最高的生成的似然 值來識(shí)別強(qiáng)拍。
20. 根據(jù)權(quán)利要求19所述的裝置,其中所述強(qiáng)拍識(shí)別器應(yīng)用以下算法:
s(tn)是拍子時(shí)亥Ij tn,tn+M,tn+2M,· · ·,的集合,M是小節(jié)中的拍子的數(shù)目,以及wc,Wa和Wm 分別是針對所述和弦變化概率、基于第一重音的強(qiáng)拍似然和基于第二重音的強(qiáng)拍似然的權(quán) 重。
21. 根據(jù)任何前述權(quán)利要求所述的裝置,所述裝置包括: 用于接收多個(gè)視頻片段的構(gòu)件,每個(gè)視頻片段具有各自的具有共同內(nèi)容的音頻信號(hào); 以及 視頻編輯模塊,其用于使用所識(shí)別的強(qiáng)拍來識(shí)別針對所述視頻片段的可能的編輯點(diǎn)。
22. 根據(jù)權(quán)利要求21所述的裝置,其中所述視頻編輯模塊還被配置為:在一個(gè)或多個(gè) 編輯點(diǎn)加入多個(gè)視頻片段以生成加入的視頻片段。
23. 用于處理音頻信號(hào)的裝置,所述裝置包括: 拍子跟蹤模塊,其用于識(shí)別所述音頻信號(hào)中的拍子時(shí)刻(h); 和弦變化估計(jì)模塊,其用于從在所述拍子時(shí)刻(h)或在所述拍子時(shí)刻(tj之間的所述 音頻信號(hào)中的色度重音信息確定至少一個(gè)和弦變化似然; 基于第一重音和第二重音的估計(jì)模塊,其用于使用各自不同的算法從在所述拍子時(shí)刻 (tj或在所述拍子時(shí)刻(tj之間的所述音頻信號(hào)確定各自的基于第一重音和第二重音的 強(qiáng)拍似然值;以及 強(qiáng)拍識(shí)別器,其用于使用在所述拍子時(shí)刻(t)或在所述拍子時(shí)刻(tj之間的和弦變化 似然的數(shù)值表示和所述基于第一重音和第二重音的強(qiáng)拍似然值來識(shí)別在拍子時(shí)刻(h)出 現(xiàn)的強(qiáng)拍。
24. -種方法,包括: 識(shí)別音頻信號(hào)中的拍子時(shí)刻(tj ; 從在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所述音頻信號(hào)確定至少一個(gè)和 弦變化似然; 從在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所述音頻信號(hào)確定至少一個(gè)基 于第一重音的強(qiáng)拍似然;以及 使用在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所述和弦變化似然和所述基 于第一重音的強(qiáng)拍似然來識(shí)別在拍子時(shí)刻(tj出現(xiàn)的強(qiáng)拍。
25. 根據(jù)權(quán)利要求24所述的方法,其中識(shí)別強(qiáng)拍使用預(yù)定義的基于分?jǐn)?shù)的算法,該預(yù) 定義的基于分?jǐn)?shù)的算法采用在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所確定的 和弦變化似然和所述基于第一重音的強(qiáng)拍似然的數(shù)值表示作為輸入。
26. 根據(jù)權(quán)利要求24所述的方法,其中識(shí)別強(qiáng)拍使用基于判決的邏輯,該基于判決的 邏輯采用在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所確定的和弦變化似然和所 述基于第一重音的強(qiáng)拍似然的數(shù)值表示作為輸入。
27. 根據(jù)權(quán)利要求24至26中的任何一項(xiàng)所述的方法,其中識(shí)別拍子時(shí)刻(tj包括:從 所述音頻信號(hào)提取重音特征以生成重音信號(hào),從所述重音信號(hào)來估計(jì)所述音頻信號(hào)的音樂 速度以及從所述音樂速度和所述重音信號(hào)來估計(jì)所述拍子時(shí)刻(tj。
28. 根據(jù)權(quán)利要求27所述的方法,包括:借助于基于基本頻率(&)的顯著性分析提取 色度重音特征來生成所述重音信號(hào)。
29. 根據(jù)權(quán)利要求28所述的方法,包括:借助于所述音頻信號(hào)的多速率濾波器組類型 分解,來生成所述重音信號(hào)。
30. 根據(jù)權(quán)利要求28或權(quán)利要求29所述的方法,包括:借助于基于基本頻率顯著性分 析提取色度重音特征結(jié)合所述音頻信號(hào)的多速率濾波器組類型分解,生成所述重音信號(hào)。
31. 根據(jù)權(quán)利要求24至30中的任何一項(xiàng)所述的方法,其中確定和弦變化似然使用預(yù)定 義的算法,該預(yù)定義的算法采用在當(dāng)前拍子時(shí)刻(tj或在當(dāng)前拍子時(shí)刻(tj之間的音高色 度的值以及在之前的和/或隨后拍子時(shí)刻U i)或在之前的和/或隨后拍子時(shí)刻Ui)之間 的音高色度的一個(gè)或多個(gè)值作為輸入。
32. 根據(jù)權(quán)利要求31所述的方法,其中所述預(yù)定義的算法采用在當(dāng)前拍子時(shí)刻(h)或 在當(dāng)前拍子時(shí)刻Ui)之間以及在預(yù)定數(shù)目的在前和隨后拍子時(shí)刻或在預(yù)定數(shù)目的在前和 隨后拍子時(shí)刻之間的音高色度的值作為輸入,以使用差的和或相似性計(jì)算來生成和弦變化 似然。
33. 根據(jù)權(quán)利要求31或權(quán)利要求32所述的方法,其中所述預(yù)定義的算法采用在當(dāng)前的 以及在前和/或隨后的拍子時(shí)刻或在當(dāng)前的以及在前和/或隨后的拍子時(shí)刻之間的平均音 高色度的值作為輸入。
34. 根據(jù)權(quán)利要求33所述的方法,其中所述預(yù)定義的算法被定義成:
其中X是色度或音級(jí)的數(shù)目,y是在前拍子時(shí)刻的數(shù)目以及z是隨后拍子時(shí)刻的數(shù)目。
35. 根據(jù)權(quán)利要求31至34中的任何一項(xiàng)所述的方法,其中確定和弦變化似然借助于基 于基本頻率(4)的顯著性分析提取色度特征來計(jì)算所述音高色度或平均音高色度。
36. 根據(jù)權(quán)利要求24至35中的任何一項(xiàng)所述的方法,還包括:從在所述拍子時(shí)刻(tj 或在所述拍子時(shí)刻(tj之間的所述音頻信號(hào)確定的基于第二,不同的,重音的強(qiáng)拍似然,以 及其中識(shí)別強(qiáng)拍還包括采用所述基于第二重音的強(qiáng)拍似然作為至所述基于分?jǐn)?shù)的算法的 輸入。
37. 根據(jù)權(quán)利要求36所述的方法,其中確定所述基于重音的強(qiáng)拍似然中的一個(gè)基于重 音的強(qiáng)拍似然包括:將從針對所述拍子時(shí)刻(h)或在所述拍子時(shí)刻(tj之間的所述音頻信 號(hào)提取色度重音特征應(yīng)用于預(yù)定義的似然算法或變換,使用基本頻率(f〇)的顯著性分析來 提取所述色度重音特征。
38. 根據(jù)權(quán)利要求37所述的方法,其中確定所述基于重音的強(qiáng)拍似然中的另一個(gè)基于 重音的強(qiáng)拍似然包括:將從所述音頻信號(hào)的多個(gè)子帶中的每個(gè)子帶提取的重音特征應(yīng)用于 預(yù)定義的似然算法或變換。
39. 根據(jù)權(quán)利要求37或權(quán)利要求38所述的方法,其中確定所述基于重音的強(qiáng)拍似然包 括:在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間將所述重音特征應(yīng)用于線性判別分析 (LDA)變換,以獲得各自的基于重音的數(shù)字似然。
40. 根據(jù)權(quán)利要求24至39中的任何一項(xiàng)所述的方法,還包括:在識(shí)別強(qiáng)拍之前正規(guī)化 和弦變化似然以及所述基于重音的強(qiáng)拍似然或每個(gè)基于重音的強(qiáng)拍似然的值。
41. 根據(jù)權(quán)利要求40所述的方法,其中所述正規(guī)化步驟包括:使用值的最大絕對值除 這些值中的每個(gè)值。
42. 根據(jù)權(quán)利要求24至41中的任何一項(xiàng)所述的方法,其中識(shí)別強(qiáng)拍包括:針對一組拍 子時(shí)刻中的每個(gè)時(shí)刻,生成表示或包含所述和弦變化似然值和所述基于重音的強(qiáng)拍似然或 每個(gè)基于重音的強(qiáng)拍似然的和的分?jǐn)?shù),以及從在所述一組拍子時(shí)刻上的最高的生成的似然 值來識(shí)別強(qiáng)拍。
43. 根據(jù)權(quán)利要求42所述的方法,其中識(shí)別強(qiáng)拍使用以下算法:
其中S(tn)是拍子時(shí)刻tn,tn+M,tn+2M,...,的集合,M是小節(jié)中的拍子的數(shù)目,以及WyW a 和wm分別是針對所述和弦變化概率、基于第一重音的強(qiáng)拍似然和基于第二重音的強(qiáng)拍似然 的權(quán)重。
44. 一種處理視頻片段的方法,所述方法包括: 接收多個(gè)視頻片段,每個(gè)視頻片段具有各自的具有共同內(nèi)容的音頻信號(hào); 執(zhí)行根據(jù)權(quán)利要求20至35中的任何一項(xiàng)所述的方法以識(shí)別強(qiáng)拍;以及 使用所識(shí)別的強(qiáng)拍來識(shí)別針對所述視頻片段的編輯點(diǎn)。
45. 根據(jù)權(quán)利要求44所述的方法,還包括:在所述編輯點(diǎn)處加入多個(gè)視頻片段以生成 加入的視頻片段。
46. 一種方法,包括: 識(shí)別音頻信號(hào)中的拍子時(shí)刻(tj ; 從在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所述音頻信號(hào)中的色度重音信 息確定至少一個(gè)和弦變化似然; 使用各自不同的算法從在所述拍子時(shí)刻(h)的所述音頻信號(hào)確定各自的基于第一重 音和第二重音的強(qiáng)拍似然值;以及 使用在所述拍子時(shí)刻(h)或在所述拍子時(shí)刻(tj之間的和弦變化似然的數(shù)值表示和 所述基于第一重音和第二重音的強(qiáng)拍似然值來識(shí)別在拍子時(shí)刻(tj出現(xiàn)的強(qiáng)拍。
47. -種包括指令的計(jì)算機(jī)程序,當(dāng)由計(jì)算機(jī)裝置運(yùn)行該指令時(shí),該指令控制所述計(jì)算 機(jī)裝置執(zhí)行權(quán)利要求24至46中的任何一項(xiàng)所述的方法。
48. -種非短暫性的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該非短暫性的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)具有存 儲(chǔ)在其上的計(jì)算機(jī)可讀代碼,當(dāng)由計(jì)算裝置運(yùn)行該計(jì)算機(jī)可讀代碼時(shí),該計(jì)算機(jī)可讀代碼 使得所述計(jì)算裝置執(zhí)行一種方法,所述方法包括: 識(shí)別音頻信號(hào)中的拍子時(shí)刻(ti); 從在所述拍子時(shí)刻(ti)或在所述拍子時(shí)刻(ti)之間的所述音頻信號(hào)確定至少一個(gè)和 弦變化似然; 從在所述拍子時(shí)刻(ti)或在所述拍子時(shí)刻(ti)之間的所述音頻信號(hào)確定至少一個(gè)基 于第一重音的強(qiáng)拍似然;以及 使用在所述拍子時(shí)刻(ti)或在所述拍子時(shí)刻(ti)之間的和弦變化似然和所述基于第 一重音的強(qiáng)拍似然的數(shù)值表示來識(shí)別在拍子時(shí)刻(ti)出現(xiàn)的強(qiáng)拍。
49. 裝置,所述裝置具有至少一個(gè)處理器以及至少一個(gè)存儲(chǔ)器,所述至少一個(gè)存儲(chǔ)器具 有存儲(chǔ)在其上的計(jì)算機(jī)可讀代碼,當(dāng)運(yùn)行所述計(jì)算機(jī)可讀代碼時(shí),所述計(jì)算機(jī)可讀代碼控 制所述至少一個(gè)處理器: 識(shí)別音頻信號(hào)中的拍子時(shí)刻(tj ; 從在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所述音頻信號(hào)確定至少一個(gè)和 弦變化似然; 從在所述拍子時(shí)刻(tj或在所述拍子時(shí)刻(tj之間的所述音頻信號(hào)確定至少一個(gè)基 于第一重音的強(qiáng)拍似然;以及 使用在所述拍子時(shí)刻(h)或在所述拍子時(shí)刻(tj之間的和弦變化似然和所述基于第 一重音的強(qiáng)拍似然的數(shù)值表示來識(shí)別在拍子時(shí)刻(h)出現(xiàn)的強(qiáng)拍。
【文檔編號(hào)】G10H1/40GK104395953SQ201280074293
【公開日】2015年3月4日 申請日期:2012年4月30日 優(yōu)先權(quán)日:2012年4月30日
【發(fā)明者】A·J·埃羅寧 申請人:諾基亞公司