專利名稱:信息處理設(shè)備、聲音分析方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息處理設(shè)備、聲音分析方法和程序。
背景技術(shù):
近年來(lái),已經(jīng)開(kāi)發(fā)了用于分析以所演奏樂(lè)曲的聲音來(lái)記錄的音頻信號(hào)以及檢測(cè)該 樂(lè)曲的拍子位置、和弦進(jìn)行、小節(jié)線進(jìn)行等的技術(shù)。 例如,日本專利文獻(xiàn)JP-A-2008-102405公開(kāi)了一種信號(hào)處理設(shè)備,其從音頻信號(hào) 中檢測(cè)樂(lè)曲中所包括的拍子的位置,針對(duì)所檢測(cè)到的拍子位置中的每個(gè)拍子位置來(lái)提取用 于和弦辨別的特征量(FQ),并且之后基于所提取出的特征量來(lái)辨別各個(gè)拍子位置處的和弦 的類型。
發(fā)明內(nèi)容
然而,所演奏樂(lè)曲的實(shí)際速度不僅包括樂(lè)譜上出現(xiàn)的速度波動(dòng),還包括樂(lè)譜上未 出現(xiàn)的、由于演奏者或指揮者的編排而引起的速度波動(dòng)。在這樣的情況中,利用相關(guān)領(lǐng)域 的樂(lè)曲分析技術(shù),很難在反映了速度波動(dòng)的情況下精確地檢測(cè)到拍子位置或拍子類型(例 如,節(jié)拍、拍子的拍數(shù)等)。 鑒于以上所述,希望提供能夠提高對(duì)音頻信號(hào)中所包括的拍子的位置或拍子的類
型的檢測(cè)的精度的新穎的和改進(jìn)的信息處理設(shè)備、聲音分析方法和程序。 根據(jù)本發(fā)明一個(gè)實(shí)施例,提供了一種信息處理設(shè)備,其包括用于檢測(cè)音頻信號(hào)中
所包括的拍子的位置的拍子分析單元;用于計(jì)算類似概率的結(jié)構(gòu)分析單元,每個(gè)類似概率
是用由拍子分析單元所檢測(cè)到的各個(gè)拍子位置劃分出的拍子區(qū)間的聲音內(nèi)容之間相類似
的概率;以及小節(jié)線檢測(cè)單元,用于基于根據(jù)由所述結(jié)構(gòu)分析單元所計(jì)算出的類似概率而
確定的小節(jié)線概率來(lái)確定所述音頻信號(hào)的有可能的小節(jié)線進(jìn)行,所述小節(jié)線概率指示各個(gè)
拍子對(duì)應(yīng)于哪種節(jié)拍中的哪個(gè)拍數(shù)。 該結(jié)構(gòu)分析單元可以包括用于通過(guò)使用各個(gè)拍子區(qū)間的各個(gè)音調(diào)的平均能量來(lái) 計(jì)算特定特征量的特征量計(jì)算單元;用于針對(duì)拍子區(qū)間來(lái)計(jì)算由特征量計(jì)算單元所計(jì)算出 的特征量之間的相關(guān)性的相關(guān)性計(jì)算單元;以及根據(jù)由所述相關(guān)性計(jì)算單元所計(jì)算出的相 關(guān)性來(lái)生成所述類似概率的類似概率生成單元。 該小節(jié)線檢測(cè)單元可以包括用于基于從音頻信號(hào)提取出的特定特征量來(lái)計(jì)算小 節(jié)線概率的小節(jié)線概率計(jì)算單元;用于根據(jù)類似概率來(lái)校正由小節(jié)線概率計(jì)算單元計(jì)算出 的小節(jié)線概率的小節(jié)線概率校正單元;以及用于基于由小節(jié)線概率校正單元校正后的小節(jié) 線概率來(lái)確定音頻信號(hào)的有可能的小節(jié)線進(jìn)行的小節(jié)線確定單元。 特征量計(jì)算單元可以通過(guò)在多個(gè)八度音階中對(duì)具有相同名稱的音符的值求加權(quán) 和來(lái)計(jì)算特征量,這些值被包括在各個(gè)音調(diào)的平均能量中。 相關(guān)性計(jì)算單元可以通過(guò)使用這些特征量來(lái)計(jì)算拍子區(qū)間之間的相關(guān)性,每個(gè)特 征量是針對(duì)所關(guān)注的拍子區(qū)間以及所關(guān)注的拍子區(qū)間周?chē)粋€(gè)或多個(gè)拍子區(qū)間的。
小節(jié)線概率計(jì)算單元可以基于根據(jù)各個(gè)拍子區(qū)間的和弦類型或基調(diào)類型而不同 的第一特征量和根據(jù)拍子概率而不同的第二特征量來(lái)計(jì)算小節(jié)線概率,拍子概率指示拍子 被包括在音頻信號(hào)的各個(gè)特定時(shí)間單位中的概率。 小節(jié)線確定單元可以通過(guò)以下方式來(lái)確定有可能的小節(jié)線進(jìn)行從通過(guò)在以按時(shí) 間順序布置的拍子以及各個(gè)拍子的節(jié)拍和拍數(shù)所指定的節(jié)點(diǎn)中順次選擇節(jié)點(diǎn)而形成的路 徑中,搜索使根據(jù)小節(jié)線概率而不同的評(píng)估值變成最優(yōu)的路徑。 小節(jié)線檢測(cè)單元還可以包括小節(jié)線重新確定單元,該小節(jié)線重新確定單元用于在 第一節(jié)拍和第二節(jié)拍兩者都被包括在由所述小節(jié)線確定單元所確定的小節(jié)線進(jìn)行中的情 況中,從搜索的對(duì)象中排除第一節(jié)拍和第二節(jié)拍中較不經(jīng)常出現(xiàn)的節(jié)拍而重新執(zhí)行路徑搜 索。 拍子分析單元可以包括用于基于拍子概率來(lái)檢測(cè)所述音頻信號(hào)中所包括的起始 點(diǎn)的起始點(diǎn)檢測(cè)單元,每個(gè)起始點(diǎn)是聲音產(chǎn)生的時(shí)間點(diǎn),每個(gè)拍子概率指示拍子被包括在 音頻信號(hào)中的各個(gè)特定時(shí)間單位中的概率;用于針對(duì)由所述起始點(diǎn)檢測(cè)單元檢測(cè)到的各個(gè) 起始點(diǎn)來(lái)計(jì)算拍子得分的拍子得分計(jì)算單元,拍子得分指示起始點(diǎn)與具有可以設(shè)想到的拍 子間隔的拍子的對(duì)應(yīng)程度;拍子搜索單元,該拍子搜索單元用于基于由所述拍子得分計(jì)算 單元所計(jì)算出的拍子得分來(lái)搜索由示出有可能的速度波動(dòng)的起始點(diǎn)形成的最優(yōu)路徑;以及 拍子確定單元,該拍子確定單元用于確定最優(yōu)路徑上這些起始點(diǎn)的位置和根據(jù)拍子間隔所 補(bǔ)充的位置,作為拍子位置。 拍子分析單元還可以包括拍子重新搜索單元,該拍子重新搜索單元用于在由拍 子搜索單元確定的最優(yōu)路徑的速度中的波動(dòng)很小的情況中,限制搜索范圍并且重新執(zhí)行對(duì) 最優(yōu)路徑的搜索。 拍子搜索單元可以通過(guò)使用根據(jù)拍子得分而不同的評(píng)估值,來(lái)從通過(guò)沿時(shí)間軸順
次選擇以起始點(diǎn)和拍子間隔所指定的節(jié)點(diǎn)而形成的路徑中確定最優(yōu)路徑。 拍子搜索單元還可以通過(guò)使用根據(jù)過(guò)渡(transition)前后的節(jié)點(diǎn)之間速度的變
化量而不同的評(píng)估值來(lái)確定最優(yōu)路徑。 拍子搜索單元還可通過(guò)使用根據(jù)過(guò)渡前后的起始點(diǎn)之間的間隔與過(guò)渡前后的節(jié) 點(diǎn)處的拍子間隔之間的匹配程度而不同的評(píng)估值來(lái)確定最優(yōu)路徑。 拍子搜索單元還可以通過(guò)使用根據(jù)節(jié)點(diǎn)之間的過(guò)渡中所跳過(guò)的起始點(diǎn)的數(shù)目而 不同的評(píng)估值來(lái)確定最優(yōu)路徑。 拍子分析單元還可以包括速度修正單元,該速度修正單元用于根據(jù)使用通過(guò)學(xué)習(xí) 預(yù)先獲得的估計(jì)速度辨別公式而從音頻信號(hào)的波形中估計(jì)出的估計(jì)速度,對(duì)由拍子確定單 元所確定的拍子位置進(jìn)行修正。 速度修正單元可以通過(guò)針對(duì)多個(gè)乘子中的每一個(gè)乘子、使用修正后的拍子位置的 平均拍子概率和估計(jì)速度來(lái)評(píng)估修正后的速度的似然,從而確定修正拍子位置所要使用的 用于修正的乘子。 根據(jù)本發(fā)明另一實(shí)施例,提供了一種信息處理設(shè)備,其包括起始點(diǎn)檢測(cè)單元,該 起始點(diǎn)檢測(cè)單元用于基于拍子概率來(lái)檢測(cè)音頻信號(hào)中所包括的起始點(diǎn),每個(gè)起始點(diǎn)是聲音 產(chǎn)生的時(shí)間點(diǎn),每個(gè)拍子概率指示拍子被包括在音頻信號(hào)中的各個(gè)特定時(shí)間單位中的概 率;拍子得分計(jì)算單元,該拍子得分計(jì)算單元用于針對(duì)由起始點(diǎn)檢測(cè)單元檢測(cè)到的各個(gè)起始點(diǎn)來(lái)計(jì)算拍子得分,拍子得分指示起始點(diǎn)與具有可以設(shè)想到的拍子間隔的拍子的對(duì)應(yīng)程 度;拍子搜索單元,該拍子搜索單元用于基于由所述拍子得分計(jì)算單元所計(jì)算出的拍子得 分來(lái)搜索由示出有可能的速度波動(dòng)的起始點(diǎn)形成的最優(yōu)路徑;以及拍子確定單元,該拍子 確定單元用于確定所述最優(yōu)路徑上起始點(diǎn)的位置和根據(jù)所述拍子間隔所補(bǔ)充的位置,作為 拍子位置。 根據(jù)本發(fā)明的另一實(shí)施例,提供了一種聲音分析方法,其包括以下步驟檢測(cè)音頻 信號(hào)中所包括的起始點(diǎn)的位置;計(jì)算類似概率,每個(gè)類似概率是用各個(gè)所檢測(cè)到的拍子位 置劃分出的拍子區(qū)間的聲音內(nèi)容之間相類似的概率;以及基于根據(jù)所計(jì)算出的類似概率而 確定的小節(jié)線概率來(lái)確定音頻信號(hào)的有可能的小節(jié)線進(jìn)行,小節(jié)線概率指示各個(gè)拍子對(duì)應(yīng) 于哪種節(jié)拍中的哪個(gè)拍數(shù)。 根據(jù)本發(fā)明的另一實(shí)施例,提供了一種程序,該程序使得控制信息處理設(shè)備的計(jì) 算機(jī)用作拍子分析單元,該拍子分析單元用于檢測(cè)音頻信號(hào)中所包括的拍子的位置;結(jié) 構(gòu)分析單元,該結(jié)構(gòu)分析單元用于計(jì)算類似概率,每個(gè)類似概率是用由拍子分析單元所檢 測(cè)到的各個(gè)拍子位置劃分出的拍子區(qū)間的聲音內(nèi)容之間相類似的概率;以及小節(jié)線檢測(cè)單 元,該小節(jié)線檢測(cè)單元用于基于根據(jù)由結(jié)構(gòu)分析單元所計(jì)算出的類似概率而確定的小節(jié)線 概率來(lái)確定所述音頻信號(hào)的有可能的小節(jié)線進(jìn)行,小節(jié)線概率指示各個(gè)拍子對(duì)應(yīng)于哪種節(jié) 拍中的哪個(gè)拍數(shù)。 根據(jù)以上所述的本發(fā)明的實(shí)施例,可以提高對(duì)音頻信號(hào)中所包括的拍子的位置或 拍子的類型的檢測(cè)的精度。
圖1是示出根據(jù)本發(fā)明一個(gè)實(shí)施例的信息處理設(shè)備的邏輯配置的框圖; 圖2是示出對(duì)數(shù)譜的一個(gè)示例的說(shuō)明性示圖; 圖3是示出對(duì)數(shù)譜的另一示例的說(shuō)明性示圖; 圖4是用于描述拍子概率公式的學(xué)習(xí)處理的說(shuō)明性示圖; 圖5是示出通過(guò)拍子概率公式所計(jì)算出的拍子概率的一個(gè)示例的說(shuō)明性示圖; 圖6是示出拍子分析單元的詳細(xì)配置的框圖; 圖7是示出從拍子概率中檢測(cè)出的起始點(diǎn)的一個(gè)示例的說(shuō)明性示圖; 圖8是示出起始點(diǎn)檢測(cè)處理流程的一個(gè)示例的流程圖; 圖9是與拍子概率相關(guān)地示出由起始點(diǎn)檢測(cè)單元檢測(cè)到的起始點(diǎn)的位置的說(shuō)明 性示圖; 圖10是用于描述由拍子得分計(jì)算處理的說(shuō)明性示圖; 圖11是示出拍子得分計(jì)算處理流程的一個(gè)示例的流程圖; 圖12是使從拍子得分計(jì)算單元輸出的拍子得分可視化的拍子得分分布圖; 圖13是用于描述由拍子搜索單元進(jìn)行的路徑搜索的說(shuō)明性示圖; 圖14是示出速度變化得分的一個(gè)示例的說(shuō)明性示圖; 圖15是示出起始點(diǎn)移動(dòng)得分的一個(gè)示例的說(shuō)明性示圖; 圖16是示出針對(duì)跳過(guò)的懲罰的一個(gè)示例的說(shuō)明性示圖; 圖17是示出被拍子搜索單元確定為最優(yōu)路徑的路徑的一個(gè)示例的說(shuō)明性示7
圖18是示出恒定速度判定單元的判定結(jié)果的兩個(gè)示例的說(shuō)明性示圖; 圖19是用于描述由針對(duì)恒定速度的拍子重新搜索單元進(jìn)行的路徑重新搜索處理
的說(shuō)明性示圖; 圖20是用于描述由拍子確定單元進(jìn)行的拍子確定處理的說(shuō)明性示圖; 圖21是用于描述由拍子確定單元進(jìn)行的補(bǔ)充拍子設(shè)置處理的說(shuō)明性示圖; 圖22是示出為常數(shù)倍關(guān)系的速度示例的說(shuō)明性示圖; 圖23是用于描述估計(jì)速度辨別公式的學(xué)習(xí)處理的說(shuō)明性示圖; 圖24是用于描述針對(duì)各個(gè)乘子的平均拍子概率的說(shuō)明性示圖; 圖25是用于描述由速度修正單元計(jì)算出的速度似然的說(shuō)明性示圖; 圖26是示出速度修正處理流程的一個(gè)示例的流程圖; 圖27是示出結(jié)構(gòu)分析單元的詳細(xì)配置的框圖; 圖28是示出拍子、拍子區(qū)間和拍子區(qū)間特征量之間的關(guān)系的說(shuō)明性示圖; 圖29是用于描述拍子區(qū)間特征量的計(jì)算處理的第一說(shuō)明性示圖; 圖30是用于描述拍子區(qū)間特征量的計(jì)算處理的第二說(shuō)明性示圖; 圖31是用于描述相關(guān)系數(shù)計(jì)算處理的說(shuō)明性示圖; 圖32是用于描述從相關(guān)系數(shù)變換成類似概率的變換曲線的一個(gè)示例的說(shuō)明性示 圖; 圖33是使拍子區(qū)間之間的類似概率的一個(gè)示例可視化的說(shuō)明性示圖; 圖34是示出和弦概率計(jì)算單元的詳細(xì)配置的框圖; 圖35是用于描述根音特征量生成處理的第一說(shuō)明性示圖; 圖36是用于描述根音特征量生成處理的第二說(shuō)明性示圖; 圖37是用于描述和弦概率公式的學(xué)習(xí)處理的說(shuō)明性示圖; 圖38是用于描述和弦概率的計(jì)算處理的說(shuō)明性示圖; 圖39是示出由和弦概率計(jì)算單元計(jì)算出的和弦概率的一個(gè)示例的說(shuō)明性示圖; 圖40是示出基調(diào)檢測(cè)單元的詳細(xì)配置的框圖; 圖41是用于描述相對(duì)和弦概率生成處理的說(shuō)明性示圖; 圖42是用于描述各個(gè)拍子區(qū)間的和弦出現(xiàn)得分的說(shuō)明性示圖; 圖43是用于描述各個(gè)拍子區(qū)間的和弦過(guò)渡出現(xiàn)得分的說(shuō)明性示圖; 圖44是用于描述基調(diào)概率公式的學(xué)習(xí)處理的說(shuō)明性示圖; 圖45是用于描述基調(diào)概率的計(jì)算處理的說(shuō)明性示圖; 圖46是示出由基調(diào)概率計(jì)算單元計(jì)算出的基調(diào)概率的示例的說(shuō)明性示圖; 圖47是用于描述簡(jiǎn)單基調(diào)概率的計(jì)算處理的說(shuō)明性示圖; 圖48是用于描述由基調(diào)確定單元進(jìn)行的路徑搜索的說(shuō)明性示圖; 圖49是示出基調(diào)過(guò)渡概率的一個(gè)示例的說(shuō)明性示圖; 圖50是示出由基調(diào)確定單元確定的基調(diào)進(jìn)行的一個(gè)示例的說(shuō)明性示圖; 圖51是示出小節(jié)線檢測(cè)單元的詳細(xì)配置的框圖; 圖52是用于描述由第一特征量提取單元進(jìn)行的特征量提取處理的說(shuō)明性示圖; 圖53是用于描述和弦穩(wěn)定性得分的說(shuō)明性示圖; 圖54是用于描述和弦不穩(wěn)定性得分的說(shuō)明性示 圖55是用于描述相對(duì)和弦得分的生成處理的說(shuō)明性示圖; 圖56是用于描述由第二特征量提取單元進(jìn)行的特征量提取處理的說(shuō)明性示圖; 圖57是用于描述小節(jié)線概率公式的學(xué)習(xí)處理的說(shuō)明性示圖; 圖58是用于描述小節(jié)線概率的計(jì)算處理的說(shuō)明性示圖; 圖59是用于描述由小節(jié)線確定單元進(jìn)行的路徑搜索的說(shuō)明性示圖; 圖60是示出節(jié)拍變化概率的示例的說(shuō)明性示圖; 圖61是示出由小節(jié)線確定單元確定的小節(jié)線進(jìn)行的一個(gè)示例的說(shuō)明性示圖; 圖62是示出和弦進(jìn)行檢測(cè)單元的詳細(xì)配置的框圖; 圖63是用于描述擴(kuò)展拍子區(qū)間特征量的說(shuō)明性示圖; 圖64是用于描述擴(kuò)展根音特征量生成處理的說(shuō)明性示圖; 圖65是用于描述擴(kuò)展和弦概率公式的學(xué)習(xí)處理的說(shuō)明性示圖; 圖66是用于描述和弦概率的重新計(jì)算處理的說(shuō)明性示圖; 圖67是用于描述由和弦進(jìn)行確定單元進(jìn)行的路徑搜索的說(shuō)明性示圖; 圖68是示出由和弦進(jìn)行確定單元確定的和弦進(jìn)行的一個(gè)示例的說(shuō)明性示圖; 圖69是示出通用計(jì)算機(jī)的配置示例的框圖。
具體實(shí)施例方式
以下,將參考附圖來(lái)詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例。注意,在該說(shuō)明書(shū)和附圖中, 用相同的標(biāo)號(hào)來(lái)標(biāo)注具有基本相同的功能和結(jié)構(gòu)的結(jié)構(gòu)元件,并且省略對(duì)這些結(jié)構(gòu)元件的 重復(fù)說(shuō)明。 此外,將按以下順序來(lái)描述"具體實(shí)施方式
"。
1.根據(jù)一個(gè)實(shí)施例的信息處理設(shè)備的總體配置 2.根據(jù)一個(gè)實(shí)施例的信息處理設(shè)備的各個(gè)單元的描述 2-1.對(duì)數(shù)譜變換單元 2-2.拍子概率計(jì)算單元 2-3.拍子分析單元 2-4.結(jié)構(gòu)分析單元 2-5.和弦概率計(jì)算單元 2-6.基調(diào)檢測(cè)單元 2-7.小節(jié)線檢測(cè)單元 2-8.和弦進(jìn)行檢測(cè)單元 3.根據(jù)本實(shí)施例的信息處理設(shè)備的特征 4.總結(jié) 〈1.根據(jù)一個(gè)實(shí)施例的信息處理設(shè)備的總體配置〉 首先,將描述根據(jù)本發(fā)明一個(gè)實(shí)施例的信息處理設(shè)備100的總體配置。
圖1是示出根據(jù)本發(fā)明一個(gè)實(shí)施例的信息處理設(shè)備100的邏輯配置的框圖。參 考圖l,信息處理設(shè)備100包括對(duì)數(shù)譜變換單元110、拍子概率計(jì)算單元120、拍子分析單元 130、結(jié)構(gòu)分析單元150、和弦概率計(jì)算單元160、基調(diào)檢測(cè)單元170、小節(jié)線檢測(cè)單元180和 禾口弓玄進(jìn)行(chordprogression)檢測(cè)單元190。
信息處理設(shè)備100首先獲得音頻信號(hào),該音頻信號(hào)是以任意格式記錄的樂(lè)曲的聲
音。信息處理設(shè)備ioo所要處理的音頻信號(hào)的格式可以是任何壓縮格式或非壓縮格式,例
如WAV、 AIFF、 MP3或ATRAC。 信息處理設(shè)備100將音頻信號(hào)作為輸入信號(hào),并且通過(guò)圖1中所示的各個(gè)單元來(lái)
執(zhí)行處理。信息處理設(shè)備ioo對(duì)音頻信號(hào)的處理的結(jié)果例如可以包括該音頻信號(hào)中所包含
的拍子在時(shí)間軸上的位置、小節(jié)線的位置、各個(gè)拍子位置處的基調(diào)或和弦,等等。 信息處理設(shè)備100例如可以是諸如個(gè)人計(jì)算機(jī)(PC)或工作站之類的通用計(jì)算機(jī)。
并且,信息處理設(shè)備100可以是任何數(shù)字裝置,例如,移動(dòng)電話終端、移動(dòng)信息終端、游戲終
端、音樂(lè)回放裝置或電視機(jī)。此外,信息處理設(shè)備ioo可以是專用于音樂(lè)處理的裝置。 以下,將詳細(xì)描述圖1中示出的信息處理設(shè)備100的各個(gè)單元。 〈2.根據(jù)一個(gè)實(shí)施例的信息處理設(shè)備的各個(gè)單元的描述〉 (2-1.對(duì)數(shù)譜變換單元) 對(duì)數(shù)譜變換單元110將作為輸入信號(hào)的音頻信號(hào)的波形變換成以時(shí)間和音調(diào)兩 個(gè)維度表示的對(duì)數(shù)譜。JP-A-2005-275068中所公開(kāi)的方法例如可以用作將音頻信號(hào)的波形 變換成對(duì)數(shù)譜的方法。 根據(jù)JP-A-2005-275068中所公開(kāi)的方法,首先,通過(guò)頻帶劃分和下采樣將音頻信 號(hào)劃分成多個(gè)八度音階的信號(hào)。然后,通過(guò)使12個(gè)音調(diào)的頻帶通過(guò)的帶通濾波器從每個(gè)八 度音階的信號(hào)中分別提取12個(gè)音調(diào)的信號(hào)。結(jié)果,可以獲得示出多個(gè)八度音階上各自的12 個(gè)音調(diào)的音符的能量的對(duì)數(shù)譜。 圖2是示出從對(duì)數(shù)譜變換單元110輸出的對(duì)數(shù)譜的示例的說(shuō)明性示圖。
參考圖2的垂直軸,輸入音頻信號(hào)被劃分成4個(gè)八度音階,并且每個(gè)八度音階又被 劃分成12個(gè)音調(diào):"C"、"C#"、"D"、"D#"、"E"、"F"、"F#"、"G"、"G#"、"A"、"A#H"。另 一方面,圖2的水平軸示出沿時(shí)間軸對(duì)音頻信號(hào)進(jìn)行采用時(shí)的幀編號(hào)。例如,當(dāng)音頻信號(hào)被 以采樣頻率128(Hz)進(jìn)行采樣時(shí),1幀時(shí)間段對(duì)應(yīng)于1 (秒)/128 = 7. 8125 (毫秒)。
圖2中所示的時(shí)間-音調(diào)二維平面上所繪出的顏色的濃淡指示時(shí)間軸上各個(gè)位置 處各個(gè)音調(diào)的能量的強(qiáng)度。例如,在圖2中,下數(shù)第二個(gè)八度音階的第十幀處的音調(diào)C(該 圖中的S1)用黑色繪出,從而指示該音符的能量是高的,S卩,該音符被強(qiáng)有力地產(chǎn)生。
此外,從對(duì)數(shù)譜變換單元110輸出的對(duì)數(shù)譜不限于這樣的示例。圖3示出與圖2 中所示的音頻信號(hào)不同的音頻信號(hào)被劃分成8個(gè)八度音階的對(duì)數(shù)譜的示例。
(2-2.拍子概率計(jì)算單元) 拍子概率計(jì)算單元120針對(duì)從對(duì)數(shù)譜變換單元IIO輸入的對(duì)數(shù)譜的特定時(shí)間單位 中的每一個(gè)(例如,1幀),計(jì)算該時(shí)間單位中包括拍子的概率(以下,稱為"拍子概率")。 此外,當(dāng)特定時(shí)間單位為1幀時(shí),拍子概率可以被認(rèn)為是各幀與拍子位置(時(shí)間軸上拍子的 位置)相一致的概率。例如,作為采用JP-A-2008-123011中所公開(kāi)的學(xué)習(xí)算法的機(jī)器學(xué)習(xí) 的結(jié)果而獲得的拍子概率公式被用于拍子概率的計(jì)算。 根據(jù)JP-A-2008-123011中所公開(kāi)的方法,首先,向?qū)W習(xí)裝置提供一組內(nèi)容數(shù)據(jù) (例如,音頻信號(hào))和針對(duì)要從該內(nèi)容數(shù)據(jù)提取出的特征量的教師數(shù)據(jù)。接著,學(xué)習(xí)裝置通 過(guò)隨機(jī)地組合所選擇的算子(operator)來(lái)生成用于從內(nèi)容數(shù)據(jù)中計(jì)算出特征量的多個(gè)特 征量提取公式。然后,學(xué)習(xí)裝置將根據(jù)所生成的特征量提取公式計(jì)算出的特征量與輸入的
10教師數(shù)據(jù)相比較,并且評(píng)估特征量。此外,學(xué)習(xí)裝置基于特征量提取公式的評(píng)估結(jié)果來(lái)生成 下一代特征量提取公式。通過(guò)重復(fù)特征量提取公式的生成和評(píng)估的循環(huán)數(shù)次,最終可以獲 得能夠以高精度從內(nèi)容數(shù)據(jù)中提取教師數(shù)據(jù)的特征量提取公式。 通過(guò)采用這樣的學(xué)習(xí)算法,通過(guò)如圖4中所示的學(xué)習(xí)處理來(lái)獲得由拍子概率計(jì)算 單元120使用的拍子概率公式。此外,在圖4中,示出用于拍子概率的計(jì)算的時(shí)間單位是1 幀的示例。 首先,向?qū)W習(xí)算法提供從拍子位置已知的樂(lè)曲的音頻信號(hào)中變換出的對(duì)數(shù)譜的片 段(以下,稱為"局部對(duì)數(shù)譜")和作為針對(duì)每個(gè)局部對(duì)數(shù)譜的教師數(shù)據(jù)的拍子概率。這里, 考慮拍子概率的計(jì)算和處理代價(jià)之間的權(quán)衡來(lái)確定局部對(duì)數(shù)譜的窗寬度。例如,局部對(duì)數(shù) 譜的窗寬度可以包括要計(jì)算拍子概率的幀之前的7幀和之后的7幀(S卩,總共15幀)。
此外,作為教師數(shù)據(jù)的拍子概率例如是基于已知的拍子位置并且通過(guò)使用真值 (1)或假值(0)來(lái)指示拍子是否被包括在各個(gè)局部對(duì)數(shù)譜的中心幀中的數(shù)據(jù)。這里沒(méi)有考 慮小節(jié)的位置,并且當(dāng)中心幀與拍子位置相對(duì)應(yīng)時(shí),拍子概率為1 ;而當(dāng)中心幀與拍子位置 不對(duì)應(yīng)時(shí),拍子概率為0。在圖4中所示的示例中,局部對(duì)數(shù)譜Wa,Wb,Wc,. . . ,Wn的拍子概 率分別被給出為l,O,l,... ,0。 用于從局部對(duì)數(shù)譜計(jì)算出拍子概率的拍子概率公式(P(W))是預(yù)先基于如上所述 的多組輸入數(shù)據(jù)和教師數(shù)據(jù),通過(guò)上述學(xué)習(xí)算法獲得的。 然后,拍子概率計(jì)算單元120針對(duì)輸入對(duì)數(shù)譜的幀中的每個(gè)幀,截取具有越過(guò)該 幀的前后幾幀的窗寬度的局部對(duì)數(shù)譜,并且通過(guò)應(yīng)用作為學(xué)習(xí)的結(jié)果而獲得的拍子概率公 式,每次一個(gè)局部對(duì)數(shù)譜地計(jì)算多個(gè)局部對(duì)數(shù)譜中的每一個(gè)的拍子概率。
圖5是示出拍子概率計(jì)算單元120所計(jì)算出的拍子概率的示例的說(shuō)明性示圖。
參考圖5,首先,在圖5的上部示出從對(duì)數(shù)譜變換單元IIO輸入拍子概率計(jì)算單元 120的對(duì)數(shù)譜的示例。并且,在圖5的下部,還利用時(shí)間軸上的折線示出由拍子概率計(jì)算單 元120從上部中所示出的對(duì)數(shù)譜中計(jì)算出的拍子概率。例如,在幀位置Fl處,局部對(duì)數(shù)譜 Wl被從該對(duì)數(shù)譜截取,并且通過(guò)拍子概率公式計(jì)算出拍子概率為0. 95。另一方面,在幀位 置F2處,局部對(duì)數(shù)譜W2被從該對(duì)數(shù)譜截取,并且通過(guò)拍子概率公式計(jì)算出拍子概率為0. 1。 即,可以理解,幀位置Fl與拍子位置對(duì)應(yīng)的可能性高并且?guī)恢肍2與拍子位置對(duì)應(yīng)的可能 性低。 由拍子概率計(jì)算單元120以這種方式計(jì)算出的各幀的拍子概率輸出到稍后描述 的拍子分析單元130和小節(jié)線檢測(cè)單元180。 此外,可以通過(guò)另一學(xué)習(xí)算法來(lái)習(xí)得由拍子概率計(jì)算單元120使用的拍子概率公 式。然而,應(yīng)當(dāng)注意,一般,對(duì)數(shù)譜包括各種參數(shù),例如,鼓譜、由于說(shuō)話引起的譜的發(fā)生和由 于和弦的變化引起的譜中的變化。在鼓譜的情況中,打鼓的時(shí)間點(diǎn)很有可能就是拍子位置。 另一方面,在語(yǔ)音譜的情況中,說(shuō)話的開(kāi)始時(shí)間點(diǎn)很有可能是拍子位置。為了通過(guò)總體使用 各種參數(shù)來(lái)高精度地計(jì)算拍子概率,適于使用JP-A-2008-123011中所公開(kāi)的學(xué)習(xí)算法。
(2-3.拍子分析單元) 拍子分析單元130基于從拍子概率計(jì)算單元120輸入的拍子概率來(lái)確定音頻信號(hào) 中所包括的拍子在時(shí)間軸上的位置。 圖6是示出拍子分析單元130的詳細(xì)配置的框圖。參考圖6,拍子分析單元130包括起始點(diǎn)檢測(cè)單元132、拍子得分計(jì)算單元134、拍子搜索單元136、恒定速度判定單元138、 針對(duì)恒定速度的拍子重新搜索單元140、拍子確定單元142和速度修正單元144。
(2-3-1.起始點(diǎn)檢測(cè)單元) 起始點(diǎn)檢測(cè)單元132基于從拍子概率計(jì)算單元120輸入的、利用圖5描述的拍子 概率,檢測(cè)音頻信號(hào)中所包括的起始點(diǎn)。在該說(shuō)明書(shū)中,起始點(diǎn)是音頻信號(hào)中產(chǎn)生聲音的時(shí) 間點(diǎn),并且更具體而言,起始點(diǎn)被視為拍子概率在特定閾值以上并且取得極大值的點(diǎn)。
圖7是示出從針對(duì)音頻信號(hào)計(jì)算出的拍子概率中檢測(cè)出的起始點(diǎn)的示例的說(shuō)明 性示圖。 在圖7中,和圖5的下部一樣,在時(shí)間軸上利用折線示出了由拍子概率計(jì)算單元 120計(jì)算出的拍子概率。利用該拍子概率,取得極大值的點(diǎn)有3個(gè)點(diǎn),S卩,幀F(xiàn)3、 F4和F5。 在這些幀中,關(guān)于幀F(xiàn)3和F5,這些時(shí)間點(diǎn)的拍子概率在預(yù)先給出的特定閾值Thl以上。另 一方面,幀F(xiàn)4在這時(shí)間點(diǎn)的拍子概率在閾值Thl以下。在該情況中,檢測(cè)到兩個(gè)點(diǎn),即幀F(xiàn)3 和F5,作為起始點(diǎn)。 圖8是示出起始點(diǎn)檢測(cè)單元132的起始點(diǎn)檢測(cè)處理流程的示例的流程圖。
參考圖8,首先,起始點(diǎn)檢測(cè)單元132關(guān)于針對(duì)各幀計(jì)算出的拍子概率,從第一幀 開(kāi)始,針對(duì)這些幀順次執(zhí)行循環(huán)(S1322)。然后,起始點(diǎn)檢測(cè)單元132關(guān)于各幀判定拍子概 率是否在特定閾值以(S1324),以及拍子概率是否指示極大值(S1326)。這里,當(dāng)拍子概率 在特定閾值以上并且拍子概率指示極大值時(shí),處理進(jìn)行到S1328。另一方面,當(dāng)拍子概率不 在特定閾值以上或者拍子概率沒(méi)有指示極大值時(shí),跳過(guò)S1328的處理。在S1328,向起始點(diǎn) 位置的列表添加當(dāng)前時(shí)間(或幀編號(hào))(S1328)。然后,當(dāng)關(guān)于所有幀的處理結(jié)束時(shí),循環(huán)終 止(S1330)。 利用如上所述的起始點(diǎn)檢測(cè)單元132的起始點(diǎn)檢測(cè)處理,輸出音頻信號(hào)中所包括 的起始點(diǎn)的位置的列表,即,各個(gè)起始點(diǎn)的時(shí)間或幀編號(hào)的列表。 圖9是與拍子概率相關(guān)地示出由起始點(diǎn)檢測(cè)單元132檢測(cè)到的起始點(diǎn)的位置的說(shuō) 明性示圖。 在圖9中,在示出拍子概率的折線上方利用圓環(huán)示出由起始點(diǎn)檢測(cè)單元132檢測(cè) 到的起始點(diǎn)的位置。可以理解,檢測(cè)到了 15個(gè)指示具有在閾值Thl以上的拍子概率的極大 值的起始點(diǎn)。由起始點(diǎn)檢測(cè)單元132檢測(cè)到的起始點(diǎn)的位置的列表輸出給接下來(lái)所描述的 拍子得分計(jì)算單元134。
(2-3-2.拍子得分計(jì)算單元) 拍子得分計(jì)算單元134針對(duì)由起始點(diǎn)檢測(cè)單元132檢測(cè)到的各個(gè)起始點(diǎn)計(jì)算拍子 得分,拍子得分指示與形成具有恒定速度(或恒定拍子間隔)的一串拍子的多個(gè)拍子當(dāng)中 的拍子的一致程度。 圖10是用于描述由拍子得分計(jì)算單元134進(jìn)行的拍子得分計(jì)算處理的說(shuō)明性示 圖。 參考圖IO,在由起始點(diǎn)檢測(cè)單元132檢測(cè)到的起始點(diǎn)中,幀位置Fk(幀編號(hào)k)處 的起始點(diǎn)被設(shè)為所關(guān)注的起始點(diǎn)。此外,示出距離幀位置Fk特定距離d的整數(shù)倍的一連串 幀位置Fk—3、 Fk—2、 Fk—p Fk、 Fk+1、 Fk+2和Fk+3。在該說(shuō)明書(shū)中,該特定距離d被稱為轉(zhuǎn)移量,并且 距離轉(zhuǎn)移量d的整數(shù)倍的幀位置被稱為轉(zhuǎn)移位置。已經(jīng)計(jì)算了拍子概率的幀的群組F中所包括的所有轉(zhuǎn)移位置(...Fk—3, Fk—2, Fk—p Fk, Fk+1, Fk+2和Fk+3...)處的拍子概率的加和將是所 關(guān)注的起始點(diǎn)的拍子得分。即,當(dāng)幀位置Fi處的拍子概率是P(Fi)時(shí),由下式表示依賴于幀 編號(hào)k和轉(zhuǎn)移量d的、所關(guān)注的起始點(diǎn)的拍子得分BS(k, d)。
[等式l] M(/:,"hZ尸(i^J,(i^,巧 (1) 通過(guò)等式1計(jì)算出來(lái)的拍子得分BS(k,d)可以說(shuō)是指示音頻信號(hào)的第k幀處的起 始點(diǎn)與以轉(zhuǎn)移量d為拍子間隔的恒定速度同步的可能性的得分。 圖11是示出拍子得分計(jì)算單元134的拍子得分計(jì)算處理流程的示例的流程圖。
參考圖ll,首先,拍子得分計(jì)算單元134關(guān)于由起始點(diǎn)檢測(cè)單元132檢測(cè)到的起 始點(diǎn),從第一起始點(diǎn)開(kāi)始,針對(duì)這些起始點(diǎn)順次執(zhí)行循環(huán)(S1342)。此外,拍子得分計(jì)算單 元134關(guān)于所關(guān)注的起始點(diǎn)針對(duì)所有轉(zhuǎn)移量d中的每一個(gè)轉(zhuǎn)移量d執(zhí)行循環(huán)(S1344)。作 為循環(huán)的對(duì)象的轉(zhuǎn)移量d是可以在音樂(lè)演奏中使用的所有拍子處的間隔的值。然后,拍子 得分計(jì)算單元134初始化拍子得分BS(k, d)(即,O被代入拍子得分BS(K, d)中)(S1346)。 接著,拍子得分計(jì)算單元134針對(duì)用于轉(zhuǎn)移所關(guān)注起始點(diǎn)的幀位置Fd的轉(zhuǎn)移系數(shù)n來(lái)執(zhí)行 循環(huán)(S1348)。然后,拍子得分計(jì)算單元134向拍子得分BS(k,d)順次添加每個(gè)轉(zhuǎn)移位置處 的拍子概率P(Fk+nd)(S1350)。然后,當(dāng)針對(duì)所有轉(zhuǎn)移系數(shù)n的循環(huán)結(jié)束時(shí)(S1352),拍子得 分計(jì)算單元134記錄所關(guān)注的起始點(diǎn)的幀位置(幀編號(hào)k)、轉(zhuǎn)移量d和拍子得分BS(k, d) (S1354)。拍子得分計(jì)算單元134針對(duì)所有起始點(diǎn)的每個(gè)轉(zhuǎn)移量重復(fù)此拍子得分BS(k, d) 的計(jì)算(S1356, S1358)。 利用如上所述由拍子得分計(jì)算單元134進(jìn)行的拍子得分計(jì)算處理,針對(duì)由起始點(diǎn) 檢測(cè)單元132檢測(cè)到的每個(gè)起始點(diǎn),輸出跨越多個(gè)轉(zhuǎn)移量d的拍子得分BS(k, d)。
圖12是使從拍子得分計(jì)算單元134輸出的拍子得分可視化的拍子得分分布圖。
在圖12中,沿水平軸按時(shí)間順序示出由起始點(diǎn)檢測(cè)單元132檢測(cè)到的起始點(diǎn)。另 一方面,圖12中的垂直軸指示轉(zhuǎn)移量,針對(duì)所述轉(zhuǎn)移量,已經(jīng)計(jì)算了各個(gè)起始點(diǎn)的拍子得 分。此外,圖中各個(gè)點(diǎn)的顏色的濃淡指示在轉(zhuǎn)移量處針對(duì)起始點(diǎn)計(jì)算出的拍子得分的水平。 例如,在該拍子得分分布圖中,在轉(zhuǎn)移量dl的附近,拍子得分對(duì)于所有起始點(diǎn)都高。這意味 著,當(dāng)假定以轉(zhuǎn)移量dl的速度演奏樂(lè)曲時(shí),很有可能所檢測(cè)到的起始點(diǎn)中的許多起始點(diǎn)與 拍子對(duì)應(yīng)。由拍子得分計(jì)算單元134計(jì)算出的拍子得分輸出給接下來(lái)所描述的拍子搜索單 元136。 (2-3-3.拍子搜索單元) 拍子搜索單元136基于由拍子得分計(jì)算單元134計(jì)算出的拍子得分來(lái)搜索示出可 能的速度波動(dòng)的起始點(diǎn)位置路徑。例如,基于隱馬爾科夫模型的Viterbi算法可以用作拍 子搜索單元136的路徑搜索方法。 圖13是用于描述由拍子搜索單元136進(jìn)行的路徑搜索的說(shuō)明性示圖。
當(dāng)應(yīng)用用于由拍子搜索單元136進(jìn)行的路徑搜索的Viterbi算法時(shí),與圖12相關(guān) 地描述的起始點(diǎn)編號(hào)被用作時(shí)間軸(圖13中的水平軸)的單位。并且,用于計(jì)算拍子得分 的轉(zhuǎn)移量被用作觀測(cè)序列(圖13中的垂直軸)。 S卩,拍子搜索單元136將所有已經(jīng)由拍子得分計(jì)算單元134計(jì)算了拍子得分的起
13始點(diǎn)與轉(zhuǎn)移量的組合中的每一種組合看作節(jié)點(diǎn),節(jié)點(diǎn)是路徑搜索的對(duì)象。此外,如上所述,各個(gè)節(jié)點(diǎn)的轉(zhuǎn)移量在意義上與針對(duì)該節(jié)點(diǎn)假設(shè)的拍子間隔是等同的。因此,在以下描述中,各個(gè)節(jié)點(diǎn)的轉(zhuǎn)移量被稱為拍子間隔。 關(guān)于所述節(jié)點(diǎn),拍子搜索單元136沿著時(shí)間軸順次選擇這些節(jié)點(diǎn)中的任何節(jié)點(diǎn),并且通過(guò)使用稍后描述的評(píng)估值來(lái)評(píng)估由這一連串所選擇的節(jié)點(diǎn)形成的路徑。此時(shí),在節(jié)點(diǎn)選擇中,允許拍子搜索單元136跳過(guò)起始點(diǎn)。例如,在圖13中,在第k-l個(gè)起始點(diǎn)之后,跳過(guò)第k個(gè)起始點(diǎn),并且選擇第k+l個(gè)起始點(diǎn)。這是因?yàn)?,是拍子的起始點(diǎn)和不是拍子的起始點(diǎn)通常被混合在起始點(diǎn)中,并且只好從包括不經(jīng)過(guò)不是拍子的起始點(diǎn)的路徑在內(nèi)的路徑中搜索出可能的路徑。 例如,對(duì)于路徑的評(píng)估,可以使用4個(gè)評(píng)估值,S卩,(1)拍子得分,(2)速度變化得分,(3)起始點(diǎn)移動(dòng)得分和(4)針對(duì)跳過(guò)的懲罰。其中,(1)拍子得分是由拍子得分計(jì)算單元134針對(duì)每個(gè)節(jié)點(diǎn)計(jì)算出的拍子得分。另一方面,對(duì)節(jié)點(diǎn)間的過(guò)渡給出(2)速度變化得分、(3)起始點(diǎn)移動(dòng)得分和(4)針對(duì)跳過(guò)的懲罰。 在對(duì)節(jié)點(diǎn)間的過(guò)渡給出的評(píng)估值中,(2)速度變化得分是基于經(jīng)驗(yàn)知識(shí)給出的評(píng)估值,經(jīng)驗(yàn)知識(shí)通常是樂(lè)曲中逐漸波動(dòng)的速度。即,在路徑選擇中節(jié)點(diǎn)間的過(guò)渡中,過(guò)渡前節(jié)點(diǎn)處的拍子間隔與過(guò)渡后節(jié)點(diǎn)處的拍子間隔之間的差越小,給出的速度變化得分的值越高。 圖14是示出速度變化得分的示例的說(shuō)明性示圖。 在圖14中,當(dāng)前選擇節(jié)點(diǎn)Nl。拍子搜索單元136有可能選擇節(jié)點(diǎn)N2至N5中的任何節(jié)點(diǎn)作為下一節(jié)點(diǎn)(盡管也可以選擇其它節(jié)點(diǎn),但是為了便于描述,將描述4個(gè)節(jié)點(diǎn),即節(jié)點(diǎn)N2至N5)。這里,當(dāng)拍子搜索單元136選擇節(jié)點(diǎn)N4時(shí),由于節(jié)點(diǎn)Nl與節(jié)點(diǎn)N4處的拍子間隔之間沒(méi)有差,所以將給出最高值作為速度變化得分。另一方面,當(dāng)拍子搜索單元136選擇節(jié)點(diǎn)N3或N5時(shí),在節(jié)點(diǎn)Nl和節(jié)點(diǎn)N3或N5處的拍子間隔之間存在差,并且因此給出相對(duì)于選擇節(jié)點(diǎn)N4時(shí)較低的速度變化得分。此外,當(dāng)拍子搜索單元136選擇節(jié)點(diǎn)N2時(shí),由于節(jié)點(diǎn)Nl和節(jié)點(diǎn)N2處的拍子間隔之間的差大于節(jié)點(diǎn)N3或N5被選擇時(shí)的差,所以給出更低的速度得分。 接著,(3)起始點(diǎn)移動(dòng)得分是根據(jù)過(guò)渡前后節(jié)點(diǎn)的起始點(diǎn)位置之間的間隔是否與
過(guò)渡前節(jié)點(diǎn)處的拍子間隔相匹配而給出的評(píng)估值。 圖15是示出起始點(diǎn)移動(dòng)得分的示例的說(shuō)明性示圖。 在圖15(15A)中,當(dāng)前選擇第k個(gè)起始點(diǎn)的具有拍子間隔d2的節(jié)點(diǎn)N6。并且還示出接下來(lái)可能被拍子搜索單元136選擇的節(jié)點(diǎn)中的兩個(gè)節(jié)點(diǎn)N7和N8。其中,節(jié)點(diǎn)N7是第k+l個(gè)起始點(diǎn)的節(jié)點(diǎn),并且第k個(gè)起始點(diǎn)與第k+l個(gè)起始點(diǎn)之間的間隔(例如,幀編號(hào)之間的差)是D7。另一方面,節(jié)點(diǎn)N8是第k+2個(gè)起始點(diǎn)的節(jié)點(diǎn),并且第k個(gè)起始點(diǎn)與第k+2個(gè)起始點(diǎn)之間的間隔是D8。 這里,當(dāng)假定路徑上的所有節(jié)點(diǎn)都成功與恒定速度中的拍子位置相對(duì)應(yīng)的理想路徑時(shí),相鄰節(jié)點(diǎn)的起始點(diǎn)位置之間的間隔是各個(gè)節(jié)點(diǎn)處的拍子間隔的整數(shù)倍(當(dāng)無(wú)休止符時(shí)是相同間隔)。因此,如圖15(15B)中所示,關(guān)于當(dāng)前節(jié)點(diǎn)N6,起始點(diǎn)位置之間的間隔越接近節(jié)點(diǎn)N6處的拍子間隔d2的整數(shù)倍,起始點(diǎn)移動(dòng)得分被定義得越高。在圖15(15B)的示例中,由于節(jié)點(diǎn)N6和N8之間的間隔D8比節(jié)點(diǎn)N6和N7之間的間隔D7更接近節(jié)點(diǎn)N6處
14的拍子間隔d2的整數(shù)倍,所以,對(duì)從節(jié)點(diǎn)N6至節(jié)點(diǎn)N8的過(guò)渡給出更高的起始點(diǎn)移動(dòng)得分。
現(xiàn)在,(4)針對(duì)跳過(guò)的懲罰是用于在節(jié)點(diǎn)間的過(guò)渡中限制起始點(diǎn)過(guò)多跳過(guò)的評(píng)估值。即,在一次過(guò)渡中跳過(guò)越多起始點(diǎn)則得分越低,而在一次過(guò)渡中跳過(guò)越少起始點(diǎn)則得分越高。這里,越低的得分意味著越高的懲罰。
圖16是示出針對(duì)跳過(guò)的懲罰的示例的說(shuō)明性示圖。 在圖16中,當(dāng)前選擇第k個(gè)起始點(diǎn)的節(jié)點(diǎn)N9。并且,還示出接下來(lái)可能被拍子搜索單元136選擇的節(jié)點(diǎn)中的3個(gè)節(jié)點(diǎn)N10、 Nil和N12。其中,節(jié)點(diǎn)N10是第k+l個(gè)起始點(diǎn)的節(jié)點(diǎn),節(jié)點(diǎn)Nil是第k+2個(gè)起始點(diǎn)的節(jié)點(diǎn),而節(jié)點(diǎn)N12是第k+3個(gè)起始點(diǎn)的節(jié)點(diǎn)。S卩,在從節(jié)點(diǎn)N9至節(jié)點(diǎn)N10的過(guò)渡的情況中,沒(méi)有跳過(guò)節(jié)點(diǎn)。另一方面,在從節(jié)點(diǎn)N9至節(jié)點(diǎn)Nil的過(guò)渡的情況中,跳過(guò)第k+l個(gè)起始點(diǎn)。此外,在從節(jié)點(diǎn)N9至節(jié)點(diǎn)N12的過(guò)渡的情況中,跳過(guò)第k+l個(gè)和第k+2個(gè)起始點(diǎn)。此時(shí),針對(duì)跳過(guò)的懲罰在從節(jié)點(diǎn)N9至節(jié)點(diǎn)N10的過(guò)渡的情況中取得相對(duì)高的值,在從節(jié)點(diǎn)N9至節(jié)點(diǎn)Nil的過(guò)渡的情況中取得中間值,并且在從節(jié)點(diǎn)N9至節(jié)點(diǎn)N12的過(guò)渡的情況中取得低值。因此,可以防止更多數(shù)目的起始點(diǎn)被跳過(guò)從而使得節(jié)點(diǎn)之間的間隔恒定的現(xiàn)象。 此前,已經(jīng)描述了用于評(píng)估由拍子搜索單元136搜索出的路徑的4個(gè)評(píng)估值。使用圖13描述的路徑評(píng)估是關(guān)于所選擇的路徑,通過(guò)將對(duì)各個(gè)節(jié)點(diǎn)給出的或針對(duì)路徑中所包括的節(jié)點(diǎn)間的過(guò)渡所給出的上述(1)至(4)的評(píng)估值彼此順次相乘來(lái)執(zhí)行的。拍子搜索單元136確定所有可以設(shè)想到的路徑中評(píng)估值的乘積最大的路徑作為最優(yōu)路徑。
圖17是示出被拍子搜索單元136確定為最優(yōu)路徑的路徑的示例的說(shuō)明性示圖。
在圖17中,在圖12中所示的拍子得分分布圖中用點(diǎn)線描畫(huà)出由拍子搜索單元136確定的最優(yōu)路徑的輪廓。參考圖17,可見(jiàn),在示圖的示例中,由拍子搜索單元136針對(duì)其執(zhí)行了搜索的樂(lè)曲的速度以拍子間隔d3為中心波動(dòng)。由拍子搜索單元136確定的最優(yōu)路徑(最優(yōu)路徑中所包括的節(jié)點(diǎn)的列表)輸出給以下將分別描述的恒定速度判定單元138、針對(duì)恒定速度的拍子重新搜索單元140以及拍子確定單元142。[OMO] (2-3-4.恒定速度判定單元) 恒定速度判定單元138判定由拍子搜索單元136確定的最優(yōu)路徑是否指示具有低的拍子間隔(即針對(duì)各個(gè)節(jié)點(diǎn)假定的拍子間隔)方差的恒定速度。更具體而言,恒定速度判定單元138首先計(jì)算從拍子搜索單元136輸入的最優(yōu)路徑中所包括的節(jié)點(diǎn)處的一組拍子間隔的方差。然后,當(dāng)所計(jì)算出的方差小于預(yù)先給定的特定閾值時(shí),恒定速度判定單元138判定速度是恒定的;并且當(dāng)所計(jì)算出的方差大于該特定閾值時(shí),恒定速度判定單元138判定速度不是恒定的。 圖18是示出恒定速度判定單元138的判定結(jié)果的兩個(gè)示例的說(shuō)明性示圖。
參考圖18(18A),用點(diǎn)線描畫(huà)出輪廓的最優(yōu)路徑中起始點(diǎn)位置的拍子間隔根據(jù)時(shí)間變化。利用這樣的路徑,作為由恒定速度判定單元138進(jìn)行的與閾值相關(guān)的判定的結(jié)果,可以判定速度不是恒定的。另一方面,參考圖18(18B),由點(diǎn)線描畫(huà)出輪廓的最優(yōu)路徑中的起始點(diǎn)位置的拍子間隔在整個(gè)樂(lè)曲中幾乎恒定。作為由恒定速度判定單元138進(jìn)行的與閾值相關(guān)的判定的結(jié)果,可以判定這樣的路徑是恒定的。由恒定速度判定單元138進(jìn)行的與閾值相關(guān)的判定的結(jié)果被輸出給針對(duì)恒定速度的拍子重新搜索單元140。
(2-3-5.針對(duì)恒定速度的拍子重新搜索單元)
當(dāng)從拍子搜索單元136輸出的最優(yōu)路徑被恒定速度判定單元138判定為指示恒定速度時(shí),針對(duì)恒定速度的拍子重新搜索單元140重新執(zhí)行路徑搜索,將作為搜索對(duì)象的節(jié)點(diǎn)限制為僅在最經(jīng)常出現(xiàn)的拍子間隔周?chē)哪切┕?jié)點(diǎn)。 圖19是用于描述由針對(duì)恒定速度的拍子重新搜索單元140進(jìn)行的路徑重新搜索處理的說(shuō)明性示圖。 圖19和圖13—樣,示出了以拍子間隔為觀測(cè)序列的沿時(shí)間軸(起始點(diǎn)編號(hào))的一組節(jié)點(diǎn)。這里,假定要被拍子搜索單元136確定為最優(yōu)路徑的路徑中所包括的節(jié)點(diǎn)處的拍子間隔的眾數(shù)是d4,并且該路徑被恒定速度判定單元138判定為指示恒定速度。在這種情況中,針對(duì)恒定速度的拍子重新搜索單元140將僅拍子間隔d滿足d4-Th2《d《d4+Th2(Th2是預(yù)先給出的特定閾值)的那些節(jié)點(diǎn)作為搜索對(duì)象來(lái)再次搜索路徑。例如,在圖19的示例中,針對(duì)第k個(gè)起始點(diǎn)示出5個(gè)節(jié)點(diǎn)N12至N16。其中,N13至N15處的拍子間隔被包括在搜索范圍(d4-Th2《d《d4+Th2)內(nèi)。相比之下,N12和N16處的拍子間隔未被包括在上述搜索范圍內(nèi)。因此,關(guān)于第k個(gè)起始點(diǎn),僅3個(gè)節(jié)點(diǎn)N13至N15成為由針對(duì)恒定速度的拍子重新搜索單元140進(jìn)行的路徑搜索重新執(zhí)行的對(duì)象。此外,由針對(duì)恒定速度的拍子重新搜索單元140進(jìn)行的對(duì)路徑的重新搜索處理的流程與使用圖13至17描述的由拍子搜索單元136進(jìn)行的路徑搜索處理相似,不同在于成為搜索的對(duì)象的節(jié)點(diǎn)的范圍不同。 根據(jù)如上所述由針對(duì)恒定速度的拍子重新搜索單元140進(jìn)行的路徑重新搜索處理,關(guān)于具有恒定速度的樂(lè)曲,可以減少路徑搜索的結(jié)果中可能局部發(fā)生的與拍子位置相關(guān)的誤差。由針對(duì)恒定速度的拍子重新搜索單元140確定的最優(yōu)路徑輸出給拍子確定單元142。 (2-3-6.拍子確定單元) 拍子確定單元142基于由拍子搜索單元136確定的最優(yōu)路徑或由針對(duì)恒定速度的拍子重新搜索單元140確定的最優(yōu)路徑以及基于路徑中所包括的各個(gè)節(jié)點(diǎn)處的拍子間隔,確定音頻信號(hào)中所包括的拍子位置。 圖20是用于描述由拍子確定單元142進(jìn)行的拍子確定處理的說(shuō)明性示圖。
在圖20(20A)中再次示出使用圖9描述的、由起始點(diǎn)檢測(cè)單元132進(jìn)行的起始點(diǎn)檢測(cè)的結(jié)果的示例。在該示例中,示出了由起始點(diǎn)檢測(cè)單元132檢測(cè)到的在第k個(gè)起始點(diǎn)附近的14個(gè)起始點(diǎn)。 相比之下,圖20(20B)示出了由拍子搜索單元136或針對(duì)恒定速度的拍子重新搜索單元140確定的最優(yōu)路徑中所包括的起始點(diǎn)。在20B的示例中,20A中所示出的14個(gè)起始點(diǎn)中,第k-7個(gè)起始點(diǎn)、第k個(gè)起始點(diǎn)和第k+6個(gè)起始點(diǎn)(幀編號(hào)Fk—7、Fk、Fk+6)被包括在最優(yōu)路徑中。此外,第k-7個(gè)起始點(diǎn)處的拍子間隔(等同于對(duì)應(yīng)節(jié)點(diǎn)處的拍子間隔)是4—7,并且第k個(gè)起始點(diǎn)處的拍子間隔是dk。 關(guān)于這樣的起始點(diǎn),首先,拍子確定單元142將最優(yōu)路徑中所包括的起始點(diǎn)的位置作為樂(lè)曲的拍子位置。然后,拍子確定單元142根據(jù)各個(gè)起始點(diǎn)處的拍子間隔在最優(yōu)路徑中所包括的相鄰起始點(diǎn)之間設(shè)置補(bǔ)充拍子。 拍子確定單元142首先確定用來(lái)在最優(yōu)路徑上彼此相鄰的起始點(diǎn)之間設(shè)置拍子的補(bǔ)充拍子的數(shù)目。例如,如圖21中所示,假定兩個(gè)相鄰起始點(diǎn)的位置是Fh和Fw,并且起始點(diǎn)位置Fh處的拍子間隔是dh。在這種情況中,拍子確定單元142所要設(shè)置在Fh和Fh+1之間的補(bǔ)充拍子的數(shù)目Bfill由以下等式給出。
[等式2]
<formula>formula see original document page 17</formula> 此外,在等式2中,Ro皿d(X)指示X被四舍五入為最接近的整數(shù)。即,拍子確定單元142所要設(shè)置的補(bǔ)充拍子的數(shù)目將是通過(guò)以下方式得到的數(shù)相鄰起始點(diǎn)之間的間隔除以拍子間隔得到的值四舍五入為最接近的整數(shù),并且之后考慮柵欄柱問(wèn)題從所得到的整數(shù)中減去l。 接著,拍子確定單元142在最優(yōu)路徑彼此相鄰的起始點(diǎn)之間設(shè)置已經(jīng)以上述方式確定了數(shù)目的補(bǔ)充拍子,使得這些拍子以相等的間隔排列。在圖20(20C)的示例中,在第k_7個(gè)起始點(diǎn)和第k個(gè)起始點(diǎn)之間以及在第k個(gè)起始點(diǎn)與第k+6個(gè)起始點(diǎn)之間設(shè)置兩個(gè)補(bǔ)充拍子。應(yīng)當(dāng)注意,由拍子確定單元142提供的補(bǔ)充拍子的位置不一定與由起始點(diǎn)檢測(cè)單元132檢測(cè)到的起始點(diǎn)的位置相對(duì)應(yīng)。因此,拍子確定單元142可以恰當(dāng)?shù)卮_定拍子的位置而不受該拍子位置之外處產(chǎn)生的聲音的影響。此外,即使在該拍子位置處為休止符而沒(méi)有聲音產(chǎn)生的情況中,也可以恰當(dāng)?shù)匕盐张淖游恢谩?由拍子確定單元142確定的拍子位置的列表(包括最優(yōu)路徑上的起始點(diǎn)和由拍子確定單元142設(shè)置的補(bǔ)充拍子)輸出給速度修正單元144。
(2-3-7.速度修正單元) 由拍子確定單元142確定的拍子位置所指示的速度有可能是樂(lè)曲的原始速度的
常數(shù)倍,例如2倍、1/2倍、3/2倍、2/3倍等。速度修正單元144考慮了這種可能性并且通過(guò)
對(duì)作為常數(shù)倍的被錯(cuò)誤地把握的速度進(jìn)行修正來(lái)再現(xiàn)樂(lè)曲的原始速度。 圖22是示出為常數(shù)倍關(guān)系的三種類型的速度中每種速度的拍子位置的樣式的示
例的說(shuō)明性示圖。 參考圖22,在圖中所示的時(shí)間范圍(22A)中檢測(cè)到6個(gè)拍子。相比之下,在22B中,在相同的時(shí)間范圍中檢測(cè)到12個(gè)拍子。即,22B的拍子位置利用22A的拍子位置作為基準(zhǔn)指示2倍速度。 另一方面,在22C-1中,在相同的時(shí)間范圍中包括3個(gè)拍子。即,22C-1的拍子位置利用22A的拍子位置作為基準(zhǔn)指示1/2倍速度。在22C-2中,與22C-1 —樣,在相同時(shí)間范圍中包括3個(gè)拍子,并且因此利用22A的拍子位置作為基準(zhǔn)指示1/2倍速度。然而,22C-1和22C-2彼此不同在于在從基準(zhǔn)速度改變速度時(shí)將保留的拍子位置。 例如,通過(guò)以下過(guò)程(1)至(3)來(lái)執(zhí)行由速度修正單元144進(jìn)行的對(duì)速度的修正。
(1)確定基于波形所估計(jì)出的估計(jì)速度
(2)確定多個(gè)乘子中的最優(yōu)基本乘子
(3)重復(fù)(2)直到基本乘子為1為止
(1)確定基于波形所估計(jì)出的估計(jì)速度 首先,速度修正單元144從音頻信號(hào)的波形中出現(xiàn)的聲音特征中確定被估計(jì)為足夠的估計(jì)速度。例如,作為采用JP-A-2008-123011中所公開(kāi)的學(xué)習(xí)算法的機(jī)器學(xué)習(xí)的結(jié)果
17而獲得的估計(jì)速度辨別公式可以用于確定估計(jì)速度。 由速度修正單元144使用的估計(jì)速度辨別公式采用JP-A-2008-123011中所公開(kāi) 的學(xué)習(xí)算法并且是通過(guò)圖23中所示的學(xué)習(xí)處理獲得的。 首先,向?qū)W習(xí)算法提供已從樂(lè)曲的音頻信號(hào)中變換出的多個(gè)對(duì)數(shù)譜,作為輸入數(shù) 據(jù)。例如,在圖23中,對(duì)數(shù)譜LS l至LSn被提供給學(xué)習(xí)算法。此外,由正在收聽(tīng)樂(lè)曲的人 判定為正確的速度被輸入學(xué)習(xí)算法,作為教師數(shù)據(jù)。例如,在圖23中,各個(gè)對(duì)數(shù)譜的正確速 度(LSI :100, . . . , LSn :60)被提供給學(xué)習(xí)算法?;诙嘟M這樣的輸入數(shù)據(jù)和教師數(shù)據(jù),通 過(guò)上述學(xué)習(xí)算法來(lái)預(yù)先獲得用于從對(duì)數(shù)譜中確定估計(jì)速度的估計(jì)速度辨別公式。
速度修正單元144通過(guò)將如上所述預(yù)先獲得的估計(jì)速度辨別公式應(yīng)用于輸入到 信息處理設(shè)備100的音頻信號(hào),來(lái)確定估計(jì)速度。
(2)確定多個(gè)乘子中的最優(yōu)基本乘子 接著,速度修正單元144從多個(gè)基本乘子中確定使得修正后的速度與樂(lè)曲的原始 速度最接近的基本乘子。這里,該基本乘子是作為用于速度修正的常數(shù)比的基本單位的乘 子。例如,在本實(shí)施例中,基本乘子被描述為七種類型的乘子(即,1/3、1/2、2/3、1、3/2、2 和3)中的任何一個(gè)。然而,基本乘子不限于這樣的示例,并且例如可以是五種類型的乘子 (即,1/3、1/2、1、2和3)中的任何一個(gè)。 為了確定最優(yōu)基本乘子,速度修正單元144首先針對(duì)上述基本乘子中的每個(gè)基本 乘子來(lái)計(jì)算根據(jù)該乘子修正拍子位置之后的平均拍子概率(在基本乘子為1的情況中,針 對(duì)拍子位置未被修正的情況來(lái)計(jì)算平均拍子概率)。 圖24是用于描述由速度修正單元144針對(duì)各個(gè)乘子計(jì)算出的平均拍子概率的說(shuō) 明性示圖。 參考圖24,如圖5的下部一樣,在時(shí)間軸上利用折線示出了由拍子概率計(jì)算單元 120計(jì)算出的拍子概率。并且,在水平軸上示出了根據(jù)這些乘子中任何一個(gè)修正后的3個(gè)拍 子的幀編號(hào)Fh—^Fh和Fw。這里,當(dāng)幀編號(hào)Fh的拍子概率是BP(h)時(shí),通過(guò)以下等式給出根 據(jù)乘子r修正后的拍子位置的群組F(r)的平均拍子概率BPAve(r)。
[等式3]
Z畔)肌,丄、=
贏/廣 ,人 (3)
m廠、 這里,在上述等式中,m(r)是群組F(r)中所包括的幀編號(hào)的個(gè)數(shù)。
此外,如使用圖22(C-l)和(C-2)所描述的,在基本乘子r為1/2時(shí),存在拍子位 置的兩種類型的候選。在這種情況中,速度修正單元144針對(duì)拍子位置的兩種類型的候選 中的每一種計(jì)算平均拍子概率BP皿(r),并且采用具有較高平均拍子概率BP皿(r)的拍子位 置作為根據(jù)乘子r = 1/2修正后的拍子位置。類似地,在乘子r為1/3的情況中,存在拍子 位置的三種類型的候選。在這種情況中,速度修正單元144針對(duì)拍子位置的三種類型的候 選計(jì)算出平均拍子候選BP皿(r),并且采用具有最高平均拍子概率BP皿(r)的拍子位置作為 根據(jù)乘子r = 1/3修正后的拍子位置。 接著,在針對(duì)各個(gè)基本乘子計(jì)算出平均拍子概率之后,速度修正單元144基于估
18計(jì)速度和平均拍子概率來(lái)計(jì)算針對(duì)各個(gè)基本乘子修正后的速度的似然(以下,稱為"速度 似然")。這里,速度似然可以是通過(guò)以估計(jì)速度為中心的高斯分布示出的速度概率與平均 拍子概率的乘積。 圖25是用于描述由速度修正單元144計(jì)算出的速度似然的說(shuō)明性示圖。
圖25(25A)示出由速度修正單元144針對(duì)各個(gè)乘子計(jì)算出的平均拍子概率。并 且,圖25(25B)示出高斯分布形式的速度概率,其是由預(yù)先給定的特定方差ol確定的,并 且以由速度修正單元144基于音頻信號(hào)的波形估計(jì)出的估計(jì)速度為中心。此外,25A和25B 的水平軸表示已經(jīng)根據(jù)各個(gè)乘子修正拍子位置之后,速度的對(duì)數(shù)。速度修正單元144通過(guò) 將平均拍子概率與速度概率彼此相乘,來(lái)針對(duì)基本乘子中的每個(gè)基本乘子計(jì)算圖25 (25C) 中所示的速度似然。即,在圖25的示例中,盡管平均拍子概率對(duì)于基本乘子是1時(shí)和其為 1/2時(shí)幾乎是相同的,但是被修正為1/2倍的速度與估計(jì)速度更接近(速度概率高),因此, 對(duì)于被修正為1/2倍的速度,所計(jì)算出的速度似然更高。速度修正單元144以這種方式計(jì) 算速度似然,并且確定產(chǎn)生最高速度似然的基本乘子,作為使得修正后的速度最接近樂(lè)曲 的原始速度的基本乘子。 以這種方式,通過(guò)在有可能的速度的確定中考慮可以從估計(jì)速度獲得的速度概
率,可以從候選中精確地確定恰當(dāng)?shù)乃俣?,這些候選是具有常數(shù)倍關(guān)系并且基于聲音的局
部波形難以相互辨別的速度。 (3)重復(fù)(2)直到基本乘子為1為止 然后,速度修正單元144針對(duì)各個(gè)基本乘子重復(fù)對(duì)平均拍子概率的計(jì)算和對(duì)速度 似然的計(jì)算,直到產(chǎn)生最高速度似然的基本乘子為1為止。結(jié)果,即使在由速度修正單元 144進(jìn)行的修正之前的速度是樂(lè)曲的原始速度的1/4倍、1/6倍、4倍、6倍等,也可以用通過(guò) 基本乘子的組合獲得的用于修正的恰當(dāng)乘子(例如,1/2倍X 1/2倍=1/4倍)來(lái)修正速 度。 圖26是示出速度修正單元144的修正處理流程的示例的流程圖。
參考圖26,首先,速度修正單元144通過(guò)使用預(yù)先通過(guò)學(xué)習(xí)獲得的估計(jì)速度辨別 公式來(lái)從音頻信號(hào)中確定估計(jì)速度(S1442)。接著,速度修正單元144針對(duì)多個(gè)基本乘子 (例如,l/3、l/2等)順次執(zhí)行循環(huán)(S1444)。在循環(huán)內(nèi),如使用圖22所描述的,速度修正單 元144根據(jù)各個(gè)基本乘子來(lái)改變拍子位置,并且修正速度(S1446)。接著,如使用圖24所描 述的,速度修正單元144計(jì)算修正后的拍子位置的平均拍子概率(S1448)。接著,如使用圖 25所描述的,速度修正單元144基于在S1448處計(jì)算出的平均拍子概率和在S1442處確定 的估計(jì)速度來(lái)計(jì)算針對(duì)各個(gè)基本乘子的速度似然(S1450)。然后,當(dāng)該循環(huán)對(duì)于所有基本乘 子都結(jié)束了時(shí)(S1452),速度修正單元144確定產(chǎn)生最高速度似然的基本乘子(S1454)。此 外,速度修正單元144判定產(chǎn)生最高速度似然的基本乘子是否是1 (S1456)。如果產(chǎn)生最高 速度似然的基本乘子是l,則速度修正單元144的修正處理終止。另一方面,當(dāng)產(chǎn)生最高速 度似然的基本乘子不是1時(shí),處理返回S1444。從而,基于根據(jù)產(chǎn)生最高速度似然的基本乘 子修正后的速度(拍子位置),再次執(zhí)行根據(jù)基本乘子中的任何一個(gè)的速度修正。
在上述從起始點(diǎn)檢測(cè)單元132直到速度修正單元144的處理之后,由拍子分析單 元130進(jìn)行的拍子分析處理終止。作為由拍子分析單元130進(jìn)行的分析的結(jié)果而檢測(cè)到的 拍子位置輸出給稍后描述的結(jié)構(gòu)分析單元150和和弦概率計(jì)算單元160。
(2-4.結(jié)構(gòu)分析單元) 結(jié)構(gòu)分析單元150基于從對(duì)數(shù)譜變換單元110輸入的音頻信號(hào)的對(duì)數(shù)譜和從拍子 分析單元130輸入的拍子位置,計(jì)算該音頻信號(hào)中所包括的拍子區(qū)間之間的聲音的類似概率。 圖27是示出結(jié)構(gòu)分析單元150的詳細(xì)配置的框圖。參考圖27,結(jié)構(gòu)分析單元150 包括拍子區(qū)間特征量計(jì)算單元152、相關(guān)性計(jì)算單元154和類似概率生成單元156。
(2-4-1.拍子區(qū)間特征量計(jì)算單元) 拍子區(qū)間特征量計(jì)算單元152關(guān)于由拍子分析單元130檢測(cè)到的各個(gè)拍子來(lái)計(jì)算 拍子區(qū)間特征量,拍子區(qū)間特征量表示從該拍子到下一拍子的拍子區(qū)間的局部對(duì)數(shù)譜的特 征。 圖28是示出拍子、拍子區(qū)間和拍子區(qū)間特征量之間的關(guān)系的說(shuō)明性示圖。
在圖28的上部示出由拍子分析單元130檢測(cè)到的6個(gè)拍子Bl至B6。該拍子區(qū)間 是通過(guò)在拍子位置處劃分音頻信號(hào)所獲得的區(qū)間,并且指示從一個(gè)拍子到下一個(gè)拍子之間 的區(qū)間。B卩,在圖28的示例中,拍子區(qū)間BDl是從拍子B1至拍子B2的區(qū)間;拍子區(qū)間BD2 是從拍子B2至拍子B3的區(qū)間;并且拍子區(qū)間BD3是從拍子B3至拍子B4的區(qū)間。此外,拍 子區(qū)間特征量計(jì)算單元152從與各個(gè)拍子區(qū)間BD1至BD6相對(duì)應(yīng)的局部對(duì)數(shù)譜中計(jì)算各個(gè) 拍子區(qū)間特征量BF1至BF6。 圖29和圖30是用于描述由拍子區(qū)間特征量計(jì)算單元152進(jìn)行的對(duì)拍子區(qū)間特征 量的計(jì)算處理的說(shuō)明性示圖。 在圖29(29A)中,由拍子區(qū)間特征量計(jì)算單元152截取與拍子相對(duì)應(yīng)的拍子區(qū)間 BD的局部對(duì)數(shù)譜。拍子區(qū)間特征量計(jì)算單元152首先通過(guò)對(duì)局部對(duì)數(shù)譜的各個(gè)音調(diào)(八度 音階的數(shù)目X12個(gè)音符)的能量進(jìn)行時(shí)間平均來(lái)計(jì)算各個(gè)音調(diào)的平均能量。圖29(29B) 示出由拍子區(qū)間特征量計(jì)算單元152計(jì)算出的各個(gè)音調(diào)的平均能量的水平。
接著,參考圖30(30A),示出與圖29 (29B)中所示一樣的各個(gè)音調(diào)的平均能量水 平。然后,拍子區(qū)間特征量計(jì)算單元152針對(duì)12個(gè)音符,對(duì)若干個(gè)八度音階上不同八度音 階中有相同名稱的音符的平均能量的值求加權(quán)和,并且計(jì)算相應(yīng)12個(gè)音符的能量。例如, 在圖30(30B,30C)中所示的示例中,通過(guò)使用特定的權(quán)重(Wp W2, . . . , Wn)對(duì)n個(gè)八度音階 上的音符C(Q,(^,... ,Cn)的平均能量進(jìn)行加權(quán)并且加和到一起,并且計(jì)算出音符C的能量 值Enc。此外,以相同的方式,通過(guò)使用特定的權(quán)重(WpWy...,Wn)對(duì)n個(gè)八度音階上的音 符B(BpB^. . . ,Bn)的平均能量進(jìn)行加權(quán)并且加和到一起,并且計(jì)算出音符B的能量值Erv 對(duì)于音符C和音符B之間的IO個(gè)音符(Cft至Aft)同樣如此。結(jié)果,生成了以相應(yīng)12個(gè)音 符的能量值ENC, ENCT, . . . , ENB為元素的12維向量。拍子區(qū)間特征量計(jì)算單元152針對(duì)每 個(gè)拍子計(jì)算這樣的相應(yīng)12個(gè)音符的能量(12維向量)作為拍子區(qū)間特征量BF,并且將它輸 出給相關(guān)性計(jì)算單元154。 用于求加權(quán)和的各個(gè)八度音階的權(quán)重WpW^. . . ,Wn的值優(yōu)選在普通樂(lè)曲的旋律或 和弦清楚的中音域中較大。這使得能夠在更清楚地反映旋律或和弦的特征的情況下對(duì)樂(lè)曲 結(jié)構(gòu)進(jìn)行分析。 (2-4-2.相關(guān)性計(jì)算單元) 相關(guān)性計(jì)算單元154針對(duì)音頻信號(hào)中所包括的所有拍子區(qū)間對(duì),通過(guò)使用從拍子區(qū)間特征量計(jì)算單元152輸入的拍子區(qū)間特征量,即,各個(gè)拍子區(qū)間的相應(yīng)12個(gè)音符的能 量,計(jì)算拍子區(qū)間之間的相關(guān)系數(shù)。 圖31是用于描述相關(guān)性計(jì)算單元154進(jìn)行的相關(guān)系數(shù)計(jì)算處理的說(shuō)明性示圖。
在圖31中,示出第一所關(guān)注拍子區(qū)間BDi和第二所關(guān)注拍子區(qū)間BDj作為要計(jì)算 相關(guān)系數(shù)的一對(duì)拍子區(qū)間的示例,拍子區(qū)間是通過(guò)劃分對(duì)數(shù)譜獲得的。為了計(jì)算這兩個(gè)所 關(guān)注拍子區(qū)間之間的相關(guān)系數(shù),相關(guān)性計(jì)算單元154首先獲得第一所關(guān)注拍子區(qū)間BR以 及前后N個(gè)區(qū)間(也稱為"2N+1個(gè)區(qū)間")(在圖31的示例中,N = 2,總共5個(gè)區(qū)間)的相 應(yīng)12個(gè)音符的能量。同樣地,相關(guān)性計(jì)算單元154獲得第二所關(guān)注拍子區(qū)間BDj以及前后 N個(gè)區(qū)間的相應(yīng)12個(gè)音符的能量。然后,相關(guān)性計(jì)算單元154計(jì)算所獲得的第一所關(guān)注拍 子區(qū)間BDi以及前后N個(gè)區(qū)間的相應(yīng)12個(gè)音符的能量與所獲得的第二所關(guān)注拍子區(qū)間BDj 以及前后N個(gè)區(qū)間的相應(yīng)12個(gè)音符的能量之間的相關(guān)系數(shù)。相關(guān)性計(jì)算單元154針對(duì)所 有的第一所關(guān)注拍子區(qū)間BDi和第二所關(guān)注拍子區(qū)間BDj對(duì)來(lái)計(jì)算所述相關(guān)系數(shù),并且向類 似概率生成單元156輸出計(jì)算結(jié)果。
(2-4-3.類似概率生成單元) 類似概率生成單元156通過(guò)使用預(yù)先生成的變換曲線,將從相關(guān)性計(jì)算單元154 輸入的、拍子區(qū)間之間的相關(guān)系數(shù)變換成類似概率,類似概率指示拍子區(qū)間的聲音內(nèi)容之 間的類似程度。 圖32是用于描述將相關(guān)系數(shù)變換成類似概率時(shí)所使用的變換曲線的示例的說(shuō)明 性示圖。 圖32(32A)示出預(yù)先獲得的兩種概率分布,S卩,具有相同聲音內(nèi)容的拍子區(qū)間之 間的相關(guān)系數(shù)的概率分布和具有不同聲音內(nèi)容的拍子區(qū)間之間的相關(guān)系數(shù)的概率分布。從 圖32(32A)中可見(jiàn),相關(guān)系數(shù)越低,聲音內(nèi)容彼此相同的概率越低,并且相關(guān)系數(shù)越高,聲 音內(nèi)容彼此相同的概率越高。因此,可以預(yù)先生成如圖32(32B)中所示、用于從相關(guān)系數(shù)中 導(dǎo)出拍子區(qū)間之間的類似概率的變換曲線。類似概率生成單元156通過(guò)使用預(yù)先以這種 方式生成的變換曲線,將從相關(guān)性計(jì)算單元154輸入的相關(guān)系數(shù)COl例如變換成類似概率 SP1。 圖33是作為一個(gè)示例的將由結(jié)構(gòu)分析單元150計(jì)算出的拍子區(qū)間之間的類似概 率可視化的說(shuō)明性示圖。 圖33的垂直軸對(duì)應(yīng)于第一所關(guān)注拍子區(qū)間中的位置,并且水平軸對(duì)應(yīng)于第二所 關(guān)注拍子區(qū)間中的位置。此外,兩維平面上繪出的顏色的濃淡指示該坐標(biāo)處第一所關(guān)注拍 子區(qū)間和第二所關(guān)注拍子區(qū)間之間的類似概率的程度。例如,第一所關(guān)注拍子區(qū)間il與和 第一所關(guān)注拍子區(qū)間il基本相同的第二所關(guān)注拍子區(qū)間jl之間的類似概率自然顯示高 值,并且示出這些拍子區(qū)間具有相同的聲音內(nèi)容。當(dāng)被演奏的樂(lè)曲部分到達(dá)第二所關(guān)注拍 子區(qū)間j2時(shí),第一所關(guān)注拍子區(qū)間il與第二所關(guān)注拍子區(qū)間j2之間的類似概率再次顯示 高值。即,可以看出,很有可能在第二所關(guān)注拍子區(qū)間j2中正在演奏與第一所關(guān)注拍子區(qū) 間il的聲音內(nèi)容幾乎相同的聲音內(nèi)容。由結(jié)構(gòu)分析單元150以這種方式獲得的拍子區(qū)間 之間的類似概率輸出給稍后描述的小節(jié)線檢測(cè)單元180和和弦進(jìn)行檢測(cè)單元190。
此外,在本實(shí)施例中,由于對(duì)拍子區(qū)間中的能量的時(shí)間平均被用于對(duì)拍子區(qū)間特 征量的計(jì)算,所以對(duì)于由結(jié)構(gòu)分析單元150進(jìn)行的對(duì)樂(lè)曲結(jié)構(gòu)的分析,沒(méi)有考慮拍子區(qū)間中的對(duì)數(shù)譜中有關(guān)時(shí)間變化的信息。即,即使在兩個(gè)區(qū)間中演奏相同的旋律而該旋律(例
如,由于演奏者的編排)在時(shí)間上彼此偏移,所演奏的內(nèi)容仍被判定為相同,只要該偏移僅
發(fā)生在拍子區(qū)間內(nèi)即可。
(2-5.和弦概率計(jì)算單元) 和弦概率計(jì)算單元160針對(duì)由拍子分析單元130檢測(cè)到的各個(gè)拍子,計(jì)算和弦概
率,和弦概率指示與各個(gè)拍子相對(duì)應(yīng)的拍子區(qū)間中各種和弦被演奏的概率。 此外,由和弦概率計(jì)算單元160計(jì)算出的和弦概率的值是用于由稍后描述的基調(diào)
檢測(cè)單元170進(jìn)行的基調(diào)檢測(cè)處理的臨時(shí)值。由稍后描述的和弦進(jìn)行檢測(cè)單元190的和弦
概率計(jì)算單元196考慮各個(gè)拍子區(qū)間的基調(diào)概率來(lái)重新計(jì)算和弦概率。 圖34是示出和弦概率計(jì)算單元160的詳細(xì)配置的框圖。參考圖34,和弦概率計(jì)算
單元160包括拍子區(qū)間特征量計(jì)算單元162、根音特征量準(zhǔn)備單元164和和弦概率計(jì)算單元
166。 (2-5-1.拍子區(qū)間特征量計(jì)算單元) 與結(jié)構(gòu)分析單元150的拍子區(qū)間特征量計(jì)算單元152 —樣,拍子區(qū)間特征量計(jì)算 單元162針對(duì)由拍子分析單元130檢測(cè)到的各個(gè)拍子來(lái)計(jì)算相應(yīng)12個(gè)音符的能量,作為表 示與各個(gè)拍子相對(duì)應(yīng)的拍子區(qū)間中的音頻信號(hào)的特征的拍子區(qū)間特征量。由拍子區(qū)間特征 量計(jì)算單元162進(jìn)行的對(duì)相應(yīng)12個(gè)音符的能量的計(jì)算處理與使用圖28至圖30描述的由 拍子區(qū)間特征量計(jì)算單元152進(jìn)行的處理相同。然而,拍子區(qū)間特征量計(jì)算單元162以使 用與圖30中所示的權(quán)重Wp W2, . . . , Wn不同的值,作為用于對(duì)12個(gè)音符中每一個(gè)音符針對(duì) 各個(gè)八度音階的平均能量進(jìn)行加權(quán)并且加和到一起的權(quán)重的值。拍子區(qū)間特征量計(jì)算單元 162計(jì)算出相應(yīng)12個(gè)音符的能量作為拍子區(qū)間特征量,并且將其輸出給根音特征量準(zhǔn)備單 元164。 (2-5-2.根音特征量準(zhǔn)備單元) 根音特征量準(zhǔn)備單元164根據(jù)從拍子區(qū)間特征量計(jì)算單元162輸入的相應(yīng)12個(gè)
音符的能量,生成用于各個(gè)拍子區(qū)間的和弦概率的計(jì)算的根音特征量。 圖35和圖36是用于描述由根音特征量準(zhǔn)備單元164進(jìn)行的根音特征量生成處理
的說(shuō)明性示圖。 根音特征量準(zhǔn)備單元164首先針對(duì)所關(guān)注拍子區(qū)間BDi,提取所關(guān)注拍子區(qū)間BDi 以及前后N個(gè)區(qū)間的相應(yīng)12個(gè)音符的能量(參考圖35)。所關(guān)注拍子區(qū)間BDi以及前后N 個(gè)區(qū)間的相應(yīng)12個(gè)音符的能量可以被認(rèn)為是將音符C作為和弦的根音(基音)的特征量。 在圖35的示例中,由于N為2,所以將音符C作為根音的5個(gè)區(qū)間的根音特征量(12X5維) 被提取出。此外,這里N的值可以是與圖31中的N的值相同或不同的值。
接著,根音特征量準(zhǔn)備單元164通過(guò)將將音符C作為根音的5個(gè)區(qū)間的根音特征 量的12個(gè)音符的元素位置轉(zhuǎn)移特定數(shù)目,生成11個(gè)單獨(dú)的根音特征量,每個(gè)根音特征量針 對(duì)5個(gè)區(qū)間并且每個(gè)根音特征量以音符C#至音符B的任何音符為根音(參考圖36)。此 外,元素位置被轉(zhuǎn)移的轉(zhuǎn)移數(shù)是在音符Cft為根音的情況下為l,在音符D為根音的情況下 為2,……,并且在音符B為根音的情況下為ll。結(jié)果,由根音特征量準(zhǔn)備單元164針對(duì)相 應(yīng)12個(gè)音符生成了根音特征量(分別為12X5維),每個(gè)根音特征量將從音符C至音符B 的12個(gè)音符中的一個(gè)作為根音。
根音特征量準(zhǔn)備單元164針對(duì)所有拍子區(qū)間執(zhí)行如上所述的根音特征量生成處 理,并且準(zhǔn)備用于針對(duì)各個(gè)區(qū)間的和弦概率計(jì)算的根音特征量。此外,在圖35和圖36的示 例中,準(zhǔn)備用于一個(gè)拍子區(qū)間的特征量是12X5X12維向量。由根音特征量準(zhǔn)備單元164 生成的根音特征量輸出給和弦概率計(jì)算單元166。
(2-5-3.和弦概率計(jì)算單元) 和弦概率計(jì)算單元166通過(guò)使用從根音特征量準(zhǔn)備單元164輸入的根音特征量, 針對(duì)各個(gè)拍子區(qū)間來(lái)計(jì)算指示各種和弦被演奏的概率的和弦概率。這里的"各種和弦"是 指例如基于根音(C, C#, D,… )、構(gòu)成音符的數(shù)目(三和弦(triad)、七和弦(7th chord)、 九和弦(9th chord))、調(diào)性(大調(diào)/小調(diào))等來(lái)區(qū)分的和弦中的各種和弦。例如,通過(guò)邏輯 回歸分析預(yù)先習(xí)得的和弦概率公式可以用于和弦概率的計(jì)算。 圖37是用于描述用于由和弦概率計(jì)算單元166進(jìn)行的和弦概率計(jì)算的和弦概率 公式的學(xué)習(xí)處理的說(shuō)明性示圖。 和弦概率公式的學(xué)習(xí)是針對(duì)每種類型的和弦來(lái)執(zhí)行的。即,例如針對(duì)用于大和弦 的和弦概率公式、用于小和弦的和弦概率公式、用于七和弦的和弦概率公式和用于九和弦 的和弦概率公式中的每一個(gè),執(zhí)行以下描述的學(xué)習(xí)處理。 首先,提供多個(gè)根音特征量(例如,用圖36描述的12X5X12維向量)作為用于
邏輯回歸分析的獨(dú)立變量,每個(gè)根音特征量是針對(duì)正確和弦已知的拍子區(qū)間的。 此外,針對(duì)各個(gè)拍子區(qū)間的根音特征量中的每一個(gè),提供用于通過(guò)邏輯回歸分析
預(yù)測(cè)生成概率的啞元數(shù)據(jù)(教師數(shù)據(jù))。例如,當(dāng)學(xué)習(xí)用于大和弦的和弦概率公式時(shí),如果
已知的和弦是大和弦,則啞元數(shù)據(jù)的值將為真值(1),并且對(duì)于任何其它情況,啞元數(shù)據(jù)的
值為假值(0)。并且,當(dāng)學(xué)習(xí)用于小和弦的和弦概率公式時(shí),如果己知的和弦是小和弦,則啞
元數(shù)據(jù)的值將為真值(l),并且對(duì)于任何其它情況,啞元數(shù)據(jù)的值為假值(0)??梢哉f(shuō),對(duì)于
七和弦和九和弦也是如此。 通過(guò)使用上述獨(dú)立變量和鵬元數(shù)據(jù)來(lái)對(duì)足夠數(shù)目的根音特征量(每個(gè)根音特征 量針對(duì)一個(gè)拍子區(qū)間)執(zhí)行邏輯回歸分析,預(yù)先獲得了用于從各個(gè)拍子區(qū)間的根音特征量 計(jì)算出相應(yīng)類型的和弦概率的和弦概率公式。 然后,和弦概率計(jì)算單元166將預(yù)先獲得的和弦概率公式應(yīng)用于從根音特征量準(zhǔn) 備單元164輸入的根音特征量,并且針對(duì)各個(gè)拍子區(qū)間的相應(yīng)類型的和弦順次計(jì)算和弦概率。 圖38是用于描述由和弦概率計(jì)算單元166進(jìn)行的和弦概率計(jì)算處理的說(shuō)明性示 圖。 參考圖38(38A),示出了各個(gè)拍子區(qū)間的根音特征量中,用音符C作為根音的根音 特征量。和弦概率計(jì)算單元166將通過(guò)學(xué)習(xí)預(yù)先獲得的用于大和弦的和弦概率公式例如 應(yīng)用于用音符C作為根音的根音特征量,并且針對(duì)該拍子區(qū)間計(jì)算和弦為"C"的和弦概率 CPC。此外,和弦概率計(jì)算單元166將用于小和弦的和弦概率公式應(yīng)用于用音符C作為根音 的根音特征量,并且針對(duì)該拍子區(qū)間計(jì)算和弦為"Cm"的和弦概率CPCm。
以類似的方式,和弦概率計(jì)算單元166可以將用于大和弦的和弦概率公式和用于 小和弦的和弦概率公式應(yīng)用于用音符C#作為根音的根音特征量,并且可以計(jì)算和弦"Cft" 的和弦概率CPefl和和弦"C#m"的和弦概率CPeflm(38B)。可以說(shuō),對(duì)和弦"B"的和弦概率CPB和和弦"Bm"的和弦概率CPBm的計(jì)算也是如此(38C)。 圖39是示出由和弦概率計(jì)算單元166計(jì)算出的和弦概率的示例的說(shuō)明性示圖。
參考圖39,針對(duì)某一拍子區(qū)間,計(jì)算從音符C至音符B的12個(gè)音符中每一個(gè)音符 的各種和弦的和弦概率,這些和弦例如是"Maj(大和弦)"、"m(/小和弦)"、"7 (七和弦)" 和"m7 (/小七和弦)"。根據(jù)圖39的示例,和弦概率CPC是0. 88, CPCm是0. 08, CPC7是0. 01, CPCm7是0. 02并且CPB是0. 01。其它和弦概率值都指示0。 此外,在計(jì)算多種類型的和弦的和弦概率之后,和弦概率計(jì)算單元166以使得每 拍子區(qū)間的所計(jì)算出的概率值的總和變成l的方式對(duì)概率值進(jìn)行歸一化。針對(duì)音頻信號(hào)中 所包括的所有拍子區(qū)間重復(fù)如上所述由和弦概率計(jì)算單元166進(jìn)行的計(jì)算和歸一化處理。
在如上所述的由拍子區(qū)間特征量計(jì)算單元162至和弦概率計(jì)算單元166執(zhí)行的處 理之后,由和弦概率計(jì)算單元160進(jìn)行的和弦概率計(jì)算處理結(jié)束。由和弦概率計(jì)算單元160 計(jì)算出的和弦概率輸出給接下來(lái)所描述的基調(diào)檢測(cè)單元170。
(2-6.基調(diào)檢測(cè)單元) 基調(diào)檢測(cè)單元170通過(guò)使用由和弦概率計(jì)算單元160針對(duì)各個(gè)拍子區(qū)間計(jì)算出的 和弦概率來(lái)檢測(cè)各個(gè)拍子區(qū)間的基調(diào)(調(diào)性/基本音階)。基調(diào)檢測(cè)單元170還在基調(diào)檢 測(cè)的處理中計(jì)算各個(gè)拍子區(qū)間的基調(diào)概率。 圖40是示出基調(diào)檢測(cè)單元170的詳細(xì)配置的框圖。參考圖40,基調(diào)檢測(cè)單元170 包括相對(duì)和弦概率生成單元172、特征量準(zhǔn)備單元174、基調(diào)概率計(jì)算單元176和基調(diào)確定 單元178。 (2-6-1.相對(duì)和弦概率生成單元) 相對(duì)和弦概率生成單元172根據(jù)從和弦概率計(jì)算單元160輸入的、各個(gè)拍子區(qū)間
的和弦概率,生成用于計(jì)算各個(gè)拍子區(qū)間的基調(diào)概率的相對(duì)和弦概率。 圖41是用于描述由相對(duì)和弦概率生成單元172進(jìn)行的相對(duì)和弦概率生成處理的
說(shuō)明性示圖。 相對(duì)和弦概率生成單元172首先從某一所關(guān)注的拍子區(qū)間的和弦概率提取出大 和弦和小和弦的和弦概率值。這里所提取的和弦概率值形成總共24維的向量,即,大和弦 的12個(gè)音符和小和弦的12個(gè)音符。以下,24維向量被視為將音符C假定為基調(diào)的相對(duì)和 弦概率。 接著,相對(duì)和弦概率生成單元172通過(guò)將所提取出的大和弦和小和弦的和弦概率 值的12個(gè)音符的元素位置轉(zhuǎn)移特定數(shù)目,生成11個(gè)單獨(dú)的相對(duì)和弦概率。此外,元素位置 被轉(zhuǎn)移的轉(zhuǎn)移數(shù)與如使用圖36所述生成根音特征量時(shí)的轉(zhuǎn)移數(shù)相同。結(jié)果,由相對(duì)和弦概 率生成單元172生成12個(gè)單獨(dú)的相對(duì)和弦概率,每個(gè)相對(duì)和弦概率假定從音符C至音符B 的12個(gè)音符中的一個(gè)作為基調(diào)。 相對(duì)和弦概率生成單元172針對(duì)所有拍子區(qū)間執(zhí)行如上所述的相對(duì)和弦概率生 成處理,并且向特征量準(zhǔn)備單元174輸出所生成的相對(duì)和弦概率。
(2-6-2.特征量準(zhǔn)備單元) 特征量準(zhǔn)備單元174根據(jù)從相對(duì)和弦概率生成單元172輸入的相對(duì)和弦概率來(lái)計(jì) 算各個(gè)拍子區(qū)間的和弦出現(xiàn)得分和和弦過(guò)渡出現(xiàn)得分,作為用于計(jì)算各個(gè)拍子區(qū)間的基調(diào) 概率的特征量。
24
圖42是用于描述由特征量準(zhǔn)備單元174生成的各個(gè)拍子區(qū)間的和弦出現(xiàn)得分的 說(shuō)明性示圖。 參考圖42,特征量準(zhǔn)備單元174首先假定音符C作為基調(diào),針對(duì)所關(guān)注的拍子區(qū) 間以及前后M個(gè)拍子區(qū)間來(lái)提供相對(duì)和弦概率CP。然后,特征量準(zhǔn)備單元174將所關(guān)注的 拍子區(qū)間以及前后M個(gè)拍子區(qū)間上相同位置處的元素的概率值進(jìn)行加和,這些概率值被包 括在假定音符C作為基調(diào)的相對(duì)和弦概率中。結(jié)果,根據(jù)各種和弦的出現(xiàn)概率獲得和弦出 現(xiàn)得分(CEc,CECfl,. . . ,CEBm) (24維向量),出現(xiàn)概率是針對(duì)所關(guān)注的拍子區(qū)間和所關(guān)注的拍 子區(qū)間周?chē)亩鄠€(gè)拍子區(qū)間的并且是假定音符C作為基調(diào)的。特征量準(zhǔn)備單元174針對(duì)假 定從音符C至音符B的12個(gè)音符中的一個(gè)作為基調(diào)的每種情況,執(zhí)行上述和弦出現(xiàn)得分計(jì) 算。從而,針對(duì)一個(gè)所關(guān)注拍子區(qū)間獲得12個(gè)單獨(dú)的和弦出現(xiàn)得分。 接著,圖43是用于描述由特征量準(zhǔn)備單元174生成的各個(gè)拍子區(qū)間的和弦過(guò)渡出 現(xiàn)得分的說(shuō)明性示圖。 參考圖43,特征量準(zhǔn)備單元174首先關(guān)于拍子區(qū)間BDi與相鄰拍子區(qū)間BDi+1之間 的所有和弦對(duì)(即,所有和弦過(guò)渡),將和弦過(guò)渡前后的相對(duì)和弦概率彼此相乘,這些相對(duì) 和弦概率假定音符C作為基調(diào)。這里,"所有的和弦對(duì)"是指24X24個(gè)對(duì),即,"C" — "C"、 "C" —"C#"、"C,,一"D"、"B" —"B"。接著,特征量準(zhǔn)備單元174針對(duì)整個(gè)所關(guān)注的
拍子區(qū)間和前后M個(gè)區(qū)間,對(duì)和弦過(guò)渡前后的相對(duì)和弦概率的相乘結(jié)果進(jìn)行加和。結(jié)果, 根據(jù)各種和弦過(guò)渡的出現(xiàn)概率獲得24X24維和弦過(guò)渡出現(xiàn)得分(24X24維向量),出現(xiàn)概 率是針對(duì)所關(guān)注的拍子區(qū)間和所關(guān)注的拍子區(qū)間周?chē)亩鄠€(gè)拍子區(qū)間的并且是假定音符C 作為基調(diào)的。例如,對(duì)于所關(guān)注的拍子區(qū)間BDi,有關(guān)從"C"至"Cft"的和弦過(guò)渡的和弦過(guò)渡 出現(xiàn)得分CTc —Cfl(i)由下式給出。
[等式4] <formula>formula see original document page 25</formula>
特征量準(zhǔn)備單元174針對(duì)假定從音符C至音符B的12個(gè)音符中的一個(gè)音符作為 基調(diào)的每種情況,執(zhí)行上述24X24次單獨(dú)的和弦過(guò)渡出現(xiàn)得分CT計(jì)算。從而,對(duì)于一個(gè)所 關(guān)注的拍子區(qū)間,獲得12個(gè)單獨(dú)的和弦過(guò)渡出現(xiàn)得分。 此外,與可能因各個(gè)小節(jié)而變化的和弦不同,例如,樂(lè)曲的基調(diào)通常在較長(zhǎng)一段時(shí) 間保持不變。因此,對(duì)要用于和弦出現(xiàn)得分或和弦過(guò)渡出現(xiàn)得分的計(jì)算的相對(duì)和弦概率的 范圍進(jìn)行定義的M的值例如是可以包括許多小節(jié)(例如,幾十個(gè)拍子)的合適的值。
特征量準(zhǔn)備單元174向基調(diào)概率計(jì)算單元176輸出針對(duì)每個(gè)拍子區(qū)間計(jì)算出的24 維和弦出現(xiàn)得分CE和24X24維和弦過(guò)渡出現(xiàn)得分,作為用于計(jì)算基調(diào)概率的特征量。 [O302] (2-6-3.基調(diào)概率計(jì)算單元) 基調(diào)概率計(jì)算單元176通過(guò)使用從特征量準(zhǔn)備單元174輸入的和弦出現(xiàn)得分和和
弦過(guò)渡出現(xiàn)得分,針對(duì)各個(gè)拍子區(qū)間,計(jì)算指示各種基調(diào)被演奏的概率的基調(diào)概率。這里的
"各種基調(diào)"是指例如基于12個(gè)音符(C, C#, D,...)或調(diào)性(大調(diào)/小調(diào))來(lái)區(qū)分的基調(diào)。
例如,通過(guò)邏輯回歸分析預(yù)先獲得的基調(diào)概率公式可以用于基調(diào)概率的計(jì)算。 圖44是用于描述用于由基調(diào)概率計(jì)算單元176進(jìn)行的基調(diào)概率的計(jì)算的基調(diào)概
率公式的學(xué)習(xí)處理的說(shuō)明性示圖。
基調(diào)概率公式的學(xué)習(xí)是針對(duì)大調(diào)和小調(diào)獨(dú)立執(zhí)行的。即,通過(guò)學(xué)習(xí)獲得兩個(gè)公式, 即,大調(diào)概率公式和小調(diào)概率公式。 首先,提供正確基調(diào)已知的各個(gè)拍子區(qū)間的和弦出現(xiàn)得分和和弦過(guò)渡出現(xiàn)得分, 作為邏輯回歸分析中的獨(dú)立變量。 接著,針對(duì)所提供的和弦出現(xiàn)得分和和弦過(guò)渡出現(xiàn)得分對(duì)中的每一對(duì),提供用于 通過(guò)邏輯回歸分析預(yù)測(cè)生成概率的啞元數(shù)據(jù)(教師數(shù)據(jù))。例如,當(dāng)學(xué)習(xí)大調(diào)概率公式時(shí), 如果已知的基調(diào)是大調(diào),則啞元數(shù)據(jù)將為真值(1),并且當(dāng)是任何其它情況時(shí),啞元數(shù)據(jù)為 假值(0)。并且,當(dāng)學(xué)習(xí)小調(diào)概率公式時(shí),如果已知的基調(diào)是小調(diào),則鵬元數(shù)據(jù)將為真值 (1),并且當(dāng)是任何其它情況時(shí),啞元數(shù)據(jù)為假值(0)。 通過(guò)使用足夠數(shù)目的獨(dú)立變量和啞元數(shù)據(jù)對(duì)來(lái)執(zhí)行邏輯回歸分析,預(yù)先獲得用于 從和弦出現(xiàn)得分和和弦過(guò)渡出現(xiàn)得分對(duì)中計(jì)算出大調(diào)或小調(diào)的概率的基調(diào)概率公式。
然后,基調(diào)概率計(jì)算單元176將基調(diào)概率公式中的每一個(gè)應(yīng)用于從特征量準(zhǔn)備單 元174輸入的一對(duì)和弦出現(xiàn)得分和和弦過(guò)渡出現(xiàn)得分,并且針對(duì)各個(gè)拍子區(qū)間順次計(jì)算各 種基調(diào)的基調(diào)概率。 圖45是用于描述由基調(diào)概率計(jì)算單元176進(jìn)行的基調(diào)概率的計(jì)算處理的說(shuō)明性 示圖。 參考圖45(45A),基調(diào)概率計(jì)算單元176例如將預(yù)先通過(guò)學(xué)習(xí)獲得的大調(diào)概率公 式應(yīng)用于假定音符C為基調(diào)的一對(duì)和弦出現(xiàn)得分和和弦過(guò)渡出現(xiàn)得分,并且針對(duì)相應(yīng)拍子 區(qū)間計(jì)算基調(diào)為"C"的基調(diào)概率KPe?;{(diào)概率計(jì)算單元176還將小調(diào)概率公式應(yīng)用于假 定音符C為基調(diào)的這一對(duì)和弦出現(xiàn)得分和和弦過(guò)渡出現(xiàn)得分,并且針對(duì)相應(yīng)拍子區(qū)間計(jì)算 基調(diào)為"Cm"的基調(diào)概率KPCm。 類似地,基調(diào)概率計(jì)算單元176可以將大調(diào)概率公式和小調(diào)概率公式應(yīng)用于假定 音符C#為基調(diào)的一對(duì)和弦出現(xiàn)得分和和弦過(guò)渡出現(xiàn)得分,并且可以計(jì)算基調(diào)概率KPCfl和 KPCflm(45B)??梢哉f(shuō),對(duì)基調(diào)概率KPB和KPBm的計(jì)算同樣如此(45C)。 圖46是示出由基調(diào)概率計(jì)算單元176計(jì)算出的基調(diào)概率的示例的說(shuō)明性示圖。
參考圖46,對(duì)于從音符C至音符B的12個(gè)音符,針對(duì)某一拍子區(qū)間計(jì)算兩種類型 的基調(diào)概率,即針對(duì)"Maj (大調(diào))"和"m(小調(diào))"。根據(jù)圖46的示例,基調(diào)概率KPC是0. 90, 并且基調(diào)概率KPCm是0. 03 。此外,其它基調(diào)概率值都指示0 。 此外,在計(jì)算了所有類型的基調(diào)的基調(diào)概率之后,基調(diào)概率計(jì)算單元176以使得 每拍子區(qū)間所計(jì)算出的概率值的總和為1的方式對(duì)概率值進(jìn)行歸一化。針對(duì)音頻信號(hào)中所 包括的所有拍子區(qū)間重復(fù)如上所述由基調(diào)概率計(jì)算單元176進(jìn)行的計(jì)算和歸一化處理?;?調(diào)概率計(jì)算單元176以這種方式針對(duì)各個(gè)拍子區(qū)間來(lái)計(jì)算各個(gè)基調(diào)的基調(diào)概率,并且將基 調(diào)概率輸出給基調(diào)確定單元178。 此外,基調(diào)概率計(jì)算單元176根據(jù)針對(duì)從音符C至音符B的12個(gè)音符并且針對(duì)兩
種類型的基調(diào)(即,大調(diào)和小調(diào))所計(jì)算出的基調(diào)概率值來(lái)計(jì)算出不區(qū)分大調(diào)和小調(diào)的簡(jiǎn) 單基調(diào)概率。 圖47是用于描述由基調(diào)概率計(jì)算單元176進(jìn)行的簡(jiǎn)單基調(diào)概率的計(jì)算處理的說(shuō) 明性示圖。 參考圖47(47A),由基調(diào)概率計(jì)算單元176針對(duì)某一拍子區(qū)間計(jì)算出的基調(diào)概率KPC、 KPCm、 KPA和KPAm分別是0. 90、0. 03、0. 02和0. 05。其它基調(diào)概率值全都指示0。此時(shí), 基調(diào)概率計(jì)算單元176通過(guò)針對(duì)從音符C至音符B的12個(gè)音符對(duì)為平行調(diào)關(guān)系的基調(diào)的基 調(diào)概率值進(jìn)行加和,來(lái)計(jì)算不區(qū)分大調(diào)和小調(diào)的簡(jiǎn)單基調(diào)概率。例如,簡(jiǎn)單基調(diào)概率SKPc是 基調(diào)概率KPc和KP紐的總和,即,SKPc二 0.90+0. 05 = 0.95。這是因?yàn)镃大調(diào)(基調(diào)"C") 和A小調(diào)(基調(diào)"Am")為平行調(diào)關(guān)系。類似地針對(duì)音符C#至音符B執(zhí)行簡(jiǎn)單基調(diào)概率計(jì) 算。 由基調(diào)概率計(jì)算單元176計(jì)算出的12個(gè)單獨(dú)的簡(jiǎn)單基調(diào)概率SKPC至SKPB輸出給 和弦進(jìn)行檢測(cè)單元190。 [O320](基調(diào)確定單元) 基調(diào)確定單元178基于由基調(diào)概率計(jì)算單元176針對(duì)各個(gè)拍子區(qū)間計(jì)算出的各個(gè) 基調(diào)的基調(diào)概率,通過(guò)路徑搜索來(lái)確定有可能的基調(diào)進(jìn)行。例如,上述Viterbi算法可以用 作由基調(diào)確定單元178進(jìn)行的路徑搜索的方法。 圖48是用于描述由基調(diào)確定單元178進(jìn)行的路徑搜索的說(shuō)明性示圖。 在將Viterbi算法應(yīng)用于由基調(diào)確定單元178進(jìn)行的路徑搜索的情況中,拍子被
順次布置在時(shí)間軸(圖48中的水平軸)上。此外,已經(jīng)被計(jì)算出了基調(diào)概率的基調(diào)的類型
被用于觀測(cè)序列(圖48中的垂直軸)。S卩,基調(diào)確定單元178將所有已經(jīng)由基調(diào)概率計(jì)算
單元176計(jì)算出了基調(diào)概率的拍子和基調(diào)類型構(gòu)成的對(duì)中的每一對(duì)作為路徑搜索的對(duì)象節(jié)點(diǎn)。 關(guān)于上述節(jié)點(diǎn),基調(diào)確定單元178沿時(shí)間軸順次選擇這些節(jié)點(diǎn)中的任何一個(gè),并
且通過(guò)使用兩個(gè)評(píng)估值,(1)基調(diào)概率和(2)基調(diào)過(guò)渡概率,來(lái)評(píng)估由一連串所選擇的節(jié)點(diǎn)
形成的路徑。此外,在由基調(diào)確定單元178進(jìn)行對(duì)節(jié)點(diǎn)的選擇時(shí),不允許跳過(guò)拍子。 (1)基調(diào)概率是由基調(diào)概率計(jì)算單元176計(jì)算出的上述基調(diào)概率。對(duì)圖48中所示
的各個(gè)節(jié)點(diǎn)給出基調(diào)概率。另一方面,(2)基調(diào)過(guò)渡概率是對(duì)節(jié)點(diǎn)間的過(guò)渡給出的評(píng)估值。
基調(diào)過(guò)渡概率是基于正確基調(diào)已知的樂(lè)曲中轉(zhuǎn)調(diào)的發(fā)生概率,針對(duì)各種轉(zhuǎn)調(diào)樣式預(yù)先定義的。 圖49是示出基調(diào)過(guò)渡概率的示例的說(shuō)明性示圖。 與針對(duì)過(guò)渡的轉(zhuǎn)調(diào)量相應(yīng)的12個(gè)單獨(dú)的值被定義為以下4種樣式的基調(diào)過(guò)渡中 每種樣式的基調(diào)過(guò)渡概率從大調(diào)至大調(diào)、從大調(diào)至小調(diào)、從小調(diào)至大調(diào)和從小調(diào)至小調(diào)。 圖49示出與針對(duì)從大調(diào)至大調(diào)的基調(diào)過(guò)渡的轉(zhuǎn)調(diào)量相應(yīng)的12個(gè)單獨(dú)的概率值的示例。例 如,當(dāng)與轉(zhuǎn)調(diào)量Ak相關(guān)的基調(diào)過(guò)渡概率是Pr(Ak)時(shí),Pr(O)為0. 9987。這指示樂(lè)曲中基 調(diào)變化的概率很低。另一方面,Pr(l)為0.0002。這指示基調(diào)被升高一個(gè)音調(diào)(或被降低 11個(gè)音調(diào))的概率是0.02%。類似地,Pr (2) 、 Pr (3) 、 Pr (4) 、 Pr (5) 、 Pr (7) 、 Pr (8) 、 Pr (9) 和Pr(lO)分別是0.0001。并且,Pr(6)和Pr(ll)分別是0.0000。與轉(zhuǎn)調(diào)量相應(yīng)的12個(gè) 單獨(dú)的概率值還分別針對(duì)以下過(guò)渡樣式中的每種過(guò)渡樣式被定義從大調(diào)至小調(diào),從小調(diào) 至大調(diào)以及從小調(diào)至小調(diào)。 基調(diào)確定單元178關(guān)于表示使用圖48描述的基調(diào)進(jìn)行的各個(gè)路徑,將路徑中所包 括的各個(gè)節(jié)點(diǎn)的(1)基調(diào)概率和對(duì)節(jié)點(diǎn)間的過(guò)渡所給出的(2)基調(diào)過(guò)渡概率彼此順次相 乘。然后,基調(diào)確定單元178確定使得作為路徑評(píng)估值的相乘結(jié)果最大的路徑,作為表示有 可能的基調(diào)進(jìn)行的最優(yōu)路徑。
27
圖50是示出由基調(diào)確定單元178確定為最優(yōu)路徑的基調(diào)進(jìn)行的示例的說(shuō)明性示 圖。 在圖50中,在從樂(lè)曲的開(kāi)始到結(jié)束的時(shí)間尺度下,示出由基調(diào)確定單元178確定 的樂(lè)曲的基調(diào)進(jìn)行的示例。首先,從樂(lè)曲的開(kāi)始3分鐘,樂(lè)曲的基調(diào)是"Cm"。之后,樂(lè)曲的 基調(diào)變?yōu)?Cto"并且基調(diào)保持不變直到樂(lè)曲結(jié)束。 在上述由相對(duì)和弦概率生成單元172至基調(diào)確定單元178進(jìn)行的處理之后,由基 調(diào)檢測(cè)單元170進(jìn)行的基調(diào)檢測(cè)處理結(jié)束。由基調(diào)檢測(cè)單元170檢測(cè)到的基調(diào)進(jìn)行和基調(diào) 概率輸出給稍后描述的小節(jié)線檢測(cè)單元180和和弦進(jìn)行檢測(cè)單元190。
(2-7.小節(jié)線檢測(cè)單元) 小節(jié)線檢測(cè)單元180基于拍子概率、拍子區(qū)間之間的類似概率、各個(gè)拍子區(qū)間的
和弦概率、基調(diào)進(jìn)行以及各個(gè)拍子區(qū)間的基調(diào)概率,確定小節(jié)線進(jìn)行(bar progression),
小節(jié)線進(jìn)行指示一連串的拍子中各個(gè)拍子對(duì)應(yīng)于哪個(gè)節(jié)拍中的哪個(gè)拍數(shù)。 圖51是示出小節(jié)線檢測(cè)單元180的詳細(xì)配置的框圖。參考圖51,小節(jié)線檢測(cè)單元
180包括第一特征量提取單元181、第二特征量提取單元182、小節(jié)線概率計(jì)算單元184、小
節(jié)線概率校正單元186、小節(jié)線確定單元188和小節(jié)線重新確定單元189。 (2-7-1.第一特征量提取單元) 第一特征量提取單元181針對(duì)各個(gè)拍子區(qū)間,根據(jù)該拍子區(qū)間以及前后L個(gè)區(qū)間 的和弦概率和基調(diào)概率來(lái)提取第一特征量,作為用于稍后描述的小節(jié)線概率的計(jì)算的特征 圖52是用于描述由第一特征量提取單元181進(jìn)行的特征量提取處理的說(shuō)明性示 圖。 參考圖52,第一特征量包括(1)無(wú)和弦變化得分和(2)相對(duì)和弦得分,它們是從所 關(guān)注的拍子區(qū)間BDi以及前后L個(gè)拍子區(qū)間的和弦概率和基調(diào)概率中導(dǎo)出的。其中,無(wú)和 弦變化得分是所具有的維數(shù)與包括所關(guān)注的拍子區(qū)間BDi以及前后L個(gè)拍子區(qū)間在內(nèi)的區(qū) 間的數(shù)目相等的特征量。另一方面,相對(duì)和弦得分是對(duì)于所關(guān)注的拍子區(qū)間BDi以及前后L 個(gè)拍子區(qū)間中每個(gè)區(qū)間具有24維的特征量。例如,當(dāng)L是8時(shí),無(wú)和弦變化得分是17維的 而相對(duì)和弦得分是408維(17X24維)的,并且因此,第一特征量總共有425維。以下,將 描述無(wú)和弦變化得分和相對(duì)和弦得分。
(1)無(wú)和弦變化得分 無(wú)和弦變化得分是表示樂(lè)曲的和弦在特定范圍的區(qū)間中不改變的程度的特征量。 無(wú)和弦變化得分是通過(guò)將接下來(lái)所要描述的和弦穩(wěn)定性得分除以和弦不穩(wěn)定性得分獲得 的。 圖53是用于描述用于無(wú)和弦變化得分的計(jì)算的和弦穩(wěn)定性得分的說(shuō)明性示圖。
參考圖53,拍子區(qū)間BDi的和弦穩(wěn)定性得分包括元素CC(i-L)至CC(i+L) , CC(i-L) 至CC(i+L)中的每一個(gè)是針對(duì)拍子區(qū)間BDi以及前后L個(gè)拍子區(qū)間中的相應(yīng)區(qū)間來(lái)確定的。 這些元素中的每一個(gè)被計(jì)算出,作為目標(biāo)拍子區(qū)間與緊前的拍子區(qū)間之間具有相同名稱的 和弦的和弦概率的乘積的總和值。例如,通過(guò)對(duì)拍子區(qū)間BD卜h與拍子區(qū)間BDh的和弦概 率中具有相同名稱的和弦的和弦概率的乘積進(jìn)行加和,計(jì)算出和弦穩(wěn)定性得分CC(i-L)。以 類似的方式,通過(guò)對(duì)拍子區(qū)間BDi+w與拍子區(qū)間BD^的和弦概率中具有相同名稱的和弦的和弦概率的乘積進(jìn)行加和,計(jì)算出和弦穩(wěn)定性得分CC (i+L)。第一特征量提取單元181針對(duì) 整個(gè)所關(guān)注的拍子區(qū)間BDi以及前后L個(gè)拍子區(qū)間執(zhí)行上述計(jì)算,并且計(jì)算2L+1個(gè)單獨(dú)的 和弦穩(wěn)定性得分。 圖54是用于描述用于無(wú)和弦變化得分的計(jì)算的和弦不穩(wěn)定性得分的說(shuō)明性示 圖。 參考圖54,拍子區(qū)間BDi的和弦不穩(wěn)定性得分包括元素CU(i-L)至CU(i+L),這些 元素中的每一個(gè)是針對(duì)拍子區(qū)間BDi以及前后L個(gè)拍子區(qū)間中的相應(yīng)區(qū)間來(lái)確定的。這 些元素中的每一個(gè)被計(jì)算出,作為目標(biāo)拍子區(qū)間與緊前的拍子區(qū)間之間所有具有不同名稱 的和弦對(duì)的和弦概率的乘積的總和值。例如,通過(guò)對(duì)拍子區(qū)間BD卜h與拍子區(qū)間BDh的 和弦概率中具有不同名稱的和弦的和弦概率的乘積進(jìn)行加和,計(jì)算出和弦不穩(wěn)定性得分 CU(i-L)。以類似的方式,通過(guò)對(duì)拍子區(qū)間BDi+h與拍子區(qū)間BDi化的和弦概率中具有不同 名稱的和弦的和弦概率的乘積進(jìn)行加和,計(jì)算出和弦不穩(wěn)定性得分CU(i+L)。第一特征量提 取單元181針對(duì)整個(gè)所關(guān)注的拍子區(qū)間BDi以及前后L個(gè)拍子區(qū)間執(zhí)行上述計(jì)算,并且計(jì) 算2L+1個(gè)單獨(dú)的和弦不穩(wěn)定性得分。 此外,第一特征量提取單元181針對(duì)所關(guān)注的拍子區(qū)間BDi,通過(guò)針對(duì)每組2L+1個(gè)
元素將和弦穩(wěn)定性得分除以和弦不穩(wěn)定性得分來(lái)計(jì)算無(wú)和弦變化得分。例如,如果對(duì)于所
關(guān)注的拍子區(qū)間BDi,和弦穩(wěn)定性得分CC是(CCh,. . . ,CCi+J并且和弦不穩(wěn)定性得分CU是
(CU卜l, . . . , CUi+l),則無(wú)和弦變化得分CR是(CC卜l/CU卜l, . . . , CCi+l/CUi+J 。 所關(guān)注的拍子區(qū)間周?chē)慕o定范圍內(nèi)的和弦變化越少,無(wú)和弦變化得分指示越高
的值。第一特征量提取單元181計(jì)算音頻信號(hào)中所包括的所有拍子區(qū)間的無(wú)和弦變化得分。 (2)相對(duì)和弦得分 相對(duì)和弦得分是表示給定范圍內(nèi)的區(qū)間上和弦的出現(xiàn)概率及其樣式的特征量。相 對(duì)和弦得分是通過(guò)根據(jù)從基調(diào)檢測(cè)單元170輸入的基調(diào)進(jìn)行來(lái)轉(zhuǎn)移和弦概率的元素位置 而生成的。 圖55是用于描述相對(duì)和弦得分的生成處理的說(shuō)明性示圖。 與圖50 —樣,圖55 (55A)示出由基調(diào)檢測(cè)單元170確定的基調(diào)進(jìn)行的示例。根據(jù) 基調(diào)進(jìn)行,樂(lè)曲的基調(diào)在從樂(lè)曲的開(kāi)始起3分鐘后從"B"變?yōu)?Cto"。此外,還示出所關(guān)注 的拍子區(qū)間BDi的位置,拍子區(qū)間BDi在前后L個(gè)區(qū)間內(nèi)包括基調(diào)改變的時(shí)間點(diǎn)。
此時(shí),第一特征量提取單元181針對(duì)基調(diào)為"B"的拍子區(qū)間生成相對(duì)和弦概率, 其中拍子區(qū)間的包括大調(diào)和小調(diào)的24維和弦概率的元素的位置被轉(zhuǎn)移使得和弦概率CPB 在開(kāi)始處出現(xiàn)。同樣,第一特征量提取單元181針對(duì)基調(diào)為"Cto"的拍子區(qū)間生成相對(duì)和 弦概率,其中拍子區(qū)間的包括大調(diào)和小調(diào)的24維和弦概率的元素的位置被轉(zhuǎn)移使得和弦 概率CP^在開(kāi)始處出現(xiàn)。第一特征量提取單元181針對(duì)所關(guān)注的拍子區(qū)間以及前后L個(gè) 區(qū)間中的每個(gè)區(qū)間來(lái)生成這樣的相對(duì)和弦概率,并且輸出所生成的相對(duì)和弦概率的集合 ((2L+1) X24維特征量向量)作為相對(duì)和弦得分。 從如上所述的(1)無(wú)和弦變化得分和(2)相對(duì)和弦得分形成的第一特征量從第一 特征量提取單元181輸出到小節(jié)線概率計(jì)算單元184。
(2-7-2.第二特征量提取單元)
第二特征量提取單元182針對(duì)各個(gè)拍子區(qū)間,根據(jù)拍子區(qū)間以及前后L個(gè)區(qū)間上 拍子概率中的變化特征來(lái)提取第二特征量,作為用于稍后描述的小節(jié)線概率計(jì)算的特征 圖56是用于描述由第二特征量提取單元182進(jìn)行的特征量提取處理的說(shuō)明性示 圖。 參考圖56,沿時(shí)間軸示出從拍子概率計(jì)算單元120輸入的拍子概率。此外,還示出 通過(guò)分析拍子概率檢測(cè)到的6個(gè)拍子以及所關(guān)注的拍子區(qū)間BDi作為示例。第二特征量提 取單元182關(guān)于拍子概率來(lái)計(jì)算各個(gè)小區(qū)間SDj的拍子概率的平均值,小區(qū)間SDj具有特定 持續(xù)時(shí)間并且被包括在整個(gè)所關(guān)注的拍子區(qū)間BDi以及前后L個(gè)區(qū)間上的拍子區(qū)間中。
例如,為了主要檢測(cè)音符值(N/M拍的M)是4的節(jié)拍,優(yōu)選用在拍子間隔的1/4和 3/4的位置處劃分拍子間隔的線來(lái)將小區(qū)間相互劃分開(kāi)。在這種情況中,將針對(duì)一個(gè)所關(guān)注 的拍子區(qū)間BDi計(jì)算LX4+1個(gè)拍子概率的平均值。因此,由第二特征量提取單元182計(jì)算 出的第二特征量對(duì)于每個(gè)所關(guān)注的拍子區(qū)間將具有LX4+1維。并且,小區(qū)間的持續(xù)時(shí)間是 拍子間隔的1/2。 此外,為了恰當(dāng)?shù)貦z測(cè)樂(lè)曲中的小節(jié)線,希望分析至少若干個(gè)小節(jié)的音頻信號(hào)的 特征。因此,優(yōu)選定義用于第二特征量的提取的拍子概率的范圍的L的值例如是8個(gè)拍子。 當(dāng)L為8時(shí),由第二特征量提取單元182提取的第二特征量對(duì)于每個(gè)所關(guān)注的拍子區(qū)間是 33維的。 上述第二特征量從第二特征量提取單元182輸出到小節(jié)線概率計(jì)算單元184。
(2-7-3.小節(jié)線概率計(jì)算單元) 小節(jié)線概率計(jì)算單元184通過(guò)使用上述第一特征量和第二特征量來(lái)計(jì)算各個(gè)拍 子的小節(jié)線概率。在本說(shuō)明書(shū)中,小節(jié)線概率是指各個(gè)拍子是X節(jié)拍中第Y個(gè)拍子的概率 的集合。此外,在本實(shí)施例中,各種節(jié)拍中的各個(gè)拍數(shù)成為辨別的對(duì)象,各種節(jié)拍是1/4節(jié) 拍、2/4節(jié)拍、3/4節(jié)拍和4/4節(jié)拍中的任何一種。即,在本實(shí)施例中,存在X與Y的10種單 獨(dú)集合,即,(l,l)、 (2,1)、 (2,2)、 (3,1)、 (3,2)、 (3,3)、 (4,1)、 (4,2)、 (4,3)和(4'4),并且 計(jì)算IO種類型的小節(jié)線概率。此外,由稍后所述的小節(jié)線概率校正單元186考慮樂(lè)曲的結(jié) 構(gòu)來(lái)校正由小節(jié)線概率計(jì)算單元184計(jì)算出的概率值。S卩,由小節(jié)線概率計(jì)算單元184計(jì) 算出的概率是有待校正的中間數(shù)據(jù)。通過(guò)邏輯回歸分析預(yù)先習(xí)得的小節(jié)線概率公式例如可 以用于由小節(jié)線概率計(jì)算單元184進(jìn)行的小節(jié)線概率的計(jì)算。 圖57是用于描述用于由小節(jié)線概率計(jì)算單元184進(jìn)行的小節(jié)線概率的計(jì)算的小 節(jié)線概率公式的學(xué)習(xí)處理的說(shuō)明性示圖。 此外,對(duì)小節(jié)線概率公式的學(xué)習(xí)是針對(duì)上述各種類型的小節(jié)線概率來(lái)執(zhí)行的。艮P, 當(dāng)假定要辨別各個(gè)拍子在1/4節(jié)拍、2/4節(jié)拍、3/4節(jié)拍和4/4節(jié)拍中的拍數(shù)時(shí),要通過(guò)學(xué)習(xí) 獲得10個(gè)單獨(dú)的小節(jié)線概率公式。 首先,提供多個(gè)第一特征量和第二特征量對(duì),作為用于邏輯回歸分析的獨(dú)立變量, 這些第一特征量和第二特征量對(duì)是通過(guò)對(duì)正確節(jié)拍(X)和拍子的正確拍數(shù)(Y)已知的音頻 信號(hào)進(jìn)行分析提取出來(lái)的。 接著,提供用于通過(guò)邏輯回歸分析來(lái)預(yù)測(cè)所提供的第一特征量與第二特征量對(duì)中 每一對(duì)的生成概率的啞元數(shù)據(jù)(教師數(shù)據(jù))。例如,當(dāng)學(xué)習(xí)用于辨別1/4節(jié)拍中的第一個(gè)拍子以計(jì)算拍子為1/4節(jié)拍中的第一個(gè)拍子的概率的公式時(shí),如果已知的節(jié)拍和拍數(shù)是(1, l),則啞元數(shù)據(jù)的值將為真值(l),并且對(duì)于任何其它情況,啞元數(shù)據(jù)的值將為假值(0)。同 樣,當(dāng)學(xué)習(xí)用于辨別2/4節(jié)拍中的第一個(gè)拍子以計(jì)算拍子是2/4節(jié)拍中的第一個(gè)拍子的概 率的公式時(shí),例如,如果已知的節(jié)拍和拍數(shù)是(2,1),則啞元數(shù)據(jù)的值將為真值(l),并且對(duì) 于任何其它情況,啞元數(shù)據(jù)的值將為假值(0)??梢哉f(shuō),對(duì)于其它節(jié)拍和拍數(shù)同樣如此。
通過(guò)如上所述使用足夠數(shù)目的獨(dú)立變量和啞元數(shù)據(jù)對(duì)來(lái)執(zhí)行邏輯回歸分析,預(yù)先 獲得10種類型的小節(jié)線概率公式,這些小節(jié)線概率公式用于從一對(duì)第一特征量和第二特 征量中計(jì)算小節(jié)線概率。 然后,小節(jié)線概率計(jì)算單元184將小節(jié)線概率公式應(yīng)用于分別從第一特征量提取 單元181和第二特征量提取單元182輸入的一對(duì)第一特征量和第二特征量,并且針對(duì)各個(gè) 拍子區(qū)間順次計(jì)算小節(jié)線概率。 圖58是用于描述由小節(jié)線概率計(jì)算單元184進(jìn)行的小節(jié)線概率的計(jì)算處理的說(shuō) 明性示圖。 參考圖58,小節(jié)線概率計(jì)算單元184例如將預(yù)先獲得的用于辨別1/4節(jié)拍中的第 一個(gè)拍子的公式應(yīng)用于針對(duì)所關(guān)注的拍子區(qū)間提取的一對(duì)第一特征量和第二特征量,并且 計(jì)算拍子是1/4節(jié)拍中的第一個(gè)拍子的小節(jié)線概率P^' (l,l)。同樣,小節(jié)線概率計(jì)算單 元184將預(yù)先獲得的用于辨別2/4節(jié)拍中的第一個(gè)拍子的公式應(yīng)用于針對(duì)所關(guān)注的拍子區(qū) 間提取的一對(duì)第一特征量和第二特征量,并且計(jì)算拍子是2/4節(jié)拍中的第一個(gè)拍子的小節(jié)
線概率P^' (2,1)??梢哉f(shuō),對(duì)于其它節(jié)拍和拍數(shù)同樣如此。 小節(jié)線概率計(jì)算單元184針對(duì)所有拍子重復(fù)小節(jié)線概率計(jì)算,并且計(jì)算各個(gè)拍子 的小節(jié)線概率。由小節(jié)線概率計(jì)算單元184針對(duì)各個(gè)拍子計(jì)算出的小節(jié)線概率輸出給接下 來(lái)所描述的小節(jié)線概率校正單元186。
(2-7-4.小節(jié)線概率校正單元) 小節(jié)線概率校正單元186基于從結(jié)構(gòu)分析單元150輸入的拍子區(qū)間之間的類似概 率,校正從小節(jié)線概率計(jì)算單元184輸入的小節(jié)線概率。 例如,假定第i個(gè)所關(guān)注的拍子是X節(jié)拍中的第Y個(gè)拍子的小節(jié)線概率(該小節(jié) 線概率還有待校正)是& ' (i,x,y),并且第i個(gè)拍子區(qū)間與第j個(gè)拍子區(qū)間之間的類似
概率是SP(i, j)。然后,校正后的小節(jié)線概率P^(i,X,y)例如由下式給出。[等式5] (/,X,力=(乂,X,力 即,校正后的小節(jié)線概率Pb (i, x, y)是通過(guò)使用歸一化后的類似概率作為權(quán)重來(lái) 對(duì)校正前的小節(jié)線概率求加權(quán)和而獲得的值,其中,類似概率是與所關(guān)注的拍子相對(duì)應(yīng)的 配置區(qū)間與其它拍子區(qū)間之間的類似概率。通過(guò)這樣的概率值校正,與校正前的小節(jié)線概 率相比較,相似聲音內(nèi)容的拍子的小節(jié)線概率將具有更接近的值。由小節(jié)線概率校正單元 186校正后的各個(gè)拍子的小節(jié)線概率輸出給接下來(lái)所描述的小節(jié)線確定單元188。
(2-7-5.小節(jié)線確定單元)
SP(i,j)
(5)
31
小節(jié)線確定單元188基于從小節(jié)線概率校正單元186輸入的小節(jié)線概率,通過(guò)路 徑搜索來(lái)確定有可能的小節(jié)線進(jìn)行,小節(jié)線概率指示各個(gè)拍子是X節(jié)拍中的第Y個(gè)拍子的 概率。上述Viterbi算法例如可以用作由小節(jié)線確定單元188進(jìn)行的路徑搜索的方法。
圖59是用于描述由小節(jié)線確定單元188進(jìn)行的路徑搜索的說(shuō)明性示圖。
在將Viterbi算法應(yīng)用于由小節(jié)線確定單元188進(jìn)行的路徑搜索的情況中,拍子 被順次布置在時(shí)間軸(圖59中的水平軸)上。此外,小節(jié)線概率已被計(jì)算出的拍子的類型 (X節(jié)拍中的第Y個(gè)拍子)被用于觀測(cè)序列(圖59中的垂直軸)。S卩,小節(jié)線確定單元188 將從小節(jié)線概率校正單元186輸入的拍子和拍子類型的所有對(duì)中的每一對(duì)作為路徑搜索 的對(duì)象節(jié)點(diǎn)。 關(guān)于上述節(jié)點(diǎn),小節(jié)線確定單元188沿時(shí)間軸順次選擇這些節(jié)點(diǎn)中的任何節(jié)點(diǎn)。 然后,小節(jié)線確定單元188使用兩個(gè)評(píng)估值,(1)小節(jié)線概率和(2)節(jié)拍變化概率,來(lái)評(píng)估 由 一連串所選擇的節(jié)點(diǎn)形成的路徑。 此外,在由小節(jié)線確定單元188進(jìn)行節(jié)點(diǎn)的選擇時(shí),例如優(yōu)選施加下述約束。第
一,禁止跳過(guò)拍子。第二,禁止在小節(jié)的中間從一種節(jié)拍過(guò)渡至另一節(jié)拍(例如,從四節(jié)拍
中的第一個(gè)至第三個(gè)拍子中的任何拍子或三節(jié)拍中的第一個(gè)或第二個(gè)拍子開(kāi)始的過(guò)渡),
或從一種節(jié)拍過(guò)渡至另一節(jié)拍的小節(jié)的中間。第三,禁止不按次序的過(guò)渡,例如,從第一個(gè)
拍子至第三個(gè)或第四個(gè)拍子,或從第二個(gè)拍子至第二個(gè)拍子或第四個(gè)拍子。 現(xiàn)在,在用于小節(jié)線確定單元188的路徑評(píng)估的評(píng)估值中,(1)小節(jié)線概率是通過(guò)
由小節(jié)線概率校正單元186校正小節(jié)線概率而計(jì)算出的上述小節(jié)線概率。對(duì)圖59中示出
的各個(gè)節(jié)點(diǎn)給出小節(jié)線概率。另一方面,(2)節(jié)拍變化概率是對(duì)節(jié)點(diǎn)之間的過(guò)渡所給出的
評(píng)估值。節(jié)拍變化概率是通過(guò)從許多普通樂(lè)曲中收集在小節(jié)線的進(jìn)行期間節(jié)拍變化的發(fā)生
概率,針對(duì)變化前的拍子類型和變化后的拍子類型的每種組合被預(yù)先定義的。 圖60是用于示出節(jié)拍變化概率的示例的說(shuō)明性示圖。 參考圖60,示出基于變化前的4種類型的節(jié)拍和變化后4種類型的節(jié)拍導(dǎo)出的16 種單獨(dú)的節(jié)拍變化概率。在該示例中,針對(duì)從四節(jié)拍變?yōu)閱喂?jié)拍的節(jié)拍變化概宰是0. 05,從 四節(jié)拍變?yōu)槎?jié)拍的節(jié)拍變化概率是0. 03,從四節(jié)拍變?yōu)槿?jié)拍的節(jié)拍變化概率是0. 02, 而從四節(jié)拍變?yōu)樗墓?jié)拍(即,沒(méi)有變化)的節(jié)拍變化概率是0.90。這指明節(jié)拍在樂(lè)曲中間 改變的可能性一般不高。 此外,關(guān)于單節(jié)拍或二節(jié)拍,如果所檢測(cè)到的小節(jié)線的位置由于小節(jié)線的檢測(cè)誤 差而從其正確的位置偏移,則節(jié)拍變化概率可以用來(lái)自動(dòng)恢復(fù)小節(jié)線的位置。因此,優(yōu)選將 單節(jié)拍或二節(jié)拍與另一節(jié)拍之間的節(jié)拍變化概率值設(shè)置為比三節(jié)拍或四節(jié)拍與另一節(jié)拍 之間的節(jié)拍變化概率高。 小節(jié)線確定單元188關(guān)于表示使用圖59描述的小節(jié)線進(jìn)行的各個(gè)路徑,順次將路 徑中所包括的各個(gè)節(jié)點(diǎn)的(1)小節(jié)線概率和對(duì)節(jié)點(diǎn)間的過(guò)渡所給出的上述(2)節(jié)拍變化概 率彼此相乘。然后,小節(jié)線確定單元188確定使得作為路徑評(píng)估值的相乘結(jié)果最大的路徑, 作為表示有可能的小節(jié)線進(jìn)行的最優(yōu)路徑。 圖61是示出由小節(jié)線確定單元188確定為最優(yōu)路徑的小節(jié)線進(jìn)行的示例的說(shuō)明 性示圖。 在圖61中,針對(duì)第一至第八個(gè)拍子示出被小節(jié)線確定單元188確定為最優(yōu)路徑的小節(jié)線進(jìn)行(參見(jiàn)粗線框)。根據(jù)該示例,從第一個(gè)拍子開(kāi)始各個(gè)拍子的類型順次是四節(jié)
拍中的第一個(gè)拍子、四節(jié)拍中的第二個(gè)拍子、四節(jié)拍中的第三個(gè)拍子、四節(jié)拍中的第四個(gè)拍
子、四節(jié)拍中的第一個(gè)拍子、四節(jié)拍中的第二個(gè)拍子、四節(jié)拍中的第三個(gè)拍子、四節(jié)拍中的
第四個(gè)拍子。由小節(jié)線確定單元188確定的、表示小節(jié)線進(jìn)行的最優(yōu)路徑輸出給接下來(lái)所
描述的小節(jié)線重新確定單元189。 (2-7-6.小節(jié)線重新確定單元) 在普通樂(lè)曲中,拍子類型的三節(jié)拍和四節(jié)拍很少以混合的方式存在。因此,小節(jié)線 重新確定單元189首先判定對(duì)于出現(xiàn)在從小節(jié)線確定單元188輸入的小節(jié)線進(jìn)行中的拍子 類型,三節(jié)拍和四節(jié)拍是否以混合的方式存在。然后,如果拍子類型的三節(jié)拍和四節(jié)拍以混 合的方式存在,則小節(jié)線重新確定單元189從搜索對(duì)象中排除較不經(jīng)常出現(xiàn)的節(jié)拍,并且 再次搜索表示小節(jié)線進(jìn)行的最優(yōu)路徑。根據(jù)所述由小節(jié)線重新確定單元189進(jìn)行的路徑重 新搜索處理,可以減少可能在路徑搜索的結(jié)果中局部出現(xiàn)的小節(jié)線(拍子類型)識(shí)別誤差。
在由第一特征量提取單元181至小節(jié)線重新確定單元189進(jìn)行的處理之后,由小 節(jié)線檢測(cè)單元180進(jìn)行的小節(jié)線檢測(cè)處理結(jié)束。由小節(jié)線檢測(cè)單元180檢測(cè)到的小節(jié)線進(jìn) 行(一連串拍子的類型)輸出給接下來(lái)所描述的和弦進(jìn)行檢測(cè)單元190。
(2-8.和弦進(jìn)行檢測(cè)單元) 和弦進(jìn)行檢測(cè)單元190基于各個(gè)拍子的簡(jiǎn)單基調(diào)概率、拍子區(qū)間之間的類似概率
以及小節(jié)線進(jìn)行來(lái)針對(duì)各個(gè)拍子區(qū)間確定一連串和弦的有可能的和弦進(jìn)行。 圖62是示出和弦進(jìn)行檢測(cè)單元190的詳細(xì)配置的框圖。參考圖62,和弦進(jìn)行檢測(cè)
單元190包括拍子區(qū)間特征量計(jì)算單元192、根音特征量準(zhǔn)備單元194、和弦概率計(jì)算單元
196、和弦概率校正單元197和和弦進(jìn)行確定單元198。 (2-8-1.拍子區(qū)間特征量計(jì)算單元) 和和弦概率計(jì)算單元160的拍子區(qū)間特征量計(jì)算單元162 —樣,拍子區(qū)間特征量 計(jì)算單元192首先計(jì)算相應(yīng)12個(gè)音符的能量(參見(jiàn)針對(duì)相應(yīng)12個(gè)音符的能量的計(jì)算處理 的圖28至圖30)。可替換地,拍子區(qū)間特征量計(jì)算單元192可以獲得并且使用由拍子區(qū)間 特征量計(jì)算單元162計(jì)算出的相應(yīng)12個(gè)音符的能量。 接著,拍子區(qū)間特征量計(jì)算單元192生成擴(kuò)展拍子區(qū)間特征量,擴(kuò)展拍子區(qū)間特 征量包括所關(guān)注的拍子區(qū)間以及前后N個(gè)區(qū)間的相應(yīng)12個(gè)音符的能量以及從基調(diào)檢測(cè)單 元170輸入的簡(jiǎn)單基調(diào)概率。 圖63是用于描述由拍子區(qū)間特征量計(jì)算單元192生成的擴(kuò)展拍子區(qū)間特征量的 說(shuō)明性示圖。 參考圖63,例如,由拍子區(qū)間特征量計(jì)算單元192提取出了所關(guān)注拍子區(qū)間BDi以 及前后N個(gè)區(qū)間各自的相應(yīng)12個(gè)音符的能量BF卜2、 BF卜p BFi、 BFi+1和BFi+2。此外,這里的 N例如是2。此外,由拍子區(qū)間特征量計(jì)算單元192獲得所關(guān)注的拍子區(qū)間BDi的簡(jiǎn)單基調(diào) 概率(SKP" . . . , SKPB)。拍子區(qū)間特征量計(jì)算單元192針對(duì)所有的拍子區(qū)間,生成擴(kuò)展拍子 區(qū)間特征量,并且將其輸出到根音特征量準(zhǔn)備單元194,擴(kuò)展拍子區(qū)間特征量包括簡(jiǎn)單基調(diào) 概率和拍子區(qū)間以及前后N個(gè)區(qū)間的相應(yīng)12個(gè)音符的能量。 [(M01] (2-8-2.根音特征量準(zhǔn)備單元) 根音特征量準(zhǔn)備單元194轉(zhuǎn)移從拍子區(qū)間特征量計(jì)算單元192輸入的擴(kuò)展拍子區(qū)間特征量的元素位置,并且生成12個(gè)單獨(dú)的擴(kuò)展根音特征量。 圖64是用于描述由根音特征量準(zhǔn)備單元194進(jìn)行的擴(kuò)展根音特征量生成處理的 說(shuō)明性示圖。 參考圖64,首先,根音特征量準(zhǔn)備單元194將從拍子區(qū)間特征量計(jì)算單元192輸入 的擴(kuò)展拍子區(qū)間特征量作為用音符C作為根音的擴(kuò)展根音特征量。接著,根音特征量準(zhǔn)備 單元194通過(guò)將用音符C作為根音的擴(kuò)展根音特征量的12個(gè)音符的元素位置轉(zhuǎn)移特定數(shù) 目,生成11個(gè)單獨(dú)的擴(kuò)展拍子區(qū)間特征量,每個(gè)擴(kuò)展拍子區(qū)間特征量將音符C#至音符B中 的任何一個(gè)作為根音。此外,元素位置被轉(zhuǎn)移的轉(zhuǎn)移數(shù)與用于使用圖36描述的由根音特征 量準(zhǔn)備單元164進(jìn)行的根音特征量生成處理的轉(zhuǎn)移數(shù)相同。 根音特征量準(zhǔn)備單元194針對(duì)所有的拍子區(qū)間執(zhí)行上述擴(kuò)展根音特征量生成處 理,并且準(zhǔn)備要用于各個(gè)區(qū)間的和弦概率的重新計(jì)算的擴(kuò)展根音特征量。由根音特征量準(zhǔn) 備單元194生成的擴(kuò)展根音特征量輸出給和弦概率計(jì)算單元196。 [CMOS] (2-8-3.和弦概率計(jì)算單元) 和弦概率計(jì)算單元196針對(duì)各個(gè)拍子區(qū)間,通過(guò)使用從根音特征量準(zhǔn)備單元194 輸入的根音特征量來(lái)計(jì)算指示各種和弦被演奏的概率的和弦概率。如上所述,這里的"各種 和弦"是指例如通過(guò)根音(C, C#, D,...)、構(gòu)成音符的數(shù)目(三和弦、七和弦、九和弦)、調(diào)性 (大調(diào)/小調(diào))等來(lái)區(qū)分的和弦中的每一個(gè)和弦。通過(guò)邏輯回歸分析預(yù)先習(xí)得的擴(kuò)展和弦 概率公式例如可以用于和弦概率的計(jì)算。 圖65是用于描述對(duì)擴(kuò)展和弦概率公式的學(xué)習(xí)處理的說(shuō)明性示圖,擴(kuò)展和弦概率 公式用于由和弦概率計(jì)算單元196進(jìn)行的對(duì)和弦概率的重新計(jì)算。 此外,和針對(duì)和弦概率公式的情況一樣,對(duì)擴(kuò)展和弦概率公式的學(xué)習(xí)是針對(duì)每種 和弦類型來(lái)進(jìn)行的。即,以下所描述的學(xué)習(xí)處理例如是針對(duì)以下每種公式來(lái)執(zhí)行的用于大 和弦的擴(kuò)展和弦概率公式、用于小和弦的擴(kuò)展和弦概率公式、用于七和弦的擴(kuò)展和弦概率 公式和用于九和弦的擴(kuò)展和弦概率公式。 首先,分別針對(duì)正確和弦已知的拍子區(qū)間提供多個(gè)擴(kuò)展根音特征量(例如,使用 圖64描述的12個(gè)單獨(dú)的12X6維向量),作為用于邏輯回歸分析的獨(dú)立變量。
此外,針對(duì)各個(gè)拍子區(qū)間的擴(kuò)展根音特征量中的每一個(gè),提供用于通過(guò)邏輯回歸 分析來(lái)預(yù)測(cè)生成概率的啞元數(shù)據(jù)(教師數(shù)據(jù))。當(dāng)學(xué)習(xí)用于大和弦的擴(kuò)展和弦概率公式 時(shí),如果已知的和弦是大和弦,則啞元數(shù)據(jù)的值將是真值(l),并且對(duì)于任何其它情況,啞元 數(shù)據(jù)的值將是假值(0)。同樣,當(dāng)學(xué)習(xí)用于小和弦的擴(kuò)展和弦概率公式時(shí),如果已知的和弦 是小和弦,則啞元數(shù)據(jù)的值將是真值(1),并且對(duì)于任何其它情況,啞元數(shù)據(jù)的值將是假值 (0)。可以說(shuō),對(duì)于七和弦和九和弦同樣如此。 通過(guò)使用上述獨(dú)立變量和鵬元數(shù)據(jù)來(lái)對(duì)足夠數(shù)目的擴(kuò)展根音特征量(每個(gè)擴(kuò)展 根音特征量是針對(duì)一個(gè)拍子區(qū)間的)執(zhí)行邏輯回歸分析,預(yù)先獲得用于從根音特征量中重 新計(jì)算各個(gè)和弦概率的擴(kuò)展和弦概率公式。 然后,和弦概率計(jì)算單元196將預(yù)先獲得的擴(kuò)展和弦概率公式應(yīng)用于從根音特征 量準(zhǔn)備單元194輸入的擴(kuò)展根音特征量,并且針對(duì)各個(gè)拍子區(qū)間順次計(jì)算和弦概率。
圖66是用于描述由和弦概率計(jì)算單元196進(jìn)行的對(duì)和弦概率的重新計(jì)算處理的 說(shuō)明性示圖。
參考圖66(66A),示出各個(gè)拍子區(qū)間的擴(kuò)展根音特征量中,用音符C作為根音的擴(kuò) 展根音特征量。和弦概率計(jì)算單元196例如將通過(guò)學(xué)習(xí)預(yù)先獲得的用于大和弦的擴(kuò)展和 弦概率公式應(yīng)用于用音符C作為根音的擴(kuò)展根音特征量,并且針對(duì)該拍子區(qū)間計(jì)算和弦為 "C"的和弦概率CP' e。此外,和弦概率計(jì)算單元196將用于小和弦的擴(kuò)展和弦概率公式應(yīng) 用于用音符C作為根音的擴(kuò)展根音特征量,并且針對(duì)該拍子區(qū)間重新計(jì)算和弦為"Cm"的和 弦概率CP' Cm。 以相似的方式,和弦概率計(jì)算單元196將用于大和弦的擴(kuò)展和弦概率公式和用 于小和弦的擴(kuò)展和弦概率公式應(yīng)用于用音符C#作為根音的擴(kuò)展根音特征量,并且重新 計(jì)算和弦概率CP' ^和和弦概率CP' eflm(66B)??梢哉f(shuō),對(duì)和弦概率CP' b、和弦概率 CP' Bm(66C)以及未示出的其它類型的和弦(包括七和弦、九和弦等)的和弦概率的計(jì)算也 是如此。 和弦概率計(jì)算單元196針對(duì)所有所關(guān)注的拍子區(qū)間重復(fù)如上所述的和弦概率重 新計(jì)算處理,并且向接下來(lái)描述的和弦概率校正單元197輸出所重新計(jì)算出的和弦概率。
(2-8-4.和弦概率校正單元) 和弦概率校正單元197基于從結(jié)構(gòu)分析單元150輸入的拍子區(qū)間之間的類似概 率,校正由和弦概率計(jì)算單元196重新計(jì)算出的和弦概率。 例如,假定第i個(gè)所關(guān)注的拍子區(qū)間中和弦X的和弦概率是CP' x(i),并且第 i個(gè)拍子區(qū)間和第j個(gè)拍子區(qū)間之間的類似概率是SP(i, j)。然后,校正后的和弦概率 CP" x(i)例如由下式給出。
[等式6]
闊O')二i:c尸;(y). S卩,校正后的和弦概率CP" x(i)是通過(guò)利用歸一化后的類似概率來(lái)對(duì)和弦概率求 加權(quán)和而獲得的值,其中與所關(guān)注的拍子相對(duì)應(yīng)的拍子區(qū)間與另一拍子區(qū)間之間的類似概 率中的每一個(gè)類似概率被用作權(quán)重。通過(guò)這樣的概率值校正,具有相似聲音內(nèi)容的拍子區(qū) 間的和弦概率相比于校正前將具有更接近的值。由和弦概率校正單元197校正后的各個(gè)拍 子區(qū)間的和弦概率輸出給接下來(lái)所描述的和弦進(jìn)行確定單元198。
(2-8-5.和弦進(jìn)行確定單元) 和弦進(jìn)行確定單元198基于從和弦概率校正單元197輸入的各個(gè)拍子位置的和弦 概率,通過(guò)路徑搜索來(lái)確定有可能的和弦進(jìn)行。上述Viterbi算法例如可以用作由和弦進(jìn) 行確定單元198進(jìn)行的路徑搜索的方法。 圖67是用于描述由和弦進(jìn)行確定單元198進(jìn)行的路徑搜索的說(shuō)明性示圖。
在將Viterbi算法應(yīng)用于由和弦進(jìn)行確定單元198進(jìn)行的路徑搜索的情況中,拍 子被順次布置在時(shí)間軸(圖67中的水平軸)上。此外,和弦概率已被計(jì)算出的和弦類型被 用作觀測(cè)序列(圖67中的垂直軸)。即,和弦進(jìn)行確定單元198將所有和弦類型與從和弦 概率校正單元197輸入的拍子區(qū)間對(duì)中的每一對(duì)作為路徑搜索的對(duì)象節(jié)點(diǎn)。
關(guān)于上述節(jié)點(diǎn),和弦進(jìn)行確定單元198沿時(shí)間軸順次選擇這些節(jié)點(diǎn)中的任何節(jié)
SP(i,j
(6)
35點(diǎn)。然后,和弦進(jìn)行確定單元198使用以下四種評(píng)估值來(lái)對(duì)由一連串所選擇的節(jié)點(diǎn)形成的 路徑進(jìn)行評(píng)估(l)和弦概率,(2)依賴于基調(diào)的和弦出現(xiàn)概率,(3)依賴于小節(jié)線的和弦過(guò) 渡概率和(4)依賴于基調(diào)的和弦過(guò)渡概率。此外,在由和弦進(jìn)行確定單元198進(jìn)行對(duì)節(jié)點(diǎn) 的選擇時(shí),不允許跳過(guò)拍子。 在用于由和弦進(jìn)行確定單元198進(jìn)行的路徑評(píng)估的評(píng)估值中,(1)和弦概率是由 和弦概率校正單元197校正后的上述和弦概率。對(duì)圖67中所示的各個(gè)節(jié)點(diǎn)給出和弦概率。
此外,(2)依賴于基調(diào)的和弦出現(xiàn)概率是依賴于根據(jù)從基調(diào)檢測(cè)單元170輸入的 基調(diào)進(jìn)行而針對(duì)各個(gè)拍子區(qū)間指定的基調(diào)的、各種和弦的出現(xiàn)概率。依賴于基調(diào)的和弦出 現(xiàn)概率是通過(guò)針對(duì)樂(lè)曲中使用的每種類型的基調(diào),對(duì)許多樂(lè)曲的和弦出現(xiàn)概率進(jìn)行合計(jì)來(lái) 預(yù)先定義的。例如, 一般,在基調(diào)為"C"的樂(lè)曲中,和弦"C"、 "F"和"G"中的每種和弦的出 現(xiàn)概率高。對(duì)圖67中所示的各個(gè)節(jié)點(diǎn)給出依賴于基調(diào)的和弦出現(xiàn)概率。
此外,(3)依賴于小節(jié)線的和弦過(guò)渡概率是依賴于根據(jù)從小節(jié)線檢測(cè)單元180輸 入的小節(jié)線進(jìn)行而針對(duì)各個(gè)拍子規(guī)定的拍子類型的和弦過(guò)渡概率。依賴于小節(jié)線的和弦過(guò) 渡概率是通過(guò)針對(duì)樂(lè)曲的小節(jié)線進(jìn)行中相鄰拍子的各種類型對(duì),對(duì)許多樂(lè)曲的和弦過(guò)渡概 率進(jìn)行合計(jì)來(lái)預(yù)先定義的。例如,一般,和弦在小節(jié)線變化(過(guò)渡后的拍子是第一個(gè)拍子) 時(shí)或在從四節(jié)拍中第二個(gè)拍子過(guò)渡至第三個(gè)拍子時(shí)變化的概率比和弦在其它過(guò)渡時(shí)變化 的概率高。對(duì)節(jié)點(diǎn)之間的過(guò)渡給出依賴于小節(jié)線的和弦過(guò)渡概率。 此外,(4)依賴于基調(diào)的和弦過(guò)渡概率是依賴于根據(jù)從基調(diào)檢測(cè)單元170輸入的 基調(diào)進(jìn)行而針對(duì)各個(gè)拍子區(qū)間規(guī)定的基調(diào)的和弦過(guò)渡概率。依賴于基調(diào)的和弦過(guò)渡概率是 通過(guò)針對(duì)樂(lè)曲中使用的各種類型的基調(diào),對(duì)許多樂(lè)曲的和弦過(guò)渡概率進(jìn)行合計(jì)來(lái)預(yù)先定義 的。對(duì)節(jié)點(diǎn)間的過(guò)渡給出依賴于基調(diào)的和弦過(guò)渡概率。 和弦進(jìn)行確定單元198關(guān)于表示使用圖67描述的和弦進(jìn)行的各個(gè)路徑,將路徑 中所包括的各個(gè)節(jié)點(diǎn)的上述(1)至(4)的評(píng)估值彼此順次相乘。然后,和弦進(jìn)行確定單元 198確定使得作為路徑評(píng)估值的相乘結(jié)果最大的路徑,作為表示有可能的和弦進(jìn)行的最優(yōu) 路徑。 圖68是示出由和弦進(jìn)行確定單元198確定為最優(yōu)路徑的和弦進(jìn)行的示例的說(shuō)明 性示圖。 在圖68中,示出和弦進(jìn)行確定單元198針對(duì)第一個(gè)至第六個(gè)拍子區(qū)間和第i個(gè)拍 子區(qū)間確定為最優(yōu)路徑的和弦進(jìn)行(參見(jiàn)粗線框)。根據(jù)該示例,從第一個(gè)拍子區(qū)間開(kāi)始, 拍子區(qū)間的和弦順次是"C"、"C"、"F"、"F"、"Fm"、"Fm"……"C"。 在由上述拍子區(qū)間特征量計(jì)算單元192至和弦進(jìn)行確定單元198進(jìn)行的處理之 后,由和弦進(jìn)行檢測(cè)單元190進(jìn)行的和弦進(jìn)行檢測(cè)處理結(jié)束。
〈3.根據(jù)本實(shí)施例的信息處理設(shè)備的特征〉 相比于現(xiàn)有技術(shù)的方法,根據(jù)本實(shí)施例的信息處理設(shè)備100主要由于接下來(lái)所描 述的特征而提供音頻信號(hào)的高精度分析結(jié)果。 第一,小節(jié)線檢測(cè)單元180基于校正后的小節(jié)線概率(指示各個(gè)拍子對(duì)于哪種節(jié) 拍中的哪個(gè)拍數(shù))來(lái)確定音頻信號(hào)的有可能的小節(jié)線進(jìn)行,校正后的小節(jié)線概率是根據(jù)由 結(jié)構(gòu)分析單元150計(jì)算出的拍子區(qū)間之間的類似概率來(lái)確定的。具體而言,在確定本實(shí)施 例中的小節(jié)線進(jìn)行時(shí),小節(jié)線概率可以預(yù)先被校正以對(duì)于產(chǎn)生類似的聲音內(nèi)容的拍子區(qū)間中的拍子具有接近的值。從而,可以基于更精確地反映原始拍子的類型的小節(jié)線概率來(lái)確 定小節(jié)線進(jìn)行。 此外,小節(jié)線檢測(cè)單元180在使用類似概率來(lái)進(jìn)行校正之前,基于根據(jù)各個(gè)拍子 區(qū)間的和弦類型或基調(diào)類型而不同的第一特征量和根據(jù)拍子概率而不同的第二特征量來(lái) 計(jì)算小節(jié)線進(jìn)行。這里,各個(gè)拍子的拍數(shù)和節(jié)拍通??梢允强紤]和弦變化和基調(diào)變化以及 拍子來(lái)確定的。因此,如所描述的基于第一特征量和第二特征量計(jì)算出的小節(jié)線概率在辨 別有可能的小節(jié)線進(jìn)行方面是有效的。 第二,和弦進(jìn)行檢測(cè)單元190基于根據(jù)由結(jié)構(gòu)分析單元150計(jì)算出的拍子區(qū)間之 間的類似概率所確定的校正后和弦概率來(lái)確定有可能的和弦進(jìn)行。具體而言,在確定本實(shí) 施例中的和弦進(jìn)行時(shí),和弦概率可以預(yù)先被校正以對(duì)于產(chǎn)生類似的聲音內(nèi)容的拍子區(qū)間中 的拍子具有接近的值。從而,可以基于更精確地反映實(shí)際演奏的和弦的類型的和弦概率來(lái) 確定和弦進(jìn)行。 此外,和弦進(jìn)行檢測(cè)單元190除了使用針對(duì)所關(guān)注的拍子區(qū)間以及所關(guān)注的拍子 區(qū)間周?chē)呐淖訁^(qū)間的相應(yīng)12個(gè)音符的能量以外,還使用包括由基調(diào)檢測(cè)單元170計(jì)算出 的簡(jiǎn)單基調(diào)概率的擴(kuò)展拍子區(qū)間特征量來(lái)重新計(jì)算用于確定和弦進(jìn)行的和弦概率。從而, 考慮各個(gè)拍子區(qū)間的基調(diào)的特征,確定了更精確的和弦進(jìn)行。 第三,結(jié)構(gòu)分析單元150基于對(duì)應(yīng)于各個(gè)拍子區(qū)間的各個(gè)音調(diào)的平均能量的特征 量之間的相關(guān)性來(lái)計(jì)算上述類似概率。這里,盡管各個(gè)音調(diào)的平均能量仍然保持諸如演奏 的聲音的音量或音調(diào)之類的聲音特征,但是它們幾乎不受速度中時(shí)間波動(dòng)的影響。具體而 言,根據(jù)各個(gè)音調(diào)的平均能量計(jì)算出的拍子區(qū)間之間的類似概率不受速度中波動(dòng)的影響, 并且在精確地分析樂(lè)曲的拍子、和弦或基調(diào)方面有效。 此外,結(jié)構(gòu)分析單元150通過(guò)使用特征量來(lái)計(jì)算拍子區(qū)間之間的相關(guān)性,每個(gè)特 征量是針對(duì)所關(guān)注的拍子區(qū)間以及所關(guān)注的拍子區(qū)間周?chē)囊粋€(gè)或多個(gè)拍子區(qū)間的。具體 而言,即使拍子區(qū)間的聲音特征與另一拍子區(qū)間的聲音特征相似,如果鄰近的多個(gè)拍子區(qū) 間中的聲音特征不同,則所計(jì)算出的相關(guān)系數(shù)也不很大。從而,可以高精度地分析對(duì)于各個(gè) 拍子區(qū)間很少變化的樂(lè)曲的基調(diào)、和弦、節(jié)拍等。 第四,節(jié)拍分析單元130的節(jié)拍搜索單元136通過(guò)使用指示起始點(diǎn)與具有可以設(shè)
想到的拍子間隔的拍子的對(duì)應(yīng)程度的拍子得分,選擇由示出有可能的速度波動(dòng)的起始點(diǎn)形
成的最優(yōu)路徑。從而,可以容易地檢測(cè)到恰當(dāng)?shù)胤从逞葑嗟乃俣鹊呐淖游恢谩?此外,當(dāng)由節(jié)拍搜索單元136確定的最優(yōu)路徑的速度中的波動(dòng)(拍子間隔的方差)
很小時(shí),節(jié)拍分析單元130的針對(duì)恒定速度的節(jié)拍重新搜索單元140將搜索范圍限制于最
常出現(xiàn)的拍子間隔周?chē)⑶抑匦滤阉髯顑?yōu)路徑。從而,關(guān)于具有恒定速度的樂(lè)曲,可以減少
路徑搜索的結(jié)果中可能局部發(fā)生的與拍子位置相關(guān)的誤差。 此外,不必說(shuō),該說(shuō)明書(shū)中所描述的其它特征也對(duì)根據(jù)本實(shí)施例的信息處理設(shè)備 100的分析結(jié)果的精確度的提高有貢獻(xiàn)。
〈4.總結(jié)> 之前,已經(jīng)使用圖1至圖68描述了根據(jù)本發(fā)明實(shí)施例的信息處理設(shè)備100。
此外,最終從信息處理設(shè)備100輸出的信息可以是包括諸如本說(shuō)明書(shū)中所描述的 拍子位置、拍子區(qū)間之間的類似概率、基調(diào)概率、基調(diào)進(jìn)行、和弦概率或和弦進(jìn)行之類的任何信息的任意信息。此外,還可能部分地執(zhí)行該說(shuō)明書(shū)中所描述的信息處理設(shè)備100的操 作。例如,當(dāng)用戶沒(méi)有必要檢測(cè)和弦進(jìn)行時(shí),可以省略上述和弦進(jìn)行檢測(cè)單元190,并且信息 處理設(shè)備100可以被配置為僅檢測(cè)小節(jié)線的拍子分析設(shè)備。 此外,在本實(shí)施例中,Viterbi算法被用作以下單元的路徑搜索算法節(jié)拍搜索單 元136、基調(diào)確定單元178、小節(jié)線確定單元188、和弦進(jìn)行確定單元198等。然而,這不限于 這樣的示例,并且由上述單元中的各個(gè)單元可以使用任何其它路徑搜索算法。同樣,其它的 統(tǒng)計(jì)分析算法也可以用來(lái)替代本實(shí)施例中所使用的邏輯回歸算法。 此外,由節(jié)拍搜索單元136、基調(diào)確定單元178、小節(jié)線確定單元188、和弦進(jìn)行確 定單元198中兩個(gè)或更多處理單元進(jìn)行的路徑搜索可以被同時(shí)執(zhí)行。例如,通過(guò)同時(shí)執(zhí)行 兩個(gè)或更多處理單元的路徑搜索,可以使所要搜索出的路徑的似然全面最大化。然而,在這 種情況中,應(yīng)當(dāng)注意,路徑搜索的處理成本將增大。此外,通過(guò)增加該說(shuō)明書(shū)中未描述的限 制條件,可以使路徑搜索時(shí)的搜索范圍變窄,從而減小處理成本。 此外,如該說(shuō)明書(shū)中所述,預(yù)先提供了各種參數(shù)以用于根據(jù)本實(shí)施例的處理。這樣 的參數(shù)的示例有用于起始點(diǎn)檢測(cè)的閾值(圖7)、用于恒定速度判定的閾值(圖1S)、用于 限制與恒定速度相關(guān)的路徑的重新搜索范圍的閾值(圖19)、用于在相應(yīng)12個(gè)音符的能量 的計(jì)算時(shí)求加權(quán)和的權(quán)重(圖30)等。這些參數(shù)可以通過(guò)例如本地搜索算法、遺傳算法或 任何其它的參數(shù)最優(yōu)化算法被預(yù)先最優(yōu)化。 此外,本說(shuō)明書(shū)中所描述的信息處理設(shè)備100的各個(gè)單元的一連串處理可以被實(shí) 現(xiàn)為硬件或軟件。例如,當(dāng)通過(guò)軟件來(lái)執(zhí)行一連串處理或這一連串處理的一部分時(shí),通過(guò)使 用專門(mén)的硬件中所內(nèi)建的計(jì)算機(jī)或圖69中所示的通用計(jì)算機(jī)來(lái)執(zhí)行構(gòu)成軟件的程序。
在圖69中,中央處理單元(CPU)902控制通用計(jì)算機(jī)的總體操作。只讀存儲(chǔ) 器(R0M)904存儲(chǔ)描述這一連串處理的一部分或全部的數(shù)據(jù)或程序。隨機(jī)存取存儲(chǔ)器 (RAM) 906臨時(shí)存儲(chǔ)CPU 902在執(zhí)行處理時(shí)所使用的程序或數(shù)據(jù)。 CPU 902、R0M 904和RAM 906通過(guò)總線910互連??偩€910連接到輸入/輸出接 □ 912。 輸入/輸出接口 912是用于將CPU 902、 ROM 904和RAM 906與輸入裝置920、輸 出裝置922、存儲(chǔ)裝置924、通信裝置926和驅(qū)動(dòng)器930連接的接口 。 輸入裝置920接收用戶經(jīng)由諸如按鈕、鼠標(biāo)或鍵盤(pán)之類的輸入裝置輸入的指令或 信息。輸出裝置922例如經(jīng)由諸如陰極射線管(CRT)、液晶顯示器、有機(jī)發(fā)光二極管(OLED) 等的顯示裝置或諸如揚(yáng)聲器之類的音頻輸出裝置向用戶輸出信息。 存儲(chǔ)裝置924例如是由硬盤(pán)驅(qū)動(dòng)器或閃存構(gòu)成的,并且存儲(chǔ)程序、程序數(shù)據(jù)、輸入 /輸出數(shù)據(jù)等。通信裝置926經(jīng)由諸如LAN或因特網(wǎng)之類的網(wǎng)絡(luò)來(lái)執(zhí)行通信處理。驅(qū)動(dòng)器 930在適當(dāng)時(shí)被提供給通用計(jì)算機(jī),并且例如,可移除介質(zhì)932被附接到驅(qū)動(dòng)器930。
由信息處理設(shè)備100輸出的信息可以用于與音樂(lè)有關(guān)的各種應(yīng)用。例如,通過(guò)使 用由小節(jié)線檢測(cè)單元180檢測(cè)到的小節(jié)線進(jìn)行和由和弦進(jìn)行檢測(cè)單元190檢測(cè)到的和弦 進(jìn)行,可以實(shí)現(xiàn)用于使得在可視空間中,角色與音樂(lè)同步地運(yùn)動(dòng)的應(yīng)用。并且,通過(guò)使用由 和弦進(jìn)行檢測(cè)單元190檢測(cè)到的和弦進(jìn)行,例如可以實(shí)現(xiàn)用于在樂(lè)譜上自動(dòng)寫(xiě)下和弦的應(yīng) 用。 本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,根據(jù)設(shè)計(jì)需求和其它因素,可以進(jìn)行各種修改、組合、
38子組合和更改,只要它們?cè)谒綑?quán)利要求及其等同物的范圍以內(nèi)即可。 例如,流程圖中所描述的處理不必按照流程圖中所示出的次序被執(zhí)行。各個(gè)處理 步驟可以包括被并行地或獨(dú)立地執(zhí)行的處理。 本申請(qǐng)包括與2008年11月21日在日本專利局提交的日本優(yōu)先權(quán)專利申請(qǐng)JP 2008-298567中所公開(kāi)的主題相關(guān)的主題,其全部?jī)?nèi)容被通過(guò)引用結(jié)合于此。
權(quán)利要求
一種信息處理設(shè)備,包括拍子分析單元,所述拍子分析單元用于檢測(cè)音頻信號(hào)中所包括的拍子的位置;結(jié)構(gòu)分析單元,所述結(jié)構(gòu)分析單元用于計(jì)算類似概率,每個(gè)類似概率是用由所述拍子分析單元所檢測(cè)到的各個(gè)拍子位置劃分出的拍子區(qū)間的聲音內(nèi)容之間相類似的概率;以及小節(jié)線檢測(cè)單元,所述小節(jié)線檢測(cè)單元用于基于根據(jù)所述結(jié)構(gòu)分析單元所計(jì)算出的類似概率而確定的小節(jié)線概率來(lái)確定所述音頻信號(hào)的有可能的小節(jié)線進(jìn)行,所述小節(jié)線概率指示各個(gè)拍子對(duì)應(yīng)于哪種節(jié)拍中的哪個(gè)拍數(shù)。
2. 根據(jù)權(quán)利要求l所述的信息處理設(shè)備,其中 所述結(jié)構(gòu)分析單元包括特征量計(jì)算單元,所述特征量計(jì)算單元用于通過(guò)使用各個(gè)拍子區(qū)間的各個(gè)音調(diào)的平均 能量來(lái)計(jì)算特定特征量;相關(guān)性計(jì)算單元,所述相關(guān)性計(jì)算單元用于針對(duì)所述拍子區(qū)間來(lái)計(jì)算由所述特征量計(jì) 算單元所計(jì)算出的特征量之間的相關(guān)性;以及類似概率生成單元,所述類似概率生成單元用于根據(jù)由所述相關(guān)性計(jì)算單元所計(jì)算出 的相關(guān)性來(lái)生成所述類似概率。
3. 根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其中 所述小節(jié)線檢測(cè)單元包括小節(jié)線概率計(jì)算單元,所述小節(jié)線概率計(jì)算單元用于基于從所述音頻信號(hào)提取出的特 定特征量來(lái)計(jì)算所述小節(jié)線概率;小節(jié)線概率校正單元,所述小節(jié)線概率校正單元用于根據(jù)所述類似概率來(lái)校正由所述 小節(jié)線概率計(jì)算單元計(jì)算出的小節(jié)線概率;以及小節(jié)線確定單元,所述小節(jié)線確定單元用于基于由所述小節(jié)線概率校正單元校正后的 小節(jié)線概率來(lái)確定所述音頻信號(hào)的所述有可能的小節(jié)線進(jìn)行。
4. 根據(jù)權(quán)利要求2所述的信息處理設(shè)備,其中所述特征量計(jì)算單元通過(guò)在多個(gè)八度音階當(dāng)中對(duì)具有相同名稱的音符的值求加權(quán)和 來(lái)計(jì)算所述特征量,所述值被包括在各個(gè)音調(diào)的平均能量中。
5. 根據(jù)權(quán)利要求2所述的信息處理設(shè)備,其中所述相關(guān)性計(jì)算單元通過(guò)使用所述特征量來(lái)計(jì)算所述拍子區(qū)間之間的相關(guān)性,每個(gè)特 征量是針對(duì)所關(guān)注的拍子區(qū)間以及所述所關(guān)注的拍子區(qū)間周?chē)粋€(gè)或多個(gè)拍子區(qū)間的。
6. 根據(jù)權(quán)利要求3所述的信息處理設(shè)備,其中所述小節(jié)線概率計(jì)算單元基于根據(jù)各個(gè)拍子區(qū)間的和弦類型或基調(diào)類型而不同的第 一特征量和根據(jù)拍子概率而不同的第二特征量來(lái)計(jì)算所述小節(jié)線概率,所述拍子概率指示 拍子被包括在所述音頻信號(hào)的各個(gè)特定時(shí)間單位中的概率。
7. 根據(jù)權(quán)利要求3所述的信息處理設(shè)備,其中所述小節(jié)線確定單元通過(guò)以下方式來(lái)確定所述有可能的小節(jié)線進(jìn)行從通過(guò)在以按時(shí) 間順序布置的拍子以及各個(gè)拍子的節(jié)拍和拍數(shù)所指定的節(jié)點(diǎn)中順次選擇節(jié)點(diǎn)而形成的路 徑中,搜索使根據(jù)所述小節(jié)線概率而不同的評(píng)估值變成最優(yōu)的路徑。
8. 根據(jù)權(quán)利要求3所述的信息處理設(shè)備,其中 所述小節(jié)線檢測(cè)單元還包括小節(jié)線重新確定單元,所述小節(jié)線重新確定單元用于在由所述小節(jié)線確定單元所確定 的小節(jié)線進(jìn)行中包括第一節(jié)拍和第二節(jié)拍兩者的情況中,從搜索的對(duì)象中排除所述第一節(jié) 拍和所述第二節(jié)拍中較不經(jīng)常出現(xiàn)的節(jié)拍而重新執(zhí)行路徑搜索。
9. 根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其中 所述拍子分析單元包括起始點(diǎn)檢測(cè)單元,所述起始點(diǎn)檢測(cè)單元用于基于拍子概率來(lái)檢測(cè)所述音頻信號(hào)中所包 括的起始點(diǎn),每個(gè)起始點(diǎn)是聲音產(chǎn)生的時(shí)間點(diǎn),每個(gè)拍子概率指示拍子被包括在所述音頻 信號(hào)中的各個(gè)特定時(shí)間單位中的概率;拍子得分計(jì)算單元,所述拍子得分計(jì)算單元用于針對(duì)由所述起始點(diǎn)檢測(cè)單元檢測(cè)到的 每個(gè)起始點(diǎn)來(lái)計(jì)算拍子得分,拍子得分指示該起始點(diǎn)與具有能設(shè)想到的拍子間隔的拍子的 對(duì)應(yīng)程度;拍子搜索單元,所述拍子搜索單元用于基于由所述拍子得分計(jì)算單元所計(jì)算出的拍子 得分來(lái)搜索由示出有可能的速度波動(dòng)的起始點(diǎn)形成的最優(yōu)路徑;以及拍子確定單元,所述拍子確定單元用于確定所述最優(yōu)路徑上起始點(diǎn)的位置和根據(jù)所述 拍子間隔所補(bǔ)充的位置,作為拍子位置。
10. 根據(jù)權(quán)利要求9所述的信息處理設(shè)備,其中 所述拍子分析單元還包括拍子重新搜索單元,所述拍子重新搜索單元用于在由所述拍子搜索單元確定的最優(yōu)路 徑的速度的波動(dòng)很小的情況中,限制搜索范圍并且重新執(zhí)行對(duì)所述最優(yōu)路徑的搜索。
11. 根據(jù)權(quán)利要求9所述的信息處理設(shè)備,其中所述拍子搜索單元通過(guò)使用根據(jù)所述拍子得分而不同的評(píng)估值,來(lái)從通過(guò)沿時(shí)間軸順 次選擇以所述起始點(diǎn)和所述拍子間隔指定的節(jié)點(diǎn)而形成的路徑中確定最優(yōu)路徑。
12. 根據(jù)權(quán)利要求11所述的信息處理設(shè)備,其中所述拍子搜索單元還通過(guò)使用根據(jù)過(guò)渡前后的節(jié)點(diǎn)之間速度的變化量而不同的評(píng)估 值來(lái)確定所述最優(yōu)路徑。
13. 根據(jù)權(quán)利要求11所述的信息處理設(shè)備,其中所述拍子搜索單元還通過(guò)使用根據(jù)過(guò)渡前后的起始點(diǎn)之間的間隔與過(guò)渡前后的節(jié)點(diǎn) 處的拍子間隔之間的匹配程度而不同的評(píng)估值來(lái)確定所述最優(yōu)路徑。
14. 根據(jù)權(quán)利要求11所述的信息處理設(shè)備,其中所述拍子搜索單元還通過(guò)使用根據(jù)節(jié)點(diǎn)之間的過(guò)渡中所跳過(guò)的起始點(diǎn)的數(shù)目而不同 的評(píng)估值來(lái)確定所述最優(yōu)路徑。
15. 根據(jù)權(quán)利要求9所述的信息處理設(shè)備,其中 所述拍子分析單元還包括速度修正單元,所述速度修正單元用于根據(jù)估計(jì)速度,對(duì)由所述拍子確定單元所確定 的拍子位置進(jìn)行修正,所述估計(jì)速度是使用通過(guò)學(xué)習(xí)預(yù)先獲得的估計(jì)速度辨別公式而從所 述音頻信號(hào)的波形中估計(jì)出的。
16. 根據(jù)權(quán)利要求15所述的信息處理設(shè)備,其中所述速度修正單元通過(guò)針對(duì)多個(gè)乘子中的每一個(gè)乘子,使用修正后的拍子位置的平均 拍子概率和所述估計(jì)速度來(lái)評(píng)估修正后的速度的似然,從而確定要用來(lái)修正所述拍子位置的用于修正的乘子。
17. —種信息處理設(shè)備,包括起始點(diǎn)檢測(cè)單元,所述起始點(diǎn)檢測(cè)單元用于基于拍子概率來(lái)檢測(cè)音頻信號(hào)中所包括的 起始點(diǎn),每個(gè)起始點(diǎn)是聲音產(chǎn)生的時(shí)間點(diǎn),每個(gè)拍子概率指示拍子被包括在所述音頻信號(hào) 中的各個(gè)特定時(shí)間單位中的概率;拍子得分計(jì)算單元,所述拍子得分計(jì)算單元用于針對(duì)由所述起始點(diǎn)檢測(cè)單元檢測(cè)到的 每個(gè)起始點(diǎn)來(lái)計(jì)算拍子得分,拍子得分指示該起始點(diǎn)與具有能設(shè)想到的拍子間隔的拍子的 對(duì)應(yīng)程度;拍子搜索單元,所述拍子搜索單元用于基于由所述拍子得分計(jì)算單元所計(jì)算出的拍子 得分來(lái)搜索由示出有可能的速度波動(dòng)的起始點(diǎn)形成的最優(yōu)路徑;以及拍子確定單元,所述拍子確定單元用于確定所述最優(yōu)路徑上起始點(diǎn)的位置和根據(jù)所述 拍子間隔所補(bǔ)充的位置,作為拍子位置。
18. —種聲音分析方法,包括以下步驟 檢測(cè)音頻信號(hào)中所包括的拍子的位置;計(jì)算類似概率,每個(gè)類似概率是用各個(gè)所檢測(cè)到的拍子位置劃分出的拍子區(qū)間的聲音 內(nèi)容之間相類似的概率;以及基于根據(jù)所計(jì)算出的類似概率而確定的小節(jié)線概率來(lái)確定所述音頻信號(hào)的有可能的 小節(jié)線進(jìn)行,所述小節(jié)線概率指示各個(gè)拍子對(duì)應(yīng)于哪種節(jié)拍中的哪個(gè)拍數(shù)。
19. 一種程序,該程序使得控制信息處理設(shè)備的計(jì)算機(jī)用作 拍子分析單元,所述拍子分析單元用于檢測(cè)音頻信號(hào)中所包括的拍子的位置; 結(jié)構(gòu)分析單元,所述結(jié)構(gòu)分析單元用于計(jì)算類似概率,每個(gè)類似概率是用由所述拍子分析單元所檢測(cè)到的各個(gè)拍子位置劃分出的拍子區(qū)間的聲音內(nèi)容之間相類似的概率;以及 小節(jié)線檢測(cè)單元,所述小節(jié)線檢測(cè)單元用于基于根據(jù)由所述結(jié)構(gòu)分析單元所計(jì)算出的 類似概率而確定的小節(jié)線概率來(lái)確定所述音頻信號(hào)的有可能的小節(jié)線進(jìn)行,所述小節(jié)線概 率指示各個(gè)拍子對(duì)應(yīng)于哪種節(jié)拍中的哪個(gè)拍數(shù)。
全文摘要
公開(kāi)了一種信息處理設(shè)備、聲音分析方法和程序。該信息處理設(shè)備包括用于檢測(cè)音頻信號(hào)中所包括的拍子的位置的拍子分析單元;用于計(jì)算類似概率的結(jié)構(gòu)分析單元,每個(gè)類似概率是用由拍子分析單元所檢測(cè)到的各個(gè)拍子位置劃分出的拍子區(qū)間的聲音內(nèi)容之間相類似的概率;以及小節(jié)線檢測(cè)單元,用于基于根據(jù)由所述結(jié)構(gòu)分析單元所計(jì)算出的類似概率而確定的小節(jié)線概率來(lái)確定所述音頻信號(hào)的有可能的小節(jié)線進(jìn)行,所述小節(jié)線概率指示各個(gè)拍子對(duì)應(yīng)于哪種節(jié)拍中的哪個(gè)拍數(shù)。
文檔編號(hào)G10G3/00GK101740010SQ20091022192
公開(kāi)日2010年6月16日 申請(qǐng)日期2009年11月23日 優(yōu)先權(quán)日2008年11月21日
發(fā)明者小林由幸 申請(qǐng)人:索尼株式會(huì)社