1.一種基于雙聲道的腳步檢測方法,包括下列步驟:
1)獲取待檢測的雙聲道音頻數(shù)據(jù)并進行分幀處理,得到相應(yīng)的音頻幀;所述雙聲道音頻數(shù)據(jù)包括固定在左腳的采集設(shè)備所采集的左腳聲道音頻數(shù)據(jù)和固定在右腳的采集設(shè)備所采集的右腳聲道音頻數(shù)據(jù);
2)提取每個音頻幀的特征向量,基于腳步檢測模型得出每個音頻幀屬于腳步的概率;其中,所述腳步檢測模型是以音頻幀的特征向量為輸入,以音頻幀屬于腳步的概率為輸出的機器學習模型,該機器學習模型以標注了腳跟著地聲的音頻幀和標注了前腳掌著地聲的音頻幀為正樣本,以前一步的前腳掌著地聲與后一步的腳跟著地聲之間的多個音頻幀為負樣本進行訓(xùn)練;
3)根據(jù)所得出的各個音頻幀屬于腳步的概率,得出各個音頻幀是否含有腳步聲,進而得出腳步對應(yīng)的時間區(qū)間。
2.根據(jù)權(quán)利要求1所述的基于雙聲道的腳步檢測方法,其特征在于,所述步驟2)中,左腳聲道的音頻幀及其屬于腳步的概率構(gòu)成左腳聲道概率曲線,右腳聲道的音頻幀及其屬于腳步的概率構(gòu)成右腳聲道概率曲線;
所述步驟3)還包括:將左、右腳聲道概率曲線融合成綜合概率曲線,對綜合概率曲線進行平滑處理,基于預(yù)設(shè)的概率閾值得出各個音頻幀是否含有腳步聲,進而得出腳步對應(yīng)的時間區(qū)間。
3.根據(jù)權(quán)利要求2所述的基于雙聲道的腳步檢測方法,其特征在于,所述步驟1)中,采用漢明窗對雙聲道音頻數(shù)據(jù)進行分幀處理。
4.根據(jù)權(quán)利要求3所述的基于雙聲道的腳步檢測方法,其特征在于,所述步驟1)中,所得到的所述音頻幀長度為10~30ms,相鄰幀的重疊部分為漢明窗窗口長度的20%~30%。
5.根據(jù)權(quán)利要求4所述的基于雙聲道的腳步檢測方法,其特征在于,所述步驟2)中,構(gòu)成所述音頻幀的特征向量的特征包括:自相關(guān)系數(shù)、子帶能量特征、過零率、線性預(yù)測系數(shù)特征和梅爾倒譜系數(shù)特征。
6.根據(jù)權(quán)利要求4所述的基于雙聲道的腳步檢測方法,其特征在于,所述步驟2)中,所述機器學習模型采用SVM分類器模型,所述正樣本包括已知的左腳聲道音頻數(shù)據(jù)中的以每個標注腳跟著地聲的位置為中心的三個音頻幀和以每個標注前腳掌著地聲的位置為中心的三個音頻幀,以及已知的右腳聲道音頻數(shù)據(jù)中的以每個標注腳跟著地聲的位置為中心的三個音頻幀和以每個標注前腳掌著地聲的位置為中心的三個音頻幀;所述負樣本包括:左腳聲道音頻數(shù)據(jù)中的前一步的前腳掌著地聲與后一步的腳跟著地聲之間的九個音頻幀,以及右腳聲道音頻數(shù)據(jù)中的前一步的前腳掌著地聲與后一步的腳跟著地聲之間的九個音頻幀。
7.根據(jù)權(quán)利要求2所述的基于雙聲道的腳步檢測方法,其特征在于,所述步驟3)中,用低通濾波器對綜合概率曲線進行平滑處理。
8.根據(jù)權(quán)利要求7所述的基于雙聲道的腳步檢測方法,其特征在于,所述步驟3)中,所述低通濾波器的相對截止頻率不超過0.1。
9.根據(jù)權(quán)利要求7所述的基于雙聲道的腳步檢測方法,其特征在于,所述步驟3)中,所述綜合概率曲線是左、右腳聲道概率曲線的求和疊加。
10.根據(jù)權(quán)利要求7所述的基于雙聲道的腳步檢測方法,其特征在于,所述步驟3)中,所述綜合概率曲線是對左、右腳聲道概率曲線取較大值后得到的融合概率曲線。