本發(fā)明涉及一種聲音壓縮系統(tǒng),尤其是涉及一種在異常聲音檢測系統(tǒng)中有更低的壓縮率的聲音壓縮系統(tǒng)。
背景技術:
在無線網(wǎng)絡、衛(wèi)星通信等現(xiàn)實應用中帶寬資源是很有限的,在信號傳輸之前一般需要先壓縮語音信號頻帶,因為語音信號在數(shù)字化以后會占用更多的帶寬。然而傳統(tǒng)的基于離散傅里葉變換法,離散余弦變換法和小波變換的壓縮方式不能滿足在異常聲音檢測系統(tǒng)中快速傳輸?shù)男枰?,仍未能滿足快速傳輸?shù)男枰?。因此,亟需一種新的聲音壓縮系統(tǒng)來提高異常聲音檢測系統(tǒng)中聲音壓縮的性能,進而改善異常聲音檢測系統(tǒng)的性能。
技術實現(xiàn)要素:
(一)要解決的技術問題
本發(fā)明的目的是改善異常聲音檢測系統(tǒng)中聲音壓縮系統(tǒng)的性能。本發(fā)明提供了一種采用改進的基于離散余弦變換的壓縮方法的聲音壓縮系統(tǒng)。該系統(tǒng)在聲音壓縮方面取得了更低的壓縮率。
(二)技術方案
一種應用于異常聲音檢測的聲音壓縮系統(tǒng),包括分段擬合壓縮模塊和離散余弦變換壓縮模塊;
所述分段擬合壓縮模塊對原始聲音信號進行基于角度誤差限定的分段幾何特征擬合,得到一次壓縮信號,并將一次壓縮信號傳輸至離散余弦變換壓縮模塊;
所述離散余弦變換壓縮模塊基于離散余弦變換對一次壓縮信號進行二次壓縮。
優(yōu)選地,所述分段擬合壓縮模塊利用預先設定的角度誤差對時域原始聲音信號進行壓縮,通過設定角度誤差實現(xiàn)波形的壓縮。
優(yōu)選地,所述離散余弦變換壓縮模塊通過離散余弦變換變換以后,設定一個閾值,將閾值以下的dct系數(shù)化為0,實現(xiàn)dct系數(shù)的壓縮。
優(yōu)選地,所述聲音壓縮系統(tǒng)還包括編碼模塊和譯碼模塊;
所述編碼模塊用于將二次壓縮后的聲音信號進行編碼;
所述譯碼模塊接收編碼后的聲音信號,并對其進行譯碼。
優(yōu)選地,還包括聲音重建模塊,所述聲音重建模塊用于將譯碼后的聲音信號進行重建;
所述聲音重建模塊先進行idct反變換,再利用基于幾何特征的內(nèi)插重建聲音信號。
優(yōu)選地,內(nèi)插時采用兩點間公式內(nèi)插的方法重建聲音信號。
優(yōu)選地,所述編碼方式為哈夫曼(huffman)編碼。
優(yōu)選地,所述基于角度誤差限定的分段幾何特征擬合包括:
預先設定角度誤差;
從波形第一個點開始,連接第二個點并尋找其延長線與時域波形上的交點;
判斷交點是否在預先設定的角度誤差范圍內(nèi),從而判斷第三個點是否可以保留,從而實現(xiàn)壓縮。
優(yōu)選地,所述分段擬合壓縮模塊用于壓縮信號的低頻部分;所述離散余弦變換壓縮模塊用于壓縮信號的高頻部分。
一種應用于異常聲音檢測的聲音壓縮方法,包括以下步驟:
s1:基于角度誤差限定對聲音信號進行分段幾何特征擬合的壓縮,得到一次壓縮后聲音信號;
s2:基于離散余弦變換對一次壓縮后的聲音信號進行二次壓縮;
s3:將二次壓縮后的聲音信號進行傳輸;
s4:將傳輸完成的聲音信號進行重建。
(三)有益效果
本發(fā)明綜合了基于角度誤差限定的分段擬合的潛壓縮和基于離散余弦變換的壓縮構建了一個聲音壓縮系統(tǒng)。由于角度誤差限定的分段擬合側重于低頻部分的壓縮,而基于離散余弦變換的壓縮則側重于壓縮高頻部分,兩步壓縮在低頻和高頻部分同時進行了壓縮,取得了很好的壓縮效果。該系統(tǒng)應用于異常聲音檢測系統(tǒng),能夠有效地改善異常聲音系統(tǒng)中聲音信號傳輸模塊的性能。
附圖說明
圖1為本發(fā)明實施例的應用于異常聲音檢測的聲音壓縮系統(tǒng)示意圖;
圖2為本發(fā)明實施例的基于角度誤差限定的分段擬合示意圖;
圖3為本發(fā)明實施例的基于角度誤差限定的分段擬合原理圖;
圖4為本發(fā)明實施例的應用于異常聲音檢測的聲音壓縮方法流程圖。
具體實施方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明白,以下結合具體實施例,并參照附圖,對本發(fā)明作進一步的詳細說明。
本發(fā)明中的聲音壓縮系統(tǒng)使用了一種改進的基于離散余弦變換的聲音信號壓縮的方法,即采用了基于角度誤差限定分段擬合和基于離散余弦變換的壓縮相結合的方式,與其他的聲音壓縮系統(tǒng)相比有更低的壓縮率。
圖1為本發(fā)明實施例的應用于異常聲音檢測的聲音壓縮系統(tǒng)示意圖,如圖1所示,本發(fā)明第一實施例提供一種應用于異常聲音檢測的聲音壓縮系統(tǒng),包括:分段擬合壓縮模塊1、離散余弦變換壓縮模塊2、編碼模塊3、譯碼模塊4和聲音重建模塊5。
分段擬合壓縮模塊1是基于角度誤差限定對聲音信號進行分段幾何特征擬合,基于角度誤差限定的分段幾何特征擬合主要是利用分段直線對原始聲音信號進行擬合,來降低聲音信號的壓縮率,利用設定的角度誤差對時域信號進行壓縮,主要壓縮信號的低頻部分。
基于角度誤差限定的分段幾何特征擬合是一種有損壓縮,波形的擬合去掉了原始聲音信號中的大量低頻成分,而高頻成分得到保留。通過預先設定一個角度誤差,從第一個點開始,連接第二個點并尋找其延長線與時域波形上的交點,判斷是否在預先設定的角度誤差范圍內(nèi),從而判斷第三個點是否可以保留,從而達到了壓縮的目的。
圖2為基于角度誤差限定的分段擬合示意圖,如圖2所示,聲音信號區(qū)間內(nèi)有40個采樣點,通過線段擬合后只需aa’、bb’、cc’、dd’、ee’共10個點就可以表示,壓縮比是4∶1。
圖3為本發(fā)明實施例的基于角度誤差限定的分段擬合原理圖,如圖3所示,假設給定聲音數(shù)據(jù)流x={x1,x2,…},那么對于線段s={(i,xi),(j,xj)},如果該線段的延長線如圖3所示在(k,xk)的誤差區(qū)間[xk-ε,xk+ε]內(nèi),則更新線段為s’={(i,xi),(k,yk)},否則更新線段為s”={(j,xj),(k,xk)}。具體可以分為6步:
(1)給定角度限定誤差ε;
(2)保留波形中第一個點,計算出第一個點和第二個點的連線的斜率1,作為初始值,當前點指針curr,當前點的前一個點的指針prev;
(3)第一個點(i,xi)已經(jīng)被固定,從第二個點(j,xj)開始,得到第一個點與第二個點的連線的延長線與第三個點即當前點(k,xk)處的波形的交點(k,yk),將prev指針指向第二個點,curr指針指向第三個點;
(4)如果延長線的交點(k,yk)在當前點(k,xk)的限定誤差ε以內(nèi)即[xk-ε,xk+ε],那么當前點的前一個點xj被壓縮,值設為0,之前的斜率1得以保留,prev指針后移指向當前點,當前點指針curr后移指向新的當前點;如果延長線的交點(k,yk)不在當前點(k,xk)的限定誤差[xk-ε,xk+ε]以內(nèi),則prev指向的點(k,xk)保留下來,由prev和curr指向的點計算新的斜率,更新斜率1,prev指針后移指向當前點,當前點指針curr后移指向新的當前點;
(5)按照更新后的斜率重新找到與curr指針指向的點所在波形處的交點,重復第(4)步,直至到達最后的采樣點。
(6)將最后一個采樣點保留。
分段擬合壓縮模塊1利用預先設定的角度誤差對時域信號進行壓縮,通過設定角度誤差實現(xiàn)了波形的壓縮,分段擬合壓縮模塊1對聲音信號進行壓縮后得到一次壓縮后的聲音信號,將該聲音信號傳輸給離散余弦變換壓縮模塊2進行二次壓縮。
離散余弦變換壓縮模塊2是基于離散余弦變換對聲音信號進行二次壓縮,基于離散余弦變換的壓縮就是先把信號分解為一組余弦函數(shù)系的線性疊加,再對系數(shù)進行處理從而達到處理信號的目的。正交變換具有4個性質(zhì):1.能量保持;2.去相關;3.熵保持;4.能量重新分配與集中。
聲音信號在經(jīng)過dct變換后,高頻區(qū)域內(nèi)的dct系數(shù)大都很小或者趨近于零,用于能量壓縮時具有良好的性能。利用這個特性,可以選擇合適的閾值m,將小于此閾值的所有變換系數(shù)更新為0,以實現(xiàn)壓縮,主要壓縮了信號的高頻部分。
這樣就將基于角度誤差限定的分段擬合壓縮后的聲音信號通過離散余弦變換完成了進一步的壓縮,完成了第二次壓縮以后,接下來可通過編碼模塊3對壓縮后的聲音信號進行編碼,編碼模塊3可選擇主流的編碼方式如哈夫曼(huffman)編碼進行聲音信號的處理,編碼后的聲音信號即可進行傳輸。
聲音信號傳輸完成后由譯碼模塊4接收,譯碼模塊4對編碼后的聲音信號進行譯碼。
聲音重建模塊5將譯碼完成的聲音信號進行重建,聲音信號的重建分為兩步,第一步先進行反離散余弦變換(idct反變換),將變換后并壓縮的dct系數(shù)轉換回原采樣值。第二步進行基于幾何特征方法的內(nèi)插重建聲音信號,主要是利用了兩點間直線公式進行點的內(nèi)插。最終得到了重建的聲音信號。重建步驟如下:
(1)使用idct反變換恢復壓縮前的采樣信號xn;
(2)從第一個點(xprev,yprev)開始,先找到第二個不為0的點(xcurr,ycurr),指針prev指向第一個點,指針curr指向第二個點;
(3)利用兩點間直線公式計算線段兩端點之間的數(shù)據(jù)點(xi,yi)并填充;
(4)prev指針后移指向當前采樣點,curr指針后移指向新的當前點,重復(2)(3)步;
(5)prev指向最后一個采樣點時,表明信號重建完畢。
綜上所述,本發(fā)明實施例提出的聲音壓縮系統(tǒng)通過設定角度誤差來壓縮波形,設定閾值來進行dct系數(shù)的壓縮,同時調(diào)節(jié)兩個參數(shù)可以得到最優(yōu)的壓縮效果。具備了進行以較低的壓縮率進行聲音壓縮的能力,可以有效提高聲音傳輸?shù)男?,改善了異常聲音檢測系統(tǒng)整體的性能。
本發(fā)明第二實施例提供一種應用于異常聲音檢測的聲音壓縮方法,圖4為本發(fā)明實施例的應用于異常聲音檢測的聲音壓縮方法流程圖,如圖4所示,包括以下步驟:
s1:基于角度誤差限定對聲音信號進行分段幾何特征擬合,得到一次壓縮后聲音信號;
s2:基于離散余弦變換對一次壓縮后的聲音信號進行二次壓縮;
s3:將二次壓縮后的聲音信號進行傳輸;
s4:將傳輸完成的聲音信號進行重建。
有上述實施例可以看出,本發(fā)明綜合了基于角度誤差限定的分段擬合的潛壓縮和基于離散余弦變換的壓縮構建了一個聲音壓縮系統(tǒng)。由于角度誤差限定的分段擬合側重于低頻部分的壓縮,而基于離散余弦變換的壓縮則側重于壓縮高頻部分,兩步壓縮在低頻和高頻部分同時進行了壓縮,取得了很好的壓縮效果。該系統(tǒng)應用于異常聲音檢測系統(tǒng),能夠有效地改善異常聲音系統(tǒng)中聲音信號傳輸模塊的性能。
以上所述的具體實施例,對本發(fā)明的目的、技術方案和有益效果進行了進一步詳細說明,應理解的是,以上所述僅為本發(fā)明的具體實施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。