專利名稱:音頻信號編碼裝置和譯碼裝置以及音頻信號編碼和譯碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及將聲音信號及音樂信號等音頻信號編碼的音頻信號編碼裝置。特別是使用正交變換等方法,將音頻信號從時間區(qū)域變換到頻率區(qū)域,并且可以比源音頻信號用盡可能少的代碼串表現(xiàn)的將該變換后的信號有效地進(jìn)行編碼的裝置,和使用編碼后的信號這樣的全部代碼串或其一部分代碼串,可以將高品質(zhì)和寬頻帶的音頻信號譯碼的譯碼裝置以及該音頻信號的編碼及譯碼方法。
將音頻信號有效地進(jìn)行編碼及譯碼的方法提案了各種各樣的方案。音樂信號等具有20kHz以上的頻帶的音頻信號,特別是近年來有MPEG音頻方式等。以MPEG方式為代表的編碼方式,是使用余弦變換等正交變換將時間軸上的數(shù)字音頻信號變換為頻率軸上的數(shù)據(jù),并利用人的聽覺上的敏感特性將該頻率軸上的信息對聽覺上重要的信息進(jìn)行編碼的方式,對聽覺上不重要的信息和冗長的信息不進(jìn)行編碼的方式。對于源數(shù)字信號的信息量,想用很少的信息量表現(xiàn)時,有使用矢量量化的方法的TC-WVQ等編碼方式。MPEG音頻和TC-WVQ分別在ISO/IEC標(biāo)準(zhǔn)IS-11172-3和T.Moriya,H.Suga:An 8 Kbits transformcoder for noisy channels,Proc.ICASSP 89,pp196-199等中已作了介紹。下面,使用圖24說明先有的音頻信號編碼裝置的結(jié)構(gòu)。
在圖24中,1601是將輸入信號進(jìn)行頻率變換的FFT部,1602是計算用以將經(jīng)過頻率變換的輸入信號中的特定的頻帶進(jìn)行編碼的最小可聽限和利用掩蔽特性計算進(jìn)行自適應(yīng)位分配的計算的自適應(yīng)位分配計算部,1603是將輸入信號分割為多個頻帶的子頻帶分割部,1604是使用比例因子將分割為多個頻帶的各成分進(jìn)行正規(guī)化的比例因子正規(guī)化部,1605是根據(jù)上述自適應(yīng)位分配計算部1602的位分配將比例因子正規(guī)化部1604的正規(guī)化輸出進(jìn)行標(biāo)量量化處理的標(biāo)量量化部。
下面,說明其動作。輸入信號輸入FFT部1601和子頻帶分割部1603。在FFT部1601中,將輸入信號進(jìn)行頻率變換,并將其輸出輸入自適應(yīng)位分配部1602。在自適應(yīng)位分配部1602中,根據(jù)按人的聽覺特性定義的最小可聽限和掩蔽特性對某一頻帶成分計算應(yīng)供給多少信息量,并將各頻帶的信息量分配編碼為索引(index)。
另一方面,在子頻帶分割部1603中,將輸入信號分割為例如32個頻帶而輸出。并且,在比例因子正規(guī)化部1604中,對由上述子頻帶分割部1603分割的各頻帶成分以某一代表值進(jìn)行正規(guī)化處理。該正規(guī)化的值量化為索引IND1。在標(biāo)量量化部1605中,根據(jù)由上述自適應(yīng)位分配計算部1602計算的位分配將比例因子正規(guī)化部1604的輸出進(jìn)行標(biāo)量量化處理,并將該量化值編碼為索引IND2。
先有的音頻信號編碼裝置按上述方式構(gòu)成,MPEG音頻方式是對每1信道用64000位/秒以上的信息量進(jìn)行編碼所使用的方法,但是,通常在該信息量以下,有時可再生的頻帶寬度及所譯碼的音頻信號的主觀的品質(zhì)將顯著地變壞。其原因在于,如圖24所示的例子那樣,編碼的信息大致由自適應(yīng)位分配部1602的位分配、比例因子正規(guī)化部1604的頻帶代表值和標(biāo)量量化部1605的量化值3部分構(gòu)成,在高壓縮率的情況下,信息量未充分地分配給量化值輸出。另外,在先有的音頻信號編碼裝置中,通常是采用使編碼的信息量和譯碼的信息量相同來構(gòu)成編碼裝置和譯碼裝置的方法。例如,在每秒鐘編碼為128000位的信息量的方法中,其譯碼裝置就將128000位的信息量譯碼。
但是,根據(jù)上述情況,在先有的音頻信號編碼裝置和譯碼裝置中,為了得到良好的音質(zhì),必須用固定的信息量進(jìn)行編碼和譯碼,這就不能用高壓縮率得到高品質(zhì)的音質(zhì)。
本發(fā)明就是為了解決上述問題而提案的,目的旨在提供即使用很少的信息量進(jìn)行編碼和譯碼也可以得到高品質(zhì)和寬的再生頻帶并且可以使編碼和譯碼時的信息量不是固定的值而是可以改變的音頻信號編碼裝置和譯碼裝置以及音頻信號編碼和譯碼方法。
此外,本發(fā)明的目的還在于提供可以進(jìn)一步大大提高量化效率的音頻信號編碼裝置和譯碼裝置以及音頻信號編碼和譯碼方法。
為了解決上述問題,本發(fā)明的權(quán)利要求1所述的發(fā)明的特征在于在對將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列進(jìn)行矢量量化處理并將音頻信號進(jìn)行編碼的音頻信號編碼裝置中,具備至少具有將上述頻率特性信號系列或其一部分進(jìn)行矢量量化處理的第1級矢量量化器和將上述第1級矢量量化器的量化器誤差成分進(jìn)行矢量量化處理的第2級矢量量化器的多級量化單元,上述多級量化單元的各級量化單元具有對將上述頻率特性信號系列利用各級的分割方式分割為至少2個以上的在多個級間可以具有重復(fù)的部分的頻帶的多個頻帶的某一個頻帶的系數(shù)串進(jìn)行矢量量化處理的至少1個以上的分割化矢量量化器。
本發(fā)明的權(quán)利要求2所述的發(fā)明的特征在于在權(quán)利要求1所述的音頻信號編碼裝置中具有將上述頻率特性信號系列進(jìn)行正規(guī)化處理并將其輸出供給上述多級量化單元的正規(guī)化單元。
本發(fā)明的權(quán)利要求3所述的發(fā)明的特征在于在權(quán)利要求1或2所述的音頻信號編碼裝置中,上述各級量化單元適當(dāng)?shù)剡x擇量化誤差的能量之和大的頻帶作為應(yīng)進(jìn)行量化處理的上述頻率特性信號系列的分割的頻帶進(jìn)行量化處理。
本發(fā)明的權(quán)利要求4所述的發(fā)明在特征在于在權(quán)利要求1或2所述的音頻信號編碼裝置中,上述各級的量化單元,根據(jù)人的聽覺上的性質(zhì)即聽覺敏感,特性適當(dāng)?shù)剡x擇對其重要性高的頻帶加上大的權(quán)重值的量化誤差的能量之和大的頻帶作為應(yīng)進(jìn)行量化處理的上述頻率特性信號系列的分割的頻帶,進(jìn)行量化處理。
本發(fā)明的權(quán)利要求5所述的發(fā)明的特征在于在權(quán)利要求1~4的任一權(quán)項所述的音頻信號編碼裝置中,在構(gòu)成上述多級量化單元的第1級矢量量化器和第2級矢量量化器之間具有第1量化頻帶選擇部,在上述第2級矢量量化器和上述第3級矢量量化器之間具有第2量化頻帶選擇部,上述第1量化頻帶選擇部將上述第1級矢量量化器的量化誤差的輸出作為其輸入,選擇應(yīng)由上述第2級矢量量化器進(jìn)行量化處理的頻帶;上述第2量化頻帶選擇部將上述第2級矢量量化器的量化誤差的輸出作為其輸入,選擇應(yīng)由上述第3級矢量量化器進(jìn)行量化處理的頻帶。
本發(fā)明的權(quán)利要求6所述的發(fā)明的特征在于在權(quán)利要求5所述的音頻信號編碼裝置中,上述多級量化單元具有,將上述頻率特性信號系列的上述分割的各頻帶的各系數(shù)串,由第i級分割的矢量量化器獨立地進(jìn)行量化處理的多個第i級的分割矢量量化器,和作為至少一次將應(yīng)進(jìn)行量化處理的輸入信號的各頻帶全部進(jìn)行量化處理的全頻帶量化部的第j級矢量量化器。
本發(fā)明的權(quán)利要求7所述的發(fā)明的特征在于在權(quán)利要求1所述的音頻信號編碼裝置中,上述多級量化單元使用前級矢量量化器使用代碼薄的矢量量化方法,計算矢量量化中的量化誤差,后級矢量量化器對該計算出的量化誤差進(jìn)一步進(jìn)行矢量量化處理。
本發(fā)明的權(quán)利要求8所述的發(fā)明的特征在于在權(quán)利要求2所述的音頻信號編碼裝置中,上述多級量化單元使用前級矢量量化器使用代碼薄的矢量量化方法,計算矢量量化中的量化誤差,后級矢量量化器對該計算出的量化誤差進(jìn)一步進(jìn)行矢量量化處理。
本發(fā)明的權(quán)利要求9所述的發(fā)明的特征在于在權(quán)利要求8所述的音頻信號編碼裝置中,上述多級量化單元的矢量量化器在檢索矢量量化處理中的上述代碼薄內(nèi)的最佳代碼時使用的代碼間的距離的計算中,使用從上述正規(guī)化單元輸出的輸入信號的正規(guī)化成分作為權(quán)重計算該距離,抽出給定最小距離的代碼。
本發(fā)明的權(quán)利要求10所述的發(fā)明的特征在于在權(quán)利要求9所述的音頻信號編碼裝置中,上述多級量化單元的矢量量化器將從上述正規(guī)化單元輸出的頻率特性信號系列的正規(guī)化成分和考慮了人的聽覺上的性質(zhì)即聽覺敏感特性的值兩者作為權(quán)重計算上述距離,抽出給定最小距離的代碼。
本發(fā)明的權(quán)利要求11所述的發(fā)明的特征在于在權(quán)利要求2和8~10中的任一權(quán)項所述的音頻信號編碼裝置中,上述正規(guī)化單元具有將上述頻率特性信號系列的概形大致地進(jìn)行正規(guī)化處理的頻率概形正規(guī)化部。
本發(fā)明的權(quán)利要求12所述的發(fā)明的特征在于在權(quán)利要求2和8~10中的任一權(quán)項所述的音頻信號編碼裝置中,上述正規(guī)化單元具有將上述頻率特性信號系列分為多個連續(xù)的單位頻帶的各成分,并通過用1個值除各單位頻帶的系數(shù)串而進(jìn)行正規(guī)化的頻帶振幅正規(guī)化部。
本發(fā)明的權(quán)利要求13所述的發(fā)明的特征在于在權(quán)利要求1所述的音頻信號編碼裝置中,上述多級量化單元具有,將上述頻率特性信號系列的上述分割的各頻帶的各系數(shù)串,利用分割化矢量量化器獨立地進(jìn)行量化處理的矢量量化器,和作為至少一次將應(yīng)進(jìn)行量化處理的輸入信號的各頻帶全部進(jìn)行量化處理的全頻帶量化部的矢量量化器。
本發(fā)明的權(quán)利要求14所述的發(fā)明的特征在于在權(quán)利要求13所述的音頻信號編碼裝置中,上述多級量化單元具有由低頻區(qū)的分割化矢量量化器、中頻區(qū)的分割化矢量量化器和高頻區(qū)的分割化矢量量化器構(gòu)成的第1矢量量化器,與其后級連接的第2矢量量化器和與其后級連接的第3矢量量化器,將輸入該多級量化單元的頻率特性信號系列分割為3個頻帶,由上述低頻區(qū)的分割化矢量量化器獨立地將該3個頻帶中的低頻帶成分的頻率特性信號系列進(jìn)行量化處理,由上述中頻區(qū)的分割化矢量量化器獨立地將上述3個頻帶中的中頻的頻帶成分的頻率特性信號系列進(jìn)行量化處理,由上述高頻區(qū)的分割化矢量量化器獨立地將上述3個頻帶中的高頻帶成分的頻率特性信號系列進(jìn)行量化處理,由構(gòu)成上述第1矢量量化器的各分割化矢量量化器計算對頻率特性信號系列的量化誤差,將其作為向后級的上述第2矢量量化器的輸入,在上述第2矢量量化器中對該第2矢量量化器量化的頻帶寬度進(jìn)行量化處理,計算對該第2矢量量化器的輸入的量化誤差,將其作為向上述第3矢量量化器的輸入,在上述第3矢量量化器中,對該第3矢量量化器量化的頻帶寬度進(jìn)行量化處理。
本發(fā)明的權(quán)利要求15所述的發(fā)明的特征在于在權(quán)利要求14所述的音頻信號編碼裝置中,在構(gòu)成上述多級量化單元的第1矢量量化器和第2矢量量化器之間設(shè)置第1量化頻帶選擇部,同時,在上述第2矢量量化器和上述第3矢量量化器之間設(shè)置第2量化頻帶選擇部,上述第1量化頻帶選擇部將上述第1矢量量化器的輸出作為其輸入,選擇應(yīng)由上述第2矢量量化器進(jìn)行量化處理的頻帶,上述第2矢量量化器對于由上述第1量化選擇部選擇的頻帶的由上述3個矢量量化器構(gòu)成的第1矢量量化器的量化誤差,對該第2矢量量化器量化的頻帶寬度進(jìn)行量化處理,計算對該第2矢量量化器的輸入的量化誤差,并將其作為向上述第2量化頻帶選擇部的輸入;上述第2量化頻帶選擇部將上述第2矢量量化器的量化誤差作為輸入,選擇應(yīng)由上述第3矢量量化器進(jìn)行量化處理的頻帶,上述第3矢量量化器對于上述第2量化頻帶選擇部選擇的頻帶的上述第2矢量量化器的量化誤差,對該第2矢量量化器量化的頻帶寬度進(jìn)行量化處理。
本發(fā)明的權(quán)利要求16所述的發(fā)明的特征在于在權(quán)利要求14所述的音頻信號編碼裝置中,使用上述低頻區(qū)的分割化矢量量化器、中頻區(qū)的分割化矢量量化器和高頻區(qū)的分割化矢量量化器構(gòu)成上述第2矢量量化器或第3矢量量化器,取代上述第1矢量量化器。
本發(fā)明的權(quán)利要求17所述的發(fā)明是一種將權(quán)利要求1所述的音頻信號編碼裝置輸出的代碼作為其輸入并將其譯碼從而輸出與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號譯碼裝置,其特征在于具有使用上述音頻信號編碼裝置的量化單元輸出的代碼的至少一部分進(jìn)行逆量化處理的逆量化部,和使用作為該逆量化部的輸出的頻率特性信號系列將頻率特性信號系列變換為與原來的音頻輸入信號相當(dāng)?shù)男盘柕哪骖l率變換部。
本發(fā)明的權(quán)利要求18所述的發(fā)明是一種將權(quán)利要求2所述的音頻信號編碼裝置輸出的代碼作為其輸入并將其譯碼從而輸出與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號譯碼裝置,其特征在于具有再生頻率特性信號系列的逆量化部及使用作為該逆量化部的輸出的頻率特性信號系列,根據(jù)作為上述音頻信號編碼裝置的輸出的代碼再生正規(guī)化成分,并將上述頻率特性信號系列與正規(guī)化成分相乘而輸出的逆正規(guī)化部,和接收該逆正規(guī)化的輸出并將頻率特性信號系列變換為與原來的音頻信號相當(dāng)?shù)男盘柕哪骖l率變換部。
本發(fā)明的權(quán)利要求19所述的發(fā)明是一種將權(quán)利要求13所述的音頻信號編碼裝置輸出的代碼作為其輸入并將其譯碼從而輸出與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號譯碼裝置,其特征在于具有不論構(gòu)成上述音頻信號編碼裝置的量化單元的全部還是一部分矢量量化器輸出代碼時都使用輸出的代碼進(jìn)行逆量化處理的逆量化部。
本發(fā)明的權(quán)利要求20所述的發(fā)明的特征在于在權(quán)利要求19所述的音頻信號譯碼裝置中,上述逆量化部在某一級的指定頻帶的量化代碼的逆量化之后,交替地進(jìn)行該指定頻帶的下一級的量化代碼的逆量化處理和與該某一級的該指定頻帶不同的頻帶的量化代碼的逆量化處理,在不存在該指定頻帶的下一級的量化代碼時,接著就進(jìn)行不同的頻帶的量化代碼的逆量化處理;在不存在與上述指定的頻帶不同的頻帶的量化代碼時,接著就進(jìn)行下一級的量化代碼的逆量化處理。
本發(fā)明的權(quán)利要求21所述的發(fā)明是一種將權(quán)利要求14所述的音頻信號編碼裝置輸出的代碼作為其輸入并將其譯碼從而輸出與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號譯碼裝置,其特征在于具有不論從構(gòu)成上述音頻信號編碼裝置的第1矢量量化器的3個分割化矢量量化器全部還是一部分輸出代碼時都只使用構(gòu)成上述第1矢量量化器的低頻區(qū)的分割化矢量量化器的代碼進(jìn)行逆量化處理的逆量化部。
本發(fā)明的權(quán)利要求22所述的發(fā)明的特征在于在權(quán)利要求21所述的音頻信號譯碼裝置中,上述逆量化部除了使用構(gòu)成上述第1矢量量化器的低頻區(qū)的分割化矢量量化器的代碼外,還使用上述第2矢量量化器的代碼進(jìn)行逆量化處理。
本發(fā)明的權(quán)利要求23所述的發(fā)明的特征在于在權(quán)利要求22所述的音頻信號譯碼裝置中,上述逆量化部除了使用構(gòu)成上述第1矢量量化器的低頻區(qū)的分割化矢量量化器的代碼和上述第2矢量量化器的代碼外,還使用構(gòu)成上述第1矢量量化器的中頻區(qū)的分割化矢量量化器的代碼進(jìn)行逆量化處理。
本發(fā)明的權(quán)利要求24所述的發(fā)明的特征在于在權(quán)利要求23所述的音頻信號譯碼裝置中,上述逆量化部除了使用構(gòu)成上述第1矢量量化器的低頻區(qū)的分割化矢量量化器的代碼、上述第2矢量量化器的代碼和構(gòu)成上述第1矢量量化器的中頻區(qū)的分割化矢量量化器的代碼外,還使用上述第3矢量量化器的代碼進(jìn)行逆量化處理。
本發(fā)明的權(quán)利要求25所述的發(fā)明的特征在于在權(quán)利要求24所述的音頻信號譯碼裝置中,上述逆量化部除了使用構(gòu)成上述第1矢量量化器的低頻區(qū)的分割化矢量量化器的代碼、上述第2矢量量化器的代碼、構(gòu)成上述第1矢量量化器的中頻區(qū)的分割化矢量量化器的代碼和上述第3矢量量化器的代碼外,還使用構(gòu)成上述第1矢量量化器的高頻區(qū)的分割化矢量量化器的代碼進(jìn)行逆量化處理。
本發(fā)明的權(quán)利要求26所述的發(fā)明是一種接收將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列、將其編碼而輸出并將該輸出的代碼信號作為輸入將其譯碼從而再生與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號編碼和譯碼方法,其特征在于將上述頻率特性信號系列分為與至少分割為2個以上的頻帶的頻帶相當(dāng)?shù)南禂?shù)串,分別獨立地進(jìn)行量化處理而輸出,根據(jù)接收的已量化的信號,對與上述分割的頻帶相當(dāng)?shù)娜我獾念l帶的數(shù)據(jù)進(jìn)行逆量化處理,再生與原來的音頻輸入信號相當(dāng)?shù)男盘枴?br>
本發(fā)明的權(quán)利要求27所述的發(fā)明的特征在于在權(quán)利要求26所述的音頻信號編碼和譯碼方法中,上述量化處理分階段進(jìn)行,從而將計算出的量化誤差進(jìn)一步進(jìn)行量化處理;上述逆量化處理反復(fù)交替地進(jìn)行向擴(kuò)展頻帶方向的逆量化處理和向上述量化處理時量化階段加深的方向的逆量化處理。
本發(fā)明的權(quán)利要求28所述的發(fā)明的特征在于在權(quán)利要求27所述的音頻信號編碼和譯碼方法中,向擴(kuò)展上述頻帶方向的逆量化處理按考慮了人的聽覺心理特性的順序擴(kuò)展頻帶而進(jìn)行。
本發(fā)明的權(quán)利要求29所述的發(fā)明的特征在于在權(quán)利要求26~28中的任一權(quán)項所述的音頻信號編碼和譯碼方法中,在編碼側(cè),將上述頻率特性信號系列正規(guī)化后,將該頻率特性信號系列分為與至少分割為2個以上的頻帶的頻帶相當(dāng)?shù)南禂?shù)串,進(jìn)行分別獨立地量化而輸出的處理;在譯碼側(cè),使用關(guān)于上述編碼側(cè)的正規(guī)化的代碼,將上述編碼側(cè)的代碼進(jìn)行逆正規(guī)化處理后,對該逆正規(guī)化處理后的代碼,通過對與上述分割的頻帶相當(dāng)?shù)娜我獾念l帶的數(shù)據(jù)進(jìn)行逆量化處理,再生與原來的音頻輸入信號相當(dāng)?shù)男盘枴?br>
本發(fā)明的權(quán)利要求30所述的發(fā)明是一種對將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列進(jìn)行正規(guī)化和矢量量化處理并將音頻信號進(jìn)行編碼的音頻信號編碼裝置,其特征在于具備至少具有將上述頻率特性信號系列或其一部分進(jìn)行正規(guī)化和矢量量化處理的第1級正規(guī)化及矢量量化器,和將上述第1級正規(guī)化及矢量量化器的量化誤差進(jìn)行正規(guī)化及矢量量化處理的第2級正規(guī)化及矢量量化器的多級量化單元,上述多級量化單元的各級量化單元具有至少1個以上的分割化的正規(guī)化及矢量量化器,該分割化的正規(guī)化及矢量量化器將利用各級的分割方式將上述頻率特性信號系列分割為至少2個以上的在多個級間可以具有疊加的部分的頻帶的多個頻帶中的某個頻帶的系數(shù)串進(jìn)行正規(guī)化及矢量量化處理。
本發(fā)明的權(quán)利要求31所述的發(fā)明的特征在于在權(quán)利要求30所述的音頻信號編碼裝置中,在構(gòu)成上述多級量化單元的第1級正規(guī)化及矢量量化器和第2級正規(guī)化及矢量量化器之間具有第1量化頻帶選擇部,在上述第2級正規(guī)化及矢量量化器和上述第3級正規(guī)化及矢量量化器之間具有第2量化頻帶選擇部,上述第1量化頻帶選擇部將上述第1級正規(guī)化及矢量量化器的量化誤差的輸出作為其輸入,選擇應(yīng)由上述第2級正規(guī)化及矢量量化器進(jìn)行量化處理的頻帶,并將該選擇的頻帶的量化誤差的輸出向上述第2級正規(guī)化及矢量量化器輸出;上述第2量化頻帶選擇部將上述第2級正規(guī)化及矢量量化器的量化誤差的輸出作為其輸入,選擇應(yīng)由上述第3正規(guī)化及矢量量化器進(jìn)行量化處理的頻帶,并將該選擇的頻帶的量化誤差的輸出向上述第3級正規(guī)化及矢量量化器輸出。
本發(fā)明的權(quán)利要求32所述的發(fā)明的特征在于在權(quán)利要求31所述的音頻信號編碼裝置中,上述多級量化單元的第2級以后的各級正規(guī)化及矢量量化器,適當(dāng)?shù)剡x擇應(yīng)進(jìn)行正規(guī)化及量化處理的上述頻率特性信號系列的分割的頻帶中前級的正規(guī)化及矢量量化器的輸出即量化誤差的能量之和大的頻帶,進(jìn)行正規(guī)化及量化處理。
本發(fā)明的權(quán)利要求33所述的發(fā)明的特征在于在權(quán)利要求31所述的音頻信號編碼裝置中,上述多級量化單元的第2級以后的各級正規(guī)化及矢量量化器,在應(yīng)進(jìn)行正規(guī)化及量化處理的上述頻率特性信號系列的分割的頻帶中,根據(jù)人的聽覺的性質(zhì)即聽覺敏感特性,適當(dāng)?shù)剡x擇對其重要性高的頻帶加權(quán)大的值的前級的正規(guī)化及矢量量化器的輸出即量化誤差的能量之和大的頻帶進(jìn)行正規(guī)化及量化處理。
本發(fā)明的權(quán)利要求34所述的發(fā)明是一種將作為權(quán)利要求30~33中的任一權(quán)項所述的音頻信號編碼裝置的輸出的代碼作為其輸入并將其譯碼從而輸出與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號譯碼裝置,其特征在于具有接收上述音頻信號編碼裝置的量化部的各量化器的信號并再生與上述頻率特性信號系列分割為多個頻帶的各頻帶的系數(shù)串相當(dāng)?shù)男盘柕哪媪炕浚O(shè)置在該多個逆量化部中將作為其輸出的頻率特性信號系列的系數(shù)串,根據(jù)關(guān)于作為上述音頻信號編碼裝置的輸出的正規(guī)化的代碼而再生的正規(guī)化成分相乘,從而輸出與編碼前的頻率特性信號系列的各系數(shù)串相當(dāng)?shù)男盘柕亩鄠€逆正規(guī)化部,和接收該多個逆正規(guī)化部的輸出并將它們變換為與原來的音頻信號相當(dāng)?shù)男盘柕哪骖l率變換部。
本發(fā)明的權(quán)利要求35所述的發(fā)明是一種接收將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列并將其進(jìn)行編碼后輸出、將該輸出的代碼信號作為輸入并將其譯碼從而再生與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號編碼和譯碼方法,其特征在于將上述頻率特性信號系列分為與分割為至少2個以上的頻帶的頻帶相當(dāng)?shù)南禂?shù)串,分別獨立地進(jìn)行正規(guī)化及量化處理后輸出,從接收的已量化的信號中使用關(guān)于編碼側(cè)的正規(guī)化的代碼,通過對與上述分割的頻帶相當(dāng)?shù)娜我獾念l帶的數(shù)據(jù)進(jìn)行逆正規(guī)化及逆量化處理,再生與原來的音頻輸入信號相當(dāng)?shù)男盘枴?br>
本發(fā)明的權(quán)利要求36所述的發(fā)明的特征在于在權(quán)利要求35所述的音頻信號編碼和譯碼方法中,上述正規(guī)化及量化處理分階段進(jìn)行,從而對計算出的量化誤差進(jìn)一步進(jìn)行正規(guī)化及量化處理;上述逆正規(guī)化及逆量化處理,反復(fù)交替地進(jìn)行向擴(kuò)展頻帶的方向的逆正規(guī)化及逆量化處理和向上述量化處理時的量化階段深入的方向的逆正規(guī)化及逆量化處理。
本發(fā)明的權(quán)利要求37所述的發(fā)明的特征在于在權(quán)利要求36所述的音頻信號編碼和譯碼方法中,向擴(kuò)展上述頻帶的方向的逆正規(guī)化及逆量化處理,按照考慮了人的聽覺心理特性的順序擴(kuò)展頻帶而進(jìn)行。
本發(fā)明的權(quán)利要求38所述的發(fā)明是一種對將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列進(jìn)行矢量量化處理并對音頻信號進(jìn)行編碼的音頻信號編碼裝置,其特征在于具有具備至少具有對上述頻率特性信號系列進(jìn)行矢量量化處理的第1級矢量量化器和對上述第1級矢量量化器的量化誤差成分進(jìn)行矢量量化處理的第2級矢量量化器的多級量化單元,上述多級量化單元的各級量化單元由將上述頻率特性信號系列或前級的量化單元的量化誤差成分全部進(jìn)行矢量量化處理的全頻帶矢量量化器構(gòu)成。
如上所述,按照本發(fā)明的音頻信號編碼裝置和譯碼裝置或者編碼和譯碼方法,量化處理使用矢量量化的方法等,具有在高信息壓縮率中也可以進(jìn)行量化處理的結(jié)構(gòu),同時,采用將量化處理時的信息量的分配交替地分配對再生頻帶的擴(kuò)展有用的信息量和對提高品質(zhì)有用的信息量的結(jié)構(gòu),首先,在編碼裝置中,作為第1階段,將輸入的音頻信號變換為頻率區(qū)域的信號,并將變換后的頻率信號的一部分進(jìn)行編碼,作為第2階段,將未編碼的頻率信號的一部分和第1階段的量化誤差信號進(jìn)行編碼,并附加到第1階段的代碼上,在第3階段,進(jìn)而對未編碼的頻率信號的一部分和第1階段及第2階段的量化誤差信號進(jìn)行編碼并附加到第1階段和第2階段的代碼上,同樣,進(jìn)而繼續(xù)向下一階段推進(jìn),進(jìn)行編碼;另一方面,在譯碼裝置中,也可以先只使用第1階段編碼的代碼進(jìn)行譯碼,然后使用第1階段和第2階段編碼的代碼進(jìn)行譯碼,進(jìn)而使用從第1階段到第3階段以上的階段編碼的代碼進(jìn)行譯碼,采用譯碼的順序為交替地將對頻帶擴(kuò)展有用的代碼和對品質(zhì)提高有用的代碼進(jìn)行譯碼的結(jié)構(gòu),所以,即使不使用固定的信息量進(jìn)行編碼和譯碼,也可以得到良好的音質(zhì),另外,還可以用高的壓縮率得到高品質(zhì)的聲音。
另外,按照本發(fā)明的音頻信號編碼裝置和譯碼裝置或編碼還譯碼方法,在用量化單元進(jìn)行量化處理之前,設(shè)置正規(guī)化單元,在對輸入音頻信號進(jìn)行正規(guī)化處理后進(jìn)行量化處理,所以,可以進(jìn)行正規(guī)化單元和量化單元完全地發(fā)揮各自的能力的編碼,不會損失源音頻信號所具有的信息量,可以進(jìn)行量化誤差小、量化效率高的量化處理,從而可以根據(jù)音頻信號的種類而充分發(fā)揮其效果。另外,如上所述,通過采用將量化處理時的信息量的分配交替地分配對再生頻帶的擴(kuò)展有用的信息量和對品質(zhì)提高有用的信息量的結(jié)構(gòu),在限定受信側(cè)的信息量時,就只能在頻帶窄而淺的區(qū)域進(jìn)行逆量化處理,但是,通過順序?qū)⒃撃媪炕幚斫惶娴叵驍U(kuò)展頻帶的方向和加深逆量化處理的深度的方向擴(kuò)展,增大受信側(cè)的信息量,則不論從編碼裝置發(fā)信來的信息量如何,都可以將已編碼的音頻信號的所希望的信息量進(jìn)行譯碼,這樣,通過根據(jù)受信側(cè)的通信環(huán)境等改變進(jìn)行譯碼的信息量,例如,即使在利用通常的公用電話網(wǎng)時,也可以穩(wěn)定地得到高品位的音質(zhì)。
另外,按照本發(fā)明的音頻信號編碼裝置和譯碼裝置或編碼和譯碼方法,在進(jìn)行多級量化處理的量化單元的前級分別設(shè)置正規(guī)化單元,對分割的各頻帶并且在各級的量化處理前進(jìn)行正規(guī)化處理后進(jìn)行量化處理,所以,利用各頻帶的正規(guī)化處理,進(jìn)行與各頻帶的音頻信號所具有的信息量相應(yīng)的適當(dāng)?shù)木幋a,即進(jìn)行正規(guī)化單元和量化單元可以完全地發(fā)揮各自的能力的編碼,不會損失源音頻信號所具有的信息量,因此,可以進(jìn)行量化誤差小、量化效率高的量化處理,從而可以根據(jù)音頻信號的種類而充分發(fā)揮其效果。另外,如果將譯碼側(cè)的逆正規(guī)化和逆量化處理交替地向擴(kuò)展量化的頻帶的方向和加深量化的深度的方向進(jìn)行,和上述一樣,不論從編碼裝置發(fā)信來的信息量如何,都可以將已編碼的音頻信號的所希望的信息量進(jìn)行譯碼,即,可以根據(jù)受信側(cè)的通信環(huán)境等改變進(jìn)行譯碼的信息量,例如,即使利用通常的公用電話網(wǎng)時,也可以穩(wěn)定地得到高品位的音質(zhì)。
圖1是表示本發(fā)明的音頻信號編碼裝置和譯碼裝置的總體結(jié)構(gòu)的圖。
圖2是表示構(gòu)成上述音頻信號編碼裝置的正規(guī)化部的一例的結(jié)構(gòu)圖。
圖3是表示構(gòu)成上述音頻信號編碼裝置的頻率概形正規(guī)化部的一例的結(jié)構(gòu)圖。
圖4是表示構(gòu)成上述音頻信號編碼裝置的量化部的實施例1的結(jié)構(gòu)圖。
圖5是表示構(gòu)成上述音頻信號編碼裝置的量化部的實施例2的結(jié)構(gòu)圖。
圖6是表示構(gòu)成上述音頻信號編碼裝置的量化部的實施例3的結(jié)構(gòu)圖。
圖7是表示構(gòu)成上述音頻信號譯碼裝置的逆量化部的實施例4的結(jié)構(gòu)圖。
圖8是表示構(gòu)成上述音頻信號譯碼裝置的逆量化部的實施例4的一例的結(jié)構(gòu)圖。
圖9是表示構(gòu)成上述音頻信號譯碼裝置的逆量化部的實施例4的其他例的結(jié)構(gòu)圖。
圖10是表示構(gòu)成上述音頻信號譯碼裝置的逆量化部的實施例4的另一例的結(jié)構(gòu)圖。
圖11是表示構(gòu)成上述音頻信號譯碼裝置的逆量化部的實施例4的另一例的結(jié)構(gòu)圖。
圖12是表示逆正規(guī)化部的一個實施例的結(jié)構(gòu)圖。
圖13是用于說明上述編碼裝置的量化部的詳細(xì)的動作的圖。
圖14是用于說明上述譯碼裝置的逆量化部的信息的動作的圖。
圖15是用于說明上述實施例4的逆量化部的逆量化處理順序的動作的圖。
圖16是表示頻率概形逆正規(guī)化部的一個實施例的結(jié)構(gòu)圖。
圖17是用于說明先有的和本發(fā)明的音頻信號編碼裝置的量化處理的方法的圖。
圖18是表示本發(fā)明的實施例5的音頻信號編碼裝置的量化部的結(jié)構(gòu)圖。
圖19是用于說明本發(fā)明的實施例5的音頻信號編碼裝置的動作全體的波形圖。
圖20是表示本發(fā)明的實施例1~3(圖(a))和實施例5(圖(b),(c))的音頻信號編碼裝置的概略結(jié)構(gòu)的圖。
圖21是用于說明本發(fā)明的實施例5的音頻信號編碼裝置的動作全體的波形圖。
圖22是用于說明本發(fā)明的實施例5的音頻信號編碼裝置的第1級~第3級正規(guī)化及量化單元的正規(guī)化和量化處理的方法的一例的圖。
圖23是用于說明與本發(fā)明的實施例5的音頻信號編碼裝置對應(yīng)的音頻信號譯碼裝置的結(jié)構(gòu)的圖。
圖24是表示先有的音頻信號編碼裝置的結(jié)構(gòu)的圖。
下面,參照
本發(fā)明的實施例。
(實施例1)圖1是表示本發(fā)明的實施例1的音頻信號編碼裝置和譯碼裝置的總體結(jié)構(gòu)的圖。在圖1中,1是編碼裝置,2是譯碼裝置。在編碼裝置1中,101是將輸入信號分割為指定的幀值的幀分割部,102是在時間軸上將輸入信號與窗函數(shù)相乘的加窗部,103是進(jìn)行改進(jìn)離散余弦變換(Modified discrete cosine transform)的MDCT部,104是將幀分割部101的輸出即時間軸的信號和MDCT部103的輸出即MDCT系數(shù)作為輸入并將該MDCT系數(shù)進(jìn)行正規(guī)化處理的正規(guī)化部,105是將已正規(guī)化的MDCT系數(shù)作為輸入進(jìn)行量化處理的量化部。這里,對作為時間頻率變換使用MDCT的情況進(jìn)行說明,但是,也可以使用離散付利葉變換(DFT:Discrete Fourier Transform)。
在譯碼裝置2中,106是接收從編碼裝置1輸出的信號(索引IND2)并將其進(jìn)行逆量化處理的逆量化部,107是使用編碼裝置1的正規(guī)化部104的索引IND1將逆量化部106的輸出進(jìn)行逆正規(guī)化處理的逆正規(guī)化部,108是將逆正規(guī)化部107的輸出進(jìn)行改進(jìn)離散余弦變換的逆MDCT部,109是對逆MDCT部108的輸出進(jìn)行加窗的加窗部,110是對加窗部109的輸出進(jìn)行幀疊加的幀疊加部。
下面,說明按上述方式構(gòu)成的音頻信號編碼裝置和譯碼裝置的動作。
輸入編碼裝置1的信號,假定是在時間上連續(xù)的數(shù)字信號系列。例如,假定是將聲音信號用采樣頻率48kHz量化為16位的數(shù)字信號。該輸入信號在達(dá)到某一一定的采樣數(shù)之前由幀分割部101進(jìn)行存儲,存儲的采樣數(shù)達(dá)到規(guī)定的幀長度時,就進(jìn)行輸出。這里,幀分割部101的幀長度是例如128、256、512、1024、2048、4096采樣等。在幀分割部101中,也可以根據(jù)輸入信號的特征改變幀長度而輸出。另外,幀分割部101是每隔某一移位長度進(jìn)行輸出的結(jié)構(gòu),例如,在將幀長度采用4096采樣時,如果設(shè)定幀長度的一半的移位長度,幀長度具有每隔與達(dá)到2048采樣相當(dāng)?shù)臅r間而輸出最新的4096采樣等的結(jié)構(gòu)。當(dāng)然,即使改變幀長度或采樣頻率,同樣也可以具有將移位長度設(shè)定為幀長度的一半的結(jié)構(gòu)。
并且,該幀分割部101的輸出分別輸入后級的加窗部102和正規(guī)化部104。在加窗部102中,對上述幀分割部101的輸出信號在時間軸上乘以窗函數(shù),作為加窗部102的輸出。其形式可以用例如(1)式表示。
hxi=hi.xii=1,2,…,Nhi=sin(πN(i+0.5))-------(1)]]>其中,xi是幀分割部101的輸出,hi是窗函數(shù),hxi是加窗部102的輸出。另外,i是時間的下標(biāo)。在(1)式中所示的窗函數(shù)hi是一例,窗函數(shù)不一定必須是(1)式所示的那樣。窗函數(shù)的選擇,依賴于輸入加窗部102的信號的特征、幀分割部101的幀長度和在時間上前后幀的窗函數(shù)的形狀。例如,作為輸入加窗部102的信號的特征,設(shè)幀分割部101的幀長度為N時,計算每隔N/4輸入的信號的平均功率,該平均功率發(fā)生非常大的變化時,就選擇使幀長度比N短而進(jìn)行(1)式所示的運(yùn)算等。另外,最好根據(jù)前一時刻的幀的窗函數(shù)的形狀和后面的幀的窗函數(shù)的形狀適當(dāng)?shù)剡x擇使當(dāng)前時刻的幀的窗函數(shù)的形狀沒有畸變。
其次,加窗部102的輸出,輸入MDCT部103,。在此進(jìn)行改進(jìn)離散余弦變換,并輸出MDCT系數(shù)。改進(jìn)離散余弦變換的一般式可以用(2)式表示。yk=Σn=0N-1hxn·cos(2π(k+1/2)(n+n0)N)-------(2)]]>n0=N/4+1/2(k=0,1,…,N/2-1)這樣,假設(shè)作為MDCT部103的輸出的MDCT系數(shù)用(2)式的yk表示,則MDCT部103的輸出就表示頻率特性,yk的變量k越接近0,低頻成分越與從0增大到接近N/2-1的高頻成分線性地對應(yīng)。在正規(guī)化部104中,將作為幀分割部101的輸出的時間軸上的信號xi和作為MDCT部103的輸出的MDCT系數(shù)yk作為輸入,使用其幾個參量將MDCT系數(shù)進(jìn)行正規(guī)化處理。這里,所謂MDCT系數(shù)的正規(guī)化,就是要抑制在低頻成分和高頻成分部分的大小有非常大的差別的MDCT系數(shù)的大小的偏差,例如,相對于高頻成分,低頻成分非常大時,就選擇在低頻成分中成為大的值,在高頻成分中成為小的值的參量,通過用此參量除上述MDCT系數(shù),來抑制MDCT系數(shù)的大小的偏差。另外,在正規(guī)化部104中,將表現(xiàn)正規(guī)化所使用的參量的索引IND1進(jìn)行編碼。
在量化部105中,就將由正規(guī)化部104進(jìn)行正規(guī)化處理后的MDCT系數(shù)作為輸入,進(jìn)行MDCT系數(shù)的量化處理。這時,該量化部105輸出使該量化處理后的值與和位于代碼薄中的多個代碼索引對應(yīng)的各量化輸出之間的差別為最小的代碼索引。這時,由上述量化部105進(jìn)行量化處理后的值與和從該量化部105輸出的代碼索引對應(yīng)的值之差就是量化誤差。
另一方面,在譯碼裝置2中,使用編碼裝置1的正規(guī)化部104的索引IND1和量化部105的索引IND2進(jìn)行譯碼。在逆量化部106中,使用量化部105的索引IND2再生在上述編碼裝置1中進(jìn)行正規(guī)化處理時刻的MDCT系數(shù)。在逆量化部106中,既可以使用全部索引也可以使用一部分索引進(jìn)行MDCT系數(shù)的再生。當(dāng)然,正規(guī)化部104的輸出和逆量化部106的輸出伴有量化部105進(jìn)行量化處理時的量化誤差,所以,與進(jìn)行量化處理前的狀態(tài)不一定一致。
在逆正規(guī)化部107中,根據(jù)編碼裝置1的正規(guī)化部104的索引IND1對在編碼裝置1中進(jìn)行正規(guī)化處理所使用的參量進(jìn)行復(fù)原,將逆量化部106的輸出與該參量相乘,進(jìn)行MDCT系數(shù)的復(fù)原。在逆MDCT部108中,根據(jù)作為逆正規(guī)化部107的輸出的MDCT系數(shù)進(jìn)行逆MDCT處理,從而進(jìn)行從頻率區(qū)域的信號向時間區(qū)域的信號的復(fù)原。上述逆MDCT計算,可以用例如(3)式表示。xx(n)=2NΣk=0n-1yykcos(2π(k+1/2)(n+n0)N)------(3)]]>n0=N/4+1/2其中,yyk是由逆正規(guī)化部107所復(fù)原的MDCT系數(shù),xx(n)是逆MDCT系數(shù),將其作為逆MDCT部108的輸出。
在加窗部109中,使用逆MDCT部108的輸出xx(n)進(jìn)行加窗處理。加窗處理是使用在編碼裝置1的加窗部102中使用的窗函數(shù)進(jìn)行例如由(4)式所示的處理。
z(i)=xx(i)·hi(4)其中,z(i)是加窗部109的輸出。
在幀疊加部110中,使用加窗部109的輸出再生音頻信號。由于加窗部109的輸出成為在時間上重復(fù)的信號,所以,在幀疊加部110中,使用例如(5)式作為譯碼裝置2的輸出信號。
out(i)=zm(i)+zm-1(i+SHIFT)(5)其中,zm(i)是第m時刻的幀的第i個加窗部109的輸出信號,zm-1(i)是第m-1時刻的幀的第i個加窗部109的輸出信號,SHIFT是與編碼裝置的幀長度相當(dāng)?shù)牟蓸訑?shù),out(i)是在幀疊加部110的第m時刻的幀的譯碼裝置2的輸出信號。
下面,使用圖2說明上述正規(guī)化部104的詳細(xì)的一例。在圖2中,201是接收幀分割部101和MDCT部103的輸出的頻率概形正規(guī)化部,202是接收頻率概形正規(guī)化部201的輸出并參照頻帶表203進(jìn)行正規(guī)化處理的頻帶振幅正規(guī)化部。
下面,說明其動作。在頻率概形正規(guī)化部201中,使用幀分割部101的時間軸上的數(shù)據(jù)輸出計算作為大致的頻率的概形的頻率概形,并用其除作為MDCT部103的輸出的MDCT系數(shù)。表現(xiàn)頻率概形所使用的參量,編碼為索引IND1。在頻帶振幅正規(guī)化部202中,將頻率概形正規(guī)化部201的輸出信號作為輸入,對在頻帶表203中所示的各頻帶進(jìn)行正規(guī)化處理。例如,設(shè)作為頻率概形正規(guī)化部201的輸出的MDCT系數(shù)為dct(i)(i=0~2047)、頻帶表203為例如(表1)所示的那樣,就使用(6)式等計算各頻帶的振幅的平均值。
(表1)
其中,bjlow,bjhigh分別表示頻帶表203所示的第j頻帶的dct(i)所屬的最低頻的索引i和最高頻的索引i。另外,p是進(jìn)行距離計算中的范數(shù),最好為2等數(shù)值。
avej是各頻帶號碼j的振幅的平均值。在頻帶振幅正規(guī)化部202中,將avej進(jìn)行量化處理,計算qavej,使用例如(7)式進(jìn)行正規(guī)化處理。
n_dct(i)=dct(i)/qavejbjlow≤i≤bjhigh(7)avej的量化,既可以使用標(biāo)量量化,也可以使用代碼薄進(jìn)行矢量量化處理。在頻帶振幅正規(guī)化部202中,將表現(xiàn)qavej所使用的參量的索引IND1進(jìn)行編碼。
編碼裝置1的正規(guī)化部104的結(jié)構(gòu),此處表示了使用圖2的頻率概形正規(guī)化部201和頻帶振幅正規(guī)化部202的結(jié)構(gòu),但是,也可以是只使用頻率概形正規(guī)化部201的結(jié)構(gòu),或只使用頻帶振幅正規(guī)化部202的結(jié)構(gòu)。此外,當(dāng)在MDCT部103輸出的MDCT系數(shù)的低頻成分和高頻成分中沒有大的偏差時,也可以采用不使用兩者的結(jié)構(gòu)而將MDCT部103的輸出信號直接輸入量化部105的結(jié)構(gòu)。
下面,使用圖3說明圖2的頻率概形正規(guī)化部201的詳細(xì)情況。在圖3中,301是接收幀分割部101的輸出的線性預(yù)測分析部,302是接收線性預(yù)測分析部301的輸出的概形量化部,303是接收MDCT部103的輸出的包絡(luò)特性正規(guī)化部。
下面,說明上述頻率概形正規(guī)化部201的動作。在上述線性預(yù)測分析部301中,將幀分割部101的時間軸上的音頻信號作為輸入,進(jìn)行線性預(yù)測分析。線性預(yù)測分析的線性預(yù)測系數(shù),通??梢酝ㄟ^計算加重平均窗等的加窗的信號的自相關(guān)函數(shù)并求解標(biāo)準(zhǔn)方程等而計算。計算出的線性預(yù)測系數(shù)變換為線頻譜對系數(shù)(LSP(Line Spectrum Pair)系數(shù))等,由概形量化部302進(jìn)行量化處理。作為量化方法,既可以使用矢量量化,也可以使用標(biāo)量量化。并且,由包絡(luò)特性正規(guī)化部303計算由概形量化部302進(jìn)行量化處理的參量所表現(xiàn)的頻率傳遞特性,并通過用其除作為MDCT部103的輸出的MDCT系數(shù)進(jìn)行正規(guī)化處理。作為具體的計算例子,假定與由概形量化部302進(jìn)行量化處理的參量等價的線性預(yù)測系數(shù)為qlpc(i),則由包絡(luò)特性正規(guī)化部303計算的上述頻率傳遞特性可以用例如(8)式表示。
env(i)=1/fft(li)其中,ORDER最好為10~40。fft()表示高速傅利葉變換。在包絡(luò)特性正規(guī)化部303中,使用計算出的頻率傳遞特性env(i)利用例如以下所示的(9)式進(jìn)行正規(guī)化處理。
fdct(i)=mdct(i)/env(i)(9)其中,mdct(i)是MDCT部103的輸出信號,fdct(i)是進(jìn)行正規(guī)化處理的包絡(luò)特性正規(guī)化部303的輸出信號。
下面,使用圖4說明編碼裝置1的量化部105的詳細(xì)情況。在圖4中,401是第1小量化部,402是接收第1小量化部401的輸出的第2小量化部,403是接收第2小量化部402的輸出的第3小量化部。
下面,說明上述量化部105的動作。輸入上述第1小量化部401的信號是編碼裝置的正規(guī)化部104的輸出,是進(jìn)行了正規(guī)化處理的MDCT系數(shù)。但是,在不具有正規(guī)化部104的結(jié)構(gòu)中,就成為MDCT部103的輸出。在第1小量化部401中,將輸入的MDCT系數(shù)進(jìn)行標(biāo)量量化處理或矢量量化處理后,將表現(xiàn)量化處理時所使用的參量的索引進(jìn)行編碼。另外,計算量化處理引起的對MDCT系數(shù)的量化誤差,并將其向第2小量化部402輸出。這里,在第1小量化部401中,可以將全部MDCT系數(shù)進(jìn)行量化處理,也可以只將一部分進(jìn)行量化處理。當(dāng)然,只將一部分進(jìn)行量化處理時,未由第1小量化部401進(jìn)行量化處理的頻帶的量化誤差就是未進(jìn)行量化處理的頻帶的輸入MDCT系數(shù)本身。
其次,在第2小量化部402中,將第1小量化部401的MDCT系數(shù)的量化誤差作為輸入,并進(jìn)而將其進(jìn)行量化處理。這時的量化也和第1小量化部401一樣,可以使用標(biāo)量量化處理,也可以使用矢量量化處理。并且,在第2小量化部402中,對表現(xiàn)量化處理所使用的參量的索引進(jìn)行編碼。另外,計算量化處理所引起的量化誤差,并將其向第3小量化部403輸出。該第3小量化部403的結(jié)構(gòu)和上述第2小量化部相同。這里,上述第1小量化部401、第2小量化部402、第3小量化部403進(jìn)行量化處理的MDCT系數(shù)的個數(shù)即頻帶寬度不一定必須是均勻的,另外,進(jìn)行量化處理的頻帶也不必相同。這時,最好考慮人的聽覺特性,第2小量化部402和第3小量化部403都設(shè)定為將表示低頻成分的MDCT系數(shù)的頻帶進(jìn)行量化處理。
這樣,按照本實施例1的音頻信號編碼裝置,進(jìn)行量化處理時,按層次設(shè)置量化部即構(gòu)成多級量化部,通過改變前級和后級的量化部進(jìn)行量化處理的頻帶寬度,將輸入MDCT系數(shù)中與任意的頻帶例如對人說來在聽覺上重要的低頻成分相當(dāng)?shù)南禂?shù)重點地進(jìn)行量化處理,所以,即使以低位速率即高的壓縮率將音頻信號進(jìn)行編碼時,在受信側(cè)也可以進(jìn)行高品位的聲音的再生。
(實施例2)下面,使用圖5說明本發(fā)明的實施例2的音頻信號編碼裝置。在本實施例2中,由于只有編碼裝置1的量化部105的結(jié)構(gòu)與上述實施例1不同,所以,這里只說明量化部的結(jié)構(gòu)。在圖5中,501是第1小量化部,502是第2小量化部,503是第3小量化部。和上述實施例1結(jié)構(gòu)不同的地方,是第1小量化部501將輸入MDCT系數(shù)分割為3個頻帶(高頻、中頻、低頻)獨立地進(jìn)行量化處理,構(gòu)成該第1小量化部501的各頻帶的量化部與所謂的“分割化矢量量化器”相當(dāng)。通常,在使用矢量量化的方法進(jìn)行量化處理時,可以從輸入MDCT系數(shù)中抽出幾個要素構(gòu)成矢量,進(jìn)行矢量量化處理。在本實施例2的第1小量化部501中,從輸入MDCT系數(shù)中抽出幾個要素構(gòu)成矢量時,就成為低頻的量化只使用低頻的要素進(jìn)行矢量量化處理、中頻的量化只使用中頻的要素進(jìn)行矢量量化處理、高頻的量化只使用高頻的要素進(jìn)行矢量量化處理的結(jié)構(gòu)。
在本實施例2中,以進(jìn)行量化處理時分割為低頻、中頻、高頻的3個頻帶的方法作為一例進(jìn)行說明的,但是,分割的頻帶的數(shù)也可以是3以外的數(shù)。另外,對于第2小量化部502、第3小量化部503也和第1小量化部501一樣,可以采用將頻帶分割為幾個進(jìn)行量化處理的結(jié)構(gòu)。
這樣,按照本實施例2,在多級量化單元中,首先,在第1級中,將輸入MDCT系數(shù)分割為3個頻帶獨立地進(jìn)行量化處理,所以,在進(jìn)行第1次的量化處理時可以進(jìn)行優(yōu)先將聽覺上重要的頻帶進(jìn)行量化處理等的處理,在后級的量化部502、503中,進(jìn)而通過分階段進(jìn)行該聽覺上重要的頻帶的MDCT系數(shù)的量化處理,可以進(jìn)一步減小量化誤差,從而在受信側(cè)可以再現(xiàn)更高品位的音質(zhì)。
(實施例3)下面,使用圖6說明本實施例3的音頻信號編碼裝置。在本實施例3中,由于只有編碼裝置1的量化部105的結(jié)構(gòu)與上述實施例1不同,所以,這里只說明量化部的結(jié)構(gòu)。在圖6中,601是第1小量化部,602是第1量化頻帶選擇部,603是第2小量化部,604是第2量化頻帶選擇部,605是第3小量化部。和上述實施例2結(jié)構(gòu)不同的是,增加了第1量化頻帶選擇部602和第2量化頻帶選擇部604。
下面,說明其動作。在上述第1量化頻帶選擇部602中,使用作為第1小量化部601的量化誤差的輸出計算應(yīng)由第2小量化部602將哪個頻帶的MDCT系數(shù)進(jìn)行量化處理。例如,計算使由(10)式給定的esum(j)為最大的j,可以將從j*OFFSET到j(luò)*OFFSET+BANDWIDTH的頻帶進(jìn)行量化處理。esum(j)=Σi=j·OFFSETj·OFFSET+BANDWIDTHfdterr(i)2-------(10)]]>其中,OFFSET是常數(shù),BANDWIDTH是與第2小量化部603進(jìn)行量化處理的頻帶寬度相當(dāng)?shù)目偛蓸?。在?量化頻帶選擇部602中,例如,將(10)式中給定esum(j)的最大值的j等進(jìn)行編碼后,作為索引IND2。在第2小量化部603中,接收該索引IND2,將由第1量化頻帶選擇部602選擇的頻帶進(jìn)行量化處理。第2量化頻帶選擇部604將第2小量化部603的量化誤差的輸出作為其輸入,并將該第2量化頻帶選擇部604所選擇的頻帶輸入上述第3小量化部605與其相除,可以采用和上述第1量化頻帶選擇部602相同的結(jié)構(gòu)而實現(xiàn)。
以上,說明了在第1量化頻帶選擇部602和第2量化頻帶選擇部604中使用(10)式選擇下一個量化部應(yīng)進(jìn)行量化處理的頻帶的結(jié)構(gòu),但是,也可以使用將(11)式的在正規(guī)化部104中進(jìn)行正規(guī)化處理所使用的值與考慮了與人的頻率對應(yīng)的相對的聽覺敏感特性的值相乘的值計算應(yīng)進(jìn)行量化處理的頻帶。esum(j)=Σi=j·OFFSETj·OFFSET+BANDWIDTH{fdcterr(i)·env(i)·zxc(i)}2------(11)]]>其中,env(i)是用正規(guī)化部104的輸出與MDCT部103的輸出相除后的值,zxc(i)是考慮了與人的頻率對應(yīng)的相對的聽覺敏感特性的表,將其一例示于(表2)。另外,在(11)式中,也可以是將zxc(i)全部作為1而未考慮在內(nèi)的結(jié)構(gòu)。
此外,量化頻帶選擇部可以采用不一定必須設(shè)置多個而只使用第1量化頻帶選擇部602的結(jié)構(gòu)或只使用第2量化頻帶選擇部604的結(jié)構(gòu)。
這樣,在本實施例3中,在由多級量化單元分進(jìn)行多級量化處理時,通過在前級的量化部和后級的量化部之間設(shè)置量化頻帶選擇部,改變并適當(dāng)?shù)剡x擇進(jìn)行量化處理的頻帶,可以根據(jù)輸入信號適當(dāng)?shù)馗淖冞M(jìn)行量化處理的頻帶,并可提高量化的完全度,從而可以重點地將需要量化的部分進(jìn)行量化處理,大大提高量化效率。
下面,使用圖1~圖13說明上述實施例1~3的編碼裝置1的量化部106的量化方法的詳細(xì)的動作。輸入各小量化部的MDCT系數(shù)1401,從該MDCT系數(shù)1401中抽出幾個構(gòu)成聲源子矢量1403。同樣,在正規(guī)化部104中,將用作為正規(guī)化部104的輸出的MDCT系數(shù)除作為正規(guī)化部104的輸入的MDCT系數(shù)后的系數(shù)串作為正規(guī)化成分1402時,對于該正規(guī)化成分1402,也可以按照和從MDCT系數(shù)1401中抽出聲源子矢量1403相同的規(guī)則從該正規(guī)化成分1402中抽出,構(gòu)成加權(quán)子矢量1404。這樣,從MDCT系數(shù)1401和正規(guī)化成分1402中分別抽出聲源子矢量1403和加權(quán)子矢量1404的規(guī)則,有例如由(14)式所示的方法等。
其中,第i個聲源子矢量的第j個要素為subvectori(j),MDCT系數(shù)1401是vector(),MDCT系數(shù)1401的總要素數(shù)為TOTAL,聲源子矢量1403的要素數(shù)為CR,VTOTAL是與TOTAL相同的值或大于TOTAL的值,VTOTAL/CR設(shè)定為整數(shù)值。例如,TOTAL為2048時,CR為19、VTOTAL為2052、CR為23、VTOTAL為2070、CR為21、VTOTAL為2079等。對于加權(quán)子矢量1404,也可以按(14)式的順序抽出。
在矢量量化器1405中,從代碼薄1409中的代碼矢量中檢索與聲源子矢量1403的距離由加權(quán)子矢量1404進(jìn)行加權(quán)而成為最小的代碼矢量,并輸出給定該最小距離的代碼矢量的索引IND2和與給定最小距離的代碼矢量與輸入聲源子矢量1403的量化誤差相當(dāng)?shù)臍埐钭邮噶?410。作為實際的計算順序例子,說明該矢量量化器1405具有距離計算單元1406、代碼決定單元1407和殘差生成單元1408等3個結(jié)構(gòu)要素的情況。在距離計算單元1406中,使用例如(15)式計算第i個聲源子矢量1403與代碼薄1409的第k個代碼矢量的距離。dik=Σj=0CR-1wjR(subvectorj(j)-ck(j))S------(15)]]>其中,wj是加權(quán)子矢量的第j個要素,ck(j)是第k個代碼矢量的第j個要素,R、S是距離計算的范數(shù),作為R、S的值,最好為1、1.5、2等值。該距離計算的范數(shù)R和S不必是相同的數(shù)值。dik表示第k個代碼矢量與第i個聲源子矢量的距離。在代碼決定單元1407中,選出按(15)式等計算的距離中最小的代碼矢量,并將其索引進(jìn)行編碼(IND2)。例如,diu為最小值時,對第i個子矢量編碼的索引為u。在殘差生成單元1408中,使用由代碼決定單元1407選出的代碼矢量,用(16)式生成殘差子矢量1410。
resi(j)=subvectori(j)-cu(j)(16)其中,第i個殘差子矢量1410的第j個要素是resi(j),將由代碼決定單元1407選出的第u個代碼矢量的第j個要素作為cu(j)。殘差子矢量1410通過進(jìn)行(14)式的逆過程等,作為其以后的小量化部的量化對象的MDCT系數(shù)而進(jìn)行保持。但是,在某一頻帶的量化進(jìn)行對其以后的小量化部沒有影響的頻帶的量化處理時,即以后的小量化部不進(jìn)行量化處理時,殘差生成單元1408就不必生成殘差子矢量1410和MDCT系數(shù)1411。另外,代碼薄1409具有的代碼矢量的個數(shù)為幾個都可以,若考慮存儲容量和計算時間等因素時,則最好約為64個。
作為上述矢量量化器1405的其他實施例,也可以采用以下的結(jié)構(gòu)。即,在距離計算單元1406中,使用(17)式計算距離。
其中,K是代碼薄1409的代碼檢索所使用的代碼矢量的總數(shù)。
在代碼決定單元1407中,選出給定由(17)式計算的距離dik的最小值的k,并將其索引進(jìn)行編碼(IND2)。但是,k是從0到2K-1的值。在殘差生成單元1408中,使用(18)式生成殘差子矢量1410。
代碼薄1409具有的代碼矢量為幾個都可以,但是,若考慮存儲器的容量和計算時間等因素,最好采用約64個。
另外,作為加權(quán)子矢量1404,只說明了根據(jù)正規(guī)化成分1402而生成該加權(quán)子矢量的結(jié)構(gòu),但是,進(jìn)而將考慮了人的聽覺特性的權(quán)重乘以加權(quán)子矢量1404,也可以生成加權(quán)子矢量。
按照上述本實施例3,在第1小量化部和第2小量化部之間設(shè)置第1量化頻帶選擇部,在第2小量化部和第3小量化部之間設(shè)置第2量化頻帶選擇部,改變并適當(dāng)?shù)剡x擇由上述第2小量化部和第3小量化部進(jìn)行量化處理的頻帶,所以,可以根據(jù)輸入信號適當(dāng)?shù)馗淖冞M(jìn)行量化處理的頻帶,提高量化的完全度,從而可以重點地將需要量化的部分進(jìn)行量化處理,大大提高量化效率。
此外,在上述實施例1~3中,在對輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列進(jìn)行矢量量化處理并對音頻信號進(jìn)行編碼的音頻信號編碼裝置中,可以采用至少具有將上述頻率特性信號系列或其一部分進(jìn)行矢量量化處理的第1級矢量量化器和將上述第1級矢量量化器的量化誤差成分進(jìn)行矢量量化處理的第2級矢量量化器的多級量化單元的結(jié)構(gòu),同時該多級量化單元的各級的量化單元可以采用具有對將上述頻率特性信號系列利用各級的分割方式分割為至少2個以上的在多個級間可以具有重復(fù)的部分的頻帶的多個頻帶中的某一個頻帶的系數(shù)串進(jìn)行矢量量化處理的至少1個以上的分割化矢量量化器的結(jié)構(gòu)。利用這樣的結(jié)構(gòu),對輸入MDCT系數(shù)中與任意的頻帶例如對人說來聽覺上重要的低頻成分相當(dāng)?shù)南禂?shù)重點地量化處理到所希望的深度,另一方面,在譯碼側(cè),可以使用多個階段的已編碼的代碼進(jìn)行譯碼,另外,可以采用譯碼的順序為交替地對頻帶擴(kuò)展有用的代碼和對品質(zhì)提高有用的代碼進(jìn)行譯碼的結(jié)構(gòu),這樣,即使是以低位速率即高的壓縮率進(jìn)行音頻信號編碼的情況,以及即使不是按固定的信息量進(jìn)行編碼和譯碼,在受信側(cè)也可以進(jìn)行高品位的聲音的再生。
(實施例4)下面,使用圖1、圖7~圖11說明本發(fā)明的實施例4的音頻信號譯碼裝置。作為編碼裝置1的輸出的索引,大致分為正規(guī)化部104輸出的索引IND1和量化部105輸出的索引IND2。
正規(guī)化部104輸出的索引IND1由逆正規(guī)化部107進(jìn)行譯碼,量化部105輸出的索引IND2由逆量化部106進(jìn)行譯碼。這里,在逆量化部106中,可以只使用量化部105輸出的索引IND2的一部分進(jìn)行譯碼。
即,下面,說明將編碼裝置1的量化部105的結(jié)構(gòu)采用圖5所示的結(jié)構(gòu)時在譯碼裝置2中使用具有圖7的結(jié)構(gòu)的逆量化部進(jìn)行逆量化處理的情況。在圖7中,701是第1低頻成分的逆量化部。在該第1低頻成分的逆量化部701中,只使用第1小量化部501的低頻成分的索引IND21進(jìn)行譯碼。
通過這樣處理,在第1低頻成分的逆量化部701中,通過只使用第1小量化部501的低頻成分的索引進(jìn)行譯碼,不論從編碼裝置1發(fā)信來的信息量如何,都可以將已編碼的音頻信號的所希望的信息量進(jìn)行譯碼。即,即使在受信側(cè)進(jìn)行譯碼的信息量有限制的情況下,也可以使編碼的信息量和譯碼的信息量為不同的值而只對所希望的信息量進(jìn)行譯碼。因此,可以根據(jù)在受信側(cè)的通信環(huán)境等改變譯碼的信息量,例如,即使在利用通常的公用電話網(wǎng)的情況下,也可以穩(wěn)定地得到高品位的音質(zhì)。
圖8是表示按2階段進(jìn)行逆量化處理時的音頻信號譯碼裝置的逆量化部的結(jié)構(gòu)的圖,在圖8中,704是第2逆量化部。在該第2逆量化部704中,使用第2小量化部502的索引IND3進(jìn)行譯碼。因此,將第1低頻成分的逆量化部701的輸出IND21’與第2逆量化部704的輸出IND3’之和作為逆量化部106的輸出信號而輸出。但是,這里的兩者之和是對與在量化處理時各小量化部所量化處理的頻帶相同的頻帶進(jìn)行相加而計算的。
這樣,利用第1低頻成分的逆量化部701將第1小量化部(低頻)的索引IND21進(jìn)行譯碼同時將第2小量化部的索引IND3進(jìn)行逆量化處理時,通過將上述第1低頻成分的逆量化部701的輸出IND21’與該逆量化處理的對象相加后進(jìn)行逆量化處理,便可按2階段進(jìn)行逆量化處理,以及可以正確地將按多階段量化的音頻信號進(jìn)行譯碼,從而可以得到更高品質(zhì)的音質(zhì)。
另外,圖9是表示按2階段進(jìn)行逆量化處理時將作為對象的頻帶擴(kuò)大而進(jìn)行的音頻信號譯碼裝置的逆量化部的結(jié)構(gòu)的圖,在圖9中,702是第1中頻成分的逆量化部。在該第1中頻成分的逆量化部702中,使用第1小量化部501的中頻成分的索引IND22進(jìn)行譯碼。因此,第1低頻成分的逆量化部701的輸出IND21’、第2逆量化部704的輸出IND3’和第1中頻成分的逆量化部702的輸出IND22’之和就作為逆量化部106的輸出信號而輸出。但是,這里的三者之和是對與量化處理時各小量化部所量化處理的頻帶相同的頻帶進(jìn)行相加而計算的。通過這樣處理,便可擴(kuò)大再生的聲音的頻帶,從而可以進(jìn)行更高品質(zhì)的音頻信號的再生。
另外,圖10是表示在具有圖9的結(jié)構(gòu)的逆量化部中按3階段進(jìn)行逆量化處理的級數(shù)時的音頻信號譯碼裝置的逆量化部的結(jié)構(gòu)的圖,在圖10中,705是第3逆量化部。在第3逆量化部705中,使用第3小量化部503的索引進(jìn)行譯碼。因此,第1低頻成分的逆量化部701的輸出IND21’、第2逆量化部704的輸出IND3’、第1中頻成分的逆量化部702的輸出IND22’與第3逆量化部705的輸出IND4’之和就作為逆量化部106的輸出信號而輸出。但是,這里的四者之和是對與量化處理時各小量化部所量化處理的頻帶相同的頻帶進(jìn)行相加而計算的。
此外,圖11是表示在具有圖10的結(jié)構(gòu)的逆量化部中按3階段進(jìn)行逆量化處理時將作為對象的頻帶擴(kuò)大而進(jìn)行的音頻信號譯碼裝置的逆量化部的結(jié)構(gòu)的圖,在圖11中,703是第1高頻成分的逆量化部。在第1高頻成分的逆量化部703中,使用第1小量化部501的高頻成分的索引進(jìn)行譯碼。因此,第1低頻成分的逆量化部701的輸出IND21’、第2逆量化部704的輸出IND3’、第1中頻成分的逆量化部702的輸出IND22’、第3逆量化部705的輸出IND4’與第1高頻成分的逆量化部703的輸出IND23’之和就作為逆量化部106的輸出信號而輸出。但是,這里的五者之和是對與量化處理時各小量化部所量化處理的頻帶相同的頻帶進(jìn)行相加而計算的。
在本實施例4中,以逆量化部106將由具有圖6的結(jié)構(gòu)的量化部105所量化的信息進(jìn)行逆量化處理的情況為例進(jìn)行了說明,但是,量化部105的結(jié)構(gòu)為圖4或圖5所示的結(jié)構(gòu)時也同樣可以進(jìn)行。
另外,作為量化部,使用上述圖5所示的結(jié)構(gòu)的量化部進(jìn)行編碼、作為其逆量化部使用具有圖11所示的結(jié)構(gòu)的逆量化部進(jìn)行譯碼時,如圖15所示,將第1小量化部的低頻的索引進(jìn)行逆量化處理后,將下一級的第2小量化部502的索引進(jìn)行逆量化處理,然后再次將第1小量化部的中頻的索引進(jìn)行逆量化處理,就這樣反復(fù)交替地進(jìn)行用于擴(kuò)大頻帶的逆量化處理和用于減小量化誤差的逆量化處理,使用具有圖11所示的結(jié)構(gòu)的逆量化部將由圖4所示的結(jié)構(gòu)的量化部所編碼的信號進(jìn)行譯碼時,在圖4的結(jié)構(gòu)中,由于沒有分割的頻帶,所以,順序進(jìn)行將由下級的量化部所量化的系數(shù)進(jìn)行譯碼的處理。
下面,使用圖1和圖14說明構(gòu)成上述譯碼裝置2的逆量化部106的詳細(xì)的動作。逆量化部106具有例如圖7所示的逆量化部時,由第1低頻的逆量化部701構(gòu)成,具有圖8所示的逆量化部時,由第1低頻的逆量化部701和第2逆量化部704這2個逆量化部構(gòu)成。
矢量逆量化器1501使用矢量量化器105的索引IND2進(jìn)行MDCT系數(shù)的再生。小量化部具有圖7所示的結(jié)構(gòu)時的逆量化處理,根據(jù)索引IND21將索引號碼進(jìn)行譯碼,并從代碼薄1502中選出該號碼的代碼矢量。假定代碼薄1502的內(nèi)容和編碼裝置1的代碼薄相同。從該選出的代碼矢量中可以得到再生子矢量1503,這就是按(14)式的逆過程進(jìn)行了逆量化處理的MDCT系數(shù)(i,j)1504。
另外,小量化部具有圖8所示的結(jié)構(gòu)時的逆量化處理,根據(jù)索引IND21和索引IND3將索引號碼k進(jìn)行譯碼,從代碼薄1502中選出按(19)式計算的號碼u的代碼矢量。
再生子矢量使用(20)式生成。
其中,假定第i個再生子矢量的第j個要素為resi(j)。
下面,使用圖1和圖12說明構(gòu)成音頻信號譯碼裝置的逆正規(guī)化部107的詳細(xì)的結(jié)構(gòu)。在圖12中,1201是頻率概形逆正規(guī)化部,1202是頻帶振幅逆正規(guī)化部,1203是頻帶表。頻率概形正規(guī)化部1201將頻率概形正規(guī)化部201的索引IND11作為輸入,再生頻率概形,并將上述頻率概形與逆量化部106的輸出相乘而輸出。在頻帶振幅逆正規(guī)化部1202中,將頻帶振幅正規(guī)化部202的索引IND12作為輸入,并與頻帶表1203所示的各頻帶的振幅值相乘而復(fù)原。假定使用頻帶振幅正規(guī)化部202的索引IND12所復(fù)原的各頻帶的值為qavej,則頻帶振幅逆正規(guī)化部1202的運(yùn)算由(12)式給出。
dct(i)=n_dct(i)·qavejbjlow≤i≤bjhigh(12)其中,設(shè)頻率概形逆正規(guī)化部1201的輸出為n-dct(i),頻帶振幅逆正規(guī)化部1202的輸出為dct(i)。另外,頻帶表1203和圖2的頻帶表203一樣。
下面,使用圖16說明構(gòu)成譯碼裝置2的頻率概形逆正規(guī)化部1201的詳細(xì)的結(jié)構(gòu)。在圖16中,1301是概形逆量化部,1302是包絡(luò)特性逆正規(guī)化部。在概形逆量化部1301中,使用編碼裝置1的概形量化部301的索引IND13將表示頻率概形的參量例如線性預(yù)測系數(shù)等復(fù)原。如果所復(fù)原的系數(shù)是線性預(yù)測系數(shù),則通過進(jìn)行與例如(8)式同樣的計算,復(fù)原所量化的包絡(luò)特性E13。所復(fù)原的系數(shù)不是線性預(yù)測系數(shù)時,例如是LSP系數(shù)等時,就將其變換為頻率特性,后,復(fù)原包絡(luò)特性E13。在包絡(luò)特性逆量化部1302中,如(13)式所示的那樣,將復(fù)原的包絡(luò)特性E13與逆量化部106的輸出IND16相乘而輸出,并輸入頻帶振幅逆正規(guī)化部1201。
mdct(i)=fdct(i)·env(i)(13)按照這樣的本實施例4,在由量化單元進(jìn)行量化處理之前,設(shè)置正規(guī)化單元,在進(jìn)行輸入音頻信號的正規(guī)化處理后進(jìn)行量化處理,所以,可以進(jìn)行正規(guī)化單元和量化單元完全地發(fā)揮各自的能力的編碼,從而可以進(jìn)行不會損失源音頻信號所具有的信息量、量化誤差小、量化效率高的量化處理。另外,在受信側(cè)的信息量已限定時,只能在頻帶窄而淺的區(qū)域進(jìn)行逆量化處理,但是,通過將該逆量化處理順序交替地向擴(kuò)展頻帶的方向和加深逆量化處理的深度的方向擴(kuò)展,增大受信側(cè)的信息量,不論從編碼裝置1發(fā)信來的信息量如何,都可以將已編碼的音頻信號的所希望的信息量進(jìn)行譯碼。因此,通過根據(jù)受信側(cè)的通信環(huán)境等改變進(jìn)行譯碼的信息量,即使在例如利用通常的公用電話網(wǎng)的情況下,也可以穩(wěn)定地得到高品位的音質(zhì)。
(實施例5)下面,使用圖18說明本發(fā)明的實施例5的音頻信號編碼裝置。在本實施例5中,只有編碼裝置1的量化部105的結(jié)構(gòu)與上述實施例不同,所以,這里只說明量化部的結(jié)構(gòu),對其他結(jié)構(gòu)則省略其說明。
在圖18中,1801是第1正規(guī)化部,1802是第1小量化部,1803是第1量化頻帶選擇部,1804是第2正規(guī)化部,1805是第2小量化部,1806是第2量化頻帶選擇部,1807是第3正規(guī)化部,1808是第3小量化部,1809是第3量化頻帶選擇部。
和實施例3結(jié)構(gòu)不同的地方是,附加了第2和第3正規(guī)化部1804和1807。
下面,說明本實施例5的各結(jié)構(gòu)要素。第1、第2、第3正規(guī)化部1801、1804、1807可以利用和實施例1的正規(guī)化部104相同的結(jié)構(gòu)實現(xiàn)。另外,第1、第2、第3小量化部1802、1805、1808可以利用和實施例3的第1小量化部601相同的結(jié)構(gòu)實現(xiàn)。另外,第1、第2、第3量化頻帶選擇部1803、1806、1809可以利用和實施例3的第1量化頻帶選擇部602相同的結(jié)構(gòu)實現(xiàn)。在本實施例5中,說明具有3組由正規(guī)化部、小量化部和量化頻帶選擇部這三者構(gòu)成的組合的情況,但是,該組合也可以不是3組,可以是4組以上,也可以是2組。另外,最后一級的1組的量化頻帶選擇部有時不一定需要,可以省略。
下面,說明圖18的本實施例5的編碼裝置的動作。
在圖18中,輸入本實施例5的輸入音頻信號的MDCT系數(shù)首先由第1正規(guī)化部1801進(jìn)行正規(guī)化處理,并輸出正規(guī)化后的MDCT系數(shù)。在第1小量化部1802中,將作為第1正規(guī)化部1801的輸出信號的已正規(guī)化的MDCT系數(shù)進(jìn)行量化處理。在第1小量化部1802中,將量化處理所使用的參量作為索引,進(jìn)而將在這時的量化處理中產(chǎn)生的量化誤差向下一級的量化頻帶選擇部1803輸出。在第1量化頻帶選擇部1803中,使用第1小量化部1802的輸出計算在第2小量化部1805中應(yīng)將哪個頻帶的MDCT系數(shù)進(jìn)行量化處理。
在第2正規(guī)化部1804中,根據(jù)第1量化頻帶選擇部1803的頻帶選擇結(jié)果,對該選擇的頻帶將作為第1小量化部1802的輸出的MDCT系數(shù)進(jìn)行正規(guī)化處理。在第2小量化部1805中,將第2正規(guī)化部1804的輸出進(jìn)行量化處理,并將這時的量化處理所使用的參量作為索引而輸出,同時也輸出在這時的量化處理中產(chǎn)生的量化誤差。在第2量化頻帶選擇部1806中,使用第2小量化部1805的輸出計算在第3小量化部1808中應(yīng)將哪個頻帶的MDCT系數(shù)進(jìn)行量化處理。
在第3正規(guī)化部1807中,根據(jù)第2量化頻帶選擇部1806的頻帶選擇結(jié)果,對該選擇的頻帶將作為第2小量化部1805的輸出的MDCT系數(shù)進(jìn)行正規(guī)化處理。在第3小量化部1808中,將第3正規(guī)化部1807的輸出進(jìn)行量化處理,并將這時的量化處理所使用的參量作為索引而輸出,同時也輸出在這時的量化處理中產(chǎn)生的量化誤差。
圖中所示的第3量化頻帶選擇部1809是在后級進(jìn)而存在第4小量化部(圖中未示出)時所需要的要素。如果存在第4小量化部,該第3量化頻帶選擇部1809就使用第3小量化部1808的輸出計算在第4小量化部中應(yīng)將哪個頻帶的MDCT系數(shù)進(jìn)行量化處理。第1、第2、第3正規(guī)化部1801、1804、1807都和實施例1的正規(guī)化部105一樣,將正規(guī)化處理所使用的參量作為索引而輸出。
下面,通過與上述實施例1~3的編碼裝置進(jìn)行比較而說明本實施例5的編碼裝置的動作和作用的特征。
在具有上述實施例1~3的音頻信號編碼裝置的正規(guī)化單元的結(jié)構(gòu)中,如圖19(a)所示,將時間軸上的聲音信號波形利用MDCT和FFT變換為頻率軸上的波形,如圖20(a)所示,對該頻率軸上的波形的全頻率范圍利用正規(guī)化單元進(jìn)行該正規(guī)化A即概形抽出與由該抽出的概形的振幅值的除法運(yùn)算,然后,對該正規(guī)化輸出按將上述全頻率范圍分割的例如3個頻率區(qū)域即低頻區(qū)域、中頻區(qū)域、高頻區(qū)域進(jìn)行量化處理x,y,z,這樣,便可得到量化輸出=∧(x+y+z)。
與此相反,如圖20(b)所示,本實施例5在上述分割化的各量化單元的前級分別具有正規(guī)化單元α、β、γ,首先,如圖19(d)所示的那樣,將頻率軸上的波形分割為多個頻帶后,對各分割的頻帶分別進(jìn)行正規(guī)化和量化處理,所以,結(jié)果便是得到量化輸出=αx+βy+γz。其全體的情況進(jìn)而示于圖21。
通常,在音頻信號的頻率特性中有非常偏倚的情況時,例如,像聲音信息那樣是集中在低頻區(qū)域的信號時,就總體地將其大致地進(jìn)行正規(guī)化處理了,從而不能重點地將有上述低頻區(qū)域的特征的地方進(jìn)行正規(guī)化和量化處理。即,總體的大致的正規(guī)化,在信號變化的細(xì)微的地方不能獲得信號的包絡(luò)線,從而將損失該信號變化的細(xì)微處的信息。因此,在進(jìn)行這樣的正規(guī)化處理之后進(jìn)行量化處理,即使量化器完全地發(fā)揮自己的能力,對于未擴(kuò)展的信號變化的細(xì)微處的信息也已進(jìn)行了量化處理,也就是進(jìn)行了沒有太大意義的量化處理。換言之,就是進(jìn)行了難于使正規(guī)化和量化一致的量化處理。即,如果設(shè)置正規(guī)化單元,就可以使正規(guī)化單元和量化單元完全地發(fā)揮各自的能力,相反,在非常粗略的信號時,即使單純將其全體大致地進(jìn)行正規(guī)化處理,結(jié)果也幾乎是不變化的。
這里,圖20(a)是表示具有圖1所示的正規(guī)化部104的上述實施例1~3的音頻信號編碼裝置的正規(guī)化單元與各量化單元的關(guān)系的圖,對于正規(guī)化單元A將輸入音頻信號的頻率特性信號系列全體進(jìn)行正規(guī)化處理的結(jié)構(gòu),如上所述,在輸入音頻信號有例如集中在低頻區(qū)域那樣的在頻率上偏倚的信號時,可以認(rèn)為就是正規(guī)化單元和量化單元不能完全地發(fā)揮各自的能力的結(jié)構(gòu)。
與此相反,如圖20(b)所示的那樣,在各量化單元x、y、z分別在其前級具有正規(guī)化單元α、β、γ的本實施例5的結(jié)構(gòu)中,對于各量化單元要進(jìn)行量化處理的各對象的信號進(jìn)行正規(guī)化處理,所以,各正規(guī)化單元可以進(jìn)行使考慮了要進(jìn)行量化處理的各量化單元的負(fù)荷的最佳的正規(guī)化即各應(yīng)進(jìn)行量化處理的信號的電平具有各量化單元可以完全地發(fā)揮其能力的電平的正規(guī)化處理,從而可以獲得將正規(guī)化單元與量化單元組合的最大的效果。
即,本實施例5的編碼裝置的正規(guī)化部和量化部的結(jié)構(gòu)如圖20(b)所示的那樣,是對于將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列或分割該頻率特性信號系列的頻帶的某一頻帶A的系數(shù)串,首先由第1級的正規(guī)化單元α和量化單元x進(jìn)行正規(guī)化和量化處理,并且,由第2級的正規(guī)化單元β和量化單元y對與上述第1級的頻帶A的系數(shù)串相鄰的頻帶B的系數(shù)串進(jìn)行正規(guī)化和量化處理,此外,由第3級的正規(guī)化單元γ和量化單元z對與上述第2級的頻帶B的系數(shù)串相鄰的頻帶C的系數(shù)串進(jìn)行正規(guī)化和量化處理的結(jié)構(gòu)。
或者,如圖20(c)所示的那樣,是第2級的正規(guī)化單元β和量化單元y在與上述第1級的頻帶A具有一部分疊加而相鄰的頻帶B中,在該疊加部分對作為第1級的輸出的量化誤差進(jìn)行正規(guī)化和量化處理、在其他部分對上述頻率特性信號系列的該頻帶B的系數(shù)串進(jìn)行正規(guī)化和量化處理,由第3級的正規(guī)化單元γ和量化單元z在與上述第2級的頻帶B的系數(shù)串具有一部分疊加而相鄰的頻帶C中,在該疊加部分對作為第2級的輸出的量化誤差進(jìn)行正規(guī)化和量化處理、在其他部分對上述頻率特性信號系列的該頻帶C的系數(shù)串進(jìn)行正規(guī)化和量化處理的結(jié)構(gòu)。
在上述圖20(b)、(c)所示的結(jié)構(gòu)中,通過對各量化單元的量化進(jìn)行正規(guī)化處理,各正規(guī)化單元進(jìn)行考慮了各量化單元的負(fù)荷的正規(guī)化處理,這樣,便可進(jìn)行各正規(guī)化單元和量化單元完全地發(fā)揮各自的能力的量化處理,從而可以大大提高量化效率。
圖20(b)、(c)的各級的正規(guī)化單元和量化單元處理的頻帶和量化的深度不限于上述例子,可以任意地進(jìn)行調(diào)整。
下面,使用圖18和圖22說明第1級~第3級的正規(guī)化單元和量化單元的正規(guī)化和量化處理的方法的一例。
在本實施例5中,作為第1、第2、第3各正規(guī)化單元1801、1804、1807,可以用和上述實施例1的正規(guī)化單元104相同的結(jié)構(gòu)實現(xiàn),作為正規(guī)化的參量計算方法,也可以使用其他方法來實現(xiàn),例如,根據(jù)輸入各正規(guī)化部的MDCT系數(shù)直接計算LPC系數(shù)和LSP系數(shù)等,也可以將它們作為正規(guī)化的參量構(gòu)成正規(guī)化部。在圖22中,T1、T2、T3是各級的正規(guī)化單元α、β、γ分別使用的用于正規(guī)化的表,它們可以用以下的方法求出。
即,對于有可能作為輸入音頻信號而輸入的各種聲源信號的MDCT系數(shù),進(jìn)行LPC(Linear Predictive Coding)分析,求出LSP(LineSpectrum Pair)系數(shù)。并且,對各聲源反復(fù)進(jìn)行該動作,對所有的幀進(jìn)行求LSP系數(shù)的處理,將所有的這些系數(shù)集中在一起,進(jìn)行分類分析,求出典型的多個包絡(luò)線參量,將它們作為第1級的正規(guī)化單元α的正規(guī)化表T1。
使用這樣得到的多個包絡(luò)線參量進(jìn)行第1級的正規(guī)化和量化處理,并對其輸出進(jìn)行和上述相同的LPC分析的處理,和上述一樣,求出多個包絡(luò)線參量,將它們作為第2級的正規(guī)化單元β的正規(guī)化表T2。
以下,按照同樣的處理,可以求出第3級的正規(guī)化單元γ的正規(guī)化表T3。
這樣,作為第1級~第3級的各量化單元的量化處理,由于考慮了各量化單元的負(fù)荷,可以進(jìn)行完全地發(fā)揮正規(guī)化和量化單元的各自的能力的最佳的量化處理,所以,可以得到正規(guī)化單元的正規(guī)化表T1、T2、T3。
在這樣的結(jié)構(gòu)的音頻信號編碼裝置中,可以認(rèn)為由多個種類的各種聲源信號構(gòu)成的輸入音頻信號輸入主裝置時,如從圖19(a)到(b)所示的那樣,該輸入音頻信號由MDCT和FFT從時間軸上的數(shù)據(jù)變換為頻率軸上的數(shù)據(jù)。并且,該變換為頻率軸上的數(shù)據(jù)的信號,如從圖19(b)到(c)所示的那樣,進(jìn)行其概形抽出。這時的概形抽出使用第1級的正規(guī)化單元α的正規(guī)化表T1進(jìn)行,結(jié)果,所得到的概形是由例如20位的LSP的多項式構(gòu)成。并且,通過用所得到的概形來除變換為上述頻率軸上的數(shù)據(jù)的信號,進(jìn)行正規(guī)化α處理。另外,在進(jìn)行該正規(guī)化處理后,由量化單元x將其進(jìn)行量化處理,則第1級的正規(guī)化和量化處理即告結(jié)束。這樣,便可進(jìn)行考慮了上述多個種類的各種聲源信號的特征的高效率的量化處理。
其次,由第2級的正規(guī)化和量化單元使用上述第2級的正規(guī)化表T2,對與在第1級作為量化處理的對象的分割頻率特性信號系列的某一頻帶A的系數(shù)串不同的頻帶B的系數(shù)串或作為上述第1級的正規(guī)化和量化處理的結(jié)果的量化誤差的輸出進(jìn)行第2級的正規(guī)化和量化處理。這樣,仍然可以以考慮了上述多個種類的各種聲源信號的特征的所需要的頻帶為重點或以所需要的頻帶部分的量化的深度為重點進(jìn)行高效率的量化處理。
此外,由第2級的正規(guī)化和量化單元使用第3級的正規(guī)化表T3,對與在第1級、第2級作為量化處理的對象的分割頻率特性信號系列的各頻帶的系數(shù)串不同的頻帶B的系數(shù)串或作為上述第2級的正規(guī)化和量化處理的結(jié)果的量化誤差的輸出進(jìn)行第3級的正規(guī)化和量化處理。這樣,仍然可以以考慮了上述多個種類的各種聲源信號的特征的所需要的頻帶為重點或以所需要的頻帶部分的量化的深度為重點進(jìn)行高效率的量化處理。
這樣,通過使用按以上說明的方法作成的正規(guī)化表T1、T2、T3進(jìn)行各級的正規(guī)化α、量化x、正規(guī)化β、量化y、正規(guī)化γ、量化z,便可根據(jù)作為應(yīng)進(jìn)行量化處理的對象的信號的性質(zhì)等進(jìn)行減輕量化處理的過度的分擔(dān)的正規(guī)化處理,從而可以大大改善量化效率,大大提高在再生側(cè)的品質(zhì)。
另外,如圖23(b)、(c)所示,與本實施例5的編碼裝置對應(yīng)的譯碼裝置,與圖20(b)、(c)所示的編碼裝置側(cè)的結(jié)構(gòu)對應(yīng),具有接收上述音頻信號編碼裝置的量化部的各量化器的信號并再生與上述頻率特性信號系列分割為多個頻帶的各頻帶的系數(shù)串相當(dāng)?shù)男盘柕哪媪炕縳’、y’、z’、設(shè)置在該多個各逆量化部中將作為其輸出的頻率特性信號系列的系數(shù)串與根據(jù)關(guān)于作為上述音頻信號編碼裝置的輸出的正規(guī)化的代碼而再生的正規(guī)化成分相乘并輸出與編碼前的頻率特性信號系列的各系數(shù)串相當(dāng)?shù)男盘柕亩鄠€逆正規(guī)化部α’、β’、γ’和接收該多個各逆正規(guī)化部的輸出并輸出與原來的音頻信號相當(dāng)?shù)男盘柕哪骖l率變換部(圖中未示出)。
另外,如果將該譯碼裝置的逆正規(guī)化和逆量化處理交替地向擴(kuò)展量化處理的頻帶的方向和加深量化的深度的方向進(jìn)行,就和在上述實施例4中說明的一樣,不論從編碼裝置發(fā)信來的信息量如何,都可以將已編碼的音頻信號的所希望的信息量進(jìn)行譯碼。即,可以根據(jù)受信側(cè)的通信環(huán)境等改變譯碼的信息量,例如,即使在利用通常的公眾電話網(wǎng)的情況下,也可以穩(wěn)定地得到高品位的音質(zhì)。
在上述實施例5中,第1、第2、第3量化頻帶選擇部1803、1806、1809的結(jié)構(gòu),也可以作為輸出各預(yù)先設(shè)定的應(yīng)進(jìn)行量化處理的頻帶的結(jié)構(gòu)而實現(xiàn)。這時,在第1、第2、第3量化頻帶選擇部1803、1806、1809中,不進(jìn)行計算應(yīng)進(jìn)行量化處理的頻帶的計算而輸出各預(yù)先設(shè)定的應(yīng)進(jìn)行量化處理的頻帶,從而可以使結(jié)構(gòu)更簡化。
另外,上述實施例5的第1、第2、第3量化頻帶選擇部1803、1806、1809的結(jié)構(gòu)也可以構(gòu)成為為了根據(jù)人的聽覺特性作為輸出而得到應(yīng)進(jìn)行量化處理的頻帶使用寂靜時的最小可聽特性和難于根據(jù)某一輸入頻率成分而聽到其附近的頻率成分的聲音的掩蔽特性進(jìn)行頻帶的選擇。
按照這樣的本實施例5的音頻信號編碼裝置,在進(jìn)行多級量化處理的量化單元的前級設(shè)置各正規(guī)化單元,對分割的各頻帶及各級的量化在進(jìn)行正規(guī)化處理后進(jìn)行量化處理,所以,通過各頻帶的正規(guī)化處理,進(jìn)行與各頻帶的音頻信號所具有的信息量對應(yīng)的適當(dāng)?shù)木幋a,即,進(jìn)行正規(guī)化單元和量化單元可以完全地發(fā)揮各自的能力的編碼,并可進(jìn)行不會損失原來的音頻信號所具有的信息量從而量化誤差小、量化效率高的量化處理,從而可以穩(wěn)定地得到高品位的音質(zhì)。
在上述實施例1~5中,上述多級量化單元至少具有將上述頻率特性信號系列或其一部分進(jìn)行矢量量化處理的第1級矢量量化器和將上述第1級的矢量量化器的量化誤差成分進(jìn)行矢量量化處理的第2級矢量量化器,同時,該多級量化單元的各級量化單元對利用各級的分割的方式將上述頻率特性信號系列分割為至少2個以上的在多個級間具有重復(fù)的部分的頻帶的多個頻帶中的某個頻帶的系數(shù)串進(jìn)行矢量量化處理的至少1個以上的分割化矢量量化器,但是,該多級量化單元的各級的量化單元也可以是由將上述頻率特性信號系列或前級的量化單元的量化誤差成分全部進(jìn)行矢量量化處理的全頻帶矢量量化器構(gòu)成,這樣,分多級進(jìn)行量化處理,即使和上述一樣按低位速率即高的壓縮率將音頻信號進(jìn)行編碼時,另外,即使不以固定的信息量進(jìn)行編碼和譯碼,在受信側(cè)也可以進(jìn)行高品位的聲音的再生。
如上所述,按照本發(fā)明的音頻信號編碼裝置和譯碼裝置或編碼及譯碼方法,具有在進(jìn)行量化處理時可以使用矢量量化的方法等在高的信息壓縮率下進(jìn)行量化處理的結(jié)構(gòu),同時,采用對量化處理時的信息量的分配進(jìn)行交替地分配對再生頻帶的擴(kuò)展有用的信息量和對品質(zhì)提高有用的信息量的結(jié)構(gòu),首先,在編碼裝置中,作為第1階段,將輸入的音頻信號變換為頻率區(qū)域的信號,并將變換后的頻率信號的一部分進(jìn)行編碼;在第2階段,將未編碼的頻率信號的一部分和第1階段的量化誤差信號進(jìn)行編碼,并附加到第1階段的代碼上;在第3階段,進(jìn)而將未編碼的頻率信號的一部分和第1階段及第2階段的量化誤差信號進(jìn)行編碼,并附加到第1階段和第2階段的代碼上;按照同樣的方式,進(jìn)而將階段疊加地進(jìn)行編碼,另一方面,在譯碼裝置中,可以只使用第1階段的已編碼的代碼進(jìn)行譯碼,使用第1階段和第2階段已譯碼的代碼進(jìn)行譯碼,使用從第1階段到第3階段以上的階段已譯碼的代碼進(jìn)行譯碼,譯碼的順序采用交替地將對頻帶擴(kuò)展有用的代碼和對品質(zhì)提高有用的代碼進(jìn)行譯碼的結(jié)構(gòu),所以,即使不以固定的信息量進(jìn)行編碼和譯碼,也可以得到良好的音質(zhì),另外,還可以在高的壓縮率下得到高品質(zhì)的聲音。
另外,按照本發(fā)明的音頻信號編碼裝置和譯碼裝置或編碼及譯碼方法,在由量化單元進(jìn)行量化處理之前,設(shè)置正規(guī)化單元,在進(jìn)行輸入音頻信號的正規(guī)化處理后再進(jìn)行量化處理,所以,可以進(jìn)行正規(guī)化單元還量化單元完全地發(fā)揮各自的能力的編碼,從而可以進(jìn)行不會損失原來的音頻信號所具有的信息量、量化誤差小、量化效率高的量化處理,根據(jù)音頻信號的種類不同可以發(fā)揮更大的效果。另外,如上所述,通過采用對量化處理時的信息量的分配交替地分配對再生頻帶的擴(kuò)展有用的信息量還對品質(zhì)提高有用的信息量的結(jié)構(gòu),在受信側(cè)的信息量已限定時,就只能在頻帶窄而淺的區(qū)域進(jìn)行逆量化處理,但是,通過交替地將該逆量化處理向擴(kuò)展頻帶的方向和加深逆量化處理的深度的方向擴(kuò)展,增大受信側(cè)的信息量,不論從編碼裝置發(fā)信來的信息量如何,都可以將已編碼的音頻信號的所希望的信息量進(jìn)行譯碼,這樣,通過根據(jù)受信側(cè)的通信環(huán)境等改變譯碼的信息量,即使在例如利用通常的公眾電話網(wǎng)的情況下,也可以穩(wěn)定地得到高品位的音質(zhì)。
另外,按照本發(fā)明的音頻信號編碼裝置和譯碼裝置或編碼及譯碼方法,在進(jìn)行多級量化處理的量化單元的前級分別設(shè)置正規(guī)化單元,在對分割的各頻帶以及各級的量化進(jìn)行正規(guī)化處理后進(jìn)行量化處理,所以,通過各頻帶的正規(guī)化處理進(jìn)行與各頻帶的音頻信號所具有的信息量對應(yīng)的適當(dāng)?shù)木幋a即進(jìn)行正規(guī)化單元和量化單元完全地發(fā)揮各自的能力的編碼,便可進(jìn)行不會損失原來的音頻信號所具有的信息量從而量化誤差小、量化效率高的量化處理,根據(jù)音頻信號的種類不同可以發(fā)揮更大的效果。另外,如果將譯碼側(cè)的逆正規(guī)化和逆量化處理交替地向擴(kuò)展量化的頻帶的方向和加深量化的深度的方向進(jìn)行,和上述一樣,不論從編碼裝置發(fā)信來的信息量如何,都可以將已編碼的音頻信號的所希望的信息量進(jìn)行譯碼,即,可以根據(jù)受信側(cè)的通信環(huán)境等改變譯碼的信息量,即使在例如利用通常的公眾電話網(wǎng)的情況下,也可以穩(wěn)定地得到高品位的音質(zhì)。
如上所述,按照本發(fā)明的音頻信號編碼裝置和譯碼裝置或編碼及譯碼方法,即使不以固定的信息量進(jìn)行編碼和譯碼,也可以得到良好的音質(zhì),另外,可以在高的壓縮率下得到高品質(zhì)的聲音。
另外,通過利用各頻帶的正規(guī)化處理進(jìn)行與各頻帶的音頻信號所具有的信息量對應(yīng)的適當(dāng)?shù)牧炕幚恚M(jìn)行正規(guī)化單元和量化單元完全地發(fā)揮各自的能力的編碼,便可進(jìn)行不會損失原來的音頻信號所具有的信息量、量化誤差小、量化效率高的量化處理,可以根據(jù)音頻信號的種類不同發(fā)揮更大的效果,從而,通過根據(jù)受信側(cè)的通信環(huán)境等改變譯碼的信息量,即使在例如利用通常的公眾電話網(wǎng)的情況下,也可以穩(wěn)定地得到高品位的音質(zhì)。
權(quán)利要求
1.一種對將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列進(jìn)行矢量量化處理并將音頻信號進(jìn)行編碼的音頻信號編碼裝置,其特征在于具備至少具有將上述頻率特性信號系列或其一部分進(jìn)行矢量量化處理的第1級矢量量化器和將上述第1級矢量量化器的量化器誤差成分進(jìn)行矢量量化處理的第2級矢量量化器的多級量化單元,上述多級量化單元的各級量化單元具有至少1個以上的分割化矢量量化器,用于對將上述頻率特性信號系列利用各級的分割方式分割為至少2個以上的在多個級間可以具有重復(fù)的部分的頻帶的多個頻帶的某一個頻帶的系數(shù)串進(jìn)行矢量量化處理。
2.按權(quán)利要求1所述的音頻信號編碼裝置,其特征在于具有將上述頻率特性信號系列進(jìn)行正規(guī)化處理并將其輸出供給上述多級量化單元的正規(guī)化單元。
3.按權(quán)利要求1或2所述的音頻信號編碼裝置,其特征在于上述各級量化單元適當(dāng)?shù)剡x擇量化誤差的能量之和大的頻帶作為應(yīng)進(jìn)行量化處理的上述頻率特性信號系列的分割的頻帶進(jìn)行量化處理。
4.按權(quán)利要求1或2所述的音頻信號編碼裝置,其特征在于上述各級的量化單元,根據(jù)人的聽覺上的性質(zhì)即聽覺敏感特性,適當(dāng)?shù)剡x擇對其重要性高的頻帶加上大的權(quán)重值的量化誤差的能量之和大的頻帶作為應(yīng)進(jìn)行量化處理的上述頻率特性信號系列的分割的頻帶,進(jìn)行量化處理。
5.按權(quán)利要求1~4中的任一權(quán)項所述的音頻信號編碼裝置,其特征在于在構(gòu)成上述多級量化單元的第1級矢量量化器和第2級矢量量化器之間具有第1量化頻帶選擇部,在上述第2級矢量量化器和上述第3級矢量量化器之間具有第2量化頻帶選擇部,上述第1量化頻帶選擇部將上述第1級矢量量化器的量化誤差的輸出作為其輸入,選擇應(yīng)由上述第2級矢量量化器進(jìn)行量化處理的頻帶;上述第2量化頻帶選擇部將上述第2級矢量量化器的量化誤差的輸出作為其輸入,選擇應(yīng)由上述第3級矢量量化器進(jìn)行量化處理的頻帶。
6.按權(quán)利要求5所述的音頻信號編碼裝置,其特征在于上述多級量化單元具有,將上述頻率特性信號系列的上述分割的各頻帶的各系數(shù)串,由第i級分割的矢量量化器獨立地進(jìn)行量化處理的多個第i級的分割矢量量化器,和作為至少一次將應(yīng)進(jìn)行量化處理的輸入信號的各頻帶全部進(jìn)行量化處理的全頻帶量化部的第j級矢量量化器。
7.按權(quán)利要求1所述的音頻信號編碼裝置,其特征在于上述多級量化單元使用前級矢量量化器使用代碼薄的矢量量化方法,計算矢量量化中的量化誤差,后級矢量量化器對該計算出的量化誤差進(jìn)一步進(jìn)行矢量量化處理。
8.按權(quán)利要求2所述的音頻信號編碼裝置,其特征在于上述多級量化單元使用前級矢量量化器使用代碼薄的矢量量化方法,計算矢量量化中的量化誤差,后級矢量量化器對該計算出的量化誤差進(jìn)一步進(jìn)行矢量量化處理。
9.按權(quán)利要求8所述的音頻信號編碼裝置,其特征在于上述多級量化單元的矢量量化器在檢索矢量量化處理中的上述代碼薄內(nèi)的最佳代碼時使用的代碼間的距離的計算中,使用從上述正規(guī)化單元輸出的輸入信號的正規(guī)化成分作為權(quán)重計算該距離,抽出給定最小距離的代碼。
10.按權(quán)利要求9所述的音頻信號編碼裝置,其特征在于上述多級量化單元的矢量量化器將從上述正規(guī)化單元輸出的頻率特性信號系列的正規(guī)化成分和考慮了人的聽覺上的性質(zhì)即聽覺敏感特性的值兩者作為權(quán)重計算上述距離,抽出給定最小距離的代碼。
11.按權(quán)利要求2和8~10中的任一權(quán)項所述的音頻信號編碼裝置,其特征在于上述正規(guī)化單元具有將上述頻率特性信號系列的概形大致地進(jìn)行正規(guī)化處理的頻率概形正規(guī)化部。
12.按權(quán)利要求2和8~10中的任一權(quán)項所述的音頻信號編碼裝置,其特征在于上述正規(guī)化單元具有將上述頻率特性信號系列分為多個連續(xù)的單位頻帶的各成分,并通過用1個值除各單位頻帶的系數(shù)串而進(jìn)行正規(guī)化的頻帶振幅正規(guī)化部。
13.按權(quán)利要求1所述的音頻信號編碼裝置,其特征在于上述多級量化單元具有,將上述頻率特性信號系列的上述分割的各頻帶的各系數(shù)串,利用分割化矢量量化器獨立地進(jìn)行量化處理的矢量量化器,和作為至少一次將應(yīng)進(jìn)行量化處理的輸入信號的各頻帶全部進(jìn)行量化處理的全頻帶量化部的矢量量化器。
14.按權(quán)利要求13所述的音頻信號編碼裝置,其特征在于上述多級量化單元具有由低頻區(qū)的分割化矢量量化器、中頻區(qū)的分割化矢量量化器和高頻區(qū)的分割化矢量量化器構(gòu)成的第1矢量量化器,與其后級連接的第2矢量量化器和與其后級連接的第3矢量量化器,將輸入該多級量化單元的頻率特性信號系列分割為3個頻帶,由上述低頻區(qū)的分割化矢量量化器獨立地將該3個頻帶中的低頻帶成分的頻率特性信號系列進(jìn)行量化處理,由上述中頻區(qū)的分割化矢量量化器獨立地將上述3個頻帶中的中頻的頻帶成分的頻率特性信號系列進(jìn)行量化處理,由上述高頻區(qū)的分割化矢量量化器獨立地將上述3個頻帶中的高頻帶成分的頻率特性信號系列進(jìn)行量化處理,由構(gòu)成上述第1矢量量化器的各分割化矢量量化器計算對頻率特性信號系列的量化誤差,將其作為向后級的上述第2矢量量化器的輸入,在上述第2矢量量化器中對該第2矢量量化器量化的頻帶寬度進(jìn)行量化處理,計算對該第2矢量量化器的輸入的量化誤差,將其作為向上述第3矢量量化器的輸入,在上述第3矢量量化器中,對該第3矢量量化器量化的頻帶寬度進(jìn)行量化處理。
15.按權(quán)利要求14所述的音頻信號編碼裝置,其特征在于在構(gòu)成上述多級量化單元的第1矢量量化器和第2矢量量化器之間設(shè)置第1量化頻帶選擇部,同時,在上述第2矢量量化器和上述第3矢量量化器之間設(shè)置第2量化頻帶選擇部,上述第1量化頻帶選擇部將上述第1矢量量化器的輸出作為其輸入,選擇應(yīng)由上述第2矢量量化器進(jìn)行量化處理的頻帶,上述第2矢量量化器對于由上述第1量化選擇部選擇的頻帶的由上述3個矢量量化器構(gòu)成的第1矢量量化器的量化誤差,對該第2矢量量化器量化的頻帶寬度進(jìn)行量化處理,計算對該第2矢量量化器的輸入的量化誤差,并將其作為向上述第2量化頻帶選擇部的輸入;上述第2量化頻帶選擇部將上述第2矢量量化器的量化誤差作為輸入,選擇應(yīng)由上述第3矢量量化器進(jìn)行量化處理的頻帶,上述第3矢量量化器對于上述第2量化頻帶選擇部選擇的頻帶的上述第2矢量量化器的量化誤差,對該第2矢量量化器量化的頻帶寬度進(jìn)行量化處理。
16.按權(quán)利要求14所述的音頻信號編碼裝置,其特征在于使用上述低頻區(qū)的分割化矢量量化器、中頻區(qū)的分割化矢量量化器和高頻區(qū)的分割化矢量量化器構(gòu)成上述第2矢量量化器或第3矢量量化器,取代上述第1矢量量化器。
17.一種將權(quán)利要求1所述的音頻信號編碼裝置輸出的代碼作為其輸入并將其譯碼從而輸出與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號譯碼裝置,其特征在于具有使用上述音頻信號編碼裝置的量化單元輸出的代碼的至少一部分進(jìn)行逆量化處理的逆量化部,和使用作為該逆量化部的輸出的頻率特性信號系列將頻率特性信號系列變換為與原來的音頻輸入信號相當(dāng)?shù)男盘柕哪骖l率變換部。
18.一種將權(quán)利要求2所述的音頻信號編碼裝置輸出的代碼作為其輸入并將其譯碼從而輸出與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號譯碼裝置,其特征在于具有再生頻率特性信號系列的逆量化部,及使用作為該逆量化部的輸出的頻率特性信號系列根據(jù)作為上述音頻信號編碼裝置的輸出的代碼再生正規(guī)化成分并將上述頻率特性信號系列與正規(guī)化成分相乘而輸出的逆正規(guī)化部和接收該逆正規(guī)化的輸出并將頻率特性信號系列變換為與原來的音頻信號相當(dāng)?shù)男盘柕哪骖l率變換部。
19.一種將權(quán)利要求13所述的音頻信號編碼裝置的輸出這樣的代碼作為其輸入并將其譯碼從而輸出與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號譯碼裝置,其特征在于具有不論構(gòu)成上述音頻信號編碼裝置的量化單元的全部還是一部分矢量量化器輸出代碼時都使用輸出的代碼進(jìn)行逆量化處理的逆量化部。
20.按權(quán)利要求19所述的音頻信號譯碼裝置,其特征在于上述逆量化部在某一級的指定頻帶的量化代碼的逆量化之后,交替地進(jìn)行該指定頻帶的下一級的量化代碼的逆量化處理和與該某一級的該指定頻帶不同的頻帶的量化代碼的逆量化處理,在不存在該指定頻帶的下一級的量化代碼時,接著就進(jìn)行不同的頻帶的量化代碼的逆量化處理;在不存在與上述指定的頻帶不同的頻帶的量化代碼時,接著就進(jìn)行下一級的量化代碼的逆量化處理。
21.一種將權(quán)利要求14所述的音頻信號編碼裝置輸出的代碼作為其輸入并將其譯碼從而輸出與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號譯碼裝置,其特征在于具有不論從構(gòu)成上述音頻信號編碼裝置的第1矢量量化器的3個分割化矢量量化器全部還是一部分輸出代碼時都只使用構(gòu)成上述第1矢量量化器的低頻區(qū)的分割化矢量量化器的代碼進(jìn)行逆量化處理的逆量化部。
22.按權(quán)利要求21所述的音頻信號譯碼裝置,其特征在于上述逆量化部除了使用構(gòu)成上述第1矢量量化器的低頻區(qū)的分割化矢量量化器的代碼外,還使用上述第2矢量量化器的代碼進(jìn)行逆量化處理。
23.按權(quán)利要求22所述的音頻信號譯碼裝置,其特征在于上述逆量化部除了使用構(gòu)成上述第1矢量量化器的低頻區(qū)的分割化矢量量化器的代碼和上述第2矢量量化器的代碼外,還使用構(gòu)成上述第1矢量量化器的中頻區(qū)的分割化矢量量化器的代碼進(jìn)行逆量化處理。
24.按權(quán)利要求23所述的音頻信號譯碼裝置,其特征在于上述逆量化部除了使用構(gòu)成上述第1矢量量化器的低頻區(qū)的分割化矢量量化器的代碼、上述第2矢量量化器的代碼和構(gòu)成上述第1矢量量化器的中頻區(qū)的分割化矢量量化器的代碼外,還使用上述第3矢量量化器的代碼進(jìn)行逆量化處理。
25.按權(quán)利要求24所述的音頻信號編碼裝置,其特征在于上述逆量化部除了使用構(gòu)成上述第1矢量量化器的低頻區(qū)的分割化矢量量化器的代碼、上述第2矢量量化器的代碼、構(gòu)成上述第1矢量量化器的中頻區(qū)的分割化矢量量化器的代碼和上述第3矢量量化器的代碼外,還使用構(gòu)成上述第1矢量量化器的高頻區(qū)的分割化矢量量化器的代碼進(jìn)行逆量化處理。
26.一種接收將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列、將其編碼而輸出并將該輸出的代碼信號作為輸入將其譯碼從而再生與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號編碼和譯碼方法,其特征在于將上述頻率特性信號系列分為與至少分割為2個以上的頻帶的頻帶相當(dāng)?shù)南禂?shù)串,分別獨立地進(jìn)行量化處理而輸出,根據(jù)接收的已量化的信號,通過對與上述分割的頻帶相當(dāng)?shù)娜我獾念l帶的數(shù)據(jù)進(jìn)行逆量化處理,再生與原來的音頻輸入信號相當(dāng)?shù)男盘枴?br>
27.按權(quán)利要求26所述的音頻信號編碼和譯碼方法,其特征在于上述量化處理分階段進(jìn)行,從而將計算出的量化誤差進(jìn)一步進(jìn)行量化處理;上述逆量化處理反復(fù)交替地進(jìn)行向擴(kuò)展頻帶方向的逆量化處理和向上述量化處理時量化階段加深的方向的逆量化處理。
28.按權(quán)利要求27所述的音頻信號編碼和譯碼方法,其特征在于向擴(kuò)展上述頻帶方向的逆量化處理按考慮了人的聽覺心理特性的順序擴(kuò)展頻帶而進(jìn)行。
29.按權(quán)利要求26~28中的任一權(quán)項所述的音頻信號編碼和譯碼方法,其特征在于在編碼側(cè),將上述頻率特性信號系列正規(guī)化后,將該頻率特性信號系列分為與至少分割為2個以上的頻帶的頻帶相當(dāng)?shù)南禂?shù)串,進(jìn)行分別獨立地量化而輸出的處理;在譯碼側(cè),使用關(guān)于上述編碼側(cè)的正規(guī)化的代碼,將上述編碼側(cè)的代碼進(jìn)行逆正規(guī)化處理后,對該逆正規(guī)化處理后的代碼,通過對與上述分割的頻帶相當(dāng)?shù)娜我獾念l帶的數(shù)據(jù)進(jìn)行逆量化處理,再生與原來的音頻輸入信號相當(dāng)?shù)男盘枴?br>
30.一種對將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列進(jìn)行正規(guī)化和矢量量化處理并將音頻信號進(jìn)行編碼的音頻信號編碼裝置,其特征在于具備至少具有將上述頻率特性信號系列或其一部分進(jìn)行正規(guī)化和矢量量化處理的第1級正規(guī)化及矢量量化器、和將上述第1級正規(guī)化及矢量量化器的量化誤差進(jìn)行正規(guī)化及矢量量化處理的第2級正規(guī)化及矢量量化器的多級量化單元,上述多級量化單元的各級量化單元具有至少1個以上的分割化的正規(guī)化及矢量量化器,該分割化的正規(guī)化及矢量量化器將利用各級的分割方式將上述頻率特性信號系列分割為至少2個以上的在多個級間可以具有疊加的部分的頻帶的多個頻帶中的某個頻帶的系數(shù)串進(jìn)行正規(guī)化及矢量量化處理。
31.按權(quán)利要求30所述的音頻信號編碼裝置,其特征在于在構(gòu)成上述多級量化單元的第1級正規(guī)化及矢量量化器和第2級正規(guī)化及矢量量化器之間具有第1量化頻帶選擇部,在上述第2級正規(guī)化及矢量量化器和上述第3級正規(guī)化及矢量量化器之間具有第2量化頻帶選擇部,上述第1量化頻帶選擇部將上述第1級正規(guī)化及矢量量化器的量化誤差的輸出作為其輸入,選擇應(yīng)由上述第2級正規(guī)化及矢量量化器進(jìn)行量化處理的頻帶,并將該選擇的頻帶的量化誤差的輸出向上述第2級正規(guī)化及矢量量化器輸出;上述第2量化頻帶選擇部將上述第2級正規(guī)化及矢量量化器的量化誤差的輸出作為其輸入,選擇應(yīng)由上述第3正規(guī)化及矢量量化器進(jìn)行量化處理的頻帶,并將該選擇的頻帶的量化誤差的輸出向上述第3級正規(guī)化及矢量量化器輸出。
32.按權(quán)利要求31所述的音頻信號編碼裝置,其特征在于上述多級量化單元的第2級以后的各級正規(guī)化及矢量量化器,適當(dāng)?shù)剡x擇應(yīng)進(jìn)行正規(guī)化及量化處理的上述頻率特性信號系列的分割的頻帶中前級的正規(guī)化及矢量量化器的輸出即量化誤差的能量之和大的頻帶,進(jìn)行正規(guī)化及量化處理。
33.按權(quán)利要求31所述的音頻信號編碼裝置,其特征在于上述多級量化單元的第2級以后的各級正規(guī)化及矢量量化器,在應(yīng)進(jìn)行正規(guī)化及量化處理的上述頻率特性信號系列的分割的頻帶中,根據(jù)人的聽覺的性質(zhì)即聽覺靈敏特性,適當(dāng)?shù)剡x擇對其重要性高的頻帶加權(quán)大的值的前級的正規(guī)化及矢量量化器的輸出即量化誤差的能量之和大的頻帶進(jìn)行正規(guī)化及量化處理。
34.一種將作為權(quán)利要求30~33中的任一權(quán)項所述的音頻信號編碼裝置的輸出的代碼作為其輸入并將其譯碼從而輸出與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號譯碼裝置,其特征在于具有接收上述音頻信號編碼裝置的量化部的各量化器的信號,并再生與上述頻率特性信號系列分割為多個頻帶的各頻帶的系數(shù)串相當(dāng)?shù)男盘柕哪媪炕?,設(shè)置在該多個逆量化部中,將作為其輸出的頻率特性信號系列的系數(shù)串,與根據(jù)關(guān)于作為上述音頻信號編碼裝置的輸出的正規(guī)化的代碼而再生的正規(guī)化成分相乘,從而輸出與編碼前的頻率特性信號系列的各系數(shù)串相當(dāng)?shù)男盘柕亩鄠€逆正規(guī)化部,和接收該多個逆正規(guī)化部的輸出并將它們變換為與原來的音頻信號相當(dāng)?shù)男盘柕哪骖l率變換部。
35.一種接收將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列并將其進(jìn)行編碼后輸出、將該輸出的代碼信號作為輸入并將其譯碼從而再生與原來的輸入音頻信號相當(dāng)?shù)男盘柕囊纛l信號編碼和譯碼方法,其特征在于將上述頻率特性信號系列分為與分割為至少2個以上的頻帶的頻帶相當(dāng)?shù)南禂?shù)串,分別獨立地進(jìn)行正規(guī)化及量化處理后輸出,從接收的已量化的信號中使用關(guān)于編碼側(cè)的正規(guī)化的代碼,通過對與上述分割的頻帶相當(dāng)?shù)娜我獾念l帶的數(shù)據(jù)進(jìn)行逆正規(guī)化及逆量化處理,再生與原來的音頻輸入信號相當(dāng)?shù)男盘枴?br>
36.按權(quán)利要求35所述的音頻信號編碼和譯碼方法,其特征在于上述正規(guī)化及量化處理分階段進(jìn)行,從而對計算出的量化誤差進(jìn)一步進(jìn)行正規(guī)化及量化處理;上述逆正規(guī)化及逆量化處理,反復(fù)交替地進(jìn)行向擴(kuò)展頻帶的方向的逆正規(guī)化及逆量化處理和向上述量化處理時的量化階段深入的方向的逆正規(guī)化及逆量化處理。
37.按權(quán)利要求36所述的音頻信號編碼和譯碼方法,其特征在于向擴(kuò)展上述頻帶的方向的逆正規(guī)化及逆量化處理,按照考慮了人的聽覺心理特性的順序擴(kuò)展頻帶而進(jìn)行。
38.一種對將輸入音頻信號進(jìn)行頻率變換而得到的頻率特性信號系列進(jìn)行矢量量化處理并對音頻信號進(jìn)行編碼的音頻信號編碼裝置,其特征在于具有具備至少具有對上述頻率特性信號系列進(jìn)行矢量量化處理的第1級矢量量化器和對上述第1級矢量量化器的量化誤差成分進(jìn)行矢量量化處理的第2級矢量量化器的多級量化單元,上述多級量化單元的各級量化單元由將上述頻率特性信號系列或前級的量化單元的量化誤差成分全部進(jìn)行矢量量化處理的全頻帶矢量量化器構(gòu)成。
全文摘要
一種音頻信號編碼裝置和譯碼裝置,提高在譯碼裝置中即使不使用編碼裝置的全部信息也可以進(jìn)行音頻信號的再生的編碼裝置和與其對應(yīng)的譯碼裝置。將構(gòu)成編碼裝置1的量化部采用具有由低頻、中頻、高頻的小量化部構(gòu)成的第1小量化部501、進(jìn)而將第1小量化部501的量化誤差進(jìn)行量化處理的第2小量化部502和進(jìn)而將由第1小量化部501和第2小量化部502進(jìn)行處理后的量化誤差進(jìn)行量化處理的第3小量化部。
文檔編號G10L19/02GK1224523SQ98800527
公開日1999年7月28日 申請日期1998年5月14日 優(yōu)先權(quán)日1997年5月15日
發(fā)明者津島峰生, 則松武志, 石川智一 申請人:松下電器產(chǎn)業(yè)株式會社