編碼裝置、解碼裝置和其方法

文檔序號(hào)：2830047閱讀：234來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：編碼裝置、解碼裝置和其方法
技術(shù)領(lǐng)域：
本發(fā)明涉及對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼并傳輸?shù)耐ㄐ畔到y(tǒng)中所使用的編碼裝置、解碼裝置和其方法。

背景技術(shù)：
在以數(shù)字無(wú)線通信和因特網(wǎng)通信為代表的分組通信或語(yǔ)音存儲(chǔ)等領(lǐng)域中，為了實(shí)現(xiàn)有效利用電波等的傳輸路徑容量或存儲(chǔ)媒體，語(yǔ)音信號(hào)的編碼和解碼技術(shù)必不可少，至目前為止已開(kāi)發(fā)了許多語(yǔ)音編碼和解碼方式。
而且，現(xiàn)在，CELP方式的語(yǔ)音編碼和解碼方式作為主流方式而被實(shí)用化(例如，非專利文獻(xiàn)1)。CELP方式的語(yǔ)音編碼方式主要是存儲(chǔ)發(fā)聲語(yǔ)音的模型，基于預(yù)先存儲(chǔ)的語(yǔ)音模型，對(duì)輸入語(yǔ)音進(jìn)行編碼的方式。
并且，近年以來(lái)，已開(kāi)發(fā)了可擴(kuò)展編碼技術(shù)，該技術(shù)是在語(yǔ)音信號(hào)和音頻信號(hào)的編碼時(shí)應(yīng)用CELP方式，即使從編碼信息的一部分也能夠?qū)φZ(yǔ)音和音頻信號(hào)進(jìn)行解碼，而即使在發(fā)生分組損失的情況下，也能夠抑制音質(zhì)的惡化(例如，參照專利文獻(xiàn)1)。
可擴(kuò)展編碼方式通常由基本層和多個(gè)擴(kuò)展層構(gòu)成，并且各個(gè)層以基本層作為最低層，形成分層結(jié)構(gòu)。然后，在各個(gè)層，對(duì)較低層的輸入信號(hào)與輸出信號(hào)之間的差即殘差信號(hào)進(jìn)行編碼。根據(jù)該結(jié)構(gòu)，使用所有層的編碼信息或部分層的編碼信息，能夠?qū)φZ(yǔ)音和音頻進(jìn)行解碼。
另外，在可擴(kuò)展編碼時(shí)，通常進(jìn)行輸入信號(hào)的采樣頻率變換，并對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼。此時(shí)，通過(guò)對(duì)低層的解碼信號(hào)進(jìn)行上采樣，并求輸入信號(hào)與上采樣后的解碼信號(hào)之間的差，從而生成由高層進(jìn)行編碼的殘差信號(hào)。特開(kāi)平10-97295號(hào)公報(bào)M.R.Schroeder，B.S.Atal，″Code Excited Linear PredictionHigh Quality Speech at Very Low Bit Rate″，IEEE proc.，ICASSP′85 pp.937-940

發(fā)明內(nèi)容
發(fā)明需要解決的問(wèn)題在此，一般而言，編碼裝置具有作為解碼信號(hào)的質(zhì)量惡化原因的固有特性。例如，在基本層對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼時(shí)，因采樣頻率變換而產(chǎn)生解碼信號(hào)的相位偏差，導(dǎo)致解碼信號(hào)的質(zhì)量惡化。
然而，在以往的可擴(kuò)展編碼方式中，不考慮編碼裝置的固有特性而進(jìn)行編碼，所以由于該編碼裝置的固有特性導(dǎo)致低層的解碼信號(hào)的質(zhì)量惡化，使解碼信號(hào)與輸入信號(hào)之間的誤差大，而成為導(dǎo)致高層的編碼效率降低的原因。
本發(fā)明的目的為提供在可擴(kuò)展編碼方式中，即使存在編碼裝置的固有特性時(shí)，也能夠抵消解碼信號(hào)受到影響的特性的編碼裝置、解碼裝置和其方法。
解決該問(wèn)題的方案本發(fā)明的編碼裝置為對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼的編碼裝置，該裝置所采用的結(jié)構(gòu)包括第一編碼單元，對(duì)所述輸入信號(hào)進(jìn)行編碼而生成第一編碼信息；第一解碼單元，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；調(diào)整單元，通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述第一解碼信號(hào)的調(diào)整；延遲單元，使所述輸入信號(hào)延遲，以使其與調(diào)整后的第一解碼信號(hào)同步；加法單元，求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào)；以及第二編碼單元，對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
本發(fā)明的編碼裝置為對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼的編碼裝置，該裝置所采用的結(jié)構(gòu)包括頻率變換單元，通過(guò)對(duì)所述輸入信號(hào)進(jìn)行下采樣，從而進(jìn)行采樣頻率變換；第一編碼單元，對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼而生成第一編碼信息；第一解碼單元，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；頻率變換單元，通過(guò)對(duì)所述第一解碼信號(hào)進(jìn)行上采樣，從而進(jìn)行采樣頻率變換；調(diào)整單元，通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述上采樣后的第一解碼信號(hào)的調(diào)整；延遲單元，使所述輸入信號(hào)延遲，以使其與調(diào)整后的第一解碼信號(hào)同步；加法單元，求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào)；以及第二編碼單元，對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
本發(fā)明的解碼裝置為對(duì)上述的編碼裝置所輸出的編碼信息進(jìn)行解碼的解碼裝置，該裝置所采用的結(jié)構(gòu)包括第一解碼單元，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；第二解碼單元，對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào)；調(diào)整單元，通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述第一解碼信號(hào)的調(diào)整；加法單元，將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加；以及信號(hào)選擇單元，選擇所述第一解碼單元所生成的第一解碼信號(hào)或所述加法單元的相加結(jié)果中的一個(gè)并輸出。
本發(fā)明的解碼裝置為對(duì)上述的編碼裝置所輸出的編碼信息進(jìn)行解碼的解碼裝置，該裝置所采用的結(jié)構(gòu)包括第一解碼單元，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；第二解碼單元，對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào)；頻率變換單元，通過(guò)對(duì)所述第一解碼信號(hào)進(jìn)行上采樣，從而進(jìn)行采樣頻率變換；調(diào)整單元，通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述上采樣后的第一解碼信號(hào)的調(diào)整；加法單元，將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加；以及信號(hào)選擇單元，選擇所述第一解碼單元所生成的第一解碼信號(hào)或所述加法單元的相加結(jié)果中的一個(gè)并輸出。
本發(fā)明的編碼方法為對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼的編碼方法，該方法所采用的方法包括第一編碼步驟，對(duì)所述輸入信號(hào)進(jìn)行編碼而生成第一編碼信息；第一解碼步驟，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；調(diào)整步驟，通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述第一解碼信號(hào)的調(diào)整；延遲步驟，使所述輸入信號(hào)延遲，以使其與調(diào)整后的第一解碼信號(hào)同步；加法步驟，求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào)；以及第二編碼步驟，對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
本發(fā)明的解碼方法為對(duì)通過(guò)上述的編碼方法編碼的編碼信息進(jìn)行解碼的解碼方法，該方法所采用的方法包括第一解碼步驟，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；第二解碼步驟，對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào)；調(diào)整步驟，通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述第一解碼信號(hào)的調(diào)整；加法步驟，將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加；以及信號(hào)選擇步驟，選擇所述第一解碼步驟中所生成的第一解碼信號(hào)或所述加法步驟中的相加結(jié)果中的一個(gè)并輸出。
發(fā)明的有益效果根據(jù)本發(fā)明，通過(guò)對(duì)所輸出的解碼信號(hào)進(jìn)行調(diào)整，能夠抵消編碼裝置的固有特性，能夠?qū)崿F(xiàn)提高解碼信號(hào)的質(zhì)量，并能夠提高高層的編碼效率。

圖1是表示本發(fā)明實(shí)施方式1的編碼裝置和解碼裝置的主要結(jié)構(gòu)的方框圖。
圖2是表示本發(fā)明實(shí)施方式1的第一編碼單元和第二編碼單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖3是用于簡(jiǎn)單說(shuō)明決定自適應(yīng)聲源延遲的處理的圖。
圖4是用于簡(jiǎn)單說(shuō)明決定固定聲源向量的處理的圖。
圖5是表示本發(fā)明實(shí)施方式1的第一解碼單元和第二解碼單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖6是表示本發(fā)明實(shí)施方式1的調(diào)整單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖7是表示本發(fā)明實(shí)施方式2的語(yǔ)音和音頻發(fā)送裝置的結(jié)構(gòu)的方框圖。
圖8是表示本發(fā)明實(shí)施方式2的語(yǔ)音和音頻接收裝置的結(jié)構(gòu)的方框圖。

具體實(shí)施例方式 以下，參照附圖詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式。另外，在以下的實(shí)施方式中，對(duì)通過(guò)由兩層構(gòu)成的分層性的信號(hào)編碼和解碼方法而進(jìn)行CELP類型的語(yǔ)音編碼和解碼的情況，進(jìn)行說(shuō)明。此外，分層性的信號(hào)編碼方法是指，在高層中存在多個(gè)信號(hào)編碼方法而形成分層結(jié)構(gòu)的方法，該信號(hào)編碼方法對(duì)在低層中的輸入信號(hào)與輸出信號(hào)之間的差分信號(hào)進(jìn)行編碼并輸出編碼信息。
(實(shí)施方式1) 圖1是表示本發(fā)明實(shí)施方式1的編碼裝置100和解碼裝置150的主要結(jié)構(gòu)的方框圖。編碼裝置100主要由頻率變換單元101和104、第一編碼單元102、第一解碼單元103、調(diào)整單元105、延遲單元106、加法器107、第二編碼單元108、以及復(fù)用單元109構(gòu)成。另外，解碼裝置150主要由復(fù)用分離單元151、第一解碼單元152、第二解碼單元153、頻率變換單元154、調(diào)整單元155、加法器156、以及信號(hào)選擇單元157構(gòu)成。編碼裝置100所輸出的編碼信息，通過(guò)傳輸路徑M被傳輸?shù)浇獯a裝置150。
以下，說(shuō)明圖1所示的編碼裝置100的各個(gè)結(jié)構(gòu)單元的處理內(nèi)容。作為語(yǔ)音和音頻信號(hào)的信號(hào)被輸入到頻率變換單元101以及延遲單元106。頻率變換單元101進(jìn)行輸入信號(hào)的采樣頻率變換，并將下采樣后的輸入信號(hào)輸出到第一編碼單元102。
第一編碼單元102使用CELP方式的語(yǔ)音和音頻編碼方法，對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼，并將通過(guò)編碼生成的第一編碼信息輸出到第一解碼單元103以及復(fù)用單元109。
第一解碼單元103使用CELP方式的語(yǔ)音和音頻解碼方法，對(duì)從第一編碼單元102輸出的第一編碼信息進(jìn)行解碼，并將通過(guò)解碼生成的第一解碼信號(hào)輸出到頻率變換單元104。頻率變換單元104對(duì)從第一解碼單元103輸出的第一解碼信號(hào)進(jìn)行采樣頻率變換，并將上采樣后的第一解碼信號(hào)輸出到調(diào)整單元105。
調(diào)整單元105通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，對(duì)上采樣后的第一解碼信號(hào)進(jìn)行調(diào)整，并將調(diào)整后的第一解碼信號(hào)輸出到加法器107。如此，在調(diào)整單元105中，通過(guò)對(duì)上采樣后的第一解碼信號(hào)進(jìn)行調(diào)整，能夠吸收編碼裝置固有的特性。另外，調(diào)整單元105的內(nèi)部結(jié)構(gòu)以及卷積處理的詳細(xì)說(shuō)明將后述。
延遲單元106將所輸入的語(yǔ)音和音頻信號(hào)暫時(shí)存儲(chǔ)于緩沖區(qū)，從緩沖區(qū)提取語(yǔ)音和音頻信號(hào)并輸出到加法器107，以使其與從調(diào)整單元105輸出的第一解碼信號(hào)在時(shí)間上取得同步。加法器107將對(duì)從調(diào)整單元105輸出的第一解碼信號(hào)進(jìn)行極性反轉(zhuǎn)后的信號(hào)與從延遲單元106輸出的輸入信號(hào)相加，并將相加結(jié)果的殘差信號(hào)輸出到第二編碼單元108。
第二編碼單元108使用CELP方式的語(yǔ)音和音頻編碼方法，對(duì)從加法器107輸出的殘差信號(hào)進(jìn)行編碼，并將通過(guò)編碼生成的第二編碼信息輸出到復(fù)用單元109。
復(fù)用單元109將從第一編碼單元102輸出的第一編碼信息與從第二編碼單元108輸出的第二編碼信息復(fù)用，并將其作為復(fù)用信息而輸出到傳輸路徑M。
接著，說(shuō)明圖1所示的解碼裝置150的各個(gè)結(jié)構(gòu)單元的處理內(nèi)容。復(fù)用分離單元151將從編碼裝置100傳輸?shù)膹?fù)用信息分離為第一編碼信息與第二編碼信息，并將第一編碼信息輸出到第一解碼單元152，將第二編碼信息輸出到第二解碼單元153。
第一解碼單元152接收到從復(fù)用分離單元151輸出的第一編碼信息，使用CELP方式的語(yǔ)音和音頻解碼方法對(duì)第一編碼信息進(jìn)行解碼，并將通過(guò)解碼求出的第一解碼信號(hào)輸出到頻率變換單元154以及信號(hào)選擇單元157。
第二解碼單元153接收到從復(fù)用分離單元151輸出的第二編碼信息，使用CELP方式的語(yǔ)音和音頻解碼方法對(duì)第二編碼信息進(jìn)行解碼，并將通過(guò)解碼求出的第二解碼信號(hào)輸出到加法器156。
頻率變換單元154對(duì)從第一解碼單元152輸出的第一解碼信號(hào)進(jìn)行采樣頻率變換，并將上采樣后的第一解碼信號(hào)輸出到調(diào)整單元155。
調(diào)整單元155使用與調(diào)整單元105相同的方法，對(duì)從頻率變換單元154輸出的第一解碼信號(hào)進(jìn)行調(diào)整，并將調(diào)整后的第一解碼信號(hào)輸出到加法器156。
加法器156將從第二解碼單元153輸出的第二解碼信號(hào)與從調(diào)整單元155輸出的第一解碼信號(hào)相加，求作為相加結(jié)果的第二解碼信號(hào)。
信號(hào)選擇單元157基于控制信號(hào)，將從第一解碼單元152輸出的第一解碼信號(hào)或從加法器156輸出的第二解碼信號(hào)的任一方，輸出到進(jìn)行后級(jí)步驟的單元。
接著，以頻率變換單元101將采樣頻率是16kHz的輸入信號(hào)下采樣到8kHz的情況為例，詳細(xì)說(shuō)明在編碼裝置100和解碼裝置150中的頻率變換處理。
此時(shí)，頻率變換單元101首先將輸入信號(hào)輸入到低通濾波器，除去高頻的頻率分量(4～8kHz)，以使輸入信號(hào)的頻率分量為0～4kHz。然后，頻率變換單元101在經(jīng)過(guò)低通濾波器后的輸入信號(hào)的樣本中提取每隔一個(gè)樣本，將提取后的樣本的序列作為下采樣后的輸入信號(hào)。
頻率變換單元104和154將第一解碼信號(hào)的采樣頻率從8kHz上采樣到16kHz。具體而言，頻率變換單元104和154在8kHz的第一解碼信號(hào)的樣本與樣本之間，插入具有“ 0”的值的樣本，將第一解碼信號(hào)的樣本的序列伸長(zhǎng)為兩倍長(zhǎng)度。接著，頻率變換單元104和154將伸長(zhǎng)后的第一解碼信號(hào)輸入到低通濾波器，除去高頻的頻率分量(4～8kHz)，以使第一解碼信號(hào)的頻率分量為0～4kHz。接著，頻率變換單元104和154對(duì)經(jīng)過(guò)低通濾波器后的第一解碼信號(hào)進(jìn)行功率的補(bǔ)償，并將補(bǔ)償后的第一解碼信號(hào)作為上采樣后的第一解碼信號(hào)。
按照下面的步驟進(jìn)行功率的補(bǔ)償。頻率變換單元104和154存儲(chǔ)了用于功率補(bǔ)償?shù)南禂?shù)r。假設(shè)系數(shù)r的初始值為“1”。此外，系數(shù)r的初始值也可變更為適合于各個(gè)編碼裝置的值。對(duì)每個(gè)幀進(jìn)行以下的處理。首先，根據(jù)以下的式(1)，求伸長(zhǎng)前的第一解碼信號(hào)的RMS(均方根)與經(jīng)過(guò)低通濾波器后的第一解碼信號(hào)的RMS’。
···式(1) 其中，ys(i)為伸長(zhǎng)前的第一解碼信號(hào)，i取0～N/2-1的值。此外，ys′(i)為經(jīng)過(guò)低通濾波器后的第一解碼信號(hào)，i取0～N-1的值。另外，N相當(dāng)于幀的長(zhǎng)度。接著，根據(jù)以下的式(2)，對(duì)于各個(gè)i(0～N-1)進(jìn)行系數(shù)r的更新(update)以及第一解碼信號(hào)的功率補(bǔ)償。
r＝r×0.99+(RMS/RMS′)×0.01···式(2) ys″(i)＝y(tǒng)s′(i)×r 式(2)中的上面的式為對(duì)系數(shù)r進(jìn)行更新的式，系數(shù)r的值在當(dāng)前幀中進(jìn)行功率補(bǔ)償之后，在下一個(gè)幀中的處理時(shí)繼續(xù)被使用。式(2)中的下面的式為使用系數(shù)r進(jìn)行功率補(bǔ)償?shù)氖健Ｍㄟ^(guò)式(2)求得的ys”(i)為上采樣后的第一解碼信號(hào)。式(2)的0.99和0.01的值也可變更為適合于各個(gè)編碼裝置的值。此外，在式(2)中，RMS’的值為“0 ” 時(shí)，進(jìn)行處理以能夠求(RMS/RMS’)的值。例如，在RMS’的值為“0”時(shí)，假設(shè)將RMS的值代入到RMS’，以使(RMS/RMS’)的值為“1”。
接著，使用圖2的方框圖說(shuō)明第一編碼單元102以及第二編碼單元108的內(nèi)部結(jié)構(gòu)。另外，這些編碼單元的內(nèi)部結(jié)構(gòu)是相同的，但是作為編碼對(duì)象的語(yǔ)音和音頻信號(hào)的采樣頻率是不同的。此外，第一編碼單元102以及第二編碼單元108將所輸入的語(yǔ)音和音頻信號(hào)劃分為每N個(gè)樣本(N為自然數(shù))，并將N個(gè)樣本作為1個(gè)幀而對(duì)各個(gè)幀進(jìn)行編碼。該N的值有時(shí)在第一編碼單元102與第二編碼單元108之間不相同。
作為輸入信號(hào)和殘差信號(hào)的其中一方的語(yǔ)音和音頻信號(hào)被輸入到預(yù)處理單元201。預(yù)處理單元201進(jìn)行用于除去DC分量的高通濾波處理，或者進(jìn)行波形整形處理以帶來(lái)后續(xù)的編碼處理的性能改善，或進(jìn)行預(yù)加重(pre-emphasis)處理，并將這些處理后的信號(hào)(Xin)輸出到LSP分析單元202以及加法器205。
LSP分析單元202使用Xin進(jìn)行線性預(yù)測(cè)分析，并將分析結(jié)果的LPC(線性預(yù)測(cè)系數(shù))變換為L(zhǎng)SP(Line Spectral Pairs)后，輸出到LSP量化單元203。
LSP量化單元203對(duì)從LSP分析單元202輸出的LSP進(jìn)行量化處理，并將量化后的量化LSP輸出到合成濾波器204。另外，LSP量化單元203將表示量化LSP的量化LSP代碼(L)輸出到復(fù)用單元214。
合成濾波器204使用基于量化LSP的濾波系數(shù)，通過(guò)對(duì)從后述的加法器211輸出的驅(qū)動(dòng)聲源進(jìn)行濾波合成而生成合成信號(hào)，并將合成信號(hào)輸出到加法器205。
加法器205通過(guò)使合成信號(hào)的極性反轉(zhuǎn)后與Xin相加而計(jì)算出誤差信號(hào)，并將誤差信號(hào)輸出到聽(tīng)覺(jué)加權(quán)單元212。
自適應(yīng)聲源代碼本206將以前由加法器211輸出的驅(qū)動(dòng)聲源存儲(chǔ)在緩沖區(qū)，在緩沖區(qū)中從參數(shù)決定單元213輸出的信號(hào)所確定的取出位置開(kāi)始取出相當(dāng)于1個(gè)幀的樣本，并將其作為自適應(yīng)聲源向量而輸出到乘法器209。另外，自適應(yīng)聲源代碼本206每當(dāng)接收到從加法器211輸出的驅(qū)動(dòng)聲源時(shí)，進(jìn)行緩沖區(qū)的更新。
量化增益生成單元207根據(jù)從參數(shù)決定單元213輸出的信號(hào)，決定量化自適應(yīng)聲源增益和量化固定聲源增益，并將這些增益分別輸出到乘法器209和乘法器210。
固定聲源代碼本208將具有從參數(shù)決定單元213輸出的信號(hào)所確定的形狀的向量，作為固定聲源向量而輸出到乘法器210。
乘法器209將從量化增益生成單元207輸出的量化自適應(yīng)聲源增益與從自適應(yīng)聲源代碼本206輸出的自適應(yīng)聲源向量相乘，并輸出到加法器211。乘法器210將從量化增益生成單元207輸出的量化固定聲源增益與從固定聲源代碼本208輸出的固定聲源向量相乘，并輸出到加法器211。
加法器211分別接收到從乘法器209和乘法器210輸出的與增益相乘后的自適應(yīng)聲源向量和固定聲源向量，將與增益相乘后的自適應(yīng)聲源向量和固定聲源向量相加，并將作為相加結(jié)果的驅(qū)動(dòng)聲源輸出到合成濾波器204和自適應(yīng)聲源代碼本206。另外，自適應(yīng)聲源代碼本206中所輸入的驅(qū)動(dòng)聲源被存儲(chǔ)于緩沖區(qū)。
聽(tīng)覺(jué)加權(quán)單元212對(duì)從加法器205輸出的誤差信號(hào)進(jìn)行聽(tīng)覺(jué)加權(quán)，并將其作為編碼失真而輸出到參數(shù)決定單元213。
參數(shù)決定單元213從自適應(yīng)聲源代碼本206中選擇自適應(yīng)聲源延遲，該自適應(yīng)聲源延遲使從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真最小，并將表示選擇結(jié)果的自適應(yīng)聲源延遲代碼(A)輸出到復(fù)用單元214。其中，“自適應(yīng)聲源延遲”是指取出自適應(yīng)聲源向量的取出位置，其詳細(xì)說(shuō)明將后述。另外，參數(shù)決定單元213從固定聲源代碼本208中選擇固定聲源向量，該固定聲源向量使從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真最小，并將表示選擇結(jié)果的固定聲源向量代碼(F)輸出到復(fù)用單元214。此外，參數(shù)決定單元213從量化增益生成單元207中選擇量化自適應(yīng)聲源增益和量化固定聲源增益，該量化自適應(yīng)聲源增益和量化固定聲源增益使從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真最小，并將表示選擇結(jié)果的量化聲源增益代碼(G)輸出到復(fù)用單元214。
復(fù)用單元214接收從LSP量化單元203輸出的量化LSP代碼(L)與從參數(shù)決定單元213輸出的自適應(yīng)聲源延遲代碼(A)、固定聲源向量代碼(F)和量化聲源增益代碼(G)，并將這些信息復(fù)用后，作為編碼信息而輸出。其中，假設(shè)第一編碼單元102輸出的編碼信息為第一編碼信息，第二編碼單元108輸出的編碼信息為第二編碼信息。
接著，以假設(shè)分配給量化LSP代碼(L)的比特?cái)?shù)為“8”而對(duì)LSP進(jìn)行向量量化的情況為例，簡(jiǎn)單地說(shuō)明LSP量化單元203決定量化LSP的處理。
LSP量化單元203具有LSP代碼本，該LSP代碼本中存儲(chǔ)預(yù)先創(chuàng)建的256種LSP代碼向量lsp(l)(i)。其中，l是附加在LSP代碼向量的索引，取0～255的值。另外，LSP代碼向量lsp(l)(i)為N維的向量，i取0～N-1的值。LSP量化單元203接收從LSP分析單元202輸出的LSPα(i)。其中，LSPα(i)為N維的向量，i取0～N-1的值。
接著，LSP量化單元203通過(guò)式(3)求LSPα(i)與LSP代碼向量lsp(l)(i)之間的均方誤差er。
···式(3) 接著，LSP量化單元203對(duì)每個(gè)l求均方誤差er，并決定使均方誤差er最小的l的值(lmin)。再者，LSP量化單元203將lmin作為量化LSP代碼(L)而輸出到復(fù)用單元214，并且將lsp(lmin)(i)作為量化LSP而輸出到合成濾波器204。
如此，由LSP量化單元203求出的lsp(lmin)(i)就是“量化LSP”。
接著，使用圖3說(shuō)明參數(shù)決定單元213決定自適應(yīng)聲源延遲的處理。
在該圖3中，緩沖區(qū)301為自適應(yīng)聲源代碼本206中所具備的緩沖區(qū)，位置302為自適應(yīng)聲源向量的取出位置，向量303為取出后的自適應(yīng)聲源向量。另外，數(shù)值“41”和“296”與使取出位置302移動(dòng)的范圍的下限和上限對(duì)應(yīng)。
在假設(shè)分配給表示自適應(yīng)聲源延遲的代碼(A)的比特?cái)?shù)為“8”時(shí)，使取出位置302移動(dòng)的范圍可設(shè)定為“256”的長(zhǎng)度的范圍(例如，41～296)。另外，也可任意地設(shè)定使取出位置302移動(dòng)的范圍。
參數(shù)決定單元213使取出位置302在所設(shè)定的范圍內(nèi)移動(dòng)，并將取出位置302依序指示給自適應(yīng)聲源代碼本206。接著，自適應(yīng)聲源代碼本206使用參數(shù)決定單元213所指示的取出位置302，取出相當(dāng)于幀長(zhǎng)度的自適應(yīng)聲源向量303，并將取出后的自適應(yīng)聲源向量輸出到乘法器209。接著，參數(shù)決定單元213在所有的取出位置302取出自適應(yīng)聲源向量303時(shí)，求從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真，并決定使編碼失真最小的取出位置302。
如此，由參數(shù)決定單元213求出的緩沖區(qū)的取出位置302就是“自適應(yīng)聲源延遲”。
接著，使用圖4說(shuō)明參數(shù)決定單元213決定固定聲源向量的處理。另外，其中，以假設(shè)分配給固定聲源向量代碼(F)的比特?cái)?shù)為“12”的情況為例進(jìn)行說(shuō)明。
在圖4中，音軌401、音軌402和音軌403分別生成一個(gè)單位脈沖(振幅值為1)。另外，乘法器404、乘法器405和乘法器406分別對(duì)在音軌401～403被生成的單位脈沖附加極性。加法器407為將所生成的三個(gè)單位脈沖進(jìn)行相加的加法器，向量408為由三個(gè)單位脈沖構(gòu)成的“固定聲源向量”。
能夠生成單位脈沖的位置因各個(gè)音軌而不同，在圖4中，各個(gè)音軌的結(jié)構(gòu)分別為音軌401在{0，3，6，9，12，15，18，21}的八處中的一處、音軌402在{1，4，7，10，13，16，19，22}的八處中的一處、音軌403在{2，5，8，11，14，17，20，23}的八處中的一處，建立一個(gè)單位脈沖。
接著，所生成的單位脈沖分別被乘法器404～406附加極性，通過(guò)加法器407使三個(gè)單位脈沖相加，從而作為相加結(jié)果的固定聲源向量408被構(gòu)成。
在該例子中，按各個(gè)單位脈沖有8種位置，有正和負(fù)的兩種極性，所以位置信息3比特以及極性信息1比特用于表現(xiàn)各個(gè)單位脈沖。因此，合計(jì)成12比特的固定聲源代碼本。參數(shù)決定單元213使三個(gè)單位脈沖的生成位置和極性移動(dòng)，并將生成位置和極性依序指示給固定聲源代碼本208。接著，固定聲源代碼本208使用參數(shù)決定單元213所指示的生成位置和極性而構(gòu)成固定聲源向量408，并將構(gòu)成后的固定聲源向量408輸出到乘法器210。接著，參數(shù)決定單元213對(duì)生成位置和極性的所有組合，求從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真，并決定使編碼失真最小的生成裝置和極性的組合。接著，參數(shù)決定單元213將固定聲源向量代碼(F)輸出到復(fù)用單元214，該固定聲源向量代碼(F)表示使編碼失真最小的生成位置和極性的組合。
接著，以假設(shè)分配給量化聲源增益代碼(G)的比特?cái)?shù)為“8”的情況為例，簡(jiǎn)單地說(shuō)明參數(shù)決定單元213決定由量化增益生成單元207生成的量化自適應(yīng)聲源增益與固定聲源增益的處理。量化增益生成單元207具有聲源增益代碼本，該聲源增益代碼本中存儲(chǔ)預(yù)先創(chuàng)建的256種聲源增益代碼向量gain(k)(i)。其中，k是附加在聲源增益代碼向量的索引，取0～255的值。另外，聲源增益代碼向量gain(k)(i)為二維的向量，i取0～1的值。參數(shù)決定單元213將從0至255的k的值，依序指示給量化增益生成單元207。量化增益生成單元207使用參數(shù)決定單元213所指示的k，從聲源增益代碼本中選擇聲源增益代碼向量gain(k)(i)，將gain(k)(0)作為量化自適應(yīng)聲源增益而輸出到乘法器209，并且將gain(k)(1)作為量化固定聲源增益而輸出到乘法器210。
如此，由量化增益生成單元207求出的gain(k)(0)就是“量化自適應(yīng)聲源增益”，gain(k)(1)則是“量化固定聲源增益”。
參數(shù)決定單元213對(duì)所有的k求從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真，并決定使編碼失真最小的k的值(kmin)。接著，參數(shù)決定單元213將kmin作為量化聲源增益代碼(G)而輸出到復(fù)用單元214。
接著，使用圖5的方框圖說(shuō)明第一解碼單元103、第一解碼單元152以及第二解碼單元153的內(nèi)部結(jié)構(gòu)。另外，這些解碼單元的內(nèi)部結(jié)構(gòu)是相同的。
第一編碼信息和第二編碼信息的其中一方的編碼信息被輸出到復(fù)用分離單元501。所輸入的編碼信息被復(fù)用分離單元501分離為個(gè)別的代碼(L、A、G和F)。分離后的量化LSP符號(hào)(L)被輸出到LSP解碼單元502，分離后的自適應(yīng)聲源延遲代碼(A)被輸出到自適應(yīng)聲源代碼本505，分離后的量化聲源增益代碼(G)被輸出到量化增益生成單元506，分離后的固定聲源向量代碼(F)被輸出到固定聲源代碼本507。
LSP解碼單元502從復(fù)用分離單元501所輸出的量化LSP代碼(L)中解碼量化LSP，并將解碼后的量化LSP輸出到合成濾波器503。
自適應(yīng)聲源代碼本505從緩沖區(qū)中取出在復(fù)用分離單元501所輸出的自適應(yīng)聲源延遲代碼(A)所指定的取出位置開(kāi)始相當(dāng)于一個(gè)幀的樣本，并將取出后的向量作為自適應(yīng)聲源向量而輸出到乘法器508。另外，自適應(yīng)聲源代碼本505每當(dāng)接收到從加法器510輸出的驅(qū)動(dòng)聲源時(shí)，進(jìn)行緩沖區(qū)的更新。
量化增益生成單元506對(duì)從復(fù)用分離單元501輸出的量化聲源增益代碼(G)所指定的量化自適應(yīng)聲源增益和量化固定聲源增益進(jìn)行解碼，并將量化自適應(yīng)聲源增益輸出到乘法器508，將量化固定聲源增益輸出到乘法器509。
固定聲源代碼本507生成從復(fù)用分離單元501輸出的固定聲源向量代碼(F)所指定的固定聲源向量，并將其輸出到乘法器509。
乘法器508將自適應(yīng)聲源向量與量化自適應(yīng)聲源增益相乘，并輸出到加法器510。乘法器509將固定聲源向量與量化固定聲源增益相乘，并輸出到加法器510。
加法器510將從乘法器508和509輸出的、與增益相乘后的自適應(yīng)聲源向量和固定聲源向量相加，從而生成驅(qū)動(dòng)聲源，并將驅(qū)動(dòng)聲源輸出到合成濾波器503以及自適應(yīng)聲源代碼本505。另外，自適應(yīng)聲源代碼本505中所輸入的驅(qū)動(dòng)聲源被存儲(chǔ)于緩沖區(qū)。
合成濾波器503使用從加法器510輸出的驅(qū)動(dòng)聲源與由LSP解碼單元502進(jìn)行了解碼的濾波系數(shù)，進(jìn)行濾波合成，并將合成信號(hào)輸出到后處理單元504。
后處理單元504對(duì)從合成濾波器503輸出的合成信號(hào)進(jìn)行改善語(yǔ)音的主觀質(zhì)量的處理，例如共振峰增強(qiáng)或音調(diào)增強(qiáng)等的處理，或者進(jìn)行改善靜態(tài)噪聲的主觀質(zhì)量的處理等，并將其作為解碼信號(hào)而輸出。其中，假設(shè)第一解碼單元103以及第一解碼單元152輸出的解碼信號(hào)為第一解碼信號(hào)，第二解碼單元153輸出的解碼信號(hào)為第二解碼信號(hào)。接著，使用圖6的方框圖說(shuō)明調(diào)整單元105以及調(diào)整單元155的內(nèi)部結(jié)構(gòu)。
存儲(chǔ)單元603存儲(chǔ)通過(guò)后述的學(xué)習(xí)方法而預(yù)先求得的調(diào)整用脈沖響應(yīng)h(i)。
第一解碼信號(hào)被輸入到存儲(chǔ)單元601。以下，將第一解碼信號(hào)表示為y(i)。第一解碼信號(hào)y(i)為N維的向量，i取n～n+N-1的值。其中，N相當(dāng)于幀的長(zhǎng)度。另外，n是位于各個(gè)幀的開(kāi)頭的樣本，相當(dāng)于N的整數(shù)倍。
存儲(chǔ)單元601具備緩沖區(qū)，該緩沖區(qū)用于存儲(chǔ)以前從頻率變換單元104和154輸出的第一解碼信號(hào)。以下，將存儲(chǔ)單元601中所具備的緩沖區(qū)表示為ybuf(i)。緩沖區(qū)ybuf(i)是長(zhǎng)度N+W-1的緩沖區(qū)，i取0～N+W-2的值。其中，W相當(dāng)于卷積單元602進(jìn)行卷積時(shí)的窗的長(zhǎng)度。存儲(chǔ)單元601根據(jù)式(4)，使用所輸入的第一解碼信號(hào)y(i)進(jìn)行緩沖區(qū)的更新。
ybuf(i)＝y(tǒng)buf(i+N)(i＝(0，…，W-2)···式(4) ybuf(i+W-1)＝y(tǒng)(i+n)(i＝0，…，N-1) 通過(guò)根據(jù)式(4)的更新，在緩沖區(qū)ybuf(0)到y(tǒng)buf(W-2)存儲(chǔ)更新前的緩沖區(qū)的一部分ybuf(N)到y(tǒng)buf(N+W-2)，在緩沖區(qū)ybuf(W-1)到y(tǒng)buf(N+W-2)存儲(chǔ)所輸入的第一解碼信號(hào)y(n)～y(n+N-1)。接著，存儲(chǔ)單元601將更新后的緩沖區(qū)ybuf(i)均輸出到卷積單元602。
卷積單元602從存儲(chǔ)單元601接收緩沖區(qū)ybuf(i)，從存儲(chǔ)單元603接收調(diào)整用脈沖響應(yīng)h(i)。調(diào)整用脈沖響應(yīng)h(i)為W維的向量，i取0～W-1的值。接著，卷積單元602通過(guò)式(5)的卷積，進(jìn)行第一解碼信號(hào)的調(diào)整，從而求調(diào)整后的第一解碼信號(hào)。
···式(5) 如此，通過(guò)將緩沖區(qū)ybuf(i)到y(tǒng)buf(i+W-1)與調(diào)整用脈沖響應(yīng)h(0)～h(W-1)進(jìn)行卷積，能夠求調(diào)整后的第一解碼信號(hào)ya(n-D+i)。調(diào)整用脈沖響應(yīng)h(i)已學(xué)習(xí)了以通過(guò)進(jìn)行調(diào)整而使調(diào)整后的第一解碼信號(hào)與輸入信號(hào)之間的誤差小。其中，求出的調(diào)整后的第一解碼信號(hào)是從ya(n-D)到y(tǒng)a(n-D+N-1)的信號(hào)，與輸入到存儲(chǔ)單元601中的第一解碼信號(hào)y(n)～y(n+N-1)相比，在時(shí)間(樣本數(shù))上產(chǎn)生D的延遲。接著，卷積單元602輸出求出的第一解碼信號(hào)。
接著，說(shuō)明通過(guò)學(xué)習(xí)預(yù)先求調(diào)整用脈沖響應(yīng)h(i)的方法。首先，準(zhǔn)備學(xué)習(xí)用的語(yǔ)音和音頻信號(hào)，而將其輸入到編碼裝置100。其中，假設(shè)學(xué)習(xí)用的語(yǔ)音和音頻信號(hào)為x(i)。接著，對(duì)學(xué)習(xí)用的語(yǔ)音和音頻信號(hào)進(jìn)行編碼和解碼，將從頻率變化單元104輸出的第一解碼信號(hào)y(i)按各個(gè)幀輸入到調(diào)整單元105。接著，在存儲(chǔ)單元601中，對(duì)各個(gè)幀進(jìn)行根據(jù)式(4)的緩沖區(qū)的更新。將緩沖區(qū)中所存儲(chǔ)的第一解碼信號(hào)與未知的調(diào)整用脈沖響應(yīng)h(i)進(jìn)行卷積的信號(hào)以及學(xué)習(xí)用的語(yǔ)音和音頻信號(hào)x(i)之間的、以幀為單位的均方誤差E(n)由式(6)表示。
···式(6) 其中，N相當(dāng)于幀的長(zhǎng)度。另外，n是位于各個(gè)幀的開(kāi)頭的樣本，為N的整數(shù)倍。此外，W相當(dāng)于進(jìn)行卷積時(shí)的窗的長(zhǎng)度。
在幀的總數(shù)為R時(shí)，各個(gè)幀的均方誤差E(n)的總和Ea由式(7)表示。
···式(7) 其中，緩沖區(qū)ybufk(i)為幀k中的緩沖區(qū)ybuf(i)。緩沖區(qū)ybuf(i)按各個(gè)幀進(jìn)行更新，所以緩沖區(qū)的內(nèi)容因各個(gè)幀而不同。另外，假設(shè)x(-D)～x(-1)的值均為“0”。此外，假設(shè)從緩沖區(qū)ybuf(0)至ybuf(n+W-2)的初始值均為“0”。
為了求調(diào)整用脈沖響應(yīng)h(i)，求使式(7)的均方誤差的總和Ea最小的h(i)。也就是說(shuō)，對(duì)式(7)中的所有h(J)，求滿足δEa/δh(j)的h(j)。式(8)為能夠從δEa/δh(j)＝0導(dǎo)出的聯(lián)立方程式。通過(guò)求滿足式(8)的聯(lián)立方程式的h(j)，能夠求已被學(xué)習(xí)的調(diào)整用脈沖響應(yīng)h(i)。
···式(8) 接著，通過(guò)式(9)定義W維的向量V以及W維的向量H。
···式(9) 另外，通過(guò)式(10)定義W×W的矩陣Y后，式(8)能夠由式(11)表示。

···式(10) V＝Y(jié)·H ···式(11) 因此，為了求調(diào)整用脈沖響應(yīng)h(i)，通過(guò)式(12)求向量H。
H＝Y(jié)-1·V ···式(12) 如此，使用學(xué)習(xí)用的語(yǔ)音和音頻信號(hào)進(jìn)行學(xué)習(xí)，能夠求調(diào)整用脈沖響應(yīng)h(i)。已學(xué)習(xí)了調(diào)整用脈沖響應(yīng)h(i)，以通過(guò)對(duì)第一解碼信號(hào)進(jìn)行調(diào)整而使調(diào)整后的第一解碼信號(hào)與輸入信號(hào)之間的均方誤差小。在調(diào)整單元105中，通過(guò)以上的方法而求出的調(diào)整用脈沖響應(yīng)h(i)與從頻率變換單元104輸出的第一解碼信號(hào)進(jìn)行卷積，抵消編碼裝置100固有的特性，能夠使第一解碼信號(hào)與輸入信號(hào)之間的均方誤差更小。
接著，說(shuō)明延遲單元106使輸入信號(hào)延遲并輸出的處理。延遲單元106將所輸入的語(yǔ)音和音頻信號(hào)存儲(chǔ)于緩沖區(qū)。接著，延遲單元106從緩沖區(qū)提取語(yǔ)音和音頻信號(hào)并將其作為輸入信號(hào)而輸出到加法器107，以使其與從調(diào)整單元105輸出的第一解碼信號(hào)在時(shí)間上取得同步。具體而言，在所輸入的語(yǔ)音和音頻信號(hào)為x(n)～x(n+N-1)時(shí)，從緩沖區(qū)提取在時(shí)間(樣本數(shù))上產(chǎn)生D的延遲的信號(hào)，并將提取后的信號(hào)x(n-D)～x(n-D+N-1)作為輸入信號(hào)而輸出到加法器107。
另外，在本實(shí)施方式中，以編碼裝置100具有兩個(gè)編碼單元的情況為例進(jìn)行了說(shuō)明，但編碼單元的個(gè)數(shù)不限于此，也可具有三個(gè)以上的編碼單元。
另外，在本實(shí)施方式中，以解碼裝置150具有兩個(gè)解碼單元的情況為例進(jìn)行了說(shuō)明，但解碼單元的個(gè)數(shù)不限于此，也可具有三個(gè)以上的解碼單元。
此外，在本實(shí)施方式中，以用脈沖形成固定聲源代碼本208所生成的固定聲源向量的情況為例進(jìn)行了說(shuō)明，但本發(fā)明也可適用于形成固定聲源向量的脈沖為擴(kuò)頻脈沖的情況，能夠獲得與本實(shí)施方式相同的作用和效果。在此，擴(kuò)頻脈沖不是指單位脈沖，而是指在連著幾個(gè)樣本上都具有特定形狀的脈沖狀的波形。
另外，在本實(shí)施方式中，對(duì)編碼單元和解碼單元是CELP類型的語(yǔ)音和音頻編碼和解碼方法的情況進(jìn)行了說(shuō)明，但本發(fā)明也可適用于編碼單元和解碼單元是CELP類型以外的語(yǔ)音和音頻編碼和解碼方法(例如，脈沖代碼調(diào)制、預(yù)測(cè)編碼、向量量化和聲碼器)的情況，能夠獲得與本實(shí)施方式相同的作用和效果。此外，本發(fā)明也可適用于語(yǔ)音和音頻編碼和解碼方法因各個(gè)編碼單元和解碼單元而不同的情況，能夠獲得與本實(shí)施方式相同的作用和效果。
(實(shí)施方式2) 圖7是表示本發(fā)明實(shí)施方式2的語(yǔ)音和音頻發(fā)送裝置的結(jié)構(gòu)的方框圖，該裝置包含在上述的實(shí)施方式1中所說(shuō)明的編碼裝置。
語(yǔ)音和音頻信號(hào)701被輸入裝置702變換為電信號(hào)，并輸出到A/D變換裝置703。A/D變換裝置703將從輸入裝置702輸出的(模擬)信號(hào)變換為數(shù)字信號(hào)，并輸出到語(yǔ)音和音頻編碼裝置704。語(yǔ)音和音頻編碼裝置704裝載圖1所示的編碼裝置100，對(duì)從A/D變換裝置703輸出的數(shù)字語(yǔ)音和音頻信號(hào)進(jìn)行編碼，并將編碼信息輸出到RF調(diào)制裝置705。RF調(diào)制裝置705將從語(yǔ)音和音頻編碼裝置704輸出的編碼信息變換為用于裝載在電波等的傳播媒體而送出的信號(hào)，并輸出到發(fā)送天線706。發(fā)送天線706將從RF調(diào)制裝置705輸出的輸出信號(hào)作為電波(RF信號(hào))而送出。另外，在圖中的RF信號(hào)707表示從發(fā)送天線706送出的電波(RF信號(hào))。
圖8是表示本發(fā)明實(shí)施方式2的語(yǔ)音和音頻接收裝置的結(jié)構(gòu)的方框圖，該裝置包含在上述的實(shí)施方式1中所說(shuō)明的解碼裝置。
RF信號(hào)801被接收天線802接收并輸出到RF解調(diào)裝置803。另外，在圖中的RF信號(hào)801表示接收天線802所接收的電波，而若在傳播路徑中沒(méi)有信號(hào)的衰減或噪聲的重疊，就完全與RF信號(hào)707相同。
RF解調(diào)裝置803從接收天線802所輸出的RF信號(hào)中解調(diào)編碼信息，并將其輸出到語(yǔ)音和音頻解碼裝置804。語(yǔ)音和音頻解碼裝置804裝載圖1所示的解碼裝置150，從RF解調(diào)裝置803輸出的編碼信息中解碼語(yǔ)音和音頻信號(hào)，并將其輸出到D/A變換裝置805。D/A變換裝置805將從語(yǔ)音和音頻解碼裝置804輸出的數(shù)字語(yǔ)音和音頻信號(hào)變換為模擬的電信號(hào)，并輸出到輸出裝置806。輸出裝置806將電信號(hào)變換為空氣振動(dòng)并作為聲波而輸出，以使人類的耳朵能夠聽(tīng)見(jiàn)。另外，在圖中，參照標(biāo)號(hào)807表示所輸出的聲波。
通過(guò)在無(wú)線通信系統(tǒng)中的基站裝置和通信終端裝置具備如上所述的語(yǔ)音和音頻信號(hào)發(fā)送裝置以及語(yǔ)音和音頻信號(hào)接收裝置，能夠獲得高質(zhì)量的輸出信號(hào)。
如此，根據(jù)本實(shí)施方式，將本發(fā)明的編碼裝置以及解碼裝置能夠裝載于語(yǔ)音和音頻信號(hào)發(fā)送裝置以及語(yǔ)音和音頻信號(hào)接收裝置。
本發(fā)明的編碼裝置以及解碼裝置不限于上述的實(shí)施方式1和2，也可通過(guò)各種變更而實(shí)施。
本發(fā)明的編碼裝置和解碼裝置也可裝載于移動(dòng)通信系統(tǒng)中的移動(dòng)終端裝置和基站裝置，由此能夠提供具有與上述同樣的作用效果的移動(dòng)終端裝置和基站裝置。
另外，其中，舉例說(shuō)明了以硬件構(gòu)成本發(fā)明的情況，但本發(fā)明也可通過(guò)軟件來(lái)實(shí)現(xiàn)。
本說(shuō)明書(shū)基于在2005年5月11日申請(qǐng)的日本專利申請(qǐng)第2005-138151號(hào)。其內(nèi)容全部包含于此。
工業(yè)實(shí)用性本發(fā)明具有即使存在編碼裝置固有的特性，也可獲得質(zhì)量佳的解碼語(yǔ)音信號(hào)的效果，并適合于對(duì)語(yǔ)音和音頻信號(hào)進(jìn)行編碼而傳輸?shù)耐ㄐ畔到y(tǒng)中的編碼裝置和解碼裝置。
權(quán)利要求
1.一種編碼裝置，對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼，該裝置包括
第一編碼單元，對(duì)所述輸入信號(hào)進(jìn)行編碼而生成第一編碼信息；
第一解碼單元，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；
調(diào)整單元，通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述第一解碼信號(hào)的調(diào)整；
延遲單元，使所述輸入信號(hào)延遲，以使其與調(diào)整后的第一解碼信號(hào)同步；
加法單元，求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào)；以及
第二編碼單元，對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
2.一種編碼裝置，對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼，該裝置包括
頻率變換單元，通過(guò)對(duì)所述輸入信號(hào)進(jìn)行下采樣，從而進(jìn)行采樣頻率變換；
第一編碼單元，對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼而生成第一編碼信息；
第一解碼單元，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；
頻率變換單元，通過(guò)對(duì)所述第一解碼信號(hào)進(jìn)行上采樣，從而進(jìn)行采樣頻率變換；
調(diào)整單元，通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述上采樣后的第一解碼信號(hào)的調(diào)整；
延遲單元，使所述輸入信號(hào)延遲，以使其與調(diào)整后的第一解碼信號(hào)同步；
加法單元，求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào)；以及
第二編碼單元，對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
3.如權(quán)利要求1所述的編碼裝置，其中，
調(diào)整用的脈沖響應(yīng)通過(guò)學(xué)習(xí)而求得。
4.一種解碼裝置，對(duì)權(quán)利要求1所述的編碼裝置所輸出的編碼信息進(jìn)行解碼，該解碼裝置包括
第一解碼單元，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；
第二解碼單元，對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào)；
調(diào)整單元，通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述第一解碼信號(hào)的調(diào)整；
加法單元，將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加；以及
信號(hào)選擇單元，選擇所述第一解碼單元所生成的第一解碼信號(hào)或者所述加法單元的相加結(jié)果中的一個(gè)并輸出。
5.一種解碼裝置，對(duì)權(quán)利要求2所述的編碼裝置輸出的編碼信息進(jìn)行解碼，該解碼裝置包括
第一解碼單元，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；
第二解碼單元，對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào)；
頻率變換單元，通過(guò)對(duì)所述第一解碼信號(hào)進(jìn)行上采樣，從而進(jìn)行采樣頻率變換；
調(diào)整單元，通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述上采樣后的第一解碼信號(hào)的調(diào)整；
加法單元，將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加；以及
信號(hào)選擇單元，選擇所述第一解碼單元所生成的第一解碼信號(hào)或所述加法單元的相加結(jié)果中的一個(gè)并輸出。
6.如權(quán)利要求4所述的解碼裝置，其中，
調(diào)整用的脈沖響應(yīng)通過(guò)學(xué)習(xí)而求得。
7.一種基站裝置，包括權(quán)利要求1所述的編碼裝置。
8.一種基站裝置，包括權(quán)利要求4所述的解碼裝置。
9.一種通信終端裝置，包括權(quán)利要求1所述的編碼裝置。
10.一種通信終端裝置，包括權(quán)利要求4所述的解碼裝置。
11.一種編碼方法，對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼，該方法包括
第一編碼步驟，對(duì)所述輸入信號(hào)進(jìn)行編碼而生成第一編碼信息；
第一解碼步驟，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；
調(diào)整步驟，通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述第一解碼信號(hào)的調(diào)整；
延遲步驟，使所述輸入信號(hào)延遲，以使其與調(diào)整后的第一解碼信號(hào)同步；
加法步驟，求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào)；以及
第二編碼步驟，對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
12.一種解碼方法，對(duì)通過(guò)權(quán)利要求11所述的編碼方法編碼的編碼信息進(jìn)行解碼，該解碼方法包括
第一解碼步驟，對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào)；
第二解碼步驟，對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào)；
調(diào)整步驟，通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，從而進(jìn)行所述第一解碼信號(hào)的調(diào)整；
加法步驟，將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加；以及
信號(hào)選擇步驟，選擇所述第一解碼步驟中所生成的第一解碼信號(hào)或者所述加法步驟中的相加結(jié)果中的一個(gè)并輸出。
全文摘要
本發(fā)明提供一種在可擴(kuò)展編碼方式中，抵消作為解碼信號(hào)的質(zhì)量惡化原因的編碼裝置固有的特性，能夠?qū)崿F(xiàn)提高所生成的解碼信號(hào)的質(zhì)量的編碼裝置。在該編碼裝置中，第一編碼單元(102)對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼。第一解碼單元(103)對(duì)從第一編碼單元(102)輸出的第一編碼信息進(jìn)行解碼。調(diào)整單元(105)通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積，調(diào)整上采樣后的第一解碼信號(hào)。加法器(107)使調(diào)整后的第一解碼信號(hào)的極性反轉(zhuǎn)后，與輸入信號(hào)相加。第二編碼單元(108)對(duì)從加法器(107)輸出的殘差信號(hào)進(jìn)行編碼。復(fù)用單元(109)將從第一編碼單元(102)輸出的第一編碼信息與從第二編碼單元(108)輸出的第二編碼信息復(fù)用并輸出。
文檔編號(hào)G10L19/14GK101176148SQ20068001618
公開(kāi)日2008年5月7日申請(qǐng)日期2006年4月28日優(yōu)先權(quán)日2005年5月11日
發(fā)明者佐藤薰, 森井利幸, 山梨智史申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載