專利名稱:編碼裝置、解碼裝置和其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼并傳輸?shù)耐ㄐ畔到y(tǒng)中所使用的編碼裝置、解碼裝置和其方法。
背景技術(shù):
在以數(shù)字無(wú)線通信和因特網(wǎng)通信為代表的分組通信或語(yǔ)音存儲(chǔ)等領(lǐng)域中,為了實(shí)現(xiàn)有效利用電波等的傳輸路徑容量或存儲(chǔ)媒體,語(yǔ)音信號(hào)的編碼和解碼技術(shù)必不可少,至目前為止已開(kāi)發(fā)了許多語(yǔ)音編碼和解碼方式。
而且,現(xiàn)在,CELP方式的語(yǔ)音編碼和解碼方式作為主流方式而被實(shí)用化(例如,非專利文獻(xiàn)1)。CELP方式的語(yǔ)音編碼方式主要是存儲(chǔ)發(fā)聲語(yǔ)音的模型,基于預(yù)先存儲(chǔ)的語(yǔ)音模型,對(duì)輸入語(yǔ)音進(jìn)行編碼的方式。
并且,近年以來(lái),已開(kāi)發(fā)了可擴(kuò)展編碼技術(shù),該技術(shù)是在語(yǔ)音信號(hào)和音頻信號(hào)的編碼時(shí)應(yīng)用CELP方式,即使從編碼信息的一部分也能夠?qū)φZ(yǔ)音和音頻信號(hào)進(jìn)行解碼,而即使在發(fā)生分組損失的情況下,也能夠抑制音質(zhì)的惡化(例如,參照專利文獻(xiàn)1)。
可擴(kuò)展編碼方式通常由基本層和多個(gè)擴(kuò)展層構(gòu)成,并且各個(gè)層以基本層作為最低層,形成分層結(jié)構(gòu)。然后,在各個(gè)層,對(duì)較低層的輸入信號(hào)與輸出信號(hào)之間的差即殘差信號(hào)進(jìn)行編碼。根據(jù)該結(jié)構(gòu),使用所有層的編碼信息或部分層的編碼信息,能夠?qū)φZ(yǔ)音和音頻進(jìn)行解碼。
另外,在可擴(kuò)展編碼時(shí),通常進(jìn)行輸入信號(hào)的采樣頻率變換,并對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼。此時(shí),通過(guò)對(duì)低層的解碼信號(hào)進(jìn)行上采樣,并求輸入信號(hào)與上采樣后的解碼信號(hào)之間的差,從而生成由高層進(jìn)行編碼的殘差信號(hào)。 特開(kāi)平10-97295號(hào)公報(bào)M.R.Schroeder,B.S.Atal,″Code Excited Linear PredictionHigh Quality Speech at Very Low Bit Rate″,IEEE proc.,ICASSP′85 pp.937-940
發(fā)明內(nèi)容
發(fā)明需要解決的問(wèn)題 在此,一般而言,編碼裝置具有作為解碼信號(hào)的質(zhì)量惡化原因的固有特性。例如,在基本層對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼時(shí),因采樣頻率變換而產(chǎn)生解碼信號(hào)的相位偏差,導(dǎo)致解碼信號(hào)的質(zhì)量惡化。
然而,在以往的可擴(kuò)展編碼方式中,不考慮編碼裝置的固有特性而進(jìn)行編碼,所以由于該編碼裝置的固有特性導(dǎo)致低層的解碼信號(hào)的質(zhì)量惡化,使解碼信號(hào)與輸入信號(hào)之間的誤差大,而成為導(dǎo)致高層的編碼效率降低的原因。
本發(fā)明的目的為提供在可擴(kuò)展編碼方式中,即使存在編碼裝置的固有特性時(shí),也能夠抵消解碼信號(hào)受到影響的特性的編碼裝置、解碼裝置和其方法。
解決該問(wèn)題的方案 本發(fā)明的編碼裝置為對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼的編碼裝置,該裝置所采用的結(jié)構(gòu)包括第一編碼單元,對(duì)所述輸入信號(hào)進(jìn)行編碼而生成第一編碼信息;第一解碼單元,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);調(diào)整單元,通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述第一解碼信號(hào)的調(diào)整;延遲單元,使所述輸入信號(hào)延遲,以使其與調(diào)整后的第一解碼信號(hào)同步;加法單元,求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào);以及第二編碼單元,對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
本發(fā)明的編碼裝置為對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼的編碼裝置,該裝置所采用的結(jié)構(gòu)包括頻率變換單元,通過(guò)對(duì)所述輸入信號(hào)進(jìn)行下采樣,從而進(jìn)行采樣頻率變換;第一編碼單元,對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼而生成第一編碼信息;第一解碼單元,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);頻率變換單元,通過(guò)對(duì)所述第一解碼信號(hào)進(jìn)行上采樣,從而進(jìn)行采樣頻率變換;調(diào)整單元,通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述上采樣后的第一解碼信號(hào)的調(diào)整;延遲單元,使所述輸入信號(hào)延遲,以使其與調(diào)整后的第一解碼信號(hào)同步;加法單元,求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào);以及第二編碼單元,對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
本發(fā)明的解碼裝置為對(duì)上述的編碼裝置所輸出的編碼信息進(jìn)行解碼的解碼裝置,該裝置所采用的結(jié)構(gòu)包括第一解碼單元,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);第二解碼單元,對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào);調(diào)整單元,通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述第一解碼信號(hào)的調(diào)整;加法單元,將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加;以及信號(hào)選擇單元,選擇所述第一解碼單元所生成的第一解碼信號(hào)或所述加法單元的相加結(jié)果中的一個(gè)并輸出。
本發(fā)明的解碼裝置為對(duì)上述的編碼裝置所輸出的編碼信息進(jìn)行解碼的解碼裝置,該裝置所采用的結(jié)構(gòu)包括第一解碼單元,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);第二解碼單元,對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào);頻率變換單元,通過(guò)對(duì)所述第一解碼信號(hào)進(jìn)行上采樣,從而進(jìn)行采樣頻率變換;調(diào)整單元,通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述上采樣后的第一解碼信號(hào)的調(diào)整;加法單元,將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加;以及信號(hào)選擇單元,選擇所述第一解碼單元所生成的第一解碼信號(hào)或所述加法單元的相加結(jié)果中的一個(gè)并輸出。
本發(fā)明的編碼方法為對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼的編碼方法,該方法所采用的方法包括第一編碼步驟,對(duì)所述輸入信號(hào)進(jìn)行編碼而生成第一編碼信息;第一解碼步驟,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);調(diào)整步驟,通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述第一解碼信號(hào)的調(diào)整;延遲步驟,使所述輸入信號(hào)延遲,以使其與調(diào)整后的第一解碼信號(hào)同步;加法步驟,求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào);以及第二編碼步驟,對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
本發(fā)明的解碼方法為對(duì)通過(guò)上述的編碼方法編碼的編碼信息進(jìn)行解碼的解碼方法,該方法所采用的方法包括第一解碼步驟,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);第二解碼步驟,對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào);調(diào)整步驟,通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述第一解碼信號(hào)的調(diào)整;加法步驟,將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加;以及信號(hào)選擇步驟,選擇所述第一解碼步驟中所生成的第一解碼信號(hào)或所述加法步驟中的相加結(jié)果中的一個(gè)并輸出。
發(fā)明的有益效果 根據(jù)本發(fā)明,通過(guò)對(duì)所輸出的解碼信號(hào)進(jìn)行調(diào)整,能夠抵消編碼裝置的固有特性,能夠?qū)崿F(xiàn)提高解碼信號(hào)的質(zhì)量,并能夠提高高層的編碼效率。
圖1是表示本發(fā)明實(shí)施方式1的編碼裝置和解碼裝置的主要結(jié)構(gòu)的方框圖。
圖2是表示本發(fā)明實(shí)施方式1的第一編碼單元和第二編碼單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖3是用于簡(jiǎn)單說(shuō)明決定自適應(yīng)聲源延遲的處理的圖。
圖4是用于簡(jiǎn)單說(shuō)明決定固定聲源向量的處理的圖。
圖5是表示本發(fā)明實(shí)施方式1的第一解碼單元和第二解碼單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖6是表示本發(fā)明實(shí)施方式1的調(diào)整單元的內(nèi)部結(jié)構(gòu)的方框圖。
圖7是表示本發(fā)明實(shí)施方式2的語(yǔ)音和音頻發(fā)送裝置的結(jié)構(gòu)的方框圖。
圖8是表示本發(fā)明實(shí)施方式2的語(yǔ)音和音頻接收裝置的結(jié)構(gòu)的方框圖。
具體實(shí)施例方式 以下,參照附圖詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式。另外,在以下的實(shí)施方式中,對(duì)通過(guò)由兩層構(gòu)成的分層性的信號(hào)編碼和解碼方法而進(jìn)行CELP類型的語(yǔ)音編碼和解碼的情況,進(jìn)行說(shuō)明。此外,分層性的信號(hào)編碼方法是指,在高層中存在多個(gè)信號(hào)編碼方法而形成分層結(jié)構(gòu)的方法,該信號(hào)編碼方法對(duì)在低層中的輸入信號(hào)與輸出信號(hào)之間的差分信號(hào)進(jìn)行編碼并輸出編碼信息。
(實(shí)施方式1) 圖1是表示本發(fā)明實(shí)施方式1的編碼裝置100和解碼裝置150的主要結(jié)構(gòu)的方框圖。編碼裝置100主要由頻率變換單元101和104、第一編碼單元102、第一解碼單元103、調(diào)整單元105、延遲單元106、加法器107、第二編碼單元108、以及復(fù)用單元109構(gòu)成。另外,解碼裝置150主要由復(fù)用分離單元151、第一解碼單元152、第二解碼單元153、頻率變換單元154、調(diào)整單元155、加法器156、以及信號(hào)選擇單元157構(gòu)成。編碼裝置100所輸出的編碼信息,通過(guò)傳輸路徑M被傳輸?shù)浇獯a裝置150。
以下,說(shuō)明圖1所示的編碼裝置100的各個(gè)結(jié)構(gòu)單元的處理內(nèi)容。作為語(yǔ)音和音頻信號(hào)的信號(hào)被輸入到頻率變換單元101以及延遲單元106。頻率變換單元101進(jìn)行輸入信號(hào)的采樣頻率變換,并將下采樣后的輸入信號(hào)輸出到第一編碼單元102。
第一編碼單元102使用CELP方式的語(yǔ)音和音頻編碼方法,對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼,并將通過(guò)編碼生成的第一編碼信息輸出到第一解碼單元103以及復(fù)用單元109。
第一解碼單元103使用CELP方式的語(yǔ)音和音頻解碼方法,對(duì)從第一編碼單元102輸出的第一編碼信息進(jìn)行解碼,并將通過(guò)解碼生成的第一解碼信號(hào)輸出到頻率變換單元104。頻率變換單元104對(duì)從第一解碼單元103輸出的第一解碼信號(hào)進(jìn)行采樣頻率變換,并將上采樣后的第一解碼信號(hào)輸出到調(diào)整單元105。
調(diào)整單元105通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,對(duì)上采樣后的第一解碼信號(hào)進(jìn)行調(diào)整,并將調(diào)整后的第一解碼信號(hào)輸出到加法器107。如此,在調(diào)整單元105中,通過(guò)對(duì)上采樣后的第一解碼信號(hào)進(jìn)行調(diào)整,能夠吸收編碼裝置固有的特性。另外,調(diào)整單元105的內(nèi)部結(jié)構(gòu)以及卷積處理的詳細(xì)說(shuō)明將后述。
延遲單元106將所輸入的語(yǔ)音和音頻信號(hào)暫時(shí)存儲(chǔ)于緩沖區(qū),從緩沖區(qū)提取語(yǔ)音和音頻信號(hào)并輸出到加法器107,以使其與從調(diào)整單元105輸出的第一解碼信號(hào)在時(shí)間上取得同步。加法器107將對(duì)從調(diào)整單元105輸出的第一解碼信號(hào)進(jìn)行極性反轉(zhuǎn)后的信號(hào)與從延遲單元106輸出的輸入信號(hào)相加,并將相加結(jié)果的殘差信號(hào)輸出到第二編碼單元108。
第二編碼單元108使用CELP方式的語(yǔ)音和音頻編碼方法,對(duì)從加法器107輸出的殘差信號(hào)進(jìn)行編碼,并將通過(guò)編碼生成的第二編碼信息輸出到復(fù)用單元109。
復(fù)用單元109將從第一編碼單元102輸出的第一編碼信息與從第二編碼單元108輸出的第二編碼信息復(fù)用,并將其作為復(fù)用信息而輸出到傳輸路徑M。
接著,說(shuō)明圖1所示的解碼裝置150的各個(gè)結(jié)構(gòu)單元的處理內(nèi)容。復(fù)用分離單元151將從編碼裝置100傳輸?shù)膹?fù)用信息分離為第一編碼信息與第二編碼信息,并將第一編碼信息輸出到第一解碼單元152,將第二編碼信息輸出到第二解碼單元153。
第一解碼單元152接收到從復(fù)用分離單元151輸出的第一編碼信息,使用CELP方式的語(yǔ)音和音頻解碼方法對(duì)第一編碼信息進(jìn)行解碼,并將通過(guò)解碼求出的第一解碼信號(hào)輸出到頻率變換單元154以及信號(hào)選擇單元157。
第二解碼單元153接收到從復(fù)用分離單元151輸出的第二編碼信息,使用CELP方式的語(yǔ)音和音頻解碼方法對(duì)第二編碼信息進(jìn)行解碼,并將通過(guò)解碼求出的第二解碼信號(hào)輸出到加法器156。
頻率變換單元154對(duì)從第一解碼單元152輸出的第一解碼信號(hào)進(jìn)行采樣頻率變換,并將上采樣后的第一解碼信號(hào)輸出到調(diào)整單元155。
調(diào)整單元155使用與調(diào)整單元105相同的方法,對(duì)從頻率變換單元154輸出的第一解碼信號(hào)進(jìn)行調(diào)整,并將調(diào)整后的第一解碼信號(hào)輸出到加法器156。
加法器156將從第二解碼單元153輸出的第二解碼信號(hào)與從調(diào)整單元155輸出的第一解碼信號(hào)相加,求作為相加結(jié)果的第二解碼信號(hào)。
信號(hào)選擇單元157基于控制信號(hào),將從第一解碼單元152輸出的第一解碼信號(hào)或從加法器156輸出的第二解碼信號(hào)的任一方,輸出到進(jìn)行后級(jí)步驟的單元。
接著,以頻率變換單元101將采樣頻率是16kHz的輸入信號(hào)下采樣到8kHz的情況為例,詳細(xì)說(shuō)明在編碼裝置100和解碼裝置150中的頻率變換處理。
此時(shí),頻率變換單元101首先將輸入信號(hào)輸入到低通濾波器,除去高頻的頻率分量(4~8kHz),以使輸入信號(hào)的頻率分量為0~4kHz。然后,頻率變換單元101在經(jīng)過(guò)低通濾波器后的輸入信號(hào)的樣本中提取每隔一個(gè)樣本,將提取后的樣本的序列作為下采樣后的輸入信號(hào)。
頻率變換單元104和154將第一解碼信號(hào)的采樣頻率從8kHz上采樣到16kHz。具體而言,頻率變換單元104和154在8kHz的第一解碼信號(hào)的樣本與樣本之間,插入具有“ 0”的值的樣本,將第一解碼信號(hào)的樣本的序列伸長(zhǎng)為兩倍長(zhǎng)度。接著,頻率變換單元104和154將伸長(zhǎng)后的第一解碼信號(hào)輸入到低通濾波器,除去高頻的頻率分量(4~8kHz),以使第一解碼信號(hào)的頻率分量為0~4kHz。接著,頻率變換單元104和154對(duì)經(jīng)過(guò)低通濾波器后的第一解碼信號(hào)進(jìn)行功率的補(bǔ)償,并將補(bǔ)償后的第一解碼信號(hào)作為上采樣后的第一解碼信號(hào)。
按照下面的步驟進(jìn)行功率的補(bǔ)償。頻率變換單元104和154存儲(chǔ)了用于功率補(bǔ)償?shù)南禂?shù)r。假設(shè)系數(shù)r的初始值為“1”。此外,系數(shù)r的初始值也可變更為適合于各個(gè)編碼裝置的值。對(duì)每個(gè)幀進(jìn)行以下的處理。首先,根據(jù)以下的式(1),求伸長(zhǎng)前的第一解碼信號(hào)的RMS(均方根)與經(jīng)過(guò)低通濾波器后的第一解碼信號(hào)的RMS’。
···式(1) 其中,ys(i)為伸長(zhǎng)前的第一解碼信號(hào),i取0~N/2-1的值。此外,ys′(i)為經(jīng)過(guò)低通濾波器后的第一解碼信號(hào),i取0~N-1的值。另外,N相當(dāng)于幀的長(zhǎng)度。接著,根據(jù)以下的式(2),對(duì)于各個(gè)i(0~N-1)進(jìn)行系數(shù)r的更新(update)以及第一解碼信號(hào)的功率補(bǔ)償。
r=r×0.99+(RMS/RMS′)×0.01···式(2) ys″(i)=y(tǒng)s′(i)×r 式(2)中的上面的式為對(duì)系數(shù)r進(jìn)行更新的式,系數(shù)r的值在當(dāng)前幀中進(jìn)行功率補(bǔ)償之后,在下一個(gè)幀中的處理時(shí)繼續(xù)被使用。式(2)中的下面的式為使用系數(shù)r進(jìn)行功率補(bǔ)償?shù)氖健Mㄟ^(guò)式(2)求得的ys”(i)為上采樣后的第一解碼信號(hào)。式(2)的0.99和0.01的值也可變更為適合于各個(gè)編碼裝置的值。此外,在式(2)中,RMS’的值為“0 ” 時(shí),進(jìn)行處理以能夠求(RMS/RMS’)的值。例如,在RMS’的值為“0”時(shí),假設(shè)將RMS的值代入到RMS’,以使(RMS/RMS’)的值為“1”。
接著,使用圖2的方框圖說(shuō)明第一編碼單元102以及第二編碼單元108的內(nèi)部結(jié)構(gòu)。另外,這些編碼單元的內(nèi)部結(jié)構(gòu)是相同的,但是作為編碼對(duì)象的語(yǔ)音和音頻信號(hào)的采樣頻率是不同的。此外,第一編碼單元102以及第二編碼單元108將所輸入的語(yǔ)音和音頻信號(hào)劃分為每N個(gè)樣本(N為自然數(shù)),并將N個(gè)樣本作為1個(gè)幀而對(duì)各個(gè)幀進(jìn)行編碼。該N的值有時(shí)在第一編碼單元102與第二編碼單元108之間不相同。
作為輸入信號(hào)和殘差信號(hào)的其中一方的語(yǔ)音和音頻信號(hào)被輸入到預(yù)處理單元201。預(yù)處理單元201進(jìn)行用于除去DC分量的高通濾波處理,或者進(jìn)行波形整形處理以帶來(lái)后續(xù)的編碼處理的性能改善,或進(jìn)行預(yù)加重(pre-emphasis)處理,并將這些處理后的信號(hào)(Xin)輸出到LSP分析單元202以及加法器205。
LSP分析單元202使用Xin進(jìn)行線性預(yù)測(cè)分析,并將分析結(jié)果的LPC(線性預(yù)測(cè)系數(shù))變換為L(zhǎng)SP(Line Spectral Pairs)后,輸出到LSP量化單元203。
LSP量化單元203對(duì)從LSP分析單元202輸出的LSP進(jìn)行量化處理,并將量化后的量化LSP輸出到合成濾波器204。另外,LSP量化單元203將表示量化LSP的量化LSP代碼(L)輸出到復(fù)用單元214。
合成濾波器204使用基于量化LSP的濾波系數(shù),通過(guò)對(duì)從后述的加法器211輸出的驅(qū)動(dòng)聲源進(jìn)行濾波合成而生成合成信號(hào),并將合成信號(hào)輸出到加法器205。
加法器205通過(guò)使合成信號(hào)的極性反轉(zhuǎn)后與Xin相加而計(jì)算出誤差信號(hào),并將誤差信號(hào)輸出到聽(tīng)覺(jué)加權(quán)單元212。
自適應(yīng)聲源代碼本206將以前由加法器211輸出的驅(qū)動(dòng)聲源存儲(chǔ)在緩沖區(qū),在緩沖區(qū)中從參數(shù)決定單元213輸出的信號(hào)所確定的取出位置開(kāi)始取出相當(dāng)于1個(gè)幀的樣本,并將其作為自適應(yīng)聲源向量而輸出到乘法器209。另外,自適應(yīng)聲源代碼本206每當(dāng)接收到從加法器211輸出的驅(qū)動(dòng)聲源時(shí),進(jìn)行緩沖區(qū)的更新。
量化增益生成單元207根據(jù)從參數(shù)決定單元213輸出的信號(hào),決定量化自適應(yīng)聲源增益和量化固定聲源增益,并將這些增益分別輸出到乘法器209和乘法器210。
固定聲源代碼本208將具有從參數(shù)決定單元213輸出的信號(hào)所確定的形狀的向量,作為固定聲源向量而輸出到乘法器210。
乘法器209將從量化增益生成單元207輸出的量化自適應(yīng)聲源增益與從自適應(yīng)聲源代碼本206輸出的自適應(yīng)聲源向量相乘,并輸出到加法器211。乘法器210將從量化增益生成單元207輸出的量化固定聲源增益與從固定聲源代碼本208輸出的固定聲源向量相乘,并輸出到加法器211。
加法器211分別接收到從乘法器209和乘法器210輸出的與增益相乘后的自適應(yīng)聲源向量和固定聲源向量,將與增益相乘后的自適應(yīng)聲源向量和固定聲源向量相加,并將作為相加結(jié)果的驅(qū)動(dòng)聲源輸出到合成濾波器204和自適應(yīng)聲源代碼本206。另外,自適應(yīng)聲源代碼本206中所輸入的驅(qū)動(dòng)聲源被存儲(chǔ)于緩沖區(qū)。
聽(tīng)覺(jué)加權(quán)單元212對(duì)從加法器205輸出的誤差信號(hào)進(jìn)行聽(tīng)覺(jué)加權(quán),并將其作為編碼失真而輸出到參數(shù)決定單元213。
參數(shù)決定單元213從自適應(yīng)聲源代碼本206中選擇自適應(yīng)聲源延遲,該自適應(yīng)聲源延遲使從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真最小,并將表示選擇結(jié)果的自適應(yīng)聲源延遲代碼(A)輸出到復(fù)用單元214。其中,“自適應(yīng)聲源延遲”是指取出自適應(yīng)聲源向量的取出位置,其詳細(xì)說(shuō)明將后述。另外,參數(shù)決定單元213從固定聲源代碼本208中選擇固定聲源向量,該固定聲源向量使從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真最小,并將表示選擇結(jié)果的固定聲源向量代碼(F)輸出到復(fù)用單元214。此外,參數(shù)決定單元213從量化增益生成單元207中選擇量化自適應(yīng)聲源增益和量化固定聲源增益,該量化自適應(yīng)聲源增益和量化固定聲源增益使從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真最小,并將表示選擇結(jié)果的量化聲源增益代碼(G)輸出到復(fù)用單元214。
復(fù)用單元214接收從LSP量化單元203輸出的量化LSP代碼(L)與從參數(shù)決定單元213輸出的自適應(yīng)聲源延遲代碼(A)、固定聲源向量代碼(F)和量化聲源增益代碼(G),并將這些信息復(fù)用后,作為編碼信息而輸出。其中,假設(shè)第一編碼單元102輸出的編碼信息為第一編碼信息,第二編碼單元108輸出的編碼信息為第二編碼信息。
接著,以假設(shè)分配給量化LSP代碼(L)的比特?cái)?shù)為“8”而對(duì)LSP進(jìn)行向量量化的情況為例,簡(jiǎn)單地說(shuō)明LSP量化單元203決定量化LSP的處理。
LSP量化單元203具有LSP代碼本,該LSP代碼本中存儲(chǔ)預(yù)先創(chuàng)建的256種LSP代碼向量lsp(l)(i)。其中,l是附加在LSP代碼向量的索引,取0~255的值。另外,LSP代碼向量lsp(l)(i)為N維的向量,i取0~N-1的值。LSP量化單元203接收從LSP分析單元202輸出的LSPα(i)。其中,LSPα(i)為N維的向量,i取0~N-1的值。
接著,LSP量化單元203通過(guò)式(3)求LSPα(i)與LSP代碼向量lsp(l)(i)之間的均方誤差er。
···式(3) 接著,LSP量化單元203對(duì)每個(gè)l求均方誤差er,并決定使均方誤差er最小的l的值(lmin)。再者,LSP量化單元203將lmin作為量化LSP代碼(L)而輸出到復(fù)用單元214,并且將lsp(lmin)(i)作為量化LSP而輸出到合成濾波器204。
如此,由LSP量化單元203求出的lsp(lmin)(i)就是“量化LSP”。
接著,使用圖3說(shuō)明參數(shù)決定單元213決定自適應(yīng)聲源延遲的處理。
在該圖3中,緩沖區(qū)301為自適應(yīng)聲源代碼本206中所具備的緩沖區(qū),位置302為自適應(yīng)聲源向量的取出位置,向量303為取出后的自適應(yīng)聲源向量。另外,數(shù)值“41”和“296”與使取出位置302移動(dòng)的范圍的下限和上限對(duì)應(yīng)。
在假設(shè)分配給表示自適應(yīng)聲源延遲的代碼(A)的比特?cái)?shù)為“8”時(shí),使取出位置302移動(dòng)的范圍可設(shè)定為“256”的長(zhǎng)度的范圍(例如,41~296)。另外,也可任意地設(shè)定使取出位置302移動(dòng)的范圍。
參數(shù)決定單元213使取出位置302在所設(shè)定的范圍內(nèi)移動(dòng),并將取出位置302依序指示給自適應(yīng)聲源代碼本206。接著,自適應(yīng)聲源代碼本206使用參數(shù)決定單元213所指示的取出位置302,取出相當(dāng)于幀長(zhǎng)度的自適應(yīng)聲源向量303,并將取出后的自適應(yīng)聲源向量輸出到乘法器209。接著,參數(shù)決定單元213在所有的取出位置302取出自適應(yīng)聲源向量303時(shí),求從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真,并決定使編碼失真最小的取出位置302。
如此,由參數(shù)決定單元213求出的緩沖區(qū)的取出位置302就是“自適應(yīng)聲源延遲”。
接著,使用圖4說(shuō)明參數(shù)決定單元213決定固定聲源向量的處理。另外,其中,以假設(shè)分配給固定聲源向量代碼(F)的比特?cái)?shù)為“12”的情況為例進(jìn)行說(shuō)明。
在圖4中,音軌401、音軌402和音軌403分別生成一個(gè)單位脈沖(振幅值為1)。另外,乘法器404、乘法器405和乘法器406分別對(duì)在音軌401~403被生成的單位脈沖附加極性。加法器407為將所生成的三個(gè)單位脈沖進(jìn)行相加的加法器,向量408為由三個(gè)單位脈沖構(gòu)成的“固定聲源向量”。
能夠生成單位脈沖的位置因各個(gè)音軌而不同,在圖4中,各個(gè)音軌的結(jié)構(gòu)分別為音軌401在{0,3,6,9,12,15,18,21}的八處中的一處、音軌402在{1,4,7,10,13,16,19,22}的八處中的一處、音軌403在{2,5,8,11,14,17,20,23}的八處中的一處,建立一個(gè)單位脈沖。
接著,所生成的單位脈沖分別被乘法器404~406附加極性,通過(guò)加法器407使三個(gè)單位脈沖相加,從而作為相加結(jié)果的固定聲源向量408被構(gòu)成。
在該例子中,按各個(gè)單位脈沖有8種位置,有正和負(fù)的兩種極性,所以位置信息3比特以及極性信息1比特用于表現(xiàn)各個(gè)單位脈沖。因此,合計(jì)成12比特的固定聲源代碼本。參數(shù)決定單元213使三個(gè)單位脈沖的生成位置和極性移動(dòng),并將生成位置和極性依序指示給固定聲源代碼本208。接著,固定聲源代碼本208使用參數(shù)決定單元213所指示的生成位置和極性而構(gòu)成固定聲源向量408,并將構(gòu)成后的固定聲源向量408輸出到乘法器210。接著,參數(shù)決定單元213對(duì)生成位置和極性的所有組合,求從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真,并決定使編碼失真最小的生成裝置和極性的組合。接著,參數(shù)決定單元213將固定聲源向量代碼(F)輸出到復(fù)用單元214,該固定聲源向量代碼(F)表示使編碼失真最小的生成位置和極性的組合。
接著,以假設(shè)分配給量化聲源增益代碼(G)的比特?cái)?shù)為“8”的情況為例,簡(jiǎn)單地說(shuō)明參數(shù)決定單元213決定由量化增益生成單元207生成的量化自適應(yīng)聲源增益與固定聲源增益的處理。量化增益生成單元207具有聲源增益代碼本,該聲源增益代碼本中存儲(chǔ)預(yù)先創(chuàng)建的256種聲源增益代碼向量gain(k)(i)。其中,k是附加在聲源增益代碼向量的索引,取0~255的值。另外,聲源增益代碼向量gain(k)(i)為二維的向量,i取0~1的值。參數(shù)決定單元213將從0至255的k的值,依序指示給量化增益生成單元207。量化增益生成單元207使用參數(shù)決定單元213所指示的k,從聲源增益代碼本中選擇聲源增益代碼向量gain(k)(i),將gain(k)(0)作為量化自適應(yīng)聲源增益而輸出到乘法器209,并且將gain(k)(1)作為量化固定聲源增益而輸出到乘法器210。
如此,由量化增益生成單元207求出的gain(k)(0)就是“量化自適應(yīng)聲源增益”,gain(k)(1)則是“量化固定聲源增益”。
參數(shù)決定單元213對(duì)所有的k求從聽(tīng)覺(jué)加權(quán)單元212輸出的編碼失真,并決定使編碼失真最小的k的值(kmin)。接著,參數(shù)決定單元213將kmin作為量化聲源增益代碼(G)而輸出到復(fù)用單元214。
接著,使用圖5的方框圖說(shuō)明第一解碼單元103、第一解碼單元152以及第二解碼單元153的內(nèi)部結(jié)構(gòu)。另外,這些解碼單元的內(nèi)部結(jié)構(gòu)是相同的。
第一編碼信息和第二編碼信息的其中一方的編碼信息被輸出到復(fù)用分離單元501。所輸入的編碼信息被復(fù)用分離單元501分離為個(gè)別的代碼(L、A、G和F)。分離后的量化LSP符號(hào)(L)被輸出到LSP解碼單元502,分離后的自適應(yīng)聲源延遲代碼(A)被輸出到自適應(yīng)聲源代碼本505,分離后的量化聲源增益代碼(G)被輸出到量化增益生成單元506,分離后的固定聲源向量代碼(F)被輸出到固定聲源代碼本507。
LSP解碼單元502從復(fù)用分離單元501所輸出的量化LSP代碼(L)中解碼量化LSP,并將解碼后的量化LSP輸出到合成濾波器503。
自適應(yīng)聲源代碼本505從緩沖區(qū)中取出在復(fù)用分離單元501所輸出的自適應(yīng)聲源延遲代碼(A)所指定的取出位置開(kāi)始相當(dāng)于一個(gè)幀的樣本,并將取出后的向量作為自適應(yīng)聲源向量而輸出到乘法器508。另外,自適應(yīng)聲源代碼本505每當(dāng)接收到從加法器510輸出的驅(qū)動(dòng)聲源時(shí),進(jìn)行緩沖區(qū)的更新。
量化增益生成單元506對(duì)從復(fù)用分離單元501輸出的量化聲源增益代碼(G)所指定的量化自適應(yīng)聲源增益和量化固定聲源增益進(jìn)行解碼,并將量化自適應(yīng)聲源增益輸出到乘法器508,將量化固定聲源增益輸出到乘法器509。
固定聲源代碼本507生成從復(fù)用分離單元501輸出的固定聲源向量代碼(F)所指定的固定聲源向量,并將其輸出到乘法器509。
乘法器508將自適應(yīng)聲源向量與量化自適應(yīng)聲源增益相乘,并輸出到加法器510。乘法器509將固定聲源向量與量化固定聲源增益相乘,并輸出到加法器510。
加法器510將從乘法器508和509輸出的、與增益相乘后的自適應(yīng)聲源向量和固定聲源向量相加,從而生成驅(qū)動(dòng)聲源,并將驅(qū)動(dòng)聲源輸出到合成濾波器503以及自適應(yīng)聲源代碼本505。另外,自適應(yīng)聲源代碼本505中所輸入的驅(qū)動(dòng)聲源被存儲(chǔ)于緩沖區(qū)。
合成濾波器503使用從加法器510輸出的驅(qū)動(dòng)聲源與由LSP解碼單元502進(jìn)行了解碼的濾波系數(shù),進(jìn)行濾波合成,并將合成信號(hào)輸出到后處理單元504。
后處理單元504對(duì)從合成濾波器503輸出的合成信號(hào)進(jìn)行改善語(yǔ)音的主觀質(zhì)量的處理,例如共振峰增強(qiáng)或音調(diào)增強(qiáng)等的處理,或者進(jìn)行改善靜態(tài)噪聲的主觀質(zhì)量的處理等,并將其作為解碼信號(hào)而輸出。其中,假設(shè)第一解碼單元103以及第一解碼單元152輸出的解碼信號(hào)為第一解碼信號(hào),第二解碼單元153輸出的解碼信號(hào)為第二解碼信號(hào)。接著,使用圖6的方框圖說(shuō)明調(diào)整單元105以及調(diào)整單元155的內(nèi)部結(jié)構(gòu)。
存儲(chǔ)單元603存儲(chǔ)通過(guò)后述的學(xué)習(xí)方法而預(yù)先求得的調(diào)整用脈沖響應(yīng)h(i)。
第一解碼信號(hào)被輸入到存儲(chǔ)單元601。以下,將第一解碼信號(hào)表示為y(i)。第一解碼信號(hào)y(i)為N維的向量,i取n~n+N-1的值。其中,N相當(dāng)于幀的長(zhǎng)度。另外,n是位于各個(gè)幀的開(kāi)頭的樣本,相當(dāng)于N的整數(shù)倍。
存儲(chǔ)單元601具備緩沖區(qū),該緩沖區(qū)用于存儲(chǔ)以前從頻率變換單元104和154輸出的第一解碼信號(hào)。以下,將存儲(chǔ)單元601中所具備的緩沖區(qū)表示為ybuf(i)。緩沖區(qū)ybuf(i)是長(zhǎng)度N+W-1的緩沖區(qū),i取0~N+W-2的值。其中,W相當(dāng)于卷積單元602進(jìn)行卷積時(shí)的窗的長(zhǎng)度。存儲(chǔ)單元601根據(jù)式(4),使用所輸入的第一解碼信號(hào)y(i)進(jìn)行緩沖區(qū)的更新。
ybuf(i)=y(tǒng)buf(i+N)(i=(0,…,W-2)···式(4) ybuf(i+W-1)=y(tǒng)(i+n)(i=0,…,N-1) 通過(guò)根據(jù)式(4)的更新,在緩沖區(qū)ybuf(0)到y(tǒng)buf(W-2)存儲(chǔ)更新前的緩沖區(qū)的一部分ybuf(N)到y(tǒng)buf(N+W-2),在緩沖區(qū)ybuf(W-1)到y(tǒng)buf(N+W-2)存儲(chǔ)所輸入的第一解碼信號(hào)y(n)~y(n+N-1)。接著,存儲(chǔ)單元601將更新后的緩沖區(qū)ybuf(i)均輸出到卷積單元602。
卷積單元602從存儲(chǔ)單元601接收緩沖區(qū)ybuf(i),從存儲(chǔ)單元603接收調(diào)整用脈沖響應(yīng)h(i)。調(diào)整用脈沖響應(yīng)h(i)為W維的向量,i取0~W-1的值。接著,卷積單元602通過(guò)式(5)的卷積,進(jìn)行第一解碼信號(hào)的調(diào)整,從而求調(diào)整后的第一解碼信號(hào)。
···式(5) 如此,通過(guò)將緩沖區(qū)ybuf(i)到y(tǒng)buf(i+W-1)與調(diào)整用脈沖響應(yīng)h(0)~h(W-1)進(jìn)行卷積,能夠求調(diào)整后的第一解碼信號(hào)ya(n-D+i)。調(diào)整用脈沖響應(yīng)h(i)已學(xué)習(xí)了以通過(guò)進(jìn)行調(diào)整而使調(diào)整后的第一解碼信號(hào)與輸入信號(hào)之間的誤差小。其中,求出的調(diào)整后的第一解碼信號(hào)是從ya(n-D)到y(tǒng)a(n-D+N-1)的信號(hào),與輸入到存儲(chǔ)單元601中的第一解碼信號(hào)y(n)~y(n+N-1)相比,在時(shí)間(樣本數(shù))上產(chǎn)生D的延遲。接著,卷積單元602輸出求出的第一解碼信號(hào)。
接著,說(shuō)明通過(guò)學(xué)習(xí)預(yù)先求調(diào)整用脈沖響應(yīng)h(i)的方法。首先,準(zhǔn)備學(xué)習(xí)用的語(yǔ)音和音頻信號(hào),而將其輸入到編碼裝置100。其中,假設(shè)學(xué)習(xí)用的語(yǔ)音和音頻信號(hào)為x(i)。接著,對(duì)學(xué)習(xí)用的語(yǔ)音和音頻信號(hào)進(jìn)行編碼和解碼,將從頻率變化單元104輸出的第一解碼信號(hào)y(i)按各個(gè)幀輸入到調(diào)整單元105。接著,在存儲(chǔ)單元601中,對(duì)各個(gè)幀進(jìn)行根據(jù)式(4)的緩沖區(qū)的更新。將緩沖區(qū)中所存儲(chǔ)的第一解碼信號(hào)與未知的調(diào)整用脈沖響應(yīng)h(i)進(jìn)行卷積的信號(hào)以及學(xué)習(xí)用的語(yǔ)音和音頻信號(hào)x(i)之間的、以幀為單位的均方誤差E(n)由式(6)表示。
···式(6) 其中,N相當(dāng)于幀的長(zhǎng)度。另外,n是位于各個(gè)幀的開(kāi)頭的樣本,為N的整數(shù)倍。此外,W相當(dāng)于進(jìn)行卷積時(shí)的窗的長(zhǎng)度。
在幀的總數(shù)為R時(shí),各個(gè)幀的均方誤差E(n)的總和Ea由式(7)表示。
···式(7) 其中,緩沖區(qū)ybufk(i)為幀k中的緩沖區(qū)ybuf(i)。緩沖區(qū)ybuf(i)按各個(gè)幀進(jìn)行更新,所以緩沖區(qū)的內(nèi)容因各個(gè)幀而不同。另外,假設(shè)x(-D)~x(-1)的值均為“0”。此外,假設(shè)從緩沖區(qū)ybuf(0)至ybuf(n+W-2)的初始值均為“0”。
為了求調(diào)整用脈沖響應(yīng)h(i),求使式(7)的均方誤差的總和Ea最小的h(i)。也就是說(shuō),對(duì)式(7)中的所有h(J),求滿足δEa/δh(j)的h(j)。式(8)為能夠從δEa/δh(j)=0導(dǎo)出的聯(lián)立方程式。通過(guò)求滿足式(8)的聯(lián)立方程式的h(j),能夠求已被學(xué)習(xí)的調(diào)整用脈沖響應(yīng)h(i)。
···式(8) 接著,通過(guò)式(9)定義W維的向量V以及W維的向量H。
···式(9) 另外,通過(guò)式(10)定義W×W的矩陣Y后,式(8)能夠由式(11)表示。
···式(10) V=Y(jié)·H ···式(11) 因此,為了求調(diào)整用脈沖響應(yīng)h(i),通過(guò)式(12)求向量H。
H=Y(jié)-1·V ···式(12) 如此,使用學(xué)習(xí)用的語(yǔ)音和音頻信號(hào)進(jìn)行學(xué)習(xí),能夠求調(diào)整用脈沖響應(yīng)h(i)。已學(xué)習(xí)了調(diào)整用脈沖響應(yīng)h(i),以通過(guò)對(duì)第一解碼信號(hào)進(jìn)行調(diào)整而使調(diào)整后的第一解碼信號(hào)與輸入信號(hào)之間的均方誤差小。在調(diào)整單元105中,通過(guò)以上的方法而求出的調(diào)整用脈沖響應(yīng)h(i)與從頻率變換單元104輸出的第一解碼信號(hào)進(jìn)行卷積,抵消編碼裝置100固有的特性,能夠使第一解碼信號(hào)與輸入信號(hào)之間的均方誤差更小。
接著,說(shuō)明延遲單元106使輸入信號(hào)延遲并輸出的處理。延遲單元106將所輸入的語(yǔ)音和音頻信號(hào)存儲(chǔ)于緩沖區(qū)。接著,延遲單元106從緩沖區(qū)提取語(yǔ)音和音頻信號(hào)并將其作為輸入信號(hào)而輸出到加法器107,以使其與從調(diào)整單元105輸出的第一解碼信號(hào)在時(shí)間上取得同步。具體而言,在所輸入的語(yǔ)音和音頻信號(hào)為x(n)~x(n+N-1)時(shí),從緩沖區(qū)提取在時(shí)間(樣本數(shù))上產(chǎn)生D的延遲的信號(hào),并將提取后的信號(hào)x(n-D)~x(n-D+N-1)作為輸入信號(hào)而輸出到加法器107。
另外,在本實(shí)施方式中,以編碼裝置100具有兩個(gè)編碼單元的情況為例進(jìn)行了說(shuō)明,但編碼單元的個(gè)數(shù)不限于此,也可具有三個(gè)以上的編碼單元。
另外,在本實(shí)施方式中,以解碼裝置150具有兩個(gè)解碼單元的情況為例進(jìn)行了說(shuō)明,但解碼單元的個(gè)數(shù)不限于此,也可具有三個(gè)以上的解碼單元。
此外,在本實(shí)施方式中,以用脈沖形成固定聲源代碼本208所生成的固定聲源向量的情況為例進(jìn)行了說(shuō)明,但本發(fā)明也可適用于形成固定聲源向量的脈沖為擴(kuò)頻脈沖的情況,能夠獲得與本實(shí)施方式相同的作用和效果。在此,擴(kuò)頻脈沖不是指單位脈沖,而是指在連著幾個(gè)樣本上都具有特定形狀的脈沖狀的波形。
另外,在本實(shí)施方式中,對(duì)編碼單元和解碼單元是CELP類型的語(yǔ)音和音頻編碼和解碼方法的情況進(jìn)行了說(shuō)明,但本發(fā)明也可適用于編碼單元和解碼單元是CELP類型以外的語(yǔ)音和音頻編碼和解碼方法(例如,脈沖代碼調(diào)制、預(yù)測(cè)編碼、向量量化和聲碼器)的情況,能夠獲得與本實(shí)施方式相同的作用和效果。此外,本發(fā)明也可適用于語(yǔ)音和音頻編碼和解碼方法因各個(gè)編碼單元和解碼單元而不同的情況,能夠獲得與本實(shí)施方式相同的作用和效果。
(實(shí)施方式2) 圖7是表示本發(fā)明實(shí)施方式2的語(yǔ)音和音頻發(fā)送裝置的結(jié)構(gòu)的方框圖,該裝置包含在上述的實(shí)施方式1中所說(shuō)明的編碼裝置。
語(yǔ)音和音頻信號(hào)701被輸入裝置702變換為電信號(hào),并輸出到A/D變換裝置703。A/D變換裝置703將從輸入裝置702輸出的(模擬)信號(hào)變換為數(shù)字信號(hào),并輸出到語(yǔ)音和音頻編碼裝置704。語(yǔ)音和音頻編碼裝置704裝載圖1所示的編碼裝置100,對(duì)從A/D變換裝置703輸出的數(shù)字語(yǔ)音和音頻信號(hào)進(jìn)行編碼,并將編碼信息輸出到RF調(diào)制裝置705。RF調(diào)制裝置705將從語(yǔ)音和音頻編碼裝置704輸出的編碼信息變換為用于裝載在電波等的傳播媒體而送出的信號(hào),并輸出到發(fā)送天線706。發(fā)送天線706將從RF調(diào)制裝置705輸出的輸出信號(hào)作為電波(RF信號(hào))而送出。另外,在圖中的RF信號(hào)707表示從發(fā)送天線706送出的電波(RF信號(hào))。
圖8是表示本發(fā)明實(shí)施方式2的語(yǔ)音和音頻接收裝置的結(jié)構(gòu)的方框圖,該裝置包含在上述的實(shí)施方式1中所說(shuō)明的解碼裝置。
RF信號(hào)801被接收天線802接收并輸出到RF解調(diào)裝置803。另外,在圖中的RF信號(hào)801表示接收天線802所接收的電波,而若在傳播路徑中沒(méi)有信號(hào)的衰減或噪聲的重疊,就完全與RF信號(hào)707相同。
RF解調(diào)裝置803從接收天線802所輸出的RF信號(hào)中解調(diào)編碼信息,并將其輸出到語(yǔ)音和音頻解碼裝置804。語(yǔ)音和音頻解碼裝置804裝載圖1所示的解碼裝置150,從RF解調(diào)裝置803輸出的編碼信息中解碼語(yǔ)音和音頻信號(hào),并將其輸出到D/A變換裝置805。D/A變換裝置805將從語(yǔ)音和音頻解碼裝置804輸出的數(shù)字語(yǔ)音和音頻信號(hào)變換為模擬的電信號(hào),并輸出到輸出裝置806。輸出裝置806將電信號(hào)變換為空氣振動(dòng)并作為聲波而輸出,以使人類的耳朵能夠聽(tīng)見(jiàn)。另外,在圖中,參照標(biāo)號(hào)807表示所輸出的聲波。
通過(guò)在無(wú)線通信系統(tǒng)中的基站裝置和通信終端裝置具備如上所述的語(yǔ)音和音頻信號(hào)發(fā)送裝置以及語(yǔ)音和音頻信號(hào)接收裝置,能夠獲得高質(zhì)量的輸出信號(hào)。
如此,根據(jù)本實(shí)施方式,將本發(fā)明的編碼裝置以及解碼裝置能夠裝載于語(yǔ)音和音頻信號(hào)發(fā)送裝置以及語(yǔ)音和音頻信號(hào)接收裝置。
本發(fā)明的編碼裝置以及解碼裝置不限于上述的實(shí)施方式1和2,也可通過(guò)各種變更而實(shí)施。
本發(fā)明的編碼裝置和解碼裝置也可裝載于移動(dòng)通信系統(tǒng)中的移動(dòng)終端裝置和基站裝置,由此能夠提供具有與上述同樣的作用效果的移動(dòng)終端裝置和基站裝置。
另外,其中,舉例說(shuō)明了以硬件構(gòu)成本發(fā)明的情況,但本發(fā)明也可通過(guò)軟件來(lái)實(shí)現(xiàn)。
本說(shuō)明書(shū)基于在2005年5月11日申請(qǐng)的日本專利申請(qǐng)第2005-138151號(hào)。其內(nèi)容全部包含于此。
工業(yè)實(shí)用性 本發(fā)明具有即使存在編碼裝置固有的特性,也可獲得質(zhì)量佳的解碼語(yǔ)音信號(hào)的效果,并適合于對(duì)語(yǔ)音和音頻信號(hào)進(jìn)行編碼而傳輸?shù)耐ㄐ畔到y(tǒng)中的編碼裝置和解碼裝置。
權(quán)利要求
1.一種編碼裝置,對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼,該裝置包括
第一編碼單元,對(duì)所述輸入信號(hào)進(jìn)行編碼而生成第一編碼信息;
第一解碼單元,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);
調(diào)整單元,通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述第一解碼信號(hào)的調(diào)整;
延遲單元,使所述輸入信號(hào)延遲,以使其與調(diào)整后的第一解碼信號(hào)同步;
加法單元,求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào);以及
第二編碼單元,對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
2.一種編碼裝置,對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼,該裝置包括
頻率變換單元,通過(guò)對(duì)所述輸入信號(hào)進(jìn)行下采樣,從而進(jìn)行采樣頻率變換;
第一編碼單元,對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼而生成第一編碼信息;
第一解碼單元,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);
頻率變換單元,通過(guò)對(duì)所述第一解碼信號(hào)進(jìn)行上采樣,從而進(jìn)行采樣頻率變換;
調(diào)整單元,通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述上采樣后的第一解碼信號(hào)的調(diào)整;
延遲單元,使所述輸入信號(hào)延遲,以使其與調(diào)整后的第一解碼信號(hào)同步;
加法單元,求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào);以及
第二編碼單元,對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
3.如權(quán)利要求1所述的編碼裝置,其中,
調(diào)整用的脈沖響應(yīng)通過(guò)學(xué)習(xí)而求得。
4.一種解碼裝置,對(duì)權(quán)利要求1所述的編碼裝置所輸出的編碼信息進(jìn)行解碼,該解碼裝置包括
第一解碼單元,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);
第二解碼單元,對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào);
調(diào)整單元,通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述第一解碼信號(hào)的調(diào)整;
加法單元,將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加;以及
信號(hào)選擇單元,選擇所述第一解碼單元所生成的第一解碼信號(hào)或者所述加法單元的相加結(jié)果中的一個(gè)并輸出。
5.一種解碼裝置,對(duì)權(quán)利要求2所述的編碼裝置輸出的編碼信息進(jìn)行解碼,該解碼裝置包括
第一解碼單元,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);
第二解碼單元,對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào);
頻率變換單元,通過(guò)對(duì)所述第一解碼信號(hào)進(jìn)行上采樣,從而進(jìn)行采樣頻率變換;
調(diào)整單元,通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述上采樣后的第一解碼信號(hào)的調(diào)整;
加法單元,將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加;以及
信號(hào)選擇單元,選擇所述第一解碼單元所生成的第一解碼信號(hào)或所述加法單元的相加結(jié)果中的一個(gè)并輸出。
6.如權(quán)利要求4所述的解碼裝置,其中,
調(diào)整用的脈沖響應(yīng)通過(guò)學(xué)習(xí)而求得。
7.一種基站裝置,包括權(quán)利要求1所述的編碼裝置。
8.一種基站裝置,包括權(quán)利要求4所述的解碼裝置。
9.一種通信終端裝置,包括權(quán)利要求1所述的編碼裝置。
10.一種通信終端裝置,包括權(quán)利要求4所述的解碼裝置。
11.一種編碼方法,對(duì)輸入信號(hào)進(jìn)行可擴(kuò)展編碼,該方法包括
第一編碼步驟,對(duì)所述輸入信號(hào)進(jìn)行編碼而生成第一編碼信息;
第一解碼步驟,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);
調(diào)整步驟,通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述第一解碼信號(hào)的調(diào)整;
延遲步驟,使所述輸入信號(hào)延遲,以使其與調(diào)整后的第一解碼信號(hào)同步;
加法步驟,求延遲處理后的輸入信號(hào)與所述調(diào)整后的第一解碼信號(hào)之間的差分即殘差信號(hào);以及
第二編碼步驟,對(duì)所述殘差信號(hào)進(jìn)行編碼而生成第二編碼信息。
12.一種解碼方法,對(duì)通過(guò)權(quán)利要求11所述的編碼方法編碼的編碼信息進(jìn)行解碼,該解碼方法包括
第一解碼步驟,對(duì)所述第一編碼信息進(jìn)行解碼而生成第一解碼信號(hào);
第二解碼步驟,對(duì)所述第二編碼信息進(jìn)行解碼而生成第二解碼信號(hào);
調(diào)整步驟,通過(guò)將所述第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,從而進(jìn)行所述第一解碼信號(hào)的調(diào)整;
加法步驟,將調(diào)整后的第一解碼信號(hào)與所述第二解碼信號(hào)相加;以及
信號(hào)選擇步驟,選擇所述第一解碼步驟中所生成的第一解碼信號(hào)或者所述加法步驟中的相加結(jié)果中的一個(gè)并輸出。
全文摘要
本發(fā)明提供一種在可擴(kuò)展編碼方式中,抵消作為解碼信號(hào)的質(zhì)量惡化原因的編碼裝置固有的特性,能夠?qū)崿F(xiàn)提高所生成的解碼信號(hào)的質(zhì)量的編碼裝置。在該編碼裝置中,第一編碼單元(102)對(duì)下采樣后的輸入信號(hào)進(jìn)行編碼。第一解碼單元(103)對(duì)從第一編碼單元(102)輸出的第一編碼信息進(jìn)行解碼。調(diào)整單元(105)通過(guò)將上采樣后的第一解碼信號(hào)與調(diào)整用的脈沖響應(yīng)進(jìn)行卷積,調(diào)整上采樣后的第一解碼信號(hào)。加法器(107)使調(diào)整后的第一解碼信號(hào)的極性反轉(zhuǎn)后,與輸入信號(hào)相加。第二編碼單元(108)對(duì)從加法器(107)輸出的殘差信號(hào)進(jìn)行編碼。復(fù)用單元(109)將從第一編碼單元(102)輸出的第一編碼信息與從第二編碼單元(108)輸出的第二編碼信息復(fù)用并輸出。
文檔編號(hào)G10L19/14GK101176148SQ20068001618
公開(kāi)日2008年5月7日 申請(qǐng)日期2006年4月28日 優(yōu)先權(quán)日2005年5月11日
發(fā)明者佐藤薰, 森井利幸, 山梨智史 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社