專利名稱:語音編碼裝置以及語音編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音編碼裝置以及語音編碼方法。
技術(shù)背景為了有效地利用移動通信系統(tǒng)中的電波資源等,需要以低比特率壓縮語 音信號。另一方面,又希望提高通話語音的質(zhì)量以及實現(xiàn)較高臨場感的通話服務(wù)。 為了實現(xiàn)該目的,不僅需要語音信號的高質(zhì)量,而且需要能夠?qū)φZ音信號以 外的頻帶更寬的音頻信號等信號高質(zhì)量地進行編碼。對于這樣相互矛盾的需求,將多個編碼技術(shù)分層次地結(jié)合起來的研究將 很有前途。具體而言,為將第一層和第二層分層次地組合的研究,所述第一 層,以適合語音信號的模式用低比特率對輸入信號進行編碼,所述第二層, 以也適合語音以外的信號的模式對輸入信號與第一層解碼信號的差分信號進 行編碼。這種分層結(jié)構(gòu)的編碼方式具有,即使廢棄已編碼的比特流的一部分 也能夠從剩余的信息獲得解碼信號的特征(可擴展性),因此被稱為可擴展編 碼。由可擴展編碼的這種特性,還可以靈活地應(yīng)對比特率彼此不同的網(wǎng)絡(luò)之 間的通信。此外,可以說這種特征適合于通過IP協(xié)議將多種網(wǎng)絡(luò)合并的將來 的網(wǎng)絡(luò)環(huán)境。作為以往的可擴展編碼,有使用由MPEG-4(Moving Picture Experts Group phase-4運動圖像專家組格式-4)標準化了的技術(shù)的編碼(例如參照非專利文獻 1)。在非專利文獻1記載的可擴展編碼中,在第一層使用適合語音信號的 CELP(Code Excited Linear Prediction:碼激勵線性預(yù)測),在第二層使用作為 對從原有信號中減去第一層解碼信號所獲得的殘差信號進行編碼的 AAC(Advanced Audio Coder:高級音頻編碼)或TwinVQ(Transform Domain \Veighted Interleave Vector Quantization:傳輸i或加4又交織矢量量孑匕)這才羊的變換 編碼。另一方面,在變換編碼中,存在對頻語高效率地進行編碼的技術(shù)(例如參照專利文獻l)。在專利文獻1記載的技術(shù)中,將語音信號的頻帶劃分為低頻 域和高頻域兩個子帶,將低頻域的頻譜復(fù)制到高頻域,并將復(fù)制后的頻鐠進 行變形而使其成為高頻域的頻譜。此時,對變形信息以較少的比特數(shù)進行編 碼,從而能夠?qū)崿F(xiàn)低比特率。非專利文獻1:三木弼一編著,MPEG-4 ^全"C ,初版,(株)工業(yè)調(diào)查會, 1998年9月30日,pp.126-127專利文獻1:日本專利申請?zhí)乇?001-521648號公報發(fā)明內(nèi)容發(fā)明需要解決的問題一般地,語音信號或音頻信號的頻譜用隨同頻率緩慢地變化的分量(頻譜 包絡(luò))與細微地變化的分量(頻譜細微結(jié)構(gòu))的乘積來表示。作為一個例子,圖 1表示語音信號的頻譜,圖2表示頻譜包絡(luò),圖3表示頻譜細微結(jié)構(gòu)。該頻 譜包絡(luò)(圖2)是使用10階的LPC(Linear Prediction Coding:線性預(yù)測編碼)系 數(shù)計算出的頻譜包絡(luò)。從這些圖可知,頻譜包絡(luò)(圖2)與頻譜細微結(jié)構(gòu)(圖3) 的乘積成為語音信號的頻譜(圖1)。這里,在對低頻域的頻譜進行復(fù)制而使其成為高頻域的頻譜的情況下, 在復(fù)制目的地的高頻域的帶寬寬于復(fù)制源的低頻域的帶寬時,將低頻域的頻 譜復(fù)制到高頻域兩次以上。例如,在從圖1的低頻域(O-FL)將頻譜復(fù)制到高頻 域(FL-FH)的情況下,由于在該例中存在FH=2*FL的關(guān)系,所以需要將低頻 域的頻譜復(fù)制到高頻域兩次。如圖4所示,這樣將低頻域的頻譜復(fù)制到高頻 域多次后,在復(fù)制目的地的頻譜的連接部分產(chǎn)生頻譜的能量的不連續(xù)。發(fā)生 這樣的不連續(xù)的原因在于頻譜包絡(luò)。如圖2所示,在頻譜包絡(luò)中,頻率上升 的同時,能量衰減,所以在頻譜產(chǎn)生斜率。由于存在這樣的頻譜的斜率,在 將低頻域的頻譜復(fù)制到高頻域多次后,發(fā)生頻譜的能量的不連續(xù),語音質(zhì)量 惡化??赏ㄟ^增益調(diào)整對該不連續(xù)進行校正,但是為了通過增益調(diào)整而獲得 充分的效果,需要較多的比特數(shù)。本發(fā)明的目的在于提供,即使在將低頻域的頻譜復(fù)制到高頻域多次的情 況下,也能夠保持頻譜的能量的連續(xù)性,并且防止語音質(zhì)量的惡化的語音編 碼裝置以及語音編碼方法。解決問題的方案本發(fā)明的語音編碼裝置采用的結(jié)構(gòu)包括第一編碼單元,對語音信號的 低頻域的頻譜進行編碼;平整單元,使用所述語音信號的LPC系數(shù),對所述 低頻域的頻鐠進行平整;以及第二編碼單元,使用平整后的低頻域的頻譜, 對所述語音信號的高頻域的頻譜進行編碼。發(fā)明的有益效果根據(jù)本發(fā)明能夠保持頻鐠的能量的連續(xù)性,并且防止語音質(zhì)量的惡化。
圖1是表示語音信號的頻語(以往)的圖;圖2是表示頻譜包絡(luò)(以往)的圖;圖3是表示頻譜細微結(jié)構(gòu)(以往)的圖;圖4是表示將低頻域的頻譜復(fù)制到高頻域多次時的頻譜(以往)的圖;圖5A是本發(fā)明的動作原理的說明圖(低頻域的解碼頻譜);圖5B是本發(fā)明的動作原理的說明圖(通過逆濾波器后的頻譜);圖5C是本發(fā)明的動作原理的說明圖(高頻域的編碼);圖5D是本發(fā)明的動作原理的說明圖(解碼信號的頻譜);圖6是本發(fā)明實施方式1的語音編碼裝置的結(jié)構(gòu)的方框圖;圖7是上述語音編碼裝置的第二層編碼單元的結(jié)構(gòu)的方框圖;圖8是本發(fā)明實施方式1的濾波單元的動作說明圖;圖9是本發(fā)明實施方式1的語音解碼裝置的結(jié)構(gòu)的方框圖;圖io是上述語音解碼裝置的第二層解碼單元的結(jié)構(gòu)的方框圖;圖11是本發(fā)明實施方式2的語音編碼裝置的結(jié)構(gòu)的方框圖;圖12是本發(fā)明實施方式2的語音解碼裝置的結(jié)構(gòu)的方框圖;圖13是本發(fā)明實施方式3的語音編碼裝置的結(jié)構(gòu)的方框圖;圖14是本發(fā)明實施方式3的語音解碼裝置的結(jié)構(gòu)的方框圖;圖15是本發(fā)明實施方式4的語音編碼裝置的結(jié)構(gòu)的方框圖;圖16是本發(fā)明實施方式4的語音解碼裝置的結(jié)構(gòu)的方框圖;圖17是本發(fā)明實施方式5的語音編碼裝置的結(jié)構(gòu)的方框圖;圖18是本發(fā)明實施方式5的語音解碼裝置的結(jié)構(gòu)的方框圖;圖19是本發(fā)明實施方式5的語音編碼裝置的結(jié)構(gòu)的方框圖(變形例1);圖20是本發(fā)明實施方式5的語音編碼裝置的結(jié)構(gòu)的方框圖(變形例2);圖21是本發(fā)明實施方式5的語音解碼裝置的結(jié)構(gòu)的方框圖(變形例1);圖22是本發(fā)明實施方式6的第二層編碼單元的結(jié)構(gòu)的方框圖;圖23是本發(fā)明實施方式6的頻譜變形單元的結(jié)構(gòu)的方框圖;圖24是本發(fā)明實施方式6的第二層解碼單元的結(jié)構(gòu)的方框圖;圖25是本發(fā)明實施方式7的頻語變形單元的結(jié)構(gòu)的方框圖;圖26是本發(fā)明實施方式8的頻譜變形單元的結(jié)構(gòu)的方框圖;圖27是本發(fā)明實施方式9的頻譜變形單元的結(jié)構(gòu)的方框圖;圖28是本發(fā)明實施方式10的第二層編碼單元的結(jié)構(gòu)的方框圖;圖29是本發(fā)明實施方式10的第二層解碼單元的結(jié)構(gòu)的方框圖;圖30是本發(fā)明實施方式11的第二層編碼單元的結(jié)構(gòu)的方框圖;圖31是本發(fā)明實施方式11的第二層解碼單元的結(jié)構(gòu)的方框圖;圖32是本發(fā)明實施方式12的第二層編碼單元的結(jié)構(gòu)的方框圖;以及圖33是本發(fā)明實施方式12的第二層解碼單元的結(jié)構(gòu)的方框圖。
具體實施方式
在本發(fā)明中,在利用低頻域的頻譜,對高頻域進行編碼時,從低頻域的 頻譜中除去頻譜包絡(luò)的影響而使頻譜平整,并使用平整后的頻譜,對高頻域 的頻譜進行編碼。首先,使用圖5A-圖5D說明本發(fā)明的動作原理。在圖5A ~圖5D中,將FL作為閾值頻率,O-FL為低頻域,F(xiàn)L-FH為高 頻域。圖5A表示通過以往的編碼/解碼處理所獲得的低頻域的解碼頻譜,圖5B獲得的頻譜。這樣,使低頻域的解碼頻譜通過具有與頻譜包絡(luò)相反的特性的 逆濾波器,從而使低頻域的頻譜平整。然后,如圖5C所示,將平整后的低頻 域的頻譜復(fù)制到高頻域多次(這里為兩次),對高頻域進行編碼。如圖5B所示, 低頻域的頻譜已經(jīng)被平整,所以在高頻域的編碼中,不會發(fā)生上述那樣的由 頻譜包絡(luò)所引起的頻譜的能量的不連續(xù)。然后,通過對信號頻帶被擴展到 O-FH的頻譜賦予頻語包絡(luò),從而獲得如圖5D所示的解碼信號的頻譜。另外,作為高頻域的編碼方法,能夠使用下述方法,將低頻域的頻譜用 于音調(diào)濾波器的內(nèi)部狀態(tài),并在頻率軸上按從低頻至高頻進行音調(diào)濾波處理來估計頻譜的高頻域。根據(jù)該編碼方法,在高頻域的編碼中,對音調(diào)濾波器 的濾波信息進行編碼即可,從而能夠?qū)崿F(xiàn)低比特率。下面,參照附圖詳細地說明本發(fā)明的實施方式。(實施方式1)在本實施方式中,說明在第一層以及第二層中都進行頻域中的編碼的情 況。此外,在本實施方式中,在進行了低頻域的頻譜的平整后,反復(fù)利用平 整后的頻譜,對高頻域的頻譜進行編碼。圖6表示本發(fā)明實施方式1的語音編碼裝置的結(jié)構(gòu)。在圖6所示的語音編碼裝置100中,LPC分析單元101進行輸入語音信 號的LPC分析,并計算LPC系數(shù)a(i)(B匕NP)。這里,NP表示LPC系數(shù)的 階數(shù),例如選擇10至18。計算出的LPC系數(shù)被輸入到LPC量化單元102。LPC量化單元102進行LPC系數(shù)的量化。LPC量化單元102從量化效率 和穩(wěn)定性判定的觀點,將LPC系數(shù)變換為LSP(Line Spectral Pair:線譜對)參 數(shù)后進行量化。量化后的LPC系數(shù)作為編碼數(shù)據(jù)被輸入到LPC解碼單元103 以及復(fù)用單元109。LPC解碼單元103對量化后的LPC系數(shù)進行解碼而生成解碼LPC系數(shù) aq(i)(lS^NP),并將其輸出到逆濾波單元104。逆濾波單元104使用解碼LPC系數(shù)而構(gòu)成逆濾波器,并使輸入語音信號 通過該逆濾波器,從而使輸入語音信號的頻譜平整。逆濾波器如式(1)或式(2)所示。式(2)為,利用了用于控制平整的程度的共 振抑制系數(shù)丫(0<^<1)時的逆濾波器?!?1) …(2)于是,在將語音信號s(n)輸入到以式(l)表示的逆濾波器時所獲得的輸出 信號e(n),如式(3)所示。<formula>formula see original document page 8</formula> …(3)同樣,在將語音信號s(n)輸入到以式(2)表示的逆濾波器時所獲得的輸出 信號e(n),如式(4)所示。<formula>formula see original document page 9</formula> …(4)因此,通過該逆濾波處理,輸入語音信號的頻譜被平整。另外,在以下 的說明中,將逆濾波單元104的輸出信號(頻譜被平整過的語音信號)稱為預(yù)測 殘差信號。頻域變換單元105對從逆濾波單元104輸出的預(yù)測殘差信號進行頻率分 析,并求殘差頻語作為變換系數(shù)。頻域變換單元105例如使用MDCT(Modified Discrete Cosine TransfoniK變形離散余弦變換)來將時域的信號變換為頻域的 信號。殘差頻譜被輸入到第一層編碼單元106以及第二層編碼單元108。第一層編碼單元106使用TwinVQ等進行殘差頻譜的低頻域的編碼,并 將通過該編碼所獲得的第一層編碼數(shù)據(jù)輸出到第一層解碼單元107以及復(fù)用 單元109。第一層解碼單元107對第一層編碼數(shù)據(jù)進行解碼而生成第一層解碼頻 譜,并將其輸出到第二層編碼單元108。另外,第一層解碼單元107將變換 為時域前的第 一層解碼頻譜輸出。第二層編碼單元108使用由第一層解碼單元107獲得的第一層解碼頻譜, 對殘差頻譜的高頻域進行編碼,并將由該編碼所獲得的第二層編碼數(shù)據(jù)輸出 到復(fù)用單元109。第二層編碼單元108將第一層解碼頻譜用于音調(diào)濾波器的 內(nèi)部狀態(tài),并通過音調(diào)濾波處理而對殘差頻譜的高頻域進行估計。此時,第 二層編碼單元108對殘差頻語的高頻域進行估計,以便不破壞頻譜的諧波結(jié) 構(gòu)。此外,第二層編碼單元108對音調(diào)濾波器的濾波信息進行編碼。進而, 在第二層編碼單元108中,使用其頻譜被平整過的殘差頻譜來對殘差頻譜的 高頻域進行估計。因此,即使通過濾波處理而使頻譜被遞歸地反復(fù)使用,從 而高頻域被估計,也能夠防止頻譜的能量的不連續(xù)的發(fā)生。因此,根據(jù)本實 施方式,能夠以低比特率而獲得高音質(zhì)。另外,在后面敘述第二層編碼單元 108的細節(jié)。復(fù)用單元109將第一層編碼數(shù)據(jù)、第二層編碼數(shù)據(jù)以及LPC系數(shù)編碼數(shù) 據(jù)進行復(fù)用,生成并輸出比特流。接著,說明第二層編碼單元108的細節(jié)。圖7表示第二層編碼單元108 的結(jié)構(gòu)。內(nèi)部狀態(tài)設(shè)定單元1081從第一層解碼單元107輸入第一層解碼頻譜Sl(k)(0Sk<FL)。內(nèi)部狀態(tài)設(shè)定單元1081使用該第一層解碼頻譜來設(shè)定由濾波 單元1082使用的濾波器的內(nèi)部狀態(tài)。音調(diào)系數(shù)設(shè)定單元1084,根據(jù)搜索單元1083的控制,使音調(diào)系數(shù)T在 預(yù)先設(shè)定的搜索范圍Tmin~Tmax中一點一點地改變,同時將其依次地輸出到 濾波單元1082。濾波單元1082基于由內(nèi)部狀態(tài)設(shè)定單元1081設(shè)定的濾波器的內(nèi)部狀態(tài) 和由音調(diào)系數(shù)設(shè)定單元1084輸出的音調(diào)系數(shù)T,進行第 一層解碼頻語的濾波, 并計算殘差頻譜的估計值S2'(k)。在后面敘述該濾波處理的細節(jié)。搜索單元1083計算表示了從頻域變換單元105輸入的殘差頻譜S2(k)(0 KFH)與從濾波單元1082輸入的殘差頻譜的估計值S2'(k)之間的相似性的 參數(shù)、即相似程度。每次由音調(diào)系數(shù)設(shè)定單元1084提供音調(diào)系數(shù)T時進行該 相似程度的計算處理,而且使計算出的相似程度為最大的音調(diào)系數(shù)(最合適的 音調(diào)系數(shù))T,(Tmin-T隨的范圍)被輸出到復(fù)用單元1086。此外,搜索單元1083 將使用該音調(diào)系數(shù)T,而生成的殘差頻譜的估計值S2'(k)輸出到增益編碼單元 1085。增益編碼單元1085基于從頻域變換單元105輸入的殘差頻譜S2(k)((Kk<FH),計算殘差頻譜S2(k)的增益信息。另外,這里,以下述情況為例進行說明,用每個子帶的頻譜能量表示該增益信息,并將頻帶FL眾〈FH劃分為J個子帶。此時、第j個子帶的頻譜能量B(j)用式(5)來表示。在式(5)中,BL(j)表示第j個子帶的最小頻率,BH(j)表示第j個子帶的最大頻率。將這樣求出的殘差頻譜的子帶信息視為殘差頻譜的增益信息。<formula>formula see original document page 10</formula>5)此外,增益編碼單元1085同樣地根據(jù)式(6)計算殘差頻譜的估計值S2'(k)的子帶信息B,(j),并根據(jù)式(7)計算每個子帶的變動量V(j)。<formula>formula see original document page 10</formula>接著,增益編碼單元1085對變動量V(j)進行編碼而求編碼后的變動量 Vq(j),并將該索引輸出到復(fù)用單元1086。復(fù)用單元1086將從搜索單元1083輸入的最合適的音調(diào)系數(shù)T,和從增益 編碼單元1085輸入的變動量V(j)的索引進行復(fù)用,將其作為第二層編碼數(shù)據(jù) 輸出到復(fù)用單元109。接著,說明在濾波單元1082中的濾波處理的細節(jié)。圖8表示濾波單元 1082使用從音調(diào)系數(shù)設(shè)定單元1084輸入的音調(diào)系數(shù)T,生成頻帶FL^c〈FH 的頻鐠的情形。這里,為了方便而將全頻帶((Kk〈FH)的頻i普稱為S(k),并使 用以式(8)表示的濾波函數(shù)。在該式中,T表示由音調(diào)系數(shù)設(shè)定單元1084提供 的音調(diào)系數(shù),而且假設(shè)M-1。第一層解碼頻譜Sl(k)作為濾波器的內(nèi)部狀態(tài)被存儲在S(k)的OSk<FL的 頻帶中。另一方面,通過以下的步驟所求出的殘差頻譜的估計值S2'(k)被存儲 在S(k)FI^k<FH的頻帶中。通過濾波處理,將S2'(k)置換為以式(9)表示的頻譜,該頻譜為將以比k 低T的頻率的頻譜S(k-T)為中心、離開了相當于i的附近的頻譜S(k-T-i)與預(yù) 定的加權(quán)系數(shù)Pi相乘所得的頻譜Pi S(k-T-i)全部相加后所得的頻譜。然后, 從較低的頻率(k-FL)開始,在FL^k<FH的范圍中依次改變k而進行該運算, 從而計算出FI^k<FH中的殘差頻譜的估計值S2'(k)。每次由音調(diào)系數(shù)設(shè)定單元1084提供音調(diào)系數(shù)T時,在FI^k<FH的范圍 中,對S(k)進行清零后進行以上的濾波處理。也就是說,每次音調(diào)系數(shù)T發(fā) 生變化時,計算S(k),并將其輸出到搜索單元1083。這里,在圖8所示的例子中,由于音調(diào)系數(shù)T的大小比頻帶FL-FH小, 所以遞歸地使用低頻域((Kk〈FL)的頻鐠而生成高頻域(FLSk〈FH)的頻譜。由于 低頻域的頻譜如上述那樣被平整,所以即使在通過濾波處理遞歸地使用低頻 域的頻譜而生成高頻域的頻譜的情況下,也不在高頻域的頻譜中產(chǎn)生能量的 不連續(xù)。這樣,根據(jù)本實施方式,能夠防止由于頻譜包絡(luò)的影響而在高頻域產(chǎn)生 頻譜的能量的不連續(xù),并能夠改善語音質(zhì)量。接著,說明本實施方式的語音解碼裝置。圖9表示本發(fā)明實施方式1的 語音解碼裝置的結(jié)構(gòu)。該語音解碼裝置200接收從圖6所示的語音編碼裝置 IOO發(fā)送的比特流。在圖9所示的語音解碼裝置200中,分離單元201將從圖6所示的語音 編碼裝置100接收的比特流分離為第 一層編碼數(shù)據(jù)、第二層編碼數(shù)據(jù)以及LPC 系數(shù),并將第一層編碼數(shù)據(jù)輸出到第一層解碼單元202,將第二層編碼數(shù)據(jù) 輸出到第二層解碼單元203,將LPC系數(shù)輸出到LPC解碼單元204。而且, 分離單元201將層信息(表示比特流中包含哪層的編碼數(shù)據(jù)的信息)輸出到判 定單元205。第一層解碼單元202使用第一層編碼數(shù)據(jù)來進行解碼處理而生成第一層 解碼頻諳,并將其輸出到第二層解碼單元203以及判定單元205。第二層解碼單元203使用第二層編碼數(shù)據(jù)和第一層解碼頻譜,生成第二 層解碼頻譜并輸出到判定單元205。另外,在后面敘述第二層解碼單元203 的細節(jié)。LPC解碼單元204將對LPC系數(shù)編碼數(shù)據(jù)進行解碼所獲得的解碼LPC 系數(shù)輸出到合成濾波單元207。這里,語音編碼裝置100發(fā)送包含第一層編碼數(shù)據(jù)和第二層編碼數(shù)據(jù)雙 方的比特流,但是有時在通信路徑的途中第二層編碼數(shù)據(jù)被丟棄。因此,判 定單元205基于層信息,判定比特流中是否包含第二層編碼數(shù)據(jù)。然后,在 比特流中不包含第二層編碼數(shù)據(jù)時,由于第二層解碼單元203不生成第二層 解碼頻譜,所以判定單元205將第一層解碼頻譜輸出到時域變換單元206。 但是,在該情況下,為了使次數(shù)與包含了第二層編碼數(shù)據(jù)時的解碼頻譜相一 致,判定單元205將第一層解碼頻譜的次數(shù)擴展至FH為止,并使FL-FH的 頻譜為"O"而輸出。另一方面,在比特流中包含第一層編碼數(shù)據(jù)和第二層編碼 數(shù)據(jù)雙方時,判定單元205將第二層解碼頻譜輸出到時域變換單元206。時域變換單元206,將從判定單元205輸入的解碼頻譜變換為時域的信 號而生成解碼殘差信號,并輸出到合成濾波單元207。合成濾波單元207使用從LPC解碼單元204輸入的解碼LPC系數(shù) aq(i)( 1 〈<NP)而構(gòu)成合成濾波器。合成濾波器H(z)如式(10)或式(ll)所示。另外,在式(ll)中>7(0<丫<1)表示 共振抑制系數(shù)。<formula>formula see original document page 13</formula>然后,若將由時域變換單元206提供的解碼殘差信號作為eq(n)輸入到合 成濾波單元207,則在使用以式(10)表示的合成濾波器時,所輸出的解碼信號 Sq(n)如式(12)所示。<formula>formula see original document page 13</formula>'=' …(12) 同樣地,在使用以式(ll)表示的合成濾波器時,解碼信號Sq(n)如式(13)所示,<formula>formula see original document page 13</formula>(13)接著,說明第二層解碼單元203的細節(jié)。圖10表示第二層解碼單元203 的結(jié)構(gòu)。內(nèi)部狀態(tài)設(shè)定單元2031從第一層解碼單元202輸入第一層解碼頻譜。內(nèi) 部狀態(tài)設(shè)定單元2031使用第一層解碼頻譜Sl(k),設(shè)定由濾波單元2033使用 的濾波器的內(nèi)部狀態(tài)。另一方面,分離單元2032從分離單元201輸入第二層編碼數(shù)據(jù)。分離單 元2032將第二層編碼數(shù)據(jù)分離為有關(guān)濾波系數(shù)的信息(最合適的音調(diào)系數(shù)T') 和有關(guān)增益的信息(變動量V(j)的索引),并將有關(guān)濾波系數(shù)的信息輸出到濾波 單元2033,同時將有關(guān)增益的信息輸出到增益解碼單元2034。濾波單元2033基于由內(nèi)部狀態(tài)設(shè)定單元2031設(shè)定的濾波器的內(nèi)部狀態(tài) 和從分離單元2032輸入的音調(diào)系數(shù)T,,進行第一層解碼頻譜Sl(k)的濾波, 并計算殘差頻譜的估計值S2'(k)。在濾波單元2033中,使用式(8)所示的濾波 函數(shù)。增益解碼單元2034對從分離單元2032輸入的增益信息進行解碼,并求 對變動量V(j)進行編碼所獲得的變動量Vq(j)。頻譜調(diào)整單元2035根據(jù)式(14)將從濾波單元2033輸入的解碼頻譜S'(k)與從增益解碼單元2034輸入的已解碼的每個子帶的變動量Vq(j)相乘,從而 對解碼頻語S'(k)的頻帶FI^k<FH中的頻譜形狀進行調(diào)整,并生成調(diào)整后的解 碼頻譜S3(k)。該調(diào)整后的解碼頻譜S3(k)作為第二層解碼頻譜被輸出到判定 單元205。s単"yW《,(y) (5z(y)""/^),/c^//_/) ...(14)這樣,語音解碼裝置200能夠?qū)膱D6所示的語音編碼裝置100發(fā)送的比特流進行解碼。(實施方式2)在本實施方式中,說明在第一層中進行時域中的編碼(例如,CELP編碼) 的情況。而且,在本實施方式中,使用在第一層的編碼處理中求得的解碼LPC 系數(shù)進行第 一層解碼信號的頻譜的平整。圖11表示本發(fā)明實施方式2的語音編碼裝置的結(jié)構(gòu)。在圖11中,對與 實施方式l(圖6)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在圖11所示的語音編碼裝置300中,下采樣單元301對輸入語音信號的 采樣率進行下采樣,并將所期望的采樣率的語音信號輸出到第一層編碼單元 302。第一層編碼單元302對已下采樣為所期望的采樣率的語音信號進行編碼 處理而生成第一層編碼數(shù)據(jù),并將其輸出到第一層解碼單元303以及復(fù)用單 元109。第一層編碼單元302例如使用CELP編碼。在如CELP編碼那樣進行 LPC系數(shù)的編碼處理時,第一層編碼單元302能夠在該編碼處理中生成解碼 LPC系數(shù)。因此,第一層編碼單元302將在編碼處理中生成的第一層解碼LPC 系數(shù)輸出到逆濾波單元304。第一層解碼單元303使用第一層編碼數(shù)據(jù)進行解碼處理而生成第一層解 碼信號,并將其輸出到逆濾波單元304。逆濾波單元304使用從第 一層編碼單元302輸入的第一層解碼LPC系數(shù) 而構(gòu)成逆濾波器,并使第一層解碼信號通過該逆濾波器,從而使第一層解碼 信號的頻譜平整。另外,逆濾波器的細節(jié)與實施方式1相同,所以省略其說 明。而且,在以下的說明中,將逆濾波單元304的輸出信號(頻鐠被平整過的 第 一層解碼信號)稱為第 一層解碼殘差信號。頻域變換單元305對從逆濾波單元304輸出的第一層解碼殘差信號進行 頻率分析而生成第一層解碼頻譜,并將其輸出到第二層編碼單元108。另外,延遲單元306將預(yù)定長度的延遲賦予輸入語音信號。使該延遲的 大小與輸入語音信號通過下采樣單元301、第一層編碼單元302、第一層解碼 單元303、逆濾波單元304以及頻域變換單元305時所產(chǎn)生的時間延遲為相 同值。這樣,根據(jù)本實施方式,由于使用在第 一層的編碼處理中求得的解碼LPC 系數(shù)(第一層解碼LPC系數(shù))進行第一層解碼信號的頻語的平整,所以能夠使 用第一層編碼數(shù)據(jù)的信息,使第一層解碼信號的頻譜平整。因此,根據(jù)本實 施方式,由于不需要LPC系數(shù)所需的編碼比特,所以能夠進行頻譜的平整而 不增加信息量,該LPC系數(shù)為用于使第一層解碼信號的頻譜平整的系數(shù)。接著,說明本實施方式的語音解碼裝置。圖12表示本發(fā)明實施方式2的 語音解碼裝置的結(jié)構(gòu)。該語音解碼裝置400接收從圖11所示的語音編碼裝置 300發(fā)送的比特流。在圖12所示的語音解碼裝置400中,分離單元401將從圖11所示的語 音編碼裝置300接收的比特流分離為第一層編碼數(shù)據(jù)、第二層編碼數(shù)據(jù)以及 LPC系數(shù)編碼數(shù)據(jù),并將第一層編碼數(shù)據(jù)輸出到第一層解碼單元402,將第 二層編碼數(shù)據(jù)輸出到第二層解碼單元405 ,將LPC系數(shù)編碼數(shù)據(jù)輸出到LPC 解碼單元407。而且,分離單元401將層信息(表示比特流中包含哪層的編碼 數(shù)據(jù)的信息)輸出到判定單元413。第一層解碼單元402使用第一層編碼數(shù)據(jù)進行解碼處理而生成第一層解 碼信號,并將其輸出到逆濾波單元403以及上采樣單元410。而且,第一層 解碼單元402將在解碼處理中生成的第一層解碼LPC系數(shù)輸出到逆濾波單元 403。上采樣單元410對第一層解碼信號的采樣率進行上采樣,使其與圖11的 輸入語音信號的采樣率相同并輸出到^(氐通濾波單元411以及判定單元413。低通濾波單元411將通過頻帶設(shè)定為O-FL,僅使上采樣后的頻帶O-FL 的第一層解碼信號通過而生成低頻信號,并將其輸出到加法單元412。逆濾波單元403使用從第一層解碼單元402輸入的第一層解碼LPC系數(shù) 而構(gòu)成逆濾波器,利用第一層解碼信號通過該逆濾波器而生成第一層解碼殘 差信號,并將其輸出到頻域變換單元404。頻域變換單元404對從逆濾波單元403輸出的第一層解碼殘差信號進行 頻率分析而生成第一層解碼頻譜,并將其輸出到第二層解碼單元405。第二層解碼單元405使用第二層編碼數(shù)據(jù)和第一層解碼頻譜,生成第二 層解碼頻譜并輸出到時域變換單元406。另外,第二層解碼單元405的細節(jié) 與實施方式1的第二層解碼單元203(圖9)相同,所以省略其說明。時域變換單元406,將第二層解碼頻語變換為時域的信號而生成第二層 解碼殘差信號,并將其輸出到合成濾波單元408。LPC解碼單元407將對LPC系數(shù)進行解碼所獲得的解碼LPC系數(shù)輸出 到合成濾波單元408。合成濾波器。另外,合成濾波單元408的細節(jié)與實施方式1的合成濾波單元 207(圖9)相同,所以省略其說明。合成濾波單元408與實施方式1相同地生 成第二層合成信號Sq(n),并將其輸出到高通濾波單元409。高通濾波單元409將通過頻帶設(shè)定為FL-FH,僅使頻帶FL-FH的第二層 合成信號通過而生成高頻信號,并將其輸出到加法單元412。加法單元412將低頻信號與高頻信號相加而生成第二層解碼信號,并將其 輸出到判定單元413。判定單元413基于從分離單元401輸入的層信息,判定在比特流中是否 包含第二層編碼數(shù)據(jù),并選擇第一層解碼信號或第二層解碼信號中的任一個 作為解碼信號而輸出。在比特流中不包含第二層編碼數(shù)據(jù)時,判定單元413 輸出第一層解碼信號,在比特流中包含第一層編碼數(shù)據(jù)和第二層編碼數(shù)據(jù)雙 方時,判定單元413輸出第二層解碼信號。另外,低通濾波單元411以及高通濾波單元409被用于減少低頻信號與 高頻信號之間相互造成的影響。因此,在低頻信號與高頻信號之間相互造成 的影響較小時,也可以采用語音解碼裝置400不使用這些濾波器的結(jié)構(gòu)。在 不使用這些濾波器時,由于不需要濾波的運算,所以能夠削減運算量。這樣,語音解碼裝置400能夠?qū)膱D11所示的語音編碼裝置300發(fā)送的 比特流進行解碼。(實施方式3)第 一層音源信號的頻譜,與從輸入語音信號中去除了頻譜包絡(luò)的影響的 預(yù)測殘差信號的頻譜同樣地被平整。因此,在本實施方式中,將在第一層的 編碼處理中求得的第一層激勵信號視為頻譜被平整過的信號(即,實施方式2 中的第 一層解碼殘差信號)來進行處理。圖13表示本發(fā)明實施方式3的語音編碼裝置的結(jié)構(gòu)。在圖13中,對與 實施方式2(圖ll)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。第一層編碼單元501對已下采樣為所期望的采樣率的語音信號進行編碼 處理而生成第一層編碼數(shù)據(jù),并將其輸出到復(fù)用單元109。第一層編碼單元 501例如使用CELP編碼。而且,第一層編碼單元501將在編碼處理中生成的 第一層激勵信號輸出到頻域變換單元502。另外,這里所述的激勵信號是指 輸入到進行CELP編碼的第一層編碼單元501的內(nèi)部的合成濾波器(或聽覺加 權(quán)合成濾波器)的信號,也被稱為驅(qū)動信號。頻域變換單元502對第一層激勵信號進行頻率分析而生成第一層解碼頻 譜,并將其輸出到第二層編碼單元108。另外,使延遲單元503的延遲的大小與輸'入語音信號通過下采樣單元這樣,根據(jù)本實施方式,與實施方式2(圖ll)相比,不需要第一層解碼單 元303以及逆濾波單元304,所以能夠削減運算量。接著,說明本實施方式的語音解碼裝置。圖14表示本發(fā)明實施方式3的 語音解碼裝置的結(jié)構(gòu)。該語音解碼裝置600接收從圖13所示的語音編碼裝置 500發(fā)送的比特流。在圖14中,對與實施方式2(圖12)相同的結(jié)構(gòu)部分賦予 相同的標號,并省略其說明。第一層解碼單元601使用第一層編碼數(shù)據(jù)來進^f亍解碼處理而生成第一層 解碼信號,并將其輸出到上采樣單元410。而且,第一層解碼單元601將在 解碼處理中生成的第一層激勵信號輸出到頻域變換單元602。頻域變換單元602對第一層激勵信號進行頻率分析而生成第一層解碼頻 譜,并將其輸出到第二層解碼單元405。這樣,語音解碼裝置600能夠?qū)膱D13所示的語音編碼裝置500發(fā)送的 比特流進行解碼。(實施方式4)在本實施方式中,使用在第二層求出的第二層解碼LPC系數(shù),使第一層 解碼信號以及輸入語音信號的各個信號的頻譜平整。圖15表示本發(fā)明實施方式4的語音編碼裝置700的結(jié)構(gòu)。在圖15中, 對與實施方式2(圖ll)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。第一層編碼單元701對已下采樣為所期望的采樣率的語音信號進行編碼處理而生成第一層編碼數(shù)據(jù),并將其輸出到第一層解碼單元702以及復(fù)用單 元109。第一層編碼單元701例如使用CELP編碼。第一層解碼單元702使用第一層編碼數(shù)據(jù)進行解碼處理而生成第一層解 碼信號,并將其輸出到上采樣單元703。上采樣單元703對第一層解碼信號的采樣率進行上采樣,使其與輸入語 音信號的采樣率相同,并將其輸出到逆濾波單元704。與逆濾波單元104相同,逆濾波單元704從LPC解碼單元103輸入解碼 LPC系數(shù)。逆濾波單元704使用解碼LPC系數(shù)而構(gòu)成逆濾波器,使上采樣后 的第一層解碼信號通過該逆濾波器,從而使第一層解碼信號的頻譜平整。另 外,在以下的說明中,將逆濾波單元704的輸出信號(頻譜被平整了的第一層 解碼信號)稱為第 一層解碼殘差信號。頻域變換單元705對從逆濾波單元704輸出的第一層解碼殘差信號進行 頻率分析而生成第一層解碼頻譜,并將其輸出到第二層編碼單元108。另外,使延遲單元706的延遲的大小與輸入語音信號通過下采樣單元 301、第一層編碼單元701、第一層解碼單元702、上采樣單元703、逆濾波 單元704以及頻域變換單元705時產(chǎn)生的時間延遲為相同值。接著,說明本實施方式的語音解碼裝置。圖16表示本發(fā)明實施方式4的 語音解碼裝置的結(jié)構(gòu)。該語音解碼裝置800接收從圖15所示的語音編碼裝置 700發(fā)送的比特流。在圖16中,對與實施方式2(圖12)相同的結(jié)構(gòu)部分賦予 相同的標號,并省略其說明。第一層解碼單元801使用第一層編碼數(shù)據(jù)進行解碼處理而生成第一層解 碼信號,并將其輸出到上采樣單元802。上采樣單元802對第一層解碼信號的采樣率進行上采樣,使其與圖15的 輸入語音信號的采樣率相同,并將其輸出到逆濾波單元803以及判定單元 413。與合成濾波單元408相同,逆濾波單元803從LPC解碼單元407輸入解 碼LPC系數(shù)。逆濾波單元803使用解碼LPC系數(shù)而構(gòu)成逆濾波器,使上釆樣 后的第一層解碼信號通過該逆濾波器,從而使第一層解碼信號的頻譜平整, 并將第一層解碼殘差信號輸出到頻域變換單元804。頻域變換單元804對從逆濾波單元803輸出的第一層解碼殘差信號進行 頻率分析而生成第一層解碼頻譜,并將其輸出到第二層解碼單元405。這樣,語音解碼裝置800能夠?qū)膱D15所示的語音編碼裝置700發(fā)送的 比特流進行解碼。這樣,根據(jù)本實施方式,在語音編碼裝置中,使用在第二層求出的第二 層解碼lpc系數(shù),使第一層解碼信號以及輸入語音信號的各個信號的頻譜平 整,所以在語音解碼裝置中,能夠使用與語音編碼裝置共同的lpc系數(shù)來求 第一層解碼頻譜。因此,根據(jù)本實施方式,在語音解碼裝置中,在生成解碼 信號時,不需要進行如實施方式2和3那樣的分離為低頻域和高頻域的處理, 所以不需要低通濾波器以及高通濾波器而使裝置結(jié)構(gòu)簡單,同時能夠削減濾 波處理的運算量。(實施方式5)本實施方式使進行頻譜的平整的逆濾波器的共振抑制系數(shù)根據(jù)輸入語音 信號的特性自適應(yīng)地改變,從而控制平整的程度。圖17表示本發(fā)明實施方式5的語音編碼裝置卯0的結(jié)構(gòu)。在圖17中, 對與實施方式4(圖15)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在語音編碼裝置900中,逆濾波單元904和905用式(2)表示。特征量分析單元901對輸入語音信號進行分析而計算特征量,并將其輸 出到特征量編碼單元902。使用表示共振所產(chǎn)生的語音頻譜的強度的參數(shù)作 為特征量。具體而言,例如,使用相鄰的lsp參數(shù)之間的距離。 一般地,該 距離越小,共振的程度越強,與共振頻率對應(yīng)的頻譜的能量越大。在出現(xiàn)共 振較強的語音區(qū)間,由于平整處理,在共振頻率附近的頻譜過度地被衰減而 成為音質(zhì)惡化的原因。為了防止這種惡化,在出現(xiàn)共振較強的語音區(qū)間將上 述的共振抑制系數(shù)丫(0<丫<1)設(shè)定得較小來降低平整的程度。由此,能夠防止 由平整處理所產(chǎn)生的在共振頻率附近的頻譜的過度衰減,能夠抑制語音質(zhì)量 的惡化。特征量編碼單元902將乂人特征量分析單元901輸入的特征量進行編碼而 生成特征量編碼數(shù)據(jù),并將其輸出到特征量解碼單元903以及復(fù)用單元卯6。特征量解碼單元903使用特征量編碼數(shù)據(jù)對特征量進行解碼,根據(jù)解碼 特征量決定在逆濾波單元904和905使用的共振抑制系數(shù)y,并將其輸出到逆 濾波單元904和905。在使用表示周期性的強度的參數(shù)作為特征量時,輸入 語音信號的周期性越強,越增大共振抑制系數(shù)y,輸入語音信號的周期性越弱, 越減小共振抑制系數(shù)y。這樣,通過控制共振抑制系數(shù)y,在有聲部分更強地進行頻譜的平整,而在無聲部分頻譜的平整的程度減弱。因此,能夠防止在 無聲部分的過度的頻譜的平整,能夠抑制語音質(zhì)量的惡化。逆濾波單元904和905根據(jù)由特征量解碼單元903控制的共振抑制系數(shù) y, #4居式(2)進行逆濾波處理。復(fù)用單元906將第一層編碼數(shù)據(jù)、第二層編碼數(shù)據(jù)、lpc系數(shù)以及特征 量編碼數(shù)據(jù)進行復(fù)用,生成并輸出比特流。另外,使延遲單元907的延遲的大小與輸入語音信號通過下采樣單元 301、第一層編碼單元701、第一層解碼單元702、上采樣單元703、逆濾波 單元905以及頻域變換單元705時產(chǎn)生的時間延遲為相同值。接著,說明本實施方式的語音解碼裝置。圖18表示本發(fā)明實施方式5的 語音解碼裝置的結(jié)構(gòu)。該語音解碼裝置1000接收從圖17所示的語音編碼裝 置900發(fā)送的比特流。在圖18中,對與實施方式4(圖16)相同的結(jié)構(gòu)部分賦 予相同的標號,并省略其說明。在語音解碼裝置1000中,逆濾波單元1003用式(2)表示。分離單元1001將從圖17所示的語音編碼裝置900接收的比特流分離為 第一層編碼數(shù)據(jù)、第二層編碼數(shù)據(jù)、lpc系數(shù)編碼數(shù)據(jù)以及特征量編碼數(shù)據(jù), 并將第一層編碼數(shù)據(jù)輸出到第一層解碼單元801,將第二層編碼數(shù)據(jù)輸出到 第二層解碼單元405,將lpc系數(shù)輸出到lpc解碼單元407,將特征量編碼 數(shù)據(jù)輸出到特征量解碼單元1002。而且,分離單元1001將層信息(表示比特 流中包含哪層的編碼數(shù)據(jù)的信息)輸出到判定單元413。與特征量解碼單元903(圖17)相同,特征量解碼單元1002使用特征量編 碼數(shù)據(jù)對特征量進行解碼,根據(jù)解碼特征量決定在逆濾波單元1003使用的共 振抑制系數(shù)y,并將其輸出到逆濾波單元1003。逆濾波單元1003根據(jù)由特征量解碼單元1002控制的共振抑制系數(shù)y,根 據(jù)式(2)進行逆濾波處理。這樣,語音解碼裝置1000能夠?qū)膱D17所示的語音編碼裝置900發(fā)送 的比特流進行解碼。另外,如上所述,lpc量化單元102(圖17)將lpc系數(shù)變換為lsp參數(shù) 后對其進行量化。因此,在本實施方式中,語音編碼裝置的結(jié)構(gòu)也可以如圖 19所示。也就是說,在圖19所示的語音編碼裝置1100中,不設(shè)置特征量分 析單元901, lpc量化單元102計算lsp參數(shù)之間的距離并將其輸出到特征量編碼單元902。進而,在LPC量化單元102生成解碼LSP參數(shù)時,語音編碼裝置的結(jié)構(gòu) 也可以如圖20所示。也就是說,在圖20所示的語音編碼裝置1300中,不設(shè) 置特征量分析單元901、特征量編碼單元902以及特征量解碼單元903, LPC 量化單元102生成解碼LSP參數(shù),計算解碼LSP參數(shù)之間的距離并將其輸出 到逆濾波單元904和905。另外,對從圖20所示的語音編碼裝置1300發(fā)送的比特流進行解碼的語 音解碼裝置1400的結(jié)構(gòu)如圖21所示。在圖21中,LPC解碼單元407還從解 碼LPC系數(shù)生成解碼LSP參數(shù),計算解碼LSP參數(shù)之間的距離并將其輸出 到逆濾波單元1003。(實施方式6)在語音信號或音頻信號中,經(jīng)常發(fā)生復(fù)制源的低頻域的頻譜的動態(tài)范圍 (頻語的振幅的最大值與最小值之比)大于復(fù)制目的地的高頻域的頻譜的動態(tài) 范圍的情況。在這樣的情況下,復(fù)制低頻域的頻譜而使其為高頻域的頻譜時, 在高頻域發(fā)生頻譜的過大的峰值。然后,在將這樣具有過大的峰值的頻譜變 換為時域所獲得的解碼信號中,發(fā)生鈴響似的可聽見的噪聲,其結(jié)果,主觀 質(zhì)量降低。對此,為了實現(xiàn)主觀質(zhì)量的改善,提出了將低頻域的頻譜進行變形而使 低頻域的頻譜的動態(tài)范圍接近高頻域的頻譜的動態(tài)范圍的技術(shù)(例如參照,押切,江原,吉田,"匕。f" 7 < A夕tl >夕'(二基d 〈》《夕卜少符號化汔用L、 t超広帯域;^r—"、音聲符號化o改善",2004年秋季音講論集2-4-13, pp.297-298, 2004年9月)。在該技術(shù)中,需要將表示如何變形了低頻域的頻 譜的變形信息從語音編碼裝置發(fā)送到語音解碼裝置。這里,在語音編碼裝置中對該變形信息進行編碼時,在編碼候補的數(shù)量 不夠的情況下,即,在低比特率的情況下,發(fā)生較大的量化誤差。于是,若 發(fā)生這樣的較大的量化誤差,則由該量化誤差引起而不能充分進行低頻域的 頻譜的動態(tài)范圍的調(diào)整,其結(jié)果,有時會導(dǎo)致質(zhì)量惡化。特別是,在選擇了 所表示的動態(tài)范圍大于高頻域的頻譜的動態(tài)范圍的編碼候補時,在高頻域的 頻譜中容易發(fā)生過大的峰值,有時會明顯地出現(xiàn)質(zhì)量惡化。因此,在本實施方式中,在將使低頻域的頻譜的動態(tài)范圍接近高頻域的 頻譜的動態(tài)范圍的技術(shù)適用于上述各個實施方式的情況下,在第二層編碼單元108對變形信息進行編碼時,與使動態(tài)范圍變大的編碼候補相比,更容易 選擇使動態(tài)范圍變小的編碼候補。圖22表示本發(fā)明實施方式6的第二層編碼單元108的結(jié)構(gòu)。在圖22中, 對與實施方式l(圖7)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在圖22所示的第二層編碼單元108中,頻譜變形單元1087從第一層解 碼單元107輸入第一層解碼頻譜Sl(k)(OSk<FL),并從頻域變換單元105輸入 殘差頻譜S2(k)(0^c<FH)。頻語變形單元1087為了使解碼頻譜Sl(k)的動態(tài)范 圍為適當?shù)膭討B(tài)范圍,將解碼頻譜Sl(k)進行變形來改變解碼頻譜Sl(k)的動 態(tài)范圍。然后,頻譜變形單元1087將表示如何變形了解碼頻譜Sl(k)的變形 信息進行編碼后輸出到復(fù)用單元1086。而且,頻譜變形單元1087將變形后 的解碼頻譜(變形解碼頻譜)Sl'(j, k)輸出到內(nèi)部狀態(tài)設(shè)定單元1081。圖23表示頻譜變形單元1087的結(jié)構(gòu)。頻譜變形單元1087將解碼頻譜 Sl(k)進行變形而使解碼頻譜Sl(k)的動態(tài)范圍接近殘差頻譜S2(k)的高頻域 (FI^k〈FH)的動態(tài)范圍。而且,頻譜變形單元1087對變形信息進行編碼,而 后將其輸出。在圖23所示的頻譜變形單元1087中,變形頻譜生成單元1101將解碼頻 鐠Sl(k)進行變形而生成變形解碼頻譜Sl'(j, k),并將其輸出到子帶能量計算 單元1102。這里,j為用于識別碼本1111的各個編碼候補(各個變形信息)的 索引,變形頻譜生成單元1101使用碼本1111所包含的各個編碼候補(各個變 形信息)進行解碼頻譜Sl(k)的變形。這里,列舉一例使用指數(shù)函數(shù)進行頻譜 的變形的情況。例如,將碼本1111所包含的編碼候補表示為a(j)時,假設(shè)各 個編碼候補a(j)在(Ka(j^1的范圍中。因此,變形解碼頻譜Sl'(j, k)如式(15) 所示。其中,sign()表示返回正或負的符號的函數(shù)。因此,編碼候補a(j)取越接 近于"O,,的值,變形解碼頻譜Sl'(j, k)的動態(tài)范圍越小。子帶能量計算單元1102將變形解碼頻譜Sl'(j,k)的頻域劃分為多個子帶, 求各個子帶的平均能量(子帶能量)Pl(j, n),并將其輸出到方差計算單元1103。 這里,n表示子帶序號。方差計算單元1103為了表示子帶能量Pl(j, n)的偏差的程度,求子帶能 量Pl(j, n)的方差cjl(j)2。然后,方差計算單元1103將編碼候補(變形信息)j的方差al(jf輸出到減法單元1106。另一方面,子帶能量計算單元1104將殘差頻語S2(k)的高頻域劃分為多 個子帶,求各個子帶的平均能量(子帶能量)P2(n),并將其輸出到方差計算單 元1105。方差計算單元1105為了表示子帶能量P2(n)的偏差的程度,求子帶能量 P2(n)的方差cj22,并將其輸出到減法單元1106。減法單元1106從方差022中減去方差(11(])2 ,并將通過該相減所獲得的 誤差信號輸出到判定單元1107以及加權(quán)誤差計算單元1108。判定單元1107判定誤差信號的符號(正或負),并基于判定結(jié)果,決定提 供給加權(quán)誤差計算單元1108的權(quán)重(weight)。判定單元1107在誤差信號的符號為正時,選擇Wp。s作為權(quán)重,在誤差信號的符號為負時,選擇Wneg作為權(quán)重,并將其輸出到加權(quán)誤差計算單元1108。
Wp。s和Wneg之間存在式(16)所示的大小關(guān)系。<formula>formula see original document page 23</formula>16)加權(quán)誤差計算單元1108,首先計算從減法單元1106輸入的誤差信號的平方值,接著將從判定單元1107輸入的權(quán)重W(Wp。s或Wneg)乘以誤差信號的平方值而計算加權(quán)平方誤差E,并將其輸出到搜索單元1109。加權(quán)平方誤差E 如式(17)所示。<formula>formula see original document page 23</formula>
依次輸出到變形頻譜生成單元1101,并搜索使加權(quán)平方誤差E為最小的編碼 候補(變形信息)。然后,搜索單元1109將使加權(quán)平方誤差E為最小的編碼候 補的索引j。pt作為最佳變形信息輸出到變形頻譜生成單元1110以及復(fù)用單元 1086。變形頻譜生成單元1110將解碼頻譜Sl(k)進行變形而生成與最佳變形信 息j。pt對應(yīng)的變形解碼頻譜Sl'(j。pt, k),并將其輸出到內(nèi)部狀態(tài)設(shè)定單元1081。接著,說明本實施方式的語音解碼裝置的第二層解碼單元203。圖24表 示本發(fā)明實施方式6的第二層解碼單元203的結(jié)構(gòu)。在圖24中,對與實施方 式l(圖IO)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在第二層解碼單元203中,變形頻譜生成單元2036基于從分離單元2032輸入的最佳變形信息j。pt,將從第一層解碼單元202輸入的第一層解碼頻譜 Sl(k)進行變形而生成變形解碼頻譜Sl'(j。pt, k),并將其輸出到內(nèi)部狀態(tài)設(shè)定 單元2031。也就是說,變形頻譜生成單元2036被配置為與語音編碼裝置端 的變形頻語生成單元1110對應(yīng),并進行與變形頻譜生成單元1110相同的處 理。如上所述,根據(jù)誤差信號的符號決定在計算加權(quán)平方誤差時的權(quán)重,并 且,該權(quán)重存在如式(16)所示的關(guān)系時,可以進行如下敘述。也就是說,誤差信號為正的情況是指變形解碼頻譜Sl'的偏差的程度小于 作為目標值的殘差頻譜S2的偏差的程度的情況。也就是iJt,這相當于在語 音解碼裝置端生成的變形解碼頻譜Sl'的動態(tài)范圍小于殘差頻譜S2的動態(tài)范 圍。另一方面,誤差信號為負的情況是指變形解碼頻譜sr的偏差的程度大于作為目標值的殘差頻譜S2的偏差的程度的情況。也就是說,這相當于在語音解碼裝置端生成的變形解碼頻譜sr的動態(tài)范圍大于殘差頻譜S2的動態(tài)范圍。因此,如式(16)所示,通過將誤差信號為正時的權(quán)重Wp。s設(shè)定得小于誤差 信號為負時的權(quán)重wneg,從而在平方誤差為相同程度的值的情況下,生成動態(tài)范圍比殘差頻語S2的動態(tài)范圍小的變形解碼頻譜sr的編碼候補容易被選 擇。也就是說,抑制動態(tài)范圍的編碼候補被優(yōu)先地選擇。因此,減少了在語 音解碼裝置生成的估計頻譜的動態(tài)范圍大于殘差頻譜的高頻域的動態(tài)范圍的 頻度。這里,在變形解碼頻譜sr的動態(tài)范圍大于作為目標的頻譜的動態(tài)范圍 時,在語音解碼裝置中估計頻譜上出現(xiàn)過大的峰值并容易使人的耳朵感覺到 質(zhì)量惡化,與此情況相對,在變形解碼頻譜sr的動態(tài)范圍小于作為目標的頻 譜的動態(tài)范圍時,在語音解碼裝置中估計頻譜上不容易出現(xiàn)上述那樣的過大 的峰值。因此,根據(jù)本實施方式,在將使低頻域的頻譜的動態(tài)范圍與高頻域 的頻譜的動態(tài)范圍匹配的技術(shù)適用于實施方式i的情況下,能夠防止聽覺性 的音質(zhì)惡化。另外,在上述說明中,以一例列舉了使用指數(shù)函數(shù)作為頻譜變形方法, 但并不限于此,也可以利用其他的頻譜變形方法,例如使用了對數(shù)函數(shù)的頻 譜變形等。另外,在上述說明中,說明了使用子帶的平均能量的方差的情況,但只 要是表示頻譜的動態(tài)范圍的大小的指標,并不限定于子帶的平均能量的方差。(實施方式7)圖25表示本發(fā)明實施方式7的頻譜變形單元1087的結(jié)構(gòu)。在圖25中, 對與實施方式6(圖23)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在圖25所示的頻譜變形單元1087中,偏差程度計算單元1112-1根據(jù)解 碼頻譜Sl(k)的低頻域的值的分布來計算解碼頻語Sl(k)的偏差程度,并將其 輸出到閾值設(shè)定單元1113-1和1113-2。具體而言,偏差程度是指解碼頻譜Sl(k) 的標準偏差cj1。閾值設(shè)定單元1113-1使用標準偏差cj1求第一閾值TH1,并將其輸出到 平均頻譜計算單元1114-1以及變形頻譜生成卓元1110。這里,第一閾值TH1 是指用于來確定解碼頻譜Sl(k)中振幅比較大的頻譜的閾值,使用將標準偏差 cj1與預(yù)定的常數(shù)a相乘所得的值。閾值設(shè)定單元1113-2使用標準偏差al求第二闊值TH2,并將其輸出到 平均頻譜計算單元1114-2以及變形頻譜生成單元1110。這里,第二閾值TH2 是指用于來確定解碼頻譜S1 (k)的低頻域中振幅比較d、的頻譜的閾值,使用將 標準偏差cj1與預(yù)定的常數(shù)b(〈a)相乘所得的值。平均頻譜計算單元1114-1求其振幅比第 一 閾值TH1大的頻譜的平均振幅 值(以下,稱為第一平均值),并將其輸出到變形矢量計算單元lll5。具體而 言,平均頻譜計算單元1114-1將解碼頻譜Sl(k)的低頻域的頻譜的值與解碼 頻譜Sl(k)的平均值ml加上第一閾值TH1所得的值(ml+THl)進行比較,確定 具有大于該值的值的頻譜(步驟1)。接著,平均頻譜計算單元1114-1將解碼頻 譜Sl(k)的低頻域的頻譜的值與從解碼頻譜Sl(k)的平均值ml中減去第一閾 值TH1所得的值(ml-THl)進行比較,確定具有小于該值的值的頻譜(步驟2)。 然后,平均頻譜計算單元1114-1求在步驟1和步驟2雙方所求得的頻譜的振 幅的平均值,并將其輸出到變形矢量計算單元1115。平均頻譜計算單元1114-2求其振幅比第二閾值TH2小的頻譜的平均振幅 值(以下,稱為第二平均值),并將其輸出到變形矢量計算單元1115。具體而 言,平均頻譜計算單元1114-2將解碼頻譜Sl(k)的低頻域的頻譜的值與解碼 頻譜Sl(k)的平均值ml加上第二闞值TH2所得的值(ml+TH2)進行比較,確定 具有小于該值的值的頻譜(步驟1)。接著,平均頻譜計算單元1114-2將解碼頻譜Sl(k)的低頻域的頻譜的值與從解碼頻鐠Sl(k)的平均值ml中減去第二閾 值TH2所得的值(ml-TH2)進行比較,確定具有大于該值的值的頻語(步驟2)。 然后,平均頻譜計算單元1114-2求在步驟1和步驟2雙方所求得的頻譜的振 幅的平均值,并將其輸出到變形矢量計算單元1115。另一方面,偏差程度計算單元1112-2根據(jù)殘差頻譜S2(k)的高頻域的數(shù) 值的分布來計算殘差頻語S2(k)的偏差程度,并將其輸出到閾值設(shè)定單元 1113-3和1113-4。具體而言,偏差程度是指殘差頻譜S2(k)的標準偏差cj2。閾值設(shè)定單元1113-3使用標準偏差cj2求第三閾值TH3,并將其輸出到 平均頻譜計算單元1114-3。這里,第三閾值TH3是指用于確定殘差頻語S2(k) 的高頻域中振幅比較大的頻譜的闊值,使用將標準偏差cj2與預(yù)定的常數(shù)c相 乘所得的值。閾值設(shè)定單元1113-4使用標準偏差a2求第四閾值TH4,并將其輸出到 平均頻譜計算單元1114-4。這里,第四閾值TH4是指用于確定殘差頻譜S2(k) 的高頻域中振幅比較小的頻譜的闊值,使用將標準偏差cj2與預(yù)定的常數(shù)d(<c) 相乘所得的值。平均頻譜計算單元1114-3求其振幅比第三閾值TH3大的頻譜的平均振幅 值(以下,稱為第三平均值),并將其輸出到變形矢量計算單元1115。具體而 言,平均頻譜計算單元1114-3將殘差頻譜S2(k)的高頻域的頻譜的值與殘差 頻諮S2(k)的平均值m3加上第三閾值TH3所得的值(m3+TH3)進行比較,確 定具有大于該值的值的頻諳(步驟1)。接著,平均頻譜計算單元11M-3將殘差 頻譜S2(k)的高頻域的頻譜的值與從殘差頻譜S2 (k)的平均值m3中減去第三 閾值TH3所得的值(m3-TH3)進行比較,確定具有小于該值的值的頻譜(步驟 2)。然后,平均頻譜計算單元1114-3求在步驟1和步驟2雙方所求得的頻譜 的振幅的平均值,并將其輸出到變形矢量計算單元1115。平均頻譜計算單元1114-4求其振幅比第四閾值TH4小的頻譜的平均振幅 值(以下,稱為第四平均值),并將其輸出到變形矢量計算單元1115。具體而 言,平均頻譜計算單元1114-4將殘差頻譜S2(k)的高頻域的頻譜的值與殘差 頻譜S2(k)的平均值m3加上第四閾值TH4所得的值(m3+TH4)進行比較,確 定具有小于該值的值的頻譜(步驟1)。接著,平均頻譜計算單元1114-4將殘差 頻i普S2(k)的高頻域的頻譜的值與從殘差頻譜S2(k)的平均值m3中減去第四 閾值TH4所得的值(m3-TH4)進行比較,確定具有大于該值的值的頻譜(步驟2)。然后,平均頻譜計算單元1114-4求在步驟1和步驟2雙方所求得的頻譜 的振幅的平均值,并將其輸出到變形矢量計算單元1115。變形矢量計算單元1115使用第一平均值、第二平均值、第三平均值以及 第四平均值,由以下方式計算變形矢量。也就是說,變形矢量計算單元1115計算第三平均值與第一平均值之比(以 下,稱為第一增益)以及第四平均值與第二平均值之比(以下,稱為第二增益), 并將第一增益以及第二增益作為變形矢量輸出到減法單元1106。以下,將變 形矢量表示為g(i)(i=l, 2)。也就是說,g(l)表示第一增益,g(2)表示第二增益。減法單元1106 ,人變形矢量g(i)中減去屬于變形矢量碼本1116的編碼候 補,并將通過該相減所獲得的誤差信號輸出到判定單元1107以及加權(quán)誤差計 算單元1108。以下,將編碼候補表示為v(j, i)。其中,j為用于識別變形矢 量碼本1116的各個編碼候補(各個變形信息)的索引。判定單元1107判定誤差信號的符號(正或負),并基于判定結(jié)果,對每個 第一增益g(l)和第二增益g(2)決定提供給加權(quán)誤差計算單元1108的權(quán)重 (weight)。對于第一增益g(l),判定單元1107在誤差信號的符號為正時,選擇WHght作為權(quán)重,在誤差信號的符號為負時,選擇Wheavy作為權(quán)重,并將其輸出到加權(quán)誤差計算單元1108。另一方面,對于第二增益g(2),判定單元1107在誤差信號的符號為正時,選擇Wheavy作為權(quán)重,在誤差信號的符號為負時, 選擇W,ight作為權(quán)重,并將其輸出到加權(quán)誤差計算單元1108。
W"ght和Wheavy之間存在式(18)所示的大小關(guān)系。 <formula>formula see original document page 27</formula>加權(quán)誤差計算單元1108,首先計算從減法單元1106輸入的誤差信號的平 方值,接著求誤差信號的平方值與每個第一增益g(l)和第二增益g(2)的從判定單元1107輸入的4又重W(W,jght或Wheavy)的積和,乂人而求加權(quán)平方誤差E,并將其輸出到搜索單元1109。加權(quán)平方誤差E如式(19)所示。<formula>formula see original document page 27</formula>搜索單元1109控制變形矢量碼本1116而使存儲在變形矢量碼本1116中 的編碼候補(變形信息)被依次輸出到減法單元1106,并搜索使加權(quán)平方誤差E為最小的編碼候補(變形信息)。然后,搜索單元1109將使加權(quán)平方誤差E為 最小的編碼候補的索引j。pt作為最佳變形信息輸出到變形頻語生成單元1110 以及復(fù)用單元1086。變形頻鐠生成單元1110使用第一閾值TH1、第二閾值TH2以及最佳變 形信息J。pp將解碼頻譜Sl(k)進行變形,從而生成與最佳變形信息j率對應(yīng)的 變形解碼頻語Sl'(j。pt, k),并將其輸出到內(nèi)部狀態(tài)設(shè)定單元1081。變形頻鐠生成單元1110首先利用最佳變形信息j一而生成第三平均值與 第一平均值之比的解碼值(以下,稱為解碼第一增益),以及第四平均值與第二 平均值之比的解碼值(以下,稱為解碼第二增益)。接著,變形頻傳生成單元1110比較解碼頻譜Sl(k)的振幅值和第一閾值 TH1,確定與第一閾值TH1相比振幅較大的頻譜,并將這些頻譜與解碼第一 增益相乘而生成變形解碼頻譜Sl'(j。pt, k)。同樣地,變形頻譜生成單元1110 比較解碼頻譜Sl(k)的振幅值和第二閾值TH2,確定與第二閾值TH2相比振 幅較小的頻謙,并將這些頻語與解碼第二增益相乘而生成變形解碼頻譜 Sl'(j。pt, k)。另外,在解碼頻譜Sl(k)中,對于屬于第一閾值TH1和第二閾值TH2之 間的區(qū)域內(nèi)的頻譜,不存在編碼信息。因此,變形頻譜生成單元1110使用具 有解碼第一增益與解碼第二增益的中間值的增益。例如,變形頻譜生成單元1U0從基于解碼第一增益、解碼第二增益、第一閾值TH1以及第二閾值TH2 的特性曲線,求對應(yīng)某一振幅x的解碼增益y,并將該增益乘以解碼頻譜Sl(k) 的振幅。也就是,解碼增益y為解碼第一增益以及解碼第二增益的線性插值。這樣,根據(jù)本實施方式,能夠獲得與實施方式6相同的作用和效果。(實施方式8)圖26表示本發(fā)明實施方式8的頻語變形單元1087的結(jié)構(gòu)。在圖26中, 對與實施方式6(圖23)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在圖26所示的頻譜變形單元1087中,校正單元1117從方差計算單元 n05^入方差(j22。校正單元1117進行減小方差022的值的校正處理,并將其輸出到減法單 元1106。
具體而言,;歐正單元1117將"0,,以上、小于"l"的值乘以方差a22。減法單元1106從校正處理后的方差中減去ol(j)2,并將通過該相減所獲 得的誤差信號輸出到誤差計算單元1118。誤差計算單元1118計算從減法單元1106輸入的誤差信號的平方值(平方 誤差),并將其輸出到搜索單元1109。搜索單元1109對碼本1111進行控制而使存儲在碼本1111的編碼候補(變 形信息)依次輸出到變形頻譜生成單元1101,并搜索使平方誤差為最小的編碼 候補(變形信息)。然后,搜索單元1109將使平方誤差為最小的編碼候補的索 引j。pt作為最佳變形信息輸出到變形頻語生成單元1110以及復(fù)用單元1086。這樣,根據(jù)本實施方式,通過在校正單元1117的校正處理,在搜索單元 1109,進行將校正處理后的方差、即、將值變小的方差作為目標值的編碼候 補的搜索。因此,在語音解碼裝置中,由于能夠抑制估計頻譜的動態(tài)范圍, 從而能夠進一步減少上述那樣的過大的峰值的發(fā)生頻度。另外,在校正單元1117中,也可以根據(jù)輸入語音信號的特性,改變與方 差(722相乘的值。使用輸入語音信號的音調(diào)周期性的強度作為該特性是合適 的。也就是說,校正單元1117也可以在輸入語音信號的音調(diào)周期性較弱時(例 如,音調(diào)增益較小時),使與方差022相乘的值為較大的值,在輸入語音信號 的音調(diào)周期性較強時(例如,音調(diào)增益較大時),使與方差022相乘的值為較小 的值。通過這樣的自適應(yīng),僅對音調(diào)周期性較強的信號(例如母音部分),不容 易產(chǎn)生過大的頻譜峰值,其結(jié)果,能夠改善聽覺性的音質(zhì)。(實施方式9)圖27表示本發(fā)明實施方式9的頻譜變形單元1087的結(jié)構(gòu)。在圖27中, 對與實施方式7(圖25)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在圖27所示的頻i普變形單元1087中,校正單元1117從變形矢量計算單 元1115輸入變形矢量g(i)。校正單元1117至少進行以下一個校正處理,即減少第一增益g(l)的值的 校正處理以及增大第二增益g(2)的值的校正處理,并將其輸出到減法單元 1106。具體而言,校正單元1117將"0,,以上、小于"l,,的值乘以第一增益g(l), 將比"l"大的值乘以第二增益g(2)。減法單元1106從校正處理后的變形矢量中減去屬于變形矢量碼本1116 的編碼候補,并將通過該相減所獲得的誤差信號輸出到誤差計算單元1118。誤差計算單元1118計算從減法單元1106輸入的誤差信號的平方值(平方 誤差),并將其輸出到搜索單元1109。搜索單元1109對變形矢量碼本1116進行控制而使存儲在變形矢量碼本1116的編碼候補(變形信息)依次輸出到減法單元1106,并搜索使平方誤差為 最小的編碼候補(變形信息)。然后,搜索單元1109將使平方誤差為最小的編 碼候補的索引j。pt作為最佳變形信息輸出到變形頻譜生成單元1110以及復(fù)用 單元1086。這樣,根據(jù)本實施方式,通過在校正單元1117的校正處理,在搜索單元 1109中,進行將使校正處理后的變形矢量、即、使動態(tài)范圍變小的變形矢量 為目標值的編碼候補的搜索。因此,在語音解碼裝置中,由于能夠抑制估計 頻譜的動態(tài)范圍,從而能夠進一步減少上述那樣的過大的峰值的發(fā)生頻度。另外,在本實施方式中也與實施方式8相同,也可以在沖交正單元1117中, 根據(jù)輸入語音信號的特性,改變與變形矢量g(i)相乘的值。與實施方式8相同, 通過這樣的自適應(yīng)化,僅對音調(diào)周期性較強的信號(例如母音部分),不容易產(chǎn) 生過大的頻譜峰值,其結(jié)果,能夠改善聽覺性的音質(zhì)。(實施方式10)圖28表示本發(fā)明實施方式10的第二層編碼單元108的結(jié)構(gòu)。在圖28 中,對與實施方式6(圖22)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在圖28所示的第二層編碼單元108中,頻譜變形單元1088從頻域變換 單元105輸入殘差頻譜S2(k),并從搜索單元1083輸入殘差頻譜的估計值(估 計殘差頻譜)S2'(k)。頻譜變形單元1088參照殘差頻譜S2(k)的高頻域的動態(tài)范圍,使估計殘 差頻譜S2'(k)變形,從而使估計殘差頻譜S2'(k)的動態(tài)范圍改變。然后,頻譜 變形單元1088對表示如何地變形了估計殘差頻-潛S2'(k)的變形信息進行編碼 后輸出到復(fù)用單元1086。而且,頻二潛變形單元1088將變形后的估計殘差頻 譜(變形殘差頻譜)輸出到增益編碼單元1085。另外,由于頻譜變形單元1088 的內(nèi)部結(jié)構(gòu)與頻譜變形單元1087相同,所以省略其詳細說明。由于在增益編碼單元1085的處理為將實施方式1中的"殘差頻譜的估計 值S2'(k)"讀為"變形殘差頻譜,,的處理,所以省略其詳細說明。接著,說明本實施方式的語音解碼裝置的第二層解碼單元203。圖29表 示本發(fā)明實施方式10的第二層解碼單元203的結(jié)構(gòu)。在圖29中,對與實施 方式6(圖24)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在第二層解碼單元203中,變形頻譜生成單元2037基于從分離單元2032 輸入的最佳變形信息j。pt,即,關(guān)于變形殘差頻譜的最佳變形信息j。pt,將從濾波單元2033輸入的解碼頻譜S'(k)進行變形,并將其輸出到頻語調(diào)整單元 2035。也就是說,變形頻語生成單元2037被配置為與語音編碼裝置端的頻譜 變形單元1088對應(yīng),并進行與頻譜變形單元1088相同的處理。這樣,根據(jù)本實施方式,由于不僅使解碼頻譜Sl(k)變形而且使估計殘差 頻譜S2'(k)變形,所以能夠生成具有更合適的動態(tài)范圍的估計殘差頻譜。(實施方式11)圖30表示本發(fā)明實施方式11的第二層編碼單元108的結(jié)構(gòu)。在圖30 中,對與實施方式6(圖22)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在圖30所示的第二層編碼單元108中,頻-潛變形單元1087^4居與語音 解碼裝置共享的預(yù)定的變形信息,使解碼頻譜Sl(k)變形,從而^f吏解碼頻譜 Sl(k)的動態(tài)范圍改變。然后,頻譜變形單元1087將變形解碼頻譜Sl'(j, k) 輸出到內(nèi)部狀態(tài)設(shè)定單元1081。接著,說明本實施方式的語音解碼裝置的第二層解碼單元203。圖31表 示本發(fā)明實施方式11的第二層解碼單元203的結(jié)構(gòu)。在圖31中,對與實施 方式6(圖24)相同的結(jié)構(gòu)部分賦予相同的標號,并省略其說明。在第二層解碼單元203中,變形頻譜生成單元2036根據(jù)與語音編碼裝置 共享的預(yù)定的變形信息,即與圖30的頻譜變形單元1087使用過的預(yù)定的變 形信息相同的變形信息,使從第一層解碼單元202輸入的第一層解碼頻譜 Sl(k)變形,并將其輸出到內(nèi)部狀態(tài)設(shè)定單元2031。這樣,根據(jù)本實施方式,語音編碼裝置的頻譜變形單元1087和語音解碼 裝置的變形頻譜生成單元2036根據(jù)預(yù)先設(shè)定的相同的變形信息進行變形處 理,所以不需要從語音編碼裝置將變形信息發(fā)送到語音解碼裝置。這樣,與 實施方式6相比,根據(jù)本實施方式,能夠降低比特率。另外,也可以圖28所示的頻譜變形單元1088和圖29所示的變形頻譜生 成單元2037根據(jù)預(yù)先設(shè)定的相同的變形信息進行變形處理。由此,能夠進一 步降低比特率。(實施方式12)實施方式10中的第二層編碼單元108也可以采用不具有頻譜變形單元 1087的結(jié)構(gòu)。因此,作為實施方式12,圖32表示這種情況下的第二層編碼 單元108的結(jié)構(gòu)。而且,在第二層編碼單元108不具有頻譜變形單元1087的情況下,在語音解碼裝置中也不需要與頻語變形單元1087對應(yīng)的變形頻鐠生成單元2036。 因此,作為實施方式12,圖33表示這種情況下的第二層解碼單元203的結(jié) 構(gòu)。以上說明了本發(fā)明實施方式。另外,實施方式6至12的第二層編碼單元108也可以用于實施方式2(圖 11)、實施方式3(圖12)、實施方式4(圖15)以及實施方式5(圖17)。但是,在 實施方式4和5(圖15,圖17)中,由于在對第一層解碼信號進行上采樣后進 行頻域變換,所以第一層解碼頻譜Sl(k)的頻域為(Kk<FH。但是,由于只在 進行上采樣之后變換到頻域,所以在頻帶FI^k<FH中不包含有效的信號分 量。因此,在這些實施方式中,也可以將第一層解碼頻譜Sl(k)的頻帶作為 0^k<FL來處理。另外,實施方式6至12的第二層編碼單元108也可以用于在實施方式2 至5中記載的語音編碼裝置以外的語音編碼裝置的第二層中的編碼。另外,在上述實施方式中,在第二層編碼單元108內(nèi),在復(fù)用單元1086 將音調(diào)系數(shù)和索引等進行復(fù)用而將其作為第二層編碼數(shù)據(jù)輸出后,在復(fù)用單 元109將第一層編碼數(shù)據(jù)、第二層編碼數(shù)據(jù)以及LPC系數(shù)編碼數(shù)據(jù)進行復(fù)用 而生成比特流,但并不限于此,也可以在第二層編碼單元108內(nèi)不設(shè)置復(fù)用 單元1086,而將音調(diào)系數(shù)和索引等直接輸入到復(fù)用單元109并進行與第一層 編碼數(shù)據(jù)等的復(fù)用。另外,對于第二層解碼單元203,將在分離單元201從 比特流中分離而生成的第二層編碼數(shù)據(jù)輸入到第二層解碼單元203內(nèi)的分離 單元2032,在分離單元2032還分離為音調(diào)系數(shù)和索引等,但不限于此,也 可以在第二層解碼單元203內(nèi)不設(shè)置分離單元2032,而在分離單元201將比 特流直接分離為音調(diào)系數(shù)和索引等,從而將其輸入到第二層解碼單元203 。另外,在上述實施方式中,以可擴展編碼的層數(shù)是2的情況為例進行了 說明,但不限于此,本發(fā)明也可以適用于具有三層以上的層的可擴展編碼。另夕卜,在上述實施方式中以使用MDCT作為第二層中的變換編碼的方式 為例進行了說明,但并不限于此,在本發(fā)明中也可以使用FFT(快速傅立葉變 換)、DFT(離散付立葉變換)、DCT(離散余弦變換)、濾波器組(filterbank)以及 小波變換(Wavelet transform)等其他的變換編碼方式。另外,在上述實施方式中以輸入信號是語音信號的情況為例進行了說明, 但不限于此,本發(fā)明也能夠適用于音頻信號。另外,將上述實施方式的語音編碼裝置和語音解碼裝置配置在移動通信 系統(tǒng)所使用的無線通信移動臺裝置和無線通信基站裝置上,能夠防止移動通 信中的語音質(zhì)量的惡化。另外,有時無線通信移動臺裝置被表示為UE,無線通信基站裝置被表示為NodeB。另外,在上述實施方式中,以本發(fā)明通過硬件構(gòu)成的情況為例進行了說 明,但本發(fā)明也可以通過軟件來實現(xiàn)。另外,用于上述實施方式的說明中的各功能塊通常被作為集成電路的 LSI來實現(xiàn)。這些塊既可以被單獨地集成為一個芯片,也可以包含一部分或 全部地被集成為一個芯片。雖然此處稱為LSI,但根據(jù)集成程度,可以被稱 為IC、系統(tǒng)LSI、超大LSI(SuperLSI)、或特大LSI(Ultra LSI)。另外,實現(xiàn)集成電路化的方法不僅限于LSI,也可使用專用電路或通用 處理器來實現(xiàn)。也可以-使用可在LSI制造后編程的FPGA(Field Programmable Gate Array:現(xiàn)場可編程門陣列),或者可重構(gòu)LSI內(nèi)部的電路單元的連接和 設(shè)定的可重構(gòu)處理器。再者,隨著半導(dǎo)體的技術(shù)進步或隨之派生的其它技術(shù)的出現(xiàn),如果出現(xiàn) 能夠替代LSI的集成電路化的新技術(shù),當然可利用該新技術(shù)進行功能塊的集 成化。還存在著適用生物技術(shù)等的可能性。本說明書基于2005年9月30日申請的日本專利申請2005-286533及2006 年7月21日申請的日本專利申請2006-199616。其內(nèi)容全部包含于此。工業(yè)實用性本發(fā)明能夠適用于在移動通信系統(tǒng)中使用的無線通信移動臺裝置和無線 通信基站裝置等用途。
權(quán)利要求
1、一種語音編碼裝置,包括第一編碼單元,對比語音信號的閾值頻率低的頻帶的低頻域的頻譜進行編碼;平整單元,使用具有與所述語音信號的頻譜包絡(luò)相反的特性的逆濾波器,對所述低頻域的頻譜進行平整;以及第二編碼單元,使用平整后的低頻域的頻譜,對比所述語音信號的所述閾值頻率高的頻帶的高頻域的頻譜進行編碼。
2、 如權(quán)利要求1所述的語音編碼裝置,其中,所述平整單元使用所述語 音信號的LPC系數(shù)而構(gòu)成所述逆濾波器。
3、 如權(quán)利要求1所述的語音編碼裝置,其中,所述平整單元根據(jù)所述語 音信號的共振的程度,改變平整的程度。
4、 如權(quán)利要求3所述的語音編碼裝置,其中,所述共振越強,所述平整 單元越降低所述平整的程度。
5、 如權(quán)利要求1所述的語音編碼裝置,其中,所述第二編碼單元使所述 平整后的低頻域的頻譜變形,并使用變形后的低頻域的頻譜對所述高頻域的 頻譜進行編碼。
6、 如權(quán)利要求5所述的語音編碼裝置,其中,所述第二編碼單元對所述 平整后的低頻域的頻譜進行使所述平整后的低頻域的頻譜的動態(tài)范圍接近所 述高頻域的頻譜的動態(tài)范圍的變形。
7、 如權(quán)利要求6所述的語音編碼裝置,其中,所述第二編碼單元在多個 編碼候補中,與增大動態(tài)范圍的編碼候補相比,優(yōu)先地使用減小動態(tài)范圍的 編碼候補,使所述平整后的低頻域的頻譜變形。
8、 如權(quán)利要求7所述的語音編碼裝置,其中,所述第二編碼單元進行減 小編碼候補搜索用的目標值的校正,基于該校正后的目標值,對所述多個編 碼候補搜索用于對所述平整后的低頻域的頻譜進行變形的編碼候補。
9、 如權(quán)利要求5所述的語音編碼裝置,其中,所述第二編碼單元從所述 變形后的低頻域的頻譜估計所述高頻域的頻譜,使估計出的高頻域的頻譜變 形,并使用變形后的高頻域的頻譜,對所述語音信號的高頻域的頻譜進行編 碼。
10、 如權(quán)利要求1所述的語音編碼裝置,其中,所述第二編碼單元從所 述平整后的低頻域的頻傳估計所述高頻域的頻諶,使估計出的高頻域的頻譜 變形,并使用變形后的高頻域的頻譜,對所述語音信號的高頻域的頻譜進行 編碼。
11、 一種無線通信移動臺裝置,具有權(quán)利要求1所述的語音編碼裝置。
12、 一種無線通信基站裝置,具有權(quán)利要求1所述的語音編碼裝置。
13、 一種語音編碼方法,包括第一編碼步驟,對比語音信號的閾值頻率低的頻帶的低頻域的頻譜進行 編碼;平整步驟,使用具有與所述語音信號的頻譜包絡(luò)相反的特性的逆濾波 器,對所述低頻域的頻譜進行平整;以及第二編碼步驟,使用平整后的低頻域的頻譜,對比所述語音信號的所述閾值頻率高的頻帶的高頻域的頻譜進行編碼。
全文摘要
公開了語音編碼裝置,即使在將語音信號的低頻域的頻譜多次復(fù)制到高頻域的情況下,也保持頻譜的能量的連續(xù)性,并防止語音質(zhì)量的惡化。在該語音編碼裝置(100)中,LPC量化單元(102)進行LPC系數(shù)的量化,LPC解碼單元(103)對量化后的LPC系數(shù)進行解碼,逆濾波單元(104)通過使用解碼LPC系數(shù)所構(gòu)成的逆濾波器,對輸入語音信號的頻譜進行平整,頻域變換單元(105)對平整后的頻譜進行頻率分析,第一層編碼單元(106)對平整后的頻譜的低頻域進行編碼而生成第一層編碼數(shù)據(jù),第一層解碼單元(107)對第一層編碼數(shù)據(jù)進行解碼而生成第一層解碼頻譜,第二層編碼單元(108)使用第一層解碼頻譜,對平整后的頻譜的高頻域進行編碼。
文檔編號G10L19/04GK101273404SQ20068003535
公開日2008年9月24日 申請日期2006年9月29日 優(yōu)先權(quán)日2005年9月30日
發(fā)明者押切正浩 申請人:松下電器產(chǎn)業(yè)株式會社