音頻解碼裝置制造方法
【專利摘要】一種音頻解碼裝置,即使在應(yīng)用無(wú)聲壓縮時(shí)也能夠降低通話質(zhì)量的劣化。其具有:抖動(dòng)吸收緩沖器,其臨時(shí)蓄積接收到的分組,并在規(guī)定的輸出定時(shí)輸出該分組;背景噪聲生成部,其根據(jù)從上述抖動(dòng)吸收緩沖器輸出的分組所包含的背景噪聲數(shù)據(jù)生成背景噪聲的音頻數(shù)據(jù);音頻解碼部,其對(duì)從上述抖動(dòng)吸收緩沖器輸出的分組所包含的音頻編碼數(shù)據(jù)進(jìn)行解碼而生成語(yǔ)音的音頻數(shù)據(jù);語(yǔ)速變換部,其進(jìn)行對(duì)由上述音頻解碼部解碼后的上述音頻數(shù)據(jù)的再現(xiàn)速度進(jìn)行變換的語(yǔ)速變換;和控制部,其根據(jù)上述抖動(dòng)吸收緩沖器中的分組的蓄積狀況,控制由上述背景噪聲生成部生成的上述背景噪聲的時(shí)間長(zhǎng)度,并且控制由上述語(yǔ)速變換部所變換的上述再現(xiàn)速度。
【專利說明】音頻解碼裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及在網(wǎng)絡(luò)電話等中使用的對(duì)編碼后的音頻進(jìn)行解碼的音頻解碼裝置。
【背景技術(shù)】
[0002]網(wǎng)絡(luò)電話等語(yǔ)音通話以如下方式進(jìn)行通話:在對(duì)語(yǔ)音進(jìn)行編碼后形成分組,并通過網(wǎng)絡(luò)收發(fā)分組。在分組的通信中,接收到分組的時(shí)間間隔大多不固定,分組的接收時(shí)間間隔產(chǎn)生偏差(抖動(dòng))的情況較多。作為吸收這樣的抖動(dòng),并連續(xù)地輸出對(duì)接收到的分組所包含的音頻碼進(jìn)行解碼而得到的解碼音頻的技術(shù),例如存在專利文獻(xiàn)I所記載的技術(shù)。
[0003]在專利文獻(xiàn)I所記載的技術(shù)中,根據(jù)臨時(shí)存儲(chǔ)接收分組的抖動(dòng)吸收緩沖器中的接收分組的蓄積量加快或減慢再現(xiàn)速度,由此將抖動(dòng)吸收緩沖器中的接收分組的蓄積量保持為恰當(dāng)?shù)牧浚⑦B續(xù)地輸出解碼音頻。由此,與通過抖動(dòng)吸收緩沖器中的接收分組的廢棄、復(fù)制而將接收分組的蓄積量保持為恰當(dāng)?shù)牧康那闆r相比,減輕了音頻質(zhì)量的劣化。
[0004]【專利文獻(xiàn)1】日本特許第3796240號(hào)公報(bào)
[0005]但是,在以往的音頻解碼裝置中,是以如下情況為前提進(jìn)行的控制:以固定的時(shí)間間隔對(duì)語(yǔ)音進(jìn)行編碼、打包并發(fā)送的分組存儲(chǔ)到抖動(dòng)吸收緩沖器中的與該分組的分組編號(hào)對(duì)應(yīng)的位置處。因此,在應(yīng)用了例如無(wú)聲區(qū)間中分組的送出間隔變長(zhǎng)等、不一定以固定的時(shí)間間隔送出分組的無(wú)聲壓縮的系統(tǒng)中,存在無(wú)法進(jìn)行恰當(dāng)?shù)奶幚矶鴮?dǎo)致通話質(zhì)量劣化的問題。
【發(fā)明內(nèi)容】
[0006]本發(fā)明正是為了解決上述那樣的問題而完成的,其目的在于,得到一種即使在應(yīng)用無(wú)聲壓縮時(shí)也能夠減少通話質(zhì)量的劣化的音頻解碼裝置。
[0007]本發(fā)明的音頻解碼裝置具有:抖動(dòng)吸收緩沖器,其臨時(shí)蓄積接收到的分組,并在規(guī)定的輸出定時(shí)輸出該分組;背景噪聲生成部,其根據(jù)從上述抖動(dòng)吸收緩沖器輸出的分組所包含的背景噪聲數(shù)據(jù),生成背景噪聲的音頻數(shù)據(jù);音頻解碼部,其對(duì)從上述抖動(dòng)吸收緩沖器輸出的分組所包含的音頻編碼數(shù)據(jù)進(jìn)行解碼而生成語(yǔ)音的音頻數(shù)據(jù);語(yǔ)速變換部,其進(jìn)行對(duì)由上述音頻解碼部解碼后的上述音頻數(shù)據(jù)的再現(xiàn)速度進(jìn)行變換的語(yǔ)速變換;以及控制部,其根據(jù)上述抖動(dòng)吸收緩沖器中的分組的蓄積狀況,控制由上述背景噪聲生成部生成的上述背景噪聲的時(shí)間長(zhǎng)度,并且控制由上述語(yǔ)速變換部所變換的上述再現(xiàn)速度。
[0008]根據(jù)本發(fā)明,通過具有:抖動(dòng)吸收緩沖器,其臨時(shí)蓄積接收到的分組,并在規(guī)定的輸出定時(shí)輸出該分組;背景噪聲生成部,其根據(jù)從上述抖動(dòng)吸收緩沖器輸出的分組所包含的背景噪聲數(shù)據(jù)生成背景噪聲的音頻數(shù)據(jù);音頻解碼部,其對(duì)從上述抖動(dòng)吸收緩沖器輸出的分組所包含的音頻編碼數(shù)據(jù)進(jìn)行解碼而生成語(yǔ)音的音頻數(shù)據(jù);語(yǔ)速變換部,其進(jìn)行對(duì)由上述音頻解碼部解碼后的上述音頻數(shù)據(jù)的再現(xiàn)速度進(jìn)行變換的語(yǔ)速變換;以及控制部,其根據(jù)上述抖動(dòng)吸收緩沖器中的分組的蓄積狀況,控制由上述背景噪聲生成部生成的上述背景噪聲的時(shí)間長(zhǎng)度,并且控制由上述語(yǔ)速變換部所變換的上述再現(xiàn)速度,由此,即使在應(yīng)用無(wú)聲壓縮時(shí)也能夠防止通話質(zhì)量劣化。
【專利附圖】
【附圖說明】
[0009]圖1是本發(fā)明實(shí)施方式I中的音頻解碼裝置的功能塊結(jié)構(gòu)圖。
[0010]圖2是示出分組的時(shí)間戳與抖動(dòng)吸收緩沖器的蓄積之間的關(guān)系的說明圖。
[0011]圖3是本發(fā)明實(shí)施方式2中的音頻解碼裝置的功能塊結(jié)構(gòu)圖。
[0012]圖4是本發(fā)明實(shí)施方式3中的音頻解碼裝置的功能塊結(jié)構(gòu)圖。
[0013]圖5是本發(fā)明實(shí)施方式4中的音頻解碼裝置的功能塊結(jié)構(gòu)圖。
[0014]圖6是本發(fā)明實(shí)施方式5中的音頻解碼裝置的功能塊結(jié)構(gòu)圖。
[0015]圖7是示出分組的時(shí)間戳與抖動(dòng)吸收緩沖器的蓄積之間的關(guān)系的說明圖。
[0016]標(biāo)號(hào)說明
[0017]1:抖動(dòng)吸收緩沖器;2:背景噪聲生成部;3:音頻解碼部;4:語(yǔ)速變換部;5:輸出緩沖器;6:輸出緩沖器監(jiān)視部;7:控制部;71:緩沖器余量監(jiān)視部;72:控制信號(hào)輸出部;73:到達(dá)速度監(jiān)視部;8:高精度無(wú)聲壓縮部;9:音頻檢測(cè)部;10:音頻編碼部;11:無(wú)聲壓縮控制部;12:背景噪聲數(shù)據(jù)檢測(cè)/插入部;20:音頻解碼裝置;21:音頻編碼裝置。
【具體實(shí)施方式】
[0018]以下,說明本發(fā)明的實(shí)施方式。另外,以下的實(shí)施方式是本發(fā)明的一個(gè)例子,本發(fā)明并不受以下的實(shí)施方式限定。
[0019]實(shí)施方式1.[0020]圖1是示出本發(fā)明的一個(gè)實(shí)施例的音頻解碼裝置的功能塊結(jié)構(gòu)圖。
[0021]在圖1中,抖動(dòng)吸收緩沖器I臨時(shí)蓄積接收到的分組,并在規(guī)定的輸出定時(shí)輸出該分組。背景噪聲生成部2根據(jù)從抖動(dòng)吸收緩沖器I輸出的分組所包含的背景噪聲數(shù)據(jù),生成背景噪聲的音頻數(shù)據(jù)。音頻解碼部3對(duì)從抖動(dòng)吸收緩沖器I輸出的分組所包含的音頻編碼數(shù)據(jù)進(jìn)行解碼而生成語(yǔ)音的音頻數(shù)據(jù)。語(yǔ)速變換部4進(jìn)行對(duì)由音頻解碼部3解碼后的音頻數(shù)據(jù)的再現(xiàn)速度進(jìn)行變換的語(yǔ)速變換。輸出緩沖器5對(duì)由上述背景噪聲生成部2生成的背景噪聲的音頻數(shù)據(jù)和由上述音頻解碼部3生成的語(yǔ)音的音頻數(shù)據(jù)進(jìn)行臨時(shí)蓄積。輸出緩沖器監(jiān)視部6監(jiān)視輸出緩沖器5所蓄積的音頻數(shù)據(jù)的蓄積量,并根據(jù)該蓄積量對(duì)抖動(dòng)吸收緩沖器I指示臨時(shí)蓄積的分組的輸出定時(shí)??刂撇?根據(jù)抖動(dòng)吸收緩沖器I中的分組的蓄積狀況,控制由背景噪聲生成部2生成的背景噪聲的時(shí)間長(zhǎng)度,并且控制由語(yǔ)速變換部4變換后的再現(xiàn)速度。
[0022]在本實(shí)施方式中,控制部7具有緩沖器余量監(jiān)視部71和控制信號(hào)輸出部72。緩沖器余量監(jiān)視部71監(jiān)視抖動(dòng)吸收緩沖器I的余量,作為抖動(dòng)吸收緩沖器I中的分組的蓄積狀況??刂菩盘?hào)輸出部72根據(jù)由緩沖器余量監(jiān)視部71監(jiān)視到的抖動(dòng)吸收緩沖器余量,輸出對(duì)由背景噪聲生成部2生成的背景噪聲的時(shí)間長(zhǎng)度進(jìn)行控制的時(shí)間長(zhǎng)度控制信號(hào)、和對(duì)由語(yǔ)速變換部4所變換的再現(xiàn)速度進(jìn)行控制的再現(xiàn)速度控制信號(hào)。
[0023]接著對(duì)動(dòng)作進(jìn)行說明。
[0024]另外,在本實(shí)施方式中,說明在用戶與用戶的通話對(duì)方的兩者之間進(jìn)行語(yǔ)音通話的情況下的動(dòng)作,但本發(fā)明并不受其限定。[0025]首先,當(dāng)用戶的通話對(duì)方發(fā)聲時(shí),其語(yǔ)音在通話對(duì)方側(cè)被編碼而形成分組,并通過網(wǎng)絡(luò)在用戶側(cè)被接收。這樣在用戶側(cè)接收到從通話對(duì)方側(cè)發(fā)送的分組時(shí),抖動(dòng)吸收緩沖器I對(duì)該接收到的分組進(jìn)行臨時(shí)蓄積。抖動(dòng)吸收緩沖器I蓄積預(yù)先確定的初始延遲量的分組后依次輸出臨時(shí)蓄積的分組,以吸收分組到達(dá)延遲的波動(dòng)即抖動(dòng),使得能夠在平滑化后的定時(shí)輸出分組。其中,來(lái)自抖動(dòng)吸收緩沖器I的輸出定時(shí)依照來(lái)自輸出緩沖器監(jiān)視部6的指示。
[0026]從抖動(dòng)吸收緩沖器I輸出的分組被分為包含背景噪聲數(shù)據(jù)的背景噪聲分組、和包含音頻編碼數(shù)據(jù)的音頻分組進(jìn)行處理。在音頻分組的情況下,該分組被輸入到音頻解碼部3,在背景噪聲分組的情況下,該分組被輸入到背景噪聲生成部2。與背景噪聲分組一起,將該背景噪聲分組與下一分組的時(shí)間差、例如分別表示賦予給背景噪聲分組和下一分組的發(fā)送時(shí)間的時(shí)間戳值的差作為背景噪聲生成時(shí)間長(zhǎng)度從抖動(dòng)吸收緩沖器I傳遞給背景噪聲生成部2。
[0027]使用圖說明詳細(xì)的動(dòng)作。圖2是示出分組的時(shí)間戳與抖動(dòng)吸收緩沖器的蓄積之間的關(guān)系的說明圖。
[0028]在圖2中,包含t時(shí)間的音頻編碼數(shù)據(jù)的音頻分組# U# 2、# 4,以及包含背景噪聲數(shù)據(jù)的背景噪聲分組# 3分別按照# 1、# 2、# 3、# 4的順序到達(dá),并臨時(shí)蓄積到抖動(dòng)吸收緩沖器I中。
[0029]當(dāng)對(duì)作為背景噪聲分組的# 3的分組賦予序號(hào)N、時(shí)間戳值M時(shí),# I分組的序號(hào)為N — 2、# 2分組的序號(hào)為N — 1、# 4分組的序號(hào)為N + I, # I分組的時(shí)間戳值為M —2t、# 2分組的時(shí)間戳值為M— t。# 4分組的時(shí)間戳值成為經(jīng)過了噪聲區(qū)間長(zhǎng)度即T時(shí)間后的時(shí)間、即M +T。背景噪聲生成時(shí)間長(zhǎng)度成為背景噪聲分組即# 3分組與下一分組即# 4分組的時(shí)間戳值的差,即(M + T) — M = T。
[0030]被輸入了背景噪聲分組和背景噪聲生成時(shí)間長(zhǎng)度的背景噪聲生成部2根據(jù)背景噪聲分組中所存儲(chǔ)的背景噪聲數(shù)據(jù)生成背景噪聲,使背景噪聲的生成持續(xù)背景噪聲生成時(shí)間長(zhǎng)度,并作為背景噪聲的音頻數(shù)據(jù)輸出到輸出緩沖器5。
[0031]被輸入了音頻分組的音頻解碼部3通過對(duì)音頻分組中所存儲(chǔ)的音頻編碼數(shù)據(jù)進(jìn)行解碼來(lái)生成語(yǔ)音的音頻數(shù)據(jù),并輸出到語(yǔ)速變換部4。由語(yǔ)速變換部4處理后的語(yǔ)音的音頻數(shù)據(jù)被輸入給輸出緩沖器5。
[0032]輸出緩沖器監(jiān)視部6監(jiān)視輸出緩沖器5所蓄積的音頻數(shù)據(jù)的有無(wú)(所蓄積的音頻數(shù)據(jù)的蓄積量),在判斷為沒有來(lái)自背景噪聲生成部2和語(yǔ)速變換部4的輸入(比規(guī)定的量少)的情況下,對(duì)抖動(dòng)吸收緩沖器I指示分組的輸出定時(shí),以輸出蓄積在抖動(dòng)吸收緩沖器I中的I個(gè)分組。
[0033]緩沖器余量監(jiān)視部71監(jiān)視臨時(shí)蓄積在抖動(dòng)吸收緩沖器I中的分組的量,在緩沖器余量少于某個(gè)閾值A(chǔ)的情況下,將“小”通知給控制信號(hào)輸出部72,在多于某個(gè)閾值B的情況下,將“大”通知給控制信號(hào)輸出部72,當(dāng)在某個(gè)閾值A(chǔ)以上且在某個(gè)閾值B以下的情況下,將“中”通知給控制信號(hào)輸出部72。
[0034]接收到來(lái)自緩沖器余量監(jiān)視部71的通知的控制信號(hào)輸出部72輸出時(shí)間長(zhǎng)度控制信號(hào)和再現(xiàn)速度控制信號(hào),該時(shí)間長(zhǎng)度控制信號(hào)(指示)控制成抖動(dòng)吸收緩沖器I的緩沖器余量越大則越縮短背景噪聲生成時(shí)間長(zhǎng)度,該再現(xiàn)速度控制信號(hào)(指示)控制成抖動(dòng)吸收緩沖器I的緩沖器余量越大則越加快語(yǔ)速進(jìn)行再現(xiàn)。
[0035]例如,根據(jù)表1記載的控制內(nèi)容,如果被通知了 “小”,則向背景噪聲生成部2發(fā)出延長(zhǎng)背景噪聲生成時(shí)間長(zhǎng)度的指示、例如延長(zhǎng)為1.1倍的指示,向語(yǔ)速變換部4發(fā)出緩慢進(jìn)行再現(xiàn)的指示、例如減慢為0.8倍的指示。如果被通知了“大”,則向背景噪聲生成部2發(fā)出縮短背景噪聲生成時(shí)間長(zhǎng)度的指示、例如縮短為0.9倍的指示,向語(yǔ)速變換部4發(fā)出加快再現(xiàn)的指示、例如加快為1.2倍的指示。如果被通知了“中”,則向背景噪聲生成部2發(fā)出將背景噪聲生成時(shí)間長(zhǎng)度設(shè)為通常長(zhǎng)度的指示、例如為1.0倍的指示,向語(yǔ)速變換部4發(fā)出將再現(xiàn)設(shè)為通常速度的指示、例如為1.0倍的指示。
[0036]【表1】
【權(quán)利要求】
1.一種音頻解碼裝置,其特征在于,具有: 抖動(dòng)吸收緩沖器,其臨時(shí)蓄積接收到的分組,并在規(guī)定的輸出定時(shí)輸出該分組; 背景噪聲生成部,其根據(jù)從上述抖動(dòng)吸收緩沖器輸出的分組所包含的背景噪聲數(shù)據(jù),生成背景噪聲的音頻數(shù)據(jù); 音頻解碼部,其對(duì)從上述抖動(dòng)吸收緩沖器輸出的分組所包含的音頻編碼數(shù)據(jù)進(jìn)行解碼而生成語(yǔ)音的音頻數(shù)據(jù); 語(yǔ)速變換部,其進(jìn)行對(duì)由上述音頻解碼部解碼后的上述音頻數(shù)據(jù)的再現(xiàn)速度進(jìn)行變換的語(yǔ)速變換;以及 控制部,其根據(jù)上述抖動(dòng)吸收緩沖器中的分組的蓄積狀況,控制由上述背景噪聲生成部生成的上述背景噪聲的時(shí)間長(zhǎng)度,并且控制由上述語(yǔ)速變換部所變換的上述再現(xiàn)速度。
2.根據(jù)權(quán)利要求1所述的音頻解碼裝置,其特征在于, 上述控制部具有: 緩沖器余量監(jiān)視部,其監(jiān)視上述抖動(dòng)吸收緩沖器的余量,作為上述蓄積狀況;以及控制信號(hào)輸出部,其根據(jù)由上述緩沖器余量監(jiān)視部監(jiān)視到的上述余量,輸出控制由上述背景噪聲生成部生成的上述背景噪聲的時(shí)間長(zhǎng)度的時(shí)間長(zhǎng)度控制信號(hào)、和控制由上述語(yǔ)速變換部所變換的上述再現(xiàn)速度的再現(xiàn)速度控制信號(hào)。
3.根據(jù)權(quán)利要求 1所述的音頻解碼裝置,其特征在于, 上述控制部具有: 到達(dá)速度監(jiān)視部,其監(jiān)視上述接收到的分組到達(dá)上述抖動(dòng)吸收緩沖器的到達(dá)速度,作為上述蓄積狀況;以及 控制信號(hào)輸出部,其根據(jù)由上述到達(dá)速度監(jiān)視部監(jiān)視到的上述到達(dá)速度,輸出控制由上述背景噪聲生成部生成的上述背景噪聲的時(shí)間長(zhǎng)度的時(shí)間長(zhǎng)度控制信號(hào)、和控制由上述語(yǔ)速變換部所變換的上述再現(xiàn)速度的再現(xiàn)速度控制信號(hào)。
4.根據(jù)權(quán)利要求1所述的音頻解碼裝置,其特征在于, 上述音頻解碼裝置具有高精度無(wú)聲壓縮部,上述高精度無(wú)聲壓縮部對(duì)上述接收到的分組進(jìn)行分析,在從該分組所包含的音頻編碼數(shù)據(jù)中檢測(cè)到無(wú)聲/噪聲區(qū)間的情況下,將上述分組置換為包含背景噪聲數(shù)據(jù)的背景噪聲分組,在沒有檢測(cè)到上述無(wú)聲/噪聲區(qū)間的情況下,在不進(jìn)行置換的情況下輸出上述分組, 上述抖動(dòng)吸收緩沖器對(duì)從上述高精度無(wú)聲壓縮部輸出的分組進(jìn)行臨時(shí)蓄積。
5.根據(jù)權(quán)利要求1所述的音頻解碼裝置,其特征在于, 上述音頻解碼裝置具有檢測(cè)用戶有無(wú)發(fā)聲的音頻檢測(cè)部, 上述抖動(dòng)吸收緩沖器在由上述音頻檢測(cè)部檢測(cè)到存在用戶的發(fā)聲的情況下,返回到初始狀態(tài)。
6.根據(jù)權(quán)利要求1所述的音頻解碼裝置,其特征在于, 上述音頻解碼裝置具有背景噪聲數(shù)據(jù)檢測(cè)/插入部,上述背景噪聲數(shù)據(jù)檢測(cè)/插入部檢測(cè)上述接收到的分組是否包含背景噪聲數(shù)據(jù),在檢測(cè)到包含背景噪聲數(shù)據(jù)的情況下,將個(gè)數(shù)與上述背景噪聲數(shù)據(jù)的無(wú)聲/噪聲區(qū)間的時(shí)間長(zhǎng)度相當(dāng)?shù)南率龇纸M插入到上述抖動(dòng)吸收緩沖器中,該分組的每I個(gè)分組的時(shí)間長(zhǎng)度與包含音頻編碼數(shù)據(jù)的分組的每I個(gè)分組的時(shí)間長(zhǎng)度相等。
7.根據(jù)權(quán)利要求1所述的音頻解碼裝置,其特征在于,具有: 輸出緩沖器,其臨時(shí)蓄積上述背景噪聲的音頻數(shù)據(jù)和上述語(yǔ)音的音頻數(shù)據(jù);以及輸出緩沖器監(jiān)視部,其監(jiān)視上述輸出緩沖器所蓄積的上述音頻數(shù)據(jù)的蓄積量,并根據(jù)該蓄積量對(duì)上述抖動(dòng)吸收緩沖器指示臨時(shí)蓄積的上述分組的輸出定時(shí), 上述抖動(dòng)吸收緩沖器根據(jù)來(lái)自上述輸出緩沖器監(jiān)視部的指示,輸出臨時(shí)蓄積的上述分組。
【文檔編號(hào)】G10L21/043GK104022967SQ201410058259
【公開日】2014年9月3日 申請(qǐng)日期:2014年2月20日 優(yōu)先權(quán)日:2013年2月28日
【發(fā)明者】伏見涉, 鈴木茂明, 山浦正 申請(qǐng)人:三菱電機(jī)株式會(huì)社