亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

處理音頻信號(hào)的方法和裝置制造方法

文檔序號(hào):2827758閱讀:157來(lái)源:國(guó)知局
處理音頻信號(hào)的方法和裝置制造方法
【專(zhuān)利摘要】本發(fā)明涉及處理音頻信號(hào)的方法和裝置,其中用于處理音頻信號(hào)的方法包括:對(duì)音頻信號(hào)執(zhí)行頻率轉(zhuǎn)換處理以獲得多個(gè)頻率轉(zhuǎn)換系數(shù)的步驟;基于脈沖比來(lái)選擇一般模式或非一般模式,用于在多個(gè)頻率轉(zhuǎn)換系數(shù)之中具有高頻帶的頻率轉(zhuǎn)換系數(shù)的步驟;以及如果選擇非一般模式,則執(zhí)行以下步驟的步驟:從具有高頻帶的頻率轉(zhuǎn)換系數(shù)提取預(yù)定數(shù)目的脈沖,以及生成脈沖信息;從具有高頻帶的頻率轉(zhuǎn)換系數(shù)生成原始噪聲信號(hào),排除脈沖;使用多個(gè)頻率轉(zhuǎn)換系數(shù)之中具有低頻帶的頻率轉(zhuǎn)換系數(shù)生成基準(zhǔn)噪聲信號(hào);以及使用原始噪聲信號(hào)和基準(zhǔn)噪聲信號(hào)生成噪聲位置信息和噪聲能量信息。
【專(zhuān)利說(shuō)明】處理音頻信號(hào)的方法和裝置
[0001] 本申請(qǐng)是2012年9月13日提交的國(guó)際申請(qǐng)日為2011年1月17日的申請(qǐng)?zhí)枮?201180013842. 5 (PCT/KR2011/000324)的,發(fā)明名稱(chēng)為"處理音頻信號(hào)的方法和裝置"的專(zhuān) 利申請(qǐng)的分案申請(qǐng)。

【技術(shù)領(lǐng)域】
[0002] 本發(fā)明涉及一種用于編碼或解碼音頻信號(hào)的音頻信號(hào)處理方法和裝置。

【背景技術(shù)】
[0003] 通常,音頻信號(hào)包括具有多種頻率的信號(hào)。人耳聽(tīng)得見(jiàn)的頻率范圍是20Hz到 20kHz,并且人聲通常在約200Hz到3kHz的范圍內(nèi)。
[0004] 在具有不存在人聲的7kHz或更大的高頻帶的音頻信號(hào)的編碼中,多個(gè)編譯模式 或編譯方案之一根據(jù)音頻特性是可應(yīng)用的。


【發(fā)明內(nèi)容】

[0005]【技術(shù)問(wèn)題】
[0006] 如果應(yīng)用不適用于音頻特性的編譯模式或編譯方案,則聲音質(zhì)量會(huì)劣化。
[0007] 【技術(shù)的解決方案】
[0008] 本發(fā)明的目標(biāo)在于提供用于對(duì)諸如敲打聲的、在特定頻帶中具有高能量的信號(hào)的 脈沖單獨(dú)編碼的音頻信號(hào)處理方法和裝置。
[0009] 本發(fā)明的另一個(gè)目標(biāo)在于提供用于對(duì)諸如弦音的具有諧波的信號(hào)的諧波軌跡 (harmonic track)單獨(dú)編碼的音頻信號(hào)處理方法和裝置。
[0010] 本發(fā)明的另一個(gè)目標(biāo)在于提供用于基于脈沖比和/或諧波比應(yīng)用適用于音頻特 性的編譯模式的音頻信號(hào)處理方法和裝置。
[0011] 【有益效果】
[0012] 本發(fā)明提供以下效果和優(yōu)點(diǎn)。
[0013] 首先,在特定頻帶中具有高能量的信號(hào)中,僅對(duì)信號(hào)的特定頻帶的脈沖進(jìn)行單獨(dú) 編碼。從而,恢復(fù)率高于僅使用低頻帶的編碼模式(一般模式)的恢復(fù)率,并且從而能夠顯 著改進(jìn)聲音質(zhì)量。
[0014] 第二,在包括諧波的信號(hào)中,不分別編碼對(duì)應(yīng)于諧波的脈沖,而是對(duì)整體諧波軌跡 編碼。從而,可以在不增加比特?cái)?shù)的情況下增加恢復(fù)率。
[0015] 第三,通過(guò)根據(jù)幀的音頻特性適應(yīng)性地應(yīng)用對(duì)應(yīng)于總計(jì)四個(gè)模式的編碼和解碼方 案中的一個(gè),可以改進(jìn)聲音質(zhì)量。
[0016] 第四,在應(yīng)用修改后的離散余弦變換(MDCT)的情況下,由于根據(jù)MDCT特性提取主 脈沖和與其鄰近的子脈沖以便準(zhǔn)確地提取映射至特定頻帶的脈沖,可以增加非一般模式編 碼方案的性能。
[0017] 第五,通過(guò)在諧波模式下從多個(gè)諧波軌跡提取并且單獨(dú)量化僅最佳脈沖和與其鄰 近的脈沖,可以減少比特?cái)?shù)。
[0018] 第六,在諧波模式下,由于相對(duì)于屬于具有相同節(jié)距(pitch)的一組的諧波軌跡 將開(kāi)始位置設(shè)置為預(yù)定位置中的一個(gè),所以可以在多個(gè)諧波軌跡的開(kāi)始位置的顯示中減少 比特?cái)?shù)。

【專(zhuān)利附圖】

【附圖說(shuō)明】
[0019] 圖1是示出根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的編碼器的配置的示意圖。
[0020] 圖2是示出確定幀間相似度(音調(diào))的實(shí)例的示意圖。
[0021] 圖3是示出在一般模式或非一般模式下被適當(dāng)編譯的信號(hào)的實(shí)例的示意圖。
[0022] 圖4是示出一般模式編碼單元140的詳細(xì)配置的示意圖。
[0023] 圖5是示出在一般模式下執(zhí)行編碼的情況下的語(yǔ)法的實(shí)例的示意圖。
[0024] 圖6是示出非一般模式編碼單元150的詳細(xì)配置的示意圖。
[0025] 圖7和圖8是示出脈沖提取處理的示意圖。
[0026] 圖9是示出脈沖提取之前的信號(hào)(SWB信號(hào))和脈沖提取之后的信號(hào)(原始噪聲 信號(hào))的實(shí)例的示意圖。
[0027] 圖10是示出基準(zhǔn)噪聲生成處理的示意圖。
[0028] 圖11是示出在非一般模式下執(zhí)行編碼的情況下的語(yǔ)法的實(shí)例的示意圖。
[0029] 圖12是示出在一般模式和非一般模式下對(duì)特定音頻信號(hào)進(jìn)行編碼的結(jié)果的示意 圖。
[0030] 圖13是示出諧波比確定單元160的詳細(xì)配置的示意圖。
[0031] 圖14是不出具有1?諧波比的首頻/[目號(hào)的不意圖。
[0032] 圖15是示出非諧波模式編碼單元170的詳細(xì)配置的示意圖。
[0033] 圖16是示出在非諧波模式的情況下提取固定脈沖的規(guī)則的示意圖。
[0034] 圖17是示出在非諧波模式下執(zhí)行編碼的情況下的語(yǔ)法的實(shí)例的示意圖。
[0035] 圖18是示出諧波模式編碼單元180的詳細(xì)配置的示意圖。
[0036] 圖19是示出諧波軌跡的提取的示意圖。
[0037] 圖20是示出諧波軌跡位置信息的量化的示意圖。
[0038] 圖21是示出在諧波模式下執(zhí)行編碼的情況下的語(yǔ)法的示意圖。
[0039] 圖22是示出在非諧波模式和諧波模式下對(duì)特定音頻信號(hào)編碼的結(jié)果的示意圖。
[0040] 圖23是示出根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的解碼器的配置的示意圖。
[0041] 圖24是示出其中實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的產(chǎn)品的配置的示 意圖。
[0042] 圖25是示出其中實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的產(chǎn)品之間的關(guān)系 的示意圖。

【具體實(shí)施方式】
[0043] 【最佳模式】
[0044] 根據(jù)本發(fā)明的一方面,提供一種音頻信號(hào)處理方法,包括:相對(duì)于音頻信號(hào)執(zhí)行 頻率轉(zhuǎn)換以獲取多個(gè)頻率轉(zhuǎn)換系數(shù),相對(duì)于在多個(gè)頻率轉(zhuǎn)換系數(shù)之中高頻帶的頻率轉(zhuǎn)換系 數(shù),基于脈沖比來(lái)選擇一般模式和非一般模式中的一個(gè),以及如果選擇非一般模式,則執(zhí)行 以下步驟:從高頻帶的頻率轉(zhuǎn)換系數(shù)提取預(yù)定數(shù)目的脈沖并且生成脈沖信息,從高頻帶的 頻率轉(zhuǎn)換系數(shù)排除脈沖來(lái)生成原始噪聲信號(hào),使用在多個(gè)頻率轉(zhuǎn)換系數(shù)之中低頻帶的頻率 轉(zhuǎn)換系數(shù)來(lái)生成基準(zhǔn)噪聲信號(hào),以及使用原始噪聲信號(hào)和基準(zhǔn)噪聲信號(hào)來(lái)生成噪聲位置信 息和噪聲能量信息。
[0045] 脈沖比可以是多個(gè)脈沖的能量與當(dāng)前幀的總能量的比。
[0046] 提取預(yù)定數(shù)目的脈沖可以包括:提取主脈沖最高能量,提取鄰近主脈沖的子脈沖, 以及從高頻帶的頻率轉(zhuǎn)換系數(shù)排除主脈沖和子脈沖以便生成目標(biāo)噪聲信號(hào),并且主脈沖和 子脈沖的提取被重復(fù)預(yù)定次數(shù),以便生成目標(biāo)噪聲信號(hào)。
[0047] 脈沖信息可以包括脈沖位置信息、脈沖符號(hào)信息、脈沖幅度信息和脈沖子帶信息 中的至少一個(gè)。
[0048] 生成基準(zhǔn)噪聲信號(hào)可以包括:基于低頻帶的總能量設(shè)置閾值,以及排除超過(guò)閾值 的脈沖以便生成基準(zhǔn)噪聲信號(hào)。
[0049] 生成噪聲能量信息可以包括:生成預(yù)定數(shù)目的脈沖的能量,生成原始噪聲信號(hào)的 能量,使用脈沖的能量和原始噪聲信號(hào)的能量來(lái)獲取脈沖比,以及生成脈沖比作為噪聲能 量信息。
[0050] 根據(jù)本發(fā)明的另一方面,提供一種音頻信號(hào)處理裝置,包括:頻率轉(zhuǎn)換單元,其被 配置成相對(duì)于音頻信號(hào)執(zhí)行頻率轉(zhuǎn)換,以便獲取多個(gè)頻率轉(zhuǎn)換系數(shù);脈沖比確定單元,其被 配置成相對(duì)于在多個(gè)頻率轉(zhuǎn)換系數(shù)之中的高頻帶的頻率轉(zhuǎn)換系數(shù),基于脈沖比來(lái)選擇一般 模式和非一般模式之一;以及非一般模式編碼單兀,其被配置成在非一般模式下操作并且 包括:脈沖提取器,其被配置成從高頻帶的頻率轉(zhuǎn)換系數(shù)提取預(yù)定數(shù)目的脈沖并且生成脈 沖信息;基準(zhǔn)噪聲發(fā)生器,其被配置成使用在多個(gè)頻率轉(zhuǎn)換系數(shù)之中的低頻帶的頻率轉(zhuǎn)換 系數(shù)來(lái)生成基準(zhǔn)噪聲信號(hào);以及噪聲搜索單元,其被配置成使用原始噪聲信號(hào)和基準(zhǔn)噪聲 信號(hào)來(lái)生成噪聲位置信息和噪聲能量信息,其中,通過(guò)從高頻帶的頻率轉(zhuǎn)換系數(shù)排除脈沖 來(lái)生成原始噪聲信號(hào)。
[0051] 根據(jù)本發(fā)明的另一方面,提供一種音頻信號(hào)處理方法,包括:接收指示當(dāng)前幀是處 于一般模式還是非一般模式的第二模式信息;如果第二模式信息指示當(dāng)前幀處于非一般模 式,則接收脈沖信息、噪聲位置信息和噪聲能量信息;使用脈沖信息來(lái)生成相對(duì)于頻率轉(zhuǎn)換 系數(shù)的預(yù)定數(shù)目的脈沖;使用對(duì)應(yīng)于噪聲位置信息的低頻帶的頻率轉(zhuǎn)換系數(shù)來(lái)生成基準(zhǔn)噪 聲信號(hào);使用噪聲能量信息來(lái)調(diào)節(jié)基準(zhǔn)噪聲信號(hào)的能量;以及使用基準(zhǔn)噪聲信號(hào)、被調(diào)節(jié) 的能量、以及多個(gè)脈沖來(lái)生成對(duì)應(yīng)于高頻帶的頻率轉(zhuǎn)換系數(shù)。
[0052] 根據(jù)本發(fā)明的另一方面,提供一種音頻信號(hào)處理方法,包括:接收音頻信號(hào),相對(duì) 于音頻信號(hào)執(zhí)行頻率轉(zhuǎn)換以便獲取多個(gè)頻率轉(zhuǎn)換系數(shù),相對(duì)于頻率轉(zhuǎn)換系數(shù)、基于諧波比 來(lái)選擇非諧波模式和諧波模式中的一個(gè),并且如果選擇諧波模式,則執(zhí)行以下步驟:判定對(duì) 應(yīng)于第一節(jié)距的第一組的諧波軌跡,判定對(duì)應(yīng)于第二節(jié)距的第二組的諧波軌跡,以及生成 多個(gè)諧波軌跡的開(kāi)始位置信息,其中,第一組的諧波軌跡包括第一諧波軌跡和第二諧波軌 跡,其中,第二組的諧波軌跡包括第三諧波軌跡和第四諧波軌跡,其中,第一諧波軌跡和第 三諧波軌跡的開(kāi)始位置信息對(duì)應(yīng)于第一位置集合中的一個(gè),并且其中,第二諧波軌跡和第 四諧波軌跡的開(kāi)始位置信息對(duì)應(yīng)于第二位置集合中的一個(gè)。
[0053] 可以基于多個(gè)諧波軌跡的能量和多個(gè)脈沖的能量來(lái)生成諧波比。
[0054] 第一位置集合可以對(duì)應(yīng)于偶數(shù)位置,并且第二位置集合可以對(duì)應(yīng)于奇數(shù)位置。
[0055] 音頻信號(hào)處理方法可以進(jìn)一步包括:生成第一目標(biāo)矢量,所述第一目標(biāo)矢量包括 第一諧波軌跡中的最佳脈沖和與其鄰近的脈沖以及第二諧波軌跡中的最佳脈沖和與其鄰 近的脈沖;生成第二目標(biāo)矢量,所述第二目標(biāo)矢量包括第三諧波軌跡中的最佳脈沖和與其 鄰近的脈沖以及第四諧波軌跡中的最佳脈沖和與其鄰近的脈沖;矢量-量化第一目標(biāo)矢量 和第二目標(biāo)矢量;以及相對(duì)于從諧波軌跡排除第一目標(biāo)矢量和第二目標(biāo)矢量的殘余部分來(lái) 執(zhí)行頻率轉(zhuǎn)換。
[0056] 第一諧波軌跡可以是具有第一節(jié)距的多個(gè)脈沖的集合,第二諧波軌跡可以是具有 第一節(jié)距的多個(gè)脈沖的集合,第三諧波軌跡可以是具有第二節(jié)距的多個(gè)脈沖的集合,以及 第四諧波軌跡可以是具有第二節(jié)距的多個(gè)脈沖的集合。
[0057] 音頻信號(hào)處理方法可以進(jìn)一步包括:生成指示第一節(jié)距和第二節(jié)距的節(jié)距信息。
[0058] 根據(jù)本發(fā)明的另一方面,提供一種音頻信號(hào)處理方法,包括:接收包括對(duì)應(yīng)于第一 節(jié)距的第一組的諧波軌跡和對(duì)應(yīng)于第二節(jié)距的第二組的諧波軌跡的多個(gè)諧波軌跡的開(kāi)始 位置信息;生成對(duì)應(yīng)于開(kāi)始位置信息的多個(gè)諧波軌跡;以及使用多個(gè)諧波軌跡來(lái)生成對(duì)應(yīng) 于當(dāng)前幀的音頻信號(hào),其中,第一組的諧波軌跡包括第一諧波軌跡和第二諧波軌跡,其中, 第二組的諧波軌跡包括第三諧波軌跡和第四諧波軌跡,其中,第一諧波軌跡和第三諧波軌 跡的開(kāi)始位置信息對(duì)應(yīng)于第一位置集合中的一個(gè),并且其中,第二諧波軌跡和第四諧波軌 跡的開(kāi)始位置信息對(duì)應(yīng)于第二位置集合中的一個(gè)。
[0059] 根據(jù)本發(fā)明的一方面,提供一種音頻信號(hào)處理方法,包括:相對(duì)于音頻信號(hào)執(zhí)行頻 率轉(zhuǎn)換,以便獲取多個(gè)頻率轉(zhuǎn)換系數(shù);相對(duì)于頻率轉(zhuǎn)換系數(shù)、基于幀間相似度來(lái)選擇非音 調(diào)模式和音調(diào)模式;如果選擇非音調(diào)模式,貝 1J基于脈沖比來(lái)選擇一般模式和非一般模式中 的一個(gè);如果選擇音調(diào)模式,則基于諧波比來(lái)選擇非諧波模式和諧波模式中的一個(gè);以及 根據(jù)所選模式對(duì)音頻信號(hào)進(jìn)行編碼以便生成參數(shù),其中,參數(shù)包括一般模式下的包絡(luò)位置 信息和縮放信息,其中,參數(shù)包括非一般模式下的脈沖信息和噪聲能量信息,其中,在非諧 波模式下,參數(shù)包括作為關(guān)于固定脈沖的信息的固定脈沖信息、每子帶預(yù)定的數(shù)目,并且其 中,參數(shù)包括在諧波模式下的第一組的諧波軌跡的位置信息和第二組的諧波軌跡的位置信 肩、。
[0060] 音頻信號(hào)處理方法可以進(jìn)一步包括:根據(jù)所選模式來(lái)生成第一模式信息和第二模 式信息,第一模式信息可以指不非音調(diào)模式和音調(diào)模式中的一個(gè),并且如果第一模式信息 指示非音調(diào)模式,則第二模式信息可以指示一般模式或非一般模式中的一個(gè),并且如果第 一模式信息指示音調(diào)模式,則第二模式信息指示非諧波模式和諧波模式中的一個(gè)。
[0061] 根據(jù)本發(fā)明的另一方面,提供一種音頻信號(hào)處理方法,包括:通過(guò)比特流來(lái)提取第 一模式信息和第二模式信息;基于第一模式信息和第二模式信息來(lái)判定對(duì)應(yīng)于當(dāng)前幀的當(dāng) 前模式;如果當(dāng)前模式是一般模式,則使用包絡(luò)位置信息和縮放信息來(lái)恢復(fù)當(dāng)前幀的音頻 信號(hào);如果當(dāng)前模式是非一般模式,則使用脈沖信息和噪聲能量信息來(lái)恢復(fù)當(dāng)前幀的音頻 信號(hào);如果當(dāng)前模式是非諧波模式,則使用作為關(guān)于固定脈沖的信息的固定脈沖信息、每子 帶預(yù)定的數(shù)目來(lái)恢復(fù)當(dāng)前幀的音頻信號(hào),并且如果當(dāng)前模式是諧波模式,則使用第一組的 諧波軌跡的位置信息和第二組的諧波軌跡的位置信息來(lái)恢復(fù)當(dāng)前幀的音頻信號(hào)。
[0062]【本發(fā)明的模式】
[0063] 此后,參考附圖來(lái)詳細(xì)地描述本發(fā)明的示例性實(shí)施例。在本說(shuō)明書(shū)和權(quán)利要求中 使用的術(shù)語(yǔ)不限于其一般意義并且基于適當(dāng)?shù)囟x術(shù)語(yǔ)的概念的規(guī)則被解釋為適于本發(fā) 明的技術(shù)精神的意義和概念,以便可能以最佳方式圖示本發(fā)明。本說(shuō)明書(shū)中描述的實(shí)施例 和圖中示出的配置僅是示例性的并且可以做出多種修改及其等同物。
[0064] 在本發(fā)明中,以下術(shù)語(yǔ)可以基于以下標(biāo)準(zhǔn)解釋?zhuān)⑶以诖宋词褂玫男g(shù)語(yǔ)可以基于 以下標(biāo)準(zhǔn)解釋。術(shù)語(yǔ)編譯可以被解釋為編碼或解碼,并且術(shù)語(yǔ)信息包括值、參數(shù)、系數(shù)、元素 等,并且其意義可以根據(jù)環(huán)境不同地解釋?zhuān)⑶冶景l(fā)明不限于此。
[0065] 術(shù)語(yǔ)音頻信號(hào)在廣義上與術(shù)語(yǔ)視頻信號(hào)相區(qū)分,并且是指當(dāng)被回放時(shí)被可聽(tīng)識(shí)別 的信號(hào),并且在狹義上與語(yǔ)音信號(hào)相區(qū)分,并且是指語(yǔ)言特性不存在或很少的信號(hào)。在本 發(fā)明中,在廣義上解釋音頻信號(hào),并且當(dāng)用于區(qū)分語(yǔ)音信號(hào)時(shí),被解釋為具有狹義的音頻信 號(hào)。
[0066] 術(shù)語(yǔ)編譯可以?xún)H指編碼或可以包括編碼和解碼。
[0067] 圖1是示出根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的編碼器的配置的示意圖。根 據(jù)實(shí)施例的編碼器100包括脈沖比確定單元130、諧波比確定單元160、非一般模式編碼單 元150和諧波模式編碼單元180中的至少一個(gè),并且可以進(jìn)一步包括頻率轉(zhuǎn)換單元110、相 似度(音調(diào))確定單元120、一般模式編碼單元140和非諧波模式編碼單元180中的至少一 個(gè)。
[0068] 總之,存在總計(jì)四個(gè)編譯模式:1) 一般模式、2)非一般模式、3)非諧波模式以及4) 諧波模式。1) 一般模式和2)非一般模式對(duì)應(yīng)于非音調(diào)模式,以及3)非諧波模式和4)諧波 模式對(duì)應(yīng)于音調(diào)模式。
[0069] 關(guān)于是否應(yīng)用非音調(diào)模式或音調(diào)模式的確定由相似度確定單元120根據(jù)幀間相 似度作出。即,如果相似度不高,則應(yīng)用非音調(diào)模式,并且如果相似度高,則應(yīng)用音調(diào)模式。 在非音調(diào)模式的情況下,脈沖比確定單元130確定如果脈沖比(脈沖的能量與總能量的比) 高,則應(yīng)用1) 一般模式,并且確定如果脈沖比低,則應(yīng)用2)非一般模式。
[0070] 另外,在音調(diào)模式下,諧波比確定單元160確定如果諧波比(諧波軌跡的能量與脈 沖的能量的比)不高,則應(yīng)用3)非諧波模式,并且如果諧波比高,則應(yīng)用4)諧波模式。
[0071] 頻率轉(zhuǎn)換單元110相對(duì)于輸入音頻信號(hào)執(zhí)行頻率轉(zhuǎn)換,以便獲取多個(gè)頻率轉(zhuǎn)換系 數(shù)。修改的離散余弦變換(MDCT)方法、快速傅里葉變換(FFT)方法等可以被應(yīng)用于頻率轉(zhuǎn) 換,但是本發(fā)明不限于此。
[0072] 頻率轉(zhuǎn)換系數(shù)包括對(duì)應(yīng)于相對(duì)低頻帶的頻率轉(zhuǎn)換系數(shù)和對(duì)應(yīng)于高頻帶的頻率轉(zhuǎn) 換系數(shù)。低頻帶的頻率轉(zhuǎn)換系數(shù)被稱(chēng)為寬帶信號(hào)、WB信號(hào)或WB系數(shù),并且高頻帶的頻率轉(zhuǎn) 換系數(shù)被稱(chēng)為超寬帶信號(hào)、SWB信號(hào)或WB系數(shù)。用于劃分低頻帶和高頻帶的標(biāo)準(zhǔn)可以為約 7kHz,但是本發(fā)明不限于特定頻率。
[0073] 如果MDCT方法被用作頻率轉(zhuǎn)換方法,則相對(duì)于整個(gè)音頻信號(hào)可以生成總計(jì)640個(gè) 頻率轉(zhuǎn)換系數(shù)。此時(shí),對(duì)應(yīng)于最低帶的約280個(gè)系數(shù)可以稱(chēng)為WB信號(hào),并且對(duì)應(yīng)于下一個(gè) 帶的約280個(gè)系數(shù)可以稱(chēng)為SWB信號(hào)。然而,本發(fā)明不限于此。
[0074] 相似度確定單元120相對(duì)于輸入音頻信號(hào)來(lái)確定幀間相似度。幀間相似度涉及當(dāng) 前幀的頻率轉(zhuǎn)換系數(shù)的頻譜與先前幀的頻率轉(zhuǎn)換系數(shù)的頻譜相似的程度。幀間相似度可以 稱(chēng)為音調(diào)(tonality)。將省略用于幀間相似度的等式的描述。
[0075] 圖2是示出確定幀間相似度(音調(diào))的實(shí)例的示意圖。圖2(A)示出先前幀的頻 譜和當(dāng)前幀的頻譜的實(shí)例??梢灾庇^(guān)地看出,在約40到60的頻率窗口中相似度最低。從 圖2(B)可以看出,在約40到60的頻率窗口中相似度最低,類(lèi)似于直觀(guān)結(jié)果。
[0076] 作為經(jīng)由相似度確定單元120確定幀間相似度的結(jié)果,低相似度信號(hào)類(lèi)似于噪聲 并且對(duì)應(yīng)于非音調(diào)模式,并且高相似度信號(hào)不同于噪聲并且對(duì)應(yīng)于音調(diào)模式。指示幀是對(duì) 應(yīng)于非音調(diào)模式還是音調(diào)模式的第一模式信息被生成并且發(fā)送至解碼器。
[0077] 如果確定幀對(duì)應(yīng)于非音調(diào)模式(例如,如果第一模式信息是0),則將高頻帶的頻 率轉(zhuǎn)換系數(shù)發(fā)送至脈沖比確定單元130,并且如果確定幀對(duì)應(yīng)于音調(diào)模式(例如,如果第一 模式信息是1),則將系數(shù)發(fā)送至諧波比確定單元160。
[0078] 再次參考圖1,如果幀間相似度低,S卩,在非音調(diào)模式的情況下,激活脈沖比確定單 元 130。
[0079] 脈沖比確定單元130基于多個(gè)脈沖的能量與當(dāng)前幀的總能量的比,來(lái)確定一般模 式或非一般模式。術(shù)語(yǔ)脈沖是指在頻率轉(zhuǎn)換系數(shù)的域(例如,MDCT域)中具有相對(duì)高能量 的系數(shù)。
[0080] 圖3是示出在一般模式或非一般模式下適當(dāng)編譯的信號(hào)的實(shí)例的示意圖。參考圖 3 (A),可以看出,信號(hào)不是僅包括特定頻帶,而是包括所有頻帶。信號(hào)具有類(lèi)似于噪聲的性 能,可以在一般模式下被適當(dāng)?shù)鼐幾g。參考圖3 (B),可以看出,信號(hào)不包括所有頻帶,而是在 特定頻帶(線(xiàn))中具有高能量。特定頻帶在頻率轉(zhuǎn)換系數(shù)的域中可以表現(xiàn)為脈沖。如果該 脈沖的能量高于總能量,則脈沖比高,并且從而該信號(hào)可以在非一般模式下被適當(dāng)?shù)鼐幋a。 圖3(A)中所示的信號(hào)可以接近噪聲,并且圖3(b)中所示的信號(hào)可以接近敲打聲。
[0081] 由于通過(guò)脈沖比確定單元130從頻率轉(zhuǎn)換系數(shù)的域提取具有高能量的脈沖的處 理可以等于當(dāng)應(yīng)用非一般模式的編譯方法時(shí)執(zhí)行的脈沖提取處理,以下將描述非一般模式 編碼單元150的詳細(xì)配置。
[0082] 如果提取總計(jì)八個(gè)脈沖,則這可以表示如下。
[0083] [等式 1]
[0084] P (j) = max ({M32 (k+280)}2), j = 0, . . . , 7 k = 280, ...,560
[0085] 其中,M32(k)是SWB系數(shù)(高頻帶的頻率轉(zhuǎn)換系數(shù)),k是頻率轉(zhuǎn)換系數(shù)的索引, P (j)是脈沖(或峰值),以及j是脈沖索引。
[0086] 脈沖比可以由以下等式表示。
[0087] [等式 2]

【權(quán)利要求】
1. 一種音頻信號(hào)處理方法,包括: 接收音頻信號(hào); 相對(duì)于所述音頻信號(hào),通過(guò)執(zhí)行頻率轉(zhuǎn)換來(lái)獲取多個(gè)頻率轉(zhuǎn)換系數(shù); 相對(duì)于所述頻率轉(zhuǎn)換系數(shù),基于諧波比來(lái)選擇非諧波模式和諧波模式中的一個(gè);以及 如果選擇所述諧波模式,則執(zhí)行以下步驟: 判定與第一節(jié)距相對(duì)應(yīng)的第一組的諧波軌跡; 判定與第二節(jié)距相對(duì)應(yīng)的第二組的諧波軌跡;以及 生成所述多個(gè)諧波軌跡的開(kāi)始位置信息, 其中,所述第一組的所述諧波軌跡包括第一諧波軌跡和第二諧波軌跡, 其中,所述第二組的所述諧波軌跡包括第三諧波軌跡和第四諧波軌跡, 其中,所述第一諧波軌跡和所述第三諧波軌跡的開(kāi)始位置信息對(duì)應(yīng)于第一位置集合中 的一個(gè),以及 其中,所述第二諧波軌跡和所述第四諧波軌跡的開(kāi)始位置信息對(duì)應(yīng)于第二位置集合中 的一個(gè)。
2. 根據(jù)權(quán)利要求1所述的音頻信號(hào)處理方法,其中,基于所述多個(gè)諧波軌跡的能量和 所述多個(gè)脈沖的能量來(lái)生成所述諧波比。
3. 根據(jù)權(quán)利要求1所述的音頻信號(hào)處理方法,其中,所述第一位置集合對(duì)應(yīng)于偶數(shù)位 置,以及所述第二位置集合對(duì)應(yīng)于奇數(shù)位置。
4. 根據(jù)權(quán)利要求1所述的音頻信號(hào)處理方法,進(jìn)一步包括: 生成第一目標(biāo)矢量,所述第一目標(biāo)矢量包括所述第一諧波軌跡中的最大脈沖和鄰近所 述最大脈沖的脈沖以及所述第二諧波軌跡中的最大脈沖和鄰近所述最大脈沖的脈沖; 生成第二目標(biāo)矢量,所述第二目標(biāo)矢量包括所述第三諧波軌跡中的最大脈沖和鄰近所 述最大脈沖的脈沖以及所述第四諧波軌跡中的最大脈沖和鄰近所述最大脈沖的脈沖; 矢量-量化所述第一目標(biāo)矢量和所述第二目標(biāo)矢量;以及 相對(duì)于從所述諧波軌跡排除所述第一目標(biāo)矢量和所述第二目標(biāo)矢量的殘余部分來(lái)執(zhí) 行頻率轉(zhuǎn)換。
5. 根據(jù)權(quán)利要求1所述的音頻信號(hào)處理方法,其中: 所述第一諧波軌跡是具有第一節(jié)距的多個(gè)脈沖的集合, 所述第二諧波軌跡是具有第一節(jié)距的多個(gè)脈沖的集合, 所述第三諧波軌跡是具有第二節(jié)距的多個(gè)脈沖的集合,以及 所述第四諧波軌跡是具有第二節(jié)距的多個(gè)脈沖的集合。
6. 根據(jù)權(quán)利要求1所述的音頻信號(hào)處理方法,進(jìn)一步包括:生成指示所述第一節(jié)距和 所述第二節(jié)距的節(jié)距信息。
7. -種音頻信號(hào)處理方法,包括: 接收多個(gè)諧波軌跡的開(kāi)始位置信息,所述多個(gè)諧波軌跡包括與第一節(jié)距相對(duì)應(yīng)的第一 組的諧波軌跡以及與第二節(jié)距相對(duì)應(yīng)的第二組的諧波軌跡; 生成與所述開(kāi)始位置信息相對(duì)應(yīng)的多個(gè)諧波軌跡;以及 使用所述多個(gè)諧波軌跡來(lái)生成與當(dāng)前幀相對(duì)應(yīng)的音頻信號(hào), 其中,所述第一組的諧波軌跡包括第一諧波軌跡和第二諧波軌跡, 其中,所述第二組的諧波軌跡包括第三諧波軌跡和第四諧波軌跡, 其中,所述第一諧波軌跡和所述第三諧波軌跡的開(kāi)始位置信息對(duì)應(yīng)于第一位置集合中 的一個(gè),以及 其中,所述第二諧波軌跡和所述第四諧波軌跡的開(kāi)始位置信息對(duì)應(yīng)于第二位置集合中 的一個(gè)。
8. -種音頻信號(hào)處理方法,包括: 相對(duì)于音頻信號(hào),通過(guò)執(zhí)行頻率轉(zhuǎn)換來(lái)獲取多個(gè)頻率轉(zhuǎn)換系數(shù); 相對(duì)于所述頻率轉(zhuǎn)換系數(shù),基于幀間相似度來(lái)選擇非音調(diào)模式和音調(diào)模式; 如果選擇所述非音調(diào)模式,貝1J基于脈沖比來(lái)選擇一般模式和非一般模式中的一個(gè); 如果選擇所述音調(diào)模式,則基于諧波比來(lái)選擇非諧波模式和諧波模式中的一個(gè);以及 根據(jù)所選模式,通過(guò)對(duì)所述音頻信號(hào)進(jìn)行編碼來(lái)生成參數(shù), 其中,在所述一般模式的情況下,所述參數(shù)包括包絡(luò)位置信息和縮放信息, 其中,在所述非一般模式的情況下,所述參數(shù)包括脈沖信息和噪聲能量信息, 其中,在所述非諧波模式的情況下,所述參數(shù)包括作為關(guān)于固定脈沖的信息的固定脈 沖信息、每子帶預(yù)定的數(shù)目,以及 其中,在所述諧波模式的情況下,所述參數(shù)包括第一組的諧波軌跡的位置信息和第二 組的諧波軌跡的位置信息。
9. 根據(jù)權(quán)利要求8所述的音頻信號(hào)處理方法,進(jìn)一步包括:根據(jù)所選模式來(lái)生成第一 模式信息和第二模式信息, 其中,所述第一模式信息指示所述非音調(diào)模式和所述音調(diào)模式中的一個(gè),以及 其中,如果所述第一模式信息指示所述非音調(diào)模式,則所述第二模式信息指示所述一 般模式或非一般模式中的一個(gè),以及如果所述第一模式信息指示所述音調(diào)模式,則所述第 二模式信息指示所述非諧波模式和所述諧波模式中的一個(gè)。
10. -種音頻信號(hào)處理方法,包括: 通過(guò)比特流來(lái)提取第一模式信息和第二模式信息; 基于所述第一模式信息和所述第二模式信息來(lái)判定與當(dāng)前幀相對(duì)應(yīng)的當(dāng)前模式; 如果所述當(dāng)前模式是一般模式,則使用包絡(luò)位置信息和縮放信息來(lái)恢復(fù)所述當(dāng)前幀的 音頻信號(hào); 如果所述當(dāng)前模式是非一般模式,則使用脈沖信息和噪聲能量信息來(lái)恢復(fù)所述當(dāng)前幀 的所述音頻信號(hào); 如果所述當(dāng)前模式是非諧波模式,則使用作為關(guān)于固定脈沖的信息的固定脈沖信息、 每子帶預(yù)定的數(shù)目來(lái)恢復(fù)所述當(dāng)前幀的所述音頻信號(hào);以及 如果所述當(dāng)前模式是諧波模式,則使用第一組的諧波軌跡的位置信息和第二組的諧波 軌跡的位置信息來(lái)恢復(fù)所述當(dāng)前幀的所述音頻信號(hào)。
【文檔編號(hào)】G10L21/0208GK104252862SQ201410433417
【公開(kāi)日】2014年12月31日 申請(qǐng)日期:2011年1月17日 優(yōu)先權(quán)日:2010年1月15日
【發(fā)明者】丁奎赫, 金大煥, 姜仁圭, 金洛榕, 洪起烽, 樸志剛, 李寅誠(chéng), 林鐘下, 文鐌鉉, 李炳錫, 田惠晶 申請(qǐng)人:Lg電子株式會(huì)社, 忠北大學(xué)校產(chǎn)學(xué)協(xié)力團(tuán)
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1