亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

音頻編碼方法和裝置與流程

文檔序號:11972981閱讀:207來源:國知局
音頻編碼方法和裝置與流程
本發(fā)明實施例涉及信號處理技術(shù)領(lǐng)域,并且更具體地,涉及音頻編碼方法和裝置。

背景技術(shù):
現(xiàn)有技術(shù)中,通常采用混合編碼器對語音通信系統(tǒng)中的音頻信號進行編碼。具體地,該混合編碼器通常包括兩個子編碼器,一個子編碼器適合對語音信號進行編碼,另一個編碼器適合對非語音信號進行編碼。對于接收到的音頻信號,混合編碼器中的每一個子編碼器都會對該音頻信號進行編碼?;旌暇幋a器直接比較編碼后的音頻信號的質(zhì)量好壞來選擇最優(yōu)的子編碼器。但是這種閉環(huán)的編碼方法的運算復雜度很高。

技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供的音頻編碼的方法和裝置,能夠降低編碼的復雜度,同時能夠保證編碼具有較高的準確率。第一方面,一種音頻編碼的方法,該方法包括:確定輸入的N個音頻幀的能量在頻譜上分布的稀疏性,其中該N個音頻幀包括當前音頻幀,N為正整數(shù);根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,其中該第一編碼方法為基于時頻變換和變換系數(shù)量化且不基于線性預測的編碼方法,該第二編碼方法為基于線性預測的編碼方法。結(jié)合第一方面,在第一方面的第一種可能的實現(xiàn)方式中,該確定輸入的N個音頻幀的能量在頻譜上分布的稀疏性,包括:將該N個音頻幀的每一個音頻幀的頻譜劃分為P個頻譜包絡,其中P為正整數(shù);根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),該一般稀疏性參數(shù)表示該N個音頻幀的能量在頻譜上分布的稀疏性。結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第一方面的第二種可能的實現(xiàn)方式中,該一般稀疏性參數(shù)包括第一最小帶寬;該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),包括:根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值為該第一最小帶寬;該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:在該第一最小帶寬小于第一預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼;在該第一最小帶寬大于該第一預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。結(jié)合第一方面的第二種可能的實現(xiàn)方式,在第一方面的第三種可能的實現(xiàn)方式中,該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,包括:分別將該每一個音頻幀的P個頻譜包絡的能量從大到小排序;根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬;根據(jù)該N個音頻幀中每一個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值。結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第一方面的第四種可能的實現(xiàn)方式中,該一般稀疏性參數(shù)包括第一能量比例,該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),包括:從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P1個頻譜包絡;根據(jù)該N個音頻幀中每個音頻幀的P1個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第一能量比例,其中P1為小于P的正整數(shù);該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:在該第一能量比例大于第二預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼;在該第一能量比例小于該第二預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。結(jié)合第一方面的第四種可能的實現(xiàn)方式,在第一方面的第五種可能的實現(xiàn)方式中,該P1個頻譜包絡中任一個頻譜包絡的能量大于該P個頻譜包絡中除該P1個頻譜包絡外的其他頻譜包絡中的任一個頻譜包絡的能量。結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第一方面的第六種可能的實現(xiàn)方式中,該一般稀疏性參數(shù)包括第二最小帶寬和第三最小帶寬,該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),包括:根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,確定該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值作為該第二最小帶寬,該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值作為該第三最小帶寬,其中該第二預設(shè)比例小于該第三預設(shè)比例;該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:在該第二最小帶寬小于第三預設(shè)值且該第三最小帶寬小于第四預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼;在該第三最小帶寬小于第五預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼;或者,在該第三最小帶寬大于第六預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼;其中該第四預設(shè)值大于或等于該第三預設(shè)值,該第五預設(shè)值小于該第四預設(shè)值,該第六預設(shè)值大于該第四預設(shè)值。結(jié)合第一方面的第六種可能的實現(xiàn)方式,在第一方面的第七種可能的實現(xiàn)方式中,該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,確定該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,包括:分別將該每一個音頻幀的P個頻譜包絡的能量從大到小排序;根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬;根據(jù)該N個音頻幀中每一個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值;根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬;根據(jù)該N個音頻幀中每一個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬確定該N個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值。結(jié)合第一方面的第一種可能的實現(xiàn)方式,在第一方面的第八種可能的實現(xiàn)方式中,該一般稀疏性參數(shù)包括第二能量比例和第三能量比例,該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),包括:從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P2個頻譜包絡;根據(jù)該N個音頻幀中每個音頻幀的P2個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第二能量比例;從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P3個頻譜包絡;根據(jù)該N個音頻幀中每個音頻幀的P3個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第三能量比例,其中P2和P3為小于P的正整數(shù),且P2小于P3;該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:在該第二能量比例大于第七預設(shè)值且該第三能量比例大于第八預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼;在該第二能量比例大于第九預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼;在該第三能量比例小于第十預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。結(jié)合第一方面的第八種可能的實現(xiàn)方式,在第一方面的第九種可能的實現(xiàn)方式中,該P2個頻譜包絡為該P個頻譜包絡中能量最大的P2個頻譜包絡;該P3個頻譜包絡為該P個頻譜包絡中能量最大的P3個頻譜包絡。結(jié)合第一方面,在第一方面的第十種可能的實現(xiàn)方式中,該能量在頻譜上分布的稀疏性包括能量在頻譜上分布的全局稀疏性、局部稀疏性以及短時突發(fā)性。結(jié)合第一方面的第十種可能的實現(xiàn)方式,在第一方面的第十一種可能的實現(xiàn)方式中,N為1,該N個音頻幀為該當前音頻幀;該確定輸入的N個音頻幀的能量在頻譜上分布的稀疏性,包括:將該當前音頻幀的頻譜劃分為Q個子帶;根據(jù)該當前音頻幀頻譜的Q個子帶中的每個子帶的峰值能量,確定突發(fā)稀疏性參數(shù),其中該突發(fā)稀疏性參數(shù)用于表示該當前音頻幀的全局稀疏性、局部稀疏性以及短時突發(fā)性。結(jié)合第一方面的第十一種可能的實現(xiàn)方式,在第一方面的第十二種可能的實現(xiàn)方式中,該突發(fā)稀疏性參數(shù)包括:該Q個子帶中每個子帶的全局峰均比、該Q個子帶中每個子帶的局部峰均比和該Q個子帶中每個子帶的短時能量波動,其中該全局峰均比是根據(jù)子帶內(nèi)的峰值能量和該當前音頻幀的全部子帶的平均能量確定的,該局部峰均比是根據(jù)子帶內(nèi)的峰值能量和子帶內(nèi)的平均能量確定的,該短時峰值能量波動是根據(jù)子帶內(nèi)的峰值能量和該音頻幀之前的音頻幀的特定頻帶內(nèi)的峰值能量確定的;該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:確定該Q個子帶中是否存在第一子帶,其中該第一子帶的局部峰均比大于第十一預設(shè)值,該第一子帶的全局峰均比大于第十二預設(shè)值,該第一子帶的短時峰值能量波動大于第十三預設(shè)值;在該Q個子帶中存在該第一子帶的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。結(jié)合第一方面,在第一方面的第十三種可能的實現(xiàn)方式中,該能量在頻譜上分布的稀疏性包括能量在頻譜上分布的帶限特性。結(jié)合第一方面的第十三種可能的實現(xiàn)方式,在第一方面的第十四種可能的實現(xiàn)方式中,該確定輸入的N個音頻幀的能量在頻譜上分布的稀疏性,包括:確定該N個音頻幀中每個音頻幀的分界頻率;根據(jù)該N個音頻幀中每個音頻幀的分界頻率,確定帶限稀疏性參數(shù)。結(jié)合第一方面的第十四種可能的實現(xiàn)方式,在第一方面的第十五種可能的實現(xiàn)方式中,該帶限稀疏性參數(shù)為該N個音頻幀的分界頻率的平均值;該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:在確定該音頻幀的帶限稀疏性參數(shù)小于第十四預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。第二方面,本發(fā)明實施例提供一種裝置,該裝置包括:獲取單元,用于獲取N個音頻幀,其中該N個音頻幀包括當前音頻幀,N為正整數(shù);確定單元,用于確定該獲取單元獲取的N個音頻幀的能量在頻譜上分布的稀疏性;該確定單元,還用于根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,其中該第一編碼方法為基于時頻變換和變換系數(shù)量化且不基于線性預測的編碼方法,該第二編碼方法為基于線性預測的編碼方法。結(jié)合第二方面,在第二方面的第一種可能的實現(xiàn)方式中,該確定單元,具體用于將該N個音頻幀的每一個音頻幀的頻譜劃分為P個頻譜包絡,根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),其中P為正整數(shù),該一般稀疏性參數(shù)表示該N個音頻幀的能量在頻譜上分布的稀疏性。結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第二方面的第二種可能的實現(xiàn)方式中,該一般稀疏性參數(shù)包括第一最小帶寬;該確定單元,具體用于根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值為該第一最小帶寬;該確定單元,具體用于在該第一最小帶寬小于第一預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第一最小帶寬大于該第一預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。結(jié)合第二方面的第二種可能的實現(xiàn)方式,在第二方面的第三種可能的實現(xiàn)方式中,該確定單元,具體用于分別將該每一個音頻幀的P個頻譜包絡的能量從大到小排序,根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬,根據(jù)該N個音頻幀中每一個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值。結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第二方面的第四種可能的實現(xiàn)方式中,該一般稀疏性參數(shù)包括第一能量比例,該確定單元,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P1個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P1個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第一能量比例,其中P1為小于P的正整數(shù);該確定單元,具體用于在該第一能量比例大于第二預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第一能量比例小于該第二預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。結(jié)合第二方面的第四種可能的實現(xiàn)方式,在第二方面的第五種可能的實現(xiàn)方式中,該確定單元,具體用于根據(jù)該P個頻譜包絡的能量確定該P1個頻譜包絡,其中該P1個頻譜包絡中任一個頻譜包絡的能量大于該P個頻譜包絡中除該P1個頻譜包絡外的其他頻譜包絡中的任一個頻譜包絡的能量。結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第二方面的第六種可能的實現(xiàn)方式中,該一般稀疏性參數(shù)包括第二最小帶寬和第三最小帶寬,該確定單元,具體用于根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,確定該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值作為該第二最小帶寬,該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值作為該第三最小帶寬,其中該第二預設(shè)比例小于該第三預設(shè)比例;該確定單元,具體用于在該第二最小帶寬小于第三預設(shè)值且該第三最小帶寬小于第四預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第三最小帶寬小于第五預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,或者,在該第三最小帶寬大于第六預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼;其中該第四預設(shè)值大于或等于該第三預設(shè)值,該第五預設(shè)值小于該第四預設(shè)值,該第六預設(shè)值大于該第四預設(shè)值。結(jié)合第二方面的第六種可能的實現(xiàn)方式,在第二方面的第七種可能的實現(xiàn)方式中,該確定單元,具體用于分別將該每一個音頻幀的P個頻譜包絡的能量從大到小排序,根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬,根據(jù)該N個音頻幀中每一個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬,根據(jù)該N個音頻幀中每一個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值。結(jié)合第二方面的第一種可能的實現(xiàn)方式,在第二方面的第八種可能的實現(xiàn)方式中,該一般稀疏性參數(shù)包括第二能量比例和第三能量比例,該確定單元,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P2個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P2個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第二能量比例,從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P3個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P3個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第三能量比例,其中P2和P3為小于P的正整數(shù),且P2小于P3;該確定單元,具體用于在該第二能量比例大于第七預設(shè)值且該第三能量比例大于第八預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第二能量比例大于第九預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第三能量比例小于第十預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。結(jié)合第二方面的第八種可能的實現(xiàn)方式,在第二方面的第九種可能的實現(xiàn)方式中,該確定單元,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中能量最大的P2個頻譜包絡,從該N個音頻幀中每個音頻幀的P個頻譜包絡中能量最大的P3個頻譜包絡。結(jié)合第二方面,在第二方面的第十種可能的實現(xiàn)方式中,N為1,該N個音頻幀為該當前音頻幀;該確定單元,具體用于將該當前音頻幀的頻譜劃分為Q個子帶,根據(jù)該當前音頻幀頻譜的Q個子帶中的每個子帶的峰值能量,確定突發(fā)稀疏性參數(shù),其中該突發(fā)稀疏性參數(shù)用于表示該當前音頻幀的全局稀疏性、局部稀疏性以及短時突發(fā)性。結(jié)合第二方面的第十種可能的實現(xiàn)方式,在第二方面的第十一種可能的實現(xiàn)方式中,該確定單元,具體用于確定該Q個子帶中每個子帶的全局峰均比、該Q個子帶中每個子帶的局部峰均比和該Q個子帶中每個子帶的短時能量波動,其中該全局峰均比是該確定單元根據(jù)子帶內(nèi)的峰值能量和該當前音頻幀的全部子帶的平均能量確定的,該局部峰均比是該確定單元根據(jù)子帶內(nèi)的峰值能量和子帶內(nèi)的平均能量確定的,該短時峰值能量波動是根據(jù)子帶內(nèi)的峰值能量和該音頻幀之前的音頻幀的特定頻帶內(nèi)的峰值能量確定的;該確定單元,具體用于確定該Q個子帶中是否存在第一子帶,其中該第一子帶的局部峰均比大于第十一預設(shè)值,該第一子帶的全局峰均比大于第十二預設(shè)值,該第一子帶的短時峰值能量波動大于第十三預設(shè)值,在該Q個子帶中存在該第一子帶的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。結(jié)合第二方面,在第二方面的第十二種可能的實現(xiàn)方式中,該確定單元,具體用于確定該N個音頻幀中每個音頻幀的分界頻率;該確定單元,具體用于根據(jù)該N個音頻幀中每個音頻幀的分界頻率,確定帶限稀疏性參數(shù)。結(jié)合第二方面的第十二種可能的實現(xiàn)方式,在第二方面的第十三種可能的實現(xiàn)方式中,該帶限稀疏性參數(shù)為該N個音頻幀的分界頻率的平均值;該確定單元,具體用于在確定該音頻幀的帶限稀疏性參數(shù)小于第十四預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。上述技術(shù)方案在對音頻幀進行編碼時,考慮了該音頻幀的能量在頻譜上分布的稀疏性,能夠降低編碼的復雜度,同時能夠保證編碼具有較高的準確率。附圖說明為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對本發(fā)明實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面所描述的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是根據(jù)本發(fā)明實施例提供的音頻編碼的示意性流程圖。圖2是根據(jù)本發(fā)明實施例提供的裝置的結(jié)構(gòu)框圖。圖3是根據(jù)本發(fā)明實施例提供的裝置的結(jié)構(gòu)框圖。具體實施方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所述的實施例是本發(fā)明的一部分實施例,而不是全部實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都應屬于本發(fā)明保護的范圍。圖1是根據(jù)本發(fā)明實施例提供的音頻編碼的示意性流程圖。101,確定輸入的N個音頻幀的能量在頻譜上分布的稀疏性,其中該N個音頻幀包括當前音頻幀,N為正整數(shù)。102,根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,其中該第一編碼方法為基于時頻變化和變化系數(shù)量化且不基于線性預測的編碼方法,該第二編碼方法為基于線性預測的編碼方法。圖1所示的方法在對音頻幀進行編碼時,考慮了該音頻幀的能量在頻譜上分布的稀疏性,能夠降低編碼的復雜度,同時能夠保證編碼具有較高的準確率。在為音頻幀選擇合適的編碼方法時可以考慮該音頻幀的能量在頻譜上分布的稀疏性。音頻幀的能量在頻譜上分布的稀疏性可以有三種:一般稀疏性、突發(fā)稀疏性和帶限稀疏性??蛇x的,作為一個實施例,可以通過一般稀疏性為該當前音頻幀選擇合適的編碼方法。在此情況下,該確定輸入的N個音頻幀的能量在頻譜上分布的稀疏性,包括:將該N個音頻幀的每一個音頻幀的頻譜劃分為P個頻譜包絡,其中P為正整數(shù),根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),該一般稀疏性參數(shù)表示該N個音頻幀的能量在頻譜上分布的稀疏性。具體地,可以將輸入的音頻幀特定比例能量在頻譜上分布的最小帶寬在連續(xù)N幀的均值定義為一般稀疏性。這個帶寬越小則一般稀疏性越強,這個帶寬越大則一般稀疏性越弱。換句話說,一般稀疏性越強,則音頻幀的能量越集中,一般稀疏性越弱,則音頻幀的能量越分散。第一編碼方法對一般稀疏性較強的音頻幀編碼效率高。因此,可以通過判斷音頻幀的一般稀疏性選擇合適的編碼方法對音頻幀進行編碼。為了便于判斷音頻幀的一般稀疏性,可以將一般稀疏性進行量化得到一般稀疏性參數(shù)??蛇x的,當N取1的情況下,該一般稀疏性就是當前音頻幀的特定比例能量在頻譜上分布的最小帶寬??蛇x的,作為一個實施例,該一般稀疏性參數(shù)包括第一最小帶寬。在此情況下,該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),包括:根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,該N個音頻幀的第一預設(shè)比例的能量在該頻譜上分布的最小帶寬的平均值為該第一最小帶寬。該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:在該第一最小帶寬小于第一預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第一最小帶寬大于該第一預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。可選的,作為一個實施例,在N取1的情況下,該N個音頻幀就是該當前音頻幀,該N個音頻幀的第一預設(shè)比例的能量在該頻譜上分布的最小帶寬的平均值就是該當前音頻幀的第一預設(shè)比例能量在頻譜上分布的最小帶寬。本領(lǐng)域技術(shù)人員可以理解,該第一預設(shè)值和該第一預設(shè)比例可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)牡谝活A設(shè)值和第一預設(shè)比例,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果。一般而言,第一預設(shè)比例的取值一般取在0和1之間較接近于1的數(shù),如90%,80%等。第一預設(shè)值的選取則與第一預設(shè)比例的取值有關(guān),也與在第一編碼方法和第二編碼方法間的選擇傾向性有關(guān)。例如,一個相對較大的第一預設(shè)比例所對應的第一預設(shè)值一般會大于與一個相對較小的第一預設(shè)比例所對應的第一預設(shè)值。又例如,傾向于選擇第一編碼方法的情況下,其對應的第一預設(shè)值一般會比傾向于選擇第二編碼方法的情況下所對應的第一預設(shè)值大。該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,包括:分別將該每一個音頻幀的P個頻譜包絡的能量從大到小排序;根據(jù)該N個音頻幀中每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬;根據(jù)該N個音頻幀中每一個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的不小于第一預設(shè)比例能量在頻譜上分布的最小帶寬的平均值。例如,輸入的音頻信號是16kHz采樣的寬帶信號,輸入信號以20ms為一幀被輸入。每幀信號為320個時域采樣點。對時域信號做時頻變換,例如采用快速傅里葉變換(FastFourierTransformation,F(xiàn)FT)進行時頻變換,得到160個頻譜包絡S(k),即160個FFT能量譜系數(shù),其中k=0,1,2,…,159。在頻譜包絡S(k)中尋找一個最小帶寬,使得該帶寬上的能量占該幀總能量的比例為第一預設(shè)比例。具體來說,根據(jù)音頻幀的從大到小排序的P個頻譜包絡的能量,確定該音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬,包括:將頻譜包絡S(k)中的頻點能量由大到小依次進行累加;每一次進行累加后與該音頻幀的總能量進行比較,如果比值大于第一預設(shè)比例,則中止累加過程,累加的次數(shù)即為最小帶寬。例如,第一預設(shè)比例為90%,累加30次的能量之和占總能量的比例超過了90%,并且累加29次的能量之和占總能量的比例小于90%,累加31次的能量之和占總能量的比例超過了累加30次的能量之后占總能量的比例,則可以認為該音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬為30。對N個音頻幀分別執(zhí)行上述確定最小帶寬的過程。分別確定包括當前音頻幀在內(nèi)的N個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬。計算N個最小帶寬的平均值。這個N最小帶寬的平均值可以稱為第一最小帶寬,該第一最小帶寬可以作為該一般稀疏性參數(shù)。在該第一最小帶寬小于第一預設(shè)值的情況下,確定采用第一編碼方法對該當前音頻幀進行編碼。在該第一最小帶寬大于該第一預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼??蛇x的,作為另一個實施例,該一般稀疏性參數(shù)可以包括第一能量比例。在此情況下,該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),包括:從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P1個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P1個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量確定該第一能量比例,其中P1為小于P的正整數(shù)。該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:在該第一能量比例大于第二預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第一能量比例小于該第二預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼??蛇x的,作為一個實施例,在N取1的情況下,該N個音頻幀就是該當前音頻幀,該根據(jù)該N個音頻幀中每個音頻幀的P1個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量確定該第一能量比例,包括:根據(jù)該當前音頻幀的P1個頻譜包絡的能量與該當前音頻幀的總能量確定該第一能量比例。具體地,可以利用以下公式計算該第一能量比例:.............................................公式1.1其中,R1表示該第一能量比例,Ep1(n)表示第n個音頻幀中選定的P1個頻譜包絡的能量之和,Eall(n)表示第n個音頻幀的總能量,r(n)表示N個音頻幀中的第n個音頻幀的P1個頻譜包絡的能量占該音頻幀的總能量的比例。本領(lǐng)域技術(shù)人員可以理解,該第二預設(shè)值和該P1個頻譜包絡的選擇可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)牡诙A設(shè)值和P1的值以及選擇P1個頻譜包絡的方法,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果。一般而言,P1的取值可以是一個相對較小的數(shù),如選取P1,使得P1與P的比值小于20%。第二預設(shè)值的取值,一般不選擇對應太小比例的數(shù),如不選擇小于10%的數(shù)。第二預設(shè)值的選擇又與P1的取值及在第一編碼方法和第二編碼方法間的選擇傾向性有關(guān)。例如,一個相對較大的P1所對應的第二預設(shè)值一般會大于一個相對較小的P1所對應的第二預設(shè)值。又例如,傾向于選擇第一編碼方法的情況下,其對應的第二預設(shè)值一般會比傾向于選擇第二編碼方法的情況下所對應的第二預設(shè)值小。可選的,作為一個實施例,該P1個頻譜包絡中任意一個的能量要大于該P個頻譜包絡中剩下的P-P1個頻譜包絡中任意一個的能量。舉例來說,輸入的音頻信號是16kHz采樣的寬帶信號,輸入信號以20ms為一幀被輸入。每幀信號為320個時域采樣點。對時域信號做時頻變換,例如采用快速傅里葉變換進行時頻變換,得到160個頻譜包絡S(k),其中k=0,1,2,…,159。從該160個頻譜包絡中選擇P1個頻譜包絡,計算這P1個頻譜包絡的能量之和占該音頻幀的總能量的比例。對N個音頻幀分別執(zhí)行上述過程,即分別計算N個音頻幀中每一個音頻幀的P1個頻譜包絡的能量之和占各自的總能量的比例。計算比例的平均值,這個比例的平均值即為該第一能量比例。在該第一能量比例大于第二預設(shè)值的情況下,確定采用第一編碼方法對該當前音頻幀進行編碼。在該第一能量比例小于該第二預設(shè)值的情況下,確定采用第二編碼方法對該當前音頻幀進行編碼。該P1個頻譜中任一個頻譜包絡的能量大于所述P個頻譜包絡中除所述P1個頻譜包絡外的其他頻譜包絡中的任一個頻譜包絡的能量。可選的,作為一個實施例,P1的取值可以為20??蛇x的,作為另一個實施例,該一般稀疏性參數(shù)可以包括第二最小帶寬和第三最小帶寬。在此情況下,該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),包括:根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,確定該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值作為所述第二最小帶寬,該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值作為該第三最小帶寬,其中該第二預設(shè)比例小于該第三預設(shè)比例。該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:在該第二最小帶寬小于第三預設(shè)值且該第三最小帶寬小于第四預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼;在該第三最小帶寬小于第五預設(shè)值的情況下確定采用該第一編碼方法對該當前音頻幀進行編碼;在該第三最小帶寬大于第六預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。該第四預設(shè)值大于等于該第三預設(shè)值,該第五預設(shè)值小于該第四預設(shè)值,該第六預設(shè)值大于該第四預設(shè)值。可選的,作為一個實施例,在N取1的情況下,該N個音頻幀就是該當前音頻幀。該確定該N個音頻幀的第二預設(shè)比例能量在頻譜上分布的最小帶寬的平均值作為該第二最小帶寬,包括:根據(jù)該當前音頻幀的第二預設(shè)比例能量在頻譜上分布的最小帶寬作為該第二最小帶寬。該確定該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值為該第三最小帶寬,包括:根據(jù)該當前音頻幀的第三預設(shè)比例能量在頻譜上分布的最小帶寬作為該第三最小帶寬。本領(lǐng)域技術(shù)人員可以理解,該第三預設(shè)值、第四預設(shè)值、第五預設(shè)值、第六預設(shè)值、該第二預設(shè)比例和該第三預設(shè)比例可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)念A設(shè)值和預設(shè)比例,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果。該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,確定該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,包括:分別將該每一個音頻幀的P個頻譜包絡的能量從大到小排序;根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬;根據(jù)該N個音頻幀中每一個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值;根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬;根據(jù)該N個音頻幀中每一個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值。舉例來說,輸入的音頻信號是16kHz采樣的寬帶信號,輸入信號以20ms為一幀被輸入。每幀信號為320個時域采樣點。對時域信號做時頻變換,例如采用快速傅里葉變換進行時頻變換,得到160個頻譜包絡S(k),其中k=0,1,2,…,159。在頻譜包絡S(k)中尋找一個最小帶寬,使得該帶寬上的能量占該幀總能量的比例為第二預設(shè)比例。繼續(xù)在頻譜包括S(k)中尋找一個帶寬,使得該帶寬上的能量占總能量的比例為第三預設(shè)比例。具體來說,根據(jù)一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬和該音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬,包括:將頻譜包括S(k)中的頻點能量由大到小依次進行累加。每一次進行累加后與該音頻幀的總能量進行比較,如果比值大于第二預設(shè)比例,則累加的次數(shù)即為符合不小于第二預設(shè)比例的最小帶寬。繼續(xù)進行累加,如果累加后與該音頻幀總能量的比值大于第三預設(shè)比例,則中止累加,累加次數(shù)為符合不小于第三預設(shè)比例的最小帶寬。例如,第二預設(shè)比例為85%,第三預設(shè)比例為95%。累加30次的能量之和占總能量的比例超過了85%,則可以認為該音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬為30。繼續(xù)進行累加,如果累加了35次的能量之和占總能量的比例為95,則可以認為該音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬為35。對N個音頻幀分別執(zhí)行上述過程。分別確定包括當前音頻幀在內(nèi)的N個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬和不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬。該N個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值即為該第二最小帶寬。該N個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值即為該第三最小帶寬。在該第二最小帶寬小于第三預設(shè)值且該第三最小帶寬小于第四預設(shè)值的情況下,確定采用第一編碼方法對該當前音頻幀進行編碼。在該第三最小帶寬小于第五預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。在該第三最小帶寬大于第六預設(shè)值的情況下,確定采用第二編碼方法對該當前音頻幀進行編碼??蛇x的,作為另一個實施例,該一般稀疏性參數(shù)包括第二能量比例和第三能量比例。在此情況下,該根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),包括:從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P2個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P2個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第二能量比例,從該N個音頻幀中每個音頻幀的P個頻譜包絡中分布選擇P3個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P3個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第三能量比例。該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:在該第二能量比例大于第七預設(shè)值且該第三能量比例大于第八預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第二能量比例大于第九預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第三能量比例小于第十預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。P2和P3為小于P的正整數(shù),且P2小于P3。可選的,作為一個實施例,在N取1的情況下,該N個音頻幀就是該當前音頻幀。該根據(jù)該N個音頻幀中每個音頻幀的P2個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第二能量比例,包括:根據(jù)該當前音頻幀的P2個頻譜包絡的能量與該當前音頻幀的總能量,確定該第二能量比例。該根據(jù)該N個音頻幀中每個音頻幀的P3個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第三能量比例,包括:根據(jù)該當前音頻幀的P3個頻譜包絡的能量與該當前音頻幀的總能量,確定該第三能量比例。本領(lǐng)域技術(shù)人員可以理解,P2和P3的值,以及該第七預設(shè)值、該第八預設(shè)值、該第九預設(shè)值和該第十預設(shè)值可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)念A設(shè)值,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果??蛇x的,作為一個實施例,該P2個頻譜包絡可以是該P個頻譜包絡中能量最大的P2個頻譜包絡;該P3個頻譜包絡可以是該P個頻譜包絡中能量最大的P3個頻譜包絡。舉例來說,輸入的音頻信號是16kHz采樣的寬帶信號,輸入信號以20ms為一幀被輸入。每幀信號為320個時域采樣點。對時域信號做時頻變換,例如采用快速傅里葉變換進行時頻變換,得到160個頻譜包絡S(k),其中k=0,1,2,…,159。從該160個頻譜包絡中選擇P2個頻譜包絡,計算這P2個頻譜包絡的能量之和占該音頻幀的總能量的比例。對N個音頻幀分別執(zhí)行上述過程,即分別計算N個音頻幀中每一個音頻幀的P2個頻譜包絡的能量之和占各自總能量的比例。計算比例的平均值,這個比例的平均值即為該第二能量比例。從該160個頻譜包絡中選擇P3個頻譜包絡,計算這P3個頻譜包絡的能量之和占該音頻幀的總能量的比例。對該N個音頻幀分別執(zhí)行上述過程,即分別計算N個音頻幀中每一個音頻幀的P2個頻譜包絡的能量之和占各自總能量的比例。計算比例的平均值,這個比例的平均值即為該第三能量比例。在該第二能量比例大于第七預設(shè)值且該第三能量比例大于第八預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。在該第二能量比例大于第九預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。在該第三能量比例小于第十預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。該P2個頻譜包絡可以是該P個頻譜包絡中能量最大的P2個頻譜包絡;該P3個頻譜包絡可以是該P個頻譜包絡中能量最大的P3個頻譜包絡??蛇x的,作為一個實施例,P2的取值可以為20,P3的取值可以為30??蛇x的,作為另一實施例,可以通過突發(fā)稀疏性為該當前音頻幀選擇合適的編碼方法。突發(fā)稀疏性需要考慮音頻幀的能量在頻譜上分布的全局稀疏性、局部稀疏性以及短時突發(fā)性。在此情況下,該能量在頻譜上分布的稀疏性可以包括能量在頻譜上分布的全局稀疏性、局部稀疏性以及短時突發(fā)性。在此情況下,N可以取值為1,該N個音頻幀就是該當前音頻幀。該確定輸入的N個音頻幀在頻譜上分布的稀疏性,包括:將該當前音頻幀的頻譜劃分為Q個子帶,根據(jù)該當前音頻幀的Q個子帶中的每個子帶的峰值能量,確定突發(fā)稀疏性參數(shù),其中該突發(fā)稀疏性參數(shù)用于表示該當前音頻幀的全局稀疏性、該局部稀疏性以及該短時突發(fā)性。該突發(fā)稀疏性參數(shù)包括:該Q個子帶中每個子帶的全局峰均比、該Q個子帶中每個子帶的局部峰均比和該Q個子帶中每個子帶的短時能量波動,其中該全局峰均比是根據(jù)該子帶內(nèi)的峰值能量和該當前音頻幀的全部子帶的平均能量確定的,該局部峰均比是根據(jù)該子帶內(nèi)的峰值能量和該子帶的平均能量確定的,該短時峰值能量波動是根據(jù)子帶內(nèi)的峰值能量和該音頻幀之前的音頻幀的特定頻帶內(nèi)的峰值能量確定的。該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:確定該Q個子帶中是否存在第一子帶,其中該第一子帶的局部峰均比大于第十一預設(shè)值,該第一子帶的全局峰均比大于第十二預設(shè)值,該第一子帶的短時峰值能量波動大于第十三預設(shè)值,在該Q個子帶中存在該第一子帶的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。該Q個子帶中每個子帶的全局峰均比、該Q個子帶中每個子帶的局部峰均比和該Q個子帶中每個子帶的短時能量波動分別表示該全局稀疏性、該局部稀疏性以及該短時突發(fā)性。具體地,該全局峰均比可以采用以下公式確定:................................公式1.2其中,e(i)表示Q個子帶中第i個子帶的峰值能量,s(k)表示P個頻譜包絡中第k個頻譜包絡的能量。p2s(i)表示第i個子帶的全局峰均比。該局部峰均比可以采用以下公式確定:.......................公式1.3其中,e(i)表示Q個子帶中第i個子帶的峰值能量,s(k)表示P個頻譜包絡中第k個頻譜包絡的能量,h(i)表示第i個子帶所含頻率最高的頻譜包絡的索引,l(i)表示第i個子帶所含頻率最低的頻譜包絡的索引。p2a(i)表示第i個子帶的局部峰均比。其中h(i)小于等于P-1。該短時峰值能量波動可以采用以下公式確定:dev(i)=(2*e(i))/(e1+e2),...............................公式1.4其中,e(i)表示當前音頻幀的Q個子帶中第i個子帶的峰值能量,e1和e2表示該當前音頻幀之前的音頻幀中特定頻帶的峰值能量。具體地,假設(shè)當前音頻幀為第M個音頻幀,確定該當前音頻幀的第i個子帶的峰值能量所在的頻譜包絡。假設(shè)該峰值能量所在的頻譜包絡位置為i1。確定第(M-1)個音頻幀中(i1-t)頻譜包絡至(i1+t)頻譜包絡范圍內(nèi)的峰值能量,該峰值能量即為e1。類似的,確定第(M-2)個音頻幀中(i1-t)頻譜包絡至(i1+t)頻譜包絡范圍內(nèi)的峰值能量,該峰值能量即為e2。本領(lǐng)域技術(shù)人員可以理解,該第十一預設(shè)值、第十二預設(shè)值、第十三預設(shè)值可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)念A設(shè)值,從而使得滿足上述條件的音頻幀在采用第一編碼方法時可以獲得較好的編碼效果??蛇x的,作為另一個實施例,可以通過帶限稀疏性為該當前音頻幀選擇合適的編碼方法。在此情況下,該能量在頻譜上分布的稀疏性包括能量在頻譜上分布的帶限稀疏性。在此情況下,該確定輸入的N個音頻幀的能量在頻譜上分布的稀疏性,包括:確定該N個音頻幀中每個音頻幀的分界頻率,根據(jù)該每個音頻幀的分界頻率,確定帶限稀疏性參數(shù)。該帶限稀疏性參數(shù)可以是該N個音頻幀的分界頻率的平均值。舉例來說,第Ni個音頻幀為該N個音頻幀中的任一個音頻幀,該第Ni個音頻幀的頻率范圍是從Fb至Fe,其中Fb小于Fe。假設(shè)起始頻率為Fb,那么確定該第Ni個音頻幀的分界頻率的方法可以是從Fb開始搜索一個頻率Fs,F(xiàn)s滿足以下條件:從Fb到Fs的能量之和與該第Ni個音頻幀總能量的比值不小于該第四預設(shè)比例,從Fb到小于Fs的任一頻率的能量之和與該第Ni個音頻幀總能量的比值小于該第四預設(shè)比例,F(xiàn)s就是第Ni個音頻幀的分界頻率。對該N個音頻幀中每一個音頻幀都執(zhí)行上述確定分界頻率的步驟。這樣,就可以得到N個音頻幀的N個分界頻率。該根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,包括:在確定該音頻幀的帶限稀疏性參數(shù)小于第十四預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。本領(lǐng)域技術(shù)人員可以理解,該第四預設(shè)比例和該第十四預設(shè)值的取值可以根據(jù)仿真實驗確定。根據(jù)仿真實驗,可以確定適當?shù)念A設(shè)值和預設(shè)比例,從而使得滿足上述條件的音頻幀在采用第一編碼方法時可以獲得較好的編碼效果。一般而言,第四預設(shè)比例的取值會選擇一個小于1但接近于1的數(shù),如95%,99%等。第十四預設(shè)值的選取一般不會選擇一個對應于相對較高頻率的數(shù)。如在一些實施例中,若音頻幀的頻率范圍是從0Hz~8kHz,則第十四預設(shè)值可以選擇小于5kHz頻率的數(shù)。舉例來說,可以確定該當前音頻幀的P個頻譜包絡中每一個頻譜包絡的能量,從低頻到高頻搜索分界頻率,使得小于該分界頻率的能量占該當前音頻幀總能量的比值為第四預設(shè)比例。假設(shè)N為1,則該當前音頻幀的分界頻率即為該帶限稀疏性參數(shù)。假設(shè)N為大于1的整數(shù),則確定N個音頻幀的分界頻率的平均值即為該帶限稀疏性參數(shù)。本領(lǐng)域技術(shù)人員可以理解,上述確定分界頻率僅是一個例子。確定分界頻率的方法還可以是從高頻到低頻搜索分界頻率或者其他方法。進一步,為了避免頻繁地切換第一編碼方法和第二編碼方法,還可以設(shè)置拖尾區(qū)間。拖尾區(qū)間內(nèi)的音頻幀可以采用拖尾區(qū)間起始位置音頻幀采用的編碼方法。這樣,就可以避免頻繁切換不同的編碼方法引起的切換質(zhì)量的下降。如果拖尾區(qū)間的拖尾長度為L,則在該當前音頻幀之后的L個音頻幀均屬于該當前音頻幀的拖尾區(qū)間。如果屬于拖尾區(qū)間內(nèi)的某一音頻幀的能量在頻譜上分布的稀疏性與該拖尾區(qū)間起始位置音頻幀的能量在頻譜上分布的稀疏性不同,則該音頻幀仍采用與該拖尾區(qū)間起始位置音頻幀相同的編碼方法進行編碼。拖尾區(qū)間的長度可以根據(jù)拖尾區(qū)間內(nèi)的音頻幀的能量在頻譜上分布的稀疏性更新,直到拖尾區(qū)間的長度為0。舉例來說,如果確定第I個音頻幀采用第一編碼方法且預設(shè)拖尾區(qū)間長度為L,則該第I+1個音頻幀至第I+L個音頻幀均采用該第一編碼方法。然后,確定該第I+1個音頻幀的能量在頻譜上分布的稀疏性,根據(jù)該第I+1個音頻幀的能量在頻譜上分布的稀疏性重新計算拖尾區(qū)間。如果第I+1個音頻幀仍符合采用第一編碼方法的條件,則后續(xù)拖尾區(qū)間仍然是預設(shè)拖尾區(qū)間L。也就是說,拖尾區(qū)間從第L+2個音頻幀開始到第(I+1+L)個音頻幀。如果第I+1個音頻幀不符合采用第一編碼方法的條件,則根據(jù)該I+1個音頻幀的能量在頻譜上分布的稀疏性,重新確定拖尾區(qū)間。例如,重新確定確定拖尾區(qū)間為L-L1,其中L1為小于或等于L的正整數(shù)。如果L1等于L,則拖尾區(qū)間的長度更新為0。在此情況下,根據(jù)該第I+1個音頻幀的能量在頻譜上分布的稀疏性重新確定編碼方法。如果L1為小于L的整數(shù),則根據(jù)第(I+1+L-L1)個音頻幀的能量在頻譜上分布的稀疏性重新確定編碼方法。但是由于第I+1個音頻幀位于第I個音頻幀的拖尾區(qū)間內(nèi),第I+1個音頻幀仍采用第一編碼方法進行編碼。L1可以稱為拖尾更新參數(shù),該拖尾更新參數(shù)的取值可以根據(jù)輸入的音頻幀的能量在頻譜上分布的稀疏性來確定。這樣,拖尾區(qū)間的更新與音頻幀的能量在頻譜上分布的稀疏性相關(guān)。例如,在確定了一般稀疏性參數(shù)且該一般稀疏性參數(shù)為第一最小帶寬的情況下,可以根據(jù)音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬重新確定該拖尾區(qū)間。假設(shè)確定采用第一編碼方法對第I個音頻幀進行編碼,且預設(shè)的拖尾區(qū)間為L。確定包括第I+1個音頻幀在內(nèi)的連續(xù)H個音頻幀中每一個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬,其中H為大于0的正整數(shù)。如果第I+1個音頻幀不滿足使用第一編碼方法的條件,則確定第一預設(shè)比例的能量在頻譜上分布的最小帶寬小于第十五預設(shè)值的音頻幀的數(shù)量(以下簡稱該數(shù)量為第一拖尾參數(shù))。在該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬大于第十六預設(shè)值且小于第十七預設(shè)值,并且該第一拖尾參數(shù)小于第十八預設(shè)值的情況下,將拖尾區(qū)間長度減1,即拖尾更新參數(shù)為1。該第十六預設(shè)值大于第一預設(shè)值。在該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬大于該第十七預設(shè)值且小于該第十九預設(shè)值,并且該第一拖尾參數(shù)小于該第十八預設(shè)值的情況下,將該拖尾區(qū)間長度減2,即拖尾更新參數(shù)為2。在該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬大于該第十九預設(shè)值的情況下,將拖尾區(qū)間設(shè)置為0。在該第一拖尾參數(shù)以及該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬不滿足上述第十六預設(shè)值至第十九預設(shè)值中的一個或多個預設(shè)值的情況下,拖尾區(qū)間保持不變。本領(lǐng)域技術(shù)人員可以理解,該預設(shè)的拖尾區(qū)間可以根據(jù)實際情況進行設(shè)置,拖尾更新參數(shù)也可以根據(jù)實際情況進行調(diào)整。該第十五預設(shè)值至該第十九預設(shè)值可以根據(jù)實際情況進行調(diào)整,從而可以設(shè)置不同的拖尾區(qū)間。類似的,當該一般稀疏性參數(shù)包括第二最小帶寬和第三最小帶寬,或者,該一般稀疏性參數(shù)包括第一能量比例,或者,該一般稀疏性參數(shù)包括第二能量比例和第三能量比例的情況下,可以設(shè)置相應的預設(shè)的拖尾區(qū)間、拖尾更新參數(shù)以及用于確定拖尾更新參數(shù)的相關(guān)參數(shù),從而可以確定相應的拖尾區(qū)間,避免頻繁地切換編碼方法。在根據(jù)的突發(fā)稀疏性確定編碼方法(即根據(jù)音頻幀的能量在頻譜上分布的全局稀疏性、局部稀疏性以及短時突發(fā)性確定編碼方法)的情況下,也可以設(shè)置相應的拖尾區(qū)間、拖尾更新參數(shù)以及用于確定拖尾更新參數(shù)的相關(guān)參數(shù)以避免頻繁地切換編碼方法。在此情況下,該拖尾區(qū)間可以小于一般稀疏性參數(shù)時設(shè)置的拖尾區(qū)間。在根據(jù)能量在頻譜上分布的帶限特性確定編碼方法的情況下,也可以設(shè)置相應的拖尾區(qū)間、拖尾更新參數(shù)以及用于確定拖尾更新參數(shù)的相關(guān)參數(shù)以避免頻繁地切換編碼方法。例如,可以通過計算輸入的音頻幀的低頻譜包絡的能量與所有頻譜包絡的能量的比值,根據(jù)該比值確定該拖尾更新參數(shù)。具體地,可以采用以下公式確定低頻譜包絡的能量與所有頻譜包絡的能量的比值:..........................................公式1.5其中,Rlow表示低頻譜包絡的能量與所有頻譜包絡的能量的比值,s(k)表示第k個頻譜包絡的能量,y表示低頻帶的最高頻譜包絡的索引,P表示該音頻幀總共被劃分為P個頻譜包絡。在此情況下,如果Rlow大于第二十預設(shè)值,則該拖尾更新參數(shù)為0。否則如果Rlow大于第二十一預設(shè)值,則拖尾更新參數(shù)可以取較小的值,其中該第二十預設(shè)值大于該第二十一預設(shè)值。如果Rlow不大于第二十一預設(shè)值,則該拖尾參數(shù)可以取較大的值。本領(lǐng)域技術(shù)人員可以理解,該第二十預設(shè)值和該第二十一預設(shè)值可以根據(jù)仿真實驗確定,該拖尾更新參數(shù)的取值也可以根據(jù)試驗確定。一般而言,第二十一預設(shè)值的取值一般不選取太小比值的數(shù),如一般可以選取大于50%的數(shù)。第二十預設(shè)值的取值介于第二十一預設(shè)值與1之間。此外,在根據(jù)能量在頻譜上分布的帶限特性確定編碼方法的情況下,還可以確定輸入的音頻幀的分界頻率,根據(jù)該分界頻率確定該拖尾更新參數(shù),其中該分界頻率可以與用于確定帶限稀疏性參數(shù)的分界頻率不同。如果該分界頻率小于第二十二預設(shè)值,則該拖尾更新參數(shù)為0。否則,如果該分界頻率小于第二十三預設(shè)值,則該拖尾更新參數(shù)取值較小。其中第二十三預設(shè)值大于第二十二預設(shè)值。如果該分界頻率大于該第二十三預設(shè)值,則該拖尾更新參數(shù)可以取較大的值。本領(lǐng)域技術(shù)人員可以理解,該第二十二預設(shè)值和該第二十三預設(shè)值可以根據(jù)仿真實驗確定,該拖尾更新參數(shù)的取值也可以根據(jù)試驗確定。一般而言,第二十三預設(shè)值的取值不選取對應于相對較高頻率的數(shù)。例如,若音頻幀的頻率范圍是從0Hz~8kHz,則二十三預設(shè)值可以選擇小于5kHz頻率的數(shù)。圖2是根據(jù)本發(fā)明實施例提供的裝置的結(jié)構(gòu)框圖。圖2所示的裝置200能夠執(zhí)行圖1的各個步驟。如圖2所示,裝置200包括獲取單元201和確定單元202。,其特征在于,該裝置包括:獲取單元201,用于獲取N個音頻幀,其中該N個音頻幀包括當前音頻幀,N為正整數(shù)。確定單元202,用于確定該獲取單元201獲取的N個音頻幀的能量在頻譜上分布的稀疏性。確定單元202,還用于根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,其中該第一編碼方法為基于時頻變換和變換系數(shù)量化且不基于線性預測的編碼方法,該第二編碼方法為基于線性預測的編碼方法。圖2所示的裝置在對音頻幀進行編碼時,考慮了該音頻幀的能量在頻譜上分布的稀疏性,能夠降低編碼的復雜度,同時能夠保證編碼具有較高的準確率。在為音頻幀選擇合適的編碼方法時可以考慮該音頻幀的能量在頻譜上分布的稀疏性。音頻幀的能量在頻譜上分布的稀疏性可以有三種:一般稀疏性、突發(fā)稀疏性和帶限稀疏性??蛇x的,作為一個實施例,可以通過一般稀疏性為該當前音頻幀選擇合適的編碼方法。在此情況下,確定單元202,具體用于將該N個音頻幀的每一個音頻幀的頻譜劃分為P個頻譜包絡,根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),其中P為正整數(shù),該一般稀疏性參數(shù)表示該N個音頻幀的能量在頻譜上分布的稀疏性。具體地,可以將輸入的音頻幀特定比例能量在頻譜上分布的最小帶寬在連續(xù)N幀的均值定義為一般稀疏性。這個帶寬越小則一般稀疏性越強,這個帶寬越大則一般稀疏性越弱。換句話說,一般稀疏性越強,則音頻幀的能量越集中,一般稀疏性越弱,則音頻幀的能量越分散。第一編碼方法對一般稀疏性較強的音頻幀編碼效率高。因此,可以通過判斷音頻幀的一般稀疏性選擇合適的編碼方法對音頻幀進行編碼。為了便于判斷音頻幀的一般稀疏性,可以將一般稀疏性進行量化得到一般稀疏性參數(shù)。可選的,當N取1的情況下,該一般稀疏性就是當前音頻幀的特定比例能量在頻譜上分布的最小帶寬??蛇x的,作為一個實施例,該一般稀疏性參數(shù)包括第一最小帶寬。在此情況下,確定單元202,具體用于根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值為該第一最小帶寬。確定單元202,具體用于在該第一最小帶寬小于第一預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第一最小帶寬大于該第一預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。本領(lǐng)域技術(shù)人員可以理解,該第一預設(shè)值和該第一預設(shè)比例可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)牡谝活A設(shè)值和第一預設(shè)比例,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果。確定單元202,具體用于分別將該每一個音頻幀的P個頻譜包絡的能量從大到小排序,根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬,根據(jù)該N個音頻幀中每一個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值。例如,獲取單元201獲取的音頻信號是16kHz采樣的寬帶信號,獲取的音頻信號以20ms為一幀被獲取。每幀信號為320個時域采樣點。確定單元202可以對時域信號做時頻變換,例如采用快速傅里葉變換(FastFourierTransformation,F(xiàn)FT)進行時頻變換,得到160個頻譜包絡S(k),即160個FFT能量譜系數(shù),其中k=0,1,2,…,159。確定單元202可以在頻譜包絡S(k)中尋找一個最小帶寬,使得該帶寬上的能量占該幀總能量的比例為第一預設(shè)比例。具體來說,確定單元202可以將頻譜包絡S(k)中的頻點能量由大到小依次進行累加;每一次進行累加后與該音頻幀的總能量進行比較,如果比值大于第一預設(shè)比例,則中止累加過程,累加的次數(shù)即為最小帶寬。例如,第一預設(shè)比例為90%,累加30次的能量之和占總能量的比例超過了90%,則可以認為該音頻幀的不小于第一預設(shè)比例的能量的最小帶寬為30。確定單元202可以對N個音頻幀分別執(zhí)行上述確定最小帶寬的過程。分別確定包括當前音頻幀在內(nèi)的N個音頻幀的不小于第一預設(shè)比例的能量的最小帶寬。確定單元202可以計算N個不小于第一預設(shè)比例的能量的最小帶寬的平均值。這個N個不小于第一預設(shè)比例的能量的最小帶寬的平均值可以稱為第一最小帶寬,該第一最小帶寬可以作為該一般稀疏性參數(shù)。在該第一最小帶寬小于第一預設(shè)值的情況下,確定單元202可以確定采用第一編碼方法對該當前音頻幀進行編碼。在該第一最小帶寬大于該第一預設(shè)值的情況下,確定單元202可以確定采用該第二編碼方法對該當前音頻幀進行編碼??蛇x的,作為另一個實施例,該一般稀疏性參數(shù)可以包括第一能量比例。在此情況下,確定單元202,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P1個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P1個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第一能量比例,其中P1為小于P的正整數(shù)。確定單元202,具體用于在該第一能量比例大于第二預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第一能量比例小于該第二預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼??蛇x的,作為一個實施例,在N取1的情況下,該N個音頻幀就是該當前音頻幀,確定單元202,具體用于根據(jù)該當前音頻幀的P1個頻譜包絡的能量與該當前音頻幀的總能量確定該第一能量比例。確定單元202,具體用于根據(jù)該P個頻譜包絡的能量確定該P1個頻譜包絡,其中該P1個頻譜包絡中任一個頻譜包絡的能量大于該P個頻譜包絡中除該P1個頻譜包絡外的其他頻譜包絡中的任一個頻譜包絡的能量。具體地,確定單元202可以利用以下公式計算該第一能量比例:..............................................公式1.6其中,R1表示該第一能量比例,Ep1(n)表示第n個音頻幀中選定的P1個頻譜包絡的能量之和,Eall(n)表示第n個音頻幀的總能量,r(n)表示N個音頻幀中的第n個音頻幀的P1個頻譜包絡的能量占該音頻幀的總能量的比例。本領(lǐng)域技術(shù)人員可以理解,該第二預設(shè)值和該P1個頻譜包絡的選擇可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)牡诙A設(shè)值和P1的值以及選擇P1個頻譜包絡的方法,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果。可選的,作為一個實施例,該P1個頻譜包絡可以是該P個頻譜包絡中能量最大的P1個頻譜包絡。舉例來說,獲取單元201獲取的音頻信號是16kHz采樣的寬帶信號,獲取的音頻信號以20ms為一幀被獲取。每幀信號為320個時域采樣點。確定單元202可以對時域信號做時頻變換,例如采用快速傅里葉變換進行時頻變換,得到160個頻譜包絡S(k),其中k=0,1,2,…,159。確定單元202可以從該160個頻譜包絡中選擇P1個頻譜包絡,計算這P1個頻譜包絡的能量之和占該音頻幀的總能量的比例。確定單元202可以對N個音頻幀分別執(zhí)行上述過程,即分別計算N個音頻幀中每一個音頻幀的P1個頻譜包絡的能量之和占各自的總能量的比例。確定單元202可以計算比例的平均值,這個比例的平均值即為該第一能量比例。在該第一能量比例大于第二預設(shè)值的情況下,確定單元202可以確定采用第一編碼方法對該當前音頻幀進行編碼。在該第一能量比例小于該第二預設(shè)值的情況下,確定單元202可以確定采用第二編碼方法對該當前音頻幀進行編碼。該P1個頻譜包絡可以是該P個頻譜包絡中能量最大的P1個頻譜包絡。也就是說,確定單元202,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中確定能量最大的P1個頻譜包絡??蛇x的,作為一個實施例,P1的取值可以為20。可選的,作為另一個實施例,該一般稀疏性參數(shù)可以包括第二最小帶寬和第三最小帶寬。在此情況下,確定單元202,具體用于根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,確定該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值作為該第二最小帶寬,該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值作為該第三最小帶寬,其中該第二預設(shè)比例小于該第三預設(shè)比例。確定單元202,具體用于在該第二最小帶寬小于第三預設(shè)值且該第三最小帶寬小于第四預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第三最小帶寬小于第五預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,或者,在該第三最小帶寬大于第六預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。可選的,作為一個實施例,在N取1的情況下,該N個音頻幀就是該當前音頻幀。確定單元202可以根據(jù)該當前音頻幀的第二預設(shè)比例能量在頻譜上分布的最小帶寬作為該第二最小帶寬。確定單元202可以根據(jù)該當前音頻幀的第三預設(shè)比例能量在頻譜上分布的最小帶寬作為該第三最小帶寬。本領(lǐng)域技術(shù)人員可以理解,該第三預設(shè)值、第四預設(shè)值、第五預設(shè)值、第六預設(shè)值、該第二預設(shè)比例和該第三預設(shè)比例可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)念A設(shè)值和預設(shè)比例,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果。該確定單元202,具體用于分別將該每一個音頻幀的P個頻譜包絡的能量從大到小排序,根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬,根據(jù)該N個音頻幀中每一個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬,根據(jù)該N個音頻幀中每一個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值。舉例來說,獲取單元201獲取的音頻信號是16kHz采樣的寬帶信號,獲取的音頻信號以20ms為一幀被獲取。每幀信號為320個時域采樣點。確定單元202可以對時域信號做時頻變換,例如采用快速傅里葉變換進行時頻變換,得到160個頻譜包絡S(k),其中k=0,1,2,…,159。確定單元202可以在頻譜包絡S(k)中尋找一個最小帶寬,使得該帶寬上的能量占該幀總能量的比例不小于第二預設(shè)比例。確定單元202可以繼續(xù)在頻譜包括S(k)中尋找一個帶寬,使得該帶寬上的能量占總能量的比例不小于第三預設(shè)比例。具體來說,確定單元202可以將頻譜包括S(k)中的頻點能量由大到小依次進行累加。每一次進行累加后與該音頻幀的總能量進行比較,如果比值大于第二預設(shè)比例,則累加的次數(shù)即為不小于第二預設(shè)比例的最小帶寬。確定單元202可以繼續(xù)進行累加,如果累加后與該音頻幀總能量的比值大于第三預設(shè)比例,則中止累加,累加次數(shù)為不小于第三預設(shè)比例的最小帶寬。例如,第二預設(shè)比例為85%,第三預設(shè)比例為95%。累加30次的能量之和占總能量的比例超過了85%,則可以認為該音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬為30。繼續(xù)進行累加,如果累加了35次的能量之和占總能量的比例為95,則可以認為該音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬為35。確定單元202可以對N個音頻幀分別執(zhí)行上述過程。確定單元202可以分別確定包括當前音頻幀在內(nèi)的N個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬和不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬。該N個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值即為該第二最小帶寬。該N個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值即為該第三最小帶寬。在該第二最小帶寬小于第三預設(shè)值且該第三最小帶寬小于第四預設(shè)值的情況下,確定單元202可以確定采用第一編碼方法對該當前音頻幀進行編碼。在該第三最小帶寬小于第五預設(shè)值的情況下,確定單元202可以確定采用該第一編碼方法對該當前音頻幀進行編碼。在該第三最小帶寬大于第六預設(shè)值的情況下,確定單元202可以確定采用第二編碼方法對該當前音頻幀進行編碼??蛇x的,作為另一個實施例,該一般稀疏性參數(shù)包括第二能量比例和第三能量比例。在此情況下,確定單元202,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P2個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P2個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第二能量比例,從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P3個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P3個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第三能量比例,其中P2和P3為小于P的正整數(shù),且P2小于P3。確定單元202,具體用于在該第二能量比例大于第七預設(shè)值且該第三能量比例大于第八預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第二能量比例大于第九預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第三能量比例小于第十預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。可選的,作為一個實施例,在N取1的情況下,該N個音頻幀就是該當前音頻幀。確定單元202可以根據(jù)該當前音頻幀的P2個頻譜包絡的能量與該當前音頻幀的總能量,確定該第二能量比例。確定單元202可以根據(jù)該當前音頻幀的P3個頻譜包絡的能量與該當前音頻幀的總能量,確定該第三能量比例。本領(lǐng)域技術(shù)人員可以理解,P2和P3的值,以及該第七預設(shè)值、該第八預設(shè)值、該第九預設(shè)值和該第十預設(shè)值可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)念A設(shè)值,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果??蛇x的,作為一個實施例,確定單元202,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中能量最大的P2個頻譜包絡,從該N個音頻幀中每個音頻幀的P個頻譜包絡中能量最大的P3個頻譜包絡。舉例來說,獲取單元201獲取的音頻信號是16kHz采樣的寬帶信號,獲取的音頻信號以20ms為一幀被獲取。每幀信號為320個時域采樣點。確定單元202可以對時域信號做時頻變換,例如采用快速傅里葉變換進行時頻變換,得到160個頻譜包絡S(k),其中k=0,1,2,…,159。確定單元202可以從該160個頻譜包絡中選擇P2個頻譜包絡,計算這P2個頻譜包絡的能量之和占該音頻幀的總能量的比例。確定單元202可以對N個音頻幀分別執(zhí)行上述過程,即分別計算N個音頻幀中每一個音頻幀的P2個頻譜包絡的能量之和占各自總能量的比例。確定單元202可以計算比例的平均值,這個比例的平均值即為該第二能量比例。確定單元202可以從該160個頻譜包絡中選擇P3個頻譜包絡,計算這P3個頻譜包絡的能量之和占該音頻幀的總能量的比例。確定單元202可以對該N個音頻幀分別執(zhí)行上述過程,即分別計算N個音頻幀中每一個音頻幀的P2個頻譜包絡的能量之和占各自總能量的比例。確定單元202可以計算比例的平均值,這個比例的平均值即為該第三能量比例。在該第二能量比例大于第七預設(shè)值且該第三能量比例大于第八預設(shè)值的情況下,確定單元202可以確定采用該第一編碼方法對該當前音頻幀進行編碼。在該第二能量比例大于第九預設(shè)值的情況下,確定單元202可以確定采用該第一編碼方法對該當前音頻幀進行編碼。在該第三能量比例小于第十預設(shè)值的情況下,確定單元202可以確定采用該第二編碼方法對該當前音頻幀進行編碼。該P2個頻譜包絡可以是該P個頻譜包絡中能量最大的P2個頻譜包絡;該P3個頻譜包絡可以是該P個頻譜包絡中能量最大的P3個頻譜包絡??蛇x的,作為一個實施例,P2的取值可以為20,P3的取值可以為30??蛇x的,作為另一實施例,可以通過突發(fā)稀疏性為該當前音頻幀選擇合適的編碼方法。突發(fā)稀疏性需要考慮音頻幀的能量在頻譜上分布的全局稀疏性、局部稀疏性以及短時突發(fā)性。在此情況下,該能量在頻譜上分布的稀疏性可以包括能量在頻譜上分布的全局稀疏性、局部稀疏性以及短時突發(fā)性。在此情況下,N可以取值為1,該N個音頻幀就是該當前音頻幀。確定單元202,具體用于將該當前音頻幀的頻譜劃分為Q個子帶,根據(jù)該當前音頻幀頻譜的Q個子帶中的每個子帶的峰值能量,確定突發(fā)稀疏性參數(shù),其中該突發(fā)稀疏性參數(shù)用于表示該當前音頻幀的全局稀疏性、局部稀疏性以及短時突發(fā)性。具體地,確定單元202,具體用于確定該Q個子帶中每個子帶的全局峰均比、該Q個子帶中每個子帶的局部峰均比和該Q個子帶中每個子帶的短時能量波動,其中該全局峰均比是確定單元202根據(jù)子帶內(nèi)的峰值能量和該當前音頻幀的全部子帶的平均能量確定的,該局部峰均比是確定單元202根據(jù)子帶內(nèi)的峰值能量和子帶內(nèi)的平均能量確定的,該短時峰值能量波動是根據(jù)子帶內(nèi)的峰值能量和該音頻幀之前的音頻幀的特定頻帶內(nèi)的峰值能量確定的。該Q個子帶中每個子帶的全局峰均比、該Q個子帶中每個子帶的局部峰均比和該Q個子帶中每個子帶的短時能量波動分別表示該全局稀疏性、該局部稀疏性以及該短時突發(fā)性。確定單元202,具體用于確定該Q個子帶中是否存在第一子帶,其中該第一子帶的局部峰均比大于第十一預設(shè)值,該第一子帶的全局峰均比大于第十二預設(shè)值,該第一子帶的短時峰值能量波動大于第十三預設(shè)值,在該Q個子帶中存在該第一子帶的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。具體地,確定單元202可以采用以下公式確定該全局峰均比:....................................公式1.7其中,e(i)表示Q個子帶中第i個子帶的峰值能量,s(k)表示P個頻譜包絡中第k個頻譜包絡的能量。p2s(i)表示第i個子帶的全局峰均比。確定單元202可以采用以下公式確定該局部峰均比:.........................公式1.8其中,e(i)表示Q個子帶中第i個子帶的峰值能量,s(k)表示P個頻譜包絡中第k個頻譜包絡的能量,h(i)表示第i個子帶所含頻率最高的頻譜包絡的索引,l(i)表示第i個子帶所含頻率最低的頻譜包絡的索引。p2a(i)表示第i個子帶的局部峰均比。其中h(i)小于等于P-1。確定單元202可以采用以下公式確定該短時峰值能量波動:dev(i)=(2*e(i))/(e1+e2),.................................公式1.9其中,e(i)表示當前音頻幀的Q個子帶中第i個子帶的峰值能量,e1和e2表示該當前音頻幀之前的音頻幀中特定頻帶的峰值能量。具體地,假設(shè)當前音頻幀為第M個音頻幀,確定該當前音頻幀的第i個子帶的峰值能量所在的頻譜包絡。假設(shè)該峰值能量所在的頻譜包絡位置為i1。確定第(M-1)個音頻幀中(i1-t)頻譜包絡至(i1+t)頻譜包絡范圍內(nèi)的峰值能量,該峰值能量即為e1。類似的,確定第(M-2)個音頻幀中(i1-t)頻譜包絡至(i1+t)頻譜包絡范圍內(nèi)的峰值能量,該峰值能量即為e2。本領(lǐng)域技術(shù)人員可以理解,該第十一預設(shè)值、第十二預設(shè)值、第十三預設(shè)值可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)念A設(shè)值,從而使得滿足上述條件的音頻幀在采用第一編碼方法時可以獲得較好的編碼效果??蛇x的,作為另一個實施例,可以通過帶限稀疏性為該當前音頻幀選擇合適的編碼方法。在此情況下,該能量在頻譜上分布的稀疏性包括能量在頻譜上分布的帶限稀疏性。在此情況下,確定單元202,具體用于確定該N個音頻幀中每個音頻幀的分界頻率。確定單元202,具體用于根據(jù)該N個音頻幀中每個音頻幀的分界頻率,確定帶限稀疏性參數(shù)。本領(lǐng)域技術(shù)人員可以理解,該第四預設(shè)比例和該第十四預設(shè)值的取值可以根據(jù)仿真實驗確定。根據(jù)仿真實驗,可以確定適當?shù)念A設(shè)值和預設(shè)比例,從而使得滿足上述條件的音頻幀在采用第一編碼方法時可以獲得較好的編碼效果。舉例來說,確定單元202可以確定該當前音頻幀的P個頻譜包絡中每一個頻譜包絡的能量,從低頻到高頻搜索分界頻率,使得小于該分界頻率的能量占該當前音頻幀總能量的比值為第四預設(shè)比例。該帶限稀疏性參數(shù)還可以是該N個音頻幀的分界頻率的平均值。在此情況下,確定單元202,具體用于在確定該音頻幀的帶限稀疏性參數(shù)小于第十四預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。假設(shè)N為1,則該當前音頻幀的分界頻率即為該帶限稀疏性參數(shù)。假設(shè)N為大于1的整數(shù),則確定單元202可以確定N個音頻幀的分界頻率的平均值即為該帶限稀疏性參數(shù)。本領(lǐng)域技術(shù)人員可以理解,上述確定分界頻率僅是一個例子。確定分界頻率的方法還可以是從高頻到低頻搜索分界頻率或者其他方法。進一步,為了避免頻繁地切換第一編碼方法和第二編碼方法,確定單元202還可以用于設(shè)置拖尾區(qū)間。確定單元202可以用于確定拖尾區(qū)間內(nèi)的音頻幀可以采用拖尾區(qū)間起始位置音頻幀采用的編碼方法。這樣,就可以避免頻繁切換不同的編碼方法引起的切換質(zhì)量的下降。如果拖尾區(qū)間的拖尾長度為L,則確定單元202可以用于確定在該當前音頻幀之后的L個音頻幀均屬于該當前音頻幀的拖尾區(qū)間。如果屬于拖尾區(qū)間內(nèi)的某一音頻幀的能量在頻譜上分布的稀疏性與該拖尾區(qū)間起始位置音頻幀的能量在頻譜上分布的稀疏性不同,則確定單元202可以用于確定該音頻幀仍采用與該拖尾區(qū)間起始位置音頻幀相同的編碼方法進行編碼。拖尾區(qū)間的長度可以根據(jù)拖尾區(qū)間內(nèi)的音頻幀的能量在頻譜上分布的稀疏性更新,直到拖尾區(qū)間的長度為0。舉例來說,如果確定單元202確定第I個音頻幀采用第一編碼方法且預設(shè)拖尾區(qū)間長度為L,則確定單元202可以確定該第I+1個音頻幀至第I+L個音頻幀均采用該第一編碼方法。然后,確定單元202可以確定該第I+1個音頻幀的能量在頻譜上分布的稀疏性,根據(jù)該第I+1個音頻幀的能量在頻譜上分布的稀疏性重新計算拖尾區(qū)間。如果第I+1個音頻幀仍符合采用第一編碼方法的條件,則確定單元202可以確定后續(xù)拖尾區(qū)間仍然是預設(shè)拖尾區(qū)間L。也就是說,拖尾區(qū)間從第L+2個音頻幀開始到第(I+1+L)個音頻幀。如果第I+1個音頻幀不符合采用第一編碼方法的條件,則確定單元202可以根據(jù)該I+1個音頻幀的能量在頻譜上分布的稀疏性,重新確定拖尾區(qū)間。例如,確定單元202可以重新確定確定拖尾區(qū)間為L-L1,其中L1為小于或等于L的正整數(shù)。如果L1等于L,則拖尾區(qū)間的長度更新為0。在此情況下,確定單元202可以根據(jù)該第I+1個音頻幀的能量在頻譜上分布的稀疏性重新確定編碼方法。如果L1為小于L的整數(shù),則確定單元202可以根據(jù)第(I+1+L-L1)個音頻幀的能量在頻譜上分布的稀疏性重新確定編碼方法。但是由于第I+1個音頻幀位于第I個音頻幀的拖尾區(qū)間內(nèi),第I+1個音頻幀仍采用第一編碼方法進行編碼。L1可以稱為拖尾更新參數(shù),該拖尾更新參數(shù)的取值可以根據(jù)輸入的音頻幀的能量在頻譜上分布的稀疏性來確定。這樣,拖尾區(qū)間的更新與音頻幀的能量在頻譜上分布的稀疏性相關(guān)。例如,在確定了一般稀疏性參數(shù)且該一般稀疏性參數(shù)為第一最小帶寬的情況下,確定單元202可以根據(jù)音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬重新確定該拖尾區(qū)間。假設(shè)確定采用第一編碼方法對第I個音頻幀進行編碼,且預設(shè)的拖尾區(qū)間為L。確定單元202可以確定包括第I+1個音頻幀在內(nèi)的連續(xù)H個音頻幀中每一個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬,其中H為大于0的正整數(shù)。如果第I+1個音頻幀不滿足使用第一編碼方法的條件,則確定單元202可以確定第一預設(shè)比例的能量在頻譜上分布的最小帶寬小于第十五預設(shè)值的音頻幀的數(shù)量(以下簡稱該數(shù)量為第一拖尾參數(shù))。在該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬大于第十六預設(shè)值且小于第十七預設(shè)值,并且該第一拖尾參數(shù)小于第十八預設(shè)值的情況下,確定單元202可以將拖尾區(qū)間長度減1,即拖尾更新參數(shù)為1。該第十六預設(shè)值大于第一預設(shè)值。在該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬大于該第十七預設(shè)值且小于該第十九預設(shè)值,并且該第一拖尾參數(shù)小于該第十八預設(shè)值的情況下,確定單元202可以將該拖尾區(qū)間長度減2,即拖尾更新參數(shù)為2。在該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬大于該第十九預設(shè)值的情況下,確定單元202可以將拖尾區(qū)間設(shè)置為0。在該第一拖尾參數(shù)以及該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬不滿足上述第十六預設(shè)值至第十九預設(shè)值中的一個或多個預設(shè)值的情況下,確定單元202可以確定拖尾區(qū)間保持不變。本領(lǐng)域技術(shù)人員可以理解,該預設(shè)的拖尾區(qū)間可以根據(jù)實際情況進行設(shè)置,拖尾更新參數(shù)也可以根據(jù)實際情況進行調(diào)整。該第十五預設(shè)值至該第十九預設(shè)值可以根據(jù)實際情況進行調(diào)整,從而可以設(shè)置不同的拖尾區(qū)間。類似的,當該一般稀疏性參數(shù)包括第二最小帶寬和第三最小帶寬,或者,該一般稀疏性參數(shù)包括第一能量比例,或者,該一般稀疏性參數(shù)包括第二能量比例和第三能量比例的情況下,確定單元202可以設(shè)置相應的預設(shè)的拖尾區(qū)間、拖尾更新參數(shù)以及用于確定拖尾更新參數(shù)的相關(guān)參數(shù),從而可以確定相應的拖尾區(qū)間,避免頻繁地切換編碼方法。在根據(jù)的突發(fā)稀疏性確定編碼方法(即根據(jù)音頻幀的能量在頻譜上分布的全局稀疏性、局部稀疏性以及短時突發(fā)性確定編碼方法)的情況下,確定單元202也可以設(shè)置相應的拖尾區(qū)間、拖尾更新參數(shù)以及用于確定拖尾更新參數(shù)的相關(guān)參數(shù)以避免頻繁地切換編碼方法。在此情況下,該拖尾區(qū)間可以小于一般稀疏性參數(shù)時設(shè)置的拖尾區(qū)間。在根據(jù)能量在頻譜上分布的帶限特性確定編碼方法的情況下,確定單元202也可以設(shè)置相應的拖尾區(qū)間、拖尾更新參數(shù)以及用于確定拖尾更新參數(shù)的相關(guān)參數(shù)以避免頻繁地切換編碼方法。例如,確定單元202可以通過計算輸入的音頻幀的低頻譜包絡的能量與所有頻譜包絡的能量的比值,根據(jù)該比值確定該拖尾更新參數(shù)。具體地,確定單元202可以采用以下公式確定低頻譜包絡的能量與所有頻譜包絡的能量的比值:..........................................公式1.10其中,Rlow表示低頻譜包絡的能量與所有頻譜包絡的能量的比值,s(k)表示第k個頻譜包絡的能量,y表示低頻帶的最高頻譜包絡的索引,P表示該音頻幀總共被劃分為P個頻譜包絡。在此情況下,如果Rlow大于第二十預設(shè)值,則該拖尾更新參數(shù)為0。如果Rlow大于第二十一預設(shè)值,則拖尾更新參數(shù)可以取較小的值,其中該第二十預設(shè)值大于該第二十一預設(shè)值。如果Rlow不大于第二十一預設(shè)值,則該拖尾參數(shù)可以取較大的值。本領(lǐng)域技術(shù)人員可以理解,該第二十預設(shè)值和該第二十一預設(shè)值可以根據(jù)仿真實驗確定,該拖尾更新參數(shù)的取值也可以根據(jù)試驗確定。此外,在根據(jù)能量在頻譜上分布的帶限特性確定編碼方法的情況下,確定單元202還可以確定輸入的音頻幀的分界頻率,根據(jù)該分界頻率確定該拖尾更新參數(shù),其中該分界頻率可以與用于確定帶限稀疏性參數(shù)的分界頻率不同。如果該分界頻率小于第二十二預設(shè)值,則確定單元202可以確定該拖尾更新參數(shù)為0。如果該分界頻率小于第二十三預設(shè)值,則確定單元202可以確定該拖尾更新參數(shù)取值較小。如果該分界頻率大于該第二十三預設(shè)值,則確定單元202可以確定該拖尾更新參數(shù)可以取較大的值。本領(lǐng)域技術(shù)人員可以理解,該第二十二預設(shè)值和該第二十三預設(shè)值可以根據(jù)仿真實驗確定,該拖尾更新參數(shù)的取值也可以根據(jù)試驗確定。圖3是根據(jù)本發(fā)明實施例提供的裝置的結(jié)構(gòu)框圖。圖3所示的裝置300能夠執(zhí)行圖1的各個步驟。如圖3所示,裝置300包括:處理器301、存儲器302。裝置300中的各個組件通過總線系統(tǒng)303耦合在一起,其中總線系統(tǒng)303除包括數(shù)據(jù)總線之外,還包括電源總線、控制總線和狀態(tài)信號總線。但是為了清楚說明起見,在圖3中將各種總線都標為總線系統(tǒng)303。上述本發(fā)明實施例揭示的方法可以應用于處理器301中,或者由處理器301實現(xiàn)。處理器301可能是一種集成電路芯片,具有信號的處理能力。在實現(xiàn)過程中,上述方法的各步驟可以通過處理器301中的硬件的集成邏輯電路或者軟件形式的指令完成。上述的處理器301可以是通用處理器、數(shù)字信號處理器(DigitalSignalProcessor,DSP)、專用集成電路(ApplicationSpecificIntegratedCircuit,ASIC)、現(xiàn)成可編程門陣列(FieldProgrammableGateArray,F(xiàn)PGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件??梢詫崿F(xiàn)或者執(zhí)行本發(fā)明實施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。結(jié)合本發(fā)明實施例所公開的方法的步驟可以直接體現(xiàn)為硬件譯碼處理器執(zhí)行完成,或者用譯碼處理器中的硬件及軟件模塊組合執(zhí)行完成。軟件模塊可以位于隨機存取存儲器(RandomAccessMemory,RAM)、閃存、只讀存儲器(Read-OnlyMemory,ROM)、可編程只讀存儲器或者電可擦寫可編程存儲器、寄存器等本領(lǐng)域成熟的存儲介質(zhì)中。該存儲介質(zhì)位于存儲器302,處理器301讀取存儲器302中的指令,結(jié)合其硬件完成上述方法的步驟。處理器301,用于獲取N個音頻幀,其中該N個音頻幀包括當前音頻幀,N為正整數(shù)。處理器301,用于確定該處理器301獲取的N個音頻幀的能量在頻譜上分布的稀疏性。處理器301,還用于根據(jù)該N個音頻幀的能量在頻譜上分布的稀疏性,確定采用第一編碼方法或第二編碼方法對該當前音頻幀進行編碼,其中該第一編碼方法為基于時頻變換和變換系數(shù)量化且不基于線性預測的編碼方法,該第二編碼方法為基于線性預測的編碼方法。圖3所示的裝置在對音頻幀進行編碼時,考慮了該音頻幀的能量在頻譜上分布的稀疏性,能夠降低編碼的復雜度,同時能夠保證編碼具有較高的準確率。在為音頻幀選擇合適的編碼方法時可以考慮該音頻幀的能量在頻譜上分布的稀疏性。音頻幀的能量在頻譜上分布的稀疏性可以有三種:一般稀疏性、突發(fā)稀疏性和帶限稀疏性??蛇x的,作為一個實施例,可以通過一般稀疏性為該當前音頻幀選擇合適的編碼方法。在此情況下,處理器301,具體用于將該N個音頻幀的每一個音頻幀的頻譜劃分為P個頻譜包絡,根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量確定一般稀疏性參數(shù),其中P為正整數(shù),該一般稀疏性參數(shù)表示該N個音頻幀的能量在頻譜上分布的稀疏性。具體地,可以將輸入的音頻幀特定比例能量在頻譜上分布的最小帶寬在連續(xù)N幀的均值定義為一般稀疏性。這個帶寬越小則一般稀疏性越強,這個帶寬越大則一般稀疏性越弱。換句話說,一般稀疏性越強,則音頻幀的能量越集中,一般稀疏性越弱,則音頻幀的能量越分散。第一編碼方法對一般稀疏性較強的音頻幀編碼效率高。因此,可以通過判斷音頻幀的一般稀疏性選擇合適的編碼方法對音頻幀進行編碼。為了便于判斷音頻幀的一般稀疏性,可以將一般稀疏性進行量化得到一般稀疏性參數(shù)??蛇x的,當N取1的情況下,該一般稀疏性就是當前音頻幀的特定比例能量在頻譜上分布的最小帶寬??蛇x的,作為一個實施例,該一般稀疏性參數(shù)包括第一最小帶寬。在此情況下,處理器301,具體用于根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,該N個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值為該第一最小帶寬。處理器301,具體用于在該第一最小帶寬小于第一預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第一最小帶寬大于該第一預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。本領(lǐng)域技術(shù)人員可以理解,該第一預設(shè)值和該第一預設(shè)比例可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)牡谝活A設(shè)值和第一預設(shè)比例,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果。處理器301,具體用于分別將該每一個音頻幀的P個頻譜包絡的能量從大到小排序,根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬,根據(jù)該N個音頻幀中每一個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的不小于第一預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值。例如,處理器301獲取的音頻信號是16kHz采樣的寬帶信號,獲取的音頻信號以30ms為一幀被獲取。每幀信號為330個時域采樣點。處理器301可以對時域信號做時頻變換,例如采用快速傅里葉變換(FastFourierTransformation,F(xiàn)FT)進行時頻變換,得到130個頻譜包絡S(k),即130個FFT能量譜系數(shù),其中k=0,1,2,…,159。處理器301可以在頻譜包絡S(k)中尋找一個最小帶寬,使得該帶寬上的能量占該幀總能量的比例為第一預設(shè)比例。具體來說,處理器301可以將頻譜包絡S(k)中的頻點能量由大到小依次進行累加;每一次進行累加后與該音頻幀的總能量進行比較,如果比值大于第一預設(shè)比例,則中止累加過程,累加的次數(shù)即為最小帶寬。例如,第一預設(shè)比例為90%,累加30次的能量之和占總能量的比例超過了90%,則可以認為該音頻幀的不小于第一預設(shè)比例的能量的最小帶寬為30。處理器301可以對N個音頻幀分別執(zhí)行上述確定最小帶寬的過程。分別確定包括當前音頻幀在內(nèi)的N個音頻幀的不小于第一預設(shè)比例的能量的最小帶寬。處理器301可以計算N個不小于第一預設(shè)比例的能量的最小帶寬的平均值。這個N個不小于第一預設(shè)比例的能量的最小帶寬的平均值可以稱為第一最小帶寬,該第一最小帶寬可以作為該一般稀疏性參數(shù)。在該第一最小帶寬小于第一預設(shè)值的情況下,處理器301可以確定采用第一編碼方法對該當前音頻幀進行編碼。在該第一最小帶寬大于該第一預設(shè)值的情況下,處理器301可以確定采用該第二編碼方法對該當前音頻幀進行編碼??蛇x的,作為另一個實施例,該一般稀疏性參數(shù)可以包括第一能量比例。在此情況下,處理器301,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P1個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P1個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第一能量比例,其中P1為小于P的正整數(shù)。處理器301,具體用于在該第一能量比例大于第二預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第一能量比例小于該第二預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼??蛇x的,作為一個實施例,在N取1的情況下,該N個音頻幀就是該當前音頻幀,處理器301,具體用于根據(jù)該當前音頻幀的P1個頻譜包絡的能量與該當前音頻幀的總能量確定該第一能量比例。處理器301,具體用于根據(jù)該P個頻譜包絡的能量確定該P1個頻譜包絡,其中該P1個頻譜包絡中任一個頻譜包絡的能量大于該P個頻譜包絡中除該P1個頻譜包絡外的其他頻譜包絡中的任一個頻譜包絡的能量。具體地,處理器301可以利用以下公式計算該第一能量比例:...........................................公式1.6其中,R1表示該第一能量比例,Ep1(n)表示第n個音頻幀中選定的P1個頻譜包絡的能量之和,Eall(n)表示第n個音頻幀的總能量,r(n)表示N個音頻幀中的第n個音頻幀的P1個頻譜包絡的能量占該音頻幀的總能量的比例。本領(lǐng)域技術(shù)人員可以理解,該第二預設(shè)值和該P1個頻譜包絡的選擇可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)牡诙A設(shè)值和P1的值以及選擇P1個頻譜包絡的方法,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果。可選的,作為一個實施例,該P1個頻譜包絡可以是該P個頻譜包絡中能量最大的P1個頻譜包絡。舉例來說,處理器301獲取的音頻信號是16kHz采樣的寬帶信號,獲取的音頻信號以30ms為一幀被獲取。每幀信號為330個時域采樣點。處理器301可以對時域信號做時頻變換,例如采用快速傅里葉變換進行時頻變換,得到130個頻譜包絡S(k),其中k=0,1,2,…,159。處理器301可以從該130個頻譜包絡中選擇P1個頻譜包絡,計算這P1個頻譜包絡的能量之和占該音頻幀的總能量的比例。處理器301可以對N個音頻幀分別執(zhí)行上述過程,即分別計算N個音頻幀中每一個音頻幀的P1個頻譜包絡的能量之和占各自的總能量的比例。處理器301可以計算比例的平均值,這個比例的平均值即為該第一能量比例。在該第一能量比例大于第二預設(shè)值的情況下,處理器301可以確定采用第一編碼方法對該當前音頻幀進行編碼。在該第一能量比例小于該第二預設(shè)值的情況下,處理器301可以確定采用第二編碼方法對該當前音頻幀進行編碼。該P1個頻譜包絡可以是該P個頻譜包絡中能量最大的P1個頻譜包絡。也就是說,處理器301,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中確定能量最大的P1個頻譜包絡??蛇x的,作為一個實施例,P1的取值可以為30。可選的,作為另一個實施例,該一般稀疏性參數(shù)可以包括第二最小帶寬和第三最小帶寬。在此情況下,處理器301,具體用于根據(jù)該N個音頻幀的每一個音頻幀的P個頻譜包絡的能量,確定該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,確定該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值作為該第二最小帶寬,該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值作為該第三最小帶寬,其中該第二預設(shè)比例小于該第三預設(shè)比例。處理器301,具體用于在該第二最小帶寬小于第三預設(shè)值且該第三最小帶寬小于第四預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第三最小帶寬小于第五預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,或者,在該第三最小帶寬大于第六預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。可選的,作為一個實施例,在N取1的情況下,該N個音頻幀就是該當前音頻幀。處理器301可以根據(jù)該當前音頻幀的第二預設(shè)比例能量在頻譜上分布的最小帶寬作為該第二最小帶寬。處理器301可以根據(jù)該當前音頻幀的第三預設(shè)比例能量在頻譜上分布的最小帶寬作為該第三最小帶寬。本領(lǐng)域技術(shù)人員可以理解,該第三預設(shè)值、第四預設(shè)值、第五預設(shè)值、第六預設(shè)值、該第二預設(shè)比例和該第三預設(shè)比例可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)念A設(shè)值和預設(shè)比例,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果。該處理器301,具體用于分別將該每一個音頻幀的P個頻譜包絡的能量從大到小排序,根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬,根據(jù)該N個音頻幀中每一個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值,根據(jù)該N個音頻幀中的每一個音頻幀的從大到小排序的P個頻譜包絡的能量,確定該N個音頻幀中每一個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬,根據(jù)該N個音頻幀中每一個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬,確定該N個音頻幀的第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值。舉例來說,處理器301獲取的音頻信號是16kHz采樣的寬帶信號,獲取的音頻信號以30ms為一幀被獲取。每幀信號為330個時域采樣點。處理器301可以對時域信號做時頻變換,例如采用快速傅里葉變換進行時頻變換,得到130個頻譜包絡S(k),其中k=0,1,2,…,159。處理器301可以在頻譜包絡S(k)中尋找一個最小帶寬,使得該帶寬上的能量占該幀總能量的比例不小于第二預設(shè)比例。處理器301可以繼續(xù)在頻譜包括S(k)中尋找一個帶寬,使得該帶寬上的能量占總能量的比例不小于第三預設(shè)比例。具體來說,處理器301可以將頻譜包括S(k)中的頻點能量由大到小依次進行累加。每一次進行累加后與該音頻幀的總能量進行比較,如果比值大于第二預設(shè)比例,則累加的次數(shù)即為不小于第二預設(shè)比例的最小帶寬。處理器301可以繼續(xù)進行累加,如果累加后與該音頻幀總能量的比值大于第三預設(shè)比例,則中止累加,累加次數(shù)為不小于第三預設(shè)比例的最小帶寬。例如,第二預設(shè)比例為85%,第三預設(shè)比例為95%。累加30次的能量之和占總能量的比例超過了85%,則可以認為該音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬為30。繼續(xù)進行累加,如果累加了35次的能量之和占總能量的比例為95,則可以認為該音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬為35。處理器301可以對N個音頻幀分別執(zhí)行上述過程。處理器301可以分別確定包括當前音頻幀在內(nèi)的N個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬和不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬。該N個音頻幀的不小于第二預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值即為該第二最小帶寬。該N個音頻幀的不小于第三預設(shè)比例的能量在頻譜上分布的最小帶寬的平均值即為該第三最小帶寬。在該第二最小帶寬小于第三預設(shè)值且該第三最小帶寬小于第四預設(shè)值的情況下,處理器301可以確定采用第一編碼方法對該當前音頻幀進行編碼。在該第三最小帶寬小于第五預設(shè)值的情況下,處理器301可以確定采用該第一編碼方法對該當前音頻幀進行編碼。在該第三最小帶寬大于第六預設(shè)值的情況下,處理器301可以確定采用第二編碼方法對該當前音頻幀進行編碼??蛇x的,作為另一個實施例,該一般稀疏性參數(shù)包括第二能量比例和第三能量比例。在此情況下,處理器301,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P2個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P2個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第二能量比例,從該N個音頻幀中每個音頻幀的P個頻譜包絡中分別選擇P3個頻譜包絡,根據(jù)該N個音頻幀中每個音頻幀的P3個頻譜包絡的能量與該N個音頻幀的每個音頻幀的總能量,確定該第三能量比例,其中P2和P3為小于P的正整數(shù),且P2小于P3。處理器301,具體用于在該第二能量比例大于第七預設(shè)值且該第三能量比例大于第八預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第二能量比例大于第九預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼,在該第三能量比例小于第十預設(shè)值的情況下,確定采用該第二編碼方法對該當前音頻幀進行編碼。可選的,作為一個實施例,在N取1的情況下,該N個音頻幀就是該當前音頻幀。處理器301可以根據(jù)該當前音頻幀的P2個頻譜包絡的能量與該當前音頻幀的總能量,確定該第二能量比例。處理器301可以根據(jù)該當前音頻幀的P3個頻譜包絡的能量與該當前音頻幀的總能量,確定該第三能量比例。本領(lǐng)域技術(shù)人員可以理解,P2和P3的值,以及該第七預設(shè)值、該第八預設(shè)值、該第九預設(shè)值和該第十預設(shè)值可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)念A設(shè)值,從而使得滿足上述條件的音頻幀在采用第一編碼方法或第二編碼方法時可以獲得較好的編碼效果??蛇x的,作為一個實施例,處理器301,具體用于從該N個音頻幀中每個音頻幀的P個頻譜包絡中能量最大的P2個頻譜包絡,從該N個音頻幀中每個音頻幀的P個頻譜包絡中能量最大的P3個頻譜包絡。舉例來說,處理器301獲取的音頻信號是16kHz采樣的寬帶信號,獲取的音頻信號以30ms為一幀被獲取。每幀信號為330個時域采樣點。處理器301可以對時域信號做時頻變換,例如采用快速傅里葉變換進行時頻變換,得到130個頻譜包絡S(k),其中k=0,1,2,…,159。處理器301可以從該130個頻譜包絡中選擇P2個頻譜包絡,計算這P2個頻譜包絡的能量之和占該音頻幀的總能量的比例。處理器301可以對N個音頻幀分別執(zhí)行上述過程,即分別計算N個音頻幀中每一個音頻幀的P2個頻譜包絡的能量之和占各自總能量的比例。處理器301可以計算比例的平均值,這個比例的平均值即為該第二能量比例。處理器301可以從該130個頻譜包絡中選擇P3個頻譜包絡,計算這P3個頻譜包絡的能量之和占該音頻幀的總能量的比例。處理器301可以對該N個音頻幀分別執(zhí)行上述過程,即分別計算N個音頻幀中每一個音頻幀的P2個頻譜包絡的能量之和占各自總能量的比例。處理器301可以計算比例的平均值,這個比例的平均值即為該第三能量比例。在該第二能量比例大于第七預設(shè)值且該第三能量比例大于第八預設(shè)值的情況下,處理器301可以確定采用該第一編碼方法對該當前音頻幀進行編碼。在該第二能量比例大于第九預設(shè)值的情況下,處理器301可以確定采用該第一編碼方法對該當前音頻幀進行編碼。在該第三能量比例小于第十預設(shè)值的情況下,處理器301可以確定采用該第二編碼方法對該當前音頻幀進行編碼。該P2個頻譜包絡可以是該P個頻譜包絡中能量最大的P2個頻譜包絡;該P3個頻譜包絡可以是該P個頻譜包絡中能量最大的P3個頻譜包絡??蛇x的,作為一個實施例,P2的取值可以為30,P3的取值可以為30??蛇x的,作為另一實施例,可以通過突發(fā)稀疏性為該當前音頻幀選擇合適的編碼方法。突發(fā)稀疏性需要考慮音頻幀的能量在頻譜上分布的全局稀疏性、局部稀疏性以及短時突發(fā)性。在此情況下,該能量在頻譜上分布的稀疏性可以包括能量在頻譜上分布的全局稀疏性、局部稀疏性以及短時突發(fā)性。在此情況下,N可以取值為1,該N個音頻幀就是該當前音頻幀。處理器301,具體用于將該當前音頻幀的頻譜劃分為Q個子帶,根據(jù)該當前音頻幀頻譜的Q個子帶中的每個子帶的峰值能量,確定突發(fā)稀疏性參數(shù),其中該突發(fā)稀疏性參數(shù)用于表示該當前音頻幀的全局稀疏性、局部稀疏性以及短時突發(fā)性。具體地,處理器301,具體用于確定該Q個子帶中每個子帶的全局峰均比、該Q個子帶中每個子帶的局部峰均比和該Q個子帶中每個子帶的短時能量波動,其中該全局峰均比是處理器301根據(jù)子帶內(nèi)的峰值能量和該當前音頻幀的全部子帶的平均能量確定的,該局部峰均比是處理器301根據(jù)子帶內(nèi)的峰值能量和子帶內(nèi)的平均能量確定的,該短時峰值能量波動是根據(jù)子帶內(nèi)的峰值能量和該音頻幀之前的音頻幀的特定頻帶內(nèi)的峰值能量確定的。該Q個子帶中每個子帶的全局峰均比、該Q個子帶中每個子帶的局部峰均比和該Q個子帶中每個子帶的短時能量波動分別表示該全局稀疏性、該局部稀疏性以及該短時突發(fā)性。處理器301,具體用于確定該Q個子帶中是否存在第一子帶,其中該第一子帶的局部峰均比大于第十一預設(shè)值,該第一子帶的全局峰均比大于第十二預設(shè)值,該第一子帶的短時峰值能量波動大于第十三預設(shè)值,在該Q個子帶中存在該第一子帶的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。具體地,處理器301可以采用以下公式確定該全局峰均比:................................公式1.7其中,e(i)表示Q個子帶中第i個子帶的峰值能量,s(k)表示P個頻譜包絡中第k個頻譜包絡的能量。p2s(i)表示第i個子帶的全局峰均比。處理器301可以采用以下公式確定該局部峰均比:.......................公式1.8其中,e(i)表示Q個子帶中第i個子帶的峰值能量,s(k)表示P個頻譜包絡中第k個頻譜包絡的能量,h(i)表示第i個子帶所含頻率最高的頻譜包絡的索引,l(i)表示第i個子帶所含頻率最低的頻譜包絡的索引。p2a(i)表示第i個子帶的局部峰均比。其中h(i)小于等于P-1。處理器301可以采用以下公式確定該短時峰值能量波動:dev(i)=(2*e(i))/(e1+e2),..............................公式1.9其中,e(i)表示當前音頻幀的Q個子帶中第i個子帶的峰值能量,e1和e2表示該當前音頻幀之前的音頻幀中特定頻帶的峰值能量。具體地,假設(shè)當前音頻幀為第M個音頻幀,確定該當前音頻幀的第i個子帶的峰值能量所在的頻譜包絡。假設(shè)該峰值能量所在的頻譜包絡位置為i1。確定第(M-1)個音頻幀中(i1-t)頻譜包絡至(i1+t)頻譜包絡范圍內(nèi)的峰值能量,該峰值能量即為e1。類似的,確定第(M-2)個音頻幀中(i1-t)頻譜包絡至(i1+t)頻譜包絡范圍內(nèi)的峰值能量,該峰值能量即為e2。本領(lǐng)域技術(shù)人員可以理解,該第十一預設(shè)值、第十二預設(shè)值、第十三預設(shè)值可以根據(jù)仿真試驗確定。通過仿真試驗可以確定適當?shù)念A設(shè)值,從而使得滿足上述條件的音頻幀在采用第一編碼方法時可以獲得較好的編碼效果。可選的,作為另一個實施例,可以通過帶限稀疏性為該當前音頻幀選擇合適的編碼方法。在此情況下,該能量在頻譜上分布的稀疏性包括能量在頻譜上分布的帶限稀疏性。在此情況下,處理器301,具體用于確定該N個音頻幀中每個音頻幀的分界頻率。處理器301,具體用于根據(jù)該N個音頻幀中每個音頻幀的分界頻率,確定帶限稀疏性參數(shù)。本領(lǐng)域技術(shù)人員可以理解,該第四預設(shè)比例和該第十四預設(shè)值的取值可以根據(jù)仿真實驗確定。根據(jù)仿真實驗,可以確定適當?shù)念A設(shè)值和預設(shè)比例,從而使得滿足上述條件的音頻幀在采用第一編碼方法時可以獲得較好的編碼效果。舉例來說,處理器301可以確定該當前音頻幀的P個頻譜包絡中每一個頻譜包絡的能量,從低頻到高頻搜索分界頻率,使得小于該分界頻率的能量占該當前音頻幀總能量的比值為第四預設(shè)比例。該帶限稀疏性參數(shù)還可以是該N個音頻幀的分界頻率的平均值。在此情況下,處理器301,具體用于在確定該音頻幀的帶限稀疏性參數(shù)小于第十四預設(shè)值的情況下,確定采用該第一編碼方法對該當前音頻幀進行編碼。假設(shè)N為1,則該當前音頻幀的分界頻率即為該帶限稀疏性參數(shù)。假設(shè)N為大于1的整數(shù),則處理器301可以確定N個音頻幀的分界頻率的平均值即為該帶限稀疏性參數(shù)。本領(lǐng)域技術(shù)人員可以理解,上述確定分界頻率僅是一個例子。確定分界頻率的方法還可以是從高頻到低頻搜索分界頻率或者其他方法。進一步,為了避免頻繁地切換第一編碼方法和第二編碼方法,處理器301還可以用于設(shè)置拖尾區(qū)間。處理器301可以用于確定拖尾區(qū)間內(nèi)的音頻幀可以采用拖尾區(qū)間起始位置音頻幀采用的編碼方法。這樣,就可以避免頻繁切換不同的編碼方法引起的切換質(zhì)量的下降。如果拖尾區(qū)間的拖尾長度為L,則處理器301可以用于確定在該當前音頻幀之后的L個音頻幀均屬于該當前音頻幀的拖尾區(qū)間。如果屬于拖尾區(qū)間內(nèi)的某一音頻幀的能量在頻譜上分布的稀疏性與該拖尾區(qū)間起始位置音頻幀的能量在頻譜上分布的稀疏性不同,則處理器301可以用于確定該音頻幀仍采用與該拖尾區(qū)間起始位置音頻幀相同的編碼方法進行編碼。拖尾區(qū)間的長度可以根據(jù)拖尾區(qū)間內(nèi)的音頻幀的能量在頻譜上分布的稀疏性更新,直到拖尾區(qū)間的長度為0。舉例來說,如果處理器301確定第I個音頻幀采用第一編碼方法且預設(shè)拖尾區(qū)間長度為L,則處理器301可以確定該第I+1個音頻幀至第I+L個音頻幀均采用該第一編碼方法。然后,處理器301可以確定該第I+1個音頻幀的能量在頻譜上分布的稀疏性,根據(jù)該第I+1個音頻幀的能量在頻譜上分布的稀疏性重新計算拖尾區(qū)間。如果第I+1個音頻幀仍符合采用第一編碼方法的條件,則處理器301可以確定后續(xù)拖尾區(qū)間仍然是預設(shè)拖尾區(qū)間L。也就是說,拖尾區(qū)間從第L+2個音頻幀開始到第(I+1+L)個音頻幀。如果第I+1個音頻幀不符合采用第一編碼方法的條件,則處理器301可以根據(jù)該I+1個音頻幀的能量在頻譜上分布的稀疏性,重新確定拖尾區(qū)間。例如,處理器301可以重新確定確定拖尾區(qū)間為L-L1,其中L1為小于或等于L的正整數(shù)。如果L1等于L,則拖尾區(qū)間的長度更新為0。在此情況下,處理器301可以根據(jù)該第I+1個音頻幀的能量在頻譜上分布的稀疏性重新確定編碼方法。如果L1為小于L的整數(shù),則處理器301可以根據(jù)第(I+1+L-L1)個音頻幀的能量在頻譜上分布的稀疏性重新確定編碼方法。但是由于第I+1個音頻幀位于第I個音頻幀的拖尾區(qū)間內(nèi),第I+1個音頻幀仍采用第一編碼方法進行編碼。L1可以稱為拖尾更新參數(shù),該拖尾更新參數(shù)的取值可以根據(jù)輸入的音頻幀的能量在頻譜上分布的稀疏性來確定。這樣,拖尾區(qū)間的更新與音頻幀的能量在頻譜上分布的稀疏性相關(guān)。例如,在確定了一般稀疏性參數(shù)且該一般稀疏性參數(shù)為第一最小帶寬的情況下,處理器301可以根據(jù)音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬重新確定該拖尾區(qū)間。假設(shè)確定采用第一編碼方法對第I個音頻幀進行編碼,且預設(shè)的拖尾區(qū)間為L。處理器301可以確定包括第I+1個音頻幀在內(nèi)的連續(xù)H個音頻幀中每一個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬,其中H為大于0的正整數(shù)。如果第I+1個音頻幀不滿足使用第一編碼方法的條件,則處理器301可以確定第一預設(shè)比例的能量在頻譜上分布的最小帶寬小于第十五預設(shè)值的音頻幀的數(shù)量(以下簡稱該數(shù)量為第一拖尾參數(shù))。在該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬大于第十六預設(shè)值且小于第十七預設(shè)值,并且該第一拖尾參數(shù)小于第十八預設(shè)值的情況下,處理器301可以將拖尾區(qū)間長度減1,即拖尾更新參數(shù)為1。該第十六預設(shè)值大于第一預設(shè)值。在該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬大于該第十七預設(shè)值且小于該第十九預設(shè)值,并且該第一拖尾參數(shù)小于該第十八預設(shè)值的情況下,處理器301可以將該拖尾區(qū)間長度減2,即拖尾更新參數(shù)為2。在該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬大于該第十九預設(shè)值的情況下,處理器301可以將拖尾區(qū)間設(shè)置為0。在該第一拖尾參數(shù)以及該第L+1個音頻幀的第一預設(shè)比例的能量在頻譜上分布的最小帶寬不滿足上述第十六預設(shè)值至第十九預設(shè)值中的一個或多個預設(shè)值的情況下,處理器301可以確定拖尾區(qū)間保持不變。本領(lǐng)域技術(shù)人員可以理解,該預設(shè)的拖尾區(qū)間可以根據(jù)實際情況進行設(shè)置,拖尾更新參數(shù)也可以根據(jù)實際情況進行調(diào)整。該第十五預設(shè)值至該第十九預設(shè)值可以根據(jù)實際情況進行調(diào)整,從而可以設(shè)置不同的拖尾區(qū)間。類似的,當該一般稀疏性參數(shù)包括第二最小帶寬和第三最小帶寬,或者,該一般稀疏性參數(shù)包括第一能量比例,或者,該一般稀疏性參數(shù)包括第二能量比例和第三能量比例的情況下,處理器301可以設(shè)置相應的預設(shè)的拖尾區(qū)間、拖尾更新參數(shù)以及用于確定拖尾更新參數(shù)的相關(guān)參數(shù),從而可以確定相應的拖尾區(qū)間,避免頻繁地切換編碼方法。在根據(jù)的突發(fā)稀疏性確定編碼方法(即根據(jù)音頻幀的能量在頻譜上分布的全局稀疏性、局部稀疏性以及短時突發(fā)性確定編碼方法)的情況下,處理器301也可以設(shè)置相應的拖尾區(qū)間、拖尾更新參數(shù)以及用于確定拖尾更新參數(shù)的相關(guān)參數(shù)以避免頻繁地切換編碼方法。在此情況下,該拖尾區(qū)間可以小于一般稀疏性參數(shù)時設(shè)置的拖尾區(qū)間。在根據(jù)能量在頻譜上分布的帶限特性確定編碼方法的情況下,處理器301也可以設(shè)置相應的拖尾區(qū)間、拖尾更新參數(shù)以及用于確定拖尾更新參數(shù)的相關(guān)參數(shù)以避免頻繁地切換編碼方法。例如,處理器301可以通過計算輸入的音頻幀的低頻譜包絡的能量與所有頻譜包絡的能量的比值,根據(jù)該比值確定該拖尾更新參數(shù)。具體地,處理器301可以采用以下公式確定低頻譜包絡的能量與所有頻譜包絡的能量的比值:...........................................公式1.10其中,Rlow表示低頻譜包絡的能量與所有頻譜包絡的能量的比值,s(k)表示第k個頻譜包絡的能量,y表示低頻帶的最高頻譜包絡的索引,P表示該音頻幀總共被劃分為P個頻譜包絡。在此情況下,如果Rlow大于第二十預設(shè)值,則該拖尾更新參數(shù)為0。如果Rlow大于第二十一預設(shè)值,則拖尾更新參數(shù)可以取較小的值,其中該第二十預設(shè)值大于該第二十一預設(shè)值。如果Rlow不大于第二十一預設(shè)值,則該拖尾參數(shù)可以取較大的值。本領(lǐng)域技術(shù)人員可以理解,該第二十預設(shè)值和該第二十一預設(shè)值可以根據(jù)仿真實驗確定,該拖尾更新參數(shù)的取值也可以根據(jù)試驗確定。此外,在根據(jù)能量在頻譜上分布的帶限特性確定編碼方法的情況下,處理器301還可以確定輸入的音頻幀的分界頻率,根據(jù)該分界頻率確定該拖尾更新參數(shù),其中該分界頻率可以與用于確定帶限稀疏性參數(shù)的分界頻率不同。如果該分界頻率小于第二十二預設(shè)值,則處理器301可以確定該拖尾更新參數(shù)為0。如果該分界頻率小于第二十三預設(shè)值,則處理器301可以確定該拖尾更新參數(shù)取值較小。如果該分界頻率大于該第二十三預設(shè)值,則處理器301可以確定該拖尾更新參數(shù)可以取較大的值。本領(lǐng)域技術(shù)人員可以理解,該第二十二預設(shè)值和該第二十三預設(shè)值可以根據(jù)仿真實驗確定,該拖尾更新參數(shù)的取值也可以根據(jù)試驗確定。本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計算機軟件和電子硬件的結(jié)合來實現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應認為超出本發(fā)明的范圍。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。在本申請所提供的幾個實施例中,應該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。所述功能如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務器,或者網(wǎng)絡設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-OnlyMemory)、隨機存取存儲器(RAM,RandomAccessMemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應涵蓋在本發(fā)明的保護范圍之內(nèi),因此本發(fā)明的保護范圍應以權(quán)利要求的保護范圍為準。
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1