專利名稱:一種視頻音量自動調(diào)節(jié)的系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種音視頻音量自動調(diào)節(jié)的系統(tǒng)及方法,尤其是應(yīng)用于對多個音量不同的音視頻文件進行合并時的音量自動調(diào)節(jié)系統(tǒng)及其方法。
背景技術(shù):
:
在制作視頻源文件時,需要將兩個或多個視頻文件合并為一個視頻文件,由于各個視頻文件各自的音量不同,這就會導(dǎo)致用戶在看電視或者播放視頻文件時,有時會遇到聲音忽高忽低的情況,更有甚者,有時電視劇中插播一些廣告,廣告的聲音會突然地變高。為了解決上述問題,中國專利申請N0.200910077304.7中公開了一種自動控制頻道音量的方法及使用上述方法的數(shù)字電視終端。然而,該中國專利申請N0.200910077304.7雖然解決了數(shù)字電視終端在切換節(jié)目時節(jié)目聲音忽高忽低的情況,但是其只是針對單個用戶端數(shù)字電視終端而實施的,因此無法解決所有用戶所遇到聲音忽高忽低的問題。由此就存在如何在制作視頻源文件過程中合并兩個或多個不同音量的視頻文件時統(tǒng)一視頻音量控制問題。發(fā)明內(nèi)容:
為了解決上述技術(shù)問題,本發(fā)明提供了一種音視頻音量自動調(diào)節(jié)的系統(tǒng),包括:解封裝裝置,用于將數(shù)個音視頻文件解析為相應(yīng)的音頻幀序列和視頻幀序列;音頻數(shù)據(jù)解碼裝置,用于將所述音頻幀序列還原為PCM格式的音頻數(shù)據(jù);音量計算裝置,用于計算所述PCM格式的音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù);音量調(diào)節(jié)裝置,用所述音量調(diào)節(jié)系數(shù)對所述PCM格式的音頻數(shù)據(jù)進行倍增處理,獲得音量調(diào)節(jié)后的PCM格式的音頻數(shù)據(jù);編碼裝置,通過對所述PCM格式的音頻數(shù)據(jù)進行編碼,獲得經(jīng)重新編碼后的音頻幀序列;封裝裝置,用于對所述視頻幀序列和所述經(jīng)重新編碼后的音頻幀序列進行封裝。
優(yōu)選地,所述音量計算裝置以一定字節(jié)長度為單位計算每一個音視頻文件的PCM格式的音頻數(shù)據(jù)中的每一幀的音量平均值,然后計算每一個音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將所述PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值作為所述音量系數(shù)。優(yōu)選地,所述音量計算裝置針對所述數(shù)個音視頻文件中的一個被指定作為計算基準音量系數(shù)的音視頻文件計算出被指定的音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將其作為基準音量系數(shù),同時計算出當前所要處理的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值并將其作為當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),然后將所述基準音量系數(shù)除以當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),獲得所述音量調(diào)節(jié)系數(shù)。優(yōu)選地,所述音量計算裝置針對所述數(shù)個音視頻文件計算出所述數(shù)個音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將其作為基準音量系數(shù),同時計算出當前所要處理的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值并將其作為當前所要處理的PCM格式的音頻數(shù)據(jù) 的音量系數(shù),然后將所述基準音量系數(shù)除以當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),獲得所述音量調(diào)節(jié)系數(shù)。
優(yōu)選地,所述音量平均值的計算方法如下:P=(Vi+V2+......+Vn)/n,其中,P為每一幀
的音量平均值,V為每一個單位的音量值,η為每一幀的單位數(shù)。優(yōu)選地,所有幀的音量平均值的計算方法如下AKPJPJ......+Pf)/f,其中,A為所
有幀的音量平均值,P為每一幀的音量平均值,f為PCM格式的音頻數(shù)據(jù)中的幀數(shù)。優(yōu)選地,所述一定字節(jié)長度為2個字節(jié)。優(yōu)選地,所述音量調(diào)節(jié)裝置,對所述PCM格式的音頻數(shù)據(jù)中的每一幀用所述音量調(diào)節(jié)系數(shù)進行倍增。本發(fā)明還提供一種音視頻音量自動調(diào)節(jié)的方法,包括:解封裝步驟,將數(shù)個音視頻文件解析為相應(yīng)的音頻幀序列和視頻幀序列;音頻數(shù)據(jù)解碼步驟,將所述音頻幀序列還原為PCM格式的音頻數(shù)據(jù);音量計算步驟,計算所述PCM格式的音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù);音量調(diào)節(jié)步驟,用所述音量調(diào)節(jié)系數(shù)對所述PCM格式的音頻數(shù)據(jù)進行倍增處理,獲得音量調(diào)節(jié)后的PCM格式的音頻數(shù)據(jù);編碼步驟,通過對所述PCM格式的音頻數(shù)據(jù)進行編碼,獲得經(jīng)重新編碼后的音頻幀序列;封裝步驟,對所述視頻幀序列和所述經(jīng)重新編碼后的音頻幀序列進行封裝。
優(yōu)選地,在所述音量計算步驟中,以一定字節(jié)長度為單位計算每一個音視頻文件的PCM格式的音頻數(shù)據(jù)中的每一幀的音量平均值,然后計算每一個音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將所述PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值作為所述音量系數(shù)。優(yōu)選地,在所述音量計算步驟中,當所述數(shù)個音視頻文件中的一個被指定作為計算基準音量系數(shù)的音視頻文件時,計算出被指定的音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將其作為基準音量系數(shù),同時計算出當前所要處理的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值并將其作為當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),然后將所述基準音量系數(shù)除以當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),獲得所述音量調(diào)節(jié)系數(shù)。優(yōu)選地,在所述音量計算步驟中,當所有的所述數(shù)個音視頻文件被指定作為計算基準音量系數(shù)的音視頻文件時,計算出所述數(shù)個音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將其作為基準音量系數(shù),同時計算出當前所要處理的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值并將其作為當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),然后將所述基準音量系數(shù)除以當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),獲得所述音量調(diào)節(jié)系數(shù)。優(yōu)選地,在所述音量調(diào)節(jié)步驟中,對所述PCM格式的音頻數(shù)據(jù)中的每一幀用所述音量調(diào)節(jié)系數(shù)進行倍增。本發(fā)明的上述技術(shù)方案能夠從解決現(xiàn)有技術(shù)中用戶在播放視頻文件時所遇到聲音忽高忽低的問題。同時,本發(fā)明的技術(shù)方案簡化了對視頻音量進行調(diào)節(jié)的操作,并能大批量地進行這種視頻音量調(diào)節(jié)處理,從而能夠提高了對視頻音量調(diào)節(jié)處理的效率和降低了相應(yīng)的處理成本。
: 圖1為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的結(jié)構(gòu)框 圖2為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的解封裝模塊的結(jié)構(gòu)框圖;圖3為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的解碼模塊的結(jié)構(gòu)框 圖4為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的音頻音量計算模塊的結(jié)構(gòu)框 圖5為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的音量系數(shù)計算單元的示意
圖6為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的基準音量系數(shù)計算單元的示意 圖7為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的音量調(diào)節(jié)系數(shù)計算單元的示意 圖8為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)的流程 圖9為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)步驟S12的流程 圖10為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)步驟S13的流程 圖11為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)步驟S14的流程 圖12為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)步驟S16的流程 圖13為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)步驟S17的流程圖。
具體實施方式
:
下面根據(jù)附圖所示實施方式·闡述本項發(fā)明。本發(fā)明實施方式所涉及的多媒體處理裝置可以根據(jù)用戶的要求將不同音量的多個音視頻文件進行合并,形成一個具有一致音量的音視頻文件。圖1顯示了本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的結(jié)構(gòu)框圖。如圖1所示,上述多媒體處理裝置包括音視頻數(shù)據(jù)接收模塊1、解封裝模塊2、音頻數(shù)據(jù)解碼模塊
3、音頻音量計算模塊4、音頻音量調(diào)節(jié)模塊5、編碼模塊6、封裝模塊7、存儲模塊8和數(shù)據(jù)總線9。其中,音視頻數(shù)據(jù)接收模塊1、解封裝模塊2、音頻數(shù)據(jù)解碼模塊3、音頻音量計算模塊
4、音頻音量調(diào)節(jié)模塊5、編碼模塊6、封裝模塊7和存儲模塊8通過數(shù)據(jù)總線9進行連接。上述音視頻數(shù)據(jù)接收模塊I用于接收需要進行合并的具有不同音量的音視頻數(shù)據(jù)(例如音視頻文件1、音視頻文件2和音視頻文件3),并將所接收的上述音視頻數(shù)據(jù)輸送至上述解封裝模塊2進行相應(yīng)的解封裝。上述解封裝模塊2將上述音視頻數(shù)據(jù)接收模塊I接收到的上述音視頻數(shù)據(jù)進行解封裝,在上述解封裝過程中,上述解封裝模塊2將音視頻文件解封裝為視頻幀序列和音頻幀序列,并將上述視頻幀序列和音頻幀序列存儲到上述存儲模塊8中。然后,上述音頻數(shù)據(jù)解碼模塊3將上述解封裝模塊2得到的上述音頻幀序列進行解碼。在上述解碼過程中,上述音頻數(shù)據(jù)解碼模塊3將上述音頻幀序列還原為PCM格式的音頻數(shù)據(jù)并將其存儲到上述存儲模塊8中。上述音頻音量計算模塊4分別計算得出上述解碼模塊3得到的各個上述PCM格式的音頻數(shù)據(jù)的音量系數(shù)并將其存儲到上述存儲模塊8中。當音頻音量計算模塊4計算出所有的上述PCM格式的音頻數(shù)據(jù)的音量系數(shù)后,再根據(jù)用戶的設(shè)定,計算出基準音量系數(shù)并將其存儲到上述存儲模塊8中。然后,音頻音量計算模塊4基于上述PCM格式的音頻數(shù)據(jù)的音量系數(shù)和基準音量系數(shù)分別計算得出所有的所述PCM格式的音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù)并將其存儲到上述存儲模塊8中。上述音頻音量調(diào)節(jié)模塊5對上述PCM格式的音頻數(shù)據(jù)進行倍增處理,上述倍增處理的倍增系數(shù)為上述音頻計算模塊4計算得出的上述PCM格式的音頻數(shù)據(jù)所對應(yīng)的音量調(diào)節(jié)系數(shù)。上述編碼模塊6對上述音頻音量調(diào)節(jié)模塊5倍增處理后的所述PCM格式的音頻數(shù)據(jù)進行編碼,得到和原始編碼一樣的音頻幀序列并將其存儲到上述存儲模塊8中。上述封裝模塊7重新調(diào)整上述解封裝模塊2得到的上述視頻幀序列和上述編碼模塊6得到的上述音頻幀序列的時間戳,然后分別對調(diào)整完時間戳的視頻幀序列和音頻幀序列進行合并,最后將上述合并后的視頻幀序列和音頻幀序列進行封裝,輸出新的視頻文件。圖2為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的解封裝模塊2的結(jié)構(gòu)框圖。如圖2所示,上述解封裝模塊2包括音視頻文件格式判斷單元21、解封裝選擇單元22和數(shù)個解封裝單元23、24、25……。其中,上述數(shù)個解封裝單元23、24、25……具有不同的格式,可以對應(yīng)于不同的文件格式進行解封裝。上述音視頻文件格式判斷單元21可以判斷來自上述音視頻數(shù)據(jù)接收模塊I所接收的音視頻的文件格式,上述解封裝選擇單元22可以根據(jù)上述音視頻文件格式判斷單元21的判斷結(jié)果(即音視頻文件的格式)從解封裝單元23、24,25……中選擇相應(yīng)的解封裝單元對上述音視頻文件進行解封裝,上述相應(yīng)的解封裝單
元(即上述解封裝單元23、24、25......中之一)將所接收到的上述音視頻文件解封為相應(yīng)的
視頻幀序列和音頻幀序列,將它們存儲到上述存儲模塊8中。圖3為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的音頻數(shù)據(jù)解碼模塊3的結(jié)構(gòu)框圖。如圖3所示,上述音頻數(shù)據(jù)解碼模塊3包括編碼格式判斷單元31、解碼器選擇單元32和數(shù)個的解碼器33、34、35……。其中,上述數(shù)個的解碼器33、34、35……具有不同的解碼格式,可以對應(yīng)于不同的解碼要求進行解碼。上述編碼格式判斷單元31可以從上述存儲模塊8中獲取上述音頻幀序列并判斷上述音頻幀序列的編碼格式。上述解碼器選擇單元32可以根據(jù)上述編碼格式判斷單元31的判斷結(jié)果(即上述音頻幀序列的編碼格式)從解碼器33、34、35……中選擇相應(yīng)的解碼器 ,上述相應(yīng)的解碼器對所收到的上述音頻幀序列進行解碼,將上述音頻幀序列中的音頻幀還原為PCM格式的音頻數(shù)據(jù),并將上述PCM格式的音頻數(shù)據(jù)存儲在上述存儲模塊8中。圖4為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的音頻音量計算模塊4的結(jié)構(gòu)框圖。如圖4所示,上述音頻音量計算模塊4包括指令接收單元41、音量系數(shù)計算單元42、基準音量系數(shù)計算單元43和音量調(diào)節(jié)系數(shù)計算單元44。上述指令接收單元41可以接收用戶的設(shè)定指令,并把指令存儲到上述存儲模塊8中,上述用戶指令可以指定某一音視頻文件的音量系數(shù)為基準音量系數(shù),也可以指定所有音視頻文件的音量系數(shù)的平均值為基準音量系數(shù)。上述音量系數(shù)計算單元42接收到上述音頻數(shù)據(jù)解碼模塊3得到的上述PCM格式的音頻數(shù)據(jù),通過計算得到上述PCM格式的音頻數(shù)據(jù)的音量系數(shù),并把上述音量系數(shù)存儲到上述存儲模塊8中。上述基準音量系數(shù)計算單元43首先從上述存儲模塊8中取出上述用戶指令,通過判斷再從上述存儲模塊8中取出需要的音量系數(shù),最后計算得出基準音量系數(shù)并把上述基準音量系數(shù)存儲到上述存儲模塊8中。上述音量調(diào)節(jié)系數(shù)計算單元44從上述存儲模塊8中取出上述基準音量系數(shù)和每個上述PCM格式音頻數(shù)據(jù)的音量系數(shù),通過計算得出每個PCM格式的音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù),并把上述每個PCM格式的音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù)存儲到上述存儲模塊8中。上述音頻音量調(diào)節(jié)模塊5接收到上述PCM格式的音頻數(shù)據(jù)后,先從上述存儲模塊8中讀取相應(yīng)的上述PCM格式音頻數(shù)據(jù)的音頻調(diào)節(jié)系數(shù),再對上述PCM格式音頻數(shù)據(jù)進行倍增處理,得到處理后的PCM格式的音頻數(shù)據(jù)。
圖5為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的音量系數(shù)計算單元42的示意圖。如圖5所示,上述音量系數(shù)計算單元42首先對每一個音視頻文件的上述PCM格式的音頻數(shù)據(jù)中的每一幀以2字節(jié)長度為一個單位求音量平均值,計算公式如下:
(P= (VV……+Vn)/n(I)
(其中,P為幀平均值、V為每一個單位的值、η為每一幀的單位數(shù)即每一幀的字節(jié)數(shù)除以2)。然后,上述音量系數(shù)計算單元42再對每一個音視頻文件的上述PCM格式幀序列(及全部的幀)求音量平均值,計算公式如下:
A= (P^P2+......+Pf) /f(2)
(其中,A為音量系 數(shù),P為幀平均值,f為PCM幀序列的幀數(shù))。最后,上述音量系數(shù)計算單元42得出所述音量系數(shù),并把上述音量系數(shù)存儲到上述存儲模塊8中。圖6為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的基準音量系數(shù)計算單元43的示意圖。如圖6所示,上述基準音量系數(shù)計算單元43首先從上述存儲模塊8中獲取用戶指令,再根據(jù)上述用戶指令判斷選擇哪種方式計算上述基準音量系數(shù)。如果用戶指定某一音視頻文件的音量系數(shù)為基準音量系數(shù)時,用如下計算公式進行計算:
T=A (3)
(其中,T為基準音量系數(shù),A為用戶指定音視頻的音量系數(shù))。S卩,上述基準音量系數(shù)計算單元43讀取上述指定的某一音視頻文件的PCM格式的音頻數(shù)據(jù)的音量系數(shù),并將該音量系數(shù)作為基準音量系數(shù),并將基準音量系數(shù)存儲到上述存儲模塊8中。如果用戶指定所有音視頻文件的音量系數(shù)的平均值為基準音量系數(shù)時,用如下計算公式進行計算:
T= (A^A2+……Am)/m(4)
(其中,T為基準音量系數(shù),A為每個音視頻的音量系數(shù),m為PCM格式音頻數(shù)據(jù)的個數(shù))。其中,上述基準音量系數(shù)計算單元43讀取全部音視頻文件的PCM格式的音頻數(shù)據(jù)的音量系數(shù),并根據(jù)上述公式(4)計算出基準音量系數(shù),把基準音量系數(shù)存儲到上述存儲模塊8中。圖7為本發(fā)明實施方式涉及的音視頻音量自動調(diào)節(jié)系統(tǒng)的音量調(diào)節(jié)系數(shù)計算單元44的示意圖。如圖7所示,上述音量調(diào)整系數(shù)計算單元44先從上述存儲模塊8中讀取上述基準音量系數(shù)和上述PCM格式的音頻數(shù)據(jù)的音量系數(shù),再計算出PCM格式音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù),上述音量調(diào)節(jié)系數(shù)用以下計算方式(公式5)進行計算,并把上述的音量調(diào)節(jié)系數(shù)保存到上述存儲模塊8中。ε =T/A (5)
(其中,ε為音量調(diào)節(jié)系數(shù),T為基準音量系數(shù),A為所處理所述PCM格式的音頻數(shù)據(jù)的所述音量系數(shù))。圖8為本發(fā)明實施方式涉及的視頻音量定制調(diào)節(jié)系統(tǒng)的編碼模塊6的結(jié)構(gòu)框圖。如圖8所示,上述編碼模塊6包括編碼器選擇單元61、數(shù)個編碼器62、63、64……。上述編碼器選擇單元61可以從上述存儲模塊8中獲取經(jīng)上述音頻音量調(diào)節(jié)模塊5進行音量調(diào)節(jié)后的新的PCM格式的音頻數(shù)據(jù)。上述編碼器選擇單元61可以根據(jù)原音頻幀序列的編碼格式參數(shù)或用戶指定的編碼格式選擇相應(yīng)的編碼器(即上述編碼器62、63、64……中之一)對上述經(jīng)音量調(diào)節(jié)后的PCM格式的音頻數(shù)據(jù)進行重新編碼,形成新的音頻幀序列,并將新的音頻幀序列存儲在上述存儲模塊8中。圖9為本發(fā)明實施方式涉及的視頻音量定制調(diào)節(jié)系統(tǒng)的封裝模塊7的結(jié)構(gòu)框圖。如圖9所示,上述封裝模塊7包括封裝格式選擇單元71和數(shù)個封裝單元72、73、74……。其中,上述數(shù)個封裝單元72、73、74……具有不同的封裝格式,可以對應(yīng)于不同的封裝格式的要求進行封裝。上述封裝格式選擇單元71可以根據(jù)原音視頻文件封裝格式的相關(guān)參數(shù)或用戶指定的文件封裝格式選擇相應(yīng)的封裝單元(即封裝單元72、73、74……中之一)。上述封裝單元通過調(diào)整各視頻幀序列和音頻幀序列的時間戳,對上述視頻幀序列和新的音頻幀序列進行封裝,獲得調(diào)節(jié)后的音視頻文件。圖10為本發(fā)明實·施方式涉及的音視頻音量自動調(diào)節(jié)的流程圖。下面,參照圖10說明在本實施方式涉及的視頻音量自動調(diào)節(jié)的處理過程。首先,輸入音視頻文件,上述音視頻數(shù)據(jù)接收模塊I接收上述音視頻文件數(shù)據(jù)并將其輸送至上述解封裝模塊2 (步驟S11)。上述解封裝模塊2對上述音視頻文件數(shù)據(jù)進行解封裝,將上述音視頻文件數(shù)據(jù)解析為視頻幀序列和音頻幀序列,并將上述視頻幀序列和音頻幀序列存儲在上述存儲模塊8中(步驟S12)。上述音頻數(shù)據(jù)解碼模塊3從上述存儲模塊8中獲取上述音頻幀序列,將上述音頻幀序列中的音頻幀還原為PCM格式的音頻數(shù)據(jù),并將上述PCM格式的音頻數(shù)據(jù)存儲到上述存儲模塊8中(步驟S13)。上述音頻音量計算模塊4分別計算得出步驟S13中得到的各個PCM格式的音頻數(shù)據(jù)的音量系數(shù),當上述音頻音量計算模塊4計算出所有的PCM格式的音頻數(shù)據(jù)的音量系數(shù)后,再根據(jù)用戶的設(shè)定計算出基準音量系數(shù),最后分別計算得出所有的PCM格式的音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù),并將上述音量調(diào)節(jié)系數(shù)存儲至上述存儲模塊8中(步驟S14)。上述音頻音量調(diào)節(jié)模塊5基于上述音頻音量計算模塊4所獲得的上述音量調(diào)節(jié)系數(shù)對上述PCM格式的音頻數(shù)據(jù)進行倍增處理,將上述經(jīng)倍增處理后的PCM格式的音頻數(shù)據(jù)存儲至上述存儲模塊8中(步驟S15),其中上述倍增處理的倍增系數(shù)為步驟S14中計算得出的上述PCM格式的音頻數(shù)據(jù)所對應(yīng)的音量調(diào)節(jié)系數(shù)。上述編碼模塊6從上述存儲模塊8中獲取經(jīng)音量調(diào)節(jié)后的PCM格式的音頻數(shù)據(jù),并根據(jù)原音頻幀序列的編碼格式或用戶指定的編碼格式對經(jīng)音量調(diào)節(jié)后的PCM格式的音頻數(shù)據(jù)進行編碼,形成新的音頻幀序列并存儲到上述存儲模塊8中(步驟S16)。上述封裝|旲塊7從上述存儲|旲塊8中獲取視頻巾貞序列和新的首頻巾貞序列,調(diào)節(jié)各視頻幀序列和新的音頻幀序列的時間戳,然后分別對調(diào)整完時間戳的各視頻幀序列和新的音頻幀序列進行合并,最后根據(jù)原音視頻文件的封裝格式或用戶指定的封裝格式進行封裝,形成新的音視頻文件(步驟S17)。圖11為本發(fā)明實施方式涉及的視頻音量自動調(diào)節(jié)的步驟S12的流程圖。下面,參照圖11說明在本實施方式涉及的音視頻文件進行解封裝處理過程。音頻文件格式判斷單元21基于所接收的音視頻文件數(shù)據(jù)判斷所接收的音視頻文件的封裝格式,將判斷結(jié)果輸送到解封裝選擇單元22 (步驟S121)。上述解封裝選擇單元22基于上述判斷結(jié)果選擇相應(yīng)的解封裝單元(步驟S122)。上述解封裝單元(即解封裝單元23、24、25……中之一)對上述音視頻文件數(shù)據(jù)進行解封裝,將上述音視頻文件數(shù)據(jù)解析為視頻幀序列和音頻幀序列(步驟S123),并將視頻幀序列和音頻幀序列存儲到上述存儲模塊8中(步驟S124)。圖12為本發(fā)明實施方式涉及的視頻音量自動調(diào)節(jié)的步驟S13的流程圖。下面,參照圖12說明在本實施方式涉及的對音頻數(shù)據(jù)進行解碼處理過程。編碼格式判斷單元31對解封裝后的音頻幀序列的編碼格式(例如MP3、AAC、AC_3等)進行判斷,并將判斷結(jié)果輸送到解碼器選擇單元32 (步驟S131)。上述解碼器選擇單元32基于上述判斷結(jié)果選擇與上述編碼格式相應(yīng)的解碼器進行解碼(步驟S132),上述解碼器(即解碼器33、34、35……中之一)將上述音頻幀序列中的音頻幀還原為PCM格式的音頻數(shù)據(jù)(步驟S133),并將上述PCM格式的音頻數(shù)據(jù)存儲至存儲模塊8中(步驟S134)。圖13為本發(fā)明實施方式涉及的視頻音量自動調(diào)節(jié)的步驟S14的流程圖。下面,參照圖13說明在本實施方式涉及的對音頻音量系數(shù)進行計算的處理過程。上述音量系數(shù)計算單元42首先對上述PCM格式的音頻數(shù)據(jù)中的每一幀以2字節(jié)長度為單位并基于上述公式(I)求出PCM格式的音頻數(shù)據(jù)幀中的音量平均值P(步驟S141 ),然后根據(jù)上述公式(2)求出當前PCM幀序列中所有PCM格式的音頻數(shù)據(jù)幀的音量平均值A(chǔ)(即音量系數(shù)),并將其存儲至存儲模塊8中(步驟S142)。上述基準音量系數(shù)計算單元43判斷用戶是否輸入指令(步驟S143)。如果未收到用戶輸入的指令(步驟S143:否),等待用戶輸入指令。如果收到用戶輸入的指令(步驟S143:是),判斷用戶是否指定某一音視頻文件的音量系數(shù)為基準音量系數(shù)(步驟S144)。如果用戶指定某一音視頻文件的音量系數(shù)為基準音量系數(shù)(步驟S144:是),上述基準音量系數(shù)計算單元43讀取上述指定的音視頻文件的音量系數(shù)A,并基于上述公式 (3)計算得出基準音量系數(shù)(步驟S145)。如果用戶指定所有的音視頻文件的音量系數(shù)的平均值為基準音量系數(shù)T (步驟S144:否),上述基準音量系數(shù)計算單元43讀取所有PCM格式的音頻數(shù)據(jù)的音量系數(shù)A,并基于上述公式(4)計算得出基準音量系數(shù)T (步驟S146)。將上述獲得的基準音量系數(shù)T存儲至存儲模塊8中(步驟S147)。上述音量調(diào)整系數(shù)計算單元44從存儲模塊8中獲取上述基準音量系數(shù)T和當前PCM格式的音頻數(shù)據(jù)的音量系數(shù)A,并基于上述公式(5)計算出當前PCM格式的音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù)ε,并將其存儲至存儲模塊8中(步驟S148)。上述音頻音量調(diào)節(jié)模塊5從存儲模塊8中獲取上述音量調(diào)節(jié)系數(shù)ε,對當前PCM格式的音頻數(shù)據(jù)的音量進行調(diào)節(jié),即對當前PCM格式的音頻數(shù)據(jù)的音量進行培增處理(步驟 S15)。圖14為本發(fā)明實施方式涉及的對調(diào)節(jié)音量后的PCM格式數(shù)據(jù)進行編碼的步驟S16的流程圖。下面,參照圖14說明在本實施方式涉及的對PCM格式數(shù)據(jù)進行編碼處理過程。編碼器選擇單元61從上述存儲模塊8中獲取上述經(jīng)調(diào)節(jié)音量后的PCM格式數(shù)據(jù)(步驟S161)。編碼器選擇單元41基于原音頻幀序列的編碼格式或用戶指定的編碼格式選擇相應(yīng)的編碼器(步驟S162 )。上述被選定的編碼器對上述經(jīng)調(diào)節(jié)音量后的PCM格式數(shù)據(jù)進行編碼,以獲得新的音頻幀序列(步驟S163),并將所獲得的新的音頻幀序列存儲在存儲模塊8中(步驟S164)。
圖15為本發(fā)明實施方式涉及的對視頻幀序列和新的音頻幀序列進行封裝的步驟S17的流程圖。下面,參照圖15說明在本實施方式涉及的對視頻幀序列和新的音頻幀序列進行封裝處理過程。上述封裝格式選擇單元71從上述存儲模塊8中獲取視頻幀序列和新的音頻幀序列(步驟S171)。上述封裝格式選擇單元71基于原音視頻文件的封裝格式或用戶指定的封裝格式選擇相應(yīng)的封裝單元(步驟S172),上述封裝單元在對上述視頻幀序列和上述新的音頻幀序列進行時間戳的調(diào)整后將上述視頻幀序列和上述新的音頻幀序列重新封裝,形成新的音視頻文件(步驟S173),并輸出新的音視頻文件(步驟S174)。應(yīng)理解以上說明書中所描述的具體實施方式
和實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。在閱讀了本發(fā)明之后,本領(lǐng)域技術(shù)人員對本發(fā)明的各種等同形式的修改均落于本申請所附 權(quán)利要求所限定的范圍。
權(quán)利要求
1.一種音視頻音量自動調(diào)節(jié)的系統(tǒng),包括: 解封裝裝置,用于將數(shù)個音視頻文件解析為相應(yīng)的音頻幀序列和視頻幀序列; 音頻數(shù)據(jù)解碼裝置,用于將所述音頻幀序列還原為PCM格式的音頻數(shù)據(jù); 音量計算裝置,用于所述PCM格式的音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù); 音量調(diào)節(jié)裝置,用所述音量調(diào)節(jié)系數(shù)對所述PCM格式的音頻數(shù)據(jù)進行倍增處理,獲得音量調(diào)節(jié)后的PCM格式的音頻數(shù)據(jù); 編碼裝置,通過對所述PCM格式的音頻數(shù)據(jù)進行編碼,獲得經(jīng)重新編碼后的音頻幀序列; 封裝裝置,用于對所述視頻幀序列和所述經(jīng)重新編碼后的音頻幀序列進行封裝。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于:所述音量計算裝置以一定字節(jié)長度為單位計算每一個音視頻文件的PCM格式的音頻數(shù)據(jù)中的每一幀的音量平均值,然后計算每一個音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將所述PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值作為音量系數(shù)。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于:所述音量計算裝置針對所述數(shù)個音視頻文件中的一個被指定作為計算基準音量系數(shù)的音視頻文件計算出被指定的音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將其作為基準音量系數(shù),同時計算出當前所要處理的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值并將其作為當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),然后將所述基準音量系數(shù)除以當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),獲得所述 音量調(diào)節(jié)系數(shù)。
4.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于:所述音量計算裝置針對所述數(shù)個音視頻文件計算出所述數(shù)個音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將其作為基準音量系數(shù),同時計算出當前所要處理的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值并將其作為當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),然后將所述基準音量系數(shù)除以當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),獲得所述音量調(diào)節(jié)系數(shù)。
5.根據(jù)權(quán)利要求2 4中任意一項所述的系統(tǒng),其特征在于: 所述音量平均值的計算方法如下: P= (VV……+Vn)/n, 其中,P為每一幀的音量平均值,V為每一個單位的音量值,η為每一幀的單位數(shù); 所有幀的音量平均值的計算方法如下:Α=(Ρ!+Ρ2+……+Pf)/f, 其中,A為所有幀的音量平均值,P為每一幀的音量平均值,f為PCM格式的音頻數(shù)據(jù)中的幀數(shù)。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于:所述一定字節(jié)長度為2個字節(jié)。
7.根據(jù)權(quán)利要求1 4中任意一項所述的系統(tǒng),其特征在于: 所述音量調(diào)節(jié)裝置,對所述PCM格式的音頻數(shù)據(jù)中的每一幀用所述音量調(diào)節(jié)系數(shù)進行倍增。
8.一種音視頻音量自動調(diào)節(jié)的方法,包括: 解封裝步驟,將數(shù)個音視頻文件解析為相應(yīng)的音頻幀序列和視頻幀序列; 音頻數(shù)據(jù)解碼步驟,將所述音頻幀序列還原為PCM格式的音頻數(shù)據(jù);音量計算步驟,計算所述PCM格式的音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù); 音量調(diào)節(jié)步驟,用所述音量調(diào)節(jié)系數(shù)對所述PCM格式的音頻數(shù)據(jù)進行倍增處理,獲得音量調(diào)節(jié)后的PCM格式的音頻數(shù)據(jù); 編碼步驟,通過對所述PCM格式的音頻數(shù)據(jù)進行編碼,獲得經(jīng)重新編碼后的音頻幀序列; 封裝步驟,對所述視頻幀序列和所述經(jīng)重新編碼后的音頻幀序列進行封裝。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于:在所述音量計算步驟中,以一定字節(jié)長度為單位計算每一個音視頻文件的PCM格式的音頻數(shù)據(jù)中的每一幀的音量平均值,然后計算每一個音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將所述PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值作為所述音量系數(shù)。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于:在所述音量計算步驟中,當所述數(shù)個音視頻文件中的一個被指定作為計算基準音量系數(shù)的音視頻文件時,計算出被指定的音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將其作為基準音量系數(shù),同時計算出當前所要處理的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值并將其作為當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),然后將所述基準音量系數(shù)除以當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),獲得所述音量調(diào)節(jié)系數(shù)。
11.根據(jù)權(quán)利要求9所述的方法,其特征在于:在所述音量計算步驟中,當所有的所述數(shù)個音視頻文件被指定作為計算基準音量系數(shù)的音視頻文件時,計算出所述數(shù)個音視頻文件的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值,將其作為基準音量系數(shù),同時計算出當前所要處理的PCM格式的音頻數(shù)據(jù)中的所有幀的音量平均值并將其作為當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù),然后將所述基準音量系數(shù)除以當前所要處理的PCM格式的音頻數(shù)據(jù)的音量系數(shù), 獲得所述音量調(diào)節(jié)系數(shù)。
12.根據(jù)權(quán)利要求9 11中任意一項所述的方法,其特征在于: 所述音量平均值的計算方法如下:P= (V^V2+……+Vn)/n, 其中,P為每一幀的音量平均值,V為每一個單位的音量值,η為每一幀的單位數(shù); 所有幀的音量平均值的計算方法如下:Α=(Ρ!+Ρ2+……+Pf)/f, 其中,A為所有幀的音量平均值,P為每一幀的音量平均值,f為PCM格式的音頻數(shù)據(jù)中的幀數(shù)。
13.根據(jù)權(quán)利要求12所述的方法,其特征在于:所述一定字節(jié)長度為2個字節(jié)。
14.根據(jù)權(quán)利要求8 11中任意一項所述的方法,其特征在于: 在所述音量調(diào)節(jié)步驟中,對所述PCM格式的音頻數(shù)據(jù)中的每一幀用所述音量調(diào)節(jié)系數(shù)進行倍增。
全文摘要
本發(fā)明提供了一種音視頻音量自動調(diào)節(jié)的系統(tǒng),包括解封裝裝置,用于將數(shù)個音視頻文件解析為相應(yīng)的音頻幀序列和視頻幀序列;音頻數(shù)據(jù)解碼裝置,用于將所述音頻幀序列還原為PCM格式的音頻數(shù)據(jù);音量計算裝置,用于計算所述PCM格式的音頻數(shù)據(jù)的音量系數(shù)和所述PCM格式的音頻數(shù)據(jù)的音量調(diào)節(jié)系數(shù);音量調(diào)節(jié)裝置,用所述音量調(diào)節(jié)系數(shù)對所述PCM格式的音頻數(shù)據(jù)進行倍增處理,獲得音量調(diào)節(jié)后的PCM格式的音頻數(shù)據(jù);編碼裝置,通過對所述PCM格式的音頻數(shù)據(jù)進行編碼,獲得經(jīng)重新編碼后的音頻幀序列;封裝裝置,用于對所述視頻幀序列和所述經(jīng)重新編碼后的音頻幀序列進行封裝。本發(fā)明還提供一種音視頻音量自動調(diào)節(jié)的方法。
文檔編號H04N5/60GK103237258SQ201310118940
公開日2013年8月7日 申請日期2013年4月8日 優(yōu)先權(quán)日2013年3月29日
發(fā)明者武悅 申請人:天脈聚源(北京)傳媒科技有限公司