亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種電視廣播媒體音視頻數(shù)據(jù)碎片時間的預(yù)測方法與流程

文檔序號:11733187閱讀:508來源:國知局
一種電視廣播媒體音視頻數(shù)據(jù)碎片時間的預(yù)測方法與流程
本發(fā)明涉及一種電視廣播媒體音視頻數(shù)據(jù)碎片時間的預(yù)測方法,屬于多媒體處理領(lǐng)域。
背景技術(shù)
:在電視廣播媒體的數(shù)據(jù)處理過程中,為盡可能地提高音視頻數(shù)據(jù)文件的壓縮比、方便音視頻文件的傳輸、合理地分配帶寬,理想情況下應(yīng)當(dāng)對音視頻文件中的碎片時間進(jìn)行標(biāo)記和預(yù)測。音視頻碎片是指畫面為純色且聲音為低于30分貝的底噪的片段?,F(xiàn)有技術(shù)中沒有提供一種方法能夠?qū)σ粢曨l中的碎片時間進(jìn)行預(yù)測。技術(shù)實(shí)現(xiàn)要素:為對音視頻數(shù)據(jù)中的碎片時間進(jìn)行預(yù)測,本發(fā)明提出了一種電視廣播媒體音視頻數(shù)據(jù)碎片時間的預(yù)測方法。本發(fā)明技術(shù)方案如下:一種電視廣播媒體音視頻數(shù)據(jù)碎片時間的預(yù)測方法,步驟如下:(1)將由音頻流和視頻流所組成的原始音視頻數(shù)據(jù)文件以時長2s為間隔分段成音視頻組,并按時間順序?yàn)橐粢曨l組中的音視頻片段標(biāo)定序號;(2)建立數(shù)據(jù)頭信息;(3)使用BP神經(jīng)網(wǎng)絡(luò)依次對所述音視頻組中的音視頻片段進(jìn)行空閑識別,若識別為空閑片段則將記錄該片段的序號并將序號寫入數(shù)據(jù)頭信息中;(4)將數(shù)據(jù)頭信息放入原始音視頻數(shù)據(jù)文件的起始位置;所述數(shù)據(jù)頭信息中記錄的空閑片段的集合即為該音視頻數(shù)據(jù)中的碎片時間;步驟(3)中所述BP神經(jīng)網(wǎng)絡(luò)對音視頻片段進(jìn)行空閑識別的方法步驟為:(3-1)記該音視頻片段的音頻流碼率為x1,視頻流碼率為x2;將該音視頻片段轉(zhuǎn)換為RMVB格式,然后記RMVB格式下該片段的采樣率為x3,記RMVB格式下該片段的視頻流碼率與壓縮前的視頻流碼率之比為x4;計算該音視頻片段壓縮前的音頻流平均分貝值為x5;將x1、x2、x3、x4和x5作為一組輸入數(shù)據(jù)保存;(3-2)將所述輸入數(shù)據(jù)傳送至BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行識別;該BP神經(jīng)網(wǎng)絡(luò)沿輸入至輸出方向依次設(shè)置有輸入層、預(yù)處理層、中間層和輸出層;所述輸入層包括用于輸入x1的輸入單元一、用于輸入x2的輸入單元二、用于輸入x3的輸入單元三、用于輸入x4的輸入單元四和用于輸入x5的輸入單元五;所述預(yù)處理層包括預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四;所述中間層包括中間單元一、中間單元二和中間單元三;所述輸出層包括輸出單元;所述輸入層、預(yù)處理層、中間層和輸出層分別為BP神經(jīng)網(wǎng)絡(luò)的第1層、第2層、第3層和第4層;所述輸入單元一、輸入單元二、輸入單元三、輸入單元四和輸入單元五分別為第1層的第1單元、第2單元、第3單元、第4單元和第5單元;所述預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四分別為第2層的第1單元、第2單元、第3單元和第4單元;所述中間單元一、中間單元二和中間單元三分別為第3層的第1單元、第2單元和第3單元;所述輸出單元為第4層的第1單元;設(shè)第l層第i單元的輸出值為偏置項(xiàng)為激活函數(shù)為fi(l)(),第l層的單元總數(shù)為n(l),第l層第j單元的輸出值傳遞至第l+1層第i單元時的權(quán)值為則對于第1層:對于第2至4層:設(shè)和恒為0;BP神經(jīng)網(wǎng)絡(luò)根據(jù)輸入的數(shù)據(jù)判斷出該音視頻片段是否為空閑片段,結(jié)果由輸出層輸出。進(jìn)一步地:所述預(yù)處理層各單元的激活函數(shù)為:fi(l)(x)=e2x+8sin(x)3-1e2x+1-x,x≥0e2xsin(x),x<0.]]>進(jìn)一步地:所述中間層和輸出層各單元的激活函數(shù)為:fi(l)(x)=max(0,x+0.01ex)。進(jìn)一步地:BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法為:在背景噪聲分貝值低于30分貝的環(huán)境中錄制時長1000s、畫面為純色的空閑音視頻數(shù)據(jù),并在背景噪聲分貝值為40分貝、45分貝、50分貝、60分貝和75分貝的環(huán)境中分別錄制時長2000s的非空閑音視頻數(shù)據(jù),所述非空閑音視頻數(shù)據(jù)中的每一幀畫面都包括至少4個不同顏色,所述不同顏色是指在RGB顏色標(biāo)準(zhǔn)下紅、綠、藍(lán)三個通道的值至少有一個值有所不同;將錄制的空閑音視頻數(shù)據(jù)和非空閑音視頻數(shù)據(jù)各自以時長2s為間隔分段成樣本片段,將來自空閑音視頻數(shù)據(jù)的樣本片段標(biāo)記為空閑片段,將來自非空閑音視頻數(shù)據(jù)的樣本片段標(biāo)記為非空閑片段;依次對所有樣本片段分別進(jìn)行如下處理:記樣本片段的音頻流碼率為x1,視頻流碼率為x2;將樣本片段轉(zhuǎn)換為RMVB格式,然后記RMVB格式下該片段的采樣率為x3,記RMVB格式下該片段的視頻流碼率與壓縮前的視頻流碼率之比為x4;計算該樣本片段壓縮前的音頻流平均分貝值為x5;將x1、x2、x3、x4和x5作為一組訓(xùn)練樣本輸入數(shù)據(jù)保存;使用訓(xùn)練樣本輸入數(shù)據(jù)結(jié)合各樣本片段原所對應(yīng)的空閑/非空閑標(biāo)記對BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,訓(xùn)練時保持和恒為0。相對于現(xiàn)有技術(shù),本發(fā)明具有以下優(yōu)點(diǎn):(1)本發(fā)明利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)算法根據(jù)音視頻片段的特征信息識別出是否為空閑片段,并將空閑片段的序號寫入數(shù)據(jù)頭信息中,空閑片段的集合即為該音視頻數(shù)據(jù)中的碎片時間,實(shí)現(xiàn)了碎片時間的識別和預(yù)測;(2)本方法利用神經(jīng)網(wǎng)絡(luò)對音視頻數(shù)據(jù)進(jìn)行識別,具有非線性逼近能力強(qiáng)、判斷效率高和準(zhǔn)確率高的優(yōu)點(diǎn);(3)神經(jīng)網(wǎng)絡(luò)中引入了預(yù)處理層,由于在RMVB格式的壓縮過程中能夠盡可能地壓低采樣率和碼率,并且壓縮后的采樣率和視頻流碼率之間具有一定的相關(guān)性,因此預(yù)處理層中對部分權(quán)數(shù)進(jìn)行了強(qiáng)制設(shè)定,并將RMVB格式下該片段的采樣率x3和RMVB格式下該片段的視頻流碼率與壓縮前的視頻流碼率之比x4這兩種相關(guān)性較明顯但又無法完全合并的特征信息進(jìn)行了非完全性的合并處理,然后再將預(yù)處理層的結(jié)果輸出到中間層中,保證了后續(xù)的計算過程中x3和x4始終保有一定的相關(guān)性,從而提高了判斷結(jié)果的準(zhǔn)確性,同時也提高了訓(xùn)練的效率;(4)預(yù)處理層的激活函數(shù)設(shè)定充分考慮了x3和x4兩個特征信息非完全性合并處理在計算效率、微分求解難度和相關(guān)性保留方面的要求,具有求解、訓(xùn)練效率高和判斷準(zhǔn)確性高的優(yōu)點(diǎn)。附圖說明圖1為本發(fā)明的流程示意圖。圖2為BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖。具體實(shí)施方式下面結(jié)合附圖詳細(xì)說明本發(fā)明的技術(shù)方案:如圖1,一種電視廣播媒體音視頻數(shù)據(jù)碎片時間的預(yù)測方法,步驟如下:(1)將由音頻流和視頻流所組成的原始音視頻數(shù)據(jù)文件以時長2s為間隔分段成音視頻組,并按時間順序?yàn)橐粢曨l組中的音視頻片段標(biāo)定序號;(2)建立數(shù)據(jù)頭信息;(3)使用BP神經(jīng)網(wǎng)絡(luò)依次對所述音視頻組中的音視頻片段進(jìn)行空閑識別,若識別為空閑片段則將記錄該片段的序號并將序號寫入數(shù)據(jù)頭信息中;(4)將數(shù)據(jù)頭信息放入原始音視頻數(shù)據(jù)文件的起始位置;所述數(shù)據(jù)頭信息中記錄的空閑片段的集合即為該音視頻數(shù)據(jù)中的碎片時間;步驟(3)中所述BP神經(jīng)網(wǎng)絡(luò)對音視頻片段進(jìn)行空閑識別的方法步驟為:(3-1)記該音視頻片段的音頻流碼率為x1,視頻流碼率為x2;將該音視頻片段轉(zhuǎn)換為RMVB格式,然后記RMVB格式下該片段的采樣率為x3,記RMVB格式下該片段的視頻流碼率與壓縮前的視頻流碼率之比為x4;計算該音視頻片段壓縮前的音頻流平均分貝值為x5;將x1、x2、x3、x4和x5作為一組輸入數(shù)據(jù)保存;(3-2)將所述輸入數(shù)據(jù)傳送至BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行識別;如圖2,該BP神經(jīng)網(wǎng)絡(luò)沿輸入至輸出方向依次設(shè)置有輸入層、預(yù)處理層、中間層和輸出層;所述輸入層包括用于輸入x1的輸入單元一、用于輸入x2的輸入單元二、用于輸入x3的輸入單元三、用于輸入x4的輸入單元四和用于輸入x5的輸入單元五;所述預(yù)處理層包括預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四;所述中間層包括中間單元一、中間單元二和中間單元三;所述輸出層包括輸出單元;所述輸入層、預(yù)處理層、中間層和輸出層分別為BP神經(jīng)網(wǎng)絡(luò)的第1層、第2層、第3層和第4層;所述輸入單元一、輸入單元二、輸入單元三、輸入單元四和輸入單元五分別為第1層的第1單元、第2單元、第3單元、第4單元和第5單元;所述預(yù)處理單元一、預(yù)處理單元二、預(yù)處理單元三和預(yù)處理單元四分別為第2層的第1單元、第2單元、第3單元和第4單元;所述中間單元一、中間單元二和中間單元三分別為第3層的第1單元、第2單元和第3單元;所述輸出單元為第4層的第1單元;設(shè)第l層第i單元的輸出值為偏置項(xiàng)為激活函數(shù)為fi(l)(),第l層的單元總數(shù)為n(l),第l層第j單元的輸出值傳遞至第l+1層第i單元時的權(quán)值為則對于第1層:對于第2至4層:設(shè)和恒為0;BP神經(jīng)網(wǎng)絡(luò)根據(jù)輸入的數(shù)據(jù)判斷出該音視頻片段是否為空閑片段,結(jié)果由輸出層輸出。所述預(yù)處理層各單元的激活函數(shù)為:fi(l)(x)=e2x+8sin(x)3-1e2x+1-x,x≥0e2xsin(x),x<0;]]>該激活函數(shù)的設(shè)定充分考慮了x3和x4兩個特征信息非完全性合并處理后在計算效率、微分求解難度和相關(guān)性保留方面的要求,具有求解、訓(xùn)練效率高和判斷準(zhǔn)確性高的優(yōu)點(diǎn);所述中間層和輸出層各單元的激活函數(shù)為:fi(l)(x)=max(0,x+0.01ex)。該BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法為:在背景噪聲分貝值低于30分貝的環(huán)境中錄制時長1000s、畫面為純色的空閑音視頻數(shù)據(jù),并在背景噪聲分貝值為40分貝、45分貝、50分貝、60分貝和75分貝的環(huán)境中分別錄制時長2000s的非空閑音視頻數(shù)據(jù),所述非空閑音視頻數(shù)據(jù)中的每一幀畫面都包括至少4個不同顏色,所述不同顏色是指在RGB顏色標(biāo)準(zhǔn)下紅、綠、藍(lán)三個通道的值至少有一個值有所不同;將錄制的空閑音視頻數(shù)據(jù)和非空閑音視頻數(shù)據(jù)各自以時長2s為間隔分段成樣本片段,將來自空閑音視頻數(shù)據(jù)的樣本片段標(biāo)記為空閑片段,將來自非空閑音視頻數(shù)據(jù)的樣本片段標(biāo)記為非空閑片段;依次對所有樣本片段分別進(jìn)行如下處理:記樣本片段的音頻流碼率為x1,視頻流碼率為x2;將樣本片段轉(zhuǎn)換為RMVB格式,然后記RMVB格式下該片段的采樣率為x3,記RMVB格式下該片段的視頻流碼率與壓縮前的視頻流碼率之比為x4;計算該樣本片段壓縮前的音頻流平均分貝值為x5;將x1、x2、x3、x4和x5作為一組訓(xùn)練樣本輸入數(shù)據(jù)保存;使用訓(xùn)練樣本輸入數(shù)據(jù)結(jié)合各樣本片段原所對應(yīng)的空閑/非空閑標(biāo)記對BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,訓(xùn)練時保持和恒為0。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1