亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

視頻文件的切分方法及裝置制造方法

文檔序號:7801123閱讀:133來源:國知局
視頻文件的切分方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種視頻文件的切分方法及裝置,在上述方法中,將通過聲紋識別獲取到的音頻文件劃分為N個(gè)時(shí)間長度相同的音頻數(shù)據(jù)段,再根據(jù)各個(gè)音頻數(shù)據(jù)段的內(nèi)容相似度對相鄰的多個(gè)音頻數(shù)據(jù)段進(jìn)行合并,生成M個(gè)音頻數(shù)據(jù)單元,其中,M<N,N和M均為正整數(shù);分別獲取每個(gè)音頻數(shù)據(jù)單元對應(yīng)的視頻圖像幀所在的GoP,并對該GoP以及與該GoP前后相鄰的兩個(gè)GoP進(jìn)行碼流分析;根據(jù)碼流分析結(jié)果對與音頻文件同步播放的視頻文件進(jìn)行切分。根據(jù)本發(fā)明提供的技術(shù)方案,提高了新媒體內(nèi)容產(chǎn)生系統(tǒng)的效率和性能。
【專利說明】視頻文件的切分方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信領(lǐng)域,具體而言,涉及一種視頻文件的切分方法及裝置。
【背景技術(shù)】
[0002]圖1是根據(jù)相關(guān)技術(shù)的新聞節(jié)目大數(shù)據(jù)Map-Reduce并行處理流程的示意圖。如圖1所示,在Hadoop中的每個(gè)數(shù)據(jù)節(jié)點(diǎn)上運(yùn)行Map作業(yè),各自處理一路新聞電視節(jié)目。Map主要執(zhí)行以下兩種操作:
[0003]其一、是采用語音識別算法對電視新聞播音員的語音數(shù)據(jù)進(jìn)行處理;
[0004]其二、是進(jìn)行視頻內(nèi)容分析和視頻切分輸出新媒體數(shù)據(jù)。
[0005]其中,Map第一階段的主要目的在于對視頻段進(jìn)行語音識別分析以獲取語音關(guān)鍵詞作為標(biāo)簽,并為新媒體內(nèi)容搜索建立索引。而Map第二階段的主要目的在于產(chǎn)生當(dāng)今日益流行的三屏新媒體短視頻內(nèi)容。然后再由Reduce作業(yè)將新媒體內(nèi)容進(jìn)行分類聚合,從而適應(yīng)于新媒體聚合門戶應(yīng)用。
[0006]然而,上述技術(shù)方案存在如下缺陷:相關(guān)技術(shù)中為了并行計(jì)算而簡單切分文件會導(dǎo)致語音識別的準(zhǔn)確率下降。另外,自動(dòng)化切分新媒體內(nèi)容缺乏緊密性、準(zhǔn)確性和完整性。

【發(fā)明內(nèi)容】

[0007]本發(fā)明提供了一種視頻文件的切分方法及裝置,以至少解決相關(guān)技術(shù)中為了并行計(jì)算而簡單切分文件會導(dǎo)致語音識別的準(zhǔn)確率下降的問題。
[0008]根據(jù)本發(fā)明的一個(gè)方面,提供了一種視頻文件的切分方法。
[0009]根據(jù)本發(fā)明實(shí)施例的視頻文件的切分方法包括:將通過聲紋識別獲取到的音頻文件劃分為N個(gè)時(shí)間長度相同的音頻數(shù)據(jù)段,再根據(jù)各個(gè)音頻數(shù)據(jù)段的內(nèi)容相似度對相鄰的多個(gè)音頻數(shù)據(jù)段進(jìn)行合并,生成M個(gè)音頻數(shù)據(jù)單元,其中,M〈N,N和M均為正整數(shù);分別獲取每個(gè)音頻數(shù)據(jù)單元對應(yīng)的視頻圖像幀所在的視頻圖像組(GoP),并對該GoP以及與該GoP前后相鄰的兩個(gè)GoP進(jìn)行碼流分析;根據(jù)碼流分析結(jié)果對與音頻文件同步播放的視頻文件進(jìn)行切分。
[0010]優(yōu)選地,根據(jù)各個(gè)音頻數(shù)據(jù)段的內(nèi)容相似度對相鄰的多個(gè)音頻數(shù)據(jù)段進(jìn)行合并,生成M個(gè)音頻數(shù)據(jù)單元包括:按照預(yù)先設(shè)定的關(guān)鍵詞類別分別對每個(gè)音頻數(shù)據(jù)段中出現(xiàn)的多個(gè)關(guān)鍵詞進(jìn)行分類;對每種分類中的各個(gè)關(guān)鍵詞的出現(xiàn)頻率進(jìn)行統(tǒng)計(jì)分析并在對每個(gè)關(guān)鍵詞的出現(xiàn)頻率進(jìn)行降序排列后選取前X個(gè)關(guān)鍵詞,其中,X為正整數(shù);判斷相鄰的多個(gè)音頻數(shù)據(jù)段中各自選取的前X個(gè)關(guān)鍵詞的重復(fù)率是否超過預(yù)設(shè)閾值;如果是,則對相鄰的多個(gè)音頻數(shù)據(jù)段進(jìn)行合并。
[0011]優(yōu)選地,采用以下公式判斷相鄰的兩個(gè)音頻數(shù)據(jù)段中各自選取的前X個(gè)關(guān)鍵詞的重復(fù)率是否超過預(yù)設(shè)閾值:
【權(quán)利要求】
1.一種視頻文件的切分方法,其特征在于,包括: 將通過聲紋識別獲取到的音頻文件劃分為N個(gè)時(shí)間長度相同的音頻數(shù)據(jù)段,再根據(jù)各個(gè)音頻數(shù)據(jù)段的內(nèi)容相似度對相鄰的多個(gè)音頻數(shù)據(jù)段進(jìn)行合并,生成M個(gè)音頻數(shù)據(jù)單元,其中,M〈N,N和M均為正整數(shù); 分別獲取每個(gè)音頻數(shù)據(jù)單元對應(yīng)的視頻圖像幀所在的視頻圖像組GoP,并對該GoP以及與該GoP前后相鄰的兩個(gè)GoP進(jìn)行碼流分析; 根據(jù)碼流分析結(jié)果對與所述音頻文件同步播放的視頻文件進(jìn)行切分。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)各個(gè)音頻數(shù)據(jù)段的內(nèi)容相似度對所述相鄰的多個(gè)音頻數(shù)據(jù)段進(jìn)行合并,生成M個(gè)音頻數(shù)據(jù)單元包括: 按照預(yù)先設(shè)定的關(guān)鍵詞類別分別對每個(gè)音頻數(shù)據(jù)段中出現(xiàn)的多個(gè)關(guān)鍵詞進(jìn)行分類; 對每種分類中的各個(gè)關(guān)鍵詞的出現(xiàn)頻率進(jìn)行統(tǒng)計(jì)分析并在對每個(gè)關(guān)鍵詞的出現(xiàn)頻率進(jìn)行降序排列后選取前X個(gè)關(guān)鍵詞,其中,X為正整數(shù); 判斷所述相鄰的多個(gè)音頻數(shù)據(jù)段中各自選取的前X個(gè)關(guān)鍵詞的重復(fù)率是否超過預(yù)設(shè)閾值;如果是,則對所述相鄰的多個(gè)音頻數(shù)據(jù)段進(jìn)行合并。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,采用以下公式判斷所述相鄰的兩個(gè)音頻數(shù)據(jù)段中各自選取的前X個(gè)關(guān)鍵詞的重復(fù)率是否超過所述預(yù)設(shè)閾值:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)碼流分析結(jié)果對與所述音頻文件同步播放的視頻文件進(jìn)行切分包括: 在對所述GoP以及與所述GoP前后相鄰的兩個(gè)GoP進(jìn)行碼流分析后,獲取每個(gè)GoP內(nèi)各個(gè)視頻幀的宏塊序號、DC分量數(shù)值、運(yùn)動(dòng)矢量殘差值和幀內(nèi)編碼宏塊數(shù)量; 根據(jù)所述宏塊序號和所述DC分量數(shù)值檢測每個(gè)GoP中的關(guān)鍵幀; 采用所述運(yùn)動(dòng)矢量殘差值進(jìn)行運(yùn)動(dòng)復(fù)雜度分析; 根據(jù)相鄰視頻幀各自的幀內(nèi)編碼宏塊數(shù)量統(tǒng)計(jì)所述相鄰視頻幀的幀內(nèi)編碼宏塊數(shù)量的變化幅度; 根據(jù)檢測結(jié)果、運(yùn)動(dòng)復(fù)雜度分析結(jié)果以及變化幅度統(tǒng)計(jì)結(jié)果確定對所述視頻文件的切分位置。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其特征在于,采用Hadoop中的數(shù)據(jù)節(jié)點(diǎn)上運(yùn)行的Map作業(yè)對所述音頻文件進(jìn)行劃分,生成所述M個(gè)音頻數(shù)據(jù)單元,以及對與所述音頻文件同步播放的視頻文件進(jìn)行切分;采用Reduce作業(yè)對劃分后的音頻文件以及劃分后的視頻文件進(jìn)行分類聚合。
6.一種視頻文件的切分裝置,其特征在于,包括: 處理模塊,用于將通過聲紋識別獲取到的音頻文件劃分為N個(gè)時(shí)間長度相同的音頻數(shù)據(jù)段,再根據(jù)各個(gè)音頻數(shù)據(jù)段的內(nèi)容相似度對相鄰的多個(gè)音頻數(shù)據(jù)段進(jìn)行合并,生成M個(gè)音頻數(shù)據(jù)單元,其中,M〈N,N和M均為正整數(shù); 分析模塊,用于分別獲取每個(gè)音頻數(shù)據(jù)單元對應(yīng)的視頻圖像幀所在的視頻圖像組GoP,并對該GoP以及與該GoP前后相鄰的兩個(gè)GoP進(jìn)行碼流分析; 切分模塊,用于根據(jù)碼流分析結(jié)果對與所述音頻文件同步播放的視頻文件進(jìn)行切分。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述處理模塊包括: 分類單元,用于按照預(yù)先設(shè)定的關(guān)鍵詞類別分別對每個(gè)音頻數(shù)據(jù)段中出現(xiàn)的多個(gè)關(guān)鍵詞進(jìn)行分類; 選取單元,用于對每種分類中的各個(gè)關(guān)鍵詞的出現(xiàn)頻率進(jìn)行統(tǒng)計(jì)分析并在對每個(gè)關(guān)鍵詞的出現(xiàn)頻率進(jìn)行降序排列后選取前X個(gè)關(guān)鍵詞,其中,X為正整數(shù); 判斷單元,用于判斷所述相鄰的多個(gè)音頻數(shù)據(jù)段中各自選取的前X個(gè)關(guān)鍵詞的重復(fù)率是否超過預(yù)設(shè)閾值; 合并單元,用于在所述判斷單元輸出為是時(shí),對所述相鄰的多個(gè)音頻數(shù)據(jù)段進(jìn)行合并。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述判斷單元,用于采用以下公式判斷所述 相鄰的兩個(gè)音頻數(shù)據(jù)段中各自選取的前X個(gè)關(guān)鍵詞的重復(fù)率是否超過所述預(yù)設(shè)閾值:
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述切分模塊包括:獲取單元,用于在對所述GoP以及與所述GoP前后相鄰的兩個(gè)GoP進(jìn)行碼流分析后,獲取每個(gè)GoP內(nèi)各個(gè)視頻幀的宏塊序號、DC分量數(shù)值、運(yùn)動(dòng)矢量殘差值和幀內(nèi)編碼宏塊數(shù)量;檢測單元,用于根據(jù)所述宏塊序號和所述DC分量數(shù)值檢測每個(gè)GoP中的關(guān)鍵幀; 分析單元,用于采用所述運(yùn)動(dòng)矢量殘差值進(jìn)行運(yùn)動(dòng)復(fù)雜度分析; 統(tǒng)計(jì)單元,用于根據(jù)相鄰視頻幀各自的幀內(nèi)編碼宏塊數(shù)量統(tǒng)計(jì)所述相鄰視頻幀的幀內(nèi)編碼宏塊數(shù)量的變化幅度; 確定單元,用于根據(jù)檢測結(jié)果、運(yùn)動(dòng)復(fù)雜度分析結(jié)果以及變化幅度統(tǒng)計(jì)結(jié)果確定對所述視頻文件的切分位置。
10.根據(jù)權(quán)利要求6至9中任一項(xiàng)所述的裝置,其特征在于,所述裝置應(yīng)用于Hadoop中的數(shù)據(jù)節(jié)點(diǎn)上運(yùn)行的Map作業(yè)中,并采用Reduce作業(yè)對劃分后的音頻文件以及劃分后的視頻文件進(jìn)行分類聚合。
【文檔編號】H04N21/234GK103905742SQ201410143826
【公開日】2014年7月2日 申請日期:2014年4月10日 優(yōu)先權(quán)日:2014年4月10日
【發(fā)明者】崔玉斌, 宿玉文 申請人:北京數(shù)碼視訊科技股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1