本發(fā)明涉及視頻處理技術(shù)領(lǐng)域,特別是涉及一種視頻分類方法及裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,尤其是移動互聯(lián)網(wǎng)技術(shù)的發(fā)展,視頻網(wǎng)站應(yīng)運(yùn)而生。區(qū)別于傳統(tǒng)的電視媒體,基于流量的網(wǎng)絡(luò)媒體更具有互動性。用戶不再受時間和地域的限制,可以選擇在任意時間、任意地點(diǎn),觀看視頻網(wǎng)站上的節(jié)目內(nèi)容。當(dāng)越來越多的用戶傾向于在視頻網(wǎng)站上觀看視頻時,用戶對于視頻網(wǎng)站上視頻內(nèi)容的質(zhì)量要求也越來越高。
視頻網(wǎng)站上的視頻種類繁多,內(nèi)容豐富,除了具有傳統(tǒng)電視媒體上播放的視頻節(jié)目以外,還引進(jìn)了來自于不同國家的視頻內(nèi)容,甚至包括網(wǎng)絡(luò)用戶自行上傳的原創(chuàng)內(nèi)容。這些視頻內(nèi)容質(zhì)量參差不齊,為了保證視頻內(nèi)容的高質(zhì)量,并且滿足不同用戶的需求,需要對視頻網(wǎng)站上的視頻內(nèi)容進(jìn)行分類和分級,為用戶的觀看提供便利。
現(xiàn)有技術(shù)中,對于視頻內(nèi)容的分類和分級,需要人工甄別和審核,去除敏感或者非法的內(nèi)容,并對這些視頻及時進(jìn)行線下處理,常見的視頻類別可以分為:普通視頻、動漫視頻、廣告視頻等。但視頻網(wǎng)站上的視頻量巨大,如果全部需要人工甄別和審核,不僅需要耗費(fèi)極大的人力,還會導(dǎo)致不能及時對網(wǎng)站上實(shí)時播出的視頻內(nèi)容進(jìn)行分類的問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例的目的在于提供一種視頻分類方法及裝置,以實(shí)現(xiàn)及時對網(wǎng)站上的視頻進(jìn)行分類,提高用戶體驗(yàn),節(jié)約了人力的目的。具體技術(shù)方案如下:
本發(fā)明實(shí)施例提供了一種視頻分類方法,所述方法包括:
獲取視頻文件;
提取所述視頻文件中各個鏡頭的關(guān)鍵幀,得到多個視頻幀;
針對每個視頻幀,確定該視頻幀的類別;
統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長,得到統(tǒng)計(jì)結(jié)果;
根據(jù)統(tǒng)計(jì)結(jié)果,將所述視頻文件進(jìn)行分類。
可選的,所述提取所述視頻文件中各個鏡頭的關(guān)鍵幀,得到多個視頻幀,包括:
將所述視頻文件通過鏡頭分割提取關(guān)鍵幀,得到多個視頻幀。
可選的,所述提取所述視頻文件中各個鏡頭的關(guān)鍵幀,得到多個視頻幀,包括:
將所述視頻文件中各個鏡頭按照預(yù)設(shè)間隔提取關(guān)鍵幀,得到多個視頻幀。
可選的,所述針對每個視頻幀,確定該視頻幀的類別,包括:
將每個視頻幀輸入到預(yù)先訓(xùn)練的分類器中,得到該視頻幀的類別;其中,預(yù)先訓(xùn)練的分類器是通過收集多個視頻幀和對應(yīng)的類別信息,采用誤差反向傳播神經(jīng)網(wǎng)絡(luò)算法,得到的分類網(wǎng)絡(luò)模型。
可選的,所述統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長,包括:
統(tǒng)計(jì)屬于相同類別的視頻幀的數(shù)量和每個視頻幀的開始時間、結(jié)束時間。
可選的,所述根據(jù)統(tǒng)計(jì)結(jié)果,將所述視頻文件進(jìn)行分類,包括:
比較不同類別的視頻幀的數(shù)量值,得到比較結(jié)果;
根據(jù)比較結(jié)果,將所述視頻文件進(jìn)行分類。
可選的,所述根據(jù)比較結(jié)果,將所述視頻文件進(jìn)行分類,包括:
若第一類別的視頻幀的數(shù)量值大于第二類別的視頻幀的數(shù)量值,則所述視頻文件屬于第一類別,統(tǒng)計(jì)所述第一類別每個視頻幀的時長,標(biāo)注在所述視頻文件中,完成所述視頻文件的分類;
若第一類別的視頻幀的數(shù)量值小于第二類別的視頻幀的數(shù)量值,則所述視頻文件屬于第二類別,統(tǒng)計(jì)所述第二類別每個視頻幀的時長,標(biāo)注在所述視頻文件中,完成所述視頻文件的分類。本發(fā)明實(shí)施例提供了一種視頻分類裝置,所述裝置包括:
獲取模塊,用于獲取視頻文件;
提取模塊,用于提取所述視頻文件中各個鏡頭的關(guān)鍵幀,得到多個視頻幀;
第一分類模塊,用于針對每個視頻幀,確定該視頻幀的類別;
統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長,得到統(tǒng)計(jì)結(jié)果;
第二分類模塊,用于根據(jù)統(tǒng)計(jì)結(jié)果,將所述視頻文件進(jìn)行分類。
可選的,所述提取模塊,具體用于將所述視頻文件通過鏡頭分割提取關(guān)鍵幀,得到多個視頻幀。
可選的,所述提取模塊,具體用于將所述視頻文件中各個鏡頭按照預(yù)設(shè)間隔提取關(guān)鍵幀,得到多個視頻幀。
可選的,所述第一分類模塊,具體用于將每個視頻幀輸入到預(yù)先訓(xùn)練的分類器中,得到該視頻幀的類別;其中,預(yù)先訓(xùn)練的分類器是通過收集多個視頻幀和對應(yīng)的類別信息,采用誤差反向傳播神經(jīng)網(wǎng)絡(luò)算法,得到的分類網(wǎng)絡(luò)模型。
可選的,所述統(tǒng)計(jì)模塊,具體用于統(tǒng)計(jì)屬于相同類別的視頻幀的數(shù)量和每個視頻幀的開始時間、結(jié)束時間。
可選的,所述第二分類模塊,包括:
比較子模塊,具體用于比較不同類別的視頻幀的數(shù)量值,得到比較結(jié)果;
分類子模塊,具體用于根據(jù)比較結(jié)果,將所述視頻文件進(jìn)行分類。
可選的,所述分類子模塊,具體用于若第一類別的視頻幀的數(shù)量值大于第二類別的視頻幀的數(shù)量值,則所述視頻文件屬于第一類別,統(tǒng)計(jì)所述第一類別每個視頻幀的時長,標(biāo)注在所述視頻文件中,完成所述視頻文件的分類;
若第一類別的視頻幀的數(shù)量值小于第二類別的視頻幀的數(shù)量值,則所述視頻文件屬于第二類別,統(tǒng)計(jì)所述第二類別每個視頻幀的時長,標(biāo)注在所述視頻文件中,完成所述視頻文件的分類。
本發(fā)明實(shí)施例提供的視頻分類方法及裝置,提取視頻文件中各個鏡頭的關(guān)鍵幀,得到多個視頻幀,并針對每個視頻幀,確定該視頻幀的類別,統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長;根據(jù)統(tǒng)計(jì)結(jié)果,將視頻文件進(jìn)行分類。實(shí)現(xiàn)視頻文件的分類,可以實(shí)現(xiàn)及時對網(wǎng)站上的視頻進(jìn)行分類,提高了用戶體驗(yàn),節(jié)約了人力。當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品或方法并不一定需要同時達(dá)到以上所述的所有優(yōu)點(diǎn)。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例視頻分類方法的流程圖;
圖2為本發(fā)明實(shí)施例在實(shí)際應(yīng)用場景中的流程圖;
圖3為本發(fā)明實(shí)施例視頻分類裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
為了提高用戶體驗(yàn),節(jié)約人力,實(shí)現(xiàn)及時對網(wǎng)站上的視頻進(jìn)行分類,本發(fā)明實(shí)施例提供了一種視頻分類方法及裝置,以下分別進(jìn)行詳細(xì)說明。
圖1為本發(fā)明實(shí)施例視頻分類方法的流程圖,包括如下步驟:
步驟101,獲取視頻文件。
本發(fā)明實(shí)施例提供的方法可以應(yīng)用于電子設(shè)備。具體地,該電子設(shè)備可以為臺式計(jì)算機(jī)、智能移動終端、便攜式計(jì)算機(jī)等。
電子設(shè)備獲取視頻文件的方式有多種,例如,可以通過合作模式直接在交互式網(wǎng)絡(luò)平臺上獲取視頻文件;利用爬蟲工具遍歷交互式網(wǎng)絡(luò)平臺上的內(nèi)容,獲取視頻文件;利用硬件解析工具導(dǎo)出數(shù)字電視機(jī)頂盒中的視頻文件。在本步驟中,電子設(shè)備獲取的視頻文件包括不同電視臺、多個頻道的視頻文件,還可以包括用戶原創(chuàng)的視頻內(nèi)容,這些視頻內(nèi)容五花八門,可能中間包含有敏感或者非法內(nèi)容,所以需要對電子設(shè)備獲取到的視頻文件進(jìn)行分類,方便用戶進(jìn)行觀看。
步驟102,提取視頻文件中各個鏡頭的關(guān)鍵幀,得到多個視頻幀。
將步驟101中獲取得到的視頻文件進(jìn)行處理,提取視頻文件的關(guān)鍵幀。一個視頻文件是有無數(shù)個鏡頭組成的,一個鏡頭由多幀圖像組成,各幀圖像之間會有相當(dāng)多的重復(fù)信息,所以通常選取能夠描述鏡頭主要內(nèi)容的幀,作為關(guān)鍵幀,來簡潔的表達(dá)一個鏡頭,所以提取關(guān)鍵幀的目的是選取具有代表性的關(guān)鍵幀代表一個鏡頭,減小后期視頻處理的計(jì)算量。
可選的,一種提取視頻文件中各個鏡頭的關(guān)鍵幀的方法為,將視頻文件通過鏡頭分割提取關(guān)鍵幀,得到多個視頻幀。鏡頭分割的目的是將視頻文件進(jìn)行鏡頭檢測,鏡頭檢測的目的是將視頻文件中相似的視頻幀進(jìn)行聚類、合并處理為一個鏡頭,將視頻文件分割成以鏡頭為單位的片段,得到多個視頻幀。通過鏡頭分割的方法,將視頻文件中相似的視頻幀進(jìn)行聚類、合并處理,選出代表這個片段的鏡頭,并提取各鏡頭的關(guān)鍵幀,可以達(dá)到減小整體計(jì)算量的目的。
將得到的多個視頻幀可以進(jìn)行如下的進(jìn)一步處理:第一步,繪制圖像三原色光模式(colormodel,rgb)值圖。通過現(xiàn)有的計(jì)算機(jī)程序軟件,例如java等,將輸入的視頻幀中的圖像進(jìn)行rgb值轉(zhuǎn)換。例如,可以用計(jì)算機(jī)軟件raster獲取視頻幀每一像素點(diǎn)的rgb值,由此計(jì)算每一個輸入的視頻幀的rgb值。并且,可以利用這些rgb值,采用繪圖軟件opencv或者matlab繪制出每個視頻幀的顏色直方圖;第二步,計(jì)算歐式距離。計(jì)算時域相鄰幀的顏色直方圖之間的歐式距離,即直方圖上點(diǎn)與點(diǎn)之間的直線距離;如果歐式距離值大于預(yù)先設(shè)定的第一閾值th1,則認(rèn)為鏡頭發(fā)生了切變,記錄當(dāng)前幀的第一開始位置e1和第一結(jié)束位置s1之間的所有視頻幀為一個鏡頭;計(jì)算當(dāng)前幀與當(dāng)前幀之前的n幀之間的直方圖的歐式距離,如果大于預(yù)先設(shè)定的第二閾值th2,則認(rèn)為在此處發(fā)生了鏡頭漸變,記錄當(dāng)前幀的第二開始位置e2和第二結(jié)束位置s2之間的所有視頻幀為一個鏡頭。如果上述條件都不滿足,則確定當(dāng)前幀處于一個鏡頭內(nèi)部,繼續(xù)檢測鏡頭分割點(diǎn),重復(fù)上述第一步和第二步,直到完成所有視頻幀的鏡頭檢測和關(guān)鍵幀提取。
可以根據(jù)預(yù)先設(shè)定的幀數(shù)m,電子設(shè)備在鏡頭中抽取預(yù)先設(shè)定的幀數(shù)m對應(yīng)的幀作為代表幀,計(jì)算抽取視頻幀的間隔gap=(e-s)/(m+1),e代表當(dāng)前幀的開始位置,s代表當(dāng)前幀的結(jié)束位置,從當(dāng)前幀開始以gap為間隔抽取視頻幀,作為關(guān)鍵幀。
可選的,另一種提取視頻文件中各個鏡頭的關(guān)鍵幀的方法為,將視頻文件中各個鏡頭按照預(yù)設(shè)間隔提取關(guān)鍵幀,得到多個視頻幀。以預(yù)設(shè)時間間隔t為間隔,每隔t秒在各個鏡頭中抽取一幀關(guān)鍵幀,記錄每個抽取的關(guān)鍵幀在視頻文件中的位置,以及同上一個鏡頭的抽取間隔。以預(yù)設(shè)時間間隔t提取關(guān)鍵幀的方法相對于鏡頭分割的方法提取關(guān)鍵幀,可以節(jié)約計(jì)算時間,提高效率,但是等時間間隔的方法有可能提取的鏡頭不能精確的代表某個片段,因?yàn)槊總€片段的時間不一樣,所以按照等時間間隔提取可能會提取到相同片段內(nèi)的鏡頭。
步驟103,針對每個視頻幀,確定該視頻幀的類別。
電子設(shè)備在對視頻文件進(jìn)行處理之后,得到多個視頻幀。為了將這些視頻幀進(jìn)行分類,需要確定這些視頻的類別。
作為本發(fā)明實(shí)施例的一種實(shí)施方式,電子設(shè)備確定視頻幀的類別一種具體的方法為,將每個視頻幀輸入到預(yù)先訓(xùn)練的分類器中,得到該視頻幀的類別;其中,預(yù)先訓(xùn)練的分類器是通過收集多個視頻幀和對應(yīng)的類別信息,采用誤差反向傳播神經(jīng)網(wǎng)絡(luò)算法,得到的分類網(wǎng)絡(luò)模型。將視頻幀進(jìn)行分類的具體過程跟選擇的分類器有關(guān),常見的分類器有決策樹分類器、選擇樹分類器等,通過將數(shù)據(jù)按照不同的標(biāo)準(zhǔn)或者分類屬性進(jìn)行分類,我們選取深度學(xué)習(xí)分類器googlenet將上述視頻幀進(jìn)行分類。其中,預(yù)先訓(xùn)練的分類器是通過預(yù)先收集大量的視頻幀,其中包括各個類別的,以我們通常視頻分的類別為例,預(yù)先收集大量視頻幀中,可能包括正常視頻幀、情色視頻幀、動漫視頻幀、情色動漫視頻幀,這些視頻幀都有對應(yīng)的類別信息,將這些視頻幀和類別信息一起輸入到caffe開源的深度學(xué)習(xí)框架進(jìn)行模型訓(xùn)練。具體的訓(xùn)練過程為通過誤差反向傳播神經(jīng)網(wǎng)絡(luò)算法將視頻幀分類。每個視頻幀樣本作用于網(wǎng)絡(luò)時,權(quán)重及閾值得到一次更新,重復(fù)若干次,直到誤差函數(shù)到達(dá)全局最小值,將誤差函數(shù)到達(dá)全局最小值與對應(yīng)的視頻幀類別信息對應(yīng)起來,結(jié)束訓(xùn)練。通過重復(fù)上述過程,可以得到用于分類的網(wǎng)絡(luò)模型。
將步驟102中得到的多個視頻幀,輸入到訓(xùn)練好的模型中,按照同樣的模型結(jié)構(gòu)以及訓(xùn)練好的參數(shù),依次進(jìn)行卷積、修正線性單元等操作,得到每個類別的置信度概率,直到完成分類。例如,正常視頻幀類別,情色視頻幀類別、正常動漫視頻幀類別、情色動漫視頻幀類別的置信度概率輸出分別為p1、p2、p3、p4,選取p1、p2、p3、p4中最大值對應(yīng)的類別,為視頻幀所對應(yīng)的類別。假如輸入的某個未知的視頻幀的四個類別的置信度概率輸出p1、p2、p3、p4中p3的數(shù)值最低,則該視頻幀為正常動漫視頻幀。
步驟104,統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長,得到統(tǒng)計(jì)結(jié)果。
本步驟中,將步驟103中得到的各個視頻幀的類別信息進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長,統(tǒng)計(jì)的目的是為了將每個視頻幀的時長和類別信息標(biāo)注在視頻文件中。
作為本發(fā)明實(shí)施例的一種實(shí)施方式,電子設(shè)備統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長的一種具體方法為,統(tǒng)計(jì)屬于相同類別的視頻幀的數(shù)量和每個視頻幀的開始時間、結(jié)束時間。統(tǒng)計(jì)所有從步驟102中得到視頻幀的類別,統(tǒng)計(jì)的方法可以為統(tǒng)計(jì)相同類別下的視頻幀的數(shù)量,根據(jù)步驟102例子中得到的四個類別,分別統(tǒng)計(jì)每個類別的視頻幀的數(shù)量,可以確定每個類別視頻幀的分布;統(tǒng)計(jì)每個視頻幀的開始時間、結(jié)束時間,進(jìn)而可以得到每個視頻幀的時長。
對于一個視頻文件來說,對于各個視頻幀的處理是按照時間序列處理的,并且在處理每一個視頻幀的時候,會記錄上一個視頻幀處理的過程,在統(tǒng)計(jì)視頻幀的時長時,具體方法還包括:如果某個類別視頻幀之前出現(xiàn)的是另一個類別的視頻幀,例如,在正常視頻幀之前出現(xiàn)的是情色視頻幀或者情色動漫視頻幀,則記錄這個情色視頻幀或者情色動漫視頻幀的開始位置,如果在這個情色視頻幀或者情色動漫視頻幀之前出現(xiàn)的也是相同類別的視頻幀,則將該視頻幀的時長累計(jì);如果出現(xiàn)正常視頻幀,結(jié)束之前對情色或者情色動漫視頻幀的統(tǒng)計(jì),開始統(tǒng)計(jì)正常視頻幀的時長,直到出現(xiàn)另一類別的視頻幀;如果兩個情色視頻幀段落之間有短暫的正常視頻幀,假如時長小于預(yù)設(shè)時間長度th,預(yù)設(shè)時間長度可以按照用戶的需求任意設(shè)定,則將這兩段情色視頻幀段落合并為一個段落,記錄第一個段落的位置,視頻段落長度為這兩個情色視頻幀段落之和加上中間的正常視頻幀段落的長度。統(tǒng)計(jì)每個類別視頻幀的時長,將每個類別視頻段落的數(shù)量和總長度記錄下來,得到統(tǒng)計(jì)結(jié)果。
步驟105,根據(jù)統(tǒng)計(jì)結(jié)果,將視頻文件進(jìn)行分類。
將統(tǒng)計(jì)得到的每個類別視頻段落的數(shù)量和總長度的統(tǒng)計(jì)結(jié)果,根據(jù)這些統(tǒng)計(jì)結(jié)果對視頻文件進(jìn)行進(jìn)一步處理。根據(jù)統(tǒng)計(jì)得到的每個類別視頻的段落和每個段落的時長,可以將視頻文件標(biāo)記為帶有分段類別的視頻文件,用戶可以一目了然的看出視頻文件中包含有哪些類別的視頻段落以及相應(yīng)的段落時長。
作為本發(fā)明實(shí)施例的一種實(shí)施方式,根據(jù)統(tǒng)計(jì)結(jié)果,將視頻文件進(jìn)行分類的一種具體方法為,比較不同類別的視頻幀的數(shù)量值,得到比較結(jié)果。將每個類別的視頻幀的數(shù)量值進(jìn)行比較,比較方法為若第一類別的視頻幀的數(shù)量值大于第二類別的視頻幀的數(shù)量值,則視頻文件屬于第一類別,統(tǒng)計(jì)第一類別每個視頻幀的時長,標(biāo)注在視頻文件中,完成視頻文件的分類;若第一類別的視頻幀的數(shù)量值小于第二類別的視頻幀的數(shù)量值,則視頻文件屬于第二類別,統(tǒng)計(jì)第二類別每個視頻幀的時長,標(biāo)注在視頻文件中,完成視頻文件的分類。舉例說明說下:
對于各個類別的視頻幀,可以通過統(tǒng)計(jì)各個類別視頻幀的數(shù)量進(jìn)行第一步比較,假如第一類別的視頻幀的數(shù)量為n1,第二類別的視頻幀的數(shù)量為n2,如果n1>n2,則認(rèn)為該視頻屬于第一類別,否則屬于第一類別。第一類別可以為普通視頻,其中包括正常視頻幀和情色視頻幀,第一類別可以為動漫視頻,其中包括正常動漫視頻幀和情色動漫視頻幀。通過以上的方法可以將視頻分為兩大類。
對于已經(jīng)分成兩大類的視頻文件,還可以具體按照級別分為適合不同人群觀看的視頻,假設(shè)1至12歲的未成年人適合觀看的視頻等級為一級,12歲至18歲的未成年人適合觀看的視頻等級為二級,18歲以上的成年人適合觀看的視頻等級為三級。根據(jù)統(tǒng)計(jì)結(jié)果中的每個類別視頻段落的數(shù)量和總長度,如果視頻中不含有情色視頻幀和情色動漫視頻幀,即該類別視頻段落的數(shù)量為0,則認(rèn)為該視頻屬于一級視頻;如果包含情色視頻幀和情色動漫視頻幀的數(shù)量小于一個預(yù)設(shè)閾值,該預(yù)設(shè)閾值可以根據(jù)用戶的需求任意設(shè)定,則認(rèn)為該視頻屬于二級視頻;都不滿足上述兩個條件的為三級視頻。本發(fā)明實(shí)施例提供的視頻分類方法,通過提取視頻文件中各個鏡頭的關(guān)鍵幀,得到多個視頻幀,并將每個視頻幀,輸入到已經(jīng)訓(xùn)練好的分類器中,進(jìn)行模型重訓(xùn),確定該視頻幀的類別,統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長;根據(jù)統(tǒng)計(jì)結(jié)果,每個視頻幀的類別和時長都標(biāo)注在視頻文件中,將視頻文件進(jìn)行分類。本發(fā)明實(shí)施例提供的方法,可以實(shí)現(xiàn)對視頻文件的精確分類,并且實(shí)時對網(wǎng)站上的視頻文件進(jìn)行分類,方便用戶進(jìn)行觀看,提高了用戶體驗(yàn),同時全程由電子設(shè)備完成分類,節(jié)約了人力。
作為本發(fā)明實(shí)施例的一種具體實(shí)施方式,在實(shí)際應(yīng)用場景中,本發(fā)明實(shí)施例提供的視頻文件分類方法應(yīng)用如圖2所示,包括:
步驟201,獲取視頻文件。
在實(shí)際應(yīng)用中,獲取到的視頻文件可能來自于不同的視頻播放平臺或者原創(chuàng)內(nèi)容,這些視頻文件根據(jù)自身來源和不同的畫質(zhì),例如高清、超清、流暢畫質(zhì)等,會被電子設(shè)備分為不同的信道,對從不同的信道獲取的視頻文件進(jìn)行分類處理,這里以獲取到的一個視頻文件為例,進(jìn)行說明,多個視頻文件的分類方法相同。
步驟202,提取視頻文件中各個鏡頭的關(guān)鍵幀,得到多個視頻幀。
一個視頻文件是由多個鏡頭組成的,將視頻文件中的每個鏡頭進(jìn)行關(guān)鍵幀提取,找出可以代表這個鏡頭的關(guān)鍵幀,得到多個鏡頭的視頻幀。
步驟203,將多個視頻幀進(jìn)行分類。
將步驟202中得到的多個視頻幀,輸入到訓(xùn)練好的模型中,按照同樣的模型結(jié)構(gòu)以及訓(xùn)練好的參數(shù),依次進(jìn)行卷積、修正線性單元等操作,得到每個類別的置信度概率,直到完成分類。訓(xùn)練模型和步驟103中內(nèi)容相同。
步驟204,統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長,得到統(tǒng)計(jì)結(jié)果。
將步驟203中得到的各個視頻幀的類別信息進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長,統(tǒng)計(jì)的目的是為了將每個視頻幀的時長和類別信息標(biāo)注在視頻文件中。
步驟205,根據(jù)統(tǒng)計(jì)結(jié)果,完成視頻文件的分類。
統(tǒng)計(jì)每個類別視頻段落的數(shù)量和總長度并根據(jù)這些統(tǒng)計(jì)結(jié)果對視頻文件進(jìn)行進(jìn)一步處理。根據(jù)統(tǒng)計(jì)得到的每個類別視頻的段落和每個段落的時長,可以將視頻文件標(biāo)記為帶有分段類別的視頻文件,用戶可以一目了然的看出視頻文件中包含有哪些類別的視頻段落以及相應(yīng)的段落時長。
本發(fā)明還提供了一種視頻分類裝置,裝置的結(jié)構(gòu)示意圖如圖3所示,包括:獲取模塊301,用于獲取視頻文件。
提取模塊302,用于提取視頻文件中各個鏡頭的關(guān)鍵幀,得到多個視頻幀。
第一分類模塊303,用于針對每個視頻幀,確定該視頻幀的類別。
統(tǒng)計(jì)模塊304,用于統(tǒng)計(jì)所有視頻幀的類別和每個視頻幀的時長,得到統(tǒng)計(jì)結(jié)果。
第二分類模塊305,用于根據(jù)統(tǒng)計(jì)結(jié)果,將視頻文件進(jìn)行分類。
可選的,提取模塊302,具體用于將視頻文件通過鏡頭分割提取關(guān)鍵幀,得到多個視頻幀。
可選的,提取模塊302,具體用于將視頻文件中各個鏡頭按照預(yù)設(shè)間隔提取關(guān)鍵幀,得到多個視頻幀。
可選的,第一分類模塊303,具體用于將每個視頻幀輸入到預(yù)先訓(xùn)練的分類器中,得到該視頻幀的類別;其中,預(yù)先訓(xùn)練的分類器是通過收集多個視頻幀和對應(yīng)的類別信息,采用誤差反向傳播神經(jīng)網(wǎng)絡(luò)算法,得到的分類網(wǎng)絡(luò)模型。
可選的,統(tǒng)計(jì)模塊304,具體用于統(tǒng)計(jì)屬于相同類別的視頻幀的數(shù)量和每個視頻幀的開始時間、結(jié)束時間。
可選的,第二分類模塊305,包括:
比較子模塊,具體用于比較不同類別的視頻幀的數(shù)量值,得到比較結(jié)果。
分類子模塊,具體用于根據(jù)比較結(jié)果,將視頻文件進(jìn)行分類。
可選的,分類子模塊,具體用于若第一類別的視頻幀的數(shù)量值大于第二類別的視頻幀的數(shù)量值,則視頻文件屬于第一類別,統(tǒng)計(jì)第一類別每個視頻幀的時長,標(biāo)注在視頻文件中,完成視頻文件的分類;
若第一類別的視頻幀的數(shù)量值小于第二類別的視頻幀的數(shù)量值,則視頻文件屬于第二類別,統(tǒng)計(jì)第二類別每個視頻幀的時長,標(biāo)注在視頻文件中,完成視頻文件的分類。
需要說明的是,本發(fā)明實(shí)施例的裝置是應(yīng)用上述視頻分類方法的裝置,則上述視頻分類方法的所有實(shí)施例均適用于該裝置,且均能達(dá)到相同或相似的有益效果。
需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實(shí)體或者操作與另一個實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
本說明書中的各個實(shí)施例均采用相關(guān)的方式描述,各個實(shí)施例之間相同相似的部分互相參見即可,每個實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。