本發(fā)明涉及電子技術(shù)領(lǐng)域,尤其涉及一種畫(huà)面的提取方法及終端。
背景技術(shù):
目前視頻在播放過(guò)程中有很多精彩部分,為了有效利用這些精彩部分的畫(huà)面,廠商常會(huì)對(duì)這些精彩部分的畫(huà)面進(jìn)行人工截取,并對(duì)其進(jìn)行運(yùn)營(yíng),如制作廣告,或者制作視頻簡(jiǎn)介等。
但是,由于目標(biāo)畫(huà)面是人工進(jìn)行截取,這往往取決于截取操作人員的惹人喜好以及個(gè)人素質(zhì)等問(wèn)題,這使得人工截取出來(lái)的畫(huà)面質(zhì)量不可控,無(wú)法保障目標(biāo)畫(huà)面的質(zhì)量,且需花費(fèi)大量人力成本進(jìn)行查看視頻并進(jìn)行操作截取,這增加了廠商的成本開(kāi)銷,并且提取畫(huà)面效率低下。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例所要解決的技術(shù)問(wèn)題在于,提供一種畫(huà)面的提取方法及終端??商岣咛崛∧繕?biāo)畫(huà)面的效率,降低提取成本。
為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供了一種畫(huà)面的提取方法,包括:
提取待處理的音視頻數(shù)據(jù)中的音頻數(shù)據(jù);
獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù);
在所述待處理的音視頻數(shù)據(jù)中獲取與所述目標(biāo)音頻數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音視頻數(shù)據(jù);
從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面。
其中,所述獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù)包括:
獲取預(yù)置的背景音樂(lè)特征;
對(duì)所述音頻數(shù)據(jù)進(jìn)行劃分,獲得至少一段音頻數(shù)據(jù);
對(duì)每段音頻數(shù)據(jù)分別進(jìn)行特征提取,獲得每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù);
在所述每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù)中獲取與所述背景音樂(lè)特征匹配的目標(biāo)特征數(shù)據(jù);
獲取所述目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù),將所述目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù)設(shè)置為目標(biāo)音頻數(shù)據(jù)。
其中,所述從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面包括:
提取所述目標(biāo)音視頻數(shù)據(jù)中的目標(biāo)視頻數(shù)據(jù);
對(duì)所述目標(biāo)視頻數(shù)據(jù)進(jìn)行鏡頭劃分,獲得各鏡頭的視頻數(shù)據(jù);
從所述各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行提取畫(huà)面,獲得至少一個(gè)目標(biāo)畫(huà)面。
其中,所述從所述各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行畫(huà)面提取,獲得至少一個(gè)目標(biāo)畫(huà)面包括:
從所述各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行提取畫(huà)面,獲得至少一個(gè)待處理的提取畫(huà)面;
當(dāng)僅獲取到一個(gè)待處理的提取畫(huà)面時(shí),將所述待處理的提取畫(huà)面設(shè)置為目標(biāo)畫(huà)面;
當(dāng)獲取到至少兩個(gè)待處理的提取畫(huà)面時(shí),對(duì)所述至少兩個(gè)待處理的提取畫(huà)面進(jìn)行濾除處理,獲得所述至少一個(gè)目標(biāo)畫(huà)面。
其中,所述對(duì)所述至少兩個(gè)待處理的提取畫(huà)面進(jìn)行濾除處理,獲得所述至少一個(gè)目標(biāo)畫(huà)面包括:
在所述至少兩個(gè)待處理的提取畫(huà)面中計(jì)算任意兩張待處理的提取畫(huà)面之間的相似度;
判斷所述相似度是否大于預(yù)設(shè)的閾值;
當(dāng)所述相似度大于預(yù)設(shè)的閾值時(shí),濾除所述任意兩張待處理的提取畫(huà)面中的任意一張待處理的提取畫(huà)面,在所述任意兩張待處理的提取畫(huà)面中將除所述任意一張待處理的提取畫(huà)面之外的另一張待處理的提取畫(huà)面設(shè)置為所述目標(biāo)畫(huà)面;
當(dāng)所述相似度小于預(yù)設(shè)的閾值時(shí),將所述任意兩張待處理的提取畫(huà)面均設(shè)置為所述目標(biāo)畫(huà)面。
其中,所述從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面之后,還包括:
將至少兩個(gè)目標(biāo)畫(huà)面進(jìn)行視頻拼接,獲得精彩視頻并輸出所述精彩視頻。
本發(fā)明實(shí)施例還提供了一種終端,包括:
提取單元,用于提取待處理的音視頻數(shù)據(jù)中的音頻數(shù)據(jù);
檢測(cè)單元,用于獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù);
獲取單元,用于在所述待處理的音視頻數(shù)據(jù)中獲取與所述目標(biāo)音頻數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音視頻數(shù)據(jù);
提取畫(huà)面單元,用于從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行畫(huà)面提取,獲得目標(biāo)畫(huà)面。
其中,所述檢測(cè)單元包括:
獲取特征子單元,用于獲取預(yù)置的背景音樂(lè)特征;
第一劃分子單元,用于對(duì)所述音頻數(shù)據(jù)進(jìn)行劃分,獲得至少一段音頻數(shù)據(jù);
第一提取子單元,用于對(duì)每段音頻數(shù)據(jù)分別進(jìn)行特征提取,獲得每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù);
獲取子單元,用于在所述每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù)中獲取與所述背景音樂(lè)特征匹配的目標(biāo)特征數(shù)據(jù);
第一設(shè)置子單元,用于獲取所述目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù),將所述目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù)設(shè)置為目標(biāo)音頻數(shù)據(jù)。
其中,所述提取畫(huà)面單元包括:
第二提取子單元,用于提取所述目標(biāo)音視頻數(shù)據(jù)中的目標(biāo)視頻數(shù)據(jù);
第二劃分子單元,用于對(duì)所述目標(biāo)視頻數(shù)據(jù)進(jìn)行鏡頭劃分,獲得各鏡頭的視頻數(shù)據(jù);
第三提取子單元,用于從所述各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行提取畫(huà)面,獲得至少一個(gè)目標(biāo)畫(huà)面。
其中,所述第三提取子單元包括:
第三提取子單元,用于從所述各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行提取畫(huà)面,獲得至少一個(gè)待處理的提取畫(huà)面;
第二設(shè)置子單元,用于當(dāng)僅獲取到一個(gè)待處理的提取畫(huà)面時(shí),將所述待處理的提取畫(huà)面設(shè)置為目標(biāo)畫(huà)面;
處理子單元,用于當(dāng)獲取到至少兩個(gè)待處理的提取畫(huà)面時(shí),對(duì)所述至少兩個(gè)待處理的提取畫(huà)面進(jìn)行濾除處理,獲得所述至少一個(gè)目標(biāo)畫(huà)面。
其中,所述濾除子單元包括:
計(jì)算子單元,用于在所述至少兩個(gè)待處理的提取畫(huà)面中計(jì)算任意兩張待處理的提取畫(huà)面之間的相似度;
判斷子單元,用于判斷所述相似度是否大于預(yù)設(shè)的閾值;
濾除子單元,用于當(dāng)所述判斷子單元判斷所述相似度大于預(yù)設(shè)的閾值時(shí),濾除所述任意兩張待處理的提取畫(huà)面中的任意一張待處理的提取畫(huà)面,在所述任意兩張待處理的提取畫(huà)面中將除所述任意一張待處理的提取畫(huà)面之外的另一張待處理的提取畫(huà)面設(shè)置為所述目標(biāo)畫(huà)面;
第三設(shè)置子單元,用于當(dāng)所述判斷子單元判斷所述相似度小于預(yù)設(shè)的閾值時(shí),將所述任意兩張待處理的提取畫(huà)面均設(shè)置為所述目標(biāo)畫(huà)面。
其中,所述終端還包括:
拼接單元,用于將至少兩個(gè)目標(biāo)畫(huà)面進(jìn)行視頻拼接,獲得精彩視頻并輸出所述精彩視頻。
本發(fā)明實(shí)施例還提供了一種終端,包括:殼體、處理器、存儲(chǔ)器、電路板和電源電路,其中,所述電路板安置在所述殼體圍成的空間內(nèi)部,所述處理器和所述存儲(chǔ)器設(shè)置在所述電路板上;所述電源電路,用于為所述移動(dòng)終端的各個(gè)電路或器件供電;所述存儲(chǔ)器用于存儲(chǔ)可執(zhí)行程序代碼;所述處理器通過(guò)讀取所述存儲(chǔ)器中存儲(chǔ)的可執(zhí)行程序代碼來(lái)運(yùn)行與所述可執(zhí)行程序代碼對(duì)應(yīng)的程序,以用于執(zhí)行以下步驟:
提取待處理的音視頻數(shù)據(jù)中的音頻數(shù)據(jù);
獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù);
在所述待處理的音視頻數(shù)據(jù)中獲取與所述目標(biāo)音頻數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音視頻數(shù)據(jù);
從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面。
在本發(fā)明實(shí)施例中,終端提取待處理的音視頻數(shù)據(jù)中的音頻數(shù)據(jù),獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù),在所述待處理的音視頻數(shù)據(jù)中獲取與所述目標(biāo)音頻數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音視頻數(shù)據(jù),從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面,這可使得終端可自動(dòng)從音視頻數(shù)據(jù)中提取到目標(biāo)畫(huà)面,可提高從音視頻數(shù)據(jù)中的提取目標(biāo)畫(huà)面的效率,降低提取成本。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例提供的一種畫(huà)面的提取方法的一種實(shí)施例流程示意圖;
圖2是本發(fā)明實(shí)施例提供的一種終端的一種實(shí)施例結(jié)構(gòu)圖;
圖3是本發(fā)明實(shí)施例提供的一種終端的另一種實(shí)施例結(jié)構(gòu)圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例中的執(zhí)行主體可以為終端,所描述的終端可包括:電腦、平板電腦、筆記本等智能終端,上述終端僅是舉例,而非窮舉,包含但不限于上述終端。
參見(jiàn)圖1,是本發(fā)明實(shí)施例提供的一種畫(huà)面的提取方法一種實(shí)施例流程示意圖。本發(fā)明實(shí)施例的一種畫(huà)面的提取方法包括如下步驟:
S100,提取待處理的音視頻數(shù)據(jù)中的音頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,音視頻數(shù)據(jù)由音頻數(shù)據(jù)以及視頻數(shù)據(jù)組成,音視頻數(shù)據(jù)可以通過(guò)聲音播放器輸出音頻以及視頻播放器輸出視頻,如音視頻數(shù)據(jù)可以是電視播放的具有聲音輸出的節(jié)目?jī)?nèi)容、手機(jī)上具有聲音輸出的錄像等音視頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,待處理的音視頻數(shù)據(jù)為用戶選擇所要進(jìn)行處理的音視頻數(shù)據(jù),如終端接收到的音視頻數(shù)據(jù)可以作為待處理的音視頻數(shù)據(jù),或者終端可以存儲(chǔ)多個(gè)音視頻數(shù)據(jù),用戶從中選擇一個(gè)音視頻數(shù)據(jù)作為待處理的音視頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,當(dāng)終端確定待處理的音視頻數(shù)據(jù),終端可對(duì)待處理的音視頻數(shù)據(jù)進(jìn)行解碼,提取待處理的音視頻數(shù)據(jù)所包括的音頻數(shù)據(jù)。
S101,獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,音頻數(shù)據(jù)中可包括多種類型音頻數(shù)據(jù),如背景音樂(lè)類型的音頻數(shù)據(jù)、旁白類型的音頻數(shù)據(jù)和靜音類型的音頻數(shù)據(jù)等類型音頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,由于音視頻中的目標(biāo)畫(huà)面一般出現(xiàn)在有背景音樂(lè)的音視頻數(shù)據(jù)中,因此,終端可對(duì)音頻數(shù)據(jù)進(jìn)行識(shí)別出有背景音樂(lè)的音頻數(shù)據(jù),從而進(jìn)行處理獲得目標(biāo)畫(huà)面。
在本發(fā)明實(shí)施例中,終端可對(duì)音頻數(shù)據(jù)進(jìn)行識(shí)別出有背景音樂(lè)的音頻數(shù)據(jù)可以是:獲取預(yù)置背景音樂(lè)特征,在音頻數(shù)據(jù)中檢測(cè)與背景音樂(lè)特征匹配的音頻數(shù)據(jù),當(dāng)檢測(cè)到與背景音樂(lè)特征匹配的音頻數(shù)據(jù)時(shí),提取與背景音樂(lè)特征匹配的音頻數(shù)據(jù),將與背景音樂(lè)特征匹配的音頻數(shù)據(jù)作為目標(biāo)音頻數(shù)據(jù)。其中,預(yù)置的背景音樂(lè)特征可以是用戶進(jìn)行預(yù)置存儲(chǔ)。具體的,在音頻數(shù)據(jù)中檢測(cè)與背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù)可以是:對(duì)音頻數(shù)據(jù)進(jìn)行劃分,獲得至少一段音頻數(shù)據(jù),其中,可以是按時(shí)間段進(jìn)行劃分,如以1s的時(shí)間段對(duì)音頻數(shù)據(jù)進(jìn)行劃分,每個(gè)分段的音頻數(shù)據(jù)的播放時(shí)間為1s。當(dāng)終端對(duì)音頻數(shù)據(jù)進(jìn)行劃分后,終端可對(duì)每段音頻數(shù)據(jù)分別進(jìn)行特征提取,獲得每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù),然后在每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù)中獲取與背景音樂(lè)特征匹配的目標(biāo)特征數(shù)據(jù),獲取目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù),將目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù)設(shè)置為目標(biāo)音頻數(shù)據(jù),其中,當(dāng)終端獲取的目標(biāo)特征數(shù)據(jù)有多個(gè)時(shí),終端可獲取多個(gè)目標(biāo)特征數(shù)據(jù)各分別對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù),并將多個(gè)音頻數(shù)據(jù)進(jìn)行拼接,獲得目標(biāo)音頻數(shù)據(jù)。
S102,在所述待處理的音視頻數(shù)據(jù)中獲取與所述目標(biāo)音頻數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音視頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,音頻數(shù)據(jù)、視頻數(shù)據(jù)以及音視頻數(shù)據(jù)都攜帶有時(shí)間戳,其中,時(shí)間戳是一個(gè)字符序列,唯一地標(biāo)識(shí)某一刻的時(shí)間。由于音視頻數(shù)據(jù)中的音頻數(shù)據(jù)與音視頻數(shù)據(jù)中的視頻數(shù)據(jù)需進(jìn)行同步播放,因此,音頻數(shù)據(jù)的時(shí)間戳、音視頻數(shù)據(jù)中的視頻數(shù)據(jù)的時(shí)間戳和音視頻數(shù)據(jù)的時(shí)間戳都和一個(gè)時(shí)間參考線對(duì)應(yīng),從而使得音頻數(shù)據(jù)與視頻數(shù)據(jù)能進(jìn)行同步播放,即是,終端輸出音視頻數(shù)據(jù)進(jìn)行播放時(shí),輸出的音頻和視頻進(jìn)行同步播放。因此,可根據(jù)目標(biāo)音頻數(shù)據(jù)中的時(shí)間戳在音視頻數(shù)據(jù)中獲取該時(shí)間戳對(duì)應(yīng)的音視頻數(shù)據(jù),從而將該時(shí)間戳對(duì)應(yīng)的音視頻數(shù)據(jù)設(shè)為目標(biāo)音視頻數(shù)據(jù)獲取到目標(biāo)音視頻數(shù)據(jù)。
S103,從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面。
在本發(fā)明實(shí)施例中,目標(biāo)音視頻數(shù)據(jù)可包括目標(biāo)音頻數(shù)據(jù)以及目標(biāo)視頻數(shù)據(jù),終端可提取目標(biāo)音視頻數(shù)據(jù)中所包括的目標(biāo)視頻數(shù)據(jù)。
當(dāng)終端獲取到目標(biāo)視頻數(shù)據(jù)后,終端可在目標(biāo)視頻數(shù)據(jù)中的預(yù)置的至少一個(gè)位置上提取至少一個(gè)畫(huà)面。其中,至少一個(gè)位置可以是目標(biāo)視頻數(shù)據(jù)中的起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置,進(jìn)一步的,位置還可以是其他位置,用戶可以自行設(shè)置。因此,當(dāng)終端預(yù)置的位置包括起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置時(shí),終端可在目標(biāo)視頻數(shù)據(jù)中的起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置各提取到一張畫(huà)面作為目標(biāo)畫(huà)面進(jìn)行保存或者進(jìn)行輸出。
進(jìn)一步的,當(dāng)終端獲取到目標(biāo)視頻數(shù)據(jù)后,終端可按鏡頭對(duì)目標(biāo)視頻數(shù)據(jù)進(jìn)行分段,獲取各鏡頭的視頻數(shù)據(jù),并從各鏡頭的視頻數(shù)據(jù)進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面。其中,終端可從各鏡頭的視頻數(shù)據(jù)中的預(yù)置的至少一個(gè)位置上分別提取至少一個(gè)畫(huà)面。其中,至少一個(gè)位置可以是各鏡頭的視頻數(shù)據(jù)中的起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置中的任意一個(gè)位置多個(gè)位置。進(jìn)一步的,位置還可以是其他位置,用戶可以自行設(shè)置。因此,當(dāng)終端預(yù)置的位置包括起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置時(shí),終端可在各鏡頭的視頻數(shù)據(jù)中的起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置上各提取到一張畫(huà)面作為目標(biāo)畫(huà)面進(jìn)行保存以及輸出。
進(jìn)一步的,終端還可將上述所提取到的畫(huà)面作為待處理的提取畫(huà)面,即可以是,終端可從各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行畫(huà)面提取,獲得至少一個(gè)待處理的提取畫(huà)面,其中,終端可計(jì)算所獲取到的待處理的提取畫(huà)面的個(gè)數(shù),根據(jù)待處理的提取畫(huà)面的個(gè)數(shù)執(zhí)行相應(yīng)的步驟。具體的,當(dāng)終端僅獲取到一個(gè)待處理的提取畫(huà)面時(shí),終端將待處理的提取畫(huà)面設(shè)置為目標(biāo)畫(huà)面;當(dāng)終端獲取到至少兩個(gè)待處理的提取畫(huà)面時(shí),終端可對(duì)所獲得的所有待處理的提取畫(huà)面進(jìn)行濾除處理,獲得目標(biāo)畫(huà)面。其中,終端對(duì)所獲得的所有待處理的提取畫(huà)面進(jìn)行濾除處理,獲得目標(biāo)畫(huà)面可以是:終端在所獲得的待處理的提取畫(huà)面中計(jì)算任意兩張待處理的提取畫(huà)面之間的相似度,其中,計(jì)算任意兩張待處理的提取畫(huà)面之間的相似度可以是終端分別對(duì)該任意兩張待處理的提取畫(huà)面均進(jìn)行畫(huà)面檢測(cè),計(jì)算其內(nèi)容的相似度。當(dāng)終端計(jì)算出該任意兩張待處理的提取畫(huà)面的相似度后,終端可判斷相似度是否大于預(yù)設(shè)的閾值,當(dāng)終端判斷相似度大于預(yù)設(shè)的閾值時(shí),終端可濾除該任意兩張待處理的提取畫(huà)面中的任意一張待處理的提取畫(huà)面,在該任意兩張待處理的提取畫(huà)面中將除該任意一張待處理的提取畫(huà)面之外的另一張待處理的提取畫(huà)面設(shè)置為目標(biāo)畫(huà)面,當(dāng)終端判斷相似度小于或等于預(yù)設(shè)的閾值時(shí),終端可將該任意兩張待處理的提取畫(huà)面均設(shè)置為目標(biāo)畫(huà)面。從而終端可獲取到目標(biāo)畫(huà)面。其中,終端可對(duì)所獲得的待處理的提取畫(huà)面分別進(jìn)行兩兩組合,從而計(jì)算任意兩張待處理的提取畫(huà)面之間的相似度可以是計(jì)算每個(gè)組合的待處理的提取畫(huà)面之間的相似度。
在本發(fā)明實(shí)施例中,當(dāng)終端獲取到目標(biāo)畫(huà)面后,終端還可以進(jìn)行輸出目標(biāo)畫(huà)面?;蛘咛峁┙o用戶制作其他信息,如將目標(biāo)畫(huà)面作為精彩畫(huà)面進(jìn)行制作視頻簡(jiǎn)介、制作廣告等。
進(jìn)一步的,在本發(fā)明實(shí)施例中,當(dāng)終端獲取到至少兩張目標(biāo)畫(huà)面時(shí),終端可所有的目標(biāo)畫(huà)面進(jìn)行視頻拼接獲得精彩視頻并輸出精彩視頻。同時(shí),終端還可根據(jù)目標(biāo)畫(huà)面的個(gè)數(shù)獲得精彩視頻的播放時(shí)間,并在播放時(shí)間內(nèi)進(jìn)行播出目標(biāo)視頻。
在本發(fā)明實(shí)施例中,終端提取待處理的音視頻數(shù)據(jù)中的音頻數(shù)據(jù),獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù),在所述待處理的音視頻數(shù)據(jù)中獲取與所述目標(biāo)音頻數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音視頻數(shù)據(jù),從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面,這可使得終端可自動(dòng)從音視頻數(shù)據(jù)中提取到目標(biāo)畫(huà)面,可提高從音視頻數(shù)據(jù)中的提取目標(biāo)畫(huà)面的效率,降低提取成本。
參見(jiàn)圖2,是本發(fā)明實(shí)施例提供的一種終端的一種實(shí)施例流程示意圖。本發(fā)明實(shí)施例的一種終端包括:
提取單元100,用于提取待處理的音視頻數(shù)據(jù)中的音頻數(shù)據(jù)。
檢測(cè)單元200,用于獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù)。
獲取單元300,用于在所述待處理的音視頻數(shù)據(jù)中獲取與所述目標(biāo)音頻數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音視頻數(shù)據(jù)。
提取畫(huà)面單元400,用于從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面。
在本發(fā)明實(shí)施例中,音視頻數(shù)據(jù)由音頻數(shù)據(jù)以及視頻數(shù)據(jù)組成,音視頻數(shù)據(jù)可以通過(guò)聲音播放器輸出音頻以及視頻播放器輸出視頻,如音視頻數(shù)據(jù)可以是電視播放的具有聲音輸出的節(jié)目?jī)?nèi)容、手機(jī)上具有聲音輸出的錄像等音視頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,待處理的音視頻數(shù)據(jù)為用戶選擇所要進(jìn)行處理的音視頻數(shù)據(jù),如終端接收到的音視頻數(shù)據(jù)可以作為待處理的音視頻數(shù)據(jù),或者終端可以存儲(chǔ)多個(gè)音視頻數(shù)據(jù),用戶從中選擇一個(gè)音視頻數(shù)據(jù)作為待處理的音視頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,當(dāng)終端確定待處理的音視頻數(shù)據(jù),提取單元100可對(duì)待處理的音視頻數(shù)據(jù)進(jìn)行解碼,提取待處理的音視頻數(shù)據(jù)所包括的音頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,音頻數(shù)據(jù)中可包括多種類型音頻數(shù)據(jù),如背景音樂(lè)類型的音頻數(shù)據(jù)、旁白類型的音頻數(shù)據(jù)和靜音類型的音頻數(shù)據(jù)等類型音頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,由于音視頻中的目標(biāo)畫(huà)面一般出現(xiàn)在有背景音樂(lè)的音視頻數(shù)據(jù)中,因此,檢測(cè)單元200可對(duì)音頻數(shù)據(jù)進(jìn)行識(shí)別出有背景音樂(lè)的音頻數(shù)據(jù),從而進(jìn)行處理獲得目標(biāo)畫(huà)面。
在本發(fā)明實(shí)施例中,檢測(cè)單元200可對(duì)音頻數(shù)據(jù)進(jìn)行識(shí)別出有背景音樂(lè)的音頻數(shù)據(jù)可以是:檢測(cè)單元200獲取預(yù)置背景音樂(lè)特征,在音頻數(shù)據(jù)中檢測(cè)與背景音樂(lè)特征匹配的音頻數(shù)據(jù),當(dāng)檢測(cè)到與背景音樂(lè)特征匹配的音頻數(shù)據(jù)時(shí),提取與背景音樂(lè)特征匹配的音頻數(shù)據(jù),將與背景音樂(lè)特征匹配的音頻數(shù)據(jù)作為目標(biāo)音頻數(shù)據(jù)。其中,預(yù)置的背景音樂(lè)特征可以是用戶進(jìn)行預(yù)置存儲(chǔ)。具體的,檢測(cè)單元200在音頻數(shù)據(jù)中檢測(cè)與背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù)可以是:檢測(cè)單元200對(duì)音頻數(shù)據(jù)進(jìn)行劃分,獲得至少一段音頻數(shù)據(jù),其中,可以是按時(shí)間段進(jìn)行劃分,如以1s的時(shí)間段對(duì)音頻數(shù)據(jù)進(jìn)行劃分,每個(gè)分段的音頻數(shù)據(jù)的播放時(shí)間為1s。當(dāng)檢測(cè)單元200對(duì)音頻數(shù)據(jù)進(jìn)行劃分后,檢測(cè)單元200可對(duì)每段音頻數(shù)據(jù)分別進(jìn)行特征提取,獲得每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù),然后在每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù)中獲取與背景音樂(lè)特征匹配的目標(biāo)特征數(shù)據(jù),獲取目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù),將目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù)設(shè)置為目標(biāo)音頻數(shù)據(jù),其中,當(dāng)檢測(cè)單元200獲取的目標(biāo)特征數(shù)據(jù)有多個(gè)時(shí),檢測(cè)單元200可獲取多個(gè)目標(biāo)特征數(shù)據(jù)各分別對(duì)應(yīng)的多個(gè)音頻數(shù)據(jù),并將多個(gè)音頻數(shù)據(jù)進(jìn)行拼接,獲得目標(biāo)音頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,音頻數(shù)據(jù)、視頻數(shù)據(jù)以及音視頻數(shù)據(jù)都攜帶有時(shí)間戳,其中,時(shí)間戳是一個(gè)字符序列,唯一地標(biāo)識(shí)某一刻的時(shí)間。由于音視頻數(shù)據(jù)中的音頻數(shù)據(jù)與音視頻數(shù)據(jù)中的視頻數(shù)據(jù)需進(jìn)行同步播放,因此,音頻數(shù)據(jù)的時(shí)間戳、音視頻數(shù)據(jù)中的視頻數(shù)據(jù)的時(shí)間戳和音視頻數(shù)據(jù)的時(shí)間戳都和一個(gè)時(shí)間參考線對(duì)應(yīng),從而使得音頻數(shù)據(jù)與視頻數(shù)據(jù)能進(jìn)行同步播放,即是,終端輸出音視頻數(shù)據(jù)進(jìn)行播放時(shí),輸出的音頻和視頻進(jìn)行同步播放。因此,獲取單元300可根據(jù)目標(biāo)音頻數(shù)據(jù)中的時(shí)間戳在音視頻數(shù)據(jù)中獲取該時(shí)間戳對(duì)應(yīng)的音視頻數(shù)據(jù),從而獲取單元300將該時(shí)間戳對(duì)應(yīng)的音視頻數(shù)據(jù)設(shè)為目標(biāo)音視頻數(shù)據(jù)獲取到目標(biāo)音視頻數(shù)據(jù)。
在本發(fā)明實(shí)施例中,目標(biāo)音視頻數(shù)據(jù)可包括目標(biāo)音頻數(shù)據(jù)以及目標(biāo)視頻數(shù)據(jù),提取畫(huà)面單元400可提取目標(biāo)音視頻數(shù)據(jù)中所包括的目標(biāo)視頻數(shù)據(jù)。
當(dāng)提取畫(huà)面單元400獲取到目標(biāo)視頻數(shù)據(jù)后,提取畫(huà)面單元400可在目標(biāo)視頻數(shù)據(jù)中的預(yù)置的至少一個(gè)位置上提取至少一個(gè)畫(huà)面。其中,至少一個(gè)位置可以是目標(biāo)視頻數(shù)據(jù)中的起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置,進(jìn)一步的,位置還可以是其他位置,用戶可以自行設(shè)置。因此,當(dāng)終端預(yù)置的位置包括起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置時(shí),提取畫(huà)面單元400可在目標(biāo)視頻數(shù)據(jù)中的起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置各提取到一張畫(huà)面作為目標(biāo)畫(huà)面進(jìn)行保存或者進(jìn)行輸出。
進(jìn)一步的,當(dāng)提取畫(huà)面單元400獲取到目標(biāo)視頻數(shù)據(jù)后,提取畫(huà)面單元400可按鏡頭對(duì)目標(biāo)視頻數(shù)據(jù)進(jìn)行分段,獲取各鏡頭的視頻數(shù)據(jù),并從各鏡頭的視頻數(shù)據(jù)進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面。其中,提取畫(huà)面單元400可從各鏡頭的視頻數(shù)據(jù)中的預(yù)置的至少一個(gè)位置上分別提取至少一個(gè)畫(huà)面。其中,至少一個(gè)位置可以是各鏡頭的視頻數(shù)據(jù)中的起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置中的任意一個(gè)位置多個(gè)位置。進(jìn)一步的,位置還可以是其他位置,用戶可以自行設(shè)置。因此,當(dāng)終端預(yù)置的位置包括起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置時(shí),提取畫(huà)面單元400可在各鏡頭的視頻數(shù)據(jù)中的起點(diǎn)位置、中點(diǎn)位置以及終點(diǎn)位置上各提取到一張畫(huà)面作為目標(biāo)畫(huà)面進(jìn)行保存以及輸出。
進(jìn)一步的,提取畫(huà)面單元400還可將上述所提取到的畫(huà)面作為待處理的提取畫(huà)面,即可以是,提取畫(huà)面單元400可從各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行畫(huà)面提取,其中,提取單元400可計(jì)算所獲取到的待處理的提取畫(huà)面的個(gè)數(shù),根據(jù)待處理的提取畫(huà)面的個(gè)數(shù)執(zhí)行相應(yīng)的步驟。具體的,當(dāng)提取單元400僅獲取到一個(gè)待處理的提取畫(huà)面時(shí),提取單元400將待處理的提取畫(huà)面設(shè)置為目標(biāo)畫(huà)面;當(dāng)提取單元400獲取到至少兩個(gè)待處理的提取畫(huà)面時(shí),提取畫(huà)面單元400可對(duì)所獲得的所有待處理的提取畫(huà)面進(jìn)行濾除處理,獲得目標(biāo)畫(huà)面。其中,提取畫(huà)面單元400對(duì)所獲得的所有待處理的提取畫(huà)面進(jìn)行濾除處理,獲得目標(biāo)畫(huà)面可以是:提取畫(huà)面單元400在所獲得的待處理的提取畫(huà)面中計(jì)算任意兩張待處理的提取畫(huà)面之間的相似度,其中,計(jì)算任意兩張待處理的提取畫(huà)面之間的相似度可以是終端分別對(duì)該任意兩張待處理的提取畫(huà)面均進(jìn)行畫(huà)面檢測(cè),計(jì)算其內(nèi)容的相似度。當(dāng)提取畫(huà)面單元400計(jì)算出該任意兩張待處理的提取畫(huà)面的相似度后,提取畫(huà)面單元400可判斷相似度是否大于預(yù)設(shè)的閾值,當(dāng)提取畫(huà)面單元400判斷相似度大于預(yù)設(shè)的閾值時(shí),提取畫(huà)面單元400可濾除該任意兩張待處理的提取畫(huà)面中的任意一張待處理的提取畫(huà)面,將在該任意兩張待處理的提取畫(huà)面中除該任意一張待處理的提取畫(huà)面之外的另一張待處理的提取畫(huà)面設(shè)置為目標(biāo)畫(huà)面,當(dāng)提取畫(huà)面單元400判斷相似度小于或等于預(yù)設(shè)的閾值時(shí),提取畫(huà)面單元400可將該任意兩張待處理的提取畫(huà)面均設(shè)置為目標(biāo)畫(huà)面。從而提取畫(huà)面單元400可獲取到目標(biāo)畫(huà)面。其中,提取畫(huà)面單元400可對(duì)所獲得的待處理的提取畫(huà)面分別進(jìn)行兩兩組合,從而計(jì)算任意兩張待處理的提取畫(huà)面之間的相似度可以是計(jì)算每個(gè)組合的待處理的提取畫(huà)面之間的相似度。
在本發(fā)明實(shí)施例中,當(dāng)提取畫(huà)面單元400獲取到目標(biāo)畫(huà)面后,終端還可以進(jìn)行輸出目標(biāo)畫(huà)面。或者提供給用戶制作其他信息,如將目標(biāo)畫(huà)面作為精彩畫(huà)面進(jìn)行制作視頻簡(jiǎn)介、制作廣告等。
進(jìn)一步的,在本發(fā)明實(shí)施例中,當(dāng)提取畫(huà)面單元400獲取到至少兩張目標(biāo)畫(huà)面時(shí),終端可所有的目標(biāo)畫(huà)面進(jìn)行視頻拼接獲得精彩視頻并輸出精彩視頻。同時(shí),終端還可根據(jù)目標(biāo)畫(huà)面的個(gè)數(shù)獲得精彩視頻的播放時(shí)間,并在播放時(shí)間內(nèi)進(jìn)行播出目標(biāo)視頻。
其中,所述檢測(cè)單元200包括:
獲取特征子單元,用于獲取預(yù)置的背景音樂(lè)特征;
第一劃分子單元,用于對(duì)所述音頻數(shù)據(jù)進(jìn)行劃分,獲得至少一段音頻數(shù)據(jù);
第一提取子單元,用于對(duì)每段音頻數(shù)據(jù)分別進(jìn)行特征提取,獲得每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù);
獲取子單元,用于在所述每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù)中獲取與所述背景音樂(lè)特征匹配的目標(biāo)特征數(shù)據(jù);
第一設(shè)置子單元,用于獲取所述目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù),將所述目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù)設(shè)置為目標(biāo)音頻數(shù)據(jù)。
所述提取畫(huà)面單元400包括:
第二提取子單元,用于提取所述目標(biāo)音視頻數(shù)據(jù)中的目標(biāo)視頻數(shù)據(jù);
第二劃分子單元,用于對(duì)所述目標(biāo)視頻數(shù)據(jù)進(jìn)行鏡頭劃分,獲得各鏡頭的視頻數(shù)據(jù);
第三提取子單元,用于從所述各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行畫(huà)面提取,獲得至少一個(gè)目標(biāo)畫(huà)面。
所述第三提取子單元包括:
第三提取子單元,用于從所述各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行提取畫(huà)面,獲得至少一個(gè)待處理的提取畫(huà)面;
第二設(shè)置子單元,用于當(dāng)僅獲取到一個(gè)待處理的提取畫(huà)面時(shí),將所述待處理的提取畫(huà)面設(shè)置為目標(biāo)畫(huà)面;
處理子單元,用于當(dāng)獲取到至少兩個(gè)待處理的提取畫(huà)面時(shí),對(duì)所述至少兩個(gè)待處理的提取畫(huà)面進(jìn)行濾除處理,獲得所述至少一個(gè)目標(biāo)畫(huà)面。
所述濾除子單元包括:
計(jì)算子單元,用于在所述至少一個(gè)待處理的提取畫(huà)面中計(jì)算任意兩張待處理的提取畫(huà)面之間的相似度;
判斷子單元,用于判斷所述相似度是否大于預(yù)設(shè)的閾值;
濾除子單元,用于當(dāng)所述判斷子單元判斷所述相似度大于預(yù)設(shè)的閾值時(shí),濾除所述任意兩張待處理的提取畫(huà)面中的任意一張待處理的提取畫(huà)面,在所述任意兩張待處理的提取畫(huà)面中將除所述任意一張待處理的提取畫(huà)面之外的另一張待處理的提取畫(huà)面設(shè)置為所述目標(biāo)畫(huà)面;
第三設(shè)置子單元,用于當(dāng)所述判斷子單元判斷所述相似度小于預(yù)設(shè)的閾值時(shí),將所述任意兩張待處理的提取畫(huà)面均設(shè)置為所述目標(biāo)畫(huà)面。
所述終端還包括:
拼接單元,用于將至少兩個(gè)目標(biāo)畫(huà)面進(jìn)行視頻拼接,獲得精彩視頻并輸出所述精彩視頻。
其中,可以理解的是,本實(shí)施例的終端中的單元的各功能模塊的功能可根據(jù)上述方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過(guò)程可以參照上述方法實(shí)施例的相關(guān)描述,此處不再進(jìn)行贅述。
在本發(fā)明實(shí)施例中,終端提取待處理的音視頻數(shù)據(jù)中的音頻數(shù)據(jù),獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù),在所述待處理的音視頻數(shù)據(jù)中獲取與所述目標(biāo)音頻數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音視頻數(shù)據(jù),從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面,這可使得終端可自動(dòng)從音視頻數(shù)據(jù)中提取到目標(biāo)畫(huà)面,可提高從音視頻數(shù)據(jù)中的提取目標(biāo)畫(huà)面的效率,降低提取成本。
請(qǐng)參見(jiàn)圖3,為本發(fā)明一種終端的另一種實(shí)施例流程示意圖。如圖3所示,本實(shí)施例所述的一種終端包括:
殼體301、處理器302、存儲(chǔ)器303、電路板307和電源電路305,其中,電路板307安置在殼體301圍成的空間內(nèi)部,處理器302和存儲(chǔ)器303設(shè)置在電路板307上;電源電路305,用于為終端的各個(gè)電路或器件供電;存儲(chǔ)器303用于存儲(chǔ)可執(zhí)行程序代碼;處理器302通過(guò)讀取存儲(chǔ)器303中存儲(chǔ)的可執(zhí)行程序代碼來(lái)運(yùn)行與可執(zhí)行程序代碼對(duì)應(yīng)的程序,以用于執(zhí)行以下步驟:
提取待處理的音視頻數(shù)據(jù)中的音頻數(shù)據(jù);
獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù);
在所述待處理的音視頻數(shù)據(jù)中獲取與所述目標(biāo)音頻數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音視頻數(shù)據(jù);
從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面。
其中,所述處理器302獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù)包括:
獲取預(yù)置的背景音樂(lè)特征;
對(duì)所述音頻數(shù)據(jù)進(jìn)行劃分,獲得至少一段音頻數(shù)據(jù);
對(duì)每段音頻數(shù)據(jù)分別進(jìn)行特征提取,獲得每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù);
在所述每段音頻數(shù)據(jù)對(duì)應(yīng)的特征數(shù)據(jù)中獲取與所述背景音樂(lè)特征匹配的目標(biāo)特征數(shù)據(jù);
獲取所述目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù),將所述目標(biāo)特征數(shù)據(jù)對(duì)應(yīng)的音頻數(shù)據(jù)設(shè)置為目標(biāo)音頻數(shù)據(jù)。
其中,所述處理器302從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面包括:
提取所述目標(biāo)音視頻數(shù)據(jù)中的目標(biāo)視頻數(shù)據(jù);
對(duì)所述目標(biāo)視頻數(shù)據(jù)進(jìn)行鏡頭劃分,獲得各鏡頭的視頻數(shù)據(jù);
從所述各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行畫(huà)面提取,獲得至少一個(gè)目標(biāo)畫(huà)面。
其中,所述處理器302從所述各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行提取畫(huà)面,獲得至少一個(gè)目標(biāo)畫(huà)面包括:
從所述各鏡頭的視頻數(shù)據(jù)中分別進(jìn)行提取畫(huà)面,獲得至少一個(gè)待處理的提取畫(huà)面;
當(dāng)僅獲取到一個(gè)待處理的提取畫(huà)面時(shí),將所述待處理的提取畫(huà)面設(shè)置為目標(biāo)畫(huà)面;
當(dāng)獲取到至少兩個(gè)待處理的提取畫(huà)面時(shí),對(duì)所述至少兩個(gè)待處理的提取畫(huà)面進(jìn)行濾除處理,獲得所述至少一個(gè)目標(biāo)畫(huà)面。
其中,所述處理器302對(duì)所述至少兩個(gè)待處理的提取畫(huà)面進(jìn)行濾除處理,獲得所述至少一個(gè)目標(biāo)畫(huà)面包括:
在所述至少兩個(gè)待處理的提取畫(huà)面中計(jì)算任意兩張待處理的提取畫(huà)面之間的相似度;
判斷所述相似度是否大于預(yù)設(shè)的閾值;
當(dāng)所述相似度大于預(yù)設(shè)的閾值時(shí),濾除所述任意兩張待處理的提取畫(huà)面中的任意一張待處理的提取畫(huà)面,在所述任意兩張待處理的提取畫(huà)面中將除所述任意一張待處理的提取畫(huà)面之外的另一張待處理的提取畫(huà)面設(shè)置為所述目標(biāo)畫(huà)面;
當(dāng)所述相似度小于預(yù)設(shè)的閾值時(shí),將所述任意兩張待處理的提取畫(huà)面均設(shè)置為所述目標(biāo)畫(huà)面。
其中,在所述處理器302從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面之后,所述處理器302還執(zhí)行:
將至少兩個(gè)目標(biāo)畫(huà)面進(jìn)行視頻拼接,獲得精彩視頻并輸出所述精彩視頻。
可以理解的是,本實(shí)施例的終端的各功能模塊的功能可根據(jù)上述方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過(guò)程可以參照上述方法實(shí)施例的相關(guān)描述,此處不再進(jìn)行贅述。
在本發(fā)明實(shí)施例中,終端提取待處理的音視頻數(shù)據(jù)中的音頻數(shù)據(jù),獲取預(yù)置的背景音樂(lè)特征,在所述音頻數(shù)據(jù)中檢測(cè)與所述背景音樂(lè)特征相匹配的目標(biāo)音頻數(shù)據(jù),在所述待處理的音視頻數(shù)據(jù)中獲取與所述目標(biāo)音頻數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音視頻數(shù)據(jù),從所述目標(biāo)音視頻數(shù)據(jù)中進(jìn)行提取畫(huà)面,獲得目標(biāo)畫(huà)面,這可使得終端可自動(dòng)從音視頻數(shù)據(jù)中提取到目標(biāo)畫(huà)面,可提高從音視頻數(shù)據(jù)中的提取目標(biāo)畫(huà)面的效率,降低提取成本。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過(guò)計(jì)算機(jī)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤(pán)、只讀存儲(chǔ)記憶體(Read-Only Memory,ROM)或隨機(jī)存儲(chǔ)記憶體(Random Access Memory,RAM)等。
以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來(lái)限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。