本發(fā)明涉及電子技術(shù)領(lǐng)域,尤其涉及一種視頻文件的生成方法及終端。
背景技術(shù):
隨著智能終端的普及,具有拍攝功能的智能終端的重要性越來越高,通過具有拍攝功能的智能終端進(jìn)行拍攝、觀看、分享視頻已經(jīng)成為許多人的愛好。
當(dāng)前,在我們的日常生活中,用戶通常將智能終端錄制的一些視頻文件分享至公眾平臺(tái)上供用戶查看。但是,目前用戶在通過智能終端錄制視頻文件時(shí),智能終端僅僅只是能夠?qū)崿F(xiàn)實(shí)時(shí)錄制視頻文件,無法提供更多的其他內(nèi)容吸引用戶關(guān)注。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例所要解決的技術(shù)問題在于,提供一種視頻文件的生成方法及終端??商岣咭曨l文件內(nèi)容的趣味性。
為了解決上述技術(shù)問題,本發(fā)明實(shí)施例提供了一種視頻文件的生成方法,包括:
對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果;
根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素;
將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀;
對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件。
本發(fā)明另一方提供一種終端,所述終端包括:
識(shí)別單元,用于對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果;
獲取單元,用于根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素;
合成單元,用于將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀;
生成單元,用于對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件。
在本發(fā)明實(shí)施例中,終端可對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果,根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素,將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀,對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件,這可增加視頻文件的趣味性,提高視頻文件內(nèi)容的吸引力。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例中的一種視頻文件的生成方法的實(shí)施例流程示意圖;
圖2是本發(fā)明實(shí)施例中提供的一種待處理視頻幀示意圖;
圖3是本發(fā)明實(shí)施例中提供的一種顯示元素示意圖;
圖4是本發(fā)明實(shí)施例中提供的一種已處理視頻幀示意圖;
圖5是本發(fā)明實(shí)施例中的另一種視頻文件的生成方法的實(shí)施例流程示意圖;
圖6是本發(fā)明實(shí)施例中的又一種視頻文件的生成方法的實(shí)施例流程示意圖;
圖7是本發(fā)明實(shí)施例中的一種終端結(jié)構(gòu)圖;
圖8是本發(fā)明實(shí)施例中的另一種終端結(jié)構(gòu)圖;
圖9是本發(fā)明實(shí)施例中的又一種終端結(jié)構(gòu)圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例提供的一種視頻文件的生成方法可以應(yīng)用于終端錄制視頻文件的場景。
下面將結(jié)合附圖1-附圖6,對(duì)本發(fā)明實(shí)施例提供的視頻文件的生成方法進(jìn)行詳細(xì)介紹,其中,實(shí)施例的執(zhí)行終端,所描述的終端可以是具有拍攝功能的終端,如包括:手機(jī)、平板電腦、掌上電腦或者移動(dòng)互聯(lián)網(wǎng)設(shè)備(Mobile Internet Device,MID)等,上述終端僅是舉例,而非窮舉,包含但不限于上述終端。
參見圖1,是本發(fā)明實(shí)施例提供的一種視頻文件的生成方法一種實(shí)施例流程示意圖。本發(fā)明實(shí)施例的一種視頻文件的生成方法包括如下步驟:
S100,對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果。
在本發(fā)明實(shí)施例中,當(dāng)終端接收到生成視頻文件的操作指令時(shí),終端可采集用于生成視頻文件的待處理視頻幀,其中,生成視頻文件的操作指令可以是拍攝視頻指令,或者是對(duì)播放視頻進(jìn)行錄制的操作指令等生成視頻文件的操作指令。當(dāng)終端接收到拍攝視頻指令時(shí),終端可啟動(dòng)攝像頭,控制攝像頭采集用于生成視頻文件的待處理視頻幀,其中,攝像頭可內(nèi)置在終端中,或者攝像頭外置在終端外,在此不進(jìn)行限制;當(dāng)終端接收到對(duì)播放視頻進(jìn)行錄制的操作指令時(shí),終端可對(duì)播放視頻進(jìn)行捕捉用于生成視頻文件的待處理視頻幀,具體應(yīng)用中可如,當(dāng)電視機(jī)在播放節(jié)目中接收到對(duì)節(jié)目進(jìn)行錄制的操作指令時(shí),電視機(jī)可對(duì)播放的節(jié)目畫面進(jìn)行捕捉用于生成視頻文件的待處理視頻幀。
在本發(fā)明實(shí)施例中,當(dāng)終端采集到待處理視頻幀時(shí),終端可逐幀對(duì)待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果。進(jìn)一步的,由于待處理視頻幀的相鄰一個(gè)或多個(gè)視頻幀的視頻內(nèi)容大多相似,為了降低終端的處理壓力,提升終端的處理效率,終端可按預(yù)置的幀間隔從采集到的待處理視頻幀中獲取目標(biāo)待處理視頻幀,并對(duì)目標(biāo)待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果。當(dāng)然,為了進(jìn)一步降低終端處理壓力,終端在對(duì)待處理視頻幀進(jìn)行人臉表情識(shí)別前,終端可對(duì)待處理視頻幀進(jìn)行人臉識(shí)別,判斷待處理視頻幀是否包括人臉圖像,當(dāng)終端確定待處理視頻幀包括人臉圖像時(shí),終端可執(zhí)行對(duì)待處理視頻幀進(jìn)行人臉表情識(shí)別步驟;當(dāng)終端確定待處理視頻幀不包括人臉圖像時(shí),終端即可對(duì)待處理視頻幀進(jìn)行編碼處理,生成視頻文件。
在本發(fā)明實(shí)施例中,目標(biāo)表情識(shí)別結(jié)果可以是用于描述人臉表情所表達(dá)的情緒信息,如“喜”、“怒”、“哀”、“樂”。進(jìn)一步的,為提高目標(biāo)表情識(shí)別結(jié)果精確性,目標(biāo)表情識(shí)別結(jié)果還可以包括“平靜”、“微笑”、“大笑”、“厭惡”、“害怕”以及“驚訝”等用于更精確描述表情的情緒信息。進(jìn)一步的,目標(biāo)表情識(shí)別結(jié)果還可以包括用于標(biāo)識(shí)人臉表情的情緒信息的標(biāo)識(shí)符,如終端預(yù)置表情識(shí)別結(jié)果包括標(biāo)識(shí)符“1”、“2”、“3”和“4”,終端可設(shè)置標(biāo)識(shí)符“1”用于標(biāo)識(shí)人臉表情的喜,終端可設(shè)置標(biāo)識(shí)符“2”用于標(biāo)識(shí)人臉表情的怒,終端可設(shè)置標(biāo)識(shí)符“3”用于標(biāo)識(shí)人臉表情的哀,終端可設(shè)置標(biāo)識(shí)符“4”用于標(biāo)識(shí)人臉表情的樂,當(dāng)然,終端還可以設(shè)置其他標(biāo)識(shí)符標(biāo)識(shí)人臉表情的其他的情緒信息,在此不進(jìn)行限制。
在本發(fā)明實(shí)施例中,終端對(duì)待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果即可以是終端可識(shí)別視頻幀中包括的人臉圖像上的情緒信息,具體可例如:當(dāng)待處理視頻幀如圖2中的終端在錄制視頻文件中界面所顯示的圖像時(shí),終端對(duì)待處理視頻幀進(jìn)行人臉表情識(shí)別后,獲得目標(biāo)表情識(shí)別結(jié)果可以是“笑”或者與“笑”相關(guān)的其他情緒信息,或者目標(biāo)表情識(shí)別結(jié)果還可以是用于標(biāo)識(shí)情緒信息“笑”或者與“笑”相關(guān)的其他情緒信息的標(biāo)識(shí)符。
S101,根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素。
在本發(fā)明實(shí)施例中,顯示元素可以包括:一個(gè)字母或字母組合、數(shù)字、圖形(如動(dòng)態(tài)圖片、靜態(tài)圖片、圖標(biāo)和表情符號(hào))等可在畫面上進(jìn)行顯示的元素。其中,終端可預(yù)置各種表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,如終端可預(yù)置表情識(shí)別結(jié)果為“笑”對(duì)應(yīng)一個(gè)笑臉圖片,預(yù)置表情識(shí)別結(jié)果為“哭”對(duì)應(yīng)一片烏云圖片,預(yù)置表情識(shí)別結(jié)果為“傷心”對(duì)應(yīng)字符為“傷心”等對(duì)應(yīng)關(guān)系。因此,當(dāng)終端獲取到目標(biāo)表情識(shí)別結(jié)果時(shí),終端可根據(jù)以上所描述的對(duì)應(yīng)關(guān)系,獲取目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素。進(jìn)一步的,終端不僅可預(yù)置一種表情識(shí)別結(jié)果對(duì)應(yīng)一種顯示元素的對(duì)應(yīng)關(guān)系,也可預(yù)置一種表情識(shí)別結(jié)果對(duì)應(yīng)多種顯示元素的對(duì)應(yīng)關(guān)系,在此不進(jìn)行限制。
S102,將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀。
在本發(fā)明實(shí)施例中,當(dāng)終端獲取到目標(biāo)顯示元素后,終端可將目標(biāo)顯示元素疊加在待處理視頻幀上的預(yù)置位置上進(jìn)行合成,獲得已處理視頻幀。其中,預(yù)置位置可以是待處理視頻幀上的人臉圖像的旁邊位置,或者待處理視頻幀上頂部位置或底部位置。進(jìn)一步的,預(yù)置位置還可以是:用戶針對(duì)顯示的待處理視頻幀進(jìn)行點(diǎn)擊輸入的點(diǎn)擊位置。
在具體應(yīng)用中,當(dāng)目標(biāo)顯示元素如圖3的示意圖所示時(shí),則終端將目標(biāo)顯示元素疊加在待處理視頻幀上的預(yù)置位置上進(jìn)行合成,獲得的已處理視頻幀在輸出顯示時(shí)的圖像畫面具體可如圖4的圖像畫面示意圖所示。
在本發(fā)明實(shí)施例中,當(dāng)終端是按預(yù)置的幀間隔對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,且終端采集到待處理視頻的后續(xù)待處理視頻幀時(shí),終端仍可將目標(biāo)顯示元素疊加在后續(xù)待處理視頻幀傷進(jìn)行合成,獲得后續(xù)已處理視頻幀,直至終端采集到的后續(xù)待處理視頻幀滿足預(yù)置的幀間隔。
S103,對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件。
在本發(fā)明實(shí)施例中,終端可獲取終端所支持的視頻編碼格式,如MPEG-1、MPEG-2、AVC等視頻編碼格式。從而終端可在所支持的視頻編碼格式中隨機(jī)獲取任意一種視頻編碼格式對(duì)已處理視頻幀進(jìn)行編碼處理,生成視頻文件,其中,視頻文件是可進(jìn)行保存以及發(fā)送的文件。
在本發(fā)明實(shí)施例中,終端還可在所支持的視頻編碼格式中獲取滿足預(yù)設(shè)條件的視頻編碼格式對(duì)已處理視頻幀進(jìn)行編碼處理,生成視頻文件。其中,滿足預(yù)設(shè)條件的視頻編碼格式具體可以是:壓縮率最高的視頻編碼格式,或者是無損壓縮的視頻編碼格式等,進(jìn)一步的,滿足預(yù)設(shè)條件的視頻編碼格式還可以滿足其他用戶指定的條件的視頻編碼格式,在此不進(jìn)行限制。
在本發(fā)明實(shí)施例中,終端可對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果,根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素,將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀,對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件,這可增加視頻文件的趣味性,提高視頻文件內(nèi)容的吸引力。
參見圖5,是本發(fā)明實(shí)施例提供的一種視頻文件的生成方法一種實(shí)施例流程示意圖。本發(fā)明實(shí)施例的一種視頻文件的生成方法包括如下步驟:
S200,對(duì)所述待處理視頻幀進(jìn)行人臉圖像分割,獲得人臉圖像。
在本發(fā)明實(shí)施例中,終端可首先對(duì)待處理視頻幀進(jìn)行圖像預(yù)處理,如對(duì)待處理視頻幀的大小和灰度進(jìn)行歸一化,以及對(duì)待處理視頻幀的人臉頭部姿態(tài)的矯正等處理,這可有效改善待處理視頻幀的質(zhì)量,消除待處理視頻幀噪聲,統(tǒng)一待處理視頻幀的灰度值及尺寸。當(dāng)將待處理視頻幀進(jìn)行預(yù)處理后,終端可對(duì)進(jìn)行預(yù)處理后的待處理視頻幀進(jìn)行人臉識(shí)別,以及人臉圖像分割,獲取人臉圖像。
S201,對(duì)所述人臉圖像進(jìn)行表情特征提取,獲得表情特征。
在本發(fā)明實(shí)施例中,表情特征提取具體可如終端對(duì)眼睛、眉毛、嘴巴等的位置變化進(jìn)行定位、測量,并確定其大小、距離、形狀及相互比例等參數(shù)作為表情特征。
S202,將所述表情特征與預(yù)置的至少一個(gè)表情特征模板進(jìn)行匹配,獲得與所述表情特征相匹配的目標(biāo)表情特征模板。
在本發(fā)明實(shí)施例中,終端可將獲得的所有表情特征分別與預(yù)置的多個(gè)表情特征目標(biāo)進(jìn)行匹配,并獲取匹配度最高的表情特征模板作為與表情特征相匹配的目標(biāo)表情特征目標(biāo)。
S203,根據(jù)預(yù)置的表情特征模板與目標(biāo)表情識(shí)別結(jié)果的對(duì)應(yīng)關(guān)系,獲得所述目標(biāo)表情特征模板所對(duì)應(yīng)的目標(biāo)表情識(shí)別結(jié)果。
在本發(fā)明實(shí)施例中,終端可預(yù)置表情特征目標(biāo)與目標(biāo)表親識(shí)別結(jié)果的對(duì)應(yīng)關(guān)系。
S204,根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素。
S205,將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀。
S206,對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件。
在本發(fā)明實(shí)施例中,步驟S204、步驟S205和步驟S206的具體實(shí)施方式可參見上述實(shí)施例中的步驟S101、步驟S102和步驟S103的具體實(shí)施方式,在此不進(jìn)行贅述。
在本發(fā)明實(shí)施例中,終端可對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果,根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素,將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀,對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件,這可增加視頻文件的趣味性,提高視頻文件內(nèi)容的吸引力。
參見圖6,是本發(fā)明實(shí)施例提供的一種視頻文件的生成方法一種實(shí)施例流程示意圖。本發(fā)明實(shí)施例的一種視頻文件的生成方法包括如下步驟:
S300,對(duì)所述待處理視頻幀進(jìn)行人臉圖像分割,獲得人臉圖像。
在本發(fā)明實(shí)施例中,終端可首先對(duì)待處理視頻幀進(jìn)行圖像預(yù)處理,如對(duì)待處理視頻幀的大小和灰度進(jìn)行歸一化,以及對(duì)待處理視頻幀的人臉頭部姿態(tài)的矯正等處理,這可有效改善待處理視頻幀的質(zhì)量,消除待處理視頻幀噪聲,統(tǒng)一待處理視頻幀的灰度值及尺寸。當(dāng)將待處理視頻幀進(jìn)行預(yù)處理后,終端可對(duì)進(jìn)行預(yù)處理后的待處理視頻幀進(jìn)行人臉識(shí)別,以及人臉圖像分割,獲取人臉圖像。
S301,將所述人臉圖像輸入至預(yù)置的表情識(shí)別模型中進(jìn)行人臉表情識(shí)別。
在本發(fā)明實(shí)施例中,為提高表情識(shí)別準(zhǔn)確度,終端可構(gòu)造表情識(shí)別模型。表情識(shí)別模型可以是用于輸出目標(biāo)表情識(shí)別結(jié)果的人臉表情識(shí)別公式,人臉圖像是其中的自變量,終端可根據(jù)自變量的每個(gè)表情特征在人臉表情識(shí)別中所占比重的大小調(diào)整其對(duì)應(yīng)的權(quán)值系數(shù),生成人臉表情識(shí)別公式。
在本發(fā)明實(shí)施例中,終端可根據(jù)預(yù)置的人臉樣本圖像和人臉樣本圖像的表情識(shí)別結(jié)果進(jìn)行訓(xùn)練,生成待調(diào)整表情識(shí)別模型,其中,終端可將人臉樣本圖像作為自變量、人臉樣本圖像的表情識(shí)別結(jié)果作為因變量進(jìn)行訓(xùn)練,生成待調(diào)整表情識(shí)別模型。為提高表情識(shí)別模型的穩(wěn)定性,終端可對(duì)待調(diào)整表情識(shí)別模型進(jìn)行測試調(diào)整,獲得表情識(shí)別模型。其中,終端對(duì)待調(diào)整表情識(shí)別模型進(jìn)行測試調(diào)整,獲得表情識(shí)別模型具體可以是:終端將預(yù)置的人臉測試圖像和人臉測試圖像的表情識(shí)別結(jié)果輸入至待調(diào)整表情識(shí)別模型中,以使待調(diào)整表情識(shí)別模型根據(jù)輸入的信息進(jìn)一步調(diào)整與人臉圖像相關(guān)的因變量的權(quán)值系數(shù)或者運(yùn)算方式,獲得表情識(shí)別模型,有效提高表情識(shí)別的準(zhǔn)確性。
S302,獲取所述表情識(shí)別模型輸出的目標(biāo)表情識(shí)別結(jié)果。
S303,根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素。
S304,將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀。
S305,對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件。
在本發(fā)明實(shí)施例中,步驟S303、步驟S304和步驟S305的具體實(shí)施方式可參見上述實(shí)施例中的步驟S101、步驟S102和步驟S103的具體實(shí)施方式,在此不進(jìn)行贅述。
在本發(fā)明實(shí)施例中,終端可對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果,根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素,將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀,對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件,這可增加視頻文件的趣味性,提高視頻文件內(nèi)容的吸引力。
下面將結(jié)合附圖7-附圖9,對(duì)本發(fā)明實(shí)施例提供的終端進(jìn)行詳細(xì)介紹。需要說明的是,附圖7-附圖9所示的終端,用于執(zhí)行本發(fā)明附圖1-附圖6所示實(shí)施例的方法,為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,具體技術(shù)細(xì)節(jié)未揭示的,請(qǐng)參照本發(fā)明圖1-圖6所示的實(shí)施例。
請(qǐng)參見圖7,為本發(fā)明實(shí)施例提供了一種終端的結(jié)構(gòu)示意圖。如圖7所示,本發(fā)明實(shí)施例的所述終端可以包括:
識(shí)別單元100,用于對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果;
獲取單元200,用于根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素;
合成單元300,用于將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀;
生成單元400,用于對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件。
其中,可以理解的是,本實(shí)施例的終端中的單元的各功能模塊的功能可根據(jù)圖1-圖6所述的方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過程可以參照上述方法實(shí)施例的相關(guān)描述,此處不再進(jìn)行贅述。
在本發(fā)明實(shí)施例中,終端可對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果,根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素,將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀,對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件,這可增加視頻文件的趣味性,提高視頻文件內(nèi)容的吸引力。
請(qǐng)參見圖8,為本發(fā)明實(shí)施例提供了一種終端的結(jié)構(gòu)示意圖。如圖8所示,本發(fā)明實(shí)施例的所述終端可以包括:
識(shí)別單元100、獲取單元200、合成單元300和生成單元400。
其中,所述終端包括:
采集單元500,用于當(dāng)接收到生成視頻文件的操作指令時(shí),通過攝像頭采集用于生成視頻文件的待處理視頻幀。
其中,所述終端包括:
判斷單元600,用于判斷所述待處理視頻幀是否包括人臉圖像;
當(dāng)所述判斷單元判斷所述待處理視頻幀包括人臉圖像時(shí),通知所述識(shí)別單元對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果。
其中,所述識(shí)別單元100包括:
采集子單元10,用于按預(yù)置的幀間隔在采集到的所述待處理視頻幀中獲取目標(biāo)待處理視頻幀;
識(shí)別子單元20,用于對(duì)所述目標(biāo)待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果。
其中,所述識(shí)別單元100包括:
第一分割子單元30,用于對(duì)所述待處理視頻幀進(jìn)行人臉圖像分割,獲得人臉圖像;
特征提取子單元40,用于對(duì)所述人臉圖像進(jìn)行表情特征提取,獲得表情特征;
匹配子單元50,用于將所述表情特征與預(yù)置的至少一個(gè)表情特征模板進(jìn)行匹配,獲得與所述表情特征相匹配的目標(biāo)表情特征模板;
第一獲取子單元60,用于根據(jù)預(yù)置的表情特征模板與目標(biāo)表情識(shí)別結(jié)果的對(duì)應(yīng)關(guān)系,獲得所述目標(biāo)表情特征模板所對(duì)應(yīng)的目標(biāo)表情識(shí)別結(jié)果。
其中,所述識(shí)別單元100包括:
第二分割子單元70,用于對(duì)所述待處理視頻幀進(jìn)行人臉圖像分割,獲得人臉圖像;
輸入子單元80,用于將所述人臉圖像輸入至預(yù)置的表情識(shí)別模型中進(jìn)行人臉表情識(shí)別;
第二獲取子單元90,用于獲取所述表情識(shí)別模型輸出的目標(biāo)表情識(shí)別結(jié)果。
其中,所述合成單元300包括:
第三獲取子單元91,用于獲取用戶針對(duì)顯示的所述待處理視頻幀進(jìn)行點(diǎn)擊輸入的點(diǎn)擊位置;
合成子單元92,用于將所述目標(biāo)顯示元素疊加在所述待處理視頻幀中的所述點(diǎn)擊位置上進(jìn)行合成,獲得已處理視頻幀。
其中,所述生成單元400包括:
第四獲取子單元93,用于獲取所述終端所支持的視頻編碼格式;
編碼子單元94,用于按所述視頻編碼格式對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件。
其中,可以理解的是,本實(shí)施例的終端中的單元的各功能模塊的功能可根據(jù)圖1-圖6所述的方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過程可以參照上述方法實(shí)施例的相關(guān)描述,此處不再進(jìn)行贅述。
在本發(fā)明實(shí)施例中,終端可對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果,根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素,將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀,對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件,這可增加視頻文件的趣味性,提高視頻文件內(nèi)容的吸引力。
請(qǐng)參見圖9,為本發(fā)明實(shí)施例提供了一種終端的結(jié)構(gòu)示意圖。如圖9所示,終端1000可以包括:至少一個(gè)處理器1001,例如CPU,至少一個(gè)網(wǎng)絡(luò)接口1004,用戶接口1003,存儲(chǔ)器1005,至少一個(gè)通信總線1002。其中,通信總線1002用于實(shí)現(xiàn)這些組件之間的連接通信。其中,用戶接口1003可以包括顯示屏(Display)、鍵盤(Keyboard),可選用戶接口1003還可以包括標(biāo)準(zhǔn)的有線接口、無線接口。網(wǎng)絡(luò)接口1004可選的可以包括標(biāo)準(zhǔn)的有線接口、無線接口(如WI-FI接口)。存儲(chǔ)器1005可以是高速RAM存儲(chǔ)器,也可以是非不穩(wěn)定的存儲(chǔ)器(non-volatile memory),例如至少一個(gè)磁盤存儲(chǔ)器。存儲(chǔ)器1005可選的還可以是至少一個(gè)位于遠(yuǎn)離前述處理器1001的存儲(chǔ)裝置。如圖9所示,作為一種計(jì)算機(jī)存儲(chǔ)介質(zhì)的存儲(chǔ)器1005中可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊、用戶接口模塊以及通信連接應(yīng)用程序。
在圖9所示的終端1000中,用戶接口1003主要用于為用戶提供輸入的接口,獲取用戶輸入的數(shù)據(jù);網(wǎng)絡(luò)接口1004用于與新聞服務(wù)器相連接,獲取新聞服務(wù)器發(fā)送的數(shù)據(jù);而處理器1001可以用于調(diào)用存儲(chǔ)器1005中存儲(chǔ)的通信連接應(yīng)用程序,并具體執(zhí)行以下操作:
對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果;
根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素;
將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀;
對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件。
其中,在所述處理器1001對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果之前,所述處理器1001還執(zhí)行:
當(dāng)接收到生成視頻文件的操作指令時(shí),通過攝像頭采集用于生成視頻文件的待處理視頻幀。
其中,在所述處理器1001對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果之前,所述處理器1001還執(zhí)行:
判斷所述待處理視頻幀是否包括人臉圖像;
當(dāng)判斷所述待處理視頻幀包括人臉圖像時(shí),執(zhí)行所述對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果步驟。
其中,所述處理器1001對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果包括:
按預(yù)置的幀間隔在采集到的所述待處理視頻幀中獲取目標(biāo)待處理視頻幀;
對(duì)所述目標(biāo)待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果。
其中,所述處理器1001對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果包括:
對(duì)所述待處理視頻幀進(jìn)行人臉圖像分割,獲得人臉圖像;
對(duì)所述人臉圖像進(jìn)行表情特征提取,獲得表情特征;
將所述表情特征與預(yù)置的至少一個(gè)表情特征模板進(jìn)行匹配,獲得與所述表情特征相匹配的目標(biāo)表情特征模板;
根據(jù)預(yù)置的表情特征模板與目標(biāo)表情識(shí)別結(jié)果的對(duì)應(yīng)關(guān)系,獲得所述目標(biāo)表情特征模板所對(duì)應(yīng)的目標(biāo)表情識(shí)別結(jié)果。
其中,所述處理器1001對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果包括:
對(duì)所述待處理視頻幀進(jìn)行人臉圖像分割,獲得人臉圖像;
將所述人臉圖像輸入至預(yù)置的表情識(shí)別模型中進(jìn)行人臉表情識(shí)別;
獲取所述表情識(shí)別模型輸出的目標(biāo)表情識(shí)別結(jié)果。
其中,所述處理器1001將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀包括:
獲取用戶針對(duì)顯示的所述待處理視頻幀進(jìn)行點(diǎn)擊輸入的點(diǎn)擊位置;
將所述目標(biāo)顯示元素疊加在所述待處理視頻幀中的所述點(diǎn)擊位置上進(jìn)行合成,獲得已處理視頻幀。
其中,所述處理器1001對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件包括:
獲取所述終端所支持的視頻編碼格式;
按所述視頻編碼格式對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件。
其中,可以理解的是,本實(shí)施例的終端中的單元的各功能模塊的功能可根據(jù)圖1-圖6所述的方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過程可以參照上述方法實(shí)施例的相關(guān)描述,此處不再進(jìn)行贅述。
在本發(fā)明實(shí)施例中,終端可對(duì)用于生成視頻文件的待處理視頻幀進(jìn)行人臉表情識(shí)別,獲得目標(biāo)表情識(shí)別結(jié)果,根據(jù)預(yù)置的表情識(shí)別結(jié)果與顯示元素的對(duì)應(yīng)關(guān)系,獲取所述目標(biāo)表情識(shí)別結(jié)果對(duì)應(yīng)的目標(biāo)顯示元素,將所述目標(biāo)顯示元素疊加在所述待處理視頻幀上進(jìn)行合成,獲得已處理視頻幀,對(duì)所述已處理視頻幀進(jìn)行編碼處理,生成視頻文件,這可增加視頻文件的趣味性,提高視頻文件內(nèi)容的吸引力。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(Read-Only Memory,ROM)或隨機(jī)存儲(chǔ)記憶體(Random Access Memory,RAM)等。
以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。