一種信息處理方法以及信息處理裝置的制造方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及電子技術(shù)領(lǐng)域,尤其涉及一種信息處理方法以及信息處理裝置。
【背景技術(shù)】
[0002]隨著科學技術(shù)的不斷發(fā)展,電子技術(shù)也得到了飛速的發(fā)展,電子產(chǎn)品的種類也越來越多,人們也享受到了科技發(fā)展帶來的各種便利。例如,光場相機在主透鏡與感光器陣列之間,設(shè)置了一個微型透鏡陣列,光線集合從主透鏡經(jīng)每個微透鏡傳送到感光器前,析出聚焦光線及將光線資料轉(zhuǎn)換,以數(shù)碼方式記下,這個系統(tǒng)可以捕捉相關(guān)場景光線的所有方向的信息,因此它在拍攝完成后可以“聚焦”照片中的任何深度,使用者可以更快地完成拍照,即便非專業(yè)攝影師也不必擔心對焦問題,特別是在攝錄視頻文件的時候,光場相機具有普通相機無法達到的優(yōu)點,普通相機拍攝視頻的時候,若焦點不正確,則無法對視頻文件進行修改,而光場相機由于能夠先拍照后進行對焦,所以在視頻文件拍攝完成后對視頻文件的焦點進行修改,使得該視頻文件能夠滿足用戶的需求,因此光場相機因為這種先拍照后對焦的特點在越來越多的場合被使用。
[0003]但是,光場相機攝錄獲得的視頻文件沒有焦點,不便于預覽,需要用戶在為視頻文件設(shè)置對應(yīng)的焦點,才能夠形成滿足用戶預覽需求的預覽視頻文件。用戶在為視頻文件設(shè)置對應(yīng)的焦點時,會耗費一定的時間,在一些實時性要求特別高的場合,例如視頻電話會議等等場合,本地會議室的光場相機攝錄的視頻文件傳輸給遠端會議室的時候沒有焦點,遠端會議室就無法及時地觀看本地會議室的光場相機攝錄的視頻文件。
[0004]因此,現(xiàn)有技術(shù)中存在由于光場相機攝錄獲得的視頻文件沒有焦點,不便于預覽的技術(shù)問題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實施例通過提供一種信息處理方法以及信息處理裝置,用以解決現(xiàn)有技術(shù)中存在的由于光場相機攝錄獲得的視頻文件沒有焦點,不便于預覽的技術(shù)問題。
[0006]第一方面,本發(fā)明實施例提供一種信息處理方法,包括:獲取光場攝像單元攝錄的視頻文件;根據(jù)所述視頻文件中的音頻信息和/或人臉信息,確定所述視頻文件中光場圖像幀的焦點;基于已確定焦點的光場圖像幀,生成所述視頻文件的預覽視頻文件。
[0007]結(jié)合第一方面,在第一種可能的實現(xiàn)方式中,所述視頻文件為一視頻會議的視頻文件;所述根據(jù)所述視頻文件中的音頻信息和/或人臉信息,確定所述視頻文件中光場圖像幀的焦點,具體包括:通過對所述光場圖像幀進行人臉識別,確定所述光場圖像幀中的參會者所在的位置;根據(jù)參會者所在的位置,并通過所述視頻文件中的音頻信息和/或唇動識別,確定參會者中的講話者所在的位置;將所述講話者所在的位置確定為所述視頻文件中光場圖像幀的焦點。
[0008]結(jié)合第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,所述通過所述視頻文件中的音頻信息,確定參會者中的講話者所在的位置,具體包括:對所述視頻文件中的音頻信息進行分析,確定所述講話者所在的位置,所述音頻信息由一麥克風陣列在所述光場攝像單元攝錄所述視頻文件時同步獲得。
[0009]結(jié)合第一種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,所述通過唇動識別,確定參會者中的講話者所在的位置,具體包括:對所述光場圖像幀進行唇動識別,并根據(jù)唇動識別的結(jié)果,確定所述光場圖像幀中唇動的人臉所在的位置;確定所述唇動的人臉所在的位置為所述講話者所在的位置。
[0010]結(jié)合第一種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,所述通過所述視頻文件中的音頻信息和唇動識別,確定參會者中的講話者所在的位置,具體包括:對所述音頻信息進行分析,獲得所述光場圖像幀對應(yīng)的最強聲音;對所述光場圖像幀進行唇動識別,并根據(jù)唇動識別的結(jié)果,確定所述光場圖像幀中唇動的人臉;匹配所述最強聲音與所述唇動的人臉的唇部動作,確定與所述最強聲音匹配的唇動的人臉所在的位置為所述講話者所在的位置。
[0011]第二方面,本發(fā)明實施例提供一種信息處理裝置,包括:光場攝像單元,用于攝錄視頻文件;處理單元,用于獲取光場攝像單元攝錄的視頻文件,并根據(jù)所述視頻文件中的音頻信息和/或人臉信息,確定所述視頻文件中光場圖像幀的焦點,并基于已確定焦點的光場圖像幀,生成所述視頻文件的預覽視頻文件。
[0012]結(jié)合第二方面,在第一種可能的實現(xiàn)方式中,所述視頻文件為一視頻會議的視頻文件,所述處理單元具體用于通過對所述光場圖像幀進行人臉識別,確定所述光場圖像幀中的參會者所在的位置,并根據(jù)參會者所在的位置,并通過所述視頻文件中的音頻信息和/或唇動識別,確定參會者中的講話者所在的位置,并將所述講話者所在的位置確定為所述視頻文件中光場圖像幀的焦點。
[0013]結(jié)合第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,所述處理單元具體用于對所述視頻文件中的音頻信息進行分析,確定所述講話者所在的位置,所述音頻信息由一麥克風陣列在所述光場攝像單元攝錄所述視頻文件時同步獲得。
[0014]結(jié)合第一種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,所述處理單元具體用于對所述光場圖像幀進行唇動識別,并根據(jù)唇動識別的結(jié)果,確定所述光場圖像幀中唇動的人臉所在的位置,并確定所述唇動的人臉所在的位置為所述講話者所在的位置。
[0015]結(jié)合第一種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,所述處理單元具體用于對所述音頻信息進行分析,獲得所述光場圖像幀對應(yīng)的最強聲音,并對所述光場圖像幀進行唇動識別,并根據(jù)唇動識別的結(jié)果,確定所述光場圖像幀中唇動的人臉,并匹配所述最強聲音與所述唇動的人臉的唇部動作,確定與所述最強聲音匹配的唇動的人臉所在的位置為所述講話者所在的位置。
[0016]第三方面,本發(fā)明實施例還提供一種通信終端,包括:光場攝像單元,用于攝錄一通信場景的視頻文件;處理單元,與所述光場攝像單元相連,用于確定視頻文件中光場圖像幀的焦點,并基于已確定焦點的光場圖像幀,生成視頻文件的預覽視頻文件。
[0017]本發(fā)明實施例中提供的一個或多個技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點:
[0018]由于采用了獲取光場攝像單元攝錄的視頻文件,并確定視頻文件中光場圖像幀的焦點,并基于已確定焦點的光場圖像幀,生成視頻文件的預覽視頻文件的技術(shù)方案,所生成的視頻文件的預覽視頻文件中的光場圖像幀是具有焦點的,也即該預覽視頻文件能夠方便地供用戶預覽,所以解決了現(xiàn)有技術(shù)中存在的由于光場相機攝錄獲得的視頻文件沒有焦點,不便于預覽的技術(shù)問題,實現(xiàn)了將光場相機攝錄的視頻文件轉(zhuǎn)換為具有焦點的預覽視頻文件,從而便于預覽的技術(shù)效果。
【附圖說明】
[0019]圖1為本發(fā)明實施例提供的信息處理方法的流程圖;
[0020]圖2為本發(fā)明實施例提供的通過視頻文件中的音頻信息,確定參會者中的講話者所在的位置的示意圖;
[0021]圖3為本發(fā)明實施例提供的通過唇動識別,確定參會者中的講話者所在的位置的示意圖;
[0022]圖4為本發(fā)明實施例提供的通過視頻文件中的音頻信息和唇動識別,確定參會者中的講話者所在的位置的示意圖;
[0023]圖5為本發(fā)明實施例提供的通信終端的功能模塊圖;
[0024]圖6為本發(fā)明實施例提供的信息處理裝置的功能模塊圖。
【具體實施方式】
[0025]本發(fā)明實施例通過提供一種信息處理方法以及信息處理裝置,用以解決現(xiàn)有技術(shù)中存在的由于光場相機攝錄獲得的視頻文件沒有焦點,不便于預覽的技術(shù)問題。
[0026]本發(fā)明實施例中的技術(shù)方案為解決上述技術(shù)問題,總體思路如下:
[0027]本發(fā)明實施例提供一種信息處理方