一種視頻音頻采集方法
【專利摘要】本發(fā)明涉及一種視頻音頻采集方法,具有全息音頻采集裝置,全息音頻采集裝置包括麥克風(fēng)單元、采集信號處理模塊、全息聲場信號處理單元、信源編碼模塊,麥克風(fēng)單元采集三維聲場信號,采集信號處理模塊對采集信號進行處理并轉(zhuǎn)換成數(shù)字信號,前述數(shù)字信號輸入至全息聲場信號處理單元,全息聲場信號處理單元對聲場信號進行處理,處理后的信號經(jīng)信源編碼壓縮后,通過網(wǎng)絡(luò)發(fā)送至視頻采集裝置。
【專利說明】一種視頻音頻采集方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及一種視頻音頻采集方法。
【背景技術(shù)】
[0002]現(xiàn)有技術(shù)中,在很多設(shè)備視頻錄制回放中是沒有聲場的采集回放及控制功能的,導(dǎo)致視頻體驗整體不佳。通常的情況是,與視頻采集相伴的是單聲道或者普通立體聲采集,雖然視頻已經(jīng)在很多設(shè)備上具備了高清的解析度,但聲場的解析度遠(yuǎn)遠(yuǎn)達(dá)不到很高的臨場感。
[0003]傳統(tǒng)攝像機一般注重高質(zhì)量視頻的拍攝,對于聲音的采集,一般情況下其內(nèi)置的麥克風(fēng)聲音質(zhì)量不高,外置的麥克風(fēng)可以提供高一些的質(zhì)量,但是空間解析能力不行。近來出現(xiàn)的空間環(huán)繞聲膠囊麥克風(fēng)可以為攝像機提供一些空間聲場解析能力,但整體而言空間解析力還非常弱,空間定位能力較差。
[0004]目前以手機為代表的移動設(shè)備爆發(fā)增長,基于手機的視頻拍攝甚至也到了高清,但基于其內(nèi)置單通道或者雙通道麥克風(fēng)錄制的聲音質(zhì)量非常差,當(dāng)然,后來也出現(xiàn)了一些手機的錄音配件,可以提供高點的錄音質(zhì)量,但是空間解析能力仍然很差。
[0005]在視頻監(jiān)控領(lǐng)域,大都是只有視頻沒有音頻,即使少部分視頻監(jiān)控設(shè)備有了音頻采集的能力,但是一直沒有很好地聲音定位能力,而在視頻監(jiān)控領(lǐng)域聲音定位能力是十分重要的。
[0006]除了手機,近來穿戴式設(shè)備也日益流行,其中基于眼鏡的視頻拍攝也非常流行,其中的音頻采集質(zhì)量也是特別的差。
[0007]綜上所述,當(dāng)前幾種典型的視頻采集裝置的聲音質(zhì)量,特別是空間解析質(zhì)量很差。
[0008]傳統(tǒng)錄音方法包括單麥克錄音、立體聲錄音(AB、XY、MS、0RTF)。單麥克錄音最為簡便,但是聲場也最為單調(diào);立體聲錄音的初衷是營造更為豐富的立體聲場,在麥克風(fēng)配置上出現(xiàn)了多種多樣的方式,都是試圖模擬人的兩耳對聲音的感知特性,比如延時、幅度差異、相位等,然而只是靠麥克風(fēng)擺放位置是難以達(dá)到模擬真正的人耳感知的。仿真人頭錄音能夠?qū)崿F(xiàn)浸入式三維聲場的逼真體現(xiàn),但目前主要還是存在于一些專業(yè)實驗室作為測試工具使用,對于廣泛的音頻視頻錄制來說,一是極為不方便使用,同時也是極為昂貴的(包含仿真人頭、錄音設(shè)備、處理設(shè)備等一套需要100萬歐元左右),另外,目前的仿真人頭主要應(yīng)用于通信器材的測試,并非為了人耳立體聲場感知的目的制作的,它的質(zhì)地、結(jié)構(gòu)與真實人頭還是存在很大的差異,這些差異會最終影響所錄制的聲場效果。
[0009]另一方面,移動寬帶的迅猛發(fā)展,普通消費者的手機、平板電腦等常用工具除了打電話之外都有了音頻視頻錄制能力,以及很多的數(shù)碼產(chǎn)品諸如錄音筆、可攝像的相機等大多數(shù)情況下這些設(shè)備都是基于內(nèi)部麥克風(fēng)來錄制聲音的,這些內(nèi)置麥克風(fēng)一方面音質(zhì)比較差,同時聲場展現(xiàn)能力也非常差。
[0010]目前也出現(xiàn)了一些為手機等設(shè)備提供立體聲錄音的接口設(shè)備,這些設(shè)備接口離上述專業(yè)立體聲麥克風(fēng)還有很大距離,更談不上浸入式三維聲場了。
【發(fā)明內(nèi)容】
[0011]本發(fā)明的發(fā)明目的在于提供一種視頻音頻采集方法,能夠為視頻裝置采集全息聲場信號。
[0012]實現(xiàn)本發(fā)明目的的技術(shù)方案:
一種視頻音頻采集方法,其特征在于:具有全息音頻采集裝置,全息音頻采集裝置包括麥克風(fēng)單元、采集信號處理模塊、全息聲場信號處理單元、信源編碼模塊,麥克風(fēng)單元采集三維聲場信號,采集信號處理模塊對采集信號進行處理并轉(zhuǎn)換成數(shù)字信號,前述數(shù)字信號輸入至全息聲場信號處理單兀,全息聲場信號處理單兀對聲場信號進行處理,處理后的信號經(jīng)信源編碼壓縮后,通過網(wǎng)絡(luò)發(fā)送至視頻采集裝置。
[0013]視頻采集裝置包括攝像頭單元和視頻采集信號處理單元,攝像頭單元采集的信號輸入至視頻采集信號處理單元,視頻信號采集處理單元通過網(wǎng)絡(luò)接收全息音頻采集裝置傳送的信號。
[0014]全息音頻采集裝置和視頻采集裝置呈一體,全息音頻采集裝置的信源編碼模塊與視頻采集裝置的視頻采集信號處理單元連接,全息音頻采集裝置輸出的信號直接傳送至視頻采集裝置。
[0015]視頻采集裝置可將視頻信號和全息聲場信號通過網(wǎng)絡(luò)發(fā)送至遠(yuǎn)端的設(shè)備。
[0016]視頻采集裝置可以是手機、攝像機、監(jiān)控攝像頭或者是可進行視頻拍攝的眼鏡。
[0017]本發(fā)明具有的有益效果:
本發(fā)明具有全息音頻采集裝置,全息音頻采集裝置包括麥克風(fēng)單元、采集信號處理模塊、全息聲場信號處理單元、信源編碼模塊,麥克風(fēng)單元采集三維聲場信號,全息聲場信號處理單元對聲場信號進行處理,處理后的信號經(jīng)信源編碼壓縮后,可以通過網(wǎng)絡(luò)發(fā)送至視頻采集裝置。全息音頻采集裝置和視頻采集裝置也可以呈一體,全息音頻采集裝置輸出的信號直接傳送至視頻采集裝置。本發(fā)明通過全息音頻采集裝置為視頻裝置采集全息聲場信號,有效提高視頻采集裝置的音頻品質(zhì)。本發(fā)明視頻采集裝置可以是手機、攝像機、監(jiān)控攝像頭或者是可進行視頻拍攝的眼鏡,視頻采集裝置可將視頻信號和全息聲場信號通過網(wǎng)絡(luò)發(fā)送至遠(yuǎn)端的設(shè)備,進一步方便用戶的使用。
【專利附圖】
【附圖說明】
[0018]圖1是本發(fā)明全息音頻采集裝置與視頻采集裝置通過網(wǎng)絡(luò)連接時的電路原理框圖;
圖2是本發(fā)明本發(fā)明全息音頻采集裝置與視頻采集裝置呈一體時的電路原理框圖;
圖3是實施例一的工作狀態(tài)示意圖;
圖4是實施例二的工作狀態(tài)示意圖;
圖5是實施例三的工作狀態(tài)示意圖。
【具體實施方式】
[0019]如圖1所示,全息音頻采集裝置包括麥克風(fēng)單元、采集信號處理模塊、全息聲場信號處理單元、信源編碼模塊,麥克風(fēng)單元包括基于耳機的或者基于人工頭的,但不限于此。麥克風(fēng)單元采集三維聲場信號,采集信號處理模塊對采集信號進行處理并轉(zhuǎn)換成數(shù)字信號,前述數(shù)字信號輸入至全息聲場信號處理單兀,全息聲場信號處理單兀對聲場信號進行處理,處理后的信號經(jīng)信源編碼壓縮后,通過網(wǎng)絡(luò)發(fā)送至視頻采集裝置。視頻采集裝置包括攝像頭單元和視頻采集信號處理單元,攝像頭單元采集的信號輸入至視頻采集信號處理單元,視頻信號采集處理單元通過網(wǎng)絡(luò)接收全息音頻采集裝置傳送的信號。視頻采集裝置可將視頻信號和全息聲場信號通過網(wǎng)絡(luò)發(fā)送至遠(yuǎn)端的設(shè)備。
[0020]如圖2所示,全息音頻采集裝置和視頻采集裝置可以呈一體,全息音頻采集裝置的信源編碼模塊與視頻采集裝置的視頻采集信號處理單元連接,全息音頻采集裝置輸出的信號直接傳送至視頻采集裝置。
[0021]視頻采集裝置可將視頻信號和全息聲場信號通過網(wǎng)絡(luò)發(fā)送至遠(yuǎn)端的設(shè)備。
[0022]視頻采集裝置可以是手機、攝像機、監(jiān)控攝像頭或者是可進行視頻拍攝的眼鏡。
[0023]實施例一,如圖3所示,視頻采集裝置是手機I。手機的視頻錄制,不使用手機內(nèi)置麥克風(fēng),而使用全息音頻錄音麥克風(fēng),即視頻的音軌是全息音頻。全息音頻采集裝置2通過網(wǎng)絡(luò)將全息聲場信號傳送至手機。手機I還可拍攝照片,同時配有全息音頻麥克風(fēng)錄制的聲場音頻信息。所拍攝包含全息聲場的視頻可以存儲于手機1,也可以通過網(wǎng)絡(luò)傳輸?shù)竭h(yuǎn)端用戶進行欣賞。當(dāng)存儲在手機I時,可以通過手機軟件進行回放,讓用戶欣賞帶有包含全息聲場的視頻。
[0024]實施例二,如圖4所示,視頻裝置是可進行視頻拍攝的眼鏡,可采集三維聲場信號的麥克風(fēng)3設(shè)置于眼鏡上,全息音頻采集裝置和視頻采集裝置呈一體。全息聲場的采集是基于眼鏡腿上的全息麥克風(fēng)3進行的。對于眼鏡的控制及音視頻錄制的存儲既可以在眼鏡上直接進行,也可以通過手機4進行。眼鏡也可以沒有攝像頭或者不用攝像頭,此時可以借助全息聲場麥克風(fēng)進行聲場錄制。當(dāng)用來進行視頻或照片的拍攝時,可以基于位置A的攝像頭(這個攝像頭可以在左邊也可以在右邊,也可以左右兩邊都有)進行拍攝,也可以基于位置B的攝像頭拍攝,也可以基于位置C的攝像頭進行拍攝。所拍攝包含全息聲場的視頻或照片既可以存儲在眼鏡或手機上,也可以通過網(wǎng)絡(luò)傳輸?shù)竭h(yuǎn)端用戶進行實時或離線的欣貝ο
[0025]實施例三,如圖5所示,視頻采集裝置是監(jiān)控攝像頭5,全息音頻采集裝置和視頻采集裝置呈一體。把全息聲場加入傳統(tǒng)視頻監(jiān)控之后,就可以進行帶有全息聲場定位的視頻監(jiān)控了,監(jiān)控攝像頭采集監(jiān)控視頻,全息聲場麥克風(fēng)6同步采集全息聲場,然后統(tǒng)一編碼成視頻流通過網(wǎng)絡(luò)傳輸?shù)竭h(yuǎn)端。監(jiān)控攝像頭5所具有的云臺轉(zhuǎn)動功能要求全息聲場麥克風(fēng)6與攝像頭同步轉(zhuǎn)動。
【權(quán)利要求】
1.一種視頻音頻采集方法,其特征在于:具有全息音頻采集裝置,全息音頻采集裝置包括麥克風(fēng)單元、采集信號處理模塊、全息聲場信號處理單元、信源編碼模塊,麥克風(fēng)單元采集三維聲場信號,采集信號處理模塊對采集信號進行處理并轉(zhuǎn)換成數(shù)字信號,前述數(shù)字信號輸入至全息聲場信號處理單兀,全息聲場信號處理單兀對聲場信號進行處理,處理后的信號經(jīng)信源編碼壓縮后,通過網(wǎng)絡(luò)發(fā)送至視頻采集裝置。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:視頻采集裝置包括攝像頭單元和視頻采集信號處理單元,攝像頭單元采集的信號輸入至視頻采集信號處理單元,視頻信號采集處理單元通過網(wǎng)絡(luò)接收全息音頻采集裝置傳送的信號。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于:全息音頻采集裝置和視頻采集裝置呈一體,全息音頻采集裝置的信源編碼模塊與視頻采集裝置的視頻采集信號處理單元連接,全息音頻采集裝置輸出的信號直接傳送至視頻采集裝置。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于:視頻采集裝置可將視頻信號和全息聲場信號通過網(wǎng)絡(luò)發(fā)送至遠(yuǎn)端的設(shè)備。
5.根據(jù)權(quán)利要求1至4任何一項所述的方法,其特征在于:視頻采集裝置可以是手機、攝像機、監(jiān)控攝像頭或者是可進行視頻拍攝的眼鏡。
【文檔編號】H04N7/18GK104168465SQ201410440366
【公開日】2014年11月26日 申請日期:2014年9月1日 優(yōu)先權(quán)日:2014年9月1日
【發(fā)明者】張德明 申請人:北京塞賓科技有限公司