專利名稱:視頻采集方法
技術領域:
本發(fā)明涉及一種視頻采集方法。
背景技術:
視頻采集(Video Capture)主要作用是把模擬視頻轉換成數(shù)字視頻,并按數(shù)字視頻文件的格式保存下來。所謂視頻采集就是將模擬攝像機、錄像機、LD視盤機、電視機輸出的視頻信號,通過專用的模擬、數(shù)字轉換設備,轉換為二進制數(shù)字信息的過程。數(shù)字采集設備,如電腦攝像頭,由于受到攝像頭與電腦之間的信息傳輸速度和能力的制約,往往無法同時保證獲得令人滿意的清晰度和刷新速度。如果用戶要得到較高的分辨率,往往要忍受較低的幀率,使得顯示畫面看起來很“卡”;而如果追求流暢的畫面,則往往要接受比較低劣的畫面質(zhì)量。隨著數(shù)字處理技術的不斷提高,各種提高分辨率和幀率的方法和裝置不斷被提出并得到應用,同時電腦本身處理數(shù)據(jù)能力的提高,使得這方面問題得到了一定程度的改善,但總的來說,提高分辨率和刷新速度是一對矛盾,用戶往往不得不重點選擇其中之一而在另一方面有所舍棄。數(shù)字成像的攝像機,是一種把景物光像轉化為電信號的裝置,其結構可以大致分為以下幾部分光學系統(tǒng)(主要指鏡頭)、光電轉換系統(tǒng)(主要指攝像管及攝像器件)、電路系統(tǒng)(主要指視頻處理電路),其中電路系統(tǒng)即視頻處理電路是用來處理視頻數(shù)據(jù)的軟件處理通道。公知的圖像處理方法中,每一幅畫面各個部分的分辨率都是一致的,即在一幅畫面上各個位置都擁有同樣的分辨率,而視頻處理電路、數(shù)據(jù)傳輸通道和電腦處理系統(tǒng)要為圖像各點處一致的分辨率付出均等的代價。對于人來說,眼睛是獲取外部信息的主要窗口,“看”的目的在于獲得人需要的信息,而非想得到可以獲得的所有信息。由于人的大腦處理能力的有限性,人腦在同一時刻只能通過“注意機制”集中獲取某一局部區(qū)域的有限信息,而其他區(qū)域的信息由于不被“注意”,其接受能力是十分有限的。根據(jù)格式塔心理學,人眼在觀察處理景物時具有相近性、封閉性、相似性和連續(xù)性。其中連續(xù)性是指我們在看事物時傾向于把事物看成在空間、時間域中是整體性的和延續(xù)的,對于獲得信息中缺失的部分,如果人腦認為是已經(jīng)了解了的,就會用大腦中已有的信息來自動填充缺失信息。攝像頭在實際應用中,多用于視頻聊天、視頻會議、遠程監(jiān)控等。在很多應用場合中,人們并不需要視頻中傳輸來的影像中的全部信息,而只需要了解其中感興趣的部分,如人臉表情的變化,而對于背景中的信息則不去注意。在這種情況下,現(xiàn)有的視頻信息處理方式以完全一致的分辨率處理整個視頻畫面,對于視頻處理和信息傳輸來說,都是一種不必要的負擔。根據(jù)對人眼分辨力及水平和垂直方向視角的研究,人眼的視角是有限的,并且因人而異。一般而言,映在人眼視網(wǎng)膜上的圖像,只有中心部分能分辨清楚,這叫分辨視域,約 15度。從十幾度到30度之間則稱為有效視域,觀眾能立刻看清物體的存在和有什么動作,還不到需要轉動頭部才能辨別清楚的程度,但分辨能力已經(jīng)下降了。超過水平方向視野角 30度的周邊部分稱為誘導視野,俗稱眼睛的余光,只能感覺到物體的存在或有動作出現(xiàn),并不能看清楚是什么物體或什么動作。當人們感覺到有動體或變化的時候,就會把眼珠或頭頸轉過去,讓動體落入視角正中以便分清何物。由此可以看出,只有處于中心部分圖像的信息才會被人眼精確獲取,稍外圍有效視域關注度則會降低,而眼睛的余光部分則只需要得到物體存在和變化的信息,對細節(jié)并不關注。由于人眼的這種特點,在以上應用場合中,使用者都會有意識的在調(diào)試攝像頭時讓最需要關注的事物如人臉等位于鏡頭正中,此時完全沒有必要讓整幅畫面都使用完全一樣的高分辨率,現(xiàn)有的圖像采集方法對數(shù)據(jù)的處理和傳輸有比較大的負面影響。
發(fā)明內(nèi)容
因此,本發(fā)明為了克服現(xiàn)有圖像采集方法影響數(shù)據(jù)處理與數(shù)據(jù)處理速度的缺陷, 提供了一種在無損人眼觀察的情況下,提供一種能夠減少數(shù)據(jù)處理環(huán)節(jié)和傳輸環(huán)節(jié)負擔的視頻采集方法。本發(fā)明采用以下技術方案
該發(fā)明視頻采集方法,以視頻采集設備捕獲畫面的中心為原點,依次向外逐漸降低分辨率將捕獲畫面劃分為多級捕獲區(qū)域,進而依次讀取原點和以原點為中心的逐漸向外的環(huán)狀掃描線上的數(shù)據(jù),其中環(huán)狀掃描線定義為層。依據(jù)本發(fā)明的上述方法,等于是在攝像頭系統(tǒng)與視頻編碼器之間進行前置處理, 更具體的講本方案不是攝像頭系統(tǒng)采集架構的改變,而是數(shù)據(jù)讀取方式的改變?,F(xiàn)有的掃描方式是行列掃描,比如以分辨率為10MX768的屏幕來說,即每一條水平線上包含有 1024個像素點,共有768條線,即掃描列數(shù)為IOM行,行數(shù)為768列,難以做到變分辨率掃描。依據(jù)本發(fā)明,以環(huán)狀掃描線讀取數(shù)據(jù),劃分多級捕獲區(qū)域,采用中心區(qū)域分辨率高,越往外分辨率越低的方式,可以大幅降低數(shù)據(jù)讀取量;因此,使用戶在得到注意區(qū)域高分辨率的同時,通過降低其他區(qū)域的分辨率,減少整個畫面的數(shù)據(jù)量,從而減少了數(shù)據(jù)處理環(huán)節(jié)和傳輸環(huán)節(jié)的負擔,在單位時間內(nèi)傳輸數(shù)據(jù)量相同的前提下,達到提高幀率、提高畫面連續(xù)性的目的;或者在對畫面連續(xù)性沒有過高要求的前提下,提高注意區(qū)域的分辨率,得到足夠的信
息里ο上述視頻采集方法,所述多級捕獲區(qū)域中的中心區(qū)域的層數(shù)的修改權限開放給用戶。上述視頻采集方法,所述層為正方形。上述視頻采集方法,所述多級捕獲區(qū)域中的級數(shù)為兩級,第一級為中心區(qū)域,第二級為外圍區(qū)域,其中中心區(qū)域設定為所屬各層分辨率相等,而外圍區(qū)域的所屬各層分辨率依次等幅降低。上述視頻采集方法,所述外圍區(qū)域所屬各層與中心區(qū)域最外層從內(nèi)到外分辨率依次降低。上述視頻采集方法,定義以所述原點為原點的直角坐標系,所述正方形的邊相應平行于坐標軸,象素點在相應層上的位置稱為位,所述等幅降低采用確定外圍所屬各層位數(shù)相等的方式。
上述視頻采集方法取中心區(qū)域最外層的位數(shù)m,外圍區(qū)域任意一層的位數(shù)計為n, 每層按照逆時針或者順時針的位順次計為位次,則讀取該層位次的方法是首先依據(jù)公式 rand(0, 1)取m個隨機數(shù),然后乘n,進而取整,得到的數(shù)字作為當前層讀取位次。上述視頻采集方法,還包括在取得當前層讀取位次后的缺失校驗步驟,該步驟為首先確定實際獲得位次的總個數(shù),除以m,若小于等于95% ;則進行位次補償。上述視頻采集方法,所述位次補償為確定當前層讀取位次的步驟后在該層所缺失的位次中再進行位次的隨機確定。上述視頻采集方法,還包括在依次讀取原點和以原點為中心的逐級向外的環(huán)狀掃描線上的數(shù)據(jù)步驟后的格式轉換步驟,該步驟為把環(huán)狀掃描線的數(shù)據(jù)格式轉換成行列掃描線數(shù)據(jù)格式。
圖1為人眼分辨力及視角示意圖,圖中d為注意區(qū)域高度,D為圖像高度,Φ表示視角,而θ表示注意角度。圖2為依據(jù)本發(fā)明的一種視頻采集方法流程。圖3為中心區(qū)域與外圍區(qū)域結構示意圖。
具體實施例方式下面結合說明書附圖對本發(fā)明的技術方案作進一步的說明,一種視頻采集方法, 以視頻采集設備捕獲畫面的中心為原點,依次向外逐漸降低分辨率將捕獲畫面劃分為多級捕獲區(qū)域,進而依次讀取原點和以原點為中心的逐漸向外的環(huán)狀掃描線上的數(shù)據(jù),其中環(huán)狀掃描線定義為層。如附圖1所示,環(huán)狀可以為矩形環(huán),也可以為圓環(huán),之所以用環(huán)不用線,
主要是象素點有一定的寬度。關于多級,即把統(tǒng)一、連續(xù)的整體畫面分割為多個畫面按照不同方式讀取數(shù)據(jù),是清楚的。根據(jù)預設分辨率,重置視頻采集的坐標系。采集視頻畫面時,不再按照行、列的次序依次讀取攝像頭傳感器信息,而是取預設分辨率下的幾何中心為坐標原點設置直角坐標系,從坐標原點開始,呈環(huán)形依次向外讀取數(shù)據(jù),構造直角坐標系比較容易與現(xiàn)有的行列掃描方式進行格式轉換,當然,格式轉換并非必需步驟,環(huán)狀存成一種格式,再通過逆轉換轉換過來也可以。較佳的選擇是所述多級捕獲區(qū)域中的中心區(qū)域的層數(shù)的修改權限開放給用戶,用戶可以根據(jù)需要設置中心區(qū)域的層數(shù)或者說大小以及分辨率。而為了更便于坐標轉換,所述層為正方形,正方形是矩形的特殊形式,雖然屏幕也好,視頻部獲取區(qū)域也罷,多是長寬不等的矩形,在這種情況下,在遍歷畫面時,利用正方形的層就會出現(xiàn)可能有一部分空白區(qū)域,空白區(qū)域無象素,不需要讀取。接前述內(nèi)容,重置視頻采集的坐標系時,取預設分辨率的幾何中心為坐標原點, 即
x0=B/2 y0=H/2(B為視頻畫面寬度值,H為視頻畫面高度值)
圍繞原點依次向外圍展開的封閉像素點(當然,可能依據(jù)具體的畫面或者圖像會有部分正方形不連續(xù),但不影響數(shù)據(jù)讀取的表達)構成的每一個正方形連續(xù)線稱為“層” C,像素點在每層上的位置稱為“位”W,整幅圖像上每一個像素點(X,y)均可用層位CiWj表示,下標 “i”、“j”分別代表層數(shù)和位數(shù);
任一像素點所在層數(shù)C= I Max (x, y) | ;
按照由內(nèi)到外的順序將畫面設置層數(shù)C,原點為Ctl,第一層SC1,第二層為C2……,依次設置為Ci ;
設定每一層與X軸右方交點位置像素點為該層起點,定義為W1,按逆時針方向旋轉依次設置為Wj ;
所述多級捕獲區(qū)域中的級數(shù)必然至少為兩級,那么級數(shù)越多必然計算越復雜,通過驗證,兩級時只要通過合理配置中心區(qū)域層數(shù)m就能夠滿足后續(xù)處理的低存儲量要求,為兩級時第一級為中心區(qū)域,第二級為外圍區(qū)域,其中中心區(qū)域設定為所屬各層分辨率相等,而外圍區(qū)域的所屬各層分辨率依次等幅降低,通過這種配置方式,除滿足前面的基本要求之外,還可以通過外圍區(qū)域的分辨率設置為從內(nèi)層到外層逐次降低,分辨率的平穩(wěn)過渡,使人的視覺在主觀上減少突兀感。進一步地則是所述外圍區(qū)域所屬各層與中心區(qū)域最外層從內(nèi)到外分辨率依次降低,以做到中心區(qū)域和外圍區(qū)域的平滑過渡。依前述內(nèi)容,多級捕獲區(qū)域一定程度上也可以認為是外圍區(qū)域概念的外延,當然, 級數(shù)多了,更外層的可以不做平滑處理,以減小計算量。如前所述,定義以所述原點為原點的直角坐標系,所述正方形的邊相應平行于坐標軸,象素點在相應層上的位置稱為位,所述等幅降低采用讀取外圍所屬各層位數(shù)相等的方式。據(jù)此可以大幅降低計算量,提高處理環(huán)節(jié)的速度。一個示例,設中心區(qū)域最外層層數(shù)為cm,該層像素總位數(shù)為Wm。則外圍區(qū)域第一層為Cm+1,該層總位數(shù)為1+4。外圍區(qū)域任意一層層數(shù)為Cn,該層總位數(shù)為Wn,總位數(shù)為Wn_1+4。設定外圍區(qū)域任意一層讀取數(shù)據(jù)位數(shù)總數(shù)均等于中心區(qū)域最外層總位數(shù)Wm。由于每一層總位數(shù)均比上一層多4個,所以每層不讀取的數(shù)據(jù)位數(shù)均比上一層多4個,從而在事實上降低了每層的分辨率。進而,為了使不讀取的數(shù)據(jù)分散化以免產(chǎn)生大塊的數(shù)據(jù)空白區(qū)域,也就是使不讀取的位盡可能的不相鄰,在讀取數(shù)據(jù)選擇上使用隨機函數(shù)進行處理,方法如下
取中心區(qū)域最外層的位數(shù)m,外圍區(qū)域任意一層(記為當前層)的位數(shù)計為n,每層按照逆時針或者順時針的位順次計為位次,則讀取該層數(shù)據(jù)的方法是首先依據(jù)公式rand(0,1) 取m個隨機數(shù),然后乘n,進而取整,得到的數(shù)字作為當前層讀取位次,依據(jù)所獲得位次依次讀取當前層相應位上的數(shù)據(jù)。上述內(nèi)容可以采用一個整體的公式就是j=[n*rand (0,1)]。采用上述公式,不可避免的會出現(xiàn)取整之后部分位次相同的情形,使得所獲得位數(shù)少于m個,造成位次缺失比例失調(diào),但由于本方法本身目的即為降低外圍區(qū)域分辨率,所以,只要缺失比例不大,即不用特別處理。不過一旦缺失部分比例過大,比如丟失超過5%,需要進行處理。更準確的,依據(jù)上述方案還包括在取得當前層讀取位次后的位次缺失校驗步驟,該步驟為首先確定實際獲得位次的總個數(shù),除以m,若小于等于95% (0. 95m),則進行位次補償。所述位次補償為確定當前層讀取位次的步驟后在該層所缺失的位次中再進行位次的隨機確定。對與外圍的層,因總位次數(shù)目比較多,因重復丟失的位次的比例相對較小, 簡單的重新確定位次也未嘗不可;但對于內(nèi)層的層,因總位次數(shù)目相對較少,因重復丟失位次的比例較高,因此,采用補償是必要的。位次確定可以作為視頻設備初始化的內(nèi)容,不涉及每次讀取數(shù)據(jù)都需要初始化。如前所述,為了保證通用性,依據(jù)前述方案還包括在依次讀取原點和以原點為中心的逐級向外的環(huán)狀掃描線上的數(shù)據(jù)步驟后的格式轉換步驟,該步驟為把環(huán)狀掃描線的數(shù)據(jù)格式轉換成行列掃描線數(shù)據(jù)格式。這種轉換在采用前面所說的正方形掃描線的情況下變得非常簡便,當然,所有的轉換方式都是簡單的位置映射,正交的邊對應行列掃描的行列, 轉換算法本領域的技術人員據(jù)此容易獲得。格式轉換過程會在一定程度上增加攝像頭DSP運算量,但由于該轉換只是簡單的位置映射,故而運算量不大;轉換之后的數(shù)據(jù)量也不會變化。值得指出的是,該轉換過程并不是必須的。只要接收端的軟件設置得可以接收并正常顯示該格式的圖像數(shù)據(jù)信息,就不必進行該轉換,但是該格式圖像在使用其他圖像顯示和視頻播放軟件播放時可能會遇到問題。所以,是否進行轉換,可以由生產(chǎn)廠家按照需要進行選擇。最后,可以將完成坐標轉換的圖像信息輸出到編碼器,以進行后續(xù)處理。下面以用于視頻聊天的電腦視頻攝像頭為例,用于在進行視頻聊天打開攝像頭時,均會檢查攝像頭拍攝顯示區(qū)域,將鏡頭對準所要重點關注的畫面正中(如人臉),并調(diào)整分辨率或采用默認分辨率。此時只有中央部分畫面屬于重點關注區(qū)域。攝像頭感應器讀取數(shù)據(jù)后,由該處理軟件進行處理,首先在預設分辨率下,轉換坐標系,按照由內(nèi)層到外層的順序讀取數(shù)據(jù)。中心區(qū)域的數(shù)據(jù)按照順序依次全部讀取,外圍區(qū)域每層須先確定讀取位置,先由m個隨機數(shù)乘以該層位數(shù)總數(shù),得到m個數(shù)字確定為讀取位;計算讀取位有效數(shù)量總和,將該總和除以m,如小于一定比例(如95%),則用缺少的數(shù)量 m- Σ Hii再次乘以隨機數(shù)并取整,得到相應的數(shù)字作為讀取位數(shù)。此次計算仍有可能有重疊部分,但是越接近外層,每層的像素總位數(shù)就會越大,重疊缺失的概率就會越低。根據(jù)計算出來的外層區(qū)域讀取層數(shù)和位數(shù)讀取數(shù)據(jù)后,即完成了一幅畫面的數(shù)據(jù)讀取。然后對讀取的畫面數(shù)據(jù)進行坐標轉換,轉為通用格式進行儲存,然后進行發(fā)送。如用戶設定中心區(qū)域分辨率為640*480,即目前最常用的30萬像素,中心區(qū)域層數(shù)為80層,則整幅畫面實際像素小于等于95600,只有原畫面像素的31. 1%,則在相同的數(shù)據(jù)傳輸速度下,畫面幀率可以提高3倍以上,達到提高畫面連續(xù)性的效果。上述技術方案不適用于需要對全畫面均有較高注意要求的場合,如監(jiān)控等,而只適用于對畫面關注程度遠高于邊緣區(qū)域的場合,如視頻聊天、視頻會議等。
權利要求
1.一種視頻采集方法,其特征在于,以視頻采集設備捕獲畫面的中心為原點,依次向外逐漸降低分辨率將捕獲畫面劃分為多級捕獲區(qū)域,進而依次讀取原點和以原點為中心的逐漸向外的環(huán)狀掃描線上的數(shù)據(jù),其中環(huán)狀掃描線定義為層。
2.根據(jù)權利要求1所述的視頻采集方法,其特征在于,所述多級捕獲區(qū)域中的中心區(qū)域的層數(shù)的修改權限開放給用戶。
3.根據(jù)權利要求1所述的視頻采集方法,其特征在于所述層為正方形。
4.根據(jù)權利要求3所述的視頻采集方法,其特征在于所述多級捕獲區(qū)域中的級數(shù)為兩級,第一級為中心區(qū)域,第二級為外圍區(qū)域,其中中心區(qū)域設定為所屬各層分辨率相等, 而外圍區(qū)域的所屬各層分辨率依次等幅降低。
5.根據(jù)權利要求4所述的視頻采集方法,其特征在于所述外圍區(qū)域所屬各層與中心區(qū)域最外層從內(nèi)到外分辨率依次降低。
6.根據(jù)權利要求4或5所述的視頻采集方法,其特征在于定義以所述原點為原點的直角坐標系,所述正方形的邊相應平行于坐標軸,象素點在相應層上的位置稱為位,所述等幅降低采用確定外圍所屬各層位數(shù)相等的方式。
7.根據(jù)權利要求6所述的視頻采集方法,其特征在于取中心區(qū)域最外層的位數(shù)m,外圍區(qū)域任意一層的位數(shù)計為n,每層按照逆時針或者順時針的位順次計為位次,則讀取該層位次的方法是首先依據(jù)公式rand(0,1)取m個隨機數(shù),然后乘n,進而取整,得到的數(shù)字作為當前層讀取位次。
8.根據(jù)權利要求7所述的視頻采集方法,其特征在于還包括在取得當前層讀取位次后的缺失校驗步驟,該步驟為首先確定實際獲得位次的總個數(shù),除以m,若小于等于95% ;則進行位次補償。
9.根據(jù)權利要求8所述的視頻采集方法,其特征在于所述位次補償為確定當前層讀取位次的步驟后在該層所缺失的位次中再進行位次的隨機確定。
10.根據(jù)權利要求1所述的視頻采集方法,其特征在于還包括在依次讀取原點和以原點為中心的逐級向外的環(huán)狀掃描線上的數(shù)據(jù)步驟后的格式轉換步驟,該步驟為把環(huán)狀掃描線的數(shù)據(jù)格式轉換成行列掃描線數(shù)據(jù)格式。
全文摘要
本發(fā)明公開了一種視頻采集方法,以視頻采集設備捕獲畫面的中心為原點,依次向外逐漸降低分辨率將捕獲畫面劃分為多級捕獲區(qū)域,進而依次讀取原點和以原點為中心的逐漸向外的環(huán)狀掃描線上的數(shù)據(jù),其中環(huán)狀掃描線定義為層。依據(jù)本發(fā)明在無損人眼觀察的情況下,能夠有效地減少數(shù)據(jù)處理環(huán)節(jié)和傳輸環(huán)節(jié)的負擔。
文檔編號H04N5/232GK102291533SQ20111016927
公開日2011年12月21日 申請日期2011年6月22日 優(yōu)先權日2011年6月22日
發(fā)明者李泉 申請人:李泉