移動網(wǎng)絡(luò)攝像機的光學(xué)模塊的系統(tǒng)，方法及網(wǎng)絡(luò)攝像機的制作方法

文檔序號：7618721閱讀：202來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：移動網(wǎng)絡(luò)攝像機的光學(xué)模塊的系統(tǒng)，方法及網(wǎng)絡(luò)攝像機的制作方法
技術(shù)領(lǐng)域：
本發(fā)明一般涉及網(wǎng)絡(luò)攝像機的平搖、俯仰和推拉，且更特定而言，涉及通過軟件或固件控制的視頻網(wǎng)絡(luò)攝像機的機械平搖、俯仰和推拉。
背景技術(shù)：
在過去的幾年中，人們之間的電子接觸已急劇增加。各種模式的通信均被用于彼此之間的電子通信，如視頻會議、電子信函、文本消息等。尤其是允許人們彼此通過因特網(wǎng)而實時通信(“IM聊天”)的即時消息(IM)已變得日益普及。最近，視頻數(shù)據(jù)也與實時IM聊天一起傳輸。
存在可用于所述電子視頻通信的多種攝像機。除視頻數(shù)據(jù)和音頻數(shù)據(jù)外，一些所述攝像機具有俘獲靜止圖像數(shù)據(jù)的能力。為了視頻實時聊天的目的，通常將這些攝像機連接到一用戶的計算機，并將所述攝像機所俘獲的視頻和/或音頻數(shù)據(jù)傳輸?shù)剿鲇嬎銠C。如上所提及，可存在多種其他應(yīng)用，其中傳輸靜止圖像、視頻和/或音頻數(shù)據(jù)，如用于制作電影、視頻監(jiān)視、因特網(wǎng)監(jiān)視、因特網(wǎng)網(wǎng)絡(luò)攝像機等目的的現(xiàn)場視頻流(video streaming)、視頻俘獲。
在這些應(yīng)用中，看見另一用戶的臉部通常極為重要。例如，在兩個用戶使用視頻IM通信的情況下，通常希望建立與另一用戶實際聊天的印象。因此，看見彼此的臉部大大增強了這個體驗。然而，人們會自然地將臉部左右或上下等移動且因此完全或部分從攝像機的視野中消失。因此，在這些應(yīng)用中追蹤所述用戶臉部通常是很重要的。
然而，用于即時消息接發(fā)的大多數(shù)常規(guī)攝像機(通常為網(wǎng)絡(luò)攝像機)不能自動移動來追蹤用戶的臉部。用戶須用手特定移動攝像機以再進(jìn)入視野，或須有意識地將他或她的臉部移回到攝像機的視野中。在一些情況下，已實施了光學(xué)臉部追蹤。一種此類實施光學(xué)臉部追蹤的攝像機為Logitech公司(加利福尼亞弗里蒙特)的QuickCam Pro 4000。作為光學(xué)追蹤如何工作的一個實例，假設(shè)用戶的臉部移到攝像機視野的右上角。與所述攝像機相關(guān)聯(lián)的軟件可識別用戶臉部的此移動，變焦推進(jìn)(zoom in)至所述臉部，采集臉部周圍的圖像數(shù)據(jù)，并接著調(diào)整將要傳輸?shù)膱D像的大小。
光學(xué)臉部追蹤具有數(shù)個局限性。首先，此種光學(xué)處理圖像數(shù)據(jù)的質(zhì)量顯著下降。其次，通過此種光學(xué)處理，所述攝像機的視野并未改變。因此，假如用戶移動得足以離開攝像機的當(dāng)前視野，那么光學(xué)臉部追蹤就不能為此做出補救。專利6,297,846使用一廣角鏡頭，且從所述廣角圖像中跟隨人們并在所述廣角圖像內(nèi)選擇一窗口。
標(biāo)題為“Method for automatically adjusting a video conferencing systemcamera”的美國專利第5,598,209號中提出了另一解決方案。該專利的論述內(nèi)容提供調(diào)節(jié)攝像機的平搖、俯仰、變焦推拉和聚焦的其他方法。然而，所揭示的方法需要來自用戶的關(guān)于攝像機的視野應(yīng)集中在某個目標(biāo)或某個特定位置周圍的特定輸入?；谧粉櫵鲇脩舻哪槻浚銎綋u、俯仰等并非是自動的。
一些專利描述了數(shù)種靜止畫面分框系統(tǒng)且其他專利使用測距系統(tǒng)(ranging system)以通過變焦推拉來調(diào)節(jié)距離。美國專利第6,606,458號和第5,864,363號描述了用于攝像機肖像(portrait)的人臉部的自動對準(zhǔn)，但并未提供視頻的連續(xù)追蹤。專利第5,389,967號展示藉助一種攝錄像機但使用一紅外信號來追蹤目標(biāo)。專利第4,348,097號展示了一個安裝在一軌道上的攝像機，其中一個測距儀用于控制攝像機的移動以保持與一個目標(biāo)的所需距離。
專利第6,680,745號教示用于視頻會議的多個攝像機，其中一個廣角攝像機檢測人的移動并隨后引導(dǎo)其他攝像機變焦推拉、平搖和俯仰。美國公開申請案第20020113862號中展示了一種一個攝像機控制其他攝像機的類似系統(tǒng)，其展示了一個連接到USB的控制其他攝像機跟隨臉部的廣角攝像機。某些系統(tǒng)使用聲音(人的談話)來定位一個已移出攝像機范圍的人。通常，使用一個特定的視頻會議接線板，以第一電纜提供視頻輸入，而其他電纜給攝像機提供輸出控制。

發(fā)明內(nèi)容
本發(fā)明是一種用于自動機械平搖、俯仰和/或推拉一網(wǎng)絡(luò)攝像機以追蹤一個用戶臉部的系統(tǒng)和方法。在一個實施例中，所述移動由在一所述網(wǎng)絡(luò)攝像機向其發(fā)送視頻數(shù)據(jù)的主機中的核心軟件所控制。以此方式，在所述主機核心中的驅(qū)動器操縱臉部追蹤，對取所述視頻的應(yīng)用程序透明。在一個替代實施例中，所述移動由在網(wǎng)絡(luò)攝像機自身中的固件所控制。所述視頻和控制信號通過相同的標(biāo)準(zhǔn)電纜(如USB總線)而發(fā)送。
在一個實施例中，將視頻提供給一即時消息應(yīng)用。通過所述即時消息應(yīng)用，使用標(biāo)準(zhǔn)總線(例如，USB)和將臉部追蹤卸載到所述網(wǎng)絡(luò)攝像機和驅(qū)動器允許較容易的使用。
在一個實施例中，一機器視覺算法將用戶的臉部定位在網(wǎng)絡(luò)攝像機當(dāng)前視野中?；谀槻康恼ㄎ?positive localization)及其臉部特征移動所述網(wǎng)絡(luò)攝像機。在本發(fā)明的一個實施例中，使用一算法來比較所述用戶臉部的位置與所述網(wǎng)絡(luò)攝像機的當(dāng)前視野。如果確定用戶的臉部距視野邊緣(基于一個指定的臨界)太近，則適當(dāng)移動所述網(wǎng)絡(luò)攝像機的鏡頭。根據(jù)本發(fā)明的一個實施例的視頻網(wǎng)絡(luò)攝像機配備有將網(wǎng)絡(luò)攝像機的鏡頭上或下(俯仰)或左右(平搖)移動的機械制動器。在另一個實施例中也存在機械制動器以將所述網(wǎng)絡(luò)攝像機鏡頭往里或往外移動(推拉)。在一個實施例中，在所述網(wǎng)絡(luò)攝像機自身中進(jìn)行追蹤臉部的處理，從而無需一主機系統(tǒng)來進(jìn)行此處理。
所述概述和以下詳細(xì)描述中所描述的特征和優(yōu)點并未盡述(all-inclusive)，且特定地說，根據(jù)本文中的圖式、說明書和權(quán)利要求書很多其他特征和優(yōu)點對于所述領(lǐng)域的技術(shù)人員來說將是顯而易見的。而且，應(yīng)注意說明書中所使用的語言主要是出于可讀性和指導(dǎo)的目的而選擇的，而并非為描繪或限定所述發(fā)明性主題、采用確定所述發(fā)明性主題所必需的權(quán)利要求書而選擇的。

本發(fā)明具有其他優(yōu)點和特征，且其結(jié)合附圖從本發(fā)明的以下詳細(xì)描述和上述權(quán)利要求書來看將變得更加顯而易見，其中圖1是一個用于視頻通信的系統(tǒng)100的實施例的方塊圖。
圖2A、2B和2C說明一用戶頭部的移動和為所述運動的網(wǎng)絡(luò)攝像機的移動。
圖3是一個根據(jù)本發(fā)明的一個實施例的系統(tǒng)的方塊圖。
圖4是一個說明根據(jù)本發(fā)明的一個實施例的系統(tǒng)運行的流程圖。
圖5是一個根據(jù)本發(fā)明的一個實施例的機器視覺模塊的方塊圖。
圖6是一個說明根據(jù)本發(fā)明的一個實施例的移動控制模塊運行的流程圖。
圖7是一個說明網(wǎng)絡(luò)攝像機、主機核心層(驅(qū)動器)和應(yīng)用程序之間的關(guān)系的方塊圖。
具體實施例方式
所述圖(或圖式)僅為說明的目的而描繪了本發(fā)明的一個優(yōu)選實施例。應(yīng)注意圖中類似或相同的參考數(shù)字可以指示類似或相同的功能。所屬領(lǐng)域的技術(shù)人員從以下論述將不難認(rèn)識到在不背離本文中的本發(fā)明原則的情況下，可以采用本文中所揭示的結(jié)構(gòu)和方法的替代實施例。
圖1是一個用于視頻通信的系統(tǒng)100的實施例的方塊圖。系統(tǒng)100包含計算機系統(tǒng)110a和110b、網(wǎng)絡(luò)攝像機120a和120b和網(wǎng)絡(luò)130。一使用計算機110a和網(wǎng)絡(luò)攝像機120a的用戶可以通過網(wǎng)絡(luò)130與一使用計算機110b和網(wǎng)絡(luò)攝像機120b的用尸通信。
計算機110a或110b可為任何能夠與網(wǎng)絡(luò)攝像機120a或120b和/或網(wǎng)絡(luò)130通信的主機。因此，計算機110或110b可為一個人計算機(桌上型或膝上型)、一手持式計算機或管理器(如，個人數(shù)字助理(PDA))、一蜂窩電話、一能夠與網(wǎng)絡(luò)攝像機和/或網(wǎng)絡(luò)接合的嵌入式自動方案(embedded automotivesolution)等。在一個實施例中，計算機110a和110b為常規(guī)計算機系統(tǒng)的一部分，其每個均可包括一存儲裝置、一網(wǎng)絡(luò)服務(wù)連接和諸如以下的常規(guī)輸入/輸出裝置可耦接到一個計算機系統(tǒng)的顯示器、鼠標(biāo)、打印機和/或鍵盤。所述計算機110a或110b也包括一常規(guī)的操作系統(tǒng)(MS Windows、Mac OSX操作系統(tǒng)等)、輸入/輸出裝置和網(wǎng)絡(luò)服務(wù)軟件。另外，在一個實施例中，所述計算機110a或110b包括IM軟件，如ICQ公司的ICQ、美國在線公司(AmericaOnline，Inc.)(弗吉尼亞杜勒斯)的America OnLine Instant Messenger(AIM)、Microsoft公司(華盛頓雷蒙德)的MSNMessenger和Yahoo！公司(加利福亞桑尼維爾)的Yahoo！Instant Messenger。
網(wǎng)絡(luò)服務(wù)連接包括那些允許連接常規(guī)網(wǎng)絡(luò)服務(wù)的硬件和軟件組件。例如所述網(wǎng)絡(luò)服務(wù)連接可包括與一電信線路(例如，撥號、數(shù)字用戶線(“DSL”)、T1或T3通信線路)的連接。所述主機、存儲裝置和網(wǎng)絡(luò)服務(wù)連接可從(例如)IBM公司(紐約州阿爾蒙克)、Sun Microsystems公司(加利福尼亞帕洛阿爾托)或Hewlett-Packard公司(加利福尼亞帕洛阿爾托)購得。
將網(wǎng)絡(luò)攝像機120a和120b分別連接到計算機110a和110b。網(wǎng)絡(luò)攝像機120a和120b可為任何可連接到計算機110a和110b的攝像機。在一個實施例中，網(wǎng)絡(luò)攝像機120a和/或120b為Logitech公司(加利福尼亞弗里蒙特)的QuickCam攝像機。
網(wǎng)絡(luò)130可為如廣域網(wǎng)(WAN)或局域網(wǎng)(LAN)的任何網(wǎng)絡(luò)或任何其他網(wǎng)絡(luò)。WAN可包括因特網(wǎng)、因特網(wǎng)2等。LAN可包括企業(yè)內(nèi)部互聯(lián)網(wǎng)，其可為一基于(例如)屬于一個僅可為所述機構(gòu)成員、雇員或經(jīng)許可的其他人所存取的機構(gòu)的TCP/IP的網(wǎng)絡(luò)。LAN也可為一個諸如(例如)Novell公司(猶他普羅沃)的NetwareTM或Microsoft公司(華盛頓雷蒙德)的WindowsNT的網(wǎng)絡(luò)。網(wǎng)絡(luò)120也可以包括市售的訂閱式服務(wù)，諸如(例如)AmericaOnline公司(弗吉尼亞杜勒斯)的OL或Microsoft公司(華盛頓雷蒙德)的MSN。
圖2A、2B和2C提供本發(fā)明的一個實施例運行的一個實例。圖2A、2B和2C說明所述網(wǎng)絡(luò)攝像機120a的視野(圖2A和2B中的200、圖2C中的202)、用戶/說話者210的頭部和由兩條垂直線所表示的固定的背景特征220。
在圖2A中，說話者的頭部210在網(wǎng)絡(luò)攝像機120a的視野200的中央。從圖2A可見，這時所述固定的背景特征220位于說話者頭部的后面，且因此也在網(wǎng)絡(luò)攝像機120a的視野200的中央。
假設(shè)說話者接著向左移動。圖2B說明說話者的頭部210移到網(wǎng)絡(luò)攝像機120a的視野200的左方。所述固定的背景特征220仍在網(wǎng)絡(luò)攝像機120a的視野200的中央。
圖2C說明一個根據(jù)本發(fā)明的一個實施例的系統(tǒng)將怎樣適應(yīng)所述說話者的移動。在一個實施例中，所述系統(tǒng)檢測到說話者的頭部210距攝像機的當(dāng)前視野200的邊緣很近。接著，所述攝像機的鏡頭移動并改變其視野，使得說話者的頭部200位于其新的視野202的中央?？梢姽潭ǖ谋尘疤卣?20不再位于新的視野202的中央。
應(yīng)注意，由于所述網(wǎng)絡(luò)攝像機120a可改變其視野以適應(yīng)說話者的移動，因此網(wǎng)絡(luò)攝像機120a的有效視野明顯大于常規(guī)攝像機的有效視野。在以上的實例中也應(yīng)該注意所述說話者從右向左移動。在一個實施例中，即使說話者以其它方向(如從左到右、從上到下、從下到上或其組合)移動，所述鏡頭也可通過移動以進(jìn)行相同的適應(yīng)。在一個實施例中，所述視野自動調(diào)節(jié)(即，當(dāng)說話者移近攝像機或更加遠(yuǎn)離攝像機時其分別拉遠(yuǎn)和拉近)，以保持說話者頭部相對于攝像機視野的相同尺寸。在一個實施例中，可通過在網(wǎng)絡(luò)攝像機上推拉鏡頭來達(dá)到視野的自動調(diào)節(jié)。在另一個實施例中，可使用電子推拉(在網(wǎng)絡(luò)攝像機自身上或在主機上)來達(dá)到視野的自動調(diào)節(jié)。
圖3是一個根據(jù)本發(fā)明的一個實施例的系統(tǒng)的方塊圖。系統(tǒng)300包含網(wǎng)絡(luò)攝像機120a和計算機110a。
網(wǎng)絡(luò)攝像機120a包含一光學(xué)模塊310和一機械模塊320。在一個實施例中，光學(xué)模塊310包含鏡頭、傳感器和允許視頻處理和壓縮的固件。所述機械模塊320包括用于移動鏡頭的機構(gòu)(mechanics)。在一個實施例中，將制動器用于移動鏡頭。在一個實施例中，所述制動器通過將制動器的旋轉(zhuǎn)轉(zhuǎn)化為網(wǎng)絡(luò)攝像機的運動的齒輪箱致使機械透鏡以任何方向移位。在一個實施例中，使用兩個制動器和兩個齒輪箱，且每個制動器控制一個齒輪箱。一旦作出要機械移動所述鏡頭的決定，就命令所述網(wǎng)絡(luò)攝像機的固件(嵌入所述網(wǎng)絡(luò)攝像機自身中的軟件)來執(zhí)行這一決定。所述固件將信號發(fā)送到制動器，制動器又反過來移動齒輪箱，而齒輪箱又反過來移動網(wǎng)絡(luò)攝像機和/或其鏡頭。
計算機110a上的軟件包括一驅(qū)動模塊330和一應(yīng)用模塊340。所述驅(qū)動模塊330包括一機器視覺模塊332和一移動控制模塊334。所述機械視覺模塊332在網(wǎng)絡(luò)攝像機120a的視野內(nèi)追蹤說話者臉部的位置，且以下參看圖5將進(jìn)一步描述所述機器視覺模塊。移動控制模塊334根據(jù)從機器視覺模塊332的輸出判定是否移動攝像機和移動多少。以下參看圖6進(jìn)一步描述所述移動控制模塊334。當(dāng)使用網(wǎng)絡(luò)攝像機120a時，應(yīng)用模塊340為與用戶相互作用的應(yīng)用程序。
圖4是一個說明系統(tǒng)300的運行的流程圖。計算機110a接收從網(wǎng)絡(luò)攝像機120a發(fā)出的視頻數(shù)據(jù)(步驟410)。接著，處理視頻數(shù)據(jù)以估計圖框中用戶的臉部的位置(步驟420)。以下將參看圖5而描述的機器視覺模塊332執(zhí)行這個處理。
圖5是一個根據(jù)本發(fā)明的一個實施例的機器視覺模塊332的方塊圖。
所述機器視覺模塊332包括一臉部檢測器510、一肌膚取樣器(fleshsampler)515、一肌膚追蹤器(flesh tracker)520和一運動檢測器530。臉部檢測器510、肌膚追蹤器520和運動檢測器530每個均使用不同的參數(shù)來確定用戶的臉部可能定位在攝像機所俘獲的圖框內(nèi)的何處。這些模塊的輸出彼此影響，且其一起判斷用戶的臉部位于攝像機視野內(nèi)的何處。
臉部檢測器510根據(jù)預(yù)期為所有人類臉部所共有的某些參數(shù)來檢測臉部的存在。這些參數(shù)可包括(例如)存在兩個眼睛、一個鼻子和一個嘴巴，它們之間具有一定的間距比。
接著，將所述臉部檢測器510的輸出提供給所述肌膚取樣器515。肌膚取樣器從臉部檢測器所確定的“臉部”來選擇一特定的光滑區(qū)域。例如，這個區(qū)域可為一個選自用戶前額的區(qū)域。接著，將此區(qū)域用作所述用戶肌膚的一個樣品。使用用戶臉部的樣品排除了不同用戶的膚色的不同，和由于用戶所處環(huán)境中的燈光而導(dǎo)致的膚色的不同。將肌膚取樣器515的輸出提供給肌膚追蹤器520。接著，肌膚追蹤器520使用肌膚取樣器515的樣品，并通過追蹤用戶肌膚(當(dāng)其移動時)來追蹤用戶的臉部。
運動檢測器530檢測運動。當(dāng)用戶移動他的/她的頭部時，運動檢測器530能夠辨別該運動。運動檢測器530也從臉部檢測器510和肌膚追蹤器520接收信息。因此，這三個模塊結(jié)合工作以辨別具有人類臉部參數(shù)、具有膚色和正在移動的事物。因此，機器視覺模塊332可相對于攝像機的視野在圖框中看到用戶的臉部。在一個實施例中，機器視覺模塊的輸出是一個其中含有用戶的臉部的矩形。
再參看圖4，接著做出關(guān)于是否應(yīng)和在哪個方向上移動網(wǎng)絡(luò)攝像機鏡頭的決定(步驟430)。在一個實施例中，通過移動網(wǎng)絡(luò)攝像機自身而上下、左右等移動網(wǎng)絡(luò)攝像機。在另一個實施例中，在不移動網(wǎng)絡(luò)攝像機機架的情況下移動網(wǎng)絡(luò)攝像機鏡頭。在一個實施例中，移動網(wǎng)絡(luò)攝像機鏡頭(步驟430)的決定包括計算所述鏡頭應(yīng)移動的量。在另一個實施例中，以指定方向?qū)⑺鲧R頭移動一預(yù)定的量。在一個實施例中，通過確定用戶的臉部是否位于圖框中一臨界外來做出決定(步驟430)。圖6詳細(xì)地說明了這一點。
圖6是一個方塊圖，其說明根據(jù)本發(fā)明的一個實施例如何做出關(guān)于是否移動網(wǎng)絡(luò)攝像機的鏡頭、移動多少和以哪個方向移動的決定。
矩形610表示網(wǎng)絡(luò)攝像機120a的當(dāng)前視野。矩形630a、b和c表示用戶的臉部的位置。在一個實施例中，通過機器視覺模塊332提供矩形630a、b和c。矩形620表示一個相對于所述網(wǎng)絡(luò)攝像機120a當(dāng)前視野610的預(yù)定臨界。與用戶的臉部(即，630a、b或c)到臨界620的位置相關(guān)的算法確定是否移動鏡頭、移動多少和以哪個方向移動。例如，在一個實施例中，所述算法為當(dāng)表示用戶的臉部630a、b或c的矩形的中心位于臨界矩形620內(nèi)時，無需移動鏡頭。當(dāng)表示用戶的臉部630a、b或c的矩形的中心位于臨界矩形620外時，移動鏡頭直到用戶的臉部630a、b或c再次位于臨界矩形的內(nèi)部。
從圖6可見，使用這種算法，當(dāng)用戶的頭部位于位置630a和630b時無需鏡頭運動。然而，當(dāng)用戶的臉部位于位置630c時，需將鏡頭向下和向右移動。
再參看圖4可見，如果判定不應(yīng)移動攝像機(步驟430)，那么系統(tǒng)繼續(xù)接收視頻數(shù)據(jù)(步驟410)并進(jìn)行處理(步驟420)。如果判定需要移動網(wǎng)絡(luò)攝像機來追蹤臉部，那么以指定的方向以經(jīng)計算或預(yù)定的量來移動網(wǎng)絡(luò)攝像機的鏡頭。所述系統(tǒng)繼續(xù)接收視頻數(shù)據(jù)(步驟410)并進(jìn)行處理(步驟420)。
應(yīng)注意，在一個替代實施例中，機器視覺模塊332和其它相關(guān)模塊被嵌入網(wǎng)絡(luò)攝像機120a自身，而不是位于計算機110a上。在一個實施例中，攝像機的機械平搖、俯仰和/或推拉由網(wǎng)絡(luò)攝像機固件所控制。在一個實施例中，所述機器視覺模塊332和/或移動控制模塊334可全部或部分包括于攝像機自身中。
圖7說明網(wǎng)絡(luò)攝像機、主機核心層(驅(qū)動器)和應(yīng)用程序之間的關(guān)系。網(wǎng)絡(luò)攝像機700包括一個視頻傳感器702和用于將所述視頻傳感器的平搖、俯仰和推拉控制機械化的制動器704。USB接口將視頻信號712提供給主機，并從主機接收制動器控制命令714以控制所述制動器。這允許將一標(biāo)準(zhǔn)總線用于控制網(wǎng)絡(luò)攝像機。
在所述主機中，核心層710包括一個具有一臉部追蹤系統(tǒng)716的驅(qū)動器。這監(jiān)視視頻712，并提供對應(yīng)用程序720透明的制動器控制信號。也將視頻信號712提供到所述應(yīng)用程序720。實線表示具有臉部追蹤的視頻路徑，虛線表示無臉部追蹤的視頻路徑。在所展示的實例中，所述應(yīng)用程序是一個即時消息程序。所述即時消息程序具有一個消息窗口722和一個用于顯示視頻712的視頻俘獲窗口724。按鈕圖標(biāo)可顯示于消息窗口中以激活臉部追蹤特征。
盡管已說明和描述了本發(fā)明的特定實施例和應(yīng)用，但應(yīng)了解本發(fā)明不限于本文中所描述的精確構(gòu)造和組件。例如，如上所提及，本發(fā)明可用于從一個網(wǎng)絡(luò)攝像機搜集(pull from)視頻的其它應(yīng)用，而不僅僅是即時消息。在不背離上述權(quán)利要求書所界定的本發(fā)明的精神和范圍的情況下，可對本文中所揭示的本發(fā)明的方法和設(shè)備的配置、操作和細(xì)節(jié)進(jìn)行各種其它修改、改變和變化，其對所屬領(lǐng)域的技術(shù)人員來說是顯而易見的。
權(quán)利要求
1.一種用于通過追蹤一用戶的臉部而機械移動一網(wǎng)絡(luò)攝像機中的一光學(xué)模塊的系統(tǒng)，所述系統(tǒng)包含一用于俘獲圖像數(shù)據(jù)的光學(xué)模塊；一耦接到所述光學(xué)模塊的機器視覺模塊，其用于根據(jù)所述俘獲的圖像數(shù)據(jù)辨別所述用戶臉部的位置；一耦接到所述機器視覺模塊的移動控制模塊，其用于判定是否移動所述光學(xué)模塊；和一耦接到所述移動控制模塊的機械模塊，其用于根據(jù)所述移動控制模塊的決定來移動所述光學(xué)模塊。
2.根據(jù)權(quán)利要求1所述的系統(tǒng)，其中所述機械模塊位于所述網(wǎng)絡(luò)攝像機內(nèi)。
3.根據(jù)權(quán)利要求1所述的系統(tǒng)，其中所述機器視覺模塊和所述移動控制模塊位于所述網(wǎng)絡(luò)攝像機內(nèi)。
4.根據(jù)權(quán)利要求1所述的系統(tǒng)，其中所述機器視覺模塊和所述移動控制模塊位于以通信方式耦接到所述網(wǎng)絡(luò)攝像機的一計算機中的驅(qū)動器內(nèi)。
5.根據(jù)權(quán)利要求1所述的系統(tǒng)，其中來自所述網(wǎng)絡(luò)攝像機的所述圖像數(shù)據(jù)被提供給一即時消息接發(fā)應(yīng)用。
6.根據(jù)權(quán)利要求1所述的系統(tǒng)，其中所述機器視覺模塊包含一臉部檢測器，其用于根據(jù)預(yù)先規(guī)定的參數(shù)來檢測一用戶臉部；一肌膚追蹤器，其用于根據(jù)膚色來追蹤一用戶肌膚的移動；和一運動檢測器，其耦接到所述臉部檢測器和所述肌膚追蹤器以用于檢測一用戶臉部的運動。
7.根據(jù)權(quán)利要求6所述的系統(tǒng)，其中所述機器視覺模塊進(jìn)一步包含一耦接到所述臉部檢測器的肌膚取樣器，其用于提取所述用戶肌膚的樣品，并用于將此樣品提供給所述肌膚追蹤器。
8.根據(jù)權(quán)利要求1所述的系統(tǒng)，其中所述網(wǎng)絡(luò)攝像機通過一標(biāo)準(zhǔn)總線連接到一計算機，而發(fā)送到所述計算機的視頻數(shù)據(jù)及自所述計算機發(fā)送到所述網(wǎng)絡(luò)攝像機的控制信號均通過所述總線發(fā)送。
9.根據(jù)權(quán)利要求1所述的系統(tǒng)，其中所述網(wǎng)絡(luò)攝像機根據(jù)臉部特征的正定位而移動。
10.一種用于根據(jù)一用戶臉部的移動而機械移動一俘獲圖像數(shù)據(jù)的網(wǎng)絡(luò)攝像機的方法，所述方法包含處理所述圖像數(shù)據(jù)以估計所述用戶臉部的位置；確定是否移動所述網(wǎng)絡(luò)攝像機；和響應(yīng)移動所述網(wǎng)絡(luò)攝像機的決定，移動所述網(wǎng)絡(luò)攝像機。
11.根據(jù)權(quán)利要求10所述的系統(tǒng)，其中確定是否移動所述網(wǎng)絡(luò)攝像機的步驟包含比較所述用戶臉部的位置與所述網(wǎng)絡(luò)攝像機的當(dāng)前視野；響應(yīng)所述用戶臉部的位置與所述網(wǎng)絡(luò)攝像機的當(dāng)前視野的任何邊緣之間的差異大于一個規(guī)定閾限，決定不移動所述網(wǎng)絡(luò)攝像機；和響應(yīng)所述用戶臉部的位置與所述網(wǎng)絡(luò)攝像機的當(dāng)前視野的任何邊緣之間的差異小于一個規(guī)定閾限，決定移動所述網(wǎng)絡(luò)攝像機。
12.一種通過追蹤一用戶臉部而機械移動的網(wǎng)絡(luò)攝像機，所述網(wǎng)絡(luò)攝像機包含一用于俘獲視頻數(shù)據(jù)的光學(xué)模塊；一耦接到所述光學(xué)模塊的機器視覺模塊，其用于根據(jù)所述俘獲的視頻數(shù)據(jù)辨別所述用戶臉部的位置；一耦接到所述機器視覺模塊的移動控制模塊，其用于判定是否移動所述光學(xué)模塊；和一耦接到所述移動控制模塊的機械模塊，其用于根據(jù)所述移動控制模塊的決定來移動所述光學(xué)模塊。
13.一種用于通過追蹤一用戶臉部而機械移動一網(wǎng)絡(luò)攝像機中的一光學(xué)模塊的系統(tǒng)，所述系統(tǒng)包含一網(wǎng)絡(luò)攝像機，其包含一用于俘獲視頻數(shù)據(jù)的光學(xué)模塊；和一耦接到所述光學(xué)模塊以用于移動所述光學(xué)模塊的機械模塊；一連接到所述網(wǎng)絡(luò)攝像機的標(biāo)準(zhǔn)總線；和一耦接到所述標(biāo)準(zhǔn)總線的計算機，所述具有一驅(qū)動模塊的計算機包含一耦接到所述光學(xué)模塊的機器視覺模塊，其用于根據(jù)所述俘獲的視頻數(shù)據(jù)辨別所述用戶臉部的位置；一耦接到所述機器視覺模塊的移動控制模塊，其用于判定是否移動所述光學(xué)模塊，并將所述決定提供給所述機械模塊。
全文摘要
本發(fā)明揭示一種用于機械平搖、俯仰和/或變焦推拉一網(wǎng)絡(luò)攝像機以追蹤一用戶臉部的系統(tǒng)和方法。在一個實施例中，所述移動由一所述網(wǎng)絡(luò)攝像機向其發(fā)送視頻數(shù)據(jù)的主機中的核心軟件控制。這樣，所述主機核心中的驅(qū)動器操縱所述臉部追蹤，對存取所述視頻的應(yīng)用程序透明。在一個替代實施例中，所述移動由所述網(wǎng)絡(luò)攝像機自身中的固件所控制。所述視頻和控制信號通過相同標(biāo)準(zhǔn)電纜(如，USB總線)發(fā)送。在一個實施例中，將視頻提供給一即時消息接發(fā)應(yīng)用。通過所述即時消息接發(fā)應(yīng)用，使用標(biāo)準(zhǔn)總線(例如，USB)和將臉部追蹤卸載到所述網(wǎng)絡(luò)攝像機和驅(qū)動器允許較容易的使用。
文檔編號H04N5/225GK1756306SQ200510073419
公開日2006年4月5日申請日期2005年5月24日優(yōu)先權(quán)日2004年10月1日
發(fā)明者保羅·麥卡爾平, 奧利維爾·萊赫內(nèi)恩內(nèi), 文卡泰什·圖馬提·克里希南, 帕特里克·米奧托恩, 雷米·齊默爾曼, 張玉林申請人:羅技?xì)W洲公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：保羅.麥卡爾平;奧利維爾.萊赫內(nèi)恩內(nèi);文卡泰什.圖馬提.克里希南;帕特里克.米奧托恩;雷米.齊默爾曼;張玉林
技術(shù)所有人：羅技?xì)W洲公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

光學(xué)指紋模塊相關(guān)技術(shù)

fpm10a光學(xué)指紋模塊相關(guān)技術(shù)

dxo光學(xué)模塊下載相關(guān)技術(shù)

dxo光學(xué)模塊無法下載相關(guān)技術(shù)

光學(xué)指紋識別模塊相關(guān)技術(shù)

光學(xué)模塊相關(guān)技術(shù)

dxo光學(xué)模塊相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

移動網(wǎng)絡(luò)攝像機的光學(xué)模塊的系統(tǒng)，方法及網(wǎng)絡(luò)攝像機的制作方法