專利名稱:視訊設(shè)備控制方法、裝置及視訊系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音視頻通信技術(shù)領(lǐng)域,更具體地說,涉及一種視訊設(shè)備控制方法、裝置及具有該裝置的視訊系統(tǒng)。
背景技術(shù):
視訊系統(tǒng)是一種集視頻、音頻、數(shù)據(jù)通信于一體的新一代交互式多媒體通信系統(tǒng), 是基于通信網(wǎng)絡(luò)上的一種增值業(yè)務(wù),其為身處異地的與會(huì)者提供了一個(gè)虛擬的會(huì)議室,使與會(huì)者們就像身處于同一個(gè)房間內(nèi),方便的召開“面對(duì)面”的會(huì)議。為了有效的削減運(yùn)營(yíng)成本,越來越多企業(yè)、政府機(jī)關(guān)等選擇利用視訊會(huì)議來取代原來的城市與國(guó)家之間的商務(wù)出差?,F(xiàn)有技術(shù)中,一般是按照與會(huì)者參加會(huì)議的模式(常規(guī)模式是坐著參加會(huì)議的方式,下面簡(jiǎn)稱為與會(huì)模式)來設(shè)計(jì)會(huì)場(chǎng)環(huán)境,所述會(huì)場(chǎng)環(huán)境包括與會(huì)者座位及各種視訊設(shè)備(包括顯示器、攝像機(jī))的位置。一方面,從降低會(huì)場(chǎng)環(huán)境配置工作量的角度,為了避免頻繁改動(dòng)會(huì)場(chǎng)環(huán)境帶來較多的工作量,會(huì)場(chǎng)環(huán)境一般是不做改變的。另一方面,從方便與會(huì)者參加會(huì)議的角度,與會(huì)模式應(yīng)當(dāng)是靈活變化的,這樣可以適應(yīng)不同與會(huì)者的習(xí)慣,如有些與會(huì)者習(xí)慣坐著參加會(huì)議,而有些與會(huì)者習(xí)慣站著參加會(huì)議;另外,也可以適應(yīng)與會(huì)者的會(huì)議需求,如在技術(shù)報(bào)告會(huì)上,需要與會(huì)者演示某技術(shù)內(nèi)容,不可避免地會(huì)改變與會(huì)模式。但是,這兩方面的需求在現(xiàn)有技術(shù)中卻是矛盾的由于會(huì)議環(huán)境是根據(jù)與會(huì)模式配置的,兩者之間是一種綁定的關(guān)系,這意味著如要靈活改變與會(huì)模式以適應(yīng)與會(huì)者的與會(huì)需求,則需要重新配置會(huì)議環(huán)境,而如果保持會(huì)議環(huán)境配置,則無法適應(yīng)與會(huì)者的與會(huì)需求。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供一種視訊設(shè)備控制方法、裝置及具有該裝置的視訊系統(tǒng),能夠在與會(huì)者位置發(fā)生變化時(shí)調(diào)整攝像機(jī)及顯示器的朝向,從而保證與與會(huì)者之間的“正對(duì)”關(guān)系,靈活適應(yīng)與會(huì)者的多種與會(huì)模式并且無需修改會(huì)場(chǎng)環(huán)境。本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的一方面,本發(fā)明實(shí)施例提供一種視訊設(shè)備控制方法,所述視訊設(shè)備包括顯示器和攝像機(jī),所述顯示器和攝像機(jī)相對(duì)固定、朝向一致且與一運(yùn)動(dòng)機(jī)構(gòu)相連,所述方法包括獲取從會(huì)場(chǎng)圖像識(shí)別出的與會(huì)者人臉圖像,所述會(huì)場(chǎng)圖像由所述攝像機(jī)攝取并提供;分析所述人臉圖像,并在參考分析結(jié)果判斷出所述與會(huì)者的臉部位置偏離正對(duì)所述顯示器和攝像機(jī)的方向時(shí),確定偏離方向;控制所述運(yùn)動(dòng)機(jī)構(gòu)依據(jù)所述偏離方向,驅(qū)動(dòng)所述顯示器和攝像機(jī)移動(dòng)至與所述與會(huì)者的臉部位置正對(duì)的位置。另一方面,本發(fā)明實(shí)施例還提供一種視訊設(shè)備控制裝置,所述視訊設(shè)備包括顯示器和攝像機(jī),所述顯示器和攝像機(jī)相對(duì)固定、朝向一致且與一運(yùn)動(dòng)機(jī)構(gòu)相連,所述視訊設(shè)備控制裝置包括獲取單元,用于獲取從會(huì)場(chǎng)圖像識(shí)別出的與會(huì)者人臉圖像,所述會(huì)場(chǎng)圖像由所述攝像機(jī)攝取并提供;分析單元,用于分析所述人臉圖像;判斷單元,用于參考所述分析單元的分析結(jié)果,判斷所述與會(huì)者的臉部位置是否偏離正對(duì)所述顯示器及攝像機(jī)的方向,并在所述與會(huì)者的臉部位置偏離正對(duì)所述顯示器及攝像機(jī)的方向時(shí),確定偏離方向;控制單元,用于控制所述運(yùn)動(dòng)機(jī)構(gòu)依據(jù)所述偏離方向,驅(qū)動(dòng)所述顯示器及攝像機(jī)移動(dòng)至與所述與會(huì)者的臉部位置正對(duì)的位置。另一方面,本發(fā)明實(shí)施例還提供一種視訊系統(tǒng),包括視訊設(shè)備及中央控制單元,所述視訊設(shè)備包括顯示器和攝像機(jī),所述顯示器和攝像機(jī)相對(duì)固定、朝向一致且與一運(yùn)動(dòng)機(jī)構(gòu)相連,所述系統(tǒng)還包括獲取所述攝像機(jī)提供的會(huì)場(chǎng)圖像,從中識(shí)別出與會(huì)者的人臉圖像的人臉識(shí)別引擎;所述中央控制單元用于從所述人臉識(shí)別引擎獲取所述人臉圖像,分析所述人臉圖像,并在參考分析結(jié)果判斷出所述與會(huì)者的臉部位置偏離正對(duì)所述顯示器及攝像機(jī)的方向時(shí),確定偏離方向,控制所述運(yùn)動(dòng)機(jī)構(gòu)依據(jù)所述偏離方向,驅(qū)動(dòng)所述顯示器和攝像機(jī)移動(dòng)至與所述與會(huì)者的臉部位置正對(duì)的位置。從上述的技術(shù)方案可以看出,與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例在將顯示器和攝像機(jī)相對(duì)位置固定地(即聯(lián)動(dòng))設(shè)置于一運(yùn)動(dòng)機(jī)構(gòu)上,能夠在攝像機(jī)攝取的與會(huì)圖像中識(shí)別出與會(huì)者臉部位置后,在判斷出與會(huì)者臉部朝向發(fā)生變化時(shí),通過控制運(yùn)動(dòng)機(jī)構(gòu)工作來移動(dòng)所述顯示器及攝像機(jī),保證顯示屏和攝像機(jī)正對(duì)著與會(huì)者,從而能夠攝取到與會(huì)者的正面圖像并保證與會(huì)者觀看顯示屏畫面時(shí)是正面水平平視的,即保證了與會(huì)者之間“水平眼對(duì)眼效果”。如此,在保持會(huì)場(chǎng)環(huán)境不變的情況下,適應(yīng)與會(huì)者的多種與會(huì)模式。
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例提供的一種視訊設(shè)備控制方法的流程圖;圖2為一種會(huì)場(chǎng)環(huán)境示意圖;圖3為本發(fā)明實(shí)施例提供的另一種視訊設(shè)備控制方法的流程圖;圖4為經(jīng)過圖3所示方法之后與會(huì)者與顯示器及攝像機(jī)的示意圖;圖5為另一種會(huì)場(chǎng)環(huán)境示意圖;圖6為本發(fā)明實(shí)施例提供的又一種視訊設(shè)備控制方法的流程圖;圖7為經(jīng)過圖6所示方法之后與會(huì)者與顯示器及攝像機(jī)的一種示意圖;圖8為經(jīng)過圖6所示方法之后與會(huì)者與顯示器及攝像機(jī)的另一種示意圖;圖9為本發(fā)明實(shí)施例提供的另外一種視訊設(shè)備控制方法的流程圖10為又一種會(huì)場(chǎng)環(huán)境示意圖;圖11為本發(fā)明實(shí)施例提供的另外一種視訊設(shè)備控制方法的流程圖;圖12為本發(fā)明實(shí)施例提供的一種視訊設(shè)備控制裝置的結(jié)構(gòu)示意圖;圖13-圖16為本發(fā)明實(shí)施例提供的幾種視訊系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例提供了一種技術(shù)方案,能夠在與會(huì)者位置發(fā)生變化時(shí)調(diào)整攝像機(jī)及顯示器的朝向,從而保證與與會(huì)者之間的“正對(duì)”關(guān)系,在無需改變會(huì)場(chǎng)環(huán)境的情況下,靈活適應(yīng)與會(huì)者的多種與會(huì)模式。為了引用和清楚起見,本文中使用的技術(shù)名詞、簡(jiǎn)寫或縮寫總結(jié)如下WEB,web,即Web頁(yè)面網(wǎng)狀組織;WIFI, Wireless Fidelity,即無線保真;C/S,Client/Server,即客戶 / 服務(wù)器;MIC,Microphone,麥克風(fēng);IP, Internet Protocol,網(wǎng)絡(luò)互連協(xié)議。下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明實(shí)施例公開的視訊設(shè)備控制方法針對(duì)攝像機(jī)和顯示器處于“聯(lián)動(dòng)”關(guān)系的視訊設(shè)備,即攝像機(jī)和顯示器位置相對(duì)固定、朝向一致且與一運(yùn)動(dòng)機(jī)構(gòu)相連,在所述運(yùn)動(dòng)機(jī)構(gòu)的驅(qū)動(dòng)下運(yùn)動(dòng)(移動(dòng)或轉(zhuǎn)動(dòng))。圖1示出了所述視訊設(shè)備控制方法的流程圖,包括以下步驟步驟S101、獲取從會(huì)場(chǎng)圖像識(shí)別出的與會(huì)者人臉圖像,所述會(huì)場(chǎng)圖像由所述攝像機(jī)攝取并提供。具體的過程為首先通過攝像機(jī)攝取會(huì)場(chǎng)圖像,然后通過人臉識(shí)別技術(shù)從所述會(huì)場(chǎng)圖像中識(shí)別出與會(huì)者的人臉圖像。步驟S102、分析所述人臉圖像。步驟S103、并參考分析結(jié)果判斷所述與會(huì)者的臉部位置是否偏離正對(duì)所述顯示器及攝像機(jī)的方向,若是,進(jìn)入步驟S104,否則,返回步驟SlOl。步驟S104、確定偏離方向。分析所述人臉圖像,參考分析結(jié)果判斷所述與會(huì)者的臉部位置是否偏離正對(duì)所述視訊設(shè)備的方向,并確定偏離距離,具有多種方式,下面做簡(jiǎn)單介紹一種方式圖像比對(duì)方式,即將上述步驟SlOl獲取到的人臉圖像與預(yù)先存儲(chǔ)的參考人臉圖像進(jìn)行比對(duì),所述參考人臉圖像是正對(duì)所述視訊設(shè)備方向的人臉圖像,因此,如果比較結(jié)果顯示獲取到的人臉圖像與所述參考人臉圖像位置不一致,則可認(rèn)為所述與會(huì)者的臉部位置偏離正對(duì)所述視訊設(shè)備的方向。還有一種方式是同時(shí)結(jié)合圖像比對(duì)及聲音比對(duì)方式,即將上述步驟SlOl獲取到的人臉圖像與預(yù)先存儲(chǔ)的參考人臉圖像進(jìn)行比對(duì),圖像比對(duì)過程與上述方式相同,同時(shí)采集與會(huì)者前方兩側(cè)(即所述視訊設(shè)備正前方的兩側(cè))的會(huì)場(chǎng)音頻數(shù)據(jù),并進(jìn)行比較,當(dāng)兩側(cè)的會(huì)場(chǎng)聲音音量相等或基本相等時(shí),可以認(rèn)為與會(huì)者的臉部位置正對(duì)所述視訊設(shè)備方向, 而當(dāng)兩側(cè)的會(huì)場(chǎng)聲音音量明顯不相等(可以設(shè)置閾值,當(dāng)音量差值超過該閾值,則認(rèn)為音量明顯不相等),則可認(rèn)為與會(huì)者的臉部位置偏離正對(duì)所述視訊設(shè)備的方向??梢岳斫猓瑓⒖挤治鼋Y(jié)果判斷所述與會(huì)者的臉部位置是否偏離正對(duì)所述視訊設(shè)備的方向,并確定偏離距離,還可以有其他的實(shí)現(xiàn)方式,上述對(duì)于具體方式的實(shí)現(xiàn)不構(gòu)成對(duì)于本發(fā)明范圍的限制。所述參考人臉圖像為與會(huì)者臉部位置正對(duì)視訊設(shè)備的圖像,可以在執(zhí)行上述步驟 SlOl開始之前,由與會(huì)者端坐(或者站立)于視訊設(shè)備前方,臉部位置正對(duì)所述攝像機(jī),由所述攝像機(jī)攝取并存儲(chǔ)于視訊系統(tǒng)中央處理器或者單獨(dú)一個(gè)存儲(chǔ)器內(nèi),此過程可稱為一個(gè) “學(xué)習(xí)”的過程。當(dāng)然,也可以是所述與會(huì)者在之前其他視訊會(huì)議時(shí)所采集的臉部位置正對(duì)視訊設(shè)備的圖像。步驟S105、控制所述運(yùn)動(dòng)機(jī)構(gòu)依據(jù)所述偏離方向,驅(qū)動(dòng)所述視訊設(shè)備移動(dòng)至與所述與會(huì)者的臉部位置正對(duì)的位置。在判斷出與會(huì)者的臉部位置偏離正對(duì)所述視訊設(shè)備的方向后,至少有以下兩種方式控制所述運(yùn)動(dòng)機(jī)構(gòu)以驅(qū)動(dòng)所述視訊設(shè)備移動(dòng)至與所述與會(huì)者的臉部正對(duì)的位置一種控制方式是根據(jù)偏離方向確定調(diào)整方向,例如當(dāng)步驟SlOl獲取到的人臉圖像中某些主要特征(例如眼鏡、鼻子或嘴巴)位于參考人臉圖像中相應(yīng)特征的左側(cè),則可確定與會(huì)者向左移動(dòng),從而可以確定視訊設(shè)備的調(diào)整方向?yàn)椤跋蛴摇?。則可以控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)所述視訊設(shè)備向右移動(dòng),每次移動(dòng)預(yù)定距離(步長(zhǎng)),并在每次移動(dòng)后獲取從會(huì)場(chǎng)圖像識(shí)別出的與會(huì)者人臉圖像,與所述參考人臉圖像進(jìn)行比較,根據(jù)比較結(jié)果判斷兩者是否重合 (或者一致),若是,則停止運(yùn)動(dòng)機(jī)構(gòu)工作,否則,繼續(xù)控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)所述視訊設(shè)備向右移動(dòng),直至兩者重合(或者一致)。另一種控制方式是進(jìn)一步確定調(diào)整距離,然后控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)所述視訊設(shè)備沿著所述調(diào)整方向移動(dòng)所述調(diào)整距離;具體可通過如下方式確定調(diào)整距離和移動(dòng),但并不局限于此根據(jù)系統(tǒng)的經(jīng)驗(yàn)值估計(jì)得到目標(biāo)調(diào)整位置,并以此目標(biāo)調(diào)整位置估算出需要調(diào)整的距離,然后通過控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)視訊設(shè)備進(jìn)行移動(dòng),當(dāng)達(dá)到目標(biāo)調(diào)整位置后,利用攝像機(jī)拍攝與會(huì)者的圖像與預(yù)先攝取的與會(huì)者臉部位置圖像進(jìn)行比較,利用比較結(jié)構(gòu)進(jìn)行運(yùn)動(dòng)機(jī)構(gòu)的微量控制,使調(diào)整后攝相機(jī)拍攝的與會(huì)者的圖像與預(yù)先存儲(chǔ)的參考人臉圖像基本重合或者方位一致??梢钥闯觯景l(fā)明實(shí)施例將顯示器與攝像機(jī)設(shè)置為聯(lián)動(dòng)結(jié)構(gòu),結(jié)合人臉識(shí)別技術(shù)判斷與會(huì)者位置是否發(fā)生變化,并在確定與會(huì)者臉部位置偏離顯示器和攝像機(jī)時(shí),控制顯示器和攝像機(jī)移動(dòng)至正對(duì)所述與會(huì)者的位置。至少具有以下作用1、由于顯示器與攝像機(jī)是“聯(lián)動(dòng)”的關(guān)系,則在與會(huì)者正對(duì)顯示器時(shí)攝像機(jī)能夠攝取與會(huì)者的正面圖像,即在保證攝像機(jī)攝取正面圖像的情況下與會(huì)者之間能夠保持“水平眼對(duì)眼”的交流;2、本實(shí)施例中,在與會(huì)者與會(huì)模式改變的情況下,顯示器可以根據(jù)與會(huì)者的與會(huì)模式進(jìn)行位置調(diào)整,此過程無需改變會(huì)場(chǎng)環(huán)境,即本實(shí)施例能夠在不修改會(huì)場(chǎng)環(huán)境的情況下適應(yīng)與會(huì)者的多種與會(huì)模式。一般情況下,與會(huì)者的位置變化可以分為垂直方向上的變化、水平方向上的變化及結(jié)合垂直方向和水平方向的變化,為了本領(lǐng)域技術(shù)人員能夠更清楚的理解本發(fā)明實(shí)施例,下面針對(duì)這三種位置變化提供幾個(gè)應(yīng)用例應(yīng)用例一會(huì)議開始時(shí),與會(huì)者坐在顯示器和攝像機(jī)前方,臉部位置正對(duì)所述顯示器和攝像機(jī)前方,如圖2所示,圖中,點(diǎn)劃線表示顯示器的正對(duì)范圍,虛線表示攝像機(jī)的攝像范圍。之后,與會(huì)者從坐著模式變成站立模式,水平方向上無變化。此過程中,本發(fā)明實(shí)施例的控制方法的流程如圖3所示,包括以下步驟步驟S301、獲取與會(huì)者人臉圖像。通過攝像機(jī)攝取會(huì)場(chǎng)圖像,并由人臉?biāo)阉饕鎻乃鰰?huì)場(chǎng)圖像識(shí)別出與會(huì)者的人臉圖像。步驟S302-步驟S303、比較所述人臉圖像及預(yù)先存儲(chǔ)的參考人臉圖像,根據(jù)比較結(jié)果判斷與會(huì)者臉部位置是否偏離顯示器及攝像機(jī)的正對(duì)方向,若是,進(jìn)入步驟S304,否則,返回步驟S301。步驟S304、確認(rèn)與會(huì)者臉部位置的在垂直方向上向上偏移。具體過程可以是,判斷兩幅圖像中主要特征(例如眼睛、鼻子或嘴巴)的位置,如果位置一樣,則意味著與會(huì)者位置沒有發(fā)生變化,如果不一樣,則意味著與會(huì)者的臉部位置偏離顯示器及攝像機(jī)的正對(duì)方向。本實(shí)施例中,當(dāng)獲取到的與會(huì)者人臉圖像與所述預(yù)先存儲(chǔ)的參考人臉圖像位置偏上,則可確定與會(huì)者從坐著變成站立,即表明所述與會(huì)者的臉部位置僅在垂直方向上從較低位置移動(dòng)至較高位置,而水平方向上則無變化。步驟S305、控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)所述顯示器和攝像機(jī)向上移動(dòng),返回步驟S301。其中,根據(jù)實(shí)時(shí)判斷出的與會(huì)者的位置變化控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)所述顯示器和攝像機(jī)移動(dòng),并且移動(dòng)的方向可以根據(jù)判斷出的與會(huì)者的位置進(jìn)行動(dòng)態(tài)調(diào)整。所述運(yùn)動(dòng)機(jī)構(gòu)至少包括垂直升降機(jī)構(gòu),垂直升降機(jī)構(gòu)可以采用絲桿或者齒輪的方式實(shí)現(xiàn)升降,屬于現(xiàn)有技術(shù),本文對(duì)此不做贅述。在執(zhí)行本發(fā)明實(shí)施例過程中,可能與會(huì)者位置又發(fā)生了變化,因此需要再繼續(xù)返回執(zhí)行步驟S301-步驟S303,必要時(shí)還需要執(zhí)行步驟S304和步驟S305,甚至繼續(xù)執(zhí)行下一次循環(huán)(步驟S301-步驟S305)。經(jīng)過一次或多次循環(huán),與會(huì)者的臉部位置正對(duì)顯示器及攝像機(jī),如圖4所示。本發(fā)明實(shí)施例對(duì)于與會(huì)者從站立變成坐下的情況,基本思路與本應(yīng)用例相似,區(qū)別僅是確認(rèn)與會(huì)者臉部位置的在垂直方向上向下偏移后,控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)所述顯示器和攝像機(jī)向下移動(dòng)。需要說明的是,對(duì)于與會(huì)者僅在兩種與會(huì)模式之間切換的,例如與會(huì)者只有站著和坐著兩種模式,可以預(yù)先確定與會(huì)者坐著及站立時(shí)臉部位置的偏移距離,以便后續(xù)在確認(rèn)出與會(huì)者臉部位置發(fā)生偏離時(shí),控制顯示器及攝像機(jī)沿偏離方向移動(dòng)所述偏移距離,方便、快捷。應(yīng)用例二與會(huì)初始,與會(huì)者坐在(或站立于)顯示器和攝像機(jī)前方,臉部位置正對(duì)所述顯示器和攝像機(jī)前方,如圖5所示。之后,與會(huì)者從在水平方向上向左移動(dòng)至?xí)?chǎng)上的另外一個(gè)位置,垂直方向上無變化。此過程中,本發(fā)明實(shí)施例的控制方法的一種實(shí)現(xiàn)流程如圖6所示,包括以下步驟步驟S601、獲取與會(huì)者人臉圖像。與前文步驟S301內(nèi)容基本相同。步驟S602-步驟S603、比較所述人臉圖像及預(yù)先存儲(chǔ)的參考人臉圖像,根據(jù)比較結(jié)果判斷與會(huì)者臉部位置是否偏離顯示器及攝像機(jī)的正對(duì)方向,若是,進(jìn)入步驟S604,否則,返回步驟S601。步驟S604、確認(rèn)與會(huì)者臉部位置的在水平方向上向左偏移。具體過程可以是,判斷兩幅圖像中主要特征(例如眼睛、鼻子或嘴巴)的位置,如果位置一樣,則意味著與會(huì)者位置沒有發(fā)生變化,如果不一樣,則意味著與會(huì)者的臉部位置偏離顯示器及攝像機(jī)的正對(duì)方向。本實(shí)施例中,與會(huì)者從一個(gè)位置向左(從與會(huì)者的角度) 移動(dòng)到另外一個(gè)位置站立,則相當(dāng)于所述與會(huì)者的臉部位置僅在水平方向上移動(dòng),而垂直方向上則無變化,即,采用上述定位方式能夠區(qū)別與會(huì)者在水平方位上的移動(dòng)方向。步驟S605、控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)所述顯示器和攝像機(jī)向右轉(zhuǎn)動(dòng),返回步驟S601。所述運(yùn)動(dòng)機(jī)構(gòu)至少包括水平轉(zhuǎn)動(dòng)機(jī)構(gòu),所述水平轉(zhuǎn)動(dòng)機(jī)構(gòu)可以采用連桿、凸輪或者齒輪實(shí)現(xiàn)所述顯示器和攝像機(jī)的水平轉(zhuǎn)動(dòng),屬于現(xiàn)有技術(shù),本文不做贅述。在驅(qū)動(dòng)所述顯示器和攝像機(jī)向右轉(zhuǎn)動(dòng)后,此過程中可能與會(huì)者位置又發(fā)生了變化,因此需要再繼續(xù)返回執(zhí)行步驟S601-步驟S603,必要時(shí)還需要執(zhí)行步驟S604和步驟 S605,甚至繼續(xù)執(zhí)行下一次循環(huán)(步驟S601-步驟S605)。經(jīng)過一次或多次循環(huán),與會(huì)者的臉部位置正對(duì)顯示器及攝像機(jī),如圖7所示,圖中虛線表示原先位置,實(shí)線表示當(dāng)前位置。 需要說明的是,在其他實(shí)施例中,所述顯示器和攝像機(jī)的運(yùn)動(dòng)方式是水平移動(dòng),需要由水平移動(dòng)機(jī)構(gòu)代替所述水平轉(zhuǎn)動(dòng)機(jī)構(gòu),所述水平移動(dòng)機(jī)構(gòu)可以通過滑軌結(jié)構(gòu)實(shí)現(xiàn)所述顯示器和攝像機(jī)的水平移動(dòng),同樣屬于現(xiàn)有技術(shù),本文不做贅述。當(dāng)然,對(duì)于與會(huì)者從在水平方向上向左移動(dòng)至?xí)?chǎng)上的另外一個(gè)位置,垂直方向上無變化的情況,本應(yīng)用例僅在步驟S604時(shí)確定與會(huì)者臉部位置的在水平方向上向右偏移,并在步驟S605時(shí),控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)所述顯示器和攝像機(jī)向左轉(zhuǎn)動(dòng),其他基本相同。經(jīng)過一次或多次循環(huán),與會(huì)者的臉部位置正對(duì)顯示器及攝像機(jī),如圖8所示,圖中虛線表示原先位置,實(shí)線表示當(dāng)前位置。在相同的場(chǎng)景下,可以結(jié)合人臉識(shí)別和跟蹤技術(shù)及聲音定位技術(shù)判斷與會(huì)者臉部位置是否偏離顯示器及攝像機(jī)的正對(duì)方向及偏離方向。具體流程如圖9所示,包括以下步驟步驟S901、獲取與會(huì)者人臉圖像。與前文步驟S601內(nèi)容基本相同。步驟S902、比較所述人臉圖像及預(yù)先存儲(chǔ)的參考人臉圖像,得到比較結(jié)果,進(jìn)入步驟 S904。步驟S903、采集與會(huì)者正對(duì)所述顯示器和攝像機(jī)方向兩側(cè)的音頻數(shù)據(jù)(具體為音量),比較兩者數(shù)值大小,進(jìn)入步驟S904。本應(yīng)用例在會(huì)場(chǎng)中位于與會(huì)者前方,位于所述與會(huì)者正對(duì)所述顯示器和攝像機(jī)方向的兩側(cè)分別設(shè)置一個(gè)MIC(MIC1和MIC2),如圖10所示。步驟S904-步驟S905,綜合考慮步驟S902和步驟S903的比較結(jié)果,判斷人臉位置是否發(fā)生偏離,若是,進(jìn)入步驟S906,否則進(jìn)入步驟S901和步驟S903。一般來說,如果與會(huì)者位置偏左或者偏右(相對(duì)于正對(duì)所述顯示器和攝像機(jī)方向來說),兩個(gè)MIC采集到的音量大小也會(huì)發(fā)生變化,也就是說通過MIC,可以初步估計(jì)出與會(huì)者移動(dòng)的方位,即向左還是向右,如果MIC 2采集到的音量大于MIC 1采集到的音量,并超出預(yù)設(shè)門限值(兩個(gè)MIC拾音音量大小差的絕對(duì)值在這個(gè)門限值內(nèi),則不認(rèn)為與會(huì)者在水平位置發(fā)生了變化),則認(rèn)為與會(huì)者在水平方向上向右移動(dòng),反之認(rèn)為與會(huì)者在水平方向上向左移動(dòng)。但是,由于會(huì)場(chǎng)中不同位置可能存在雜音,即不是與會(huì)者本身發(fā)出的聲音,從而會(huì)干擾判斷結(jié)果,因此,本應(yīng)用例僅將聲音定位技術(shù)所執(zhí)行判斷操作得到的結(jié)果作為輔助參考,仍然以圖像比較得到的判斷結(jié)果作為主要依據(jù)。步驟S906、確定偏離方向。本應(yīng)用例中,確定偏離方向?yàn)樗较蜃?。步驟S907、控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)所述顯示器和攝像機(jī)運(yùn)動(dòng),以保證與所述與會(huì)者臉部位置正對(duì)。與前文兩個(gè)應(yīng)用例相似,本應(yīng)用例可能需要執(zhí)行一次或者多次循環(huán)(步驟 S901-步驟S907),才能實(shí)現(xiàn)顯示器及攝像機(jī)正對(duì)所述會(huì)者的臉部位置。本應(yīng)用例利用聲音定位技術(shù)采集音量數(shù)據(jù),進(jìn)行比較后,依據(jù)比較結(jié)果對(duì)采用人臉識(shí)別和跟蹤技術(shù)得出的判斷結(jié)果進(jìn)行驗(yàn)證和確認(rèn),進(jìn)一步提高了判斷的準(zhǔn)確性。應(yīng)用例三與會(huì)初始,與會(huì)者坐在(或站立于)顯示器和攝像機(jī)前方,臉部位置正對(duì)所述顯示器和攝像機(jī)前方。之后,與會(huì)者從在水平方向上移動(dòng)至?xí)?chǎng)上的另外一個(gè)位置,垂直方向也發(fā)生了變化(如從坐著變成站立)。此過程中,本發(fā)明實(shí)施例的控制方法的一種實(shí)現(xiàn)流程如圖11所示,包括以下步驟步驟SllOl-步驟S1105,與上述應(yīng)用例中的步驟S901-步驟S905基本相同。在步驟S1105中,綜合分析如果僅在在會(huì)場(chǎng)中位于與會(huì)者前方,位于所述與會(huì)者正對(duì)所述顯示器和攝像機(jī)方向的兩側(cè)分別設(shè)置一個(gè)MIC,則根據(jù)音量比對(duì)后所能確定的偏離方向只有偏左或偏右兩種,本應(yīng)用例中,依據(jù)聲音定位方式得到的比較結(jié)果確定偏離方向?yàn)樗较蜃?。而依?jù)人臉圖像比較的方式得到的比較結(jié)果確定偏離方向?yàn)椤八较蜃? 垂直向上”。步驟S1106、確定偏離方向?yàn)椤八较蜃?垂直向上”。具體的,如果與會(huì)者位置有變化,則兩個(gè)MIC采集到的音量大小也會(huì)發(fā)生變化,即當(dāng)MIC 2采集到的音量小于MIC 1采集到的音量,并超出預(yù)設(shè)門限值(兩個(gè)MIC拾音音量大小差的絕對(duì)值在這個(gè)門限值內(nèi),則不認(rèn)為與會(huì)者在水平位置發(fā)生了變化),則認(rèn)為與會(huì)者在水平方向上向左移動(dòng);同時(shí),本實(shí)施例中,當(dāng)獲取到的與會(huì)者人臉圖像與所述預(yù)先存儲(chǔ)的參考人臉圖像位置偏上,即表明所述與會(huì)者的臉部位置在垂直方向上從較低位置移動(dòng)至較高位置,則認(rèn)為與會(huì)者在垂直方向上向上移動(dòng);因此,最后確定的偏離方向?yàn)椤八较蜃?垂直向上”(即偏離方向?yàn)樽笊戏椒较颍摲较蚺c水平方向呈預(yù)設(shè)角度)。步驟S1107、控制運(yùn)動(dòng)機(jī)構(gòu)驅(qū)動(dòng)所述顯示器和攝像機(jī)運(yùn)動(dòng),以保證與所述與會(huì)者臉部位置正對(duì)。顯示器和攝像機(jī)運(yùn)動(dòng)包括兩個(gè)過程垂直移動(dòng)過程+水平移動(dòng)過程??梢韵韧瓿纱怪币苿?dòng)過程,然后再進(jìn)行水平移動(dòng)過程,或者先完成水平移動(dòng)過程,再進(jìn)行垂直移動(dòng)過程。需要說明的是,對(duì)于上述各應(yīng)用例中所述的聲音定位方式,即通過在會(huì)場(chǎng)中架設(shè)用于采集音量數(shù)據(jù)的音頻單元(即MIC),通過音量的比對(duì)確定是否與會(huì)者的臉部位置是否偏離正對(duì)所述顯示器和攝像機(jī)的方向及偏離方向。本文只將它作為某種應(yīng)用場(chǎng)景之下應(yīng)用,即與會(huì)者從處于會(huì)場(chǎng)中心(如圖2所示位置)的位置向左或者向右移動(dòng)至另外一個(gè)位置時(shí)。在其他應(yīng)用場(chǎng)景中,例如與會(huì)者從偏離會(huì)場(chǎng)中心的位置(如圖7中實(shí)線所示位置) 偏離至另外一個(gè)位置,所述聲音定位方式將被屏蔽或關(guān)閉??梢钥闯?,本實(shí)施例提供的視訊設(shè)備控制方法中,顯示器和攝像機(jī)之間為聯(lián)動(dòng)關(guān)系,可以在一運(yùn)動(dòng)機(jī)構(gòu)的驅(qū)動(dòng)下同時(shí)運(yùn)動(dòng),方便控制,且在與會(huì)者正對(duì)顯示器時(shí)攝像機(jī)能夠攝取與會(huì)者的正面圖像,即在保證攝像機(jī)攝取正面圖像的情況下與會(huì)者之間能夠保持“水平眼對(duì)眼”的交流,為與會(huì)者提供較好的與會(huì)體驗(yàn)。并且,能夠在與會(huì)中根據(jù)與會(huì)者的與會(huì)模式的改變調(diào)整顯示器和攝像機(jī)的位置,給與會(huì)者較大的空間自由度,并能適用較多的會(huì)議場(chǎng)景,且無需修改會(huì)場(chǎng)環(huán)境。需要補(bǔ)充說明的是,本實(shí)施例所提供的方法可以是根據(jù)與會(huì)者指令觸發(fā)的,也就是說,本方法在與會(huì)者的與會(huì)過程中可以不需要一直執(zhí)行,而僅在接收到與會(huì)者的觸發(fā)指令后執(zhí)行。如此,與會(huì)者可以在需要改變?cè)跁?huì)場(chǎng)中位置(即改變與會(huì)模式)時(shí)觸發(fā)執(zhí)行本方法,在不需要改變會(huì)場(chǎng)中位置時(shí),關(guān)閉或者不觸發(fā)本方法的執(zhí)行。其觸發(fā)的方式可以通過設(shè)置在會(huì)場(chǎng)中或攝像機(jī)或顯示器上的某按鍵發(fā)送指令實(shí)現(xiàn),也可以通過手持電子設(shè)備(例如遙控器)發(fā)送觸發(fā)控制信號(hào)實(shí)現(xiàn)。此外,對(duì)于與會(huì)者在與會(huì)開始前已經(jīng)處于偏離正對(duì)所述顯示器和攝像機(jī)較遠(yuǎn)的位置的這種情況,本發(fā)明另外實(shí)施例中,可以根據(jù)所述與會(huì)者的指令直接控制所述運(yùn)動(dòng)機(jī)構(gòu)移動(dòng)或轉(zhuǎn)動(dòng)所述顯示器和攝像機(jī),并在接收到觸發(fā)信息后才執(zhí)行上述各方法實(shí)施例過程。 也就是說,與會(huì)者可以預(yù)先對(duì)所述顯示器和攝像機(jī)進(jìn)行“粗調(diào)”,然后在由本實(shí)施例提供的方法進(jìn)行“細(xì)調(diào)”。針對(duì)上述方法本發(fā)明實(shí)施例同時(shí)還提供了一種視訊設(shè)備控制裝置及具有該視訊設(shè)備控制裝置的視訊系統(tǒng)。所述視訊設(shè)備控制裝置用于執(zhí)行上述視訊設(shè)備控制方法相關(guān)流程。圖12示出了該裝置的一種邏輯結(jié)構(gòu)示意圖,所述視訊設(shè)備包括顯示器和攝像機(jī),所述顯示器和攝像機(jī)相對(duì)固定、朝向一致且與一運(yùn)動(dòng)機(jī)構(gòu)相連,從圖中可以看出,該控制裝置包括獲取單元 121、分析單元122、判斷單元123和控制單元124,其中所述獲取單元121,用于獲取從會(huì)場(chǎng)圖像識(shí)別出的與會(huì)者人臉圖像,所述會(huì)場(chǎng)圖像由所述攝像機(jī)攝取并提供。所述分析單元122,用于分析所述人臉圖像。所述判斷單元123,用于參考所述分析單元的分析結(jié)果,判斷所述與會(huì)者的臉部位置是否偏離正對(duì)所述顯示器及攝像機(jī)的方向,并在所述與會(huì)者的臉部位置偏離正對(duì)所述顯示器及攝像機(jī)的方向時(shí),確定偏離方向。所述控制單元124,用于控制所述運(yùn)動(dòng)機(jī)構(gòu)依據(jù)所述偏離方向,驅(qū)動(dòng)所述視訊設(shè)備移動(dòng)至與所述與會(huì)者的臉部位置正對(duì)的位置。本裝置主要是用于實(shí)現(xiàn)上述視訊設(shè)備控制方法,因此本裝置的工作過程可以參照前文方法部分的內(nèi)容。具體的,所述視訊控制裝置為視訊系統(tǒng)中的中央控制單元(或中央控制器)或者作為所述中央控制單元的一部分。其通過某些管腳或者線路連接外部的攝像機(jī)、人臉?biāo)阉饕婕斑\(yùn)動(dòng)機(jī)構(gòu),連接結(jié)構(gòu)如圖13所示,這部分連接結(jié)構(gòu)形成視訊系統(tǒng)或所述視訊系統(tǒng)的部分結(jié)構(gòu)。參考圖14,為本發(fā)明實(shí)施例提供的一種視訊系統(tǒng)的結(jié)構(gòu)示意圖,從圖中可以看出, 所述視訊系統(tǒng)包括中央控制單元141、運(yùn)動(dòng)機(jī)構(gòu)142、視訊設(shè)備(攝像機(jī)和顯示器)143、人臉識(shí)別引擎144、音視頻編解碼器145、交換機(jī)146和揚(yáng)聲器147,其中所述攝像機(jī)和顯示器143中,攝像機(jī)為系統(tǒng)的視頻輸入源,顯示器為系統(tǒng)的輸出視頻顯示設(shè)備,兩者相對(duì)位置固定,在運(yùn)動(dòng)機(jī)構(gòu)142驅(qū)動(dòng)下聯(lián)動(dòng),以進(jìn)行垂直升降和水平轉(zhuǎn)動(dòng)(或移動(dòng))。所述人臉識(shí)別引擎144的核心是人臉識(shí)別、跟蹤算法,用于實(shí)時(shí)采集攝像機(jī)的視頻數(shù)據(jù)(會(huì)場(chǎng)圖像),調(diào)用人臉識(shí)別、跟蹤算法分析來分析人臉位置,并反饋給所述中央控制單元141。運(yùn)動(dòng)機(jī)構(gòu)142,包括垂直升降機(jī)構(gòu)和水平轉(zhuǎn)動(dòng)或移動(dòng)機(jī)構(gòu),并采用電子驅(qū)動(dòng)方式。 在中央控制單元的調(diào)度(即控制)下,通過驅(qū)動(dòng)電機(jī)等方式控制攝像機(jī)和顯示器143做垂直升降和水平轉(zhuǎn)動(dòng)或水平移動(dòng),或者做垂直升降、水平移動(dòng)及水平轉(zhuǎn)動(dòng)。為系統(tǒng)的執(zhí)行者。音視頻編解碼器145,其一方面對(duì)會(huì)場(chǎng)本端(即本系統(tǒng)所在一端)的音視頻數(shù)據(jù)進(jìn)行壓縮、編碼,打包成IP包,傳輸給遠(yuǎn)端;另一方面接收來自遠(yuǎn)端會(huì)場(chǎng)的IP包,解IP包并進(jìn)行視頻數(shù)據(jù)的解碼,將解碼后的視頻數(shù)據(jù)提供給本端的顯示器進(jìn)行顯示,音頻數(shù)據(jù)提供給本端揚(yáng)聲器147播放聲音。是系統(tǒng)的數(shù)據(jù)換轉(zhuǎn)者。揚(yáng)聲器147為輸出設(shè)備,接收所述音視頻編解碼器145輸出的音頻數(shù)據(jù)并播放,為系統(tǒng)的輸出者。交換機(jī)146用于協(xié)議解析和控制,為系統(tǒng)的傳輸者。其工作過程如下攝像機(jī)攝取會(huì)場(chǎng)圖像并提供給人臉識(shí)別引擎144,所述人臉識(shí)別引擎144進(jìn)行人臉識(shí)別后,將識(shí)別出的人臉圖像提供給所述中央控制單元141,所述中央控制單元141分析所述人臉圖像,并在參考分析結(jié)果判斷出所述與會(huì)者的臉部位置偏離正對(duì)所述攝像機(jī)及顯示器143的方向時(shí),確定偏離方向,然后,控制所述運(yùn)動(dòng)機(jī)構(gòu)142依據(jù)所述偏離方向,驅(qū)動(dòng)所述攝像機(jī)及顯示器143移動(dòng)至與所述與會(huì)者的臉部位置正對(duì)的位置。所述中央控制單元141具體的圖像分析過程是調(diào)用預(yù)先存儲(chǔ)的參考人臉圖像, 將人臉識(shí)別引擎144提供的人臉圖像與所述參考人臉圖像進(jìn)行比較,根據(jù)比較結(jié)果確定人臉位置是否發(fā)生變化。所述參考人臉圖像為與會(huì)者臉部位置正對(duì)視訊設(shè)備的圖像,可以于會(huì)前,由與會(huì)者端坐(或者站立)于視訊設(shè)備前方,臉部位置正對(duì)所述攝像機(jī),由所述攝像機(jī)攝取并存儲(chǔ)于中央控制單元141內(nèi)或者單獨(dú)存儲(chǔ)于一個(gè)存儲(chǔ)器內(nèi),此過程即為本系統(tǒng)的 “學(xué)習(xí)”過程。當(dāng)然,也可以是所述與會(huì)者在之前其他視訊會(huì)議時(shí)所采集的臉部位置正對(duì)視訊設(shè)備的圖像。所述中央控制單元141可以直接通過管腳或電纜發(fā)送控制信號(hào)來控制所述運(yùn)動(dòng)機(jī)構(gòu)142運(yùn)動(dòng),也可以通過無線射頻單元(圖中未示出)發(fā)送無線控制信號(hào)來控制所述運(yùn)動(dòng)機(jī)構(gòu)142運(yùn)動(dòng)。在某些實(shí)施例提供個(gè)視訊系統(tǒng)中,還可以進(jìn)一步包括位于與會(huì)者前方,位于所述與會(huì)者正對(duì)所述顯示器和攝像機(jī)方向的兩側(cè)的音頻設(shè)備,如圖15所示,視訊系統(tǒng)還包括 MICl和MIC2以及處理音頻數(shù)據(jù)的MIC音源處理單元148,MIC1和MIC2分別位于與會(huì)者前方,位于所述與會(huì)者正對(duì)所述顯示器和攝像機(jī)方向的兩側(cè)。所述MICl和MIC2作為音源采集設(shè)備,用于完成聲電轉(zhuǎn)換,采集會(huì)場(chǎng)的聲音,送給所述MIC音源處理單元148。是系統(tǒng)的輸入者。所述MIC音源處理單元148用于對(duì)MICl和MIC2采集的音頻數(shù)據(jù)(音量)進(jìn)行放大、濾波及量化等前處理,并在處理完之后,一方面將音頻數(shù)據(jù)提供給音視頻編解碼器 145進(jìn)行解碼,另一方面,比較兩路MIC拾取(即采集)的音量大小,以此估計(jì)出與會(huì)者的臉部位置偏向哪個(gè)MIC,并將此估計(jì)結(jié)果傳遞給所述中央控制單元141,所述中央控制單元 141即可據(jù)此大致判斷出所述與會(huì)者臉部位置是否偏離正對(duì)所述攝像機(jī)和顯示器143的方向及偏離方向。是系統(tǒng)的分析者。在本視訊系統(tǒng)中,所述中央控制單元141綜合所述人臉識(shí)別引擎144提供的信息及所述MIC音源處理單元148提供的信息,作出最終判斷。需要說明的是,由于會(huì)場(chǎng)中不同位置可能存在雜音(即不是與會(huì)者本身發(fā)出的聲音),從而會(huì)干擾判斷結(jié)果,因此,本視訊系統(tǒng)僅將所述MIC音源處理單元148提供的信息作為輔助參考,而以所述人臉識(shí)別引擎144 提供的信息作為主要判斷依據(jù),即當(dāng)根據(jù)所述人臉識(shí)別引擎144及所述MIC音源處理單元 148提供的信息分析得到的判斷結(jié)果不一致時(shí),以依據(jù)所述人臉識(shí)別引擎144提供的信息做出的判斷為準(zhǔn)。在另外實(shí)施例提供的視訊系統(tǒng)中還可以包括計(jì)算機(jī)149,如圖16所示,所述計(jì)算機(jī)149用于通過C/S模式訪問系統(tǒng)的web,以對(duì)系統(tǒng)相應(yīng)設(shè)備發(fā)起設(shè)置、控制及監(jiān)控系統(tǒng)運(yùn)行狀態(tài)。也就是說,與會(huì)者可以于會(huì)前,通過該計(jì)算機(jī)149存儲(chǔ)預(yù)先拍攝得到的參考人臉圖像,為后續(xù)的圖像比對(duì)提供依據(jù),也可以通過計(jì)算機(jī)149設(shè)置相關(guān)設(shè)備(顯示器、攝像機(jī)) 的參數(shù),如亮度、圖像縮放等。還可以通過該計(jì)算機(jī)149控制所述運(yùn)動(dòng)機(jī)構(gòu)142驅(qū)動(dòng)所述攝像機(jī)及顯示器143運(yùn)動(dòng),可以對(duì)所述攝像機(jī)及顯示器143的位置進(jìn)行“粗調(diào)”,關(guān)于“粗調(diào)” 的描述可以參考前文方法部分的內(nèi)容。需要說明的是,本領(lǐng)域技術(shù)人員應(yīng)能知曉,上述各視訊系統(tǒng)中,所述交換機(jī)146、揚(yáng)聲器147屬于附加功能特征,在某些場(chǎng)景下(例如近程通信和/或耳機(jī)模式),可以不需要所述交換機(jī)146和/或揚(yáng)聲器147。另外還需要說明的是,上述人臉識(shí)別引擎144、中央控制單元141的判斷及控制操作,可以是系統(tǒng)啟動(dòng)后自動(dòng)運(yùn)行,也可以是由與會(huì)者來控制,例如與會(huì)者在需要改變與會(huì)模式(例如由坐著變成站著)時(shí),起立后通過電子設(shè)備(例如遙控器)發(fā)送觸發(fā)控制信號(hào), 觸發(fā)上述各單元進(jìn)行工作。當(dāng)然,與會(huì)者也可以通過電子設(shè)備發(fā)送關(guān)閉控制信號(hào),以停止上述各單元工作。從而避免在無需改變與會(huì)模式的情況下,而上述單元仍然處于工作狀態(tài)而導(dǎo)致的電能浪費(fèi)。本說明書中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似部分互相參見即可。對(duì)于實(shí)施例公開的裝置而言,由于其與實(shí)施例公開的方法相對(duì)應(yīng),所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法部分說明即可。本領(lǐng)域技術(shù)人員可以理解,可以使用許多不同的工藝和技術(shù)中的任意一種來表示信息、消息和信號(hào)。例如,上述說明中提到過的消息、信息都可以表示為電壓、電流、電磁波、 磁場(chǎng)或磁性粒子、光場(chǎng)或以上任意組合。專業(yè)人員還可以進(jìn)一步意識(shí)到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來實(shí)現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,所述程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(Read-Only Memory,ROM)或隨機(jī)存儲(chǔ)記憶體(Random Access Memory, RAM)等。對(duì)所公開的實(shí)施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。 對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。
權(quán)利要求
1.一種視訊設(shè)備控制方法,所述視訊設(shè)備包括顯示器和攝像機(jī),其特征在于,所述顯示器和攝像機(jī)相對(duì)固定、朝向一致且與一運(yùn)動(dòng)機(jī)構(gòu)相連,所述方法包括獲取從會(huì)場(chǎng)圖像識(shí)別出的與會(huì)者人臉圖像,所述會(huì)場(chǎng)圖像由所述攝像機(jī)攝取并提供; 分析所述人臉圖像,并在參考分析結(jié)果判斷出所述與會(huì)者的臉部位置偏離正對(duì)所述顯示器和攝像機(jī)的方向時(shí),確定偏離方向;控制所述運(yùn)動(dòng)機(jī)構(gòu)依據(jù)所述偏離方向,驅(qū)動(dòng)所述顯示器和攝像機(jī)移動(dòng)至與所述與會(huì)者的臉部位置正對(duì)的位置。
2.根據(jù)權(quán)利要求1所述的視訊設(shè)備控制方法,其特征在于,按照以下步驟分析所述人臉圖像調(diào)用預(yù)先存儲(chǔ)的參考人臉圖像,所述參考人臉圖像是預(yù)先攝取的所述與會(huì)者臉部位置正對(duì)所述顯示器和攝像機(jī)的人臉圖像;比較獲取的人臉圖像及所述參考人臉圖像,確定獲取的人臉圖像與所述參考人臉圖像相比是否發(fā)生空間位置的變化。
3.根據(jù)權(quán)利要求2所述的視訊設(shè)備控制方法,其特征在于,判斷所述與會(huì)者的臉部位置偏離正對(duì)所述顯示器及攝像機(jī)的方向包括采集所述與會(huì)者正對(duì)所述攝像機(jī)及顯示器前方兩側(cè)的會(huì)場(chǎng)音量,并進(jìn)行比較,得到比較結(jié)果;綜合所述分析結(jié)果和比較結(jié)果,當(dāng)分析結(jié)果和所述比較結(jié)果均指示與會(huì)者臉部位置偏離正對(duì)所述顯示器及攝像機(jī)的方向時(shí),確定與會(huì)者臉部位置偏離正對(duì)所述顯示器及攝像機(jī)的方向。
4.一種視訊設(shè)備控制裝置,所述視訊設(shè)備包括顯示器和攝像機(jī),其特征在于,所述顯示器和攝像機(jī)相對(duì)固定、朝向一致且與一運(yùn)動(dòng)機(jī)構(gòu)相連,所述視訊設(shè)備控制裝置包括獲取單元,用于獲取從會(huì)場(chǎng)圖像識(shí)別出的與會(huì)者人臉圖像,所述會(huì)場(chǎng)圖像由所述攝像機(jī)攝取并提供;分析單元,用于分析所述人臉圖像;判斷單元,用于參考所述分析單元的分析結(jié)果,判斷所述與會(huì)者的臉部位置是否偏離正對(duì)所述顯示器及攝像機(jī)的方向,并在所述與會(huì)者的臉部位置偏離正對(duì)所述顯示器及攝像機(jī)的方向時(shí),確定偏離方向;控制單元,用于控制所述運(yùn)動(dòng)機(jī)構(gòu)依據(jù)所述偏離方向,驅(qū)動(dòng)所述顯示器及攝像機(jī)移動(dòng)至與所述與會(huì)者的臉部位置正對(duì)的位置。
5.根據(jù)權(quán)利要求4所述的視訊設(shè)備控制裝置,其特征在于,所述分析單元包括調(diào)用單元,用于調(diào)用預(yù)先存儲(chǔ)的參考人臉圖像,所述參考人臉圖像是預(yù)先攝取的所述與會(huì)者臉部位置正對(duì)所述顯示器和攝像機(jī)的人臉圖像;比較單元,用于比較獲取的人臉圖像及所述參考人臉圖像,確定獲取的人臉圖像與所述參考人臉圖像相比是否發(fā)生空間位置的變化。
6.根據(jù)權(quán)利要求5所述的視訊設(shè)備控制裝置,其特征在于,所述判斷單元包括采集模塊,用于采集所述與會(huì)者正對(duì)所述攝像機(jī)及顯示器前方兩側(cè)的會(huì)場(chǎng)音量,并進(jìn)行比較,得到比較結(jié)果;處理模塊,用于綜合所述分析結(jié)果和比較結(jié)果,當(dāng)分析結(jié)果和所述比較結(jié)果均指示與會(huì)者臉部位置偏離正對(duì)所述顯示器及攝像機(jī)的方向時(shí),確定與會(huì)者臉部位置偏離正對(duì)所述顯示器及攝像機(jī)的方向。
7.—種視訊系統(tǒng),包括視訊設(shè)備及中央控制單元,所述視訊設(shè)備包括顯示器和攝像機(jī), 其特征在于,所述顯示器和攝像機(jī)相對(duì)固定、朝向一致且與一運(yùn)動(dòng)機(jī)構(gòu)相連,所述系統(tǒng)還包括獲取所述攝像機(jī)提供的會(huì)場(chǎng)圖像,從中識(shí)別出與會(huì)者的人臉圖像的人臉識(shí)別引擎;所述中央控制單元用于從所述人臉識(shí)別引擎獲取所述人臉圖像,分析所述人臉圖像, 并在參考分析結(jié)果判斷出所述與會(huì)者的臉部位置偏離正對(duì)所述顯示器及攝像機(jī)的方向時(shí), 確定偏離方向,控制所述運(yùn)動(dòng)機(jī)構(gòu)依據(jù)所述偏離方向,驅(qū)動(dòng)所述顯示器和攝像機(jī)移動(dòng)至與所述與會(huì)者的臉部位置正對(duì)的位置。
8.根據(jù)權(quán)利要求7所述的視訊系統(tǒng),其特征在于,所述攝像機(jī)固定設(shè)置于所述顯示器上方。
9.根據(jù)權(quán)利要求7所述的視訊系統(tǒng),其特征在于,還包括置于會(huì)場(chǎng)中且位于顯示器正對(duì)方向兩側(cè),以采集會(huì)場(chǎng)音量的第一音頻設(shè)備和第二音頻設(shè)備。
10.根據(jù)權(quán)利要求7所述的視訊系統(tǒng),其特征在于,所述運(yùn)動(dòng)機(jī)構(gòu)由電子驅(qū)動(dòng),至少包括垂直升降機(jī)構(gòu)、水平轉(zhuǎn)動(dòng)機(jī)構(gòu)和水平移動(dòng)機(jī)構(gòu)中的任意一種。
全文摘要
本發(fā)明實(shí)施例公開了一種視訊設(shè)備控制方法、裝置和視訊系統(tǒng),所述視訊設(shè)備包括相對(duì)固定、朝向一致且與一運(yùn)動(dòng)機(jī)構(gòu)相連的顯示器和攝像機(jī),所述方法包括獲取從會(huì)場(chǎng)圖像識(shí)別出的與會(huì)者人臉圖像,所述會(huì)場(chǎng)圖像由所述攝像機(jī)攝取并提供;分析所述人臉圖像,并在參考分析結(jié)果判斷出所述與會(huì)者的臉部位置偏離正對(duì)所述顯示器和攝像機(jī)的方向時(shí),確定偏離方向;控制所述運(yùn)動(dòng)機(jī)構(gòu)依據(jù)所述偏離方向,驅(qū)動(dòng)所述顯示器和攝像機(jī)移動(dòng)至與所述與會(huì)者的臉部位置正對(duì)的位置。本發(fā)明實(shí)施例通過控制運(yùn)動(dòng)機(jī)構(gòu)工作來移動(dòng)所述顯示器及攝像機(jī)來適應(yīng)與會(huì)者的多種與會(huì)模式,并能保證了與會(huì)者之間“水平眼對(duì)眼效果”,且無需修改會(huì)場(chǎng)環(huán)境。
文檔編號(hào)H04N5/232GK102547209SQ201210025289
公開日2012年7月4日 申請(qǐng)日期2012年2月6日 優(yōu)先權(quán)日2012年2月6日
發(fā)明者凌偉君 申請(qǐng)人:華為技術(shù)有限公司