專利名稱:視頻會(huì)議系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在位于遠(yuǎn)處、通常在外地的與會(huì)者之間的一個(gè)視頻會(huì)議系統(tǒng)或者電信會(huì)議系統(tǒng)。
它適用于多點(diǎn)系統(tǒng),亦即為產(chǎn)生在位于幾個(gè)地點(diǎn)的與會(huì)者之間的視聽鏈路而設(shè)計(jì)的系統(tǒng)。它還涉及點(diǎn)對點(diǎn)系統(tǒng),亦即通過一條視聽鏈路只連接兩個(gè)地點(diǎn)的系統(tǒng)。它還適用于經(jīng)由一個(gè)會(huì)議網(wǎng)關(guān)連接的可視電話(visiophones)。
用于一給定地點(diǎn)的視頻會(huì)議系統(tǒng)的設(shè)備安放在一個(gè)設(shè)施中,以下稱為房間或演播室。在大多數(shù)場合,與會(huì)者圍坐在一張會(huì)議桌前,面對一個(gè)顯示屏。
今天,商用視頻會(huì)議服務(wù)和系統(tǒng)提議一個(gè)有限音像質(zhì)量的多點(diǎn)鏈路,這或者是由于質(zhì)量信道限制(banks)(聲音和圖像恢復(fù)),或者本質(zhì)上是由于所用特定網(wǎng)絡(luò)通帶的限制而沒有位速率的事實(shí)所致。
的確,會(huì)議系統(tǒng)根據(jù)處于點(diǎn)對點(diǎn)方式還是多點(diǎn)方式等幾種配置連接到數(shù)字網(wǎng)絡(luò),主要是ISDN網(wǎng)絡(luò)。
所以,在NUMERIS網(wǎng)絡(luò)上為此種服務(wù)提供的位速率在128千位/秒和384千位/秒之間變化,前者用于下限范圍會(huì)議服務(wù),后者用于上限范圍會(huì)議服務(wù)。
所用終端大體符合ITU標(biāo)準(zhǔn),諸如所有H320標(biāo)準(zhǔn)。
在某些系統(tǒng)中,可能在某一時(shí)刻只看見遠(yuǎn)處的一個(gè)房間。這使用戶很不方便,因?yàn)樗麄儾荒芡瑫r(shí)看見每一個(gè)人。手動(dòng)或自動(dòng)切換選擇投射到屏幕上的房間。一般來說,這一房間發(fā)送最強(qiáng)的音頻信號(聲音切換)。會(huì)議網(wǎng)關(guān)也是這樣,它根據(jù)聲音的檢測、亦即具有最活躍聲音的房間切換圖像。
遵守ITU標(biāo)準(zhǔn)、諸如標(biāo)準(zhǔn)320或H323或者其它標(biāo)準(zhǔn)的其它系統(tǒng)使用一個(gè)中心單元從所有多會(huì)議單元(MCU)接收圖像,正如在標(biāo)準(zhǔn)H231和H243中規(guī)定的那樣。這一單元通過共享給MCU傳輸?shù)耐◣Щ謴?fù)圖像,其次數(shù)和所發(fā)送的圖像數(shù)目同樣多。
這一點(diǎn)通過加密實(shí)現(xiàn),其基本上以一個(gè)在40到50之間的壓縮因子壓縮連機(jī)位速率。這導(dǎo)致清晰度損失等于大約由每一房間(多點(diǎn)系統(tǒng)多達(dá)5個(gè)房間)所傳輸圖像的四分之三。
圖像的數(shù)字壓縮可能為運(yùn)動(dòng)型JPEG(ISO標(biāo)準(zhǔn))或MPEG1或MPEG2的以H261加密的H320類型,或者為以H263加密的H323類型。
在上述任一種中,發(fā)送的圖像都可以采取計(jì)算機(jī)文件的形式。
在所有情況下,都會(huì)削弱接收到的圖像,不可能重現(xiàn)多點(diǎn)會(huì)議的效果。
對于音頻傳輸,使用加密系統(tǒng)或者G722類型或G711類型的位速率壓縮,它不考慮話音信號的原始質(zhì)量,無論是就帶寬還是就加密質(zhì)量自身。
根據(jù)本發(fā)明的視頻會(huì)議系統(tǒng)的目標(biāo)是在若干遠(yuǎn)程場地之間提供最大數(shù)目與會(huì)者的視頻會(huì)議,超過當(dāng)今商用系統(tǒng)的限制。它給位于遠(yuǎn)處的與會(huì)者在屏幕上提供視圖(以接近于1的比例),使清楚感知行為的特征和方式,和使聲音和圖像匹配,這是由于根據(jù)成像條件在空間分布遠(yuǎn)處與會(huì)者的聲音而實(shí)現(xiàn)的。
建議的系統(tǒng)甚至在多點(diǎn)配置下也連續(xù)地顯示在遠(yuǎn)程場地的與會(huì)者。此外,該系統(tǒng)通過使用N個(gè)接近要拍攝的圖像放置的(例如安放在屏幕窗口內(nèi)的)視頻攝像機(jī)使眼睛的接觸損失為最小,后面將會(huì)說明。它還能再現(xiàn)高保真聲音。
更具體說,本發(fā)明建議一個(gè)在若干遠(yuǎn)程場地的與會(huì)者之間的視頻會(huì)議系統(tǒng),每一場地安置一個(gè)視頻屏幕,其中,視頻屏幕是視頻投影儀類型、高射投影儀(overhead projector)類型或直接視頻類型的大屏幕,包括一個(gè)或者多個(gè)形成圖像壁的視頻系統(tǒng),以便在由所述屏幕形成的圖像壁上再現(xiàn)的一個(gè)位置處同時(shí)觀看所有遠(yuǎn)處的與會(huì)者。
-所述系統(tǒng)為每一給定場地包括在空間分布聲音的設(shè)備,以匹配由每位遠(yuǎn)程與會(huì)者發(fā)出的聲音和在所考慮的場地的屏幕上看到的他/她的圖像,-從而一給定場地接收由其它場地發(fā)布的圖像和音頻信號,并根據(jù)建立的對應(yīng)(correspondence)再現(xiàn)它們,觀看與聆聽其它場地和發(fā)言者是同時(shí)的,并基于同時(shí)在幾個(gè)場地之間進(jìn)行的話音交換,無縫地且不干擾其它與會(huì)者。
遠(yuǎn)處與會(huì)者的圖像以接近于1的比例顯示在演播室屏幕上;該比例取決于屏幕和與會(huì)者圍坐的桌子之間的距離。例如,這導(dǎo)致一個(gè)近似為5×2m的標(biāo)準(zhǔn)大小的屏幕來觀看4個(gè)在每一房間約有4人的遠(yuǎn)處的房間。
該視頻會(huì)議系統(tǒng)包括一個(gè)或多個(gè)攝像機(jī)(CA1)、(CA2)和聲音記錄系統(tǒng)(麥克風(fēng)或聲學(xué)天線)。聲音記錄數(shù)據(jù)與一個(gè)或另一個(gè)攝像機(jī)匹配,這取決于所傳輸?shù)囊曨l信號來自攝像機(jī)(CA1)還是攝像機(jī)(CA2)。
更具體說,這一匹配提供一種“主觀疊加”(subjectiveoverlay),聲音源接近關(guān)聯(lián)的圖像(沿圖像的軸線)。
根據(jù)本發(fā)明另一特征,聲音記錄和再現(xiàn)設(shè)備包括-信號捕獲和數(shù)字化單元,-信號再現(xiàn)和模數(shù)變換單元;-在所述場地的與會(huì)者面前分布的n個(gè)麥克風(fēng);-沿屏幕長度分布的p個(gè)揚(yáng)聲器,其中p正比于屏幕大小;-在一個(gè)或多個(gè)麥克風(fēng)、從所述麥克風(fēng)發(fā)出的信號和用于再現(xiàn)所述信號的外地?fù)P聲器之間的匹配單元,-裝備有位速率衰減的網(wǎng)絡(luò)適配設(shè)備;-回聲控制設(shè)備。
聲音在空間分布,以便使聲音與視覺圖像匹配。這種布局不僅強(qiáng)烈增強(qiáng)電信會(huì)議效果,同時(shí)能使在兩個(gè)遠(yuǎn)處的房間中并行進(jìn)行若干對話;對話的監(jiān)視通過系統(tǒng)能夠注意于某人希望聽的人員而簡化,就像在正常的會(huì)議中一樣。
在麥克風(fēng)、來自所述麥克風(fēng)的信號和用于再現(xiàn)所述信號的遠(yuǎn)程場地的揚(yáng)聲器之間建立對話的設(shè)備通過編程希望的配置而操作。這種編程可能涉及存儲(chǔ)一個(gè)或者多個(gè)預(yù)先確定的配置。
根據(jù)另一特征,圖像記錄器包括為每一場地的q個(gè)攝像機(jī),這一數(shù)目優(yōu)選超過或等于2。這些攝像機(jī)放置在所述場地與會(huì)者面前,使其位于在屏幕上顯示各個(gè)外地與會(huì)者的不同區(qū)域或接近這些區(qū)域。在實(shí)際中,這些攝像機(jī)可以位于在屏幕的下面、頂部或周圍。
因此,每一房間可以包括幾個(gè)攝像機(jī),它們以不同角度拍攝與會(huì)者。傳輸?shù)侥硤龅氐膱D像是由位于接近為該場地投射的圖像的攝像機(jī)記錄的圖像。這使得可能夠減小眼睛接觸效果,區(qū)別視點(diǎn)和根據(jù)他/她在該場地和在總配置中的位置重新建立每一與會(huì)者的位置。
在幾個(gè)圖像沿屏幕寬度并置的點(diǎn)對點(diǎn)配置中,每一圖像提供該設(shè)施的部分視圖。這使得容易知道在屏幕上誰在看誰,從而跟蹤會(huì)議動(dòng)態(tài)。
在實(shí)際中,攝像機(jī)放置在屏幕10上投影的圖像的下面。
在具有兩個(gè)相連圖像(一個(gè)在另一個(gè)的旁邊)的配置中,攝像機(jī)重新排列和放置在距屏幕中心一定距離處,相應(yīng)于該圖像寬度的約三分之一,亦即屏幕總寬度的六分之一。這樣的重排列使由兩個(gè)攝像機(jī)拍攝的兩個(gè)圖像在邊緣處的重疊的問題為最小。
多個(gè)場地在點(diǎn)對點(diǎn)或多點(diǎn)配置中通過一個(gè)高位速率網(wǎng)絡(luò)或者通過一個(gè)中央MCU單元(視頻會(huì)議網(wǎng)關(guān))連接在一起。
本發(fā)明的其它特征和優(yōu)點(diǎn)在閱讀這里的說明書時(shí)會(huì)顯現(xiàn)。本說明書參考附圖以非窮舉的解釋給出,附圖中
圖1和圖2原理說明本發(fā)明解決的遠(yuǎn)程會(huì)議問題,圖3表示本發(fā)明的原理圖,圖4表示在一個(gè)演播室中的設(shè)備的實(shí)施例的圖,圖5是相應(yīng)于在3個(gè)演播室之間有一條會(huì)議鏈路的場合下的一個(gè)特定實(shí)施例的圖,圖6是相應(yīng)于在兩個(gè)演播室之間有一條鏈路的場合下的一個(gè)特定實(shí)施例的圖,圖7到圖9表示形成大屏幕上圖像壁的不同“屏幕圖像”的一個(gè)例子,圖10到13表示在演播室設(shè)備或視頻話音終端之間根據(jù)本發(fā)明在不同網(wǎng)絡(luò)配置中的不同連接方式,為說明實(shí)現(xiàn)遠(yuǎn)程會(huì)議效果的一種方法,圖1表示出類似真實(shí)生活中的會(huì)議形象。
假定有12個(gè)人圍坐在一張?zhí)摂M的圓桌前。一個(gè)與會(huì)者可以通過一個(gè)窗口看到該組另外4個(gè)相鄰的人,并且通過開發(fā)表面,可以假定該與會(huì)者可以在一個(gè)平面或幾乎純平的屏幕上看見這4個(gè)人。因此他將在兩個(gè)特別是以平面結(jié)構(gòu)的屏幕上看見兩個(gè)不同演播室中以4人為一組的其它8個(gè)人。作為一般規(guī)則,虛擬桌不是圓形,而是縱長放置的,與會(huì)者小組分坐在兩邊。因此,人E將看見A在他/她的左邊,而F在他/她的右邊,所有出席的個(gè)人連續(xù)相鄰排列。
圖2表示的屏幕稍微彎曲,以產(chǎn)生加入(immersion)結(jié)構(gòu)。
這一環(huán)境通過近似與會(huì)者之間轉(zhuǎn)動(dòng)和彼此觀察的眼的動(dòng)作特別能夠重現(xiàn)與會(huì)者之間交換的對視。例如,A可以觀察E,而任何其它人將以一個(gè)主觀近似的視角看見A在看F。
圖3的草圖表示根據(jù)本發(fā)明的遠(yuǎn)程會(huì)議系統(tǒng)的原理圖。
當(dāng)然,其它選擇也是可能的,例如與會(huì)者的位置(坐著或站著,圍著桌子或不圍著桌子),攝像機(jī)的位置和揚(yáng)聲器的位置可以有多種,使得可能獲得聲音/空間分布和模擬所有與會(huì)者全都加入的圖像壁。
場地A經(jīng)由一個(gè)高位速率網(wǎng)絡(luò)連接到其它場地B..K。用于這些場地的不同的連接選擇將在后面的圖10到13中詳述。例如通過把若干SO接入點(diǎn)分組而使用ISDN(綜合業(yè)務(wù)數(shù)字網(wǎng))。還可以使用信息高速公路,因特網(wǎng)或HDSL接入設(shè)備。這種網(wǎng)絡(luò)與通帶超過7KHz的模擬聲音信號不會(huì)不兼容,只要使用保持原來質(zhì)量的位速率壓縮系統(tǒng)。它提供等價(jià)于由數(shù)字緊致式光盤(CD)提供的高的聲音質(zhì)量。
所用傳輸網(wǎng)絡(luò)是異步傳輸方式網(wǎng)絡(luò)(ATM)或者另外的數(shù)字或模擬類型的高位速率網(wǎng)絡(luò)。所有圖像都可以以高吞吐量傳輸?shù)讲煌瑘龅?,不需要在加密期間增加壓縮因子。
例如,取決于所用網(wǎng)絡(luò)類型,加密圖像在384千位/秒(在Numeris網(wǎng)絡(luò)上)到2兆位/秒之間傳輸。
視頻會(huì)議由單元100A、100K控制或遙控,它們通過網(wǎng)絡(luò)R對話,以遵守在與會(huì)者、聲音圖像和視覺圖像之間建立的對應(yīng)(correspondence)。換句話說,如果尚未預(yù)先定義配置,則控制單元連同傳輸?shù)男盘栆黄鸢l(fā)送該配置的說明,否則發(fā)送從為所有場地已經(jīng)定義的幾種配置中選擇的配置方式的說明。它們能按照希望的配置管理所有演播室設(shè)備。在可能的會(huì)議配置之中,點(diǎn)對點(diǎn)鏈路或者在3、4、5或更多場地之間的多點(diǎn)鏈路是可能的選擇。
在實(shí)際中,配置涉及對在某一場地的一個(gè)與會(huì)者P1(A)、拾取與會(huì)者對話的聲音記錄系統(tǒng)(或多個(gè))M1(麥克風(fēng)或聲學(xué)天線)、拍攝他/她的攝像機(jī)CA1之間鏈路的說明,以便使在場地B處的圖像IP1(A)與再現(xiàn)由麥克風(fēng)(或多個(gè))M1提供的聲音的揚(yáng)聲器(或多個(gè))H1匹配。
為此目的,場地A包括n個(gè)麥克風(fēng),p個(gè)揚(yáng)聲器和q個(gè)攝像機(jī)。對一個(gè)給定場地,揚(yáng)聲器的數(shù)目與屏幕大小成比例(與該屏幕的寬度或與其表面)。
對于圍坐在桌子周圍的與會(huì)者,在給定場地的會(huì)議桌前安置一個(gè)大屏幕10,(每一場地的)屏幕圖像都投射在該屏幕上,使得遠(yuǎn)處的與會(huì)者和在該場地的與會(huì)者處于同一水平,從而產(chǎn)生一張?zhí)摂M桌。
當(dāng)與會(huì)者P1(A)對與會(huì)者P1(B)說話時(shí),場地A的攝像機(jī)CA1的圖像被發(fā)射到其它場地B到K。此外,場地B的攝像機(jī)CA1的圖像被發(fā)送到場地A、C到K。如果在其它場地?zé)o人發(fā)言,則攝制這些場地的攝像機(jī)不反應(yīng),盡管還是發(fā)送所有與會(huì)者的圖像。
攝像機(jī)的圖像由位于各場地處的控制單元100A-100K控制,或由一個(gè)監(jiān)控場地遙控。
在聲音記錄方式和必須記錄圖像的攝像機(jī)之間的伺服控制由熟悉本技術(shù)領(lǐng)域的人所公知的控制程序保證。該程序由單元100A到100K實(shí)現(xiàn),以便獲得這樣的圖像,它們一旦被投射在屏幕上便產(chǎn)生所涉及的人確實(shí)正在看另一個(gè)人的印象。
在實(shí)際中,這一效果可以只用兩個(gè)攝像機(jī)產(chǎn)生。
由網(wǎng)絡(luò)傳輸?shù)膱D像被每一場地接收,并由視頻單元300處理,以便被并列和/或重迭投射到屏幕上。然而,所有接收的圖像被投射到每一場地的屏幕10上,所述屏幕形成一個(gè)圖像壁。
在點(diǎn)對點(diǎn)系統(tǒng)的特例下,投射到每一屏幕上的圖像相應(yīng)于單一房間。這一配置有可能加強(qiáng)圖像質(zhì)量。為此目的,建議傳輸兩個(gè)圖像,各分別由一個(gè)攝像機(jī)拍攝。每一攝像機(jī)記錄該設(shè)施的部分圖像。在實(shí)際上,一個(gè)攝像機(jī)拍攝場面的一半,而另一攝像機(jī)拍攝另一半。
圖像的并置由處理單元100A和100B控制,它們根據(jù)由這兩個(gè)攝像機(jī)發(fā)送的信號控制視頻處理單元在屏幕上投射單幅圖像。圖像的級連在本質(zhì)上是傳統(tǒng)類型的圖像處理。
圖4更完整地表示作為系統(tǒng)部件的處理和控制單元。這又是在每一演播室有兩臺攝像機(jī)的另一個(gè)例子。
對于視頻部分第一攝像機(jī)CA1連接到視頻編碼器303,而視頻解碼單元304連接到初始投影儀PR1。解碼單元包括一個(gè)或者多個(gè)解碼器,使得每一個(gè)解碼器解碼來自該場地的視頻信號。在下面的說明中,將講述解碼器304,因?yàn)榭蛇m用于一組解碼器。
編碼器和解碼器連接到網(wǎng)絡(luò)R的視頻信號適配和傳輸接口301。例如,所述接口是用于ATM網(wǎng)絡(luò)傳輸?shù)腁AL1接口(適配層)。
上述接口連接到一個(gè)物理支持接口400。
例如,控制單元100A根據(jù)該視頻會(huì)議配置經(jīng)由本地網(wǎng)絡(luò)RL分別為編碼器、解碼器和適配接口301發(fā)送控制信號CD1、DC1、IV1。
相似地,第二攝像機(jī)CA2連接到編碼器305,編碼器305自身連接到網(wǎng)絡(luò)的一個(gè)傳輸適配接口302。解碼器306連接到第二投影儀PR2和接口302。接口302連接到物理支持接口400。
控制單元根據(jù)該配置分別為編碼器、解碼器和適配接口發(fā)送控制信號CD2、DC2、IV2。
可以把一個(gè)視頻編碼器在功能上連接到幾個(gè)解碼器,此種技術(shù)不屬于本發(fā)明的范圍。
然后可以把一個(gè)場地的第三攝像機(jī)連接到編碼器303或305之一,并發(fā)送優(yōu)先考慮的某特定人的圖像。這一攝像機(jī)的圖像將由該攝像機(jī)連接的編碼器加密,并傳輸?shù)剿衅渌鼒龅?。然后所有其它場地必須在解碼器單元303或306中裝備一個(gè)附加的解碼器,以處理由該攝像機(jī)提交的視頻信號,并投射該拍攝的圖象到與這種圖像關(guān)聯(lián)的場地的屏幕10上。
投影儀可以是視頻投影儀,也可以是液晶高射投影儀(liquidcrystal overhead projector)。只要使用等離子屏幕的話,可以直接投射。
對于音頻部分n個(gè)麥克風(fēng)連接到一個(gè)信號捕獲單元201,它把信號數(shù)字化。該單元201的輸出加在衰減單元207的輸入以控制回聲。衰減單元的輸出加在位速率縮減器編碼器的輸入用于由單元100A控制的音頻信號202。編碼器202還執(zhí)行麥克風(fēng)信號的陣列化,以與網(wǎng)絡(luò)上可用的用于音頻傳輸?shù)耐ǖ罃?shù)目一致。為此目的,編碼器接收配置控制信號CA。音頻適配編碼器202連接到網(wǎng)絡(luò)R的傳輸適配接口204,其是ATM網(wǎng)絡(luò)的AAL5接口。該接口連接到物理支持接口400。
接口204能在網(wǎng)絡(luò)上發(fā)布加密的音頻信號和接收由其它場地發(fā)布的加密的音頻信號。接收的信號由接口204處理并加在一個(gè)解碼單元和音頻信號解陣列單元203上。
由解碼和解陣列單元203提交的信號經(jīng)由一個(gè)音頻信號再現(xiàn)和模數(shù)變換單元205施加在希望的一個(gè)(或多個(gè))揚(yáng)聲器上。該單元205設(shè)計(jì)用于發(fā)送接收到的需要的信號到幾個(gè)適當(dāng)?shù)膿P(yáng)聲器。
在配置被編程且被存儲(chǔ)在控制單元的存儲(chǔ)器110中的場合,單元100A將在其存儲(chǔ)器表中包含有關(guān)信息,指示解碼器的輸出S1正在提交信號,該信號由麥克風(fēng)M1或包括場地B的M1的一系列麥克風(fēng)拾取,以及該輸出隨后必須被傳送到揚(yáng)聲器Hn或包括H1的一系列揚(yáng)聲器,以產(chǎn)生發(fā)言的與會(huì)者的一個(gè)特寫鏡頭。
選擇捕獲系統(tǒng)(麥克風(fēng)和單元205)要注意話音信號通帶,并以7KHz的頻帶(對質(zhì)量而言是該系統(tǒng)的下限)操作。同樣選擇加密系統(tǒng)以注意這一原始質(zhì)量,同時(shí)選擇位速率縮減算法,如MPEG1或MPEG2標(biāo)準(zhǔn)所說明的。還選擇捕獲系統(tǒng)以提供一個(gè)好的信噪比。
在點(diǎn)對點(diǎn)配置的兩個(gè)房間的場合,一個(gè)可能的配置包括6個(gè)聲音通道,亦即為每一個(gè)麥克風(fēng)一個(gè)通道。在3個(gè)房間的場合,在每一場地有2×3個(gè)聲音通道。對于場地A,3個(gè)通道提供A和B之間的音頻鏈路,而另外3個(gè)提供A和C之間(類似地為B和C之間)的音頻鏈路。
以最低可能的時(shí)間位移(約100毫秒)傳輸圖像和聲音,結(jié)合視頻圖像的質(zhì)量和大小,它將允許聾人對外地發(fā)言人進(jìn)行唇讀。
此外,音頻設(shè)備包括一個(gè)回聲控制電路206,其通過本質(zhì)上是標(biāo)準(zhǔn)處理的可變衰減單元207用作對麥克風(fēng)信號的一個(gè)增益變換器。所述電路連接到單元201的輸出端和單元205的輸入端。
圖5表示上述的一個(gè)可能配置。這是在3個(gè)場地A、B和C之間的視頻配置。
所述圖通過強(qiáng)調(diào)該配置在不同場地之間提供的直接鏈路而忽略傳輸網(wǎng)絡(luò)而加以簡化。
從3個(gè)場地A、B和C來說明這一配置。
每一場地A和B各有兩個(gè)攝像機(jī)CA1和CA2,它們以不同角度在同一場地拍攝。
根據(jù)這一配置,為編碼器和解碼器提供點(diǎn)對點(diǎn)鏈路。
攝像機(jī)CA1連接到場地A的編碼器303。該編碼器連接到解碼器304,后者連接到提供屏幕圖像E1(A)(來自場地A的攝像機(jī)CA1的圖像)的投影儀。
場地B的編碼器303連接到場地B的攝像機(jī)CA1。由解碼器提供的信號由場地A的解碼器304解密以供應(yīng)屏幕圖像E1(B)(來自場地B的攝像機(jī)CA1的圖像)。
在演播室C,安裝了標(biāo)號為CA1的單一攝像機(jī)。該攝像機(jī)連接到兩個(gè)編碼器304(A2)和304(B2)。編碼器304(A2)連接到場地A與屏幕圖像E1(C)關(guān)聯(lián)的解碼器306,而編碼器304(B2)連接到場地B與屏幕圖像EI(C)關(guān)聯(lián)的解碼器306。
相反,場地C的解碼器306連接到場地A的攝像機(jī)CA2的信號編碼器305,另一個(gè)連接到場地B的攝像機(jī)CA2的信號編碼器305,以分別在場地C顯示場地A的屏幕圖像亦即E2(A),和場地B的屏幕圖像亦即E2(B)。
根據(jù)這一配置,音頻處理單元也是雙份的,以便與每場地的一個(gè)音頻單元202、203、205連接。
圖6表示在場地A和場地B之間的點(diǎn)對點(diǎn)鏈路。在這一場合,每一攝像機(jī)CA1、CA2捕獲該場地的部分視野。
在傳輸6個(gè)音頻信號(6個(gè)麥克風(fēng))的場合,在每一場地的3個(gè)通道上使用兩個(gè)編碼器-解碼器。
圖7到9分別表示在場地A、B和C投射的屏幕圖像。在場地A(圖7),屏幕圖像E(4,3,2,1)提供從各個(gè)終端產(chǎn)生的視圖,而屏幕圖像E(C,B)提供在場地C和B疊加的視圖。
圖8表示在場地B的視圖結(jié)構(gòu),而圖9表示場地C的視圖結(jié)構(gòu)。
圖10到13表示在這些場地之間可能的鏈路的例子。
圖10表示經(jīng)由ATM網(wǎng)絡(luò)或一條專線連接的4個(gè)演播室。
圖11表示經(jīng)由一個(gè)中心MCU單元(視頻會(huì)議網(wǎng)關(guān))提供的連接。
圖12表示混合網(wǎng)絡(luò)連線和一個(gè)MCU設(shè)備,亦即一個(gè)商用視頻會(huì)議網(wǎng)關(guān)并包括一個(gè)設(shè)備,以壓縮演播室1、2和3的音頻信號,因?yàn)榫哂兄苯渔溌泛屯ㄟ^這種硬件連接的場地會(huì)受由該直接網(wǎng)絡(luò)鏈路和MCU連接提交的信號的疊加和時(shí)間偏移的不利影響。
圖13表示經(jīng)由不同類型網(wǎng)絡(luò)諸如Numeris、ATM和專線的連接。
權(quán)利要求
1.一個(gè)在位于幾個(gè)不同場地的與會(huì)者之間的視頻會(huì)議系統(tǒng),其包括在每一場地的一個(gè)觀看屏幕、多個(gè)攝像機(jī)和圖像再現(xiàn)設(shè)備以及聲音記錄和再現(xiàn)設(shè)備,其特征在于-觀看屏幕是投影、高射投影或直接投影類型的大屏幕(10),包括一個(gè)或多個(gè)形成一個(gè)圖像壁的觀看系統(tǒng),以便在由所述屏幕(10)形成的圖像壁上產(chǎn)生的一個(gè)空間內(nèi)同時(shí)觀看所有遠(yuǎn)處的與會(huì)者,-聲音記錄和再現(xiàn)設(shè)備,包括在每一場地空間分布聲音的設(shè)備(100A,100K,Hi和Mj),以匹配由每一位遠(yuǎn)處與會(huì)者發(fā)出的聲音和在所考慮場地投射的該與會(huì)者的圖像,-一給定場地接收由其它場地發(fā)布的圖像和音頻信號并根據(jù)建立的對應(yīng)關(guān)系再現(xiàn)它們,通過在兩地之間進(jìn)行話音交換實(shí)現(xiàn)同時(shí)觀看和聆聽其它場地和發(fā)言者,無縫地且不干擾其它與會(huì)者。
2.根據(jù)權(quán)利要求1的視頻會(huì)議系統(tǒng),其特征在于,形成圖像壁的屏幕(10)的大小如此選擇,使得能夠顯示所有場地的圖像,而所顯示的與會(huì)者的比例接近1。
3.根據(jù)權(quán)利要求1的視頻會(huì)議系統(tǒng),其特征在于,拍攝設(shè)備包括一個(gè)初始攝像機(jī)(CA1)和一個(gè)第二攝像機(jī)(CA2),其中記錄的聲音與所述攝像機(jī)的一個(gè)或另一個(gè)關(guān)聯(lián),這取決于所傳輸?shù)囊曨l信號來自所述攝像機(jī)(CA1,CA2)中的哪一個(gè)。
4.根據(jù)權(quán)利要求1的視頻會(huì)議系統(tǒng),其中,聲音記錄設(shè)備包括幾個(gè)麥克風(fēng)、音頻信號捕獲設(shè)備(201)以及為所述信號加密和陣列化的設(shè)備(205)。
5.根據(jù)權(quán)利要求1的視頻會(huì)議系統(tǒng),其特征在于,聲音再現(xiàn)設(shè)備包括對音頻信號解碼和解陣列的設(shè)備(203),再現(xiàn)音頻信號的設(shè)備(205)和幾個(gè)揚(yáng)聲器。
6.根據(jù)前述權(quán)利要求中任何一個(gè)權(quán)利要求的視頻會(huì)議系統(tǒng),其特征在于,聲音記錄和再現(xiàn)設(shè)備包括-信號和數(shù)字化捕獲單元(201);-信號再現(xiàn)和模數(shù)變換單元(205);-在所述場地的與會(huì)者面前放置的n個(gè)麥克風(fēng)(M1...Mn);-沿屏幕長度放置的p個(gè)揚(yáng)聲器(H1...Hp),其中p正比于屏幕大?。?包括位速率壓縮設(shè)備的網(wǎng)絡(luò)適配設(shè)備;-回聲控制設(shè)備。
7.根據(jù)前述權(quán)利要求中任何一個(gè)權(quán)利要求的視頻會(huì)議系統(tǒng),其特征在于,提供在麥克風(fēng)、由所述麥克風(fēng)提供的信號和打算再現(xiàn)所述信號的揚(yáng)聲器之間匹配的設(shè)備包括存儲(chǔ)建立所希望的匹配的一個(gè)或多個(gè)配置的存儲(chǔ)設(shè)備(110)。
8.根據(jù)前述權(quán)利要求中任何一個(gè)權(quán)利要求的視頻會(huì)議系統(tǒng),其特征在于,對于每一場地每一拍攝單元包括q個(gè)攝像機(jī),它們放置在所述場地與會(huì)者面前,使得每一個(gè)攝像機(jī)拍攝顯示在屏幕不同部分的不同組的外地與會(huì)者。
9.根據(jù)前述權(quán)利要求中任何一個(gè)權(quán)利要求的視頻會(huì)議系統(tǒng),其中在N個(gè)場地之間召開視頻會(huì)議,其特征在于,每一場地的攝像機(jī)數(shù)q大于或等于2,以再現(xiàn)圖像透視效果。
10.根據(jù)權(quán)利要求1到8中任何一個(gè)權(quán)利要求的視頻會(huì)議系統(tǒng),其中只在兩個(gè)不同場地之間召開視頻會(huì)議,其中,一個(gè)攝像機(jī)(CA1)拍攝包括一初始與會(huì)者組的本地場地的部分圖像,另一攝像機(jī)(CA2)拍攝包括第二組與會(huì)者的本地場地的部分圖像,這兩部分圖像并列放置,使能看到所有與會(huì)者。
11.根據(jù)權(quán)利要求1到10中任何一個(gè)權(quán)利要求的視頻會(huì)議系統(tǒng),其中使用幾個(gè)攝像機(jī)拍攝,其特征在于,所述的攝像機(jī)(CA1,CA2)放置在投射的圖像下面。
12.根據(jù)前述權(quán)利要求中任何一個(gè)權(quán)利要求的視頻會(huì)議系統(tǒng),其特征在于,所述系統(tǒng)還包括若干陰極射線設(shè)備、或液晶視頻、或高射投影儀(PR1,PR2),用于以接近1的比例再現(xiàn)圖像。
13.根據(jù)前述權(quán)利要求中任何一個(gè)權(quán)利要求的視頻會(huì)議系統(tǒng),其特征在于,所述系統(tǒng)包括用于每一場地的圖像處理設(shè)備,能夠并置或疊加從外場地接收的圖像(301,304),以使所有圖像能在屏幕(10)上顯示。
14.根據(jù)前述權(quán)利要求中任何一個(gè)權(quán)利要求的視頻會(huì)議系統(tǒng),其中,場地經(jīng)由不同的高位速率傳輸網(wǎng)絡(luò)(R)直接連接,或經(jīng)由一個(gè)視頻會(huì)議網(wǎng)關(guān)或經(jīng)由一個(gè)網(wǎng)絡(luò)和視頻會(huì)議網(wǎng)關(guān)間接連接。
15.根據(jù)前述權(quán)利要求中任何一個(gè)權(quán)利要求的視頻會(huì)議系統(tǒng),其特征在于,處理設(shè)備包括-PC類型或工作站(100A...,100K)的處理和控制單元,-由處理單元控制的視頻編碼器-解碼器(303-306)和音頻編碼器-解碼器,-用于所述網(wǎng)絡(luò)的傳輸適配接口(301,302,204)。
16.根據(jù)權(quán)利要求15的視頻會(huì)議系統(tǒng),其特征在于,所述網(wǎng)絡(luò)是一個(gè)ATM(異步傳輸模式)類型的傳輸網(wǎng)絡(luò),用于音像信號的傳輸接口是AAL1類型的接口,在處理單元之間用于視頻會(huì)議的控制信號的傳輸接口是AAL5類型接口。
全文摘要
本發(fā)明涉及位于不同場地與會(huì)者之間的視頻會(huì)議系統(tǒng),每一場地裝備一個(gè)觀看屏幕。根據(jù)本發(fā)明,觀看屏幕為投影類型、高射投影類型或直接投射類型的大屏幕(10),包括一個(gè)或多個(gè)形成一個(gè)圖像壁的觀看系統(tǒng),以使同時(shí)在由所述屏幕(10)形成的圖像壁上產(chǎn)生的一個(gè)空間內(nèi)觀看所有遠(yuǎn)處的與會(huì)者。所建議的系統(tǒng)包括為每一場地在空間分布聲音的設(shè)備(100A,100K,Hi,Mj),以匹配由每一遠(yuǎn)處的與會(huì)者發(fā)出的聲音和在所考慮的場地的屏幕上投射的該與會(huì)者的圖像。
文檔編號H04M11/00GK1257631SQ9880546
公開日2000年6月21日 申請日期1998年3月26日 優(yōu)先權(quán)日1997年3月27日
發(fā)明者G·布赫納, Y·馬約克斯, C·維普利茲, J·-P·朱利安 申請人:法國電訊公司