專利名稱:智能音頻限制方法、系統(tǒng)和節(jié)點(diǎn)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種電話會(huì)議,其中控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束超負(fù)荷狀態(tài)(還稱為音頻風(fēng)暴)。更具體地說,本發(fā)明涉及一種電話會(huì)議,其中控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束超負(fù)荷狀態(tài),其中每個(gè)終端均在沒有來自網(wǎng)絡(luò)的任何同步消息的情況下獨(dú)立于其它終端就所述超負(fù)荷狀態(tài)達(dá)成相同決定。
背景技術(shù):
當(dāng)參與大型電話會(huì)議時(shí),所有潛在音頻通道的總和可能超過網(wǎng)絡(luò)和CPU資源的能力限制。使用VAD(語音活動(dòng)性檢測)是統(tǒng)計(jì)上保持同時(shí)音頻流的數(shù)目受到限制的標(biāo)準(zhǔn)方式。然而,很多時(shí)候,大量參與者可能產(chǎn)生音頻響應(yīng),其會(huì)造成幾乎所有節(jié)點(diǎn)都開始傳輸。
大型會(huì)議的會(huì)議參與者的最大數(shù)目造成一個(gè)音頻處理問題,而在15方會(huì)議中不存在所述音頻處理問題。假定主持一個(gè)100方會(huì)議,且所有遠(yuǎn)程終端都不是沉默的且因此能夠在任何時(shí)間傳輸音頻。主發(fā)言人發(fā)表一個(gè)每個(gè)人均對此作出回應(yīng)的意見,且在100-300ms的相當(dāng)短時(shí)間中,每個(gè)ViPr終端開始發(fā)送音頻數(shù)據(jù),從而造成“音頻包風(fēng)暴”。此類風(fēng)暴對會(huì)議的影響可能會(huì)是接收到的噪聲下限增加且等于20dB的所有信號均進(jìn)入音頻輸出。終端每秒處理5000個(gè)音頻RTP包。將ViPr終端連接到會(huì)議的其它部分的任何低帶寬鏈路將必須與8Mbps音頻數(shù)據(jù)流競爭。(注意8Mbps數(shù)字是從每個(gè)ViPr終端以64kbps傳輸音頻數(shù)據(jù)、以4.8kbps傳輸RTP額外開銷和約4kbps傳輸IP額外開銷得到的。)本發(fā)明描述如何檢測會(huì)議正進(jìn)入此超負(fù)荷狀態(tài)且控制哪個(gè)發(fā)送者應(yīng)停止發(fā)送。本發(fā)明提供一種用于限制過多同時(shí)音頻流的影響的機(jī)制。
發(fā)明內(nèi)容
本發(fā)明關(guān)于一種電話會(huì)議系統(tǒng)。所述系統(tǒng)包含網(wǎng)絡(luò)。所述系統(tǒng)包含多個(gè)節(jié)點(diǎn),其通過所述網(wǎng)絡(luò)用所述節(jié)點(diǎn)傳輸?shù)奖舜说囊纛l流來彼此進(jìn)行通信以形成會(huì)議。每個(gè)節(jié)點(diǎn)均能夠檢測正由所述若干節(jié)點(diǎn)傳輸超過預(yù)定數(shù)目個(gè)同時(shí)音頻流的超負(fù)荷狀態(tài),且能夠連同其它節(jié)點(diǎn)一起控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束所述超負(fù)荷狀態(tài)。
本發(fā)明關(guān)于一種提供電話會(huì)議的方法。所述方法包含以下步驟多個(gè)節(jié)點(diǎn)通過網(wǎng)絡(luò)用所述節(jié)點(diǎn)傳輸?shù)奖舜说囊纛l流來彼此進(jìn)行通信以形成會(huì)議。存在以下步驟由每個(gè)節(jié)點(diǎn)檢測正由所述若干節(jié)點(diǎn)傳輸超過預(yù)定數(shù)目個(gè)同時(shí)音頻流的超負(fù)荷狀態(tài)。存在以下步驟控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束所述超負(fù)荷狀態(tài)。
本發(fā)明關(guān)于一種用于具有其它節(jié)點(diǎn)的網(wǎng)絡(luò)的電話會(huì)議節(jié)點(diǎn)。所述節(jié)點(diǎn)包含網(wǎng)絡(luò)接口,其與其它節(jié)點(diǎn)進(jìn)行通信以形成會(huì)議。所述節(jié)點(diǎn)包含控制器,其檢測正由所述若干節(jié)點(diǎn)傳輸超過預(yù)定數(shù)目個(gè)同時(shí)音頻流的超負(fù)荷狀態(tài)且連同其它節(jié)點(diǎn)一起控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束所述超負(fù)荷狀態(tài)。
在附圖中說明本發(fā)明的優(yōu)選實(shí)施例和實(shí)踐本發(fā)明的優(yōu)選方法,其中圖1是用于本發(fā)明的系統(tǒng)的示意性表示。
圖2是用于本發(fā)明的網(wǎng)絡(luò)的示意性表示。
圖3是連接到PC和網(wǎng)絡(luò)的視頻電話的示意性表示。
圖4是用于本發(fā)明的系統(tǒng)的示意性表示。
圖5a和圖5b是視頻電話的前視圖和側(cè)視圖的示意性表示。
圖6是視頻電話的連接面板的示意性表示。
圖7是用于視頻電話的多屏幕配置的示意性表示。
圖8是視頻電話的方框圖。
圖9是視頻電話結(jié)構(gòu)的方框圖。
圖10是系統(tǒng)的示意性表示。
圖11是系統(tǒng)的示意性表示。
圖12是本發(fā)明系統(tǒng)的示意性表示。
圖13是本發(fā)明另一系統(tǒng)的示意性表示。
圖14是本發(fā)明音頻混合器的示意性表示。
圖15是混合器結(jié)構(gòu)的方框圖。
圖16是SBU的方框圖。
圖17是視頻電話會(huì)議中的視頻電話UAM的示意性表示。
圖18是雙向電話呼叫中的視頻電話UAM的示意性表示。
圖19是用于混合器的網(wǎng)絡(luò)的示意性表示。
圖20是本發(fā)明的方框圖。
具體實(shí)施例方式
現(xiàn)參考附圖,其中在所述若干視圖中相同參考數(shù)字始終指代相似或相同部分,且更明確地參考圖20,其展示一種電話會(huì)議系統(tǒng)10。所述系統(tǒng)10包含網(wǎng)絡(luò)40。所述系統(tǒng)10包含多個(gè)節(jié)點(diǎn),例如終端或視頻電話,其通過網(wǎng)絡(luò)40用所述終端傳輸?shù)奖舜说膶?shí)況講話音頻流來彼此進(jìn)行通信以形成會(huì)議。每個(gè)終端均能夠檢測正由所述若干終端傳輸超過預(yù)定數(shù)目個(gè)同時(shí)實(shí)況講話音頻流的超負(fù)荷狀態(tài),且能夠連同其它終端一起控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束所述超負(fù)荷狀態(tài)。
優(yōu)選地,在檢測到所述超負(fù)荷狀態(tài)時(shí),每個(gè)終端基于其傳輸?shù)囊纛l流和其它終端傳輸?shù)囊纛l流而確定其是否應(yīng)停止傳輸其音頻流。每個(gè)終端優(yōu)選地在沒有來自網(wǎng)絡(luò)40的任何同步消息的情況下獨(dú)立于其它終端就所述超負(fù)荷狀態(tài)達(dá)成相同決定。
本發(fā)明關(guān)于一種提供電話會(huì)議的方法。所述方法包含以下步驟多個(gè)終端通過網(wǎng)絡(luò)40用所述終端傳輸?shù)奖舜说膶?shí)況講話音頻流來彼此進(jìn)行通信以形成會(huì)議。存在以下步驟由每個(gè)終端檢測正由所述若干終端傳輸超過預(yù)定數(shù)目個(gè)同時(shí)實(shí)況講話音頻流的超負(fù)荷狀態(tài)。存在以下步驟控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束所述超負(fù)荷狀態(tài)。
優(yōu)選地,所述控制步驟包括以下步驟通過所述終端中的每一者控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目和所述超負(fù)荷狀態(tài)。所述控制步驟優(yōu)選地包括以下步驟在檢測到所述超負(fù)荷狀態(tài)時(shí),每個(gè)終端基于其傳輸?shù)囊纛l流和其它終端傳輸?shù)囊纛l流而確定其是否應(yīng)停止傳輸其音頻流。優(yōu)選地,所述控制步驟包括以下步驟每個(gè)終端均在沒有來自網(wǎng)絡(luò)40的任何同步消息的情況下獨(dú)立于所述若干終端就所述超負(fù)荷狀態(tài)達(dá)成相同決定。
所述方法優(yōu)選地包括以下步驟允許傳輸最近期講話音頻流的節(jié)點(diǎn)繼續(xù)傳輸它們的音頻流。優(yōu)選地,所述允許步驟包括對每個(gè)節(jié)點(diǎn)進(jìn)行記分的步驟,其中具有最高記分的節(jié)點(diǎn)繼續(xù)進(jìn)行傳輸。所述記分步驟優(yōu)選地包括以下步驟使用在過去60秒內(nèi)每一方的音頻包的計(jì)數(shù)來確定所述記分。
本發(fā)明關(guān)于一種用于具有其它節(jié)點(diǎn)的網(wǎng)絡(luò)40的電話會(huì)議節(jié)點(diǎn)12。所述節(jié)點(diǎn)包含網(wǎng)絡(luò)40接口,其與其它節(jié)點(diǎn)進(jìn)行通信以形成實(shí)況講話會(huì)議。所述節(jié)點(diǎn)包含控制器19,其檢測正由所述終端傳輸超過預(yù)定數(shù)目個(gè)同時(shí)實(shí)況講話音頻流的超負(fù)荷狀態(tài),且連同其它終端一起控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束所述超負(fù)荷狀態(tài)。優(yōu)選地,所述節(jié)點(diǎn)包括用以接收講話的音頻接收器58、用以俘獲節(jié)點(diǎn)處的實(shí)況圖像的圖像裝置和用以播放從其它節(jié)點(diǎn)處接收到的音頻流的揚(yáng)聲器64。
在優(yōu)選實(shí)施例的操作中,大型實(shí)況會(huì)議的會(huì)議參與者的最大數(shù)目造成一個(gè)音頻處理問題,在15方會(huì)議中不存在所述音頻處理問題。假定主持一個(gè)100方會(huì)議,但所有遠(yuǎn)程終端都不是沉默的且因此能夠在任何時(shí)間傳輸音頻。主發(fā)言人64發(fā)表一個(gè)每個(gè)人均對此作出回應(yīng)的意見,且在100-300ms的非常短時(shí)間中,每個(gè)端點(diǎn)開始發(fā)送音頻數(shù)據(jù),從而造成“音頻包風(fēng)暴”。此類風(fēng)暴對會(huì)議的影響可能會(huì)是接收到的噪聲下限增加且等于20 dB的所有信號均進(jìn)入音頻輸出。端點(diǎn)每秒處理5000個(gè)音頻RTP包。將端點(diǎn)連接到會(huì)議的其它部分的任何低帶寬鏈路將必須與8Mbps音頻數(shù)據(jù)流競爭。(注意8Mbps數(shù)字是從每個(gè)裝置以64kbps傳輸音頻數(shù)據(jù)、以4.8kbps傳輸RTP額外開銷和約4kbps傳輸IP額外開銷得到的。)檢測將所接收的音頻包的速率與閾值進(jìn)行比較。每個(gè)端點(diǎn)獨(dú)立地確定是否存在風(fēng)暴和其應(yīng)繼續(xù)發(fā)送音頻數(shù)據(jù)還是自動(dòng)沉默。所述端點(diǎn)共享的共用線程在于每個(gè)端點(diǎn)可估計(jì)其它端點(diǎn)講話活動(dòng)性統(tǒng)計(jì)數(shù)據(jù),因?yàn)樗鼈儗⒔邮毡舜说囊纛l數(shù)據(jù)。
根據(jù)模擬,可預(yù)計(jì)所傳輸?shù)囊纛l通道的數(shù)目超過一段較短時(shí)間(通常小于300ms)的極限。這一點(diǎn)的原因在于,在網(wǎng)絡(luò)40中存在延遲,所述延遲將影響任何一個(gè)端點(diǎn)何時(shí)可檢測到風(fēng)暴。如果所述延遲是50ms,那么在端點(diǎn)檢測到風(fēng)暴之前,多達(dá)三個(gè)包可在路由中。并且,每個(gè)端點(diǎn)必須決定其是否應(yīng)自動(dòng)沉默??紤]到歸因于每個(gè)端點(diǎn)檢測到風(fēng)暴且決定如何緩解所述風(fēng)暴的時(shí)間點(diǎn)上的差異的統(tǒng)計(jì)上的典型變化,將存在比預(yù)期更多或更少的沉默的端點(diǎn)。如果沒有足夠的端點(diǎn)沉默來平息風(fēng)暴,那么某些端點(diǎn)將稍后沉默。在此過程中,存在由端點(diǎn)執(zhí)行風(fēng)暴檢測和緩解過程的不同時(shí)間以及通道隨機(jī)性或抖動(dòng)引起的隨機(jī)性。
當(dāng)給定時(shí)間間隔中所接收的音頻包的數(shù)目超過檢測閾值時(shí),檢測到(或斷言)風(fēng)暴。
音頻風(fēng)暴檢測和緩解自動(dòng)保護(hù)模式目標(biāo)在于防止音頻風(fēng)暴鎖死ViPr終端,因?yàn)橐纛l過程具有最高優(yōu)先級。只在音頻質(zhì)量保護(hù)模式不作用且發(fā)送過量的音頻包時(shí)才調(diào)用。此模式還防止拒絕服務(wù)攻擊。
在相對較小的時(shí)間段(100-200ms)內(nèi)對傳入包進(jìn)行計(jì)數(shù),且如果超過閾值,那么在所述時(shí)間段期間丟棄任何多余的所接收的包。
音頻質(zhì)量保護(hù)模式目標(biāo)在于限制發(fā)送音頻包來防止網(wǎng)絡(luò)40超負(fù)荷且防止每個(gè)遠(yuǎn)程終端處過多的噪聲和音量。
1.所有終端收集關(guān)于所有音頻流的統(tǒng)計(jì)數(shù)據(jù),包括本地終端在內(nèi)。
2.所有終端獨(dú)立地通過追蹤正活動(dòng)地發(fā)送數(shù)據(jù)的傳入通道的數(shù)目來檢測音頻風(fēng)暴的開始。
3.每個(gè)終端獨(dú)立地基于其本地音頻傳輸?shù)挠浄趾蛠碜赃h(yuǎn)程終端的記分來決定是否要停止發(fā)送其音頻流。
對于ViPr音頻風(fēng)暴檢測和緩解為新穎的關(guān)鍵特征每個(gè)終端在決定是否要發(fā)送音頻數(shù)據(jù)上完全是自主的而不受其它終端控制。
將所有終端的決定過程聯(lián)系在一起的是所有終端計(jì)算每個(gè)通道的近似相同的統(tǒng)計(jì)數(shù)據(jù)。
下文主要是針對“如何建立“音頻風(fēng)暴檢測和恢復(fù)”裝置”的描述。
電話會(huì)議中的每一方以規(guī)則間隔向所述電話會(huì)議中的所有其它方發(fā)送實(shí)況講話音頻包。限制網(wǎng)絡(luò)40和處理器負(fù)荷的主要方法是各方在靜默時(shí)期期間停止發(fā)送這些音頻包。在典型電話會(huì)議中,只有幾方會(huì)同時(shí)發(fā)言,且所有其它方將處于“安靜”模式。因而,每一方將僅活動(dòng)地從那幾方接收包。當(dāng)新的一方對議題作出回應(yīng)時(shí),語音活動(dòng)性檢測邏輯將啟用從所述端點(diǎn)的音頻包傳輸。同樣,當(dāng)一方停止講話時(shí),語音活動(dòng)性檢測邏輯將再次激活“安靜”模式以停止包流動(dòng)。
每當(dāng)出現(xiàn)產(chǎn)生較大同時(shí)音頻回應(yīng)的情形時(shí),每一方將在退出“安靜”模式時(shí)開始傳輸包。當(dāng)許多音頻流同時(shí)為活動(dòng)的時(shí),在每個(gè)端點(diǎn)處進(jìn)行的音頻混合功能將變得對處理器造成愈加繁重的負(fù)擔(dān)。還存在對于網(wǎng)絡(luò)40負(fù)荷的大量增加。這是被稱為“音頻風(fēng)暴”的情況,且以下描述詳細(xì)說明用以檢測和停止音頻風(fēng)暴的設(shè)計(jì)。
由于每一方實(shí)時(shí)處理傳入音頻包且在音頻風(fēng)暴期間已經(jīng)存在大大增加的網(wǎng)絡(luò)40流量,使用二級網(wǎng)絡(luò)40信令來在各方之間交換音頻風(fēng)暴信息不是一種容易的方式。這需要每個(gè)端點(diǎn)獨(dú)立地檢測音頻風(fēng)暴。這還需要電話會(huì)議中的每個(gè)端點(diǎn)維持其自己的關(guān)于會(huì)議中的每一方(包括其自身在內(nèi))的短期音頻包歷史。
音頻風(fēng)暴的初始檢測相對較容易。每當(dāng)一方有效地從至少“nStormThreshold”數(shù)目個(gè)參與方接收音頻數(shù)據(jù)時(shí),就簡單地?cái)嘌砸纛l風(fēng)暴。困難部分在于決定如何控制此風(fēng)暴。理想情形是使得在風(fēng)暴前一直在講話的相同方仍然能被聽到。每一者還應(yīng)仍然能夠聽到若干額外方,以便它們同樣能聽到它們的反應(yīng)。
來自每一方的先前音頻包的歷史用于創(chuàng)建“記分”,所述記分接著將決定哪些方是最近期講話者。位于列表頂部的參與方的“nSimultaneousTalkers(n同時(shí)講話者)”數(shù)目可接著被用于決定哪些是在檢測到音頻風(fēng)暴之后繼續(xù)進(jìn)行傳輸?shù)倪x定方。由于所有端點(diǎn)均保持完全相同的音頻包歷史,因而它們應(yīng)總是具有完全相同的記分列表。如果特定端點(diǎn)位于列表頂部內(nèi),那么其應(yīng)繼續(xù)進(jìn)行傳輸;否則,其必須立即停止傳輸。此列表的其它用途在于限制對哪些方進(jìn)行解碼及混合以供音頻回放。音頻風(fēng)暴的影響將減弱,且只有位于列表頂部的所述幾方將繼續(xù)進(jìn)行傳輸并被聽到。
剩下的最后一件事情是等到音頻風(fēng)暴結(jié)束以恢復(fù)正常的會(huì)議作業(yè)。由于最初將恰好存在“nSimultaneousTalkers”數(shù)目個(gè)參與方進(jìn)行傳輸,因而需要在宣布音頻風(fēng)暴結(jié)束之前等到進(jìn)行傳輸?shù)膮⑴c方少于“nStormEndThreshold(n風(fēng)暴結(jié)束閾值)”數(shù)目為止。
典型的記分算法是使用過去60秒內(nèi)每一方的音頻包計(jì)數(shù)。接著,在還從這方接收到至少一個(gè)包的情況下針對每個(gè)先前500毫秒間隔將此計(jì)數(shù)遞增100。對于每一方,這一過程繼續(xù)返回進(jìn)行至60秒歷史中,直到第一個(gè)500毫秒間隔不含有任何包為止。此記分方法首先關(guān)注最近期講話者且接著關(guān)注在過去60秒內(nèi)說話的那幾方。
可使用其它更復(fù)雜的記分技術(shù),例如以人工方式將特定方識別為“關(guān)鍵陳述者”,這將一直把這些方的分?jǐn)?shù)設(shè)定在列表頂部,且因此這些方一直是聽得見的。
所提出的對音頻風(fēng)暴的解決方案假定終端必須獨(dú)立行動(dòng)來檢測和緩解音頻包風(fēng)暴。檢測將所接收的音頻包的速率與閾值進(jìn)行比較。每個(gè)終端獨(dú)立地確定是否存在風(fēng)暴和其是繼續(xù)發(fā)送音頻數(shù)據(jù)還是自動(dòng)沉默。ViPr終端共享的共用線程在于每個(gè)終端可估計(jì)其它終端的講話活動(dòng)性統(tǒng)計(jì)數(shù)據(jù),因?yàn)樗鼈儗⒔邮毡舜说囊纛l數(shù)據(jù)。
根據(jù)模擬,可預(yù)計(jì)所傳輸?shù)囊纛l通道的數(shù)目超過一段較短時(shí)間(通常少于300ms)的極限。這點(diǎn)的原因在于在網(wǎng)絡(luò)40中存在延遲,所述延遲將影響任何一個(gè)終端在何時(shí)可檢測到風(fēng)暴。如果延遲為50ms,那么在終端檢測到風(fēng)暴之前,多達(dá)三個(gè)包可在路由中。并且,每個(gè)端點(diǎn)必須決定其是否應(yīng)自動(dòng)沉默??紤]到歸因于每個(gè)終端檢測到風(fēng)暴且決定如何緩解所述風(fēng)暴的時(shí)間點(diǎn)上的差異的統(tǒng)計(jì)上的典型變化,將存在比預(yù)期更多或更少的沉默的終端。如果沒有足夠的終端沉默來平息風(fēng)暴,那么某些終端將稍后沉默。在此過程中,存在由終端執(zhí)行風(fēng)暴檢測和緩解過程的不同時(shí)間以及通道隨機(jī)性或抖動(dòng)引起的隨機(jī)性。
音頻包風(fēng)暴的時(shí)間記錄具有超過50個(gè)參與者的大型會(huì)議正在進(jìn)行中。一個(gè)或兩個(gè)參與者正活動(dòng)地講話,且剩余參與者正在收聽。作了一個(gè)有趣的陳述,且突然50個(gè)以上的參與者開始發(fā)笑。在每個(gè)ViPr終端處,VAD算法開始檢測到麥克風(fēng)音頻電平的增加,且如果這繼續(xù)60ms,那么發(fā)送4或5個(gè)包突發(fā)且接著以20ms間隔發(fā)送包。接收所述突發(fā)的終端將使用其來預(yù)加載抖動(dòng)緩沖器,并開始播放所接收的音頻。一旦笑聲減退,VAD將檢測到安靜并在關(guān)閉包之前開始兩秒倒數(shù)計(jì)時(shí)。
使用遠(yuǎn)程靜音(remote mute)的有主持的會(huì)議要求較低,因?yàn)橹鞒终呓o予參與者發(fā)言權(quán)。只有被給予發(fā)言權(quán)的那些參與者可發(fā)送音頻包。
包傳輸算法如果以下條件為真,那么傳輸包。
VAD算法正在檢測語音且在有主持的會(huì)議中,且主持者使此參與者不沉默或在無主持的會(huì)議中,且以下為真。
未檢測到音頻包風(fēng)暴或檢測到音頻包風(fēng)暴,參與者是重要講話者或基于發(fā)送的最后時(shí)間音頻數(shù)據(jù)與從其它參與者中每一者接收到的最后時(shí)間音頻數(shù)據(jù)的比較的參與者的等級。
音頻包風(fēng)暴檢測當(dāng)在給定時(shí)間間隔中所接收的音頻包的數(shù)目超過檢測閾值時(shí),檢測到(或斷言)風(fēng)暴。所述算法如下。
每當(dāng)接收到包時(shí),遞增全局變量g_nPktsRcvd。
每100ms,如果未檢測到音頻風(fēng)暴,
如果g_nPktsRcvd>m_nPktsStormDeclared,那么將bStormDetected設(shè)為真如果檢測到音頻風(fēng)暴,如果g_nPktsRcvd<m_nPktsStormDeclared,那么將bStormDetected設(shè)為假將g_nPktsRcvd設(shè)為0。
講話者活動(dòng)性測量用兩種方式之一測量講話活動(dòng)性。第一種方法計(jì)算在通常一分鐘的間隔中花費(fèi)在講話上的時(shí)間百分比。這僅針對本地講話者來進(jìn)行計(jì)算且使用以下算法。
將循環(huán)緩沖器TT_local初始化為全零,且將索引indxTT初始化為0。
每兩秒檢測一次,且未檢測到音頻包風(fēng)暴,如果本地參與者正在講話,那么在TT_local[indxTT]中設(shè)置1,否則將其設(shè)為0。遞增indxTT。
TT_local陣列中“1”的數(shù)目除以陣列大小就是講話時(shí)間的百分比。2秒的樣本間隔是基于具有2秒的最小接通時(shí)間的VAD。TT_local陣列經(jīng)設(shè)定大小以對最后一分鐘進(jìn)行取樣。如果在最后一分鐘的25%中檢測到講話,那么將本地講話者確定為重要類別。
用于測量講話活動(dòng)性的第二種方法使用接收或傳輸一個(gè)包的最近時(shí)間。在考慮包風(fēng)暴起源時(shí),僅使用最近包到達(dá)時(shí)間將不會(huì)產(chǎn)生有用的結(jié)果。更受關(guān)注的是在當(dāng)前音頻包風(fēng)暴開始之前發(fā)送音頻包的最近時(shí)間。以下算法追蹤所述包到達(dá)時(shí)間。
如果PktRcvTime>PktRcvTimeLast+1秒在當(dāng)前音頻包風(fēng)暴之前接收到最后包,且因此將PktRcvTimeLast復(fù)制到PktRcvTimeLast1中。
PktRcvTimeLast=PktRcvTime使用相同算法用于音頻包傳輸,但PktXmtTime取代PktRcvTime。
實(shí)施方案在AudioMan中,如果EncoderRdy()向AudioMan.cpp中的encoder_decoder_loop()返回真,那么調(diào)用訪問函數(shù)SetTalkTimeLast()。EncoderRdy返回狀態(tài)由VAD控制。在AudioStorm.cpp中找到SetXmtTimeLast()。
每2秒鐘,在AudioMan.cpp中的encoder_decoder_loop中調(diào)用UpdateTalkerActivity()。UpdateTalkerActivity()通過使用訪問函數(shù)IsTalking()確定本地參與者是否正在講話來查看VAD講話狀態(tài)eVADstate。如果檢測到講話,那么將“1”加載到循環(huán)緩沖器TT_local中。
對于每個(gè)所接收的包,調(diào)用函數(shù)SetRecTimeLast(iChannel)。使用訪問函數(shù)SetRecTimeLast(iChannel)來記錄所述通道的最近接收包時(shí)間,且遞增用于檢測音頻包風(fēng)暴的所接收包的數(shù)目nPktsRcvStorm。
每100毫秒,StormDetect()使用nPktRcvStorm來檢測包風(fēng)暴是否正在進(jìn)行中。StormDetect()位于encoder_decoder_loop()中的while(1)循環(huán)的頂部。如果檢測到風(fēng)暴,那么StormDetect()將調(diào)用VAD訪問函數(shù)SetStormMute(真),除非本地參與者是重要講話者或等級足夠高。
包解碼算法AudioMan在實(shí)時(shí)核心程序中運(yùn)行,且如果加載有40個(gè)以上傳入G.722流,那么將占用100%的CPU時(shí)間。觸摸面板將變得無回應(yīng),直到傳入音頻包的數(shù)目降到40以下。(值40是粗略近似。)如果某人說一些大多數(shù)參與者對此作出反應(yīng)的話(例如開玩笑),那么這些數(shù)目在大型會(huì)議中是可能的。AudioMan在指定時(shí)間段內(nèi)對所接收包的數(shù)目進(jìn)行計(jì)數(shù)。如果包計(jì)數(shù)超過規(guī)定閾值,那么簡單地丟棄在所述時(shí)段期滿之前到達(dá)的音頻包。由g_nPacketsPoliced追蹤所丟棄包的數(shù)目,且如果大于零,被顯示在展示狀態(tài)(ShowStatus)屏幕中的幫助(Help)中。
如同AudioMan中的每一者,服務(wù)器設(shè)置為Audio_MaxReceivedPackets=70Audio_MaxReceivedPacketsPeriod=40在此實(shí)例中,解碼在40ms時(shí)段中接收到的最初70個(gè)接收音頻包。丟棄第70個(gè)包之后接收到的任何包,直到所述40ms時(shí)段期滿,且接著所述過程重新開始。
關(guān)于音頻風(fēng)暴處理的關(guān)鍵“唯一”事物之一是每個(gè)終端獨(dú)立地達(dá)成“完全”相同的決策而沒有任何額外的同步消息。這得以成為可能是因?yàn)樗鼈兌冀邮障嗤纛l流且它們都使用相同記分規(guī)則。
以下申請案均以引用方式并入本文中題為“VIDEOPHONE AND METHOD FOR A VIDEO CALL”的第10/114,402號美國專利申請案題為“AUDIO MIXER AND METHOD”的第10/871,852號美國專利申請案題為“METHOD AND APPARATUS FOR CONFERENCING WITH STREAM”的第11/078,193號美國專利申請案節(jié)點(diǎn)可包括會(huì)議的成員、參與方、終端或參與者。會(huì)議通常包含至少三個(gè)節(jié)點(diǎn),且可具有10或20或者甚至50或100或150或更多節(jié)點(diǎn)。
總音頻帶寬必須永遠(yuǎn)不超過1000Kbps,否則音頻可能受到不利影響。音頻風(fēng)暴帶寬控制方法將最大講話者數(shù)目限制為10,以防止音頻和視頻降級。
視頻電話參看圖8、9、10和11,成像裝置30(例如由Sony提供的具有S視頻的常規(guī)模擬相機(jī)32)將來自成像裝置30的場景圖像轉(zhuǎn)換為電信號,所述電信號沿著導(dǎo)線發(fā)送到視頻解碼器34(例如Philips SAA7114 NTSC/PAL/解碼器)。視頻解碼器34將所述電信號轉(zhuǎn)換為數(shù)字信號,并將其作為場景的像素流發(fā)送出去(例如在BT 656格式下)。所述像素流被從視頻解碼器34中發(fā)送出去,且被分裂成第一流和與第一流相同的第二流。編碼器36(優(yōu)選地,IBM eNV 420編碼器)接收第一像素流,對所述第一流進(jìn)行操作,且產(chǎn)生MPEG-2格式的數(shù)據(jù)流。與在相機(jī)中產(chǎn)生時(shí)的數(shù)據(jù)相比,由視頻編碼器36產(chǎn)生的數(shù)據(jù)流的大小被壓縮約1/50。MPEG-2流是經(jīng)編碼的數(shù)字流,且在隨后被分包之前不受到幀緩沖以便最小化任何延遲。使用RTP通過現(xiàn)場可編程門陣列(FPGA)38和向其提供MPEG-2流的軟件來對經(jīng)編碼的MPEG-2數(shù)字流進(jìn)行分包,且使用網(wǎng)絡(luò)接口42經(jīng)由PLX 9054 PCI接口44以155兆位每秒的速率將所述MPEG-2數(shù)字流傳輸?shù)骄W(wǎng)絡(luò)40(例如以太網(wǎng)802.p或ATM)上。如果需要,可由解碼器34接收與VCR或電視節(jié)目(例如CNN或電影)相關(guān)聯(lián)的視頻流,且將其直接提供到顯示器控制器52以供顯示。位于FPGA 38中且連接到解碼器34的解碼器控制器46控制解碼器34的操作。
或者,如果使用數(shù)碼相機(jī)47,那么由所述相機(jī)產(chǎn)生的所得流已經(jīng)是數(shù)字格式且不需要提供到解碼器34。來自數(shù)碼相機(jī)47的數(shù)字流(其具有BT 656格式)被分裂成第一和第二流,所述第一和第二流直接來自相機(jī)而不穿過任何視頻解碼器34。
在另一替代方案中,火線相機(jī)(fire wire camera)48(例如1394接口火線相機(jī)48)可用于將數(shù)字信號直接提供到FPGA 38。所述火線相機(jī)48提供以下優(yōu)點(diǎn)如果數(shù)據(jù)流的產(chǎn)生將在距FPGA 38非常短的距離以外的任何地方,那么可在此較長距離上通過(例如)從火線相機(jī)48布電纜來支持所述數(shù)字信號。FPGA 38將來自火線相機(jī)48的數(shù)字信號提供到編碼器36以進(jìn)行處理(如上文所述),且還創(chuàng)建低幀速率流(如下文所述)。
將第二流提供到FPGA 38,其中FPGA 38和軟件產(chǎn)生低幀速率流(例如運(yùn)動(dòng)JPEG流),與第一流相比,這需要低帶寬。FPGA 38和具有軟件的主控制器50對此低幀速率流執(zhí)行編碼、壓縮和分包,并將其提供到PCI接口44,所述PCI接口44又將其通過網(wǎng)絡(luò)接口卡56傳送到網(wǎng)絡(luò)接口42以供傳輸?shù)骄W(wǎng)絡(luò)40上。經(jīng)編碼的MPEG-2數(shù)字流和低幀速率流是兩個(gè)基本相同但獨(dú)立的數(shù)據(jù)流,不同之處只是與MPEG-2數(shù)據(jù)流相比,所述低幀速率數(shù)據(jù)流被按比例縮小,以提供相對于MPEG-2數(shù)據(jù)流的相同場景的較小視圖,且要求網(wǎng)絡(luò)40的較少資源。
在網(wǎng)絡(luò)40上,每個(gè)數(shù)字流被載送到所需的接收器視頻電話15,或如果涉及具有兩個(gè)以上參與方的會(huì)議,那么載送到多個(gè)接收器視頻電話15。使用SIP來路由所述數(shù)據(jù)。接收視頻電話15的網(wǎng)絡(luò)接口卡56接收與第一和第二數(shù)據(jù)流相關(guān)聯(lián)的包,且將來自所述包的數(shù)據(jù)和由主控制器選擇的視頻流(第一或第二)提供到接收存儲器。具有軟件的接收視頻電話15的主控制器50對所選擇的所接收數(shù)據(jù)流進(jìn)行解碼和擴(kuò)展,并將其傳送到顯示器控制器52。顯示器控制器52使用標(biāo)準(zhǔn)縮放硬件在VGA數(shù)字平板顯示器上顯示重建的圖像。接收視頻電話15處的用戶可用觸摸屏74選擇觀看所述兩個(gè)數(shù)據(jù)流中的哪個(gè)流,或如果需要的話,選擇兩者,以便顯示所述場景的大圖像和小圖像,盡管一般不會(huì)發(fā)生顯示來自發(fā)射視頻電話15的兩個(gè)流的情況。下文論述用于顯示的協(xié)議。通過具有選擇場景的較大視圖或場景的較小視圖的選擇權(quán),用戶能夠分配系統(tǒng)10的資源,以便可選擇此刻對于觀看者來說以較大且較清楚圖片進(jìn)行觀看較為重要的個(gè)別圖像;同時(shí),仍然可以看到用戶仍想看但在那時(shí)不重要的那些圖像。
如果存在一個(gè)以上圖像(如果發(fā)生電話會(huì)議),那么顯示器控制器52造成每個(gè)獨(dú)特視頻流并排呈現(xiàn)在顯示器54上。對并排形成在顯示器54上的圖像進(jìn)行裁剪而并非按比例縮小,所以場景中對象的尺寸本身沒有受到改變,只是移除了與每個(gè)數(shù)據(jù)流相關(guān)聯(lián)的場景的每一側(cè)上的外部范圍。如果需要,可在顯示器54屏幕的右下角并排顯示來自與較小場景圖像相關(guān)聯(lián)的流的圖像。顯示器控制器52向LCD控制器72提供標(biāo)準(zhǔn)數(shù)字視頻,如圖9所示。由ATI或Nvidia生產(chǎn)的顯示器控制器52是標(biāo)準(zhǔn)VGA控制器。LCD控制器72自顯示器控制器52獲得標(biāo)準(zhǔn)化數(shù)字視頻,且使得圖像適合于所使用的特定面板(例如用于Fujistu面板的Philips)。
為了進(jìn)一步增強(qiáng)圖像的裁剪,代替簡單地從外部邊緣開始且朝向中心移動(dòng)來移除圖像的若干部分,裁剪圖像的不展示相關(guān)信息的部分。如果正在講話的個(gè)人出現(xiàn)在圖像的左側(cè)或右側(cè)上,那么需要在所述個(gè)人在圖像右側(cè)時(shí)從左側(cè)向內(nèi)進(jìn)行裁剪,或者在所述個(gè)人在圖像左側(cè)上時(shí)從右側(cè)向內(nèi)進(jìn)行裁剪,而并非僅從每個(gè)外部邊緣向內(nèi)進(jìn)行裁剪,從每個(gè)外部邊緣向內(nèi)進(jìn)行裁剪會(huì)造成丟失所述個(gè)人的一部分。對視頻追蹤的使用可查看所形成的圖像,并分析在圖像哪處發(fā)生改變以識別個(gè)人位于圖像的哪處。假定所述個(gè)人將相對于圖像的其它區(qū)域較多地進(jìn)行移動(dòng),且通過識別所述相對移動(dòng),可確定所述個(gè)人在圖像中的位置。根據(jù)此視頻追蹤,可使得裁剪發(fā)生在存在最少量改變的邊緣處?;蛘?,或結(jié)合視頻追蹤,也可使用音頻追蹤來引導(dǎo)所發(fā)生的圖像裁剪。由于視頻電話15具有麥克風(fēng)陣列,基于給定聲音到達(dá)麥克風(fēng)陣列的不同元件所花費(fèi)的不同時(shí)間的標(biāo)準(zhǔn)三角測量技術(shù)可用于確定所述個(gè)人相對于所述麥克風(fēng)陣列位于何處,且由于知道麥克風(fēng)陣列相對于正被成像的場景的位置,因而得知所述個(gè)人在圖像中的位置。
視頻電話15的功能性由監(jiān)視器上的觸摸屏74控制。所述觸摸屏74(其為標(biāo)準(zhǔn)玻璃觸摸屏)向觸摸屏控制器76提供原始信號。當(dāng)用戶在給定位置處觸摸玻璃時(shí),由在玻璃上產(chǎn)生的超聲波感測所述原始信號,正如此項(xiàng)技術(shù)中眾所周知。觸摸屏控制器76接著獲取原始信號,并將其轉(zhuǎn)換為關(guān)于在顯示器上的X和Y位置的有意義信息,且將此信息傳遞到主控制器50。
如果電視或VCR連接可用,那么將電視或電影的饋入信號提供到解碼器34,其中如同由視頻電話15接收的任何其它視頻信號那樣來控制所述饋入。電視或電影可在顯示器54上呈現(xiàn)在來自與另一視頻電話15的視頻連接的場景的旁邊。
所述場景的音頻流基本上沿著與音頻視頻流平行及相似的路徑,不同之處只是從音頻接收器58(所述音頻接收器58例如麥克風(fēng)、聲卡、耳機(jī)或手持話機(jī))提供音頻流到CS晶體4201音頻接口60或例如執(zhí)行信號的模擬到數(shù)字和數(shù)字模擬轉(zhuǎn)換以及控制音量和混合的編解碼器,其對音頻信號進(jìn)行數(shù)字化并將其提供到TCI 320C6711或6205 DSP 62。DSP 62接著對數(shù)字化音頻流進(jìn)行分包,且將所述數(shù)字化音頻流傳送到FPGA 38。FRGA 38又將其提供到PCI接口44,在所述PCI接口44處接著將其傳遞到網(wǎng)絡(luò)接口卡56以在網(wǎng)絡(luò)40上進(jìn)行傳輸。由接收視頻電話15接收到的音頻流被傳遞到FRGA 38且繼續(xù)傳遞到DSP 62上,且接著傳遞到音頻接口60,所述音頻接口60將所述數(shù)字信號轉(zhuǎn)換為模擬信號以供在揚(yáng)聲器64上進(jìn)行播放。
網(wǎng)絡(luò)接口卡56對傳輸?shù)骄W(wǎng)絡(luò)40的每個(gè)音頻包和視頻包印時(shí)戳。處理由視頻電話15接收到的音頻和視頻的速度較快,足以使人眼和人耳在聽到其時(shí)不能分辨出音頻與所述場景的在時(shí)間上相關(guān)聯(lián)的視頻的任何未對準(zhǔn)。對于場景的音頻和視頻信息的處理設(shè)置小于20-30毫秒的限制,以維持所述場景的視頻與音頻的此關(guān)聯(lián)性。為了確保當(dāng)在接收視頻電話15處接收到時(shí)場景的音頻和視頻是同步的,檢查每個(gè)包的時(shí)戳,且相應(yīng)的基于音頻的包和基于視頻的包由接收視頻電話15對準(zhǔn)并相應(yīng)地基本上同時(shí)進(jìn)行播放,所以接收器視頻電話15處不存在用戶可辨別的場景的視頻和音頻的不對準(zhǔn)。
ENC-DSP板含有IBM eNV 420 MPEG-2編碼器和支持電路、用于音頻編碼和解碼的DSP 62,和PCI接口44。在具有高性能PC 68平臺和顯示器54系統(tǒng)10時(shí),其含有實(shí)現(xiàn)全部視頻電話15終端功能性所必須的硬件。這是適應(yīng)全尺寸PCI 2.2的設(shè)計(jì)。相機(jī)、麥克風(fēng)和揚(yáng)聲器64介接到此板。DSP 62將執(zhí)行音頻編碼、解碼、混合、立體聲布置、電平控制、間隙填補(bǔ)、分包和其它音頻功能,例如立體AEC、射束控制、噪聲消除、鍵盤敲擊聲消除和去混響。EPGA 38通過使用Celoxia(Handel-C)工具來開發(fā),且是完全可重配置的。布局支持在1-3百萬個(gè)門電路范圍內(nèi)的零件。
此板包括數(shù)碼相機(jī)47芯片接口、硬件或基于“視頻DSP”的多通道視頻解碼器34接口,使用DVI輸入和輸出連接器的視頻疊加,視頻疊加具有高達(dá)完全無音幀(full dumbframe)緩沖能力。
使用NTSC或PAL視頻信號,編碼器36應(yīng)產(chǎn)生640×480且優(yōu)選地720×480或更佳分辨率的高質(zhì)量視頻流。應(yīng)控制位速率,以使得限制每幀的最大位數(shù),以便防止經(jīng)由網(wǎng)絡(luò)40的傳輸延遲。解碼器34必須在接收到第一數(shù)據(jù)宏區(qū)塊時(shí)開始對片段進(jìn)行解碼。需要某種緩沖來適應(yīng)微小抖動(dòng)且從而改進(jìn)圖片。
廣泛使用并部署MPEG-2,這是DVD和VCD編碼、數(shù)字VCR和時(shí)間移位裝置(例如TiVo)以及DSS和其它數(shù)字TV推廣的基礎(chǔ)。其通常被認(rèn)為是對于4到50兆位/秒視頻傳輸?shù)淖钸m合選擇。因?yàn)樗膹V泛使用,現(xiàn)在市場上可購買到相對較低成本且高度集成的解碼和(最近些年來)編碼解決方案。
應(yīng)將MPEG-2考慮作為用于編碼視頻的句法而并非標(biāo)準(zhǔn)壓縮方法。盡管本說明書定義所述句法和編碼方法,但在使用所述方法中存在非常寬的自由,只要遵循所定義的句法便可。出于此原因,關(guān)于MPEG-2的概括通常是令人誤解的或不準(zhǔn)確的。必須深入到特定編碼方法和預(yù)期應(yīng)用的較低細(xì)節(jié)水平,以便針對特定應(yīng)用估計(jì)MPEG-2的性能。
對視頻電話15項(xiàng)目有意義的是低延遲編碼和解碼的問題以及與網(wǎng)絡(luò)40有關(guān)的問題。在MPEG-2算法中存在三個(gè)主要問題需要理解以在網(wǎng)絡(luò)40上達(dá)成低延遲高質(zhì)量視頻 GOP(圖片群組)結(jié)構(gòu)和其對延遲的作用 位速率、編碼幀大小變化和VBV緩沖器對延遲和網(wǎng)絡(luò)40要求的影響
GOP結(jié)構(gòu)對具有包損失的質(zhì)量的影響GOP結(jié)構(gòu)和延遲MPEG-2定義三種編碼幀I、P和B。使用中最常見的GOP結(jié)構(gòu)為16幀長IPBBPBBPBBPBBPBB。此結(jié)構(gòu)的問題在于由于B幀是從先前和隨后幀估計(jì)得到的運(yùn)動(dòng),每個(gè)連續(xù)B幀需要在可開始編碼所述B幀之前俘獲隨后幀。當(dāng)每個(gè)幀為33毫秒時(shí),這(與沒有B幀的結(jié)構(gòu)相比)為GOP結(jié)構(gòu)添加了最少66毫秒的額外延遲。這導(dǎo)致僅含有I和/或P幀的低延遲GOP結(jié)構(gòu),這在MPEG-2規(guī)范中界定為SP@ML(簡單輪廓)編碼。
位速率、編碼幀大小和VBV一旦消除B幀以最小化編碼延遲,GOP就由I幀和與I幀相關(guān)的P幀組成。因?yàn)镮幀完全是幀內(nèi)編碼的,所以使用大量位來做此事,且對于隨后P幀使用較少位。
應(yīng)注意到I幀可為P幀的8倍大,且為標(biāo)稱位速率的5倍。這對網(wǎng)絡(luò)40要求和延遲具有直接影響如果存在帶寬限制,I幀將在網(wǎng)絡(luò)40限制下受到緩沖,從而導(dǎo)致對經(jīng)由受限區(qū)段的傳送增加多個(gè)幀時(shí)間的延遲。此緩沖必須在接收器處匹配,因?yàn)椴シ潘俾视梢曨l設(shè)置,而并非由網(wǎng)絡(luò)40帶寬設(shè)置。用于以上數(shù)據(jù)的樣本為低運(yùn)動(dòng)辦公室場景;在具有場景改變的高運(yùn)動(dòng)內(nèi)容中,取決于內(nèi)容而定,幀將被分配更多或更少的位,其中在場景改變處發(fā)生一些較大的P幀。
為控制此特性,MPGE-2實(shí)施VBV緩沖器(視頻緩沖驗(yàn)證器),其允許對最大編碼幀大小與標(biāo)稱位速率之間的比率進(jìn)行某程度的控制。通過嚴(yán)密約束VBV使得將I幀限制為小于由標(biāo)稱位速率指示的大小的2倍,可將添加的緩沖延遲限制為1個(gè)額外幀時(shí)間。限制VBV大小的代價(jià)是圖片質(zhì)量引入較大I幀的原因是為隨后P幀提供良好基礎(chǔ),且當(dāng)I幀的大小受到約束時(shí),在較低位速率(<4兆位)下圖片質(zhì)量受到嚴(yán)重降級??紤]在2兆位下,平均幀大小為8千字節(jié),且甚至此大小的2倍也不足以用優(yōu)良質(zhì)量來編碼320×240 JPEG圖像,其類似于I幀受到DCT壓縮。
借助于僅I幀編碼可實(shí)現(xiàn)更一致的編碼幀大小,但會(huì)進(jìn)一步降級質(zhì)量。低位速率的僅I幀編碼沒有利用MPEG-2算法的大部分壓縮能力。
MPEG-2規(guī)范定義了CBR(固定位速率)和VBR(可變位速率)模式,且允許流內(nèi)的可變GOP結(jié)構(gòu)。定義CBR模式以針對每個(gè)GOP產(chǎn)生一致數(shù)目的位,必要時(shí)使用填充。期望將VBR用以通過允許編碼帶寬的變化,從而準(zhǔn)許所述流向難以編碼的區(qū)域分配較多位(只要這可由較簡單區(qū)段中的較低位速率進(jìn)行補(bǔ)償)來實(shí)現(xiàn)一致質(zhì)量。VBR可由兩次通過或單次通過技術(shù)實(shí)施??勺僄OP結(jié)構(gòu)允許(例如)將I幀放置在場景過渡邊界處來消除可見的壓縮假像。由于低延遲要求和對向前查看少許位以便實(shí)施VBR或可變GOP的需要,這些模式對于視頻電話15應(yīng)用具有很少利益。
因?yàn)榈湫虶OP結(jié)構(gòu)中的P和B幀依賴于I幀和在前的P和B幀,所以數(shù)據(jù)損失影響錯(cuò)誤之后且直到下一I幀的所有幀。這還影響啟動(dòng)等待時(shí)間,例如當(dāng)在DSS系統(tǒng)10上變換通道時(shí)所發(fā)生的,其中解碼器34在能開始顯示圖像之前等待I幀。出于此原因,必須針對應(yīng)用和傳遞系統(tǒng)10對GOP長度、結(jié)構(gòu)和位速率進(jìn)行調(diào)節(jié)。在使用IP的實(shí)時(shí)協(xié)作的情況下,使用不可靠的傳送協(xié)議(例如RTP或UDP),因?yàn)楸仨殞⑦t到的包視為丟失的,這是由于無法承受處理可靠協(xié)議握手和重傳輸所需的延遲。已對包損失對視頻質(zhì)量的影響作了各種分析,結(jié)果展示,對于典型IPB GOP結(jié)構(gòu),1%的包損失導(dǎo)致30%的幀損失。較短的GOP結(jié)構(gòu)且最終僅I幀流(具有質(zhì)量損失)對此有些幫助,且FEC(前向錯(cuò)誤校正)技術(shù)可在發(fā)生損失時(shí)具有很少幫助,但當(dāng)然MPEG-2的一個(gè)問題在于它對數(shù)據(jù)損失的容許度不高。
被稱為連續(xù)P幀編碼的GOP結(jié)構(gòu)解決了所有前述問題,且以相對較低的位速率為視頻電話15提供極佳的視頻質(zhì)量。連續(xù)P編碼在P幀內(nèi)利用了幀間編碼幀的宏區(qū)塊的能力。通過編碼每個(gè)幀中的16×16像素宏區(qū)塊的偽隨機(jī)組且運(yùn)動(dòng)編碼其它,I幀的位的等效物分布在每個(gè)幀中。通過實(shí)施偽隨機(jī)宏區(qū)塊選擇來確保頻繁地更新所有塊,可以合理的方式處理啟動(dòng)和場景改變。
IBM已針對S420編碼器實(shí)施了此算法,將整個(gè)幀DCT更新速率設(shè)置為8個(gè)幀(每秒3.75次)。用于典型辦公室和會(huì)議內(nèi)容時(shí)的結(jié)果給人的印象非常深刻。對于視頻電話15來說,編碼延遲、編碼幀大小變化和包損失特性幾乎是理想的。對編碼樣本的檢查展示,對于場景改變和高動(dòng)態(tài)內(nèi)容,編碼器36假像是明顯的,但對于典型講話者協(xié)作內(nèi)容,質(zhì)量非常好。
高質(zhì)量音頻是有效通信的基本先決條件。高質(zhì)量被定義為全雙工、7kHz帶寬(電話為3.2kHz)、>30dB信噪比、沒有可感知回聲、切斷或失真。安裝將非常簡單,涉及盡可能少的電纜。板上診斷將指示所述問題和如何解決其。來自揚(yáng)聲器64的聲音將不會(huì)有高聲砰響和轟鳴以及過高或過低的音量。
可基于先前音頻信號對來自丟失或遲到的包的音頻信號進(jìn)行“填補(bǔ)”。由于網(wǎng)絡(luò)40抖動(dòng)與向音頻添加延遲之間的平衡,音頻緩沖器應(yīng)為約50ms??蓽p少320樣本或20ms的當(dāng)前包大小來減小編碼和解碼等待時(shí)間。然而,20ms是RTP包的標(biāo)準(zhǔn)數(shù)據(jù)長度。
在商品中可使用下文描述的某些過程。然而,出于成本和集成原因,它們將在DSP 62上進(jìn)行實(shí)施。在另一實(shí)施例中,第二DSP 62也可執(zhí)行聲響回聲消除,而并非僅一個(gè)DSP62執(zhí)行此功能。
音頻系統(tǒng)10具有發(fā)射和接收部分。發(fā)射部分由以下各項(xiàng)組成麥克風(fēng)揚(yáng)聲器電話的主要不足之一是在遠(yuǎn)端處聽到的有回響的聲音。此有回響的聲音是由于室內(nèi)混響的緣故,且最好被認(rèn)為是反射(混響)聲音功率與直接聲音功率的比率。目前,改進(jìn)拾音的最好方法是將麥克風(fēng)定位在靠近講話者處且因此增加直接聲音功率。在辦公室環(huán)境下,麥克風(fēng)可定位在PC 68監(jiān)視器處、在視頻電話15終端上和在白板處。
自動(dòng)增益控制自動(dòng)調(diào)節(jié)每個(gè)麥克風(fēng)的前置放大器的增益,以使得完全使用ADC范圍。將必須把前置放大器增益發(fā)送到其它音頻過程,例如AEC和噪聲降低。
編解碼器在其最簡單形式中,這是ADC裝置。然而,若干公司(例如Texas Instruments andAnalog Devices Inc)具有帶有模擬放大器和模擬多路復(fù)用器的編解碼器。并且,駐留在芯片上的是具有類似控制的DAC。在先前部分中描述的自動(dòng)增益控制在所述編解碼器中實(shí)施且由DSP 62控制。
噪聲降低可使用兩種噪聲降低方法來改進(jìn)SNR。第一種方法通常被稱為噪聲選通,其依據(jù)存在的信號電平來接通和斷開通道。第二種方法是自適應(yīng)噪聲消除(ANC)且從麥克風(fēng)信號中減去不想要的噪聲。在辦公室環(huán)境中,可能會(huì)使用ANC來移除PA通知、風(fēng)扇噪聲,且在某些情況下,甚至移除鍵盤敲擊聲。
可使用在商業(yè)音頻編輯插件(例如Cold Edit和Goldwave)中的噪聲降低或選通算法,其可施加特定效果、從記錄中移除刮劃和砰響噪聲且還從磁帶錄音中移除嘶聲。
聲響回聲消除當(dāng)講話者的語音在超過50ms之后返回到講話者時(shí),聽到回聲。回聲是非常令人分心的,且因此必須將其移除。兩個(gè)回聲源是線路回聲和聲響回聲。線路回聲是由于雙線電話系統(tǒng)10的特征引起的。PSTN通過使用線路回聲消除器(LEC)來移除此回聲。當(dāng)使用揚(yáng)聲器電話系統(tǒng)10時(shí),在電話揚(yáng)聲器與麥克風(fēng)之間發(fā)生聲響回聲。來自遠(yuǎn)程揚(yáng)聲器的聲音由遠(yuǎn)程麥克風(fēng)拾取并返回到講話者。聲響回聲消除(AEC)比LEC困難,因?yàn)閷κ覂?nèi)聲響進(jìn)行建模是較為復(fù)雜的,且室內(nèi)聲響可隨著人們移動(dòng)而突然改變。存在多種AEC產(chǎn)品,從例如ASPI EF1210的獨(dú)立裝置到經(jīng)優(yōu)化以在DSP 62平臺上運(yùn)行的信號工作目標(biāo)模塊(Signal Works object modules)。
自動(dòng)混合自動(dòng)混合選擇將哪些麥克風(fēng)信號混合在一起且將混合器的單耳輸出發(fā)送到編碼器36。選擇標(biāo)準(zhǔn)是基于使用最高音量源附近的麥克風(fēng)或使用接收高于閾值水平的聲音的麥克風(fēng)。自動(dòng)混合器可從各個(gè)銷售商處購得,且用于電話會(huì)議和電話教學(xué)系統(tǒng)。
編碼為降低數(shù)據(jù)傳輸帶寬,通過利用典型的信號特征和我們對語音的感知來將音頻信號壓縮為較低位速率。目前,G.722編解碼器以64千位/秒的合理位速率提供最佳音頻質(zhì)量(7kHz帶寬@14位)。
RTP傳輸將經(jīng)編碼的音頻數(shù)據(jù)分割成20毫秒片斷且作為實(shí)時(shí)協(xié)議(RTP)包發(fā)送。RTP是針對VoIP和電話會(huì)議應(yīng)用所需的實(shí)時(shí)數(shù)據(jù)交換而特別設(shè)計(jì)的。
接收部分是RTP接收將含有來自一個(gè)或一個(gè)以上遠(yuǎn)程位置的音頻流的RTP包放置在其各自緩沖器中。檢測到丟失或遲到的包,且將所述信息傳遞到間隙處理器。次序紊亂的包是遲到的包的特殊情況,且相同遲到的包有可能被丟棄。替代方案是用緩沖器來將音頻信號的播放延遲至少一個(gè)包長度。將必須約束緩沖器的大小,以使得端到端延遲不長于100ms。
解碼將G.722音頻流解碼為用于編解碼器的PCM樣本。
間隙處理經(jīng)由任何網(wǎng)絡(luò),RTP包將被丟失或破壞。因此,間隙處理器將基于先前包的頻譜和統(tǒng)計(jì)數(shù)據(jù)來“填補(bǔ)”丟失數(shù)據(jù)。在最小程度上,應(yīng)在數(shù)據(jù)流中填充零以組成數(shù)據(jù),但可使用用以填補(bǔ)數(shù)據(jù)的頻譜內(nèi)插或外推算法。
緩沖網(wǎng)絡(luò)抖動(dòng)將需要緩沖,以實(shí)現(xiàn)連續(xù)的音頻播放。此緩沖器將可能基于短期抖動(dòng)統(tǒng)計(jì)數(shù)據(jù)與等待時(shí)間影響之間的折衷來調(diào)節(jié)其大小(且因此,等待時(shí)間)。
速率控制視頻電話15終端的標(biāo)稱樣本速率是16kHz。然而,將存在微小差異且需要對其進(jìn)行處理。舉例來說,假定視頻電話15北端以正好16,001Hz進(jìn)行取樣,而視頻電話15南端以15,999Hz進(jìn)行取樣。因此,南終端將每秒累積比其輸出到揚(yáng)聲器的樣本多的1個(gè)樣本,且北終端將具有相等量的不足。關(guān)于接收緩沖器的長期統(tǒng)計(jì)數(shù)據(jù)將能夠確定樣本速率微分是多少,且可計(jì)算恰當(dāng)?shù)膬?nèi)插(對于視頻電話15北端)或消去(對于視頻電話15南端)因數(shù)。
音量控制調(diào)節(jié)來自揚(yáng)聲器64的音量通常由遠(yuǎn)程收聽者進(jìn)行。較好的方式可能是基于其對于房間中的麥克風(fēng)來說有多響來自動(dòng)調(diào)節(jié)來自揚(yáng)聲器64的聲音??煽紤]其它因素(例如背景噪聲和收聽者的自身偏好)。
立體聲布置可將來自不同位置的遠(yuǎn)程講話者布置在聽覺域中。因此,來自位置A的個(gè)人將始終來自左邊,來自位置B的個(gè)人始終來自中間,且來自位置C的個(gè)人始終來自右邊。此布置使得更易于追蹤誰正在講話。
揚(yáng)聲器聲音的質(zhì)量在某種程度上是由揚(yáng)聲器64和外殼的質(zhì)量決定的。在任何情況下,將自動(dòng)放大揚(yáng)聲器64用于視頻電話15終端。
微分本會(huì)議系統(tǒng)(例如PolyCom Soundstation)提供令人滿意但帶寬受限的全雙工音頻質(zhì)量。然而,帶寬被限制為3500Hz,且所得聲音質(zhì)量使聽覺負(fù)擔(dān)很重,且特別是辨別摩擦音時(shí)。
視頻電話15將帶寬延伸到7kHz,且自動(dòng)混合多個(gè)麥克風(fēng),以最小化室內(nèi)混響。當(dāng)三人或三人以上正在講話時(shí),將遠(yuǎn)程參與者中的每一者放置在立體聲音領(lǐng)域的唯一位置中。結(jié)合高質(zhì)量音頻拾取和增大的帶寬,經(jīng)由網(wǎng)絡(luò)40的會(huì)議將非常近似于親臨其境的會(huì)議。
音頻系統(tǒng)10使用多個(gè)麥克風(fēng)來獲得較好的聲音拾取,且使用寬帶編碼器(G.722)來獲得比當(dāng)前由tollgrade系統(tǒng)提供的保真度好的保真度。另外,對于多方會(huì)議,將實(shí)施遠(yuǎn)程講話者的立體聲布置,且聲響回聲消除系統(tǒng)10用以實(shí)現(xiàn)自動(dòng)操作。房間內(nèi)的音量調(diào)節(jié)將由用于末端用戶的單個(gè)控件自動(dòng)控制,以調(diào)節(jié)整體聲音水平。
在視頻電話15網(wǎng)絡(luò)40中,網(wǎng)關(guān)70將某些非SIP設(shè)備連接到SIP環(huán)境。通常存在電氣差異以及協(xié)議差異。大多數(shù)網(wǎng)關(guān)70將其它電話或視頻會(huì)議裝置連接到視頻電話15系統(tǒng)10。
網(wǎng)關(guān)70可由接口辨別;一側(cè)是網(wǎng)絡(luò)40,對于視頻電話15來說,這是以太網(wǎng)或ATM。外側(cè)可以是模擬電話線或RS-232端口。端口的類型、數(shù)目和特征將網(wǎng)關(guān)70彼此區(qū)分。在網(wǎng)絡(luò)40側(cè),存在傳送協(xié)議(例如RTP或AAL2)和信令協(xié)議(例如SIP、Megaco或MGCP)。
在外側(cè),可存在各種各樣的協(xié)議,這取決于所提供的接口。某些實(shí)例將是ISDN(Q.931)或POTS信令。PSRN網(wǎng)關(guān)70將PSTN線路連接到現(xiàn)場的視頻電話15系統(tǒng)10中。PBX網(wǎng)關(guān)70允許視頻電話15系統(tǒng)10模仿專有電話來向現(xiàn)場的現(xiàn)有PBX提供兼容性。POTS網(wǎng)關(guān)70將無音模擬電話連接到視頻電話15系統(tǒng)10。H.323網(wǎng)關(guān)70將H.323系統(tǒng)10連接到基于SIP的視頻電話15系統(tǒng)10。這是僅信令網(wǎng)關(guān)70——媒體服務(wù)器66進(jìn)行H.261到MPEG的轉(zhuǎn)換。
三種用于實(shí)現(xiàn)視頻電話15的技術(shù)是會(huì)話起始協(xié)議(SIP)、會(huì)話描述協(xié)議(SDP)和實(shí)時(shí)傳送協(xié)議(RTP),所有這些協(xié)議以引用方式并入本文中。
SIP是用于起始、管理和終止經(jīng)由包網(wǎng)絡(luò)的語音和視頻會(huì)話的信令協(xié)議。
SDP是用于出于會(huì)話通知、會(huì)話邀請和其它形式的多媒體會(huì)話起始目的來描述多媒體會(huì)話。SIP使用SDP來描述媒體會(huì)話。
RTP提供適用于經(jīng)由多播或單播網(wǎng)絡(luò)40服務(wù)而傳輸實(shí)時(shí)數(shù)據(jù)(例如音頻、視頻或模擬數(shù)據(jù))的應(yīng)用的端到端網(wǎng)絡(luò)40傳送功能。SIP使用RTP來進(jìn)行媒體會(huì)話傳送。
視頻電話15可執(zhí)行具有三方或三方以上的會(huì)議,而不使用任何會(huì)議橋或MCU。這通過使用由SIP建立的ATM點(diǎn)對多點(diǎn)流來完成。更明確地說,當(dāng)MPEG-2流和低幀速率流經(jīng)分包以傳輸?shù)骄W(wǎng)絡(luò)40上,每個(gè)包的標(biāo)頭信息識別會(huì)議的所有接收視頻電話15的地址,正如此項(xiàng)技術(shù)中眾所周知。根據(jù)此信息,當(dāng)將包傳輸?shù)骄W(wǎng)絡(luò)40時(shí),SIP為不同包建立必要連接性以到達(dá)它們所要達(dá)到的視頻電話15目的地。
作為不使用任何會(huì)議橋的會(huì)議的實(shí)例,假設(shè)在考慮周到的位置處存在10個(gè)視頻電話15(其是會(huì)議的參與方)。每個(gè)視頻電話15產(chǎn)生基于音頻的流、基于MPEG-2的流和基于低幀速率的流。然而,每個(gè)視頻電話15將不把這些流中的任一者發(fā)送回到其本身,因此實(shí)際上,在視頻電話15的10方會(huì)議中,每一者與其它九個(gè)視頻電話15進(jìn)行通信。情況可能是視頻電話15與其本身進(jìn)行通信來最大化帶寬利用,但由任何視頻電話15產(chǎn)生的視頻且(如果需要的話)由視頻電話15產(chǎn)生的音頻可如同其實(shí)質(zhì)上呈現(xiàn)于其它視頻電話15一般被展示或聽到(但通過內(nèi)部通道),其將在下文中描述,因而不需要利用網(wǎng)絡(luò)40的任何帶寬。
在會(huì)議中,每個(gè)視頻電話15接收九個(gè)基于音頻的數(shù)據(jù)流、三個(gè)基于MPEG-2的數(shù)據(jù)流和六個(gè)基于低幀速率的數(shù)據(jù)流。如果需要的話,接收器可選擇基于低幀速率的流中高達(dá)九個(gè)流,所以顯示器54僅展示每個(gè)視頻電話15的較小圖像,或選擇所述基于MPEG-2的流中的高達(dá)四個(gè)流,其中顯示器54由來自所述會(huì)議的四個(gè)視頻電話15的四個(gè)圖像來填滿,而不展示基于低幀速率的流的圖像,這是由于如果顯示四個(gè)基于MPEG-2的流,那么在顯示器54上就沒有用于基于低幀速率的流的空間。通過展示三個(gè)基于MPEG-2的流,這允許展示六個(gè)基于低幀速率的流。如上文解釋的那樣形成所述流中的每一者,且在各個(gè)視頻電話15處如上文解釋的那樣接收所述流中的每一者。
如果需要顯示會(huì)議的四個(gè)以上大圖像,那么用以完成此的方式是將額外視頻電話15連接在一起,使得并排排列不同視頻電話15的顯示器,如圖7中展示。一個(gè)視頻電話15可為主裝置,且當(dāng)添加每個(gè)額外視頻電話時(shí),其將成為所述主視頻電話15的從屬裝置,所述主視頻電話15控制所述不同視頻電話15上的大圖像和小圖像的顯示54。
在用以確定在會(huì)議的視頻電話15的顯示器上將誰展示為大圖像和將誰展示為小圖像的協(xié)議的方面,一個(gè)優(yōu)選協(xié)議是將三個(gè)最近期講話者顯示為大圖像,且將其它參與方顯示為小圖像。也就是說,將當(dāng)前講話的參與方和兩個(gè)先前講話者展示為大圖像。由于會(huì)議的每個(gè)視頻電話15接收會(huì)議的所有基于音頻的流,因而具有其主控制器50的每個(gè)視頻電話15可確定在給定時(shí)刻在何處發(fā)生講話,并致使網(wǎng)絡(luò)接口卡56接受與發(fā)生講話的視頻電話15相關(guān)聯(lián)的MPEG-2流,而不接受相關(guān)聯(lián)的低幀速率流。在另一協(xié)議中,將一個(gè)視頻電話15建立為領(lǐng)導(dǎo)或主持者視頻電話15,且所述領(lǐng)導(dǎo)視頻電話15選擇每個(gè)其它視頻電話15看到的是大圖像還是小圖像。在又一協(xié)議中,關(guān)于誰是大且誰是小的圖像選擇是固定的,且在整個(gè)會(huì)議中始終保持相同。所述協(xié)議可以是每個(gè)視頻電話15可挑選它們想如何展示它們接收到的圖像。將基于MPEG-2的流和低幀速率流都傳輸?shù)骄W(wǎng)絡(luò)40上,以傳輸?shù)綍?huì)議的接收視頻電話。因此,兩種基于視頻的流均可供每個(gè)接收視頻電話15使用,以依據(jù)所選擇的顯示器54協(xié)議來展示。
就由每個(gè)視頻電話15傳輸?shù)幕谝纛l的流來說,為了進(jìn)一步有效使用帶寬且通過減少對于任何發(fā)射視頻電話15或接收視頻電話15的處理需要來輔助音頻處理,僅當(dāng)有高于發(fā)射視頻電話15處的預(yù)定分貝閾值的音頻時(shí),視頻電話15才可傳輸基于音頻的流。通過僅傳輸具有足夠響的聲音的基于音頻的流,同時(shí)假定將把閾值校準(zhǔn)為在發(fā)生講話時(shí)得以滿足或超過,這不僅消除了傳送和接收外部背景噪聲的必要(所述噪聲基本上不起任何作用,但使用帶寬),而且有助于選擇與講話相關(guān)聯(lián)的MPEG-2流,因?yàn)閮H接收具有講話的音頻流。
如上文提及,如果給定視頻電話15需要看到其自身的圖像(其正被發(fā)送到其它視頻電話15),那么由FPGA 38形成的低幀速率流在沒有任何壓縮的情況下被發(fā)送到所述視頻電話15中的本地存儲器,如同將被分包并從視頻電話15發(fā)送到網(wǎng)絡(luò)40的低幀速率流的情況。從此本地存儲器開始,具有軟件的主處理器將對其進(jìn)行操作,且將其在顯示器54上展示為小圖像。
此外,視頻電話15提供對將聽到或看到從網(wǎng)絡(luò)40接收到的哪些音頻或視頻流的控制。在會(huì)議中除視頻電話15的用戶外還有其他參與方希望看見或聽到的情況下,視頻電話15的用戶可選擇只看見或只聽見構(gòu)成整個(gè)會(huì)議的視頻流或音頻流的一子組。舉例來說,在100方會(huì)議中,對于可被展示的可能的100張圖片中的總共23張圖片,用戶選擇將所述視頻流中的三者在屏幕上作為大圖片觀看,且將所述視頻流中的20者在屏幕上作為小圖像觀看。視頻電話15的用戶選擇將三個(gè)最大聲的講話者呈現(xiàn)為大圖片,且接著通過觸摸屏74選擇會(huì)議中的參與方(其列出在觸摸屏的頁面上),將其也顯示為小圖片??蛇x擇其它協(xié)議,例如展示為小圖片的20個(gè)圖片可以是從會(huì)議開始且每一方進(jìn)行介紹起所述會(huì)議中的最近20個(gè)講話者。通過控制所展示的視頻流的數(shù)目,可賦予會(huì)議組織性,且視頻電話15的資源利用得到更好的分配。
就展示在屏幕上的不同圖片而言,選擇可與每個(gè)圖片相關(guān)聯(lián)。舉例來說,一個(gè)圖片可由電話會(huì)議的主持者來選擇,所述圖片中的兩者可基于在會(huì)議當(dāng)前時(shí)間的最近/最響講話者,且其它圖片可與用戶從會(huì)議的所有其他參與者中選出的個(gè)人相關(guān)聯(lián)。以此方式,會(huì)議的每個(gè)參與者或用戶可能看到自會(huì)議中的全部參與者選出的不同圖片選擇。那么需要的最大帶寬是用于將一個(gè)視頻流發(fā)送到網(wǎng)絡(luò)和從網(wǎng)絡(luò)接收四個(gè)視頻流的帶寬,而不管會(huì)議的參與者數(shù)目。
就音頻流來說,可對視頻電話15設(shè)定限制,使得僅將與三個(gè)最大聲講話者相關(guān)聯(lián)的音頻流選擇為被聽到,且同時(shí)將其各自圖片展示在屏幕上。DSP 62可分析接收到的音頻流,并僅允許播放與所述最大聲講話者相關(guān)聯(lián)的三個(gè)音頻流,且同時(shí),指導(dǎo)網(wǎng)絡(luò)接口42僅接收與具有最大聲講話者的三個(gè)音頻流相關(guān)聯(lián)的具有大圖片的第一視頻流。一般來說,同時(shí)講話的人越多,就會(huì)發(fā)生越多混亂和越少理解。因此,用戶對音頻流實(shí)行控制,以給予其一定程度的組織性。
作為關(guān)于音頻流的控制的一部分,如上文提及,每個(gè)視頻電話15將僅在視頻電話15周圍的噪聲高于閾值的情況下發(fā)送音頻流。優(yōu)選地,閾值是動(dòng)態(tài)的,且基于在給定時(shí)間處與三個(gè)最大聲講話者相關(guān)聯(lián)的三個(gè)最大聲音頻流的噪聲水平。因?yàn)闉榱双@得將被考慮為具有三個(gè)最大聲講話者的音頻流中的一者的音頻流,故接著必須在噪聲水平方面監(jiān)視和識別其它音頻流的噪聲水平。DSP 62在通過網(wǎng)絡(luò)40從網(wǎng)絡(luò)接口42接收音頻流時(shí)檢查音頻流并識別具有最大噪聲的三個(gè)流,且還將所述被識別為具有三個(gè)最大聲講話者的三個(gè)接收音頻流的噪聲水平與視頻電話15周圍的場景的噪聲水平進(jìn)行比較。如果來自視頻電話15周圍的場景的噪聲水平高于接收到的任何一個(gè)音頻流,那么視頻電話15將其音頻流發(fā)送到網(wǎng)絡(luò)40。由DSP 62進(jìn)行的此類型的獨(dú)立分析發(fā)生在會(huì)議中的每個(gè)視頻電話處,且因此是整個(gè)會(huì)議中的分布式分析。每個(gè)視頻電話獨(dú)立于所有其它視頻電話就其接收到的音頻流作出其自己的分析,所述音頻流根據(jù)定義僅在各自視頻電話15已確定其場景周圍的噪聲足夠響來證明在給定時(shí)間其是三個(gè)最大聲之一之后才由各自視頻電話15發(fā)送出去。每個(gè)視頻電話15接著獲取此接收到的音頻流信息,并將其用作比較其自身噪聲水平的基礎(chǔ)。每個(gè)視頻電話15因此自己確定閾值。
執(zhí)行此分布式分析的替代方式是每個(gè)視頻電話在使用其DSP 62確定其認(rèn)為閾值應(yīng)為多少之后可將此閾值發(fā)送到會(huì)議的所有其它視頻電話,所以所有視頻電話均可檢查所有其它視頻電話認(rèn)為閾值是多少,且可(例如)對所述閾值求平均值以識別其將應(yīng)用于其場景的閾值。
通過使用選擇三個(gè)最大聲講話者的視頻流的技術(shù),可存在各方均立即開始大聲講話并產(chǎn)生混亂和難以理解的時(shí)刻,但通過這樣做,其提高了噪聲的閾值水平,從而立即導(dǎo)致消除不與其它流產(chǎn)生一樣多的噪聲的音頻流,以使得將再次僅選擇和聽到所述三個(gè)最大聲講話者的音頻流而不選擇其它,且因此移除其它音頻流可能提供的某些噪聲。這暗示著可存在由視頻電話15接收到三個(gè)以上音頻流的機(jī)會(huì),因?yàn)槿齻€(gè)以上視頻電話可在給定時(shí)刻具有高于閾值的噪聲水平,從而允許此類視頻電話中的每一者在那時(shí)產(chǎn)生音頻流且將其發(fā)送到網(wǎng)絡(luò)40。然而,如剛才解釋,一旦閾值發(fā)生改變,所述情況將停止。此關(guān)于音頻流的分布式分析不限于本文描述的視頻電話15,而是還可應(yīng)用于任何類型的音頻會(huì)議,無論是否也存在視頻流。
與強(qiáng)調(diào)節(jié)約帶寬使用相一致,且為了節(jié)約帶寬而僅發(fā)送所必須的內(nèi)容,裁剪圖像發(fā)生在編碼器36處而并非接收視頻電話15處。在發(fā)射視頻電話15知道其圖像將如何呈現(xiàn)在接收視頻電話15處的情況下,編碼器36在傳輸場景的大圖像之前對其進(jìn)行裁剪,所以少得多的圖像要被傳輸且利用到帶寬。如果將在接收器視頻電話15處發(fā)生剪裁,那么在將接收到的圖像提供到顯示器控制器52之前,具有軟件的主處理器將對接收到的圖像進(jìn)行操作。
第二相機(jī)可連接到視頻電話15以提供所述場景的替代性視圖。舉例來說,在房間內(nèi),可將第一相機(jī)或主要相機(jī)設(shè)置為聚焦在觀看者或講話者的臉部。然而,可在房間內(nèi)存在額外個(gè)體,所述額外個(gè)體是在房間內(nèi)控制視頻電話15的個(gè)人希望展示給在接收視頻電話15處的其他觀看者的個(gè)體。舉例來說,可將第二相機(jī)設(shè)置在所述房間的上角落中,使得所述第二相機(jī)可基本上比主要相機(jī)觀看到所述房間的大得多的部分。可將第二相機(jī)的饋入信號提供到解碼器34。解碼器34具有若干端口來接收視頻饋入。或者,如果來自第二相機(jī)的流已經(jīng)被數(shù)字化,可通過與主要相機(jī)類似的通道將其提供到視頻電話15的處理元件。優(yōu)選地,每個(gè)視頻電話15控制從其發(fā)送出去的任何內(nèi)容,所以對將傳輸哪個(gè)相機(jī)饋入的選擇由控制視頻電話15的觀看者決定?;蛘撸赡芟蜻h(yuǎn)程接收視頻電話15提供控制和選擇在給定視頻電話15處來自哪個(gè)相機(jī)的哪個(gè)流將被傳輸?shù)哪芰?。來自控制視頻電話15的控制信號將經(jīng)由網(wǎng)絡(luò)40傳輸,且由個(gè)別視頻電話15接收,所述個(gè)別視頻電話15接著將提供所選擇的流以供傳輸。除了第二相機(jī)外,還可通過視頻電話15提供任何其它類型的視頻饋入,例如來自DVD、VCR或白板相機(jī)的視頻饋入。
在優(yōu)選實(shí)施例中,視頻電話15以窺視模式進(jìn)行操作。在所述窺視模式中,視頻電話15相機(jī)拍取在其之前的場景的靜止圖像,且將此圖像傳輸?shù)狡渌曨l電話15,所述其它視頻電話15已先前被識別來接收所述圖像,例如在其快速撥號菜單上的那些視頻電話15?;蛘撸谒龈Q視模式中,將所拍取的靜止圖像維持在視頻電話15處,且在請求時(shí)將其提供到希望呼叫所述視頻電話15的任一者。理想地,如與視頻電話15的優(yōu)選使用一致,每個(gè)視頻電話15用戶控制從視頻電話15發(fā)送出去的任何內(nèi)容,且可簡單地選擇關(guān)閉所述窺視模式,或控制發(fā)送出什么圖像。當(dāng)發(fā)生有效呼叫時(shí),關(guān)閉窺視模式,所以在窺視模式與相機(jī)拍取連續(xù)圖像流的有效呼叫之間并不存在任何沖突。窺視模式可使得以預(yù)定時(shí)間間隔拍取場景的靜止圖像,例如以一分鐘增量、五分鐘增量、30分鐘增量等。在窺視模式中,在拍取靜止圖像之前的預(yù)定時(shí)間(例如拍取圖像之前的五或十秒)處,可提供可聽隊(duì)列來警告相機(jī)前面的任一者將要拍取圖片且其應(yīng)表現(xiàn)得體??陕犼?duì)列可以是嘟聲、咻聲或其它記錄的噪聲或消息。以此方式,當(dāng)使用窺視模式時(shí),使得其它視頻電話15可得到對視頻電話15的相機(jī)之前的場景的窺視圖像,且向其它視頻電話15提供關(guān)于相機(jī)的人物存在的指示。
作為存在傳感器的另一實(shí)例,在相機(jī)可充當(dāng)存在傳感器之前,相對于相機(jī)前的視場而定位相機(jī)的自動(dòng)鏡頭。當(dāng)在相機(jī)前面沒有任何人時(shí),那么相機(jī)的自動(dòng)鏡頭將聚焦在位于其視場中的物體或墻壁上。當(dāng)有人位于相機(jī)前面時(shí),自動(dòng)鏡頭將聚焦在所述人上,這將導(dǎo)致鏡頭位于與人不在鏡頭前面時(shí)不同的位置中。來自相機(jī)的指示鏡頭焦點(diǎn)的信號可從相機(jī)發(fā)送到FPGA 38,所述FPGA 38接著導(dǎo)致將焦點(diǎn)信息發(fā)送到預(yù)定列表的視頻電話15接收器(例如在發(fā)射視頻電話15的快速撥號列表上的那些),以告知接收視頻電話15觀看者是否在視頻電話15前面以指示某人存在。
視頻電話15還提供視頻郵件。在所述情況下,試圖從一個(gè)視頻電話15向另一視頻電話15進(jìn)行視頻呼叫,且接收視頻電話15在預(yù)定時(shí)間(例如4次響鈴)之后不應(yīng)答所述視頻呼叫,那么與接收視頻電話15相關(guān)聯(lián)的視頻服務(wù)器66將對所述視頻呼叫作出回應(yīng)。視頻服務(wù)器66將應(yīng)答來自發(fā)射視頻電話15的視頻呼叫,且向發(fā)射視頻電話15發(fā)送已記錄的音頻消息或來自未應(yīng)答的接收視頻電話15的具有已記錄視頻圖像的音頻消息,所述音頻消息先前已被記錄。視頻服務(wù)器66將播放所述消息,并向呼叫者提供音頻或音頻及視頻隊(duì)列,以在預(yù)定指示(例如嘟聲)之后留下它們的消息。當(dāng)預(yù)定指示發(fā)生時(shí),呼叫者接著將留下消息,所述消息將包括音頻陳述以及呼叫者的視頻圖像。所述視頻和音頻消息將存儲在視頻服務(wù)器66處的存儲器中。所述消息可如需要的那么長,或限制到消息被定義為的預(yù)定時(shí)間段。在所述預(yù)定時(shí)間段已過去或呼叫者已完成并終止呼叫之后,視頻服務(wù)器66保存所述視頻消息,且向未應(yīng)答最初呼叫的接收視頻電話15發(fā)送信號,所述信號指示存在等待接收視頻電話15的觀看者關(guān)注的視頻消息。此消息可以是呈現(xiàn)在接收視頻電話15的顯示器54上的文本或視頻圖像,或僅僅是經(jīng)激活以警告接收視頻電話15的觀看者他有視頻郵件的消息燈。
當(dāng)觀看者希望觀看視頻郵件時(shí),觀看者可僅僅在觸摸屏74上選擇用來激活視頻郵件的區(qū)域。向用戶展現(xiàn)一系列郵件處理選項(xiàng),包括閱讀視頻郵件,其向視頻服務(wù)器66發(fā)送信號以在視頻電話15顯示器54上為觀看者播放所述視頻郵件。從視頻服務(wù)器66發(fā)送的圖像流遵循上文針對基于視頻的流所解釋的路徑而到達(dá)并通過接收視頻電話15以被顯示。為了使視頻電話15觀看者在觀看者不應(yīng)答視頻呼叫時(shí)將消息記錄在視頻服務(wù)器66上來回應(yīng)視頻呼叫,觀看者觸摸觸摸屏74上的區(qū)域,其激活視頻服務(wù)器66以在預(yù)定時(shí)間提醒觀看者記錄音頻或音頻及視頻的消息,觀看者接著將這樣做來創(chuàng)建消息。
視頻電話15提供了以預(yù)定水平操作揚(yáng)聲器64,而用戶不必進(jìn)行任何音量控制。視頻電話15的揚(yáng)聲器64可用麥克風(fēng)來校準(zhǔn),使得如果麥克風(fēng)拾取太響的噪聲,那么主控制器50和DSP 62會(huì)降低揚(yáng)聲器64的音頻輸出水平來減少噪聲水平。通過設(shè)置預(yù)定和所需水平,視頻電話15自動(dòng)控制音量的大小而觀看者不必做任何事。
視頻電話15可經(jīng)編程以辨認(rèn)對特定個(gè)人說話的查詢,且接著在接收視頻電話15處將用于辨認(rèn)的預(yù)定語言型式用作為音調(diào)或信號來通知在接收視頻電話15處的觀看者正在向所述接收視頻電話15請求呼叫。舉例來說,短語“Hey Craig”可用于視頻電話15來辨認(rèn)將用發(fā)射視頻電話15向Craig發(fā)起呼叫。觀看者通過說“Hey Craig”而導(dǎo)致發(fā)射視頻電話自動(dòng)向Craig發(fā)起呼叫,其接著將短語“Hey Craig”發(fā)送到Craig的接收視頻電話15。Craig的接收視頻電話15不再響鈴來指示正向Craig請求呼叫,而是在Craig的視頻電話15處間歇地通知短語“Hey Craig”來代替一般將發(fā)生以引起Craig注意的響鈴。用以執(zhí)行此操作的功能性將由主控制器50和DSP 62執(zhí)行。句子“Hey Craig”將由觀看者通知且傳輸(如上文解釋)到服務(wù)器66。服務(wù)器66在分析所述句子時(shí)將把所述短語辨認(rèn)為一種命令,其用以向所述命令的指定方發(fā)起呼叫。服務(wù)器66將接著利用Craig的視頻電話15的地址信息來發(fā)起向Craig的視頻電話15的呼叫,且導(dǎo)致在Craig的視頻電話15處產(chǎn)生的信號或音調(diào)為“Hey Craig”。
如此項(xiàng)技術(shù)中眾所周知,編碼器36能夠識別每個(gè)幀的開始和結(jié)束。當(dāng)編碼器36接收到數(shù)據(jù)時(shí),其編碼用于幀的數(shù)據(jù)且將所述數(shù)據(jù)進(jìn)行存儲直到所述幀完成為止。由于編碼器36所利用的算法的緣故,所存儲的幀被用作形成下一幀的基礎(chǔ)。所存儲的幀用作下一待編碼的幀的參考幀。本質(zhì)上這是因?yàn)閺囊粋€(gè)幀到下一個(gè)幀的幀變化是編碼的焦點(diǎn),而并非從開始處的整個(gè)幀。接著直接發(fā)送經(jīng)編碼的幀來進(jìn)行分包(如上文解釋),而沒有任何緩沖(除了用于分包目的之外),以便最小化任何延遲?;蛘撸?dāng)編碼器36編碼用于幀的數(shù)據(jù)時(shí),為了甚至進(jìn)一步加快數(shù)據(jù)傳輸,經(jīng)編碼的數(shù)據(jù)被命令繼續(xù)前進(jìn)以用于分包目的,而不等待整個(gè)幀被編碼。出于形成幀的目的也存儲被編碼的數(shù)據(jù)(原因在上文中解釋),使得參考幀可由編碼器36使用。然而,獨(dú)立地,所述數(shù)據(jù)在編碼后被繼續(xù)發(fā)送以用于分包目的,且數(shù)據(jù)在被準(zhǔn)備用于分包時(shí)形成為幀,雖然如果所述包準(zhǔn)備進(jìn)行傳輸且也那么發(fā)生了,那么只有所述幀的一部分被制成包的一部分,所述幀的剩余部分將與獨(dú)立包一起傳輸,且直到在接收視頻電話15處接收到具有幀信息的兩個(gè)包時(shí)才可形成幀。
參看圖1,視頻電話15連接到網(wǎng)絡(luò)40。視頻電話15支持基于銅線或多模式光纖的10/100以太網(wǎng)連接和(視情況)ATM 155Mbps連接。每個(gè)視頻電話15終端通常與用戶PC 68相關(guān)聯(lián)。視頻電話15的角色在于提供電話(會(huì)議)的音頻和視頻方面。PC 68用于任何其它功能。經(jīng)由視頻電話15建立呼叫可在相關(guān)聯(lián)的PC 68之間自動(dòng)建立MicrosoftNetmeeting(微軟網(wǎng)絡(luò)會(huì)議)會(huì)話,使得用戶可在基于Windows的程序(例如Power Point展示或電子數(shù)據(jù)表)中協(xié)作,在電子白板上交換圖形,傳送文件或使用基于文本的聊天程序等。PC 68可連接到以太網(wǎng),而不管視頻電話15終端是如何連接的。其當(dāng)然還可連接到ATM LAN。PC 68和相關(guān)聯(lián)的發(fā)射視頻電話15通過網(wǎng)絡(luò)40彼此進(jìn)行通信。PC 68和相關(guān)聯(lián)的發(fā)射視頻電話15彼此進(jìn)行通信,所以PC 68知道發(fā)射視頻電話15正向誰講話。PC 68可接著與發(fā)射視頻電話15正對其講話的接收視頻電話15的PC 68進(jìn)行通信。PC 68還可向視頻電話15發(fā)出呼叫。
大多數(shù)系統(tǒng)10功能性是基于服務(wù)器的,且是運(yùn)行在視頻電話15代理服務(wù)器上的軟件,所述代理服務(wù)器優(yōu)選為SIP代理服務(wù)器。需要一個(gè)服務(wù)器66來傳遞基礎(chǔ)功能性,需要第二個(gè)服務(wù)器來用于彈性操作,即在一個(gè)服務(wù)器66失效的情況下維持服務(wù)。在此情況下,服務(wù)器和視頻電話15終端中的軟件將自動(dòng)切換到備份服務(wù)器66。通過此配置,視頻電話15終端可向網(wǎng)絡(luò)40上的任何其它視頻電話15終端或在網(wǎng)絡(luò)上注冊的任何電話(優(yōu)選地,SIP電話)發(fā)出呼叫或接收來自其的的呼叫。
媒體服務(wù)器在一組媒體流上向用戶提供一組服務(wù)。媒體服務(wù)器66由特征服務(wù)器66(優(yōu)選地,特征服務(wù)器66)控制。其經(jīng)采用以提供媒體流的來源和接收器,作為各種用戶可調(diào)用功能的一部分。媒體服務(wù)器66上提供的服務(wù)為會(huì)議橋接記錄和播放代碼轉(zhuǎn)換音調(diào)和通知媒體服務(wù)器66是設(shè)置在LAN或WAN上的盒子。一般來說,沒有其它連接連接到其。其優(yōu)選地為SIP裝置。特征服務(wù)器在源自視頻電話15終端的信令路徑中。然而,媒體路徑將從媒體服務(wù)器66直接去往裝置。
在操作中,用戶可請求一功能(例如視頻郵件)。特征服務(wù)器66將提供用戶界面和信令功能,媒體服務(wù)器66將提供用于多媒體提示(如果使用的話)和消息記錄及播放的機(jī)制。
為了使得視頻電話15終端能夠發(fā)出向任何非協(xié)議或標(biāo)準(zhǔn)(例如SIP)(視頻)電話的呼叫或接受來自任何非協(xié)議或標(biāo)準(zhǔn)(例如SIP)(視頻)電話的呼叫,添加網(wǎng)關(guān)70(例如SIP網(wǎng)關(guān))??蓪⑺哪M線網(wǎng)關(guān)70直接連接到PSTN或連接到本地PBX的模擬線。用于供應(yīng)引出線的標(biāo)準(zhǔn)規(guī)則適用。通常,向每六個(gè)用戶供應(yīng)一個(gè)干線,即假定任何一個(gè)用戶使用其電話來在任一小時(shí)中的10分鐘中撥打外部連接。如果視頻電話15終端將充當(dāng)當(dāng)前PBX上的擴(kuò)展(當(dāng)關(guān)注傳入呼叫時(shí)),那么每個(gè)視頻電話15需要一個(gè)模擬線。
TV來源(例如CNN)可供視頻電話15用戶使用。視頻電話15視頻服務(wù)器66實(shí)現(xiàn)此服務(wù)。服務(wù)器66支持接著可由網(wǎng)絡(luò)40上的任何視頻電話15用戶訪問的單個(gè)視頻通道的連接。視頻通道是兩個(gè)正常會(huì)議會(huì)話的等效物。調(diào)諧器可設(shè)置可用的通道。應(yīng)針對客戶希望同時(shí)可用的每個(gè)不同通道而向所述配置添加新的視頻電話15視頻服務(wù)器66。
視頻電話15服務(wù)器66(優(yōu)選地,SIP)還含有用于用戶數(shù)據(jù)的數(shù)據(jù)庫,包括用戶聯(lián)系人信息的本地超高速緩存。此數(shù)據(jù)庫可與用戶主聯(lián)系人數(shù)據(jù)庫同步。舉例來說,可與Outlook/Exchange用戶同步,并用于Lotus Notes用戶。將在任何基于NT的服務(wù)器66平臺上運(yùn)行的獨(dú)立程序進(jìn)行同步。不管所服務(wù)的場所的數(shù)目,僅需要一個(gè)服務(wù)器66。
如圖2所示,通常多個(gè)視頻電話15終端將分布在若干場所上,由廣域網(wǎng)40連接。一個(gè)服務(wù)器66足以向單個(gè)校園中高達(dá)100+視頻電話15提供服務(wù)。隨著場所中視頻電話15的總數(shù)目增加,到一定階段時(shí)將需要安裝更多的服務(wù)器。
在視頻電話15分布在若干場所中的情況下,它們可能基于中心服務(wù)器進(jìn)行操作,但因?yàn)樗褂玫腤AN帶寬和對WAN的依賴性的緣故,這并不是推薦配置。優(yōu)選地,每個(gè)場所具有至少一個(gè)服務(wù)器66,當(dāng)使用SIP時(shí),所述服務(wù)器66優(yōu)選地為SIP服務(wù)器66。出于更謹(jǐn)慎起見,最簡單且最容易的配置是如果每個(gè)場所具有兩套服務(wù)器,那么優(yōu)選地每一者是SIP服務(wù)器。然而,使用中心服務(wù)器66作為遠(yuǎn)程場所服務(wù)器的替代物也將能起作用。
網(wǎng)絡(luò)40中任何地方的視頻電話15可從單個(gè)中心網(wǎng)關(guān)70進(jìn)行基于PSTN或PBX的傳出呼叫。然而,如果需要視頻電話15也是本地PBX上的擴(kuò)展以接受傳入呼叫,那么需要在每個(gè)位置處提供PSTN網(wǎng)關(guān)70。網(wǎng)關(guān)70上需要有用于所述場所上的每個(gè)視頻電話15的端口。
中心CNN服務(wù)器66可將TV通道分布到網(wǎng)絡(luò)40上的任何視頻電話50。盡管如此,可能優(yōu)選地包括場所特定服務(wù)器,而非占用WAN上的所述帶寬。
視頻電話15可用于以155兆位/秒連接到10/100以太網(wǎng)網(wǎng)絡(luò)40或ATM網(wǎng)絡(luò)40(使用光纖和銅線)。ATM連接的視頻電話15使用IP控制面板來建立用于呼叫的端點(diǎn)的ATM地址,且接著使用ATM信令來建立那些端點(diǎn)之間的載體通道。所述載體通道被建立成交換虛擬電路(SVC),其中規(guī)定了全部QoS要求。
每個(gè)視頻流在2Mbps與6Mbps雙工之間,其由設(shè)置和帶寬協(xié)商決定。由于顯示構(gòu)件可展示超過單個(gè)的視頻流,因而至每個(gè)視頻電話的所需總連接帶寬隨著電話會(huì)議中的參與方數(shù)目增加而增加。發(fā)射端裁剪確保了最大所需帶寬大約為使用中單個(gè)視頻流帶寬的2.5倍。如果場所中存在若干視頻電話15,那么用戶與干線之間的正常電話比率將適用于視頻電話15會(huì)話。換句話說,預(yù)期視頻電話15用戶在每個(gè)呼叫中平均向兩個(gè)其他人講話(即,兩個(gè)流),且在每小時(shí)內(nèi)將平均使用視頻電話15達(dá)10分鐘。對于3Mbps的平均編碼速率,這給出6Mbps的WAN帶寬需要,可預(yù)期所述帶寬能支持高達(dá)6個(gè)用戶。
如圖3所示,當(dāng)存在低密度的視頻電話15終端時(shí),視頻電話15在”p”啟用的以太網(wǎng)網(wǎng)絡(luò)40上進(jìn)行操作。視頻電話15系統(tǒng)10將在把兩個(gè)視頻電話15鏈接在一起的網(wǎng)絡(luò)40的ATM部分上建立SVC,且使用所述”p”啟用的以太網(wǎng)來確保經(jīng)由所述連接的以太網(wǎng)部分傳遞足夠的服務(wù)質(zhì)量。
在圖4中展示視頻電話15系統(tǒng)10的基本元件。它們一起建立大大增強(qiáng)地理上分散的團(tuán)體的交流能力的多媒體協(xié)作工具。此類團(tuán)體在幾乎每個(gè)大型企業(yè)中越來越常見,但用于幫助它們有效且高效工作的工具十年來沒有發(fā)生多少改變且在很多方面令人不滿意。視頻電話15全面地解決了現(xiàn)存系統(tǒng)的許多問題,從而在遠(yuǎn)程協(xié)作領(lǐng)域產(chǎn)生了飛躍式的改進(jìn)。這通過最新可用的技術(shù)實(shí)現(xiàn),以服務(wù)質(zhì)量和功能的正確混合為顯著區(qū)別,極好的用戶接口的開發(fā)使其便于使用,且通過使用基于標(biāo)準(zhǔn)的結(jié)構(gòu)將其設(shè)計(jì)為可擴(kuò)展的。
通過使用(例如)眾所周知的SIP技術(shù)在網(wǎng)絡(luò)上將音頻和視頻流(如上文解釋)從起始視頻電話15傳輸?shù)浇K止視頻電話15??赏ㄟ^使用IP路由技術(shù)將SIP消息路由經(jīng)過異質(zhì)網(wǎng)絡(luò)。需要異質(zhì)網(wǎng)絡(luò)中的媒體流具有更直接的路徑。優(yōu)選地,在會(huì)議的起始視頻電話15連接到以太網(wǎng)且會(huì)議的終止視頻電話15連接到ATM網(wǎng)絡(luò)的情況下(如圖15所示),會(huì)發(fā)生以下對跨越起始與終止視頻電話之間的網(wǎng)絡(luò)的包的尋址。起始視頻電話15將包發(fā)送到以太網(wǎng)上,對于以太網(wǎng),所述包是與所述起始視頻電話的IP地址的通信。包到達(dá)起始網(wǎng)關(guān)80,所述起始網(wǎng)關(guān)80將以太網(wǎng)與ATM網(wǎng)絡(luò)進(jìn)行鏈接。在起始網(wǎng)關(guān)80處,從所述包處保存起始視頻電話15的IP地址,且起始網(wǎng)關(guān)80向包添加起始網(wǎng)關(guān)80的ATM地址,并將所述包繼續(xù)發(fā)送到終止視頻電話15。當(dāng)終止視頻電話15接收到包時(shí),其存儲來自所述包的起始網(wǎng)關(guān)80的ATM地址,并向起始網(wǎng)關(guān)80發(fā)回一個(gè)返回包連同終止視頻電話15的ATM地址,所述返回包指示其已接收到所述包。起始網(wǎng)關(guān)80在接收到返回包時(shí)保存終止視頻電話15的ATM地址并將起始網(wǎng)關(guān)80的IP地址添加到返回包。接著將返回包從起始網(wǎng)關(guān)80發(fā)送回到起始視頻電話15。
以此方式,起始視頻電話15與終止視頻電話15之間(且包括所述視頻電話)的整個(gè)路徑的每個(gè)關(guān)鍵節(jié)點(diǎn)的特定地址是所述路徑的每個(gè)關(guān)鍵節(jié)點(diǎn)已知的。在最小程度上,路徑上的每個(gè)節(jié)點(diǎn)知道路徑的下一節(jié)點(diǎn)的地址,且如果需要的話,可在包沿著路徑移動(dòng)時(shí)將額外地址與各別包保持在一起,所以路徑的每個(gè)節(jié)點(diǎn)可在關(guān)鍵節(jié)點(diǎn)的地址方面知道更多信息而不僅是知道所述包將去往的下一節(jié)點(diǎn)。這是因?yàn)楫?dāng)包從節(jié)點(diǎn)向節(jié)點(diǎn)移動(dòng)時(shí),且明確地說,在所述實(shí)例中,從起始視頻電話15到起始網(wǎng)關(guān)80到終止視頻電話15且接著回到起始網(wǎng)關(guān)80且接著到起始視頻電話15時(shí),每個(gè)節(jié)點(diǎn)保存從其接收各自包的先前節(jié)點(diǎn)的關(guān)鍵地址,并相對于下一節(jié)點(diǎn)作為其一部分的網(wǎng)絡(luò)類型來介紹其自身地址。因而,每個(gè)節(jié)點(diǎn)將包發(fā)送到下一節(jié)點(diǎn)上所需的關(guān)鍵地址分布在整個(gè)路徑上。
將包從以太網(wǎng)上的起始視頻電話15傳送到ATM網(wǎng)絡(luò)上的終止視頻電話15的此實(shí)例也可適用于相反情況,其中起始終端或視頻電話15與ATM網(wǎng)絡(luò)進(jìn)行通信,且終止視頻電話15與以太網(wǎng)進(jìn)行通信。
類似地,路徑可包含與以太網(wǎng)通信的起始視頻電話15和與以太網(wǎng)通信的終止視頻電話15,在其間存在包將要橫越的ATM網(wǎng)絡(luò),如圖16所示。在此情況下,將在每個(gè)邊緣處存在兩個(gè)網(wǎng)關(guān),在所述邊緣處存在以太網(wǎng)與ATM網(wǎng)絡(luò)之間的接口。如上文解釋,所述過程將僅僅向路徑添加額外節(jié)點(diǎn),其中起始網(wǎng)關(guān)80將其自身ATM地址引入到包,且將包發(fā)送到終止網(wǎng)關(guān)82,所述終止網(wǎng)關(guān)82保存所述起始網(wǎng)關(guān)的ATM地址并將終止網(wǎng)關(guān)的IP地址添加到包,接著將所述包發(fā)送到以太網(wǎng)上的終止視頻電話15。對于返回包,以相反方式發(fā)生相同情況,且每個(gè)網(wǎng)關(guān)保存來自先前網(wǎng)關(guān)或終止視頻電話15的各別地址信息,且將其自身地址添加到最終發(fā)送到起始視頻電話15的返回包,其中起始網(wǎng)關(guān)80和起始視頻電話15分別保存終止網(wǎng)關(guān)82或起始網(wǎng)關(guān)82的ATM地址,所以存儲整個(gè)路徑的每個(gè)鏈路中的各別地址,以更有效且快速地繼續(xù)發(fā)送連接的后續(xù)包。
舉例來說,視頻電話15的主控制器50和網(wǎng)絡(luò)接口42可使用將SIP路由信息(或所使用的任何標(biāo)準(zhǔn)路由信息)放在包中的領(lǐng)域的所屬技術(shù)人員熟知的相同技術(shù)向發(fā)送到網(wǎng)絡(luò)40的每個(gè)包添加視頻電話15的地址。網(wǎng)絡(luò)接口42還將從來自網(wǎng)絡(luò)上節(jié)點(diǎn)的包接收到的地址信息存儲在本地存儲器中。類似地,對于網(wǎng)絡(luò)40上的網(wǎng)關(guān),可應(yīng)用相同情況。如眾所周知,網(wǎng)關(guān)具有控制構(gòu)件和數(shù)據(jù)處理構(gòu)件來將包移動(dòng)到其最終目的地。網(wǎng)關(guān)的控制機(jī)制的網(wǎng)絡(luò)接口42和主控制器50(其關(guān)于SIP路由信息以眾所周知的技術(shù)進(jìn)行操作)存儲從包接收的地址信息,且其將相對于網(wǎng)絡(luò)40(將在其中發(fā)送包)的自身地址信息與包放置在一起。舉例來說,可將網(wǎng)關(guān)或視頻電話15的地址信息放置在與包相關(guān)聯(lián)的標(biāo)頭部分中的字段中。應(yīng)注意,盡管所述實(shí)例談及將視頻電話15使用作為終止和起始源,但可使用產(chǎn)生和接收包的任何類型的裝置作為此整個(gè)機(jī)制中的節(jié)點(diǎn)。
虛擬存在視頻電話15是作為個(gè)人通信終端的桌上型網(wǎng)絡(luò)40裝置。其取代用戶桌面上的電話,提供現(xiàn)代PBX終端的所有特征,及由視頻電話15的大觸摸屏74提供的用戶界面的簡單性和使用簡易性。
視頻電話15向所有人際通信添加視頻方面,從而將通話體驗(yàn)改變?yōu)樘摂M存在的體驗(yàn)。過去,視頻會(huì)議系統(tǒng)上的視頻質(zhì)量不夠高,不足以使該技術(shù)成為透明的。視頻電話15是傳遞足夠高的視頻質(zhì)量來建立正確體驗(yàn)的第一種個(gè)人視頻電話。為進(jìn)行有效的實(shí)時(shí)視頻通信,不僅需要圖片質(zhì)量接近廣播TV質(zhì)量,而且等待時(shí)間必須保持得非常低。如果要進(jìn)行自然的交談,那么嘴唇同步也很重要。所有這些問題已在視頻電話15視頻子系統(tǒng)的設(shè)計(jì)中得以解決。視頻電話15使用特別針對此應(yīng)用配置的最新編碼器36和解碼器34技術(shù)。換句話說,視頻電話15盡可能地接近于“身臨其境”。
視頻電話15還通過使用傳遞清晰語音的高保真度且接近CD質(zhì)量的音頻通道而大大改進(jìn)常規(guī)揚(yáng)聲器電話性能。立體聲音頻通道提供了每個(gè)參與者音頻的空間差異。高級立體聲回聲消除不僅消除來自單元揚(yáng)聲器64的所有聲音,而且使得講話者能以正常交談音量進(jìn)行交談,即使在吵雜房間中也能這樣。
視頻電話15直接支持建立高達(dá)4個(gè)遠(yuǎn)程方(即,5向)視頻電話會(huì)議和/或高達(dá)10方的音頻電話會(huì)議。每個(gè)用戶可以看到他/她的工作群組的所有其他成員的可用性。視頻電話15優(yōu)選地使用會(huì)話起始協(xié)議(SIP)作為建立、修改和清除多流多媒體會(huì)話的構(gòu)件。視頻電話15可經(jīng)由網(wǎng)關(guān)70而建立到任何其它SIP電話或任何其它電話的音頻呼叫。
視頻電話15對其附接的網(wǎng)絡(luò)40具有高要求。視頻電話15的電話會(huì)議要求網(wǎng)絡(luò)40能供應(yīng)連續(xù)的高帶寬,對帶寬、等待時(shí)間和抖動(dòng)有保證。Marconi plc專門研究提供可支持高服務(wù)質(zhì)量應(yīng)用的網(wǎng)絡(luò)。也可獲得視頻電話15的會(huì)議室版本。
視頻電話15是具有完全與用戶的PC 68(計(jì)算平臺)集成的能力的通信終端(平臺)。用于PC 68的視頻電話15應(yīng)用在PC 68與相關(guān)聯(lián)的視頻電話15終端之間提供許多集成服務(wù)。這將包括出于共享例如白板或展示等應(yīng)用的目的而自動(dòng)建立視頻電話15的電話會(huì)議中各方之間的NetMeeting會(huì)話(如果啟用),還包括其它能力,包括在PC 68上進(jìn)行視頻電話15對號碼的“拖放”撥號。
一組服務(wù)器(優(yōu)選地,每一者為SIP服務(wù)器)向網(wǎng)絡(luò)40裝置提供呼叫控制和特征實(shí)施。這些是在標(biāo)準(zhǔn)計(jì)算平臺上運(yùn)行的軟件服務(wù)器,能夠?qū)崿F(xiàn)冗余。這些服務(wù)器還運(yùn)行用戶聯(lián)系人信息數(shù)據(jù)庫和用戶偏好數(shù)據(jù)庫的本地副本。這些服務(wù)器上可用的應(yīng)用程序提供訪問公司或其它LDAP可訪問目錄的能力。
同步服務(wù)器66維持用戶主聯(lián)系人數(shù)據(jù)庫與服務(wù)器66(優(yōu)選地,SIP)上的本地副本之間的同步。支持Outlook Exchange或Lotus Notes同步。一組媒體網(wǎng)關(guān)70被用于模擬或數(shù)字PSTN網(wǎng)絡(luò)40。一組媒體網(wǎng)關(guān)70介接到最常見的PABX設(shè)備,包括與那些PABX相關(guān)聯(lián)的語音郵件系統(tǒng)。
媒體服務(wù)器66向視頻電話15終端提供許多服務(wù)。其充當(dāng)4方視頻會(huì)議的橋接會(huì)議服務(wù)器66(如果需要的話)。其還可提供視頻電話15標(biāo)準(zhǔn)與其它常見音頻或視頻格式(例如H320/H323)之間的代碼轉(zhuǎn)換。其可提供記錄和播放工具,從而使得能記錄和播放會(huì)話。其可提供音調(diào)和通知源。
需要根據(jù)正使用的標(biāo)準(zhǔn)的防火墻(例如SIP防火墻),以便在標(biāo)準(zhǔn)代理軟件(例如SIP代理軟件)的控制下安全傳遞經(jīng)動(dòng)態(tài)生成的RTP流。TV服務(wù)器66充當(dāng)TV分布源,從而允許視頻電話15用戶選擇所支持的任何通道(例如CNN)。
視頻電話15用于以太網(wǎng)和ATM桌面。視頻電話15終端將支持端到端ATM SVC且使用它們來建立具有必要服務(wù)質(zhì)量水平的連接。視頻電話15還將支持經(jīng)由LANE服務(wù)的IP連接性。為使其保證所需的QoS,需要LANE 2。視頻電話15向附接到ATM的桌上型PC 68提供ATM通過(passthrough),或提供ATM至以太網(wǎng)通過以便經(jīng)由以太網(wǎng)附接PC 68。
視頻電話15需要支持端到端QoS。對于附接到以太網(wǎng)的視頻電話15,用戶連接需要支持802.1p、DiffServ和/或IntServ或更好的協(xié)議。如果可經(jīng)由ATM網(wǎng)絡(luò)40到達(dá)目的地,那么將提供以太網(wǎng)到ATM的網(wǎng)關(guān)70。SIP代理服務(wù)器66和SIP信令將建立最靠近目標(biāo)視頻電話15終端的ATM端點(diǎn),即,如果它是ATM附接的或最靠近的ATM以太網(wǎng)網(wǎng)關(guān)70,則為其ATM地址。信令將在網(wǎng)絡(luò)40的ATM部分上建立具有恰當(dāng)QoS的SVC。此SVC將鏈接到在遠(yuǎn)程端處產(chǎn)生恰當(dāng)優(yōu)先級指示的特定以太網(wǎng)流。
視頻電話15產(chǎn)品系列由若干終端(裝置)、一組服務(wù)器(其提供未內(nèi)建到所述裝置中的特征)和一組網(wǎng)關(guān)70(其將產(chǎn)品連接到現(xiàn)存設(shè)施和PSTN服務(wù)外部)組成。系統(tǒng)10提供的基本功能性為 電話服務(wù),在所有“網(wǎng)上”呼叫上可使用視頻,具有非常高質(zhì)量的音頻和視頻 多方會(huì)議服務(wù),其為音頻和視頻的、專門或預(yù)調(diào)度的、完全自動(dòng)服務(wù)并完全集成到電話服務(wù)中
存在服務(wù)——具有多種工具來確定協(xié)作可用性 共享表面服務(wù)——電子白板,應(yīng)用程序共享,文檔共享,演示廣播 其它附加值服務(wù),例如廣播視頻(到達(dá)群組的Mikes消息)TV分布。在線互動(dòng)培訓(xùn)等。如果需要的話,會(huì)話記錄服務(wù)也是可用的。
視頻電話15是具有大量新功能性的電話,而不是試圖實(shí)現(xiàn)電話功能的電腦。這允許完全同時(shí)使用電腦來從事其擅長的工作,同時(shí)提供靈活而特定針對應(yīng)用的裝置來進(jìn)行通信??舍槍Υ藨?yīng)用調(diào)節(jié)用戶界面和物理設(shè)計(jì),從而提供一種如同當(dāng)前電話的瞬時(shí)接通、高度可靠的通信裝置,而PC 68將永遠(yuǎn)不會(huì)成為某種裝置。此方法還對裝置的操作環(huán)境提供控制,從而消除與PC 68硬件和軟件配置問題相關(guān)的支持問題。
人為因素研究已反復(fù)表明,音頻質(zhì)量是進(jìn)行有效和透明通信的單個(gè)最重要因素。盡管手持話機(jī)是必要的,但包括聲響回聲消除(AEC)、自動(dòng)增益控制(AGC)、寬帶音頻能力(G.722 8kHz帶寬或更好)、立體聲輸出和與PC 68聲音輸出的集成的極好質(zhì)量的免提音頻可提供全新水平的有效遠(yuǎn)程協(xié)作。還存在高質(zhì)量麥克風(fēng)陣列,其經(jīng)設(shè)計(jì)和處理以限制罐頭效應(yīng)。
使用一種簡單、清潔、直觀、完全靈活的用于視頻輸出和按鈕/選擇輸入的平臺。在第一視頻電話模型中,這是高質(zhì)量TFT全色屏幕,其為具有1260×768或更好分辨率的17″對角線16乘9屏幕,上面覆蓋有中等分辨率的高壽命的觸摸板。將明亮(>200尼特)且擴(kuò)展視角(>+-60°)的有源矩陣面板用于顯示全動(dòng)視頻以在辦公室環(huán)境下獲得舒適觀看??墒褂酶?、更明亮、更快速、更大對比度和更高視角的屏幕。
視頻電話15使用TFT彩色LCD,具有帶有基于Intel Celeron/440MMX和Lynx VGA控制器的VGA型顯示器53接口的類似PC 68的結(jié)構(gòu)。
高質(zhì)量數(shù)字480逐行掃描相機(jī)用于提供30幀每秒的至少640×480視頻。視頻電話15利用用于機(jī)頂盒的視頻編碼器36技術(shù)來使用MPEG2編碼??僧a(chǎn)生各種不同位速率,從而允許視頻質(zhì)量適合一對一呼叫的可用資源,且適合一對多或多對多呼叫的最高質(zhì)量參與者。集成的高質(zhì)量相機(jī)模塊被置于靠近屏幕處,其中提供外部視頻輸入(火線)來允許使用額外相機(jī)、VCR或其他視頻源。
現(xiàn)存的10/100BaseT以太網(wǎng)桌面連接是與LAN、WAN、PC 68桌上型計(jì)算機(jī)和各種服務(wù)器、代理和網(wǎng)關(guān)70進(jìn)行通信必需的僅有連接。使用802.1p將用于音頻和視頻的限時(shí)RTP流標(biāo)記為具有優(yōu)先級,從而在LAN的以太網(wǎng)域內(nèi)提供用于QoS的機(jī)制。還支持DiffServ,同時(shí)RSVP為可選項(xiàng)。為了消除對到桌面的額外建造布線的需要,視頻電話15將包括小型10/100以太網(wǎng)交換機(jī),從而允許現(xiàn)存桌面端口可用于電話和PC 68兩者。
視頻電話15還支持ATM接口。所述接口是基于使用具有光纖或銅線接口的HE155兆位/秒卡。視頻電話15提供ATM通過端口,以連接到連接ATM的桌面裝置或?qū)⑦B接以太網(wǎng)的PC 68連接到連接ATM的視頻電話15。
會(huì)議室環(huán)境的成本和性能權(quán)衡顯著不同于桌面環(huán)境的成本和性能權(quán)衡。視頻投影、具有遠(yuǎn)程搖攝/傾斜/縮放的多個(gè)相機(jī)、多個(gè)麥克風(fēng)、多個(gè)視頻通道、背投白板和其它適用于會(huì)議室環(huán)境的產(chǎn)品被集成到會(huì)議室視頻電話15中。會(huì)議室環(huán)境與桌面的交互操作是無縫的且透明的。此環(huán)境將大量使用介接到相同基礎(chǔ)架構(gòu)和標(biāo)準(zhǔn)的OEM設(shè)備以代替桌面裝置。硬件設(shè)計(jì)是基本相同的,具有對多個(gè)麥克風(fēng)的額外音頻支持和對多個(gè)相機(jī)和顯示器的額外視頻支持?;蛘?,可使用鏈接到低成本SIP電話的PC 68應(yīng)用程序,其由鼠標(biāo)或觸摸屏74(如果PC 68具有觸摸屏74)驅(qū)動(dòng)。對于不需要上文所述的協(xié)作能力的那些桌面和其它位置,可使用與系統(tǒng)10一起工作而不需要額外布線或PBX的標(biāo)準(zhǔn)電話。
通過使用SIP(會(huì)話起始協(xié)議)標(biāo)準(zhǔn),終端裝置由一個(gè)或一個(gè)以上提供注冊、定位、用戶概況、存在和各種代理服務(wù)的服務(wù)器支持。這些服務(wù)器是連接到LAN的廉價(jià)Linux或BSD機(jī)器。
視頻電話15是電話,所以必須提供一組關(guān)鍵的PBX功能,包括傳送、轉(zhuǎn)發(fā)、3(和4、5、……)方會(huì)議、呼叫者ID+、呼叫歷史等。這些特征中的某些可建立在稱為“CPL”的SIP擴(kuò)展機(jī)制上,所述CPL實(shí)際上是一種用于以安全、可擴(kuò)展方式提供呼叫處理的語言。
視頻電話15提供了有效存在和瞬間消息傳送。存在(也許是改進(jìn)每日分布式群組協(xié)作工作的最有革命性的工具)允許人們知道誰在且他們正在做什么。其為非常低的額外開銷呼叫、消除電話標(biāo)簽和傳統(tǒng)撥號、鼓勵(lì)群組作為群組而并非通過現(xiàn)在常見的分離式一對一電話交談來進(jìn)行通信提供了基礎(chǔ)。與瞬間消息傳送(實(shí)時(shí)郵件)的集成提供了交換短文本消息的非延遲方式,其可能使用PC 68鍵盤進(jìn)行輸入。
視頻電話15提供了分布式/冗余結(jié)構(gòu)。這是電話系統(tǒng)10,且其必須是可靠的。其還應(yīng)能夠通過本地?cái)U(kuò)展來加以集中管理,其中分布式服務(wù)器向所有用戶提供“瞬間”回應(yīng)。舉例來說,如果使用SIP,那么將部署不同SIP代理功能中的每一者,使得它們可任意組合成一組物理服務(wù)器,同時(shí)冗余版本位于網(wǎng)絡(luò)40中。
Microsoft NetMeeting用于共享表面和共享應(yīng)用程序功能性。可使用PC 68和PDA的計(jì)算機(jī)/電話接口(CTI),其具有例如集成的聯(lián)系人列表、自動(dòng)撥打選定電話號碼或名稱、呼叫歷史的日歷記錄、自動(dòng)輸入聯(lián)系人等特征。
SIP向防火墻提出挑戰(zhàn),因?yàn)镽TP流使用動(dòng)態(tài)分配的UDP端口,且在SIP消息中承載地址/端口信息。這意味著防火墻必須追蹤SIP消息,且對于恰當(dāng)?shù)牡刂?端口組合在防火墻中打開“針孔(pin hole)”。此外,如果采用NAT,那么必須更改消息以具有恰當(dāng)?shù)霓D(zhuǎn)譯地址/端口。存在兩種用于完成此類任務(wù)的方式。一種是將所述性能內(nèi)建到防火墻中。位居前三位的防火墻銷售商(Checkpoint、Network Associates和Axxent)提供此功能。替代方案是具有專用防火墻,其與主防火墻并行且僅處理SIP。存在此類防火墻的商業(yè)版本,例如MicroAppliances的版本。應(yīng)注意,SIP或NetMeeting是可用于實(shí)現(xiàn)其必要的各自功能性的優(yōu)選實(shí)施例。如果提供了必要的功能性,那么可使用它們的替代方案。
圖5展示視頻電話15終端的主物理組件。架子提供易于調(diào)節(jié)主顯示器54面板的高度和將面板緊固在所述高度的構(gòu)件。高度調(diào)節(jié)范圍為至少6英寸行程以適應(yīng)不同用戶高度。假定架子將擱在桌子上且桌面高度是標(biāo)準(zhǔn)的。架子與主單元之間的鏈接必須提供偏離垂直方向的有限傾斜度,以便匹配用戶偏好且易于鎖定在那個(gè)角度。所需的傾斜量為與垂直方向相距-0+15。主單元可直接進(jìn)行墻式安裝而不需要作為可選項(xiàng)的架子組合件。
主單元外殼提供用于視頻電話15設(shè)計(jì)中的所有其它元件(包括圖5中所示的所有那些元件)和所有內(nèi)部電子元件的外罩。所述外殼提供了手持話機(jī)的左手或右手座架。用右手的人往往會(huì)用左手拾取手持話機(jī)(因?yàn)樗麄儗⒂糜沂烛?qū)動(dòng)觸摸屏74和寫字)且用左手的人正好相反。盡管左手定位將是正常模式,但必須能夠?qū)⑹殖衷挋C(jī)放置在右側(cè)。在外殼上提供揚(yáng)聲器插孔,以允許揚(yáng)聲器64安裝在遠(yuǎn)離視頻電話15處。提供輸入以處理來自相關(guān)聯(lián)PC 68的揚(yáng)聲器輸出,以使得視頻電話15可控制PC 68和視頻電話15音頻??墒褂玫綋P(yáng)聲器64的無線連接的實(shí)施方案(經(jīng)由藍(lán)牙或SONY標(biāo)準(zhǔn))。
在所述單元處提供手持話機(jī),且應(yīng)使用標(biāo)準(zhǔn)RJ9卷繞電纜和連接器插孔連接。當(dāng)擱置時(shí),手持話機(jī)應(yīng)易于拾取但為不礙事的。手持話機(jī)選項(xiàng)提供了手持話機(jī)上的標(biāo)準(zhǔn)鍵盤。可使用用以改進(jìn)終端用戶移動(dòng)性的無線手持話機(jī)。
提供插孔以連接立體聲耳機(jī)+麥克風(fēng)。使用耳機(jī)來進(jìn)行正常電話交談?wù)找嬖黾?。用戶?yīng)能夠選擇使用耳機(jī)+吊桿麥克風(fēng),或僅使用耳機(jī),同時(shí)采用麥克風(fēng)陣列作為輸入裝置??蛇x擇使用無線耳機(jī),以便改進(jìn)終端用戶的移動(dòng)性。
在主外殼上某一位置中提供用以介接到PDA和其它IR裝置的IR端口,以允許容易的連接。當(dāng)前,電話和PDA上的IR接口是最常見的,且因此出于與需要藍(lán)牙接口相同的原因,也需要IR接口。
陣列麥克風(fēng)嵌入在外殼中。所述陣列必須不會(huì)由于終端的正常操作而產(chǎn)生附加噪聲。明確地說,其應(yīng)不能夠檢測到觸摸面板上的用戶動(dòng)作。所述陣列麥克風(fēng)允許用戶在單元前方周圍和水平面中110E的弧形(例如,6英尺)內(nèi)且在存在預(yù)定分貝的背景噪聲的情況下以正常交談音量進(jìn)行講話。單元必須明確指示麥克風(fēng)是有效的/無效的,即等同于“掛機(jī)”或“摘機(jī)”。視頻電話15用戶將需要再次確保,他不會(huì)在不知道的情況下被收聽。這是機(jī)械相機(jī)快門的音頻等效物。
主視頻電話15單元可具有智能卡讀取器選項(xiàng)以提供為獲得個(gè)人特征對終端的安全使用。對視頻電話15的使用將需要一系列使用控制特征,從屏幕上的簡單密碼登錄到安全鏈(security fob)。智能卡讀取器提供這些使用權(quán)控制方法中的一者。
如果可從屏幕控制傾斜和搖攝,且優(yōu)選地,如果搖攝和傾斜僅僅是電子的且不需要任何機(jī)械機(jī)制,那么明顯地存在優(yōu)點(diǎn)。相機(jī)支架應(yīng)當(dāng)安裝為盡可能靠近主屏幕的頂部,以改進(jìn)視線接觸。
相機(jī)應(yīng)當(dāng)是能夠產(chǎn)生480p輸出的數(shù)碼相機(jī)47。相機(jī)輸出饋入MPEG-2編碼器36。應(yīng)當(dāng)能夠動(dòng)態(tài)地配置相機(jī),使得相機(jī)輸出得以優(yōu)化而以選擇的編碼器36輸出數(shù)據(jù)速率饋入編碼器36。面部形成相機(jī)將接收到的大部分輸入,且因此在各種各樣光照條件下對膚色的準(zhǔn)確捕捉是一項(xiàng)基本特征。
相機(jī)應(yīng)在低至3勒克斯值的各種各樣光照條件下進(jìn)行操作。相機(jī)應(yīng)提供自動(dòng)白色平衡。白色平衡變化必須是緩慢的,以使得所俘獲的圖像上的瞬變現(xiàn)象不會(huì)造成不適當(dāng)?shù)膱D片擾動(dòng)。只有持續(xù)超過5秒的改變才應(yīng)改變白色平衡。相機(jī)的焦距應(yīng)為18英寸到10英尺,即具有較大景深,且理想地焦距達(dá)20英尺。用戶和信息(如果在其白板上存在的話)兩者均需要被對焦。自動(dòng)聚焦(其中當(dāng)用戶移動(dòng)時(shí)相機(jī)不斷搜尋最佳焦距)在接收器端處產(chǎn)生干擾圖像,且必須加以避免。
相機(jī)應(yīng)允許有限變焦能力,從一個(gè)用戶在相機(jī)正前方的設(shè)置變到一些用戶同時(shí)在一個(gè)視頻電話15上的另一設(shè)置。作為替代方案,可提供不同鏡頭。可依據(jù)鏡頭視野來對此進(jìn)行規(guī)定,從例如30E視野到75E視野。
相機(jī)應(yīng)當(dāng)能夠輸入比傳輸所需更大的圖片,例如1280×960圖像。這將允許以電子方式的有限的縮放和水平及垂直搖攝,從而消除對與相機(jī)相關(guān)聯(lián)的電子-機(jī)械控制的需要。相機(jī)的物理尺寸應(yīng)較小,以使得“屏幕上”安裝不會(huì)簡單地被相機(jī)大小取消。
中等分辨率長壽命觸摸面板形成與視頻電話15進(jìn)行通信的主要方法,且形成主顯示器54的正面。面板將受到大量手指接觸,且因此必須經(jīng)受頻繁清潔以去除污點(diǎn)和其它指紋,否則所述污點(diǎn)和其它指紋將影響顯示54質(zhì)量。應(yīng)當(dāng)易于校準(zhǔn)觸摸面板,即確保在觸摸面板上觸摸的區(qū)域與在下面的顯示器54之間的對準(zhǔn)將導(dǎo)致滿足“假觸摸”要求。
觸摸屏74表面必須最小化表面反射,以使得即使在面對窗戶時(shí)顯示器54也是清楚的。要求是“假觸摸”為罕見事件。對觸摸面板的分辨率要求因此很大程度上依賴于觸摸屏設(shè)法區(qū)別的最小顯示器54區(qū)域。組合的分辨率和視差誤差應(yīng)使得一般受訓(xùn)用戶由于這些因素而產(chǎn)生“假觸摸”的機(jī)會(huì)小于5%。(20次選擇中存在一次假觸摸)。理想的是,此假觸摸比率小于2%,即在50次選擇中存在一次假觸摸。
在恰當(dāng)情況下,必須給予用戶成功觸摸的可聽和/或可見反饋。這些音調(diào)可依據(jù)當(dāng)時(shí)觸摸屏74顯示器54上的內(nèi)容而變化。舉例來說,當(dāng)使用鍵盤時(shí),類似鍵盤的聲音是恰當(dāng)?shù)?,?dāng)使用撥號盤時(shí),不同聲音可能較為相關(guān),等等??陕牱答伩赡懿皇窃谒星闆r下都是需要的,盡管通常成功觸摸的某種可聽或可見指示對用戶有幫助。用戶應(yīng)能夠打開和關(guān)閉音調(diào),并設(shè)置與某設(shè)置屏幕上的觸摸相關(guān)聯(lián)的音調(diào)、音調(diào)持續(xù)時(shí)間和音量水平。應(yīng)提供默認(rèn)值。觸摸屏74也可與指示筆以及手指一起使用。
顯示器54面板應(yīng)為至少17″對角線平板(或更好的)全色顯示器54技術(shù),其中16×9縱橫比是優(yōu)選的,但16×10縱橫比是可接受的。
屏幕分辨率應(yīng)至少為1280×768??梢暯嵌葢?yīng)在水平和垂直平面上至少離軸6E。屏幕對比率應(yīng)當(dāng)比典型的300∶1好。顏色分辨率應(yīng)為至少6位/色彩,即能夠顯示262K種色彩,6位/色彩對于原型單元是可接受的。對于生產(chǎn)單元,8位/色彩是優(yōu)選的,其中其它方面是相等的。顯示器54面板應(yīng)具有足夠高的亮度,以便甚至在良好照明或自然照明的房間中也能舒適地觀看。亮度應(yīng)為至少300cd/m2。顯示器54和解碼電子設(shè)備應(yīng)當(dāng)能夠顯示來自圖像的恰當(dāng)網(wǎng)絡(luò)40源的720P高分辨率圖像。
到最小亮度的50%時(shí),背光應(yīng)具有至少25,000小時(shí)的最小壽命。如果背光由于視頻電話15終端不活動(dòng)的緣故而被關(guān)閉,那么其應(yīng)當(dāng)在有傳入呼叫時(shí)和在用戶觸摸觸摸屏上的任何地方時(shí)自動(dòng)打開。不活動(dòng)時(shí)段(一旦經(jīng)過其以后就關(guān)閉接觸屏)應(yīng)當(dāng)可由用戶設(shè)置,可設(shè)置為“不關(guān)閉”。
圖6中展示視頻電話15的連接區(qū)域中所需的連接。下文將在多個(gè)段落中簡要描述每個(gè)連接器要求。
兩個(gè)RJ 45/100以太網(wǎng)連接器用于連接到網(wǎng)絡(luò)40,且源自相關(guān)聯(lián)的PC 68。
應(yīng)提供ATM個(gè)性化模塊中的可選插件,其使得視頻電話15能夠容易地支持用于光學(xué)和銅線接口兩者的155兆位/秒接口。
應(yīng)提供USB端口,以允許容易地連接各種可選外圍設(shè)備,例如鍵盤、鼠標(biāo)、低成本相機(jī)等。
應(yīng)提供1394(火線)接口以準(zhǔn)許連接到外部(火線)相機(jī)或其它視頻源。接口應(yīng)準(zhǔn)許對火線接口進(jìn)行完全的帶內(nèi)相機(jī)控制。在必要情況下,應(yīng)使用外部轉(zhuǎn)換器來從(例如)S視頻轉(zhuǎn)換到火線輸入。應(yīng)當(dāng)能夠使用此源來代替輸出到會(huì)議的視頻電話15中的主相機(jī)源。還應(yīng)能夠規(guī)定正?;颉癈NN”模式,即可對此視頻源進(jìn)行裁剪或不可對其進(jìn)行裁剪。應(yīng)提供XVGA視頻輸出,以使得視頻電話15能夠用反映在主顯示器52上顯示的圖像的圖像來驅(qū)動(dòng)外部投影儀。
應(yīng)針對PCAudio輸出提供音頻輸入。為了確保PC 68音頻和視頻電話15音頻的集成,將僅部署一組揚(yáng)聲器64。PC 68聲音將穿過視頻電話15的音頻通道。應(yīng)提供一插孔或一對插孔來連接到耳機(jī)和附接的懸掛式麥克風(fēng)。僅耳機(jī)操作(使用內(nèi)建的麥克風(fēng)陣列)必須也是可能的。如果耳機(jī)插孔相對難以接近,那么應(yīng)能夠讓耳機(jī)保持插入,且經(jīng)由用戶控制來選擇是否在耳機(jī)上打開音頻。提供到外部左揚(yáng)聲器和右揚(yáng)聲器64的連接??赡苁褂靡粋€(gè)、兩個(gè)或三個(gè)視頻電話15單元就好像它們是單個(gè)功能單元,如圖7中說明。
在具有一個(gè)以上視頻電話15的配置中,只有一個(gè)單元充當(dāng)主控制面板,其它單元顯示視頻和與所顯示視頻直接相關(guān)聯(lián)的控件。對于這些配置中的任一者,將只需要一組揚(yáng)聲器64。
將考慮到麥克風(fēng)輸入和音頻流而提供許多選項(xiàng),從使用單個(gè)常見麥克風(fēng)輸入到將音頻從每個(gè)麥克風(fēng)陣列傳輸?shù)剿鲆曨l電話15上的視頻源。
應(yīng)針對視頻輸入提供許多選項(xiàng)。默認(rèn)的應(yīng)是傳輸“控制面板”視頻電話15的視圖。如果可使用更多帶寬,那么每個(gè)用戶可從顯示所述用戶的屏幕處得到視頻,從而產(chǎn)生更自然的體驗(yàn)??山?jīng)由LAN連接達(dá)成多個(gè)視頻電話15終端的所有協(xié)調(diào),即不需要任何特殊的單元間布線。
視頻電話15視頻電話向其用戶提供許多主要功能——它是辦公室電話——它是用戶電話——它是視頻電話——它是會(huì)議電話——它是視頻會(huì)議電話
——它提供對聯(lián)系人詳細(xì)信息的容易的訪問和管理——它提供對語音/視頻郵件的訪問和管理單元功能性分為兩種類別,即用戶功能和系統(tǒng)功能。
用戶功能是用戶將可以使用的任何功能。
系統(tǒng)10功能是I.T.需要用來設(shè)定監(jiān)視器和維護(hù)視頻電話15終端的那些功能,且所述功能是一般用戶看不見的。實(shí)際上,整個(gè)設(shè)計(jì)的重要目的是確保向用戶呈現(xiàn)非常簡單的界面,在所述界面中他可在幾乎沒有受到培訓(xùn)的情況下使用視頻電話15。
下文定義基本特征組,所述基本特征組是必須具有的最小的特征組。
當(dāng)沒有用戶登錄到終端上時(shí),視頻電話15視頻電話充當(dāng)常規(guī)電話。其功能性必須完全不取決于相關(guān)聯(lián)的PC 68的存在。
下文描述視頻電話15作為辦公室中常規(guī)電話的功能性。
終端能夠在服務(wù)所述場所的PABX上具有常規(guī)擴(kuò)展號碼。
終端能夠從任何電話接受傳入呼叫,所述電話可以在PABX上、在視頻電話15網(wǎng)絡(luò)40上或?yàn)槿魏瓮獠侩娫挘鴽]有任何區(qū)別對待。
視頻電話15能夠接受來自其它兼容SIP電話的呼叫。
傳入呼叫將根據(jù)配置來產(chǎn)生響鈴音調(diào)(見下文的設(shè)定屏幕要求)。明確地說,針對包括視頻的視頻電話15呼叫的響鈴音調(diào)將可被選擇成一種區(qū)別于僅音頻呼叫的響鈴,無論其是否來自視頻電話15終端。
傳入呼叫將在顯示器54上的狀態(tài)區(qū)中產(chǎn)生傳入呼叫指示。此顯示器54必須給出與由傳入呼叫提供的呼叫者ID信息一樣多的呼叫者ID信息,或指示沒有一者是可用的。
有可能通過以下方式來接受傳入呼叫a)按壓傳入呼叫狀態(tài)顯示器54上的呼叫接受按鈕。
b)拾起手持話機(jī)——這將總是接受所有被提供的選項(xiàng),即視頻和音頻。
用戶能夠容易地在一次呼叫之中在手持話機(jī)與免提(揚(yáng)聲器電話)操作之間進(jìn)行切換。在呼叫之中拾起手持話機(jī)應(yīng)自動(dòng)從揚(yáng)聲器電話模式切換到手持話機(jī)模式。在不重新選擇揚(yáng)聲器電話模式的情況下放回手持話機(jī)將斷開所述呼叫。
屏幕上應(yīng)給出關(guān)于所述模式(即手持話機(jī)或免提)的指示。
呼叫狀態(tài)欄可顯示呼叫持續(xù)時(shí)間。
能夠通過主顯示器54上輕易可得的控件來調(diào)節(jié)傳入呼叫的音量。應(yīng)可獨(dú)立地調(diào)節(jié)耳機(jī)和揚(yáng)聲器音量。
當(dāng)在揚(yáng)聲器電話模式中時(shí),能夠?qū)⑹殖衷挋C(jī)放回到手持話機(jī)支架,而不斷開呼叫。
在以下情況下終止呼叫$如果用戶按壓呼叫狀態(tài)顯示54上的清除呼叫按鈕。
$如果在手持話機(jī)模式中且沒有選擇免提時(shí)用戶放回手持話機(jī)。
$如果遠(yuǎn)程方掛斷呼叫(假設(shè)這被可靠地指示給視頻電話15)。
保持——應(yīng)能夠?qū)⒑艚兄糜诒3譅顟B(tài)且再次取消所述呼叫的保持狀態(tài)。應(yīng)在狀態(tài)顯示54上顯示保持狀態(tài),同時(shí)具有一個(gè)允許拾起被保持的呼叫的按鈕。
呼叫等待——額外傳入呼叫必須在顯示器54的狀態(tài)區(qū)中產(chǎn)生傳入呼叫指示。必須不產(chǎn)生呼叫音調(diào),除非這已在設(shè)置菜單中啟用。
能夠在當(dāng)前操作模式(即,手持話機(jī)或免提)中通過狀態(tài)顯示54上的呼叫接受按鈕接受新的傳入呼叫。
接受另一傳入呼叫將自動(dòng)將當(dāng)前呼叫置于保持狀態(tài)。
在任何呼叫時(shí)按壓“取消保持”按鈕必須自動(dòng)將其它呼叫轉(zhuǎn)換為保持。
可處理的同時(shí)傳入呼叫的數(shù)目由狀態(tài)顯示54空間的可用性設(shè)置。必須不少于兩個(gè)呼叫。
在當(dāng)前呼叫的數(shù)目超過可處理的數(shù)目時(shí),任何其它傳入呼叫a)得到忙音或b)立即轉(zhuǎn)接到語音郵件c)立即轉(zhuǎn)接到經(jīng)配置的轉(zhuǎn)接號碼d)被發(fā)送一條記錄消息。
這由用戶“遇忙呼叫轉(zhuǎn)接”設(shè)置確定。
如果在可接受限制內(nèi)的傳入呼叫在(可配置)時(shí)間間隔內(nèi)未被應(yīng)答,那么呼叫a)被轉(zhuǎn)接到語音郵件b)被轉(zhuǎn)接到預(yù)先配置的轉(zhuǎn)接號碼c)被發(fā)送一條記錄消息。
這由用戶的“無應(yīng)答呼叫轉(zhuǎn)接”設(shè)置確定。
呼叫轉(zhuǎn)移——用戶能夠容易地將任何呼叫轉(zhuǎn)移到任何其它號碼。所述轉(zhuǎn)移功能將把呼叫置于保持狀態(tài)并允許撥打新號碼。一旦聽到響鈴音調(diào),用戶便將具有完成轉(zhuǎn)移的選項(xiàng)?;蛘?,用戶將能夠?qū)λ鲂绿柎a講話,且接著起始轉(zhuǎn)移或首先加入電話會(huì)議中的所有(三個(gè))參與方。如果在后者情況下,將向用戶提供一種功能來退出所述電話會(huì)議。在沒有來自被叫終端的回復(fù)或只有來自被叫終端的語音郵件的情況下,用戶將具有返回到最初呼叫的選項(xiàng)。
呼叫轉(zhuǎn)接——必須能夠?qū)㈦娫捲O(shè)定為將傳入呼叫自動(dòng)轉(zhuǎn)接到預(yù)先配置的號碼。呼叫轉(zhuǎn)接可為a)無條件的b)遇忙轉(zhuǎn)接c)無應(yīng)答轉(zhuǎn)接電話會(huì)議——能夠?qū)⒍鄠€(gè)呼叫組成僅音頻的會(huì)議,而不管語音呼叫的起源。能夠?qū)⒅辽?個(gè)呼叫組成會(huì)議,即四向交談。在任何一個(gè)時(shí)間僅需要支持單個(gè)會(huì)議,但仍能夠接受一個(gè)其它傳入呼叫(如在上文呼叫等待中所描述)。能夠接受的是,原型僅能夠接受對特定會(huì)議的一個(gè)傳入呼叫,即對于非視頻電話呼叫將需要外部橋接器。
與傳入呼叫狀態(tài)顯示54相關(guān)聯(lián)的選項(xiàng)將允許用戶添加呼叫或從會(huì)議連接中移除呼叫。
能夠向會(huì)議添加多個(gè)呼叫,而不管它們是傳入呼叫還是傳出呼叫。
如果遠(yuǎn)程會(huì)議用戶掛斷,那么必須自動(dòng)清除所述呼叫支路(call leg)。
可使得呼叫成為免提的或有時(shí)使用手持話機(jī)。拾起手持話機(jī)應(yīng)引出撥號盤(如果不在通話中的話)并將音頻連接到手持話機(jī)。需要屏幕上音調(diào)撥號盤(即,數(shù)字1到0加上“*”和“#”)。另外,應(yīng)存在暫停按鈕來向撥號串插入暫停(以用于通過PABX,除非網(wǎng)關(guān)70可經(jīng)編程以去除此要求)。應(yīng)考慮添加+鍵,且布置為將所述+符號自動(dòng)轉(zhuǎn)譯成所述位置的國際訪問串。
還需要用以校正鍵入錯(cuò)誤的鍵(例如[回格]鍵)和用以清除輸入的清除鍵。短時(shí)間按下[退格]鍵應(yīng)移除最后鍵入的數(shù)字,較長時(shí)間的按壓繼續(xù)移除多個(gè)數(shù)字,持續(xù)按壓(pressover)應(yīng)清除數(shù)字寄存器。
應(yīng)將號碼顯示54自動(dòng)格式化為本地號碼格式。[這可能需要用戶設(shè)置來選擇操作國家,因?yàn)槊總€(gè)國家具有不同風(fēng)格,或如果鍵入國際代碼,那么所述代碼應(yīng)用作格式化所述號碼的剩余部分的基礎(chǔ)。]當(dāng)連接到使用音調(diào)數(shù)字盤來選擇特征的服務(wù)時(shí),在使用屏幕上鍵盤或手持話機(jī)鍵盤時(shí),必須在所述服務(wù)的控制下產(chǎn)生正確音調(diào)。撥號盤必須能夠提供此功能,而不管如何起始所述呼叫。
重?fù)堋軌蛲ㄟ^單次觸摸經(jīng)恰當(dāng)識別的功能來重?fù)苌洗螕艽虻奶柎a。
自動(dòng)重?fù)堋軌?例如)通過按住[重?fù)躚按鈕來觸發(fā)自動(dòng)重?fù)軝C(jī)制。自動(dòng)重?fù)軐⒃谙惹皣L試返回占線信號的情況下自動(dòng)重復(fù)所述呼叫若干次。
遇忙等待——當(dāng)向支持遇忙等待的裝置發(fā)出呼叫時(shí),“遇忙等待”功能是可用的。一旦被叫方可用時(shí),遇忙等待便向所述用戶回電。如果被叫號碼不能支持遇忙等待,那么應(yīng)產(chǎn)生表明“此服務(wù)不可用”的消息。
當(dāng)沒有用戶登錄到視頻電話15上時(shí),可在顯示的屏幕上存在恰當(dāng)日志。
應(yīng)將傳入、傳出的頻繁和錯(cuò)過的呼叫的日志顯示在集成撥號屏幕的恰當(dāng)視圖中。對“上次號碼重?fù)堋惫ぞ叩膯未斡|摸或兩次觸摸使用應(yīng)一直在撥號屏幕上為可用的。下文給出這些日志的進(jìn)一步定義。
為了訪問視頻電話15終端上可用的整組特征,用戶必須登錄到所述終端中。提供登錄屏幕,在其中用戶可鍵入其名字和密碼。這可與他的正常網(wǎng)絡(luò)40訪問名稱和密碼相同。視頻電話15終端將因此使用場所用戶驗(yàn)證服務(wù)。必須提供使得IT人員能夠?qū)⒁曨l電話15配置為使用這些驗(yàn)證服務(wù)所需要的任何屏幕。識別用戶的替代方法是可用的,例如使用智能卡或ID鏈。不要求用戶在登錄到視頻電話15終端之前已經(jīng)登錄到PC 68上。
多個(gè)用戶可登錄到單個(gè)視頻電話15上,且可提供用于每個(gè)用戶的截然不同傳入響鈴音調(diào)。傳入呼入指示還應(yīng)識別被叫方名稱以及主叫方名稱。如果多個(gè)用戶登錄到單個(gè)視頻電話15上,那么所有呼叫轉(zhuǎn)接功能均專用于呼叫所針對的用戶。
如果用戶已經(jīng)登錄在其PC 68中,登錄到視頻電話15上的動(dòng)作將創(chuàng)建用戶已登錄的PC 68與視頻電話15終端之間的相關(guān)聯(lián)性(倘若這從PC 68得到證實(shí))。用戶能夠同時(shí)登錄到多個(gè)視頻電話15終端。有效視頻電話15是最先應(yīng)答所述用戶的任何呼叫的視頻電話。
主頁屏幕含有在所有屏幕上可見的狀態(tài)區(qū)(除了在全屏模式中)。狀態(tài)包括登錄用戶的名稱——或“無用戶登錄”。用戶的“存在”狀態(tài)、視頻及音頻傳輸?shù)膱D標(biāo)、語音郵件“消息”指示和日期及時(shí)間。
如果在用戶語音郵件系統(tǒng)10上存在沒聽到的語音郵件,那么“消息”指示點(diǎn)亮并閃爍。按壓所述指示符會(huì)引出語音郵件處理屏幕。
觸摸日期時(shí)間區(qū)域允許訪問日歷功能。
主頁具有在所有屏幕上可見的控制欄區(qū)域(除了在全屏模式中)。
控制欄允許直接訪問最頻繁使用的呼叫控制特征且訪問所有其它功能。應(yīng)在按鈕上使用圖標(biāo),但也可使用文本來強(qiáng)調(diào)功能用途。
控制面板還具有對麥克風(fēng)、相機(jī)和揚(yáng)聲器64的全局控件。所述控件應(yīng)清楚指示其操作狀態(tài)(例如,打開或關(guān)閉),且在所述控件處應(yīng)使用可能的圖標(biāo)。
可得到自我圖像,其指示由相機(jī)拍取的圖片和有效呼叫的遠(yuǎn)程端可見的部分。能夠?qū)⒆晕覉D像打開及關(guān)閉,且能夠確定其是一直被打開還是只是在已建立有效通話時(shí)才打開。
能夠在任何時(shí)候(即在呼叫中、不在呼叫中等)在屏幕的主視頻區(qū)中顯示相機(jī)圖像。圖像應(yīng)是針對單個(gè)視頻呼叫的圖像,且應(yīng)覆蓋任何其它存在的視頻。應(yīng)能夠請求所述視頻的全屏版本。可將此認(rèn)為是數(shù)字鏡像,且這允許用戶確保他/她對相機(jī)將要或正在展示的內(nèi)容感到滿意。
出于診斷目的,需要用戶還能看到在編碼和解碼之后的圖像,以使得他知道將在遠(yuǎn)端處看到的圖像的質(zhì)量。如果支持此模式,那么相機(jī)直接圖像和編碼解碼圖像并排。用戶可截取其自身圖像,以用作為與其聯(lián)系人信息相關(guān)聯(lián)的圖像。
將主屏幕的主要部分分配給集成撥號功能。存在四個(gè)主要子功能快速撥號顯示54、目錄訪問顯示54、撥號盤,和對呼叫日志的訪問。撥號盤和對呼叫日志的訪問將占據(jù)不違背方便使用的最小屏幕區(qū)域,從而最大化可用于快速撥號/聯(lián)系人頁面的區(qū)域。首先詳細(xì)說明快速撥號區(qū)域,所有主要子功能的任何共同要求僅在快速撥號部分下詳細(xì)描述且暗示用于其它三個(gè)功能。撥號區(qū)域的功能在于選擇將向其發(fā)出呼叫的用戶。
與撥號屏幕的其它要求一致,快速撥號區(qū)域盡可能地大。大于20個(gè)快速撥號位置是足夠的。每個(gè)位置應(yīng)足夠大,以便在與屏幕相距正常操作距離(例如3英尺)處能非常容易地閱讀存儲在所述位置處的個(gè)人詳細(xì)識別信息。
存儲在快速撥號位置中的用戶信息包含個(gè)人名稱、“存在狀態(tài)”(如果知道的話)、在選擇所述快速撥號時(shí)將被呼叫的號碼和用以指示用戶是否支持視頻呼叫的圖標(biāo)。詳細(xì)信息還存儲視頻電話15的兼容視頻類別,例如,MPEG2、H261等。
所述區(qū)域提供經(jīng)觸摸以起始呼叫的空白區(qū)。如果可用的話,包括個(gè)人的縮略圖。提供一種處理長名稱(即,不能放入分配在快速撥號按鈕上的空間中的名稱)的方法。
具有標(biāo)準(zhǔn)國際格式的常規(guī)電話號碼(即,“+國家代碼區(qū)域代碼號碼”)被自動(dòng)轉(zhuǎn)譯成向此號碼發(fā)出呼叫所需的外部訪問代碼加上國際訪問代碼。
可獲得與快速撥號頁面上的個(gè)人相關(guān)聯(lián)的全部聯(lián)系人詳細(xì)信息。所述聯(lián)系人詳細(xì)信息提供可借以聯(lián)系所述用戶的所有號碼,并提供一種選擇所述號碼中的一者作為快速撥號頁面上使用的默認(rèn)號碼的構(gòu)件。能夠經(jīng)由這一到聯(lián)系人頁面的鏈接而選擇并撥打所述用戶的替代號碼。
用戶信息包括所述個(gè)人的最近期呼叫歷史,例如最近10個(gè)呼叫(傳入錯(cuò)過或傳出)。僅僅提供“最近呼叫”信息將是可接受的最小功能性。
能夠編輯與快速撥號條目相關(guān)聯(lián)的聯(lián)系人詳細(xì)信息,和/或創(chuàng)建用于快速撥號頁面的新聯(lián)系人條目。能夠?qū)l目從聯(lián)系人、目錄或呼叫日志屏幕復(fù)制到快速撥號頁面。能夠?qū)l目從快速撥號頁面復(fù)制到聯(lián)系人或目錄屏幕。能夠刪除快速撥號條目或?qū)⑺鰲l目移動(dòng)到另一聯(lián)系人頁面(即,復(fù)制且接著刪除原始條目)。
能夠控制用戶在快速撥號頁面上的位置。還應(yīng)能夠以某種方式(彩色編碼)區(qū)分不同類別的快速撥號用戶,即商務(wù)、家庭、同事、銷售商,客戶??焖贀芴栱撁嫱瑯涌珊衼碜月?lián)系人信息中多個(gè)其它類別的名稱??墒褂媚撤N形式的自動(dòng)組織,例如姓、名、公司,或先按照類別然后是姓、名、公司等。
能夠?qū)⒁唤M用戶定義為單個(gè)快速撥號條目。如果群組大小受限于最大電話會(huì)議的規(guī)模,那么這是可接受的。能夠從快速撥號頁面中選擇目錄視圖。目錄視圖將占據(jù)與快速撥號頁面相同的屏幕區(qū)域。能夠從視頻電話15可訪問的在線目錄范圍中進(jìn)行選擇。默認(rèn)的將是Outlook和/或Lotus Notes目錄,其含有用戶的主要聯(lián)系人詳細(xì)信息。應(yīng)顯示選定目錄的名稱。
由用戶在其Outlook或Notes聯(lián)系人列表中建立的類別可用作選擇項(xiàng)。如果所述多個(gè)類別不能放入顯示54區(qū)域,那么提供按鈕以向上或向下滾動(dòng)列表。應(yīng)按字母順序組織所述列表。
快速撥號類別是用于填充快速撥號頁面的類別。當(dāng)快速撥號頁面是滿的且不再能向此聯(lián)系人類別添加其它名稱(除非它們?nèi)〈F(xiàn)存條目)時(shí),會(huì)有某種指示。能夠以最近期呼叫的次序來對快速撥號條目進(jìn)行排序,即最少使用的快速撥號條目將位于底部。這將用于判斷哪個(gè)條目是最佳的刪除候選者,以允許鍵入更常用的號碼。
能夠容易地用最少的用戶輸入來從選定類別中尋找和選擇條目。條目選擇機(jī)制必須對于相對較短的列表和非常長的列表(10,000個(gè)名稱)都起作用。所述機(jī)制必須包括鍵入文本串并按其進(jìn)行搜索的能力。能夠依據(jù)姓、名或組織來為展現(xiàn)的數(shù)據(jù)選擇排序次序。存在一種校正條目錯(cuò)誤且快速重新開始整個(gè)搜索的方法。
如果搜索關(guān)鍵字的每個(gè)次序是有意義的且可由用戶改變,那么是理想的。換句話說,舉例來說,按住最左邊的搜索關(guān)鍵字使得用戶能夠選擇按姓、名或公司來搜索(或按擴(kuò)展的屬性列表來搜索。這(例如)對于尋找在特定部門或特定位置處的某人是有用的——“誰在韓國”)。第二關(guān)鍵字接著限定第一關(guān)鍵字搜索,等等。因此,將關(guān)鍵字設(shè)置為公司、姓、名;例如Marconi,那么在Marconi處在多個(gè)姓內(nèi)進(jìn)行按字母次序的用戶搜索。顯然,當(dāng)選擇每個(gè)分類類別時(shí),在所述類別域中存在具有相同值的條目的某種隱式子排序。因此,對于選擇的姓,隱式子次序是名,接著是公司,對于公司,隱式分類次序是姓、名,且對于名,例如為姓、公司。
呼叫日志屏幕顯示三個(gè)呼叫類別(傳出、傳入和錯(cuò)過的呼叫)的最近期條目,同時(shí)具有對哪個(gè)類別被選擇的清楚指示。另外,應(yīng)存在“頻繁”類別,其對任何類型的最近(<200)呼叫依據(jù)使用頻繁度來列出號碼。應(yīng)能從呼叫日志屏幕使用撥號盤。推遲對提供高得多程度的處理呼叫日志數(shù)據(jù)的值的分析。
在最小程度上,當(dāng)觸摸“消息”時(shí),連接到用戶語音郵件系統(tǒng)10,此用戶的語音郵件被輸入,且顯示撥號盤以通過使用常規(guī)電話按鍵來控制語音郵件?!罢Z音郵件”屏幕的較大部分應(yīng)引出用以訪問郵件系統(tǒng)10的每個(gè)特征的按鈕,例如,下一消息、前一消息、播放消息、轉(zhuǎn)發(fā)消息、回復(fù)消息、呼叫發(fā)送者等,同時(shí)所述按鈕具有每個(gè)功能內(nèi)的按鍵的所有等效物,例如開始記錄、停止記錄、檢查記錄、刪除記錄等。所有功能需要在按鈕上,并轉(zhuǎn)換為各自DMF音調(diào)。
需要可從快速撥號或目錄視圖中選擇“轉(zhuǎn)發(fā)到”號碼或需要鍵入一列用戶號碼的任何語音郵件命令,且需要所述選擇僅自動(dòng)插入用戶號碼的恰當(dāng)部分。這可在向群組轉(zhuǎn)發(fā)語音消息中特別有用。使用者能夠在視頻電話15上設(shè)置時(shí)間和日期。通過恰當(dāng)?shù)木W(wǎng)絡(luò)40服務(wù)來自動(dòng)設(shè)置時(shí)間和日期是希望的。
需要與用戶的Outlook/Palm/Notes時(shí)間表/日歷應(yīng)用程序集成的日歷功能性。最小要求將僅僅是按日、星期或月(按照Outlook或Palm屏幕)來查看在任何日期的約會(huì),同時(shí)僅可經(jīng)由Outlook或Palm數(shù)據(jù)庫進(jìn)行改變和添加新條目。
可能相當(dāng)一些用戶將不維持其自身的日歷,且實(shí)際上可能在其桌上沒有PC 68,但確實(shí)需要查看所述信息。觸摸屏幕的狀態(tài)部分的用戶狀態(tài)區(qū)會(huì)允許用戶設(shè)置其狀態(tài)。用戶將具有一系列狀態(tài)選項(xiàng)來進(jìn)行選擇,包括i)有空ii)繁忙——在通話中,其中將不接受另一呼叫iii)勿打擾——不在通話中,但不可被干擾iv)五分鐘后回來v)離開辦公室
vi)休假中視頻電話15終端上的單個(gè)呼叫實(shí)例支持從一個(gè)傳入流到在一次會(huì)議中的最大數(shù)目的流。對于視頻電話,終端將支持至少四個(gè)到其它方的連接作為單個(gè)電話會(huì)議的一部分。可能接受至少兩個(gè)獨(dú)立的僅音頻呼叫,即使存在最大大小的視頻電話會(huì)議也是這樣,以使得音頻呼叫可經(jīng)協(xié)商保持轉(zhuǎn)移。視頻電話15能夠支持至少三個(gè)同時(shí)“呼叫實(shí)例”,即高達(dá)三個(gè)獨(dú)立呼叫。僅一個(gè)呼叫可以是活動(dòng)的,即,呼叫控制一次僅可應(yīng)用于一個(gè)呼叫??山邮芤粋€(gè)以上呼叫(活動(dòng)或不活動(dòng)),即用戶音頻和視頻在每個(gè)被接受呼叫上被傳輸??蓪⑦M(jìn)行中的通話置于保持狀態(tài),此時(shí)用戶音頻和視頻不被傳輸?shù)教幱诒3譅顟B(tài)的用戶且來自所述用戶的音頻和視頻也受到抑制。
在控制顯示54區(qū)域中展示傳入呼叫狀態(tài)。在顯示器54的主要部分中展示呼叫本身和呼叫中控制。
呼叫狀態(tài)為i)傳入呼叫ii)接受且活動(dòng)——用戶的音頻(和視頻,如果為視頻呼叫的話)(受到各種無音控制)連接到此呼叫。呼叫控制應(yīng)用于此呼叫。
iii)接受但不活動(dòng)——如同上述,但呼叫控制不應(yīng)用于此呼叫。
iv)接受且保持——用戶音頻(和視頻,如果為視頻呼叫的話)不被傳輸?shù)酱撕艚小?br>
v)接受且被轉(zhuǎn)移指示每個(gè)呼叫的呼叫狀態(tài)。只有一個(gè)接受呼叫可以是活動(dòng)的。通過觸摸與一個(gè)呼叫相關(guān)聯(lián)的呼叫顯示54區(qū)域或控制面板中的呼叫狀態(tài)來使得所述接受呼叫成為活動(dòng)的。將任何先前活動(dòng)呼叫設(shè)置為不活動(dòng)的。第二次觸摸將關(guān)閉活動(dòng)狀態(tài)。傳入呼叫指示指示了呼叫是否提供視頻連接。沒有指示暗示僅音頻呼叫。傳入呼叫指示將展示與所述傳入呼叫相關(guān)聯(lián)的各方的名稱。此立即展示了用戶是被一對一呼叫還是被邀請加入會(huì)議。
用戶具有以下選項(xiàng)來處理傳入呼叫i)接受所述呼叫作為僅語音呼叫ii)接受所述呼叫作為視頻呼叫(暗示具有語音)iii)發(fā)送到語音郵件可使用設(shè)置來將視頻電話15終端設(shè)置為自動(dòng)應(yīng)答傳入呼叫,其中傳入呼叫的數(shù)目可高達(dá)所支持呼叫的最大數(shù)目。自動(dòng)應(yīng)答生成音頻和視頻連接(如果提供的話)。一旦通話在進(jìn)行中,用戶狀態(tài)便應(yīng)自動(dòng)改變?yōu)椤巴ㄔ捴小?。一旦沒有呼叫是活動(dòng)的,用戶狀態(tài)便將還原到其先前狀態(tài)(通常為“有空”)。
用戶能夠配置是否還分配呼叫用戶數(shù)據(jù)。如果用戶已經(jīng)接受了一個(gè)或一個(gè)以上呼叫,且如果所有呼叫均處于保持狀態(tài)或不活動(dòng)的,那么此呼叫在被接受時(shí)將創(chuàng)建一個(gè)新的呼叫實(shí)例。當(dāng)用戶處理此新呼叫時(shí),所有被接受但不活動(dòng)的呼叫將繼續(xù)看到并聽到所述用戶。如果所述接受呼叫中的一者被接受且為活動(dòng)的,那么所述新呼叫將加入所述通話,且所述通話的所有參與方將與所述新呼叫者組成會(huì)議(如果接受所述呼叫的話)。
如果用戶在(>10)秒之后不接聽,那么將如“無應(yīng)答轉(zhuǎn)接”設(shè)置所確定的那樣對呼叫進(jìn)行自動(dòng)轉(zhuǎn)接。如上述,所述轉(zhuǎn)接特定用于所述呼叫所針對的用戶。如果用戶狀態(tài)被標(biāo)記為“勿打擾”或“繁忙”,或由于存在最大數(shù)目的呼叫正被處理而已設(shè)置了所述“繁忙”狀態(tài),那么如“遇忙轉(zhuǎn)接”和“勿打擾時(shí)轉(zhuǎn)接”設(shè)置所確定的那樣“立即”對所述呼叫進(jìn)行轉(zhuǎn)接(如通過“展示轉(zhuǎn)接呼叫”設(shè)置所修改,如果實(shí)施此功能的話)。
取決于“展示轉(zhuǎn)接呼叫”設(shè)置,用戶可選擇在轉(zhuǎn)接呼叫之前在(>5秒)時(shí)間中看到傳入呼叫指示。(這意味著除非想接聽所述呼叫,用戶不需要采取行動(dòng),而并非上文中對于呼叫所需采取的積極行動(dòng)。)如果繁忙狀態(tài)是由于視頻電話15已經(jīng)處理最大數(shù)目的呼叫的緣故,那么這不會(huì)起作用。
產(chǎn)生與呼叫一起發(fā)送的(非常短的)文本消息的能力是傳達(dá)關(guān)于呼叫重要性和其將花費(fèi)多長時(shí)間的更多信息的有效方式。下文處理與產(chǎn)生消息并將其添加到傳出呼叫相關(guān)聯(lián)的要求。如果存在的話,應(yīng)與傳入呼叫相關(guān)聯(lián)地展示傳入呼叫文本消息。顯示器54同時(shí)應(yīng)付多個(gè)傳入呼叫的文本消息顯示。文本消息還存儲在傳入或錯(cuò)過呼叫日志中。
呼叫參數(shù)協(xié)商受限于在網(wǎng)絡(luò)40政策參數(shù)和當(dāng)前網(wǎng)絡(luò)40使用情況的范圍內(nèi)建立呼叫所需的參數(shù)協(xié)商。提供設(shè)置以允許用戶指定向其它視頻電話15終端呼叫時(shí)使用的偏好,例如總是提供視頻、從不提供視頻、在每次呼叫詢問是否我想要提供視頻。
針對向其他視頻電話15用戶的呼叫,支持呼叫等待有空(Camp on Available)。一旦所述用戶的狀態(tài)改變?yōu)椤坝锌铡?,這便將對所述用戶起始呼叫。如果待被呼叫的用戶是群組,那么僅在所述群組的所有成員“有空”時(shí)才將起始呼叫。
電話會(huì)議是當(dāng)快速撥號或目錄列表中的一個(gè)位置代表一群人(其每一者將是通話的參與者)時(shí)的情況。實(shí)施此特征的建議過程是輪流且一旦主動(dòng)請求確認(rèn)了應(yīng)將所述呼叫添加到會(huì)議時(shí)發(fā)出每個(gè)呼叫。這在呼叫轉(zhuǎn)至語音郵件的情況下提供了逸出路線。一旦完成關(guān)于第一呼叫者的行動(dòng)(即,在通話中或拒絕),便處理下一個(gè)號碼。
有可能創(chuàng)建半雙工的傳出呼叫,換句話說,其請求來自被叫方的音頻和/或視頻,但不在此類型的呼叫上傳輸任一者。這是拉模式。同樣地,能夠創(chuàng)建推模式,其中傳出呼叫發(fā)送音頻和/或視頻,但不要求返回任何音頻或視頻。此模式可用于選擇性地將內(nèi)容廣播到未被注意的終端或用戶僅在會(huì)議中起被動(dòng)角色的終端。
獨(dú)立調(diào)節(jié)揚(yáng)聲器64、手持話機(jī)和耳機(jī)的總音量。可打開和關(guān)閉揚(yáng)聲器。關(guān)閉揚(yáng)聲器還將關(guān)閉麥克風(fēng)。狀態(tài)指示符展示揚(yáng)聲器和麥克風(fēng)的狀態(tài)。
麥克風(fēng)可被關(guān)閉且再次打開。狀態(tài)指示符展示麥克風(fēng)無聲的狀態(tài)。
相機(jī)可被關(guān)閉且再次打開。狀態(tài)指示符展示相機(jī)無聲的狀態(tài)。
在呼叫中,控制僅對活動(dòng)呼叫起作用。如果某個(gè)呼叫是不活動(dòng)的,那么通過觸摸控制面板中的呼叫進(jìn)行狀態(tài)指示符或呼叫顯示54區(qū)域中除特定通話控制功能區(qū)域的任何地方,可使所述呼叫成為活動(dòng)的。任何其它當(dāng)前活動(dòng)呼叫被轉(zhuǎn)換為不活動(dòng)的??赏ㄟ^隨后按壓相同區(qū)域來將活動(dòng)呼叫轉(zhuǎn)變?yōu)椴换顒?dòng)。提供控制,其掛斷所述活動(dòng)呼叫。在電話會(huì)議中,其清除通話實(shí)例的所有要素。
呼叫必須被接受且為活動(dòng)的以使得會(huì)議控制起作用。觸摸會(huì)議控制將使當(dāng)前活動(dòng)呼叫實(shí)例加入下一變?yōu)榛顒?dòng)的呼叫。會(huì)議控制將指示其是活動(dòng)的,直到其再次被按壓,使得其為不活動(dòng)的,或使得另一呼叫實(shí)例為活動(dòng)的為止。在當(dāng)前活動(dòng)通話中的所有呼叫加入會(huì)議通話實(shí)例之后,所述通話成為單個(gè)會(huì)議通話且發(fā)出會(huì)議控制有效指示。只是作為再次陳述,會(huì)議選擇其它呼叫將加入的呼叫并接著選擇所述呼叫來加入那個(gè)呼叫。
終止一方對電話會(huì)議的加入的方法是讓那個(gè)方掛斷。出于各種原因,用戶可能希望能對通話實(shí)例的每個(gè)部分進(jìn)行獨(dú)立控制。這可由去會(huì)議(de-conference)能力實(shí)現(xiàn)。舉例來說,通過在三秒以上時(shí)間中觸摸所述通話實(shí)例,出現(xiàn)子菜單,其允許識別通話實(shí)例的個(gè)別成員并對其進(jìn)行選擇以進(jìn)行去會(huì)議。接著從會(huì)議中移除此呼叫,且將其建立為單獨(dú)的通話實(shí)例,其中所有正??刂贫歼m用,特別是其可被清除。
轉(zhuǎn)移功能轉(zhuǎn)移活動(dòng)呼叫。當(dāng)觸摸轉(zhuǎn)移控制時(shí),顯示集成撥號屏幕且將活動(dòng)呼叫置于保持狀態(tài),但指示其參與通話操作。轉(zhuǎn)移控制指示其為活動(dòng)的,直到其被第二次按壓而取消轉(zhuǎn)移為止,或直到用戶選擇并按壓撥打他想要向其轉(zhuǎn)移呼叫的號碼為止。
一旦已起始了傳出呼叫,轉(zhuǎn)移控制便指示狀態(tài)改變,以使得觸摸所述控制造成“盲目”轉(zhuǎn)移,且將所述通話實(shí)例從屏幕中移除?;蛘?,用戶可進(jìn)行等待,直到被叫號碼應(yīng)答為止,此時(shí)創(chuàng)建新的通話實(shí)例,從而允許用戶向被叫方講話,且轉(zhuǎn)移功能再次改變狀態(tài),以指示再次對其按壓將完成轉(zhuǎn)移并終止兩個(gè)呼叫。否則,要求返回以對正被轉(zhuǎn)移的呼叫者講話,且重新開始轉(zhuǎn)移過程或終止呼叫。轉(zhuǎn)移是“管理員”借以設(shè)定呼叫且接著將其轉(zhuǎn)移到“上司”的主要機(jī)制。在此情況下,管理員不能夠繼續(xù)“收聽”所轉(zhuǎn)移的呼叫是基本的。這在安全環(huán)境下將是特別正確的。
可通過觸摸保持控件來將活動(dòng)呼叫置于保持狀態(tài)。在保持狀態(tài)下,暫停傳出視頻和音頻流,且向遠(yuǎn)程端提供其處于保持狀態(tài)的指示。不再顯示傳入音頻和視頻流。在控制欄上,在呼叫狀態(tài)顯示54中指示所述保持狀態(tài)。如果任何呼叫處于保持狀態(tài),那么保持控件指示保持是活動(dòng)的。在活動(dòng)呼叫處于保持狀態(tài)時(shí)再次按壓保持(HOLD)會(huì)解除保持狀態(tài)且將所述呼叫返回到顯示的狀態(tài)。
在主控制面板上存在控件,其引出主屏幕且提供對所有其它非呼叫功能的訪問。存在指示已選擇了Main的指示。第二次按壓Main會(huì)重新建立當(dāng)前呼叫顯示且接觸選擇Main。向通話內(nèi)的每個(gè)被接受和被顯示方和每個(gè)顯示的呼叫提供單獨(dú)控制。需要對來自每個(gè)特定用戶的音頻的音量進(jìn)行調(diào)節(jié)。能夠個(gè)別地消除屏幕上顯示的每個(gè)用戶的音頻和/或視頻的聲音。存在狀態(tài)指示符來指示音頻或視頻無聲是否是打開的。
如果可在任何一個(gè)時(shí)間顯示一個(gè)以上通話實(shí)例,例如與兩個(gè)其他用戶的電話會(huì)議加上對一個(gè)其他用戶的新呼叫,那么有可能消除整個(gè)通話實(shí)例的音頻和/或視頻的聲音,例如消除兩方會(huì)議的音頻,且同時(shí)對所述第二呼叫說話。
提供了對在能支持視頻的僅音頻連接上的視頻的請求。提供對視頻請求的接受或拒絕。如果同意連接,那么建立視頻連接。設(shè)置頁面項(xiàng)目使得用戶能夠總是接受或總是拒絕視頻請求。
能夠顯示每個(gè)連接的載體通道參數(shù),即視頻(如果存在的話)和音頻的傳入和傳出編碼率。在通話中,控制僅對活動(dòng)呼叫起作用。如果被接受呼叫是不活動(dòng)的,那么使得所述呼叫成為活動(dòng)的。
能夠針對任何用戶啟用“載體通道質(zhì)量監(jiān)視器”。此監(jiān)視器(有點(diǎn)像手機(jī)上的信號強(qiáng)度計(jì))將(例如)當(dāng)在音頻和視頻通道上不存在錯(cuò)誤或丟失包時(shí)展示100%綠條,一旦損失率或等待時(shí)間超過預(yù)定比率則展示黃條,且一旦超過更高比率則展示紅條。時(shí)間積分應(yīng)為短的,例如50毫秒,因?yàn)榇藭r(shí)間范圍中的錯(cuò)誤將影響用戶視頻。因而,舉例來說,如果接收者看到視頻假象,但同時(shí)看到監(jiān)視器條變?yōu)辄S或紅色,他就知道這是網(wǎng)絡(luò)40擁擠引發(fā)的。
提供了對呼叫內(nèi)視頻編碼參數(shù)的變化(即增加或減少編碼速率)的請求。提供對此請求的接受或拒絕和改變傳出視頻速率的方法。視頻電話15對于所有參與者產(chǎn)生單個(gè)傳出編碼速率。它有可能接受所有傳入流上的不同傳入速率。
提供了對具有接受或拒絕請求的能力的側(cè)條的請求。如果接受的話,側(cè)條關(guān)閉從兩個(gè)參與者到其他每一者的音頻流,所以他們能進(jìn)行私人交談,且同時(shí)繼續(xù)聽到所有討論并繼續(xù)看到所有參與者且由所有參與者看到。提供了雙向發(fā)送具有視頻和側(cè)條請求的短消息的能力。
不管呼叫是傳入呼叫還是傳出呼叫,到視頻視圖的屏幕過渡應(yīng)當(dāng)是平滑的。音頻可搶先于視頻。視頻可直到此過渡完成時(shí)才被顯示。(即,不應(yīng)在向視頻過渡的過程中,不應(yīng)存在任何跳躍圖片、半成形幀等。)向用戶顯示54視頻屏幕的過渡應(yīng)僅在通話“進(jìn)行中”之后且不在起始呼叫時(shí)開始。來自用戶的視頻的顯示應(yīng)最大限度地使用分配給用戶顯示器54的顯示器54區(qū)域。一個(gè)顯示54中控件能夠?qū)⒋藛瓮ㄔ拰?shí)例單用戶顯示54轉(zhuǎn)換為全屏顯示54。觸摸“全屏”顯示54內(nèi)的任何地方將返回到標(biāo)準(zhǔn)顯示54。除了已經(jīng)提到的通話中控制之外,還應(yīng)顯示用戶名稱。顯示器54和控制面板上的通話實(shí)例必須指示呼叫是否為活動(dòng)的,即通話一般控制是否起作用。當(dāng)一個(gè)通話實(shí)例準(zhǔn)備好時(shí),通過按壓通話實(shí)例或主顯示54上除通話專用控制區(qū)域之外的任何地方來選擇活動(dòng)/不活動(dòng)。
從一個(gè)通話實(shí)例(兩方呼叫)的過渡應(yīng)當(dāng)是平滑的,且應(yīng)當(dāng)一旦第二呼叫在“進(jìn)行中”就被起始。顯示54應(yīng)最大限度地使用分配給用戶顯示54的顯示器54區(qū)域。如果必要的話,可在每個(gè)邊緣處對視頻進(jìn)行裁剪而并非縮放,以適合可用區(qū)域。不要求用于兩個(gè)或兩個(gè)以上準(zhǔn)備好的通話的全屏顯示54。除了已經(jīng)提到的通話控制之外,應(yīng)針對每一方顯示用戶名稱。必須存在關(guān)于雙方是單個(gè)通話實(shí)例的一部分的指示。顯示54和控制面板上的通話實(shí)例必須指示呼叫是否為活動(dòng)的。當(dāng)更多方添加到視頻通話中時(shí),可對傳入視頻進(jìn)行逐漸裁剪以適合可用顯示54區(qū)域。
在兩個(gè)通話實(shí)例(兩者均為單方呼叫)中,存在向單個(gè)用戶的兩個(gè)單獨(dú)呼叫,所述呼叫兩者均被顯示。屏幕上顯示54和呼叫控制指示清楚地指示這些是兩個(gè)單獨(dú)且獨(dú)立的呼叫,其還指示哪個(gè)是活動(dòng)的(如果有的話)。如果將任一呼叫置于保持狀態(tài),那么不再顯示那個(gè)呼叫,且顯示54返回到單通話實(shí)例單呼叫顯示54。
除顯示上文描述的那些之外,用戶區(qū)域應(yīng)當(dāng)還能夠顯示以下組合中的任一者。
四個(gè)通話實(shí)例,其每一者均為單方呼叫;三個(gè)通話實(shí)例,其中一個(gè)呼叫可為兩方,且其它呼叫為單方呼叫。
兩個(gè)通話實(shí)例,其中一個(gè)通話實(shí)例可高達(dá)三方或兩個(gè)通話實(shí)例可為兩方呼叫。
對“CNN”風(fēng)格顯示54的要求是以上單通話實(shí)例單呼叫的那些要求,包括具有全屏顯示54的能力。還能夠在半個(gè)屏幕中顯示“CNN”風(fēng)格呼叫,且將另外半個(gè)屏幕用于一個(gè)或兩個(gè)用戶顯示器區(qū)域,后者顯示為兩個(gè)獨(dú)立通話實(shí)例或單個(gè)兩方通話實(shí)例。
提供了為語音和數(shù)據(jù)流提供各種等級的加密的能力。對診斷、測試、測量和管理工具的訪問應(yīng)使用SMF(簡單管理框架),換句話說,將可能以三種方式(經(jīng)由SNMP、經(jīng)由網(wǎng)絡(luò)和經(jīng)由操作接口(craft interface))來訪問所有工具。視頻電話15終端必須是可遠(yuǎn)程管理的,對于每天操作或?qū)τ谶M(jìn)行錯(cuò)誤修復(fù)的軟件升級來說不需要任何現(xiàn)場IT專門技術(shù)。故障診斷也是可遠(yuǎn)端進(jìn)行的,且能夠確定問題是在單元硬件、單元配置、單元軟件、網(wǎng)絡(luò)40還是網(wǎng)絡(luò)40服務(wù)。管理可采用IP連接性,但必須采用到視頻電話15的相對較低帶寬連接。
在正常操作下,視頻電話15應(yīng)在加電時(shí)執(zhí)行硬件系統(tǒng)10測試的縮短版本。如果這失敗了,那么視頻電話15應(yīng)在主屏幕上顯示啟動(dòng)失敗消息??善仁菇K端進(jìn)入擴(kuò)展的硬件診斷模式。這可通過在單元加電時(shí)將鍵盤附接到USP端口或通過按壓觸摸屏74的右上角來進(jìn)行。此模式將允許訪問底層操作系統(tǒng)10和更強(qiáng)大的診斷功能,以確定是否存在硬件故障。
可包括一系列簡單測試,在視頻電話15通過啟動(dòng)測試但不為用戶提供正確功能性的情況下,用戶可運(yùn)行所述測試。終端提供技術(shù)接口,其結(jié)合本地鍵盤(和鼠標(biāo))以輔助診斷單元或系統(tǒng)10的問題。這將允許進(jìn)行對音頻和視頻等的各種診斷。
能夠在遠(yuǎn)程控制下安全地下載視頻電話15終端軟件的新版本。“安全地”意味著在所下載版本中發(fā)生故障時(shí)能夠返回到先前版本,而無需本地干涉(即,某人必須安裝CD)。能夠經(jīng)由管理接口讀取特定視頻電話15終端上的軟件的軟件版本編號以及單元硬件序列號、組件版本號和序列號以及主要子組件的組件版本號。在系統(tǒng)10崩潰的情況下,視頻電話15應(yīng)當(dāng)存儲或已經(jīng)存儲用以輔助診斷所述崩潰原因的信息。一旦視頻電話15已重新啟動(dòng),必須可從遠(yuǎn)程場所在線檢索此信息以供分析。
在受到可分配給此特征的存儲空間的限制下,視頻電話15從加電開始保持所有動(dòng)作、事件和狀態(tài)改變的運(yùn)行日志。應(yīng)使得能夠存儲至少一個(gè)月長的活動(dòng)。此數(shù)據(jù)可能需要屬于許多類別,例如含有用戶數(shù)據(jù)的安全類別(例如所呼叫的號碼將僅可由進(jìn)行呼叫的用戶披露)。一般數(shù)據(jù),例如呼叫數(shù)目、呼叫狀態(tài)(即,通話實(shí)例數(shù)目和每個(gè)實(shí)例的端點(diǎn))、編碼器36和解碼器34特征、載體通道錯(cuò)誤報(bào)告等不是如此敏感的信息。能夠記錄每次按鍵以作為幫助診斷系統(tǒng)10級別問題和重建事件鏈的方式可能是有幫助的。
視頻電話15能夠以IP級別和SIP級別兩者將控制平面級別的交換復(fù)制到遠(yuǎn)程診斷終端(將線路監(jiān)視器遠(yuǎn)程連接到視頻電話15終端的等效物)。終端管理將監(jiān)視許多參數(shù),例如網(wǎng)絡(luò)40質(zhì)量。必須能夠設(shè)置閾值且在超出那些閾值時(shí)產(chǎn)生警報(bào)。ATM接口和以太網(wǎng)接口兩者均具有標(biāo)準(zhǔn)測量(例如,類似遠(yuǎn)程監(jiān)控),其應(yīng)可供視頻電話15使用。視頻電話15應(yīng)能夠?qū)⒛切┚瘓?bào)發(fā)送到一個(gè)或一個(gè)以上網(wǎng)絡(luò)管理系統(tǒng)。
音頻混合器就音頻混合器而言,可產(chǎn)生音頻流和視頻流且作為具有服務(wù)質(zhì)量能力的ATM網(wǎng)絡(luò)的一部分的第一節(jié)點(diǎn)80希望與第二節(jié)點(diǎn)82形成點(diǎn)對點(diǎn)呼叫。第二節(jié)點(diǎn)82僅具有音頻能力,且為(例如)PSTN電話。第二節(jié)點(diǎn)82不是ATM網(wǎng)絡(luò)的一部分。
第一節(jié)點(diǎn)80通過向SIP服務(wù)器(其也是ATM網(wǎng)絡(luò)的一部分)發(fā)送信令消息來開始形成到第二節(jié)點(diǎn)82的呼叫,所述信息向服務(wù)器識別第二節(jié)點(diǎn)82是第一節(jié)點(diǎn)80正起始的呼叫的目的地。服務(wù)器已經(jīng)具有關(guān)于第二節(jié)點(diǎn)82的地址信息,將所述地址信息添加到從第一節(jié)點(diǎn)80接收到的信令信息,且將信令消息與第二節(jié)點(diǎn)82的地址信息傳輸?shù)揭纛l混合器20,所述音頻混合器20也是ATM網(wǎng)絡(luò)的一部分。
當(dāng)混合器20接收發(fā)源于第一節(jié)點(diǎn)80的信令信息時(shí),其根據(jù)此信息確定第一節(jié)點(diǎn)80希望與第二節(jié)點(diǎn)82形成連接?;旌掀?0接著向第二節(jié)點(diǎn)82發(fā)送邀請,通過所述邀請以某種方式進(jìn)行通信,例如通過T1線或以太網(wǎng)但并非借助于ATM網(wǎng)絡(luò),以在其特征和數(shù)據(jù)需要以之提供給它的形式(以便它可理解所述數(shù)據(jù))方面對其自身進(jìn)行識別。作為響應(yīng),第二節(jié)點(diǎn)82向混合器20識別數(shù)據(jù)必須采用以使得第二節(jié)點(diǎn)82能理解所述數(shù)據(jù)的特定形式,且還向混合器20指示可以向其發(fā)送數(shù)據(jù),因而可形成連接。
混合器20接著向第一節(jié)點(diǎn)80發(fā)送信號,指示其已經(jīng)準(zhǔn)備好形成連接。對于第一節(jié)點(diǎn)80,混合器20(其為ATM網(wǎng)絡(luò)的一部分)代表第二節(jié)點(diǎn)82,且給予第一節(jié)點(diǎn)80這樣的印象第二節(jié)點(diǎn)82是ATM網(wǎng)絡(luò)的一部分且類似于第一節(jié)點(diǎn)80。對于第二節(jié)點(diǎn)82,混合器20(其也是第二節(jié)點(diǎn)82所屬的網(wǎng)絡(luò)或連接性的一部分)代表第一節(jié)點(diǎn)80,且給予第二節(jié)點(diǎn)82這樣的印象第一節(jié)點(diǎn)80是第二節(jié)點(diǎn)82所屬的相同網(wǎng)絡(luò)或連接性的一部分,且類似于第二節(jié)點(diǎn)82。
第一節(jié)點(diǎn)80接著起始數(shù)據(jù)(包括音頻數(shù)據(jù))以及單播數(shù)據(jù)包到混合器20的流動(dòng),如此項(xiàng)技術(shù)中眾所周知。當(dāng)混合器20接收到所述包時(shí),其緩沖所述包中的數(shù)據(jù),如此項(xiàng)技術(shù)中眾所周知,從而對于以第二節(jié)點(diǎn)82為目的地的來自第一節(jié)點(diǎn)80的包來說有效地終止連接。早先已通過發(fā)送到第二節(jié)點(diǎn)82的邀請而被告知數(shù)據(jù)需要采用以使得第二節(jié)點(diǎn)82可理解所述數(shù)據(jù)的形式的混合器20將所緩沖的數(shù)據(jù)置于必需的格式中,且接著在恰當(dāng)?shù)臅r(shí)間限制下,在從混合器20到第一節(jié)點(diǎn)80的新的且單獨(dú)連接中有效地發(fā)送經(jīng)恰當(dāng)重新格式化的數(shù)據(jù)。以此方式,形成點(diǎn)對點(diǎn)呼叫,盡管其實(shí)際上包含兩個(gè)不同的連接,且第一節(jié)點(diǎn)80和第二節(jié)點(diǎn)82都不會(huì)意識到利用兩個(gè)連接來在第一節(jié)點(diǎn)80與第二節(jié)點(diǎn)82之間創(chuàng)建所需的點(diǎn)對點(diǎn)呼叫。類似地,當(dāng)數(shù)據(jù)從第二節(jié)點(diǎn)82發(fā)送回第一節(jié)點(diǎn)80時(shí),重復(fù)所述過程(盡管以相反順序),使得在由混合器20接收到來自第二節(jié)點(diǎn)82的數(shù)據(jù)之后,混合器20將數(shù)據(jù)重新格式化為第一節(jié)點(diǎn)80可理解的形式,且將來自第二節(jié)點(diǎn)82的數(shù)據(jù)(所述數(shù)據(jù)已在混合器20中緩沖)單播到第一節(jié)點(diǎn)80。如果使用IP而并非ATM,那么混合器20將單播IP包發(fā)送到第一節(jié)點(diǎn)80,如此項(xiàng)技術(shù)中眾所周知。
現(xiàn)將使用本發(fā)明來描述涉及會(huì)議的場景(還稱為點(diǎn)對多點(diǎn)點(diǎn)對多點(diǎn)連接)。繼續(xù)上文涉及點(diǎn)對點(diǎn)連接的討論,第一節(jié)點(diǎn)80希望在所述連接中加入作為ATM網(wǎng)絡(luò)的一部分且具有與第一節(jié)點(diǎn)80基本上相同的特征的第三節(jié)點(diǎn)84以形成會(huì)議。第一節(jié)點(diǎn)80向?qū)⒅鞒謺?huì)議的主機(jī)節(jié)點(diǎn)22發(fā)送信令邀請。主機(jī)節(jié)點(diǎn)22可以是第一節(jié)點(diǎn)80或其可以是不同的節(jié)點(diǎn)。第一節(jié)點(diǎn)80與主機(jī)節(jié)點(diǎn)22通過服務(wù)器進(jìn)行通信以形成會(huì)議,且使第三節(jié)點(diǎn)84加入所述會(huì)議。出于信令目的,主機(jī)節(jié)點(diǎn)22邀請且與混合器20形成連接,并導(dǎo)致終止第一節(jié)點(diǎn)80與混合器20之間的原始信令連接。響應(yīng)于來自第一節(jié)點(diǎn)80的關(guān)于使第三節(jié)點(diǎn)84加入連接的請求,主機(jī)節(jié)點(diǎn)22還邀請并與第三節(jié)點(diǎn)84形成連接。在作為ATM網(wǎng)絡(luò)的一部分的節(jié)點(diǎn)將加入到連接中的每種情況下,信令通過服務(wù)器且被恰當(dāng)路由,如此項(xiàng)技術(shù)中眾所周知。主機(jī)節(jié)點(diǎn)22充當(dāng)ATM網(wǎng)絡(luò)中的會(huì)議連接的典型的主機(jī)節(jié)點(diǎn)?;旌掀?0代表不是ATM網(wǎng)絡(luò)的一部分但將成為整個(gè)會(huì)議連接的一部分的任何節(jié)點(diǎn)。
就ATM網(wǎng)絡(luò)上的任何節(jié)點(diǎn)來說,混合器20使得作為連接的一部分但不是ATM網(wǎng)絡(luò)的一部分的任何節(jié)點(diǎn)看起來似乎它們與ATM網(wǎng)絡(luò)上的其它節(jié)點(diǎn)一樣。通過信令連接,其中所述信令連接形成在主機(jī)與混合器20之間及混合器20與第二節(jié)點(diǎn)82(由混合器20代表)之間,將來自連接的所有節(jié)點(diǎn)的所需信息提供給所述節(jié)點(diǎn)中的每一者,以使得它們能夠理解所述連接的所有其它節(jié)點(diǎn)并與之進(jìn)行通信。事實(shí)上,主機(jī)節(jié)點(diǎn)22不僅通知所有其它節(jié)點(diǎn)關(guān)于其它節(jié)點(diǎn)的特征的信息,而且向所述節(jié)點(diǎn)返回它們最初向主機(jī)節(jié)點(diǎn)22提供的信息,使得基本上每個(gè)節(jié)點(diǎn)均取回其自己的信息。一旦分配此信息,便如同任何典型會(huì)議情形中通常將出現(xiàn)的那樣,執(zhí)行所述流信息。在ATM網(wǎng)絡(luò)情形中,第一節(jié)點(diǎn)80和第三節(jié)點(diǎn)84將使用PMP樹來以包形式將信息ATM多播到彼此且ATM多播到混合器20。在IP環(huán)境中,第一節(jié)點(diǎn)80和第三節(jié)點(diǎn)84將把包IP多播到網(wǎng)絡(luò)中的所有節(jié)點(diǎn)(混合器20為用于此目的的節(jié)點(diǎn)),且只有作為連接一部分的那些節(jié)點(diǎn)將理解并利用作為連接一部分的特定包信息。
混合器20接收來自第一節(jié)點(diǎn)80和第三節(jié)點(diǎn)84的包,且對它們進(jìn)行緩沖,如上文所述。根據(jù)所屬領(lǐng)域的技術(shù)人員熟知的標(biāo)準(zhǔn)算法,由混合器20接收到的來自不同節(jié)點(diǎn)的包在被接收并混合或相加在一起時(shí)被重新格式化。在預(yù)定時(shí)間,如此項(xiàng)技術(shù)中眾所周知,由混合器20重新格式化的數(shù)據(jù)接著被傳輸?shù)降诙?jié)點(diǎn)82。以相同方式,但只是以相反順序,由混合器20接收到來自第二節(jié)點(diǎn)82的數(shù)據(jù)并進(jìn)行緩沖。接著,以重新格式化的形式將其多播到第一節(jié)點(diǎn)80和第三節(jié)點(diǎn)84。
當(dāng)?shù)谒墓?jié)點(diǎn)(其僅具有音頻能力,如同第二節(jié)點(diǎn)82且不是ATM網(wǎng)絡(luò)的一部分)加入到所述會(huì)議時(shí),主機(jī)節(jié)點(diǎn)22與混合器20形成第二信令連接?;旌掀?0又與第四節(jié)點(diǎn)形成不同連接,所述連接與混合器20已與第二節(jié)點(diǎn)82形成的連接分離?;旌掀?0維持其正支持的會(huì)話的列表。在涉及主題會(huì)議的會(huì)話中,其識別通過混合器20的兩個(gè)交叉連接。第一交叉連接是通過從主機(jī)節(jié)點(diǎn)22到第二節(jié)點(diǎn)82的信令連接,且第二交叉連接是從主機(jī)節(jié)點(diǎn)22到第四節(jié)點(diǎn)。以此方式,第一和第三節(jié)點(diǎn)80、84以及主機(jī)節(jié)點(diǎn)22相信,存在它們與之進(jìn)行通信的兩個(gè)單獨(dú)節(jié)點(diǎn),其代表第二節(jié)點(diǎn)82和第四節(jié)點(diǎn)。事實(shí)上,混合器20代表第二節(jié)點(diǎn)82和第四節(jié)點(diǎn),且分別向第一節(jié)點(diǎn)80和第三節(jié)點(diǎn)84多播來自第二節(jié)點(diǎn)82和第四節(jié)點(diǎn)中每一者的數(shù)據(jù)以維持此錯(cuò)覺以及維持第二節(jié)點(diǎn)82和第四節(jié)點(diǎn)與第一節(jié)點(diǎn)80和第三節(jié)點(diǎn)80相像的錯(cuò)覺。
ViPr系統(tǒng)是高度先進(jìn)的視頻會(huì)議系統(tǒng),其提供的“虛擬存在”會(huì)議質(zhì)量遠(yuǎn)遠(yuǎn)超過當(dāng)今市場上任何舊式視頻會(huì)議系統(tǒng)的能力。所述ViPr系統(tǒng)依賴于點(diǎn)對多點(diǎn)點(diǎn)對多點(diǎn)SVC(PMP-SVC)和IP多播來在會(huì)議參與者間建立點(diǎn)對多點(diǎn)點(diǎn)對多點(diǎn)音頻/視頻媒體流。盡管參與ViPr會(huì)議的用戶享受到空前的音頻和視頻質(zhì)量,但需要使得其它非ViPr用戶能夠加入ViPr會(huì)議。系統(tǒng)10使得單播僅語音電話呼叫(即,PSTN、移動(dòng)電話和SIP電話)能夠添加到多方ViPr會(huì)議。
當(dāng)前ViPr系統(tǒng)通過基于SIP的模擬和數(shù)字電話網(wǎng)關(guān)來提供對電話系統(tǒng)的支持。此功能性使得ViPr用戶能夠向電話用戶發(fā)出點(diǎn)對點(diǎn)呼叫/從電話用戶接收點(diǎn)對點(diǎn)呼叫。然而,它們不允許ViPr用戶向ViPr會(huì)議添加電話呼叫。這是由于電話呼叫的單播本質(zhì)和電話網(wǎng)關(guān)不能將電話流轉(zhuǎn)換為PMP/多播流引起的。ViPr UAM將通過使得ViPr用戶能夠向ViPr會(huì)議添加單播電話呼叫來增強(qiáng)ViPr系統(tǒng)對電話的支持。
為了支持此功能性,ViPr UAM通過以下方式來添加ViPr終端與電話用戶(即,PSTN、移動(dòng)電話和SIP電話)之間的無縫會(huì)議功能性將上游單播電話音頻流轉(zhuǎn)換為點(diǎn)對多點(diǎn)點(diǎn)對多點(diǎn)音頻流(即,PMP-SVC或IP多播),且將下游PMP/多播ViPr音頻流混合/轉(zhuǎn)換為單播電話音頻流,以及執(zhí)行ViPr音頻從寬帶16位/16KHz PCM編碼到G.711或G.722的下游音頻代碼轉(zhuǎn)換。
由UAM提供的額外功能性是將IP/UDP音頻流轉(zhuǎn)換為ATM SVC音頻流且反之亦然的中間體網(wǎng)關(guān)的功能性。此功能性使得部署在ATM環(huán)境下的ViPr系統(tǒng)與以太網(wǎng)網(wǎng)絡(luò)上的基于SIP的IP語音(VoIP)電話網(wǎng)關(guān)之間的互用性成為可能。
UAM允許一個(gè)或一個(gè)以上ViPr電話與一個(gè)或一個(gè)以上電話網(wǎng)關(guān)一起工作。
UAM將支持以下列配置存在的具有單播音頻裝置的ViPr電話會(huì)議 類型1支持僅具有一個(gè)作為參與者存在的音頻單播裝置的一個(gè)電話會(huì)議。
類型2支持多個(gè)電話會(huì)議。每個(gè)電話會(huì)議可能具有多個(gè)作為參與者存在的音頻單播裝置。
類型3支持多個(gè)電話會(huì)議,其中每個(gè)電話會(huì)議恰好具有一個(gè)作為參與者存在的音頻單播裝置。
優(yōu)選地,20個(gè)參與者(單播裝置加上ViPr電話)可由單個(gè)單播管理器應(yīng)用程序服務(wù)。
單播裝置將用于圖1所示的配置中。
如圖1所示,達(dá)到單播裝置和從單播裝置到ViPr的所有呼叫總是被發(fā)送到UAM。UAM實(shí)施B2B SIP UA來將單播裝置連接到ViPr。
實(shí)例位于POTS1處的用戶A呼叫位于ViPr V1處的用戶B。發(fā)生以下事件序列1.UD1(Mediatrics或任何單播裝置)接收來自User_A的連接到User_B的請求。
2.UD1向UAM發(fā)送邀請。邀請中的To字段或顯示器名稱識別所述呼叫是針對User_B的。
3.UAM接收邀請作為傳入呼叫C1。
4.UAM從C1上的邀請?zhí)崛ser_B的sip地址,且通過向V1發(fā)送邀請來向此用戶起始呼叫C2。
5.UAM還將C1交叉連接到C2。
6.V1看到來自UAM的傳入邀請,其由SDP識別為ViPr類別裝置。因此,V1上的軟件知道對等軟件能夠支持ViPr裝置預(yù)期具有的所有功能性(包括替換/查閱等)。
7.例如位于V1處的User_B向邀請回復(fù)OK。
8.UAM將連接C2標(biāo)記為準(zhǔn)備好的。其接著在C1上發(fā)送OK。
此實(shí)例中的媒體流以下列方式中的任一者發(fā)送V1與UD1之間的媒體流
1.將媒體直接從V1發(fā)送到UD1。這可通過UAM寫入正確SDP來進(jìn)行。因此,當(dāng)向V1發(fā)送邀請時(shí),其放入U(xiǎn)D1的IP地址、端口以用于接收。并且,當(dāng)向UD1發(fā)送OK時(shí),其放入V1的IP地址、端口作為接收地址。
2.媒體由UAM進(jìn)行轉(zhuǎn)繼。在此情況下,UAM將數(shù)據(jù)從V1轉(zhuǎn)繼到UD1,且反之亦然。容易看到,如果UAM和ViPr通信經(jīng)由ATM云來連接,那么可設(shè)定V1與UAM之間的SVC。因此,UAM充當(dāng)ATM到以太網(wǎng)的網(wǎng)關(guān)以用于媒體流量。
進(jìn)一步擴(kuò)展實(shí)例1,User_A決定將位于V2處的User_B加入到會(huì)議中。發(fā)生下列事件1.UAM與V1之間的Sip連接由具有V1、V2和UAM作為參與者的電話會(huì)議C3取代。因此,B2B UA現(xiàn)正將電話會(huì)議(C3)與單播呼叫(C1)交叉連接。
2.UAM一直在C3與C4之間轉(zhuǎn)繼流量。上文選項(xiàng)11。其混合來自V1和V2的流量,并將其轉(zhuǎn)繼到UD1。其還將來自UD1的流量多播到V1和V2。
可將由UAM執(zhí)行的功能性分成以下部份 SIP B2B UA單元[SBU]。此單元執(zhí)行實(shí)施B2B SIP UA所需的sip信令。
媒體交叉連接和混合器[MCMU]。
將通過三個(gè)過程來決定UAM功能性SBU、單播混合器管理器和Sip堆棧,如圖2所示。
Sip服務(wù)器過程將實(shí)施SIP功能性,且將向SBU提供提取的信令A(yù)PI(接口Ia)。接口Ia也保持不改變。
SBU實(shí)施呼叫控制和膠合邏輯以用于實(shí)施B2B UA。此單元得自呼叫管理器/Vupper編碼基數(shù)。SBU還負(fù)責(zé)設(shè)定正確混合器流。出于此目的,SBU通過RPC而與UMM過程介接。
UMM實(shí)施用于交叉連接媒體流的功能性以及實(shí)施音頻混合功能性。
SBU實(shí)施呼叫控制和膠合邏輯以用于實(shí)施B2B UA。SBU還負(fù)責(zé)設(shè)定正確混合器流。出于此目的,SBU通過RPC而與UMM過程介接。
會(huì)話Class MediaSession{int SelfID//自身IDCVStringGUID//電話會(huì)議IDCVList XIDList; //交叉連接列表
GUID}SIP B2B交叉連接Class SIPB2BCrossConnect{int SelfID//自身IDint SessionID //作為其中成員的會(huì)話的IDInt ViPrLegID //連接到ViPr的SiP呼叫支路Int UDLegID //連接到單播裝置的支路}SIP B2B呼叫支路Class SIPB2BCrossConnect{int SelfID//自身ID-由呼叫管理者返回int XID//擁有此支路的交叉連接的IDSipCallLegViPrLeg //連接到ViPr的支路SipCallLegUDLeg //連接到單播裝置的支路}SBU單元的內(nèi)部構(gòu)造為如下如可從圖3中看到,SBU的設(shè)計(jì)重新使用并擴(kuò)展了由呼叫管理者提供的SIP/媒體流接口,以實(shí)施用于UAM的信令呼叫控制邏輯。
以下文字展現(xiàn)當(dāng)用戶A向User_B起始呼叫時(shí)的控制流程。
下文中,Sip服務(wù)器指的是位于UAM處的Sip服務(wù)器,SBU指的是位于UAM處的SBU,且UMM指的是位于UAM處的UMM。
為了進(jìn)一步闡明所述實(shí)例,假定以下條件一整個(gè)網(wǎng)絡(luò)是以太網(wǎng)網(wǎng)絡(luò)-V1的IP地址為172.19.64.101-V2的IP地址為172.19.64.101-連接到V1/V2云的UAM的接口的IP地址為172.19.64.51,連接到UD1云的UAM的IP接口為169.144.50.100-UD1的IP地址為169.144.50.48
-將地址表示為<IP地址,端口>元組-所述實(shí)例中的所有地址和端口是說明性的,不需要將其固定,而是它們由OS分配。
-在以下實(shí)例中,SBU(在UAM處)接收的所有SIP事件實(shí)際上由Sip服務(wù)器接收且接著被傳到SBU。然而,出于簡潔起見,未展示接收事件并將其傳遞到SBU的Sip服務(wù)器。
用于UD1與V1之間的P2P呼叫的控制流程以上表格解釋了對于通過呼叫會(huì)發(fā)生的情況。下文是當(dāng)將此呼叫轉(zhuǎn)換為會(huì)議電話時(shí)的控制流程。在此情況下,例如User_B將V2處的User_C加入到會(huì)議通話中。
進(jìn)一步假定以下條件-V2的IP地址是171.19.64.102
起始與單播裝置上的用戶的會(huì)議為了將另一ViPr用戶添加到會(huì)議,重復(fù)步驟12到18??紤]另一單播裝置用戶(例如,位于POTS2上的User_D)所需的步驟。
假定以下條件S位于ViPr V2上的User_C決定將位于POTS2上的User_D加入會(huì)議中。
用于將第二單播用戶添加到會(huì)議的控制流程UMM實(shí)施用于交叉連接媒體流的功能性以及實(shí)施音頻混合功能性。
部署場景1參看圖4,此場景涵蓋兩種情況多方ViPr音頻/視頻會(huì)議中的ViPr用戶將單播僅音頻電話用戶添加到會(huì)議在此情況下,多方ViPr會(huì)議中的ViPr用戶決定將單播電話用戶添加到會(huì)議。因而,所述參與者中的一者向目的電話號碼起始呼叫。ViPr SIP服務(wù)器將呼叫重定向到ViPrUAM。ViPr UAM終止ViPr僅音頻呼叫,且經(jīng)由電話網(wǎng)關(guān)向目的電話建立背靠背呼叫。
一旦建立了呼叫,ViPr UAM便將從所述電話接收的單播G.711/G.722音頻流轉(zhuǎn)換為PMP/多播流,且將其轉(zhuǎn)發(fā)到ViPr終端而沒有任何代碼轉(zhuǎn)換。另一方面,ViPr UAM執(zhí)行將從各種ViPr終端接收的寬帶16位/16KHz PCM ViPr音頻流代碼轉(zhuǎn)換且混合為一個(gè)G.711或G.722單播音頻流,并將其轉(zhuǎn)發(fā)到電話目的地。
具有電話用戶的點(diǎn)對點(diǎn)僅音頻會(huì)議中的ViPr用戶將另一ViPr用戶添加到所述會(huì)議在此情況下,具有電話用戶(T)的點(diǎn)對點(diǎn)僅音頻呼叫中的ViPr用戶(V1)決定將另一ViPr用戶(V2)添加到所述會(huì)議。因而,ViPr用戶V1向目的ViPr用戶V2起始音頻/視頻呼叫。ViPr系統(tǒng)撤銷V1與ViPr UAM之間已建立的點(diǎn)對點(diǎn)呼叫,且在V1、V2和ViPr UAM之間重新建立PMP/多播呼叫。
ViPr UAM終止新的ViPr音頻/視頻呼叫,且將其橋接到已經(jīng)建立的背靠背電話呼叫。在此整個(gè)過程中,電話會(huì)議保持為活動(dòng)的,且切換對于電話用戶是透明的。
一旦建立了所述呼叫,ViPr UAM將從電話接收到的單播G.711/G.722音頻流轉(zhuǎn)換到PMP/多播流,并將其轉(zhuǎn)發(fā)到ViPr終端而沒有任何代碼轉(zhuǎn)換。另一方面,ViPr UAM執(zhí)行將從各種ViPr終端接收到的寬帶16位/16KHz PCM ViPr音頻流代碼轉(zhuǎn)換且混合為一個(gè)G.711或G.722單播音頻流,并將其轉(zhuǎn)發(fā)到電話目的地。
ViPr使用會(huì)話起始協(xié)議(SIP)作為建立、修改和清除多流多媒體會(huì)話的手段。UAM將通過以下方式在ViPr終端與電話用戶(即,PSTN、移動(dòng)電話和SIP電話)之間添加會(huì)議能力將上游單播僅語音電話流轉(zhuǎn)換為點(diǎn)對多點(diǎn)流(即,PMP-SVC或IP多播),且將下游ViPr多播/PMP音頻流轉(zhuǎn)換為單播電話僅語音流,以及執(zhí)行ViPr音頻的從寬帶16位/16KHz PCM編碼到G.711或G.722的下游音頻代碼轉(zhuǎn)換。
部署場景2參看圖5,此場景涵蓋兩種情況電話用戶呼叫ViPr用戶在此情況下,電話用戶向ViPr用戶起始呼叫(僅音頻)。電話網(wǎng)關(guān)將呼叫重定向到ViPr UAM。ViPr UAM終止電話呼叫,且向目的ViPr終端建立背靠背ViPr僅音頻呼叫。
一旦建立了所述呼叫,ViPr UAM便將從電話接收到的G.711/G.722音頻流轉(zhuǎn)發(fā)到ViPr終端而沒有任何代碼轉(zhuǎn)換。另一方面,ViPr UAM執(zhí)行將ViPr音頻流從寬帶16位/16KHzPCM代碼轉(zhuǎn)換為G.711或G.722,且將其轉(zhuǎn)發(fā)到電話目的地。
ViPr用戶呼叫電話用戶在此情況下,ViPr用戶向電話用戶起始呼叫。ViPr SIP服務(wù)器將呼叫重定向到ViPrUAM。ViPr UAM終止ViPr僅音頻呼叫,且經(jīng)由電話網(wǎng)關(guān)向目的電話建立背靠背PSTN呼叫。以與在先前段落中描述的方式相同的方式來進(jìn)行代碼轉(zhuǎn)換。
圖6給出UAM的典型使用背景。由UAM提供的特征如下。
特征1例如,ViPr V1和V2在點(diǎn)對點(diǎn)呼叫中,且它們希望使單播裝置UD1加入電話會(huì)議。換句話說,希望將在會(huì)議中的UD1、V1和V2形成電話會(huì)議。例如位于V1處的用戶要求位于UD1處的用戶加入具有V1和V2作為其他參與者的電話會(huì)議。此要求由SIP服務(wù)器中的一者轉(zhuǎn)發(fā)到UAM。
UAM接著執(zhí)行以下任務(wù)-代表UD1加入會(huì)議呼叫。將此會(huì)議呼叫稱為C1。
-還與單播裝置形成點(diǎn)對點(diǎn)呼叫。將此會(huì)議呼叫稱為C2。
-將在C2上接收到的音頻數(shù)據(jù)轉(zhuǎn)繼到C1。
-在呼叫C2中接受來自V1和V2參與方的視頻數(shù)據(jù),混合此數(shù)據(jù)并將其轉(zhuǎn)發(fā)到UD。
特征2考慮以上圖中的vipr網(wǎng)是ATM且UD網(wǎng)是IP網(wǎng)絡(luò)的情況。同樣,假設(shè)需要針對音頻盡可能地在ATM網(wǎng)絡(luò)上僅使用SVC而并非LANE/CLIP。這可能是出于安全性考慮或由于性能問題。
在此情況下,如果位于vipr網(wǎng)上的vipr V1希望使單播裝置(UD1)加入音頻交談,那么使用UAM來提供用以在ATM網(wǎng)絡(luò)中使用SVC和在IP網(wǎng)絡(luò)中使用IP的功能性。
為了進(jìn)行此,將從V1到UD1的所有呼叫分解成從V1到UAMD和從UAMD到V2的兩種呼叫。
可將由UAM支持的特征所需的配置分成以下類別-用于ViPr到UD呼叫的配置。
-用于UD到ViPr呼叫的配置。
-普通配置。
普通配置使得B2BUA SIP UA在任何所需端口(除了5060)上運(yùn)行。這通過將vipr.ini文件修改為包括以下參數(shù)來進(jìn)行SIP_Port=7070[任何有效端口編號]用于ViPr到UD呼叫的配置對于典型ViPr電話,當(dāng)用戶撥打“號碼”時(shí),其“呼叫請求”被發(fā)送到SIP服務(wù)器,所述SIP服務(wù)器接著將呼叫請求轉(zhuǎn)發(fā)到恰當(dāng)目的地。然而,此情況是不同的。在此情況下,當(dāng)用戶說我希望向單播裝置(UD1)講話時(shí),SIP服務(wù)器將所述請求轉(zhuǎn)發(fā)到UAM。另外,它還將信息放入請求中,以識別應(yīng)將此呼叫轉(zhuǎn)發(fā)到UD1。因此,SIP服務(wù)器經(jīng)編程以將針對由UAM裝置服務(wù)的SIP-URI的呼叫路由到恰當(dāng)UAMD服務(wù)器。
還能夠規(guī)定默認(rèn)單播裝置SIP地址,由UAM接收的所有呼叫被轉(zhuǎn)發(fā)到所述SIP地址。此默認(rèn)地址可通過在vipr.ini文件中添加下列行來指定UD_SERVER_ADDRESS=169.144.50.48X_FORWARD_AVAILABLE=0應(yīng)注意到,當(dāng)從單播裝置向ViPr發(fā)出呼叫時(shí),必須將所述呼叫傳遞到UAM。為了進(jìn)行此,在單播裝置處執(zhí)行恰當(dāng)配置,對此請參考特定針對單播裝置的文獻(xiàn)。
用于UD到ViPr呼叫的配置針對ViPr而在UD處發(fā)源的呼叫被路由到UAM。一種用于實(shí)現(xiàn)此的方式是通過編程UD來將所有呼叫引導(dǎo)或轉(zhuǎn)接到UAM。同樣,在針對UAM的呼叫請求中指定呼叫(例如V1)的最終目的地。通常,此地址將是SIP消息中的To字段。在UD或SIP服務(wù)器處執(zhí)行這些配置。
另外,當(dāng)UAM接收來自UD的呼叫請求時(shí),其將所述請求轉(zhuǎn)發(fā)到網(wǎng)關(guān)Marshall服務(wù)器以用于對被叫方執(zhí)行穩(wěn)健性檢查。此網(wǎng)關(guān)地址可在vipr.ini文件中指定GatewayMarshallServer=sip.eng.fore.com:5065縮寫詞列表ATM異步傳送模式ISDN綜合業(yè)務(wù)數(shù)據(jù)網(wǎng)IP網(wǎng)際協(xié)議LAN局域網(wǎng)MC多播(IP)MCMU媒體交叉連接和混合器MCU媒體會(huì)議單元PBX專用小交換機(jī)(專用電話交換機(jī))PCM脈沖編碼調(diào)制PMP點(diǎn)對多點(diǎn)(ATM)POTS“老式電話系統(tǒng)”PRI主要速率接口(ISDN)PSTN公用交換電話網(wǎng)SBU SIP背靠背用戶代理SIP會(huì)話起始協(xié)議SVC交換型虛擬電路(ATM)UAM單播音頻混合器ViPrTM虛擬存在系統(tǒng)WAN廣域網(wǎng)盡管已出于說明目的在前述實(shí)施例中詳細(xì)描述了本發(fā)明,但將了解到此類細(xì)節(jié)僅僅是出于說明目的,且在不偏離本發(fā)明精神和范圍的情況下所屬領(lǐng)域的技術(shù)人員可對此作出變化,本發(fā)明精神和范圍可由所附權(quán)利要求書描述。
權(quán)利要求
1.一種電話會(huì)議系統(tǒng),其包括網(wǎng)絡(luò);以及多個(gè)節(jié)點(diǎn),其通過所述網(wǎng)絡(luò)利用所述節(jié)點(diǎn)傳輸?shù)奖舜说膶?shí)況講話音頻流來彼此進(jìn)行通信以形成會(huì)議,每個(gè)節(jié)點(diǎn)均能夠檢測其中所述若干節(jié)點(diǎn)傳輸?shù)耐瑫r(shí)實(shí)況講話音頻流超過預(yù)定數(shù)目的超負(fù)荷狀態(tài),且能夠連同其它節(jié)點(diǎn)一起控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束所述超負(fù)荷狀態(tài)。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中在檢測到所述超負(fù)荷狀態(tài)時(shí),每個(gè)節(jié)點(diǎn)基于其傳輸?shù)囊纛l流和其它節(jié)點(diǎn)傳輸?shù)囊纛l流而決定其是否應(yīng)停止傳輸其音頻流。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其中每個(gè)節(jié)點(diǎn)均在沒有來自所述網(wǎng)絡(luò)的任何同步消息的情況下獨(dú)立于其它節(jié)點(diǎn)就所述超負(fù)荷狀態(tài)達(dá)成相同決定。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其中每個(gè)節(jié)點(diǎn)是視頻電話。
5.根據(jù)權(quán)利要求4所述的系統(tǒng),其中存在至少3個(gè)節(jié)點(diǎn)。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其中存在至少10個(gè)節(jié)點(diǎn)。
7.一種提供電話會(huì)議的方法,其包括以下步驟多個(gè)節(jié)點(diǎn)通過網(wǎng)絡(luò)利用所述節(jié)點(diǎn)傳輸?shù)奖舜说膶?shí)況講話音頻流來彼此進(jìn)行通信以形成所述會(huì)議;由每個(gè)節(jié)點(diǎn)檢測其中所述若干節(jié)點(diǎn)傳輸?shù)耐瑫r(shí)實(shí)況講話音頻流超過預(yù)定數(shù)目的超負(fù)荷狀態(tài);以及控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束所述超負(fù)荷狀態(tài)。
8.根據(jù)權(quán)利要求7所述的方法,其中所述控制步驟包括控制同時(shí)傳輸至所述節(jié)點(diǎn)中每一者的音頻流數(shù)目和所述節(jié)點(diǎn)每一者的超負(fù)荷狀態(tài)的步驟。
9.根據(jù)權(quán)利要求8所述的方法,其中所述控制步驟包括以下步驟在檢測到所述超負(fù)荷狀態(tài)時(shí),每個(gè)節(jié)點(diǎn)基于其傳輸?shù)囊纛l流和其它節(jié)點(diǎn)傳輸?shù)囊纛l流而決定其是否應(yīng)停止傳輸其音頻流。
10.根據(jù)權(quán)利要求9所述的方法,其中所述控制步驟包括以下步驟每個(gè)節(jié)點(diǎn)均在沒有來自所述網(wǎng)絡(luò)的任何同步消息的情況下獨(dú)立于所述若干節(jié)點(diǎn)就所述超負(fù)荷狀態(tài)達(dá)成相同決定。
11.根據(jù)權(quán)利要求10所述的方法,其中存在至少3個(gè)節(jié)點(diǎn)。
12.根據(jù)權(quán)利要求11所述的方法,其中存在至少10個(gè)節(jié)點(diǎn)。
13.根據(jù)權(quán)利要求12所述的方法,其包括允許傳輸最近期講話音頻流的節(jié)點(diǎn)繼續(xù)傳輸其音頻流的步驟。
14.根據(jù)權(quán)利要求13所述的方法,其中所述允許步驟包括對每個(gè)節(jié)點(diǎn)進(jìn)行記分的步驟,其中具有最高記分的節(jié)點(diǎn)繼續(xù)進(jìn)行傳輸。
15.根據(jù)權(quán)利要求14所述的方法,其中所述記分步驟包括以下步驟使用在過去60秒內(nèi)每一方的音頻包計(jì)數(shù)來確定所述記分。
16.一種用于具有其它節(jié)點(diǎn)的網(wǎng)絡(luò)的電話會(huì)議節(jié)點(diǎn),其包括網(wǎng)絡(luò)接口,其與所述其它節(jié)點(diǎn)進(jìn)行通信以形成實(shí)況講話會(huì)議;以及控制器,其檢測其中所述節(jié)點(diǎn)傳輸?shù)耐瑫r(shí)實(shí)況講話音頻流超過預(yù)定數(shù)目的超負(fù)荷狀態(tài),且連同所述其它節(jié)點(diǎn)一起控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束所述超負(fù)荷狀態(tài)。
17.根據(jù)權(quán)利要求16所述的節(jié)點(diǎn),其包括用于播放所述音頻流的揚(yáng)聲器和用以接收講話的音頻接收器。
18.根據(jù)權(quán)利要求17所述的節(jié)點(diǎn),其包括用以俘獲實(shí)況圖像的成像裝置。
全文摘要
本發(fā)明提供一種包括網(wǎng)絡(luò)的電話會(huì)議系統(tǒng)。所述系統(tǒng)包括多個(gè)例如終端的節(jié)點(diǎn),所述節(jié)點(diǎn)通過所述網(wǎng)絡(luò)利用所述終端傳輸?shù)奖舜说囊纛l流來彼此進(jìn)行通信以形成會(huì)議。每個(gè)終端能夠檢測其中所述終端傳輸?shù)耐瑫r(shí)音頻流超過預(yù)定數(shù)目的超負(fù)荷狀態(tài),且能夠連同其它終端一起控制同時(shí)被傳輸?shù)囊纛l流的數(shù)目以結(jié)束所述超負(fù)荷狀態(tài)。本發(fā)明提供一種提供電話會(huì)議的方法。本發(fā)明還提供一種電話會(huì)議節(jié)點(diǎn)。
文檔編號H04M3/56GK101090329SQ20071010674
公開日2007年12月19日 申請日期2007年6月15日 優(yōu)先權(quán)日2006年6月16日
發(fā)明者理查德·E·休伯, 阿倫·蓬伊, 彼得·D·希爾 申請人:愛立信公司