專利名稱:增強的通信橋接器的制作方法
技術(shù)領(lǐng)域:
本申請涉及通信網(wǎng)絡(luò),并且更特別地涉及一種用于提供增強的通信橋接器的方法和裝置。
背景技術(shù):
數(shù)據(jù)通信網(wǎng)絡(luò)可以包括各種計算機、服務(wù)器、節(jié)點、路由器、交換機、集線器、代理以及相互耦合并且被配置成相互傳遞數(shù)據(jù)的其他設(shè)備。這些設(shè)備將在這里稱為“網(wǎng)元”,并且可以提供網(wǎng)絡(luò)上的各種網(wǎng)絡(luò)資源。通過網(wǎng)絡(luò)上的通信鏈路在網(wǎng)元之間傳遞協(xié)議數(shù)據(jù)單元 (諸如分組、單元、幀或者分段)來通過數(shù)據(jù)通信網(wǎng)絡(luò)傳送數(shù)據(jù)。特定協(xié)議數(shù)據(jù)單元可以由多個網(wǎng)元處理并且在它通過網(wǎng)絡(luò)在它的來源與它的目的地之間傳播時跨越多個通信鏈路。主機(諸如計算機、電話、蜂窩電話、個人數(shù)字助理和其他類型的用戶電子設(shè)備)連接到通信網(wǎng)絡(luò)并且通過通信網(wǎng)絡(luò)傳輸/接收數(shù)據(jù),并且因此是通信網(wǎng)絡(luò)提供的通信服務(wù)的用戶??梢越㈦娫捄艚幸赃B接兩個、三個或者少量的人并且使那些個人能夠在通信網(wǎng)絡(luò)上相互談話。當(dāng)更大數(shù)量的人想要參與電話呼叫時,可以使用音頻橋接器。音頻橋接器基本上從參與者接收輸入、選擇待混合的兩個、三個或者另外少量的信號,并且向每個參與者提供混合的音頻。這允許許多人通過網(wǎng)絡(luò)同時談話并且收聽給定的通信。音頻橋接器已經(jīng)普及多年并且在本領(lǐng)域中眾所周知。遺憾的是,傳統(tǒng)音頻橋接器并未總是提供高的聲聲音質(zhì)量量。例如,一個人可能天生地響亮地談話,而另一個人很安靜地談話。該不平衡可能使參與者難以調(diào)整聲級使得他們可以聽見會議呼叫上的每個人。同樣,不同參與者可以使用不同的通信技術(shù)連接到音頻橋接器,這可能對音頻橋接器提供的總聲音質(zhì)量具有有害影響。例如,會議參與者可以使用蜂窩、基于IP、基于無線IP或者其他類型的手持設(shè)備來連接。這些連接技術(shù)中的每個可以具有不同的聲音特性,這可能使音頻橋接器提供的總音頻具有減少的音頻質(zhì)量。
發(fā)明內(nèi)容
一種增強的通信橋接器包括上下文(context)接口,該上下文接口使音頻橋接器能夠了解關(guān)于語音編碼器類型、設(shè)備、網(wǎng)絡(luò)連接、位置、呼叫類型(業(yè)務(wù)和個人)、個人的身份和位置的信息以及關(guān)于通信會話本身的上下文以及加入通信會話的每個人的上下文的其他信息。該上下文信息用來確定整體上通信的體驗質(zhì)量目標(biāo)如何以及應(yīng)當(dāng)如何唯一地處理每個個人的貢獻以嘗試滿足體驗質(zhì)量目標(biāo)。業(yè)務(wù)因素可以影響關(guān)于將對參與者提供的每個信號實現(xiàn)的處理類型的決定。在實施例中,糾正動作也可以由客戶端網(wǎng)絡(luò)設(shè)備上的橋接器實現(xiàn)。可以集中或者分布橋接器。也可以實現(xiàn)視頻橋接器。
在權(quán)利要求書中具體指出本發(fā)明的方面。以下附圖公開一個或者多個實施例僅為了舉例說明而并非旨在限制本發(fā)明的范圍。在以下附圖中,同樣的標(biāo)號指示相似元素。為的清楚的目的,可以不在每幅圖中標(biāo)注每個元素。在附圖中
圖1是根據(jù)本發(fā)明一個實施例的通信網(wǎng)絡(luò)的示例的功能框圖; 圖2A和2B是示出了在參與者A-E與兩類通信橋接器之間的信息流的功能框圖;并且圖3是根據(jù)本發(fā)明一個實施例的示例增強的通信橋接器的功能框圖。
具體實施例方式下文詳細的描述闡述了多個具體細節(jié)以提供對本發(fā)明的透徹理解。然而,本領(lǐng)域技術(shù)人員將理解無這些具體細節(jié)也可以實現(xiàn)本發(fā)明。在其他情況中,并未詳細描述公知方法、過程、部件、協(xié)議、算法和電路以免模糊本發(fā)明。圖1圖示了多方通信會話可以實現(xiàn)于其上的示例通信網(wǎng)絡(luò)10。多方通信會話可以是音頻呼叫,并且可選地也可以包括視頻內(nèi)容。如這里所用,術(shù)語“通信橋接器”將用來指代能夠在通信會話期間連接多方的設(shè)備。通信會話可以是音頻通信會話或者可以是音頻/ 視頻通信會話。因此,術(shù)語通信橋接器這里用作如下通用術(shù)語,該通用術(shù)語涵蓋傳統(tǒng)僅音頻橋接器以及能夠處理音頻和視頻數(shù)據(jù)兩者的橋接器。盡管該描述的部分可以指代音頻,但是本發(fā)明并不限于僅音頻橋接器,因為相同技術(shù)可以用來處理多方音頻-視頻通信會話上的音頻。圖1示出了多方通信會話可以建立于其上的示例通信網(wǎng)絡(luò)。在圖1中所示的示例通信網(wǎng)絡(luò)中,網(wǎng)絡(luò)10包括增強的通信橋接器12,下文結(jié)合圖3描述該增強的通信橋接器的一個實施例。人們可以使用很多不同接入技術(shù)連接到通信橋接器12。由于這些連接技術(shù)具有不同特性,所以根據(jù)本發(fā)明的一個實施例,增強的通信橋接器能夠確定與呼叫本身以及與每個參與者關(guān)聯(lián)的上下文。增強的通信橋接器將使用上下文信息來按照體驗質(zhì)量和業(yè)務(wù)度量來調(diào)整針對該特定參與者的音頻處理。這使通信橋接器能夠調(diào)整應(yīng)用于每個參與者音頻流的處理,使得輸出音頻與針對該通信會話類型的預(yù)期一致。同樣,通信橋接器將使用業(yè)務(wù)因素來進行容量對質(zhì)量的權(quán)衡以使運營費用(OpEx)最小化來確定哪些處理從業(yè)務(wù)觀點來看有意義以使通信橋接器能夠優(yōu)化收入生成、關(guān)鍵用戶體驗質(zhì)量和處理資源。例如,通信會話上的個人可以是其他參與者可能想要在呼叫期間聽見的客戶端或者客戶。通信橋接器可以優(yōu)先選擇來自該個人的音頻流以作為混合的輸出音頻流之一來包括而使該人能夠被聽見??梢园▍⑴c者分類作為業(yè)務(wù)因素的部分以使不同分類能夠根據(jù)通信會話的類型被提供給參與者。因此,例如,基于通信(例如,客戶會議呼叫)的業(yè)務(wù)關(guān)鍵性,通信橋接器可以部署更多處理以保證高體驗質(zhì)量。同樣,通信橋接器可以為了最佳質(zhì)量而偏向(bias)客戶的線路,并且保證客戶能夠容易地切入對話中。對于未直接生成收入的橋接器,可以優(yōu)化對通信橋接器的處理元件的使用以保證橋接器可以盡可能地支持最大數(shù)量的同時呼叫和用戶。圖1示出了可以用來連接到通信會話的若干示例接入技術(shù)。例如,人可以經(jīng)由蜂窩接入網(wǎng)(例如,經(jīng)由基站收發(fā)器16)在蜂窩電話14上談話以加入通信橋接器托管的通信會話。同樣,另一用戶可以具有無線IP電話18,該用戶可以使用該無線IP電話18以經(jīng)由無線接入點20連接到通信會話。其他用戶可以具有加載到他們的膝上型或者桌面計算機、 PDA或者其他計算設(shè)備22上的軟電話客戶端。這些用戶可以經(jīng)由網(wǎng)關(guān)M通過因特網(wǎng)連接到通信會話。更多其他用戶可以從連接到企業(yè)網(wǎng)的用戶設(shè)備沈(IP電話、軟客戶端等)加入通信會話。當(dāng)通信橋接器位于企業(yè)網(wǎng)外部時,用戶可以經(jīng)由企業(yè)網(wǎng)關(guān)觀連接到通信會話。也可以存在或者可以隨時間開發(fā)很多連接到橋接器的其他方式,并且圖1中所示的選擇并非限制。如圖1中所示,存在用于人連接到通信會話的很多不同方式。根據(jù)用來連接到通信會話的特定設(shè)備和接入技術(shù),通信橋接器從用戶接收的信號的特性可以明顯變化。根據(jù)本發(fā)明的一個實施例,通信橋接器確定與每個參與者關(guān)聯(lián)的上下文信息并且使用該上下文信息來處理來自該參與者的信號以及去往該參與者的信號。這使通信橋接器能夠適應(yīng)用戶已經(jīng)連接到通信會話的特定方式以增加通信橋接器的所得混合音頻輸出的清晰度。圖2A示出了通信橋接器可以如何操作以使多個人能夠在通信會話期間相互談話的示例。在圖2A中所示示例中,通信橋接器將從連接到特定通信會話的每個參與者接收輸入音頻。在該示例中,存在五個參與者A、B、C、D和E。通信會話可以具有數(shù)百個參與者,并且本發(fā)明并不限于該特定示例。通信橋接器將選擇待混合到一起的輸入的子集并且呈獻給參與者。在該示例中,通信橋接器已經(jīng)選擇來自參與者A、B和E的輸入用于混合在一起并且作為輸出音頻在通信會話上提供。因而,將向每個非活躍參與者提供如下輸出音頻流,該輸出音頻流包括來自參與者A、B和E的混合輸入。活躍參與者接收不包括他們自己的語音的混合,因此A將接收混合的B和E、B將接收混合的A和E而E將接收混合的A和B。圖2B示出了另一類型的通信橋接器,其中通信橋接器集中執(zhí)行選擇功能、但是其中混合以分布方式發(fā)生。在分布式橋接器(諸如圖2B中所示橋接器)中,通信橋接器12將確定哪些參與者應(yīng)當(dāng)在通信會話上被聽見并且將向每個參與者輸出多個語音流。例如,在圖2B中,通信橋接器已經(jīng)選擇參與者A、B和E將在通信會話上被聽見。因而,橋接器已經(jīng)向每個參與者輸出語音流A、語音流B和語音流E。參與者具有如下本地混合功能,該本地混合功能將混合這些輸入語音流,使得用戶可以收聽到混合的音頻。這里描述的本發(fā)明方面可以應(yīng)用于任一類型的橋接器。圖3示出了根據(jù)本發(fā)明一個實施例的示例增強的通信橋接器12。在圖3中所示示例中,用戶經(jīng)由用戶設(shè)備30A-30F連接到通信橋接器12。每個用戶可以使用相同的用戶設(shè)備連接到通信橋接器或者可以使用不同的用戶設(shè)備。一般而言,可以預(yù)計用戶將使用便利的并且可為該特定用戶所用的無論什么類型的用戶設(shè)備連接到通信橋接器。在圖3中所示實施例中,通信橋接器具有應(yīng)用接口 32,用戶將在發(fā)起通信會話、力口入通信會話時、在通信會話期間以及可選地結(jié)合離開通信會話來與該應(yīng)用接口 32交互。例如,可以通過撥打特定電話號碼來接入通信橋接器。當(dāng)用戶撥打用于通信會話的接入電話號碼時,用戶將連接到應(yīng)用接口,該應(yīng)用接口可以向用戶詢問會議ID號、安全接入碼或者其他相似信息。應(yīng)用接口通常具有使用戶能夠與自動化系統(tǒng)交互以發(fā)起、加入、修改或者終止通信會話的交互式語音響應(yīng)和/或DTMF信令模塊。應(yīng)用接口使用戶能夠與通信橋接器交互并且也使通信橋接器能夠與用戶設(shè)備協(xié)商以確定用戶設(shè)備將如何實現(xiàn)通信會話。例如,應(yīng)用接口可以實現(xiàn)控制和信令以選擇將由用戶設(shè)備用于通信會話的音碼器(vocoder),并且調(diào)整用戶設(shè)備和通信會話通信的速率??梢栽谟脩粼O(shè)備連接到通信橋接器時同樣地協(xié)商底層連接的其他特征。在一個實施例中,在通信會話期間,API可以指示用戶采取糾正性動作以改進用戶設(shè)備生成的信號。因此,在該實施例中,橋接器API能夠向參與者發(fā)回信息。例如,API可以向最終用戶傳輸如下消息,該消息建議將由最終用戶采取的如下糾正性動作,該糾正性動作可以使最終用戶能夠幫助改進通信會話上的音頻質(zhì)量。例如,API可以指示有噪聲的連接上的參與者將他們的麥克風(fēng)靜音以減少會議呼叫上的噪聲量。可選地,這可以通過API 直接代表有噪聲的參與者控制有噪聲的參與者的設(shè)備來實現(xiàn)。API也可以遠程控制和修復(fù)訂戶客戶端問題、諸如音頻和麥克風(fēng)增益。當(dāng)參與者例如正在使用計算機上實現(xiàn)的軟件客戶端并且參與者在頭戴式耳機上談話時,該人的膝上型計算機上的單獨麥克風(fēng)可以同時拾取該人的語音以及拾取其他環(huán)境噪聲。API可以禁用膝上型麥克風(fēng)或者替代地將來自膝上型計算機的信號用于噪聲剖析(profiling)和消除。同樣,API可以檢測參與者提供的音頻電平并且用信號通知參與者更響亮或者更輕柔地談話,或者將麥克風(fēng)從噪聲源移開以改進信噪比。同樣,API可以與最終設(shè)備直接交互以自動調(diào)整最終設(shè)備提供的信號電平。這可以使API能夠?qū)⒆罱K設(shè)備靜音或者調(diào)整在最終設(shè)備處的音頻增益以如果參與者輕柔地講話則放大參與者的語音,或者如果參與者響亮地講話則減少放大電平,從而使每個參與者在通信會話上的總音量適中。API也可以對最終用戶設(shè)備采取其他糾正性動作或者實現(xiàn)其他處理動作。例如,上下文接口和推斷引擎46可以確定將對從用戶設(shè)備30A提供的信號或者對向用戶設(shè)備30A 提供的信號執(zhí)行的處理,并且指示用戶設(shè)備30A實現(xiàn)這些過程的全部或者部分。因此,在該實施例中,可以在API的指示之下在用戶設(shè)備處實現(xiàn)編解碼器選擇、回聲處理、噪聲消除以及其他前和后處理功能。用戶也可以與應(yīng)用接口交互以在通信會話期間選擇特定特征。例如,用戶可以具有本地靜音控制,或者替代地,通信橋接器可以提供靜音控制。因此,應(yīng)用接口可以使用戶能夠控制是否選擇他們的音頻流用于在會議呼叫上輸出。應(yīng)用接口也可以使用戶能夠為呼叫選擇特征。根據(jù)特定用戶設(shè)備,應(yīng)用接口也可以在通信會話期間向參與者提供附加信息。例如,應(yīng)用接口可以提供關(guān)于當(dāng)前談話者的信息,使得參與者可以跟隨誰在特定時間點講話。 應(yīng)用接口也可以使用戶能夠總體上并且可選地在每個講話者的基礎(chǔ)上指定通信會話上的
首頻首量。當(dāng)音頻橋接器利用三維音頻混合時,橋接器可以指派特定個人在呼叫上的位置并且混合音頻,使得在其他參與者聽來聲音源于個人所坐方向。三維音頻混合的示例包括使用相位和延遲音頻處理以使用戶能夠具有音頻源于左/右側(cè)或者前/后側(cè)的空間感知。已經(jīng)開發(fā)并且可以在未來開發(fā)實現(xiàn)三維音頻的不同方式,并且音頻橋接器可以使用這些處理技術(shù)來為音頻橋接器的每個用戶調(diào)整參與者的位置。因此,音頻的方向性可以幫助人們確定誰在通信會話上談話。應(yīng)用接口也可以使用戶設(shè)備能夠向會議橋接器提供如下信息,該信息然后可以向上下文接口傳遞以使會議橋接器能夠知道知道關(guān)于通信會話的總體上下文以及該用戶在通信會話上的特定上下文的更多信息。例如,應(yīng)用接口可以檢測連接到通信會話的設(shè)備類型、在設(shè)備上實現(xiàn)的客戶端類型并且確定設(shè)備上實現(xiàn)的特征類型(諸如設(shè)備是否將在通信會話期間采用任何噪聲消除技術(shù))。應(yīng)用接口也可以檢測網(wǎng)絡(luò)連接類型(例如,蜂窩、無線 IP、IP、P0TS),以及呼叫者是從住宅連接還是商業(yè)連接進行連接。應(yīng)用接口也可以從用戶接收關(guān)于呼叫是實現(xiàn)于室外還是室內(nèi)的輸入,并且可以在初始連接期間(當(dāng)用戶登入通信會
7話時)收聽背景噪聲電平以確定向用戶提供的服務(wù)的質(zhì)量并且可選地確定連接上的背景噪聲電平。在業(yè)務(wù)上下文中,通過日歷程序調(diào)度會議(諸如電話會議)是普通的。當(dāng)人也在他們的計算機上具有軟電話客戶端時,人可以從他們的日歷程序直接啟動通信會話,該日歷程序然后調(diào)用電話應(yīng)用以連接到通信會話。在該和其他實例中,可以從參與者的日歷收集 (glean)關(guān)于通信會話的信息,并且軟電話客戶端可以向應(yīng)用接口提供參與者在通信會話中的角色。例如,如果人是組織通信會話的那個人,則可以向應(yīng)用接口提供該信息。同樣, 可以在用戶連接到通信會話時向應(yīng)用接口提供個人在組織中的角色和組織的標(biāo)識。將在一個實施例中向上下文接口 46傳遞應(yīng)用接口收集的信息。盡管應(yīng)用接口可以收集大量上下文信息,但是并未以該方式限制本發(fā)明,因為也可以實現(xiàn)收集用于由上下文接口和推斷引擎使用的信息的其他方式。下文更詳細地討論上下文接口 46。通信橋接器也具有實現(xiàn)通信會話的音頻橋接器34。在圖3中,使用粗線來圖示媒體路徑并且使用細線來示出控制信息流。音頻橋接器包括控制36、混音器38和選擇器40。 控制36與應(yīng)用接口 32交互以選擇性地接納參與者參加音頻橋接器實現(xiàn)的一個或者多個通信會話?;煲羝鲌?zhí)行向通信會話上的參與者傳輸混合信號的功能。選擇器40選擇一個、兩個、三個或者其他少量的音頻輸入來由混音器混合并且在通信會話上輸出。在操作中,當(dāng)用戶經(jīng)由應(yīng)用接口 32加入通信會話時,應(yīng)用接口 32將指示控制36 向音頻橋接器34將開始的特定通信會話添加用戶或者向音頻橋接器34托管的已經(jīng)存在的通信會話添加用戶。一旦用戶被添加到通信會話,選擇器40將開始從用戶接收輸入,并且如果適當(dāng),則選擇該用戶的音頻以混合到通信會話上的輸出流中。一旦用戶加入通信會話, 混音器就也將向用戶提供來自通信會話的輸出音頻。根據(jù)本發(fā)明的一個實施例,通信橋接器12包括音頻增強器42,該音頻增強器42根據(jù)從上下文接口和推斷引擎46接收的上下文信息44來獨立處理每個用戶的音頻。音頻增強器包括控制48,該控制48將音頻處理器50編程為將特定音頻處理算法應(yīng)用于選擇器40 選擇的信號。將使用單獨的音頻處理算法來個別地處理選擇器40向音頻處理器提供的每個信道,使得可以根據(jù)與個別信道關(guān)聯(lián)的上下文來優(yōu)化該特定信道。盡管在圖3中所示的實施例中選擇器40選擇用于由音頻處理器50處理的音頻信道,但是本發(fā)明就該點而言不受限制,因為如果期望,則音頻處理器可以實現(xiàn)選擇功能。如上所述,在一個實施例中,并非所有輸入音頻信道將由混音器38混合在一起用于向通信會話上的用戶輸出。因而,優(yōu)選地應(yīng)當(dāng)在音頻處理之前執(zhí)行選擇過程(無論是由選擇器40還是音頻處理器50實現(xiàn)),使得音頻處理器50將僅處理將對通信會話有貢獻的相關(guān)音頻信道。在一個替代實施例中,輸入音頻信道的更大子集將在選擇過程之前經(jīng)歷一些音頻處理。例如,可以在選擇過程之前預(yù)處理來自如下信道的音頻輸入以便優(yōu)化選擇,這些信道被檢測出具有噪聲或者增益問題。同樣,信號可以在選擇之前經(jīng)歷增益調(diào)整以使自然地輕柔講話的人更容易切入通信橋接器托管的對話中。因而,如圖3中所示,通信橋接器可以包括預(yù)處理器41,該預(yù)處理器41被配置成接收輸入音頻并且在向選擇器輸入信號之前處理信號。預(yù)處理器將執(zhí)行的處理類型可以由音頻增強器42控制以使音頻信號的預(yù)處理能夠與后處理協(xié)調(diào)。同樣,音頻增強器42也可以向選擇器提供輸入以幫助選擇器確定應(yīng)當(dāng)優(yōu)先地選擇哪些信號以在通信會話上輸出。
在圖3中所示實施例中,將預(yù)處理器41、選擇器40、音頻處理器50和混音器38被示出為單獨框以有助于說明可以結(jié)合音頻信號實現(xiàn)的不同功能。并未以該方式限制本發(fā)明,因為這些功能中的若干或者所有功能可選地可以組合成單個FPGA或者其他可編程電路。因此例如,可以向單個芯片輸入信號,該芯片執(zhí)行預(yù)處理、選擇、音頻處理和音頻混合以向通信會話的若干參與者輸出多個個別混合的音頻信道。實現(xiàn)通信橋接器的多種方式是可能的,包括在針對信號處理而優(yōu)化的專用處理器上或者在通用微處理器上運行的軟件。上下文接口和推斷引擎46向音頻增強器42提供上下文信息44以關(guān)于應(yīng)當(dāng)對特定信道執(zhí)行的處理類型并且可選地關(guān)于應(yīng)當(dāng)與處理特定音頻信道結(jié)合使用的參數(shù)指示音頻增強器。上下文接口收集關(guān)于通信會話中的每個參與者的信息。例如,在所示實施例中,上下文接口和推斷引擎46接收關(guān)于參與者所用語音編碼器(音碼器)52、網(wǎng)絡(luò)連接的類型54、 設(shè)備的類型56和設(shè)備58所用通信客戶端的輸入。這些參數(shù)使上下文接口和推斷引擎46 能夠了解關(guān)于連接和設(shè)備的如下物理特性,這些物理特性可以影響應(yīng)當(dāng)在音頻處理器中如何處理用戶設(shè)備提供的信號。上下文接口也收集總體上關(guān)于通信會話以及關(guān)于用戶參與通信會話的社會上下文信息。例如,上下文接口和推斷引擎46可以從用戶的日歷60接收輸入以了解通信會話的社會上下文。這使通信橋接器可以針對業(yè)務(wù)呼叫實現(xiàn)與它針對個人呼叫實現(xiàn)的處理不同的處理。同樣,組織和人在組織中的角色62可以影響橋接器在通信會話上提供的服務(wù)質(zhì)量。 類似地,可以向特定參與者(諸如在銷售會議呼叫上的客戶)給予優(yōu)先級以增加那些參與者的體驗質(zhì)量、使該特定參與者更容易切入對話中或者否則調(diào)整在通信會話期間對待參與者的方式。人從其進行呼叫的位置也可以與通信橋接器12相關(guān)。例如,如果人從外部呼叫, 則環(huán)境背景噪聲量可能比如果人從更安靜的室內(nèi)位置呼叫時高。類似地,如果人從家中而不是從辦公室呼叫,則在該人提供的音頻上的背景噪聲特性可能不同。音頻橋接器也可以查看服務(wù)質(zhì)量65以確定如何處理從特定用戶接收的音頻。例如,如果用戶從家中呼叫并且具有相對靜態(tài)的粗篩(riddled)連接,則通信橋接器可能想要過濾信號以嘗試從該連接消除一些靜態(tài)。也可以確定其他服務(wù)質(zhì)量因素。音頻橋接器也可以將會話優(yōu)先級66與業(yè)務(wù)因素規(guī)則70 —起用來確定如何分配橋接器的資源以優(yōu)化質(zhì)量、 成本和容量。例如,與客戶的會議呼叫可以針對計算資源采用壓倒業(yè)務(wù)環(huán)境中的內(nèi)部會議的優(yōu)先級。在作為服務(wù)而運行的會議橋接器中,可以向溢價預(yù)訂的客戶給予相對于支付更低費用的其他人而言的優(yōu)先級。音頻橋接器可以在上下文歷史80中保持優(yōu)化、推斷以及連接問題和上下文的記錄??梢允褂蒙舷挛臍v史作為用于音頻處理的起點設(shè)置。例如,具有一貫高增益的用戶可以使得在他們向橋接器呼入時自動應(yīng)用增益減少。除了用戶標(biāo)識之外,諸如用戶設(shè)備、連接類型、編解碼器等其他上下文輸入也可以保持于上下文歷史中。為了優(yōu)化存儲,可以僅存儲最頻繁和高優(yōu)先級的用戶的上下文。音頻增強器從上下文接口和推斷引擎46接收輸入并且將其與體驗質(zhì)量因素68和業(yè)務(wù)因素70進行組合以確定如何在音頻處理器50中處理信號。體驗質(zhì)量因素68是描述用戶對通信會話性質(zhì)的感知的因素。例如,回聲消除或者抑制可能對于實現(xiàn)防止過量回聲干擾聲音保真度而言是重要的。用于回聲抑制的體驗質(zhì)量因素可以指定最優(yōu)總回聲響度比率(TELR)值以及可接受的TELR值。這些TELR值可以依賴于會議呼叫的特定是上下文和其他因素。例如,業(yè)務(wù)會議呼叫可能較少地容忍回聲,并且因此可以針對業(yè)務(wù)會議呼叫指定最優(yōu)和可接受的TELR值的第一集合。青少年可能具有對回聲的不同容忍度,并且因此可以針對該類用戶指定最優(yōu)和可接受的TELR值第二集合。類似地,他們自己中的討論家庭事務(wù)的家屬談話可能具有對回聲的不同容忍度,并且因此可以針對該類用戶指定最優(yōu)和可接受的TELR值的第三集合。除了回聲之外,還可以針對其他音頻性質(zhì)(諸如噪聲電平、總響度值和其他相似性質(zhì))指定最優(yōu)和可接受的閾值。體驗質(zhì)量因素因此向音頻增強器給予目標(biāo)值以防止音頻增強器過度處理信號使得增加特定性質(zhì)(例如,回聲消除),其中這樣做不會使最終用戶可感知地增加總體聲音質(zhì)量而是可能占用不必要的計算資源。業(yè)務(wù)因素使成本和會話優(yōu)先級能夠在確定通信橋接器應(yīng)當(dāng)如何處理信號時被考慮。特定過程可能是計算密集的,并且因此占用通信橋接器的更大百分比的處理能力。由于通信橋接器具有有限的計算資源,所以實現(xiàn)計算密集過程限制了通信橋接器可以處理的通信會話數(shù)量。當(dāng)基于通信會話的數(shù)量向通信橋接器的所有者付費時,實現(xiàn)計算密集過程可能影響通信橋接器生成的收入。業(yè)務(wù)因素使業(yè)務(wù)決定能夠得以實現(xiàn),使得通信橋接器能夠不僅優(yōu)化參與者在通信會話上的體驗質(zhì)量,而且還能夠優(yōu)化橋接器能夠在網(wǎng)絡(luò)上生成的收入量。例如,業(yè)務(wù)因素可以使通信橋接器能夠在橋接器負載時為通信會話實現(xiàn)更高質(zhì)量的處理,并且然后在橋接器變得更擁塞時為較不重要的通信會話代用較低質(zhì)量的處理。這使橋接器能夠通過調(diào)整音頻增強器如何處理存在的通信會話來調(diào)整到最大化收入的負載條件。上下文接口和推斷引擎接收這些類型的輸入以及可能的其他輸入,并且為信號確定適當(dāng)?shù)囊纛l處理算法。這使會議橋接器能夠通過提供針對社會上下文和個別參與者可調(diào)的優(yōu)良音頻性能來增強會議用戶體驗、通過在傳統(tǒng)音頻橋接器上集成業(yè)務(wù)智能來增加協(xié)作有效性。音頻處理器可以針對特定個別參與者實現(xiàn)多個不同類型的處理技術(shù)以優(yōu)化該參與者在通信會話上的聲音質(zhì)量。一個示例類型的處理可以是確定是應(yīng)當(dāng)實現(xiàn)用于回聲控制的線性還是非線性方法。特別地,如果選擇線性回聲處理方法,則可以使用回聲消除器,而非線性方法將需要使用回聲抑制而不是回聲消除?;芈曄侨缦逻^程,音頻處理器50可以通過該過程了解接收的信號的哪部分是實際信號以及哪部分是回聲。自適應(yīng)濾波器然后可以被構(gòu)建成從信號減去回聲。這使回聲能夠從信號中被減去或者消除,使得在理論上可以從信號移除回聲而對非回聲信號的影響最小。對照而言,回聲抑制并未僅移除信號的回聲部分而是可能阻止整個反信號。由于回聲朝向說話者向回傳播,所以一種普通方法是在反方向上阻止音頻以減少線路上的回聲感知。盡管這由于無需創(chuàng)建自適應(yīng)濾波器而比回聲消除簡單,但是它防止兩個人同時談話。 特別地,當(dāng)?shù)谝粋€人談話時,如果第二個人開始談話,則回聲抑制可以認為從第二個人朝向第一個人傳播的音頻為回聲,在該情況下它因此將抑制來自第二個人的音頻。因而,對于回聲抑制而言,是難以具有全雙工對話的。
存在用于確定是否應(yīng)當(dāng)實現(xiàn)線性回聲控制方法(回聲消除)或者是否應(yīng)當(dāng)使用非線性方法(回聲抑制)的若干方式。一種這樣做的方式是查看該特定用戶使用的音碼器類型。存在通常由ITU以G. XXX系列標(biāo)準(zhǔn)的形式多年來已經(jīng)指定的很多音碼器。例如,G. 711、 G. 726和G. 722音碼器一般為線性的,因而可以與使用這些音碼器之一來實現(xiàn)的呼叫結(jié)合使用回聲消除。對照而言,G. 720、EVRC和變體、AMR、G. 723. 1、G. 722. 2通常為非線性的,因而可能必須在通信會話參與者使用這些音碼器之一時使用回聲抑制。移動用戶通??梢允褂弥T如增強的可變速率編解碼器(EVRC)或者自適應(yīng)多速率壓縮(AMR)之類的音碼器,業(yè)務(wù)用戶經(jīng)常使用諸如G. 702/G. 711/G. 722之類的音碼器,并且基于家庭的住宅用戶將經(jīng)常使用G. 729或者G. 711音碼器。因而,網(wǎng)絡(luò)連接的類型可以影響該人所用的特定音碼器。上下文接口和推斷引擎46針對加入通信會話的每個人單獨實現(xiàn)對回聲抑制或者回聲消除的選擇,使得可以針對該特定人實現(xiàn)最優(yōu)回聲處理。除了音碼器類型之外,網(wǎng)絡(luò)損傷也可以指示需要部署非線性回聲抑制??梢詸z測的示例網(wǎng)絡(luò)損傷包括分組丟失和抖動,其可以圖案、尖峰率、脈沖串大小、頻率/出現(xiàn)等來進一步表征。測量的抖動特性(諸如尖峰率)可以指示網(wǎng)絡(luò)抖動特性的頻繁改變。如果分組丟失率超過如下比率,標(biāo)準(zhǔn)分組丟失隱藏算法在該比率以下操作的較少的非自然因素,則應(yīng)當(dāng)使用回聲抑制而不是回聲消除。除了在每個用戶的基礎(chǔ)上執(zhí)行回聲處理之外,音頻增強器也可以在每個用戶的基礎(chǔ)上實現(xiàn)噪聲控制。當(dāng)在信道上存在背景噪聲時,期望實現(xiàn)一些形式的噪聲抑制以減少背景噪聲。然而,重要的是在抑制噪聲時不能太激進,因為噪聲抑制也可能破壞信道上的感興趣的信號。根據(jù)本發(fā)明的一個實施例,可以根據(jù)具有特定用戶的通信信道的特定特性以及用戶的位置和上下文信息(諸如對話類型(業(yè)務(wù)/隨意))來調(diào)整噪聲抑制水平和類型。噪聲減少引擎通??梢杂梢纛l增強器實現(xiàn),盡管不以該方式限制本發(fā)明。在一個實施例中,可以基于在談話者與噪聲減少引擎之間的音碼器類型來調(diào)整噪聲抑制水平和類型。存在兩種一般的音碼器類型_保留原始波形的波形音碼器和將原始信號解壓成分量并且然后個別壓縮分量的參數(shù)音碼器。如果使用波形音碼器(諸如G. 711或者G. 726),則噪聲抑制算法可以更激進。如果使用參數(shù)音碼器,則噪聲抑制根據(jù)壓縮率應(yīng)當(dāng)較不激進。此外,本底噪聲測量可以用來確定信噪比。如果環(huán)境本底噪聲高于特定閾值,則可以經(jīng)由應(yīng)用接口 32向參與者發(fā)送通知以使參與者能夠修改用戶設(shè)備的區(qū)域中的條件以幫助減少噪聲閾值。例如,參與者可以在揚聲器電話上并且設(shè)備的麥克風(fēng)可能與噪聲源(諸如計算機風(fēng)扇、投影儀風(fēng)扇或者其他類型的噪聲源)太近定位。參與者可能并不知道風(fēng)扇對呼叫引起明顯噪聲。向參與者提供通知可以使參與者能夠移動電話或者向頭戴式受話器而不是揚聲器電話切換。類似地,室外環(huán)境通常比室內(nèi)環(huán)境更嘈雜。如果人從外部談話,則可以進行補償/ 調(diào)整以減少信號上的噪聲量。例如,噪聲消除過程可以在人從室外位置談話時比在人從室內(nèi)位置談話時更激進。因而,如上文討論的那樣,上下文接口和推斷引擎收集和處理每個參與者的上下文。上下文可以包括參與者的姓名、在公司中的角色、對話類型(業(yè)務(wù)、隨意、家屬、少年),這些上下文幫助上下文接口和推斷引擎確定在通信會話上所需的音頻質(zhì)量。例如,業(yè)務(wù)會議呼叫可能需要與在少年人群組之間的會議呼叫或者在家屬群組之間的家庭會議呼叫不同地加以支持并且具有不同的音頻質(zhì)量。因此,通信會話背后的原因可以用來基于與社會上下文關(guān)聯(lián)的預(yù)期來確定所需的體驗質(zhì)量閾值。這些體驗質(zhì)量因素然后可以用來在音頻處理器對將在通信會話上混合在一起的音頻流實現(xiàn)的回聲抑制、噪聲減少、音量平衡等方面調(diào)整呼叫的處理。在一個實施例中,通信橋接器使用關(guān)于參與者和呼叫上下文的可用上下文信息, 以及關(guān)于設(shè)備類型、網(wǎng)絡(luò)連接類型和與參與者如何連接到通信橋接器關(guān)聯(lián)的其他性質(zhì)的物理信息來確定對影響體驗質(zhì)量的一些因素的改進是否可能。例如,通信橋接器可以確定是否有可能改進回聲消除、噪聲減少、響度比率或者另一因素。通信橋接器然后可以確定可用機制是否將充分改進因素以更改最終用戶體驗質(zhì)量。如果不是,則無理由應(yīng)用可用機制。即使通信橋接器可以使用可用機制來改進最終用戶體驗質(zhì)量,通信橋接器也可以查看與通信會話關(guān)聯(lián)的社會上下文以確定從業(yè)務(wù)觀點來看是否值得這樣做。用于信號處理網(wǎng)絡(luò)設(shè)備的動態(tài)協(xié)調(diào)的機制(MDCSPNE)是草案ITU-T推薦以針對語音質(zhì)量增加來協(xié)調(diào)信號處理特征。根據(jù)特定實現(xiàn),在網(wǎng)絡(luò)上的不同地點應(yīng)用不同語音質(zhì)量增強可能由于在過程之間的非既定干擾而引起不期望的降級。通過在通信橋接器處經(jīng)由音頻處理器實現(xiàn)多個語音質(zhì)量增強過程,可以協(xié)調(diào)這些增強以避免該類非既定干擾和附帶的潛在音頻質(zhì)量降級。在圖3中所示的實施例中,通信橋接器包括服務(wù)保證接口 72,該服務(wù)保證接口 72 從網(wǎng)絡(luò)接收關(guān)于網(wǎng)絡(luò)狀態(tài)的輸入,并且通信橋接器可以通過該服務(wù)保證接口 72采取補救動作。服務(wù)保證接口也向服務(wù)保證系統(tǒng)提供橋接器和音頻運轉(zhuǎn)的狀態(tài)以使服務(wù)保證系統(tǒng)能夠知道橋接器如何隨時間運轉(zhuǎn)。同樣,服務(wù)保證系統(tǒng)可以提供關(guān)于網(wǎng)絡(luò)狀態(tài)的運營信息以使通信橋接器能夠了解網(wǎng)絡(luò)如何操作。例如,如上文所言,網(wǎng)絡(luò)的分組丟失率和抖動特性可以幫助通信橋接器確定使用哪個類型的回聲處理。服務(wù)保證接口 72可以獲得關(guān)于網(wǎng)絡(luò)運營狀態(tài)的信息以幫助上下文接口和推斷引擎在針對特定信號實現(xiàn)回聲處理時確定這些參數(shù)。應(yīng)當(dāng)理解這里做出的將功能描述為由本發(fā)明的方法執(zhí)行的所有功能陳述可以由利用子例程和本領(lǐng)域普通技術(shù)人員已知的其他編程技術(shù)來實現(xiàn)的軟件程序執(zhí)行。替代地, 可以用硬件、固件或者硬件、軟件和固件的組合實現(xiàn)這些功能。本發(fā)明因此并不限于特定實現(xiàn)??刂七壿嬁梢詫崿F(xiàn)為在網(wǎng)元內(nèi)的計算機可讀存儲器中存儲的并且在微處理器上執(zhí)行的程序指令集。然而,在該實施例中與先前實施例一樣,本領(lǐng)域技術(shù)人員將清楚可以使用分立部件、集成電路、與可編程邏輯器件(諸如現(xiàn)場可編程門陣列(FPGA)或者微處理器) 結(jié)合使用的可編程邏輯或者包括其任何組合的任何其他設(shè)備來實現(xiàn)這里描述的所有邏輯。 可編程邏輯可以暫時或者持久地固定于有形介質(zhì)(諸如只讀儲存器芯片、計算機存儲器、盤或者其他存儲介質(zhì))中。所有這樣的實施例旨在落入本發(fā)明的范圍內(nèi)。應(yīng)當(dāng)理解可以在本發(fā)明的精神和范圍內(nèi)進行對附圖中示出和這里描述的實施例的各種改變和修改。因而,旨在按照示例而非限制意義解釋上文描述中包含和附圖中示出的所有內(nèi)容。本發(fā)明僅由以下權(quán)利要求書和其等同物限定。
權(quán)利要求
1.一種增強的通信橋接器,包括應(yīng)用接口,用于與通信會話參與者通信以使所述通信會話參與者能夠加入所述通信橋接器托管的通信會話;音頻橋接器,用于實現(xiàn)所述通信橋接器托管的所述通信會話,所述音頻橋接器從每個所述通信會話參與者接收輸入音頻流并且選擇所述輸入音頻流的子集用于混合以便向所述通信會話參與者呈現(xiàn);上下文接口和推斷引擎,用于確定用于每個所述通信會話參與者的通信上下文和所述通信會話的社會上下文、選擇將應(yīng)用于每個選擇的輸入音頻流的語音質(zhì)量增強過程的唯一集合;以及音頻增強器,用于對每個所述選擇的輸入音頻流個別地執(zhí)行音頻處理,使得可以在混合用于向所述通信會話參與者呈現(xiàn)之前向每個選擇的輸入流個別地應(yīng)用相應(yīng)的語音質(zhì)量增強的唯一集合。
2.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中用于每個所述通信會話參與者的所述通信上下文包括用于每個所述通信會話參與者的網(wǎng)絡(luò)上下文。
3.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中至少部分地經(jīng)由與網(wǎng)絡(luò)服務(wù)保證系統(tǒng)的接口來確定所述網(wǎng)絡(luò)上下文。
4.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中所述上下文接口還使用體驗質(zhì)量因素來選擇將向每個所述選擇的輸入音頻流應(yīng)用的語音質(zhì)量增強過程的唯一集合。
5.根據(jù)權(quán)利要求4所述的增強的通信橋接器,所述上下文接口還使用業(yè)務(wù)因素來確定特定語音質(zhì)量增強過程是否太昂貴以至于無法應(yīng)用于所述選擇的輸入音頻流中的一個或者多個。
6.根據(jù)權(quán)利要求4所述的增強的通信橋接器,其中基于所述通信會話的所述社會上下文來選擇所述體驗質(zhì)量因素。
7.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中所述語音質(zhì)量增強過程包括回聲控制、增益控制和噪聲抑制。
8.根據(jù)權(quán)利要求7所述的增強的通信橋接器,其中回聲控制包括基于在所述輸入音頻流上使用的音碼器的類型來進行選擇以實現(xiàn)用于特定選擇的輸入音頻流的回聲消除和回聲抑制。
9.根據(jù)權(quán)利要求8所述的增強的通信橋接器,其中如果在所述輸入音頻流上使用保留所述音頻信號的波形特性的音碼器,則采用回聲消除。
10.根據(jù)權(quán)利要求8所述的增強的通信橋接器,其中如果在所述輸入音頻流上使用具有非線性特性的音碼器,則采用回聲抑制。
11.根據(jù)權(quán)利要求7所述的增強的通信橋接器,其中用波形保留音碼器實現(xiàn)比用參數(shù)音碼器實現(xiàn)的更激進的噪聲抑制。
12.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中上下文接口和推斷引擎也確定每個所述通信會話參與者的社會上下文并且基于每個特定通信會話參與者的所述社會上下文來調(diào)整所述音頻增強器如何個別地執(zhí)行音頻處理。
13.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中所述社會上下文用來優(yōu)先地選擇來自所述通信會話參與者中的至少一個的音頻以作為所述選擇的輸入音頻流之一而包括。
14.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中所述社會上下文用來給予與業(yè)務(wù)有關(guān)的通信會話超過個人通信會話的優(yōu)先級。
15.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中所述應(yīng)用接口使所述通信橋接器在所述通信會話期間能夠向所述參與者提供指令。
16.根據(jù)權(quán)利要求15所述的增強的通信橋接器,其中所述指令之一是指示所述參與者之一將用來將所述參與者連接到所述通信會話的通信設(shè)備從噪聲源移開的消息。
17.根據(jù)權(quán)利要求15所述的增強的通信橋接器,其中所述指令之一是指示所述參與者之一在用來將所述參與者連接到所述通信會話的通信設(shè)備上激活靜音功能的消息。
18.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中所述應(yīng)用接口使所述通信橋接器能夠基于體驗質(zhì)量和業(yè)務(wù)因素來控制和調(diào)整與所述參與者之一關(guān)聯(lián)的通信設(shè)備的增益電平、噪聲減少、靜音或者編解碼器選擇。
19.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中所述應(yīng)用接口檢測由每個所述參與者用于所述通信會話之一的通信設(shè)備的類型并且向所述上下文和接口引擎提供所述通信設(shè)備的類型的信息。
20.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中所述通信橋接器處理視頻數(shù)據(jù)以及音頻數(shù)據(jù)。
21.根據(jù)權(quán)利要求1所述的增強的通信橋接器,其中所述通信橋接器維持與先前通信會話結(jié)合使用的處理動作的歷史并且使用所述歷史來確定用于所述通信會話的初始設(shè)置。
全文摘要
一種增強的通信橋接器包括上下文接口,該上下文接口使音頻橋接器能夠了解關(guān)于語音編碼器類型、設(shè)備、網(wǎng)絡(luò)連接、位置、呼叫類型(業(yè)務(wù)對個人)、個人的身份和位置的信息以及關(guān)于通信會話本身的上下文和加入通信會話的每個人的上下文的其他信息。該上下文信息用來確定體驗質(zhì)量如何總體上以通信為目標(biāo)以及應(yīng)當(dāng)如何唯一地處理每個個人的貢獻以嘗試滿足體驗質(zhì)量目標(biāo)。業(yè)務(wù)因素可以影響關(guān)于將對參與者提供的每個信號實現(xiàn)的處理類型的決定。糾正性動作在實施例中也可以在客戶端網(wǎng)絡(luò)設(shè)備上由橋接器實現(xiàn)??梢约谢蛘叻植紭蚪悠?。也可以實現(xiàn)視頻橋接器。
文檔編號H04N7/15GK102461139SQ201080025387
公開日2012年5月16日 申請日期2010年4月9日 優(yōu)先權(quán)日2009年4月9日
發(fā)明者布勞因 F., 索爾普 L., 拉比普爾 R., 德爾維加 T., 拉勒爾 T. 申請人:北方電訊網(wǎng)絡(luò)有限公司