專利名稱:用于實施語音會議的方法和語音會議系統(tǒng)的制作方法
用于實施語音會議的方法和語音會議系統(tǒng)
背景技術(shù):
語音會議系統(tǒng)允許多個語音終端設(shè)備互相連接成一個電話會議,從 而向各個用戶榆入通過其余用戶的語音終端設(shè)備的各自話筒所接收的 音頻信號作為用作音頻輸出的"混合的信號".輸入用戶的"混合的信 號",下面也稱為混合信號,在此是施加的所有音頻信號的疊加,然而 該用戶的音頻信號除外,因為這個他自身在會議中的講話部分不需要或 者不允許被他自己聽到,因為這會產(chǎn)生自身講話的非期望的回聲效應(yīng).
因此,必須為電話會議的N個用戶中的每一個形成特殊的混合信號,在 這種情況下,將該電話會議的其余用戶的(N-l)個語音信號加工成該 特殊的混合信號。
例如,在具有語音終端設(shè)備的基于分組的通信系統(tǒng)中,該語音終端 設(shè)備借助基于分組的方法通過基于分組的網(wǎng)絡(luò)一例如基于IP的UP: Internet Protocal,互聯(lián)網(wǎng)協(xié)議)網(wǎng)絡(luò)一來通信,將通過話筒接收的
音頻信號通過編碼器轉(zhuǎn)換為用于該基于分組的網(wǎng)絡(luò)的數(shù)據(jù)分組,并且借 助解碼器將來自該基于分組的網(wǎng)絡(luò)的數(shù)據(jù)分組轉(zhuǎn)換為用于通過例如位
于電話聽筒中的揚聲器音頻輸出的音頻信號.組合的編碼和解碼單元通 常稱作C0DE(X編解碼器)(編碼/解碼)。已知的編碼方法例如通過ITU-T (ITU-T: ITU的電信標準化部門;ITU:國際電信聯(lián)盟)來進行標準化。 它們例如是具有名稱G. 711, G. 726或者G. 729的CODEC,這些CODEC 尤其通過各自的語音質(zhì)量、各自的壓縮率以及各自編碼方法的復(fù)雜性來 相互區(qū)分.例如CODBCG. 729的優(yōu)點是,該CODEC可以用于語音質(zhì)量比
較好時的高壓縮,但是其中必須執(zhí)行計算強度大的運算.
語音終端設(shè)備經(jīng)常支持多個CODEC,其中協(xié)商用一個共同的CODEC 來用于各個通信伙伴的連接和/或各個通信伙伴的連接的部分片段,
為了通過電話會議將語音終端設(shè)備相互連接,通常這樣處理,即在 語音終端設(shè)備的語音會議系統(tǒng)中將傳入的經(jīng)過編碼的語音數(shù)據(jù)進行解 碼,從中為各自的語音終端設(shè)備分別產(chǎn)生混合信號,并且該分別產(chǎn)生的
6混合信號利用與各自的語音終端設(shè)備匹配的編碼器來轉(zhuǎn)換.分別生成的 混合語音數(shù)據(jù)于是通過面向分組的方法傳輸給各自語音終端設(shè)備來進 行各自的語音輸出,
由此給出,在具有N個用戶的電話會議中,通過語音會議系統(tǒng)同時 對N個傳入的語音數(shù)據(jù)流進行解碼,并且通過N個編碼器將隨后形成的 N個混合信號轉(zhuǎn)換為N個傳出的語音數(shù)據(jù)流.尤其在具有許多用戶的電 話會議中,這可能導(dǎo)致可觀的用于編碼和解碼的計算消耗,除此以外, 為了支持具有許多用戶的電話會議,必須維持大量的編碼器和解碼器.
為了減少編碼和解碼的復(fù)雜性,可以在語音會議系統(tǒng)中只使用需要 較少計算能力的CODEC.然而已經(jīng)證實,在語音質(zhì)量和/或用于傳輸經(jīng)過 編碼的語音數(shù)據(jù)所需要的帶寬方面,這種計算強度較低的CODEC大多是
不利的.
可替換地,并且為了解決這個高計算消耗的問題,通過將各自語音 終端設(shè)備的經(jīng)過編碼的語音數(shù)據(jù)傳輸給所有其它的語音終端設(shè)備,然后 分別在語音終端設(shè)備中進行解碼和混合,語音會議系統(tǒng)可以放棄解碼和 對經(jīng)過解碼的信號的混合.然而這種方法引出了其它的或者進一步的問 題,因為對語音終端設(shè)備的帶寬要求極度地提高,并且語音終端設(shè)備必 須為此如此設(shè)置,即必須能對多個傳入的語音數(shù)據(jù)流進行并行處理.由 此,語音終端設(shè)備中的復(fù)雜性顯著提高了.
在前述所有的方法中,證實這樣做是困難的,即通過語音會議系統(tǒng) 服務(wù)大量的用戶而不將語音會議系統(tǒng)中的計算復(fù)雜性極度提高,并且對 語音質(zhì)量或傳輸帶寬沒有明顯的消極影響.
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是,給出一種用于執(zhí)行語音會議的方法以 及一種語音會議系統(tǒng),即使在會議用戶較多時,該語音會議系統(tǒng)也可以 為所有語音信號的編碼保持較低的計算復(fù)雜性。
這個任務(wù)通過根據(jù)權(quán)利要求1的用于執(zhí)行語音會議的方法,以及通 過根據(jù)權(quán)利要求14的語音會議系統(tǒng)來解決。
所述方法的優(yōu)選實施形式和擴展在從屬權(quán)利要求中給出.
在本發(fā)明的方法中,該方法用于在通信系統(tǒng)中實施具有至少三個語音終端設(shè)備的語音會議,優(yōu)選為同時、雙向的通信而設(shè)置的語音終端設(shè)
備分別具有接收信道(Empfangskanal)和記錄信道(Aufnahmekanal ), 該接收信道用于接收在語音會議中累積的經(jīng)過編碼的語音數(shù)據(jù),并且將 通過對接收到的語音數(shù)據(jù)進行解碼而形成的語音信號輸出給各自的語 音終端設(shè)備。該記錄信道用于為語音會議提供經(jīng)過編碼的語音數(shù)據(jù),其 中要提供的語音數(shù)據(jù)由編碼器根據(jù)在各自的語音終端設(shè)備上記錄的語 音信號來形成。在本發(fā)明的方法中,將語音終端設(shè)備中的至少一個設(shè)備 至少暫時地分配給第一組,使得為該第一組將通過它們各自的記錄信道 提供的語音數(shù)據(jù)分別解碼成單個語音信號(Einzelsprachsignal),將 該單個語音信號疊加成合成語音信號(Su咖ensprachsignal ),并且將 該合成語音信號編碼為第一合成語音數(shù)據(jù)(Summensprachdaten ),此外, 將語音終端設(shè)備中的至少兩個設(shè)備至少暫時地分配給第二組,使得第二 組只包括這樣的語音終端設(shè)備,即在該語音終端設(shè)備中在它們各自的記 錄信道上識別出廣泛的(weitgehend)非主動性.根據(jù)本發(fā)明,向分配 給笫二組的語音終端設(shè)備通過它們各自的接收信道輸入第一合成語音 數(shù)據(jù)來用于分別輸出該第一合成語音數(shù)據(jù).
本發(fā)明證明其自身尤其是有益的,即當從多個單個語音信號中形成 唯一的、共同的合成語音信號,并且將經(jīng)過編碼的合成語音信號,即笫 一合成語音數(shù)據(jù),不經(jīng)過特殊的改變而輸入給多個語音終端設(shè)備.因此 只對一個語音信號一合成語音信號一優(yōu)選通過共同的CODEC來編碼,由 此在語音會議中同時使用的CODEC的數(shù)量可以明顯地減少。例如,如果 將X個非主動的語音終端設(shè)備分配給第二組,則為了對特定于終端設(shè)備 的語音數(shù)據(jù)進行編碼而不使用本發(fā)明的方法,通常需要同時使用X個 C0DEC。相反地,在使用本發(fā)明的方法時,只需要使用一個CODEC,因此 可以節(jié)約X-l個CODEC,原因是需要相應(yīng)更少的CODEC,語音會議的最 大數(shù)量用戶所需要的CODEC的最大數(shù)量,可以例如在為真實環(huán)境中運行 的電話會議所做的準備階段調(diào)查的范圍內(nèi)根據(jù)經(jīng)驗確定,
從前文所述中可以看出, 一方面用于執(zhí)行根據(jù)本發(fā)明的方法的語音 會議系統(tǒng)可以保持少于語音會議中存在地用戶的CODEC,并且盡管如此 該語音會議系統(tǒng)可以用語音數(shù)據(jù)來服務(wù)所有用戶。另一方面,通過更少 的同時主動的CODEC—即通過語音會議中的所有語音終端設(shè)備而同時使用的所有CODEC的總計,或者通過所有同時舉行的語音會議的語音終端 設(shè)備而同時使用的所有CODEC的總計,減少了在語音會議系統(tǒng)中的計算 復(fù)雜性,從而或者可以節(jié)約計算容量,或者可以使用質(zhì)量更好的CODEC, 其中后者又對語音質(zhì)量和所占用的傳輸帶寬具有積極作用.
單個語音信號的疊加可以理解為對單個語音信號的求和,并且必要 時理解為連接在求和后面的信號表減.后者在此可以保證最大電平不會 被合成語音信號超過.此外,通過在疊加時對單個語音信號進行不同的 加權(quán),單個語音信號在疊加時可以被匹配到共同的音量水平.
在本發(fā)明的優(yōu)選設(shè)置中,可以這樣形成第一組,即只將在各自的記 錄信道上識別出主動性的語音終端設(shè)備分配給第一組,因此第一組和第 二組可以保持不相交.這樣做是有益的,因為在形成疊加時只需要注意 主動的單個語音信號.由此,要疊加的單個語音信號的數(shù)量減少了,并 且因此也降低了疊加的復(fù)雜性,除此之外也改善了疊加的合成語音信號 的語音質(zhì)量,因為那些雖然包括通常會引起干擾的背景噪聲但除此之外 不具有主動性的語音信號并不傳入合成語音信號中,因此通過本發(fā)明隱 含性地被濾出,
可替換地在本發(fā)明的另一個優(yōu)選設(shè)置中,可以這樣形成第一組,即 將語音會議的基本上非主動的語音終端設(shè)備或者將所有語音終端設(shè)備 也分配給第一組.用這種方式不需要對單個語音信號進行關(guān)于主動性/ 非主動性的提前檢查,由此可以避免在執(zhí)行本方法時的延遲.合成語音 信號在本設(shè)置中還包括非主動的單個語音信號,這些非主動的單個語音 信號通過廣泛的非主動性表征,其中主動的語音終端設(shè)備是占支配地位 的,從而滿足了合成語音信號基本上是主動語音終端設(shè)備的疊加信號的 目的.
按照本發(fā)明的優(yōu)選擴展,分配或者劃分到第一和/或第二組可以動 態(tài)地進行.第一個可能性是,通過在一個時間段過去之后對語音終端設(shè) 備的主動性進行分析,在規(guī)則的或者不規(guī)則的時間段過去之后對語音終 端設(shè)備的組的歸屬性進行檢查,根據(jù)在這個時間點占主導(dǎo)的主動性或者 根據(jù)在該時間段期間的主動性頻率和/或主動性持續(xù)時間,可以將已在 記錄信道上識別了主動性的語音終端設(shè)備標記為主動發(fā)言方,并且分配 給笫一組,類似地,可以在記錄信道上識別了非主動性時在將所屬的語20
音終端設(shè)備標記為被動的聽眾方,并且分配給笫二組.
除此之外或者可替換地可以重新執(zhí)行組的分配,所述組的分配通過 在一個記錄信道上的主動性改變而引發(fā),而主動性改變例如是從廣泛的 非主動性轉(zhuǎn)換成主動性或者相反,或者通過在一個語音終端設(shè)備上的使 用者動作來引發(fā),使用者動作例如可能是在一個語音終端設(shè)備上的按 鍵,通過該使用者動作表示,相應(yīng)的用戶想要主動地參與語音會議???替換地,為了向每個用戶分配講話的權(quán)利,可以通過語音會議的主持人 來執(zhí)行該使用者動作。
在本發(fā)明的另一種優(yōu)選擴展中可以形成第三組,所述第三組與第二 組類似只包括這樣的語音終端設(shè)備,則這些語音終端設(shè)備在它們的記錄 信道上具有廣泛的非主動性.優(yōu)選對第二組以及第三組分別使用互不相 同的編碼器,來對同樣輸入的合成語音信號進行編碼,從而向笫二組的 語音終端設(shè)備榆入通過第 一編碼器編碼的第 一合成語音數(shù)據(jù),而向第三 組的語音終端設(shè)備輸入通過笫二編碼器編碼的笫二合成語音數(shù)據(jù).因
此,例如可以這樣形成組,即將支持CODECG. 729的語音終端設(shè)備分配 給第二組,而支持G. 711的語音終端設(shè)備分到第三組.用這種方式可以 促使分別使用各個語音終端設(shè)備的質(zhì)量最好的CODEC,優(yōu)選將笫二組和 第三組分離,從而分配給這兩組中一組的語音終端設(shè)備只獲得第一合成 語音數(shù)據(jù)或者可替換地只獲得笫二合成語音數(shù)據(jù),其中支持多個CODEC 的語音終端設(shè)備,優(yōu)選分配給這樣的組,即該組使得可以輸出質(zhì)量最高 的輸出信號,和/或該組通過傳輸相應(yīng)的合成數(shù)據(jù)實現(xiàn)了最小的帶寬負 荷,
除了根據(jù)本發(fā)明的方法,前面所述的優(yōu)點、擴展和實施形式以類似 的方式適用于根據(jù)本發(fā)明的語音會議系統(tǒng).
下面借助于附圖進一步闡釋本發(fā)明的實施例。 在此在示意圖中
圖l示出具有語音會議服務(wù)器和參與語音會議的語音終端設(shè)備的通 信系統(tǒng),以及
圖2-圖5示出語音會議服務(wù)器的部件以及在各個不同的方法階段中在語音會議中這些部件之間的邏輯信號流和數(shù)據(jù)流.
具體實施例方式
在閨1以示意閨示出具有語音會議系統(tǒng)K0NF和多個語音終端設(shè)備 A, B, C, D, E, F和G的通信系統(tǒng).語音會議系統(tǒng)K0NF以及語音終端 設(shè)備A, B, C, D, E, F, G在所述實施例中基于面向分組的原理,其中 為了語音的傳輸以及發(fā)信號設(shè)置了沒有進一步示出的基于IP的傳輸網(wǎng) 絡(luò).語音終端設(shè)備A, B, C, D, E, F, G與語音會議系統(tǒng)K0NF的耦合 在圖1中分別通過各自的語音終端設(shè)備A, B, C, D, E, F, G與語音會 議系統(tǒng)K0NF之間的連接V來形象地說明,
在圖1至圖5中假設(shè),已經(jīng)通過語音會議系統(tǒng)K0NF建立了語音會 議,并且連接建立階段已經(jīng)結(jié)束.參與該語音會議的是所有的前述語音 終端設(shè)備A至G,
在閨1中示出的輸出情況是,在語音會議KONP中,就傳送語音來 說,語音終端設(shè)備A, B和C是主動的,而語音終端設(shè)備D, E, F和G 是非主動的.這個劃分在圖1中通過第一組和第二組GR1和GR2的橢圓 圖形來表明,其中GR1的橢圃形包括語音終端設(shè)備A, B, C, GR2的橢 圃形包括其余的語音終端設(shè)備D, E, F, G.通過連接V流動的語音數(shù)據(jù) 流在圖1中通過有方向的箭頭示出,其中將從各自的語音終端設(shè)備A, B, C, D, E, F, G向語音會議系統(tǒng)KONF傳輸?shù)恼Z音數(shù)據(jù)流稱為單個語音數(shù) 據(jù)ESD,而將從語音會議系統(tǒng)KONF向各自的語音終端設(shè)備A, B, C, D, E, F, G傳輸?shù)恼Z音數(shù)據(jù)流標記為合成語音數(shù)據(jù)SSD。
語音終端設(shè)備A, B, C, D, E, F, G中的一個語音終端設(shè)備上的用 戶是主動地參與語音會議還是僅僅被動地參與語音會議,在附圖標記 ESD中通過上標A來表示主動,通過上標P來表示被動(因此給出了 ESD' 或者ESDP)。產(chǎn)生各自的單個語音數(shù)據(jù)ESD的各語音終端設(shè)備A, B, C, D, E, F, G在參考標記ESD中通過語音終端設(shè)備A, B, C, D, E, F, G 的下標字母來表示.因此例如通過參考標記ESDPB來標記從語音終端設(shè) 備B輸出的單個語音數(shù)據(jù)的被動數(shù)據(jù)流.就合成語音數(shù)據(jù)而言,在各自 的參考標記SSD中給出從哪些源數(shù)據(jù)流疊加成合成語音數(shù)據(jù)流。這通過 將源語音終端設(shè)備A, B, C, D, E, F, G的字母作為下標來表明.因此例如將傳入語音終端設(shè)備A和B的數(shù)據(jù)流標記為SSD".
在該實施例中,在語音會議系統(tǒng)K0NF中,在給定的時間段內(nèi)對傳 入的語音數(shù)據(jù)進行分析,并且尤其是分析在該時間段內(nèi)是否識別出各語 音終端設(shè)備A, B, C, D, E, F, G的主動性或者被動性。該分析借助于 語音終端設(shè)備A, B, C, D, E, F, G的所有的單個語音數(shù)據(jù)ESD或者從 該ESD中解碼的單個語音信號來進行,困1的通信系統(tǒng)在此在這樣一個 時間點示出,即在該時間點語音終端設(shè)備A, B和C被識別為是主動的, 而語音終端設(shè)備D, E, F和G被確定為是非主動的.因此按照前面解釋 過的命名,單個語音數(shù)據(jù)ESD\, ESD ,ESD'是為主動的語音終端設(shè)備A, B, C傳入的.另外,語音會議系統(tǒng)KONF中的單個語音數(shù)據(jù)ESDV ESDP8, ESD 以及ESD 是為被動的語音終端設(shè)備D, E, F和G傳入的.根據(jù)本 發(fā)明,將從語音終端設(shè)備A, B和C傳入的單個語音數(shù)據(jù)ESD、 ESDV ES叭解碼成單個語音信號,并且疊加為共同的合成語音信號一 該合成語 音信號沒有示出.將該合成語音信號在另一個步驟中編碼成合成語音數(shù) 據(jù).由于對語音終端設(shè)備A, B和C的信號的疊加,將該合成語音數(shù)據(jù) 稱為SSD道,并且將該合成語音數(shù)據(jù)作為輸出數(shù)據(jù)流傳輸給被動的語音 終端設(shè)備D, E, F, G,也就是這些語音終端設(shè)備D, E, F, G通過在它 們各自記錄信道上的進一步的非主動性表征。因此,將相同的合成語音 數(shù)據(jù)SSDm輸入給所有被動的語音終端設(shè)備D, E, F, G.接著,在各語 音終端設(shè)備D, E, F, G中對在該各語音終端設(shè)備D, E, F, G中接收到 的合成語音數(shù)據(jù)SSD縱進行解碼,并且通過電話聽筒的揚聲器輸出給各 個用戶。
除此之外,為主動的語音終端設(shè)備A, B, C單獨傳輸合成語音數(shù)據(jù) SSD,例如為語音終端設(shè)備A傳榆經(jīng)過編碼的數(shù)據(jù),該數(shù)據(jù)是語音終端 設(shè)備B和語音終端設(shè)備C的單個語音信號的特定于終端設(shè)備的疊加.因 此將B和C的單個語音信號的經(jīng)過編碼的疊加作為合成語音數(shù)據(jù)SSDBC 傳輸給語音終端設(shè)備A.用類似方式分別將其余語音終端設(shè)備的單個語 音信號經(jīng)過疊加然后經(jīng)過編碼地輸入其他的主動語音終端設(shè)備B和C。
為語音端設(shè)備B輸入合成語音數(shù)據(jù)SSDm;,并且為語音終端設(shè)備C輸入
合成語音數(shù)據(jù)SSD,b,該合成語音數(shù)據(jù)SSDw和SSDw分別特定于終端設(shè)備 (特定于B或者C)而形成。因此為各自的語音終端設(shè)備A, B, C, D, E, F, G輸入合成語音數(shù) 據(jù)SSD,該合成語音數(shù)據(jù)SSD在各自的語音終端設(shè)備A, B, C, D, E, F, G上經(jīng)過解碼之后通過揚聲器輸出.在此合成語音數(shù)據(jù)SSD分別包含每 個用戶分別需要的語音會議的音頻分量.在各個語音終端設(shè)備A, B, C, D, E, F, G中對語音信號或者語音數(shù)據(jù)進行的廣泛的后處理,例如通過 音頻信號的疊加、提取和/或倒置(Inversion)而進行的后處理,在本 發(fā)明的范圍內(nèi)是不需要的.
至于主動性和非主動性(或者被動性)的確定到目前為止還沒有詳 細討論。主動性例如通過信號一次性地超過閾值電平來表征,可替換地, 在把信號分類為主動信號之前, 一個電平必須被多次超越。此外可以將 平均的和統(tǒng)計的分析引入到主動性評估中,可以檢查均勻的或者不均勻 的時間段;除此之外或者可替換地,超過或者不超過閾值可以引起關(guān)于 主動性的重估.
在解釋過圖1中關(guān)于實施本發(fā)明語音會議的粗略關(guān)聯(lián)之后,現(xiàn)在借 助于圖2以及其他的圖3-5來解釋,語音會議系統(tǒng)KONF如何執(zhí)行語音 數(shù)據(jù)的分析以及語音信號和語音數(shù)據(jù)的加工.在此在圖2中的輸出情況 與在圖l中的情況相同;也就是說語音終端設(shè)備A, B和C是主動的, 并且語音終端設(shè)備D, E, F和G是非主動的.在圖1中引入的單個語音 數(shù)據(jù)ESD、合成語音數(shù)據(jù)SSD—包括上下標、組GR1, GR2以及語音終端 設(shè)備A, B, C, D, E, F, G的標志,在圖2至困5中保持不變。
在圖2至困5中,將語音會議系統(tǒng)KONF分割成解碼單元DE、信號 混合單元MIX、編碼單元KE、主動性識別單元AE以及編碼控制單元KSE. 在這些圖中從左向右提供信號流,由此在語音會議系統(tǒng)K0NF中在左側(cè) 提供傳入的語音終端設(shè)備A, B, C, D, E, F, G的單個語音數(shù)據(jù)ESD, 并且分別在困2至圖5的右側(cè)示出從語音會議系統(tǒng)KONF輸出給各個語 音終端設(shè)備A, B, C, D, E, F, G的合成語音數(shù)據(jù)SSD.解碼單元DE 用長方形來表示,該解碼單元DE包括多個同樣用長方形來表示的解碼 器Dl至D7,解碼器Dl至D7在此是CODEC的解碼實例,例如G. 723 CODEC 或者G. 729 CODEC,解碼單元DE的輸入信息是語音終端設(shè)備A, B, C, D, E, F, G的單個語音數(shù)據(jù)ESD\, BSDV ESDac, ESDpd, ESDpb, ESDpp, ESD 的數(shù)據(jù)分組.為了將面向分組的經(jīng)過編碼的數(shù)據(jù)與未經(jīng)編碼的語音
13信號區(qū)分開來,在圖2至困5中用雙箭頭來表示數(shù)據(jù)或者數(shù)據(jù)分組,而用單箭頭來表示信號(也表示控制數(shù)據(jù))。
解碼單元DE的解碼器Dl至D7擁有用于將單個語音信號ESS傳輸至信號混合單元MIX的信號輸出端來作為輸出端.在信號混合單元MIX中基于傳入的單個語音信號ESS而形成不同的、疊加的混合信號作為合成語音信號,該合成語音信號又傳輸給編碼單元KE.該混合信號(在圖中表示為相加的單個語音信號一例如ESSb + ESS,)或合成語音信號通過各自CODEC的編碼器實例(Kodierins tanz ) Kl至K6編碼成合成語音數(shù)據(jù)SSD,并且傳輸給各自的語音終端設(shè)備A至G.
向主動性識別單元AE(根據(jù)權(quán)利要求15也稱為信號混合控制單元)輸入所有通過解碼單元DE榆出的單個語音信號ESS" ESSb, ESSc, ESSd,ESSb, ESSp, ESS"可替換地,也可以在將單個語音數(shù)據(jù)ESDAA, ESDAB,ESD、, ESDPD, ESDPB, ESDPP, ESD 輸入解碼單元DE之前,通過主動性識別單元AE來處理該單個語音數(shù)據(jù).主動性識別單元AE確定一定時間段內(nèi)的主動和被動的語音終端設(shè)備。所確定的信息接著通過該實施例范圍內(nèi)沒有進一步特殊化的信令輸入信號混合單元MIX以及編碼控制單元KSE,從而主動性識別單元AE除了識別主動性和被動性以外,還執(zhí)行用于控制信號混合的功能。借助輸入的信息,在信號混合單元MIX中控制并執(zhí)行不同的單個語音信號ESSA, ESSb, ESSc, ESSd, ESSb, ESSp, ESSc的混合.
除此之外,將該信息以及其他關(guān)于語音終端設(shè)備A至G的CODEC的信息INF傳輸給編碼控制單元KSE,接著編碼控制單元KSE確定語音終端設(shè)備A至G的組分配,所確定的組的歸屬性在此在圖2至固5中在編碼單元KE的輸出端上用虛線畫出的橢圃表示。在解碼單元DE、信號混合單元MIX以及編碼單元KE中的信號路徑同樣通過虛線示出,
在圖2中根據(jù)圖1中的示意困,將主動的語音終端設(shè)備A, B和C的單個語音數(shù)據(jù)ESDAA, ESDV ES叭輸入解碼單元DE.除此之外,將語音終端設(shè)備D, E, F和G的非主動單個語音數(shù)據(jù)ESDPD, BSDPB, ESDPP,ESD 同樣輸入解碼單元DE,在此,解碼通過各自的解碼器Dl至D7單獨進行。解碼器Dl至D7產(chǎn)生各自的單個語音信號ESSA, ESSb, ESSc,ESSd, ESSb, BSSp, ESSfi.將所述的單個語音信號ESS輸入信號混合單元MIX以及主動性識別單元AE.
主動性識別單元AE分析單個語音信號ESS,并且識別出語音終端設(shè)備A, B和C通過廣泛的主動性來表征,相反語音終端設(shè)備D, E, F和G通過廣泛的非主動性來表征.這借助一個或者多個信息消息傳輸給信號混合單元MIX.這在圖2中通過消息ACT和PAS來表示,其中消息ACT包括主動的語音終端設(shè)備A, B, C的列表,而消息PAS包括被動的語音終端設(shè)備D, E, F和G的列表.信號混合單元MIX處理這些消息,并且將三個主動語音終端設(shè)備信號ESSA, ESSb, ESSc中的兩個疊加成三個語音終端設(shè)備A, B, C中的每兩個的相應(yīng)的合成語音信號,以及疊加成所有三個語音終端設(shè)備信號ESSA, ESSb, ESSe的疊加.語音終端設(shè)備B和C的信號疊加一在圖2中稱為ESSB + ESSC—在此設(shè)置為給語音終端設(shè)備A的輸出,并且仍必須為此傳輸給編碼單元KE.類似地,為語音終端設(shè)備B進行語音終端設(shè)備A和C的單個語音信號的疊加ESSA + ESSe,以及為語音終端設(shè)備C進行語音終端設(shè)備A和B的單個語音信號的疊加ESSA+ ESSB,除此之外,根據(jù)本發(fā)明執(zhí)行所有三個主動語音終端設(shè)備信號的疊加BSSA + ESSB + ESSc,并且同樣輸入編碼單元KE。
編碼控制單元KSE得到關(guān)于主動的語音終端設(shè)備(A, B, C)和非主動的語音終端設(shè)備(D, E, F, G)的消息,并且額外地詢問哪個CODEC由哪個語音終端設(shè)備A, B, C, D, E, F, G來支持,這通過信息INF的輸入來表示.基于這些信息,現(xiàn)在編碼控制單元KSB可以將語音終端設(shè)備A, B, C, D, E, F, G分組,從而在第一組GR1中包括了所有主動的語音終端設(shè)備(即A, B, C),以及在第二組GR2中組合了所有被動的語音終端設(shè)備(即D, E, F, G).這樣做的前提是,所有被動的語音終端設(shè)備D, E, F, G分別支持同一個CODEC,從而隨后在語音終端設(shè)備D,E, F, G上的編碼又可以被解碼,
將組信息從編碼控制單元KSE傳輸給編碼羊元KE(在閨2中表示為消息"GR1: A, B, C"和"GR2: D, E, F, G").接著編碼單元1[B為分配給第一組GR1的主動語音終端設(shè)備A, B, C分別產(chǎn)生一個編碼器實例(或者從給出的編碼器池中檢索出 一個實例),以及為分配給第二組GR2的所有語音終端設(shè)備D, E, F, G產(chǎn)生一個共同的實例。所述笫一種情況在圖2中是編碼器U, K2和K3。用于非主動語音終端設(shè)備D, E, F,G的共同編碼器在困2中稱為K4.編碼器U通過對疊加的單個語音信號ESSb和ESSe進行編碼來對用于語音終端設(shè)備A的合成語音數(shù)據(jù)SSDBC進行編碼.用類似的方式通過編碼器K2處理語音終端設(shè)備A和C的疊加的單個語音信號ESS, + ESSe,并且借助合成語音數(shù)據(jù)SSDAe繼續(xù)傳遞給語音終端設(shè)備B,相應(yīng)地,通過編碼器K3來對語音終端設(shè)備A和B的疊加的單個語音數(shù)據(jù)ESS,和ESSB進行編碼,并且作為合成語音數(shù)據(jù)SSDAB輸入語音終端設(shè)備C.
編碼器K4處理三個主動語音終端設(shè)備A,B和C的經(jīng)過疊加的信號,即ESSA + ESSB + ESSe.通過編碼器K4產(chǎn)生共同的合成語音數(shù)據(jù)SSDABC,該合成語音數(shù)據(jù)SSD縦經(jīng)過復(fù)制并且通過各自的連接傳輸給非主動的語音終端設(shè)備D, E, F和G,
通過這種方式,對于語音終端設(shè)備D, E, F和G來說只需要一個編碼器K4,該編碼器為所有四個非主動的語音終端設(shè)備D, E, F, G共同產(chǎn)生待輸入的合成語音數(shù)據(jù)SSDABC.因此相對于現(xiàn)有技術(shù)節(jié)約了大量的編碼器.這種非主動語音終端設(shè)備的邏輯組合在圖2中通過具有標記GR2的橢圃示出,該橢圓包括用于語音終端設(shè)備D, E, F和G的合成語音數(shù)據(jù)SSDABC.
基于該配置以及圖2中示出的情況,現(xiàn)在在圖3中通過一個屬于到目前為止主動的語音終端設(shè)備C的用戶在一定的時間間隔內(nèi)沒有產(chǎn)生被識別為主動語音信號的語音信號,該到目前為止主動的語音終端設(shè)備C變?yōu)榉侵鲃印?br>
通過主動性識別單元AE確定,現(xiàn)在只有語音終端設(shè)備A和B是主動的,而語音終端設(shè)備C, D, E, F和G是非主動的。這借助消息ACT和PAS傳輸給信號混合單元MIX,接著通過信號混合單元MIX形成來自兩個主動語音終端設(shè)備A和B的混合信號一ESS* + ESSB。此外,每一個主動語音終端設(shè)備的信號混合單元MIX本來會產(chǎn)生其余語音終端設(shè)備的混合信號.因為在這種情況下只有兩個主動語音終端設(shè)備A和B,所以在產(chǎn)生混合信號的情況下就不需要疊加了 .只將語音終端設(shè)備B的單個語音信號ESSB提供給語音終端設(shè)備A,以及反過來將語音終端設(shè)備A的單個語音信號ESSA提供給語音終端設(shè)備B,兩個最后所述的單個語音信號ESS,和ESSB分別通過編碼器Kl和K2編譯成合成語音數(shù)據(jù)SSDb和SSIX,并且分別向語音終端設(shè)備A和B傳輸,使得傳輸給語音終端設(shè)備A的合成語音數(shù)據(jù)SSDB只表示對語音終端設(shè)備B的單個語音信號ESSB的編碼.類似地,向語音終端設(shè)備B只輸入語音終端設(shè)備A的語音數(shù)據(jù).
兩個主動語音終端設(shè)備A和B的經(jīng)過疊加的合成語音信號ESSA +ESSB與根據(jù)本發(fā)明的合成語音信號相對應(yīng),本發(fā)明的合成語音信號現(xiàn)在通過編碼器K4轉(zhuǎn)換為第一合成語音數(shù)據(jù)SSDAB.經(jīng)過轉(zhuǎn)換的合成語音數(shù)據(jù)SSD,B現(xiàn)在被復(fù)制到不同的連接V上,并且輸入給各個非主動的語音終端設(shè)備C至G.這基于通過編碼控制單元KSE的控制進行,該編碼控制單元KSE已識別出主動語音終端設(shè)備的第一組GR1只包括了語音終端設(shè)備A和B,而非主動語音終端設(shè)備的第二組GR2包括了語音終端設(shè)備C, D, E, F和G。這又通過具有標記GR2的橢圃在閨3中表示出來.
基于困2和圖3可以看出,在通常只有一個主發(fā)言方和多個次發(fā)言方暫時同時存在的語音會議中,借助本發(fā)明能夠明顯減少所使用的編碼器.這在最優(yōu)的極端情況下可以導(dǎo)致,為了能夠服務(wù)于該語音會議的所有語音終端設(shè)備而只需要使用兩個編碼器.
基于圖2,在圖4中觀察到一種相反的情況,其中到目前為止一直被動的語音會議成員 一語音終端設(shè)備D—通過在它自己的記錄信道上的主動性來表征,并且因此被分配到主動語音終端設(shè)備的組GR1中.語音終端設(shè)備A至D現(xiàn)在都是基本上主動的,并且所有的語音終端設(shè)備A至G相應(yīng)于它們的主動性通過主動性識別單元AE分類為或分組為主動的和被動的語音終端設(shè)備,這個分組信息又傳輸給信號混合單元MIX。該信號混合單元MIX用與之前的圖2和困3中類似的方式分別形成多個混合信號.分別給主動的語音終端設(shè)備A, B, C和D—個混合信號,而給被動的語音終端設(shè)備E, F和G共同的混合信號,最后所述的混合信號在此是四個主動語音終端設(shè)備A, B, C和D的單個語音信號的疊加ESSA+ ESSB+ESSc + ESSD.基于它們的主動性加上所支持的CODEC的信息,現(xiàn)在通過編碼控制單元KSE形成笫一組GR1和第二組GR2,從而在第一組GR1中包括主動的語音終端設(shè)備A, B, C和D,在笫二組GR2中包括非主動的語音終端設(shè)備E, P和G,
此外與圖2類似,使用編碼器K1, K2, K3和K4來為語音終端設(shè)備A, B, C, D, E, F和G產(chǎn)生信號.為了給到目前為止一直是非主動的但
17是現(xiàn)在被激活的語音終端設(shè)備D產(chǎn)生合成語音數(shù)據(jù)SSDm,在編碼單元KE中產(chǎn)生新的編碼器實例K5,該編碼器實例K5對語音終端設(shè)備A, B和C傳入的疊加的合成語音信號ESS, + ESSB + ESSc進行編碼,并且作為合成語音數(shù)據(jù)將SSDw傳輸給語音終端設(shè)備D。通過這種對編碼器的動態(tài)增加,可以靈活地對在語音終端設(shè)備的各個記錄信道上的主動性改變進行反應(yīng),與圖2相反,通過編碼器K4產(chǎn)生的合成語音數(shù)據(jù)SSD,歸只輸入現(xiàn)在還是非主動的語音終端設(shè)備E, F和G.
在圖5中進行根據(jù)本發(fā)明的一個擴展,其中并不是所有的語音終端設(shè)備都支持CODEC的一致準則.在此假設(shè),終端設(shè)備D和E分別支持具有極高語音質(zhì)量的共同的CODEC,而語音終端設(shè)備F和G只支持具有中等語音質(zhì)量的CODEC.此外如在圖2中一樣,所述的語音終端設(shè)備D, E,F和G通過它們的非主動性來表征,語音終端設(shè)備A, B和C同樣如在圖2中一樣是主動的.因此與圖2類似,主動性識別單元AE識別出語音終端設(shè)備A, B, C是主動的,而語音終端設(shè)備D, E, F和G是非主動的,并且主動性識別單元AE將該信息傳榆給信號混合單元MIX以及編碼控制單元KSE,用與在圖2中示出的同樣的方式,信號混合單元MIX為主動的語音終端設(shè)備A, B, C產(chǎn)生混合信號,以及為所有被動的語音終端設(shè)備D, E, F和G產(chǎn)生共同的疊加的合成語音信號ESS, + BSSb + ESSc,編碼控制單元KSE分析所傳輸?shù)年P(guān)于主動性和被動性的信息,以及關(guān)于通過語音終端設(shè)備A至G來支持的CODEC的信息INF,然后根據(jù)語音終端設(shè)備A至G的主動性和對CODEC的支持性,將語音終端設(shè)備A至G分為三組GRl, GR2和GR3。 GR1包括主動的語音終端設(shè)備A, B和C. GR2包括非主動的、支持盡可能最好的CODEC的語音終端設(shè)備。這在該實施例中只通過語音終端設(shè)備D和E給出.此外,編碼控制單元KSE將那些非主動的、但是不支持最高編碼質(zhì)量的非主動語音終端設(shè)備分成組GR3。那些是語音終端設(shè)備F和G.
然后,通過編碼單元KE為第一組GR1的語音終端設(shè)備A, B, C分別產(chǎn)生編碼器K1, K2和K3.為組GR2產(chǎn)生編碼器實例K4,并且為第三組GR3產(chǎn)生編碼器實例K6,其中在兩個最后所述的編碼器中輸入三個主動語音終端設(shè)備A, B和C的疊加的合成語音信號ESSa + ESSb + ESS"現(xiàn)在通過編碼器K4,將這個輸入的合成語音信號轉(zhuǎn)換為特定于該編碼器的
18第一合成語音數(shù)據(jù)SSD"m,并且將該第一合成語音數(shù)據(jù)SSD"成輸入語音終端設(shè)備D和E。此外,編碼器K6同樣從相同的合成語音信號中產(chǎn)生第二合成語音數(shù)據(jù)SSD"成,該相同的合成語音信號也將輸入笫四編碼器K4.因此通過編碼器K6產(chǎn)生特定于編碼器的合成語音數(shù)據(jù)SSD"痕,該合成語音數(shù)據(jù)SSD"度接著將輸入兩個非主動的語音終端設(shè)備F和G.因此,即使對CODEC的支持性不一致,本發(fā)明還是可以在編碼單元KE中明顯減少要使用的編碼器,而不必使用次優(yōu)的編碼器,盡管各個語音終端設(shè)備可以支持質(zhì)量更好的編碼器.
用類似的方式,本發(fā)明可以擴展到多個由非主動語音終端設(shè)備構(gòu)成的組,從而按照一定的判據(jù)為各組的語音終端設(shè)備進行最佳編碼,其中在下面的段落中解釋可能的優(yōu)化判據(jù).
當在前面的第二組和第三組GR2, GR3的分組基本上是根據(jù)待執(zhí)行的編碼的質(zhì)量判據(jù)而且由此根據(jù)要達到的語音質(zhì)量來進行時,也可以按照其他的適配判據(jù)或者不同判據(jù)的組合來進行編碼器選擇.從而例如可以考慮形成盡可能少的組.可替換地可以有這樣的判據(jù),即為組GR2,GR3中的至少一個分配非常多的語音終端設(shè)備.只要不存在任意多數(shù)量的編碼器,并且只能為確定的CODEC類型產(chǎn)生有限數(shù)量的實例,則另外的判據(jù)可以是產(chǎn)生一種CODEC類型的盡可能少的實例.除此之外,可以將針對編碼的期望計算消耗引入編碼器的選擇中,從而將語音會議服務(wù)
器中的計算消耗保持得很低或者最小化,另外可以注意用于所產(chǎn)生的合成語音數(shù)據(jù)的傳輸帶寬,從而不會產(chǎn)生與語音終端設(shè)備的連接的過髙負荷.應(yīng)該注意與一個或多個前述判據(jù)相關(guān)聯(lián)的判據(jù)是,使在同時舉行的所有語音會議中同時使用的編碼器數(shù)量最小化.
優(yōu)選按照混合的質(zhì)量判據(jù)和數(shù)量判據(jù)來選擇編碼器,從而例如作為最重要的判據(jù)優(yōu)選質(zhì)量最好的CODEC,該CODEC受到至少一個其它的語音終端設(shè)備支持,或者受到預(yù)定最小數(shù)量的其它語音終端設(shè)備支持.因此對于這樣的優(yōu)化,可能根據(jù)不同的判據(jù)并不選擇絕對的最佳,其中例如通過評估各個判據(jù)確定整體最佳,并且根據(jù)該整體最佳進行編碼器選擇.因此,優(yōu)選與確定要使用的編碼器一起確定組GR2、 GR3和可能的
其它組,因為這兩者相互影響并具有反饋。
在語音會議中只有少數(shù)用戶同時主動地參與語音會議的前提條件
19下,可以借助本發(fā)明的方法在編碼單元KE中明顯地減少計算消耗.在 此可以自適應(yīng)地執(zhí)行關(guān)于主動性和非主動性的分析,從而例如當語音信 道通過極度增大的主動語音數(shù)據(jù)流來表征時,改變主動性閾值,使得只 將兩個或者最多三個語音終端設(shè)備分組為主動的語音終端設(shè)備.因此可 以實現(xiàn),絕對不存在由許多主動語音終端設(shè)備產(chǎn)生的語音混亂,該語音 混亂反正也沒有語音終端設(shè)備的用戶可以理解.因此本發(fā)明還附加地用 于使語音會議的實施流水線化,以及提髙語音可理解性和語音清晰性。
為了在編碼單元中實現(xiàn)對編碼器的沒有干擾的激活和停用,適當?shù)?是信號只在基于相同的CODEC的編碼器之間輸入和輸出。例如,到目前 通過G. 723 CODEC來編碼的主動信號,可以在轉(zhuǎn)換為非主動性時被分配 給同樣使用該G. 723 CODEC的非主動語音終端設(shè)備組。用這種方式,在 編碼單元KE中轉(zhuǎn)換編碼器對語音終端設(shè)備來說是透明的.因此信息通 過編碼單元KE傳給各個語音終端設(shè)備不是強制性必須的.
可替換地,還可以在轉(zhuǎn)換編碼器時轉(zhuǎn)換到另一種方法。但是,在此 向語音終端設(shè)備附加地發(fā)出相應(yīng)的通知是有意義的,該通知表明向新 CODEC的轉(zhuǎn)換,從而向該語音終端設(shè)備指示同樣轉(zhuǎn)換成匹配的CODEC.
如果在語音通信系統(tǒng)中同時實施多個會議,那么本發(fā)明是尤其有益
的,因為通過這種方式明顯提高了要節(jié)約的編碼器的數(shù)量。解碼器的數(shù) 量在給出的發(fā)明中沒有減少,但是這并不是不利的,因為編碼單元KE 的計算消耗明顯超過解碼單元DE的計算消耗。
對于主動性和非主動性的識別可以應(yīng)用極為不同的方法。例如,在 此可以確定在確定的時間段內(nèi)的最大信號,該最大信號將與閾值相比 較。除此之外也可以確定平均的信號電平,該平均的信號電平將與閾值 相比較.優(yōu)選也可以識別信號電平的改變或者識別趨勢,從而在信號電 平稍微提高時就已經(jīng)可以識別出在短時間內(nèi)將傳輸關(guān)于記錄信道的重 要信息,從而激活該記錄信道.此外尤其優(yōu)選,主動性和非主動性之間 的轉(zhuǎn)換并不是在每個時間段內(nèi)都促使組的從屬性發(fā)生明顯的改變,因為 這也許對所產(chǎn)生的語音質(zhì)量不利。因此,包含滯后或者閾值開關(guān)是合理 的,從而當在較長時間段內(nèi)信號超過或者低于比較值時,才能識別主動 性和非主動性。此外可以定義多個閾值,從而轉(zhuǎn)換到一個組也許比轉(zhuǎn)換 到其它方向運行得快.由此可能考慮到以下亊實對于主動的用戶也會 出現(xiàn)談話間隙,該談話間隙不應(yīng)該立刻引起向非主動組的轉(zhuǎn)換.即使借助于語音終端設(shè)備來闡釋本發(fā)明,本發(fā)明也可以一般地用于 多媒體連接或者視頻連接,除此之外,所介紹的原理也可以應(yīng)用于面向 線路的通信系統(tǒng)來應(yīng)用.語音終端設(shè)備優(yōu)選是電話,然而在此也可以是
在工位計算機(Arbeitsplatzrechner )上的軟件應(yīng)用,通常也稱為軟 客戶端,語音會議系統(tǒng)可以是通信系統(tǒng)的中央設(shè)備,其中還可以考慮分 布式的架構(gòu),其中尤其是可以實現(xiàn)不依賴于是中央的還是分布式的服務(wù) 器方的信號混合和信號編碼,并且在終端設(shè)備中實現(xiàn)更小的復(fù)雜性.
權(quán)利要求
1. 一種用于在通信系統(tǒng)中實施具有至少三個語音終端設(shè)備(A,B,C,...)的語音會議的方法,其中語音終端設(shè)備(A,B,C,...)分別具有一接收信道,該接收信道用于接收經(jīng)過編碼的、在語音會議中累積的編碼語音數(shù)據(jù)(SSD),并且將通過對接收的語音數(shù)據(jù)(SSD)進行解碼而形成的語音信號輸出給各自的語音終端設(shè)備,和一記錄信道,該記錄信道用于為語音會議提供經(jīng)過編碼的語音數(shù)據(jù)(ESD),其中所提供的語音數(shù)據(jù)(ESD)通過編碼器形成在各個語音終端設(shè)備上記錄的語音信號,其特征是,將語音終端設(shè)備(A,B,C,...)中的至少一個設(shè)備至少暫時地分配給第一組(GR1),使得對于該第一組將通過它們各自的記錄信道提供的語音數(shù)據(jù)(ESD)分別解碼成單個語音信號(ESS),將所述單個語音信號(ESS)疊加成合成語音信號,并且將所述合成語音信號編碼為第一合成語音數(shù)據(jù)中(SSD),將語音終端設(shè)備(A,B,C,...)中的至少兩個至少暫時地分配給第二組(GR2),使得第二組(GR2)只包括這樣的語音終端設(shè)備(A,B,C,...),即在該語音終端設(shè)備(A,B,C,...)中識別出它們各自記錄信道上的廣泛的非主動性,以及向分配給第二組(GR2)的語音終端設(shè)備(A,B,C,...)通過它們各自的接收信道輸入第一合成語音數(shù)據(jù)(SSD),以用于各自輸出第一合成語音數(shù)據(jù)(SSD)。
2. 根據(jù)權(quán)利要求1所述的方法,其特征是,將語音終端設(shè)備(A, B, C,…)分配給笫一組(GR1)是這樣進行的,即第一組(GR1)只包 括在各自的記錄信道上被識別出廣泛的主動性的語音終端設(shè)備(A, B, C, .. ).
3. 根據(jù)前面任何一項權(quán)利要求所述的方法,其特征是,所述笫一 組(GR1)和/或第二組(GR2)一在一個時間段過去之后,和/或—通過在各個記錄信道中的一個記錄信道上識別出主動性改變,和/或—通過在所述語音終端設(shè)備(A, B, C,…)中的一個語音終端設(shè) 備上識別出使用者動作而重新形成.
4. 根據(jù)前面任何一項權(quán)利要求所述的方法,其特征是,通過對笫 一組(GR1)中的語音終端設(shè)備(A, B, C,…)的單個語音信號(ESS) 進行疊加,為笫一組(GR1 )中的語音終端設(shè)備(A, B, C,...)形成特 定于終端設(shè)備的合成語音信號,并且所述合成語音信號被編碼成特定于 終端設(shè)備的合成語音數(shù)據(jù)(SSD ),并且將特定于終端設(shè)備的合成語音數(shù) 據(jù)(SSD)通過所屬的接收信道輸入語音終端設(shè)備(A, B, C,...),以作為特定于終端設(shè)備的輸出.
5. 根據(jù)前面任何一項權(quán)利要求所述的方法,其特征是,將合成語 音信號編碼成與笫一合成語音數(shù)據(jù)(SSD")不同的笫二合成語音數(shù)據(jù)(SSD"),將語音終端設(shè)備中的至少兩個語音終端設(shè)備(F, G)至少暫時地分 配給第三組(GR3),使得笫三組(GR3)只包括在各自的記錄信道上識 別出廣泛的非主動性的語音終端設(shè)備,并且向分配給第三組(GR3)的語音終端設(shè)備(F, G)通過各自的接收 信道輸入第二合成語音數(shù)據(jù)(SSD"),以用于分別輸出第二合成語音數(shù) 據(jù)(SSD"),
6. 根據(jù)前面任何一項權(quán)利要求所述的方法,其特征是,合成語音 信號被編碼成第 一合成語音數(shù)據(jù)(SSD")通過恰好一個第 一編碼器(K4 ) 進行.
7. 根據(jù)前面任何一項權(quán)利要求所述的方法,其特征是,合成語音 信號被編碼成第二合成語音數(shù)據(jù)(SSD")通過恰好一個與第一編碼器(W)不同的第二編碼器(K5)進行.
8. 根據(jù)前面任何一項權(quán)利要求所述的方法,其特征是,自適應(yīng)地 進行編碼器的選摔.
9. 根據(jù)權(quán)利要求8所述的方法,其特征是,這樣進行各編碼器(Kl,2,...)的自適應(yīng)選擇,即—優(yōu)化所涉及的語音終端設(shè)備(A, B, C...)上的輸出質(zhì)量,或者 一優(yōu)化所涉及的語音終端設(shè)備(A, B, C...)的各自接收信道上的 傳輸帶寬,或者一將為語音會議同時使用的編碼器(n, K2,...)的數(shù)量最小化.
10. 根據(jù)前面任何一項權(quán)利要求所述的方法,其特征是,在識別分配給第一組(GR1)的語音終端設(shè)備(A, B, C…)的至少暫時的廣泛非 主動性時,—取消將非主動的語音終端設(shè)備(C)分配給第一組(GR1),并且 —將該非主動的語音終端設(shè)備(C)分配給第二組(GR2),
11. 根據(jù)前面任何一項權(quán)利要求所述的方法,其特征是,在識別分 配給第一組(GR1)的語音終端設(shè)備(C )的至少暫時的廣泛非主動性時, 將到目前為止用于將語音數(shù)據(jù)傳輸給該非主動語音終端設(shè)備的編碼器(K3)標記為可用.
12. 根據(jù)前面任何一項權(quán)利要求所述的方法,其特征是,在識別分 配給第二組(GR2)的語音終端設(shè)備(D)的至少暫時的廣泛主動性時,—取消將主動的語音終端設(shè)備(D)分配給第二組(GR2),并且 —將該主動的語音終端設(shè)備(D)分配給第一組(GR1).
13. 根據(jù)前面任何一項權(quán)利要求所述的方法,其特征是,在識別分 配給第二組(GR2)的語音終端設(shè)備(D)的至少暫時的廣泛主動性時,—為該主動的語音終端設(shè)備(D)形成特定于終端設(shè)備的合成語音 信號,并且—將標記為可用的編碼器U6 )分配給該主動的語音終端設(shè)備(D),并且—利用所述編碼器(K6)將用于該主動的語音終端設(shè)備(D)的特 定于終端設(shè)備的合成語音信號編碼成特定于主動語音終端設(shè)備(D)的 合成語音數(shù)據(jù)(SSDABC).
14. 一種用于通信系統(tǒng)中多個語音終端系統(tǒng)的語音會議系統(tǒng),其特 征是,具有用于執(zhí)行根據(jù)前面任一項方法權(quán)利要求所述方法的裝置.
15. 根據(jù)權(quán)利要求14所述的語音會議系統(tǒng),其特征是,具有—信號混合單元(MIX),所述信號混合單元(MIX)用于將分配給 第一組(GR1 )的語音終端設(shè)備(A, B, C…)的單個語音信號(ESS ) 疊加成合成語音信號,和/或?qū)⑦x擇的分配給第一組(GR1)的語音終端 設(shè)備(A, B, C...)的單個語音信號(ESS)分別疊加成特定于終端設(shè)備 的合成語音信號,和/或—信號混合控制單元(AE),所述信號混合控制單元(AE)用于從 語音會議的語音終端設(shè)備(A, B, C...)傳入的單個語音信號(ESS)中 選擇要通過信號混合單元(MIX)疊加的單個語音信號(ESS),和/或—具有多個可供使用的編碼器(n, K2,…)的編碼羊元(KE), 所述編碼單元(KE)通過分別選擇的編碼器(Kl, K2...)將合成語音信 號編碼成第一合成語音數(shù)據(jù)(SSD),和將特定于終端設(shè)備的合成語音信 號編碼成特定于終端設(shè)備的合成語音數(shù)據(jù)(SSD),和/或—編碼控制單元(KSE ),所述編碼控制單元(KSE )用于選擇和/或 配置要通過編碼單元(KE)使用的編碼器(Kl, K2,...),所述編碼器 (n, K2,...)分別是為合成語音信號和特定于終端設(shè)備的合成語音信 號而選擇的.
全文摘要
本發(fā)明涉及一種用于在通信系統(tǒng)中實施具有至少三個語音終端設(shè)備(A,B,C,…)的語音會議的方法和語音會議系統(tǒng),其中將語音終端設(shè)備(A,B,C,…)中的至少一個設(shè)備至少暫時地分配給第一組(GR1),使得對于該第一組將通過它們各自的記錄信道提供的語音數(shù)據(jù)(ESD)分別解碼成單個語音信號(ESS),將所述單個語音信號(ESS)疊加成合成語音信號,并且將所述合成語音信號編碼為第一合成語音數(shù)據(jù)中(SSD)。此外將語音終端設(shè)備(A,B,C,…)中的至少兩個至少暫時地分配給第二組(GR2),使得第二組(GR2)只包括這樣的語音終端設(shè)備(A,B,C,…),即在該語音終端設(shè)備(A,B,C,…)中識別出它們各自記錄信道上的廣泛的非主動性。此外向分配給第二組(GR2)的語音終端設(shè)備(A,B,C,…)通過它們各自的接收信道輸入第一合成語音數(shù)據(jù)(SSD),以用于各自輸出第一合成語音數(shù)據(jù)(SSD)。
文檔編號H04M3/56GK101502043SQ200680055414
公開日2009年8月5日 申請日期2006年7月28日 優(yōu)先權(quán)日2006年7月28日
發(fā)明者S·哈特曼, T·克利曼, V·吉爾格, W·施米德 申請人:西門子公司