本發(fā)明涉及語音會議通信技術領域,尤其涉及一種共線語音會議分散混音系統(tǒng)。
背景技術:
人們對通信領域除了點對點通話的基本需求,對電話會議和視頻會議的通信需求也日益強烈。目前,電話會議和視頻會議的語音混音的實現(xiàn)方式大都是集中混音。集中混音要求所有與會成員將自己的語言發(fā)給一個或幾個混音服務器(如實現(xiàn)混音功能的電路交換機PBX或其它設備),混音服務器完成混音后將語音數(shù)據(jù)分發(fā)給每個與會成員。每個與會成員有一個語音輸出(來自與會成員的麥克風)和一個語音輸入(送至與會成員的聽筒)。對混音服務器來說,有多少與會成員就有與會成員相同數(shù)量的語音輸入(來自與會成員的麥克風)和語音輸出(將混音結(jié)果送至與會成員的聽筒)。對于電路交換機PBX或電路環(huán)網(wǎng)設備來說,每一個輸入和輸出都會獨占一個寶貴的時隙資源,同時會獨占傳輸路徑上的時隙資源。集中混音的這樣方式要求混音服務器的處理能力足夠強,并且?guī)捯獕蛴谩?/p>
技術實現(xiàn)要素:
針對現(xiàn)有技術的不足,本發(fā)明提出了一種共線語音會議分散混音系統(tǒng),該系統(tǒng)將每一個與會成員所屬的環(huán)網(wǎng)設備通過中繼連接成環(huán)網(wǎng);在共線會議時,每個與會成員只占用所屬的環(huán)網(wǎng)設備的一個時隙資源,只占用設備間傳輸中繼的一個時隙,解決了現(xiàn)有的集中混音系統(tǒng)中每個與會成員獨占大量的時隙資源以及混音處理對系統(tǒng)配置要求高的問題。
為了實現(xiàn)上述目的,本發(fā)明技術方案如下:
一種共線語音會議分散混音系統(tǒng),包括若干環(huán)網(wǎng)設備。各環(huán)網(wǎng)設備順次循環(huán)連接。每個環(huán)網(wǎng)設備分別與本站的語音收發(fā)終端進行語音數(shù)據(jù)傳輸。本站的環(huán)網(wǎng)設備接收上一站的環(huán)網(wǎng)設備的語音混音輸出,并消除上一站的環(huán)網(wǎng)設備的語音混音輸出中含有的本站的語音收發(fā)終端上一時刻發(fā)送的語音,得到本站的語音收發(fā)終端的接收語音。環(huán)網(wǎng)設備并且接收本站的語音收發(fā)終端本時刻發(fā)送的語音,并將本站的語音收發(fā)終端(3)本時刻發(fā)送的語音與接收語音進行疊加,得到本站的環(huán)網(wǎng)設備的語音混音輸出;本站的環(huán)網(wǎng)設備的語音混音輸出發(fā)送到下一站的環(huán)網(wǎng)設備。
進一步地,環(huán)網(wǎng)設備包含回聲消除模塊、混音模塊。回聲消除模塊的第一輸入端接收上一站的環(huán)網(wǎng)設備的語音混音輸出?;芈曄K第二輸入端接收本站的語音收發(fā)終端上一時刻發(fā)送的語音,本站的語音收發(fā)終端上一時刻發(fā)送的語音作為本時刻回聲消除參考。回聲消除模塊根據(jù)所述本時刻回聲消除參考消除上一站的環(huán)網(wǎng)設備的語音混音輸出中含有的本站的語音收發(fā)終端上一時刻發(fā)送的語音,得到本站的語音收發(fā)終端的接收語音。混音模塊的第一輸入端接收所述接收語音;混音模塊的第二輸入端接收本站的語音收發(fā)終端本時刻發(fā)送的語音?;煲裟K將所述接收語音與本站的語音收發(fā)終端本時刻發(fā)送的語音進行疊加,得到本站的環(huán)網(wǎng)設備的本時刻的語音混音輸出;本站的環(huán)網(wǎng)設備的本時刻的語音混音輸出發(fā)送到下一站的環(huán)網(wǎng)設備。
進一步地,環(huán)網(wǎng)設備包含回聲消除模塊、混音模塊?;芈曄K的第一輸入端與上一站的環(huán)網(wǎng)設備相連接?;芈曄K的第二輸入端與本站的語音收發(fā)終端的語音發(fā)送端相連接。回聲消除模塊的輸出端與混音模塊的第一輸入端相連接。回聲消除模塊的輸出端并且與本站的語音收發(fā)終端的語音接收端相連接?;煲裟K的第二輸入端與本站的語音收發(fā)終端的語音發(fā)送端相連接?;煲裟K的輸出端與下一站的環(huán)網(wǎng)設備相連接。
進一步地,所述環(huán)網(wǎng)設備還包含混音濾波模塊。本站的混音模塊通過混音濾波模塊與下一站的環(huán)網(wǎng)設備相連接。本站的混音模塊將所述接收語音與本站的語音收發(fā)終端本時刻發(fā)送的語音進行疊加,得到本站的環(huán)網(wǎng)設備的語音混音輸出;該語音混音輸出通過混音濾波模塊濾波后,再發(fā)送到下一站的環(huán)網(wǎng)設備。
進一步地,所述環(huán)網(wǎng)設備還包含輸入語音去直流模塊。語音收發(fā)終端的語音發(fā)送端通過輸入語音去直流模塊與本站的混音模塊的第二輸入端相連接。輸入語音去直流模塊用于消除本站的語音收發(fā)終端本時刻發(fā)送的語音中的直流分量。
進一步地,輸入語音去直流模塊包含輸入語音求差單元、輸入語音存儲單元。語音收發(fā)終端的語音發(fā)送端分別與輸入語音求差單元的輸入端、輸入語音存儲單元的第一輸入端相連接。輸入語音存儲單元的輸出端與輸入語音求差單元的第二輸入端相連接。輸入語音存儲單元的輸出端與混音模塊的第二輸入端相連接。
輸入語音存儲單元接收本站語音收發(fā)終端發(fā)送的本時刻的語音,并對本時刻的語音進行存儲,存儲的本時刻的語音作為輸入語音求差單元下一時刻求差運算時的上一時刻的語音。
輸入語音求差單元接收本站語音收發(fā)終端發(fā)送的本時刻的語音,并從輸入語音存儲單元中獲取本站的上一時刻的語音;并將本時刻的語音減去上一時刻的語音,得到本站本時刻的語音差值;輸入語音求差單元將本站本時刻的語音差值發(fā)送到混音模塊進行混音。
進一步地,語音收發(fā)終端包括混音服務器、若干個話機。本站的各話機分別通過混音服務器與本站的環(huán)網(wǎng)設備相連接?;煲舴掌鲗Ρ菊镜母髟挋C發(fā)送的語音進行逐一疊加,得到集中混音輸出,并將集中混音輸出發(fā)送到本站的環(huán)網(wǎng)設備上。
進一步地,所述混音濾波模塊為單極性IIR濾波器。
進一步地,所述混音濾波模塊的衰減系數(shù)為1/64。
進一步地,語音收發(fā)終端本時刻發(fā)送的語音在發(fā)送到輸入語音去直流模塊之前幅度被衰減。
進一步地,語音收發(fā)終端本時刻發(fā)送的語音在發(fā)送到輸入語音去直流模塊之前幅度被衰減1/16。
本發(fā)明的有益效果:
(1)本發(fā)明包括若干個環(huán)網(wǎng)設備,將每一個與會成員所屬的環(huán)網(wǎng)設備通過中繼連接成環(huán)網(wǎng)。在共線會議時,每個與會成員只占用所屬的環(huán)網(wǎng)設備的一個時隙資源,只占用設備間傳輸中繼的一個時隙。節(jié)約獨占的時隙資源可以提高環(huán)網(wǎng)設備間傳輸中繼的時隙利用率,使得在同等資源配置下可以支持更多的并發(fā)通信。
(2)本發(fā)明各站點的回聲消除模塊根據(jù)本時刻回聲消除參考消除上一站的環(huán)網(wǎng)設備的語音混音輸出中含有的本站的語音收發(fā)終端上一時刻發(fā)送的語音,得到本站的語音收發(fā)終端的接收語音,消除了回聲干擾。
(3)本發(fā)明中混音濾波模塊對本站每一幀混音后的語音混音輸出進行一次濾波,可以有效的去除混音后的直流分量。
(4)本發(fā)明的語音收發(fā)終端包含混音服務器、若干個話機。本站的各話機分別通過混音服務器與本站的環(huán)網(wǎng)設備相連接?;煲舴掌鲗Ρ菊镜母髟挋C發(fā)送的語音進行逐一疊加,得到集中混音輸出,并將集中混音輸出發(fā)送到本站的環(huán)網(wǎng)設備上。實現(xiàn)了集中混音和共線會議分散混音的結(jié)合,擴大了會議混音系統(tǒng)的容量,并減少了會議混音系統(tǒng)遠距離的傳輸時傳輸介質(zhì)的成本。
附圖說明
圖1為本發(fā)明的電路原理方框圖。
圖2為圖1中環(huán)網(wǎng)設備1的電路原理方框圖。
圖3為圖2中輸入語音去直流模塊14的電路原理方框圖。
圖4為混音系統(tǒng)中回聲產(chǎn)生的濾波器模型。
其中,圖1至圖4的附圖標記為:環(huán)網(wǎng)設備 1、傳輸介質(zhì) 2、語音收發(fā)終端 3;回聲消除模塊 11、混音模塊 12、混音濾波模塊 13、輸入語音去直流模塊 14;輸入語音求差單元 141、輸入語音存儲單元 142。
具體實施方式
下面結(jié)合附圖和實施例,進一步闡述本發(fā)明。
如圖1所示,一種共線語音會議分散混音系統(tǒng),包括若干環(huán)網(wǎng)設備1、以及連接環(huán)網(wǎng)設備1的傳輸介質(zhì)2。
環(huán)網(wǎng)設備1通過傳輸介質(zhì)2順次循環(huán)連接,構(gòu)成環(huán)網(wǎng)共線會議(后文簡稱為環(huán)網(wǎng))。每個環(huán)網(wǎng)設備1分別與本站上的語音收發(fā)終端3進行語音數(shù)據(jù)傳輸。
傳輸介質(zhì)2可以是E1傳輸、光纖或者無線通信介質(zhì)等。
本站的環(huán)網(wǎng)設備1接收上一站的環(huán)網(wǎng)設備1的語音混音輸出,并消除上一站的環(huán)網(wǎng)設備1的語音混音輸出中含有的本站的語音收發(fā)終端3上一時刻發(fā)送的語音,得到本站的語音收發(fā)終端3的接收語音,該接收語音發(fā)送給本站語音收發(fā)終端3。環(huán)網(wǎng)設備1并且接收本站的語音收發(fā)終端3本時刻發(fā)送的語音,并將本站的語音收發(fā)終端(3)本時刻發(fā)送的語音與接收語音進行疊加,得到本站的環(huán)網(wǎng)設備1的語音混音輸出;本站的環(huán)網(wǎng)設備1的語音混音輸出發(fā)送到下一站的環(huán)網(wǎng)設備1。需要理解的是,本發(fā)明中,所說的‘本時刻’減去‘上一時刻’所得的時間差為本站發(fā)送的語音在環(huán)網(wǎng)上環(huán)繞一周的時間。
各站點上的語音收發(fā)終端3發(fā)送的語音依次經(jīng)過各環(huán)網(wǎng)設備1循環(huán)混音一圈后,站點間傳輸?shù)恼Z音就包含了環(huán)上所有站點語音收發(fā)終端3的語音。本站的語音收發(fā)終端3的接收語音包含了除自己外環(huán)上所有站點與會成員的語音。
該環(huán)網(wǎng)共線會議采用的分散的多處混音的實現(xiàn)方式,目的是占用較少的時隙資源。該環(huán)網(wǎng)共線會議是在2M環(huán)網(wǎng)中,所有設備共同使用一個時隙(A律語音)或者兩個時隙(線性語音)傳輸語音。每個環(huán)網(wǎng)設備1為一個站點,每一個站點都需要做混音,從而實現(xiàn)會議功能。由于混音算法簡單易于實現(xiàn),每個與會成員的終端并沒有增加太多的任務量。
如圖2所示,具體地,環(huán)網(wǎng)設備1包含回聲消除模塊11、混音模塊12。回聲消除模塊11的第一輸入端與上一站的環(huán)網(wǎng)設備1相連接;回聲消除模塊11的第二輸入端與本站的語音收發(fā)終端3的語音發(fā)送端相連接;回聲消除模塊11的輸出端與混音模塊12的第一輸入端相連接;回聲消除模塊11的輸出端并且與本站的語音收發(fā)終端3的語音接收端相連接;混音模塊12的第二輸入端與本站的語音收發(fā)終端3的語音發(fā)送端相連接;混音模塊12的輸出端與下一站的環(huán)網(wǎng)設備1相連接。
回聲消除模塊11的第一輸入端接收上一站的環(huán)網(wǎng)設備1的語音混音輸出PORT(M-1);回聲消除模塊11第二輸入端接收本站的語音收發(fā)終端3上一時刻發(fā)送的語音MemberFrame,本站的語音收發(fā)終端3上一時刻發(fā)送的語音MemberFrame作為本時刻回聲消除參考。具體地,回聲消除模塊11第二輸入端接收本站的語音收發(fā)終端3發(fā)送的語音MemberFrame;回聲消除模塊11包含一語音緩存RAM;語音緩存RAM可以緩存回聲消除模塊11第二輸入端接收的最新的256幀語音MemberFrame;回聲消除模塊11根據(jù)環(huán)網(wǎng)的延時在語音緩存RAM中取得對應的語音收發(fā)終端3上一時刻發(fā)送的語音MemberFrame作為本時刻回聲消除參考?;芈曄K11根據(jù)所述本時刻回聲消除參考消除上一站的環(huán)網(wǎng)設備1的語音混音輸出Conf_Sum(M-1)中含有的本站的語音收發(fā)終端3上一時刻發(fā)送的語音MemberFrame,得到本站的語音收發(fā)終端3的接收語音PORT(M);混音模塊12的第一輸入端接收所述接收語音PORT(M);混音模塊12的第二輸入端接收本站的語音收發(fā)終端3本時刻發(fā)送的語音MemberFrame;混音模塊12將所述接收語音PORT(M)與本站的語音收發(fā)終端3本時刻發(fā)送的語音MemberFrame進行疊加,得到本站的環(huán)網(wǎng)設備1的語音混音輸出Conf_Sum(M);本站的環(huán)網(wǎng)設備1的語音混音輸出Conf_Sum(M)發(fā)送到下一站的環(huán)網(wǎng)設備1進行混音處理。其中,M<=L,L表示本會議環(huán)網(wǎng)中站點的個數(shù),M表示第M個站點。
每一個站點加入混音結(jié)果的語音經(jīng)過在環(huán)網(wǎng)上一圈的傳輸之后會再次來到本站點。如果這個語音,即上一時刻的語音,不被清除,會在環(huán)網(wǎng)上兜圈會導致混音結(jié)果只有“嗡嗡”聲。所以需要在每一個站點增加回聲消除功能,刪除“來自環(huán)上上一站”語音中本地的語音要素,其結(jié)果作為本站語音收發(fā)終端3接收的語音?!皝碜原h(huán)上上一站”語音經(jīng)過回聲消除模塊11之后只保留其它站點的語音。如果回聲消除效果做的好,可以使共線會議達到本地普通會議集中混音的語音效果。
與會成員在發(fā)言時,相應地,語音收發(fā)終端3發(fā)送語音MemberFrame至本站的環(huán)網(wǎng)設備1上,由于聲音是一個變化的交流信號,我們不希望其中含有直流分量。
因此,如圖2所示,環(huán)網(wǎng)設備1還包括輸入語音去直流模塊14。語音收發(fā)終端3的語音發(fā)送端通過輸入語音去直流模塊14與本站的混音模塊12的第二輸入端相連接。語音收發(fā)終端3發(fā)送的語音MemberFrame至本站的混音模塊12上前,首先經(jīng)過輸入語音去直流模塊14消除本時刻發(fā)送的語音MemberFrame中的直流分量。
設本站語音收發(fā)終端3本時刻發(fā)送的語音MemberFrame為第N幀,語音MemberFrame在環(huán)上走一圈回到本站的延遲了x幀,則通過輸入語音去直流模塊14獲取x幀前本站加入環(huán)網(wǎng)的語音差值DIFF為:
x幀前本站的語音差值DIFF(M)=MemberFrame(N-x)-MemberFrame(N-x-1);
語音差值DIFF中只含有表達語音變化的交流信號,有效的過濾了輸入信號中的直流分量。
各站的混音模塊12對語音差值DIFF進行混音,上一站的環(huán)網(wǎng)設備1的語音混音輸出Conf_Sum(M-1)含有x幀前本站的語音差值DIFF(M)。
具體地,如圖3所示,輸入語音去直流模塊14包含輸入語音求差單元141、輸入語音存儲單元142。
語音收發(fā)終端3的語音發(fā)送端分別與輸入語音求差單元141的輸入端、輸入語音存儲單元142的第一輸入端相連接;輸入語音存儲單元142的輸出端與輸入語音求差單元141的第二輸入端相連接;輸入語音存儲單元142的輸出端與混音模塊12的第二輸入端相連接。
輸入語音存儲單元142接收本站語音收發(fā)終端3發(fā)送的本時刻的語音MemberFrame(N),并對本時刻的語音MemberFrame(N)進行存儲,存儲的本時刻的語音MemberFrame(N)作為輸入語音求差單元141下一時刻求差運算時的上一時刻的語音MemberFrame(N-1)。
輸入語音求差單元141接收本站語音收發(fā)終端3發(fā)送的本時刻的語音MemberFrame(N),并從輸入語音存儲單元142中獲取本站的上一時刻的語音MemberFrame(N-1);并將本時刻的語音MemberFrame(N)減去上一時刻的語音MemberFrame(N-1),得到本站本時刻的語音差值DIFF(M);輸入語音求差單元141并將本站本時刻的語音差值DIFF(M)發(fā)送到混音模塊12進行混音。
本站的回聲消除模塊11將上一站的環(huán)網(wǎng)設備1的語音混音輸出Conf_Sum(M-1)減去x幀前的語音MemberFrame(N-x),消除回聲,即得到了本站的語音收發(fā)終端3的接收語音:
PORT(M)=Conf_Sum(M-1)-MemberFrame(N-x)。
此時,本站的語音收發(fā)終端3的接收語音PORT(M)語音包含了除自己外環(huán)網(wǎng)上所有站點與會成員的語音;PORT(M)并且作為本站混音模塊12當前幀混音的原始數(shù)據(jù)。
當前幀本站的語音差值DIFF(M)=MemberFrame(N)-MemberFrame(N-1)。
因此,經(jīng)過混音模塊12混音后,當前幀本站最新的語音混音輸出為Conf_Sum(M)=PORT(M)+DIFF(M)。
本會議中,每個站點的語音差值DIFF分為四種狀態(tài):未參與會議、新加入會議、已經(jīng)在會議中和退出會議。
未參與會議時,DIFF=0;
新加入會議時,DIFF=MemberFrame(N)-0;
已經(jīng)在會議中時,DIFF=MemberFrame(N)-MemberFrame(N-1);
退出會議時,DIFF=0-MemberFrame(N-1)。
較佳地,在語音收發(fā)終端3發(fā)送語音MemberFrame至本站的輸入語音去直流模塊14上之前,首先做適當?shù)乃p,降低幅度,可以防止混音后溢出導致失真。優(yōu)選地,衰減系數(shù)h為1/16。
常見的回聲其實質(zhì)就是原始語音的多徑延時并衰減后的累加和,因此可以把回聲看成是原始語音經(jīng)過一個濾波器后產(chǎn)生的。該濾波器模型如圖4所示,回聲f(n)=sum(h(n)*X(n))。
h(n)表示各原始語音X(n)延時后對應的衰減系數(shù)。
回聲消除的關鍵就是通過自適應算法得出各個時延的衰減系數(shù),從而重構(gòu)出的語音信號就是回聲,兩者相減即可完成回聲消除。
由于環(huán)網(wǎng)的特殊場景,決定了以下兩點:(1)、單路徑延時,只有一個128us整數(shù)倍延遲的回聲,不存在多徑延時;(2)、衰減只與環(huán)網(wǎng)站點數(shù)相關。因此,環(huán)網(wǎng)回聲可簡化為f=h*X。
設當前為第N幀,語音在環(huán)網(wǎng)上走一圈回到本站的延時了x幀,如前所述,x幀前本站點加入會議的語音為:
x幀前本端口語音差值DIFF(M)=MemberFrame(N-x)-MemberFrame(N-x-1);
該語音差值DIFF(M)經(jīng)過x幀后再次來到本站點,上一站的環(huán)網(wǎng)設備1的語音混音輸出為Conf_Sum(M-1);
環(huán)網(wǎng)回聲簡化為f(N)=Coff*MemberFrame(N-x);Coff即為x幀延時后的語音MemberFrame(N-x)的衰減系數(shù)h。
此時,上一站的環(huán)網(wǎng)設備1的語音混音輸出為Conf_Sum(M-1)含有DIFF(M-x);
上一站的環(huán)網(wǎng)設備1的語音混音輸出經(jīng)過本站經(jīng)過回聲消除模塊11消除回聲后,即得到本站的語音收發(fā)終端3的接收語音為:
PORT(M)=Conf_Sum(M-1)-Coff*MemberFrame(N-x)。
如圖2所示,較佳地,環(huán)網(wǎng)設備1還包括混音濾波模塊13,本站的混音模塊12通過混音濾波模塊13與下一站的環(huán)網(wǎng)設備1相連接?;煲魹V波模塊13用于濾除混音模塊12的語音混音輸出Conf_Sum內(nèi)的直流分量。本站的混音模塊12將所述接收語音PORT(M)與本站的語音收發(fā)終端3當前幀發(fā)送的語音進行疊加,得到本站的環(huán)網(wǎng)設備1的語音混音輸出Conf_Sum;該語音混音輸出Conf_Sum通過混音濾波模塊13濾除直流分量后,再發(fā)送到下一站的環(huán)網(wǎng)設備1進行混音處理。
混音濾波模塊13使用單極性IIR濾波器,采用遞歸型結(jié)構(gòu),即結(jié)構(gòu)上帶有反饋環(huán)路,每個站點當前幀得到的語音混音輸出Conf_Sum在本站僅執(zhí)行一次濾波。
較佳地,混音濾波模塊13的衰減系數(shù)h為1/64。假設環(huán)網(wǎng)支持的站點有三十二個。本站當前幀發(fā)送的語音MemberFrame(N)在本站混音前首先經(jīng)過前述1/16衰減,在本站混音后進過本站混音濾波模塊13的1/64衰減;之后經(jīng)過后面的第二站到第三十一站依次混音后,共衰減三十次1/64衰減;語音MemberFrame(N)到達第三十二站(環(huán)網(wǎng)的最后一站),不被衰減,直接被接聽;語音MemberFrame(N)返回到本站之后,直接被回聲消除模塊11清除,不會在環(huán)網(wǎng)上產(chǎn)生回聲。
語音收發(fā)終端3為話機,話機包括麥克風、聽筒。麥克風接收與會成員的原始語音,為語音收發(fā)終端3的語音發(fā)送端;聽筒為語音收發(fā)終端3的語音接收端。
環(huán)網(wǎng)上的兩個環(huán)網(wǎng)設備1可能距離較遠,在另一個實施例中,可以使用集中混音和共線會議分散混音結(jié)合的方式實現(xiàn)擴容。語音收發(fā)終端3包括混音服務器、若干個話機。本站的各話機分別通過混音服務器與本站的環(huán)網(wǎng)設備1相連接?;煲舴掌鲗⒈菊旧系亩鄠€話機的各語音逐一疊加混音后,得到集中混音輸出,并將集中混音輸出發(fā)送到本站的環(huán)網(wǎng)設備1上。此時,依然將混音服務器及其相連的各話機看做“一路話機”的角色。
本發(fā)明支持多個獨立的共線會議,每個共線會議有一個唯一的會議號,每一個會議號有一個Conf_Sum,所以有多少個獨立的共線會議就有多少個Conf_Sum。每個與會成員都是根據(jù)會議號加入對應的會議。
以上所述的僅是本發(fā)明的優(yōu)選實施方式,本發(fā)明不限于以上實施例??梢岳斫猓绢I域技術人員在不脫離本發(fā)明的基本構(gòu)思的前提下直接導出或聯(lián)想到的其它改進和變化均應認為包含在本發(fā)明的保護范圍之內(nèi)。