一種會議系統(tǒng)中播放提示語音的方法及設(shè)備的制作方法

文檔序號：2833429閱讀：545來源：國知局

專利名稱：一種會議系統(tǒng)中播放提示語音的方法及設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及通信技術(shù)領(lǐng)域，尤其涉及會議系統(tǒng)中播放提示語音的方法和設(shè)備。
背景技術(shù)：
錯誤！未找到引用源。給出了一個典型的多個終端通過MCU (MultiControl Unit,多點控制單元)ioid的會議的組網(wǎng)圖，其中，未包含視頻部分。由于音頻語音會議系統(tǒng)的組網(wǎng)圖與此類似，不再單獨列舉。在圖I所示系統(tǒng)中，一個會場IOla通過麥克風102a()拾取與會場語音信號傳輸?shù)浇K端設(shè)備104a對會場語音信號進行壓縮編碼，然后將壓縮編碼后的會場語音信號經(jīng)由網(wǎng)絡(luò)傳輸?shù)組CUlOld中，其他會場101b、IOlc通過同樣的工作模式將會場語音信號傳輸?shù)組CUlOld中。MCUlOld對各個會場101a、101b、IOlc的會場語音信號進行解碼、混音、編碼，然后將編碼后的會場語音信號分別發(fā)送給各個會場101a、101b、101c，這樣就實現(xiàn)了多個會場可以互相聽到其他多個會場的聲音。在召集多點會議時，某些場景MCU需要對與會終端發(fā)送要播放的提示語音，以更清晰、明顯地提示與會者進行某些操作或者提醒與會者當前會議正處于什么樣的進程。例如在會議過程中有新會場加入時播放提示語音“歡迎加入會議”、當會議即將結(jié)束時播放提示語音“離會議結(jié)束還有5分鐘”等等。圖2給出了現(xiàn)有技術(shù)中，MCU實現(xiàn)對所有終端會場播放提示語音的情況。結(jié)合圖I，在會議過程中，MCU需要向所有與會終端會場播放提示語音，那么現(xiàn)有技術(shù)會直接將解碼器DEC(Decoder) I、DEC2、DEC3解碼產(chǎn)生的純音頻碼流按照混音規(guī)則混音完成后再與提示語音信號混音，以使得編碼器ENC(Encoder) I、ENC2、ENC3收到的即將編碼的音頻數(shù)據(jù)為本身混音的數(shù)據(jù)疊加上將要播放音頻提示語音信號，然后編碼器ENC1、ENC2、ENC3將此音頻數(shù)據(jù)進行壓縮編碼，再通過網(wǎng)絡(luò)發(fā)送給終端會場進行播放。以上工作過程就實現(xiàn)了 MCU設(shè)備對所有與會終端會場發(fā)送音頻互動語音應(yīng)當IVR(Interactive Voice Response)提示音。但現(xiàn)有技術(shù)存在如下問題I、按照現(xiàn)有技術(shù)，MCU需要向所有與會終端會場發(fā)送音頻提示語音時，是直接將音頻提示語音信號與會場語音信號進行混合疊加，再發(fā)送給ENCl、3(302b、304b)進行編碼后發(fā)送到終端會場進行播放。這樣做就使得提示語音的音量很難調(diào)節(jié)，如果提示語音過高將會使得聽音者無法聽清主席聲音，而如果提示語音的過低可能會導致聽音者無法聽清提示語音而產(chǎn)生其他不良影響。2、另一方面，由于MCU需要向所有會場發(fā)送提示語音，所以作為主席會場的ENC2(303b)也同樣會收到此IVR提示語音。那么當主席正在連續(xù)發(fā)言的時候，按照當前的技術(shù)，會直接將提示語音發(fā)送給主席會場，這樣會使得當前發(fā)言的主席會場有一種發(fā)言被打斷的感覺，體驗不好。

發(fā)明內(nèi)容
鑒于此，有必要提供一種會議系統(tǒng)中播放提示語音的方法和設(shè)備，用以解決現(xiàn)有技術(shù)存在的問題。一方面，本發(fā)明實施例提供一種會議系統(tǒng)中播放提示語音的方法對解碼后的會場語音信號進行VAD (Voice Activation Dectection,語音活動偵測)檢測，判斷所述會場語音信號是否處于語音激活狀態(tài)；如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為非語音激活狀態(tài)，則對所述解碼后的會場語音信號與提示語音信號進行混音處理，形成混合語音信號。另一方面，本發(fā)明實施例提供一種會議系統(tǒng)中播放提示語音的MCU設(shè)備，包括
VAD檢測模塊，對解碼后的會場語音信號進行VAD檢測，判斷所述解碼后的會場語音信號是否處于語音激活狀態(tài)；混音模塊，如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為非語音激活狀態(tài)，對所述解碼后的會場語音信號與提示語音信號進行混音處理，形成混合語音信號。本發(fā)明實施例通過會場語音信號進行VAD檢測，在會場語音信號處于非語音激活狀態(tài)下疊加提示語音，使得當前發(fā)言不會被突然打斷；在會場語音信號處于語音激活狀態(tài)下對提示語音進行AGC(Automatic Gain Control,自動增益控制)處理,可以優(yōu)先保證與會終端可以聽清會議正常聲音，在此前提下，盡可能保證與會終端可以聽清提示語音。通過以上有益效果，有效提升了發(fā)言和收聽的用戶體驗，解決了現(xiàn)有技術(shù)存在的問題。

為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹，顯而易見地，下面描述中的附圖是本發(fā)明的一些實施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。圖I是現(xiàn)有技術(shù)的系統(tǒng)構(gòu)架圖；圖2是現(xiàn)有技術(shù)的混首方法不意圖；圖3是本發(fā)明實施例一的方法流程圖；圖4是本發(fā)明實施例二的MCU設(shè)備結(jié)構(gòu)圖；圖5是本發(fā)明實施例三的MCU設(shè)備結(jié)構(gòu)圖；圖6是本發(fā)明實施例二的方法流程圖；圖7是本發(fā)明實施例四的MCU設(shè)備結(jié)構(gòu)圖；圖8是本發(fā)明實施例二的方法流程具體實施例方式為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚，下面將結(jié)合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述，顯然，所描述的實施例是本發(fā)明一部分實施例，而不是全部的實施例?；诒景l(fā)明中的實施例，本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護的范圍。以下結(jié)合附圖及實施例，對本發(fā)明所闡述的會議系統(tǒng)中播放提示語音的方法以及MCU設(shè)備做進一步詳細說明。應(yīng)當理解，此處所描述的具體實施例僅僅用以解釋本發(fā)明，并不用于限定本發(fā)明。
實施例I本發(fā)明實施例提供一種會議系統(tǒng)中播放提示語音的方法，請參考圖3，該方法包括SlOl :對解碼后的會場語音信號進行VAD檢測，判斷所述會場語音信號是否處于語音激活狀態(tài)；其中，在對會場語音信號進行VAD檢測之前，接收會場語音信號并將其解碼。S103:如果經(jīng)過所述解碼后的會場語音信號為非語音激活狀態(tài)，則對所述解碼后的會場語音信號與提示語音信號進行混音處理，形成混合語音信號。之后，接收上述混合語音信號并將其編碼。本發(fā)明實施例通過會場語音信號進行VAD檢測，在會場語音信號處于非語音激活·狀態(tài)下疊加提示語音，使得當前發(fā)言不會被突然打斷，有效提升了的用戶體驗，解決了現(xiàn)有技術(shù)存在的問題。實施例2本發(fā)明實施例提供一種會議系統(tǒng)中播放提示語音的MCU設(shè)備10，請參看圖4，包括VAD檢測模塊101，對解碼后的會場語音信號進行VAD檢測，判斷所述解碼后的會場語音信號是否處于語音激活狀態(tài)；混音模塊102，如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為非語音激活狀態(tài)，對所述解碼后的會場語音信號與提示語音信號進行混音處理，形成混合語音信號。其中，上述MCU設(shè)備10，還包括解碼模塊103，接收上述會場語音信號并將其解碼，并將解碼后的會場語音信號發(fā)送給VAD監(jiān)測模塊101。編碼模塊104，接收上述混合語音信號并將其編碼。上述MCU設(shè)備10，進一步包括提示語音模塊105，如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為語音激活狀態(tài)，則推遲向所述混音模塊102發(fā)送所述提示語音信號；如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為非語音激活狀態(tài)，則向所述混音模塊102發(fā)送所述提示語音信號；AGC模塊106，對上述提示語音信號進行AGC處理。上述提示語音模塊105，還用于如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為語音激活狀態(tài)，則向所述混音模塊發(fā)送經(jīng)過AGC處理的提示語音信號。本發(fā)明實施例通過會場語音信號進行VAD檢測，在會場語音信號處于非語音激活狀態(tài)下疊加提示語音，使得當前發(fā)言不會被突然打斷；在會場語音信號處于語音激活狀態(tài)下對提示語音進行AGC處理，可以優(yōu)先保證與會終端可以聽清會議正常聲音，在此前提下，盡可能保證與會終端可以聽清提示語音。通過以上有益效果，有效提升了發(fā)言和收聽時插播提示語音的用戶體驗，解決了現(xiàn)有技術(shù)存在的問題。實施例3本發(fā)明實施例提供一種會議系統(tǒng)中播放提示語音的方法，本發(fā)明實施例的總體構(gòu)架圖如圖5所示，方法流程圖如圖6所示。下面結(jié)合圖示對本發(fā)明實施例的方法進行闡述。
S201 :接收會場語音信號并將其解碼。解碼模塊103接收會場終端發(fā)送的會場RTP (Real-time TransportProtocol,實時傳送協(xié)議)語音信號并將其解碼，將解碼后的會場PCM(Pulse-code modulation,脈沖編碼調(diào)制)語音信號發(fā)送給混音模塊102。本例中，解碼模塊103 (2)接收與其對應(yīng)的會場終端發(fā)送的會場RTP語音信號并將其解碼發(fā)送到混音模塊102。S202:對解碼后的會場語音信號進行VAD檢測，判斷所述會場語音信號是否處于語音激活狀態(tài)；當需要向各會場發(fā)送提示語音信號時，例如，在會議過程中新會場加入時播放提示語音“歡迎加入會議”等，提示語音控制模塊107控制提示語音模塊106向混音模塊102 發(fā)送提示語音信號。在提示語音模塊105向混音模塊102發(fā)送提示語音信號之前，提示語音模塊105控制VAD檢測模塊對會場PCM語音信號進行VAD檢測。本例中，VAD檢測模塊對解碼模塊103⑵發(fā)送的會場PCM語音信號進行VAD檢測。S203 :如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為非語音激活狀態(tài)，則。如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為語音激活狀態(tài)，則延遲對所述解碼后的會場語音信號與提示語音的混音處理。上述對所述解碼后的會場語音信號與提示語音信號進行混音處理，形成混合語音信號的步驟，具體包括S2031 :提不語音模塊105向混音模塊102發(fā)送提不語音信號。S2032 :混音模塊102將會場PCM語音信號和提示語音信號進行混音處理，形成混
合語音信號。上述延遲對所述解碼后的會場語音信號與提示語音的混音處理的步驟，具體包括提不語音信號模塊105延遲向混音模塊102發(fā)送提不語音信號。需要說明的是，VAD檢測，用以檢測人在會議講話過程中發(fā)言之間的停頓，本例正是利用這個停頓時間來疊加提示語音。本領(lǐng)域的普通技術(shù)人員知道如何使用VAD檢測來進行監(jiān)測。S204 :接收混合語音信號并將其編碼?；煲裟K102將混合語音信號發(fā)送到編碼模塊104 ;編碼模塊104將混合語音信號進行編碼。本發(fā)明實施例通過會場語音信號進行VAD檢測，在會場語音信號處于非語音激活狀態(tài)下疊加提示語音，使得當前發(fā)言不會被突然打斷，有效提升了發(fā)言時插播語音提示的用戶體驗，解決了現(xiàn)有技術(shù)存在的問題。實施例4本發(fā)明實施例提供一種會議系統(tǒng)中播放提示語音的方法，本發(fā)明實施例的總體構(gòu)架圖如圖7所示，方法流程圖如圖8所示。下面結(jié)合圖示對本發(fā)明實施例的方法進行闡述。S301與S201相同，在此不贅述。S302:對解碼后的會場語音信號進行VAD檢測，判斷所述會場語音信號是否處于語音激活狀態(tài)；當需要向各會場發(fā)送提示語音信號時(例如，在會議過程中新會場加入時播放提示語音“歡迎加入會議”等)，提示語音控制模塊107控制提示語音模塊106向混音模塊102發(fā)送提示語音信號。在提示語音模塊105向混音模塊102發(fā)送提示語音信號之前，提示語音模塊105控制VAD檢測模塊對會場PCM語音信號進行VAD檢測。在本例中，VAD檢測模塊對混音模塊102發(fā)送的會場PCM語音信號進行VAD檢測。S303’ 如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為語音激活狀態(tài)，則對提示語音信號進行AGC處理，將處理后的提示語音信號與所述解碼后的會場語音信號進行混音處理，形成混合語音信號。S3031’:如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為語音激活狀態(tài)，則提示語音模塊105將提示語音信號發(fā)送到AGC模塊106進行AGC處理適當下調(diào)提示語音信號的音量，在保證提示語音信號可以被聽清的情況下，優(yōu)先保證會場語音信號的正常音量。如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為非語音激活狀態(tài)，則保持提示語音信號的默認音量，不進行AGC處理。需要說明的是，AGC處理是一種現(xiàn)有技術(shù)。S3032’ =AGC模塊106將經(jīng)過AGC處理后的解碼后的會場語音信號發(fā)送到混音模塊 102。S3033’ 混音模塊102將解碼后的會場語音信號和經(jīng)過AGC處理的提示語音信號進行混音處理，形成混合語音信號。S304與S204相同，在此不贅述。本發(fā)明實施例通過會場語音信號進行VAD檢測，在會場語音信號處于語音激活狀態(tài)下對提示語音進行AGC處理，可以優(yōu)先保證與會終端可以聽清會議正常聲音，在此前提下，盡可能保證與會終端可以聽清提示語音，有效提升了收聽時插播提示語音的用戶體驗，解決了現(xiàn)有技術(shù)存在的問題。通過以上的實施方式的描述，所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可以用硬件實現(xiàn)，或軟件實現(xiàn)，或固件實現(xiàn)，或它們的組合方式來實現(xiàn)。當使用軟件實現(xiàn)時，可以將上述功能存儲在計算機可讀介質(zhì)中或作為計算機可讀介質(zhì)上的一個或多個指令或代碼進行傳輸。計算機可讀介質(zhì)包括計算機存儲介質(zhì)和通信介質(zhì)，其中通信介質(zhì)包括便于從一個地方向另一個地方傳送計算機程序的任何介質(zhì)。存儲介質(zhì)可以是計算機能夠存取的任何可用介質(zhì)。以此為例但不限于計算機可讀介質(zhì)可以包括RAM、ROM、EEPROM、CD-ROM或其他光盤存儲、磁盤存儲介質(zhì)或者其他磁存儲設(shè)備、或者能夠用于攜帶或存儲具有指令或數(shù)據(jù)結(jié)構(gòu)形式的期望的程序代碼并能夠由計算機存取的任何其他介質(zhì)。此外。任何連接可以適當?shù)某蔀橛嬎銠C可讀介質(zhì)。例如，如果軟件是使用同軸電纜、光纖光纜、雙絞線、數(shù)字用戶線(DSL)或者諸如紅外線、無線電和微波之類的無線技術(shù)從網(wǎng)站、服務(wù)器或者其他遠程源傳輸?shù)?，那么同軸電纜、光纖光纜、雙絞線、DSL或者諸如紅外線、無線和微波之類的無線技術(shù)包括在所屬介質(zhì)的定影中。如本發(fā)明所使用的，盤(Disk)和碟(disc)包括壓縮光碟(CD)、激光碟、光碟、數(shù)字通用光碟(DVD)、軟盤和藍光光碟，其中盤通常磁性的復制數(shù)據(jù)，而碟則用激光來光學的復制數(shù)據(jù)。上面的組合也應(yīng)當包括在計算機可讀介質(zhì)的保護范圍之內(nèi)。
總之，以上所述僅為本發(fā)明技術(shù)方案的較佳實施例而已，并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進等，均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1.一種會議系統(tǒng)中播放提示語音的方法，其特征在于，所述方法包括對解碼后的會場語音信號進行VAD檢測，判斷所述解碼后的會場語音信號是否處于語音激活狀態(tài)；如果所述解碼后的會場語音信號為非語音激活狀態(tài)，則對所述解碼后的會場語音信號與提示語音信號進行混音處理，形成混合語音信號。
2.根據(jù)權(quán)利要求I所述的方法，其特征在于，所述，如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為非語音激活狀態(tài)，則對所述解碼后的會場語音信號與提示語音信號進行混音處理，形成混合語音信號，之后，所述方法還包括接收所述混合語音信號并將其編碼。
3.根據(jù)權(quán)利要求I所述的方法，其特征在于，所述方法進一步包括如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為語音激活狀態(tài)時，則延遲對所述解碼后的會場語音信號與提示語音進行混音處理，形成混合語音信號。
4.一種會議系統(tǒng)中播放提示語音的的方法，其特征在于，所述方法包括對解碼后的會場語音信號進行VAD檢測，判斷所述解碼后的會場語音信號是否處于語音激活狀態(tài)；如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為語音激活狀態(tài)時，則對所述提示語音信號進行AGC處理；將處理后的提示語音信號與所述解碼后的會場語音信號進行混音處理，形成混合語音信號。
5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述對所述提示語音信號進行AGC處理，具體包括將所述提示語音信號進行AGC處理，使得所述提示語音信號的音量保持在不干擾所述會場語音信號的范圍內(nèi)。
6.一種多點控制單元，其特征在于，所述MCU包括 VAD檢測模塊，用于對解碼后的會場語音信號進行VAD檢測，判斷所述解碼后的會場語音信號是否處于語音激活狀態(tài)；混音模塊，如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為非語音激活狀態(tài)，對所述解碼后的會場語音信號與提示語音信號進行混音處理，形成混合語音信號。
7.根據(jù)權(quán)利要求6所述的多點控制單元，其特征在于，所述多點控制單元還包括編碼模塊，接收所述混合語音信號并將其編碼。
8.根據(jù)權(quán)利要求6所述的多點控制單元，其特征在于，所述混音模塊還用于如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為語音激活狀態(tài)時，則延遲對所述解碼后的會場語音信號與提示語音進行混音處理，形成混合語音信號。
9.根據(jù)權(quán)利要求6所述的多點控制單元，其特征在于，所述多點控制單元還包括提示語音模塊，如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為語音激活狀態(tài)，則推遲向所述混音模塊發(fā)送所述提示語音信號；如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為非語音激活狀態(tài)，則向所述混音模塊發(fā)送所述提示語音信號。
10.一種多點控制單元，其特征在于，所述多點控制單元包括 VAD檢測模塊，用于對解碼后的會場語音信號進行VAD檢測，判斷所述解碼后的會場語音信號是否處于語音激活狀態(tài)； AGC模塊，用于對提示語音信號進行AGC處理；混音模塊，用于將處理后的提示語音信號與所述解碼后的會場語音信號進行混音處理，形成混合語音信號。
11.根據(jù)權(quán)利要求10所述的多點控制單元，其特征在于，所述AGC模塊，進一步用于將所述提示語音信號進行AGC處理，使得所述提示語音信號的音量保持在不干擾所述會場語音信號的范圍內(nèi)。
12.根據(jù)權(quán)利要求10所述的多點控制單元，其特征在于，所述多點控制單元還包括提示語音模塊，用于，如果經(jīng)過VAD檢測的所述解碼后的會場語音信號為語音激活狀態(tài)，則向所述混音模塊發(fā)送經(jīng)過AGC處理的提示語音信號。
全文摘要
本發(fā)明實施例提供一種會議系統(tǒng)中播放提示語音的方法以及MCU設(shè)備。其中方法包括對解碼后的會場語音信號進行VAD檢測，判斷所述會場語音信號是否處于語音激活狀態(tài)；如果經(jīng)過VAD檢測的解碼后的會場語音信號為非語音激活狀態(tài)，則對解碼后的會場語音信號與提示語音信號進行混音處理，形成混合語音信號。采用此方法，在會議進行過程中播放提示語音時，不會打斷用戶的正常發(fā)言或由于音量不合適干擾到用戶的正常發(fā)言，有效提升了用戶體驗。另外，本發(fā)明實施例還提供一種MCU設(shè)備。
文檔編號G10L19/012GK102915743SQ201210387520
公開日2013年2月6日申請日期2012年10月12日優(yōu)先權(quán)日2012年10月12日
發(fā)明者張冉冉申請人:華為技術(shù)有限公司

完整全部詳細技術(shù)資料下載