專利名稱:電話會議的錄音方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,特別涉及一種電話會議的錄音方法和設(shè)備。
背景技術(shù):
隨著IP網(wǎng)絡(luò)的廣泛部署及IP語音技術(shù)的發(fā)展,IP電話會議作為一種經(jīng)濟(jì)高 效的會議解決方案,逐步在企業(yè)得到越來越多的應(yīng)用,大大提高了人們溝通、 協(xié)作的效率。
會議作為一種多人交流的手段,會議記錄往往是必要的,對于IP電話會議 來講,IP電話會議的錄音就是一種會議記錄的形式。在實(shí)際的應(yīng)用場景中,IP 電話會議的錄音要求除對會議的內(nèi)容進(jìn)行錄音外,還需要能夠完成錄音信息 的存儲,并可以進(jìn)一步實(shí)現(xiàn)對錄音文件的備份、管理、檢索以及播放等多種 功能。
相對于傳統(tǒng)PSTN網(wǎng)絡(luò),電話會議數(shù)據(jù)是經(jīng)過編碼處理,并進(jìn)行IP打包后, 在IP通信網(wǎng)絡(luò)(局域網(wǎng)、廣域網(wǎng))上進(jìn)行傳輸,而不是在傳統(tǒng)的雙絞銅絲線上 進(jìn)行的。
因此,IP電話會議錄音不能采用傳統(tǒng)的搭線錄音方式來實(shí)現(xiàn),相應(yīng)的,出 現(xiàn)了會議內(nèi)置錄音功能、鏡像抓包等錄音技術(shù)。
現(xiàn)有的IP電話會議錄音方案之一是采用鏡像抓包的技術(shù),在如圖l所示的 網(wǎng)絡(luò)架構(gòu)中,將錄音服務(wù)器和IP電話會議服務(wù)器同時接到一臺以太網(wǎng)交換機(jī) 上,通過交換機(jī)的端口鏡像功能,將IP電話會議服務(wù)器所連接的端口鏡像到錄 音服務(wù)器所連接的端口上,這樣錄音系統(tǒng)可以抓到所有端口的語音數(shù)據(jù),進(jìn) 行錄音。
在實(shí)現(xiàn)本發(fā)明的過程中,申請人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題 1、現(xiàn)有技術(shù)的鏡像抓包錄音技術(shù)要求以太網(wǎng)交換機(jī)有鏡像功能,需要按 要求配置鏡像端口,對用戶現(xiàn)有網(wǎng)絡(luò)配置改動較大。2、現(xiàn)有技術(shù)的鏡像4爪包錄音技術(shù)需要鏡像多個語音流,參與電話會議的 每個會議參與方都提供了一條語音流,然后由錄音服務(wù)器進(jìn)行合并(如果只 選取某一條語音流,那錄音就沒有對應(yīng)參與方的聲音),這樣的技術(shù)方案導(dǎo) 致最后的會議錄音與實(shí)際會議出現(xiàn)差異。
例如,對于有A、 B、 C、 D、 E、 F六方參加的電話會議,假如動態(tài)選擇 其中的四方進(jìn)行混音,在某個時刻選擇A、 B、 C、 D混音,那么對于A,只能 聽到B、 C、 D的混音,同理
B只能聽到A、 C、 D混音,
C只能聽到A、 B、 D混音,
D只能聽到A、 B、 C混音,
而E、 F可以聽到A、 B、 C、 D的完整混音。
但這不意味著只要錄E、 F接收的混音就能實(shí)現(xiàn)對電話會議的錄音,因?yàn)椋?還存在另外一個問題,就是,混音方是動態(tài)選擇的。也就是說,在另一個時 刻,可能選擇另外四方混音。如果通過鏡像抓包錄音,將找不到一條流能代 表整個會議的實(shí)際情況。
并且,除了選擇不了一條現(xiàn)有的流來錄音,也不能通過現(xiàn)有流再加工, 例如,如果需要對混音后的文件進(jìn)行再次混音,或者對發(fā)言重新混音等都不 能實(shí)現(xiàn)。
因?yàn)榘凑宅F(xiàn)有的技術(shù)方案,假如需要把混音后的文件再次混音,將會出 現(xiàn)回音現(xiàn)象,即B+C+D, A+C+D, A+B+D, A+B+C和A+B+C+D等幾條流再 次混合,將出現(xiàn)同一個聲音會出現(xiàn)多次的問題,如果加入時間稍有不同步, 就會發(fā)生回聲現(xiàn)象。
另一方面,假如需要對原始發(fā)言進(jìn)行混音,將需要錄音系統(tǒng)嚴(yán)格按照會 議系統(tǒng)的混音策略和算法來做。但是,在實(shí)際的操作過程中,要讓錄音系統(tǒng) 與會議系統(tǒng)嚴(yán)格保持一致,實(shí)施難度會非常大,這相當(dāng)于在錄音系統(tǒng)中重建 一個會議系統(tǒng)。
發(fā)明內(nèi)容
7本發(fā)明提供一種電話會議的錄音方法和設(shè)備,實(shí)現(xiàn)在不需要鏡像功能的 網(wǎng)絡(luò)架構(gòu)中,對電話會議進(jìn)行錄音,同時,避免回聲和無法再加工等錄音缺 陷。
為達(dá)到上述目的,本發(fā)明一方面提供了一種電話會議的錄音方法,應(yīng)用 于包括至少兩個電話會議參與終端、 一個電話會議服務(wù)器和一個錄音服務(wù)器 的系統(tǒng)中,其中,所述電話會議參與終端通過所述電話會議服務(wù)器參與一個
電話會議,所述電話會議具有唯一的標(biāo)識,所述方法包括
所述電話會議開始時,所述電話會議服務(wù)器向所述錄音服務(wù)器發(fā)送錄音 啟動報文,啟動所述電話會議的錄音,其中,所述錄音啟動報文包含所述電 話會議的標(biāo)識及基本信息、所述多個電話會議參與終端的信息和錄音啟動標(biāo)
識;
所述電話會議服務(wù)器實(shí)時的將接收到的所述電話會議參與終端發(fā)送的媒 體流進(jìn)行混音處理,并將混音處理后的媒體流發(fā)送給所述錄音服務(wù)器,其中,
所述混音處理后的媒體流攜帶所述電話會議的標(biāo)識;
所述電話會議結(jié)束時,所述電話會議服務(wù)器向所述錄音服務(wù)器發(fā)送錄音 結(jié)束報文,結(jié)束所述電話會議的錄音,其中,所述錄音結(jié)束報文包含所述電 話會議的標(biāo)識和錄音結(jié)束標(biāo)識。
優(yōu)選的,所述電話會議服務(wù)器向所述錄音服務(wù)器發(fā)送錄音啟動報文或錄 音結(jié)束報文的時間,具體通過以下方式設(shè)定
所述電話會議服務(wù)器根據(jù)預(yù)設(shè)電話會議的標(biāo)識所對應(yīng)的電話會議的開始 時間或結(jié)束時間確定向所述錄音服務(wù)器發(fā)送錄音啟動報文或錄音結(jié)束報文的 時間;或,
所述電話會議服務(wù)器根據(jù)接收到的所述電話會議參與終端發(fā)送的啟動指 令或結(jié)束指令確定向所述錄音服務(wù)器發(fā)送錄音啟動報文或錄音結(jié)束報文的時 間。
優(yōu)選的,所述電話會議參與終端發(fā)送的啟動指令或結(jié)束指令,通過所述 電話會議參與終端中預(yù)設(shè)的觸發(fā)按鍵或觸發(fā)按鍵組合來觸發(fā); 其中,所述啟動指令和所述結(jié)束指令,具體為預(yù)設(shè)的錄音啟動消息和錄音結(jié)束消息;或,
在未錄音狀態(tài)下所述電話會議參與終端發(fā)送的錄音"t喿作指令,和在錄音 狀態(tài)下所述電話會議參與終端發(fā)送的錄音操作指令。
優(yōu)選的,所述電話會議服務(wù)器實(shí)時的將接收到的所述電話會議參與終端 發(fā)送的媒體流進(jìn)行混音處理之后,還包括
所述電話會議服務(wù)器分別向各所述電話會議參與終端實(shí)時的發(fā)送混音處 理后的媒體流,其中,所述向各所述電話會議參與終端實(shí)時的發(fā)送的混音處 理后的媒體流不包含各所述電話會議參與終端自身所對應(yīng)的媒體流。
優(yōu)選的,如果所述電話會議服務(wù)器實(shí)時的將混音處理后的媒體流發(fā)送給 所述錄音服務(wù)器進(jìn)行錄音的過程中,新的電話會議參與終端加入所述電話會 議,或所述電話會議中的電話會議參與終端退出所述電話會議,具體包括
所述電話會議服務(wù)器向所述錄音服務(wù)器發(fā)送加入報文或退出報文,其中, 所述加入報文中包含所述電話會議的標(biāo)識、加入的所述電話會議參與終端的 信息和加入標(biāo)識,所述退出報文中包含所述電話會議的標(biāo)識、退出的所述電 話會議參與終端的信息和退出標(biāo)識;或,
所述電話會議服務(wù)器記錄加入的所述電話會議參與終端的信息或退出的 所述電話會議參與終端的信息。
優(yōu)選的,當(dāng)所述電話會議的錄音過程中,所述電話會議服務(wù)器向所述錄 音服務(wù)器發(fā)送加入報文或退出報文時,所述電話會議服務(wù)器向所述錄音服務(wù) 器發(fā)送錄音結(jié)束^^艮文,結(jié)束所述電話會議的錄音之后,還包括
所述錄音服務(wù)器將包含所述電話會議的標(biāo)識的所述錄音啟動報文、所述 混音處理后的媒體流、所述錄音結(jié)束報文和所述加入報文或退出報文生成錄 音文件,并將所述電話會議的標(biāo)識及基本信息、所述多個電話會議參與終端 的信息作為所述錄音文件的標(biāo)識信息。
優(yōu)選的,當(dāng)所述電話會議服務(wù)器記錄加入的所述電話會議參與終端的信 息或退出的所述電話會議參與終端的信息時,所述電話會議服務(wù)器向所述錄 音服務(wù)器發(fā)送錄音結(jié)束報文,結(jié)束所述電話會議的錄音之后,還包括
所述電話會議服務(wù)器將所述加入的所述電話會議參與終端的信息或退出
9的所述電話會議參與終端的信息和所述電話會議的標(biāo)識發(fā)送給所述錄音服務(wù)
器;
所述錄音服務(wù)器將包含所述電話會議的標(biāo)識的所述錄音啟動報文、所述 混音處理后的媒體流、所述錄音結(jié)束報文和所述加入的所述電話會議參與終 端的信息或退出的所述電話會議參與終端的信息生成錄音文件,并將所述電 話會議的標(biāo)識及基本信息、所述多個電話會議參與終端的信息作為所述錄音 文件的標(biāo)識信息。
另一方面,本發(fā)明還提供了一種電話會議服務(wù)器,應(yīng)用于包括至少兩個 電話會議參與終端、 一個電話會議服務(wù)器和一個錄音服務(wù)器的系統(tǒng)中,其中, 所述電話會議參與終端通過所述電話會議服務(wù)器參與一個電話會議,所述電 話會議具有唯一的標(biāo)識,包括
通信模塊,用于接收所述電話會議參與終端發(fā)送的媒體流,并將混音處 理后的媒體流發(fā)送給所述錄音服務(wù)器,還用于向所述錄音服務(wù)器發(fā)送錄音啟 動報文或錄音結(jié)束報文,啟動或結(jié)束所述電話會議的錄音,其中,所述錄音 啟動報文包含所述電話會議的標(biāo)識及基本信息、所述多個電話會議參與終端 的信息和錄音啟動標(biāo)識,所述錄音結(jié)束報文包含所述電話會議的標(biāo)識和錄音 結(jié)束標(biāo)識,所述混音處理后的媒體流攜帶所述電話會議的標(biāo)識;
混音才莫塊,與所述通信模塊連接,用于實(shí)時的將所述通信模塊接收到的 各所述電話會議參與終端發(fā)送的媒體流進(jìn)行混音處理,并發(fā)給所述通信模塊。
優(yōu)選的,所述電話會議服務(wù)器還包括
設(shè)置模塊,用于設(shè)置需要錄音的電話會議的標(biāo)識;
檢測模塊,與所述設(shè)置模塊和所述通信模塊連接,用于檢測所述設(shè)置模 塊所設(shè)置的電話會議的標(biāo)識所對應(yīng)的電話會議的開始或結(jié)束,并觸發(fā)所述通 信模塊向所述錄音服務(wù)器發(fā)送錄音啟動報文或錄音結(jié)束報文。
優(yōu)選的,所述通信模塊,還用于接收所述電話會議參與終端發(fā)送的啟動 指令或結(jié)束指令,并根據(jù)所述啟動指令或結(jié)束指令向所述錄音服務(wù)器發(fā)送錄 音啟動纟艮文或錄音結(jié)束l艮文。優(yōu)選的,所述電話會議服務(wù)器還包括
處理模塊,與所述通信模塊和所述混音模塊連接,用于在所述混音模塊 進(jìn)行混音處理后的媒體流中分別刪除各所述電話會議參與終端自身發(fā)送的媒
體流;
所述通信模塊,用于將所述處理模塊進(jìn)行處理后的々某體流分別發(fā)送給相 應(yīng)的電話會議參與終端,在所述媒體流中不包含所述電話會議參與終端自身 所發(fā)送的媒體流。
優(yōu)選的,所述電話會議服務(wù)器還包括
存儲模塊,與所述通信模塊連接,用于存儲電話會議錄音過程中,加入 的所述電話會議參與終端的信息或退出的所述電話會議參與終端的信息;
所述通信模塊,還用于將所述存儲模塊所存儲的加入的所述電話會議參 與終端的信息或退出的所述電話會議參與終端的信息和所述電話會議的標(biāo)識 發(fā)送給所述錄音服務(wù)器。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)
通過本發(fā)明,對于電話會議的錄音可以避免鏡像抓包錄音,從而不需要 對IP網(wǎng)絡(luò)進(jìn)行任何改動,并且,電話會議的會議功能和錄音功能獨(dú)立,減少了 相互影響,提高整個系統(tǒng)的可靠性。
圖i為現(xiàn)有技術(shù)中的采用鏡像抓包的技術(shù)的網(wǎng)絡(luò)架構(gòu)結(jié)構(gòu)示意圖; 圖2為本發(fā)明提供的一種電話會議的錄音方法的流程示意圖; 圖3為本發(fā)明提供的一種電話會議的錄音方法的組網(wǎng)結(jié)構(gòu)示意圖; 圖4為本發(fā)明提供的一種實(shí)際應(yīng)用場景中電話會議的錄音方法的流程示 意圖5為本發(fā)明提供的錄音啟動報文的結(jié)構(gòu)示意圖; 圖6為本發(fā)明提供的參與者列表報文的結(jié)構(gòu)示意圖; 圖7為本發(fā)明提供的RTP報文的結(jié)構(gòu)示意圖; 圖8為本發(fā)明提供的媒體報文處理流程示意圖;圖9為本發(fā)明提供的加入或退出報文的結(jié)構(gòu)示意圖; 圖IO為本發(fā)明提供的電話會議服務(wù)器的結(jié)構(gòu)示意圖。
具體實(shí)施例方式
如背景技術(shù)所述,現(xiàn)有的技術(shù)方案依賴于具有鏡像功能的網(wǎng)絡(luò)交換機(jī), 并且由于媒體流的選擇局限,會出現(xiàn)回聲或者錄音不全的情況,對錄音效果 產(chǎn)生不利的影響。
本發(fā)明所提出的技術(shù)方案是將IP電話會議中指定會議的基本信息及混音 數(shù)據(jù)復(fù)制后發(fā)給錄音服務(wù)器,來為錄音服務(wù)器提供某個電話會議的信息(會 議ID、會議名稱、參與人員等)及會議混音數(shù)據(jù),錄音服務(wù)器獲得這些數(shù)據(jù) 后,完成IP電話會議中某個會議的錄音。
該方案不限制參與電話會議的終端數(shù)量,可以靈活實(shí)現(xiàn)對IP電話會議的錄音。
在本發(fā)明所提出的技術(shù)方案中,可以通過唯一的電話會議標(biāo)識對電話會 議服務(wù)器和錄音服務(wù)器之間的交互信息進(jìn)行標(biāo)識,從而將屬于一個電話會議 的全部信息經(jīng)過整合處理后,生成統(tǒng)一的錄音文件,并能進(jìn)行后續(xù)的管理和 檢索服務(wù)。
如圖2所示,為本發(fā)明所提出的一種電話會議的錄音方法,應(yīng)用于包括 至少兩個電話會議參與終端、 一個電話會議服務(wù)器和一個錄音服務(wù)器的系統(tǒng)
議,電話會議具有唯一的標(biāo)識。 該方法具體包括以下步驟
步驟S201、電話會議服務(wù)器向錄音服務(wù)器發(fā)送錄音啟動報文,啟動電話 會議的錄音。
其中,錄音啟動報文包含電話會議的標(biāo)識及基本信息、多個電話會議參 與終端的信息和錄音啟動標(biāo)識。
步驟S202、電話會議服務(wù)器實(shí)時的將接收到的至少兩個電話會議參與終 端發(fā)送的媒體流進(jìn)行混音處理,并將混音處理后的媒體流發(fā)送給錄音服務(wù)器。
12其中,混音處理后的媒體流攜帶電話會議的標(biāo)識。
如果電話會議服務(wù)器實(shí)時的將混音處理后的媒體流發(fā)送給錄音服務(wù)器進(jìn) 行錄音的過程中,新的電話會議參與終端加入電話會議,或電話會議中的電 話會議參與終端退出電話會議,本步驟還可以包括相應(yīng)的加入和退出處理機(jī)
制,具體包括以下兩種情況
情況一、電話會議服務(wù)器向錄音服務(wù)器實(shí)時反饋加入或退出情況。 電話會議服務(wù)器向錄音服務(wù)器發(fā)送加入報文或退出報文,其中,加入報 文中包含電話會議的標(biāo)識、加入的電話會議參與終端的信息和加入標(biāo)識,退 出報文中包含電話會議的標(biāo)識、退出的電話會議參與終端的信息和退出標(biāo)識。 情況二,電話會議服務(wù)器記錄加入或退出情況。
電話會議服務(wù)器記錄加入的電話會議參與終端的信息或退出的電話會議 參與終端的信息。
另一方面,在本步驟進(jìn)行的過程中,同時還可以包括電話會議服務(wù)器向 該電話會議的各參與終端反饋其他參與終端的媒體流的過程,該過程具體通 過以下方式實(shí)現(xiàn)
體流的混音處理后的々某體流,并在該媒體流中攜帶該電話會議的標(biāo)識。
通過上述步驟,使各電話會議參與終端獲得該電話會議中其他電話會議 參與終端所發(fā)送的媒體流,即能夠聽到其他終端的語音,從而,保證電話會
議功能的正常實(shí)現(xiàn)。
并且,由于各電話會議參與終端收到的媒體流中不包含自身的媒體流信 息,所以,不會出現(xiàn)回聲等影響電話會議質(zhì)量的情況。
步驟S203、電話會議服務(wù)器向錄音服務(wù)器發(fā)送錄音結(jié)束才艮文,結(jié)束電話 會議的錄音。
其中,錄音結(jié)束報文包含電話會議的標(biāo)識和錄音結(jié)束標(biāo)識。 對應(yīng)前述的加入和退出處理機(jī)制的差異,本步驟中也存在相應(yīng)的流程區(qū) 別,具體說明如下
對于前述的電話會議服務(wù)器向錄音服務(wù)器實(shí)時反饋加入或退出情況的情況一,電話會議服務(wù)器向錄音服務(wù)器發(fā)送錄音結(jié)束報文,結(jié)束電話會議的錄
音之后,還包括
錄音服務(wù)器將包含電話會議的標(biāo)識的錄音啟動報文、混音處理后的^C體 流、錄音結(jié)束報文和加入才艮文或退出報文生成錄音文件,并將電話會議的標(biāo) 識及基本信息、多個電話會議參與終端的信息作為錄音文件的標(biāo)識信息。
對于前述的電話會議服務(wù)器記錄加入或退出情況的情況二,電話會議服 務(wù)器向錄音服務(wù)器發(fā)送錄音結(jié)束報文,結(jié)束電話會議的錄音之后,還包括
電話會議服務(wù)器將加入的電話會議參與終端的信息或退出的電話會議參 與終端的信息和電話會議的標(biāo)識發(fā)送給錄音服務(wù)器;
錄音服務(wù)器將包含電話會議的標(biāo)識的錄音啟動報文、混音處理后的媒體 流、錄音結(jié)束報文和加入的電話會議參與終端的信息或退出的電話會議參與 終端的信息生成錄音文件,并將電話會議的標(biāo)識及基本信息、多個電話會議 參與終端的信息作為錄音文件的標(biāo)識信息。
在具體的應(yīng)用場景中,上述兩種方式的區(qū)別在于加入或退出的電話會議 參與終端的信息是由誰來記錄,這僅是錄音過程中的差異,錄音結(jié)束時,無 論先前是由電話會議服務(wù)器還是錄音服務(wù)器記錄,都需要將全部的信息反饋 給錄音服務(wù)器,并由錄音服務(wù)器生成的錄音文件攜帶,因此,具體應(yīng)用哪種 方式并不影響本發(fā)明的保護(hù)范圍。
需要進(jìn)一步指出的是,在具體的應(yīng)用場景中,上述的電話會議服務(wù)器向 錄音服務(wù)器發(fā)送錄音啟動報文或錄音結(jié)束報文的時間具體可以通過以下方式 設(shè)定
方式一、電話會議服務(wù)器根據(jù)預(yù)設(shè)電話會議的標(biāo)識所對應(yīng)的電話會議的 開始或結(jié)束確定向錄音服務(wù)器發(fā)送錄音啟動報文或錄音結(jié)束報文的時間。
方式二、電話會議服務(wù)器根據(jù)接收到的電話會議參與終端發(fā)送的啟動指 令或結(jié)束指令確定向錄音服務(wù)器發(fā)送錄音啟動"^艮文或錄音結(jié)束^^文的時間。
其中,電話會議參與終端發(fā)送的啟動指令或結(jié)束指令,通過電話會議參 與終端中預(yù)設(shè)的觸發(fā)按鍵或觸發(fā)按鍵組合來觸發(fā)。
在具體的應(yīng)用場景中,啟動指令和結(jié)束指令具體可以為以下兩種形式1、 預(yù)設(shè)的錄音啟動消息和錄音結(jié)束消息。
2、 在未錄音狀態(tài)下電話會議參與終端發(fā)送的錄音操作指令,和在錄音狀 態(tài)下電話會議參與終端發(fā)送的錄音操作指令。
對于這種情況,可以實(shí)現(xiàn)管理員或主持人隨時根據(jù)需要對正在召開的電
話會議進(jìn)行錄音,這種方式通常使用電話的DTMF按鍵(如按"*2,,來啟動 錄音,再次按"*2,,來結(jié)束錄音)來完成錄音的啟動、停止等操作,電話會議 服務(wù)器收到相應(yīng)的DTMF碼后對指定的電話會議進(jìn)行錄音。
在具體的應(yīng)用場景中,管理員或主持人觸發(fā)電話的DTMF按鍵,從而發(fā) 送了一次錄音操作指令,這個操作指令可以是單獨(dú)設(shè)定的錄音啟動指令或錄 音結(jié)束指令,也可以是統(tǒng)一的錄音操作指令,對于這種情況,電話會議服務(wù) 器如果是在非錄音狀態(tài)下接收到該錄音操作指令,則認(rèn)為該錄音操作指令是 錄音啟動指令,如果實(shí)在錄音狀態(tài)下接收到該錄音操作指令,則認(rèn)為該錄音 操作指令是錄音結(jié)束指令。
具體采用上述哪種技術(shù)方案并不影響本發(fā)明的保護(hù)范圍。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)
通過本發(fā)明,對于電話會議的錄音可以避免鏡像抓包錄音,從而不需要 對IP網(wǎng)絡(luò)進(jìn)行任何改動,并且,電話會議的會議功能和錄音功能獨(dú)立,減少了 相互影響,提高整個系統(tǒng)的可靠性。
下面,結(jié)合具體的應(yīng)用場景對本發(fā)明的技術(shù)方案進(jìn)行說明,如圖3所示, 為一種具體場景下的IP電話會議錄音方案所對應(yīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。
對應(yīng)該應(yīng)用場景,如圖4所示,本發(fā)明所提出的技術(shù)方案包括以下步驟 步驟S401、多個電話會議參與終端連接IP電話會議服務(wù)器,進(jìn)行電話會 議接入。
步驟S402、錄音啟動時,IP電話會議服務(wù)器向錄音服務(wù)器發(fā)送錄音啟動 報文。
其中,錄音啟動報文中攜帶如下信息
1 、該電i舌會i義的標(biāo)識,即該電i舌會i義的ID;2、 該電話會議的其他基本信息,包括電話會議名稱、電話會議參與終 端IP地址、電話會議參與終端號碼、電話會議參與終端名稱、編解碼、加密 密鑰等。
3、 錄音開始標(biāo)志
電話會議服務(wù)器將上述的信息封裝成標(biāo)準(zhǔn)的XML格式的報文或文件,發(fā) 送給指定的錄音服務(wù)器,具體的封裝格式示例如圖5所示。
其中,record—start為錄音啟動/停止標(biāo)志true為啟動錄音、false為停止 錄音,缺省為true;
confjd為該電話會議的ID;
conf—name為該電"i舌會i義的名稱;
conf_codec為該電話會議采用的編解碼;
srtp_key為該電話會議加密的密鑰(只有采用SRTP時有效)。
同時,電話會議服務(wù)器會將當(dāng)前會議的電話會議參與終端列表的信息封 裝到標(biāo)準(zhǔn)的XML格式的報文或文件中,發(fā)送給指定的錄音服務(wù)器,具體的封 裝格式示例如圖6所示。
其中,conf—id為該電話會議的ID;
participant—ip為參與方的IP i也i止;
participant—number為參與方的電話號碼;
participant—name為參與方的名稱。
需要說明的是,上述的當(dāng)前會議的電話會議參與終端列表的信息所封裝 的XML格式的報文或文件可以攜帶在上述的錄音啟動報文中一并發(fā)送,也可 以在錄音啟動報文發(fā)送后在單獨(dú)發(fā)送,這樣的變化并不影響本發(fā)明的保護(hù)范 圍。
步驟S403、錄音啟動后,IP電話會議服務(wù)器實(shí)時復(fù)制一份語音媒體流, 發(fā)給指定的錄音服務(wù)器。
在具體的應(yīng)用場景中,上述的語音媒體流即RTP報文,封裝格式的示例 如圖7所示。
本步驟具體的處理過程如圖8所示,包括以下步驟
16步驟S801、當(dāng)需要錄音時,電話會議服務(wù)器接收各電話會議參與終端發(fā) 送的各自的語音媒體流。
步驟S802、電話會議服務(wù)器將接收到的各電話會議參與終端的語音媒體 流進(jìn)行混音處理。
步驟S803、電話會議服務(wù)器將混音處理后的音頻媒體流發(fā)送給各電話會 議參與終端。
如果原始混音媒體流中包含了某個電話會議參與終端的聲音,那么在向 該該電話會議參與終端發(fā)送媒體流報文時,需要把這個電話會議參與終端自 身的聲音去掉。
通過本步驟,使各電話會議參與終端獲取該電話會議的全部語音信息的 同時,不會產(chǎn)生回音等不利影響,從而保證電話會議的正常實(shí)現(xiàn)。
步驟S804、電話會議服務(wù)器向錄音服務(wù)器發(fā)送一份攜帶電話會議標(biāo)識的 的會議混音報文。
這里所說的會議混音報文即RTP負(fù)載報文,在向錄音服務(wù)器發(fā)送該混一 混音報文之前,電話會議服務(wù)器會把對應(yīng)的會議ID添加到RTP負(fù)載報文前, 然后進(jìn)行UDP和IP頭的封裝,并發(fā)送給錄音服務(wù)器,其中,IP頭所對應(yīng)的 地址為指定的錄音服務(wù)器的地址。
需要指出的是,本步驟所對應(yīng)的操作和步驟S803所對應(yīng)的操作可以是同 時進(jìn)行的,因此,上述的步驟S803和步驟S804沒有必然的先后順序。這樣 的變化并不影響本發(fā)明的保護(hù)范圍。
錄音過程中,如有新的參與者通過參與終端加入或退出電話會議,則執(zhí) 行步驟S氛
步驟S404、 IP電話會議服務(wù)器將包含加入或退出該電話會議的參與終端 的信息的加入或退出報文發(fā)送給錄音服務(wù)器。
其中,加入或退出該電話會議的參與終端的信息,具體包括電話會議 的ID、電話會議參與終端的IP地址、電話會議參與終端的號碼、電話會議參 與終端的名稱等。
進(jìn)一步的,電話會議服務(wù)器將上述的信息及加入/退出標(biāo)志封裝成標(biāo)準(zhǔn)的XML報文,發(fā)送給指定的錄音服務(wù)器。
具體的封裝格式示例如圖9所示,其中,字段說明如下
join_flag為電話會議參與終端加入或退出會議的標(biāo)識,其中,true表示加
入會議、false表示退出會議,如果該字段缺省,則默認(rèn)為為true; conf一id為該電"i舌會i義的ID; participant—ip為電話會議參與終端的IP地址; participant—number為電i舌會i義參與終端的電話號石馬; participant—name為電i舌會i義參與終端的名稱; datetime為電話會議參與終端加入或退出電話會i義的時間。 步驟S405、錄音結(jié)束時,IP電話會議服務(wù)器向錄音服務(wù)器發(fā)送包含電話
會議標(biāo)識的錄音結(jié)束報文。
具體的,電話會議服務(wù)器將該電話會議的會議ID、錄音結(jié)束標(biāo)識封裝成
標(biāo)準(zhǔn)的XML報文,發(fā)送給指定的錄音服務(wù)器,封裝格式和啟動報文類似,在
此不再另行敘述。
步驟S406、錄音服務(wù)器根據(jù)錄音啟動報文、錄音結(jié)束報文、參與者列表
報文組織起來,形成完整的錄音文件。
同時,將會議編解碼、SRTP密鑰、會議名稱、電話會議參與終端列表等 信息作為錄音文件的標(biāo)識信息,并通過上述標(biāo)識信息完成錄音文件的回放、 存儲、檢索等操作。
需要進(jìn)一步指出的是,上述的錄音文件生成過程,可以是根據(jù)會議ID, 將各終端參與該會議的過程中所發(fā)送的RTP報文處理后統(tǒng)一生成一個完整的 錄音文件(例如mp3格式,wav格式等),也可以是根據(jù)會議ID,將所有包 含該會議ID的RTP報文進(jìn)行統(tǒng)一存儲(如存儲于一個一改會議ID為名稱的 文件夾或數(shù)據(jù)包中),具體錄音文件的生成方式的變化并不影響本發(fā)明的保護(hù) 范圍。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)
通過本發(fā)明,對于電話會議的錄音可以避免鏡像抓包錄音,從而不需要對IP網(wǎng)絡(luò)進(jìn)行任何改動,并且,電話會議的會議功能和錄音功能獨(dú)立,減少了 相互影響,提高整個系統(tǒng)的可靠性。
另一方面,為了實(shí)現(xiàn)上述的操作流程,本發(fā)明還提供了一種電話會議服 務(wù)器,應(yīng)用于包括至少兩個電話會議參與終端、 一個電話會議服務(wù)器和一個 錄音服務(wù)器的系統(tǒng)中,其中,電話會議參與終端通過電話會議服務(wù)器參與一
個電話會議,電話會議具有唯一的標(biāo)識,具體的結(jié)構(gòu)示意圖如圖IO所示,包 括
通信模塊101,用于接收電話會議參與終端發(fā)送的媒體流,并將混音處理 后的媒體流發(fā)送給錄音服務(wù)器,還用于向錄音服務(wù)器發(fā)送錄音啟動報文或錄 音結(jié)束報文,啟動或結(jié)束電話會議的錄音,其中,錄音啟動報文包含電話會 議的標(biāo)識及基本信息、多個電話會議參與終端的信息和錄音啟動標(biāo)識,錄音 結(jié)束報文包含電話會議的標(biāo)識和錄音結(jié)束標(biāo)識,混音處理后的^f某體流攜帶電 話會;義的標(biāo)識;
混音模塊102,與通信模塊101連接,用于實(shí)時的將通信模塊101接收到 的各電話會議參與終端發(fā)送的媒體流進(jìn)行混音處理,并發(fā)給通信模塊101。
在具體的應(yīng)用場景中,電話會議服務(wù)器還包括
設(shè)置模塊103,用于設(shè)置需要錄音的電話會議的標(biāo)識;
檢測模塊104,與設(shè)置模塊103和通信模塊101連接,用于檢測設(shè)置模塊 103所設(shè)置的電話會議的標(biāo)識所對應(yīng)的電話會議的開始或結(jié)束,并觸發(fā)通信模 塊101向錄音服務(wù)器發(fā)送錄音啟動報文或錄音結(jié)束報文。
在具體的應(yīng)用場景中,通信模塊101還用于接收電話會議參與終端發(fā)送 的啟動指令或結(jié)束指令,并根據(jù)該啟動指令或結(jié)束指令向錄音服務(wù)器發(fā)送錄 音啟動報文或錄音結(jié)束4艮文。
在具體的應(yīng)用場景中,電話會議服務(wù)器還包括
處理模塊105,與通信模塊101和混音模塊102連接,用于在混音模塊 102進(jìn)行混音處理后的媒體流中分別刪除各電話會議參與終端自身所發(fā)送的 々某體流;
19相應(yīng)的,通信模塊101用于將處理模塊105進(jìn)行處理后的i某體流分別發(fā)
送給相應(yīng)的電話會議參與終端,在該媒體流中不包含目標(biāo)終端自身所發(fā)送的 媒體流。
對應(yīng)前述方法中的電話會議服務(wù)器記錄加入或退出情況的技術(shù)方案,電
話會議服務(wù)器還包括
存儲模塊106,與通信模塊101連接,用于存儲電話會議錄音過程中,加 入的電話會議參與終端的信息或退出的電話會議參與終端的信息;
通信模塊101,還用于將存儲模塊106所存儲的加入的電話會議參與終端 的信息或退出的電話會議參與終端的信息和電話會議的標(biāo)識發(fā)送給錄音服務(wù) 器。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)
通過本發(fā)明,對于電話會議的錄音可以避免鏡像抓包錄音,從而不需要 對IP網(wǎng)絡(luò)進(jìn)行Y壬何改動,并且,電話會議的會議功能和錄音功能獨(dú)立,減少了 相互影響,提高整個系統(tǒng)的可靠性。
通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā) 明可以通過硬件實(shí)現(xiàn),也可以借助軟件加必要的通用硬件平臺的方式來實(shí)現(xiàn)。 基于這樣的理解,本發(fā)明的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來,該軟 件產(chǎn)品可以存儲在一個非易失性存儲介質(zhì)(可以是CD-ROM, U盤,移動硬 盤等)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服 務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施場景所述的方法。
本領(lǐng)域技術(shù)人員可以理解附圖只是一個優(yōu)選實(shí)施場景的示意圖,附圖中 的模塊或流程并不一定是實(shí)施本發(fā)明所必須的。
本領(lǐng)域技術(shù)人員可以理解實(shí)施場景中的裝置中的模塊可以按照實(shí)施場景 描述進(jìn)行分布于實(shí)施場景的裝置中,也可以進(jìn)行相應(yīng)變化位于不同于本實(shí)施 場景的一個或多個裝置中。上述實(shí)施場景的模塊可以合并為一個模塊,也可 以進(jìn)一步拆分成多個子;f莫塊。
上述本發(fā)明序號僅僅為了描述,不代表實(shí)施場景的優(yōu)劣。以上公開的僅為本發(fā)明的幾個具體實(shí)施場景,但是,本發(fā)明并非局限于 此,任何本領(lǐng)域的技術(shù)人員能思之的變化都應(yīng)落入本發(fā)明的保護(hù)范圍。
權(quán)利要求
1、一種電話會議的錄音方法,其特征在于,應(yīng)用于包括至少兩個電話會議參與終端、一個電話會議服務(wù)器和一個錄音服務(wù)器的系統(tǒng)中,其中,所述電話會議參與終端通過所述電話會議服務(wù)器參與一個電話會議,所述電話會議具有唯一的標(biāo)識,所述方法包括所述電話會議開始時,所述電話會議服務(wù)器向所述錄音服務(wù)器發(fā)送錄音啟動報文,啟動所述電話會議的錄音,其中,所述錄音啟動報文包含所述電話會議的標(biāo)識及基本信息、所述多個電話會議參與終端的信息和錄音啟動標(biāo)識;所述電話會議服務(wù)器實(shí)時的將接收到的所述電話會議參與終端發(fā)送的媒體流進(jìn)行混音處理,并將混音處理后的媒體流發(fā)送給所述錄音服務(wù)器,其中,所述混音處理后的媒體流攜帶所述電話會議的標(biāo)識;所述電話會議結(jié)束時,所述電話會議服務(wù)器向所述錄音服務(wù)器發(fā)送錄音結(jié)束報文,結(jié)束所述電話會議的錄音,其中,所述錄音結(jié)束報文包含所述電話會議的標(biāo)識和錄音結(jié)束標(biāo)識。
2、 如權(quán)利要求l所述的方法,其特征在于,所述電話會議服務(wù)器向所述 錄音服務(wù)器發(fā)送錄音啟動報文或錄音結(jié)束報文的時間,具體通過以下方式設(shè) 定所述電話會議服務(wù)器根據(jù)預(yù)設(shè)電話會議的標(biāo)識所對應(yīng)的電話會議的開始 時間或結(jié)束時間確定向所述錄音服務(wù)器發(fā)送錄音啟動報文或錄音結(jié)束報文的 時間;或,所述電話會議服務(wù)器根據(jù)接收到的所述電話會議參與終端發(fā)送的啟動指 令或結(jié)束指令確定向所述錄音服務(wù)器發(fā)送錄音啟動報文或錄音結(jié)束報文的時 間。
3、 如權(quán)利要求2所述的方法,其特征在于,所述電話會議參與終端發(fā)送 的啟動指令或結(jié)束指令,通過所述電話會議參與終端中預(yù)設(shè)的觸發(fā)按鍵或觸發(fā)按鍵組合來觸發(fā);其中,所述啟動指令和所述結(jié)束指令,具體為 預(yù)設(shè)的錄音啟動消息和錄音結(jié)束消息;或,在未錄音狀態(tài)下所述電話會議參與終端發(fā)送的錄音操作指令,和在錄音 狀態(tài)下所述電話會議參與終端發(fā)送的錄音操作指令。
4、 如權(quán)利要求l所述的方法,其特征在于,所述電話會議服務(wù)器實(shí)時的 將接收到的所述電話會議參與終端發(fā)送的媒體流進(jìn)行混音處理之后,還包括所述電話會議服務(wù)器分別向各所述電話會議參與終端實(shí)時的發(fā)送混音處 理后的媒體流,其中,所述向各所述電話會議參與終端實(shí)時的發(fā)送的混音處 理后的媒體流不包含各所述電話會議參與終端自身所對應(yīng)的媒體流。
5、 如權(quán)利要求l所述的方法,其特征在于,如果所述電話會議服務(wù)器實(shí) 時的將混音處理后的媒體流發(fā)送給所述錄音服務(wù)器進(jìn)行錄音的過程中,新的 電話會議參與終端加入所述電話會議,或所述電話會議中的電話會議參與終 端退出所述電話會議,具體包括所述電話會議服務(wù)器向所述錄音服務(wù)器發(fā)送加入報文或退出報文,其中, 所述加入報文中包含所述電話會議的標(biāo)識、加入的所述電話會議參與終端的 信息和加入標(biāo)識,所述退出報文中包含所述電話會議的標(biāo)識、退出的所述電 話會議參與終端的信息和退出標(biāo)識;或,所述電話會議服務(wù)器記錄加入的所述電話會議參與終端的信息或退出的 所述電話會議參與終端的信息。
6、 如權(quán)利要求5所述的方法,其特征在于,當(dāng)所述電話會議的錄音過程 中,所述電話會議服務(wù)器向所述錄音服務(wù)器發(fā)送加入報文或退出報文時,所 述電話會議服務(wù)器向所述錄音服務(wù)器發(fā)送錄音結(jié)束報文,結(jié)束所述電話會議 的錄音之后,還包括所述錄音服務(wù)器將包含所述電話會議的標(biāo)識的所述錄音啟動報文、所述 混音處理后的媒體流、所述錄音結(jié)束報文和所述加入報文或退出報文生成錄 音文件,并將所述電話會議的標(biāo)識及基本信息、所述多個電話會議參與終端 的信息作為所述錄音文件的標(biāo)識信息。
7、 如權(quán)利要求5所述的方法,其特征在于,當(dāng)所述電話會議服務(wù)器記錄 加入的所述電話會議參與終端的信息或退出的所述電話會議參與終端的信息 時,所述電話會議服務(wù)器向所述錄音服務(wù)器發(fā)送錄音結(jié)束報文,結(jié)束所述電話會議的錄音之后,還包括所述電話會議服務(wù)器將所述加入的所述電話會議參與終端的信息或退出 的所述電話會議參與終端的信息和所述電話會議的標(biāo)識發(fā)送給所述錄音服務(wù) 器;所述錄音服務(wù)器將包含所述電話會議的標(biāo)識的所述錄音啟動報文、所述 混音處理后的^ 某體流、所述錄音結(jié)束報文和所述加入的所述電話會議參與終 端的信息或退出的所述電話會議參與終端的信息生成錄音文件,并將所述電 話會議的標(biāo)識及基本信息、所述多個電話會議參與終端的信息作為所述錄音 文件的標(biāo)識信息。
8、 一種電話會議服務(wù)器,其特征在于,應(yīng)用于包括至少兩個電話會議參 與終端、 一個電話會議服務(wù)器和一個錄音服務(wù)器的系統(tǒng)中,其中,所述電話 會議參與終端通過所述電話會議服務(wù)器參與一個電話會議,所述電話會議具 有唯一的標(biāo)識,包括通信模塊,用于接收所述電話會議參與終端發(fā)送的媒體流,并將混音處 理后的媒體流發(fā)送給所述錄音服務(wù)器,還用于向所述錄音服務(wù)器發(fā)送錄音啟 動報文或錄音結(jié)束報文,啟動或結(jié)束所述電話會議的錄音,其中,所述錄音 啟動報文包含所述電話會議的標(biāo)識及基本信息、所述多個電話會議參與終端 的信息和錄音啟動標(biāo)識,所述錄音結(jié)束報文包含所述電話會議的標(biāo)識和錄音 結(jié)束標(biāo)識,所述混音處理后的i某體流攜帶所述電話會議的標(biāo)識;混音模塊,與所述通信模塊連接,用于實(shí)時的將所述通信模塊接收到的 各所述電話會議參與終端發(fā)送的i某體流進(jìn)行混音處理,并發(fā)給所述通信模塊。
9、 如權(quán)利要求8所述的電話會議服務(wù)器,其特征在于,還包括 設(shè)置模塊,用于設(shè)置需要錄音的電話會議的標(biāo)識;檢測模塊,與所述設(shè)置模塊和所述通信模塊連接,用于檢測所述設(shè)置模 塊所設(shè)置的電話會議的標(biāo)識所對應(yīng)的電話會議的開始或結(jié)束,并觸發(fā)所述通 信模塊向所述錄音服務(wù)器發(fā)送錄音啟動報文或錄音結(jié)束報文。
10、 如權(quán)利要求8所述的電話會議服務(wù)器,其特征在于,所述通信模塊,還用于接收所述電話會議參與終端發(fā)送的啟動指令或結(jié) 束指令,并根據(jù)所述啟動指令或結(jié)束指令向所述錄音服務(wù)器發(fā)送錄音啟動報 文或錄音結(jié)束l艮文。
11、 如權(quán)利要求8所述的電話會議服務(wù)器,其特征在于,還包括 處理模塊,與所述通信模塊和所述混音模塊連接,用于在所述混音模塊進(jìn)行混音處理后的媒體流中分別刪除各所述電話會議參與終端自身發(fā)送的媒 體流;所述通信模塊,用于將所述處理模塊進(jìn)行處理后的媒體流分別發(fā)送給相 應(yīng)的電話會議參與終端,在所述媒體流中不包含所述電話會議參與終端自身 所發(fā)送的媒體流。
12、 如權(quán)利要求8所述的電話會議服務(wù)器,其特征在于,還包括 存儲模塊,與所述通信模塊連接,用于存儲電話會議錄音過程中,加入的所述電話會議參與終端的信息或退出的所述電話會議參與終端的信息;所述通信模塊,還用于將所述存儲模塊所存儲的加入的所述電話會議參 與終端的信息或退出的所述電話會議參與終端的信息和所述電話會議的標(biāo)識 發(fā)送給所述錄音服務(wù)器。
全文摘要
本發(fā)明公開了一種電話會議的錄音方法和設(shè)備,實(shí)現(xiàn)在不需要鏡像功能的網(wǎng)絡(luò)架構(gòu)中,對電話會議進(jìn)行錄音,同時,避免回聲和無法再加工等錄音缺陷。通過本發(fā)明,對于電話會議的錄音可以避免鏡像抓包錄音,從而不需要對IP網(wǎng)絡(luò)進(jìn)行任何改動,并且,電話會議的會議功能和錄音功能獨(dú)立,減少了相互影響,提高整個系統(tǒng)的可靠性。
文檔編號H04M3/56GK101616222SQ20091015821
公開日2009年12月30日 申請日期2009年7月22日 優(yōu)先權(quán)日2009年7月22日
發(fā)明者郭曉軍, 龍夫軍 申請人:杭州華三通信技術(shù)有限公司