專利名稱:混音處理方法和混音處理系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻會議領(lǐng)域,特別是涉及一種混音處理方法和混音處理系統(tǒng)。
背景技術(shù):
目前,隨著網(wǎng)絡(luò)技術(shù)和視頻會議的迅速發(fā)展,視頻和音頻的應(yīng)用技術(shù)已經(jīng)相對成熟。在實際應(yīng)用中,音頻的互補(bǔ)處理仍然處于最基本、核心的位置,對音頻的實時性要求更為苛刻,由此,對于實際使用中的不同地點的多個終端,若要進(jìn)行多個點的實時音頻的交互,在網(wǎng)絡(luò)帶寬的允許的條件下,需要將多路音頻按照一定的策略進(jìn)行混音,并最終編碼傳送給另外的終端。然而,不論是傳統(tǒng)的視頻會議廠商還是網(wǎng)絡(luò)視頻會議廠商,他們的視頻會議都要求與會的各方必須使用與服務(wù)器相同的音頻編解碼器才能與會。如果與會方的終端設(shè)備 不具備或不使用相同音頻編解碼器,就無法與會。這樣不僅限制了與會的終端設(shè)備,也限制視頻會議服務(wù)器互聯(lián)互通的應(yīng)用范圍。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種簡單易施的混音處理方法和混音處理系統(tǒng),允許與會各方的終端設(shè)備使用不同的音頻編解碼器,大大增加了視頻會議技術(shù)互聯(lián)互通的應(yīng)用范圍。本發(fā)明的目的通過如下技術(shù)方案實現(xiàn)一種混音處理方法,包括如下步驟接收客戶端發(fā)送的音頻編碼數(shù)據(jù)和音頻編碼類型;通過與所述音頻編碼類型對應(yīng)的音頻解碼器對所述音頻編碼數(shù)據(jù)進(jìn)行解碼獲得解碼數(shù)據(jù);比較所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率的大??;若所述解碼數(shù)據(jù)的采樣率大于預(yù)設(shè)的服務(wù)器采樣率,則對所述解碼數(shù)據(jù)進(jìn)行降采樣處理;若所述解碼數(shù)據(jù)的采樣率小于預(yù)設(shè)的服務(wù)器采樣率,則對所述解碼數(shù)據(jù)進(jìn)行升采樣處理;對所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率相同時的解碼數(shù)據(jù)/降采樣處理后的解碼數(shù)據(jù)/升采樣處理后的解碼數(shù)據(jù)進(jìn)行混音操作獲得混音數(shù)據(jù)。一種混音處理系統(tǒng),包括如下步驟接收單元,用于接收客戶端發(fā)送的音頻編碼數(shù)據(jù)和音頻編碼類型信息;解碼單元,用于通過與所述音頻編碼類型對應(yīng)的音頻解碼器對所述音頻編碼數(shù)據(jù)進(jìn)行解碼獲得解碼數(shù)據(jù);第一比較單元,用于比較所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率的大??;第一降采樣單元,用于在所述解碼數(shù)據(jù)的采樣率大于預(yù)設(shè)的服務(wù)器采樣率時,對所述解碼數(shù)據(jù)進(jìn)行降采樣處理;第一升采樣單元,用于在所述解碼數(shù)據(jù)的采樣率小于預(yù)設(shè)的服務(wù)器采樣率,則對所述解碼數(shù)據(jù)進(jìn)行升采樣處理;混音單元,用于對所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率相同時的解碼數(shù)據(jù)/降采樣處理后的解碼數(shù)據(jù)/升采樣處理后的解碼數(shù)據(jù)進(jìn)行混音操作獲得混音數(shù)據(jù)。依據(jù)上述本發(fā)明的方案,在接收到客戶端發(fā)送的音頻編碼數(shù)據(jù)和音頻編碼類型后,通過與所述音頻編碼類型對應(yīng)的音頻解碼器對所述音頻編碼數(shù)據(jù)進(jìn)行解碼獲得解碼數(shù)據(jù),再根據(jù)解碼數(shù)據(jù)的采樣率和服務(wù)器采樣率的大小關(guān)系對解碼數(shù)據(jù)做相應(yīng)采樣率轉(zhuǎn)換(解碼數(shù)據(jù)的采樣率和服務(wù)器采樣率相等時,不轉(zhuǎn)換采樣率),再進(jìn)行混音操作。本發(fā)明可以允許與會各方的終端設(shè)備使用不同的音頻編解碼器(包括音頻編碼器和音頻解碼器),大大增加了視頻會議技術(shù)互聯(lián)互通的應(yīng)用范圍。
圖I為本發(fā)明實施例的混音處理方法的流程示意圖;圖2為本發(fā)明一個實施例的混音處理系統(tǒng)的流程示意圖;圖3為本發(fā)明另一個實施例的混音處理系統(tǒng)的流程示意圖;圖4為本發(fā)明第三個實施例的混音處理系統(tǒng)的流程示意圖。
具體實施例方式下面結(jié)合實施例及附圖對本發(fā)明作進(jìn)一步闡述,但本發(fā)明的實施方式不限于此。實施例I參見圖I所示,為本發(fā)明實施例的混音處理方法的流程示意圖。如圖I所示,該實施例中的混音處理方法包括步驟步驟SlOl :接收客戶端發(fā)送的音頻編碼數(shù)據(jù)和音頻編碼類型,進(jìn)入步驟S102 ;步驟S102 :通過與所述音頻編碼類型對應(yīng)的音頻解碼器對所述音頻編碼數(shù)據(jù)進(jìn)行解碼獲得解碼數(shù)據(jù),進(jìn)入步驟S103,其中,音頻編碼類型包括G. 711、G. 723. I、G. 722、G. 722. IAnnex C、AAC-LD......等等;步驟S103 :比較所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率的大小,若所述解碼數(shù)據(jù)的采樣率大于預(yù)設(shè)的服務(wù)器采樣率,則進(jìn)入步驟S104,若所述解碼數(shù)據(jù)的采樣率小于預(yù)設(shè)的服務(wù)器采樣率,則進(jìn)入步驟S105,若所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率相同,則進(jìn)入步驟S106,其中,服務(wù)器采樣率可以根據(jù)具體情況而定;步驟S104 :對所述解碼數(shù)據(jù)進(jìn)行降采樣處理,進(jìn)入步驟S106,其中,降采樣處理可以采用現(xiàn)有技術(shù)中的方式,在此不予贅述;步驟S105 :對所述解碼數(shù)據(jù)進(jìn)行升采樣處理,進(jìn)入步驟S106,其中,升采樣處理可以采用現(xiàn)有技術(shù)中的方式,在此不予贅述。步驟S 106 :對所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率相同時的解碼數(shù)據(jù)/降采樣處理后的解碼數(shù)據(jù)/升采樣處理后的解碼數(shù)據(jù)進(jìn)行混音操作獲得混音數(shù)據(jù),也就是說在所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率相同時,直接對解碼數(shù)據(jù)進(jìn)行混音操作,在所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率不同時,需要在執(zhí)行了對應(yīng)的采樣率轉(zhuǎn)換(包括升采樣處理、降采樣處理)后再進(jìn)行混音操作。據(jù)此,依據(jù)本實施例的方案,在接收到客戶端發(fā)送的音頻編碼數(shù)據(jù)和音頻編碼類型后,通過與所述音頻編碼類型對應(yīng)的音頻解碼器對所述音頻編碼數(shù)據(jù)進(jìn)行解碼獲得解碼數(shù)據(jù),再根據(jù)解碼數(shù)據(jù)的采樣率和服務(wù)器采樣率的大小關(guān)系對解碼數(shù)據(jù)做相應(yīng)采樣率轉(zhuǎn)換(解碼數(shù)據(jù)的采樣率和服務(wù)器采樣率相等時,不轉(zhuǎn)換采樣率),再進(jìn)行混音操作。本發(fā)明可以允許與會各方的終端設(shè)備使用不同的音頻編解碼器(包括音頻編碼器和音頻解碼器),大大增加了視頻會議技術(shù)互聯(lián)互通的應(yīng)用范圍。其中,在將混音操作后的混音數(shù)據(jù)發(fā)送給對應(yīng)的客戶端時,也需要對該混音數(shù)據(jù)做相應(yīng)的采樣率轉(zhuǎn)換,并采用客戶端對應(yīng)的音頻編碼器進(jìn)行編碼。因此,還可以包括步驟比較所述混音數(shù)據(jù)的采樣率和所述客戶端對應(yīng)的音頻編解碼器的采樣率的大小,其中,混音數(shù)據(jù)的采樣率一般和預(yù)設(shè)的服務(wù)器采樣率相同;
若所述混音數(shù)據(jù)的采樣率大于所述客戶端對應(yīng)的音頻編解碼器的采樣率,則對所述混音數(shù)據(jù)進(jìn)行降采樣處理;若所述混音數(shù)據(jù)的采樣率小于所述客戶端對應(yīng)的音頻編解碼器的采樣率,則對所述混音數(shù)據(jù)進(jìn)行降升采樣處理;采用與所述客戶端對應(yīng)的音頻編碼器對所述混音數(shù)據(jù)的采樣率等于所述客戶端對應(yīng)的音頻編解碼器的采樣率時的混音數(shù)據(jù)/降采樣處理后的混音數(shù)據(jù)/升采樣處理后的混音數(shù)據(jù)進(jìn)行編碼獲得混音編碼數(shù)據(jù),換言之,在音頻編解碼器對所述混音數(shù)據(jù)的采樣率等于所述客戶端對應(yīng)的音頻編解碼器的采樣率時,可直接對混音數(shù)據(jù)進(jìn)行編碼操作,在所述混音數(shù)據(jù)的采樣率不等于所述客戶端對應(yīng)的音頻編解碼器的采樣率時,應(yīng)先對混音數(shù)據(jù)進(jìn)行采樣率轉(zhuǎn)換(包括降采樣處理、降采樣處理)再進(jìn)行編碼操作;將所述混音編碼數(shù)據(jù)發(fā)送給所述客戶端。從而,客戶端接收到混音編碼數(shù)據(jù)時,可以用其對應(yīng)的音頻解碼器進(jìn)行解碼進(jìn)而獲取混音數(shù)據(jù)。另一方面,在開高清視頻會議時,參與視頻會議的各方網(wǎng)絡(luò)狀況各不相同,為了保證語音質(zhì)量,視頻會議廠家采用的策略要么是降低視頻的幀率保證傳輸?shù)恼Z音帶寬,要么是保證音頻優(yōu)先傳輸,又或是使用多碼率音頻編解碼器,在網(wǎng)絡(luò)不好的情況下降低碼率。由于高清音頻編解碼器,例如G. 719的最低碼率仍有32kps,在網(wǎng)絡(luò)情況持續(xù)變壞的情況下,可能依舊無法保證語音流暢,從而造成因一方會場網(wǎng)絡(luò)不好影響整個會場的語音質(zhì)量。而丟包率可以體現(xiàn)網(wǎng)絡(luò)質(zhì)量的好壞,為此,還可以判斷接收到的音頻編碼數(shù)據(jù)的丟包率是否大于預(yù)設(shè)值;若是,則產(chǎn)生采用低碼率的音頻編解碼器的指令,并將所述指令發(fā)送至對應(yīng)的客戶端,其中,預(yù)設(shè)值可以根據(jù)實際要求確定,如選3%或5%。從而,客戶端可以使用相對于當(dāng)前音頻編解碼器具有更低碼率的音頻編解碼器,而本發(fā)明對客戶端使用的音頻編解碼器無限制,因而在網(wǎng)絡(luò)情況持續(xù)變壞的情況下,仍能保證語音流暢。其中,音頻編碼數(shù)據(jù)對應(yīng)的數(shù)據(jù)包中包括一個按時間排列的時間戳序號,若出現(xiàn)丟包,則接收到的各數(shù)據(jù)包的時間戳序號是不連續(xù)的,則可以通過音頻編碼數(shù)據(jù)對應(yīng)的數(shù)據(jù)包的時間戳序號可以確定丟包率,如在單位時間內(nèi)接收到時間戳序號為001至100內(nèi)的數(shù)據(jù)包,但通過查詢時間戳序號時,發(fā)現(xiàn)時間戳序號026、075的兩個數(shù)據(jù)包丟失,則可以確定當(dāng)前的丟包率為2%。實施例2
根據(jù)上述本發(fā)明的混音處理方法,本發(fā)明還提供一種混音處理系統(tǒng),以下就本發(fā)明的混音處理系統(tǒng)的實施例進(jìn)行詳細(xì)說明。在該實施例中,如圖2所示,本實施例中的混音處理系統(tǒng),包括接收單元201、解碼單元202、第一比較單元203、第一降采樣單元204、第一升采樣單元205、混音單元206,其中接收單元201,用于接收客戶端發(fā)送的A和音頻編碼類型,其中,音頻編碼類型包括 G. 711、G. 723. I、G. 722、G. 722. IAnnex C, AAC-LD......等等;解碼單元202,用于通過與所述音頻編碼類型對應(yīng)的音頻解碼器對所述音頻編碼數(shù)據(jù)進(jìn)行解碼獲得解碼數(shù)據(jù);第一比較單元203,用于比較所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率的大小,其中,服務(wù)器采樣率可以根據(jù)具體情況而定;第一降采樣單元204,用于在所述解碼數(shù)據(jù)的采樣率大于預(yù)設(shè)的服務(wù)器采樣率時,對所述解碼數(shù)據(jù)進(jìn)行降采樣處理,其中,降采樣處理可以采用現(xiàn)有技術(shù)中的方式,在此不予·贅述;第一升采樣單元205,用于在所述解碼數(shù)據(jù)的采樣率小于預(yù)設(shè)的服務(wù)器采樣率,則對所述解碼數(shù)據(jù)進(jìn)行升采樣處理,其中,升采樣處理可以采用現(xiàn)有技術(shù)中的方式,在此不予贅述;混音單元206,用于對所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率相同時的解碼數(shù)據(jù)/第一降采樣單元204降采樣處理后的解碼數(shù)據(jù)/第一升采樣單元205升采樣處理后的解碼數(shù)據(jù)進(jìn)行混音操作獲得混音數(shù)據(jù),也就是說在所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率相同時,直接對解碼數(shù)據(jù)進(jìn)行混音操作,在所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率不同時,需要在對應(yīng)的工作單元執(zhí)行了對應(yīng)的采樣率轉(zhuǎn)換(包括降采樣處理、降采樣處理)后再進(jìn)行混音操作。據(jù)此,依據(jù)本實施例的方案,在接收單元201接收客戶端發(fā)送的音頻編碼數(shù)據(jù)和音頻編碼類型后,解碼單元202通過與對應(yīng)的音頻解碼器對所述音頻編碼數(shù)據(jù)進(jìn)行解碼獲得解碼數(shù)據(jù),第一比較單元203比較所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率的大小,在所述解碼數(shù)據(jù)的采樣率大于預(yù)設(shè)的服務(wù)器采樣率時,第一降采樣單元204對所述解碼數(shù)據(jù)進(jìn)行降采樣處理,在所述解碼數(shù)據(jù)的采樣率小于預(yù)設(shè)的服務(wù)器采樣率,第一升采樣單元205對所述解碼數(shù)據(jù)進(jìn)行升采樣處理,最后,混音單元206對進(jìn)行了采樣率轉(zhuǎn)換(解碼數(shù)據(jù)的采樣率和服務(wù)器采樣率相等時,不轉(zhuǎn)換采樣率)的數(shù)據(jù)進(jìn)行混音操作。本發(fā)明可以允許與會各方的終端設(shè)備使用不同的音頻編解碼器,大大增加了視頻會議技術(shù)互聯(lián)互通的應(yīng)用范圍。其中,在將混音操作后的混音數(shù)據(jù)發(fā)送給對應(yīng)的客戶端時,需要對混音數(shù)據(jù)做相應(yīng)的采樣率轉(zhuǎn)換,并采用客戶端對應(yīng)的音頻編解碼器進(jìn)行編碼。因此,參見圖3所示,本發(fā)明的混音處理系統(tǒng)還可以包括第二比較單元207、第二降采樣單元208、第二升采樣單元209、編碼單元210、發(fā)送單元211,其中第二比較單元207,用于比較所述混音數(shù)據(jù)的采樣率和所述客戶端對應(yīng)的音頻編解碼器的采樣率的大小,其中,混音數(shù)據(jù)的采樣率一般和預(yù)設(shè)的服務(wù)器采樣率相同;第二降采樣單元208,用于在所述混音數(shù)據(jù)的采樣率大于所述客戶端對應(yīng)的音頻編解碼器的采樣率時,則對所述混音數(shù)據(jù)進(jìn)行降采樣處理;
第二升采樣單元209,用于在所述混音數(shù)據(jù)的采樣率小于所述客戶端對應(yīng)的音頻編解碼器的采樣率時,則對所述混音數(shù)據(jù)進(jìn)行升采樣處理;編碼單元210,用于采用與所述客戶端對應(yīng)的音頻編碼器對所述混音數(shù)據(jù)的采樣率等于所述客戶端對應(yīng)的音頻編解碼器的采樣率時的混音數(shù)據(jù)/第二降采樣單元208降采樣處理后的混音數(shù)據(jù)/第二升采樣單元209升采樣處理后的混音數(shù)據(jù)進(jìn)行編碼獲得混音編碼數(shù)據(jù),換言之,在音頻編解碼器對所述混音數(shù)據(jù)的采樣率等于所述客戶端對應(yīng)的音頻編解碼器的采樣率時,可直接對混音數(shù)據(jù)進(jìn)行編碼操作,在所述混音數(shù)據(jù)的采樣率不等于所述客戶端對應(yīng)的音頻編解碼器的采樣率時,應(yīng)在對應(yīng)的單元對混音數(shù)據(jù)進(jìn)行對應(yīng)的采樣率轉(zhuǎn)換(包括降采樣處理、降采樣處理)后再進(jìn)行編碼操作;發(fā)送單元211,用于將所述混音編碼數(shù)據(jù)發(fā)送給所述客戶端。另一方面,在開高清視頻會議時,參與視頻會議的各方網(wǎng)絡(luò)狀況各不相同,為了保證語音質(zhì)量,視頻會議廠家采用的策略要么是降低視頻的幀率保證傳輸?shù)恼Z音帶寬,要么是保證音頻優(yōu)先傳輸,又或是使用多碼率音頻編解碼器,在網(wǎng)絡(luò)不好的情況下降低碼率。由 于高清音頻編解碼器,例如G. 719的最低碼率仍有32kps,在網(wǎng)絡(luò)情況持續(xù)變壞的情況下,可能依舊無法保證語音流暢,從而造成因一方會場網(wǎng)絡(luò)不好影響整個會場的語音質(zhì)量。而丟包率可以體現(xiàn)網(wǎng)絡(luò)質(zhì)量的好壞,為此,參見圖4所示,本發(fā)明的混音處理系統(tǒng)還可以包括判斷單元212和控制單元213,判斷單元212用于判斷所述接收單元接收到的音頻編碼數(shù)據(jù)的丟包率是否大于預(yù)設(shè)值;控制單元213用于在判斷單元212的判定結(jié)果為是時,產(chǎn)生采用低碼率的音頻編解碼器的指令;相應(yīng)地,所述發(fā)送單元211還用于將所述指令發(fā)送至對應(yīng)的客戶端,預(yù)設(shè)值可以根據(jù)實際要求確定,如選3%或5%。從而,客戶端可以使用相對于當(dāng)前音頻編解碼器具有更低碼率的音頻編解碼器,而本發(fā)明對客戶端使用的音頻編解碼器無限制,因而在網(wǎng)絡(luò)情況持續(xù)變壞的情況下,仍能保證語音流暢。其中,音頻編碼數(shù)據(jù)對應(yīng)的數(shù)據(jù)包中包括一個按時間排列的時間戳序號,若出現(xiàn)丟包,則接收到的各數(shù)據(jù)包的時間戳序號是不連續(xù)的,因此,判斷單元212可以根據(jù)接收到的音頻編碼數(shù)據(jù)對應(yīng)的數(shù)據(jù)包的時間戳序號確定所述丟包率,如在單位時間內(nèi)接收到時間戳序號為001至100內(nèi)的數(shù)據(jù)包,但通過查詢時間戳序號時,發(fā)現(xiàn)時間戳序號026、075的兩個數(shù)據(jù)包丟失,則可以確定當(dāng)前的丟包率為2%。實施例3為了便于理解本發(fā)明的方案,在本是實施例中,給出了本發(fā)明的一個具體應(yīng)用示例,但下述具體應(yīng)用示例不構(gòu)成對本發(fā)明專利范圍的限制。例如,會場A和會場B開一個高清視頻會議,與服務(wù)器協(xié)商使用高清音頻編解碼器AAC-LD (采樣率48kHz,碼率64kps)。會議中,會場C要加入會議,但它的客戶端設(shè)備沒有高清音頻編解碼器AAC-LD。客戶端C使用音頻編解碼器G. 722. IC (采樣率32kHz,碼率32kps)。此時依據(jù)本發(fā)明方案,在接到會場C的客戶端的音頻編碼數(shù)據(jù)和會場C使用的是音頻編解碼器G. 722. IC的信息后,使用音頻編解碼器G. 722. IC對音頻編碼數(shù)據(jù)進(jìn)行解碼,然后對解碼后的數(shù)據(jù)進(jìn)行升采樣處理(升采樣率到48Khz),再與會場A和會場B的語音數(shù)據(jù)混音。將混音后的數(shù)據(jù)降采樣到32kHz,用音頻編解碼器G. 722. IC編碼后再發(fā)回給C會場對應(yīng)的客戶端。當(dāng)檢查到C會場對應(yīng)的客戶端發(fā)過來的數(shù)據(jù)丟包率太大,可以通知該客戶端使用碼率更低的音頻編解碼器,如音頻編解碼器iLBC(采樣率8kHz,碼率13. 3kps)。以上所述實施例僅表達(dá)了本發(fā)明的幾種實施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保 護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
權(quán)利要求
1.一種混音處理方法,其特征在于,包括如下步驟 接收客戶端發(fā)送的音頻編碼數(shù)據(jù)和音頻編碼類型; 通過與所述音頻編碼類型對應(yīng)的音頻解碼器對所述音頻編碼數(shù)據(jù)進(jìn)行解碼獲得解碼數(shù)據(jù); 比較所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率的大??; 若所述解碼數(shù)據(jù)的采樣率大于預(yù)設(shè)的服務(wù)器采樣率,則對所述解碼數(shù)據(jù)進(jìn)行降采樣處理; 若所述解碼數(shù)據(jù)的采樣率小于預(yù)設(shè)的服務(wù)器采樣率,則對所述解碼數(shù)據(jù)進(jìn)行升采樣處理; 對所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率相同時的解碼數(shù)據(jù)/降采樣處理后的解碼數(shù)據(jù)/升采樣處理后的解碼數(shù)據(jù)進(jìn)行混音操作獲得混音數(shù)據(jù)。
2.根據(jù)權(quán)利要求I所述的混音處理方法,其特征在于,還包括步驟 比較所述混音數(shù)據(jù)的采樣率和所述客戶端對應(yīng)的音頻編解碼器的采樣率的大小; 若所述混音數(shù)據(jù)的采樣率大于所述客戶端對應(yīng)的音頻編解碼器的采樣率,則對所述混音數(shù)據(jù)進(jìn)行降采樣處理; 若所述混音數(shù)據(jù)的采樣率小于所述客戶端對應(yīng)的音頻編解碼器的采樣率,則對所述混音數(shù)據(jù)進(jìn)行降升采樣處理; 采用與所述客戶端對應(yīng)的音頻編碼器對所述混音數(shù)據(jù)的采樣率等于所述客戶端對應(yīng)的音頻編解碼器的采樣率時的混音數(shù)據(jù)/降采樣處理后的混音數(shù)據(jù)/升采樣處理后的混音數(shù)據(jù)進(jìn)行編碼獲得混音編碼數(shù)據(jù); 將所述混音編碼數(shù)據(jù)發(fā)送給所述客戶端。
3.根據(jù)權(quán)利要求I或2所述的混音處理方法,其特征在于,還包括步驟 判斷接收到的音頻編碼數(shù)據(jù)的丟包率是否大于預(yù)設(shè)值; 若是,則產(chǎn)生采用低碼率的音頻編解碼器的指令,并將所述指令發(fā)送至對應(yīng)的客戶端。
4.根據(jù)權(quán)利要求3所述的混音處理方法,其特征在于,根據(jù)接收到的音頻編碼數(shù)據(jù)對應(yīng)的數(shù)據(jù)包的時間戳序號確定所述丟包率。
5.一種混音處理系統(tǒng),其特征在于,包括如下步驟 接收單元,用于接收客戶端發(fā)送的音頻編碼數(shù)據(jù)和音頻編碼類型信息; 解碼單元,用于通過與所述音頻編碼類型對應(yīng)的音頻解碼器對所述音頻編碼數(shù)據(jù)進(jìn)行解碼獲得解碼數(shù)據(jù); 第一比較單元,用于比較所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率的大小; 第一降采樣單元,用于在所述解碼數(shù)據(jù)的采樣率大于預(yù)設(shè)的服務(wù)器采樣率時,對所述解碼數(shù)據(jù)進(jìn)行降采樣處理; 第一升采樣單元,用于在所述解碼數(shù)據(jù)的采樣率小于預(yù)設(shè)的服務(wù)器采樣率,則對所述解碼數(shù)據(jù)進(jìn)行升采樣處理; 混音單元,用于對所述解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率相同時的解碼數(shù)據(jù)/第一降采樣單元降采樣處理后的解碼數(shù)據(jù)/第一升采樣單元升采樣處理后的解碼數(shù)據(jù)進(jìn)行混音操作獲得混音數(shù)據(jù)。
6.根據(jù)權(quán)利要求5所述的混音處理系統(tǒng),其特征在于,還包括第二比較單元,用于比較所述混音數(shù)據(jù)的采樣率和所述客戶端對應(yīng)的音頻編解碼器的采樣率的大??; 第二降采樣單元,用于在所述混音數(shù)據(jù)的采樣率大于所述客戶端對應(yīng)的音頻編解碼器的采樣率時,則對所述混音數(shù)據(jù)進(jìn)行降采樣處理; 第二升采樣單元, 用于在所述混音數(shù)據(jù)的采樣率小于所述客戶端對應(yīng)的音頻編解碼器的采樣率時,則對所述混音數(shù)據(jù)進(jìn)行升采樣處理; 編碼單元采用與所述客戶端對應(yīng)的音頻編碼器對所述混音數(shù)據(jù)的采樣率等于所述客戶端對應(yīng)的音頻編解碼器的采樣率時的混音數(shù)據(jù)/第二降采樣單元降采樣處理后的混音數(shù)據(jù)/第二升采樣單元升采樣處理后的混音數(shù)據(jù)進(jìn)行編碼獲得混音編碼數(shù)據(jù); 發(fā)送單元,用于將所述混音編碼數(shù)據(jù)發(fā)送給所述客戶端。
7.根據(jù)權(quán)利要求6所述的混音處理系統(tǒng),其特征在于,還包括判斷單元和控制單元,其中 所述判斷單元用于判斷所述接收單元接收到的音頻編碼數(shù)據(jù)的丟包率是否大于預(yù)設(shè)值; 所述控制單元用于在所述判斷單元的判定結(jié)果為是時,產(chǎn)生采用低碼率的音頻編解碼器的指令; 所述發(fā)送單元還用于將所述指令發(fā)送至對應(yīng)的客戶端。
8.根據(jù)權(quán)利要求7所述的混音處理系統(tǒng),其特征在于,所述判斷單元根據(jù)接收到的音頻編碼數(shù)據(jù)對應(yīng)的數(shù)據(jù)包的時間戳序號確定所述丟包率。
全文摘要
本發(fā)明提供一種混音處理方法和系統(tǒng),其方法包括步驟接收客戶端發(fā)送的音頻編碼數(shù)據(jù)和音頻編碼類型;通過與音頻編碼類型對應(yīng)的音頻解碼器對音頻編碼數(shù)據(jù)進(jìn)行解碼獲得解碼數(shù)據(jù);比較解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率的大??;若解碼數(shù)據(jù)的采樣率大于預(yù)設(shè)的服務(wù)器采樣率,則對解碼數(shù)據(jù)進(jìn)行降采樣處理;若解碼數(shù)據(jù)的采樣率小于預(yù)設(shè)的服務(wù)器采樣率,則對解碼數(shù)據(jù)進(jìn)行升采樣處理;對解碼數(shù)據(jù)的采樣率和預(yù)設(shè)的服務(wù)器采樣率相同時的解碼數(shù)據(jù)/降采樣處理后的解碼數(shù)據(jù)/升采樣處理后的解碼數(shù)據(jù)進(jìn)行混音操作獲得混音數(shù)據(jù)。本發(fā)明可以允許與會各方的終端設(shè)備使用不同的音頻編解碼器,大大增加了視頻會議技術(shù)互聯(lián)互通的應(yīng)用范圍。
文檔編號G10L19/00GK102915736SQ20121039244
公開日2013年2月6日 申請日期2012年10月16日 優(yōu)先權(quán)日2012年10月16日
發(fā)明者李 根 申請人:廣東威創(chuàng)視訊科技股份有限公司