專利名稱:遠(yuǎn)程卡拉ok的實(shí)現(xiàn)方法、裝置和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,特別涉及遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法、裝置和 系統(tǒng)。
技術(shù)背景目前在國(guó)內(nèi)和國(guó)際上實(shí)現(xiàn)卡拉OK的場(chǎng)景一般為在同一區(qū)域內(nèi),利用 模擬或數(shù)字電纜電路的方式,將參與卡拉OK對(duì)唱、輪唱的雙/多聲道聲音信 號(hào)匯集到一個(gè)模擬或數(shù)字處理中心進(jìn)行混音處理,然后將混合后的音頻信號(hào) 通過揚(yáng)聲器等方式播放出來,從而實(shí)現(xiàn)卡拉OK功能。隨著人們對(duì)服務(wù)感受度要求的提升,遠(yuǎn)程卡拉OK成為了一種需要。例 如在廣播電影業(yè)界實(shí)現(xiàn)異地同唱一首歌就需要用到遠(yuǎn)程卡拉OK技術(shù)。環(huán) 形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法可以采用網(wǎng)際協(xié)議(Internet Protocol, IP)會(huì) 議電話中心混音原理實(shí)現(xiàn)。在該方法的實(shí)現(xiàn)過程中, 一個(gè)指定IP地址的控制 中心接收來自至少兩個(gè)終端的音頻信號(hào);所有的終端的音頻信號(hào)均包含語音 音頻,其中一臺(tái)終端還包含伴奏音頻;控制中心接收到來自至少兩個(gè)終端的 音頻信號(hào)后對(duì)上述音頻信號(hào)混合處理,然后通過IP網(wǎng)絡(luò)廣播出去。上述廣播 的對(duì)象可以為上述參與音頻信號(hào)混合的所有終端,也可以是上述參與音頻合 成以外的其它終端。環(huán)形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法中的控制中心的功能集成在一個(gè)終端 中,成為星形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法,該方法中,終端需要接收其他終 端的音頻,然后合成混合音頻,然后將混合音頻發(fā)送給參與會(huì)話的終端。發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中發(fā)現(xiàn)在多個(gè)終端參與的遠(yuǎn)程卡拉OK的 實(shí)現(xiàn)過程中,多個(gè)終端中的某一終端將自身的語音音頻和伴奏音頻作為一路 上傳到控制中心;控制中心在進(jìn)行音頻信號(hào)混合處理的時(shí)候,其它終端發(fā)送 到的語音音頻均以上述伴奏音頻為基礎(chǔ),這樣參與音頻合成的終端越多伴奏 音頻聲音就會(huì)越小,混合處理后的音頻也會(huì)越嘈雜。 發(fā)明內(nèi)容本發(fā)明實(shí)施例要解決的技術(shù)問題是提供遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法、裝置和系統(tǒng),提高遠(yuǎn)程卡拉OK的音頻質(zhì)量。為解決上述技術(shù)問題,本發(fā)明所提供的環(huán)形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法實(shí)施例可以通過以下技術(shù)方案實(shí)現(xiàn)接收第一終端和第二終端發(fā)送的語音音頻,接收伴奏曲庫(kù)服務(wù)器根據(jù)所述第一終端或第二終端的伴奏需求發(fā)送的伴奏音頻;對(duì)所述伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻; 將所述混合音頻發(fā)送給所述第 一終端和/或第二終端。 本發(fā)明實(shí)施例還提供了 一種星形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法,包括 接收參與會(huì)話的本終端以外的其他終端發(fā)送的語音音頻,采集本終端的語音音頻,接收伴奏曲庫(kù)服務(wù)器根據(jù)本終端或所述其他終端的伴奏需求發(fā)送的伴奏音頻;對(duì)所述伴奏音頻、接收到的語音音頻以及本終端的語音音頻進(jìn)行音頻混 合處理,獲得混合音頻;播放所述混合音頻;將所述混合音頻發(fā)送給所述其他終端。本發(fā)明實(shí)施例還提供了另 一種環(huán)形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法,包括將采集到的本終端的語音音頻發(fā)送給控制中心;接收由控制中心發(fā)送的混合音頻;所述混合音頻包含參與會(huì)話的終端的音頻信息;接收伴奏曲庫(kù)服務(wù)器發(fā)送的伴奏音頻;合成所述混合音頻和所述伴奏音頻,得到目標(biāo)音頻并播放所述目標(biāo)音頻。 本發(fā)明實(shí)施例還提供了一種控制中心,包括音頻接收單元,用于接收第一終端和第二終端發(fā)送的語音音頻,接收伴 奏曲庫(kù)服務(wù)器發(fā)送的伴奏音頻;音頻混合處理單元,用于對(duì)所述伴奏音頻和語音音頻進(jìn)行音頻混合處理, 獲得混合音頻;音頻發(fā)送單元,用于將所述混合音頻發(fā)送給所述第一終端和/或第二終端。 本發(fā)明實(shí)施例還提供了一種終端,包括音頻接收單元,用于接收參與會(huì)話的本終端以外的其他終端發(fā)送的語音 音頻,接收伴奏曲庫(kù)服務(wù)器根據(jù)本終端或所述其他終端的伴奏需求發(fā)送的伴9奏音頻;音頻采集單元,用于采集本終端的語音音頻;音頻合成單元,用于對(duì)所述伴奏音頻、接收到的語音音頻以及本終端的 語音音頻進(jìn)行音頻混合處理,獲得混合音頻; 音頻播放單元,用于播放所述混合音頻; 混合音頻發(fā)送單元,將所述混合音頻發(fā)送給所述其他終端。 本發(fā)明實(shí)施例還提供了另一種終端,包括音頻發(fā)送單元,用于將采集到的本終端的語音音頻發(fā)送給控制中心; 混合音頻接收單元,用于接收由控制中心發(fā)送的混合音頻;所述混合音頻包含參與會(huì)話的終端的音頻信息;伴奏音頻接收單元,用于接收伴奏曲庫(kù)服務(wù)器發(fā)送的伴奏音頻; 音頻合成單元,用于合成所述混合音頻和所述伴奏音頻,得到目標(biāo)音頻; 音頻播放單元,用于播放所述目標(biāo)音頻。 本發(fā)明實(shí)施例還提供了一種遠(yuǎn)程卡拉OK的實(shí)現(xiàn)的系統(tǒng),包括 伴奏曲庫(kù)服務(wù)器,用于根據(jù)第一終端或第二終端的需求向控制中心發(fā)送伴奏音頻;控制中心,用于接收第一終端和第二終端發(fā)送的語音音頻,接收伴奏曲 庫(kù)服務(wù)器根據(jù)所述第一終端或第二終端的需求發(fā)送的伴奏音頻;對(duì)所述伴奏 音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻;將所述混合音頻發(fā)送給 所述第一終端和/或第二終端。上述技術(shù)方案具有如下有益效果語音音頻來自終端、伴奏音頻來自伴 奏曲庫(kù)服務(wù)器,在進(jìn)行音頻混合處理時(shí)不會(huì)造成相互干擾,從而提高了遠(yuǎn)程 卡拉OK音頻的質(zhì)量。
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí) 施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面 描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講, 在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明方法實(shí)施例 一流程示意圖;圖2為本發(fā)明方法實(shí)施例二流程示意圖; 圖3為本發(fā)明方法實(shí)施例三流程示意圖; 圖4為本發(fā)明方法實(shí)施例四流程示意圖; 圖5為本發(fā)明裝置實(shí)施例五控制中心結(jié)構(gòu)示意圖; 圖6為本發(fā)明裝置實(shí)施例五另 一控制中心結(jié)構(gòu)示意圖; 圖7為本發(fā)明裝置實(shí)施例五另一控制中心結(jié)構(gòu)示意圖; 圖8為本發(fā)明裝置實(shí)施例五另 一控制中心結(jié)構(gòu)示意圖; 圖9為本發(fā)明裝置實(shí)施例五另 一控制中心結(jié)構(gòu)示意圖; 圖10為本發(fā)明裝置實(shí)施例六一種終端結(jié)構(gòu)示意圖; 圖11為本發(fā)明裝置實(shí)施例六另 一 種終端結(jié)構(gòu)示意圖; 圖12為本發(fā)明裝置實(shí)施例七一種終端結(jié)構(gòu)示意圖; 圖13為本發(fā)明裝置實(shí)施例七另一種終端結(jié)構(gòu)示意圖; 圖14為本發(fā)明裝置實(shí)施例八系統(tǒng)結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行 清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而 不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作 出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明實(shí)施例要解決的技術(shù)問題是提供一種遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法、裝 置和系統(tǒng),提高遠(yuǎn)程卡拉OK的音頻質(zhì)量。實(shí)施例一,如圖l所示,本發(fā)明實(shí)施例提供的一種環(huán)形的遠(yuǎn)程卡拉OK的 實(shí)現(xiàn)方法,包括步驟101:接收第一終端和第二終端發(fā)送的語音音頻,接收伴奏曲庫(kù)服務(wù) 器發(fā)送的伴奏音頻;在本步驟中還可以接收第一終端和第二終端發(fā)送的視頻 圖像;上述視頻可以為第一終端采集的第一終端側(cè)的視頻圖像然后發(fā)送給控 制中心,第二終端采集的第二終端側(cè)的視頻圖像然后發(fā)送給控制中心??蛇x地,在步驟101之前還可以接收到第一終端和第二終端的注冊(cè)申請(qǐng); 接收到第一終端和第二終端的注冊(cè)申請(qǐng)后,綁定第一終端和第二終端;后續(xù) 實(shí)施例將注冊(cè)的過程作進(jìn)一步的說明。另外,上述第一終端和第二終端發(fā)送語音音頻參數(shù)也是可以協(xié)商的,當(dāng) 然采用設(shè)定的固定參數(shù)進(jìn)行發(fā)送也是可以的,并不影響本發(fā)明實(shí)施例的實(shí)現(xiàn)。上述第一終端和第二終端都為參與遠(yuǎn)程卡拉OK的終端,為方便敘述稱為 第一終端和第二終端,第一終端和第二終端可以表示為多個(gè)終端,終端的個(gè)數(shù)不作限制;上述綁定可以理解為將參與遠(yuǎn)程卡拉OK的終端組成一個(gè)會(huì)話 組,具體可以為,控制中心建立一個(gè)卡拉OK的會(huì)話組存儲(chǔ)加入上述會(huì)話組的 終端的標(biāo)識(shí),在發(fā)送合成音頻和/或合成視頻圖像前讀取上述會(huì)話組的終端的 標(biāo)識(shí),然后向上述讀取到的標(biāo)識(shí)的終端發(fā)送合成音頻和/或合成視頻圖像。步驟102:對(duì)上述伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻; 如果上一步驟中有視頻,本步驟還可以對(duì)上述來自于第一終端和第二終端的 視頻圖像進(jìn)行視頻合成處理,獲得合成視頻圖像。步驟103:將上述混合音頻發(fā)送給上述第一終端和/或第二終端。若上一步 驟中合成了合成視頻圖像,本步驟還可以將上述合成視頻圖像發(fā)送給上述第 一終端和/或第二終端。上述混合音頻發(fā)送給第一終端和/或第二終端,發(fā)送的相關(guān)參數(shù)也是可以 與終端進(jìn)行協(xié)商的,當(dāng)然采用設(shè)定的參數(shù)進(jìn)行發(fā)送不進(jìn)行協(xié)商也是可以的, 不影響本發(fā)明實(shí)施例的實(shí)現(xiàn)。上述方法步驟的執(zhí)行主體為控制中心;伴奏曲庫(kù)服務(wù)器可以是獨(dú)立的服 務(wù)器,也可以集成在控制中心上。上述實(shí)施方式中,語音音頻來自終端、伴奏音頻來自伴奏曲庫(kù)服務(wù)器, 在進(jìn)行音頻混合處理時(shí)不會(huì)造成相互干擾,從而提高了遠(yuǎn)程卡拉OK音頻的質(zhì) 量。上述實(shí)現(xiàn)方式中音頻的合成的執(zhí)行方如果是終端,方案的執(zhí)行流程可以為將采集到的本終端的語音音頻發(fā)送給控制中心;還可以將采集到的本終 端的視頻圖像發(fā)送給控制中心;接收由控制中心發(fā)送的混合音頻;上述混合音頻包含參與會(huì)話的終端的 音頻信息;還可以接收控制中心發(fā)送的合成視頻圖像,上述視頻圖像包含參 與會(huì)話的終端的視頻信息;奏音頻;合成上述混合音頻和上述伴奏音頻,得到目標(biāo)音頻并播放上述目標(biāo)音頻;在播放目標(biāo)音頻同時(shí)還可以播放上述合成視頻圖像。上述實(shí)現(xiàn)方式的執(zhí)行主體可以為參與會(huì)話的終端,基于與圖l所揭示的方 案同樣的原理,控制中心將來自終端的音頻進(jìn)行了合成,然后發(fā)送到終端, 然后由終端將混合音頻和伴奏音頻進(jìn)行合成得到最終的合成音頻,本實(shí)施方 式依然能夠達(dá)到提高遠(yuǎn)程卡拉OK的音頻質(zhì)量的目的。實(shí)施例二,本發(fā)明實(shí)施例還提供了 一種星形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法, 如圖2所示,包括本終端的語音音頻,接收伴奏曲庫(kù)服務(wù)器根據(jù)本終端或上述其他終端的伴奏 需求發(fā)送的伴奏音頻;這里還可以包括接收上述其他終端發(fā)送的視頻圖像,采集本終端的視 頻圖像;步驟202:對(duì)上述伴奏音頻、接收到的語音音頻以及本終端的語音音頻進(jìn) 行音頻混合處理,獲得混合音頻;這里也可以對(duì)來自于上述其他終端的視頻圖像和本終端的4^頻圖像進(jìn) 行合成處理,獲得合成視頻圖像;步驟203:播放上述混合音頻;將上述混合音頻發(fā)送給上述其他終端。這里也可以播放上述合成視頻圖像,將上述合成視頻圖像發(fā)送給上述 其他終端。上述實(shí)施方式中,語音音頻來自終端、伴奏音頻來自伴奏曲庫(kù)服務(wù)器, 在進(jìn)行音頻混合處理時(shí)不會(huì)造成相互干擾,從而提高了遠(yuǎn)程卡4立OK音頻的質(zhì) 量。進(jìn)一步地加入視頻的內(nèi)容能夠豐富卡拉OK的視覺效果。實(shí)施例三,本實(shí)施例為采用星形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法的 一個(gè)具體實(shí) 施例,本實(shí)施例中,控制中心集成在第一終端,伴奏曲庫(kù)服務(wù)器為獨(dú)立的服 務(wù)器。由于終端的音頻合成能力的限制,本方案可以在參與遠(yuǎn)程卡拉OK終端 小于6個(gè)的時(shí)候采用;上述控制中心集成在第一終端上可以是第一終端含有混音才莫塊或者類似功能,例如內(nèi)置多點(diǎn)控制單元(Multipoint Control Unit, MCU )。 可以理解的是在本實(shí)施例中第二終端可以有多個(gè),具體數(shù)量不作限制。第一 終端可以為具有混音能力的會(huì)議電視終端,第 一終端可以為會(huì)議電視終端也 可以為不具混音能力的可視電話。在本實(shí)施例中第一終端以視頻電視終端A表 示,第二終端以視頻電一見終端B表示。遠(yuǎn)程卡拉OK具體實(shí)現(xiàn)過程如圖3所示(本過程可以采用會(huì)議電^LH.323框 架進(jìn)行)301、 控制中心注冊(cè)1)會(huì)議電視終端,開機(jī)上電后向指定IP地址的控制中心發(fā)出注冊(cè)申請(qǐng); 2 )控制中心(內(nèi)含多點(diǎn)控制單元MCU或網(wǎng)守GK,其中MCU可以用于接收各個(gè)會(huì)場(chǎng)的聲音和圖像的,網(wǎng)守可以用于完成開會(huì)調(diào)度功能)接受注冊(cè)申請(qǐng),然后驗(yàn)證終端的身份和密碼,還可以分配一個(gè)"昵稱"或"呼叫短號(hào)"給各個(gè)申請(qǐng)注冊(cè)的會(huì)議電視終端。在本實(shí)施例中會(huì)議電視終端A和會(huì)議電視終端B都是會(huì)議電視終端,在未注明是A還是B時(shí),可以認(rèn)為會(huì)議電視終端A和/或會(huì)議電視終端B。302、 伴奏曲庫(kù)服務(wù)器注冊(cè)1) 會(huì)議電視終端根據(jù)預(yù)先設(shè)定的賬號(hào)密碼登陸伴奏曲庫(kù)服務(wù)器;并向伴 奏曲庫(kù)服務(wù)器發(fā)送調(diào)閱和點(diǎn)撥曲庫(kù)服務(wù)器存儲(chǔ)的伴奏曲庫(kù)的目錄和歌曲的請(qǐng) 求;2) 伴奏曲庫(kù)服務(wù)器驗(yàn)證各個(gè)會(huì)議電視終端的登陸賬號(hào)和密碼等權(quán)限,同 意或拒絕各個(gè)會(huì)議電視終端調(diào)閱和點(diǎn)撥曲庫(kù)服務(wù)器存儲(chǔ)的伴奏曲庫(kù)的目錄和 歌曲(這里還可以根據(jù)上述權(quán)限來設(shè)定開放的目錄大小)。另外,各個(gè)終端還可以向伴奏曲庫(kù)服務(wù)器匯報(bào)自身能力,例如自身支 持的視頻編碼協(xié)議(例如H.264/263、 MPEG-2/4、 AVS等),音頻能力(例如 G.711/723/728/729、 AAC等音頻協(xié)議),分辨率、最高速率、是否支持雙流等。 服務(wù)器記錄各個(gè)終端的能力;在2)中,伴奏曲庫(kù)服務(wù)器針對(duì)各個(gè)終端發(fā)送出 合適的網(wǎng)際協(xié)議(Internet Protocol , IP)媒體流發(fā)送伴奏歌曲(Karaoke television, KTV)給控制中心。303、 呼叫1 )會(huì)議電視終端A向會(huì)議電視終端B發(fā)起點(diǎn)對(duì)點(diǎn)的會(huì)議邀請(qǐng),邀請(qǐng)會(huì)議電視終端B參與一次卡拉OK歌唱。具體方式會(huì)議電視終端A在知道終端B的IP 地址時(shí),可以按照IP地址進(jìn)行呼叫(可以參見H.323協(xié)議或同類型協(xié)議);不知 道終端B的實(shí)際IP地址但知道終端B的"昵稱"或"呼叫短號(hào)",則可用將會(huì)議 邀請(qǐng)發(fā)送給控制中心,控制中心進(jìn)行IP地址映射轉(zhuǎn)接(類似于IP地址的域名 映射)處理后將會(huì)議邀請(qǐng)發(fā)送終端B。2 )會(huì)議電視終端B在接收到上述會(huì)議邀請(qǐng)后可以選擇接受或者拒絕進(jìn)行 卡拉OK歌唱;若接受進(jìn)行卡拉OK歌唱?jiǎng)t建立通信連接。如果有更多的終端例如C、 D......等需要加入,可以在會(huì)議電視終端A和B已經(jīng)接通的情況下,由終端A按照如上方法呼叫C或D,或者由終端C或D反向 對(duì)終端A發(fā)起呼叫,由終端A決定是否接受其加入。304、協(xié)商1) 會(huì)議電一見終端A向會(huì)議電一見終端B發(fā)送呼叫請(qǐng)求;2) 當(dāng)會(huì)議電視終端B接到會(huì)議電視終端A的呼叫請(qǐng)求后,顯示來電方"IP 地址"或"昵稱"或"號(hào)碼"等,然后決定是否接聽(接受邀請(qǐng)并參與卡拉 OK)。 如決定接受邀請(qǐng),則雙方會(huì)議電視終端根據(jù)會(huì)議電視的技術(shù)框架,例 如H.323 、會(huì)話初始協(xié)議(Session Initiation Protocol, SIP)等協(xié)商各自的 能力,決定一個(gè)雙方都能接受的媒體流協(xié)議和速率(例如約定視頻采用H.264 協(xié)議、分辨率4CIF ( 704 x 576 )、速率2Mbit/s;音頻采用高級(jí)音頻編碼低延遲 規(guī)格(Advanced Audio Coding Low Delay, AAC LD )協(xié)議、雙聲道、速率 384kbit/s等)。3) 協(xié)商完成后,則建立會(huì)議電視終端A與會(huì)議電視終端B的IP鏈路鏈接。 開始會(huì)議電視通話過程(卡拉OK參與開始)。另夕卜,被呼叫的會(huì)議電視終端B可以向伴奏曲庫(kù)服務(wù)器匯報(bào)自己已經(jīng)接受 了 "來自會(huì)議電視終端A,,的呼叫,已經(jīng)和會(huì)議電視終端A建立了穩(wěn)定的IP鏈 路。(此步驟便于綁定以及同步各個(gè)終端下行來自伴奏曲庫(kù)服務(wù)器的媒體流和 目錄信息)如有會(huì)議電視終端C、 D......等,也可以按照如上方法協(xié)商是否接通,并向伴奏曲庫(kù)服務(wù)器上報(bào)信息,申請(qǐng)綁定在同一條下行媒體流的邏輯IP鏈路上。上述協(xié)商的過程在控制中心進(jìn)行語音和視頻合成之前完成即可,至于協(xié) 商過程可以在終端向控制中心發(fā)送音頻和視頻之前進(jìn)行,還是在終端向控制 中心發(fā)送音頻和視頻之后進(jìn)行,不影響本發(fā)明實(shí)施例的實(shí)現(xiàn),對(duì)此本發(fā)明實(shí) 施例不予限定。305、 選曲1) 電視終端向伴奏曲庫(kù)服務(wù)器發(fā)送請(qǐng)求消息指定需要的伴奏歌曲;2) 當(dāng)任何一方會(huì)議電視終端從伴奏曲庫(kù)服務(wù)器(KTV)的備選歌曲目錄 中選定歌曲后,伴奏曲庫(kù)服務(wù)器則從伴奏歌曲庫(kù)服務(wù)器通過下行IP媒體流到各 個(gè)邏輯綁定在一起的已開會(huì)終端上(例如終端A和B )。此時(shí)卡拉OK歌曲播放 開始,(此步驟也可在發(fā)起呼叫邀請(qǐng)之前完成選曲過程)。如多個(gè)各自選擇了多首歌曲,則可用根據(jù)選曲的時(shí)間順序排出次序,逐 個(gè)由伴奏歌曲庫(kù)服務(wù)器播放下行。306、 混音1)各個(gè)參與歌唱的終端可預(yù)先設(shè)定或?qū)崟r(shí)調(diào)整自己麥克風(fēng)的音量、(調(diào) 整的方式可用為設(shè)定權(quán)值,對(duì)音量進(jìn)行升高或降低的控制)混響等效果;然 后將各自本端已經(jīng)數(shù)字化語音信號(hào),通過協(xié)商過程中約定的音頻協(xié)議傳遞給 會(huì)議電視終端A;2 )會(huì)議電視終端A進(jìn)行混音后形成單獨(dú)的音頻媒體流發(fā)送給各個(gè)參與f大 唱的終端。307、 多畫面合成1) 各個(gè)參與歌唱的終端可以將本方終端獲取到的視頻圖像發(fā)送給控制中 心(獲取的方式可以為,通過攝像頭獲取);2) 控制中心將接收到的視頻圖像廣播給各參與歌唱的終端,或?qū)⒍鄠€(gè)視 頻圖像拼接成一個(gè)新視頻圖像(可以為多畫面);然后將合成后的視頻圖像發(fā) 送給參與歌唱的各方終端,或者發(fā)送給指定的某些終端。308、 調(diào)度調(diào)度的過程可以通過設(shè)置主席終端的方式進(jìn)行; 一般內(nèi)含混音模塊的終 端(視頻電;f見終端A)可以由控制中心指定為本次卡拉OK歌唱過程的主席終 端,當(dāng)然也可以是根據(jù)接收到的終端的設(shè)置請(qǐng)求后,設(shè)定某一終端為主席終端??沙跏蓟缦骆窒?br>
1 )將主席權(quán)限授權(quán)給任一個(gè)參與會(huì)話的終端;然后該終端可以對(duì)卡拉OK會(huì)話進(jìn)行統(tǒng)一調(diào)度;也可采用共享主席方式,任何參與者均可參與調(diào)度;也可根據(jù)各自選取的歌曲,采用單曲主席自動(dòng)移交的方式,即何人唱歌該終端就是主席;
已經(jīng)確定為主席的終端可以具有如下權(quán)限刪除或設(shè)置優(yōu)先已選歌曲的目錄表;調(diào)度歌曲的進(jìn)度例如重放、快進(jìn)、快退、慢放、暫停等;調(diào)度l欠曲的聲道例如切換歌曲的原音、伴奏、導(dǎo)唱等;調(diào)整整個(gè)伴奏背景音頻的大小、效果等;允許或屏蔽任何一個(gè)終端的聲道加入混音;
調(diào)整混音處理單元的效果例如增大或減小某個(gè)終端的混音比率、調(diào)整總體混響效果、音效等;
允許或拒絕新申請(qǐng)加入的終端入會(huì)(加入唱歌);以及踢出已經(jīng)入會(huì)的終端(使其脫離本次唱歌的邏輯通路);
監(jiān)控各個(gè)與會(huì)(唱歌)的各個(gè)終端定時(shí)發(fā)來的匯報(bào)狀態(tài)信息(例如每秒l次匯報(bào)一個(gè)IP信息包);
允許或拒絕廣播其中一個(gè)視頻圖像;視頻中心的處理過程為接收到上述允許或拒絕的指令后,將接收到的來自于參與會(huì)話的終端并且處于允許狀態(tài)的視頻圖像進(jìn)行合成,具體的合成方法可以參考多點(diǎn)視頻處理過程,視頻圖像合成處理完成后,得到的可以是幾個(gè)視頻圖像畫面合成為一個(gè)新的圖像(注新的圖像可以為"多畫面");然后將新生成的"多畫面"視頻圖像下發(fā)給參與會(huì)話的各個(gè)終端,或者發(fā)送給指定的某些終端;
宣布結(jié)束會(huì)議(唱歌),關(guān)閉相應(yīng)邏輯綁定關(guān)系。
2)會(huì)議電視終端A接收主席終端發(fā)送的控制卡拉OK會(huì)話的控制消息;上述控制信息為刪除已選伴奏音頻、設(shè)置已選伴奏音頻的播放順序、調(diào)度歌曲的進(jìn)度、調(diào)度歌曲的聲道、調(diào)整伴奏背景音頻的大小或效果、允許或屏蔽第 一終端和/或第二終端的音頻進(jìn)行混合處理、允許或屏蔽第 一終端和/或第二終端的視頻圖像進(jìn)行合成處理、調(diào)整混音處理的效果、允許或拒絕新的終端加入會(huì)話、宣布結(jié)束會(huì)話中的至少一項(xiàng);
3)會(huì)議電視終端A依據(jù)控制消息的指示,對(duì)卡拉OK會(huì)話執(zhí)行刪除已選伴奏音頻、設(shè)置已選伴奏音頻的播放順序、調(diào)度歌曲的進(jìn)度、調(diào)度f大曲的聲道、調(diào)整伴奏背景音頻的大小或效果、允許或屏蔽第一終端和/或第二終端的音頻進(jìn)行混合處理、允許或屏蔽第一終端和/或第二終端的視頻圖像進(jìn)行合成處理、調(diào)整混音處理的效果、允許或拒絕新的終端加入會(huì)話、宣布結(jié)束會(huì)話。
309、 退出
1) 各個(gè)已經(jīng)參與的終端可在向主席申請(qǐng)退出本次會(huì)議;
2) 由主席終端記錄,將該終端從本次會(huì)議(唱歌過程)的IP邏輯鏈路中刪除,并根據(jù)會(huì)議電視的技術(shù)框架(例如H.323或SIP等技術(shù)框架)中對(duì)應(yīng)的調(diào)度協(xié)議使其脫離本次會(huì)議的呼叫過程。已經(jīng)退出的終端則可申請(qǐng)加入另一個(gè)會(huì)議(唱歌過程),也可以向伴奏曲庫(kù)服務(wù)器申請(qǐng)退出登陸。上述退出是正常退出的流程?;?br>
1)控制中心監(jiān)控各個(gè)終端發(fā)來的定時(shí)匯報(bào)狀態(tài)信息(例如如上的每秒l個(gè)狀態(tài)信息包), 一段時(shí)間后(如4~5秒) 一直未收到狀態(tài)信息包,則主席終端判定該終端異常。此時(shí)主席終端刪除該終端的邏輯綁定關(guān)系,還可以向各與會(huì)終端通報(bào)該終端異常退出。例如某個(gè)終端斷電或網(wǎng)絡(luò)終端造成的異常退出?;?br>
1)伴奏曲庫(kù)服務(wù)器根據(jù)終端操作超時(shí)判斷終端退出登陸。另外如果當(dāng)值主席終端異常退出,則主席權(quán)限自動(dòng)回到具有混音模塊一方的終端。如發(fā)揮混音模塊作用的終端(會(huì)議電視終端A)異常退出,則各與會(huì)終端在設(shè)定時(shí)間內(nèi)接收不到混音后的信息后,執(zhí)行脫離本次會(huì)議(唱歌過程),此時(shí)會(huì)議異常結(jié)束。
310、 結(jié)束
1)主席終端向伴奏曲庫(kù)服務(wù)器申請(qǐng)關(guān)閉各自終端的邏輯綁定關(guān)系,各自終端均根據(jù)會(huì)議電視的技術(shù)框架(例如H.323或SIP等技術(shù)框架)中對(duì)應(yīng)的調(diào)度協(xié)議脫離呼叫鏈接關(guān)系。則本次會(huì)議(唱歌過程)結(jié)束。
已經(jīng)退出的終端則可申請(qǐng)加入另一個(gè)會(huì)議(唱歌過程),也可以向伴奏曲庫(kù)服務(wù)器發(fā)送退出申請(qǐng),申請(qǐng)退出登陸。實(shí)施例四,本實(shí)施例為采用環(huán)形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法的一個(gè)具體實(shí)施例。本實(shí)施例中,控制中心為獨(dú)立的服務(wù)器,伴奏曲庫(kù)服務(wù)器也為獨(dú)立的服務(wù)器。在本實(shí)施例中伴奏曲庫(kù)服務(wù)器可以集成在控制中心,不影響本發(fā)明實(shí)施例的實(shí)現(xiàn)。如果控制中心具有的混音能力較強(qiáng),本方案可以在參與遠(yuǎn)程
卡拉OK終端很多的場(chǎng)景下采用;在本方案中,控制中心還可以具多畫面功能,
第 一終端和第二終端在此種架構(gòu)下可以為相同類型的終端,終端仍然可以有多個(gè),具體數(shù)量不作限制。第一終端和第二終端可以為會(huì)議電視終端,也可
以為可視電話。在本實(shí)施例中第一終端以^L頻電4見終端A表示,第二終端以一見頻電視終端B表示。
遠(yuǎn)程卡拉OK具體實(shí)現(xiàn)過程如圖4所示(本過程可以采用會(huì)議電視H.323框架或同類型的網(wǎng)絡(luò)框架協(xié)議進(jìn)行)
401、 注冊(cè)
與實(shí)施例三中的控制中心注冊(cè)、伴奏曲庫(kù)服務(wù)器注冊(cè)相同。參與會(huì)話的終端需要在控制中心和伴奏曲庫(kù)服務(wù)器分別注冊(cè)。
402、 呼叫
例如會(huì)議電視終端A準(zhǔn)備邀請(qǐng)會(huì)議電視終端B、 C、 D...等參與一次卡拉OK歌唱,會(huì)議電視終端A也可單獨(dú)邀請(qǐng)某一個(gè)終端。
1) 終端A根據(jù)已知的終端B、 C、 D…的"昵稱"或"呼叫短號(hào)",通過總控制中心進(jìn)行呼叫終端B、 C、 D...,呼叫匯接到總控制中心的MCU上。
2) 總控制中心為此次會(huì)議分配一個(gè)會(huì)議序號(hào),該序號(hào)也可由終端A提交召集申請(qǐng)時(shí)候確定名稱,并可申請(qǐng)為此次會(huì)議設(shè)置參與加入的密碼等信息。如總控制中心檢查無重名并符合某些既定的命名規(guī)則的情況下同意本次會(huì)議序號(hào)。
如有終端E、 F......等,可以在該會(huì)議召集已經(jīng)接通的情況下,需要加入
的終端通過該會(huì)議序號(hào)及其密碼等信息申請(qǐng)加入會(huì)議(唱歌過程)。
403、 伴奏曲庫(kù)服務(wù)器注冊(cè),404、協(xié)商,405、選曲,406、混音、407、多畫面合成,408、調(diào)度過程、409、退出、410、結(jié)束與實(shí)施例三中的302、伴奏曲庫(kù)服務(wù)器注冊(cè),304、協(xié)商,305、選曲,306、混音,307、多畫面合成,308、調(diào)度、309、退出,310、結(jié)束類似。在此不再贅述。
本實(shí)施例中,加入視頻時(shí),各個(gè)終端需要采集各自的視頻信息并發(fā)送給控制中心;在協(xié)商過程中,需要對(duì)視頻參數(shù)進(jìn)行協(xié)商,具體協(xié)商過程依然可以參考會(huì)議電視的技術(shù)框架進(jìn)行;上述視頻信息的發(fā)送采用上述協(xié)商的參數(shù)進(jìn)行發(fā)送;控制中心的多點(diǎn)控制單元(MCU)模塊對(duì)發(fā)送來的視頻畫面進(jìn)行合成,然后發(fā)送給參與會(huì)話的終端或者指定范圍的終端;發(fā)送視頻的方式可以參考音頻類似的發(fā)送方式(發(fā)送與終端能力適應(yīng)的視頻)。在調(diào)度過程中,主席增加了新的權(quán)限建立、關(guān)閉多畫面效果;調(diào)整多畫面狀態(tài)和次序、將任意幾方的終端的視頻加入多畫面中。這樣可以一方面看到伴唱l大詞畫面,又可看到參與的各方的表情動(dòng)作等信息,較大的豐富了唱歌時(shí)候的氣氛。
實(shí)施例五、如圖5所示,本發(fā)明實(shí)施例還提供了一種控制中心,包括
音頻接收單元501,用于接收第一終端和第二終端發(fā)送的語音音頻,接收伴奏曲庫(kù)服務(wù)器發(fā)送的伴奏音頻;
音頻混合處理單元502,用于對(duì)上述伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻;
音頻發(fā)送單元503,用于將上述混合音頻發(fā)送給上述第一終端和/或第二終
上述實(shí)施方式中,語音音頻來自終端、伴奏音頻來自伴奏曲庫(kù)服務(wù)器,
在進(jìn)行音頻混合處理時(shí)不會(huì)造成相互干擾,從而提高了遠(yuǎn)程卡拉OK音頻的質(zhì)量。進(jìn)一步地加入^L頻的內(nèi)容能夠豐富卡拉OK的^L覺效果。
進(jìn)一步地,如圖6所示,上述控制中心可以增加視頻處理的功能使卡拉OK的會(huì)話更加豐富,還包括
視頻接收單元601,用于接收第一終端和第二終端發(fā)送的視頻圖像;
視頻混合處理單元602,用于對(duì)上述來自于第一終端和第二終端的視頻圖像進(jìn)行合成處理,獲得合成視頻圖像;
視頻發(fā)送單元603,用于將上述合成視頻圖像發(fā)送給上述第一終端和/或第二終端。
上述實(shí)施方式加入了視頻的內(nèi)容能夠更加豐富卡拉OK會(huì)話,使用戶有更好的體驗(yàn)。
進(jìn)一步地,如圖7所示,上述控制中心,還可以包括
混合效果信息接收單元701,用于接收第一終端和/或第二終端發(fā)送的調(diào)整自身音頻屬性和/或混合效果信息;
上述音頻混合處理單元502,具體用于對(duì)上述與第一終端對(duì)應(yīng)的伴奏音頻和上述語音音頻按照上述調(diào)整自身音頻屬性和/或混合效果信息要求的混合效果進(jìn)行音頻混合處理,獲得與第一終端對(duì)應(yīng)的混合音頻;對(duì)上述與第二終端對(duì)應(yīng)的伴奏音頻和上述語音音頻按照上述調(diào)整自身音頻屬性和/或混合效果信
息要求的混合效果進(jìn)行音頻混合處理,獲得與第二終端對(duì)應(yīng)的混合音頻。
上述實(shí)施方式,通過采用每個(gè)終端設(shè)置的要求來進(jìn)行音頻的混合能夠更
好的滿足終端的差異化要求。
進(jìn)一步地,如圖8所示,上述控制中心,還可以包括
控制消息接收單元801,用于接收主席終端發(fā)送的控制消息;
控制執(zhí)行單元802,用于依據(jù)控制消息的指示,對(duì)卡拉OK執(zhí)行對(duì)應(yīng)的控
制操作。
上述實(shí)施方式解決的技術(shù)問題是由主席終端進(jìn)行會(huì)話控制的實(shí)現(xiàn)方式。
進(jìn)一步地,如圖9所示,上述控制中心,還可以包括
退出信息獲取單元901,用于接收到上述第一終端或第二終端發(fā)送的退出請(qǐng)求,或,接收主席終端發(fā)送的剔除終端的控制消息,或,監(jiān)聽到上述第一終端或第二終端異常退出;
連接斷開單元902,用于當(dāng)接收到上述第一終端或第二終端發(fā)送的退出請(qǐng)求,或,接收到主席終端發(fā)送的剔除終端的控制消息,或,監(jiān)聽到上述第一終端或第二終端異常退出時(shí),解除該終端的會(huì)話連接。
上述實(shí)施方式解決的技術(shù)問題是終端退出會(huì)話的實(shí)現(xiàn)方式。
實(shí)施例六,本發(fā)明實(shí)施例還提供了一種終端,如圖10所示,包括
語音音頻,接收伴奏曲庫(kù)服務(wù)器根據(jù)本終端或所述其他終端的伴奏需求發(fā)送的伴奏音頻;
音頻采集單元1002,用于采集本終端的語音音頻;音頻合成單元1003,用于對(duì)所述伴奏音頻、接收到的語音音頻以及本終
端的語音音頻進(jìn)行音頻混合處理,獲得混合音頻;音頻播放單元1004,用于播放所述混合音頻;混合音頻發(fā)送單元1005,將所述混合音頻發(fā)送給所述其他終端。進(jìn)一步地,如圖ll所示,所述終端,還包括視頻接收單元1101,用于接收所述其他終端發(fā)送的視頻圖像;視頻采集單元1102,用于采集本終端的視頻圖像;視頻合成單元1103,用于對(duì)來自于所述其他終端的視頻圖像和本終端的
視頻圖像進(jìn)行合成處理,獲得合成視頻圖像;
視頻播放單元1104,用于播放所述合成視頻圖像;視頻發(fā)送單元1105,用于將所述合成視頻圖像發(fā)送給所述其他終端。上述實(shí)施方式中,語音音頻來自終端、伴奏音頻來自伴奏曲庫(kù)服務(wù)器,
在進(jìn)行音頻混合處理時(shí)不會(huì)造成相互干擾,從而提高了遠(yuǎn)程卡拉OK音頻的質(zhì)
量。進(jìn)一步地加入視頻的內(nèi)容能夠豐富卡拉OK的視覺效果。
實(shí)施例七,本發(fā)明實(shí)施例還提供了一種終端,如圖12所示,包括音頻發(fā)送單元1201,用于將采集到的本終端的語音音頻發(fā)送給控制中心混合音頻接收單元1202,用于接收由控制中心發(fā)送的混合音頻;所述混
合音頻包含參與會(huì)話的終端的音頻信息;
伴奏音頻接收單元1203,用于接收伴奏曲庫(kù)服務(wù)器發(fā)送的伴奏音頻;音頻合成單元1204,用于合成所述混合音頻和所述伴奏音頻,得到目標(biāo)
音頻;
音頻播放單元1205,用于播放所述目標(biāo)音頻。進(jìn)一步地,如圖13所示,所述終端,還包括
視頻發(fā)送單元1301,用于向控制中心發(fā)送本終端采集到的視頻圖像;合成圖像接收單元1302,用于接收控制中心發(fā)送的合成視頻圖像,所述視頻圖像包含參與會(huì)話的終端的視頻信息;
視頻播放單元1303,用于播放所述合成視頻圖像。
上述實(shí)施方式中,語音音頻來自終端、伴奏音頻來自伴奏曲庫(kù)服務(wù)器,在進(jìn)行音頻混合處理時(shí)不會(huì)造成相互干擾,從而提高了遠(yuǎn)程卡拉OK音頻的質(zhì)
量。進(jìn)一步地加入^L頻的內(nèi)容能夠豐富卡拉OK的^^覺效果。
實(shí)施例八、如圖14所示,本發(fā)明實(shí)施例還提供了一種遠(yuǎn)程卡拉OK的實(shí)現(xiàn)的系統(tǒng),包括
伴奏曲庫(kù)服務(wù)器1401,用于根據(jù)第一終端或第二終端的需求向控制中心1402發(fā)送伴奏音頻;
控制中心1402,用于接收第一終端和第二終端發(fā)送的語音音頻,接收伴奏曲庫(kù)服務(wù)器1401根據(jù)上述第一終端或第二終端的需求發(fā)送的伴奏音頻;對(duì)上述伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻;將上述混合音頻發(fā)送給上述第一終端和/或第二終端。
進(jìn)一步地,上述控制中心1402,還用于接收第一終端和第二終端發(fā)送的視頻圖像;對(duì)上述來自于第一終端和第二終端的視頻圖像進(jìn)行合成處理,獲得合成視頻圖像;
將上述合成視頻圖像發(fā)送給上述第 一終端和/或第二終端。
進(jìn)一步地,上述控制中心1402,還用于與第一終端、第二終端分別協(xié)商發(fā)送音頻信號(hào)的參數(shù);
上述將混合處理后的音頻信號(hào)發(fā)送給上述第一終端或第二終端包括按照與第一終端協(xié)商的發(fā)送音頻信號(hào)的參數(shù),將混合音頻發(fā)送給上述第一終端;按照與第二終端協(xié)商的發(fā)送音頻信號(hào)的參數(shù),將混合音頻發(fā)送給上述第二終端。
進(jìn)一步地,上述伴奏曲庫(kù)服務(wù)器1401,具體用于根據(jù)所述第一終端設(shè)置的傳輸參數(shù)發(fā)送伴奏音頻給控制中心,根據(jù)所述第二終端設(shè)置的傳輸參數(shù)發(fā)
送伴奏音頻給控制中心;
上述控制中心1402,具體用于對(duì)所述根據(jù)第一終端設(shè)置的傳輸參數(shù)發(fā)送的伴奏音頻和所述語音音頻進(jìn)行音頻混合處理,獲得與第一終端ift應(yīng)的混合音頻并送給第一終端端;對(duì)所述根據(jù)第二終端設(shè)置的傳輸參數(shù)發(fā)送的伴奏音頻和所述語音音頻進(jìn)行音頻混合處理,獲得與第二終端對(duì)應(yīng)的混合音頻并發(fā)送給第二終端。進(jìn)一步地,上述控制中心1402,還用于接收第一終端和/或第二終端發(fā)送
的調(diào)整自身音頻屬性和/或混合效果的信息;
上述控制中心1402,對(duì)伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻包括
按照上述調(diào)整后的第一終端的音頻屬性和/或混合效果的信息,對(duì)伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得與第一終端對(duì)應(yīng)的混合音頻;按照上述調(diào)整后的第二終端的音頻屬性和/或混合效果的信息,對(duì)伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得與第二終端對(duì)應(yīng)的混合音頻。
進(jìn)一步地上述控制中心1402,還用于接收主席終端發(fā)送的控制消息;依據(jù)控制消息的指示,對(duì)卡拉OK執(zhí)行對(duì)應(yīng)的控制操作。
進(jìn)一步地,上述控制中心1402,還用于當(dāng)接收到上述第一終端或第二終端發(fā)送的退出請(qǐng)求,或,接收到主席終端發(fā)送的剔除終端的控制消息,或,監(jiān)聽到上述第一終端或第二終端異常退出時(shí),解除該終端的會(huì)話連接。
是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。以上對(duì)本發(fā)明實(shí)施例所提供的 一種遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法、裝置和系統(tǒng)
闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
權(quán)利要求
1、一種環(huán)形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法,其特征在于,包括接收第一終端和第二終端發(fā)送的語音音頻,接收伴奏曲庫(kù)服務(wù)器根據(jù)所述第一終端或第二終端的伴奏需求發(fā)送的伴奏音頻;對(duì)所述伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻;將所述混合音頻發(fā)送給所述第一終端和/或第二終端。
2、 根據(jù)權(quán)利要求l所述方法,其特征在于,還包括 接收第一終端和第二終端發(fā)送的視頻圖像;對(duì)所述來自于第 一終端和第二終端的視頻圖像進(jìn)行合成處理,獲得合成 視頻圖像;將所述合成視頻圖像發(fā)送給所述第一終端和/或第二終端。
3、 根據(jù)權(quán)利要求l所述方法,其特征在于,所述接收伴奏曲庫(kù)服務(wù)器根 據(jù)所述第一終端或第二終端的伴奏需求發(fā)送的伴奏音頻包括接收伴奏曲庫(kù)服務(wù)器根據(jù)第一終端設(shè)置的傳輸參數(shù)發(fā)送的伴奏音頻;接 收伴奏曲庫(kù)服務(wù)器根據(jù)第二終端設(shè)置的傳輸參數(shù)發(fā)送的伴奏音頻;所述對(duì)伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻包括對(duì)所述根據(jù)第一終端設(shè)置的傳輸參數(shù)發(fā)送的伴奏音頻和所述語音音頻進(jìn) 行音頻混合處理,獲得與第一終端對(duì)應(yīng)的混合音頻;對(duì)所述根據(jù)第二終端設(shè) 置的傳輸參數(shù)發(fā)送的伴奏音頻和所述語音音頻進(jìn)行音頻混合處理,獲得與第 二終端對(duì)應(yīng)的混合音頻;將所述將混合音頻發(fā)送給所述第 一終端和/或第二終端包括將與第 一終端對(duì)應(yīng)的混合音頻發(fā)送給第 一終端;將與第二終端對(duì)應(yīng)的混合音頻發(fā)送給第二終端。
4、 根據(jù)權(quán)利要求l所述方法,其特征在于,所述對(duì)伴奏音頻和語音音頻 進(jìn)行音頻混合處理之前還包括接收第一終端和/或第二終端發(fā)送的調(diào)整自身 音頻屬性和/或混合效果的信息;所述對(duì)伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻包括 按照所述調(diào)整后的第 一終端的音頻屬性和/或混合效果的信息,對(duì)伴奏音 頻和語音音頻進(jìn)行音頻混合處理,獲得與第一終端對(duì)應(yīng)的混合音頻;按照所 述調(diào)整后的第二終端的音頻屬性和/或混合效果的信息,對(duì)伴奏音頻和語音音 頻進(jìn)行音頻混合處理,獲得與第二終端對(duì)應(yīng)的混合音頻;所述將混合音頻發(fā)送給所述第一終端和/或第二終端包括將與第一終端對(duì)應(yīng)的混合音頻發(fā)送給第一終端;講與第二終端對(duì)應(yīng)的混合音頻發(fā)送給第二終端。
5、 根據(jù)權(quán)利要求1至4任意一項(xiàng)所述方法,其特征在于,還包括 接收主席終端發(fā)送的控制卡拉OK會(huì)話的控制消息;所述控制信息為刪除已選伴奏音頻、設(shè)置已選伴奏音頻的播放順序、調(diào)度歌曲的進(jìn)度、調(diào)度歌 曲的聲道、調(diào)整伴奏背景音頻的大小或效果、允許或屏蔽第一終端和/或第二 終端的音頻進(jìn)行混合處理、允許或屏蔽第一終端和/或第二終端的視頻圖進(jìn)行 合成處理、調(diào)整混音處理的效果、允許或拒絕新的終端加入會(huì)話、宣布結(jié)束 會(huì)話中的至少一項(xiàng);依據(jù)控制消息的指示,對(duì)卡拉OK會(huì)話執(zhí)行刪除已選伴奏音頻、設(shè)置已選 伴奏音頻的播放順序、調(diào)度歌曲的進(jìn)度、調(diào)度歌曲的聲道、調(diào)整伴奏背景音 頻的大小或效果、允許或屏蔽第 一終端和/或第二終端的音頻進(jìn)行混合處理、 允許或屏蔽第一終端和/或第二終端的視頻圖像進(jìn)行合成處理、調(diào)整混音處理 的效果、允許或拒絕新的終端加入會(huì)話、宣布結(jié)束會(huì)話。
6、 根據(jù)權(quán)利要求5所述方法,其特征在于,還包括 當(dāng)接收到所述第一終端或第二終端發(fā)送的退出請(qǐng)求,或,接收到主席終端發(fā)送的剔除終端的控制消息,或,監(jiān)聽到所述第一終端或第二終端異常退 出時(shí),解除發(fā)送退出請(qǐng)求的終端、控制消息剔除的終端、或異常退出的終端 的會(huì)話連接。
7、 一種星形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法,其特征在于,包括 接收參與會(huì)話的本終端以外的其他終端發(fā)送的語音音頻,采集本終端的語音音頻,接收伴奏曲庫(kù)服務(wù)器根據(jù)本終端或所述其他終端的伴奏需求發(fā)送 的伴奏音頻;對(duì)所述伴奏音頻、接收到的語音音頻以及本終端的語音音頻進(jìn)行音頻混 合處理,獲得混合音頻;播放所述混合音頻;將所述混合音頻發(fā)送給所述其他終端。
8、 根據(jù)權(quán)利要求7所述方法,其特征在于,還包括 接收所述其他終端發(fā)送的視頻圖像,采集本終端的視頻圖像;對(duì)來自于所述其他終端的視頻圖像和本終端的視頻圖像進(jìn)行合成處理, 獲得合成視頻圖像;播放所述合成視頻圖像,將所述合成視頻圖像發(fā)送給所述其他終端。
9、 一種環(huán)形的遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法,其特征在于,包括 將采集到的本終端的語音音頻發(fā)送給控制中心;接收由控制中心發(fā)送的混合音頻;所述混合音頻包含參與會(huì)話的終端的 音頻信息;接收伴奏曲庫(kù)服務(wù)器發(fā)送的伴奏音頻;合成所述混合音頻和所述伴奏音頻,得到目標(biāo)音頻并播放所述目標(biāo)音頻。
10、 根據(jù)權(quán)利要求9所述方法,其特征在于,還包括 向控制中心發(fā)送本終端采集到的視頻圖像;接收控制中心發(fā)送的合成視頻圖像,所述視頻圖像包含參與會(huì)話的終端 的視頻信息;所述播放目標(biāo)音頻之時(shí)還包括播放所述合成視頻圖像。
11、 一種控制中心,其特征在于,包括音頻接收單元,用于接收第一終端和第二終端發(fā)送的語音音頻,接收伴 奏曲庫(kù)服務(wù)器發(fā)送的伴奏音頻;音頻混合處理單元,用于對(duì)所述伴奏音頻和語音音頻進(jìn)行音頻混合處理, 獲得混合音頻;音頻發(fā)送單元,用于將所述混合音頻發(fā)送給所述第一終端和/或第二終端。
12、 根據(jù)權(quán)利要求ll所述控制中心,其特征在于,還包括 視頻接收單元,用于接收第一終端和第二終端發(fā)送的視頻圖像; 視頻混合處理單元,用于對(duì)所述來自于第一終端和第二終端的視頻圖像進(jìn)行合成處理,獲得合成視頻圖像;視頻發(fā)送單元,用于將所述合成視頻圖像發(fā)送給所述第一終端和/或第二 終端。
13、 根據(jù)權(quán)利要求11或12所述控制中心,其特征在于,還包括 混合效果信息接收單元,用于接收第一終端和/或第二終端發(fā)送的調(diào)整自身音頻屬性和/或混合效果信息;所述音頻混合處理單元,具體用于對(duì)所述與第一終端對(duì)應(yīng)的伴奏音頻和 所述語音音頻按照所述調(diào)整自身音頻屬性和/或混合效果信息要求的混合效果進(jìn)行音頻混合處理,獲得與第一終端對(duì)應(yīng)的混合音頻;對(duì)所述與第二終端對(duì) 應(yīng)的伴奏音頻和所述語音音頻按照所述調(diào)整自身音頻屬性和/或混合效果信息 要求的混合效果進(jìn)行音頻混合處理,獲得與第二終端對(duì)應(yīng)的混合音頻。
14、 根據(jù)權(quán)利要求11或12所述控制中心,其特征在于,還包括 控制消息接收單元,用于接收主席終端發(fā)送的控制消息; 控制執(zhí)行單元,用于依據(jù)控制消息的指示,對(duì)卡拉OK4丸行對(duì)應(yīng)的控制操作。
15、 根據(jù)權(quán)利要求14所述控制中心,其特征在于,還包括 退出信息獲取單元,用于接收到所述第一終端或第二終端發(fā)送的退出請(qǐng)求,或,接收主席終端發(fā)送的剔除終端的控制消息,或,監(jiān)聽到所述第一終 端或第二終端異常退出;連接斷開單元,用于當(dāng)接收到所述第一終端或第二終端發(fā)送的退出請(qǐng)求, 或,接收到主席終端發(fā)送的剔除終端的控制消息,或,監(jiān)聽到所述第一終端 或第二終端異常退出時(shí),解除該終端的會(huì)話連接。
16、 一種終端,其特征在于,包括音頻接收單元,用于接收參與會(huì)話的本終端以外的其他終端發(fā)送的語音 奏音頻;音頻采集單元,用于釆集本終端的語音音頻;音頻合成單元,用于對(duì)所述伴奏音頻、接收到的語音音頻以及本終端的 語音音頻進(jìn)行音頻混合處理,獲得混合音頻; 音頻播放單元,用于播放所述混合音頻; 混合音頻發(fā)送單元,將所述混合音頻發(fā)送給所述其他終端。
17、 根據(jù)權(quán)利要求16所述終端,其特征在于,還包括 視頻接收單元,用于接收所述其他終端發(fā)送的視頻圖像; 視頻采集單元,用于采集本終端的視頻圖像;視頻合成單元,用于對(duì)來自于所述其他終端的視頻圖像和本終端的視頻圖像進(jìn)行合成處理,獲得合成視頻圖像;視頻播放單元,用于播放所述合成視頻圖像;視頻發(fā)送單元,用于將所述合成視頻圖像發(fā)送給所述其他終端。
18、 一種終端,其特征在于,包括音頻發(fā)送單元,用于將采集到的本終端的語音音頻發(fā)送給控制中心; 混合音頻接收單元,用于接收由控制中心發(fā)送的混合音頻;所述混合音 頻包含參與會(huì)話的終端的音頻信息;伴奏音頻接收單元,用于接收伴奏曲庫(kù)服務(wù)器發(fā)送的伴奏音頻;音頻合成單元,用于合成所述混合音頻和所述伴奏音頻,得到目標(biāo)音頻; 音頻播放單元,用于播放所述目標(biāo)音頻。
19、 根據(jù)權(quán)利要求18所述終端,其特征在于,還包括 視頻發(fā)送單元,用于向控制中心發(fā)送本終端采集到的視頻圖像; 合成圖像接收單元,用于接收控制中心發(fā)送的合成視頻圖像,所述視頻圖像包含參與會(huì)話的終端的視頻信息;視頻播放單元,用于播放所述合成視頻圖像。
20、 一種遠(yuǎn)程卡拉OK的實(shí)現(xiàn)的系統(tǒng),其特征在于,包括 伴奏曲庫(kù)服務(wù)器,用于根據(jù)第一終端或第二終端的需求向控制中心發(fā)送伴奏音頻;控制中心,用于接收第一終端和第二終端發(fā)送的語音音頻,接收伴奏曲 庫(kù)服務(wù)器根據(jù)所述第一終端或第二終端的需求發(fā)送的伴奏音頻;對(duì)所述伴奏 音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻;將所述混合音頻發(fā)送給 所述第一終端和/或第二終端。
21、 根據(jù)權(quán)利要求20所述系統(tǒng),其特征在于,所述控制中心,還用于接收第一終端和第二終端發(fā)送的視頻圖像;對(duì)所 述來自于第一終端和第二終端的視頻圖像進(jìn)行合成處理,獲得合成視頻圖像; 將所述合成視頻圖像發(fā)送給所述第一終端和/或第二終端。
22、 根據(jù)權(quán)利要求20或21所述系統(tǒng),其特征在于,所述控制中心,還用于與第一終端、第二終端分別協(xié)商發(fā)送音頻信號(hào)的 參數(shù);所述將混合處理后的音頻信號(hào)發(fā)送給所述第一終端或第二終端包括按照與第一終端協(xié)商的發(fā)送音頻信號(hào)的參數(shù),將混合音頻發(fā)送給所述第一終端; 按照與第二終端協(xié)商的發(fā)送音頻信號(hào)的參數(shù),將混合音頻發(fā)送給所述第二終端。
23、 根據(jù)權(quán)利要求20或21所述系統(tǒng),其特征在于,所述伴奏曲庫(kù)服務(wù)器,具體用于根據(jù)所述第一終端設(shè)置的傳輸參數(shù)發(fā)送 伴奏音頻給控制中心,根據(jù)所述第二終端設(shè)置的傳輸參數(shù)發(fā)送伴奏音頻給控 制中心;所述控制中心,具體用于對(duì)所述根據(jù)第一終端設(shè)置的傳輸參數(shù)發(fā)送的伴 奏音頻和所述語音音頻進(jìn)行音頻混合處理,獲得與第一終端對(duì)應(yīng)的混合音頻 并送給第一終端端;對(duì)所述根據(jù)第二終端設(shè)置的傳輸參數(shù)發(fā)送的伴奏音頻和 所述語音音頻進(jìn)行音頻混合處理,獲得與第二終端對(duì)應(yīng)的混合音頻并發(fā)送給 第二終端。
24、 根據(jù)權(quán)利要求20或21所述系統(tǒng),其特征在于,所述控制中心,還用于接收第一終端和/或第二終端發(fā)送的調(diào)整自身音頻 屬性和/或混合效果的信息;所述控制中心,對(duì)伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音 頻包括按照所述調(diào)整后的第 一終端的音頻屬性和/或混合效果的信息,對(duì)伴奏音 頻和語音音頻進(jìn)行音頻混合處理,獲得與第一終端對(duì)應(yīng)的混合音頻;按照所 述調(diào)整后的第二終端的音頻屬性和/或混合效果的信息,對(duì)伴奏音頻和語音音 頻進(jìn)行音頻混合處理,獲得與第二終端對(duì)應(yīng)的混合音頻。
25、 根據(jù)權(quán)利要求20或21所述系統(tǒng),其特征在于,所述控制中心,還用于接收主席終端發(fā)送的控制消息;依據(jù)控制消息的 指示,對(duì)卡拉OK執(zhí)行對(duì)應(yīng)的控制操作。
26、 根據(jù)權(quán)利要求25所述系統(tǒng),其特征在于,所述控制中心,還用于當(dāng)接收到所述第 一終端或第二終端發(fā)送的退出請(qǐng) 求,或,接收到主席終端發(fā)送的剔除終端的控制消息,或,監(jiān)聽到所述第一 終端或第二終端異常退出時(shí),解除該終端的會(huì)話連接。
全文摘要
本發(fā)明涉及遠(yuǎn)程卡拉OK的實(shí)現(xiàn)方法、裝置和系統(tǒng)。所述方法包括接收第一終端和第二終端發(fā)送的語音音頻,接收伴奏曲庫(kù)服務(wù)器根據(jù)所述第一終端或第二終端的伴奏需求發(fā)送的伴奏音頻;對(duì)所述伴奏音頻和語音音頻進(jìn)行音頻混合處理,獲得混合音頻;將所述混合音頻發(fā)送給所述第一終端和/或第二終端。上述實(shí)施方式中,語音音頻來自終端、伴奏音頻來自伴奏曲庫(kù)服務(wù)器,在進(jìn)行音頻混合處理時(shí)不會(huì)造成相互干擾,從而提高了遠(yuǎn)程卡拉OK音頻的質(zhì)量。
文檔編號(hào)G10H1/36GK101630507SQ20091016316
公開日2010年1月20日 申請(qǐng)日期2009年8月18日 優(yōu)先權(quán)日2009年8月18日
發(fā)明者楊海曜 申請(qǐng)人:深圳華為通信技術(shù)有限公司