專(zhuān)利名稱(chēng):一種語(yǔ)音信號(hào)傳輸處理方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,具體涉及語(yǔ)音信號(hào)傳輸處理方法及裝置。
背景技術(shù):
會(huì)議電視系統(tǒng)是一種實(shí)時(shí)通訊的視音頻,數(shù)據(jù)傳送的一種業(yè)務(wù),可在
IP網(wǎng)絡(luò)、電路交換網(wǎng)絡(luò)以及更新的3G網(wǎng)絡(luò)中提供,實(shí)現(xiàn)終端之間點(diǎn)對(duì)點(diǎn)通 訊、多個(gè)終端參加的點(diǎn)對(duì)多點(diǎn)通訊。主流通訊協(xié)議框架則是IP網(wǎng)絡(luò)下的 H323,以及電路交換網(wǎng)絡(luò)的H320協(xié)議框架,其他網(wǎng)絡(luò)則可以通過(guò)網(wǎng)關(guān)實(shí) 現(xiàn)數(shù)據(jù)格式的轉(zhuǎn)換和傳輸。其中語(yǔ)音傳送是必須的,其他視頻,數(shù)據(jù)是可 選的。隨著技術(shù)的成熟以及應(yīng)用的擴(kuò)大,高清晰的視音頻,以及大容量的 組網(wǎng)是當(dāng)前的發(fā)展趨勢(shì)。
在會(huì)議電視系統(tǒng)中涉及到對(duì)音頻進(jìn)行編解碼,由于實(shí)際業(yè)務(wù)應(yīng)用,特 別是在多點(diǎn)會(huì)議中并不是所有會(huì)場(chǎng)的聲音都需要在相同的時(shí)刻發(fā)送給所 有入會(huì)終端,而是根據(jù)業(yè)務(wù)策略(如,選取音量值最大的4參與方)進(jìn)行 混音后再發(fā)送給所有會(huì)場(chǎng);當(dāng)前各個(gè)主流會(huì)議電視或者會(huì)議電話(huà)廠家,在 對(duì)音頻處理上需要在解碼后才能獲取到音量(能量);也有一些協(xié)議涉及 到音量的傳輸,但音頻碼流以及音量值是分別傳送的。
現(xiàn)有技術(shù)中的一種技術(shù)方案如下
當(dāng)前各個(gè)主流會(huì)議電視或者會(huì)議電話(huà)廠家,在對(duì)音頻處理上需要通過(guò)
解碼后才能獲取到各會(huì)場(chǎng)音量值(能量),然后根據(jù)這種方法獲取到的音
量值大小來(lái)為業(yè)務(wù)所使用,根據(jù)策略選取部分會(huì)場(chǎng)進(jìn)行混音或者編碼,這
樣將導(dǎo)致在特定場(chǎng)景應(yīng)用中造成很大的資源浪費(fèi),如MCU的多點(diǎn)會(huì)議中 實(shí)際參與混音的終端只支持到幾個(gè)(由于語(yǔ)音效果的限制,超過(guò)一定數(shù)量
的會(huì)場(chǎng)(如5方)進(jìn)行同時(shí)發(fā)言時(shí),就失去了交流的清晰性。因此,在實(shí) 際應(yīng)用場(chǎng)景也是支持到幾方終端同時(shí)發(fā)言,所有會(huì)場(chǎng)說(shuō)話(huà)的場(chǎng)景基本沒(méi) 有),而解碼后才能獲取各會(huì)場(chǎng)的語(yǔ)音音量大小對(duì)于大性能的MCU在實(shí)現(xiàn) 中就會(huì)出現(xiàn)很大的解碼資源浪費(fèi)。
現(xiàn)有技術(shù)中的另一種技術(shù)方案如下也有一些協(xié)議涉及到音量的傳
5輸,但音頻碼流以及音量值是分別傳送的。由于音量傳輸和語(yǔ)音數(shù)據(jù)流是 分別獨(dú)立傳送的,其傳輸目的地址可以不是相同的地址,必然存在碼流傳 送和音量值大小不同步的情況,導(dǎo)致實(shí)際應(yīng)用存在較大的技術(shù)難度,關(guān)聯(lián) 關(guān)系的建立會(huì)占用很大系統(tǒng)資源以及影響系統(tǒng)的處理性能,同時(shí)傳輸?shù)牟?同步會(huì)導(dǎo)致一定的延時(shí)等待,影響實(shí)時(shí)通訊系統(tǒng)的性能,導(dǎo)致主觀效果感 受體驗(yàn)不好的結(jié)果;如果傳送的音量值與語(yǔ)音碼流傳送的目的地址不一
致,則在多點(diǎn)處理單元MP和多點(diǎn)控制單元(MCU, Multiprotocol Control Unit)獨(dú)立的系統(tǒng)中接收到碼流的MP不能同步獲得音量值的大小。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供一種語(yǔ)音信號(hào)傳輸處理方法及裝置,可 避免或減少解碼資源的浪費(fèi),從而提高系統(tǒng)性能。
本發(fā)明實(shí)施例提供的一種語(yǔ)音信號(hào)傳輸處理方法,包括 接收語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值;
判斷所述音量值的大小,若所述音量值滿(mǎn)足業(yè)務(wù)策略時(shí),則對(duì)該音量 值對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)碼流進(jìn)行解碼。
本發(fā)明實(shí)施例提供的一種語(yǔ)音信號(hào)傳輸處理裝置,包括
接收單元,用于接收音頻信號(hào)及其對(duì)應(yīng)的音量值;
判斷單元,用于判斷所述音量值的大小,若所述音量值滿(mǎn)足業(yè)務(wù)策略 時(shí),則發(fā)送解碼指令給解碼單元;
解碼單元,用于對(duì)音頻信號(hào)進(jìn)行解碼;根據(jù)所述判斷單元發(fā)送的解碼 指令對(duì)所述音量值對(duì)應(yīng)的音頻信號(hào)進(jìn)行解碼。
本發(fā)明實(shí)施例提供的另一種語(yǔ)音信號(hào)發(fā)送方法,包括
獲取語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值;
將所述語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值一起發(fā)送給接收端。
本發(fā)明實(shí)施例還提供一種語(yǔ)音信號(hào)發(fā)送裝置,包括
音量獲取單元,用于獲取音頻信號(hào)對(duì)應(yīng)的音量值;
編碼單元,用于對(duì)所述音頻信號(hào)進(jìn)行抽樣、編碼形成語(yǔ)音數(shù)據(jù)碼流;
發(fā)送單元,用于發(fā)送所述音量值及語(yǔ)音數(shù)據(jù)碼流給接收端。該裝置還包括
封裝單元,將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流一起按照預(yù)定格式進(jìn)行
封裝得到數(shù)據(jù)包;
所述發(fā)送單元發(fā)送所述封裝后的數(shù)據(jù)包給接收端。
綜上所述,本發(fā)明實(shí)施例提供的技術(shù)方案,將音量值實(shí)時(shí)傳遞給接收 碼流的設(shè)備,可在解碼之前獲知接收語(yǔ)音碼流對(duì)應(yīng)的音量值,在判斷該音 量值是否滿(mǎn)足要求之后,確定是否對(duì)所述語(yǔ)音碼流進(jìn)行解碼,從而避免或 減少解碼資源的浪費(fèi),有效解決了當(dāng)前會(huì)議電視系統(tǒng)中對(duì)接收到的所有語(yǔ) 音碼流進(jìn)行解碼才能獲取到音量值的大量浪費(fèi)資源的問(wèn)題,支撐在該方案 下的節(jié)能但不損傷任何服務(wù)質(zhì)量的 一種應(yīng)用方式。
圖1為本發(fā)明實(shí)施例中的語(yǔ)音信號(hào)傳輸處理裝置架構(gòu)示意圖; 圖2為本發(fā)明實(shí)施例中提供的語(yǔ)音信號(hào)傳輸處理方法流程圖; 圖3為本發(fā)明實(shí)施例中采用的RTP協(xié)議數(shù)據(jù)包固定頭部示意圖; 圖4為本發(fā)明實(shí)施例RTP協(xié)議數(shù)據(jù)包擴(kuò)展頭格式示意圖; 圖5為本發(fā)明實(shí)施例還提供一種語(yǔ)音信號(hào)發(fā)送裝置。
具體實(shí)施例方式
鑒于現(xiàn)有技術(shù)中接收端設(shè)備進(jìn)行解碼后才獲知接收到的語(yǔ)音碼流的 音量值大小,對(duì)音量值不滿(mǎn)足要求的語(yǔ)音碼流消耗了解碼設(shè)備的資源,本 發(fā)明的實(shí)施例才是供一種語(yǔ)音信號(hào)傳輸處理方法,實(shí)現(xiàn)音量值與語(yǔ)音碼流同 步傳送,可在解碼之前獲知接收語(yǔ)音碼流對(duì)應(yīng)的音量值,在判斷該音量值 是否滿(mǎn)足要求之后,確定是否對(duì)所述語(yǔ)音碼流進(jìn)行解碼,從而避免或減少 解碼資源的浪費(fèi),進(jìn)一步提供一種比較完整的方案支撐業(yè)務(wù)使用。 下面通過(guò)具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述。 本發(fā)明實(shí)施例以會(huì)議電視系統(tǒng)中的語(yǔ)音傳輸為例進(jìn)行描述。 在會(huì)議電視系統(tǒng)中的語(yǔ)音發(fā)送端主要是指終端設(shè)備(也可以是MCU 以及語(yǔ)音網(wǎng)關(guān)等設(shè)備),可進(jìn)行語(yǔ)音碼流的編碼。
參照?qǐng)D1,本發(fā)明實(shí)施例提供的設(shè)置在語(yǔ)音發(fā)送端的一種語(yǔ)音信號(hào)傳輸處理裝置,包括
編碼單元110,用于對(duì)所述音頻信號(hào)進(jìn)行抽樣、編碼形成語(yǔ)音數(shù)據(jù)碼
流;
音量獲取單元120,用于獲取語(yǔ)音數(shù)據(jù)碼流對(duì)應(yīng)的音量值; 封裝單元130,將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流一起按照預(yù)定格式 進(jìn)行封裝得到數(shù)據(jù)包;
發(fā)送單元140,將所述封裝后的數(shù)據(jù)包發(fā)送給接收端。 本實(shí)施例中,在編碼單元進(jìn)行語(yǔ)音編碼(碼流生成)過(guò)程中音量獲取 單元同步記錄下該碼流的音量值大小,可以通過(guò)數(shù)據(jù)表方式保存在編碼后 的緩沖區(qū)中或者把數(shù)據(jù)以文件方式保存下來(lái),供后續(xù)操作使用;也可以直 接將這兩組數(shù)據(jù)(實(shí)際語(yǔ)音碼流數(shù)據(jù)以及對(duì)應(yīng)的語(yǔ)音音量值)同時(shí)傳遞給 封裝單元,由封裝單元進(jìn)行封裝處理,形成數(shù)據(jù)包。然后由發(fā)送單元將所 述封裝后的數(shù)據(jù)包發(fā)送給接收端。
在會(huì)議電視系統(tǒng)中語(yǔ)音接收端的語(yǔ)音信號(hào)傳輸處理裝置,如圖2所示, 包括
接收單元210,用于接收音頻信號(hào)及其對(duì)應(yīng)的音量值,所述音量值不 遲于所述音頻信號(hào)到達(dá)接收端;
判斷單元220,用于判斷所述音量值的大小,若所述音量值滿(mǎn)足業(yè)務(wù) 策略時(shí),則發(fā)送解碼指令給解碼單元230;
解碼單元230,用于對(duì)音頻信號(hào)進(jìn)行解碼;具體可以是在會(huì)議電視系 統(tǒng)中的終端設(shè)備、MCU、網(wǎng)關(guān)設(shè)備等;根據(jù)所述判斷單元220發(fā)送的解碼 指令對(duì)所述音量值對(duì)應(yīng)的音頻信號(hào)進(jìn)行解碼。
接收單元210接收到的數(shù)據(jù)包,然后進(jìn)行拆分?jǐn)?shù)據(jù)包,區(qū)別出實(shí)際的 音頻碼流數(shù)據(jù)和與之對(duì)應(yīng)的音量值數(shù)據(jù)。判斷單元220對(duì)于需要根據(jù)音量 值大小決策是否需要進(jìn)行解碼的則直接對(duì)提取出來(lái)的語(yǔ)音音量值大小進(jìn) 行判斷過(guò)濾,決策是否需要解碼,需要?jiǎng)t啟動(dòng)解碼單元230進(jìn)行解碼,否 則不啟動(dòng)解碼。
由于能夠從傳送過(guò)來(lái)的數(shù)據(jù)直接獲取到語(yǔ)音數(shù)據(jù)的音量值,解碼設(shè)備 支持對(duì)音量值的判斷過(guò)濾后決策是否進(jìn)行解碼,因此可以節(jié)約解碼設(shè)備的
8解碼資源。這樣,對(duì)于支持超大容量的終端/網(wǎng)關(guān)/MCU等接入的應(yīng)用場(chǎng)景 下,可以大大節(jié)省解碼資源配置,為客戶(hù)提供最低的成本,但不影響任何 服務(wù)質(zhì)量。
參照?qǐng)D3本發(fā)明實(shí)施例提供的一種語(yǔ)音信號(hào)傳輸處理方法,包括如下 步驟
5301, 發(fā)送端獲取語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值; 獲:f又語(yǔ)音數(shù)據(jù)碼流對(duì)應(yīng)的音量值的方法包括如下幾種
(1) 平均取值方法
假設(shè)音量值時(shí)間取值范圍為每4個(gè)時(shí)間單位為一個(gè)計(jì)算單元,該計(jì)算 單元內(nèi)的平均值算法則可以把4個(gè)固定的間隔(可以是4等分或者其他等 分)讀取一次音量值,然后所有音量值的加和/取值的次數(shù)=音量值。
(2) 最大值取值方法
假設(shè)音量值時(shí)間取值范圍為每4個(gè)時(shí)間單位為一個(gè)計(jì)算單元,該計(jì)算 單元內(nèi)的最大值算法則可以把4個(gè)刻度的時(shí)間分別按照固定的間隔(可以 是4等分或者其他等分)讀取一次音量值,然后取所有音量值中的最大值 作為本時(shí)間單元內(nèi)的音量值。
(3) 音量面積積分加權(quán)取值方法 作支設(shè)音量值時(shí)間取值范圍為每4個(gè)時(shí)間單位為一個(gè)計(jì)算單元,則通過(guò)
該單元內(nèi)的面積(音量值曲線(xiàn)與橫軸,縱軸組成的面積)積分方法計(jì)算出 面積,然后再才艮據(jù)上述平均取值或最大值等方法來(lái)計(jì)算出音量值,通過(guò)面 積和取得的音量值進(jìn)行不同比例的加權(quán)計(jì)算,得出最終的音量值,則能更 好體現(xiàn)根據(jù)音量的變化范圍進(jìn)行一種比較好的取值方法。
5302, 將所述語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值一起發(fā)送給接收端; 具體包括
對(duì)所述語(yǔ)音數(shù)據(jù)碼流進(jìn)行編碼形成語(yǔ)音數(shù)據(jù)碼流; 將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流一起按照預(yù)定格式進(jìn)行封裝得到 數(shù)據(jù)包;
將封裝后的數(shù)據(jù)包發(fā)送給接收端。 所述按照預(yù)定格式進(jìn)行封裝,具體包括
9將預(yù)定格式數(shù)據(jù)包包頭進(jìn)行擴(kuò)展,將所述音量值攜帶在所述數(shù)據(jù)包的 擴(kuò)展包頭;
(IP包交換網(wǎng)絡(luò))H323/SIP等基于IP傳送的系統(tǒng)直接在音頻碼流 傳輸中的RTP協(xié)議中擴(kuò)展RTP包頭的字段,用于表示同步發(fā)送的語(yǔ)音碼 流的音量值。
RTP協(xié)議數(shù)據(jù)包固定頭部如圖3所示,RTP擴(kuò)展頭格式,如圖4所示, 其中的擴(kuò)展頭Header extension (X): 1 bit,其中X為音量值。如果該字段 置1, RTP固定頭后面必須跟至少一個(gè)擴(kuò)展頭部。將下面的X位置設(shè)為1, 并放置在固定頭部之后(包括CSRC列表,如果有的話(huà)),媒體數(shù)據(jù)(包 含媒體頭和媒體數(shù)據(jù))之前。擴(kuò)展頭長(zhǎng)度不固定,但是前16 bits表示類(lèi)型, 接著16bites表示長(zhǎng)度(包含自身和前面的類(lèi)型長(zhǎng)度)。
或者,將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流按照對(duì)應(yīng)關(guān)系封裝到數(shù)據(jù)包中。
另外,也可采用在語(yǔ)音碼流中定義音量值,可以采用下面的表達(dá)形式 進(jìn)行音頻碼流和音量值的封裝,采用標(biāo)識(shí)字段進(jìn)行標(biāo)識(shí)后面跟隨的數(shù)據(jù)是 音量值還是碼流值,標(biāo)識(shí)段至少要l個(gè)bit以上,可以用多個(gè)bit位填特殊 的數(shù)據(jù)表明該段為標(biāo)識(shí)段,然后其中l(wèi)bit的0/1值分別表示后續(xù)的數(shù)據(jù)是 音量值或者是碼流數(shù)據(jù);音量值的表示數(shù)據(jù)則釆用32bit表示;后續(xù)的音 頻碼流數(shù)據(jù)則按照現(xiàn)有的格式進(jìn)行封裝,根據(jù)音頻協(xié)議的不同,音頻碼流 數(shù)據(jù)長(zhǎng)度也不同,因此,在此不進(jìn)行具體音頻碼流數(shù)據(jù)的長(zhǎng)度標(biāo)識(shí),其實(shí) 現(xiàn)方式與現(xiàn)有的一樣即可。
當(dāng)電視會(huì)議系統(tǒng)中采用E1/ISDN等電路交換專(zhuān)線(xiàn),如按照R320標(biāo)準(zhǔn)的 電視會(huì)議系統(tǒng)(H,320標(biāo)準(zhǔn)對(duì)基于電路交換的電視會(huì)議系統(tǒng)進(jìn)行了定義, 能在傳輸網(wǎng)絡(luò)平臺(tái)上開(kāi)展標(biāo)準(zhǔn)的電視會(huì)議應(yīng)用),在基于&320系統(tǒng)的傳 輸通道中傳輸用于表示同步發(fā)送的語(yǔ)音碼流的音量值;
H.320是有專(zhuān)門(mén)的獨(dú)立音頻時(shí)隙(通道),目前其他非音頻時(shí)隙已經(jīng)沒(méi) 有可以擴(kuò)展的,因?yàn)橥?20每個(gè)時(shí)隙都是獨(dú)立傳送某種類(lèi)型的數(shù)據(jù),如果
對(duì)應(yīng)關(guān)系,所以本發(fā)明實(shí)施例中采用在傳輸語(yǔ)音凄t據(jù)流的時(shí)隙中增加傳送音量值,即在每次傳輸音頻碼流數(shù)據(jù)前先進(jìn)行音量值的傳送,實(shí)現(xiàn)——對(duì) 應(yīng)。
由于音頻協(xié)議不同,音頻碼流數(shù)據(jù)長(zhǎng)度也不同,因此本實(shí)施例中不進(jìn) 行具體音頻碼流數(shù)據(jù)的長(zhǎng)度標(biāo)識(shí),具體采用與以前一樣的實(shí)現(xiàn)方式即可。
音量值數(shù)據(jù)段的定義建議采用32位以上,其中32位用于表示音量值, 其他位用于標(biāo)識(shí)該段數(shù)據(jù)為音量值表示數(shù)據(jù)。
另夕卜,根據(jù)實(shí)際每次封裝音頻碼流的數(shù)據(jù)量(即一個(gè)時(shí)間段內(nèi)的數(shù)據(jù), 如G.711A是每次封裝20ms時(shí)間長(zhǎng)度的數(shù)據(jù)),可以在傳輸音頻碼流前傳 輸多個(gè)音量值;也可以多個(gè)音頻碼流數(shù)據(jù)前只傳輸一個(gè)音量值。
S303,接收端接收語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值,通常所述音量值 不遲于所述音頻信號(hào)到達(dá)接收端;
S304,判斷所述音量值的大小;
將接收到的音量值與預(yù)定的業(yè)務(wù)策略所需要的音量值進(jìn)行比較,根據(jù) 比較結(jié)果進(jìn)行后續(xù)操作。
'S305,若所述音量值大于業(yè)務(wù)策略所需要的音量值時(shí),則對(duì)該音量值 對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)碼流進(jìn)行解碼。
本發(fā)明實(shí)施例還提供一種語(yǔ)音信號(hào)發(fā)送方法,包括
5401, 獲取語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值;
5402, 將所述語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值一起發(fā)送給接收端。 具體包括
對(duì)所述語(yǔ)音數(shù)據(jù)碼流進(jìn)行編碼形成語(yǔ)音數(shù)據(jù)碼流; 將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流一起按照預(yù)定格式進(jìn)行封裝得到 數(shù)據(jù)包;
將封裝后的數(shù)據(jù)包發(fā)送給接收端。 所述按照預(yù)定格式進(jìn)行封裝,具體包括 將預(yù)定格式數(shù)據(jù)包包頭進(jìn)行擴(kuò)展,將所述音量值攜帶在所述數(shù)據(jù)包的 擴(kuò)展包頭;或
將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流按照對(duì)應(yīng)關(guān)系封裝到數(shù)據(jù)包中。 所述語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值采用電路交換方式傳輸,還包括
按照語(yǔ)音數(shù)據(jù)碼流與其音量值對(duì)應(yīng)關(guān)系在傳輸語(yǔ)音數(shù)據(jù)流的時(shí)隙中 傳送音量值。
參照?qǐng)D5,本發(fā)明實(shí)施例還提供一種語(yǔ)音信號(hào)發(fā)送裝置,包括 音量獲取單元510,用于獲取音頻信號(hào)對(duì)應(yīng)的音量值; 編碼單元520,用于對(duì)所述音頻信號(hào)進(jìn)4于抽樣、編碼形成語(yǔ)音數(shù)據(jù)碼
流;
發(fā)送單元540,用于發(fā)送所述音量值及語(yǔ)音數(shù)據(jù)碼流給接收端。 進(jìn)一步地還包括,封裝單元530,將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流 一起按照預(yù)定格式進(jìn)行封裝得到數(shù)據(jù)包;
發(fā)送單元540將所述封裝后的數(shù)據(jù)包發(fā)送給接收端。 本發(fā)明實(shí)施例提供的技術(shù)方案可以應(yīng)用到所有涉及到語(yǔ)音通訊系統(tǒng), 包括多點(diǎn)通訊或點(diǎn)對(duì)點(diǎn)通訊,可以應(yīng)用到下一4、 NGN通信網(wǎng)、IP多i某體 系統(tǒng)(IMS , IP Multimedia Subsystem )以及即時(shí)通訊等系統(tǒng),并且不受限 于網(wǎng)絡(luò)傳輸方式以及設(shè)備類(lèi)型。通過(guò)該技術(shù)可以較快獲取到對(duì)端發(fā)送過(guò)來(lái) 的音量值,而進(jìn)行相應(yīng)的應(yīng)用,實(shí)現(xiàn)不同程度的節(jié)省資源,如對(duì)方的音量 值低于預(yù)定值,則本端進(jìn)行播放或混音處理時(shí)可以直接不進(jìn)行解碼其音頻 碼流,直接采用舒適噪音等進(jìn)行替代,或者可以其他新的應(yīng)用業(yè)務(wù),如靜 音期間插音廣告等語(yǔ)音服務(wù)。
綜上所述,本發(fā)明實(shí)施例提供的技術(shù)方案,將音量值實(shí)時(shí)傳遞給接收 碼流的設(shè)備,可在解碼之前獲知接收語(yǔ)音碼流對(duì)應(yīng)的音量值,在判斷該音 量值是否滿(mǎn)足要求之后,確定是否對(duì)所述語(yǔ)音碼流進(jìn)行解碼,從而避免或 減少解碼資源的浪費(fèi),有效解決了當(dāng)前會(huì)議電視系統(tǒng)中對(duì)接收到的所有語(yǔ) 音碼流進(jìn)行解碼才能獲取到音量值的大量浪費(fèi)資源的問(wèn)題,支撐在該方案 下的節(jié)能但不損傷任何服務(wù)質(zhì)量的 一種應(yīng)用方式。
另外,根據(jù)本發(fā)明提供的語(yǔ)音碼流和音量值的同步封裝以及傳送方 案,有效解決了 一些協(xié)議或廠家M傳輸語(yǔ)音碼流和音量值導(dǎo)致的數(shù)據(jù)準(zhǔn) 確性低以及難實(shí)現(xiàn)關(guān)聯(lián),計(jì)算量大以及影響系統(tǒng)性能和指標(biāo)以及語(yǔ)音時(shí)延 大等問(wèn)題。
12本發(fā)明易于在會(huì)議電視現(xiàn)有協(xié)議基礎(chǔ)上實(shí)現(xiàn),并且降低互通兼容的成本。
顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各單元或各步驟 可以用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者 分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí) 行的程序代碼來(lái)實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來(lái) 執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)單 元或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特 定的硬件和軟件結(jié)合。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù) 范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等, 均包含在本發(fā)明的保護(hù)范圍內(nèi)。
權(quán)利要求
1、一種語(yǔ)音信號(hào)傳輸處理方法,其特征在于,包括接收語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值;判斷所述音量值的大小,若所述音量值滿(mǎn)足業(yè)務(wù)策略時(shí),則對(duì)該音量值對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)碼流進(jìn)行解碼。
2、 如權(quán)利要求1所述的方法,其特征在于,語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的 音量值由發(fā)送端獲取,該方法還包括 將所述語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值一起發(fā)送給接收端。
3、 如權(quán)利要求2所述的方法,其特征在于,所述將所述語(yǔ)音碼流及其 對(duì)應(yīng)的音量值一起發(fā)送給接收端,具體包括對(duì)所述語(yǔ)音數(shù)據(jù)碼流進(jìn)行編碼形成語(yǔ)音數(shù)據(jù)碼流; 將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流一起按照預(yù)定格式進(jìn)行封裝得到數(shù) 據(jù)包;將封裝后的數(shù)據(jù)包發(fā)送給接收端。
4、 如權(quán)利要求3所述的方法,其特征在于,所述按照預(yù)定格式進(jìn)行封 裝,具體包括將預(yù)定格式數(shù)據(jù)包包頭進(jìn)行擴(kuò)展,將所述音量值攜帶在所述數(shù)據(jù)包的擴(kuò) 展包頭。
5、 如權(quán)利要求3所述的方法,其特征在于,所述按照預(yù)定格式進(jìn)行封 裝,具體包括將所述音量值與所述語(yǔ)音 居碼流按照對(duì)應(yīng)關(guān)系封裝到數(shù)據(jù)包中。
6、 如權(quán)利要求1所述的方法,其特征在于,所述語(yǔ)音數(shù)據(jù)碼流及其對(duì) 應(yīng)的音量值采用電路交換方式傳輸,還包括按照語(yǔ)音數(shù)據(jù)碼流與其音量值對(duì)應(yīng)關(guān)系在傳輸語(yǔ)音數(shù)據(jù)流的時(shí)隙中傳 送音量值。
7、 如權(quán)利要求3至6中任一項(xiàng)所述的方法,其特征在于,所述數(shù)據(jù)包 中包含的音量值的數(shù)量根據(jù)抽樣頻率和/或音量變化情況確定。
8、 一種語(yǔ)音信號(hào)傳輸處理裝置,其特征在于,包括 接收單元,用于接收音頻信號(hào)及其對(duì)應(yīng)的音量值;判斷單元,用于判斷所述音量值的大小,若所述音量值滿(mǎn)足業(yè)務(wù)策略時(shí),則發(fā)送解碼指令給解碼單元;解碼單元,用于對(duì)音頻信號(hào)進(jìn)行解碼;根據(jù)所述判斷單元發(fā)送的解碼指 令對(duì)所述音量值對(duì)應(yīng)的音頻信號(hào)進(jìn)行解碼。
9、 一種語(yǔ)音信號(hào)發(fā)送方法,其特征在于,包括 獲取語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值; 將所述語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值一起發(fā)送給接收端。
10、 如權(quán)利要求9所述的方法,其特征在于,所述將所述語(yǔ)音碼流及其 對(duì)應(yīng)的音量值一起發(fā)送給接收端,具體包括對(duì)所述語(yǔ)音數(shù)據(jù)碼流進(jìn)行編碼形成語(yǔ)音數(shù)據(jù)碼流; 將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流一起按照預(yù)定格式進(jìn)行封裝得到數(shù) 據(jù)包;將封裝后的數(shù)據(jù)包發(fā)送給接收端。
11、 如權(quán)利要求IO所述的方法,其特征在于,所述按照預(yù)定格式進(jìn)行 封裝,具體包括將預(yù)定格式數(shù)據(jù)包包頭進(jìn)行擴(kuò)展,將所述音量值攜帶在所述數(shù)據(jù)包的擴(kuò) 展包頭。
12、 如權(quán)利要求IO所述的方法,其特征在于,所述按照預(yù)定格式進(jìn)行 封裝,具體包括將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流按照對(duì)應(yīng)關(guān)系封裝到數(shù)據(jù)包中。
13、 如權(quán)利要求9所述的方法,其特征在于,所述語(yǔ)音數(shù)據(jù)碼流及其對(duì) 應(yīng)的音量值采用電路交換方式傳輸,還包括按照語(yǔ)音數(shù)據(jù)碼流與其音量值對(duì)應(yīng)關(guān)系在傳輸語(yǔ)音數(shù)據(jù)流的時(shí)隙中傳 送音量值。
14、 一種語(yǔ)音信號(hào)發(fā)送裝置,其特征在于,包括 音量獲取單元,用于獲取音頻信號(hào)對(duì)應(yīng)的音量值;編碼單元,用于對(duì)所述音頻信號(hào)進(jìn)行抽樣、編碼形成語(yǔ)音數(shù)據(jù)碼流; 發(fā)送單元,用于發(fā)送所述音量值及語(yǔ)音數(shù)據(jù)碼流給接收端。
15、 如權(quán)利要求14所述的裝置,其特征在于,還包括封裝單元,將所述音量值與所述語(yǔ)音數(shù)據(jù)碼流一起按照預(yù)定格式進(jìn)行封裝得到數(shù)據(jù)包;所述發(fā)送單元發(fā)送所述封裝后的數(shù)據(jù)包給接收端。
全文摘要
本發(fā)明公開(kāi)了一種語(yǔ)音信號(hào)傳輸處理方法,包括接收語(yǔ)音數(shù)據(jù)碼流及其對(duì)應(yīng)的音量值,所述音量值不遲于所述音頻信號(hào)到達(dá)接收端;判斷所述音量值的大小,若所述音量值滿(mǎn)足業(yè)務(wù)策略時(shí),則對(duì)該音量值對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)碼流進(jìn)行解碼。本發(fā)明還提供了相應(yīng)的語(yǔ)音信號(hào)傳輸處理裝置。根據(jù)本發(fā)明在判斷該音量值是否滿(mǎn)足要求之后,確定是否對(duì)所述語(yǔ)音碼流進(jìn)行解碼,從而避免或減少解碼資源的浪費(fèi)。
文檔編號(hào)H04N7/15GK101489091SQ200910008450
公開(kāi)日2009年7月22日 申請(qǐng)日期2009年1月23日 優(yōu)先權(quán)日2009年1月23日
發(fā)明者羅桂英 申請(qǐng)人:深圳華為通信技術(shù)有限公司