專利名稱:基于電路域可視電話同步錄制對(duì)端聲音圖像的方法和終端的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于電路域可視通話領(lǐng)域,尤其涉及一種基于電路域可 視電話同步錄制對(duì)端聲音圖像的方法和終端。
背景技術(shù):
隨著計(jì)算機(jī)技術(shù)和第三代移動(dòng)通訊技術(shù)(3rd Generation, 3G)的發(fā)展, 用戶端計(jì)算機(jī)設(shè)備的處理能力越來(lái)越強(qiáng)大,視頻數(shù)據(jù)通過(guò)移動(dòng)通訊網(wǎng)絡(luò)的實(shí)
時(shí)傳輸技術(shù)已經(jīng)比較成熟。3G網(wǎng)絡(luò)的最大用途是同步溝通,目前通過(guò)移動(dòng)
視電話是3G時(shí)代的一個(gè)重要應(yīng)用,目前3G手機(jī)是實(shí)現(xiàn)這個(gè)應(yīng)用的一個(gè)重
要終端。在利用可視電話進(jìn)行通話的過(guò)程中,將包含對(duì)方圖像和聲音的音視
頻流錄制成3GP格式的文件也是一個(gè)非常重要的應(yīng)用。3GP格式是移動(dòng)終
端普遍支持的視頻文件格式。中國(guó)電信IMS (IP Multimedia Subsystem, IP
多媒體系統(tǒng))終端技術(shù)要求中規(guī)定移動(dòng)終端應(yīng)支持3GP格式的音視頻的 編碼和解碼。
3GPP ( 3rd Generation Partnership Project,第三代合作伙伴計(jì)劃)提出了 基于電路域進(jìn)行音視頻傳輸?shù)囊苿?dòng)可視電話的解決方案3G-324M協(xié)議集。 3G-324M協(xié)i義集包含H.324M協(xié)議、H.223復(fù)用協(xié)i義、H.245控制協(xié)i義和音 ^L頻編碼協(xié)議等。
3GP標(biāo)準(zhǔn)是3GPP組織制定的3GPP 26244-720標(biāo)準(zhǔn),該標(biāo)準(zhǔn)基于 ISO/IEC 041828—ISOJEC—14496-12—2005 (E)。目前大多凄t可^L電話錄像 就是將對(duì)端視頻和音頻流根據(jù)3GP標(biāo)準(zhǔn)格式錄制成3GP文件后,在播放器 中播放。這樣,用戶就可以看到對(duì)端的圖像、聽(tīng)到對(duì)端的聲音了。
現(xiàn)有可視電話在通話過(guò)程中,雙方可實(shí)時(shí)地看到對(duì)端通過(guò)攝像頭捕獲到
5的視頻圖像,同時(shí)聽(tīng)到對(duì)端通過(guò)麥克風(fēng)捕獲到的音頻聲音。移動(dòng)終端在將看 到的和聽(tīng)到的視頻和音頻錄制成3GP文件時(shí),為了不影響當(dāng)前可視通話效 果,需啟動(dòng)音頻寫(xiě)入線程和視頻寫(xiě)入線程。音視頻寫(xiě)入線程在處理音視頻幀 時(shí),需要取得手機(jī)系統(tǒng)時(shí)間。但由于線程優(yōu)先級(jí)和調(diào)度的原因,使得上述兩 個(gè)線程取到的時(shí)間不一致,所以就會(huì)出現(xiàn)音視頻不同步的現(xiàn)象,有時(shí)會(huì)相差
l秒,有時(shí)會(huì)相差2 3秒甚至更多。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是提供一種基于電路域可視電話同步錄制對(duì) 端聲音圖像的方法和終端,以解決現(xiàn)有技術(shù)中存在的錄制音視頻不同步的問(wèn)題。
為解決上述問(wèn)題,本發(fā)明提供了一種基于電路域可視電話同步錄制對(duì)端 聲音和圖像的方法,包括
間作為基準(zhǔn)時(shí)間并對(duì)接收到的音視頻碼流進(jìn)行幀解析;將解析出的音頻幀、 視頻幀及各幀所對(duì)應(yīng)的時(shí)長(zhǎng)寫(xiě)入3GP文件中;其中,除寫(xiě)入該3GP文件中 的第 一 個(gè)音視頻幀以外的各音視頻幀的時(shí)長(zhǎng)為解析出該幀時(shí)的相對(duì)時(shí)間與 解析出前一對(duì)應(yīng)幀時(shí)的相對(duì)時(shí)間的差值,而解析出各幀時(shí)的相對(duì)時(shí)間的值為 解析出該幀時(shí)的本地時(shí)間與所述基準(zhǔn)時(shí)間的差值。
進(jìn)一步地,上述方法還可具有以下特征
寫(xiě)入3GP文件的第一個(gè)音頻幀的時(shí)長(zhǎng)為20ms,寫(xiě)入3GP文件的第一個(gè) 視頻幀的時(shí)長(zhǎng)為((N*8) A見(jiàn)頻所占實(shí)際網(wǎng)絡(luò)帶寬)*1000ms, N為該-現(xiàn)頻 幀所包含的字節(jié)數(shù)。
進(jìn)一步地,上述方法還可具有以下特征
所述終端將解析出的視頻幀寫(xiě)入3GP文件中具體包括
所述終端對(duì)解析出的各視頻幀依次進(jìn)行判斷,直到判斷出某一視頻幀為 I幀時(shí)才開(kāi)始將當(dāng)前視頻幀及后續(xù)視頻幀寫(xiě)入3GP文件;
所述終端將解析出的音頻幀寫(xiě)入3GP文件中具體包括在對(duì)解析出的第 一個(gè)音頻幀進(jìn)行寫(xiě)入之前,判斷本終端此時(shí)是否已判斷
出某一視頻幀為I幀,如果是,則將當(dāng)前音頻幀及后續(xù)音頻幀寫(xiě)入3GP文件; 否則,對(duì)下一音頻幀進(jìn)行上述判斷操作。
進(jìn)一步地,上述方法還可具有以下特征
所述終端中設(shè)置有一標(biāo)志位;當(dāng)所述終端判斷出某一視頻幀為I幀時(shí), 置位該標(biāo)志位;
在寫(xiě)入音頻幀之前判斷本終端是否已判斷出某一視頻幀為I幀是指判 斷該標(biāo)志位是否被置位。
進(jìn)一步地,上述方法還可具有以下特征
所述終端在收到用戶發(fā)來(lái)的錄像指令后,還包括向?qū)Χ税l(fā)送I幀請(qǐng)求。
進(jìn)一步地,上述方法還可具有以下特征
所述視頻所占實(shí)際網(wǎng)絡(luò)帶寬的值為48位速率或經(jīng)驗(yàn)值。
進(jìn)一步地,上述方法還可具有以下特征
所述可^L通話參與方為主叫用戶和/或#皮叫用戶。
進(jìn)一步地,上述方法還可包括
所述終端在接收到用戶發(fā)來(lái)的停止錄像命令后,停止對(duì)音視頻流進(jìn)行解 析,并關(guān)閉3GP文件。
為解決上述問(wèn)題,本發(fā)明還提供了 一種基于電路域可視電話同步錄制對(duì) 端聲音圖像的終端,包括音視頻幀解析模塊、音頻幀寫(xiě)入模塊及視頻幀寫(xiě)入 模塊,還包括幀時(shí)長(zhǎng)計(jì)算模塊;
所述音視頻幀解析模塊用于在收到用戶發(fā)來(lái)的錄像指令后,向所述幀時(shí) 長(zhǎng)計(jì)算模塊發(fā)送計(jì)時(shí)命令,并開(kāi)始對(duì)接收到的音視頻碼流進(jìn)行幀解析;還用
于記錄解析出的每一音視頻幀時(shí)的本地時(shí)間并發(fā)送給所述幀時(shí)長(zhǎng)計(jì)算模塊;
所述音頻幀寫(xiě)入模塊用于將所述音視頻幀解析模塊解析出的音頻幀及 各音頻幀所對(duì)應(yīng)的時(shí)長(zhǎng)寫(xiě)入3GP文件中;
所述視頻幀寫(xiě)入模塊用于將所述音視頻幀解析模塊解析出的視頻幀及各一見(jiàn)頻幀所對(duì)應(yīng)的時(shí)長(zhǎng)寫(xiě)入所述3GP文件中;
所述幀時(shí)長(zhǎng)計(jì)算模塊用于在接收到所述開(kāi)始計(jì)時(shí)命令時(shí),取本地時(shí)間作 為基準(zhǔn)時(shí)間;還用于計(jì)算除寫(xiě)入3GP文件的第一個(gè)音視頻幀以外的其余各
出該幀時(shí)的相對(duì)時(shí)間與解析出前一對(duì)應(yīng)幀時(shí)的相對(duì)時(shí)間的差值,而解析出各 幀時(shí)的相對(duì)時(shí)間的值為解析出該幀時(shí)的本地時(shí)間與所述基準(zhǔn)時(shí)間的差值。
進(jìn)一步地,上述終端還可具有以下特征
寫(xiě)入3GP文件的第一個(gè)音頻幀的時(shí)長(zhǎng)為20ms,寫(xiě)入3GP文件的第一個(gè) -現(xiàn)頻幀的時(shí)長(zhǎng)為((N*8) A見(jiàn)頻所占實(shí)際網(wǎng)絡(luò)帶寬)*1000ms, N為該-現(xiàn)頻 幀所包含的字節(jié)數(shù)。
進(jìn)一步地,上述終端還可具有以下特征
所述視頻幀寫(xiě)入模塊用于對(duì)所述解析出的各視頻幀依次進(jìn)行判斷,直到 判斷出某一視頻幀為I幀時(shí)才開(kāi)始將當(dāng)前視頻幀及后續(xù)視頻幀寫(xiě)入3GP文 件;
所述音頻幀寫(xiě)入模塊用于在對(duì)解析出的第 一個(gè)音頻幀進(jìn)行寫(xiě)入之前,判 斷所述視頻幀寫(xiě)入模塊是否已判斷出某一視頻幀為I幀,如果是,則用于將 當(dāng)前音頻幀及后續(xù)音頻幀寫(xiě)入3GP文件;否則,對(duì)下一音頻幀進(jìn)行上述判 斷操作。
采用本發(fā)明后,可以在可視電話通話過(guò)程中同步錄制對(duì)方的圖像和聲 音;同時(shí)由于在接收到視頻I幀時(shí)才開(kāi)始錄像,避免了錄像開(kāi)始時(shí)候播放P 幀而帶來(lái)的前幾秒花屏的現(xiàn)象;在錄像開(kāi)始時(shí)候向?qū)Ψ桨l(fā)送I幀請(qǐng)求,使對(duì) 端能及時(shí)向本端發(fā)送I幀,避免開(kāi)始錄像后丟棄較多P幀,使用戶體驗(yàn)到用 戶啟動(dòng)錄像時(shí)間和實(shí)際錄像時(shí)間基本相同,從而提高用戶滿意度。
圖1為本發(fā)明實(shí)施例中可視電話同步錄像音視頻的流程圖; 圖2為本發(fā)明實(shí)施例中同步錄制對(duì)端聲音圖像的終端結(jié)構(gòu)圖。
具體實(shí)施例方式
下面將結(jié)合附圖及實(shí)施例對(duì)本發(fā)明的技術(shù)方案進(jìn)行更詳細(xì)的說(shuō)明。
本發(fā)明的基本構(gòu)思是可視通話參與方(主叫和/或被叫用戶)所使用 的終端在收到用戶發(fā)來(lái)的錄像指令后,取本地時(shí)間作為基準(zhǔn)時(shí)間并對(duì)接收到 的音視頻碼流進(jìn)行幀解析;然后將解析出的音頻幀、視頻幀及各幀所對(duì)應(yīng)的 時(shí)長(zhǎng)(duration)寫(xiě)入3GP文件中,其中,寫(xiě)入3GP文件的第一個(gè)音頻幀的 時(shí)長(zhǎng)可為20ms,寫(xiě)入3GP文件的第一個(gè)^L頻幀的時(shí)長(zhǎng)可為((>1*8)/一見(jiàn)頻 所占實(shí)際網(wǎng)絡(luò)帶寬"1000ms, N為該視頻幀所包含的字節(jié)數(shù),其余各音視 頻幀的時(shí)長(zhǎng)為解析出該幀時(shí)的相對(duì)時(shí)間與解析出前 一 對(duì)應(yīng)幀時(shí)的相對(duì)時(shí)間 的差值,而解析出各幀時(shí)的相對(duì)時(shí)間的值為解析出該幀時(shí)的本地時(shí)間與上述 基準(zhǔn)時(shí)間的差值。
電路域可視電話為64k位速率,分配給視頻帶寬一般為48k位速率。因 此,上述視頻所占實(shí)際網(wǎng)絡(luò)帶寬的值可耳又48位速率或經(jīng)-驗(yàn)值(如35k位速 率)。
為了保證錄制的前幾秒不會(huì)因?yàn)椴シ臥幀而出現(xiàn)花屏現(xiàn)象,則可以對(duì)解 析出的各視頻幀依次進(jìn)行判斷,直到判斷出某一視頻幀為I幀時(shí)才開(kāi)始將當(dāng) 前視頻幀及后續(xù)視頻幀寫(xiě)入3GP文件。相應(yīng)的,在對(duì)解析出的第一個(gè)音頻 幀進(jìn)行寫(xiě)入之前,需判斷本終端此時(shí)是否已判斷出某一視頻幀為I幀,如果 是,則將當(dāng)前音頻幀及后續(xù)音頻幀寫(xiě)入3GP文件;否則,對(duì)下一音頻幀進(jìn) 行上述判斷操作。
可在該終端中設(shè)置一標(biāo)志位,當(dāng)該終端判斷出某一視頻幀為I幀時(shí),置 位該標(biāo)志位;而在寫(xiě)入音頻幀之前判斷本終端是否已判斷出某一視頻幀為I 幀是指判斷該標(biāo)志位是否被置位。
而為了避免在開(kāi)始錄像后丟棄較多P幀,上述終端還可以在收到用戶發(fā) 來(lái)的錄像指令后,向?qū)Χ税l(fā)送I幀請(qǐng)求,使得對(duì)端可以盡快地向本端發(fā)送I 幀,減少了 P幀的丟棄量。
此外,終端在接收到用戶發(fā)來(lái)的停止錄像命令后,停止對(duì)音視頻流進(jìn)行解析,并關(guān)閉3GP文件,結(jié)束錄像流程。
而基于電路域可視電話同步錄制對(duì)端聲音圖像的終端,如圖2所示,包 括音視頻幀解析模塊、音頻幀寫(xiě)入模塊、視頻幀寫(xiě)入模塊及幀時(shí)長(zhǎng)計(jì)算模塊;
音視頻幀解析模塊用于在收到用戶發(fā)來(lái)的錄像指令后,向幀時(shí)長(zhǎng)計(jì)算模 塊發(fā)送計(jì)時(shí)命令,并開(kāi)始對(duì)接收到的音視頻碼流進(jìn)行幀解析;還用于記錄解 析出的每一音視頻幀時(shí)的本地時(shí)間并發(fā)送給幀時(shí)長(zhǎng)計(jì)算模塊;
音頻幀寫(xiě)入模塊用于將音視頻幀解析模塊解析出的音頻幀及各音頻幀 所對(duì)應(yīng)的時(shí)長(zhǎng)寫(xiě)入3GP文件中;
視頻幀寫(xiě)入模塊用于將音視頻幀解析模塊解析出的視頻幀及各視頻幀 所對(duì)應(yīng)的時(shí)長(zhǎng)寫(xiě)入所述3GP文件中;
幀時(shí)長(zhǎng)計(jì)算模塊用于在接收到開(kāi)始計(jì)時(shí)命令時(shí),取本地時(shí)間作為基準(zhǔn)時(shí) 間;還用于計(jì)算除寫(xiě)入3GP文件的第一個(gè)音視頻幀以外的其余各音視頻幀 的時(shí)長(zhǎng)并將各幀的時(shí)長(zhǎng)發(fā)送給對(duì)應(yīng)幀寫(xiě)入^f莫塊,該時(shí)長(zhǎng)的值為解析出該幀時(shí) 的相對(duì)時(shí)間與解析出前一對(duì)應(yīng)幀時(shí)的相對(duì)時(shí)間的差值,而解析出各幀時(shí)的相 對(duì)時(shí)間的值為解析出該幀時(shí)的本地時(shí)間與所述基準(zhǔn)時(shí)間的差值。其中,寫(xiě)入 3GP文件的第一個(gè)音頻幀的時(shí)長(zhǎng)為20ms,寫(xiě)入3GP文件的第一個(gè)視頻幀的 時(shí)長(zhǎng)為((N*8) A見(jiàn)頻所占實(shí)際網(wǎng)絡(luò)帶寬)*1000ms, N為該^L頻幀所包含 的字節(jié)數(shù)。
具體地,視頻幀寫(xiě)入模塊用于對(duì)解析出的各視頻幀依次進(jìn)行判斷,直到 判斷出某一視頻幀為I幀時(shí)才開(kāi)始將當(dāng)前視頻幀及后續(xù)視頻幀寫(xiě)入3GP文 件;音頻幀寫(xiě)入模塊用于在對(duì)解析出的第一個(gè)音頻幀進(jìn)行寫(xiě)入之前,判斷視 頻幀寫(xiě)入模塊是否已判斷出某一視頻幀為I幀,如果是,則用于將當(dāng)前音頻
幀及后續(xù)音頻幀寫(xiě)入3GP文件;否則,對(duì)下一音頻幀進(jìn)行上述判斷操作。 下面用本發(fā)明的 一應(yīng)用實(shí)例進(jìn)一 步加以i兌明。
圖1為本發(fā)明可視電話錄像音視頻同步流程示意圖,下面參見(jiàn)附圖2對(duì) 本發(fā)明的方法具體步驟進(jìn)行詳細(xì)的描述,其中步驟l、在主被叫雙方使用可視電話進(jìn)行可視通話過(guò)程中,任意一方的 可視電話1在收到用戶發(fā)起的錄像命令時(shí),向?qū)Χ丝梢曤娫?發(fā)送I幀請(qǐng)求, 并啟動(dòng)音頻寫(xiě)入線程和視頻寫(xiě)入線程,取本地時(shí)間作為基準(zhǔn)時(shí)間,進(jìn)行相關(guān)
資源申請(qǐng),創(chuàng)建3GP文件;
步驟2、對(duì)接收到的音視頻碼流進(jìn)行幀解析;為了表述清楚,下面將分 別對(duì)視頻寫(xiě)入流程及音頻寫(xiě)入流程進(jìn)行描述。
視頻寫(xiě)入流程包括
步驟A1、視頻寫(xiě)入線程判斷解析出的第一個(gè)視頻幀是否是I幀,如果 是,則執(zhí)行下一步驟;否則,丟棄該視頻幀,并繼續(xù)對(duì)下一視頻幀是否是I 幀進(jìn)行判斷,直到判斷出某一視頻幀是I幀時(shí),執(zhí)行下一步驟;
步驟A2、將該視頻幀的duration的值設(shè)置為((N*8 ) /視頻所占實(shí)際網(wǎng) 絡(luò)帶寬)*1000ms,其中,N表示該視頻幀所包含的字節(jié)數(shù);
步驟A3、計(jì)算并記錄解析出該視頻幀的相對(duì)時(shí)間,其值等于解析出該 幀時(shí)的本地時(shí)間與基準(zhǔn)時(shí)間的差值;
步驟A4、將該視頻幀及其對(duì)應(yīng)的duration寫(xiě)入到3GP文件中;
步驟A5、計(jì)算并記錄解析出下一視頻幀的相對(duì)時(shí)間,其值等于解析出 該幀時(shí)的本地時(shí)間與基準(zhǔn)時(shí)間的差值;
步驟A6、計(jì)算該^L頻幀的duration,其值等于解析出當(dāng)前幀的相對(duì)時(shí)間 與解析出前一視頻幀的相對(duì)時(shí)間的差值,然后執(zhí)行步驟A4。
音頻寫(xiě)入流程包括
步驟Bl、音頻寫(xiě)入線程在寫(xiě)入解析出的第一個(gè)音頻幀之前要判斷視頻 寫(xiě)入線程是否已判斷出某一視頻幀是I幀,如果是,則執(zhí)行下一步驟;否貝'J, 丟棄該音頻幀,并在寫(xiě)入下一音頻幀之前仍要進(jìn)行上述判斷和相應(yīng)的丟棄操 作,直到判斷出視頻寫(xiě)入線程已經(jīng)判斷出某一視頻幀是I幀時(shí),執(zhí)行下一步 驟;
步驟B2、將音頻幀的duration值設(shè)置為20ms;
步驟B3、計(jì)算并記錄解析出該音頻幀的相對(duì)時(shí)間,其值等于解析出該 幀時(shí)的本地時(shí)間與基準(zhǔn)時(shí)間的差值;步驟B4、將該音頻幀及其對(duì)應(yīng)的duration寫(xiě)入到3GP文件中;
步驟B5、計(jì)算并記錄解析出下一音頻幀的相對(duì)時(shí)間,其值等于解析出 該幀時(shí)的本地時(shí)間與基準(zhǔn)時(shí)間的差值;
步驟B6、計(jì)算該音頻幀的duration,其值等于解析出當(dāng)前幀的相對(duì)時(shí)間 與解析出前一音頻幀的相對(duì)時(shí)間的差值,然后執(zhí)行步驟B4。
當(dāng)然,本發(fā)明還可有其他多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的 形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
權(quán)利要求
1、一種基于電路域可視電話同步錄制對(duì)端聲音圖像的方法,其特征在于,可視通話參與方所使用的終端在收到用戶發(fā)來(lái)的錄像指令后,取本地時(shí)間作為基準(zhǔn)時(shí)間并對(duì)接收到的音視頻碼流進(jìn)行幀解析;將解析出的音頻幀、視頻幀及各幀所對(duì)應(yīng)的時(shí)長(zhǎng)寫(xiě)入3GP文件中;其中,除寫(xiě)入3GP文件的第一個(gè)音視頻幀以外的其余各音視頻幀的時(shí)長(zhǎng)均為解析出該幀時(shí)的相對(duì)時(shí)間與解析出前一對(duì)應(yīng)幀時(shí)的相對(duì)時(shí)間的差值,而解析出各幀時(shí)的相對(duì)時(shí)間的值為解析出該幀時(shí)的本地時(shí)間與所述基準(zhǔn)時(shí)間的差值。
2、 如權(quán)利要求l所述的方法,其特征在于,寫(xiě)入3GP文件的第一個(gè)音頻幀的時(shí)長(zhǎng)為20ms,寫(xiě)入3GP文件的第一個(gè) -現(xiàn)頻幀的時(shí)長(zhǎng)為((N*8) A見(jiàn)頻所占實(shí)際網(wǎng)絡(luò)帶寬)*1000ms, N為該-f見(jiàn)頻 幀所包含的字節(jié)數(shù)。
3、 如權(quán)利要求l所述的方法,其特征在于,所述終端將解析出的視頻幀寫(xiě)入3GP文件中具體包括所述終端對(duì)解析出的各視頻幀依次進(jìn)行判斷,直到判斷出某一視頻幀為 I幀時(shí)才開(kāi)始將當(dāng)前浮見(jiàn)頻幀及后續(xù)視頻幀寫(xiě)入3GP文件;所述終端將解析出的音頻幀寫(xiě)入3GP文件中具體包括在對(duì)解析出的第一個(gè)音頻幀進(jìn)行寫(xiě)入之前,判斷本終端此時(shí)是否已判斷 出某一視頻幀為I幀,如果是,則將當(dāng)前音頻幀及后續(xù)音頻幀寫(xiě)入3GP文件; 否則,對(duì)下一音頻幀進(jìn)行上述判斷操作。
4、 如權(quán)利要求3所述的方法,其特征在于,所述終端中設(shè)置有一標(biāo)志位;當(dāng)所述終端判斷出某一視頻幀為I幀時(shí), 置位該標(biāo)志位;在寫(xiě)入音頻幀之前判斷本終端是否已判斷出某一視頻幀為I幀是指判 斷該標(biāo)志位是否纟皮置位。
5、 如權(quán)利要求3或4所述的方法,其特征在于,所述終端在收到用戶發(fā)來(lái)的錄像指令后,還包括向?qū)Χ税l(fā)送I幀請(qǐng)求。
6、 如權(quán)利要求2所述的方法,其特征在于, 所述視頻所占實(shí)際網(wǎng)絡(luò)帶寬的值為48位速率或經(jīng)驗(yàn)值。
7、 如權(quán)利要求l所述的方法,其特征在于, 所述可-見(jiàn)通話參與方為主叫用戶和/或#皮叫用戶。
8、 如權(quán)利要求l所述的方法,其特征在于,還包括所述終端在接收到用戶發(fā)來(lái)的停止錄像命令后,停止對(duì)音視頻流進(jìn)行解 析,并關(guān)閉3GP文件。
9、 一種基于電路域可視電話同步錄制對(duì)端聲音圖像的終端,包括音視 頻幀解析模塊、音頻幀寫(xiě)入模塊及視頻幀寫(xiě)入模塊,其特征在于,還包括幀 時(shí)長(zhǎng)計(jì)算模塊;所述音視頻幀解析模塊用于在收到用戶發(fā)來(lái)的錄像指令后,向所述幀時(shí) 長(zhǎng)計(jì)算模塊發(fā)送計(jì)時(shí)命令,并開(kāi)始對(duì)接收到的音視頻碼流進(jìn)行幀解析;還用 于記錄解析出的 每一音視頻幀時(shí)的本地時(shí)間并發(fā)送給所述幀時(shí)長(zhǎng)計(jì)算模塊;所述音頻幀寫(xiě)入模塊用于將所述音視頻幀解析模塊解析出的音頻幀及 各音頻幀所對(duì)應(yīng)的時(shí)長(zhǎng)寫(xiě)入3GP文件中;所述視頻幀寫(xiě)入模塊用于將所述音視頻幀解析模塊解析出的視頻幀及 各視頻幀所對(duì)應(yīng)的時(shí)長(zhǎng)寫(xiě)入所述3GP文件中;所述幀時(shí)長(zhǎng)計(jì)算模塊用于在接收到所述開(kāi)始計(jì)時(shí)命令時(shí),取本地時(shí)間作 為基準(zhǔn)時(shí)間;還用于計(jì)算除寫(xiě)入3GP文件的第一個(gè)音視頻幀以外的其余各 音視頻幀的時(shí)長(zhǎng)并將各幀的時(shí)長(zhǎng)發(fā)送給對(duì)應(yīng)幀寫(xiě)入模塊,該時(shí)長(zhǎng)的值為解析 出該幀時(shí)的相對(duì)時(shí)間與解析出前一對(duì)應(yīng)幀時(shí)的相對(duì)時(shí)間的差值,而解析出各 幀時(shí)的相對(duì)時(shí)間的值為解析出該幀時(shí)的本地時(shí)間與所述基準(zhǔn)時(shí)間的差值。
10、 如權(quán)利要求9所述的終端,其特征在于,寫(xiě)入3GP文件的第一個(gè)音頻幀的時(shí)長(zhǎng)為20ms,寫(xiě)入3GP文件的第一個(gè)視頻幀的時(shí)長(zhǎng)為((N*8) /視頻所占實(shí)際網(wǎng)絡(luò)帶寬)*1000ms, N為該視頻 幀所包含的字節(jié)數(shù)。
11、如權(quán)利要求9所述的終端,其特征在于,所述視頻幀寫(xiě)入模塊用于對(duì)所述解析出的各視頻幀依次進(jìn)行判斷,直到 判斷出某一^L頻幀為I幀時(shí)才開(kāi)始將當(dāng)前^L頻幀及后續(xù)^L頻幀寫(xiě)入3GP文 件;所述音頻幀寫(xiě)入模塊用于在對(duì)解析出的第一個(gè)音頻幀進(jìn)行寫(xiě)入之前,判 斷所述視頻幀寫(xiě)入模塊是否已判斷出某一視頻幀為i幀,如果是,則用于將 當(dāng)前音頻幀及后續(xù)音頻幀寫(xiě)入3GP文件;否則,對(duì)下一音頻幀進(jìn)行上述判 斷操作。
全文摘要
基于電路域可視電話同步錄制對(duì)端聲音和圖像的方法和終端,其中,該方法包括可視通話參與方使用的終端在收到用戶發(fā)來(lái)的錄像指令后,取本地時(shí)間作為基準(zhǔn)時(shí)間并對(duì)接收到的音視頻碼流進(jìn)行幀解析;將解析出的音頻幀、視頻幀及各幀所對(duì)應(yīng)的時(shí)長(zhǎng)寫(xiě)入3GP文件中;其中,寫(xiě)入3GP文件的第一個(gè)音頻幀的時(shí)長(zhǎng)為20ms,寫(xiě)入3GP文件的第一個(gè)視頻幀的時(shí)長(zhǎng)為((N*8)/視頻所占實(shí)際網(wǎng)絡(luò)帶寬)*1000ms,N為該視頻幀包含的字節(jié)數(shù);其余各音視頻幀的時(shí)長(zhǎng)為解析出該幀時(shí)的相對(duì)時(shí)間與解析出前一對(duì)應(yīng)幀時(shí)的相對(duì)時(shí)間的差值,而解析出各幀時(shí)的相對(duì)時(shí)間的值為解析出該幀時(shí)的本地時(shí)間與基準(zhǔn)時(shí)間的差值。
文檔編號(hào)H04N7/24GK101540871SQ200910135589
公開(kāi)日2009年9月23日 申請(qǐng)日期2009年4月27日 優(yōu)先權(quán)日2009年4月27日
發(fā)明者閆曉梅 申請(qǐng)人:中興通訊股份有限公司