用于視頻通訊的通訊信息的呈現(xiàn)方法、裝置及系統(tǒng)的制作方法

文檔序號：9618978閱讀：229來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

用于視頻通訊的通訊信息的呈現(xiàn)方法、裝置及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通迅領(lǐng)域，尤其涉及用于視頻通訊的音視頻信息的呈現(xiàn)方法、裝置及系統(tǒng)。
【背景技術(shù)】
[0002] 現(xiàn)有用于視頻會議的通訊技術(shù)中，一方會場的顯示設(shè)備通常會顯示另一方會場的所有參會人員，如另一方會場中的參會人員過多，會導(dǎo)致顯示設(shè)備顯示過多人員而不能重點突出正在發(fā)言的人。
[0003] 因此，需要研究開發(fā)出一種通訊方法及系統(tǒng)克服上述缺陷。

【發(fā)明內(nèi)容】

[0004] 第一方面，本發(fā)明實施例提供了一種視頻通訊中用于呈現(xiàn)通訊信息的方法，包括：控制采集所述視頻通訊現(xiàn)場的音頻信息與視頻信息；根據(jù)所述音頻信息判斷所述視頻通訊現(xiàn)場中的發(fā)言人的位置，所述發(fā)言人為為所述視頻通訊現(xiàn)場參加者中發(fā)言的人，所述多個參加者為多個參加所述視頻通訊的人；根據(jù)所述發(fā)言人的位置從所述視頻信息中獲取發(fā)言視頻信息，其中，所述發(fā)言視頻信息為所述發(fā)言人在所述發(fā)言時段的視頻信息；控制所述發(fā) 目視頻?目息呈現(xiàn)。
[0005] 在第一方面的第一種可能的實現(xiàn)方式中，所述控制采集所述視頻通訊現(xiàn)場的音頻信息與視頻信息包括：控制數(shù)個采集設(shè)備采集所述音頻信息與所述視頻信息，所述數(shù)個采集設(shè)備中的每個采集設(shè)備包括一個音頻采集模塊及一個視頻采集模塊，所述視頻采集模塊相對于所述音頻采集模塊的位置為預(yù)設(shè)的，所述音頻采集模塊采集所述多個參加者中一個或數(shù)個參加者的音頻信息，所述視頻采集模塊采集所述一個或數(shù)個參加者的視頻信息，所述音頻采集模塊采集的所述多個參加者中一個或數(shù)個參加者的音頻信息構(gòu)成所述音頻信息中的一路音頻信息，所述視頻采集模塊采集的所述一個或數(shù)個參加者的視頻信息構(gòu)成所述視頻信息中的一路視頻信息；所述根據(jù)所述音頻信息判斷所述視頻通訊現(xiàn)場中的發(fā)言人的位置包括：將所述音頻信息中音量最大，音量超過音量閾值，且所述音量超過所述音量閾值的持續(xù)時間超過時間閾值的一路音頻信息作為所述發(fā)言人的聲音信息；及根據(jù)所述發(fā) 言人的聲音信息，判斷所述發(fā)言人相對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位置；所述根據(jù)所述發(fā)言人的位置從所述視頻信息中獲取發(fā)言視頻信息包括：根據(jù)所述發(fā)言人相對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位置及采集所述發(fā)言人的視頻信息的視頻采集模塊相對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位置，判斷所述發(fā) 言人相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置；識別出采集所述發(fā)言人的視頻信息的視頻采集模塊采集的一路視頻信息中的所述一個或數(shù)個參加者的影像，并記錄所述一個或數(shù)個參加者的影像相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置；根據(jù)所述發(fā)言人相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置及所述一個或數(shù)個參加者的影像相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置，確定采集所述發(fā)言人的視頻信息的視頻采集模塊采集的一路視頻信息中所述發(fā)言人的影像；及從采集所述發(fā)言人的視頻信息的視頻采集模塊采集的一路視頻信息中，提取所述發(fā)言時段中所述發(fā)言人的影像。
[0006] 在第一方面的第二種可能的實現(xiàn)方式中，所述控制采集所述視頻通訊現(xiàn)場的音頻信息與視頻信息包括：控制一個采集設(shè)備采集設(shè)備采集所述音頻信息與所述視頻信息，所述采集設(shè)備包括一個音頻采集模塊及一個視頻采集模塊，所述音頻采集模塊相對于所述視頻采集模塊的位置為預(yù)設(shè)的，所述音頻采集模塊采集所述音頻信息，所述音頻信息為所述多個參加者的音頻信息，所述視頻采集模塊采集所述視頻信息，所述視頻信息為所述多個參加者的視頻信息；所述根據(jù)所述音頻信息判斷所述視頻通訊現(xiàn)場中的發(fā)言人的位置包括：根據(jù)所述音頻信息，判斷所述發(fā)言人相對于所述音頻采集模塊的位置；所述根據(jù)所述發(fā)言人的位置從所述視頻信息中獲取發(fā)言視頻信息包括：根據(jù)所述發(fā)言人相對于所述音頻采集模塊的位置及所述視頻采集模塊相對于所述音頻采集模塊的位置，判斷所述發(fā)言人相對于所述視頻采集模塊的位置；識別出所述視頻信息中的所述多個參加者的影像，并記錄所述多個參加者的影像相對于所述視頻采集模塊的位置；根據(jù)所述發(fā)言人相對于所述視頻采集模塊的位置及所述多個參加者的影像相對于所述視頻采集模塊的位置，確定所述視頻信息中所述發(fā)言人的影像；及從所述視頻信息中，提取所述發(fā)言時段中所述發(fā)言人的影像。
[0007] 結(jié)合第一方面第一種可能的實現(xiàn)方式以及第二種可能的實現(xiàn)方式中的任意一種可能的實現(xiàn)方式，在第三種可能的實現(xiàn)方式中，其中，所述音頻采集模塊為麥克風(fēng)陣列，其中，所述麥克風(fēng)陣列包括至少兩個麥克風(fēng)。
[0008] 結(jié)合第一方面，或者第一方面第一至第二種任意一種可能的實現(xiàn)方式，在第四種可能的實現(xiàn)方式中，所述控制所述發(fā)言視頻信息呈現(xiàn)包括：控制所述發(fā)言視頻信息實時呈現(xiàn)。
[0009] 結(jié)合第一方面，或者第一方面第一至第二種任意一種可能的實現(xiàn)方式，在第五種可能的實現(xiàn)方式中，所述控制所述發(fā)言視頻信息呈現(xiàn)包括：控制記錄所述發(fā)言視頻信息；及控制記錄的所述發(fā)言視頻信息在所述發(fā)言時段結(jié)束后呈現(xiàn)。
[0010] 結(jié)合第一方面第五種可能的實現(xiàn)方式，在第六種可能的實現(xiàn)方式中，還包括：若所述發(fā)言人的音量低于音量最低閾值，且所述發(fā)言人的音量低于音量最低閾值的持續(xù)時間長于最長時間閾值，則判斷所述發(fā)言時段結(jié)束；或若收到發(fā)言結(jié)束信號，則判斷所述發(fā)言時段結(jié)束。
[0011] 結(jié)合第一方面第五種可能的實現(xiàn)方式以及第六種可能的實現(xiàn)方式中的任意一種可能的實現(xiàn)方式，在第七種可能的實現(xiàn)方式中，所述控制所述發(fā)言視頻信息呈現(xiàn)還包括生成與所述發(fā)言視頻信息對應(yīng)的記錄圖標，所述控制記錄的所述發(fā)言視頻信息在所述發(fā)言時段結(jié)束后呈現(xiàn)包括根據(jù)接收到的指示所述記錄圖標是否得到觸碰的信號，控制開啟播放或停止播放所述發(fā)言視頻信息。
[0012] 結(jié)合第一方面第七種可能的實現(xiàn)方式，在第八種可能的實現(xiàn)方式中，所述方法還包括根據(jù)接收到的指示所述記錄圖標是否得到觸碰的信號，控制開啟播放或停止播放下列信息中的至少一種信息：發(fā)言音頻信息及與所述發(fā)言音頻信息對應(yīng)的文本信息，所述發(fā)言音頻信息為所述音頻信息中在所述發(fā)言時段中的音頻信息。
[0013] 結(jié)合第一方面第五種可能的實現(xiàn)方式、第一方面第六種可能的實現(xiàn)方式及第一方面第七種可能的實現(xiàn)方式中任意一種可能的實現(xiàn)方式，在第九種可能的實現(xiàn)方式中，還包括：在所述發(fā)言時段中，禁止發(fā)言音頻信息及所述發(fā)言視頻信息實時呈現(xiàn)，所述發(fā)言音頻信息為所述音頻信息中在所述發(fā)言時段中的音頻信息。
[0014] 結(jié)合第一方面、第一方面第一種可能的實現(xiàn)方式、第一方面第二種可能的實現(xiàn)方式、第一方面第三種可能的實現(xiàn)方式及第一方面第四種可能的實現(xiàn)方式中任意一種可能的實現(xiàn)方式，在第十種可能的實現(xiàn)方式中，所述控制所述發(fā)言視頻信息呈現(xiàn)包括：控制記錄所述發(fā)言視頻信息；接收指示信息，所述指示信息用于指示待播放的發(fā)言視頻信息的時間范圍；及控制呈現(xiàn)所述時間范圍內(nèi)的所述發(fā)言視頻信息。
[0015] 第二方面，本發(fā)明實施例提供了一種視頻通訊中用于呈現(xiàn)通訊信息的裝置，包括：控制采集模塊，用于控制一個或多個采集設(shè)備采集所述視頻通訊現(xiàn)場的音頻信息與視頻信息；判斷模塊，用于根據(jù)所述音頻信息判斷所述視頻通訊現(xiàn)場中的發(fā)言人的位置，所述發(fā)言人為多個參加者中在發(fā)言時段發(fā)言的參加者，所述多個參加者為多個參加所述視頻通訊的人；獲取模塊，用于根據(jù)所述發(fā)言人的位置從所述視頻信息中獲取發(fā)言視頻信息，其中，所述發(fā)言視頻信息為所述發(fā)言人在所述發(fā)言時段的視頻信息；及控制呈現(xiàn)模塊，用于控制所述發(fā)言視頻信息呈現(xiàn)。
[0016] 在第二方面的第一種可能的實現(xiàn)方式中，所述采集設(shè)備為數(shù)個，所述數(shù)個采集設(shè) 備中的每個采集設(shè)備包括一個音頻采集模塊及一個視頻采集模塊，所述視頻采集模塊相對于所述音頻采集模塊的位置為預(yù)設(shè)的，所述音頻采集模塊采集所述多個參加者中一個或數(shù) 個參加者的音頻信息，所述視頻采集模塊采集所述一個或數(shù)個參加者的視頻信息，所述音頻采集模塊采集的所述一個或數(shù)個參加者的音頻信息構(gòu)成所述音頻信息中的一路音頻信息，所述視頻采集模塊采集的所述一個或數(shù)個參加者的視頻信息構(gòu)成所述視頻信息中的一路視頻信息；所述判斷模塊包括：選擇模塊，用于將所述音頻信息中音量最大，音量超過音量閾值，且所述音量超過所述音量閾值的持續(xù)時間超過時間閾值的一路音頻信息作為所述發(fā)言人的聲音信息；及音頻判位模塊，用于根據(jù)所述發(fā)言人的聲音信息，判斷所述發(fā)言人相對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位置；所述獲取模塊包括：視頻判位模塊，用于根據(jù)所述發(fā)言人相對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位置及采集所述發(fā)言人的視頻信息的視頻采集模塊相對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位置，判斷所述發(fā)言人相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置；影像識別模塊，用于識別出采集所述發(fā)言人的視頻信息的視頻采集模塊采集的一路視頻信息中的所述一個或數(shù)個參加者的影像，并記錄所述一個或數(shù)個參加者的影像相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置；影像確定模塊，用于根據(jù)所述發(fā)言人相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置及所述一個或數(shù)個參加者的影像相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置，確定采集所述發(fā)言人的視頻信息的視頻采集模塊采集的一路視頻信息中所述發(fā)言人的影像；及影像提取模塊，用于從采集所述發(fā)言人的視頻信息的視頻采集模塊采集的一路視頻信息中，提取所述發(fā)言時段中所述發(fā)言人的影像。
[0017] 在第二方面的第二種可能的實現(xiàn)方式中，所述一個采集設(shè)備包括一個音頻采集模塊及一個視頻采集模塊，所述音頻采集模塊相對于所述視頻采集模塊的位置為預(yù)設(shè)的，所述音頻采集模塊采集所述音頻信息，所述音頻信息包括所述多個參加者的音頻信息，所述視頻采集模塊采集所述視頻信息，所述視頻信息包括所述多個參加者的視頻信息；所述判斷模塊用于根據(jù)所述音頻信息，判斷所述發(fā)言人相對于所述音頻采集模塊的位置；所述獲取模塊包括：視頻判位模塊，用于根據(jù)所述發(fā)言人相對于所述音頻采集模塊的位置及所述視頻采集模塊相對于所述音頻采集模塊的位置，判斷所述發(fā)言人相對于所述視頻采集模塊的位置；影像識別模塊，用于識別出所述視頻信息中的所述多個參加者的影像，并記錄所述多個參加者的影像相對于所述視頻采集模塊的位置；影像確定模塊，用于根據(jù)所述發(fā)言人相對于所述視頻采集模塊的位置及所述多個參加者的影像相對于所述視頻采集模塊的位置，確定所述視頻信息中所述發(fā)言人的影像；及影像提取模塊，用于從所述視頻信息中，提取所述發(fā)言時段中所述發(fā)言人的影像。
[0018] 在第二方面的第二種可能的實現(xiàn)方式，所述一個采集設(shè)備包括一個音頻采集模塊及一個視頻采集模塊，所述音頻采集模塊相對于所述視頻采集模塊的位置為預(yù)設(shè)的，所述音頻采集模塊采集所述音頻信息，所述音頻信息包括所述多個參加者的音頻信息，所述視頻采集模塊采集所述視頻信息，所述視頻信息包括所述多個參加者的視頻信息；所述判斷模塊用于根據(jù)所述音頻信息，判斷所述發(fā)言人相對于所述音頻采集模塊的位置；所述獲取模塊包括：視頻判位模塊，用于根據(jù)所述發(fā)言人相對于所述音頻采集模塊的位置及所述視頻采集模塊相對于所述音頻采集模塊的位置，判斷所述發(fā)言人相對于所述視頻采集模塊的位置；影像識別模塊，用于識別出所述視頻信息中的所述多個參加者的影像，并記錄所述多個參加者的影像相對于所述視頻采集模塊的位置；影像確定模塊，用于根據(jù)所述發(fā)言人相對于所述視頻采集模塊的位置及所述多個參加者的影像相對于所述視頻采集模塊的位置，確定所述視頻信息中所述發(fā)言人的影像；及影像提取模塊，用于從所述視頻信息中，提取所述發(fā)言時段中

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2 3 4 5 6

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳子沖;趙寅;呂培;周炯;
技術(shù)所有人：華為技術(shù)有限公司;
我是此專利的發(fā)明人

上一篇：一種移動視頻會議系統(tǒng)及其實現(xiàn)方法
上一篇：一種會議系統(tǒng)及文件同步方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

軍團通訊裝置相關(guān)技術(shù)

內(nèi)部通訊裝置相關(guān)技術(shù)

遠動通訊裝置相關(guān)技術(shù)

pcs9799遠動通訊裝置相關(guān)技術(shù)

耳內(nèi)式通訊裝置相關(guān)技術(shù)

通訊接口裝置相關(guān)技術(shù)

vpn通訊裝置相關(guān)技術(shù)

通訊裝置相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于視頻通訊的通訊信息的呈現(xiàn)方法、裝置及系統(tǒng)的制作方法

用于視頻通訊的通訊信息的呈現(xiàn)方法、裝置及系統(tǒng)的制作方法