亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于視頻通訊的通訊信息的呈現(xiàn)方法、裝置及系統(tǒng)的制作方法

文檔序號:9618978閱讀:229來源:國知局
用于視頻通訊的通訊信息的呈現(xiàn)方法、裝置及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通迅領(lǐng)域,尤其涉及用于視頻通訊的音視頻信息的呈現(xiàn)方法、裝置及 系統(tǒng)。
【背景技術(shù)】
[0002] 現(xiàn)有用于視頻會議的通訊技術(shù)中,一方會場的顯示設(shè)備通常會顯示另一方會場的 所有參會人員,如另一方會場中的參會人員過多,會導(dǎo)致顯示設(shè)備顯示過多人員而不能重 點突出正在發(fā)言的人。
[0003] 因此,需要研究開發(fā)出一種通訊方法及系統(tǒng)克服上述缺陷。

【發(fā)明內(nèi)容】

[0004] 第一方面,本發(fā)明實施例提供了一種視頻通訊中用于呈現(xiàn)通訊信息的方法,包括: 控制采集所述視頻通訊現(xiàn)場的音頻信息與視頻信息;根據(jù)所述音頻信息判斷所述視頻通訊 現(xiàn)場中的發(fā)言人的位置,所述發(fā)言人為為所述視頻通訊現(xiàn)場參加者中發(fā)言的人,所述多個 參加者為多個參加所述視頻通訊的人;根據(jù)所述發(fā)言人的位置從所述視頻信息中獲取發(fā)言 視頻信息,其中,所述發(fā)言視頻信息為所述發(fā)言人在所述發(fā)言時段的視頻信息;控制所述發(fā) 目視頻?目息呈現(xiàn)。
[0005] 在第一方面的第一種可能的實現(xiàn)方式中,所述控制采集所述視頻通訊現(xiàn)場的音頻 信息與視頻信息包括:控制數(shù)個采集設(shè)備采集所述音頻信息與所述視頻信息,所述數(shù)個采 集設(shè)備中的每個采集設(shè)備包括一個音頻采集模塊及一個視頻采集模塊,所述視頻采集模塊 相對于所述音頻采集模塊的位置為預(yù)設(shè)的,所述音頻采集模塊采集所述多個參加者中一個 或數(shù)個參加者的音頻信息,所述視頻采集模塊采集所述一個或數(shù)個參加者的視頻信息,所 述音頻采集模塊采集的所述多個參加者中一個或數(shù)個參加者的音頻信息構(gòu)成所述音頻信 息中的一路音頻信息,所述視頻采集模塊采集的所述一個或數(shù)個參加者的視頻信息構(gòu)成所 述視頻信息中的一路視頻信息;所述根據(jù)所述音頻信息判斷所述視頻通訊現(xiàn)場中的發(fā)言人 的位置包括:將所述音頻信息中音量最大,音量超過音量閾值,且所述音量超過所述音量閾 值的持續(xù)時間超過時間閾值的一路音頻信息作為所述發(fā)言人的聲音信息;及根據(jù)所述發(fā) 言人的聲音信息,判斷所述發(fā)言人相對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位 置;所述根據(jù)所述發(fā)言人的位置從所述視頻信息中獲取發(fā)言視頻信息包括:根據(jù)所述發(fā)言 人相對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位置及采集所述發(fā)言人的視頻信 息的視頻采集模塊相對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位置,判斷所述發(fā) 言人相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置;識別出采集所述發(fā)言人的 視頻信息的視頻采集模塊采集的一路視頻信息中的所述一個或數(shù)個參加者的影像,并記錄 所述一個或數(shù)個參加者的影像相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置; 根據(jù)所述發(fā)言人相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置及所述一個或 數(shù)個參加者的影像相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置,確定采集所 述發(fā)言人的視頻信息的視頻采集模塊采集的一路視頻信息中所述發(fā)言人的影像;及從采集 所述發(fā)言人的視頻信息的視頻采集模塊采集的一路視頻信息中,提取所述發(fā)言時段中所述 發(fā)言人的影像。
[0006] 在第一方面的第二種可能的實現(xiàn)方式中,所述控制采集所述視頻通訊現(xiàn)場的音頻 信息與視頻信息包括:控制一個采集設(shè)備采集設(shè)備采集所述音頻信息與所述視頻信息,所 述采集設(shè)備包括一個音頻采集模塊及一個視頻采集模塊,所述音頻采集模塊相對于所述視 頻采集模塊的位置為預(yù)設(shè)的,所述音頻采集模塊采集所述音頻信息,所述音頻信息為所述 多個參加者的音頻信息,所述視頻采集模塊采集所述視頻信息,所述視頻信息為所述多個 參加者的視頻信息;所述根據(jù)所述音頻信息判斷所述視頻通訊現(xiàn)場中的發(fā)言人的位置包 括:根據(jù)所述音頻信息,判斷所述發(fā)言人相對于所述音頻采集模塊的位置;所述根據(jù)所述 發(fā)言人的位置從所述視頻信息中獲取發(fā)言視頻信息包括:根據(jù)所述發(fā)言人相對于所述音頻 采集模塊的位置及所述視頻采集模塊相對于所述音頻采集模塊的位置,判斷所述發(fā)言人相 對于所述視頻采集模塊的位置;識別出所述視頻信息中的所述多個參加者的影像,并記錄 所述多個參加者的影像相對于所述視頻采集模塊的位置;根據(jù)所述發(fā)言人相對于所述視頻 采集模塊的位置及所述多個參加者的影像相對于所述視頻采集模塊的位置,確定所述視頻 信息中所述發(fā)言人的影像;及從所述視頻信息中,提取所述發(fā)言時段中所述發(fā)言人的影像。
[0007] 結(jié)合第一方面第一種可能的實現(xiàn)方式以及第二種可能的實現(xiàn)方式中的任意一種 可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,其中,所述音頻采集模塊為麥克風(fēng)陣列,其 中,所述麥克風(fēng)陣列包括至少兩個麥克風(fēng)。
[0008] 結(jié)合第一方面,或者第一方面第一至第二種任意一種可能的實現(xiàn)方式,在第四種 可能的實現(xiàn)方式中,所述控制所述發(fā)言視頻信息呈現(xiàn)包括:控制所述發(fā)言視頻信息實時呈 現(xiàn)。
[0009] 結(jié)合第一方面,或者第一方面第一至第二種任意一種可能的實現(xiàn)方式,在第五種 可能的實現(xiàn)方式中,所述控制所述發(fā)言視頻信息呈現(xiàn)包括:控制記錄所述發(fā)言視頻信息; 及控制記錄的所述發(fā)言視頻信息在所述發(fā)言時段結(jié)束后呈現(xiàn)。
[0010] 結(jié)合第一方面第五種可能的實現(xiàn)方式,在第六種可能的實現(xiàn)方式中,還包括:若所 述發(fā)言人的音量低于音量最低閾值,且所述發(fā)言人的音量低于音量最低閾值的持續(xù)時間長 于最長時間閾值,則判斷所述發(fā)言時段結(jié)束;或若收到發(fā)言結(jié)束信號,則判斷所述發(fā)言時段 結(jié)束。
[0011] 結(jié)合第一方面第五種可能的實現(xiàn)方式以及第六種可能的實現(xiàn)方式中的任意一種 可能的實現(xiàn)方式,在第七種可能的實現(xiàn)方式中,所述控制所述發(fā)言視頻信息呈現(xiàn)還包括生 成與所述發(fā)言視頻信息對應(yīng)的記錄圖標,所述控制記錄的所述發(fā)言視頻信息在所述發(fā)言時 段結(jié)束后呈現(xiàn)包括根據(jù)接收到的指示所述記錄圖標是否得到觸碰的信號,控制開啟播放或 停止播放所述發(fā)言視頻信息。
[0012] 結(jié)合第一方面第七種可能的實現(xiàn)方式,在第八種可能的實現(xiàn)方式中,所述方法還 包括根據(jù)接收到的指示所述記錄圖標是否得到觸碰的信號,控制開啟播放或停止播放下列 信息中的至少一種信息:發(fā)言音頻信息及與所述發(fā)言音頻信息對應(yīng)的文本信息,所述發(fā)言 音頻信息為所述音頻信息中在所述發(fā)言時段中的音頻信息。
[0013] 結(jié)合第一方面第五種可能的實現(xiàn)方式、第一方面第六種可能的實現(xiàn)方式及第一方 面第七種可能的實現(xiàn)方式中任意一種可能的實現(xiàn)方式,在第九種可能的實現(xiàn)方式中,還包 括:在所述發(fā)言時段中,禁止發(fā)言音頻信息及所述發(fā)言視頻信息實時呈現(xiàn),所述發(fā)言音頻信 息為所述音頻信息中在所述發(fā)言時段中的音頻信息。
[0014] 結(jié)合第一方面、第一方面第一種可能的實現(xiàn)方式、第一方面第二種可能的實現(xiàn)方 式、第一方面第三種可能的實現(xiàn)方式及第一方面第四種可能的實現(xiàn)方式中任意一種可能的 實現(xiàn)方式,在第十種可能的實現(xiàn)方式中,所述控制所述發(fā)言視頻信息呈現(xiàn)包括:控制記錄所 述發(fā)言視頻信息;接收指示信息,所述指示信息用于指示待播放的發(fā)言視頻信息的時間范 圍;及控制呈現(xiàn)所述時間范圍內(nèi)的所述發(fā)言視頻信息。
[0015] 第二方面,本發(fā)明實施例提供了一種視頻通訊中用于呈現(xiàn)通訊信息的裝置,包括: 控制采集模塊,用于控制一個或多個采集設(shè)備采集所述視頻通訊現(xiàn)場的音頻信息與視頻信 息;判斷模塊,用于根據(jù)所述音頻信息判斷所述視頻通訊現(xiàn)場中的發(fā)言人的位置,所述發(fā)言 人為多個參加者中在發(fā)言時段發(fā)言的參加者,所述多個參加者為多個參加所述視頻通訊的 人;獲取模塊,用于根據(jù)所述發(fā)言人的位置從所述視頻信息中獲取發(fā)言視頻信息,其中,所 述發(fā)言視頻信息為所述發(fā)言人在所述發(fā)言時段的視頻信息;及控制呈現(xiàn)模塊,用于控制所 述發(fā)言視頻信息呈現(xiàn)。
[0016] 在第二方面的第一種可能的實現(xiàn)方式中,所述采集設(shè)備為數(shù)個,所述數(shù)個采集設(shè) 備中的每個采集設(shè)備包括一個音頻采集模塊及一個視頻采集模塊,所述視頻采集模塊相對 于所述音頻采集模塊的位置為預(yù)設(shè)的,所述音頻采集模塊采集所述多個參加者中一個或數(shù) 個參加者的音頻信息,所述視頻采集模塊采集所述一個或數(shù)個參加者的視頻信息,所述音 頻采集模塊采集的所述一個或數(shù)個參加者的音頻信息構(gòu)成所述音頻信息中的一路音頻信 息,所述視頻采集模塊采集的所述一個或數(shù)個參加者的視頻信息構(gòu)成所述視頻信息中的一 路視頻信息;所述判斷模塊包括:選擇模塊,用于將所述音頻信息中音量最大,音量超過音 量閾值,且所述音量超過所述音量閾值的持續(xù)時間超過時間閾值的一路音頻信息作為所述 發(fā)言人的聲音信息;及音頻判位模塊,用于根據(jù)所述發(fā)言人的聲音信息,判斷所述發(fā)言人相 對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位置;所述獲取模塊包括:視頻判位模 塊,用于根據(jù)所述發(fā)言人相對于采集所述發(fā)言人的聲音信息的音頻采集模塊的位置及采集 所述發(fā)言人的視頻信息的視頻采集模塊相對于采集所述發(fā)言人的聲音信息的音頻采集模 塊的位置,判斷所述發(fā)言人相對于采集所述發(fā)言人的視頻信息的視頻采集模塊的位置;影 像識別模塊,用于識別出采集所述發(fā)言人的視頻信息的視頻采集模塊采集的一路視頻信息 中的所述一個或數(shù)個參加者的影像,并記錄所述一個或數(shù)個參加者的影像相對于采集所述 發(fā)言人的視頻信息的視頻采集模塊的位置;影像確定模塊,用于根據(jù)所述發(fā)言人相對于采 集所述發(fā)言人的視頻信息的視頻采集模塊的位置及所述一個或數(shù)個參加者的影像相對于 采集所述發(fā)言人的視頻信息的視頻采集模塊的位置,確定采集所述發(fā)言人的視頻信息的視 頻采集模塊采集的一路視頻信息中所述發(fā)言人的影像;及影像提取模塊,用于從采集所述 發(fā)言人的視頻信息的視頻采集模塊采集的一路視頻信息中,提取所述發(fā)言時段中所述發(fā)言 人的影像。
[0017] 在第二方面的第二種可能的實現(xiàn)方式中,所述一個采集設(shè)備包括一個音頻采集模 塊及一個視頻采集模塊,所述音頻采集模塊相對于所述視頻采集模塊的位置為預(yù)設(shè)的,所 述音頻采集模塊采集所述音頻信息,所述音頻信息包括所述多個參加者的音頻信息,所述 視頻采集模塊采集所述視頻信息,所述視頻信息包括所述多個參加者的視頻信息;所述判 斷模塊用于根據(jù)所述音頻信息,判斷所述發(fā)言人相對于所述音頻采集模塊的位置;所述獲 取模塊包括:視頻判位模塊,用于根據(jù)所述發(fā)言人相對于所述音頻采集模塊的位置及所述 視頻采集模塊相對于所述音頻采集模塊的位置,判斷所述發(fā)言人相對于所述視頻采集模塊 的位置;影像識別模塊,用于識別出所述視頻信息中的所述多個參加者的影像,并記錄所述 多個參加者的影像相對于所述視頻采集模塊的位置;影像確定模塊,用于根據(jù)所述發(fā)言人 相對于所述視頻采集模塊的位置及所述多個參加者的影像相對于所述視頻采集模塊的位 置,確定所述視頻信息中所述發(fā)言人的影像;及影像提取模塊,用于從所述視頻信息中,提 取所述發(fā)言時段中所述發(fā)言人的影像。
[0018] 在第二方面的第二種可能的實現(xiàn)方式,所述一個采集設(shè)備包括一個音頻采集模塊 及一個視頻采集模塊,所述音頻采集模塊相對于所述視頻采集模塊的位置為預(yù)設(shè)的,所述 音頻采集模塊采集所述音頻信息,所述音頻信息包括所述多個參加者的音頻信息,所述視 頻采集模塊采集所述視頻信息,所述視頻信息包括所述多個參加者的視頻信息;所述判斷 模塊用于根據(jù)所述音頻信息,判斷所述發(fā)言人相對于所述音頻采集模塊的位置;所述獲取 模塊包括:視頻判位模塊,用于根據(jù)所述發(fā)言人相對于所述音頻采集模塊的位置及所述視 頻采集模塊相對于所述音頻采集模塊的位置,判斷所述發(fā)言人相對于所述視頻采集模塊的 位置;影像識別模塊,用于識別出所述視頻信息中的所述多個參加者的影像,并記錄所述多 個參加者的影像相對于所述視頻采集模塊的位置;影像確定模塊,用于根據(jù)所述發(fā)言人相 對于所述視頻采集模塊的位置及所述多個參加者的影像相對于所述視頻采集模塊的位置, 確定所述視頻信息中所述發(fā)言人的影像;及影像提取模塊,用于從所述視頻信息中,提取所 述發(fā)言時段中
當(dāng)前第1頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1