專利名稱:一種在視訊會議中提示發(fā)言人信息的方法、裝置及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子通信技術(shù)領(lǐng)域,尤其涉及一種在視訊會議中提示發(fā)言人 信息的方法、裝置及系統(tǒng)。
背景技術(shù):
隨著光電技術(shù)、微計算機(jī)技術(shù)、圖像處理技術(shù)與模式識別等技術(shù)的快速 發(fā)展,出現(xiàn)了一種嶄新的人體生物特征識別技術(shù),依靠人體生物特征能夠準(zhǔn) 確地進(jìn)行人的身份識別。人體生物特征目前主要用到人體的指紋、掌紋、目艮
虹膜、筆跡、語音、臉部及DNA等。由于這些特征具有人體所固有的不可復(fù) 制的唯一性和穩(wěn)定性,因此不易復(fù)制、失竊或被遺忘。近幾年來,已開發(fā)應(yīng) 用了臉部識別、語音識別、簽字識別、指紋識別、掌形識別、眼虹膜識別等 人體生物特征識別技術(shù)。將這種人體生物特征識別才支術(shù)應(yīng)用于一見訊會議或電 視節(jié)目中,能夠使視訊會議或電視節(jié)目的播出更加智能化。
在視訊會議或電視節(jié)目中有時需要讓人們看到圖像中發(fā)言人的有關(guān)信息 (姓名、職務(wù)等信息),目前這種信息提示方式主要通過在現(xiàn)場放置座位名 牌或人工打字幕方式。
在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題
對于現(xiàn)場放置座位名牌方式,每次都需要專門的工作人員去制作名牌并 提前擺放到相應(yīng)的位置上,工作較繁瑣,易出錯。并且,名牌信息量小,僅 能提供姓名等基本信息,不能提供更多的相關(guān)信息。
對于人工打字幕方式,工作量較大,易出錯,且成本高,響應(yīng)速度慢, 不夠智能化。
發(fā)明內(nèi)容
本發(fā)明的實施例提供了 一種在視訊會議中提示發(fā)言人信息的方法、裝置 及系統(tǒng),能夠自動語音提示或者在顯示設(shè)備上自動地顯示發(fā)言人的姓名、職 務(wù)及其它相關(guān)的信息。
本發(fā)明實施例是通過以下技術(shù)方案實現(xiàn)的
本發(fā)明實施例提供一種在視訊會議中提示發(fā)言人信息的方法,包括以下 步驟
獲取發(fā)言人特征信息;
根據(jù)發(fā)言人特征信息,在保存有發(fā)言人特征信息與發(fā)言人信息對應(yīng)關(guān)系 的數(shù)據(jù)庫中識別發(fā)言人信息; 提示所述發(fā)言人信息。
本發(fā)明實施例提供一種在視訊會議中提示發(fā)言人信息的裝置,包括 信息獲取模塊,用于獲取發(fā)言人特征信息;
信息識別模塊,用于根據(jù)所述信息獲取模塊獲取的發(fā)言人特征信息,在 保存有發(fā)言人特征信息與發(fā)言人信息對應(yīng)關(guān)系的數(shù)據(jù)庫中識別發(fā)言人信息; 信息提示模塊,用于提示所述發(fā)言人信息。
本發(fā)明實施例提供一種在視訊會議中提示發(fā)言人信息的控制裝置,包
括
信息獲取模塊,用于獲取發(fā)言人特征信息;
信息識別模塊,用于根據(jù)所述信息獲取模塊獲取的發(fā)言人特征信息,在 保存有發(fā)言人特征信息與發(fā)言人信息對應(yīng)關(guān)系的數(shù)據(jù)庫中識別發(fā)言人信息;
第二發(fā)送模塊,用于將所述發(fā)言人信息發(fā)送給會議終端,以使所述會議 終端提示所述發(fā)言人信息。
本發(fā)明實施例提供一種在視訊會議中提示發(fā)言人信息的系統(tǒng),包括上述 的提示發(fā)言人信息的裝置和多點(diǎn)控制單元,所述裝置將所述信息識別模塊識
5別出的發(fā)言人信息發(fā)送給所述多點(diǎn)控制單元,其中
所述裝置將識別出的發(fā)言人信息發(fā)送給所述多點(diǎn)控制單元;
所述多點(diǎn)控制單元收到所述裝置發(fā)送的發(fā)言人信息后,將所述發(fā)言人信
息發(fā)送給會議終端,以使所述會議終端提示所迷發(fā)言人信息。
本發(fā)明實施例提供一種在視訊會議中提示發(fā)言人信息的系統(tǒng),包括上述
的提示發(fā)言人信息的控制裝置和至少一個會議終端,所述控制裝置獲取發(fā)言
人特征信息,并根據(jù)所述發(fā)言人特征信息識別出發(fā)言人信息;將所述發(fā)言人
信息發(fā)送給所述會議終端,所述會議終端提示所述發(fā)言人信息
由上述本發(fā)明的實施例提供的技術(shù)方案可以看出,本發(fā)明能夠自動語音
提示或者在顯示設(shè)備上智能地顯示發(fā)言人信息,并根據(jù)發(fā)言人的變化自動顯
示相關(guān)信息,響應(yīng)速度快,且無需繁瑣、復(fù)雜的準(zhǔn)備工作。
為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例描述中所 需要使用的附圖作筒單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā) 明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前 提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實施例一提供的一種在視訊會議中提示發(fā)言人信息的方法的 流程圖2為本發(fā)明實施例二提供的 一種在視訊會議中提示提示發(fā)言人信息的裝 置的結(jié)構(gòu)圖3為本發(fā)明實施例三提供的 一種在視訊會議中提示發(fā)言人信息的控制裝 置的結(jié)構(gòu)圖4為本發(fā)明實施例四提供的一種在視訊會議中提示發(fā)言人信息的系統(tǒng)的 結(jié)構(gòu)圖;圖5為本發(fā)明實施例五提供的一種在視訊會議中提示發(fā)言人信息的系統(tǒng)的
結(jié)構(gòu)圖6為本發(fā)明實施例六提供的 一種在視訊會議中跟蹤獲取發(fā)言人圖像信息 的方法的流程圖7為本發(fā)明實施例七提供的一種在視訊會議中跟蹤獲取發(fā)言人圖像信息 的裝置的結(jié)構(gòu)圖。
具體實施例方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行 清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而 不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做 出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
實施例一
參見圖1,本發(fā)明實施例 一的在視訊會議中提示發(fā)言人信息的方法包括
步驟1:獲取發(fā)言人特征信息。發(fā)言人特征信息可以是臉部信息或語音信 息等人體生物特征信息,或者,也可以為其他非生物特征信息。
如果需要獲得的發(fā)言人特征信息是發(fā)言人的臉部信息,那么首先需要獲 得包含有發(fā)言人臉部信息的圖像序列,然后通過臉部識別算法在圖像序列中 識別出發(fā)言人臉部信息。
步驟2:根據(jù)發(fā)言人特征信息,在保存有發(fā)言人特征信息與發(fā)言人信息對 應(yīng)關(guān)系的數(shù)據(jù)庫中識別發(fā)言人信息。
該步驟需要預(yù)先在數(shù)據(jù)庫中保存全部發(fā)言人特征信息與全部發(fā)言人信息 及它們的對應(yīng)關(guān)系,然后裝置根據(jù)當(dāng)前發(fā)言人特征信息,根據(jù)對應(yīng)關(guān)系找到 與當(dāng)前發(fā)言人特征信息相匹配的發(fā)言人信息。發(fā)言人信息包括發(fā)言人的基本信息,例如姓名、年齡、職務(wù)等,和相關(guān)信息,例如經(jīng)歷、特長等。 具體地,數(shù)據(jù)庫可以存儲在本地或者網(wǎng)絡(luò)側(cè)。
步驟3:提示發(fā)言人信息。提示發(fā)言人信息包括顯示或者語音提示所述發(fā) 言人信息。
進(jìn)一步地,裝置在提示所述發(fā)言人信息之后,向網(wǎng)絡(luò)側(cè)的多點(diǎn)控制單元 發(fā)送所述發(fā)言人信息,以使所述多點(diǎn)控制單元將所述發(fā)言人信息發(fā)送給會議終端。
可以將至少 一個發(fā)言人特征信息設(shè)置為使用會議終端的密匙。 應(yīng)用本發(fā)明實施例的方法可以在會議終端上自動語音提示或者顯示發(fā)言 人信息,響應(yīng)速度快,使聽眾或觀眾能夠及時地了解到發(fā)言人的情況。
實施例二
本發(fā)明實施例二的 一種在視訊會議中提示發(fā)言人信息的裝置的結(jié)構(gòu)如圖2 所示,包括
信息獲取模塊11,用于獲取發(fā)言人特征信息。發(fā)言人特征信息可以是臉 部信息、語音信息等人體生物特征信息,或者,也可以為其他非生物特征信息。
信息識別模塊12,用于根據(jù)所述信息獲取模塊11獲取的發(fā)言人特征信 息,在保存有發(fā)言人特征信息與發(fā)言人信息對應(yīng)關(guān)系的數(shù)據(jù)庫中識別發(fā)言人信息。
具體地,數(shù)據(jù)庫可以存儲在本地或網(wǎng)絡(luò)側(cè)。
信息提示模塊13,用于將信息識別模塊12識別出的發(fā)言人信息進(jìn)行語音 提示或者以文字的形式增加到播放的圖像上。 進(jìn)一步地,上述裝置還可以包括
第一發(fā)送模塊14,用于將所述信息識別模塊12識別出的發(fā)言人信息發(fā)送 給網(wǎng)絡(luò)側(cè)的多點(diǎn)控制單元,以使所述多點(diǎn)控制單元將所述發(fā)言人信息發(fā)送給會i義終端。
應(yīng)用本發(fā)明的裝置可以在會議終端上自動語音提示或者智能地顯示發(fā)言 人信息,響應(yīng)速度快,使聽眾或觀眾能夠及時地了解到發(fā)言人的情況。
實施例三
圖3為本發(fā)明實施例三的在視訊會議中提示發(fā)言人信息的控制裝置的結(jié)構(gòu) 圖。包括
信息獲取模塊21,用于獲取發(fā)言人特征信息。發(fā)言人特征信息可以是臉
部信息、語音信息等人體生物特征信息,或者,也可以為其他非生物特征信 白
信息識別模塊22,用于根據(jù)所述信息獲取模塊21獲取的發(fā)言人特征信 息,在保存有發(fā)言人特征信息與發(fā)言人信息對應(yīng)關(guān)系的數(shù)據(jù)庫中識別發(fā)言人 信息。
具體地,數(shù)據(jù)庫可以存儲在控制裝置中或網(wǎng)絡(luò)側(cè)。 進(jìn)一 步地,上述控制裝置還可以包括
第二發(fā)送模塊23,用于將所述發(fā)言人信息發(fā)送給會議終端,以使所述會 議終端提示所述發(fā)言人信息。
本發(fā)明的控制裝置可以從會議終端獲取發(fā)言人特征信息,進(jìn)行識別并找 到發(fā)言人信息,然后將發(fā)言人信息發(fā)送到各個會議終端,通過會議終端進(jìn)行 語音提示發(fā)言人信息或者以文字方式將發(fā)言人信息增加到播放的圖像上。
實施例四
圖4為本發(fā)明實施例四的一個系統(tǒng)的結(jié)構(gòu)圖,包括多點(diǎn)控制單元和三個如 圖2所示的提示發(fā)言人信息的裝置A,會議終端B和會議終端C。
裝置A獲取發(fā)言人特征信息,并通過內(nèi)部的信息識別模塊得到發(fā)言人信 息,然后將發(fā)言人信息發(fā)送到多點(diǎn)控制單元,多點(diǎn)控制單元接收到發(fā)言人信息后,將發(fā)言人信息發(fā)送給會議終端B、會議終端C,使其他裝置能夠語音提 示發(fā)言人信息或者以文字方式將發(fā)言人信息增加到播放的圖像上。
本實施例四中的系統(tǒng)可以有多個上述裝置A,也可以有多個會議終端。 應(yīng)用本發(fā)明實施例四的系統(tǒng)可以在所有與多點(diǎn)控制單元相連的會議終端
上自動地進(jìn)行語音提示或者顯示發(fā)言人信息,響應(yīng)速度快,使每個裝置前的
聽眾或觀眾能夠及時地了解到發(fā)言人的情況。
實施例五
圖5為本發(fā)明實施例五的一個系統(tǒng)的結(jié)構(gòu)圖,包括如圖3所示的提示發(fā)言 人信息的控制裝置和會議終端A、 B和C。
控制裝置可以從一個會議終端獲取發(fā)言人特征信息,進(jìn)行識別并找到發(fā) 言人信息,然后將發(fā)言人信息發(fā)送到其他會議終端,通過會議終端語音提示 發(fā)言人信息或者以文字方式將發(fā)言人信息增加到播放的圖像上。
應(yīng)用本發(fā)明實施例的系統(tǒng)可以在會議終端上自動地進(jìn)4亍語音提示或者顯 示發(fā)言人信息,響應(yīng)速度快,使每個會議終端前的聽眾或觀眾能夠及時地了 解到發(fā)言人的情況。
實施例六
獲取發(fā)言人信息的步驟還包括一種在視訊會議中跟蹤獲取發(fā)言人圖像信 息的方法,參見圖6,包括以下步驟 步驟1:采集發(fā)言人特征信息;
具體地,發(fā)言人特征信息包括臉部信息和語音信息中的至少一項。 步驟2:根據(jù)采集的發(fā)言人特征信息獲取發(fā)言人圖像的位置變化信息; 步驟3:根據(jù)位置變化信息調(diào)節(jié)圖像采集端位置,獲耳又發(fā)言人圖像信息。 上述方法還包括圖像采集端找到發(fā)言人的步驟,包括以下步驟 步驟1:從數(shù)據(jù)庫中獲取發(fā)言人臉部信息,數(shù)據(jù)庫中保存著會議參與人的臉部信息;
步驟2:現(xiàn)場采集會議參與人的臉部信息,并將采集的會議參與人的臉部 信息與獲取的發(fā)言人臉部信息進(jìn)行匹配,確定發(fā)言人。
進(jìn)一步地,可以將至少一個會議參與人的特征信息設(shè)置為使用會議終端 的密匙。
應(yīng)用本發(fā)明的方法可以使圖像采集端找到發(fā)言人并自動跟蹤發(fā)言人,持 續(xù)獲取發(fā)言人的圖像信息。
實施例七
本發(fā)明實施例七提供一種在視訊會議中跟蹤獲取發(fā)言人圖像信息的裝 置,參見圖7,包括
信息采集模塊16,用于采集發(fā)言人特征信息;
圖像采集端17,用于獲取發(fā)言人圖像信息,圖像采集端17可以是攝像
機(jī);
圖像處理模塊18,用于根據(jù)采集的發(fā)言人特征信息獲取發(fā)言人圖像的位 置變化信息;
圖像采集端控制模塊19,用于根據(jù)位置變化信息調(diào)節(jié)圖像采集端17的位 置,獲取發(fā)言人圖像信息。
進(jìn)一步地,信息采集模塊還用于現(xiàn)場采集會議參與人的臉部信息;且, 該裝置還包括
信息匹配模塊,用于從數(shù)據(jù)庫中獲取發(fā)言人臉部信息,并將信息采集模 塊現(xiàn)場采集的會議參與人的臉部信息與獲取的發(fā)言人臉部信息進(jìn)行匹配,確 定發(fā)"f人。
可以預(yù)先將特征信息通過信息采集^t塊存儲到數(shù)據(jù)庫中。 有時發(fā)言人在講話時需要移動位置,例如,使用寫字板或投影屏幕進(jìn)行 講解。應(yīng)用本發(fā)明的裝置可以使圖像采集端自動跟蹤發(fā)言人,持續(xù)獲取發(fā)言人的圖像信息。
本發(fā)明還可以應(yīng)用于電視節(jié)目中,例如領(lǐng)導(dǎo)講話、嘉賓訪談等節(jié)目中。 本發(fā)明還可以應(yīng)用到遠(yuǎn)程教育、醫(yī)療等其它領(lǐng)域。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流 程,是可以通過計算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲于 一計算機(jī)可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施
例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory, ROM)或隨機(jī)存儲記憶體(Random Access Memory, RAM)等。
以上所述,僅為本發(fā)明較佳的具體實施方式
,但本發(fā)明的保護(hù)范圍并不 局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可 輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明 的保護(hù)范圍應(yīng)該以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
1權(quán)利要求
1、一種在視訊會議中提示發(fā)言人信息的方法,其特征在于,包括獲取發(fā)言人特征信息;根據(jù)所述發(fā)言人特征信息,在保存有發(fā)言人特征信息與發(fā)言人信息對應(yīng)關(guān)系的數(shù)據(jù)庫中識別發(fā)言人信息;提示所述發(fā)言人信息。
2、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述發(fā)言人特征信息包括 臉部信息或語音信息中的至少 一種。
3、 根據(jù)權(quán)利要求1所述的方法,其特征在于,提示所述發(fā)言人信息包括 顯示或者語音提示所述發(fā)言人信息。
4、 根據(jù)權(quán)利要求1所述的方法,其特征在于,在提示所述發(fā)言人信息之 后,向網(wǎng)絡(luò)側(cè)的多點(diǎn)控制單元發(fā)送所述發(fā)言人信息,以使所述多點(diǎn)控制單元 將所述發(fā)言人信息發(fā)送給會議終端。
5、 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述數(shù)據(jù)庫存儲在本地或 者網(wǎng)絡(luò)側(cè)。
6、 一種在視訊會議中提示發(fā)言人信息的裝置,其特征在于,包括 信息獲取模塊,用于獲取發(fā)言人特征信息;信息識別模塊,用于根據(jù)所述信息獲取模塊獲取的發(fā)言人特征信息,在 保存有發(fā)言人特征信息與發(fā)言人信息對應(yīng)關(guān)系的數(shù)據(jù)庫中識別發(fā)言人信息; 信息提示模塊,用于提示所述發(fā)言人信息。
7、 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述數(shù)據(jù)庫存儲在本地或 者網(wǎng)絡(luò)側(cè)。
8、 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述發(fā)言人特征信息包括 臉部信息或語音信息中的至少 一種。
9、 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括第一發(fā) 送模塊,用于將所述信息識別模塊識別出的發(fā)言人信息發(fā)送給網(wǎng)絡(luò)側(cè)的多點(diǎn) 控制單元,以使所述多點(diǎn)控制單元將所述發(fā)言人信息發(fā)送給會議終端。
10、 一種在視訊會議中提示發(fā)言人信息的控制裝置,其特征在于,包括信息獲取模塊,用于獲取發(fā)言人特征信息;信息識別模塊,用于根據(jù)所述信息獲取模塊獲取的發(fā)言人特征信息,在 保存有發(fā)言人特征信息與發(fā)言人信息對應(yīng)關(guān)系的數(shù)據(jù)庫中識別發(fā)言人信息;第二發(fā)送模塊,用于將所述發(fā)言人信息發(fā)送給會議終端,以使所述會議 終端提示所述發(fā)言人信息。
11、 根據(jù)權(quán)利要求10所述的控制裝置,其特征在于,所述數(shù)據(jù)庫存儲在 本地或者網(wǎng)絡(luò)側(cè)。
12、 根據(jù)權(quán)利要求10所述的控制裝置,其特征在于,所述發(fā)言人特征信 息包括臉部信息或語音信息中的至少 一種。
13、 一種在視訊會議中提示發(fā)言人信息的系統(tǒng),其特征在于,包括如權(quán) 利要求6至9任一項所述的裝置和多點(diǎn)控制單元,其中所述裝置將識別出的發(fā)言人信息發(fā)送給所述多點(diǎn)控制單元; 所述多點(diǎn)控制單元收到所述裝置發(fā)送的發(fā)言人信息后,將所述發(fā)言人信 息發(fā)送給會議終端,以使所述會議終端提示所述發(fā)言人信息。
14、 一種在視訊會議中提示發(fā)言人信息的系統(tǒng),其特征在于,包括如權(quán) 利要求10至12任一項所述的控制裝置和至少一個會議終端,所述控制裝置獲 取發(fā)言人特征信息,并根據(jù)所述發(fā)言人特征信息識別出發(fā)言人信息;將所述 發(fā)言人信息發(fā)送給所述會議終端,所述會議終端^l是示所述發(fā)言人信息。
全文摘要
一種在視訊會議中提示發(fā)言人信息的方法、裝置及系統(tǒng)。提示發(fā)言人信息的過程包括獲取發(fā)言人特征信息;根據(jù)發(fā)言人特征信息,在保存有發(fā)言人特征信息與發(fā)言人信息對應(yīng)關(guān)系的數(shù)據(jù)庫中識別發(fā)言人信息;提示發(fā)言人信息。本發(fā)明能夠自動提示發(fā)言人的姓名、職務(wù)及其它相關(guān)的信息,響應(yīng)速度快,且無需繁瑣、復(fù)雜的準(zhǔn)備工作。
文檔編號H04N7/15GK101540873SQ20091013769
公開日2009年9月23日 申請日期2009年5月7日 優(yōu)先權(quán)日2009年5月7日
發(fā)明者王小飛 申請人:深圳華為通信技術(shù)有限公司