本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,特別涉及一種會議紀(jì)要的生成方法、裝置及視頻會議系統(tǒng)。
背景技術(shù):
視頻會議系統(tǒng),是指兩個或兩個以上不同地方的個人或群體,通過傳輸線路及多媒體設(shè)備,將聲音、影像及文件資料互傳,實(shí)現(xiàn)即時且互動的溝通,以實(shí)現(xiàn)會議目的的系統(tǒng)設(shè)備。
但是在視頻會議系統(tǒng)中,當(dāng)多方進(jìn)行視頻會議時,尤其是當(dāng)一個會議室里有多人參加會議,并發(fā)言時,實(shí)際的會議畫面無法聚焦于實(shí)際的發(fā)言人身上,其他與會各方無法實(shí)時、清晰的看到發(fā)言人的舉止和表情,而且無法得知發(fā)言人的身份,以至于影響與會各方的交流,影響視頻會議的效果。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明的目的是提供一種可以根據(jù)發(fā)言人的聲音來輔助識別發(fā)言人身份的會議紀(jì)要的生成方法、裝置及視頻會議系統(tǒng)。
為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供了一種會議紀(jì)要的生成方法,包括:
獲取發(fā)言人的語音數(shù)據(jù);
將所述發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換為文字?jǐn)?shù)據(jù);
結(jié)合所述發(fā)言人的身份信息形成會議紀(jì)要。
本發(fā)明還提供一種會議紀(jì)要的生成裝置,包括:
獲取模塊,配置為獲取發(fā)言人的語音數(shù)據(jù);
轉(zhuǎn)換模塊,配置為將所述發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換為文字?jǐn)?shù)據(jù);
處理模塊,配置為結(jié)合所述發(fā)言人的身份信息形成會議紀(jì)要。
本發(fā)明還提供一種視頻會議系統(tǒng),包括如上所述的裝置。
由上述本發(fā)明實(shí)施例提出的技術(shù)方案可以看出本實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠?qū)l(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換成文字?jǐn)?shù)據(jù),并識別出發(fā)言人的身份信息,將二者相結(jié)合,形成會議紀(jì)要,這樣使得參會人員不但可以獲知發(fā)言人的身份信息,還可以獲知每個參會人員的發(fā)言內(nèi)容,從而提高了視頻會議的效率。
附圖說明
圖1為本發(fā)明一種實(shí)施例的會議紀(jì)要的生成方法的流程圖;
圖2為本發(fā)明根據(jù)一種實(shí)施例的結(jié)合發(fā)言人身份信息形成會議紀(jì)要的示意圖;
圖3為本發(fā)明其中一種實(shí)施例的會議紀(jì)要的生成方法的流程圖;
圖4為本發(fā)明根據(jù)其中一種實(shí)施例的根據(jù)發(fā)言人的聲紋對發(fā)言人的身份進(jìn)行識別的示意圖;
圖5為本發(fā)明根據(jù)其中一種實(shí)施例的根據(jù)發(fā)言人的圖像對發(fā)言人的身份進(jìn)行識別的示意圖;
圖6為本發(fā)明另一種實(shí)施例的會議紀(jì)要的生成方法的流程圖;
圖7為本發(fā)明再一種實(shí)施例的會議紀(jì)要的生成方法的流程圖;
圖8為本發(fā)明又一種實(shí)施例的會議紀(jì)要的生成方法的流程圖;
圖9為本發(fā)明一種實(shí)施例的會議紀(jì)要的生成裝置的示意圖;
圖10為本發(fā)明其中一種實(shí)施例的會議紀(jì)要的生成裝置的示意圖;
圖11為本發(fā)明另一種實(shí)施例的會議紀(jì)要的生成裝置的示意圖;
圖12為本發(fā)明再一種實(shí)施例的會議紀(jì)要的生成裝置的示意圖;
圖13為本發(fā)明又一種實(shí)施例的會議紀(jì)要的生成裝置的示意圖。
具體實(shí)施方式
此處參考附圖描述本公開的各種方案以及特征。
應(yīng)理解的是,可以對此處公開的實(shí)施例做出各種修改。因此,上述說明書不應(yīng)該視為限制,而僅是作為實(shí)施例的范例。本領(lǐng)域的技術(shù)人員將想到在本公開的范圍和精神內(nèi)的其他修改。
包含在說明書中并構(gòu)成說明書的一部分的附圖示出了本公開的實(shí)施例,并且與上面給出的對本公開的大致描述以及下面給出的對實(shí)施例的詳細(xì)描述一起用于解釋本公開的原理。
通過下面參照附圖對給定為非限制性實(shí)例的實(shí)施例的優(yōu)選形式的描述,本發(fā)明的這些和其它特性將會變得顯而易見。
還應(yīng)當(dāng)理解,盡管已經(jīng)參照一些具體實(shí)例對本發(fā)明進(jìn)行了描述,但本領(lǐng)域技術(shù)人員能夠確定地實(shí)現(xiàn)本發(fā)明的很多其它等效形式,它們具有如權(quán)利要求所述的特征并因此都位于借此所限定的保護(hù)范圍內(nèi)。
當(dāng)結(jié)合附圖時,鑒于以下詳細(xì)說明,本公開的上述和其他方面、特征和優(yōu)勢將變得更為顯而易見。
此后參照附圖描述本公開的具體實(shí)施例;然而,應(yīng)當(dāng)理解,所公開的實(shí)施例僅僅是本公開的實(shí)例,其可采用多種方式實(shí)施。熟知和/或重復(fù)的功能和結(jié)構(gòu)并未詳細(xì)描述以避免不必要或多余的細(xì)節(jié)使得本公開模糊不清。因此,本文所公開的具體的結(jié)構(gòu)性和功能性細(xì)節(jié)并非意在限定,而是僅僅作為權(quán)利要求的基礎(chǔ)和代表性基礎(chǔ)用于教導(dǎo)本領(lǐng)域技術(shù)人員以實(shí)質(zhì)上任意合適的詳細(xì)結(jié)構(gòu)多樣地使用本公開。
本說明書可使用詞組“在一種實(shí)施例中”、“在另一個實(shí)施例中”、“在又一實(shí)施例中”或“在其他實(shí)施例中”,其均可指代根據(jù)本公開的相同或不同實(shí)施例中的一個或多個。
圖1為本發(fā)明一種實(shí)施例的會議紀(jì)要的生成方法的流程圖,如圖1所示,本實(shí)施例的會議紀(jì)要的生成方法,具體可以包括:
獲取發(fā)言人的語音數(shù)據(jù)。
本實(shí)施例應(yīng)用于視頻會議系統(tǒng)。在進(jìn)行視頻會議時可以通過獲取發(fā)言人的語音數(shù)據(jù),獲取發(fā)言人的語音數(shù)據(jù)的方法,例如可以通過視頻會議系統(tǒng)內(nèi)置的麥克風(fēng),或者外置的高靈敏度的麥克風(fēng)來采集發(fā)言人的語音數(shù)據(jù)。
將所述發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換為文字?jǐn)?shù)據(jù)。
為便于對發(fā)言人的語音數(shù)據(jù)進(jìn)行整理,可以將發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換成文字?jǐn)?shù)據(jù)。在具體實(shí)施時,可以通過語音轉(zhuǎn)換文字軟件進(jìn)行轉(zhuǎn)換。
結(jié)合所述發(fā)言人的身份信息形成會議紀(jì)要。
具體地,由于在會議紀(jì)要中不僅要顯示發(fā)言人的發(fā)言內(nèi)容,還要顯示與該發(fā)言內(nèi)容相對應(yīng)的發(fā)言人的身份信息,如姓名等。因此,在這一步驟中,需要對發(fā)言人的身份進(jìn)行識別,再其對應(yīng)的發(fā)言內(nèi)容相結(jié)合,以形成會議紀(jì)要。舉例來說,如圖2所示,參會人員包括A、B和C,進(jìn)行發(fā)言的人為發(fā)言人,A的發(fā)言內(nèi)容為“大家早上好”,然后B進(jìn)行發(fā)言,例如B的發(fā)言內(nèi)容為“主持人早上好”,然后C進(jìn)行發(fā)言,C的發(fā)言內(nèi)容為“現(xiàn)在開始……”,則在發(fā)言人進(jìn)行發(fā)言的同時,對他們的身份信息進(jìn)行識別,例如,可以通過生物特征信息進(jìn)行識別,在A發(fā)言時,識別出其姓名為A,則在會議紀(jì)要相應(yīng)的發(fā)言人的位置,顯示A,其發(fā)言內(nèi)容為“大家早上好”,則在與A相對應(yīng)的發(fā)言內(nèi)容位置處顯示“大家早上好”,同理,根據(jù)識別出的B的身從信息顯示在相識發(fā)言人位置處,再將與B相對應(yīng)的發(fā)言內(nèi)容顯示在與B相對應(yīng)的位置處,同理,將C的身份信息和發(fā)言內(nèi)容顯示在相應(yīng)位置處。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠?qū)l(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換成文字?jǐn)?shù)據(jù),并識別出發(fā)言人的身份信息,將二者相結(jié)合,形成會議紀(jì)要,這樣使得參會人員不但可以獲知發(fā)言人的身份信息,還可以獲知每個參會人員的發(fā)言內(nèi)容,提高視頻會議的效率。
圖3為本發(fā)明其中一種實(shí)施例的會議紀(jì)要的生成方法的流程圖,本實(shí)施例的會議紀(jì)要的生成方法在如圖1所示的實(shí)施例的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。如圖3所示,本實(shí)施例的會議紀(jì)要的生成方法,具體可以包括:
獲取發(fā)言人的語音數(shù)據(jù)。
本實(shí)施例應(yīng)用于視頻會議系統(tǒng)。在進(jìn)行視頻會議時可以通過獲取發(fā)言人的語音數(shù)據(jù),獲取發(fā)言人的語音數(shù)據(jù)的方法,例如可以通過視頻會議系統(tǒng)內(nèi)置的麥克風(fēng),或者外置的高靈敏度的麥克風(fēng)來采集發(fā)言人的語音數(shù)據(jù)。
將所述發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換為文字?jǐn)?shù)據(jù);
為便于對發(fā)言人的語音數(shù)據(jù)進(jìn)行整理,可以將發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換成文字?jǐn)?shù)據(jù)。在具體實(shí)施時,可以通過語音轉(zhuǎn)換文字軟件進(jìn)行轉(zhuǎn)換。
根據(jù)所述發(fā)言人的生物特征信息,對所述發(fā)言人的身份信息進(jìn)行識別。
進(jìn)一步地,根據(jù)所述發(fā)言人的生物特征信息,對所述發(fā)言人的身份信息進(jìn)行識別,包括:A,獲取發(fā)言人的生物特征信息B,根據(jù)所述發(fā)言人的生物特征信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上。
具體地,由于會議現(xiàn)場存在噪聲等干擾因素,因此,對于發(fā)言人身份的識別往往不能達(dá)到理想情況,即對發(fā)言人身份的識別所能達(dá)到的識別率不一定能達(dá)到100%。實(shí)際情況中,識別率可能達(dá)到60%、70%或80%不等(此處的識別率表示識別的概率,而非識別的準(zhǔn)確率)。因此,可以通過一些方法對發(fā)言人身份信息進(jìn)行識別的識別率進(jìn)行區(qū)分,以提示參會人員,對于發(fā)言人的身份信息的識別不一定百分百準(zhǔn)確。例如,可以采用的一種方法是,以顏色來區(qū)分識別率,即識別率低于60%可以用紅色字體顯示發(fā)言人的姓名,識別率介于60%-80%,可以用黃色字體顯示發(fā)言人的姓名,識別率介于80%-100%可以用藍(lán)色字體顯示發(fā)言人的姓名;還可以采用一種方法是,對于識別率低于60%的發(fā)言人,可以在顯示其姓名時,在其姓名后方同時標(biāo)識“?”來表示對該發(fā)言人的識別率較低,此姓名可能不準(zhǔn)確。
另外,在對發(fā)言人進(jìn)行身份識別的時候,可能識別出來發(fā)言人的身份信息有多人,例如,識別當(dāng)前發(fā)言人為A的識別率為75%,發(fā)言人為B的識別率也為75%,機(jī)器無法確定發(fā)言人究竟為A還是B,此時,可以將所識別出來的發(fā)言人的身份信息均列出來,在進(jìn)一步優(yōu)選的實(shí)施例中,還可以通過下拉框來將發(fā)言人的身份信息列出來,可在形成會議紀(jì)要時供參會人員選擇實(shí)際的發(fā)言人身份信息。
在進(jìn)一步優(yōu)選的實(shí)施例中,如果經(jīng)過一段時間的身份識別,最終識別出更為準(zhǔn)確的發(fā)言人,則可以將其他的發(fā)言人身份信息刪除。例如,在視頻會議之初,識別出當(dāng)前的發(fā)言人A和B的識別率均為75%,則可同時顯示為A和B,接下來經(jīng)過一段時間的識別,最終識別為A的識別率達(dá)到95%,而B的識別率仍為75%,也就是說二者的識別率相差較大,例如識別率超過10%即可以認(rèn)為差別較大,則可以認(rèn)為當(dāng)前發(fā)言人為A,同時保留A,而將B刪除。
進(jìn)一步地,所述生物特征信息可以包括聲紋信息。
若所述生物特征信息為聲紋信息,
相應(yīng)地,獲取發(fā)言人的生物特征信息,包括:
獲取發(fā)言人的聲紋信息;
根據(jù)所述發(fā)言人的生物特征信息對所述發(fā)言人的身份進(jìn)行識別,包括:
根據(jù)所述發(fā)言人的聲紋信息對所述發(fā)言人的身份進(jìn)行識別。
進(jìn)一步地,根據(jù)所述發(fā)言人的聲紋信息對所述發(fā)言人的身份進(jìn)行識別,包括:C,將所述發(fā)言人的聲紋與聲紋庫中的聲紋進(jìn)行逐一比對;D,若比對一致,則輸出與所述聲紋庫中與所述聲紋對應(yīng)的發(fā)言人的身份。
判斷對所述發(fā)言人的身份信息進(jìn)行識別的識別率是否超過預(yù)設(shè)閾值。
若是,則將所述發(fā)言人的身份信息,以及與其對應(yīng)的文字?jǐn)?shù)據(jù)進(jìn)行處理,形成所述會議紀(jì)要;
否則,則將所述發(fā)言人的身份信息標(biāo)識為一標(biāo)記,以及與其對應(yīng)的文字?jǐn)?shù)據(jù)進(jìn)行處理,形成所述會議紀(jì)要。
具體地,例如可以將識別率設(shè)置為80%,識別率超過80%,則發(fā)言人的身份信息較為準(zhǔn)確,未超過80%,則發(fā)言人的身份信息存疑。
具體地,在獲取發(fā)言人身份信息時,首先在根據(jù)參會人員的名單確定發(fā)言人的姓名信息,然后可以根據(jù)參會人員的姓名信息到相關(guān)的數(shù)據(jù)庫,例如公司某部門的員工數(shù)據(jù)庫或公司某地分公司人員數(shù)據(jù)庫等,進(jìn)行查詢,以進(jìn)一步獲取發(fā)言人的身份信息。因此,以上所述的身份信息包括發(fā)言人的姓名、職務(wù)、所屬的單位或所處的地址位置等信息。那么,在之后形成的會議紀(jì)要中可以詳細(xì)地顯示發(fā)言人的身份信息,例如,在姓名之后顯示其職務(wù),或在姓名之后,顯示其所屬的分公司,以及在分公司的職務(wù),然后在會議紀(jì)要顯示發(fā)言內(nèi)容的位置顯示其對應(yīng)的發(fā)言內(nèi)容。
由于視頻會議的現(xiàn)場存在噪聲,在獲取發(fā)言人的音頻數(shù)據(jù)時可能存在噪聲干擾,或者對于遠(yuǎn)程視頻會議在傳輸音頻數(shù)據(jù)時,可能會丟失信息,因此,在提取發(fā)言人的聲紋信息并與聲紋庫中進(jìn)行比對時,可能存在偏差。因此,存在無法識別發(fā)言人的身份信息的情況。此時,可以將發(fā)言人的身份做一臨時性的標(biāo)識,例如,利用字母A、B或C來標(biāo)記發(fā)言人的姓名。例如,在會議紀(jì)要中顯示發(fā)言人A及其對應(yīng)的發(fā)言。這樣可以避免當(dāng)存在多個無法識別的發(fā)言人時,示顯示其身份信息,而造成該多個發(fā)言人的發(fā)言內(nèi)容相混淆的問題。
如圖4所示,在具體實(shí)施時,在進(jìn)行視頻會議時,發(fā)言人在發(fā)言時,收集發(fā)言人的音頻信息,提取發(fā)言人音頻信息中的聲紋,利用聲紋識別模塊來識別發(fā)言人的聲紋,以確定發(fā)言人的身份信息,在將用戶的身份信息發(fā)送至視頻會議系統(tǒng),再利用聲紋識別反饋模塊,驗(yàn)證該聲紋是否與發(fā)言人的身份信息相對應(yīng),具體是可以與聲紋庫中存儲的聲紋進(jìn)行比對,最后在與視頻會議系統(tǒng)連接的顯示裝置上顯示發(fā)言人的身份信息。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視頻會議時,能夠根據(jù)發(fā)言人的聲紋信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上,這樣使得其他參會人員,能夠?qū)崟r得知發(fā)言人的身份,方向與會各方進(jìn)行交流,提高視頻會議的效率。
本發(fā)明的會議紀(jì)要的生成方法的實(shí)施例三的流程圖與圖3一致,請繼續(xù)參見圖3,本實(shí)施例的會議紀(jì)要的生成方法在如圖1所示的實(shí)施例的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。如圖3所示,本實(shí)施例的會議紀(jì)要的生成方法,具體可以包括:
獲取發(fā)言人的語音數(shù)據(jù);
將所述發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換為文字?jǐn)?shù)據(jù);
根據(jù)所述發(fā)言人的生物特征信息,對所述發(fā)言人的身份信息進(jìn)行識別;
進(jìn)一步地,根據(jù)所述發(fā)言人的生物特征信息,對所述發(fā)言人的身份信息進(jìn)行識別,包括:A,獲取發(fā)言人的生物特征信息B,根據(jù)所述發(fā)言人的生物特征信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上。
所述生物特征信息包括圖像信息;
若所述生物特征信息為圖像信息,
相應(yīng)地,獲取發(fā)言人的生物特征信息,包括:
獲取發(fā)言人的圖像信息;
根據(jù)所述發(fā)言人的生物特征信息對所述發(fā)言人的身份進(jìn)行識別,包括:
E,根據(jù)所述發(fā)言人的圖像信息對所述發(fā)言人的身份進(jìn)行識別。
進(jìn)一步地,根據(jù)所述發(fā)言人的圖像信息對所述發(fā)言人的身份進(jìn)行識別,包括:F,將所述發(fā)言人的圖像與圖像庫中的圖像進(jìn)行逐一比對;G,若比對一致,則輸出與所述圖像庫中與所述圖像對應(yīng)的發(fā)言人的身份。
判斷對所述發(fā)言人的身份信息進(jìn)行識別的識別率是否超過預(yù)設(shè)閾值;
若是,則將所述發(fā)言人的身份信息,以及與其對應(yīng)的文字?jǐn)?shù)據(jù)進(jìn)行處理,形成所述會議紀(jì)要;
否則,則將所述發(fā)言人的身份信息標(biāo)識為一標(biāo)記,以及與其對應(yīng)的文字?jǐn)?shù)據(jù)進(jìn)行處理,形成所述會議紀(jì)要。
本實(shí)施例還可以采用發(fā)言人的圖像信息來獲取發(fā)言人的身份信息,當(dāng)然還可以同時實(shí)施聲紋識別和圖像識別的方式,這樣所獲取的發(fā)言人的身份信息更加準(zhǔn)確。
如圖5所示,本實(shí)施例在具體實(shí)施時,在通過發(fā)言人的聲紋信息識別發(fā)言人的身份信息的同時,還可以通過設(shè)置圖像采集模塊來采集發(fā)言人的圖像信息,圖像采集模塊可以采用攝像頭;將發(fā)言人的圖像信息與圖像庫中的圖像進(jìn)行逐一比對,獲得圖像庫中與圖像相對應(yīng)的發(fā)言人的身份信息。并在顯示界面上顯示發(fā)言人的身份信息,例如,顯示發(fā)言人的姓名;同時顯示發(fā)言人的圖像,圖像可以包括發(fā)言人的頭像,以及發(fā)言人的身體圖像,例如發(fā)言人的手勢等。
在本發(fā)明的其他實(shí)施例中,還可以根據(jù)所述發(fā)言人的圖像信息對所述發(fā)言人進(jìn)行定位;并顯示所述發(fā)言人的圖像信息。在具體實(shí)施時,發(fā)言人在發(fā)言人會伴隨身體的動作或者姿勢,以及可能根據(jù)顯示界面的位置進(jìn)行移動,本實(shí)施例通過攝像頭的云臺轉(zhuǎn)動,來對發(fā)言人進(jìn)行追蹤定位,使遠(yuǎn)程的其他參會人員更真實(shí)地看到會議畫面。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠根據(jù)發(fā)言人的圖像信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息和圖像信息顯示在顯示界面上,增強(qiáng)視頻會議的現(xiàn)場感,方便參會人員進(jìn)行交流,提高視頻會議的效率。
圖6為本發(fā)明另一種實(shí)施例的會議紀(jì)要的生成方法的流程圖,本實(shí)施例的會議紀(jì)要的生成方法在如圖3所示的施例的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。如圖6所示,本實(shí)施例的會議紀(jì)要的生成方法,具體可以包括:
獲取發(fā)言人的語音數(shù)據(jù)。
本實(shí)施例應(yīng)用于視頻會議系統(tǒng)。在進(jìn)行視頻會議時可以通過獲取發(fā)言人的語音數(shù)據(jù),獲取發(fā)言人的語音數(shù)據(jù)的方法,例如可以通過視頻會議系統(tǒng)內(nèi)置的麥克風(fēng),或者外置的高靈敏度的麥克風(fēng)來采集發(fā)言人的語音數(shù)據(jù)。
將所述發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換為文字?jǐn)?shù)據(jù)。
為便于對發(fā)言人的語音數(shù)據(jù)進(jìn)行整理,可以將發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換成文字?jǐn)?shù)據(jù)。在具體實(shí)施時,可以通過語音轉(zhuǎn)換文字軟件進(jìn)行轉(zhuǎn)換。
根據(jù)所述發(fā)言人的生物特征信息,對所述發(fā)言人的身份信息進(jìn)行識別。
進(jìn)一步地,根據(jù)所述發(fā)言人的生物特征信息,對所述發(fā)言人的身份信息進(jìn)行識別,包括:A,獲取發(fā)言人的生物特征信息B,根據(jù)所述發(fā)言人的生物特征信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上。
所述生物特征信息可以包括聲紋信息和圖像信息。具體實(shí)施例請參見圖2所示的實(shí)施例二和實(shí)施例三。
判斷對所述發(fā)言人的身份信息進(jìn)行識別的識別率是否超過預(yù)設(shè)閾值。
若是,則將所述發(fā)言人的身份信息,以及與其對應(yīng)的文字?jǐn)?shù)據(jù)進(jìn)行處理,形成所述會議紀(jì)要;
否則,則將所述發(fā)言人的身份信息標(biāo)識為一標(biāo)記,以及與其對應(yīng)的文字?jǐn)?shù)據(jù)進(jìn)行處理,形成所述會議紀(jì)要。
進(jìn)一步地,對不同的所述發(fā)言人的身份信息標(biāo)識為唯一標(biāo)記。
例如,在存在多個未能識別出身份信息的發(fā)言人,則對不同的發(fā)言人標(biāo)識為不同的唯一標(biāo)記,以區(qū)分不同的發(fā)言人。
在具體實(shí)施時,在會議過程中,若識別出所述發(fā)言人的身份信息,則將會議紀(jì)要中的所述標(biāo)記替換為所述身份信息。
由于視頻會議的現(xiàn)場存在噪聲,在獲取發(fā)言人的音頻數(shù)據(jù)時可能存在噪聲干擾,或者對于遠(yuǎn)程視頻會議在傳輸音頻數(shù)據(jù)時,可能會丟失信息,因此,在提取發(fā)言人的聲紋信息并與聲紋庫中進(jìn)行比對時,可能存在偏差。因此,存在無法識別發(fā)言人的身份信息的情況。此時,可以將發(fā)言人的身份做一臨時性的標(biāo)識,例如,利用字母A、B或C來標(biāo)記發(fā)言人的姓名。例如,在會議紀(jì)要中顯示發(fā)言人A及其對應(yīng)的發(fā)言。在后續(xù)的視頻會議過程中,進(jìn)一步對發(fā)言人A的音頻數(shù)據(jù)進(jìn)行采集,同時進(jìn)一步識別發(fā)言人的聲紋信息和發(fā)言人A的圖像信息,若經(jīng)過一段時間的識別過程,最終識別出發(fā)言人的身份信息,例如為張三,則將標(biāo)識A替換發(fā)言人的姓名,例如替換為張三。
在本發(fā)明的其他實(shí)施例中,還可以采用排除法,例如,首先獲取參會人員的全體名單、聲紋庫和圖像庫,利用上述實(shí)施例獲取了參會人員的身份信息后,僅剩1名參會人員的身份信息未能識別,則可以通過排除法,由參會人員的名單將已識別的參會人員排除,剩下的一名參會人員則為未能識別的發(fā)言人,由此可以獲知該發(fā)言人的身份信息;在本發(fā)明的又一其他實(shí)施例中,仍然采用排除法,例如,首先獲取參會人員的全體名單、聲紋庫和圖像庫,利用上述實(shí)施例獲取了參會人員的身份信息后,僅剩幾名參會人員的身份信息未能識別,可將剩下的參會人員身份信息其中之一與未能識別的參會人員身份相對應(yīng),由于未能識別的人數(shù)較少,這種方法準(zhǔn)確率也較高。
以上所述的身份信息包括發(fā)言人的姓名、職務(wù)、所屬的單位或所處的地址位置等信息。在本實(shí)施例可以采用發(fā)言人的姓名,即在會議紀(jì)要中,顯示發(fā)言人的姓名,及其對應(yīng)的發(fā)言。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠根據(jù)發(fā)言人的聲紋信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上,這樣使得其他參會人員,能夠?qū)崟r得知發(fā)言人的身份,方向與會各方進(jìn)行交流,提高視頻會議的效率。
圖7為本發(fā)明再一種實(shí)施例的會議紀(jì)要的生成方法的流程圖,本實(shí)施例的會議紀(jì)要的生成方法在如圖1所示的實(shí)施例的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。如圖7所示,本實(shí)施例的會議紀(jì)要的生成方法,具體可以包括:
獲取發(fā)言人的語音數(shù)據(jù)。
本實(shí)施例應(yīng)用于視頻會議系統(tǒng)。在進(jìn)行視頻會議時可以通過獲取發(fā)言人的語音數(shù)據(jù),獲取發(fā)言人的語音數(shù)據(jù)的方法,例如可以通過視頻會議系統(tǒng)內(nèi)置的麥克風(fēng),或者外置的高靈敏度的麥克風(fēng)來采集發(fā)言人的語音數(shù)據(jù)。
將所述發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換為文字?jǐn)?shù)據(jù)。
為便于對發(fā)言人的語音數(shù)據(jù)進(jìn)行整理,可以將發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換成文字?jǐn)?shù)據(jù)。在具體實(shí)施時,可以通過語音轉(zhuǎn)換文字軟件進(jìn)行轉(zhuǎn)換。
結(jié)合所述發(fā)言人的身份信息形成會議紀(jì)要。
具體地,通過對發(fā)言人進(jìn)行身份識別,并與所述文字?jǐn)?shù)據(jù)相結(jié)合,即發(fā)言人與其語音數(shù)據(jù)與轉(zhuǎn)換的文字?jǐn)?shù)據(jù)相對應(yīng),并形成會議紀(jì)要。這樣,參會人員不但可以獲知發(fā)言人的身份信息,還可以獲知每個參會人員的發(fā)言內(nèi)容。
將所述會議紀(jì)要推送給每個參會人員。
由于在結(jié)議結(jié)束后,參會人員僅任記憶可能會忘記會議內(nèi)容,因此,本實(shí)施例在形成會議紀(jì)要后,可以將會議紀(jì)要通過網(wǎng)絡(luò)傳輸給每個參會人員,例如可以發(fā)送至每個參會人員的郵箱,還可以推送到每個參會人員的手機(jī)上。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠根據(jù)發(fā)言人的聲紋信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上,這樣使得其他參會人員,能夠?qū)崟r得知發(fā)言人的身份,方便與會各方進(jìn)行交流,提高視頻會議的效率。
圖8為本發(fā)明又一種實(shí)施例的會議紀(jì)要的生成方法的流程圖,本實(shí)施例的會議紀(jì)要的生成方法在如圖1所示的實(shí)施例的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。如圖8所示,本實(shí)施例的會議紀(jì)要的生成方法,具體可以包括:
獲取發(fā)言人的語音數(shù)據(jù)。
本實(shí)施例應(yīng)用于視頻會議系統(tǒng)。在進(jìn)行視頻會議時可以通過獲取發(fā)言人的語音數(shù)據(jù),獲取發(fā)言人的語音數(shù)據(jù)的方法,例如可以通過視頻會議系統(tǒng)內(nèi)置的麥克風(fēng),或者外置的高靈敏度的麥克風(fēng)來采集發(fā)言人的語音數(shù)據(jù)。
將所述發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換為文字?jǐn)?shù)據(jù)。
為便于對發(fā)言人的語音數(shù)據(jù)進(jìn)行整理,可以將發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換成文字?jǐn)?shù)據(jù)。在具體實(shí)施時,可以通過語音轉(zhuǎn)換文字軟件進(jìn)行轉(zhuǎn)換。
對每一參會人員的位置進(jìn)行定位。
若所述參會人員的位置處于會議室外,則對當(dāng)前的會議內(nèi)容進(jìn)行記錄,形成會議紀(jì)要,直至所述參會人員的位置定位為會議室內(nèi);其中記錄方式可以為錄音方式或者將當(dāng)前發(fā)言人的發(fā)言轉(zhuǎn)為文字并存儲;
將所述會議紀(jì)要發(fā)送至所述參會人員。
本實(shí)施例在具體實(shí)施時,可以不對整個會議過程形成會議紀(jì)要,僅針對特殊情況形成會議紀(jì)要。例如,參會人員存在中途外出的情況,可能錯過重要內(nèi)容,因此,本實(shí)施基于圖像采集模塊的追蹤和定位功能,可以對參會人員的位置進(jìn)行定位,當(dāng)發(fā)現(xiàn)有參會人員外出,即開始將當(dāng)前發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換為文字?jǐn)?shù)據(jù),也可以直接將當(dāng)前發(fā)言人的語音數(shù)據(jù),整理成會議紀(jì)要,發(fā)送給外出的參會人員,以避夠該參會人員錯過重要信息。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠根據(jù)發(fā)言人的聲紋信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上,這樣使得其他參會人員,能夠?qū)崟r得知發(fā)言人的身份,方向與會各方進(jìn)行交流,提高視頻會議的效率。
圖9為本發(fā)明一種實(shí)施例的會議紀(jì)要的生成裝置的示意圖,如圖9所示,本實(shí)施例的會議紀(jì)要的生成裝置,具體可以包括獲取模塊、轉(zhuǎn)換模塊和處理模塊。
獲取模塊,配置為獲取發(fā)言人的語音數(shù)據(jù);
轉(zhuǎn)換模塊,配置為將所述發(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換為文字?jǐn)?shù)據(jù);
處理模塊,配置為結(jié)合所述發(fā)言人的身份信息形成會議紀(jì)要。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠?qū)l(fā)言人的語音數(shù)據(jù)轉(zhuǎn)換成文字?jǐn)?shù)據(jù),并識別出發(fā)言人的身份信息,將二者相結(jié)合,形成會議紀(jì)要,這樣使得參會人員不但可以獲知發(fā)言人的身份信息,還可以獲知每個參會人員的發(fā)言內(nèi)容,提高視頻會議的效率。
圖10為本發(fā)明其中一種實(shí)施例的會議紀(jì)要的生成裝置的示意圖,本實(shí)施例的會議紀(jì)要的生成裝置在如圖9所示的實(shí)施例的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。
如圖10所示,所述處理模塊,包括:
識別子模塊,配置為根據(jù)所述發(fā)言人的生物特征信息,對所述發(fā)言人的身份信息進(jìn)行識別;
判斷子模塊,配置為判斷對所述發(fā)言人的身份信息進(jìn)行識別的識別率是否超過預(yù)設(shè)閾值;
處理子模塊,配置為當(dāng)對所述發(fā)言人的身份信息進(jìn)行識別成功時,將所述發(fā)言人的身份信息,以及與其對應(yīng)的文字?jǐn)?shù)據(jù)進(jìn)行處理,形成所述會議紀(jì)要;或者,
當(dāng)對所述發(fā)言人的身份信息進(jìn)行識別的識別率未超過預(yù)設(shè)閾值時,將所述發(fā)言人的身份信息標(biāo)識為一標(biāo)記,以及與其對應(yīng)的文字?jǐn)?shù)據(jù)進(jìn)行處理,形成所述會議紀(jì)要。
進(jìn)一步地,所述識別子模塊,具體配置為:
獲取發(fā)言人的生物特征信息;所述生物特征信息包括聲紋信息和圖像信息;
根據(jù)所述發(fā)言人的生物特征信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上。
進(jìn)一步地,所述識別子模塊,還具體配置為:
將所述發(fā)言人的聲紋與聲紋庫中的聲紋進(jìn)行逐一比對;
若比對一致,則輸出與所述聲紋庫中與所述聲紋對應(yīng)的發(fā)言人的身份。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視頻會議時,能夠根據(jù)發(fā)言人的聲紋信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上,這樣使得其他參會人員,能夠?qū)崟r得知發(fā)言人的身份,方向與會各方進(jìn)行交流,提高視頻會議的效率。
本發(fā)明的會議紀(jì)要的生成裝置的實(shí)施例三的示意圖與圖10一致,請參見圖10.本實(shí)施例的會議紀(jì)要的生成裝置在如圖8所示的實(shí)施例一的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。
繼續(xù)結(jié)合圖10,所述處理模塊,包括:
識別子模塊,配置為根據(jù)所述發(fā)言人的生物特征信息,對所述發(fā)言人的身份信息進(jìn)行識別;
處理子模塊,配置為將所述發(fā)言人的身份信息,以及與其對應(yīng)的文字?jǐn)?shù)據(jù)進(jìn)行處理,形成所述會議紀(jì)要;或者,
配置為當(dāng)無法根據(jù)所述發(fā)言人的生物特征信息,識別所述發(fā)言人的身份信息時,則將所述發(fā)言人的身份信息標(biāo)識為一標(biāo)記,以及與其對應(yīng)的文字?jǐn)?shù)據(jù)進(jìn)行處理,形成所述會議紀(jì)要。
所述識別子模塊,具體配置為:
當(dāng)所述生物特征信息為圖像信息時,獲取發(fā)言人的圖像信息;根據(jù)所述發(fā)言人的圖像信息對所述發(fā)言人的身份進(jìn)行識別。
所述識別子模塊,還具體配置為:
將所述發(fā)言人的圖像與圖像庫中的圖像進(jìn)行逐一比對;
若比對一致,則輸出與所述圖像庫中與所述圖像對應(yīng)的發(fā)言人的身份。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠根據(jù)發(fā)言人的圖像信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息和圖像信息顯示在顯示界面上,增強(qiáng)視頻會議的現(xiàn)場感,方便參會人員進(jìn)行交流,提高視頻會議的效率。
圖11為本發(fā)明另一種實(shí)施例的會議紀(jì)要的生成裝置的示意圖,本實(shí)施例的會議紀(jì)要的生成裝置在如圖9所示的實(shí)施例的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。
如圖11所示,本實(shí)施例的會議紀(jì)要的生成裝置,還包括:
第一定位模塊,配置為根據(jù)所述發(fā)言人的圖像信息對所述發(fā)言人進(jìn)行定位;
顯示模塊,配置為顯示所述發(fā)言人的圖像信息。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠根據(jù)發(fā)言人的聲紋信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上,這樣使得其他參會人員,能夠?qū)崟r得知發(fā)言人的身份,方向與會各方進(jìn)行交流,提高視頻會議的效率。
圖12為本發(fā)明再一種實(shí)施例的會議紀(jì)要的生成裝置的示意圖,本實(shí)施例的會議紀(jì)要的生成裝置在如圖9所示的實(shí)施例一的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。
如圖12所示,本實(shí)施例的會議紀(jì)要的生成裝置,進(jìn)一步可以包括:
所述處理模塊,還包括:
標(biāo)記子模塊,配置為對不同的所述發(fā)言人的身份信息標(biāo)識為唯一標(biāo)記。
所述處理模塊還包括:
替換子模塊,配置為在會議過程中,當(dāng)識別出所述發(fā)言人的身份信息,則將會議紀(jì)要中的所述標(biāo)記替換為所述身份信息。
第一推送模塊,配置為將所述會議紀(jì)要推送給每個參會人員。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠根據(jù)發(fā)言人的聲紋信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上,這樣使得其他參會人員,能夠?qū)崟r得知發(fā)言人的身份,方向與會各方進(jìn)行交流,提高視頻會議的效率。
圖13為本發(fā)明又一種實(shí)施例的會議紀(jì)要的生成裝置的示意圖,本實(shí)施例的會議紀(jì)要的生成裝置在如圖9所示的實(shí)施例的基礎(chǔ)上,進(jìn)一步更加詳細(xì)地介紹本發(fā)明的技術(shù)方案。
本實(shí)施例的會議紀(jì)要的生成裝置還包括:
第二定位模塊,配置為對每一參會人員的位置進(jìn)行定位;
記錄模塊,配置為當(dāng)所述參會人員的位置處于會議室外時,則對當(dāng)前的會議內(nèi)容進(jìn)行記錄,形成會議紀(jì)要,直至所述參會人員的位置定位為會議室內(nèi);其中記錄方式可以為錄音方式或者將當(dāng)前發(fā)言人的發(fā)言轉(zhuǎn)為文字并存儲;
第二推送模塊,配置為將所述會議紀(jì)要發(fā)送至所述參會人員。
本發(fā)明實(shí)施例的技術(shù)方案在進(jìn)行視會議時,能夠根據(jù)發(fā)言人的聲紋信息對所述發(fā)言人的身份進(jìn)行識別,并將所述發(fā)言人的身份信息顯示在顯示界面上,這樣使得其他參會人員,能夠?qū)崟r得知發(fā)言人的身份,方向與會各方進(jìn)行交流,提高視頻會議的效率。
本發(fā)明實(shí)施例還提供一種視頻會議系統(tǒng),包括如圖9至圖13任一實(shí)施例所示的裝置。
以上實(shí)施例僅為本發(fā)明的示例性實(shí)施例,不用于限制本發(fā)明,本發(fā)明的保護(hù)范圍由權(quán)利要求書限定。本領(lǐng)域技術(shù)人員可以在本發(fā)明的實(shí)質(zhì)和保護(hù)范圍內(nèi),對本發(fā)明做出各種修改或等同替換,這種修改或等同替換也應(yīng)視為落在本發(fā)明的保護(hù)范圍內(nèi)。