使用化身的通信的制作方法

文檔序號：11710243閱讀：130來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本申請為分案申請，其原申請是于2014年06月25日向中國專利局提交的專利申請，申請?zhí)枮?01180075926.1，發(fā)明名稱為“使用化身的通信”。

以下的公開內(nèi)容涉及視頻通信和交互，并且更具體的，涉及使用化身(avatar)進行視頻通信和交互的方法。

背景技術(shù)：

移動設(shè)備中不斷增加的各種可用功能已經(jīng)引起了用戶除了簡單的通話外還經(jīng)由視頻進行通信的需求。例如，用戶可以發(fā)起“視頻通話”、“視頻會議”等，其中，設(shè)備中的攝像機和麥克風(fēng)向一個或多個其它接收方(例如其它移動設(shè)備、臺式電腦、視頻會議系統(tǒng)等)發(fā)送用戶的音頻和實時視頻。實時視頻的通信可能涉及傳輸大量的數(shù)據(jù)(例如，這取決于攝像機的技術(shù)、用于處理實時圖像信息的特定視頻編解碼器等)?？紤]到現(xiàn)有2g/3g無線技術(shù)的帶寬限制以及并且新興4g無線技術(shù)的仍然受限的可用性，很多設(shè)備用戶進行并發(fā)視頻通話的主張給現(xiàn)有的無線通信基礎(chǔ)設(shè)施的帶寬帶來了巨大的負(fù)擔(dān)，這可能會負(fù)面地對視頻通話的質(zhì)量造成影響。

附圖說明

隨著下述具體實施方式的繼續(xù)，并且在參考附圖之后，所要求保護的主題的各個實施例的特征和優(yōu)點將會變得顯而易見，其中相同的數(shù)字表示相同的部件，其中：

圖1a示出了依照本公開內(nèi)容的各個實施例的示例性設(shè)備到設(shè)備系統(tǒng)；

圖1b示出了依照本公開內(nèi)容的各個實施例的示例性虛擬空間系統(tǒng)；

圖2示出了依照本公開內(nèi)容的各個實施例的示例性設(shè)備；

圖3示出了依照本公開內(nèi)容的至少一個實施例的示例性系統(tǒng)實現(xiàn)；

圖4是依照本公開內(nèi)容的至少一個實施例的示例性操作的流程圖。

盡管將在參考說明性實施例的情況下繼續(xù)下述的具體實施方式，但是其多種替代、修改和變型對于本領(lǐng)域技術(shù)人員來說將是顯而易見的。

具體實施方式

一般來講，本公開內(nèi)容描述了使用化身進行視頻通信和交互的系統(tǒng)和方法。與實況圖像相比，使用化身大大地降低了要傳輸?shù)臄?shù)據(jù)量，并且因此，化身通信需要更少的帶寬。在一個實施例中，激活耦合到攝像機的設(shè)備中的應(yīng)用。所述應(yīng)用可以被配置為允許用戶選擇一個化身以用于在遠(yuǎn)程設(shè)備上、在虛擬空間等中進行顯示。所述設(shè)備隨后可以被配置為發(fā)起與至少一個其它設(shè)備、虛擬空間等的通信。例如，可以通過2g、3g、4g蜂窩連接來建立所述通信。可替換，可以經(jīng)由wifi連接通過因特網(wǎng)來建立所述通信。在建立所述通信之后，所述攝像機可以被配置為開始捕獲圖像。隨后在捕獲的圖像上執(zhí)行面部檢測/追蹤，并且在面部上執(zhí)行特征提取。檢測到的面部/頭部移動和/或面部特征的變化面部隨后被轉(zhuǎn)換為對在至少一個其它設(shè)備上、在虛擬空間等中使所述化身動畫化有用的參數(shù)。隨后傳輸化身選擇或化身參數(shù)中的至少一個。在一個實施例中，接收遠(yuǎn)程化身選擇或遠(yuǎn)程化身參數(shù)中的至少一個。所述遠(yuǎn)程化身選擇可以使得所述設(shè)備顯示化身，而所述遠(yuǎn)程化身參數(shù)可以使得所述設(shè)備使所顯示的化身動畫化。利用已知的方法，音頻通信伴隨著化身動畫。

圖1a示出了根據(jù)本公開內(nèi)容的各個實施例的設(shè)備到設(shè)備系統(tǒng)100。系統(tǒng)100一般可以包括經(jīng)由網(wǎng)絡(luò)122通信的設(shè)備102和112。設(shè)備102至少包括攝像機104、麥克風(fēng)106和顯示器108。設(shè)備112至少包括攝像機114、麥克風(fēng)116和顯示器118。網(wǎng)絡(luò)122至少包括服務(wù)器124。

設(shè)備102和112可以包括能夠進行有線和/或無線通信的各種硬件平臺。例如，設(shè)備102和112可以包括但不限于視頻會議系統(tǒng)、臺式電腦、膝上型電腦、平板電腦、智能電話(例如基于安卓的電話、基于的電話、基于的電話等)、蜂窩手持機等。攝像機104和114包括用于捕獲數(shù)字圖像的任意設(shè)備，所述數(shù)字圖像表示包括一個或多個人的環(huán)境，并且攝像機104和114可以具有足夠的分辨率，用于對所述環(huán)境中的一個或多個人進行面部分析，如本文中所描述的。例如，攝像機104和114可以包括靜止攝像機(例如被配置為捕獲靜止圖像的攝像機)或者視頻攝像機(例如被配置為捕獲包括多個幀的運動圖像的攝像機)。攝像機104和114可以被配置為利用可見光頻譜的光或者利用不限于紅外線頻譜、紫外線頻譜等的電磁波頻譜的其它部分進行操作。攝像機104和114可以被分別整合到設(shè)備102和112中，或者可以是被配置為經(jīng)由有線或無線通信與設(shè)備102和112進行通信的分離設(shè)備。攝像機104和114的具體示例可以包括可以與計算機、視頻監(jiān)控器等關(guān)聯(lián)的有線(例如，通用串行總線(usb)、以太網(wǎng)、火線等)或者無線(例如，wifi、藍牙等)網(wǎng)絡(luò)攝像機、移動設(shè)備攝像機(例如集成到例如之前討論的示例性設(shè)備中的蜂窩電話或智能電話攝像機)、集成的膝上型電腦攝像機、集成的平板電腦攝像機(例如，galaxy等)等等。設(shè)備102和112可以進一步包括麥克風(fēng)106和116。

麥克風(fēng)106和116包括被配置為感測聲音的任意設(shè)備。麥克風(fēng)106和116可以被分別集成到設(shè)備102和112中，或者可以經(jīng)由有線或無線通信與這些設(shè)備交互，就像在上面示例中關(guān)于攝像機104和114所描述的一樣。顯示器108和118包括被配置為顯示文本、靜止圖像、運動圖像(例如視頻)、用戶界面、圖形等的任意設(shè)備。顯示器108和118可以被分別集成到設(shè)備102和112，或者可以經(jīng)由有線或無線通信與這些設(shè)備交互，就像在上面中關(guān)于攝像機104和114所描述一樣。在一個實施例中，顯示器108和118被配置為分別顯示化身110和120。就像本文所提到的，化身被定義為二維(2d)或三維(3d)的用戶圖形表示。化身不必與用戶的面容相似，因此，雖然化身可以是逼真的表示，但是它們也可以采用繪圖、漫畫、草圖等形式。在系統(tǒng)100中，設(shè)備102可以顯示表示設(shè)備112的用戶(例如遠(yuǎn)程用戶)的化身110，類似地，設(shè)備112可以顯示表示設(shè)備102的用戶的化身120。用這種方式，用戶可以看到其他用戶的表示，而不需要交換采用實況圖像的設(shè)備到設(shè)備通信所涉及的大量的信息。

網(wǎng)絡(luò)122可以包括各種第二代(2g)、第三代(3g)、第四代(4g)基于蜂窩的數(shù)據(jù)通信技術(shù)、wifi無線數(shù)據(jù)通信技術(shù)等。網(wǎng)絡(luò)122包括至少一個服務(wù)器124，其被配置為在使用這些技術(shù)時建立和維持通信連接。例如，服務(wù)器124可以被配置為支持與因特網(wǎng)有關(guān)的通信協(xié)議，例如：會話發(fā)起協(xié)議(sip)，用于建立、修改和終止兩方(單播)和多方(組播)會話；交互式連接建立協(xié)議(ice)，用于提供允許在字節(jié)流連接之上建立協(xié)議的框架；網(wǎng)絡(luò)接入轉(zhuǎn)換(或nat)會話遍歷實用協(xié)議(stun)，用于允許通過nat運行的應(yīng)用發(fā)現(xiàn)分配給應(yīng)用的用戶數(shù)據(jù)報協(xié)議(udp)連接以連接到遠(yuǎn)程主機的其它nat、ip地址和端口的存在；使用中繼遍歷nat(turn)，用于允許nat或防火墻后面的元件通過傳輸控制協(xié)議(tcp)或udp連接接收數(shù)據(jù)；等等。

圖1b示出了根據(jù)本公開內(nèi)容的各個實施例的虛擬空間系統(tǒng)126。系統(tǒng)126可以待用設(shè)備102、設(shè)備112和服務(wù)器124。設(shè)備102、設(shè)備112和服務(wù)器124可以以與圖1a所示的方式類似的方式繼續(xù)通信，但是用戶交互可以發(fā)生在虛擬空間128中，而不是設(shè)備到設(shè)備的形式。就像本文所提到的，虛擬空間可以被定義為物理場所的數(shù)字仿真。例如，虛擬空間128可以類似于戶外場所(如城市、道路、人行道、原野、森林、島嶼等)，或者類似于室內(nèi)場所(如辦公室、住宅、學(xué)校、商場、商店等)。由化身表示的用戶在虛擬空間128中的交互看起來可以像在真實世界中的交互。虛擬空間128可以存在于耦合到因特網(wǎng)的一個或多個服務(wù)器上，并且可由第三方維護。虛擬空間的示例包括虛擬辦公室、虛擬會議室、類似的虛擬世界、類似的大型多人在線角色扮演游戲(mmorpg)、類似的大型多人在線真實生活游戲(mmorlg)等。在系統(tǒng)126中，虛擬空間128可以包括與不同用戶對應(yīng)的多個化身。并不是顯示化身，顯示器108和118可以顯示虛擬空間(vs)128的封裝的(例如更小的)版本。例如，顯示器108可以顯示與設(shè)備102的用戶相對應(yīng)的化身在虛擬空間128中“看到”的東西的透視圖。類似的，顯示器118可以顯示與設(shè)備112的用戶相對應(yīng)的化身在虛擬空間128中“看到”的東西的透視圖。化身在虛擬空間128中可能看到的東西的示例包括但不限于虛擬建筑物(例如大樓)、虛擬車輛、虛擬物體、虛擬動物、其他化身等。

圖2示出了根據(jù)本公開內(nèi)容的各個實施例的示例性設(shè)備102。雖然僅僅描述了設(shè)備102，但是設(shè)備112(例如遠(yuǎn)程設(shè)備)可以包括被配置為提供相同或類似功能的資源。正如之前所討論的，示出了包括攝像機104、麥克風(fēng)106和顯示器108的設(shè)備102。攝像機104和麥克風(fēng)106可以給攝像機和音頻構(gòu)架模塊200提供輸入。攝像機和音頻構(gòu)架模塊200可以包括定制的、專有的、已知的和/或以后開發(fā)的音頻和視頻處理代碼(或指令集)，所述音頻和視頻處理代碼一般是意義明確的并且用于至少控制攝像機104和麥克風(fēng)106。例如，攝像機和音頻構(gòu)架模塊200可以使得攝像機104和麥克風(fēng)106記錄圖像和/或聲音，可以處理圖像和/或聲音，可以使得圖像和/或聲音被再現(xiàn)等等。攝像機和音頻構(gòu)架模塊200可以變化，這取決于設(shè)備102，并且更具體地取決于在設(shè)備102中運行的操作系統(tǒng)(os)。示例性操作系統(tǒng)包括os、os等。揚聲器202可以接收來自攝像機和音頻構(gòu)架模塊200的音頻信息，并且可以被配置為重現(xiàn)本地聲音(例如以提供用戶聲音的音頻反饋)和遠(yuǎn)程聲音(例如，在虛擬空間中參與電話、視頻通話或交互的其它方的聲音)。

面部檢測和追蹤模塊204可以被配置為在攝像機104所提供的圖像中識別和追蹤頭部、面部和/或面部區(qū)域。例如，面部檢測模塊204可以包括定制的、專有的、已知的和/或以后開發(fā)的面部檢測代碼(或指令集)、硬件和/或固件，所述面部檢測代碼、硬件和/或固件一般是意義明確的并且用于接收標(biāo)準(zhǔn)格式的圖像(例如但不限于rgb彩色圖像)，以及至少在一定的范圍內(nèi)識別圖像中的面部。面部檢測和追蹤模塊204還可以被配置為通過一系列圖像(例如24幀/秒的視頻幀)追蹤檢測到的面部，并且基于檢測到的面部確定頭部位置?？梢员幻娌繖z測/追蹤模塊204使用的已知的追蹤系統(tǒng)可以包括粒子濾波、均值漂移、卡爾曼濾波等，它們中的每一個可以利用邊緣分析、平方差之和分析、特征點分析、直方圖分析、膚色分析等。

特征提取模塊206可以被配置為識別面部檢測模塊204檢測到的面部中的特征(例如，諸如眼睛、眉毛、鼻子、嘴等等之類的面部界標(biāo)的位置和/或形狀)。在一個實施例中，化身動畫可以直接基于感測到的面部動作(例如面部特征的變化)，而不需要面部表情的識別?；砻娌可系南鄳?yīng)特征點可以遵循或模仿真實人臉的運動，這被稱為“表情克隆”或“性能驅(qū)動的面部動畫”。特征提取模塊206可以包括定制的、專有的、已知的和/或以后開發(fā)的面部特性識別代碼(或指令集)，所述面部特性識別代碼一般是意義明確的并且用于從攝像機104接收標(biāo)準(zhǔn)格式的圖像(例如但不限于rgb彩色圖像)，以及至少在一定程度上提取圖像中的一個或多個面部特性。這些已知的面部特性系統(tǒng)包括但不限于科羅拉多州大學(xué)的csu面部識別評估系統(tǒng)。

特征提取模塊206還可以被配置為識別與檢測到的特征相關(guān)聯(lián)的表情(例如，識別先前檢測到的面部是否快樂、悲傷、微笑、皺眉、驚訝、興奮等)。因此，特征提取模塊206可以進一步包括定制的、專有的、已知的和/或以后開發(fā)的面部表情檢測和/或識別代碼(或指令集)，所述面部表情檢測和/或識別代碼一般是意義明確的，并且用于檢測和/或識別面部的表情。例如，特征提取模塊206可以確定面部特征(例如眼睛、嘴巴、臉頰、牙齒等)的大小和/或位置，并且可以將這些面部特征與面部特征庫進行比較，所述面部特征庫包括具有相應(yīng)的面部特征分類(例如微笑、皺眉、興奮、悲傷等)的樣本面部特征。

化身選擇模塊208被配置為允許設(shè)備102的用戶選擇在遠(yuǎn)程設(shè)備上顯示的化身?；磉x擇模塊208可以包括定制的、專有的、已知的和/或以后開發(fā)的用戶接口指令代碼(或指令集)，所述用戶接口指令代碼一般是意義明確的并且用于向用戶呈現(xiàn)不同的化身，使得用戶可以選擇化身中的一個。在一個實施例中，可以在設(shè)備102中預(yù)先定義一個或多個化身。預(yù)先定義的化身允許所有的設(shè)備都具有相同的化身，并且在交互期間，僅僅化身的選擇(例如預(yù)先定義的化身的識別)需要被傳輸?shù)竭h(yuǎn)程設(shè)備或虛擬空間，這樣減少了需要交換的信息量。在建立通信之前選擇化身，但是也可以在活動的通信過程期間改變化身。因此，在通信期間的任意點發(fā)送和接收化身的選擇以及接收設(shè)備根據(jù)接收的化身選擇改變所顯示的化身是可能的。

化身控制模塊210被配置為生成用于對化身進行動畫化的參數(shù)。本文中所提及的動畫可以被定義為改變圖像/模型的外觀。單個的動畫可以改變2d靜止圖像的外觀，或者多個動畫可以順序地出現(xiàn)以模仿圖像中的運動(例如頭部旋轉(zhuǎn)、點頭、眨眼、談話、皺眉、微笑、大笑、打盹、眨眼等)。3d模型的動畫的示例包括：使3d線框模型變形、施加紋理映射以及重新計算模型的頂點法線以用于渲染。檢測到的面部和/或提取的面部特征的位置變化可以被轉(zhuǎn)換為參數(shù)，所述參數(shù)使得化身的特征類似于用戶面部的特征。在一個實施例中，檢測到的面部的一般表情可以被轉(zhuǎn)換為一個或多個參數(shù)，所述一個或多個參數(shù)使得化身展現(xiàn)相同的表情?；淼谋砬檫€可以被夸大以強調(diào)該表情。當(dāng)化身參數(shù)可以一般性地應(yīng)用到所有預(yù)先定義的化身時，所選化身的知識可以不是必須的。然而，在一個實施例中，化身參數(shù)可以是特定于所選化身的，并且因此，如果選擇了另一個化身，那么可以改變化身參數(shù)。例如，與動物化身、卡通化身等相比，人類化身可能需要不同的參數(shù)設(shè)置(例如不同的化身特征可能被改變)來展示諸如高興、悲傷、憤怒、吃驚等等之類的情緒?；砜刂颇K208可以包括定制的、專有的、已知的和/或以后開發(fā)的圖形處理代碼(或指令集)，所述圖形處理代碼一般是意義明確的，并且用于基于由面部檢測和追蹤模塊204檢測到的面部/頭部位置和/或由特征提取模塊206檢測到的面部特征，來生成用于對由化身選擇模塊208選擇的化身進行動畫化的參數(shù)。對于基于面部特征的動畫方法而言，2d化身動畫可以通過例如圖像扭曲或圖像變形來進行，而3d化身動畫可以通過自由形式的變形(ffd)進行或者通過利用定義在頭部的3d模型中的動畫結(jié)構(gòu)來進行。oddcast是可用于2d化身動畫的軟件資源的示例，而facegen是可用于3d化身動畫的軟件資源的示例。

此外，在系統(tǒng)100中，化身控制模塊210可以接收遠(yuǎn)程化身選擇和遠(yuǎn)程化身參數(shù)，以用于顯示和動畫化與與遠(yuǎn)程設(shè)備處的用戶相對應(yīng)的化身?；砜刂颇K可以使得顯示模塊212在顯示器108上顯示化身110。顯示模塊208可以包括定制的、專有的、已知的和/或以后開發(fā)的圖形處理代碼(或指令集)，所述圖形處理代碼一般是意義明確的，并且用于根據(jù)示例性設(shè)備到設(shè)備的實施例在顯示器108上顯示和對化身進行動畫化。例如，化身控制模塊210可以接收遠(yuǎn)程化身選擇，并且可以將遠(yuǎn)程化身選擇解釋為與預(yù)定的化身相對應(yīng)。顯示模塊212隨后可以在顯示器108上顯示化身110。此外，可以解釋在化身控制模塊210中接收到的遠(yuǎn)程化身參數(shù)，并且可以向顯示模塊212提供對化身110進行動畫化的命令。在一個實施例中，可能有多于兩個的用戶參與視頻通話。當(dāng)多于兩個的用戶在視頻通話中交互時，顯示器108可被劃分或分割，以允許同時顯示多于一個的與遠(yuǎn)程用戶相對應(yīng)的化身。可替換地，在系統(tǒng)126中，化身控制模塊210可以接收信息，所述信息使得顯示模塊212顯示與設(shè)備102的用戶相對應(yīng)的化身(例如從化身的虛擬視角)在虛擬空間128中所“看到”的內(nèi)容。例如，顯示器108可以顯示在虛擬空間108中表示的建筑物、物體、動物、其它化身等。在一個實施例中，化身控制模塊210可以被配置為使得顯示模塊212顯示“反饋”化身214。反饋化身214表示所選化身在虛擬場所等中是如何呈現(xiàn)在遠(yuǎn)程設(shè)備上的。具體地，反饋化身214作為用戶所選擇的化身而呈現(xiàn)，并且可以使用化身控制模塊210生成的相同的參數(shù)進行動畫化。這樣，用戶可以確認(rèn)在他們的交互期間遠(yuǎn)程用戶看到的內(nèi)容。

通信模塊216被配置為發(fā)送和接收信息，以用于選擇化身、顯示化身、對化身進行動畫化、顯示虛擬場所視圖等。通信模塊216可以包括定制的、專有的、已知的和/或以后開發(fā)的通信處理代碼(或指令集)，所述通信處理代碼一般是意義明確的，并且用于發(fā)送化身選擇、化身參數(shù)以及接收遠(yuǎn)程化身選擇和遠(yuǎn)程化身參數(shù)。通信模塊216還可以發(fā)送和接收對應(yīng)于基于化身的交互的音頻信息。通信模塊216可以經(jīng)由網(wǎng)絡(luò)122來發(fā)送和接收上述信息，如之前所描述的。

圖3示出了了根據(jù)至少一個實施例的示例性系統(tǒng)實現(xiàn)。設(shè)備102’被配置為經(jīng)由wifi連接300進行無線通信(例如在工作時)，服務(wù)器124’被配置為經(jīng)由因特網(wǎng)302在設(shè)備102’和112’之間協(xié)商連接，并且裝置112’被配置為經(jīng)由另一個wifi連接304進行無線通信(例如在家時)。在一個實施例中，在裝置102’中激活設(shè)備到設(shè)備的基于化身的視頻通話應(yīng)用。在化身選擇之后，所述應(yīng)用可以允許選擇至少一個遠(yuǎn)程設(shè)備(例如設(shè)備112’)。所述應(yīng)用隨后可以使得設(shè)備102’發(fā)起與設(shè)備112’的通信?？梢园l(fā)起通信，其中設(shè)備102’經(jīng)由企業(yè)接入點(ap)306向設(shè)備112’發(fā)送連接建立請求。企業(yè)ap306可以是用在商業(yè)環(huán)境中的ap，因此，相比于家庭ap304，可以支持更高的數(shù)據(jù)吞吐量和更多的并發(fā)無線客戶端。企業(yè)ap306可以從設(shè)備102’接收無線信號，并且可以經(jīng)由網(wǎng)關(guān)308通過多個商業(yè)網(wǎng)絡(luò)繼續(xù)發(fā)送連接建立請求。所述連接建立請求隨后可以通過防火墻310，所述防火墻310可以被配置為控制流入和流出wifi網(wǎng)絡(luò)300的信息。

設(shè)備102’的連接建立請求隨后可以被服務(wù)器124’處理。服務(wù)器124’可以被配置用于ip地址的注冊、目的地地址的認(rèn)證和nat遍歷，使得所述連接建立請求可以被定向至因特網(wǎng)302上的正確目的地。例如，服務(wù)器124’可以根據(jù)從設(shè)備102’接收到的連接建立請求中的信息中解析預(yù)期的目的地(例如遠(yuǎn)程設(shè)備112’)，并且可以路由所述信號通過正確的nat、端口，從而據(jù)此到達目的地ip地址。這些操作可能只需要在連接建立期間被執(zhí)行，這取決于網(wǎng)絡(luò)配置。在一些實例中，在視頻通話期間可以重復(fù)這些操作，以向nat提供通知以保持連接存活。在已經(jīng)建立了連接之后，媒體和信號路徑312可以攜帶視頻(例如化身選擇和/或化身參數(shù))以及音頻信息，方向為指向家庭ap314。隨后設(shè)備112’可以接收所述連接建立請求，并可以被配置為確定是否接受所述請求。確定是否接受所述請求可以包括：例如向設(shè)備112’的用戶呈現(xiàn)可視注解語句，詢問是否接受來自設(shè)備102’的連接請求。如果設(shè)備112’的用戶接受所述連接(例如接受視頻通話)，則建立所述連接。攝像機104’和114’可被配置為隨后分別開始捕獲設(shè)備102’和112’的各自用戶的圖像，用于對每個用戶所選擇的化身進行動畫化。麥克風(fēng)106’和116’可以被配置為隨后開始記錄來自每一個用戶的音頻。隨著設(shè)備102’和112’之間的交換信息的開始，顯示器108’和118’可以顯示和并對與設(shè)備102’和112’的用戶相對應(yīng)的化身進行動畫化。

圖4是根據(jù)至少一個實施例的示例性操作的流程圖。在操作402中，可以在設(shè)備中激活應(yīng)用(例如，基于化身的視頻通話應(yīng)用)。在應(yīng)用的激活之后可以是化身選擇。化身選擇可以包括：所述應(yīng)用呈現(xiàn)界面，所述界面允許用戶選擇預(yù)先定義的化身。在化身選擇之后，在操作404中可以配置通信。通信配置包括：參與視頻通話的至少一個遠(yuǎn)程設(shè)備或虛擬空間的識別。例如，用戶可以從遠(yuǎn)程用戶/設(shè)備列表中進行選擇，所述列表存儲在所述應(yīng)用程序中、與設(shè)備中的另一個系統(tǒng)關(guān)聯(lián)地存儲(例如智能電話、手機等中的聯(lián)系人列表)、遠(yuǎn)程地存儲，例如在因特網(wǎng)上(例如，在諸如臉書、領(lǐng)英、雅虎、谷歌、msn等社交媒體網(wǎng)站中)?？商鎿Q地，用戶可以選擇在例如第二人生之類的虛擬空間上網(wǎng)。

在操作406中，可以在設(shè)備和至少一個遠(yuǎn)程設(shè)備或虛擬空間之間發(fā)起通信。例如，可以向遠(yuǎn)程設(shè)備或虛擬空間發(fā)送連接建立請求。在本文中為了解釋的目的，假設(shè)所述遠(yuǎn)程設(shè)備或虛擬空間接受所述連接建立請求。在操作408中，設(shè)備中的攝像機隨后可以開始捕獲圖像。所述圖像可以是靜止圖像或?qū)崨r視頻(例如順序地捕獲的多個圖像)。在操作410中，可以發(fā)生圖像分析，開始于圖像中的面部/頭部的檢測/追蹤。隨后可以分析檢測到的面部以提取面部特征(例如面部界標(biāo)、面部表情等)。在操作412中，將檢測到的面部/頭部位置和/或面部特征轉(zhuǎn)換為化身參數(shù)?；韰?shù)被用于在遠(yuǎn)程設(shè)備或虛擬空間中對所選化身進行動畫化。在操作414中，可以發(fā)送化身選擇或化身參數(shù)中的至少一個。

在操作416中，可以顯示化身并對其進行動畫化。在設(shè)備到設(shè)備通信的實例(例如系統(tǒng)100)中，可以從所述遠(yuǎn)程設(shè)備接收遠(yuǎn)程化身選擇或遠(yuǎn)程化身參數(shù)中的至少一個。隨后，可以基于接收到的遠(yuǎn)程化身選擇來顯示對應(yīng)于遠(yuǎn)程用戶的化身，并且可以基于接收到的遠(yuǎn)程化身參數(shù)來對對應(yīng)于遠(yuǎn)程用戶的化身進行動畫化。在虛擬場所交互的實例(系統(tǒng)126)中，可以接收允許所述設(shè)備顯示對應(yīng)于設(shè)備用戶的化身看到的內(nèi)容的信息。隨后在操作418中可以做出當(dāng)前通信是否完成的確定。如果在操作418中確定所述通信沒有完成，則可以重復(fù)操作408-416，以基于對用戶面部的分析繼續(xù)在遠(yuǎn)程裝置上顯示化身并對化身進行動畫化。否則，在操作420中可以終止所述通信。例如如果不再進行視頻通話，那么也可以終止所述視頻通話應(yīng)用。

雖然圖4示出了根據(jù)實施例的各種操作，但是要理解的是，圖4中描述的操作對于其它實施例而言并不都是必需的。實際上，在本文中可以完全預(yù)料到的是，在本公開內(nèi)容的其它實施例中，圖4描述的操作和/或本文中描述的其它操作，可以以任何附圖中沒有專門示出的方式進行組合，但仍然完全符合本公開內(nèi)容。因此，針對沒有確切地顯示在附圖中的特征和/或操作的權(quán)利要求被認(rèn)為是處于本公開的精神和內(nèi)容之中。

如在本文的任意實施例中所使用的，術(shù)語“模塊”可以指被配置為執(zhí)行上述操作中的任何一個的軟件、固件和/或電路。軟件可以具體化為記錄在非暫時性計算機可讀存儲介質(zhì)中的軟件包、代碼、指令、指令集和/或數(shù)據(jù)。固件可以具體化為在存儲設(shè)備中被硬編碼(例如非易失性)的代碼、指令或指令集和/或數(shù)據(jù)。如在本文的任意實施例中所使用，“電路”可以包括例如單個的或組合的硬線電路、可編程電路(例如包括一個或多個單獨的指令處理核的計算機處理器)、狀態(tài)機電路和/或存儲可編程電路所執(zhí)行的指令的固件。所述模塊可以共同地或單獨地被具體化為形成較大系統(tǒng)的一部分的電路，例如集成電路(ic)、片上系統(tǒng)(soc)、臺式電腦、膝上型電腦、平板電腦、服務(wù)器、智能電話等。

本文中所描述的任意操作可以實現(xiàn)在包括一個或多個存儲介質(zhì)的系統(tǒng)中，在所述存儲介質(zhì)上存儲有單獨的或組合的指令，所述指令在被一個或多個處理器執(zhí)行時執(zhí)行所述方法。在這里，處理器可以包括例如服務(wù)器cpu、移動設(shè)備cpu和/或其它可編程的電路。而且，本文中所描述的操作旨在可以分布在多個物理設(shè)備上，例如不止一個的不同的物理位置處的處理結(jié)構(gòu)。存儲介質(zhì)可以包括任意類型的有形介質(zhì)，例如，任意類型的磁盤(包括硬盤、軟盤、光盤、只讀光盤存儲器(cd-roms)、可重寫光盤(cd-rw)以及永磁光盤)、半導(dǎo)體設(shè)備(例如只讀存儲器(rom)、隨機存取存儲器(ram)(例如動態(tài)和靜態(tài)ram)、可擦除可編程只讀存儲器(eprom)、電可擦除可編程只讀存儲器(eeprom)、閃存、固態(tài)盤(ssds)、磁或光卡)、或者任意類型的適于存儲電子指令的介質(zhì)。其它實施例可以被實現(xiàn)成由可編程控制設(shè)備執(zhí)行的軟件模塊。所述存儲介質(zhì)可以是非暫時性的。

因此，本公開內(nèi)容提供了一種用于使用化身而不是實況圖像進行視頻通信的方法和系統(tǒng)。相比于實況圖像的發(fā)送，化身的使用減少了要交換的信息量。選擇化身，并且之后可以建立通信。每一個設(shè)備中的攝像機可以捕獲參與者的圖像?？梢苑治鰣D像來確定面部位置和面部特征。所述面部位置和/或面部特征隨后被轉(zhuǎn)換為化身參數(shù)，發(fā)送化身選擇或化身參數(shù)中的至少一個來進行顯示/動畫化。

根據(jù)一個方面，提供了一種方法。所述方法可以包括：選擇化身、發(fā)起通信、捕獲圖像、在圖像中檢測面部、從面部提取特征、將面部特征轉(zhuǎn)換為化身參數(shù)以及發(fā)送化身選擇或化身參數(shù)中的至少一個。

根據(jù)另一方面，提供了一種系統(tǒng)。所述系統(tǒng)可以包括：被配置為捕獲圖像的攝像機、被配置為發(fā)送和接收信息的通信模塊、以及一個或多個存儲介質(zhì)。此外，所述一個或多個存儲介質(zhì)具有單獨地或組合地存儲在其上的指令，所述指令在被一個或多個處理器執(zhí)行時，導(dǎo)致以下操作，所述操作包括：選擇化身、發(fā)起通信、捕獲圖像、在圖像中檢測面部、從面部提取面部特征、將面部特征轉(zhuǎn)換為化身參數(shù)以及發(fā)送化身選擇或化身參數(shù)中的至少一個。

根據(jù)另一方面，提供了一種系統(tǒng)。所述系統(tǒng)可以包括一個或多個存儲介質(zhì)，所述一個或多個存儲介質(zhì)具有單獨地或組合地存儲在其上的指令，所述指令在被一個或多個處理器執(zhí)行時導(dǎo)致以下操作，包括：選擇化身、發(fā)起通信、捕獲圖像、在圖像中檢測面部、從面部提取特征面部、將面部特征轉(zhuǎn)換為化身參數(shù)以及發(fā)送化身選擇或化身參數(shù)中的至少一個。

本文中已經(jīng)使用的術(shù)語和表達作為描述的術(shù)語，而不是進行限制的術(shù)語，并且使用這樣的術(shù)語和表達的意圖并不是要排除所示出和描述的特征(或其部分)的等價形式，并且要認(rèn)識的是，落入權(quán)利要求范圍內(nèi)的各種修改都是可能的。因此，權(quán)利要求旨在涵蓋所有這類等價形式。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：W·李;X·童;Y·杜;Q·E·栗;Y·張;W·胡;H·A·李;J·G·坦南特
技術(shù)所有人：英特爾公司
我是此專利的發(fā)明人

上一篇：一種顯示處理方法及裝置與流程
上一篇：智能電視的開機方法、智能電視及遙控器與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

禁止使用無線通信相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

使用化身的通信的制作方法