用于數(shù)據(jù)處理系統(tǒng)的智能音頻和視頻捕捉系統(tǒng)的制作方法
【專利摘要】計(jì)算系統(tǒng)包括用于檢測(cè)計(jì)算系統(tǒng)的位置信息(包括位置和方向)的方向檢測(cè)設(shè)備、耦合到所述定位檢測(cè)設(shè)備的多傳感器系統(tǒng),所述多傳感器系統(tǒng)用于捕捉環(huán)境輸入數(shù)據(jù),所述傳感器系統(tǒng)包括至少音頻捕捉系統(tǒng)和三維(3D)圖像捕捉系統(tǒng)的其中之一,并且所述環(huán)境輸入數(shù)據(jù)至少包括音頻或圖像中的其中之一、和至少一個(gè)耦合至所述定向檢測(cè)設(shè)備和所述多傳感器系統(tǒng)的信號(hào)處理部件,其中所述處理器用于基于所述位置信息修改所述捕捉的環(huán)境輸入數(shù)據(jù)。
【專利說(shuō)明】用于數(shù)據(jù)處理系統(tǒng)的智能音頻和視頻捕捉系統(tǒng)
[0001]相關(guān)申請(qǐng)案交叉申請(qǐng)
[0002]本發(fā)明要求2011年12月12日由周炯等人遞交的發(fā)明名稱為“用于數(shù)據(jù)處理系統(tǒng)的智能音頻和視頻捕捉系統(tǒng)(Smart Audio and Video Capture Systems for DataProcessing Systems) ”的第13/323157號(hào)美國(guó)專利申請(qǐng)案的在先申請(qǐng)優(yōu)先權(quán),該在先申請(qǐng)的內(nèi)容以引入的方式并入本文本中,如全文再現(xiàn)一般。
【技術(shù)領(lǐng)域】
[0003]本發(fā)明涉及通信網(wǎng)絡(luò),尤其涉及用于數(shù)據(jù)處理系統(tǒng)的智能音頻和視頻捕捉系統(tǒng)。【背景技術(shù)】
[0004]不同的制造商向消費(fèi)者市場(chǎng)提供了不同的平板電腦,例如自2010年發(fā)行的產(chǎn)品。平板電腦,也稱為個(gè)人平板電腦(例如蘋果公司的iPad),是相比其他類型計(jì)算設(shè)備在文檔、郵件、網(wǎng)上沖浪、社會(huì)活動(dòng)和個(gè)人娛樂(lè)方面提供若干優(yōu)勢(shì)的便攜設(shè)備。一般而言,平板電腦具有錄音系統(tǒng),使得該平板電腦能夠錄音,例如使能語(yǔ)音通信或媒體應(yīng)用。該錄音系統(tǒng)中由麥克風(fēng)轉(zhuǎn)換的數(shù)字?jǐn)?shù)據(jù)用于進(jìn)行識(shí)別、編碼和傳輸?shù)榷喾N目的。由于聲音環(huán)境包括噪音。為了獲取清晰的聲音,增強(qiáng)或者從噪音中分離出麥克風(fēng)中記錄的目標(biāo)聲音。一些平板電腦還具有三維(3D)視頻攝像頭功能,其可以用于實(shí)施與其它平板電腦或設(shè)備用戶的3D視頻會(huì)議。
【發(fā)明內(nèi)容】
[0005]在一項(xiàng)實(shí)施例中,本發(fā)明包括計(jì)算系統(tǒng),所述計(jì)算系統(tǒng)包括用于檢測(cè)計(jì)算系統(tǒng)的位置信息(包括位置和方向)的定位檢測(cè)設(shè)備、耦合到所述定位檢測(cè)設(shè)備的多傳感器系統(tǒng),所述多傳感器系統(tǒng)用于捕捉環(huán)境輸入數(shù)據(jù),所述傳感器系統(tǒng)至少包括音頻捕捉系統(tǒng)和三維(3D)圖像捕捉系統(tǒng)的其中之一,并且所述環(huán)境輸入數(shù)據(jù)至少包括音頻或圖像中的其中之一、和至少一個(gè)耦合至所述方向檢測(cè)設(shè)備和所述多傳感器系統(tǒng)的信號(hào)處理部件,其中所述處理器用于基于所述位置信息修改所述捕捉的環(huán)境輸入數(shù)據(jù)。
[0006]在另一項(xiàng)實(shí)施例中,本發(fā)明包括錄音系統(tǒng),所述錄音系統(tǒng)包括耦合到一個(gè)或多個(gè)麥克風(fēng)的到達(dá)方向(DOA)估計(jì)部件,用于使用接收的定位信息估計(jì)檢測(cè)的聲音信號(hào)的D0A;耦合到所述DOA估計(jì)部件的降噪部件,用于使用所述DOA估計(jì)降低所述檢測(cè)的聲音信號(hào)中的噪聲;以及耦合到所述降噪部件和所述DOA估計(jì)部件的去混響部件,用于使用所述DOA估計(jì)去除檢測(cè)的聲音信號(hào)中的混響效果。
[0007]在另一項(xiàng)實(shí)施例中,本發(fā)明包括二維(3D)視頻捕捉系統(tǒng),所述3D視頻捕捉系統(tǒng)包括耦合到至少兩個(gè)攝像頭的攝像頭配置設(shè)備,用于基于檢測(cè)的所述3D視頻捕捉系統(tǒng)的方向信息布置所述攝像頭中的至少一些攝像頭,以正確地捕捉3D視頻和3D圖像的其中之一;以及耦合到所述攝像頭配置設(shè)備的方向檢測(cè)設(shè)備,用于檢測(cè)所述方向信息。
[0008]在又一項(xiàng)實(shí)施例中,本發(fā)明包括實(shí)施在便攜設(shè)備上的錄音方法,所述方法包括檢測(cè)所述便攜設(shè)備的方向、基于所述檢測(cè)的方向調(diào)整麥克風(fēng)陣列設(shè)備、使用所述調(diào)整的麥克風(fēng)陣列設(shè)備記錄聲音信號(hào)以及基于所述檢測(cè)的方向估計(jì)所述聲音信號(hào)的到達(dá)方向(DOA)。
[0009]在又一項(xiàng)實(shí)施例中,本發(fā)明包括實(shí)施在便攜設(shè)備上的三維(3D)視頻捕捉方法,所述方法包括檢測(cè)所述便攜設(shè)備的方向、基于所述檢測(cè)的方向配置多個(gè)攝像頭以及使用所述配置的攝像頭捕捉視頻或圖像。
[0010]結(jié)合附圖和權(quán)利要求書(shū),可從以下的詳細(xì)描述中更清楚地理解這些和其他特征。
【專利附圖】
【附圖說(shuō)明】
[0011]為了更完整地理解本發(fā)明,現(xiàn)在參考以下結(jié)合附圖和詳細(xì)描述進(jìn)行的簡(jiǎn)要描述,其中相同參考標(biāo)號(hào)表不相同部分。
[0012]圖1是平板電腦設(shè)計(jì)的示意圖。
[0013]圖2是錄音系統(tǒng)的示意圖。
[0014]圖3是信號(hào)處理部件的示意圖。
[0015]圖4是改進(jìn)的平板電腦設(shè)計(jì)的實(shí)施例的示意圖。
[0016]圖5是改進(jìn)的錄音系統(tǒng)的實(shí)施例的示意圖。
[0017]圖6是改進(jìn)的信號(hào)處理部件的實(shí)施例的示意圖。
[0018]圖7是改進(jìn)的3D視頻捕捉系統(tǒng)的實(shí)施例的示意圖。
[0019]圖8是改進(jìn)的錄音方法的實(shí)施例的流程圖。
[0020]圖9是改進(jìn)的3D視頻捕捉方法的實(shí)施例的流程圖。
[0021]圖10是通用計(jì)算機(jī)系統(tǒng)的實(shí)施例的示意圖。
【具體實(shí)施方式】
[0022]最初應(yīng)理解,盡管下文提供一個(gè)或多個(gè)實(shí)施例的說(shuō)明性實(shí)施方案,但可使用任意數(shù)目的當(dāng)前已知或現(xiàn)有的技術(shù)來(lái)實(shí)施所公開(kāi)的系統(tǒng)和/或方法。本發(fā)明決不應(yīng)限于下文所說(shuō)明的所述說(shuō)明性實(shí)施方案、圖式和技術(shù),包含本文所說(shuō)明并描述的示范性設(shè)計(jì)和實(shí)施方案,而是可以在所附權(quán)利要求書(shū)的范圍以及其均等物的完整范圍內(nèi)修改。
[0023]新興和未來(lái)的平板電腦可包括高級(jí)麥克風(fēng)陣列,這些高級(jí)麥克風(fēng)陣列可能集成到平板電腦中以提供更好的錄音質(zhì)量,例如,具有更高的信噪比(SNR)。高級(jí)麥克風(fēng)整列設(shè)備可用于替代當(dāng)前使用的檢測(cè)目標(biāo)聲音的全向(單向)麥克風(fēng)。麥克風(fēng)陣列可以更適應(yīng)聲音傳入的方向,因此可以具有更好的噪聲消除屬性。一種實(shí)施麥克風(fēng)陣列的方法可以是基于聲音源的方向和麥克風(fēng)間的距離使用由陣列中的麥克風(fēng)接收的聲音信號(hào)的相位差來(lái)強(qiáng)調(diào)目標(biāo)聲音,從而抑制噪聲。這可以通過(guò)不同的算法實(shí)現(xiàn)。
[0024]例如,為了增強(qiáng)接收的聲音信號(hào),可以使用可實(shí)施多重信號(hào)分類(MUSIC)算法的相干信號(hào)子空間過(guò)程。該算法可要求預(yù)估信號(hào)方向,其中信號(hào)方向的估計(jì)錯(cuò)誤可顯著影響該過(guò)程的最終估計(jì)。電話會(huì)議系統(tǒng)、人機(jī)界面和助聽(tīng)器等一些應(yīng)用可能需要足夠準(zhǔn)確地估計(jì)聲音信號(hào)的D0A。這些應(yīng)用可能涉及閉室中的聲音源的DOA估計(jì)。因此,來(lái)自不同方向的大量混響的存在可顯著降低DOA估計(jì)算法的性能。這樣,在一個(gè)充滿混響的房間中,就可能需要一個(gè)更加可靠的預(yù)估計(jì)DOA來(lái)定位說(shuō)話人。此外,由于與目標(biāo)聲音相比噪聲源可能具有不同的方向,因此更加精確估計(jì)的DOA可以加強(qiáng)噪音消除。[0025]另一個(gè)可能需要注意的重要場(chǎng)景是估計(jì)或識(shí)別平板電腦的3D視頻攝像頭系統(tǒng)的用戶的臉部位置。例如,當(dāng)用戶與另一使用平板電腦的用戶參與3D視頻會(huì)議時(shí),用戶可能沒(méi)有以指定的正確位置持有平板電腦或3D視頻攝像頭系統(tǒng)可能不知道平板電腦的方向。當(dāng)沒(méi)有以正確的位置持有平板電腦時(shí),當(dāng)前3D視頻攝像頭使市場(chǎng)中的平板電腦不一定能夠捕捉正確的3D視頻或圖像。可能需要使用位置感知系統(tǒng)和攝像頭配置系統(tǒng),該攝像頭配置系統(tǒng)使用位置或方向信息來(lái)自適應(yīng)地配置系統(tǒng)的3D攝像頭,以捕捉正確的3D視頻/圖像。
[0026]本文所揭示的是使用平板電腦允許改進(jìn)的錄音和3D視頻/圖像捕捉的系統(tǒng)和方法。這些系統(tǒng)可用于檢測(cè)和獲取平板電腦的方向或位置信息并且使用這些信息提高平板電腦中的錄音子系統(tǒng)和/或3D視頻捕捉子系統(tǒng)的性能。本文使用的術(shù)語(yǔ)位置信息和方向信息可互換以指示平板電腦的方向和/或傾斜(例如,單位為度),例如平板電腦的水平對(duì)齊方式等指定位置。這些系統(tǒng)可包括方向檢測(cè)設(shè)備、麥克風(fēng)調(diào)整設(shè)備、攝像頭配置設(shè)備、錄音子系統(tǒng)、3D視頻捕捉或其組合。方向檢測(cè)設(shè)備可用于生成平板電腦的位置/方向信息,該信息可由麥克風(fēng)調(diào)整設(shè)備和/或攝像頭配置設(shè)備使用。麥克風(fēng)調(diào)整設(shè)備可使用該信息調(diào)整麥克風(fēng)中的傳感角度并使該角度與目標(biāo)聲音的方向?qū)R。位置/方向信息還可用于在錄音子系統(tǒng)中實(shí)施信號(hào)處理方案。視頻配置設(shè)備可使用該信息重新布置攝像頭用于捕捉視頻/圖像。該信息還可用于在3D視頻捕捉子系統(tǒng)中實(shí)施相應(yīng)過(guò)程,以獲取正確的3D視頻或圖像。
[0027]圖1示出了平板電腦101的平板電腦設(shè)計(jì)100的實(shí)施例。平板電腦101可以是以平板電腦外殼的一側(cè)上的平面屏幕為特征的任意便攜計(jì)算設(shè)備。顯示屏可用于觀看,且還可以是用于打字的觸摸屏。平板電腦101可能不要求連接用于基礎(chǔ)操作的單獨(dú)的接口設(shè)備,對(duì)于臺(tái)式電腦情況可能并非如此。平板電腦101可以是不可折疊或不要求機(jī)械操作的固定設(shè)備,例如筆記本。與其它類型的計(jì)算設(shè)備(例如,筆記本)相比,平板電腦101可提供更少的特性/功能并且具有較低的定價(jià)和成本。平板電腦101還可更輕且更加便攜。平板電腦101與智能手機(jī)等其它通信設(shè)備的不同可能在于平板電腦101可能尺寸更大、提供更多的計(jì)算功能和功能、和/或不必配備蜂窩接口。平板電腦101可能具有與至少一些當(dāng)前的可用平板電腦(市場(chǎng)中還稱之為pad)類似的特性,例如蘋果iPad、惠普(HP)平板電腦、三星Galaxy平板電腦、聯(lián)想IdeaPad、戴爾Latitude平板電腦以及其它平板電腦或pad。
[0028]平板電腦設(shè)計(jì)100相對(duì)其寬度或長(zhǎng)度以及平板電腦101的一側(cè)上的平面顯示屏(例如,觸摸屏)而言可能具有相對(duì)較小的厚度。平板電腦101的頂部和底部邊緣可能比平板電腦101的其余(側(cè))邊緣更寬。因此,長(zhǎng)度或頂部和底部邊緣可對(duì)應(yīng)于平板電腦101的長(zhǎng)度,且側(cè)邊緣的長(zhǎng)度可對(duì)應(yīng)于平板電腦101的寬度。顯示屏可包括平板電腦101的整個(gè)表面的實(shí)質(zhì)區(qū)域。平板電腦設(shè)計(jì)100還可包括例如,位于圍繞屏幕的平板電腦101的一邊上的麥克風(fēng)102以及例如,通常位于平板電腦101的另一邊上的一個(gè)或兩個(gè)攝像頭104,如圖1(a)所示。麥克風(fēng)102可以是全向麥克風(fēng)或麥克風(fēng)陣列設(shè)備,其是平板電腦101的錄音系統(tǒng)的一部分,用于接收用戶的聲音并使能聲音通信、錄音、通信或其組合。攝像頭104可以是平板電腦101的視頻捕捉系統(tǒng)的一部分,用于拍攝圖像或視頻以及使能視頻會(huì)議或呼口L或者兩者。攝像頭104可以是3D攝像頭,且視頻捕捉系統(tǒng)可以是捕捉3D圖像或視頻的3D視頻捕捉系統(tǒng)。3D攝像頭是能夠捕捉“RGB”信息和3G信息的單個(gè)設(shè)備。在一些實(shí)施例中,需要至少兩個(gè)攝像頭104來(lái)(同時(shí))從不同角度捕捉相同圖像的兩個(gè)幀。隨后可根據(jù)3D處理方案處理這兩個(gè)幀以呈現(xiàn)類似3D的圖像。相同的概念可用于3D視頻捕捉。
[0029]通常,可根據(jù)平板電腦101的指定方向優(yōu)化錄音系統(tǒng)。例如,可以針對(duì)平板電腦101的垂直位置優(yōu)化錄音系統(tǒng),如圖1(a)所示。在該位置,麥克風(fēng)102可以位于平板電腦101的底部邊緣(例如,圍繞底部邊緣的中心)。因此,錄音系統(tǒng)正確地處理由麥克風(fēng)102檢測(cè)到的目標(biāo)聲音或用戶的語(yǔ)音,以去除任何噪聲。除了噪聲以外,麥克風(fēng)102可例如圍繞用戶或目標(biāo)聲音的其它源接收用戶的語(yǔ)音或任意目標(biāo)聲音。隨后錄音系統(tǒng)可在計(jì)算噪音的時(shí)候假設(shè)平板電腦101以正確的方向(垂直位置)持有或放置并且麥克風(fēng)102相應(yīng)地位于(底部邊緣的)合適的位置。然而,當(dāng)(例如,如圖1(b)所示180度)改變或旋轉(zhuǎn)平板電腦101的位置/方向時(shí),麥克風(fēng)102可能不再位于正確的位置(例如,相對(duì)聲音目標(biāo)),因此錄音系統(tǒng)(假設(shè)平板電腦101的垂直位置)可能無(wú)法正確地處理檢測(cè)的聲音/語(yǔ)音以及伴隨噪聲。因此,可能無(wú)法優(yōu)化錄音系統(tǒng)的輸出。例如,在語(yǔ)音呼叫場(chǎng)景,通信的用戶語(yǔ)音可仍然包括大量噪聲或另一側(cè)的接受者可能聽(tīng)不清楚。
[0030]類似地,可根據(jù)平板電腦101的選擇的方向(例如,圖1 (a)的垂直位置)優(yōu)化3D視頻捕捉系統(tǒng),其中兩個(gè)攝像頭104可能位于平板電腦101的頂部邊緣(例如,圍繞頂部邊緣的中心)。在此場(chǎng)景下,可由3D視頻捕捉系統(tǒng)正確地處理攝像頭104捕捉的視頻或圖像以正確地生成類似3D的場(chǎng)景。當(dāng)攝像頭104捕捉(例如,用戶面部或任意目標(biāo)場(chǎng)景)圖像/視頻幀時(shí),3D視頻捕捉系統(tǒng)可通過(guò)考慮(位于頂部邊緣的)攝像頭104的相應(yīng)位置來(lái)處理捕捉的幀,假設(shè)以正確的方向(垂直位置)持有或放置平板電腦101。然而,當(dāng)(例如,如圖1 (b)所示180度)改變或旋轉(zhuǎn)平板電腦101的位置/方向時(shí),攝像頭104可能不再位于正確的位置(例如,相對(duì)目標(biāo)圖像/視頻),因此3D錄像系統(tǒng)(假設(shè)平板電腦101的垂直位置)可能無(wú)法正確地處理捕捉的視頻/圖像。因此,可能無(wú)法優(yōu)化3D視頻捕捉系統(tǒng)的輸出。例如,在視頻會(huì)議場(chǎng)景中,另一側(cè)的觀看者可能看不清楚通信用戶的3D視頻。
[0031]圖2示出了錄音系統(tǒng)200的實(shí)施例,基于平板電腦設(shè)計(jì)100,該錄音系統(tǒng)可用于平板電腦101中。錄音系統(tǒng)200可包括麥克風(fēng)201、耦合到麥克風(fēng)201的信號(hào)處理設(shè)備202和用于進(jìn)一步信號(hào)處理的耦合到信號(hào)處理設(shè)備202的至少一個(gè)額外的處理部件203。錄音系統(tǒng)200的部件可以如圖2所示進(jìn)行布置,并且可以使用硬件、軟件或使用二者結(jié)合來(lái)實(shí)施。麥克風(fēng)201可對(duì)應(yīng)于麥克風(fēng)102。信號(hào)處理設(shè)備202可用于從麥克風(fēng)201接收檢測(cè)的聲音/音頻作為輸入、處理該聲音/音頻(例如,用以消除或抑制噪聲)并將處理的(清晰的)聲音作為輸出發(fā)送到額外的處理部件203。信號(hào)處理設(shè)備202的過(guò)程可包括但不限于降噪和去混響。額外的處理部件203可用于接收清晰的聲音作為輸入,進(jìn)一步處理清晰的聲音(例如,實(shí)施聲音識(shí)別、編碼和/或傳輸),并且相應(yīng)地提供數(shù)字聲音數(shù)據(jù)作為輸出。
[0032]圖3示出了信號(hào)處理部件300的實(shí)施例,基于平板電腦設(shè)計(jì)100,該信號(hào)處理部件可用于平板電腦101中。該信號(hào)處理部件300可對(duì)應(yīng)于錄音系統(tǒng)200的信號(hào)處理部件202。該信號(hào)處理部件300可包括降噪塊301和耦合到降噪塊301的去混響塊302。信號(hào)處理部件300的部件可以如圖3所示進(jìn)行布置,并且可以使用硬件、軟件或二者結(jié)合來(lái)實(shí)施。降噪塊301可用于接收可能具有噪聲和/或混響效果的收集的聲音(例如,來(lái)自麥克風(fēng)201)信號(hào)、處理該聲音信號(hào)以降低或消除噪聲并隨后將處理的信號(hào)轉(zhuǎn)發(fā)到去混響塊302。去混響塊302可用于接收來(lái)自降噪塊301的處理的信號(hào)、進(jìn)一步處理聲音信號(hào)以消除或降低聲音中的任意混響效果并隨后轉(zhuǎn)發(fā)清晰的聲音作為輸出。[0033]圖4示出了平板電腦401的改進(jìn)的平板電腦設(shè)計(jì)400的實(shí)施例。平板電腦401可以是以平板電腦外殼的一側(cè)上的平面屏幕為特征的任意便攜計(jì)算設(shè)備。平板電腦401的部件的配置可與平板電腦101的相應(yīng)部件類似,包括可能是觸摸屏的屏幕。平板電腦401還可包括例如位于屏幕周圍的平板電腦401的一個(gè)邊緣上的麥克風(fēng)402。麥克風(fēng)402可以是麥克風(fēng)陣列設(shè)備,其可包括以陣列配置布置的多個(gè)麥克風(fēng)。平板電腦401還可包括至少兩個(gè)攝像頭404,其可以是用于捕捉3D視頻/圖像的3D攝像頭。攝像頭404可位于平板電腦401的一個(gè)或不同邊緣上。例如,平板電腦401可包括大約四個(gè)攝像頭404,其中每個(gè)攝像頭位于平板電腦401的四個(gè)邊緣的一個(gè)邊緣上。將攝像頭404沿平板電腦401的不同的邊緣分布可以允許當(dāng)捕捉視頻/圖像時(shí)考慮平板電腦400的不同的位置/方向,從而根據(jù)位置/方向有更好的3D視頻/圖像處理。平板電腦401的部件可以如圖4(a)所示進(jìn)行布置,其可以對(duì)應(yīng)于一個(gè)可能的位置(例如,右上位置)用于持有和操作平板電腦401。
[0034]圖4(b)、(C)和(d)分別示出了持有或操作平板電腦401的其它可能方向,與圖
(4)的方向呈90度、180度和270度角。在不同的方向,麥克風(fēng)402和攝像頭404的位置來(lái)自固定的目標(biāo),例如用戶的面部可能不同。如果相對(duì)于平板電腦的指定的正確方向而言,使用假設(shè)目標(biāo)的確定方向的典型的聲音/視頻處理方案,那么針對(duì)平板電腦的不同方向的固定目標(biāo)處理聲音/視頻的結(jié)果可能導(dǎo)致處理錯(cuò)誤(降低的聲音/視頻質(zhì)量)。
[0035]相反,為了允許在不同的方向持有和操作平板電腦401,平板電腦401可包括改進(jìn)的錄音和/或3D視頻捕捉系統(tǒng)(未示出)。當(dāng)錄音和/或捕捉3D視頻時(shí),改進(jìn)的錄音/3D視頻捕捉系統(tǒng)可以基于平板電腦401的位置/方向信息在平板電腦401的任意方向或位置(傾斜)適當(dāng)?shù)靥幚砺曇?視頻。平板電腦401可包括用于檢測(cè)位置信息的方向檢測(cè)設(shè)備(未示出)。錄音系統(tǒng)可以使用位置信息以估計(jì)信號(hào)的DOA并且相應(yīng)地處理由麥克風(fēng)402錄制的聲音。例如,可以考慮基于位置信息的選擇陣列中的一些麥克風(fēng)檢測(cè)的聲音。類似地,3D視頻捕捉系統(tǒng)可以使用位置信息以過(guò)濾和處理攝像頭404捕捉的視頻/圖像。例如,可以考慮基于位置信息選擇的一些攝像頭404捕捉的視頻/圖像。
[0036]方向檢測(cè)設(shè)備可用于生成方向信息、位置數(shù)據(jù)和/或角度數(shù)據(jù),其可由麥克風(fēng)調(diào)整設(shè)備(未示出)和/或視頻配置設(shè)備(未示出)使用。麥克風(fēng)調(diào)整設(shè)備可用于基于方向信息選擇麥克風(fēng)或控制麥克風(fēng)中的傳感器用于陣列中的聲音處理考慮,并且可能是錄音系統(tǒng)的一部分。視頻配置設(shè)備可以用于基于方向信息為視頻處理考慮選擇或布置攝像頭404 (例如,指導(dǎo)攝像頭中的傳感器),并且可能是3D視頻捕捉系統(tǒng)的一部分。
[0037]例如,當(dāng)相對(duì)于水平平面旋轉(zhuǎn)平板電腦時(shí),方向檢測(cè)設(shè)備中的位置檢測(cè)器可以檢測(cè)平板電腦401的相對(duì)位置或?qū)Φ孛娴膬A斜并且相應(yīng)地生成位置信息數(shù)據(jù)。位置信息數(shù)據(jù)可以在麥克風(fēng)調(diào)整設(shè)備中使用。例如,麥克風(fēng)調(diào)整設(shè)備可以(例如,相對(duì)于用戶的面部或嘴部)相應(yīng)地控制麥克風(fēng)陣列的最大傳感角度,和/或可將該信息傳遞給信號(hào)處理設(shè)備(未示出)以在麥克風(fēng)陣列收集的聲音信號(hào)上指導(dǎo)信號(hào)處理過(guò)程。信號(hào)處理設(shè)備可以是錄音系統(tǒng)的一部分。信號(hào)處理過(guò)程可以包括降噪、去混響、語(yǔ)音增強(qiáng)和/或其它聲音增強(qiáng)過(guò)程。位置信息數(shù)據(jù)還可以用于3D視頻配置設(shè)備/系統(tǒng)中以指導(dǎo)和配置至少一對(duì)攝像頭404用于捕捉3D視頻和圖像。
[0038]圖5示出了改進(jìn)的錄音系統(tǒng)500的實(shí)施例,基于平板電腦設(shè)計(jì)400,該錄音系統(tǒng)可用于平板電腦401中。錄音系統(tǒng)500可包括至少兩個(gè)麥克風(fēng)501、耦合到麥克風(fēng)501的信號(hào)處理設(shè)備502以及至少一個(gè)用于進(jìn)一步信號(hào)處理的耦合到信號(hào)處理設(shè)備502的額外的處理部件503。此外,錄音系統(tǒng)500可包括耦合到信號(hào)處理設(shè)備502的麥克風(fēng)調(diào)整設(shè)備505、耦合到麥克風(fēng)調(diào)整設(shè)備505的方向檢測(cè)設(shè)備504。錄音系統(tǒng)500的部件可以如圖5所示進(jìn)行布置,并且可以使用硬件、軟件或使用二者來(lái)實(shí)施這些部件。
[0039]麥克風(fēng)501可以是兩個(gè)獨(dú)立的全向麥克風(fēng)、兩個(gè)獨(dú)立的麥克風(fēng)陣列或兩個(gè)麥克風(fēng)陣列中的兩個(gè)麥克風(fēng)(傳感器)。在其它實(shí)施例中,錄音系統(tǒng)500可包括兩個(gè)以上獨(dú)立的麥克風(fēng)501,例如位于平板電腦的一個(gè)或多個(gè)邊緣上。發(fā)往信號(hào)處理設(shè)備502的輸入可包括來(lái)自各個(gè)麥克風(fēng)501的收集的聲音信號(hào)以及來(lái)自麥克風(fēng)調(diào)整設(shè)備505的位置信息數(shù)據(jù)。方向檢測(cè)設(shè)備504可包括加速計(jì)和/或方向/旋轉(zhuǎn)檢測(cè)設(shè)備,用于提供方向/旋轉(zhuǎn)信息。根據(jù)水平平面等平板電腦的指定位置或方向,可以檢測(cè)方向/旋轉(zhuǎn)信息。此外或作為替代,方向檢測(cè)設(shè)備504可包括面部/嘴部識(shí)別設(shè)備,其可以用來(lái)估計(jì)平板電腦相對(duì)于用戶的位置/方向信息。
[0040]來(lái)自方向檢測(cè)設(shè)備504的位置信息數(shù)據(jù)可以被發(fā)送到麥克風(fēng)調(diào)整設(shè)備505,該麥克風(fēng)調(diào)整設(shè)備505可以用于控制麥克風(fēng)501 (或麥克風(fēng)陣列)的最大傳感角度??梢钥刂汽溈孙L(fēng)501使得用戶的嘴部在最大傳感角度內(nèi)對(duì)齊,因此更好地進(jìn)行傳入聲音信號(hào)方向的對(duì)齊檢測(cè)并且遠(yuǎn)離噪聲源。此外或作為替代,麥克風(fēng)調(diào)整設(shè)備505可以向信號(hào)處理設(shè)備502發(fā)送位置信息數(shù)據(jù)。信號(hào)處理設(shè)備502可以使用位置信息數(shù)據(jù)實(shí)施降噪/去混響過(guò)程以獲取清晰的聲音。此外,信號(hào)處理設(shè)備502可以實(shí)施聲音的DOA估計(jì),如下文進(jìn)一步論述。隨后可以將清晰的聲音發(fā)送到額外的處理部件503,其可用于進(jìn)行信號(hào)識(shí)別、編碼和/或傳輸。
[0041]圖6示出了改進(jìn)的信號(hào)處理部件600的實(shí)施例,基于平板電腦設(shè)計(jì)400,該信號(hào)處理部件可用于平板電腦401中。該信號(hào)處理部件600可對(duì)應(yīng)于錄音系統(tǒng)500的信號(hào)處理設(shè)備502。信號(hào)處理部件600可包括降噪塊601、耦合到降噪塊601的去混響塊602以及耦合到降噪塊601和去混響塊602的DOA估計(jì)塊603。信號(hào)處理部件600的部件可以如圖6所示進(jìn)行布置,并且可以使用硬件、軟件或使用二者來(lái)實(shí)施這些部件。
[0042]DOA估計(jì)塊603可用于從每個(gè)麥克風(fēng)(例如,麥克風(fēng)501)接收可能帶有噪聲的收集的聲音并且基于(例如,來(lái)自方向檢測(cè)設(shè)備504和/或麥克風(fēng)調(diào)整設(shè)備505)接收的位置信息實(shí)施DOA。DOA估計(jì)塊603可以使用位置信息數(shù)據(jù)以估計(jì)傳入聲音信號(hào)的D0A。可以使用DOA估計(jì)算法,例如MUSIC算法實(shí)現(xiàn)DOA估計(jì)。DOA估計(jì)塊603的輸出(D0A估計(jì)信息)可以作為輸入分別發(fā)送到降噪塊601和去混響塊602以基于DOA信息實(shí)現(xiàn)改進(jìn)的降噪和去混響。來(lái)自每個(gè)麥克風(fēng)的收集的信號(hào)還可以發(fā)送到降噪塊601,在降噪塊601中可以使用DOA信息進(jìn)行降噪過(guò)程。降噪塊601可以將處理的信號(hào)轉(zhuǎn)發(fā)到去混響塊602,去混響塊602可以使用DOA信息進(jìn)一步處理聲音信號(hào)以消除或降低聲音中的任意混響效果,并且隨后轉(zhuǎn)發(fā)清晰的聲音作為輸出。
[0043]圖7示出了 3D視頻捕捉系統(tǒng)700的實(shí)施例,基于平板電腦設(shè)計(jì)400,該視頻捕捉系統(tǒng)可用于平板電腦401中。3D視頻捕捉系統(tǒng)700可包括方向檢測(cè)設(shè)備701、耦合到方向檢測(cè)設(shè)備701的攝像頭配置設(shè)備702以及耦合到攝像頭配置設(shè)備702的多個(gè)攝像頭703至706。攝像頭703至706可能是,例如對(duì)應(yīng)于攝像頭404的3D攝像頭。方向檢測(cè)設(shè)備704可用于提供方向/旋轉(zhuǎn)信息,例如類似方向檢測(cè)設(shè)備504。例如,方向檢測(cè)設(shè)備704可包括加速計(jì)、其它方向/旋轉(zhuǎn)檢測(cè)設(shè)備、臉部/嘴部識(shí)別設(shè)備,或其組合,其可用來(lái)估計(jì)平板電腦相對(duì)于用戶的位置/方向信息。
[0044]方向檢測(cè)設(shè)備701可以向攝像頭配置設(shè)備702發(fā)送估計(jì)的位置信息數(shù)據(jù),其可以用于(例如,根據(jù)位置信息)從攝像頭703至706選擇正確的或合適的攝像頭對(duì)。在用戶坐在攝像頭前面的假設(shè)下選擇攝像頭,這可能是平板電腦用戶的典型場(chǎng)景或最一般的情況。例如,如果平板電腦相對(duì)于用戶的臉部旋轉(zhuǎn)約90度(圖4(d)所示),選擇的正確的攝像頭對(duì)可能是位于頂部或底部邊緣上(在圖4(a)的初始(垂直)位置)的攝像頭。
[0045]圖8示出了錄音方法800的實(shí)施例的流程圖,其可以在平板電腦401中實(shí)施。例如,可使用錄音系統(tǒng)500實(shí)施錄音方法800。方法800可開(kāi)始于方框810,在方框810,可以檢測(cè)平板電腦的位置。方向檢測(cè)設(shè)備504可以檢測(cè)位置/方向。在方框820,可以基于位置信息調(diào)整平板電腦的麥克風(fēng)。例如,麥克風(fēng)調(diào)整設(shè)備505可以控制麥克風(fēng)501 (或麥克風(fēng)陣列)的最大傳感角度。在方框830,可以(例如,由至少兩個(gè)麥克風(fēng)501)記錄聲音信號(hào)。在方框840,可以基于位置信息估計(jì)信號(hào)的D0A。例如,DOA估計(jì)塊603可以基于位置信息實(shí)施算法以獲取D0A。在方框850,可以基于DOA估計(jì)降低信號(hào)中的噪聲。降噪塊601可以使用DOA估計(jì)以降低或消除信號(hào)中的噪聲。在方框860,可以基于DOA估計(jì)消除信號(hào)中的混響效果。例如,去混響塊602可以使用DOA估計(jì)以去除信號(hào)中的混響效果。在方框870,可以傳輸清晰的聲音。清晰的聲音可以通過(guò)去除檢測(cè)的聲音信號(hào)中的噪聲、混響效果和/或其它錯(cuò)誤的結(jié)果產(chǎn)生。方法800隨后可以結(jié)束。
[0046]圖9示出了 3D視頻捕捉方法900的實(shí)施例,其可以在平板電腦401中實(shí)施。例如,3D視頻捕捉方法900可使用3D視頻捕捉系統(tǒng)700實(shí)施。方法900可開(kāi)始于方框910,在方框910可以檢測(cè)平板電腦的位置。方向檢測(cè)設(shè)備701可以檢測(cè)位置/方向。在方框920,可以基于位置信息配置多個(gè)攝像頭。例如,攝像頭配置設(shè)備702可以根據(jù)位置信息從攝像頭703至706選擇合適的攝像頭對(duì)。在方框930,(例如,選擇的攝像頭)可以捕捉視頻/圖像。在方框940,可以使用3D視頻/圖像處理方案處理捕捉的視頻/圖像。在方框950,可以傳輸3D視頻/圖像。方法900隨后可以結(jié)束。
[0047]在一些實(shí)施例中,上述部件可在任何通用電腦系統(tǒng)或智能設(shè)備部件上實(shí)施,其具有足夠的處理能力、存儲(chǔ)資源和吞吐能力來(lái)處理其上的必要工作量。圖10示出了一種典型的通用電腦系統(tǒng)1000,其適用于實(shí)施本文所揭示的部件的一項(xiàng)或多項(xiàng)實(shí)施例。電腦系統(tǒng)1000包括處理器1002(可稱為中央處理器單元或CPU),其與包括輔助存儲(chǔ)器1004、只讀存儲(chǔ)器(ROM) 1006、隨機(jī)存取存儲(chǔ)器(RAM) 1008的存儲(chǔ)裝置,輸入/輸出(I/O) 1010和網(wǎng)絡(luò)連接裝置1012進(jìn)行通信。處理器1002可作為一個(gè)或多個(gè)CPU芯片實(shí)施,或者可以是一個(gè)或多個(gè)專用集成電路(ASIC)的一部分。
[0048]輔助存儲(chǔ)器1004通常由一個(gè)或多個(gè)磁盤驅(qū)動(dòng)器或磁帶驅(qū)動(dòng)器組成,用于數(shù)據(jù)的非易失性存儲(chǔ),且如果RAM1008的大小不足以保存所有工作數(shù)據(jù),那么所述輔助存儲(chǔ)器還用作溢流數(shù)據(jù)存儲(chǔ)設(shè)備。輔助存儲(chǔ)器1004可以用于存儲(chǔ)程序,當(dāng)選擇執(zhí)行這些程序時(shí),所述程序?qū)⒓虞d到RAM1008中。R0M1006用于存儲(chǔ)在程序執(zhí)行期間讀取的指令以及可能讀取的數(shù)據(jù)。R0M1006為非易失性存儲(chǔ)設(shè)備,其存儲(chǔ)容量相對(duì)于輔助存儲(chǔ)器1004的較大存儲(chǔ)容量而言通常較小。RAM1008用于存儲(chǔ)易失性數(shù)據(jù),并且可能用于存儲(chǔ)指令。R0M1006和RAM1008兩者的存取速度通常比輔助存儲(chǔ)器1004的存取速度快。[0049]本發(fā)明公開(kāi)至少一項(xiàng)實(shí)施例,且所屬領(lǐng)域的普通技術(shù)人員對(duì)所述實(shí)施例和/或所述實(shí)施例的特征作出的變化、組合和/或修改均在本發(fā)明公開(kāi)的范圍內(nèi)。因組合、合并和/或省略所述實(shí)施例的特征而得到的替代性實(shí)施例也在本發(fā)明的范圍內(nèi)。應(yīng)當(dāng)理解的是,本發(fā)明已明確闡明了數(shù)值范圍或限制,此類明確的范圍或限制應(yīng)包括涵蓋在上述范圍或限制(如從大約I至大約10的范圍包括2、3、4等;大于0.10的范圍包括0.11,0.12,0.13等)內(nèi)的類似數(shù)量級(jí)的迭代范圍或限制。例如,每當(dāng)公開(kāi)具有下限R1和上限Ru的數(shù)值范圍時(shí),具體是公開(kāi)落入所述范圍內(nèi)的任何數(shù)字。具體而言,特別公開(kāi)所述范圍內(nèi)的以下數(shù)字:R =R^kMRu-R1),其中k為從I %到100%范圍內(nèi)以1%遞增的變量,即,k為1%、2%、3%、4%,7%,...,70%,71%,72%,...、97%、96%、97%、98%、99%或 100%。此外,還特此公開(kāi)了,上文定義的兩個(gè)R值所定義的任何數(shù)值范圍。相對(duì)于權(quán)利要求的某一要素,術(shù)語(yǔ)“可選擇”的使用表示該要素可以是“需要的”,或者也可以是“不需要的”,二者均在所述權(quán)利要求的范圍內(nèi)。使用如“包括”、“包含”和“具有”等較廣術(shù)語(yǔ)應(yīng)被理解為提供對(duì)如“由...組成”、“基本上由...組成”以及“大體上由...組成”等較窄術(shù)語(yǔ)的支持。因此,保護(hù)范圍不受上文所述的限制,而是由所附權(quán)利要求書(shū)定義,所述范圍包含所附權(quán)利要求書(shū)的標(biāo)的物的所有等效物。每項(xiàng)和每條權(quán)利要求作為進(jìn)一步公開(kāi)的內(nèi)容并入說(shuō)明書(shū)中,且權(quán)利要求書(shū)是本發(fā)明的實(shí)施例。所述揭示內(nèi)容中的參考的論述并不是承認(rèn)其為現(xiàn)有技術(shù),尤其是具有在本申請(qǐng)案的在先申請(qǐng) 優(yōu)先權(quán)日:期之后的
【公開(kāi)日】期的任何參考。本發(fā)明中所引用的所有專利、專利申請(qǐng)案和公開(kāi)案的揭示內(nèi)容特此以引用的方式并入本文本中,其提供補(bǔ)充本發(fā)明的示例性、程序性或其他細(xì)節(jié)。
[0050]雖然本發(fā)明中已提供若干實(shí)施例,但應(yīng)理解,在不脫離本發(fā)明的精神或范圍的情況下,本發(fā)明所公開(kāi)的系統(tǒng)和方法可以以許多其他特定形式來(lái)體現(xiàn)。本發(fā)明的實(shí)例應(yīng)被視為說(shuō)明性而非限制性的,且本發(fā)明并不限于本文本所給出的細(xì)節(jié)。例如,各種元件或部件可以在另一系統(tǒng)中組合或合并,或者某些特征可以省略或不實(shí)施。
[0051 ] 此外,在不 脫離本發(fā)明的范圍的情況下,各種實(shí)施例中描述和說(shuō)明為離散或單獨(dú)的技術(shù)、系統(tǒng)、子系統(tǒng)和方法可以與其他系統(tǒng)、模塊、技術(shù)或方法進(jìn)行組合或合并。展示或論述為彼此耦接或直接耦接或通信的其他項(xiàng)也可以采用電方式、機(jī)械方式或其他方式通過(guò)某一接口、裝置或中間部件間接地耦接或通信。其他變化、替代和改變的示例可以由本領(lǐng)域的技術(shù)人員在不脫離本文精神和所公開(kāi)的范圍的情況下確定。
【權(quán)利要求】
1.一種計(jì)算系統(tǒng),其特征在于,包括: 方向檢測(cè)設(shè)備,用于檢測(cè)包括計(jì)算系統(tǒng)的位置和方向的位置信息; 耦合到所述方向檢測(cè)設(shè)備的多傳感器系統(tǒng),其中所述多傳感器系統(tǒng)用于捕捉環(huán)境輸入數(shù)據(jù),所述多傳感器系統(tǒng)包括音頻捕捉系統(tǒng)和三維(3D)圖像捕捉系統(tǒng)中的至少一個(gè),并且環(huán)境輸入數(shù)據(jù)包括音頻和圖像中的至少一個(gè)。 至少一個(gè)耦合到所述方向檢測(cè)設(shè)備的信號(hào)處理部件,其中所述處理器用于基于所述位置信息修改所述捕捉的環(huán)境輸入數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述音頻捕捉系統(tǒng)用于檢測(cè)聲音信號(hào)以及所述的至少一個(gè)信號(hào)處理部件用于基于所述計(jì)算系統(tǒng)的所述位置信息修改所述聲音信號(hào)。
3.根據(jù)權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述3D圖像捕捉系統(tǒng)用于捕捉圖像以及所述的至少一個(gè)信號(hào)處理部件用于基于所述位置信息修改所述圖像。
4.根據(jù)權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述音頻捕捉系統(tǒng)包括: 至少兩個(gè)用于檢測(cè)聲音信號(hào)的麥克風(fēng),其中所述至少一個(gè)信號(hào)處理部件耦合到所述麥克風(fēng)并且用于降低所述檢測(cè)的聲音信號(hào)中的噪聲。
5.根據(jù)權(quán)利要 求4所述的計(jì)算系統(tǒng),其特征在于,所述兩個(gè)麥克風(fēng)是兩個(gè)單向麥克風(fēng)。
6.根據(jù)權(quán)利要求4所述的計(jì)算系統(tǒng),其特征在于,所述兩個(gè)麥克風(fēng)對(duì)應(yīng)于至少一個(gè)麥克風(fēng)陣列設(shè)備。
7.根據(jù)權(quán)利要求4所述的計(jì)算系統(tǒng),其特征在于,所述檢測(cè)的聲音信號(hào)由所述至少一個(gè)信號(hào)處理部件進(jìn)一步處理以實(shí)施聲音識(shí)別、編碼和傳輸中的至少一種。
8.根據(jù)權(quán)利要求4所述的計(jì)算系統(tǒng),其特征在于,所述音頻捕捉系統(tǒng)進(jìn)一步包括: 耦合到所述至少一個(gè)信號(hào)處理部件的麥克風(fēng)調(diào)整設(shè)備,用于根據(jù)所述位置信息控制所述麥克風(fēng)的最大傳感角度。
9.根據(jù)權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述方向檢測(cè)設(shè)備包括加速計(jì)和方向/旋轉(zhuǎn)檢測(cè)設(shè)備中的至少一個(gè),所述方向/旋轉(zhuǎn)檢測(cè)設(shè)備用于提供方向/旋轉(zhuǎn)信息。
10.根據(jù)權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述3D圖像捕捉系統(tǒng)包括: 至少兩個(gè)攝像頭,每個(gè)用于捕捉圖像;以及 耦合到所述攝像頭的攝像頭配置設(shè)備,用于布置或選擇所述攝像頭以正確地捕捉3D圖像。
11.根據(jù)權(quán)利要求10所述的計(jì)算系統(tǒng),其特征在于,所述攝像頭是接近所述計(jì)算系統(tǒng)的不同邊緣的攝像頭。
12.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)系統(tǒng),其特征在于,所述音頻捕捉系統(tǒng)和所述3D圖像捕捉系統(tǒng)是平板電腦系統(tǒng)的一部分,用于使能視頻會(huì)議、語(yǔ)音呼叫、人機(jī)界面和助聽(tīng)器中的至少一個(gè)。
13.根據(jù)權(quán)利要求1所述的計(jì)算系統(tǒng),其特征在于,所述位置信息用于獲取基本上沒(méi)有噪聲和基本上沒(méi)有混響效果的基本上清晰的聲音數(shù)據(jù)以及相對(duì)于用戶而言位于所述平板電腦的多個(gè)方向的任意一個(gè)方向的3D圖像。
14.錄音系統(tǒng),其特征在于,包括: 耦合到一個(gè)或多個(gè)麥克風(fēng)的到達(dá)方向(DOA)估計(jì)部件,用于使用接收的方向信息估計(jì)檢測(cè)的聲音信號(hào)的DOA ; 耦合到所述DOA估計(jì)部件的降噪部件,用于使用所述DOA估計(jì)降低所述檢測(cè)的聲音信號(hào)中的噪聲;以及 耦合到所述降噪部件和所述DOA估計(jì)部件的去混響部件,用于使用所述DOA估計(jì)去除所述檢測(cè)的聲音信號(hào)中的混響效果。
15.根據(jù)權(quán)利要求14所述的錄音系統(tǒng),其特征在于,所述方向信息是由耦合到所述DOA估計(jì)部件的方向檢測(cè)設(shè)備提供的。
16.根據(jù)權(quán)利要求14所述的錄音系統(tǒng),其特征在于,所述DOA估計(jì)部件基于多重信號(hào)分類(MUSIC)算法和所述方向信息估計(jì)所述檢測(cè)的聲音信號(hào)的D0A。
17.—種三維(3D)視頻捕捉系統(tǒng),其特征在于,包括: 耦合到至少兩個(gè)攝像頭的攝像頭配置設(shè)備,用于基于所述3D視頻捕捉系統(tǒng)的檢測(cè)的方向信息布置所述攝像頭中的至少一些攝像頭以正確地捕捉3D視頻和3D圖像中的一個(gè);以及 耦合到所述攝像頭配置設(shè)備的方向檢測(cè)設(shè)備,用于檢測(cè)所述方向信息。
18.根據(jù)權(quán)利要求17所述的3D視頻捕捉系統(tǒng),其特征在于,所述方向信息是由耦合到所述攝像頭配置設(shè)備的方向檢測(cè)設(shè)備提供的。
19.根據(jù)權(quán)利要求17所述的3D視頻捕捉系統(tǒng),其特征在于,用于捕捉所述3D視頻或圖像的所述選擇的攝像頭包括兩個(gè)接近平板電腦設(shè)備的相反邊緣的攝像頭。
20.根據(jù)權(quán)利要求17所述的視頻捕捉系統(tǒng),其特征在于,所述兩個(gè)攝像頭中的至少一個(gè)攝像頭包括3D攝像頭。
21.一種在便攜設(shè)備上實(shí)施的錄音方法,其特征在于,包括: 檢測(cè)所述便攜設(shè)備的方向; 基于所述檢測(cè)的方向調(diào)整麥克風(fēng)陣列設(shè)備; 使用所述調(diào)整的麥克風(fēng)陣列設(shè)備記錄聲音信號(hào);以及 基于所述檢測(cè)的方向估計(jì)所述聲音信號(hào)的到達(dá)方向(DOA)。
22.根據(jù)權(quán)利要求21所述的在所述便攜設(shè)備上實(shí)施的所述錄音方法,其特征在于,進(jìn)一步包括: 基于所述DOA估計(jì)降低所述聲音信號(hào)中的噪聲; 基于所述DOA估計(jì)消除所述聲音信號(hào)中的去混響效果;以及 傳輸所得的清晰的聲音信號(hào)。
23.權(quán)利要求22所述的在所述便攜設(shè)備上實(shí)施的所述錄音方法進(jìn)一步包括在為編碼、語(yǔ)音識(shí)別和聲音增強(qiáng)的至少一個(gè)傳輸之前處理所述清晰的聲音。
24.權(quán)利要求21所述的在所述便攜設(shè)備上實(shí)施的所述錄音方法,其特征在于,相對(duì)于所述便攜設(shè)備的用戶的所述面部或嘴部,通過(guò)控制所述麥克風(fēng)陣列設(shè)備的最大傳感角度調(diào)整所述麥克風(fēng)陣列設(shè)備。
25.一種在便攜設(shè)備上實(shí)施的三維(3D)視頻捕捉方法,其特征在于,包括: 檢測(cè)所述便攜設(shè)備的方向; 基于所述檢測(cè)的方向配置多個(gè)攝像頭;以及 使用所述配置的攝像頭捕捉視頻或圖像。
26.根據(jù)權(quán)利要求25所述的3D視頻捕捉方法,其特征在于,進(jìn)一步包括: 使用3D視頻或圖像處理方案處理所述捕捉的視頻或圖像;以及 傳輸所述3D視頻或圖像。
27.根據(jù)權(quán)利要求25所述的3D視頻捕捉方法,其特征在于,通過(guò)選擇所述攝像頭的子集方式配置所述攝像頭用于根據(jù)所述便攜設(shè)備的所述檢測(cè)的方向捕捉所述視頻或圖像以獲取正確的3D視 頻或圖像。
【文檔編號(hào)】H04N5/232GK104012074SQ201280061091
【公開(kāi)日】2014年8月27日 申請(qǐng)日期:2012年12月12日 優(yōu)先權(quán)日:2011年12月12日
【發(fā)明者】周炯, 唐·考克 申請(qǐng)人:華為技術(shù)有限公司