自由空間中的一組坐標映射到致動器110的相應(yīng)的設(shè)置中。然而,這僅僅是產(chǎn)生變換函數(shù)的一個非限制性方式,所述變換函數(shù)用于將2D或30坐標轉(zhuǎn)換成在所接收坐標的方向上指向揚聲器105的致動器信號。
[0023]在一個方面,致動器控制器230可以使用由面部識別應(yīng)用225提供的坐標來識別不同的坐標。例如,面部識別應(yīng)用225可以返回用戶的鼻子在3D空間中的坐標。然而,為了使揚聲器105指向用戶的耳朵,致動器控制器230可以使用預(yù)定義的調(diào)節(jié)參數(shù)來估計用戶的耳朵的可能的位置。這個調(diào)節(jié)參數(shù)可以基于用戶距攝像頭115的距離而變化一例如,當用戶更靠近攝像頭115時,調(diào)節(jié)參數(shù)可能會更大。通過使用調(diào)節(jié)參數(shù)來改變坐標,致動器控制器230可以接著產(chǎn)生對應(yīng)于例如用戶的耳朵的坐標,其可以用作變換函數(shù)的輸入以確定致動器控制信號。
[0024]在另一示例中,致動器控制器230根據(jù)檢測到多少用戶來改變由面部識別應(yīng)用225提供的坐標。例如,如果應(yīng)用225輸出三個不同的用戶的坐標,則致動器控制器230可以對坐標求平均值以識別用戶之間的位置。以這種方式,不管系統(tǒng)200中的用戶的數(shù)量或位置,致動器控制器230可以被設(shè)計成改變由面部識別應(yīng)用225提供的一個(或多個)坐標以便調(diào)節(jié)揚聲器105。
[0025]揚聲器系統(tǒng)235包括圖1中所描述的致動器110和揚聲器105。揚聲器系統(tǒng)235可以包括封裝這兩個組件的單一主體,或這些組件的支撐結(jié)構(gòu)。在一個示例中,致動器110可以遠離揚聲器105,并且揚聲器系統(tǒng)235可以包括機械元件,諸如用于將力從致動器110轉(zhuǎn)移到揚聲器105的電纜、鏈條或氣動軟管。
[0026]圖3是使用面部識別調(diào)節(jié)揚聲器的方法300。為了改進理解,結(jié)合圖4A至圖4C中所示的系統(tǒng)來描述方法300的方框。在方框305,面部識別應(yīng)用225使用從攝像頭115捕獲的數(shù)據(jù)識別臉部。如圖4A的系統(tǒng)400中所示,面部識別應(yīng)用225識別圍繞用戶401的邊界框405。本文所提供的示例不限于用于基于從攝像頭115捕獲的數(shù)據(jù)識別用戶401的特定算法。在這個示例中,應(yīng)用225識別圍繞用戶401的頭部為中心的邊界框405,但在其他示例中,面部識別應(yīng)用225可以返回識別用戶的臉部的幾何中間的單個坐標,或各自對應(yīng)于用戶401的不同特征(例如,眼睛、耳朵、嘴等)的多個坐標。
[0027]面部識別應(yīng)用225將邊界框405的坐標傳輸?shù)街聞悠骺刂破?30。在方法300的方框310,致動器控制器230使用邊界框405的坐標來識別點或區(qū)域。例如,當只有一個用戶401由面部識別應(yīng)用225識別時,致動器控制器230可以將揚聲器105定向到用戶的耳朵。在一個示例中,面部識別應(yīng)用225可以識別用戶的耳朵的坐標并且將這些坐標提供到致動器控制器230。然而,在圖4A中所示的示例中,致動器控制器230使用邊界框405的坐標來計算用戶的耳朵的位置。
[0028]如圖4B的系統(tǒng)420中所示,致動器控制器230通過使用調(diào)節(jié)參數(shù)來確定耳朵的位置425,所述調(diào)節(jié)參數(shù)可以根據(jù)用戶401與攝像頭115或揚聲器105之間的距離而變化。例如,調(diào)節(jié)參數(shù)可以是從邊界框405左側(cè)的中間坐標減去的預(yù)定義值,從而產(chǎn)生耳朵的位置425的坐標。當然,調(diào)節(jié)參數(shù)的類型或值可以根據(jù)由面部識別應(yīng)用225提供的坐標而變化。即,如圖所示,相比于當應(yīng)用225輸出邊界框405時,當應(yīng)用225輸出用戶的鼻子的坐標時,需要不同的調(diào)節(jié)參數(shù)。此外,如上所述,當面部識別應(yīng)用225識別多個用戶時,致動器控制器230可以不同方式改變坐標。例如,致動器控制器230可以使用由面部識別應(yīng)用225提供的坐標來識別多個用戶之間的區(qū)域或點,而不是估計用戶的耳朵的位置425。
[0029]在方框315,致動器控制器230將使用來自應(yīng)用225的坐標識別的點或區(qū)域變換成致動器控制信號??刂破?30可以使用將點(S卩,用戶的耳朵的位置425)映射到控制信號中的變換函數(shù)或算法,所述控制信號將揚聲器105的方向改變成面向點。致動器110接收這些信號并且改變揚聲器105所面向的方向。區(qū)域410圖示在揚聲器105前面的區(qū)域,在這個區(qū)域揚聲器的音頻輸出是最大的(例如,包括來自揚聲器105的90%的音頻輸出)。如圖所示,用戶401在區(qū)域410的外部,因此可能比用戶401在區(qū)域410內(nèi)部的情況體驗更差的音頻演示。
[0030]在方框320,響應(yīng)于控制信號,致動器110調(diào)節(jié)揚聲器105所面向的方向,使得由區(qū)域410限定的音頻輸出現(xiàn)在包括用戶的耳朵的位置425,如圖4C中所示。在一個示例中,揚聲器105的方向被調(diào)節(jié),使得用戶的耳朵的位置425至少在區(qū)域410內(nèi)。即,位置425僅需要在區(qū)域410內(nèi),而不是移動揚聲器105直到揚聲器105的方向面向與位置425相交。通過不需要精確對準,當執(zhí)行可能輸出不太準確的坐標的應(yīng)用225時,系統(tǒng)450改進了用戶401的體驗并且可以能夠使用較便宜的攝像頭115或節(jié)省處理時間。然而,這些坐標可以足夠準確足以導(dǎo)出確保位置425在區(qū)域410內(nèi)的控制信號,即使揚聲器105不直接面向用戶的耳朵。此外,因為攝像頭115與揚聲器105物理分隔,所以當音頻輸出區(qū)域410改變(S卩,揚聲器105的定向被改變)時,攝像頭115的定向可以在其當前定向上保持固定。換句話說,在揚聲器105的音頻輸出區(qū)域410改變時,攝像頭115繼續(xù)面向相同的方向。
[0031]圖5A和圖5B圖示基于車輛500中的乘客調(diào)節(jié)揚聲器布置。具體來說,圖5A和圖5B圖示車輛500的前半部,而后座或后置揚聲器(如果有的話)被省略。如圖5A和圖5B中的頂視圖所示,車輛500包括攝像頭115和安裝在車輛500的儀表板上或支柱中的兩個揚聲器505。為了清楚起見,用于移動揚聲器505的致動器,以及用于處理由攝像頭115捕獲的數(shù)據(jù)并且確定致動器的控制信號的計算設(shè)備已被省略。然而,在一個示例中,計算設(shè)備可以集成到機載計算機中,所述機載計算機用于操作車輛或集成到車輛500中的信息娛樂系統(tǒng)。
[0032]基于由攝像頭115捕獲的數(shù)據(jù),計算設(shè)備中的面部識別應(yīng)用確定有多少乘客在車輛500中以及這些乘客在2D或3D空間中處于的位置。在圖5A中,計算設(shè)備確定只有位于位置510的一名乘客(S卩,駕駛員)在車輛500中。作為響應(yīng),計算設(shè)備中的致動器控制器識別用于定向揚聲器505的點或區(qū)域。
[0033]在一個方面,點或區(qū)域?qū)τ趽P聲器505A和揚聲器505B可能是相同的一一例如,兩個揚聲器均指向同一個3D點。或者,計算設(shè)備可以計算揚聲器505的不同的點或區(qū)域。例如,揚聲器505A可以指向駕駛員的左耳,而揚聲器505B指向駕駛員的右耳。這樣做允許音頻系統(tǒng)在揚聲器505上輸出不同的聲音,或使用環(huán)繞聲來為駕駛員提供更身臨其境的體驗。然而,如果為兩個揚聲器505輸出的聲音是相同的,則更優(yōu)的布置可能是將兩個揚聲器505定向在用戶前面的公共點。由于駕駛員與兩個揚聲器之間的不同的距離,如果揚聲器505A被定向到駕駛員的左耳,而揚聲器505B被定向到駕駛員的右耳,則駕駛員可能會聽到不同的聲級,這可能是不愉快的。當然,在一個示例中,計算設(shè)備可能通過在使每個揚聲器瞄準不同的耳朵時增加揚聲器505B的音頻輸出(或減小揚聲器505A的輸出)來補償這個距離差。無論如何,通過跟蹤用戶的位置510,音頻系統(tǒng)能夠調(diào)節(jié)揚聲器505以優(yōu)化音頻演示。
[0034]在圖5B中,計算設(shè)備確定有兩名乘客在車輛500中——一名乘客在位置510而另一名乘客在位置515。為了識別乘客,攝像頭115被定位成駕駛員的座椅和前右乘客的座椅均在其視圖內(nèi)。面部識別應(yīng)用掃描由攝像頭115產(chǎn)生的圖像數(shù)據(jù)以識別乘客在車輛500中的位置。因為在這個示例中有兩名乘客而不是如圖5A中所示只有一名乘客,所以音頻系統(tǒng)可以不同方式調(diào)節(jié)揚聲器。例如,計算設(shè)備可以將揚聲器505A調(diào)節(jié)成面向駕駛員,而揚聲器505B被調(diào)節(jié)成面向乘客。在一個實施方案中,揚聲器505A可以面向駕駛員的臉部的中央位置(諸如她的鼻子),使得在駕駛員的耳朵中同樣地聽到揚聲器505A的音頻輸出。類似地,揚聲器505B可以被調(diào)節(jié)成面向在位置515處的乘客的臉部的中央位置,使得在她的兩個耳朵中同樣地聽到其輸出。然而,另一種優(yōu)化的解決方案可以是使揚聲器505A和505B直接面向駕駛員或乘客的一個耳朵。所使用的特定解決方案可以根據(jù)用戶的偏好、所使用的揚聲器的類型、車輛500的特定音響效果等而變化。
[0035]圖5A和圖5B圖示計算設(shè)備改變?nèi)绾位谲囕v中的乘客的數(shù)量調(diào)節(jié)揚聲器。更一般地說,用于改進音頻系統(tǒng)的性能的特定技術(shù)可以基于有多少用戶在攝像頭115的視圖中而改變。例如,音頻系統(tǒng)可以是根據(jù)存在于房間中的用戶的數(shù)量使用不同的揚聲器布置的家庭娛樂系統(tǒng),而不是車輛。
[0036]除了考慮用戶的位置和/或識別的用戶的數(shù)量之外,計算設(shè)備可以根據(jù)指定的用戶偏好優(yōu)化系統(tǒng)的性能。例如,除了識別用戶的臉部的位置之外,面部識別應(yīng)用可以基于她的面部特征識別用戶的名稱。一旦用戶被識別,計算設(shè)備可以查找與用戶相關(guān)聯(lián)的偏好。例如,用戶A可能比用戶B更喜歡更多的低音和更少的高音?;蛘?,用戶A可能更喜歡立體聲,而用戶B更喜歡環(huán)繞聲。計算設(shè)備可以在優(yōu)化性能時考慮這些偏好。例如,當用戶A是駕駛員時,計算設(shè)備可以改變揚聲器505的低音到高音比。在一個方面,系統(tǒng)可以對由揚聲器505輸出的音頻進行其他電氣變化,諸如修改如何處理音頻信號一一例如,改變均衡、延遲等。
[0037]盡管將車輛500圖示為汽車,但是本文所描述的實施方案可以施加到其他類型的車