使用面部識(shí)別調(diào)節(jié)揚(yáng)聲器的制造方法
【技術(shù)領(lǐng)域】
[0001]本公開(kāi)涉及可變向揚(yáng)聲器,且更具體來(lái)說(shuō),涉及使用面部識(shí)別來(lái)調(diào)節(jié)可變向揚(yáng)聲器的方向。
【背景技術(shù)】
[0002]固定揚(yáng)聲器通常用于在車(chē)輛中輸出音頻。例如,機(jī)動(dòng)車(chē)輛(諸如汽車(chē))通常具有固定布置的多個(gè)揚(yáng)聲器以為車(chē)輛中的駕駛員和乘客輸出音頻(例如,音樂(lè)、有聲書(shū)、廣播節(jié)目等)。然而,固定揚(yáng)聲器不能響應(yīng)于乘客處于收聽(tīng)環(huán)境中的不同位置進(jìn)行調(diào)節(jié)。一個(gè)特定揚(yáng)聲器布置可能最適合于某一高度的乘客,但并非最適合于更高或更矮的乘客。此外,固定揚(yáng)聲器布置中的音頻輸出的方向不會(huì)根據(jù)車(chē)輛中的乘客的數(shù)量而改變。例如,如果當(dāng)四名乘客在車(chē)輛中時(shí),揚(yáng)聲器布置被設(shè)計(jì)成提供最佳性能,則當(dāng)少于四名乘客在車(chē)輛中時(shí),這個(gè)布置的性能可能不如揚(yáng)聲器的其他布置那么好。
【發(fā)明內(nèi)容】
[0003]根據(jù)本公開(kāi)的一個(gè)實(shí)施方案,一種方法包括基于由攝像頭捕獲的圖像數(shù)據(jù)接收用戶的位置;以及基于所述用戶的位置識(shí)別一個(gè)或多個(gè)空間坐標(biāo)。所述方法還包括基于所述一個(gè)或多個(gè)坐標(biāo)產(chǎn)生用于調(diào)節(jié)至少一個(gè)致動(dòng)器的控制信號(hào),所述控制信號(hào)被配置成改變揚(yáng)聲器的定向,使得所述揚(yáng)聲器的音頻輸出區(qū)域包括所述一個(gè)或多個(gè)坐標(biāo)。
[0004]本公開(kāi)的另一實(shí)施方案為一種系統(tǒng),其包括可變向揚(yáng)聲器、機(jī)械耦合到所述可變向揚(yáng)聲器的致動(dòng)器,以及計(jì)算設(shè)備。所述計(jì)算設(shè)備被配置成基于由攝像頭捕獲的圖像數(shù)據(jù)接收用戶的位置;以及基于所述用戶的位置識(shí)別一個(gè)或多個(gè)空間坐標(biāo)。所述計(jì)算設(shè)備還被配置成基于所述一個(gè)或多個(gè)坐標(biāo)產(chǎn)生用于調(diào)節(jié)所述致動(dòng)器的控制信號(hào),所述控制信號(hào)被配置成改變所述可變向揚(yáng)聲器的定向,使得所述可變向揚(yáng)聲器的音頻輸出區(qū)域包括所述一個(gè)或多個(gè)坐標(biāo)。
[0005]本公開(kāi)的另一實(shí)施方案為一種用于調(diào)節(jié)揚(yáng)聲器的計(jì)算機(jī)程序產(chǎn)品,其中所述計(jì)算機(jī)程序產(chǎn)品包括可由一個(gè)或多個(gè)計(jì)算機(jī)處理器執(zhí)行的計(jì)算機(jī)可讀程序代碼。所述程序代碼被配置成基于由攝像頭捕獲的圖像數(shù)據(jù)接收用戶的位置;以及基于所述用戶的位置識(shí)別一個(gè)或多個(gè)空間坐標(biāo)。此外,所述程序代碼被配置成基于所述一個(gè)或多個(gè)坐標(biāo)產(chǎn)生用于調(diào)節(jié)至少一個(gè)致動(dòng)器的控制信號(hào),所述控制信號(hào)被配置成改變所述揚(yáng)聲器的定向,使得所述揚(yáng)聲器的音頻輸出區(qū)域包括所述一個(gè)或多個(gè)坐標(biāo)。
【附圖說(shuō)明】
[0006]圖1是用于基于用戶的位置調(diào)節(jié)可變向揚(yáng)聲器的系統(tǒng);
[0007]圖2是用于基于面部識(shí)別調(diào)節(jié)揚(yáng)聲器的系統(tǒng)的方框圖;
[0008]圖3是用于基于面部識(shí)別調(diào)節(jié)揚(yáng)聲器的方法;
[0009]圖4A至圖4C圖示基于面部識(shí)別來(lái)識(shí)別位置以引導(dǎo)揚(yáng)聲器;
[0010]圖5A和圖5B圖示基于車(chē)輛中的乘客的數(shù)量調(diào)節(jié)揚(yáng)聲器布置;
[0011]圖6A和圖6B圖示基于車(chē)輛中的乘客的數(shù)量調(diào)節(jié)揚(yáng)聲器布置;
[0012]圖7是用于識(shí)別路徑以基于面部識(shí)別調(diào)節(jié)可變向揚(yáng)聲器的系統(tǒng)。
[0013]為了便于理解,在可能的情況下使用相同的參考數(shù)字指定圖中所共有的相同的元件。可以預(yù)期的是,一個(gè)實(shí)施方案中所公開(kāi)的元件可以有利地用于其他實(shí)施方案,而無(wú)需特別指明。這里所指的附圖不應(yīng)被理解為按比例繪制,除非特別注明。另外,為了清楚地呈現(xiàn)和解釋,附圖通常被簡(jiǎn)化并且細(xì)節(jié)或組件被省略。附圖和討論用來(lái)解釋下面討論的原理,其中相同的標(biāo)號(hào)表示相同的元件。
【具體實(shí)施方式】
[0014]本文的實(shí)施方案描述了一種基于用戶的位置調(diào)節(jié)的音頻系統(tǒng)。本文所描述的音頻系統(tǒng)根據(jù)用戶的位置或數(shù)量調(diào)節(jié)一個(gè)或多個(gè)揚(yáng)聲器的音頻輸出的方向,而不是依賴于不能改變其音頻輸出的方向的固定揚(yáng)聲器。為此,音頻系統(tǒng)可以包括攝像頭;以及面部識(shí)別應(yīng)用,其識(shí)別在攝像頭前面的用戶的位置和/或用戶的數(shù)量。使用這個(gè)信息,音頻系統(tǒng)調(diào)節(jié)耦合到揚(yáng)聲器的一個(gè)或多個(gè)致動(dòng)器以改變揚(yáng)聲器的音頻輸出的方向一即,揚(yáng)聲器面向的方向。例如,面部識(shí)別應(yīng)用可以識(shí)別用戶在3D空間中的位置,并且作為響應(yīng),音頻系統(tǒng)調(diào)節(jié)揚(yáng)聲器使得其面向該位置。隨著用戶繼續(xù)移動(dòng)或移位,音頻系統(tǒng)可以繼續(xù)調(diào)節(jié)揚(yáng)聲器以優(yōu)化系統(tǒng)的性能。
[0015]在一個(gè)方面,面部識(shí)別應(yīng)用檢測(cè)在攝像頭前面的多個(gè)用戶。音頻系統(tǒng)可以基于用戶的各個(gè)位置調(diào)節(jié)揚(yáng)聲器。例如,如果揚(yáng)聲器被移動(dòng)使得音頻輸出的方向是在兩個(gè)用戶之間,則可以實(shí)現(xiàn)最佳性能。或者,音頻系統(tǒng)可以包括多個(gè)可調(diào)式揚(yáng)聲器,并且調(diào)節(jié)一個(gè)揚(yáng)聲器來(lái)面向用戶中的一個(gè)并調(diào)節(jié)另一個(gè)揚(yáng)聲器來(lái)面向另一個(gè)揚(yáng)聲器。不管用戶的數(shù)量或位置,音頻系統(tǒng)可以被預(yù)編程來(lái)改變揚(yáng)聲器的方向以便優(yōu)化(即,改進(jìn))音頻性能。
[0016]圖1是用于基于用戶的位置調(diào)節(jié)可變向揚(yáng)聲器105的音頻系統(tǒng)100。系統(tǒng)100包括揚(yáng)聲器105、致動(dòng)器110、攝像頭115和用戶120。如圖所示,揚(yáng)聲器105可以是響應(yīng)于電信號(hào)輸入產(chǎn)生聲音的任何設(shè)備。揚(yáng)聲器105耦合到致動(dòng)器110,其沿著一個(gè)或多個(gè)運(yùn)動(dòng)軸(例如,上下、左右、對(duì)角、圓周運(yùn)動(dòng)等)改變揚(yáng)聲器105的音頻輸出的方向。這里所示的致動(dòng)器110是可以收縮或延伸以調(diào)節(jié)揚(yáng)聲器105面向的方向的活塞致動(dòng)器。通過(guò)控制兩個(gè)致動(dòng)器IlOA和110B,系統(tǒng)100移動(dòng)揚(yáng)聲器105來(lái)面向特定點(diǎn)或區(qū)域。例如,在揚(yáng)聲器105前面的區(qū)域可以被分為2D或3D網(wǎng)格,其中通過(guò)調(diào)節(jié)致動(dòng)器110,系統(tǒng)100移動(dòng)揚(yáng)聲器105來(lái)面向2D/3D網(wǎng)格內(nèi)的點(diǎn)或區(qū)域。此外,在一個(gè)示例中,攝像頭115的定向保持固定,而揚(yáng)聲器105的定向改變成面向點(diǎn)或區(qū)域。
[0017]這里所示的活塞致動(dòng)器110只是合適的致動(dòng)器的一個(gè)示例。致動(dòng)器110可以使用球窩、螺釘、齒輪系統(tǒng)、鏈條等來(lái)調(diào)節(jié)揚(yáng)聲器105的方向。另外,致動(dòng)器110可以使用用于產(chǎn)生運(yùn)動(dòng)的任何類型的驅(qū)動(dòng)系統(tǒng),諸如機(jī)械、電氣、液壓或氣動(dòng)系統(tǒng)。盡管圖1圖示兩個(gè)致動(dòng)器110,但是在其他示例中,揚(yáng)聲器105可以僅由一個(gè)致動(dòng)器110移動(dòng)。在一個(gè)方面,致動(dòng)器110可能不直接附接到揚(yáng)聲器105。例如,電纜可以用于將由遠(yuǎn)程致動(dòng)器110產(chǎn)生的力轉(zhuǎn)移到揚(yáng)聲器105。這樣做可能會(huì)減少揚(yáng)聲器105的形狀因數(shù),并且允許揚(yáng)聲器105適應(yīng)在空間限制區(qū)域,諸如在儀表板或在分離車(chē)輛的擋風(fēng)玻璃和門(mén)的支柱。
[0018]攝像頭115可以包括一個(gè)或多個(gè)傳感器,其用于基于接收的電磁信號(hào)(例如,紅外或可見(jiàn)光信號(hào))捕獲圖像。例如,攝像頭115可以包括用于在約390nm至700nm(S卩,可見(jiàn)光)下檢測(cè)電磁信號(hào)的可見(jiàn)光傳感器、使用紅外投影儀和傳感器來(lái)捕獲3D空間的圖像的測(cè)距系統(tǒng),或兩者的組合。由攝像頭115捕獲的信息可以是2D或3D信息。在一個(gè)方面,深度(S卩,用戶120與攝像頭115之間的距離)可以是已知的。例如,音頻系統(tǒng)可以被設(shè)計(jì)用于一個(gè)房間,其中用戶120坐在距攝像頭115和揚(yáng)聲器105預(yù)定義的距離的沙發(fā)上。因此,僅使用2D信息,音頻系統(tǒng)110基于在沙發(fā)上的用戶120的位置調(diào)節(jié)揚(yáng)聲器105?;蛘撸疃瓤赡懿皇且阎?,因此,攝像頭110捕獲3D信息來(lái)確定用戶120與攝像頭115之間的距離。
[0019]使用由攝像頭115捕獲的信息,音頻系統(tǒng)100跟蹤用戶120在ID、2D或3D空間中的運(yùn)動(dòng)?;谟脩?20的位置(例如,用戶的臉部或耳朵的位置),系統(tǒng)100將用于改變揚(yáng)聲器105的方向的指令提供給致動(dòng)器110以便優(yōu)化音頻系統(tǒng)100的性能。例如,如果揚(yáng)聲器105面向用戶120的耳朵,則可以獲得最佳性能。當(dāng)用戶120移動(dòng)時(shí),致動(dòng)器110改變揚(yáng)聲器105的方向以繼續(xù)指向用戶的耳朵在3D空間中的位置。
[0020]圖2是用于基于面部識(shí)別調(diào)節(jié)揚(yáng)聲器105的系統(tǒng)200的方框圖。系統(tǒng)200包括攝像頭115、計(jì)算設(shè)備210和揚(yáng)聲器系統(tǒng)235。攝像頭115包括用于收集深度信息的深度傳感器205,所述深度信息用于確定攝像頭115與用戶之間的距離。然而,如上所述,在其他示例中,攝像頭115可能不收集深度信息。
[0021]攝像頭115耦合到計(jì)算設(shè)備210,計(jì)算設(shè)備210包括處理器215和存儲(chǔ)器220。計(jì)算設(shè)備210可以是通用計(jì)算設(shè)備,諸如膝上型計(jì)算機(jī)、平板計(jì)算機(jī)、服務(wù)器、臺(tái)式計(jì)算機(jī)等,或用于執(zhí)行本文所描述的方面和示例的專用計(jì)算設(shè)備。處理器215可以是適合于執(zhí)行本文所描述的功能的任何處理元件。處理器215可以代表單個(gè)處理元件或多個(gè)處理元件,其可以各自包括一個(gè)或多個(gè)處理核心。存儲(chǔ)器220可以是易失性或非易失性存儲(chǔ)器,其可以包括硬盤(pán)、RAM、閃速存儲(chǔ)器等。如這里所示,存儲(chǔ)器220包括面部識(shí)別應(yīng)用225和致動(dòng)器控制器230。面部識(shí)別應(yīng)用225接收由攝像頭115捕獲的2D或3D數(shù)據(jù),并且識(shí)別在攝像頭115前面的區(qū)域中的用戶。面部識(shí)別應(yīng)用225可以產(chǎn)生一個(gè)或多個(gè)坐標(biāo),其識(shí)別用戶在2D或3D空間中的位置(例如,用戶的臉部的位置)。使用這些坐標(biāo),致動(dòng)器控制器230確定致動(dòng)器110的相應(yīng)的控制信號(hào),以便移動(dòng)揚(yáng)聲器105以優(yōu)化系統(tǒng)200的性能。例如,如果在揚(yáng)聲器105面向用戶的耳朵的情況下性能得到改進(jìn),則致動(dòng)器控制器240確定致使揚(yáng)聲器105面向在用戶的耳朵方向上的控制信號(hào)。
[0022]在一個(gè)方面,致動(dòng)器控制器230可以包括變換函數(shù)或算法,其用于將由面部識(shí)別應(yīng)用225提供的坐標(biāo)轉(zhuǎn)換成致動(dòng)器110的控制信號(hào)。例如,應(yīng)用225可以返回一個(gè)或多個(gè)x、y和z坐標(biāo),其識(shí)別用戶在攝像頭115前面的位置。變換函數(shù)可以使用x、y和z坐標(biāo)作為輸入,并且輸出致動(dòng)器110的引起揚(yáng)聲器105面向用戶的相應(yīng)的控制信號(hào)??梢栽谂渲秒A段期間產(chǎn)生變換函數(shù),其中自由空間中的一個(gè)或多個(gè)點(diǎn)被映射到致動(dòng)器110的特定設(shè)置。這些映射接著可以被一般化以形成變換函數(shù),其可以將