本實用新型涉及圖像采集技術(shù)領(lǐng)域,具體地說,涉及一種圖像采集裝置及智能機器人。
背景技術(shù):
隨著圖像傳感器性能的提高,人們通過圖像采集裝置能夠得到越來越清晰以及流暢的視頻圖像。然而,對于現(xiàn)有的圖像采集裝置來說,其通常是根據(jù)圖像采集裝置的鏡頭的固定朝向來獲取指定區(qū)域的圖像并進行顯示,當指定區(qū)域過大時,用戶往往無法獲取到自身感興趣區(qū)域的詳細圖像,這也就可能造成用戶在交互過程中漏掉某些有效信息。
技術(shù)實現(xiàn)要素:
為解決上述問題,本實用新型提供了一種圖像采集裝置,其包括:
麥克風陣列,其配置為根據(jù)獲取到的聲波信號生成對應(yīng)的音頻電信號;
聲源定位電路,其與所述麥克風陣列連接,其配置為根據(jù)所述麥克風陣列傳輸來的音頻電信號確定聲源位置信息;
全景攝像頭,其與所述聲源定位電路連接,其配置為根據(jù)所述聲源位置信息進行轉(zhuǎn)動以將自身的主視角轉(zhuǎn)動至聲源對應(yīng)方向。
根據(jù)本實用新型的一個實施例,所述圖像采集裝置還包括:
圖像顯示模塊,其與所述全景攝像頭連接,其配置為顯示所述全景攝像頭的主視角圖像。
根據(jù)本實用新型的一個實施例,所述麥克風陣列包括多個麥克風單元,所述多個麥克風單元分布在所述全景攝像頭平面的線性上。
根據(jù)本實用新型的一個實施例,所述麥克風陣列包括多個麥克風單元,所述多個麥克風單元分布在空間圍繞所述全景攝像頭的同一圓環(huán)上。
根據(jù)本實用新型的一個實施例,所述多個麥克風單元在圓環(huán)上等間距分布。
根據(jù)本實用新型的一個實施例,所述全景攝像頭布置在所述圓環(huán)的中心位置處。
本實用新型還提供了一種智能機器人,其包括如上述任一項所述的圖像采集裝置。
根據(jù)本實用新型的一個實施例,所述麥克風陣列和全景攝像頭安裝在所述智能機器人的頭部。
本實用新型所提供的圖像采集裝置能夠?qū)Πl(fā)出聲音的聲源進行定位,并根據(jù)聲源定位結(jié)果來將聲源的相關(guān)圖像進行突出顯示,相較于現(xiàn)有的圖像采集裝置,本實用新型所提供的圖像采集裝置能夠使得用戶更加容易地了解到交互環(huán)境中的敏感信息,從而提高用戶的視頻交互體驗。
本實用新型的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本實用新型而了解。本實用新型的目的和其他優(yōu)點可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
附圖說明
為了更清楚地說明本實用新型實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要的附圖做簡單的介紹:
圖1是根據(jù)本實用新型一個實施例的圖像采集裝置的結(jié)構(gòu)示意圖;
圖2是根據(jù)本實用新型一個實施例的智能機器人的應(yīng)用常用場景示意圖;
圖3是根據(jù)本實用新型另一個實施例的智能機器人的應(yīng)用常用場景示意圖;
圖4是根據(jù)本實用新型再一個實施例的智能機器人的應(yīng)用常用場景示意圖。
具體實施方式
以下將結(jié)合附圖及實施例來詳細說明本實用新型的實施方式,借此對本實用新型如何應(yīng)用技術(shù)手段來解決技術(shù)問題,并達成技術(shù)效果的實現(xiàn)過程能充分理解并據(jù)以實施。需要說明的是,只要不構(gòu)成沖突,本實用新型中的各個實施例以及各實施例中的各個特征可以相互結(jié)合,所形成的技術(shù)方案均在本實用新型的保護范圍之內(nèi)。
同時,在以下說明中,出于解釋的目的而闡述了許多具體細節(jié),以提供對本實用新型實施例的徹底理解。然而,對本領(lǐng)域的技術(shù)人員來說顯而易見的是,本實用新型可以不用這里的具體細節(jié)或者所描述的特定方式來實施。
針對現(xiàn)有的圖像采集裝置只能夠固定地采集某一方向的圖像的問題,本實用新型提供了一種新的圖像采集裝置以及一種安裝有上述圖像采集裝置的智能機器人。其中,圖1示出了本實施例中該圖像采集裝置的結(jié)構(gòu)示意圖。
如圖1所示,本實施例所提供的圖像采集裝置優(yōu)選地包括:麥克風陣列101、聲源定位電路102、全景攝像頭103以及圖像顯示模塊104。其中,麥克風陣列101能夠獲取聲波信號,并將獲取到的聲波信號轉(zhuǎn)換為對應(yīng)的音頻電信號,從而實現(xiàn)信號的聲-電轉(zhuǎn)換。
本實施例中,麥克風陣列101優(yōu)選地包括四個麥克風單元,其中,各個麥克風單元均可以獨立地根據(jù)獲取到的聲波信號生成對應(yīng)的音頻電信號。需要指出的是,在本實用新型的其他實施例中,麥克風陣列101所包含的麥克風單元的數(shù)量可以根據(jù)實際需要配置為其他合理值,本實用新型不限于此。
聲源定位電路102與麥克風陣列101電連接,其能夠根據(jù)麥克風陣列101所傳輸來的音頻電信號確定出發(fā)出上述聲波信號的聲源的聲源位置信息。聲源定位電路102與全景攝像頭103電連接,其能夠?qū)⒆陨砩傻穆曉次恢眯畔鬏斨寥皵z像頭103。
本實施例中,全景攝像頭103優(yōu)選地包括圖像傳感器單元和角度調(diào)節(jié)單元,其中,圖像傳感器單元安裝在角度調(diào)節(jié)單元上,角度調(diào)節(jié)單元與聲源定位電路102電連接。角度調(diào)節(jié)單元在接收到聲源定位電路102所傳輸來的聲源定位信息后,會根據(jù)該聲源定位信息來對圖像傳感器單元的朝向進行調(diào)節(jié),以將圖像傳感器單元的主視角轉(zhuǎn)動至聲源所對應(yīng)的方向,這樣圖形傳感器單元也就可以獲取到聲源所對應(yīng)方向上的相關(guān)圖像,即得到全景攝像頭的主視角圖像。
如圖1所示,本實施例中所提供的圖像采集裝置優(yōu)選地還包括有圖像顯示模塊104。其中,圖像顯示模塊104與全景攝像頭103連接,其能夠顯示全景攝像頭103的主視角圖像。
需要指出的是,在本實用新型的其他實施例中,根據(jù)實際需要,圖像采集裝置還可以不配置圖像顯示模塊,本實用新型不限于此。
現(xiàn)有的聲源定位技術(shù)主要包括基于最大輸出功率的可控波形成技術(shù)和高分辨率譜估計技術(shù)。其中,基于最大輸出功率的可控波形成技術(shù)的基本思想是將各陣元采集來的信號進行加權(quán)求和形成波束,通過搜索聲源的可能位置來引導該波束,修改權(quán)值使得音頻傳感器陣列的輸出信號的功率最大。
本實施例中,聲源定位電路102優(yōu)選地使用達到時間差法來對多模態(tài)輸入數(shù)據(jù)中的音頻信息進行聲源定位。具體地,當麥克風陣列101的一個鄰近聲源發(fā)出聲波時,麥克風陣列101中所包含的多個麥克風單元將分別接收到上述聲波。由于各個麥克風單元的安裝位置不同,因此上述聲源所發(fā)出的聲波達到各個麥克風單元的時間也將存在差異。
對于本實施例所提供的圖像采集裝置來說,其麥克風陣列101和全景攝像頭103優(yōu)選地安裝在智能機器人的頭部。具體地,麥克風陣列101所包含的麥克風單元可以分布在全景攝像頭103平面的線性上,即麥克風陣列101所包含的麥克風風單元均分布在同一直線上。
圖2示出了本實施例所提供的智能機器人的一個應(yīng)用場景。如圖2所示,會議場地105中分布有多個座位(例如座位A、座位B、座位C、座位D、….)。當位于某一座位上的用戶發(fā)言時,其所發(fā)出的聲波到達麥克風陣列101中各個麥克風單元并被各個麥克風單元所獲取。由于聲波到達麥克風陣列101中各個麥克風單元的時間不同(例如座位A上的用戶發(fā)言時,其所發(fā)出的聲波將最先到達麥克風陣列101中最左側(cè)的麥克風單元,隨后從左向右逐次到達后續(xù)的麥克風單元),而這種差異也將在各個麥克風單元所生成的音頻電信號中體現(xiàn)。
聲源定位電路102與麥克風陣列101中的各個麥克風單元連接,其可以根據(jù)麥克風陣列101中各個麥克風單元所傳輸來的音頻電信號來確定出聲源位置信息。具體地,本實施例中,聲源定位電路102可以根據(jù)各個麥克風單元所傳輸來的音頻電信號的時間差來確定出聲源方向,從而實現(xiàn)對音頻信號的聲源定位。
需要指出的是,在本實用新型的其他實施例中,聲源定位電路102還可以采用其他合理的方式來根據(jù)麥克風陣列101中各個麥克風單元所傳輸來的音頻電信號來確定出聲源位置信息,本實用新型不限于此。例如,在本實用新型的一個實施例中,聲源定位電路102還可以采用諸如基于空間的定位技術(shù)或基于可控波束形成的定位技術(shù)來確定上述聲源位置信息。
當然,在本實用新型的其他實施例中,圖像采集裝置還可以采用其他合理布局方式來安裝在智能機器人上,本實用新型不限于此。例如,在本實用新型的一個實施例中,圖像采集裝置中的麥克風陣列101和全景攝像頭103還可以采用如圖3或如圖4所示的方式來進行配置。
如圖3和圖4所示,麥克風陣列103分布在空間圍繞全景攝像頭103的同一圓環(huán)上,而全景攝像頭103則位于該圓環(huán)的中心位置處。對于圖3所示的應(yīng)用場景來說,會議場地中的座位分別位于圖像采集裝置的兩側(cè),這樣麥克風陣列同樣可以獲取到各個座位上的用戶所發(fā)出的聲波信號,并且全景攝像頭也可以通過旋轉(zhuǎn)來將自身的主視角轉(zhuǎn)動至對應(yīng)的聲源方向。而對于圖4所示的應(yīng)用場景來說,會議場地則為一圓形場地,上述圖像采集裝置則位于該圓形場地的中央,這樣圖像采集裝置同樣可以主動將自身的主視角方向調(diào)整至聲源方向。
需要指出的是,在本實用新型的其他實施例中,全景攝像頭103還可以采用其他合理的方式來實現(xiàn),本實用新型不限于此。例如在本實用新型的一個實施例中,全景攝像頭103還可以采用能夠同時采集360°方向的攝像頭來實現(xiàn),這樣全景全景攝像頭103也就可以不需要配置角度調(diào)節(jié)單元,而是直接從自身獲取到的360°的全景圖像中提取對應(yīng)于聲源方向上的圖像來得到主視角圖像。
從上述描述中可以看出,本實用新型所提供的圖像采集裝置能夠?qū)Πl(fā)出聲音的聲源進行定位,并根據(jù)聲源定位結(jié)果來將聲源的相關(guān)圖像進行突出顯示,相較于現(xiàn)有的圖像采集裝置,本實用新型所提供的圖像采集裝置能夠使得用戶更加容易地了解到交互環(huán)境中的敏感信息,從而提高用戶的視頻交互體驗。
當應(yīng)用于會議記錄場景中時,本實用新型所提供的圖像采集裝置能夠利用麥克風陣列和聲源定位電路來主動地對發(fā)言人進行定位,并利用全景攝像頭來獲取發(fā)言人的相關(guān)圖像,從而使得與會人員能夠更加清楚、快速地看到發(fā)言人的相關(guān)圖像。類似地,當應(yīng)用視頻交互場景中時,本實用新型所提供的圖像采集裝置同樣能夠有效提高用戶的視頻交互體驗。
當應(yīng)用于監(jiān)控攝像場景中時,本實用新型所提供的圖像采集裝置能夠?qū)Ξ惓5穆曇暨M行快速定位并對聲源位置的圖像進行自動捕獲,從而有助于監(jiān)控人員更加準確、有效地對目標場地進行監(jiān)控。
應(yīng)該理解的是,本實用新型所公開的實施例不限于這里所公開的特定結(jié)構(gòu),而應(yīng)當延伸到相關(guān)領(lǐng)域的普通技術(shù)人員所理解的這些特征的等同替代。還應(yīng)當理解的是,在此使用的術(shù)語僅其配置為描述特定實施例的目的,而并不意味著限制。
說明書中提到的“一個實施例”或“實施例”意指結(jié)合實施例描述的特定特征、結(jié)構(gòu)或特性包括在本實用新型的至少一個實施例中。因此,說明書通篇各個地方出現(xiàn)的短語“一個實施例”或“實施例”并不一定均指同一個實施例。
雖然上述示例其配置為說明本實用新型在一個或多個應(yīng)用中的原理,但對于本領(lǐng)域的技術(shù)人員來說,在不背離本實用新型的原理和思想的情況下,明顯可以在形式上、用法及實施的細節(jié)上作各種修改而不用付出創(chuàng)造性勞動。因此,本實用新型由所附的權(quán)利要求書來限定。