本發(fā)明實(shí)施例涉及智能終端技術(shù)領(lǐng)域,尤其涉及一種音頻輸出方法、裝置及終端設(shè)備。
背景技術(shù):
隨著智能終端的快速發(fā)展,智能終端(例如,智能手機(jī)和智能穿戴設(shè)備等)已經(jīng)廣泛應(yīng)用到人們工作、生活的各個(gè)領(lǐng)域。
目前的智能終端中都裝有揚(yáng)聲器,支持揚(yáng)聲器語音輸出功能。而普通揚(yáng)聲器發(fā)出的聲音是向四面八方傳播的,為了降低對周圍人群的干擾,出現(xiàn)了一種與普通揚(yáng)聲器工作原理不同的定向揚(yáng)聲器,首先定向揚(yáng)聲器將低頻聲音信號載于指向性很強(qiáng)的高頻信號之上,再經(jīng)過放大、發(fā)射到空氣中,而后,空氣會把高頻信號迅速過濾,其上的可聽聲音信號便會自然濾出,實(shí)現(xiàn)像激光一樣定向傳播。
但是,現(xiàn)有的定向揚(yáng)聲器或裝有定向揚(yáng)聲器的智能終端,其位置一旦固定之后,對應(yīng)的揚(yáng)聲器輸出聲音的方向就是固定的。在很多場景下,例如,用戶背對揚(yáng)聲器聲音傳播方向時(shí),上述輸出的聲音并不能被用戶很好的接收到。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種音頻輸出方法、裝置及終端設(shè)備,以實(shí)現(xiàn)自動(dòng)識別音頻輸出方向,向著用戶方向輸出聲音。
第一方面,本發(fā)明實(shí)施例提供了一種音頻輸出方法,該方法包括:
在檢測到揚(yáng)聲器處于音頻輸出狀態(tài)時(shí),確定用戶所在方位;
控制所述揚(yáng)聲器向所述用戶所在方位輸出音頻。
進(jìn)一步的,確定用戶所在方位包括:
對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并對采集的圖像進(jìn)行圖像識別;
若所述采集的圖像中包含人體特征信息,則根據(jù)所述采集的圖像確定人體特征的方位,將所述人體特征的方位作為用戶所在方位。
進(jìn)一步的,確定用戶所在方位包括:
采用旋轉(zhuǎn)攝像頭對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并在所述旋轉(zhuǎn)攝像頭旋轉(zhuǎn)的過程中實(shí)時(shí)識別采集的圖像;
若識別到采集的圖像中包含人體特征信息,則控制所述旋轉(zhuǎn)攝像頭停止旋轉(zhuǎn),將停止旋轉(zhuǎn)時(shí)所述旋轉(zhuǎn)攝像頭朝向的方位作為用戶所在方位。
進(jìn)一步的,確定用戶所在方位包括:
對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并將采集的圖像與預(yù)先采集的所述用戶的圖像進(jìn)行匹配;
若匹配成功,則根據(jù)所述采集的圖像確定所述用戶的方位。
進(jìn)一步的,確定用戶所在方位包括:
對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,若識別到采集的圖像中包含多個(gè)用戶的人體特征信息時(shí),則采用距離傳感器確定所述揚(yáng)聲器與各用戶之間的距離;
根據(jù)所述采集的圖像確定距離所述揚(yáng)聲器最近的用戶所在方位。
進(jìn)一步的,確定用戶所在方位之前,還包括:
采用虹膜識別傳感器識別出所述用戶。
第二方面,本發(fā)明實(shí)施例還提供了一種音頻輸出裝置,該裝置包括:
方位確定模塊,用于在檢測到揚(yáng)聲器處于音頻輸出狀態(tài)時(shí),確定用戶所在方位;
音頻輸出模塊,用于控制所述揚(yáng)聲器向所述用戶所在方位輸出音頻。
進(jìn)一步的,所述方位確定模塊具體用于,對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并對采集的圖像進(jìn)行圖像識別;若所述采集的圖像中包含人體特征信息,則根據(jù)所述采集的圖像確定人體特征的方位,將所述人體特征的方位作為用戶所在方位。
進(jìn)一步的,所述方位確定模塊具體用于,采用旋轉(zhuǎn)攝像頭對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并在所述旋轉(zhuǎn)攝像頭旋轉(zhuǎn)的過程中實(shí)時(shí)識別采集的圖像;若識別到采集的圖像中包含人體特征信息,則控制所述旋轉(zhuǎn)攝像頭停止旋轉(zhuǎn),將停止旋轉(zhuǎn)時(shí)所述旋轉(zhuǎn)攝像頭朝向的方位作為用戶所在方位。
進(jìn)一步的,所述方位確定模塊具體用于,對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并將采集的圖像與預(yù)先采集的所述用戶的圖像進(jìn)行匹配;若匹配成功,則根據(jù)所述采集的圖像確定所述用戶的方位。
進(jìn)一步的,所述方位確定模塊具體用于,對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,若識別到采集的圖像中包含多個(gè)用戶的人體特征信息時(shí),則采用距離傳感器確定所述揚(yáng)聲器與各用戶之間的距離;根據(jù)所述采集的圖像確定距離所述揚(yáng)聲器最近的用戶所在方位。
進(jìn)一步的,該音頻輸出裝置還包括:
虹膜識別模塊,用于在所述方位確定模塊確定用戶所在方位之前,采用虹膜識別傳感器識別出所述用戶。
第三方面,本發(fā)明實(shí)施例還提供了一種終端設(shè)備,包括上述第二方面提供的任一項(xiàng)所述音頻輸出裝置和揚(yáng)聲器;
所述揚(yáng)聲器設(shè)置在所述終端設(shè)備中。
進(jìn)一步的,所述終端設(shè)備包括攝像頭和距離傳感器;或,攝像頭和虹膜識別傳感器;
所述攝像頭,用于采集所述終端設(shè)備所在的空間的圖像,并根據(jù)采集的圖像確定用戶所在方位;
所述距離傳感器,用于確定所述終端設(shè)備與用戶之間的距離;
所述虹膜識別傳感器,用于識別出用戶。
進(jìn)一步的,所述攝像頭為旋轉(zhuǎn)式攝像頭。
本發(fā)明實(shí)施例的技術(shù)方案,通過終端自動(dòng)識別用戶的方位并向用戶所在方位輸出音頻,解決了定向揚(yáng)聲器不能自動(dòng)識別用戶方向的技術(shù)問題,實(shí)現(xiàn)了自動(dòng)識別用戶的方位,并向該方位定向輸出音頻的技術(shù)效果。
附圖說明
圖1是本發(fā)明實(shí)施例一中的音頻輸出方法的流程圖;
圖2是本發(fā)明實(shí)施例二中的音頻輸出方法的流程圖;
圖3是本發(fā)明實(shí)施例三中的音頻輸出方法的流程圖;
圖4是本發(fā)明實(shí)施例四中的音頻輸出方法的流程圖;
圖5是本發(fā)明實(shí)施例五中的音頻輸出方法的流程圖;
圖6是本發(fā)明實(shí)施例六中的音頻輸出裝置的結(jié)構(gòu)示意圖;
圖7是本發(fā)明實(shí)施例七中的終端設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對本發(fā)明作進(jìn)一步的詳細(xì)說明。可以理解的是,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
實(shí)施例一
圖1為本發(fā)明實(shí)施例一提供的一種音頻輸出方法的流程圖,本實(shí)施例可適用于定向輸出音頻的情況,該方法可以由本發(fā)明實(shí)施例提供的音頻輸出裝置來執(zhí)行,該裝置可以采用軟件和/或硬件的方式來實(shí)現(xiàn),該裝置可集成于具有音頻輸出功能的終端內(nèi),例如,揚(yáng)聲器、移動(dòng)終端(例如手機(jī)、平板電腦)、車載終端、筆記本電腦和固定終端(例如臺式電腦)中。具體包括如下步驟:
S110、在檢測到揚(yáng)聲器處于音頻輸出狀態(tài)時(shí),確定用戶所在方位。
所述揚(yáng)聲器可以為設(shè)置在終端中的揚(yáng)聲器,也可以為揚(yáng)聲器設(shè)備。當(dāng)所述揚(yáng)聲器設(shè)置終端時(shí),音頻輸出狀態(tài)指的是終端通過揚(yáng)聲器輸出聲音的狀態(tài),例如可以是通話狀態(tài)或者音樂播放狀態(tài)等。當(dāng)所述揚(yáng)聲器為揚(yáng)聲器設(shè)備時(shí),音頻輸出狀態(tài)指的是揚(yáng)聲器設(shè)備播放錄音或音頻輸出聲音的狀態(tài)。用戶所在方位指的是音頻的接收者所在位置相對于終端的方向。
S120、控制所述揚(yáng)聲器向所述用戶所在方位輸出音頻。
本實(shí)施例中,當(dāng)確定用戶的方位之后,向揚(yáng)聲器發(fā)出控制指令,使得音頻向著用戶的方向輸出。例如,用戶可通過控制設(shè)備(例如,遙控器或手機(jī))向揚(yáng)聲器發(fā)出控制指令,具體可采用wifi網(wǎng)絡(luò)、藍(lán)牙或4G網(wǎng)絡(luò)向揚(yáng)聲器發(fā)送控制指令,所述揚(yáng)聲器收到控制指令后,可通過旋轉(zhuǎn)將喇叭朝向用戶輸出音頻。
其中,控制揚(yáng)聲器定向輸出音頻可通過有源定向揚(yáng)聲器或矩陣揚(yáng)聲器陣列實(shí)現(xiàn)。有源定向揚(yáng)聲器的工作原理為將低頻聲音信號載于指向性很強(qiáng)的高頻信號之上,再經(jīng)過放大、發(fā)射到空氣中,而后,空氣會把高頻信號迅速過濾,其上的可聽聲音信號便會自然濾出,實(shí)現(xiàn)像激光一樣定向傳播;矩陣揚(yáng)聲器陣列的工作原理為將若干揚(yáng)聲器等間隔矩陣排列,每個(gè)揚(yáng)聲器單元輻射一個(gè)平面的同相位波陣面,多個(gè)單元的組合形成可提供單一的主擴(kuò)展聲源,該揚(yáng)聲器陣列的波陣面通過在整個(gè)音頻范圍內(nèi)的耦合,在一定區(qū)域范圍內(nèi)產(chǎn)生品質(zhì)一致的聲音,使其以波束的形式在一定方向上傳播。
值得說明的是,在確定用戶所在方位之前,需要判斷處于輸出狀態(tài)的音頻是否需要定向輸出。具體的,應(yīng)用距離傳感器檢測終端與用戶臉部的距離,當(dāng)該距離小于預(yù)設(shè)距離時(shí),不需要進(jìn)行用戶方位的識別,正常進(jìn)行語音的播放,否則,當(dāng)該距離大于預(yù)設(shè)距離或者終端的揚(yáng)聲器處于免提外放模式時(shí),可自動(dòng)或用戶手動(dòng)開啟定位模式,確定用戶的方位,并控制揚(yáng)聲器向用戶所在方位輸出音頻。其中,預(yù)設(shè)距離一般可以為10cm或者20cm。
本實(shí)施例的技術(shù)方案,通過終端自動(dòng)識別用戶的方位并向用戶所在方位輸出音頻,解決了定向揚(yáng)聲器不能自動(dòng)識別用戶方向的技術(shù)問題,實(shí)現(xiàn)了自動(dòng)識別用戶的方位,并向該方位定向輸出音頻的技術(shù)效果。
實(shí)施例二
圖2為本發(fā)明實(shí)施例二提供的一種音頻輸出方法的流程圖,在上述實(shí)施例一的基礎(chǔ)上對音頻輸出方法進(jìn)行優(yōu)化,提供了確定用戶所在方位的方法,具體是對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并對采集的圖像進(jìn)行圖像識別;若所述采集的圖像中包含人體特征信息,則根據(jù)所述采集的圖像確定人體特征的方位,將所述人體特征的方位作為用戶所在方位。相應(yīng)的,本實(shí)施例的方法包括:
S210、對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并對采集的圖像進(jìn)行圖像識別。
其中,對揚(yáng)聲器所在的空間進(jìn)行圖像采集可以是通過攝像頭采集圖像,對圖像進(jìn)行識別指的是對圖像中包含的圖像信息進(jìn)行識別,確定采集的圖像中是否包含用戶。
S220、若所述采集的圖像中包含人體特征信息,則根據(jù)所述采集的圖像確定人體特征的方位,將所述人體特征的方位作為用戶所在方位。
其中,人體特征信息指的是能夠確認(rèn)圖像中包含人體的信息,例如可以是人體頭部、面部或者嘴巴等,如果識別出圖像中含有上述任意一種人體特征信息,就可以確定圖像中含有用戶。通過該人體特征信息在圖像中的相對位置計(jì)算并確定用戶相對于終端的方位。
終端可間隔一定時(shí)間,例如可以是30秒或1分鐘,連續(xù)采集揚(yáng)聲器所在的空間的圖像并識別,實(shí)時(shí)獲取人體特征信息,確定用戶的方位。
S230、控制所述揚(yáng)聲器向所述用戶所在方位輸出音頻。
本實(shí)施例的技術(shù)方案,通過采集揚(yáng)聲器所在空間的圖像,識別人體特征信息以自動(dòng)識別用戶的方位,并向該方位定向輸出音頻,實(shí)現(xiàn)了自動(dòng)識別用戶的方位,并向該方位定向輸出音頻的技術(shù)效果。
實(shí)施例三
圖3為本發(fā)明實(shí)施例三提供的一種音頻輸出方法的流程圖,在上述實(shí)施例的基礎(chǔ)上對音頻輸出方法進(jìn)行優(yōu)化,提供了確定用戶所在方位的方法,具體是采用旋轉(zhuǎn)攝像頭對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并在所述旋轉(zhuǎn)攝像頭旋轉(zhuǎn)的過程中實(shí)時(shí)識別采集的圖像;若識別到采集的圖像中包含人體特征信息,則控制所述旋轉(zhuǎn)攝像頭停止旋轉(zhuǎn),將停止旋轉(zhuǎn)時(shí)所述旋轉(zhuǎn)攝像頭朝向的方位作為用戶所在方位。相應(yīng)的,本實(shí)施例的方法包括:
S310、采用旋轉(zhuǎn)攝像頭對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并在所述旋轉(zhuǎn)攝像頭旋轉(zhuǎn)的過程中實(shí)時(shí)識別采集的圖像。
其中,旋轉(zhuǎn)攝像頭為能夠旋轉(zhuǎn)拍攝的攝像頭。具體的,當(dāng)檢測到終端處于音頻輸出狀態(tài),并判斷需要確定用戶的方位時(shí),終端自動(dòng)或者用戶手動(dòng)開啟旋轉(zhuǎn)攝像頭,獲取終端所在空間的圖像,并實(shí)時(shí)對旋轉(zhuǎn)攝像頭獲取的圖像進(jìn)行識別,自動(dòng)捕捉人體特征信息。
S320、若識別到采集的圖像中包含人體特征信息,則控制所述旋轉(zhuǎn)攝像頭停止旋轉(zhuǎn),將停止旋轉(zhuǎn)時(shí)所述旋轉(zhuǎn)攝像頭朝向的方位作為用戶所在方位。
具體的,在旋轉(zhuǎn)攝像頭在旋轉(zhuǎn)拍攝的過程中,識別到有人體特征信息出現(xiàn)時(shí),例如可以是在圖像在出現(xiàn)了人體頭部,控制旋轉(zhuǎn)攝像頭停止旋轉(zhuǎn),將旋轉(zhuǎn)攝像頭停止旋轉(zhuǎn)時(shí)刻的朝向確定為用戶所在的方向;否則,繼續(xù)旋轉(zhuǎn)攝像頭采集空間內(nèi)的圖像,直到識別到有人體特征信息,確定用戶方向。值得說明的是,當(dāng)圖像中的人體特征信息消失時(shí),旋轉(zhuǎn)攝像頭自動(dòng)開啟旋轉(zhuǎn)并繼續(xù)采集空間內(nèi)的圖像,直到識別到有人體特征信息,確定用戶方向。
S330、控制所述揚(yáng)聲器向所述用戶所在方位輸出音頻。
本實(shí)施例的技術(shù)方案,通過旋轉(zhuǎn)攝像頭實(shí)時(shí)獲取并識別揚(yáng)聲器所在空間的圖像,自動(dòng)捕捉用戶的人體特征以確定用戶的方位,實(shí)現(xiàn)了自動(dòng)識別用戶的方位,并向該方位定向輸出音頻的技術(shù)效果。
實(shí)施例四
圖4為本發(fā)明實(shí)施例四提供的一種音頻輸出方法的流程圖,在上述實(shí)施例的基礎(chǔ)上對音頻輸出方法進(jìn)行優(yōu)化,提供了確定用戶所在方位的方法,具體是對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并將采集的圖像與預(yù)先采集的所述用戶的圖像進(jìn)行匹配;若匹配成功,則根據(jù)所述采集的圖像確定所述用戶的方位。相應(yīng)的,本實(shí)施例的方法包括:
S410、對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并將采集的圖像與預(yù)先采集的所述用戶的圖像進(jìn)行匹配。
其中,預(yù)先采集的用戶圖像指的是用于與終端采集的圖像進(jìn)行比對的,預(yù)先存在終端中的用戶的圖像,例如可以是用戶自主拍攝的圖像,也可以是終端在之前的圖像匹配過程中自動(dòng)存儲的用戶的圖像。
具體的,終端可采用人臉識別算法對采集的圖像進(jìn)行匹配。人臉識別算法的原理為提取終端采集的圖像中的人臉信息,包括眼睛、鼻子、嘴巴或者耳朵等,并將給人臉信息與預(yù)先采集的用戶的圖像中的人臉信息進(jìn)行匹配,當(dāng)相似度達(dá)到預(yù)設(shè)值時(shí),確定終端采集的圖像中存在終端用戶。其中,匹配相似度的預(yù)設(shè)值可以是終端的推薦值,也可以是用戶自定義的調(diào)整值,例如可以是80%或90%。當(dāng)匹配相似度預(yù)設(shè)值越高時(shí),匹配準(zhǔn)確度越高,匹配消耗時(shí)間越長,相應(yīng)的,當(dāng)匹配相似度預(yù)設(shè)值較低時(shí),匹配速度快,匹配準(zhǔn)確度低,容易出現(xiàn)識別錯(cuò)誤的情況。
S420、若匹配成功,則根據(jù)所述采集的圖像確定所述用戶的方位。
其中,匹配成功指的是終端采集的圖像與預(yù)先采集的用戶圖像中的人臉信息的相似度達(dá)到了匹配相似度預(yù)設(shè)值,確認(rèn)終端采集的圖像中存在終端用戶??梢酝ㄟ^該終端用戶的人臉信息在圖像中的相對位置計(jì)算并確定用戶相對于終端的方位。
本實(shí)施例中,通過對終端采集的圖像中信息與預(yù)設(shè)的用戶的圖像信息匹配識別,識別終端用戶,確定用戶的方位,提高了方位確定的準(zhǔn)確度。
可選的,確定用戶所在方位之前,該方法還包括:
采用虹膜識別傳感器識別出所述用戶。
其中,虹膜識別技術(shù)指的是通過眼睛中的進(jìn)行身份識別。虹膜是位于人眼的黑色瞳孔與白色鞏膜之間的圓環(huán)狀部分,其包含了很多相互交錯(cuò)的斑點(diǎn)、細(xì)絲、冠狀、條紋和隱窩等的細(xì)節(jié)特征;虹膜在胎兒發(fā)育階段形成后的整個(gè)生命歷程中保持不變。根據(jù)虹膜的細(xì)節(jié)特征能夠唯一性的識別用戶的身份。
虹膜識別傳感器是能夠獲取人眼虹膜圖像并識別用戶身份的傳感器。虹膜識別傳感器的工作原理為獲取虹膜圖像;對虹膜圖像進(jìn)行預(yù)處理,使其滿足提取虹膜特征的需求;提取虹膜特征;對提取的和模特進(jìn)行特征匹配,識別用戶身份。
具體的,在本實(shí)施例中,通過虹膜識別傳感器獲取揚(yáng)聲器所在空間的虹膜圖像,并實(shí)時(shí)對獲取的虹膜圖像進(jìn)行識別,并與預(yù)存的終端用戶的虹膜圖像進(jìn)行匹配,當(dāng)匹配成功時(shí),確定獲取的虹膜圖像屬于終端用戶,并計(jì)算確定終端用戶的方位。
本實(shí)施例中,通過虹膜識別技術(shù)唯一識別終端用戶的身份,確定用戶的方位,提高了方位確定的準(zhǔn)確度。
S430、控制所述揚(yáng)聲器向所述用戶所在方位輸出音頻。
本實(shí)施例的技術(shù)方案,通過對終端采集的圖像中信息與預(yù)設(shè)的用戶的圖像信息匹配識別,識別終端用戶,確定用戶的方位,解決了定向揚(yáng)聲器不能自動(dòng)識別用戶方向的技術(shù)問題,實(shí)現(xiàn)了自動(dòng)識別用戶的方位,并向該方位定向輸出音頻的技術(shù)效果。
實(shí)施例五
圖5為本發(fā)明實(shí)施例五提供的一種音頻輸出方法的流程圖,在上述實(shí)施例的基礎(chǔ)上對音頻輸出方法進(jìn)行優(yōu)化,提供了確定用戶所在方位的方法,具體是對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,若識別到采集的圖像中包含多個(gè)用戶的人體特征信息時(shí),則采用距離傳感器確定所述揚(yáng)聲器與各用戶之間的距離;根據(jù)所述采集的圖像確定距離所述揚(yáng)聲器最近的用戶所在方位。相應(yīng)的,本實(shí)施例的方法包括:
S510、對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,若識別到采集的圖像中包含多個(gè)用戶的人體特征信息時(shí),則采用距離傳感器確定所述揚(yáng)聲器與各用戶之間的距離。
其中,距離傳感器是能夠檢測物理距離的一種傳感器,例如可以通過光電距離傳感器或超聲距離傳感器檢測用戶與終端揚(yáng)聲器間的距離。具體的,當(dāng)識別到終端采集的圖像中在不同方位存在多個(gè)且不屬于同一用戶的人體特征信息,終端無法確定音頻的輸出方向,可通過距離傳感器檢測并識別唯一的音頻輸出用戶,來確定音頻的輸出方向。
S520、根據(jù)所述采集的圖像確定距離所述揚(yáng)聲器最近的用戶所在方位。
具體的,通過距離傳感器檢測各用戶與終端揚(yáng)聲器之間的距離,將該距離進(jìn)行比較,根據(jù)比較結(jié)果,選擇距離最近的用戶確定為音頻輸出用戶。根據(jù)該音頻輸出用戶的方位確定音頻的輸出方向。
S530、控制所述揚(yáng)聲器向所述用戶所在方位輸出音頻。
本實(shí)施例的技術(shù)方案,當(dāng)識別到多人的人體特征信息時(shí),通過距離傳感器檢測識別各個(gè)用戶與終端揚(yáng)聲器的距離,將最近的用戶確定為音頻輸出用戶,來確定音頻的輸出方向,實(shí)現(xiàn)了在多個(gè)用戶存在的情況下,自動(dòng)識別音頻輸出方向的效果。
實(shí)施例六
圖6為本發(fā)明實(shí)施例六提供的音頻輸出裝置的結(jié)構(gòu)示意圖,該裝置適用于執(zhí)行本發(fā)明實(shí)施例提供的音頻輸出方法,如圖6所示,該裝置具體可以包括:
方位確定模塊610,用于在檢測到揚(yáng)聲器處于音頻輸出狀態(tài)時(shí),確定用戶所在方位;
音頻輸出模塊620,用于控制所述揚(yáng)聲器向所述用戶所在方位輸出音頻。
可選的,方位確定模塊610具體用于,對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并對采集的圖像進(jìn)行圖像識別;若所述采集的圖像中包含人體特征信息,則根據(jù)所述采集的圖像確定人體特征的方位,將所述人體特征的方位作為用戶所在方位。
可選的,方位確定模塊610具體用于,采用旋轉(zhuǎn)攝像頭對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并在所述旋轉(zhuǎn)攝像頭旋轉(zhuǎn)的過程中實(shí)時(shí)識別采集的圖像;若識別到采集的圖像中包含人體特征信息,則控制所述旋轉(zhuǎn)攝像頭停止旋轉(zhuǎn),將停止旋轉(zhuǎn)時(shí)所述旋轉(zhuǎn)攝像頭朝向的方位作為用戶所在方位。
可選的,方位確定模塊610具體用于,對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,并將采集的圖像與預(yù)先采集的所述用戶的圖像進(jìn)行匹配;若匹配成功,則根據(jù)所述采集的圖像確定所述用戶的方位。
可選的,方位確定模塊610具體用于,對所述揚(yáng)聲器所在的空間進(jìn)行圖像采集,若識別到采集的圖像中包含多個(gè)用戶的人體特征信息時(shí),則采用距離傳感器確定所述揚(yáng)聲器與各用戶之間的距離;根據(jù)所述采集的圖像確定距離所述揚(yáng)聲器最近的用戶所在方位。
可選的,該音頻輸出裝置還包括:
虹膜識別模塊,用于在所述方位確定模塊確定用戶所在方位之前,采用虹膜識別傳感器識別出所述用戶。
本實(shí)施例通過終端自動(dòng)識別用戶的方位并向用戶所在方位輸出音頻,解決了定向揚(yáng)聲器不能自動(dòng)識別用戶方向的技術(shù)問題,實(shí)現(xiàn)了自動(dòng)識別用戶的方位,并向該方位定向輸出音頻的技術(shù)效果。
實(shí)施例七
圖7是本發(fā)明實(shí)施例七提供的終端設(shè)備的結(jié)構(gòu)示意圖,基于上述實(shí)施例提供的音頻輸出裝置,本實(shí)施例提供了包含上述實(shí)施例提供的任意一種音頻輸出裝置的終端設(shè)備700。音頻輸出裝置600可以控制終端設(shè)備700的自動(dòng)識別用戶方向,并向用戶方向定向輸出音頻。具體的,該終端設(shè)備包括音頻輸出裝置600和揚(yáng)聲器710,該揚(yáng)聲器710設(shè)置在終端設(shè)備700中。
其中,終端設(shè)備700可以是智能手表或智能手環(huán)等智能穿戴設(shè)備、智能手機(jī)或者移動(dòng)平板等。
揚(yáng)聲器710根據(jù)音頻輸出裝置600形成的音頻輸出方向指令定向輸出音頻。示例性的,本實(shí)施例中揚(yáng)聲器可采用MEMS矩陣揚(yáng)聲器陣列實(shí)現(xiàn),MEMS揚(yáng)聲器尺寸為微米級,MEMS矩陣揚(yáng)聲器陣列中MEMS揚(yáng)聲器個(gè)數(shù)一般可以為50-200,本實(shí)施例中MEMS揚(yáng)聲器個(gè)數(shù)優(yōu)選為100左右,MEMS矩陣揚(yáng)聲器陣列尺寸優(yōu)選為10mm。
MEMS矩陣揚(yáng)聲器區(qū)別于傳統(tǒng)矩陣壓電式揚(yáng)聲器,體積小,可微型化,可量產(chǎn)并應(yīng)用于終端設(shè)備700中。
可選的,該終端設(shè)備700包括攝像頭和距離傳感器;或,攝像頭和虹膜識別傳感器;
所述攝像頭,用于采集所述終端設(shè)備所在的空間的圖像,并根據(jù)采集的圖像確定用戶所在方位;
所述距離傳感器,用于確定所述終端設(shè)備與用戶之間的距離;
所述虹膜識別傳感器,用于識別出用戶。
可選的,攝像頭為旋轉(zhuǎn)式攝像頭。
本實(shí)施例在上述實(shí)施例的基礎(chǔ)上,提供了一種終端設(shè)備,該實(shí)施例通過音頻輸出裝置確定用戶方位,控制揚(yáng)聲器向該用戶方位定向輸出音頻,解決了定向揚(yáng)聲器不能自動(dòng)識別用戶方向的技術(shù)問題,實(shí)現(xiàn)了自動(dòng)識別用戶的方位,并向該方位定向輸出音頻的技術(shù)效果。
注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會理解,本發(fā)明不限于這里所述的特定實(shí)施例,對本領(lǐng)域技術(shù)人員來說能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會脫離本發(fā)明的保護(hù)范圍。因此,雖然通過以上實(shí)施例對本發(fā)明進(jìn)行了較為詳細(xì)的說明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。