本技術(shù)涉及終端,尤其涉及一種音頻采集方法、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、隨著終端技術(shù)的發(fā)展,電子設(shè)備可以支持音頻輸出和音頻采集的功能。例如,電子設(shè)備可以通過揚聲器(speaker)播放音頻,電子設(shè)備也可以通過麥克風(fēng)(mic)采集音頻。
2、電子設(shè)備可以將麥克風(fēng)采集的音頻保存在本地,電子設(shè)備也可以將麥克風(fēng)采集的音頻發(fā)送至其他設(shè)備。但是,需要用戶在支持語音錄制功能的應(yīng)用程序內(nèi)找到音頻采集入口并控制電子設(shè)備采集音頻,用戶操作比較繁瑣?;蛘哂脩艨梢酝ㄟ^語音喚醒電子設(shè)備上支持語音錄制功能的應(yīng)用程序采集音頻,語音喚醒容易發(fā)生誤觸的情況發(fā)生。如何提供一種方便、快捷且準確地采集音頻的方法,有待進一步研究。
技術(shù)實現(xiàn)思路
1、本技術(shù)提供了一種音頻采集方法、電子設(shè)備及存儲介質(zhì),提高了音頻采集效率,減少了用戶操作,提升了用戶體驗。
2、第一方面,本技術(shù)提供了一種音頻采集方法,第一電子設(shè)備包括麥克風(fēng)陣列,麥克風(fēng)陣列包括至少兩個麥克風(fēng),方法包括:第一電子設(shè)備通過麥克風(fēng)陣列采集目標發(fā)聲物體輸出的第一音頻信號;第一電子設(shè)備基于第一音頻信號確定第一電子設(shè)備與目標發(fā)聲物體的第一距離;在第一距離小于第一預(yù)設(shè)距離時,第一電子設(shè)備通過麥克風(fēng)陣列獲取目標發(fā)聲物體輸出的第二音頻信號;第一電子設(shè)備將第二音頻信號保存在第一應(yīng)用內(nèi)。
3、可選的,電子設(shè)備也可以保存第一音頻信號,也可以不保存第一音頻信號。
4、可選的,第一電子設(shè)備將第二音頻信號保存在第一應(yīng)用內(nèi),可以是第一電子設(shè)備直接將第二音頻信號保存在第一應(yīng)用內(nèi),也可以是將第二音頻信號轉(zhuǎn)換為文字信息,再將文字信息保存在第一應(yīng)用內(nèi)。
5、電子設(shè)備可以基于采集的音頻信號確定與目標發(fā)聲物體之間的第一距離。當(dāng)電子設(shè)備與目標發(fā)聲物體之間的第一距離大于第一預(yù)設(shè)距離,或者一定時長電子設(shè)備與目標發(fā)聲物體之間的第一距離大于第一預(yù)設(shè)距離時,電子設(shè)備可以確定識別到近場語音。電子設(shè)備可以自動開始采集音頻并將音頻自動保存在第一應(yīng)用內(nèi)。實現(xiàn)了電子設(shè)備自動拾取音頻,減少了用戶操作,提高了音頻采集效率,提升了用戶體驗。
6、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,第一電子設(shè)備將第二音頻信號保存在第一應(yīng)用內(nèi),具體包括:
7、響應(yīng)于第一距離小于第一預(yù)設(shè)距離,第一電子設(shè)備開啟第一應(yīng)用,并將第二音頻信號保存在第一應(yīng)用內(nèi),或者,第一電子設(shè)備將第二音頻信號轉(zhuǎn)換為第一文字信息,并將第一文字信息保存在第一應(yīng)用內(nèi)。
8、這樣,在識別到近場語音后,電子設(shè)備可以自動將采集的音頻信號或者采集的音頻信號對應(yīng)的文字信息保存在第一應(yīng)用內(nèi)。
9、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,第一電子設(shè)備將第二音頻信號保存在第一應(yīng)用內(nèi),具體包括:響應(yīng)于第一距離小于第一預(yù)設(shè)距離,第一電子設(shè)備開啟第一應(yīng)用,并將第二音頻信號通過第一應(yīng)用發(fā)送至第二電子設(shè)備,或者,第一電子設(shè)備將第二音頻信號轉(zhuǎn)換為第一文字信息,并將第一文字信息通過第一應(yīng)用發(fā)送至第二電子設(shè)備。
10、這樣,在識別到近場語音后,電子設(shè)備可以自動將采集的音頻信號發(fā)送至建立通信連接的第二電子設(shè)備,或者將采集的音頻信號對應(yīng)的文字信息發(fā)送至建立通信連接的第二電子設(shè)備。
11、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,第一電子設(shè)備通過藍牙連接有第三電子設(shè)備;第一電子設(shè)備將第二音頻信號保存在第一應(yīng)用內(nèi),具體包括:第一電子設(shè)備將第二音頻信號通過藍牙連接發(fā)送至第三電子設(shè)備;第三電子設(shè)備將第二音頻信號保存在第一應(yīng)用內(nèi)。
12、可選的,第一電子設(shè)備可以是藍牙耳機。藍牙耳機在識別到近場語音后,藍牙耳機可以自動將采集的音頻信號發(fā)送至建立藍牙連接的第三電子設(shè)備,或者將采集的音頻信號對應(yīng)的文字信息發(fā)送至建立藍牙連接的第三電子設(shè)備。
13、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,在第一電子設(shè)備通過麥克風(fēng)陣列獲取第二音頻信號的同時,第一電子設(shè)備還通過麥克風(fēng)陣列獲取其他發(fā)聲物體輸出的第三音頻信號;電子設(shè)備將第二音頻信號保存在第一應(yīng)用內(nèi),具體包括:當(dāng)?shù)谝浑娮釉O(shè)備確定第一電子設(shè)備與其他發(fā)聲物體之間的距離超過第一預(yù)設(shè)距離時,電子設(shè)備將第二音頻信號保存在第一應(yīng)用內(nèi)。
14、可選的,第二音頻信號和第三音頻信號可以是同一個音頻文件中的音頻信號。電子設(shè)備100可以從該同一個音頻文件中提取得到第二音頻信號或者第三音頻信號。
15、可選的,第二音頻信號和第三音頻信號也可以分別是兩個音頻文件中的音頻信號。
16、近場語音可以指與電子設(shè)備之間在第一預(yù)設(shè)距離內(nèi)的目標發(fā)聲物體輸出的音頻。遠場語音可以指與電子設(shè)備之間超過第一預(yù)設(shè)距離的目標發(fā)聲物體輸出的音頻。
17、這樣,在識別到近場語音并開始采集音頻信號后,電子設(shè)備可以判斷采集的音頻信號是近場音頻信號還是遠場音頻信號,僅保存近場音頻信號即可,無需保存遠場音頻信號,可以避免遠場音頻信號的干擾。
18、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,在第一距離小于第一預(yù)設(shè)距離時,第一電子設(shè)備通過麥克風(fēng)陣列獲取目標發(fā)聲物體輸出的第二音頻信號,具體包括:第一電子設(shè)備確定第一音頻信號中包含的語音信號的概率;在第一距離小于第一預(yù)設(shè)距離時,且第一音頻信號中包含的語音信號的概率大于第一閾值時,第一電子設(shè)備通過麥克風(fēng)陣列獲取目標發(fā)聲物體輸出的第二音頻信號。
19、這樣,在開始采集音頻之前,電子設(shè)備可以確定音頻信號中包含的語音信號的概率。在音頻信號中包含的語音信號的概率大于第一閾值時即識別到用戶說話的概率較大,電子設(shè)備可以采集并保存第二音頻信號。
20、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,第一電子設(shè)備通過藍牙連接有第三電子設(shè)備;第一電子設(shè)備通過麥克風(fēng)陣列獲取目標發(fā)聲物體輸出的第二音頻信號,具體包括:當(dāng)?shù)谝浑娮釉O(shè)備確定出第一電子設(shè)備處于手持狀態(tài),第一距離小于第一預(yù)設(shè)距離,且第一音頻信號中包含的語音信號的概率大于第一閾值時,第一電子設(shè)備通過麥克風(fēng)陣列獲取目標發(fā)聲物體輸出的第二音頻信號。
21、可選的,第一電子設(shè)備上預(yù)置有傳感器,可以通過傳感器采集的傳感器信號確認是否處于手持狀態(tài)。
22、這樣,當(dāng)?shù)谝浑娮釉O(shè)備是藍牙耳機時,當(dāng)藍牙耳機處于手持狀態(tài)時,可以認為當(dāng)前用戶有對著藍牙耳機說話的意圖。當(dāng)藍牙耳機處于手持狀態(tài)、藍牙耳機與目標發(fā)聲物體之間的距離在第一預(yù)設(shè)距離內(nèi),第一音頻信號中包含的語音信號的概率大于第一閾值時,藍牙耳機可以進入近場語音模式并開始自動采集和保存音頻信號,可以提高藍牙耳機進入近場語音模式的準確性。
23、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,第一電子設(shè)備包括揚聲器;在第一電子設(shè)備通過麥克風(fēng)陣列獲取目標發(fā)聲物體輸出的第二音頻信號之前,方法還包括:第一電子設(shè)備通過揚聲器發(fā)出第一超聲波信號;第一電子設(shè)備接收反射的第二超聲波信號;第一電子設(shè)備基于第一超聲波信號和第二超聲波信號確定出第一電子設(shè)備與目標發(fā)聲物體之間的第二距離和目標發(fā)聲物體的目標發(fā)聲部位的振動頻率;當(dāng)?shù)诙嚯x小于第二預(yù)設(shè)距離,且目標發(fā)聲物體的目標發(fā)聲部位的振動頻率在第一范圍內(nèi)時,第一電子設(shè)備通過麥克風(fēng)陣列獲取目標發(fā)聲物體輸出的第二音頻信號。
24、示例性的,第一范圍可以是20hz-40hz之間。
25、可選的,第二預(yù)設(shè)距離可以小于第一預(yù)設(shè)距離??蛇x的,第二預(yù)設(shè)距離也可以和第一預(yù)設(shè)距離相等。
26、可選的,目標發(fā)聲物體的目標發(fā)聲物體在發(fā)聲時,可以以一定的振動頻率發(fā)聲。第一電子設(shè)備可以通過第一超聲波信號和第二超聲波信號獲取到目標發(fā)聲物體的目標發(fā)聲部位的振動頻率,并基于獲取到的目標發(fā)聲物體的振動頻率確定目標發(fā)聲物體是否在發(fā)聲。當(dāng)目標發(fā)聲物體的振動頻率在第一范圍內(nèi)時,則可以認為目標發(fā)聲物體在發(fā)聲。
27、這樣,在第一電子設(shè)備進入近場語音模式,可以確認是否述第一電子設(shè)備和目標發(fā)聲物體是否足夠近,以及目標發(fā)聲物體的目標發(fā)聲部位是否在發(fā)聲。可以提高第一電子設(shè)備進入近場語音模式的準確性。
28、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,在第一電子設(shè)備將第二音頻信號保存在第一應(yīng)用內(nèi)之后,方法還包括:當(dāng)連續(xù)第一預(yù)設(shè)時長基于第一超聲波信號和第二超聲波信號確定出第二距離大于第二預(yù)設(shè)距離和/或目標發(fā)聲物體的目標發(fā)聲部位的振動頻率不在第一范圍內(nèi)時,第一電子設(shè)備通過麥克風(fēng)陣列停止獲取音頻信號。
29、在第一電子設(shè)備進入近場語音模式之后,第一電子設(shè)備還需持續(xù)監(jiān)測第一電子設(shè)備和目標發(fā)聲物體是否足夠近,以及目標發(fā)聲物體的目標發(fā)聲部位是否在發(fā)聲。當(dāng)監(jiān)測到第一電子設(shè)備和目標發(fā)聲物體之間的距離超過第二預(yù)設(shè)距離,和/或目標發(fā)聲物體的目標發(fā)聲部位未發(fā)聲,第一電子設(shè)備可以自動退出近場語音模式,停止采集音頻。
30、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,麥克風(fēng)陣列包括第一麥克風(fēng)和第二麥克風(fēng),第一麥克風(fēng)和第二麥克風(fēng)在第一電子設(shè)備上的位置不同;第一電子設(shè)備通過麥克風(fēng)陣列采集目標發(fā)聲物體輸出的第一音頻信號,具體包括:第一電子設(shè)備通過第一麥克風(fēng)和第二麥克風(fēng)分別采集目標發(fā)聲物體輸出的第一音頻信號;第一電子設(shè)備基于第一音頻信號確定第一電子設(shè)備與目標發(fā)聲物體的第一距離,具體包括:第一電子設(shè)備獲取第一麥克風(fēng)采集得到的第一音頻信號的第一能量值和第二麥克風(fēng)采集得到的第一音頻信號的第二能量值;第一電子設(shè)備基于第一能量值和第二能量值之間的差值確定出第一電子設(shè)備與目標發(fā)聲物體的第一距離;和/或,第一電子設(shè)備獲取第一麥克風(fēng)采集得到的第一音頻信號的第一時刻和第二麥克風(fēng)采集得到的第一音頻信號的第二時刻;第一電子設(shè)備基于第一時刻和第二時刻之間的差值確定出第一電子設(shè)備與目標發(fā)聲物體的第一距離。
31、這樣,電子設(shè)備可以通過麥克風(fēng)陣列中多個麥克風(fēng)采集的同一音頻信號的能量值的差值和/或接收的同一音頻信號的時刻之間的差值確定出第一電子設(shè)備和目標發(fā)聲物體之間的距離。
32、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,麥克風(fēng)陣列包括第一麥克風(fēng)和第二麥克風(fēng),第一麥克風(fēng)和第二麥克風(fēng)在第一電子設(shè)備上的位置不同,揚聲器包括第一揚聲器和第二揚聲器,第一揚聲器位于第一麥克風(fēng)附近,第二揚聲器位于第二麥克風(fēng)附近;第一電子設(shè)備通過揚聲器發(fā)出第一超聲波信號,具體包括:當(dāng)?shù)谝浑娮釉O(shè)備確定出第一麥克風(fēng)與目標發(fā)聲物體之間距離小于第二麥克風(fēng)與目標發(fā)聲物體之間距離時,第一電子設(shè)備通過第一揚聲器發(fā)出第一超聲波信號,其中,第一揚聲器為距離目標發(fā)聲物體最近的揚聲器。
33、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,第一電子設(shè)備接收反射的第二超聲波信號,具體包括:第一電子設(shè)備通過第一麥克風(fēng)接收反射的第二超聲波信號。
34、這樣,第一電子設(shè)備可以通過距離目標發(fā)聲物體最近的揚聲器發(fā)出超聲波信號和通過距離目標發(fā)聲物體最近的麥克風(fēng)接收反射的超聲波信號,可以提高識別目標發(fā)聲物體的準確性。
35、結(jié)合第一方面,在一種可能的實現(xiàn)方式中,第一電子設(shè)備確定出第一麥克風(fēng)與目標發(fā)聲物體之間距離小于第二麥克風(fēng)與目標發(fā)聲物體之間距離,具體包括:第一電子設(shè)備獲取第一麥克風(fēng)采集得到的第一音頻信號的第一能量值和第二麥克風(fēng)采集得到的第一音頻信號的第二能量值;當(dāng)?shù)谝荒芰恐荡笥诘诙芰恐禃r,第一電子設(shè)備確定出第一麥克風(fēng)與目標發(fā)聲物體之間距離小于第二麥克風(fēng)與目標發(fā)聲物體之間距離;和/或,第一電子設(shè)備獲取第一麥克風(fēng)采集得到的第一音頻信號第一時刻和第二麥克風(fēng)采集得到的第一音頻信號的第二時刻;當(dāng)?shù)谝粫r刻小于第二時刻時,第一電子設(shè)備確定出第一麥克風(fēng)與目標發(fā)聲物體之間距離小于第二麥克風(fēng)與目標發(fā)聲物體之間距離。
36、第二方面,本技術(shù)提供了一種電子設(shè)備,電子設(shè)備包括麥克風(fēng)陣列、存儲器、處理器;其中,麥克風(fēng)陣列、存儲器和處理器耦合,存儲器用于存儲計算機程序,當(dāng)處理器執(zhí)行調(diào)用計算機程序,使得電子設(shè)備執(zhí)行第一方面中任一可能的實現(xiàn)方式中提供的一種音頻采集方法。
37、第三方面,本技術(shù)提供了一種計算機可讀存儲介質(zhì),包括指令,當(dāng)指令在電子設(shè)備上運行,使得電子設(shè)備執(zhí)行第一方面中任一可能的實現(xiàn)方式中提供的一種音頻采集方法。
38、第四方面,本技術(shù)提供了一種包含指令的計算機程序產(chǎn)品,當(dāng)上述計算機程序產(chǎn)品在電子設(shè)備上運行時,使得電子設(shè)備執(zhí)行上述第一方面任一可能的實現(xiàn)方式中提供的一種音頻采集方法。
39、第五方面,本技術(shù)提供了一種芯片系統(tǒng),芯片系統(tǒng)包括一個或多個處理器,處理器用于調(diào)用計算機指令以使得電子設(shè)備執(zhí)行上述第一方面任一可能的實現(xiàn)方式中提供的一種音頻采集方法。
40、對于第二方面至第五方面有益效果的描述,可以參考第一方面中有益效果的描述,本技術(shù)在此不再贅述。