本技術(shù)涉及終端,尤其涉及音頻處理方法、電子設(shè)備及計算機可讀存儲介質(zhì)。
背景技術(shù):
1、隨著手機、平板等終端設(shè)備的處理能力越來越強,以音頻降噪為主的音頻處理技術(shù)在手機、平板等終端設(shè)備上也得到了廣泛應(yīng)用。
2、在用戶使用手機進行日常通話過程中,通話一方或者雙方可能處于噪聲環(huán)境中(如人流較多的商場、高鐵站、機場等),這導(dǎo)致通話一方無法聽清另一方所說的內(nèi)容,通話質(zhì)量較差。
技術(shù)實現(xiàn)思路
1、本技術(shù)實施例公開了音頻處理方法、電子設(shè)備及計算機可讀存儲介質(zhì),在通話過程中,通過對來自對端的通話音頻數(shù)據(jù)進行語義分析,可以動態(tài)調(diào)整電子設(shè)備的上行音頻處理策略,從而可以提高通話質(zhì)量,使得用戶獲得更好的通話體驗。
2、第一方面公開一種音頻處理方法,該方法可以應(yīng)用于第一電子設(shè)備,也可以應(yīng)用于第一電子設(shè)備中的模塊(例如,處理器),還可以應(yīng)用于能實現(xiàn)全部或部分第一電子設(shè)備功能的邏輯模塊或軟件。下面以應(yīng)用于第一電子設(shè)備為例進行描述,該通信方法可以包括:在該第一電子設(shè)備與第二電子設(shè)備通話過程中,對通話音頻數(shù)據(jù)進行語義分析,得到目標(biāo)語義分析結(jié)果;該通話音頻數(shù)據(jù)包括來自該第二電子設(shè)備的通話音頻數(shù)據(jù);基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略;其中,該音頻處理策略包括上行音頻處理策略,該上行音頻處理策略用于對該第一電子設(shè)備采集的通話音頻數(shù)據(jù)進行處理。
3、本技術(shù)實施例中,在通話過程中,第一電子設(shè)備可以對來自第二電子設(shè)備的通話音頻數(shù)據(jù)(如“你聲音好小呀”,“你那邊太吵了,聽不清”)進行語義分析,得到語義分析結(jié)果?;谡Z義分析結(jié)果,第一電子設(shè)備可以了解對端(第二電子設(shè)備)用戶的實際通話感受或者本端(第一電子設(shè)備)的通話音頻質(zhì)量,如本端噪音是否較大、本端聲音是否較小等,因此,第一電子設(shè)備可以基于語義分析結(jié)果動態(tài)調(diào)整本端的上行音頻處理策略(如在對端反饋本端噪音較大的情況下,選用更高一級的降噪強度)。之后,第一電子設(shè)備可以通過調(diào)整后的上行音頻處理策略對第一電子設(shè)備采集的通話音頻數(shù)據(jù)進行處理,可以使得向第二電子設(shè)備發(fā)送的通話音頻數(shù)據(jù)的音頻質(zhì)量更好,使得對端用戶獲得更好的通話體驗。
4、結(jié)合第一方面,在一種可能的實施方式中,該上行音頻處理策略包括上行降噪強度、上行音頻增益、上行降噪場景中的一項或多項。
5、本技術(shù)實施例中,針對上行音頻處理策略,可以包括上行降噪強度、上行音頻增益、上行降噪場景等多個選項。其中,上行降噪強度可以用于調(diào)整噪音的消除程度,可以用于滿足不同用戶和各種場景下的降噪需求。如降噪強度弱可以消除小部分噪音,降噪強度中可以消除大部分噪音,降噪強度強可以完全消除噪音。上行音頻增益可以用于調(diào)整傳遞給第二電子設(shè)備側(cè)的音頻數(shù)據(jù)的幅度,也即是可以調(diào)整音量的大小,通過調(diào)整上行音頻增益可以幫助對端用戶可以聽得更清楚。而針對于降噪場景而言,不同的降噪場景可以對應(yīng)有不同的降噪模型,通過調(diào)整合適的降噪場景,可以獲得最好的降噪效果,可以在降噪的同時盡量減輕對目標(biāo)人聲的影響。
6、結(jié)合第一方面,在一種可能的實施方式中,該通話音頻數(shù)據(jù)還包括該第一電子設(shè)備采集的通話音頻數(shù)據(jù)。
7、本技術(shù)實施例中,通話音頻數(shù)據(jù)還包括該第一電子設(shè)備采集的通話音頻數(shù)據(jù),也即是本端的通話音頻數(shù)據(jù),這樣,第一電子設(shè)備可以基于對話上下文(本端用戶與對端用戶的對話)得到更加完整以及準(zhǔn)確的語義分析結(jié)果,從而可以保證能夠更加準(zhǔn)確地調(diào)整上行降噪策略。
8、結(jié)合第一方面,在一種可能的實施方式中,該音頻處理策略還包括下行音頻處理策略。
9、結(jié)合第一方面,在一種可能的實施方式中,該下行音頻處理策略包括下行降噪強度、下行音頻增益、下行降噪場景中的一項或多項。
10、本技術(shù)實施例中,第一電子設(shè)備還可以基于通話音頻數(shù)據(jù)的語義分析結(jié)果動態(tài)調(diào)整下行音頻處理策略,如降噪場景、降噪強度等,可以使得本端用戶獲得更好的通話體驗。
11、結(jié)合第一方面,在一種可能的實施方式中,該基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略包括:在該目標(biāo)語義分析結(jié)果為多個預(yù)設(shè)語義分析結(jié)果之一的情況下,基于該目標(biāo)語義結(jié)果對應(yīng)的調(diào)整策略調(diào)整音頻處理策略;該多個預(yù)設(shè)語義分析結(jié)果均配置有對應(yīng)的調(diào)整策略,該調(diào)整策略用于指示需要調(diào)整的音頻處理策略中的參數(shù)以及調(diào)整方式。
12、本技術(shù)實施例中,可以提前配置多個預(yù)設(shè)語義分析結(jié)果,以及每個預(yù)設(shè)語義分析結(jié)果對應(yīng)的調(diào)整策略,這樣,可以保證第一電子設(shè)備基于通話音頻數(shù)據(jù)的語義分析結(jié)果能夠高效以及準(zhǔn)確地調(diào)整上行音頻處理策略。
13、結(jié)合第一方面,在一種可能的實施方式中,該方法還包括:發(fā)起定位,得到第一定位結(jié)果;基于該第一定位結(jié)果調(diào)整上行降噪場景,不同的降噪場景對應(yīng)不同的降噪模型。
14、本技術(shù)實施例中,通過定位可以準(zhǔn)確地確定當(dāng)前本端所處的上行降噪場景,從而可以采用最合適的降噪模型進行降噪處理,進而可以保證獲得最好的降噪效果。
15、結(jié)合第一方面,在一種可能的實施方式中,該方法還包括:接收來自該第二電子設(shè)備的第一指示信息,該第一指示信息用于指示該第一電子設(shè)備的音頻質(zhì)量問題;基于該第一指示信息調(diào)整上行音頻處理策略。
16、本技術(shù)實施例中,第一電子設(shè)備還可以基于來自第二電子設(shè)備的第一指示信息調(diào)整上行音頻處理策略,以提高通話音頻的質(zhì)量,使得對端用戶獲得更好的通話體驗。
17、結(jié)合第一方面,在一種可能的實施方式中,該基于該第一指示信息調(diào)整上行音頻處理策略包括:基于該第一指示信息對應(yīng)的調(diào)整策略調(diào)整上行音頻處理策略;該第一指示信息包括多種取值情況,該多種取值情況均配置有對應(yīng)的調(diào)整策略,該調(diào)整策略用于指示需要調(diào)整的音頻處理策略中的參數(shù)以及調(diào)整方式。
18、本技術(shù)實施例中,可以提前確定多種可能的場景,每種場景可以對應(yīng)一種指示信息的取值,并且針對每種指示信息的取值可以預(yù)配置對應(yīng)的調(diào)整策略,這樣,可以保證第一電子設(shè)備基于第一指示信息可以高效以及準(zhǔn)確地調(diào)整上行音頻處理策略。
19、結(jié)合第一方面,在一種可能的實施方式中,在基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略之前,該方法還包括:對第六音頻數(shù)據(jù)進行語義分析,得到第六語義分析結(jié)果;該第六音頻數(shù)據(jù)包括來自該第二電子設(shè)備的通話音頻數(shù)據(jù)和/或該第一電子設(shè)備采集的通話音頻數(shù)據(jù);在該第六語義分析結(jié)果為多個預(yù)設(shè)語義分析結(jié)果之一的情況下,開啟智能通話模式;該基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略包括:在該智能通話模式開啟的情況下,基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略。
20、本技術(shù)實施例中,由于大部分情況下,第一電子設(shè)備通常處于噪聲較小或基本沒有噪聲的環(huán)境,因此,第一電子設(shè)備每次進行通話時,智能通話模式可以默認(rèn)處于關(guān)閉狀態(tài),這種情況下,第一電子設(shè)備可以不用進行降噪等處理。在通話過程中,第一電子設(shè)備可以對來自第二電子設(shè)備的通話音頻數(shù)據(jù)等進行語義分析,在基于語義分析確定通話音頻質(zhì)量存在問題時(如本端噪音較大、本端聲音較小),第一電子設(shè)備可以再打開智能通話模式,進行降噪等處理。可見,這種方式下,第一電子設(shè)備可以僅在基于語義分析結(jié)果確定滿足特定條件時,才打開智能通話模式進行降噪等處理,這樣,可以盡量避免第一電子設(shè)備無意義的降噪處理,可以降低第一電子設(shè)備的整體功耗。
21、結(jié)合第一方面,在一種可能的實施方式中,在基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略之前,該方法還包括:接收來自該第二電子設(shè)備的第一請求消息,該第一請求消息用于請求開啟智能通話模式;基于該第一請求消息開啟智能通話模式;該基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略包括:在該智能通話模式開啟的情況下,基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略。
22、結(jié)合第一方面,在一種可能的實施方式中,該方法還包括:接收來自該第二電子設(shè)備的第二請求消息,該第二請求消息用于請求調(diào)整上行音頻處理策略,該第二請求消息包括需要調(diào)整的上行音頻處理策略中的參數(shù)以及對應(yīng)的參數(shù)值;基于該第二請求消息調(diào)整上行音頻處理策略。
23、本技術(shù)實施例中,第一電子設(shè)備還可以基于來自第二電子設(shè)備的請求消息直接開啟智能通話模式,或者直接調(diào)整上行音頻處理策略,可以提高智能通話模式開啟的靈活性,以及上行音頻處理策略調(diào)整的靈活性。示例性的,第二電子設(shè)備端可以提供對應(yīng)的用于請求對端開啟智能通話模式的控件,以及請求對端調(diào)整上行音頻處理策略的控件,這樣,第二電子設(shè)備端的用戶可以根據(jù)實際的通話感受請求對端開啟智能通話模式或者調(diào)整上行音頻處理策略,以提高通話質(zhì)量,使得自身獲得更好的通話體驗。
24、結(jié)合第一方面,在一種可能的實施方式中,該方法還包括:顯示第一用戶界面,該第一用戶界面包括音頻處理配置控件;響應(yīng)于作用在該音頻處理配置控件的用戶操作,顯示第二用戶界面;該第二用戶界面包括上行音頻處理配置區(qū)域,該上行音頻處理配置區(qū)域包括降噪強度配置區(qū)域、音頻增益配置區(qū)域、降噪場景配置區(qū)域中的一項或多項,該降噪強度配置區(qū)域包括多個降噪強度選項,該音頻增益配置區(qū)域包括多個音頻增益選項,該降噪場景配置區(qū)域包括多個降噪場景選項;響應(yīng)于作用在第一選項的用戶操作,將該第一選項更改為選中狀態(tài),且啟用該第一選項對應(yīng)的音頻處理策略;該第一選項為該第二用戶界面中的任一選項。
25、本技術(shù)實施例中,第一電子設(shè)備還可以提供上行音頻處理策略對應(yīng)的配置界面,可以便于用戶手動進行調(diào)整,可以進一步提高上行音頻處理策略調(diào)整的靈活性。
26、結(jié)合第一方面,在一種可能的實施方式中,該方法還包括:接收來自該第二電子設(shè)備的第四音頻數(shù)據(jù);基于當(dāng)前下行音頻處理策略對該第四音頻數(shù)據(jù)進行處理,得到第五音頻數(shù)據(jù);對該第五音頻數(shù)據(jù)進行分析,確定該第五音頻數(shù)據(jù)的音頻質(zhì)量問題;基于該第五音頻數(shù)據(jù)的音頻質(zhì)量問題調(diào)整下行音頻處理策略。
27、本技術(shù)實施例中,第一電子設(shè)備還可以對經(jīng)過本端下行音頻處理策略處理過的音頻數(shù)據(jù)進行分析,然后基于分析結(jié)果調(diào)整下行音頻處理策略,可以保證下行音頻處理策略的準(zhǔn)確性,使得本端用戶獲得更好的通話體驗。
28、第二方面公開一種音頻處理方法,該方法可以應(yīng)用于第一電子設(shè)備,也可以應(yīng)用于第一電子設(shè)備中的模塊(例如,處理器),還可以應(yīng)用于能實現(xiàn)全部或部分第一電子設(shè)備功能的邏輯模塊或軟件。下面以應(yīng)用于第一電子設(shè)備為例進行描述,該通信方法可以包括:在該第一電子設(shè)備與第二電子設(shè)備通話過程中,對通話音頻數(shù)據(jù)進行語義分析,得到目標(biāo)語義分析結(jié)果;該通話音頻數(shù)據(jù)包括該第一電子設(shè)備采集的通話音頻數(shù)據(jù);基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略;該音頻處理策略包括下行音頻處理策略,該下行音頻處理策略用于對來自該第二電子設(shè)備的通話音頻數(shù)據(jù)進行處理。
29、結(jié)合第二方面,在一種可能的實施方式中,該下行音頻處理策略包括下行降噪強度、下行音頻增益、下行降噪場景中的一項或多項。
30、結(jié)合第二方面,在一種可能的實施方式中,該音頻處理策略還包括上行音頻處理策略。
31、結(jié)合第二方面,在一種可能的實施方式中,該上行音頻處理策略包括上行降噪強度、上行音頻增益、上行降噪場景中的一項或多項。
32、結(jié)合第二方面,在一種可能的實施方式中,該通話音頻數(shù)據(jù)還包括來自該第二電子設(shè)備的通話音頻數(shù)據(jù)。
33、需要說明的是,本技術(shù)第二方面的技術(shù)方案與第一方面的技術(shù)方案可能存在對應(yīng)或者類似,相關(guān)的有益效果可以參考第一方面的有益效果。
34、第三方面公開一種音頻處理方法,該方法可以應(yīng)用于第一電子設(shè)備,也可以應(yīng)用于第一電子設(shè)備中的模塊(例如,處理器),還可以應(yīng)用于能實現(xiàn)全部或部分第一電子設(shè)備功能的邏輯模塊或軟件。下面以應(yīng)用于第一電子設(shè)備為例進行描述,該通信方法可以包括:在該第一電子設(shè)備與第二電子設(shè)備通話過程中,對通話音頻數(shù)據(jù)進行語義分析,得到目標(biāo)語義分析結(jié)果;該通話音頻數(shù)據(jù)包括來自該第二電子設(shè)備的通話音頻數(shù)據(jù);基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略;其中,該音頻處理策略包括下行音頻處理策略,該下行音頻處理策略用于對來自該第二電子設(shè)備的通話音頻數(shù)據(jù)進行處理。
35、結(jié)合第三方面,在一種可能的實施方式中,該下行音頻處理策略包括下行降噪強度、下行音頻增益、下行降噪場景中的一項或多項。
36、結(jié)合第三方面,在一種可能的實施方式中,該音頻處理策略還包括上行音頻處理策略。
37、結(jié)合第三方面,在一種可能的實施方式中,該上行音頻處理策略包括上行降噪強度、上行音頻增益、上行降噪場景中的一項或多項。
38、結(jié)合第三方面,在一種可能的實施方式中,該通話音頻數(shù)據(jù)還包括該第一電子設(shè)備采集的通話音頻數(shù)據(jù)。
39、需要說明的是,本技術(shù)第三方面的技術(shù)方案與第一方面的技術(shù)方案可能存在對應(yīng)或者類似,相關(guān)的有益效果可以參考第一方面的有益效果。
40、第四方面公開一種音頻處理方法,該方法可以應(yīng)用于第一電子設(shè)備,也可以應(yīng)用于第一電子設(shè)備中的模塊(例如,處理器),還可以應(yīng)用于能實現(xiàn)全部或部分第一電子設(shè)備功能的邏輯模塊或軟件。下面以應(yīng)用于第一電子設(shè)備為例進行描述,該通信方法可以包括:在該第一電子設(shè)備與第二電子設(shè)備通話過程中,對通話音頻數(shù)據(jù)進行語義分析,得到目標(biāo)語義分析結(jié)果;該通話音頻數(shù)據(jù)包括該第一電子設(shè)備采集的通話音頻數(shù)據(jù);基于該目標(biāo)語義分析結(jié)果調(diào)整音頻處理策略;該音頻處理策略包括上行音頻處理策略,該上行音頻處理策略用于對該第一電子設(shè)備采集的通話音頻數(shù)據(jù)進行處理。
41、結(jié)合第四方面,在一種可能的實施方式中,該上行音頻處理策略包括上行降噪強度、上行音頻增益、上行降噪場景中的一項或多項。
42、結(jié)合第四方面,在一種可能的實施方式中,該音頻處理策略還包括下行音頻處理策略。
43、結(jié)合第四方面,在一種可能的實施方式中,該下行音頻處理策略包括下行降噪強度、下行音頻增益、下行降噪場景中的一項或多項。
44、結(jié)合第四方面,在一種可能的實施方式中,該通話音頻數(shù)據(jù)還包括來自該第二電子設(shè)備的通話音頻數(shù)據(jù)。
45、需要說明的是,本技術(shù)第四方面的技術(shù)方案與第一方面的技術(shù)方案可能存在對應(yīng)或者類似,相關(guān)的有益效果可以參考第一方面的有益效果。
46、第五方面公開一種電子設(shè)備,該電子設(shè)備可以為第一電子設(shè)備,該電子設(shè)備包括處理器和通信接口;該通信接口用于接收和發(fā)送數(shù)據(jù);該處理器調(diào)用存儲器中存儲的計算機程序或計算機指令實現(xiàn)如上述第一方面以及第一方面中任一可能的實施方式中所提供的方法,或?qū)崿F(xiàn)如上述第二方面以及第二方面中任一可能的實施方式中所提供的方法,或?qū)崿F(xiàn)如上述第三方面以及第三方面中任一可能的實施方式中所提供的方法,或?qū)崿F(xiàn)如上述第四方面以及第四方面中任一可能的實施方式中所提供的方法。
47、作為一種可能的實施方式,上述第五方面公開的通信裝置包括的處理器可以是一個或多個。
48、可選地,上述第五方面公開的通信裝置還包括一個或多個存儲器。
49、第六方面公開一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)上存儲有計算機程序或計算機指令,當(dāng)該計算機程序或計算機指令運行時,實現(xiàn)如上述第一方面以及第一方面中任一可能的實施方式中所提供的方法,或者實現(xiàn)如上述第二方面以及第二方面中任一可能的實施方式中所提供的方法,或者實現(xiàn)如上述第三方面以及第三方面中任一可能的實施方式中所提供的方法,或者實現(xiàn)如上述第四方面以及第四方面中任一可能的實施方式中所提供的方法。
50、第七方面公開一種芯片,包括處理器,用于執(zhí)行存儲器中存儲的程序,當(dāng)程序被執(zhí)行時,使得芯片執(zhí)行上述第一方面以及第一方面中任一可能的實施方式中所提供的方法,或者執(zhí)行如上述第二方面以及第二方面中任一可能的實施方式中所提供的方法,或者執(zhí)行如上述第三方面以及第三方面中任一可能的實施方式中所提供的方法,或者執(zhí)行如上述第四方面以及第四方面中任一可能的實施方式中所提供的方法。
51、作為一種可能的實施方式,存儲器位于芯片之外。
52、第八方面公開一種計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括計算機程序代碼,當(dāng)該計算機程序代碼被運行時,使得上述第一方面以及第一方面中任一可能的實施方式中所提供的方法被執(zhí)行,或使得上述第二方面以及第二方面中任一可能的實施方式中所提供的方法被執(zhí)行,或使得上述第三方面以及第三方面中任一可能的實施方式中所提供的方法被執(zhí)行,或使得上述第四方面以及第四方面中任一可能的實施方式中所提供的方法。
53、應(yīng)理解,本技術(shù)上述多個方面或者任一種可能的實施方式的實現(xiàn)和有益效果可互相參考。