本發(fā)明涉及音頻處理,尤其涉及一種音量顯示方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、傳統(tǒng)音頻設(shè)備通常采用固定的標(biāo)準(zhǔn)顯示實時音量水平,這種方法反映了音頻信號的電平大小。在早期模擬音頻設(shè)備中,這種固定音量表顯示方式表現(xiàn)良好,但隨著數(shù)字音頻技術(shù)的發(fā)展和智能設(shè)備的普及,其局限性日益凸顯。固定音量表顯示無法適應(yīng)不同音頻內(nèi)容的動態(tài)范圍差異,導(dǎo)致在某些情況下音量顯示不夠精確或不能反映真實的聽感。同時,它也無法考慮環(huán)境噪聲的影響,在不同環(huán)境下可能導(dǎo)致音量顯示與實際感知不符。此外,不同用戶對音量顯示的偏好存在差異,固定音量表難以滿足個性化顯示需求。因此,傳統(tǒng)固定音量表顯示方式難以充分適應(yīng)現(xiàn)有音頻內(nèi)容和用戶需求,導(dǎo)致音量顯示的準(zhǔn)確性較低。
技術(shù)實現(xiàn)思路
1、本發(fā)明的主要目的在于解決傳統(tǒng)固定音量表顯示方式難以充分適應(yīng)現(xiàn)有音頻內(nèi)容和用戶需求,導(dǎo)致音量顯示的準(zhǔn)確性較低的問題。
2、本發(fā)明第一方面提供了一種音量顯示方法,包括:獲取音頻設(shè)備的音頻信號、環(huán)境噪聲和初始音量顯示設(shè)置;基于所述音頻信號進(jìn)行分析,得到音頻類型和第一音量值;將所述音頻類型、所述環(huán)境噪聲和所述初始音量顯示設(shè)置輸入預(yù)置的用戶偏好模型,得到第二音量值;計算所述環(huán)境噪聲的噪聲水平,并基于所述噪聲水平確定第三音量值;對所述第一音量值、所述第二音量值和所述第三音量值分配對應(yīng)的權(quán)重;基于所述第一音量值、所述第二音量值和所述第三音量值及對應(yīng)的權(quán)重計算出綜合音量值;將所述綜合音量值進(jìn)行映射,得到所述綜合音量值在用戶界面的顯示結(jié)果。
3、在一種可行的實施方式中,所述基于所述音頻信號進(jìn)行分析,得到音頻類型和第一音量值,包括:將所述音頻信號輸入預(yù)置的音頻分類模型,得到所述音頻信號對應(yīng)的音頻類型;計算所述音頻信號的動態(tài)范圍;對所述音頻信號進(jìn)行頻譜分析,得到頻譜分析結(jié)果;基于所述動態(tài)范圍和所述頻譜分析結(jié)果確定第一音量值。
4、在一種可行的實施方式中,所述計算所述音頻信號的動態(tài)范圍,包括:計算所述音頻信號的峰值電平和均方根電平;計算所述峰值電平和所述均方根電平之間的差值,得到音頻信號的動態(tài)范圍。
5、在一種可行的實施方式中,所述對所述音頻信號進(jìn)行頻譜分析,得到頻譜分析結(jié)果,包括:計算所述音頻信號中各頻段的能量;對各頻段的能量進(jìn)行權(quán)重分配;基于各頻段的能量和分配的權(quán)重計算出頻譜能量總和。
6、在一種可行的實施方式中,所述基于所述動態(tài)范圍和所述頻譜分析結(jié)果確定第一音量值,包括:對所述動態(tài)范圍進(jìn)行標(biāo)準(zhǔn)化,得到目標(biāo)動態(tài)范圍;基于所述頻譜能量總和、所述目標(biāo)動態(tài)范圍及預(yù)設(shè)的調(diào)整系數(shù)計算出第一音量值。
7、在一種可行的實施方式中,所述計算所述環(huán)境噪聲的噪聲水平,并基于所述噪聲水平確定第三音量值,包括:計算所述環(huán)境噪聲的短時rms值;計算所述短時rms值的平均值,得到噪聲水平;根據(jù)所述噪聲水平,通過預(yù)設(shè)的映射關(guān)系查詢對應(yīng)的第三音量值。
8、在一種可行的實施方式中,所述基于所述第一音量值、所述第二音量值和所述第三音量值及對應(yīng)的權(quán)重計算出綜合音量值,包括:分別計算所述第一音量值、所述第二音量值和所述第三音量值與對應(yīng)權(quán)重的乘積,并將計算結(jié)果進(jìn)行加和,得到綜合音量值。
9、在一種可行的實施方式中,在所述獲取音頻設(shè)備的音頻信號、環(huán)境噪聲和初始音量顯示設(shè)置之前,還包括:獲取所述音頻設(shè)備的歷史使用記錄,所述歷史使用記錄包括歷史音頻類型、歷史環(huán)境噪聲水平、歷史初始音量顯示設(shè)置和歷史最終音量;將所述歷史音頻類型、所述歷史環(huán)境噪聲水平和所述歷史初始音量顯示設(shè)置作為輸入,所述歷史最終音量顯示作為輸出,對預(yù)置的學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到用戶偏好模型。
10、在一種可行的實施方式中,在獲取音頻設(shè)備的音頻信號、音頻類型、環(huán)境噪聲和初始音量顯示設(shè)置之前,還包括:構(gòu)建不同音頻類型的音量標(biāo)準(zhǔn)曲線,并基于所述音量標(biāo)準(zhǔn)曲線創(chuàng)建查找表。
11、在一種可行的實施方式中,所述將所述綜合音量值進(jìn)行映射,得到所述綜合音量值在用戶界面的顯示結(jié)果,包括:在所述查找表中查找所述綜合音量值對應(yīng)的映射條目,得到音量顯示值;基于所述音量顯示值更新用戶界面上的音量顯示元素。
12、在一種可行的實施方式中,在所述將所述綜合音量值進(jìn)行映射,得到所述綜合音量值在用戶界面的顯示結(jié)果之后,還包括:當(dāng)接收到標(biāo)準(zhǔn)修改指令時,通過預(yù)置的標(biāo)準(zhǔn)轉(zhuǎn)換矩陣字典對顯示標(biāo)準(zhǔn)進(jìn)行轉(zhuǎn)換;實時監(jiān)測設(shè)備的性能指標(biāo),根據(jù)所述性能指標(biāo)的變化對音量顯示的刷新率進(jìn)行調(diào)整。
13、在一種可行的實施方式中,所述通過預(yù)置的標(biāo)準(zhǔn)轉(zhuǎn)換矩陣字典對顯示標(biāo)準(zhǔn)進(jìn)行轉(zhuǎn)換,包括:解析所述標(biāo)準(zhǔn)修改指令,提取出原顯示標(biāo)準(zhǔn)和目標(biāo)顯示標(biāo)準(zhǔn);基于所述原顯示標(biāo)準(zhǔn)和目標(biāo)顯示標(biāo)準(zhǔn)在預(yù)置的標(biāo)準(zhǔn)轉(zhuǎn)換矩陣字典中查找對應(yīng)的轉(zhuǎn)換矩陣;基于所述轉(zhuǎn)換矩陣,根據(jù)目標(biāo)顯示標(biāo)準(zhǔn)對當(dāng)前顯示數(shù)據(jù)進(jìn)行轉(zhuǎn)換,以使顯示數(shù)據(jù)在目標(biāo)顯示標(biāo)準(zhǔn)下顯示。
14、本發(fā)明第二方面提供了一種音量顯示裝置,包括:第一獲取模塊,用于獲取音頻設(shè)備的音頻信號、環(huán)境噪聲和初始音量顯示設(shè)置;分析模塊,用于基于所述音頻信號進(jìn)行分析,得到音頻類型和第一音量值;處理模塊,用于將所述音頻類型、所述環(huán)境噪聲和所述初始音量顯示設(shè)置輸入預(yù)置的用戶偏好模型,得到第二音量值;第一計算模塊,用于計算所述環(huán)境噪聲的噪聲水平,并基于所述噪聲水平確定第三音量值;分配模塊,用于對所述第一音量值、所述第二音量值和所述第三音量值分配對應(yīng)的權(quán)重;第二計算模塊,用于基于所述第一音量值、所述第二音量值和所述第三音量值及對應(yīng)的權(quán)重計算出綜合音量值;映射模塊,用于將所述綜合音量值進(jìn)行映射,得到所述綜合音量值在用戶界面的顯示結(jié)果。
15、在一種可行的實施方式中,所述分析模塊包括:輸入單元,用于將所述音頻信號輸入預(yù)置的音頻分類模型,得到所述音頻信號對應(yīng)的音頻類型;計算單元,用于計算所述音頻信號的動態(tài)范圍;分析單元,用于對所述音頻信號進(jìn)行頻譜分析,得到頻譜分析結(jié)果;確定單元,用于基于所述動態(tài)范圍和所述頻譜分析結(jié)果確定第一音量值。
16、在一種可行的實施方式中,所述計算單元具體用于:計算所述音頻信號的峰值電平和均方根電平;計算所述峰值電平和所述均方根電平之間的差值,得到音頻信號的動態(tài)范圍。
17、在一種可行的實施方式中,所述分析單元具體用于:計算所述音頻信號中各頻段的能量;對各頻段的能量進(jìn)行權(quán)重分配;基于各頻段的能量和分配的權(quán)重計算出頻譜能量總和。
18、在一種可行的實施方式中,所述確定單元具體用于:對所述動態(tài)范圍進(jìn)行標(biāo)準(zhǔn)化,得到目標(biāo)動態(tài)范圍;基于所述頻譜能量總和、所述目標(biāo)動態(tài)范圍及預(yù)設(shè)的調(diào)整系數(shù)計算出第一音量值。
19、在一種可行的實施方式中,所述處理模塊具體用于:計算所述環(huán)境噪聲的短時rms值;計算所述短時rms值的平均值,得到噪聲水平;根據(jù)所述噪聲水平,通過預(yù)設(shè)的映射關(guān)系查詢對應(yīng)的第三音量值。
20、在一種可行的實施方式中,所述第二計算模塊具體用于:分別計算所述第一音量值、所述第二音量值和所述第三音量值與對應(yīng)權(quán)重的乘積,并將計算結(jié)果進(jìn)行加和,得到綜合音量值。
21、在一種可行的實施方式中,所述音量顯示裝置還包括:第二獲取模塊,用于獲取所述音頻設(shè)備的歷史使用記錄,所述歷史使用記錄包括歷史音頻類型、歷史環(huán)境噪聲水平、歷史初始音量顯示設(shè)置和歷史最終音量;訓(xùn)練模塊,用于將所述歷史音頻類型、所述歷史環(huán)境噪聲水平和所述歷史初始音量顯示設(shè)置作為輸入,所述歷史最終音量顯示作為輸出,對預(yù)置的學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到用戶偏好模型。
22、在一種可行的實施方式中,所述音量顯示裝置還包括:創(chuàng)建模塊,用于構(gòu)建不同音頻類型的音量標(biāo)準(zhǔn)曲線,并基于所述音量標(biāo)準(zhǔn)曲線創(chuàng)建查找表。
23、在一種可行的實施方式中,所述映射模塊具體用于:在所述查找表中查找所述綜合音量值對應(yīng)的映射條目,得到音量顯示值;基于所述音量顯示值更新用戶界面上的音量顯示元素。
24、在一種可行的實施方式中,所述音量顯示裝置還包括:轉(zhuǎn)換模塊,用于當(dāng)接收到標(biāo)準(zhǔn)修改指令時,通過預(yù)置的標(biāo)準(zhǔn)轉(zhuǎn)換矩陣字典對顯示標(biāo)準(zhǔn)進(jìn)行轉(zhuǎn)換;調(diào)整模塊,用于實時監(jiān)測設(shè)備的性能指標(biāo),根據(jù)所述性能指標(biāo)的變化對音量顯示的刷新率進(jìn)行調(diào)整。
25、在一種可行的實施方式中,所述轉(zhuǎn)換模塊具體用于:解析所述標(biāo)準(zhǔn)修改指令,提取出原顯示標(biāo)準(zhǔn)和目標(biāo)顯示標(biāo)準(zhǔn);基于所述原顯示標(biāo)準(zhǔn)和目標(biāo)顯示標(biāo)準(zhǔn)在預(yù)置的標(biāo)準(zhǔn)轉(zhuǎn)換矩陣字典中查找對應(yīng)的轉(zhuǎn)換矩陣;基于所述轉(zhuǎn)換矩陣,根據(jù)目標(biāo)顯示標(biāo)準(zhǔn)對當(dāng)前顯示數(shù)據(jù)進(jìn)行轉(zhuǎn)換,以使顯示數(shù)據(jù)在目標(biāo)顯示標(biāo)準(zhǔn)下顯示。
26、本發(fā)明第三方面提供了一種音量顯示設(shè)備,包括:存儲器和至少一個處理器,所述存儲器中存儲有指令;所述至少一個處理器調(diào)用所述存儲器中的所述指令,以使得所述音量顯示設(shè)備執(zhí)行上述的音量顯示方法。
27、本發(fā)明的第四方面提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)中存儲有指令,當(dāng)其在計算機上運行時,使得計算機執(zhí)行上述的音量顯示方法。
28、本發(fā)明提供的技術(shù)方案中,獲取音頻設(shè)備的音頻信號、環(huán)境噪聲和初始音量顯示設(shè)置;基于所述音頻信號進(jìn)行分析,得到音頻類型和第一音量值;將所述音頻類型、所述環(huán)境噪聲和所述初始音量顯示設(shè)置輸入預(yù)置的用戶偏好模型,得到第二音量值;計算所述環(huán)境噪聲的噪聲水平,并基于所述噪聲水平確定第三音量值;對所述第一音量值、所述第二音量值和所述第三音量值分配對應(yīng)的權(quán)重;基于所述第一音量值、所述第二音量值和所述第三音量值及對應(yīng)的權(quán)重計算出綜合音量值;將所述綜合音量值進(jìn)行映射,得到所述綜合音量值在用戶界面的顯示結(jié)果。本發(fā)明實施例中,通過多因素融合和權(quán)重分配機制,使得音量計算更加精確和符合實際需求,提高了音量顯示的準(zhǔn)確性和可靠性。