本申請涉及數(shù)據(jù)處理,尤其涉及音頻處理方法、裝置、設備、介質及產(chǎn)品。
背景技術:
1、目前,可以在音頻數(shù)據(jù)處理場景下,通過自適應濾波、譜減法、維納濾波法等等方法對音頻數(shù)據(jù)中的噪聲進行去噪處理,以實現(xiàn)對音頻數(shù)據(jù)的音頻去找。
2、然而,發(fā)明人在實踐過程中發(fā)現(xiàn),現(xiàn)有的音頻處理方法的去噪效果受到帶噪音頻數(shù)據(jù)的信噪比的影響,比如,對于整段長度較長的音頻數(shù)據(jù)(例如,語言數(shù)據(jù)x)而言,一旦該音頻數(shù)據(jù)x的信噪比較小,則會導致在這段音頻數(shù)據(jù)中存在大量的噪音,因此,在采用現(xiàn)有的音頻處理方法對這段音頻數(shù)據(jù)進行音頻去噪的過程中將難以對在該音頻數(shù)據(jù)中所出現(xiàn)的大量噪音進行有效地去噪處理,以至于會出現(xiàn)在去噪處理后的音頻數(shù)據(jù)中仍然會攜帶一些噪音,進而降低了對音頻數(shù)據(jù)的音頻去噪質量。
技術實現(xiàn)思路
1、本申請實施例提供了一種音頻處理方法、裝置、設備、介質及產(chǎn)品,能夠在對音頻數(shù)據(jù)進行處理的過程中,提取通道權重矩陣和頻帶權重矩陣,從而可以確定在時間特征上的通道和頻帶所對應的權重,從而能夠提升對音頻數(shù)據(jù)的音頻去噪質量。
2、本申請實施例一方面提供了一種音頻處理方法,方法包括:
3、對第一音頻數(shù)據(jù)的時頻譜數(shù)據(jù)進行特征提取,得到時頻譜數(shù)據(jù)的第一特征矩陣;第一特征矩陣包括通道特征、時間特征和頻帶特征;
4、基于通道特征、時間特征和頻帶特征,得到第一通道權重矩陣和第一頻帶權重矩陣;
5、將第一通道權重矩陣和第一頻帶權重矩陣進行矩陣乘積,得到時間通道權重矩陣;
6、將第一特征矩陣和時間通道權重矩陣進行哈達瑪乘積,得到第二特征矩陣;
7、基于第二特征矩陣對第一音頻數(shù)據(jù)進行去噪,得到第一音頻數(shù)據(jù)對應的第二音頻數(shù)據(jù)。
8、本申請實施例一方面提供了一種音頻處理裝置,裝置包括:
9、第一特征提取模塊,用于對第一音頻數(shù)據(jù)的時頻譜數(shù)據(jù)進行特征提取,得到時頻譜數(shù)據(jù)的第一特征矩陣;第一特征矩陣包括通道特征、時間特征和頻帶特征;
10、權重提取模塊,用于基于通道特征、時間特征和頻帶特征,得到第一通道權重矩陣和第一頻帶權重矩陣;
11、權重融合模塊,用于將第一通道權重矩陣和第一頻帶權重矩陣進行矩陣乘積,得到時間通道權重矩陣;
12、特征融合模塊,用于將第一特征矩陣和時間通道權重矩陣進行哈達瑪乘積,得到第二特征矩陣;
13、音頻去噪模塊,用于基于第二特征矩陣對第一音頻數(shù)據(jù)進行去噪,得到第一音頻數(shù)據(jù)對應的第二音頻數(shù)據(jù)。
14、本申請實施例一方面提供了一種計算機可讀存儲介質,計算機可讀存儲介質存儲有計算機程序,該計算機程序適于由處理器加載并執(zhí)行,以使得具有該處理器的計算機設備執(zhí)行本申請實施例提供的方法。
15、本申請實施例一方面提供了一種計算機程序產(chǎn)品或計算機程序,該計算機程序產(chǎn)品或計算機程序包括計算機指令,該計算機指令存儲在計算機可讀存儲介質中。計算機設備的處理器從計算機可讀存儲介質讀取該計算機指令,處理器執(zhí)行該計算機指令,使得該計算機設備執(zhí)行本申請實施例提供的方法。
16、在本申請實施例中,在對音頻數(shù)據(jù)進行處理時,可以對音頻數(shù)據(jù)的時頻譜數(shù)據(jù)進行特征提取,得到第一特征矩陣,進而可以基于第一特征矩陣中的通道特征、時間特征和頻帶特征,確定出第一通道權重矩陣和第一頻帶權重矩陣,該第一通道權重矩陣和第一頻帶權重矩陣可以關注到在時間特征上通道和頻帶的特征差異,進而可以基于第一通道權重矩陣和第一頻帶權重矩陣進行矩陣乘積,得到時間通道權重矩陣,該時間通道權重矩陣可以表征時間特征上的頻帶特征權重和通道特征權重所融合的得到的權重矩陣,進而可以將第一特征矩陣和時間通道權重矩陣進行哈達瑪乘積,以將時間通道權重矩陣添加到第一特征矩陣,得到第二特征矩陣,則該第二特征矩陣可以關注到在時間特征上的特征權重差異,從而表征出時間特征上的潛在噪音規(guī)律,針對各種時間長度的音頻數(shù)據(jù)均可以不受信噪比對音頻數(shù)據(jù)的去噪的影響,進而可以基于該第二特征矩陣進行去噪,能夠對音頻數(shù)據(jù)中的噪音信息進行去除,從而提升對音頻數(shù)據(jù)的音頻去噪質量。
1.一種音頻處理方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述的方法,其特征在于,所述基于所述通道特征、所述時間特征和所述頻帶特征,得到第一通道權重矩陣,包括:
3.根據(jù)權利要求2所述的方法,其特征在于,所述對所述第三特征矩陣進行線性變換,得到第二通道權重矩陣,包括:
4.根據(jù)權利要求1所述的方法,其特征在于,所述基于所述通道特征、所述時間特征和所述頻帶特征,得到第一頻帶權重矩陣,包括:
5.根據(jù)權利要求4所述的方法,其特征在于,所述對所述第四特征矩陣進行線性變換,第二頻帶權重矩陣,包括:
6.根據(jù)權利要求1所述的方法,其特征在于,所述將所述第一通道權重矩陣和所述第一頻帶權重矩陣進行矩陣乘積,得到時間通道權重矩陣之后,所述方法還包括:
7.根據(jù)權利要求1所述的方法,其特征在于,所述基于所述第二特征矩陣對所述第一音頻數(shù)據(jù)進行去噪,得到所述第一音頻數(shù)據(jù)對應的第二音頻數(shù)據(jù),包括:
8.一種音頻處理裝置,其特征在于,所述裝置包括:
9.一種計算機設備,其特征在于,包括存儲器和處理器;
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有計算機程序,所述計算機程序適于由處理器加載并執(zhí)行,以使得具有所述處理器的計算機設備執(zhí)行權利要求1-7任一項所述的方法。
11.一種計算機程序產(chǎn)品,其特征在于,包括計算機程序/指令,所述計算機程序/指令被處理器執(zhí)行時實現(xiàn)權利要求1-7任一項所述的方法。