1.一種偽造語(yǔ)音檢測(cè)方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的偽造語(yǔ)音檢測(cè)方法,其特征在于,所述采集待檢測(cè)的語(yǔ)音信號(hào),將所述語(yǔ)音信號(hào)轉(zhuǎn)換為時(shí)序數(shù)字信號(hào),并對(duì)所述時(shí)序數(shù)字信號(hào)進(jìn)行預(yù)處理,得到離散語(yǔ)音信號(hào),包括:
3.根據(jù)權(quán)利要求1所述的偽造語(yǔ)音檢測(cè)方法,其特征在于,所述在所述離散語(yǔ)音信號(hào)上進(jìn)行傅里葉變換得到幅度譜,在所述幅度譜上進(jìn)行二次插值,得到每個(gè)頻率窗口的峰值,組合所述峰值得到所述離散語(yǔ)音信號(hào)的峰頻矩陣,包括:
4.根據(jù)權(quán)利要求1所述的偽造語(yǔ)音檢測(cè)方法,其特征在于,所述提取所述離散語(yǔ)音信號(hào)的線(xiàn)性頻率倒譜系數(shù),將所述峰頻和所述線(xiàn)性頻率倒譜系數(shù)進(jìn)行拼接得到融合特征,包括:
5.根據(jù)權(quán)利要求1所述的偽造語(yǔ)音檢測(cè)方法,其特征在于,所述偽造語(yǔ)音檢測(cè)模型包括二維卷積層、res2net模塊、全局平均池化層、全連接層和softmax分類(lèi)模塊;
6.根據(jù)權(quán)利要求3所述的偽造語(yǔ)音檢測(cè)方法,其特征在于,所述擬合所述幅度譜上每幀的頻率窗口和幅度確定一條拋物線(xiàn),通過(guò)假設(shè)三個(gè)已知幅度值的位置進(jìn)行二次插值確定幅度峰值對(duì)應(yīng)的頻率窗口,重復(fù)進(jìn)行多次二次插值,得到多個(gè)峰頻,包括:
7.根據(jù)權(quán)利要求1所述的偽造語(yǔ)音檢測(cè)方法,其特征在于,所述偽造語(yǔ)音檢測(cè)模型的訓(xùn)練過(guò)程包括:
8.一種偽造語(yǔ)音檢測(cè)裝置,其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有多條指令,所述指令適于由處理器加載以執(zhí)行權(quán)利要求1至7任一項(xiàng)所述的偽造語(yǔ)音檢測(cè)方法。
10.一種電子設(shè)備,其特征在于,包括處理器和存儲(chǔ)器,所述處理器與所述存儲(chǔ)器電性連接,所述存儲(chǔ)器用于存儲(chǔ)指令和數(shù)據(jù),所述處理器用于執(zhí)行權(quán)利要求1至7任一項(xiàng)所述的偽造語(yǔ)音檢測(cè)方法中的步驟。