技術特征:
技術總結
關鍵詞識別方法及裝置,所述方法包括:將獲取的待識別聲音數據劃分為多個重疊的聲音幀;對劃分得到的多個聲音幀的聲音信號分別進行快速傅立葉變換運算,得到對應的頻譜能量;將各個聲音幀對應的頻譜能量轉換為梅爾頻率下的頻譜能量,并計算對應的MFCC參數;根據各個聲音幀對應的MFCC參數,分別計算得到所述待識別聲音數據與預設的多個參考模板之間的DTW距離中值、歐氏距離中值和互相關距離中值;當確定所述待識別聲音數據與當前參考模板之間的DTW距離中值、歐氏距離中值和互相關距離中值的均值小于預設的閾值時,將當前參考模板中的關鍵詞作為識別結果。上述的方案,可以提高關鍵詞識別的準確率,并節(jié)約計算資源。
技術研發(fā)人員:孫廷瑋
受保護的技術使用者:展訊通信(上海)有限公司
技術研發(fā)日:2015.12.25
技術公布日:2017.07.04