技術(shù)總結(jié)
本申請(qǐng)公開(kāi)了一種語(yǔ)音識(shí)別方法,包括:利用預(yù)設(shè)的語(yǔ)音知識(shí)源,生成包含客戶端預(yù)設(shè)信息的、用于對(duì)語(yǔ)音信號(hào)進(jìn)行解碼的搜索空間;提取待識(shí)別語(yǔ)音信號(hào)的特征矢量序列;計(jì)算特征矢量對(duì)應(yīng)于搜索空間基本單元的概率;以所述概率為輸入、在所述搜索空間中執(zhí)行解碼操作,得到與所述特征矢量序列對(duì)應(yīng)的詞序列。本申請(qǐng)同時(shí)提供一種語(yǔ)音識(shí)別裝置,以及另一種語(yǔ)音識(shí)別方法及裝置。采用本申請(qǐng)?zhí)峁┑姆椒?,由于在生成用于解碼的搜索空間時(shí)包含了客戶端預(yù)設(shè)信息,因此在對(duì)客戶端采集的語(yǔ)音信號(hào)進(jìn)行識(shí)別時(shí)能夠相對(duì)準(zhǔn)確地識(shí)別出與客戶端相關(guān)的信息,從而可以提高語(yǔ)音識(shí)別的準(zhǔn)確率,提升用戶的使用體驗(yàn)。
技術(shù)研發(fā)人員:李曉輝;李宏言
受保護(hù)的技術(shù)使用者:阿里巴巴集團(tuán)控股有限公司
文檔號(hào)碼:201510752397
技術(shù)研發(fā)日:2015.11.06
技術(shù)公布日:2017.05.17