1.一種語音識別的方法,其特征在于,包括:
將語言模型表示為有限狀態(tài)轉(zhuǎn)移機(jī);
待識別的新詞根據(jù)設(shè)定規(guī)則在所述有限狀態(tài)轉(zhuǎn)移機(jī)上獲得所述新詞對應(yīng)的近義詞;
將所述新詞添加到所述有限狀態(tài)轉(zhuǎn)移機(jī),獲得更新后的有限狀態(tài)轉(zhuǎn)移機(jī),使用所述更新后的有限狀態(tài)轉(zhuǎn)移機(jī)進(jìn)行語音識別。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述待識別的新詞根據(jù)設(shè)定規(guī)則在所述有限狀態(tài)轉(zhuǎn)移機(jī)上獲得所述新詞對應(yīng)的近義詞的步驟包括:
根據(jù)靜態(tài)配置獲得新詞對應(yīng)的近義詞。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述待識別的新詞根據(jù)設(shè)定規(guī)則在所述有限狀態(tài)轉(zhuǎn)移機(jī)上獲得所述新詞對應(yīng)的近義詞的步驟包括:
將所述新詞映射到向量空間,獲得第一向量;
將語言模型詞表中的詞映射到向量空間,獲得第二向量;
根據(jù)所述第一向量和所述第二向量利用余弦距離公式,獲得新詞和所述詞表中的詞之間的相似度;
將所述相似度高的所述詞表中的詞確定為新詞對應(yīng)的近義詞。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將所述近似詞添加到所述有限狀態(tài)轉(zhuǎn)移機(jī),獲得更新后的有限狀態(tài)轉(zhuǎn)移機(jī)的步驟包括:
將所述獲得新詞和所述詞表中的詞之間的相似度與近義詞的權(quán)重的乘積作為新詞的權(quán)重;
將所述新詞和所述新詞的權(quán)重并列添加在所述有限狀態(tài)轉(zhuǎn)移機(jī)中的近似詞處,獲得更新后的有限狀態(tài)轉(zhuǎn)移機(jī)。
5.一種語音識別的裝置,其特征在于,包括:
轉(zhuǎn)換模塊,用于將語言模型表示為有限狀態(tài)轉(zhuǎn)移機(jī);
近義詞模塊,用于待識別的新詞根據(jù)設(shè)定規(guī)則在所述有限狀態(tài)轉(zhuǎn)移機(jī)上獲得所述新詞對應(yīng)的近義詞;
更新模塊,用于將所述近似詞添加到所述有限狀態(tài)轉(zhuǎn)移機(jī),獲得更新后的有限狀態(tài)轉(zhuǎn)移機(jī),使用所述更新后的有限狀態(tài)轉(zhuǎn)移機(jī)進(jìn)行語音識別。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,近義詞模塊包括:
配置子模塊,用于根據(jù)靜態(tài)配置獲得新詞對應(yīng)的近義詞。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在于,近義詞模塊包括:
第一映射子模塊,用于將所述新詞映射到向量空間,獲得第一向量;
第二映射子模塊,用于將語言模型的詞表中的詞映射到向量空間,獲得第二向量;
詞間距離子模塊,用于根據(jù)所述第一向量和所述第二向量利用余弦距離公式,獲得新詞和所述詞表中的詞之間的相似度;
確定子模塊,用于將所述相似度高的所述詞表中的詞確定為新詞對應(yīng)的近義詞。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述更新模塊具體用于:
將所述獲得新詞和所述詞表中的詞之間的相似度與近義詞的權(quán)重的乘積作為新詞的權(quán)重;
將所述新詞和所述新詞的權(quán)重并列添加在所述有限狀態(tài)轉(zhuǎn)移機(jī)中的近似詞處,獲得更新后的有限狀態(tài)轉(zhuǎn)移機(jī)。