基于雙向LSTM神經網絡的語句識別方法及裝置與流程

文檔序號：11864648閱讀：來源：國知局

技術特征：

1.一種基于雙向LSTM神經網絡的語句識別方法，其特征在于，所述方法包括：

獲取第一輸入系統(tǒng)和第二輸入系統(tǒng)中語句的第一切詞序列x₁＝{x₁₁，x₁₂，……，x_1n}和第二切詞序列x₂＝{x₂₁，x₂₂，……，x_2m}；

建立兩個雙向LSTM神經網絡模型；

將所述第一切詞序列和所述第二切詞序列分別作為所述兩個雙向LSTM神經網絡模型的第一輸入序列和第二輸入序列；

通過所述雙向LSTM神經網絡模型的參數(shù)對所述第一輸入序列和所述第二輸入序列進行標準化，以獲得標準化后的第一輸出y₁和第二輸出y₂；

比較所述第一輸出y₁和第二輸出y₂，以實現(xiàn)語義識別；

其中，n為所述第一切詞序列的元素數(shù)量，m為所述第二切詞序列的元素數(shù)量。

2.如權利要求1所述的語句識別方法，其特征在于，所述建立兩個雙向LSTM神經網絡模型，其中，每個雙向LSTM神經網絡模型包括：輸入、輸入門、遺忘門、記憶細胞、tanh函數(shù)、隱藏層、反饋部、輸出門；其中，在輸入的序列為t時，參數(shù)的計算公式如下：

G_feedback(t)＝sigmoid(W_fxx_t+W_fh1h_t-1+W_fm1m_t-1+W_fh2h_t+1+W_fm2m_t+1+e_f)；

G_input(t)＝sigmoid(W_ih1h_t-1+W_im1m_t-1+W_ifG_feedback(t)+W_ih2h_t+1+W_im2m_t+1+e_i)；

G_disremember(t)＝sigmoid(W_dh1h_t-1+W_dm1m_t-1+W_dfG_feedback(t)+W_dh2h_t+1+W_dm2m_t+1+e_d)；

m_t＝G_disremember(t)x m_t-1+G_disremember(t)x m_t+1+G_input(t)x tanh(W_mfG_feedback(t)+W_mh1h_t-1+W_mh2h_t+1+e_m)；

G_output(t)＝sigmoid(W_ofG_feedback(t)+W_oh1h_t-1+W_om1m_t-1+W_oh2h_t+1+W_om2m_t+1+e_o)；

h_t＝G_output(t)x m_t；

y_t＝softmax_k(W_yhh_t+e_y)；

其中，

G_feedback(t)為序列為t時反饋門的輸出；

W_fx1為序列為t時反饋門與序列為t時輸入x_t的權值；

W_fh1為序列為t時反饋門與序列為t-1時隱藏層輸入h_t-1之間的權值；

W_fh2為序列為t時反饋門與序列為t+1時隱藏層輸入h_t+1之間的權值；

W_fm1為序列為t時反饋門與序列為t-1時記憶細胞輸入m_t-1之間的權值；

W_fm2為序列為t時反饋門與序列為t+1時記憶細胞輸入m_t+1之間的權值；

G_input(t)為序列為t時輸入門的輸出；

W_ih1為序列為t時輸入門與序列為t-1時隱藏層輸入h_t-1之間的權值；

W_ih2為序列為t時輸入門與序列為t+1時隱藏層輸入h_t+1之間的權值；

W_im1為序列為t時輸入門與序列為t-1時記憶細胞輸入m_t-1之間的權值；

W_im2為序列為t時輸入門與序列為t+1時記憶細胞輸入m_t+1之間的權值；

W_if為序列為t時輸入門與序列為t時反饋門之間的權值；

G_disremember(t)為序列為t時遺忘門的輸出；

W_dh1為序列為t時遺忘門與序列為t-1時隱藏層輸入h_t-1之間的權值；

W_dh2為序列為t時遺忘門與序列為t+1時隱藏層輸入h_t+1之間的權值；

W_dm1為序列為t時遺忘門與序列為t-1時記憶細胞輸入m_t-1之間的權值；

W_dm2為序列為t時遺忘門與序列為t+1時記憶細胞輸入m_t+1之間的權值；

W_mf為序列為t時記憶細胞與序列為t時反饋門之間的權值；

W_mh1為序列為t時記憶細胞與序列為t-1時隱藏層輸入h_t-1之間的權值；

W_mh2為序列為t時記憶細胞與序列為t+1時隱藏層輸入h_t+1之間的權值；

W_of為序列為t時輸出門與序列為t時反饋門之間的權值；

W_oh1為序列為t時輸出門與序列為t-1時隱藏層輸入h_t-1之間的權值；

W_oh2為序列為t時輸出門與序列為t+1時隱藏層輸入h_t+1之間的權值；

W_om1為序列為t時輸出門與序列為t-1時記憶細胞輸入m_t-1之間的權值；

W_om2為序列為t時輸出門與序列為t+1時記憶細胞輸入m_t+1之間的權值；

W_yh為序列為t時輸出與序列為t時隱藏層輸入h_t之間的權值；

sigmoid(x)函數(shù)為

tanh(x)函數(shù)為

softmax_k(x)函數(shù)為其中，x_k為第k個softmax函數(shù)的輸入，k大于1，且小于K；

x_t為序列為t時的輸入；

y_t為序列為t時的輸出；

h_t為序列為t時隱藏層的輸入；

m_t為序列為t時記憶細胞的輸出；

e_f為序列為t時反饋門的偏差值；

e_i為序列為t時輸入門的偏差值；

e_d為序列為t時遺忘門的偏差值；

e_m為序列為t時記憶細胞的偏差值；

e_o為序列為t時輸出門的偏差值；

e_y為序列為t時輸出的偏差值。

3.如權利要求2所述的語句識別方法，其特征在于，

當t為1時，參數(shù)的計算公式如下：

G_feedback(t)＝sigmoid(W_fxx_t+W_fh2h_t+1+W_fm2m_t+1+e_f)；

G_input(t)＝sigmoid(W_ifG_feedback(t)+W_ih2h_t+1+W_im2m_t+1+e_i)；

G_disremember(t)＝sigmoid(W_dfG_feedback(t)+W_dh2h_t+1+W_dm2m_t+1+e_d)；

m_t＝G_disremember(t)x m_t+1+G_input(t)x tanh(W_mfG_feedback(t)+W_mh2h_t+1+e_m)；

G_output(t)＝sigmoid(W_ofG_feedback(t)+W_oh2h_t+1+W_om2m_t+1+e_o)；

h_t＝G_output(t)x m_t；

y_t＝softmax_k(W_yhh_t+e_y)；

當t為輸入x中的最后一個序列時，上述參數(shù)的計算公式如下：

G_feedback(t)＝sigmoid(W_fxx_t+W_fh1h_t-1+W_fm1m_t-1+e_f)；

G_input(t)＝sigmoid(W_ih1h_t-1+W_im1m_t-1+W_ifG_feedback(t)+e_i)；

G_disremember(t)＝sigmoid(W_dh1h_t-1+W_dm1m_t-1+W_dfG_feedback(t)+e_d)；

m_t＝G_disremember(t)x m_t-1+G_input(t)x tanh(W_mfG_feedback(t)+W_mh1h_t-1+e_m)；

G_output(t)＝sigmoid(W_ofG_feedback(t)+W_oh1h_t-1+W_om1m_t-1+e_o)；

h_t＝G_output(t)x m_t；

y_t＝softmax_k(W_yhh_t+e_y)。

4.如權利要求2所述的語句識別方法，其特征在于，

計算輸入的第一切詞序列中最后一個序列x₁n時，參數(shù)的計算公式如下：

G_feedback(1_n)＝sigmoid(W_fxx_{1_n}+W_fh1h_{1_n-1}+W_fm1m_{1_n-1}+W_fh2h_{2_1}+W_fm2m_{2_1}+e_f)；

G_input(1_n)＝sigmoid(W_ih1h_{1_n-1}+W_im1m_{1_n-1}+W_ifG_feedback(1_n)+W_ih2h_{2_1}+W_im2m_{2_1}+e_i)；

G_disremember(1_n)＝sigmoid(W_dh1h_{1_n-1}+W_dm1m_{1_n-1}+W_dfG_feedback(1_n)+W_dh2h_{2_1}+W_dm2m_{2_1}+e_d)；

m_{1_n}＝G_disremember(1_n)x m_{1_n-1}+G_disremember(1_n)x m_{2_1}+G_input(1_n)x tanh(W_mfG_feedback(1_n)+W_mh1h_{1_n-1}+W_mh2h_{2_1}+e_m)；

G_output(1_n)＝sigmoid(W_ofG_feedback(1_n)+W_oh1h_{1_n-1}+W_om1m_{1_n-1}+W_oh2h_{2_1}+W_om2m_{2_1}+e_o)；

h_{1_n}＝G_output(1_n)x m_{1_n}；

y_{1_n}＝softmax_k(W_yhh_{1_n}+e_y)；

其中，1_n表示的是第一切詞序列x₁中最后一個序列x_1n；2_1表示的是第二切詞序列x₂中第一序列x₂₁；

計算輸入的第二切詞序列中第一個序列x₂₁時，參數(shù)的計算公式如下：

G_feedback(2_1)＝sigmoid(W_fxx_{2_1}+W_fh1h_{1_n}+W_fm1m_{1_n}+W_fh2h_{2_2}+W_fm2m_{2_2}+e_f)；

G_input(2_1)＝sigmoid(W_ih1h_{1_n}+W_im1m_{1_n}+W_ifG_feedback(2_1)+W_ih2h_{2_2}+W_im2m_{2_2}+e_i)；

G_disremember(2_1)＝sigmoid(W_dh1h_{1_n}+W_dm1m_{1_n}+W_dfG_feedback(2_1)+W_dh2h_{2_2}+W_dm2m_{2_2}+e_d)；

m_t＝G_disremember(2_1)x m_{1_n}+G_disremember(2_1)x m_{2_2}+G_input(2_1)x tanh(W_mfG_feedback(2_1)+W_mh1h_{1_n}+W_mh2h_{2_2}+e_m)；

G_output(2_1)＝sigmoid(W_ofG_feedback(2_1)+W_oh1h_{1_n}+W_om1m_{1_n}+W_oh2h_{2_2}+W_om2m_{2_2}+e_o)；

h_{2_1}＝G_output(2_1)x m_{2_1}；

y_{2_1}＝softmax_k(W_yhh_{2_1}+e_y)；

其中，1_n表示的是第一切詞序列x₁中最后一個序列x_1n；2_1表示的是第二切詞序列x₂中第一序列x₂₁，2_2表示的是第二切詞序列x₂中第二序列x₂₂。

5.如權利要求1至4任一所述的語句識別方法，其特征在于，所述比較所述第一輸出y₁和所述第二輸出y₂是通過計算所述第一輸出y₁和所述第二輸出y₂的相似性；

作為優(yōu)選，所述比較所述第一輸出y₁和所述第二輸出y₂是通過余弦相似性來計算相似性，計算公式為cosθ余弦值的范圍在[-1，1]之間，值越趨近于1，第一輸出y₁和第二輸出y₂相應的相似度也越高。

6.一種基于LSTM神經網絡的語句識別裝置，其特征在于，所述裝置包括：

切詞獲取單元，用于獲取語句的切詞序列，獲取第一輸入系統(tǒng)和第二輸入系統(tǒng)中語句的第一切詞序列x₁＝{x₁₁，x₁₂，……，x_1n}和第二切詞序列x₂＝[x₂₁，x₂₂，……，x_2m}；

網絡模型建立單元，用于建立雙向LSTM神經網絡模型，建立兩個雙向LSTM神經網絡模型；

輸入選取單元，用于將所述切詞獲取單元獲取的切詞序列選擇作為所述網絡模型建立單元的輸入，將所述第一切詞序列和所述第二切詞序列分別作為所述兩個雙向LSTM神經網絡模型的第一輸入序列和第二輸入序列；

計算單元，用于將輸入選取單元選取的輸入引入所述網絡模型建立單元建立的雙向LSTM神經網絡模型的參數(shù)計算中計算，使得所述切詞序列標準化，以獲得標準化后的輸出，通過所述雙向LSTM神經網絡模型的參數(shù)對所述第一輸入序列和所述第二輸入序列進行標準化，以獲得標準化后的第一輸出y₁和第二輸出y₂；

比較單元，用于比較所述計算單元的輸出，比較所述第一輸出y₁和第二輸出y₂，以實現(xiàn)語義識別。

7.如權利要求6所述的語句識別裝置，其特征在于，所述網絡模型建立單元中的每個雙向LSTM神經網絡模型包括：輸入、輸入門、遺忘門、記憶細胞、tanh函數(shù)、隱藏層、反饋部、輸出門；其中，在輸入的序列為t時，參數(shù)的計算公式如下：

G_feedback(t)＝sigmoid(W_fxx_t+W_fh1h_t-1+W_fm1m_t-1+W_fh2h_t+1+W_fm2m_t+1+e_f)；

G_input(t)＝sigmoid(W_ih1h_t-1+W_im1m_t-1+W_ifG_feedback(t)+W_ih2h_t+1+W_im2m_t+1+e_i)；

G_disremember(t)＝sigmoid(W_dh1h_t-1+W_dm1m_t-1+W_dfG_feedback(t)+W_dh2h_t+1+W_dm2m_t+1+e_d)；

m_t＝G_disremember(t)x m_t-1+G_disremember(t)x m_t+1+G_input(t)x tanh(W_mfG_feedback(t)+W_mh1h_t-1+W_mh2h_t+1+e_m)；

G_output(t)＝sigmoid(W_ofG_feedback(t)+W_oh1h_t-1+W_om1m_t-1+W_oh2h_t+1+W_om2m_t+1+e_o)；

h_t＝G_output(t)x m_t；

y_t＝softmax_k(W_yhh_t+e_y)；

其中，

G_feedback(t)為序列為t時反饋門的輸出；

W_fx1為序列為t時反饋門與序列為t時輸入x_t的權值；

W_fh1為序列為t時反饋門與序列為t-1時隱藏層輸入h_t-1之間的權值；

W_fh2為序列為t時反饋門與序列為t+1時隱藏層輸入h_t+1之間的權值；

W_fm1為序列為t時反饋門與序列為t-1時記憶細胞輸入m_t-1之間的權值；

W_fm2為序列為t時反饋門與序列為t+1時記憶細胞輸入m_t+1之間的權值；

G_input(t)為序列為t時輸入門的輸出；

W_ih1為序列為t時輸入門與序列為t-1時隱藏層輸入h_t-1之間的權值；

W_ih2為序列為t時輸入門與序列為t+1時隱藏層輸入h_t+1之間的權值；

W_im1為序列為t時輸入門與序列為t-1時記憶細胞輸入m_t-1之間的權值；

W_im2為序列為t時輸入門與序列為t+1時記憶細胞輸入m_t+1之間的權值；

W_if為序列為t時輸入門與序列為t時反饋門之間的權值；

G_disremember(t)為序列為t時遺忘門的輸出；

W_dh1為序列為t時遺忘門與序列為t-1時隱藏層輸入h_t-1之間的權值；

W_dh2為序列為t時遺忘門與序列為t+1時隱藏層輸入h_t+1之間的權值；

W_dm1為序列為t時遺忘門與序列為t-1時記憶細胞輸入m_t-1之間的權值；

W_dm2為序列為t時遺忘門與序列為t+1時記憶細胞輸入m_t+1之間的權值；

W_mf為序列為t時記憶細胞與序列為t時反饋門之間的權值；

W_mh1為序列為t時記憶細胞與序列為t-1時隱藏層輸入h_t-1之間的權值；

W_mh2為序列為t時記憶細胞與序列為t+1時隱藏層輸入h_t+1之間的權值；

W_of為序列為t時輸出門與序列為t時反饋門之間的權值；

W_oh1為序列為t時輸出門與序列為t-1時隱藏層輸入h_t-1之間的權值；

W_oh2為序列為t時輸出門與序列為t+1時隱藏層輸入h_t+1之間的權值；

W_om1為序列為t時輸出門與序列為t-1時記憶細胞輸入m_t-1之間的權值；

W_om2為序列為t時輸出門與序列為t+1時記憶細胞輸入m_t+1之間的權值；

W_yh為序列為t時輸出與序列為t時隱藏層輸入h_t之間的權值；

sigmoid(x)函數(shù)為

tanh(x)函數(shù)為

softmax_k(x)函數(shù)為其中，x_k為第k個softmax函數(shù)的輸入，k大于1，且小于K；

x_t為序列為t時的輸入；

y_t為序列為t時的輸出；

h_t為序列為t時隱藏層的輸入；

m_t為序列為t時記憶細胞的輸出；

e_f為序列為t時反饋門的偏差值；

e_i為序列為t時輸入門的偏差值；

e_d為序列為t時遺忘門的偏差值；

e_m為序列為t時記憶細胞的偏差值；

e_o為序列為t時輸出門的偏差值；

e_y為序列為t時輸出的偏差值。

8.如權利要求7所述的語句識別裝置，其特征在于，所述網絡模型建立單元中參數(shù)計算時，

當t為1時，參數(shù)的計算公式如下：

G_feedback(t)＝sigmoid(W_fxx_t4W_fh2h_t+1+W_fm2m_t+1+e_f)；

G_input(t)＝sigmoid(W_ifG_feedback(t)+W_ih2h_t+1+W_im2m_t+1+e_i)；

G_disremember(t)＝sigmoid(W_dfG_feedback(t)+W_dh2h_t+1+W_dm2m_t+1+e_d)；

m_t＝G_disremember(t)x m_t+1+G_input(t)x tanh(W_mfG_feedback(t)+W_mh2h_t+1+e_m)；

G_output(t)＝sigmoid(W_ofG_feedback(t)+W_oh2h_t+1+W_om2m_t+1+e_o)；

h_t＝G_output(t)x m_t；

y_t＝softmax_k(W_yhh_t+e_y)；

當t為輸入x中的最后一個序列時，上述參數(shù)的計算公式如下：

G_feedback(t)＝sigmoid(W_fxx_t+W_fh1h_t-1+W_fm1m_t-1+e_f)；

G_input(t)＝sigmoid(W_ih1h_t-1+W_im1m_t-1+W_ifG_feedback(t)+e_i)；

G_disremember(t)＝sigmoid(W_dh1h_t-1+W_dm1m_t-1+W_dfG_feedback(t)+e_d)；

m_t＝G_disremember(t)x m_t-1+G_input(t)x tanh(W_mfG_feedback(t)+W_mh1h_t-1+e_m)；

G_output(t)＝sigmoid(W_ofG_feedback(t)+W_oh1h_t-1+W_om1m_t-1+e_o)；

h_t＝G_output(t)x m_t；

y_t＝softmax_k(W_yhh_t+e_y)。

9.如權利要求7所述的語句識別裝置，其特征在于，所述網絡模型建立單元中參數(shù)計算時，

計算輸入的第一切詞序列中最后一個序列x₁n時，參數(shù)的計算公式如下：

G_feedback(1_n)＝sigmoid(W_fxx_{1_n}+W_fh1h_{1_n-1}+W_fm1m_{1_n-1}+W_fh2h_{2_1}+W_fm2m_{2_1}+e_f)；

G_input(1_n)＝sigmoid(W_ih1h_{1_n-1}+W_im1m_{1_n-1}+W_ifG_feedback(1_n)+W_ih2h_{2_1}+W_im2m_{2_1}+e_i)；

G_disremember(1_n)＝sigmoid(W_dh1h_{1_n-1}+W_dm1m_{1_n-1}+W_dfG_feedback(1_n)+W_dh2h_{2_1}+W_dm2m_{2_1}+e_d)；

m_{1_n}＝G_disremember(1_n)x m_{1_n-1}+G_disremember(1_n)x m_{2_1}+G_input(1_n)x tanh(W_mfG_feedback(1_n)+W_mh1h_{1_n-1}+W_mh2h_{2_1}+e_m)；

G_output(1_n)＝sigmoid(W_ofG_feedback(1_n)+W_oh1h_{1_n-1}+W_om1m_{1_n-1}+W_oh2h_{2_1}+W_om2m_{2_1}+e_o)；

h_{1_n}＝G_output(1_n)x m_{1_n}；

y_{1_n}＝softmax_k(W_yhh_{1_n}+e_y)；

其中，1_n表示的是第一切詞序列x₁中最后一個序列x_1n；2_1表示的是第二切詞序列x₂中第一序列x₂₁；

計算輸入的第二切詞序列中第一個序列x₂₁時，參數(shù)的計算公式如下：

G_feedback(2_1)＝sigmoid(W_fxx_{2_1}+W_fh1h_{1_n}+W_fm1m_{1_n}+W_fh2h_{2_2}+W_fm2m_{2_2}+e_f)；

G_input(2_1)＝sigmoid(W_ih1h_{1_n}+W_im1m_{1_n}+W_ifG_feedback(2_1)+W_ih2h_{2_2}+W_im2m_{2_2}+e_i)；

G_disremember(2_1)＝sigmoid(W_dh1h_{1_n}+W_dm1m_{1_n}+W_dfG_feedback(2_1)+W_dh2h_{2_2}+W_dm2m_{2_2}+e_d)；

m_t＝G_disremember(2_1)x m_{1_n}+G_disremember(2_1)x m_{2_2}+G_input(2_1)x tanh(W_mfG_feedback(2_1)+W_mh1h_{1_n}+W_mh2h_{2_2}+e_m)；

G_output(2_1)＝sigmoid(W_ofG_feedback(2_1)+W_oh1h_{1_n}+W_om1m_{1_n}+W_oh2h_{2_2}+W_om2m_{2_2}+e_o)；

h_{2_1}＝G_output(2_1)x m_{2_1}；

y_{2_1}＝softmax_k(W_yhh_{2_1}+e_y)；

其中，1_n表示的是第一切詞序列x₁中最后一個序列x_1n；2_1表示的是第二切詞序列x₂中第一序列x₂₁，2_2表示的是第二切詞序列x₂中第二序列x₂₂。

10.如權利要求6至9任一所述的的語句識別裝置，其特征在于，所述比較單元中比較所述第一輸出y₁和所述第二輸出y₂是通過計算所述第一輸出y₁和所述第二輸出y₂的相似性；

作為優(yōu)選，所述比較單元中比較所述第一輸出y₁和所述第二輸出y₂是通過余弦相似性來計算相似性，計算公式為cosθ余弦值的范圍在[-1，1]之間，值越趨近于1，第一輸出y₁和第二輸出y₂相應的相似度也越高。

完整全部詳細技術資料下載

當前第2頁1 2 3

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于雙向LSTM神經網絡的語句識別方法及裝置與流程