一種基于無監(jiān)督域適應(yīng)的語音情感識別方法與流程

文檔序號：12159493閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)>一種基于無監(jiān)督域適應(yīng)的語音情感識別方法與流程

技術(shù)特征：

1.一種基于無監(jiān)督域適應(yīng)的語音情感識別方法，其特征在于，包括如下步驟：

S1，語音樣本預(yù)處理：按照INTERSPEECH 2009情感挑戰(zhàn)賽的要求，利用開源工具包openEAR從原始語音樣本中提取384維特征，替代原始語音樣本作為輸入數(shù)據(jù)；

S2，模型訓(xùn)練：所述模型包括三部分：特征提取，情感標(biāo)簽預(yù)測，域標(biāo)簽預(yù)測；源域的有標(biāo)簽樣本和目標(biāo)域的無標(biāo)簽訓(xùn)練樣本通過S1得到相應(yīng)的384維特征作為模型的輸入數(shù)據(jù)；具體實現(xiàn)包括如下：

在模型的特征提取層，輸入數(shù)據(jù)通過不同的權(quán)重映射成兩種特征：情感判別特征和情感無關(guān)特征；然后情感判別特征通過層次非線性轉(zhuǎn)換得到高層情感特征；

源域有標(biāo)簽樣本的高層情感特征用于情感標(biāo)簽的預(yù)測，源域和目標(biāo)域樣本的高層情感特征用于域標(biāo)簽的預(yù)測；

最后更新模型的參數(shù)，將兩個標(biāo)簽預(yù)測器的損失進(jìn)行反向傳播，用梯度下降法進(jìn)行參數(shù)的更新；

S3，特征提?。豪肧2中訓(xùn)練好的特征提取層的參數(shù)，將源域有標(biāo)簽訓(xùn)練樣本的384維特征轉(zhuǎn)換成高層情感特征；

S4，分類器訓(xùn)練：利用S3中源域有標(biāo)簽訓(xùn)練樣本的高層情感特征和相對應(yīng)的情感標(biāo)簽，進(jìn)行分類器SVM的訓(xùn)練；

S5，語音情感識別：對任意一個目標(biāo)域的語音測試樣本，首先利用步驟S1提取384維特征作為輸入數(shù)據(jù)，然后通過S2中訓(xùn)練好的特征提取層得到高層情感特征，最后輸入到S4訓(xùn)練好的SVM中進(jìn)行分類。

2.根據(jù)權(quán)利要求1所述的一種基于無監(jiān)督域適應(yīng)的語音情感識別方法，其特征在于，所述步驟S2中所述特征提取層的實現(xiàn)包括如下：

S2.1，設(shè)有N+1層，第n層有k⁽ⁿ⁾個結(jié)點，h⁽ⁿ⁾表示第n層的特征表示，n∈[0,1,...,N]；對于第零層，假設(shè)h⁽⁰⁾＝x，x為輸入樣本；那么第n層的特征表示為：

其中W⁽ⁿ⁾∈R^k(n)×k(n-1)表示權(quán)重矩陣，b⁽ⁿ⁾∈R^k(n)表示偏置，表示非線性激活函數(shù)；

S2.2，為了消除提取到的特征摻雜一些情感無關(guān)的因素，引進(jìn)一個正交項來解開情感判別因素和其他無關(guān)因素；對于輸入x，把它映射成兩塊特征：一塊編碼輸入數(shù)據(jù)的判別因素，另一塊編碼輸入數(shù)據(jù)的其他因素，參數(shù)分別是θ_e＝{W⁽¹⁾,b⁽¹⁾}和θ_o＝{w,c}；

S2.3，為了讓這兩塊特征可以有效地解開，讓第i個情感相關(guān)特征的敏感度向量和每個情感無關(guān)的特征的敏感度向量正交；進(jìn)一步，對這兩塊特征進(jìn)行約束的正交損失函數(shù)定義如下：

$<mrow> <msub> <mi>L</mi> <mrow> <mi>o</mi> <mi>r</mi> <mi>t</mi> <mi>h</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>θ</mi> <mi>e</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>o</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>Σ</mo> <mrow> <mi>x</mi> <mo>&Element;</mo> <msub> <mi>D</mi> <mi>s</mi> </msub> </mrow> </munder> <munder> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </munder> <msup> <mrow> <mo>(</mo> <mfrac> <mrow> <mo>∂</mo> <msubsup> <mi>h</mi> <mi>i</mi> <mrow> <mo>(</mo> <mi>e</mi> <mo>)</mo> </mrow> </msubsup> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>∂</mo> <mi>x</mi> </mrow> </mfrac> <mo>·</mo> <mfrac> <mrow> <mo>∂</mo> <msubsup> <mi>h</mi> <mi>j</mi> <mrow> <mo>(</mo> <mi>o</mi> <mo>)</mo> </mrow> </msubsup> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>∂</mo> <mi>x</mi> </mrow> </mfrac> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow>$

其中表示所有樣本的域標(biāo)簽集合；

S2.4，對于輸入x，經(jīng)過上述特征提取過程，得到它的高層特征表示h^(N)。

3.根據(jù)權(quán)利要求2所述的一種基于無監(jiān)督域適應(yīng)的語音情感識別方法，其特征在于，所述步驟S2中所述情感標(biāo)簽預(yù)測和域標(biāo)簽預(yù)測的實現(xiàn)包括如下：

利用得到的高層特征表示h^(N)來預(yù)測情感標(biāo)簽和域標(biāo)簽：采用Softmax回歸進(jìn)行情感標(biāo)簽和域標(biāo)簽的預(yù)測，具體地，情感標(biāo)簽預(yù)測的損失函數(shù)L_y和域標(biāo)簽預(yù)測的損失函數(shù)L_d可以表示成如下形式：

$<mrow> <msub> <mi>L</mi> <mi>y</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>θ</mi> <mi>f</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>y</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <mfrac> <mn>1</mn> <msub> <mi>n</mi> <mi>s</mi> </msub> </mfrac> <munder> <mo>Σ</mo> <mrow> <mi>x</mi> <mo>&Element;</mo> <msub> <mi>D</mi> <mi>s</mi> </msub> </mrow> </munder> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>c</mi> </munderover> <mn>1</mn> <mo>{</mo> <mi>y</mi> <mo>=</mo> <mi>i</mi> <mo>}</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mfrac> <msup> <mi>e</mi> <mrow> <msubsup> <mi>θ</mi> <mrow> <mi>y</mi> <mi>i</mi> </mrow> <mi>T</mi> </msubsup> <msup> <mi>h</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msup> </mrow> </msup> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>c</mi> </munderover> <msup> <mi>e</mi> <mrow> <msubsup> <mi>θ</mi> <mrow> <mi>y</mi> <mi>j</mi> </mrow> <mi>T</mi> </msubsup> <msup> <mi>h</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msup> </mrow> </msup> </mrow> </mfrac> <mo>,</mo> </mrow>$

$<mrow> <msub> <mi>L</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>θ</mi> <mi>f</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>d</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <mfrac> <mn>1</mn> <msub> <mi>n</mi> <mi>s</mi> </msub> </mfrac> <munder> <mo>Σ</mo> <mrow> <mi>x</mi> <mo>&Element;</mo> <mi>X</mi> </mrow> </munder> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>1</mn> </munderover> <mn>1</mn> <mo>{</mo> <mi>y</mi> <mo>=</mo> <mi>i</mi> <mo>}</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mfrac> <msup> <mi>e</mi> <mrow> <msubsup> <mi>θ</mi> <mrow> <mi>d</mi> <mi>i</mi> </mrow> <mi>T</mi> </msubsup> <msup> <mi>h</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msup> </mrow> </msup> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>1</mn> </munderover> <msup> <mi>e</mi> <mrow> <msubsup> <mi>θ</mi> <mrow> <mi>d</mi> <mi>j</mi> </mrow> <mi>T</mi> </msubsup> <msup> <mi>h</mi> <mrow> <mo>(</mo> <mi>N</mi> <mo>)</mo> </mrow> </msup> </mrow> </msup> </mrow> </mfrac> <mo>,</mo> </mrow>$

其中是情感標(biāo)簽預(yù)測的參數(shù)，是域標(biāo)簽預(yù)測的參數(shù)；X＝{x|x∈D_s||x∈D_t}表示訓(xùn)練時所有可獲得的源域有標(biāo)簽樣本和目標(biāo)域無標(biāo)簽樣本集合；表示所有樣本的域標(biāo)簽集合；y表示情感標(biāo)簽；n_s表示源域樣本個數(shù)。

4.根據(jù)權(quán)利要求3所述的一種基于無監(jiān)督域適應(yīng)的語音情感識別方法，其特征在于，所述步驟S2中所述更新模型參數(shù)的實現(xiàn)包括如下：

S2.5，結(jié)合特征提取、情感標(biāo)簽預(yù)測和域標(biāo)簽預(yù)測的損失函數(shù)，得到總目標(biāo)函數(shù)如下：

$<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>L</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>θ</mi> <mi>f</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>y</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>d</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mi>Σ</mi> <mrow> <mi>x</mi> <mo>&Element;</mo> <msub> <mi>D</mi> <mi>s</mi> </msub> </mrow> </munder> <msub> <mi>G</mi> <mi>y</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <mi>x</mi> <mo>;</mo> <msub> <mi>θ</mi> <mi>f</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>;</mo> <msub> <mi>θ</mi> <mi>y</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mi>α</mi> <munder> <mi>Σ</mi> <mrow> <mi>x</mi> <mo>&Element;</mo> <mi>X</mi> </mrow> </munder> <msub> <mi>G</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <mi>x</mi> <mo>;</mo> <msub> <mi>θ</mi> <mi>f</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>;</mo> <msub> <mi>θ</mi> <mi>d</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mo>+</mo> <msub> <mi>βL</mi> <mrow> <mi>o</mi> <mi>r</mi> <mi>t</mi> <mi>h</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>θ</mi> <mi>e</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>o</mi> </msub> </mrow> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <msub> <mi>L</mi> <mi>y</mi> </msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>θ</mi> <mi>f</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>y</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>αL</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>θ</mi> <mi>f</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>d</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>βL</mi> <mrow> <mi>o</mi> <mi>r</mi> <mi>t</mi> <mi>h</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>θ</mi> <mi>e</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>o</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> </mtr> </mtable> </mfenced>$

其中f把輸入x映射成高層特征表示，G_y和G_d分別把高層特征表示映射成情感標(biāo)簽和域標(biāo)簽，L_y和L_d分別表示情感標(biāo)簽預(yù)測和域標(biāo)簽預(yù)測的損失函數(shù)，a衡量域標(biāo)簽預(yù)測項的貢獻(xiàn)程度，β衡量正交損失函數(shù)的貢獻(xiàn)程度；

S2.6，為了得到情感判別和域不變的特征，需要尋找總目標(biāo)函數(shù)的一個鞍點：

$<mrow> <mo>(</mo> <msub> <mover> <mi>θ</mi> <mo>^</mo> </mover> <mi>f</mi> </msub> <mo>,</mo> <msub> <mover> <mi>θ</mi> <mo>^</mo> </mover> <mi>y</mi> </msub> <mo>)</mo> <mo>=</mo> <mi>arg</mi> <mi> </mi> <msub> <mi>min</mi> <mrow> <msub> <mi>θ</mi> <mi>f</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>y</mi> </msub> </mrow> </msub> <mi>L</mi> <mo>(</mo> <msub> <mi>θ</mi> <mi>f</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>y</mi> </msub> <mo>,</mo> <msub> <mover> <mi>θ</mi> <mo>^</mo> </mover> <mi>d</mi> </msub> <mo>)</mo> <mo>,</mo> </mrow>$

$<mrow> <mo>(</mo> <msub> <mover> <mi>θ</mi> <mo>^</mo> </mover> <mi>d</mi> </msub> <mo>)</mo> <mo>=</mo> <mi>arg</mi> <mi> </mi> <msub> <mi>max</mi> <msub> <mi>θ</mi> <mi>d</mi> </msub> </msub> <mi>L</mi> <mo>(</mo> <msub> <mover> <mi>θ</mi> <mo>^</mo> </mover> <mi>f</mi> </msub> <mo>,</mo> <msub> <mover> <mi>θ</mi> <mo>^</mo> </mover> <mi>y</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>d</mi> </msub> <mo>)</mo> <mo>.</mo> </mrow>$

S2.7，為了能使用梯度下降法來尋找這個鞍點，在特征提取層和域標(biāo)簽預(yù)測層之間加上了一個梯度反轉(zhuǎn)層；在前向傳播時，梯度反轉(zhuǎn)層相對于一個恒等變換函數(shù)；在反向傳播時，梯度會乘以一個負(fù)數(shù)-λ；用如下的偽函數(shù)來描述梯度反轉(zhuǎn)層：

R_λ(x)＝x,

$<mrow> <mfrac> <mrow> <msub> <mi>dR</mi> <mi>λ</mi> </msub> </mrow> <mrow> <mi>d</mi> <mi>x</mi> </mrow> </mfrac> <mo>=</mo> <mo>-</mo> <mi>λ</mi> <mi>I</mi> <mo>,</mo> </mrow>$

其中I是單位矩陣；因此總目標(biāo)函數(shù)的偽目標(biāo)函數(shù)可以定義成如下形式：

$<mrow> <msub> <mi>L</mi> <mrow> <mi>E</mi> <mi>S</mi> <mi>D</mi> <mi>F</mi> </mrow> </msub> <mo>=</mo> <munder> <mi>Σ</mi> <mrow> <mi>x</mi> <mo>&Element;</mo> <msub> <mi>D</mi> <mi>s</mi> </msub> </mrow> </munder> <msub> <mi>G</mi> <mi>y</mi> </msub> <mrow> <mo>(</mo> <mi>f</mi> <mo>(</mo> <mrow> <mi>x</mi> <mo>;</mo> <msub> <mi>θ</mi> <mi>f</mi> </msub> </mrow> <mo>)</mo> <mo>;</mo> <msub> <mi>θ</mi> <mi>y</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mi>α</mi> <munder> <mi>Σ</mi> <mrow> <mi>x</mi> <mo>&Element;</mo> <mi>X</mi> </mrow> </munder> <msub> <mi>G</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mi>λ</mi> </msub> <mo>(</mo> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <mi>x</mi> <mo>;</mo> <msub> <mi>θ</mi> <mi>f</mi> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>;</mo> <msub> <mi>θ</mi> <mi>d</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>βL</mi> <mrow> <mi>o</mi> <mi>r</mi> <mi>t</mi> <mi>h</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>θ</mi> <mi>e</mi> </msub> <mo>,</mo> <msub> <mi>θ</mi> <mi>o</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

所有的權(quán)重和偏置可以使用如下的梯度下降算法進(jìn)行更新：

$<mrow> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> <mo>&LeftArrow;</mo> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> <mo>-</mo> <mi>μ</mi> <mrow> <mo>(</mo> <mrow> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mi>y</mi> </msub> </mrow> <mrow> <mo>∂</mo> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> </mrow> </mfrac> <mo>-</mo> <mi>λ</mi> <mi>α</mi> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mi>d</mi> </msub> </mrow> <mrow> <mo>∂</mo> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> </mrow> </mfrac> <mo>+</mo> <mi>β</mi> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mrow> <mi>o</mi> <mi>r</mi> <mi>t</mi> <mi>h</mi> </mrow> </msub> </mrow> <mrow> <mo>∂</mo> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> </mrow> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

$<mrow> <msup> <mi>b</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> <mo>&LeftArrow;</mo> <msup> <mi>b</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> <mo>-</mo> <mi>μ</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mi>y</mi> </msub> </mrow> <mrow> <mo>∂</mo> <msup> <mi>b</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> </mrow> </mfrac> <mo>-</mo> <mi>λ</mi> <mi>α</mi> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mi>d</mi> </msub> </mrow> <mrow> <mo>∂</mo> <msup> <mi>b</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> </mrow> </mfrac> <mo>+</mo> <mi>β</mi> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mrow> <mi>o</mi> <mi>r</mi> <mi>t</mi> <mi>h</mi> </mrow> </msub> </mrow> <mrow> <mo>∂</mo> <msup> <mi>b</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

$<mrow> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> </msup> <mo>&LeftArrow;</mo> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> </msup> <mo>-</mo> <mi>μ</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mi>y</mi> </msub> </mrow> <mrow> <mo>∂</mo> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> </msup> </mrow> </mfrac> <mo>-</mo> <mi>λ</mi> <mi>α</mi> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mi>d</mi> </msub> </mrow> <mrow> <mo>∂</mo> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

$<mrow> <msup> <mi>b</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> </msup> <mo>&LeftArrow;</mo> <msup> <mi>b</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> </msup> <mo>-</mo> <mi>μ</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mi>y</mi> </msub> </mrow> <mrow> <mo>∂</mo> <msup> <mi>b</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> </msup> </mrow> </mfrac> <mo>-</mo> <mi>λ</mi> <mi>α</mi> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mi>d</mi> </msub> </mrow> <mrow> <mo>∂</mo> <msup> <mi>b</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

$<mrow> <mi>w</mi> <mo>&LeftArrow;</mo> <mi>w</mi> <mo>-</mo> <mi>μ</mi> <mrow> <mo>(</mo> <mi>β</mi> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mrow> <mi>o</mi> <mi>r</mi> <mi>t</mi> <mi>h</mi> </mrow> </msub> </mrow> <mrow> <mo>∂</mo> <mi>w</mi> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

$<mrow> <mi>c</mi> <mo>&LeftArrow;</mo> <mi>c</mi> <mo>-</mo> <mi>μ</mi> <mrow> <mo>(</mo> <mi>β</mi> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mrow> <mi>o</mi> <mi>r</mi> <mi>t</mi> <mi>h</mi> </mrow> </msub> </mrow> <mrow> <mo>∂</mo> <mi>c</mi> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

$<mrow> <msub> <mi>θ</mi> <mi>d</mi> </msub> <mo>&LeftArrow;</mo> <msub> <mi>θ</mi> <mi>d</mi> </msub> <mo>-</mo> <mi>μ</mi> <mrow> <mo>(</mo> <mi>α</mi> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mi>d</mi> </msub> </mrow> <mrow> <mo>∂</mo> <msub> <mi>θ</mi> <mi>d</mi> </msub> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

$<mrow> <msub> <mi>θ</mi> <mi>y</mi> </msub> <mo>&LeftArrow;</mo> <msub> <mi>θ</mi> <mi>y</mi> </msub> <mo>-</mo> <mi>μ</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mo>∂</mo> <msub> <mi>L</mi> <mi>y</mi> </msub> </mrow> <mrow> <mo>∂</mo> <msub> <mi>θ</mi> <mi>y</mi> </msub> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

其中m＝2,...,N，μ是學(xué)習(xí)率，a和β分別衡量域預(yù)測損失函數(shù)和正交損失函數(shù)的貢獻(xiàn)程度，λ是梯度反轉(zhuǎn)層的參數(shù)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

局域網(wǎng)語音聊天軟件相關(guān)技術(shù)

局域網(wǎng)語音相關(guān)技術(shù)

語音識別應(yīng)用領(lǐng)域相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于無監(jiān)督域適應(yīng)的語音情感識別方法與流程