一種具有情感識別功能的多媒體播放器的制作方法

文檔序號：12473184閱讀：218來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及多媒體領(lǐng)域，具體涉及一種具有情感識別功能的多媒體播放器。
背景技術(shù)：
：多媒體播放器，一種可以在電視上播放網(wǎng)絡(luò)視頻文件的設(shè)備。多媒體播放器可在電腦里個(gè)人享用的電影搬到客廳，在電視機(jī)上直播網(wǎng)絡(luò)電影，實(shí)現(xiàn)電視全家人共享精彩歡樂時(shí)刻。情感在人們相互交際過程中起著極其重要的作用。借助情感表達(dá)所伴隨著的外在表現(xiàn)信息，如情感化的語音信號或面部表情，人們可以很方便地相互溝通、相互了解。對于人類情感方面的研究，一直是生理學(xué)、神經(jīng)學(xué)、心理學(xué)等領(lǐng)域的重要研究方向，近幾年來倍受工程領(lǐng)域研究者的關(guān)注。當(dāng)前，對于單模態(tài)情感研究較多，但是對于多模態(tài)情感融合的研究較為有限。技術(shù)實(shí)現(xiàn)要素：針對上述問題，本發(fā)明提供一種具有情感識別功能的多媒體播放器。本發(fā)明的目的采用以下技術(shù)方案來實(shí)現(xiàn)：一種具有情感識別功能的多媒體播放器，其特征是，包括多媒體播放器和與多媒體播放器相連的情感控制系統(tǒng)，所述多媒體播放器可選擇地運(yùn)行于第一模式或第二模式，包括：多個(gè)多媒體源，用于提供多媒體數(shù)據(jù)；通用串行總線集線器接口，連接至外部電子裝置，并在該多媒體播放器運(yùn)行于該第二模式時(shí)與該外部電子裝置通信；處理器，耦接至該多個(gè)多媒體源及該通用串行總線集線器接口，當(dāng)該多媒體播放器運(yùn)行于該第一模式時(shí)，該處理器擷取該多個(gè)多媒體源其中之一的該多媒體數(shù)據(jù)，并譯碼該多媒體數(shù)據(jù)，其中該被譯碼的多媒體數(shù)據(jù)被準(zhǔn)備好以用于播放；當(dāng)該多媒體播放器運(yùn)行于該第二模式時(shí)，該處理器透過該通用串行總線集線器接口連接至該外部電子裝置，該多個(gè)多媒體源被用作支持該外部電子裝置的通用串行總線裝置。優(yōu)選地，該外部電子裝置為傳統(tǒng)的通用計(jì)算機(jī)、特種用途計(jì)算機(jī)或互聯(lián)網(wǎng)裝置。優(yōu)選地，該外部電子裝置為包括多媒體播放器代理的通用串行總線主機(jī)。本發(fā)明的有益效果為：可通過通用串行總線集線器接口連接至外部電子裝置，從而可以更有效地利用外部多媒體資源。附圖說明利用附圖對本發(fā)明作進(jìn)一步說明，但附圖中的實(shí)施例不構(gòu)成對本發(fā)明的任何限制，對于本領(lǐng)域的普通技術(shù)人員，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)以下附圖獲得其它的附圖。圖1是本發(fā)明多媒體播放器的結(jié)構(gòu)示意圖；圖2是本發(fā)明情感控制系統(tǒng)的結(jié)構(gòu)示意圖。附圖標(biāo)記：語音情感識別處理模塊1、表情情感識別處理模塊2、多模態(tài)情感融合識別處理模塊3、控制模塊4、聲學(xué)特征提取子模塊11、聲學(xué)特征降維子模塊12、語音情感分類處理子模塊13、表情特征提取子模塊21、表情特征降維子模塊22、表情情感分類處理子模塊23。具體實(shí)施方式結(jié)合以下實(shí)施例對本發(fā)明作進(jìn)一步描述。應(yīng)用場景1參見圖1、圖2，本應(yīng)用場景中的一種具有情感識別功能的多媒體播放器，其特征是，包括多媒體播放器和與多媒體播放器相連的情感控制系統(tǒng)，所述多媒體播放器可選擇地運(yùn)行于第一模式或第二模式，包括：多個(gè)多媒體源，用于提供多媒體數(shù)據(jù)；通用串行總線集線器接口，連接至外部電子裝置，并在該多媒體播放器運(yùn)行于該第二模式時(shí)與該外部電子裝置通信；處理器，耦接至該多個(gè)多媒體源及該通用串行總線集線器接口，當(dāng)該多媒體播放器運(yùn)行于該第一模式時(shí)，該處理器擷取該多個(gè)多媒體源其中之一的該多媒體數(shù)據(jù)，并譯碼該多媒體數(shù)據(jù)，其中該被譯碼的多媒體數(shù)據(jù)被準(zhǔn)備好以用于播放；當(dāng)該多媒體播放器運(yùn)行于該第二模式時(shí)，該處理器透過該通用串行總線集線器接口連接至該外部電子裝置，該多個(gè)多媒體源被用作支持該外部電子裝置的通用串行總線裝置。優(yōu)選地，該外部電子裝置為傳統(tǒng)的通用計(jì)算機(jī)、特種用途計(jì)算機(jī)或互聯(lián)網(wǎng)裝置。本優(yōu)選實(shí)施例可通過通用串行總線集線器接口連接至外部電子裝置，從而可以更有效地利用外部多媒體資源。優(yōu)選地，該外部電子裝置為包括多媒體播放器代理的通用串行總線主機(jī)。本優(yōu)選實(shí)施例更加方便客戶體驗(yàn)。優(yōu)選地，所述情感控制系統(tǒng)包括語音情感識別處理模塊1、表情情感識別處理模塊2、多模態(tài)情感融合識別處理模塊3和控制模塊4：(1)語音情感識別處理模塊1，用于獲取用戶的語音信號，并對語音信號進(jìn)行處理，最終輸出語音情感識別結(jié)果，其包括聲學(xué)特征提取子模塊11、聲學(xué)特征降維子模塊12和語音情感分類處理子模塊13；所述聲學(xué)特征提取子模塊11用于提取聲學(xué)特征數(shù)據(jù)；所述聲學(xué)特征降維子模塊12用于采用改進(jìn)的局部線性嵌入方法對所述聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理；所述語音情感分類處理子模塊13用于采用已訓(xùn)練好的支持向量機(jī)作為語音情感識別分類器，對降維后的聲學(xué)特征數(shù)據(jù)進(jìn)行情感識別并輸出語音情感識別結(jié)果，支持向量機(jī)的核函數(shù)采用高斯核函數(shù)；(2)表情情感識別處理模塊2，用于獲取用戶的表情圖像，并對表情圖像特征進(jìn)行處理，最終生成表情情感識別結(jié)果，其包括表情特征提取子模塊21、表情特征降維子模塊22和表情情感分類處理子模塊23；所述表情特征提取子模塊21用于采用自適應(yīng)二維Gabor小波變換方法對表情圖像中的表情特征進(jìn)行提??；所述表情特征降維子模塊22用于采用所述改進(jìn)的局部線性嵌入方法對所述表情特征數(shù)據(jù)進(jìn)行降維處理，并采用形態(tài)學(xué)處理方法做濾波處理；所述表情情感分類處理子模塊23用于采用已訓(xùn)練好的稀疏分類器作為表情情感識別分類器，對降維、濾波處理后的表情特征數(shù)據(jù)進(jìn)行情感識別并輸出表情情感識別結(jié)果；(3)多模態(tài)情感融合識別處理模塊3，用于基于所述語音情感識別結(jié)果和表情情感識別結(jié)果，根據(jù)預(yù)定的多模態(tài)情感融合策略生成用戶情感識別結(jié)果；(4)控制模塊，用于根據(jù)所述用戶情感識別結(jié)果，在驗(yàn)證用戶身份的前提下控制多媒體播放器執(zhí)行相應(yīng)的操作。本優(yōu)選實(shí)施例設(shè)置多模態(tài)情感融合識別處理模塊3，基于所述語音情感識別結(jié)果和表情情感識別結(jié)果，增強(qiáng)了識別結(jié)果的可靠性。優(yōu)選地，所述用戶情感識別結(jié)果包括高級別和低級別的褒義情感，中性情感以及高級別和低級別的貶義情感組成的5個(gè)級別情感類型。所述在驗(yàn)證用戶身份的前提下控制多媒體播放器執(zhí)行相應(yīng)的操作，具體為：所述控制模塊基于預(yù)先設(shè)置的語音特征數(shù)據(jù)庫，匹配所述用戶的語音信號的語音特征，從而進(jìn)行用戶身份驗(yàn)證，若驗(yàn)證通過，控制模塊控制多媒體播放器執(zhí)行相應(yīng)的操作。所述采用改進(jìn)的局部線性嵌入方法對所述聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理，包括：(1)將提取的聲學(xué)特征數(shù)據(jù)中的聲學(xué)特征向量看成是高維空間中的樣本數(shù)據(jù)點(diǎn)，設(shè)M維的N個(gè)樣本數(shù)據(jù)點(diǎn)為Xi，Xi∈RM，i∈[1，N]，類別號為Ci，嵌入輸出的N個(gè)m維的降維數(shù)據(jù)點(diǎn)為Yi，Yi∈Rm，i∈[1，N]，m≤M，且m值的范圍為[2，20]，對每個(gè)樣本數(shù)據(jù)點(diǎn)Xi確定其鄰域點(diǎn)的數(shù)目K，鄰域點(diǎn)的距離公式為：L′=1-e-Lλ,Ci=CjL+δ1max(L)+δ2min(L),Ci≠Cj]]>式中，L′是結(jié)合樣本數(shù)據(jù)點(diǎn)類別信息計(jì)算后的距離，L是忽略樣本數(shù)據(jù)點(diǎn)類別信息的原始?xì)W氏距離，參數(shù)λ用來防止L過快增長，max(L)表示最大歐氏距離，min(L)表示最小歐式距離，常數(shù)因子δ1、δ2(0≤δ1、δ2≤1)，共同控制距離計(jì)算時(shí)樣本數(shù)據(jù)點(diǎn)類別信息的結(jié)合數(shù)量程度；(2)利用每個(gè)樣本數(shù)據(jù)點(diǎn)Xi的鄰域點(diǎn)計(jì)算出樣本數(shù)據(jù)點(diǎn)的局部重建權(quán)值矩陣Wij，要求最小化下列損失函數(shù)：s(W)=Σi=1N||Xi-Σj=1KWijXj||2]]>式中，Wij為Xi與Xj之間的權(quán)值，且需滿足對Xi的非鄰域點(diǎn)，Wij＝0；(3)計(jì)算各樣本數(shù)據(jù)點(diǎn)Xi的K個(gè)鄰域點(diǎn)的權(quán)重之和：Qij=Σj=1KZij]]>其中，式中，Zij為各鄰域點(diǎn)之間的加權(quán)矩陣，d(Xi，Xj)表示樣本數(shù)據(jù)點(diǎn)間的Fisher投影距離，ξ為可調(diào)參數(shù)；(4)利用該樣本數(shù)據(jù)點(diǎn)的局部重建權(quán)值矩陣Wij以及其鄰域點(diǎn)計(jì)算出該樣本數(shù)據(jù)點(diǎn)的輸出值，具體是將所有的樣本數(shù)據(jù)點(diǎn)Xi映射嵌入到低維空間中，并使得低維重構(gòu)的誤差達(dá)到最小，要求最小化下列損失函數(shù)：ω(Y)=Σi=1NQij||Yi-ΣXj∈Ω(Xi)WijYj||2=tr(YMYT)]]>式中，需滿足其中構(gòu)建一個(gè)稀疏矩陣M＝(I-W)T(I-W)，通過求解這個(gè)稀疏矩陣的前m個(gè)最小的非零特征值所對應(yīng)的特征向量作為樣本數(shù)據(jù)點(diǎn)Xi的嵌入輸出值。所述自適應(yīng)二維Gabor小波變換方法中的Gabor濾波器的核函數(shù)定義為：Φα,β=||kα,β||2σ2e-||kα,β||2||z||22σ2[eikα,βz-e-σ22]]]>式中，α、β分別表示核函數(shù)的方向和頻率大小，α、β按照按如下方法設(shè)置：當(dāng)表情圖像質(zhì)量較好時(shí)，選取三個(gè)中心頻率β＝{0，1，2}和六個(gè)方向α＝{0，1，…，5}組成的18個(gè)Gabor濾波器用于特征提??；當(dāng)表情圖像受到腐蝕、遮擋時(shí)，選取四個(gè)中心頻率β＝{0，1…，3}和八個(gè)方向α＝{0，1，…，7}組成的32個(gè)Gabor濾波器用于特征提取；σ表示采用高斯函數(shù)窗口的大小，用來決定濾波器的帶寬，σ能夠根據(jù)參數(shù)設(shè)置進(jìn)行自適應(yīng)調(diào)整：將表情圖像分成v×v子塊，根據(jù)每個(gè)子塊特征數(shù)目選擇σ，特征數(shù)目大的子塊設(shè)定σ＝π，特征數(shù)目少的子塊設(shè)定σ＝2π；kα，β為小波矢量，其中，kβ和分別表示Gabor濾波器在頻率和方向空間的采樣方式。所述預(yù)定的多模態(tài)情感融合策略為：設(shè)已經(jīng)計(jì)算出一個(gè)測試樣本x對于c類的分類情況下，采用n個(gè)分類器進(jìn)行分類得到的后驗(yàn)概率集合為{pij(x)，i＝1,2,…,n,j＝1,2,…,c}，對n個(gè)分類器取得的后驗(yàn)概率按照方差規(guī)則集成得到一個(gè)新的后驗(yàn)概率集合{qj(x)，j＝1,2,…,c}，從中按照預(yù)定的挑選規(guī)則挑選出合適的后驗(yàn)概率值所對應(yīng)的類別作為要輸出的用戶情感識別結(jié)果；對于j類測試樣本，按照方差規(guī)則獲得的新的后驗(yàn)概率qj(x)可表示為：qj(x)=qj′(x)Σjqj′(x)]]>式中，qj′(x)=1nΣi=1n(pij(x)-1nΣi=1npij(x))2]]>對于j類測試樣本，最終所獲得的識別類別可表示為：ρ(x)＝argmaxj(qj(x))其中，所述預(yù)定的挑選規(guī)則為：將所述新的后驗(yàn)概率集合中的后驗(yàn)概率值按照從大到小順序進(jìn)行排列的前3個(gè)后驗(yàn)概率值為qj(x)max,qj(x)max-1，qj(x)max-2，若選擇qj(x)max作為合適的后驗(yàn)概率值，否則選擇qj(x)max-1作為合適的后驗(yàn)概率值,其中Qq為設(shè)定的后驗(yàn)概率權(quán)值，取值范圍為[1.4,1.6]。本優(yōu)選實(shí)施例設(shè)置改進(jìn)的局部線性嵌入方法，需要確定的參數(shù)比較少，只有鄰域數(shù)k和輸出維數(shù)d，大大減少了運(yùn)算量，且可以學(xué)習(xí)出任意維數(shù)的低維流形，提高了識別速度；采用自適應(yīng)二維Gabor小波變換方法對表情圖像中的表情特征進(jìn)行提取，具有旋轉(zhuǎn)、平移以及伸縮變換條件下不變的性質(zhì)，而且能得到一個(gè)解析的全局最優(yōu)解；在聲學(xué)特征降維子模塊12對聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理的過程中，計(jì)算各樣本數(shù)據(jù)點(diǎn)Xi的K個(gè)鄰域點(diǎn)的權(quán)重之和，并將其考慮到低維重構(gòu)的損失函數(shù)中，降低了噪聲的影響和數(shù)據(jù)樣本外點(diǎn)對降維的干擾，進(jìn)一步提高了情感識別的精度；設(shè)置預(yù)定的多模態(tài)情感融合策略，并根據(jù)多模態(tài)情感融合策略生成用戶情感識別結(jié)果，使識別結(jié)果更加可靠準(zhǔn)確。本應(yīng)用場景設(shè)定后驗(yàn)概率權(quán)值為Qq＝1.4，識別精度相對提高了12％。應(yīng)用場景2參見圖1、圖2，本應(yīng)用場景中的一種具有情感識別功能的多媒體播放器，其特征是，包括多媒體播放器和與多媒體播放器相連的情感控制系統(tǒng)，所述多媒體播放器可選擇地運(yùn)行于第一模式或第二模式，包括：多個(gè)多媒體源，用于提供多媒體數(shù)據(jù)；通用串行總線集線器接口，連接至外部電子裝置，并在該多媒體播放器運(yùn)行于該第二模式時(shí)與該外部電子裝置通信；處理器，耦接至該多個(gè)多媒體源及該通用串行總線集線器接口，當(dāng)該多媒體播放器運(yùn)行于該第一模式時(shí)，該處理器擷取該多個(gè)多媒體源其中之一的該多媒體數(shù)據(jù)，并譯碼該多媒體數(shù)據(jù)，其中該被譯碼的多媒體數(shù)據(jù)被準(zhǔn)備好以用于播放；當(dāng)該多媒體播放器運(yùn)行于該第二模式時(shí)，該處理器透過該通用串行總線集線器接口連接至該外部電子裝置，該多個(gè)多媒體源被用作支持該外部電子裝置的通用串行總線裝置。優(yōu)選地，該外部電子裝置為傳統(tǒng)的通用計(jì)算機(jī)、特種用途計(jì)算機(jī)或互聯(lián)網(wǎng)裝置。本優(yōu)選實(shí)施例可通過通用串行總線集線器接口連接至外部電子裝置，從而可以更有效地利用外部多媒體資源。優(yōu)選地，該外部電子裝置為包括多媒體播放器代理的通用串行總線主機(jī)。本優(yōu)選實(shí)施例更加方便客戶體驗(yàn)。優(yōu)選地，所述情感控制系統(tǒng)包括語音情感識別處理模塊1、表情情感識別處理模塊2、多模態(tài)情感融合識別處理模塊3和控制模塊4：(1)語音情感識別處理模塊1，用于獲取用戶的語音信號，并對語音信號進(jìn)行處理，最終輸出語音情感識別結(jié)果，其包括聲學(xué)特征提取子模塊11、聲學(xué)特征降維子模塊12和語音情感分類處理子模塊13；所述聲學(xué)特征提取子模塊11用于提取聲學(xué)特征數(shù)據(jù)；所述聲學(xué)特征降維子模塊12用于采用改進(jìn)的局部線性嵌入方法對所述聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理；所述語音情感分類處理子模塊13用于采用已訓(xùn)練好的支持向量機(jī)作為語音情感識別分類器，對降維后的聲學(xué)特征數(shù)據(jù)進(jìn)行情感識別并輸出語音情感識別結(jié)果，支持向量機(jī)的核函數(shù)采用高斯核函數(shù)；(2)表情情感識別處理模塊2，用于獲取用戶的表情圖像，并對表情圖像特征進(jìn)行處理，最終生成表情情感識別結(jié)果，其包括表情特征提取子模塊21、表情特征降維子模塊22和表情情感分類處理子模塊23；所述表情特征提取子模塊21用于采用自適應(yīng)二維Gabor小波變換方法對表情圖像中的表情特征進(jìn)行提取；所述表情特征降維子模塊22用于采用所述改進(jìn)的局部線性嵌入方法對所述表情特征數(shù)據(jù)進(jìn)行降維處理，并采用形態(tài)學(xué)處理方法做濾波處理；所述表情情感分類處理子模塊23用于采用已訓(xùn)練好的稀疏分類器作為表情情感識別分類器，對降維、濾波處理后的表情特征數(shù)據(jù)進(jìn)行情感識別并輸出表情情感識別結(jié)果；(3)多模態(tài)情感融合識別處理模塊3，用于基于所述語音情感識別結(jié)果和表情情感識別結(jié)果，根據(jù)預(yù)定的多模態(tài)情感融合策略生成用戶情感識別結(jié)果；(4)控制模塊，用于根據(jù)所述用戶情感識別結(jié)果，在驗(yàn)證用戶身份的前提下控制多媒體播放器執(zhí)行相應(yīng)的操作。本優(yōu)選實(shí)施例設(shè)置多模態(tài)情感融合識別處理模塊3，基于所述語音情感識別結(jié)果和表情情感識別結(jié)果，增強(qiáng)了識別結(jié)果的可靠性。優(yōu)選地，所述用戶情感識別結(jié)果包括高級別和低級別的褒義情感，中性情感以及高級別和低級別的貶義情感組成的5個(gè)級別情感類型。所述在驗(yàn)證用戶身份的前提下控制多媒體播放器執(zhí)行相應(yīng)的操作，具體為：所述控制模塊基于預(yù)先設(shè)置的語音特征數(shù)據(jù)庫，匹配所述用戶的語音信號的語音特征，從而進(jìn)行用戶身份驗(yàn)證，若驗(yàn)證通過，控制模塊控制多媒體播放器執(zhí)行相應(yīng)的操作。所述采用改進(jìn)的局部線性嵌入方法對所述聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理，包括：(1)將提取的聲學(xué)特征數(shù)據(jù)中的聲學(xué)特征向量看成是高維空間中的樣本數(shù)據(jù)點(diǎn)，設(shè)M維的N個(gè)樣本數(shù)據(jù)點(diǎn)為Xi，Xi∈RM，i∈[1，N]，類別號為Ci，嵌入輸出的N個(gè)m維的降維數(shù)據(jù)點(diǎn)為Yi，Yi∈Rm，i∈[1，N]，m≤M，且m值的范圍為[2,20]，對每個(gè)樣本數(shù)據(jù)點(diǎn)Xi確定其鄰域點(diǎn)的數(shù)目K，鄰域點(diǎn)的距離公式為：L′=1-e-Lλ,Ci=CjL+δ1max(L)+δ2min(L),Ci≠Cj]]>式中，L′是結(jié)合樣本數(shù)據(jù)點(diǎn)類別信息計(jì)算后的距離，L是忽略樣本數(shù)據(jù)點(diǎn)類別信息的原始?xì)W氏距離，參數(shù)λ用來防止L過快增長，max(L)表示最大歐氏距離，min(L)表示最小歐式距離，常數(shù)因子δ1、δ2(0≤δ1、δ2≤1)，共同控制距離計(jì)算時(shí)樣本數(shù)據(jù)點(diǎn)類別信息的結(jié)合數(shù)量程度；(2)利用每個(gè)樣本數(shù)據(jù)點(diǎn)Xi的鄰域點(diǎn)計(jì)算出樣本數(shù)據(jù)點(diǎn)的局部重建權(quán)值矩陣Wij，要求最小化下列損失函數(shù)：s(W)=Σi=1N||Xi-Σj=1KWijXj||2]]>式中，Wij為Xi與Xj之間的權(quán)值，且需滿足對Xi的非鄰域點(diǎn)，Wij＝0；(3)計(jì)算各樣本數(shù)據(jù)點(diǎn)Xi的K個(gè)鄰域點(diǎn)的權(quán)重之和：Qij=Σj=1KZij]]>其中，式中，Zij為各鄰域點(diǎn)之間的加權(quán)矩陣，d(Xi，Xj)表示樣本數(shù)據(jù)點(diǎn)間的Fisher投影距離，ξ為可調(diào)參數(shù)；(4)利用該樣本數(shù)據(jù)點(diǎn)的局部重建權(quán)值矩陣Wij以及其鄰域點(diǎn)計(jì)算出該樣本數(shù)據(jù)點(diǎn)的輸出值，具體是將所有的樣本數(shù)據(jù)點(diǎn)Xi映射嵌入到低維空間中，并使得低維重構(gòu)的誤差達(dá)到最小，要求最小化下列損失函數(shù)：ω(Y)=Σi=1NQij||Yi-ΣXj∈Ω(Xi)WijYj||2=tr(YMYT)]]>式中，需滿足其中構(gòu)建一個(gè)稀疏矩陣M＝(I-W)T(I-W)，通過求解這個(gè)稀疏矩陣的前m個(gè)最小的非零特征值所對應(yīng)的特征向量作為樣本數(shù)據(jù)點(diǎn)Xi的嵌入輸出值。所述自適應(yīng)二維Gabor小波變換方法中的Gabor濾波器的核函數(shù)定義為：Φα,β=||kα,β||2σ2e-||kα,β||2||z||22σ2[eikα,βz-e-σ22]]]>式中，α、β分別表示核函數(shù)的方向和頻率大小，α、β按照按如下方法設(shè)置：當(dāng)表情圖像質(zhì)量較好時(shí)，選取三個(gè)中心頻率β＝{0，1，2}和六個(gè)方向α＝{0，1，…，5}組成的18個(gè)Gabor濾波器用于特征提??；當(dāng)表情圖像受到腐蝕、遮擋時(shí)，選取四個(gè)中心頻率β＝{0，1…，3}和八個(gè)方向α＝{0，1，…，7}組成的32個(gè)Gabor濾波器用于特征提?。沪冶硎静捎酶咚购瘮?shù)窗口的大小，用來決定濾波器的帶寬，σ能夠根據(jù)參數(shù)設(shè)置進(jìn)行自適應(yīng)調(diào)整：將表情圖像分成v×v子塊，根據(jù)每個(gè)子塊特征數(shù)目選擇σ，特征數(shù)目大的子塊設(shè)定σ＝π，特征數(shù)目少的子塊設(shè)定σ＝2π；kα,β為小波矢量，其中，kβ和分別表示Gabor濾波器在頻率和方向空間的采樣方式。所述預(yù)定的多模態(tài)情感融合策略為：設(shè)已經(jīng)計(jì)算出一個(gè)測試樣本x對于c類的分類情況下，采用n個(gè)分類器進(jìn)行分類得到的后驗(yàn)概率集合為{pij(x)，i＝1,2,…,n,j＝1,2,…,c}，對n個(gè)分類器取得的后驗(yàn)概率按照方差規(guī)則集成得到一個(gè)新的后驗(yàn)概率集合{qj(x)，j＝1,2,…,c}，從中按照預(yù)定的挑選規(guī)則挑選出合適的后驗(yàn)概率值所對應(yīng)的類別作為要輸出的用戶情感識別結(jié)果；對于j類測試樣本，按照方差規(guī)則獲得的新的后驗(yàn)概率qj(x)可表示為：qj(x)=qj′(x)Σjqj′(x)]]>式中，qj′(x)=1nΣi=1n(pij(x)-1nΣi=1npij(x))2]]>對于j類測試樣本，最終所獲得的識別類別可表示為：ρ(x)＝argmaxj(qj(x))其中，所述預(yù)定的挑選規(guī)則為：將所述新的后驗(yàn)概率集合中的后驗(yàn)概率值按照從大到小順序進(jìn)行排列的前3個(gè)后驗(yàn)概率值為qj(x)max,qj(x)max-1，qj(x)max-2，若選擇qj(x)max作為合適的后驗(yàn)概率值，否則選擇qj(x)max-1作為合適的后驗(yàn)概率值,其中Qq為設(shè)定的后驗(yàn)概率權(quán)值，取值范圍為[1.4,1.6]。本優(yōu)選實(shí)施例設(shè)置改進(jìn)的局部線性嵌入方法，需要確定的參數(shù)比較少，只有鄰域數(shù)k和輸出維數(shù)d，大大減少了運(yùn)算量，且可以學(xué)習(xí)出任意維數(shù)的低維流形，提高了識別速度；采用自適應(yīng)二維Gabor小波變換方法對表情圖像中的表情特征進(jìn)行提取，具有旋轉(zhuǎn)、平移以及伸縮變換條件下不變的性質(zhì)，而且能得到一個(gè)解析的全局最優(yōu)解；在聲學(xué)特征降維子模塊12對聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理的過程中，計(jì)算各樣本數(shù)據(jù)點(diǎn)Xi的K個(gè)鄰域點(diǎn)的權(quán)重之和，并將其考慮到低維重構(gòu)的損失函數(shù)中，降低了噪聲的影響和數(shù)據(jù)樣本外點(diǎn)對降維的干擾，進(jìn)一步提高了情感識別的精度；設(shè)置預(yù)定的多模態(tài)情感融合策略，并根據(jù)多模態(tài)情感融合策略生成用戶情感識別結(jié)果，使識別結(jié)果更加可靠準(zhǔn)確。本應(yīng)用場景設(shè)定后驗(yàn)概率權(quán)值為Qq＝1.45，識別精度相對提高了10％。應(yīng)用場景3參見圖1、圖2，本應(yīng)用場景中的一種具有情感識別功能的多媒體播放器，其特征是，包括多媒體播放器和與多媒體播放器相連的情感控制系統(tǒng)，所述多媒體播放器可選擇地運(yùn)行于第一模式或第二模式，包括：多個(gè)多媒體源，用于提供多媒體數(shù)據(jù)；通用串行總線集線器接口，連接至外部電子裝置，并在該多媒體播放器運(yùn)行于該第二模式時(shí)與該外部電子裝置通信；處理器，耦接至該多個(gè)多媒體源及該通用串行總線集線器接口，當(dāng)該多媒體播放器運(yùn)行于該第一模式時(shí)，該處理器擷取該多個(gè)多媒體源其中之一的該多媒體數(shù)據(jù)，并譯碼該多媒體數(shù)據(jù)，其中該被譯碼的多媒體數(shù)據(jù)被準(zhǔn)備好以用于播放；當(dāng)該多媒體播放器運(yùn)行于該第二模式時(shí)，該處理器透過該通用串行總線集線器接口連接至該外部電子裝置，該多個(gè)多媒體源被用作支持該外部電子裝置的通用串行總線裝置。優(yōu)選地，該外部電子裝置為傳統(tǒng)的通用計(jì)算機(jī)、特種用途計(jì)算機(jī)或互聯(lián)網(wǎng)裝置。本優(yōu)選實(shí)施例可通過通用串行總線集線器接口連接至外部電子裝置，從而可以更有效地利用外部多媒體資源。優(yōu)選地，該外部電子裝置為包括多媒體播放器代理的通用串行總線主機(jī)。本優(yōu)選實(shí)施例更加方便客戶體驗(yàn)。優(yōu)選地，所述情感控制系統(tǒng)包括語音情感識別處理模塊1、表情情感識別處理模塊2、多模態(tài)情感融合識別處理模塊3和控制模塊4：(1)語音情感識別處理模塊1，用于獲取用戶的語音信號，并對語音信號進(jìn)行處理，最終輸出語音情感識別結(jié)果，其包括聲學(xué)特征提取子模塊11、聲學(xué)特征降維子模塊12和語音情感分類處理子模塊13；所述聲學(xué)特征提取子模塊11用于提取聲學(xué)特征數(shù)據(jù)；所述聲學(xué)特征降維子模塊12用于采用改進(jìn)的局部線性嵌入方法對所述聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理；所述語音情感分類處理子模塊13用于采用已訓(xùn)練好的支持向量機(jī)作為語音情感識別分類器，對降維后的聲學(xué)特征數(shù)據(jù)進(jìn)行情感識別并輸出語音情感識別結(jié)果，支持向量機(jī)的核函數(shù)采用高斯核函數(shù)；(2)表情情感識別處理模塊2，用于獲取用戶的表情圖像，并對表情圖像特征進(jìn)行處理，最終生成表情情感識別結(jié)果，其包括表情特征提取子模塊21、表情特征降維子模塊22和表情情感分類處理子模塊23；所述表情特征提取子模塊21用于采用自適應(yīng)二維Gabor小波變換方法對表情圖像中的表情特征進(jìn)行提取；所述表情特征降維子模塊22用于采用所述改進(jìn)的局部線性嵌入方法對所述表情特征數(shù)據(jù)進(jìn)行降維處理，并采用形態(tài)學(xué)處理方法做濾波處理；所述表情情感分類處理子模塊23用于采用已訓(xùn)練好的稀疏分類器作為表情情感識別分類器，對降維、濾波處理后的表情特征數(shù)據(jù)進(jìn)行情感識別并輸出表情情感識別結(jié)果；(3)多模態(tài)情感融合識別處理模塊3，用于基于所述語音情感識別結(jié)果和表情情感識別結(jié)果，根據(jù)預(yù)定的多模態(tài)情感融合策略生成用戶情感識別結(jié)果；(4)控制模塊，用于根據(jù)所述用戶情感識別結(jié)果，在驗(yàn)證用戶身份的前提下控制多媒體播放器執(zhí)行相應(yīng)的操作。本優(yōu)選實(shí)施例設(shè)置多模態(tài)情感融合識別處理模塊3，基于所述語音情感識別結(jié)果和表情情感識別結(jié)果，增強(qiáng)了識別結(jié)果的可靠性。優(yōu)選地，所述用戶情感識別結(jié)果包括高級別和低級別的褒義情感，中性情感以及高級別和低級別的貶義情感組成的5個(gè)級別情感類型。所述在驗(yàn)證用戶身份的前提下控制多媒體播放器執(zhí)行相應(yīng)的操作，具體為：所述控制模塊基于預(yù)先設(shè)置的語音特征數(shù)據(jù)庫，匹配所述用戶的語音信號的語音特征，從而進(jìn)行用戶身份驗(yàn)證，若驗(yàn)證通過，控制模塊控制多媒體播放器執(zhí)行相應(yīng)的操作。所述采用改進(jìn)的局部線性嵌入方法對所述聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理，包括：(1)將提取的聲學(xué)特征數(shù)據(jù)中的聲學(xué)特征向量看成是高維空間中的樣本數(shù)據(jù)點(diǎn)，設(shè)M維的N個(gè)樣本數(shù)據(jù)點(diǎn)為Xi，Xi∈RM，i∈[1，N]，類別號為Ci，嵌入輸出的N個(gè)m維的降維數(shù)據(jù)點(diǎn)為Yi，Yi∈Rm，i∈[1，N]，m≤M，且m值的范圍為[2,20]，對每個(gè)樣本數(shù)據(jù)點(diǎn)Xi確定其鄰域點(diǎn)的數(shù)目K，鄰域點(diǎn)的距離公式為：L′=1-e-Lλ,Ci=CjL+δ1max(L)+δ2min(L),Ci≠Cj]]>式中，L′是結(jié)合樣本數(shù)據(jù)點(diǎn)類別信息計(jì)算后的距離，L是忽略樣本數(shù)據(jù)點(diǎn)類別信息的原始?xì)W氏距離，參數(shù)λ用來防止L過快增長，max(L)表示最大歐氏距離，min(L)表示最小歐式距離，常數(shù)因子δ1、δ2(0≤δ1、δ2≤1)，共同控制距離計(jì)算時(shí)樣本數(shù)據(jù)點(diǎn)類別信息的結(jié)合數(shù)量程度；(2)利用每個(gè)樣本數(shù)據(jù)點(diǎn)Xi的鄰域點(diǎn)計(jì)算出樣本數(shù)據(jù)點(diǎn)的局部重建權(quán)值矩陣Wij，要求最小化下列損失函數(shù)：s(W)=Σi=1N||Xi-Σj=1KWijXj||2]]>式中，Wij為Xi與Xj之間的權(quán)值，且需滿足對Xi的非鄰域點(diǎn)，Wij＝0；(3)計(jì)算各樣本數(shù)據(jù)點(diǎn)Xi的K個(gè)鄰域點(diǎn)的權(quán)重之和：Qij=Σj=1KZij]]>其中，式中，Zij為各鄰域點(diǎn)之間的加權(quán)矩陣，d(Xi，Xj)表示樣本數(shù)據(jù)點(diǎn)間的Fisher投影距離，ξ為可調(diào)參數(shù)；(4)利用該樣本數(shù)據(jù)點(diǎn)的局部重建權(quán)值矩陣Wij以及其鄰域點(diǎn)計(jì)算出該樣本數(shù)據(jù)點(diǎn)的輸出值，具體是將所有的樣本數(shù)據(jù)點(diǎn)Xi映射嵌入到低維空間中，并使得低維重構(gòu)的誤差達(dá)到最小，要求最小化下列損失函數(shù)：ω(Y)=Σi=1NQij||Yi-ΣXj∈Ω(Xi)WijYj||2=tr(YMYT)]]>式中，需滿足其中構(gòu)建一個(gè)稀疏矩陣M＝(I-W)T(I-W)，通過求解這個(gè)稀疏矩陣的前m個(gè)最小的非零特征值所對應(yīng)的特征向量作為樣本數(shù)據(jù)點(diǎn)Xi的嵌入輸出值。所述自適應(yīng)二維Gabor小波變換方法中的Gabor濾波器的核函數(shù)定義為：Φα,β=||kα,β||2σ2e-||kα,β||2||z||22σ2[eikα,βz-e-σ22]]]>式中，α、β分別表示核函數(shù)的方向和頻率大小，α、β按照按如下方法設(shè)置：當(dāng)表情圖像質(zhì)量較好時(shí)，選取三個(gè)中心頻率β＝{0，1，2}和六個(gè)方向α＝{0，1，…，5}組成的18個(gè)Gabor濾波器用于特征提?。划?dāng)表情圖像受到腐蝕、遮擋時(shí)，選取四個(gè)中心頻率β＝{0，1…，3}和八個(gè)方向α＝{0，1，…，7}組成的32個(gè)Gabor濾波器用于特征提??；σ表示采用高斯函數(shù)窗口的大小，用來決定濾波器的帶寬，σ能夠根據(jù)參數(shù)設(shè)置進(jìn)行自適應(yīng)調(diào)整：將表情圖像分成v×v子塊，根據(jù)每個(gè)子塊特征數(shù)目選擇σ，特征數(shù)目大的子塊設(shè)定σ＝π，特征數(shù)目少的子塊設(shè)定σ＝2π；kα,β為小波矢量，其中，kβ和分別表示Gabor濾波器在頻率和方向空間的采樣方式。所述預(yù)定的多模態(tài)情感融合策略為：設(shè)已經(jīng)計(jì)算出一個(gè)測試樣本x對于c類的分類情況下，采用n個(gè)分類器進(jìn)行分類得到的后驗(yàn)概率集合為{pij(x)，i＝1,2,…,n,j＝1,2,…,c}，對n個(gè)分類器取得的后驗(yàn)概率按照方差規(guī)則集成得到一個(gè)新的后驗(yàn)概率集合{qj(x)，j＝1,2,…,c}，從中按照預(yù)定的挑選規(guī)則挑選出合適的后驗(yàn)概率值所對應(yīng)的類別作為要輸出的用戶情感識別結(jié)果；對于j類測試樣本，按照方差規(guī)則獲得的新的后驗(yàn)概率qj(x)可表示為：qj(x)=qj′(x)Σjqj′(x)]]>式中，qj′(x)=1nΣi=1n(pij(x)-1nΣi=1npij(x))2]]>對于j類測試樣本，最終所獲得的識別類別可表示為：ρ(x)＝argmaxj(qj(x))其中，所述預(yù)定的挑選規(guī)則為：將所述新的后驗(yàn)概率集合中的后驗(yàn)概率值按照從大到小順序進(jìn)行排列的前3個(gè)后驗(yàn)概率值為qj(x)max,qj(x)max-1，qj(x)max-2，若選擇qj(x)max作為合適的后驗(yàn)概率值，否則選擇qj(x)max-1作為合適的后驗(yàn)概率值,其中Qq為設(shè)定的后驗(yàn)概率權(quán)值，取值范圍為[1.4,1.6]。本優(yōu)選實(shí)施例設(shè)置改進(jìn)的局部線性嵌入方法，需要確定的參數(shù)比較少，只有鄰域數(shù)k和輸出維數(shù)d，大大減少了運(yùn)算量，且可以學(xué)習(xí)出任意維數(shù)的低維流形，提高了識別速度；采用自適應(yīng)二維Gabor小波變換方法對表情圖像中的表情特征進(jìn)行提取，具有旋轉(zhuǎn)、平移以及伸縮變換條件下不變的性質(zhì)，而且能得到一個(gè)解析的全局最優(yōu)解；在聲學(xué)特征降維子模塊12對聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理的過程中，計(jì)算各樣本數(shù)據(jù)點(diǎn)Xi的K個(gè)鄰域點(diǎn)的權(quán)重之和，并將其考慮到低維重構(gòu)的損失函數(shù)中，降低了噪聲的影響和數(shù)據(jù)樣本外點(diǎn)對降維的干擾，進(jìn)一步提高了情感識別的精度；設(shè)置預(yù)定的多模態(tài)情感融合策略，并根據(jù)多模態(tài)情感融合策略生成用戶情感識別結(jié)果，使識別結(jié)果更加可靠準(zhǔn)確。本應(yīng)用場景設(shè)定后驗(yàn)概率權(quán)值為Qq＝1.5，識別精度相對提高了15％。應(yīng)用場景4參見圖1、圖2，本應(yīng)用場景中的一種具有情感識別功能的多媒體播放器，其特征是，包括多媒體播放器和與多媒體播放器相連的情感控制系統(tǒng)，所述多媒體播放器可選擇地運(yùn)行于第一模式或第二模式，包括：多個(gè)多媒體源，用于提供多媒體數(shù)據(jù)；通用串行總線集線器接口，連接至外部電子裝置，并在該多媒體播放器運(yùn)行于該第二模式時(shí)與該外部電子裝置通信；處理器，耦接至該多個(gè)多媒體源及該通用串行總線集線器接口，當(dāng)該多媒體播放器運(yùn)行于該第一模式時(shí)，該處理器擷取該多個(gè)多媒體源其中之一的該多媒體數(shù)據(jù)，并譯碼該多媒體數(shù)據(jù)，其中該被譯碼的多媒體數(shù)據(jù)被準(zhǔn)備好以用于播放；當(dāng)該多媒體播放器運(yùn)行于該第二模式時(shí)，該處理器透過該通用串行總線集線器接口連接至該外部電子裝置，該多個(gè)多媒體源被用作支持該外部電子裝置的通用串行總線裝置。優(yōu)選地，該外部電子裝置為傳統(tǒng)的通用計(jì)算機(jī)、特種用途計(jì)算機(jī)或互聯(lián)網(wǎng)裝置。本優(yōu)選實(shí)施例可通過通用串行總線集線器接口連接至外部電子裝置，從而可以更有效地利用外部多媒體資源。優(yōu)選地，該外部電子裝置為包括多媒體播放器代理的通用串行總線主機(jī)。本優(yōu)選實(shí)施例更加方便客戶體驗(yàn)。優(yōu)選地，所述情感控制系統(tǒng)包括語音情感識別處理模塊1、表情情感識別處理模塊2、多模態(tài)情感融合識別處理模塊3和控制模塊4：(1)語音情感識別處理模塊1，用于獲取用戶的語音信號，并對語音信號進(jìn)行處理，最終輸出語音情感識別結(jié)果，其包括聲學(xué)特征提取子模塊11、聲學(xué)特征降維子模塊12和語音情感分類處理子模塊13；所述聲學(xué)特征提取子模塊11用于提取聲學(xué)特征數(shù)據(jù)；所述聲學(xué)特征降維子模塊12用于采用改進(jìn)的局部線性嵌入方法對所述聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理；所述語音情感分類處理子模塊13用于采用已訓(xùn)練好的支持向量機(jī)作為語音情感識別分類器，對降維后的聲學(xué)特征數(shù)據(jù)進(jìn)行情感識別并輸出語音情感識別結(jié)果，支持向量機(jī)的核函數(shù)采用高斯核函數(shù)；(2)表情情感識別處理模塊2，用于獲取用戶的表情圖像，并對表情圖像特征進(jìn)行處理，最終生成表情情感識別結(jié)果，其包括表情特征提取子模塊21、表情特征降維子模塊22和表情情感分類處理子模塊23；所述表情特征提取子模塊21用于采用自適應(yīng)二維Gabor小波變換方法對表情圖像中的表情特征進(jìn)行提??；所述表情特征降維子模塊22用于采用所述改進(jìn)的局部線性嵌入方法對所述表情特征數(shù)據(jù)進(jìn)行降維處理，并采用形態(tài)學(xué)處理方法做濾波處理；所述表情情感分類處理子模塊23用于采用已訓(xùn)練好的稀疏分類器作為表情情感識別分類器，對降維、濾波處理后的表情特征數(shù)據(jù)進(jìn)行情感識別并輸出表情情感識別結(jié)果；(3)多模態(tài)情感融合識別處理模塊3，用于基于所述語音情感識別結(jié)果和表情情感識別結(jié)果，根據(jù)預(yù)定的多模態(tài)情感融合策略生成用戶情感識別結(jié)果；(4)控制模塊，用于根據(jù)所述用戶情感識別結(jié)果，在驗(yàn)證用戶身份的前提下控制多媒體播放器執(zhí)行相應(yīng)的操作。本優(yōu)選實(shí)施例設(shè)置多模態(tài)情感融合識別處理模塊3，基于所述語音情感識別結(jié)果和表情情感識別結(jié)果，增強(qiáng)了識別結(jié)果的可靠性。優(yōu)選地，所述用戶情感識別結(jié)果包括高級別和低級別的褒義情感，中性情感以及高級別和低級別的貶義情感組成的5個(gè)級別情感類型。所述在驗(yàn)證用戶身份的前提下控制多媒體播放器執(zhí)行相應(yīng)的操作，具體為：所述控制模塊基于預(yù)先設(shè)置的語音特征數(shù)據(jù)庫，匹配所述用戶的語音信號的語音特征，從而進(jìn)行用戶身份驗(yàn)證，若驗(yàn)證通過，控制模塊控制多媒體播放器執(zhí)行相應(yīng)的操作。所述采用改進(jìn)的局部線性嵌入方法對所述聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理，包括：(1)將提取的聲學(xué)特征數(shù)據(jù)中的聲學(xué)特征向量看成是高維空間中的樣本數(shù)據(jù)點(diǎn)，設(shè)M維的N個(gè)樣本數(shù)據(jù)點(diǎn)為Xi，Xi∈RM，i∈[1，N]，類別號為Ci，嵌入輸出的N個(gè)m維的降維數(shù)據(jù)點(diǎn)為Yi，Yi∈Rm，i∈[1，N]，m≤M，且m值的范圍為[2,20]，對每個(gè)樣本數(shù)據(jù)點(diǎn)Xi確定其鄰域點(diǎn)的數(shù)目K，鄰域點(diǎn)的距離公式為：L′=1-e-Lλ,Ci=CjL+δ1max(L)+δ2min(L),Ci≠Cj]]>式中，L′是結(jié)合樣本數(shù)據(jù)點(diǎn)類別信息計(jì)算后的距離，L是忽略樣本數(shù)據(jù)點(diǎn)類別信息的原始?xì)W氏距離，參數(shù)λ用來防止L過快增長，max(L)表示最大歐氏距離，min(L)表示最小歐式距離，常數(shù)因子δ1、δ2(0≤δ1、δ2≤1)，共同控制距離計(jì)算時(shí)樣本數(shù)據(jù)點(diǎn)類別信息的結(jié)合數(shù)量程度；(2)利用每個(gè)樣本數(shù)據(jù)點(diǎn)Xi的鄰域點(diǎn)計(jì)算出樣本數(shù)據(jù)點(diǎn)的局部重建權(quán)值矩陣Wij，要求最小化下列損失函數(shù)：s(W)=Σi=1N||Xi-Σj=1KWijXj||2]]>式中，Wij為Xi與Xj之間的權(quán)值，且需滿足對Xi的非鄰域點(diǎn)，Wij＝0；(3)計(jì)算各樣本數(shù)據(jù)點(diǎn)Xi的K個(gè)鄰域點(diǎn)的權(quán)重之和：Qij=Σj=1KZij]]>其中，式中，Zij為各鄰域點(diǎn)之間的加權(quán)矩陣，d(Xi，Xj)表示樣本數(shù)據(jù)點(diǎn)間的Fisher投影距離，ξ為可調(diào)參數(shù)；(4)利用該樣本數(shù)據(jù)點(diǎn)的局部重建權(quán)值矩陣Wij以及其鄰域點(diǎn)計(jì)算出該樣本數(shù)據(jù)點(diǎn)的輸出值，具體是將所有的樣本數(shù)據(jù)點(diǎn)Xi映射嵌入到低維空間中，并使得低維重構(gòu)的誤差達(dá)到最小，要求最小化下列損失函數(shù)：ω(Y)=Σi=1NQij||Yi-ΣXj∈Ω(Xi)WijYj||2=tr(YMYT)]]>式中，需滿足其中構(gòu)建一個(gè)稀疏矩陣M＝(I-W)T(I-W)，通過求解這個(gè)稀疏矩陣的前m個(gè)最小的非零特征值所對應(yīng)的特征向量作為樣本數(shù)據(jù)點(diǎn)Xi的嵌入輸出值。所述自適應(yīng)二維Gabor小波變換方法中的Gabor濾波器的核函數(shù)定義為：Φα,β=||kα,β||2σ2e-||kα,β||2||z||22σ2[eikα,βz-e-σ22]]]>式中，α、β分別表示核函數(shù)的方向和頻率大小，α、β按照按如下方法設(shè)置：當(dāng)表情圖像質(zhì)量較好時(shí)，選取三個(gè)中心頻率β＝{0，1，2}和六個(gè)方向α＝{0，1，…，5}組成的18個(gè)Gabor濾波器用于特征提取；當(dāng)表情圖像受到腐蝕、遮擋時(shí)，選取四個(gè)中心頻率β＝{0，1…，3}和八個(gè)方向α＝{0，1，…，7}組成的32個(gè)Gabor濾波器用于特征提?。沪冶硎静捎酶咚购瘮?shù)窗口的大小，用來決定濾波器的帶寬，σ能夠根據(jù)參數(shù)設(shè)置進(jìn)行自適應(yīng)調(diào)整：將表情圖像分成v×v子塊，根據(jù)每個(gè)子塊特征數(shù)目選擇σ，特征數(shù)目大的子塊設(shè)定σ＝π，特征數(shù)目少的子塊設(shè)定σ＝2π；kα，β為小波矢量，其中，kβ和分別表示Gabor濾波器在頻率和方向空間的采樣方式。所述預(yù)定的多模態(tài)情感融合策略為：設(shè)已經(jīng)計(jì)算出一個(gè)測試樣本x對于c類的分類情況下，采用n個(gè)分類器進(jìn)行分類得到的后驗(yàn)概率集合為{pij(x)，i＝1,2,…,n,j＝1,2,…,c}，對n個(gè)分類器取得的后驗(yàn)概率按照方差規(guī)則集成得到一個(gè)新的后驗(yàn)概率集合{qj(x)，j＝1,2,…,c}，從中按照預(yù)定的挑選規(guī)則挑選出合適的后驗(yàn)概率值所對應(yīng)的類別作為要輸出的用戶情感識別結(jié)果；對于j類測試樣本，按照方差規(guī)則獲得的新的后驗(yàn)概率qj(x)可表示為：qj(x)=qj′(x)Σjqj′(x)]]>式中，qj′(x)=1nΣi=1n(pij(x)-1nΣi=1npij(x))2]]>對于j類測試樣本，最終所獲得的識別類別可表示為：ρ(x)＝argmaxj(qj(x))其中，所述預(yù)定的挑選規(guī)則為：將所述新的后驗(yàn)概率集合中的后驗(yàn)概率值按照從大到小順序進(jìn)行排列的前3個(gè)后驗(yàn)概率值為qj(x)max,qj(x)max-1，qj(x)max-2，若選擇qj(x)max作為合適的后驗(yàn)概率值，否則選擇qj(x)max-1作為合適的后驗(yàn)概率值,其中Qq為設(shè)定的后驗(yàn)概率權(quán)值，取值范圍為[1.4,1.6]。本優(yōu)選實(shí)施例設(shè)置改進(jìn)的局部線性嵌入方法，需要確定的參數(shù)比較少，只有鄰域數(shù)k和輸出維數(shù)d，大大減少了運(yùn)算量，且可以學(xué)習(xí)出任意維數(shù)的低維流形，提高了識別速度；采用自適應(yīng)二維Gabor小波變換方法對表情圖像中的表情特征進(jìn)行提取，具有旋轉(zhuǎn)、平移以及伸縮變換條件下不變的性質(zhì)，而且能得到一個(gè)解析的全局最優(yōu)解；在聲學(xué)特征降維子模塊12對聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理的過程中，計(jì)算各樣本數(shù)據(jù)點(diǎn)Xi的K個(gè)鄰域點(diǎn)的權(quán)重之和，并將其考慮到低維重構(gòu)的損失函數(shù)中，降低了噪聲的影響和數(shù)據(jù)樣本外點(diǎn)對降維的干擾，進(jìn)一步提高了情感識別的精度；設(shè)置預(yù)定的多模態(tài)情感融合策略，并根據(jù)多模態(tài)情感融合策略生成用戶情感識別結(jié)果，使識別結(jié)果更加可靠準(zhǔn)確。本應(yīng)用場景設(shè)定后驗(yàn)概率權(quán)值為Qq＝1.55，識別精度相對提高了10％。應(yīng)用場景5參見圖1、圖2，本應(yīng)用場景中的一種具有情感識別功能的多媒體播放器，其特征是，包括多媒體播放器和與多媒體播放器相連的情感控制系統(tǒng)，所述多媒體播放器可選擇地運(yùn)行于第一模式或第二模式，包括：多個(gè)多媒體源，用于提供多媒體數(shù)據(jù)；通用串行總線集線器接口，連接至外部電子裝置，并在該多媒體播放器運(yùn)行于該第二模式時(shí)與該外部電子裝置通信；處理器，耦接至該多個(gè)多媒體源及該通用串行總線集線器接口，當(dāng)該多媒體播放器運(yùn)行于該第一模式時(shí)，該處理器擷取該多個(gè)多媒體源其中之一的該多媒體數(shù)據(jù)，并譯碼該多媒體數(shù)據(jù)，其中該被譯碼的多媒體數(shù)據(jù)被準(zhǔn)備好以用于播放；當(dāng)該多媒體播放器運(yùn)行于該第二模式時(shí)，該處理器透過該通用串行總線集線器接口連接至該外部電子裝置，該多個(gè)多媒體源被用作支持該外部電子裝置的通用串行總線裝置。優(yōu)選地，該外部電子裝置為傳統(tǒng)的通用計(jì)算機(jī)、特種用途計(jì)算機(jī)或互聯(lián)網(wǎng)裝置。本優(yōu)選實(shí)施例可通過通用串行總線集線器接口連接至外部電子裝置，從而可以更有效地利用外部多媒體資源。優(yōu)選地，該外部電子裝置為包括多媒體播放器代理的通用串行總線主機(jī)。本優(yōu)選實(shí)施例更加方便客戶體驗(yàn)。優(yōu)選地，所述情感控制系統(tǒng)包括語音情感識別處理模塊1、表情情感識別處理模塊2、多模態(tài)情感融合識別處理模塊3和控制模塊4：(1)語音情感識別處理模塊1，用于獲取用戶的語音信號，并對語音信號進(jìn)行處理，最終輸出語音情感識別結(jié)果，其包括聲學(xué)特征提取子模塊11、聲學(xué)特征降維子模塊12和語音情感分類處理子模塊13；所述聲學(xué)特征提取子模塊11用于提取聲學(xué)特征數(shù)據(jù)；所述聲學(xué)特征降維子模塊12用于采用改進(jìn)的局部線性嵌入方法對所述聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理；所述語音情感分類處理子模塊13用于采用已訓(xùn)練好的支持向量機(jī)作為語音情感識別分類器，對降維后的聲學(xué)特征數(shù)據(jù)進(jìn)行情感識別并輸出語音情感識別結(jié)果，支持向量機(jī)的核函數(shù)采用高斯核函數(shù)；(2)表情情感識別處理模塊2，用于獲取用戶的表情圖像，并對表情圖像特征進(jìn)行處理，最終生成表情情感識別結(jié)果，其包括表情特征提取子模塊21、表情特征降維子模塊22和表情情感分類處理子模塊23；所述表情特征提取子模塊21用于采用自適應(yīng)二維Gabor小波變換方法對表情圖像中的表情特征進(jìn)行提??；所述表情特征降維子模塊22用于采用所述改進(jìn)的局部線性嵌入方法對所述表情特征數(shù)據(jù)進(jìn)行降維處理，并采用形態(tài)學(xué)處理方法做濾波處理；所述表情情感分類處理子模塊23用于采用已訓(xùn)練好的稀疏分類器作為表情情感識別分類器，對降維、濾波處理后的表情特征數(shù)據(jù)進(jìn)行情感識別并輸出表情情感識別結(jié)果；(3)多模態(tài)情感融合識別處理模塊3，用于基于所述語音情感識別結(jié)果和表情情感識別結(jié)果，根據(jù)預(yù)定的多模態(tài)情感融合策略生成用戶情感識別結(jié)果；(4)控制模塊，用于根據(jù)所述用戶情感識別結(jié)果，在驗(yàn)證用戶身份的前提下控制多媒體播放器執(zhí)行相應(yīng)的操作。本優(yōu)選實(shí)施例設(shè)置多模態(tài)情感融合識別處理模塊3，基于所述語音情感識別結(jié)果和表情情感識別結(jié)果，增強(qiáng)了識別結(jié)果的可靠性。優(yōu)選地，所述用戶情感識別結(jié)果包括高級別和低級別的褒義情感，中性情感以及高級別和低級別的貶義情感組成的5個(gè)級別情感類型。所述在驗(yàn)證用戶身份的前提下控制多媒體播放器執(zhí)行相應(yīng)的操作，具體為：所述控制模塊基于預(yù)先設(shè)置的語音特征數(shù)據(jù)庫，匹配所述用戶的語音信號的語音特征，從而進(jìn)行用戶身份驗(yàn)證，若驗(yàn)證通過，控制模塊控制多媒體播放器執(zhí)行相應(yīng)的操作。所述采用改進(jìn)的局部線性嵌入方法對所述聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理，包括：(1)將提取的聲學(xué)特征數(shù)據(jù)中的聲學(xué)特征向量看成是高維空間中的樣本數(shù)據(jù)點(diǎn)，設(shè)M維的N個(gè)樣本數(shù)據(jù)點(diǎn)為Xi，Xi∈RM，i∈[1，N]，類別號為Ci，嵌入輸出的N個(gè)m維的降維數(shù)據(jù)點(diǎn)為Yi，Yi∈Rm，i∈[1，N]，m≤M，且m值的范圍為[2,20]，對每個(gè)樣本數(shù)據(jù)點(diǎn)Xi確定其鄰域點(diǎn)的數(shù)目K，鄰域點(diǎn)的距離公式為：L′=1-e-Lλ,Ci=CjL+δ1max(L)+δ2min(L),Ci≠Cj]]>式中，L′是結(jié)合樣本數(shù)據(jù)點(diǎn)類別信息計(jì)算后的距離，L是忽略樣本數(shù)據(jù)點(diǎn)類別信息的原始?xì)W氏距離，參數(shù)λ用來防止L過快增長，max(L)表示最大歐氏距離，min(L)表示最小歐式距離，常數(shù)因子δ1、δ2(0≤δ1、δ2≤1)，共同控制距離計(jì)算時(shí)樣本數(shù)據(jù)點(diǎn)類別信息的結(jié)合數(shù)量程度；(2)利用每個(gè)樣本數(shù)據(jù)點(diǎn)Xi的鄰域點(diǎn)計(jì)算出樣本數(shù)據(jù)點(diǎn)的局部重建權(quán)值矩陣Wij，要求最小化下列損失函數(shù)：s(W)=Σi=1N||Xi-Σj=1KWijXj||2]]>式中，Wij為Xi與Xj之間的權(quán)值，且需滿足對Xi的非鄰域點(diǎn)，Wij＝0；(3)計(jì)算各樣本數(shù)據(jù)點(diǎn)Xi的K個(gè)鄰域點(diǎn)的權(quán)重之和：Qij=Σj=1KZij]]>其中，式中，Zij為各鄰域點(diǎn)之間的加權(quán)矩陣，d(Xi，Xj)表示樣本數(shù)據(jù)點(diǎn)間的Fisher投影距離，ξ為可調(diào)參數(shù)；(4)利用該樣本數(shù)據(jù)點(diǎn)的局部重建權(quán)值矩陣Wij以及其鄰域點(diǎn)計(jì)算出該樣本數(shù)據(jù)點(diǎn)的輸出值，具體是將所有的樣本數(shù)據(jù)點(diǎn)Xi映射嵌入到低維空間中，并使得低維重構(gòu)的誤差達(dá)到最小，要求最小化下列損失函數(shù)：ω(Y)=Σi=1NQij||Yi-ΣXj∈Ω(Xi)WijYj||2=tr(YMYT)]]>式中，需滿足其中構(gòu)建一個(gè)稀疏矩陣M＝(I-W)T(I-W)，通過求解這個(gè)稀疏矩陣的前m個(gè)最小的非零特征值所對應(yīng)的特征向量作為樣本數(shù)據(jù)點(diǎn)Xi的嵌入輸出值。所述自適應(yīng)二維Gabor小波變換方法中的Gabor濾波器的核函數(shù)定義為：Φα,β=||kα,β||2σ2e-||kα,β||2||z||22σ2[eikα,βz-e-σ22]]]>式中，α、β分別表示核函數(shù)的方向和頻率大小，α、β按照按如下方法設(shè)置：當(dāng)表情圖像質(zhì)量較好時(shí)，選取三個(gè)中心頻率β＝{0，1，2}和六個(gè)方向α＝{0，1，…，5}組成的18個(gè)Gabor濾波器用于特征提?。划?dāng)表情圖像受到腐蝕、遮擋時(shí)，選取四個(gè)中心頻率β＝{0，1…，3}和八個(gè)方向α＝{0，1，…，7}組成的32個(gè)Gabor濾波器用于特征提??；σ表示采用高斯函數(shù)窗口的大小，用來決定濾波器的帶寬，σ能夠根據(jù)參數(shù)設(shè)置進(jìn)行自適應(yīng)調(diào)整：將表情圖像分成v×v子塊，根據(jù)每個(gè)子塊特征數(shù)目選擇σ，特征數(shù)目大的子塊設(shè)定σ＝π，特征數(shù)目少的子塊設(shè)定σ＝2π；kα,β為小波矢量，其中，kβ和分別表示Gabor濾波器在頻率和方向空間的采樣方式。所述預(yù)定的多模態(tài)情感融合策略為：設(shè)已經(jīng)計(jì)算出一個(gè)測試樣本x對于c類的分類情況下，采用n個(gè)分類器進(jìn)行分類得到的后驗(yàn)概率集合為{pij(x)，i＝1,2,…,n,j＝1,2,…,c}，對n個(gè)分類器取得的后驗(yàn)概率按照方差規(guī)則集成得到一個(gè)新的后驗(yàn)概率集合{qj(x)，j＝1,2,…,c}，從中按照預(yù)定的挑選規(guī)則挑選出合適的后驗(yàn)概率值所對應(yīng)的類別作為要輸出的用戶情感識別結(jié)果；對于j類測試樣本，按照方差規(guī)則獲得的新的后驗(yàn)概率qj(x)可表示為：qj(x)=qj′(x)Σjqj′(x)]]>式中，qj′(x)=1nΣi=1n(pij(x)-1nΣi=1npij(x))2]]>對于j類測試樣本，最終所獲得的識別類別可表示為：ρ(x)＝argmaxj(qj(x))其中，所述預(yù)定的挑選規(guī)則為：將所述新的后驗(yàn)概率集合中的后驗(yàn)概率值按照從大到小順序進(jìn)行排列的前3個(gè)后驗(yàn)概率值為qj(x)max,qj(x)max-1，qj(x)max-2，若選擇qj(x)max作為合適的后驗(yàn)概率值，否則選擇qj(x)max-1作為合適的后驗(yàn)概率值,其中Qq為設(shè)定的后驗(yàn)概率權(quán)值，取值范圍為[1.4,1.6]。本優(yōu)選實(shí)施例設(shè)置改進(jìn)的局部線性嵌入方法，需要確定的參數(shù)比較少，只有鄰域數(shù)k和輸出維數(shù)d，大大減少了運(yùn)算量，且可以學(xué)習(xí)出任意維數(shù)的低維流形，提高了識別速度；采用自適應(yīng)二維Gabor小波變換方法對表情圖像中的表情特征進(jìn)行提取，具有旋轉(zhuǎn)、平移以及伸縮變換條件下不變的性質(zhì)，而且能得到一個(gè)解析的全局最優(yōu)解；在聲學(xué)特征降維子模塊12對聲學(xué)特征數(shù)據(jù)進(jìn)行降維處理的過程中，計(jì)算各樣本數(shù)據(jù)點(diǎn)Xi的K個(gè)鄰域點(diǎn)的權(quán)重之和，并將其考慮到低維重構(gòu)的損失函數(shù)中，降低了噪聲的影響和數(shù)據(jù)樣本外點(diǎn)對降維的干擾，進(jìn)一步提高了情感識別的精度；設(shè)置預(yù)定的多模態(tài)情感融合策略，并根據(jù)多模態(tài)情感融合策略生成用戶情感識別結(jié)果，使識別結(jié)果更加可靠準(zhǔn)確。本應(yīng)用場景設(shè)定后驗(yàn)概率權(quán)值為Qq＝1.6，識別精度相對提高了8％。最后應(yīng)當(dāng)說明的是，以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案，而非對本發(fā)明保護(hù)范圍的限制，盡管參照較佳實(shí)施例對本發(fā)明作了詳細(xì)地說明，本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解，可以對本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換，而不脫離本發(fā)明技術(shù)方案的實(shí)質(zhì)和范圍。當(dāng)前第1頁1 2 3

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：不公告發(fā)明人;
技術(shù)所有人：楊超坤;
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

多媒體播放器相關(guān)技術(shù)

vlc多媒體播放器相關(guān)技術(shù)

gensee多媒體播放器相關(guān)技術(shù)

多媒體播放器哪個(gè)好相關(guān)技術(shù)

便攜式多媒體播放器相關(guān)技術(shù)

qt多媒體播放器相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種具有情感識別功能的多媒體播放器的制作方法