一種唇語識別方法及系統(tǒng)的制作方法

文檔序號：6626712閱讀：1187來源：國知局

一種唇語識別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種唇語識別方法，包括：定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部；接收用戶面部反射的無線信號，并對所述反射的無線信號進行過濾，獲得用戶嘴部運動時的嘴部反射信號；對所述嘴部反射信號進行分段，獲得分段信號，并提取所述分段信號的波形特征圖；所述分段信號為每發(fā)出一個語音事件的反射信號；比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件。相應的，本發(fā)明實施例還提供一種唇語識別系統(tǒng)。采用本發(fā)明實施例，能夠通過無線信號探測用戶嘴部運動來實現(xiàn)唇語識別，提高識別效率和準確率。
【專利說明】一種唇語識別方法及系統(tǒng)

【技術領域】
[0001] 本發(fā)明涉及移動通信【技術領域】，尤其涉及一種唇語識別方法及系統(tǒng)。

【背景技術】
[0002] 無線探測識別的應用提高到一個新的水平，包括運動檢測、手勢識別、定位、材料分類等。通過檢測和分析信號的反射，無線探測識別系統(tǒng)可以發(fā)現(xiàn)穿墻運動和識別人的手勢，甚至可以檢測和定位人體中的腫瘤。
[0003] 但是，在現(xiàn)有技術中，對用戶說話的識別，只是通過聲學傳感器或攝像裝置來實現(xiàn)。采用這種方法的系統(tǒng)布置代價很高，并且具有限的傳感和通信范圍。此外，采用聲學傳感器或攝像裝置的系統(tǒng)對于檢測會有延遲，因為傳感器必須先錄制聲音，攝像裝置必須先拍攝圖片，再進行處理，然后才會發(fā)送到接收器。同時，采用聲學傳感器的系統(tǒng)不能在太嘈雜的環(huán)境中解碼。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明實施例提出一種唇語識別方法及系統(tǒng)，能夠通過無線信號探測用戶嘴部運動來實現(xiàn)唇語的識別，提高識別效率和準確率。
[0005] 本發(fā)明實施例提供一種唇語識別方法，包括：
[0006] 定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部；
[0007] 接收用戶面部反射的無線信號，并對所述反射的無線信號進行過濾，獲得用戶嘴部運動時的嘴部反射信號；
[0008] 對所述嘴部反射信號進行分段，獲得分段信號，并提取所述分段信號的波形特征圖；所述分段信號為每發(fā)出一個語音事件的反射信號；
[0009] 比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件；所述嘴部運動特征圖為發(fā)出一個語音事件時的無線信號波形特征圖。
[0010] 進一步地，所述定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部，具體包括：
[0011] 勻速旋轉無線信號，記錄所述無線信號變換程度最大的時間點；
[0012] 根據(jù)所述無線信號勻速旋轉的角速度和所述時間點，計算所述無線信號定向發(fā)射的角度；
[0013] 根據(jù)所述角度定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部。
[0014] 進一步地，所述接收用戶面部反射的無線信號，并對所述反射的無線信號進行過濾，獲得用戶嘴部運動時的嘴部反射信號，具體包括：
[0015] 接收用戶面部反射的無線信號，并采用巴特沃斯濾波器，對所述反射的無線信號進行過濾，獲得濾波信號；
[0016] 設置延遲閾值，去除延遲時間大于所述延遲閾值的濾波信號，獲得用戶嘴部運動時的嘴部反射信號。
[0017] 進一步地，所述設置延遲閾值，去除延遲時間大于所述延遲閾值的濾波信號，獲得用戶嘴部運動時的嘴部反射信號，具體包括：
[0018] 對所述濾波信號的信道狀態(tài)信息CSI進行快速傅里葉逆變換，獲得濾波信號的時域 CSI ;
[0019] 設置延遲閾值，去除時域CSI大于所述延遲閾值的濾波信號，獲得具有時域CSI的嘴部反射信號；
[0020] 對所述嘴部反射信號的時域CSI進行快速傅里葉變換，獲得用戶嘴部運動時的嘴部反射信號。
[0021] 進一步地，所述對所述嘴部反射信號進行分段，獲得分段信號，并提取所述分段信號的波形特征圖，具體包括：
[0022] 采用小波變換算法，對所述嘴部反射信號進行分段，獲得分段信號；
[0023] 在所述分段信號的CSI中，選取每個時間段信號強度變化最大的子載波，并將每個時間段選取的子載波拼接起來，獲得所述分段信號的波形特征圖；所述CSI具有30個子載波。
[0024] 進一步地，所述比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件，具體包括：
[0025] 根據(jù)最小二乘法算法，比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件。
[0026] 相應地，本發(fā)明實施例還提供一種唇語識別系統(tǒng)，包括發(fā)射端和接收端；所述接收端包括信號過濾模塊、特征提取模塊和特征對比模塊；
[0027] 所述發(fā)射端用于定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部；
[0028] 所述信號過濾模塊用于接收用戶面部反射的無線信號，并對所述反射的無線信號進行過濾，獲得用戶說話時嘴部的反射信號；
[0029] 所述特征提取模塊用于對所述嘴部反射信號進行分段，獲得分段信號，并提取分段信號的波形特征圖；所述分段信號為每發(fā)出一個語音事件的反射信號；
[0030] 所述特征對比模塊用于比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件；所述嘴部運動特征圖為用戶發(fā)出一個語音事件時的無線信號波形特征圖。
[0031] 實施本發(fā)明實施例，具有如下有益效果：
[0032] 本發(fā)明實施例提供的唇語識別方法及系統(tǒng)能夠通過無線信號探測用戶嘴部運動來提取嘴部反射信號的波形特征圖，并將波形特征圖與預先采樣的嘴部運動特征圖進行對 t匕，從而實現(xiàn)唇語的識別，提高識別效率和準確率；無需部署額外的裝置，成本低廉，而且，在具有噪音的環(huán)境下，仍可準確進行唇語識別；定向發(fā)射無線信號，使無線信號覆蓋用戶面部，以減少不相關的多徑效應，提高探測信號的精度；提取嘴部反射信號的波形特征圖，選取每段時間內(nèi)信號強度變化最大的子載波作為特征圖，降低計算復雜度，提高識別效率；由于相同用戶具有相同語速，從而對每個用戶均建立嘴部運動特征圖檔案，在對用戶的唇語進行識別時，直接與其嘴部運動特征圖檔案進行對比，提高唇語識別的準確率；采用上下文相關的糾錯技術，對已識別的唇語進行驗證，進一步提高唇語識別的準確率。

【專利附圖】

【附圖說明】
[0033] 圖1是本發(fā)明提供的唇語識別方法的一個實施例的流程示意圖；
[0034] 圖2是本發(fā)明提供的唇語識別方法中步驟S1的一個實施例的流程示意圖；
[0035] 圖3是本發(fā)明提供的唇語識別方法中步驟S2的一個實施例的流程示意圖；
[0036] 圖4是圖2所示實施例中的步驟S22的一個實施例的流程示意圖；
[0037] 圖5是本發(fā)明提供的唇語識別方法中步驟S3的一個實施例的流程示意圖；
[0038] 圖6是本發(fā)明提供的唇語識別系統(tǒng)的一個實施例的結構示意圖。

【具體實施方式】
[0039] 下面將結合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發(fā)明一部分實施例，而不是全部的實施例?；?本發(fā)明中的實施例，本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護的范圍。
[0040] 參見圖1，是本發(fā)明提供的唇語識別方法的一個實施例的流程示意圖，包括：
[0041] S1、定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部；
[0042] S2、接收用戶面部反射的無線信號，并對所述反射的無線信號進行過濾，獲得用戶嘴部運動時的嘴部反射信號；
[0043] S3、對所述嘴部反射信號進行分段，獲得分段信號，并提取所述分段信號的波形特征圖；所述分段信號為每發(fā)出一個語音事件的反射信號；
[0044] S4、比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件；所述嘴部運動特征圖為發(fā)出一個語音事件時的無線信號波形特征圖。
[0045] 在一個優(yōu)選地實施方式中，如圖2所示，所述步驟S1具體包括：
[0046] S11、勻速旋轉無線信號，記錄所述無線信號變換程度最大的時間點；
[0047] S12、根據(jù)所述無線信號勻速旋轉的角速度和所述時間點，計算所述無線信號定向發(fā)射的角度；
[0048] S13、根據(jù)所述角度定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部。
[0049] 在另一個優(yōu)選地實施方式中，所述步驟S1具體包括：
[0050] S111、發(fā)射端保持無線信號發(fā)射的垂直方向仰角不變，在水平方向勻速360度旋轉無線信號；
[0051] S112、接收端記錄無線信號在水平方向變換程度最大的第一時間點，并將第一時間點反饋給發(fā)射端；
[0052] S113、發(fā)射端根據(jù)水平方向勻速旋轉的角速度和第一時間點，調(diào)整無線信號的水平方向角度；
[0053] S114、發(fā)射端固定水平方向角速度，在垂直方向勻速360度旋轉無線信號；
[0054] S115、接收端記錄無線信號在垂直方向變換程度最大的第二時間點，并將第二時間點反饋給發(fā)射端；
[0055] S116、發(fā)射端根據(jù)無線信號垂直方向勻速旋轉的角速度和第二時間點，調(diào)整無線信號的垂直方向角度；
[0056] S117、根據(jù)水平方向角度和垂直方向角度，定向發(fā)射無線信號，使無線信號覆蓋用戶面部。
[0057] 在又一個實施方式中，定向發(fā)射無線信號的角度通過用戶在固定位置重復預定義已知的語音事件來實現(xiàn)。例如，用戶每秒發(fā)出一個"啊"的音，發(fā)射端勻速旋轉無線信號，接收端檢測接收到的波形，并將接收到的波形與預先采樣的"啊"音所對應的波形特征圖進行對比，找到與"啊"音對應的波形特征圖相似度最高、波形最匹配的時間點。根據(jù)時間點和無線信號旋轉角速度，計算出無線信號定向發(fā)射角度。
[0058] 需要說明的是，發(fā)射端用無線信號對周圍環(huán)境進行360度掃描，其掃描過程是通過將發(fā)射端安裝在步進電機上旋轉來實現(xiàn)的。接收端通過感知信號變換程度，記錄信號變換程度最大的時間點。其中，發(fā)射端可從同一位置開始多次重復掃描過程，接收端記錄多次的時間點，然后通過分析和排除偶然誤差，將正確的時間點反饋給發(fā)射端。發(fā)射端根據(jù)反饋的時間點調(diào)整定向發(fā)射無線信號的角度。接收端還可以在后續(xù)信號分析匹配過程中，進一步向發(fā)射端反饋更精準的時間點信息，以改進無線信號的發(fā)射方向。
[0059] 采用定向發(fā)射無線信號的方式，使無線信號覆蓋用戶面部，以減少不相關的多徑效應，提高探測信號的精度。
[0060] 進一步地，如圖3所示，所述步驟S2具體包括：
[0061] S21、接收用戶面部反射的無線信號，并采用巴特沃斯濾波器，對所述反射的無線信號進行過濾，獲得濾波信號。
[0062] 采用3階巴特沃斯帶通濾波器，并設置巴特沃斯帶通濾波器具有通帶內(nèi)最大平坦的頻率響應，以確保在目標頻率范圍內(nèi)的信號的保真度，同時消除帶外噪聲。通過巴特沃斯帶通濾波器，保留嘴部運動對信號的干擾信息，濾除其他頻段的信息。
[0063] S22、設置延遲閾值，去除延遲時間大于所述延遲閾值的濾波信號，獲得用戶嘴部運動時的嘴部反射信號。
[0064] 無線信號從發(fā)射端發(fā)出，會沿著不同路徑反射，即多徑反射，最終到達接收端。而由于嘴部運動，如舌頭、嘴唇和下顎的運動，是非剛性的，一組多徑反射可能反映嘴部不同部分的運動信息。因此，設置延遲閾值，去除延遲時間超過延遲閾值的多徑分量（通常來自周圍靜態(tài)環(huán)境的反射）。其中，延遲閾值是根據(jù)經(jīng)驗選擇并基于嘴部運動特征圖的分類過程來進行調(diào)整的。由于典型的室內(nèi)信道的最大額外時延通常小于500納秒，因此，通常設置延遲閾值為500納秒。
[0065] 進一步地，如圖4所示，所述步驟S22具體包括：
[0066] S221、對所述濾波信號的信道狀態(tài)信息CSI進行快速傅里葉逆變換，獲得濾波信號的時域CSI ;
[0067] S222、設置延遲閾值，去除時域CSI大于所述延遲閾值的濾波信號，獲得具有時域 CSI的嘴部反射信號；
[0068] S223、對所述嘴部反射信號的時域CSI進行快速傅里葉變換，獲得用戶嘴部運動時的嘴部反射信號。
[0069] CSI (Channel State Information,信道狀態(tài)信息）表示各個子載波的細粒度的信道頻率響應。根據(jù)CSI在時域中的功率延遲分布來對濾波信號進行進一步的過濾。先對濾波信號的頻域CSI進行快速傅里葉逆變換，將頻域CSI轉換為CSI在時域中的功率延遲分布。然后，設置延遲閾值，去除延遲時間大于延遲閾值的多徑分量。最后，通過快速傅里葉變換，將保留的多徑分量的時域CSI轉換回頻域CSI，從而獲得嘴部反射信號。
[0070] 進一步地，如圖5所示，所述步驟S3具體包括：
[0071] S31、采用小波變換算法，對所述嘴部反射信號進行分段，獲得分段信號；
[0072] S32、在所述分段信號的CSI中，選取每個時間段信號強度變化最大的子載波，并將每個時間段選取的子載波拼接起來，獲得所述分段信號的波形特征圖；所述CSI具有30 個子載波。
[0073] 在每個時間段內(nèi)，分段信號CSI均具有30個子載波，即分段信號CSI在每個時間段均具有30組數(shù)據(jù)，每組數(shù)據(jù)表示一個子載波的信號幅度和相位信息。選取30個子載波中信號強度（波形峰峰值）變化最大的子載波，并舍棄該時間段內(nèi)其余29個子載波。將變化最大的子載波作為該時間段的單一代表值，并將每個時間段選取的單一代表值拼接起來，形成分段信號整個時間內(nèi)的信號變換值，該信號變換值即為分段信號的波形特征圖。在每段時間內(nèi)，選取信號強度變化最大的子載波來進行后續(xù)處理，簡化了計算，并提高了效率。
[0074] 進一步地，所述步驟S4具體包括：
[0075] 根據(jù)最小二乘法算法，比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件。
[0076] 需要說明的是，對于同一個用戶，其語速有相似的節(jié)奏模式。預先采樣該用戶的嘴部運動特征圖，從而根據(jù)廣義最小二乘法算法，直接比較分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，獲得相似度最高的嘴部運動特征圖。讀取相似度最高的嘴部運動特征圖對應的語音事件，即可完成該用戶唇語的識別。
[0077] 進一步地，在所述步驟S2之前，還包括：
[0078] 采樣用戶發(fā)出已知的語音事件時無線信號的波形特征圖，獲得所述已知語音事件對應的嘴部運動特征圖；
[0079] 將所述嘴部運動特征圖進行歸類，使具有相同讀音的已知語音事件所對應的嘴部運動特征圖為一類。
[0080] 在對用戶進行唇語識別之前，需先對用戶的嘴部運動特征圖進行采樣，對不同用戶建立不同的嘴部運動特征檔案。嘴部運動特征圖的采樣方法與上述分段信號的波形特征圖的獲得方法相同，這里不再詳細描述。
[0081] 對于發(fā)音不同的語音事件，嘴部運動不同，對無線信號波形的影響也不同。但對于發(fā)音相同的語音事件，嘴部運動基本相同，對無線信號波形的影響也相同，因此，將對無線信號波形的影響相同的嘴部運動特征圖歸為一類。
[0082] 由于用戶發(fā)出的每個語音事件之間是相關的，在完成對唇語的識別后，通過使用上下文的糾錯技術，對識別的唇語進行驗證，減少同類別嘴部運動特征圖的識別錯誤，進一步提高唇語識別的準確率。
[0083] 優(yōu)選地，所述語音事件為音節(jié)或單詞。
[0084] 在預先采樣用戶的嘴部運動特征圖時，可對用戶發(fā)出一個音節(jié)的嘴部運動特征圖進行采樣，也可對用戶發(fā)出一個單詞的嘴部運動特征圖進行采樣。相應的，在對嘴部反射信號進行分段時，可采用詞內(nèi)分段或詞間分段的方法。若采用詞內(nèi)分段的方法，則將一個單詞分為多個音節(jié)，通過音節(jié)的組合來識別該單詞。若采用詞間分段的方法，由于通常人在連續(xù) 發(fā)出兩個單詞之間有較短的間隔時間（如300毫秒），通過檢測無聲的間隔區(qū)間將單詞區(qū)分開來。
[0085] 參見圖6,是本發(fā)明提供的一種唇語識別系統(tǒng)的一個實施例的結構示意圖，包括發(fā) 射端101和接收端102 ;所述接收端102包括信號過濾模塊103、特征提取模塊104和特征對比模塊105 ;
[0086] 所述發(fā)射端101用于定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部；
[0087] 所述信號過濾模塊103用于接收用戶面部反射的無線信號，并對所述反射的無線信號進行過濾，獲得用戶說話時嘴部的反射信號；
[0088] 所述特征提取模塊104用于對所述嘴部反射信號進行分段，獲得分段信號，并提取分段信號的波形特征圖；所述分段信號為每發(fā)出一個語音事件的反射信號；
[0089] 所述特征對比模塊105用于比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件；所述嘴部運動特征圖為用戶發(fā)出一個語音事件時的無線信號波形特征圖。
[0090] 其中，發(fā)射端101采用定向天線或具有束波功能，從而保證無線信號的定向發(fā)射。在接收反射的無線信號時，可使用多個接收端102,部署在不同的角度，從而提高識別的精度。
[0091] 優(yōu)選地，所述語音事件為音節(jié)或單詞。
[0092] 需要說明的是，本發(fā)明實施例僅以一個用戶的唇語識別為例進行描述，但在具體實施當中，還可對多個用戶同時進行唇語識別。
[0093] 在識別前，先對多個用戶分別進行采樣，建立用戶對應的嘴部運動特征圖檔案。識別過程中，發(fā)射端發(fā)射不同的無線信號，使每個無線信號定位不同的用戶。接收端采用 MMO(Multiple-Input Multiple-Output，多輸入多輸出）技術，同時解碼多個用戶的嘴部運動。在對多個用戶進行唇語識別時，采用之字形消除（Zigzag cancelation)來實現(xiàn)同時識別技術。例如，同時對兩個用戶唇語進行識別時，先識別第一用戶的第一語音事件，當?shù)?一用戶的第二語音事件與第二用戶的第一語音事件同時發(fā)生時，消除第一用戶的第二語音事件，而根據(jù)第一用戶的第一語音事件來預測其第二語音事件，同時，識別出第二用戶的第一語音事件。重復這一過程，從而實現(xiàn)對多個用戶的唇語識別，無需部署額外的設備。
[0094] 本發(fā)明實施例提供的唇語識別方法及系統(tǒng)能夠通過無線信號探測用戶嘴部運動來提取嘴部反射信號的波形特征圖，并將波形特征圖與預先采樣的嘴部運動特征圖進行對 t匕，從而實現(xiàn)唇語的識別，提高識別效率和準確率；無需部署額外的裝置，成本低廉，而且，在具有噪音的環(huán)境下，仍可準確進行唇語識別；定向發(fā)射無線信號，使無線信號覆蓋用戶面部，以減少不相關的多徑效應，提高探測信號的精度；提取嘴部反射信號的波形特征圖，選取每段時間內(nèi)信號強度變化最大的子載波作為特征圖，降低計算復雜度，提高識別效率；由于相同用戶具有相同語速，從而對每個用戶均建立嘴部運動特征圖檔案，在對用戶的唇語進行識別時，直接與其嘴部運動特征圖檔案進行對比，提高唇語識別的準確率；采用上下文相關的糾錯技術，對已識別的唇語進行驗證，進一步提高唇語識別的準確率。
[0095] 以上所述是本發(fā)明的優(yōu)選實施方式，應當指出，對于本【技術領域】的普通技術人員來說，在不脫離本發(fā)明原理的前提下，還可以做出若干改進和潤飾，這些改進和潤飾也視為本發(fā)明的保護范圍。
【權利要求】
1. 一種唇語識別方法，其特征在于，包括：定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部；接收用戶面部反射的無線信號，并對所述反射的無線信號進行過濾，獲得用戶嘴部運動時的嘴部反射信號；對所述嘴部反射信號進行分段，獲得分段信號，并提取所述分段信號的波形特征圖；所述分段信號為每發(fā)出一個語音事件的反射信號；比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件；所述嘴部運動特征圖為發(fā)出一個語音事件時的無線信號波形特征圖。
2. 如權利要求1所述的唇語識別方法，其特征在于，所述定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部，具體包括：勻速旋轉無線信號，記錄所述無線信號變換程度最大的時間點；根據(jù)所述無線信號旋轉的角速度和所述時間點，計算所述無線信號定向發(fā)射的角度；根據(jù)所述角度定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部。
3. 如權利要求1所述的唇語識別方法，其特征在于，所述接收用戶面部反射的無線信號，并對所述反射的無線信號進行過濾，獲得用戶嘴部運動時的嘴部反射信號，具體包括：接收用戶面部反射的無線信號，并采用巴特沃斯濾波器，對所述反射的無線信號進行過濾，獲得濾波信號；設置延遲閾值，去除延遲時間大于所述延遲閾值的濾波信號，獲得用戶嘴部運動時的嘴部反射信號。
4. 如權利要求3所述的唇語識別方法，其特征在于，所述設置延遲閾值，去除延遲時間大于所述延遲閾值的濾波信號，獲得用戶嘴部運動時的嘴部反射信號，具體包括：對所述濾波信號的信道狀態(tài)信息CSI進行快速傅里葉逆變換，獲得濾波信號的時域 CSI ；設置延遲閾值，去除時域CSI大于所述延遲閾值的濾波信號，獲得具有時域CSI的嘴部反射信號；對所述嘴部反射信號的時域CSI進行快速傅里葉變換，獲得用戶嘴部運動時的嘴部反射信號。
5. 如權利要求1所述的唇語識別方法，其特征在于，所述對所述嘴部反射信號進行分段，獲得分段信號，并提取所述分段信號的波形特征圖，具體包括：采用小波變換算法，對所述嘴部反射信號進行分段，獲得分段信號；在所述分段信號的CSI中，選取每個時間段信號強度變化最大的子載波，并將每個時間段選取的子載波拼接起來，獲得所述分段信號的波形特征圖；所述CSI具有30個子載波。
6. 如權利要求1所述的唇語識別方法，其特征在于，所述比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件，具體包括：根據(jù)最小二乘法算法，比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件。
7. 如權利要求1所述的唇語識別方法，其特征在于，在所述接收用戶面部反射的無線信號，并對所述反射的無線信號進行過濾，獲得用戶嘴部運動時的嘴部反射信號之前，還包括：采樣用戶發(fā)出已知的語音事件時無線信號的波形特征圖，獲得所述已知語音事件對應的嘴部運動特征圖；將所述嘴部運動特征圖進行歸類，使具有相同發(fā)音的已知語音事件所對應的嘴部運動特征圖為一類。
8. 如權利要求1至7任一項所述的唇語識別方法，其特征在于，所述語音事件為音節(jié)或單詞。
9. 一種唇語識別系統(tǒng)，其特征在于，包括發(fā)射端和接收端；所述接收端包括信號過濾模塊、特征提取模塊和特征對比模塊；所述發(fā)射端用于定向發(fā)射無線信號，使所述無線信號覆蓋用戶面部；所述信號過濾模塊用于接收用戶面部反射的無線信號，并對所述反射的無線信號進行過濾，獲得用戶說話時嘴部的反射信號；所述特征提取模塊用于對所述嘴部反射信號進行分段，獲得分段信號，并提取分段信號的波形特征圖；所述分段信號為每發(fā)出一個語音事件的反射信號；所述特征對比模塊用于比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度，讀取相似度最高的嘴部運動特征圖所對應的語音事件；所述嘴部運動特征圖為用戶發(fā)出一個語音事件時的無線信號波形特征圖。
10. 如權利要求9所述的唇語識別系統(tǒng)，其特征在于，所述語音事件為音節(jié)或單詞。
【文檔編號】G06K9/62GK104217218SQ201410462392
【公開日】2014年12月17日申請日期:2014年9月11日優(yōu)先權日:2014年9月11日
【發(fā)明者】王冠華, 伍楷舜, 倪明選申請人:廣州市香港科大霍英東研究院

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：王冠華;伍楷舜;倪明選
技術所有人：廣州市香港科大霍英東研究院
我是此專利的發(fā)明人

上一篇：區(qū)域gps基準站坐標時間序列的噪聲模型獲得方法
上一篇：智能移動終端惡意軟件的檢測方法與裝置制造方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種唇語識別方法及系統(tǒng)的制作方法