一種唇語識別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種唇語識別方法,包括:定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部;接收用戶面部反射的無線信號,并對所述反射的無線信號進行過濾,獲得用戶嘴部運動時的嘴部反射信號;對所述嘴部反射信號進行分段,獲得分段信號,并提取所述分段信號的波形特征圖;所述分段信號為每發(fā)出一個語音事件的反射信號;比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度,讀取相似度最高的嘴部運動特征圖所對應的語音事件。相應的,本發(fā)明實施例還提供一種唇語識別系統(tǒng)。采用本發(fā)明實施例,能夠通過無線信號探測用戶嘴部運動來實現(xiàn)唇語識別,提高識別效率和準確率。
【專利說明】一種唇語識別方法及系統(tǒng)
【技術領域】
[0001] 本發(fā)明涉及移動通信【技術領域】,尤其涉及一種唇語識別方法及系統(tǒng)。
【背景技術】
[0002] 無線探測識別的應用提高到一個新的水平,包括運動檢測、手勢識別、定位、材料 分類等。通過檢測和分析信號的反射,無線探測識別系統(tǒng)可以發(fā)現(xiàn)穿墻運動和識別人的手 勢,甚至可以檢測和定位人體中的腫瘤。
[0003] 但是,在現(xiàn)有技術中,對用戶說話的識別,只是通過聲學傳感器或攝像裝置來實 現(xiàn)。采用這種方法的系統(tǒng)布置代價很高,并且具有限的傳感和通信范圍。此外,采用聲學傳 感器或攝像裝置的系統(tǒng)對于檢測會有延遲,因為傳感器必須先錄制聲音,攝像裝置必須先 拍攝圖片,再進行處理,然后才會發(fā)送到接收器。同時,采用聲學傳感器的系統(tǒng)不能在太嘈 雜的環(huán)境中解碼。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實施例提出一種唇語識別方法及系統(tǒng),能夠通過無線信號探測用戶嘴部運 動來實現(xiàn)唇語的識別,提高識別效率和準確率。
[0005] 本發(fā)明實施例提供一種唇語識別方法,包括:
[0006] 定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部;
[0007] 接收用戶面部反射的無線信號,并對所述反射的無線信號進行過濾,獲得用戶嘴 部運動時的嘴部反射信號;
[0008] 對所述嘴部反射信號進行分段,獲得分段信號,并提取所述分段信號的波形特征 圖;所述分段信號為每發(fā)出一個語音事件的反射信號;
[0009] 比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度,讀 取相似度最高的嘴部運動特征圖所對應的語音事件;所述嘴部運動特征圖為發(fā)出一個語音 事件時的無線信號波形特征圖。
[0010] 進一步地,所述定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部,具體包括:
[0011] 勻速旋轉無線信號,記錄所述無線信號變換程度最大的時間點;
[0012] 根據(jù)所述無線信號勻速旋轉的角速度和所述時間點,計算所述無線信號定向發(fā)射 的角度;
[0013] 根據(jù)所述角度定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部。
[0014] 進一步地,所述接收用戶面部反射的無線信號,并對所述反射的無線信號進行過 濾,獲得用戶嘴部運動時的嘴部反射信號,具體包括:
[0015] 接收用戶面部反射的無線信號,并采用巴特沃斯濾波器,對所述反射的無線信號 進行過濾,獲得濾波信號;
[0016] 設置延遲閾值,去除延遲時間大于所述延遲閾值的濾波信號,獲得用戶嘴部運動 時的嘴部反射信號。
[0017] 進一步地,所述設置延遲閾值,去除延遲時間大于所述延遲閾值的濾波信號,獲得 用戶嘴部運動時的嘴部反射信號,具體包括:
[0018] 對所述濾波信號的信道狀態(tài)信息CSI進行快速傅里葉逆變換,獲得濾波信號的時 域 CSI ;
[0019] 設置延遲閾值,去除時域CSI大于所述延遲閾值的濾波信號,獲得具有時域CSI的 嘴部反射信號;
[0020] 對所述嘴部反射信號的時域CSI進行快速傅里葉變換,獲得用戶嘴部運動時的嘴 部反射信號。
[0021] 進一步地,所述對所述嘴部反射信號進行分段,獲得分段信號,并提取所述分段信 號的波形特征圖,具體包括:
[0022] 采用小波變換算法,對所述嘴部反射信號進行分段,獲得分段信號;
[0023] 在所述分段信號的CSI中,選取每個時間段信號強度變化最大的子載波,并將每 個時間段選取的子載波拼接起來,獲得所述分段信號的波形特征圖;所述CSI具有30個子 載波。
[0024] 進一步地,所述比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征 圖的相似度,讀取相似度最高的嘴部運動特征圖所對應的語音事件,具體包括:
[0025] 根據(jù)最小二乘法算法,比較所述分段信號的波形特征圖與預先采樣的所有嘴部運 動特征圖的相似度,讀取相似度最高的嘴部運動特征圖所對應的語音事件。
[0026] 相應地,本發(fā)明實施例還提供一種唇語識別系統(tǒng),包括發(fā)射端和接收端;所述接收 端包括信號過濾模塊、特征提取模塊和特征對比模塊;
[0027] 所述發(fā)射端用于定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部;
[0028] 所述信號過濾模塊用于接收用戶面部反射的無線信號,并對所述反射的無線信號 進行過濾,獲得用戶說話時嘴部的反射信號;
[0029] 所述特征提取模塊用于對所述嘴部反射信號進行分段,獲得分段信號,并提取分 段信號的波形特征圖;所述分段信號為每發(fā)出一個語音事件的反射信號;
[0030] 所述特征對比模塊用于比較所述分段信號的波形特征圖與預先采樣的所有嘴部 運動特征圖的相似度,讀取相似度最高的嘴部運動特征圖所對應的語音事件;所述嘴部運 動特征圖為用戶發(fā)出一個語音事件時的無線信號波形特征圖。
[0031] 實施本發(fā)明實施例,具有如下有益效果:
[0032] 本發(fā)明實施例提供的唇語識別方法及系統(tǒng)能夠通過無線信號探測用戶嘴部運動 來提取嘴部反射信號的波形特征圖,并將波形特征圖與預先采樣的嘴部運動特征圖進行對 t匕,從而實現(xiàn)唇語的識別,提高識別效率和準確率;無需部署額外的裝置,成本低廉,而且, 在具有噪音的環(huán)境下,仍可準確進行唇語識別;定向發(fā)射無線信號,使無線信號覆蓋用戶面 部,以減少不相關的多徑效應,提高探測信號的精度;提取嘴部反射信號的波形特征圖,選 取每段時間內(nèi)信號強度變化最大的子載波作為特征圖,降低計算復雜度,提高識別效率;由 于相同用戶具有相同語速,從而對每個用戶均建立嘴部運動特征圖檔案,在對用戶的唇語 進行識別時,直接與其嘴部運動特征圖檔案進行對比,提高唇語識別的準確率;采用上下文 相關的糾錯技術,對已識別的唇語進行驗證,進一步提高唇語識別的準確率。
【專利附圖】
【附圖說明】
[0033] 圖1是本發(fā)明提供的唇語識別方法的一個實施例的流程示意圖;
[0034] 圖2是本發(fā)明提供的唇語識別方法中步驟S1的一個實施例的流程示意圖;
[0035] 圖3是本發(fā)明提供的唇語識別方法中步驟S2的一個實施例的流程示意圖;
[0036] 圖4是圖2所示實施例中的步驟S22的一個實施例的流程示意圖;
[0037] 圖5是本發(fā)明提供的唇語識別方法中步驟S3的一個實施例的流程示意圖;
[0038] 圖6是本發(fā)明提供的唇語識別系統(tǒng)的一個實施例的結構示意圖。
【具體實施方式】
[0039] 下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0040] 參見圖1,是本發(fā)明提供的唇語識別方法的一個實施例的流程示意圖,包括:
[0041] S1、定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部;
[0042] S2、接收用戶面部反射的無線信號,并對所述反射的無線信號進行過濾,獲得用戶 嘴部運動時的嘴部反射信號;
[0043] S3、對所述嘴部反射信號進行分段,獲得分段信號,并提取所述分段信號的波形特 征圖;所述分段信號為每發(fā)出一個語音事件的反射信號;
[0044] S4、比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似 度,讀取相似度最高的嘴部運動特征圖所對應的語音事件;所述嘴部運動特征圖為發(fā)出一 個語音事件時的無線信號波形特征圖。
[0045] 在一個優(yōu)選地實施方式中,如圖2所示,所述步驟S1具體包括:
[0046] S11、勻速旋轉無線信號,記錄所述無線信號變換程度最大的時間點;
[0047] S12、根據(jù)所述無線信號勻速旋轉的角速度和所述時間點,計算所述無線信號定向 發(fā)射的角度;
[0048] S13、根據(jù)所述角度定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部。
[0049] 在另一個優(yōu)選地實施方式中,所述步驟S1具體包括:
[0050] S111、發(fā)射端保持無線信號發(fā)射的垂直方向仰角不變,在水平方向勻速360度旋 轉無線信號;
[0051] S112、接收端記錄無線信號在水平方向變換程度最大的第一時間點,并將第一時 間點反饋給發(fā)射端;
[0052] S113、發(fā)射端根據(jù)水平方向勻速旋轉的角速度和第一時間點,調(diào)整無線信號的水 平方向角度;
[0053] S114、發(fā)射端固定水平方向角速度,在垂直方向勻速360度旋轉無線信號;
[0054] S115、接收端記錄無線信號在垂直方向變換程度最大的第二時間點,并將第二時 間點反饋給發(fā)射端;
[0055] S116、發(fā)射端根據(jù)無線信號垂直方向勻速旋轉的角速度和第二時間點,調(diào)整無線 信號的垂直方向角度;
[0056] S117、根據(jù)水平方向角度和垂直方向角度,定向發(fā)射無線信號,使無線信號覆蓋用 戶面部。
[0057] 在又一個實施方式中,定向發(fā)射無線信號的角度通過用戶在固定位置重復預定義 已知的語音事件來實現(xiàn)。例如,用戶每秒發(fā)出一個"啊"的音,發(fā)射端勻速旋轉無線信號,接 收端檢測接收到的波形,并將接收到的波形與預先采樣的"啊"音所對應的波形特征圖進行 對比,找到與"啊"音對應的波形特征圖相似度最高、波形最匹配的時間點。根據(jù)時間點和 無線信號旋轉角速度,計算出無線信號定向發(fā)射角度。
[0058] 需要說明的是,發(fā)射端用無線信號對周圍環(huán)境進行360度掃描,其掃描過程是通 過將發(fā)射端安裝在步進電機上旋轉來實現(xiàn)的。接收端通過感知信號變換程度,記錄信號變 換程度最大的時間點。其中,發(fā)射端可從同一位置開始多次重復掃描過程,接收端記錄多次 的時間點,然后通過分析和排除偶然誤差,將正確的時間點反饋給發(fā)射端。發(fā)射端根據(jù)反饋 的時間點調(diào)整定向發(fā)射無線信號的角度。接收端還可以在后續(xù)信號分析匹配過程中,進一 步向發(fā)射端反饋更精準的時間點信息,以改進無線信號的發(fā)射方向。
[0059] 采用定向發(fā)射無線信號的方式,使無線信號覆蓋用戶面部,以減少不相關的多徑 效應,提高探測信號的精度。
[0060] 進一步地,如圖3所示,所述步驟S2具體包括:
[0061] S21、接收用戶面部反射的無線信號,并采用巴特沃斯濾波器,對所述反射的無線 信號進行過濾,獲得濾波信號。
[0062] 采用3階巴特沃斯帶通濾波器,并設置巴特沃斯帶通濾波器具有通帶內(nèi)最大平坦 的頻率響應,以確保在目標頻率范圍內(nèi)的信號的保真度,同時消除帶外噪聲。通過巴特沃斯 帶通濾波器,保留嘴部運動對信號的干擾信息,濾除其他頻段的信息。
[0063] S22、設置延遲閾值,去除延遲時間大于所述延遲閾值的濾波信號,獲得用戶嘴部 運動時的嘴部反射信號。
[0064] 無線信號從發(fā)射端發(fā)出,會沿著不同路徑反射,即多徑反射,最終到達接收端。而 由于嘴部運動,如舌頭、嘴唇和下顎的運動,是非剛性的,一組多徑反射可能反映嘴部不同 部分的運動信息。因此,設置延遲閾值,去除延遲時間超過延遲閾值的多徑分量(通常來自 周圍靜態(tài)環(huán)境的反射)。其中,延遲閾值是根據(jù)經(jīng)驗選擇并基于嘴部運動特征圖的分類過程 來進行調(diào)整的。由于典型的室內(nèi)信道的最大額外時延通常小于500納秒,因此,通常設置延 遲閾值為500納秒。
[0065] 進一步地,如圖4所示,所述步驟S22具體包括:
[0066] S221、對所述濾波信號的信道狀態(tài)信息CSI進行快速傅里葉逆變換,獲得濾波信 號的時域CSI ;
[0067] S222、設置延遲閾值,去除時域CSI大于所述延遲閾值的濾波信號,獲得具有時域 CSI的嘴部反射信號;
[0068] S223、對所述嘴部反射信號的時域CSI進行快速傅里葉變換,獲得用戶嘴部運動 時的嘴部反射信號。
[0069] CSI (Channel State Information,信道狀態(tài)信息)表示各個子載波的細粒度的信 道頻率響應。根據(jù)CSI在時域中的功率延遲分布來對濾波信號進行進一步的過濾。先對濾 波信號的頻域CSI進行快速傅里葉逆變換,將頻域CSI轉換為CSI在時域中的功率延遲分 布。然后,設置延遲閾值,去除延遲時間大于延遲閾值的多徑分量。最后,通過快速傅里葉 變換,將保留的多徑分量的時域CSI轉換回頻域CSI,從而獲得嘴部反射信號。
[0070] 進一步地,如圖5所示,所述步驟S3具體包括:
[0071] S31、采用小波變換算法,對所述嘴部反射信號進行分段,獲得分段信號;
[0072] S32、在所述分段信號的CSI中,選取每個時間段信號強度變化最大的子載波,并 將每個時間段選取的子載波拼接起來,獲得所述分段信號的波形特征圖;所述CSI具有30 個子載波。
[0073] 在每個時間段內(nèi),分段信號CSI均具有30個子載波,即分段信號CSI在每個時間 段均具有30組數(shù)據(jù),每組數(shù)據(jù)表示一個子載波的信號幅度和相位信息。選取30個子載波中 信號強度(波形峰峰值)變化最大的子載波,并舍棄該時間段內(nèi)其余29個子載波。將變化 最大的子載波作為該時間段的單一代表值,并將每個時間段選取的單一代表值拼接起來, 形成分段信號整個時間內(nèi)的信號變換值,該信號變換值即為分段信號的波形特征圖。在每 段時間內(nèi),選取信號強度變化最大的子載波來進行后續(xù)處理,簡化了計算,并提高了效率。
[0074] 進一步地,所述步驟S4具體包括:
[0075] 根據(jù)最小二乘法算法,比較所述分段信號的波形特征圖與預先采樣的所有嘴部運 動特征圖的相似度,讀取相似度最高的嘴部運動特征圖所對應的語音事件。
[0076] 需要說明的是,對于同一個用戶,其語速有相似的節(jié)奏模式。預先采樣該用戶的嘴 部運動特征圖,從而根據(jù)廣義最小二乘法算法,直接比較分段信號的波形特征圖與預先采 樣的所有嘴部運動特征圖的相似度,獲得相似度最高的嘴部運動特征圖。讀取相似度最高 的嘴部運動特征圖對應的語音事件,即可完成該用戶唇語的識別。
[0077] 進一步地,在所述步驟S2之前,還包括:
[0078] 采樣用戶發(fā)出已知的語音事件時無線信號的波形特征圖,獲得所述已知語音事件 對應的嘴部運動特征圖;
[0079] 將所述嘴部運動特征圖進行歸類,使具有相同讀音的已知語音事件所對應的嘴部 運動特征圖為一類。
[0080] 在對用戶進行唇語識別之前,需先對用戶的嘴部運動特征圖進行采樣,對不同用 戶建立不同的嘴部運動特征檔案。嘴部運動特征圖的采樣方法與上述分段信號的波形特征 圖的獲得方法相同,這里不再詳細描述。
[0081] 對于發(fā)音不同的語音事件,嘴部運動不同,對無線信號波形的影響也不同。但對于 發(fā)音相同的語音事件,嘴部運動基本相同,對無線信號波形的影響也相同,因此,將對無線 信號波形的影響相同的嘴部運動特征圖歸為一類。
[0082] 由于用戶發(fā)出的每個語音事件之間是相關的,在完成對唇語的識別后,通過使用 上下文的糾錯技術,對識別的唇語進行驗證,減少同類別嘴部運動特征圖的識別錯誤,進一 步提高唇語識別的準確率。
[0083] 優(yōu)選地,所述語音事件為音節(jié)或單詞。
[0084] 在預先采樣用戶的嘴部運動特征圖時,可對用戶發(fā)出一個音節(jié)的嘴部運動特征圖 進行采樣,也可對用戶發(fā)出一個單詞的嘴部運動特征圖進行采樣。相應的,在對嘴部反射信 號進行分段時,可采用詞內(nèi)分段或詞間分段的方法。若采用詞內(nèi)分段的方法,則將一個單詞 分為多個音節(jié),通過音節(jié)的組合來識別該單詞。若采用詞間分段的方法,由于通常人在連續(xù) 發(fā)出兩個單詞之間有較短的間隔時間(如300毫秒),通過檢測無聲的間隔區(qū)間將單詞區(qū)分 開來。
[0085] 參見圖6,是本發(fā)明提供的一種唇語識別系統(tǒng)的一個實施例的結構示意圖,包括發(fā) 射端101和接收端102 ;所述接收端102包括信號過濾模塊103、特征提取模塊104和特征 對比模塊105 ;
[0086] 所述發(fā)射端101用于定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部;
[0087] 所述信號過濾模塊103用于接收用戶面部反射的無線信號,并對所述反射的無線 信號進行過濾,獲得用戶說話時嘴部的反射信號;
[0088] 所述特征提取模塊104用于對所述嘴部反射信號進行分段,獲得分段信號,并提 取分段信號的波形特征圖;所述分段信號為每發(fā)出一個語音事件的反射信號;
[0089] 所述特征對比模塊105用于比較所述分段信號的波形特征圖與預先采樣的所有 嘴部運動特征圖的相似度,讀取相似度最高的嘴部運動特征圖所對應的語音事件;所述嘴 部運動特征圖為用戶發(fā)出一個語音事件時的無線信號波形特征圖。
[0090] 其中,發(fā)射端101采用定向天線或具有束波功能,從而保證無線信號的定向發(fā)射。 在接收反射的無線信號時,可使用多個接收端102,部署在不同的角度,從而提高識別的精 度。
[0091] 優(yōu)選地,所述語音事件為音節(jié)或單詞。
[0092] 需要說明的是,本發(fā)明實施例僅以一個用戶的唇語識別為例進行描述,但在具體 實施當中,還可對多個用戶同時進行唇語識別。
[0093] 在識別前,先對多個用戶分別進行采樣,建立用戶對應的嘴部運動特征圖檔案。 識別過程中,發(fā)射端發(fā)射不同的無線信號,使每個無線信號定位不同的用戶。接收端采用 MMO(Multiple-Input Multiple-Output,多輸入多輸出)技術,同時解碼多個用戶的嘴部 運動。在對多個用戶進行唇語識別時,采用之字形消除(Zigzag cancelation)來實現(xiàn)同時 識別技術。例如,同時對兩個用戶唇語進行識別時,先識別第一用戶的第一語音事件,當?shù)?一用戶的第二語音事件與第二用戶的第一語音事件同時發(fā)生時,消除第一用戶的第二語音 事件,而根據(jù)第一用戶的第一語音事件來預測其第二語音事件,同時,識別出第二用戶的第 一語音事件。重復這一過程,從而實現(xiàn)對多個用戶的唇語識別,無需部署額外的設備。
[0094] 本發(fā)明實施例提供的唇語識別方法及系統(tǒng)能夠通過無線信號探測用戶嘴部運動 來提取嘴部反射信號的波形特征圖,并將波形特征圖與預先采樣的嘴部運動特征圖進行對 t匕,從而實現(xiàn)唇語的識別,提高識別效率和準確率;無需部署額外的裝置,成本低廉,而且, 在具有噪音的環(huán)境下,仍可準確進行唇語識別;定向發(fā)射無線信號,使無線信號覆蓋用戶面 部,以減少不相關的多徑效應,提高探測信號的精度;提取嘴部反射信號的波形特征圖,選 取每段時間內(nèi)信號強度變化最大的子載波作為特征圖,降低計算復雜度,提高識別效率;由 于相同用戶具有相同語速,從而對每個用戶均建立嘴部運動特征圖檔案,在對用戶的唇語 進行識別時,直接與其嘴部運動特征圖檔案進行對比,提高唇語識別的準確率;采用上下文 相關的糾錯技術,對已識別的唇語進行驗證,進一步提高唇語識別的準確率。
[0095] 以上所述是本發(fā)明的優(yōu)選實施方式,應當指出,對于本【技術領域】的普通技術人員 來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也視為 本發(fā)明的保護范圍。
【權利要求】
1. 一種唇語識別方法,其特征在于,包括: 定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部; 接收用戶面部反射的無線信號,并對所述反射的無線信號進行過濾,獲得用戶嘴部運 動時的嘴部反射信號; 對所述嘴部反射信號進行分段,獲得分段信號,并提取所述分段信號的波形特征圖;所 述分段信號為每發(fā)出一個語音事件的反射信號; 比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特征圖的相似度,讀取相 似度最高的嘴部運動特征圖所對應的語音事件;所述嘴部運動特征圖為發(fā)出一個語音事件 時的無線信號波形特征圖。
2. 如權利要求1所述的唇語識別方法,其特征在于,所述定向發(fā)射無線信號,使所述無 線信號覆蓋用戶面部,具體包括: 勻速旋轉無線信號,記錄所述無線信號變換程度最大的時間點; 根據(jù)所述無線信號旋轉的角速度和所述時間點,計算所述無線信號定向發(fā)射的角度; 根據(jù)所述角度定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部。
3. 如權利要求1所述的唇語識別方法,其特征在于,所述接收用戶面部反射的無線信 號,并對所述反射的無線信號進行過濾,獲得用戶嘴部運動時的嘴部反射信號,具體包括: 接收用戶面部反射的無線信號,并采用巴特沃斯濾波器,對所述反射的無線信號進行 過濾,獲得濾波信號; 設置延遲閾值,去除延遲時間大于所述延遲閾值的濾波信號,獲得用戶嘴部運動時的 嘴部反射信號。
4. 如權利要求3所述的唇語識別方法,其特征在于,所述設置延遲閾值,去除延遲時間 大于所述延遲閾值的濾波信號,獲得用戶嘴部運動時的嘴部反射信號,具體包括: 對所述濾波信號的信道狀態(tài)信息CSI進行快速傅里葉逆變換,獲得濾波信號的時域 CSI ; 設置延遲閾值,去除時域CSI大于所述延遲閾值的濾波信號,獲得具有時域CSI的嘴部 反射信號; 對所述嘴部反射信號的時域CSI進行快速傅里葉變換,獲得用戶嘴部運動時的嘴部反 射信號。
5. 如權利要求1所述的唇語識別方法,其特征在于,所述對所述嘴部反射信號進行分 段,獲得分段信號,并提取所述分段信號的波形特征圖,具體包括: 采用小波變換算法,對所述嘴部反射信號進行分段,獲得分段信號; 在所述分段信號的CSI中,選取每個時間段信號強度變化最大的子載波,并將每個時 間段選取的子載波拼接起來,獲得所述分段信號的波形特征圖;所述CSI具有30個子載波。
6. 如權利要求1所述的唇語識別方法,其特征在于,所述比較所述分段信號的波形特 征圖與預先采樣的所有嘴部運動特征圖的相似度,讀取相似度最高的嘴部運動特征圖所對 應的語音事件,具體包括: 根據(jù)最小二乘法算法,比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動特 征圖的相似度,讀取相似度最高的嘴部運動特征圖所對應的語音事件。
7. 如權利要求1所述的唇語識別方法,其特征在于,在所述接收用戶面部反射的無線 信號,并對所述反射的無線信號進行過濾,獲得用戶嘴部運動時的嘴部反射信號之前,還包 括: 采樣用戶發(fā)出已知的語音事件時無線信號的波形特征圖,獲得所述已知語音事件對應 的嘴部運動特征圖; 將所述嘴部運動特征圖進行歸類,使具有相同發(fā)音的已知語音事件所對應的嘴部運動 特征圖為一類。
8. 如權利要求1至7任一項所述的唇語識別方法,其特征在于,所述語音事件為音節(jié)或 單詞。
9. 一種唇語識別系統(tǒng),其特征在于,包括發(fā)射端和接收端;所述接收端包括信號過濾 模塊、特征提取模塊和特征對比模塊; 所述發(fā)射端用于定向發(fā)射無線信號,使所述無線信號覆蓋用戶面部; 所述信號過濾模塊用于接收用戶面部反射的無線信號,并對所述反射的無線信號進行 過濾,獲得用戶說話時嘴部的反射信號; 所述特征提取模塊用于對所述嘴部反射信號進行分段,獲得分段信號,并提取分段信 號的波形特征圖;所述分段信號為每發(fā)出一個語音事件的反射信號; 所述特征對比模塊用于比較所述分段信號的波形特征圖與預先采樣的所有嘴部運動 特征圖的相似度,讀取相似度最高的嘴部運動特征圖所對應的語音事件;所述嘴部運動特 征圖為用戶發(fā)出一個語音事件時的無線信號波形特征圖。
10. 如權利要求9所述的唇語識別系統(tǒng),其特征在于,所述語音事件為音節(jié)或單詞。
【文檔編號】G06K9/62GK104217218SQ201410462392
【公開日】2014年12月17日 申請日期:2014年9月11日 優(yōu)先權日:2014年9月11日
【發(fā)明者】王冠華, 伍楷舜, 倪明選 申請人:廣州市香港科大霍英東研究院