亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法及系統(tǒng)的制作方法

文檔序號(hào):2818967閱讀:679來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)語(yǔ)音識(shí)別控制領(lǐng)域,具體涉及一種基于分形特征的語(yǔ)音識(shí)別智能輪椅控制方法。
背景技術(shù)
隨著社會(huì)的發(fā)展和人類(lèi)文明程度的提高,人們特別是老年人、殘疾人的服務(wù)需求會(huì)日益增加,他們愈來(lái)愈需要運(yùn)用現(xiàn)代高新技術(shù)來(lái)改善他們的生活質(zhì)量和生活自由度。無(wú)論是國(guó)際上還是我國(guó)國(guó)內(nèi),人口老齡化的進(jìn)程正在加快,另外由于各種交通事故、天災(zāi)人禍和種種疾病,每年均有成千上萬(wàn)的人喪失一種或多種能力(如行走、動(dòng)手能力等),這種社會(huì)現(xiàn)實(shí)促進(jìn)了智能化服務(wù)機(jī)器人在助老、助殘方面的應(yīng)用。因此,智能輪椅作為助老、助殘服務(wù)機(jī)器人系列產(chǎn)品中的一個(gè)重要研究領(lǐng)域已逐漸成為國(guó)內(nèi)外科技人員研究的熱點(diǎn)。輪椅作為廣大老弱病殘人員使用的輔助運(yùn)動(dòng)工具,幾乎都是室外使用的手柄控制的電動(dòng)輪椅, 對(duì)于那些四肢活動(dòng)能力受限的老年人或殘疾者控制起來(lái)不是十分方便,因此,我們將語(yǔ)音控制應(yīng)用于智能輪椅上,形成一種將智能輪椅與語(yǔ)音識(shí)別技術(shù)結(jié)合起來(lái)的新型代步工具, 它不僅具有普通輪椅的所有功能,重要的是還可以通過(guò)語(yǔ)音命令對(duì)輪椅進(jìn)行控制,使輪椅的控制更加簡(jiǎn)單、方便,宜人性更好。因此,實(shí)用的語(yǔ)音控制智能輪椅機(jī)器人將為老年人和殘疾人開(kāi)創(chuàng)新的生活模式和生活概念,具有非常重要的現(xiàn)實(shí)意義。在國(guó)內(nèi)外,研究者們已經(jīng)開(kāi)展了大量相關(guān)項(xiàng)目的研究1996年西班牙由ONCE基金會(huì)資助的SIAMO項(xiàng)目,目標(biāo)是根據(jù)用戶(hù)的殘障程度及特殊需求建造多功能系統(tǒng),為了達(dá)到要求,特別研究了系統(tǒng)的模塊化和靈活性,設(shè)計(jì)了分布式構(gòu)架,也著重開(kāi)發(fā)了人機(jī)界面,其中也把語(yǔ)音識(shí)別控制技術(shù)應(yīng)用于智能輪椅,使用戶(hù)更易于控制輪椅。日本北海道工業(yè)設(shè)計(jì)學(xué)院的研究人員研制出一種不用人工操作的聲控輪椅。研究人員將可感應(yīng)語(yǔ)言聲響的晶片,裝置在輪椅的控制機(jī)關(guān)內(nèi),在使用者對(duì)著麥克風(fēng)講出要求后,感應(yīng)系統(tǒng)便會(huì)依照要求啟動(dòng)運(yùn)作,除了可向前后左右和快慢行走外,椅背還可向后傾,方便使用者休息。中國(guó)科學(xué)院自動(dòng)化研究所承擔(dān)了 “863”智能機(jī)器人智能輪椅項(xiàng)目,研制了一種具有視覺(jué)和口令導(dǎo)航功能并能與人進(jìn)行語(yǔ)音交互的機(jī)器人輪椅NLPR,此項(xiàng)研究高度重視了智能輪椅人機(jī)控制界面的設(shè)計(jì),在輪椅的設(shè)計(jì)中綜合運(yùn)用模式識(shí)別實(shí)驗(yàn)室有關(guān)圖像處理、計(jì)算機(jī)視覺(jué)和語(yǔ)音識(shí)別等最新成果,使人能通過(guò)語(yǔ)音控制輪椅自由行走,輪椅可以實(shí)現(xiàn)簡(jiǎn)單的人機(jī)對(duì)話(huà)功能。上海交通大學(xué)開(kāi)發(fā)成功一種聲控輪椅,主要是為四肢全部喪失功能的殘疾者設(shè)計(jì),使用者只需發(fā)出“開(kāi)”、“前”、“后”、“左”、“右”、“快”、“慢”、“停”等指令,輪椅可在1. 2秒內(nèi)按指令執(zhí)行。但是,由于語(yǔ)音信號(hào)是一個(gè)復(fù)雜的非線性過(guò)程,那么基于傳統(tǒng)的線性系統(tǒng)理論發(fā)展起來(lái)的語(yǔ)音識(shí)別技術(shù)的性能就難以進(jìn)一步的提高。因此急需一種采用高識(shí)別率的語(yǔ)音識(shí)別系統(tǒng)來(lái)控制智能輪椅的方法。

發(fā)明內(nèi)容
有鑒于此,為了解決上述問(wèn)題,本發(fā)明提出一種采用高識(shí)別率的語(yǔ)音識(shí)別系統(tǒng)來(lái)控制智能輪椅的方法。是一種基于非線性理論的特征提取方法,即將語(yǔ)音信號(hào)的分形特征參數(shù)合并到傳統(tǒng)的Mel頻率倒譜系數(shù)(MFCC)中,這樣組成混合的特征參數(shù)在語(yǔ)音識(shí)別系統(tǒng)中可以提高系統(tǒng)的識(shí)別率。本發(fā)明的目的之一是提出一種基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法方法; 本發(fā)明的目的之二是提出一種基于分形特征的智能輪椅語(yǔ)音識(shí)別控制系統(tǒng)。本發(fā)明的目的之一是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的本發(fā)明提供的基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法,包括以下步驟Sl 語(yǔ)音信號(hào)命令詞輸入;S2 對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理;S3 提取經(jīng)過(guò)預(yù)處理后語(yǔ)音信號(hào)的特征參數(shù);S4 將特征參數(shù)與模板庫(kù)的模板進(jìn)行模式匹配;S5 選擇匹配相似度最高的模板作為識(shí)別結(jié)果;S6 將該識(shí)別結(jié)果轉(zhuǎn)換成智能輪椅的運(yùn)動(dòng)命令;S7 調(diào)用相應(yīng)的控制函數(shù),驅(qū)動(dòng)智能輪椅按照語(yǔ)音信號(hào)進(jìn)行運(yùn)動(dòng)。進(jìn)一步,所述步驟S2中的預(yù)處理,包括語(yǔ)音的預(yù)加重濾波、加窗分幀處理與雙門(mén)限端點(diǎn)檢測(cè);進(jìn)一步,所述步驟S3中的特征提取包括以下步驟S31 提取語(yǔ)音信號(hào)的MFCC (Mel頻率倒譜系數(shù))參數(shù);S311 首先確定每一幀語(yǔ)音采樣序列的點(diǎn)數(shù),對(duì)每幀序列s (η)進(jìn)行預(yù)加重濾波處理;S312 再進(jìn)行離散FFT (傅立葉變換)變換,取模的平方得到離散功率譜S (η);S313 在語(yǔ)音的頻譜范圍內(nèi)設(shè)置若干個(gè)帶通濾波器;Hm(η),m = 0,1, ,M-I, η = 0,1, ,Ν/2-1其中M為濾波器的個(gè)數(shù),通常取24,N為一幀語(yǔ)音信號(hào)的點(diǎn)數(shù);S314 將離散功率譜轉(zhuǎn)換為Mel頻率下的功率譜S (η);計(jì)算S(n)通過(guò)MfHm(Ii)后所得的功率值,即計(jì)算S(η)和禮⑷在各離散頻率點(diǎn)上乘積之和,得到M個(gè)參數(shù)Pm,m = 0,1,·,M-I ;S315 計(jì)算 Pm 的自然對(duì)數(shù),得到 Lm,m = 0,1, ,M-IS316 對(duì) L。,L1, ·,Lnri 計(jì)算其離散余弦變換,得到 Dm,m = 0,1, ,M_1 ;S317 舍去代表直流成分的D。,取D1, D2,·,Dk作為MFCC參數(shù);S32 提取語(yǔ)音的動(dòng)態(tài)特征,作為一幀語(yǔ)音信號(hào)的特征參數(shù),用差分倒譜參數(shù)來(lái)描述語(yǔ)音的動(dòng)態(tài)特征,計(jì)算公式為
權(quán)利要求
1.基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法,其特征在于包括以下步驟51語(yǔ)音信號(hào)命令詞輸入;52對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理;53提取經(jīng)過(guò)預(yù)處理后語(yǔ)音信號(hào)的特征參數(shù);54將特征參數(shù)與模板庫(kù)的模板進(jìn)行模式匹配;55選擇匹配相似度最高的模板作為識(shí)別結(jié)果;56將該識(shí)別結(jié)果轉(zhuǎn)換成智能輪椅的運(yùn)動(dòng)命令;57調(diào)用相應(yīng)的控制函數(shù),驅(qū)動(dòng)智能輪椅按照語(yǔ)音信號(hào)進(jìn)行運(yùn)動(dòng)。
2.根據(jù)權(quán)利要求1所述的基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法,其特征在于 所述步驟S2中的預(yù)處理,包括語(yǔ)音的預(yù)加重濾波、加窗分幀處理與雙門(mén)限端點(diǎn)檢測(cè)。
3.根據(jù)權(quán)利要求1所述的基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法,其特征在于 所述步驟S3中的特征提取包括以下步驟531提取語(yǔ)音信號(hào)的Mel頻率倒譜系數(shù)MFCC參數(shù);5311首先確定每一幀語(yǔ)音采樣序列的點(diǎn)數(shù),對(duì)每幀序列S(ri)進(jìn)行預(yù)加重濾波處理;5312再進(jìn)行離散傅立葉變換FFT變換,取模的平方得到離散功率譜S (η);5313在語(yǔ)音的頻譜范圍內(nèi)設(shè)置若干個(gè)帶通濾波器;在某一頻譜范圍內(nèi)的語(yǔ)音可以通過(guò)此帶通濾波器,而其它范圍的語(yǔ)音頻譜被衰減至極低值。此帶通濾波器如下^1(Ii),m = 0,1, ,M-I, η = 0,1, ,Ν/2-1其中Hm(η)為每個(gè)帶通濾波器的傳遞函數(shù),M為濾波器的個(gè)數(shù),通常取24,N為一幀語(yǔ)音信號(hào)的點(diǎn)數(shù);5314將離散功率譜轉(zhuǎn)換為Mel頻率下的功率譜S (η);計(jì)算S(n)通過(guò)Mf Hm(η)后所得的功率值,即計(jì)算S(η)和禮(11)在各離散頻率點(diǎn)上乘積之和,得到M個(gè)參數(shù)Pm,m = 0,1, ·,M-I,此處Pm為中心頻率;5315計(jì)算Pm的自然對(duì)數(shù),得到Lm,m = 0,1,·,M-1,此處Lm為對(duì)數(shù)頻譜。5316對(duì)Ltl,L1, ·,Lnrl計(jì)算其離散余弦變換,得到Dm,m = 0,1, ,M-1 ;5317舍去代表直流成分的D。,取D1, D2, ·,Dk作為MFCC參數(shù);532提取語(yǔ)音的動(dòng)態(tài)特征,作為一幀語(yǔ)音信號(hào)的特征參數(shù), 用差分倒譜參數(shù)來(lái)描述語(yǔ)音的動(dòng)態(tài)特征,計(jì)算公式為其中c和d都表示一幀語(yǔ)音參數(shù),k為常數(shù),通常取2,差分參數(shù)就稱(chēng)為當(dāng)前幀的前兩幀和后兩幀參數(shù)的線性組合;由此式計(jì)算得到的差分參數(shù)為一階MFCC差分參數(shù),實(shí)際使用中,將MFCC參數(shù)和各階MFCC差分參數(shù)合并為一個(gè)矢量;S33 提取語(yǔ)音信號(hào)的分形維數(shù)作為分形特征;5331將語(yǔ)音信號(hào)歸一化到單位正方形區(qū)域,得到歸一化信號(hào)x(t);5332將正方形區(qū)域劃分為邊長(zhǎng)為s的網(wǎng)格,計(jì)算出IogN(S),log(l/s),N(S)表示用邊長(zhǎng)為s的網(wǎng)格覆蓋x(t)所需要的最小正方形個(gè)數(shù),改變s的大小,計(jì)算相應(yīng)的logN(s), log(l/s);S 333 :令\ = log(l/Si), Yi = IogN(Si), i = 1,2,·,M,利用(Xi, Yi)最小二乘擬合直線y = kx+b, k即為計(jì)盒維數(shù)Db,Db的計(jì)算公式為
4.根據(jù)權(quán)利要求1所述的基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法,其特征在于 所述步驟S4中的模板庫(kù)是經(jīng)過(guò)特征訓(xùn)練形成的對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理后提取特征參數(shù), 得到每個(gè)語(yǔ)音信號(hào)命令詞的特征參數(shù)模板,保存在模板庫(kù)中形成該命令詞在模板庫(kù)中的參考模板。
5.根據(jù)權(quán)利要求1所述的基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法,其特征在于 所述步驟S5包括以下步驟551從語(yǔ)音信號(hào)中提取特征參數(shù)生成測(cè)試模板;552將測(cè)試模板與模板庫(kù)中的參考模板進(jìn)行模式匹配;553選擇匹配相似度最高的參考模板作為識(shí)別結(jié)果。
6.根據(jù)權(quán)利要求1所述的基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法,其特征在于 所述模板庫(kù)的特征訓(xùn)練訓(xùn)練和模式匹配采用隱馬爾可夫模型方法。
7.基于分形特征的智能輪椅語(yǔ)音識(shí)別控制系統(tǒng),其特征在于包括語(yǔ)音信號(hào)輸入模塊,用于輸入語(yǔ)音信號(hào)命令詞;語(yǔ)音信號(hào)預(yù)處理模塊,用于對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理;語(yǔ)音的預(yù)加重濾波、加窗分幀處理與雙門(mén)限端點(diǎn)檢測(cè);語(yǔ)音信號(hào)的特征參數(shù)提取模塊,用于提取經(jīng)過(guò)預(yù)處理后語(yǔ)音信號(hào)的特征參數(shù); 匹配模塊,用于將特征參數(shù)與模板庫(kù)的模板進(jìn)行模式匹配; 判斷模塊,用于選擇匹配相似度最高的模板作為識(shí)別結(jié)果; 命令轉(zhuǎn)換模塊,用于將該識(shí)別結(jié)果轉(zhuǎn)換成智能輪椅的運(yùn)動(dòng)命令; 控制模塊,用于調(diào)用相應(yīng)的控制函數(shù),驅(qū)動(dòng)智能輪椅按照語(yǔ)音信號(hào)進(jìn)行運(yùn)動(dòng)。
8.根據(jù)權(quán)利要求7所述的基于分形特征的智能輪椅語(yǔ)音識(shí)別控制系統(tǒng),其特征在于 所述語(yǔ)音信號(hào)的特征參數(shù)提取模塊,包括MFCC參數(shù)提取模塊、動(dòng)態(tài)特征提取模塊、分形特征提取模塊和混合特征參數(shù)提取模塊;所述MFCC參數(shù)提取模塊,用于執(zhí)行以下步驟首先確定每一幀語(yǔ)音采樣序列的點(diǎn)數(shù),對(duì)每幀序列s(n)進(jìn)行預(yù)加重濾波處理; 再進(jìn)行離散FFT變換,取模的平方得到離散功率譜S (η);在語(yǔ)音的頻譜范圍內(nèi)設(shè)置若干個(gè)帶通濾波器; Hm(η),m = 0,1, ,M-I, η = 0,1, ,Ν/2-1 其中M為濾波器的個(gè)數(shù),通常取24,N為一幀語(yǔ)音信號(hào)的點(diǎn)數(shù); 將離散功率譜轉(zhuǎn)換為Mel頻率下的功率譜S (η);計(jì)算S(n)通過(guò)Mf Hm(η)后所得的功率值,即計(jì)算S(η)和禮(11)在各離散頻率點(diǎn)上乘積之和,得到M個(gè)參數(shù)Pm,m = 0,1,·,M-I ;計(jì)算Pm的自然對(duì)數(shù),得到Lm,m = 0,1,·,M-I 對(duì)Ltl,L1, ·,Lffl^1計(jì)算其離散余弦變換,得到Dm,m = 0,1,·,M-I ; 舍去代表直流成分的Dtl,取D1, D2,·,Dk作為MFCC參數(shù); 所述動(dòng)態(tài)特征提取模塊,用于以下公式來(lái)計(jì)算
9.根據(jù)權(quán)利要求7所述的基于分形特征的智能輪椅語(yǔ)音識(shí)別控制系統(tǒng),其特征在于 所述匹配模塊中的模板庫(kù)是經(jīng)過(guò)特征訓(xùn)練形成的對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理后提取特征參數(shù),得到每個(gè)語(yǔ)音信號(hào)命令詞的特征參數(shù)模板,保存在模板庫(kù)中形成該命令詞在模板庫(kù)中的參考模板。
10.根據(jù)權(quán)利要求7所述的基于分形特征的智能輪椅語(yǔ)音識(shí)別控制系統(tǒng),其特征在于還包括語(yǔ)音輸入裝置、信號(hào)處理裝置、無(wú)線通信裝置和智能輪椅本體,所述語(yǔ)音命令信號(hào)通過(guò)語(yǔ)音輸入裝置傳輸?shù)叫盘?hào)處理裝置進(jìn)行信號(hào)處理得到控制智能輪椅本體的命令,該控制命令通過(guò)無(wú)線通信裝置傳輸?shù)街悄茌喴伪倔w實(shí)現(xiàn)智能輪椅本體的運(yùn)動(dòng)。
全文摘要
本發(fā)明公開(kāi)了一種基于分形特征的智能輪椅語(yǔ)音識(shí)別控制方法,涉及語(yǔ)音識(shí)別方法,首先將語(yǔ)音信號(hào)輸入,再進(jìn)行預(yù)處理和特征參數(shù)提取,然后與模板庫(kù)中的模板進(jìn)行匹配判斷獲得命令控制智能輪椅,采用將語(yǔ)音信號(hào)的分形特征參數(shù)和傳統(tǒng)的MFCC特征參數(shù)有機(jī)結(jié)合得到的混合特征參數(shù),提高了系統(tǒng)的識(shí)別率,用于智能輪椅語(yǔ)音控制系統(tǒng)中的語(yǔ)音識(shí)別,實(shí)現(xiàn)了對(duì)智能輪椅的精確控制,達(dá)到用戶(hù)與智能輪椅之間語(yǔ)音交互的目的,同時(shí),這種混合特征參數(shù)提取方法還適用于其它的語(yǔ)音識(shí)別系統(tǒng),另外還公開(kāi)了一種基于分形特征的智能輪椅語(yǔ)音識(shí)別控制系統(tǒng),包括語(yǔ)音信號(hào)輸入模塊,預(yù)處理模塊,特征參數(shù)提取模塊,匹配模塊,判斷模塊,命令轉(zhuǎn)換模塊,控制模塊。
文檔編號(hào)G10L15/04GK102184732SQ201110109168
公開(kāi)日2011年9月14日 申請(qǐng)日期2011年4月28日 優(yōu)先權(quán)日2011年4月28日
發(fā)明者張毅, 李敏, 李艷花, 林海波, 羅元, 蔡軍, 謝穎, 黃璜 申請(qǐng)人:重慶郵電大學(xué)
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1