一種通過語音控制和喚醒機器人的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明專利涉及一種語音控制實現(xiàn)設(shè)備喚醒方法的技術(shù)領(lǐng)域,尤其是一種通過語音控制和喚醒機器人的方法,該裝置采用獨特的優(yōu)化方法設(shè)計,。
【背景技術(shù)】
[0002]隨著物質(zhì)生活水平的逐步提高,機器人技術(shù)的發(fā)展和使用越來越得到普及,它應(yīng)該說是一個科學(xué)技術(shù)發(fā)展共同的一個綜合性的結(jié)果,也同時,為社會經(jīng)濟發(fā)展產(chǎn)生了一個重大影響的一門科學(xué)技術(shù),另一方面它也是生產(chǎn)力發(fā)展的需求的必然結(jié)果,也是人類自身發(fā)展的必然結(jié)果,那么人類的發(fā)展隨著人們這種社會發(fā)展的情況,人們越來越不斷探討自然過程中,在改造自然過程中,認(rèn)識自然過程中,實現(xiàn)人們對不可達世界的認(rèn)識和改造,這也是人們在科技發(fā)展過程中的一個客觀需要;語音聊天和人機交互是體現(xiàn)智能技術(shù)的一大分支,而這些技術(shù)主要立足于語音識別、語義理解以及語音喚醒這三門技術(shù);
[0003]語音識別技術(shù)廣義上講是指將聲音轉(zhuǎn)換成文字,而語義理解是指解析這段語義,并獲取它的關(guān)鍵詞,而語音喚醒是指聽到喚醒詞后即可喚醒相應(yīng)的設(shè)備等;而現(xiàn)有技術(shù)中機器人的開關(guān)操作都是基于手動的開關(guān)操作和無線的遙控操作,比較麻煩,且操作繁瑣,而基于語音控制及語音喚醒功能的機器人目前還處在開發(fā)研究階段,現(xiàn)有的語音識別技術(shù)不能保證完全正確的識別;語義理解技術(shù)也不能完全得到正確的分析結(jié)果,且普遍存在資源短缺,算法不精準(zhǔn),致使提取關(guān)鍵詞頻繁出錯,不能解析復(fù)雜句子,不能合理的處理有歧義的句子,無法合理的做到記憶功能等缺陷;
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是,提供一種通過語音控制和喚醒機器人的方法,解決了現(xiàn)有技術(shù)中,其技術(shù)和資源存在的缺陷,尤其是語音識別、語義理解及語音喚醒等技術(shù)的局限性,降低了識別率受環(huán)境和硬件的影響較大的不足,解決了語音喚醒技術(shù)在嘈雜的環(huán)境中喚醒率較低的技術(shù)難題;
[0005]—種通過語音控制和喚醒機器人的方法,包括如下步驟:
[0006]步驟一、為了避免單獨使用軟件的局限性,通過分析及優(yōu)化設(shè)計,采用軟、硬結(jié)合的方式,在硬件上添加了幾個不同方位的麥克風(fēng),以便從不同的方向判斷聲音的來源,以及在人多嘈雜的環(huán)境中識別出想要的聲音;
[0007]作為一種舉例說明,所述麥克風(fēng)的數(shù)量為四個;
[0008]作為一種舉例說明,所述麥克風(fēng)的安裝方位為東、南、西、北;
[0009]步驟二、所述麥克風(fēng)在所述軟件中設(shè)計有相應(yīng)記錄用的陣列錄音,并通過內(nèi)置的語音處理芯片解析進行語音處理;
[0010]步驟三、在所述軟件設(shè)計中加入降噪算法來處理麥克風(fēng)錄到的聲音;通過一定的算法去除環(huán)境的噪音以及多余的人聲,從而提高識別率和喚醒率;
[0011 ]步驟四、在所述軟件設(shè)計中加入語音識別處理和語義理解提取技術(shù);
[0012]步驟五、在所述軟件設(shè)計中加入能夠聯(lián)動機器人動作的邏輯處理單元;
[0013]作為一種舉例說明,所述降噪算法主要利用信號處理技術(shù)消除信號中的強噪聲干擾,從而提高輸出信噪比以提取出有用信號;
[0014]本發(fā)明通過增加不同方位的麥克風(fēng)判別不同的聲音,再通過增加降噪算法的技術(shù)手段,處理從麥克風(fēng)獲取的聲音,得到準(zhǔn)確的關(guān)鍵詞提取,降低出錯率;
[0015]為了更好的說明本發(fā)明的工作原理,先通過舉例說明,來進一步闡釋本發(fā)明的方法步驟:
[0016]①同時打開4個不同方位的麥克風(fēng)陣列錄音;
[0017]②將錄音的數(shù)據(jù)傳給語音處理芯片處理;
[0018]③通過降噪算法等,去除回音、環(huán)境噪音以及多余的人聲等;
[0019]④再將處理后的音頻數(shù)據(jù)經(jīng)過語音識別轉(zhuǎn)換成相應(yīng)的文字;
[0020]⑤通過語義理解提取相應(yīng)的語義關(guān)鍵詞;
[0021]⑥再通過相應(yīng)的邏輯讓機器人執(zhí)行相應(yīng)的動作,如行走、唱歌、講故事、聊天等,從而達到人機交互的目的。
[0022]本次發(fā)明是主要是解決通過語音控制機器人時識別率較低以及資源缺乏的情景;使用的方法是通過從硬件上增加不同方位麥克風(fēng)的數(shù)量,再加上軟件上的降噪算法,在最大程度上降低或屏蔽環(huán)境的噪音,從而達到提高識別率和喚醒率的目的;
[0023]本發(fā)明的有益效果:
[0024]1、通過上述的改進,使用多個麥克風(fēng)通過不同方位的錄音,加上降噪算法的處理,音質(zhì)效果增強了,受環(huán)境噪音影響減小了,識別率和喚醒率提高了;
[0025]2、本發(fā)明之方法設(shè)計簡單,實現(xiàn)容易,能夠使人機交互體驗效果發(fā)生了質(zhì)的飛躍,和機器人交流,顯得機器人更加智能。
【附圖說明】
[0026]圖1是本發(fā)明一種通過語音控制和喚醒機器人的方法之原理示意圖
[0027]圖2是本發(fā)明一種通過語音控制和喚醒機器人的方法之流程示意圖
【具體實施方式】
[0028]下面結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行詳細說明。
[0029]參照圖1至圖2所示,一種通過語音控制和喚醒機器人的方法,包括如下步驟:
[0030]步驟一、為了避免單獨使用軟件的局限性,通過分析及優(yōu)化設(shè)計,采用軟、硬結(jié)合的方式,在硬件上添加了幾個不同方位的麥克風(fēng),以便從不同的方向判斷聲音的來源,以及在人多嘈雜的環(huán)境中識別出想要的聲音;
[0031 ]作為一種舉例說明,所述麥克風(fēng)的數(shù)量為四個;
[0032]作為一種舉例說明,所述麥克風(fēng)的安裝方位為東、南、西、北;
[0033]步驟二、所述麥克風(fēng)在所述軟件中設(shè)計有相應(yīng)記錄用的陣列錄音,并通過內(nèi)置的語音處理芯片解析進行語音處理;
[0034]步驟三、在所述軟件設(shè)計中加入降噪算法來處理麥克風(fēng)錄到的聲音;通過一定的算法去除環(huán)境的噪音以及多余的人聲,從而提高識別率和喚醒率;
[0035]步驟四、在所述軟件設(shè)計中加入語音識別處理和語義理解提取技術(shù);
[0036]步驟五、在所述軟件設(shè)計中加入能夠聯(lián)動機器人動作的邏輯處理單元;
[0037]作為一種舉例說明,所述降噪算法主要利用信號處理技術(shù)消除信號中的強噪聲干擾,從而提高輸出信噪比以提取出有用信號;
[0038]本發(fā)明通過增加不同方位的麥克風(fēng)判別不同的聲音,再通過增加降噪算法的技術(shù)手段,處理從麥克風(fēng)獲取的聲音,得到準(zhǔn)確的關(guān)鍵詞提取,降低出錯率;
[0039]為了更好的說明本發(fā)明的工作原理,先通過舉例說明,來進一步闡釋本發(fā)明的方法步驟:
[0040]①同時打開4個不同方位的麥克風(fēng)陣列錄音;
[0041 ]②將錄音的數(shù)據(jù)傳給語音處理芯片處理;
[0042]③通過降噪算法等,去除回音、環(huán)境噪音以及多余的人聲等;
[0043]④再將處理后的音頻數(shù)據(jù)經(jīng)過語音識別轉(zhuǎn)換成相應(yīng)的文字;
[0044]⑤通過語義理解提取相應(yīng)的語義關(guān)鍵詞;
[0045]⑥再通過相應(yīng)的邏輯讓機器人執(zhí)行相應(yīng)的動作,如行走、唱歌、講故事、聊天等,從而達到人機交互的目的。
[0046]本次發(fā)明是主要是解決通過語音控制機器人時識別率較低以及資源缺乏的情景;使用的方法是通過從硬件上增加不同方位麥克風(fēng)的數(shù)量,再加上軟件上的降噪算法,在最大程度上降低或屏蔽環(huán)境的噪音,從而達到提高識別率和喚醒率的目的;
[0047]本發(fā)明通過上述的改進,使用多個麥克風(fēng)通過不同方位的錄音,加上降噪算法的處理,音質(zhì)效果增強了,受環(huán)境噪音影響減小了,識別率和喚醒率提高了;本發(fā)明之方法設(shè)計簡單,實現(xiàn)容易,能夠使人機交互體驗效果發(fā)生了質(zhì)的飛躍,和機器人交流,顯得機器人更加智能。
[0048]以上所述的僅為本發(fā)明的優(yōu)選實施例,所應(yīng)理解的是,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想,并不用于限定本發(fā)明的保護范圍,凡在本發(fā)明的思想和原則之內(nèi)所做的任何修改、等同替換等等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1.一種通過語音控制和喚醒機器人的方法,其特征在于,包括如下步驟: 步驟一、為了避免單獨使用軟件的局限性,通過分析及優(yōu)化設(shè)計,采用軟、硬結(jié)合的方式,在硬件上添加了幾個不同方位的麥克風(fēng),以便從不同的方向判斷聲音的來源,以及在人多嘈雜的環(huán)境中識別出想要的聲音; 步驟二、所述麥克風(fēng)在所述軟件中設(shè)計有相應(yīng)記錄用的陣列錄音,并通過內(nèi)置的語音處理芯片解析進行語音處理; 步驟三、在所述軟件設(shè)計中加入降噪算法來處理麥克風(fēng)錄到的聲音;通過一定的算法去除環(huán)境的噪音以及多余的人聲,從而提高識別率和喚醒率; 步驟四、在所述軟件設(shè)計中加入語音識別處理和語義理解提取技術(shù); 步驟五、在所述軟件設(shè)計中加入能夠聯(lián)動機器人動作的邏輯處理單元。2.根據(jù)權(quán)利要求1所述的一種通過語音控制和喚醒機器人的方法,其特征在于,所述麥克風(fēng)的數(shù)量為四個。3.根據(jù)權(quán)利要求2所述的一種通過語音控制和喚醒機器人的方法,其特征在于,所述麥克風(fēng)的安裝方位為東、南、西、北。
【專利摘要】一種通過語音控制和喚醒機器人的方法,包括如下步驟:采用軟、硬結(jié)合的方式,在硬件上添加了幾個不同方位的麥克風(fēng),以便從不同的方向判斷聲音的來源,所述麥克風(fēng)在所述軟件中設(shè)計有相應(yīng)記錄用的陣列錄音,并通過內(nèi)置的語音處理芯片解析進行語音處理;在所述軟件設(shè)計中加入降噪算法來處理麥克風(fēng)錄到的聲音;在所述軟件設(shè)計中加入語音識別處理和語義理解提取技術(shù);在所述軟件設(shè)計中加入能夠聯(lián)動機器人動作的邏輯處理單元,通過上述的改進,使用多個麥克風(fēng)通過不同方位的錄音,加上降噪算法的處理,音質(zhì)效果增強了,受環(huán)境噪音影響減小了,識別率和喚醒率提高了;本發(fā)明之方法設(shè)計簡單,實現(xiàn)容易,能夠使人機交互體驗效果發(fā)生了質(zhì)的飛躍。
【IPC分類】G10L21/0208, G10L15/20, G10L15/26
【公開號】CN105632493
【申請?zhí)枴緾N201610081981
【發(fā)明人】王贏
【申請人】深圳前海勇藝達機器人有限公司
【公開日】2016年6月1日
【申請日】2016年2月5日