本發(fā)明涉及語音識別技術(shù)領(lǐng)域,特別涉及一種基于語音識別技術(shù)的教學(xué)系統(tǒng)及方法。
背景技術(shù):
在實際生活過程中,不管是學(xué)習(xí)還是工作,我們都需要進行訓(xùn)練,以便適應(yīng)實際過程中面臨的問題。虛擬教學(xué)系統(tǒng)就應(yīng)運而生,而在虛擬教學(xué)系統(tǒng)中,又具備多種形式,包括視頻教學(xué)和語音教學(xué)。視頻教學(xué)由于生動形象,受到很多人的追捧,但整個系統(tǒng)的造價較為高昂。但是實際過程中,語音教學(xué)由于較為廉價,而且具備不輸于視頻教學(xué)的效果,其普及率更高。
而現(xiàn)有的語音教學(xué)系統(tǒng)還存在以下的問題:
1、無法模擬多種聲音:由于現(xiàn)有的教學(xué)系統(tǒng)多采用固定的機械式聲音進行教學(xué),無法模擬更多的聲音類型。
2、容易受干擾:無法識別操控者的聲音和外部的干擾聲音,導(dǎo)致教學(xué)過程中系統(tǒng)的運行錯誤。
3、教學(xué)效果較差:對于操控者的聲音的識別和對聲音的預(yù)處理方式較為落后,很多時候會導(dǎo)致誤操作,進行錯誤教學(xué)。
4、和上位機的通信效果較差:和上位機進行通信的時候未對通信過程進行校驗,導(dǎo)致通信錯誤。
技術(shù)實現(xiàn)要素:
鑒于此,本發(fā)明提供了一種基于語音識別技術(shù)的教學(xué)系統(tǒng)及方法,本發(fā)明具有教學(xué)效果好、自我校驗、模擬多種聲音和不易受干擾等優(yōu)點。
本發(fā)明采用的技術(shù)方案如下:
一種基于語音識別技術(shù)的教學(xué)系統(tǒng),其特征在于,所述系統(tǒng)包括:語音識別單元、聲強檢測單元、語音合成單元、面板控制單元、面板、主控器和上位機;所述主控制器分別信號連接于語音識別單元、聲強檢測單元、語音合成單元、面板控制單元和上位機;所述面板控制單元信號連接于面板。
采用上述技術(shù)方案,操作人員可以在面板上對整個系統(tǒng)進行操作,面板控制單元根據(jù)操作人員的操作發(fā)送控制命令道控制器從而對整個系統(tǒng)進行控制。
所述語音識別單元,用于識別操作人員的口令;它包括:聲音輸入模塊、頻譜分析模塊、特征提取模塊、語音識別模塊、語音識別器、關(guān)鍵詞列表、拼音串和MCU處理器;所述聲音輸入模塊信號連接于頻譜分析模塊;所述頻譜分析模塊信號連接于特征提取模塊;所述特征提取模塊信號連接于語音識別器;所述語音識別器分別信號連接于MCU處理器和關(guān)鍵詞列表;所述關(guān)鍵詞列表信號連接于拼音串;所述MCU處理器信號連接于拼音串。
所述聲音輸入模塊,用于接收來自于主控制器處理后的聲音信號;所述頻譜分析模塊,用于對獲取的聲音信號進行頻譜分析,將分析后的聲音信號發(fā)送至特征提取模塊;所述特征提取模塊,對聲音信號進行特征提取,將處理后的信號發(fā)送至語音識別模塊;所述語音識別模塊,用于根據(jù)關(guān)鍵詞列表中的關(guān)鍵詞對語音信號進行識別,將識別后的語音信號發(fā)送至;所述MCU處理器,用于處理用戶輸入的關(guān)鍵詞,將處理后的關(guān)鍵詞發(fā)送至拼音串;所述拼音串,用于將處理后的關(guān)鍵詞轉(zhuǎn)換為拼音串,將拼音串發(fā)送至關(guān)鍵詞列表進行存儲,從而更新關(guān)鍵詞列表。
采用上述技術(shù)方案,語音識別單元所處理的聲音信號是經(jīng)過聲強監(jiān)測單元預(yù)處理后的信號。
所述聲強檢測單元,用于檢測接收到的聲音信號是否是對該設(shè)備進行控制的口令;所述聲強檢測單元包括:聲音采集模塊、數(shù)模轉(zhuǎn)換模塊、聲強判斷模塊、信號放大模塊和信號采樣模塊;所述聲音采集模塊,用于對外部聲音信號進行采集;所述數(shù)模轉(zhuǎn)換模塊,用于將采集到的聲音信號轉(zhuǎn)換為電信號;所述聲強判斷模塊,用于接收到的信號強度進行判斷,若聲強超過設(shè)定的閾值則將信號發(fā)送至信號放大模塊,若聲強未超過設(shè)定的閾值,則將接收到的信號進行刪除;所述信號放大模塊,用于將信號進行放大;所述信號采樣模塊,用于對信號進行采樣,將采樣后的聲音信號發(fā)送至控制器。
進一步的,聲強檢測單元中的閾值可以通過面板進行設(shè)置,同時也可以通過程序進行預(yù)設(shè)。
所述語音合成單元,包括發(fā)音人選擇單元、語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元、音量調(diào)節(jié)單元和合成單元;所述發(fā)音人選擇單元分別信號連接于語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元和音量調(diào)節(jié)單元,用于根據(jù)控制器發(fā)送過來的經(jīng)語音識別信號識別后的語音信號隨機選擇不同的發(fā)音人,將該發(fā)音人對應(yīng)的語音特征分別發(fā)送至語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元和音量調(diào)節(jié)單元;所述語速調(diào)節(jié)單元,用于根據(jù)接收到的發(fā)音人特征,生成對應(yīng)的語速特征;所述語調(diào)調(diào)節(jié)單元,用于根據(jù)接收到的發(fā)音人特征,生成對應(yīng)的語調(diào)特征;所述音量調(diào)節(jié)單元,用于根據(jù)接收到的發(fā)音人特征,生成對應(yīng)的音量特征;所述合成單元分別信號連接于語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元和音量調(diào)節(jié)單元,用于根據(jù)接收到的語速特征、語調(diào)特征和音量特征合成最終的聲音信號。
進一步的,語音特征、語速特征、語調(diào)特征和音量特征都是一個參數(shù),合成單元根據(jù)獲取的參數(shù)和語音識別單元的識別結(jié)果,進行合成,生成最終的聲音信號。
一種基于語音識別技術(shù)的教學(xué)方法,其特征在于,所述方法包括以下步驟:
步驟1:聲強檢測單元對接收到的聲音信號進行聲強檢測,若聲強超過了設(shè)定的閾值則對聲音信號進行預(yù)處理,然后發(fā)送至控制器,執(zhí)行步驟2;若聲強未超過設(shè)定的閾值,則將接收到的信號刪除;
步驟2:控制器將預(yù)處理后的聲音信號發(fā)送至語音識別單元;語音識別單元對接收到的聲音信號進行語音識別處理,將處理后的聲音信號發(fā)送至控制器;
步驟3:控制器將語音識別處理后的聲音信號發(fā)送至語音合成單元;語音合成單元對接收到的經(jīng)語音識別單元識別后的聲音信號進行合成,生成最終的語音信號。
所述上位機對聲音信號進行回放的方法包括以下步驟:
步驟1:上位機發(fā)送串口命令至控制器;控制器監(jiān)測串口0是否終端,如果終端則執(zhí)行步驟2,如果未終端則不進行處理;
步驟2:控制器接收上位機的控制命令,判斷接收到的數(shù)據(jù)中是否存在本機地址,如果存在,則執(zhí)行步驟3,如果不存在則跳回繼續(xù)執(zhí)行步驟1;
步驟3:控制器將地址存入緩沖區(qū),判斷地址是否接收完整,如果是則執(zhí)行步驟4,如果不是則繼續(xù)執(zhí)行步驟1;
步驟4:控制器開始進行CRC校驗,如果校驗正確,則執(zhí)行步驟5,如果校驗不正確則跳回執(zhí)行步驟1;
步驟5:執(zhí)行信號回傳,將聲音信號發(fā)送至上位機。
采用上述技術(shù)方案,可以保證控制器準(zhǔn)確獲取上位機的控制命令,避免了誤操作。
采用以上技術(shù)方案,本發(fā)明產(chǎn)生了以下有益效果:
1、可合成不同的聲音:本發(fā)明的教學(xué)系統(tǒng)可以合成不同的類型的聲音信號,可以使得被訓(xùn)練者可以接受不同類型聲音的訓(xùn)練,提升教學(xué)的效果。
2、不易受干擾:本發(fā)明的教學(xué)系統(tǒng)通過對聲音強度的識別可以判別是操控者的聲音還是環(huán)境的干擾聲音,避免了部分干擾。
3、教學(xué)效果好:本發(fā)明的教學(xué)系統(tǒng)通過對聲音的準(zhǔn)確識別和合成不同類型的聲音,提升了教學(xué)的效果。。
4、通信效果好:本發(fā)明的上位機和控制器的通信過程中進行了多重驗證,保證了通信過程的穩(wěn)定和準(zhǔn)確。
附圖說明
圖1是本發(fā)明的一種基于語音識別技術(shù)的教學(xué)系統(tǒng)及方法的系統(tǒng)結(jié)構(gòu)示意圖。
具體實施方式
本說明書中公開的所有特征,或公開的所有方法或過程中的步驟,除了互相排斥的特征和/或步驟以外,均可以以任何方式組合。
本說明書(包括任何附加權(quán)利要求、摘要)中公開的任一特征,除非特別敘述,均可被其他等效或具有類似目的的替代特征加以替換。即,除非特別敘述,每個特征只是一系列等效或類似特征中的一個例子而已。
本發(fā)明實施例1中提供了一種基于語音識別技術(shù)的教學(xué)系統(tǒng),系統(tǒng)結(jié)構(gòu)如圖1所示:
一種基于語音識別技術(shù)的教學(xué)系統(tǒng),其特征在于,所述系統(tǒng)包括:語音識別單元、聲強檢測單元、語音合成單元、面板控制單元、面板、主控器和上位機;所述主控制器分別信號連接于語音識別單元、聲強檢測單元、語音合成單元、面板控制單元和上位機;所述面板控制單元信號連接于面板。
采用上述技術(shù)方案,操作人員可以在面板上對整個系統(tǒng)進行操作,面板控制單元根據(jù)操作人員的操作發(fā)送控制命令道控制器從而對整個系統(tǒng)進行控制。
所述語音識別單元,用于識別操作人員的口令;它包括:聲音輸入模塊、頻譜分析模塊、特征提取模塊、語音識別模塊、語音識別器、關(guān)鍵詞列表、拼音串和MCU處理器;所述聲音輸入模塊信號連接于頻譜分析模塊;所述頻譜分析模塊信號連接于特征提取模塊;所述特征提取模塊信號連接于語音識別器;所述語音識別器分別信號連接于MCU處理器和關(guān)鍵詞列表;所述關(guān)鍵詞列表信號連接于拼音串;所述MCU處理器信號連接于拼音串。
所述聲音輸入模塊,用于接收來自于主控制器處理后的聲音信號;所述頻譜分析模塊,用于對獲取的聲音信號進行頻譜分析,將分析后的聲音信號發(fā)送至特征提取模塊;所述特征提取模塊,對聲音信號進行特征提取,將處理后的信號發(fā)送至語音識別模塊;所述語音識別模塊,用于根據(jù)關(guān)鍵詞列表中的關(guān)鍵詞對語音信號進行識別,將識別后的語音信號發(fā)送至;所述MCU處理器,用于處理用戶輸入的關(guān)鍵詞,將處理后的關(guān)鍵詞發(fā)送至拼音串;所述拼音串,用于將處理后的關(guān)鍵詞轉(zhuǎn)換為拼音串,將拼音串發(fā)送至關(guān)鍵詞列表進行存儲,從而更新關(guān)鍵詞列表。
采用上述技術(shù)方案,語音識別單元所處理的聲音信號是經(jīng)過聲強監(jiān)測單元預(yù)處理后的信號。
所述聲強檢測單元,用于檢測接收到的聲音信號是否是對該設(shè)備進行控制的口令;所述聲強檢測單元包括:聲音采集模塊、數(shù)模轉(zhuǎn)換模塊、聲強判斷模塊、信號放大模塊和信號采樣模塊;所述聲音采集模塊,用于對外部聲音信號進行采集;所述數(shù)模轉(zhuǎn)換模塊,用于將采集到的聲音信號轉(zhuǎn)換為電信號;所述聲強判斷模塊,用于接收到的信號強度進行判斷,若聲強超過設(shè)定的閾值則將信號發(fā)送至信號放大模塊,若聲強未超過設(shè)定的閾值,則將接收到的信號進行刪除;所述信號放大模塊,用于將信號進行放大;所述信號采樣模塊,用于對信號進行采樣,將采樣后的聲音信號發(fā)送至控制器。
進一步的,聲強檢測單元中的閾值可以通過面板進行設(shè)置,同時也可以通過程序進行預(yù)設(shè)。
所述語音合成單元,包括發(fā)音人選擇單元、語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元、音量調(diào)節(jié)單元和合成單元;所述發(fā)音人選擇單元分別信號連接于語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元和音量調(diào)節(jié)單元,用于根據(jù)控制器發(fā)送過來的經(jīng)語音識別信號識別后的語音信號隨機選擇不同的發(fā)音人,將該發(fā)音人對應(yīng)的語音特征分別發(fā)送至語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元和音量調(diào)節(jié)單元;所述語速調(diào)節(jié)單元,用于根據(jù)接收到的發(fā)音人特征,生成對應(yīng)的語速特征;所述語調(diào)調(diào)節(jié)單元,用于根據(jù)接收到的發(fā)音人特征,生成對應(yīng)的語調(diào)特征;所述音量調(diào)節(jié)單元,用于根據(jù)接收到的發(fā)音人特征,生成對應(yīng)的音量特征;所述合成單元分別信號連接于語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元和音量調(diào)節(jié)單元,用于根據(jù)接收到的語速特征、語調(diào)特征和音量特征合成最終的聲音信號。
進一步的,語音特征、語速特征、語調(diào)特征和音量特征都是一個參數(shù),合成單元根據(jù)獲取的參數(shù)和語音識別單元的識別結(jié)果,進行合成,生成最終的聲音信號。
本發(fā)明實施例2中提供了一種基于語音識別技術(shù)的教學(xué)方法:
一種基于語音識別技術(shù)的教學(xué)方法,其特征在于,所述方法包括以下步驟:
步驟1:聲強檢測單元對接收到的聲音信號進行聲強檢測,若聲強超過了設(shè)定的閾值則對聲音信號進行預(yù)處理,然后發(fā)送至控制器,執(zhí)行步驟2;若聲強未超過設(shè)定的閾值,則將接收到的信號刪除;
步驟2:控制器將預(yù)處理后的聲音信號發(fā)送至語音識別單元;語音識別單元對接收到的聲音信號進行語音識別處理,將處理后的聲音信號發(fā)送至控制器;
步驟3:控制器將語音識別處理后的聲音信號發(fā)送至語音合成單元;語音合成單元對接收到的經(jīng)語音識別單元識別后的聲音信號進行合成,生成最終的
所述上位機對聲音信號進行回放的方法包括以下步驟:
步驟1:上位機發(fā)送串口命令至控制器;控制器監(jiān)測串口0是否終端,如果終端則執(zhí)行步驟2,如果未終端則不進行處理;
步驟2:控制器接收上位機的控制命令,判斷接收到的數(shù)據(jù)中是否存在本機地址,如果存在,則執(zhí)行步驟3,如果不存在則跳回繼續(xù)執(zhí)行步驟1;
步驟3:控制器將地址存入緩沖區(qū),判斷地址是否接收完整,如果是則執(zhí)行步驟4,如果不是則繼續(xù)執(zhí)行步驟1;
步驟4:控制器開始進行CRC校驗,如果校驗正確,則執(zhí)行步驟5,如果校驗不正確則跳回執(zhí)行步驟1;
步驟5:執(zhí)行信號回傳,將聲音信號發(fā)送至上位機。
采用上述技術(shù)方案,可以保證控制器準(zhǔn)確獲取上位機的控制命令,避免了誤操作。
本發(fā)明實施例3中提供了一種基于語音識別技術(shù)的教學(xué)系統(tǒng)及方法,系統(tǒng)結(jié)構(gòu)圖如圖1所示:
一種基于語音識別技術(shù)的教學(xué)系統(tǒng),其特征在于,所述系統(tǒng)包括:語音識別單元、聲強檢測單元、語音合成單元、面板控制單元、面板、主控器和上位機;所述主控制器分別信號連接于語音識別單元、聲強檢測單元、語音合成單元、面板控制單元和上位機;所述面板控制單元信號連接于面板。
采用上述技術(shù)方案,操作人員可以在面板上對整個系統(tǒng)進行操作,面板控制單元根據(jù)操作人員的操作發(fā)送控制命令道控制器從而對整個系統(tǒng)進行控制。
所述語音識別單元,用于識別操作人員的口令;它包括:聲音輸入模塊、頻譜分析模塊、特征提取模塊、語音識別模塊、語音識別器、關(guān)鍵詞列表、拼音串和MCU處理器;所述聲音輸入模塊信號連接于頻譜分析模塊;所述頻譜分析模塊信號連接于特征提取模塊;所述特征提取模塊信號連接于語音識別器;所述語音識別器分別信號連接于MCU處理器和關(guān)鍵詞列表;所述關(guān)鍵詞列表信號連接于拼音串;所述MCU處理器信號連接于拼音串。
所述聲音輸入模塊,用于接收來自于主控制器處理后的聲音信號;所述頻譜分析模塊,用于對獲取的聲音信號進行頻譜分析,將分析后的聲音信號發(fā)送至特征提取模塊;所述特征提取模塊,對聲音信號進行特征提取,將處理后的信號發(fā)送至語音識別模塊;所述語音識別模塊,用于根據(jù)關(guān)鍵詞列表中的關(guān)鍵詞對語音信號進行識別,將識別后的語音信號發(fā)送至;所述MCU處理器,用于處理用戶輸入的關(guān)鍵詞,將處理后的關(guān)鍵詞發(fā)送至拼音串;所述拼音串,用于將處理后的關(guān)鍵詞轉(zhuǎn)換為拼音串,將拼音串發(fā)送至關(guān)鍵詞列表進行存儲,從而更新關(guān)鍵詞列表。
采用上述技術(shù)方案,語音識別單元所處理的聲音信號是經(jīng)過聲強監(jiān)測單元預(yù)處理后的信號。
所述聲強檢測單元,用于檢測接收到的聲音信號是否是對該設(shè)備進行控制的口令;所述聲強檢測單元包括:聲音采集模塊、數(shù)模轉(zhuǎn)換模塊、聲強判斷模塊、信號放大模塊和信號采樣模塊;所述聲音采集模塊,用于對外部聲音信號進行采集;所述數(shù)模轉(zhuǎn)換模塊,用于將采集到的聲音信號轉(zhuǎn)換為電信號;所述聲強判斷模塊,用于接收到的信號強度進行判斷,若聲強超過設(shè)定的閾值則將信號發(fā)送至信號放大模塊,若聲強未超過設(shè)定的閾值,則將接收到的信號進行刪除;所述信號放大模塊,用于將信號進行放大;所述信號采樣模塊,用于對信號進行采樣,將采樣后的聲音信號發(fā)送至控制器。
進一步的,聲強檢測單元中的閾值可以通過面板進行設(shè)置,同時也可以通過程序進行預(yù)設(shè)。
所述語音合成單元,包括發(fā)音人選擇單元、語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元、音量調(diào)節(jié)單元和合成單元;所述發(fā)音人選擇單元分別信號連接于語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元和音量調(diào)節(jié)單元,用于根據(jù)控制器發(fā)送過來的經(jīng)語音識別信號識別后的語音信號隨機選擇不同的發(fā)音人,將該發(fā)音人對應(yīng)的語音特征分別發(fā)送至語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元和音量調(diào)節(jié)單元;所述語速調(diào)節(jié)單元,用于根據(jù)接收到的發(fā)音人特征,生成對應(yīng)的語速特征;所述語調(diào)調(diào)節(jié)單元,用于根據(jù)接收到的發(fā)音人特征,生成對應(yīng)的語調(diào)特征;所述音量調(diào)節(jié)單元,用于根據(jù)接收到的發(fā)音人特征,生成對應(yīng)的音量特征;所述合成單元分別信號連接于語速調(diào)節(jié)單元、語調(diào)調(diào)節(jié)單元和音量調(diào)節(jié)單元,用于根據(jù)接收到的語速特征、語調(diào)特征和音量特征合成最終的聲音信號。
進一步的,語音特征、語速特征、語調(diào)特征和音量特征都是一個參數(shù),合成單元根據(jù)獲取的參數(shù)和語音識別單元的識別結(jié)果,進行合成,生成最終的聲音信號。
一種基于語音識別技術(shù)的教學(xué)方法,其特征在于,所述方法包括以下步驟:
步驟1:聲強檢測單元對接收到的聲音信號進行聲強檢測,若聲強超過了設(shè)定的閾值則對聲音信號進行預(yù)處理,然后發(fā)送至控制器,執(zhí)行步驟2;若聲強未超過設(shè)定的閾值,則將接收到的信號刪除;
步驟2:控制器將預(yù)處理后的聲音信號發(fā)送至語音識別單元;語音識別單元對接收到的聲音信號進行語音識別處理,將處理后的聲音信號發(fā)送至控制器;
步驟3:控制器將語音識別處理后的聲音信號發(fā)送至語音合成單元;語音合成單元對接收到的經(jīng)語音識別單元識別后的聲音信號進行合成,生成最終的聲音信號。
所述上位機對聲音信號進行回放的方法包括以下步驟:
步驟1:上位機發(fā)送串口命令至控制器;控制器監(jiān)測串口0是否終端,如果終端則執(zhí)行步驟2,如果未終端則不進行處理;
步驟2:控制器接收上位機的控制命令,判斷接收到的數(shù)據(jù)中是否存在本機地址,如果存在,則執(zhí)行步驟3,如果不存在則跳回繼續(xù)執(zhí)行步驟1;
步驟3:控制器將地址存入緩沖區(qū),判斷地址是否接收完整,如果是則執(zhí)行步驟4,如果不是則繼續(xù)執(zhí)行步驟1;
步驟4:控制器開始進行CRC校驗,如果校驗正確,則執(zhí)行步驟5,如果校驗不正確則跳回執(zhí)行步驟1;
步驟5:執(zhí)行信號回傳,將聲音信號發(fā)送至上位機。
采用上述技術(shù)方案,可以保證控制器準(zhǔn)確獲取上位機的控制命令,避免了誤操作。
本發(fā)明的教學(xué)系統(tǒng)可以合成不同的類型的聲音信號,可以使得被訓(xùn)練者可以接受不同類型聲音的訓(xùn)練,提升教學(xué)的效果。
本發(fā)明的教學(xué)系統(tǒng)通過對聲音強度的識別可以判別是操控者的聲音還是環(huán)境的干擾聲音,避免了部分干擾。
本發(fā)明的教學(xué)系統(tǒng)通過對聲音的準(zhǔn)確識別和合成不同類型的聲音,提升了教學(xué)的效果。。
本發(fā)明的上位機和控制器的通信過程中進行了多重驗證,保證了通信過程的穩(wěn)定和準(zhǔn)確。
本發(fā)明并不局限于前述的具體實施方式。本發(fā)明擴展到任何在本說明書中披露的新特征或任何新的組合,以及披露的任一新的方法或過程的步驟或任何新的組合。