一種面向pc的嵌入式非特定語音溝通系統(tǒng)的制作方法

文檔序號：8339353閱讀：419來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種面向pc的嵌入式非特定語音溝通系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種非特定語音信號識別電路，具體地說是涉及一種通過嵌入式非特定語音信號和電腦溝通的電路系統(tǒng)。
【背景技術(shù)】
[0002] 嵌入式技術(shù)作為21世紀(jì)智能時代的核心技術(shù)，越來越多的在科技和生活領(lǐng)域發(fā) 揮了支柱性作用。目前，計算機(jī)的控制是通過鍵盤和鼠標(biāo)來完成，隨著科技的不斷發(fā)展，人們需要一種更方便、更自然、更加人性化的方式與計算機(jī)進(jìn)行交互。語音識別技術(shù)是信息
技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一，它是一門交叉學(xué)科，正逐步成為信息技術(shù)中人機(jī) 交互的關(guān)鍵技術(shù)，它的應(yīng)用已經(jīng)成為一個具有競爭性的新興高技術(shù)產(chǎn)業(yè)。目前主流的語音識別技術(shù)是基于統(tǒng)計模式識別的基本理論，而統(tǒng)計模型訓(xùn)練由于算法復(fù)雜，運算量大，功耗高，成本高等缺點，在實際應(yīng)用中限制了它的運用。而嵌入式語音人機(jī)交互由于其實時性好，穩(wěn)定性高等許多優(yōu)點已成為目前研宄的熱門課題，但尚無比較成熟，設(shè)計復(fù)雜程度低、功耗較小的可實施性方案問世。

【發(fā)明內(nèi)容】

[0003] 鑒于上述現(xiàn)有技術(shù)的不足，本發(fā)明的目的是提出一種面向PC的嵌入式非特定語音溝通系統(tǒng)，以簡單的電路設(shè)計、識別率高、實時性高、穩(wěn)定性好等特點提出PC語音交互的技術(shù)解決方案。
[0004] 本發(fā)明的上述目的，其得以實現(xiàn)的技術(shù)解決方案是：一種面向PC的嵌入式非特定語音溝通系統(tǒng)，其特征在于：所述溝通系統(tǒng)由微處理器、語音識別芯片LD3320、USB電纜和輔配電路組成，其中所述微處理器為Cortex-M4內(nèi)核的STM32F407VG主控芯片且移植有 yC/OS-III操作系統(tǒng)，所述語音識別芯片LD3320外接設(shè)有音頻播放器和音頻采集器且與微處理器SPI通信相連，所述USB電纜連接微處理器至PC機(jī)，且語音溝通包括步驟： I、通用初始化，通用初始化就是語音識別以及語音播放都適用的初始化。LD3320內(nèi)部集成PLL，根據(jù)時鐘頻率正確配置PLL是語音識別ADC采樣和語音播放.DA輸出的保證，只需要修改代碼中的CLK_IN這個宏定義即可； II、初始化語音識別一些參數(shù)，這參數(shù)主要包括設(shè)置語音檢測的靈敏度、起始語音的時間、背景噪音時間，靈敏度并不是越高越好，靈敏度越高誤觸發(fā)的可能性越大，因此要根據(jù) 實際環(huán)境設(shè)置一個合適的值。起始語音時間為當(dāng)芯片檢測到多長的語音時決策為一次真正的語音開始，背景噪音時間為當(dāng)芯片檢測到語音多久沒有輸入之后判斷為語音的結(jié)束。
[0005] III、面向微處理器通過拼音直接寫入非特定的識別短語，每一個識別短語都包含一個短語ID且對應(yīng)一項PC動作指令，對應(yīng)在PC機(jī)上虛擬成為一個人機(jī)接口鍵盤； IV、啟動語音識別，音頻采集器接收外部的非特定語音，由語音識別芯片LD3320識別語音并將識別結(jié)果向微處理器申請中斷，微控制器中斷讀取出識別結(jié)果并選定與短語ID 相對應(yīng)的PC動作指令、通過USB電纜向PC機(jī)輸出動作指令并由PC機(jī)響應(yīng)動作。
[0006] 進(jìn)一步地，所述微處理器為最高工作頻率達(dá)168MHz的MCU。
[0007] 進(jìn)一步地，所述語音識別芯片LD3320為內(nèi)置有非特定語音識別DSP算法的語音識別器。
[0008] 應(yīng)用本發(fā)明的非特定語音溝通系統(tǒng)，其顯著優(yōu)點體現(xiàn)為：無需通過鍵盤和鼠標(biāo)來完成計算機(jī)的控制和操作，只需通過人發(fā)出聲音命令來控制和操作計算機(jī)，該電路具有穩(wěn) 定性好、語音識別率高、抗噪聲干擾能力強(qiáng)、結(jié)構(gòu)簡單和使用方便等優(yōu)點，可以有效降低成本，并可廣泛應(yīng)用于服務(wù)機(jī)器人智能空間、智能家居和消費電子產(chǎn)品等多個領(lǐng)域。
【附圖說明】
[0009] 圖1是本發(fā)明的電路總框圖。
[0010] 圖2是本發(fā)明溝通系統(tǒng)中語音識別芯片LD3320的電路連接示意圖。
【具體實施方式】
[0011] 以下便結(jié)合實施例附圖，對本發(fā)明技術(shù)方案作進(jìn)一步的詳細(xì)說明，以使本發(fā)明創(chuàng) 新性、實用性更易于理解。
[0012] 本發(fā)明創(chuàng)新提出一種通過嵌入式非特定語音信號和電腦交互的溝通電路，該電路主要包括主控和語音識別兩大部分。如圖1所示從具體的結(jié)構(gòu)來看：其結(jié)構(gòu)由微處理器 STM32F407VG、語音識別芯片LD3320、USB電纜及其它看門狗等輔配電路組成，其中微處理器為CortexHM內(nèi)核的STM32F407VG主控芯片（下稱MCU)，并且移植μ COS-III操作系統(tǒng) 作為任務(wù)管理，移植了 USB作為HID標(biāo)準(zhǔn)設(shè)備，MCU選擇SPI與語音識別芯片LD3320通信。該MCU的最高工作頻率達(dá)168MHz，處理速度快；μ COS-III是micrium公司的第三代微控制器系統(tǒng)，它是一個全新的操作系統(tǒng)，在國內(nèi)外被廣泛應(yīng)用于各類產(chǎn)品，在主控芯片上移植 μ COS-III操作系統(tǒng)，作為任務(wù)的管理和調(diào)度。
[0013] 如圖2本發(fā)明溝通系統(tǒng)中語音識別芯片LD3320的電路連接示意圖所示，LD3320采用并行方式直接與MCU相接，一般采用IkQ電阻上拉，復(fù)位信號以及中斷返回信號與MCU 直接相連并采用3. 3kΩ的上拉電阻，輔助系統(tǒng)穩(wěn)定工作，LD3320和處理器采用同一個外部時鐘，圖下方為有源晶振，右上方為麥克風(fēng)和耳機(jī)的接口，右下方排針引出來連接到相應(yīng)管腳上。對LD3320來說，復(fù)位信號由MCU發(fā)出，而中斷信號由LD3320發(fā)出，MCU負(fù)責(zé)接收。語音識別芯片LD3320外接設(shè)有音頻播放器和音頻采集器且與微處理器SPI通信相連，USB電纜連接微處理器至PC機(jī)，語音識別芯片LD3320內(nèi)置有非特定語音識別的DSP算法，可以動態(tài)編輯識別條目列表，無需外掛其它輔助器件，單一芯片即可完成語音識別，并且直接支持 mp3數(shù)據(jù)的語音播放，語音識別芯片檢測語音輸入并對語音進(jìn)行識別，識別結(jié)果向MCU申請中斷，MCU中斷讀取出識別結(jié)果，并啟動相應(yīng)的識別任務(wù)，對PC機(jī)進(jìn)行相關(guān)的操作。
[0014] 上述語音溝通包括步驟： I、通用初始化，通用初始化就是語音識別以及語音播放都適用的初始化。LD3320內(nèi)部集成PLL，根據(jù)時鐘頻率正確配置PLL是語音識別ADC采樣和語音播放.DA輸出的保證，我們只需要修改代碼中的CLK_IN這個宏定義即可。
[0015] II、初始化語音識別一些參數(shù)，這參數(shù)主要包括設(shè)置語音檢測的靈敏度、起始語音的時間、背景噪音時間，靈敏度并不是越高越好，靈敏度越高誤觸發(fā)的可能性越大，因此要根據(jù)實際環(huán)境設(shè)置一個合適的值。起始語音時間為當(dāng)芯片檢測到多長的語音時決策為一次真正的語音開始，背景噪音時間為當(dāng)芯片檢測到語音多久沒有輸入之后判斷為語音的結(jié) 束。
[0016] III、面向微處理器通過拼音直接寫入非特定的識別短語，每一個識別短語都包含一個短語ID且對應(yīng)一項PC動作指令，對應(yīng)在PC機(jī)上虛擬成為一個人機(jī)接口鍵盤。
[0017] IV、啟動語音識別，音頻采集器接收外部的非特定語音，由語音識別芯片LD3320 識別語音并將識別結(jié)果向微處理器申請中斷，微控制器中斷讀取出識別結(jié)果并選定與短語 ID相對應(yīng)的PC動作指令、通過USB電纜向PC機(jī)輸出動作指令并由PC機(jī)響應(yīng)動作。
[0018] 通常情況下，每次識別只要重復(fù)步驟I至IV即可；如果系統(tǒng)持續(xù)工作在語音識別功能且沒有復(fù)位，那么只需要每次啟動識別時只執(zhí)行一次步驟IV即可，從而可以節(jié)省時間，提高語音識別的響應(yīng)速度。
[0019] 以下從本發(fā)明溝通系統(tǒng)在實際各種場合下的溝通實驗來進(jìn)一步了解本技術(shù)方案的實際優(yōu)異效果。在家庭(安靜環(huán)境）和商場(吵鬧環(huán)境）等兩個不同噪音背景的環(huán)境下，通過按以上方案架構(gòu)連接而成的溝通電路，并對該溝通電路在步驟II中設(shè)置合理的語音檢測靈敏度、語音起始時間、背景噪音時間等參數(shù)后，即可進(jìn)行面向PC機(jī)的嵌入式非特定語音溝通。讓大人和小孩根據(jù)預(yù)設(shè)的語音指令對該溝通電路發(fā)出聲控，觀察并記錄PC機(jī)的實際運作情況（這邊次數(shù)設(shè)為15次），結(jié)果整理如下表所示(識別率為識別次數(shù)與總次數(shù)之比)：
【主權(quán)項】
1. 一種面向PC的嵌入式非特定語音溝通系統(tǒng)，其特征在于：所述溝通系統(tǒng)由微處理器、語音識別芯片LD3320、USB電纜和輔配電路組成，其中所述微處理器為Cortex-M4內(nèi)核的STM32F407VG主控芯片且移植有y C/OS-III操作系統(tǒng)，所述語音識別芯片LD3320外接設(shè)有音頻播放器和音頻采集器且與微處理器SPI通信相連，所述USB電纜連接微處理器至 PC機(jī)，且語音溝通包括步驟：
1. 對語音識別芯片LD3320進(jìn)行語音識別及語音播放的通用初始化，語音識別芯片 LD3320內(nèi)部集成PLL，根據(jù)時鐘頻率通過修改代碼中的CLK_IN這個宏定義正確配置PLL以保證語音識別ADC采樣和語音播放.DA輸出； II、初始化語音識別的參數(shù)，所述參數(shù)包括語音檢測的靈敏度、判斷語音開始的起始語音時間和判斷語音結(jié)束的背景噪音時間； III、面向微處理器通過拼音直接寫入非特定的識別短語，每一個識別短語都包含一個短語ID且對應(yīng)一項PC動作指令，對應(yīng)在PC機(jī)上虛擬成為一個人機(jī)接口鍵盤； IV、啟動語音識別，音頻采集器接收外部的非特定語音，由語音識別芯片LD3320識別語音并將識別結(jié)果向微處理器申請中斷，微控制器中斷讀取出識別結(jié)果并選定與短語ID 相對應(yīng)的PC動作指令、通過USB電纜向PC機(jī)輸出動作指令并由PC機(jī)響應(yīng)動作。
2. 根據(jù)權(quán)利要求1所述面向PC的嵌入式非特定語音溝通系統(tǒng)，其特征在于：所述微處理器為最高工作頻率達(dá)168MHz的MCU。
3. 根據(jù)權(quán)利要求1所述面向PC的嵌入式非特定語音溝通系統(tǒng)，其特征在于：所述語音識別芯片LD3320為內(nèi)置有非特定語音識別DSP算法的語音識別器。
【專利摘要】本發(fā)明揭示了一種嵌入式非特定語音信號和電腦溝通電路的設(shè)計，其組成包括微處理器STM32F407VG，語音識別芯片LD3320，USB電纜等。整個系統(tǒng)使用的是Cortex-M4內(nèi)核的STM32F407VG作為主控芯片，并且移植μC/OS-III操作系統(tǒng)作為任務(wù)管理，移植了USB電纜作為人機(jī)接口標(biāo)準(zhǔn)設(shè)備，語音識別芯片外接設(shè)有音頻播放器和音頻采集器且與微處理器SPI通信相連，且USB電纜連接微處理器至PC機(jī)。本發(fā)明方案的提出，無需通過鍵盤和鼠標(biāo)來完成計算機(jī)的控制和操作，只需通過人發(fā)出聲音命令來控制和操作計算機(jī)，該電路具有穩(wěn)定性好、語音識別率高、抗噪聲干擾能力強(qiáng)、結(jié)構(gòu)簡單和使用方便等優(yōu)點，可以有效降低成本，并可廣泛應(yīng)用于服務(wù)機(jī)器人智能空間、智能家居和消費電子產(chǎn)品等多個領(lǐng)域。
【IPC分類】G10L15-22, G06F3-16
【公開號】CN104657104
【申請?zhí)枴緾N201510030838
【發(fā)明人】吳振英
【申請人】蘇州工業(yè)職業(yè)技術(shù)學(xué)院
【公開日】2015年5月27日
【申請日】2015年1月22日

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：吳振英;
技術(shù)所有人：蘇州工業(yè)職業(yè)技術(shù)學(xué)院;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

嵌入式語音識別相關(guān)技術(shù)

嵌入式語音識別軟件相關(guān)技術(shù)

嵌入式語音識別系統(tǒng)相關(guān)技術(shù)

嵌入式程序開發(fā)相關(guān)技術(shù)

嵌入式相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種面向pc的嵌入式非特定語音溝通系統(tǒng)的制作方法