亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種面向pc的嵌入式非特定語音溝通系統(tǒng)的制作方法

文檔序號:8339353閱讀:419來源:國知局
一種面向pc的嵌入式非特定語音溝通系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種非特定語音信號識別電路,具體地說是涉及一種通過嵌入式非特 定語音信號和電腦溝通的電路系統(tǒng)。
【背景技術(shù)】
[0002] 嵌入式技術(shù)作為21世紀(jì)智能時代的核心技術(shù),越來越多的在科技和生活領(lǐng)域發(fā) 揮了支柱性作用。目前,計算機(jī)的控制是通過鍵盤和鼠標(biāo)來完成,隨著科技的不斷發(fā)展,人 們需要一種更方便、更自然、更加人性化的方式與計算機(jī)進(jìn)行交互。語音識別技術(shù)是信息
技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一,它是一門交叉學(xué)科,正逐步成為信息技術(shù)中人機(jī) 交互的關(guān)鍵技術(shù),它的應(yīng)用已經(jīng)成為一個具有競爭性的新興高技術(shù)產(chǎn)業(yè)。目前主流的語音 識別技術(shù)是基于統(tǒng)計模式識別的基本理論,而統(tǒng)計模型訓(xùn)練由于算法復(fù)雜,運算量大,功耗 高,成本高等缺點,在實際應(yīng)用中限制了它的運用。而嵌入式語音人機(jī)交互由于其實時性 好,穩(wěn)定性高等許多優(yōu)點已成為目前研宄的熱門課題,但尚無比較成熟,設(shè)計復(fù)雜程度低、 功耗較小的可實施性方案問世。

【發(fā)明內(nèi)容】

[0003] 鑒于上述現(xiàn)有技術(shù)的不足,本發(fā)明的目的是提出一種面向PC的嵌入式非特定語 音溝通系統(tǒng),以簡單的電路設(shè)計、識別率高、實時性高、穩(wěn)定性好等特點提出PC語音交互的 技術(shù)解決方案。
[0004] 本發(fā)明的上述目的,其得以實現(xiàn)的技術(shù)解決方案是:一種面向PC的嵌入式非特 定語音溝通系統(tǒng),其特征在于:所述溝通系統(tǒng)由微處理器、語音識別芯片LD3320、USB電纜 和輔配電路組成,其中所述微處理器為Cortex-M4內(nèi)核的STM32F407VG主控芯片且移植有 yC/OS-III操作系統(tǒng),所述語音識別芯片LD3320外接設(shè)有音頻播放器和音頻采集器且與 微處理器SPI通信相連,所述USB電纜連接微處理器至PC機(jī),且語音溝通包括步驟: I、 通用初始化,通用初始化就是語音識別以及語音播放都適用的初始化。LD3320內(nèi)部 集成PLL,根據(jù)時鐘頻率正確配置PLL是語音識別ADC采樣和語音播放.DA輸出的保證,只 需要修改代碼中的CLK_IN這個宏定義即可; II、 初始化語音識別一些參數(shù),這參數(shù)主要包括設(shè)置語音檢測的靈敏度、起始語音的時 間、背景噪音時間,靈敏度并不是越高越好,靈敏度越高誤觸發(fā)的可能性越大,因此要根據(jù) 實際環(huán)境設(shè)置一個合適的值。起始語音時間為當(dāng)芯片檢測到多長的語音時決策為一次真正 的語音開始,背景噪音時間為當(dāng)芯片檢測到語音多久沒有輸入之后判斷為語音的結(jié)束。
[0005] III、面向微處理器通過拼音直接寫入非特定的識別短語,每一個識別短語都包含 一個短語ID且對應(yīng)一項PC動作指令,對應(yīng)在PC機(jī)上虛擬成為一個人機(jī)接口鍵盤; IV、啟動語音識別,音頻采集器接收外部的非特定語音,由語音識別芯片LD3320識別 語音并將識別結(jié)果向微處理器申請中斷,微控制器中斷讀取出識別結(jié)果并選定與短語ID 相對應(yīng)的PC動作指令、通過USB電纜向PC機(jī)輸出動作指令并由PC機(jī)響應(yīng)動作。
[0006] 進(jìn)一步地,所述微處理器為最高工作頻率達(dá)168MHz的MCU。
[0007] 進(jìn)一步地,所述語音識別芯片LD3320為內(nèi)置有非特定語音識別DSP算法的語音識 別器。
[0008] 應(yīng)用本發(fā)明的非特定語音溝通系統(tǒng),其顯著優(yōu)點體現(xiàn)為:無需通過鍵盤和鼠標(biāo)來 完成計算機(jī)的控制和操作,只需通過人發(fā)出聲音命令來控制和操作計算機(jī),該電路具有穩(wěn) 定性好、語音識別率高、抗噪聲干擾能力強(qiáng)、結(jié)構(gòu)簡單和使用方便等優(yōu)點,可以有效降低成 本,并可廣泛應(yīng)用于服務(wù)機(jī)器人智能空間、智能家居和消費電子產(chǎn)品等多個領(lǐng)域。
【附圖說明】
[0009] 圖1是本發(fā)明的電路總框圖。
[0010] 圖2是本發(fā)明溝通系統(tǒng)中語音識別芯片LD3320的電路連接示意圖。
【具體實施方式】
[0011] 以下便結(jié)合實施例附圖,對本發(fā)明技術(shù)方案作進(jìn)一步的詳細(xì)說明,以使本發(fā)明創(chuàng) 新性、實用性更易于理解。
[0012] 本發(fā)明創(chuàng)新提出一種通過嵌入式非特定語音信號和電腦交互的溝通電路,該電路 主要包括主控和語音識別兩大部分。如圖1所示從具體的結(jié)構(gòu)來看:其結(jié)構(gòu)由微處理器 STM32F407VG、語音識別芯片LD3320、USB電纜及其它看門狗等輔配電路組成,其中微處理 器為CortexHM內(nèi)核的STM32F407VG主控芯片(下稱MCU),并且移植μ COS-III操作系統(tǒng) 作為任務(wù)管理,移植了 USB作為HID標(biāo)準(zhǔn)設(shè)備,MCU選擇SPI與語音識別芯片LD3320通信。 該MCU的最高工作頻率達(dá)168MHz,處理速度快;μ COS-III是micrium公司的第三代微控 制器系統(tǒng),它是一個全新的操作系統(tǒng),在國內(nèi)外被廣泛應(yīng)用于各類產(chǎn)品,在主控芯片上移植 μ COS-III操作系統(tǒng),作為任務(wù)的管理和調(diào)度。
[0013] 如圖2本發(fā)明溝通系統(tǒng)中語音識別芯片LD3320的電路連接示意圖所示,LD3320采 用并行方式直接與MCU相接,一般采用IkQ電阻上拉,復(fù)位信號以及中斷返回信號與MCU 直接相連并采用3. 3kΩ的上拉電阻,輔助系統(tǒng)穩(wěn)定工作,LD3320和處理器采用同一個外部 時鐘,圖下方為有源晶振,右上方為麥克風(fēng)和耳機(jī)的接口,右下方排針引出來連接到相應(yīng)管 腳上。對LD3320來說,復(fù)位信號由MCU發(fā)出,而中斷信號由LD3320發(fā)出,MCU負(fù)責(zé)接收。語 音識別芯片LD3320外接設(shè)有音頻播放器和音頻采集器且與微處理器SPI通信相連,USB電 纜連接微處理器至PC機(jī),語音識別芯片LD3320內(nèi)置有非特定語音識別的DSP算法,可以動 態(tài)編輯識別條目列表,無需外掛其它輔助器件,單一芯片即可完成語音識別,并且直接支持 mp3數(shù)據(jù)的語音播放,語音識別芯片檢測語音輸入并對語音進(jìn)行識別,識別結(jié)果向MCU申請 中斷,MCU中斷讀取出識別結(jié)果,并啟動相應(yīng)的識別任務(wù),對PC機(jī)進(jìn)行相關(guān)的操作。
[0014] 上述語音溝通包括步驟: I、通用初始化,通用初始化就是語音識別以及語音播放都適用的初始化。LD3320內(nèi)部 集成PLL,根據(jù)時鐘頻率正確配置PLL是語音識別ADC采樣和語音播放.DA輸出的保證,我 們只需要修改代碼中的CLK_IN這個宏定義即可。
[0015] II、初始化語音識別一些參數(shù),這參數(shù)主要包括設(shè)置語音檢測的靈敏度、起始語音 的時間、背景噪音時間,靈敏度并不是越高越好,靈敏度越高誤觸發(fā)的可能性越大,因此要 根據(jù)實際環(huán)境設(shè)置一個合適的值。起始語音時間為當(dāng)芯片檢測到多長的語音時決策為一 次真正的語音開始,背景噪音時間為當(dāng)芯片檢測到語音多久沒有輸入之后判斷為語音的結(jié) 束。
[0016] III、面向微處理器通過拼音直接寫入非特定的識別短語,每一個識別短語都包含 一個短語ID且對應(yīng)一項PC動作指令,對應(yīng)在PC機(jī)上虛擬成為一個人機(jī)接口鍵盤。
[0017] IV、啟動語音識別,音頻采集器接收外部的非特定語音,由語音識別芯片LD3320 識別語音并將識別結(jié)果向微處理器申請中斷,微控制器中斷讀取出識別結(jié)果并選定與短語 ID相對應(yīng)的PC動作指令、通過USB電纜向PC機(jī)輸出動作指令并由PC機(jī)響應(yīng)動作。
[0018] 通常情況下,每次識別只要重復(fù)步驟I至IV即可;如果系統(tǒng)持續(xù)工作在語音識別 功能且沒有復(fù)位,那么只需要每次啟動識別時只執(zhí)行一次步驟IV即可,從而可以節(jié)省時間, 提高語音識別的響應(yīng)速度。
[0019] 以下從本發(fā)明溝通系統(tǒng)在實際各種場合下的溝通實驗來進(jìn)一步了解本技術(shù)方案 的實際優(yōu)異效果。在家庭(安靜環(huán)境)和商場(吵鬧環(huán)境)等兩個不同噪音背景的環(huán)境下,通 過按以上方案架構(gòu)連接而成的溝通電路,并對該溝通電路在步驟II中設(shè)置合理的語音檢測 靈敏度、語音起始時間、背景噪音時間等參數(shù)后,即可進(jìn)行面向PC機(jī)的嵌入式非特定語音 溝通。讓大人和小孩根據(jù)預(yù)設(shè)的語音指令對該溝通電路發(fā)出聲控,觀察并記錄PC機(jī)的實際 運作情況(這邊次數(shù)設(shè)為15次),結(jié)果整理如下表所示(識別率為識別次數(shù)與總次數(shù)之比):
【主權(quán)項】
1. 一種面向PC的嵌入式非特定語音溝通系統(tǒng),其特征在于:所述溝通系統(tǒng)由微處理 器、語音識別芯片LD3320、USB電纜和輔配電路組成,其中所述微處理器為Cortex-M4內(nèi)核 的STM32F407VG主控芯片且移植有y C/OS-III操作系統(tǒng),所述語音識別芯片LD3320外接 設(shè)有音頻播放器和音頻采集器且與微處理器SPI通信相連,所述USB電纜連接微處理器至 PC機(jī),且語音溝通包括步驟:
1. 對語音識別芯片LD3320進(jìn)行語音識別及語音播放的通用初始化,語音識別芯片 LD3320內(nèi)部集成PLL,根據(jù)時鐘頻率通過修改代碼中的CLK_IN這個宏定義正確配置PLL以 保證語音識別ADC采樣和語音播放.DA輸出; II、 初始化語音識別的參數(shù),所述參數(shù)包括語音檢測的靈敏度、判斷語音開始的起始語 音時間和判斷語音結(jié)束的背景噪音時間; III、 面向微處理器通過拼音直接寫入非特定的識別短語,每一個識別短語都包含一個 短語ID且對應(yīng)一項PC動作指令,對應(yīng)在PC機(jī)上虛擬成為一個人機(jī)接口鍵盤; IV、 啟動語音識別,音頻采集器接收外部的非特定語音,由語音識別芯片LD3320識別 語音并將識別結(jié)果向微處理器申請中斷,微控制器中斷讀取出識別結(jié)果并選定與短語ID 相對應(yīng)的PC動作指令、通過USB電纜向PC機(jī)輸出動作指令并由PC機(jī)響應(yīng)動作。
2. 根據(jù)權(quán)利要求1所述面向PC的嵌入式非特定語音溝通系統(tǒng),其特征在于:所述微處 理器為最高工作頻率達(dá)168MHz的MCU。
3. 根據(jù)權(quán)利要求1所述面向PC的嵌入式非特定語音溝通系統(tǒng),其特征在于:所述語音 識別芯片LD3320為內(nèi)置有非特定語音識別DSP算法的語音識別器。
【專利摘要】本發(fā)明揭示了一種嵌入式非特定語音信號和電腦溝通電路的設(shè)計,其組成包括微處理器STM32F407VG,語音識別芯片LD3320,USB電纜等。整個系統(tǒng)使用的是Cortex-M4內(nèi)核的STM32F407VG作為主控芯片,并且移植μC/OS-III操作系統(tǒng)作為任務(wù)管理,移植了USB電纜作為人機(jī)接口標(biāo)準(zhǔn)設(shè)備,語音識別芯片外接設(shè)有音頻播放器和音頻采集器且與微處理器SPI通信相連,且USB電纜連接微處理器至PC機(jī)。本發(fā)明方案的提出,無需通過鍵盤和鼠標(biāo)來完成計算機(jī)的控制和操作,只需通過人發(fā)出聲音命令來控制和操作計算機(jī),該電路具有穩(wěn)定性好、語音識別率高、抗噪聲干擾能力強(qiáng)、結(jié)構(gòu)簡單和使用方便等優(yōu)點,可以有效降低成本,并可廣泛應(yīng)用于服務(wù)機(jī)器人智能空間、智能家居和消費電子產(chǎn)品等多個領(lǐng)域。
【IPC分類】G10L15-22, G06F3-16
【公開號】CN104657104
【申請?zhí)枴緾N201510030838
【發(fā)明人】吳振英
【申請人】蘇州工業(yè)職業(yè)技術(shù)學(xué)院
【公開日】2015年5月27日
【申請日】2015年1月22日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1