專利名稱:一種語音識別門禁系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字家庭智能家居技術(shù)領(lǐng)域,具體涉及一種語音識別門禁系統(tǒng)。
背景技術(shù):
出入口門禁安全管理系統(tǒng)是新型現(xiàn)代化安全管理系統(tǒng),它集微機(jī)自動(dòng)識別技術(shù)和 現(xiàn)代安全管理措施為一體,它涉及電子,機(jī)械,光學(xué),計(jì)算機(jī)技術(shù),通訊技術(shù),生物技術(shù)等諸 多新技術(shù)。它是解決重要部門出入口實(shí)現(xiàn)安全防范管理的有效措施。適用各種機(jī)要部門, 如銀行、賓館、機(jī)房、軍械庫、機(jī)要室、辦公間,智能化小區(qū),工廠等。在數(shù)字技術(shù)網(wǎng)絡(luò)技術(shù)飛速發(fā)展的今天門禁技術(shù)得到了迅猛的發(fā)展。門禁系統(tǒng)早已 超越了單純的門道及鑰匙管理,它已經(jīng)逐漸發(fā)展成為一套完整的出入管理系統(tǒng)。它在工作 環(huán)境安全、人事考勤管理等行政管理工作中發(fā)揮著巨大的作用。隨著科技的不斷進(jìn)步,語音識別技術(shù)逐漸的出現(xiàn)在我們的生活之中,如手機(jī)、個(gè)人 電腦。智能家居發(fā)展的一個(gè)重要方面是讓用戶交互界面更加人性化,更加方便自然,做到老 年人和殘疾人可以無障礙地使用。目前,門禁系統(tǒng)采用較多的是非接觸式RF卡IC卡密碼輸入等方式隨著科學(xué)技術(shù) 的發(fā)展,生物識別技術(shù)日趨成熟,如語音識別指紋識別虹膜識別紅外識別等技術(shù)逐步成為 門禁系統(tǒng)發(fā)展的主流技術(shù)。其中語音識別技術(shù)是一種非接觸性識別技術(shù),具有方便、安全、 準(zhǔn)確、反應(yīng)速度快等優(yōu)點(diǎn),具有較好的發(fā)展前景。本發(fā)明就是利用語音識別技術(shù),使得門禁 系統(tǒng)的使用更加方便。對此,提出一種可得到更方便、安全,可靠的門禁管理方案。
發(fā)明內(nèi)容
本發(fā)明的目的在于彌補(bǔ)現(xiàn)有技術(shù)的不足,提供一種對人聲進(jìn)行特征提取、對比、識 別和確認(rèn),利用語音識別技術(shù)進(jìn)行安全、準(zhǔn)確、可靠的身份認(rèn)證的一種語音識別門禁系統(tǒng)。本發(fā)明的采用基本原理是語音識別應(yīng)用方向可分為特定人識別和非特定人識 別。特定人識別的聲學(xué)模型是針對某一特定用戶訓(xùn)練的。一般來說用戶需要先訓(xùn)練系統(tǒng), 然后才能識別該用戶的發(fā)音。門禁系統(tǒng)由于是針對特定人員擁有開啟和關(guān)閉的權(quán)限,所以 屬于特定人語音識別范疇。為了實(shí)現(xiàn)本發(fā)明目的,本發(fā)明所采用的技術(shù)方案如下本發(fā)明一種語音識別門禁系統(tǒng),包括(1)用于語音采集、語音輸出的聲音輸入輸出系統(tǒng),包括負(fù)責(zé)接收用戶的聲音,然后傳輸?shù)秸Z音信號處理系統(tǒng)進(jìn)行后續(xù)處理的麥克風(fēng);用于輸出問答問題及告知用戶識別結(jié)果的喇叭;(2)用于處理語音信號的語音信號處理系統(tǒng),包括預(yù)處理模塊還包括A/D數(shù)模轉(zhuǎn)換模塊,分幀加窗模塊以及信號預(yù)加重模塊。所述A/D數(shù)模轉(zhuǎn)換模塊麥克風(fēng)采集到的信號是模擬信號,模擬信號不利DSP芯片進(jìn)行處理,所以首先在這里實(shí)現(xiàn)數(shù)模轉(zhuǎn)換,把模擬信號轉(zhuǎn)換成數(shù)字信號;所述信號預(yù)加重模塊是提升信號的高頻部分,使信號的頻譜變得平坦,以保持信 號在整個(gè)頻帶內(nèi)具有同樣的信噪比,便于聲道參數(shù)分析;所述分幀加窗模塊是在對語音信號進(jìn)行分析和處理之前先將語音段分割成若干 短的時(shí)間段,以保證每一個(gè)短的時(shí)間段內(nèi)語音信號可近似看作具有固定特性的連續(xù)語音片 段。話語端點(diǎn)檢測模塊,語音信號的端點(diǎn)檢測是進(jìn)行特征訓(xùn)練和識別的基礎(chǔ),一般采 集到的語音信號都摻雜無聲段和短時(shí)噪聲等無用的信息,造成語音的數(shù)據(jù)量非常大,為了 從語音波形中提取出反映語音特征的參數(shù),須采用端點(diǎn)檢測的方法來確定一段語音信號的 起點(diǎn)和終點(diǎn)。特征向量提取模塊,首先,原始的語音信號不能直接用于模版訓(xùn)練和模式匹配,這 是因?yàn)樵夹盘柕臄?shù)據(jù)量太大,系統(tǒng)的運(yùn)算和存儲負(fù)擔(dān)過重;其次,原始語音信號包含太多 的隨機(jī)因素,極大地影響了系統(tǒng)的識別率。特征提取就是對語音信號進(jìn)行分析處理,去除對 語音識別無關(guān)緊要的冗余信息,提取出對語音識別有用的信息。模式匹配模塊,將待識別的語音經(jīng)預(yù)處理以及特征提取以后得到的特征矢量序列 稱之為測試模版,將特征模版庫中的各個(gè)模版稱之為參考模版,計(jì)算測試模版和參考模版 之間的相似度,然后得出識別結(jié)果。(3)用于對識別結(jié)果進(jìn)行處理的識別結(jié)果處理系統(tǒng),包括用于執(zhí)行語音信號處理系統(tǒng)的命令的開關(guān)電路。用于控制門鎖的控制電機(jī),控制著門鎖的開合。門鎖,本門禁系統(tǒng)的主要部分。本發(fā)明具有以下有益結(jié)果(1)在日常生活及工作環(huán)境中,通過聲音識別進(jìn)行門禁身份驗(yàn)證,相比鑰匙,感應(yīng) 卡,密碼等方式,有無需攜帶,方便高效等特點(diǎn)。(2)通過語音識別進(jìn)行門禁身份識別驗(yàn)證,相比人臉識別技術(shù),系統(tǒng)運(yùn)算量更少, 節(jié)省了系統(tǒng)的功耗,并且對系統(tǒng)的內(nèi)存等硬件要求更低。
圖1是本發(fā)明的系統(tǒng)結(jié)構(gòu)示意圖;圖2是本發(fā)明的語音識別系統(tǒng)原理圖;圖3是本發(fā)明的用戶使用流程圖。
具體實(shí)施例方式下面結(jié)合附圖對本發(fā)明做進(jìn)一步的說明。下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明系統(tǒng)結(jié)構(gòu)示意圖如附圖1所示,由聲音輸入輸出系統(tǒng)語音信號處理系統(tǒng),開關(guān)電路,控制電機(jī),門鎖組成。本實(shí)施例的語音識別門禁系統(tǒng)包括以下組件(1)用于語音采集,語音輸出的聲音輸入輸出系統(tǒng),包括麥克風(fēng),是負(fù)責(zé)接收用戶的聲音,然后傳輸?shù)秸Z音信號處理系統(tǒng)進(jìn)行后續(xù)處理。喇叭,用于輸出問答問題,以及告知用戶識別結(jié)果。(2)用于處理語音信號的語音信號處理系統(tǒng),包括預(yù)處理模塊,主要有以下功能:A/D數(shù)模轉(zhuǎn)換,麥克風(fēng)采集到的信號是模擬信號, 模擬信號不利處用DSP芯片進(jìn)行處理,所以首先在這里實(shí)現(xiàn)數(shù)模轉(zhuǎn)換,把模擬信號轉(zhuǎn)換成 數(shù)字信號。信號的預(yù)加重,預(yù)加重的目的是提升信號的高頻部分,使信號的頻譜變得平坦, 以保持信號在整個(gè)頻帶內(nèi)具有同樣的信噪比,便于聲道參數(shù)分析。分幀加窗,在對語音信號 進(jìn)行分析和處理之前先將語音段分割成若干短的時(shí)間段,以保證每一個(gè)短的時(shí)間段內(nèi)語音 信號可近似看作具有固定特性的連續(xù)語音片段。話語端點(diǎn)檢測模塊,語音信號的端點(diǎn)檢測是進(jìn)行特征訓(xùn)練和識別的基礎(chǔ),一般采 集到的語音信號都摻雜無聲段和短時(shí)噪聲等無用的信息,造成語音的數(shù)據(jù)量非常大,為了 從語音波形中提取出反映語音特征的參數(shù),須采用端點(diǎn)檢測的方法來確定一段語音信號的 起點(diǎn)和終點(diǎn)。特征向量提取模塊,首先,原始的語音信號不能直接用于模版訓(xùn)練和模式匹配,這 是因?yàn)樵夹盘柕臄?shù)據(jù)量太大,系統(tǒng)的運(yùn)算和存儲負(fù)擔(dān)過重;其次,原始語音信號包含太多 的隨機(jī)因素,極大地影響了系統(tǒng)的識別率。特征提取就是對語音信號進(jìn)行分析處理,去除對 語音識別無關(guān)緊要的冗余信息,提取出對語音識別有用的信息。模式匹配模塊,將待識別的語音經(jīng)預(yù)處理以及特征提取以后得到的特征矢量序列 稱之為測試模版,將特征模版庫中的各個(gè)模版稱之為參考模版,計(jì)算測試模版和參考模版 之間的相似度,然后得出識別結(jié)果。(3)用于對識別結(jié)果進(jìn)行處理的識別結(jié)果處理系統(tǒng),包括用于執(zhí)行語音信號處理系統(tǒng)的命令的開關(guān)電路。用于控制門鎖的控制電機(jī),控制著門鎖的開合。門鎖,本門禁系統(tǒng)的主要部分。所述的語音識別系統(tǒng)原理圖如圖2所示,識別過程分為兩個(gè)步驟第一步是系統(tǒng) 的學(xué)習(xí)階段,這一階段的任務(wù)是建立識別單位的聲學(xué)模型;第二步是測試階段,根據(jù)識別系 統(tǒng)的類型選擇能夠滿足要求的一種識別方法,采用語音分析方法提出這種識別方法要求的 特征參數(shù),按照一定準(zhǔn)則與系統(tǒng)模型進(jìn)行比較,通過判決得出識別結(jié)果。具體步驟如下A/D數(shù)模轉(zhuǎn)換采樣人說話的信號頻率范圍主要集中在300Hz 3000Hz,語音信號 通過輸入設(shè)備轉(zhuǎn)化成電信號后,需要設(shè)計(jì)一個(gè)帶通濾波器以便濾掉語音信號頻率以外的干 擾由A/D采樣裝置根據(jù)Nyquist采樣定理,以不小于語音信號頻譜帶寬2倍的采樣頻率進(jìn) 行采樣。預(yù)加重,目的是提升信號的高頻部分,使信號的頻譜變得平坦,以保持信號在整個(gè) 頻帶內(nèi)具有同樣的信噪比,便于聲道參數(shù)分析通常是用一階數(shù)字濾波器來實(shí)現(xiàn)。分幀加窗,在對語音信號進(jìn)行分析和處理之前先將語音段分割成若干短的時(shí)間 段,以保證每一個(gè)短的時(shí)間段內(nèi)語音信號可近似看作具有固定特性的連續(xù)語音片段這樣一 個(gè)短的時(shí)間段稱為一幀,對每一幀進(jìn)行處理也就等效于對固定特性的一段連續(xù)語音進(jìn)行處理將語音信號分成若干幀的常用手段是對語音信號進(jìn)行加窗處理,即用一個(gè)有限長度的窗函數(shù)截取一段語音信號來進(jìn)行分析在語音信號的數(shù)字處理中常用的是矩形窗和漢明窗。端點(diǎn)檢測,語音信號的端點(diǎn)檢測是進(jìn)行特征訓(xùn)練和識別的基礎(chǔ),一般采集到的語 音信號都摻雜無聲段和短時(shí)噪聲等無用的信息,造成語音的數(shù)據(jù)量非常大,為了從語音波 形中提取出反映語音特征的參數(shù),須采用端點(diǎn)檢測的方法來確定一段語音信號的起點(diǎn)和終 點(diǎn)端點(diǎn)監(jiān)測涉及的信息包括短時(shí)能量過零碎。特征向量提取,本系統(tǒng)采用了不同說話人的分散程度與各說話人自身的分散程度 之間的對比值作為特征參數(shù)的評價(jià)方法。對單個(gè)參數(shù)而言,可以取兩種分布參數(shù)的方差比 (稱為F比)作為有效的度量準(zhǔn)則。F比反映了不同說話人的分散程度與各說話人自身的 分散程度之間的對比關(guān)系。模式匹配,說話人對同一個(gè)詞的兩個(gè)發(fā)音不可能完全相同,這些差異不僅包括音 強(qiáng)的大小頻譜的偏移,更重要的是發(fā)音時(shí)音節(jié)的長短就不可能完全相同,而且兩次發(fā)音的 音節(jié)往往不存在線性的對應(yīng)關(guān)系,在語音識別過程中,用戶進(jìn)行訓(xùn)練或者識別時(shí),即使每次 盡量以同樣的方式說同一個(gè)詞匯,其持續(xù)時(shí)間的長度也會(huì)隨機(jī)改變,因此,如果直接用特征 矢量參數(shù)序列的模式來進(jìn)行相似性的比較,其效果不是最佳的,需要對特征參數(shù)序列重新 進(jìn)行時(shí)間的校準(zhǔn),采用動(dòng)態(tài)時(shí)間規(guī)整(DTW)方法可以有效地解決這個(gè)問題。為了進(jìn)行相似 度測量,將特征模版庫中的各個(gè)模版稱之為參考模版,用R來表示;將待識別的語音經(jīng)預(yù)處 理以及特征提取以后得到的特征矢量序列稱之為測試模版,用T表示。計(jì)算測試模版和參 考模版之間的相似度,可以計(jì)算它們之間的失真,失真度越小相似性越高測試模版和參考 模版之間的總體失真表示為D(T,R)
權(quán)利要求
1.一種語音識別門禁系統(tǒng),其特征在于包括 用于語音采集、語音輸出的聲音輸入輸出系統(tǒng); 用于處理語音信號的語音信號處理系統(tǒng); 用于對識別結(jié)果進(jìn)行處理的識別結(jié)果處理系統(tǒng)。
2.根據(jù)權(quán)利要求1所述的語音識別門禁系統(tǒng),其特征在于所述的聲音輸入輸出系統(tǒng)還 包括負(fù)責(zé)接收用戶的聲音,然后傳輸?shù)秸Z音信號處理系統(tǒng)進(jìn)行后續(xù)處理的麥克風(fēng); 用于輸出問答問題及告知用戶識別結(jié)果的喇叭。
3.根據(jù)權(quán)利要求1所述的語音識別門禁系統(tǒng),其特征在于所述的語音信號處理系統(tǒng)還 包括預(yù)處理模塊,話語端點(diǎn)檢測模塊、特征向量提取模塊、模式匹配模塊。
4.根據(jù)權(quán)利要求3所述的語音識別門禁系統(tǒng),其特征在于所述預(yù)處理還包括數(shù)模轉(zhuǎn)換 模塊,信號預(yù)加重模塊及分幀加窗模塊。
5.根據(jù)權(quán)利要求1所述的語音識別門禁系統(tǒng),其特征在于所述的識別結(jié)果處理系統(tǒng)包括用于執(zhí)行語音信號處理系統(tǒng)的命令的開關(guān)電路; 用于控制著門鎖的開合的控制電機(jī); 以及門鎖。
全文摘要
本發(fā)明提供了一種語音識別門禁系統(tǒng),屬于智能家居技術(shù)領(lǐng)域。包括用于語音采集、語音輸出的聲音輸入輸出系統(tǒng);用于處理語音信號的語音信號處理系統(tǒng);用于對識別結(jié)果進(jìn)行處理的識別結(jié)果處理系統(tǒng)。通過各系統(tǒng)之間的協(xié)作,本發(fā)明實(shí)現(xiàn)了門禁控制更加方便、高效,安全。
文檔編號G07C9/00GK102005070SQ20101054990
公開日2011年4月6日 申請日期2010年11月17日 優(yōu)先權(quán)日2010年11月17日
發(fā)明者劉寧, 劉廣發(fā), 羅笑南, 薛凱軍, 陳健民 申請人:東莞市聚川電子科技有限公司, 廣東中大訊通信息有限公司