專(zhuān)利名稱(chēng):一種語(yǔ)音識(shí)別的智能門(mén)控系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù),更具體地講,涉及ー種基于語(yǔ)音識(shí)別的智能門(mén)控系統(tǒng)。
背景技術(shù):
出入口門(mén)禁安全管理系統(tǒng)是新型現(xiàn)代化安全管理系統(tǒng),它集微機(jī)自動(dòng)識(shí)別技術(shù)和現(xiàn)代安全管理措施為一體,它涉及電子,機(jī)械,光學(xué),計(jì)算機(jī)技木,通訊技木,生物技術(shù)等諸多新技術(shù)。它是解決重要部門(mén)出入口實(shí)現(xiàn)安全防范管理的有效措施。適用各種機(jī)要部門(mén),如銀行、賓館、機(jī)房、軍械庫(kù)、機(jī)要室、辦公間,智能化小區(qū),エ廠等。在數(shù)字技術(shù)網(wǎng)絡(luò)技術(shù)飛速發(fā)展的今天門(mén)禁技術(shù)得到了迅猛的發(fā)展。門(mén)禁系統(tǒng)早已超越了單純的門(mén)道及鑰匙管理,它已經(jīng)逐漸發(fā)展成為ー套完整的出入管理系統(tǒng)。它在工作環(huán)境安全、人事考勤管理等行政管理工作中發(fā)揮著巨大的作用。隨著科技的不斷進(jìn)步,語(yǔ)音識(shí)別技術(shù)逐漸的出現(xiàn)在我們的生活之中,如手機(jī)、個(gè)人電腦。智能家居發(fā)展的ー個(gè)重要方面是讓用戶(hù)交互界面更加人性化,更加方便自然,做到老年人和殘疾人可以無(wú)障礙地使用。
目前,門(mén)禁系統(tǒng)采用較多的是非接觸式RF卡エC卡密碼輸入等方式隨著科學(xué)技術(shù)的發(fā)展,生物識(shí)別技術(shù)日趨成熟,如語(yǔ)音識(shí)別指紋識(shí)別虹膜識(shí)別紅外識(shí)別等技術(shù)逐步成為門(mén)禁系統(tǒng)發(fā)展的主流技木。但相對(duì)于其他技木,語(yǔ)音識(shí)別技術(shù)是目前公認(rèn)的比較方便與安全的識(shí)別技術(shù)之一,該技術(shù)是利用人體生物特征進(jìn)行身份認(rèn)證的ー種技木。由于每個(gè)人的生物特征與其他人相比具有不同的唯一性和在一定時(shí)期內(nèi)不變的穩(wěn)定性,因此不易偽造和假冒,所以利用語(yǔ)音識(shí)別技術(shù)進(jìn)行身份認(rèn)證,安全、準(zhǔn)確、可靠,具有較好的發(fā)展前景。本發(fā)明就是利用語(yǔ)音識(shí)別技術(shù),使得門(mén)禁系統(tǒng)的使用更加方便。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種語(yǔ)音識(shí)別的智能門(mén)控系統(tǒng),可用于家庭或小型辦公場(chǎng)所的門(mén)鎖控制。為了解決上述技術(shù)問(wèn)題,本發(fā)明提供一種語(yǔ)音識(shí)別的智能門(mén)控系統(tǒng),包括如下順序模塊
Si硬件系統(tǒng)設(shè)計(jì);
S2:語(yǔ)音信號(hào)處理。進(jìn)ー步,所述的硬件系統(tǒng)設(shè)計(jì)的模塊包括
S201: CPU核心電路:采用SPCE061A高性能16位單片機(jī);
S202:語(yǔ)音識(shí)別電路首先是噪音的濾除和預(yù)加重,然后語(yǔ)音信號(hào)經(jīng)過(guò)濾波器組進(jìn)行信號(hào)的選擇,提取有用信號(hào),通過(guò)PAR-COR系數(shù)、線(xiàn)性預(yù)測(cè)系數(shù)、過(guò)零次數(shù)和能量性關(guān)函數(shù)等的計(jì)算匹配對(duì)信號(hào)進(jìn)行處理選擇。進(jìn)ー步,語(yǔ)音信號(hào)處理的內(nèi)容包括
S301:語(yǔ)音信號(hào)預(yù)處理,噪聲的存在對(duì)語(yǔ)音信號(hào)的處理和識(shí)別存在著嚴(yán)重的干擾,因此我們?cè)谔幚砬跋纫M(jìn)行噪聲的處理;S302:特征提取本系統(tǒng)采用了不同說(shuō)話(huà)人的分散程度與各說(shuō)話(huà)人自身的 分散程度之間的對(duì)比值作為特征參數(shù)的評(píng)價(jià)方法;
S303:模式匹配本系統(tǒng)采用端點(diǎn)松弛兩點(diǎn)的(DTW)算法,端點(diǎn)松弛引起的計(jì)算量增加并不大,還可以放松對(duì)端點(diǎn)檢測(cè)的精度要求。此外,優(yōu)選的,該系統(tǒng)的核心處理器是陵陽(yáng)16位單片機(jī)SPCE061A,并在其上實(shí)現(xiàn)與文本有關(guān)的說(shuō)話(huà)人的確認(rèn),然后執(zhí)行相應(yīng)的命令與操作。該系統(tǒng)主要由說(shuō)話(huà)人識(shí)別模塊、門(mén)鎖控制電機(jī)以及門(mén)鎖等部分組成。在訓(xùn)練吋,說(shuō)話(huà)人的聲音通過(guò)麥克風(fēng)進(jìn)入說(shuō)話(huà)人語(yǔ)音信號(hào)采集前端電路,由語(yǔ)音信號(hào)處理電路對(duì)采集的語(yǔ)音信號(hào)進(jìn)行特征化和語(yǔ)音處理,提取說(shuō)話(huà)人的個(gè)性特征參數(shù)并進(jìn)行存儲(chǔ),形成說(shuō)話(huà)人特征參數(shù)數(shù)據(jù)庫(kù)。在識(shí)別吋,將待識(shí)別語(yǔ)音與說(shuō)話(huà)人特征參數(shù)數(shù)據(jù)庫(kù)進(jìn)行匹配,通過(guò)輸出電路控制門(mén)控電機(jī),最終實(shí)現(xiàn)對(duì)門(mén)鎖的控制。 本發(fā)明和原理和功能說(shuō)明
本發(fā)明的語(yǔ)音識(shí)別的智能門(mén)控系統(tǒng),其特征在干將陵陽(yáng)單片機(jī)的語(yǔ)音處理技術(shù)用于門(mén)控系統(tǒng);
硬件部分主要由SPCE061A單片機(jī)、電源與門(mén)控電路、外擴(kuò)存儲(chǔ)器SPR4096、音頻輸入與輸出電路組成;
軟件部分由語(yǔ)音訓(xùn)練模塊、語(yǔ)音識(shí)別模塊、語(yǔ)音數(shù)據(jù)處理模塊、語(yǔ)音播報(bào)模塊和密碼輸入與確認(rèn)模塊組成,通過(guò)對(duì)系統(tǒng)的初始化和識(shí)別訓(xùn)練實(shí)現(xiàn)了語(yǔ)音數(shù)據(jù)的采集、特征提取、特定語(yǔ)音識(shí)別和語(yǔ)音播放;根據(jù)語(yǔ)音識(shí)別算法原理,對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理、特征提取、模式匹配。語(yǔ)音識(shí)別的分類(lèi)該系統(tǒng)的核心處理器是陵陽(yáng)16位單片機(jī)SPCE061A,并在其上實(shí)現(xiàn)與文本有關(guān)的說(shuō)話(huà)人的確認(rèn),然后執(zhí)行相應(yīng)的命令與操作。硬件系統(tǒng)設(shè)計(jì)本系統(tǒng)中的硬件設(shè)計(jì)包含CPU核心電路設(shè)計(jì)及語(yǔ)音識(shí)別電路的設(shè)計(jì)。語(yǔ)音信號(hào)處理該過(guò)程包含語(yǔ)音信號(hào)預(yù)處理、特征提取及模式匹配。本系統(tǒng)中的硬件設(shè)計(jì)包含CPU核心電路設(shè)計(jì)及語(yǔ)音識(shí)別電路的設(shè)計(jì),具體內(nèi)容如下
DCPU核心電路SPCE061A高性能16位單片機(jī)的工作電壓范圍為2. 6 5. 5V,系統(tǒng)工作頻率為0. 375 49. 152MHz。在片內(nèi)集成有32位可編程的多功能I/O端ロ、兩個(gè)16位定時(shí)器/計(jì)數(shù)器、7通道10位電壓模-數(shù)轉(zhuǎn)換器(ADC)、自動(dòng)增益控制功能的麥克風(fēng)輸入方式、雙通道10位DAC方式的音頻輸出功能及看門(mén)狗定時(shí)器。中斷控制器可處理3種FIQ中斷和11種IRQ中斷,以及ー個(gè)由指令BREAK控制的軟中斷。提供豐富的C函數(shù)庫(kù)和語(yǔ)音處理函數(shù)庫(kù),因此非常適合數(shù)字聲音和語(yǔ)音識(shí)別產(chǎn)品的開(kāi)發(fā)。使得設(shè)計(jì)電路簡(jiǎn)單化,大大降低了硬件成本。分幀采用幀與幀重疊的方法,避免失幀。2)語(yǔ)音識(shí)別電路首先是噪音的濾除和預(yù)加重,然后語(yǔ)音信號(hào)經(jīng)過(guò)濾波器組進(jìn)行信號(hào)的選擇,提取有用信號(hào),通過(guò)PAR-COR系數(shù)、線(xiàn)性預(yù)測(cè)系數(shù)、過(guò)零次數(shù)和能量性關(guān)函數(shù)等的計(jì)算匹配對(duì)信號(hào)進(jìn)行處理選擇。語(yǔ)音信號(hào)在進(jìn)行分析處理后與語(yǔ)音庫(kù)(即字典)里的語(yǔ)音量進(jìn)行模式匹配,最后根據(jù)匹配的結(jié)果輸出語(yǔ)音識(shí)別結(jié)果。其中,對(duì)語(yǔ)音信號(hào)處理,具體內(nèi)容如下I)語(yǔ)音信號(hào)預(yù)處理對(duì)麥克風(fēng)輸入的模擬語(yǔ)音信號(hào)要進(jìn)行采樣和量化,獲得數(shù)字化的語(yǔ)音信號(hào)。在語(yǔ)音信號(hào)數(shù)字化之前,要進(jìn)行防混疊濾波及防エ頻干擾。其中防混疊濾波是濾除高于1/2采樣頻率的信號(hào)成分或噪聲,使信號(hào)帶寬限制在某個(gè)范圍內(nèi)。得到干凈的語(yǔ)音信號(hào)后并通過(guò)預(yù)加重技術(shù)濾除低頻干擾,尤其是50Hz或60Hz的エ頻干擾,提升語(yǔ)音信號(hào)的高頻部分,而且它還可以起到消除直流漂移、抑制隨機(jī)噪聲和提升清音部分能量的作用。2)特征提取本系統(tǒng)采用了不同說(shuō)話(huà)人的分散程度與各說(shuō)話(huà)人自身的分散程度之間的對(duì)比值作為特征參數(shù)的評(píng)價(jià)方法。其基本思想是對(duì)同一說(shuō)話(huà)人的一段語(yǔ)音提取一組特征參數(shù),相當(dāng)于把該段語(yǔ)音映射到多維空間上的ー個(gè)點(diǎn)。同一說(shuō)話(huà)人的不同語(yǔ)音會(huì)在特征空間產(chǎn)生不同的點(diǎn),其分布可用多變量概率密度函數(shù)來(lái)描述。對(duì)同一個(gè)說(shuō)話(huà)人的不相同單次的發(fā)音,這些點(diǎn)比較集中;而不同說(shuō)話(huà)人的發(fā)音分布相距較遠(yuǎn),則所選擇的這組特征參數(shù)就能夠有效的描述說(shuō)話(huà)人的個(gè)性特征。根據(jù)這一原則,對(duì)單個(gè)參數(shù)而言,可以取兩種分布參數(shù)的方差比(稱(chēng)為F比)作為有效的度量準(zhǔn)則。F比反映了不同說(shuō)話(huà)人的分散程度與各說(shuō)話(huà)人自身的分散程度之間的對(duì)比關(guān)系。某一特征參數(shù)的F比越大,說(shuō)明對(duì)于本特征,平均而言前者要大于后者。因此,說(shuō)話(huà)人識(shí)別系統(tǒng)中采用F比較大的,這樣系統(tǒng)會(huì)得到較好的性能。3)模式匹配本系統(tǒng)采用端點(diǎn)松弛兩點(diǎn)的(DTW)算法,端點(diǎn)松弛引起的計(jì)算量增加并不大,還可以放松對(duì)端點(diǎn)檢測(cè)的精度要求。
圖I是本發(fā)明提供的系統(tǒng)硬件框圖。圖2是語(yǔ)音識(shí)別電路框圖。圖3語(yǔ)音信號(hào)處理過(guò)程結(jié)構(gòu)圖。
具體實(shí)施例方式 圖I是本發(fā)明提供的系統(tǒng)硬件框圖。本系統(tǒng)的硬件部分由單片機(jī)SPCE061A、音頻輸出電路、音頻輸入電路、語(yǔ)音識(shí)別電路、門(mén)鎖控制電路、FLASH電路和按鍵電路等部分組成。系統(tǒng)框圖如圖I所示。硬件系統(tǒng)主要完成的任務(wù)是將語(yǔ)音信號(hào)數(shù)字化,實(shí)現(xiàn)語(yǔ)音數(shù)據(jù)的采集、上傳、保存、識(shí)別及播放。。圖2是語(yǔ)音識(shí)別電路框圖。語(yǔ)音識(shí)別電路的工作原理是智能系統(tǒng)在提取語(yǔ)音后, 對(duì)語(yǔ)音信號(hào)進(jìn)行分析,首先是噪音的濾除和預(yù)加重,然后語(yǔ)音信號(hào)經(jīng)過(guò)濾波器組進(jìn)行信號(hào)的選擇,提取有用信號(hào),通過(guò)PAR-COR系數(shù)、線(xiàn)性預(yù)測(cè)系數(shù)、過(guò)零次數(shù)和能量性關(guān)函數(shù)等的計(jì)算匹配對(duì)信號(hào)進(jìn)行處理選擇。語(yǔ)音信號(hào)在進(jìn)行分析處理后與語(yǔ)音庫(kù)(即字典)里的語(yǔ)音量進(jìn)行模式匹配,最后根據(jù)匹配的結(jié)果輸出語(yǔ)音識(shí)別結(jié)果。語(yǔ)音識(shí)別電路的基本結(jié)構(gòu)如圖2所示。圖3語(yǔ)音信號(hào)處理過(guò)程結(jié)構(gòu)圖。首先對(duì)輸入的語(yǔ)音信號(hào)要進(jìn)行預(yù)處理,對(duì)信號(hào)進(jìn)行適當(dāng)?shù)姆糯?,并進(jìn)行反混疊濾波來(lái)消除エ頻干擾;然后為方便數(shù)字化設(shè)備對(duì)信號(hào)進(jìn)行計(jì)算處理則對(duì)信號(hào)進(jìn)行數(shù)字化,將模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào);接著進(jìn)行特征提取,用反映語(yǔ)音信號(hào)特點(diǎn)的若干參數(shù)來(lái)代表語(yǔ)音,最后根據(jù)任務(wù)的不同,采用不同的處理方法。語(yǔ)音識(shí)別分為兩個(gè)階段訓(xùn)練階段和識(shí)別階段。在訓(xùn)練階段對(duì)用特征參數(shù)形式表示的語(yǔ)音信號(hào)進(jìn)行相應(yīng)的處理,獲得表示識(shí)別基本単元共性特點(diǎn)的標(biāo)準(zhǔn)數(shù)據(jù),以此形成參考模板,將所有能識(shí)別的基本単元的參考模板結(jié)合在一起,形成參考模板庫(kù);在識(shí)別階段將待識(shí)別的語(yǔ)音經(jīng)過(guò)特征提取后逐一與參考模板比較,找出最相似的參考模板所對(duì)應(yīng)的發(fā)音,即為識(shí)別結(jié)果。
權(quán)利要求
1.一種語(yǔ)音識(shí)別的智能門(mén)控系統(tǒng),包括如下順序模塊 Si硬件系統(tǒng)設(shè)計(jì); S2:語(yǔ)音信號(hào)處理。
2.根據(jù)權(quán)利要求I所述的語(yǔ)音識(shí)別的智能門(mén)控系統(tǒng),其特征在于所述的硬件系統(tǒng)設(shè)計(jì)的模塊包括 S201: CPU核心電路:采用SPCE061A高性能16位單片機(jī); S202:語(yǔ)音識(shí)別電路首先是噪音的濾除和預(yù)加重,然后語(yǔ)音信號(hào)經(jīng)過(guò)濾波器組進(jìn)行信號(hào)的選擇,提取有用信號(hào),通過(guò)PAR-COR系數(shù)、線(xiàn)性預(yù)測(cè)系數(shù)、過(guò)零次數(shù)和能量性關(guān)函數(shù)等的計(jì)算匹配對(duì)信號(hào)進(jìn)行處理選擇。
3.根據(jù)權(quán)利要求I所述的語(yǔ)音識(shí)別的智能門(mén)控系統(tǒng),其特征在于所述的語(yǔ)音信號(hào)處理的內(nèi)容包括 S301:語(yǔ)音信號(hào)預(yù)處理; S302:特征提取采用不同說(shuō)話(huà)人的分散程度與各說(shuō)話(huà)人自身的分散程度之間的對(duì)比值作為特征參數(shù)的評(píng)價(jià)模式; S303:模式匹配采用端點(diǎn)松弛兩點(diǎn)的算法。
4.根據(jù)權(quán)利要求I所述的語(yǔ)音識(shí)別的智能門(mén)控系統(tǒng),其特征在于系統(tǒng)主要由說(shuō)話(huà)人識(shí)別模塊、門(mén)鎖控制電機(jī)以及門(mén)鎖等部分組成;在訓(xùn)練吋,說(shuō)話(huà)人的聲音通過(guò)麥克風(fēng)進(jìn)入說(shuō)話(huà)人語(yǔ)音信號(hào)采集前端電路,由語(yǔ)音信號(hào)處理電路對(duì)采集的語(yǔ)音信號(hào)進(jìn)行特征化和語(yǔ)音處理,提取說(shuō)話(huà)人的個(gè)性特征參數(shù)并進(jìn)行存儲(chǔ),形成說(shuō)話(huà)人特征參數(shù)數(shù)據(jù)庫(kù);在識(shí)別時(shí),將待識(shí)別語(yǔ)音與說(shuō)話(huà)人特征參數(shù)數(shù)據(jù)庫(kù)進(jìn)行匹配,通過(guò)輸出電路控制門(mén)控電機(jī),最終實(shí)現(xiàn)對(duì)門(mén)鎖的控制。
全文摘要
本發(fā)明涉及一種語(yǔ)音識(shí)別的智能門(mén)控系統(tǒng),采用語(yǔ)音識(shí)別技術(shù),在陵陽(yáng)單片機(jī)SPCE061A上實(shí)現(xiàn)。硬件部分主要由SPCE061A單片機(jī)、電源與門(mén)控電路、外擴(kuò)存儲(chǔ)器SPR4096、音頻輸入與輸出電路等組成。主要技術(shù)是該單片機(jī)在語(yǔ)音識(shí)別中的應(yīng)用和對(duì)門(mén)控電路的設(shè)計(jì)。該系統(tǒng)軟件部分由語(yǔ)音訓(xùn)練模塊、語(yǔ)音識(shí)別模塊、語(yǔ)音數(shù)據(jù)處理模塊、語(yǔ)音播報(bào)模塊和密碼輸入與確認(rèn)模塊組成,通過(guò)對(duì)系統(tǒng)的初始化和識(shí)別訓(xùn)練實(shí)現(xiàn)了語(yǔ)音數(shù)據(jù)的采集、特征提取、特定語(yǔ)音識(shí)別和語(yǔ)音播放等功能。根據(jù)語(yǔ)音識(shí)別算法原理,對(duì)語(yǔ)音信號(hào)的預(yù)處理、特征提取、模式匹配做了分析。該系統(tǒng)實(shí)驗(yàn)結(jié)果表明,系統(tǒng)性能穩(wěn)定,識(shí)別效果好,可用于家庭或小型辦公場(chǎng)所的門(mén)鎖控制。
文檔編號(hào)G07C9/00GK102760312SQ201210204650
公開(kāi)日2012年10月31日 申請(qǐng)日期2012年6月20日 優(yōu)先權(quán)日2012年6月20日
發(fā)明者蘇淳 申請(qǐng)人:太倉(cāng)博天網(wǎng)絡(luò)科技有限公司