專利名稱:簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置及方法。
背景技術(shù):
語(yǔ)音信號(hào)是人們?nèi)粘I钪凶顬槠胀ê统S玫耐ㄓ嵎绞?,現(xiàn)代信號(hào)處理技術(shù)的發(fā)展使得語(yǔ)音智能識(shí)別技術(shù)越發(fā)成熟。自從IBM公司推出商業(yè)語(yǔ)音識(shí)別軟件Via Voice后,語(yǔ)音的計(jì)算機(jī)識(shí)別逐步進(jìn)入人們的日常生活,車站的語(yǔ)音購(gòu)票,手機(jī)的自動(dòng)語(yǔ)音撥號(hào)等應(yīng)用已被大家所熟悉。同時(shí)利用語(yǔ)音進(jìn)行身份驗(yàn)證的技術(shù)也逐步受到關(guān)注,但是正確率不高,在一些重要場(chǎng)合的應(yīng)用仍有很多限制。識(shí)別說(shuō)話人的性別是身份驗(yàn)證中較為基本的一項(xiàng)任務(wù),傳統(tǒng)方法需要采集大量的男女聲數(shù)據(jù)作為樣本庫(kù),并建立復(fù)雜的HMM識(shí)別模型,用樣本庫(kù)進(jìn)行訓(xùn)練,從而建立起男女聲的識(shí)別模板。這樣做使得數(shù)據(jù)量較大,而且也不一定能滿足語(yǔ)音的普遍性,識(shí)別性能與樣本庫(kù)相關(guān)度較大;識(shí)別的正確率與訓(xùn)練語(yǔ)音的說(shuō)話內(nèi)容有較大的聯(lián)系,基于特定文本的識(shí)別效果比非特定文本的識(shí)別效果好很多;同時(shí)語(yǔ)音信號(hào)將隨著錄音設(shè)備的不同而產(chǎn)生差異,即使是同一個(gè)人在一臺(tái)設(shè)備上錄制一段語(yǔ)音,同樣的話語(yǔ)在另一臺(tái)設(shè)備上的錄制數(shù)據(jù)也會(huì)存在不同,若錄音話筒材質(zhì)不同影響則更大?;谀P头诸惖恼Z(yǔ)音性別區(qū)分設(shè)備都存在此類問(wèn)題。
發(fā)明內(nèi)容
為了解決上述問(wèn)題,本發(fā)明的目的在于提供一種簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置及方法,通過(guò)語(yǔ)音信號(hào)整形后的頻率,主要依托男女基音頻率的不同,來(lái)判斷說(shuō)話人的性別。為了達(dá)到以上目的,本發(fā)明采用的技術(shù)方案是簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置,它包括將聲音信號(hào)轉(zhuǎn)變成電波形的語(yǔ)音采集模塊、輸入端與語(yǔ)音采集模塊相連接并用于濾除電波形中的高次諧波的低通濾波模塊、輸入端與低通濾波模塊的輸出端相連接并用于將頻率信號(hào)轉(zhuǎn)換成電壓信號(hào)的頻率電壓轉(zhuǎn)換模塊、輸入端與頻率電壓轉(zhuǎn)換模塊的輸出端相連接并用于將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的模數(shù)轉(zhuǎn)換模塊、輸入端與數(shù)模轉(zhuǎn)換模塊的輸出端相連接并用于判斷數(shù)字信號(hào)大小的控制器模塊、輸入端與控制器模塊的輸出端相連接的顯示模塊。進(jìn)一步地,低通濾波模塊為二階濾波電路,它包括放大器、電阻和電容。更進(jìn)一步地,低通濾波模塊的通帶為10 500Hz,阻帶下限為600Hz,過(guò)渡帶衰減在20dB以上,帶內(nèi)波動(dòng)在3dB以內(nèi)。本發(fā)明所提供的另一技術(shù)方案為一種利用上述的簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置的檢測(cè)方法,它包括以下步驟
(1)根據(jù)環(huán)境噪聲,設(shè)定濁音的門限能量;設(shè)定男女聲的分界頻率;
(2)采集聲音信號(hào),判斷該聲音信號(hào)的能量值是否大于門限能量,若大于門限能量,則進(jìn)入下一步,如小于等于門限能量,則重新采集聲音信號(hào)并判斷;
(3)若聲音信號(hào)的能量值大于門限能量,則打開(kāi)頻率電壓轉(zhuǎn)換模塊的信號(hào)通道,控制器模塊記錄一組模數(shù)轉(zhuǎn)換的電壓值,并求取平均值;(4)檢測(cè)該平均值是否大于分界頻率,是則為女聲,否則為男聲,并控制LCD做出結(jié)果顯示;隨后返回初始狀態(tài),進(jìn)行下一組數(shù)據(jù)的采集處理。依照不同的分類規(guī)則漢語(yǔ)可以有幾種發(fā)音方式,其中以聲帶的振動(dòng)與否將語(yǔ)音分為清音和濁音,發(fā)濁音時(shí)人的聲帶將產(chǎn)生振動(dòng),聲波呈現(xiàn)準(zhǔn)周期的特性,發(fā)清音時(shí)聲帶基本不振動(dòng),聲波呈現(xiàn)類似白噪聲的特性,規(guī)律不明顯。聲帶振動(dòng)的頻率稱為基音頻率,而人的基音頻率一般處在50 400Hz之間。通過(guò)大量的先驗(yàn)認(rèn)識(shí)可知,一般成年男性的基音頻率在50 200Hz,成年女性的基頻分布于200 400Hz,兒童的基頻與女性基頻相似。一般而言,語(yǔ)音信號(hào)經(jīng)過(guò)低通整形以后,語(yǔ)音基頻段的能量會(huì)較好的保存下來(lái)。本發(fā)明使得基于人語(yǔ)音的性別區(qū)分變得簡(jiǎn)單而快捷,避免了大數(shù)據(jù)量的訓(xùn)練,且不需要計(jì)算機(jī)裝置。本裝置既可以作為復(fù)雜身份驗(yàn)證裝置的補(bǔ)充,也可以制成一個(gè)簡(jiǎn)易的手持設(shè)備,使用方便,具有一定的市場(chǎng)前景。
圖I為本發(fā)明裝置電路結(jié)構(gòu)示意圖。圖2為本發(fā)明裝置的檢測(cè)方法流程圖。
具體實(shí)施例方式下面結(jié)合附圖對(duì)本發(fā)明的較佳實(shí)施例進(jìn)行詳細(xì)闡述,以使本發(fā)明的優(yōu)點(diǎn)和特征能更易于被本領(lǐng)域技術(shù)人員理解,從而對(duì)本發(fā)明的保護(hù)范圍做出更為清楚明確的界定。從附圖I的結(jié)構(gòu)示意圖可以看出,本發(fā)明提供了簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置及方法,它包括將聲音信號(hào)轉(zhuǎn)變成電波形的語(yǔ)音采集模塊、輸入端與語(yǔ)音采集模塊相連接并用于濾除電波形中的高次諧波的低通濾波模塊、輸入端與低通濾波模塊的輸出端相連接并用于將頻率信號(hào)轉(zhuǎn)換成電壓信號(hào)的頻率電壓轉(zhuǎn)換模塊、輸入端與頻率電壓轉(zhuǎn)換模塊的輸出端相連接并用于將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的模數(shù)轉(zhuǎn)換模塊、輸入端與數(shù)模轉(zhuǎn)換模塊的輸出端相連接并用于判斷數(shù)字信號(hào)大小的控制器模塊、輸入端與控制器模塊的輸出端相連接的顯示模塊。在本實(shí)施例中,本裝置由麥克風(fēng)語(yǔ)音采集電路、500Hz低通濾波電路、基于LM331的F/V轉(zhuǎn)換電路、A/D轉(zhuǎn)換電路、MCU核心處理器和LCD顯示器組成。本裝置可以在室內(nèi)外任何非強(qiáng)噪聲環(huán)境下使用。麥克風(fēng)語(yǔ)音采集電路由柱體話筒配合相應(yīng)的電阻和電容構(gòu)成,可以將聲音信號(hào)轉(zhuǎn)變成電波形;500Hz低通濾波器,由常用放大器0P07和電阻、電容構(gòu)成二階濾波電路,過(guò)渡帶小于100Hz,衰減20dB以上,主要將語(yǔ)音中的高次諧波濾除,也可以起到一定的整形作用;F/V轉(zhuǎn)換電路主要由LM331芯片構(gòu)成,可以實(shí)現(xiàn)頻率和電壓的轉(zhuǎn)化;AD轉(zhuǎn)換可以采用MCU自帶的AD轉(zhuǎn)換器,也可采用外置的高速AD芯片,轉(zhuǎn)換時(shí)間小于2us,IObit量化位數(shù),完全滿足裝置要求;MCU采用PIC16F877單片機(jī),該裝置編程方便,具有30余個(gè)通用10,足夠裝置的輸入輸出分配,操控IXD,按鍵輸入,AD輸入都很方便,同時(shí)片上集成UART總線,方便與計(jì)算機(jī)通信,便于擴(kuò)展;采用常規(guī)的1602IXD顯示器作為裝置的輸出,顯不結(jié)果。說(shuō)話人的語(yǔ)音信號(hào)通過(guò)采集電路由聲壓變成電壓信號(hào),再通過(guò)低通濾波電路,將高次諧波濾除,濾波器的精度要求不是特別高,通帶10 500Hz,阻帶下限600Hz,過(guò)渡帶衰減20dB以上,帶內(nèi)波動(dòng)3dB以內(nèi)。濾波后的信號(hào)相當(dāng)于完成了一部分的整形工作,便于后續(xù)的F/V轉(zhuǎn)換。要了解信號(hào)中的頻率成分可以采用數(shù)字采樣和頻譜分析的方式,但是成本較高,數(shù)據(jù)處理復(fù)雜。而通過(guò)F/V轉(zhuǎn)化,原本的頻率信號(hào)變成了電壓信號(hào),只需要一般的AD轉(zhuǎn)化就能夠通過(guò)電壓變化而直接獲得原信號(hào)中的頻率成分,更方便快捷。通過(guò)電壓值的大小判定語(yǔ)音信號(hào)的基頻,與預(yù)先設(shè)定的分界頻率比較,大于分界頻率的聲音判定為女聲,否則為男聲。最后通過(guò)IXD顯示結(jié)果。圖2為本發(fā)明裝置的檢測(cè)方法流程圖。由于人發(fā)音的停頓,語(yǔ)音信號(hào)會(huì)有空隙;而且基音頻率僅包含在濁音中,清音中沒(méi)有。所以在對(duì)語(yǔ)音信號(hào)進(jìn)行分析時(shí)必須對(duì)無(wú)聲信號(hào)、清音信號(hào)及濁音信號(hào)有明確的區(qū)分。一般而言,無(wú)聲或是清音信號(hào)的能量比較小,而濁音的能量遠(yuǎn)大于此二者,故利用語(yǔ)音的能量大小可以很容易的定位到濁語(yǔ)音。另外由于語(yǔ)音信號(hào)具有非平穩(wěn)非線性的特征,所以必須通過(guò)短時(shí)分析的方法才能獲得較好的結(jié)果。常規(guī)的語(yǔ)音分析裝置將語(yǔ)音分成20 40ms —組進(jìn)行處理(PIC16F877的片上AD采集速度遠(yuǎn)大于語(yǔ)音分幀時(shí)長(zhǎng),完全滿足要求)。一般的濁音都能維持200ms以上,故為了避免數(shù)據(jù)處理和 判斷的誤差,本裝置將對(duì)200ms內(nèi)取得的語(yǔ)音基頻做平均處理后再進(jìn)行性別判斷,以抵制各類因素所造成的錯(cuò)誤。一種利用上述的簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置的檢測(cè)方法,它包括以下步驟
(I)根據(jù)環(huán)境噪聲,設(shè)定濁語(yǔ)音的門限能量E,即大于此門限的信號(hào)為濁音;根據(jù)先驗(yàn)信息,設(shè)定男女聲的分界頻率F,大于此頻率的為女聲,否則為男聲。(2)裝置運(yùn)行后,采集聲音信號(hào),首先檢測(cè)語(yǔ)音短時(shí)能量,判斷該聲音信號(hào)的能量值是否大于門限能量,若大于門限能量E,則進(jìn)入下一步,如小于等于門限能量,則重新采集聲音信號(hào)并判斷,知道檢測(cè)到濁音信號(hào);
(3)若聲音信號(hào)的能量值大于門限能量E,則打開(kāi)F/V信號(hào)通道,MCU記錄一組AD轉(zhuǎn)換的電壓值,濾除突變信號(hào),取電壓平均值,并通過(guò)換算得到對(duì)應(yīng)語(yǔ)音的基頻。(4)檢測(cè)該平均值是否大于所述的分界頻率F,是則為女聲,否則為男聲,并控制LCD做出結(jié)果顯示;隨后返回初始狀態(tài),進(jìn)行下一組數(shù)據(jù)的采集處理。以上實(shí)施方式只為說(shuō)明本發(fā)明的技術(shù)構(gòu)思及特點(diǎn),其目的在于讓熟悉此項(xiàng)技術(shù)的人了解本發(fā)明的內(nèi)容并加以實(shí)施,并不能以此限制本發(fā)明的保護(hù)范圍,凡根據(jù)本發(fā)明精神實(shí)質(zhì)所做的等效變化或修飾,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置,其特征在于它包括將聲音信號(hào)轉(zhuǎn)變成電波形的語(yǔ)音采集模塊、輸入端與所述語(yǔ)音采集模塊相連接并用于濾除所述電波形中的高次諧波的低通濾波模塊、輸入端與所述低通濾波模塊的輸出端相連接并用于將頻率信號(hào)轉(zhuǎn)換成電壓信號(hào)的頻率電壓轉(zhuǎn)換模塊、輸入端與所述頻率電壓轉(zhuǎn)換模塊的輸出端相連接并用于將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的模數(shù)轉(zhuǎn)換模塊、輸入端與所述數(shù)模轉(zhuǎn)換模塊的輸出端相連接并用于判斷所述數(shù)字信號(hào)大小的控制器模塊、輸入端與所述控制器模塊的輸出端相連接的顯示模塊。
2.根據(jù)權(quán)利要求I所述的簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置,其特征在于所述的低通濾波模塊為二階濾波電路,它包括放大器、電阻和電容。
3.根據(jù)權(quán)利要求I或2所述的簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置,其特征在于所述的低通濾波模塊的通帶為10 500Hz,阻帶下限為600Hz,過(guò)渡帶衰減在20dB以上,帶內(nèi)波動(dòng)在3dB以內(nèi)。
4.一種利用權(quán)利要求I所述的簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置的檢測(cè)方法,它包括以下步驟 (1)根據(jù)環(huán)境噪聲,設(shè)定濁音的門限能量;設(shè)定男女聲的分界頻率; (2)采集聲音信號(hào),判斷該聲音信號(hào)的能量值是否大于門限能量,若大于門限能量,則進(jìn)入下一步,如小于等于門限能量,則重新采集聲音信號(hào)并判斷; (3)若聲音信號(hào)的能量值大于門限能量,則打開(kāi)頻率電壓轉(zhuǎn)換模塊的信號(hào)通道,控制器模塊記錄一組模數(shù)轉(zhuǎn)換的電壓值,并求取平均值; (4)檢測(cè)該平均值是否大于所述的分界頻率,是則為女聲,否則為男聲,并控制LCD做出結(jié)果顯示;隨后返回初始狀態(tài),進(jìn)行下一組數(shù)據(jù)的采集處理。
全文摘要
本發(fā)明公開(kāi)了一種簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置,它包括語(yǔ)音采集模塊、低通濾波模塊、頻率電壓轉(zhuǎn)換模塊、模數(shù)轉(zhuǎn)換模塊、控制器模塊、顯示模塊。本發(fā)明還公開(kāi)了一種利用上述的簡(jiǎn)易語(yǔ)音性別檢測(cè)裝置的檢測(cè)方法,它包括以下步驟(1)根據(jù)環(huán)境噪聲,設(shè)定濁音的門限能量;設(shè)定男女聲的分界頻率;(2)采集聲音信號(hào),判斷該聲音信號(hào)的能量值是否大于門限能量,若大于門限能量,則進(jìn)入下一步,如小于等于門限能量,則重新采集聲音信號(hào)并判斷;(3)若聲音信號(hào)的能量值大于門限能量,則打開(kāi)頻率電壓轉(zhuǎn)換模塊的信號(hào)通道,控制器模塊記錄一組模數(shù)轉(zhuǎn)換的電壓值,并求取平均值;(4)檢測(cè)該平均值是否大于分界頻率,并控制LCD做出結(jié)果顯示。
文檔編號(hào)G10L17/00GK102693721SQ20121021109
公開(kāi)日2012年9月26日 申請(qǐng)日期2012年6月26日 優(yōu)先權(quán)日2012年6月26日
發(fā)明者潘欣裕, 諸立駿 申請(qǐng)人:蘇州科技學(xué)院