亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

聲音辨識(shí)系統(tǒng)及具有該系統(tǒng)的安全裝置的制作方法

文檔序號(hào):2831293閱讀:329來源:國知局
專利名稱:聲音辨識(shí)系統(tǒng)及具有該系統(tǒng)的安全裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種聲音辨識(shí)系統(tǒng)及具有該系統(tǒng)的安全裝置,特別是指一種能提高辨識(shí)率的聲音辨識(shí)系統(tǒng)及具有該系統(tǒng)的安全裝置。
背景技術(shù)
已知的安全裝置一般是包含攝影機(jī)及監(jiān)控器,而該攝影機(jī)可安裝于大門出入口、電梯或是房間內(nèi),且該監(jiān)控器可接收該攝影機(jī)擷取的影像,并將影像顯示在監(jiān)控器的畫面上,而大樓的管理員即可通過監(jiān)視該監(jiān)控器的畫面來監(jiān)控是否有異常人士出入。但監(jiān)看畫面的管理人員則需隨時(shí)盯著監(jiān)控器的畫面才能達(dá)到較緊密的安全。
而已知的另一種安全裝置除了包含攝影機(jī)、監(jiān)控器外,還加裝麥克風(fēng)和喇叭。該攝影機(jī)和該監(jiān)控器的功能與上述相同,而該麥克風(fēng)則可接收聲音信號(hào)并由該喇叭將該聲音信號(hào)播出。但該麥克風(fēng)會(huì)將所有聲音信號(hào)都接收進(jìn)來,且該聲音信號(hào)包含汽車?yán)嚷?、宣傳車廣播聲、電視節(jié)目聲等一些與安全無關(guān)的聲音,而大樓管理員或使用者必須以人為方式一一過濾這些聲音,而無法由系統(tǒng)作智能型的判斷。
此外,為了改善上述現(xiàn)象,如圖1所示,已知的另一種安全裝置除了包含上述所提到的攝影機(jī)4、監(jiān)控器5、麥克風(fēng)6及喇叭7外,還加裝了聲音辨識(shí)系統(tǒng)8及處理器9。該聲音辨識(shí)系統(tǒng)8則可對(duì)麥克風(fēng)6接收到的聲音進(jìn)行辨識(shí)以將聲音信號(hào)分類,而該處理器9則可判斷分類出的聲音種類是否為預(yù)設(shè)的異常聲音。并在判定為是異常聲音時(shí)通報(bào)該喇叭7發(fā)出警示聲。
而該聲音辨識(shí)系統(tǒng)8是包括特征擷取器81、分類器82及數(shù)據(jù)庫83。該數(shù)據(jù)庫83儲(chǔ)存多種聲音信號(hào)的特征向量。而該特征擷取器81可接收該麥克風(fēng)6傳來的聲音信號(hào),并找出該聲音信號(hào)的特征向量。
該特征擷取器81一般可采用梅爾倒頻譜參數(shù)(Mel-scale FrequencyCepstral Coefficients,簡稱MFCC)的方法來分析出聲音信號(hào)的特征,該方法可參考L.Rabiner與B.-H.Juang所著,并于1993年由Prentice Hall出版的“語音識(shí)別基本原理(Fundamentals of Speech Recognition)”。而該方法主要是將該聲音信號(hào)先經(jīng)過快速傅利葉轉(zhuǎn)換(Fast Fourier Transform),使該信號(hào)由時(shí)域(Time Domain)信號(hào)轉(zhuǎn)成頻域(Frequency Domain)信號(hào),然后再將該頻域信號(hào)經(jīng)過一組三角帶通濾波器(Triangular Band-pass Filters),且該組濾波器的中心頻率是根據(jù)梅爾頻率(Mel-frequency)設(shè)計(jì)的,因?yàn)槊窢栴l率符合人的聽覺效應(yīng)。之后再將經(jīng)過該等濾波器處理后的信號(hào)用離散余弦轉(zhuǎn)換(Discrete Cosine Transform)去做維度降低及轉(zhuǎn)換,以得到一組特定維度的梅爾倒頻譜參數(shù)來當(dāng)做聲音的特征向量。
而該分類器82則將該特征擷取器81分析出的特征向量與該數(shù)據(jù)庫83中所存的特征向量作比較,以將該麥克風(fēng)6接收到的聲音信號(hào)分類至適當(dāng)?shù)穆曇舴N類。而該處理器9可預(yù)先設(shè)定幾種具指針性的聲音,如玻璃破碎聲、撞擊聲,且當(dāng)該分類器82判斷出該麥克風(fēng)6接收到的聲音信號(hào)是屬于預(yù)先設(shè)定的指針聲音時(shí),則該處理器9則通知該喇叭7發(fā)出警示聲,以提醒使用者有小偷入侵或是安全系統(tǒng)已遭到破壞了。
而該分類器82所使用的方法可為S.-T.Bow所著的,并于1984年由Jwang Yuan出版的“Pattern Recognition”中所述的馬霍諾畢斯距離(Mahalanobis Distance)法。該方法主要是計(jì)算麥克風(fēng)6收到的聲音信號(hào)的特征值與數(shù)據(jù)庫83中所存的指針聲音的特征向量之間的距離,并且在計(jì)算距離的過程中,相對(duì)于歐幾里得距離法(Euclidian Distance)只對(duì)數(shù)據(jù)庫83中的特征向量的統(tǒng)計(jì)特性中的平均值(Mean)做計(jì)算,馬霍諾畢斯距離法也對(duì)特征向量的統(tǒng)計(jì)特性中的變異值(Variance)做計(jì)算。在相同的歐幾里得距離的情況下,若數(shù)據(jù)庫83中的指針聲音的特征向量的變異值大的,在馬霍諾畢斯距離法運(yùn)算下,將有較大可能被判斷為是收到的聲音。
但已知加入聲音辨識(shí)系統(tǒng)8雖可以幫助使用者分析出該麥克風(fēng)6是否接收到異常的聲音信號(hào),但該特征擷取器81可能會(huì)對(duì)不同種類的聲音信號(hào)判斷出相同的特征,故已知的聲音辨識(shí)系統(tǒng)8具有的辨識(shí)正確率不高,而常常出現(xiàn)辨識(shí)錯(cuò)誤的情形,即該聲音辨識(shí)系統(tǒng)8誤判接收到的聲音信號(hào)是具有指針性的聲音,故會(huì)誤啟動(dòng)報(bào)警聲,或是接收到的聲音信號(hào)的確是具有指針性的聲音種類,但卻沒有正確判斷出而未激活報(bào)警聲提醒,造成安全上的漏洞。

發(fā)明內(nèi)容
因此,本發(fā)明的目的是提供一種聲音辨識(shí)系統(tǒng),且該聲音辨識(shí)系統(tǒng)具有較佳的聲音辨識(shí)率。
因此,本發(fā)明的另一目的是提供一種具有聲音辨識(shí)系統(tǒng)的安全裝置,且因該安全裝置包含該具有較佳辨識(shí)率的聲音辨識(shí)系統(tǒng),故能改善安全系統(tǒng)誤判的現(xiàn)象。
于是,本發(fā)明的聲音辨識(shí)系統(tǒng)是包含諧波偵測(cè)器、特征擷取器、第一數(shù)據(jù)庫、第二數(shù)據(jù)庫和分類器。
該諧波偵測(cè)器可判斷該聲音信號(hào)是否為諧波信號(hào)。而該特征擷取器可找出該聲音信號(hào)的特征向量。且該第一數(shù)據(jù)庫儲(chǔ)存多種呈諧波形式的信號(hào)的特征向量,而該第二數(shù)據(jù)庫則儲(chǔ)存多種呈非諧波形式的信號(hào)的特征向量。
而該分類器與該多個(gè)數(shù)據(jù)庫電連接,并根據(jù)該諧波偵測(cè)器判斷出的結(jié)果選擇相對(duì)應(yīng)的數(shù)據(jù)庫,即當(dāng)該聲音信號(hào)是一諧波信號(hào)時(shí)則選擇該第一數(shù)據(jù)庫,而當(dāng)該聲音信號(hào)是一非諧波信號(hào)時(shí),則選擇該第二數(shù)據(jù)庫,且該分類器可接收該特征擷取器判斷出的特征向量,并根據(jù)所選擇的數(shù)據(jù)庫內(nèi)所存的特征向量來判斷該聲音信號(hào)的種類。
于是,本發(fā)明利用上面所提到的之聲音辨識(shí)系統(tǒng)的安全裝置除了包含該聲音辨識(shí)系統(tǒng)外,也包含一接收器和一監(jiān)控器。
該接收器可接收該聲音信號(hào),并將該聲音信號(hào)傳送至該聲音辨識(shí)系統(tǒng)。而該監(jiān)控器與該聲音辨識(shí)系統(tǒng)的分類器電連接,并可預(yù)設(shè)幾種指針性聲音,且當(dāng)由該分類器判斷出的分類結(jié)果是符合該等指針性聲音的其中一個(gè)種類時(shí),則該監(jiān)控器會(huì)發(fā)出警示通知。


圖1是已知的具有聲音辨識(shí)系統(tǒng)的安全裝置的方框圖;
圖2是本發(fā)明具有聲音辨識(shí)系統(tǒng)的安全裝置的優(yōu)選實(shí)施例的方框圖;圖3是該優(yōu)選實(shí)施例的聲音辨識(shí)系統(tǒng)的系統(tǒng)方框圖;圖4是一個(gè)示意圖,說明利用聲音信號(hào)的自相關(guān)系數(shù)與一個(gè)臨界值來判斷該聲音信號(hào)是否呈諧波形式;圖5是一個(gè)示意圖,說明該優(yōu)選實(shí)施例的顯示器所顯示的畫面;及圖6是該優(yōu)選實(shí)施例的用來建立二數(shù)據(jù)庫的系統(tǒng)。
具體實(shí)施例方式
有關(guān)本發(fā)明的前述及其它技術(shù)內(nèi)容、特點(diǎn)與功效,在以下配合參考附圖的一個(gè)優(yōu)選實(shí)施例的詳細(xì)說明中,將更加顯而易見。
參見圖2,本發(fā)明具有聲音辨識(shí)系統(tǒng)的安全裝置的優(yōu)選實(shí)施例包含聲音辨識(shí)系統(tǒng)1、接收器2及監(jiān)控器3。
該接收器2包括可接收聲音信號(hào)的麥克風(fēng)21及攝影機(jī)22,且該麥克風(fēng)21可將接收到的聲音信號(hào)傳至該聲音辨識(shí)系統(tǒng)1,而該攝影機(jī)22則可將擷取到的影像傳送至該監(jiān)控器3。而在本實(shí)施例中,該麥克風(fēng)21可接收的聲音包含電視節(jié)目聲、汽車?yán)嚷暋⒉A扑槁?、口哨聲、撕裂聲、撞擊聲及電話鈴聲等聲音?br> 配合參考圖3,該聲音辨識(shí)系統(tǒng)1包括諧波(Harmonic)偵測(cè)器11、特征擷取器12、分類器13、第一數(shù)據(jù)庫14、第二數(shù)據(jù)庫15及聲音偵測(cè)器16。
該聲音偵測(cè)器16可接收該麥克風(fēng)21傳來的聲音信號(hào),并在該聲音信號(hào)的強(qiáng)度大于默認(rèn)值時(shí),才將該聲音信號(hào)傳入該諧波偵測(cè)器11及該特征擷取器12。而在本實(shí)施例中,該默認(rèn)值是取前20次接收的聲音信號(hào)之平均強(qiáng)度,且將平均強(qiáng)度加上一調(diào)整量。
如圖4所示,該諧波偵測(cè)器11可判斷該聲音信號(hào)是一種諧波信號(hào)或是一種非諧波(Non-harmonic)信號(hào)。而在本實(shí)施例中,該諧波偵測(cè)器11判斷的方式是計(jì)算該聲音信號(hào)的自相關(guān)系數(shù)(Autocorrelation),且判斷該自相關(guān)系數(shù)的第二高峰值是否高于一個(gè)預(yù)設(shè)的臨界值,且此臨界值至少要大于自相關(guān)系數(shù)的第一高峰值的二分之一。若該自相關(guān)系數(shù)的第二高峰值高于該臨界值,則判斷該聲音信號(hào)是屬于諧波信號(hào),若低于該臨界值,則判斷該聲音信號(hào)是屬于非諧波信號(hào)。
但需注意的是,該諧波偵測(cè)器11也可用其它方法來判斷該聲音信號(hào)是否為諧波信號(hào),并不以本實(shí)施例所提的內(nèi)容為限。而本實(shí)施例所用的自相關(guān)系數(shù)法是在時(shí)域(Time Domain)上判斷出諧波信號(hào),但也可用其它在頻域(Frequency Domain)上的方法來判斷出諧波信號(hào),如判斷在頻域上是否有相對(duì)于其它頻率而言,具有很高強(qiáng)度的頻率成分。
回來參閱圖3,該特征擷取器12可將該聲音信號(hào)的特征分離出來,而在本實(shí)施例中,該特征擷取器12是使用一種已知的梅爾倒頻譜參數(shù)(Mel-scale Frequency Cepstral Coefficients,簡稱MFCC)的方法來分析出聲音信號(hào)的特征。且該方法已在現(xiàn)有技術(shù)中說明,故在此不再贅述。此外,值得注意的是,本發(fā)明的特征擷取器12所使用的方法也可為頻域系數(shù)分析法或其它方法,并不以上述所提到的內(nèi)容為限。
該第一數(shù)據(jù)庫14儲(chǔ)存多個(gè)呈諧波形式的信號(hào)的特征向量,而該第二數(shù)據(jù)庫15則儲(chǔ)存多個(gè)呈非諧波形式的信號(hào)的特征向量。
而該分類器13與該特征擷取器12、該諧波偵測(cè)器11及該等數(shù)據(jù)庫14、15電連接,并可接收該特征擷取器12判斷出的特征向量,并根據(jù)該諧波偵測(cè)器11判斷出的結(jié)果選擇相對(duì)應(yīng)的數(shù)據(jù)庫14、15,以根據(jù)所對(duì)應(yīng)的數(shù)據(jù)庫14、15內(nèi)所存的特征向量判斷該聲音信號(hào)的種類。即當(dāng)該諧波偵測(cè)器11判斷出該聲音信號(hào)是呈諧波形式的信號(hào)時(shí),則將由該特征擷取器12傳來的特征向量與該第一數(shù)據(jù)庫14中所存的多個(gè)特征向量作比較,而當(dāng)該諧波偵測(cè)器11判斷出該聲音信號(hào)是呈非諧波形式的信號(hào)時(shí),則將由該特征擷取器12傳來的特征向量與該第二數(shù)據(jù)庫15中所存的多個(gè)特征向量作比較。
而在本實(shí)施例中,該分類器13所采用的比對(duì)方法為在現(xiàn)有技術(shù)中已提到的馬霍諾畢斯距離法,但該分類器13也可用其它方法如L.Rabiner與B.-H.Juang所著,并于1993年由Prentice Hall出版的“Fundamentals ofSpeech Recognition”中所述的隱藏式馬沃夫模型(Hidden Markov models)來判斷,且并不以此兩種為限。
回來參閱圖2,該監(jiān)控器3可以是電子產(chǎn)品或安裝在掌上型電子產(chǎn)品上,如手機(jī)、桌上型計(jì)算機(jī)、筆記型計(jì)算機(jī)、個(gè)人數(shù)字助理、電視等,以方便使用者隨時(shí)監(jiān)控居家安全。而該監(jiān)控器3包括處理器31、顯示器32、第一存儲(chǔ)器33、第二存儲(chǔ)器34、喇叭35及發(fā)光單元36。
該顯示器32可顯示該攝影機(jī)22所擷取的影像,而該處理器31與該分類器13、顯示器32、第一存儲(chǔ)器33、第二存儲(chǔ)器34、喇叭35及發(fā)光單元36電連接,并預(yù)設(shè)幾種指針性聲音與安全相關(guān),如玻璃破碎聲、撞擊聲、敲打聲等,且也可進(jìn)一步將該等指針性聲音區(qū)分安全等級(jí)。而當(dāng)由該分類器13判斷出的分類結(jié)果是符合該等指針性聲音的其中一種類時(shí),則該處理器31會(huì)通知該喇叭35發(fā)出警示聲,并控制該發(fā)光單元36發(fā)出閃爍的燈光。而該攝影機(jī)22在激活時(shí),所擷取到的影像即會(huì)一直儲(chǔ)存于該第一存儲(chǔ)器33內(nèi),且當(dāng)指針性聲音出現(xiàn)時(shí),則該處理器31會(huì)將由該攝影機(jī)22攝取的影像另外存儲(chǔ)在該第二存儲(chǔ)器34內(nèi)。
此外,如果該監(jiān)控器3安裝在手機(jī)中,則當(dāng)由該分類器13判斷出的分類結(jié)果是符合該等指針性聲音的其中一個(gè)種類時(shí),則該處理器31則可發(fā)出一短消息通知,以通報(bào)使用者有小偷入侵。而當(dāng)該監(jiān)控器3安裝在計(jì)算機(jī)中時(shí),則也可通過發(fā)出電子郵件的方式來通知使用者。
如圖5所示,是本實(shí)施例中該顯示器32顯示的使用者接口,包括文字區(qū)、影像區(qū)、聲音播放狀態(tài)區(qū)。該文字區(qū)可顯示與該指針性聲音相對(duì)應(yīng)的文字,而該影像區(qū)可播放該攝影機(jī)22所擷取的動(dòng)態(tài)影像或靜態(tài)影像,而該聲音播放狀態(tài)區(qū)可顯示目前喇叭35的音量大小及相關(guān)聲音信息。
而建立該等數(shù)據(jù)庫14、15的方法是利用如圖6所示的系統(tǒng),該系統(tǒng)利用該特征擷取器12、諧波偵測(cè)器11及判斷器17,且該特征擷取器12與諧波偵測(cè)器11與上述相同,故在此不再贅述。而使用者可將搜集的多數(shù)筆多種類的聲音信號(hào)一筆一筆地輸入至該諧波偵測(cè)器11及特征擷取器12,以判斷出每一筆信號(hào)的特征及每一筆信號(hào)是否為一諧波信號(hào)。而該判斷器17則先將屬于諧波信號(hào)的分成一大類,且屬于非諧波信號(hào)的分成另一大類,再分別對(duì)該兩大類進(jìn)一步細(xì)分成多種聲音信號(hào)。
在此舉一簡單例子說明若搜集的聲音信號(hào)包括100筆電話鈴聲、100筆口哨聲、及100筆撕紙聲。則將這些聲音一一輸入至特征擷取器12及該諧波偵測(cè)器11。而該諧波偵測(cè)器11則一一對(duì)每筆信號(hào)判斷,并可判斷出該100筆電話鈴聲及該100筆口哨聲都屬于諧波信號(hào),而該100筆撕紙聲則屬于非諧波信號(hào)。而該判斷器17則將該100筆電話鈴聲及該100筆口哨聲先分至第一大類,并將該100筆撕紙聲分至第二大類。且該判斷器17則利用該特征擷取器12傳來的特征將該第一大類中的聲音信號(hào)繼續(xù)細(xì)分,而最后可得第一大類中將分成二小類,其中一小類即屬于電話鈴聲而另一小類則為口哨聲。而在本實(shí)施例中該判斷器17將一大類中再細(xì)分成多個(gè)小類的方法是使用Z.Huang于1998在Data Mining and KnowledgeDiscovery.Vol.2,pp.283-304,中所提出的“Extensions to the k-MeansAlgorithm for Clustering Large Data Sets with Categorical Values”的方法。
值得注意的是,本實(shí)施例中的接收器2雖然同時(shí)包括該麥克風(fēng)21及該攝影機(jī)22,但該接收器2也可不包括該攝影機(jī)22,且此時(shí),該監(jiān)控器3則不需該顯示器32及該第一存儲(chǔ)器33和第二存儲(chǔ)器34。
此外,該聲音辨識(shí)系統(tǒng)1也可不包含該聲音偵測(cè)器16,即該麥克風(fēng)21接收到的所有聲音信號(hào)可直接輸入至該諧波偵測(cè)器11及特征擷取器12中作分析,而不會(huì)影響本發(fā)明的主要功能。
且本發(fā)明的聲音辨識(shí)系統(tǒng)1也不限于用在本實(shí)施例所述的安全裝置,而可獨(dú)立成一商品販賣或是安裝于其它裝置使用,如聲控家電及聲控遙控器等。
綜上所述,本發(fā)明因?yàn)榫哂性撝C波偵測(cè)器11,故可判斷接收到的聲音信號(hào)是否為一諧波信號(hào)或一非諧波信號(hào),以得到不同于該特征擷取器12判斷出的特征,并根據(jù)該二數(shù)據(jù)庫14、15對(duì)諧波信號(hào)與非諧波信號(hào)分別進(jìn)行分類。故能比已知的聲音辨識(shí)系統(tǒng)8具有較高的正確辨識(shí)率,進(jìn)而使本發(fā)明的安全裝置具有較佳的可靠度與便利性。
上面以結(jié)合本發(fā)明的優(yōu)選實(shí)施例對(duì)本發(fā)明進(jìn)行了描述,上面的描述不意味著本發(fā)明的實(shí)施范圍限制于此,本領(lǐng)域技術(shù)人員應(yīng)該理解,對(duì)本發(fā)明的說明內(nèi)容及實(shí)施例的簡單的等效變化與改變不脫離所附權(quán)利要求覆蓋的本發(fā)明的范圍。
權(quán)利要求
1.一種可辨識(shí)聲音信號(hào)的聲音辨識(shí)系統(tǒng),包含諧波偵測(cè)器,用于判斷該聲音信號(hào)是否為諧波信號(hào);特征擷取器,用于找出該聲音信號(hào)的特征向量;第一數(shù)據(jù)庫,用于儲(chǔ)存多種呈諧波形式的信號(hào)的特征向量;第二數(shù)據(jù)庫,用于儲(chǔ)存多種呈非諧波形式的信號(hào)的特征向量;及分類器,與該多個(gè)數(shù)據(jù)庫電連接,并根據(jù)該諧波偵測(cè)器判斷出的結(jié)果選擇相對(duì)應(yīng)的數(shù)據(jù)庫,即當(dāng)該聲音信號(hào)是諧波信號(hào)時(shí)則選擇該第一數(shù)據(jù)庫而當(dāng)該聲音信號(hào)是一非諧波信號(hào)時(shí),則選擇該第二數(shù)據(jù)庫,且該分類器可接收該特征擷取器判斷出的特征向量,并根據(jù)所選擇的數(shù)據(jù)庫內(nèi)所存儲(chǔ)的特征向量來判斷該聲音信號(hào)的種類。
2.根據(jù)權(quán)利要求1所述的聲音辨識(shí)系統(tǒng),還包含聲音偵測(cè)器,用于接收該聲音信號(hào)并在該聲音信號(hào)的強(qiáng)度大于默認(rèn)值時(shí),才將該聲音信號(hào)傳入該諧波偵測(cè)器及該特征擷取器中。
3.根據(jù)權(quán)利要求1所述的聲音辨識(shí)系統(tǒng),其中,該諧波偵測(cè)器計(jì)算該聲音信號(hào)的自相關(guān)系數(shù),并判斷該自相關(guān)系數(shù)的第二高峰值是否高于一預(yù)設(shè)的臨界值,若高于該臨界值,則判斷該聲音信號(hào)是屬于一諧波信號(hào),若低于該臨界值,則判斷該聲音信號(hào)是屬于一非諧波信號(hào)。
4.根據(jù)權(quán)利要求1所述的聲音辨識(shí)系統(tǒng),其中,該特征擷取器利用梅爾倒頻譜參數(shù)的方法找出該聲音信號(hào)的特征向量。
5.根據(jù)權(quán)利要求1所述的聲音辨識(shí)系統(tǒng),其中,該分類器是利用馬霍諾畢斯距離法來對(duì)該聲音信號(hào)進(jìn)行分類的動(dòng)作。
6.根據(jù)權(quán)利要求1所述的聲音辨識(shí)系統(tǒng),還包括用來建立該多個(gè)數(shù)據(jù)庫的判斷器,而建立該多個(gè)數(shù)據(jù)庫的方法是將多筆多種類的聲音信號(hào)一筆一筆地經(jīng)由該諧波偵測(cè)器及特征擷取器處理,以判斷出每一筆信號(hào)的特征及每一筆信號(hào)是否為諧波信號(hào),而該判斷器則可接收該諧波偵測(cè)器及該特征擷取器的處理結(jié)果,并先將屬于諧波信號(hào)的分成一大類且屬于非諧波信號(hào)的分成另一大類,再分別對(duì)該兩大類進(jìn)一步細(xì)分成多種聲音信號(hào),以建立該多個(gè)數(shù)據(jù)庫。
7.一種安全裝置,包括如權(quán)利要求1所述的聲音辨識(shí)系統(tǒng),;接收器,用于接收聲音信號(hào),并將聲音信號(hào)傳送至該聲音辨識(shí)系統(tǒng);和監(jiān)控器,與該聲音辨識(shí)系統(tǒng)的分類器電連接,并可預(yù)設(shè)幾種指針性聲音,且當(dāng)由該分類器判斷出的分類結(jié)果是符合該多個(gè)指針性聲音的其中一種類時(shí),該監(jiān)控器發(fā)出警示通知。
8.根據(jù)權(quán)利要求7所述的安全裝置,其中,該接收器包括接收該聲音信號(hào)的麥克風(fēng),而該監(jiān)控器包括與該分類器電連接的處理器和喇叭,當(dāng)由該分類器判斷出的分類結(jié)果是符合該多個(gè)指針性聲音的其中一個(gè)種類時(shí),該處理器會(huì)通知該喇叭發(fā)出警示聲。
9.根據(jù)權(quán)利要求7所述的安全裝置,其中,該監(jiān)控器包括與該分類器電連接的處理器及發(fā)光單元,當(dāng)由該分類器判斷出的分類結(jié)果是符合該多個(gè)指針性聲音的其中一個(gè)種類時(shí),則該處理器通知該發(fā)光單元發(fā)出亮光。
10.根據(jù)權(quán)利要求7所述的安全裝置,其中,該接收器包括可攝取影像的攝影機(jī),而該監(jiān)控器包括顯示器,且該顯示器可顯示該攝影機(jī)攝取的影像。
11.根據(jù)權(quán)利要求10所述的安全裝置,其中,該監(jiān)控器還包括與該分類器電連接的處理器和與該處理器電連接的第一存儲(chǔ)器,而該第一存儲(chǔ)器可在該攝影機(jī)激活時(shí)即存儲(chǔ)該攝影機(jī)所攝取的影像資料。
12.根據(jù)權(quán)利要求10所述的安全裝置,其中,該監(jiān)控器還包括與該分類器電連接的處理器和與該處理器電連接的第二存儲(chǔ)器,當(dāng)由該分類器判斷出的分類結(jié)果是符合該多個(gè)指針性聲音的其中一個(gè)種類時(shí),則該處理器將該攝影機(jī)攝取的影像存儲(chǔ)在該第二存儲(chǔ)器內(nèi)。
13.根據(jù)權(quán)利要求10所述的安全裝置,其中,該顯示器可顯示相對(duì)于該指針性聲音的文字、靜態(tài)影像及動(dòng)態(tài)影像。
14.根據(jù)權(quán)利要求7所述的安全裝置,其中,該監(jiān)控器安裝在掌上型電子產(chǎn)品上。
15.根據(jù)權(quán)利要求14所述的安全裝置,其中,該監(jiān)控器發(fā)出的警示通知是手機(jī)短消息。
16.根據(jù)權(quán)利要求14所述的安全裝置,其中,該監(jiān)控器發(fā)出的警示通知是電子郵件。
17.根據(jù)權(quán)利要求7所述的安全裝置,其中,該聲音辨識(shí)系統(tǒng)還包括聲音偵測(cè)器,該聲音偵測(cè)器接收該聲音信號(hào)并在該聲音信號(hào)的強(qiáng)度大于默認(rèn)值時(shí),才將該聲音信號(hào)傳入該諧波偵測(cè)器及該特征擷取器中。
18.根據(jù)權(quán)利要求7所述的安全裝置其中,該諧波偵測(cè)器是計(jì)算該聲音信號(hào)的自相關(guān)系數(shù),且判斷該自相關(guān)系數(shù)的第二高峰值是否高于預(yù)設(shè)的臨界值,如果高于該臨界值,則判斷該聲音信號(hào)屬于諧波信號(hào),如果低于該臨界值,則判斷該聲音信號(hào)屬于非諧波信號(hào)。
19.根據(jù)權(quán)利要求7所述的安全裝置,其中,該特征擷取器利用梅爾倒頻譜參數(shù)的方法找出該聲音信號(hào)的特征向量。
20.根據(jù)權(quán)利要求7所述的安全裝置,其中,該分類器利用馬霍諾畢斯距離法來對(duì)該聲音信號(hào)進(jìn)行分類的動(dòng)作。
21.根據(jù)權(quán)利要求7所述的安全裝置,其中,該聲音辨識(shí)系統(tǒng)還包括用來建立該多個(gè)數(shù)據(jù)庫的判斷器,而建立該多個(gè)數(shù)據(jù)庫的方法是將多數(shù)筆多種類的聲音信號(hào)一筆一筆地經(jīng)由該諧波偵測(cè)器及特征擷取器處理,以判斷出每一筆信號(hào)的特征及每一筆信號(hào)是否為諧波信號(hào),而該判斷器則可接收該諧波偵測(cè)器及該特征擷取器的處理結(jié)果,并先將屬于諧波信號(hào)的分成一大類且屬于非諧波信號(hào)的分成另一大類,再分別對(duì)該兩大類進(jìn)一步細(xì)分成多種聲音信號(hào),以建立出該多個(gè)數(shù)據(jù)庫。
全文摘要
一種聲音辨識(shí)系統(tǒng),包含可判斷該聲音信號(hào)是否為諧波信號(hào)的諧波偵測(cè)器、可找出該聲音信號(hào)的特征向量的特征擷取器、存儲(chǔ)多種呈諧波形式的信號(hào)的特征向量的第一數(shù)據(jù)庫、存儲(chǔ)多種呈非諧波形式的信號(hào)的特征向量的第二數(shù)據(jù)庫及一分類器,而該分類器可根據(jù)該諧波偵測(cè)器判斷出的結(jié)果選擇相對(duì)應(yīng)的數(shù)據(jù)庫,且可接收該特征擷取器判斷出的特征向量,并根據(jù)所選擇的數(shù)據(jù)庫內(nèi)所存儲(chǔ)的特征向量來判斷該聲音信號(hào)的種類。
文檔編號(hào)G10L15/00GK1776807SQ20041009261
公開日2006年5月24日 申請(qǐng)日期2004年11月15日 優(yōu)先權(quán)日2004年11月15日
發(fā)明者吳建明, 林哲民, 嚴(yán)嘉鑫, 邱毓翰 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1