專利名稱:比較發(fā)音進(jìn)行安全控制的方法
背景技術(shù):
發(fā)明領(lǐng)域本發(fā)明一般涉及用于模擬或者比較人體特征(譬如指紋、聲音模式以及視網(wǎng)膜模式)以便對(duì)個(gè)人加以區(qū)分的電子安全方法,更特別的是,它涉及一種用于模擬與比較發(fā)音來控制安全裝置運(yùn)行的安全方法及協(xié)議。
相關(guān)技術(shù)的說明下述技術(shù)詳細(xì)說明了這一領(lǐng)域的當(dāng)前狀態(tài)。
Parra(帕拉)的美國(guó)專利5,313,556描述了一個(gè)(已知或未知)個(gè)人的、通過他的口鼻通道所發(fā)聲音的某種聲波特性數(shù)據(jù)來加以確定的獨(dú)特性質(zhì)。這些聲音被轉(zhuǎn)換為數(shù)字電氣信號(hào),并生成一個(gè)包括頻率、振幅與時(shí)間采樣三個(gè)方面的格式來產(chǎn)生構(gòu)成人的聲波特性數(shù)據(jù)的一個(gè)峰谷陣列。某位已知個(gè)人的相同格式的聲波特性數(shù)據(jù)源或庫(kù)具有某種相互關(guān)系,這種相互關(guān)系包括該已知個(gè)人的上述聲波特性數(shù)據(jù)的上述峰谷與上述未知的被比較個(gè)人的上述峰谷的相對(duì)位置,而且在檢測(cè)到或未檢測(cè)到上述聲波特性數(shù)據(jù)之間的某種相關(guān)時(shí)會(huì)提供一個(gè)應(yīng)用信號(hào)。
Hair(海爾)等人的美國(guó)專利3,673,331描述一種在各具有多個(gè)終端的、互相分離的若干設(shè)備上完成的聲音確認(rèn)方法。多路傳輸?shù)慕Y(jié)構(gòu)通過一個(gè)通信鏈接將這些終端互相連接到一個(gè)中央處理站。從這些終端發(fā)送的、模擬的聲音復(fù)現(xiàn)信號(hào)被轉(zhuǎn)換為數(shù)字信號(hào)。這些數(shù)字信號(hào)在該中央處理站內(nèi)被變換到頻域。將這些變換后信號(hào)的預(yù)定特征與需要確認(rèn)的聲音的、已被存儲(chǔ)的預(yù)定特征加以比較。然后根據(jù)這些預(yù)定特征的比較結(jié)果將一個(gè)確認(rèn)或未確認(rèn)信號(hào)發(fā)送到該特定終端。
Waterbury(沃特伯里)的美國(guó)專利3,896,266描述了一個(gè)符合該發(fā)明的安全卡(可以是一張信用卡),卡上錄制了識(shí)別某位個(gè)人的數(shù)據(jù)以及該卡的授權(quán)持有人的不可偽造的特征,譬如聲音特征。一個(gè)符合該發(fā)明的卡應(yīng)用系統(tǒng)提供了將由這些數(shù)據(jù)所記錄的特征與希望使用該卡的人的相應(yīng)特征進(jìn)行比較的裝置,從而基本上消除了非授權(quán)的用卡可能性。
Murol(默羅爾)等人的美國(guó)專利4,833,713描述了一個(gè)聲音或語(yǔ)音識(shí)別系統(tǒng),該系統(tǒng)包括用于將聲音轉(zhuǎn)變?yōu)殡姎饴曇粜盘?hào)的一個(gè)麥克風(fēng)、用于生成具有時(shí)間-頻率分布格式的聲音模式的一個(gè)頻率分析器以及使該聲音模式與注冊(cè)的聲音模式進(jìn)行匹配的匹配單元。
Feix(菲克斯)等人的美國(guó)專利4,449,189描述了通過語(yǔ)音與面部識(shí)別的某種組合來識(shí)別人的一種方法與一臺(tái)裝置。某位被訊問人對(duì)一個(gè)麥克風(fēng)發(fā)出一個(gè)關(guān)鍵詞的聲音信號(hào)在一個(gè)模式匹配器中與預(yù)先存儲(chǔ)的已知個(gè)人發(fā)出該相同關(guān)鍵詞的聲音信號(hào)加以比較,從而獲得一個(gè)第一相似性評(píng)分。同時(shí),在該被訊問人發(fā)出該關(guān)鍵詞的過程中出現(xiàn)關(guān)鍵事件時(shí),用光學(xué)方式記錄那個(gè)人口部區(qū)域的一幅瞬間圖像,在該圖像上投影一個(gè)網(wǎng)格模式,并與預(yù)先存儲(chǔ)的、該相同已知個(gè)人的相應(yīng)瞬間圖像加以比較來獲得一個(gè)第二相似性評(píng)分。
該現(xiàn)有技術(shù)講述了時(shí)間域與頻率域中聲音信號(hào)的比較。但是,該現(xiàn)有技術(shù)沒有講到某種采用差分技術(shù)來對(duì)這些聲音特性數(shù)據(jù)進(jìn)行濾波的裝置。本發(fā)明方法滿足這些需要,并進(jìn)一步提供下述概要中所述的相關(guān)優(yōu)點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明講述能達(dá)到下述目的方法中所具有的好處。
本發(fā)明是一種將當(dāng)前的口頭發(fā)音(utterance)與預(yù)先錄制的(注冊(cè))口頭發(fā)音加以比較的安全保護(hù)方法,它將當(dāng)前發(fā)音的頻域表示與預(yù)先錄制的、該相同內(nèi)容的多次重復(fù)發(fā)音相比較來構(gòu)成一個(gè)比較基準(zhǔn)。本方法不像傳統(tǒng)方法那樣在時(shí)域比較該發(fā)音,而是通過確定整個(gè)頻域的多種單元的能量來進(jìn)行比較,而且本方法不是集中注意一個(gè)人從一次試驗(yàn)到相隔幾天、幾周或更長(zhǎng)時(shí)間后的下一次試驗(yàn)重復(fù)發(fā)音的能力,而是集中注意相同單詞或短語(yǔ)的多次發(fā)音之間的差別的可變性。具體地講,該方法在對(duì)企圖打開一個(gè)安全設(shè)備(譬如一個(gè)入口鎖)的、經(jīng)過允許與未經(jīng)允許的人員進(jìn)行區(qū)分的一次嘗試中,試圖確定兩個(gè)聲音是否由相同的人聲所形成。此外,該方法可以被用來確定該人正在給出什么命令,并從該相同個(gè)人發(fā)出的所有這類命令的庫(kù)中挑出該選定的命令。
本方法的發(fā)明具有一個(gè)重要的方面,即將一個(gè)當(dāng)前口頭發(fā)出的單詞或短語(yǔ)與這類發(fā)音庫(kù)中存儲(chǔ)的相同發(fā)音加以區(qū)分或匹配。本方法的另一個(gè)方面是利用差分方法進(jìn)行比較,從而在口頭發(fā)音的區(qū)分與/或匹配中獲得高精度的快速結(jié)果。本方法是一種非顯而易見的、高效的、用來將很大的數(shù)據(jù)集合與查詢進(jìn)行極快速比較以便提供方便的程序,譬如說,在一扇由各自具有口頭通行代碼的大量個(gè)人使用的安全門前采用純口頭查詢,已經(jīng)證明,其中獲準(zhǔn)通過的遲延時(shí)間在幾秒鐘或更短的時(shí)間范圍內(nèi)。該方法還能達(dá)到對(duì)個(gè)人加以區(qū)分的極高水平,并同時(shí)對(duì)該人聲音在語(yǔ)調(diào)、音質(zhì)及音量中不時(shí)出現(xiàn)的正常改變與變化給予高水平的“寬容”。本方法的區(qū)分能力為軍事以及工業(yè)應(yīng)用提供了足夠高的可信度,而且在居所使用、商業(yè)使用以及在消費(fèi)電子設(shè)備與玩具中獲得應(yīng)用既不昂貴也很簡(jiǎn)單。本發(fā)明還有一個(gè)方面是在頻域的一組頻率范圍內(nèi)測(cè)試最低能量等級(jí),以及測(cè)試超過選定能量等級(jí)基準(zhǔn)的相應(yīng)能量等級(jí)。根據(jù)下面為提供對(duì)本發(fā)明原理的理解所作的更為詳細(xì)的說明,本發(fā)明的其他特點(diǎn)與優(yōu)點(diǎn)將會(huì)變得十分明顯。
具體實(shí)施例方式
本發(fā)明提供了一種按部就班的方法,可用于將講話人當(dāng)前的一個(gè)口頭發(fā)音(查詢發(fā)音)與預(yù)先錄制的口頭發(fā)音(注冊(cè)發(fā)音)加以比較以便確定該講話人的有效性,即確定該查詢發(fā)音是否由發(fā)出該注冊(cè)發(fā)音的同一個(gè)人發(fā)出。如果有效性得以確認(rèn),那么就授權(quán)一項(xiàng)操作,譬如打開一把鎖、撥打一個(gè)秘密電話號(hào)碼、準(zhǔn)予訪問數(shù)據(jù)或服務(wù)等等。該方法包括按順序執(zhí)行的步驟。大體上這些步驟可以說明如下首先,根據(jù)一個(gè)人或多個(gè)人的發(fā)音來準(zhǔn)備一個(gè)注冊(cè)數(shù)據(jù),其次,用一個(gè)人或多個(gè)人的當(dāng)前發(fā)音來查證該注冊(cè)數(shù)據(jù),最后,如果該查詢發(fā)音被認(rèn)為足夠接近一個(gè)注冊(cè)數(shù)據(jù)就執(zhí)行該安全操作。在這種情況下,該查詢?nèi)送▓?bào)他/她的身份,使得該比較只在同一個(gè)人的查詢發(fā)音與注冊(cè)發(fā)音之間進(jìn)行,即假定是該相同個(gè)人在查詢。在本方法的另一種使用情況中,可以存儲(chǔ)同一個(gè)人的一組不同發(fā)音來作為對(duì)幾個(gè)單詞或短語(yǔ)中每一個(gè)的注冊(cè)發(fā)音。在這種情況下,當(dāng)該查詢?nèi)苏f出一個(gè)已注冊(cè)發(fā)音后才進(jìn)行查證,而且其目的是將該查詢發(fā)音與該正確的注冊(cè)單詞或短語(yǔ)進(jìn)行匹配。
準(zhǔn)備注冊(cè)數(shù)據(jù)包括采用一個(gè)麥克風(fēng)或其他變送器將此后被稱之為一個(gè)注冊(cè)發(fā)音的口頭發(fā)音轉(zhuǎn)換為一個(gè)電氣信號(hào)的各個(gè)步驟。這個(gè)模擬電氣信號(hào)如同技術(shù)上熟知的那樣被變換為數(shù)字格式,譬如通過模擬到數(shù)字的轉(zhuǎn)換電路來進(jìn)行變換。對(duì)這個(gè)電氣信號(hào)的各段進(jìn)行快速傅立葉變換可以產(chǎn)生該注冊(cè)發(fā)音的許多頻域模型。這些電氣信號(hào)段的頻域模型被按照符合人聲平均音高區(qū)段的時(shí)間幀來進(jìn)行處理,譬如說,每幀大約20ms數(shù)據(jù)。只含有很低能量或不含能量的幀會(huì)被忽略。這樣會(huì)產(chǎn)生選定數(shù)量的這類模型,該數(shù)量可用變量M來表示,每個(gè)模型包含N個(gè)頻道的向量數(shù)據(jù)點(diǎn),從而構(gòu)成一個(gè)M×N的采樣注冊(cè)矩陣Ei。
M與N被選定為其大小符合該用戶所希望的安全等級(jí)需要的整數(shù),較大的數(shù)提供對(duì)該結(jié)果的較高可信度。該矩陣提供單元值Mi-Ni,其中i代表一個(gè)整數(shù),這些值由每個(gè)單元內(nèi)的總能量來表示,即用一個(gè)數(shù)來表示。其次,該方法可以確定,在N個(gè)頻道的至少Y(一個(gè)任意數(shù))個(gè)通道中,M個(gè)采樣中是否至少有X(另一個(gè)任意數(shù))個(gè)采樣具有選定的最低能量。如果沒有,那么就重復(fù)該注冊(cè)發(fā)音直到滿足標(biāo)準(zhǔn)X與Y為止,或者,如果沒有,那么在經(jīng)過幾次嘗試后就終止該注冊(cè)過程。這種情況通常只是在該講話人在他的或她的講話中不能提供足夠的音量來產(chǎn)生該最小能量標(biāo)準(zhǔn)、或者在該輸入不是人聲因而缺少必要的譜成分時(shí)才會(huì)發(fā)生。
當(dāng)該注冊(cè)成功時(shí),該過程就會(huì)被重復(fù)直到構(gòu)成了并存儲(chǔ)了選定數(shù)量的采樣矩陣為止,這里用Ei來表示這些矩陣。我們將這些矩陣記為E1、E2、E3等等。為了滿足成功注冊(cè)個(gè)聲音發(fā)音的需要,我們通常會(huì)需要至少三個(gè)這樣的矩陣。
其次,該方法需要求得各對(duì)注冊(cè)矩陣Ei之間的差值之和來確定一個(gè)差分矩陣EDi,它們彼此的關(guān)系為ED1=(E1-E2)+(E1-E3)、ED2=(E2-E1),(E2-E3)等等。采用若干算法在時(shí)間域上對(duì)每個(gè)獨(dú)立的幀與每個(gè)大致對(duì)應(yīng)的幀在矩陣之間進(jìn)行比較,并允許在時(shí)間上向前或向后跳過有限數(shù)量的幀以便獲得最好的匹配。這樣,我們就在構(gòu)成該注冊(cè)發(fā)音的過程中確定了該個(gè)別講話人的與其他獲得的發(fā)音不同的變化或可變性特征。
最后,根據(jù)每個(gè)矩陣Ei之間的差分EDi來計(jì)算最大注冊(cè)范圍ES,即ES=(ED1-ED2)或(ED2-ED3)或(ED1-ED3)中的最大值,而且只有當(dāng)ES<R1、而且只有在至少一個(gè)或多個(gè)差分EDi小于R2時(shí)才認(rèn)可該注冊(cè)數(shù)據(jù),這里R1是一個(gè)選定的被稱為“注冊(cè)范圍”的第一注冊(cè)標(biāo)準(zhǔn),R2是一個(gè)選定的被稱為“注冊(cè)基準(zhǔn)”的第二注冊(cè)標(biāo)準(zhǔn)。這一步驟的第一部分對(duì)本方法的可實(shí)施性至為關(guān)鍵,因?yàn)镽1限定了差分EDi之間的總變化必須小于R1標(biāo)準(zhǔn),否則我們就必須認(rèn)為對(duì)這個(gè)人而言,在該相同內(nèi)容的重復(fù)講話發(fā)音中的變化太小,所以在本方法中無法使用。這就向我們保證,從前獲得的錄音沒有被用于注冊(cè),也就是說,我們可以保證這些矩陣的差至少有通常對(duì)一個(gè)人聲所期望的那樣大。在該相同的錄音被用于任何兩個(gè)注冊(cè)采樣時(shí),我們會(huì)發(fā)現(xiàn)它們之間的可變化性要比由該人聲所產(chǎn)生的小。這一步驟的第二部分對(duì)本方法的可實(shí)施性也很關(guān)鍵,因?yàn)閷?duì)這個(gè)人而言,R2被用來判定在該相同內(nèi)容的重復(fù)講話發(fā)音中的變化太大,所以在本方法中無法使用。對(duì)現(xiàn)有技術(shù)而言,這很明顯是一個(gè)新步驟,它對(duì)判斷在一個(gè)時(shí)刻講話的發(fā)音對(duì)于在另一個(gè)時(shí)刻講話的相同發(fā)音之間的相關(guān)性以及判斷它與該個(gè)人重復(fù)那個(gè)發(fā)音的一致性的相互關(guān)系非常關(guān)鍵。該EDi值與該注冊(cè)采樣矩陣一道被存儲(chǔ)起來以備將來與查詢發(fā)音進(jìn)行比較。如果該采樣數(shù)據(jù)被改變,那么在與查詢發(fā)音進(jìn)行比較之前就破壞了該數(shù)據(jù)的完整性,該Edi參考值就可以被用來拒絕接收該注冊(cè)數(shù)據(jù)。
查證該注冊(cè)數(shù)據(jù)首先包括用一個(gè)麥克風(fēng)或其他變送器將一個(gè)口頭查詢發(fā)音變換為一個(gè)電氣信號(hào)的各個(gè)步驟。這個(gè)電氣信號(hào)像該注冊(cè)程序一樣被轉(zhuǎn)換為數(shù)字格式。對(duì)這個(gè)電氣信號(hào)的各部分進(jìn)行快速傅立葉變換來產(chǎn)生該查詢發(fā)音的許多頻域表示。這些電氣信號(hào)的頻域模型按照符合該人聲的平均音高區(qū)段的時(shí)間幀來進(jìn)行處理,譬如說,每幀大約20ms數(shù)據(jù)。含有很低能量或者不含能量的幀被忽略。然后認(rèn)可數(shù)量的幀,該數(shù)量仍用M來表示,每幀包含N個(gè)頻道的向量數(shù)據(jù)點(diǎn),以便構(gòu)成該查詢矩陣C的一個(gè)M×N的采樣,而且判定在N個(gè)頻道的至少Y個(gè)通道中,該M個(gè)采樣中是否至少有X個(gè)采樣具有選定的最小能量。
十分清楚,用于獲得該查詢矩陣的這些步驟與該注冊(cè)程序的相應(yīng)步驟完全一致。如果對(duì)最小能量的新近測(cè)試失敗,那么就重復(fù)這些查詢步驟,并在選定次數(shù)的重復(fù)之后終止該查詢,這是因?yàn)橐粋€(gè)冒名頂替者正在試圖打開該系統(tǒng),而且不應(yīng)當(dāng)讓這樣一個(gè)冒名頂替者未經(jīng)授權(quán)就獲得他/她操縱該系統(tǒng)所需要的嘗試次數(shù)。
然后,對(duì)每一對(duì)矩陣Ei計(jì)算C與Ei的差值之和,從而得到C與每一對(duì)注冊(cè)矩陣Ei之間的一個(gè)差CDi,它們彼此之間的關(guān)系為CD1=(C-E1)+(C-E2)、D2=(C-E2)_(C-E3)等等。采用若干算法將每一個(gè)獨(dú)立的幀與其他矩陣的每個(gè)相應(yīng)的時(shí)間幀加以比較,而且允許在時(shí)間上向前或向后跳過有限數(shù)量的幀,以便像對(duì)該注冊(cè)程序所作的那樣獲得最好的匹配。對(duì)這一步驟可以采用熟知的動(dòng)態(tài)時(shí)間扭曲技術(shù)。
最后,求出CDi值之間的最大差值的最大范圍CS,即CS=[(D1-D2)或(D2-D3)或(D3-D1)...]。這些步驟對(duì)應(yīng)與該注冊(cè)過程中的類似步驟。如果CS<V1,而且C與每一對(duì)CEi之間的至少一個(gè)上述差分CDi小于V2,就認(rèn)為C是一個(gè)有效查詢,其中V1是一個(gè)選定的第一確認(rèn)標(biāo)準(zhǔn),而V2是一個(gè)選定的第二確認(rèn)標(biāo)準(zhǔn)。V1及V2與該注冊(cè)程序中的R1與R2起相應(yīng)的作用,而且都被用于相同的目的。在符合這些標(biāo)準(zhǔn)時(shí),該口頭查詢發(fā)音就被認(rèn)可,并啟動(dòng)該必要的安全步驟。
我們已經(jīng)描述了本方法用于只認(rèn)為有一個(gè)查詢?nèi)说膽?yīng)用場(chǎng)合。在這種情況下只需要完成一個(gè)注冊(cè)。在這樣一個(gè)系統(tǒng)中,它的目的是保證只有一個(gè)已注冊(cè)的個(gè)人可以通過成功地向該方法提出查詢而進(jìn)入該系統(tǒng)。所有其他人,即冒名頂替者,不能成功地查證該方法,所以它們被該方法拒絕在所有安全系統(tǒng)之外。
很明顯,若對(duì)每個(gè)用戶完成一個(gè)注冊(cè),那么這樣一個(gè)系統(tǒng)就可以在同一時(shí)間對(duì)多個(gè)用戶使用該方法。在這種情況下,任何一位用戶都要提出一次查詢,而且對(duì)每個(gè)注冊(cè)都執(zhí)行該查詢方法,直到實(shí)現(xiàn)了一次成功的查詢、或者試驗(yàn)了所有注冊(cè)都不成功為止。
同樣也很明顯,該系統(tǒng)可以被用于具有若干注冊(cè)發(fā)音的單個(gè)用戶,從而根據(jù)匹配情況作出若干不同的可能操作。一個(gè)示例是使用該系統(tǒng)來打開一扇門上的鎖,然后打開房間的燈,再放出柔和的音樂,最后啟動(dòng)一臺(tái)烹飪?cè)O(shè)備來準(zhǔn)備正餐。這可以由一個(gè)單獨(dú)的查詢?nèi)税l(fā)出一系列口頭命令來完成,其中每個(gè)命令都在它與已注冊(cè)的相應(yīng)發(fā)音得以匹配后由伺服機(jī)構(gòu)執(zhí)行。
另外也很明顯,每個(gè)數(shù)據(jù)集合可以包括某項(xiàng)特定操作的詳細(xì)說明,從而使得在查詢與注冊(cè)之間獲得某種特定匹配時(shí),可以執(zhí)行與對(duì)應(yīng)于其他注冊(cè)的其他操作不同的特定操作。
盡管本發(fā)明的描述一直參考了希望的實(shí)施例,但是那些熟悉該技術(shù)的人員應(yīng)當(dāng)清楚地理解,本發(fā)明并不限于此。相反,本發(fā)明的范圍應(yīng)當(dāng)僅僅結(jié)合所附的權(quán)利要求來加以解釋。
權(quán)利要求
1.一種將一個(gè)口頭查詢發(fā)音與同一個(gè)人的幾個(gè)口頭注冊(cè)發(fā)音加以比較以便確定安全操作的方法,該方法包括如下步驟A)準(zhǔn)備一個(gè)注冊(cè)數(shù)據(jù),包括如下步驟a)生成口頭注冊(cè)發(fā)音的電氣信號(hào)表示的一個(gè)快速傅立葉變換以便產(chǎn)生它的一個(gè)注冊(cè)頻域表示;b)對(duì)N個(gè)頻道中每一個(gè)頻道取出該注冊(cè)頻域表示的M個(gè)注冊(cè)采樣以便構(gòu)成一個(gè)M×N的注冊(cè)矩陣E;c)判定在該N個(gè)頻道的至少Y個(gè)頻道中,該M個(gè)注冊(cè)采樣中是否至少有X個(gè)采樣具有選定的最小能量;d)如果在步驟(c)中的判斷為否定,則重復(fù)步驟(a)至(c),而且在步驟(a)至(c)的選定次數(shù)的否定重復(fù)后終止;e)如果在步驟(c)中的判斷為肯定,則重復(fù)步驟(a)至(c),直到構(gòu)成選定數(shù)量的上述采樣注冊(cè)矩陣Ei為止,記為E1、E2、E3、…;f)計(jì)算每個(gè)Ei之間的差值之和EDi,即ED1=(E1-E2)+(E1-E3)+…、ED2=(E2-E1)+(E2-E3)+…;g)通過將每個(gè)采樣在時(shí)間上向前與向后移動(dòng)來逐對(duì)比較這些注冊(cè)采樣,以便獲得一個(gè)最好的匹配;h)計(jì)算一個(gè)注冊(cè)范圍ES,它等于EDi的最大與最小值的差;以及i)在下述條件下認(rèn)可該注冊(cè)數(shù)據(jù)i.ES<R1,而且ii.EDi<R2,其中R1與R2為選定的注冊(cè)標(biāo)準(zhǔn)。B)查證該注冊(cè)數(shù)據(jù),包括如下步驟a)生成口頭查詢發(fā)音的電氣信號(hào)表示的一個(gè)快速傅立葉變換以便產(chǎn)生它的一個(gè)查詢頻域表示;b)對(duì)N個(gè)頻道中的每個(gè)頻道取出該查詢頻域表示中的M個(gè)查證采樣以便構(gòu)成一個(gè)M×N的查詢矩陣C;c)判定在該N個(gè)頻道的至少Y個(gè)頻道中,該M個(gè)查詢采樣中是否至少有X個(gè)采樣具有選定的最小能量;d)如果在步驟(c)中的判斷為否定,則重復(fù)步驟(a)至(c),而且在步驟(a)至(c)的選定次數(shù)的否定重復(fù)后終止;e)計(jì)算C與每個(gè)Ei之間的差值之和CDi,即CD1=(C-E1)+(C-E2)、CD2=(C-E2)+(C-E3)、CD3=(C-E3)+(C-E4)、…;f)通過將這些采樣在時(shí)間上向前與向后移動(dòng)來逐對(duì)比較每一個(gè)查詢采樣以便獲得最好的匹配;g)計(jì)算一個(gè)查詢范圍CS,它等于CDi的最大與最小值之間的差;而且h)在下述條件下認(rèn)可該查詢數(shù)據(jù)i.CS<V1,而且ii.CDi<V2,其中V1與V2為選定的確認(rèn)標(biāo)準(zhǔn)。C)如果認(rèn)可該口頭查詢發(fā)音就啟動(dòng)該安全操作。
2.權(quán)利要求1的方法,它還包括對(duì)選定的個(gè)人多次重復(fù)步驟(A)(a)至步驟(A)(i),從而產(chǎn)生若干個(gè)人注冊(cè)數(shù)據(jù)集合。
3.權(quán)利要求2的方法,它還包括如下步驟,即逐對(duì)比較若干個(gè)人注冊(cè)數(shù)據(jù)集合,而且在相應(yīng)的注冊(cè)范圍彼此相差不超過選定的數(shù)量時(shí)去除上述注冊(cè)數(shù)據(jù)集合中的每個(gè)新集合。
4.權(quán)利要求2的方法,它還包括如下步驟,即逐對(duì)比較若干個(gè)人注冊(cè)數(shù)據(jù)集合,而且在相應(yīng)的注冊(cè)范圍彼此相差超過選定的數(shù)量時(shí)去除上述注冊(cè)數(shù)據(jù)集合中的每個(gè)新集合。
5.權(quán)利要求1的方法,其中每個(gè)數(shù)據(jù)集合包括用來定義在成功的確認(rèn)后進(jìn)行特定安全操作的數(shù)據(jù),并采取另外的步驟來完成上述特定安全操作,上述安全操作包括產(chǎn)生一個(gè)電氣信號(hào)。
6.權(quán)利要求1的方法,它還包括為選定的操作多次重復(fù)步驟(A)(a)至步驟(A)(i),從而產(chǎn)生若干操作注冊(cè)數(shù)據(jù)集合。
全文摘要
一種通過對(duì)比發(fā)音的時(shí)間-頻域表述而將當(dāng)前的口頭發(fā)音與預(yù)先錄制的口頭發(fā)音加以比較的安全保護(hù)方法,其利用多次重復(fù)發(fā)音來構(gòu)成確定各人的重復(fù)性能的變化的基準(zhǔn),以及利用在注冊(cè)發(fā)音與查證發(fā)音之間類似的差異形成對(duì)注冊(cè)與查證發(fā)音之間變化的類似分析的基準(zhǔn)。在一個(gè)實(shí)施例中,由每個(gè)查證發(fā)音搜索注冊(cè)數(shù)據(jù)的集合,直到找到指示某一動(dòng)作的特定匹配,或者找到指示放棄的匹配。在一個(gè)應(yīng)用中,某人作為一個(gè)命令者被接受或拒絕,在另一個(gè)應(yīng)用中,一個(gè)對(duì)應(yīng)于一個(gè)口頭發(fā)命令的選定的動(dòng)作被接受。
文檔編號(hào)G10L17/00GK1774741SQ01818727
公開日2006年5月17日 申請(qǐng)日期2001年6月27日 優(yōu)先權(quán)日2000年11月10日
發(fā)明者布拉德利·艾倫·克萊門茨, 謝里·安·愛德考克, 杰拉爾德·S·施瓦茨 申請(qǐng)人:聲音安全系統(tǒng)公司