本發(fā)明涉及一種確定是否已經(jīng)飲酒的方法以及用于實(shí)施該方法的記錄介質(zhì)和裝置,并且更具體地,本發(fā)明涉及一種通過(guò)使用語(yǔ)音對(duì)差分信號(hào)中的頻率幀進(jìn)行比較來(lái)確定是否已經(jīng)飲酒的方法以及用于實(shí)施該方法的記錄介質(zhì)和裝置。
背景技術(shù):
雖然適量飲酒給人們提供各種好處,但是過(guò)度飲酒對(duì)健康有害。另外,酒后駕車(chē)會(huì)造成致命的事故,并且在某些情況下甚至導(dǎo)致死亡。
對(duì)于測(cè)量飲酒的方法,存在使用配備有酒精傳感器的體內(nèi)酒量測(cè)定器在呼吸期間測(cè)量呼出的氣體中的酒精濃度的方法,并且存在使用激光測(cè)量血流中的酒精濃度的方法。一般地,前一種方法通常用于打擊酒后駕車(chē)。在這種情況下,當(dāng)任何駕駛員拒絕做清醒測(cè)試時(shí),可以通過(guò)在駕駛員的同意下收集其血液而使用韋德馬克(Widmark)方程來(lái)估計(jì)血液酒精濃度。
除了車(chē)輛事故以外,由在酒精的作用下在海上或在空中操作交通工具造成的事故也同樣是問(wèn)題。然而,現(xiàn)有的飲酒測(cè)量方法要求對(duì)駕駛員本人進(jìn)行測(cè)試,且因此不適合用于確定在遙遠(yuǎn)位置處的駕駛員是否飲酒。
因此,政府正在運(yùn)用各種努力以防止在海上或在空中在酒精的作用下操作交通工具。作為其中一種努力,對(duì)于船舶來(lái)說(shuō),通過(guò)在操作之前和之后對(duì)飲酒進(jìn)行測(cè)量來(lái)進(jìn)行對(duì)在酒精的作用下正在操作車(chē)輛的個(gè)人的數(shù)量的控制。然而,在個(gè)人正在主動(dòng)操作交通工具的時(shí)間期間難以進(jìn)行測(cè)量。在某些情況下,海岸警衛(wèi)隊(duì)可以出乎意料地通過(guò)在海上直接接觸來(lái)進(jìn)行隨機(jī)的清醒檢查。然而,由于進(jìn)行船與船的聯(lián)系的困難以及從船上起飛的風(fēng)險(xiǎn),這種方法是非常危險(xiǎn)的。
因此,確定是否飲酒經(jīng)由與在海上的駕駛員的通信來(lái)間接地確定。然而,當(dāng)駕駛員否認(rèn)飲酒時(shí),難以確定是否已經(jīng)飲酒。因此,存在對(duì)即使在較遠(yuǎn)距離也能間接且客觀地確定駕駛員是否已經(jīng)飲酒的方法的需求。
技術(shù)實(shí)現(xiàn)要素:
技術(shù)問(wèn)題
本發(fā)明旨在提供一種用于通過(guò)對(duì)經(jīng)由通信取得的駕駛員的語(yǔ)音進(jìn)行分析來(lái)確定是否已經(jīng)飲酒以及飲酒的程度的飲酒確定方法。
本發(fā)明還旨在提供一種其上記錄有用于執(zhí)行所述飲酒確定方法的計(jì)算機(jī)程序的記錄介質(zhì)。
本發(fā)明還旨在提供一種用于執(zhí)行所述飲酒確定方法的裝置。
技術(shù)方案
根據(jù)用于實(shí)現(xiàn)本發(fā)明的上述目的的實(shí)施方式,一種飲酒確定方法包括以下步驟:檢測(cè)輸入語(yǔ)音信號(hào)的有效幀;檢測(cè)所述有效幀的原始信號(hào)的差分信號(hào);對(duì)所述原始信號(hào)和所述差分信號(hào)執(zhí)行快速傅里葉變換;以及基于經(jīng)快速傅里葉變換的原始信號(hào)與經(jīng)快速傅里葉變換的差分信號(hào)之間的斜率差而在頻域中確定是否已經(jīng)飲酒。
確定是否已經(jīng)飲酒可以包括以下步驟:生成經(jīng)快速傅里葉變換的原始信號(hào)和經(jīng)快速傅里葉變換的差分信號(hào)的頻率斜率;測(cè)量所述斜率之差以測(cè)量所述原始信號(hào)與所述差分信號(hào)之間的能量差;以及當(dāng)所述能量差大于閾值時(shí)確定已經(jīng)飲酒并且輸出所述確定的結(jié)果。
經(jīng)快速傅里葉變換的原始信號(hào)的頻率斜率和經(jīng)快速傅里葉變換的差分信號(hào)的頻率斜率中的每一個(gè)可以是共振峰斜率。
有效幀的檢測(cè)步驟可以包括以下步驟:形成所述輸入語(yǔ)音信號(hào)的語(yǔ)音幀;以及確定所述語(yǔ)音幀是否對(duì)應(yīng)于濁音。
快速傅里葉變換的執(zhí)行步驟可以包括以下步驟:對(duì)所述原始信號(hào)執(zhí)行快速傅里葉變換,以及對(duì)所述差分信號(hào)執(zhí)行快速傅里葉變換。
差分信號(hào)的檢測(cè)步驟可以包括以下步驟:通過(guò)使所述有效幀的所述原始信號(hào)S(n)進(jìn)行移位來(lái)生成移位信號(hào)S(n-1);以及輸出所述原始信號(hào)與所述移位信號(hào)之間的差分信號(hào)S(n)-S(n-1)。
根據(jù)用于實(shí)現(xiàn)本發(fā)明的上述其它目的的實(shí)施方式,存在一種其上記錄有用于執(zhí)行上述飲酒確定方法的計(jì)算機(jī)程序的計(jì)算機(jī)可讀記錄介質(zhì)。
根據(jù)用于實(shí)現(xiàn)本發(fā)明的上述其它目的的實(shí)施方式,一種飲酒確定裝置包括:有效幀檢測(cè)單元,該有效幀檢測(cè)單元被配置為檢測(cè)輸入語(yǔ)音信號(hào)的有效幀;差分信號(hào)檢測(cè)單元,該差分信號(hào)檢測(cè)單元被配置為檢測(cè)所述有效幀的原始信號(hào)的差分信號(hào);傅里葉變換單元,該傅里葉變換單元被配置為對(duì)所述原始信號(hào)和所述差分信號(hào)執(zhí)行快速傅里葉變換;以及酒精攝入確定單元,該酒精攝入確定單元被配置為基于經(jīng)快速傅里葉變換的原始信號(hào)與經(jīng)快速傅里葉變換的差分信號(hào)之間的斜率差而在頻域中確定是否已經(jīng)飲酒。
所述酒精攝入確定單元可以包括:斜率提取單元,該斜率提取單元被配置為生成經(jīng)快速傅里葉變換的原始信號(hào)和經(jīng)快速傅里葉變換的差分信號(hào)的頻率斜率;能量比較單元,該能量比較單元被配置為測(cè)量所述斜率之差以測(cè)量所述原始信號(hào)與所述差分信號(hào)之間的能量差;以及結(jié)果輸出單元,該結(jié)果輸出單元被配置為當(dāng)所述能量差大于閾值時(shí)確定已經(jīng)飲酒并且輸出所述確定的結(jié)果。
經(jīng)快速傅里葉變換的原始信號(hào)的頻率斜率和經(jīng)快速傅里葉變換的差分信號(hào)的頻率斜率中的每一個(gè)可以是共振峰斜率。
所述有效幀檢測(cè)單元可以包括:幀形成單元,該幀形成單元被配置為形成所述輸入語(yǔ)音信號(hào)的語(yǔ)音幀;以及濁音確定單元,該濁音確定單元被配置為確定所述語(yǔ)音幀是否對(duì)應(yīng)于濁音。
所述傅里葉變換單元可以包括:第一傅里葉變換單元,該第一傅里葉變換單元被配置為對(duì)所述原始信號(hào)執(zhí)行快速傅里葉變換;以及第二傅里葉變換單元,該第二傅里葉變換單元被配置為對(duì)所述差分信號(hào)執(zhí)行快速傅里葉變換。
所述差分信號(hào)檢測(cè)單元可以包括:移位信號(hào)單元,該移位信號(hào)單元被配置為通過(guò)使所述有效幀的所述原始信號(hào)S(n)進(jìn)行移位來(lái)生成移位信號(hào)S(n-1);以及差分信號(hào)輸出單元,該差分信號(hào)輸出單元被配置為輸出所述原始信號(hào)與所述移位信號(hào)之間的差分信號(hào)S(n)-S(n-1)。
有益效果
根據(jù)本發(fā)明,可以通過(guò)提取頻域中的語(yǔ)音的特征參數(shù)并且應(yīng)用所提取的特征參數(shù)來(lái)確定在遙遠(yuǎn)位置處的駕駛員或操作者是否已經(jīng)飲酒以及飲酒的程度,并且將飲酒之前和之后的語(yǔ)音應(yīng)用到獨(dú)立說(shuō)話人和從屬說(shuō)話人。具體地,當(dāng)存在很多個(gè)有效幀時(shí),可以使確定的準(zhǔn)確性增加。因此,本發(fā)明在測(cè)量語(yǔ)音的長(zhǎng)期變化方面是有用的。
因此,還可以通過(guò)通信來(lái)提取在遙遠(yuǎn)位置處的駕駛員或操作者的語(yǔ)音,以便間接且客觀地確定是否已經(jīng)飲酒,從而防止由酒后操作造成事故。
附圖說(shuō)明
圖1是示出根據(jù)本發(fā)明的實(shí)施方式的用于確定飲酒的裝置的框圖。
圖2是圖1的有效幀檢測(cè)單元的詳細(xì)框圖。
圖3是用于描述圖2的有效幀檢測(cè)單元的幀形成單元將語(yǔ)音信號(hào)轉(zhuǎn)換成語(yǔ)音幀的概念的視圖。
圖4是圖2的有效幀檢測(cè)單元的濁音確定單元的詳細(xì)框圖。
圖5是圖1的差分信號(hào)檢測(cè)單元的詳細(xì)框圖。
圖6是圖1的飲酒確定單元的詳細(xì)框圖。
圖7是用于描述圖1的傅里葉變換單元的頻率輸出的曲線圖。
圖8是示出由圖1的飲酒確定單元生成的共振峰斜率的曲線圖。
圖9是示出通過(guò)使用圖1的飲酒確定單元來(lái)測(cè)量斜率的變化而獲得的能量差的曲線圖。
圖10是示出根據(jù)本發(fā)明的實(shí)施方式的飲酒確定方法的流程圖。
具體實(shí)施方式
下面的詳細(xì)描述涉及例示與本發(fā)明相一致的示例性實(shí)施方式的附圖。這些實(shí)施方式將足夠詳細(xì)地進(jìn)行描述,以使得本領(lǐng)域技術(shù)人員能夠?qū)嵺`本發(fā)明。要理解的是,本發(fā)明的各種實(shí)施方式雖然不同,但是不一定相互排斥。例如,在不背離本發(fā)明的精神和范圍的情況下,本文中所描述的與一種實(shí)施方式相關(guān)的特定特征、結(jié)構(gòu)或特性可以在其它實(shí)施方式內(nèi)實(shí)現(xiàn)。另外,要理解的是,在不背離本發(fā)明的精神和范圍的情況下,可以修改在各公開(kāi)的實(shí)施方式內(nèi)的各個(gè)元件的位置或布置。因此,下面的詳細(xì)描述不應(yīng)從限制的意義上來(lái)看,并且本發(fā)明的范圍僅受恰當(dāng)闡釋的所附權(quán)利要求以及這些權(quán)利要求授權(quán)的全部范圍的等同物限定。在附圖中,遍及多個(gè)視圖,相同的標(biāo)號(hào)指代相同或相似的元件。
下文中,將參照附圖更加詳細(xì)地描述本發(fā)明的優(yōu)選實(shí)施方式。
圖1是示出根據(jù)本發(fā)明的實(shí)施方式的用于確定飲酒的裝置的框圖。
參照?qǐng)D1,一種根據(jù)該實(shí)施方式的用于確定飲酒的裝置10包括:有效幀檢測(cè)單元110,該有效幀檢測(cè)單元110被配置為檢測(cè)輸入語(yǔ)音信號(hào)的有效幀;差分信號(hào)檢測(cè)單元130,該差分信號(hào)檢測(cè)單元130被配置為檢測(cè)有效幀的原始信號(hào)的差分信號(hào);傅里葉變換單元150,該傅里葉變換單元150被配置為對(duì)原始信號(hào)和差分信號(hào)執(zhí)行快速傅里葉變換;以及飲酒確定單元170,該飲酒確定單元170被配置為基于經(jīng)快速傅里葉變換的原始信號(hào)與經(jīng)快速傅里葉變換的差分信號(hào)之間的斜率差而在頻域中確定是否已經(jīng)飲酒。
可以在根據(jù)本發(fā)明的裝置10中安裝并執(zhí)行飲酒確定軟件(應(yīng)用)??梢酝ㄟ^(guò)在裝置10中執(zhí)行的飲酒確定軟件來(lái)控制諸如有效幀檢測(cè)單元110的元件。
裝置10可以是單獨(dú)的終端或者終端的模塊。裝置10可以是固定的或者可以具有移動(dòng)性。裝置10可以被稱(chēng)作其它術(shù)語(yǔ),諸如終端、用戶(hù)設(shè)備(UE)、移動(dòng)站(MS)、移動(dòng)終端(MT)、用戶(hù)終端(UT)、訂戶(hù)站(SS)、無(wú)線裝置、個(gè)人數(shù)字助理(PDA)、無(wú)線調(diào)制解調(diào)器、手持式裝置等。
裝置10可以支持有線或無(wú)線通信,并且除了諸如智能電話、蜂窩電話、平板PC、筆記本電腦、上網(wǎng)本、個(gè)人數(shù)字助理(PDA)、便攜式多媒體播放器(PMP)、便攜式游戲機(jī)(PSP)、MP3播放器、電子書(shū)閱讀器、導(dǎo)航裝置、智能相機(jī)、電子詞典、電子手表和游戲控制器的各種移動(dòng)裝置之外,裝置10可以包括諸如臺(tái)式計(jì)算機(jī)和智能TV的電子裝置。
裝置10可以在操作系統(tǒng)(OS)的基礎(chǔ)上執(zhí)行各種應(yīng)用。OS是用于允許應(yīng)用使用裝置的硬件的系統(tǒng)程序,并且可以包括諸如iOS、安卓OS、Windows移動(dòng)OS、巴達(dá)OS、塞班OS和黑莓OS的移動(dòng)計(jì)算機(jī)操作系統(tǒng)以及諸如Windows系列、Linux系列、Unix系列、MAC、AIX和HP-UX的計(jì)算機(jī)操作系統(tǒng)。
該應(yīng)用是被開(kāi)發(fā)以使用終端來(lái)執(zhí)行特定任務(wù)的程序,并且除了各種類(lèi)型的應(yīng)用程序和服務(wù)對(duì)象以外,還可以包括諸如游戲、視頻和照片的各種類(lèi)型的多媒體內(nèi)容或者諸如用于執(zhí)行多媒體內(nèi)容的圖像查看器和視頻播放器的執(zhí)行程序。將理解的是,本申請(qǐng)可以包括全部的應(yīng)用程序和執(zhí)行程序。
有效幀檢測(cè)單元110檢測(cè)并輸出用戶(hù)的輸入語(yǔ)音信號(hào)的有效幀。該語(yǔ)音信號(hào)可以直接地或者經(jīng)由通信被輸入到裝置10。即,語(yǔ)音信號(hào)可以通過(guò)裝置10中包括的麥克風(fēng)進(jìn)行輸入或者可以從遙遠(yuǎn)位置被發(fā)送。
參照?qǐng)D2,有效幀檢測(cè)單元110包括:幀形成單元111,該幀形成單元111被配置為形成輸入語(yǔ)音信號(hào)的語(yǔ)音幀;以及濁音確定單元113,該濁音確定單元113被配置為確定語(yǔ)音幀是否對(duì)應(yīng)于濁音。
幀形成單元111接收個(gè)人的語(yǔ)音,將所接收的語(yǔ)音轉(zhuǎn)換成語(yǔ)音數(shù)據(jù),將語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成以幀為單位的語(yǔ)音幀數(shù)據(jù),并且輸出語(yǔ)音幀數(shù)據(jù)。典型地,模擬語(yǔ)音信號(hào)以每秒8000個(gè)的比率并且以16比特(65535步)的大小進(jìn)行采樣,并且被轉(zhuǎn)換成語(yǔ)音數(shù)據(jù)。
幀形成單元111可以將所接收的語(yǔ)音信號(hào)轉(zhuǎn)換成語(yǔ)音數(shù)據(jù)并且將語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成以幀為單位的語(yǔ)音幀數(shù)據(jù)。這里,一條語(yǔ)音幀數(shù)據(jù)具有256個(gè)能量值。
如圖3所示,語(yǔ)音數(shù)據(jù)根據(jù)所接收的語(yǔ)音由多個(gè)語(yǔ)音幀(n=幀的數(shù)量,n=1、2、3、...)構(gòu)成。幀形成單元111生成語(yǔ)音幀,且然后將關(guān)于語(yǔ)音幀的信息輸出到濁音確定單元113。
濁音確定單元113接收語(yǔ)音幀,從語(yǔ)音幀中提取預(yù)定特征,并且根據(jù)所提取的特征來(lái)分析所接收的語(yǔ)音幀是與濁音、清音還是噪聲相關(guān)聯(lián)。根據(jù)分析的結(jié)果,濁音確定單元113可以?xún)H將與濁音相對(duì)應(yīng)的幀從語(yǔ)音幀中分離并且輸出所分離的幀。
參照?qǐng)D4,濁音確定單元113可以包括:特征提取單元113a,該特征提取單元113a被配置為接收語(yǔ)音幀并且從語(yǔ)音幀中提取預(yù)定特征;識(shí)別單元113b,該識(shí)別單元113b被配置為產(chǎn)生針對(duì)語(yǔ)音幀的識(shí)別結(jié)果;確定單元113c,該確定單元113c被配置為確定所接收的語(yǔ)音幀是與濁音還是清音相關(guān)聯(lián),或者所接收的語(yǔ)音幀是否是由背景噪聲造成的;以及分離和輸出單元113d,該分離和輸出單元113d被配置為根據(jù)確定的結(jié)果來(lái)分離并輸出有效幀。
當(dāng)通過(guò)幀形成單元111接收到語(yǔ)音幀時(shí),特征提取單元113a可以從所接收的語(yǔ)音幀中提取諧波的周期性特性或者諸如低波段語(yǔ)音信號(hào)能量區(qū)的均方根能量(RMSE)或過(guò)零計(jì)數(shù)(ZC)的特征。
通常,識(shí)別單元113b可以由神經(jīng)網(wǎng)絡(luò)構(gòu)成。這是因?yàn)樯窠?jīng)網(wǎng)絡(luò)在分析非線性問(wèn)題(即,數(shù)學(xué)上不能解決的復(fù)雜問(wèn)題)方面有用,并且因此適用于分析語(yǔ)音信號(hào)以及根據(jù)分析的結(jié)果來(lái)確定相應(yīng)的語(yǔ)音信號(hào)是被確定為濁音信號(hào)、清音信號(hào)還是背景噪聲。由這種神經(jīng)網(wǎng)絡(luò)構(gòu)成的識(shí)別單元113b可以將預(yù)定權(quán)重分配到從特征提取單元113a中提取的特征,并且可以通過(guò)神經(jīng)網(wǎng)絡(luò)的計(jì)算處理來(lái)產(chǎn)生針對(duì)語(yǔ)音幀的識(shí)別結(jié)果。這里,該識(shí)別結(jié)果是指通過(guò)根據(jù)被分配到每個(gè)語(yǔ)音幀的特征的權(quán)重對(duì)計(jì)算元素進(jìn)行計(jì)算而獲得的值。
確定單元113c根據(jù)上述的識(shí)別結(jié)果(即,通過(guò)識(shí)別單元113b計(jì)算的值)來(lái)確定所接收的語(yǔ)音信號(hào)是對(duì)應(yīng)于濁音還是清音。分離和輸出單元113d根據(jù)確定單元113c的確定結(jié)果來(lái)將語(yǔ)音幀分離為濁音、清音或背景噪聲。
同時(shí),由于濁音在各種特征方面與清音和背景噪聲顯著不同,因此識(shí)別濁音是相對(duì)容易的,并且存在用于此的多種已知技術(shù)。例如,濁音具有諧波以每特定頻率間隔進(jìn)行重復(fù)的周期性特性,而背景噪聲不具有諧波。
另一方面,清音具有帶有弱周期性的諧波。換句話說(shuō),濁音的特征在于諧波在一個(gè)幀內(nèi)進(jìn)行重復(fù),而清音的特征在于諸如諧波的濁音的特征每隔特定數(shù)量的幀進(jìn)行重復(fù),即,被示出為較弱。
當(dāng)濁音確定單元113分離濁音、清音或背景噪聲時(shí),有效幀檢測(cè)單元110僅輸出針對(duì)濁音的幀。針對(duì)濁音的輸出幀被稱(chēng)為有效幀的原始信號(hào)S(n),并且有效幀的原始信號(hào)S(n)被傳遞到差分信號(hào)檢測(cè)單元130和傅里葉變換單元150。
參照?qǐng)D5,差分信號(hào)檢測(cè)單元130包括移位信號(hào)單元131和差分信號(hào)輸出單元133,以便輸出有效幀的原始信號(hào)S(n)的差分信號(hào)S(n)-S(n-1)。
移位信號(hào)單元131通過(guò)使有效幀的原始信號(hào)S(n)進(jìn)行移位來(lái)生成移位信號(hào)S(n-1),并且差分信號(hào)輸出單元133輸出原始信號(hào)與移位信號(hào)S(n-1)之間的差分信號(hào)S(n)-S(n-1)。
作為飲酒之前和之后的特征,已報(bào)道了如同鼻音的特征的高頻分量會(huì)增加。即,在高頻分量中存在顯著差異,而低頻分量幾乎不發(fā)生改變。飲酒造成聽(tīng)力下降。因此,說(shuō)話人應(yīng)大聲說(shuō)話,并因此將其嘴張大,因?yàn)檎f(shuō)話人無(wú)法很好地聽(tīng)到。這使得肺活量增大并影響能量。另外,當(dāng)說(shuō)話人飲酒時(shí),其語(yǔ)音的音量無(wú)法得到維持并且通常過(guò)度增大或減小。因此,語(yǔ)音的音量的偏差在飲酒之后增大。
根據(jù)本發(fā)明,找出原始信號(hào)的差分信號(hào)。所找出的差分信號(hào)示出了高頻分量被突出的特征。因此,飲酒之前和之后間的差異可以進(jìn)一步得到突出,并且還可以通過(guò)使用差分信號(hào)來(lái)進(jìn)一步便于高頻分析。
傅里葉變換單元150通過(guò)對(duì)從有效幀檢測(cè)單元110輸出的有效幀的原始信號(hào)S(n)和從差分信號(hào)檢測(cè)單元130輸出的有效幀的差分信號(hào)S(n)-S(n-1)執(zhí)行快速傅里葉變換來(lái)將語(yǔ)音信號(hào)轉(zhuǎn)換到頻域中。
傅里葉變換是將來(lái)自時(shí)域的信號(hào)轉(zhuǎn)換到頻域以對(duì)復(fù)合信號(hào)進(jìn)行分析以便找出信號(hào)的頻率和特征的方法。例如,當(dāng)信號(hào)從天線進(jìn)行發(fā)送時(shí),可以通過(guò)使用無(wú)線電的頻率調(diào)整來(lái)聽(tīng)到無(wú)線電波。應(yīng)明白,頻率調(diào)整用作用于阻擋具有其它頻率的信號(hào)(無(wú)線電波)的濾波器。為了進(jìn)行這種濾波而執(zhí)行傅里葉變換。將時(shí)間函數(shù)u(t)轉(zhuǎn)換成頻率函數(shù)U(ω)被稱(chēng)為傅里葉變換,并且將頻率函數(shù)U(ω)轉(zhuǎn)換成時(shí)間函數(shù)u(t)被稱(chēng)為逆傅里葉變換。
快速傅里葉變換是被設(shè)計(jì)以減少當(dāng)在傅里葉變換的基礎(chǔ)上執(zhí)行使用近似公式的離散傅里葉變換時(shí)所需的運(yùn)算數(shù)量的算法。
傅里葉變換單元150可以包括:第一傅里葉變換單元151,該第一傅里葉變換單元151被配置為對(duì)有效幀的原始信號(hào)S(n)執(zhí)行快速傅里葉變換;以及第二傅里葉變換單元152,該第二傅里葉變換單元152被配置為對(duì)有效幀的差分信號(hào)S(n)-S(n-1)執(zhí)行快速傅里葉變換。
在該實(shí)施方式中,通過(guò)單獨(dú)的傅里葉變換單元對(duì)有效幀的原始信號(hào)S(n)和有效幀的差分信號(hào)S(n)-S(n-1)執(zhí)行快速傅里葉變換。然而,在其它實(shí)施方式中,傅里葉變換單元150可以同時(shí)地、按照任何次序或按順序地對(duì)有效幀的原始信號(hào)S(n)和有效幀的差分信號(hào)S(n)-S(n-1)執(zhí)行快速傅里葉變換。
針對(duì)有效幀的原始信號(hào)S(n)的經(jīng)快速傅里葉變換的信號(hào)FE1和針對(duì)有效幀的差分信號(hào)S(n)-S(n-1)的經(jīng)快速傅里葉變換的信號(hào)FE2各自是頻域中的語(yǔ)音信號(hào),并且被輸出到飲酒確定單元170。
飲酒確定單元170從經(jīng)快速傅里葉變換的原始信號(hào)FE1和經(jīng)快速傅里葉變換的差分信號(hào)FE2中找出能量差,以確定是否已經(jīng)飲酒。為了找出兩個(gè)信號(hào)之間的能量差,飲酒確定單元190可以生成針對(duì)原始信號(hào)的頻域信號(hào)FE1的斜率和針對(duì)差分信號(hào)的頻域信號(hào)FE2的斜率,并且從這些斜率之差中產(chǎn)生能量差。
當(dāng)某個(gè)人飲酒時(shí),其控制其語(yǔ)音音量的能力降低,導(dǎo)致高頻分量的能量變化增加。因此,飲酒確定單元170可以在特定時(shí)段期間根據(jù)高頻分量的能量變化的差異來(lái)確定是否已經(jīng)飲酒。
參照?qǐng)D6,飲酒確定單元170包括斜率提取單元171、能量比較單元173和結(jié)果輸出單元175。
斜率提取單元171生成經(jīng)快速傅里葉變換的原始信號(hào)FE1的頻率斜率和經(jīng)快速傅里葉變換的差分信號(hào)FE2的頻率斜率。頻率斜率中的每一個(gè)可以是共振峰斜率。
圖7示出了通過(guò)用第一傅里葉變換單元對(duì)有效幀的原始信號(hào)S(n)執(zhí)行快速傅里葉變換而獲得的經(jīng)快速傅里葉變換的原始信號(hào)FE1。經(jīng)快速傅里葉變換的原始信號(hào)FE1是頻域信號(hào)。在這種情況下,從最低頻率峰值開(kāi)始,找出第一至第四峰值頻率P1、P2、P3和P4。
圖8示出了共振峰斜率從圖1的經(jīng)快速傅里葉變換的原始信號(hào)FE1中提取。
斜率提取單元171可以提取第一峰值頻率P1與第四峰值頻率P4之間的斜率F14、第一峰值頻率P1與第三峰值頻率P3之間的斜率F13、第一峰值頻率P1與第二峰值頻率P2之間的斜率F12等。
例如,在多個(gè)共振峰斜率當(dāng)中,F(xiàn)14(第一峰值頻率與第四峰值頻率之間的斜率)和F24(第二峰值頻率與第四峰值頻率之間的斜率)可以被用來(lái)確定是否已經(jīng)飲酒。在某個(gè)人飲酒之后,其控制其語(yǔ)音音量的能力由于身體變化而降低。因此,由于個(gè)人無(wú)法通過(guò)使用能量的變化來(lái)平穩(wěn)地且有節(jié)奏地說(shuō)話,因此個(gè)人大聲地進(jìn)行連續(xù)發(fā)聲或者即使當(dāng)應(yīng)小聲地進(jìn)行發(fā)聲時(shí)也大聲地進(jìn)行發(fā)聲。該特征表示在第一峰值頻率P1中發(fā)生變化。此外,當(dāng)已經(jīng)飲酒時(shí),舌頭位置在發(fā)聲時(shí)發(fā)生變化。這對(duì)第二峰值頻率P2產(chǎn)生影響。即,第二峰值頻率P2在舌頭被定位得向前時(shí)增大,并且在舌頭被定位得向后時(shí)減小。第四峰值頻率P4幾乎不受發(fā)音器官的影響,且因此在飲酒之前和之后幾乎是恒定的。因此,可以根據(jù)F14和F24的變化來(lái)更加容易地確定是否已經(jīng)飲酒。
斜率提取單元171通過(guò)相同的方法從經(jīng)快速傅里葉變換的差分信號(hào)FE2中提取共振峰斜率,并且將所提取的共振峰斜率輸出到能量比較單元173。
能量比較單元173測(cè)量斜率之差以測(cè)量原始信號(hào)與差分信號(hào)之間的能量差。能量差可以由共振峰斜率之間的距離差產(chǎn)生。
參照?qǐng)D9,能量比較單元173從經(jīng)快速傅里葉變換的原始信號(hào)FE1與經(jīng)快速傅里葉變換的差分信號(hào)FE2之間的共振峰斜率差中產(chǎn)生能量差ED。經(jīng)快速傅里葉變換的原始信號(hào)FE1的斜率F1與經(jīng)快速傅里葉變換的差分信號(hào)FE2的斜率F2之間的共振峰斜率差是斜率之間的距離差。由于該差根據(jù)頻率而不同,所以能量差檢測(cè)單元193可以計(jì)算距離差的平均值。
結(jié)果輸出單元175可以確定當(dāng)能量差大于閾值時(shí)已經(jīng)飲酒,并且可以確定當(dāng)能量差小于或等于閾值時(shí)未飲酒。
閾值可以進(jìn)行預(yù)定和存儲(chǔ),并且還可以在全部情況下應(yīng)用。閾值可以是通過(guò)實(shí)驗(yàn)的方式設(shè)置的最佳值。可以取決于性別或年齡或者根據(jù)自定義來(lái)應(yīng)用不同閾值。
根據(jù)本發(fā)明的飲酒確定裝置在頻域中確定是否已經(jīng)飲酒。具體地,飲酒確定裝置在頻域中利用共振峰能量比較方法,以便突出語(yǔ)音信號(hào)的高頻率并且還使針對(duì)該信號(hào)的分析準(zhǔn)確性增加。因?yàn)榇_定準(zhǔn)確性隨著有效幀的數(shù)量增加而增加,所以本發(fā)明是在通過(guò)在長(zhǎng)期中找出變化來(lái)確定是否已經(jīng)飲酒以及飲酒的程度方面有用的分析方法。
圖10是示出根據(jù)本發(fā)明的實(shí)施方式的飲酒確定方法的流程圖。
根據(jù)該實(shí)施方式的飲酒確定方法可以按照與圖1的裝置10的配置大致相同的配置來(lái)執(zhí)行。因此,與圖1的裝置10的元件相同的元件通過(guò)相同的參考標(biāo)號(hào)來(lái)指示,并且對(duì)其的重復(fù)描述將被省略掉。
另選地,根據(jù)該實(shí)施方式的飲酒確定方法可以通過(guò)飲酒確定軟件(應(yīng)用)來(lái)執(zhí)行。
參照?qǐng)D10,根據(jù)該實(shí)施方式的飲酒確定方法包括檢測(cè)輸入語(yǔ)音信號(hào)的有效幀(步驟S110)。
檢測(cè)有效幀的步驟(步驟S110)可以包括形成輸入語(yǔ)音信號(hào)的語(yǔ)音幀并且確定該語(yǔ)音幀是否對(duì)應(yīng)于濁音。
詳細(xì)地,該步驟可以包括:接收個(gè)人的語(yǔ)音,將語(yǔ)音轉(zhuǎn)換成語(yǔ)音數(shù)據(jù),將語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成以幀為單位的語(yǔ)音幀數(shù)據(jù),并且分析語(yǔ)音幀是與濁音、清音還是噪聲相關(guān)聯(lián)。根據(jù)分析的結(jié)果,僅可以輸出與濁音相對(duì)應(yīng)的幀,即有效幀。
該方法包括:當(dāng)檢測(cè)到有效幀時(shí),檢測(cè)有效幀的原始信號(hào)的差分信號(hào)(步驟S130)。
檢測(cè)差分信號(hào)的步驟(步驟S130)可以包括以下步驟:通過(guò)使有效幀的原始信號(hào)S(n)進(jìn)行移位來(lái)生成移位信號(hào)S(n-1)并且輸出原始信號(hào)與移位信號(hào)之間的差分信號(hào)S(n)-S(n-1)。
由于差分信號(hào)示出了高頻分量被突出的特征,所以可以進(jìn)一步突出飲酒之前和之后間的差異,并且還可以通過(guò)使用差分信號(hào)來(lái)進(jìn)一步便于對(duì)高頻率的分析。
該方法包括:對(duì)原始信號(hào)和差分信號(hào)執(zhí)行快速傅里葉變換(步驟S150)。
執(zhí)行快速傅里葉變換的步驟(步驟S150)可以包括以下步驟:對(duì)原始信號(hào)執(zhí)行快速傅里葉變換,以及對(duì)差分信號(hào)執(zhí)行快速傅里葉變換。
與此不同,可以同時(shí)地、按照任何次序或按順序地對(duì)有效幀的原始信號(hào)S(n)和有效幀的差分信號(hào)S(n)-S(n-1)執(zhí)行快速傅里葉變換。
有效幀的原始信號(hào)S(n)的經(jīng)快速傅里葉變換的信號(hào)FE1和有效幀的差分信號(hào)S(n)-S(n-1)的經(jīng)快速傅里葉變換的信號(hào)FE2在頻域中作為語(yǔ)音信號(hào)被輸出。
該方法包括:基于經(jīng)快速傅里葉變換的原始信號(hào)FE1與經(jīng)快速傅里葉變換的差分信號(hào)FE2之間的斜率差而在頻域中確定是否已經(jīng)飲酒(步驟S170)。
確定是否已經(jīng)飲酒的步驟(步驟S170)可以包括:生成經(jīng)快速傅里葉變換的原始信號(hào)和經(jīng)快速傅里葉變換的差分信號(hào)的頻率斜率;測(cè)量所述斜率之差以測(cè)量所述原始信號(hào)與所述差分信號(hào)之間的能量差;以及當(dāng)所述能量差大于閾值時(shí)確定已經(jīng)飲酒并且輸出所述確定的結(jié)果。
經(jīng)快速傅里葉變換的原始信號(hào)的頻率斜率和經(jīng)快速傅里葉變換的差分信號(hào)的頻率斜率中的每一個(gè)可以是共振峰斜率。共振峰斜率之差是斜率之間的距離差。由于該差根據(jù)頻率而不同,因此可以計(jì)算該距離差的平均值。當(dāng)能量差的平均值大于閾值時(shí),高頻分量的能量變化較大。因此,可以確定已經(jīng)飲酒。
如上所述,飲酒確定方法可以被實(shí)現(xiàn)為應(yīng)用或者按照可以通過(guò)各種計(jì)算機(jī)部件執(zhí)行并且被記錄在計(jì)算機(jī)可讀記錄介質(zhì)上的程序指令的形式來(lái)實(shí)施。計(jì)算機(jī)可讀記錄介質(zhì)可以以單獨(dú)或組合的形式包括程序指令、數(shù)據(jù)文件、數(shù)據(jù)結(jié)構(gòu)等。
在計(jì)算機(jī)可讀記錄介質(zhì)上記錄的程序指令可以針對(duì)本發(fā)明具體地進(jìn)行指定或者可以對(duì)計(jì)算機(jī)軟件領(lǐng)域的技術(shù)人員來(lái)說(shuō)是已知的且被其使用。
計(jì)算機(jī)可讀記錄介質(zhì)的示例包括諸如硬盤(pán)、軟盤(pán)或磁帶的磁性介質(zhì);諸如光盤(pán)-只讀存儲(chǔ)器(CD-ROM)或數(shù)字通用光盤(pán)(DVD)的光學(xué)介質(zhì);諸如軟式光盤(pán)的磁光介質(zhì);以及專(zhuān)門(mén)設(shè)計(jì)以存儲(chǔ)并執(zhí)行程序指令的諸如ROM、隨機(jī)存取存儲(chǔ)器(RAM)或閃速存儲(chǔ)器的硬件裝置。
程序指令的示例不僅包括由編譯器等生成的機(jī)器代碼,而且包括可以由使用解譯器等的計(jì)算機(jī)執(zhí)行的高級(jí)語(yǔ)言代碼。硬件裝置可以被配置為作為一個(gè)或更多個(gè)軟件模塊來(lái)操作,以便執(zhí)行本發(fā)明的操作,且反之亦然。
雖然已參照示例性實(shí)施方式對(duì)本發(fā)明進(jìn)行了描述,但是將理解的是,在不背離所附權(quán)利要求書(shū)中限定的本發(fā)明的范圍和精神的情況下,可以在本文中進(jìn)行各種變化和修改。
工業(yè)實(shí)用性
根據(jù)本發(fā)明的飲酒確定方法以及用于實(shí)現(xiàn)該方法的記錄介質(zhì)和裝置可以通過(guò)通信確定在遙遠(yuǎn)位置處的駕駛員或操作者是否已經(jīng)飲酒,從而防止由在酒精的作用下操作車(chē)輛的人造成的事故。另外,本發(fā)明可以廣泛地應(yīng)用于難以親自測(cè)量飲酒的運(yùn)輸領(lǐng)域,諸如船舶、鐵路、飛機(jī)、車(chē)輛、公共汽車(chē)和高速公路,并且還可以應(yīng)用于國(guó)內(nèi)和國(guó)外船舶和空中控制服務(wù)系統(tǒng)。此外,本發(fā)明可以有助于用于對(duì)飲酒進(jìn)行測(cè)量的在個(gè)人蜂窩電話上的網(wǎng)絡(luò)應(yīng)用。