本發(fā)明涉及建筑施工領(lǐng)域,特指一種利用汽車喇叭聲紋中斷車機消息播報的方法及系統(tǒng)。
背景技術(shù):
語音交互方式在車載設(shè)備的廣泛運用,涉及到的技術(shù)包括:語音識別、語音合成、聲紋識別等。用戶通過語音交互系統(tǒng),說話就能操控汽車上車機設(shè)備,實現(xiàn)打電話、導航、聽音樂等功能。同時,當設(shè)備收到消息時,如來電、來短信、微信消息、推送通知等,也會通過語音合成技術(shù),提示用戶接收到新信息,是否需要播報內(nèi)容或執(zhí)行操作。
在車機設(shè)備上的消息播報系統(tǒng)進行消息播報時,當所播報的消息為私人信息,而車內(nèi)同乘有多人時,為避免私人信息被直接播報出來,車主需通過操作中斷消息播報系統(tǒng)的播報,中斷操作一般通過車機設(shè)備的控制面板來實施,可能會存在操作不及時而導致播報未及時終止的情形,即使及時終止了播報也會給車主帶來尷尬的情境。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺陷,提供一種利用汽車喇叭聲紋中斷車機消息播報的方法及系統(tǒng),解決現(xiàn)有技術(shù)中消息播報系統(tǒng)在消息播報時通過操作控制面板終止播報而存在的操作不及時和為車主帶來尷尬情境的問題。
實現(xiàn)上述目的的技術(shù)方案是:
本發(fā)明提供了一種利用汽車喇叭聲紋中斷車機消息播報的方法,包括如下步驟:
于車機設(shè)備上建立喇叭聲紋模型;
在所述車機設(shè)備收到需進行消息播報的消息時,激活所述喇叭聲紋模型;
通過所述車機設(shè)備上的麥克風連續(xù)不斷地進行監(jiān)聽錄音以獲取錄音信號;
對所述錄音信號進行降噪處理并提取對應的聲紋特征;以及
將所提取的聲紋特征輸入到所述喇叭聲紋模型中進行匹配判斷,
若所提取的聲紋特征與喇叭聲紋特征相匹配,則形成中斷播報指令發(fā)送給所述車機設(shè)備以中斷消息播報進而使得所述消息播報結(jié)束;
若所提取的聲紋特征與所述喇叭聲紋特征不匹配,則繼續(xù)進行匹配判斷直至所述消息播報結(jié)束。
本發(fā)明利用了喇叭聲音來中斷消息播報,在車機聲波進行消息播報的過程中,始終對車內(nèi)的環(huán)境進行監(jiān)聽,當監(jiān)聽到喇叭聲音時,立即中斷消息播報并取消播報流程,對車主的隱私起到了很好的保護。按喇叭的操作經(jīng)常發(fā)生且極易操作,能夠快速有效的中斷消息播報,另外,利用喇叭中斷播報,按喇叭能夠轉(zhuǎn)移其他同乘人員的注意力,且按喇叭的動作不會產(chǎn)生違和感,能夠較好的化解尷尬情境,提升了語音產(chǎn)品的人文關(guān)懷。
本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的方法的進一步改進在于,于車機設(shè)備上建立喇叭聲紋模型,包括:
采集多種環(huán)境下的喇叭聲音信號,并從所采集的喇叭聲音信號中提取出對應的喇叭聲紋特征;
利用所提取的喇叭聲紋特征進行聲學模型訓練以得到對應的喇叭聲紋模型。
本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的方法的進一步改進在于,采集多種環(huán)境下的喇叭聲音信號,包括:
采集汽車在不同檔位行駛的環(huán)境下的喇叭聲音信號;
采集汽車在開、關(guān)窗的環(huán)境下的喇叭聲音信號;以及
采集汽車內(nèi)有、無背景聲音的環(huán)境下的喇叭聲音信號。
本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的方法的進一步改進在于,在消息播報結(jié)束時,釋放所述喇叭聲紋模型。
本發(fā)明還提供了一種利用汽車喇叭聲紋中斷車機消息播報的系統(tǒng),包括:
裝設(shè)于車機設(shè)備上的喇叭聲紋模型,所述喇叭聲紋模型與所述車機設(shè)備上的消息播報系統(tǒng)連接,所述消息播報系統(tǒng)在收到需進行消息播報的消息時形成激活指令發(fā)送給所述喇叭聲紋模型,以激活所述喇叭聲紋模型;
與所述喇叭聲紋模型連接的音頻獲取模塊,所述音頻獲取模塊與所述車機設(shè)備上的麥克風控制連接,所述喇叭聲紋模型被激活后向所述音頻獲取模塊發(fā)送錄音獲取指令,所述音頻獲取模塊根據(jù)所述錄音獲取指令控制所述麥克風連續(xù)不斷地進行監(jiān)聽錄音并獲取所形成錄音信號,所述音頻獲取模塊對所獲取的所述錄音信號進行降噪處理;
與所述音頻獲取模塊和所述喇叭聲紋模型連接的特征提取模塊,所述特征提取模塊接收所述音頻獲取模塊所獲取的錄音信號并對所述錄音信號進行特征提取以獲得對應的聲紋特征,所述特征提取模塊將所提取的聲紋特征發(fā)送給所述喇叭聲紋模型;以及
與所述喇叭聲紋模型和所述消息播報系統(tǒng)連接中斷控制模塊;
其中:
所述喇叭聲紋模型對所提取的聲紋特征與喇叭聲紋特征進行匹配判斷并輸出匹配判斷結(jié)果給所述中斷控制模塊;
當所述匹配判斷結(jié)果為所提取的聲紋特征與喇叭聲紋特征相匹配時,所述中斷控制模塊形成中斷播報指令發(fā)送給所述消息播報系統(tǒng)以中斷消息播報進而使得消息播報結(jié)束;
當所述匹配判斷結(jié)果為所提取的聲紋特征與喇叭聲紋特征不匹配時,則中斷控制模塊不處理。
本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的系統(tǒng)的進一步改進在于,所述喇叭聲紋模型通過喇叭聲紋特征進行聲學模型訓練得到,所述喇叭聲紋特征通過對多種環(huán)境下的喇叭聲音信號進行提取獲得。
本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的系統(tǒng)的進一步改進在于,多種環(huán)境下的喇叭聲音信號包括汽車在不同檔位行駛的環(huán)境下的喇叭聲音信號,汽車在開、關(guān)窗的環(huán)境下的喇叭聲音信號以及汽車內(nèi)有、無背景聲音的環(huán)境下的喇叭聲音信號。
本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的系統(tǒng)的進一步改進在于,所述消息播報系統(tǒng)在消息播報結(jié)束時,形成結(jié)束播報指令發(fā)送給所述喇叭聲紋模型以釋放所述喇叭聲紋模型。
本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的系統(tǒng)的進一步改進在于,所述喇叭聲紋模型在接收到所述結(jié)束播報指令后形成關(guān)閉指令并發(fā)送至所述音頻獲取模塊、所述特征提取模塊以及所述中斷控制模塊,以令所述音頻獲取模塊、所述特征提取模塊以及所述中斷控制模塊停止運行。
附圖說明
圖1為本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的方法及系統(tǒng)的流程圖。
具體實施方式
下面結(jié)合附圖和具體實施例對本發(fā)明作進一步說明。
本發(fā)明提供了一種利用汽車喇叭聲紋中斷車機消息播報的方法及系統(tǒng),為車機設(shè)備在消息播報過程提供了一種中斷播報的方法,即利用喇叭聲音來中斷車機設(shè)備的消息播報流程。汽車喇叭聲音是一種固定的聲音信號,具有固定頻譜和聲域,通過采集、歸納、提取汽車喇叭聲音的聲紋特征,并利用該聲紋特征訓練得到喇叭聲紋模型,進而結(jié)合聲紋識別技術(shù),在車機設(shè)備的消息播報流程中持續(xù)監(jiān)聽聲音信號,當監(jiān)聽到聲音信號匹配喇叭聲紋模型中的已知的喇叭聲紋特征,就判斷為喇叭聲音,并且執(zhí)行中斷消息播報流程的操作,當監(jiān)聽到的聲音不匹配時,就繼續(xù)監(jiān)聽直至消息播報流程結(jié)束。由于按喇叭操作經(jīng)常發(fā)生且極易操作,能夠快速有效的中斷消息播報流程,按喇叭還能夠轉(zhuǎn)移車內(nèi)其他乘坐人的注意力,且按喇叭動作不會產(chǎn)生違和感,化解尷尬情境,保護了用戶的隱私信息不被播報,還提升了語音產(chǎn)品的人文關(guān)懷。下面結(jié)合附圖對本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的方法及系統(tǒng)進行說明。
本發(fā)明提供了一種利用汽車喇叭聲紋中斷車機消息播報的系統(tǒng),該系統(tǒng)包括有喇叭聲紋模型、音頻獲取模塊、特征提取模塊、以及中斷控制模塊。該系統(tǒng)可集成到車機設(shè)備的語音交互系統(tǒng)中,也可以作為單獨的產(chǎn)品裝設(shè)到車機設(shè)備上,并與語音交互系統(tǒng)通信連接,語音交互系統(tǒng)內(nèi)設(shè)置有消息播報系統(tǒng),用于接收到的需要進行消息播報的消息進行語音播報。本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的系統(tǒng)中的喇叭聲紋模型裝設(shè)于車機設(shè)備上,在系統(tǒng)集成于車機設(shè)備的語音交互系統(tǒng)中的情形下,該喇叭聲紋模型可集成于車機設(shè)備的語音交互系統(tǒng)中。該喇叭聲紋模型與車機設(shè)備上的消息播報系統(tǒng)連接,喇叭聲紋模型還與音頻獲取模塊、特征提取模塊、以及中斷控制模塊連接,特征提取模塊與音頻獲取模塊連接,中斷控制模塊與消息播報系統(tǒng)連接。
消息播報系統(tǒng)在收到需要進行消息播報的消息時形成激活指令,如圖1所示,在收到消息后形成激活指令發(fā)送給喇叭聲紋模型以激活喇叭聲紋模型。消息播報系統(tǒng)在收到消息后,在發(fā)送激活指令的同時還進行tts播報新信息提示(tts,text to speech,從文本到語音),利用語音交互系統(tǒng)詢問用戶是否需要對新信息進行語音播報,提示后等待用戶反饋。若用戶反饋為播報,則該消息播報系統(tǒng)對新信息進行語音播報,即進入語音播報流程直至完成播報,若用戶反饋為不播報,則消息播報系統(tǒng)的播報流程結(jié)束,在播報流程結(jié)束后形成結(jié)束播報指令給喇叭聲紋模型以釋放喇叭聲紋模型。
在喇叭聲紋模型被激活指令激活后,該喇叭聲紋模型向音頻獲取模塊發(fā)送錄音獲取指令,音頻獲取模塊根據(jù)錄音獲取指令開始運行。該音頻獲取模塊與車機設(shè)備上的麥克風控制連接,音頻獲取模塊運行后控制車機設(shè)備上的麥克風連續(xù)不斷地進行監(jiān)聽錄音并獲取所形成的錄音信號,該音頻獲取模塊還用于對獲取的錄音信號進行降噪處理。具體地,麥克風在被音頻獲取模塊控制開啟后,實時地進行錄音,所形成的錄音信號為模擬信號,該音頻獲取模塊中設(shè)有模數(shù)轉(zhuǎn)換器,形成的錄音信號經(jīng)模數(shù)轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號。在音頻獲取模塊中還設(shè)有降噪子模塊,降噪子模塊利用環(huán)境噪音對轉(zhuǎn)換成數(shù)字信號的錄音信號進行降噪,該降噪子模塊所利用的環(huán)境噪音可以是預先存儲的,也可以是在車機設(shè)備開啟后錄取的車內(nèi)環(huán)境聲音所形成的。
特征提取模塊接收音頻獲取模塊所獲取的錄音信號,音頻獲取模塊對錄音信號進行降噪處理后,將處理后的錄音信號發(fā)送給特征提取模塊,該特征提取模塊用于對錄音信號進行特征提取以獲得對應的聲紋特征,該特征提取模塊所提取的聲紋特征發(fā)送給喇叭聲紋模型,以令喇叭聲紋模型進行識別。
喇叭聲紋模型在接收到特征提取模塊發(fā)送的提取的聲紋特征后,對該提取的聲紋特征進行匹配判斷,并輸出匹配判斷結(jié)果給中斷控制模塊。當匹配判斷結(jié)果為所提取的聲紋特征與喇叭聲紋特征相匹配時,該中斷控制模塊根據(jù)該匹配判斷結(jié)果形成中斷播報指令發(fā)送給消息播報信息以中斷消息播報進而使得消息播報結(jié)果;當匹配判斷結(jié)果為所提取的聲紋特征與喇叭聲紋特征不匹配時,則中斷控制模塊不作處理。匹配判斷結(jié)果為提取的聲紋特征與喇叭聲紋特征相匹配時,表示用戶進行了按喇叭操作,在監(jiān)聽到喇叭聲音時立即中斷消息播報流程,實現(xiàn)快速及時有效的中斷,以保護用戶隱私,解決現(xiàn)有通過操作面板操作不及時的問題。
本發(fā)明中的喇叭聲紋模型是通過喇叭聲紋特征進行聲學模型訓練得到的,為了提高喇叭聲紋模型識別的準確率,需要采集大量的喇叭聲紋特征進行聲學模型訓練,且喇叭聲紋特征還要通過多種環(huán)境下的喇叭聲音信號進行提取獲得。多種環(huán)境下的喇叭聲音信號包括有汽車在不同檔位行駛的環(huán)境下的喇叭聲音信號,汽車在開、關(guān)窗的環(huán)境下的喇叭聲音信號以及汽車內(nèi)有、無背景聲音的環(huán)境下的喇叭聲音信號。采集喇叭聲音信號時,在真實場景的不同狀態(tài)中進行,若是前裝車機,則需要采集該汽車車型在各種狀態(tài)的喇叭聲音,包括各檔車速、開關(guān)窗、是否有背景聲音的狀態(tài)下。若是后裝車機,則需要采集不同車型在各種狀態(tài)的喇叭聲音,對車型和上述的各檔車速、開關(guān)窗、是否有背景聲音的狀態(tài)進行組合采集喇叭聲音。
消息播報系統(tǒng)在消息播報結(jié)束時,形成結(jié)束播報指令發(fā)送給喇叭聲紋模型以釋放喇叭聲紋模型。該消息播報系統(tǒng)的消息播報結(jié)束包括完成播報消息、用戶反饋不播報以及中斷控制模塊發(fā)送中斷播報指令而中斷消息播報。該喇叭聲紋模型在接收到結(jié)束播報指令后形成關(guān)閉指令并發(fā)送給音頻獲取模塊、特征提取模塊以及中斷控制模塊,令音頻獲取模塊、特征提取模塊以及中斷控制模塊停止運行,以待下次被激活。
本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的系統(tǒng)的有益效果為:
本發(fā)明的系統(tǒng)針對車載場景且同乘車又有多個人的情況,為了避免私人信息被直接播報,在語音播報消息過程中,進行實施監(jiān)聽,在監(jiān)聽到喇叭聲音,立即中斷語音播報,有效保護用戶隱私。
按喇叭操作在汽車使用過程中經(jīng)常發(fā)生且極易操作,實現(xiàn)了快速及時有效的中斷消息播報,解決了現(xiàn)有操作面板操控不及時的問題。
按喇叭還能夠轉(zhuǎn)移其他乘坐人的注意力,同時按喇叭的動作不會產(chǎn)生違和感,化解尷尬情境,提升了語音產(chǎn)品的人文關(guān)懷。
下面對本發(fā)明利用汽車喇叭聲紋中斷車機消息播報的方法進行說明。
本發(fā)明的利用汽車喇叭聲紋中斷車機消息播報的方法包括如下步驟:
在車機設(shè)備上建立喇叭聲紋模型,該喇叭聲紋模型用于識別喇叭聲音;
在車機設(shè)備收到需進行消息播報的消息時,激活所建立的喇叭聲紋模型,使得喇叭聲紋模型處于運行狀態(tài);
通過車機設(shè)備上的麥克風連續(xù)不斷地進行監(jiān)聽錄音以獲取錄音信號;
對所獲取的錄音信號進行降噪處理并提取對應的聲紋特征;
將所提取的聲紋特征輸入到喇叭聲紋模型中進行匹配判斷,即通過喇叭聲紋模型對所提取的聲紋特征進行識別;當所提取的聲紋特征與喇叭聲紋特征相匹配,則形成中斷播報指令發(fā)送給車機設(shè)備以中斷消息播報進而使得消息播報結(jié)束;當所提取的聲紋特征與喇叭聲紋特征不匹配,則繼續(xù)進行匹配判斷直至消息播報結(jié)束。
本發(fā)明的方法針對車機設(shè)備的語音交互系統(tǒng),該語音交互系統(tǒng)內(nèi)設(shè)置有消息播報系統(tǒng),用于接收到的需要進行消息播報的消息進行語音播報。本發(fā)明的方法對消息播報系統(tǒng)實現(xiàn)控制,在消息播報的過程中,通過獲取到了喇叭聲音從而中斷消息播報,避免了私人信息被直接播報。下面結(jié)合圖1,對本發(fā)明的利用汽車喇叭聲紋中斷車機消息播報方法的流程進行說明。
如圖1所示,消息播報系統(tǒng)接收到新信息時,即步驟S101,收到消息,消息播報系統(tǒng)接著執(zhí)行步驟S102和步驟S107。
執(zhí)行步驟S102,激活喇叭聲紋模型,該消息播報系統(tǒng)可以通過發(fā)送激活指令的方式激活喇叭聲紋模型,被激活的喇叭聲紋模型處于運行狀態(tài)。接著執(zhí)行步驟S103。
執(zhí)行步驟S103,監(jiān)聽錄音,在喇叭聲紋模型被激活后,開始持續(xù)地監(jiān)聽錄音,可以通過控制車機設(shè)備的麥克風開啟進行監(jiān)聽錄音,連續(xù)不斷地錄制以形成錄音信號。接著執(zhí)行步驟S104。
執(zhí)行步驟S104,降噪處理,對所錄制的錄音信號進行降噪處理,可以利用實現(xiàn)預存的環(huán)境噪音進行降噪處理,也可以在車機設(shè)備啟動時,對車內(nèi)環(huán)境聲音進行錄制形成環(huán)境噪音。接著執(zhí)行步驟S105。
執(zhí)行步驟S105,對經(jīng)過降噪處理的錄音信號進行聲紋特征提取,以提取與錄音信號對應的聲紋特征。接著執(zhí)行步驟S106。
執(zhí)行步驟S106,喇叭聲紋模型對所提取的聲紋特征進行匹配判斷,即對所提取的聲紋特征進行識別,識別其是否為喇叭聲音。喇叭聲紋模型將所提取的聲紋特征與喇叭聲紋特征進行匹配判斷,若所提取的聲紋特征與喇叭聲紋特征相匹配,則接著執(zhí)行步驟S109。若所提取的聲紋特征與喇叭聲紋特征不匹配,則接著執(zhí)行步驟S102,以繼續(xù)進行監(jiān)聽錄音。
執(zhí)行步驟S107,tts播報新信息提示,即語音提示用戶收到新信息是否需要播報,接著執(zhí)行步驟S108。
執(zhí)行步驟S108,等待用戶反饋。這步驟S107和步驟S108中接收到用戶反饋后,若反饋信息為播報,則執(zhí)行步驟S110,若反饋信息為不播報,則執(zhí)行步驟S109。
執(zhí)行步驟S110,語音播報流程,對新信息進行語音播報。接著執(zhí)行步驟S111。
執(zhí)行步驟S109,中斷當前播報流程,接著執(zhí)行步驟S111。
執(zhí)行步驟S111,流程結(jié)束,語音播報流程結(jié)束,接著執(zhí)行步驟S112。
執(zhí)行步驟S112,釋放喇叭聲紋模型。
在步驟S111的流程結(jié)束中,會有多種結(jié)束情況,在語音播報完成后進入到流程結(jié)束,在用戶反饋不播報而通過中斷當前播報流程而進入流程結(jié)束,在喇叭聲紋模型識別到有喇叭聲音而通過中斷當前播報流程而進入流程結(jié)束。本發(fā)明利用了喇叭聲音來中斷消息播報,在車機聲波進行消息播報的過程中,始終對車內(nèi)的環(huán)境進行監(jiān)聽,當監(jiān)聽到喇叭聲音時,立即中斷消息播報并取消播報流程,對車主的隱私起到了很好的保護。按喇叭的操作經(jīng)常發(fā)生且極易操作,能夠快速有效的中斷消息播報,另外,利用喇叭中斷播報,按喇叭能夠轉(zhuǎn)移其他同乘人員的注意力,且按喇叭的動作不會產(chǎn)生違和感,能夠較好的化解尷尬情境,提升了語音產(chǎn)品的人文關(guān)懷。
本發(fā)明的方法的一較佳實施方式,在車機設(shè)備上建立喇叭聲紋模型包括:
采集多種環(huán)境下的喇叭聲音信號,并從所采集的喇叭聲音信號中提取出對應的喇叭聲紋特征,為提高喇叭聲紋模型的識別準確率,需采集大量的喇叭聲音信號。利用所提取的喇叭聲紋特征進行聲學模型訓練以得到對應的喇叭聲紋模型。
采集多種環(huán)境下的喇叭聲音信號包括:采集汽車在不同檔位行駛的環(huán)境下的喇叭聲音信號;采集汽車在開、關(guān)窗的環(huán)境下的喇叭聲音信號;以及采集汽車內(nèi)有、無背景聲音的環(huán)境下的喇叭聲音信號。采集喇叭聲音信號時,在真實場景的不同狀態(tài)中進行,若是前裝車機,則需要采集該汽車車型在各種狀態(tài)的喇叭聲音,包括各檔車速、開關(guān)窗、是否有背景聲音的狀態(tài)下。若是后裝車機,則需要采集不同車型在各種狀態(tài)的喇叭聲音,對車型和上述的各檔車速、開關(guān)窗、是否有背景聲音的狀態(tài)進行組合采集喇叭聲音。
在消息播報結(jié)束時,釋放喇叭聲紋模型,可通過形成結(jié)束播報指令的方式來釋放喇叭聲紋模型,以待下次被激活。
以上結(jié)合附圖實施例對本發(fā)明進行了詳細說明,本領(lǐng)域中普通技術(shù)人員可根據(jù)上述說明對本發(fā)明做出種種變化例。因而,實施例中的某些細節(jié)不應構(gòu)成對本發(fā)明的限定,本發(fā)明將以所附權(quán)利要求書界定的范圍作為本發(fā)明的保護范圍。