本發(fā)明涉及一種喚醒方法及系統(tǒng),尤其涉及一種基于語音和臉部圖像識別的混合喚醒方法及系統(tǒng)。
背景技術(shù):
隨著智能電子產(chǎn)品的出現(xiàn),智能設(shè)備越來越廣泛地進入人們的生活?,F(xiàn)有家用智能設(shè)備正朝著更加智能化的方向進入家用,比如家用智能電視。喚醒對于智能電子設(shè)備具有重要意義,通常智能電子設(shè)備在工作之后處理休眠狀態(tài),啟動時需要喚醒。現(xiàn)有技術(shù)中,語音喚醒是比較重要的喚醒方式,但語音喚醒需要固定的喚醒詞,有時無意中使用了該喚醒詞,往往導(dǎo)致智能電子設(shè)備的錯誤啟動?,F(xiàn)有技術(shù)中,也有利用圖像和語音混合喚醒技術(shù)進行喚醒,但其圖像并非通過與產(chǎn)品的方位來確定。
技術(shù)實現(xiàn)要素:
本發(fā)明解決的技術(shù)問題是:構(gòu)建一種混合喚醒方法及系統(tǒng),克服現(xiàn)有技術(shù)喚醒智能電子喚醒方法過于單一,容易導(dǎo)致出錯的技術(shù)問題。
本發(fā)明的技術(shù)方案是:提供一種混合喚醒方法,包括如下步驟:
采集語音,對采集的語音進行識別,將語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令進行對比;
采集臉部圖像特征,根據(jù)采集的臉部圖像特征確定臉部是否對著待喚醒設(shè)備;
若語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令一致以及臉部對著待喚醒設(shè)備,則喚醒該設(shè)備。
本發(fā)明的進一步技術(shù)方案是:所述臉部圖像特征包括臉部輪廓特征、臉部器官特征。
本發(fā)明的進一步技術(shù)方案是:根據(jù)臉部輪廓特征和臉部器官特征確定臉部的左右中間線和上下中間線,根據(jù)左右中間線和臉部輪廓特征確定臉部左部和右部的面積比,根據(jù)上下中間線和臉部輪廓特征確定臉部上部和下部的面積比,根據(jù)臉部左部和右部的面積比和臉部上部和下部的面積比確定臉部是否對著待喚醒設(shè)備。
本發(fā)明的進一步技術(shù)方案是:臉部左部和右部的面積比為0.8至1.2以及臉部上部和下部的面積比為0.7至1.3,則確定臉部是否對著待喚醒設(shè)備。
本發(fā)明的進一步技術(shù)方案是:在不能通過臉部特征進行確定時,通過特定的語音來喚醒設(shè)備。
本發(fā)明的技術(shù)方案是:構(gòu)建一種混合喚醒系統(tǒng),包括語音采集模塊、語音識別模塊、圖像采集模塊、語音指令比較模塊、臉部特征確定模塊、喚醒模塊,所述語音采集模塊采集語音,所述語音識別模塊對采集的語音進行識別,所述語音指令比較模塊將語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令進行對比,所述圖像采集模塊采集臉部圖像特征,所述臉部特征確定模塊根據(jù)采集的臉部圖像特征確定臉部是否對著待喚醒設(shè)備,若語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令一致以及臉部對著待喚醒設(shè)備,則所述喚醒模塊喚醒該設(shè)備。
本發(fā)明的進一步技術(shù)方案是:所述圖像采集模塊所述臉部圖像特征包括臉部輪廓特征、臉部器官特征。
本發(fā)明的進一步技術(shù)方案是:所述臉部特征確定模塊根據(jù)臉部輪廓特征和臉部器官特征確定臉部的左右中間線和上下中間線,所述臉部特征確定模塊根據(jù)左右中間線和臉部輪廓特征確定臉部左部和右部的面積比,所述臉部特征確定模塊根據(jù)上下中間線和臉部輪廓特征確定臉部上部和下部的面積比,所述臉部特征確定模塊根據(jù)臉部左部和右部的面積比和臉部上部和下部的面積比確定臉部是否對著待喚醒設(shè)備。
本發(fā)明的進一步技術(shù)方案是:臉部左部和右部的面積比為0.8至1.2以及臉部上部和下部的面積比為0.7至1.3,則所述臉部特征確定模塊確定臉部是否對著待喚醒設(shè)備。
本發(fā)明的進一步技術(shù)方案是:還包括特定語音喚醒模塊,在不能通過臉部特征進行確定時,所述特定語音喚醒模塊通過特定的語音來喚醒設(shè)備。
本發(fā)明的技術(shù)效果是:構(gòu)建一種混合喚醒方法及系統(tǒng),包括以下步驟:采集語音,對采集的語音進行識別,將語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令進行對比。采集臉部圖像特征,根據(jù)采集的臉部圖像特征確定臉部是否對著待喚醒設(shè)備。若語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令一致以及臉部對著待喚醒設(shè)備,則喚醒該設(shè)備。本發(fā)明一種混合喚醒方法及系統(tǒng),通過語音喚醒和臉部與待喚醒設(shè)備的方位關(guān)系共同喚醒設(shè)備,克服現(xiàn)有技術(shù)喚醒方法單一容易出錯的技術(shù)問題。
附圖說明
圖1為本發(fā)明的結(jié)構(gòu)示意圖。
具體實施方式
下面結(jié)合具體實施例,對本發(fā)明技術(shù)方案進一步說明。
本發(fā)明的具體實施方式是:提供一種混合喚醒方法,包括如下步驟:
采集語音,對采集的語音進行識別,將語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令進行對比。
具體實施過程是:系統(tǒng)中預(yù)設(shè)語音喚醒指令,通過麥克風(fēng)等設(shè)備采集語音,然后將采集的語音進行語音識別,將語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令進行對比。
采集臉部圖像特征,根據(jù)采集的臉部圖像特征確定臉部是否對著待喚醒設(shè)備。
具體實施過程是:通過攝像采集人的臉部圖像特征,所述臉部圖像特征包括臉部輪廓特征、臉部器官特征,根據(jù)臉部輪廓特征、臉部器官特征得到臉部對準(zhǔn)的方向,確定臉部是否對著待喚醒設(shè)備。
若語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令一致以及臉部對著待喚醒設(shè)備,則喚醒該設(shè)備。
具體實施過程是:若語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令一致,并且根據(jù)臉部輪廓特征、臉部器官特征得到臉部對準(zhǔn)的方向,確定臉部是否對著待喚醒設(shè)備,則喚醒該設(shè)備。
本發(fā)明的優(yōu)選實施方式是:所述臉部圖像特征包括臉部輪廓特征、臉部器官特征。根據(jù)臉部輪廓特征和臉部器官特征確定臉部的左右中間線和上下中間線,根據(jù)左右中間線和臉部輪廓特征確定臉部左部和右部的面積比,根據(jù)上下中間線和臉部輪廓特征確定臉部上部和下部的面積比,根據(jù)臉部左部和右部的面積比和臉部上部和下部的面積比確定臉部是否對著待喚醒設(shè)備。臉部左部和右部的面積比為0.8至1.2以及臉部上部和下部的面積比為0.7至1.3,則確定臉部是否對著待喚醒設(shè)備。
本發(fā)明的優(yōu)選實施方式的實施過程如下:所述臉部圖像特征包括臉部輪廓特征、臉部器官特征。具體實施例中,根據(jù)獲取的臉部圖像確定臉部邊緣輪廓,獲取臉部輪廓特征,根據(jù)獲取的臉部圖像確定臉部器官邊緣輪廓,尤其是臉部的眼睛、鼻子、眉毛、頭頂、下巴、額頭、嘴巴等臉部器官特征,根據(jù)這些臉部器官特征中的多種組合確定臉部的左右中間線和上下中間線,比如,通過眼睛、鼻子、眉毛、頭頂、下巴、額頭、嘴巴中的任意一種或多種得到臉部的左右中間線,通過頭頂、下巴得到臉部的上下中間線。根據(jù)上下中間線和臉部輪廓特征確定臉部上部和下部的面積比,根據(jù)臉部左部和右部的面積比和臉部上部和下部的面積比確定臉部是否對著待喚醒設(shè)備。具體實施例中,臉部左部和右部的面積比為0.8至1.2以及臉部上部和下部的面積比為0.7至1.3,則確定臉部是否對著待喚醒設(shè)備。
本發(fā)明的優(yōu)選實施方式是:在不能通過臉部特征進行確定時,通過特定的語音來喚醒設(shè)備。具體實施方式為:在一些情況下,不能同時通過語音指令和圖像掃描喚醒時,設(shè)置特定語音喚醒指令進行喚醒,通過輸入特征語音,識別后與該特定語音喚醒指令進行對比,若一致,則喚醒該待喚醒設(shè)備。比如:當(dāng)燈光比較暗,難以采集到清楚圖像時,設(shè)置特定語音喚醒指令進行喚醒,通過輸入特征語音,識別后與該特定語音喚醒指令進行對比,若一致,則喚醒該待喚醒設(shè)備。
如圖1所示,本發(fā)明的具體實施方式是:構(gòu)建一種混合喚醒系統(tǒng),包括語音采集模塊1、語音識別模塊2、圖像采集模塊3、語音指令比較模塊4、臉部特征確定模塊5、喚醒模塊6,所述語音采集模塊1采集語音,所述語音識別模塊2對采集的語音進行識別,所述語音指令比較模塊4將語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令進行對比,所述圖像采集模塊3采集臉部圖像特征,所述臉部特征確定模塊5根據(jù)采集的臉部圖像特征確定臉部是否對著待喚醒設(shè)備,若語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令一致以及臉部對著待喚醒設(shè)備,則所述喚醒模塊6喚醒該設(shè)備。
如圖1所示,本發(fā)明的具體實施過程是:具體實施過程是:系統(tǒng)中預(yù)設(shè)語音喚醒指令,所述語音采集模塊1通過麥克風(fēng)等設(shè)備采集語音,然后語音識別模塊2將采集的語音進行語音識別,語音指令比較模塊4將語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令進行對比。所述圖像采集模塊3通過攝像采集人的臉部圖像特征,所述臉部圖像特征包括臉部輪廓特征、臉部器官特征,臉部特征確定模塊5根據(jù)臉部輪廓特征、臉部器官特征得到臉部對準(zhǔn)的方向,臉部特征確定模塊5確定臉部是否對著待喚醒設(shè)備。若語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令一致,并且根據(jù)臉部輪廓特征、臉部器官特征得到臉部對準(zhǔn)的方向,確定臉部是否對著待喚醒設(shè)備,則所述喚醒模塊6喚醒該設(shè)備。
本發(fā)明的優(yōu)選實施方式的實施過程如下:所述臉部圖像特征包括臉部輪廓特征、臉部器官特征。具體實施例中,根據(jù)獲取的臉部圖像確定臉部邊緣輪廓,獲取臉部輪廓特征,根據(jù)獲取的臉部圖像確定臉部器官邊緣輪廓,尤其是臉部的眼睛、鼻子、眉毛、頭頂、下巴、額頭、嘴巴等臉部器官特征,根據(jù)這些臉部器官特征中的多種組合確定臉部的左右中間線和上下中間線,比如,通過眼睛、鼻子、眉毛、頭頂、下巴、額頭、嘴巴中的任意一種或多種得到臉部的左右中間線,通過頭頂、下巴得到臉部的上下中間線。根據(jù)上下中間線和臉部輪廓特征確定臉部上部和下部的面積比,根據(jù)臉部左部和右部的面積比和臉部上部和下部的面積比確定臉部是否對著待喚醒設(shè)備。具體實施例中,臉部左部和右部的面積比為0.8至1.2以及臉部上部和下部的面積比為0.7至1.3,則臉部特征確定模塊5確定臉部是否對著待喚醒設(shè)備。
本發(fā)明的優(yōu)選實施方式是:還包括特定語音喚醒模塊8,在不能通過臉部特征進行確定時,所述特定語音喚醒模塊8通過特定的語音來喚醒設(shè)備。具體實施方式為:在一些情況下,不能同時通過語音指令和圖像掃描喚醒時,設(shè)置特定語音喚醒指令進行喚醒,通過輸入特征語音,識別后與該特定語音喚醒指令進行對比,若一致,則特定語音喚醒模塊8喚醒該待喚醒設(shè)備。比如:當(dāng)燈光比較暗,難以采集到清楚圖像時,設(shè)置特定語音喚醒指令進行喚醒,通過輸入特征語音,識別后與該特定語音喚醒指令進行對比,若一致,則特定語音喚醒模塊8喚醒該待喚醒設(shè)備。
本發(fā)明的技術(shù)效果是:構(gòu)建一種混合喚醒方法及系統(tǒng),包括以下步驟:采集語音,對采集的語音進行識別,將語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令進行對比。采集臉部圖像特征,根據(jù)采集的臉部圖像特征確定臉部是否對著待喚醒設(shè)備。若語音識別結(jié)果與預(yù)設(shè)的語音喚醒指令一致以及臉部對著待喚醒設(shè)備,則喚醒該設(shè)備。本發(fā)明一種混合喚醒方法及系統(tǒng),通過語音喚醒和臉部與待喚醒設(shè)備的方位關(guān)系共同喚醒設(shè)備,克服現(xiàn)有技術(shù)喚醒方法單一容易出錯的技術(shù)問題。
以上內(nèi)容是結(jié)合具體的優(yōu)選實施方式對本發(fā)明所作的進一步詳細(xì)說明,不能認(rèn)定本發(fā)明的具體實施只局限于這些說明。對于本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干簡單推演或替換,都應(yīng)當(dāng)視為屬于本發(fā)明的保護范圍。