亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種聲音喚醒方法及系統(tǒng)的制作方法

文檔序號(hào):2827498閱讀:265來源:國(guó)知局
一種聲音喚醒方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種聲音喚醒方法及系統(tǒng),屬于聲音識(shí)別【技術(shù)領(lǐng)域】。該方法包括當(dāng)檢測(cè)到外界聲音時(shí),啟動(dòng)聲音喚醒系統(tǒng);采集外界聲音,提取該外界聲音的音頻特征;當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含該外界聲音的音頻特征時(shí),傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào),該預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征;統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)該外界聲音出現(xiàn)次數(shù),并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。本發(fā)明使得聲音識(shí)別系統(tǒng)高效、準(zhǔn)確、省電,且靈活運(yùn)用。
【專利說明】一種聲音喚醒方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及聲音識(shí)別【技術(shù)領(lǐng)域】,特別涉及一種聲音喚醒方法及系統(tǒng)。
【背景技術(shù)】
[0002]近些年來,隨著語(yǔ)音識(shí)別技術(shù)的快速發(fā)展,喚醒技術(shù)在諸多語(yǔ)音系統(tǒng)中得到了應(yīng)用,例如:車載導(dǎo)航、手機(jī)語(yǔ)音助手等。傳統(tǒng)的語(yǔ)音喚醒技術(shù)需要耗費(fèi)電量做聲音方面的大量計(jì)算,或是通過按鈕等方法控制,在遠(yuǎn)程控制等復(fù)雜環(huán)境中難以騰出手來操作,具有諸多不便。而此類產(chǎn)品在現(xiàn)實(shí)生活中又具有諸多應(yīng)用,例如樓道中的聲控?zé)?、聲控解鎖等。這類產(chǎn)品其中一些能做到省電,卻容易受到外界環(huán)境干擾,例如樓道中的聲控?zé)魰?huì)因?yàn)闃巧匣驑窍侣曇舻母蓴_而自動(dòng)開啟,在實(shí)際生活中效果不佳。又例如通過對(duì)用戶的一些特殊語(yǔ)句進(jìn)行識(shí)別(例如“開始”等等)來喚醒系統(tǒng),但是對(duì)于這類語(yǔ)句的識(shí)別復(fù)雜度較高,需要提取高階特征,做復(fù)雜訓(xùn)練,構(gòu)造聲學(xué)模型,計(jì)算量較大,使得耗電量上升,在很多條件下難以推廣使用??紤]到一個(gè)好的喚醒模塊能夠使整個(gè)語(yǔ)音系統(tǒng)在大部分時(shí)間處于偽待機(jī)狀態(tài),即除了喚醒模塊其他模塊關(guān)閉,改進(jìn)現(xiàn)有技術(shù)對(duì)整個(gè)語(yǔ)音系統(tǒng)有較大意義。

【發(fā)明內(nèi)容】

[0003]為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實(shí)施例提供了一種聲音喚醒系統(tǒng)及方法。所述技術(shù)方案如下:
[0004]一方面,提供了一種聲音喚醒方法,所述方法包括:
[0005]當(dāng)檢測(cè)到外界聲音時(shí),啟動(dòng)聲音喚醒系統(tǒng);
[0006]采集外界聲音,提取所述外界聲音的音頻特征;
[0007]當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí),傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào),所述預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征;
[0008]統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)所述外界聲音出現(xiàn)次數(shù),并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。
[0009]另一方面,提供了一種聲音喚醒系統(tǒng),所述系統(tǒng)包括:預(yù)處理模塊、音頻輸入模塊、特征提取模塊、音頻分析模塊、解碼模塊;其中,
[0010]所述預(yù)處理模塊用于當(dāng)檢測(cè)到外界聲音時(shí),啟動(dòng)所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模塊;
[0011]所述音頻輸入模塊用于采集外界聲音;
[0012]所述特征提取模塊用于提取外界聲音的音頻特征;
[0013]所述音頻分析模塊,用于當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí),傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào),所述預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征;
[0014]所述解碼模塊用于統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)所述外界聲音出現(xiàn)次數(shù),并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。
[0015]本發(fā)明實(shí)施例提供的技術(shù)方案帶來的有益效果是:
[0016]通過檢測(cè)外界聲音,當(dāng)外界聲音非靜音時(shí),啟動(dòng)聲音喚醒系統(tǒng),當(dāng)判斷外界聲音為預(yù)設(shè)聲音時(shí),根據(jù)預(yù)設(shè)聲音出現(xiàn)的次數(shù)執(zhí)行相應(yīng)指令,使得該聲音喚醒系統(tǒng)具有較好的魯棒性,根據(jù)預(yù)設(shè)聲音執(zhí)行相應(yīng)指令,準(zhǔn)確率較高,資源消耗相對(duì)較低節(jié),省電源消耗。
【專利附圖】

【附圖說明】
[0017]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0018]圖1是本發(fā)明實(shí)施例提供的聲音喚醒方法流程圖;
[0019]圖2是本發(fā)明實(shí)施例提供的聲音喚醒系統(tǒng)結(jié)構(gòu)示意圖;
[0020]圖3是本發(fā)明實(shí)施例提供的聲音喚醒方法流程圖。
【具體實(shí)施方式】
[0021]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
[0022]圖1是本發(fā)明實(shí)施例提供的聲音喚醒方法流程圖。參見圖1,該實(shí)施例包括
[0023]101、當(dāng)檢測(cè)到外界聲音時(shí),啟動(dòng)聲音喚醒系統(tǒng);
[0024]在本發(fā)明實(shí)施例中,可以采用聲音強(qiáng)度檢測(cè)器檢測(cè)外界聲音,當(dāng)檢測(cè)到外界聲音時(shí),啟動(dòng)聲音喚醒系統(tǒng),當(dāng)未檢測(cè)到外界聲音時(shí),不啟動(dòng)聲音喚醒系統(tǒng)。也即是在附近無人時(shí),不啟動(dòng)聲音喚醒系統(tǒng),待有人時(shí),才啟動(dòng)聲音喚醒系統(tǒng),可以大大減少電量的消耗。
[0025]102、采集外界聲音,并對(duì)所采集的外界聲音進(jìn)行端點(diǎn)檢測(cè),確定所采集的外界聲首是否靜首;
[0026]在本發(fā)明實(shí)施例中,采集外界聲音,并用所采集的外界聲音最為簡(jiǎn)單的特征如音量、頻率、音高等進(jìn)行端點(diǎn)檢測(cè),排除靜音等情況。
[0027]103、當(dāng)所采集的外界聲音非靜音時(shí),對(duì)該外界聲音進(jìn)行短時(shí)快速傅里葉變化,提取該外界聲音的音頻特征;
[0028]104、當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含該外界聲音的音頻特征時(shí),傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào),該預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征;
[0029]其中,該人體聲音可以為掌聲、口哨聲、咳嗽聲等具有人類自身特征的聲音。使得在復(fù)雜的噪聲環(huán)境下,聲音喚醒系統(tǒng)具有較好的魯棒性,對(duì)于不同用戶普適性較好,不受口音影響,簡(jiǎn)單好用,且準(zhǔn)確率高,資源消耗相對(duì)較低。
[0030]在本發(fā)明實(shí)施例中,判斷該預(yù)設(shè)規(guī)則庫(kù)中是否包含所述外界聲音的音頻特征,如果該預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí),傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào),如果該預(yù)設(shè)規(guī)則庫(kù)中未包含所述外界聲音的音頻特征時(shí),不傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào)。
[0031]需要說明的是,本發(fā)明實(shí)施例采用預(yù)設(shè)聲音進(jìn)行喚醒,在本發(fā)明的另一實(shí)施例中,也可以使用其他音頻特征做打擊聲音喚醒,使用時(shí)域特征做口哨聲的音頻檢測(cè)等喚醒方式,本發(fā)明實(shí)施例不作具體限定。
[0032]105、統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)預(yù)設(shè)聲音出現(xiàn)的次數(shù),并根據(jù)所統(tǒng)計(jì)的預(yù)設(shè)聲音出現(xiàn)的次數(shù),執(zhí)行相應(yīng)的指令。[0033]在本發(fā)明實(shí)施例中,統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)預(yù)設(shè)聲音出現(xiàn)的次數(shù),按照預(yù)設(shè)聲音出現(xiàn)的次數(shù)執(zhí)行預(yù)設(shè)定義的指令,例如,出現(xiàn)一次預(yù)設(shè)聲音,開啟聲音識(shí)別模塊,出現(xiàn)兩次預(yù)設(shè)聲首,關(guān)閉聲首控制等。
[0034]需要說明的是,該聲音喚醒方法可以在軟件系統(tǒng)中實(shí)現(xiàn),也可以集成到硬件中實(shí)現(xiàn),本發(fā)明實(shí)施例不作具體限定。
[0035]本發(fā)明實(shí)施例提供的方法,通過檢測(cè)外界聲音,當(dāng)外界聲音非靜音時(shí),啟動(dòng)聲音喚醒系統(tǒng),當(dāng)判斷外界聲音為預(yù)設(shè)聲音時(shí),根據(jù)預(yù)設(shè)聲音出現(xiàn)的次數(shù)執(zhí)行相應(yīng)指令,使得該聲音喚醒系統(tǒng)具有較好的魯棒性,根據(jù)預(yù)設(shè)聲音執(zhí)行相應(yīng)指令,準(zhǔn)確率較高,資源消耗相對(duì)較低節(jié)省電源消耗。
[0036]圖2是本發(fā)明實(shí)施例提供的聲音喚醒系統(tǒng)結(jié)構(gòu)圖。參見圖2,該系統(tǒng)包括預(yù)處理模塊201、音頻輸入模塊202、特征提取模塊203、音頻分析模塊204、解碼模塊205 ;其中,
[0037]所述預(yù)處理模塊201用于當(dāng)檢測(cè)到外界聲音時(shí),啟動(dòng)所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模塊;所述預(yù)處理模塊201與所述音頻輸入模塊連接,所述音頻輸入模塊202用于采集外界聲音;所述音頻輸入模塊202與所述特征提取模塊203連接,所述特征提取模塊203用于提取所述外界聲音的音頻特征;所述特征提取模塊203與所述音頻分析模塊204連接,所述音頻分析模塊204,用于當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí),傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào),所述預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征;所述音頻分析模塊204與所述解碼模塊205連接,所述解碼模塊205用于統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)所述外界聲音出現(xiàn)次數(shù),并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。
[0038]可選地,所述音頻特征提取模塊203還用于采集外界聲音,并對(duì)所采集的外界聲音進(jìn)行端點(diǎn)檢測(cè),確定所采集的外界聲音是否靜音;
[0039]當(dāng)所采集的外界聲音非靜音時(shí),對(duì)所述外界聲音進(jìn)行短時(shí)快速傅里葉變化,提取所述外界聲音的音頻特征。
[0040]可選地,所述預(yù)處理模塊201還用于當(dāng)未檢測(cè)到外界聲音時(shí),不啟動(dòng)所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模塊。
[0041]可選地,所述系統(tǒng)還包括人體動(dòng)作聲音庫(kù),所述人體動(dòng)作聲音庫(kù)用于對(duì)應(yīng)存儲(chǔ)預(yù)設(shè)聲音的次數(shù)與指令。
[0042]可選地,所述系統(tǒng)應(yīng)用于智能移動(dòng)手機(jī)設(shè)備、智能手機(jī)應(yīng)用、車載設(shè)備、車載應(yīng)用、家居設(shè)備和可穿戴設(shè)備。
[0043]本發(fā)明實(shí)施例提供的裝置,通過檢測(cè)外界聲音,當(dāng)外界聲音非靜音時(shí),啟動(dòng)聲音喚醒系統(tǒng),當(dāng)判斷外界聲音為預(yù)設(shè)聲音時(shí),根據(jù)預(yù)設(shè)聲音出現(xiàn)的次數(shù)執(zhí)行相應(yīng)指令,使得該聲音喚醒系統(tǒng)具有較好的魯棒性,根據(jù)預(yù)設(shè)聲音執(zhí)行相應(yīng)指令,準(zhǔn)確率較高,資源消耗相對(duì)較低節(jié)省電源消耗。
[0044]圖3是本發(fā)明實(shí)施例提供的聲音喚醒方法流程圖,在圖3中預(yù)處理模塊檢測(cè)到外界聲音時(shí),發(fā)送啟動(dòng)信號(hào),啟動(dòng)聲音喚醒系統(tǒng),音頻輸入模塊采集外界聲音,當(dāng)外界聲音是靜音時(shí),不繼續(xù)啟動(dòng)后續(xù)模塊,如果外界聲音是非靜音的,則提取外界聲音特征,分析該外界聲音是否為預(yù)設(shè)聲音。如果該外界聲音不是預(yù)設(shè)聲音,則該預(yù)處理模塊繼續(xù)檢測(cè)外界聲音,如該外界聲音是預(yù)設(shè)聲音,則發(fā)送預(yù)設(shè)聲音出現(xiàn)的信號(hào)。該解碼模塊統(tǒng)計(jì)預(yù)設(shè)聲音在預(yù)設(shè)時(shí)間內(nèi)出現(xiàn)的次數(shù),查詢預(yù)設(shè)聲音出現(xiàn)次數(shù)對(duì)應(yīng)的指令,與聲音交互系統(tǒng)進(jìn)行交互,當(dāng)未查詢到預(yù)設(shè)聲音出現(xiàn)次數(shù)對(duì)應(yīng)的指令時(shí),確定為無效指令,該預(yù)處理模塊繼續(xù)檢測(cè)外界聲
曰?
[0045]在智能家居,智能手機(jī),車載,穿戴設(shè)備中,集成本發(fā)明所述的軟件系統(tǒng)模塊,檢測(cè)人體動(dòng)作聲音后,直接進(jìn)行命令動(dòng)作或者進(jìn)行后續(xù)的聲音交互。
[0046]在智能家居,智能手機(jī),車載,穿戴設(shè)備中,通過硬件模塊集成本發(fā)明所述模塊,檢測(cè)人體動(dòng)作聲音后,直接進(jìn)行命令動(dòng)作或者進(jìn)行后續(xù)的聲音交互。
[0047]例如:
[0048]用戶:(拍手一下)[0049]智能設(shè)備:您好
[0050]用戶:把電視打開。
[0051]又例如:
[0052]用戶:(拍手兩下)
[0053]智能設(shè)備:(自動(dòng)開機(jī))。
[0054]需要說明的是:上述實(shí)施例提供的聲音喚醒系統(tǒng)在聲音喚醒時(shí),僅以上述各功能模塊的劃分進(jìn)行舉例說明,實(shí)際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將系統(tǒng)的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實(shí)施例提供的聲音喚醒系統(tǒng)與聲音喚醒方法實(shí)施例屬于同一構(gòu)思,其具體實(shí)現(xiàn)過程詳見方法實(shí)施例,這里不再贅述。
[0055]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。
[0056]以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種聲音喚醒方法,其特征在于,所述方法包括: 當(dāng)檢測(cè)到外界聲音時(shí),啟動(dòng)聲音喚醒系統(tǒng); 采集外界聲音,提取所述外界聲音的音頻特征; 當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí),傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào),所述預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征; 統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)所述外界聲音出現(xiàn)次數(shù),并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,采集外界聲音,提取所述外界聲音的音頻特征包括: 采集外界聲音,并對(duì)所采集的外界聲音進(jìn)行端點(diǎn)檢測(cè),確定所采集的外界聲音是否靜曰; 當(dāng)所采集的外界聲音非靜音時(shí),對(duì)所述外界聲音進(jìn)行短時(shí)快速傅里葉變化,提取所述外界聲音的音頻特征。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 當(dāng)未檢測(cè)到外界聲音時(shí),不啟動(dòng)聲音喚醒系統(tǒng)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法應(yīng)用于智能移動(dòng)手機(jī)設(shè)備、智能手機(jī)應(yīng)用、車載設(shè)備、車載應(yīng)用、家居設(shè)備和可穿戴設(shè)備。
5.一種聲音喚醒系統(tǒng),其特征在于,所述系統(tǒng)包括預(yù)處理模塊、音頻輸入模塊、特征提取模塊、音頻分析模塊、解碼模塊;其中, 所述預(yù)處理模塊用于當(dāng)檢測(cè)到外界聲音時(shí),啟動(dòng)所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模塊; 所述音頻輸入模塊用于采集外界聲音; 所述特征提取模塊用于提取外界聲音的音頻特征; 所述音頻分析模塊,用于當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí),傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào),所述預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征; 所述解碼模塊用于統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)所述外界聲音出現(xiàn)次數(shù),并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述音頻特征提取模塊還用于采集外界聲音,并對(duì)所采集的外界聲音進(jìn)行端點(diǎn)檢測(cè),確定所采集的外界聲音是否靜音; 當(dāng)所采集的外界聲音非靜音時(shí),對(duì)所述外界聲音進(jìn)行短時(shí)快速傅里葉變化,提取所述外界聲音的音頻特征。
7.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述預(yù)處理模塊還用于當(dāng)未檢測(cè)到外界聲音時(shí),不啟動(dòng)所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模。
8.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述系統(tǒng)應(yīng)用于智能移動(dòng)手機(jī)設(shè)備、智能手機(jī)應(yīng)用、車載設(shè)備、車載應(yīng)用、家居設(shè)備和可穿戴設(shè)備。
【文檔編號(hào)】G10L15/06GK103956164SQ201410211795
【公開日】2014年7月30日 申請(qǐng)日期:2014年5月20日 優(yōu)先權(quán)日:2014年5月20日
【發(fā)明者】王艷龍, 陳楠昕, 俞凱, 周偉達(dá) 申請(qǐng)人:蘇州思必馳信息科技有限公司, 上海交通大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1