一種聲音喚醒方法及系統(tǒng)的制作方法

文檔序號(hào)：2827498閱讀：265來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種聲音喚醒方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種聲音喚醒方法及系統(tǒng)，屬于聲音識(shí)別【技術(shù)領(lǐng)域】。該方法包括當(dāng)檢測(cè)到外界聲音時(shí)，啟動(dòng)聲音喚醒系統(tǒng)；采集外界聲音，提取該外界聲音的音頻特征；當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含該外界聲音的音頻特征時(shí)，傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào)，該預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征；統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)該外界聲音出現(xiàn)次數(shù)，并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。本發(fā)明使得聲音識(shí)別系統(tǒng)高效、準(zhǔn)確、省電，且靈活運(yùn)用。
【專利說明】一種聲音喚醒方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及聲音識(shí)別【技術(shù)領(lǐng)域】，特別涉及一種聲音喚醒方法及系統(tǒng)。
【背景技術(shù)】
[0002]近些年來，隨著語(yǔ)音識(shí)別技術(shù)的快速發(fā)展，喚醒技術(shù)在諸多語(yǔ)音系統(tǒng)中得到了應(yīng)用，例如:車載導(dǎo)航、手機(jī)語(yǔ)音助手等。傳統(tǒng)的語(yǔ)音喚醒技術(shù)需要耗費(fèi)電量做聲音方面的大量計(jì)算，或是通過按鈕等方法控制，在遠(yuǎn)程控制等復(fù)雜環(huán)境中難以騰出手來操作，具有諸多不便。而此類產(chǎn)品在現(xiàn)實(shí)生活中又具有諸多應(yīng)用，例如樓道中的聲控?zé)?、聲控解鎖等。這類產(chǎn)品其中一些能做到省電，卻容易受到外界環(huán)境干擾，例如樓道中的聲控?zé)魰?huì)因?yàn)闃巧匣驑窍侣曇舻母蓴_而自動(dòng)開啟，在實(shí)際生活中效果不佳。又例如通過對(duì)用戶的一些特殊語(yǔ)句進(jìn)行識(shí)別(例如“開始”等等)來喚醒系統(tǒng)，但是對(duì)于這類語(yǔ)句的識(shí)別復(fù)雜度較高，需要提取高階特征，做復(fù)雜訓(xùn)練，構(gòu)造聲學(xué)模型，計(jì)算量較大，使得耗電量上升，在很多條件下難以推廣使用?？紤]到一個(gè)好的喚醒模塊能夠使整個(gè)語(yǔ)音系統(tǒng)在大部分時(shí)間處于偽待機(jī)狀態(tài)，即除了喚醒模塊其他模塊關(guān)閉，改進(jìn)現(xiàn)有技術(shù)對(duì)整個(gè)語(yǔ)音系統(tǒng)有較大意義。

【發(fā)明內(nèi)容】

[0003]為了解決現(xiàn)有技術(shù)的問題，本發(fā)明實(shí)施例提供了一種聲音喚醒系統(tǒng)及方法。所述技術(shù)方案如下:
[0004]一方面，提供了一種聲音喚醒方法，所述方法包括:
[0005]當(dāng)檢測(cè)到外界聲音時(shí)，啟動(dòng)聲音喚醒系統(tǒng)；
[0006]采集外界聲音，提取所述外界聲音的音頻特征；
[0007]當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí)，傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào)，所述預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征；
[0008]統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)所述外界聲音出現(xiàn)次數(shù)，并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。
[0009]另一方面，提供了一種聲音喚醒系統(tǒng)，所述系統(tǒng)包括:預(yù)處理模塊、音頻輸入模塊、特征提取模塊、音頻分析模塊、解碼模塊；其中，
[0010]所述預(yù)處理模塊用于當(dāng)檢測(cè)到外界聲音時(shí)，啟動(dòng)所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模塊；
[0011]所述音頻輸入模塊用于采集外界聲音；
[0012]所述特征提取模塊用于提取外界聲音的音頻特征；
[0013]所述音頻分析模塊，用于當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí)，傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào)，所述預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征；
[0014]所述解碼模塊用于統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)所述外界聲音出現(xiàn)次數(shù)，并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。
[0015]本發(fā)明實(shí)施例提供的技術(shù)方案帶來的有益效果是:
[0016]通過檢測(cè)外界聲音，當(dāng)外界聲音非靜音時(shí)，啟動(dòng)聲音喚醒系統(tǒng)，當(dāng)判斷外界聲音為預(yù)設(shè)聲音時(shí)，根據(jù)預(yù)設(shè)聲音出現(xiàn)的次數(shù)執(zhí)行相應(yīng)指令，使得該聲音喚醒系統(tǒng)具有較好的魯棒性，根據(jù)預(yù)設(shè)聲音執(zhí)行相應(yīng)指令，準(zhǔn)確率較高，資源消耗相對(duì)較低節(jié)，省電源消耗。
【專利附圖】

【附圖說明】
[0017]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案，下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)這些附圖獲得其他的附圖。
[0018]圖1是本發(fā)明實(shí)施例提供的聲音喚醒方法流程圖；
[0019]圖2是本發(fā)明實(shí)施例提供的聲音喚醒系統(tǒng)結(jié)構(gòu)示意圖；
[0020]圖3是本發(fā)明實(shí)施例提供的聲音喚醒方法流程圖。
【具體實(shí)施方式】
[0021]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
[0022]圖1是本發(fā)明實(shí)施例提供的聲音喚醒方法流程圖。參見圖1，該實(shí)施例包括
[0023]101、當(dāng)檢測(cè)到外界聲音時(shí)，啟動(dòng)聲音喚醒系統(tǒng)；
[0024]在本發(fā)明實(shí)施例中，可以采用聲音強(qiáng)度檢測(cè)器檢測(cè)外界聲音，當(dāng)檢測(cè)到外界聲音時(shí)，啟動(dòng)聲音喚醒系統(tǒng)，當(dāng)未檢測(cè)到外界聲音時(shí)，不啟動(dòng)聲音喚醒系統(tǒng)。也即是在附近無人時(shí)，不啟動(dòng)聲音喚醒系統(tǒng)，待有人時(shí)，才啟動(dòng)聲音喚醒系統(tǒng)，可以大大減少電量的消耗。
[0025]102、采集外界聲音，并對(duì)所采集的外界聲音進(jìn)行端點(diǎn)檢測(cè)，確定所采集的外界聲首是否靜首;
[0026]在本發(fā)明實(shí)施例中，采集外界聲音，并用所采集的外界聲音最為簡(jiǎn)單的特征如音量、頻率、音高等進(jìn)行端點(diǎn)檢測(cè)，排除靜音等情況。
[0027]103、當(dāng)所采集的外界聲音非靜音時(shí)，對(duì)該外界聲音進(jìn)行短時(shí)快速傅里葉變化，提取該外界聲音的音頻特征；
[0028]104、當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含該外界聲音的音頻特征時(shí)，傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào)，該預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征；
[0029]其中，該人體聲音可以為掌聲、口哨聲、咳嗽聲等具有人類自身特征的聲音。使得在復(fù)雜的噪聲環(huán)境下，聲音喚醒系統(tǒng)具有較好的魯棒性，對(duì)于不同用戶普適性較好，不受口音影響，簡(jiǎn)單好用，且準(zhǔn)確率高，資源消耗相對(duì)較低。
[0030]在本發(fā)明實(shí)施例中，判斷該預(yù)設(shè)規(guī)則庫(kù)中是否包含所述外界聲音的音頻特征，如果該預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí)，傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào)，如果該預(yù)設(shè)規(guī)則庫(kù)中未包含所述外界聲音的音頻特征時(shí)，不傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào)。
[0031]需要說明的是，本發(fā)明實(shí)施例采用預(yù)設(shè)聲音進(jìn)行喚醒，在本發(fā)明的另一實(shí)施例中，也可以使用其他音頻特征做打擊聲音喚醒，使用時(shí)域特征做口哨聲的音頻檢測(cè)等喚醒方式，本發(fā)明實(shí)施例不作具體限定。
[0032]105、統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)預(yù)設(shè)聲音出現(xiàn)的次數(shù)，并根據(jù)所統(tǒng)計(jì)的預(yù)設(shè)聲音出現(xiàn)的次數(shù)，執(zhí)行相應(yīng)的指令。[0033]在本發(fā)明實(shí)施例中，統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)預(yù)設(shè)聲音出現(xiàn)的次數(shù)，按照預(yù)設(shè)聲音出現(xiàn)的次數(shù)執(zhí)行預(yù)設(shè)定義的指令，例如，出現(xiàn)一次預(yù)設(shè)聲音，開啟聲音識(shí)別模塊，出現(xiàn)兩次預(yù)設(shè)聲首，關(guān)閉聲首控制等。
[0034]需要說明的是，該聲音喚醒方法可以在軟件系統(tǒng)中實(shí)現(xiàn)，也可以集成到硬件中實(shí)現(xiàn)，本發(fā)明實(shí)施例不作具體限定。
[0035]本發(fā)明實(shí)施例提供的方法，通過檢測(cè)外界聲音，當(dāng)外界聲音非靜音時(shí)，啟動(dòng)聲音喚醒系統(tǒng)，當(dāng)判斷外界聲音為預(yù)設(shè)聲音時(shí)，根據(jù)預(yù)設(shè)聲音出現(xiàn)的次數(shù)執(zhí)行相應(yīng)指令，使得該聲音喚醒系統(tǒng)具有較好的魯棒性，根據(jù)預(yù)設(shè)聲音執(zhí)行相應(yīng)指令，準(zhǔn)確率較高，資源消耗相對(duì)較低節(jié)省電源消耗。
[0036]圖2是本發(fā)明實(shí)施例提供的聲音喚醒系統(tǒng)結(jié)構(gòu)圖。參見圖2，該系統(tǒng)包括預(yù)處理模塊201、音頻輸入模塊202、特征提取模塊203、音頻分析模塊204、解碼模塊205 ;其中，
[0037]所述預(yù)處理模塊201用于當(dāng)檢測(cè)到外界聲音時(shí)，啟動(dòng)所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模塊；所述預(yù)處理模塊201與所述音頻輸入模塊連接，所述音頻輸入模塊202用于采集外界聲音；所述音頻輸入模塊202與所述特征提取模塊203連接，所述特征提取模塊203用于提取所述外界聲音的音頻特征；所述特征提取模塊203與所述音頻分析模塊204連接，所述音頻分析模塊204，用于當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí)，傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào)，所述預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征；所述音頻分析模塊204與所述解碼模塊205連接，所述解碼模塊205用于統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)所述外界聲音出現(xiàn)次數(shù)，并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。
[0038]可選地，所述音頻特征提取模塊203還用于采集外界聲音，并對(duì)所采集的外界聲音進(jìn)行端點(diǎn)檢測(cè)，確定所采集的外界聲音是否靜音；
[0039]當(dāng)所采集的外界聲音非靜音時(shí)，對(duì)所述外界聲音進(jìn)行短時(shí)快速傅里葉變化，提取所述外界聲音的音頻特征。
[0040]可選地，所述預(yù)處理模塊201還用于當(dāng)未檢測(cè)到外界聲音時(shí)，不啟動(dòng)所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模塊。
[0041]可選地，所述系統(tǒng)還包括人體動(dòng)作聲音庫(kù)，所述人體動(dòng)作聲音庫(kù)用于對(duì)應(yīng)存儲(chǔ)預(yù)設(shè)聲音的次數(shù)與指令。
[0042]可選地，所述系統(tǒng)應(yīng)用于智能移動(dòng)手機(jī)設(shè)備、智能手機(jī)應(yīng)用、車載設(shè)備、車載應(yīng)用、家居設(shè)備和可穿戴設(shè)備。
[0043]本發(fā)明實(shí)施例提供的裝置，通過檢測(cè)外界聲音，當(dāng)外界聲音非靜音時(shí)，啟動(dòng)聲音喚醒系統(tǒng)，當(dāng)判斷外界聲音為預(yù)設(shè)聲音時(shí)，根據(jù)預(yù)設(shè)聲音出現(xiàn)的次數(shù)執(zhí)行相應(yīng)指令，使得該聲音喚醒系統(tǒng)具有較好的魯棒性，根據(jù)預(yù)設(shè)聲音執(zhí)行相應(yīng)指令，準(zhǔn)確率較高，資源消耗相對(duì)較低節(jié)省電源消耗。
[0044]圖3是本發(fā)明實(shí)施例提供的聲音喚醒方法流程圖，在圖3中預(yù)處理模塊檢測(cè)到外界聲音時(shí)，發(fā)送啟動(dòng)信號(hào)，啟動(dòng)聲音喚醒系統(tǒng)，音頻輸入模塊采集外界聲音，當(dāng)外界聲音是靜音時(shí)，不繼續(xù)啟動(dòng)后續(xù)模塊，如果外界聲音是非靜音的，則提取外界聲音特征，分析該外界聲音是否為預(yù)設(shè)聲音。如果該外界聲音不是預(yù)設(shè)聲音，則該預(yù)處理模塊繼續(xù)檢測(cè)外界聲音，如該外界聲音是預(yù)設(shè)聲音，則發(fā)送預(yù)設(shè)聲音出現(xiàn)的信號(hào)。該解碼模塊統(tǒng)計(jì)預(yù)設(shè)聲音在預(yù)設(shè)時(shí)間內(nèi)出現(xiàn)的次數(shù)，查詢預(yù)設(shè)聲音出現(xiàn)次數(shù)對(duì)應(yīng)的指令，與聲音交互系統(tǒng)進(jìn)行交互，當(dāng)未查詢到預(yù)設(shè)聲音出現(xiàn)次數(shù)對(duì)應(yīng)的指令時(shí)，確定為無效指令，該預(yù)處理模塊繼續(xù)檢測(cè)外界聲
曰?
[0045]在智能家居，智能手機(jī)，車載，穿戴設(shè)備中，集成本發(fā)明所述的軟件系統(tǒng)模塊，檢測(cè)人體動(dòng)作聲音后，直接進(jìn)行命令動(dòng)作或者進(jìn)行后續(xù)的聲音交互。
[0046]在智能家居，智能手機(jī)，車載，穿戴設(shè)備中，通過硬件模塊集成本發(fā)明所述模塊，檢測(cè)人體動(dòng)作聲音后，直接進(jìn)行命令動(dòng)作或者進(jìn)行后續(xù)的聲音交互。
[0047]例如:
[0048]用戶:(拍手一下)[0049]智能設(shè)備:您好
[0050]用戶:把電視打開。
[0051]又例如:
[0052]用戶:(拍手兩下)
[0053]智能設(shè)備:(自動(dòng)開機(jī))。
[0054]需要說明的是:上述實(shí)施例提供的聲音喚醒系統(tǒng)在聲音喚醒時(shí)，僅以上述各功能模塊的劃分進(jìn)行舉例說明，實(shí)際應(yīng)用中，可以根據(jù)需要而將上述功能分配由不同的功能模塊完成，即將系統(tǒng)的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊，以完成以上描述的全部或者部分功能。另外，上述實(shí)施例提供的聲音喚醒系統(tǒng)與聲音喚醒方法實(shí)施例屬于同一構(gòu)思，其具體實(shí)現(xiàn)過程詳見方法實(shí)施例，這里不再贅述。
[0055]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過硬件來完成，也可以通過程序來指令相關(guān)的硬件完成，所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中，上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器，磁盤或光盤等。
[0056]以上所述僅為本發(fā)明的較佳實(shí)施例，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種聲音喚醒方法，其特征在于，所述方法包括: 當(dāng)檢測(cè)到外界聲音時(shí)，啟動(dòng)聲音喚醒系統(tǒng)；采集外界聲音，提取所述外界聲音的音頻特征；當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí)，傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào)，所述預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征；統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)所述外界聲音出現(xiàn)次數(shù)，并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，采集外界聲音，提取所述外界聲音的音頻特征包括: 采集外界聲音，并對(duì)所采集的外界聲音進(jìn)行端點(diǎn)檢測(cè)，確定所采集的外界聲音是否靜曰；當(dāng)所采集的外界聲音非靜音時(shí)，對(duì)所述外界聲音進(jìn)行短時(shí)快速傅里葉變化，提取所述外界聲音的音頻特征。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法還包括: 當(dāng)未檢測(cè)到外界聲音時(shí)，不啟動(dòng)聲音喚醒系統(tǒng)。
4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法應(yīng)用于智能移動(dòng)手機(jī)設(shè)備、智能手機(jī)應(yīng)用、車載設(shè)備、車載應(yīng)用、家居設(shè)備和可穿戴設(shè)備。
5.一種聲音喚醒系統(tǒng)，其特征在于，所述系統(tǒng)包括預(yù)處理模塊、音頻輸入模塊、特征提取模塊、音頻分析模塊、解碼模塊；其中，所述預(yù)處理模塊用于當(dāng)檢測(cè)到外界聲音時(shí)，啟動(dòng)所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模塊；所述音頻輸入模塊用于采集外界聲音；所述特征提取模塊用于提取外界聲音的音頻特征；所述音頻分析模塊，用于當(dāng)預(yù)設(shè)規(guī)則庫(kù)中包含所述外界聲音的音頻特征時(shí)，傳遞預(yù)設(shè)聲音出現(xiàn)信號(hào)，所述預(yù)設(shè)規(guī)則庫(kù)包含多個(gè)人體聲音特征；所述解碼模塊用于統(tǒng)計(jì)預(yù)設(shè)時(shí)間內(nèi)所述外界聲音出現(xiàn)次數(shù)，并根據(jù)所統(tǒng)計(jì)的次數(shù)執(zhí)行相應(yīng)的指令。
6.根據(jù)權(quán)利要求5所述的系統(tǒng)，其特征在于，所述音頻特征提取模塊還用于采集外界聲音，并對(duì)所采集的外界聲音進(jìn)行端點(diǎn)檢測(cè)，確定所采集的外界聲音是否靜音；當(dāng)所采集的外界聲音非靜音時(shí)，對(duì)所述外界聲音進(jìn)行短時(shí)快速傅里葉變化，提取所述外界聲音的音頻特征。
7.根據(jù)權(quán)利要求5所述的系統(tǒng)，其特征在于，所述預(yù)處理模塊還用于當(dāng)未檢測(cè)到外界聲音時(shí)，不啟動(dòng)所述音頻輸入模塊、所述特征提取模塊、所述音頻分析模塊及所述解碼模。
8.根據(jù)權(quán)利要求5所述的系統(tǒng)，其特征在于，所述系統(tǒng)應(yīng)用于智能移動(dòng)手機(jī)設(shè)備、智能手機(jī)應(yīng)用、車載設(shè)備、車載應(yīng)用、家居設(shè)備和可穿戴設(shè)備。
【文檔編號(hào)】G10L15/06GK103956164SQ201410211795
【公開日】2014年7月30日申請(qǐng)日期:2014年5月20日優(yōu)先權(quán)日:2014年5月20日
【發(fā)明者】王艷龍, 陳楠昕, 俞凱, 周偉達(dá) 申請(qǐng)人:蘇州思必馳信息科技有限公司, 上海交通大學(xué)

完整全部詳細(xì)技術(shù)資料下載