語音檢測方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語音檢測技術(shù),尤其涉及一種語音檢測方法及裝置。
【背景技術(shù)】
[0002]隨著智能家居技術(shù)的不斷發(fā)展,語音控制越來越多地應(yīng)用于人們的居家生活中,例如,通過語音控制家用電器。精確的語音檢測是實(shí)現(xiàn)有效的語音控制的重要前提。
[0003]目前,普遍通過數(shù)字信號處理(DigitalSignal Processing,簡稱DSP)芯片等硬件檢測方式實(shí)現(xiàn)語音檢測,這種硬件檢測方式的實(shí)現(xiàn)成本較大,而且整個(gè)控制系統(tǒng)的系統(tǒng)功耗也比較大。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實(shí)施例提供一種語音檢測方法及裝置,通過軟件的形式替代了傳統(tǒng)硬件DSP芯片實(shí)現(xiàn)語音檢測,在沒有降低檢測性能的同時(shí)可以有效降低硬件成本,系統(tǒng)功耗也會有一定程度的下降。
[0005]本發(fā)明實(shí)施例提供的語音檢測方法,包括:
[0006]根據(jù)第一預(yù)設(shè)條件判定語音采集系統(tǒng)由非觸發(fā)模式進(jìn)入觸發(fā)模式,從零開始記錄觸發(fā)模式運(yùn)行參考時(shí)間!^,并將非觸發(fā)模式運(yùn)行參考時(shí)間T2置零,其中第一預(yù)設(shè)條件是根據(jù)TdP非觸發(fā)模式下的第二PCM數(shù)據(jù)設(shè)定的;
[0007]在觸發(fā)模式下進(jìn)行語音采集,獲取第一脈沖編碼調(diào)制PCM數(shù)據(jù);
[0008]根據(jù)第二預(yù)設(shè)條件提取1^內(nèi)的第一PCM數(shù)據(jù),其中第二預(yù)設(shè)條件是根據(jù)T1、預(yù)設(shè)時(shí)間內(nèi)的第一PCM數(shù)據(jù)和所述第二PCM數(shù)據(jù)設(shè)定的;
[0009]將!\內(nèi)的第一PCM數(shù)據(jù)與語音模型匹配,獲取語音數(shù)據(jù)。
[0010]在本發(fā)明的一實(shí)施例中,上述根據(jù)第一預(yù)設(shè)條件判定語音采集系統(tǒng)由非觸發(fā)模式進(jìn)入觸發(fā)模式之前,還包括:從零開始記錄T2,在非觸發(fā)模式下進(jìn)行語音采集,獲取第二 PCM數(shù)據(jù)。
[0011 ]在本發(fā)明的一實(shí)施例中,上述獲取第一脈沖編碼調(diào)制PCM數(shù)據(jù)之后,還包括:對第一PCM數(shù)據(jù)進(jìn)行傅里葉變換,得到所述第一 PCM數(shù)據(jù)的分貝值;上述獲取第二 PCM數(shù)據(jù)之后,還包括:對第二 PCM數(shù)據(jù)進(jìn)行傅里葉變換,得到所述第二 PCM數(shù)據(jù)的分貝值。
[0012]在本發(fā)明的一實(shí)施例中,上述根據(jù)第一預(yù)設(shè)條件判定語音采集系統(tǒng)由非觸發(fā)模式進(jìn)入觸發(fā)模式,具體包括:當(dāng)T2 2第一閾值,且最新獲取的第二PCM數(shù)據(jù)的分貝值與!^內(nèi)的第二PCM數(shù)據(jù)的平均分貝值之間的差值大于或等于第一預(yù)設(shè)值時(shí),判定語音采集系統(tǒng)由非觸發(fā)模式進(jìn)入觸發(fā)模式。
[0013]在本發(fā)明的一實(shí)施例中,上述第一閾值為最小語音突變檢測時(shí)間。
[0014]在本發(fā)明的一實(shí)施例中,上述根據(jù)第二預(yù)設(shè)條件提取1^內(nèi)的第一PCM數(shù)據(jù),具體包括:當(dāng)?shù)诙撝?lt; Tif第三閾值,且預(yù)設(shè)時(shí)間內(nèi)的第一PCM數(shù)據(jù)的平均分貝值與第二PCM數(shù)據(jù)的平均分貝值之間的差值小于第二預(yù)設(shè)值時(shí),提取T1R的第一 PCM數(shù)據(jù)。
[0015]在本發(fā)明的一實(shí)施例中,上述語音檢測方法還包括-當(dāng)!^2第三閾值時(shí),或者根據(jù)第二預(yù)設(shè)條件提取1^內(nèi)的第一PCM數(shù)據(jù)之后,判定語音采集系統(tǒng)由觸發(fā)模式進(jìn)入非觸發(fā)模式,從零開始記錄T2,并將T1置零。
[0016]在本發(fā)明的一實(shí)施例中,上述第二閾值為有效語音輸入起始分析時(shí)間,上述第三閾值為有效語音輸入分析超時(shí)時(shí)間。
[0017]本發(fā)明實(shí)施例提供的語音檢測裝置,包括:
[0018]模式判定模塊,用于根據(jù)第一預(yù)設(shè)條件判定語音采集系統(tǒng)由非觸發(fā)模式進(jìn)入觸發(fā)模式,從零開始記錄所述觸發(fā)模式運(yùn)行參考時(shí)間!\,并將所述非觸發(fā)模式運(yùn)行參考時(shí)間!^置零,其中第一預(yù)設(shè)條件是根據(jù)TdP非觸發(fā)模式下的第二 PCM數(shù)據(jù)設(shè)定的;
[0019]語音采集模塊,用于在觸發(fā)模式下進(jìn)行語音采集,獲取第一脈沖編碼調(diào)制PCM數(shù)據(jù);
[0020]數(shù)據(jù)提取模塊,用于根據(jù)第二預(yù)設(shè)條件提取1^內(nèi)的第一PCM數(shù)據(jù),其中第二預(yù)設(shè)條件是根據(jù)!^、預(yù)設(shè)時(shí)間內(nèi)的第一 PCM數(shù)據(jù)和所述第二 PCM數(shù)據(jù)設(shè)定的;
[0021]數(shù)據(jù)匹配模塊,用于將1\內(nèi)的第一PCM數(shù)據(jù)與語音模型匹配,獲取語音數(shù)據(jù)。
[0022]本發(fā)明實(shí)施例提供的語音檢測方法及裝置,根據(jù)預(yù)設(shè)的判斷條件進(jìn)行語音采集和語音提取,即可以通過軟件算法判定是否有語音數(shù)據(jù)輸入觸發(fā),當(dāng)檢測到語音數(shù)據(jù)輸入出觸發(fā)后,再通過軟件算法判定語音輸入的結(jié)束。該方法以軟件的形式替代了傳統(tǒng)硬件DSP芯片實(shí)現(xiàn)語音檢測,在沒有降低檢測性能的同時(shí)可以有效降低硬件成本,系統(tǒng)功耗也會有一定程度的下降。
【附圖說明】
[0023]為了更清楚地說明本發(fā)明或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0024]圖1為本發(fā)明實(shí)施例提供的一種語音檢測方法的流程圖;
[0025]圖2為本發(fā)明實(shí)施例提供的一種示例性的語音檢測方法的流程圖;
[0026]圖3為本發(fā)明實(shí)施例提供的一種語音檢測裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0027]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有付出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0028]本發(fā)明的下述實(shí)施例中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在沒有特別說明的情況下可以互換,以便這里描述的實(shí)施例能夠以除了在這里圖示或描述的內(nèi)容以外的順序?qū)嵤?br>[0029]本發(fā)明實(shí)施例提供的語音檢測方法具體可以通過語音檢測裝置來實(shí)現(xiàn),該裝置可以集成在控制終端中,該裝置可以通過軟件方式來實(shí)現(xiàn),控制終端具體可以是智能手機(jī)、個(gè)人數(shù)字助理、個(gè)人電腦、家庭網(wǎng)關(guān)、無線調(diào)制解調(diào)器、機(jī)頂盒、數(shù)據(jù)卡或無線路由器。
[0030]圖1為本發(fā)明實(shí)施例提供的一種語音檢測方法的流程圖,如圖1所示,本實(shí)施例提供的語音檢測方法包括以下步驟:
[0031]Sll,根據(jù)第一預(yù)設(shè)條件判定語音采集系統(tǒng)由非觸發(fā)模式進(jìn)入觸發(fā)模式,從零開始記錄觸發(fā)模式運(yùn)行參考時(shí)間T1,并將非觸發(fā)模式運(yùn)行參考時(shí)間T2置零;
[0032]S12,在觸發(fā)模式下進(jìn)行語音采集,獲取第一脈沖編碼調(diào)制PCM數(shù)據(jù);
[0033]S13,根據(jù)第二預(yù)設(shè)條件提取1\內(nèi)的第一 PCM數(shù)據(jù);
[0034]S14,將1\內(nèi)的第一 PCM數(shù)據(jù)與語音模型匹配,獲取語音數(shù)據(jù)。
[0035]具體的,在本實(shí)施例中,第一預(yù)設(shè)條件是根據(jù)TdP非觸發(fā)模式下的第二PCM數(shù)據(jù)設(shè)定的,第二預(yù)設(shè)條件是根據(jù)!^、預(yù)設(shè)時(shí)間內(nèi)的第一PCM數(shù)據(jù)和所述第二PCM數(shù)據(jù)設(shè)定的。
[0036]進(jìn)一步的,在步驟SII之前,還可以從零開始記錄T2,并在非觸發(fā)模式下進(jìn)行語音采集,獲取第二 PCM數(shù)據(jù)。
[0037]作為本實(shí)施例一種可選的實(shí)施方式,可以為非觸發(fā)模式的運(yùn)行參考時(shí)間!^設(shè)置時(shí)間門限為第一閾值,在根據(jù)第一預(yù)設(shè)條件判定語音采集系統(tǒng)由非觸發(fā)模式進(jìn)入觸發(fā)模式的具體檢測判定過程中,可以先根據(jù)記錄的T2的值,判斷是否達(dá)到第一閾值,若沒有達(dá)到(T2<第一閾值),則判定當(dāng)前仍為非觸發(fā)模式,繼續(xù)進(jìn)行語音采集,獲取第二 PCM數(shù)據(jù);若達(dá)到(T2>第一閾值),則可以進(jìn)一步判定是否有有效的語音輸入。
[0038]優(yōu)選的,可以根據(jù)最新獲取的第二PCM數(shù)據(jù)的分貝值與T2內(nèi)的第二PCM數(shù)據(jù)的平均分貝值之間的差值來判定是否有有效的語音輸入。具體的,當(dāng)最新獲取的第二 PCM數(shù)據(jù)的分貝值與T2ft的第二PCM數(shù)據(jù)的平均分貝值之間的差值大于或等于第一預(yù)設(shè)值時(shí),則認(rèn)為有有效的語音輸入。
[0039]也就是說,當(dāng)滿足第一預(yù)設(shè)條件為:T22第一閾值,且最新獲取的第二PCM數(shù)據(jù)的分貝值與T2ft的第二PCM數(shù)據(jù)的平均分貝值之間的差值大于或等于第一預(yù)設(shè)值時(shí),判定語音采集系統(tǒng)由非觸發(fā)模式進(jìn)入觸發(fā)模式,同時(shí)從零開始記錄!^,并將T2置零。
[0040]相反的,當(dāng)T2<第一閾值,或者T2>第一閾值,但最新獲取的第二PCM數(shù)據(jù)的分貝值與T2R的第二PCM數(shù)據(jù)的平均分貝值之間的差值小于第一預(yù)設(shè)值時(shí),則判定語音采集系統(tǒng)仍然運(yùn)行在非觸發(fā)模式下。
[0041]作為本實(shí)施例一種可選的實(shí)施方式,可以為觸發(fā)模式的運(yùn)行參考時(shí)間置時(shí)間門限第二閾值和第三閾值,即第二閾值第三閾值。在根據(jù)第二預(yù)設(shè)條件提取T1內(nèi)的第一PCM數(shù)據(jù)的具體檢測判定過程中,可以先根據(jù)記錄的T1的值,判斷是否滿足設(shè)定的時(shí)間門限,若不滿足(!^〈第二閾值),則判定當(dāng)前仍為觸發(fā)模式,繼續(xù)進(jìn)行語音采集,獲取第一PCM數(shù)據(jù);若滿足(第二閾值第三閾值),則可以進(jìn)一步判定有效的語音輸入是否結(jié)束。
[0042]優(yōu)選的,可以根據(jù)預(yù)設(shè)時(shí)間內(nèi)的第一PCM數(shù)據(jù)的平均分貝值與所述第二PCM數(shù)據(jù)的平均分貝值之間的差值來判定有效的語音輸入是否結(jié)束。具體的,當(dāng)預(yù)設(shè)時(shí)間內(nèi)的第一 PCM數(shù)據(jù)的平均分貝值與非觸發(fā)模式下的第二 PCM數(shù)據(jù)的平均分貝值之間的差值小于第二預(yù)設(shè)值時(shí),判定有效的語音輸入結(jié)束,并提取!^內(nèi)的第一 PCM數(shù)據(jù)。
[0043]也就是說,當(dāng)滿足第二預(yù)設(shè)條件為:第二閾值第三閾值,且所述預(yù)設(shè)時(shí)間內(nèi)的第一 PCM數(shù)據(jù)的平均分貝值與所述第二 PCM數(shù)據(jù)的平均分貝值之間的差值小于第二預(yù)設(shè)值時(shí),提取T1內(nèi)的第一 PCM數(shù)據(jù)。
[0044]進(jìn)一步的,在根據(jù)第二預(yù)設(shè)條件提取1^內(nèi)的第一PCM數(shù)據(jù)之后,判定語音采集系統(tǒng)由觸發(fā)模式進(jìn)入非觸發(fā)模式,同時(shí)從零開始記錄!^,并將T1置零。
[0045]相反的,當(dāng)T12第三閾值時(shí),則也會判定語音采集系統(tǒng)由觸發(fā)模式進(jìn)入非觸發(fā)模式,同時(shí)從零開始記錄!^,并將T1置零。
[0046]可以理解的是,為了獲取各PCM數(shù)據(jù)的分貝值,還可以分別在獲取第一PCM數(shù)據(jù)和第二PCM數(shù)據(jù)之后,對第一PCM數(shù)據(jù)和第二PCM數(shù)據(jù)進(jìn)行傅里葉變換,以便獲取相應(yīng)的PCM數(shù)據(jù)的分貝值。
[0047]值得一提的是,作為本實(shí)施例一種優(yōu)選的實(shí)施方式,可以選擇最小語音突變檢測時(shí)間作為第一閾值,選擇