本公開(kāi)涉及音頻數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種夢(mèng)話(huà)提取方法、裝置及用于提取夢(mèng)話(huà)的裝置。
背景技術(shù):
隨著智能設(shè)備的普及,智能設(shè)備上安裝的應(yīng)用(APP)越來(lái)越多,以提供越來(lái)越豐富的功能,更好滿(mǎn)足用戶(hù)需求。
相關(guān)技術(shù)中雖然已有很多種APP,但是,目前還缺乏對(duì)夢(mèng)話(huà)提取的相關(guān)方案。
技術(shù)實(shí)現(xiàn)要素:
為克服相關(guān)技術(shù)中存在的問(wèn)題,本公開(kāi)提供一種夢(mèng)話(huà)提取方法、裝置及用于提取夢(mèng)話(huà)的裝置。
根據(jù)本公開(kāi)實(shí)施例的第一方面,提供一種夢(mèng)話(huà)提取方法,包括:響應(yīng)夢(mèng)話(huà)提取功能的啟動(dòng)指令;采集周?chē)囊纛l信號(hào);確定待記錄的音頻信號(hào)的門(mén)限值;當(dāng)所述采集的音頻信號(hào)的幅度值大于所述門(mén)限值時(shí),開(kāi)始記錄所述采集的音頻信號(hào),直至所述采集的音頻信號(hào)的幅度值小于所述門(mén)限值時(shí),停止記錄。
可選的,所述確定待記錄的音頻信號(hào)的門(mén)限值,包括:在采集的音頻信號(hào)中,獲取一段音頻信號(hào),其中所述一段音頻信號(hào)的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值;根據(jù)所述獲取的一段音頻信號(hào)的幅度值,確定待記錄的音頻信號(hào)的門(mén)限值。
可選的,所述根據(jù)獲取的一段音頻信號(hào)的幅度值,確定待記錄的音頻信號(hào)的門(mén)限值,包括:將獲取的一段音頻信號(hào)的幅度值的均值作為基準(zhǔn)值;將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號(hào)的門(mén)限值。
可選的,還包括:將記錄的音頻信號(hào)保存為音頻文件,且不同的音頻文件保存在不同的存儲(chǔ)區(qū)域中。
可選的,還包括:對(duì)不同存儲(chǔ)區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
可選的,所述將記錄的音頻信號(hào)保存為音頻文件,包括:對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,將滿(mǎn)足所述語(yǔ)音識(shí)別的預(yù)設(shè)條件的記錄的音頻信號(hào)保存為音頻文件;其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):語(yǔ)音識(shí)別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;語(yǔ)音識(shí)別結(jié)果中包含分詞。
可選的,所述將記錄的音頻信號(hào)保存為音頻文件,包括:對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,根據(jù)語(yǔ)音識(shí)別結(jié)果對(duì)所述記錄的音頻信號(hào)進(jìn)行打分,根據(jù)記錄的音頻信號(hào)的分值從高到低的順序依次保存對(duì)應(yīng)的音頻文件。
根據(jù)本公開(kāi)實(shí)施例的第二方面,提供一種夢(mèng)話(huà)提取裝置,包括:響應(yīng)模塊,用于響應(yīng)夢(mèng)話(huà)提取功能的啟動(dòng)指令;采集模塊,用于采集周?chē)囊纛l信號(hào);確定模塊,用于確定待記錄的音頻信號(hào)的門(mén)限值;記錄模塊,用于當(dāng)所述采集的音頻信號(hào)的幅度值大于所述門(mén)限值時(shí),開(kāi)始記錄所述采集的音頻信號(hào),直至所述采集的音頻信號(hào)的幅度值小于所述門(mén)限值時(shí),停止記錄。
可選的,所述確定模塊包括:確定子模塊,用于在采集的音頻信號(hào)中,獲取一段音頻信號(hào),其中所述一段音頻信號(hào)的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值;計(jì)算子模塊,用于根據(jù)所述獲取的一段音頻信號(hào)的幅度值,確定待記錄的音頻信號(hào)的門(mén)限值。
可選的,所述計(jì)算子模塊進(jìn)一步用于:將獲取的一段音頻信號(hào)的幅度值的均值作為基準(zhǔn)值;將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號(hào)的門(mén)限值。
可選的,還包括:保存模塊,用于將記錄的音頻信號(hào)保存為音頻文件,且不同的音頻文件保存在不同的存儲(chǔ)區(qū)域中。
可選的,還包括:刪除模塊,用于對(duì)不同存儲(chǔ)區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
可選的,還包括:所述保存模塊進(jìn)一步用于:對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,將滿(mǎn)足所述語(yǔ)音識(shí)別的預(yù)設(shè)條件的記錄的音頻信號(hào)保存為音頻文件;其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):語(yǔ)音識(shí)別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;語(yǔ)音識(shí)別結(jié)果中包含分詞。
可選的,所述保存模塊進(jìn)一步用于:對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,根據(jù)語(yǔ)音識(shí)別結(jié)果對(duì)所述記錄的音頻信號(hào)進(jìn)行打分,根據(jù)記錄的音頻信號(hào)的分值從高到低的順序依次保存對(duì)應(yīng)的音頻文件。
根據(jù)本公開(kāi)實(shí)施例的第三方面,提供一種用于提取夢(mèng)話(huà)的裝置,包括:處理器;用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;其中,所述處理器被配置為:響應(yīng)夢(mèng)話(huà)提取功能的啟動(dòng)指令;采集周?chē)囊纛l信號(hào);確定待記錄的音頻信號(hào)的門(mén)限值;當(dāng)所述采集的音頻信號(hào)的幅度值大于所述門(mén)限值時(shí),開(kāi)始記錄所述采集的音頻信號(hào),直至所述采集音頻信號(hào)的幅度值小于所述門(mén)限值時(shí),停止記錄。
可選的,所述確定待記錄的音頻信號(hào)的門(mén)限值,包括:在采集的音頻信號(hào)中,獲取一段音頻信號(hào),其中所述一段音頻信號(hào)的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值;根據(jù)所述獲取的一段音頻信號(hào)的幅度值,確定待記錄的音頻信號(hào)的門(mén)限值。
可選的,所述根據(jù)獲取的一段音頻信號(hào)的幅度值,確定待記錄的音頻信號(hào)的門(mén)限值,包括:將獲取的一段音頻信號(hào)的幅度值的均值作為基準(zhǔn)值;將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號(hào)的門(mén)限值。
可選的,還包括:將記錄的音頻信號(hào)保存為音頻文件,且不同的音頻文件保存在不同的存儲(chǔ)區(qū)域中。
可選的,還包括:對(duì)不同存儲(chǔ)區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
可選的,所述將記錄的音頻信號(hào)保存為音頻文件,包括:對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,將滿(mǎn)足所述語(yǔ)音識(shí)別的預(yù)設(shè)條件的記錄的音頻信號(hào)保存為音頻文件;其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):語(yǔ)音識(shí)別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;語(yǔ)音識(shí)別結(jié)果中包含分詞。
可選的,所述將記錄的音頻信號(hào)保存為音頻文件,包括:對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,根據(jù)語(yǔ)音識(shí)別結(jié)果對(duì)所述記錄的音頻信號(hào)進(jìn)行打分,根據(jù)記錄的音頻信號(hào)的分值從高到低的順序依次保存對(duì)應(yīng)的音頻文件。
根據(jù)本公開(kāi)實(shí)施例的第四方面,提供一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由移動(dòng)終端的處理器執(zhí)行時(shí),使得移動(dòng)終端能夠執(zhí)行一種夢(mèng)話(huà)提取方法,所述方法包括:響應(yīng)夢(mèng)話(huà)提取功能的啟動(dòng)指令;采集周?chē)囊纛l信號(hào);確定待記錄的音頻信號(hào)的門(mén)限值;當(dāng)所述采集的音頻信號(hào)的幅度值大于所述門(mén)限值時(shí),開(kāi)始記錄所述音頻信號(hào),直至所述采集的音頻信號(hào)的幅度值小于所述門(mén)限值時(shí),停止記錄。
可選的,所述確定待記錄的音頻信號(hào)的門(mén)限值,包括:在采集的音頻信號(hào)中,獲取一段音頻信號(hào),其中所述一段音頻信號(hào)的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值;根據(jù)所述獲取的一段音頻信號(hào)的幅度值,確定待記錄的音頻信號(hào)的門(mén)限值。
可選的,所述根據(jù)獲取的一段音頻信號(hào)的幅度值,確定待記錄的音頻信號(hào)的門(mén)限值,包括:將獲取的一段音頻信號(hào)的幅度值的均值作為基準(zhǔn)值;將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號(hào)的門(mén)限值。
可選的,還包括:將記錄的音頻信號(hào)保存為音頻文件,且不同的音頻文件保存在不同的存儲(chǔ)區(qū)域中。
可選的,還包括:對(duì)不同存儲(chǔ)區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
可選的,所述將記錄的音頻信號(hào)保存為音頻文件,包括:對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,將滿(mǎn)足所述語(yǔ)音識(shí)別的預(yù)設(shè)條件的記錄的音頻信號(hào)保存為音頻文件;其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):語(yǔ)音識(shí)別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;語(yǔ)音識(shí)別結(jié)果中包含分詞。
可選的,所述將記錄的音頻信號(hào)保存為音頻文件,包括:對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,根據(jù)語(yǔ)音識(shí)別結(jié)果對(duì)所述記錄的音頻信號(hào)進(jìn)行打分,根據(jù)記錄的音頻信號(hào)的分值從高到低的順序依次保存對(duì)應(yīng)的音頻文件。
本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
通過(guò)采集音頻信號(hào),并保存幅度值大于門(mén)限值的音頻信號(hào),可以提取出夢(mèng)話(huà),豐富降噪技術(shù)的應(yīng)用。
進(jìn)一步的,通過(guò)根據(jù)采集的音頻信號(hào)確定門(mén)限值,可以確定出更準(zhǔn)確的門(mén)限值,更利于夢(mèng)話(huà)提取。
進(jìn)一步的,通過(guò)刪除相似度較大的音頻文件可以刪除無(wú)用的鼾聲。
進(jìn)一步的,通過(guò)對(duì)記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,可以根據(jù)識(shí)別結(jié)果確定音頻信號(hào)是夢(mèng)話(huà)或者無(wú)用的鼾聲等,從而可以根據(jù)語(yǔ)音識(shí)別結(jié)果保存更準(zhǔn)確的音頻信號(hào)。
進(jìn)一步的,通過(guò)對(duì)記錄的音頻信號(hào)進(jìn)行打分,并根據(jù)打分結(jié)果進(jìn)行排序保存,可以?xún)?yōu)先保存為夢(mèng)話(huà)的音頻信號(hào)。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開(kāi)。
附圖說(shuō)明
此處的附圖被并入說(shuō)明書(shū)中并構(gòu)成本說(shuō)明書(shū)的一部分,示出了符合本公開(kāi)的實(shí)施例,并與說(shuō)明書(shū)一起用于解釋本公開(kāi)的原理。
圖1是根據(jù)一示例性實(shí)施例示出的一種夢(mèng)話(huà)提取方法的流程圖。
圖2是根據(jù)一示例性實(shí)施例示出的另一種夢(mèng)話(huà)提取方法的流程圖。
圖3是根據(jù)一示例性實(shí)施例示出的一種夢(mèng)話(huà)提取裝置框圖。
圖4是根據(jù)一示例性實(shí)施例示出的另一種夢(mèng)話(huà)提取裝置框圖。
圖5是根據(jù)一示例性實(shí)施例示出的一種用于提取夢(mèng)話(huà)的裝置的框圖。
具體實(shí)施方式
這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說(shuō)明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開(kāi)相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書(shū)中所詳述的、本公開(kāi)的一些方面相一致的裝置和方法的例子。
圖1是根據(jù)一示例性實(shí)施例示出的一種夢(mèng)話(huà)提取方法的流程圖,如圖1所示,夢(mèng)話(huà)提取方法用于移動(dòng)終端中,包括以下步驟。
在步驟S11中,響應(yīng)夢(mèng)話(huà)提取功能的啟示指令。
例如,當(dāng)用戶(hù)需要提取夢(mèng)話(huà)時(shí),可以在睡覺(jué)之前,通過(guò)點(diǎn)擊或其他指令啟動(dòng)夢(mèng)話(huà)提取功能。
在步驟S12中,采集周?chē)囊纛l信號(hào)。
以移動(dòng)終端是手機(jī)為例,當(dāng)接收到啟動(dòng)指令后,可以觸發(fā)手機(jī)的音頻輸入裝置(如麥克風(fēng))采集周?chē)囊纛l信號(hào)。
在步驟S13中,確定待記錄的音頻信號(hào)的門(mén)限值。
一些實(shí)施例中,可以預(yù)先設(shè)置固定的一個(gè)門(mén)限值。
一些實(shí)施例中,可以根據(jù)采集的音頻信號(hào)確定門(mén)限值。
例如,可以在采集的音頻信號(hào)中獲取一段音頻信號(hào),該一段音頻信號(hào)的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值,也就是相對(duì)穩(wěn)定且幅度較小的音頻信號(hào),再根據(jù)獲取的一段音頻信號(hào)確定門(mén)限值。例如,將這一段音頻信號(hào)的幅度值的均值作為基準(zhǔn)值,再將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號(hào)的門(mén)限值。
在步驟S14中,當(dāng)所述采集的音頻信號(hào)的幅度值大于所述門(mén)限值時(shí),開(kāi)始記錄所述采集的音頻信號(hào),直至所述采集的音頻信號(hào)的幅度值小于所述門(mén)限值時(shí),停止記錄。
其中,可以將記錄的每段音頻信號(hào)保存為一個(gè)音頻文件。由于用戶(hù)在睡夢(mèng)過(guò)程中,可能會(huì)多次說(shuō)夢(mèng)話(huà),因此,可以保存多個(gè)音頻文件。不同音頻文件在保存時(shí)可以分開(kāi)不保存,以避免相互覆蓋。
人們?cè)谒瘔?mèng)中時(shí),存在的音頻信號(hào)可能是噪聲,也可能是夢(mèng)話(huà),當(dāng)音頻信號(hào)的幅度小于門(mén)限值時(shí),可以認(rèn)為其是噪聲,不進(jìn)行記錄,而當(dāng)音頻信號(hào)的幅度大于門(mén)限值時(shí),可以認(rèn)為其是夢(mèng)話(huà),進(jìn)行記錄,以滿(mǎn)足用戶(hù)對(duì)夢(mèng)話(huà)提取的需求。
本實(shí)施例中,通過(guò)采集音頻信號(hào),并保存幅度值大于門(mén)限值的音頻信號(hào),可以提取出夢(mèng)話(huà),豐富降噪技術(shù)的應(yīng)用。
圖2是根據(jù)一示例性實(shí)施例示出的另一種夢(mèng)話(huà)提取方法的流程圖,如圖2所示,夢(mèng)話(huà)提取方法用于移動(dòng)終端中,包括以下步驟。
在步驟S21中,接收夢(mèng)話(huà)提取功能的啟動(dòng)指令并響應(yīng)所述啟動(dòng)指令。
例如,當(dāng)用戶(hù)需要提取夢(mèng)話(huà)時(shí),可以在睡覺(jué)之前,通過(guò)點(diǎn)擊或其他指令啟動(dòng)夢(mèng)話(huà)提取功能。
在步驟S22中,采集周?chē)囊纛l信號(hào)。
以移動(dòng)終端是手機(jī)為例,當(dāng)接收到啟動(dòng)指令后,可以觸發(fā)手機(jī)的音頻輸入裝置(如麥克風(fēng))采集周?chē)囊纛l信號(hào)。
在步驟S23中,在采集的音頻信號(hào)中,獲取一段音頻信號(hào),其中,一段音頻信號(hào)的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)值,以及,根據(jù)獲取的一段音頻信號(hào)的幅度值,確定待記錄的音頻信號(hào)的門(mén)限值。
例如,可以在采集的音頻信號(hào)中獲取幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值的一段音頻信號(hào),也就是相對(duì)穩(wěn)定且幅度較小的音頻信號(hào),再根據(jù)獲取的該段音頻信號(hào)確定門(mén)限值。例如,將這段音頻信號(hào)的幅度值的均值作為基準(zhǔn)值,再將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號(hào)的門(mén)限值。
在步驟S24中,當(dāng)所述采集的音頻信號(hào)的幅度值大于所述門(mén)限值時(shí),開(kāi)始記錄所述音頻信號(hào),直至所述采集的音頻信號(hào)的幅度值小于所述門(mén)限值時(shí),停止記錄。
例如,在T11時(shí)間點(diǎn),采集的音頻信號(hào)的幅度值大于門(mén)限值,則開(kāi)始記錄音頻信號(hào),當(dāng)T12時(shí)間點(diǎn),音頻信號(hào)的幅度值小于門(mén)限值,則停止記錄,從而可以記錄T11~T12這一時(shí)間區(qū)間內(nèi)的一段音頻信號(hào)。又例如,在T21時(shí)間點(diǎn),采集的音頻信號(hào)的幅度值大于門(mén)限值,則開(kāi)始記錄音頻信號(hào),當(dāng)T22時(shí)間點(diǎn),音頻信號(hào)的幅度值小于門(mén)限值,則停止記錄,從而可以記錄T21~T22這一時(shí)間區(qū)間內(nèi)的一段音頻信號(hào)。
在步驟S25中,將記錄的音頻信號(hào)保存為音頻文件,且不同的音頻文件保存在不同的存儲(chǔ)區(qū)域中。
假設(shè)T11~T12這一時(shí)間區(qū)間內(nèi)的一段音頻信號(hào)被保存為第一音頻文件,T21~T22這一時(shí)間區(qū)間內(nèi)的一段音頻信號(hào)被保存為第二音頻文件,則第一音頻文件和第二音頻文件可以保存在不同的存儲(chǔ)區(qū)域。例如,每次存儲(chǔ)之前先查找空閑的存儲(chǔ)區(qū)域,在空閑的存儲(chǔ)區(qū)域中將幅度值大于門(mén)限值的音頻信號(hào)保存為音頻文件。
進(jìn)一步的,所述將記錄的音頻信號(hào)保存為音頻文件,包括:
對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,將滿(mǎn)足所述語(yǔ)音識(shí)別的預(yù)設(shè)條件的記錄的音頻信號(hào)保存為音頻文件;
其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):
語(yǔ)音識(shí)別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;
語(yǔ)音識(shí)別結(jié)果中包含分詞。
具體如,當(dāng)記錄一段音頻信號(hào)后,對(duì)該段音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,得到音頻信號(hào)對(duì)應(yīng)的文本,如果該文本中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值(如大于5個(gè)字),和/或,該文本中包含分詞(如動(dòng)詞),則將該段音頻信號(hào)保存為音頻文本。通常來(lái)講,當(dāng)上述的文本包含的字?jǐn)?shù)大于字?jǐn)?shù)閾值或包含分詞時(shí),可以說(shuō)明該段音頻信號(hào)是夢(mèng)話(huà),而非無(wú)用的鼾聲或磨牙等噪聲,因此通過(guò)對(duì)音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,可以提高保存的音頻文件的準(zhǔn)確度。
進(jìn)一步的,所述將記錄的音頻信號(hào)保存為音頻文件,包括:
對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,根據(jù)語(yǔ)音識(shí)別結(jié)果對(duì)所述記錄的音頻信號(hào)進(jìn)行打分,根據(jù)記錄的音頻信號(hào)的分值從高到低的順序依次保存對(duì)應(yīng)的音頻文件。
例如,如果對(duì)一段音頻信號(hào)的語(yǔ)音識(shí)別結(jié)果中包含的字?jǐn)?shù)越多則該段音頻信號(hào)的分值越高,在保存為音頻文件時(shí)排序在越靠前。因此,可以將質(zhì)量更優(yōu)的夢(mèng)話(huà)排序在前。
在步驟S26中,對(duì)不同存儲(chǔ)區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
其中,在存儲(chǔ)的所有音頻文件中,可以?xún)蓛蛇M(jìn)行相似度判斷,具體的,可以采用語(yǔ)音相似度算法進(jìn)行相似度判斷,以確定兩個(gè)音頻文件的相似度。假設(shè)第一音頻文件與第二音頻文件的相似度大于閾值,則刪除第一音頻文件和第二音頻文件。
進(jìn)一步的,語(yǔ)音相似度的計(jì)算算法有多種,例如,可以對(duì)每個(gè)音頻文件進(jìn)行特征提取,獲取每個(gè)音頻文件對(duì)應(yīng)的特征向量,之后再計(jì)算兩個(gè)音頻文件對(duì)應(yīng)的兩個(gè)特征向量之間的余弦距離或歐式距離等,將計(jì)算得到的距離值作為相似度數(shù)值,進(jìn)而判斷相似度數(shù)值是否大于閾值。
人們?cè)谒瘔?mèng)中時(shí),超過(guò)門(mén)限值的音頻信號(hào)除了夢(mèng)話(huà)之前,還可能是打鼾的聲音,而打鼾的聲音的相似度較大,本實(shí)施例通過(guò)刪除相似度較大的音頻文件可以刪除無(wú)用的鼾聲。
在步驟S27中,判斷是否結(jié)束夢(mèng)話(huà)提取功能,若是,執(zhí)行步驟S28,否則,重復(fù)執(zhí)行步驟S22及其后續(xù)步驟。
其中,可以是接收到夢(mèng)話(huà)提取功能的結(jié)束指令后,確定結(jié)束夢(mèng)話(huà)提取功能,或者,也可以是預(yù)先設(shè)置結(jié)束時(shí)間,當(dāng)達(dá)到結(jié)束時(shí)間時(shí),確定結(jié)束夢(mèng)話(huà)提取功能。進(jìn)一步的,上述的結(jié)束時(shí)間可以是絕對(duì)時(shí)間,如凌晨6點(diǎn),則在凌晨6點(diǎn)結(jié)束夢(mèng)話(huà)提取功能。或者,上述的結(jié)束時(shí)間也可以是與夢(mèng)話(huà)提取功能的啟動(dòng)指令的產(chǎn)生時(shí)間之間的間隔時(shí)間,如8小時(shí),則如果啟動(dòng)指令的產(chǎn)生時(shí)間是12點(diǎn),則在8點(diǎn)結(jié)束夢(mèng)話(huà)提取功能。
在步驟S28中,結(jié)束對(duì)周?chē)纛l信號(hào)的采集。
可以理解的是,上述S26進(jìn)行相似度判斷時(shí),可以是每次保存得到一個(gè)音頻文件后,將該音頻文件與已有的音頻文件進(jìn)行兩兩相似度運(yùn)算,以刪除相似度較大的音頻文件。或者,也可以是夢(mèng)話(huà)提取功能結(jié)束后,對(duì)保存的所有音頻文件進(jìn)行兩兩相似度運(yùn)算,以刪除相似度較大的音頻文件。
本實(shí)施例中,通過(guò)采集音頻信號(hào),并保存幅度值大于門(mén)限值的音頻信號(hào),可以提取出夢(mèng)話(huà),豐富降噪技術(shù)的應(yīng)用。進(jìn)一步的,通過(guò)根據(jù)采集的音頻信號(hào)確定門(mén)限值,可以確定出更準(zhǔn)確的門(mén)限值,更利于夢(mèng)話(huà)提取。進(jìn)一步的,通過(guò)刪除相似度較大的音頻文件可以刪除無(wú)用的鼾聲。進(jìn)一步的,通過(guò)對(duì)記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,可以根據(jù)識(shí)別結(jié)果確定音頻信號(hào)是夢(mèng)話(huà)或者無(wú)用的鼾聲等,從而可以根據(jù)語(yǔ)音識(shí)別結(jié)果保存更準(zhǔn)確的音頻信號(hào)。進(jìn)一步的,通過(guò)對(duì)記錄的音頻信號(hào)進(jìn)行打分,并根據(jù)打分結(jié)果進(jìn)行排序保存,可以?xún)?yōu)先保存為夢(mèng)話(huà)的音頻信號(hào)。
圖3是根據(jù)一示例性實(shí)施例示出的一種夢(mèng)話(huà)提取裝置框圖。參照?qǐng)D3,該裝置30包括:響應(yīng)模塊31、采集模塊32、確定模塊33和記錄模塊34。
響應(yīng)模塊31,用于響應(yīng)夢(mèng)話(huà)提取功能的啟動(dòng)指令;
采集模塊32,用于在接收到所述啟動(dòng)指令后,采集周?chē)囊纛l信號(hào);
確定模塊33,用于確定待記錄的音頻信號(hào)的門(mén)限值;
記錄模塊34,用于當(dāng)所述采集的音頻信號(hào)的幅度值大于所述門(mén)限值時(shí),開(kāi)始記錄所述采集的音頻信號(hào),直至所述采集的音頻信號(hào)的幅度值小于所述門(mén)限值時(shí),停止記錄。
一些實(shí)施例中,參見(jiàn)圖4,所述確定模塊33包括:
確定子模塊331,用于在采集的音頻信號(hào)中,獲取一段音頻信號(hào),其中所述一段音頻信號(hào)的幅度值的變化量小于預(yù)設(shè)變化量,且幅度值小于預(yù)設(shè)幅度值;
計(jì)算子模塊332,用于根據(jù)所述獲取的一段音頻信號(hào)的幅度值,確定待記錄的音頻信號(hào)的門(mén)限值。
一些實(shí)施例中,所述計(jì)算子模塊332進(jìn)一步用于:
將獲取的一段音頻信號(hào)的幅度值的均值作為基準(zhǔn)值;
將基準(zhǔn)值的預(yù)設(shè)倍數(shù),確定為待記錄的音頻信號(hào)的門(mén)限值。
一些實(shí)施例中,參見(jiàn)圖4,該裝置30還包括:
保存模塊35,用于將記錄的音頻信號(hào)保存為音頻文件,且不同的音頻文件保存在不同的存儲(chǔ)區(qū)域中。
一些實(shí)施例中,參見(jiàn)圖4,該裝置30還包括:
刪除模塊36,用于對(duì)不同存儲(chǔ)區(qū)域的音頻文件進(jìn)行相似度判斷,刪除相似度大于閾值的音頻文件。
一些實(shí)施例中,所述保存模塊35進(jìn)一步用于:
對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,將滿(mǎn)足所述語(yǔ)音識(shí)別的預(yù)設(shè)條件的記錄的音頻信號(hào)保存為音頻文件;
其中,所述預(yù)設(shè)條件包括如下項(xiàng)中的至少一項(xiàng):
語(yǔ)音識(shí)別結(jié)果中包含的字?jǐn)?shù)大于預(yù)設(shè)字?jǐn)?shù)閾值;
語(yǔ)音識(shí)別結(jié)果中包含分詞。
一些實(shí)施例中,所述保存模塊35進(jìn)一步用于:
對(duì)所述記錄的音頻信號(hào)進(jìn)行語(yǔ)音識(shí)別,根據(jù)語(yǔ)音識(shí)別結(jié)果對(duì)所述記錄的音頻信號(hào)進(jìn)行打分,根據(jù)記錄的音頻信號(hào)的分值從高到低的順序依次保存對(duì)應(yīng)的音頻文件。
關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說(shuō)明。
本實(shí)施例中,通過(guò)采集音頻信號(hào),并保存幅度值大于門(mén)限值的音頻信號(hào),可以提取出夢(mèng)話(huà),豐富降噪技術(shù)的應(yīng)用。進(jìn)一步的,通過(guò)根據(jù)采集的音頻信號(hào)確定門(mén)限值,可以確定出更準(zhǔn)確的門(mén)限值,更利于夢(mèng)話(huà)提取。進(jìn)一步的,通過(guò)刪除相似度較大的音頻文件可以刪除無(wú)用的鼾聲。
圖5是根據(jù)一示例性實(shí)施例示出的一種用于提取夢(mèng)話(huà)的裝置的框圖。例如,裝置500可以是移動(dòng)電話(huà),計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等。
參照?qǐng)D5,裝置500可以包括以下一個(gè)或多個(gè)組件:處理組件502,存儲(chǔ)器504,電源組件506,多媒體組件508,音頻組件510,輸入/輸出(I/O)的接口512,傳感器組件514,以及通信組件516。
處理組件502通??刂蒲b置500的整體操作,諸如與顯示,電話(huà)呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件502可以包括一個(gè)或多個(gè)處理器520來(lái)執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件502可以包括一個(gè)或多個(gè)模塊,便于處理組件502和其他組件之間的交互。例如,處理組件502可以包括多媒體模塊,以方便多媒體組件508和處理組件502之間的交互。
存儲(chǔ)器504被配置為存儲(chǔ)各種類(lèi)型的數(shù)據(jù)以支持在裝置500的操作。這些數(shù)據(jù)的示例包括用于在裝置500上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話(huà)簿數(shù)據(jù),消息,圖片,視頻等。存儲(chǔ)器504可以由任何類(lèi)型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),電可擦除可編程只讀存儲(chǔ)器(EEPROM),可擦除可編程只讀存儲(chǔ)器(EPROM),可編程只讀存儲(chǔ)器(PROM),只讀存儲(chǔ)器(ROM),磁存儲(chǔ)器,快閃存儲(chǔ)器,磁盤(pán)或光盤(pán)。
電源組件506為裝置500的各種組件提供電力。電源組件506可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置500生成、管理和分配電力相關(guān)聯(lián)的組件。
多媒體組件508包括在所述裝置500和用戶(hù)之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來(lái)自用戶(hù)的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng)作的邊界,而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件508包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)裝置500處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
音頻組件510被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件510包括一個(gè)麥克風(fēng)(MIC),當(dāng)裝置500處于操作模式,如呼叫模式、記錄模式和語(yǔ)音識(shí)別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器504或經(jīng)由通信組件516發(fā)送。在一些實(shí)施例中,音頻組件510還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。
I/O接口512為處理組件502和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤(pán),點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁(yè)按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。
傳感器組件514包括一個(gè)或多個(gè)傳感器,用于為裝置500提供各個(gè)方面的狀態(tài)評(píng)估。例如,傳感器組件514可以檢測(cè)到裝置500的打開(kāi)/關(guān)閉狀態(tài),組件的相對(duì)定位,例如所述組件為裝置500的顯示器和小鍵盤(pán),傳感器組件514還可以檢測(cè)裝置500或裝置500一個(gè)組件的位置改變,用戶(hù)與裝置500接觸的存在或不存在,裝置500方位或加速/減速和裝置500的溫度變化。傳感器組件514可以包括接近傳感器,被配置用來(lái)在沒(méi)有任何的物理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件514還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件514還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
通信組件516被配置為便于裝置500和其他設(shè)備之間有線(xiàn)或無(wú)線(xiàn)方式的通信。裝置500可以接入基于通信標(biāo)準(zhǔn)的無(wú)線(xiàn)網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示例性實(shí)施例中,通信組件516經(jīng)由廣播信道接收來(lái)自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信組件516還包括近場(chǎng)通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識(shí)別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來(lái)實(shí)現(xiàn)。
在示例性實(shí)施例中,裝置500可以被一個(gè)或多個(gè)應(yīng)用專(zhuān)用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法:響應(yīng)夢(mèng)話(huà)提取功能的啟動(dòng)指令;采集周?chē)囊纛l信號(hào);確定待記錄的音頻信號(hào)的門(mén)限值;當(dāng)所述采集的音頻信號(hào)的幅度值大于所述門(mén)限值時(shí),開(kāi)始記錄所述采集的音頻信號(hào),直至所述采集的音頻信號(hào)的幅度值小于所述門(mén)限值時(shí),停止記錄。
在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器504,上述指令可由裝置500的處理器520執(zhí)行以完成上述方法:響應(yīng)夢(mèng)話(huà)提取功能的啟動(dòng)指令;采集周?chē)囊纛l信號(hào);確定待記錄的音頻信號(hào)的門(mén)限值;當(dāng)所述采集的音頻信號(hào)的幅度值大于所述門(mén)限值時(shí),開(kāi)始記錄所述采集的音頻信號(hào),直至所述采集的音頻信號(hào)的幅度值小于所述門(mén)限值時(shí),停止記錄。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤(pán)和光數(shù)據(jù)存儲(chǔ)設(shè)備等。
本領(lǐng)域技術(shù)人員在考慮說(shuō)明書(shū)及實(shí)踐這里公開(kāi)的發(fā)明后,將容易想到本公開(kāi)的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本公開(kāi)的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開(kāi)的一般性原理并包括本公開(kāi)未公開(kāi)的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書(shū)和實(shí)施例僅被視為示例性的,本公開(kāi)的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本公開(kāi)并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開(kāi)的范圍僅由所附的權(quán)利要求來(lái)限制。