一種信息處理方法及電子設備的制作方法
【專利摘要】本發(fā)明公開了一種信息處理方法及電子設備,其中,所述方法應用于電子設備中,所述電子設備包括聲音采集單元,所述方法包括:觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應;通過所述聲音采集單元采集語音命令,得到包含所述語音命令和所述音頻的混合數(shù)據;確定來電音頻,從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令。
【專利說明】一種信息處理方法及電子設備
【技術領域】
[0001]本發(fā)明涉及通訊技術,尤其涉及一種信息處理方法及電子設備。
【背景技術】
[0002]本申請發(fā)明人在實現(xiàn)本申請實施例技術方案的過程中,至少發(fā)現(xiàn)現(xiàn)有技術中存在如下技術問題:
[0003]用戶在使用電子設備如手機時,常常會遇到這樣的問題:一種場景是用戶在開車時有電話進來,以來電音頻的方式提示需要用戶接聽,用戶會發(fā)出語音命令來接聽電話。按照通常的識別策略,是識別出采集的語音命令,根據語音命令來選擇接聽或掛斷電話。但是,因為存在來電音頻,導致電子設備不僅會采集到語音命令這種有效數(shù)據,而且還會采集到來電音頻這種無效數(shù)據,也就是說,采集的是包括語音命令和來電音頻的混合數(shù)據,由于數(shù)據采集的不準確,勢必導致后續(xù)無法正確識別出語音命令,使得識別率大大下降。然而,相關技術中,對于該問題,尚無有效解決方案。
【發(fā)明內容】
[0004]有鑒于此,本發(fā)明實施例希望提供一種信息處理方法及電子設備,能解決識別率下降的問題。
[0005]本發(fā)明實施例的技術方案是這樣實現(xiàn)的:
[0006]本發(fā)明實施例的信息處理方法,所述方法應用于電子設備中,所述電子設備包括聲音采集單元,所述方法包括:
[0007]觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應;
[0008]通過所述聲音采集單元采集語音命令,得到包含所述語音命令和所述音頻的混合數(shù)據;
[0009]確定來電音頻,從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令。
[0010]優(yōu)選地,所述確定所述來電音頻,包括:觸發(fā)所述第一指令之前,預先回放本地存儲的第一來電音頻,通過所述聲音采集單元采集經回放后傳輸回所述電子設備的音頻并轉錄,得到第二來電音頻,將所述第二來電音頻確定為所述來電音頻。
[0011]優(yōu)選地,由所述第一來電音頻和所述第二來電音頻得到數(shù)據模型,以使得后續(xù)執(zhí)行所述過濾時能根據所述第一來電音頻直接得到所述來電音頻。
[0012]優(yōu)選地,所述數(shù)據模型包括以下一種或多種參數(shù)的組合:
[0013]包括代表電子設備自身信息的第一干擾參數(shù);
[0014]用于代表用戶所在環(huán)境對所述回放及傳輸過程中的損耗影響的第二干擾參數(shù);
[0015]用于代表用戶所在環(huán)境的背景音的第三干擾參數(shù)。
[0016]優(yōu)選地,所述根據所述第一來電音頻直接得到所述來電音頻,包括:
[0017]獲取用于代表用戶所在不同環(huán)境對所述回放及所述傳輸過程中的損耗影響的不同第二干擾參數(shù);[0018]利用所述不同第二干擾參數(shù),根據所述第一來電音頻得到所述來電音頻。
[0019]優(yōu)選地,所述方法還包括:通過以下任意一種方式對所述第二來電音頻進行修正:
[0020]方式一:所述第一來電音頻發(fā)生變化時,重新執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,以重新獲取所述第二來電音頻;
[0021]方式二:對所述第一來電音頻多次執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,收集歷史記錄,根據所述歷史記錄修正所述數(shù)據模型,以重新獲取所述第二來電音頻;
[0022]方式三:對同一批次的電子設備在出廠前設置預設值,根據所述預設值修正所述數(shù)據模型,以重新獲取所述第二來電音頻。
[0023]優(yōu)選地,所述從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令,包括:
[0024]以所述第二來電音頻作為新的參考信號實現(xiàn)所述過濾,以得到所述語音命令。
[0025]本發(fā)明實施例的電子設備,所述電子設備包括:
[0026]觸發(fā)單元,用于觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應;
[0027]聲音采集單元,用于采集語音命令,得到包含所述語音命令和所述音頻的混合數(shù)據;
[0028]確定單元,用于確定來電音頻,從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語首命令。
[0029]優(yōu)選地,所述確定單元,進一步用于觸發(fā)所述第一指令之前,預先回放本地存儲的
第一來電音頻;
[0030]所述聲音采集單元,進一步用于采集經回放后傳輸回所述電子設備的音頻并轉錄,得到第二來電音頻;
[0031]所述確定單元,還用于將所述第二來電音頻確定為所述來電音頻。
[0032]優(yōu)選地,所述電子設備還包括:
[0033]建模單元,用于由所述第一來電音頻和所述第二來電音頻得到數(shù)據模型,以使得后續(xù)執(zhí)行所述過濾時能根據所述第一來電音頻直接得到所述來電音頻。
[0034]優(yōu)選地,所述數(shù)據模型包括以下一種或多種參數(shù)的組合:
[0035]包括代表電子設備自身信息的第一干擾參數(shù);
[0036]用于代表用戶所在環(huán)境對所述回放及傳輸過程中的損耗影響的第二干擾參數(shù);
[0037]用于代表用戶所在環(huán)境的背景音的第三干擾參數(shù)。
[0038]優(yōu)選地,所述確定單元,進一步用于獲取用于代表用戶所在不同環(huán)境對所述回放及所述傳輸過程中的損耗影響的不同第二干擾參數(shù);利用所述不同第二干擾參數(shù),根據所述第一來電音頻得到所述來電音頻。
[0039]優(yōu)選地,所述電子設備還包括:
[0040]修正單元,用于通過以下任意一種方式對所述第二來電音頻進行修正:
[0041]方式一:所述第一來電音頻發(fā)生變化時,重新執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,以重新獲取所述第二來電音頻;
[0042]方式二:對所述第一來電音頻多次執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,收集歷史記錄,根據所述歷史記錄修正所述數(shù)據模型,以重新獲取所述第二來電音頻;
[0043]方式三:對同一批次的電子設備在出廠前設置預設值,根據所述預設值修正所述數(shù)據模型,以重新獲取所述第二來電音頻。
[0044]優(yōu)選地,所述確定單元,進一步用于以所述第二來電音頻作為新的參考信號以實現(xiàn)從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令。
[0045]本發(fā)明實施例信息處理方法應用于電子設備中,所述電子設備包括聲音采集單元,所述方法包括:觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應;通過所述聲音采集單元采集語音命令,得到包含所述語音命令和所述音頻的混合數(shù)據;確定來電音頻,從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令。
[0046]采用本發(fā)明實施例,由于能從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令,因此,避免了來電音頻對語音命令的干擾,從而能正確識別出語音命令,使得識別率得到大幅提聞。
【專利附圖】
【附圖說明】
[0047]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據提供的附圖獲得其他的附圖。
[0048]圖1為本發(fā)明方法實施例的一個實現(xiàn)流程示意圖;
[0049]圖2為本發(fā)明方法實施例的一個實現(xiàn)流程示意圖;
[0050]圖3為本發(fā)明方法實施例的一個實現(xiàn)流程示意圖;
[0051]圖4為本發(fā)明方法實施例的一個實現(xiàn)流程示意圖;
[0052]圖5為本發(fā)明電子設備實施例的一個組成結構示意圖;
[0053]圖6為本發(fā)明電子設備實施例的一個組成結構示意圖;
[0054]圖7為本發(fā)明電子設備實施例的一個組成結構示意圖。
【具體實施方式】
[0055]為使本申請的目的、技術方案和優(yōu)點更加清楚明白,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互任意組合。在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行。并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
[0056]下面結合附圖對技術方案的實施作進一步的詳細描述。
[0057]方法實施例一:
[0058]本發(fā)明實施例的信息處理方法,所述方法應用于電子設備中,所述電子設備包括聲音采集單元,如圖1所示,所述方法包括以下步驟:
[0059]步驟101、觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應。
[0060]步驟102、通過所述聲音采集單元采集語音命令,得到包含所述語音命令和所述音頻的混合數(shù)據。
[0061]步驟103、確定來電音頻,從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令。
[0062]這里需要指出的是,步驟103中的所述來電音頻實際上是形變后的來電音頻,不是步驟101中請求用戶進行響應的初始音頻。當然,步驟101中請求用戶進行響應的,除了可以是初始首頻,如一段鈴聲,也可以是手機震動的聲首。
[0063]以音頻為例,對于形變產生的原因以一個場景舉例來說如下:
[0064]在駕駛時,采用用戶手機鈴聲或語音導航中的利用語音引擎進行文字轉語音(TTS)等來提醒用戶有電話,這時候如果直接采用語音命令來進行響應,以實現(xiàn)電話接聽或者掛斷,因為鈴聲這種來電音頻數(shù)據和用戶語音命令的混合,導致語音識別率急劇下降。即使用戶的手機上通過回波抵消的方案,去盡可能的抵消外放的來電音頻,仍然會有如下問題無法得到解決:
[0065]由于外放的初始來電音頻經過手機上的喇機、聲音傳播和mic轉錄,已經有較大形變,且由于不同手機的喇叭和mic相對位置的不同而導致形變的畸變函數(shù)(或稱為數(shù)據模型)不一致,因此,這會導致用于回波抵消的來電音頻和實際外放轉錄的初始來電音頻差異較大,從而導致回波抵消不準確,導致回波抵消的語音畸變較大,從而導致語音識別率的大幅下降。有鑒于此,如何消除用戶的鈴聲和TTS的影響從而提高語音識別率就變得至關重要。
[0066]而采用本發(fā)明實施例,步驟103中的所述來電音頻實際上是形變后的來電音頻,不是步驟101中請求用戶進行響應的初始音頻。由于本發(fā)明實施例能確定出所述形變后的來電音頻用于回波抵消,則從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令,識別精確度更高,因此,避免了來電音頻對語音命令的干擾,從而能正確識別出語音命令,使得識別率得到大幅提高。
[0067]為了表述方便,本發(fā)明實施例中,用于回波抵消的所述形變后的來電音頻,后續(xù)稱為第二來電音頻;所述實際外放轉錄的初始來電音頻,后續(xù)稱為第一來電音頻。
[0068]下面結合附圖對技術方案的實施作進一步的詳細描述。
[0069]方法實施例二:
[0070]本發(fā)明實施例的信息處理方法,所述方法應用于電子設備中,所述電子設備包括聲音采集單元,如圖2所示,所述方法包括以下步驟:
[0071]步驟201、預先回放本地存儲的第一來電音頻,通過所述聲音采集單元采集經回放后傳輸回所述電子設備的音頻并轉錄,得到第二來電音頻。
[0072]步驟202、觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應。
[0073]步驟203、通過所述聲音采集單元采集語音命令,得到包含所述語音命令和所述音頻的混合數(shù)據。[0074]步驟204、將所述第二來電音頻確定為所述音頻,從所述混合數(shù)據中過濾掉所述音頻,得到所述語音命令。
[0075]采用本發(fā)明實施例,由于通過步驟204中能確定第二來電音頻(形變后的來電音頻),采用第二來電音頻用于回波抵消,從所述混合數(shù)據中過濾掉所述音頻,得到所述語音命令,識別精確度更高,因此,避免了來電音頻對語音命令的干擾,從而能正確識別出語音命令,使得識別率得到大幅提高。
[0076]方法實施例三:
[0077]本發(fā)明實施例的信息處理方法,所述方法應用于電子設備中,所述電子設備包括聲音采集單元,如圖3所示,所述方法包括以下步驟:
[0078]步驟301、預先回放本地存儲的第一來電音頻,通過所述聲音采集單元采集經回放后傳輸回所述電子設備的音頻并轉錄,得到第二來電音頻。
[0079]步驟302、由所述第一來電音頻和所述第二來電音頻得到數(shù)據模型。
[0080]步驟303、觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶對第一來電音頻進行響應。
[0081]步驟304、基于所述數(shù)據模型根據所述第一來電音頻直接得到所述第二來電音頻。
[0082]步驟305、通過所述聲音采集單元采集語音命令,得到包含所述語音命令和所述第二來電音頻的混合數(shù)據。
[0083]步驟306、從所述混合數(shù)據中過濾掉所述第二來電音頻,得到所述語音命令。
[0084]采用本發(fā)明實施例,由于通過步驟302能由所述第一來電音頻和所述第二來電音頻得到數(shù)據模型,以使得后續(xù)步驟304能基于所述數(shù)據模型根據所述第一來電音頻直接得到所述第二來電音頻(形變后的來電音頻),將所述第二來電音頻作為需從混合數(shù)據中過濾掉的音頻,從而,通過步驟306能從所述混合數(shù)據中過濾掉所述第二來電音頻,得到所述語音命令,識別精確度更高,因此,避免了來電音頻對語音命令的干擾,從而能正確識別出語首命令,使得識別率得到大幅提聞。
[0085]在本發(fā)明實施例一優(yōu)選實施方式中,步驟302中的所述數(shù)據模型包括以下一種或多種參數(shù)的組合:
[0086]包括代表電子設備自身信息的第一干擾參數(shù);
[0087]用于代表用戶所在環(huán)境對所述回放及傳輸過程中的損耗影響的第二干擾參數(shù);
[0088]用于代表用戶所在環(huán)境的背景音的第三干擾參數(shù)。
[0089]這里需要指出的是,對于所述第一干擾參數(shù)、所述第二干擾參數(shù)、所述第三干擾參數(shù),每種干擾參數(shù)都可能包括多個參數(shù),分別對不同的聲音因素產生影響,包括對強度的影響,對高頻信號以及低頻信號的影響等。其中,對于第一干擾參數(shù)而言,電子設備自身信息包括mic功率等;對于第二干擾參數(shù)而言,封閉空間、空曠空間對聲音的影響為第二干擾參數(shù);對于第三干擾參數(shù)而言,所述第三干擾參數(shù)包括背景音,即雜音。
[0090]在本發(fā)明實施例一優(yōu)選實施方式中,步驟304的所述根據所述第一來電音頻直接得到所述來電音頻,包括:
[0091]獲取用于代表用戶所在不同環(huán)境對所述回放及所述傳輸過程中的損耗影響的不同第二干擾參數(shù);
[0092]利用所述不同第二干擾參數(shù),根據所述第一來電音頻得到所述來電音頻。[0093]方法實施例四:
[0094]本發(fā)明實施例的信息處理方法,所述方法應用于電子設備中,所述電子設備包括聲音采集單元,如圖4所示,所述方法包括以下步驟:
[0095]步驟401、預先回放本地存儲的第一來電音頻,通過所述聲音采集單元采集經回放后傳輸回所述電子設備的音頻并轉錄,得到第二來電音頻。
[0096]步驟402、由所述第一來電音頻和所述第二來電音頻得到數(shù)據模型。
[0097]步驟403、觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶對第一來電音頻進行響應。
[0098]步驟404、基于所述數(shù)據模型根據所述第一來電音頻直接得到所述第二來電音頻。
[0099]步驟405、通過所述聲音采集單元采集語音命令,得到包含所述語音命令和所述第二來電音頻的混合數(shù)據。
[0100]步驟406、從所述混合數(shù)據中過濾掉所述第二來電音頻,得到所述語音命令。
[0101]步驟407、對所述第二來電音頻進行修正。
[0102]步驟408、以修正后的第二來電音頻作為新的參考信號實現(xiàn)所述過濾,以得到所述語首命令。
[0103]采用本發(fā)明實施例,由于通過步驟402能由所述第一來電音頻和所述第二來電音頻得到數(shù)據模型,以使得后續(xù)步驟404能基于所述數(shù)據模型根據所述第一來電音頻直接得到所述第二來電音頻(形變后的來電音頻),將所述第二來電音頻作為需從混合數(shù)據中過濾掉的音頻,從而,通過步驟406能從所述混合數(shù)據中過濾掉所述第二來電音頻,得到所述語音命令,識別精確度更高,因此,避免了來電音頻對語音命令的干擾,從而能正確識別出語首命令,使得識別率得到大幅提聞。
[0104]而且,在執(zhí)行完過濾后,或者在執(zhí)行過濾前,可以對第二來電音頻進行修正,本發(fā)明實施例是在步驟406執(zhí)行完過濾后,進行步驟407的對第二來電音頻進行修正,之后通過步驟408,以修正后的第二來電音頻作為新的參考信號實現(xiàn)所述過濾,以得到所述語音命令。這樣的好處是,第二來電音頻的獲得不是一勞永逸,而是不斷變化的,以得到更精確的第二來電音頻,得到更好的過濾效果,以提高對語音命令的識別率。
[0105]在本發(fā)明實施例的一優(yōu)選實施方式中,步驟407具體為:通過以下任意一種方式對所述第二來電音頻進行修正:
[0106]方式一:所述第一來電音頻發(fā)生變化時,重新執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,以重新獲取所述第二來電音頻;
[0107]方式二:對所述第一來電音頻多次執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,收集歷史記錄,根據所述歷史記錄修正所述數(shù)據模型,以重新獲取所述第二來電音頻;
[0108]方式三:對同一批次的電子設備在出廠前設置預設值,根據所述預設值修正所述數(shù)據模型,以重新獲取所述第二來電音頻。
[0109]以音頻為例,對于上述方法實施例及其優(yōu)選實施方式以一個場景舉例來說如下:
[0110]在駕駛時,采用用戶手機鈴聲或語音導航中的語音引擎(TTS)等來提醒用戶有電話,或者用戶正在聽歌或看視頻等存在外放音頻等場景,對于如駕駛時放歌來說,如果進行語音交互時會把歌的聲音,也添加進用戶的用于接聽或掛斷電話的語音命令中,用戶的語音命令是有效數(shù)據,需要將歌的聲音這種無效數(shù)據過濾掉才可以。對于來電提醒音頻,通過喇叭播放、聲音傳輸、mic轉錄得到新的參考信號(即上述第二來電音頻),以該新的參考信號為基準做回波抵消,而不是電子設備存儲的原始的音頻(第一來電音頻)作為參考信號進行回波抵消,采用第一來電音頻這種舊的參考信號進行回波抵消是一種普通的回波抵消方案,采用第二來電音頻作為新的參考信號做回波抵消的方案,能消除由于普通的回波抵消帶來的函數(shù)(數(shù)據模型)畸變的問題,從而提高了準確度。
[0111]例如,對來電提醒的音頻為XI,經過mic傳播轉錄,預錄得到X2,將x2作為新的參考信號,通過Xl和x2得到用于回波抵消的函數(shù)(數(shù)據模型)。
[0112]用戶的語音命令為y,則在用戶進行語音輸入時得到的混合數(shù)據實際為y+x2,而不是y+xl,由于根據數(shù)據建模已經得到用于回波抵消的函數(shù)(數(shù)據模型),從而,基于用于回波抵消的函數(shù)(數(shù)據模型),根據Xl直接得到x2,從而能從混合數(shù)據中識別出x2,過濾掉x2,保留I用于接聽或掛斷電話的處理。
[0113]而且,x2需要不斷修正,而不能一直米用固定值,一種方式是:在用戶改變來電提醒音頻時,重新采集參考信號x2’ (x2的修正值);另一種方式是:在無法大量采集參考信號時,可以根據前期采集的參考信號,估算音頻畸變的用于回波抵消的函數(shù)(數(shù)據模型),從而對參考信號進行重新估計以得到x2’;還有一種方式是:在無法針對特定用戶手機進行參考信號采集時,可以在手機出廠前對同一批次的手機進行實驗估算音頻畸變的用于回波抵消的函數(shù)(數(shù)據模型),從而對參考信號進行重新估計以得到x2’。
[0114]如此一來,在該場景應用本發(fā)明實施例之后的優(yōu)勢是:通過對電話提示音的轉錄信號采集或畸變估計,在回波抵消時避免由于喇叭、聲音傳播和mic轉錄導致畸變,從而提高語音識別率,能夠高效的用語音命令控制接聽或掛斷手機。
[0115]這里需要指出的是:以下電子設備項的描述,與上述方法描述是類似的,同方法的有益效果描述,不做贅述。對于本發(fā)明電子設備實施例中未披露的技術細節(jié),請參照本發(fā)明方法實施例的描述。
[0116]電子設備實施例一:
[0117]本發(fā)明實施例的電子設備,如圖5所示,所述電子設備包括:
[0118]觸發(fā)單元11,用于觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應。聲音采集單元12,用于采集語音命令,得到包含所述語音命令和所述音頻的混合數(shù)據。確定單元13,用于確定來電音頻,從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語首命令。
[0119]在本發(fā)明實施例的一優(yōu)選實施方式中,如圖5所示,確定單元11,還用于觸發(fā)所述第一指令之前,預先回放本地存儲的第一來電音頻;相應的,聲音采集單元12還用于采集經回放后傳輸回所述電子設備的音頻并轉錄,得到第二來電音頻;則確定單元U,還用于將所述第二來電音頻確定為所述來電音頻。
[0120]電子設備實施例二:
[0121]本發(fā)明實施例的電子設備,如圖6所示,所述電子設備包括:
[0122]建模單元10,用于由所述第一來電音頻和所述第二來電音頻得到數(shù)據模型,以使得后續(xù)執(zhí)行所述過濾時能根據所述第一來電音頻直接得到所述來電音頻。確定單元11,還用于觸發(fā)所述第一指令之前,預先回放本地存儲的第一來電音頻;觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應。聲音采集單元12還用于采集經回放后傳輸回所述電子設備的音頻并轉錄,得到第二來電音頻;用于采集語音命令,得到包含所述語音命令和所述第二來電音頻的混合數(shù)據。確定單元11,還用于將所述第二來電音頻確定為所述來電音頻,從所述混合數(shù)據中過濾掉所述第二來電音頻,得到所述語音命令。
[0123]在本發(fā)明實施例的一優(yōu)選實施方式中,所述數(shù)據模型包括以下一種或多種參數(shù)的組合:
[0124]包括代表電子設備自身信息的第一干擾參數(shù);
[0125]用于代表用戶所在環(huán)境對所述回放及傳輸過程中的損耗影響的第二干擾參數(shù);
[0126]用于代表用戶所在環(huán)境的背景音的第三干擾參數(shù)。
[0127]在本發(fā)明實施例的一優(yōu)選實施方式中,確定單元11,還用于獲取用于代表用戶所在不同環(huán)境對所述回放及所述傳輸過程中的損耗影響的不同第二干擾參數(shù);利用所述不同第二干擾參數(shù),根據所述第一來電音頻得到所述來電音頻。
[0128]電子設備實施例三:
[0129]本發(fā)明實施例的電子設備,如圖7所示,所述電子設備包括:
[0130]建模單元10,用于由所述第一來電音頻和所述第二來電音頻得到數(shù)據模型,以使得后續(xù)執(zhí)行所述過濾時能根據所述第一來電音頻直接得到所述來電音頻。確定單元11,還用于觸發(fā)所述第一指令之前,預先回放本地存儲的第一來電音頻;觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應。聲音采集單元12還用于采集經回放后傳輸回所述電子設備的音頻并轉錄,得到第二來電音頻;用于采集語音命令,得到包含所述語音命令和所述第二來電音頻的混合數(shù)據。確定單元11,還用于將所述第二來電音頻確定為所述來電音頻,從所述混合數(shù)據中過濾掉所述第二來電音頻,得到所述語音命令。
[0131]所述電子設備還包括:修正單元14,用于對所述第二來電音頻進行修正。相應的,確定單元11還用于以修正后的第二來電音頻作為新的參考信號以實現(xiàn)從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令
[0132]在本發(fā)明實施例一優(yōu)選實施方式中,修正單兀14具體通過以下任意一種方式對所述第二來電音頻進行修正:
[0133]方式一:所述第一來電音頻發(fā)生變化時,重新執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,以重新獲取所述第二來電音頻;
[0134]方式二:對所述第一來電音頻多次執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,收集歷史記錄,根據所述歷史記錄修正所述數(shù)據模型,以重新獲取所述第二來電音頻;
[0135]方式三:對同一批次的電子設備在出廠前設置預設值,根據所述預設值修正所述數(shù)據模型,以重新獲取所述第二來電音頻。
[0136]在本申請所提供的幾個實施例中,應該理解到,所揭露的設備和方法,可以通過其它的方式實現(xiàn)。以上所描述的設備實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,如:多個單元或組件可以結合,或可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口,設備或單元的間接耦合或通信連接,可以是電性的、機械的或其它形式的。[0137]上述作為分離部件說明的單元可以是、或也可以不是物理上分開的,作為單元顯示的部件可以是、或也可以不是物理單元,即可以位于一個地方,也可以分布到多個網絡單元上;可以根據實際的需要選擇其中的部分或全部單元來實現(xiàn)本實施例方案的目的。
[0138]另外,在本發(fā)明各實施例中的各功能單元可以全部集成在一個處理單元中,也可以是各單元分別單獨作為一個單元,也可以兩個或兩個以上單元集成在一個單元中;上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
[0139]本領域普通技術人員可以理解:實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質包括:移動存儲設備、只讀存儲器(ROM, Read-Only Memory)、隨機存取存儲器(RAM, Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質。
[0140]或者,本發(fā)明上述集成的單元如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質中?;谶@樣的理解,本發(fā)明實施例的技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分可以以軟件產品的形式體現(xiàn)出來,該計算機軟件產品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機、服務器、或者網絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分。而前述的存儲介質包括:移動存儲設備、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM, Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質。
[0141]以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何熟悉本【技術領域】的技術人員在本發(fā)明揭露的技術范圍內,可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內。因此,本發(fā)明的保護范圍應以所述權利要求的保護范圍為準。
【權利要求】
1.一種信息處理方法,所述方法應用于電子設備中,所述電子設備包括聲音采集單元,所述方法包括: 觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應; 通過所述聲音采集單元采集語音命令,得到包含所述語音命令和所述音頻的混合數(shù)據; 確定來電音頻,從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令。
2.根據權利要求1所述的方法,所述確定所述來電音頻,包括:觸發(fā)所述第一指令之前,預先回放本地存儲的第一來電音頻,通過所述聲音采集單元采集經回放后傳輸回所述電子設備的音頻并轉錄,得到第二來電音頻,將所述第二來電音頻確定為所述來電音頻。
3.根據權利要求2所述的方法,由所述第一來電音頻和所述第二來電音頻得到數(shù)據模型,以使得后續(xù)執(zhí)行所述過濾時能根據所述第一來電音頻直接得到所述來電音頻。
4.根據權利要求3所述的方法,所述數(shù)據模型包括以下一種或多種參數(shù)的組合: 包括代表電子設備自身信息的第一干擾參數(shù); 用于代表用戶所在環(huán)境對所述回放及傳輸過程中的損耗影響的第二干擾參數(shù); 用于代表用戶所在環(huán)境的背景音的第三干擾參數(shù)。
5.根據權利要求4所述的方法,所述根據所述第一來電音頻直接得到所述來電音頻,包括: 獲取用于代表用戶所在不同環(huán)境對所述回放及所述傳輸過程中的損耗影響的不同第二干擾參數(shù); 利用所述不同第二干擾參數(shù),根據所述第一來電音頻得到所述來電音頻。
6.根據權利要求2至5任一項所述的方法,所述方法還包括:通過以下任意一種方式對所述第二來電音頻進行修正: 方式一:所述第一來電音頻發(fā)生變化時,重新執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,以重新獲取所述第二來電音頻; 方式二:對所述第一來電音頻多次執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,收集歷史記錄,根據所述歷史記錄修正所述數(shù)據模型,以重新獲取所述第二來電音頻;方式三:對同一批次的電子設備在出廠前設置預設值,根據所述預設值修正所述數(shù)據模型,以重新獲取所述第二來電音頻。
7.根據權利要求2至5任一項所述的方法,所述從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令,包括: 以所述第二來電音頻作為新的參考信號實現(xiàn)所述過濾,以得到所述語音命令。
8.一種電子設備,所述電子設備包括: 觸發(fā)單元,用于觸發(fā)第一指令,所述第一指令用于以包括音頻的方式請求用戶進行響應; 聲音采集單元,用于采集語音命令,得到包含所述語音命令和所述音頻的混合數(shù)據; 確定單元,用于確定來電音頻,從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語音命令。
9.根據權利要求8所述的電子設備,所述確定單元,進一步用于觸發(fā)所述第一指令之前,預先回放本地存儲的第一來電音頻;所述聲音采集單元,進一步用于采集經回放后傳輸回所述電子設備的音頻并轉錄,得到第二來電音頻; 所述確定單元,還用于將所述第二來電音頻確定為所述來電音頻。
10.根據權利要求9所述的電子設備,所述電子設備還包括: 建模單元,用于由所述第一來電音頻和所述第二來電音頻得到數(shù)據模型,以使得后續(xù)執(zhí)行所述過濾時能根據所述第一來電音頻直接得到所述來電音頻。
11.根據權利要求10所述的電子設備,所述數(shù)據模型包括以下一種或多種參數(shù)的組合: 包括代表電子設備自身信息的第一干擾參數(shù); 用于代表用戶所在環(huán)境對所述回放及傳輸過程中的損耗影響的第二干擾參數(shù); 用于代表用戶所在環(huán)境的背景音的第三干擾參數(shù)。
12.根據權利要求11所述的電子設備, 所述確定單元,進一步用于獲取用于代表用戶所在不同環(huán)境對所述回放及所述傳輸過程中的損耗影響的不同第二干擾參數(shù);利用所述不同第二干擾參數(shù),根據所述第一來電音頻得到所述來電音頻。
13.根據權利要求9至12任一項所述的電子設備,所述電子設備還包括: 修正單元,用于通過以下任意一種方式對所述第二來電音頻進行修正: 方式一:所述第一來電音頻發(fā)生變化時,重新執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,以重新獲取所述第二來電音頻; 方式二:對所述第一來電音頻多次執(zhí)行所述回放、經所述回放后傳輸及所述轉錄的過程,收集歷史記錄,根據所述歷史記錄修正所述數(shù)據模型,以重新獲取所述第二來電音頻;方式三:對同一批次的電子設備在出廠前設置預設值,根據所述預設值修正所述數(shù)據模型,以重新獲取所述第二來電音頻。
14.根據權利要求9至12任一項所述的電子設備,所述確定單元,進一步用于以所述第二來電音頻作為新的參考信號以實現(xiàn)從所述混合數(shù)據中過濾掉所述來電音頻,得到所述語首命令。
【文檔編號】G10L15/00GK103929531SQ201410101226
【公開日】2014年7月16日 申請日期:2014年3月18日 優(yōu)先權日:2014年3月18日
【發(fā)明者】陳大銀, 戴海生, 劉倩 申請人:聯(lián)想(北京)有限公司