語音信號(hào)采集方法和移動(dòng)終端的制作方法
【專利摘要】本發(fā)明提出一種語音信號(hào)采集方法和移動(dòng)終端,其中所述方法包括以下步驟:采集用戶的語音信號(hào),并根據(jù)語音信號(hào)維護(hù)用戶對(duì)應(yīng)的閥值信息;在進(jìn)入語音識(shí)別模式之后,采集用戶輸入的語音輸入信號(hào);以及根據(jù)閥值信息判斷語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn),以對(duì)采集開始點(diǎn)和采集結(jié)束點(diǎn)之間的語音輸入信號(hào)進(jìn)行識(shí)別。根據(jù)本發(fā)明實(shí)施例的方法,通過用戶的語音信號(hào)維護(hù)對(duì)應(yīng)的閾值信息,使得閾值信息隨著用戶、環(huán)境等因素的不同而不同,根據(jù)閾值信息判斷確定的語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn)準(zhǔn)確,能夠準(zhǔn)確劃分有效語音數(shù)據(jù),提高識(shí)別結(jié)果準(zhǔn)確率,減少網(wǎng)絡(luò)傳輸數(shù)據(jù)量,提升用戶體驗(yàn)。
【專利說明】 語音信號(hào)采集方法和移動(dòng)終端
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息處理【技術(shù)領(lǐng)域】,特別涉及一種語音信號(hào)采集方法和移動(dòng)終端。
【背景技術(shù)】
[0002]在語音識(shí)別過程中,客戶端例如移動(dòng)終端需要將采集的語音數(shù)據(jù)上傳到服務(wù)端,由于傳輸?shù)恼Z音數(shù)據(jù)量較大,因此只需選擇性地上傳用戶說話的語音數(shù)據(jù)即有效語音數(shù)據(jù)。目前,可以通過設(shè)置閾值,并判斷語音能量與閾值的大小確定用戶說話的開始點(diǎn)和結(jié)束點(diǎn)以確定用戶說話的語音數(shù)據(jù),例如語音能量小于閥值至語音能量大于閥值,可以確定為開始說話,語音能量大于閥值至語音能量小于閥值且持續(xù)一段時(shí)間狀態(tài)不變,可以確定為結(jié)束說話,開始說話到結(jié)束說話之間產(chǎn)生的語音作即為有效語音數(shù)據(jù)。
[0003]目前存在的問題是,設(shè)置的閥值不通用,容易受到多種因素的影響,不能準(zhǔn)確劃分有效語音數(shù)據(jù),識(shí)別結(jié)果不精確,導(dǎo)致網(wǎng)絡(luò)傳輸量大,用戶體驗(yàn)差,例如受到用戶群體的影響,有人說話聲大,有人說話聲小,又受到客戶端系統(tǒng)的硬性,不同的硬件導(dǎo)致錄音的音量不同,如果閥值設(shè)置太小會(huì)將背景音認(rèn)為有效數(shù)據(jù),影響識(shí)別結(jié)果,如果閥值定義太大,開始說話的時(shí)間點(diǎn)監(jiān)測(cè)不準(zhǔn)確等。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的旨在至少解決所述技術(shù)缺陷之一。
[0005]為此,本發(fā)明的一個(gè)目的在于提出一種語音信號(hào)采集方法,該方法能夠準(zhǔn)確劃分有效語音數(shù)據(jù),提高識(shí)別結(jié)果準(zhǔn)確率,減少網(wǎng)絡(luò)傳輸數(shù)據(jù)量,提升用戶體驗(yàn)。
[0006]本發(fā)明的另一個(gè)目的在于提出一種移動(dòng)終端。
[0007]為達(dá)到所述目的,本發(fā)明第一方面的實(shí)施例公開了一種語音信號(hào)采集方法,包括以下步驟:采集用戶的語音信號(hào),并根據(jù)所述語音信號(hào)維護(hù)所述用戶對(duì)應(yīng)的閥值信息;在進(jìn)入語音識(shí)別模式之后,采集用戶輸入的語音輸入信號(hào);以及根據(jù)所述閥值信息判斷所述語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn),以對(duì)所述采集開始點(diǎn)和所述采集結(jié)束點(diǎn)之間的語音輸入信號(hào)進(jìn)行識(shí)別。
[0008]根據(jù)本發(fā)明實(shí)施例的語音信號(hào)采集方法,通過用戶的語音信號(hào)維護(hù)對(duì)應(yīng)的閾值信息,使得閾值信息隨著用戶、環(huán)境等因素的不同而不同,根據(jù)閾值信息判斷確定的語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn)準(zhǔn)確,能夠準(zhǔn)確劃分有效語音數(shù)據(jù),提高識(shí)別結(jié)果準(zhǔn)確率,減少網(wǎng)絡(luò)傳輸數(shù)據(jù)量,提升用戶體驗(yàn)。
[0009]為達(dá)到所述目的,本發(fā)明第二方面的實(shí)施例公開了一種移動(dòng)終端,包括:維護(hù)模塊,用于采集用戶的語音信號(hào),并根據(jù)所述語音信號(hào)維護(hù)所述用戶對(duì)應(yīng)的閥值信息;采集模塊,用于進(jìn)入語音識(shí)別模式之后,采集用戶輸入的語音輸入信號(hào);以及判斷模塊,用于根據(jù)所述閥值信息判斷所述語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn),以對(duì)所述采集開始點(diǎn)和所述采集結(jié)束點(diǎn)之間的語音輸入信號(hào)進(jìn)行識(shí)別。
[0010]根據(jù)本發(fā)明實(shí)施例的移動(dòng)終端,通過維護(hù)模塊根據(jù)用戶的語音信號(hào)維護(hù)對(duì)應(yīng)的閾值信息,使得閾值信息隨著用戶、環(huán)境等因素的不同而不同,根據(jù)閾值信息判斷確定的語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn)準(zhǔn)確,能夠準(zhǔn)確劃分有效語音數(shù)據(jù),提高識(shí)別結(jié)果準(zhǔn)確率,減少網(wǎng)絡(luò)傳輸數(shù)據(jù)量,提升用戶體驗(yàn)。
[0011]本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
【專利附圖】
【附圖說明】
[0012]本發(fā)明所述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
[0013]圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的語音信號(hào)采集方法的流程圖;
[0014]圖2為根據(jù)本發(fā)明又一個(gè)實(shí)施例的信息推送方法的流程圖;
[0015]圖3為根據(jù)本發(fā)明一個(gè)具體實(shí)施例的信息推送方法的流程圖;
[0016]圖4為根據(jù)本發(fā)明又一個(gè)具體實(shí)施例的信息推送方法的流程圖;
[0017]圖5為根據(jù)本發(fā)明一個(gè)實(shí)施例的移動(dòng)終端的結(jié)構(gòu)示意圖;
[0018]圖6為根據(jù)本發(fā)明又一個(gè)實(shí)施例的移動(dòng)終端的結(jié)構(gòu)示意圖;
[0019]圖7為根據(jù)本發(fā)明一個(gè)具體實(shí)施例的移動(dòng)終端的結(jié)構(gòu)示意圖;以及
[0020]圖8為根據(jù)本發(fā)明又一個(gè)具體實(shí)施例的移動(dòng)終端的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0021]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對(duì)本發(fā)明的限制。相反,本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
[0022]在本發(fā)明的描述中,需要理解的是,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性。此外,在本發(fā)明的描述中,除非另有說明,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。
[0023]流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬【技術(shù)領(lǐng)域】的技術(shù)人員所理解。
[0024]下面參考附圖描述根據(jù)本發(fā)明實(shí)施例的語音信號(hào)采集方法和移動(dòng)終端。
[0025]由于判斷語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn)的所需的閾值因?yàn)橛脩籼匦?、硬件設(shè)備以及環(huán)境等因素的影響無法唯一確定,因此需要?jiǎng)討B(tài)調(diào)整閾值,為此一種語音信號(hào)采集方法,包括以下步驟:采集用戶的語音信號(hào),并根據(jù)語音信號(hào)維護(hù)用戶對(duì)應(yīng)的閥值信息;在進(jìn)入語音識(shí)別模式之后,采集用戶輸入的語音輸入信號(hào);以及根據(jù)閥值信息判斷語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn),以對(duì)采集開始點(diǎn)和采集結(jié)束點(diǎn)之間的語音輸入信號(hào)進(jìn)行識(shí)別。[0026]圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的語音信號(hào)采集方法的流程圖。
[0027]如圖1所示,根據(jù)本發(fā)明實(shí)施例的語音信號(hào)采集方法包括下述步驟。
[0028]步驟S101,采集用戶的語音信號(hào),并根據(jù)語音信號(hào)維護(hù)用戶對(duì)應(yīng)的閥值信息。
[0029]具體地,首先在初始時(shí)設(shè)置基本閾值信息,然后采集用戶的語音信息對(duì)基本閾值信息進(jìn)行維護(hù),例如,可在用戶打電話時(shí)采集用戶的語音信號(hào),計(jì)算所采集的語音信號(hào)的平均能量值及背景語音能量值,從而更新基本閾值信息獲得具有該用戶個(gè)性的閥值信息,由此使得不同的用戶對(duì)應(yīng)不同的閥值信息。
[0030]步驟S102,在進(jìn)入語音識(shí)別模式之后,采集用戶輸入的語音輸入信號(hào)。
[0031]步驟S103,根據(jù)閥值信息判斷語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn),以對(duì)采集開始點(diǎn)和采集結(jié)束點(diǎn)之間的語音輸入信號(hào)進(jìn)行識(shí)別。
[0032]具體地,首先獲取語音輸入信號(hào)的能量值,能量值反映語音數(shù)據(jù)的自身特征,如聲音大小、高低等,并將能量值與閾值信息進(jìn)行比較以確定采集開始點(diǎn)和采集結(jié)束點(diǎn)。例如,將語音輸入信號(hào)的能量值由小于閥值狀態(tài)變?yōu)榇笥陂y值狀態(tài)的點(diǎn)記為采集開始點(diǎn),語音輸入信號(hào)的能量值由大于閥值狀態(tài)變?yōu)樾∮陂y值狀態(tài)的點(diǎn)記為采集結(jié)束點(diǎn)。
[0033]根據(jù)本發(fā)明實(shí)施例的語音信號(hào)采集方法,通過用戶的語音信號(hào)維護(hù)對(duì)應(yīng)的閾值信息,使得閾值信息隨著用戶、環(huán)境等因素的不同而不同,根據(jù)閾值信息判斷確定的語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn)準(zhǔn)確,能夠準(zhǔn)確劃分有效語音數(shù)據(jù),提高識(shí)別結(jié)果準(zhǔn)確率,減少網(wǎng)絡(luò)傳輸數(shù)據(jù)量,提升用戶體驗(yàn)。
[0034]圖2為根據(jù)本發(fā)明又一個(gè)實(shí)施例的語音信號(hào)采集方法的流程圖。
[0035]如圖2所示,根據(jù)本發(fā)明實(shí)施例的語音信號(hào)采集方法包括下述步驟。
[0036]步驟S201,采集用戶的語音信號(hào),并根據(jù)語音信號(hào)維護(hù)用戶對(duì)應(yīng)的閥值信息。
[0037]具體地,首先在初始時(shí)設(shè)置基本閾值信息,然后采集用戶的語音信息對(duì)基本閾值信息進(jìn)行維護(hù)。
[0038]步驟S202,對(duì)語音信號(hào)進(jìn)行分析以獲得用戶的聲紋信息,并建立聲紋信息與閥值信息之間的對(duì)應(yīng)關(guān)系。
[0039]其中,聲紋信息具有特定性且相對(duì)穩(wěn)定,每個(gè)用戶對(duì)應(yīng)的聲紋信息是不變的,根據(jù)聲紋信息與閾值信息建立對(duì)應(yīng)關(guān)系,可以區(qū)分不同的用戶。
[0040]步驟S203,在進(jìn)入語音識(shí)別模式之后,采集用戶輸入的語音輸入信號(hào)。
[0041]步驟S204,在采集語音輸入信號(hào)之后,根據(jù)語音輸入信號(hào)獲得對(duì)應(yīng)的聲紋信息。
[0042]步驟S205,根據(jù)語音輸入信號(hào)對(duì)應(yīng)的聲紋信息查找對(duì)應(yīng)的閥值信息。
[0043]步驟S206,根據(jù)閥值信息判斷語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn),以對(duì)采集開始點(diǎn)和采集結(jié)束點(diǎn)之間的語音輸入信號(hào)進(jìn)行識(shí)別。
[0044]具體地,首先獲取語音輸入信號(hào)的能量值,能量值反映語音數(shù)據(jù)的自身特征,如聲音大小、高低等,并將能量值與閾值信息進(jìn)行比較以確定采集開始點(diǎn)和采集結(jié)束點(diǎn)。例如,將語音輸入信號(hào)的能量值由小于閥值狀態(tài)變?yōu)榇笥陂y值狀態(tài)的點(diǎn)記為采集開始點(diǎn),語音輸入信號(hào)的能量值由大于閥值狀態(tài)變?yōu)樾∮陂y值狀態(tài)的點(diǎn)記為采集結(jié)束點(diǎn)。
[0045]根據(jù)本發(fā)明實(shí)施例的語音信號(hào)采集方法,根據(jù)語音輸入信號(hào)的聲紋信息確定對(duì)應(yīng)的閥值信息以確定采集開始點(diǎn)和采集結(jié)束點(diǎn),由于聲紋信息具有特定性,可以區(qū)分不同用戶的語音輸入信號(hào),有效語音數(shù)據(jù)劃分更準(zhǔn)確,識(shí)別結(jié)果準(zhǔn)確率更高。[0046]由于閥值信息可以是絕對(duì)閥值信息或者相對(duì)閥值信息,因此在根據(jù)閥值信息判斷所述語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn)的過程不同,下面結(jié)合圖3和圖4分別說明在不同閾值信息時(shí)采集開始點(diǎn)和采集結(jié)束點(diǎn)的確定過程,應(yīng)當(dāng)理解,圖3和圖4所述的實(shí)施例可以分別實(shí)施,也可同時(shí)存在,用戶可以擇一實(shí)施。
[0047]圖3為根據(jù)本發(fā)明一個(gè)具體實(shí)施例的語音信號(hào)采集方法的流程圖。
[0048]如圖3所示,根據(jù)本發(fā)明實(shí)施例的語音信號(hào)采集方法包括下述步驟。
[0049]步驟S301,采集用戶的語音信號(hào),并根據(jù)語音信號(hào)維護(hù)用戶對(duì)應(yīng)的閥值信息。
[0050]具體地,首先在初始時(shí)設(shè)置基本閾值信息,然后采集用戶的語音信息對(duì)基本閾值信息進(jìn)行維護(hù)。
[0051]在本發(fā)明的一個(gè)實(shí)施例中,閥值信息為絕對(duì)閥值信息,絕對(duì)閥值信息為用戶的語音信號(hào)的平均能量值。
[0052]步驟S302,對(duì)語音信號(hào)進(jìn)行分析以獲得用戶的聲紋信息,并建立聲紋信息與閥值信息之間的對(duì)應(yīng)關(guān)系。
[0053]其中,聲紋信息具有特定性且相對(duì)穩(wěn)定,每個(gè)用戶對(duì)應(yīng)的聲紋信息是不變的,根據(jù)聲紋信息與閾值信息建立對(duì)應(yīng)關(guān)系,可以區(qū)分不同的用戶。
[0054]步驟S303,在進(jìn)入語音識(shí)別模式之后,采集用戶輸入的語音輸入信號(hào)。
[0055]步驟S304,在采集語音輸入信號(hào)之后,根據(jù)語音輸入信號(hào)獲得對(duì)應(yīng)的聲紋信息。
[0056]步驟S305,根據(jù)語音輸入信號(hào)對(duì)應(yīng)的聲紋信息查找對(duì)應(yīng)的閥值信息。
[0057]步驟S306,對(duì)語音輸入信號(hào)進(jìn)行采樣,并計(jì)算每個(gè)采樣點(diǎn)的能量值。
[0058]步驟S307,如果采樣點(diǎn)且后續(xù)采樣點(diǎn)的能量值大于絕對(duì)閥值信息,且判斷采樣點(diǎn)為采集開始點(diǎn),并且在采集開始點(diǎn)之后如果采樣點(diǎn)且后續(xù)采樣點(diǎn)的能量值小于絕對(duì)閥值信息,且判斷采樣點(diǎn)為采集結(jié)束點(diǎn)。
[0059]在本發(fā)明的一個(gè)實(shí)施例中,步驟S302、步驟S304和步驟S305是可選的。
[0060]根據(jù)本發(fā)明實(shí)施例的語音信號(hào)采集方法,可以實(shí)現(xiàn)通過絕對(duì)閥值信息確定采集開始點(diǎn)和結(jié)束點(diǎn),判斷過程簡(jiǎn)單快捷,使有效語音數(shù)據(jù)劃分更準(zhǔn)確,識(shí)別結(jié)果準(zhǔn)確率更高。
[0061]圖4為根據(jù)本發(fā)明又一個(gè)具體實(shí)施例的語音信號(hào)采集方法的流程圖。
[0062]如圖4所示,根據(jù)本發(fā)明實(shí)施例的語音信號(hào)采集方法包括下述步驟。
[0063]步驟S401,采集用戶的語音信號(hào),并根據(jù)語音信號(hào)維護(hù)用戶對(duì)應(yīng)的閥值信息。
[0064]具體地,首先在初始時(shí)設(shè)置基本閾值信息,然后采集用戶的語音信息對(duì)基本閾值信息進(jìn)行維護(hù)。
[0065]在本發(fā)明的一個(gè)實(shí)施例中,閥值信息為相對(duì)閥值信息,相對(duì)閥值信息為用戶的語音信號(hào)的平均能量值與背景語音能量值之差。
[0066]步驟S402,對(duì)語音信號(hào)進(jìn)行分析以獲得用戶的聲紋信息,并建立聲紋信息與閥值信息之間的對(duì)應(yīng)關(guān)系。
[0067]其中,聲紋信息具有特定性且相對(duì)穩(wěn)定,每個(gè)用戶對(duì)應(yīng)的聲紋信息是不變的,根據(jù)聲紋信息與閾值信息建立對(duì)應(yīng)關(guān)系,可以區(qū)分不同的用戶。
[0068]步驟S403,在進(jìn)入語音識(shí)別模式之后,采集用戶輸入的語音輸入信號(hào)。
[0069]步驟S404,在采集語音輸入信號(hào)之后,根據(jù)語音輸入信號(hào)獲得對(duì)應(yīng)的聲紋信息。
[0070]步驟S405,根據(jù)語音輸入信號(hào)對(duì)應(yīng)的聲紋信息查找對(duì)應(yīng)的閥值信息。[0071]步驟S406,對(duì)語音輸入信號(hào)進(jìn)行采樣,并計(jì)算每個(gè)采樣點(diǎn)的能量值。
[0072]步驟S407,計(jì)算采樣點(diǎn)與相鄰后續(xù)采樣點(diǎn)之間的能量值之差。
[0073]步驟S408,如果相鄰采樣點(diǎn)與相鄰后續(xù)采樣點(diǎn)之間的能量值之差大于相對(duì)閥值信息,則判斷采樣點(diǎn)為采集開始點(diǎn)或采集結(jié)束點(diǎn)。
[0074]在本發(fā)明的一個(gè)實(shí)施例中,步驟S402、步驟S404和步驟S405是可選的。
[0075]根據(jù)本發(fā)明實(shí)施例的語音信號(hào)采集方法,通過相對(duì)閥值信息確定采集開始點(diǎn)和結(jié)束點(diǎn),可以消除了背景聲音的影響,減少誤差,使有效語音數(shù)據(jù)劃分更準(zhǔn)確,識(shí)別結(jié)果準(zhǔn)確
率更高。
[0076]為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種移動(dòng)終端。
[0077]一種移動(dòng)終端,包括:維護(hù)模塊,用于采集用戶的語音信號(hào),并根據(jù)語音信號(hào)維護(hù)用戶對(duì)應(yīng)的閥值信息;采集模塊,用于進(jìn)入語音識(shí)別模式后,采集用戶輸入的語音輸入信號(hào);以及判斷模塊,用于根據(jù)閥值信息判斷語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn),以對(duì)采集開始點(diǎn)和采集結(jié)束點(diǎn)之間的語音輸入信號(hào)進(jìn)行識(shí)別。
[0078]圖5為根據(jù)本發(fā)明一個(gè)實(shí)施例的移動(dòng)終端的結(jié)構(gòu)示意圖。
[0079]如圖5所示,根據(jù)本發(fā)明實(shí)施例的移動(dòng)終端包括:維護(hù)模塊100、采集模塊200和判斷模塊300。
[0080]具體地,維護(hù)模塊100用于采集用戶的語音信號(hào),并根據(jù)語音信號(hào)維護(hù)用戶對(duì)應(yīng)的閥值信息。更具體地,首先在初始時(shí)設(shè)置基本閾值信息,然后維護(hù)模塊100采集用戶的語音信息對(duì)基本閾值信息進(jìn)行維護(hù),例如,可在用戶打電話時(shí)采集用戶的語音信號(hào),計(jì)算所采集的語音信號(hào)的平均能量值及背景語音能量值,從而更新基本閾值信息獲得具有該用戶個(gè)性的閥值信息,由此使得不同的用戶對(duì)應(yīng)不同的閥值信息。
[0081]采集模塊200用于進(jìn)入語音識(shí)別模式后,采集用戶輸入的語音輸入信號(hào)。
[0082]判斷模塊300用于根據(jù)閥值信息判斷語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn),以對(duì)采集開始點(diǎn)和采集結(jié)束點(diǎn)之間的語音輸入信號(hào)進(jìn)行識(shí)別。更具體地,判斷模塊300首先獲取語音輸入信號(hào)的能量值,能量值反映語音數(shù)據(jù)的自身特征,如聲音大小、高低等,并將能量值與閾值信息進(jìn)行比較以確定采集開始點(diǎn)和采集結(jié)束點(diǎn),例如,將語音輸入信號(hào)的能量值由小于閥值狀態(tài)變?yōu)榇笥陂y值狀態(tài)的點(diǎn)記為采集開始點(diǎn),語音輸入信號(hào)的能量值由大于閥值狀態(tài)變?yōu)樾∮陂y值狀態(tài)的點(diǎn)記為采集結(jié)束點(diǎn)。
[0083]根據(jù)本發(fā)明實(shí)施例的移動(dòng)終端,通過維護(hù)模塊根據(jù)用戶的語音信號(hào)維護(hù)對(duì)應(yīng)的閾值信息,使得閾值信息隨著用戶、環(huán)境等因素的不同而不同,根據(jù)閾值信息判斷確定的語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn)準(zhǔn)確,能夠準(zhǔn)確劃分有效語音數(shù)據(jù),提高識(shí)別結(jié)果準(zhǔn)確率,減少網(wǎng)絡(luò)傳輸數(shù)據(jù)量,提升用戶體驗(yàn)。
[0084]圖6為根據(jù)本發(fā)明又一個(gè)實(shí)施例的移動(dòng)終端的結(jié)構(gòu)示意圖。
[0085]如圖6所示,在圖5所示的基礎(chǔ)上根據(jù)本發(fā)明實(shí)施例的移動(dòng)終端還包括:第一獲取模塊400、第二獲取模塊500和查找模塊600。
[0086]具體地,第一獲取模塊400用于在采集語音信號(hào)后對(duì)語音信號(hào)進(jìn)行分析以獲得用戶的聲紋信息,并建立聲紋信息與閥值信息之間的對(duì)應(yīng)關(guān)系。其中,聲紋信息具有特定性且相對(duì)穩(wěn)定,每個(gè)用戶對(duì)應(yīng)的聲紋信息是不變的,根據(jù)聲紋信息與閾值信息建立對(duì)應(yīng)關(guān)系,可以區(qū)分不同的用戶。[0087]第二獲取模塊500用于在采集語音輸入信號(hào)之后,根據(jù)語音輸入信號(hào)獲得對(duì)應(yīng)的聲紋信息。
[0088]查找模塊600用于根據(jù)語音輸入信號(hào)對(duì)應(yīng)的聲紋信息查找對(duì)應(yīng)的閥值信息。
[0089]根據(jù)本發(fā)明實(shí)施例的移動(dòng)終端,通過第一獲取模塊和第二獲取模塊可以根據(jù)語音輸入信號(hào)的聲紋信息確定對(duì)應(yīng)的閥值信息以確定采集開始點(diǎn)和采集結(jié)束點(diǎn),由于聲紋信息具有特定性,可以區(qū)分不同用戶的語音輸入信號(hào),有效語音數(shù)據(jù)劃分更準(zhǔn)確,識(shí)別結(jié)果準(zhǔn)確
率更高。
[0090]在本發(fā)明的一個(gè)實(shí)施例中,閥值信息為絕對(duì)閥值信息,絕對(duì)閥值信息為用戶的語音信號(hào)的平均能量值。
[0091]在本發(fā)明的一個(gè)實(shí)施例中,閥值信息為相對(duì)閥值信息,相對(duì)閥值信息為用戶的語音信號(hào)的平均能量值與背景語音能量值之差。
[0092]由于閥值信息可以是絕對(duì)閥值信息或者相對(duì)閥值信息,因此判斷模塊300在根據(jù)閥值信息判斷所述語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn)的過程不同,下面結(jié)合圖7和圖8分別說明判斷模塊300在不同閾值信息時(shí)采集開始點(diǎn)和采集結(jié)束點(diǎn)的確定過程。
[0093]圖7為根據(jù)本發(fā)明一個(gè)具體實(shí)施例的移動(dòng)終端的結(jié)構(gòu)示意圖。
[0094]如圖7所示,當(dāng)閥值信息可以是絕對(duì)閥值信息時(shí),在圖6所示的基礎(chǔ)上根據(jù)本發(fā)明實(shí)施例的移動(dòng)終端的判斷模塊300還包括:計(jì)算單元310和判斷單元320。
[0095]具體地,計(jì)算單元310用于對(duì)語音輸入信號(hào)進(jìn)行采樣,并計(jì)算每個(gè)采樣點(diǎn)的能量值。判斷單元320用于當(dāng)采樣點(diǎn)且后續(xù)采樣點(diǎn)的能量值大于絕對(duì)閥值信息時(shí),判斷采樣點(diǎn)為采集開始點(diǎn),并且當(dāng)采集開始點(diǎn)之后如果采樣點(diǎn)且后續(xù)采樣點(diǎn)的能量值小于絕對(duì)閥值信息時(shí),判斷采樣點(diǎn)為采集結(jié)束點(diǎn)。
[0096]根據(jù)本發(fā)明實(shí)施例的移動(dòng)終端,可以實(shí)現(xiàn)通過絕對(duì)閥值信息確定采集開始點(diǎn)和結(jié)束點(diǎn),判斷過程簡(jiǎn)單快捷,使有效語音數(shù)據(jù)劃分更準(zhǔn)確,識(shí)別結(jié)果準(zhǔn)確率更高。
[0097]圖8為根據(jù)本發(fā)明又一個(gè)具體實(shí)施例的移動(dòng)終端的結(jié)構(gòu)示意圖。
[0098]如圖8所示,當(dāng)閥值信息可以是相對(duì)閥值信息時(shí),在圖6所示的基礎(chǔ)上根據(jù)本發(fā)明實(shí)施例的移動(dòng)終端的判斷模塊300還包括:第一計(jì)算單元330、第二計(jì)算單元340和判斷單元 350。
[0099]具體地,第一計(jì)算單元330用于對(duì)語音輸入信號(hào)進(jìn)行采樣,并計(jì)算每個(gè)采樣點(diǎn)的能量值。第二計(jì)算單元340用于計(jì)算采樣點(diǎn)與相鄰后續(xù)采樣點(diǎn)之間的能量值之差。判斷單元350用于當(dāng)相鄰采樣點(diǎn)與相鄰后續(xù)采樣點(diǎn)之間的能量值之差大于相對(duì)閥值信息時(shí),判斷采樣點(diǎn)為采集開始點(diǎn)或采集結(jié)束點(diǎn)。
[0100]根據(jù)本發(fā)明實(shí)施例的移動(dòng)終端,通過相對(duì)閥值信息確定采集開始點(diǎn)和結(jié)束點(diǎn),可以消除了背景聲音的影響,減少誤差,使有效語音數(shù)據(jù)劃分更準(zhǔn)確,識(shí)別結(jié)果準(zhǔn)確率更高。
[0101]應(yīng)當(dāng)理解,在本發(fā)明的實(shí)施例中,移動(dòng)終端可以是手機(jī)、平板電腦、個(gè)人數(shù)字助理、電子書等具有各種操作系統(tǒng)的硬件設(shè)備。
[0102]應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場(chǎng)可編程門陣列(FPGA)等。
[0103]在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)所述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
[0104]盡管已經(jīng)示出和描述了本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以理解在不脫離本發(fā)明的原理和精神的情況下可以對(duì)這些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由所附權(quán)利要求及其等同限定。
【權(quán)利要求】
1.一種語音信號(hào)采集方法,其特征在于,包括以下步驟: 采集用戶的語音信號(hào),并根據(jù)所述語音信號(hào)維護(hù)所述用戶對(duì)應(yīng)的閥值信息; 在進(jìn)入語音識(shí)別模式之后,采集用戶輸入的語音輸入信號(hào);以及根據(jù)所述閥值信息判斷所述語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn),以對(duì)所述采集開始點(diǎn)和所述采集結(jié)束點(diǎn)之間的語音輸入信號(hào)進(jìn)行識(shí)別。
2.如權(quán)利要求1所述的語音信號(hào)采集方法,其特征在于,還包括: 對(duì)所述語音信號(hào)進(jìn)行分析以獲得所述用戶的聲紋信息,并建立所述聲紋信息與所述閥值信息之間的對(duì)應(yīng)關(guān)系; 在采集所述語音輸入信號(hào)之后,根據(jù)所述語音輸入信號(hào)獲得對(duì)應(yīng)的聲紋信息;以及 根據(jù)所述語音輸入信號(hào)對(duì)應(yīng)的聲紋信息查找對(duì)應(yīng)的閥值信息。
3.如權(quán)利要求1或2所述的語音信號(hào)采集方法,其特征在于,所述閥值信息為絕對(duì)閥值信息,所述絕對(duì)閥值信息為所述用戶的語音信號(hào)的平均能量值。
4.如權(quán)利要求3所述的語音信號(hào)采集方法,其特征在于,所述根據(jù)閥值信息判斷所述語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn)進(jìn)一步包括: 對(duì)所述語音輸入信號(hào)進(jìn)行采樣,并計(jì)算每個(gè)采樣點(diǎn)的能量值; 如果采樣點(diǎn)且后續(xù)采樣點(diǎn)的能量值大于所述絕對(duì)閥值信息,且判斷所述采樣點(diǎn)為采集開始點(diǎn),并且在所述采集開始點(diǎn)之后如果采樣點(diǎn)且后續(xù)采樣點(diǎn)的能量值小于所述絕對(duì)閥值信息,且判斷所述采樣點(diǎn)為采集結(jié)束點(diǎn)。
5.如權(quán)利要求1-4任一項(xiàng)所述的語音信號(hào)采集方法,其特征在于,所述閥值信息為相對(duì)閥值信息,所述相對(duì)閥值信息為所述用戶的語音信號(hào)的平均能量值與背景語音能量值之差。`
6.如權(quán)利要求5所述的語音信號(hào)采集方法,其特征在于,所述根據(jù)閥值信息判斷所述語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn)進(jìn)一步包括: 對(duì)所述語音輸入信號(hào)進(jìn)行采樣,并計(jì)算每個(gè)采樣點(diǎn)的能量值; 計(jì)算采樣點(diǎn)與相鄰后續(xù)采樣點(diǎn)之間的能量值之差; 如果所述相鄰采樣點(diǎn)與相鄰后續(xù)采樣點(diǎn)之間的能量值之差大于所述相對(duì)閥值信息,則判斷所述采樣點(diǎn)為采集開始點(diǎn)或采集結(jié)束點(diǎn)。
7.一種移動(dòng)終端,其特征在于,包括: 維護(hù)模塊,用于采集用戶的語音信號(hào),并根據(jù)所述語音信號(hào)維護(hù)所述用戶對(duì)應(yīng)的閥值信息; 采集模塊,用于進(jìn)入語音識(shí)別模式之后,采集用戶輸入的語音輸入信號(hào);以及判斷模塊,用于根據(jù)所述閥值信息判斷所述語音輸入信號(hào)中的采集開始點(diǎn)和采集結(jié)束點(diǎn),以對(duì)所述采集開始點(diǎn)和所述采集結(jié)束點(diǎn)之間的語音輸入信號(hào)進(jìn)行識(shí)別。
8.如權(quán)利要求7所述的移動(dòng)終端,其特征在于,還包括: 第一獲取模塊,用于對(duì)所述語音信號(hào)進(jìn)行分析以獲得所述用戶的聲紋信息,并建立所述聲紋信息與所述閥值信息之間的對(duì)應(yīng)關(guān)系; 第二獲取模塊,用于在采集所述語音輸入信號(hào)之后,根據(jù)所述語音輸入信號(hào)獲得對(duì)應(yīng)的聲紋信息;以及 查找模塊,用于根據(jù)所述語音輸入信號(hào)對(duì)應(yīng)的聲紋信息查找對(duì)應(yīng)的閥值信息。
9.如權(quán)利要求7或8所述的移動(dòng)終端,其特征在于,所述閥值信息為絕對(duì)閥值信息,所述絕對(duì)閥值信息為所述用戶的語音信號(hào)的平均能量值。
10.如權(quán)利要求9所述的移動(dòng)終端,其特征在于,所述判斷模塊進(jìn)一步包括: 計(jì)算單元,用于對(duì)所述語音輸入信號(hào)進(jìn)行采樣,并計(jì)算每個(gè)采樣點(diǎn)的能量值;以及 判斷單元,用于在采樣點(diǎn)且后續(xù)采樣點(diǎn)的能量值大于所述絕對(duì)閥值信息時(shí),判斷所述采樣點(diǎn)為采集開始點(diǎn),并且所述采集開始點(diǎn)之后,在采樣點(diǎn)且后續(xù)采樣點(diǎn)的能量值小于所述絕對(duì)閥值信息時(shí),判斷所述采樣點(diǎn)為采集結(jié)束點(diǎn)。
11.如權(quán)利要求7-10所述的移動(dòng)終端,其特征在于,所述閥值信息為相對(duì)閥值信息,所述相對(duì)閥值信息為所述用戶的語音信號(hào)的平均能量值與背景語音能量值之差。
12.如權(quán)利要求11所述的移動(dòng)終端,其特征在于,所述判斷模塊進(jìn)一步包括: 第一計(jì)算單元,用于對(duì)所述語音輸入信號(hào)進(jìn)行采樣,并計(jì)算每個(gè)采樣點(diǎn)的能量值; 第二計(jì)算單元,用于計(jì)算采樣點(diǎn)與相鄰后續(xù)采樣點(diǎn)之間的能量值之差; 判斷單元,用于在所述相鄰采樣點(diǎn)與相鄰后續(xù)采樣點(diǎn)之間的能量值之差大于所述相對(duì)閥值信息時(shí) ,判斷所述采樣點(diǎn)為采集開始點(diǎn)或采集結(jié)束點(diǎn)。
【文檔編號(hào)】G10L15/30GK103730118SQ201210385081
【公開日】2014年4月16日 申請(qǐng)日期:2012年10月11日 優(yōu)先權(quán)日:2012年10月11日
【發(fā)明者】劉俊啟 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司