專利名稱:一種基于語音的提示方法及終端設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音識別領(lǐng)域,尤其涉及一種基于語音的提示方法及終端設(shè)備。
背景技術(shù):
目前對語音的識別技術(shù)的應(yīng)用范圍還比較小,主要是停留在聲控的情況,在電話機、手機、語音記事本、語音智能玩具等中均有應(yīng)用,如在手機中的聲音撥號,聲音打開關(guān)閉文件軟件等對手機的聲控操作。在上述的對語音識別技術(shù)應(yīng)用中,發(fā)明人發(fā)現(xiàn)設(shè)備對于采集的語音信息,直接進行聲音匹配并進行相應(yīng)的控制,還沒有根據(jù)采集的語音來匹配相關(guān)信息來提示用戶的應(yīng)用,因此在語音識別的功能應(yīng)用上,發(fā)展的還不夠完善。
發(fā)明內(nèi)容
本發(fā)明的實施例提供一種基于語音的提示方法及終端設(shè)備,能夠根據(jù)語音信息匹配并顯示提示信息。為達到上述目的,本發(fā)明的實施例采用如下技術(shù)方案一方面,提供一種基于語音的提示方法,包括采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符;用所述標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示所述預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。一方面,提供一種終端設(shè)備,包括語音處理單元,用于采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符;匹配提示單元,用于用所述標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示所述預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。本發(fā)明的實施例提供的基于語音的提示方法及終端設(shè)備,采集語音發(fā)出個體發(fā)出的語音信息后,獲取語音信息對應(yīng)的標(biāo)識符,若該標(biāo)識符與終端設(shè)備中預(yù)先存儲的標(biāo)示符匹配,則輸出預(yù)先存儲的標(biāo)示符對應(yīng)的提示信息,以達到對用戶的提示起到抗忘記的功能, 相對現(xiàn)有技術(shù)中僅對語音進行聲控操作而言,達到了基于語音的信息提示作用,豐富了針對語音的各種人性化應(yīng)用。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實施例提供的基于語音的提示方法流程示意圖;圖2為本發(fā)明另一實施例提供的基于語音的提示方法流程示意圖3為本發(fā)明實施例提供的終端設(shè)備結(jié)構(gòu)示意圖;圖4為本發(fā)明另一實施例提供的終端設(shè)備結(jié)構(gòu)示意圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。本發(fā)明實施例提供的基于語音的提示方法,如圖1所示,包括S101、終端設(shè)備采集語音信息并獲得語音信息對應(yīng)的標(biāo)識符。S102、用該標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。本發(fā)明的實施例提供的基于語音的提示方法,采集語音發(fā)出個體發(fā)出的語音信息后,獲取語音信息對應(yīng)的標(biāo)識符,若該標(biāo)識符與終端設(shè)備中預(yù)先存儲的標(biāo)示符匹配,則輸出預(yù)先存儲的標(biāo)示符對應(yīng)的提示信息,以達到對用戶的提示起到抗忘記的功能,達到了基于語音的信息提示作用,豐富了針對語音的各種人性化應(yīng)用。本發(fā)明另一實施例提供的基于語音的提示方法,以手機作為終端設(shè)備為例進行說明,如圖2所示,包括S201、手機語音處理單元的語音采集子單元采集到來電者A打來電話的語音信息——記為第一語音信息,并將該第一語音信息存儲于手機的存儲單元中。本步驟中,是手機在通話過程中對來電者的語音信息進行采集,此外也可以是在手機處于空閑狀態(tài)時,手機用戶通過語音采集軟件對外界的語音信息有針對性的采集。S202、通過手機語音處理單元的數(shù)字轉(zhuǎn)換子單元將第一語音信息轉(zhuǎn)換為第一語音數(shù)字信號。S203、手機語音處理單元的編碼子單元根據(jù)第一語音數(shù)字信號的音高或音色或音調(diào)提取特征數(shù)據(jù),進行抽象編碼,得到標(biāo)識第一語音數(shù)字信號的唯一的第一標(biāo)識符。這里進行編碼的方式可以采用子帶編碼和統(tǒng)計編碼結(jié)合的方式進行編碼。其中,子帶編碼一般是同波形編碼結(jié)合使用,如G. 722(支持比特率為64,56和481cbpS多頻率語音編碼算法)使用的是 SB-ADPCM(sub-band adaptive difference pulse code modulation,子帶-自適應(yīng)差分脈沖編碼)技術(shù)。但子帶的劃分更多是對頻域系數(shù)的劃分, 這可以更好地利用低頻帶比高頻帶感覺重要的特點,故子帶編碼中,往往先要應(yīng)用某種變換方法得到頻域系數(shù),在G. 722. 1中使用MLTOmilti-Iink trunking,多鏈路聚合)變換, 系數(shù)劃分為 16 個子帶;MPEG (moving pictures experts group/mot in pictures experts group,動態(tài)圖像專家組)伴音中用FFT (fast fourier transformation,快速傅氏變換)或 MDCT (the modified discrete cosine transform改進離散余弦變換)變換,劃分的子帶多達32個。統(tǒng)計編碼在圖像編碼中大量應(yīng)用,但在語音編碼中出于對編碼器整體性能的考慮,如變長編碼易引起誤碼擴散等,很少使用。對存在統(tǒng)計冗余的信號來說,統(tǒng)計編碼確實可以大大提高編碼的效率,所以,近年來出現(xiàn)的音頻編碼算法中,統(tǒng)計編碼又重新得到了重視。MPEG伴音和G. 722. 1建議中采納了哈夫曼變長編碼。
S204、手機的存儲單元存儲該第一標(biāo)識符,手機的配置單元為該第一標(biāo)識符配置提示信息,并將提示信息存儲于存儲單元。這里為第一標(biāo)識符配置的提示信息可以包括文字信息、圖像信息、視頻信息、語音信息中的一種或幾種。具體的,可以將將步驟S201中儲于語音存儲單元的第一語音信息與第一標(biāo)識符相關(guān)聯(lián),作為第一標(biāo)識符對應(yīng)的提示信息。在本實施例中,假設(shè)對應(yīng)第一標(biāo)識符手機存儲配置有該來電者A的姓名、頭像、電話錄音等提示信息。S205、手機語音處理單元的語音采集子單元再次采集到打來電話的來電者A的語音信息——記為第二語音信息。將該第二語音信息存儲于手機的存儲單元中,當(dāng)然,此處存儲第二語音信息不是必須的步驟。S206、手機語音處理單元的數(shù)字轉(zhuǎn)換子單元將第二語音信息轉(zhuǎn)換為第二語音數(shù)字信號。S207、手機語音處理單元的編碼子單元根據(jù)第二語音數(shù)字信號的音高或音色或音調(diào)提取特征數(shù)據(jù),進行抽象編碼,得到標(biāo)識第二語音數(shù)字信號的唯一的第二標(biāo)識符。本步驟 S207的具體編碼過程可以參照步驟S203的說明。需要說明的是,在步驟S205中手機的存儲單元也可以對采集到的第二語音信息進行存儲,該過程與步驟S201相同。S208、手機的存儲單元存儲該第二標(biāo)識符,手機的配置單元為該第二標(biāo)識符存儲配置提示信息,并將提示信息存儲于存儲單元。S209、手機的匹配提示單元用第二標(biāo)識符與已存儲的各個標(biāo)識符相匹配,此時同屬來電者A的第一標(biāo)識符和第二標(biāo)識符匹配成功,手機向用戶提示第一標(biāo)識符對應(yīng)存儲的提示信息。此時,由于預(yù)先為第一標(biāo)識符存儲了來電者A的姓名、頭像、電話錄音,則用戶可以看到該來電者A的姓名信息、頭像圖片,以及聽到該來電者A的電話錄音,方面了用戶的使用。當(dāng)然這里已存儲的標(biāo)識符是包括第一標(biāo)識符的,如果沒有與第二標(biāo)識符相匹配, 即匹配不成功,則相當(dāng)于手機對該第二語音信息執(zhí)行對第一語音信息的處理過程,即重復(fù) S201 S204的過程,這樣便為下次的匹配準(zhǔn)備提示信息。本發(fā)明的實施例提供的基于語音的提示方法,采集語音發(fā)出個體發(fā)出的語音信息后,獲取語音信息對應(yīng)的標(biāo)識符,若該標(biāo)識符與終端設(shè)備中預(yù)先存儲的標(biāo)示符匹配,則輸出預(yù)先存儲的標(biāo)示符對應(yīng)的提示信息,以達到對用戶的提示起到抗忘記的功能,相對現(xiàn)有技術(shù)中僅對語音進行聲控操作而言,達到了基于語音的信息提示作用,豐富了針對語音的各種人性化應(yīng)用。需要說明的是,本實施例中是以手機為例進行的明,但終端設(shè)備不限于此,終端設(shè)備還可以是門禁系統(tǒng),車載系統(tǒng)或其他手持電子設(shè)備等,其具體的功能實現(xiàn)過程與本實施例相同。例如,在門禁系統(tǒng)中當(dāng)語音匹配成功后能夠通過語音的標(biāo)識符來查詢門禁設(shè)備中保存的提示信息,并輸出該提示信息,其中這里的提示信息也可以是用戶在門禁中配置的日常事項備忘錄,用于門禁使用者進行指紋匹配開門的指紋圖像信息等,從而起到在開門的同時還能達到對該門禁使用者的提示作用從而起到抗忘記的功能。
本發(fā)明實施例提供的終端設(shè)備30,對應(yīng)上述方法實施例,且可用于上述方法實施例中,并執(zhí)行上述方法的各個步驟,具體步驟說明參照上述方法實施例。該終端設(shè)備30,如圖3所示,包括語音處理單元31和匹配提示單元32其中語音處理單元,用于采集語音信息并獲得語音信息對應(yīng)的標(biāo)識符。匹配提示單元,用于用標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。本發(fā)明的實施例提供的終端設(shè)備,采集語音發(fā)出個體發(fā)出的語音信息后,獲取語音信息對應(yīng)的標(biāo)識符,若該標(biāo)識符與終端設(shè)備中預(yù)先存儲的標(biāo)示符匹配,則輸出預(yù)先存儲的標(biāo)示符對應(yīng)的提示信息,以達到對用戶的提示起到抗忘記的功能,相對現(xiàn)有技術(shù)中僅對語音進行聲控操作而言,達到了基于語音的信息提示作用,豐富了針對語音的各種人性化應(yīng)用。進一步的,語音處理單元31還包括語音采集子單元311、數(shù)字轉(zhuǎn)換子單元312和編碼子單元313。語音采集子單元311,用于采集語音信息。數(shù)字轉(zhuǎn)換子單元312,用于將語音采集子單元311采集的語音信息轉(zhuǎn)換為語音數(shù)
字信號。編碼子單元313,用于根據(jù)語音數(shù)字信號的音高或音色或音調(diào)提取特征數(shù)據(jù),進行抽象編碼,得到標(biāo)識語音數(shù)字信號的唯一的標(biāo)識符。進一步的,終端設(shè)備30還包括存儲單元33和配置單元;34。存儲單元33,用于存儲標(biāo)識符和標(biāo)識符對應(yīng)的提示信息。配置單元34,用于為存儲單元存儲的標(biāo)識符配置提示信息,并將提示信息存儲于存儲單元。需要說明的是存儲單元33,還用于存儲語音處理單元31采集的語音信息。配置單元34,還用于將存儲單元存儲的語音信息與根據(jù)語音信息得到的標(biāo)識符相關(guān)聯(lián),作為標(biāo)識符的提示信息。具體的,對于手機,語音處理單元31功能可以通過手機的麥克風(fēng)模塊和手機的 CPU模塊處理實現(xiàn),匹配提示單元32的可以通過手機的CPU模塊和手機的顯示模塊或揚聲器模塊配合處理實現(xiàn),存儲單元33的功能可以通過手機的存儲卡完成,配置單元34的功能可以通過手機的輸入模塊與CPU模塊處理實現(xiàn)。其中語音采集子單元311可以為手機的麥克風(fēng)模塊,數(shù)字轉(zhuǎn)換子單元312和編碼子單元313的功能為通過手機的CPU模塊處理實現(xiàn)。本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括R0M、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。以上所述,僅為本發(fā)明的具體實施方式
,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準(zhǔn)。
權(quán)利要求
1.一種基于語音的提示方法,其特征在于,包括 采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符;用所述標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示所述預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符包括采集語音信息,將所述語音信息轉(zhuǎn)換為語音數(shù)字信號;根據(jù)所述語音數(shù)字信號的音高或音色或音調(diào)提取特征數(shù)據(jù),進行抽象編碼,得到標(biāo)識所述語音數(shù)字信號的唯一的標(biāo)識符。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括 存儲所述標(biāo)識符,并為所述標(biāo)識符存儲配置提示信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括存儲采集的語音信息,并將所述語音信息與根據(jù)所述語音信息得到的標(biāo)識符相關(guān)聯(lián), 作為所述標(biāo)識符的提示信息。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提示信息包括文字信息、圖像信息、 視頻信息、語音信息中的一種或幾種。
6.一種終端設(shè)備,其特征在于,包括語音處理單元,用于采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符; 匹配提示單元,用于用所述標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示所述預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。
7.根據(jù)權(quán)利要求6所述的終端設(shè)備,其特征在于,所述語音處理單元包括 語音采集子單元,用于采集語音信息,數(shù)字轉(zhuǎn)換子單元,用于將所述語音采集子單元采集的語音信息轉(zhuǎn)換為語音數(shù)字信號; 編碼子單元,用于根據(jù)所述語音數(shù)字信號的音高或音色或音調(diào)提取特征數(shù)據(jù),進行抽象編碼,得到標(biāo)識所述語音數(shù)字信號的唯一的標(biāo)識符。
8.根據(jù)權(quán)利要求6所述的終端設(shè)備,其特征在于,還包括 存儲單元,用于存儲所述標(biāo)識符和所述標(biāo)識符對應(yīng)的提示信息;配置單元,用于為所述存儲單元存儲的標(biāo)識符配置提示信息,并將所述提示信息存儲于所述存儲單元。
9.根據(jù)權(quán)利要求6所述的終端設(shè)備,其特征在于,所述存儲單元,還用于存儲所述語音處理單元采集的語音信息; 所述配置單元,還用于將所述存儲單元存儲的所述語音信息與根據(jù)所述語音信息得到的標(biāo)識符相關(guān)聯(lián),作為所述標(biāo)識符的提示信息。
10.根據(jù)權(quán)利要求6所述的終端設(shè)備,其特征在于,所述提示信息包括文字信息、圖像信息、視頻信息、語音信息中的一種或幾種。
全文摘要
本發(fā)明實施例提供一種基于語音的提示方法及終端設(shè)備,涉及語音識別領(lǐng)域,能夠根據(jù)語音信息匹配并顯示提示信息。該方法包括采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符;若所述標(biāo)識符與預(yù)先存儲的標(biāo)識符相匹配,則向用戶提示所述預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。本發(fā)明實施例應(yīng)用于語音識別。
文檔編號H04M1/725GK102546940SQ201110448619
公開日2012年7月4日 申請日期2011年12月28日 優(yōu)先權(quán)日2011年12月28日
發(fā)明者楊萌 申請人:華為終端有限公司