本發(fā)明涉及移動(dòng)終端技術(shù)領(lǐng)域,尤其涉及一種語音消息的處理方法及移動(dòng)終端。
背景技術(shù):
目前,智能手機(jī)、平板電腦等移動(dòng)終端上不僅設(shè)置有基本的打電話功能,而且還具備即時(shí)聊天功能,通常,在移動(dòng)終端上安裝即時(shí)聊天應(yīng)用軟件來發(fā)送和接收文字和/或語音消息。當(dāng)用戶處于會議室、教室、圖書館等安靜環(huán)境中,移動(dòng)終端的即時(shí)聊天應(yīng)用軟件接收到語音消息時(shí),在未攜帶耳機(jī)的情況下,如果通過放外音去收聽語音消息,將會打擾到他人;如果不去收聽語音消息,將可能錯(cuò)過一些重要信息。因此,在不方便收聽語音消息的環(huán)境下,如何使用戶快速理解語音消息的內(nèi)容是亟需解決的問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例公開了一種語音消息的處理方法及移動(dòng)終端,能夠自動(dòng)提取語音消息中的關(guān)鍵信息,使用戶在不方便收聽語音消息的環(huán)境下快速理解語音消息的內(nèi)容。
本發(fā)明實(shí)施例第一方面公開一種語音消息的處理方法,包括:
檢測移動(dòng)終端是否接收到語音消息;
如果所述移動(dòng)終端接收到語音消息,提取所述語音消息中的關(guān)鍵信息;
按照預(yù)設(shè)方式將所述關(guān)鍵信息以文字的形式進(jìn)行顯示。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第一方面中,在檢測移動(dòng)終端是否接收到語音消息之前,所述方法還包括:
檢測所述移動(dòng)終端當(dāng)前是否處于預(yù)設(shè)操作模式,所述預(yù)設(shè)操作模式用于觸發(fā)所述移動(dòng)終端在接收到語音消息時(shí)提取關(guān)鍵信息;
如果所述移動(dòng)終端處于所述預(yù)設(shè)操作模式,則執(zhí)行所述的檢測移動(dòng)終端是否接收到語音消息的步驟。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第一方面中,所述提取所述語音消息中的關(guān)鍵信息之前,所述方法還包括:
對所述語音消息進(jìn)行預(yù)處理,以獲得預(yù)處理后的語音消息;
將所述預(yù)處理后的語音消息進(jìn)行語音分割,以得到至少一段語音子消息;
其中,所述提取所述語音消息中的關(guān)鍵信息,包括:
識別所述至少一段語音子消息,并濾除無效信息;
從濾除后的至少一段語音子消息中提取關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第一方面中,所述識別所述至少一段語音子消息,并濾除無效信息,包括:
將所述至少一段語音子消息與第一預(yù)設(shè)語音模型進(jìn)行匹配,識別出所述至少一段語音子消息包含的內(nèi)容;
將所述至少一段語音子消息與第二預(yù)設(shè)語音模型進(jìn)行匹配,刪除與所述第二預(yù)設(shè)語音模型相匹配的無效信息;
所述從濾除后的至少一段語音子消息中提取關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合,包括:
將濾除后的至少一段語音子消息與第三預(yù)設(shè)語音模型進(jìn)行匹配,從中提取與所述第三預(yù)設(shè)語音模型相匹配的關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第一方面中,所述方法還包括:
當(dāng)所述至少一段語音子消息中存在內(nèi)容與所述第一預(yù)設(shè)語音模型進(jìn)行匹配的匹配率低于預(yù)設(shè)值時(shí),將該內(nèi)容增加標(biāo)注;
其中,所述按照預(yù)設(shè)方式將所述關(guān)鍵信息以文字的形式進(jìn)行顯示,包括:
當(dāng)所述關(guān)鍵信息中包含帶有標(biāo)注的內(nèi)容時(shí),按照預(yù)設(shè)方式顯示未帶有標(biāo)注的關(guān)鍵信息和帶有標(biāo)注的關(guān)鍵信息。
本發(fā)明實(shí)施例第二方面公開一種移動(dòng)終端,包括:
第一檢測單元,用于檢測移動(dòng)終端是否接收到語音消息;
提取單元,用于在所述第一檢測單元檢測出所述移動(dòng)終端接收到語音消息時(shí),提取所述語音消息中的關(guān)鍵信息;
顯示單元,用于按照預(yù)設(shè)方式將所述關(guān)鍵信息以文字的形式進(jìn)行顯示。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第二方面中,所述移動(dòng)終端還包括:
第二檢測單元,用于在所述第一檢測單元檢測移動(dòng)終端是否接收到語音消息之前,檢測所述移動(dòng)終端當(dāng)前是否處于預(yù)設(shè)操作模式,所述預(yù)設(shè)操作模式用于觸發(fā)所述移動(dòng)終端在接收到語音消息時(shí)提取關(guān)鍵信息;
所述第一檢測單元具體用于在所述第二檢測單元檢測出所述移動(dòng)終端處于所述預(yù)設(shè)操作模式時(shí),檢測移動(dòng)終端是否接收到語音消息。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第二方面中,所述移動(dòng)終端還包括:
預(yù)處理單元,用于對所述語音消息進(jìn)行預(yù)處理,以獲得預(yù)處理后的語音消息;
語音分割單元,用于將所述預(yù)處理后的語音消息進(jìn)行語音分割,以得到至少一段語音子消息;
所述提取單元包括:
語音識別子單元,用于識別所述至少一段語音子消息,并濾除無效信息;
信息提取子單元,用于從濾除后的至少一段語音子消息中提取關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第二方面中,所述語音識別子單元具體用于將所述至少一段語音子消息與第一預(yù)設(shè)語音模型進(jìn)行匹配,識別出所述至少一段語音子消息包含的內(nèi)容,以及將所述至少一段語音子消息與第二預(yù)設(shè)語音模型進(jìn)行匹配,刪除與所述第二預(yù)設(shè)語音模型相匹配的無效信息;
所述信息提取子單元具體用于將濾除后的至少一段語音子消息與第三預(yù)設(shè)語音模型進(jìn)行匹配,從中提取與所述第三預(yù)設(shè)語音模型相匹配的關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合。
作為一種可選的實(shí)施方式,在本發(fā)明實(shí)施例第二方面中,所述提取單元還包括:
標(biāo)注子單元,用于當(dāng)所述語音識別子單元識別出所述至少一段語音子消息中存在內(nèi)容與所述第一預(yù)設(shè)語音模型進(jìn)行匹配的匹配率低于預(yù)設(shè)值時(shí),將該內(nèi)容增加標(biāo)注;
所述顯示單元具體用于當(dāng)所述關(guān)鍵信息中包含帶有標(biāo)注的內(nèi)容時(shí),按照預(yù)設(shè)方式顯示未帶有標(biāo)注的關(guān)鍵信息和帶有標(biāo)注的關(guān)鍵信息。
與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例具有以下有益效果:
本發(fā)明實(shí)施例中,移動(dòng)終端在接收到語音消息后,可以提取出語音消息中的關(guān)鍵信息,并按照預(yù)設(shè)方式將該關(guān)鍵信息以文字的形式顯示在移動(dòng)終端上??梢?,實(shí)施本發(fā)明實(shí)施例,當(dāng)移動(dòng)終端處于會議室、教室、圖書館等安靜環(huán)境下接收到語音消息而不方便收聽時(shí),可以自動(dòng)提取出語音消息中的關(guān)鍵信息并顯示出來,從而使得用戶在不方便收聽語音消息的環(huán)境下能夠快速理解語音消息的內(nèi)容,以免錯(cuò)過重要信息,進(jìn)而有效改善用戶體驗(yàn)。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例公開的一種語音消息的處理方法的流程示意圖;
圖2是本發(fā)明實(shí)施例公開的另一種語音消息的處理方法的流程示意圖;
圖3是本發(fā)明實(shí)施例公開的一種移動(dòng)終端的結(jié)構(gòu)示意圖;
圖4是本發(fā)明實(shí)施例公開的另一種移動(dòng)終端的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
需要說明的是,本發(fā)明實(shí)施例的術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
本發(fā)明實(shí)施例公開了一種語音消息的處理方法及移動(dòng)終端,能夠自動(dòng)提取語音消息中的關(guān)鍵信息,使用戶在不方便收聽語音消息的環(huán)境下快速理解語音消息的內(nèi)容,以免錯(cuò)過重要信息,進(jìn)而有效改善用戶體驗(yàn)。以下將結(jié)合附圖進(jìn)行詳細(xì)描述。
實(shí)施例一
請參閱圖1,圖1是本發(fā)明實(shí)施例公開的一種語音消息的處理方法的流程示意圖。其中,該語音消息的處理方法應(yīng)用于移動(dòng)終端中。如圖1所示,該語音消息的處理方法可以包括以下步驟。
101、檢測移動(dòng)終端是否接收到語音消息,如果是,則執(zhí)行步驟102;如果否,則結(jié)束本流程。
本發(fā)明實(shí)施例中,移動(dòng)終端可以包括但不限于移動(dòng)手機(jī)、移動(dòng)平板、個(gè)人數(shù)字助理(personaldigitalassistant,pda)、移動(dòng)互聯(lián)網(wǎng)設(shè)備(mobileinternetdevice,mid)、智能穿戴設(shè)備(如智能手表、智能手環(huán)等)等各種設(shè)備。其中,移動(dòng)終端可以支持包括但不限于以下網(wǎng)絡(luò)技術(shù):全球移動(dòng)通信系統(tǒng)(globalsystemformobilecommunications,gsm)、通用分組無線業(yè)務(wù)(generalpacketradioservice,gprs)、碼分多址(codedivisionmultipleaccess,cdma),寬帶碼分多址(w-cdma)、cdma2000、imt單載波(imtsinglecarrier)、增強(qiáng)型數(shù)據(jù)速率gsm演進(jìn)(enhanceddataratesforgsmevolution,edge)、長期演進(jìn)技術(shù)(long-termevolution,lte)、高級長期演進(jìn)技術(shù)、時(shí)分長期演進(jìn)技術(shù)(time-divisionlte,td-lte)、高性能無線電局域網(wǎng)(highperformanceradiolocalareanetwork,hiperlan)、高性能無線電廣域網(wǎng)(hiperwan)、本地多點(diǎn)派發(fā)業(yè)務(wù)(localmultipointdistributionservice,lmds)、全微波存取全球互通(wimax)、紫蜂協(xié)議(zigbee)、藍(lán)牙、正交頻分復(fù)用技術(shù)(ofdm)、大容量空分多路存取(hc-sdma)、通用移動(dòng)電信系統(tǒng)(umts)、通用移動(dòng)電信系統(tǒng)時(shí)分雙工(umts-tdd)、演進(jìn)式高速分組接入(hspa+)、時(shí)分同步碼分多址(td-scdma)、演進(jìn)數(shù)據(jù)最優(yōu)化(ev-do)、數(shù)字增強(qiáng)無繩通信(dect)及其他。
本發(fā)明實(shí)施例中,移動(dòng)終端中可以安裝有即時(shí)聊天應(yīng)用軟件,該即時(shí)聊天應(yīng)用軟件可以是移動(dòng)終端自帶的,也可以是下載的第三方應(yīng)用軟件。即時(shí)聊天應(yīng)用軟件中可以設(shè)置不同的通信模式,如文字消息聊天模式、語音消息聊天模式和/或視頻聊天模式等等,以實(shí)現(xiàn)與他人進(jìn)行通信。當(dāng)進(jìn)入即時(shí)聊天應(yīng)用軟件中后,用戶可以選擇通信的模式,當(dāng)用戶選擇文字消息聊天模式時(shí),通過輸入和發(fā)送文字消息實(shí)現(xiàn)與他人的通信;當(dāng)用戶選擇語音消息聊天模式時(shí),通過錄制和發(fā)送語音消息實(shí)現(xiàn)與他人的通信;當(dāng)用戶選擇視頻聊天模式時(shí),通過發(fā)起視頻實(shí)現(xiàn)與他人的通信。其中,即時(shí)聊天應(yīng)用軟件中可以通過設(shè)置不同的按鈕、語音或手勢,以實(shí)現(xiàn)對不同通信模式的切換。移動(dòng)終端可以發(fā)送文字消息、語音消息或視頻等與他人進(jìn)行交互,同時(shí)也可以接收他人發(fā)送過來的文字消息、語音消息或視頻等。
本發(fā)明實(shí)施例中,可以實(shí)時(shí)檢測移動(dòng)終端是否接收到語音消息,也可以每隔特定時(shí)間檢測移動(dòng)終端是否接收到語音消息,本發(fā)明實(shí)施例不作限定。
作為一種可選的實(shí)施方式,在執(zhí)行步驟101之前,圖1所描述的方法還可以包括以下步驟:
11)檢測移動(dòng)終端當(dāng)前是否處于預(yù)設(shè)操作模式,如果移動(dòng)終端當(dāng)前處于預(yù)設(shè)操作模式,則觸發(fā)移動(dòng)終端執(zhí)行步驟101。
在該實(shí)施方式中,預(yù)設(shè)操作模式可以用于觸發(fā)移動(dòng)終端在接收到語音消息時(shí)提取出其中包含的關(guān)鍵信息。預(yù)設(shè)操作模式可以是用戶根據(jù)自身需求自行設(shè)置的,可以包括但不限于靜音模式、振動(dòng)模式、會議模式等安靜環(huán)境下的操作模式。移動(dòng)終端可以實(shí)時(shí)或每隔一定時(shí)間檢測自身當(dāng)前是否處于預(yù)設(shè)操作模式。當(dāng)移動(dòng)終端處于預(yù)設(shè)操作模式下時(shí),才在接收到語音消息時(shí)提取出其中的關(guān)鍵信息,否則,對接收到的語音消息不進(jìn)行關(guān)鍵信息的提取。當(dāng)然,預(yù)設(shè)操作模式可以根據(jù)用戶的設(shè)置進(jìn)行變更,如增加某些操作模式或刪除某個(gè)操作模式等。預(yù)設(shè)操作模式也可以包括標(biāo)準(zhǔn)模式,即可以在非安靜環(huán)境的操作模式(如響鈴模式)下進(jìn)行語音消息中的關(guān)鍵信息的提取,該實(shí)施方式對此不作限定。
可以理解的是,步驟11)可以先于步驟101執(zhí)行,即先檢測是否處于預(yù)設(shè)操作模式后再檢測是否接收到語音消息;也可以后于步驟101執(zhí)行,即先檢測是否接收到語音消息再檢測是否處于預(yù)設(shè)操作模式;還可以與步驟101同步或交叉執(zhí)行,本發(fā)明實(shí)施例不作限定。
102、提取語音消息中的關(guān)鍵信息。
本發(fā)明實(shí)施例中,當(dāng)檢測出移動(dòng)終端接收到語音消息后,可以對該語音消息進(jìn)行識別,并提取出該語音消息中的關(guān)鍵信息。其中,語音消息中的關(guān)鍵信息可以包括但不限于姓名、人稱代詞、時(shí)間、地點(diǎn)、事件等等。例如,提取的關(guān)鍵信息為“張三上午10點(diǎn)開會”。
本發(fā)明實(shí)施例中,移動(dòng)終端中可以預(yù)先設(shè)置若干個(gè)語音模型,將語音消息中的內(nèi)容逐一與這些語音模型進(jìn)行匹配,以識別中語音消息中的關(guān)鍵信息。此外,也可以將語音消息一一與預(yù)設(shè)的多個(gè)語音模型進(jìn)行匹配,以將該語音消息識別成對應(yīng)的文字信息,再將得到的文字信息與移動(dòng)終端中預(yù)設(shè)的多個(gè)文字模型進(jìn)行對比,以提取出其中的關(guān)鍵信息。
103、按照預(yù)設(shè)方式將該關(guān)鍵信息以文字的形式進(jìn)行顯示。
本發(fā)明實(shí)施例中,在從語音消息中提取出關(guān)鍵信息后,移動(dòng)終端可以將該關(guān)鍵信息以文字的形式進(jìn)行輸出顯示。具體的,可以將該關(guān)鍵信息以文字的形式顯示在聊天窗口中該語音消息的旁邊,此時(shí)用戶無需點(diǎn)擊收聽語音消息即可快速理解語音消息中的主要內(nèi)容;或者,可以將該關(guān)鍵信息以文字的形式顯示在移動(dòng)終端的下拉菜單通知欄中,此時(shí)無需點(diǎn)擊進(jìn)入即時(shí)聊天應(yīng)用軟件即可快速了解語音消息中的主要內(nèi)容。
作為一種可選的實(shí)施方式,步驟103按照預(yù)設(shè)方式將該關(guān)鍵信息以文字的形式進(jìn)行顯示的具體實(shí)施方式可以包括以下步驟:
12)按照預(yù)設(shè)字體大小將該關(guān)鍵信息以文字的形式進(jìn)行顯示;和/或
13)按照預(yù)設(shè)字體顏色將該關(guān)鍵信息以文字的形式進(jìn)行顯示。
在該實(shí)施方式中,可以將關(guān)鍵信息以預(yù)設(shè)字體大小和/或預(yù)設(shè)字體顏色進(jìn)行顯示,還可以將關(guān)鍵信息加粗、傾斜、增加下劃線、增加背景顏色和/或增加外框等方式進(jìn)行顯示,該實(shí)施方式不作限定。例如,將關(guān)鍵信息顯示時(shí)設(shè)置為宋體五號字、加粗、文字標(biāo)紅等等。通過實(shí)施該實(shí)施方式,按照預(yù)設(shè)方式來顯示關(guān)鍵信息可以方便用戶區(qū)分關(guān)鍵信息與其他接收到的文字消息。
可見,實(shí)施圖1所描述的方法,移動(dòng)終端在接收到語音消息后自動(dòng)提取出語音消息中的關(guān)鍵信息并顯示出來,可以使得用戶快速獲取到語音消息中的內(nèi)容,尤其當(dāng)移動(dòng)終端處于會議室、教室、圖書館等安靜環(huán)境下接收到語音消息而不方便收聽時(shí),能夠使用戶快速理解語音消息的內(nèi)容,以免錯(cuò)過重要信息,進(jìn)而有效改善用戶體驗(yàn)。
實(shí)施例二
請參閱圖2,圖2是本發(fā)明實(shí)施例公開的另一種語音消息的處理方法的流程示意圖。其中,該語音消息的處理方法應(yīng)用于移動(dòng)終端中。如圖2所示,該語音消息的處理方法可以包括以下步驟。
201、檢測移動(dòng)終端是否接收到語音消息,如果是,則執(zhí)行步驟202;如果否,則結(jié)束本流程。
202、對語音消息進(jìn)行預(yù)處理,以獲得預(yù)處理后的語音消息。
本發(fā)明實(shí)施例中,當(dāng)移動(dòng)終端接收到語音消息后,可以對語音消息進(jìn)行預(yù)處理,以得到預(yù)處理后的語音消息。其中,對語音消息進(jìn)行預(yù)處理的具體實(shí)施方式可以包括但不限于:按照預(yù)設(shè)好的降噪值對語音消息進(jìn)行去噪濾波處理,根據(jù)預(yù)設(shè)的音頻分貝值對語音消息再次進(jìn)行濾波處理(例如將語音消息中的分貝值低于預(yù)設(shè)的音頻分貝值的內(nèi)容進(jìn)行刪除),以去除語音消息中的各種噪聲,避免呼吸聲、雜音異響等干擾,從而提升語音消息識別成文本的精度。
203、將預(yù)處理后的語音消息進(jìn)行語音分割,以得到至少一段語音子消息。
本發(fā)明實(shí)施例中,移動(dòng)終端可以將經(jīng)過預(yù)處理后的語音消息分割為一段段獨(dú)立的語音子消息,通過分析各語音子消息的特點(diǎn),從而可以簡化語音識別的操作過程。
作為一種可選的實(shí)施方式,步驟203將預(yù)處理后的語音消息進(jìn)行語音分割,以得到至少一段語音子消息的具體實(shí)施方式可以包括但不限于以下步驟:
21)將預(yù)處理后的語音消息按照預(yù)設(shè)時(shí)長進(jìn)行語音分割,以得到至少一段語音子消息;或者,
22)將預(yù)處理后的語音消息按照預(yù)設(shè)語音段數(shù)進(jìn)行語音分割,以得到至少一段語音子消息;或者,
23)獲取預(yù)處理后的語音消息中所有的停頓位置,并根據(jù)獲取的停頓位置將預(yù)處理后的語音消息進(jìn)行語音分割,以得到至少一段語音子消息。
在該實(shí)施方式中,可以將語音消息按照預(yù)設(shè)時(shí)長進(jìn)行分割,例如,一段語音消息總時(shí)長為20秒,預(yù)設(shè)時(shí)長為5秒,則將該語音消息分割為4段,每段的時(shí)長為5秒??梢岳斫獾氖?,當(dāng)語音消息的總時(shí)長不是預(yù)設(shè)時(shí)長的整數(shù)倍時(shí),則分割后的最后一段將不足預(yù)設(shè)時(shí)長,其他每段均為預(yù)設(shè)時(shí)長。也可以將語音消息按照預(yù)設(shè)語音段數(shù)進(jìn)行平均分割處理,例如,一段語音消息總時(shí)長為20秒,預(yù)設(shè)語音段數(shù)為5段,則將該語音消息均分為5段,每段的時(shí)長為4秒。此外,還可以獲取語音消息中的停頓位置,并將語音消息按照停頓位置的分布進(jìn)行分割,其中,停頓位置的獲取可以根據(jù)每兩個(gè)字節(jié)之間的停頓時(shí)長是否超過指定時(shí)長來判斷,如果超過,則為一次停頓,否則,不是停頓位置。例如,獲取到一段語音消息中存在兩個(gè)停頓位置,則將該語音消息在每一停頓位置處進(jìn)行分割,共分割為3段。通過實(shí)施該實(shí)施方式,對語音消息進(jìn)行分割,可以同步對分割后的語音子消息進(jìn)行識別處理,從而提高了語音識別的處理效率。
204、識別上述至少一段語音子消息,并濾除無效信息。
本發(fā)明實(shí)施例中,當(dāng)將接收到的語音消息進(jìn)行預(yù)處理并分割為至少一段語音子消息后,可以分別對各段語音子消息進(jìn)行識別,以識別出各段語音子消息中包含的內(nèi)容,并從中濾除無效信息。其中,無效信息可以是一些常見的語氣用詞(如嗯、啊、哦、吧、呢等等)和口頭禪(如然后、所以等等)。
作為一種可選的實(shí)施方式,步驟204識別上述至少一段語音子消息,并濾除無效信息的具體實(shí)施方式可以包括以下步驟:
24)將上述至少一段語音子消息與第一預(yù)設(shè)語音模型進(jìn)行匹配,識別出上述至少一段語音子消息包含的內(nèi)容;
25)將上述至少一段語音子消息與第二預(yù)設(shè)語音模型進(jìn)行匹配,刪除與第二預(yù)設(shè)語音模型相匹配的無效信息。
在該實(shí)施方式中,對于每段語音子消息,可以分別提取出其中的語音特征信息,并與事先存儲的第一預(yù)設(shè)語音模型進(jìn)行匹配,從而將匹配率最高的語音模型作為識別結(jié)果。第一預(yù)設(shè)語音模型中包括多個(gè)語音字詞的訓(xùn)練模型,可以采用孤立詞語音識別、隱馬爾可夫模型(hiddenmarkovmodel,hmm)、動(dòng)態(tài)時(shí)間規(guī)整(dynamictimewarping,dtw)等方法來完成語音識別過程。
在該實(shí)施方式中,當(dāng)識別出各段語音子消息中包含的內(nèi)容后,可以進(jìn)一步與第二預(yù)設(shè)語音模型進(jìn)行匹配,從中將匹配率最高的語音字詞作為無效信息。其中,第一預(yù)設(shè)語音模型可以包含有第二預(yù)設(shè)語音模型。第二預(yù)設(shè)語音模型中包含多個(gè)無效語音字詞的訓(xùn)練模型,如常用語氣詞和/或口頭禪的語音模型。通過實(shí)施該實(shí)施方式,通過分析各段語音子消息的特征,刪除掉與常用語氣詞和/或口頭禪等字詞,從而可以簡化語音消息,減少對不必要字詞的處理。
作為一種可選的實(shí)施方式,在執(zhí)行步驟204之后,圖2所描述的方法還可以包括以下步驟:
26)當(dāng)識別出相鄰的多段語音子消息的內(nèi)容相同時(shí),從中保留一段語音子消息,并刪除其余相同的語音子消息。
在該實(shí)施方式中,可以刪除語音消息中連續(xù)重復(fù)的語音段,例如,連續(xù)出現(xiàn)幾個(gè)好的、是的、可以、不行等字詞,則僅保留一個(gè),刪除其余相同的,從而可以進(jìn)一步簡化語音消息,避免對重復(fù)字詞的處理。
205、從濾除后的至少一段語音子消息中提取關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合。
本發(fā)明實(shí)施例中,在識別出各段語音子消息,并濾除掉無效信息和/或重復(fù)信息時(shí),可以從濾除后的語音子消息中提取出關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合處理,可以按照時(shí)間的先后順序組合成一段文字。其中,關(guān)鍵信息可以包括但不限于姓名、人稱代詞、時(shí)間、地點(diǎn)、事件等信息。
具體的,步驟205從濾除后的至少一段語音子消息中提取關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合的具體實(shí)施方式可以包括以下步驟:
27)將濾除后的至少一段語音子消息與第三預(yù)設(shè)語音模型進(jìn)行匹配,從中提取與第三預(yù)設(shè)語音模型相匹配的關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合。
其中,第一預(yù)設(shè)語音模型可以包含有第三預(yù)設(shè)語音模型。
206、按照預(yù)設(shè)方式將關(guān)鍵信息以文字的形式進(jìn)行顯示。
本發(fā)明實(shí)施例中,可以將組合后的關(guān)鍵信息以文字的形式按照預(yù)設(shè)方式顯示在聊天窗口中對應(yīng)語音消息的旁邊,也可以顯示在移動(dòng)終端的下拉菜單通知欄中,在此不作限定。如果關(guān)鍵信息不能較為清楚的表達(dá)出含義時(shí),用戶可以進(jìn)一步操作查看到語音消息對應(yīng)的詳細(xì)文字信息,例如,可以在語音消息旁設(shè)置一個(gè)按鈕,點(diǎn)擊即可顯示出對應(yīng)的文字信息;或者雙擊或長按語音消息即可顯示出對應(yīng)的文字信息等。
作為一種可選的實(shí)施方式,當(dāng)執(zhí)行步驟24)識別出上述至少一段語音子消息中存在內(nèi)容與第一預(yù)設(shè)語音模型進(jìn)行匹配的匹配率低于預(yù)設(shè)值時(shí),圖2所描述的方法還可以包括以下步驟:
28)將該內(nèi)容增加標(biāo)注;
相應(yīng)地,當(dāng)最后獲取的關(guān)鍵信息中包含帶有標(biāo)注的內(nèi)容時(shí),步驟206按照預(yù)設(shè)方式將關(guān)鍵信息以文字的形式進(jìn)行顯示的具體實(shí)施方式可以為:
按照預(yù)設(shè)方式顯示未帶有標(biāo)注的關(guān)鍵信息和帶有標(biāo)注的關(guān)鍵信息。
在該實(shí)施方式中,當(dāng)語音消息中存在內(nèi)容與第一預(yù)設(shè)語音模型進(jìn)行匹配時(shí),所有的匹配率均低于預(yù)設(shè)值,或者語音消息中存在內(nèi)容與第一預(yù)設(shè)語音模型中的多個(gè)語音模型的匹配率相當(dāng)(相同或差距低于臨界值)時(shí),說明語音音質(zhì)差或發(fā)音不太標(biāo)準(zhǔn),這些語音識別準(zhǔn)確率低,為避免誤導(dǎo)用戶,將這些語音識別出的文字加標(biāo)注進(jìn)行區(qū)分。其中,加標(biāo)注的方式可以包括但不限于用括號括起來、字體與其他文字不同、文字傾斜、加粗等處理。當(dāng)提取的關(guān)鍵信息中存在加標(biāo)注的文字時(shí),則仍然以加標(biāo)注的形式進(jìn)行顯示。
作為一種可選的實(shí)施方式,在步驟201檢測移動(dòng)終端是否接收到語音消息之前,或者在步驟201檢測出移動(dòng)終端接收到語音消息之后,可以檢測移動(dòng)終端當(dāng)前是否處于預(yù)設(shè)操作模式下,當(dāng)處于預(yù)設(shè)操作模式下時(shí),則觸發(fā)移動(dòng)終端在接收到語音消息時(shí)提取關(guān)鍵信息。
舉例來說,當(dāng)移動(dòng)終端開啟靜音、震動(dòng)或會議模式時(shí),將自動(dòng)打開關(guān)鍵信息語音識別功能,在即時(shí)聊天應(yīng)用軟件中接收到語音消息時(shí)會自動(dòng)識別出語音中的關(guān)鍵信息并顯示在聊天窗口中,供用戶查看。通過這個(gè)功能,用戶在開會、培訓(xùn)或其他安靜的環(huán)境中也可以正常處理語音消息,避免錯(cuò)過重要信息。
可見,實(shí)施圖2所描述的方法,移動(dòng)終端在接收到語音消息后自動(dòng)提取出語音消息中的關(guān)鍵信息并顯示出來,可以使得用戶快速獲取到語音消息中的內(nèi)容,尤其當(dāng)移動(dòng)終端處于會議室、教室、圖書館等安靜環(huán)境下接收到語音消息而不方便收聽時(shí),能夠使用戶快速理解語音消息的內(nèi)容,以免錯(cuò)過重要信息,進(jìn)而有效改善用戶體驗(yàn)。
實(shí)施例三
請參閱圖3,圖3是本發(fā)明實(shí)施例公開的一種移動(dòng)終端的結(jié)構(gòu)示意圖,可以用于執(zhí)行上述公開的語音消息的處理方法。如圖3所示,該移動(dòng)終端可以包括:
第一檢測單元301,用于檢測移動(dòng)終端是否接收到語音消息;
提取單元302,用于在第一檢測單元301檢測出移動(dòng)終端接收到語音消息時(shí),提取語音消息中的關(guān)鍵信息;
顯示單元303,用于按照預(yù)設(shè)方式將該關(guān)鍵信息以文字的形式進(jìn)行顯示。
本發(fā)明實(shí)施例中,第一檢測單元301可以實(shí)時(shí)或每隔特定時(shí)間檢測移動(dòng)終端是否接收到語音消息,當(dāng)檢測出接收到語音消息時(shí),可以利用提取單元302自動(dòng)提取出語音消息中的關(guān)鍵信息,并通過顯示單元303以文字形式按照預(yù)設(shè)方式來顯示該關(guān)鍵信息。其中,提取的關(guān)鍵信息可以包括但不限于姓名、人稱代詞、時(shí)間、地點(diǎn)、事件等等。
作為一種可選的實(shí)施方式,顯示單元303可以將關(guān)鍵信息以文字的形式顯示在聊天窗口中該語音消息的旁邊;或者,顯示單元303可以將關(guān)鍵信息以文字的形式顯示在移動(dòng)終端的下拉菜單通知欄中。具體的,顯示單元303可以按照預(yù)設(shè)字體大小將關(guān)鍵信息以文字的形式進(jìn)行顯示;和/或,顯示單元303可以按照預(yù)設(shè)字體顏色將關(guān)鍵信息以文字的形式進(jìn)行顯示。此外,顯示單元303還可以將關(guān)鍵信息加粗、傾斜、增加下劃線、增加背景顏色和/或增加外框等方式進(jìn)行顯示,在此不作限定。
其中,實(shí)施圖3所描述的移動(dòng)終端,在接收到語音消息后自動(dòng)提取出語音消息中的關(guān)鍵信息并顯示出來,可以使得用戶快速獲取到語音消息中的內(nèi)容,尤其當(dāng)移動(dòng)終端處于會議室、教室、圖書館等安靜環(huán)境下接收到語音消息而不方便收聽時(shí),能夠使用戶快速理解語音消息的內(nèi)容,以免錯(cuò)過重要信息,進(jìn)而有效改善用戶體驗(yàn)。
實(shí)施例四
請參閱圖4,圖4是本發(fā)明實(shí)施例公開的另一種移動(dòng)終端的結(jié)構(gòu)示意圖,可以用于執(zhí)行上述公開的語音消息的處理方法。其中,圖4所示的移動(dòng)終端是由圖3所示的移動(dòng)終端進(jìn)行優(yōu)化得到的。與圖3所示的移動(dòng)終端相比較,圖4所示的移動(dòng)終端還可以包括:
第二檢測單元304,用于在第一檢測單元301檢測移動(dòng)終端是否接收到語音消息之前,檢測移動(dòng)終端當(dāng)前是否處于預(yù)設(shè)操作模式,該預(yù)設(shè)操作模式用于觸發(fā)移動(dòng)終端在接收到語音消息時(shí)提取關(guān)鍵信息;
相應(yīng)地,第一檢測單元301具體用于在第二檢測單元304檢測出移動(dòng)終端處于預(yù)設(shè)操作模式時(shí),檢測移動(dòng)終端是否接收到語音消息。
作為一種可選的實(shí)施方式,圖4所示的移動(dòng)終端還可以包括:
預(yù)處理單元305,用于在第一檢測單元301檢測出移動(dòng)終端接收到語音消息時(shí),對接收到的語音消息進(jìn)行預(yù)處理,以獲得預(yù)處理后的語音消息;
語音分割單元306,用于將預(yù)處理后的語音消息進(jìn)行語音分割,以得到至少一段語音子消息;
相應(yīng)地,提取單元302可以進(jìn)一步包括:
語音識別子單元3021,用于在語音分割單元306分割語音得到至少一段語音子消息后,識別上述至少一段語音子消息,并濾除無效信息;
信息提取子單元3022,用于從濾除后的至少一段語音子消息中提取關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合,以使得顯示單元303顯示組合后的關(guān)鍵信息。
作為一種可選的實(shí)施方式,語音識別子單元3021具體可以用于將上述至少一段語音子消息與第一預(yù)設(shè)語音模型進(jìn)行匹配,識別出上述至少一段語音子消息包含的內(nèi)容,以及將上述至少一段語音子消息與第二預(yù)設(shè)語音模型進(jìn)行匹配,刪除與第二預(yù)設(shè)語音模型相匹配的無效信息;
信息提取子單元3022具體可以用于將濾除后的至少一段語音子消息與第三預(yù)設(shè)語音模型進(jìn)行匹配,從中提取與第三預(yù)設(shè)語音模型相匹配的關(guān)鍵信息,并將提取的關(guān)鍵信息進(jìn)行組合。
作為一種可選的實(shí)施方式,在圖4所示的移動(dòng)終端中,提取單元302還可以包括:
標(biāo)注子單元3023,用于當(dāng)語音識別子單元3021識別出上述至少一段語音子消息中存在內(nèi)容與第一預(yù)設(shè)語音模型進(jìn)行匹配的匹配率低于預(yù)設(shè)值時(shí),將該內(nèi)容增加標(biāo)注;
相應(yīng)地,顯示單元303具體可以用于當(dāng)信息提取子單元3022提取的關(guān)鍵信息中包含帶有標(biāo)注的內(nèi)容時(shí),按照預(yù)設(shè)方式顯示未帶有標(biāo)注的關(guān)鍵信息和帶有標(biāo)注的關(guān)鍵信息。
其中,實(shí)施圖4所描述的移動(dòng)終端,在接收到語音消息后自動(dòng)提取出語音消息中的關(guān)鍵信息并顯示出來,可以使得用戶快速獲取到語音消息中的內(nèi)容,尤其當(dāng)移動(dòng)終端處于會議室、教室、圖書館等安靜環(huán)境下接收到語音消息而不方便收聽時(shí),能夠使用戶快速理解語音消息的內(nèi)容,以免錯(cuò)過重要信息,進(jìn)而有效改善用戶體驗(yàn)。
需要說明的是,對于前述的各個(gè)方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請,某一些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本申請所必須的。
在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳細(xì)描述的部分,可以參見其他實(shí)施例的相關(guān)描述。
本發(fā)明實(shí)施例方法中的步驟可以根據(jù)實(shí)際需要進(jìn)行順序調(diào)整、合并和刪減。
本發(fā)明實(shí)施例移動(dòng)終端中的單元或子單元可以根據(jù)實(shí)際需要進(jìn)行合并、劃分和刪減。
本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲于一計(jì)算機(jī)可讀存儲介質(zhì)中,存儲介質(zhì)包括只讀存儲器(read-onlymemory,rom)、隨機(jī)存儲器(randomaccessmemory,ram)、可編程只讀存儲器(programmableread-onlymemory,prom)、可擦除可編程只讀存儲器(erasableprogrammablereadonlymemory,eprom)、一次可編程只讀存儲器(one-timeprogrammableread-onlymemory,otprom)、電子抹除式可復(fù)寫只讀存儲器(electrically-erasableprogrammableread-onlymemory,eeprom)、只讀光盤(compactdiscread-onlymemory,cd-rom)或其他光盤存儲器、磁盤存儲器、磁帶存儲器、或者能夠用于攜帶或存儲數(shù)據(jù)的計(jì)算機(jī)可讀的任何其他介質(zhì)。
以上對本發(fā)明實(shí)施例公開的一種語音消息的處理方法及移動(dòng)終端進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。