一種信息處理方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種信息處理方法及裝置,該方法包括:在啟動(dòng)語音服務(wù)時(shí),接收第一語音數(shù)據(jù);在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性;按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),能夠靈活地為用戶提供語音服務(wù)。
【專利說明】
_種信息處理方法及裝置
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其是涉及一種信息處理方法及裝置。
【背景技術(shù)】
[0002]隨著通信技術(shù)的不斷發(fā)展,用戶設(shè)備也越來越智能化、多樣化。
[0003]目前,各終端廠商推出的UE中,一般都帶有語音服務(wù)功能。另外,各業(yè)務(wù)提供商提供的業(yè)務(wù)應(yīng)用中,也會(huì)隨之提供語音控制或者語音服務(wù)功能,常見的如地圖導(dǎo)航等業(yè)務(wù)應(yīng)用。但是,現(xiàn)有的UE中,無論是UE本身集成的語音服務(wù)功能,還是UE中各業(yè)務(wù)應(yīng)用提供的語音服務(wù)功能,在授權(quán)該些語音服務(wù)能夠訪問UE中的音頻的情況下,該業(yè)務(wù)應(yīng)用能夠輸出的語音需要進(jìn)行預(yù)先設(shè)置,靈活性較差。例如授權(quán)某一地圖導(dǎo)航類業(yè)務(wù)應(yīng)用能夠訪問麥克風(fēng)以及揚(yáng)聲器,預(yù)先設(shè)置該地圖導(dǎo)航類業(yè)務(wù)應(yīng)用在進(jìn)行語音輸出時(shí)采用男性聲音,在設(shè)置完成后,后續(xù)該地圖導(dǎo)航類業(yè)務(wù)應(yīng)用在為用戶提供地圖導(dǎo)航語音輸出時(shí),則提供男性聲音,在不重新設(shè)置的情況下,則一直保持男性聲音輸出語音,靈活性較差。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供了一種信息處理方法及裝置,能夠靈活地為用戶提供語音服務(wù)。
[0005]—種信息處理方法,包括:在啟動(dòng)語音服務(wù)時(shí),接收第一語音數(shù)據(jù);在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性;按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù)。
[0006]在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性,包括:對(duì)接收到的所述第一語音數(shù)據(jù)進(jìn)行預(yù)處理后,獲得所述語音數(shù)據(jù)的語音特征;確定預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中和所述語音特征對(duì)應(yīng)的語言模型;將所述語言模型作為所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性。
[0007]所述語言模型包含發(fā)音模板;確定預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中和所述語音特征對(duì)應(yīng)的語言模型,包括:獲得所述語音特征中隨時(shí)間變化的語音特征矢量序列;計(jì)算所述語音特征矢量序列和語音數(shù)據(jù)庫中的發(fā)音模板之間的距離;在所述距離小于設(shè)定值時(shí),將所述發(fā)音模板作為和所述語音特征對(duì)應(yīng)的語言模型。
[0008]按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),包括下述中的至少一種:按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)和所述第一語音數(shù)據(jù)的語音內(nèi)容不相同;按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)是對(duì)實(shí)時(shí)測(cè)量獲得的數(shù)據(jù)進(jìn)行播報(bào);按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)和所述第一語音數(shù)據(jù)的語音標(biāo)準(zhǔn)不相同。
[0009]所述語音屬性至少包含下述中的一種:語音的物理屬性;語音內(nèi)容;語種識(shí)別;語音標(biāo)準(zhǔn)。
[0010]一種信息處理裝置,包括:接收單元,用于在啟動(dòng)語音服務(wù)時(shí),接收第一語音數(shù)據(jù);處理單元,用于在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性;按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù)。
[0011 ]所述處理單元,具體用于對(duì)接收到的所述第一語音數(shù)據(jù)進(jìn)行預(yù)處理后,獲得所述語音數(shù)據(jù)的語音特征;確定預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中和所述語音特征對(duì)應(yīng)的語言模型;將所述語言模型作為所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性。
[0012]所述語言模型包含發(fā)音模板;
[0013]所述處理單元,具體用于獲得所述語音特征中隨時(shí)間變化的語音特征矢量序列;計(jì)算所述語音特征矢量序列和語音數(shù)據(jù)庫中的發(fā)音模板之間的距離;在所述距離小于設(shè)定值時(shí),將所述發(fā)音模板作為和所述語音特征對(duì)應(yīng)的語言模型。
[0014]所述處理單元按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),包括下述中的至少一種:按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)和所述第一語音數(shù)據(jù)的語音內(nèi)容不相同;按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)是對(duì)實(shí)時(shí)測(cè)量獲得的數(shù)據(jù)進(jìn)行播報(bào);按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)和所述第一語音數(shù)據(jù)的語音標(biāo)準(zhǔn)不相同。
[0015]所述處理單元,確定的所述語音屬性至少包含下述中的一種:語音的物理屬性;語音內(nèi)容;語種識(shí)別;語音標(biāo)準(zhǔn)。
[0016]通過采用上述技術(shù)方案,在啟動(dòng)語音服務(wù)時(shí),接收第一語音數(shù)據(jù);在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性;按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),從而能夠靈活地為用戶提供語音服務(wù)。
【附圖說明】
[0017]圖1為本發(fā)明實(shí)施例中提出的信息處理方法應(yīng)用的計(jì)算節(jié)點(diǎn)的邏輯結(jié)構(gòu)示意圖;
[0018]圖2為本發(fā)明實(shí)施例中提出的信息處理方法所應(yīng)用的用戶設(shè)備結(jié)構(gòu)示意圖;
[0019]圖3為本發(fā)明實(shí)施例中提出的信息處理方法所應(yīng)用的用戶設(shè)備結(jié)構(gòu)示意圖;
[0020]圖4a為本發(fā)明實(shí)施例中提出的信息處理方法流程圖;
[0021]圖4b為本發(fā)明實(shí)施例中提出的信息處理裝置結(jié)構(gòu)組成示意圖。
【具體實(shí)施方式】
[0022]下面將結(jié)合各個(gè)附圖對(duì)本發(fā)明實(shí)施例技術(shù)方案的主要實(shí)現(xiàn)原理、【具體實(shí)施方式】及其對(duì)應(yīng)能夠達(dá)到的有益效果進(jìn)行詳細(xì)地闡述。
[0023]本發(fā)明實(shí)施例提出的技術(shù)方案中,以圖1為例介紹本發(fā)明實(shí)施例提供的信息處理方法應(yīng)用的計(jì)算節(jié)點(diǎn)的邏輯結(jié)構(gòu)。該計(jì)算節(jié)點(diǎn)可以是用戶設(shè)備,該用戶設(shè)備具體可以為桌面計(jì)算機(jī)、筆記本電腦、智能手機(jī)、行車記錄儀或平板電腦等。如圖1所示,該用戶設(shè)備的硬件層包括中央處理器(Center Processing Unit,CPU)、圖形處理器(Graphic ProcessingUnit, GPU)等,當(dāng)然還可以包括存儲(chǔ)器、輸入/輸出設(shè)備(Input De v i ce)、網(wǎng)絡(luò)接口等,輸入設(shè)備可包括鍵盤、鼠標(biāo)、觸摸屏等,輸出設(shè)備可包括顯示設(shè)備如液晶顯示器(LiquidCrystal Display,LCD)、陰極射線管(Cathode Ray Tube,CRT)、全息成像(Holographic)、投影(Projector)等。在硬件層之上可運(yùn)行有操作系統(tǒng)(如Android等)以及一些應(yīng)用程序。核心庫層是操作系統(tǒng)的核心部分,包括輸入/輸出服務(wù)、核心服務(wù)、圖形設(shè)備接口以及實(shí)現(xiàn)CPU、GPU圖形處理的圖形引擎(Graphics Engine)等。圖形引擎可包括2D引擎、3D引擎、合成器(Composit1n)、幀緩沖區(qū)(Frame Buffer)等。除此之外,該終端還包括驅(qū)動(dòng)層、框架層和應(yīng)用層。驅(qū)動(dòng)層可包括CPU驅(qū)動(dòng)(driver)、GPU驅(qū)動(dòng)、顯示控制器驅(qū)動(dòng)等??蚣軐涌砂▓D形服務(wù)(Graphic Service)、系統(tǒng)服務(wù)(System service)、網(wǎng)頁服務(wù)(Web Service)和用戶服務(wù)(Customer Service)等;圖形服務(wù)中,可包括如微件(Widget)、畫布(Canvas)、視圖(Views)、Render Script等。應(yīng)用層可包括桌面(launcher)、媒體播放器(Media Player)、瀏覽器(Browser)等。
[0024]本發(fā)明實(shí)施例提出的信息處理方法所應(yīng)用的用戶設(shè)備,如圖2所示,該用戶設(shè)備200包括:至少一個(gè)處理器201,至少一個(gè)網(wǎng)絡(luò)接口 204或者其他用戶接口 203,存儲(chǔ)器205,至少一個(gè)通信總線202。通信總線202用于實(shí)現(xiàn)這些組件之間的連接通信。該用戶設(shè)備200可選的包含用戶接口 2 O 3,包括至少一個(gè)顯示器(例如圖1所示的LCD、CRT、全息成像(Holographic)或者投影(Pro jector)等),鍵盤或者點(diǎn)擊設(shè)備(例如,鼠標(biāo),軌跡球(trackball),觸感板或者觸摸屏等)。
[0025]存儲(chǔ)器205可以包括只讀存儲(chǔ)器和隨機(jī)存取存儲(chǔ)器,并向處理器201提供存儲(chǔ)器205中存儲(chǔ)的程序指令和數(shù)據(jù)。存儲(chǔ)器205的一部分還可以包括非易失性隨機(jī)存取存儲(chǔ)器(NVRAM)0
[0026]在一些實(shí)施方式中,存儲(chǔ)器205存儲(chǔ)了如下的元素,可執(zhí)行模塊或者數(shù)據(jù)結(jié)構(gòu),或者他們的子集,或者他們的擴(kuò)展集:
[0027]操作系統(tǒng)2051,包含各種系統(tǒng)程序指令,該程序指令可運(yùn)行在例如圖1所示的框架層、核心庫層、驅(qū)動(dòng)層等,用于實(shí)現(xiàn)各種基礎(chǔ)業(yè)務(wù)以及處理基于硬件的任務(wù)。
[0028]應(yīng)用程序2052,包含各種應(yīng)用程序,例如圖1所示的桌面(launcher )、媒體播放器(Media Player)、瀏覽器(Browser)以及數(shù)據(jù)顯示應(yīng)用等,用于實(shí)現(xiàn)各種應(yīng)用業(yè)務(wù)。
[0029]應(yīng)用程序2052中的各種應(yīng)用程序,在本發(fā)明實(shí)施例上述提出的技術(shù)方案中,應(yīng)用程序2052中,存儲(chǔ)的實(shí)現(xiàn)信息處理方法的程序指令。
[0030]在本發(fā)明實(shí)施例中,存儲(chǔ)器205也可以稱之為存儲(chǔ)區(qū)域,用于存儲(chǔ)信息處理方法的程序,以及存儲(chǔ)操作系統(tǒng)。
[0031]處理器201通過調(diào)用存儲(chǔ)器205存儲(chǔ)的程序指令,處理器201用于按照獲得的程序指令執(zhí)行:在啟動(dòng)語音服務(wù)時(shí),接收第一語音數(shù)據(jù),在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性,按照語音屬性輸出響應(yīng)第一語音數(shù)據(jù)的第二語音數(shù)據(jù)。
[0032]可選地,作為一個(gè)實(shí)施例,處理器201還用于:對(duì)接收到的第一語音數(shù)據(jù)進(jìn)行預(yù)處理后,獲得語音數(shù)據(jù)的語音特征,確定預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中和語音特征對(duì)應(yīng)的語言模型,將語言模型作為第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性。
[0033]其中,語音特征可以是消除干擾后的語音數(shù)據(jù)的頻率曲線。每種語音對(duì)應(yīng)不同的頻率,并且語音的響聲大小,直接影響頻率曲線波峰和波谷。在本發(fā)明實(shí)施例提出的技術(shù)方案中,語音數(shù)據(jù)庫中存儲(chǔ)的語言模型,該語言模型可以包含不同的語音屬性,也可以包含全部語音屬性。例如,預(yù)先存儲(chǔ)的語言模型可以是語音屬性為女性音色的語音數(shù)據(jù)包,也可以是語音屬性為男性音色的語音數(shù)據(jù)包等,在此不一一舉例。
[0034]具體地,語音數(shù)據(jù)包含語音屬性。語音屬性包含語音的物理屬性、語音內(nèi)容、語種識(shí)別以及語音標(biāo)準(zhǔn)等。
[0035]進(jìn)一步地,語言模型包含發(fā)音模板;處理器201具體用于:獲得語音特征中隨時(shí)間變化的語音特征矢量序列,計(jì)算語音特征矢量序列和語音數(shù)據(jù)庫中的發(fā)音模板之間的距離,在距離小于設(shè)定值時(shí),將發(fā)音模板作為和所述語音特征對(duì)應(yīng)的語言模型。
[0036]在本發(fā)明實(shí)例提出的語音模型中,每個(gè)語音模型都包含發(fā)音模板,通過發(fā)音模板將該語音模型以語音的形式發(fā)出。舉一例進(jìn)行詳細(xì)闡述,發(fā)音模板可以是預(yù)先存儲(chǔ)的公眾人物的聲音。在具體實(shí)施中,發(fā)音模板可以通過不同的語音特征矢量序列表征。
[0037]在本發(fā)明實(shí)例提出的技術(shù)方案中,確定語音特征對(duì)應(yīng)的語言模型時(shí),首先將語音特征進(jìn)行分解,獲得語音特征中隨之間變化的語音特征矢量序列,該語音特征矢量序列可以用于量化地表征語音特征。
[0038]然后,計(jì)算語音特征矢量序列和發(fā)音模板(即存儲(chǔ)的每個(gè)發(fā)音模板對(duì)應(yīng)的語音特征矢量)之間的距離,得到的距離值越小,則表示兩個(gè)語音特征矢量序列越相似,在本發(fā)明實(shí)例提出的技術(shù)方案中,在距離小于設(shè)定值時(shí),將發(fā)音模板作為和所述語音特征對(duì)應(yīng)的語言模型。
[0039]處理器201在獲得第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性時(shí),首先處理器201對(duì)接收到的第一語音數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理可以較好地去除噪音,消除干擾。處理器201獲得預(yù)處理后的第一語音數(shù)據(jù)的語音特征。其中,語音特征提取是指在語音波形中提取出隨時(shí)間變化的語音特征序列。其次,在獲得語音特征之后,進(jìn)行升學(xué)模型匹配,即本發(fā)明實(shí)施例中提出的語言模型。語言模型可以包含發(fā)音模板。一種較佳地實(shí)現(xiàn)方式,在本發(fā)明實(shí)施例提出的技術(shù)方案中,在語音數(shù)據(jù)庫中存儲(chǔ)有不同的發(fā)音模板。該發(fā)音模板可以劃分為不同的音色、不同的響度。該發(fā)音模板還可以按照不同的方言進(jìn)行劃分。
[0040]進(jìn)一步地,在本發(fā)明實(shí)施例提出的技術(shù)方案中,發(fā)音模板包含不同的音色,例如男性聲音和女性聲音。發(fā)音模板還可以包含不同地方的方言、俚語,例如四川話、廣東話、東北話等等。發(fā)音模塊可以包含不同的語種,如英語、法語以及日語等等。
[0041 ]在本發(fā)明實(shí)施例提出的技術(shù)方案中,計(jì)算語音特征矢量序列和語音數(shù)據(jù)庫中的發(fā)音模板之間的距離,在距離小于設(shè)定值時(shí),將發(fā)音模板作為和語音特征對(duì)應(yīng)的語言模型。計(jì)算語音特征矢量序列和語音數(shù)據(jù)庫中的發(fā)音模板之間的距離,在辨識(shí)時(shí)將語音特征同聲學(xué)模型進(jìn)行匹配比較,以達(dá)到最佳的識(shí)別效果。
[0042]語言模型包括由辨識(shí)語音命令構(gòu)成的語法網(wǎng)絡(luò)或由統(tǒng)計(jì)方法構(gòu)成的語言模型,語音處理可以進(jìn)行語法、語義分析。
[0043]進(jìn)一步地,處理器201具體用于:按照語音屬性輸出響應(yīng)第一語音數(shù)據(jù)的第二語音數(shù)據(jù),
[0044]其中第二語音數(shù)據(jù)和第一語音數(shù)據(jù)的語音內(nèi)容不相同。
[0045]該種方式中,舉一例進(jìn)行詳細(xì)闡述第二語音數(shù)據(jù)和第一語音數(shù)據(jù)的語音內(nèi)容不相同,例如,在提供語音服務(wù)的地圖導(dǎo)航中,假設(shè)第一語音數(shù)據(jù)是輸入地點(diǎn),應(yīng)用程序接收第一語音數(shù)據(jù)之后,進(jìn)行定位、巡航等操作,然后等待一段延時(shí)之后開始播報(bào)第二語音數(shù)據(jù),該第二語音數(shù)據(jù)即為道路導(dǎo)航信息。
[0046]其中第二語音數(shù)據(jù)是對(duì)實(shí)時(shí)測(cè)量獲得的數(shù)據(jù)進(jìn)行播報(bào)。
[0047]沿用上例,例如,在提供語音服務(wù)的地圖導(dǎo)航中,假設(shè)第一語音數(shù)據(jù)是輸入地點(diǎn),應(yīng)用程序接收第一語音數(shù)據(jù)之后,進(jìn)行定位、巡航等操作,然后等待一段延時(shí)之后開始播報(bào)第二語音數(shù)據(jù),第二語音數(shù)據(jù)根據(jù)用戶的位置不同,第二語音數(shù)據(jù)的內(nèi)容也不相同,例如左拐、橋洞等信息。
[0048]其中第二語音數(shù)據(jù)和述第一語音數(shù)據(jù)的語音標(biāo)準(zhǔn)不相同。
[0049]語音屬性可以包含語音的物理屬性、語音內(nèi)容、語種識(shí)別,以及語音標(biāo)準(zhǔn)。
[0050]在本發(fā)明實(shí)施例提出的技術(shù)方案中,舉一例進(jìn)行詳細(xì)闡述,仍沿用上例,例如,在提供語音服務(wù)的地圖導(dǎo)航中,假設(shè)第一語音數(shù)據(jù)是輸入地點(diǎn),應(yīng)用程序接收第一語音數(shù)據(jù)之后,進(jìn)行定位、巡航等操作,然后等待一段延時(shí)之后開始播報(bào)第二語音數(shù)據(jù),此時(shí)第二語音數(shù)據(jù)和第一語音數(shù)據(jù)的內(nèi)容不相同。
[0051]進(jìn)一步地,若處理器201分析出第一語音數(shù)據(jù)的物理屬性是男性聲音,則可以以第二女性聲音輸出第二語音數(shù)據(jù)。或者仍然以男性聲音輸入第二語音數(shù)據(jù)。一種較佳地實(shí)現(xiàn)方式,在本發(fā)明實(shí)施例提出的技術(shù)方案中,在輸出第二語音數(shù)據(jù)時(shí),采用和第一語音數(shù)據(jù)不同的物理屬性輸出。
[0052]又例如,若處理器201分析出第一語音數(shù)據(jù)的物理屬性是男性聲音,則可以以第二女性聲音輸出第二語音數(shù)據(jù)。例如該第二女性聲音輸入數(shù)據(jù)可以是預(yù)先存儲(chǔ)的一些公眾人物的聲音模板。
[0053]又例如,若處理器201分析出第一語音數(shù)據(jù)的物理屬性是男性聲音,且語種識(shí)別為英語,則可以以第二女性聲音輸出第二語音數(shù)據(jù)。并且是通過日語輸入第二語音數(shù)據(jù)。
[0054]也就是說,在本發(fā)明實(shí)施例提出的技術(shù)方案中,第二語音數(shù)據(jù)的輸出,其語音內(nèi)容可以是和第一語音數(shù)據(jù)的語音內(nèi)容相同,也可以完全不相同,還可以是部分相同,部分不同。第二語音數(shù)據(jù)的物理屬性、語種以及語音標(biāo)準(zhǔn),也可以和第一語音數(shù)據(jù)相同,也可以完全不相同,在此,不做具體的限定。
[0055]本發(fā)明實(shí)施例提出的提出信息處理方法所應(yīng)用的用戶設(shè)備,該用戶設(shè)備可以為手機(jī)、平板電腦、行車記錄儀、個(gè)人數(shù)字助理(Personal Digital Assistant,PDA)等。參考圖3所示,為用戶設(shè)備300的其中一種結(jié)構(gòu)組成示意圖。
[0056]該用戶設(shè)備300主要包括,存儲(chǔ)器320、處理器360及輸入單元330,該輸入單元330用于接收第一語音數(shù)據(jù)。該存儲(chǔ)器320用于存儲(chǔ)操作系統(tǒng)和各種應(yīng)用程序的程序指令。
[0057]可以理解的,處理器360的具體實(shí)現(xiàn)功能可參見上述處理器201的詳細(xì)闡述,不再贅述。
[0058]存儲(chǔ)器320可以是用戶設(shè)備300的內(nèi)存,用于存儲(chǔ)語音數(shù)據(jù)庫。
[0059]用戶設(shè)備中的輸入單元330可用于接收用戶輸入的數(shù)字或字符信息,以及產(chǎn)生與用戶設(shè)備300的用戶設(shè)置以及功能控制有關(guān)的信號(hào)輸入。
[0060]具體地,本發(fā)明實(shí)施例中,該輸入單元330可以包括觸控面板331。觸控面板331,可收集用戶在其上(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板331上)的操作,并根據(jù)預(yù)先設(shè)定的程序指令,驅(qū)動(dòng)與觸控面板331相應(yīng)的連接裝置??蛇x的,觸控面板331可包括觸摸檢測(cè)裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測(cè)裝置檢測(cè)用戶的觸摸方位,并檢測(cè)觸摸操作帶來的信號(hào),將信號(hào)傳送給觸摸控制器;觸摸控制器從觸摸檢測(cè)裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給該處理器360,并能接收處理器360發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實(shí)現(xiàn)觸控面板331。除了觸控面板331,輸入單元330還可以包括其他輸入設(shè)備332,其他輸入設(shè)備332可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。
[0061 ] 該用戶設(shè)備300還可以包括顯示單元340,該顯示單元340可用于顯示由用戶輸入的信息或提供給用戶的信息以及用戶設(shè)備300的各種菜單界面。該顯示單元340可包括顯示面板341,可選的,可以采用液晶顯示器(Liquid Crystal Display,LCD)或有機(jī)發(fā)光二極管(Organic Light-Emitting D1de,0LED)等形式來配置顯示面板341。
[0062]請(qǐng)參考圖3所示,本發(fā)明實(shí)施例中,該觸控面板331覆蓋該顯示面板341,形成觸摸顯示屏,觸摸顯示屏提供給用戶預(yù)設(shè)的顯示區(qū)域。當(dāng)該觸摸顯示屏7檢測(cè)到在其上或附近的觸摸操作后,傳送給處理器360以確定觸摸事件的類型,隨后處理器360根據(jù)觸摸事件的類型在觸摸顯示屏上提供相應(yīng)的視覺輸出。
[0063]該處理器360是用戶設(shè)備300的控制中心,利用各種接口和線路連接整個(gè)用戶設(shè)備300的各個(gè)部分,通過運(yùn)行或執(zhí)行存儲(chǔ)在該存儲(chǔ)器320內(nèi)的軟件程序和/或模塊,執(zhí)行用戶設(shè)備300的各種功能和處理數(shù)據(jù),從而對(duì)用戶設(shè)備300進(jìn)行整體監(jiān)控。
[0064]可選的該用戶設(shè)備300還可以包括RF電路310,用于提供無線連接的WIFI模塊380,以及電源390和用于提供聲音輸入輸出的音頻電路370。
[0065]具體地,在本發(fā)明實(shí)例提出的技術(shù)方案中,音頻電路370連接麥克風(fēng)為例進(jìn)行詳細(xì)闡述,用戶可以通過用戶設(shè)備中的麥克風(fēng),輸入第一語音數(shù)據(jù)。音頻電路370接收第一語音數(shù)據(jù)。處理器360在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性,按照語音屬性,通過音頻電路370連接的揚(yáng)聲器,輸出響應(yīng)第一語音數(shù)據(jù)的第二語音數(shù)據(jù)。
[0066]基于圖3所示的帶有觸摸顯示屏的用戶設(shè)備300,本發(fā)明實(shí)施例提出的信息處理方法的技術(shù)方案中,該技術(shù)方案可以作為一個(gè)應(yīng)用程序,設(shè)置在終端中,也可以是一段程序代碼,存儲(chǔ)在存儲(chǔ)器中。
[0067]可以理解的,在本發(fā)明實(shí)例提出的技術(shù)方案中,還提出一種信息處理方法,如圖4a所示,其具體處理流程如下述:
[0068]41,用戶設(shè)備啟動(dòng)語音服務(wù)時(shí),接收第一語音數(shù)據(jù)。
[0069]42,在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性。
[0070]對(duì)接收到的第一語音數(shù)據(jù)進(jìn)行預(yù)處理后,獲得語音數(shù)據(jù)的語音特征;確定預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中和語音特征對(duì)應(yīng)的語言模型;將語言模型作為第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性。
[0071]其中,語音特征可以是消除干擾后的語音數(shù)據(jù)的頻率曲線。每種語音對(duì)應(yīng)不同的頻率,并且語音的響聲大小,直接影響頻率曲線波峰和波谷。在本發(fā)明實(shí)施例提出的技術(shù)方案中,語音數(shù)據(jù)庫中存儲(chǔ)的語言模型,該語言模型可以包含不同的語音屬性,也可以包含全部語音屬性。例如,預(yù)先存儲(chǔ)的語言模型可以是語音屬性為女性音色的語音數(shù)據(jù)包,也可以是語音屬性為男性音色的語音數(shù)據(jù)包等,在此不一一舉例。
[0072]語言模型包含發(fā)音模板;獲得語音特征中隨時(shí)間變化的語音特征矢量序列;計(jì)算語音特征矢量序列和語音數(shù)據(jù)庫中的發(fā)音模板之間的距離;在距離小于設(shè)定值時(shí),將發(fā)音模板作為和語音特征對(duì)應(yīng)的語言模型。
[0073]在本發(fā)明實(shí)例提出的語音模型中,每個(gè)語音模型都包含發(fā)音模板,通過發(fā)音模板將該語音模型以語音的形式發(fā)出。舉一例進(jìn)行詳細(xì)闡述,發(fā)音模板可以是預(yù)先存儲(chǔ)的公眾人物的聲音。在具體實(shí)施中,發(fā)音模板可以通過不同的語音特征矢量序列表征。
[0074]在本發(fā)明實(shí)例提出的技術(shù)方案中,確定語音特征對(duì)應(yīng)的語言模型時(shí),首先將語音特征進(jìn)行分解,獲得語音特征中隨之間變化的語音特征矢量序列,該語音特征矢量序列可以用于量化地表征語音特征。
[0075]然后,計(jì)算語音特征矢量序列和發(fā)音模板(即存儲(chǔ)的每個(gè)發(fā)音模板對(duì)應(yīng)的語音特征矢量)之間的距離,得到的距離值越小,則表示兩個(gè)語音特征矢量序列越相似,在本發(fā)明實(shí)例提出的技術(shù)方案中,在距離小于設(shè)定值時(shí),將發(fā)音模板作為和所述語音特征對(duì)應(yīng)的語言模型。
[0076]43,按照語音屬性輸出響應(yīng)第一語音數(shù)據(jù)的第二語音數(shù)據(jù)。
[0077]具體地,按照語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),包括下述中的至少一種:
[0078]按照語音屬性輸出響應(yīng)第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中第二語音數(shù)據(jù)和第一語音數(shù)據(jù)的語音內(nèi)容不相同。
[0079]按照語音屬性輸出響應(yīng)第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中第二語音數(shù)據(jù)是對(duì)實(shí)時(shí)測(cè)量獲得的數(shù)據(jù)進(jìn)行播報(bào)。
[0080]按照語音屬性輸出響應(yīng)第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中第二語音數(shù)據(jù)和第一語音數(shù)據(jù)的語音標(biāo)準(zhǔn)不相同。
[0081]可以理解的,在本發(fā)明實(shí)例提出的技術(shù)方案中,還提出一種信息處理裝置,如圖4b所示,包括:
[0082]接收單元401,用于在啟動(dòng)語音服務(wù)時(shí),接收第一語音數(shù)據(jù);
[0083]處理單元402,用于在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性,按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù)。
[0084]具體地,上述處理單元402對(duì)接收到的所述第一語音數(shù)據(jù)進(jìn)行預(yù)處理后,獲得所述語音數(shù)據(jù)的語音特征;確定預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中和所述語音特征對(duì)應(yīng)的語言模型;將所述語言模型作為所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性。
[0085]所述語言模型包含發(fā)音模板;上述處理單元402獲得所述語音特征中隨時(shí)間變化的語音特征矢量序列;計(jì)算所述語音特征矢量序列和語音數(shù)據(jù)庫中的發(fā)音模板之間的距離;在所述距離小于設(shè)定值時(shí),將所述發(fā)音模板作為和所述語音特征對(duì)應(yīng)的語言模型。
[0086]具體地,上述處理單元402按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),包括下述中的至少一種:按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)和所述第一語音數(shù)據(jù)的語音內(nèi)容不相同;按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)是對(duì)實(shí)時(shí)測(cè)量獲得的數(shù)據(jù)進(jìn)行播報(bào);按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)和所述第一語音數(shù)據(jù)的語音標(biāo)準(zhǔn)不相同。
[0087]本領(lǐng)域的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、裝置(設(shè)備)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、只讀光盤、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0088]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、裝置(設(shè)備)和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0089]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0090]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0091]盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對(duì)這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。
[0092]顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
【主權(quán)項(xiàng)】
1.一種信息處理方法,其特征在于,包括: 在啟動(dòng)語音服務(wù)時(shí),接收第一語音數(shù)據(jù); 在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性; 按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù)。2.如權(quán)利要求1所述的方法,其特征在于,在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性,包括: 對(duì)接收到的所述第一語音數(shù)據(jù)進(jìn)行預(yù)處理后,獲得所述語音數(shù)據(jù)的語音特征; 確定預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中和所述語音特征對(duì)應(yīng)的語言模型; 將所述語言模型作為所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性。3.如權(quán)利要求2所述的方法,其特征在于,所述語言模型包含發(fā)音模板; 確定預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中和所述語音特征對(duì)應(yīng)的語言模型,包括: 獲得所述語音特征中隨時(shí)間變化的語音特征矢量序列; 計(jì)算所述語音特征矢量序列和語音數(shù)據(jù)庫中的發(fā)音模板之間的距離; 在所述距離小于設(shè)定值時(shí),將所述發(fā)音模板作為和所述語音特征對(duì)應(yīng)的語言模型。4.如權(quán)利要求1所述的方法,其特征在于,按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),包括下述中的至少一種: 按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)和所述第一語音數(shù)據(jù)的語音內(nèi)容不相同; 按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)是對(duì)實(shí)時(shí)測(cè)量獲得的數(shù)據(jù)進(jìn)行播報(bào); 按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)和所述第一語音數(shù)據(jù)的語音標(biāo)準(zhǔn)不相同。5.如權(quán)利要求1?4任一所述的方法,其特征在于,所述語音屬性至少包含下述中的一種: 語音的物理屬性; 語音內(nèi)容; 語種識(shí)別; 語音標(biāo)準(zhǔn)。6.一種信息處理裝置,其特征在于,包括: 接收單元,用于在啟動(dòng)語音服務(wù)時(shí),接收第一語音數(shù)據(jù); 處理單元,用于在預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中,確定所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性;按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù)。7.如權(quán)利要求6所述的裝置,其特征在于,所述處理單元,具體用于對(duì)接收到的所述第一語音數(shù)據(jù)進(jìn)行預(yù)處理后,獲得所述語音數(shù)據(jù)的語音特征;確定預(yù)先存儲(chǔ)的語音數(shù)據(jù)庫中和所述語音特征對(duì)應(yīng)的語言模型;將所述語言模型作為所述第一語音數(shù)據(jù)對(duì)應(yīng)的語音屬性。8.如權(quán)利要求7所述的裝置,其特征在于,所述語言模型包含發(fā)音模板; 所述處理單元,具體用于獲得所述語音特征中隨時(shí)間變化的語音特征矢量序列;計(jì)算所述語音特征矢量序列和語音數(shù)據(jù)庫中的發(fā)音模板之間的距離;在所述距離小于設(shè)定值時(shí),將所述發(fā)音模板作為和所述語音特征對(duì)應(yīng)的語言模型。9.如權(quán)利要求6所述的裝置,其特征在于,所述處理單元按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),包括下述中的至少一種: 按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)和所述第一語音數(shù)據(jù)的語音內(nèi)容不相同; 按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)是對(duì)實(shí)時(shí)測(cè)量獲得的數(shù)據(jù)進(jìn)行播報(bào); 按照所述語音屬性輸出響應(yīng)所述第一語音數(shù)據(jù)的第二語音數(shù)據(jù),其中所述第二語音數(shù)據(jù)和所述第一語音數(shù)據(jù)的語音標(biāo)準(zhǔn)不相同。10.如權(quán)利要求6?9任一所述的裝置,其特征在于,所述處理單元,確定的所述語音屬性至少包含下述中的一種:語音的物理屬性;語音內(nèi)容;語種識(shí)別;語音標(biāo)準(zhǔn)。
【文檔編號(hào)】G10L15/06GK105895083SQ201610374151
【公開日】2016年8月24日
【申請(qǐng)日】2016年5月30日
【發(fā)明人】易鵬
【申請(qǐng)人】珠海市魅族科技有限公司