首先,參閱圖1所示,本發(fā)明智能家居的語音播報系統(tǒng)主要由信息收集模塊11、觸發(fā)模塊12、模型存儲模塊13、語音合成模塊14及語音播放模塊15構(gòu)成。
[0050]其中,信息收集模塊11用于接收智能家居發(fā)出的報警信號,如掃地機器人在遇到最常見的兩個問題時發(fā)出的報警信號:遇到障礙物無法逾越或者在平面上遇到毛毯織物攪住刷頭時;當掃地機器人電力快用盡,電量達到剩余10%時,掃地機器人會向信息收集模塊11發(fā)出代表“遇到障礙物”的故障信號和代表“電池即將耗盡”的電量信號,提出報警。信息收集模塊11在接收到上述兩種報警信號時,分別將相關(guān)位置1,傳送到下一個模塊,觸發(fā)豐旲塊12。
[0051]觸發(fā)模塊12與信息收集模塊11連接,觸發(fā)模塊12是一個在接收到信息收集模塊11傳送來的某一位置1信號后,觸發(fā)相關(guān)文本信息進行語音合成的模塊,即觸發(fā)模塊12用于觸發(fā)對應(yīng)于報警信號的文本信息。具體的,在觸發(fā)模塊12內(nèi)存儲有與報警信號對應(yīng)的文本信息,當觸發(fā)模塊12接收到信息收集模塊11傳送來的報警信號后,在觸發(fā)模塊12內(nèi)部匹配到相應(yīng)的文本信息“遇到障礙物”或“電池即將耗盡”,該匹配到的文本信息“遇到障礙物”或“電池即將耗盡”被觸發(fā)后,進行相關(guān)文本到標注的準備工作,這是前端處理的一部分,最后將標注完成的文本信息提供給下一步的語音合成模塊14。比如,掃地機器人遇到障礙物,會觸發(fā)觸發(fā)模塊12中的“主人主人,需要救援”單元,經(jīng)相關(guān)文本到標注的前端處理后,該文本以“zhurenzhuren xuyaojiuyuan”的形式會被傳送到語音合成模塊14中去。
[0052]模型存儲模塊13用于建立和存儲聲音模型,是本發(fā)明至關(guān)重要的一步,與模型存儲模塊13連接。通過模型存儲模塊13可以建立不同音色的播報人(可以是具有瓦力機器人音色播報人,也可以是類似蠟筆小新、櫻桃小丸子等卡通人物的音色,也可以是時下網(wǎng)絡(luò)當紅的名人聲音)的聲音模型,并進行存儲,為后續(xù)的語音合成提供事先訓(xùn)練好的播報人的聲音模型,以供語音合成模塊14隨時調(diào)用,實現(xiàn)特定音色的文本播報。其中,模型存儲模塊13具體包括語音標注前端處理單元131、特征參數(shù)抽取單元132、訓(xùn)練單元133及模型存儲單元134。語音標注前端處理單元131用于通過采集2?3個小時的某個或某些播報人的聲音作為聲音數(shù)據(jù)源,并對采集的聲音數(shù)據(jù)源進行語音標注前端處理,得到該聲音數(shù)據(jù)源的文本標注信息。特征參數(shù)抽取單元132與標注前端處理單元131連接,用于提取文本標注信息的基頻和頻譜的聲學(xué)特征。訓(xùn)練單元133與特征參數(shù)抽取單元132連接,用于基于隱馬爾可夫模型(Hidden Markov Model,簡稱HMM)的參數(shù)聚類和訓(xùn)練,形成提取的聲學(xué)特征的聲音模型。模型存儲單元134與訓(xùn)練單元133連接,用于離線存儲各種音色的播報人的聲音模型。完成模型存儲模塊13對各種不同音色的播報人的聲音模型的建立和存儲,在合成需求到達時,可以調(diào)用相關(guān)播報人的聲音模型,進行語音合成,從而達到語音播報的目的。
[0053]語音合成模塊14是本發(fā)明核心技術(shù),也是貫穿整個系統(tǒng)的模塊,語音合成模塊14同時與觸發(fā)模塊12和模型存儲模塊13連接。用于調(diào)用模型存儲模塊13中存儲的聲音模型,根據(jù)該聲音模型和決策樹預(yù)測得到觸發(fā)模塊12傳送的文本信息對應(yīng)的聲學(xué)參數(shù),再將該聲學(xué)參數(shù)進行語音合成,輸出經(jīng)語音合成的語音文件。語音合成,又稱文語轉(zhuǎn)換(Text toSpeech)技術(shù),能將任意文字信息實時轉(zhuǎn)化為標準流暢的語音朗讀出來,相當于給機器裝上了人工嘴巴。它涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、計算機科學(xué)等多個學(xué)科技術(shù),是中文信息處理領(lǐng)域的一項前沿技術(shù),解決的主要問題就是如何將文字信息轉(zhuǎn)化為可聽的聲音信息,也即讓機器像人一樣開口說話。
[0054]語音合成模塊14具體包括標注存儲單元141、參數(shù)預(yù)測單元142及合成器合成語音單元143。標注存儲單元141與觸發(fā)模塊12連接,用于對觸發(fā)模塊12傳送到的文本信息“zhurenzhuren xuyaojiuyuan”,進行詞性分析和韻律預(yù)測;參數(shù)預(yù)測單元142與標注存儲單元141和模型存儲模塊13的模型存儲單元134連接,用于向模型存儲單元134發(fā)出合成需求,調(diào)用模型存儲單元134中存儲的事先訓(xùn)練好的某個播報人的聲音模型,可以是具有瓦力機器人音色的播報人,也可以是類似蠟筆小新、櫻桃小丸子等卡通人物的音色,也可以是時下網(wǎng)絡(luò)當紅的名人聲音的聲音模型,再根據(jù)該調(diào)用的聲音模型和決策樹預(yù)測得到當前文本信息對應(yīng)的聲學(xué)參數(shù)。決策樹(Decis1n Tree)是在已知各種情況發(fā)生概率的基礎(chǔ)上,通過構(gòu)成決策樹來求取凈現(xiàn)值的期望值大于等于零的概率,評價項目風險,判斷其可行性的決策分析方法,是直觀運用概率分析的一種圖解法。合成器合成語音單元143與參數(shù)預(yù)測單元142連接,用于將參數(shù)預(yù)測單元142預(yù)測得到的聲學(xué)參數(shù)送到參數(shù)合成器中進行語音合成,輸出經(jīng)語音合成的語音文件,如“主人主人,需要救援”的聲音。
[0055]語音播放模塊15與語音合成模塊14的合成器合成語音單元143連接,用于播放經(jīng)語音合成的語音文件,實現(xiàn)語音播報。本發(fā)明的語音播報系統(tǒng)可以應(yīng)用于掃地機器人等職能家居,語音播放模塊15是內(nèi)嵌在掃地機器人內(nèi)的一個語音播放器,用于播放經(jīng)語音合成的語音文件,比如,語音合成模塊14合成的語音文件“主人主人,需要救援”到達該語音播放模塊15,被播放出來。
[0056]本發(fā)明智能家居的語音播報系統(tǒng)及語音播報方法綜合利用信息收集模塊、觸發(fā)模塊、模型存儲模塊、語音合成模塊及語音播放模塊提供一套完整的解決方案,通過語音播報實現(xiàn)及時報警,并實現(xiàn)播報文本和發(fā)音音色隨時調(diào)整,在遇到新的報警場景需要更新播報文本時或想換最新的網(wǎng)絡(luò)紅人的發(fā)音音色時,可以隨時進行調(diào)整,十分的方便、節(jié)約成本且增添收聽樂趣;本發(fā)明將語音播報系統(tǒng)應(yīng)用于掃地機器人等智能家居,針對掃地機器人在運行過程中發(fā)生的錯誤,可以通過語音播報及時報警。
[0057]配合圖2所示,利用本發(fā)明的語音播報系統(tǒng)進行語音播報,主要包括如下步驟:
[0058]S001:接收智能家居發(fā)出的報警信號;
[0059]S002:觸發(fā)對應(yīng)于報警信號的文本信息;
[0060]S003:建立和存儲聲音模型;
[0061]S004:調(diào)用存儲的聲音模型,根據(jù)聲音模型和決策樹預(yù)測得到文本信息對應(yīng)的聲學(xué)參數(shù),將聲學(xué)參數(shù)進行語音合成,輸出經(jīng)語音合成的語音文件;以及
[0062]S005:播放語音文件。
[0063]其中,步驟S001:接收報警信號,包括:
[0064]接收智能家居發(fā)出的報警信號,如掃地機器人在遇到最常見的兩個問題時發(fā)出的報警信號:遇到障礙物無法逾越或者在平面上遇到毛毯織物攪住刷頭時;當掃地機器人電力快用盡,電量達到剩余10%時,掃地機器人會發(fā)出代表“遇到障礙物”或“電池即將耗盡”的報警信號,此時系統(tǒng)接收到該代表“遇到障礙物”或“電池即將耗盡”的報警信號。
[0065]S002:觸發(fā)對應(yīng)于報警信號的文本信息,包括:
[0066]接收到代表“遇到障礙物”或“電池即將耗盡”的報警信號后,觸發(fā)與“遇到障礙物”或“電池即將耗盡”的報警信號相對應(yīng)的文本信息,去進行語音合成。具體的,在系統(tǒng)內(nèi)預(yù)先存儲有與各種預(yù)鎖定的報警信號相對應(yīng)的文本信息,當接收到傳送來的報警信號后,在內(nèi)部匹配到相應(yīng)的文本信息“遇到障礙物”或“電池即將耗盡”,該匹配到的文本信息“遇到障礙物”或“電池即將耗盡”被觸發(fā)后,進行相關(guān)文本到標注的準備工作