智能手機語音控制系統(tǒng)及其語音識別方法

文檔序號：7776125閱讀：607來源：國知局

智能手機語音控制系統(tǒng)及其語音識別方法
【專利摘要】一種智能手機語音控制系統(tǒng)，包括車載手機系統(tǒng)，服務器接收系統(tǒng)，SMS消息服務系統(tǒng)，Wap系統(tǒng)和Web系統(tǒng)。該控制系統(tǒng)為了能夠獲取位置等圖片信息,將Internet網(wǎng)絡技術與GIS地圖平臺、GPRS以及無線網(wǎng)絡技術相結合,通過Web應用服務系統(tǒng)以及Wap應用服務系統(tǒng)向客戶提供報警信息服務。該控制系統(tǒng)方便快捷多樣全面，會給車主帶來極大的方便與安全,在監(jiān)控、防盜方面也擁有廣闊的應用。
【專利說明】智能手機語音控制系統(tǒng)及其語音識別方法
【技術領域】
[0001]本發(fā)明涉及一種手機語音控制系統(tǒng)及其語音識別方法。
【背景技術】
[0002]現(xiàn)有技術中，車輛自救、報警監(jiān)控系統(tǒng)沒有與智能移動終端(手機)結合起來，所以對于在方便、快捷、多樣、全面性上來講有不足之處。

【發(fā)明內(nèi)容】

[0003]為了解決上述問題，本發(fā)明提供了一種手機語音控制系統(tǒng)及其語音識別方法，其整合了目前信息技術中比較流行的幾種技術，語音識別、GPS、GPRS以及GIS平臺，依賴無線網(wǎng)絡技術和Internet技術，使得車主在車輛自救、報警的同時能夠隨時跟蹤車輛的位置以及車速等相關資料。
[0004]本發(fā)明解決其技術問題所采用的技術方案是:
[0005]一方面，本發(fā)明提供了一種智能手機語音控制系統(tǒng)，包括車載手機系統(tǒng)，服務器接收系統(tǒng)，SMS消息服務系統(tǒng)，Wap系統(tǒng)和Web系統(tǒng)；
[0006]車載手機系統(tǒng)具有智能語音庫，用戶說出自然語言后，智能語音庫將用戶的語音信號轉換為文字消息并返回處理結果，然后將該文字信息發(fā)送給服務器接收系統(tǒng)；
[0007]服務器接收系統(tǒng)，接收到來自車載手機系統(tǒng)的消息后，連接GIS系統(tǒng)，并將車輛目前所在位置的坐標提供給GIS系統(tǒng)，GIS系統(tǒng)檢索地圖資料，并將結果以文字和圖片的形式反饋給服務器，服務器接收系統(tǒng)將文字資料存儲在數(shù)據(jù)庫中，把圖片資料存儲在對應的用戶資料文件夾中；
[0008]SMS消息服務系統(tǒng)在收到來自服務器接收系統(tǒng)的通知后，分檢出用戶的資料，并組合所述文字消息以及Wap系統(tǒng)提供的服務URL地址，SMS消息服務系統(tǒng)將最后組合的URL地址以手機短信的方式通過所述車載手機系統(tǒng)的發(fā)送給用戶；
[0009]當用戶收到來自車載手機系統(tǒng)的短信后，根據(jù)短信中包含的URL地址，通過手機瀏覽器來連接并訪問Wap服務器系統(tǒng)，下載相關資料，Wap服務器系統(tǒng)將資料以按照時間排序后的文本列表形式傳遞給用戶手機，用戶選擇列表中的某個連接即可查看車輛目前所在區(qū)域以及其他相關信息；并且
[0010]用戶能夠通過計算機系統(tǒng)登陸Web服務器系統(tǒng)從而查看相關資料，并且Web服務器系統(tǒng)提供了歷史記錄管理功能。
[0011]根據(jù)上述智能手機語音控制系統(tǒng)，其中用戶說出自然語言后，車載手機系統(tǒng)中所包含的手機移動終端首先調(diào)用語音控件進行錄音和智能剪輯，然后轉發(fā)語音數(shù)據(jù)到手機后臺監(jiān)控中心，手機后臺監(jiān)控中心獲取語音數(shù)據(jù)后進行處理，然后返回處理后的結果并呈現(xiàn)給手機用戶，用戶確認語音處理結果后再把所述文字信息發(fā)送給服務器接收系統(tǒng)。
[0012]根據(jù)上述智能手機語音控制系統(tǒng)，其中URL地址中包含用戶帳號和密碼信息。
[0013]根據(jù)上述智能手機語音控制系統(tǒng)，其中當所述智能語音庫根據(jù)用戶說出的自然語言判斷出用戶處于醉酒狀態(tài)時，手機終端可以進行警告提示或者實現(xiàn)自動救助。
[0014]根據(jù)上述智能手機語音控制系統(tǒng)，，其中所述自動救助包括電話自動短信或電話呼叫預先設置好的號碼以及自動報警。
[0015]另一方面，本發(fā)明提供了一種用于智能手機語音控制系統(tǒng)中的語音識別方法，包括語音信號的訓練階段和識別階段，在進行語音識別之前具有訓練階段，在訓練階段中將代表語音特征的特征參數(shù)進行處理后，為每個詞條建立一個模型，保存為參考模板；在語音識別階段，語音信號經(jīng)過相同的通道得到語音特征參數(shù)，生成測試模板，與參考模板進行匹配，將匹配值最高的參考模板作為識別結果。
[0016]根據(jù)上述語音識別方法，采用端點檢測算法確定語音的起點和終點，參考模板與測試模板采用相同類型的特征矢量、相同的幀長、相同的窗函數(shù)和相同的幀移；測試和參考模板分別用T和R表示，為了比較它們之間的匹配度，計算它們之間的距離D [T, R]，距離越小則認為它們之間的匹配值越高。
[0017]根據(jù)上述語音識別方法，設參考模板特征矢量序列為al，a2，…，am ;輸入語音特征矢量序列為bl，b2，…，bn，其中m與η之間滿足時間規(guī)正函數(shù)m=w(n)，并且該w滿足下面的公式:.V
[0018]D
【權利要求】
1.一種智能手機語音控制系統(tǒng)，包括車載手機系統(tǒng)，服務器接收系統(tǒng)，SMS消息服務系統(tǒng)，Wap系統(tǒng)和Web系統(tǒng)；其特征是: 車載手機系統(tǒng)具有智能語音庫，用戶說出自然語言后，智能語音庫將用戶的語音信號轉換為文字消息并返回處理結果，然后將該文字信息發(fā)送給服務器接收系統(tǒng)；服務器接收系統(tǒng)，接收到來自車載手機系統(tǒng)的消息后，連接GIS系統(tǒng)，并將車輛目前所在位置的坐標提供給GIS系統(tǒng)，GIS系統(tǒng)檢索地圖資料，并將結果以文字和圖片的形式反饋給服務器，服務器接收系統(tǒng)將文字資料存儲在數(shù)據(jù)庫中，把圖片資料存儲在對應的用戶資料文件夾中； SMS消息服務系統(tǒng)在收到來自服務器接收系統(tǒng)的通知后，分檢出用戶的資料，并組合所述文字消息以及Wap系統(tǒng)提供的服務URL地址，SMS消息服務系統(tǒng)將最后組合的URL地址以手機短信的方式通過所述車載手機系統(tǒng)的發(fā)送給用戶；當用戶收到來自車載手機系統(tǒng)的短信后，根據(jù)短信中包含的URL地址，通過手機瀏覽器來連接并訪問Wap服務器系統(tǒng)，下載相關資料，Wap服務器系統(tǒng)將資料以按照時間排序后的文本列表形式傳遞給用戶手機，用戶選擇列表中的某個連接即可查看車輛目前所在區(qū)域以及其他相關信息；并且用戶能夠通過計算機系統(tǒng)登陸Web服務器系統(tǒng)從而查看相關資料，并且Web服務器系統(tǒng)提供了歷史記錄管理功能。
2.根據(jù)權利要求1所述的智能手機語音控制系統(tǒng)，其特征是:用戶說出自然語言后，車載手機系統(tǒng)中所包含的手機移動終端首先調(diào)用語音控件進行錄音和智能剪輯，然后轉發(fā)語音數(shù)據(jù)到手機后臺監(jiān)控中心，手機后臺監(jiān)控中心獲取語音數(shù)據(jù)后進行處理，然后返回處理后的結果并呈現(xiàn)給手機用戶，用戶確認語音處理結果后再把所述文字信息發(fā)送給服務器接收系統(tǒng)。
3.根據(jù)權利要求1所述的智能手機語音控制系統(tǒng)，其特征是:URL地址中包含用戶帳號和密碼信息。
4.根據(jù)權利要求1所述的智能手機語音控制系統(tǒng)，其特征是:當所述智能語音庫根據(jù)用戶說出的自然語言判斷出用戶處于醉酒狀態(tài)時，手機終端可以進行警告提示或者實現(xiàn)自動救助。
5.根據(jù)權利要求4所述的智能手機語音控制系統(tǒng)，其特征是:所述自動救助包括電話自動短信或電話呼叫預先設置好的號碼以及自動報警。
6.一種用于權利要求1-5中任意一個智能手機語音控制系統(tǒng)中的語音識別方法，包括語音信號的訓練階段和識別階段，其特征是:在進行語音識別階段之前進行訓練階段，在訓練階段中將代表語音特征的語音特征參數(shù)進行處理后，為每個詞條建立一個模型，保存為參考模板；在語音識別階段，語音信號經(jīng)過相同的通道得到語音特征參數(shù)，生成測試模板，與參考模板進行匹配，將匹配值最高的參考模板作為識別結果。
7.根據(jù)權利要求6所述的語音識別方法，其特征是:采用端點檢測算法確定語音的起點和終點，參考模板與測試模板采用相同類型的特征矢量、相同的幀長、相同的窗函數(shù)和相同的幀移；測試和參考模板分別用T和R表示，為了比較它們之間的匹配度，計算它們之間的距離D[T，R]，距離越小則認為它們之間的匹配值越高。
8.根據(jù)權利要求7所述的語音識別方法，其特征是:設參考模板特征矢量序列為al，a2，…，am ;輸入語首特征矢量序列為bl，b2，…，bn，其中m與η之間滿足時間規(guī)正函數(shù)m=w(n)，并且該w滿足下面的公式:
9.根據(jù)權利要求6-8中任意一個所述的語音識別方法，其特征是:使用16b的定點DSP實現(xiàn)語音識別中的浮點運算，在精度要求比較高的地方，將計算的中間變量采用32b或者48b來表示，或者采用偽浮點法來表示浮點數(shù)，其中偽浮點法指用尾數(shù)+指數(shù)的方法來表示浮點數(shù)。
【文檔編號】H04W4/14GK103561104SQ201310556946
【公開日】2014年2月5日申請日期:2013年11月11日優(yōu)先權日:2013年11月11日
【發(fā)明者】楊喆申請人:北京百納威爾科技有限公司

完整全部詳細技術資料下載