基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng)及其語(yǔ)音識(shí)別方法
【專利摘要】本發(fā)明涉及綜合應(yīng)急管理【技術(shù)領(lǐng)域】,具體涉及一種基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng)及其語(yǔ)音識(shí)別方法。本發(fā)明保持現(xiàn)有系統(tǒng)功能前提下,加入語(yǔ)音識(shí)別系統(tǒng);語(yǔ)音識(shí)別系統(tǒng)通過(guò)硬件采集系統(tǒng)的音頻數(shù)據(jù),通過(guò)解析生成指令來(lái)實(shí)現(xiàn)與其他服務(wù)器的信息交互,達(dá)到將語(yǔ)音指令轉(zhuǎn)換成數(shù)字指令,最后通過(guò)大屏展示出來(lái)。本發(fā)明解決了智能應(yīng)急指揮系統(tǒng)的指揮信息說(shuō)到即做到的問(wèn)題;可以用于智能應(yīng)急指揮系統(tǒng)中。
【專利說(shuō)明】基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng)及其語(yǔ)音識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及綜合應(yīng)急管理【技術(shù)領(lǐng)域】,具體涉及一種基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng)及其語(yǔ)音識(shí)別方法。
【背景技術(shù)】
[0002]隨著社會(huì)的高速發(fā)展,現(xiàn)代城市事故及災(zāi)害類型也隨著城市化發(fā)展而變化和增力口,成為危及城市安全及社會(huì)的隱患。而近來(lái)自然災(zāi)害、公共衛(wèi)生、生產(chǎn)安全、恐怖事件等應(yīng)急事件頻繁出現(xiàn)更是迫使政府重視各類應(yīng)急系統(tǒng)的建設(shè),各種規(guī)模、各種行業(yè)的應(yīng)急系統(tǒng)正在建設(shè)之中。城市綜合應(yīng)急指揮系統(tǒng)就是其中一類重要的應(yīng)急系統(tǒng)。在發(fā)達(dá)國(guó)家的許多城市中,城市綜合應(yīng)急系統(tǒng)已經(jīng)成為顯示基礎(chǔ)設(shè)施水平和城市管理水平的標(biāo)志性工程,并且在關(guān)鍵時(shí)刻發(fā)揮了重要作用。城市綜合應(yīng)急系統(tǒng)建設(shè)在我國(guó)還處于初期階段,不同城市對(duì)系統(tǒng)的建設(shè)和運(yùn)用各有特點(diǎn)。因此,對(duì)城市綜合應(yīng)急系統(tǒng)設(shè)計(jì)、構(gòu)成和建設(shè)技術(shù)的研究,具有重要意義,可以為將來(lái)大規(guī)模的城市綜合應(yīng)急系統(tǒng)建設(shè)提供良好的思路和一定的參考作用。
[0003]目前應(yīng)急指揮系統(tǒng),都是采用領(lǐng)導(dǎo)說(shuō)后臺(tái)人員操作的模式,這種模式即使要完成一次像樣的演練都需要相關(guān)人員進(jìn)行至少三次的預(yù)演,熟悉自己角色的任務(wù),由于整個(gè)應(yīng)急系統(tǒng)非常龐大跨越交通、通訊、電力、水利、醫(yī)療、安防、傳媒等諸多領(lǐng)域,功能點(diǎn)多達(dá)2500個(gè),所以至少需要4名有一定經(jīng)驗(yàn)的系統(tǒng)操作人員,并且經(jīng)過(guò)至少三次的預(yù)演才能配合的比較理想。而實(shí)際應(yīng)用中情況更加復(fù)雜,沒(méi)有像演練那樣的執(zhí)行腳本按部就班,這樣后臺(tái)操作人員和領(lǐng)導(dǎo)需求就很難同步,難以達(dá)到理想效果,難以發(fā)揮現(xiàn)代應(yīng)急指揮系統(tǒng)的優(yōu)勢(shì)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明解決的技術(shù)問(wèn)題之一在于提供一種基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng),針對(duì)綜合應(yīng)急模擬演練實(shí)際,對(duì)突發(fā)事件在模擬演練仿真情景中的指揮人員的實(shí)際應(yīng)用進(jìn)行深化設(shè)計(jì);加入語(yǔ)音識(shí)別系統(tǒng),無(wú)需操作人員直接參與;系統(tǒng)將自動(dòng)切換到指揮人員想看到的頁(yè)面;實(shí)現(xiàn)說(shuō)到即做到的智能綜合應(yīng)急指揮系統(tǒng),使其更加符合實(shí)際應(yīng)用。
[0005]本發(fā)明解決的技術(shù)問(wèn)題之二在于提供一種基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng)的語(yǔ)音識(shí)別方法,在現(xiàn)有系統(tǒng)中加入語(yǔ)音識(shí)別系統(tǒng),無(wú)需操作人員直接參與;系統(tǒng)將自動(dòng)切換到指揮人員想看到的頁(yè)面;實(shí)現(xiàn)說(shuō)到即做到的智能綜合應(yīng)急指揮系統(tǒng),使其更加符合實(shí)際應(yīng)用。
[0006]本發(fā)明解決上述技術(shù)問(wèn)題之一的技術(shù)方案是:
[0007]所述的系統(tǒng)由基礎(chǔ)支撐平臺(tái)、綜合應(yīng)用系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)、應(yīng)急指揮場(chǎng)所、移動(dòng)應(yīng)急平臺(tái)構(gòu)成;
[0008]所述的基礎(chǔ)支撐平臺(tái)為應(yīng)急平臺(tái)的正常運(yùn)行提供基礎(chǔ)保障,主要包括WEB服務(wù)器、計(jì)算機(jī)網(wǎng)絡(luò)、電話服務(wù)器、視頻監(jiān)控服務(wù)器、視頻會(huì)議服務(wù)器、數(shù)字大屏矩陣服務(wù)器、主機(jī)存儲(chǔ)、數(shù)據(jù)交換與共享、語(yǔ)音識(shí)別系統(tǒng)、錄音錄像服務(wù)器及應(yīng)急地理信息系統(tǒng);所述的語(yǔ)音識(shí)別系統(tǒng)通過(guò)硬件采集系統(tǒng)的音頻數(shù)據(jù),通過(guò)解析生成指令來(lái)實(shí)現(xiàn)與其他服務(wù)器的信息交互,達(dá)到將語(yǔ)音指令轉(zhuǎn)換成數(shù)字指令,最后通過(guò)大屏展示出來(lái);
[0009]所述的應(yīng)急指揮場(chǎng)所由一系列獨(dú)立的視、音頻系統(tǒng),以及對(duì)它們進(jìn)行控制的集中控制系統(tǒng)和場(chǎng)所保障環(huán)境組成的安全的、智能化應(yīng)急指揮環(huán)境;包括顯示系統(tǒng)、會(huì)議系統(tǒng)、擴(kuò)聲系統(tǒng)、集中控制、智能燈光照明、綜合布線、供電系統(tǒng)等系統(tǒng);從功能區(qū)域上,應(yīng)急指揮場(chǎng)所可劃分為應(yīng)急指揮廳、值班室、會(huì)商室等場(chǎng)所區(qū)域;總體上采用以集中控制為中心的網(wǎng)絡(luò)化多媒體指揮環(huán)境,通過(guò)綜合布線設(shè)連接指揮大廳、應(yīng)急值班室、會(huì)商室等相關(guān)的指揮場(chǎng)所,通過(guò)對(duì)各種音視頻信號(hào)的集中交換與處理,并對(duì)投影、矩陣、功放等多媒體設(shè)備進(jìn)行必要的集成,實(shí)現(xiàn)本地、遠(yuǎn)程分散/集中的應(yīng)急指揮應(yīng)用對(duì)音視頻的需要,從而達(dá)到實(shí)現(xiàn)網(wǎng)絡(luò)化、一體化管理,智能化應(yīng)急指揮環(huán)境的整體目標(biāo);
[0010]所述的綜合應(yīng)用系統(tǒng)是應(yīng)急平臺(tái)的核心和靈魂,提供強(qiáng)大的應(yīng)急業(yè)務(wù)管理和應(yīng)急智能決策能力,主要包括信息資源、應(yīng)急預(yù)案、監(jiān)測(cè)預(yù)警、值班值守、事件管理、研判決策、指揮調(diào)度、模擬演練、知識(shí)庫(kù)、系統(tǒng)設(shè)置等功能模塊;
[0011]所述的數(shù)據(jù)庫(kù)系統(tǒng)采用集中式和分布式兩種存儲(chǔ)方式,常用基礎(chǔ)數(shù)據(jù)和區(qū)縣、部門的部分關(guān)鍵數(shù)據(jù)存儲(chǔ)于應(yīng)急平臺(tái)的中心數(shù)據(jù)庫(kù)中,其它數(shù)據(jù)分布式存儲(chǔ)于相關(guān)單位數(shù)據(jù)庫(kù)中;應(yīng)急平臺(tái)中心數(shù)據(jù)庫(kù)主要包括基礎(chǔ)信息數(shù)據(jù)庫(kù)、空間信息數(shù)據(jù)庫(kù)、事件信息數(shù)據(jù)庫(kù)、預(yù)案庫(kù)、案例庫(kù)、模型庫(kù)、知識(shí)庫(kù)和文檔庫(kù)等
[0012]所述的移動(dòng)應(yīng)急平臺(tái)滿足現(xiàn)場(chǎng)應(yīng)急通信、現(xiàn)場(chǎng)會(huì)商、指揮調(diào)度、移動(dòng)辦公、現(xiàn)場(chǎng)圖像視頻采集等功能,主要通過(guò)衛(wèi)星、公眾通信網(wǎng)等通信手段與相關(guān)應(yīng)急平臺(tái)以及有關(guān)方面進(jìn)行聯(lián)通。
[0013]所述基礎(chǔ)支撐平臺(tái)的WEB服務(wù)器是應(yīng)急平臺(tái)聯(lián)系個(gè)模塊將結(jié)果展示出來(lái)的服務(wù)系統(tǒng),是人機(jī)交互的接口,包括信息資源、應(yīng)急預(yù)案、監(jiān)測(cè)預(yù)警、值班值守、時(shí)間管理、研判決策、調(diào)度指揮、模擬演練、知識(shí)庫(kù)和系統(tǒng)管理;
[0014]計(jì)算機(jī)網(wǎng)絡(luò)主要用于內(nèi)、外網(wǎng)應(yīng)用系統(tǒng)的承載和數(shù)據(jù)交換的承載,主要包含相應(yīng)的廣域網(wǎng)接入和局域網(wǎng)網(wǎng)絡(luò)設(shè)備;
[0015]視頻會(huì)議服務(wù)器主要用于在重大突發(fā)公共事件發(fā)生時(shí)各級(jí)應(yīng)急平臺(tái)之間的協(xié)調(diào)溝通,會(huì)議會(huì)商;主要由MCU、視頻會(huì)議終端、視頻會(huì)議服務(wù)器等組成;
[0016]視頻監(jiān)控服務(wù)器主要用于接入個(gè)部門、包括公安、消防、三防辦、電信、林業(yè)局、水利局、公園等的攝像頭進(jìn)行統(tǒng)一管理和隨時(shí)查看實(shí)時(shí)圖像;實(shí)時(shí)圖像數(shù)據(jù)依托有關(guān)部門現(xiàn)有圖像監(jiān)控系統(tǒng),采用數(shù)字方式,由各部門應(yīng)急平臺(tái)負(fù)責(zé)將本系統(tǒng)的圖像轉(zhuǎn)換后上傳,主要由圖像接入服務(wù)器、編解碼器等組成;
[0017]數(shù)字大屏屏矩陣服務(wù)器主要用于將應(yīng)急系統(tǒng)投放到指揮大廳,展示給所有參會(huì)人員;大屏可以自定義分割成若干部分,每部分顯示不同的內(nèi)容;還包括大廳音箱系統(tǒng);
[0018]主機(jī)存儲(chǔ),實(shí)現(xiàn)應(yīng)急平臺(tái)服務(wù)器與存儲(chǔ)系統(tǒng)的完整配置,建立應(yīng)急平臺(tái)各項(xiàng)業(yè)務(wù)應(yīng)用系統(tǒng)的運(yùn)行服務(wù)器環(huán)境,建立應(yīng)急平臺(tái)各類系統(tǒng)、各類數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)與備份環(huán)境;主要包含各類應(yīng)用和數(shù)據(jù)庫(kù)服務(wù)器、磁盤陣列、光纖交換機(jī)、存儲(chǔ)管理軟件等設(shè)備;
[0019]數(shù)據(jù)交換與共享是應(yīng)急平臺(tái)管理應(yīng)急信息資源目錄、支撐應(yīng)急信息資源共享交換的基礎(chǔ)系統(tǒng);
[0020]錄音錄像服務(wù)器用于存儲(chǔ)電話錄音文件的音頻文件和視頻監(jiān)控的視頻文件,在應(yīng)急系統(tǒng)中可以通過(guò)條件查詢、預(yù)覽和下載音頻和視頻文件;
[0021]應(yīng)急地理信息系統(tǒng)提供對(duì)應(yīng)急基礎(chǔ)數(shù)據(jù)的可視化表現(xiàn),直觀地反映了突發(fā)事件周邊的地形地貌、保護(hù)目標(biāo)和危險(xiǎn)源以及救援隊(duì)伍的分布,便于領(lǐng)導(dǎo)在應(yīng)急中掌握事發(fā)態(tài)勢(shì),優(yōu)化資源配置,制定救援方案。
[0022]所述的語(yǔ)音識(shí)別系統(tǒng)采用嵌入式語(yǔ)音的設(shè)備;由語(yǔ)音檢測(cè)模塊、特征提取模塊、識(shí)別搜索模塊和語(yǔ)義分析模塊幾部分構(gòu)成;
[0023]所述的語(yǔ)音識(shí)別模塊是對(duì)送入的原始語(yǔ)音數(shù)據(jù)進(jìn)行預(yù)處理和檢測(cè),將原始語(yǔ)音信號(hào)數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)數(shù)據(jù)格式,并通過(guò)高效的語(yǔ)音信號(hào)檢測(cè)算法檢測(cè)到語(yǔ)音的起始點(diǎn)和中止占.
[0024]特征提取模塊接收語(yǔ)音識(shí)別模塊送入的語(yǔ)音數(shù)據(jù)流,提取得到語(yǔ)音信號(hào)的特征矢量;在這個(gè)模塊中需要對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)加重、分幀、加窗、頻域變換、倒譜變換、差分等處理;最終得到40維左右的特征矢量;
[0025]識(shí)別搜索模塊接收特征提取模塊送入的語(yǔ)音特征矢量;對(duì)未知語(yǔ)音信號(hào)的特征與引擎內(nèi)含的聲學(xué)模型庫(kù)、字典/詞典和識(shí)別語(yǔ)法信息進(jìn)行匹配得到最適合未知語(yǔ)音特征的詞序列;可提供多個(gè)識(shí)別結(jié)果的候選供用戶進(jìn)行選擇,方便設(shè)計(jì)靈活的人機(jī)界面;
[0026]語(yǔ)義分析模塊基于識(shí)別任務(wù)的語(yǔ)法信息通過(guò)對(duì)識(shí)別搜索模塊得到的詞序列結(jié)果進(jìn)行語(yǔ)法、語(yǔ)義分析得到識(shí)別結(jié)果的語(yǔ)義信息。
[0027]本發(fā)明解決上述技術(shù)問(wèn)題之二的技術(shù)方案是:
[0028]所述的方法是對(duì)輸入的原始語(yǔ)音流進(jìn)行語(yǔ)音檢測(cè),然后進(jìn)行特征提??;再結(jié)合特征碼本進(jìn)行量化編碼;量化編碼后的信號(hào),結(jié)合聲學(xué)模型、字典詞典、識(shí)別語(yǔ)法進(jìn)行識(shí)別搜索、語(yǔ)義分析;然后,輸入到系統(tǒng)相應(yīng)部分。
[0029]所述的識(shí)別搜索包括:
[0030]A.識(shí)別語(yǔ)法
[0031]首先需要定義識(shí)別語(yǔ)法;識(shí)別語(yǔ)法包含了對(duì)于識(shí)別任務(wù)的描述;其中包含各種符合說(shuō)話語(yǔ)法和任務(wù)場(chǎng)景的句子信息;
[0032]B.字典詞典
[0033]字典詞典包含了各種單字/單詞的發(fā)音信息,一個(gè)詞或者字的發(fā)音由音素組成;
[0034]C.聲學(xué)模型
[0035]聲學(xué)模型是語(yǔ)音識(shí)別引擎最核心的引擎資源文件,包含了對(duì)于語(yǔ)音信號(hào)頻譜和時(shí)間序列特征的精確描述;
[0036]D.識(shí)別搜索
[0037]是在未知句子或者詞序列候選空間中搜索得到具有最佳匹配結(jié)果的候選句子;識(shí)別過(guò)程是:通過(guò)檢索字典/詞典可以將句子由詞序列分解成音素的序列;這種音素的序列與聲學(xué)模型相結(jié)合就得到更反映其本質(zhì)屬性的聲學(xué)模型單元序列;然后,將原始語(yǔ)音的特征矢量與所有可能的句子候選的聲學(xué)模型單元序列的信息相互匹配計(jì)算得到其匹配概率;從中挑選出具有最大后驗(yàn)概率的聲學(xué)模型單元序列;通過(guò)該單元序列可以得到與之對(duì)應(yīng)的詞序列;作為輸出結(jié)果。
[0038]所述的語(yǔ)義分析是:
[0039]A.應(yīng)用程序啟動(dòng)錄音程序開始錄音,同時(shí)應(yīng)用程序會(huì)通過(guò)識(shí)別引擎API語(yǔ)音識(shí)別引擎申請(qǐng)一個(gè)識(shí)別資源;
[0040]B.識(shí)別引擎根據(jù)系統(tǒng)資源情況創(chuàng)建并分配一個(gè)空閑的識(shí)別句柄給該次任務(wù);
[0041]C.應(yīng)用程序獲得該識(shí)別會(huì)話控制權(quán)后;根據(jù)當(dāng)前系統(tǒng)的任務(wù)通過(guò)API通知識(shí)別引擎加載相應(yīng)語(yǔ)法;
[0042]D.應(yīng)用程序通過(guò)API函數(shù)把錄取的語(yǔ)音數(shù)據(jù)發(fā)送給該會(huì)話;該會(huì)話根據(jù)系統(tǒng)的模型和加載的語(yǔ)法對(duì)送入的語(yǔ)音進(jìn)行識(shí)別;
[0043]E.如果有識(shí)別結(jié)果;系統(tǒng)會(huì)通過(guò)回調(diào)函數(shù)來(lái)通知應(yīng)用程序;應(yīng)用程序此時(shí)可以通過(guò)引擎的API來(lái)獲取識(shí)別結(jié)果;
[0044]F.應(yīng)用程序卸載加載的語(yǔ)法;
[0045]G.應(yīng)用程序斷開該會(huì)話連接;
[0046]H.應(yīng)用程序釋放會(huì)話;此時(shí)應(yīng)用程序應(yīng)該根據(jù)識(shí)別結(jié)果做相應(yīng)的動(dòng)作,如繼續(xù)播放提示音,提示用戶繼續(xù)提供信息或做其他的動(dòng)作。
[0047]本發(fā)明的智能語(yǔ)音識(shí)別應(yīng)急指揮系統(tǒng)是在傳統(tǒng)應(yīng)急指揮系統(tǒng)基礎(chǔ)上保持原有系統(tǒng)功能不變,加入了新的功能服務(wù)器實(shí)現(xiàn)語(yǔ)音識(shí)別的功能,將傳統(tǒng)應(yīng)急指揮系統(tǒng)有人工操作變?yōu)槟苈牰酥v話的智能系統(tǒng);無(wú)需操作人員直接參與系統(tǒng)將自動(dòng)切換到指揮人員想看到的頁(yè)面,實(shí)現(xiàn)說(shuō)到即做到的智能綜合應(yīng)急指揮系統(tǒng),使其更加符合實(shí)際應(yīng)用。
【專利附圖】
【附圖說(shuō)明】
[0048]下面結(jié)合附圖對(duì)本發(fā)明進(jìn)一步說(shuō)明:
[0049]圖1是本發(fā)明系統(tǒng)結(jié)構(gòu)框圖;
[0050]圖2是本發(fā)明語(yǔ)音識(shí)別流程圖;
[0051]圖3是本發(fā)明語(yǔ)音聲學(xué)特征壓縮后的流程圖。
【具體實(shí)施方式】
[0052]見圖1所示,本發(fā)明系統(tǒng)建設(shè)由基礎(chǔ)支撐平臺(tái)、數(shù)據(jù)庫(kù)系統(tǒng)、綜合應(yīng)用系統(tǒng)、應(yīng)急指揮場(chǎng)所、移動(dòng)應(yīng)急平臺(tái)構(gòu)成,基礎(chǔ)支撐平臺(tái)為應(yīng)急平臺(tái)的正常運(yùn)行提供基礎(chǔ)保障,主要包括WEB服務(wù)器、計(jì)算機(jī)網(wǎng)絡(luò)、電話服務(wù)器、視頻監(jiān)控服務(wù)器、視頻會(huì)議服務(wù)器、數(shù)字大屏矩陣服務(wù)器、主機(jī)存儲(chǔ)、數(shù)據(jù)交換與共享、語(yǔ)音識(shí)別系統(tǒng)、錄音錄像服務(wù)器及應(yīng)急地理信息系統(tǒng)坐寸ο
[0053]WEB服務(wù)器是應(yīng)急平臺(tái)聯(lián)系個(gè)模塊將結(jié)果展示出來(lái)的服務(wù)系統(tǒng),是人機(jī)交互的接口,包括信息資源、應(yīng)急預(yù)案、監(jiān)測(cè)預(yù)警、值班值守、時(shí)間管理、研判決策、調(diào)度指揮、模擬演練、知識(shí)庫(kù)和系統(tǒng)管理。
[0054]計(jì)算機(jī)網(wǎng)絡(luò)主要用于內(nèi)、外網(wǎng)應(yīng)用系統(tǒng)的承載和數(shù)據(jù)交換的承載,主要包含相應(yīng)的廣域網(wǎng)接入和局域網(wǎng)網(wǎng)絡(luò)設(shè)備。
[0055]視頻會(huì)議服務(wù)器主要用于在重大突發(fā)公共事件發(fā)生時(shí)各級(jí)應(yīng)急平臺(tái)之間的協(xié)調(diào)溝通,會(huì)議會(huì)商。主要由MCU、視頻會(huì)議終端、視頻會(huì)議服務(wù)器等組成。
[0056]視頻監(jiān)控服務(wù)器主要用于接入個(gè)部門、包括公安、消防、三防辦、電信、林業(yè)局、水利局、公園等的攝像頭進(jìn)行統(tǒng)一管理和隨時(shí)查看實(shí)時(shí)圖像。實(shí)時(shí)圖像數(shù)據(jù)依托有關(guān)部門現(xiàn)有圖像監(jiān)控系統(tǒng),采用數(shù)字方式,由各部門應(yīng)急平臺(tái)負(fù)責(zé)將本系統(tǒng)的圖像轉(zhuǎn)換后上傳,圖像接入系統(tǒng)主要由圖像接入服務(wù)器、編解碼器等組成。
[0057]數(shù)字大屏矩陣服務(wù)器主要用于將應(yīng)急系統(tǒng)投放到指揮大廳,展示給所有參會(huì)人員。大屏可以自定義分割成若干部分,每部分顯示不同的內(nèi)容還包括大廳音箱系統(tǒng)。
[0058]主機(jī)存儲(chǔ),實(shí)現(xiàn)應(yīng)急平臺(tái)服務(wù)器與存儲(chǔ)系統(tǒng)的完整配置,建立應(yīng)急平臺(tái)各項(xiàng)業(yè)務(wù)應(yīng)用系統(tǒng)的運(yùn)行服務(wù)器環(huán)境,建立應(yīng)急平臺(tái)各類系統(tǒng)、各類數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)與備份環(huán)境。主要包含各類應(yīng)用和數(shù)據(jù)庫(kù)服務(wù)器、磁盤陣列、光纖交換機(jī)、存儲(chǔ)管理軟件等設(shè)備。
[0059]數(shù)據(jù)交換與共享應(yīng)急平臺(tái)管理應(yīng)急信息資源目錄、支撐應(yīng)急信息資源共享交換的基礎(chǔ)系統(tǒng)。
[0060]錄音錄像服務(wù)器用于存儲(chǔ)電話錄音文件的音頻文件和視頻監(jiān)控的視頻文件,在應(yīng)急系統(tǒng)中可以通過(guò)條件查詢、預(yù)覽和下載音頻和視頻文件。
[0061]應(yīng)急地理信息系統(tǒng)提供對(duì)應(yīng)急基礎(chǔ)數(shù)據(jù)的可視化表現(xiàn),直觀地反映了突發(fā)事件周邊的地形地貌、保護(hù)目標(biāo)和危險(xiǎn)源以及救援隊(duì)伍的分布,便于領(lǐng)導(dǎo)在應(yīng)急中掌握事發(fā)態(tài)勢(shì),優(yōu)化資源配置,制定救援方案。
[0062]應(yīng)急指揮場(chǎng)所是由一系列獨(dú)立的視、音頻系統(tǒng),以及對(duì)它們進(jìn)行控制的集中控制系統(tǒng)和場(chǎng)所保障環(huán)境組成的安全的、智能化應(yīng)急指揮環(huán)境,包括顯示系統(tǒng)、會(huì)議系統(tǒng)、擴(kuò)聲系統(tǒng)、集中控制、智能燈光照明、綜合布線、供電系統(tǒng)等系統(tǒng)。從功能區(qū)域上,應(yīng)急指揮場(chǎng)所可劃分為應(yīng)急指揮廳、值班室、會(huì)商室等場(chǎng)所區(qū)域??傮w設(shè)計(jì)上采用以集中控制為中心的網(wǎng)絡(luò)化多媒體指揮環(huán)境的整體設(shè)計(jì)思想,通過(guò)綜合布線設(shè)連接指揮大廳、應(yīng)急值班室、會(huì)商室等相關(guān)的指揮場(chǎng)所,通過(guò)對(duì)各種音視頻信號(hào)的集中交換與處理,并對(duì)投影、矩陣、功放等多媒體設(shè)備進(jìn)行必要的集成,實(shí)現(xiàn)本地、遠(yuǎn)程分散/集中的應(yīng)急指揮應(yīng)用對(duì)音視頻的需要,從而達(dá)到實(shí)現(xiàn)網(wǎng)絡(luò)化、一體化管理,智能化應(yīng)急指揮環(huán)境的整體目標(biāo)。
[0063]綜合應(yīng)用系統(tǒng)是應(yīng)急平臺(tái)的核心和靈魂,提供強(qiáng)大的應(yīng)急業(yè)務(wù)管理和應(yīng)急智能決策能力,主要包括信息資源、應(yīng)急預(yù)案、監(jiān)測(cè)預(yù)警、值班值守、事件管理、研判決策、指揮調(diào)度、模擬演練、知識(shí)庫(kù)、系統(tǒng)設(shè)置等功能模塊。
[0064]數(shù)據(jù)庫(kù)系統(tǒng)采用集中式和分布式兩種存儲(chǔ)方式,常用基礎(chǔ)數(shù)據(jù)和區(qū)縣、部門的部分關(guān)鍵數(shù)據(jù)存儲(chǔ)于應(yīng)急平臺(tái)的中心數(shù)據(jù)庫(kù)中,其它數(shù)據(jù)分布式存儲(chǔ)于相關(guān)單位數(shù)據(jù)庫(kù)中。應(yīng)急平臺(tái)中心數(shù)據(jù)庫(kù)主要包括基礎(chǔ)信息數(shù)據(jù)庫(kù)、空間信息數(shù)據(jù)庫(kù)、事件信息數(shù)據(jù)庫(kù)、預(yù)案庫(kù)、案例庫(kù)、模型庫(kù)、知識(shí)庫(kù)和文檔庫(kù)等。
[0065]移動(dòng)應(yīng)急平臺(tái)滿足現(xiàn)場(chǎng)應(yīng)急通信、現(xiàn)場(chǎng)會(huì)商、指揮調(diào)度、移動(dòng)辦公、現(xiàn)場(chǎng)圖像視頻采集等功能,主要通過(guò)衛(wèi)星、公眾通信網(wǎng)等通信手段與相關(guān)應(yīng)急平臺(tái)以及有關(guān)方面進(jìn)行聯(lián)通。
[0066]目前國(guó)內(nèi)和國(guó)際現(xiàn)有應(yīng)急系統(tǒng)沒(méi)有語(yǔ)音識(shí)別功能,不能對(duì)語(yǔ)音做出任何反應(yīng)。智能語(yǔ)音識(shí)別系統(tǒng),是將語(yǔ)音識(shí)別做成一個(gè)功能子模塊(即語(yǔ)音識(shí)別服務(wù)器)作為后臺(tái)服務(wù),來(lái)響應(yīng)指揮人員的語(yǔ)音命令。例如在一次應(yīng)急指揮中指揮員對(duì)著話筒說(shuō):“顯示傷員救援情況! “,而傳統(tǒng)的應(yīng)急指揮系統(tǒng)是后臺(tái)操作人員聽見領(lǐng)導(dǎo)說(shuō)要看傷員的救援的視頻先打開視頻再將屏幕切換到大屏中央,智能語(yǔ)音識(shí)別應(yīng)急指揮系統(tǒng)能聽懂指揮員說(shuō)的話,在沒(méi)有任何后臺(tái)操作人員的參與下將人們醫(yī)院救援傷員的視頻自動(dòng)顯示在大屏中央。
[0067]智能語(yǔ)音識(shí)別應(yīng)急指揮系統(tǒng)是在傳統(tǒng)應(yīng)急指揮系統(tǒng)基礎(chǔ)上那個(gè)保持原有系統(tǒng)功能不變,加入了新的功能服務(wù)器實(shí)現(xiàn)語(yǔ)音識(shí)別的功能,將傳統(tǒng)應(yīng)急指揮系統(tǒng)有人工操作變?yōu)槟苈牰酥v話的智能系統(tǒng)。
[0068]語(yǔ)音識(shí)系統(tǒng)是一個(gè)獨(dú)立的服務(wù)器,通過(guò)硬件連接到指揮臺(tái)采集音頻數(shù)據(jù),服務(wù)器通過(guò)解析生成指令通過(guò)軟件編程來(lái)實(shí)現(xiàn)與其他服務(wù)器的信息交互,達(dá)到將語(yǔ)音指令轉(zhuǎn)換成數(shù)字指令,最后通過(guò)大屏展示出來(lái)。
[0069]語(yǔ)音識(shí)別系統(tǒng)采用嵌入式語(yǔ)音的設(shè)備;由語(yǔ)音檢測(cè)模塊、特征提取模塊、識(shí)別搜索模塊和語(yǔ)義分析模塊幾部分構(gòu)成。
[0070]引擎采集的原始語(yǔ)音數(shù)據(jù)被送入語(yǔ)音檢測(cè)模塊,該模塊進(jìn)行語(yǔ)音信號(hào)的預(yù)處理和檢測(cè),將原始語(yǔ)音信號(hào)數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)數(shù)據(jù)格式如:8k,16bit并通過(guò)高效的語(yǔ)音信號(hào)檢測(cè)算法,檢測(cè)到語(yǔ)音的起始點(diǎn)和中止點(diǎn)。
[0071]檢測(cè)后的語(yǔ)音數(shù)據(jù)流被送入特征提取模塊,提取得到語(yǔ)音信號(hào)的特征矢量流語(yǔ)音識(shí)別芯片引擎中采用MFCC(Mel_scale FreqUency CepStrum Coefficient)特征。語(yǔ)音特征是利用數(shù)字信號(hào)處理技術(shù)從語(yǔ)音信號(hào)中提取最反應(yīng)其本質(zhì)屬性的信息。在這個(gè)模塊中需要對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)加重、分幀、加窗、頻域變換、倒譜變換、差分等處理最終得到40維左右的特征矢量。
[0072]語(yǔ)音特征矢量被送入識(shí)別搜索模塊;在這個(gè)模塊中未知語(yǔ)音信號(hào)的特征與引擎內(nèi)含的聲學(xué)模型庫(kù)、字典/詞典和識(shí)別語(yǔ)法信息進(jìn)行匹配得到最適合未知語(yǔ)音特征的詞序列。這個(gè)模塊是識(shí)別引擎的核心。下面對(duì)該模塊進(jìn)行具體的說(shuō)明:
[0073]A.識(shí)別語(yǔ)法
[0074]用戶在開發(fā)一個(gè)語(yǔ)音識(shí)別系統(tǒng)時(shí)首先需要定義識(shí)別語(yǔ)法識(shí)別語(yǔ)法包含了對(duì)于識(shí)別任務(wù)的描述。簡(jiǎn)單的說(shuō)就是其中包含各種符合說(shuō)話語(yǔ)法和任務(wù)場(chǎng)景的句子信息。
[0075]B.詞典
[0076]詞典包含了各種單字/單詞的發(fā)音信息一個(gè)詞或者字的發(fā)音由音素組成。
[0077]C.聲學(xué)模型
[0078]聲學(xué)模型是語(yǔ)音識(shí)別引擎最核心的引擎資源文件包含了對(duì)于語(yǔ)音信號(hào)頻譜和時(shí)間序列特征的精確描述。華鎮(zhèn)電子識(shí)別引擎采用了 HMM(隱含馬爾科夫模型)聲學(xué)模型來(lái)描述語(yǔ)音信號(hào)這個(gè)模型是通過(guò)對(duì)大量說(shuō)話人在不同場(chǎng)景的語(yǔ)音數(shù)據(jù)庫(kù)進(jìn)行訓(xùn)練得到的。
[0079]D.識(shí)別搜索
[0080]所謂搜索算法就是在未知句子或者詞序列候選空間中搜索得到具有最佳匹配結(jié)果的候選句子。這個(gè)過(guò)程可以簡(jiǎn)單的描述如下:通過(guò)檢索字典/詞典可以將句子由詞序列分解成音素的序列。這種音素的序列與聲學(xué)模型相結(jié)合就得到更反映其本質(zhì)屬性的聲學(xué)模型單元序列;如狀態(tài)序列信息。然后將原始語(yǔ)音的特征矢量與所有可能的句子候選的聲學(xué)模型單元序列的信息相互匹配計(jì)算得到其匹配概率;從中挑選出具有最大后驗(yàn)概率的聲學(xué)模型單元序列。通過(guò)該單元序列可以得到與之對(duì)應(yīng)的詞序列;就是這個(gè)模塊的輸出結(jié)果。在這個(gè)過(guò)程中涉及到各種信息的綜合利用;計(jì)算量非常巨大。本發(fā)明方案對(duì)識(shí)別空間進(jìn)行有效的裁剪使識(shí)別過(guò)程占用的計(jì)算資源和內(nèi)存資源大大降低;能夠快速有效地獲取精確的識(shí)別結(jié)果。
[0081]在語(yǔ)義分析模塊中,基于識(shí)別任務(wù)的語(yǔ)法信息通過(guò)對(duì)搜索模塊得到的詞序列結(jié)果進(jìn)行語(yǔ)法、語(yǔ)義分析;得到識(shí)別結(jié)果的語(yǔ)義信息。識(shí)別引擎還能夠提供多個(gè)識(shí)別結(jié)果的候選供用戶進(jìn)行選擇;方便設(shè)計(jì)靈活的人機(jī)界面。
[0082]應(yīng)用程序通過(guò)調(diào)用語(yǔ)音識(shí)別引擎的一系列API函數(shù)來(lái)實(shí)現(xiàn)語(yǔ)音識(shí)別功能其基本過(guò)程如下:
[0083]1.應(yīng)用程序啟動(dòng)錄音程序開始錄音,同時(shí)應(yīng)用程序會(huì)通過(guò)識(shí)別引擎API語(yǔ)音識(shí)別引擎申請(qǐng)一個(gè)識(shí)別資源。
[0084]2.識(shí)別引擎的會(huì)根據(jù)系統(tǒng)資源情況創(chuàng)建并分配一個(gè)空閑的識(shí)別句柄給該次任務(wù)。
[0085]3.應(yīng)用程序獲得該識(shí)別會(huì)話控制權(quán)后根據(jù)當(dāng)前系統(tǒng)的任務(wù)^SAPI通知識(shí)別引擎加載相應(yīng)語(yǔ)法。
[0086]4.應(yīng)用程序通過(guò)API函數(shù)把錄取的語(yǔ)音數(shù)據(jù)發(fā)送給該會(huì)話該會(huì)話會(huì)根據(jù)系統(tǒng)的模型和加載的語(yǔ)法對(duì)送入的語(yǔ)音進(jìn)行識(shí)別。
[0087]5.如果有識(shí)別結(jié)果系統(tǒng)會(huì)通過(guò)回調(diào)函數(shù)來(lái)通知應(yīng)用程序;應(yīng)用程序此時(shí)可以通過(guò)引擎的API來(lái)獲取識(shí)別結(jié)果。
[0088]6.應(yīng)用程序卸載加載的語(yǔ)法。
[0089]7.應(yīng)用程序斷開該會(huì)話連接。
[0090]8.應(yīng)用程序釋放會(huì)話。此時(shí)應(yīng)用程序應(yīng)該根據(jù)識(shí)別結(jié)果做相應(yīng)的動(dòng)作,如繼續(xù)播放提示音,提示用戶繼續(xù)提供信息或做其他的動(dòng)作。
[0091]本系統(tǒng)采用的語(yǔ)音解決方案的語(yǔ)音識(shí)別引擎提供的應(yīng)用模式是,通過(guò)識(shí)別引擎API直接訪問(wèn)語(yǔ)音識(shí)別引擎。這種方法或者用于需要應(yīng)用程序和識(shí)別引擎緊密結(jié)合或者是應(yīng)用在已有軟件平臺(tái)中直接使用識(shí)別引擎的場(chǎng)合。MSR API包含兩部分語(yǔ)音檢測(cè)API和語(yǔ)音識(shí)別API。在使用MSR API時(shí)應(yīng)用程序需要直接訪問(wèn)語(yǔ)音檢測(cè)API和語(yǔ)音識(shí)別API ;并負(fù)責(zé)將語(yǔ)音檢測(cè)API檢測(cè)出的語(yǔ)音數(shù)據(jù)送給語(yǔ)音識(shí)別API進(jìn)行語(yǔ)音識(shí)別。
[0092]語(yǔ)音識(shí)別系統(tǒng)中需要將語(yǔ)音輸入的時(shí)域聲波轉(zhuǎn)換成一種數(shù)字化的矢量特征來(lái)描述區(qū)分不同的發(fā)音,我們稱之為語(yǔ)音特征,基于該特征對(duì)所有的發(fā)音建立一個(gè)聲音模型,這在語(yǔ)音識(shí)別領(lǐng)域我們通常稱之為聲學(xué)模型所有的語(yǔ)音識(shí)別系統(tǒng)都必須要有一個(gè)聲學(xué)模型,同時(shí)對(duì)于大詞表連續(xù)語(yǔ)音識(shí)別系統(tǒng)來(lái)說(shuō)還需要一個(gè)語(yǔ)言模型在我們解決方案的語(yǔ)音識(shí)別引擎中語(yǔ)言模型為自定義的語(yǔ)法。語(yǔ)音識(shí)別的目的就是要在給定一串聲音特征序列為輸入條件,利用聲學(xué)模型和語(yǔ)言模型采用搜索算法輸出識(shí)別結(jié)果字、詞或句子。換言之,語(yǔ)音識(shí)別系統(tǒng)就是要在巨大的句子或字、詞空間中找出與給定輸入特征序列相匹配具有最大概率的句子或字、詞。在當(dāng)今流行的語(yǔ)音識(shí)別系統(tǒng)中聲學(xué)模型都是用隱含馬爾可夫模型HMM來(lái)描述由于基于連續(xù)概率密度的HMM,CDHMM與基于離散概率密度的HMM相比更能精確地描述人的發(fā)音,因此在大多數(shù)的語(yǔ)音識(shí)別系統(tǒng)中聲學(xué)模型的建立都采用CDHMM。在CDHMM中在某一狀態(tài)下特征矢量的概率分布函數(shù)是用多個(gè)高斯分布函數(shù)的加權(quán)和來(lái)描述,這樣能比較精確地描述特征矢量空間分布。然而在大詞表連續(xù)語(yǔ)音識(shí)別系統(tǒng)中如果采用⑶HMM那么在解碼,識(shí)別過(guò)程需要多次計(jì)算高斯概率這需要大量的計(jì)算量,通常在解碼過(guò)程中所需要的計(jì)算量都集中在高斯概率計(jì)算上,同時(shí)也需要大量的存儲(chǔ)量來(lái)存儲(chǔ)CDHMM的聲學(xué)模型。
[0093]我們的語(yǔ)音處理芯片的語(yǔ)音特征及聲學(xué)模型壓縮方法后的流程如圖2、3所示,是對(duì)輸入的原始語(yǔ)音流進(jìn)行語(yǔ)音檢測(cè),然后進(jìn)行特征提??;再結(jié)合特征碼本進(jìn)行量化編碼;量化編碼后的信號(hào),結(jié)合聲學(xué)模型、字典詞典、識(shí)別語(yǔ)法進(jìn)行識(shí)別搜索、語(yǔ)義分析;然后,輸入到系統(tǒng)相應(yīng)部分。
[0094]語(yǔ)音識(shí)別芯片接口
[0095]語(yǔ)音識(shí)別引擎需要用戶輸入的是:
[0096]識(shí)別詞表:在引擎初始化時(shí)輸入。
[0097]A.8K或16KHz采樣16Bits的線性PCM語(yǔ)音數(shù)據(jù)。
[0098]B.識(shí)別消息表示識(shí)別引擎的識(shí)別狀態(tài)。
[0099]C.識(shí)別結(jié)果。
[0100]識(shí)別弓I擎根據(jù)用戶輸入語(yǔ)音數(shù)據(jù)送出語(yǔ)音數(shù)據(jù)的識(shí)別結(jié)果。
[0101]識(shí)別引擎為一獨(dú)立線程與控制線程通過(guò)消息通信。
[0102]識(shí)別引擎消息:
[0103]MSR_EVENT_RESULT
[0104]正常識(shí)別,有識(shí)別結(jié)果時(shí)識(shí)別引擎發(fā)送出該消息。收到此消息后就可以獲取識(shí)別結(jié)果,可以顯示識(shí)別結(jié)果或執(zhí)行識(shí)別結(jié)果規(guī)定的動(dòng)作。
[0105]MSR_EVENT_SPEECHT00SH0RT
[0106]語(yǔ)音太短時(shí)識(shí)別引擎發(fā)送出該消息。語(yǔ)音太短的原因,通常是此段錄音為不正常的語(yǔ)音。
[0107]MSR_EVENT_NOSPEECH
[0108]識(shí)別引擎發(fā)送出該消息通常是引擎開始工作后用戶沒(méi)有說(shuō)話識(shí)別引擎超時(shí)。
[0109]MSR_EVENT_STARTPOINTDETECTED
[0110]識(shí)別引擎檢測(cè)到語(yǔ)音起始點(diǎn)時(shí)送出此消息,程序在收到此消息時(shí)可以在圖形界面上提示用戶。
[0111]MSR_EVENT_ENDPOINTDETECTED
[0112]識(shí)別引擎檢測(cè)到語(yǔ)音終止點(diǎn)時(shí)送出此消息,程序在收到此消息時(shí)可以在圖形界面上提示用戶。
[0113]語(yǔ)音識(shí)別弓I擎性能指標(biāo)
[0114]軟件響應(yīng)時(shí)間< 1.2倍實(shí)時(shí),在測(cè)試詞表不超過(guò)1000命令詞匯的情況下,實(shí)際應(yīng)用環(huán)境中達(dá)到96%以上的識(shí)別精度。
【權(quán)利要求】
1.一種基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng),其特征在于:所述的系統(tǒng)由基礎(chǔ)支撐平臺(tái)、綜合應(yīng)用系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)、應(yīng)急指揮場(chǎng)所、移動(dòng)應(yīng)急平臺(tái)構(gòu)成; 所述的基礎(chǔ)支撐平臺(tái)為應(yīng)急平臺(tái)的正常運(yùn)行提供基礎(chǔ)保障,主要包括WEB服務(wù)器、計(jì)算機(jī)網(wǎng)絡(luò)、電話服務(wù)器、視頻監(jiān)控服務(wù)器、視頻會(huì)議服務(wù)器、數(shù)字大屏矩陣服務(wù)器、主機(jī)存儲(chǔ)、數(shù)據(jù)交換與共享、語(yǔ)音識(shí)別系統(tǒng)、錄音錄像服務(wù)器及應(yīng)急地理信息系統(tǒng);所述的語(yǔ)音識(shí)別系統(tǒng)通過(guò)硬件采集系統(tǒng)的音頻數(shù)據(jù),通過(guò)解析生成指令來(lái)實(shí)現(xiàn)與其他服務(wù)器的信息交互,達(dá)到將語(yǔ)音指令轉(zhuǎn)換成數(shù)字指令,最后通過(guò)大屏展示出來(lái); 所述的應(yīng)急指揮場(chǎng)所由一系列獨(dú)立的視、音頻系統(tǒng),以及對(duì)它們進(jìn)行控制的集中控制系統(tǒng)和場(chǎng)所保障環(huán)境組成的安全的、智能化應(yīng)急指揮環(huán)境;包括顯示系統(tǒng)、會(huì)議系統(tǒng)、擴(kuò)聲系統(tǒng)、集中控制、智能燈光照明、綜合布線、供電系統(tǒng)等系統(tǒng);從功能區(qū)域上,應(yīng)急指揮場(chǎng)所可劃分為應(yīng)急指揮廳、值班室、會(huì)商室等場(chǎng)所區(qū)域;總體上采用以集中控制為中心的網(wǎng)絡(luò)化多媒體指揮環(huán)境,通過(guò)綜合布線設(shè)連接指揮大廳、應(yīng)急值班室、會(huì)商室等相關(guān)的指揮場(chǎng)所,通過(guò)對(duì)各種音視頻信號(hào)的集中交換與處理,并對(duì)投影、矩陣、功放等多媒體設(shè)備進(jìn)行必要的集成,實(shí)現(xiàn)本地、遠(yuǎn)程分散/集中的應(yīng)急指揮應(yīng)用對(duì)音視頻的需要,從而達(dá)到實(shí)現(xiàn)網(wǎng)絡(luò)化、一體化管理,智能化應(yīng)急指揮環(huán)境的整體目標(biāo); 所述的綜合應(yīng)用系統(tǒng)是應(yīng)急平臺(tái)的核心和靈魂,提供強(qiáng)大的應(yīng)急業(yè)務(wù)管理和應(yīng)急智能決策能力,主要包括信息資源、應(yīng)急預(yù)案、監(jiān)測(cè)預(yù)警、值班值守、事件管理、研判決策、指揮調(diào)度、模擬演練、知識(shí)庫(kù)、系統(tǒng)設(shè)置等功能模塊; 所述的數(shù)據(jù)庫(kù)系統(tǒng)采用集中式和分布式兩種存儲(chǔ)方式,常用基礎(chǔ)數(shù)據(jù)和區(qū)縣、部門的部分關(guān)鍵數(shù)據(jù)存儲(chǔ)于應(yīng)急平臺(tái)的中心數(shù)據(jù)庫(kù)中,其它數(shù)據(jù)分布式存儲(chǔ)于相關(guān)單位數(shù)據(jù)庫(kù)中;應(yīng)急平臺(tái)中心數(shù)據(jù)庫(kù)主要包括基礎(chǔ)信息數(shù)據(jù)庫(kù)、空間信息數(shù)據(jù)庫(kù)、事件信息數(shù)據(jù)庫(kù)、預(yù)案庫(kù)、案例庫(kù)、模型庫(kù)、知識(shí)庫(kù)和文檔庫(kù)等 所述的移動(dòng)應(yīng)急平臺(tái)滿足現(xiàn)場(chǎng)應(yīng)急通信、現(xiàn)場(chǎng)會(huì)商、指揮調(diào)度、移動(dòng)辦公、現(xiàn)場(chǎng)圖像視頻采集等功能,主要通過(guò)衛(wèi)星、公眾通信網(wǎng)等通信手段與相關(guān)應(yīng)急平臺(tái)以及有關(guān)方面進(jìn)行聯(lián)通。
2.根據(jù)權(quán)利要求1所述的基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng),其特征在于:所述基礎(chǔ)支撐平臺(tái)的WEB服務(wù)器是應(yīng)急平臺(tái)聯(lián)系個(gè)模塊將結(jié)果展示出來(lái)的服務(wù)系統(tǒng),是人機(jī)交互的接口,包括信息資源、應(yīng)急預(yù)案、監(jiān)測(cè)預(yù)警、值班值守、時(shí)間管理、研判決策、調(diào)度指揮、模擬演練、知識(shí)庫(kù)和系統(tǒng)管理; 計(jì)算機(jī)網(wǎng)絡(luò)主要用于內(nèi)、外網(wǎng)應(yīng)用系統(tǒng)的承載和數(shù)據(jù)交換的承載,主要包含相應(yīng)的廣域網(wǎng)接入和局域網(wǎng)網(wǎng)絡(luò)設(shè)備; 視頻會(huì)議服務(wù)器主要用于在重大突發(fā)公共事件發(fā)生時(shí)各級(jí)應(yīng)急平臺(tái)之間的協(xié)調(diào)溝通,會(huì)議會(huì)商;主要由MCU、視頻會(huì)議終端、視頻會(huì)議服務(wù)器等組成; 視頻監(jiān)控服務(wù)器主要用于接入個(gè)部門、包括公安、消防、三防辦、電信、林業(yè)局、水利局、公園等的攝像頭進(jìn)行統(tǒng)一管理和隨時(shí)查看實(shí)時(shí)圖像;實(shí)時(shí)圖像數(shù)據(jù)依托有關(guān)部門現(xiàn)有圖像監(jiān)控系統(tǒng),采用數(shù)字方式,由各部門應(yīng)急平臺(tái)負(fù)責(zé)將本系統(tǒng)的圖像轉(zhuǎn)換后上傳,主要由圖像接入服務(wù)器、編解碼器等組成; 數(shù)字大屏屏矩陣服務(wù)器主要用于將應(yīng)急系統(tǒng)投放到指揮大廳,展示給所有參會(huì)人員;大屏可以自定義分割成若干部分,每部分顯示不同的內(nèi)容;還包括大廳音箱系統(tǒng); 主機(jī)存儲(chǔ),實(shí)現(xiàn)應(yīng)急平臺(tái)服務(wù)器與存儲(chǔ)系統(tǒng)的完整配置,建立應(yīng)急平臺(tái)各項(xiàng)業(yè)務(wù)應(yīng)用系統(tǒng)的運(yùn)行服務(wù)器環(huán)境,建立應(yīng)急平臺(tái)各類系統(tǒng)、各類數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)與備份環(huán)境;主要包含各類應(yīng)用和數(shù)據(jù)庫(kù)服務(wù)器、磁盤陣列、光纖交換機(jī)、存儲(chǔ)管理軟件等設(shè)備; 數(shù)據(jù)交換與共享是應(yīng)急平臺(tái)管理應(yīng)急信息資源目錄、支撐應(yīng)急信息資源共享交換的基礎(chǔ)系統(tǒng); 錄音錄像服務(wù)器用于存儲(chǔ)電話錄音文件的音頻文件和視頻監(jiān)控的視頻文件,在應(yīng)急系統(tǒng)中可以通過(guò)條件查詢、預(yù)覽和下載音頻和視頻文件; 應(yīng)急地理信息系統(tǒng)提供對(duì)應(yīng)急基礎(chǔ)數(shù)據(jù)的可視化表現(xiàn),直觀地反映了突發(fā)事件周邊的地形地貌、保護(hù)目標(biāo)和危險(xiǎn)源以及救援隊(duì)伍的分布,便于領(lǐng)導(dǎo)在應(yīng)急中掌握事發(fā)態(tài)勢(shì),優(yōu)化資源配置,制定救援方案。
3.根據(jù)權(quán)利要求1所述的基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng),其特征在于:所述的語(yǔ)音識(shí)別系統(tǒng)采用嵌入式語(yǔ)音的設(shè)備;由語(yǔ)音檢測(cè)模塊、特征提取模塊、識(shí)別搜索模塊和語(yǔ)義分析模塊幾部分構(gòu)成;所述的語(yǔ)音識(shí)別模塊是對(duì)送入的原始語(yǔ)音數(shù)據(jù)進(jìn)行預(yù)處理和檢測(cè),將原始語(yǔ)音信號(hào)數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)數(shù)據(jù)格式,并通過(guò)高效的語(yǔ)音信號(hào)檢測(cè)算法檢測(cè)到語(yǔ)音的起始點(diǎn)和中止點(diǎn);特征提取模塊接收語(yǔ)音識(shí)別模塊送入的語(yǔ)音數(shù)據(jù)流,提取得到語(yǔ)音信號(hào)的特征矢量;在這個(gè)模塊中需要對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)加重、分幀、加窗、頻域變換、倒譜變換、差分等處理;最終得到40維左右的特征矢量; 識(shí)別搜索模塊接收特征提取模塊送入的語(yǔ)音特征矢量;對(duì)未知語(yǔ)音信號(hào)的特征與引擎內(nèi)含的聲學(xué)模型庫(kù)、字典/詞典和識(shí)別語(yǔ)法信息進(jìn)行匹配得到最適合未知語(yǔ)音特征的詞序列;可提供多個(gè)識(shí)別結(jié)果的候選供用戶進(jìn)行選擇,方便設(shè)計(jì)靈活的人機(jī)界面; 語(yǔ)義分析模塊基于識(shí)別任務(wù)的語(yǔ)法信息通過(guò)對(duì)識(shí)別搜索模塊得到的詞序列結(jié)果進(jìn)行語(yǔ)法、語(yǔ)義分析得到識(shí)別結(jié)果的語(yǔ)義信息。
4.根據(jù)權(quán)利要求2所述的基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng),其特征在于:所述的語(yǔ)音識(shí)別系統(tǒng)采用嵌入式語(yǔ)音的設(shè)備;由語(yǔ)音檢測(cè)模塊、特征提取模塊、識(shí)別搜索模塊和語(yǔ)義分析模塊幾部分構(gòu)成;所述的語(yǔ)音識(shí)別模塊是對(duì)送入的原始語(yǔ)音數(shù)據(jù)進(jìn)行預(yù)處理和檢測(cè),將原始語(yǔ)音信號(hào)數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)數(shù)據(jù)格式,并通過(guò)高效的語(yǔ)音信號(hào)檢測(cè)算法檢測(cè)到語(yǔ)音的起始點(diǎn)和中止點(diǎn);特征提取模塊接收語(yǔ)音識(shí)別模塊送入的語(yǔ)音數(shù)據(jù)流,提取得到語(yǔ)音信號(hào)的特征矢量;在這個(gè)模塊中需要對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)加重、分幀、加窗、頻域變換、倒譜變換、差分等處理;最終得到40維左右的特征矢量; 識(shí)別搜索模塊接收特征提取模塊送入的語(yǔ)音特征矢量;對(duì)未知語(yǔ)音信號(hào)的特征與引擎內(nèi)含的聲學(xué)模型庫(kù)、字典/詞典和識(shí)別語(yǔ)法信息進(jìn)行匹配得到最適合未知語(yǔ)音特征的詞序列;可提供多個(gè)識(shí)別結(jié)果的候選供用戶進(jìn)行選擇,方便設(shè)計(jì)靈活的人機(jī)界面; 語(yǔ)義分析模塊基于識(shí)別任務(wù)的語(yǔ)法信息通過(guò)對(duì)識(shí)別搜索模塊得到的詞序列結(jié)果進(jìn)行語(yǔ)法、語(yǔ)義分析得到識(shí)別結(jié)果的語(yǔ)義信息。
5.一種權(quán)利要求1至4任一項(xiàng)所述的基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng)的語(yǔ)音識(shí)別方法,其特征在于:所述的方法是對(duì)輸入的原始語(yǔ)音流進(jìn)行語(yǔ)音檢測(cè),然后進(jìn)行特征提??;再結(jié)合特征碼本進(jìn)行量化編碼;量化編碼后的信號(hào),結(jié)合聲學(xué)模型、字典詞典、識(shí)別語(yǔ)法進(jìn)行識(shí)別搜索、語(yǔ)義分析;然后,輸入到系統(tǒng)相應(yīng)部分。
6.根據(jù)權(quán)利要求5所述的基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng)的語(yǔ)音識(shí)別方法,其特征在于:所述的識(shí)別搜索包括: A.識(shí)別語(yǔ)法 首先需要定義識(shí)別語(yǔ)法;識(shí)別語(yǔ)法包含了對(duì)于識(shí)別任務(wù)的描述;其中包含各種符合說(shuō)話語(yǔ)法和任務(wù)場(chǎng)景的句子信息; B.字典詞典 字典詞典包含了各種單字/單詞的發(fā)音信息,一個(gè)詞或者字的發(fā)音由音素組成; C.聲學(xué)模型 聲學(xué)模型是語(yǔ)音識(shí)別引擎最核心的引擎資源文件,包含了對(duì)于語(yǔ)音信號(hào)頻譜和時(shí)間序列特征的精確描述; D.識(shí)別搜索 是在未知句子或者詞序列候選空間中搜索得到具有最佳匹配結(jié)果的候選句子;識(shí)別過(guò)程是:通過(guò)檢索字典/詞典可以將句子由詞序列分解成音素的序列;這種音素的序列與聲學(xué)模型相結(jié)合就得到更反映其本質(zhì)屬性的聲學(xué)模型單元序列;然后,將原始語(yǔ)音的特征矢量與所有可能的句子候選的聲學(xué)模型單元序列的信息相互匹配計(jì)算得到其匹配概率;從中挑選出具有最大后驗(yàn)概率的聲學(xué)模型單元序列;通過(guò)該單元序列可以得到與之對(duì)應(yīng)的詞序列;作為輸出結(jié)果。
7.根據(jù)權(quán)利要求5所述的基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng)的語(yǔ)音識(shí)別方法,其特征在于:所述的語(yǔ)義分析是: A.應(yīng)用程序啟動(dòng)錄音程序開始錄音,同時(shí)應(yīng)用程序會(huì)通過(guò)識(shí)別引擎API語(yǔ)音識(shí)別引擎申請(qǐng)一個(gè)識(shí)別資源; B.識(shí)別引擎根據(jù)系統(tǒng)資源情況創(chuàng)建并分配一個(gè)空閑的識(shí)別句柄給該次任務(wù); C.應(yīng)用程序獲得該識(shí)別會(huì)話控制權(quán)后;根據(jù)當(dāng)前系統(tǒng)的任務(wù)通過(guò)API通知識(shí)別引擎加載相應(yīng)語(yǔ)法; D.應(yīng)用程序通過(guò)API函數(shù)把錄取的語(yǔ)音數(shù)據(jù)發(fā)送給該會(huì)話;該會(huì)話根據(jù)系統(tǒng)的模型和加載的語(yǔ)法對(duì)送入的語(yǔ)音進(jìn)行識(shí)別; E.如果有識(shí)別結(jié)果;系統(tǒng)會(huì)通過(guò)回調(diào)函數(shù)來(lái)通知應(yīng)用程序;應(yīng)用程序此時(shí)可以通過(guò)引擎的API來(lái)獲取識(shí)別結(jié)果; F.應(yīng)用程序卸載加載的語(yǔ)法; G.應(yīng)用程序斷開該會(huì)話連接; H.應(yīng)用程序釋放會(huì)話;此時(shí)應(yīng)用程序應(yīng)該根據(jù)識(shí)別結(jié)果做相應(yīng)的動(dòng)作,如繼續(xù)播放提示音,提示用戶繼續(xù)提供信息或做其他的動(dòng)作。
8.根據(jù)權(quán)利要求6所述的基于語(yǔ)音識(shí)別的智能應(yīng)急指揮系統(tǒng)的語(yǔ)音識(shí)別方法,其特征在于:所述的語(yǔ)義分析是: A.應(yīng)用程序啟動(dòng)錄音程序開始錄音,同時(shí)應(yīng)用程序會(huì)通過(guò)識(shí)別引擎API語(yǔ)音識(shí)別引擎申請(qǐng)一個(gè)識(shí)別資源; B.識(shí)別引擎根據(jù)系統(tǒng)資源情況創(chuàng)建并分配一個(gè)空閑的識(shí)別句柄給該次任務(wù); C.應(yīng)用程序獲得該識(shí)別會(huì)話控制權(quán)后;根據(jù)當(dāng)前系統(tǒng)的任務(wù)通過(guò)API通知識(shí)別引擎加載相應(yīng)語(yǔ)法; D.應(yīng)用程序通過(guò)API函數(shù)把錄取的語(yǔ)音數(shù)據(jù)發(fā)送給該會(huì)話;該會(huì)話根據(jù)系統(tǒng)的模型和加載的語(yǔ)法對(duì)送入的語(yǔ)音進(jìn)行識(shí)別; E.如果有識(shí)別結(jié)果;系統(tǒng)會(huì)通過(guò)回調(diào)函數(shù)來(lái)通知應(yīng)用程序;應(yīng)用程序此時(shí)可以通過(guò)引擎的API來(lái)獲取識(shí)別結(jié)果; F.應(yīng)用程序卸載加載的語(yǔ)法; G.應(yīng)用程序斷開該會(huì)話連接; H.應(yīng)用程序釋放會(huì)話;此時(shí)應(yīng)用程序應(yīng)該根據(jù)識(shí)別結(jié)果做相應(yīng)的動(dòng)作,如繼續(xù)播放提示音,提示用戶繼續(xù)提供信息或做其他的動(dòng)作。
【文檔編號(hào)】H04L29/08GK104392721SQ201410720018
【公開日】2015年3月4日 申請(qǐng)日期:2014年11月28日 優(yōu)先權(quán)日:2014年11月28日
【發(fā)明者】賀忠堂, 陳才平, 李智勇, 呂維安, 李新安 申請(qǐng)人:東莞中國(guó)科學(xué)院云計(jì)算產(chǎn)業(yè)技術(shù)創(chuàng)新與育成中心