本發(fā)明屬于語音控制技術(shù)領(lǐng)域,具體涉及一種基于語音識別的違章抓拍控制方法及其裝置。
背景技術(shù):
隨著國民生活水平的提高,越來越多的家庭選擇汽車作為主要的交通工具,而道路上車輛的增多也帶來了更多的交通違章行為。
現(xiàn)有的電子監(jiān)控設(shè)備以及交警數(shù)量上是有限的,只能在有限的路段上對司機進行監(jiān)控,無法覆蓋到其整個駕駛過程,從而造成部分司機在有監(jiān)控的路段按交通規(guī)范駕駛,一旦脫離監(jiān)控則隨意進行違章。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明的主要目的在于提供一種基于語音識別的違章抓拍控制方法及其裝置。
為達到上述目的,本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:
本發(fā)明實施例提供一種基于語音識別的違章抓拍控制方法,該方法為:智能行車終端實時錄制前方錄像的同時,對周圍產(chǎn)生的語音實時進行錄音采集并且對所述錄音采集的錄音數(shù)據(jù)進行預(yù)處理,對所述預(yù)處理后的錄音數(shù)據(jù)進行識別,最后,所述識別結(jié)果與違章抓拍語音命令匹配后,所述智能行車終端根據(jù)預(yù)設(shè)的拍攝參數(shù)抓拍當前拍攝的圖像或者視頻進行壓縮保存。
上述方案中,所述對周圍產(chǎn)生的實時進行錄音采集并且對所述錄音采集的錄音數(shù)據(jù)進行預(yù)處理之前,該方法還包括:所述智能行車終端監(jiān)聽周圍是否有語音產(chǎn)生,當周圍產(chǎn)生的語音音量大于閾值時,確定周圍產(chǎn)生語音,并且對所述周圍產(chǎn)生的實時進行錄音采集。
上述方案中,該方法還包括,所述智能行車終端將壓縮保存的圖像或者視頻上傳至服務(wù)器端。
上述方案中,所述拍攝參數(shù)為抓拍圖像或者視頻、抓拍圖片的數(shù)量、抓拍視頻的起止時間、抓拍的時間間隔。
本發(fā)明實施例還提供一種基于語音識別的違章抓拍控制裝置,該裝置包括:錄音數(shù)據(jù)采集單元、錄音數(shù)據(jù)識別單元、錄音數(shù)據(jù)處理單元、抓拍控制單元,
所述錄音數(shù)據(jù)采集單元,用于在實時錄制前方錄像的同時,對周圍產(chǎn)生的語音實時進行錄音采集并且發(fā)送到錄音數(shù)據(jù)處理單元;
所述錄音數(shù)據(jù)處理單元,用于對所述錄音采集的錄音數(shù)據(jù)進行預(yù)處理,并且將預(yù)處理后的錄音數(shù)據(jù)發(fā)送到錄音數(shù)據(jù)識別單元;
所述錄音數(shù)據(jù)識別單元,用于對所述預(yù)處理后的錄音數(shù)據(jù)進行識別,并且將識別結(jié)果發(fā)送到抓拍控制單元;
所述抓拍控制單元,用于在所述識別結(jié)果與違章抓拍語音命令匹配后,根據(jù)預(yù)設(shè)的拍攝參數(shù)抓拍當前拍攝的圖像或者視頻進行壓縮保存。
上述方案中,所述錄音數(shù)據(jù)采集單元,還用于監(jiān)聽周圍是否有語音產(chǎn)生,當周圍產(chǎn)生的語音音量大于閾值時,確定周圍產(chǎn)生語音,并且對所述周圍產(chǎn)生的實時進行錄音采集。
上述方案中,該裝置包括上傳單元,用于將壓縮保存的圖像或者視頻上傳至服務(wù)器端。
上述方案中,所述拍攝參數(shù)為抓拍圖像或者視頻、抓拍圖片的數(shù)量、抓拍視頻的起止時間、抓拍的時間間隔。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果:
本發(fā)明無需后續(xù)查看行車錄像,直接在行車中對違章車輛進行抓拍,無需手動操作,實現(xiàn)了無障礙操作,提高了用戶體驗,提高了違章抓拍的安全性。
附圖說明
圖1為本發(fā)明實施例提供一種基于語音識別的違章抓拍控制方法的流程圖;
圖2為本發(fā)明實施例提供一種基于語音識別的違章抓拍控制裝置的連接框圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明實施例提供一種基于語音識別的違章抓拍控制方法,如圖1所示,該方法通過以下步驟實現(xiàn):
步驟101:智能行車終端實時錄制前方錄像的同時,對周圍產(chǎn)生的語音實時進行錄音采集并且對所述錄音采集的錄音數(shù)據(jù)進行預(yù)處理;
具體地,所述對周圍產(chǎn)生的實時進行錄音采集并且對所述錄音采集的錄音數(shù)據(jù)進行預(yù)處理之前,所述智能行車終端監(jiān)聽周圍是否有語音產(chǎn)生,當周圍產(chǎn)生的語音音量大于閾值時,確定周圍產(chǎn)生語音,并且對所述周圍產(chǎn)生的實時進行錄音采集。
根據(jù)噪聲抑制(NS)、自動增益控制(AGC)、靜音檢測(VAD)、回音消除(AEC)、重采樣、或自適應(yīng)濾波中的至少一種方式對錄音數(shù)據(jù)進行預(yù)處理,獲得便于后續(xù)識別的錄音數(shù)據(jù)。
本發(fā)明包括但不限于噪聲抑制(NS)、自動增益控制(AGC)、靜音檢測(VAD)、回音消除(AEC)、重采樣、自適應(yīng)濾波,也可以采用其他預(yù)處理方式對錄音數(shù)據(jù)進行預(yù)處理,以降低雜聲等干擾元素,確保錄音數(shù)據(jù)的純凈,為后續(xù)識別提供良好的數(shù)據(jù)基礎(chǔ)。
所述噪聲抑制(NS)指對環(huán)境噪音進行抑制,濾波,降低噪音對有效聲音的影響,如車載環(huán)境的車噪、風(fēng)噪、胎噪
所述自動增益控制(AGC)是處理面對錄音因為大量不同設(shè)置而導(dǎo)致音量變化,AGC提供了一種方式去調(diào)整參考音量。這在VOIP中是很有用的,因為不需再手動調(diào)節(jié)麥克風(fēng)的增益。還有另外一個優(yōu)點是麥克風(fēng)增益在一個比較保守的水平,它更容易避免削波、失真。
所述靜音檢測(VAD):語音活動檢測(Voice Activity Detection,VAD)又稱語音端點檢測,語音邊界檢測,目的是從聲音信號流里識別和消除長時間的靜音期,以達到在不降低業(yè)務(wù)質(zhì)量的情況下節(jié)省話路資源的作用,它是IP電話應(yīng)用的重要組成部分。
所述回音消除(AEC):回聲消除技術(shù),采用回波抵消方法,也就是通過自適應(yīng)方法估計回波信號的大小,然后在接收信號中減去此估計值以抵消回波。
所述重采樣是根據(jù)一類象元的信息內(nèi)插出另一類象元信息的過程,語音領(lǐng)域通常是對脈沖編碼調(diào)制數(shù)據(jù)所述(PCM)進行重新采樣,重新取得數(shù)據(jù)。
所述自適應(yīng)濾波指在麥克風(fēng)陣列或多路采樣時,可能會有時延抖動問題,如在AEC技術(shù)中需要對聲音數(shù)據(jù)在不同時延狀態(tài)下進行回波抵消。
步驟102:對所述預(yù)處理后的錄音數(shù)據(jù)進行識別;
具體地,根據(jù)語音識別算法對所述預(yù)處理后的錄音數(shù)據(jù)進行識別;
所述語音識別算法包括但不限于人工神經(jīng)網(wǎng)絡(luò)、統(tǒng)計模式識別技術(shù)。
所述人工神經(jīng)網(wǎng)絡(luò)指從信息處理角度對人腦神經(jīng)元網(wǎng)絡(luò)進行抽象,建立某種簡單模型,按不同的連接方式組成不同的網(wǎng)絡(luò)
所述統(tǒng)計模式識別技術(shù)指統(tǒng)計模式識別statistical approach of pattern recognition對模式的統(tǒng)計分類方法,把模式類看成是用某個隨機向量實現(xiàn)的集合。又稱決策理論識別方法。
步驟103:所述識別結(jié)果與違章抓拍語音命令匹配后,所述智能行車終端根據(jù)預(yù)設(shè)的拍攝參數(shù)抓拍當前拍攝的圖像或者視頻進行壓縮保存。
具體地,所述拍攝參數(shù)為抓拍圖像或者視頻、抓拍圖片的數(shù)量、抓拍視頻的起止時間、抓拍的時間間隔。
所述智能行車終端將壓縮保存的圖像或者視頻上傳至服務(wù)器端。
當所述識別結(jié)果與違章抓拍語音命令不匹配時,所述智能行車終端實時錄制前方錄像,不進行抓拍和上傳。
本發(fā)明實施例還提供一種基于語音識別的違章抓拍控制裝置,該裝置包括:錄音數(shù)據(jù)采集單元、錄音數(shù)據(jù)識別單元、錄音數(shù)據(jù)處理單元、抓拍控制單元,
所述錄音數(shù)據(jù)采集單元,用于在實時錄制前方錄像的同時,對周圍產(chǎn)生的語音實時進行錄音采集并且發(fā)送到錄音數(shù)據(jù)處理單元;
所述錄音數(shù)據(jù)處理單元,用于對所述錄音采集的錄音數(shù)據(jù)進行預(yù)處理,并且將預(yù)處理后的錄音數(shù)據(jù)發(fā)送到錄音數(shù)據(jù)識別單元;
所述錄音數(shù)據(jù)識別單元,用于對所述預(yù)處理后的錄音數(shù)據(jù)進行識別,并且將識別結(jié)果發(fā)送到抓拍控制單元;
所述抓拍控制單元,用于在所述識別結(jié)果與違章抓拍語音命令匹配后,根據(jù)預(yù)設(shè)的拍攝參數(shù)抓拍當前拍攝的圖像或者視頻進行壓縮保存。
所述錄音數(shù)據(jù)采集單元,還用于監(jiān)聽周圍是否有語音產(chǎn)生,當周圍產(chǎn)生的語音音量大于閾值時,確定周圍產(chǎn)生語音,并且對所述周圍產(chǎn)生的實時進行錄音采集。
該裝置還包括上傳單元,用于將壓縮保存的圖像或者視頻上傳至服務(wù)器端。
所述拍攝參數(shù)為抓拍圖像或者視頻、抓拍圖片的數(shù)量、抓拍視頻的起止時間、抓拍的時間間隔。
以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。