一種適用于無人機的語音控制方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及智能機器人的遠程遙控技術(shù)領(lǐng)域,更具體地,涉及一種適用于無人機的語音控制方法。
【背景技術(shù)】
[0002]無人機是一種有動力、可控制、能攜帶多種任務(wù)設(shè)備、執(zhí)行多種作戰(zhàn)任務(wù)并能重復(fù)使用的無人機戰(zhàn)術(shù)飛行器。由于其零傷亡風(fēng)險和高機動性等優(yōu)勢引起了各國軍方的高度重視。無人機飛行過程分為起飛、高空飛行和降落三個部分,高空飛行階段周圍環(huán)境相對穩(wěn)定,無需對飛機的飛行速度和姿態(tài)做太多調(diào)整,所以依靠車內(nèi)測控臺通過GPS導(dǎo)航就能夠滿足。但是在起飛和降落階段無人機的速度變化大、姿態(tài)調(diào)整頻繁、降落場地也比較復(fù)雜所以對無人機的控制系統(tǒng)要求很高?,F(xiàn)階段無人機普遍采用測控車外遙控器的方式,讓經(jīng)驗豐富的飛行人員通過觀察來控制無人機,從而滿足起飛、降落階段對控制系統(tǒng)實時性、機動性、高度復(fù)雜性的要求。
[0003]無人機的研宄和發(fā)展正在全世界范圍內(nèi)掀起高潮。無人機的遙控方式主要分為手動遙控、超視距遙控和半自主/自主控制。超視距遙控是指地面操作人員根據(jù)無人機傳送回來的云臺拍攝圖像和飛行姿態(tài)信號操控?zé)o人機。
[0004]然而,無人機控制方式多為遙控控制,其需要根據(jù)無人機發(fā)回的諸多參數(shù)由遙控人員自行判斷是否適合于發(fā)送控制指令。然而,這種方式需要使得無人機能夠隨時,或者是在關(guān)鍵時刻,能夠發(fā)回其自身的飛行參數(shù)和工作狀態(tài)信息;其次,這種方式過于依賴遙控人員的經(jīng)驗,一旦反應(yīng)較慢,則無人機在遇險情況下可能發(fā)生故障甚至墜毀。這些或者不可靠或者不確定的因素不利于飛行任務(wù)的成功完成。
【發(fā)明內(nèi)容】
[0005]為了提供智能化的無人機遙控方式同時減少上述現(xiàn)有技術(shù)中的不可靠和不確定因素,本發(fā)明提供了一種適用于無人機的語音控制方法,包括:
[0006](I)遙控裝置接收語音指令;
[0007](2)將語音指令發(fā)送到無人機的控制單元;
[0008](3)無人機的控制單元將語音指令分解成若干個單獨動作的指令;
[0009](4)無人機控制單元對所述若干個單獨動作的指令進行預(yù)演;
[0010](5)無人機根據(jù)預(yù)演結(jié)果,向遙控裝置提供反饋信息。
[0011]進一步地,所述步驟(I)包括:
[0012](1.1)遙控裝置進行人臉識別并進行聲紋識別;
[0013](1.2)根據(jù)人臉識別的結(jié)果,判斷是否接收語音。
[0014]進一步地,所述步驟(1.2)包括:如果通過人臉識別,則對接收到的語音進一步判斷是否為具有語音控制的權(quán)限的語音,確定該語音所對應(yīng)的權(quán)限,并進行語音識別。
[0015]進一步地,所述步驟(2)包括:通過無線數(shù)傳單元將語音指令發(fā)送到無人機的通信單元,該通信單元再將語音指令的安全性驗證,并在通過驗證后將語音指令傳送到無人機的控制單元。
[0016]進一步地,所述步驟(3)包括:識別語音指令中包括特定間隔符,并根據(jù)這種間隔符把語音指令分解成若干個單獨動作的指令。
[0017]進一步地,所述把語音指令分解成若干個單獨動作的指令包括:根據(jù)各種語音指令的預(yù)設(shè)運行時間,為各單獨動作的指令之間分配間隔時間。
[0018]進一步地,所述步驟(4)包括:無人機控制單元為每個單獨動作的指令檢測相應(yīng)執(zhí)行部件的關(guān)聯(lián)狀態(tài),并判斷語音執(zhí)行指令是否可行。
[0019]進一步地,所述檢測相應(yīng)執(zhí)行部件的關(guān)聯(lián)狀態(tài)包括:
[0020]判斷相應(yīng)執(zhí)行部件的種類;
[0021]根據(jù)相應(yīng)執(zhí)行部件的種類,判斷是否需要檢測相應(yīng)執(zhí)行部件的關(guān)聯(lián)狀態(tài):如果不需要,則直接判斷該語音執(zhí)行指令可行。
[0022]進一步地,所述關(guān)聯(lián)狀態(tài)包括:所述關(guān)聯(lián)狀態(tài)包括:無人機的控制單元獲得飛行速度、飛行高度、飛行軌跡與周圍障礙物之間的距離。
[0023]進一步地,所述步驟(5)包括:無人機控制單元通過以預(yù)設(shè)的時間長度延長語音指令之間的間隔進行第二次預(yù)演,然后根據(jù)第二次預(yù)演的結(jié)果,向遙控裝置提供反饋其發(fā)出的語音指令是否可行的信息。
[0024]本發(fā)明的有益效果是:去掉了無人機需要確保對其自身飛行參數(shù)和工作參數(shù)的高可靠傳輸要求,同時能夠智能地估計可行的方案并自動地執(zhí)行,大大提高了無人機遙控的效率。此外,通過語音識別技術(shù),本發(fā)明還增強了無人機遙控的安全性。
【附圖說明】
[0025]圖1示出了根據(jù)本發(fā)明的適用于無人機的語音控制方法的流程框圖。
【具體實施方式】
[0026]如圖1所示,根據(jù)本發(fā)明的優(yōu)選實施例,適用于無人機的語音控制方法包括如下步驟:
[0027](I)遙控裝置接收語音指令;遙控裝置包括聲紋模型庫和人臉數(shù)據(jù)庫。該步驟包括:
[0028](1.1)遙控裝置進行人臉識別并進行聲紋識別。
[0029]人臉識別時,人臉數(shù)據(jù)庫中預(yù)先保存有人臉信息(例如通過紅外信號檢測人臉圖像并留存人眼間隔、人眼長度等生理特征),在采集時,通過紅外信號采集到人臉數(shù)據(jù)與人臉數(shù)據(jù)庫中的數(shù)據(jù)作比較。如果通過人臉識別,則對接收到的語音進一步判斷是否為具有語音控制的權(quán)限的語音,確定該語音所對應(yīng)的權(quán)限,并進行語音識別。
[0030](1.2)根據(jù)人臉識別的結(jié)果,判斷是否接收語音。
[0031]聲紋識另Ij(Voiceprint Recognit1n, VPR),也稱為說話人識別(SpeakerRecognit1n),有兩類,S卩說話人辨認(Speaker Identificat1n)和說話人確認(SpeakerVerificat1n)。前者用以判斷某段語音是若干人中的哪一個所說的,是“多選一”問題;而后者用以確認某段語音是否是指定的某個人所說的,是“一對一判別”問題。不同的任務(wù)和應(yīng)用會使用不同的聲紋識別技術(shù),如縮小刑偵范圍時可能需要辨認技術(shù)。本發(fā)明中,聲紋模型庫采用高斯模型,具有允許進行語音控制的人員的聲紋特征信息。每位具有發(fā)出語音控制指令的人員均上傳一段訓(xùn)練語音,該訓(xùn)練語音被通過最大似然方法對語音進行訓(xùn)練,進而得到聲紋庫。
[0032]進行聲紋比較時,語音指令發(fā)出者發(fā)出語音指令,該語音指令被與聲紋數(shù)據(jù)庫進行聲紋對比。語音指令中如果包括多條單獨執(zhí)行一個動作的語音指令,則要在多個動作的語音指令之間增加特定間隔符的語音,例如英文字母“O”的發(fā)音。優(yōu)選地,該間隔不超過3秒