1.一種利用仿真生成樣本實(shí)現(xiàn)無(wú)人車自主行進(jìn)的方法,其特征在于,該方法包括如下步驟:
步驟一、搭建仿真模型,在仿真平臺(tái)生成訓(xùn)練樣本;
步驟二、用步驟一生成的訓(xùn)練樣本通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)端到端訓(xùn)練,端到端的一端是指輸入傳感器測(cè)量數(shù)據(jù),另一端是指輸出無(wú)人車的控制指令;
步驟三、控制無(wú)人車在現(xiàn)實(shí)場(chǎng)景中運(yùn)行,獲取相應(yīng)的傳感器數(shù)據(jù)和控制指令,對(duì)步驟二的神經(jīng)網(wǎng)絡(luò)的各層參數(shù)進(jìn)行處理,得到適用于該無(wú)人車自主行進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)。
2.如權(quán)利要求1所述的利用仿真生成樣本實(shí)現(xiàn)無(wú)人車導(dǎo)航的方法,其特征在于,步驟一中,搭建仿真模型并在仿真平臺(tái)生成訓(xùn)練樣本的方法如下:
1-1.搭建無(wú)人車仿真模型,添加激光測(cè)距傳感器;
1-2.在仿真平臺(tái)隨機(jī)加入障礙物,構(gòu)建場(chǎng)景;
1-3.將無(wú)人車置于仿真場(chǎng)景中,控制無(wú)人車在仿真場(chǎng)景中無(wú)碰撞地安全行駛,記錄無(wú)人車的轉(zhuǎn)向角速度和運(yùn)行速度,同時(shí)將測(cè)距傳感器測(cè)量得到的數(shù)據(jù)及相應(yīng)的時(shí)間戳記錄到本地;
1-4.重復(fù)執(zhí)行場(chǎng)景構(gòu)建及無(wú)人車運(yùn)行,產(chǎn)生足量數(shù)據(jù),并指定激光測(cè)距傳感器測(cè)量數(shù)據(jù)為神經(jīng)網(wǎng)絡(luò)的輸入,控制指令為神經(jīng)網(wǎng)絡(luò)的輸出。
3.如權(quán)利要求2所述的利用仿真生成樣本實(shí)現(xiàn)無(wú)人車自主行進(jìn)的方法,其特征在于,步驟二中,使用循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)端到端訓(xùn)練的具體方法如下:
2-1.建立處理序列數(shù)據(jù)的循環(huán)神經(jīng)網(wǎng)絡(luò),將測(cè)距傳感器測(cè)量數(shù)據(jù)預(yù)處理后作為循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入,標(biāo)記為,xt表示t時(shí)刻神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),將速度和轉(zhuǎn)向角速度等控制指令作為神經(jīng)網(wǎng)絡(luò)輸出,標(biāo)記為,ot表示t時(shí)刻神經(jīng)網(wǎng)絡(luò)輸出的控制參數(shù),將循環(huán)神經(jīng)網(wǎng)絡(luò)隱藏單元標(biāo)記為,st表示t時(shí)刻神經(jīng)網(wǎng)絡(luò)隱藏單元的狀態(tài),其中xt,ot,st是一一對(duì)應(yīng)的,下標(biāo)表示t時(shí)刻;
2-2.使用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行端到端的訓(xùn)練。
4.如權(quán)利要求3所述的利用仿真生成樣本實(shí)現(xiàn)無(wú)人車自主行進(jìn)的方法,其特征在于,步驟三中,使用實(shí)際數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行微調(diào)處理的具體方法如下:
3-1.在現(xiàn)實(shí)場(chǎng)景中控制無(wú)人車安全無(wú)碰撞地運(yùn)行,采集測(cè)距傳感器數(shù)據(jù)并記錄遙控器的控制指令,獲得現(xiàn)實(shí)場(chǎng)景中的訓(xùn)練數(shù)據(jù);
3-2.將測(cè)距傳感器數(shù)據(jù)作為網(wǎng)絡(luò)輸入,將遙控器控制指令作為網(wǎng)絡(luò)輸出,在步驟二的基礎(chǔ)上,對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行微調(diào)處理,得到適用于該無(wú)人車自主行進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)。