駕駛方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及車輛安全技術(shù)領(lǐng)域,特別涉及一種駕駛方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著電子技術(shù)的快速發(fā)展,車輛等車輛已經(jīng)成為生活中必不可少的交通工具。而 伴隨著車輛的普及,道路上的車輛越來越密集,行車安全也越來越重要。
[0003] 通常,駕駛員在駕駛車輛行駛的過程中,可能會發(fā)生一些諸如插車、障礙物阻擋等 突發(fā)事件,此時,駕駛員可以手動操作方向盤,油門,剎車等以避免車輛與障礙物發(fā)生碰撞, 但是由于在發(fā)生突發(fā)事件時,駕駛員通常處于緊張狀態(tài),駕駛員對方向盤,油門、剎車等操 作的準確性較低。為此,相關(guān)技術(shù)提供了一種駕駛系統(tǒng),該駕駛系統(tǒng)包括:環(huán)境感知模塊和 避撞控制模塊,避撞控制模塊中存儲有駕駛員根據(jù)駕駛車輛過程中的避撞經(jīng)驗設置的環(huán)境 狀態(tài)量與決策動作的對應關(guān)系,其中,環(huán)境狀態(tài)量可以為障礙物的位置,環(huán)境感知模塊可以 在車輛的行駛環(huán)境中存在由障礙物引發(fā)的突發(fā)事件時獲取車輛當前的環(huán)境狀態(tài)量,避撞控 制模塊可以根據(jù)車輛當前的環(huán)境狀態(tài)量從環(huán)境狀態(tài)量與決策動作的對應關(guān)系中確定與車 輛當前的環(huán)境狀態(tài)量對應的目標決策動作,然后根據(jù)該目標決策動作控制車輛行駛,從而 避免車輛與障礙物發(fā)生碰撞。
[0004] 在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)相關(guān)技術(shù)至少存在以下問題:
[0005] 相關(guān)技術(shù)中的駕駛系統(tǒng)是以駕駛員的避撞經(jīng)驗為依據(jù)控制車輛行駛的,受駕駛員 經(jīng)驗的限制,駕駛系統(tǒng)具有一定的局限性,且由于是以駕駛員的避撞經(jīng)驗為依據(jù)控制車輛 行駛的,因此,駕駛系統(tǒng)的穩(wěn)定性較低,靈活性較差。
【發(fā)明內(nèi)容】
[0006] 為了解決相關(guān)技術(shù)中駕駛系統(tǒng)具有局限性,穩(wěn)定性較低,靈活性較差的問題,本發(fā) 明提供一種駕駛方法及系統(tǒng)。所述技術(shù)方案如下:
[0007] 第一方面,提供一種駕駛系統(tǒng),所述駕駛系統(tǒng)包括:環(huán)境感知模塊和避撞控制模 塊,
[0008] 所述環(huán)境感知模塊用于在車輛行駛過程中監(jiān)測所述車輛的行駛環(huán)境;預測所述車 輛的行駛環(huán)境中是否會發(fā)生由障礙物引發(fā)的突發(fā)事件;在所述車輛的行駛環(huán)境中會發(fā)生由 障礙物引發(fā)的突發(fā)事件時,獲取所述障礙物的位置;
[0009] 所述避撞控制模塊用于根據(jù)所述障礙物的位置,采用機器學習算法確定目標決策 動作;根據(jù)所述目標決策動作控制所述車輛行駛。
[0010] 可選地,所述避撞控制模塊用于:
[0011] 從經(jīng)驗存儲庫中確定與所述障礙物的位置對應的目標可執(zhí)行動作,所述經(jīng)驗存儲 庫中記錄了預先通過機器學習算法確定的障礙物的位置與可執(zhí)行動作的對應關(guān)系,每個障 礙物的位置對應至少一個可執(zhí)行動作,每個可執(zhí)行動作包括決策動作和與所述決策動作 一一對應的增強信號,所述增強信號用于指示與所述增強信號一一對應的決策動作在執(zhí)行 時的立即回報;
[0012] 計算所述目標可執(zhí)行動作中的每個決策動作的未來無窮回報累加和;
[0013] 將所述未來無窮回報累加和最大的決策動作作為所述目標決策動作。
[0014] 可選地,所述避撞控制模塊用于獲取駕駛員的決策動作;
[0015] 所述環(huán)境感知模塊用于獲取執(zhí)行所述駕駛員的決策動作之后所述障礙物的第一 位置;
[0016] 所述避撞控制模塊用于從經(jīng)驗存儲庫中確定與所述障礙物的第一位置對應的目 標可執(zhí)行動作,所述經(jīng)驗存儲庫中記錄了預先通過機器學習算法確定的障礙物的位置與可 執(zhí)行動作的對應關(guān)系,每個障礙物的位置對應至少一個可執(zhí)行動作,每個可執(zhí)行動作包括 決策動作和與所述決策動作一一對應的增強信號,所述增強信號用于指示與所述增強信號 一一對應的決策動作在執(zhí)行時的立即回報;
[0017] 所述避撞控制模塊用于計算所述目標可執(zhí)行動作中的每個決策動作的未來無窮 回報累加和;將所述未來無窮回報累加和最大的決策動作作為所述目標決策動作。
[0018] 可選地,所述避撞控制模塊用于:
[0019] 計算所述駕駛員的決策動作對應的未來n個狀態(tài)的增強信號,得到n個增強信號, 所述n為大于或者等于1的整數(shù);
[0020] 判斷所述n個增強信號中是否存在符合預設條件的增強信號;
[0021] 在所述n個增強信號中存在符合預設條件的增強信號時,觸發(fā)所述環(huán)境感知模塊 獲取執(zhí)行所述駕駛員的決策動作之后所述障礙物的第一位置;
[0022] 其中,在執(zhí)行所述符合預設條件的增強信號對應的決策動作時,所述車輛與所述 車輛的行駛環(huán)境中的障礙物會發(fā)生碰撞。
[0023] 可選地,所述環(huán)境感知模塊用于:
[0024] 判斷所述車輛的行駛環(huán)境中是否存在障礙物;
[0025] 在所述車輛的行駛環(huán)境中存在障礙物時,判斷所述障礙物是否處于預設范圍內(nèi);
[0026] 在所述障礙物處于所述預設范圍時,確定所述車輛的行駛環(huán)境中會發(fā)生由所述障 礙物引發(fā)的突發(fā)事件。
[0027] 第二方面,提供一種駕駛方法,所述方法包括:
[0028] 在車輛行駛過程中監(jiān)測所述車輛的行駛環(huán)境;
[0029] 預測所述車輛的行駛環(huán)境中是否會發(fā)生由障礙物引發(fā)的突發(fā)事件;
[0030] 若所述車輛的行駛環(huán)境中會發(fā)生由障礙物引發(fā)的突發(fā)事件,則獲取所述障礙物的 位置;
[0031] 根據(jù)所述障礙物的位置,采用機器學習算法確定目標決策動作;
[0032] 根據(jù)所述目標決策動作控制所述車輛行駛。
[0033] 可選地,所述根據(jù)所述障礙物的位置,采用機器學習算法確定目標決策動作,包 括:
[0034] 從經(jīng)驗存儲庫中確定與所述障礙物的位置對應的目標可執(zhí)行動作,所述經(jīng)驗存儲 庫中記錄了預先通過機器學習算法確定的障礙物的位置與可執(zhí)行動作的對應關(guān)系,每個障 礙物的位置對應至少一個可執(zhí)行動作,每個可執(zhí)行動作包括決策動作和與所述決策動作 一一對應的增強信號,所述增強信號用于指示與所述增強信號一一對應的決策動作在執(zhí)行 時的立即回報;
[0035] 計算所述目標可執(zhí)行動作中的每個決策動作的未來無窮回報累加和;
[0036] 將所述未來無窮回報累加和最大的決策動作作為所述目標決策動作。
[0037] 可選地,所述根據(jù)所述障礙物的位置,采用機器學習算法確定目標決策動作,包 括:
[0038] 獲取駕駛員的決策動作;
[0039] 獲取執(zhí)行所述駕駛員的決策動作之后所述障礙物的第一位置;
[0040] 從經(jīng)驗存儲庫中確定與所述障礙物的第一位置對應的目標可執(zhí)行動作,所述經(jīng)驗 存儲庫中記錄了預先通過機器學習算法確定的障礙物的位置與可執(zhí)行動作的對應關(guān)系,每 個障礙物的位置對應至少一個可執(zhí)行動作,每個可執(zhí)行動作包括決策動作和與所述決策動 作一一對應的增強信號,所述增強信號用于指示與所述增強信號一一對應的決策動作在執(zhí) 行時的立即回報;
[0041] 計算所述目標可執(zhí)行動作中的每個決策動作的未來無窮回報累加和;
[0042] 將所述未來無窮回報累加和最大的決策動作作為所述目標決策動作。
[0043] 可選地,所述獲取執(zhí)行所述駕駛員的決策動作之后所述障礙物的第一位置,包 括:
[0044] 計算所述駕駛員的決策動作對應的未來n個狀態(tài)的增強信號,得到n個增強信號, 所述n為大于或者等于1的整數(shù);
[0045] 判斷所述n個增強信號中是否存在符合預設條件的增強信號;
[0046] 若所述n個增強信號中存在符合預設條件的增強信號,則獲取執(zhí)行所述駕駛員的 決策動作之后所述障礙物的第一位置;
[0047] 其中,在執(zhí)行所述符合預設條件的增強信號對應的決策動作時,所述車輛與所述 車輛的行駛環(huán)境中的障礙物會發(fā)生碰撞。
[0048] 可選地,所述預測所述車輛的行駛環(huán)境中是否會發(fā)生由障礙物引發(fā)的突發(fā)事件, 包括:
[0049] 判斷所述車輛的行駛環(huán)境中是否存在障礙物;
[0050] 若所述車輛的行駛環(huán)境中存在障礙物,則判斷所述障礙物是否處于預設范圍內(nèi);
[0051] 若所述障礙物處于所述預設范圍內(nèi),則確定所述車輛的行駛環(huán)境中會發(fā)生由所述 障礙物引發(fā)的突發(fā)事件。
[0052] 本發(fā)明提供的技術(shù)方案帶來的有益效果是:
[0053] 本發(fā)明實施例提供的駕駛方法及系統(tǒng),駕駛系統(tǒng)包括:環(huán)境感知模塊和避撞控制 模塊,環(huán)境感知模塊用于在車輛行駛過程中監(jiān)測車輛的行駛環(huán)境;預測車輛的行駛環(huán)境中 是否會發(fā)生由障礙物引發(fā)的突發(fā)事件;在車輛的行駛環(huán)境中會發(fā)生由障礙物引發(fā)的突發(fā)事 件時,獲取障礙物的位置;避撞控制模塊用于根據(jù)障礙物的位置,采用機器學習算法確定目 標決策動作;根據(jù)目標決策動作控制車輛行駛。由于本發(fā)明采用機器學習算法確定目標決 策動作,目標決策動作的確定不受駕駛員的經(jīng)驗的限制,解決了相關(guān)技術(shù)中的駕駛系統(tǒng)具 有局限性,穩(wěn)定性較低,靈活性較差的問題,達到了擴大駕駛系統(tǒng)的應用范圍,提高駕駛系 統(tǒng)的穩(wěn)定性和靈活性的有益效果。
[0054] 應當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性的,并不能限制本 發(fā)明。
【附圖說明】
[0055] 為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使 用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于 本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0056] 圖1是本發(fā)明各個實施例提供的駕駛方法所涉及的一種實施環(huán)境的結(jié)構(gòu)示意圖;
當前第1頁
1 
2 
3 
4 
5