本發(fā)明涉及一種智能數(shù)據(jù)分析的方法,具體涉及一種基于adas技術(shù)及回歸模型的用戶駕駛行為評分方法。
背景技術(shù):
現(xiàn)有的用戶駕駛行為評分方法使用obd(on-boarddiagnostic)或智能手機(jī)收集的數(shù)據(jù),判斷用戶駕駛過程中的急加速、急剎車、急轉(zhuǎn)彎等駕駛行為,通過分別計(jì)算每種駕駛行為的得分及賦予各種駕駛行為一定的權(quán)重,得到用戶駕駛行為最終得分;現(xiàn)有方法存在兩個(gè)方面的局限性:一是使用的數(shù)據(jù)主要是車輛自身運(yùn)動數(shù)據(jù),沒有考慮與外部環(huán)境之間的相關(guān)數(shù)據(jù),難以全面反映用戶駕駛行為;二是各種駕駛行為權(quán)重的確定存在很大主觀性,導(dǎo)致難以準(zhǔn)確量化用戶駕駛行為的危險(xiǎn)程度,用戶駕駛行為最終得分與用戶將來的出險(xiǎn)情況之間的對應(yīng)關(guān)系模糊。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是為了解決現(xiàn)有的用戶駕駛行為評分方法使用的數(shù)據(jù)維度不足、以及用戶駕駛行為最終得分與用戶將來的出險(xiǎn)情況之間對應(yīng)關(guān)系模糊的問題,通過引入與事故直接相關(guān)的各類adas預(yù)警數(shù)據(jù),并基于回歸模型結(jié)果確定影響駕駛安全各因子的權(quán)重系數(shù),實(shí)現(xiàn)對用戶駕駛行為的準(zhǔn)確評分。
本發(fā)明通過下述技術(shù)方案得以實(shí)現(xiàn)的:
一種基于adas技術(shù)及回歸模型的用戶駕駛行為評分方法,其特征在于包括下述步驟:
步驟1、收集用戶駕駛行為樣本數(shù)據(jù)
將用戶在一定期間內(nèi)的駕駛行為數(shù)據(jù)進(jìn)行采集,包括:adas預(yù)警數(shù)據(jù)、車輛自身運(yùn)動數(shù)據(jù)、駕駛時(shí)環(huán)境數(shù)據(jù);隨著模型的建立,對于數(shù)據(jù)種類的需求也會相應(yīng)發(fā)生變化,但這些都是需要通過傳感器等進(jìn)行采集;
其中,adas預(yù)警數(shù)據(jù)包括:前碰撞預(yù)警百公里頻次、車道偏離預(yù)警百公里頻次、騎線行駛報(bào)警百公里頻次、疲勞駕駛預(yù)警百公里頻次、駕車時(shí)操作手機(jī)時(shí)間占比、超速行駛百公里頻次、交通違章百公里頻次;adas預(yù)警數(shù)據(jù)可通過杭州好好好開車科技有限公司的adas車載終端“那狗”獲得,或通過類似的adas功能模塊獲得。
車輛自身運(yùn)動數(shù)據(jù)包括:急加速百公里頻次、急剎車百公里頻次、急轉(zhuǎn)彎百公里頻次、年化行駛里程數(shù);車輛自身運(yùn)動數(shù)據(jù)可通過加速度計(jì)、陀螺儀、磁力計(jì)、gps模塊(globalpositioningsystem,全球定位系統(tǒng))、obd(on-boarddiagnostic,車載診斷系統(tǒng))等獲得。
駕駛時(shí)環(huán)境數(shù)據(jù)包括:城市道路里程占比、熟悉路段里程占比、高危時(shí)段駕車時(shí)間占比、惡劣天氣駕車時(shí)間占比;駕駛時(shí)環(huán)境數(shù)據(jù)可通過車輛自身運(yùn)動數(shù)據(jù)結(jié)合地圖數(shù)據(jù)、天氣數(shù)據(jù)等獲得。
步驟2、收集用戶車輛出險(xiǎn)樣本數(shù)據(jù)
收集用戶一定期間發(fā)生車險(xiǎn)事故數(shù)據(jù),如用戶發(fā)生車險(xiǎn)事故,且用戶為負(fù)有責(zé)任,則認(rèn)定該用戶在這期間內(nèi)“發(fā)生事故”,否則為“未出險(xiǎn)”;用戶發(fā)生車險(xiǎn)事故,可以根據(jù)交通事故責(zé)任認(rèn)定用戶負(fù)有責(zé)任,通過技術(shù)判定也可以。
步驟3、建立樣本數(shù)據(jù)回歸模型
由步驟1、步驟2收集的樣本數(shù)據(jù),建立樣本數(shù)據(jù)的回歸模型,模型可選用貝努利分布假設(shè)下的回歸模型,也可根據(jù)樣本數(shù)據(jù)的組織形式,用其他二分類因變量的回歸模型;
步驟1中收集的用戶駕駛行為數(shù)據(jù)有k種,即用戶駕駛行為用k個(gè)解釋變量x1,x2,…,xk描述;步驟1樣本中用戶數(shù)量為n,對于第i個(gè)用戶,其對應(yīng)的解釋變量為x1i,x2i,…,xki;回歸模型中k個(gè)解釋變量對應(yīng)的系數(shù)分別為β1,β2,…,βk,另外模型的截距項(xiàng)為β0;模型的因變量記為y,對于第i個(gè)用戶,步驟2中該用戶在一年度內(nèi)“發(fā)生事故”,yi記為1,“未出險(xiǎn)”yi則記為0;利用貝努利分布假設(shè)下的logistic回歸模型為:
其中g(shù)()為logistic回歸模型的連接函數(shù),
πi為第i個(gè)用戶的出險(xiǎn)概率
β為logistic回歸模型的回歸系數(shù)向量,β=[β0,β1,β2,...,βk]t
根據(jù)樣本的因變量y,采用迭代加權(quán)最小二乘估計(jì)或直接用r語言中的gamlss函數(shù)確定以上logistic回歸模型的回歸系數(shù)向量β,從而可得第i個(gè)用戶的出險(xiǎn)概率為:
步驟4、用戶駕駛行為評分
對于任意一個(gè)用戶,通過收集其一段時(shí)間內(nèi)的駕駛行為數(shù)據(jù),并按一定期間口徑進(jìn)行標(biāo)準(zhǔn)化,得到解釋向量[1,x1,x2,…,xk],然后根據(jù)步驟3確定的logistic回歸模型的回歸系數(shù)向量[β0,β1,β2,...,βk],可得到該用戶1個(gè)年度內(nèi)的出險(xiǎn)概率估計(jì)值:
并進(jìn)一步根據(jù)該用戶此期間內(nèi)的出險(xiǎn)概率估計(jì)值,確定其駕駛行為評分s為:
作為優(yōu)選,上述一種用戶駕駛行為評分方法中步驟1、步驟2中的一定期間為不少于半年,樣本數(shù)據(jù)的采集量不少于5000。作為更佳優(yōu)選,選擇一年為常用的期間,從技術(shù)效果、實(shí)際運(yùn)行的成本等多因素考慮,都較為合理。在采集數(shù)據(jù)時(shí),一般采集的數(shù)據(jù)量為10000,可以得出較好的技術(shù)結(jié)果。
有益效果:
本發(fā)明通過引入與事故直接相關(guān)的各類adas預(yù)警數(shù)據(jù),并基于logistic回歸模型對用戶駕駛行為進(jìn)行評分,用戶駕駛行為評分與用戶的出險(xiǎn)概率之間存在嚴(yán)格對應(yīng)關(guān)系,可準(zhǔn)確量化、識別用戶駕駛風(fēng)險(xiǎn)。
附圖說明
圖1本發(fā)明的流程示意圖
具體實(shí)施方式
下面對本發(fā)明的實(shí)施作具體說明:
實(shí)施例1
本實(shí)施例所述的基于adas技術(shù)及回歸模型的用戶駕駛行為評分方法具體步驟如下:
步驟1、收集用戶駕駛行為樣本數(shù)據(jù)
用戶駕駛行為樣本數(shù)據(jù)收集包括對一定量(取1萬)的用戶一定期間(取1年內(nèi))的駕駛行為數(shù)據(jù)進(jìn)行收集。用戶駕駛行為數(shù)據(jù)包括但不限于以下種類:adas預(yù)警數(shù)據(jù)、車輛自身運(yùn)動數(shù)據(jù)、駕駛時(shí)環(huán)境數(shù)據(jù)等。
adas預(yù)警數(shù)據(jù)通過杭州好好好開車科技有限公司的adas車載終端“那狗”獲得,adas預(yù)警數(shù)據(jù)包括:前碰撞預(yù)警百公里頻次(即每百公里前碰撞預(yù)警次數(shù))、車道偏離預(yù)警百公里頻次、騎線行駛報(bào)警百公里頻次、疲勞駕駛預(yù)警百公里頻次、駕車時(shí)操作手機(jī)時(shí)間占比、超速行駛百公里頻次、交通違章百公里頻次等。
車輛自身運(yùn)動數(shù)據(jù)根據(jù)加設(shè)加速度計(jì)、陀螺儀、磁力計(jì)、gps模塊(globalpositioningsystem,全球定位系統(tǒng))、obd(on-boarddiagnostic,車載診斷系統(tǒng))等獲得。通過上述設(shè)備,可獲得車輛自身運(yùn)動數(shù)據(jù)包括:急加速百公里頻次、急剎車百公里頻次、急轉(zhuǎn)彎百公里頻次、年化行駛里程數(shù)等。
駕駛時(shí)環(huán)境數(shù)據(jù)通過車輛自身運(yùn)動數(shù)據(jù)結(jié)合地圖數(shù)據(jù)、天氣數(shù)據(jù)等獲得。駕駛時(shí)環(huán)境數(shù)據(jù)包括:城市道路里程占比、熟悉路段里程占比、高危時(shí)段駕車時(shí)間占比、惡劣天氣駕車時(shí)間占比等。
步驟2、收集用戶車輛出險(xiǎn)樣本數(shù)據(jù)
收集用戶一定期間(取1年內(nèi))是否發(fā)生車險(xiǎn)事故數(shù)據(jù)。如一個(gè)年度內(nèi),用戶發(fā)生車險(xiǎn)事故,且根據(jù)交通事故責(zé)任認(rèn)定用戶負(fù)有責(zé)任,則記該用戶在這一年度內(nèi)“發(fā)生事故”,否則為“未出險(xiǎn)”。
步驟3、建立樣本數(shù)據(jù)回歸模型
由步驟1、步驟2收集的樣本數(shù)據(jù),建立樣本數(shù)據(jù)的回歸模型,模型選用貝努利分布假設(shè)下的logistic回歸模型,為例進(jìn)行說明。
步驟1中收集的用戶駕駛行為數(shù)據(jù)有k種,即用戶駕駛行為用k個(gè)解釋變量x1,x2,…,xk描述。假設(shè)步驟1樣本中用戶數(shù)量為n,對于第i個(gè)用戶,其對應(yīng)的解釋變量為x1i,x2i,…,xki?;貧w模型中k個(gè)解釋變量對應(yīng)的系數(shù)分別為β1,β2,…,βk,另外模型的截距項(xiàng)為β0。模型的因變量記為y,對于第i個(gè)用戶,步驟2中該用戶在一年度內(nèi)“發(fā)生事故”,yi記為1,“未出險(xiǎn)”yi則記為0。貝努利分布假設(shè)下的logistic回歸模型為:
其中g(shù)()為logistic回歸模型的連接函數(shù),
πi為第i個(gè)用戶的出險(xiǎn)概率
β為logistic回歸模型的回歸系數(shù)向量,β=[β0,β1,β2,...,βk]t
根據(jù)樣本的因變量y,可采用迭代加權(quán)最小二乘估計(jì)或直接用r語言中的gamlss函數(shù)確定以上logistic回歸模型的回歸系數(shù)向量β,從而可得第i個(gè)用戶的出險(xiǎn)概率為:
步驟4、用戶駕駛行為評分
對于任意一個(gè)用戶,通過收集其一段時(shí)間內(nèi)的駕駛行為數(shù)據(jù),并按1個(gè)年度口徑進(jìn)行標(biāo)準(zhǔn)化,得到解釋向量[1,x1,x2,…,xk],然后根據(jù)步驟3確定的logistic回歸模型的回歸系數(shù)向量[β0,β1,β2,...,βk],可得到該用戶1個(gè)年度內(nèi)的出險(xiǎn)概率估計(jì)值:
并進(jìn)一步根據(jù)該用戶1個(gè)年度內(nèi)的出險(xiǎn)概率估計(jì)值確定其駕駛行為評分s為:
通過本發(fā)明的試用,1.首次在用戶駕駛行為評分中引入各類adas預(yù)警數(shù)據(jù),能更準(zhǔn)確地量化用戶駕駛風(fēng)險(xiǎn);2.首次通過對包含各類adas預(yù)警數(shù)據(jù)及其他駕駛行為數(shù)據(jù)、用戶出險(xiǎn)數(shù)據(jù)建立logistic回歸模型,能更準(zhǔn)確地估計(jì)用戶在1個(gè)年度內(nèi)的出險(xiǎn)概率;3.首次基于用戶在1個(gè)年度內(nèi)的出險(xiǎn)概率估計(jì)值,確定用戶駕駛行為評分,并得到用戶駕駛行為評分最終表達(dá)式為:
本發(fā)明所述方法可實(shí)現(xiàn)用戶駕駛行為評分和用戶出險(xiǎn)概率之間的一一對應(yīng),如得分為0的客戶在一個(gè)年度內(nèi)的出險(xiǎn)概率預(yù)計(jì)值為100%;得分為60的客戶在一個(gè)年度內(nèi)的出險(xiǎn)概率預(yù)計(jì)值為40%;得分為80的客戶在一個(gè)年度內(nèi)的出險(xiǎn)概率預(yù)計(jì)值為20%;得分為100的客戶在一個(gè)年度內(nèi)的出險(xiǎn)概率預(yù)計(jì)值為0%。本發(fā)明可為保險(xiǎn)機(jī)構(gòu)充分評估駕駛?cè)藛T的駕車習(xí)慣作充分的了解,同時(shí)也為保障出車安全提供有效的參考。