亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于機器學習的車輛估價的方法、存儲介質(zhì)及裝置與流程

文檔序號:11262285閱讀:1050來源:國知局
一種基于機器學習的車輛估價的方法、存儲介質(zhì)及裝置與流程

本發(fā)明涉及一種車輛估價技術領域,尤其涉及一種基于機器學習的車輛估價的方法、存儲介質(zhì)及裝置。



背景技術:

目前,當前二手車估價主要靠收車師的個人經(jīng)驗,收車師往往只能對部分地區(qū)、部分車型做到準確估價?;谝?guī)則統(tǒng)計的估值方法雖然看似有效,但粒度太粗,一旦細化到不同車型,準確度有待考量。放眼整個市場,各類品牌、各個地區(qū)、不同里程的二手車每天都在成交產(chǎn)生大量數(shù)據(jù)。

當前主要有如下的方案:利用不同間隔時間內(nèi),相同車型的車輛零售價格比相同來估價。該方案利用最近一段時間內(nèi)的車輛成交數(shù)據(jù),從車型、上牌年份、城市三個維度分別處理數(shù)據(jù)得出某個車型在某個城市的零售價格比,找出與待估價車類似的車輛數(shù)據(jù),便可利用零售價格比得出當前的估值。

但是,現(xiàn)有的估價方式存在以下缺陷:

(1)估價完全依賴收車師的個人經(jīng)驗和專業(yè)只是和所掌握的市場行情;

(2)收車師對車型價格的調(diào)整通過經(jīng)驗來進行評定,沒有量化,不利于估價經(jīng)驗的復制,不利于估價的透明和公平;

(3)收車師依據(jù)個人的能力,很難掌握完整和及時獲取市場行情;

(4)數(shù)據(jù)的利用率較低,僅最近一段時間內(nèi)的數(shù)據(jù)能利用;

(5)車輛估值具有滯后性,當新車降價時,不能立即體現(xiàn)在二手車估值中;

(6)能夠估價的車型較少。由于粒度是車型+城市,對于非熱門車型,數(shù)據(jù)量不夠。



技術實現(xiàn)要素:

為了克服現(xiàn)有技術的不足,本發(fā)明的目的之一在于提供一種基于機器學習的車輛估價的方法,其能解決二手車車輛準確估價的技術問題。

本發(fā)明的目的之二在于提供一種存儲介質(zhì),其能解決二手車車輛準確估價的技術問題。

本發(fā)明的目的之三在于提供一種電子設備,其能解決二手車車輛準確估價的技術問題。

本發(fā)明的目的之四在于提供一種基于機器學習的車輛估價的裝置,其能解決二手車車輛準確估價的技術問題。

本發(fā)明的目的之一采用如下技術方案實現(xiàn):

一種基于機器學習的車輛估價的方法,包括以下步驟:

信息獲取步驟:獲取車輛的原始數(shù)據(jù),所述車輛原始數(shù)據(jù)包括車輛年款、上牌時間以及車輛配置;

預處理步驟:對車輛的原始數(shù)據(jù)進行按照不同分類進行預處理以得到車輛的特征集,所述特征集包括自有特征集;

殘差率計算步驟:通過gbrt模型獲取與車輛的特征集中各個特征對應的殘差率;

估計計算步驟:獲取與車輛對應的殘差率和廠商指導價以得車輛估價。

進一步地,在信息獲取步驟之后還包括數(shù)據(jù)篩選步驟:判斷上牌時間是否處于該車輛年款的時間周期內(nèi),如果是,則執(zhí)行預處理步驟。

進一步地,在預處理步驟中,所述特征集還包括查詢類特征集和實時類特征集。

本發(fā)明的目的之二采用如下技術方案實現(xiàn):

一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序使得計算機執(zhí)行如上任意一項所描述的方法。

本發(fā)明的目的之三采用如下技術方案實現(xiàn):

一種電子設備,包括:處理器;

存儲器;以及程序,其中所述程序被存儲在所述存儲器中,并且被配置成由處理器執(zhí)行,所述程序包括用于執(zhí)行以下方法的步驟:

信息獲取步驟:獲取車輛的原始數(shù)據(jù),所述車輛原始數(shù)據(jù)包括車輛年款、上牌時間以及車輛配置;

預處理步驟:對車輛的原始數(shù)據(jù)進行按照不同分類進行預處理以得到車輛的特征集,所述特征集包括自有特征集;

殘差率計算步驟:通過gbrt模型獲取與車輛的特征集中各個特征對應的殘差率;

估計計算步驟:獲取與車輛對應的殘差率和廠商指導價以得車輛估價。

進一步地,在信息獲取步驟之后還包括數(shù)據(jù)篩選步驟:判斷上牌時間是否處于該車輛年款的時間周期內(nèi),如果是,則執(zhí)行預處理步驟。

進一步地,在預處理步驟中,所述特征集還包括查詢類特征集和實時類特征集。

本發(fā)明的目的之四采用如下技術方案實現(xiàn):

一種基于機器學習的車輛估價的裝置,包括以下模塊:

信息獲取模塊:用于獲取車輛的原始數(shù)據(jù),所述車輛原始數(shù)據(jù)包括車輛年款、上牌時間以及車輛配置;

預處理模塊:用于對車輛的原始數(shù)據(jù)進行按照不同分類進行預處理以得到車輛的特征集,所述特征集包括自有特征集;

殘差率計算模塊:用于通過gbrt模型獲取與車輛的特征集中各個特征對應的殘差率;

估計計算模塊:用于獲取與車輛對應的殘差率和廠商指導價以得車輛估價。

進一步地,在信息獲取模塊之后還包括數(shù)據(jù)篩選模塊:用于判斷上牌時間是否處于該車輛年款的時間周期內(nèi),如果是,則執(zhí)行預處理模塊。

進一步地,在預處理步驟中,所述特征集還包括查詢類特征集和實時類特征集。

相比現(xiàn)有技術,本發(fā)明的有益效果在于:

本發(fā)明利用二手車的成交數(shù)據(jù)以及當前可以獲取到的車輛數(shù)據(jù)信息,通過采用gbrt挖掘車輛各個特征與殘差率之間的關系,并且除了查詢參數(shù)以外,引入實時數(shù)據(jù)來對二手車進行準確估價。

附圖說明

圖1為本發(fā)明的基于機器學習的車輛估價的方法的流程圖;

圖2為本發(fā)明的基于機器學習的車輛估價的方法的流程模型圖;

圖3為本發(fā)明的基于機器學習的車輛估價的裝置的結(jié)構(gòu)圖。

具體實施方式

下面,結(jié)合附圖以及具體實施方式,對本發(fā)明做進一步描述,需要說明的是,在不相沖突的前提下,以下描述的各實施例之間或各技術特征之間可以任意組合形成新的實施例。

如圖1所示,本發(fā)明提供一種基于機器學習的車輛估價的方法,包括以下步驟:

步驟s1:獲取車輛的原始數(shù)據(jù),車輛原始數(shù)據(jù)包括車輛年款、上牌時間以及車輛配置;這里的原始數(shù)據(jù)即為最初的、沒有經(jīng)過篩選處理過的數(shù)據(jù);

步驟s11:判斷上牌時間是否處于該車輛年款的時間周期內(nèi),如果是,則執(zhí)行預處理步驟;設置該數(shù)據(jù)篩選的目的是為了篩選處具有代表性的數(shù)據(jù);

步驟s2:對車輛的原始數(shù)據(jù)進行按照不同分類進行預處理以得到車輛的特征集,特征集包括自有特征集、查詢類特征集和實時類特征集;其中自有特征集為車輛自己本身的特征數(shù)據(jù),也即是車輛配置數(shù)據(jù),其主要包括有車輛的品牌、車系以及車型特征,車型特征包括有座位數(shù)、變速箱、發(fā)動機排量、廠商指導價、油箱容量、車系類型等等數(shù)據(jù),因為相同的車輛不同的配置之間也會有不同的殘差率;高配和低配車型的殘差也不一樣,在進行設置的時候一定要進行不同程度的區(qū)分;

除了車型本身的特定,二手車的估價還有其他方面的因素在影響,比如查詢類特征集,該查詢類特征集包括有車輛的行駛里程,車輛買賣所在的城市以及車況,這些數(shù)據(jù)是可以根據(jù)不同車的實際需求來進行相應的處理;實時類特征集包括有經(jīng)銷商售價、市場交易天數(shù)和車輛評分等因素。通過引入了經(jīng)銷商采購價、市場交易天數(shù)、車輛評價分數(shù)作為模型訓練的特征,當經(jīng)銷商采購價發(fā)生變化,或者市場交易天數(shù)變化(表示車輛在二手車市場的熱門程度),或者車輛評價變化(表示新車受追捧程度),能實時體現(xiàn)在車輛的估值上;

步驟s3:通過gbrt模型獲取與車輛的特征集中各個特征對應的殘差率。從而可以建立完整的模型以便于客戶進行搜索查詢;其中gbrt模型為漸進梯度回歸樹,這種算法由多棵決策樹組成,所有樹的輸出結(jié)果累加起來就是最終的答案,回歸樹的目的是被用于預測實數(shù)值,其計算得到的是一個具體的數(shù)值,其中第一棵樹是正常的,之后所有的樹的決策都是由殘差(此次的值與上一次的值之差)來做決策的,在進行計算的時候其可以通過具體的公式算法來得到殘差,從而得到殘差率;

步驟s4:獲取與車輛對應的殘差率和廠商指導價以得車輛估價;車輛估價=廠商指導價*殘差率。

利用二手車成交數(shù)據(jù)、車型庫數(shù)據(jù)、實時經(jīng)銷商價格、市場銷售天數(shù)、車輛評價分數(shù),以及自定義有效數(shù)據(jù)范圍,采用gbrt挖掘各個特征的非線性關系生成模型,估價時,除了自有特征以及查詢特征參數(shù)外,引入實時數(shù)據(jù),方便于給出準確估價。

本方案中,采用車型的配置+年份代替具體車型,即具有相同配置的同年份車被認為具有相同的殘值率,這樣很大提高能估價車型的數(shù)量;其次,另外,自定義有效數(shù)據(jù),僅將這部分數(shù)據(jù)作為模型的訓練數(shù)據(jù)。最后,由于機器學習模型與傳統(tǒng)基于規(guī)則方法的不同,也正是這樣,才能大數(shù)據(jù)中挖掘出殘值率與各個特征的關系。

本方案中,首先自定義了有效數(shù)據(jù)邏輯,該邏輯是為了篩選出有代表性的估價數(shù)據(jù)。比如2015年款的車,有代表性的上牌時間為2015年1月到2015年12月,到2017年4月,共經(jīng)歷17個月至28個月。由于車輛殘值會隨著時間而變化,所以計算上牌時間到成交時間經(jīng)歷的月份數(shù),如果落在上述月份數(shù)內(nèi),則為有效數(shù)據(jù),否則不是。數(shù)據(jù)預處理邏輯??煞譃?部分,查詢類特征、自有特征、實時類特征以及l(fā)abel(實際殘值率)。殘值率的計算由成交價格除以廠商指導價得到,也是模型預測的目標值。查詢類特征指估值的主要查詢參數(shù),很大程度影響估值結(jié)果。自有特征是車型的具體參數(shù),不隨外界條件的改變而改變。實時類特征在一小段時間范圍內(nèi)的改變較小,但隨時間跨度變大,會發(fā)生較大變化。經(jīng)銷商零售價隨地區(qū)不同會不同。市場交易天數(shù)由監(jiān)控每個地區(qū)每個車型的二手車銷售天數(shù)獲取。對連續(xù)型特征標準化,對離散型特征啞編碼。

在進行估值時,輸入查詢條件,后臺查詢當前的實時類特征數(shù)據(jù)(模型生成時的實時類特征數(shù)據(jù)可能已經(jīng)發(fā)生變化,需要用最新的數(shù)據(jù)),輸入模型計算殘值率,再查詢廠商指導價計算殘值。

本發(fā)明公開了一種電子設備,包括一個或多個處理器、存儲器以及一個或者多個程序,其中一個或多個程序被存儲在存儲器中,并且被配置成由一個或多個處理器執(zhí)行,程序包括用于執(zhí)行上述方法,或者本發(fā)明的方法存儲在可讀的存儲介質(zhì)上,并且該方法程序可以被處理器執(zhí)行。該電子設備可以是手機、電腦、平板電腦等等一系列的電子設備。

如圖2所示,本發(fā)明公開了一種基于機器學習的車輛估價的裝置,包括以下模塊:

信息獲取模塊:用于獲取車輛的原始數(shù)據(jù),車輛原始數(shù)據(jù)包括車輛年款、上牌時間以及車輛配置;

數(shù)據(jù)篩選模塊:用于判斷上牌時間是否處于該車輛年款的時間周期內(nèi),如果是,則執(zhí)行預處理模塊;

預處理模塊:用于對車輛的原始數(shù)據(jù)進行按照不同分類進行預處理以得到車輛的特征集,特征集包括自有特征集、查詢類特征集和實時類特征集;

殘差率計算模塊:用于通過gbrt模型獲取與車輛的特征集中各個特征對應的殘差率;

估計計算模塊:用于獲取與車輛對應的殘差率和廠商指導價以得車輛估價。

上述實施方式僅為本發(fā)明的優(yōu)選實施方式,不能以此來限定本發(fā)明保護的范圍,本領域的技術人員在本發(fā)明的基礎上所做的任何非實質(zhì)性的變化及替換均屬于本發(fā)明所要求保護的范圍。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1