1.一種基于多元回歸模型的高速列車動態(tài)軸溫預(yù)測方法,其特征在于,具體按照以下步驟實施:
步驟1、對列車的原始數(shù)據(jù)進行分類;
步驟2:對所述步驟1進行分類后的數(shù)據(jù)進行分區(qū)處理;
步驟3:對所述步驟2得到的分區(qū)處理后的數(shù)據(jù)建立軸溫分析的流模型;
步驟4:對所述步驟3得到的流模型進行檢驗。
2.根據(jù)權(quán)利要求1所述的一種基于多元回歸模型的高速列車動態(tài)軸溫預(yù)測方法,其特征在于,所述步驟1具體按照以下步驟實施:
步驟(1.1)、采集列車原始軸溫數(shù)據(jù),放入集合“Num.1”中,列車原始軸溫數(shù)據(jù)包括:列車速度v、軸溫T、每個起停階段的初始軸溫T0、環(huán)境溫度C、運行時間t以及載重L;
步驟(1.2)、將所述步驟(1.1)中采集到的列車原始軸溫數(shù)據(jù)集合“Num.1”按照速度分割為n個起停階段,每個起停階段均包括n個加速階段、n個平穩(wěn)運行階段和n個減速階段;
步驟(1.3)、將所述步驟(1.2)中的n個加速階段的數(shù)據(jù)放入集合“Num.2”中的表sheet1中,然后將表sheet1重命名為“加速階段”,將n個平穩(wěn)運行階段的數(shù)據(jù)放入集合“Num.2”中的表sheet2中,然后將sheet2重命名為“平穩(wěn)運行階段”,將n個減速階段的數(shù)據(jù)放入集合“Num.2”中的表sheet3中,然后將表sheet3重命名為“減速階段”。
3.根據(jù)權(quán)利要求2所述的一種基于多元回歸模型的高速列車動態(tài)軸溫預(yù)測方法,其特征在于,所述步驟(1.1)中n=9。
4.根據(jù)權(quán)利要求1所述的一種基于多元回歸模型的高速列車動態(tài)軸溫預(yù)測方法,其特征在于,所述步驟2具體按照以下步驟實施:
對于所述步驟1中的“Num.2”中三個運行階段的運行時間點t,令t=random(10),隨機產(chǎn)生一個0~10的隨機數(shù)賦給變量t,若t>3則為“真”,否則為“假”,且導(dǎo)出包含t>3對應(yīng)的變量作為“訓(xùn)練樣本”數(shù)據(jù)集,導(dǎo)出不包含t>3對應(yīng)的變量作為“測試樣本”數(shù)據(jù)集,以此方法將會分別得到“加速訓(xùn)練樣本.xls”,“平穩(wěn)訓(xùn)練樣本.xls”,“減速訓(xùn)練樣本.xls”,“加速測試樣本.xls”,“平穩(wěn)測試樣本.xls”,“減速測試樣本.xls”。
5.根據(jù)權(quán)利要求1所述的一種基于多元回歸模型的高速列車動態(tài)軸溫預(yù)測方法,其特征在于,所述步驟3具體按照以下步驟實施:
步驟(3.1)、預(yù)測變量的相關(guān)性:
對經(jīng)過所述步驟2處理后的“加速訓(xùn)練樣本.xls”,“平穩(wěn)訓(xùn)練樣本.xls”及“減速訓(xùn)練樣本.xls”中的預(yù)測變量進行相關(guān)性分析,即速度v、每個起停階段的初始軸溫T0、環(huán)境溫度C、運行時間t以及載重L與軸溫T之間的相關(guān)性系數(shù),其依據(jù)如下:
其中,N為變量的個數(shù),xi為自變量,yi為因變量——軸溫T,r為皮爾遜Pearson相關(guān)系數(shù),當(dāng)
(1)0.8≤r≤1時,變量為極強相關(guān);
(2)0.6≤r<0.8時,變量為強相關(guān);
(3)0.4≤r<0.6時,變量為中等程度相關(guān);
(4)0.2≤r<0.4時,變量為弱相關(guān);
(5)0.0≤r<0.2時,變量為極弱相關(guān)或者無相關(guān),
因為影響軸溫的因素較多,故能夠根據(jù)相關(guān)系數(shù)r剔除掉極弱相關(guān)或者無關(guān)的影響因素;
步驟(3.2)、回歸系數(shù)的計算:
對經(jīng)過所述步驟2處理后得到的三個階段的訓(xùn)練樣本數(shù)據(jù)進行回歸分析,樣本回歸模型的矩陣表示為其中,e為因變量的實測值與估計值之差,為偏回歸系數(shù),表示當(dāng)其他自變量取值固定時,自變量xi每改變一個單位時yi的變化量,將三個運行階段中的變量速度v(x1i)、每個起停階段的初始軸溫T0(x2i)、環(huán)境溫度C(x3i)、運行時間t(x4i)以及載重L(x5i)作為回歸模型中的自變量xki,且生成自變量矩陣X如下:
上式中,k為自變量的個數(shù),i為每個自變量包含的元素數(shù),
將軸溫T(yi)作為回歸模型中的因變量yi,且生成包含所有目標(biāo)集的k維向量Y如下:
用公式得出各回歸系數(shù)進而得到因變量yi的估計值其中,X'為自變量組成的矩陣X的轉(zhuǎn)置;
步驟(3.3)、在數(shù)據(jù)挖掘工具SPSS Modeler中建立流模型:
在SPSS Modeler中,首先在“源”選項卡里面選擇“excel”節(jié)點,將“訓(xùn)練樣本.xls”導(dǎo)入此節(jié)點中,然后在“字段選項”選項卡里面選擇“過濾”節(jié)點filter與“類型”節(jié)點type,用此“過濾”節(jié)點可以過濾掉列車運行的“時刻”項,“類型”節(jié)點用以設(shè)置各變量的角色,然后在“建?!边x項卡里面選擇“特征選擇”feature selection和“回歸”regression節(jié)點,接下來在“字段”選項卡里選擇“導(dǎo)出”節(jié)點export,用以導(dǎo)出模型得到的軸溫值與原始軸溫對比的表和方框圖。
6.根據(jù)權(quán)利要求1所述的一種基于多元回歸模型的高速列車動態(tài)軸溫預(yù)測方法,其特征在于,所述步驟4具體按照以下步驟實施:
步驟(4.1)、模型的匯總檢驗:
用如下公式衡量模型整體的好壞,其中,復(fù)相關(guān)系數(shù)R,決定系數(shù)R2,校正的決定系數(shù)Radj2:
其中,復(fù)相關(guān)系數(shù)R表示模型中自變量與因變量線性關(guān)系的密切程度,其中yi為因變量軸溫T,為所述步驟(3.2)中得到的yi的估計量,實際上它是yi與其估計量的簡單線性相關(guān)系數(shù),其取值范圍為(0,1),沒有負值,R值越大,說明線性回歸關(guān)系越密切,決定系數(shù)R2表示因變量的總變異中由回歸模型中自變量解釋的部分所占的比例,回歸方程的解釋力一般是由決定系數(shù)R2來測量的,因此一般情況下R2越大越好,其中SSR為回歸平方和,SStotal為總的平方和,為因變量軸溫T的均值,校正的決定系數(shù)Radj2是衡量所建模型好壞的重要指標(biāo)之一,其中,n表示的是樣本的含量,p表示的是自變量的個數(shù),Radj2越大,模型的效果越好;
步驟(4.2)、訓(xùn)練樣本的相對誤差直方圖:
對步驟2中得到的訓(xùn)練樣本,分別對三個運行階段的訓(xùn)練樣本,用步驟(3.2)得到的回歸方程計算出估計值則相對誤差為
然后畫出其直方圖,觀察其分布情況;
步驟(4.3)、對測試樣本進行檢驗:
對步驟2中得到的測試樣本,分別對三個運行階段的測試樣本,用步驟(3.2)得到的回歸方程計算出估計值則相對誤差為
然后分別對三個運行階段的測試樣本,在一個圖中畫出因變量軸溫T、軸溫T的估計值相對誤差(relative error)的折線圖,并使用雙坐標(biāo)形式,相對誤差圖能夠反映出模型擬合效果的情況,在此圖中,通過預(yù)測值和真實值的折線圖能夠清楚的看到模型擬合的效果,而通過相對誤差折線圖能夠看到預(yù)測效果的好壞,如果隨著時間的推移,相對誤差值變得越來越大,則說明模型對后期預(yù)測效果不如早期的,因為預(yù)測誤差始終處于可接受范圍,故該方法能有效對軸溫進行預(yù)測,從而可以將軸溫的不正常升溫當(dāng)做列車熱軸故障檢測的一個判別標(biāo)準,以最大可能的避免事故的擴大。