本發(fā)明涉及一種基于神經(jīng)網(wǎng)絡(luò)集成的股票趨勢(shì)預(yù)測(cè)方法。
背景技術(shù):
:證券市場(chǎng)是以股票價(jià)格為參考來(lái)供個(gè)人或機(jī)構(gòu)進(jìn)行股票或衍生品交易的一個(gè)公共市場(chǎng)。同時(shí),證券市場(chǎng)作為中立方為券商和公司進(jìn)行投資提供了機(jī)會(huì),是國(guó)家經(jīng)濟(jì)狀況的主要指標(biāo)之一。然而,股票價(jià)格基本上是動(dòng)態(tài)的,非線性的,相當(dāng)程度的受人為因素的影響。同時(shí),股票價(jià)格的變動(dòng)也受許多宏觀經(jīng)濟(jì)因素的影響,如政治事件、公司的政策、商品價(jià)格指數(shù)、銀行利率等等。因此,預(yù)測(cè)股票價(jià)格的運(yùn)動(dòng)是件復(fù)雜、具有挑戰(zhàn)的事情,并且投資者和國(guó)家管理者也很感興趣。近年來(lái)在金融市場(chǎng)預(yù)測(cè)處理方面,人工神經(jīng)網(wǎng)絡(luò)(ANN)已經(jīng)被證明是表現(xiàn)不錯(cuò)的研究模型。人工神經(jīng)網(wǎng)絡(luò)模型來(lái)預(yù)測(cè)、發(fā)現(xiàn)和總結(jié)金融變量結(jié)構(gòu)的優(yōu)勢(shì)在于其不依賴于特定的假設(shè)。目前在股市的預(yù)測(cè)應(yīng)用中大多采用的是BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)和Elman回歸神經(jīng)網(wǎng)絡(luò),或者基于這三種網(wǎng)絡(luò)的一些改進(jìn)。然而,這三種神經(jīng)網(wǎng)絡(luò)在處理數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí)存在各種不足:BP網(wǎng)絡(luò)是基于梯度下降算法的,存在局部極小、魯棒性不高等缺陷;RBF神經(jīng)網(wǎng)絡(luò)屬于靜態(tài)前饋網(wǎng)絡(luò),對(duì)處理動(dòng)態(tài)時(shí)間建模問(wèn)題存在不足,不能滿足需要;Elman網(wǎng)絡(luò)是一種局部的循環(huán)網(wǎng)絡(luò),由于在學(xué)習(xí)過(guò)程中其隱含層中需要更多的隱含單元,因此需要更多的訓(xùn)練時(shí)間,另外,由于Elman網(wǎng)絡(luò)使用BP算法來(lái)處理變量,因此也存在局部極小值和收斂速度慢的問(wèn)題。因此,現(xiàn)在亟待研究出一種能夠克服以上所述缺陷的方法來(lái)預(yù)測(cè)股票趨勢(shì)。技術(shù)實(shí)現(xiàn)要素:針對(duì)上述現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明的目的在于提供一種可避免出現(xiàn)上述技術(shù)缺陷的基于神經(jīng)網(wǎng)絡(luò)集成的股票趨勢(shì)預(yù)測(cè)方法。為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明提供的技術(shù)方案如下:一種基于神經(jīng)網(wǎng)絡(luò)集成的股票趨勢(shì)預(yù)測(cè)方法,采用由BP神經(jīng)網(wǎng)絡(luò)、Elman神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)組成的神經(jīng)網(wǎng)絡(luò)集成模型來(lái)預(yù)測(cè)股票趨勢(shì)。進(jìn)一步地,所述股票趨勢(shì)預(yù)測(cè)方法具體包括以下步驟:步驟1)組織好訓(xùn)練語(yǔ)料,然后分別訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)、Elman神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)三種神經(jīng)網(wǎng)絡(luò)模型,得到三個(gè)神經(jīng)網(wǎng)絡(luò)個(gè)體。步驟2)用所述三個(gè)神經(jīng)網(wǎng)絡(luò)個(gè)體分別去預(yù)測(cè)處理股票參數(shù)數(shù)據(jù),對(duì)于每條測(cè)試記錄,得到三個(gè)結(jié)果。步驟3)對(duì)步驟2)產(chǎn)生的所述三個(gè)結(jié)果進(jìn)行投票法選擇,得到輸出結(jié)果。進(jìn)一步地,所述步驟3)具體為:將所述三個(gè)結(jié)果進(jìn)行兩兩比較,如果有二個(gè)或二個(gè)以上結(jié)果是一樣的即屬同一個(gè)分類,那么此分類作為最終結(jié)果;如果三個(gè)分類結(jié)果都不一樣,則隨機(jī)選擇一個(gè)作為最終分類結(jié)果。進(jìn)一步地,所述BP神經(jīng)網(wǎng)絡(luò)采用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),中間隱含層有20個(gè)神經(jīng)元,隱含層和輸出層均使用logistic激活函數(shù),訓(xùn)練時(shí)誤差值為0.01,學(xué)習(xí)率0.01,訓(xùn)練次數(shù)1000;RBF神經(jīng)網(wǎng)絡(luò)的均方根誤差設(shè)為0.01,擴(kuò)展速度spread設(shè)置為20;Elman網(wǎng)絡(luò)的隱含層和輸出層的激活函數(shù)為tansig,最大訓(xùn)練次數(shù)設(shè)置為2000,均方誤差為0.01。本發(fā)明提供的基于神經(jīng)網(wǎng)絡(luò)集成的股票趨勢(shì)預(yù)測(cè)方法,其趨勢(shì)分類效果要高于單一的神經(jīng)網(wǎng)絡(luò)和svm的分類效果,能夠很好地應(yīng)用于股票趨勢(shì)預(yù)測(cè),預(yù)測(cè)結(jié)果準(zhǔn)確,可以很好地滿足實(shí)際應(yīng)用的需要。附圖說(shuō)明圖1為本發(fā)明的流程圖。具體實(shí)施方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。本發(fā)明提供的基于神經(jīng)網(wǎng)絡(luò)集成的股票趨勢(shì)預(yù)測(cè)方法,采用由BP神經(jīng)網(wǎng)絡(luò)、Elman神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)組成的神經(jīng)網(wǎng)絡(luò)集成模型來(lái)預(yù)測(cè)股票趨勢(shì)。神經(jīng)網(wǎng)絡(luò)是一種大規(guī)模并行的復(fù)雜的非線性動(dòng)力系統(tǒng),它可表示極其復(fù)雜的非線性模型系統(tǒng)。神經(jīng)網(wǎng)絡(luò)有多種類型,而在股市應(yīng)用中比較常用的有BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)和Elman回歸神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)技術(shù)中應(yīng)用最為廣泛的一種,是基于BP算法的一種神經(jīng)網(wǎng)絡(luò)模型,其特點(diǎn)有:自適應(yīng)、自組織、自學(xué)習(xí)的能力,非局域性和非凸性等。BP神經(jīng)網(wǎng)絡(luò)是比較典型的前向神經(jīng)網(wǎng)絡(luò),經(jīng)典的三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、隱含層和輸出層。RBF神經(jīng)網(wǎng)絡(luò)即徑向基函數(shù)神經(jīng)網(wǎng)絡(luò),是一種高效前饋型式局部逼近式的網(wǎng)絡(luò)。相比BP神經(jīng)網(wǎng)絡(luò),RBF神經(jīng)網(wǎng)絡(luò)模型具有最佳逼近性能和全局最優(yōu)特性,結(jié)構(gòu)簡(jiǎn)單,訓(xùn)練速度快,在時(shí)間預(yù)測(cè)模式識(shí)別非線性函數(shù)逼近等領(lǐng)域具有廣泛的應(yīng)用。一般應(yīng)用時(shí)RBF神經(jīng)網(wǎng)絡(luò)其由n個(gè)輸入節(jié)點(diǎn)m個(gè)隱層節(jié)點(diǎn)和1個(gè)輸出節(jié)點(diǎn)組成,隱層節(jié)點(diǎn)是RBF函數(shù)。Elman神經(jīng)網(wǎng)絡(luò)是Elman于1990年首先針對(duì)語(yǔ)音處理問(wèn)題而提出來(lái)的,它是一種典型局部遞歸網(wǎng)絡(luò)。由于Elman神經(jīng)網(wǎng)絡(luò)在處理貫序數(shù)據(jù)輸入輸出具有優(yōu)越性,得到了廣泛的應(yīng)用?;镜腅lman網(wǎng)絡(luò)主要由輸入層、隱含層、輸出層、關(guān)聯(lián)層組成,是在BP網(wǎng)絡(luò)的基礎(chǔ)上增加了一個(gè)“反饋層”,其反饋連接由一組“連接”單元組成,用于記憶隱層過(guò)去的狀態(tài),并且在下一時(shí)刻連同網(wǎng)絡(luò)輸入一起作為隱層單元的輸入,相當(dāng)于狀態(tài)反饋。這一性質(zhì)使得部分遞歸網(wǎng)絡(luò)具有動(dòng)態(tài)記憶功能,從而適合用來(lái)建立時(shí)間序列的預(yù)測(cè)模型。神經(jīng)網(wǎng)絡(luò)集成是用有限個(gè)神經(jīng)網(wǎng)絡(luò)對(duì)同一個(gè)問(wèn)題進(jìn)行學(xué)習(xí),集成在某輸入示例下的輸出由構(gòu)成集成的各神經(jīng)網(wǎng)絡(luò)在該示例下的輸出共同決定。股票價(jià)格趨勢(shì)分析一般是根據(jù)歷史數(shù)據(jù)來(lái)進(jìn)行將來(lái)情況的分析,多數(shù)學(xué)者用的時(shí)間交易窗口是20日。本實(shí)施例也將以前20日的交易情況來(lái)作為分析第21日漲跌情況的分析時(shí)間窗口。神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)集按照以下模板進(jìn)行組織:表1神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)特征模板條目1W1W2W3W4…W20X1條目2W1W2W3W4…W20X2……………………條目nw1W2W3W4…W20Xn其中:W0到W20表示20天的的漲跌值,取值范圍在-0.1到0.1之間;Xi表示第21的漲跌趨勢(shì),可能取值1、2、3,分別表示上漲、橫盤、下降。類似的,為了用svm進(jìn)行數(shù)據(jù)處理,數(shù)據(jù)集組織模板如表2所示:表2Libsvm數(shù)據(jù)特征模板條目1X11W22W23W3…20W20條目2X21W22W23W3…20W20……………………………條目nXn1W22W23W3…20W20本實(shí)施例所用的數(shù)據(jù)是上證指數(shù)(000001)股票在2011年12月12日到2016年2月15日期間的收盤指數(shù),共959條有效數(shù)據(jù)。如圖1所示,基于神經(jīng)網(wǎng)絡(luò)集成的股票趨勢(shì)預(yù)測(cè)方法具體包括以下步驟:步驟1)組織好訓(xùn)練語(yǔ)料,然后分別訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)、Elman神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)三種神經(jīng)網(wǎng)絡(luò)模型,得到三個(gè)神經(jīng)網(wǎng)絡(luò)個(gè)體;步驟2)用所述三個(gè)神經(jīng)網(wǎng)絡(luò)個(gè)體分別去預(yù)測(cè)處理股票參數(shù)數(shù)據(jù),對(duì)于每條測(cè)試記錄,得到三個(gè)結(jié)果;步驟3)對(duì)步驟2)產(chǎn)生的所述三個(gè)結(jié)果進(jìn)行投票法選擇,得到輸出結(jié)果。所述BP神經(jīng)網(wǎng)絡(luò)采用三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),中間隱含層有20個(gè)神經(jīng)元,隱含層和輸出層均使用logistic激活函數(shù),訓(xùn)練時(shí)誤差值為0.01,學(xué)習(xí)率0.01,訓(xùn)練次數(shù)1000;RBF神經(jīng)網(wǎng)絡(luò)的均方根誤差設(shè)為0.01,擴(kuò)展速度spread設(shè)置為20;Elman網(wǎng)絡(luò)的隱含層和輸出層的激活函數(shù)為tansig,最大訓(xùn)練次數(shù)設(shè)置為2000,均方誤差為0.01。本實(shí)施例中步驟3)具體為:將所述三個(gè)結(jié)果進(jìn)行兩兩比較,如果有二個(gè)或二個(gè)以上結(jié)果是一樣的即屬同一個(gè)分類,那么此分類作為最終結(jié)果;如果三個(gè)分類結(jié)果都不一樣,則隨機(jī)選擇一個(gè)作為最終分類結(jié)果。本實(shí)施例將股票未來(lái)一天的趨勢(shì)分成3類,即將問(wèn)題轉(zhuǎn)變成了分類問(wèn)題。在分類問(wèn)題研究領(lǐng)域最常用的評(píng)介指標(biāo)就是正確率,正確率這一指標(biāo)直觀明了,易于接受。正確率的計(jì)算方法為:Precision=PridictRightr/TestSum(1)其中Precision表正確率,PridictRight為預(yù)測(cè)正確的天數(shù),TestSum為測(cè)試的總天數(shù)。為了對(duì)比本發(fā)明的神經(jīng)網(wǎng)絡(luò)集成方法的分類處理效果,還做了經(jīng)典的SVM分類實(shí)驗(yàn)。本實(shí)施例用的是臺(tái)灣大學(xué)林智仁(LinChih-Jen)教授等開(kāi)發(fā)設(shè)計(jì)的SVM模式識(shí)別與回歸軟件包libsvm。本實(shí)施例一共做了三組實(shí)驗(yàn),每次隨機(jī)從959條數(shù)據(jù)中取759條數(shù)據(jù)作訓(xùn)練集,其余的200條作測(cè)試集。實(shí)驗(yàn)結(jié)果如表3:表3三組實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)編號(hào)第一組第二組第三組基準(zhǔn)正確率33.3%33.3%33.3%SVM分類處理37%32%35.5%BP神經(jīng)網(wǎng)絡(luò)38%36%37%RBF神經(jīng)網(wǎng)絡(luò)36.5%39.5%35.5%Elman神經(jīng)網(wǎng)絡(luò)40.5%37%38.5%集成方法41.5%42.5%39.5%從實(shí)驗(yàn)中可以得到以下幾個(gè)結(jié)論:1)對(duì)比SVM的分類效果與基準(zhǔn)正確率。從表3中三組實(shí)驗(yàn)結(jié)果來(lái)看,SVM的分類效果相比基準(zhǔn)正確率并沒(méi)有高多少,第二組的正確率32%還低于基準(zhǔn)正確率33.3%。這點(diǎn)說(shuō)明,傳統(tǒng)的分類方法svm在處理復(fù)雜的股票趨勢(shì)上并沒(méi)有明顯的效果或優(yōu)勢(shì)。這也與股票趨勢(shì)特性有關(guān):影響股票價(jià)格的因素有很多,故股價(jià)具有很強(qiáng)的隨機(jī)性和突變性。2)三種神經(jīng)網(wǎng)絡(luò)的分類處理效果。一方面,從表中實(shí)驗(yàn)結(jié)果可以看出,神經(jīng)網(wǎng)絡(luò)處理的分類結(jié)果并不比svm分類結(jié)果的正確率高很多,甚至有部分實(shí)驗(yàn)結(jié)果還沒(méi)有svm效果好。比如第一組實(shí)驗(yàn)中RBF神經(jīng)網(wǎng)絡(luò)的處理正確率為36.5%,要低于svm的37%正確率;第三級(jí)實(shí)驗(yàn)中RBF神經(jīng)網(wǎng)絡(luò)的處理效果與svm效果正確率一樣高,都為35.5%。這也從另一個(gè)角度表明股份價(jià)格的復(fù)雜性,很難簡(jiǎn)單地用一學(xué)習(xí)模型來(lái)對(duì)其趨勢(shì)很好地分類。另一方面,三組實(shí)驗(yàn)中,每種神經(jīng)網(wǎng)絡(luò)的處理結(jié)果都要高于基準(zhǔn)正確率,在這點(diǎn)上是要強(qiáng)于svm的分類處理效果。3)基于結(jié)果式投票的神經(jīng)網(wǎng)絡(luò)集成方法。在表3中可以看出,基于結(jié)果式投票的神經(jīng)網(wǎng)絡(luò)集成方法的分類處理效果好于任意單一的神經(jīng)網(wǎng)絡(luò)處理結(jié)果。在很多情況下,本發(fā)明的神經(jīng)網(wǎng)絡(luò)集成方法能夠排除個(gè)體神經(jīng)網(wǎng)絡(luò)的計(jì)算缺陷或者加強(qiáng)正確的分類處理結(jié)果。從表中三組實(shí)驗(yàn)效果看,沒(méi)有一種神經(jīng)網(wǎng)絡(luò)的效果是全部好于其他二種。故處理一條數(shù)據(jù)時(shí),當(dāng)一種網(wǎng)絡(luò)分類錯(cuò)誤,那么參照另外二種網(wǎng)絡(luò)結(jié)果則可提高集成網(wǎng)絡(luò)模型分類的正確率。比如一測(cè)試條目:(-0.02920797,-0.0051749334,......,-0.06863735,-0.006891653,3)前20個(gè)為預(yù)測(cè)那天的前20天收盤價(jià)格漲跌情況,最后“3”表示是示當(dāng)天的實(shí)際漲跌情況是上漲。而三個(gè)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)處理的結(jié)果是:3,1,3。根據(jù)投票法的規(guī)則,那么神經(jīng)網(wǎng)絡(luò)集成方法的輸出結(jié)果為:3。像這樣的情況,則神經(jīng)網(wǎng)絡(luò)集成方法能夠糾正神經(jīng)網(wǎng)絡(luò)個(gè)體的錯(cuò)誤,進(jìn)而提交了分類的正確率。以上所述實(shí)施例僅表達(dá)了本發(fā)明的實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。當(dāng)前第1頁(yè)1 2 3