亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種股票日內(nèi)價(jià)格趨勢(shì)的量化及預(yù)測(cè)方法與流程

文檔序號(hào):12178269閱讀:2900來源:國知局

本發(fā)明涉及一種股票日內(nèi)價(jià)格趨勢(shì)的量化及預(yù)測(cè)方法,屬于量化投資領(lǐng)域。



背景技術(shù):

近些年,量化投資越來越多的出現(xiàn)在國內(nèi)股票、期貨市場(chǎng)。量化投資是指通過數(shù)量化和計(jì)算機(jī)程序化交易實(shí)現(xiàn)的投資方式。在量化投資中,統(tǒng)計(jì)套利是其中重要的投資方式。統(tǒng)計(jì)套利就是根據(jù)歷史交易數(shù)據(jù)建立預(yù)測(cè)模型,根據(jù)歷史交易信息所存在的規(guī)律進(jìn)行套利。統(tǒng)計(jì)套利的基礎(chǔ)是歷史交易數(shù)據(jù),最常見的統(tǒng)計(jì)套利是根據(jù)股票的收益率序列建立預(yù)測(cè)模型。這種直接使用時(shí)間序列建模的方式過于簡(jiǎn)單,其中包含信息有限,準(zhǔn)確性往往不太理想。因此,股市中一些常用的技術(shù)指標(biāo)、上市公司財(cái)報(bào)、經(jīng)濟(jì)指標(biāo),甚至社會(huì)輿論都可以作為特征數(shù)據(jù)用于股票的預(yù)測(cè)。

我們可以發(fā)現(xiàn)股票交易員在開盤期間無時(shí)無刻的不在關(guān)注股票的價(jià)格走勢(shì),通過對(duì)股票短期變化情況判斷股票未來變化方向。有經(jīng)驗(yàn)的交易員可以根據(jù)股票的短期走勢(shì)進(jìn)行買賣獲利。這說明股票短期走勢(shì)能透露出一些隱藏信息,其中往往存在很強(qiáng)的規(guī)律性,因此,使用股票短期走勢(shì)進(jìn)行統(tǒng)計(jì)套利具有可行性。借助計(jì)算機(jī)對(duì)于數(shù)據(jù)處理和數(shù)據(jù)挖掘的能力,可以更準(zhǔn)確得到股票短期走勢(shì)對(duì)股票未來價(jià)格影響的模式。目前存在的問題是,怎樣將股票價(jià)格短期走勢(shì)量化為能被計(jì)算機(jī)處理的數(shù)據(jù)形式。

本發(fā)明提供了一種股票日內(nèi)價(jià)格趨勢(shì)的量化及預(yù)測(cè)方法,將股票日內(nèi)價(jià)格變化情況量化為股票日內(nèi)趨勢(shì)特征,根據(jù)股票日內(nèi)趨勢(shì)特征建立預(yù)測(cè)模型,對(duì)股票未來趨勢(shì)進(jìn)行預(yù)測(cè)。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的在于提供一種股票日內(nèi)價(jià)格趨勢(shì)量化及預(yù)測(cè)的方法用于提高股票趨勢(shì)預(yù)測(cè)的準(zhǔn)確性。

本發(fā)明構(gòu)建了一種股票日內(nèi)價(jià)格趨勢(shì)的量化及預(yù)測(cè)方法。該方法將股票日內(nèi)趨勢(shì)進(jìn)行量化,得到股票日內(nèi)趨勢(shì)特征量;然后,使用日內(nèi)趨勢(shì)特征量預(yù)測(cè)下一交易日股票趨勢(shì)。

具體內(nèi)容包括以下幾個(gè)步驟:

步驟1:獲取股票歷史日內(nèi)分筆交易數(shù)據(jù);對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)格式轉(zhuǎn)換、數(shù)據(jù)噪聲消除、補(bǔ)全省缺項(xiàng);使用股票日內(nèi)分筆數(shù)據(jù)量化股票日內(nèi)價(jià)格趨勢(shì),量化后的股票日內(nèi)價(jià)格趨勢(shì)包含以下特征量:日內(nèi)波動(dòng)、日內(nèi)極差、開盤走勢(shì)、高低走勢(shì)、收盤走勢(shì)。

步驟2:采用支持向量機(jī)預(yù)測(cè)模型預(yù)測(cè)未來股票價(jià)格趨勢(shì);將第t-1天日內(nèi)交易趨勢(shì)特征作為預(yù)測(cè)模型輸入,第t天股票價(jià)格相較第t-1天股票價(jià)格的漲跌作為預(yù)測(cè)模型輸出;使用1000天日內(nèi)交易趨勢(shì)特征建立樣本集,將樣本對(duì)應(yīng)股票的下一日漲跌作為樣本標(biāo)簽,即下一日上漲,樣本標(biāo)記為1;下一日下跌,樣本標(biāo)記為-1。

步驟3:將建立好的樣本集劃分為訓(xùn)練集、交叉驗(yàn)證集、測(cè)試集;訓(xùn)練集占樣本集的70%,交叉驗(yàn)證集占樣本集的15%,測(cè)試集占樣本集的15%。使用訓(xùn)練集、交叉驗(yàn)證集訓(xùn)練預(yù)測(cè)模型并確定模型參數(shù);將訓(xùn)練過的模型用于測(cè)試集,檢驗(yàn)預(yù)測(cè)模型的有效性。

步驟4:將驗(yàn)證有效的預(yù)測(cè)模型用于股票價(jià)格趨勢(shì)預(yù)測(cè)。

步驟1中股票歷史日內(nèi)分筆數(shù)據(jù)可以由各種專業(yè)金融數(shù)據(jù)庫獲得。對(duì)獲取的數(shù)據(jù)進(jìn)行預(yù)處理,通常包括格式轉(zhuǎn)換、噪聲消除、補(bǔ)全缺省幾個(gè)方面。在本發(fā)明中股票日內(nèi)分筆數(shù)據(jù)按時(shí)間先后順序倒序排列,例如,某一日內(nèi)有2000筆分筆數(shù)據(jù),序號(hào)第2000的分筆數(shù)據(jù)對(duì)應(yīng)當(dāng)天第一筆交易數(shù)據(jù),序號(hào)第1的分筆數(shù)據(jù)對(duì)應(yīng)當(dāng)天最后一筆交易數(shù)據(jù)。

使用股票日內(nèi)分筆數(shù)據(jù)將股票日內(nèi)價(jià)格趨勢(shì)進(jìn)行量化,具體方法為:構(gòu)造股票日內(nèi)價(jià)格趨勢(shì)特征量,包括日內(nèi)波動(dòng)、日內(nèi)極差、開盤走勢(shì)、高低走勢(shì)、收盤走勢(shì)。

日內(nèi)波動(dòng)表示為

其中,為第i筆交易數(shù)據(jù)中股票價(jià)格, i表示第i筆交易,N表示日內(nèi)共N筆交易數(shù)據(jù),為日內(nèi)分筆數(shù)據(jù)價(jià)格均值, ;

日內(nèi)極差表示為

其中,分別表示當(dāng)日最高價(jià)和當(dāng)日最低價(jià);

開盤走勢(shì)量化為一位二進(jìn)制數(shù),‘1’表示今日開盤價(jià)大于等于昨日收盤價(jià), ‘0’表示今日開盤價(jià)小于昨日收盤價(jià);

收盤走勢(shì)同樣量化為一位二進(jìn)制數(shù),‘1’表示今日收盤價(jià)大于等于今日開盤價(jià),‘0’表示今日收盤價(jià)小于今日開盤價(jià);

高低走勢(shì)用最高價(jià)和最低價(jià)出現(xiàn)的時(shí)刻特征表示,在本發(fā)明中,開盤時(shí)刻表示為‘0’,收盤時(shí)刻表示為‘1’,即日內(nèi)交易時(shí)刻線性映射到區(qū)間[0,1];最高價(jià)出現(xiàn)的時(shí)刻表示為,最低價(jià)出現(xiàn)的時(shí)刻表示為。

由于本發(fā)明中股票日內(nèi)分筆數(shù)據(jù)按時(shí)間先后順序倒序排列,,計(jì)算方法如下:

這樣最高價(jià),最低價(jià)在日內(nèi)何時(shí)出現(xiàn)等信息都可以通過,表示,根據(jù),,,,,可以簡(jiǎn)單描繪出日內(nèi)股票價(jià)格走勢(shì)。

對(duì)于股票價(jià)格趨勢(shì)預(yù)測(cè)實(shí)質(zhì)為分類預(yù)測(cè),即股票價(jià)格漲跌預(yù)測(cè)。步驟2 中使用支持向量機(jī)(SVM)作為預(yù)測(cè)模型,SVM是基于統(tǒng)計(jì)理論發(fā)展而成的一種機(jī)器學(xué)習(xí)算法,對(duì)于分類問題有著很強(qiáng)的處理能力。SVM用于分類問題,一般考慮訓(xùn)練集為,其中為第i個(gè)輸入,為第i個(gè)輸入的對(duì)應(yīng)輸出。SVM進(jìn)行二分類時(shí),尋找分類超平面

(1)

其中,,一般為非線性映射,將輸入從低維空間(n維)映射到高維特征空間(m維)。正負(fù)類樣本分別位于超平面兩側(cè)從而實(shí)現(xiàn)了二分類。不過,直接通過分類超平面分隔兩類樣本并不是很好的分類方式,因?yàn)檫@樣不僅難于優(yōu)化還會(huì)因?yàn)闃颖緮?shù)據(jù)噪聲導(dǎo)致分類效果不佳。因此我們希望正負(fù)樣本點(diǎn)盡可能遠(yuǎn)離分類超平面。根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論,原始分類問題可以被表述為

(2)

其中,,為松弛變量。這樣原始問題被描述成為了凸優(yōu)化問題,最小化,相當(dāng)于最大化正負(fù)兩類超平面間隔。滿足條件的樣本點(diǎn)到分類超平面的垂直向量為支持向量,和為支持向量超平面,正類樣本在且遠(yuǎn)離分類超平面一側(cè),負(fù)類樣本在且遠(yuǎn)離分類超平面一側(cè)。

在本發(fā)明中,將股票日內(nèi)趨勢(shì)特征量作為預(yù)測(cè)模型輸入,下一日股票漲跌作為模型輸出(漲表示為‘1’,跌為表示‘-1’),使用歷史數(shù)據(jù)構(gòu)造用樣本集。

步驟3中將建立好的樣本集劃分為訓(xùn)練集、交叉驗(yàn)證集、測(cè)試集;本發(fā)明中訓(xùn)練集占樣本集的70%,交叉驗(yàn)證集占樣本15%,測(cè)試集占樣本15%。訓(xùn)練集的作用是訓(xùn)練SVM預(yù)測(cè)模型;交叉驗(yàn)證集的作用是確定SVM預(yù)測(cè)模型最優(yōu)參數(shù),包括懲罰系數(shù)和非線性映射中的參數(shù);測(cè)試集檢驗(yàn)預(yù)測(cè)模型的有效性。

附圖說明

圖1為本發(fā)明中股票日內(nèi)價(jià)格趨勢(shì)的量化及預(yù)測(cè)方法流程圖。

具體實(shí)施方式

以下結(jié)合附圖和發(fā)明內(nèi)容說明本發(fā)明的實(shí)施方式,所舉實(shí)例用于解釋說明,并非限定本發(fā)明的實(shí)施方式,本發(fā)明也可以通過其它不同的具體實(shí)施方式實(shí)施。

本實(shí)施例中數(shù)據(jù)預(yù)處理、股票日內(nèi)趨勢(shì)量化過程通過python編程完成;建模預(yù)測(cè)過程通過Matlab編程完成。

如圖1所示,股票日內(nèi)價(jià)格趨勢(shì)的量化及預(yù)測(cè)過程為步驟S1-S4。

步驟S1,股票歷史日內(nèi)分筆交易數(shù)據(jù)在本實(shí)施例中由Tushare(一個(gè)免費(fèi)、開源的python財(cái)經(jīng)數(shù)據(jù)接口包)獲取,也可使用其它的金融數(shù)據(jù)采集工具或從相關(guān)數(shù)據(jù)庫獲取。對(duì)得到的數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)格式轉(zhuǎn)換、數(shù)據(jù)噪聲消除、補(bǔ)全省缺項(xiàng)。使用股票日內(nèi)分筆數(shù)據(jù)量化股票日內(nèi)價(jià)格趨勢(shì),量化后的股票日內(nèi)價(jià)格趨勢(shì)包含以下特征量:日內(nèi)波動(dòng)、日內(nèi)極差、開盤走勢(shì)、高低走勢(shì)、收盤走勢(shì),通過python編寫相應(yīng)的特征構(gòu)造函數(shù)得到。

日內(nèi)波動(dòng)表示為

其中,為第i筆交易數(shù)據(jù)中股票價(jià)格, i表示第i筆交易,N表示日內(nèi)共N筆交易數(shù)據(jù),為日內(nèi)分筆數(shù)據(jù)價(jià)格均值,;

日內(nèi)極差表示為

其中,分別表示當(dāng)日最高價(jià)和當(dāng)日最低價(jià);

開盤走勢(shì)量化為一位二進(jìn)制數(shù),‘1’表示今日開盤價(jià)大于等于昨日收盤價(jià), ‘0’表示今日開盤價(jià)小于昨日收盤價(jià);

收盤走勢(shì)同樣量化為一位二進(jìn)制數(shù),‘1’表示今日收盤價(jià)大于等于今日開盤價(jià),‘0’表示今日收盤價(jià)小于今日開盤價(jià);

高低走勢(shì)用最高價(jià)和最低價(jià)出現(xiàn)的時(shí)刻特征表示,在本發(fā)明中,開盤時(shí)刻表示為‘0’,收盤時(shí)刻表示為‘1’,即日內(nèi)交易時(shí)刻線性映射到區(qū)間[0,1];最高價(jià)出現(xiàn)的時(shí)刻表示為,最低價(jià)出現(xiàn)的時(shí)刻表示為。

由于本實(shí)施例中股票日內(nèi)分筆數(shù)據(jù)按時(shí)間先后順序倒序排列,例如,某一交易日分筆數(shù)據(jù)為2000筆,開盤后第1筆交易數(shù)據(jù)的序號(hào)為2000,第2筆交易數(shù)據(jù)序號(hào)為1999,依次類推,第2000筆交易數(shù)據(jù)序號(hào)為1。,計(jì)算方法如下:

通過找到最高價(jià)、最低價(jià)對(duì)應(yīng)的序號(hào)就可以計(jì)算得出,。根據(jù),,,,,可以簡(jiǎn)單描繪出日內(nèi)股票價(jià)格走勢(shì)。

步驟S2:采用支持向量機(jī)(SVM)預(yù)測(cè)模型預(yù)測(cè)未來股票價(jià)格趨勢(shì);將第t-1天日內(nèi)交易趨勢(shì)特征作為預(yù)測(cè)模型輸入,第t天股票價(jià)格相較第t-1天股票價(jià)格的漲跌作為預(yù)測(cè)模型輸出;使用1000天日內(nèi)交易趨勢(shì)特征建立樣本集,將樣本對(duì)應(yīng)股票的下一日漲跌作為樣本標(biāo)簽,即下一日上漲,樣本標(biāo)記為1;下一日下跌,樣本標(biāo)記為-1。

步驟S3,將建立好的樣本集劃分為訓(xùn)練集、交叉驗(yàn)證集、測(cè)試集;本實(shí)施例中訓(xùn)練集占樣本集的70%,交叉驗(yàn)證集占樣本集的15%,測(cè)試集占樣本集的15%。訓(xùn)練集的作用是訓(xùn)練SVM預(yù)測(cè)模型;交叉驗(yàn)證集的作用是確定SVM預(yù)測(cè)模型最優(yōu)參數(shù),包括懲罰系數(shù)和非線性映射中的參數(shù);測(cè)試集檢驗(yàn)預(yù)測(cè)模型的有效性。

在本實(shí)施例中,經(jīng)過訓(xùn)練后的支持向量機(jī)預(yù)測(cè)模型對(duì)測(cè)試集預(yù)測(cè)的精確度和準(zhǔn)確度分別達(dá)到了79.68和75.32%,此結(jié)果說明了該預(yù)測(cè)模型在短期趨勢(shì)預(yù)測(cè)中的置信水平。投資者根據(jù)自身風(fēng)險(xiǎn)偏好和投資需求選擇適當(dāng)置信水平下的預(yù)測(cè)模型。

步驟S4,將驗(yàn)證有效的預(yù)測(cè)模型用于股票趨勢(shì)預(yù)測(cè),即使用第t天股票日內(nèi)趨勢(shì)特征,預(yù)測(cè)第t+1天股票價(jià)格趨勢(shì)。

步驟S2、S3、S4均通過編寫Matlab程序完成,其中支持向量機(jī)模型使用的是Matlab版本下LIBSVM。

上述實(shí)施例僅例示性說明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。任何熟悉此技術(shù)的人士皆可在不違背本發(fā)明的精神及范疇下,對(duì)上述實(shí)施例進(jìn)行修飾或改變。因此,舉凡所屬技術(shù)領(lǐng)域中具有通常知識(shí)者在未脫離本發(fā)明所揭示的精神與技術(shù)思想下所完成的一切等效修飾或改變,仍應(yīng)由本發(fā)明的權(quán)利要求所涵蓋。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1