亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于時態(tài)聯(lián)動挖掘的股票預測方法與流程

文檔序號:12126548閱讀:460來源:國知局
一種基于時態(tài)聯(lián)動挖掘的股票預測方法與流程

本發(fā)明涉及股票數(shù)據(jù)挖掘技術(shù)領(lǐng)域,尤其是涉及一種基于時態(tài)聯(lián)動挖掘的股票預測方法。



背景技術(shù):

股票作為金融市場最主要的金融工具之一,其價格波動能否預測、以及用何種方法進行預測,一直以來都是金融領(lǐng)域研究的焦點問題之一。

股票價格預測是指根據(jù)調(diào)查統(tǒng)計收集的股票價格數(shù)據(jù),從股票市場的歷史、現(xiàn)狀和規(guī)律性出發(fā),采用科學預測方法對股票價格未來變化趨勢做出準確預測。

在當前的股票分析中,普遍采用的方法有兩種:基本分析法和技術(shù)分析法。基本分析法通過對影響股市的供求關(guān)系的基本因素進行分析,確定股票的真正價值,判斷股市走勢,提供投資者選擇股票的依據(jù)。而技術(shù)分析關(guān)心證券市場本身的變化,通過對股價、成交量以及漲跌指數(shù)等技術(shù)指標的分析,研究市場過去及現(xiàn)在的行為反應,以推測未來價格的變動趨勢。本發(fā)明方法屬于技術(shù)分析的方法。

國內(nèi)外對股票價格進行預測的模型種類很多。但依據(jù)其建模理論不同,可將這些預測模型劃分為兩個大類:一類是以統(tǒng)計原理為基礎(chǔ)的傳統(tǒng)型波動率預測模型,目前較為流行且具有代表性的模型包括ARCH模型和SV模型;另一類是以神經(jīng)網(wǎng)絡、灰色理論、支持向量機等為基礎(chǔ)的創(chuàng)新型預測模型。這兩類模型在對股票價格進行預測時各有特點,但其預測的準確度仍有待提高。

本發(fā)明提出的基于時態(tài)聯(lián)動挖掘的股票預測方法可對股票近期幾天是否大漲或大跌的情況進行預測,從而為股民決策提供較大的指導價值。



技術(shù)實現(xiàn)要素:

本發(fā)明公開了一種基于時態(tài)聯(lián)動挖掘的股票預測方法。方法用于挖掘類似的規(guī)則:如果A股票大漲(或大跌),那么k日后B股票大漲(或大跌)的概率為x%。方法分為兩個階段:規(guī)則挖掘階段和規(guī)則應用階段。在規(guī)則挖掘階段,針對所有股票的每日漲跌幅數(shù)據(jù),經(jīng)過簡單量化后,統(tǒng)計不同股票之間在間隔的一小段時間內(nèi)聯(lián)動大漲或大跌的次數(shù),同時計算出現(xiàn)該聯(lián)動的支持度和置信度,最后生成聯(lián)動規(guī)則。在規(guī)則應用階段,每日根據(jù)每只股票的漲跌情況進行觸發(fā)生成,生成的規(guī)則分為大漲正面、大漲反面、大跌正面、大跌反面四種類型。方法可為股票短線操作提供決策支持。

本發(fā)明方法是一種近期預測的方法,即如1日預測,2日預測,3日預測等;預測結(jié)果簡化地分為4類:大漲(>=2%)、不會大漲(<2%)、大跌(<=-2%)、不會大跌(>-2%),括號內(nèi)的值為類別對應的漲跌幅定義。

本發(fā)明方法將首先挖掘如下這樣類似的規(guī)則,“如果A股票大漲(或大跌),那么k日后B股票大漲(或大跌)的概率為x%”,在得到規(guī)則后,根據(jù)每日股票的具體漲跌幅情況,對聯(lián)動股票在近期幾天的大漲或大跌,以及相應的概率做出預測。

假設(shè)股票列表為S,S=[S1, S2,…,Si,…,Sn],n為股票池中股票的數(shù)量,如中國上市股票的數(shù)量或美國上市股票的數(shù)量。本發(fā)明方法分為兩個階段,規(guī)則挖掘階段和規(guī)則應用階段。具體步驟如下:

一、規(guī)則挖掘階段

(1)對基礎(chǔ)統(tǒng)計數(shù)據(jù)及映射數(shù)據(jù)進行準備;

(2)加載大漲和大跌的股票數(shù)據(jù),并各自填充到二維統(tǒng)計數(shù)組里面;

(3)基于統(tǒng)計數(shù)組進行時態(tài)間隔時間為1天、2天和3天的聯(lián)動統(tǒng)計,包括大漲聯(lián)動統(tǒng)計和大跌聯(lián)動統(tǒng)計;

(4)基于聯(lián)動統(tǒng)計結(jié)果,挖掘生成大漲的正反面規(guī)則和大跌的正反面規(guī)則;

二、規(guī)則應用階段

(5)加載每日大漲股票的漲幅,搜索應用大漲的正反面規(guī)則,生成聯(lián)動規(guī)則結(jié)果;

(6)加載每日大跌股票的跌幅,搜索應用大跌的正反面規(guī)則,生成聯(lián)動規(guī)則結(jié)果。

其中,步驟(1)的基礎(chǔ)統(tǒng)計數(shù)據(jù)是指每只股票的大漲次數(shù)、大跌次數(shù)和歷史交易的總次數(shù);映射數(shù)據(jù)是指股票與編號的雙向哈希映射表:Hash(Stock:ID) 和Hash(ID:Stock);交易日期與編號的雙向哈希映射表:Hash(Date:ID)和Hash(ID:Date)。

其中,步驟(2)的對二維統(tǒng)計數(shù)組的填充,是指以所有股票的數(shù)量和所有交易日期的數(shù)量交叉形成兩個二維數(shù)組StatUp和StatDown,而后根據(jù)每只股票大漲的交易日期在StatUp數(shù)組的相應位置填1,根據(jù)每只股票大跌的交易日期在StatDown數(shù)組的相應位置填1,其余位置填0。

其中,步驟(3)的聯(lián)動統(tǒng)計分為大漲聯(lián)動統(tǒng)計和大跌聯(lián)動統(tǒng)計?;赟tatUp數(shù)組,進行時態(tài)間隔時間為1天、2天和3天的大漲聯(lián)動統(tǒng)計,基本過程是對于每一行,即每只股票,逐位掃描StatUp數(shù)組,在碰到1的時候,對該列位置的前1、2、3列分別進行豎方向的掃描,并分別對1出現(xiàn)的個數(shù)進行統(tǒng)計累加,最后計算該股票與其他各股票大漲聯(lián)動統(tǒng)計的支持度和置信度;大跌聯(lián)動統(tǒng)計基于StatDown數(shù)組,其計算過程類似大漲聯(lián)動統(tǒng)計。

其中,步驟(4) 的規(guī)則生成,在設(shè)定參數(shù)最小支持度minSupport、最小置信度minConfidence和最少交易次數(shù)minTradeCount參數(shù)、最大置信度maxConfidence后,大漲正面規(guī)則是指對于每只股票獲取支持度大于minSupport,置信度大于minConfidence,交易次數(shù)大于minTradeCount的元組;大漲反面規(guī)則是指支持度大于minSupport,置信度小于maxConfidence,交易次數(shù)大于minTradeCount的元組;大跌正面規(guī)則是指支持度大于minSupport,置信度大于minConfidence,交易次數(shù)大于minTradeCount的元組;大跌反面規(guī)則是指支持度大于minSupport,置信度小于maxConfidence,交易次數(shù)大于minTradeCount的元組。

其中,步驟(5)在應用大漲的正反面規(guī)則,進行聯(lián)動結(jié)果的生成過程中,由于是要生成規(guī)則右邊涉及股票的挖掘結(jié)果,因此對于每只股票的代碼,是通過匹配規(guī)則右邊的股票來獲取規(guī)則左邊所有相關(guān)的股票代碼,然后判斷這些相關(guān)股票代碼是否在當日大漲了,以此來確定規(guī)則是否適用。如果適用成功,則輸出相應聯(lián)動規(guī)則。

其中,步驟(6)在應用大跌的正反面規(guī)則,進行聯(lián)動結(jié)果的生成過程中,由于是要生成規(guī)則右邊涉及股票的挖掘結(jié)果,因此對于每只股票的代碼,是通過匹配規(guī)則右邊的股票來獲取規(guī)則左邊所有相關(guān)的股票代碼,然后判斷這些相關(guān)股票代碼是否在當日大跌了,以此來確定規(guī)則是否適用。如果適用成功,則輸出相應聯(lián)動規(guī)則。

附圖說明

圖1 是本發(fā)明基于時態(tài)聯(lián)動挖掘的股票預測方法的流程圖。上半部分為規(guī)則的挖掘過程,下半部分為規(guī)則的應用過程。

圖2 是基于本發(fā)明方法輸出的某一股票近期的大漲正面規(guī)則。

圖3 是基于本發(fā)明方法輸出的某一股票近期的大漲反面規(guī)則。

圖4 是基于本發(fā)明方法輸出的某一股票近期的大跌正面規(guī)則。

圖5 是基于本發(fā)明方法輸出的某一股票近期的大跌反面規(guī)則。

圖2~圖5的結(jié)果是在設(shè)定最小支持度minSupport=20%、最少交易次數(shù)minTradeCount=500,正面規(guī)則的最小置信度minConfidence=25%,反面規(guī)則的maxConfidence=5%后,以某一交易日如2016/09/29的收盤數(shù)據(jù)進行時態(tài)聯(lián)動挖掘后得到的。

具體實施方式

下面結(jié)合附圖和實例,對本發(fā)明進行詳細的描述。

本發(fā)明方法首先挖掘如下這樣類似的規(guī)則,“如果A股票大漲(或大跌),那么k日后B股票大漲(或大跌)的概率為x%”在得到規(guī)則后,根據(jù)每日股票的具體漲跌幅情況,對聯(lián)動股票在近期幾天的大漲或大跌,以及相應概率做出預測。

假設(shè)股票列表為S,S=[S1, S2,…,Si,…,Sn],n為股票池中股票的數(shù)量,如中國上市股票的數(shù)量或美國上市股票的數(shù)量。本發(fā)明方法分為兩個階段:規(guī)則挖掘階段和規(guī)則應用階段。

一、規(guī)則挖掘階段。

本發(fā)明方法針對所有股票的日線數(shù)據(jù)進行時態(tài)聯(lián)動規(guī)則的挖掘。先對預測結(jié)果4個分類的對應漲跌幅作定義: 大漲(>=2%)、不會大漲(<2%)、大跌(<=-2%)、不會大跌(>-2%)。具體定義數(shù)值作為參數(shù)可調(diào)。本發(fā)明中提到的“大漲”或“大跌”皆表示了其對應的漲跌幅。

(1)基礎(chǔ)統(tǒng)計數(shù)據(jù)及映射數(shù)據(jù)準備。

1.1 獲取所有股票的列表,并為每只股票從0開始進行順序編號,形成股票與編號的哈希映射表Hash(Stock:ID),和編號與股票的哈希映射表Hash(ID:Stock)。

1.2 通過上證指數(shù),獲取某個時間以來(如2005年1月1日)所有交易日期,并對日期從小到大排序后,從0開始順序編號,形成交易日期與編號的哈希映射表Hash(Date:ID),和編號與交易日期的哈希映射表Hash(ID:Date)。

1.3 獲取每只股票在歷史交易中的大漲次數(shù)和大跌次數(shù),形成股票與大漲次數(shù)的哈希映射表Hash(Stock:UpCount),和股票與大跌次數(shù)的哈希映射表Hash(Stock:DownCount)。

1.4獲取每只股票的歷史交易的次數(shù),形成股票與交易次數(shù)的哈希映射表Hash(Stock:Count)。

(2)大漲和大跌股票數(shù)據(jù)的加載。

2.1 定義兩個二維統(tǒng)計數(shù)組: StatUp[n,m] 和 StatDown[n,m],其中n代表所有股票的數(shù)量,m代表上證指數(shù)某段時間以來交易日期的數(shù)量,即所有交易日期的數(shù)量。

2.2 獲取每只股票大漲的交易日期,以1填充StatUp[n,m]的相應位置。具體為:對于每只股票,在得到其股票代碼及大漲的交易日期后,通過Hash(Stock:ID)獲取行編號,通過Hash(Date:ID)獲取列編號,最后設(shè)置StatUp數(shù)組的行列編號對應位置為1。其余位值設(shè)置為0。

2.3 獲取每只股票大跌的交易日期,以1填充StatDown[n,m]的相應位置。具體為:對于每只股票,在得到其股票代碼及大跌的交易日期后,通過Hash(Stock:ID)獲取行編號,通過Hash(Date:ID)獲取列編號,最后設(shè)置StatDown數(shù)組的行列編號對應位置為1。其余位值設(shè)置為0。

(3)時態(tài)聯(lián)動統(tǒng)計。

通過以上步驟,所有待統(tǒng)計數(shù)據(jù)已經(jīng)準備好了。接下來對StatUp和StatDown兩個數(shù)組分別進行時態(tài)聯(lián)動統(tǒng)計。時態(tài)是指不同股票間隔一小段時間的狀態(tài),而時態(tài)聯(lián)動是指對間隔小段時間的不同股票的狀態(tài)進行統(tǒng)計,以挖掘這些狀態(tài)間是否有聯(lián)動的現(xiàn)象。為避免數(shù)據(jù)量過于龐大,時態(tài)間隔時間僅取3種情況:間隔1天,間隔2天,間隔3天。

3.1 大漲聯(lián)動統(tǒng)計。分別對時態(tài)間隔時間的3種情況進行大漲的聯(lián)動統(tǒng)計。具體為:

a. 設(shè)置3個一維跟蹤數(shù)組Stat1[n]、Stat2[n]、Stat3[n],n為所有股票的數(shù)量;

b. 對于StatUp中的每一行,逐位進行掃描,如果位值為1,則進入下一步,否則跳過;

c. 獲取該1位置所對應的列編號,對該列位置減1,減2和減3的三列進行豎的掃描,如果位值為1,則將該值累加統(tǒng)計到跟蹤數(shù)組中。列位置減1,減2和減3的三列的掃描統(tǒng)計數(shù)據(jù)分別記錄到Stat1[n]、Stat2[n]、Stat3[n]。跟蹤數(shù)組的每行實際上是與每只股票一一對應的;

d.計算支持度和置信度。對于3個跟蹤數(shù)組的每一行,通過Hash(ID:Stock)獲取股票代碼,通過Hash(Stock:UpCount)獲取大漲次數(shù),通過Hash(Stock:Count)獲取交易次數(shù)。最后大漲聯(lián)動統(tǒng)計的支持度和置信度定義為:

支持度up = 100*大漲次數(shù)/交易次數(shù);

置信度up=100*跟蹤數(shù)組的統(tǒng)計次數(shù)/大漲次數(shù)。

3.2 大跌聯(lián)動統(tǒng)計。分別對時態(tài)間隔時間的3種情況進行大跌的聯(lián)動統(tǒng)計。具體過程與大漲聯(lián)動統(tǒng)計過程類似。統(tǒng)計對象為StatDown二維數(shù)組,大跌次數(shù)通過Hash(Stock:DownCount)獲得。最后大跌聯(lián)動統(tǒng)計的支持度和置信度定義為:

支持度down=100*大跌次數(shù)/交易次數(shù);

置信度down=100*跟蹤數(shù)組的統(tǒng)計次數(shù)/大跌次數(shù)。

(4)規(guī)則挖掘生成與挑選。規(guī)則的挖掘生成過程分為兩種:正面規(guī)則和反面規(guī)則。

4.1 大漲聯(lián)動規(guī)則生成。

大漲正面規(guī)則生成:設(shè)定最小支持度minSupport、最小置信度minConfidence和最少交易次數(shù)minTradeCount參數(shù),基于大漲聯(lián)動統(tǒng)計和計算的結(jié)果,獲取支持度大于minSupport,置信度大于minConfidence,交易次數(shù)大于minTradeCount的元組,這些元組構(gòu)成大漲正面規(guī)則的元組組合:

UpRule+ = {StockA,StockB,Interval,Support,Confidence}

其中,每條元組代表股票StockA大漲,在間隔時間Interval后,在支持度Support下,股票StockB大漲的置信度(或概率)為Confidence。

大漲反面規(guī)則生成:設(shè)定最小支持度minSupport、最大置信度maxConfidence和最少交易次數(shù)minTradeCount參數(shù),基于大漲聯(lián)動統(tǒng)計和計算的結(jié)果,獲取支持度大于minSupport,置信度小于maxConfidence,交易次數(shù)大于minTradeCount的元組,這些元組構(gòu)成大漲反面規(guī)則的元組組合:

UpRule- = {StockA,StockB,Interval,Support,Confidence}

其中,每條元組代表股票StockA大漲,在間隔時間Interval后,在支持度Support下,股票StockB不會大漲的置信度(或概率)為Confidence。

4.2 大跌聯(lián)動規(guī)則生成。

大跌正面規(guī)則生成:設(shè)定最小支持度minSupport、最小置信度minConfidence和最少交易次數(shù)minTradeCount參數(shù),基于大跌聯(lián)動統(tǒng)計和計算的結(jié)果,獲取支持度大于minSupport,置信度大于minConfidence,交易次數(shù)大于minTradeCount的元組,這些元組構(gòu)成大跌正面規(guī)則的元組組合:

DownRule+ = {StockA,StockB,Interval,Support,Confidence}

其中,每條元組代表股票StockA大跌,在間隔時間Interval后,在支持度Support下,股票StockB大跌的置信度(或概率)為Confidence。

大跌反面規(guī)則生成:設(shè)定最小支持度minSupport、最大置信度maxConfidence和最少交易次數(shù)minTradeCount參數(shù),基于大跌聯(lián)動統(tǒng)計和計算的結(jié)果,獲取支持度大于minSupport,置信度小于maxConfidence,交易次數(shù)大于minTradeCount的元組,這些元組構(gòu)成大跌反面規(guī)則的元組組合:

DownRule- = {StockA,StockB,Interval,Support,Confidence}

其中,每條元組代表股票StockA大跌,在間隔時間Interval后,在支持度Support下,股票StockB不會大跌的置信度(或概率)為Confidence。

二、規(guī)則應用階段。

規(guī)則的應用頻率是每天一次。規(guī)則的應用對象是每只股票。在每個交易日交易結(jié)束后即可應用規(guī)則對每只股票進行預測。具體過程如下。

(1)當日大漲和大跌股票數(shù)據(jù)的加載。

每個交易日交易結(jié)束后,獲取每天大漲股票的當日漲幅,形成股票與漲幅的哈希映射表Hash(Stock:ChangeUp);獲取每天大跌股票的當日跌幅,形成股票與跌幅的哈希映射表Hash(Stock:ChangeDown)。

(2)大漲時態(tài)聯(lián)動規(guī)則應用。

2.1 大漲正面規(guī)則應用:

基于UpRule+ = {StockA,StockB,Interval,Support,Confidence},對于每只股票的代碼,通過匹配StockB列,獲取StockA列所有相關(guān)的股票代碼,如果元組StockA列的股票代碼存在于Hash(Stock:ChangeUp),則說明規(guī)則條件成立,獲取StockA的具體漲幅X%,生成聯(lián)動規(guī)則: StockA大漲X%,StockB在Interval天后大漲的概率為Confidence%。

2.2 大漲反面規(guī)則應用:

基于UpRule- = {StockA,StockB,Interval,Support,Confidence},對于每只股票的代碼,通過匹配StockB列,獲取StockA列所有相關(guān)的股票代碼,如果元組StockA列的股票代碼存在于Hash(Stock:ChangeUp),則說明規(guī)則條件成立,獲取StockA的具體漲幅X%,生成聯(lián)動規(guī)則: StockA大漲X%,StockB在Interval天后不會大漲的概率為Confidence%。

(3)大跌時態(tài)聯(lián)動規(guī)則應用。

3.1大跌正面規(guī)則應用:

基于DownRule+ = {StockA,StockB,Interval,Support,Confidence},對于每只股票的代碼,通過匹配StockB列,獲取StockA列所有相關(guān)的股票代碼,如果元組StockA列的股票代碼存在于Hash(Stock:ChangeDown),則說明規(guī)則條件成立,獲取StockA的具體跌幅X%,生成聯(lián)動規(guī)則:StockA大跌X%,StockB在Interval天后大跌的概率為Confidence%。

3.2 大跌反面規(guī)則應用:

基于DownRule- = {StockA,StockB,Interval,Support,Confidence},對于每只股票的代碼,通過匹配StockB列,獲取StockA列所有相關(guān)的股票代碼,如果元組StockA列的股票代碼存在于Hash(Stock:ChangeDown),則說明規(guī)則條件成立,獲取StockA的具體跌幅X%,生成聯(lián)動規(guī)則:StockA大跌X%,StockB在Interval天后不會大跌的概率為Confidence%。

綜上所述,本發(fā)明公開了一種基于時態(tài)聯(lián)動挖掘的股票預測方法。方法可用于挖掘類似這樣的規(guī)則:“如果A股票大漲(或大跌),那么k日后B股票大漲(或大跌)的概率為x%”。需要說明的是,大漲正面、大漲反面、大跌正面、大跌反面4種類型規(guī)則具體應用到某一只股票時,并不一定會生成聯(lián)動規(guī)則,因為觸發(fā)規(guī)則的條件不一定成立。本發(fā)明方法可以預測股票近期幾個交易日的大漲或大跌的概率,從而為股票短線操作提供決策支持。

本發(fā)明方法同樣可應用于證券類具有時間序列特征的數(shù)據(jù),如基金、期貨等。因此,盡管為說明目的公開了本發(fā)明的具體實施例和附圖,其目的在于幫助理解本發(fā)明的內(nèi)容并據(jù)以實施,但是本領(lǐng)域的技術(shù)人員可以理解:在不脫離本發(fā)明及所附的權(quán)力要求的精神和范圍內(nèi),各種替換、變化和修改都是不可能的。因此,本發(fā)明不應局限于最佳實施例和附圖所公開的內(nèi)容。當前公開的實施例在所有方面應被理解為說明性的而非對其請求保護的范圍的限制。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1