專利名稱:一種在股評(píng)論壇中挖掘股評(píng)托的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)信息處理技術(shù)領(lǐng)域,特別是一種在股評(píng)論壇中利用股評(píng)人對(duì)某只股票發(fā)表股評(píng)的前后股市行情的變化,來挖掘股評(píng)托的方法。
背景技術(shù):
中國(guó)證券市場(chǎng)中的股評(píng)人十分特殊,他們一般背靠著某證券公司或某咨詢機(jī)構(gòu),而服務(wù)于廣大個(gè)人投資者。我國(guó)個(gè)人投資者是市場(chǎng)中的多數(shù)方,但卻屬于信息弱勢(shì)群體,相當(dāng)一部分個(gè)人投資者把股評(píng)人的看法作為主要的信息來源。因此,股評(píng)人的作用尤其重要。
股評(píng)托是指這樣的股評(píng)人,他們把股評(píng)作為操縱股市的一系列動(dòng)作當(dāng)中的一個(gè),并且是非常關(guān)鍵的一個(gè)。具體表現(xiàn)是,股評(píng)托的有關(guān)某只股票的某個(gè)股評(píng)出籠后不久,就伴隨著該只股票行情的大規(guī)模異動(dòng)。
在網(wǎng)絡(luò)發(fā)展如此迅速的今天,股評(píng)論壇成為個(gè)人投資者獲取股市信息的重要途徑。股評(píng)論壇中的股評(píng)人往往都是匿名,這給那些股評(píng)托惡意散布與事實(shí)不符的股市信息提供了很好的機(jī)會(huì)。這些不實(shí)信息往往會(huì)誤導(dǎo)市場(chǎng),制造虛假輿論,不僅會(huì)嚴(yán)重?fù)p害個(gè)人投資者的利益,而且給證券市場(chǎng)的健康發(fā)展帶來了非常惡劣的影響。
因此,對(duì)股評(píng)人的行為研究是深入了解市場(chǎng)運(yùn)作規(guī)律不可或缺的部分。其中,對(duì)股評(píng)論壇中股評(píng)托的挖掘,更是能夠幫助個(gè)人投資者認(rèn)清股評(píng)論壇中股評(píng)托的真面目,幫助證券業(yè)的管理者發(fā)現(xiàn)危險(xiǎn)分子加以預(yù)警,甚至將其清除出行業(yè)隊(duì)伍,從而保證證券市場(chǎng)的健康發(fā)展。但目前對(duì)我國(guó)證券市場(chǎng)的研究集中在市場(chǎng)行為、個(gè)人投資者和機(jī)構(gòu)投資者行為,對(duì)股評(píng)人的行為研究幾乎是一片空白,對(duì)股評(píng)托的行為研究更是幾乎沒有。
針對(duì)這個(gè)空白,本發(fā)明設(shè)計(jì)了一種在股評(píng)論壇中挖掘股評(píng)托的方法。該方法利用股評(píng)托的特征、心理,從股評(píng)論壇中挖掘出股評(píng)托。
發(fā)明內(nèi)容
對(duì)股評(píng)論壇中股評(píng)托的挖掘,能夠幫助個(gè)人投資者認(rèn)清股評(píng)論壇中股評(píng)托的真面目,幫助證券業(yè)的管理者發(fā)現(xiàn)危險(xiǎn)分子加以預(yù)警,甚至將其清除出行業(yè)隊(duì)伍,從而保證證券市場(chǎng)的健康發(fā)展。但目前對(duì)我國(guó)證券市場(chǎng)的研究集中在市場(chǎng)行為、個(gè)人投資者和機(jī)構(gòu)投資者行為,對(duì)股評(píng)人的行為研究幾乎是一片空白,對(duì)股評(píng)托的行為研究更是幾乎沒有。
針對(duì)這個(gè)空白,本發(fā)明設(shè)計(jì)了一種在股評(píng)論壇中挖掘股評(píng)托的方法。該方法利用股評(píng)托的特征、心理,從股評(píng)論壇中挖掘出股評(píng)托。
論壇中股評(píng)托的目的是讓其背后的莊家獲取最大的收益,代價(jià)是損害大多數(shù)個(gè)人投資者的收益。其行為標(biāo)志是惡意散布與事實(shí)不符的股市信息,制造虛假輿論。具體表現(xiàn)是股評(píng)托的有關(guān)某只股票的某個(gè)股評(píng)出籠后不久,就伴隨著該只股票行情的大規(guī)模異動(dòng)。因此,股評(píng)托對(duì)某只股票的股評(píng),與該股評(píng)出籠前后的該只股票的行情變化之間存在著一定的關(guān)系模式。圖1所示為一種典型的股評(píng)托行為模式當(dāng)某只股票的輿論表現(xiàn)為將會(huì)跌時(shí),受莊家的委托、預(yù)操縱該只股票的股評(píng)托往往會(huì)在股評(píng)論壇中散布該只股票將升的謠言,這些謠言往往能夠煽動(dòng)個(gè)人投資者跟風(fēng),于是該只股票的行情會(huì)短暫上升,并有繼續(xù)上升的趨勢(shì),然而當(dāng)很多個(gè)人投資者投資后,該股票往往會(huì)大幅度下跌,此時(shí)個(gè)人投資者的收益已經(jīng)受到了不同程度的損害,但同時(shí)股評(píng)托背后的莊家已經(jīng)獲得了很大的收益。本發(fā)明設(shè)計(jì)的一種在股評(píng)論壇中挖掘股評(píng)托的方法,就是根據(jù)圖1所示的股評(píng)托行為模式,對(duì)股評(píng)出籠前后的股票行情數(shù)據(jù)的變化進(jìn)行處理,從而在股評(píng)論壇中挖掘股評(píng)托。
本發(fā)明從股市論壇中抽取出某段時(shí)間內(nèi)每個(gè)股評(píng)人的股評(píng),然后將該股評(píng)出籠前后相應(yīng)股票的行情序列作為數(shù)據(jù)處理窗口,用圖1所示的股評(píng)托行為模式與窗口中的股評(píng)行情序列進(jìn)行匹配,根據(jù)匹配的頻率挖掘股評(píng)托。
本發(fā)明所述的一種在股評(píng)論壇中挖掘股評(píng)托的方法描述如下(1)假設(shè)u表示某股評(píng)人,s表示某股票;
(2)假設(shè)market(s,t)表示股票s在t時(shí)刻(以天為單位)的行情的跌漲幅;(3)假設(shè)comment(u,s,t)表示股評(píng)人u在t時(shí)刻(以天為單位)對(duì)股票s做的股評(píng);則 (4)假設(shè)publicbefore(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠前的輿論;則publicbefore(comment(u,s,t))=market(s,t-1)-market(s,t-2) 即股評(píng)comment(u,s,t)出籠前的輿論用該股評(píng)出籠前兩天內(nèi),股票s的行情跌漲幅的變化趨勢(shì)計(jì)算;(5)假設(shè)publicafter(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠后的輿論;則publicafter(comment(u,s,t))=market(s,t+1) 即股評(píng)comment(u,s,t)出籠后的輿論用該股評(píng)出籠后第二天,股票s的行情跌漲幅計(jì)算;(6)假設(shè)publicgain(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠后,大多數(shù)已經(jīng)對(duì)股票s做投資的個(gè)人投資者的收益;則publicgain(comment(u,s,t))=market(s,t+3)
即大多數(shù)個(gè)人投資者收益通過股評(píng)出籠后第三天,股票s的行情跌漲幅計(jì)算;(7)圖1所示的股評(píng)托行為模式是指某股評(píng)托在股評(píng)論壇中發(fā)表了某只股票的股評(píng),預(yù)測(cè)該只股票將會(huì)升;但是該股評(píng)出籠前該只股票的輿論表現(xiàn)為將會(huì)跌;而且股評(píng)出籠后先是該只股票的輿論表現(xiàn)為將會(huì)升,然后在短時(shí)間內(nèi)大多數(shù)個(gè)人投資者收益受到損害。假設(shè)match(u,s,t)表示股評(píng)人u在t時(shí)刻(以天為單位)對(duì)股票s做股評(píng)這個(gè)行為是否符合股評(píng)托行為模式,則當(dāng)如下條件滿足時(shí),match(u,s,t)為1,表示符合;當(dāng)如下條件不滿足時(shí),match(u,s,t)為0,表示不符合publicbefore(comment(u,s,t))=-1且comment(u,s,t)=1且publicafter(comment(u,s,t))=1且publicgain(comment(u,s,t))=-1(8)股評(píng)人在某段時(shí)間內(nèi)的股評(píng)行情序列與股評(píng)托行為模式相匹配的頻率即為該股評(píng)人是股評(píng)托的概率判定。假設(shè)alltimes(u)表示某段時(shí)間內(nèi)股評(píng)人u的所有股評(píng)次數(shù),假設(shè)matchtimes(u)表示該段時(shí)間內(nèi)股評(píng)人u的所有股評(píng)行情序列中與股評(píng)托行為模式相匹配的次數(shù),假設(shè)P(u)表示股評(píng)人u是股評(píng)托的概率,則P(u)按如下公式計(jì)算P(u)=matchtimes(u)/alltimes(u)(9)建立矩陣MarketMatrix;矩陣MarketMatrix有7列,包括<u,s,t,market(s,t-2),market(s,t-1),market(s,t+1),market(s,t+3)>;矩陣MarketMatrix中的每一行記錄了股評(píng)人u在t時(shí)刻(以天為單位)對(duì)股票s做了股評(píng),股評(píng)出籠前后幾天內(nèi)股票s的行情的跌漲幅;例如矩陣MarketMatrix中某一行為<Jone,005,2005-03-31,-0.025900,-0.049400,0.024000,-0.039000>表示股評(píng)人Jone在2005年3月31日這天對(duì)股票號(hào)為005的股票做了股評(píng),股票005的行情在該股評(píng)出籠前兩天跌漲幅為-0.025900,出籠前一天跌漲幅為-0.049400,出籠后第一天跌漲幅為0.024000,出籠后第三天跌漲幅為-0.039000;(10)建立矩陣CommentMatrix;矩陣CommentMatrix有8列,包括<u,s,t,comment(u,s,t),publicbefore(comment(u,s,t)),publicafter(comment(u,s,t)),publicgain(comment(u,s,t)),match(u,s,t)>;矩陣CommentMatrix中的每一行記錄了一條股評(píng)出籠前后的輿論變化、大多數(shù)個(gè)人投資者收益以及該股評(píng)行為是否符合股評(píng)托行為模式;例如矩陣CommentMatrix中某一行為<Jone,005,2005-03-3,1,-1,1,-1,1>表示股評(píng)人Jone在2005年3月31日這天對(duì)股票號(hào)為005的股票做了股評(píng),認(rèn)為該股票的行情將漲,而該股評(píng)出籠前的輿論為該股票的行情將跌,該股評(píng)出籠后的輿論為該股票的行情將漲,最后大多數(shù)已經(jīng)對(duì)股票s做投資的個(gè)人投資者的收益為負(fù),所以該股評(píng)行為符合股評(píng)托行為模式;根據(jù)矩陣MarketMatrix計(jì)算并填充矩陣CommentMatrix;(11)建立矩陣MatchMatrix,矩陣MatchMatrix有4列,包括<u,alltimes(u),matchtimes(u),P(u)>;矩陣中的每一行記錄了一個(gè)股評(píng)人u在某段時(shí)間內(nèi)的所有股評(píng)次數(shù),和股評(píng)人u的所有股評(píng)行情序列中與股評(píng)托行為模式相匹配的次數(shù),以及u是否為股評(píng)托的概率P(u);掃描矩陣CommentMatrix,計(jì)算并填充矩陣MatchMatrix;由用戶指定閾值MINVALUE,從矩陣MatchMatrix中抽取出P(u)高于閾值MINVALUE的用戶,這些用戶即為股評(píng)托。
目前對(duì)我國(guó)證券市場(chǎng)的研究集中在市場(chǎng)行為、個(gè)人投資者和機(jī)構(gòu)投資者行為,對(duì)股評(píng)人的行為研究幾乎是一片空白,對(duì)股評(píng)托的行為研究更是幾乎沒有。本發(fā)明的效果體現(xiàn)在
(1)開展了對(duì)我國(guó)證券市場(chǎng)中股評(píng)人的行為研究;(2)幫助個(gè)人投資者認(rèn)清股評(píng)論壇中股評(píng)托的真面目,降低個(gè)人投資者的利益損失;(3)幫助證券業(yè)的管理者發(fā)現(xiàn)危險(xiǎn)分子加以預(yù)警,甚至將其清除出行業(yè)隊(duì)伍,從而保證證券市場(chǎng)的健康發(fā)展。
本發(fā)明使用矩陣(數(shù)據(jù))的方式、手段來表達(dá)本發(fā)明的在股評(píng)論壇中挖掘股評(píng)托的方法的過程,解決股評(píng)論壇中挖掘股評(píng)托方法的問題。用圖2的方法的具體步驟達(dá)到,從股評(píng)論壇中挖掘出股評(píng)托的效果。本發(fā)明充分運(yùn)用了數(shù)據(jù)矩陣。說明了行、列的內(nèi)容以及行、列的表達(dá)。
圖1是一種股評(píng)論壇中股評(píng)托的行為模式。
圖2是本發(fā)明的一種在股評(píng)論壇中挖掘股評(píng)托的方法的實(shí)現(xiàn)流程圖。
具體實(shí)施例方式
以下是本發(fā)明的一種在股評(píng)論壇中挖掘股評(píng)托的方法的實(shí)現(xiàn)過程,參照說明書附圖2步驟S1,根據(jù)股評(píng)論壇中一定時(shí)間段的股評(píng)貼子建立矩陣MarketMatrix;矩陣MarketMatrix有7列,包括<u,s,t,market(s,t-2),market(s,t-1),market(s,t+1),market(s,t+3)>;矩陣MarketMatrix中的每一行記錄了股評(píng)人u在t時(shí)刻(以天為單位)對(duì)股票s做了股評(píng),股評(píng)出籠前后幾天內(nèi)股票s的行情的跌漲幅;根據(jù)如下假設(shè)計(jì)算并填充矩陣MarketMatrix(1)假設(shè)u表示某股評(píng)人,s表示某股票;(2)假設(shè)market(s,t)表示股票s在t時(shí)刻(以天為單位)的行情的跌漲幅;步驟S2,建立矩陣CommentMatrix;矩陣CommentMatrix有8列,包括<u,s,t,comment(u,s,t),publicbefore(comment(u,s,t)),publicafter(comment(u,s,t)),publicgain(comment(u,s,t)),match(u,s,t)>;矩陣CommentMatrix中的每一行記錄了一條股評(píng)出籠前后的輿論變化、大多數(shù)個(gè)人投資者收益以及該股評(píng)行為是否符合股評(píng)托行為模式;根據(jù)矩陣MarketMatrix和以下假設(shè)和公式計(jì)算并填充矩陣CommentMatrix(1)假設(shè)comment(u,s,t)表示股評(píng)人u在t時(shí)刻(以天為單位)對(duì)股票s做的股評(píng);則 (2)假設(shè)publicbefore(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠前的輿論,則publicbefore(comment(u,s,t))=market(s,t-1)-market(s,t-2) 即股評(píng)comment(u,s,t)出籠前的輿論用該股評(píng)出籠前兩天內(nèi),股票s的行情跌漲幅的變化趨勢(shì)計(jì)算;(3)假設(shè)publicafter(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠后的輿論,則publicafter(comment(u,s,t))=market(s,t+1) 即股評(píng)comment(u,s,t)出籠后的輿論用該股評(píng)出籠后第二天,股票s的行情跌漲幅計(jì)算;(4)假設(shè)publicgain(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠后,大多數(shù)已經(jīng)對(duì)股票s做投資的個(gè)人投資者的收益;則publicgain(comment(u,s,t))=market(s,t+3) 即大多數(shù)個(gè)人投資者收益通過股評(píng)出籠后第三天,股票s的行情跌漲幅計(jì)算;(5)假設(shè)match(u,s,t)表示股評(píng)人u在t時(shí)刻(以天為單位)對(duì)股票s做股評(píng)這個(gè)行為是否符合股評(píng)托行為模式,則當(dāng)如下條件滿足時(shí),match(u,s,t)為1,表示符合;當(dāng)如下條件不滿足時(shí),match(u,s,t)為0,表示不符合publicbefore(comment(u,s,t))=-1且comment(u,s,t)=1且publicafter(comment(u,s,t))=1且publicgain(comment(u,s,t))=-1步驟S3,建立矩陣MatchMatrix;矩陣MatchMatrix有4列,包括<u,alltimes(u),matchtimes(u),P(u)>;矩陣中的每一行記錄了一個(gè)股評(píng)人u在某段時(shí)間內(nèi)的所有股評(píng)次數(shù),和股評(píng)人u的所有股評(píng)行情序列中與股評(píng)托行為模式相匹配的次數(shù),以及u是否為股評(píng)托的概率P(u);掃描矩陣CommentMatrix,根據(jù)以下假設(shè)和公式計(jì)算并填充矩陣MatchMatrix(1)alltimes(u)表示某段時(shí)間內(nèi)股評(píng)人u的所有股評(píng)次數(shù),其計(jì)算方法是例如對(duì)于股評(píng)人Jone,在矩陣CommentMatrix中統(tǒng)計(jì)滿足u=Jone這一條件的記錄總數(shù)即為alltimes(Jone);(2)matchtimes(u)表示該段時(shí)間內(nèi)股評(píng)人u的所有股評(píng)行情序列中與股評(píng)托行為模式相匹配的次數(shù),其計(jì)算方法是例如對(duì)于股評(píng)人Jone,在矩陣CommentMatrix中統(tǒng)計(jì)滿足以下條件的記錄總數(shù)即為matchtimes(Jone)u=Jone且match(u,s,t)=1
(3)P(u)表示股評(píng)人u是股評(píng)托的概率,P(u)按如下公式計(jì)算P(u)=matchtimes(u)/alltimes(u)步驟S4,由用戶指定閾值MINVALUE,從矩陣MatchMatrix中抽取出P(u)高于閾值MINVALUE的用戶,這些用戶即為股評(píng)托。
權(quán)利要求
1.一種在股評(píng)論壇中挖掘股評(píng)托的方法該方法利用股評(píng)托的特征、心理,從股評(píng)論壇中挖掘出股評(píng)托。
2.根據(jù)權(quán)利要求1所述的在股評(píng)論壇中挖掘股評(píng)托的方法,其特征在于(1)假設(shè)u表示某股評(píng)人,s表示某股票;(2)假設(shè)market(s,t)表示股票s在t時(shí)刻的行情的跌漲幅;(3)假設(shè)comment(u,s,t)表示股評(píng)人u在t時(shí)刻對(duì)股票s做的股評(píng);則 (4)假設(shè)publicbefore(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠前的輿論;則publicbefore(comment(u,s,t))=market(s,t-1)-market(s,t-2)]]> 即股評(píng)comment(u,s,t)出籠前的輿論用該股評(píng)出籠前兩天內(nèi),股票s的行情跌漲幅的變化趨勢(shì)計(jì)算;(5)假設(shè)publicafter(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠后的輿論;則publicafter(comment(u,s,t))=market(s,t+1)]]> 即股評(píng)comment(u,s,t)出籠后的輿論用該股評(píng)出籠后第二天,股票s的行情跌漲幅計(jì)算;(6)假設(shè)publicgain(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠后,大多數(shù)已經(jīng)對(duì)股票s做投資的個(gè)人投資者的收益;則publicgain(comment(u,s,t))=market(s,t+3)]]> 即大多數(shù)個(gè)人投資者收益通過股評(píng)出籠后第三天,股票s的行情跌漲幅計(jì)算;(7)股評(píng)托行為模式是指某股評(píng)托在股評(píng)論壇中發(fā)表了某只股票的股評(píng),預(yù)測(cè)該只股票將會(huì)升;但是該股評(píng)出籠前該只股票的輿論表現(xiàn)為將會(huì)跌;而且股評(píng)出籠后先是該只股票的輿論表現(xiàn)為將會(huì)升,然后在短時(shí)間內(nèi)大多數(shù)個(gè)人投資者收益受到損害。假設(shè)match(u,s,t)表示股評(píng)人u在t時(shí)刻(以天為單位)對(duì)股票s做股評(píng)這個(gè)行為是否符合股評(píng)托行為模式,則當(dāng)如下條件滿足時(shí),match(u,s,t)為1,表示符合;當(dāng)如下條件不滿足時(shí),match(u,s,t)為0,表示不符合publicbefore(comment(u,s,t))=-1且comment(u,s,t)=1且publicafter(comment(u,s,t))=1且publicgain(comment(u,s,t))=-1(8)股評(píng)人在某段時(shí)間內(nèi)的股評(píng)行情序列與股評(píng)托行為模式相匹配的頻率即為該股評(píng)人是股評(píng)托的概率判定。假設(shè)alltimes(u)表示某段時(shí)間內(nèi)股評(píng)人u的所有股評(píng)次數(shù),假設(shè)matchtimes(u)表示該段時(shí)間內(nèi)股評(píng)人u的所有股評(píng)行情序列中與股評(píng)托行為模式相匹配的次數(shù),假設(shè)P(u)表示股評(píng)人u是股評(píng)托的概率,則P(u)按如下公式計(jì)算P(u)=matchtimes(u)/alltimes(u)。
3.根據(jù)權(quán)利要求1所述的在股評(píng)論壇中挖掘股評(píng)托的方法,其特征在于建立矩陣MarketMatrix;矩陣MarketMatrix有7列,包括<u,s,t,market(s,t-2),market(s,t-1),market(s,t+1),market(s,t+3)>;矩陣MarketMatrix中的每一行記錄了股評(píng)人u在t時(shí)刻(以天為單位)對(duì)股票s做了股評(píng),股評(píng)出籠前后幾天內(nèi)股票s的行情的跌漲幅;例如矩陣MarketMatrix中某一行為<Jone,005,2005-03-31,-0.025900,-0.049400,0.024000,-0.039000>表示股評(píng)人Jone在2005年3月31日這天對(duì)股票號(hào)為005的股票做了股評(píng),股票005的行情在該股評(píng)出籠前兩天跌漲幅為-0.025900,出籠前一天跌漲幅為-0.049400,出籠后第一天跌漲幅為0.024000,出籠后第三天跌漲幅為-0.039000。
4.根據(jù)權(quán)利要求1所述的在股評(píng)論壇中挖掘股評(píng)托的方法,其特征在于建立矩陣CommentMatrix;矩陣CommentMatrix有8列,包括<u,s,t,comment(u,s,t),publicbefore(comment(u,s,t)),publicafter(comment(u,s,t)),publicgain(comment(u,s,t)),match(u,s,t)>;矩陣CommentMatrix中的每一行記錄了一條股評(píng)出籠前后的輿論變化、大多數(shù)個(gè)人投資者收益以及該股評(píng)行為是否符合股評(píng)托行為模式;例如矩陣CommentMatrix中某一行為<Jone,005,2005-03-31,1,-1,1,-1,1>表示股評(píng)人Jone在2005年3月31日這天對(duì)股票號(hào)為005的股票做了股評(píng),認(rèn)為該股票的行情將漲,而該股評(píng)出籠前的輿論為該股票的行情將跌,該股評(píng)出籠后的輿論為該股票的行情將漲,最后大多數(shù)已經(jīng)對(duì)股票s做投資的個(gè)人投資者的收益為負(fù),所以該股評(píng)行為符合股評(píng)托行為模式;根據(jù)矩陣MarketMatrix計(jì)算并填充矩陣CommentMatrix。
5.根據(jù)權(quán)利要求1所述的在股評(píng)論壇中挖掘股評(píng)托的方法,其特征在于建立矩陣MatchMatrix,矩陣MatchMatrix有4列,包括<u,alltimes(u),matchtimes(u),P(u)>;矩陣中的每一行記錄了一個(gè)股評(píng)人u在某段時(shí)間內(nèi)的所有股評(píng)次數(shù),和股評(píng)人u的所有股評(píng)行情序列中與股評(píng)托行為模式相匹配的次數(shù),以及u是否為股評(píng)托的概率P(u);掃描矩陣CommentMatrix,計(jì)算并填充矩陣MatchMatrix;由用戶指定閾值MINVALUE,從矩陣MatchMatrix中抽取出P(u)高于閾值MINVALUE的用戶,這些用戶即為股評(píng)托。
6.根據(jù)權(quán)利要求1所述的在股評(píng)論壇中挖掘股評(píng)托的方法,其特征在于具體操作步驟是步驟S1,根據(jù)股評(píng)論壇中一定時(shí)間段的股評(píng)貼子建立矩陣MarketMatrix;矩陣MarketMatrix有7列,包括<u,s,t,market(s,t-2),market(s,t-1),market(s,t+1),market(s,t+3)>;矩陣MarketMatrix中的每一行記錄了股評(píng)人u在t時(shí)刻(以天為單位)對(duì)股票s做了股評(píng),股評(píng)出籠前后幾天內(nèi)股票s的行情的跌漲幅;根據(jù)如下假設(shè)計(jì)算并填充矩陣MarketMatrix(1)假設(shè)u表示某股評(píng)人,s表示某股票;(2)假設(shè)market(s,t)表示股票s在t時(shí)刻的行情的跌漲幅;步驟S2,建立矩陣CommentMatrix;矩陣CommentMatrix有8列,包括<u,s,t,comment(u,s,t),publicbefore(comment(u,s,t)),publicafter(comment(u,s,t)),publicgain(comment(u,s,t)),match(u,s,t)>;矩陣CommentMatrix中的每一行記錄了一條股評(píng)出籠前后的輿論變化、大多數(shù)個(gè)人投資者收益以及該股評(píng)行為是否符合股評(píng)托行為模式;根據(jù)矩陣MarketMatrix和以下假設(shè)和公式計(jì)算并填充矩陣CommentMatrix(1)假設(shè)comment(u,s,t)表示股評(píng)人u在t時(shí)刻對(duì)股票s做的股評(píng);則 (2)假設(shè)publicbefore(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠前的輿論,則publicbefore(comment(u,s,t))=market(s,t-1)-market(s,t-2)]]> 即股評(píng)comment(u,s,t)出籠前的輿論用該股評(píng)出籠前兩天內(nèi),股票s的行情跌漲幅的變化趨勢(shì)計(jì)算;(3)假設(shè)publicafter(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠后的輿論,則publicafter(comment(u,s,t))=market(s,t+1)]]> 即股評(píng)comment(u,s,t)出籠后的輿論用該股評(píng)出籠后第二天,股票s的行情跌漲幅計(jì)算;(4)假設(shè)publicgain(comment(u,s,t))表示股評(píng)comment(u,s,t)出籠后,大多數(shù)已經(jīng)對(duì)股票s做投資的個(gè)人投資者的收益;則publicgain(comment(u,s,t))=market(s,t+3)]]> 即大多數(shù)個(gè)人投資者收益通過股評(píng)出籠后第三天,股票s的行情跌漲幅計(jì)算;(5)假設(shè)match(u,s,t)表示股評(píng)人u在t時(shí)刻對(duì)股票s做股評(píng)這個(gè)行為是否符合股評(píng)托行為模式,則當(dāng)如下條件滿足時(shí),match(u,s,t)為1,表示符合;當(dāng)如下條件不滿足時(shí),match(u,s,t)為0,表示不符合publicbefore(comment(u,s,t))=-1且comment(u,s,t)=1且publicafter(comment(u,s,t))=1且publicgain(comment(u,s,t))=-1步驟S3,建立矩陣MatchMatrix;矩陣MatchMatrix有4列,包括<u,alltimes(u),matchtimes(u),P(u)>;矩陣中的每一行記錄了一個(gè)股評(píng)人u在某段時(shí)間內(nèi)的所有股評(píng)次數(shù),和股評(píng)人u的所有股評(píng)行情序列中與股評(píng)托行為模式相匹配的次數(shù),以及u是否為股評(píng)托的概率P(u);掃描矩陣CommentMatrix,根據(jù)以下假設(shè)和公式計(jì)算并填充矩陣MatchMatrix(1)alltimes(u)表示某段時(shí)間內(nèi)股評(píng)人u的所有股評(píng)次數(shù),其計(jì)算方法是例如對(duì)于股評(píng)人Jone,在矩陣CommentMatrix中統(tǒng)計(jì)滿足u=Jone這一條件的記錄總數(shù)即為alltimes(Jone);(2)matcht imes(u)表示該段時(shí)間內(nèi)股評(píng)人u的所有股評(píng)行情序列中與股評(píng)托行為模式相匹配的次數(shù),其計(jì)算方法是例如對(duì)于股評(píng)人Jone,在矩陣CommentMatrix中統(tǒng)計(jì)滿足以下條件的記錄總數(shù)即為matchtimes(Jone)u=Jone且match(u,s,t)=1(3)P(u)表示股評(píng)人u是股評(píng)托的概率,P(u)按如下公式計(jì)算P(u)=matchtimes(u)/alltimes(u)步驟S4,由用戶指定閾值MINVALUE,從矩陣MatchMatrix中抽取出P(u)高于閾值MINVALUE的用戶,這些用戶即為股評(píng)托。
全文摘要
本發(fā)明涉及網(wǎng)絡(luò)信息處理技術(shù)領(lǐng)域,是一種在股評(píng)論壇中利用股評(píng)人對(duì)某只股票發(fā)表股評(píng)的前后股市行情的變化,來挖掘股評(píng)托的方法。本發(fā)明從股評(píng)論壇中抽取出某段時(shí)間內(nèi)每個(gè)股評(píng)人的股評(píng),然后以該股評(píng)出籠前后相應(yīng)股票的行情序列為窗口,用股評(píng)托行為模式與窗口中的股評(píng)行情序列進(jìn)行匹配,基于匹配的頻率計(jì)算股評(píng)人是股評(píng)托的概率。在股評(píng)論壇中挖掘股評(píng)托,能夠幫助個(gè)人投資者認(rèn)清股評(píng)論壇中股評(píng)托的真面目,幫助證券業(yè)的管理者發(fā)現(xiàn)危險(xiǎn)分子加以預(yù)警,甚至清除出行業(yè)隊(duì)伍,從而保證證券市場(chǎng)的健康發(fā)展。目前對(duì)我國(guó)股評(píng)托的行為研究幾乎沒有。
文檔編號(hào)G06Q40/00GK1787007SQ200510130688
公開日2006年6月14日 申請(qǐng)日期2005年12月21日 優(yōu)先權(quán)日2005年12月21日
發(fā)明者郭巖, 白碩, 張凱, 王斌, 張剛 申請(qǐng)人:中國(guó)科學(xué)院計(jì)算技術(shù)研究所