股票輿情指數(shù)預(yù)測(cè)方法以及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)技術(shù),尤其是涉及一種股票輿情指數(shù)預(yù)測(cè)方法以及股票輿情指數(shù)預(yù)測(cè)裝置。
【背景技術(shù)】
[0002]量化投資已經(jīng)在國(guó)內(nèi)外獲得了越來越多的關(guān)注和應(yīng)用。根據(jù)統(tǒng)計(jì)美國(guó)市場(chǎng)大約有不少于60%的成交量來自于量化交易,而2010年也被國(guó)內(nèi)投資者譽(yù)為中國(guó)量化投資的元年。
[0003]量化投資不是依靠人的感覺來管理資產(chǎn),而是根據(jù)人的投資思想和投資經(jīng)驗(yàn)來構(gòu)建數(shù)學(xué)模型,并基于計(jì)算機(jī)設(shè)備利用大量的歷史股票量?jī)r(jià)數(shù)據(jù)作為數(shù)據(jù)源來對(duì)數(shù)學(xué)模型進(jìn)行有效性驗(yàn)證,有效性驗(yàn)證通過的數(shù)學(xué)模型可以被用于量化投資中。
[0004]發(fā)明人在實(shí)現(xiàn)本發(fā)明過程中發(fā)現(xiàn),由于股票量?jī)r(jià)數(shù)據(jù)中的噪音較多且其具有完全公開性,因此,利用股票量?jī)r(jià)數(shù)據(jù)來實(shí)現(xiàn)量化投資往往會(huì)存在構(gòu)建有效的量化投資策略難度較大的問題,從而不利用量化投資。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的是提供一種股票輿情指數(shù)預(yù)測(cè)方法以及裝置。
[0006]根據(jù)本發(fā)明的一個(gè)方面,提供一種股票輿情指數(shù)預(yù)測(cè)方法,且所述方法主要包括以下步驟:獲取不同類型的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù),其中,所述不同類型的數(shù)據(jù)源包括:基于搜索引擎的數(shù)據(jù)源、基于社區(qū)/論壇的數(shù)據(jù)源以及基于新聞的數(shù)據(jù)源;確定所述不同類型的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù)所包含的與需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票相關(guān)的描述信息;根據(jù)不同類型的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù)所包含的所有描述信息確定所述股票的股票輿情指數(shù)。
[0007]根據(jù)本發(fā)明的另一個(gè)方面,提供一種股票輿情指數(shù)預(yù)測(cè)裝置,且所述裝置主要包括:用于獲取不同類型的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù)的裝置,其中,所述不同類型的數(shù)據(jù)源包括:基于搜索引擎的數(shù)據(jù)源、基于社區(qū)/論壇的數(shù)據(jù)源以及基于新聞的數(shù)據(jù)源;用于確定所述不同類型的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù)所包含的與需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票相關(guān)的描述信息的裝置;用于根據(jù)不同類型的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù)所包含的所有描述信息確定所述股票的股票輿情指數(shù)的裝置。
[0008]與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn):本發(fā)明通過對(duì)基于搜索引擎的數(shù)據(jù)源、基于社區(qū)/論壇的數(shù)據(jù)源以及基于新聞的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù)分別進(jìn)行判斷,可以及時(shí)地確定出不同類型的實(shí)時(shí)數(shù)據(jù)中所存在的與需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票相關(guān)的各描述信息,使本發(fā)明可以通過多角度的數(shù)據(jù)挖掘獲得更多對(duì)股票價(jià)格可能會(huì)產(chǎn)生影響的描述信息;本發(fā)明通過根據(jù)確定出的描述信息來確定股票輿情指數(shù),使預(yù)測(cè)出的股票輿情指數(shù)建立在對(duì)多個(gè)不同類型的數(shù)據(jù)源中的對(duì)股票價(jià)格可能會(huì)產(chǎn)生影響的多個(gè)描述信息進(jìn)行全面考慮的基礎(chǔ)之上;由此可知,本發(fā)明提供的技術(shù)方案綜合考慮了多種不同類型的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù),從而能夠獲得較為準(zhǔn)確的股票輿情指數(shù);由于本發(fā)明預(yù)測(cè)出的股票輿情指數(shù)可以作為量化投資過程中一項(xiàng)有參考價(jià)值的指標(biāo),因此,本發(fā)明提供的上述技術(shù)方案有利于量化投資。
【附圖說明】
[0009]通過閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0010]圖1為本發(fā)明實(shí)施例一的股票輿情指數(shù)預(yù)測(cè)方法流程圖;
[0011]圖2為本發(fā)明實(shí)施例二的股票輿情指數(shù)預(yù)測(cè)裝置示意圖。
[0012]附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
【具體實(shí)施方式】
[0013]在更加詳細(xì)地討論示例性實(shí)施例之前,應(yīng)當(dāng)提到的是,一些示例性實(shí)施例被描述成作為流程圖描繪的處理或方法。雖然流程圖將各項(xiàng)操作描述成順序的處理,但是,其中的許多操作可以被并行地、并發(fā)地或者同時(shí)實(shí)施。此外,各項(xiàng)操作的執(zhí)行順序可以被重新安排。當(dāng)其操作完成時(shí)所述處理可以被終止,但是還可以具有未包括在附圖中的附加步驟。所述處理可以對(duì)應(yīng)于方法、函數(shù)、規(guī)程、子例程、子程序等等。
[0014]在上下文中所稱“計(jì)算機(jī)設(shè)備”,也稱為“電腦”,是指可以通過運(yùn)行預(yù)定程序或指令來執(zhí)行數(shù)值計(jì)算和/或邏輯計(jì)算等預(yù)定處理過程的智能電子設(shè)備,其可以包括處理器與存儲(chǔ)器,由處理器執(zhí)行在存儲(chǔ)器中預(yù)存的存續(xù)指令來執(zhí)行預(yù)定處理過程,或者是由ASIC、FPGA、DSP等硬件執(zhí)行預(yù)定處理過程,或者是由上述二者組合來實(shí)現(xiàn)。計(jì)算機(jī)設(shè)備包括但不限于服務(wù)器、個(gè)人電腦以及筆記本電腦等。
[0015]所述計(jì)算機(jī)設(shè)備包括用戶設(shè)備與網(wǎng)絡(luò)設(shè)備。其中,所述用戶設(shè)備包括但不限于電腦、智能手機(jī)、PDA等;所述網(wǎng)絡(luò)設(shè)備包括但不限于單個(gè)網(wǎng)絡(luò)服務(wù)器、多個(gè)網(wǎng)絡(luò)服務(wù)器組成的服務(wù)器組或基于云計(jì)算(Cloud Computing)的由大量計(jì)算機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成的云,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散耦合的計(jì)算機(jī)集組成的一個(gè)超級(jí)虛擬計(jì)算機(jī)。其中,所述計(jì)算機(jī)設(shè)備可單獨(dú)運(yùn)行來實(shí)現(xiàn)本發(fā)明,也可接入網(wǎng)絡(luò)并通過與網(wǎng)絡(luò)中的其他計(jì)算機(jī)設(shè)備的交互操作來實(shí)現(xiàn)本發(fā)明。其中,所述計(jì)算機(jī)設(shè)備所處的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)等。
[0016]需要說明的是,所述用戶設(shè)備、網(wǎng)絡(luò)設(shè)備和網(wǎng)絡(luò)等僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的計(jì)算機(jī)設(shè)備或網(wǎng)絡(luò)如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。
[0017]后面所討論的方法(其中一些通過流程圖示出)可通過硬件、軟件、固件、中間件、微代碼、硬件描述語言或者其任意組合來實(shí)施。當(dāng)用軟件、固件、中間件或微代碼來實(shí)施時(shí),用以實(shí)施必要任務(wù)的程序代碼或代碼段可以被存儲(chǔ)在機(jī)器或計(jì)算機(jī)可讀介質(zhì)(比如存儲(chǔ)介質(zhì))中。(一個(gè)或多個(gè))處理器可以實(shí)施必要的任務(wù)。
[0018]這里所公開的具體結(jié)構(gòu)和功能細(xì)節(jié)僅僅是代表性的,并且是用于描述本發(fā)明的示例性實(shí)施例的目的。但是,本發(fā)明可以通過許多替換形式來具體實(shí)現(xiàn),并且不應(yīng)當(dāng)被解釋成僅僅受限于這里所闡述的實(shí)施例。
[0019]應(yīng)當(dāng)理解的是,雖然在這里可能使用了術(shù)語“第一”、“第二”等等來描述各個(gè)單元,但是這些單元不應(yīng)當(dāng)受這些術(shù)語限制。使用這些術(shù)語僅僅是為了將一個(gè)單元與另一個(gè)單元進(jìn)行區(qū)分。舉例來說,在不背離示例性實(shí)施例的范圍的情況下,第一單元可以被稱為第二單元,并且類似地第二單元可以被稱為第一單元。這里所使用的術(shù)語“和/或”包括其中一個(gè)或更多所列出的相關(guān)聯(lián)項(xiàng)目的任意和所有組合。
[0020]應(yīng)當(dāng)理解的是,當(dāng)一個(gè)單元被稱為“連接”或者“耦合”到另一個(gè)單元時(shí),其可以直接連接或耦合到所述另一單元,或者可以存在中間單元。與此相對(duì),當(dāng)一個(gè)單元被稱為“直接連接”或“直接耦合”到另一單元時(shí),則不存在中間單元。應(yīng)當(dāng)按照類似的方式來解釋被用于描述單元之間的關(guān)系的其他詞語(例如“處于...之間”相比于“直接處于...之間”,“與...鄰近”相比于“與...直接鄰近”等等)。
[0021]這里所使用的術(shù)語僅僅是為了描述具體實(shí)施例而不意圖限制示例性實(shí)施例。除非上下文明確地另有所指,否則這里所使用的單數(shù)形式“一個(gè)”、“一項(xiàng)”還意圖包括復(fù)數(shù)。還應(yīng)當(dāng)理解的是,這里所使用的術(shù)語“包括”和/或“包含”規(guī)定所陳述的特征、整數(shù)、步驟、操作、單元和/或組件的存在,而不排除存在或添加一個(gè)或更多其他特征、整數(shù)、步驟、操作、單元、組件和/或其組合。
[0022]還應(yīng)當(dāng)提到的是,在一些替換實(shí)現(xiàn)方式中,所提到的功能/動(dòng)作可以按照不同于附圖中標(biāo)示的順序發(fā)生。舉例來說,取決于所涉及的功能/動(dòng)作,相繼示出的兩幅圖實(shí)際上可以基本上同時(shí)執(zhí)行或者有時(shí)可以按照相反的順序來執(zhí)行。
[0023]下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
[0024]實(shí)施例一、股票輿情指數(shù)預(yù)測(cè)方法。
[0025]圖1為本實(shí)施例的股票輿情指數(shù)預(yù)測(cè)方法的流程圖,且圖1所示的方法主要包括:步驟S100、步驟S110以及步驟S120。本實(shí)施例所記載的方法通常是在計(jì)算機(jī)設(shè)備中被執(zhí)行的,優(yōu)選的,本實(shí)施例所記載的方法可以在服務(wù)器、臺(tái)式計(jì)算機(jī)以及其他網(wǎng)絡(luò)設(shè)備中被執(zhí)行。下面對(duì)圖1中的各步驟分別進(jìn)行說明。
[0026]S100、獲取不同類型的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù)。
[0027]具體的,本實(shí)施例中的不同類型的數(shù)據(jù)源主要包括:基于搜索引擎的數(shù)據(jù)源(也可以稱為搜索大數(shù)據(jù),如百度搜索大數(shù)據(jù))、基于社區(qū)/論壇的數(shù)據(jù)源(也可稱為社區(qū)/論壇大數(shù)據(jù),如百度社區(qū)大數(shù)據(jù))以及基于新聞的數(shù)據(jù)源(也可以稱為新聞大數(shù)據(jù),如百度新聞大數(shù)據(jù))。一個(gè)具體的例子,在實(shí)際應(yīng)用中,不同類型的數(shù)據(jù)源包括:百度搜索大數(shù)據(jù)、百度社區(qū)大數(shù)據(jù)以及百度新聞大數(shù)據(jù)。另外,本實(shí)施例中的不同類型的數(shù)據(jù)源可以在包括上述三種類型的數(shù)據(jù)源類型的基礎(chǔ)上,還包括其他類型的數(shù)據(jù)源。
[0028]作為示例,本實(shí)施例中的實(shí)時(shí)數(shù)據(jù)也可以稱為當(dāng)前數(shù)據(jù)或者非歷史數(shù)據(jù)或者新鮮數(shù)據(jù)或者未過時(shí)效的數(shù)據(jù)等,且本實(shí)施例中的實(shí)時(shí)數(shù)據(jù)通常是指數(shù)據(jù)產(chǎn)生時(shí)間在預(yù)定時(shí)間范圍內(nèi)的數(shù)據(jù),如本實(shí)施例可以將當(dāng)天的數(shù)據(jù)均作為實(shí)時(shí)數(shù)據(jù),再如本實(shí)施例可以將前一天15:00到當(dāng)天早7:00所產(chǎn)生的數(shù)據(jù)均作為實(shí)時(shí)數(shù)據(jù)。
[0029]S110、確定不同類型的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù)所包含的與需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票相關(guān)的描述信息。
[0030]具體的,本實(shí)施例中的描述信息通常是指與股票相關(guān)的基于金融學(xué)的描述信息,即本實(shí)施例中的描述信息通常是指與股票相關(guān)的金融語言,如被立案調(diào)查、收購、被收購以及資產(chǎn)重組等。本實(shí)施例不限制描述信息的具體內(nèi)容。
[0031]作為示例,本實(shí)施例可以預(yù)先設(shè)定描述信息集合,該描述信息集合中包含有多個(gè)描述信息,本實(shí)施例可以利用該描述信息集合以及需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票標(biāo)識(shí)信息對(duì)不同類型的數(shù)據(jù)源中的各實(shí)時(shí)數(shù)據(jù)分別進(jìn)行過濾,以判斷各實(shí)時(shí)數(shù)據(jù)是否包含上述股票標(biāo)識(shí)信息以及描述信息集合中的描述信息。
[0032]作為示例,本實(shí)施例中的股票標(biāo)識(shí)信息可以具體為:股票名稱、股票代碼以及股票名稱的簡(jiǎn)稱中的一個(gè)或者多個(gè),且一條股票標(biāo)識(shí)信息只能唯一表示出一只股票,不同的股票標(biāo)識(shí)信息所表示出的股票并不相同。在實(shí)際應(yīng)用中,股票標(biāo)識(shí)信息最好包括:股票名稱、股票代碼以及股票名稱的簡(jiǎn)稱,以便于后續(xù)可以對(duì)數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù)進(jìn)行充分的過濾統(tǒng)
i+o
[0033]作為示例,本實(shí)施例可以根據(jù)外部輸入的信息獲取到需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票標(biāo)識(shí)信息,如根據(jù)鍵盤輸入的信息獲取到需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票標(biāo)識(shí)信息,再如根據(jù)網(wǎng)絡(luò)傳輸來的信息獲取到需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票標(biāo)識(shí)信息。
[0034]作為示例,本實(shí)施例也可以從本地存儲(chǔ)的文件中獲取到需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票標(biāo)識(shí)信息;一個(gè)具體的例子,本地存儲(chǔ)的文件中包含有目前A股市場(chǎng)中的所有股票的股票標(biāo)識(shí)信息,從而從該文件中可以獲取到任意一個(gè)需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票標(biāo)識(shí)信息。在需要對(duì)目前A股市場(chǎng)中的所有股票均進(jìn)行股票輿情指數(shù)預(yù)測(cè)時(shí),本實(shí)施例可以從該文件中逐個(gè)讀取股票標(biāo)識(shí)信息,通過針對(duì)每次讀取出的股票標(biāo)識(shí)信息分別執(zhí)行本步驟的過濾以及判斷等操作,即可實(shí)現(xiàn)對(duì)目前A股市場(chǎng)中的所有股票分別進(jìn)行股票輿情指數(shù)預(yù)測(cè)的目的。
[0035]本實(shí)施例不限制獲取需要進(jìn)行股票輿情指數(shù)預(yù)測(cè)的股票標(biāo)識(shí)信息的具體實(shí)現(xiàn)方式以及股票標(biāo)識(shí)信息所包含的具體內(nèi)容。
[0036]作為示例,本實(shí)施例可以先后對(duì)不同類型的數(shù)據(jù)源中的實(shí)時(shí)數(shù)據(jù)分別進(jìn)行過濾處理,如先對(duì)百度搜索大數(shù)據(jù)中的所有實(shí)時(shí)數(shù)據(jù)進(jìn)行過濾處理,之后對(duì)百度社區(qū)大數(shù)據(jù)中的所有實(shí)時(shí)數(shù)據(jù)進(jìn)行過濾處理,最后對(duì)百度新聞