一種基于大數(shù)據(jù)的證券資訊個(gè)性化服務(wù)系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種大數(shù)據(jù)采集分析技術(shù),尤其涉及的是一種基于大數(shù)據(jù)的證券資訊 個(gè)性化服務(wù)系統(tǒng)。
【背景技術(shù)】
[0002] 近年來(lái),隨著"大數(shù)據(jù)"概念的普及,在許多領(lǐng)域,服務(wù)提供商開(kāi)始有意識(shí)的對(duì)海量 用戶(hù)數(shù)據(jù)進(jìn)行實(shí)時(shí)采集與分析,從而提取有價(jià)值的信息。再將有價(jià)值的信息綜合利用后,推 送給目標(biāo)群體較為精準(zhǔn)的個(gè)性化信息,是一項(xiàng)以數(shù)據(jù)挖掘、自然語(yǔ)言處理以及互聯(lián)網(wǎng)技術(shù) 為基礎(chǔ)的綜合性方法體系。將合適的信息推送給合適的人,是一項(xiàng)極具挑戰(zhàn)的工作。這個(gè)過(guò) 程需要對(duì)信息作充分的分析,同時(shí)對(duì)人的興趣、行為做細(xì)致的刻畫(huà),并將兩者進(jìn)行有效匹 配。
[0003] 近年來(lái),人們對(duì)證券市場(chǎng)的關(guān)注度越來(lái)越高。證券公司每天向證券用戶(hù)提供的資 訊信息較多,動(dòng)輒幾千條,缺乏針對(duì)性,而且目前的推送方式不夠靈活,一般通過(guò)網(wǎng)站或者 用戶(hù)端給用戶(hù)提供通用資訊。目前瀏覽用戶(hù)居多,用戶(hù)什么時(shí)候在線(xiàn),在線(xiàn)用戶(hù)是誰(shuí)無(wú)法識(shí) 另IJ,因此推送個(gè)性化資訊方面效率不高。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供了一種基于大數(shù)據(jù)的證券資訊個(gè)性 化服務(wù)系統(tǒng),能夠快速識(shí)別瀏覽客戶(hù),并提供個(gè)性化資訊。
[0005] 本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的,本發(fā)明包括大數(shù)據(jù)處理系統(tǒng)和資訊適配服務(wù) 器;
[0006] 所述大數(shù)據(jù)處理系統(tǒng),接收用戶(hù)終端發(fā)送的海量日志數(shù)據(jù),提取出用戶(hù)設(shè)備信息 和用戶(hù)行為信息,生成設(shè)備與用戶(hù)對(duì)應(yīng)關(guān)系表,然后將所述對(duì)應(yīng)關(guān)系表以及該設(shè)備的用戶(hù) 瀏覽信息發(fā)送到資訊適配服務(wù)器,
[0007] 所述資訊適配服務(wù)器,通過(guò)用戶(hù)屬性、用戶(hù)行為屬性和資訊屬性建立用戶(hù)與資訊 的關(guān)聯(lián)度模型,得到每位用戶(hù)適配后的個(gè)性化資訊,然后根據(jù)用戶(hù)終端發(fā)送的設(shè)備信息,從 所述對(duì)應(yīng)關(guān)系表中識(shí)別出客戶(hù)號(hào)后,將該用戶(hù)的個(gè)性化資訊推送給相應(yīng)的用戶(hù)終端。
[0008] 所述大數(shù)據(jù)處理系統(tǒng)接收手機(jī)端和PC端發(fā)送的非結(jié)構(gòu)化日志數(shù)據(jù),所述非結(jié)構(gòu)化 日志數(shù)據(jù)包括手機(jī)號(hào)、頂EI號(hào)、客戶(hù)號(hào)、MAC地址、瀏覽證券信息、登陸時(shí)間及次數(shù),并根據(jù)所 述非結(jié)構(gòu)化日志數(shù)據(jù)生成設(shè)備與用戶(hù)對(duì)應(yīng)關(guān)系表,并定期更新。
[0009] 所述對(duì)應(yīng)關(guān)系表的生成方法,包括以下步驟:
[0010] (11)從手機(jī)日志數(shù)據(jù)中提取出用戶(hù)登錄手機(jī)系統(tǒng)的手機(jī)號(hào)、MEI號(hào)和客戶(hù)號(hào)數(shù) 據(jù),從PC日志數(shù)據(jù)中提取出用戶(hù)登錄PC系統(tǒng)的MAC地址和客戶(hù)號(hào)數(shù)據(jù);
[0011] (12)對(duì)每個(gè)手機(jī)號(hào)、頂EI號(hào)、MAC地址上登陸過(guò)的所有客戶(hù)號(hào)分別進(jìn)行統(tǒng)計(jì);
[0012] (13)如果在一個(gè)手機(jī)號(hào)、頂EI號(hào)或MAC地址上只有一個(gè)客戶(hù)號(hào)登錄,或者有多個(gè)客 戶(hù)號(hào)登錄但只有一個(gè)客戶(hù)號(hào)登錄次數(shù)或者比例超過(guò)閥值,則將該手機(jī)號(hào)、MEI號(hào)或MAC地址 對(duì)應(yīng)到這個(gè)客戶(hù)號(hào)上,寫(xiě)入設(shè)備與用戶(hù)對(duì)應(yīng)關(guān)系表中;
[0013] (14)如果在一個(gè)手機(jī)號(hào)、頂EI號(hào)或MAC地址上有多個(gè)客戶(hù)號(hào)登錄,且不止一個(gè)客戶(hù) 號(hào)登錄次數(shù)或者比例超過(guò)閥值,則將該手機(jī)號(hào)、頂EI號(hào)或MAC地址對(duì)應(yīng)到最近一次登錄的超 過(guò)閥值的客戶(hù)號(hào)上,寫(xiě)入設(shè)備與用戶(hù)對(duì)應(yīng)關(guān)系表中。
[0014] 所述用戶(hù)屬性包括個(gè)股倉(cāng)位、個(gè)股活躍度、持倉(cāng)的個(gè)股屬性,用戶(hù)行為屬性包括自 選股、瀏覽股、添加自選股時(shí)間、瀏覽次數(shù);資訊屬性包括資訊重要度、資訊時(shí)效性、對(duì)應(yīng)的 個(gè)股、對(duì)應(yīng)的行業(yè)、欄目?jī)?yōu)先級(jí)。
[0015] 所述關(guān)聯(lián)度模型的建立方法如下:
[0016] (21)將推送的資訊分類(lèi)為個(gè)股資訊、行業(yè)資訊和宏觀(guān)資訊;
[0017] (22)分別計(jì)算每個(gè)分類(lèi)下的資訊權(quán)重得分并排序;
[0018] (23)將每個(gè)分類(lèi)下的資訊權(quán)重得分前N名的資訊分別推送到相應(yīng)的用戶(hù)終端。
[0019] 所述步驟(22)中,個(gè)股資訊權(quán)重得分=個(gè)股倉(cāng)位得分+個(gè)股活躍度得分+添加自選 股天數(shù)+瀏覽次數(shù)得分+個(gè)股資訊重要度得分+個(gè)股資訊時(shí)效性得分+個(gè)股欄目?jī)?yōu)先級(jí)得分。
[0020] 所述步驟(22)中,行業(yè)資訊權(quán)重得分=行業(yè)現(xiàn)有持倉(cāng)比例得分+行業(yè)歷史分析得 分+地區(qū)持倉(cāng)比例+概念持倉(cāng)比例+行業(yè)資訊重要度得分+行業(yè)資訊時(shí)效性得分+行業(yè)欄目?jī)?yōu) 先級(jí)得分。
[0021] 所述步驟(22)中,宏觀(guān)資訊權(quán)重得分=宏觀(guān)資訊重要度得分+宏觀(guān)資訊時(shí)效性得 分+宏觀(guān)欄目?jī)?yōu)先級(jí)得分。
[0022] 所述根據(jù)用戶(hù)終端發(fā)送的設(shè)備信息,從所述對(duì)應(yīng)關(guān)系表中識(shí)別出用戶(hù)的方法如 下:
[0023] (24)根據(jù)用戶(hù)終端啟動(dòng)時(shí)發(fā)送的信息,由資訊適配服務(wù)器判斷是移動(dòng)終端還是PC 終端,如果數(shù)據(jù)中包含加密后的手機(jī)號(hào)或者IMEI號(hào),則判定為移動(dòng)終端,反之為PC終端;
[0024] (25)如果用戶(hù)終端是移動(dòng)終端,首先根據(jù)手機(jī)號(hào)查詢(xún)對(duì)應(yīng)的客戶(hù)號(hào),如果查詢(xún)成 功,返回客戶(hù)號(hào),如果查詢(xún)失敗,再根據(jù)MEI號(hào)查詢(xún)對(duì)應(yīng)的客戶(hù)號(hào),如果查詢(xún)成功,返回客戶(hù) 號(hào),如果查詢(xún)失敗,退出查詢(xún)并返回通用客戶(hù)標(biāo)志;
[0025] (26)如果用戶(hù)終端是PC終端,根據(jù)MAC地址查詢(xún)對(duì)應(yīng)的客戶(hù)號(hào),如果查詢(xún)成功,返 回客戶(hù)號(hào),如果查詢(xún)失敗,退出查詢(xún)并返回通用客戶(hù)標(biāo)志。
[0026] 所述資訊適配服務(wù)器識(shí)別出客戶(hù)號(hào)后,將關(guān)聯(lián)度模型得到的最新的個(gè)性化資訊, 推送給用戶(hù)所在的用戶(hù)終端,針對(duì)通用客戶(hù)標(biāo)志的用戶(hù)推送通用資訊,接收到新資訊后,關(guān) 聯(lián)度模型每天多次進(jìn)行更新計(jì)算。
[0027] 本發(fā)明相比現(xiàn)有技術(shù)具有以下優(yōu)點(diǎn):本發(fā)明從大數(shù)據(jù)中抽取分析出用戶(hù)信息,能 夠快速識(shí)別證券瀏覽客戶(hù),根據(jù)用戶(hù)信息與后臺(tái)資訊服務(wù)器進(jìn)行適配,并提供個(gè)性化的與 客戶(hù)高度關(guān)聯(lián)的資訊,克服了傳統(tǒng)證券軟件無(wú)法識(shí)別瀏覽客戶(hù),以及推送資訊內(nèi)容沒(méi)有針 對(duì)性問(wèn)題,提高了資訊內(nèi)容精準(zhǔn)度。
【附圖說(shuō)明】
[0028]圖1是本發(fā)明的流程圖。
【具體實(shí)施方式】
[0029] 下面對(duì)本發(fā)明的實(shí)施例作詳細(xì)說(shuō)明,本實(shí)施例在以本發(fā)明技術(shù)方案為前提下進(jìn)行 實(shí)施,給出了詳細(xì)的實(shí)施方式和具體的操作過(guò)程,但本發(fā)明的保護(hù)范圍不限于下述的實(shí)施 例。
[0030] 如圖1所示,本實(shí)施例包括大數(shù)據(jù)處理系統(tǒng)和資訊適配服務(wù)器;
[0031] 所述大數(shù)據(jù)處理系統(tǒng),接收用戶(hù)終端發(fā)送的海量日志數(shù)據(jù),每天的數(shù)據(jù)量約為 50G,800億行,提取出用戶(hù)設(shè)備信息和用戶(hù)行為信息,生成設(shè)備與用戶(hù)對(duì)應(yīng)關(guān)系表,然后將 所述對(duì)應(yīng)關(guān)系表以及該設(shè)備的用戶(hù)瀏覽信息發(fā)送到資訊適配服務(wù)器,
[0032] 所述資訊適配服務(wù)器,通過(guò)用戶(hù)屬性、用戶(hù)行為屬性和資訊屬性建立用戶(hù)與資訊 的關(guān)聯(lián)度模型,得到每位用戶(hù)適配后的個(gè)性化資訊,然后根據(jù)用戶(hù)終端發(fā)送的設(shè)備信息,從 所述對(duì)應(yīng)關(guān)系表中識(shí)別出客戶(hù)號(hào)后,將該用戶(hù)的個(gè)性化資訊推送給相應(yīng)的用戶(hù)終端。
[0033]本實(shí)施例的大數(shù)據(jù)處理系統(tǒng)平臺(tái)使用Hadoop架構(gòu),內(nèi)部采用HDFS和MapReduce并 至少3臺(tái)服務(wù)器,資訊適配服務(wù)器使用Oracle數(shù)據(jù)庫(kù)。
[0034]本實(shí)施例的用戶(hù)終端包括手機(jī)端和PC端,大數(shù)據(jù)處理系統(tǒng)接收手機(jī)端和PC端發(fā)送 的非結(jié)構(gòu)化日志數(shù)據(jù),所述非結(jié)構(gòu)化日志數(shù)據(jù)包括手機(jī)號(hào)、MEI號(hào)、客戶(hù)號(hào)、MAC地址、瀏覽 證券信息、登陸時(shí)間及次數(shù),并根據(jù)所述非結(jié)構(gòu)化日志數(shù)據(jù)生成設(shè)備與用戶(hù)對(duì)應(yīng)關(guān)系表,并 定期更新。
[0035]本實(shí)施例中的客戶(hù)號(hào)即為每個(gè)用戶(hù)存儲(chǔ)在證券系統(tǒng)內(nèi)的用來(lái)登陸證券的用戶(hù)名, 具有唯一性。MEI號(hào)是手機(jī)設(shè)備的唯一標(biāo)識(shí),MAC地址是PC設(shè)備的唯一標(biāo)識(shí),并被寫(xiě)入日志 數(shù)據(jù)中。
[0036]對(duì)應(yīng)關(guān)系表的生成方法,包括以下步驟:
[0037] (11)從手機(jī)日志數(shù)據(jù)中提取出用戶(hù)登錄手機(jī)系統(tǒng)的手機(jī)號(hào)、MEI號(hào)和客戶(hù)號(hào)數(shù) 據(jù),從PC日志數(shù)據(jù)中提取出用戶(hù)登錄PC系統(tǒng)的MAC地址和客戶(hù)號(hào)數(shù)據(jù);
[0038] (12)對(duì)每個(gè)手機(jī)號(hào)、頂EI號(hào)、MAC地址上登陸過(guò)的所有客戶(hù)號(hào)分別進(jìn)行統(tǒng)計(jì);
[0039] (13)如果在一個(gè)手機(jī)號(hào)、頂EI號(hào)或MAC地址上只有一個(gè)客戶(hù)號(hào)登錄,或者有多個(gè)客 戶(hù)號(hào)登錄但只有一個(gè)客戶(hù)號(hào)登錄次數(shù)或者比例超過(guò)3次,則將該手機(jī)號(hào)、MEI號(hào)或MAC地址 對(duì)應(yīng)到這個(gè)客戶(hù)號(hào)上,寫(xiě)入設(shè)備與用戶(hù)對(duì)應(yīng)關(guān)系表中;
[0040] (14)如果在一個(gè)手機(jī)號(hào)、頂EI號(hào)或MAC地址上有多個(gè)客戶(hù)號(hào)登錄,且不止一個(gè)客戶(hù) 號(hào)登錄次數(shù)或者比例超過(guò)3次,則將該手機(jī)號(hào)、MEI號(hào)或MAC地址對(duì)應(yīng)到最近一次登錄的超 過(guò)3次的客戶(hù)號(hào)上,寫(xiě)入設(shè)備與用戶(hù)對(duì)應(yīng)關(guān)系表中。
[0041] 用戶(hù)屬性包括個(gè)股倉(cāng)位、個(gè)股活躍度、持倉(cāng)的個(gè)股屬性,用戶(hù)行為屬性包括自