亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種用戶收益數(shù)據(jù)獲取方法及系統(tǒng)與流程

文檔序號:12064650閱讀:548來源:國知局
本發(fā)明涉及互聯(lián)網(wǎng)
技術(shù)領(lǐng)域
:,尤其涉及一種用戶收益數(shù)據(jù)獲取方法及系統(tǒng)。
背景技術(shù)
::現(xiàn)有技術(shù)中,特別是通過手機等終端計算用戶收益時,一般是讓用戶手動錄入收益數(shù)據(jù),然后再根據(jù)用戶的錄入的數(shù)據(jù),更新每天的收益。這樣做的主要缺點有:用戶手動錄入收益數(shù)據(jù)操作繁瑣,容易出錯;收益數(shù)據(jù)可能不正確、而且更新不及時。而且,現(xiàn)有技術(shù)中的理財產(chǎn)品管理系統(tǒng)單一,往往只能獲取單一的收益信息,無法得到用戶所有理財產(chǎn)品的全部收益數(shù)據(jù)。技術(shù)實現(xiàn)要素:有鑒于此,本發(fā)明提供了一種用戶收益數(shù)據(jù)獲取方法,能夠及時獲取用戶當(dāng)前的全部收益數(shù)據(jù)。本發(fā)明是這樣實現(xiàn)的:一種用戶收益數(shù)據(jù)獲取方法,包括:通過多個分布式服務(wù)器獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);若多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)存在沖突,則根據(jù)每個數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進行校正;獲取用戶的賬戶數(shù)據(jù)信息;根據(jù)所述用戶的賬戶數(shù)據(jù)信息和所述多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù)得到用戶賬戶的當(dāng)前全部收益數(shù)據(jù)。本發(fā)明還提供了一種用戶收益數(shù)據(jù)獲取系統(tǒng),包括:當(dāng)前數(shù)據(jù)采集模塊,用于獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);所述當(dāng)前數(shù)據(jù)采集模塊包括:數(shù)據(jù)采集單元,用于通過多個分布式服務(wù)器獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);沖突預(yù)警單元,用于判斷多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突;數(shù)據(jù)校正單元,用于在多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突時,根據(jù)每個數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進行校正;用戶信息管理模塊,用于獲取用戶的賬戶數(shù)據(jù)信息;收益數(shù)據(jù)獲取模塊,用于根據(jù)所述用戶的賬戶數(shù)據(jù)信息和所述多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù)得到用戶賬戶的當(dāng)前全部收益數(shù)據(jù)。實施本發(fā)明,具有如下有益效果:(1)本發(fā)明提供的用戶收益數(shù)據(jù)獲取方法,首先,獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);這些當(dāng)前數(shù)據(jù)包括多個數(shù)據(jù)源發(fā)布的多種理財產(chǎn)品的價格;其次,獲取用戶的賬戶數(shù)據(jù)信息;用戶的賬戶數(shù)據(jù)信息包括用戶與金融理財相關(guān)的賬戶數(shù)據(jù)信息,例如賬戶種類、賬戶金額;最后,根據(jù)所述用戶的賬戶數(shù)據(jù)信息和所述當(dāng)前數(shù)據(jù)計算用戶的賬戶的當(dāng)前全部收益數(shù)據(jù)。本發(fā)明提供了對多種理財產(chǎn)品整合管理的方法,自動計算不同理財產(chǎn)品整體收益,有效地解決了現(xiàn)有技術(shù)中的理財產(chǎn)品管理工具管理的品種單一造成的用戶收益數(shù)據(jù)不完整、不系統(tǒng)的問題。且本發(fā)明能夠自動更新用戶每天的收益信息,給用戶提供完整、全面的收益信息。(2)本發(fā)明通過多個分布式服務(wù)器獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù),由于采用多個分布式服務(wù)器抓取數(shù)據(jù),能夠快速地從多個數(shù)據(jù)源抓取海量數(shù)據(jù),極大地提高了用戶收益數(shù)據(jù)的更新速度,且由于采用多個分布式服務(wù)器,能夠獲取全面的數(shù)據(jù),便于系統(tǒng)、完整地計算用戶的收益數(shù)據(jù)。(3)由于多個數(shù)據(jù)源對同一理財產(chǎn)品發(fā)布的信息可能不一致,或稱為多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)存在沖突,本發(fā)明在多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)存在沖突時,也就是多個數(shù)據(jù)源抓取的理財數(shù)據(jù)發(fā)生沖突時,通過多數(shù)據(jù)源交叉校正算法,根據(jù)每個數(shù)據(jù)源的權(quán)重,校正從數(shù)據(jù)源獲取的數(shù)據(jù),從而保證了從多數(shù)據(jù)源抓取數(shù)據(jù)的正確性。(4)本發(fā)明根據(jù)所述校正結(jié)果,動態(tài)調(diào)整更新每個數(shù)據(jù)源的權(quán)重,增加被采納次數(shù)多的數(shù)據(jù)源的權(quán)重,減小被采納次數(shù)少的數(shù)據(jù)源的權(quán)重,從而提高獲取的當(dāng)前數(shù)據(jù)的可靠性。(5)由于用戶的每個理財產(chǎn)品對應(yīng)一個賬戶,本發(fā)明首先獲取用戶客戶端關(guān)聯(lián)的信息流,根據(jù)所述信息流獲取用戶的賬戶數(shù)據(jù)信息,賬戶數(shù)據(jù)信息包括短信賬單和郵件賬單。本發(fā)明能夠根據(jù)用戶的賬單自動獲取用戶的理財產(chǎn)品信息,無需用戶手動輸入理財產(chǎn)品信息,簡化了用戶獲取理財產(chǎn)品收益的流程,提高用戶體驗。(6)本發(fā)明采用了基于同根回溯定位法的賬單自動分析方法,根據(jù)需要提取的用戶的賬戶數(shù)據(jù)信息,設(shè)置提取表達式;根據(jù)提取表達式,在信息流中查找與提取表達式匹配的元素,將與提取表達式具有同一祖先且具有識別特征的元素設(shè)為基準(zhǔn)點;在信息流中查找基準(zhǔn)點最近的祖先;在祖先范圍內(nèi),通過CSS的選擇器查找與用戶的賬戶數(shù)據(jù)信息關(guān)聯(lián)的信息;在查找到的信息中,通過正則表達式提取用戶的賬戶數(shù)據(jù)信息。通過確定了祖先范圍,縮小查找范圍;通過CSS的選擇器又進一步縮小了查找范圍,最后使用正則表達式,精確查找用戶的賬號數(shù)據(jù)信息。本發(fā)明的方法能夠快速、準(zhǔn)確地查找用戶的賬號數(shù)據(jù)信息,提高了用戶賬號數(shù)據(jù)信息提取的效率。附圖說明為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案和優(yōu)點,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其它附圖。圖1是本發(fā)明實施例1的方法的流程圖;圖2是本發(fā)明實施例1的方法的步驟S102的流程圖;圖3是本發(fā)明實施例1的方法的步驟S103的流程圖;圖4是本發(fā)明實施例2的系統(tǒng)的示意圖;圖5是本發(fā)明實施例2的系統(tǒng)的數(shù)據(jù)采集單元的示意圖;圖6是本發(fā)明實施例2的系統(tǒng)的當(dāng)前數(shù)據(jù)采集模塊的示意圖;圖7是本發(fā)明實施例2的系統(tǒng)的權(quán)重調(diào)整單元的示意圖;圖8是本發(fā)明實施例2的系統(tǒng)的信息解析單元的示意圖;圖9是本發(fā)明實施例2的系統(tǒng)的另一示意圖;圖10是本發(fā)明實施例的計算機終端的結(jié)構(gòu)框圖。具體實施方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。實施例1:如圖1所示,本發(fā)明實施例1提供了一種用戶收益數(shù)據(jù)獲取方法,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組或多組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。本發(fā)明的方法包括以下步驟:S101、通過多個分布式服務(wù)器獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù)。作為一種可選的實施方式,步驟S101包括:S1011、通過多個分布式服務(wù)器從多個預(yù)設(shè)的數(shù)據(jù)源獲取當(dāng)前的原始數(shù)據(jù);數(shù)據(jù)源為發(fā)布理財產(chǎn)品數(shù)據(jù)的數(shù)據(jù)源,例如發(fā)布金融產(chǎn)品、金融數(shù)據(jù)的網(wǎng)站;本發(fā)明中的當(dāng)前數(shù)據(jù)指基金、債券、股票、外匯、期貨、P2P等理財產(chǎn)品的價格、匯率等與收益相關(guān)的當(dāng)前數(shù)據(jù)。S1012、刪除所述原始數(shù)據(jù)中與賬戶數(shù)據(jù)信息無關(guān)的數(shù)據(jù)。其中,與賬戶數(shù)據(jù)信息無關(guān)的數(shù)據(jù)包括數(shù)據(jù)源(例如網(wǎng)頁)中的亂碼、廣告、垃圾等。本發(fā)明通過多個分布式服務(wù)器獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù),由于采用多個分布式服務(wù)器抓取數(shù)據(jù),能夠快速地從多個數(shù)據(jù)源抓取海量數(shù)據(jù),極大地提高了理財產(chǎn)品數(shù)據(jù)的更新速度,且由于采用多個分布式服務(wù)器,能夠獲取全面的理財產(chǎn)品數(shù)據(jù),便于系統(tǒng)、完整地計算用戶理財收益。S102、判斷多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突,若是則根據(jù)每個數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進行校正。如圖2所示,作為一種可選的實施方式,步驟S102包括:S1021、獲取預(yù)設(shè)的每個數(shù)據(jù)源的初始權(quán)重。每個數(shù)據(jù)源的初始權(quán)重可以在步驟S101和S102之前就設(shè)定好,不做具體限定。S1022、將多個數(shù)據(jù)源根據(jù)發(fā)布的數(shù)據(jù)分組,將每一組對應(yīng)的數(shù)據(jù)源的權(quán)重相加。具體來說,將多個數(shù)據(jù)源根據(jù)發(fā)布的數(shù)據(jù)分組包括:將發(fā)布的數(shù)據(jù)相同的數(shù)據(jù)源分為一組。S1023、將相加后權(quán)重最大的一組數(shù)據(jù)設(shè)置為最終數(shù)據(jù)。舉例來說,假設(shè)基金數(shù)據(jù)主要從三個數(shù)據(jù)源獲取,三個數(shù)據(jù)源分別是天天基金、好買基金、數(shù)米基金。預(yù)設(shè)三個數(shù)據(jù)源的數(shù)據(jù)可信度權(quán)重分別是:天天基金40%,好買基金30%,數(shù)米基金30%。參見表一,三個數(shù)據(jù)源某天抓取到華夏成長(000001)基金的凈值分別是:表一單位凈值1.06801.06801.0681累計凈值3.36903.36913.3691數(shù)據(jù)源天天基金好買基金數(shù)米基金將多個數(shù)據(jù)源根據(jù)發(fā)布的數(shù)據(jù)分組,將每一組對應(yīng)的數(shù)據(jù)源的權(quán)重相加。具體來說,單位凈值數(shù)據(jù)的數(shù)值相同的數(shù)據(jù)源分為一組,例如,將單位凈值為1.0680的數(shù)據(jù)源天天基金和好買基金分為一組,對應(yīng)的權(quán)重相加:40%+30%;單位凈值為1.0681的數(shù)據(jù)源為數(shù)米基金,權(quán)重為30%。將相加后權(quán)重最大的一組數(shù)據(jù)設(shè)置為最終數(shù)據(jù)。單位凈值:1.0680(40%+30%)>1.0681(30%);累計凈值:3.3690(40%)<3.3691(30%+30%)。所以,如表二所示,單位凈值的最終數(shù)據(jù)是1.0680,累計凈值的最終數(shù)據(jù)是3.3691。表二作為一種可選的實施方式,為了提高從數(shù)據(jù)源中獲取數(shù)據(jù)的可信度,還可以包括:S1024、根據(jù)所述校正結(jié)果,調(diào)整每個數(shù)據(jù)源的權(quán)重。具體來說,若數(shù)據(jù)源獲取的數(shù)據(jù)被設(shè)置為最終數(shù)據(jù),則增加該數(shù)據(jù)源的權(quán)重;若數(shù)據(jù)源獲取的數(shù)據(jù)沒有被設(shè)置為最終數(shù)據(jù),則減小該數(shù)據(jù)源的權(quán)重。S103、獲取用戶的賬戶數(shù)據(jù)信息。用戶的賬戶數(shù)據(jù)信息包括用戶與金融理財相關(guān)的賬戶數(shù)據(jù)信息,例如賬戶種類、賬號等。賬戶種類包括用戶購買的基金、債券、股票、外匯、期貨、P2P、各種能獲得利息的存款等金融或理財產(chǎn)品的名稱和種類。賬戶金額包括用戶參與的每一種金融和理財產(chǎn)品的金額數(shù)據(jù)。用戶的賬戶數(shù)據(jù)信息可以是用戶手動輸入的信息。作為一種可選的實施方式,步驟S103包括:獲取用戶客戶端關(guān)聯(lián)的信息流,根據(jù)所述信息流獲取用戶的賬戶數(shù)據(jù)信息,所述賬戶數(shù)據(jù)信息包括短信賬單和郵件賬單。本發(fā)明中所述的用戶客戶端關(guān)聯(lián)的信息流,是指用戶客戶端接收或發(fā)送的所有信息,包括短消息、郵件、通過即時通訊軟件接收和發(fā)送的消息等。賬單頁面通常是系統(tǒng)生成,結(jié)構(gòu)復(fù)雜無特征,通過常規(guī)的正則表達式匹配分析提取賬單信息十分困難。為了解決該問題,如圖3所示,在一種可選的實施方式中,步驟S103進一步包括:S1031、根據(jù)需要提取的用戶的賬戶數(shù)據(jù)信息,設(shè)置提取表達式。S1032、根據(jù)所述提取表達式,在所述信息流中查找與所述提取表達式匹配的元素,將與所述提取表達式具有同一祖先且具有識別特征的元素設(shè)為基準(zhǔn)點;S1033、在所述信息流中查找所述基準(zhǔn)點最近的祖先;S1034、在所述祖先范圍內(nèi),通過CSS的選擇器查找與用戶的賬戶數(shù)據(jù)信息關(guān)聯(lián)的信息;S1035、在查找到的信息中,通過正則表達式提取用戶的賬戶數(shù)據(jù)信息。例如,用戶在某銀行的賬單中,有本期最低還款額:50.00。獲取用戶的賬戶數(shù)據(jù)信息的方法如下:設(shè)定需要從該賬單中,提取出本期最低還款額:50.00。本發(fā)明的發(fā)明人嘗試通過正則表達式分析提取“本期最低還款額”,發(fā)現(xiàn)由于郵件賬單的html頁面結(jié)構(gòu)太復(fù)雜,導(dǎo)致匹配的正則表達式也越來越復(fù)雜,該方案不具可行性。另外,發(fā)明人嘗試通過基于CSS選擇器的方式,分析提取,由于郵件賬單的html頁面都是用table布局,內(nèi)容相似度極高,不具有識別性,該方案也不具可行性。采用本發(fā)明的方法,能夠很好地解決該問題。具體來說,方法如下:首先,確定提取表達式;其次,找出和“最低還款額”有同一祖先的,同時具有識別特征的元素,作為基準(zhǔn)點;基準(zhǔn)點為“本期最低還款額”。這里的祖先為“最低還款額”所在的上一級表格。第三,找出兩者最近相同的祖先;因為在同一表格,所以最近相同的祖先即該表格;第四,通過CSS(CascadingStyleSheets中文名稱:層疊樣式表)的選擇器逼近“最低還款額”數(shù)據(jù);其中,CSS的選擇器可以為相鄰選擇器,還可以是后代選擇器等其他CSS選擇器;最后,通過正則表達式,提取“最低還款額”數(shù)據(jù)。本發(fā)明的配置表達式可以如下:由于用戶的每個理財產(chǎn)品對應(yīng)一個賬戶,本發(fā)明首先獲取用戶客戶端關(guān)聯(lián)的信息流,根據(jù)所述信息流獲取用戶的賬戶數(shù)據(jù)信息,賬戶數(shù)據(jù)信息包括短信賬單和郵件賬單。本發(fā)明能夠根據(jù)用戶的賬單自動獲取用戶的理財產(chǎn)品信息,無需用戶手動輸入理財產(chǎn)品信息,簡化了用戶獲取理財產(chǎn)品收益的流程,提高用戶體驗。本發(fā)明采用了基于同根回溯定位法的賬單自動分析方法,根據(jù)需要提取的用戶的賬戶數(shù)據(jù)信息,設(shè)置提取表達式;根據(jù)提取表達式,在信息流中查找與提取表達式匹配的元素,將與提取表達式具有同一祖先且具有識別特征的元素設(shè)為基準(zhǔn)點;在信息流中查找基準(zhǔn)點最近的祖先;在祖先范圍內(nèi),通過CSS的選擇器查找與用戶的賬戶數(shù)據(jù)信息關(guān)聯(lián)的信息;在查找到的信息中,通過正則表達式提取用戶的賬戶數(shù)據(jù)信息。通過確定了祖先范圍,縮小查找范圍;通過CSS的選擇器又進一步縮小了查找范圍,最后使用正則表達式,精確查找用戶的賬號數(shù)據(jù)信息。本發(fā)明的方法能夠快速、準(zhǔn)確地查找用戶的賬號數(shù)據(jù)信息,很好的解決由于賬單內(nèi)容復(fù)雜,賬單信息難提取問題;提高了用戶賬號數(shù)據(jù)信息提取的效率。S104、根據(jù)所述用戶的賬戶數(shù)據(jù)信息和所述多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù)得到用戶賬戶的當(dāng)前全部收益數(shù)據(jù)。具體來說,步驟S104包括:根據(jù)所述用戶的賬戶數(shù)據(jù)信息從步驟S102中獲取的當(dāng)前數(shù)據(jù)中查找與用戶的賬戶數(shù)據(jù)信息對應(yīng)的當(dāng)前數(shù)據(jù),分別計算用戶每個賬戶對應(yīng)的當(dāng)前收益數(shù)據(jù)。當(dāng)然,為了給用戶提供更直觀的收益數(shù)據(jù),可以將用戶每個賬戶的當(dāng)前收益數(shù)據(jù)整合,得到用戶賬戶的收益總和。本發(fā)明提供的用戶收益數(shù)據(jù)獲取方法,首先,獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);這些當(dāng)前數(shù)據(jù)包括多個數(shù)據(jù)源發(fā)布的多種理財產(chǎn)品的價格;其次,獲取用戶的賬戶數(shù)據(jù)信息;用戶的賬戶數(shù)據(jù)信息包括用戶與金融理財相關(guān)的賬戶數(shù)據(jù)信息,例如賬戶種類、賬戶金額;最后,根據(jù)所述用戶的賬戶數(shù)據(jù)信息和所述當(dāng)前數(shù)據(jù)計算用戶的賬戶的當(dāng)前全部收益數(shù)據(jù)。本發(fā)明提供了對多種理財產(chǎn)品整合管理的方法,自動計算不同理財產(chǎn)品整體收益,有效地解決了現(xiàn)有技術(shù)中的理財產(chǎn)品管理工具管理的品種單一造成的用戶收益數(shù)據(jù)不完整、不系統(tǒng)的問題。且本發(fā)明能夠自動更新用戶每天的收益信息,給用戶提供完整、全面的收益信息。由于多個數(shù)據(jù)源對同一理財產(chǎn)品發(fā)布的信息可能不一致,或稱為多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)存在沖突,本發(fā)明在多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)存在沖突時,也就是多個數(shù)據(jù)源抓取的理財數(shù)據(jù)發(fā)生沖突時,通過多數(shù)據(jù)源交叉校正算法,根據(jù)每個數(shù)據(jù)源的權(quán)重,校正該理財產(chǎn)品的原始數(shù)據(jù),從而保證了從多數(shù)據(jù)源抓取數(shù)據(jù)的正確性。本發(fā)明根據(jù)所述校正結(jié)果,動態(tài)調(diào)整更新每個數(shù)據(jù)源的權(quán)重,增加被采納次數(shù)多的數(shù)據(jù)源的權(quán)重,減小被采納次數(shù)少的數(shù)據(jù)源的權(quán)重,從而提高獲取的當(dāng)前數(shù)據(jù)的可靠性。實施例2:如圖4所示,本發(fā)明提供了一種用戶收益數(shù)據(jù)獲取系統(tǒng),包括:當(dāng)前數(shù)據(jù)采集模塊,用于獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);當(dāng)前數(shù)據(jù)采集模塊包括:數(shù)據(jù)采集單元,用于通過多個分布式服務(wù)器獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);沖突預(yù)警單元,用于判斷多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突;數(shù)據(jù)校正單元,用于在多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突時,根據(jù)每個數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進行校正;用戶信息管理模塊,用于獲取用戶的賬戶數(shù)據(jù)信息;收益數(shù)據(jù)獲取模塊,用于根據(jù)所述用戶的賬戶數(shù)據(jù)信息和所述多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù)得到用戶賬戶的當(dāng)前全部收益數(shù)據(jù)。作為一種可選的實施例,圖5是本發(fā)明的數(shù)據(jù)采集單元的示意圖,如圖5所示,所述數(shù)據(jù)采集單元包括:原始數(shù)據(jù)獲取子單元,用于通過多個分布式服務(wù)器從多個預(yù)設(shè)的數(shù)據(jù)源獲取當(dāng)前的原始數(shù)據(jù);清洗子單元,用于刪除所述原始數(shù)據(jù)中與賬戶數(shù)據(jù)信息無關(guān)的數(shù)據(jù)。作為一種可選的實施例,圖6是本發(fā)明的當(dāng)前數(shù)據(jù)采集模塊的另一結(jié)構(gòu)示意圖,如圖6所示,當(dāng)前數(shù)據(jù)采集模塊包括:數(shù)據(jù)采集單元,用于通過多個分布式服務(wù)器獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);沖突預(yù)警單元,用于判斷多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突;數(shù)據(jù)校正單元,用于在多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突時,根據(jù)每個數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進行校正。權(quán)重調(diào)整單元,用于根據(jù)所述校正結(jié)果,調(diào)整每個數(shù)據(jù)源的權(quán)重。作為一種可選的實施例,圖7是本發(fā)明的權(quán)重調(diào)整單元的示意圖,如圖7所示,所述權(quán)重調(diào)整單元包括:初值設(shè)置子單元,用于獲取預(yù)設(shè)的每個數(shù)據(jù)源的初始權(quán)重;分組計算子單元,用于將多個數(shù)據(jù)源根據(jù)發(fā)布的數(shù)據(jù)分組,將每一組對應(yīng)的數(shù)據(jù)源的權(quán)重相加;校正子單元,用于將相加后權(quán)重最大的一組數(shù)據(jù)設(shè)置為最終數(shù)據(jù)。作為一種可選的實施例,所述用戶信息管理模塊包括:信息解析單元,用于獲取用戶客戶端關(guān)聯(lián)的信息流,根據(jù)所述信息流獲取用戶的賬戶數(shù)據(jù)信息,所述賬戶數(shù)據(jù)信息包括短信賬單和郵件賬單。作為一種可選的實施例,如圖8所示,所述信息解析單元包括:表達式設(shè)置子單元,用于根據(jù)需要提取的用戶的賬戶數(shù)據(jù)信息,設(shè)置提取表達式;基準(zhǔn)點設(shè)置子單元,用于根據(jù)所述提取表達式,在所述信息流中查找與所述提取表達式匹配的元素,將與所述提取表達式具有同一祖先且具有識別特征的元素設(shè)為基準(zhǔn)點;祖先查找子單元,用于在所述信息流中查找所述基準(zhǔn)點最近的祖先;逼近子單元,用于在所述祖先范圍內(nèi),通過CSS的選擇器查找與用戶的賬戶數(shù)據(jù)信息關(guān)聯(lián)的信息;提取子單元,用于在查找到的信息中,通過正則表達式提取用戶的賬戶數(shù)據(jù)信息。圖9是在一個具體的應(yīng)用場景中,本發(fā)明的系統(tǒng)的結(jié)構(gòu)框圖。本發(fā)明的系統(tǒng)可以應(yīng)用于終端管理軟件,例如騰訊手機管家中,方便計算用戶的所有理財產(chǎn)品的收益。當(dāng)客戶終端的數(shù)目非常龐大時,對應(yīng)與各個客戶端的用戶參與的金融、理財產(chǎn)品的種類也是多種多樣的。如果每獲取一個客戶端的收益數(shù)據(jù)時,服務(wù)器都去從數(shù)據(jù)源獲取一次原始數(shù)據(jù),將會對服務(wù)器造成巨大的壓力,導(dǎo)致服務(wù)器過于繁忙。本發(fā)明為了解決這個問題,采用多個分布式服務(wù)器組成的服務(wù)器集群獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù),并將獲取的數(shù)據(jù)放入數(shù)據(jù)庫中。這樣一來,獲取每個客戶端的收益數(shù)據(jù)時,只需要從數(shù)據(jù)庫中提取需要的數(shù)據(jù)即可,實現(xiàn)數(shù)據(jù)共享,提高了系統(tǒng)的效率,極大地減輕了服務(wù)器的負擔(dān)。數(shù)據(jù)源為發(fā)布理財產(chǎn)品數(shù)據(jù)的數(shù)據(jù)源,例如發(fā)布金融產(chǎn)品、金融數(shù)據(jù)的網(wǎng)站;本發(fā)明中的當(dāng)前數(shù)據(jù)指基金、債券、股票、外匯、期貨、P2P等理財產(chǎn)品的價格、匯率等與收益相關(guān)的當(dāng)前數(shù)據(jù)。本發(fā)明的當(dāng)前數(shù)據(jù)采集模塊也可以稱為金融理財數(shù)據(jù)采集后臺,包括數(shù)據(jù)清洗模塊和數(shù)據(jù)規(guī)整模塊,用于對獲取的數(shù)據(jù)首先進行數(shù)據(jù)清洗和數(shù)據(jù)規(guī)整,例如:去除廣告、亂碼等無用的數(shù)據(jù),得到有效的數(shù)據(jù)。當(dāng)前數(shù)據(jù)采集模塊還可以包括數(shù)據(jù)庫,經(jīng)過數(shù)據(jù)清洗模塊和數(shù)據(jù)規(guī)整模塊處理后的數(shù)據(jù)會存入數(shù)據(jù)庫中,數(shù)據(jù)庫可以叫做金融理財數(shù)據(jù)庫。當(dāng)前數(shù)據(jù)采集模塊還包括沖突預(yù)警機,用于從數(shù)據(jù)庫中獲取數(shù)據(jù),并對獲取的數(shù)據(jù)中的沖突數(shù)據(jù)進行對比校驗、自動校正并進行沖突預(yù)警,將校正后的數(shù)據(jù)存入金融理財數(shù)據(jù)庫中等待調(diào)用。具體來說,沖突預(yù)警機用于判斷多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突,若是,則發(fā)出沖突預(yù)警,金融理財數(shù)據(jù)采集后臺接到?jīng)_突預(yù)警后對沖突數(shù)據(jù)進行自動校正。自動校正的過程為:根據(jù)每個數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進行校正。校正過程包括:預(yù)先獲取預(yù)設(shè)的每個數(shù)據(jù)源的初始權(quán)重。將多個數(shù)據(jù)源根據(jù)發(fā)布的數(shù)據(jù)分組,將每一組對應(yīng)的數(shù)據(jù)源的權(quán)重相加。具體來說,將多個數(shù)據(jù)源根據(jù)發(fā)布的數(shù)據(jù)分組包括:將發(fā)布的數(shù)據(jù)相同的數(shù)據(jù)源分為一組。將相加后權(quán)重最大的一組數(shù)據(jù)設(shè)置為校正后的數(shù)據(jù)。校正后的數(shù)據(jù)會存入到金融理財數(shù)據(jù)庫中。為了提高從數(shù)據(jù)源中獲取數(shù)據(jù)的可信度,沖突預(yù)警機還可以包括權(quán)重調(diào)整模塊,用于根據(jù)所述校正結(jié)果,調(diào)整每個數(shù)據(jù)源的權(quán)重。具體來說,若數(shù)據(jù)源獲取的數(shù)據(jù)被設(shè)置為最終數(shù)據(jù),則增加該數(shù)據(jù)源的權(quán)重;若數(shù)據(jù)源獲取的數(shù)據(jù)沒有被設(shè)置為最終數(shù)據(jù),則減小該數(shù)據(jù)源的權(quán)重。沖突預(yù)警機在完成數(shù)據(jù)校正和數(shù)據(jù)源的權(quán)重調(diào)整后,將更新后的數(shù)據(jù)存入金融理財數(shù)據(jù)庫中。當(dāng)前數(shù)據(jù)采集模塊可以以預(yù)定的時間間隔獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù),例如每天一次,當(dāng)然,對于更新速度較快的收益數(shù)據(jù),也可以提高數(shù)據(jù)獲取頻率。由于用戶一般只需要定期查看收益數(shù)據(jù),以預(yù)定的時間間隔獲取數(shù)據(jù)能夠為用戶提供需要的收益數(shù)據(jù),同時,服務(wù)器只需要定期從數(shù)據(jù)源獲取數(shù)據(jù),能夠節(jié)省服務(wù)器的開支。用戶信息管理模塊也可以稱為用戶理財數(shù)據(jù)管理系統(tǒng),硬件為一個或多個服務(wù)器。用戶信息管理模塊可以接受用戶錄入的賬戶數(shù)據(jù)信息,例如,用戶登錄騰訊手機管家?guī)ぬ栿w系,然后錄入其購買的理財產(chǎn)品信息,并授權(quán)騰訊手機管家管理。另外,在用戶授權(quán)的條件下,用戶信息管理模塊也可以通過基于同根回溯定位法的自動分析算法,通過獲取用戶的郵件賬單、短信賬單,自動幫用戶一鍵導(dǎo)入購買的包括股票、基金、p2p等所有理財產(chǎn)品的信息。用戶只需在騰訊手機管家登錄,并授權(quán)騰訊手機管家管理其理財產(chǎn)品,手機管家就會通過騰訊理財收益計算系統(tǒng),定期更新用戶的收益數(shù)據(jù)。具體來說,用戶信息管理模塊包括用戶理財信息數(shù)據(jù)庫,用于存儲用戶的賬戶信息。用戶的賬戶數(shù)據(jù)信息包括用戶與金融理財相關(guān)的賬戶數(shù)據(jù)信息,例如賬戶種類、賬號等。賬戶種類包括用戶購買的基金、債券、股票、外匯、期貨、P2P、各種能獲得利息的存款等金融或理財產(chǎn)品的名稱和種類。賬戶金額包括用戶參與的每一種金融和理財產(chǎn)品的金額數(shù)據(jù)。用戶的賬戶數(shù)據(jù)信息可以通過兩種方式獲取,第一種為用戶錄入,用戶信息管理模塊提供用戶錄入信息的接口,用戶通過該接口輸入賬戶數(shù)據(jù)信息。第二種為經(jīng)用戶授權(quán)的系統(tǒng)自動獲取。用戶信息管理模塊包括信息解析單元,用于在用戶授權(quán)后,獲取用戶客戶端關(guān)聯(lián)的信息流,根據(jù)所述信息流獲取用戶的賬戶數(shù)據(jù)信息,所述賬戶數(shù)據(jù)信息包括短信賬單和郵件賬單。本發(fā)明中所述的用戶客戶端關(guān)聯(lián)的信息流,是指用戶客戶端接收或發(fā)送的所有信息,包括短消息、郵件、通過即時通訊軟件接收和發(fā)送的消息等。所述信息解析單元包括:表達式設(shè)置子單元,用于根據(jù)需要提取的用戶的賬戶數(shù)據(jù)信息,設(shè)置提取表達式;基準(zhǔn)點設(shè)置子單元,用于根據(jù)所述提取表達式,在所述信息流中查找與所述提取表達式匹配的元素,將與所述提取表達式具有同一祖先且具有識別特征的元素設(shè)為基準(zhǔn)點;祖先查找子單元,用于在所述信息流中查找所述基準(zhǔn)點最近的祖先;逼近子單元,用于在所述祖先范圍內(nèi),通過CSS的選擇器查找與用戶的賬戶數(shù)據(jù)信息關(guān)聯(lián)的信息;提取子單元,用于在查找到的信息中,通過正則表達式提取用戶的賬戶數(shù)據(jù)信息。收益數(shù)據(jù)獲取模塊,也可以稱為理財收益計算引擎,其硬件也是服務(wù)器。根據(jù)所述用戶的賬戶數(shù)據(jù)信息和從數(shù)據(jù)源獲取的與用戶的賬戶數(shù)據(jù)信息對應(yīng)的當(dāng)前數(shù)據(jù),計算用戶每個賬戶對應(yīng)的當(dāng)前收益數(shù)據(jù)。當(dāng)然,為了給用戶提供更直觀的收益數(shù)據(jù),可以將用戶每個賬戶的當(dāng)前收益數(shù)據(jù)整合,形成用戶賬戶的收益總和。具體來說,收益數(shù)據(jù)獲取模塊根據(jù)用戶購買的理財產(chǎn)品,結(jié)合一定的計算公式,計算用戶的所有理財產(chǎn)品的收益,并整合所有收益情況,統(tǒng)一推送給用戶,使用戶可以清楚了解其理財?shù)乃惺找?。可以以預(yù)定的時間間隔推送給用戶,收益數(shù)據(jù)獲取模塊可以根據(jù)用戶設(shè)定的時間間隔向用戶推送收益數(shù)據(jù),從而增強用戶體驗。實施例3本發(fā)明的實施例還提供一種計算機終端,該計算機終端可以是計算機終端群中的任意一個計算機終端設(shè)備??蛇x地,在本實施例中,上述計算機終端也可以替換為移動終端等終端設(shè)備??蛇x地,在本實施例中,上述計算機終端可以位于計算機網(wǎng)絡(luò)的多個網(wǎng)絡(luò)設(shè)備中的至少一個網(wǎng)絡(luò)設(shè)備??蛇x地,圖10是根據(jù)本發(fā)明實施例的計算機終端的結(jié)構(gòu)框圖。如圖10所示,該計算機終端A可以包括:一個或多個(圖中僅示出一個)處理器101、存儲器103、以及傳輸裝置105。其中,存儲器103可用于存儲軟件程序以及模塊,如本發(fā)明實施例中的短文本分類的方法和裝置對應(yīng)的程序指令/模塊,處理器101通過運行存儲在存儲器103內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實現(xiàn)上述的短文本分類。存儲器103可包括高速隨機存儲器,還可以包括非易失性存儲器,如一個或者多個磁性存儲裝置、閃存、或者其他非易失性固態(tài)存儲器。在一些實例中,存儲器103可進一步包括相對于處理器101遠程設(shè)置的存儲器,這些遠程存儲器可以通過網(wǎng)絡(luò)連接至計算機終端A。上述網(wǎng)絡(luò)的實例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動通信網(wǎng)及其組合。上述的傳輸裝置105用于經(jīng)由一個網(wǎng)絡(luò)接收或者發(fā)送數(shù)據(jù)。上述的網(wǎng)絡(luò)具體實例可包括有線網(wǎng)絡(luò)及無線網(wǎng)絡(luò)。在一個實例中,傳輸裝置105包括一個網(wǎng)絡(luò)適配器,其可通過網(wǎng)線與其他網(wǎng)絡(luò)設(shè)備與路由器相連從而可與互聯(lián)網(wǎng)或局域網(wǎng)進行通訊。在一個實例中,傳輸裝置105為射頻模塊,其用于通過無線方式與互聯(lián)網(wǎng)進行通訊。其中,具體地,存儲器103用于存儲預(yù)設(shè)動作條件和預(yù)設(shè)權(quán)限用戶的信息、以及應(yīng)用程序。處理器101可以通過傳輸裝置調(diào)用存儲器103存儲的信息及應(yīng)用程序,以執(zhí)行下述步驟:可選的,上述處理器101還可以執(zhí)行如下步驟的程序代碼:獲取多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);判斷多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突;在多個所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突時,根據(jù)每個數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進行校正;獲取用戶的賬戶數(shù)據(jù)信息;根據(jù)所述用戶的賬戶數(shù)據(jù)信息和所述多個數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù)得到用戶賬戶的當(dāng)前全部收益數(shù)據(jù)。可選地,本實施例中的具體示例可以參考上述實施例1到實施例2中所描述的示例,本實施例在此不再贅述。上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。上述實施例中的集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在上述計算機可讀取的存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在存儲介質(zhì)中,包括若干指令用以使得一臺或多臺計算機設(shè)備(可為個人計算機、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。在本發(fā)明的上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關(guān)描述。在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的客戶端,可通過其它的方式實現(xiàn)。其中,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本
技術(shù)領(lǐng)域
:的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視為本發(fā)明的保護范圍。以上所述是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本
技術(shù)領(lǐng)域
:的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也視為本發(fā)明的保護范圍。當(dāng)前第1頁1 2 3 當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1