1.一種用戶收益數(shù)據(jù)獲取方法,其特征在于,包括:
通過多個(gè)分布式服務(wù)器獲取多個(gè)數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);
若多個(gè)所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)存在沖突,則根據(jù)每個(gè)數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進(jìn)行校正;
獲取用戶的賬戶數(shù)據(jù)信息;
根據(jù)所述用戶的賬戶數(shù)據(jù)信息和所述多個(gè)數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù)得到用戶賬戶的當(dāng)前全部收益數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的用戶收益數(shù)據(jù)獲取方法,其特征在于,所述根據(jù)每個(gè)數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進(jìn)行校正,包括:
獲取預(yù)設(shè)的每個(gè)數(shù)據(jù)源的初始權(quán)重;
將多個(gè)數(shù)據(jù)源根據(jù)發(fā)布的數(shù)據(jù)分組,將每一組對應(yīng)的數(shù)據(jù)源的權(quán)重相加;
將相加后權(quán)重最大的一組數(shù)據(jù)設(shè)置為最終數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的用戶收益數(shù)據(jù)獲取方法,其特征在于,所述根據(jù)每個(gè)數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進(jìn)行校正之后,還包括:
根據(jù)所述校正結(jié)果,調(diào)整每個(gè)數(shù)據(jù)源的權(quán)重。
4.根據(jù)權(quán)利要求3所述的用戶收益數(shù)據(jù)獲取方法,其特征在于,所述根據(jù)所述校正結(jié)果,調(diào)整每個(gè)數(shù)據(jù)源的權(quán)重,包括:
若數(shù)據(jù)源獲取的數(shù)據(jù)被設(shè)置為最終數(shù)據(jù),則增加該數(shù)據(jù)源的權(quán)重;若數(shù)據(jù)源獲取的數(shù)據(jù)沒有被設(shè)置為最終數(shù)據(jù),則減小該數(shù)據(jù)源的權(quán)重。
5.根據(jù)權(quán)利要求1所述的用戶收益數(shù)據(jù)獲取方法,其特征在于,所述通過多個(gè)分布式服務(wù)器獲取多個(gè)數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù),包括:
通過多個(gè)分布式服務(wù)器從多個(gè)預(yù)設(shè)的數(shù)據(jù)源獲取當(dāng)前的原始數(shù)據(jù);
刪除所述原始數(shù)據(jù)中與賬戶數(shù)據(jù)信息無關(guān)的數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的用戶收益數(shù)據(jù)獲取方法,其特征在于,所述獲取用戶的賬戶數(shù)據(jù)信息,包括:
獲取用戶客戶端關(guān)聯(lián)的信息流,根據(jù)所述信息流獲取用戶的賬戶數(shù)據(jù)信息,所述賬戶數(shù)據(jù)信息包括短信賬單和郵件賬單。
7.根據(jù)權(quán)利要求6所述的用戶收益數(shù)據(jù)獲取方法,其特征在于,所述根據(jù)所述信息流獲取用戶的賬戶數(shù)據(jù)信息,包括:
根據(jù)需要提取的用戶的賬戶數(shù)據(jù)信息,設(shè)置提取表達(dá)式;
根據(jù)所述提取表達(dá)式,在所述信息流中查找與所述提取表達(dá)式匹配的元素,將與所述提取表達(dá)式具有同一祖先且具有識別特征的元素設(shè)為基準(zhǔn)點(diǎn);
在所述信息流中查找所述基準(zhǔn)點(diǎn)最近的祖先;
在所述祖先范圍內(nèi),通過CSS的選擇器查找與用戶的賬戶數(shù)據(jù)信息關(guān)聯(lián)的信息;
在查找到的信息中,通過正則表達(dá)式提取用戶的賬戶數(shù)據(jù)信息。
8.一種用戶收益數(shù)據(jù)獲取系統(tǒng),其特征在于,包括:
當(dāng)前數(shù)據(jù)采集模塊,用于獲取多個(gè)數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);
所述當(dāng)前數(shù)據(jù)采集模塊包括:
數(shù)據(jù)采集單元,用于通過多個(gè)分布式服務(wù)器獲取多個(gè)數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù);
沖突預(yù)警單元,用于判斷多個(gè)所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突;
數(shù)據(jù)校正單元,用于在多個(gè)所述數(shù)據(jù)源發(fā)布的數(shù)據(jù)是否存在沖突時(shí),根據(jù)每個(gè)數(shù)據(jù)源的權(quán)重,對數(shù)據(jù)源發(fā)布的數(shù)據(jù)進(jìn)行校正;
用戶信息管理模塊,用于獲取用戶的賬戶數(shù)據(jù)信息;
收益數(shù)據(jù)獲取模塊,用于根據(jù)所述用戶的賬戶數(shù)據(jù)信息和所述多個(gè)數(shù)據(jù)源發(fā)布的當(dāng)前數(shù)據(jù)得到用戶賬戶的當(dāng)前全部收益數(shù)據(jù)。
9.根據(jù)權(quán)利要求8所述的用戶收益數(shù)據(jù)獲取系統(tǒng),其特征在于,所述當(dāng)前數(shù)據(jù)采集模塊還包括權(quán)重調(diào)整單元,所述權(quán)重調(diào)整單元用于根據(jù)所述校正結(jié)果,調(diào)整每個(gè)數(shù)據(jù)源的權(quán)重。
10.根據(jù)權(quán)利要求8所述的用戶收益數(shù)據(jù)獲取系統(tǒng),其特征在于,所述權(quán)重調(diào)整單元包括:
初值設(shè)置子單元,用于獲取預(yù)設(shè)的每個(gè)數(shù)據(jù)源的初始權(quán)重;
分組計(jì)算子單元,用于將多個(gè)數(shù)據(jù)源根據(jù)發(fā)布的數(shù)據(jù)分組,將每一組對應(yīng)的數(shù)據(jù)源的權(quán)重相加;
校正子單元,用于將相加后權(quán)重最大的一組數(shù)據(jù)設(shè)置為最終數(shù)據(jù)。
11.根據(jù)權(quán)利要求9所述的用戶收益數(shù)據(jù)獲取系統(tǒng),其特征在于,所述權(quán)重調(diào)整單元進(jìn)一步用于:若數(shù)據(jù)源獲取的數(shù)據(jù)被設(shè)置為最終數(shù)據(jù),則增加該數(shù)據(jù)源的權(quán)重;若數(shù)據(jù)源獲取的數(shù)據(jù)沒有被設(shè)置為最終數(shù)據(jù),則減小該數(shù)據(jù)源的權(quán)重。
12.根據(jù)權(quán)利要求8所述的用戶收益數(shù)據(jù)獲取系統(tǒng),其特征在于,所述數(shù)據(jù)采集單元包括:
原始數(shù)據(jù)獲取子單元,用于通過多個(gè)分布式服務(wù)器從多個(gè)預(yù)設(shè)的數(shù)據(jù)源獲取當(dāng)前的原始數(shù)據(jù);
清洗子單元,用于刪除所述原始數(shù)據(jù)中與賬戶數(shù)據(jù)信息無關(guān)的數(shù)據(jù)。
13.根據(jù)權(quán)利要求8所述的用戶收益數(shù)據(jù)獲取系統(tǒng),其特征在于,所述用戶信息管理模塊包括:信息解析單元,用于獲取用戶客戶端關(guān)聯(lián)的信息流,根據(jù)所述信息流獲取用戶的賬戶數(shù)據(jù)信息,所述賬戶數(shù)據(jù)信息包括短信賬單和郵件賬單。
14.根據(jù)權(quán)利要求13所述的用戶收益數(shù)據(jù)獲取系統(tǒng),其特征在于,所述信息解析單元包括:
表達(dá)式設(shè)置子單元,用于根據(jù)需要提取的用戶的賬戶數(shù)據(jù)信息,設(shè)置提取表達(dá)式;
基準(zhǔn)點(diǎn)設(shè)置子單元,用于根據(jù)所述提取表達(dá)式,在所述信息流中查找與所述提取表達(dá)式匹配的元素,將與所述提取表達(dá)式具有同一祖先且具有識別特征的元素設(shè)為基準(zhǔn)點(diǎn);
祖先查找子單元,用于在所述信息流中查找所述基準(zhǔn)點(diǎn)最近的祖先;
逼近子單元,用于在所述祖先范圍內(nèi),通過CSS的選擇器查找與用戶的賬戶數(shù)據(jù)信息關(guān)聯(lián)的信息;
提取子單元,用于在查找到的信息中,通過正則表達(dá)式提取用戶的賬戶數(shù)據(jù)信息。