1.一種數(shù)據(jù)采集監(jiān)控方法,其特征在于,包括:
獲取第一類型的從屬服務器上報的心跳數(shù)據(jù),所述心跳數(shù)據(jù)包括所述第一類型的從屬服務器應當采集的文件的數(shù)據(jù)量信息以及所述文件已采集完成的數(shù)據(jù)量信息;
根據(jù)所述第一類型的從屬服務器應當采集的文件的數(shù)據(jù)量信息以及所述文件已采集完成的數(shù)據(jù)量信息判斷所述第一類型的從屬服務器對于所述文件的采集過程是否發(fā)生故障,得到第一判斷結(jié)果;
當所述第一判斷結(jié)果表示所述第一類型的從屬服務器對于所述文件的采集過程發(fā)生故障時,定位所述故障在所述文件中的位置為所述文件已采集完成的最后一個數(shù)據(jù)之后的數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述第一類型的從屬服務器應當采集的文件的數(shù)據(jù)量信息以及所述文件已采集完成的數(shù)據(jù)量信息判斷所述第一類型的從屬服務器對于所述文件的采集過程是否發(fā)生故障,包括:
當達到預設采集時間閾值時,所述文件已采集完成的數(shù)據(jù)量信息小于所述第一類型的從屬服務器應當采集的文件的數(shù)據(jù)量信息,則判斷所述第一類型的從屬服務器對于所述文件的采集過程發(fā)生故障。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述方法還包括:
獲取所述第一類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間;
判斷在所述第一類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間開始的預設時間閾值內(nèi),是否接收到所述第一類型的從屬服務器上報的注銷請求或所述第一類型的從屬服務器上報的心跳數(shù)據(jù);
當在所述第一類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間開始的預設時間閾值內(nèi),未接收到所述第一類型的從屬服務器上報的注銷請求且未接收到所述第一類型的從屬服務器上報的心跳數(shù)據(jù),則確定所述第一類型的從屬服務器處于異常狀態(tài)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法還包括:
獲取所述第二類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間;
判斷在所述第二類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間開始的預設時間閾值內(nèi),是否接收到所述第二類型的從屬服務器上報的注銷請求或所述第二類型的從屬服務器上報的心跳數(shù)據(jù);
當在所述第二類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間開始的預設時間閾值內(nèi),未接收到所述第一類型的從屬服務器上報的注銷請求且未接收到所述第二類型的從屬服務器上報的心跳數(shù)據(jù),則確定所述第二類型的從屬服務器處于異常狀態(tài)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括:
獲取所述第一類型的從屬服務器上報的第一采集數(shù)據(jù)條數(shù);
獲取所述第二類型的從屬服務器上報的第二采集數(shù)據(jù)條數(shù);
根據(jù)所述第一采集數(shù)據(jù)條數(shù)以及所述第二采集數(shù)據(jù)條數(shù)判斷所述第二類型的從屬服務器的數(shù)據(jù)持久化存儲操作是否發(fā)生故障,得到第二判斷結(jié)果;
當所述第二判斷結(jié)果表示所述第二類型的從屬服務器的數(shù)據(jù)持久化存儲操作發(fā)生故障時,進行報警。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述第一采集數(shù)據(jù)條數(shù)以及所述第二采集數(shù)據(jù)條數(shù)判斷所述第二類型的從屬服務器的數(shù)據(jù)持久化存儲操作是否發(fā)生故障,包括:
當所述第一采集數(shù)據(jù)條數(shù)與所述第二采集數(shù)據(jù)條數(shù)不相等時,則判斷所述第二類型的從屬服務器的數(shù)據(jù)持久化存儲操作發(fā)生故障。
7.一種數(shù)據(jù)采集監(jiān)控裝置,其特征在于,包括:
第一獲取模塊,用于獲取第一類型的從屬服務器上報的心跳數(shù)據(jù),所述心跳數(shù)據(jù)包括所述第一類型的從屬服務器應當采集的文件的數(shù)據(jù)量信息以及所述文件已采集完成的數(shù)據(jù)量信息;
第一判斷模塊,用于根據(jù)所述第一類型的從屬服務器應當采集的文件的數(shù)據(jù)量信息以及所述文件已采集完成的數(shù)據(jù)量信息判斷所述第一類型的從屬服務器對于所述文件的采集過程是否發(fā)生故障,得到第一判斷結(jié)果;
故障定位模塊,用于當所述第一判斷結(jié)果表示所述第一類型的從屬服務器對于所述文件的采集過程發(fā)生故障時,定位所述故障在所述文件中的位置為所述文件已采集完成的最后一個數(shù)據(jù)之后的數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第一判斷模塊具體用于:
當達到預設采集時間閾值時,所述文件已采集完成的數(shù)據(jù)量信息小于所述第一類型的從屬服務器應當采集的文件的數(shù)據(jù)量信息,則判斷所述第一類型的從屬服務器對于所述文件的采集過程發(fā)生故障。
9.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述裝置還包括:
第二獲取模塊,用于獲取所述第一類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間;
第二判斷模塊,用于判斷在所述第一類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間開始的預設時間閾值內(nèi),是否接收到所述第一類型的從屬服務器上報的注銷請求或所述第一類型的從屬服務器上報的心跳數(shù)據(jù);
第一狀態(tài)確定模塊,用于當在所述第一類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間開始的預設時間閾值內(nèi),未接收到所述第一類型的從屬服務器上報的注銷請求且未接收到所述第一類型的從屬服務器上報的心跳數(shù)據(jù),則確定所述第一類型的從屬服務器處于異常狀態(tài)。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括:
第三獲取模塊,用于獲取所述第二類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間;
第三判斷模塊,用于判斷在所述第二類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間開始的預設時間閾值內(nèi),是否接收到所述第二類型的從屬服務器上報的注銷請求或所述第二類型的從屬服務器上報的心跳數(shù)據(jù);
第二狀態(tài)確定模塊,用于當在所述第二類型的從屬服務器最后一次上報心跳數(shù)據(jù)的時間開始的預設時間閾值內(nèi),未接收到所述第一類型的從屬服務器上報的注銷請求且未接收到所述第二類型的從屬服務器上報的心跳數(shù)據(jù),則確定所述第二類型的從屬服務器處于異常狀態(tài)。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述裝置還包括:
第四獲取模塊,用于獲取所述第一類型的從屬服務器上報的第一采集數(shù)據(jù)條數(shù),以及,獲取所述第二類型的從屬服務器上報的第二采集數(shù)據(jù)條數(shù);
第四判斷模塊,用于根據(jù)所述第一采集數(shù)據(jù)條數(shù)以及所述第二采集數(shù)據(jù)條數(shù)判斷所述第二類型的從屬服務器的數(shù)據(jù)持久化存儲操作是否發(fā)生故障,得到第二判斷結(jié)果;
報警模塊,用于當所述第二判斷結(jié)果表示所述第二類型的從屬服務器的數(shù)據(jù)持久化存儲操作發(fā)生故障時,進行報警。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述第四判斷模塊具體用于:
當所述第一采集數(shù)據(jù)條數(shù)與所述第二采集數(shù)據(jù)條數(shù)不相等時,則判斷所述第二類型的從屬服務器的數(shù)據(jù)持久化存儲操作發(fā)生故障。