本發(fā)明涉及分布式計(jì)算技術(shù)領(lǐng)域,特別是涉及一種數(shù)據(jù)處理方法及裝置。
背景技術(shù):
在信息爆炸的時(shí)代中,用戶(hù)可獲得的數(shù)據(jù)量呈指數(shù)增長(zhǎng)的趨勢(shì)。當(dāng)對(duì)數(shù)據(jù)庫(kù)系統(tǒng)中已存儲(chǔ)的數(shù)據(jù)記錄進(jìn)行處理時(shí)所需要的計(jì)算資源也隨之增大,這對(duì)數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù)處理服務(wù)器的計(jì)算性能提出了更高的要求。在基于傳統(tǒng)的集中式數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)系統(tǒng)(簡(jiǎn)稱(chēng)為集中式數(shù)據(jù)庫(kù)系統(tǒng))中,數(shù)據(jù)處理服務(wù)器通常是由單臺(tái)計(jì)算機(jī)構(gòu)成的,隨著數(shù)據(jù)量的迅猛增長(zhǎng),單臺(tái)計(jì)算機(jī)的性能有限,通過(guò)提高單臺(tái)計(jì)算機(jī)計(jì)算能力的方式已經(jīng)很難滿(mǎn)足用戶(hù)的數(shù)據(jù)處理需要。
現(xiàn)有技術(shù)中提供了這樣一種數(shù)據(jù)處理方法,該方法應(yīng)用于基于存儲(chǔ)服務(wù)器的數(shù)據(jù)庫(kù)系統(tǒng)(簡(jiǎn)稱(chēng)為分布式數(shù)據(jù)處理系統(tǒng)),該分布式數(shù)據(jù)處理系統(tǒng)包括存儲(chǔ)服務(wù)器、一個(gè)管理服務(wù)器和多個(gè)數(shù)據(jù)處理服務(wù)器,該數(shù)據(jù)庫(kù)被劃分為多個(gè)數(shù)據(jù)片段,各個(gè)數(shù)據(jù)片段中存儲(chǔ)有多條數(shù)據(jù)記錄,進(jìn)行數(shù)據(jù)處理時(shí),首先,管理服務(wù)器獲得針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)處理指令,根據(jù)該系統(tǒng)中數(shù)據(jù)片段的數(shù)量將已存儲(chǔ)的數(shù)據(jù)記錄劃分成多個(gè)數(shù)據(jù)處理任務(wù),然后將劃分得到的各個(gè)數(shù)據(jù)處理任務(wù)均勻地分發(fā)給各個(gè)數(shù)據(jù)處理服務(wù)器,各個(gè)數(shù)據(jù)處理服務(wù)器在接收到相應(yīng)的數(shù)據(jù)處理任務(wù)后對(duì)數(shù)據(jù)處理任務(wù)包含的數(shù)據(jù)記錄進(jìn)行數(shù)據(jù)處理并將處理結(jié)果反饋至管理服務(wù)器,完成數(shù)據(jù)處理。
相比集中式數(shù)據(jù)庫(kù)系統(tǒng)而言,分布式數(shù)據(jù)處理系統(tǒng)減少了單臺(tái)計(jì)算機(jī)需要處理的數(shù)據(jù)量,因此降低了對(duì)單臺(tái)計(jì)算機(jī)的計(jì)算性能的要求。但是,由于劃分?jǐn)?shù)據(jù)處理任務(wù)時(shí)是根據(jù)數(shù)據(jù)片段的數(shù)量劃分的,而每一數(shù)據(jù)片段內(nèi)所包含的數(shù)據(jù)記錄的數(shù)量不一定相等,所以,劃分得到的各個(gè)數(shù)據(jù)處理任務(wù)中包括的數(shù)據(jù)記錄的數(shù)量不一定相同,可見(jiàn)根據(jù)數(shù)據(jù)片段的數(shù)量劃分?jǐn)?shù)據(jù)處理任務(wù)并向處理服務(wù)器分配數(shù)據(jù)處理任務(wù)時(shí),易造成各個(gè)數(shù)據(jù)處理服務(wù)器所要執(zhí)行任務(wù)的任務(wù)量不均衡,例如,對(duì)于具有相同的計(jì)算性能的數(shù)據(jù)處理服務(wù)器而言,有的數(shù)據(jù)處理服務(wù)器的任務(wù)量很大,而有的數(shù)據(jù)處理服務(wù)器的任務(wù)量甚至幾乎為零,顯 然,各個(gè)數(shù)據(jù)處理服務(wù)器所分配到的數(shù)據(jù)處理任務(wù)是不均衡的,進(jìn)一步的,這種不均衡現(xiàn)象還會(huì)降低該分布式數(shù)據(jù)處理系統(tǒng)的整體處理速度。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例的目的在于提供一種數(shù)據(jù)處理方法及裝置,以實(shí)現(xiàn)將分布式數(shù)據(jù)處理系統(tǒng)的數(shù)據(jù)庫(kù)中的數(shù)據(jù)記錄均衡地分配給該系統(tǒng)中的各個(gè)數(shù)據(jù)處理服務(wù)器,提高分布式數(shù)據(jù)處理系統(tǒng)中數(shù)據(jù)處理服務(wù)器的并行處理速度,從而提高分布式數(shù)據(jù)處理系統(tǒng)的整體處理性能。
為達(dá)到上述目的,本發(fā)明實(shí)施例公開(kāi)了一種數(shù)據(jù)處理方法,應(yīng)用于分布式數(shù)據(jù)處理系統(tǒng)中的客戶(hù)端;其中,所述分布式數(shù)據(jù)處理系統(tǒng)包括:客戶(hù)端、任務(wù)調(diào)度器、多個(gè)數(shù)據(jù)處理服務(wù)器和多個(gè)存儲(chǔ)服務(wù)器;所述存儲(chǔ)服務(wù)器中存儲(chǔ)有多個(gè)數(shù)據(jù)片段,各個(gè)數(shù)據(jù)片段中存儲(chǔ)有多條數(shù)據(jù)記錄,所述方法包括:
接收針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)處理指令;
根據(jù)所述數(shù)據(jù)處理指令,確定有效數(shù)據(jù)片段;其中,所述有效數(shù)據(jù)片段為針對(duì)所述待處理數(shù)據(jù)的數(shù)據(jù)片段;
獲得所述有效數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息;其中,所述數(shù)據(jù)分布信息為:按照預(yù)設(shè)的統(tǒng)計(jì)規(guī)則對(duì)每個(gè)數(shù)據(jù)片段中的數(shù)據(jù)記錄的數(shù)量進(jìn)行統(tǒng)計(jì)得到的信息;
根據(jù)所獲得的數(shù)據(jù)分布信息,將每個(gè)有效數(shù)據(jù)片段的數(shù)據(jù)范圍劃分成至少一個(gè)子數(shù)據(jù)范圍;
按照劃分得到的各個(gè)子數(shù)據(jù)范圍,生成針對(duì)每個(gè)有效數(shù)據(jù)片段的數(shù)據(jù)處理任務(wù);其中,一個(gè)數(shù)據(jù)處理任務(wù)對(duì)應(yīng)一個(gè)有效數(shù)據(jù)片段的一個(gè)子數(shù)據(jù)范圍;
向所述任務(wù)調(diào)度器發(fā)送針對(duì)所述數(shù)據(jù)處理任務(wù)的數(shù)據(jù)處理請(qǐng)求,以使得所述任務(wù)調(diào)度器根據(jù)所述數(shù)據(jù)處理請(qǐng)求確定執(zhí)行每一數(shù)據(jù)處理任務(wù)的數(shù)據(jù)處理服務(wù)器,其中,所述任務(wù)調(diào)度器確定數(shù)據(jù)處理服務(wù)器后,向所確定的數(shù)據(jù)處理服務(wù)器發(fā)送其要處理的數(shù)據(jù)處理任務(wù),并接收所確定的各個(gè)數(shù)據(jù)處理服務(wù)器針對(duì)所分配的子數(shù)據(jù)范圍進(jìn)行數(shù)據(jù)處理的處理結(jié)果;
接收所述任務(wù)調(diào)度器反饋的針對(duì)待處理數(shù)據(jù)的處理結(jié)果。
較佳的,所述存儲(chǔ)服務(wù)器根據(jù)以下步驟統(tǒng)計(jì)得到所述各個(gè)數(shù)據(jù)片段中任一數(shù)據(jù)片段ri中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息:
所述存儲(chǔ)服務(wù)器將所述數(shù)據(jù)片段ri內(nèi)的各條數(shù)據(jù)記錄按照預(yù)設(shè)的標(biāo)識(shí)值排序;
按照排序后所述數(shù)據(jù)片段ri中的數(shù)據(jù)記錄的排列順序,將排序后的所述數(shù)據(jù)片段ri劃分成至少一個(gè)數(shù)據(jù)區(qū)間;
統(tǒng)計(jì)劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量;
根據(jù)統(tǒng)計(jì)得到的數(shù)量獲得所述數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息。
較佳的,所述根據(jù)統(tǒng)計(jì)得到的數(shù)量獲得所述數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息,包括:
計(jì)算所述數(shù)據(jù)片段ri的數(shù)據(jù)記錄的數(shù)量的方差;
判斷所述方差是否大于預(yù)設(shè)的數(shù)據(jù)片段方差閾值;
如果是,判斷是否滿(mǎn)足以下表達(dá)式:num≥th1,或,num≤th2,如果滿(mǎn)足則統(tǒng)計(jì)所述數(shù)據(jù)片段ri劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,并按照統(tǒng)計(jì)后的數(shù)量更新所述數(shù)據(jù)分布信息;其中,num表示數(shù)據(jù)片段ri劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,th1表示預(yù)設(shè)的第一數(shù)量閾值,th2表示預(yù)設(shè)的第二數(shù)量閾值,且th1≥th2;
如果否,則保持當(dāng)前的數(shù)據(jù)分布信息。
較佳的,所述根據(jù)統(tǒng)計(jì)得到的數(shù)量獲得所述數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息,包括:
判斷所述數(shù)據(jù)片段ri的數(shù)據(jù)記錄的數(shù)量是否滿(mǎn)足預(yù)設(shè)的數(shù)據(jù)區(qū)間調(diào)整條件;
若滿(mǎn)足,按照預(yù)設(shè)的區(qū)間調(diào)整規(guī)則對(duì)所述數(shù)據(jù)片段ri中各個(gè)數(shù)據(jù)區(qū)間進(jìn)行調(diào)整,并根據(jù)調(diào)整后各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,獲得所述數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息;
其中,所述預(yù)設(shè)的區(qū)間調(diào)整規(guī)則,包括:
獲得統(tǒng)計(jì)得到的所述數(shù)據(jù)片段ri中數(shù)據(jù)記錄的數(shù)量大于預(yù)設(shè)的第一數(shù)量閾值th3的數(shù)據(jù)區(qū)間;
按照預(yù)設(shè)的數(shù)據(jù)區(qū)間拆分規(guī)則,將數(shù)據(jù)記錄的數(shù)量大于th3的數(shù)據(jù)區(qū)間分別拆分為多個(gè)子數(shù)據(jù)區(qū)間。
較佳的,所述預(yù)設(shè)的區(qū)間調(diào)整規(guī)則,還包括:
獲得統(tǒng)計(jì)得到的所述數(shù)據(jù)片段ri中數(shù)據(jù)記錄的數(shù)量小于預(yù)設(shè)的第二數(shù)量閾值th2的數(shù)據(jù)區(qū)間;
按照預(yù)設(shè)的數(shù)據(jù)區(qū)間合并規(guī)則,對(duì)數(shù)據(jù)記錄的數(shù)量小于th2的數(shù)據(jù)區(qū)間進(jìn)行合并處理。
較佳的,所述存儲(chǔ)服務(wù)器判斷所述數(shù)據(jù)片段ri的數(shù)據(jù)記錄的數(shù)量是否滿(mǎn)足預(yù)設(shè)的數(shù)據(jù)區(qū)間處理?xiàng)l件,包括:
計(jì)算統(tǒng)計(jì)得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量的方差;
判斷計(jì)算得到的方差是否大于預(yù)設(shè)的方差閾值;
在判斷結(jié)果為大于時(shí),判定統(tǒng)計(jì)得到的各個(gè)數(shù)據(jù)區(qū)間的數(shù)據(jù)記錄的數(shù)量滿(mǎn)足預(yù)設(shè)的數(shù)據(jù)區(qū)間處理?xiàng)l件。
較佳的,在所述客戶(hù)端中已存儲(chǔ)所述各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息的情況下,所述方法還包括:
接收所述存儲(chǔ)服務(wù)器發(fā)送的數(shù)據(jù)更新通知;
根據(jù)所述數(shù)據(jù)更新通知,更新本地已存儲(chǔ)的數(shù)據(jù)分布信息。
為達(dá)到上述目的,本發(fā)明實(shí)施例公開(kāi)了一種數(shù)據(jù)處理裝置,應(yīng)用于分布式數(shù)據(jù)處理系統(tǒng)中的客戶(hù)端;其中,所述分布式數(shù)據(jù)處理系統(tǒng)包括:客戶(hù)端、任務(wù)調(diào)度器、多個(gè)數(shù)據(jù)處理服務(wù)器和多個(gè)存儲(chǔ)服務(wù)器;所述存儲(chǔ)服務(wù)器中存儲(chǔ)有多個(gè)數(shù)據(jù)片段,各個(gè)數(shù)據(jù)片段中存儲(chǔ)有多條數(shù)據(jù)記錄,所述裝置包括:
處理指令接收模塊,用于接收針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)處理指令;
有效數(shù)據(jù)確定模塊,用于根據(jù)所述數(shù)據(jù)處理指令,確定有效數(shù)據(jù)片段;其中,所述有效數(shù)據(jù)片段為針對(duì)所述待處理數(shù)據(jù)的數(shù)據(jù)片段;
分布信息獲得模塊,用于獲得所述有效數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息;其中,所述數(shù)據(jù)分布信息為:按照預(yù)設(shè)的統(tǒng)計(jì)規(guī)則對(duì)每個(gè)數(shù)據(jù)片段中的數(shù)據(jù)記錄的數(shù)量進(jìn)行統(tǒng)計(jì)得到的信息;
數(shù)據(jù)范圍劃分模塊,用于根據(jù)所獲得的數(shù)據(jù)分布信息,將每個(gè)有效數(shù)據(jù)片段的數(shù)據(jù)范圍劃分成至少一個(gè)子數(shù)據(jù)范圍;
任務(wù)生成模塊,用于按照劃分得到的各個(gè)子數(shù)據(jù)范圍,生成針對(duì)每個(gè)有效數(shù)據(jù)片段的數(shù)據(jù)處理任務(wù);其中,一個(gè)數(shù)據(jù)處理任務(wù)對(duì)應(yīng)一個(gè)有效數(shù)據(jù)片段的一個(gè)子數(shù)據(jù)范圍;
處理請(qǐng)求發(fā)送模塊,用于向所述任務(wù)調(diào)度器發(fā)送針對(duì)所述數(shù)據(jù)處理任務(wù)的數(shù)據(jù)處理請(qǐng)求,以使得所述任務(wù)調(diào)度器根據(jù)所述數(shù)據(jù)處理請(qǐng)求確定執(zhí)行每一數(shù)據(jù)處理任務(wù)的數(shù)據(jù)處理服務(wù)器,其中,所述任務(wù)調(diào)度器確定數(shù)據(jù)處理服務(wù)器后,向所確定的數(shù)據(jù)處理服務(wù)器發(fā)送其要處理的數(shù)據(jù)處理任務(wù),并接收所確定的各個(gè)數(shù)據(jù)處理服務(wù)器針對(duì)所分配的子數(shù)據(jù)范圍進(jìn)行數(shù)據(jù)處理的處理結(jié)果;
處理結(jié)果接收模塊,用于接收所述任務(wù)調(diào)度器反饋的針對(duì)待處理數(shù)據(jù)的處理結(jié)果。
較佳的,所述存儲(chǔ)服務(wù)器,包括:數(shù)據(jù)排序子模塊、區(qū)塊劃分子模塊、數(shù)據(jù)統(tǒng)計(jì)子模塊和分布信息獲得子模塊;其中,
所述數(shù)據(jù)排序子模塊,用于所述存儲(chǔ)服務(wù)器將所述數(shù)據(jù)片段ri內(nèi)的各條數(shù)據(jù)記錄按照預(yù)設(shè)的標(biāo)識(shí)值排序;
所述區(qū)間劃分子模塊,用于按照排序后所述數(shù)據(jù)片段ri中的數(shù)據(jù)記錄的排列順序,將排序后的所述數(shù)據(jù)片段ri劃分成至少一個(gè)數(shù)據(jù)區(qū)間;
所述數(shù)據(jù)統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量;
所述分布信息獲得子模塊,用于根據(jù)統(tǒng)計(jì)得到的數(shù)量獲得所述數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息。
較佳的,所述分布信息獲得子模塊,包括:片段方差計(jì)算單元、方差判斷單元、第一信息統(tǒng)計(jì)單元和第二信息統(tǒng)計(jì)單元;其中,
所述片段方差計(jì)算單元,用于計(jì)算所述數(shù)據(jù)片段ri的數(shù)據(jù)記錄的數(shù)量的方差;
所述片段方差判斷單元,用于判斷所述方差是否大于預(yù)設(shè)的數(shù)據(jù)片段方差閾值;
所述第一信息統(tǒng)計(jì)單元,用于在所述方差判斷單元的判斷結(jié)果為是時(shí),判斷是否滿(mǎn)足以下表達(dá)式:num≥th1,或,num≤th2,如果滿(mǎn)足則統(tǒng)計(jì)所述數(shù)據(jù)片段ri劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,并按照統(tǒng)計(jì)后的數(shù)量更新所述數(shù)據(jù)分布信息;其中,num表示數(shù)據(jù)片段ri劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,th1表示預(yù)設(shè)的第一數(shù)量閾值,th2表示預(yù)設(shè)的第二數(shù)量閾值,且th1≥th2;
所述第二信息統(tǒng)計(jì)單元,用于在所述方差判斷單元的判斷結(jié)果為是時(shí),則保持當(dāng)前的數(shù)據(jù)分布信息。
較佳的,所述分布信息獲得子模塊,包括:調(diào)整條件判斷單元和第一區(qū)間調(diào)整單元;其中,
所述調(diào)整條件判斷單元,用于判斷所述數(shù)據(jù)片段ri的數(shù)據(jù)記錄的數(shù)量是否滿(mǎn)足預(yù)設(shè)的數(shù)據(jù)區(qū)間調(diào)整條件;
所述第一區(qū)間調(diào)整單元,用于在所述調(diào)整條件判斷單元的判斷結(jié)果為滿(mǎn)足時(shí),按照預(yù)設(shè)的區(qū)間調(diào)整規(guī)則對(duì)所述數(shù)據(jù)片段ri中各個(gè)數(shù)據(jù)區(qū)間進(jìn)行調(diào)整,并根據(jù)調(diào)整后各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,獲得所述數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息;
其中,所述預(yù)設(shè)的區(qū)間調(diào)整規(guī)則,包括:
獲得統(tǒng)計(jì)得到的所述數(shù)據(jù)片段ri中數(shù)據(jù)記錄的數(shù)量大于預(yù)設(shè)的第一數(shù)量閾值th3的數(shù)據(jù)區(qū)間;
按照預(yù)設(shè)的數(shù)據(jù)區(qū)間拆分規(guī)則,將數(shù)據(jù)記錄的數(shù)量大于th3的數(shù)據(jù)區(qū)間分別拆分為多個(gè)子數(shù)據(jù)區(qū)間。
較佳的,所述預(yù)設(shè)的區(qū)間調(diào)整規(guī)則,還包括:
獲得統(tǒng)計(jì)得到的所述數(shù)據(jù)片段ri中數(shù)據(jù)記錄的數(shù)量小于預(yù)設(shè)的第二數(shù)量 閾值th2的數(shù)據(jù)區(qū)間;
按照預(yù)設(shè)的數(shù)據(jù)區(qū)間合并規(guī)則,對(duì)數(shù)據(jù)記錄的數(shù)量小于th2的數(shù)據(jù)區(qū)間進(jìn)行合并處理。
較佳的,所述調(diào)整條件判斷單元,包括:區(qū)間方差計(jì)算子單元、方差判斷子單元和處理?xiàng)l件判定子單元;其中,
區(qū)間方差計(jì)算子單元,用于計(jì)算統(tǒng)計(jì)得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量的方差;
區(qū)間方差判斷子單元,用于判斷計(jì)算得到的方差是否大于預(yù)設(shè)的方差閾值;
處理?xiàng)l件判定子單元,用于在所述區(qū)間方差判斷子單元的判斷結(jié)果為大于時(shí),判定統(tǒng)計(jì)得到的各個(gè)數(shù)據(jù)區(qū)間的數(shù)據(jù)記錄的數(shù)量滿(mǎn)足預(yù)設(shè)的數(shù)據(jù)區(qū)間處理?xiàng)l件。
較佳的,所述裝置還包括:
數(shù)據(jù)更新通知接收模塊,用于在所述客戶(hù)端中已存儲(chǔ)所述各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息的情況下,接收所述存儲(chǔ)服務(wù)器發(fā)送的數(shù)據(jù)更新通知;
數(shù)據(jù)分布信息更新模塊,用于根據(jù)所述數(shù)據(jù)更新通知,更新本地已存儲(chǔ)的數(shù)據(jù)分布信息。
由以上可見(jiàn),在本發(fā)明實(shí)施例提供的技術(shù)方案中,客戶(hù)端首先接收針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)處理指令,并根據(jù)該數(shù)據(jù)處理指令,確定有效數(shù)據(jù)片段;然后,獲得有效數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息,根據(jù)該數(shù)據(jù)分布信息,將每個(gè)有效數(shù)據(jù)片段的數(shù)據(jù)范圍劃分成至少一個(gè)子數(shù)據(jù)范圍;客戶(hù)端按照劃分得到的各個(gè)子數(shù)據(jù)范圍,生成針對(duì)每個(gè)有效數(shù)據(jù)片段的數(shù)據(jù)處理任務(wù),并向任務(wù)調(diào)度器發(fā)送針對(duì)數(shù)據(jù)處理任務(wù)的數(shù)據(jù)處理請(qǐng)求,以使得任務(wù)調(diào)度器根據(jù)該請(qǐng)求確定執(zhí)行每一數(shù)據(jù)處理任務(wù)的數(shù)據(jù)處理服務(wù)器,其中,任務(wù)調(diào)度器確定數(shù)據(jù)處理服務(wù)器后,向所確定的數(shù)據(jù)處理服務(wù)器發(fā)送其要處理的數(shù)據(jù)處理任務(wù),并接收所確定的各個(gè)數(shù)據(jù)處理服務(wù)器針對(duì)所分配的子數(shù)據(jù)范圍進(jìn)行數(shù)據(jù)處理的處理結(jié)果;接收任務(wù)調(diào)度器反饋的針對(duì)待處理數(shù)據(jù)的處理結(jié)果。顯然,應(yīng) 用本發(fā)明實(shí)施例提供的方案進(jìn)行數(shù)據(jù)處理時(shí),各個(gè)數(shù)據(jù)處理服務(wù)器所分配的數(shù)據(jù)處理任務(wù)是根據(jù)各個(gè)數(shù)據(jù)片段中的數(shù)據(jù)記錄的數(shù)量分配的,避免了各個(gè)數(shù)據(jù)處理服務(wù)器所分配到的數(shù)據(jù)處理任務(wù)不均衡的問(wèn)題,提高了分布式數(shù)據(jù)處理系統(tǒng)中數(shù)據(jù)處理服務(wù)器的并行處理速度,從而提高了分布式數(shù)據(jù)處理系統(tǒng)的整體處理性能。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1a為本發(fā)明實(shí)施例提供的一種分布式數(shù)據(jù)處理系統(tǒng)的架構(gòu)示意圖;
圖1b為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法的流程示意圖;
圖1c為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)片段內(nèi)各個(gè)數(shù)據(jù)區(qū)間的分布直方圖;
圖1d為本發(fā)明實(shí)施例提供的對(duì)圖1c進(jìn)行拆分處理后各個(gè)數(shù)據(jù)區(qū)間的分布直方圖;
圖1e為本發(fā)明實(shí)施例提供的另一種數(shù)據(jù)片段內(nèi)各個(gè)數(shù)據(jù)區(qū)間的分布直方圖;
圖1f為本發(fā)明實(shí)施例提供的對(duì)圖1e進(jìn)行合并處理后各個(gè)數(shù)據(jù)區(qū)間的分布直方圖;
圖1g為本發(fā)明實(shí)施例提供的一種任務(wù)分配示意圖;
圖2為本發(fā)明實(shí)施例提供的另一種數(shù)據(jù)處理方法的流程示意圖;
圖3為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖;
圖4為本發(fā)明實(shí)施例提供的另一種數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是 全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
首先,對(duì)本發(fā)明實(shí)施例的應(yīng)用場(chǎng)景進(jìn)行下簡(jiǎn)單介紹:本發(fā)明實(shí)施例應(yīng)用于如圖1a所示的分布式數(shù)據(jù)處理系統(tǒng)中的客戶(hù)端101,圖1a為本發(fā)明實(shí)施例提供的一種分布式數(shù)據(jù)處理系統(tǒng)的架構(gòu)示意圖,具體的,圖1a所示的分布式數(shù)據(jù)處理系統(tǒng)中包括:客戶(hù)端101、任務(wù)調(diào)度器102、多個(gè)數(shù)據(jù)處理服務(wù)器103和多個(gè)存儲(chǔ)服務(wù)器104;存儲(chǔ)服務(wù)器104存儲(chǔ)有多個(gè)數(shù)據(jù)片段,各個(gè)數(shù)據(jù)片段中存儲(chǔ)有多條數(shù)據(jù)記錄。
圖1b為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法的流程示意圖,該數(shù)據(jù)處理方法可以包括以下步驟:
步驟s101:接收針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)處理指令。
具體的,數(shù)據(jù)處理指令中可以攜帶針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)范圍,當(dāng)然也可以不攜帶該數(shù)據(jù)范圍,此時(shí)可默認(rèn)待處理數(shù)據(jù)的數(shù)據(jù)范圍為全部數(shù)據(jù)片段的數(shù)據(jù)范圍。當(dāng)然,本發(fā)明實(shí)施例不需要對(duì)數(shù)據(jù)處理指令中是否攜帶數(shù)據(jù)范圍以及所攜帶的數(shù)據(jù)范圍的大小進(jìn)行限定,本領(lǐng)域內(nèi)的技術(shù)人員需要根據(jù)實(shí)際應(yīng)用中的具體情況進(jìn)行合理的設(shè)置。
步驟s102:根據(jù)數(shù)據(jù)處理指令,確定有效數(shù)據(jù)片段。
其中,有效數(shù)據(jù)片段為針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)片段。
在本發(fā)明實(shí)施例的一種具體實(shí)現(xiàn)方式中,針對(duì)數(shù)據(jù)處理指令中攜帶有針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)范圍的情況,可以根據(jù)所攜帶的數(shù)據(jù)范圍來(lái)確定針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)片段,所確定的有效數(shù)據(jù)片段通常為多個(gè)數(shù)據(jù)片段中的若干個(gè)數(shù)據(jù)片段而非全部數(shù)據(jù)片段;然而,在本發(fā)明實(shí)施例的另一種具體實(shí)現(xiàn)方式中,數(shù)據(jù)處理指令中也可以不攜帶針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)范圍,此時(shí),默認(rèn)該數(shù)據(jù)處理指令攜帶的數(shù)據(jù)范圍為全部數(shù)據(jù)片段的范圍,因此,將全部數(shù)據(jù)片段確定為有效數(shù)據(jù)片段。需要說(shuō)明的是,本發(fā)明實(shí)施例不需要對(duì)數(shù)據(jù)片段的范圍的具體數(shù)值進(jìn)行限定,本領(lǐng)域內(nèi)的技術(shù)人員需要根據(jù)實(shí)際應(yīng)用中的具體情況進(jìn)行合理設(shè)置。
步驟s103:獲得有效數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息。
其中,上述提及的“數(shù)據(jù)分布信息”為:按照預(yù)設(shè)的統(tǒng)計(jì)規(guī)則對(duì)每個(gè)數(shù)據(jù)片段中的數(shù)據(jù)記錄的數(shù)量進(jìn)行統(tǒng)計(jì)得到的信息。
具體的,“預(yù)設(shè)的統(tǒng)計(jì)規(guī)則”可以是按照各個(gè)數(shù)據(jù)片段中的已存儲(chǔ)的數(shù)據(jù)記錄的鍵值進(jìn)行統(tǒng)計(jì)的規(guī)則,還可以是按照本領(lǐng)域內(nèi)的技術(shù)人員預(yù)先設(shè)定的數(shù)據(jù)記錄中其他字段進(jìn)行統(tǒng)計(jì)的統(tǒng)計(jì)規(guī)則。舉例而言,假設(shè)已存儲(chǔ)的數(shù)據(jù)記錄中的存儲(chǔ)的數(shù)據(jù)內(nèi)容為一個(gè)班級(jí)的學(xué)生的各科考試成績(jī)的數(shù)據(jù),其中,每條數(shù)據(jù)記錄均包括:姓名、學(xué)號(hào)、性別、科目等信息,那么,這個(gè)例子中的數(shù)據(jù)記錄的統(tǒng)計(jì)規(guī)則,可以是以姓氏的先后順序?yàn)榻y(tǒng)計(jì)依據(jù)的統(tǒng)計(jì)規(guī)則,還可以是以學(xué)號(hào)大小順序?yàn)榻y(tǒng)計(jì)依據(jù)的統(tǒng)計(jì)規(guī)則,等等。當(dāng)然,本發(fā)明實(shí)施例不需要對(duì)具體的統(tǒng)計(jì)規(guī)則進(jìn)行限定,任何可能的實(shí)現(xiàn)方式均可以應(yīng)用于本發(fā)明。
具體的,各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息,可以是客戶(hù)端向存儲(chǔ)服務(wù)器發(fā)送數(shù)據(jù)分布信息獲得請(qǐng)求獲得的,還可以是客戶(hù)端讀取其本地存儲(chǔ)的數(shù)據(jù)分布信息的相關(guān)數(shù)據(jù)獲得的。相比較而言,前一種方式能夠準(zhǔn)確地獲得各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息,但是,這種方式需要對(duì)各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)量進(jìn)行實(shí)時(shí)統(tǒng)計(jì),這是很占用硬件資源的。后一種方式能夠快速地獲得各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息,但是,這種方式獲得的數(shù)據(jù)分布信息可能會(huì)因?yàn)閷?duì)數(shù)據(jù)記錄的操作(例如,數(shù)據(jù)記錄的增加或刪除)而出現(xiàn)所獲得的數(shù)據(jù)分布信息與各個(gè)數(shù)據(jù)片段中的實(shí)際數(shù)量不一致的情況。
需要說(shuō)明的是,本發(fā)明實(shí)施例不需要對(duì)獲得各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息的具體方式進(jìn)行限定,本領(lǐng)域內(nèi)的工作人員需要根據(jù)實(shí)際應(yīng)用中的具體情況進(jìn)行合理的設(shè)置。
在本發(fā)明的一種具體實(shí)現(xiàn)方式中,可以根據(jù)以下步驟獲得各個(gè)數(shù)據(jù)片段中任一數(shù)據(jù)片段ri中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息:
(1)存儲(chǔ)服務(wù)器將數(shù)據(jù)片段ri內(nèi)的各條數(shù)據(jù)記錄按照預(yù)設(shè)的標(biāo)識(shí)值排序。
這里提及的“預(yù)設(shè)的標(biāo)識(shí)值”可以是存儲(chǔ)服務(wù)器中各個(gè)數(shù)據(jù)片段內(nèi)已存儲(chǔ)的數(shù)據(jù)記錄的鍵值。實(shí)際應(yīng)用中,存儲(chǔ)服務(wù)器中的每一條數(shù)據(jù)記錄一般包含多個(gè)字段,通常會(huì)選擇其中的一個(gè)字段作為數(shù)據(jù)記錄的鍵值。需要說(shuō)明的是,本發(fā)明實(shí)施例并不需要對(duì)預(yù)設(shè)的標(biāo)識(shí)值進(jìn)行限定,除了上述提到的用作鍵值的字 段外,還可以選擇其他字段來(lái)作為排序的依據(jù),本領(lǐng)域內(nèi)的技術(shù)人員需要根據(jù)實(shí)際應(yīng)用中的具體情況進(jìn)行合理的設(shè)置。
另外,步驟(1)可以按照數(shù)據(jù)片段ri內(nèi)的各條數(shù)據(jù)記錄的標(biāo)識(shí)值由大到小的順序進(jìn)行排列,也可以按照數(shù)據(jù)片段ri內(nèi)的各條數(shù)據(jù)記錄的標(biāo)識(shí)值由小到大的順序進(jìn)行排列排列,本發(fā)明實(shí)施例不需要對(duì)排列順序進(jìn)行限定。
(2)按照排序后數(shù)據(jù)片段ri中的數(shù)據(jù)記錄的排列順序,將排序后的數(shù)據(jù)片段ri劃分成至少一個(gè)數(shù)據(jù)區(qū)間。
需要說(shuō)明的是,當(dāng)數(shù)據(jù)片段ri中的數(shù)據(jù)記錄按照預(yù)設(shè)的標(biāo)識(shí)值(例如,按照數(shù)據(jù)記錄的鍵值)進(jìn)行排列后,根據(jù)該數(shù)據(jù)片段內(nèi)鍵值的取值范圍,將該數(shù)據(jù)片段劃分成至少一個(gè)數(shù)據(jù)區(qū)間,并將每個(gè)數(shù)據(jù)區(qū)間中鍵值的取值范圍確定為對(duì)應(yīng)數(shù)據(jù)區(qū)間的取值范圍。
舉例而言,假設(shè)數(shù)據(jù)片段ri內(nèi)鍵值的取值范圍為1-100,根據(jù)預(yù)設(shè)的數(shù)據(jù)區(qū)間劃分規(guī)則,可以將數(shù)據(jù)片段ri劃分為四個(gè)數(shù)據(jù)區(qū)間,且這四個(gè)數(shù)據(jù)區(qū)間的取值范圍分別為:1-25、26-50、51-75和76-100。
當(dāng)然,本發(fā)明實(shí)施例并不需要對(duì)數(shù)據(jù)片段內(nèi)所劃分的數(shù)據(jù)區(qū)間的數(shù)量進(jìn)行限定,本領(lǐng)域內(nèi)的技術(shù)人員需要根據(jù)實(shí)際應(yīng)用中的具體情況進(jìn)行合理的設(shè)置。
(3)統(tǒng)計(jì)劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量。
(4)根據(jù)統(tǒng)計(jì)得到的數(shù)量獲得數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息。
需要說(shuō)明的是,這種數(shù)據(jù)分布信息的統(tǒng)計(jì)方式,需要對(duì)數(shù)據(jù)片段內(nèi)的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量進(jìn)行統(tǒng)計(jì),可見(jiàn)統(tǒng)計(jì)過(guò)程中的計(jì)算量還是很大的。
在本發(fā)明的另一種具體實(shí)現(xiàn)方式中,步驟(4)根據(jù)統(tǒng)計(jì)得到的數(shù)量獲得數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息,可以包括以下步驟:
1)計(jì)算數(shù)據(jù)片段ri的數(shù)據(jù)記錄的數(shù)量的方差。
2)判斷方差是否大于預(yù)設(shè)的數(shù)據(jù)片段方差閾值。
3)在步驟2)的判斷結(jié)果為是時(shí),判斷是否滿(mǎn)足以下表達(dá)式:num≥th1,或,num≤th2,如果滿(mǎn)足則統(tǒng)計(jì)所述數(shù)據(jù)片段ri劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的 數(shù)據(jù)記錄的數(shù)量,并按照統(tǒng)計(jì)后的數(shù)量更新所述數(shù)據(jù)分布信息。
其中,num表示數(shù)據(jù)片段ri劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,th1表示預(yù)設(shè)的第一數(shù)量閾值,th2表示預(yù)設(shè)的第二數(shù)量閾值,且th1≥th2。
4)在步驟2)的判斷結(jié)果為否時(shí),則保持當(dāng)前的數(shù)據(jù)分布信息。
可見(jiàn),在這種實(shí)現(xiàn)方式中,計(jì)算數(shù)據(jù)片段的方差來(lái)判斷數(shù)據(jù)片段內(nèi)已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)量偏離平均值的情況,這樣,能夠及時(shí)發(fā)現(xiàn)數(shù)量嚴(yán)重超過(guò)平均值的數(shù)據(jù)片段;進(jìn)一步的,通過(guò)判斷數(shù)據(jù)片段內(nèi)的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量是否大于預(yù)設(shè)的第一數(shù)量閾值或是否小于預(yù)設(shè)的第二數(shù)量閾值,來(lái)確定出具體是哪個(gè)數(shù)據(jù)區(qū)間的數(shù)據(jù)記錄的數(shù)量發(fā)生了允許范圍(th1,th2)外的改變,進(jìn)而,可以只對(duì)該數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄進(jìn)行重新統(tǒng)計(jì)即可??梢?jiàn),這種對(duì)數(shù)據(jù)分布信息的統(tǒng)計(jì)的計(jì)算量要遠(yuǎn)小于對(duì)數(shù)據(jù)片段內(nèi)的全部數(shù)據(jù)記錄進(jìn)行統(tǒng)計(jì)的計(jì)算量。
進(jìn)一步的,在本發(fā)明的另一種具體實(shí)現(xiàn)方式中,步驟(4)根據(jù)統(tǒng)計(jì)得到的數(shù)量獲得數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息,可以包括以下步驟:
1)判斷數(shù)據(jù)片段ri的數(shù)據(jù)記錄的數(shù)量是否滿(mǎn)足預(yù)設(shè)的數(shù)據(jù)區(qū)間調(diào)整條件。
具體的,步驟1)可以包括以下步驟:
i:計(jì)算統(tǒng)計(jì)得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量的方差;
ii:判斷計(jì)算得到的方差是否大于預(yù)設(shè)的方差閾值;
iii:在判斷結(jié)果為大于時(shí),判定統(tǒng)計(jì)得到的各個(gè)數(shù)據(jù)區(qū)間的數(shù)據(jù)記錄的數(shù)量滿(mǎn)足預(yù)設(shè)的數(shù)據(jù)區(qū)間處理?xiàng)l件。
可以理解的是,當(dāng)判斷計(jì)算得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)數(shù)據(jù)記錄的數(shù)量的方差大于預(yù)設(shè)的方差閾值時(shí),表明該數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量已嚴(yán)重偏離數(shù)據(jù)區(qū)間內(nèi)數(shù)據(jù)記錄的均值,或者說(shuō),該數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量與所在數(shù)據(jù)片段內(nèi)的其他數(shù)據(jù)區(qū)間之間出現(xiàn)了較大的偏差,則認(rèn)為此時(shí)該數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄需要進(jìn)行處理(例如,對(duì)數(shù)據(jù)區(qū)間的拆分或者合并處理),即判定統(tǒng)計(jì)得到的各個(gè)數(shù)據(jù)區(qū)間的數(shù)據(jù)記錄的數(shù)量滿(mǎn)足預(yù)設(shè)的數(shù)據(jù)區(qū)間處理?xiàng)l件。
需要說(shuō)明的是,本發(fā)明并不需要對(duì)上述提及的預(yù)設(shè)的方差閾值的具體數(shù)值 進(jìn)行限定,本領(lǐng)域內(nèi)的技術(shù)人員需要根據(jù)實(shí)際應(yīng)用中的具體情況來(lái)確定。
2)在步驟1)判斷為滿(mǎn)足的情況下,按照預(yù)設(shè)的區(qū)間調(diào)整規(guī)則對(duì)數(shù)據(jù)片段ri中各個(gè)數(shù)據(jù)區(qū)間進(jìn)行調(diào)整,并根據(jù)調(diào)整后各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,獲得數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息。
在本發(fā)明的一種具體實(shí)現(xiàn)方式中,預(yù)設(shè)的區(qū)間調(diào)整規(guī)則,可以包括:
a:獲得統(tǒng)計(jì)得到的數(shù)據(jù)片段ri中數(shù)據(jù)記錄的數(shù)量大于預(yù)設(shè)的第一數(shù)量閾值th3的數(shù)據(jù)區(qū)間;
b:按照預(yù)設(shè)的數(shù)據(jù)區(qū)間拆分規(guī)則,將數(shù)據(jù)記錄的數(shù)量大于th3的數(shù)據(jù)區(qū)間分別拆分為多個(gè)子數(shù)據(jù)區(qū)間。
需要說(shuō)明的是,將數(shù)據(jù)記錄的數(shù)量大于th1的數(shù)據(jù)區(qū)間分別拆分為多個(gè)子數(shù)據(jù)區(qū)間,目的在于將各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量控制在th1以下,這樣,對(duì)各個(gè)數(shù)據(jù)區(qū)間中的數(shù)據(jù)記錄進(jìn)行處理處理時(shí),能夠保證所需要的硬件資源不超過(guò)某一數(shù)值,這樣有利于對(duì)各個(gè)數(shù)據(jù)區(qū)間所需要的硬件資源的合理分配。
舉例而言,假設(shè)第一數(shù)量閾值th1為120,參見(jiàn)圖1c,為數(shù)據(jù)片段ri中各個(gè)數(shù)據(jù)區(qū)間內(nèi)數(shù)據(jù)記錄的數(shù)量的統(tǒng)計(jì)直方圖,其中,由左向右第四個(gè)數(shù)據(jù)區(qū)間內(nèi)數(shù)據(jù)記錄的數(shù)量為200個(gè),明顯高于其他數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量。因此,可以將該數(shù)據(jù)區(qū)間拆分成如圖1d所示的2個(gè)子數(shù)據(jù)區(qū)間,且各個(gè)子數(shù)據(jù)區(qū)間中的數(shù)量分別為100,100。
需要說(shuō)明的是,在將數(shù)據(jù)記錄的數(shù)量大于th1的數(shù)據(jù)區(qū)間拆分成多個(gè)子數(shù)據(jù)區(qū)間時(shí),對(duì)于所拆分的各個(gè)子數(shù)據(jù)區(qū)間中的數(shù)量可以是相同的,也可以是不相同的,上述例子中所拆分得到的兩個(gè)子數(shù)據(jù)區(qū)間中的數(shù)量也可以是110,90。本發(fā)明不需要對(duì)拆分得到的各個(gè)子數(shù)據(jù)區(qū)間中的數(shù)據(jù)記錄的數(shù)量進(jìn)行限定,本領(lǐng)域內(nèi)的技術(shù)人員需要根據(jù)具體情況進(jìn)行合理的設(shè)置。
進(jìn)一步的,在本發(fā)明的另一種具體實(shí)現(xiàn)方式中,預(yù)設(shè)的區(qū)間調(diào)整規(guī)則,還可以包括:
c:獲得統(tǒng)計(jì)得到的數(shù)據(jù)片段ri中數(shù)據(jù)記錄的數(shù)量小于預(yù)設(shè)的第二數(shù)量閾值th2的數(shù)據(jù)區(qū)間;
d:按照預(yù)設(shè)的數(shù)據(jù)區(qū)間合并規(guī)則,對(duì)數(shù)據(jù)記錄的數(shù)量小于th2的數(shù)據(jù)區(qū)間進(jìn)行合并處理。
還需要說(shuō)明的是,對(duì)數(shù)據(jù)記錄的數(shù)量小于th2的數(shù)據(jù)區(qū)間進(jìn)行合并處理,能夠使各個(gè)數(shù)據(jù)區(qū)間中的數(shù)據(jù)記錄的數(shù)量不至于太小,這樣,對(duì)各個(gè)數(shù)據(jù)區(qū)間中的數(shù)據(jù)記錄進(jìn)行處理處理時(shí),更有利于對(duì)各個(gè)數(shù)據(jù)區(qū)間所需要的硬件資源的合理分配,不至于出現(xiàn)資源浪費(fèi)的情況。
舉例而言,假設(shè)第二數(shù)量閾值th2為30,參見(jiàn)圖1e,為數(shù)據(jù)片段ri中各個(gè)數(shù)據(jù)區(qū)間內(nèi)數(shù)據(jù)記錄的數(shù)量的統(tǒng)計(jì)直方圖,其中,各個(gè)數(shù)據(jù)區(qū)間中數(shù)據(jù)記錄的數(shù)量均小于30,因此,可以將該數(shù)據(jù)區(qū)間合并成如圖1f所示的一個(gè)數(shù)據(jù)區(qū)間,且合并后的數(shù)據(jù)區(qū)間的數(shù)量為合并前各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量之和75。
由以上可見(jiàn),根據(jù)上述兩種預(yù)設(shè)的數(shù)據(jù)區(qū)間調(diào)整規(guī)則,可以將各個(gè)數(shù)據(jù)片段內(nèi)的各個(gè)數(shù)據(jù)區(qū)間的數(shù)量維持在一個(gè)合理范圍之內(nèi),使得各個(gè)數(shù)據(jù)片段的各個(gè)數(shù)據(jù)區(qū)間對(duì)于數(shù)據(jù)處理服務(wù)器中的硬件資源的占用趨于均衡。
步驟s104:根據(jù)所獲得的數(shù)據(jù)分布信息,將每個(gè)有效數(shù)據(jù)片段的數(shù)據(jù)范圍劃分成至少一個(gè)子數(shù)據(jù)范圍。
步驟s105:按照劃分得到的各個(gè)子數(shù)據(jù)范圍,生成針對(duì)每個(gè)有效數(shù)據(jù)片段的數(shù)據(jù)處理任務(wù)。
其中,一個(gè)數(shù)據(jù)處理任務(wù)對(duì)應(yīng)一個(gè)有效數(shù)據(jù)片段的一個(gè)子數(shù)據(jù)范圍。
實(shí)際應(yīng)用中,在對(duì)存儲(chǔ)服務(wù)器中的數(shù)據(jù)記錄進(jìn)行數(shù)據(jù)處理的時(shí)候,對(duì)于處理任務(wù)的劃分直接影響到處理速度的快慢。而本發(fā)明實(shí)施例提供的方案恰恰是依據(jù)各個(gè)數(shù)據(jù)片段中各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量的分布信息進(jìn)行劃分的,可以理解的,這樣進(jìn)行數(shù)據(jù)處理任務(wù)的劃分,能夠使得各個(gè)數(shù)據(jù)處理服務(wù)器中的硬件資源與相應(yīng)的數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄。
步驟s106:向任務(wù)調(diào)度器發(fā)送針對(duì)數(shù)據(jù)處理任務(wù)的數(shù)據(jù)處理請(qǐng)求,以使得任務(wù)調(diào)度器根據(jù)數(shù)據(jù)處理請(qǐng)求確定執(zhí)行每一數(shù)據(jù)處理任務(wù)的數(shù)據(jù)處理服務(wù)器。
其中,任務(wù)調(diào)度器確定數(shù)據(jù)處理服務(wù)器后,向所確定的數(shù)據(jù)處理服務(wù)器發(fā)送其要處理的數(shù)據(jù)處理任務(wù),并接收所確定的各個(gè)數(shù)據(jù)處理服務(wù)器針對(duì)所分配的子數(shù)據(jù)范圍進(jìn)行數(shù)據(jù)處理的處理結(jié)果。
舉例而言,圖1g為本發(fā)明實(shí)施例提供的一種任務(wù)分配示意圖,針對(duì)待處理數(shù)據(jù)的有效數(shù)據(jù)片段為3個(gè),生成9個(gè)數(shù)據(jù)處理任務(wù),并且各個(gè)數(shù)據(jù)處理任務(wù)對(duì)應(yīng)的數(shù)據(jù)記錄的數(shù)量不超過(guò)130個(gè),針對(duì)這3個(gè)有效數(shù)據(jù)片段內(nèi)的各個(gè)數(shù)據(jù)區(qū)間,可以將各個(gè)數(shù)據(jù)處理任務(wù)分配如下:
容易理解的,分布式數(shù)據(jù)處理系統(tǒng)的數(shù)據(jù)處理速度通常取決于數(shù)據(jù)處理服務(wù)器中完成數(shù)據(jù)處理速度最慢的一個(gè),圖1g中各個(gè)數(shù)據(jù)處理任務(wù)所要處理的數(shù)據(jù)記錄的數(shù)量大致相當(dāng),避免了現(xiàn)有技術(shù)中僅僅根據(jù)數(shù)據(jù)片段的數(shù)量進(jìn)行數(shù)據(jù)處理任務(wù)的劃分時(shí)出現(xiàn)的分配不均衡的問(wèn)題,這樣使得各個(gè)數(shù)據(jù)處理服務(wù)器完成數(shù)據(jù)處理的速度大致是相當(dāng)?shù)?,因此,提高了分布式?shù)據(jù)處理系統(tǒng)的整體處理性能。
步驟s107:接收任務(wù)調(diào)度器反饋的針對(duì)待處理數(shù)據(jù)的處理結(jié)果。
由此可見(jiàn),應(yīng)用本實(shí)施例提供的方案進(jìn)行數(shù)據(jù)處理時(shí),各個(gè)數(shù)據(jù)處理服務(wù)器所分配的數(shù)據(jù)處理任務(wù)是根據(jù)各個(gè)數(shù)據(jù)片段中的數(shù)據(jù)記錄的數(shù)量分配的,避免了各個(gè)數(shù)據(jù)處理服務(wù)器所分配到的數(shù)據(jù)處理任務(wù)不均衡的問(wèn)題,提高了分布式數(shù)據(jù)處理系統(tǒng)中數(shù)據(jù)處理服務(wù)器的并行處理速度,從而提高了分布式數(shù)據(jù)處理系統(tǒng)的整體處理性能。
圖2為本發(fā)明實(shí)施例提供的另一種數(shù)據(jù)處理方法的流程示意圖,在圖1b所示方法實(shí)施例的基礎(chǔ)之上,該方法還可以包括:
步驟s108:在本地已存儲(chǔ)各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息的情況下,接收存儲(chǔ)服務(wù)器發(fā)送的數(shù)據(jù)更新通知。
容易理解的,存儲(chǔ)服務(wù)器中各個(gè)數(shù)據(jù)片段內(nèi)的數(shù)據(jù)記錄其實(shí)是處于一個(gè)動(dòng) 態(tài)變化的過(guò)程,數(shù)據(jù)記錄的寫(xiě)入或刪除會(huì)直接影響到各個(gè)數(shù)據(jù)片段內(nèi)的數(shù)據(jù)分布信息,因此,對(duì)于在本地存儲(chǔ)各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息的情況,就需要定期進(jìn)行數(shù)據(jù)更新,這樣才能夠保證客戶(hù)端本地存儲(chǔ)的數(shù)據(jù)分布信息盡可能與存儲(chǔ)服務(wù)器中的數(shù)據(jù)片段內(nèi)的數(shù)據(jù)記錄的實(shí)際數(shù)量的一致性。
步驟s109:根據(jù)該數(shù)據(jù)更新通知,更新本地已存儲(chǔ)的數(shù)據(jù)分布信息。
一方面,本實(shí)施例中的方案對(duì)存儲(chǔ)于本地的各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息進(jìn)行了更新,這樣保證了客戶(hù)端所獲得的數(shù)據(jù)分布信息與存儲(chǔ)服務(wù)器中實(shí)際的數(shù)據(jù)分布情況的一致性;另一方面,應(yīng)用本實(shí)施例提供的方案進(jìn)行數(shù)據(jù)處理時(shí),各個(gè)數(shù)據(jù)處理服務(wù)器所分配的數(shù)據(jù)處理任務(wù)是根據(jù)各個(gè)數(shù)據(jù)片段中的數(shù)據(jù)記錄的數(shù)量分配的,避免了各個(gè)數(shù)據(jù)處理服務(wù)器所分配到的數(shù)據(jù)處理任務(wù)不均衡的問(wèn)題,提高了分布式數(shù)據(jù)處理系統(tǒng)中數(shù)據(jù)處理服務(wù)器的并行處理速度,從而提高了分布式數(shù)據(jù)處理系統(tǒng)的整體處理性能。
圖3為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖,應(yīng)用于分布式數(shù)據(jù)處理系統(tǒng)中的客戶(hù)端。
其中,分布式數(shù)據(jù)處理系統(tǒng)包括:客戶(hù)端、任務(wù)調(diào)度器、多個(gè)數(shù)據(jù)處理服務(wù)器和多個(gè)存儲(chǔ)服務(wù)器;存儲(chǔ)服務(wù)器中存儲(chǔ)有多個(gè)數(shù)據(jù)片段,各個(gè)數(shù)據(jù)片段中存儲(chǔ)有多條數(shù)據(jù)記錄。
具體的,上述數(shù)據(jù)處理裝置可以包括以下模塊:
處理指令接收模塊201,用于接收針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)處理指令。
有效數(shù)據(jù)確定模塊202,用于根據(jù)數(shù)據(jù)處理指令,確定有效數(shù)據(jù)片段。
其中,有效數(shù)據(jù)片段為針對(duì)待處理數(shù)據(jù)的數(shù)據(jù)片段。
分布信息獲得模塊203,用于獲得有效數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息。
其中,數(shù)據(jù)分布信息為:按照預(yù)設(shè)的統(tǒng)計(jì)規(guī)則對(duì)每個(gè)數(shù)據(jù)片段中的數(shù)據(jù)記錄的數(shù)量進(jìn)行統(tǒng)計(jì)得到的信息。
數(shù)據(jù)范圍劃分模塊204,用于根據(jù)所獲得的數(shù)據(jù)分布信息,將每個(gè)有效數(shù)據(jù)片段的數(shù)據(jù)范圍劃分成至少一個(gè)子數(shù)據(jù)范圍。
任務(wù)生成模塊205,用于按照劃分得到的各個(gè)子數(shù)據(jù)范圍,生成針對(duì)每個(gè)有效數(shù)據(jù)片段的數(shù)據(jù)處理任務(wù)。
其中,一個(gè)數(shù)據(jù)處理任務(wù)對(duì)應(yīng)一個(gè)有效數(shù)據(jù)片段的一個(gè)子數(shù)據(jù)范圍。
處理請(qǐng)求發(fā)送模塊206,用于向任務(wù)調(diào)度器發(fā)送針對(duì)數(shù)據(jù)處理任務(wù)的數(shù)據(jù)處理請(qǐng)求,以使得任務(wù)調(diào)度器根據(jù)數(shù)據(jù)處理請(qǐng)求確定執(zhí)行每一數(shù)據(jù)處理任務(wù)的數(shù)據(jù)處理服務(wù)器。
其中,任務(wù)調(diào)度器確定數(shù)據(jù)處理服務(wù)器后,向所確定的數(shù)據(jù)處理服務(wù)器發(fā)送其要處理的數(shù)據(jù)處理任務(wù),并接收所確定的各個(gè)數(shù)據(jù)處理服務(wù)器針對(duì)所分配的子數(shù)據(jù)范圍進(jìn)行數(shù)據(jù)處理的處理結(jié)果。
處理結(jié)果接收模塊207,用于接收任務(wù)調(diào)度器反饋的針對(duì)待處理數(shù)據(jù)的處理結(jié)果。
具體的,存儲(chǔ)服務(wù)器,包括:數(shù)據(jù)排序子模塊、數(shù)據(jù)區(qū)間劃分子模塊、數(shù)據(jù)統(tǒng)計(jì)子模塊和分布信息獲得子模塊。
其中,數(shù)據(jù)排序子模塊,用于存儲(chǔ)服務(wù)器將數(shù)據(jù)片段ri內(nèi)的各條數(shù)據(jù)記錄按照預(yù)設(shè)的標(biāo)識(shí)值排序;
區(qū)間劃分子模塊,用于按照排序后數(shù)據(jù)片段ri中的數(shù)據(jù)記錄的排列順序,將排序后的數(shù)據(jù)片段ri劃分成至少一個(gè)數(shù)據(jù)區(qū)間;
數(shù)據(jù)統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量;
分布信息獲得子模塊,用于根據(jù)統(tǒng)計(jì)得到的數(shù)量獲得數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息。
具體的,分布信息獲得子模塊,包括:片段方差計(jì)算單元、方差判斷單元、第一信息統(tǒng)計(jì)單元和第二信息統(tǒng)計(jì)單元;其中,
片段方差計(jì)算單元,用于計(jì)算數(shù)據(jù)片段ri的數(shù)據(jù)記錄的數(shù)量的方差;
片段方差判斷單元,用于判斷方差是否大于預(yù)設(shè)的數(shù)據(jù)片段方差閾值;
第一信息統(tǒng)計(jì)單元,用于在方差判斷單元的判斷結(jié)果為是時(shí),判斷是否滿(mǎn)足以下表達(dá)式:num≥th1,或,num≤th2,如果滿(mǎn)足則統(tǒng)計(jì)所述數(shù)據(jù)片段ri劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,并按照統(tǒng)計(jì)后的數(shù)量更新所述數(shù)據(jù)分布信息;其中,num表示數(shù)據(jù)片段ri劃分得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,th1表示預(yù)設(shè)的第一數(shù)量閾值,th2表示預(yù)設(shè)的第二數(shù)量閾值,且th1≥th2;
第二信息統(tǒng)計(jì)單元,用于在方差判斷單元的判斷結(jié)果為是時(shí),則保持當(dāng)前的數(shù)據(jù)分布信息。
具體的,分布信息獲得子模塊,可以包括:調(diào)整條件判斷單元和第一區(qū)間調(diào)整單元。
其中,調(diào)整條件判斷單元,用于判斷數(shù)據(jù)片段ri的數(shù)據(jù)記錄的數(shù)量是否滿(mǎn)足預(yù)設(shè)的數(shù)據(jù)區(qū)間調(diào)整條件;
第一區(qū)間調(diào)整單元,用于在調(diào)整條件判斷單元的判斷結(jié)果為滿(mǎn)足時(shí),按照預(yù)設(shè)的區(qū)間調(diào)整規(guī)則對(duì)數(shù)據(jù)片段ri中各個(gè)數(shù)據(jù)區(qū)間進(jìn)行調(diào)整,并根據(jù)調(diào)整后各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量,獲得數(shù)據(jù)片段ri內(nèi)數(shù)據(jù)記錄的數(shù)據(jù)分布信息;
其中,預(yù)設(shè)的區(qū)間調(diào)整規(guī)則,可以包括:
獲得統(tǒng)計(jì)得到的數(shù)據(jù)片段ri中數(shù)據(jù)記錄的數(shù)量大于預(yù)設(shè)的第一數(shù)量閾值th3的數(shù)據(jù)區(qū)間;
按照預(yù)設(shè)的數(shù)據(jù)區(qū)間拆分規(guī)則,將數(shù)據(jù)記錄的數(shù)量大于th3的數(shù)據(jù)區(qū)間分別拆分為多個(gè)子數(shù)據(jù)區(qū)間。
具體的,預(yù)設(shè)的區(qū)間調(diào)整規(guī)則,還可以包括:
獲得統(tǒng)計(jì)得到的數(shù)據(jù)片段ri中數(shù)據(jù)記錄的數(shù)量小于預(yù)設(shè)的第二數(shù)量閾值th2的數(shù)據(jù)區(qū)間;
按照預(yù)設(shè)的數(shù)據(jù)區(qū)間合并規(guī)則,對(duì)數(shù)據(jù)記錄的數(shù)量小于th2的數(shù)據(jù)區(qū)間進(jìn)行合并處理。
具體的,調(diào)整條件判斷單元,包括:區(qū)間方差計(jì)算子單元、方差判斷子單 元和處理?xiàng)l件判定子單元。
其中,區(qū)間方差計(jì)算子單元,用于計(jì)算統(tǒng)計(jì)得到的各個(gè)數(shù)據(jù)區(qū)間內(nèi)的數(shù)據(jù)記錄的數(shù)量的方差;
區(qū)間方差判斷子單元,用于判斷計(jì)算得到的方差是否大于預(yù)設(shè)的方差閾值;
處理?xiàng)l件判定子單元,用于在區(qū)間方差判斷子單元的判斷結(jié)果為大于時(shí),判定統(tǒng)計(jì)得到的各個(gè)數(shù)據(jù)區(qū)間的數(shù)據(jù)記錄的數(shù)量滿(mǎn)足預(yù)設(shè)的數(shù)據(jù)區(qū)間處理?xiàng)l件。
由此可見(jiàn),應(yīng)用本實(shí)施例提供的方案進(jìn)行數(shù)據(jù)處理時(shí),各個(gè)數(shù)據(jù)處理服務(wù)器所分配的數(shù)據(jù)處理任務(wù)是根據(jù)各個(gè)數(shù)據(jù)片段中的數(shù)據(jù)記錄的數(shù)量分配的,避免了各個(gè)數(shù)據(jù)處理服務(wù)器所分配到的數(shù)據(jù)處理任務(wù)不均衡的問(wèn)題,提高了分布式數(shù)據(jù)處理系統(tǒng)中數(shù)據(jù)處理服務(wù)器的并行處理速度,從而提高了分布式數(shù)據(jù)處理系統(tǒng)的整體處理性能。
圖4為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖,在圖3所示的裝置實(shí)施例的基礎(chǔ)之上,該裝置還可以包括:
數(shù)據(jù)更新通知接收模塊208,用于在客戶(hù)端中已存儲(chǔ)各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息的情況下,接收存儲(chǔ)服務(wù)器發(fā)送的數(shù)據(jù)更新通知。
數(shù)據(jù)分布信息更新模塊209,用于根據(jù)數(shù)據(jù)更新通知,更新本地已存儲(chǔ)的數(shù)據(jù)分布信息。
一方面,本實(shí)施例中的方案對(duì)存儲(chǔ)于本地的各個(gè)數(shù)據(jù)片段中已存儲(chǔ)的數(shù)據(jù)記錄的數(shù)據(jù)分布信息進(jìn)行了更新,這樣保證了客戶(hù)端所獲得的數(shù)據(jù)分布信息與存儲(chǔ)服務(wù)器中實(shí)際的數(shù)據(jù)分布情況的一致性;另一方面,應(yīng)用本實(shí)施例提供的方案進(jìn)行數(shù)據(jù)處理時(shí),各個(gè)數(shù)據(jù)處理服務(wù)器所分配的數(shù)據(jù)處理任務(wù)是根據(jù)各個(gè)數(shù)據(jù)片段中的數(shù)據(jù)記錄的數(shù)量分配的,避免了各個(gè)數(shù)據(jù)處理服務(wù)器所分配到的數(shù)據(jù)處理任務(wù)不均衡的問(wèn)題,提高了分布式數(shù)據(jù)處理系統(tǒng)中數(shù)據(jù)處理服務(wù)器的并行處理速度,從而提高了分布式數(shù)據(jù)處理系統(tǒng)的整體處理性能。
對(duì)于裝置實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。
需要說(shuō)明的是,在本文中,諸如第一和第二等之類(lèi)的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施方式中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,這里所稱(chēng)得的存儲(chǔ)介質(zhì),如:rom/ram、磁碟、光盤(pán)等。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。