跨idc大數(shù)處理架構下執(zhí)行策略生成方法、裝置的制造方法

文檔序號：9929544閱讀：379來源：國知局

跨idc大數(shù)處理架構下執(zhí)行策略生成方法、裝置的制造方法
【技術領域】
[0001]本發(fā)明涉及大數(shù)據(jù)技術領域，特別涉及一種跨IDC(Internet Data Center，網(wǎng)絡數(shù)據(jù)中心)大數(shù)處理架構下執(zhí)行策略生成方法、裝置。
【背景技術】
[0002]當前處理海量數(shù)據(jù)處理平臺都是以單個IDC內方式構建，使用者不需要了解在IDC內分布式計算所涉及的底層技術細節(jié)，能方便快捷地開發(fā)數(shù)據(jù)處理程序。
[0003]在當前架構下，任務策略都以量化集群內設備的CPU、內存等計算相關資源來開發(fā)。
[0004]1.FIFO (First In First Out，先入先出)調度策略
[0005]隊列調度策略，是從工作隊列中以先進先出方式來處理任務。此策略是最老、最簡單的處理方式，易于實現(xiàn)運行穩(wěn)定。但是，該策略不考慮作業(yè)的優(yōu)先級或大小，如果遇到大的計算任務會占用整個集群全部資源，后續(xù)任務需要等待當前大任務完成才能獲得處理。一些優(yōu)先級別高、計算量小的任務，不能得到及時處理。
[0006]2.容量調度策略
[0007]容量調度策略，是讓任務選擇預先分配的資源容器處理執(zhí)行。
[0008]按照各容器預先劃分計算資源到每個容器內，并分配容器給多個獨立用戶和目標應用程序。該調度策略對集群的計算資源利用率不高，且計算資源擴容、刪減的維護成本較高；此外，容器內多任務運行采用FIFO調度器，無法避免相應容器內的大任務導致?lián)砣麄€容器。
[0009]3.公平調度策略
[0010]公平調度策略，與容器調度策略有相似的地方。相對容器調度策略，公平調度策略強制公平共享各容器的計算資源。
[0011 ] 具體來說，處理任務隨著時間推移，在使用完自身容器所有計算資源情況下，根據(jù)強制公平共享計算資源的全局規(guī)則約定，當前任務從其他還有計算資源且優(yōu)先策略低于當前任務的容器中借用相關資源。
[0012]在該規(guī)則下，臨時的、需要較少時間、優(yōu)先級別較高的作業(yè)會獲得計算資源，那些需要更長時間執(zhí)行的作業(yè)會推遲結果輸出。但當在數(shù)據(jù)與計算資源分布不均勻時，采用任務延遲策略，導致調度穩(wěn)定性不可預估。
[0013]現(xiàn)有大數(shù)據(jù)通用計算調度策略是在單IDC內，且數(shù)據(jù)、計算能力分布較均勻情況下有較好的批量執(zhí)行處理能力。
[0014]首先，單個大IDC構建數(shù)據(jù)中心方面，隨著大數(shù)據(jù)的演進。多樣數(shù)據(jù)源源不斷地來自網(wǎng)絡每個角落，大家已經(jīng)普遍認同:一個數(shù)據(jù)中心在建立和計算時效上都會對網(wǎng)絡、可擴容等方面造成過高的運營成本。業(yè)內需要建立一個通用有層級數(shù)據(jù)處理能力的架構，在此架構下當前調度策略都是無法滿足的。
[0015]其次，在數(shù)據(jù)與計算能力匹配調度為可執(zhí)行任務上，現(xiàn)有的策略采取的是任務延遲策略。本策略中出現(xiàn)一個空閑計算資源，如果它被選中的作業(yè)沒有設備內或本機架中的待處理數(shù)據(jù)時，策略暫把計算資源讓給其他作業(yè)?；诖瞬呗?，對處理數(shù)據(jù)分布不理想，只采用延遲一段時間后隨機處理的辦法會讓調度不穩(wěn)定。
[0016]最后，隨著大數(shù)據(jù)處理平臺的普及，不同用戶提交的應用作業(yè)往往具有不同的服務質量(QoS)需求。目前通用調度策略普遍是基于批量處理，已難于滿足當前對大數(shù)據(jù)多樣的QoS的要求。

【發(fā)明內容】

[0017]本發(fā)明的發(fā)明人發(fā)現(xiàn)上述現(xiàn)有技術中存在問題，并因此針對問題中的至少一個問題提出了一種新的技術方案。
[0018]本發(fā)明的一個目的是提供一種用于跨IDC的大數(shù)處理架構下執(zhí)行策略生成的技術方案。
[0019]根據(jù)本發(fā)明的第一方面，提供了一種跨互聯(lián)網(wǎng)數(shù)據(jù)中心IDC的大數(shù)處理架構下執(zhí)行策略生成方法，包括:
[0020]調度組件接收各個IDC集群上報的當前可用的計算資源和傳輸資源；
[0021]所述調度組件接收提交的作業(yè)，所述作業(yè)包括任務、作業(yè)數(shù)據(jù)和期望輸出；
[0022]所述調度組件根據(jù)任務類型基于任務分類模型庫確定所述任務的代表執(zhí)行策略，所述任務的代表執(zhí)行策略包括所述任務所需計算資源和所消耗時間；
[0023]所述調度組件根據(jù)集群可用資源池中的[集群可用計算資源、作業(yè)數(shù)據(jù)分布]矩陣和[各個任務所需計算資源、和所消耗時間、集群可用網(wǎng)絡傳輸資源]矩陣進行調度，獲得所述作業(yè)的當前最優(yōu)執(zhí)行策略。
[0024]可選地，該方法還包括:通過機器學習建立所述任務分類模型庫。
[0025]可選地，通過機器學習建立所述任務分類模型庫包括:任務作為一個對象向IDC集群申請相關資源，相關資源包括CPU、硬盤、內存、傳輸資源和任務所需數(shù)據(jù)；對于每個類型的任務，通過試運行任務對相關資源進行隨機分配，獲得不同相關資源分配狀態(tài)下的任務執(zhí)行輸出結果，獲得任務試運行結果最優(yōu)的最優(yōu)執(zhí)行策略；將任務的最優(yōu)執(zhí)行策略作為該任務類型的代表執(zhí)行策略存入任務分類模型庫。
[0026]可選地，計算資源包括CPU、硬盤、內存和傳輸資源。
[0027]可選地，該方法還包括:基于作業(yè)的服務質量要求為作業(yè)分配不同的作業(yè)權重，具有較高服務質量要求的作業(yè)分配較高的作業(yè)權重，讓集群計算資源在作業(yè)權重的分配下達到使用利用率最大化，從而進行策略分配時優(yōu)先分配具有較高QoS要求的作業(yè)。
[0028]可選地，調度組件根據(jù)可用資源池中的[集群可用計算資源、作業(yè)數(shù)據(jù)分布]矩陣和[各個任務所需計算資源、所消耗時間、集群可用網(wǎng)絡傳輸資源]矩陣進行調度獲得所述作業(yè)的當前最優(yōu)執(zhí)行策略包括:基于優(yōu)化算法隨機迭代，將[集群可用計算資源、作業(yè)數(shù)據(jù)分布]矩陣中的相關資源分配到[各個任務所需計算資源和所消耗時間、集群可用網(wǎng)絡資源]矩陣的各任務的公式中，通過比對最優(yōu)策略選取集群最優(yōu)的分配策略。
[0029]根據(jù)本發(fā)明的另一方面，提供一種跨互聯(lián)網(wǎng)數(shù)據(jù)中心IDC的大數(shù)處理架構下執(zhí)行策略生成裝置，包括:
[0030]可用資源獲取模塊，用于接收各個IDC集群上報的當前可用的計算資源和傳輸資源；
[0031]作業(yè)接收模塊，用于接收提交的作業(yè)，所述作業(yè)包括任務、作業(yè)數(shù)據(jù)和期望輸出；
[0032]任務策略確定模塊，用于根據(jù)所述任務的類型基于任務分類模型庫確定所述任務的代表執(zhí)行策略，所述任務的代表執(zhí)行策略包括所需計算資源和所消耗時間；
[0033]最優(yōu)策略確定模塊，用于根據(jù)可用資源池中的[集群可用計算資源、作業(yè)數(shù)據(jù)分布]矩陣和[作業(yè)的各個任務的所需計算資源和所消耗時間、集群可用網(wǎng)絡資源]矩陣進行調度，獲得所述作業(yè)的當前最優(yōu)執(zhí)行策略。
[0034]可選地，該裝置還包括:任務分類模型庫建立模塊，用于通過機器學習建立所述任務分類模型庫。
[0035]可選地，任務分類模型庫建立模塊將任務作為一個對象向集群申請相關資源，相關資源包括CPU、硬盤、傳輸資源、內存、任務所需數(shù)據(jù)；對于每個類型的任務，通過試運行任務對相關資源進行隨機分配，獲得不同相關資源分配狀態(tài)下的任務執(zhí)行輸出結果，獲得任務試運行結果最優(yōu)的最優(yōu)執(zhí)行策略；將任務的最優(yōu)執(zhí)行策略作為該任務類型的代表執(zhí)行策略存入任務分類模型庫。
[0036]可選地，最優(yōu)策略確定模塊基于優(yōu)化算法隨機迭代，將[集群可用計算資源、作業(yè)數(shù)據(jù)分布]矩陣中的相關資源分配到[各個任務所需計算資源和所消耗時間、集群可用網(wǎng)絡資源]矩陣的各任務的公式中，通過比對最優(yōu)策略選取集群最優(yōu)的分配策略。。
[0037]本發(fā)明的一個優(yōu)點在于，根據(jù)任務分類模型庫中不同類型任務的代表執(zhí)行策略來確定作業(yè)中各個任務的所需計算資源和所消耗時間，并結合各個集群內的可用計算資源、作業(yè)數(shù)據(jù)分別以及各個集群的可用網(wǎng)絡資源，確定作業(yè)的當前最優(yōu)執(zhí)行策略，從而實現(xiàn)了跨IDC的最優(yōu)執(zhí)行策略的調度和實現(xiàn)。
[0038]通過以下參照附圖對本發(fā)明的示例性實施例的詳細描述，本發(fā)明的其它特征及其優(yōu)點將會變得清楚。
【附圖說明】
[0039]構成說明書的一部分的附圖描述了本發(fā)明的實施例，并且連同說明書一起用于解釋本發(fā)明的原理。
[0040]參照附圖，根據(jù)下面的詳細描述，可以更加清楚地理解本發(fā)明，其中:
[0041]圖1是示出根據(jù)本發(fā)明的跨IDC的大數(shù)處理架構下執(zhí)行策略生成方法的一個實施例的流程圖；
[0042]圖2是示出根據(jù)本發(fā)明的跨IDC的大數(shù)處理架構下執(zhí)行策略生成方法的另一個實施例的示意圖；
[0043]圖3是示出根據(jù)本發(fā)明的跨IDC的大數(shù)處理架構下執(zhí)行策略生成裝置的一個實施例的結構圖；
[0044]圖4是示出根據(jù)本發(fā)明的跨IDC的大數(shù)處理架構下執(zhí)行策略生成裝置的另一個實施例的結構圖。
【具體實施方式】
[0045]現(xiàn)在將參照附圖來詳細描述本發(fā)明的各種示例性實施例。應注意到:除非另外具體說明，否則在這些實施例中闡述的部件和步驟的相對布置、數(shù)字表達式和數(shù)值不限制本發(fā)明的范圍。
[0046]同時，應當明白，為了便于描述，附圖中所示出的各個部分的尺

完整全部詳細技術資料下載

當前第1頁1 2 3

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：劉凱毅;
技術所有人：中國電信股份有限公司;
我是此專利的發(fā)明人

上一篇：一種基于地理信息的海量三維數(shù)據(jù)調度的方法
上一篇：數(shù)據(jù)存儲的方法和裝置的制造方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

跨idc大數(shù)處理架構下執(zhí)行策略生成方法、裝置的制造方法

跨idc大數(shù)處理架構下執(zhí)行策略生成方法、裝置的制造方法