亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

最優(yōu)化映射減少框架中數(shù)據(jù)處理的裝置和方法

文檔序號:6524743閱讀:193來源:國知局
最優(yōu)化映射減少框架中數(shù)據(jù)處理的裝置和方法
【專利摘要】由本發(fā)明的方法最優(yōu)化、由主節(jié)點實現(xiàn)的用于大規(guī)模數(shù)據(jù)的映射減少框架。該方法包括在指向由工人節(jié)點執(zhí)行的任務(wù)的輸入數(shù)據(jù)的讀取指針位置上的這些工人節(jié)點的數(shù)據(jù)的接收以及從這些任務(wù)接收工作,被竊取的該工作被應(yīng)用于輸入數(shù)據(jù),該輸入數(shù)據(jù)尚未被工作從其竊取的任務(wù)處理。
【專利說明】最優(yōu)化映射減少框架中數(shù)據(jù)處理的裝置和方法
【技術(shù)領(lǐng)域】
[0001]當(dāng)前發(fā)明涉及映射減少(MapReduce)框架中的數(shù)據(jù)處理。該映射減少模型在谷歌公司開發(fā),作為使能大規(guī)模數(shù)據(jù)處理的方式。
【背景技術(shù)】
[0002]映射減少是用于處理大數(shù)據(jù)集合的編程模型,并且谷歌的該模型的實現(xiàn)的名字映射減少通常對計算機集群進行分布式計算。該模型受通常在功能編程中使用的“映射(map)”和“減少(reduce)”功能啟發(fā)。映射減少包括“映射”步驟,其中主節(jié)點在每一個均處理特定的子任務(wù)的映射任務(wù)中建立問題的分支,并且分配這些映射任務(wù)給工人節(jié)點(worker node)。這個主任務(wù)還稱作“安排(scheduling)”任務(wù)。對于此,主節(jié)點劃分問題輸入數(shù)據(jù)并且將每個輸入數(shù)據(jù)部分分配到映射任務(wù)。工人節(jié)點處理子問題,并在映射任務(wù)完成時通知主節(jié)點。映射減少還包括“減少”步驟,其中主節(jié)點向一些工人節(jié)點分配“減少”操作,其收集全部子問題的答案并且將它們以某種形式組合以形成輸出,即原始試圖解決的問題的答案。
[0003]映射減少允許映射和減少操作的分布式處理。所提供的每一個映射操作都獨立于其他映射操作,并且可以并行地進行映射。類似地,“減少器”的集合可以進行操作相。雖然此處理相比于更加順序的算法可能顯得不高效,但是映射減少可以應(yīng)用于比商用服務(wù)器可以處理的數(shù)據(jù)集合明顯更大的數(shù)據(jù)集合一大型服務(wù)器公司可以使用映射減少來僅在若干小時內(nèi)分類千兆字節(jié)(petabyte)的數(shù)據(jù);映射減少通常適宜于處理“大數(shù)據(jù)”。并行化也提供在操作期間從服務(wù)器或貯存的部分故障中恢復(fù)的一些可能性:如果一個映射器或減少器出現(xiàn)故障,則工作可以重安排一假定輸入數(shù)據(jù)仍然可用。映射減少的流行的開源實現(xiàn)是Apache Hadoop。(來源:維基百科)。
[0004]映射減少依賴于任務(wù)的“靜態(tài)”分割來易化主機的安排并且增加容錯。任務(wù)的靜態(tài)分割由主機節(jié)點“安排器”任務(wù)來處理。詞組“靜態(tài)”在上下文中意味著在執(zhí)行之前將任務(wù)分割為同樣大小的較小任務(wù)。作為程序/功能和輸入數(shù)據(jù)分割任務(wù)的組合的任務(wù)由分割輸入數(shù)據(jù)為部分并且創(chuàng)建在各個所分割數(shù)據(jù)部分上應(yīng)用程序的若干任務(wù)。
[0005]Blumofe等在他們的論文,在F0CS1994(Annual IEEE Symposium on Foundationsof Computer Science)上 的“Scheduling Multithreaded Computations by WorkStealing”中描述了處理器從其他處理器竊取工作的工作竊取的有益效果。此技術(shù)良好的適宜于處理異構(gòu)任務(wù)。然而,它限于在相關(guān)任務(wù)之間竊取工作,例如,在線程之間的具有共享存儲器的單一機器上執(zhí)行的任務(wù)。技術(shù)不能應(yīng)用于映射減少,因為映射減少方式有賴于如下假設(shè):任務(wù)是獨立的,而這允許了輸入數(shù)據(jù)的靜態(tài)分割以改進規(guī)模和容錯。
[0006]為了處理“離群者(straggler)”(即,緩慢地計算并且降低了數(shù)據(jù)處理系統(tǒng)的性能的機器),映射減少包括公知為“推測執(zhí)行”的機制,包括在任務(wù)的拷貝的同時執(zhí)行中,期望任務(wù)的之一將比其他任務(wù)更快地執(zhí)行。此改進允許了在使用異構(gòu)資源的環(huán)境中的性能增益。不適宜于異構(gòu)地處理任務(wù),即一些任務(wù)可能要求比其他任務(wù)更多的計算能力。[0007]美國Indiana University of Bloomington 的 Guo 等人在他們的文章“ImprovingMapReduce Performance in Heterogenous Network Environments and ResourceUt i I i sat ion ”中描述了,在映射減少中,映射和減少任務(wù)被分配給由工人節(jié)點擁有的映射和減少“時隙(slot)”。每一個工人包括任務(wù)向其分配的用戶可配置數(shù)量的映射和減少時隙。對每一個時隙保留潛在資源的部分。當(dāng)全部時隙同時使用時,資源使用率是最優(yōu)的。然而,千節(jié)點的谷歌計算簇(production cluster)的收集的使用率數(shù)據(jù)示出CPU利用率在大多數(shù)時候遠不及最優(yōu)。作者承認(rèn)如同在Hadoop中應(yīng)用的映射減少方式中的資源利用率在沒有足夠任務(wù)來填充全部任務(wù)時隙的時候是不高效的。每一個工人節(jié)點具有可以以每節(jié)點為基礎(chǔ)由用戶配置的映射和減少時隙。當(dāng)不存在足夠的任務(wù)來填充全部任務(wù)時隙時,浪費了保留的資源。為了改進映射減少性能,Guo等人提出了資源竊取并使能允許的任務(wù)竊取保留的“空閑”資源用于“推測執(zhí)行”(即,相同任務(wù)(“復(fù)制”,或“競爭”任務(wù))的并行執(zhí)行)以處理執(zhí)行裝置的異構(gòu);對于一些任務(wù)Tl到Tn的每一個,重執(zhí)行任務(wù)(之前提及的“推測執(zhí)行”)以使得任務(wù)的總數(shù)變得等于時隙的數(shù)量。重執(zhí)行任務(wù)使用為“空閑”時隙保留的資源。
[0008]改進處理速度的這些現(xiàn)有技術(shù)效果通過上述靜態(tài)分割始終受限。映射減少中的當(dāng)前途徑是調(diào)諧與此靜態(tài)分割有關(guān)的參數(shù)以便于改進負(fù)載平衡并且最終改進數(shù)據(jù)處理的性能。然而,此策略要求技術(shù)人員的介入,因為它要求要處理輸入數(shù)據(jù)的正確了解。必須處理輸入在大小上太小的未被分割為塊的輸入數(shù)據(jù),因為添加映射任務(wù)增加了對每一個分割任務(wù)要求的開銷。開銷的示例是:同步的時間,轉(zhuǎn)移和啟動任務(wù)、傳輸結(jié)果和合并全部結(jié)果的時間。
[0009]改進性能的再一策略是與Guo所討論的“資源竊取”相對的、稱為“工作竊取”的策略。Al-Obaidi等在他們的文章2012年7月3-5日的ICCCE2012的“A partial multistealing scheduling model for divide and conquer problems,,,中討論了工作竊取。然而,Al-Obaidi等討論的工作竊取目標(biāo)在于多核處理器架構(gòu),并且討論了通過任務(wù)線程的竊取來將其給予未使用處理器核心的工作竊取。此工作竊取策略設(shè)計用于多線程任務(wù)和多核處理器,并且不能導(dǎo)致非多線程任務(wù)或在單一核心節(jié)點上的更快執(zhí)行。此外,該策略受未使用處理器核心的數(shù)量限制。最終,Al-Obaidi等類似于Blumofe等。全部這些不利使得這些策略對于映射減少模型中的應(yīng)用不是最優(yōu)的。
[0010]現(xiàn)有技術(shù)涉及任務(wù)執(zhí)行的最優(yōu)化,已經(jīng)提出了任務(wù)的靜態(tài)分割。這不是最優(yōu)的,因為靜態(tài)分割不考慮不同分割任務(wù)之間以及不同執(zhí)行節(jié)點之間的異構(gòu)性。將會有利的是提出基于動態(tài)適應(yīng)任務(wù)和節(jié)點異構(gòu)性兩者的方法的映射減少。
[0011 ] 因此,需要現(xiàn)有技術(shù)解決方案的進一步最優(yōu)化。

【發(fā)明內(nèi)容】

[0012]本發(fā)明旨在減輕現(xiàn)有技術(shù)的一些不便。
[0013]為此,本發(fā)明包括用于在映射減少框架中的處理數(shù)據(jù)的方法,所述方法由主節(jié)點執(zhí)行,并且包括將輸入數(shù)據(jù)分割為輸入數(shù)據(jù)片段;向工人節(jié)點分配用于處理輸入數(shù)據(jù)片段的任務(wù),其中向每一個工人節(jié)點分配用于處理輸入數(shù)據(jù)片段的任務(wù);根據(jù)從執(zhí)行任務(wù)的工人節(jié)點接收的數(shù)據(jù)確定,指向由任務(wù)處理的輸入數(shù)據(jù)片段中的當(dāng)前讀取位置的讀取指針是否尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值;并且將新任務(wù)分配給空閑的工人節(jié)點,新任務(wù)被歸于由在尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值的所述任務(wù)尚未處理的輸入數(shù)據(jù)片段的、稱為分割部分的部分,該分割部分是位于在當(dāng)前讀取指針位置之后的輸入數(shù)據(jù)片段的一部分。
[0014]根據(jù)本發(fā)明的變形實施例,所述方法的最后步驟從屬于根據(jù)從任務(wù)接收的數(shù)據(jù)確定輸入每個任務(wù)的數(shù)據(jù)處理速度以及數(shù)據(jù)處理速度低于權(quán)利要求1的最后步驟的執(zhí)行的數(shù)據(jù)處理速度閾值的每一個任務(wù),該數(shù)據(jù)處理速度從根據(jù)從工人節(jié)點接收的數(shù)據(jù)獲得的后續(xù)讀取指針確定。
[0015]根據(jù)本發(fā)明的變形實施例,本發(fā)明進一步包括向執(zhí)行尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值的任務(wù)的工人節(jié)點傳輸消息的步驟,該消息包含了用于更新對由該消息向其傳輸?shù)墓と斯?jié)點執(zhí)行的任務(wù)的輸入數(shù)據(jù)片段的信息。
[0016]根據(jù)本發(fā)明的變形實施例,所述方法進一步包括在輸入數(shù)據(jù)流中插入End OfFile標(biāo)記的步驟,向任務(wù)提供該輸入數(shù)據(jù)流用于將輸入數(shù)據(jù)的處理限制在位于分割部分之前的輸入數(shù)據(jù)片段的一部分。
[0017]根據(jù)本發(fā)明的變形實施例,所述方法進一步包括在主節(jié)點中更新安排表,所述安排表包括允許工人節(jié)點與分配給它的任務(wù)之間的關(guān)聯(lián)并且定義分配給它的任務(wù)的輸入數(shù)據(jù)片段部分開始和結(jié)束的信息。
[0018]根據(jù)本發(fā)明的變形實施例,所述方法進一步包括處理輸入數(shù)據(jù)片段的非重疊部分的任務(wù)的推測執(zhí)行。
[0019]本發(fā)明還應(yīng)用于用于處理映射減少框架中的數(shù)據(jù)的主裝置,該裝置包括用于將輸入數(shù)據(jù)分割為輸入數(shù)據(jù)片段的部件;用于向工人節(jié)點分配用于處理輸入數(shù)據(jù)片段的任務(wù)的部件,其中向每一個工人節(jié)點分配用于處理輸入數(shù)據(jù)片段的任務(wù);用于根據(jù)從執(zhí)行任務(wù)的工人節(jié)點接收的數(shù)據(jù)確定,指向由任務(wù)處理的輸入數(shù)據(jù)片段中的當(dāng)前讀取位置的讀取指針是否尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值的部件;以及將新任務(wù)分配給空閑的工人節(jié)點的部件,新任務(wù)被歸于由在尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值的所述任務(wù)尚未處理的輸入數(shù)據(jù)片段的、稱為分割部分的部分,該分割部分是位于在當(dāng)前讀取指針位置之后的輸入數(shù)據(jù)片段的一部分。
[0020]根據(jù)根據(jù)本發(fā)明的裝置的變形實施例,所述裝置進一步包括用于根據(jù)從任務(wù)接收的數(shù)據(jù)確定輸入每個任務(wù)的數(shù)據(jù)處理速度的部件,以及確定數(shù)據(jù)處理速度是否低于數(shù)據(jù)處理速度閾值的部件,該數(shù)據(jù)處理速度從根據(jù)從工人節(jié)點接收的數(shù)據(jù)獲得的后續(xù)讀取指針確定。
[0021]根據(jù)根據(jù)本發(fā)明的裝置的變形實施例,所述裝置進一步包括向執(zhí)行尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值的任務(wù)的工人節(jié)點傳輸消息的部件,該消息包含了用于更新對由該消息向其傳輸?shù)墓と斯?jié)點執(zhí)行的任務(wù)的輸入數(shù)據(jù)片段的信息。
[0022]根據(jù)根據(jù)本發(fā)明的裝置的變形實施例,所述裝置進一步包括在輸入數(shù)據(jù)流中插入End Of File標(biāo)記的部件,向任務(wù)提供該輸入數(shù)據(jù)流用于將輸入數(shù)據(jù)的處理限制在位于分割部分之前的輸入數(shù)據(jù)片段的一部分。
[0023]根據(jù)根據(jù)本發(fā)明的裝置的變形實施例,所述裝置進一步包括用于在主節(jié)點中更新安排表的部件,所述安排表包括允許工人節(jié)點與分配給它的任務(wù)之間的關(guān)系并且定義分配給它的任務(wù)的輸入數(shù)據(jù)片段部分開始和結(jié)束的信息。
[0024]根據(jù)根據(jù)本發(fā)明的裝置的變形實施例,所述裝置進一步包括用于處理輸入數(shù)據(jù)片段的非重疊部分的任務(wù)的推測執(zhí)行的部件。
【專利附圖】

【附圖說明】
[0025]通過本發(fā)明的特定、非限制實施例的描述,本發(fā)明的更多優(yōu)勢將顯現(xiàn)。將參考以下附圖描述實施例:
[0026]圖1是示出現(xiàn)有技術(shù)映射減少方法的原理的框圖。
[0027]圖2是用于根據(jù)映射減少方式的數(shù)據(jù)處理的現(xiàn)有技術(shù)大規(guī)模數(shù)據(jù)處理系統(tǒng)的框圖。
[0028]圖3是根據(jù)映射減少方法的數(shù)據(jù)處理的現(xiàn)有技術(shù)方法的流程圖。
[0029]圖4是圖示由主節(jié)點完成的映射任務(wù)的圖3的流程圖的細節(jié)。
[0030]圖5是表示處理輸入數(shù)據(jù)的工人的框圖。
[0031]圖6是根據(jù)本發(fā)明的非限制性變型實施例的映射任務(wù)的流程圖。
[0032]圖7是圖示根據(jù)本發(fā)明的非限制性實施例的輸入數(shù)據(jù)文件的分割的框圖。
[0033]圖8是根據(jù)本發(fā)明的裝置的非限制性示例實施例的框圖。
[0034]圖9是圖示根據(jù)本發(fā)明的非限制性變型實施例的順序圖。
[0035]圖10是根據(jù)非限制性示例實施例的本發(fā)明的方法的流程圖。
[0036]為了促進理解,在可以指定對于示圖共同的一致的元素的地方使用一致的附圖編號。
【具體實施方式】
[0037]圖1是示出現(xiàn)有技術(shù)映射減少方法的原理的框圖(來源:維基百科)。
[0038]“主”節(jié)點101 (經(jīng)由箭頭1000)獲得輸入數(shù)據(jù)(“問題數(shù)據(jù)”)100,并且在“映射”步驟1010中,將其劃分為較小的子問題,它們被分發(fā)給“工人”節(jié)點102-105 (箭頭1001、1003、1005)。工人節(jié)點處理該較小問題(箭頭1002、1004、1006)并且向主節(jié)點通知任務(wù)完成。在“減少”步驟1011,主節(jié)點將“減少”操作分配給一些工人節(jié)點,其收集全部子問題的答案并且將它們以某種形式組合以形成輸出(“解決方案數(shù)據(jù)”)106 (經(jīng)由箭頭1007)。
[0039]圖2是根據(jù)映射減少方式的現(xiàn)有技術(shù)大規(guī)模數(shù)據(jù)處理系統(tǒng)的框圖。與圖1共同的元素已經(jīng)對該圖解釋了,并且不在此再度解釋。主處理201分割在文件Fl到Fn (1000)中存儲的問題數(shù)據(jù)100,該問題數(shù)據(jù)100分發(fā)給分配給了工人節(jié)點202-205的任務(wù)。主處理還負(fù)責(zé)向工人節(jié)點(類似工人節(jié)點210-211)分配減少任務(wù)。節(jié)點202-205產(chǎn)生中間數(shù)據(jù)值2000,其被收集并且寫入中間文件a (206)、b (207)到η (209)。當(dāng)向主節(jié)點通知中間結(jié)果被獲得時,主節(jié)點分配減少任務(wù)給工人節(jié)點210-211。這些處理從中間文件206-209取回輸入數(shù)據(jù)(2001),合并并且組合數(shù)據(jù),并且存儲(2002)產(chǎn)生的解決方案數(shù)據(jù)106。適于由映射減少處理的典型問題的示例是購物網(wǎng)站的客戶的性別和平均年齡的統(tǒng)計。輸入數(shù)據(jù)100則是購物網(wǎng)站的客戶購買數(shù)據(jù)庫。具有大量商業(yè)成功的網(wǎng)站,其客戶數(shù)據(jù)庫是龐大的一若干兆兆字節(jié)(terabyte)數(shù)據(jù)。數(shù)據(jù)存儲在文件Fl-Fn中。主進程以64M字節(jié)的片段分割每一個文件。借助工人節(jié)點的列表,主節(jié)點建立了安排表,其將輸入數(shù)據(jù)的每一個片段歸于一個任務(wù)和一個工人節(jié)點。根據(jù)我們的情形,要由工人節(jié)點執(zhí)行的任務(wù)是兩個:計算男性/女性買家的數(shù)量以及計算買家的平均年齡。每一個工人節(jié)點202到205存儲其中間結(jié)果在中間文件206-209的一個中。例如,中間文件“a”206包括來自第一文件片段Fl的女性客戶的數(shù)量和客戶的平均年齡,而中間文件“b” 207包括第二文件片段Fl的女性客戶的數(shù)量和平均年齡,而中間文件“η” 206包括通過第η文件片段“η”的女性客戶的數(shù)量和客戶平均年齡。當(dāng)向主節(jié)點通知工人202-205已經(jīng)完成它們的任務(wù)時,他分配減少任務(wù)給工人節(jié)點,諸如工人210-211.。這些工人執(zhí)行減少任務(wù),讀取中間文件“a”到“η”的內(nèi)容,產(chǎn)生存儲在解決方案數(shù)據(jù)106中的兩個結(jié)果輸出,即女性客戶的數(shù)量和平均客戶年齡。
[0040]圖3是主進程的流程圖。
[0041]在初始化步驟301,進程需要的變量和參數(shù)被初始化。在步驟302,主節(jié)點將輸入文件分割為通常幾十兆字節(jié)的片段(例如,16或64Μ字節(jié)),這個是由用戶經(jīng)由可選參數(shù)可控制的。然后,在步驟303,主節(jié)點驗證是否存在空閑工人節(jié)點。如果沒有,則步驟循環(huán)。如果存在空閑(或“自由”)工人節(jié)點,則主節(jié)點在步驟305驗證對于空閑工人節(jié)點是否仍存在要完成的映射任務(wù);如果存在,則主節(jié)點指令該空閑工人節(jié)點開始這些映射任務(wù)(箭頭3001和步驟304),并且隨后經(jīng)由箭頭3000返回步驟303。如果不存在要完成的映射任務(wù)了,則在步驟306開始減少任務(wù)。如果這些完成了,則以步驟307完成進程。
[0042]以下表1給出了由主節(jié)點保持的現(xiàn)有技術(shù)主節(jié)點任務(wù)安排表的示例。
[0043]
【權(quán)利要求】
1.一種用于處理映射減少框架中的數(shù)據(jù)的方法,其特征在于所述方法由主裝置(800,900)執(zhí)行,并且在于所述方法包括: 將輸入數(shù)據(jù)分割(10001)為輸入數(shù)據(jù)片段; 向工人節(jié)點分配(10002)用于處理所述輸入數(shù)據(jù)片段的任務(wù),其中向每一個工人節(jié)點分配用于處理輸入數(shù)據(jù)片段的任務(wù); 根據(jù)從執(zhí)行所述任務(wù)的工人節(jié)點(901,902,903)接收的數(shù)據(jù)確定(10003)指向由任務(wù)處理的輸入數(shù)據(jù)片段中的當(dāng)前讀取位置的讀取指針是否尚未達到輸入數(shù)據(jù)片段結(jié)尾之前的預(yù)定閾值;并且 將新任務(wù)分配(10004)給空閑的工人節(jié)點,新任務(wù)被歸于由在尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值的所述任務(wù)尚未處理的輸入數(shù)據(jù)片段的、稱為分割部分的部分,所述分割部分是位于所述當(dāng)前讀取指針位置之后的所述輸入數(shù)據(jù)片段的一部分。
2.根據(jù)權(quán)利要求1所述的方法,其中權(quán)利要求1的方法的最后步驟從屬于根據(jù)從所述任務(wù)接收的所述數(shù)據(jù)確定(3047)每個任務(wù)的輸入數(shù)據(jù)處理速度的步驟,并且對于數(shù)據(jù)處理速度低于數(shù)據(jù)處理速度閾值的每一個任務(wù)執(zhí)行權(quán)利要求1的最后步驟,所述數(shù)據(jù)處理速度根據(jù)從工人 節(jié)點接收的數(shù)據(jù)獲得的后續(xù)讀取指針確定。
3.根據(jù)權(quán)利要求1或2所述的方法,包括向執(zhí)行在尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值的任務(wù)的工人節(jié)點傳輸消息的步驟,該消息包含了用于更新由向其傳輸該消息的工人節(jié)點執(zhí)行的任務(wù)的輸入數(shù)據(jù)片段結(jié)尾的信息。
4.根據(jù)權(quán)利要求1或2所述的方法,包括在向任務(wù)提供的輸入數(shù)據(jù)流中插入EndOfFile標(biāo)記,用于將輸入數(shù)據(jù)的處理限制在位于所述分割部分之前的輸入數(shù)據(jù)片段的部分。
5.根據(jù)權(quán)利要求1到2的任一所述的方法,包括在所述主節(jié)點中更新安排表,所述安排表包括允許工人節(jié)點與分配給它的任務(wù)之間的關(guān)聯(lián)并且定義分配給它的任務(wù)的輸入數(shù)據(jù)片段部分開始和結(jié)束的信息。
6.根據(jù)權(quán)利要求1到2的任一所述的方法,其中所述方法包括處理輸入數(shù)據(jù)片段的非重疊部分的任務(wù)的推測執(zhí)行。
7.一種于用于處理映射減少框架中的數(shù)據(jù)的主裝置,其特征在于所述主裝置包括: 用于將輸入數(shù)據(jù)分割為輸入數(shù)據(jù)片段的部件; 用于向工人節(jié)點分配用于處理輸入數(shù)據(jù)片段的任務(wù)的部件,其中向每一個工人節(jié)點分配用于處理輸入數(shù)據(jù)片段的任務(wù); 用于根據(jù)從執(zhí)行任務(wù)的工人節(jié)點接收的數(shù)據(jù)確定,指向由任務(wù)處理的輸入數(shù)據(jù)片段中的當(dāng)前讀取位置的讀取指針是否尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值的部件;以及 將新任務(wù)分配給空閑的工人節(jié)點的部件,新任務(wù)歸于由尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值的任務(wù)尚未處理的輸入數(shù)據(jù)片段的、稱為分割部分的部分,所述分割部分是位于在當(dāng)前讀取指針位置之后的輸入數(shù)據(jù)片段的一部分。
8.根據(jù)權(quán)利要求7所述的主裝置,其中所述主裝置進一步包括用于根據(jù)從任務(wù)接收的數(shù)據(jù)確定每個任務(wù)的數(shù)據(jù)輸入處理速度的部件,以及確定數(shù)據(jù)處理速度是否低于數(shù)據(jù)處理速度閾值的部件,所述數(shù)據(jù)處理速度根據(jù)從工人節(jié)點接收的數(shù)據(jù)獲得的后續(xù)讀取指針確定。
9.根據(jù)權(quán)利要求7或8所述的主裝置,包括向執(zhí)行尚未達到輸入數(shù)據(jù)片段結(jié)尾之前預(yù)定閾值的任務(wù)的工人節(jié)點傳輸消息的部件,該消息包含了用于更新由向其傳輸該消息的工人節(jié)點執(zhí)行的任務(wù)的輸入數(shù)據(jù)片段結(jié)尾的信息。
10.根據(jù)權(quán)利要求7或8所述的主裝置,包括在向任務(wù)提供的輸入數(shù)據(jù)流中插入EndOf File標(biāo)記的部件,用于將輸入數(shù)據(jù)的處理限制在位于分割部分之前的輸入數(shù)據(jù)片段的部分。
11.根據(jù)權(quán)利要求7到8的任一所述的主裝置,包括用于在所述主節(jié)點中更新安排表的部件,所述安排表包括允許工人節(jié)點與分配給它的任務(wù)之間的關(guān)聯(lián)并且定義分配給它的任務(wù)的輸入數(shù)據(jù)片段部分開始和結(jié)束的信息。
12.根據(jù)權(quán)利要求7到8的任一所述的主裝置,其中所述主裝置包括用于處理輸入數(shù)據(jù)片段的非重疊部分的任務(wù)的推`測執(zhí)行的部件。
【文檔編號】G06F9/48GK103885835SQ201310711298
【公開日】2014年6月25日 申請日期:2013年12月20日 優(yōu)先權(quán)日:2012年12月20日
【發(fā)明者】N.勒斯庫阿內(nèi)克, E.勒莫爾 申請人:湯姆遜許可公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1