可收集該至少一容器的工作狀態(tài),并將該工作狀態(tài)的狀態(tài)信息儲存至該規(guī)格文件。
[0083]在運算完工作21 (或主裝置分配的對應至工作21的任務)后,各個從屬裝置13的處理器133可根據(jù)對應至工作21的工作信息(job informat1n)及其規(guī)格文件建立一資源特征模型23。舉例而言,各個從屬裝置13的處理器133可根據(jù)對應至工作21的工作信息及其規(guī)格文件,利用一支持向量回歸(Support Vector Regress1n ;SVR)模塊產(chǎn)生器建立一資源特征模型。如同前述,資源特征模型23可視需求而包含各種特征模型,例如但不限于一中央處理單元特征模型、一存儲器特征模型、一網(wǎng)絡特征模型、一磁盤輸入輸出(Disk10)特征模型等等。
[0084]若叢集運算系統(tǒng)I包含分布式檔案系統(tǒng)15,主裝置11的處理器113可預先儲存對應至工作21的工作信息至分布式檔案系統(tǒng)21,而各個從屬裝置13的處理器133可從分布式檔案系統(tǒng)15中取得對應至工作21的工作信息。
[0085]若叢集運算系統(tǒng)I不包含分布式檔案系統(tǒng)15,各個從屬裝置13的處理器133亦可透過其它途徑取得對應至工作21的工作信息。舉例而言,各個從屬裝置13的處理器133可經(jīng)由連接接口 131與連接接口 111自主裝置11取得對應至工作21的工作信息。另舉例而言,各個從屬裝置13可包含一用以預先儲存對應至工作21的工作信息的儲存器(未繪示于圖),或自其它裝置預先取得對應至工作21的工作信息。
[0086]對本發(fā)明所屬技術(shù)領(lǐng)域中具有通常知識者而言,主裝置11與多個從屬裝置13與之間的互動可藉由類推得知,故以下將以圖2為本實施例的一范例,進一步說明叢集運算系統(tǒng)I中主裝置11與單一從屬裝置13之間的互動,惟此舉僅為了易于說明,并非用以限制本發(fā)明。圖2為叢集運算系統(tǒng)I中主裝置11與單一從屬裝置13的一運作例示圖,且圖2所示的從屬裝置13可以是圖1中所示多個從屬裝置13中的任一個。
[0087]如圖2所示,主裝置11可選擇性地包含以下構(gòu)件來協(xié)同完成連接接口 111與處理器113的前述功能:一資源管理器(resource manager) 1131、一工作管理器(jobmanager) 1133、一最佳資源模塊(optimal resource module) 1135 及一模型管理器(model manager) 1137。另外,從屬裝置13可選擇性地包含以下構(gòu)件來協(xié)同完成連接接口 131與處理器133的前述功能:一從屬管理器(slave manager) 1331、至少一容器(container) 1333、一模型產(chǎn)生器(model generator) 1335、一工作狀態(tài)收集器(workingstatus collector) 1337 及一規(guī)格文件 1339。
[0088]首先,當主裝置11接收到工作21時,資源管理器1131會開啟工作管理器1133,并將工作21交付給工作管理器1133處理。同時,資源管理器1131可自從屬管理器1331取得其裝置信息22,并將裝置信息22傳送至工作管理器1133。然后,工作管理器1133傳送工作21及裝置信息22至最佳資源模塊1135。在取得工作21及裝置信息22后,最佳資源模塊1135會根據(jù)工作21及裝置信息22向模型管理器1137取得資源特征模型23。同時,最佳資源模塊1135可將對應至工作21的工作信息25儲存到分布式檔案系統(tǒng)15。然后,最佳資源模塊1135會根據(jù)資源特征模型23估測從屬裝置13的容器組態(tài)參數(shù)24,并將容器組態(tài)參數(shù)24傳送至工作管理器1133。最后,工作管理器1133將容器組態(tài)參數(shù)24傳送至資源管理器1131。
[0089]在取得容器組態(tài)參數(shù)24之后,資源管理器1131會傳送容器組態(tài)參數(shù)24至從屬管理器1331,并分配工作21至從屬管理器1331。從屬管理器1331會根據(jù)容器組態(tài)參數(shù)24產(chǎn)生至少一容器1333以運算工作21 (或資源管理器1131分配的對應至工作21的任務)。從屬管理器1331可根據(jù)容器組態(tài)參數(shù)24決定容器1333的數(shù)量以及容器1333的中央處理單元規(guī)格以及存儲器規(guī)格。在容器1333運算工作21 (或資源管理器1131分配的對應至工作21的任務)的過程中,工作狀態(tài)收集器1337收集容器1333運算工作21 (或資源管理器1131分配的對應至工作21的任務)的工作狀態(tài),并將對應至該工作狀態(tài)的狀態(tài)信息26儲存至規(guī)格文件1339。狀態(tài)信息26可包含但不限于:各個容器1333的中央處理單元消耗量及存儲器消耗量。
[0090]在容器1333運算工作21 (或資源管理器1131分配的對應至工作21的任務)后,模型產(chǎn)生器1335可根據(jù)對應至工作21 (或資源管理器1131分配的對應至工作21的任務)的工作信息25及規(guī)格文件1339建立及/或更新資源特征模型23。舉例而言,模型產(chǎn)生器1335可根據(jù)工作信息25及規(guī)格文件1339,利用一支持向量回歸模塊產(chǎn)生器建立資源特征模型23。模型產(chǎn)生器1335可自分布式檔案系統(tǒng)15取得工作信息25及/或自從屬管理器1331取得工作信息25。自分布式檔案系統(tǒng)15取得工作信息25可包含但不限于:數(shù)據(jù)大小、Map/Reduce拆解數(shù)量等。自從屬管理器1331取得工作信息25可包含但不限于:各容器運算Map/Reduce的信息等。自規(guī)格文件1339取得的信息可包含但不限于:狀態(tài)信息26、運算過程中的硬件效能信息等。
[0091]圖3、圖4、圖5及圖6分別為最佳資源模塊1135、模型管理器1137、模型產(chǎn)生器1335及工作狀態(tài)收集器1337的一具體運作例示圖。然而,于本發(fā)明的其它實施例,圖2所示的最佳資源模塊1135、模型管理器1137、模型產(chǎn)生器1335及工作狀態(tài)收集器1337的運作可不需完全遵循第3-6圖所示的內(nèi)容,并且可在不脫離本發(fā)明的精神的情況下,進行適當?shù)恼{(diào)整、改變、及/或置換等處置。
[0092]如圖3所示,最佳資源模塊1135可包含一工作信息檢索器(job informat1nretriever) 1135a、一有效節(jié)點檢驗器(available node inspector) 1135b、一模型加載器(model loader) 1135c、一最佳資源預測器(optimal resource predictor) 1135d、及一最佳容器數(shù)量預測器(optimal container number predictor) 1135e。在工作管理器1133獲取工作21后,工作信息檢索器1135a會接收以下數(shù)據(jù):工作名稱(例如一演算法名稱)、輸入數(shù)據(jù)大小及全部Map/Reduce任務,并將輸入數(shù)據(jù)大小及全部Map/Reduce任務儲存到分布式檔案系統(tǒng)15。當叢集運算系統(tǒng)I中出現(xiàn)可用節(jié)點(即可用的從屬裝置13)時,有效節(jié)點檢驗器1135b會收到此節(jié)點的名稱。然后,模型加載器1135c會根據(jù)工作名稱與此節(jié)點的名稱至模型管理器1137中尋找相符的資源特征模型23。
[0093]最佳資源預測器1135d可藉由資源特征模型23預測對應到此節(jié)點的一容器的中央處理單元規(guī)格與一存儲器規(guī)格,而最佳容器數(shù)量預測器1135e可根據(jù)該中央處理單元規(guī)格與該存儲器規(guī)格預測此節(jié)點的容器數(shù)量。因此,透過最佳資源預測器1135d及最佳容器數(shù)量預測器1135e的上述運作,最佳資源模塊1135可估測出此節(jié)點的容器組態(tài)參數(shù)24,并將容器組態(tài)參數(shù)24傳送到工作管理器1133。
[0094]如圖4所示,模型管理器1137可包含一請求處理器(request handler) 1137a、一模型檢索器(model retriever) 1137b、一同質(zhì)模型引擎(homogeneous modelengine) 1137c及一同質(zhì)節(jié)點引擎(homogeneous node engine) 1137d。當最佳資源模塊 1135提出尋找資源特征模型23的請求后,請求處理器1137a會根據(jù)最佳資源模塊1135傳送的工作名稱與節(jié)點名稱,從分布式檔案系統(tǒng)15或其它來源所儲存的多個資源特征模型樣本中選出資源特征模型23。舉例而言,請求處理器1137a可選擇一相應資源特征模型、一相似資源特征模型及一預設(shè)資源特征模型其中之一作為資源特征模型23。
[0095]同質(zhì)模型引擎1137c可包含一模型信息檢索器(未繪示于圖)、一模型群組器(未繪示于圖)及一群組決定器(未繪示于圖)。當資源特征模型樣本的數(shù)量過高(例如超過一門檻值),該模型信息檢索器會截取各個資源特征模型樣本的各項信息,而該模型群組器會根據(jù)這些信息,將該等資源特征模型樣本分割為多個群組。例如,該模型群組器可利用K-means演算將該等資源