1.一種針對分布式存儲系統(tǒng)的性能監(jiān)控調(diào)優(yōu)系統(tǒng),其特征在于:包括數(shù)據(jù)處理模塊以及數(shù)據(jù)采集模塊;數(shù)據(jù)采集模塊與分布式存儲系統(tǒng)的節(jié)點一一對應,每個數(shù)據(jù)采集模塊通過探針實時獲取對應節(jié)點的硬件性能參數(shù)和軟件性能參數(shù);數(shù)據(jù)處理模塊包括瓶頸分析模塊和系統(tǒng)調(diào)優(yōu)模塊;瓶頸分析模塊根據(jù)所述軟件性能參數(shù)確定對應節(jié)點上IO棧的各個分層中占據(jù)IO棧當前處理時間最大的IO棧分層以及確定該節(jié)點上IO棧的各個分層中與相同時間間隔的歷史數(shù)據(jù)相比處理時間變化率最大的IO棧分層;系統(tǒng)調(diào)優(yōu)模塊依照貪心算法,在對應節(jié)點硬件性能未超出最大負載的情況下,對瓶頸分析模塊確定的IO棧分層所對應的分布式存儲系統(tǒng)配置參數(shù)進行調(diào)整;所述IO棧是指分布式存儲系統(tǒng)中處理讀寫請求時所需要的各個層次階段。
2.根據(jù)權(quán)利要求1所述一種針對分布式存儲系統(tǒng)的性能監(jiān)控調(diào)優(yōu)系統(tǒng),其特征在于:所述數(shù)據(jù)處理模塊還包括性能反饋模塊,性能反饋模塊比較所述調(diào)整前后的分布式存儲系統(tǒng)性能變化,如果系統(tǒng)性能提升,則保留調(diào)整結(jié)果,若系統(tǒng)性能未提升,甚至變差,則回滾此次調(diào)整。
3.根據(jù)權(quán)利要求1所述一種針對分布式存儲系統(tǒng)的性能監(jiān)控調(diào)優(yōu)系統(tǒng),其特征在于:所述硬件性能參數(shù)和軟件性能參數(shù)經(jīng)所述數(shù)據(jù)采集模塊處理為格式化數(shù)據(jù)后發(fā)送給所述數(shù)據(jù)處理模塊,所述數(shù)據(jù)處理模塊將接收的格式化數(shù)據(jù)存儲在數(shù)據(jù)庫中,格式化數(shù)據(jù)由參數(shù)名、參數(shù)值和時間戳組成。
4.根據(jù)權(quán)利要求3所述一種針對分布式存儲系統(tǒng)的性能監(jiān)控調(diào)優(yōu)系統(tǒng),其特征在于:所述數(shù)據(jù)處理模塊還包括數(shù)據(jù)清理模塊,數(shù)據(jù)清理模塊周期性刪除所述數(shù)據(jù)庫中指定時間之前的數(shù)據(jù),或者刪除所述數(shù)據(jù)庫中指定時間間隔內(nèi)的數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述一種針對分布式存儲系統(tǒng)的性能監(jiān)控調(diào)優(yōu)系統(tǒng),其特征在于:所述系統(tǒng)調(diào)優(yōu)模塊在節(jié)點硬件性能超出最大負載的情況下,查找占用硬件資源較多的IO棧分層,并嘗試釋放該層占用的部分硬件資源,若釋放資源后分布式存儲系統(tǒng)性能波動較小,則確定釋放資源,若分布式存儲系統(tǒng)性能快速下降,則將資源重新分配給該層。
6.一種針對分布式存儲系統(tǒng)的性能監(jiān)控調(diào)優(yōu)方法,其特征在于:包括以下步驟:
1)建立分布式存儲系統(tǒng)IO棧并依據(jù)邏輯結(jié)構(gòu)對IO棧進行分層;
2)在分布式存儲系統(tǒng)各個節(jié)點實時采集與IO棧各個分層相關(guān)的性能參數(shù)數(shù)據(jù)以及對應節(jié)點的硬件性能參數(shù)數(shù)據(jù);
3)將采集自分布式存儲系統(tǒng)各個節(jié)點的數(shù)據(jù)統(tǒng)一存放并定期整理;
4)針對分布式存儲系統(tǒng)某節(jié)點,利用所述性能參數(shù)數(shù)據(jù)比較IO棧每一層的當前處理時間,并找出占IO棧處理時間最大的IO棧分層,同時,對比IO棧每一層的當前處理時間和相同時間間隔下的歷史處理時間數(shù)據(jù),并找出處理時間變化率最大的IO棧分層;
5)建立調(diào)優(yōu)映射表,該映射表包括與IO棧每一層對應的分布式存儲系統(tǒng)內(nèi)的配置參數(shù);
6)從所述調(diào)優(yōu)映射表查找所述占IO棧處理時間最大的IO棧分層和所述變化率最大的IO棧分層對應的配置參數(shù),然后采用貪心算法,在不超過分布式存儲系統(tǒng)對應節(jié)點的硬件最大性能上限下,對查找到的配置參數(shù)進行調(diào)優(yōu)。
7.根據(jù)權(quán)利要求6所述一種針對分布式存儲系統(tǒng)的性能監(jiān)控調(diào)優(yōu)方法,其特征在于:所述調(diào)優(yōu)具體包括以下步驟:對查找到的配置參數(shù)進行調(diào)整,分析比較調(diào)整后和調(diào)整前的分布式存儲系統(tǒng)的性能變化,如果系統(tǒng)性能提升,則確認此次調(diào)整,如果性能下降,則回滾此次調(diào)整。
8.根據(jù)權(quán)利要求6所述一種針對分布式存儲系統(tǒng)的性能監(jiān)控調(diào)優(yōu)方法,其特征在于:所述存放前,對采集的數(shù)據(jù)進行格式化,使采集的數(shù)據(jù)變?yōu)橛蓞?shù)名、參數(shù)值和時間戳組成的格式化數(shù)據(jù)。
9.根據(jù)權(quán)利要求6所述一種針對分布式存儲系統(tǒng)的性能監(jiān)控調(diào)優(yōu)方法,其特征在于:所述定時整理具體包括以下步驟:周期性刪除指定時間之前的數(shù)據(jù),或者刪除指定時間間隔內(nèi)的數(shù)據(jù)。
10.根據(jù)權(quán)利要求6所述一種針對分布式存儲系統(tǒng)的性能監(jiān)控調(diào)優(yōu)方法,其特征在于:所述步驟6)中,在超過對應節(jié)點的硬件最大性能上限的情況下,查找占用硬件資源較多的IO棧分層,并釋放該層占用的部分硬件資源,若釋放資源后分布式存儲系統(tǒng)性能波動較小,則確定釋放資源,若分布式存儲系統(tǒng)性能快速下降,則將資源重新分配給該層。