本發(fā)明一般地涉及信息中心網(wǎng)絡的數(shù)據(jù)包傳輸,并且更具體地涉及一種用于減少信息中心網(wǎng)絡的響應時間的方法和裝置。
背景技術:
網(wǎng)絡中的擁塞導致了數(shù)據(jù)包丟棄以及高排隊延遲,這增加了延遲時間以及流完成時間。作為示例,公司在每100ms的額外延遲時間會損失1%的銷售額。頁面生成中的額外的0.5s延遲時間會減少20%的網(wǎng)站流量。典型的機制依賴于歷史和概率統(tǒng)計方法。過往,創(chuàng)建流量矩陣并且為路徑分配權重以最小化最大鏈路利用率(minMLU)。概率上,期望將這些鏈路利用圖收斂到最優(yōu)值,然而這種收斂可能出現(xiàn)的太晚以至于不能借助改變網(wǎng)絡資源分配而緩解擁塞。某些工作僅檢測了數(shù)據(jù)中心網(wǎng)絡中大的,或“象型”尺寸的流并且防止它們在相同路徑上的碰撞。其他技術使用啟發(fā)法以包括基于內(nèi)容的差異化并且依賴于歷史數(shù)據(jù)。相等最短路徑之間的基于哈希的負載平衡是減少網(wǎng)絡中擁塞的另一嘗試。與某些源/目的地濾波器匹配的IP流可以包括不同的應用。此外。IP流是一種用于分配的資源數(shù)量的較差描述符。另外,不存在明確的語義以發(fā)送流結(jié)束的信號。
在網(wǎng)絡中需要較好的流量工程和資源分配機制以減少擁塞并且因此減少流的完成時間。當前的互聯(lián)網(wǎng)架構(gòu)對于該目標來說是不適合的。
技術實現(xiàn)要素:
由上可知,本領域技術人員可以認識到出現(xiàn)了對減少網(wǎng)絡中的擁塞,特別是減少信息中心網(wǎng)絡中的擁塞的技術的需求。根據(jù)本發(fā)明,提供了一種用于減少信息中心網(wǎng)絡的響應時間的方法和裝置,其極大地減少或基本上消除了與當前減少網(wǎng)絡擁塞技術相關聯(lián)的問題以及缺點。
根據(jù)本發(fā)明的實施例,提供了一種用于減少信息中心網(wǎng)絡的響應時間的方法,所述方法包括:接收來自進入網(wǎng)絡的內(nèi)容對象的入口節(jié)點的指示,所述內(nèi)容對象與通過所述網(wǎng)絡的新的傳送流相關聯(lián)。識別用于所述內(nèi)容對象的所述網(wǎng)絡中的出口節(jié)點,以及識別所述內(nèi)容對象的尺寸。部分基于所述內(nèi)容對象的所述尺寸,確定用于所述新的傳送流的待完成量和帶寬。確定所述網(wǎng)絡中的現(xiàn)有傳送流的待完成量和帶寬。確定從所述入口節(jié)點到所述出口節(jié)點的用于所述新的傳送流的所述網(wǎng)絡中的候選路徑的集合。對于每個候選路徑,基于所述待完成量和帶寬,估計對于每個候選路徑完成所有傳送流的總響應時間。選擇用于所述新的傳送流的具有最低總響應時間的候選路徑。
本發(fā)明描述了優(yōu)于常規(guī)網(wǎng)絡擁塞減少技術的許多技術優(yōu)點。例如,一個技術優(yōu)點在于識別用于內(nèi)容對象的通過網(wǎng)絡的路徑,所述路徑對網(wǎng)絡內(nèi)的現(xiàn)有內(nèi)容傳送流具有最少的影響。另一技術優(yōu)點在于在識別候選路徑中在網(wǎng)絡中的控制器的控制下,提供了帶寬共享。又一技術優(yōu)點在于相比于常規(guī)技術響應時間的增益。其他技術優(yōu)點根據(jù)隨附附圖、說明書以及權利要求,對本領域技術人員來說是顯而易見的和可辨識的。
附圖說明
為了更全面地理解本發(fā)明及其優(yōu)點,現(xiàn)在參考下面結(jié)合附圖的說明,其中相同的附圖標記表示相同部件,其中
圖1示出了實施基于內(nèi)容的流量分配機制的網(wǎng)絡;
圖2示出了用于執(zhí)行網(wǎng)絡中的路徑選擇的簡化過程;
圖3示出了用于在路徑選擇過程中估計特定候選路徑的簡化過程;
圖4示出了用在將路徑選擇過程與常規(guī)技術作比較中的第一網(wǎng)絡類型;
圖5示出了用在將路徑選擇過程與常規(guī)技術作比較中的第二網(wǎng)絡類型;
圖6示出了在具有第一流量需求的第一網(wǎng)絡類型中將路徑選擇過程與特定常規(guī)技術作比較的圖形;
圖7示出了在具有第二流量需求的第一網(wǎng)絡類型中將路徑選擇過程與特定常規(guī)技術作比較的圖形;
圖8示出了在具有第一流到達速率的第二網(wǎng)絡類型中將路徑選擇過程與各種常規(guī)技術作比較的圖形;
圖9示出了在具有第二流到達速率的第二網(wǎng)絡類型中將路徑選擇過程與各種常規(guī)技術作比較的圖形;
圖10示出了顯示帶寬分配對以不同流到達速率的路徑選擇過程和特定常規(guī)技術的影響的圖形;以及
圖11示出了適用于執(zhí)行路徑選擇過程的網(wǎng)絡中的實體的通用計算組件的簡化示例。
具體實施方式
如下所述的圖1到圖11以及用于描述該專利中的本發(fā)明的原理的各種實施例僅是說明性的,并且不應以任何方式來解釋以限制本發(fā)明的范圍。本領域技術人員將理解本發(fā)明的原理可以實施在任何類型的適當安排的設備或系統(tǒng)中。在一個附圖中所示且所討論的特征視情況可以實施在一個或更多個其他的附圖中。
信息中心網(wǎng)絡(ICN)支持由來自內(nèi)容的用戶對于內(nèi)容的請求而發(fā)起的流。用戶可以在網(wǎng)絡內(nèi)或在不同的網(wǎng)絡域中。網(wǎng)絡接收所述請求并且內(nèi)容流回通過網(wǎng)絡。將內(nèi)容對象映射到單一流并且將組成一個內(nèi)容對象的所有組塊(chunk)分配給通過網(wǎng)絡的相同的路徑。ICN可以支持來自多個源的組塊的傳輸,然而為了討論的目的,假設所有的組塊沿著相同的路徑。
如果執(zhí)行了嚴格的路徑對稱,則可以對所述請求作出流量分配決定。也就是說,如果用戶發(fā)送了識別內(nèi)容對象的CCN/NDN興趣數(shù)據(jù)包,則可以通過在內(nèi)容的期望路徑上將興趣數(shù)據(jù)包路由到持有數(shù)據(jù)的位置,來自執(zhí)行路徑選擇。然而,為了討論的目的,一旦內(nèi)容流從直接連接到網(wǎng)絡的主機或從不同域進入網(wǎng)絡,則由網(wǎng)絡作出用于將內(nèi)容傳輸?shù)秸埱笳叩幕趦?nèi)容的路由決定。
內(nèi)容唯一地(例如,在ICN中,通過名字)與它的標識符相關聯(lián),并且內(nèi)容尺寸也與該標識符相關聯(lián)。任何常規(guī)的機制可以用來創(chuàng)建內(nèi)容名字到它的尺寸的映射。
更正式地,考慮網(wǎng)絡圖G=(N,E),其中N為節(jié)點的集合并且E為鏈路的集合。每個單獨鏈路e具有容量ce。在頂點(源)s進入網(wǎng)絡且在頂點(目的地)d離開的每個內(nèi)容(或流)zs,d可以從Ks,d個不同路徑的集合中選擇路徑Pks,d(Pks,d,k=1;:::;Ks,d),其中路徑是從u到v的鏈路E的集合中的鏈路e的非循環(huán)序列。如果鏈路e屬于對于一些s,d,k的路徑Pks,d,則我們說e∈Pks,d,將Ks,d假設為相對較低,以簡化分配決定以及管理復雜性。在示例性評估中,Ks,d的范圍從3到5。
根據(jù)傳統(tǒng)的聯(lián)網(wǎng)模型,盡管本發(fā)明適用于任何類型的流量,但為了測試目的根據(jù)泊松過程使用速率λs,d生成從s到d的流量流。由于每個流對應于一段內(nèi)容并且由于網(wǎng)絡對內(nèi)容尺寸進行訪問,因此一旦流z到達網(wǎng)絡中,網(wǎng)絡就對流尺寸(其還由z表示)進行訪問。尺寸z可以從已知的分布(可以經(jīng)驗地測量的內(nèi)容尺寸的分布的已知分布)中使用平均值來獲取。將對于流z的網(wǎng)絡的響應時間定義為在網(wǎng)絡的入口處的z的第一組塊的第一到達與直到在網(wǎng)絡的出口處的流z的最后組塊的最后離開之間的時間。
將在到達速率λs,d下的流量的數(shù)量和z的分布假設為穩(wěn)定的并且可以按照如下方式被分配到路徑Pks,d,所述方式為:被分配到每個鏈路e的負載(平均上)小于該鏈路的容量。換句話說,存在其中0≤πks,d≤1并且∑kπks,dπ=1的系數(shù)ππks,d,1;:::;Ks,d,以便鏈路e的鏈路利用率ue滿足下面的可行性條件:
應注意的是矩陣對應于網(wǎng)絡中的流量矩陣,并且πks,d對應于靜態(tài)流量工程決定。例如,可能的流量工程策略可以使用概率πks,d將從s到達至d的流隨機分離在Ks,d個可能路徑pks,d上。術語minMLU表示隨機分離策略,其中系數(shù)πks,d的選擇最小化maxe∈E ue。這是最小化最大鏈路利用率的典型的min-MLU流量工程策略。
一個重要的方面在于僅修改了通過網(wǎng)絡的對象的路徑,而不修改提供到網(wǎng)絡的流量的數(shù)量。因此,如果存在對于等式1的解決方案,則網(wǎng)絡將是穩(wěn)定的(即,能夠傳輸所有的流量),并且使網(wǎng)絡保持穩(wěn)定的所有策略的鏈路利用率將是相同的。本發(fā)明的目的不在于提高鏈路利用率,而在于減少傳輸流(或相等地,通過小定理,在任何給定的時間進行中的流的數(shù)量)的延遲。
另一關鍵方面在于在給定時間考慮流的數(shù)量。對于極大數(shù)量的流,根據(jù)系數(shù)πssdk的流的概率分離將產(chǎn)生通過中心極限定理收斂到等式1的結(jié)果。這意味著在這種情況下的鏈路利用率將接近于最佳。進一步地,對于非常大數(shù)量的流,資源分配需要保持簡單以跟上速度。然而,對于較小規(guī)模并且在重尾流尺寸分布的情況下,概率資源分配將具有更糟糕的結(jié)果(將顯示在下面的評估中)。
當前網(wǎng)絡缺乏使該設想成為可能的能力。由于與不存在比給定超時長的干擾的IP頭濾波器相匹配的數(shù)據(jù)包的序列可以包含多個不同的內(nèi)容、應用或甚至用戶,因此IP流難以適當?shù)囟x。細粒度資源分配創(chuàng)造了對于底層網(wǎng)絡以及用于提供分配的機制的大量要求。當前網(wǎng)絡因為缺乏適當?shù)墓ぞ咭约疤崛《恢С诌@種機制。為執(zhí)行網(wǎng)絡中的資源分配而考慮了4種要求,即基于內(nèi)容的提取、基于內(nèi)容的控制面、流量估計以及可擴展性。
對于基于內(nèi)容的提取,為了執(zhí)行細粒度資源分配,網(wǎng)絡層需要能夠唯一地識別每個流并且能夠區(qū)別不同的內(nèi)容和用戶。當前的IP架構(gòu)已經(jīng)向著執(zhí)行每個流決定的控制面方向演進。由于新的流進入網(wǎng)絡,因此應用通過控制器設置的規(guī)則。由于期望實現(xiàn)內(nèi)容特定的流量工程,因此可以將這種機制擴展為應用到內(nèi)容。
網(wǎng)絡的控制面擴展到邊緣并且能夠為每段內(nèi)容(或它的子集)作出一次路由決定。決定可以是如在入口邊緣分配標簽(諸如MPLS標記)那樣簡單,以便流沿著給定路徑通過網(wǎng)絡結(jié)構(gòu)(fabric),直到它到達出口邊緣??刂泼孢€需要意識到網(wǎng)絡結(jié)構(gòu)中的擁塞以作出適當?shù)穆窂竭x擇。對此,利用網(wǎng)絡監(jiān)控設施來跟蹤分配到節(jié)點的外向鏈路的流量的數(shù)量。換句話說,當將具有尺寸z的流zs,d分配到第k個路徑Pks,d時,將z添加到由路徑Pks,d穿過的邊緣的待完成量(backlog)。對于監(jiān)控擁塞的節(jié)點,要求對流以及剩余待完成量的描述。盡管將策略設計為考慮通過網(wǎng)絡的所有流以便減少網(wǎng)絡的響應時間,仍可以實施忽略某一閾值下的所有流并且對于資源分配聚焦到僅識別象型流的策略。根據(jù)分配到路徑的流的知識,流量分配機制能夠獲得轉(zhuǎn)發(fā)面的一些行為。
為了流量估計,控制面需要意識到在給定流條件下的轉(zhuǎn)發(fā)面的行為。TCP是使網(wǎng)絡內(nèi)的轉(zhuǎn)發(fā)行為(例如,對擁塞的反應)視端點處的策略而定的端到端協(xié)議。為了適當?shù)胤峙滟Y源,將控制面設計為理解它的決定對于流的影響并且設計為具有TCP行為的模型(基于先前觀察的網(wǎng)絡狀態(tài)的理論模型或經(jīng)驗模型)。對此的一個潛在方式是讓控制面控制該TCP行為。這違反了當前的方式,在當前的方式中將傳輸層的控制委托給了傳輸?shù)亩它c。
任何資源分配策略必須隨著網(wǎng)絡的尺寸按比例增加。對于大的規(guī)模,概率方法將接近最優(yōu)??梢詫嵤?層策略,即在核心中的概率minMLU機制和在邊緣的動態(tài)分配。該2層策略提供了處理不同規(guī)模的網(wǎng)絡的靈活性。
圖1顯示了實施滿足上述要求的基于內(nèi)容的流量分配機制的網(wǎng)絡100中的元素。網(wǎng)絡100使用為內(nèi)容命名的ICN協(xié)議,以便內(nèi)容對象由它的名字唯一地識別。中心控制器102在網(wǎng)絡100的邊緣處物理地或邏輯地作出基于內(nèi)容的決定。邊緣實體通常是連接到控制器102的一個或多個節(jié)點/交換機104。
控制器102包括內(nèi)容管理單元106、網(wǎng)絡監(jiān)控單元108以及分配算法單元110,以便用于通過在網(wǎng)絡100中的節(jié)點/交換機104處設置規(guī)則或通過為預計算路徑分配標記從而為內(nèi)容對象選擇通過網(wǎng)絡100的路徑??梢詫⒖刂破?02實施為OpenFlow的擴展。內(nèi)容名字到其尺寸的映射是直接簡單的。
內(nèi)容管理單元106將內(nèi)容映射到網(wǎng)絡100的緩存中的位置或映射到網(wǎng)絡100外的出口路徑,監(jiān)控諸如識別內(nèi)容尺寸的內(nèi)容信息,并且保存內(nèi)容到其尺寸的映射的數(shù)據(jù)庫。
網(wǎng)絡監(jiān)控單元108通過針對網(wǎng)絡狀態(tài)輪詢節(jié)點/交換機104,通過從輸入以及預計的網(wǎng)絡演變或上述兩者的組合估計狀態(tài),維持對于網(wǎng)絡100內(nèi)的狀態(tài)的觀察。
分配算法單元110基于內(nèi)容管理單元106和網(wǎng)絡監(jiān)控單元108的輸入,決定對于(源,目的)對來說哪個候選路徑將提供最好的網(wǎng)絡性能。
圖2顯示了用于執(zhí)行網(wǎng)絡100中提供的路徑選擇的簡化過程200。過程200開始于框202,其中網(wǎng)絡正運行且等待將被接收的新的流。一旦接收了新的流的內(nèi)容,入口節(jié)點/交換機104就在框204執(zhí)行用于發(fā)現(xiàn)控制器102的查找操作并且啟動新的流的配置。在框206,內(nèi)容管理單元106識別網(wǎng)絡100中的目的地端節(jié)點104,網(wǎng)絡監(jiān)控單元108確定初始帶寬和待完成量,并且分配算法單元110計算候選路徑。對于每個候選路徑,在框208、210和212中通過分配算法單元110針對特定路徑計算現(xiàn)有流的響應時間。盡管在執(zhí)行這些計算時,可以包括任何數(shù)量的候選路徑,使用待評估的3個候選路徑來顯示過程200。在框214,分配算法單元110選擇具有最低總完成時間的路徑。在框216,將路徑?jīng)Q定提供給入口節(jié)點/交換機104。在框218,入口節(jié)點/交換機104在所選路徑上傳輸內(nèi)容。處理200返回到框202以等待接收新的流。
圖3顯示了由分配算法單元110執(zhí)行的對于特定候選路徑的簡化過程300。在框302,過程300開始,其中分配算法單元110使用現(xiàn)有流、相關路徑、帶寬分配以及待完成量。在框304,分配算法單元110接收對于所有現(xiàn)有流的帶寬分配。在框306,處理每個流直到流已經(jīng)完成為止。一旦流完成,更新響應時間和剩余流的待完成量。在框308,判斷總剩余待完成量是否已經(jīng)達到零。如果否,則過程300返回到框302以迭代剩余流。一旦將所有的待完成量處理到零,在框310計算總響應時間以便于圖2中框214處的其他候選路徑的其他總響應時間的比較。
過程300中提供的最小響應時間策略(MRTP)基于下述參數(shù)和函數(shù)。參數(shù)zi表示網(wǎng)絡中待傳輸?shù)牡趇個內(nèi)容以及它的以字節(jié)為單位的尺寸。對于從源s∈所有源S到目的地d∈所有目的地D的每個點到點內(nèi)容傳輸,待完成量函數(shù)Bzi(t)與表示由內(nèi)容zi從s到d處于時間t生成的待完成量的每個內(nèi)容傳輸相關聯(lián)。讓tzi作為內(nèi)容zi的到達時間,于是Bzi(t)作為t的非增函數(shù),t∈[tzi,+∞),t從內(nèi)容尺寸zi減小到0。例如,如果考慮使用鏈路的全容量c的流,則可以如下所示的給出Bzi(t):
Bzi(t)=[zi-c(t-tzi)]+ (2)
其中[g]+=max{g,0}??偟膩碚f,由于流交互的動態(tài)以及傳輸協(xié)議(例如,TCP)的動態(tài),通過從原始內(nèi)容尺寸中減去已經(jīng)穿過鏈路的內(nèi)容的體積來計算在每個鏈路的Bzi(t)是容易的。Bzi(t)對應于流zi未完成的、剩余的數(shù)量。要注意的是該待完成量不在網(wǎng)絡內(nèi),而是與對于特定對象還沒有通過網(wǎng)絡傳輸?shù)臄?shù)據(jù)量相對應。
帶寬共享函數(shù)在每單位時間將f(zi)單位的帶寬分配給對象zi。例如,如果TCP是傳輸協(xié)議,則可以將f(zi)看作通過攜帶zi的TCP會話實現(xiàn)的速率。
對于所有的i=1;:::;n-1(其中,第n個到達待被安排)給出f和B(zi),可以估計對于所有內(nèi)容傳輸?shù)耐瓿蓵r間。這是一種觀察下一內(nèi)容對象(即,對象i)直至結(jié)束的迭代過程,以便對于所有的i=1;:::;n-1來說,B(zj)/f(zj)≤B(zi)/f(zi)。一旦zi完成,我們就具有不同集合的對象(其中B(zi)>0的所有對象減去zj)。對所有的對象執(zhí)行迭代,以便B(zi)>0從而計算每個對象的完成時間。參數(shù)Tv(zi)表示在分配集合V下的zi的完成時間,所述分配集合V描述了對象z1;:::;zn-1的路徑分配。
對于到達zn,存在可以分配zn的源s與目的地d之間的所有路徑Ks,d的子集Ps,d。識別子集Ps,d={Pks,d,k=1;:::;Ks,d}的示例性技術是使用Yen的k最短路徑算法的輸出,所述算法被改進以增加路徑的多樣性,從而獲取將從其中作出選擇的Ks,d最短路徑的集合。K表示候選路徑子集的基數(shù),并且VPi,i=1;:::;k表示描述當前分配加上zn到第i條路徑Pi∈Ps,d的潛在分配的分配集合。例如,VP1是具有待完成量B(zi)的z1;:::;zn-1到它們的當前路徑的分配以及具有待完成量L或在該情況下,對象尺寸)B(zn)的zn到Ps,d中的第一路徑的分配。選擇路徑P∈Ps,d以便:
即,具有系統(tǒng)中的所有對象的最小總完成時間的路徑。
用于源于節(jié)點a且去往節(jié)點b的進入內(nèi)容zn的路徑選擇的最小響應時間策略(MRTP)可以總結(jié)如下。對于每個(s,d)流量需求對的每個候選路徑Ps,d以及正被傳遞的每個內(nèi)容zi的B(zi)(t),其中i=1,...,n-1,B(zi)(t)>0,從候選路徑選擇一個路徑P∈Pa,b,1≤i≤Ka,b且通過V->V+zn→P將其插入到分配集合。給出帶寬函數(shù)f(zi)以及剩余的待完成量B(zi),計算每個流的期望響應時間TV(zi)。發(fā)現(xiàn)檢查時間tcheck,其是由tcheck=miniTV(zi)發(fā)現(xiàn)的最小期望響應時間。通過B(zi)=(B(zi)-tcheck xf(zi))+更新在時間tcheck每個流的待完成量。如果所有的流沒有被完全傳送,則遞歸返回且計算在檢查點之后未終止流的響應時間。通過Tv(zi)=Tv(zi)+tcheck更新流的響應時間,其中TV(zi)是對于候選分配V的流zi的合計響應時間。如果所有的流被完全傳送了,則計算所有流的總響應時間為迭代地返回并且選擇下一候選路徑,直到所有候選路徑被連續(xù)選擇為止。根據(jù)每個候選路徑場景Tv的總響應時間,選擇將給出最小總響應時間的一個。將該路徑加入到路徑的現(xiàn)有集合中并且在所選路徑上傳送進入內(nèi)容zn。
最小響應時間策略(MRTP)要求待完成量B(zi)以及帶寬共享函數(shù)f(zi)的知識??梢栽谶吘壧幈O(jiān)控待完成量或者如果函數(shù)f(zi)在所有時間是被知道的,則可以計算該待完成量。可以從傳輸層的模型或從網(wǎng)絡狀態(tài)的經(jīng)驗測量估計函數(shù)f(zi)、Vi。然而,為了實現(xiàn)性能目標,由控制器在寬帶分配時設置函數(shù)f(zi),以便公平地共享帶寬并且最小化完成時間。因為從網(wǎng)絡邊緣到客戶的帶寬由于用戶的移動性以及異構(gòu)訪問條件會變化,所以這種帶寬分配僅在網(wǎng)絡結(jié)構(gòu)內(nèi)部是可實用的。然而,在ICN中,這種帶寬共享計算可被用來將數(shù)據(jù)傳送到在網(wǎng)絡的邊緣處的緩存。
如下所述,可以由控制器102中的網(wǎng)絡監(jiān)控單元108來執(zhí)行帶寬共享函數(shù)。對于所有的鏈路e∈E,計算共享每個鏈路的流的數(shù)量pe。對于每個對象zi,通過BWmin,zi=mine∈Pzice/pe,發(fā)現(xiàn)最小瓶頸帶寬限制。通過BWbott=mini BWmin,zi,發(fā)現(xiàn)所有流中的最小帶寬限制。對于滿足BWmin,zi=BWbott的任何流,將BWbott帶寬分配給該流。在帶寬分配后,更新鏈路容量并且從列表去除已分配的流。如果仍然存在等待帶寬分配的流,則帶寬共享函數(shù)返回并且為每個待定流迭代。一旦處理了所有的流,網(wǎng)絡監(jiān)控單元108將帶寬分配提供到分配算法單元110用于路徑選擇。
可以使用Java模擬器估計提出的MRTP針對minMLU、MBP以及循環(huán)格式(RRF)的響應時間性能??梢栽贙.Su和C.Westphal的“On the benefit of information centric networks for traffic engineering”,IEEE ICC會議,2014年6月發(fā)現(xiàn)minMLU和MBP的技術細節(jié)。在循環(huán)格式中,每個源-目的地對具有一Ks,d路徑的集合。每次新的流進入到這兩個節(jié)點之間的網(wǎng)絡,以循環(huán)格式選擇這些路徑。對于每個模擬設置,在兩個不同的網(wǎng)絡和幾個不同的流量模型和參數(shù),執(zhí)行提出的MRTP與常規(guī)分配技術之間的評估。在下列評估中使用帶寬共享函數(shù),由于使用該帶寬共享的minMLU的性能總是好于使用TCP的minMLU的性能分配。因此,通過比較MRTP算法與minMLU和該帶寬共享,對minMLU和TCP而言,MRTP的增益被低估。
圖4描述了在評估中使用的第一網(wǎng)絡類型。該第一網(wǎng)絡類型是具有11個節(jié)點和14個邊緣的阿比林(Abilene)(WAN)網(wǎng)絡,是由Intemet2團隊建立的骨干網(wǎng)。除了印第安納波利斯和亞特蘭大中的節(jié)點之間的鏈路的容量為2480Mbps以外,每個鏈路的容量為9920Mbps。基于由B.Fortz和M.Thorup的“Internet traffic engineering by optimizing OSPF weights”,INFOCOM 2000,Nineteenth Annual Joint Conference of the IEEE Computer and Communications Societies,Proceedings,IEEE,volume 2,pages 519-528 vol.2,2000給出的OSPF鏈路權重和Yen的算法來計算每個源-目的地節(jié)點對的三個候選路徑。不同的流量需求矩陣用于表征流量輸入。它們是均勻的基于重力的,且是來自Y.Zhang,Abilene traffic matrices,http://www.cs.utexas.edu/yzhang/research/AbileneTM/的現(xiàn)實模型。在5分鐘的周期內(nèi),通過測量阿比林網(wǎng)絡中的每個源-目的地對的端到端流量來建造現(xiàn)實矩陣。針對對象尺寸和到達時間分別通過使用帕累托分布和泊松過程來創(chuàng)建流量輸入。帕累托參數(shù)χm和α以及柏松參數(shù)λ在不同的模擬中變化以測量各種流量情況下的性能。
圖5描述了在評估中使用的第二網(wǎng)絡類型。第二網(wǎng)絡類型是包括8個機架交換機和3個核心交換機的數(shù)據(jù)中心(DC)網(wǎng)絡,其構(gòu)成了組合的11個節(jié)點。網(wǎng)絡是完全雙向連接的,這意味著在每個機架與核心交換機之間存在一條鏈路。將統(tǒng)一的流量需求矩陣假設在DC網(wǎng)絡中的每個機架交換機之間。在每個機架交換機對之間存在3個不相交且等價的路徑。這些路徑具有越過核心交換機中的一個核心交換機的2跳的長度。
如上所述,使用網(wǎng)絡模擬器或Java模擬器。在兩個模擬器中,目標是測量流量輸入的集合的平均響應時間并且比較不同算法的結(jié)果。內(nèi)容的響應時間是對于內(nèi)容的最后數(shù)據(jù)包的確認的到達與第一數(shù)據(jù)包到達之間的差值。
圖6顯示了基于流量需求在阿比林(Abilene)(WAN)網(wǎng)絡中使用第一Java模擬場景的對于MRTP和minMLU的響應時間結(jié)果,從Y.Zhang,Abilene traffic matrices,http://www.cs.utexas.edu/yzhang/research/AbileneTM/中獲取所述流量需求。為了創(chuàng)造不同的流量輸入,應用對于χm的3個不同值3、30和300。對于χm=300,流到達速率(λ)在12和18之間變化,對于χm=30,流到達速率(λ)在120和180之間變化,并且對于χm=3,流到達速率(λ)在1200和1800之間變化。使用如下公式計算流量負載:
其對應于在具有該特定值的60%鏈路利用率與100%鏈路利用率之間。使用25084Mbps的流量負載滿足對于該流量矩陣的該網(wǎng)絡中的100%的鏈路利用率。注意在χm=30以及χm=3情況下的響應時間測量按10和100進行調(diào)整以將所有的3個模擬場景納入在相同的圖中。與minMLU相比,MRTP減少了大約40%的平均響應時間。
圖7顯示了在阿比林(Abilene)(WAN)網(wǎng)絡中使用第二Java模擬的對于MRTP和minMLU的響應時間結(jié)果,其具有基于重力的流量需求。在該模型下,它要求65140Mbps的流量負載以實現(xiàn)100%的鏈路使用率,因此更新到達速率參數(shù)λ以實現(xiàn)60%和100%的鏈路使用率之間的鏈路使用率。對于χm=3,將參數(shù)λ設置在3000和4800之間,對于χm=30,將參數(shù)λ設置在300和480之間,對于χm=300,將參數(shù)λ設置在30和48之間。注意,如前,在χm=30以及χm=3情況下的響應時間測量按10和100進行調(diào)整以將所有的3個模擬場景納入在相同的圖中。與minMLU相比,模擬結(jié)果顯示MRTP減少了大約30%的響應時間。
圖8和圖9顯示了在具有統(tǒng)一流量需求矩陣的DC網(wǎng)絡中使用Java模擬的響應時間結(jié)果。除了MRTP和minMLU,在模擬中還包括MBP和RRF。如在WAN模擬中,安排流量輸入?yún)?shù)以便他們對應在60%至100%的鏈路使用率之間。在統(tǒng)一流量模型下,DC網(wǎng)絡要求229151Mbps的流量負載以實現(xiàn)100%的鏈路使用率。對于λ=15,將χm設置在2000至3250之間,對于λ=1500,將χm設置在20至32.5之間。圖8顯示了在λ=15的情況下對于流量輸入的4種不同技術的響應時間計算。圖9顯示了在入=1500的情況下對于流量輸入的4種不同技術的響應時間計算。在兩幅圖中,MRTP明顯優(yōu)于其他技術。它相比于minMLU和RRF減少了大約40%至45%的響應時間。在低利用率狀態(tài)下,MBP策略表現(xiàn)第二好,但是在高利用率狀態(tài)下,它的性能衰退。
圖10顯示了使用Java模擬場景的對于MRTP和minMLU的響應時間結(jié)果以觀察帶寬分配策略對于響應時間減少的效果。對于Java模擬,將分配給任何流的最大帶寬設置為1000Mbps。基于流量需求創(chuàng)建流量輸入,所述流量需求從Y.Zhang,Abilene traffic matrices,http://www.cs.utexas.edu/yzhang/research/AbileneTM/中獲取。將λ參數(shù)設置為10、100以及1000并且將χm值相應地設置以實現(xiàn)60%至100%之間的鏈路利用率。從響應時間結(jié)果中清楚的是當存在對于帶寬的限制時,MRTP的益處下降。因此,通過控制器執(zhí)行的帶寬分配產(chǎn)生了改進的響應時間結(jié)果。
如上所示,使用稍微高成本的控制器內(nèi)復雜性實現(xiàn)了響應時間的顯著增益。然而,細粒度資源分配的增益和有效性要比控制器內(nèi)為了實施本文所述特征的復雜性的任何附加成本更有價值。
由于所有新的對象均調(diào)用控制器,因此可以提高該方法的可擴展性。例如,使用閾值以僅監(jiān)控象型流會減少調(diào)度決策的數(shù)量??梢月┑舴峙涠塘?,不會有重大的損失。
該算法測量總響應時間,但是其可以被修改為包括其他的目標。例如,一個目標可以是通過流的尺寸標準化響應時間以便不損失短流。其他的性能目標可以針對路徑選擇而計算。
還可以優(yōu)化帶寬估計機制。例如,對于在穩(wěn)定狀態(tài)下運行的網(wǎng)絡,學習方法可以允許網(wǎng)絡控制器基于先前運行訪問特定流的性能。適當?shù)馁Y源分配還應該分配帶寬,并且傳輸層演進成支持該帶寬分配。
圖11示出了適合實現(xiàn)本文所述的一個或多個實施例的通用計算機組件1100的簡化示例。對于控制器102和節(jié)點/交換機104的上述組件可以在諸如計算機的任何通用計算組件或具有充足處理能力、存儲器資源以及網(wǎng)絡吞吐量能力以處理在其上放置的必要工作量的網(wǎng)絡組件上實現(xiàn)。此外,內(nèi)容管理單元106、網(wǎng)絡監(jiān)控單元108以及分配算法單元110的特征可以在一個或多個諸如計算機的通用計算組件上或具有充足處理能力、存儲器資源以及網(wǎng)絡吞吐量能力以處理在其上放置的必要工作量的網(wǎng)絡組件上實現(xiàn)。計算組件1100包括與存儲設備、輸入/輸出(I/O)設備1110以及網(wǎng)絡/組件連接設備1112通信的處理器1102(其可以被稱為中央處理器或CPU),所述存儲設備包括輔助存儲器1104、只讀存儲器(ROM)1106、隨機存取存儲器(RAM)1108。處理器1102可以作為一個或多個CPU芯片實現(xiàn),或可以作為一個或多個專用集成電路(ASIC)的部分。
輔助存儲器1104典型地包括一個或多個磁盤驅(qū)動器或磁帶驅(qū)動器,并且用于數(shù)據(jù)的非易失性存儲,并且如果RAM 1108不夠大以至于無法容納所有工作數(shù)據(jù),則用作溢出數(shù)據(jù)存儲設備。輔助存儲器1104可以用于存儲程序,當選擇執(zhí)行該程序時,所述程序被加載到RAM 1108中。ROM 1106用于存儲指令并且可能存儲在程序執(zhí)行期間讀取的數(shù)據(jù)。ROM 1106是通常具有相對于輔助存儲器1104的較大存儲器容量來說小的存儲器容量的非易失性存儲器。RAM 1108用于存儲易失性數(shù)據(jù)并且可能存儲指令。存取ROM 1106和RAM 1108兩者通常比存取輔助存儲器1104更快。附加處理器和存儲設備可以基于每個組件的功能并入控制器102、節(jié)點/交換機104、內(nèi)容管理單元106、網(wǎng)絡監(jiān)控單元108和分配算法單元110內(nèi)。
總的來說,流量工程架構(gòu)和分配算法被呈現(xiàn)為利用信息中心網(wǎng)絡的提取以執(zhí)行在內(nèi)容水平上的細粒度資源分配。不同于IP,ICN提供了適當?shù)奶崛∫栽黾泳W(wǎng)絡資源的效率并且減少了網(wǎng)絡的響應時間。ICN提供了通過允許以內(nèi)容的粒度進行資源調(diào)度來重思考流量工程的機會。用于執(zhí)行基于內(nèi)容的資源分配的結(jié)構(gòu)包括通過考慮傳輸內(nèi)容對象所花費的時間并且通過關于最小化與其他內(nèi)容對象的傳輸相關的傳輸時間而優(yōu)化分配,將內(nèi)容對象分配到網(wǎng)絡中的路徑。
控制器可以計算候選路徑集合的估計的響應時間并且甚至相對小的這種候選路徑的集合可以在響應時間產(chǎn)生顯著增益??刂破骱喜⒘髁糠峙涞铰窂綇亩钚』W(wǎng)絡中的流的總響應時間的MRTP策略。這基于對于每個流的帶寬的估計,這可以通過控制器估計或控制。通過控制器的帶寬控制提供了分配資源的有效方式并且實施帶寬共享函數(shù)以實現(xiàn)公平以及性能的目標。
與先前的提議相比,利用所述架構(gòu)實現(xiàn)了響應時間的顯著增益,所述架構(gòu)包括最小化最大鏈路利用率(minMLU)的流量工程策略。在多網(wǎng)絡拓撲以及網(wǎng)絡狀態(tài)下估計的MRTP顯著地增加了對于大范圍網(wǎng)絡利用率以及對于不同流量尺寸分布的網(wǎng)絡的響應時間。在一些評估場景中,在所有的情況下實現(xiàn)了減少延遲,相比minMLU,響應時間得到了多達50%的改進。
在一些實施例中,通過計算機程序?qū)嵤┗蛑С忠粋€或多個設備的一些或所有的功能或處理,由計算機可讀程序代碼形成所述計算機程序并且所述計算機程序包含在計算機可讀介質(zhì)中。短語“代碼”包括任何類型的計算機代碼,包括源代碼、標代碼和可執(zhí)行代碼。短語“計算機可讀介質(zhì)”包括能夠被計算機訪問的任何類型的介質(zhì),諸如只讀存儲器(ROM)、隨機存取存儲器(RAM)、硬盤驅(qū)動器、光盤(CD)、數(shù)字視頻光盤(DVD),或者任何其他類型的存儲器。
闡述貫穿本專利文檔使用的特定詞語和短語的定義會是有利的。術語“包括”和“包含”以及它們的衍生詞意味著包括而不限于。術語“或”是包括的,意味著和/或?!跋嚓P聯(lián)”和“與其相關聯(lián)”以及其衍生詞意味著包括、被包括在內(nèi)、互連于、包含、被包含在內(nèi)、連接到或于、耦合到或于、通信于、合作與,交織、并列、接近于、綁定到或于,具有,具有特性等。
雖然本發(fā)明已經(jīng)描述了某些實施例以及一般相關的方法,然而這些實施例和方法的變化以及置換對于本領域技術人員來說將是顯而易見的并且是可以被本領域技術人員易于辨別的。因此,示例實施例的上述說明不定義或限制本發(fā)明。在不偏離由隨附權利要求定義的本發(fā)明的范圍的情況下,其他的改變、替換以及變化也是可能的。