專利名稱:主從分布式通信系統(tǒng)中本地同步的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子通信網(wǎng)絡(luò)中的分組處理技術(shù),和用于分組處理的處理設(shè)備的設(shè)計(jì)結(jié)構(gòu)。更具體地說,本發(fā)明涉及使并行工作的多個(gè)處理元件(或模塊)同步,從而形成聚集流量(aggregate throughput)等于多個(gè)并行處理元件的組合聚集流量之和的單個(gè)處理設(shè)備的等同物的方法和裝置。本發(fā)明的典型應(yīng)用是用在分組交換系統(tǒng)中。
背景技術(shù):
在關(guān)于當(dāng)前一代的交換機(jī)架構(gòu)(switch fabric)設(shè)計(jì)提出的所有競爭要求中,端口數(shù)目的可縮放性和成本效應(yīng)是應(yīng)解決的兩個(gè)基本問題。兩種建立成本低廉并且可縮放的交換機(jī)架構(gòu)的方式引人注目。第一種方式是廣泛采用的單級交換機(jī)體系結(jié)構(gòu),這種單級交換機(jī)體系結(jié)構(gòu)非常高效,但是由于其復(fù)雜性呈二次增長(由于端口數(shù)目的線性增長的結(jié)果),因此具有可縮放性限制。第二種方式是多級交換機(jī)體系結(jié)構(gòu),多級交換機(jī)體系結(jié)構(gòu)借助更高的并行性,提供更高的流量,但是和單級交換機(jī)相比,通常更復(fù)雜,效率更低。
多級交換機(jī)體系結(jié)構(gòu)也被稱為多級互連網(wǎng)絡(luò)(MIN),即,按照交換和鏈路資源可被多個(gè)連接共享的方式,通過鏈路多級或網(wǎng)狀互連的“小型”單級交換模塊的架構(gòu)排列,這導(dǎo)致小于N2的復(fù)雜性增長,通常約為NlogN,這里N是交換機(jī)架構(gòu)的端口的總數(shù)。雖然認(rèn)識到為了獲得很高的流量和支持大量的端口,需要MIN,但是在過去十年內(nèi),它們的普遍采用被反復(fù)推遲。其原因之一在于單級交換系統(tǒng)設(shè)計(jì)方面的連續(xù)不斷的革新,以及基礎(chǔ)技術(shù)方面的發(fā)展產(chǎn)生的新機(jī)會能夠跟上同一時(shí)期內(nèi)的市場需求增加。另外,在它們的可縮放性范圍內(nèi),單級交換體系結(jié)構(gòu)仍然非常有吸引力,因?yàn)樗鼈兲峁┏杀咀畹土阅茏罡咝У慕㈦娮臃纸M交換網(wǎng)絡(luò)。
單級交換機(jī)體系結(jié)構(gòu)可被分成兩類集中式控制體系結(jié)構(gòu)和分布式控制體系結(jié)構(gòu)。后一類型由并行交換域組成,每個(gè)交換域具有獨(dú)立的調(diào)度器(控制域)。其主要缺陷是它需要由負(fù)載均衡和重排序算法引起的一些復(fù)雜性開銷,負(fù)載均衡和重排序算法處理分布在多個(gè)交換域內(nèi)的分組。在文獻(xiàn)中,這也被稱為并行分組交換(PPS)。另一方面,具有集中式控制的交換機(jī)體系結(jié)構(gòu)僅具有一個(gè)交換域,它通常由并行工作的數(shù)個(gè)交換片(switch slice)組成。并行操作多個(gè)交換片能夠?qū)崿F(xiàn)交換機(jī)端口速度的提高,從而允許建立具有更高速度的交換核心。這種方法用在許多單級交換機(jī)中,因?yàn)樗试S通過把大量的外部鏈路多路復(fù)用到較高速度的單個(gè)鏈路上,建立處理大量外部鏈路的系統(tǒng)。對于指定的電路技術(shù)來說,存在對這種技術(shù)的適用性的限制,但是在其適用性范圍內(nèi),它提供放大到較大規(guī)模交換機(jī)的成本最低廉的方法。使基于集中式控制方法的單級交換機(jī)設(shè)計(jì)非常流行的其它原因是其調(diào)度方案的特異性(singularity),和其實(shí)現(xiàn)任意排隊(duì)結(jié)構(gòu)的能力基于共享存儲器的輸出排隊(duì)結(jié)構(gòu),基于縱橫制(crossbar)的輸入排隊(duì)結(jié)構(gòu)或者組合的輸入-輸出排隊(duì)結(jié)構(gòu)。
本發(fā)明涉及的問題適用于具有集中式控制的交換機(jī)體系結(jié)構(gòu)。目的是提供一種改進(jìn)它們的固有增長限制的手段。這是通過簡化多個(gè)交換機(jī)元件的聚集(aggregation),并使它們按照所謂的“端口速度擴(kuò)展”模式并行工作來實(shí)現(xiàn)的。這種改進(jìn)還間接適用于MIN體系結(jié)構(gòu),因?yàn)镸IN體系結(jié)構(gòu)通常由單級交換模塊組成。
在計(jì)算機(jī)社會中,為了獲得更高的帶寬,長期以來一直采用數(shù)據(jù)和流水線并行性。當(dāng)應(yīng)用于電子網(wǎng)絡(luò)中的分組交換技術(shù)時(shí),這轉(zhuǎn)變成通過多個(gè)并行片交換的分組,有時(shí)被稱為端口速度擴(kuò)展。
在W.E.Denzel,A.P.J.Engbersen和I.Iliadis的論文“A flexibleshared-buffer switch for ATM at Gb/s rates”(發(fā)表在ComputerNetworks and ISDN Systems,Vol.27,No.4,1995年1月,pp.611-624)中可找到端口速度擴(kuò)展的早期描述。在該論文中,端口速度擴(kuò)展被用于通過堆疊多個(gè)從屬芯片,并使它們由單個(gè)主芯片控制,按照模塊化方式擴(kuò)展端口速率。在歐洲專利申請EP0849917A2中也描述了應(yīng)用于輸出排隊(duì)交換機(jī)體系結(jié)構(gòu)的特定端口速度擴(kuò)展實(shí)施例。
下面更詳細(xì)地說明牽涉到本發(fā)明的問題。端口速度擴(kuò)展的公知難點(diǎn)是由主模塊和從屬模塊必須緊密同步而導(dǎo)致的其實(shí)現(xiàn)的復(fù)雜性。在高端口速率下,這導(dǎo)致復(fù)雜和/或昂貴的同步邏輯,它通常限制并行性的物理程度,從而限制可獲得的最大流量。于是,需要使端口速度擴(kuò)展方案的可縮放性與由同步問題引起的其實(shí)現(xiàn)復(fù)雜性分離開。
在按照端口速度擴(kuò)展模式工作的交換機(jī)架構(gòu)核心中,組件交換機(jī)被稱為“主”交換機(jī)或“從”交換機(jī)。端口速度擴(kuò)展交換機(jī)架構(gòu)包含一個(gè)主和一個(gè)或多個(gè)從屬組件。主組件和從屬組件按照任意布局,例如鏈形、環(huán)形或樹形連接。下面參考圖1描述/回想端口速度擴(kuò)展的一般概念,圖1圖解說明了與只使用一個(gè)從屬的現(xiàn)有商業(yè)產(chǎn)品IBM PRS64G相關(guān)的例子。PRS64G是為64Gb/s的總聚集帶寬實(shí)現(xiàn)32個(gè)輸入和32個(gè)輸出端口的分組路由交換機(jī),每個(gè)端口以2Gb/s運(yùn)行。按照端口速度擴(kuò)展模式組合這些芯片中的兩個(gè)芯片,能夠以4Gb/s操縱物理端口,并建立具有兩倍聚集帶寬(128Gb/s)的交換機(jī)架構(gòu)。當(dāng)要交換的分組被入口架構(gòu)接口接收時(shí),它被分成幾個(gè)部分,這里稱為“邏輯單元”(LU)(或者后面也稱為“片段”)。在該特殊例子中,LU的數(shù)目等于組件交換機(jī)的數(shù)目,但是這不是先決條件。隨后,入口架構(gòu)接口把每個(gè)分組的一個(gè)LU發(fā)送給主交換機(jī),并把后續(xù)LU發(fā)送給從屬交換機(jī)。第一個(gè)LU只包含部分初始分組有效負(fù)載,但是它具有完整的分組報(bào)頭,所述分組報(bào)頭包括處理信息。第二個(gè)LU(它被傳送給從屬交換機(jī))只包含有效負(fù)載信息,并不包含路由信息。主交換機(jī)按照分組報(bào)頭攜帶的路由和服務(wù)質(zhì)量信息,處理其LU,隨后通過向從屬交換機(jī)發(fā)送恰當(dāng)?shù)?得到的)控制信息,把其調(diào)度決策通知從屬交換機(jī)。對于主交換機(jī)收到的每個(gè)LU,得到的控制信息通過所謂的入口端口速度擴(kuò)展總線,被發(fā)送給從屬交換機(jī)。類似地,當(dāng)主交換機(jī)調(diào)度要傳送的分組時(shí),通過出口端口速度擴(kuò)展總線,類似的控制信息被發(fā)送給從屬交換機(jī)。由于出口控制路徑的傳播延遲,主出口LU可比從屬出口LU更早離開。在一些情況下,如果要求兩個(gè)輸出LU幾乎同時(shí)到達(dá)出口架構(gòu)接口,那么在主和從屬之間需要額外的傳輸同步機(jī)構(gòu)。根據(jù)上述說明,顯然端口速度擴(kuò)展架構(gòu)需要傳播延遲的控制和兩個(gè)不同流,即從入口架構(gòu)接口到架構(gòu)核心和出口架構(gòu)接口的數(shù)據(jù)流(圖1中水平繪制),和從主到一個(gè)或多個(gè)從屬的控制流(圖1中垂直繪制)的精確匹配。在圖1的分組持續(xù)時(shí)間例子(對于64字節(jié)分組,128納秒)和交換機(jī)架構(gòu)核心的緊密性(安裝在單板上)的情況下,通過保證控制信息在128納秒的一個(gè)分組周期內(nèi)到達(dá)從屬,可容易地實(shí)現(xiàn)這一點(diǎn),對于現(xiàn)有技術(shù)中的單板設(shè)計(jì)來說,128納秒是足夠的。
同時(shí),由于數(shù)據(jù)鏈路速率和系統(tǒng)規(guī)模的不斷增加,速度擴(kuò)展系統(tǒng)變得越來越難以建造。一方面,更快的數(shù)據(jù)鏈路速率已導(dǎo)致分組持續(xù)時(shí)間減小,但是在端口速度擴(kuò)展實(shí)現(xiàn)中要求更高程度的并行性。另一方面,更大的系統(tǒng)規(guī)模已迫使設(shè)計(jì)人員把交換機(jī)架構(gòu)分布到多個(gè)底板和機(jī)架上,從而增大了架構(gòu)內(nèi)數(shù)據(jù)流和/或控制流的鏈路距離。在所有這些更嚴(yán)格的系統(tǒng)要求和規(guī)模下,精確地控制和匹配物理分散的,并且同時(shí)對其來說分組持續(xù)時(shí)間已被減小的元件之間的傳播延遲變得非常困難和/或昂貴。特別地,可能發(fā)生來自一個(gè)分組的多個(gè)LU不能同時(shí)或幾乎同時(shí)到達(dá)主交換機(jī)和一個(gè)或多個(gè)從屬交換機(jī)的情況。事實(shí)上,可能發(fā)生來自完全不同分組的LU同時(shí)或近乎同時(shí)到達(dá)主和/或從屬交換機(jī)的情況。
設(shè)想如圖2中所示的1個(gè)主和N-1個(gè)從屬的鏈形布局例子,一種可能的解決方案是向每個(gè)從屬提供測量系統(tǒng)初始化時(shí),控制路徑的等待時(shí)間,并向每個(gè)從屬的數(shù)據(jù)路徑中插入補(bǔ)償和匹配控制路徑的傳播延遲的數(shù)字可編程延遲的裝置。相對于主給所有從屬的同步信號廣播,完成控制路徑等待時(shí)間的測量。一旦每個(gè)從屬測量了控制路徑的等待時(shí)間,就在每個(gè)從屬中據(jù)此單獨(dú)設(shè)置數(shù)據(jù)路徑的數(shù)字可編程延遲,從而控制延遲和數(shù)據(jù)路徑延遲以分組周期為基礎(chǔ)匹配。雖然這種提議方向正確,但是它只解決了一半問題,因?yàn)樗荒苎a(bǔ)償端口速度擴(kuò)展數(shù)據(jù)路徑中的不同等待時(shí)間(參見圖2中的數(shù)據(jù)路徑扭斜)。事實(shí)上,只有當(dāng)系統(tǒng)相當(dāng)緊密地同步時(shí),提議的方案才能工作,從而入口架構(gòu)接口發(fā)送的所有LU在小于分組周期持續(xù)時(shí)間的扭斜窗口內(nèi)到達(dá)架構(gòu)核心。在約10Gb/s(OC192)的端口速率下,如果端口的數(shù)目允許以緊致的方式,比方說單個(gè)電子機(jī)架建造物理架構(gòu)尺寸,那么這是可以實(shí)現(xiàn)的。對于更大規(guī)模和更高端口速率,例如40Gb/s(OC768)的系統(tǒng)來說,本地同步方法不僅應(yīng)補(bǔ)償控制路徑的等待時(shí)間,而且還應(yīng)補(bǔ)償數(shù)據(jù)信息和控制信息的傳播路徑中的不同預(yù)測的扭斜,并且這適合于任何(任意)布局。另外,為了能夠容易地縮放,該方法應(yīng)能夠放寬由端口速度擴(kuò)展概念引起的同步約束。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種在任意布局的分布式主-從通信系統(tǒng)的每個(gè)模塊,實(shí)現(xiàn)數(shù)據(jù)和控制信息的本地同步的方法和設(shè)備。通過補(bǔ)償數(shù)據(jù)和控制信息的傳播路徑中的不可預(yù)測的扭斜,實(shí)現(xiàn)同步。通過經(jīng)通信系統(tǒng)發(fā)送同步分組,確定每次補(bǔ)償?shù)牧恐岛头枴?br>
另一目的是提供一種在分布式系統(tǒng)的每個(gè)同步點(diǎn),本地獨(dú)立測量數(shù)據(jù)路徑和控制路徑之間的傳播延遲差的裝置。通過使系統(tǒng)能夠按照本地同步,但是全局異步的方式工作,這種本地測量允許解決集中控制的分布式通信系統(tǒng)固有的速度可縮放性限制。與一個(gè)主模塊和多個(gè)從屬模塊的全局同步方案相對,這種方案的優(yōu)點(diǎn)在于集中控制的系統(tǒng)可被縮放,從而在更高程度的并行性,任意數(shù)目的從屬模塊和任意布局的情況下工作。特別地,它允許建立在緩變相位的稍微不同的頻率下(在大型分布式系統(tǒng)中,情況通常如此),操縱不同模塊的近似同步系統(tǒng)(plesiochronous system)。
根據(jù)本發(fā)明,提供一種處理數(shù)據(jù)分組的通信系統(tǒng),每個(gè)數(shù)據(jù)分組包括一個(gè)具有控制信息的報(bào)頭和一個(gè)數(shù)據(jù)有效負(fù)載。所述系統(tǒng)包括接收數(shù)據(jù)分組的入口端口,在入口端口中,每個(gè)數(shù)據(jù)分組被細(xì)分成多個(gè)片段。系統(tǒng)還包括用于并行處理所述多個(gè)片段的一個(gè)主單元和一個(gè)或多個(gè)從屬單元。主單元適合于通過數(shù)據(jù)路徑從每個(gè)分組接收報(bào)頭,一個(gè)或多個(gè)從屬單元適合于通過數(shù)據(jù)路徑接收數(shù)據(jù)片段。導(dǎo)出的控制信息可通過控制路徑,從主單元傳送給一個(gè)或多個(gè)從屬單元。在該系統(tǒng)中,設(shè)置同步提供裝置,用于在和標(biāo)準(zhǔn)數(shù)據(jù)分組(normal data packet)相同的路徑上,在系統(tǒng)內(nèi)從入口端口發(fā)送同樣被細(xì)分成多個(gè)片段的同步分組,以及通過和標(biāo)準(zhǔn)導(dǎo)出控制信息相同的路徑,使同步控制信息經(jīng)過系統(tǒng)。每個(gè)所述一個(gè)或多個(gè)從屬單元包括時(shí)移信息裝置,也稱為第一裝置,用于當(dāng)收到同步分組片段和它的對應(yīng)同步控制信息時(shí),獲得代表數(shù)據(jù)路徑和控制路徑之間的傳播延遲差的時(shí)移信息。每個(gè)所述一個(gè)或多個(gè)從屬單元包括延遲裝置,也稱為第二裝置,用于響應(yīng)時(shí)移信息裝置獲得的時(shí)移信息,延遲數(shù)據(jù)片段或?qū)С龅目刂菩畔ⅰ?br>
根據(jù)本發(fā)明的第二方面,提供一種處理數(shù)據(jù)分組的通信設(shè)備,每個(gè)數(shù)據(jù)分組包括一個(gè)具有控制信息的報(bào)頭和一個(gè)數(shù)據(jù)有效負(fù)載,包括接收數(shù)據(jù)分組的入口端口,在入口端口中,每個(gè)數(shù)據(jù)分組被細(xì)分成多個(gè)片段,包括具有用于并行處理所述多個(gè)片段的一個(gè)主單元和一個(gè)或多個(gè)從屬單元的通信系統(tǒng),主單元適合于通過數(shù)據(jù)路徑從每個(gè)分組接收具有控制信息的報(bào)頭,一個(gè)或多個(gè)從屬單元適合于通過數(shù)據(jù)路徑接收數(shù)據(jù)片段,其中導(dǎo)出的控制信息通過控制路徑,從主單元傳送給一個(gè)或多個(gè)從屬單元,在所述設(shè)備中,設(shè)置同步提供裝置,用于在和標(biāo)準(zhǔn)數(shù)據(jù)分組相同的路徑上,從入口端口通過系統(tǒng)發(fā)送同樣被細(xì)分成多個(gè)片段的同步分組,以及通過和標(biāo)準(zhǔn)導(dǎo)出控制信息相同的路徑,使同步控制信息經(jīng)過系統(tǒng),每個(gè)從屬單元包括當(dāng)收到同步分組片段和它的對應(yīng)同步控制信息時(shí),獲得代表數(shù)據(jù)路徑和控制路徑之間的傳播延遲差的時(shí)移信息的第一裝置,并且每個(gè)從屬單元包括響應(yīng)第一裝置獲得的時(shí)移信息,延遲數(shù)據(jù)片段或?qū)С龅目刂菩畔⒌牡诙b置。
根據(jù)本發(fā)明的第三方面,提供一種用于處理數(shù)據(jù)分組的主從通信系統(tǒng)中的本地同步方法,所述數(shù)據(jù)分組均包括一個(gè)具有控制信息的報(bào)頭和一個(gè)數(shù)據(jù)有效負(fù)載,并且每個(gè)數(shù)據(jù)分組可通過至少一個(gè)入口端口被接收,在所述系統(tǒng)中,在入口端口中,每個(gè)數(shù)據(jù)分組被細(xì)分成多個(gè)片段,以便并行處理所述多個(gè)片段;系統(tǒng)包括用于并行處理所述多個(gè)片段的一個(gè)主單元和一個(gè)或多個(gè)從屬單元;其中主單元從每個(gè)分組接收具有控制信息的報(bào)頭,一個(gè)或多個(gè)從屬單元通過數(shù)據(jù)路徑接收數(shù)據(jù)片段;其中導(dǎo)出的控制信息通過控制路徑,從主單元傳送給一個(gè)或多個(gè)從屬單元;所述方法包括下述步驟,以便保證從屬單元中,接收的數(shù)據(jù)片段和導(dǎo)出的控制信息之間的正確相關(guān),而不管數(shù)據(jù)路徑和控制路徑中的傳播延遲不同(a)在和標(biāo)準(zhǔn)數(shù)據(jù)分組相同的路徑上,從入口端口通過系統(tǒng)發(fā)送同樣被細(xì)分成多個(gè)片段的同步分組,并通過和標(biāo)準(zhǔn)導(dǎo)出控制信息相同的路徑,使從同步分組的報(bào)頭導(dǎo)出的同步控制信息經(jīng)過系統(tǒng);(b)當(dāng)收到同步分組片段和它的對應(yīng)同步控制信息時(shí),在一個(gè)或多個(gè)從屬單元中獲得代表數(shù)據(jù)路徑和控制路徑之間的傳播延遲差的時(shí)移信息;和(c)在一個(gè)或多個(gè)從屬單元中,通過針對每個(gè)接收的分組片段,延遲分組片段本身或者導(dǎo)出的控制信息,來補(bǔ)償由在步驟(b)中獲得的時(shí)移信息表示的傳播延遲差。
本發(fā)明的一個(gè)特殊優(yōu)點(diǎn)在于其同步方案是本地自適應(yīng)的,并且可使之穩(wěn)健。自適應(yīng)意味著在分布式系統(tǒng)的每個(gè)同步點(diǎn),本地自動執(zhí)行同步過程,并且在通信系統(tǒng)的任意兩個(gè)模塊之間不需要雙向通信。通過在系統(tǒng)內(nèi)多次(例如每隔一定的時(shí)間)發(fā)送同步分組,能夠?qū)崿F(xiàn)對數(shù)據(jù)路徑和/或控制路徑的不斷變化的延遲的穩(wěn)健性。
本發(fā)明的另一優(yōu)點(diǎn)在于,由于主/從片段能夠補(bǔ)償分組片段之間的扭斜,因此不需要入口適配器源同時(shí)傳送所有的分組片段。事實(shí)上,對于它來說,在被延遲控制路徑上的在先主/從單元把控制信息轉(zhuǎn)發(fā)給控制路徑上的下一從屬單元所需的時(shí)間,外加控制路徑上的那些連續(xù)片段的數(shù)據(jù)路徑扭斜之間的差值的時(shí)間,發(fā)送傳送給主單元和從屬單元的分組片段是有利的。這樣做減少了為了補(bǔ)償控制路徑等待時(shí)間,在從屬單元的數(shù)據(jù)路徑上所需的緩沖量。對單級系統(tǒng)或者多級通信系統(tǒng)的第一級來說,該優(yōu)點(diǎn)都成立。
放寬每一級的同步約束的優(yōu)點(diǎn)為單級和多級系統(tǒng)中的主平面提供更大的設(shè)計(jì)自由,因?yàn)楝F(xiàn)在主平面在時(shí)間上與自適應(yīng)的從屬平面無關(guān)。多級系統(tǒng)中的本地同步的優(yōu)點(diǎn)在于每一級不增加額外的等待時(shí)間,如果每一級被全局同步,則會增加額外的等待時(shí)間。由于多級通信系統(tǒng)物理上同樣大于單級系統(tǒng)(在相同的技術(shù)中),因此對于多級通信系統(tǒng)來說,放寬的同步約束變得更為重要,因?yàn)楦蟮南到y(tǒng)會跨越通過更長的鏈路連接的多個(gè)底板/架子/機(jī)框。隨著不斷增大的帶寬/更快的分組傳輸時(shí)間,同步約束與分組長度的分離是一個(gè)重要的優(yōu)點(diǎn)。
下面舉例說明本發(fā)明,本發(fā)明不受附圖中的形狀限制,其中圖1是實(shí)現(xiàn)分布式主-從通信系統(tǒng)和端口速度擴(kuò)展的一般原理的現(xiàn)有電子交換系統(tǒng)的方框圖。
圖2是示意表示從輸入源到分段通信系統(tǒng)的多個(gè)數(shù)據(jù)分組的傳輸?shù)姆娇驁D,所述分段通信系統(tǒng)被(任意)組織成1個(gè)主和N-1個(gè)從屬的鏈形布局。
圖3是本發(fā)明可改進(jìn)的分組通信系統(tǒng)(CS)和對應(yīng)的分段分組通信系統(tǒng)的示意圖。
圖4是示意表示根據(jù)本發(fā)明,同步分組段的傳輸和從包含報(bào)頭的同步分組段得到的控制信息的傳輸?shù)姆娇驁D。
圖5是本發(fā)明的一個(gè)優(yōu)選實(shí)施例的方框圖。
圖6是示意表示在多級結(jié)構(gòu)的情況下,多個(gè)數(shù)據(jù)分組從分段通信系統(tǒng)的輸出端到出口適配器的傳輸(圖6a),或者從分段通信系統(tǒng)的輸出端到另一分段通信系統(tǒng)的傳輸(圖6b)。
圖7是圖解說明同步程序的流程圖。
具體實(shí)施例方式
現(xiàn)在參考附圖,尤其參見圖3,研究傳送數(shù)據(jù)實(shí)體,下面稱為分組的一般通信系統(tǒng)30。除規(guī)模或性能的某些嚴(yán)格要求之外,并行性有時(shí)是任何指定技術(shù)中的唯一可行解決方案。
借助系統(tǒng)的劃分和分布,能夠?qū)崿F(xiàn)并行性。分布部分30-1~30-N的組合功能等同于初始系統(tǒng)30的功能。于是,通過在系統(tǒng)的不同部分中處理分組的不同部分,分組31也被分割(成多個(gè)片段),并通過通信系統(tǒng)被傳送。在圖3中的下部描述了系統(tǒng)和分組的分割。這種并行系統(tǒng)的一個(gè)典型例子是M=N,并且分組的每個(gè)片段由通信系統(tǒng)的對應(yīng)部分處理的情況。
輸入分組的分割假定由外部設(shè)備33(下面稱為入口適配器)完成。類似地,輸出分組片段的重新組裝假定由外部設(shè)備34(下面稱為出口適配器)完成。
分割并分布如同在引言中所述的通信系統(tǒng)的功能的方式有幾種。牽涉到本發(fā)明的問題適用于集中控制的分布式通信系統(tǒng),它有時(shí)被稱為主-從類型系統(tǒng)。
可按照任意布局,例如鏈形,環(huán)形,樹形或者這三種布局的任意組合,連接主-從類系統(tǒng)?,F(xiàn)在參見圖2,關(guān)于鏈形布局(它是許多種布局中的一種可能實(shí)施例),說明集中控制的分布式通信系統(tǒng)的入口行為。集中控制的分布式通信系統(tǒng)的關(guān)鍵屬性是其內(nèi)部鏈路能夠以比輸入外部線路速率低得多的速率工作。假定外部線路速率為R,通信系統(tǒng)可由并行工作的多個(gè)(比方說N個(gè))模塊組成,導(dǎo)致單個(gè)模塊鏈路以速度R/N工作。
在通過均以速度R/N工作的N個(gè)不同鏈路或者連接20-1、20-1、…、20-N-1發(fā)送之前,輸入分組被入口適配器分成N個(gè)相同的片段。包含分組報(bào)頭(可能還包括有效負(fù)載)的第一片段被發(fā)送給主模塊21,而只包含數(shù)據(jù)有效負(fù)載的其它N-1個(gè)片段被傳送給第一、第二和第四從屬模塊22-1~22-N-1??蓪?shí)現(xiàn)的并行性的最高程度由報(bào)頭的大小指示,所述報(bào)頭必須被整個(gè)放入單個(gè)片段中。于是N不能大于被除以報(bào)頭大小的分組的大小。在最大擴(kuò)展模式下,第一片段不能攜帶任何有效負(fù)載。
雖然所有片段由入口適配器同時(shí)發(fā)送,不過不同的片段將經(jīng)歷不同的傳播時(shí)間τ0~τN-1,取決于布局及鏈路的長度和質(zhì)量。于是,給定分組的N個(gè)片段23-0~23-N-1一般不會同時(shí)或者近乎同時(shí)地到達(dá)主和從屬。最快的傳播時(shí)間和最慢的傳播時(shí)間之間的差異定義數(shù)據(jù)路徑扭斜窗口,為了簡便起見,假定數(shù)據(jù)路徑扭斜窗口相對于一個(gè)分組周期時(shí)間被歸一化。另外對于很高帶寬和/或很大規(guī)模的通信系統(tǒng)來說,來自連續(xù)分組的多個(gè)分組片段顯然可在每個(gè)單個(gè)鏈路或連接20-0~20-N-1上傳遞(in flight)。
當(dāng)主模塊21收到片段23-0時(shí),它抽取報(bào)頭信息,并根據(jù)報(bào)頭攜帶的路由和服務(wù)質(zhì)量(QoS)信息(處理信息)處理該片段。接下來或者可能同時(shí),產(chǎn)生控制信息24-0(下面稱為導(dǎo)出控制信息),并通過控制接口25-0,將其傳送給從屬模塊22-1。導(dǎo)出控制信息24-0把主模塊21做出的控制決策通知第一從屬模塊22-1,并且包含第一從屬模塊22-1處理其輸入片段23-1所需的信息。于是類似于數(shù)據(jù)鏈路20-0~20-N-1,將存在通過接口250k(0≤k≤N-2)傳遞的導(dǎo)出控制信息的多個(gè)實(shí)體。
在圖2設(shè)想的鏈形布局中,第一從屬模塊22-1接收的導(dǎo)出控制信息24-0還被轉(zhuǎn)發(fā)給鏈形布局中的第二從屬模塊22-2或者下一從屬模塊,直到導(dǎo)出控制信息24-N-2到達(dá)最后的從屬模塊22-N-1為止。在樹形布局中,可同時(shí)向所有從屬模塊廣播導(dǎo)出控制信息24-0。
返回圖2的布局例子,所有導(dǎo)出控制信息24-0~24-N-2也可經(jīng)歷不同的傳播延遲δ0~δ-N-2。對于每個(gè)從屬模塊來說,為了使其片段23-i(0≤i≤N-1)與恰當(dāng)?shù)膶?dǎo)出控制信息24-j(0≤j≤N-2)相關(guān)聯(lián),在每個(gè)從屬模塊22-1~22-N-1的數(shù)據(jù)流和控制流之間,同步是有益的??赏ㄟ^在數(shù)據(jù)和/或控制路徑中引入可編程延遲,從而可補(bǔ)償數(shù)據(jù)和/或控制路徑的傳播延遲之間的差異,能夠?qū)崿F(xiàn)這種同步。實(shí)際上,由第一從屬模塊22-1引入的補(bǔ)償對應(yīng)于導(dǎo)出控制信息24-0的傳播延遲δ0減去鏈路20-0和20-1之間的傳播時(shí)間差(δ0-(τ0-τ1))。相對于主模塊21發(fā)送的導(dǎo)出控制信息,第二從屬模塊22-2的補(bǔ)償對應(yīng)于((δ0+δ1)-(τ0-τ2)),而對于鏈形布局中的最后從屬模塊22-N-1來說,所述補(bǔ)償是((δ0+δ1+…+δN-2)-(τ0-τN-1))。
為了在每個(gè)從屬模塊22-1~22-N-1的數(shù)據(jù)和/或控制路徑中引入可編程延遲,測量傳播延遲差,即,獲得代表傳播延遲差的時(shí)移信息,隨后計(jì)算本地要求的補(bǔ)償延遲。后者在下面更詳細(xì)地說明。應(yīng)注意到為了與上面描述的問題一致,該說明仍然保留在鏈形布局的上下文中。
現(xiàn)在參見圖4,本發(fā)明的一個(gè)特征是把特殊的同步分組(下面稱為sync分組)注入通信系統(tǒng)中,并本地測量(在每個(gè)從屬模塊內(nèi))控制流和數(shù)據(jù)流之間的傳播延遲差。這是通過獲得數(shù)據(jù)路徑和控制路徑的時(shí)間戳記來實(shí)現(xiàn)的,所述時(shí)間戳記代表數(shù)據(jù)路徑和控制路徑之間的時(shí)移。Sync分組可獨(dú)立地與標(biāo)準(zhǔn)數(shù)據(jù)流(normal data stream)區(qū)分開,并在專用進(jìn)程47的控制下,由入口適配器46注入。Sync分組還被分成同樣可與標(biāo)準(zhǔn)數(shù)據(jù)分組的分組片段區(qū)分開的片段43-0~43-N-1。在圖4中,這由陰影分組片段指示。
在標(biāo)準(zhǔn)數(shù)據(jù)分組之間,可每隔一定時(shí)間,定期在系統(tǒng)內(nèi)傳送同步分組。但是在一些情況下,當(dāng)整個(gè)系統(tǒng)被初始化時(shí),只發(fā)送一個(gè)sync分組,或者每當(dāng)需要時(shí),發(fā)送分組(每隔一定距離)就已足夠。
當(dāng)主模塊41收到sync分組片段43-0時(shí),它產(chǎn)生專用控制信息44-0(下面稱為導(dǎo)出同步控制信息),類似于與數(shù)據(jù)分組相關(guān)的標(biāo)準(zhǔn)(非同步)導(dǎo)出控制信息的傳輸,主模塊41通過控制接口45-0,把該導(dǎo)出同步控制信息傳送給第一從屬模塊42-1。導(dǎo)出同步控制信息可與標(biāo)準(zhǔn)導(dǎo)出控制信息區(qū)分開,并且在圖4中同樣被加上陰影。
參見圖5和圖7,根據(jù)一個(gè)優(yōu)選實(shí)施例,說明在每個(gè)從屬模塊內(nèi),數(shù)據(jù)和導(dǎo)出控制信息的匹配。
當(dāng)一個(gè)從屬模塊通過其入口控制接口510,收到導(dǎo)出控制信息時(shí),它做兩件事。首先,它立即通過出口控制接口520,把導(dǎo)出控制信息轉(zhuǎn)發(fā)給鏈形布局中的下一從屬模塊。其次,它用同步控制檢測器534檢查輸入的控制信息。如果輸入的導(dǎo)出控制信息和標(biāo)準(zhǔn)的數(shù)據(jù)分組相關(guān),那么它被寫入第一FiFo緩沖器530。如果輸入的導(dǎo)出控制信息是sync類型的導(dǎo)出控制信息,那么它利用定序器550通過總線551提供的序列號,觸發(fā)控制時(shí)間戳記寄存器533的負(fù)載。在該優(yōu)選實(shí)施例中,假定導(dǎo)出同步控制信息還被寫入第一FiFo緩沖器530中,不過這是可選的。
對通過輸入數(shù)據(jù)接口570接收的輸入分組片段應(yīng)用相同類型的處理。同步分組檢測器544從同步分組片段中挑選出標(biāo)準(zhǔn)數(shù)據(jù)片段。標(biāo)準(zhǔn)數(shù)據(jù)分組片段被寫入第二FiFo緩沖器540中,而同步分組片段被用于用同樣由定序器550提供的序列號,觸發(fā)數(shù)據(jù)時(shí)間戳記寄存器543的負(fù)載。如果確定把導(dǎo)出同步控制信息寫入第一FiFo緩沖器530中,那么同步分組片段同樣被寫入第二FiFo緩沖器540。
定序器550實(shí)質(zhì)上是一個(gè)由從屬模塊的內(nèi)部時(shí)鐘連續(xù)遞增的計(jì)數(shù)器。在復(fù)位邏輯部分590產(chǎn)生特定的復(fù)位命令之后,可強(qiáng)制定序器550重新從0開始計(jì)數(shù)。當(dāng)檢測器544和534檢測到同步分組片段或其對應(yīng)的導(dǎo)出同步控制信息的首次到達(dá)時(shí),復(fù)位邏輯部分590產(chǎn)生復(fù)位命令。復(fù)位命令使定序器550重新從0開始計(jì)數(shù)。
在同步分組的傳輸之后,控制程序580(通常為所有主模塊和從屬模塊所共有)被用于監(jiān)視經(jīng)由總線581的數(shù)據(jù)和控制時(shí)間戳記寄存器533和543的內(nèi)容。該控制程序計(jì)算時(shí)間戳記寄存器的內(nèi)容之間的差異,并通過相應(yīng)總線582和583,據(jù)此初始化寫指針值531和541。在該特定實(shí)施例中,假定FiFo 530和540被用作循環(huán)移位寄存器,但是本領(lǐng)域的技術(shù)人員顯然易于提出實(shí)現(xiàn)可編程的數(shù)字延遲的其它方法。按照循環(huán)方式操作FiFo緩沖器530、540,這意味著一旦它們通過相應(yīng)的總線582和583被啟用,那么讀指針和寫指針都將同時(shí)開始增大(由內(nèi)部時(shí)鐘控制),并且寫指針和讀指針之間的距離將保持不變(在正常工作模式下,只要在圖5中勾畫的電路收到同步分組之后,本地未檢測到數(shù)據(jù)和控制路徑傳播延遲的任何變化,那么這意味著輸入數(shù)據(jù)、空分組和/或同步分組的連續(xù)流動)。
按照下述方式實(shí)現(xiàn)讀指針和寫指針的設(shè)置。讀指針532和542總是被設(shè)置成0。寫指針531和541的設(shè)置以從數(shù)據(jù)和控制時(shí)間戳記寄存器533和543取回的數(shù)字為基礎(chǔ)。如果控制程序580確定在其配對的導(dǎo)出控制信息之前收到數(shù)據(jù)片段(即,{533}>{543}),那么通過用等于所需延遲的值初始化數(shù)據(jù)寫指針541,把延遲添加到輸入數(shù)據(jù)路徑中。當(dāng)控制路徑不需要被延遲時(shí),可用和讀指針相同的值(即0)初始化控制寫指針531。
在另一情況下,當(dāng)控制程序確定控制路徑快于數(shù)據(jù)路徑時(shí)(即,{533}<{543}),通過用所需延遲初始化控制寫指針531,并把數(shù)據(jù)寫指針541設(shè)置成0,把延遲添加到控制路徑中。所需的延遲等于時(shí)間戳記寄存器533和543的內(nèi)容之間的差值(的絕對值)。
在正常工作模式下,數(shù)據(jù)和控制時(shí)間戳記寄存器533和543的內(nèi)容還可由控制程序580或者在從屬模擬內(nèi)實(shí)現(xiàn)的任意其它硬件裝置監(jiān)視,從而檢查和核實(shí)這兩個(gè)寄存器值之間的距離保持相同,從而檢查和核實(shí)系統(tǒng)保持同步。當(dāng)同步分組片段和導(dǎo)出同步控制信息都開始被寫入FiFo緩沖器540和530時(shí),在輸入端口控制器560內(nèi)能夠暗中實(shí)現(xiàn)檢查系統(tǒng)保持同步的另一種方式。如果情況是這樣,那么從第二FiFo緩沖器540讀出的任意同步分組片段應(yīng)總是與從第一FiFo緩沖器530讀出的另一導(dǎo)出同步控制信息匹配,或者系統(tǒng)不再同步。
要注意的是優(yōu)選實(shí)施例能夠延遲數(shù)據(jù)流和控制流,即使在實(shí)際的應(yīng)用中,預(yù)計(jì)控制路徑將是最慢的路徑。如果通過設(shè)計(jì),數(shù)據(jù)路徑扭斜窗口Dskw(定義為與給定分組相關(guān)的任意分組片段之間的數(shù)據(jù)扭斜的最大值)總是小于兩個(gè)連續(xù)從屬模塊之間的任意控制路徑的等待時(shí)間Dskw<δ0,Dskw<δ1,…和Dskw<δN-2,那么不再需要補(bǔ)償控制流的延遲的機(jī)構(gòu)和邏輯。
如前所述,可每隔一定的間隔定期發(fā)送同步分組(情況通常如此),或者可以只在開始發(fā)送一個(gè)同步分組,或者應(yīng)請求發(fā)送同步分組。
再次參見圖2,同步分組的傳輸之間的間隔由入口適配器確定為至少與控制傳輸路徑中可能的最長等待時(shí)間,外加數(shù)據(jù)路徑扭斜窗口的最大可能尺寸一樣長((maxδ0+maxδ1+…+maxδN-2)+Dskw)用于計(jì)算兩個(gè)sync分組的傳輸之間的最小可能間隔的所有數(shù)字易于取回,因?yàn)樗鼈儗?yīng)于設(shè)計(jì)指定的絕對最大值。另一方面,關(guān)于兩個(gè)同步分組的傳輸之間的最大可能間隔的唯一限制由可由定序器550尋址的最大序列范圍和FiFo緩沖器530、540的長度給出。
另外顯然上面的要求涉及圖5的具體實(shí)施例,本領(lǐng)域的技術(shù)人員能夠容易地設(shè)想把另一傳輸規(guī)則用于sync分組的另一實(shí)施例。
再次參見圖4,把sync分組片段43-i(0≤i≤N-1)和導(dǎo)出同步控制信息44-j(0≤j≤N-2)與標(biāo)準(zhǔn)數(shù)據(jù)分組片段和標(biāo)準(zhǔn)導(dǎo)出控制信息區(qū)分開的方法有幾種。預(yù)想的優(yōu)選實(shí)施例是對分組編碼,并通過使用特殊編碼(例如8b/10b光纖信道/以太網(wǎng)/Infiniband代碼的K-字符)專門區(qū)分同步分組片段和導(dǎo)出同步控制信息。然而,也可使用明確地把同步分組和導(dǎo)出同步控制信息與其它分組區(qū)分開的任意其它方法。
參見圖6,關(guān)于兩種不同的情況,說明集中控制的分布式通信系統(tǒng)的出口部分。圖6a表示通信系統(tǒng)600是單級系統(tǒng),或者是一組類似的通信系統(tǒng)的最后一級的情況,圖6b表示通信系統(tǒng)600只是具有多級的結(jié)構(gòu)的一級,并且另一系統(tǒng)660b跟隨其后,作為該結(jié)構(gòu)的下一級的情況。類似于通信系統(tǒng)600的入口端,離開系統(tǒng)的分組也被分成N個(gè)相同的片段,并通過分別以速率R/N工作的N個(gè)不同鏈路或連接640-0,640-1,…640-N-1發(fā)送。包含分組報(bào)頭(可能還包括有效負(fù)載)的第一片段由主模塊601傳送,而其它N-1個(gè)只包含數(shù)據(jù)有效負(fù)載的片段由從屬模塊602-1~602-N-1傳送。通信系統(tǒng)600的出口部分或者與把輸出的數(shù)據(jù)片段重新組裝成單個(gè)分組的出口適配器660a連接(圖6a),或者在多級互連結(jié)構(gòu)的情況下,與另一通信系統(tǒng)660b的入口部分連接(圖6b)。
由于不同的輸出數(shù)據(jù)片段也將在鏈路640-0~640-N-1上(以及圖6b中下一級的控制路徑663-0~663-N-1上)經(jīng)歷不同的傳播時(shí)間,在通信系統(tǒng)600的出口端和與之連接的下一塊之間,即,出口適配器660a和下一級的通信系統(tǒng)660b之間,同樣使用和通信系統(tǒng)的入口端類似的同步過程。這意味著通信系統(tǒng)600產(chǎn)生并通過鏈路640-0~640-N-1注入一起代表一個(gè)同步分組的特殊同步分組片段650-0,650-1,…650-N-1,以便下一級能夠本地測量傳播延遲差,并據(jù)此調(diào)整傳播延遲差。
如果下一級也是主從類型的通信系統(tǒng)(圖6b),那么通信系統(tǒng)600的出口端產(chǎn)生的同步分組片段650-0~650-N-1被下一級660b的入口端用于實(shí)現(xiàn)數(shù)據(jù)和導(dǎo)出控制信息的本地同步,如前所述。如果下一級是出口適配器(圖6a),那么通信系統(tǒng)600的出口端產(chǎn)生的同步分組片段650-0~650-N-1被用于測量多個(gè)分組片段之間的相對到達(dá)時(shí)間,以便把它們重新組合成能夠被進(jìn)一步處理和/或轉(zhuǎn)發(fā)的單個(gè)分組。在這兩種情況下(圖6a和圖6b),通信系統(tǒng)600的出口端起與之連接的下一級的入口適配器的作用。
定義出口同步分組片段650-0~650-N-1的注入時(shí)間的方法有幾種。優(yōu)選的方法是從輸入的同步分組片段610-1~610-N-1得到注入時(shí)間,而另一方法是直接從特定的出口進(jìn)程604得到注入時(shí)間。
第一種選擇最可能由無緩沖系統(tǒng)使用,在該系統(tǒng)中,輸入分組被立即轉(zhuǎn)發(fā)給輸出端口,而不被保存。在這種特殊情況下,每當(dāng)在輸入端口控制器560(圖5)中出現(xiàn)同步分組片段和導(dǎo)出控制同步信息匹配時(shí),就會產(chǎn)生出口同步分組片段。
另一方面,如果通信系統(tǒng)600是緩沖系統(tǒng),那么入口同步進(jìn)程和出口同步進(jìn)程很可能相互分開。在該特定情況下,如果通信系統(tǒng)實(shí)現(xiàn)特定的出口同步進(jìn)程604,那么同步分組片段可由通信系統(tǒng)本身產(chǎn)生。當(dāng)該進(jìn)程觸發(fā)一個(gè)同步分組的注入時(shí),一個(gè)同步分組片段650-0由主模塊601產(chǎn)生,并通過鏈路640-0傳送。同時(shí),稱為導(dǎo)出出口同步控制信息的導(dǎo)出同步控制信息也通過控制接口603-0~603-N-2被傳送給所有從屬模塊602-1~602-N-1。在每個(gè)從屬模塊602內(nèi),隨后本地使用導(dǎo)出的出口同步控制信息,重新產(chǎn)生將要通過鏈路640-0~640-N-1傳送的出口同步分組片段。要求使入口和出口分離的另一種情況是當(dāng)出口控制路徑上的延遲不同于入口控制路徑上的延遲時(shí)。
要注意圖2、4和6表示了從主模塊到從屬模塊的單個(gè)控制路徑。這并不排斥具有多個(gè)不同控制路徑的可能性。圖1中描述了一個(gè)典型例子,其中入口控制路徑和出口控制路徑是分離的。
任意公開的實(shí)施例可與表示和/或描述的一個(gè)或多個(gè)其它實(shí)施例組合。這也適用于實(shí)施例的一個(gè)或多個(gè)特征。
權(quán)利要求
1.一種處理數(shù)據(jù)分組的通信系統(tǒng),每個(gè)數(shù)據(jù)分組包括一個(gè)具有控制信息的報(bào)頭和一個(gè)數(shù)據(jù)有效負(fù)載,所述系統(tǒng)包括接收所述數(shù)據(jù)分組的入口端口,在所述入口端口中,每個(gè)數(shù)據(jù)分組被細(xì)分成多個(gè)片段;用于并行處理所述多個(gè)片段的一個(gè)主單元和一個(gè)或多個(gè)從屬單元,所述主單元適合于通過數(shù)據(jù)路徑從每個(gè)分組接收報(bào)頭,所述一個(gè)或多個(gè)從屬單元適合于通過數(shù)據(jù)路徑接收數(shù)據(jù)片段,導(dǎo)出的控制信息可通過控制路徑從主單元傳送給一個(gè)或多個(gè)從屬單元;在所述系統(tǒng)中,(a)設(shè)置同步提供裝置(46、47、510、520、570),用于在和標(biāo)準(zhǔn)數(shù)據(jù)分組相同的路徑上,從入口端口通過系統(tǒng)發(fā)送同樣被細(xì)分成多個(gè)片段的同步分組,以及通過和標(biāo)準(zhǔn)導(dǎo)出控制信息相同的路徑,使同步控制信息經(jīng)過系統(tǒng);(b)每個(gè)所述一個(gè)或多個(gè)從屬單元包括時(shí)移信息裝置(533、534、543、544),用于當(dāng)收到同步分組片段和它的對應(yīng)同步控制信息時(shí),獲得代表數(shù)據(jù)路徑和控制路徑之間的傳播延遲差的時(shí)移信息;和(c)每個(gè)所述一個(gè)或多個(gè)從屬單元包括延遲裝置(530、531、532、540、541、542、581、582、583),用于響應(yīng)所述時(shí)移信息裝置(533、534、543、544)獲得的所述時(shí)移信息,延遲數(shù)據(jù)片段或?qū)С龅目刂菩畔ⅰ?br>
2.一種處理數(shù)據(jù)分組的通信設(shè)備,每個(gè)數(shù)據(jù)分組包括一個(gè)具有控制信息的報(bào)頭和一個(gè)數(shù)據(jù)有效負(fù)載,包括接收所述數(shù)據(jù)分組的入口端口,在所述入口端口中,每個(gè)數(shù)據(jù)分組被細(xì)分成多個(gè)片段;包括具有用于并行處理所述多個(gè)片段的一個(gè)主單元和一個(gè)或多個(gè)從屬單元的通信系統(tǒng),所述主單元適合于通過數(shù)據(jù)路徑從每個(gè)分組接收具有控制信息的報(bào)頭,所述一個(gè)或多個(gè)從屬單元適合于通過數(shù)據(jù)路徑接收數(shù)據(jù)片段;其中導(dǎo)出的控制信息通過控制路徑從主單元傳送給一個(gè)或多個(gè)從屬單元;在所述設(shè)備中,(a)提供了裝置(46、47、510、520、570),用于在和標(biāo)準(zhǔn)數(shù)據(jù)分組相同的路徑上,從入口端口通過系統(tǒng)發(fā)送同樣被細(xì)分成多個(gè)片段的同步分組,以及通過和標(biāo)準(zhǔn)導(dǎo)出控制信息相同的路徑,使同步控制信息經(jīng)過系統(tǒng);(b)每個(gè)從屬單元包括當(dāng)收到同步分組片段和它的對應(yīng)同步控制信息時(shí),獲得代表數(shù)據(jù)路徑和控制路徑之間的傳播延遲差的時(shí)移信息的第一裝置(533、534、543、544);和(c)每個(gè)從屬單元包括響應(yīng)所述第一裝置(533、534、543、544)獲得的所述時(shí)移信息,延遲數(shù)據(jù)片段或?qū)С龅目刂菩畔⒌牡诙b置(530、531、532、540、541、542、581、582、583)。
3.按照權(quán)利要求2所述的通信設(shè)備,其特征在于與獲得所述時(shí)移信息的所述第一裝置相關(guān)地,每個(gè)所述一個(gè)或多個(gè)從屬單元包括呈計(jì)數(shù)器形式的定序器(550),定序器(550)的內(nèi)容響應(yīng)相應(yīng)從屬單元的本地時(shí)鐘脈沖而增大。
4.按照權(quán)利要求3所述的通信設(shè)備,其特征在于在獲得所述時(shí)移信息的所述第一裝置中,每個(gè)所述一個(gè)或多個(gè)從屬單元包括,(a)控制時(shí)間戳記寄存器(533),用于在通過控制路徑收到從同步分組導(dǎo)出的同步控制信息時(shí)保存定序器(550)的內(nèi)容;和(b)數(shù)據(jù)時(shí)間戳記寄存器(543),用于在通過數(shù)據(jù)路徑收到同步分組片段時(shí)保存所述定序器的內(nèi)容。
5.按照權(quán)利要求4所述的通信設(shè)備,其特征在于提供內(nèi)部或外部控制裝置(580),用于評估一個(gè)或多個(gè)從屬單元之一中的時(shí)間戳記寄存器的內(nèi)容,并確定代表時(shí)移的差值,并且在所述第二裝置中,每個(gè)所述一個(gè)或多個(gè)從屬單元包括(a)獨(dú)立延遲裝置(540;530),用于延遲分組數(shù)據(jù)片段以及延遲導(dǎo)出的控制信息,和(b)激活裝置(541,542;531,532),用于響應(yīng)所述控制裝置(580),在這些延遲裝置(540,530)任意之一中有選擇地激活延遲。
6.按照權(quán)利要求5所述的通信設(shè)備,其特征在于在每個(gè)從屬單元中(a)每個(gè)延遲裝置包括由寫指針和讀指針控制的循環(huán)移位寄存器(540,530),(b)每個(gè)激活裝置包括寫指針寄存器(541,531)和讀指針寄存器(542,532),以及設(shè)置裝置(583,582),所述設(shè)置裝置(583,582)用于把寫指針寄存器(541,531)之一的內(nèi)容設(shè)置成代表所述兩個(gè)時(shí)間戳記寄存器的內(nèi)容之間的差值的延遲值,并把相應(yīng)的另一寫指針寄存器和兩個(gè)讀指針寄存器(542,532)的內(nèi)容設(shè)置成0。
7.按照權(quán)利要求3所述的通信設(shè)備,其特征在于每個(gè)所述一個(gè)或多個(gè)從屬單元包括響應(yīng)同步分組片段或?qū)?yīng)的導(dǎo)出同步控制信息的接收,不論這兩者中的哪個(gè)首先到達(dá),重置所述定序器(550)的裝置(590)。
8.按照權(quán)利要求2所述的通信設(shè)備,還包括重新組裝所述片段以形成數(shù)據(jù)分組的至少一個(gè)出口端口(660a),其特征在于提供一方面補(bǔ)償通信系統(tǒng)的主單元及從屬單元之間的路徑上的傳播延遲差,以及另一方面補(bǔ)償出口端口的路徑上的傳播延遲差的輔助裝置。
9.按照權(quán)利要求2所述的通信設(shè)備,包括至少兩個(gè)分布式通信系統(tǒng)(600,660b),其特征在于提供補(bǔ)償一個(gè)分布式通信系統(tǒng)(600)的模塊的出口線路(640-i)和隨后的分布式通信系統(tǒng)(660b)的模塊的入口線路之間的數(shù)據(jù)路徑,和控制路徑(663-i)上的傳播延遲差的輔助裝置。
10.一種用于處理數(shù)據(jù)分組的主從通信系統(tǒng)中的本地同步方法,每個(gè)所述數(shù)據(jù)分組均包括一個(gè)具有控制信息的報(bào)頭和一個(gè)數(shù)據(jù)有效負(fù)載,并且每個(gè)數(shù)據(jù)分組可通過至少一個(gè)入口端口被接收,在所述系統(tǒng)中,每個(gè)數(shù)據(jù)分組在所述入口端口中被細(xì)分成多個(gè)片段,以便并行處理所述多個(gè)片段;所述系統(tǒng)包括用于并行處理所述多個(gè)片段的一個(gè)主單元和一個(gè)或多個(gè)從屬單元;其中主單元從每個(gè)分組接收具有控制信息的報(bào)頭,一個(gè)或多個(gè)從屬單元通過數(shù)據(jù)路徑接收數(shù)據(jù)片段;其中導(dǎo)出的控制信息通過控制路徑從主單元傳送給一個(gè)或多個(gè)從屬單元;所述方法包括下述步驟(a)在和標(biāo)準(zhǔn)數(shù)據(jù)分組相同的路徑上,從所述入口端口通過系統(tǒng)發(fā)送同樣被細(xì)分成多個(gè)片段的同步分組,并通過和標(biāo)準(zhǔn)導(dǎo)出控制信息相同的路徑,使從同步分組的報(bào)頭導(dǎo)出的同步控制信息經(jīng)過系統(tǒng);(b)當(dāng)收到同步分組片段和它的對應(yīng)同步控制信息時(shí),在一個(gè)或多個(gè)從屬單元中獲得代表數(shù)據(jù)路徑和控制路徑之間的傳播延遲差的時(shí)移信息;和(c)在一個(gè)或多個(gè)從屬單元中,通過針對每個(gè)接收的分組片段,延遲分組片段本身或者導(dǎo)出的控制信息,補(bǔ)償由在步驟(b)中獲得的時(shí)移信息表示的所述傳播延遲差。
11.按照權(quán)利要求10所述的方法,其中在標(biāo)準(zhǔn)數(shù)據(jù)分組之間,每隔一定時(shí)間,從入口端口同系統(tǒng)傳送同步分組。
全文摘要
為了交換或傳送數(shù)據(jù)分組,可提供一種通信系統(tǒng),所述通信系統(tǒng)由并行作用于一個(gè)分組的多個(gè)片段,以便提高速度和處理容量的數(shù)個(gè)模塊組成。一個(gè)模塊充當(dāng)主模塊(21),其它模塊是受由主模塊導(dǎo)出的控制信號(25)控制的從屬模塊(22)。重要的是在每個(gè)模塊中,數(shù)據(jù)片段和每個(gè)分組的相應(yīng)控制信號被正確同步,因?yàn)樵诖笮拖到y(tǒng)中,傳送分組片段的數(shù)據(jù)路徑和控制信號路徑可能具有明顯不同的延遲。本發(fā)明測量傳播延遲差,并在每個(gè)從屬模塊中引入受控延遲,從而通過延遲數(shù)據(jù)片段或控制信號,能夠正確地使數(shù)據(jù)片段和控制信號相關(guān)。除了標(biāo)準(zhǔn)數(shù)據(jù)分組之外,還傳送同步分組,以便獲得用于確定延遲差的時(shí)間戳記。
文檔編號H04Q11/04GK1643854SQ03806594
公開日2005年7月20日 申請日期2003年3月31日 優(yōu)先權(quán)日2002年4月30日
發(fā)明者弗蘭科歐斯·G·阿貝爾, 阿蘭·班那, 阿蘭·布蘭克, 邁克爾·克爾芒, 米奇·格薩特, 邁克爾·波雷, 諾博特·舒馬切爾, 馬克·韋爾哈潘 申請人:國際商業(yè)機(jī)器公司