基于分布式pcie系統(tǒng)的線卡故障恢復(fù)方法及相關(guān)設(shè)備的制作方法
【專利摘要】本發(fā)明公開了一種基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)方法、裝置及線卡,該方法包括:所述分布式PCIE系統(tǒng)中的故障線卡自動重啟后,關(guān)閉所述故障線卡上的PCIE端口,以通知所述分布式PCIE系統(tǒng)中與所述故障線卡連接的交換芯片丟棄目的地址為所述故障線卡的地址的數(shù)據(jù);獲取預(yù)先保存的所述故障線卡的PCIE配置信息后,根據(jù)獲取的PCIE配置信息進(jìn)行配置;開啟所述PCIE端口,以通知所述交換芯片恢復(fù)發(fā)送目的地址為所述故障線卡的地址的數(shù)據(jù)。該方案可以有效避免整個(gè)PCIE系統(tǒng)發(fā)生擁塞,節(jié)省了主控卡的軟件資源。
【專利說明】基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)方法及相關(guān)設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,尤指一種基于分布式快速外設(shè)部件互聯(lián)(PeripheralComponent Interconnect Express, PCIE)系統(tǒng)的線卡故障恢復(fù)方法、裝置及線卡。
【背景技術(shù)】
[0002]PCIE總線是應(yīng)用于通信系統(tǒng)中各組件之間傳輸數(shù)據(jù)的高性能總線。在PCIE系統(tǒng)中采用點(diǎn)對點(diǎn)連接方式,每一對互連的組件之間都擁有獨(dú)立的PCIE總線,各組件之間并發(fā)進(jìn)行數(shù)據(jù)傳輸互不影響。由于采用點(diǎn)對點(diǎn)的互連技術(shù),通過PCIE交換芯片(Switch,SW)還可以靈活擴(kuò)展PCIE系統(tǒng)的拓?fù)浣Y(jié)構(gòu)。
[0003]PCIE 系統(tǒng)一般包括根組件(Root Complex,RC)、PCIE SW 和端點(diǎn)(End Point, EP)0RC —般集成在中央處理器(Central Processing Unit, CPU)中,除了通常的數(shù)據(jù)傳輸功能夕卜,還可以實(shí)現(xiàn)對整個(gè)PCIE系統(tǒng)進(jìn)行掃描、配置、管理等等功能。PCIE SW至少包含兩個(gè)以上的端口,允許數(shù)據(jù)從一個(gè)端口傳輸?shù)搅硪粋€(gè)端口,它的主要功能是擴(kuò)展PCIE系統(tǒng)的拓?fù)?。EP是各種集成了 PCIE端口的設(shè)備,EP可以通過PCIE總線實(shí)現(xiàn)和其他的EP或RC之間的數(shù)據(jù)傳輸。如圖1所示為一個(gè)簡單的PCIE系統(tǒng)的結(jié)構(gòu)。
[0004]下面介紹PCIE系統(tǒng)的幾個(gè)特性。
[0005]第一是掃描,在PCIE系統(tǒng)剛上電時(shí),RC看不到PCIE系統(tǒng)上的其他組件,因此必須進(jìn)行掃描。掃描時(shí),RC會發(fā)出特定報(bào)文,接收到該特定報(bào)文的組件會向RC發(fā)送響應(yīng)報(bào)文,RC接收到響應(yīng)報(bào)文后就確認(rèn)該組件存在。掃描完成后,RC就可以確認(rèn)整個(gè)PCIE系統(tǒng)存在的組件及其連接方式等信息。
[0006]第二是配置,在掃描完成后,RC還需要對PCIE系統(tǒng)里的各個(gè)組件進(jìn)行配置,配置的目的是為了合理設(shè)置各組件里的寄存器,使整個(gè)PCIE系統(tǒng)可以進(jìn)行正常的數(shù)據(jù)傳輸。例如,RC要對各個(gè)EP內(nèi)部的基址寄存器進(jìn)行設(shè)置,而基址寄存器存儲的是RC分配給各個(gè)EP的內(nèi)存空間,EP就是根據(jù)基址寄存器里的內(nèi)容,來判斷是否應(yīng)該接收出現(xiàn)在PCIE總線上數(shù)據(jù)。
[0007]第三是流控,PCIE系統(tǒng)是一種可靠的數(shù)據(jù)傳輸系統(tǒng),所有的數(shù)據(jù)傳輸都必須遵守基于信用點(diǎn)的流控來保證數(shù)據(jù)在PCIE系統(tǒng)里不被隨意丟棄。信用點(diǎn)是和可發(fā)送的數(shù)據(jù)相對應(yīng)的,信用點(diǎn)多,則表示可發(fā)送的數(shù)據(jù)多,反之,則表示可發(fā)送的數(shù)據(jù)少。假設(shè)組件A和組件B為PCIE系統(tǒng)中的兩個(gè)組件,組件A向組件B發(fā)送報(bào)文的基本原理如圖2所示。
[0008]首先組件B會根據(jù)自己內(nèi)部空閑緩沖區(qū)的大小,定期發(fā)送攜帶信用點(diǎn)信息的報(bào)文給組件A,組件A收到后會更新自己的信用池。組件A向組件B發(fā)送報(bào)文前,要先查詢自身的信用池,判斷是否有足夠的信用點(diǎn),若信用點(diǎn)足夠,則向組件B發(fā)送報(bào)文,同時(shí)信用池內(nèi)的信用點(diǎn)就會相應(yīng)的減少;若信用點(diǎn)不夠,則不能向設(shè)備B發(fā)送報(bào)文。由于組件內(nèi)的信用池反映的是對端組件空閑緩沖區(qū)的大小,從而保證只有對端組件的空閑緩沖區(qū)足夠大時(shí),才能向?qū)Χ私M件發(fā)送報(bào)文,避免對端組件因?yàn)榫彌_區(qū)不足而發(fā)生丟包,保證數(shù)據(jù)傳輸?shù)目煽啃?。[0009]一般情況下,RC集成在CPU內(nèi)部,有獨(dú)立的軟件系統(tǒng),PCIE Sff以芯片的形式存在,EP的形式比較靈活,可以是沒有獨(dú)立運(yùn)行軟件系統(tǒng)的一般接口芯片,也可以是有獨(dú)立運(yùn)行軟件系統(tǒng)并集成了 EP功能的CPU。若EP的形式是后者,則PCIE系統(tǒng)擁有至少兩個(gè)CPU和軟件系統(tǒng),這樣的PCIE系統(tǒng)稱為分布式PCIE系統(tǒng)。在分布式PCIE系統(tǒng)中,RC所在的板卡稱為主控卡,EP所在的板卡稱為線卡,如圖3所示是擁有三個(gè)CPU的分布式PCIE系統(tǒng)。
[0010]目前,隨著網(wǎng)絡(luò)通信技術(shù)的快速發(fā)展,分布式PCIE系統(tǒng)應(yīng)用在越來越多的網(wǎng)絡(luò)設(shè)備中,特別是要求高性能和強(qiáng)大處理能力的核心網(wǎng)絡(luò)設(shè)備。
[0011]分布式PCIE系統(tǒng)由于存在多個(gè)CPU,處理性能很高,而可靠性卻比較差。因?yàn)槊總€(gè)CPU有自己的軟件系統(tǒng),很容易因?yàn)檐浖矫娴脑虺霈F(xiàn)故障,例如當(dāng)軟件陷入死循環(huán)、出現(xiàn)跑飛等等情況時(shí)都會出現(xiàn)故障,線卡檢測到自己的CPU故障后,會重啟CPU,該CPU所在的線卡上的配置信息全部丟失,無法繼續(xù)正常傳輸數(shù)據(jù)。線卡要想恢復(fù)正常的傳輸數(shù)據(jù),需要在主控卡檢測到線卡發(fā)生故障、并對其重新進(jìn)行掃描和配置后才行。由于從線卡發(fā)生故障到主控卡檢測出線卡發(fā)生故障并重新進(jìn)行掃描和配置需要一段比較長的時(shí)間,這段時(shí)間內(nèi)有可能因?yàn)楣收暇€卡觸發(fā)整個(gè)PCIE系統(tǒng)發(fā)生擁塞,進(jìn)而影響其他正常線卡的數(shù)據(jù)傳輸;并且,在故障恢復(fù)的過程中需要主控卡重新進(jìn)行掃描和配置,還會浪費(fèi)主控卡的軟件資源。
【發(fā)明內(nèi)容】
[0012]本發(fā)明實(shí)施例提供一種基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)方法、裝置及線卡,用以解決現(xiàn)有的基于分布式PCIE系統(tǒng)對故障線卡進(jìn)行恢復(fù)的過程中,可能觸發(fā)整個(gè)PCIE系統(tǒng)發(fā)生擁塞、進(jìn)而影響其他正常線卡的數(shù)據(jù)傳輸,以及浪費(fèi)主控卡的軟件資源的問題。
[0013]因此,根據(jù)本發(fā)明實(shí)施例,提供一種基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)方法,包括:
[0014]所述分布式PCIE系統(tǒng)中的故障線卡自動重啟后,關(guān)閉所述故障線卡上的PCIE端口,以通知所述分布式PCIE系統(tǒng)中與所述故障線卡連接的交換芯片丟棄目的地址為所述故障線卡的地址的數(shù)據(jù);
[0015]獲取預(yù)先保存的所述故障線卡的PCIE配置信息后,根據(jù)獲取的PCIE配置信息進(jìn)行配置;
[0016]開啟所述PCIE端口,以通知所述交換芯片恢復(fù)發(fā)送目的地址為所述故障線卡的地址的數(shù)據(jù)。
[0017]具體的,預(yù)先保存所述故障線卡的PCIE配置信息,具體包括:
[0018]所述故障線卡發(fā)生故障之前,在存儲器中保存所述PCIE配置信息。
[0019]具體的,獲取預(yù)先保存的所述故障線卡的PCIE配置信息,具體包括:
[0020]從所述存儲器中獲取所述PCIE配置信息。
[0021]具體的,所述存儲器為非易失存儲器。
[0022]還提供一種基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)裝置,包括:
[0023]關(guān)閉單元,用于自身所在的所述分布式PCIE系統(tǒng)中的故障線卡自動重啟后,關(guān)閉所述故障線卡上的PCIE端口,以通知所述分布式PCIE系統(tǒng)中所述故障線卡連接的交換芯片丟棄目的地址為所述故障線卡的地址的數(shù)據(jù);
[0024]配置單元,用于獲取預(yù)先保存的所述故障線卡的PCIE配置信息后,根據(jù)獲取的PCIE配置信息進(jìn)行配置;
[0025]開啟單元,用于開啟所述PCIE端口,以通知所述交換芯片恢復(fù)發(fā)送目的地址為所述故障線卡的地址的數(shù)據(jù)。
[0026]具體的,所述配置單元,用于預(yù)先保存所述故障線卡的PCIE配置信息,具體用于:
[0027]在所述故障線卡發(fā)生故障之前,在存儲器中保存所述PCIE配置信息。
[0028]具體的,所述配置單元,用于獲取預(yù)先保存的所述故障線卡的PCIE配置信息,具體用于:
[0029]從所述存儲器中獲取所述PCIE配置信息。
[0030]具體的,所述存儲器為非易失存儲器。
[0031]還提供一種線卡,包括上述基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)裝置。
[0032]本發(fā)明實(shí)施例提供的基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)方法、裝置及線卡,由于在線卡故障前保存了 PCIE配置信息,從而可以保證線卡發(fā)生故障并自動重啟后,自身可以進(jìn)行配置,并通過關(guān)閉和開啟PCIE端口來實(shí)現(xiàn)通知分布式PCIE系統(tǒng)中與故障線卡連接的交換芯片丟棄還是恢復(fù)發(fā)送目的地址為故障線卡的地址的數(shù)據(jù),在故障恢復(fù)的過程中可以有效避免整個(gè)PCIE系統(tǒng)發(fā)生擁塞,進(jìn)而保證其他正常線卡的數(shù)據(jù)傳輸;并且,故障恢復(fù)過程無需主控卡的參與就可以完成,節(jié)省了主控卡的軟件資源。
【專利附圖】
【附圖說明】
[0033]圖1為現(xiàn)有技術(shù)PCIE系統(tǒng)的結(jié)構(gòu)示意圖;
[0034]圖2為現(xiàn)有技術(shù)中組件A和組件B之間基于信用點(diǎn)傳輸數(shù)據(jù)的示意圖;
[0035]圖3為現(xiàn)有技術(shù)中分布式PCIE系統(tǒng)的結(jié)構(gòu)示意圖;
[0036]圖4為現(xiàn)有技術(shù)中基于圖3的兩條數(shù)據(jù)流的不意圖;
[0037]圖5為本發(fā)明實(shí)施例中基于分布式系統(tǒng)的線卡故障恢復(fù)方法的流程圖;
[0038]圖6為本發(fā)明實(shí)施例中基于分布式系統(tǒng)的線卡故障恢復(fù)裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0039]針對現(xiàn)有的基于分布式PCIE系統(tǒng)對故障線卡進(jìn)行恢復(fù)的過程中,可能觸發(fā)整個(gè)PCIE系統(tǒng)發(fā)生擁塞、進(jìn)而影響其他正常線卡的數(shù)據(jù)傳輸,以及浪費(fèi)主控卡的軟件資源的問題。發(fā)明人進(jìn)行了認(rèn)真的研究發(fā)現(xiàn):
[0040]如圖4所示,假設(shè)有兩條數(shù)據(jù)流,分別為線卡I到線卡2的數(shù)據(jù)流I和線卡I到主控卡的數(shù)據(jù)流2,分布式PCIE系統(tǒng)正常運(yùn)行時(shí),這兩條數(shù)據(jù)流可以正常傳輸。當(dāng)線卡2發(fā)生故障并自動重啟后,線卡2內(nèi)的配置寄存器會被復(fù)位,原來的PCIE配置信息丟失,線卡2無法再正常接收數(shù)據(jù)。
[0041]由于其他線卡無法得知線卡2已經(jīng)故障,所以還會繼續(xù)向線卡2發(fā)送數(shù)據(jù)。線卡I會繼續(xù)通過PCIE SW的端口 2和端口 3向線卡2發(fā)送數(shù)據(jù),由于線卡2無法正常接收數(shù)據(jù),數(shù)據(jù)會積累在線卡2的空閑緩沖區(qū)里,從而耗盡線卡2的空閑緩沖區(qū),導(dǎo)致PCIE Sff的端口3里的信用池被耗盡,端口 3無法繼續(xù)向線卡2發(fā)送數(shù)據(jù)。
[0042]當(dāng)線卡I繼續(xù)通過PCIE SW的端口 2向線卡2發(fā)送數(shù)據(jù),由于數(shù)據(jù)無法從PCIE Sff的端口 3發(fā)出,數(shù)據(jù)會積累在PCIE SW的端口 2的空閑緩沖區(qū)中,最終導(dǎo)致端口 2的空閑緩沖區(qū)被耗盡,線卡I的信用池也被耗盡,線卡I無法再向PCIE Sff的端口 2發(fā)送數(shù)據(jù)。
[0043]因?yàn)榫€卡I無法向PCIE Sff的端口 2發(fā)送數(shù)據(jù),導(dǎo)致數(shù)據(jù)流2也出現(xiàn)斷流,數(shù)據(jù)都堆積在交換芯片中,這時(shí)分布式PCIE系統(tǒng)就發(fā)生了擁塞,擁塞發(fā)生后,線卡I雖然是正常線卡,但是仍然無法進(jìn)行正常的數(shù)據(jù)傳輸。
[0044]為了減少誤判,主控卡在線卡2發(fā)生故障后一段較長的時(shí)間內(nèi)才能檢測到線卡2發(fā)生故障,并會對線卡2重新進(jìn)行掃描和配置,線卡2故障恢復(fù)后,擁塞才能逐漸解除,整個(gè)分布式PCIE系統(tǒng)恢復(fù)正常。
[0045]基于上述分析,本發(fā)明實(shí)施例提供一種基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)方法,該方法的流程如圖5所示,執(zhí)行步驟如下:
[0046]S50:分布式PCIE系統(tǒng)中的故障線卡自動重啟后,關(guān)閉故障線卡上的PCIE端口,以通知分布式PCIE系統(tǒng)中與故障線卡連接的交換芯片丟棄目的地址為故障線卡的地址的數(shù)據(jù)。
[0047]繼續(xù)沿用圖4的示例,線卡2發(fā)生某些故障后會自動重啟,故障可能為軟件跑飛、掛死等,線卡2的配置寄存器中的數(shù)據(jù)都會被復(fù)位到原始默認(rèn)狀態(tài),也就相當(dāng)于線卡2正常運(yùn)行時(shí)的PCIE配置信息丟失了,線卡2無法繼續(xù)接收數(shù)據(jù)。
[0048]線卡2自動重啟后,會進(jìn)行初始化,首先關(guān)閉PCIE端口,也就是說將PCIE端口的狀態(tài)設(shè)置為關(guān)閉(Disable)狀態(tài),該P(yáng)CIE端口所連接的PCIE總線處于斷開(Link down)狀態(tài)。該P(yáng)CIE端口所連接的PCIE總線另一端的PCIE SW的端口 3也將處于Link down狀態(tài)。
[0049]根據(jù)PCIE規(guī)范,PCIE Sff檢測到端口 3處于Link down時(shí),會把通過端口 3發(fā)往線卡2的所有數(shù)據(jù)丟棄,這樣端口 2的空閑緩沖區(qū)就不會被目的地址為線卡2的地址的數(shù)據(jù)耗盡,那么數(shù)據(jù)流2就可以保持正常傳輸,這樣就達(dá)到了線卡2故障重啟但不影響其他線卡正常工作的目的。
[0050]S51:獲取預(yù)先保存的故障線卡的PCIE配置信息后,根據(jù)獲取的PCIE配置信息進(jìn)行配置。
[0051 ] 線卡2初始化過程中,獲取預(yù)先保存的線卡2的PCIE配置信息,用來配置線卡2的配置寄存器,這樣就可以在線卡2重啟后,不需要主控卡重新發(fā)起對線卡2的掃描和配置。
[0052]S52:開啟端口,以通知交換芯片恢復(fù)發(fā)送目的地址為故障線卡的地址的數(shù)據(jù)。
[0053]配置完成后,線卡2將重新開啟PCIE端口,也就是將PCIE端口的狀態(tài)設(shè)置為開啟(Enable)狀態(tài),PCIE端口所連接的PCIE總線處于連通(Link up)狀態(tài)。
[0054]PCIE SW檢測到端口 3處于Link up狀態(tài)后,將恢復(fù)通過端口 3端口向線卡2發(fā)送數(shù)據(jù),線卡2也將正常接收數(shù)據(jù),整個(gè)分布式PCIE系統(tǒng)恢復(fù)正常。
[0055]該方案中,由于在線卡故障前保存了 PCIE配置信息,從而可以保證線卡發(fā)生故障并自動重啟后,自身可以進(jìn)行配置,并通過關(guān)閉和開啟PCIE端口來實(shí)現(xiàn)通知分布式PCIE系統(tǒng)中與故障線卡連接的交換芯片丟棄還是恢復(fù)發(fā)送目的地址為故障線卡的地址的數(shù)據(jù),在故障恢復(fù)的過程中可以有效避免整個(gè)PCIE系統(tǒng)發(fā)生擁塞,進(jìn)而保證其他正常線卡的數(shù)據(jù)傳輸;并且,故障恢復(fù)過程無需主控卡的參與就可以完成,節(jié)省了主控卡的軟件資源。
[0056]具體的,上述S51中的預(yù)先保存故障線卡的PCIE配置信息,具體包括:故障線卡發(fā)生故障之前,在存儲器中保存PCIE配置信息。
[0057]線卡正常運(yùn)行時(shí),會定期將配置寄存器里的PCIE配置信息保存在存儲器中,從而便于線卡故障后可以自行獲取并進(jìn)行配置。
[0058]具體的,上述S51中的獲取預(yù)先保存的故障線卡的PCIE配置信息,具體包括:從存儲器中獲取PCIE配置信息。
[0059]具體的,上述存儲器為非易失存儲器,具體為電可擦可編程只讀存儲器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、閃存(FLASH)等等,由于采用非易失存儲器,可以保證在線卡復(fù)位或下電時(shí),所存儲的信息不丟失。
[0060]基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例提供一種基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)裝置,該裝置可以設(shè)置在線卡中,結(jié)構(gòu)如圖6所示,包括:
[0061]關(guān)閉單元60,用于自身所在的分布式PCIE系統(tǒng)中的故障線卡自動重啟后,關(guān)閉故障線卡上的PCIE端口,以通知分布式PCIE系統(tǒng)中與故障線卡連接的交換芯片丟棄目的地址為故障線卡的地址的數(shù)據(jù)。
[0062]配置單元61,用于獲取預(yù)先保存的故障線卡的PCIE配置信息后,根據(jù)獲取的PCIE配置信息進(jìn)行配置。
[0063]開啟單元62,用于開啟PCIE端口,以通知交換芯片恢復(fù)發(fā)送目的地址為故障線卡的地址的數(shù)據(jù)。
[0064]具體的,上述配置單元61,用于預(yù)先保存故障線卡的PCIE配置信息,具體用于:在故障線卡發(fā)生故障之前,在存儲器中保存PCIE配置信息。
[0065]具體的,上述配置單元61,用于獲取預(yù)先保存的故障線卡的PCIE配置信息,具體用于:從存儲器中獲取PCIE配置信息。
[0066]具體的,上述存儲器為非易失存儲器。
[0067]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0068]這些計(jì)算機(jī)程序指令也可存儲在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲器中,使得存儲在該計(jì)算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0069]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0070]盡管已描述了本發(fā)明的可選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實(shí)施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括可選實(shí)施例以及落入本發(fā)明范圍的所有變更和修改。
[0071]顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明實(shí)施例進(jìn)行各種改動和變型而不脫離本發(fā)明實(shí)施例的精神和范圍。這樣,倘若本發(fā)明實(shí)施例的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
【權(quán)利要求】
1.一種基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)方法,其特征在于,包括: 所述分布式快速外設(shè)部件互聯(lián)PCIE系統(tǒng)中的故障線卡自動重啟后,關(guān)閉所述故障線卡上的PCIE端口,以通知所述分布式PCIE系統(tǒng)中與所述故障線卡連接的交換芯片丟棄目的地址為所述故障線卡的地址的數(shù)據(jù); 獲取預(yù)先保存的所述故障線卡的PCIE配置信息后,根據(jù)獲取的PCIE配置信息進(jìn)行配置; 開啟所述PCIE端口,以通知所述交換芯片恢復(fù)發(fā)送目的地址為所述故障線卡的地址的數(shù)據(jù)。
2.如權(quán)利要求1所述的方法,其特征在于,預(yù)先保存所述故障線卡的PCIE配置信息,具體包括: 所述故障線卡發(fā)生故障之前,在存儲器中保存所述PCIE配置信息。
3.如權(quán)利要求2所述的方法,其特征在于,獲取預(yù)先保存的所述故障線卡的PCIE配置信息,具體包括: 從所述存儲器中獲取所述PCIE配置信息。
4.如權(quán)利要求2或3所述的方法,其特征在于,所述存儲器為非易失存儲器。
5.一種基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)裝置,其特征在于,包括: 關(guān)閉單元,用于自身所在的所述分布式快速外設(shè)部件互聯(lián)PCIE系統(tǒng)中的故障線卡自動重啟后,關(guān)閉所述故障線卡上的PCIE端口,以通知所述分布式PCIE系統(tǒng)中所述故障線卡連接的交換芯片丟棄目的地址為所述故障線卡的地址的數(shù)據(jù); 配置單元,用于獲取預(yù)先保存的所述故障線卡的PCIE配置信息后,根據(jù)獲取的PCIE配置信息進(jìn)行配置; 開啟單元,用于開啟所述PCIE端口,以通知所述交換芯片恢復(fù)發(fā)送目的地址為所述故障線卡的地址的數(shù)據(jù)。
6.如權(quán)利要求5所述的裝置,其特征在于,所述配置單元,用于預(yù)先保存所述故障線卡的PCIE配置信息,具體用于: 在所述故障線卡發(fā)生故障之前,在存儲器中保存所述PCIE配置信息。
7.如權(quán)利要求6所述的裝置,其特征在于,所述配置單元,用于獲取預(yù)先保存的所述故障線卡的PCIE配置信息,具體用于: 從所述存儲器中獲取所述PCIE配置信息。
8.如權(quán)利要求6或7所述的裝置,其特征在于,所述存儲器為非易失存儲器。
9.一種線卡,其特征在于,包括如權(quán)利要求5-8任一所述的基于分布式PCIE系統(tǒng)的線卡故障恢復(fù)裝置。
【文檔編號】H04L12/40GK103618618SQ201310572292
【公開日】2014年3月5日 申請日期:2013年11月13日 優(yōu)先權(quán)日:2013年11月13日
【發(fā)明者】黃冠華 申請人:福建星網(wǎng)銳捷網(wǎng)絡(luò)有限公司