亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

任務(wù)處理方法及裝置、電子設(shè)備、計算機可讀存儲介質(zhì)與流程

文檔序號:40398602發(fā)布日期:2024-12-20 12:22閱讀:4來源:國知局
任務(wù)處理方法及裝置、電子設(shè)備、計算機可讀存儲介質(zhì)與流程

本公開涉及數(shù)據(jù)處理,特別涉及一種任務(wù)處理方法及裝置、電子設(shè)備、計算機可讀存儲介質(zhì)。


背景技術(shù):

1、隨著計算機的日益普及,越來越多的任務(wù)能夠通過計算機執(zhí)行。在相關(guān)技術(shù)中,針對數(shù)據(jù)量級較大的任務(wù),通常需要分配多個處理設(shè)備共同處理,借助多個處理設(shè)備之間的相互配合,共同完成任務(wù)的處理流程。

2、但是,在上述方式中,由于多個處理設(shè)備共同用于處理同一個任務(wù),因此,設(shè)備之間存在緊密的數(shù)據(jù)關(guān)聯(lián)關(guān)系,一旦其中的一個處理設(shè)備出現(xiàn)故障,則需要同時針對多個處理設(shè)備中的數(shù)據(jù)內(nèi)容進行調(diào)整。由此可見,在多設(shè)備共同處理任務(wù)的場景中,存在著故障處理效率低下的問題。


技術(shù)實現(xiàn)思路

1、本公開提供一種任務(wù)處理方法及裝置、電子設(shè)備、計算機可讀存儲介質(zhì)。

2、第一方面,本公開提供了一種任務(wù)處理方法,所述任務(wù)包括多個子任務(wù),且所述多個子任務(wù)通過多個處理設(shè)備處理,所述方法包括:

3、在檢測到所述多個處理設(shè)備中存在異常設(shè)備的情況下,根據(jù)預(yù)先配置的任務(wù)部署關(guān)系,將所述異常設(shè)備中部署的子任務(wù)確定為目標(biāo)子任務(wù);

4、確定目標(biāo)設(shè)備,將所述目標(biāo)子任務(wù)部署于所述目標(biāo)設(shè)備,更新所述任務(wù)部署關(guān)系;

5、根據(jù)預(yù)先配置的任務(wù)依賴關(guān)系,確定與所述目標(biāo)子任務(wù)存在關(guān)聯(lián)關(guān)系的關(guān)聯(lián)子任務(wù),根據(jù)所述任務(wù)部署關(guān)系,確定所述關(guān)聯(lián)子任務(wù)的關(guān)聯(lián)設(shè)備;

6、在所述目標(biāo)設(shè)備與所述關(guān)聯(lián)設(shè)備之間建立通信關(guān)系,以使所述多個處理設(shè)備根據(jù)更新后的任務(wù)部署關(guān)系以及所述任務(wù)依賴關(guān)系處理所述任務(wù)。

7、第二方面,本公開提供了一種大模型的分布式訓(xùn)練方法,包括:

8、將所述大模型的訓(xùn)練任務(wù)劃分為多個子任務(wù);

9、分別針對每個子任務(wù)進行編譯處理,得到每個子任務(wù)對應(yīng)的編譯結(jié)果文件;

10、根據(jù)多個子任務(wù)對應(yīng)的多個編譯結(jié)果文件,配置多個子任務(wù)之間的任務(wù)依賴關(guān)系;

11、將多個子任務(wù)部署至多個處理設(shè)備,根據(jù)部署結(jié)果配置所述多個子任務(wù)與所述多個處理設(shè)備之間的任務(wù)部署關(guān)系;

12、根據(jù)上述的任務(wù)處理方法處理所述多個子任務(wù)。第三方面,本公開提供了一種任務(wù)處理裝置,所述任務(wù)包括多個子任務(wù),且所述多個子任務(wù)通過多個處理設(shè)備處理,所述裝置包括:

13、檢測模塊,用于在檢測到所述多個處理設(shè)備中存在異常設(shè)備的情況下,根據(jù)預(yù)先配置的任務(wù)部署關(guān)系,將所述異常設(shè)備中部署的子任務(wù)確定為目標(biāo)子任務(wù);

14、更新模塊,用于確定目標(biāo)設(shè)備,將所述目標(biāo)子任務(wù)部署于所述目標(biāo)設(shè)備,更新所述任務(wù)部署關(guān)系;

15、確定模塊,用于根據(jù)預(yù)先配置的任務(wù)依賴關(guān)系,確定與所述目標(biāo)子任務(wù)存在關(guān)聯(lián)關(guān)系的關(guān)聯(lián)子任務(wù),根據(jù)所述任務(wù)部署關(guān)系,確定所述關(guān)聯(lián)子任務(wù)的關(guān)聯(lián)設(shè)備;

16、建立模塊,用于在所述目標(biāo)設(shè)備與所述關(guān)聯(lián)設(shè)備之間建立通信關(guān)系,以使所述多個處理設(shè)備根據(jù)更新后的任務(wù)部署關(guān)系以及所述任務(wù)依賴關(guān)系處理所述任務(wù)所述任務(wù)包括多個子任務(wù),且所述多個子任務(wù)通過多個處理設(shè)備處理,所述裝置包括:

17、檢測模塊,用于在檢測到所述多個處理設(shè)備中存在異常設(shè)備的情況下,根據(jù)預(yù)先配置的任務(wù)部署關(guān)系,將所述異常設(shè)備中部署的子任務(wù)確定為目標(biāo)子任務(wù);

18、更新模塊,用于確定目標(biāo)設(shè)備,將所述目標(biāo)子任務(wù)部署于所述目標(biāo)設(shè)備,更新所述任務(wù)部署關(guān)系;

19、確定模塊,用于根據(jù)預(yù)先配置的任務(wù)依賴關(guān)系,確定與所述目標(biāo)子任務(wù)存在關(guān)聯(lián)關(guān)系的關(guān)聯(lián)子任務(wù),根據(jù)所述任務(wù)部署關(guān)系,確定所述關(guān)聯(lián)子任務(wù)的關(guān)聯(lián)設(shè)備;

20、建立模塊,用于在所述目標(biāo)設(shè)備與所述關(guān)聯(lián)設(shè)備之間建立通信關(guān)系,以使所述多個處理設(shè)備根據(jù)更新后的任務(wù)部署關(guān)系以及所述任務(wù)依賴關(guān)系處理所述任務(wù)。

21、第四方面,本公開提供了一種電子設(shè)備,該電子設(shè)備包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的一個或多個計算機程序,一個或多個所述計算機程序被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行上述的方法。

22、第五方面,本公開提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其中,所述計算機程序在被處理器/處理核執(zhí)行時實現(xiàn)上述的方法。

23、本公開所提供的實施例,預(yù)先將任務(wù)拆分為多個子任務(wù),并分別配置了任務(wù)部署關(guān)系以及任務(wù)依賴關(guān)系。其中,任務(wù)部署關(guān)系用于記錄子任務(wù)與處理設(shè)備之間的對應(yīng)關(guān)系,任務(wù)依賴關(guān)系用于記錄多個子任務(wù)之間的關(guān)聯(lián)關(guān)系。相應(yīng)的,在任一處理設(shè)備出現(xiàn)異常的情況下,首先,根據(jù)任務(wù)部署關(guān)系確定異常設(shè)備中的目標(biāo)子任務(wù),從而將目標(biāo)子任務(wù)重新部署至目標(biāo)設(shè)備上。然后,根據(jù)任務(wù)依賴關(guān)系確定目標(biāo)子任務(wù)的關(guān)聯(lián)子任務(wù),并結(jié)合任務(wù)部署關(guān)系確定關(guān)聯(lián)子任務(wù)的關(guān)聯(lián)設(shè)備,從而在目標(biāo)設(shè)備與關(guān)聯(lián)設(shè)備之間建立通信連接,進而使目標(biāo)設(shè)備替代異常設(shè)備繼續(xù)處理。由此可見,該方式分別配置了任務(wù)部署關(guān)系以及任務(wù)依賴關(guān)系,其中,任務(wù)依賴關(guān)系是與設(shè)備的具體硬件信息無關(guān)的內(nèi)容,因而實現(xiàn)了任務(wù)與設(shè)備之間的分離。所以,在任一設(shè)備出現(xiàn)故障的情況下,無需更改任務(wù)依賴關(guān)系,只需調(diào)整任務(wù)部署關(guān)系即可,而任務(wù)部署關(guān)系的調(diào)整不涉及任務(wù)編譯等處理環(huán)節(jié),因而大幅降低了設(shè)備故障后的處理耗時,提升了故障處理效率。

24、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識本公開的實施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。



技術(shù)特征:

1.一種任務(wù)處理方法,所述任務(wù)包括多個子任務(wù),且所述多個子任務(wù)通過多個處理設(shè)備處理,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其中,所述任務(wù)依賴關(guān)系通過以下方式配置:

3.根據(jù)權(quán)利要求2所述的方法,其中,所述任務(wù)部署關(guān)系通過以下方式配置:

4.根據(jù)權(quán)利要求3所述的方法,其中,所述將所述目標(biāo)子任務(wù)部署于所述目標(biāo)設(shè)備包括:

5.根據(jù)權(quán)利要求4所述的方法,其中,所述任務(wù)為神經(jīng)網(wǎng)絡(luò)模型的分布式訓(xùn)練任務(wù);并且,所述多個子任務(wù)包括:通過數(shù)據(jù)并行方式劃分的多個第一類子任務(wù),和/或通過模型并行方式劃分的多個第二類子任務(wù);

6.根據(jù)權(quán)利要求5所述的方法,其中,所述獲取所述目標(biāo)子任務(wù)對應(yīng)的模型數(shù)據(jù)包括:

7.根據(jù)權(quán)利要求6所述的方法,其中,所述從所述多個處理設(shè)備中選擇當(dāng)前處于神經(jīng)網(wǎng)絡(luò)的前向傳播過程的候選處理設(shè)備包括:

8.根據(jù)權(quán)利要求1-7任一所述的方法,其中,所述確定目標(biāo)設(shè)備包括:

9.根據(jù)權(quán)利要求1-7任一所述的方法,所述處理設(shè)備包括:眾核系統(tǒng)中的處理核、包含多個處理核的芯片設(shè)備、和/或包含多個芯片的服務(wù)器設(shè)備。

10.一種大模型的分布式訓(xùn)練方法,其特征在于,包括:

11.一種任務(wù)處理裝置,其特征在于,所述任務(wù)包括多個子任務(wù),且所述多個子任務(wù)通過多個處理設(shè)備處理,所述裝置包括:

12.一種電子設(shè)備,其特征在于,包括:

13.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序在被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-10中任一項所述的方法。


技術(shù)總結(jié)
本公開提供了一種任務(wù)處理方法及裝置、電子設(shè)備、計算機可讀存儲介質(zhì),該方法包括:在檢測到所述多個處理設(shè)備中存在異常設(shè)備的情況下,根據(jù)預(yù)先配置的任務(wù)部署關(guān)系,將所述異常設(shè)備中部署的子任務(wù)確定為目標(biāo)子任務(wù);確定目標(biāo)設(shè)備,將所述目標(biāo)子任務(wù)部署于所述目標(biāo)設(shè)備,更新所述任務(wù)部署關(guān)系;根據(jù)預(yù)先配置的任務(wù)依賴關(guān)系,確定與所述目標(biāo)子任務(wù)存在關(guān)聯(lián)關(guān)系的關(guān)聯(lián)子任務(wù),根據(jù)所述任務(wù)部署關(guān)系,確定所述關(guān)聯(lián)子任務(wù)的關(guān)聯(lián)設(shè)備;在所述目標(biāo)設(shè)備與所述關(guān)聯(lián)設(shè)備之間建立通信關(guān)系,以使所述多個處理設(shè)備根據(jù)更新后的任務(wù)部署關(guān)系以及所述任務(wù)依賴關(guān)系處理所述任務(wù)。根據(jù)本公開的實施例能夠大幅降低設(shè)備故障后的處理耗時,提升故障處理效率。

技術(shù)研發(fā)人員:張偉豪,沈楊書
受保護的技術(shù)使用者:北京靈汐科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/19
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1