1.一種用于ai模型訓練的gpu集群數(shù)據(jù)共享方法,其特征在于,包括以下步驟:
2.根據(jù)權利要求1所述的用于ai模型訓練的gpu集群數(shù)據(jù)共享方法,其特征在于,所述數(shù)據(jù)流優(yōu)化策略的獲取步驟具體為:
3.根據(jù)權利要求2所述的用于ai模型訓練的gpu集群數(shù)據(jù)共享方法,其特征在于,所述優(yōu)化的數(shù)據(jù)分布方案的獲取步驟具體為:
4.根據(jù)權利要求3所述的用于ai模型訓練的gpu集群數(shù)據(jù)共享方法,其特征在于,所述任務重分配結(jié)果的獲取步驟具體為:
5.根據(jù)權利要求4所述的用于ai模型訓練的gpu集群數(shù)據(jù)共享方法,其特征在于,所述梯度同步策略的獲取步驟具體為:
6.根據(jù)權利要求5所述的用于ai模型訓練的gpu集群數(shù)據(jù)共享方法,其特征在于,所述虛擬資源配置結(jié)果的獲取步驟具體為:
7.根據(jù)權利要求6所述的用于ai模型訓練的gpu集群數(shù)據(jù)共享方法,其特征在于,所述資源調(diào)度優(yōu)化方案的獲取步驟具體為:
8.根據(jù)權利要求7所述的用于ai模型訓練的gpu集群數(shù)據(jù)共享方法,其特征在于,所述訓練過程并行處理效能增強結(jié)果的獲取步驟具體為: