本發(fā)明涉及計算機,具體涉及一種數(shù)據(jù)處理方法、裝置、電子設備和計算機可讀存儲介質。
背景技術:
1、在電池大數(shù)據(jù)聚合分析和模型搭建時,強依賴“電池系統(tǒng)類型”唯一標識信息。在電池系統(tǒng)類型打標過程中,往往采用電池全生命周期均不變的靜態(tài)信息進行聚類,以根據(jù)聚類結果中的類別進行打標。
2、但是,現(xiàn)有的聚類方法中,由于聚類使用的靜態(tài)信息需要強依賴新能源汽車、兩輪車、樁或儲能傳輸至云平臺的靜態(tài)信息質量,在聚合使用時,會存在因個別信息的問題導致錯誤分類、過多分類、少分類等結果,且對于“新增類型低質量電池信息”和“新增新型電池信息”在歸入指定類別和新增分類時存在困難,因此如何搭建一套高泛化性、通用性和適用新增分類的方法,對解決以上問題有重要的價值和意義。
技術實現(xiàn)思路
1、有鑒于此,本發(fā)明實施例的目的在于提供一種數(shù)據(jù)處理方法、裝置、電子設備和計算機可讀存儲介質,以提高標簽確定的準確性和泛化性。
2、第一方面,本發(fā)明實施例旨在提供一種數(shù)據(jù)處理方法,所述方法包括:
3、獲取電池流數(shù)據(jù),所述電池流數(shù)據(jù)包括多個電池數(shù)據(jù)組;
4、將各所述電池數(shù)據(jù)組分別輸入預先訓練的分類模型中進行分類,確定所述電池數(shù)據(jù)組的類別標簽,所述類別標簽為已有標簽或新標簽;
5、根據(jù)所述新標簽對應的所述電池數(shù)據(jù)組生成增量數(shù)據(jù)集;
6、將所述增量數(shù)據(jù)集輸入預先訓練的聚類模型中進行聚類,確定增量聚類結果,所述增量聚類結果包括至少一個聚類新簇,各所述聚類新簇具有對應的簇中心點和新增類別標簽;
7、根據(jù)增量聚類結果對所述分類模型進行增量學習訓練,以基于訓練后的分類模型確定類別標簽。
8、第二方面,本發(fā)明實施例旨在提供一種數(shù)據(jù)處理裝置,所述裝置包括:
9、獲取單元,用于獲取電池流數(shù)據(jù),所述電池流數(shù)據(jù)包括多個電池數(shù)據(jù)組;
10、分類單元,用于將各所述電池數(shù)據(jù)組分別輸入預先訓練的分類模型中進行分類,確定所述電池數(shù)據(jù)組的類別標簽,所述類別標簽為已有標簽或新標簽;以及根據(jù)所述新標簽對應的所述電池數(shù)據(jù)組生成增量數(shù)據(jù)集;
11、聚類單元,用于將所述增量數(shù)據(jù)集輸入預先訓練的聚類模型中進行聚類,確定增量聚類結果,所述增量聚類結果包括至少一個新簇,各所述新簇具有對應的簇中心點和第二類別標簽;
12、訓練單元,用于根據(jù)增量聚類結果對所述分類模型進行增量學習訓練,以基于訓練后的分類模型確定類別標簽。
13、第三方面,本發(fā)明實施例旨在提供一種計算機程序產品,所述計算機程序產品包括計算機程序/指令,所述計算機程序/指令被處理器執(zhí)行時實現(xiàn)如上任一項所述的方法。
14、第四方面,本發(fā)明實施例旨在提供一種電子設備,包括存儲器和處理器,所述存儲器用于存儲一條或多條計算機程序指令,其中,所述一條或多條計算機程序指令被所述處理器執(zhí)行以實現(xiàn)如上任一項所述的方法。
15、第五方面,本發(fā)明實施例旨在提供一種計算機可讀存儲介質,所述計算機可讀存儲介質內存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上任一項所述的方法。
16、本發(fā)明實施例的技術方案通過將電池流數(shù)據(jù)中的各電池數(shù)據(jù)組分別輸入預先訓練的分類模型中進行分類,確定電池數(shù)據(jù)組的類別標簽,根據(jù)新標簽對應的電池數(shù)據(jù)組生成增量數(shù)據(jù)集,并將增量數(shù)據(jù)集中的電池數(shù)據(jù)組輸入預先訓練的聚類模型中進行聚類,確定增量聚類結果;根據(jù)增量聚類結果對分類模型進行增量學習訓練,以基于訓練后的分類模型確定類別標簽,不僅能夠確定新增類別下的電池數(shù)據(jù)組的類別標簽,提高標簽確定的準確性,還能使得電池分類信息能夠基于新增電池數(shù)據(jù)組進行擴展,提高標簽確定的泛化性。
1.一種數(shù)據(jù)處理方法,其特征在于,所述方法包括:
2.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)增量聚類結果對所述分類模型進行增量學習訓練包括:
3.根據(jù)權利要求2所述的方法,其特征在于,所述分類模型包括輸入層、隱藏層和輸出層,所述根據(jù)各所述聚類新簇的簇中心點調整所述分類模型的結構包括:
4.根據(jù)權利要求2所述的方法,其特征在于,所述根據(jù)新類別數(shù)據(jù)信息對調整后的分類模型進行迭代訓練包括:
5.根據(jù)權利要求1所述的方法,其特征在于,所述聚類模型基于以下方法確定:
6.根據(jù)權利要求5所述的方法,其特征在于,所述分類模型基于以下方法確定:
7.根據(jù)權利要求1所述的方法,其特征在于,所述將各所述電池數(shù)據(jù)組分別輸入預先訓練的分類模型中進行分類,確定所述電池數(shù)據(jù)組的類別標簽包括:
8.根據(jù)權利要求1所述的方法,其特征在于,所述獲取電池流數(shù)據(jù)包括:
9.根據(jù)權利要求1所述的方法,其特征在于,所述電池數(shù)據(jù)組包括電池材料類型、電池額定容量、電池額定總電壓、電池最大使用溫度、電池單體上限電壓、系統(tǒng)最大總電壓、電池標稱總能量。
10.根據(jù)權利要求1所述的方法,其特征在于,所述聚類模型采用dbscan模型,所述分類模型采用徑向基神經網絡rbfnn模型。
11.一種數(shù)據(jù)處理裝置,其特征在于,所述裝置包括:
12.一種計算機程序產品,其特征在于,所述計算機程序產品包括計算機程序/指令,所述計算機程序/指令被處理器執(zhí)行時實現(xiàn)權利要求1-10中任一項所述的方法。
13.一種電子設備,包括存儲器和處理器,其特征在于,所述存儲器用于存儲一條或多條計算機程序指令,其中,所述一條或多條計算機程序指令被所述處理器執(zhí)行以實現(xiàn)權利要求1-10中任一項所述的方法。
14.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質內存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1-10中任一項所述的方法。