本技術(shù)涉及人工智能領(lǐng)域,尤其涉及一種基于拉曼光譜的模型訓(xùn)練方法及識別方法、裝置、介質(zhì)。
背景技術(shù):
1、拉曼光譜是一種分子指紋振動光譜,根據(jù)拉曼光譜可以對化學(xué)、材料和生物樣本等進(jìn)行快速、無損以及無標(biāo)記的檢測,這使得拉曼光譜在分析領(lǐng)域具有應(yīng)用潛力,例如,通過拉曼光譜識別化學(xué)品進(jìn)行無損鑒定、通過拉曼光譜成像鑒定材料中成分的空間分布、利用拉曼光譜進(jìn)行細(xì)菌種屬和亞型識別、以及利用人體體液或組織鑒別疾病類型和狀態(tài)等。
2、相關(guān)技術(shù)中,將拉曼光譜與深度學(xué)習(xí)算法結(jié)合,建立基于拉曼光譜的特征提取模型用于分類任務(wù),采用的訓(xùn)練樣本多為單一待測物的拉曼光譜數(shù)據(jù),光譜背景單一,識別任務(wù)難度低。實(shí)際應(yīng)用中,待測樣本常常成分復(fù)雜且需要多分類,這種類型的任務(wù)對模型的特征提取能力有較高的要求。
3、為了提高分類任務(wù)的準(zhǔn)確率,通常采用數(shù)據(jù)增強(qiáng)的方式,例如,人工擴(kuò)充訓(xùn)練集,或是通過生成對抗神經(jīng)網(wǎng)絡(luò)對原訓(xùn)練樣本添加噪聲和/或基線波動,但數(shù)據(jù)增強(qiáng)的方式只是在訓(xùn)練樣本的拉曼光譜上疊加噪聲和基線波動,并未改變基本譜峰形狀,雖然能夠一定程度上提升特征提取模型的泛化能力,但是當(dāng)實(shí)際應(yīng)用中的待測樣本的拉曼光譜數(shù)據(jù)與訓(xùn)練樣本的拉曼光譜數(shù)據(jù)差異過大,或是待測樣本的拉曼光譜數(shù)據(jù)中存在干擾數(shù)據(jù)時,特征提取模型面對這些較為復(fù)雜的拉曼光譜數(shù)據(jù),不能提取出有效的隱式特征,可以看出,相關(guān)技術(shù)中基于拉曼光譜的特征提取模型的魯棒性較差。
技術(shù)實(shí)現(xiàn)思路
1、為解決相關(guān)技術(shù)問題,本技術(shù)實(shí)施例提供一種基于拉曼光譜的模型訓(xùn)練方法及識別方法、裝置、介質(zhì)。
2、本技術(shù)實(shí)施例的技術(shù)方案是這樣實(shí)現(xiàn)的:
3、本技術(shù)實(shí)施例提供了一種基于拉曼光譜的模型訓(xùn)練方法,所述方法包括:
4、調(diào)用第一模型分別對多個訓(xùn)練樣本進(jìn)行處理,得到每個訓(xùn)練樣本的第一特征;所述訓(xùn)練樣本表征為拉曼光譜數(shù)據(jù),所述第一特征表征拉曼光譜數(shù)據(jù)的隱式特征;
5、調(diào)用第二模型分別對多個第一特征集進(jìn)行處理,得到每個第一特征集的第二特征;所述每個第一特征集包括選取自所述多個訓(xùn)練樣本的第一特征中的至少兩個第一特征;所述第二模型包括一個或多個用于進(jìn)行邏輯運(yùn)算的子網(wǎng)絡(luò);所述第二模型用于通過第一損失值與第二損失值約束所述第一模型;所述第一損失值表征拉曼光譜數(shù)據(jù)的隱式特征的損失值;所述第二損失值表征拉曼光譜數(shù)據(jù)的分類結(jié)果的損失值;
6、計算所述第一損失值及計算所述第二損失值;
7、基于計算出的所述第一損失值以及所述第二損失值,更新所述第一模型以及所述第二模型。
8、上述方案中,所述一個或多個用于進(jìn)行邏輯運(yùn)算的子網(wǎng)絡(luò)包括:第一子網(wǎng)絡(luò)和/或第二子網(wǎng)絡(luò)和/或第三子網(wǎng)絡(luò);其中,
9、所述第一子網(wǎng)絡(luò)用于對第一特征集中的至少兩個第一特征進(jìn)行交集運(yùn)算,所述第二子網(wǎng)絡(luò)用于對第一特征集中的至少兩個第一特征進(jìn)行并集運(yùn)算,所述第三子網(wǎng)絡(luò)用于對第一特征集中的至少兩個第一特征進(jìn)行減集運(yùn)算。
10、上述方案中,所述調(diào)用第二模型對多個第一特征集進(jìn)行處理,得到每個第一特征集的第二特征,包括:
11、調(diào)用所述第二模型的每個子網(wǎng)絡(luò),對每個第一特征集進(jìn)行處理,得到每個第一特征集的一個或多個第二特征;所述第一特征集的每個第二特征分別與所述第二模型的一個子網(wǎng)絡(luò)對應(yīng)。
12、上述方案中,所述計算所述第一損失值,包括:
13、調(diào)用所述第二模型的每個子網(wǎng)絡(luò)對應(yīng)的第一損失函數(shù),對所述多個訓(xùn)練樣本的第一特征以及所述多個第一特征集的第二特征進(jìn)行計算,得到每個子網(wǎng)絡(luò)對應(yīng)的第三損失值;
14、對計算得到的所有第三損失值進(jìn)行設(shè)定運(yùn)算,得到所述第一損失值。
15、上述方案中,所述計算所述第二損失值,包括:
16、調(diào)用第二損失函數(shù),對所述多個訓(xùn)練樣本中每個訓(xùn)練樣本的第一標(biāo)簽以及第一分類結(jié)果進(jìn)行計算,得到第四損失值;其中,第一標(biāo)簽表征對應(yīng)的訓(xùn)練樣本的類別;所述第一分類結(jié)果表征調(diào)用第三模型對對應(yīng)的訓(xùn)練樣本的第一特征進(jìn)行分類處理得到的分類結(jié)果;
17、調(diào)用第二損失函數(shù),對所述多個第一特征集中每個第一特征集的第二標(biāo)簽以及第二分類結(jié)果進(jìn)行計算,得到第五損失值;其中,第二標(biāo)簽表征所述第二模型的每個子網(wǎng)絡(luò)的目標(biāo)運(yùn)算邏輯對對應(yīng)的第一特征集對應(yīng)的至少兩個訓(xùn)練樣本的第一標(biāo)簽的邏輯運(yùn)算結(jié)果;所述第二分類結(jié)果表征調(diào)用第三模型對對應(yīng)的第一特征集的第二特征進(jìn)行分類處理得到的分類結(jié)果;
18、對所述第四損失值與所述第五損失值進(jìn)行求和計算,得到所述第二損失值。
19、上述方案中,所述基于計算出的所述第一損失值以及所述第二損失值,更新所述第一模型以及所述第二模型,包括:
20、對所述第一損失值與所述第二損失值進(jìn)行求和計算,得到第六損失值;
21、調(diào)用第六損失值對所述第二模型進(jìn)行反向傳播處理,以更新所述第二模型,并將所述第六損失值傳播至所述第一模型;
22、調(diào)用第六損失值對所述第一模型進(jìn)行反向傳播處理,以更新所述第一模型。
23、本技術(shù)實(shí)施例還提供了一種基于拉曼光譜的識別方法,該方法包括:
24、調(diào)用第四模型對待識別樣本的拉曼光譜數(shù)據(jù)進(jìn)行處理,得到第五特征;所述第五特征表征所述待識別樣本的拉曼光譜數(shù)據(jù)的隱式特征;
25、調(diào)用第五模型對所述第五特征進(jìn)行分類處理,得到第三分類結(jié)果,所述第三分類結(jié)果表征所述待識別樣本的拉曼光譜數(shù)據(jù)的類別;
26、其中,所述第四模型表征基于上述任一基于拉曼光譜的模型訓(xùn)練方法訓(xùn)練完成的第一模型。
27、本技術(shù)實(shí)施例還提供了一種基于拉曼光譜的模型訓(xùn)練裝置,包括:
28、第一調(diào)用單元,用于調(diào)用第一模型分別對多個訓(xùn)練樣本進(jìn)行處理,得到每個訓(xùn)練樣本的第一特征;所述訓(xùn)練樣本表征為拉曼光譜數(shù)據(jù),所述第一特征表征拉曼光譜數(shù)據(jù)的隱式特征;
29、第二調(diào)用單元,用于調(diào)用第二模型分別對多個第一特征集進(jìn)行處理,得到每個第一特征集的第二特征;所述每個第一特征集包括選取自所述多個訓(xùn)練樣本的第一特征中的至少兩個第一特征;所述第二模型包括一個或多個用于進(jìn)行邏輯運(yùn)算的子網(wǎng)絡(luò);所述第二模型用于通過第一損失值與第二損失值約束所述第一模型;所述第一損失值表征拉曼光譜數(shù)據(jù)的隱式特征的損失值;所述第二損失值表征拉曼光譜數(shù)據(jù)的分類結(jié)果的損失值;
30、計算單元,用于計算所述第一損失值及計算所述第二損失值;
31、更新單元,用于基于計算出的所述第一損失值以及所述第二損失值,更新所述第一模型以及所述第二模型。
32、本技術(shù)實(shí)施例還提供了一種基于拉曼光譜的識別裝置,包括:
33、第三調(diào)用單元,用于調(diào)用第四模型對待識別樣本的拉曼光譜數(shù)據(jù)進(jìn)行處理,得到第五特征;所述第五特征表征所述待識別樣本的拉曼光譜數(shù)據(jù)的隱式特征;
34、分類單元,用于調(diào)用第五模型對所述第五特征進(jìn)行分類處理,得到第三分類結(jié)果,所述第三分類結(jié)果表征所述待識別樣本的拉曼光譜數(shù)據(jù)的類別;
35、其中,所述第四模型表征基于上述任一基于拉曼光譜的模型訓(xùn)練方法訓(xùn)練完成的第一模型。
36、本技術(shù)實(shí)施例還提供了一種電子設(shè)備,包括:第一處理器和用于存儲能夠在處理器上運(yùn)行的計算機(jī)程序的第一存儲器,
37、其中,所述第一處理器用于運(yùn)行所述計算機(jī)程序時,執(zhí)行上述任一方法的步驟。
38、本技術(shù)實(shí)施例還提供了一種存儲介質(zhì),其上存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)上述任一方法的步驟。
39、本技術(shù)實(shí)施例還提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,所述計算機(jī)程序在被處理器執(zhí)行時實(shí)現(xiàn)上述任一方法的步驟。
40、本技術(shù)實(shí)施例中,調(diào)用第一模型對多個訓(xùn)練樣本進(jìn)行處理,得到每個訓(xùn)練樣本的第一特征,該第一特征表征拉曼光譜數(shù)據(jù)的隱式特征;然后,調(diào)用第二模型對多個第一特征集進(jìn)行處理,得到每個第一特征集的第二特征,這里,每個第一特征集包括選取自多個訓(xùn)練樣本的第一特征中的至少兩個第一特征,第二模型包括一個或多個用于進(jìn)行邏輯運(yùn)算的子網(wǎng)絡(luò),第二模型用于通過第一損失值與第二損失值約束第一模型,第一損失值表征拉曼光譜數(shù)據(jù)的隱式特征的損失值,第二損失值表征拉曼光譜數(shù)據(jù)的分類結(jié)果的損失值;然后,計算第一損失值及計算第二損失值;再基于計算出的第一損失值以及第二損失值,更新第一模型以及第二模型。如此,第二模型通過第一損失值與第二損失值實(shí)現(xiàn)在訓(xùn)練過程中對第一模型更新的約束,從而增強(qiáng)了訓(xùn)練完成后的第一模型對拉曼光譜數(shù)據(jù)的隱式特征提取能力,相比于相關(guān)技術(shù),訓(xùn)練完成后的第一模型面對復(fù)雜的拉曼光譜數(shù)據(jù),能夠提取出有效的隱式特征,具有較優(yōu)的魯棒性,從而增加了基于拉曼光譜數(shù)據(jù)對待測樣本進(jìn)行識別的準(zhǔn)確性。