本申請涉及語義分割,特別是涉及一種語義分割方法、語義分割裝置、語義分割設(shè)備以及計算機存儲介質(zhì)。
背景技術(shù):
1、隨著航空航天技術(shù)的不斷發(fā)展,高分遙感衛(wèi)星觀測能力不斷提升,如何高效地利用這些數(shù)據(jù)指導(dǎo)工農(nóng)業(yè)生產(chǎn)成為了一個重要難題。遙感影像的語義分割是其中一個重要任務(wù),遙感語義分割指的是將遙感影像劃分為林地、草地、建筑用地、水域等不同地物。在全球數(shù)字化、智能化的背景下,開展遙感影像語義分割算法的研究具有非常重要的研究意義以及應(yīng)用價值。
2、傳統(tǒng)的遙感語義分割技術(shù)依靠貝葉斯分類、聚類等技術(shù),無法適應(yīng)多樣化的實際需求。深度學(xué)習(xí)技術(shù)的發(fā)展給遙感影像語義分割帶來了新的機遇,但深度學(xué)習(xí)的訓(xùn)練過程需要大量的標(biāo)注數(shù)據(jù),而獲取像素級的語義標(biāo)簽成本高昂。這給語義分割任務(wù)帶來了新的挑戰(zhàn)。半監(jiān)督學(xué)習(xí)利用少量有標(biāo)簽數(shù)據(jù)和大量無標(biāo)簽數(shù)據(jù)共同訓(xùn)練模型,可以有效解決這一問題。
3、然而,在利用無標(biāo)簽數(shù)據(jù)對語義分割網(wǎng)絡(luò)進行訓(xùn)練時,會產(chǎn)生大量的偽標(biāo)簽,而其中不合理的偽標(biāo)簽會導(dǎo)致語義分割網(wǎng)絡(luò)訓(xùn)練時產(chǎn)生誤差,影響模型整體的預(yù)測精度。
4、?
技術(shù)實現(xiàn)思路
1、為解決上述技術(shù)問題,本申請?zhí)岢隽艘环N語義分割方法、語義分割裝置、語義分割設(shè)備以及計算機存儲介質(zhì)。
2、為解決上述技術(shù)問題,本申請?zhí)岢隽艘环N語義分割方法,所述語義分割方法包括:
3、將無標(biāo)簽圖像輸入語義分割網(wǎng)絡(luò),獲取所述無標(biāo)簽圖像的預(yù)測結(jié)果圖,其中,所述預(yù)測結(jié)果圖包括若干偽標(biāo)簽區(qū)域;
4、將所述無標(biāo)簽圖像輸入分割一切模型,獲取所述無標(biāo)簽圖像的檢測結(jié)果圖;
5、確定每一偽標(biāo)簽區(qū)域在所述檢測結(jié)果圖對應(yīng)圖像區(qū)域的偽標(biāo)簽占比;
6、將所述偽標(biāo)簽占比小于預(yù)設(shè)閾值的偽標(biāo)簽區(qū)域從所述預(yù)測結(jié)果圖中刪除,得到篩選標(biāo)簽圖像;
7、其中,所述篩選標(biāo)簽圖像用于訓(xùn)練所述語義分割網(wǎng)絡(luò)。
8、其中,所述語義分割方法,還包括:
9、將所述偽標(biāo)簽占比大于預(yù)設(shè)閾值的偽標(biāo)簽區(qū)域按照所述檢測結(jié)果圖中的偽標(biāo)簽超出區(qū)域覆蓋所述預(yù)測結(jié)果圖中的噪聲區(qū)域。
10、其中,所述語義分割方法,還包括:
11、獲取原始圖像中的隨機區(qū)域;
12、將所述隨機區(qū)域填充指定類型的目標(biāo)圖像,生成用于訓(xùn)練所述語義分割網(wǎng)絡(luò)的有標(biāo)簽圖像或無標(biāo)簽圖像。
13、其中,所述將所述隨機區(qū)域填充指定類型的目標(biāo)圖像之前,所述語義分割方法還包括:
14、將所述指定類型對應(yīng)的提示詞輸入分割一切模型,生成所述目標(biāo)圖像。
15、其中,所述獲取所述無標(biāo)簽圖像的預(yù)測結(jié)果圖,包括:
16、通過所述語義分割網(wǎng)絡(luò)的轉(zhuǎn)換器模型提取所述無標(biāo)簽圖像的圖像特征和語義特征;
17、根據(jù)所述圖像特征和所述語義特征的融合特征,輸出所述無標(biāo)簽圖像的預(yù)測結(jié)果圖。
18、其中,所述轉(zhuǎn)換器模型包括編碼器,所述編碼器包括依次連接的多尺度線性注意力層、第一歸一化拼接層、第一前饋層以及第二歸一化拼接層;
19、其中,所述多尺度線性注意力層包括第二尺度注意力層和連接所述第二尺度注意力層的若干第一尺度注意力層,所述第一尺度注意力層用于提取所述無標(biāo)簽圖像劃分的每一圖像塊的自注意力特征,所述第二尺度注意力層將所有圖像塊的自注意力特征拼接,并提取所有圖像塊之前的互注意力特征。
20、其中,所述轉(zhuǎn)換器模型還包括解碼器,所述解碼器包括依次連接的第一多尺度線性注意力層、第三歸一化拼接層、第二多尺度線性注意力層、第四歸一化拼接層、第二前饋層以及第五歸一化拼接層;其中,所述編碼器的第二歸一化拼接層輸出的圖像特征接入到所述第二多尺度線性注意力層的輸入側(cè)。
21、為解決上述技術(shù)問題,本申請還提出一種語義分割裝置,所述語義分割裝置包括:語義分割模塊、分割一切模塊、區(qū)域確認(rèn)模塊以及標(biāo)簽篩選模塊;其中,
22、所述語義分割模塊,用于將無標(biāo)簽圖像輸入語義分割網(wǎng)絡(luò),獲取所述無標(biāo)簽圖像的預(yù)測結(jié)果圖,其中,所述預(yù)測結(jié)果圖包括若干偽標(biāo)簽區(qū)域;
23、所述分割一切模塊,用于將所述無標(biāo)簽圖像輸入分割一切模型,獲取所述無標(biāo)簽圖像的檢測結(jié)果圖;
24、所述區(qū)域確認(rèn)模塊,用于確定每一偽標(biāo)簽區(qū)域在所述檢測結(jié)果圖對應(yīng)圖像區(qū)域的偽標(biāo)簽占比;
25、所述標(biāo)簽篩選模塊,用于將所述偽標(biāo)簽占比小于預(yù)設(shè)閾值的偽標(biāo)簽區(qū)域從所述預(yù)測結(jié)果圖中刪除,得到篩選標(biāo)簽圖像;
26、其中,所述篩選標(biāo)簽圖像用于訓(xùn)練所述語義分割網(wǎng)絡(luò)。
27、為解決上述技術(shù)問題,本申請還提出一種語義分割設(shè)備,所述語義分割設(shè)備包括存儲器以及與所述存儲器耦接的處理器;其中,所述存儲器用于存儲程序數(shù)據(jù),所述處理器用于執(zhí)行所述程序數(shù)據(jù)以實現(xiàn)如上述的語義分割方法。
28、為解決上述技術(shù)問題,本申請還提出一種計算機存儲介質(zhì),所述計算機存儲介質(zhì)用于存儲程序數(shù)據(jù),所述程序數(shù)據(jù)在被計算機執(zhí)行時,用以實現(xiàn)上述的語義分割方法。
29、與現(xiàn)有技術(shù)相比,本申請的有益效果是:語義分割裝置將無標(biāo)簽圖像輸入語義分割網(wǎng)絡(luò),獲取所述無標(biāo)簽圖像的預(yù)測結(jié)果圖,其中,所述預(yù)測結(jié)果圖包括若干偽標(biāo)簽區(qū)域;將所述無標(biāo)簽圖像輸入分割一切模型,獲取所述無標(biāo)簽圖像的檢測結(jié)果圖;確定每一偽標(biāo)簽區(qū)域在所述檢測結(jié)果圖對應(yīng)圖像區(qū)域的偽標(biāo)簽占比;將所述偽標(biāo)簽占比小于預(yù)設(shè)閾值的偽標(biāo)簽區(qū)域從所述預(yù)測結(jié)果圖中刪除,得到篩選標(biāo)簽圖像;其中,所述篩選標(biāo)簽圖像用于訓(xùn)練所述語義分割網(wǎng)絡(luò)。通過上述語義分割方法,利用分割一切模型的檢測結(jié)果與偽標(biāo)簽之間的矛盾,過濾預(yù)測結(jié)果圖中不合理的區(qū)域,從而對偽標(biāo)簽進行過濾,可以有效增強偽標(biāo)簽的可信度,進而提高模型整體的預(yù)測精度。
1.一種語義分割方法,其特征在于,所述語義分割方法包括:
2.根據(jù)權(quán)利要求1所述的語義分割方法,其特征在于,
3.根據(jù)權(quán)利要求1所述的語義分割方法,其特征在于,
4.根據(jù)權(quán)利要求3所述的語義分割方法,其特征在于,
5.根據(jù)權(quán)利要求1所述的語義分割方法,其特征在于,
6.根據(jù)權(quán)利要求5所述的語義分割方法,其特征在于,
7.根據(jù)權(quán)利要求6所述的語義分割方法,其特征在于,
8.一種語義分割裝置,其特征在于,所述語義分割裝置包括:語義分割模塊、分割一切模塊、區(qū)域確認(rèn)模塊以及標(biāo)簽篩選模塊;其中,
9.一種語義分割設(shè)備,其特征在于,所述語義分割設(shè)備包括存儲器以及與所述存儲器耦接的處理器;
10.一種計算機存儲介質(zhì),其特征在于,所述計算機存儲介質(zhì)用于存儲程序數(shù)據(jù),所述程序數(shù)據(jù)在被計算機執(zhí)行時,用以實現(xiàn)如權(quán)利要求1至7任一項所述的語義分割方法。