本發(fā)明屬于垃圾智能化識別的,具體地涉及一種垃圾分類識別方法、系統(tǒng)、電子設備及存儲介質(zhì)。
背景技術:
1、隨著人們的物質(zhì)生產(chǎn)和生活日益豐富,導致工業(yè)生產(chǎn)和日常生活中所產(chǎn)生的廢棄物也越來越多,其典型代表便是生活垃圾。早期,大多數(shù)垃圾分類采用人工分揀方式,這種方式缺點非常明顯,必須花費巨大的人力物力,同時效率也大大降低。隨著計算機視覺技術的發(fā)展,用機器代替眼睛對目標進行識別,計算機視覺技術應用于垃圾分類識別領域主要通過利用模式識別和圖像處理的方法,在圖像中通過滑動窗口獲得候選區(qū)域,再通過分類算法判斷是否是所需要的目標或者是根據(jù)目標物體的心態(tài)紋理等特征獲得候選區(qū)域等方法進行識別,這大大提高了工作效率,在一定程度上滿足了垃圾分類自動化的需求。
2、目前,基于計算機視覺技術的垃圾分類識別雖有效的改進了傳統(tǒng)人工分揀垃圾的工作模式。然而現(xiàn)有計算機視覺識別垃圾技術普通存在以下問題:1、針對多類別生活垃圾的公開數(shù)據(jù)集較為稀缺,且通過爬取拍攝系統(tǒng)獲取的數(shù)據(jù)誤差性較高,故此目前檢測模型并不適用于多類別生活垃圾的識別。2、目標檢測模型的模型結(jié)構(gòu)復雜,并且其識別精度及識別效率并不能兼得,若要確保識別精度,但識別效率較低,若要確保識別效率,但識別精度較差。
3、因此,如何改進現(xiàn)有檢測模型在多類別垃圾識別中存在的識別精度與識別效率不能兼顧,以及適用性差等弊端,是本領域技術人員亟待解決的課題。
技術實現(xiàn)思路
1、為了解決上述技術問題,本發(fā)明提供了一種垃圾分類識別方法、系統(tǒng)、電子設備及存儲介質(zhì)。
2、第一方面,該發(fā)明提供一種垃圾分類識別方法,包括:
3、采用爬蟲技術獲取不同類別生活垃圾的圖片集;
4、通過感知哈希算法對所述圖片集進行去重處理;
5、將去重處理的所述圖片集采用labelimg標注方法進行類別標簽處理得到樣本數(shù)據(jù)集;
6、通過平滑標簽方式對所述樣本數(shù)據(jù)集進行數(shù)據(jù)增強處理;
7、使用增強處理的所述樣本數(shù)據(jù)集,并通過最小化損失函數(shù)訓練檢測模型;引入k均值算法對檢測模型進行優(yōu)化處理;
8、將待識別的目標圖片輸入優(yōu)化后的所述檢測模型以實時識別所述目標圖片中的物體。
9、較佳地,所述采用爬蟲技術獲取不同類別生活垃圾的圖片集的步驟具體包括:
10、通過視覺圖像采集系統(tǒng)獲取每一拍攝點位的資源定位符,并將所述資源定位符傳入待抓取隊列中;
11、按照先進先出的順序依次讀取所述資源定位符;
12、采用dns解析方式對所述資源定位符進行解析得到網(wǎng)站的ip地址;
13、組合所述ip地址和網(wǎng)站相對路徑進行網(wǎng)頁下載得到不同類別生活垃圾的圖片集。
14、較佳地,所述通過感知哈希算法對所述圖片集進行去重處理的步驟具體包括:
15、將所述圖片集進行灰度處理;
16、將灰度處理后的所述圖片集的離散余弦變換值進行變換得到系數(shù)矩陣;
17、縮小所述離散余弦變換值直至呈現(xiàn)圖片的最低頻率以計算對應變化的哈希值;
18、根據(jù)所述系數(shù)矩陣,并基于所述哈希值的設定規(guī)則構(gòu)成所述圖片集對應的指紋;
19、根據(jù)所述指紋,并基于設置相應的去重參數(shù)對所述圖片集進行去重處理。
20、較佳地,所述通過平滑標簽方式對所述樣本數(shù)據(jù)集進行數(shù)據(jù)增強處理的步驟具體包括:
21、將所述樣本數(shù)據(jù)集對應的類別標簽轉(zhuǎn)化成one-hot-vector標簽;
22、基于平滑標簽的調(diào)整算法調(diào)整所述one-hot-vector標簽,其中所述調(diào)整算法為label=label×(1-smooth_factor)+smooth_factor×num_class;
23、根據(jù)調(diào)整后的所述one-hot-vector標簽增強處理所述樣本數(shù)據(jù)集。
24、較佳地,所述使用增強處理的所述樣本數(shù)據(jù)集,并通過最小化損失函數(shù)訓練檢測模型的步驟具體包括:
25、基于yolov5網(wǎng)絡結(jié)構(gòu)構(gòu)建檢測模型,所述檢測模型包括依次連接的backbone模塊、neck模塊、head模塊和串口通信模塊;
26、將增強處理的所述樣本數(shù)據(jù)集通過損失函數(shù)方法訓練所述檢測模型,其中所述損失函數(shù)方法具體為二元交叉熵及完整交叉并集。
27、較佳地,所述serial模塊從所述檢測模型的輸出層獲取所述head模塊得出的識別信息,并將所述識別信息編碼為一個10進制的數(shù)據(jù)幀,轉(zhuǎn)換為16進制后向串口輸出。
28、較佳地,所述k均值算法具體為:從樣本集中隨機選取若干樣本作為簇中心,并計算所有樣本與若干簇中心的距離,將每個樣本劃分到與其距離最近的簇中心所在的簇中,以新的簇計算新的簇中心。
29、第二方面,一種垃圾分類識別系統(tǒng),包括:
30、獲取模塊,用于采用爬蟲技術獲取不同類別生活垃圾的圖片集;
31、去重模塊,用于通過感知哈希算法對所述圖片集進行去重處理;
32、標注模塊,用于將去重處理的所述圖片集采用labelimg標注方法進行類別標簽處理得到樣本數(shù)據(jù)集;
33、增強模塊,用于通過平滑標簽方式對所述樣本數(shù)據(jù)集進行數(shù)據(jù)增強處理;
34、訓練模塊,用于使用增強處理的所述樣本數(shù)據(jù)集,并通過最小化損失函數(shù)訓練檢測模型;
35、優(yōu)化模塊,用于引入k均值算法對檢測模型進行優(yōu)化處理;
36、識別模塊,用于將待識別的目標圖片輸入優(yōu)化后的所述檢測模型以實時識別所述目標圖片中的物體。
37、較佳地,所述獲取模塊具體包括:
38、采集單元,用于通過視覺圖像采集系統(tǒng)獲取每一拍攝點位的資源定位符,并將所述資源定位符傳入待抓取隊列中;
39、讀取單元,用于按照先進先出的順序依次讀取所述資源定位符;
40、解析單元,用于采用dns解析方式對所述資源定位符進行解析得到網(wǎng)站的ip地址;
41、組合單元,用于組合所述ip地址和網(wǎng)站相對路徑進行網(wǎng)頁下載得到不同類別生活垃圾的圖片集。
42、較佳地,所述去重模塊具體包括:
43、灰度單元,用于將所述圖片集進行灰度處理;
44、變換單元,用于將灰度處理后的所述圖片集的離散余弦變換值進行變換得到系數(shù)矩陣;
45、計算單元,用于縮小所述離散余弦變換值直至呈現(xiàn)圖片的最低頻率以計算對應變化的哈希值;
46、構(gòu)成單元,用于根據(jù)所述系數(shù)矩陣,并基于所述哈希值的設定規(guī)則構(gòu)成所述圖片集對應的指紋;
47、去重單元,用于根據(jù)所述指紋,并基于設置相應的去重參數(shù)對所述圖片集進行去重處理。
48、較佳地,所述增強模塊具體包括:
49、轉(zhuǎn)化單元,用于將所述樣本數(shù)據(jù)集對應的類別標簽轉(zhuǎn)化成one-hot-vector標簽;
50、調(diào)整單元,用于基于平滑標簽的調(diào)整算法調(diào)整所述one-hot-vector標簽,其中所述調(diào)整算法為label=label×(1-smooth_factor)+smooth_factor×num_class;
51、增強單元,用于根據(jù)調(diào)整后的所述one-hot-vector標簽增強處理所述樣本數(shù)據(jù)集。
52、較佳地,所述訓練模塊具體包括:
53、構(gòu)建單元,用于基于yolov5網(wǎng)絡結(jié)構(gòu)構(gòu)建檢測模型,所述檢測模型包括依次連接的backbone模塊、neck模塊、head模塊和串口通信模塊;
54、訓練單元,用于將增強處理的所述樣本數(shù)據(jù)集通過損失函數(shù)方法訓練所述檢測模型,其中所述損失函數(shù)方法具體為二元交叉熵及完整交叉并集。
55、較佳地,所述serial模塊從所述檢測模型的輸出層獲取所述head模塊得出的識別信息,并將所述識別信息編碼為一個10進制的數(shù)據(jù)幀,轉(zhuǎn)換為16進制后向串口輸出。
56、較佳地,所述k均值算法具體為:從樣本集中隨機選取若干樣本作為簇中心,并計算所有樣本與若干簇中心的距離,將每個樣本劃分到與其距離最近的簇中心所在的簇中,以新的簇計算新的簇中心。
57、第三方面,本技術提供了一種電子設備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如第一方面所述的垃圾分類識別方法。
58、第四方面,本技術提供了一種存儲介質(zhì),其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)如第一方面所述的垃圾分類識別方法。
59、相比現(xiàn)有技術,本發(fā)明的有益效果為:
60、1、采用爬蟲技術在拍攝系統(tǒng)的網(wǎng)頁后臺獲取數(shù)據(jù)集,能夠節(jié)約大量的時間,并且自動的獲取數(shù)據(jù)還能避免人工誤差,獲得更加有效的數(shù)據(jù)。
61、2、利用感知哈希算法提取垃圾數(shù)據(jù)集的特征,并采用離散余弦變換變化的信號處理方法,消除垃圾圖像中感知冗余量,更準確的捕獲數(shù)據(jù)的感知特征參數(shù),保證感知哈希算法的有效性。
62、3、針對多分類生活垃圾,將類別標簽轉(zhuǎn)化為one-hot-vector標簽,并利用標簽平滑調(diào)整one-hot-vector標簽,可以使得檢測模型的預測結(jié)果不斷趨向于真實,提升了檢測模型的魯棒性。
63、4、使用yolov5網(wǎng)絡結(jié)構(gòu)構(gòu)建檢測模型,并通過最小損失函數(shù)訓練,可有效解決了垃圾數(shù)據(jù)集較少的問題,并具有良好的準確度及效率。
64、5、通過k均值算法優(yōu)化檢測模型,可以進一步提高圖片的識別準確度。