本公開涉及圖像處理,更具體地涉及一種基于局部線性嵌入的圖像數據的增廣方法及裝置。
背景技術:
1、在機器學習中,年齡估計、溫度預測、深度估計等任務受到越來越多的關注。深度回歸的標簽具有連續(xù)性,部分訓練樣本的標簽間存在模糊的信息,且大部分深度回歸任務的訓練數據都具有不平衡的性質。
2、相關技術中,針對深度回歸任務面臨的訓練數據不平衡問題,先將連續(xù)的標簽離散化,并在離散標簽的基礎上進行對應區(qū)間樣本的生成,導致標簽的連續(xù)性被破壞,且生成的樣本也不具有連續(xù)性,難以輔助模型對標簽間存在模糊信息的區(qū)間進行學習。
技術實現思路
1、鑒于上述問題,本公開提供了一種基于局部線性嵌入的圖像數據的增廣方法及裝置。
2、根據本公開的第一個方面,提供了一種基于局部線性嵌入的圖像數據的增廣方法,包括:對初始訓練集的初始圖像樣本進行增廣處理,得到中間訓練集,其中,中間訓練集包括多個圖像樣本,圖像樣本包括初始圖像樣本和經增廣得到的噪聲圖像樣本,每個圖像樣本具有對應的初始標簽;針對中間訓練集的第i個圖像樣本,根據第i個圖像樣本的初始標簽,確定與第i個圖像樣本對應的?近鄰圖像樣本集合,i≥0;根據第i個圖像樣本對應的近鄰圖像樣本集合,對第i個圖像樣本進行局部線性嵌入處理,得到與第i個圖像樣本對應的目標線性組合系數,其中,第i個圖像樣本對應的目標線性組合系數是第i個圖像樣本被與第i個圖像樣本對應的近鄰圖像樣本集合線性重構的系數;利用第i個圖像樣本對應的目標線性組合系數對第i個圖像樣本的初始標簽進行局部線性嵌入處理,得到第i個圖像樣本的目標標簽;根據每個圖像樣本各自對應的目標標簽更新中間訓練集,得到目標訓練集。
3、根據本公開的實施例,對初始訓練集的初始圖像樣本進行增廣處理,得到中間訓練集,包括:根據初始圖像樣本的初始標簽,對初始訓練集進行區(qū)域劃分,得到多個子區(qū)域;在多個子區(qū)域中,將不滿足預設區(qū)域閾值的子區(qū)域作為目標子區(qū)域;對目標子區(qū)域的初始圖像樣本添加高斯噪聲,得到噪聲圖像樣本;根據初始圖像樣本和噪聲圖像樣本,生成中間訓練集。
4、根據本公開的實施例,根據初始圖像樣本的初始標簽,對初始訓練集進行區(qū)域劃分,得到多個子區(qū)域,包括:根據初始標簽的類型,確定與初始標簽對應的劃分長度;根據劃分長度對初始訓練集進行劃分,得到多個子區(qū)域。
5、根據本公開的實施例,針對中間訓練集的第i個圖像樣本,根據第i個圖像樣本的初始標簽,確定與第i個圖像樣本對應的?近鄰圖像樣本集合,包括:根據第i個圖像樣本的初始標簽,確定第i個圖像樣本的鄰近區(qū)間;將第i個圖像樣本的樣本特征分別與第i個圖像樣本的鄰近區(qū)間內的n個初始近鄰圖像樣本的樣本特征進行距離值計算,得到n個距離值,n≥0;根據預設選取范圍,在n個距離值中確認m個目標距離值,0≤m≤n;將m個目標距離值對應的m個初始近鄰圖像樣本作為與第i個圖像樣本對應的近鄰圖像樣本集合。
6、根據本公開的實施例,根據第i個圖像樣本對應的近鄰圖像樣本集合,對第i個圖像樣本進行局部線性嵌入處理,得到與第i個圖像樣本對應的目標線性組合系數,包括:構建第i個圖像樣本的樣本特征和第i個圖像樣本對應的近鄰圖像樣本集合的m個初始近鄰圖像樣本的樣本特征之間的線性關系;根據線性關系,確定與第i個圖像樣本對應的目標線性組合系數。
7、根據本公開的實施例,利用第i個圖像樣本對應的目標線性組合系數對第i個圖像樣本的初始標簽進行局部線性嵌入處理,得到第i個圖像樣本的目標標簽,包括:對m個近鄰圖像樣本的初始標簽分別進行格式轉換,得到m個近鄰圖像樣本各自對應的中間標簽,其中,中間標簽為向量形式;根據預設關系,對第i個圖像樣本對應的目標線性組合系數和m個近鄰圖像樣本的中間標簽進行嵌入處理,得到第i個圖像樣本的目標標簽。
8、根據本公開的實施例,上述方法還包括:對初始圖像樣本和噪聲圖像樣本進行歸一化處理,得到處理后的初始圖像樣本和處理后的噪聲圖像樣本;根據初始圖像樣本和噪聲圖像樣本,生成中間訓練集包括:根據處理后的初始圖像樣本和處理后的噪聲圖像樣本,生成中間訓練集。
9、根據本公開的實施例,根據每個圖像樣本各自對應的目標標簽更新中間訓練集,得到目標訓練集,包括:根據第i個圖像樣本的目標標簽,更新第i個圖像樣本的初始標簽,得到更新后的第i個圖像樣本;根據更新后的第i個圖像樣本,確定更新訓練集;將中間訓練集的圖像樣本并入至更新訓練集,得到目標訓練集。
10、本公開的第二方面提供了一種圖像回歸模型的訓練方法,包括:利用上述目標訓練集對圖像回歸模型進行訓練,得到訓練后的圖像回歸模型。
11、本公開的第三方面提供了一種基于局部線性嵌入的圖像數據的增廣裝置,包括:增廣模塊,用于對初始訓練集的初始圖像樣本進行增廣處理,得到中間訓練集,其中,中間訓練集包括多個圖像樣本,圖像樣本包括初始圖像樣本和經增廣得到的噪聲圖像樣本,每個圖像樣本具有對應的初始標簽;第一確定模塊,用于針對中間訓練集的第i個圖像樣本,根據第i個圖像樣本的初始標簽,確定與第i個圖像樣本對應的近鄰圖像樣本集合,i≥0;第一處理模塊,用于根據第i個圖像樣本對應的?近鄰圖像樣本集合,對第i個圖像樣本進行局部線性嵌入處理,得到與第i個圖像樣本對應的目標線性?組合系數,其中,第i個圖像樣本對應的目標線性組合系數是第i個圖像樣本被與第i個圖像樣本對應的近鄰圖像樣本集合線性重構的系數;第二處理模塊,用于利用第i個圖像樣本對應的目標線性組合系數對第i個圖像樣本的初始標簽進行局部線性嵌入處理,得到第i個圖像樣本的目標標簽;以及更新模塊,用于根據每個圖像樣本各自對應的目標標簽更新中間訓練集,得到目標訓練集。
12、本公開的第四方面提供了一種電子設備,包括:一個或多個處理器;存儲器,用于存儲一個或多個計算機程序,其中,上述一個或多個處理器執(zhí)行上述一個或多個計算機程序以實現上述方法的步驟。
13、本公開的第五方面還提供了一種計算機可讀存儲介質,其上存儲有計算機程序或指令,上述計算機程序或指令被處理器執(zhí)行時實現上述方法的步驟。
14、本公開的第六方面還提供了一種計算機程序產品,包括計算機程序或指令,上述計算機程序或指令被處理器執(zhí)行時實現上述方法的步驟。
15、根據本公開的實施例,針對中間訓練集的第i個圖像樣本,根據第i個圖像樣本的初始標簽,確定與第i個圖像樣本對應的近鄰圖像樣本集合;根據與第i個圖像樣本對應的近鄰圖像樣本集合,對第i個圖像樣本進行局部線性嵌入處理,得到與第i個圖像樣本對應的目標線性組合系數;利用目標線性組合系數對初始標簽進行局部線性嵌入處理,得到第i個圖像樣本的目標標簽。由于根據第i個近鄰圖像樣本集合,對第i個圖像樣本進行局部線性嵌入處理,并基于得到的目標線性組合系數對第i個樣本的初始標簽進行局部線性嵌入處理,避免了在離散標簽的基礎上生成的標簽的連續(xù)性被破壞的問題,實現了在對圖像樣本進行增廣的同時,保留深度回歸中標簽連續(xù)性,有助于增強模型對于模糊標簽區(qū)間的樣本的預測能力。