1.一種基于結構指導深度學習的人體姿態(tài)估計方法,其特征在于,包括如下步驟:
步驟1:輸入數據預處理;
步驟2:結構指導卷積神經網絡預測;
步驟3:融合卷積神經網絡預測;
步驟4:輸出處理。
2.根據權利要求1所述的一種基于結構指導深度學習的人體姿態(tài)估計方法,其特征在于,所述步驟2進一步具體為:將預處理后的圖片通過結構指導的卷積神經網絡來進行學習和預測,這里結構指導指的是在一般的卷積神經網絡中融入人體骨架的結構信息,來指導神經網絡的學習,一般的人體姿態(tài)估計的神經網絡的回歸目標函數為:
表示一張由真實標記關節(jié)點為中心產生的真實標記的熱點圖,其分布為高斯分布yk代表第k真實標記的關節(jié)點,(xk,yk)是yk在圖像中坐標點的值,(i,j)是真實標記的熱點圖中的每個像素點在圖中的位置,σ1是高斯分布的標準差;結構指導的卷積神經網絡加入了骨架結構信息,這部分的目標函數為:
表示由兩個相鄰的真實標記關節(jié)點的連線為中心產生的高斯分布的真實標記熱點圖,pl表示相鄰關節(jié)點之間的連線,l是這些連線相應的序號,這些連線對應于不同的人體模型,可以采用樹形結構的人體模型,相應的連線即位樹形結構人體模型的邊;dist((i,j),pl)表示真實標記的熱點圖中的每個點(i,j)到pl的距離,σ2是該高斯分布的標準差,用l1表示關節(jié)點對應的熱點圖的損失函數,用l2表示關節(jié)點連線對應的熱點圖的損失函數:
其中,X是輸入圖像,y是真實標記的關節(jié)點,p是相鄰真實標記的關節(jié)點的連線,D是整個訓練數據集,(i,j)表示熱點圖中的每個像素點的坐標,k和l分別表示y的序號和p的序號,Hi,j,k(X,w)表示神經網絡預測輸出的相應的第k關節(jié)點的熱點圖,Pi,j,l(X,w)表示神經網絡預測輸出的相應的第1關節(jié)點連線的熱點圖,w表示卷積神經網絡的參數,結構指導卷積神經網絡的總的損失函數loss1為:
loss1=l1+l2。
3.根據權利要求1所述的一種基于結構指導深度學習的人體姿態(tài)估計方法,其特征在于,所述步驟3進一步具體為:將結構指導卷積神經網絡的低層級特征層和高層次特征層進行融合,送入另外一支卷積神 經網絡中進行學習和預測,低層次特征層包含更多的圖像細節(jié),高層次特征層則提供預測的初步結果;結構指導神經網絡引入了人體結構約束信息,提供給融合卷積神經網絡一個初步結果,并指導融合卷積網絡的學習,融合卷積神經網絡的目標函數為損失函數loss2為:
loss2=l1
整個神經網絡總的損失函數losst為:
losst=loss1+λloss2
λ是平衡loss1和loss2的常數。
4.一種基于結構指導深度學習的人體姿態(tài)估計系統(tǒng),其特征在于,包括如下模塊:
數據采集模塊,主要是通過相機得到包含有人體的圖片;
計算機處理模塊,包括圖像預處理子模塊,結構指導卷積神經網絡子模塊,融合卷積神經網絡子模塊,定位關節(jié)點子模塊和可視化子模塊。