本發(fā)明涉及運(yùn)動(dòng)軌跡分析技術(shù)領(lǐng)域,特別涉及一種基于分割信度的運(yùn)動(dòng)軌跡分割方法。
背景技術(shù):
手勢在日常生活中是一種自然直觀的交流方式,隨著基于三維手勢的交互應(yīng)用的發(fā)展和普及,三維復(fù)雜動(dòng)態(tài)手勢的識別成為一塊熱門領(lǐng)域。三維動(dòng)態(tài)手勢識別研究的關(guān)鍵和難點(diǎn)之一是手勢運(yùn)動(dòng)特征的提取。
早期的手勢識別研究中,大部分的識別方法要求用戶穿戴或手持硬件設(shè)備,以方便運(yùn)動(dòng)數(shù)據(jù)采集,例如:Saggio G,Cavallo P,Fabrizio A,et al.Gesture recognition through HITEG data glove to provide a new way of communication[C].In Proceedings of the 4th International Symposium on Applied Sciences in Biomedical and Communication Technologies,ACM,2011:13。
近年來,由于深度相機(jī)的普及,基于視覺的手勢識別成為主流研究方向,例如Song Y,Demirdjian D,Davis R.Continuous body and hand gesture recognition for natural human-computer interaction[J].ACM Transactions on Interactive Intelligent Systems(TiiS),2012,2(1):5.以及Zhang T,Feng Z.Dynamic gesture recognition based on fusing frame images[C].In Proceedings of 2013 Fourth International Conference on Intelligent Systems Design and Engineering Applications(ISDEA),IEEE Computer Society,2013:280-283。
利用相機(jī)采集到的運(yùn)動(dòng)圖像序列,Jamie等人實(shí)現(xiàn)了實(shí)時(shí)從單一深度圖像中分割人體各個(gè)部位的工作Shotton J,Sharp T,Kipman A,et al.Real-time human pose recognition in parts from single depth images[J].Communications of the ACM,2013,56(1):116-124;而Chai等人在此基礎(chǔ)上采用模板匹配的方法實(shí)現(xiàn)了手語識別Chai X,Li G,Lin Y,et al.Sign language recognition and translation with Kinect[C].IEEE Conf.on AFGR.2013。
與此不同,將手部看成一個(gè)點(diǎn),將手勢運(yùn)動(dòng)的空間信息描述成一條軌跡,并基于此建立手勢運(yùn)動(dòng)特征描述,Lee等人使用基于HMM(Hidden Markov Model)的閾值模型從單手運(yùn)動(dòng)軌跡數(shù)據(jù)中完成了9種手勢的識別Lee H K,Kim J H.An HMM-based threshold model approach for gesture recognition[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,1999,21(10):961-973;Pend等人則采用有限狀態(tài)機(jī)的方法對手勢運(yùn)動(dòng)軌跡進(jìn)行識別Hong,P.,Turk,M.,Huang,T.S.Gesture modeling and recognition using finite machines.In Proceedings of the 4th International Conference on Face and Gesture Recognition,2000,410~415。
通過上述說明可以看出,現(xiàn)有的手勢運(yùn)動(dòng)軌跡研究中,研究者大都將一條手勢軌跡作為一個(gè)整體進(jìn)行分析。但面對路徑較長較復(fù)雜的手勢運(yùn)動(dòng)軌跡,整體的手勢特征編碼非常困難,從而大大增加了識別難度。如何在復(fù)雜手勢特征編碼的準(zhǔn)確性和簡潔性之間達(dá)成平衡,進(jìn)而準(zhǔn)確描述復(fù)雜手勢特征,成為亟需面對的問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種基于分割信度的運(yùn)動(dòng)軌跡分割方法,通過將復(fù)雜手勢軌跡分割成多個(gè)子軌跡段,以對子軌跡段分別進(jìn)行特征編碼及重組,從而在準(zhǔn)確性和簡潔性之間達(dá)成平衡,進(jìn)而準(zhǔn)確描述復(fù)雜手勢特征。
一種基于分割信度的運(yùn)動(dòng)軌跡分割方法,包括以下步驟:
(1)獲取運(yùn)動(dòng)軌跡,針對運(yùn)動(dòng)軌跡的每一個(gè)屬性,獲取運(yùn)動(dòng)軌跡的屬性極值點(diǎn);屬性的參數(shù)序列利用貪心算法進(jìn)行遍歷得到各軌跡屬性極值點(diǎn)。
(2)選取部分屬性極值點(diǎn)作為第一候選分割點(diǎn);
(3)所述運(yùn)動(dòng)軌跡的每一個(gè)屬性分別設(shè)定多個(gè)帶寬閾值,針對任一屬性、任一帶寬閾值,當(dāng)?shù)谝缓蜻x分割點(diǎn)的屬性變化率大于對應(yīng)帶寬閾值時(shí),將該第一候選分割點(diǎn)標(biāo)記為第二候選分割點(diǎn);每一個(gè)屬性的帶寬閾值 的數(shù)量可以根據(jù)需要設(shè)定,優(yōu)選的,每一個(gè)屬性分別設(shè)定的帶寬閾值數(shù)量為3~7個(gè)。
(4)計(jì)算第二候選分割點(diǎn)所在軌跡點(diǎn)的信度值,當(dāng)軌跡點(diǎn)被判定為任一屬性、任一帶寬閾值下的第二候選分割點(diǎn)時(shí),該軌跡點(diǎn)的信度值增加;
(5)設(shè)定信度閾值,將信度值小于信度閾值的第二候選分割點(diǎn)所在軌跡點(diǎn)過濾,得到最終的分割點(diǎn)集合。
本發(fā)明可以應(yīng)用到任一種類的運(yùn)動(dòng)軌跡描述,特別適用于手勢運(yùn)動(dòng)軌跡這類復(fù)雜多變的運(yùn)動(dòng)軌跡。手勢運(yùn)動(dòng)軌跡會(huì)有波動(dòng),如圖2所示為采集到的揮手運(yùn)動(dòng)手勢的運(yùn)動(dòng)軌跡的速率屬性在時(shí)間軸上的變化曲線,按照嚴(yán)格單調(diào)性,b位置會(huì)標(biāo)記為極小值點(diǎn),由此會(huì)成為候選分割點(diǎn)。但實(shí)際上b點(diǎn)是由于手勢波動(dòng)引入的噪聲,一般并不希望在此處進(jìn)行分割,因此,為了盡量減少噪聲的引入,步驟(3)中,本發(fā)明通過設(shè)定帶寬閾值來抑制噪聲的初步軌跡分割方法來獲取第一候選分割點(diǎn)。定義某一軌跡點(diǎn)上的屬性(本發(fā)明中為速率、曲率和撓率中的至少一種)參數(shù)值attributei與其前一軌跡點(diǎn)上的屬性參數(shù)值attributei-1的變化率deltai來描述波動(dòng),變化率deltai的計(jì)算公式如下:
屬性參數(shù)變化率deltai越大,說明該軌跡點(diǎn)屬性變化越大。設(shè)定的帶寬閾值指的是能容忍軌跡點(diǎn)屬性變化率的上限,設(shè)定帶寬閾值越大,允許軌跡點(diǎn)的參數(shù)變化波動(dòng)越大,得到的候選分割點(diǎn)越少;相反,則允許軌跡點(diǎn)的參數(shù)變化波動(dòng)越小,得到的候選分割點(diǎn)越多。
測試過程中發(fā)現(xiàn)曲率屬性對帶寬閾值較為敏感,因此曲率帶寬閾值設(shè)置間隔較小。優(yōu)選的,速率的帶寬閾值為1%~15%,曲率的帶寬閾值為1%~5%,撓率的帶寬閾值為1%~20%。
然后對步驟(2)中獲得的第一候選分割點(diǎn)的屬性參數(shù)變化率和預(yù)設(shè)的帶寬閾值進(jìn)行比較確定各軌跡屬性的第二候選分割點(diǎn),如某一極值點(diǎn)的屬性參數(shù)變化率大于預(yù)設(shè)帶寬閾值,將該極值點(diǎn)標(biāo)記為第二候選分割點(diǎn)。
由于不同的第二候選分割點(diǎn)的重要性程度是不同的,為區(qū)分不同候選分割點(diǎn)的重要性程度,本發(fā)明引入候選分割點(diǎn)的信度描述。信度也稱可靠性,是指采取同樣方法對同一對象進(jìn)行重復(fù)測量時(shí),其所得結(jié)果相一致的 程度,最后根據(jù)信度值進(jìn)行過濾,減少軌跡分割段數(shù),得到最終的分割點(diǎn)集合。
本發(fā)明分析的運(yùn)動(dòng)軌跡描述是基于時(shí)間序列的連續(xù)軌跡點(diǎn)(即位置)的集合。為完整、準(zhǔn)確地刻畫三維空間軌跡,優(yōu)選的,所述運(yùn)動(dòng)軌跡的屬性包括速率、曲率和撓率中的至少一個(gè),進(jìn)一步優(yōu)選的,所述運(yùn)動(dòng)軌跡的屬性包括速率、曲率和撓率。本發(fā)明引入位置、速率、曲率、撓率四種屬性對軌跡進(jìn)行多屬性描述,用于軌跡分割點(diǎn)選擇。綜合采用位置、速率、曲率、撓率四種屬性對軌跡進(jìn)行多屬性描述以全面刻畫手勢運(yùn)動(dòng),提升了手勢運(yùn)動(dòng)特征描述的完整性和準(zhǔn)確性。
其中,速率描述了對象的運(yùn)動(dòng)快慢,是動(dòng)態(tài)軌跡中非常重要的特征之一,本發(fā)明通過分析整條軌跡的速率變化情況,找到速率的極小值點(diǎn)作為候選分割點(diǎn)。
曲率是曲線上某個(gè)點(diǎn)的切線方向角對弧長的轉(zhuǎn)動(dòng)率,刻畫了曲線在某一點(diǎn)的彎曲程度。針對運(yùn)動(dòng)軌跡中的曲率分布特點(diǎn),兩個(gè)曲率極大值之間的軌跡較為平穩(wěn),本發(fā)明設(shè)定曲率變化中的極大值作為候選分割點(diǎn)。
空間軌跡在三維空間內(nèi)的扭轉(zhuǎn)程度是軌跡的另一種重要屬性,一般采用撓率表示,不同于許多研究忽視撓率而僅采用曲率描述的做法,本發(fā)明引入撓率作為手勢運(yùn)動(dòng)軌跡的屬性描述,同曲率屬性類似,選取撓率變化中的極大值作為候選分割點(diǎn)。
綜上所述,優(yōu)選的,步驟(2)中,屬性為速率時(shí),選取極小值作為第一候選分割點(diǎn);屬性為曲率或撓率時(shí),選取極大值作為第一候選分割點(diǎn)。
對于復(fù)雜的手勢運(yùn)動(dòng)軌跡,為實(shí)現(xiàn)分割結(jié)果的準(zhǔn)確性與簡潔性的平衡,本發(fā)明提出了基于分割信度的候選分割點(diǎn)融合的方法,即在根據(jù)信度值進(jìn)行過濾前,對第二候選分割點(diǎn)進(jìn)行聚類處理。通過將位置鄰近的第二候選分割點(diǎn)進(jìn)行聚類,以進(jìn)一步減少軌跡分割段數(shù)。
優(yōu)選的,步驟(5)中,在過濾第二候選分割點(diǎn)前,對第二候選分割點(diǎn)進(jìn)行聚類處理。進(jìn)一步優(yōu)選的,所述聚類處理采用DBSCAN算法。DBSCAN算法利用了基于密度的聚類概念,具有聚類效率高,能有效處理噪聲點(diǎn)的特點(diǎn)。
優(yōu)選的,在聚類處理時(shí),在任一聚類點(diǎn)集中,將離質(zhì)心(即聚類點(diǎn)集所在軌跡段的平均位置)最近的第二候選分割點(diǎn)作為聚類中心,去除聚類 中心以外的其他第二候選分割點(diǎn),且將去除的第二候選分割點(diǎn)的信度值累計(jì)到位于聚類中心的第二候選分割點(diǎn)上,并依據(jù)最大分割信度值對累計(jì)進(jìn)行截?cái)嗵幚怼?/p>
為了進(jìn)一步描述信度值的計(jì)算,設(shè)定K個(gè)帶寬閾值基于各屬性分別進(jìn)行基于帶寬單調(diào)性的初步分割,當(dāng)軌跡上的某一軌跡點(diǎn)被判定為第二候選分割點(diǎn)時(shí),該軌跡點(diǎn)的基于屬性的分割信度值增加1,此時(shí),對于同一屬性,每個(gè)軌跡點(diǎn)的分割信度值的取值范圍為[0,K]。對軌跡上的任一軌跡點(diǎn)Pi,分別計(jì)算其基于速率、曲率和撓率屬性下的分割信度值Rsi,Rci,Rti。
其中,Ws,Wc和Wt分別為速率、曲率和撓率屬性的權(quán)重,由于三種屬性對分割結(jié)果分別起著不同的作用,幾乎同等重要,因此,優(yōu)選的,設(shè)置Ws=Wc=Wt=1,Pi的信度值Ri的最終取值范圍為[0,3K],將信度值大于1的軌跡點(diǎn)選為第二候選分割點(diǎn)。
優(yōu)選的,步驟(4)中,軌跡點(diǎn)的信度值的計(jì)算公式為:
Ri=WsRsi+WcRci+WtRti
上式中,
i為任一軌跡點(diǎn);
Rsi,Rci和Rti為任一軌跡點(diǎn)分別基于速率、曲率和撓率屬性下的信度值;
Ws,Wc和Wt分別為速率、曲率和撓率屬性的權(quán)重。
優(yōu)選的,步驟(4)中,針對同一屬性,任一帶寬閾值下軌跡點(diǎn)被判定為第二候選分割點(diǎn)時(shí),該軌跡點(diǎn)的信度值增加1。
優(yōu)選的,步驟(5)中,設(shè)定信度閾值的大小為軌跡點(diǎn)所能具有的最大信度值的一半。
本發(fā)明的有益效果:
本發(fā)明先對運(yùn)動(dòng)軌跡基于帶寬單調(diào)性進(jìn)行初步分割,可以消除運(yùn)動(dòng)軌跡中由于運(yùn)動(dòng)本身和運(yùn)動(dòng)采集設(shè)備噪聲帶來的數(shù)據(jù)不穩(wěn)定的影響,提高分割的準(zhǔn)確性,再基于分割信度對運(yùn)動(dòng)軌跡進(jìn)行過濾,確保分割準(zhǔn)確的前提下保證了分割的簡潔性。
附圖說明
圖1為本發(fā)明方法的線框流程圖。
圖2為運(yùn)動(dòng)軌跡的速率和時(shí)間關(guān)系圖。
圖3為本發(fā)明中的音樂節(jié)拍手勢的運(yùn)動(dòng)軌跡的軌跡點(diǎn)信度值分布。
圖4為本發(fā)明中的音樂節(jié)拍手勢的運(yùn)動(dòng)軌跡。
圖5(a)~圖5(e)為本發(fā)明基于速率屬性對應(yīng)5個(gè)不同帶寬閾值的初步分割結(jié)果。
圖6(a)~圖6(e)為本發(fā)明基于曲率屬性對應(yīng)5個(gè)不同帶寬閾值的初步分割結(jié)果。
圖7(a)~圖7(e)為本發(fā)明基于撓率屬性對應(yīng)5個(gè)不同帶寬閾值的初步分割結(jié)果。
圖8(a)~圖8(c)為本發(fā)明的音樂節(jié)拍手勢的運(yùn)動(dòng)軌跡的分割過程。
具體實(shí)施方式
本實(shí)施例中,利用微軟的Kinect設(shè)備進(jìn)行手勢運(yùn)動(dòng)的跟蹤與記錄,獲取手勢運(yùn)動(dòng)軌跡數(shù)據(jù)。采集手勢運(yùn)動(dòng)時(shí),被試者站在Kinect相機(jī)的正前方1.5~2米處,進(jìn)行手勢運(yùn)動(dòng),相機(jī)跟蹤被試者的手部,將運(yùn)動(dòng)過程記錄為等時(shí)間間隔的空間連續(xù)位置點(diǎn)(軌跡點(diǎn))集合,所采集的數(shù)據(jù)點(diǎn)經(jīng)中值濾波處理后成為最終手勢運(yùn)動(dòng)軌跡點(diǎn),連續(xù)的軌跡點(diǎn)組成運(yùn)動(dòng)軌跡。
如圖4所示,本實(shí)施例以音樂節(jié)拍手勢運(yùn)動(dòng)為例,對本發(fā)明的基于分割信度的運(yùn)動(dòng)軌跡分割方法進(jìn)行進(jìn)一步說明。
本實(shí)施例的基于分割信度的運(yùn)動(dòng)軌跡分割方法,如圖3所示,包括以下步驟:
(1)基于帶寬單調(diào)性的多屬性初步分割:
1-1、分別對音樂節(jié)拍手勢運(yùn)動(dòng)軌跡的速率、曲率和撓率三種屬性的參數(shù)序列利用貪心算法進(jìn)行遍歷得到各軌跡屬性極值點(diǎn),選擇基于速率屬性的極小值,基于曲率、撓率屬性的極大值作為第一候選分割點(diǎn);
1-2、然后對這些第一候選分割點(diǎn)基于表1中預(yù)設(shè)的帶寬閾值選擇第二候選分割點(diǎn),如某一極值點(diǎn)的屬性參數(shù)變化率大于預(yù)設(shè)的帶寬閾值,將該極值點(diǎn)標(biāo)記為第二候選分割點(diǎn),屬性參數(shù)變化率deltai的計(jì)算公式如下:
attributei為任一軌跡點(diǎn)的屬性參數(shù)值;
attributei-1為attributei前一軌跡點(diǎn)上的屬性參數(shù)值;
圖5是基于速率屬性描述的初步分割結(jié)果,圖中標(biāo)示出了音樂節(jié)拍手勢運(yùn)動(dòng)軌跡上的第二候選分割點(diǎn)(粗點(diǎn)),為了更清楚地進(jìn)行說明,本實(shí)施例中,針對每一帶寬閾值分別進(jìn)行圖示,圖5中,(a)~(e)為分別對應(yīng)表1中的5種帶寬閾值(α1~α5)下的基于速率屬性描述的初步分割結(jié)果,圖6中,(a)~(e)為分別對應(yīng)表1中的5種帶寬閾值(α1~α5)下的基于曲率屬性描述的初步分割結(jié)果;圖7中,(a)~(e)為分別對應(yīng)表1中的5種帶寬閾值(α1~α5)下的基于撓率屬性描述的初步分割結(jié)果。
進(jìn)行基于帶寬單調(diào)性的軌跡初步分割時(shí),對速率、曲率和撓率三種屬性采用表1中的5種帶寬閾值(α1~α5)進(jìn)行設(shè)置,由于測試過程中發(fā)現(xiàn)曲率屬性對帶寬閾值較為敏感,因此曲率帶寬閾值設(shè)置間隔較小。
表1
(2)通過投影合并第二候選分割點(diǎn);
圖8(a)為基于多屬性分割的直接投影,即圖5至圖7共15張圖上的所有第二候選分割點(diǎn)的直接合并。
(3)計(jì)算合并后的各第二候選分割點(diǎn)的信度值:
3-1、針對速率、曲率和撓率三種屬性,在5種不同帶寬閾值下,計(jì)算合并后的各第二候選分割點(diǎn)基于速率、曲率和撓率屬性下的分割信度值Rsi,Rci,Rti。當(dāng)軌跡上的某一軌跡點(diǎn)被判定為第二候選分割點(diǎn)時(shí),該軌跡點(diǎn)的基于屬性的分割信度值增加1。因此,Rsi,Rci,Rti的取值范圍為[0,5]。
3-2、利用下述公式計(jì)算圖8(a)上各第二候選分割點(diǎn)信度值,計(jì)算 得到的信度值范圍為[0,15],圖3為每一軌跡點(diǎn)的信度值。
軌跡點(diǎn)的信度值的計(jì)算公式為:
Ri=WsRsi+WcRci+WtRti
上式中,
i為任一軌跡點(diǎn);
Rsi,Rci和Rti為任一軌跡點(diǎn)分別基于速率、曲率和撓率屬性下的信度值;
Ws,Wc和Wt分別為速率、曲率和撓率屬性的權(quán)重,Ws=Wc=Wt=1。
(4)聚類第二候選分割點(diǎn):
4-1、根據(jù)各第二候選分割點(diǎn)的位置,采用DBSCAN算法對候選分割點(diǎn)進(jìn)行聚類,對于任一聚類點(diǎn)集,設(shè)定離其質(zhì)心最近的候選分割點(diǎn)作為聚類中心,去除聚類中心以外的其他第二候選分割點(diǎn),且將去除的第二候選分割點(diǎn)的信度值累計(jì)到位于聚類中心的第二候選分割點(diǎn)上,并依據(jù)最大分割信度值15,對累計(jì)進(jìn)行截?cái)嗵幚?,圖8(b)為經(jīng)過聚類后的結(jié)果;
(5)信度值過濾
根據(jù)設(shè)定的信度閾值對聚類后的第二候選分割點(diǎn)進(jìn)行過濾,設(shè)定默認(rèn)的信度閾值為最大信度值的一半,由于最大信度值為15,因此信度閾值為7,濾除信度值小于7的第二候選分割點(diǎn),圖8(c)為根據(jù)信度閾融合后的最終結(jié)果,得到分割點(diǎn)(粗點(diǎn))集合。
本實(shí)施例方法綜合采用位置、速率、曲率、撓率四種屬性對軌跡進(jìn)行多屬性描述以全面刻畫手勢運(yùn)動(dòng),提升了手勢運(yùn)動(dòng)特征描述的完整性和準(zhǔn)確性;
提出的基于帶寬單調(diào)性的手勢運(yùn)動(dòng)軌跡初步分割方法,可以消除手勢運(yùn)動(dòng)軌跡中由于手勢運(yùn)動(dòng)本身和運(yùn)動(dòng)采集設(shè)備噪聲帶來的數(shù)據(jù)不穩(wěn)定的影響,提高分割準(zhǔn)確性;
提出的基于分割信度運(yùn)動(dòng)手勢軌跡分割方法,在確保分割準(zhǔn)確的前提下保證了分割的簡潔性。