本發(fā)明涉及定位,尤其涉及一種行人定位方法及裝置。
背景技術(shù):
1、超寬帶(uwb)技術(shù)作為一種高精度定位技術(shù),廣泛應(yīng)用于室內(nèi)定位系統(tǒng)。uwb技術(shù)通過(guò)測(cè)量定位終端與多個(gè)信標(biāo)間的時(shí)間差來(lái)確定定位,這一過(guò)程依賴(lài)于信標(biāo)和終端之間的有效通信。如果事先能預(yù)測(cè)出行人的大致位置,可以提前選擇最優(yōu)信標(biāo)進(jìn)行通信,從而改善定位的準(zhǔn)確性和響應(yīng)速度。
2、現(xiàn)有的uwb定位技術(shù)通常依賴(lài)于上一次定位的結(jié)果進(jìn)行信標(biāo)選擇,這種方法存在局限性,特別是在行人運(yùn)動(dòng)頻繁或者環(huán)境復(fù)雜的情況下,容易導(dǎo)致定位延遲或不準(zhǔn)確。此外,雖然現(xiàn)有技術(shù)中已經(jīng)利用實(shí)際地理信息(如樓宇布局和不可通行區(qū)域)輔助定位,但這些方法通常是靜態(tài)的,缺乏對(duì)行人行為動(dòng)態(tài)變化的實(shí)時(shí)響應(yīng)能力。
3、上述內(nèi)容僅用于輔助理解本發(fā)明的技術(shù)方案,并不代表承認(rèn)上述內(nèi)容是現(xiàn)有技術(shù)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的主要目的在于提供了一種行人定位方法及裝置,旨在解決現(xiàn)有技術(shù)中上述技術(shù)問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種行人定位方法,所述行人定位方法包括:
3、獲取行人歷史軌跡數(shù)據(jù)以及環(huán)境數(shù)據(jù);
4、根據(jù)所述行人歷史軌跡數(shù)據(jù)以及環(huán)境數(shù)據(jù),預(yù)測(cè)行人的下一位置;
5、根據(jù)預(yù)測(cè)出的行人的下一位置,基于預(yù)先訓(xùn)練好的強(qiáng)化學(xué)習(xí)模型,選擇出所述下一位置附近的信標(biāo);
6、根據(jù)選擇出的下一位置附近的信標(biāo),對(duì)行人進(jìn)行定位。
7、優(yōu)選地,在所述行人定位方法中,所述根據(jù)所述行人歷史軌跡數(shù)據(jù)以及環(huán)境數(shù)據(jù),預(yù)測(cè)行人的下一位置,包括:
8、以環(huán)境數(shù)據(jù)中的關(guān)鍵點(diǎn)作為圖中的節(jié)點(diǎn),將節(jié)點(diǎn)之間的可通行性作為邊,構(gòu)建圖結(jié)構(gòu),其中節(jié)點(diǎn)的特征包括所述節(jié)點(diǎn)所處位置的環(huán)境信息,邊的特征包括路徑的長(zhǎng)度、通過(guò)難度;
9、通過(guò)預(yù)先構(gòu)建的圖卷積神經(jīng)網(wǎng)絡(luò),對(duì)節(jié)點(diǎn)以及其鄰居節(jié)點(diǎn)的信息進(jìn)行聚合,得到節(jié)點(diǎn)的特征表示,聚合公式如下:
10、;
11、其中,為節(jié)點(diǎn)v在第l層的特征表示;
12、w(l)為第l層的權(quán)重矩陣;
13、n(v)為節(jié)點(diǎn)v的鄰居集合;
14、du和dv分別表示節(jié)點(diǎn)u和v的度;
15、σ為激活函數(shù);
16、根據(jù)歷史軌跡數(shù)據(jù)以及相應(yīng)的環(huán)境數(shù)據(jù),預(yù)測(cè)行人的下一位置,預(yù)測(cè)模型如下:
17、;
18、其中,為下一位置的預(yù)測(cè)值;
19、h()為預(yù)測(cè)模型;
20、為歷史軌跡數(shù)據(jù)對(duì)應(yīng)的特征表示,即為節(jié)點(diǎn)v在最后一層的特征表示;
21、為歷史軌跡數(shù)據(jù)對(duì)應(yīng)的環(huán)境數(shù)據(jù)的特征表示,即為節(jié)點(diǎn)v的鄰居節(jié)點(diǎn)的特征表示;
22、為與節(jié)點(diǎn)v連接的邊的特征。
23、優(yōu)選地,在所述行人定位方法中,所述根據(jù)歷史軌跡數(shù)據(jù)以及相應(yīng)的環(huán)境數(shù)據(jù),預(yù)測(cè)行人的下一位置的步驟之前,還包括:
24、獲取行人的步態(tài)數(shù)據(jù)、行為數(shù)據(jù)以及當(dāng)前環(huán)境數(shù)據(jù);
25、分別提取所述步態(tài)數(shù)據(jù)、行為數(shù)據(jù)、以及當(dāng)前環(huán)境數(shù)據(jù)的特征;
26、將提取的所述步態(tài)數(shù)據(jù)、行為數(shù)據(jù)、以及當(dāng)前環(huán)境數(shù)據(jù)的特征作為輸入,輸入訓(xùn)練好的長(zhǎng)短期記憶網(wǎng)絡(luò)模型,輸出行人下一步的行為意圖預(yù)測(cè);
27、相應(yīng)地,所述根據(jù)歷史軌跡數(shù)據(jù)以及相應(yīng)的環(huán)境數(shù)據(jù),預(yù)測(cè)行人的下一位置,包括:
28、根據(jù)歷史軌跡數(shù)據(jù)、相應(yīng)的環(huán)境數(shù)據(jù)、以及行人下一步的行為意圖預(yù)測(cè),預(yù)測(cè)行人的下一位置。
29、優(yōu)選地,在所述行人定位方法中,所述分別提取所述步態(tài)數(shù)據(jù)、行為數(shù)據(jù)、以及當(dāng)前環(huán)境數(shù)據(jù)的特征,包括:
30、使用卷積網(wǎng)絡(luò)對(duì)所述步態(tài)數(shù)據(jù)、行為數(shù)據(jù)進(jìn)行特征提?。?/p>
31、使用全連接層對(duì)所述當(dāng)前環(huán)境數(shù)據(jù)進(jìn)行特征提取。
32、優(yōu)選地,在所述行人定位方法中,所述將提取的所述步態(tài)數(shù)據(jù)、行為數(shù)據(jù)、以及當(dāng)前環(huán)境數(shù)據(jù)的特征作為輸入,輸入訓(xùn)練好的長(zhǎng)短期記憶網(wǎng)絡(luò)模型,輸出行人下一步的行為意圖預(yù)測(cè)之后,所述方法還包括:
33、根據(jù)歷史軌跡數(shù)據(jù)、相應(yīng)的環(huán)境數(shù)據(jù)、以及行人下一步的行為意圖預(yù)測(cè),對(duì)行人軌跡進(jìn)行預(yù)測(cè)。
34、優(yōu)選地,在所述行人定位方法中,所述根據(jù)預(yù)測(cè)出的行人的下一位置,基于預(yù)先訓(xùn)練好的強(qiáng)化學(xué)習(xí)模型,選擇出所述下一位置附近的信標(biāo)的步驟之前,還包括:
35、定義狀態(tài)st、動(dòng)作空間,其中狀態(tài)st包括當(dāng)前位置pt、周?chē)艠?biāo)的分布和信號(hào)強(qiáng)度bt、以及環(huán)境動(dòng)態(tài)特征et,動(dòng)作空間為a={b1,b2,……,bn},bi為第i個(gè)信標(biāo),動(dòng)作at為系統(tǒng)在時(shí)刻t做出的信標(biāo)選擇;
36、設(shè)置獎(jiǎng)勵(lì)函數(shù),公式為:
37、;其中,rt為獎(jiǎng)勵(lì),誤差表示定位結(jié)果與實(shí)際位置的偏差;延遲表示系統(tǒng)響應(yīng)時(shí)間,α和β為調(diào)整獎(jiǎng)勵(lì)的權(quán)重;
38、構(gòu)建強(qiáng)化學(xué)習(xí)模型,通過(guò)策略選擇動(dòng)作,并根據(jù)獎(jiǎng)勵(lì)更新策略,更新公式如下:
39、;
40、η為學(xué)習(xí)率,γ為折扣因子。
41、優(yōu)選地,在所述行人定位方法中,所述行人定位方法應(yīng)用于服務(wù)器,所述服務(wù)器聚合多個(gè)分布式終端設(shè)備發(fā)送的強(qiáng)化學(xué)習(xí)模型參數(shù),每個(gè)分布式終端設(shè)備上建立有所述強(qiáng)化學(xué)習(xí)模型;所述方法還包括:
42、所述服務(wù)器聚合每個(gè)所述分布式終端設(shè)備發(fā)送的強(qiáng)化學(xué)習(xí)模型參數(shù),得到整體模型,其中整體模型的參數(shù)的計(jì)算公式如下:
43、;
44、其中,為整體模型的參數(shù);
45、wk為第k個(gè)分布式終端設(shè)備的強(qiáng)化學(xué)習(xí)模型的參數(shù);
46、dk為第k個(gè)分布式終端設(shè)備的數(shù)據(jù)集;
47、在完成整體模型后,將新的整體模型發(fā)送給每個(gè)所述分布式終端設(shè)備,以使所述分布式終端設(shè)備使用整體模型更新自身的強(qiáng)化學(xué)習(xí)模型參數(shù);
48、其中,每個(gè)所述分布式終端設(shè)備最小化其數(shù)據(jù)上的損失函數(shù),損失函數(shù)為:
49、;
50、每個(gè)所述分布式終端設(shè)備上的數(shù)據(jù)集為,目標(biāo)函數(shù)為:
51、;
52、每個(gè)分布式終端設(shè)備將模型參數(shù)
53、為分布式終端k的損失函數(shù);
54、w為共享模型的參數(shù);
55、xi為輸入數(shù)據(jù);
56、yi為對(duì)應(yīng)的目標(biāo)輸出;
57、為預(yù)測(cè)函數(shù)。
58、為了實(shí)現(xiàn)上述目的,本發(fā)明還提供一種行人定位裝置,所述行人定位裝置包括:
59、獲取單元,用于獲取行人歷史軌跡數(shù)據(jù)以及環(huán)境數(shù)據(jù);
60、預(yù)測(cè)單元,用于根據(jù)所述行人歷史軌跡數(shù)據(jù)以及環(huán)境數(shù)據(jù),預(yù)測(cè)行人的下一位置;
61、選擇單元,用于根據(jù)預(yù)測(cè)出的行人的下一位置,基于預(yù)先訓(xùn)練好的強(qiáng)化學(xué)習(xí)模型,選擇出所述下一位置附近的信標(biāo);
62、定位單元,用于根據(jù)選擇出的下一位置附近的信標(biāo),對(duì)行人進(jìn)行定位。
63、為了實(shí)現(xiàn)上述目的,本發(fā)明還提供一種計(jì)算機(jī)設(shè)備,包括:
64、至少一個(gè)處理器;以及,
65、與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,
66、所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行上述的行人定位方法。
67、為了實(shí)現(xiàn)上述目的,本發(fā)明還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的行人定位方法。
68、本發(fā)明至少具有如下有益效果:
69、本發(fā)明提供的行人定位方法,通過(guò)獲取行人歷史軌跡數(shù)據(jù)以及環(huán)境數(shù)據(jù);根據(jù)所述行人歷史軌跡數(shù)據(jù)以及環(huán)境數(shù)據(jù),預(yù)測(cè)行人的下一位置;根據(jù)預(yù)測(cè)出的行人的下一位置,基于預(yù)先訓(xùn)練好的強(qiáng)化學(xué)習(xí)模型,選擇出所述下一位置附近的信標(biāo);根據(jù)選擇出的下一位置附近的信標(biāo),對(duì)行人進(jìn)行定位,如何可以提高在復(fù)雜環(huán)境和動(dòng)態(tài)變化下的精度和響應(yīng)速度。
70、進(jìn)一步地,本發(fā)明通過(guò)先預(yù)測(cè)下一位置,可以篩選出下一位置附近的信標(biāo),主動(dòng)與這些信標(biāo)進(jìn)行通信,能夠獲得更優(yōu)的測(cè)距,從而定位更精準(zhǔn);
71、進(jìn)一步地,假設(shè)不知道下一位置,那么只能在無(wú)線(xiàn)電環(huán)境中盲目的掃描,而無(wú)線(xiàn)電環(huán)境比較復(fù)雜,會(huì)浪費(fèi)比較多的時(shí)間根據(jù)信號(hào)的強(qiáng)度關(guān)系來(lái)篩選信標(biāo)以及對(duì)信標(biāo)做測(cè)距,例如可能在無(wú)線(xiàn)電掃描中,可能是很遠(yuǎn)處的信標(biāo)能通信上,則會(huì)花費(fèi)大量時(shí)間與這個(gè)信標(biāo)通信,然而這個(gè)測(cè)距是沒(méi)有意義的。由于通常需要的是附近的信標(biāo)的測(cè)距,如此更準(zhǔn)確。本發(fā)明通過(guò)先預(yù)測(cè)下一位置,給出一個(gè)大概范圍,那么就可以根據(jù)下一位置輔助確定主動(dòng)與哪幾個(gè)信標(biāo)進(jìn)行通信,去獲取更有利于精確定位行人所在位置的測(cè)距。