本發(fā)明屬于云計算技術(shù)領(lǐng)域,主要涉及遠程數(shù)據(jù)的定位,具體是一種遠程數(shù)據(jù)存儲位置驗證方法,可用于驗證云端數(shù)據(jù)的存儲位置或定位非本地的數(shù)據(jù)。
背景技術(shù):
云在過去數(shù)年內(nèi)迅速席卷整個計算機行業(yè)的方方面面,存儲即服務(wù)不僅使得企業(yè)將大量數(shù)據(jù)從線下轉(zhuǎn)移到云端,也令無數(shù)個人用戶的硬盤成為了具有時代特色的緩存。
然而,云的固有問題在于云服務(wù)商是否可信以及可靠。雖然云服務(wù)商大多為it界巨頭。但是在2009年,谷歌大批用戶的文件外泄。同年,亞馬遜s3服務(wù)兩次中斷,導(dǎo)致很多依靠其服務(wù)的網(wǎng)站癱瘓。事故并沒有因搶救后停止,2010年微軟的hotmail錯誤地刪除了1.7萬用戶數(shù)據(jù)。緊接著在2011年,亞馬遜ec2服務(wù)永久丟失了大量用戶的數(shù)據(jù)。用戶雖然獲得了巨量的存儲空間以及較低的管理成本,但代價是失去對數(shù)據(jù)的直接控制。因此對云的使用而言,迫切需要建立一種能夠有效驗證云服務(wù)商所承諾服務(wù)的工程化機制。
通過服務(wù)水平協(xié)議(servicelevelagreement),簡稱sla,用戶可以在法理上與云服務(wù)商達成一致。但sla并不能保證服務(wù)實際的運行狀況,商人們有足夠的動機為了降低成本而閹割服務(wù)。鑒于此,數(shù)據(jù)持有性證明pdp以及數(shù)據(jù)可恢復(fù)性證明por應(yīng)運而生,以驗證云端用戶數(shù)據(jù)的完整性。后者por甚至可以在某種程度上恢復(fù)不完整的數(shù)據(jù)。
但僅僅驗證數(shù)據(jù)被完整存儲還遠遠不夠,數(shù)據(jù)丟失的關(guān)鍵在于數(shù)據(jù)沒有合適的冗余。為了應(yīng)對自然災(zāi)害,斷電甚至駭客的惡意行為,云服務(wù)商會為數(shù)據(jù)提供備份。然而即便利用pdp或por能夠驗證數(shù)據(jù)的完整性,也無法得知數(shù)據(jù)是否按照協(xié)議要求被備份,更無法得知所備份的數(shù)據(jù)是否分布于不同的地理位置。
驗證云端數(shù)據(jù)存儲位置的應(yīng)用不僅僅限于此,考慮到一些特殊數(shù)據(jù),例如一個國家的健康檔案。其不僅存儲需求大,而且要求能夠在全國范圍內(nèi)被正常訪問。因此將其托管給商業(yè)機構(gòu)是一個更好的選擇。但出于對病人隱私的保護和其它方面的考慮,相關(guān)法律會限制其存儲的地理位置。如加拿大個人信息保護和電子文檔法規(guī)定這些數(shù)據(jù)必須存儲于加拿大境內(nèi)以保證安全,并且任何對該數(shù)據(jù)的托管都必須滿足其存儲于加拿大境內(nèi)的要求。相關(guān)機構(gòu)可以通過驗證這些數(shù)據(jù)的地理位置來判斷服務(wù)商是否違法。
在2011年usenixhotcloud會議中,會議論文《apositionpaperondatasovereignty:theimportanceofgeolocatingdatainthecloud》指出有效驗證云端數(shù)據(jù)的地理位置是一個亟需解決的問題。而要解決的問題主要包含了倆個方面:
a)如何驗證遠端主機完整地存儲了目標文件。
b)如何定位完整地存儲了目標文件的主機。
問題的第一個方面目前已有很多良好的解決方案,如pdp以及por協(xié)議。
然而,在定位方面。為了提高可靠性,需采用主動測量的方式。而非查詢域名注冊數(shù)據(jù)庫的辦法。因為這些注冊信息既有可能過期,也有可能在登記時便是錯誤位置。所以目前主動測量進行定位的兩大問題便是定位精度和定位成本。
2011年在acmworkshoponcloudcomputingsecurityworkshop會議上《doyouknowwhereyourcloudfilesare》一文采用直接取回遠程數(shù)據(jù)的方式,結(jié)合cbg技術(shù)給出了理論框架并對亞馬遜s3的9個數(shù)據(jù)中心進行了實驗。其結(jié)果顯示文件基本可以被成功定位,算法能夠分辨亞馬遜的各個數(shù)據(jù)中心,但需要使用數(shù)十個可控服務(wù)器(又稱為地標)對目標定位,cbg要求網(wǎng)絡(luò)的時間延遲與地理距離兩者的線性關(guān)系較強,因此造成得誤差較大,可達到1,000km,無法對城市作有效區(qū)分,且成本很高。
2012年在acmworkshoponcloudcomputingsecurityworkshop會議上《lost:locationbasedstorage》一文提出了構(gòu)建于por與cbg之上的驗證機制,稱為位置驗證pol??紤]了敵手攻擊,并給出了安全性證明。該技術(shù)可以抵御云服務(wù)商的欺詐,提高定位結(jié)果的真實性。但由于其基于cbg進行定位,依然存在上述缺陷,報告所稱平均誤差為800km(歐洲)與1,000km(北美)。
綜上,為了定位遠程數(shù)據(jù),云服務(wù)商的數(shù)據(jù)中心基本以城市為單位,因此必須實現(xiàn)城市級別的定位。但800~1,000km的定位誤差意味著在有些國家內(nèi)的城市難以區(qū)分,在歐洲,甚至無法區(qū)分相鄰的國家,精度很低。且上述技術(shù)使用的服務(wù)器需要數(shù)十臺,定位成本也很高。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的不足,提出一種精度高,成本低的遠程數(shù)據(jù)存儲位置驗證方法。
本發(fā)明是一種遠程數(shù)據(jù)存儲位置驗證方法,其特征在于,包括有如下步驟:
(1)計算時間延遲的正態(tài)分布概率密度函數(shù):設(shè)定某一個遠程數(shù)據(jù),對其存儲位置進行驗證,設(shè)該遠程數(shù)據(jù)存儲位置為目標x,相對于目標x,將定位的范圍限制于某一驗證區(qū)域內(nèi)。該驗證區(qū)域內(nèi)存在地理位置已知的節(jié)點,在每個地理位置已知的節(jié)點上有可訪問的網(wǎng)絡(luò)節(jié)點n,至少存在一臺可控服務(wù)器l,簡稱地標,位于驗證區(qū)域內(nèi)任意地理位置的已知節(jié)點,如果有多個地標,則它們不相互重合。令各地標l對所有地理位置已知的網(wǎng)絡(luò)節(jié)點n發(fā)送k次探測,以任意地標li與任意網(wǎng)絡(luò)節(jié)點nj為例進行說明,1≤i≤n,1≤j≤m,n為地標總數(shù),m為網(wǎng)絡(luò)節(jié)點總數(shù)。計算地標li對網(wǎng)絡(luò)節(jié)點nj的k次探測所得時間延遲的平均值μij與時間延遲的標準差σij,可得地標li與網(wǎng)絡(luò)節(jié)點nj時間延遲的正態(tài)分布概率密度函數(shù)fij(x)。
(2)計算網(wǎng)絡(luò)節(jié)點間的時間延遲相似度:針對各網(wǎng)絡(luò)節(jié)點,構(gòu)造各網(wǎng)絡(luò)節(jié)點對各地標的時間延遲平均值向量,其中網(wǎng)絡(luò)節(jié)點nj針對所有地標的向量為(μ1j,μ2j,…,μij,…,μnj),其中元素μij表示地標li與網(wǎng)絡(luò)節(jié)點nj的平均時間延遲。根據(jù)該向量,使用閔可夫斯基距離計算網(wǎng)絡(luò)節(jié)點nj與其它所有網(wǎng)絡(luò)節(jié)點的距離,取它們的最小值,該值稱為網(wǎng)絡(luò)節(jié)點nj的時間延遲相似度μj,1≤i≤n,n為地標總數(shù)。
(3)計算時間延遲波動:針對各網(wǎng)絡(luò)節(jié)點,構(gòu)造各網(wǎng)絡(luò)節(jié)點對各地標的時間延遲標準差向量,其中網(wǎng)絡(luò)節(jié)點nj針對所有地標的向量為(σ1j,σ2j,…,σij,…,σnj),其中σij為地標li與網(wǎng)絡(luò)節(jié)點nj之間時間延遲的標準差。根據(jù)該向量對網(wǎng)絡(luò)節(jié)點nj針對所有地標的向量的所有元素求和,并除以地標總數(shù)n,得網(wǎng)絡(luò)節(jié)點nj針對所有地標的時間延遲波動σj,1≤i≤n。
(4)建立延遲匹配庫:用正態(tài)分布概率密度函數(shù)fij(x),時間延遲相似度μj和時間延遲波動σj共建延遲匹配庫。
(5)獲取被定位目標x相對于各地標的時間延遲:遠程數(shù)據(jù)存儲于目標x,目標x在未確定位置之前,視為一個網(wǎng)絡(luò)節(jié)點。各地標與目標x執(zhí)行pdp協(xié)議,用地標li進行說明。地標li向目標x發(fā)送挑戰(zhàn)并開始計時,目標x在接收到挑戰(zhàn)后在響應(yīng)中添加執(zhí)行pdp協(xié)議所用時間θix,并響應(yīng)地標li。若地標li收到響應(yīng),得到從挑戰(zhàn)發(fā)出到目標x響應(yīng)的總時間延遲τix,以及目標x所添加執(zhí)行pdp協(xié)議所用時間θix,計算從挑戰(zhàn)發(fā)出到目標x響應(yīng)的總時間延遲與執(zhí)行pdp協(xié)議所用時間之差,即τix-θix,得到地標li與目標x間的時間延遲tix,1≤i≤n,n為地標總數(shù);若地標li未收到響應(yīng),則設(shè)置地標li與目標x間的時間延遲tix=-1。所有地標均執(zhí)行該協(xié)議,得到所有地標與目標的時間延遲。當所有地標均獲取與目標的時間延遲后執(zhí)行步驟(6),否則等待未完成該過程的地標。
(6)各地標計算目標x位于各網(wǎng)絡(luò)節(jié)點的概率:地標li將它與目標x間的時間延遲tix代入地標li與網(wǎng)絡(luò)節(jié)點nj的正態(tài)分布概率密度函數(shù)fij(x),得到目標x位于網(wǎng)絡(luò)節(jié)點nj的概率pri(x=nj),1≤i≤n,1≤j≤m,n為地標總數(shù),m為網(wǎng)絡(luò)節(jié)點總數(shù)。所有地標對所有網(wǎng)絡(luò)節(jié)點均執(zhí)行該計算,得到目標x位于各網(wǎng)絡(luò)節(jié)點的概率。
(7)計算各地標的候選集合:設(shè)候選集合pi是地標li定位目標x的中間結(jié)果。設(shè)置閾值δ,當目標x位于網(wǎng)絡(luò)節(jié)點nj的概率pri(x=nj)大于δ時,將網(wǎng)絡(luò)節(jié)點nj與該概率pri(x=nj)加入地標li的候選集合pi,1≤i≤n,1≤j≤m,n為地標總數(shù),m為網(wǎng)絡(luò)節(jié)點總數(shù)。所有地標均執(zhí)行該計算,得到所有地標各自的候選集合。
(8)計算所有候選集合中各網(wǎng)絡(luò)節(jié)點的權(quán)重:各地標將所有候選集合發(fā)送至中央服務(wù)器cl,中央服務(wù)器cl統(tǒng)計各網(wǎng)絡(luò)節(jié)點在所有候選集合中出現(xiàn)的總次數(shù),記網(wǎng)絡(luò)節(jié)點nj的權(quán)重為wj。所述中央服務(wù)器cl或選擇某個地標作為中央服務(wù)器cl,或另部署一臺普通服務(wù)器作為中央服務(wù)器cl。
(9)計算權(quán)重最大網(wǎng)絡(luò)節(jié)點的概率:中央服務(wù)器cl選出權(quán)重的最大的網(wǎng)絡(luò)節(jié)點。如果權(quán)重最大的網(wǎng)絡(luò)節(jié)點有多個,計算目標x位于這些網(wǎng)絡(luò)節(jié)點的最大概率,將上述網(wǎng)絡(luò)節(jié)點及其最大概率加入集合r。
(10)得出定位結(jié)果:若集合r為空集,則定位失敗;否則,集合r中概率最大的網(wǎng)絡(luò)節(jié)點nj為最終定位結(jié)果,即目標x位于nj,完成遠程數(shù)據(jù)存儲位置驗證。
本發(fā)明以網(wǎng)絡(luò)上節(jié)點間時間延遲在一個穩(wěn)定值附近波動為前提,建立網(wǎng)絡(luò)節(jié)點間時間延遲與其相對位置的關(guān)系,以時間延遲為準,分類網(wǎng)絡(luò)節(jié)點和建群,并建立延遲匹配庫。定位時,根據(jù)延遲匹配庫計算目標x可能位于各網(wǎng)絡(luò)節(jié)點的權(quán)重與概率,實現(xiàn)對目標的定位。在地標數(shù)目相同的情況下,遠程數(shù)據(jù)存儲位置定位的精度高于現(xiàn)有技術(shù)。
與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點:
1)本發(fā)明構(gòu)造網(wǎng)絡(luò)上地標與網(wǎng)絡(luò)節(jié)點間時間延遲的正態(tài)分布概率密度函數(shù),通過正態(tài)分布概率密度函數(shù),采用地標在定位時計算目標位于各網(wǎng)絡(luò)節(jié)點的概率,將概率最大的網(wǎng)絡(luò)節(jié)點作為定位結(jié)果。定位時沒有將時間延遲映射到地理距離,避免了無法準確測量數(shù)據(jù)包傳播的距離而引入的額外誤差,因此定位的精度更高。
2)本發(fā)明需要參與定位的地標數(shù)目較少,理論上僅需一臺即可進行定位,實際實施時使用三臺便可達到甚至超過現(xiàn)有技術(shù)十多臺進行定位的精度,實驗數(shù)據(jù)顯示本發(fā)明的誤差縮小到100~300km,大大降低了成本。
3)本發(fā)明定位的所有計算不涉及幾何運算,故總計算量小。同時,各地標分攤定位過程中的大部分計算,得出中間結(jié)果并傳輸至中央服務(wù)器。中央服務(wù)器得出最終結(jié)果所需的計算量很小。因此對地標與中央服務(wù)器的硬件要求較低。
4)本發(fā)明定義了時間延遲相似度與時間延遲波動倆個參數(shù),它們用于在理論上評估本發(fā)明實際定位遠程數(shù)據(jù)的正確率。其中時間延遲相似度的值越高,時間延遲波動的值越低,本發(fā)明定位的正確率越高。因此本發(fā)明存在量化的方式來評估其定位的正確率。
附圖說明
圖1是本發(fā)明使用的定位總體流程圖;
圖2是本發(fā)明的定位示意圖;
圖3是本發(fā)明的定位理論模型圖;
圖4是本發(fā)明使用的建立延遲匹配庫流程圖;
圖5是本發(fā)明的地標與網(wǎng)絡(luò)節(jié)點間時間延遲探測模型圖;
圖6是本發(fā)明的地標挑戰(zhàn)目標模型圖;
圖7是本發(fā)明的計算目標位置流程圖;
圖8是本發(fā)明的眾多國內(nèi)大城市作為網(wǎng)絡(luò)節(jié)點的延遲匹配庫參數(shù)圖;
圖9是本發(fā)明在圖8基礎(chǔ)上的定位正確率因子圖。
具體實施方式
下面結(jié)合附圖,對本發(fā)明作詳細的描述。
實施例1
目前遠程數(shù)據(jù)存儲位置驗證的研究很少,現(xiàn)有技術(shù)均基于cbg技術(shù)。cbg技術(shù)在定位時將網(wǎng)絡(luò)節(jié)點間的時間延遲映射為地理距離進行定位,其依賴于建立網(wǎng)絡(luò)節(jié)點間時間延遲與它們間距離的線性關(guān)系。因為實際的網(wǎng)絡(luò)中不存在這種嚴格的線性關(guān)系,故cbg技術(shù)通過大量探測時間延遲與地理距離來進行線性擬合。于是現(xiàn)有技術(shù)的誤差主要來源于時間延遲的誤差與地理距離的誤差。首先,網(wǎng)絡(luò)中的時間延遲包括傳播延遲與非傳播延遲兩部分,只有傳播延遲與地理距離相關(guān),故非傳播延遲不可避免地使時間延遲測量值較大。其次,網(wǎng)絡(luò)節(jié)點間數(shù)據(jù)包實際傳播的距離無法準確測量,且與網(wǎng)絡(luò)節(jié)點在地圖上的距離不相等,因此距離測量也會引入誤差。在已有技術(shù)的報告中,其定位精度較低,很難區(qū)分一個國家內(nèi)的主要城市。而目前云服務(wù)商數(shù)據(jù)中心的建設(shè)均以城市為單位,因此無法滿足將遠程數(shù)據(jù)精確定位于數(shù)據(jù)中心的需求。
本發(fā)明針對上述技術(shù)現(xiàn)狀展開了探索與研究,提供了一種遠程數(shù)據(jù)存儲位置驗證方法,參見圖1,包括有如下步驟:
(1)計算時間延遲的正態(tài)分布概率密度函數(shù):設(shè)定某一個遠程數(shù)據(jù),用戶對其存儲位置進行驗證,設(shè)該遠程數(shù)據(jù)存儲位置為目標x,本發(fā)明就是相對于目標x展開對其位置的定位與驗證,本發(fā)明首先將定位的范圍限制于某一驗證區(qū)域內(nèi),在這一驗證區(qū)域內(nèi),對目標x進行定位和驗證。如果最終的定位失敗,則在另一個驗證區(qū)域?qū)δ繕藊重新進行定位。
在該驗證區(qū)域內(nèi)存在地理位置已知的節(jié)點,參見圖2,在每個地理位置已知的節(jié)點上有可訪問的網(wǎng)絡(luò)節(jié)點n,簡稱網(wǎng)絡(luò)節(jié)點。至少存在一臺可控服務(wù)器l,可控服務(wù)器l簡稱地標l,位于驗證區(qū)域內(nèi)任意地理位置的已知節(jié)點。如果有多個地標,則它們所位于的節(jié)點均不相同,即地標之間不相互重合。令各地標對所有地理位置已知的網(wǎng)絡(luò)節(jié)點發(fā)送k次探測,用以得到地標與網(wǎng)絡(luò)節(jié)點的時間延遲。以任意地標li與任意網(wǎng)絡(luò)節(jié)點nj為例進行說明:針對地標i,1≤i≤n,n為地標總數(shù),針對網(wǎng)絡(luò)節(jié)點j,1≤j≤m,m為網(wǎng)絡(luò)節(jié)點總數(shù),地標li對網(wǎng)絡(luò)節(jié)點nj發(fā)送k次探測,發(fā)送探測后獲得地標li對網(wǎng)絡(luò)節(jié)點nj的時間延遲集合tij={tij1,tij2,…,tijk},tijk是地標li對網(wǎng)絡(luò)節(jié)點nj發(fā)送第k次探測所得時間延遲;隨后從時間延遲集合tij中刪除較大值與較小值后,計算時間延遲集合tij中元素的平均值μij和標準差σij,可得地標li與網(wǎng)絡(luò)節(jié)點nj時間延遲的正態(tài)分布概率密度函數(shù)fij(x)。各地標對各網(wǎng)絡(luò)節(jié)點均執(zhí)行上述探測與計算,得到所有地標與所有網(wǎng)絡(luò)節(jié)點間時間延遲的正態(tài)分布概率密度函數(shù),用于定位時計算目標x位于各網(wǎng)絡(luò)節(jié)點的概率。
(2)計算網(wǎng)絡(luò)節(jié)點間的時間延遲相似度:針對各網(wǎng)絡(luò)節(jié)點,構(gòu)造各網(wǎng)絡(luò)節(jié)點對各地標的時間延遲平均值向量,其中網(wǎng)絡(luò)節(jié)點nj針對所有地標的時間延遲平均值向量為(μ1j,μ2j,…,μij,…,μnj),其中元素μij表示地標li與網(wǎng)絡(luò)節(jié)點nj的平均時間延遲。使用閔可夫斯基距離計算網(wǎng)絡(luò)節(jié)點nj與其它所有網(wǎng)絡(luò)節(jié)點間的距離,取它們的最小值,該值稱為網(wǎng)絡(luò)節(jié)點nj的時間延遲相似度μj,1≤i≤n,1≤j≤m,n為地標總數(shù),m為網(wǎng)絡(luò)節(jié)點總數(shù)。按以上方法計算所有網(wǎng)絡(luò)節(jié)點的時間延遲相似度。時間延遲相似度評價遠程數(shù)據(jù)定位正確率的基礎(chǔ)數(shù)據(jù)。
(3)計算時間延遲波動:針對各網(wǎng)絡(luò)節(jié)點,構(gòu)造各網(wǎng)絡(luò)節(jié)點對各地標的時間延遲標準差向量,其中網(wǎng)絡(luò)節(jié)點nj針對所有地標的時間延遲標準差向量為(σ1j,σ2j,…,σij,…,σnj),其中σij為地標li與網(wǎng)絡(luò)節(jié)點nj之間時間延遲的標準差。對網(wǎng)絡(luò)節(jié)點nj針對所有地標的時間延遲標準差向量的所有元素求和,并除以地標總數(shù)n,得網(wǎng)絡(luò)節(jié)點nj針對所有地標的時間延遲波動σj,1≤i≤n,1≤j≤m,m為網(wǎng)絡(luò)節(jié)點總數(shù)。按以上方法計算所有網(wǎng)絡(luò)節(jié)點的時間延遲波動。時間延遲波動是評價遠程數(shù)據(jù)定位正確率的基礎(chǔ)數(shù)據(jù)。
(4)建立延遲匹配庫:用以上三步所有地標得到的所有正態(tài)分布概率密度函數(shù),時間延遲相似度和時間延遲波動共建延遲匹配庫。延遲匹配庫建立完畢后,便可快捷的利用該數(shù)據(jù)庫進行遠程數(shù)據(jù)的定位。
(5)獲取被定位目標x相對于各地標的時間延遲:遠程數(shù)據(jù)存儲于目標x,目標x在未確定位置之前,視為一個網(wǎng)絡(luò)節(jié)點。各地標與目標x執(zhí)行pdp協(xié)議,用地標li進行說明:地標li向目標x發(fā)送挑戰(zhàn)并開始計時,目標x在接收到挑戰(zhàn)后在響應(yīng)中添加執(zhí)行pdp協(xié)議所用時間θix,并響應(yīng)地標li。若地標li收到響應(yīng),則得到從挑戰(zhàn)發(fā)出到目標x響應(yīng)的總時間延遲τix,以及目標x所添加執(zhí)行pdp協(xié)議所用時間θix,并計算從挑戰(zhàn)發(fā)出到目標x響應(yīng)的總時間延遲與執(zhí)行pdp協(xié)議所用時間之差,即τix-θix,得到地標li與目標x間的時間延遲tix;若地標li未收到響應(yīng),則設(shè)置地標li與目標x間的時間延遲tix=-1,1≤i≤n,n為地標總數(shù)。所有地標均執(zhí)行該協(xié)議,得到所有地標與目標的時間延遲。當所有地標均獲取與目標的時間延遲后執(zhí)行步驟(6),否則未完成該過程的地標等待目標x返回響應(yīng)并計算相應(yīng)所需的時間延遲,直到所有地標獲得與目標x的時間延遲。
(6)各地標計算目標x位于各網(wǎng)絡(luò)節(jié)點的概率:地標li將它與目標x間的時間延遲tix代入地標li與網(wǎng)絡(luò)節(jié)點nj的正態(tài)分布概率密度函數(shù)fij(x),該正態(tài)分布概率密度函數(shù)fij(x)在延遲匹配庫中,得到目標x位于網(wǎng)絡(luò)節(jié)點nj的概率pri(x=nj),1≤i≤n,1≤j≤m,n為地標總數(shù),m為網(wǎng)絡(luò)節(jié)點總數(shù)。所有地標對所有網(wǎng)絡(luò)節(jié)點均執(zhí)行該計算,得到各地標所得x位于各網(wǎng)絡(luò)節(jié)點的概率。
(7)計算各地標的候選集合:設(shè)候選集合pi是地標li定位目標x的中間結(jié)果。設(shè)置閾值δ,當目標x位于網(wǎng)絡(luò)節(jié)點nj的概率pri(x=nj)大于δ時,將網(wǎng)絡(luò)節(jié)點nj與該概率pri(x=nj)加入到地標li的候選集合pi,即pi={(nj,pri(x=nj))|pri(x=nj)>δ,1≤j≤m},1≤i≤n,1≤j≤m,n為地標總數(shù),m為網(wǎng)絡(luò)節(jié)點總數(shù)。所有地標均執(zhí)行該計算,得到所有地標各自的候選集合。
(8)計算所有候選集合中各網(wǎng)絡(luò)節(jié)點的權(quán)重:各地標將上一步得到的所有候選集合發(fā)送至中央服務(wù)器cl,中央服務(wù)器cl統(tǒng)計各網(wǎng)絡(luò)節(jié)點在所有候選集合中出現(xiàn)的總次數(shù),稱為權(quán)重,記網(wǎng)絡(luò)節(jié)點nj的權(quán)重為wj。所述中央服務(wù)器cl或選擇某個地標作為中央服務(wù)器cl,或另部署一臺普通服務(wù)器作為中央服務(wù)器cl,中央服務(wù)器cl沒有任何特殊要求。
(9)計算權(quán)重最大網(wǎng)絡(luò)節(jié)點的概率:中央服務(wù)器cl選出權(quán)重的最大的網(wǎng)絡(luò)節(jié)點,如果權(quán)重最大的網(wǎng)絡(luò)節(jié)點有多個,計算目標x位于這些網(wǎng)絡(luò)節(jié)點的最大概率,將上述網(wǎng)絡(luò)節(jié)點及其最大概率加入集合r。
(10)得出定位結(jié)果:若集合r為空集,通知用戶在某一驗證區(qū)域內(nèi)未搜索到該遠程數(shù)據(jù),定位失??;否則,集合r不為空集,集合r中概率最大的網(wǎng)絡(luò)節(jié)點nj為最終定位結(jié)果,即目標x位于nj,完成遠程數(shù)據(jù)存儲位置驗證。
本發(fā)明提出的定位技術(shù),不要求網(wǎng)絡(luò)節(jié)點間時間延遲與地理距離具有近似的線性關(guān)系。選擇的網(wǎng)絡(luò)節(jié)點與部署的地標越多,定位的精度越高。本發(fā)明使用少量地標便可實現(xiàn)城市級別的定位。
實施例2
遠程數(shù)據(jù)存儲位置驗證方法的技術(shù)方案同實施例1,其中步驟(1)中計算地標與網(wǎng)絡(luò)節(jié)點間時間延遲的正態(tài)分布的概率密度函數(shù),包括如下步驟:
1a)計算步驟(1)所得集合tij中元素的均值μij與標準差σij,tij代表地標li對網(wǎng)絡(luò)節(jié)點nj發(fā)送k次探測所得時間延遲的集合,1≤i≤n,1≤j≤m,n與m分別為地標和網(wǎng)絡(luò)節(jié)點總數(shù)。時間延遲集合tij中元素的標準差的公式為:
k為地標li對網(wǎng)絡(luò)節(jié)點nj發(fā)送探測所得時間延遲集合tij中元素的個數(shù),tijs為地標li對網(wǎng)絡(luò)節(jié)點nj的第s次探測結(jié)果。
1b)得到集合tij的均值μij與標準差σij,按如下公式計算:
fij(x)即為地標li與網(wǎng)絡(luò)節(jié)點nj的時間延遲正態(tài)分布的概率密度函數(shù)。
正態(tài)分布的概率密度函數(shù)是定位計算中最基礎(chǔ)的。對于給定的一個地標與一個網(wǎng)絡(luò)節(jié)點,如果記錄它們間時間延遲的每個數(shù)據(jù),則會占有大量的存儲空間。而本發(fā)明只存儲它們間時間延遲的正態(tài)分布概率密度函數(shù),則只需要存儲倆個參數(shù),有效節(jié)省存儲空間。
實施例3
遠程數(shù)據(jù)存儲位置驗證方法的技術(shù)方案同實施例1-2,步驟(2)中所述的計算網(wǎng)絡(luò)節(jié)點間的時間延遲相似度,包括如下步驟:
2a)對于網(wǎng)絡(luò)節(jié)點nj,根據(jù)步驟(1)所得時間延遲的平均值,構(gòu)造網(wǎng)絡(luò)節(jié)點nj對所有地標的時間延遲平均值向量(μ1j,μ2j,…,μij,…,μnj),其中μij為地標li與網(wǎng)絡(luò)節(jié)點nj時間延遲的平均值,1≤i≤n,1≤j≤m,n與m分別為地標和網(wǎng)絡(luò)節(jié)點總數(shù)。
2b)利用閔可夫斯基距離計算網(wǎng)絡(luò)節(jié)點nj與其余m-1個網(wǎng)絡(luò)節(jié)點間時間延遲平均值向量的距離,可得m-1個結(jié)果,取最小值作為網(wǎng)絡(luò)節(jié)點nj的時間延遲相似度μj。閔可夫斯基距離公式為:
其中djh表示網(wǎng)絡(luò)節(jié)點nj與網(wǎng)絡(luò)節(jié)點nh的閔可夫斯基距離,μij表示地標li與網(wǎng)絡(luò)節(jié)點nj間時間延遲平均值,1≤i≤n,1≤j≤m,n與m分別為地標和網(wǎng)絡(luò)節(jié)點總數(shù)。
時間延遲相似度是評價定位理論正確率的基礎(chǔ)數(shù)據(jù),一個網(wǎng)絡(luò)節(jié)點的時間延遲相似度值越大,表明該網(wǎng)絡(luò)節(jié)點與其它網(wǎng)絡(luò)節(jié)點相似度越低,則地標越容易區(qū)分該網(wǎng)絡(luò)節(jié)點與其它網(wǎng)絡(luò)節(jié)點,因此理論上定位正確率越高。
實施例4
遠程數(shù)據(jù)存儲位置驗證方法的技術(shù)方案同實施例1-3,步驟(6)中所述的各地標計算目標x位于各網(wǎng)絡(luò)節(jié)點的概率,包括如下步驟:
地標li在步驟(5)中得到其與目標x的時間延遲tix,并代入地標li與各網(wǎng)絡(luò)節(jié)點的正態(tài)分布概率密度函數(shù){fi1(x),fi2(x),…,fij(x),…,fim(x)}中,其中fij(x)為地標li與網(wǎng)絡(luò)節(jié)點nj間時間延遲的正態(tài)分布概率密度函數(shù),按下式得到地標li所計算的目標x位于網(wǎng)絡(luò)節(jié)點nj的概率pri(x=nj):
pri(x=nj)=fij(tix)/fij(μij)
μij是地標li與網(wǎng)絡(luò)節(jié)點nj間時間延遲的平均值,1≤i≤n,1≤j≤m,n,m分別為地標和網(wǎng)絡(luò)節(jié)點的總數(shù)。
本發(fā)明利用多個地標計算目標x位于各網(wǎng)絡(luò)節(jié)點的概率,有效提高定位的可信度。如果部署的地標越多,則定位的正確率高,有效地提高了遠程數(shù)據(jù)存儲位置的定位精度。
實施例5
遠程數(shù)據(jù)存儲位置驗證方法的技術(shù)方案同實施例1-4,步驟(7)中所述的計算各地標的候選集合,包括如下步驟:
7a)設(shè)置閾值δ,可設(shè)置為任意小于1大于0的值,本例中取δ≥0.6。
7b)若地標li所得目標x位于網(wǎng)絡(luò)節(jié)點nj的概率pri(x=nj)>δ,則將網(wǎng)絡(luò)節(jié)點nj和該概率pri(x=nj)加入至地標li的候選集合pi,即pi={(nj,pri(x=nj))|pri(x=nj)>δ,1≤j≤m},1≤i≤n,其中n與m分別為地標和網(wǎng)絡(luò)節(jié)點的總數(shù)。
δ值設(shè)置較小,會增加后續(xù)定位步驟的計算量,但降低定位的出錯率。反之δ值設(shè)置較大,會減少后續(xù)定位步驟的計算量,但提高定位的出錯率。本發(fā)明經(jīng)過多次實驗,給出δ≥0.6是優(yōu)化選擇。
實施例6
遠程數(shù)據(jù)存儲位置驗證方法的技術(shù)方案同實施例1-5,步驟(9)中計算權(quán)重最大網(wǎng)絡(luò)節(jié)點的概率,包括如下步驟:
9a)中央服務(wù)器cl計算權(quán)重的最大值wmax=max(w1,w2,…,wj,…,wm),1≤j≤m,m為網(wǎng)絡(luò)節(jié)點總數(shù),wj為網(wǎng)絡(luò)節(jié)點nj的權(quán)重,max指取括號中元素的最大值。
9b)中央服務(wù)器cl計算wj=wmax的網(wǎng)絡(luò)節(jié)點nj的最大概率pr(x=nj),計算公式為:
pr(x=nj)=max(pr1(x=nj),pr2(x=nj),...,pri(x=nj),...,prn(x=nj))
其中1≤i≤n,n為地標總數(shù),pri(x=nj)為地標li所得目標x位于網(wǎng)絡(luò)節(jié)點nj的概率。
9c)將滿足wj=wmax的nj以及其概率pr(x=nj)組成二維向量(nj,pr(x=nj))加入集合r中,1≤j≤m,m為網(wǎng)絡(luò)節(jié)點總數(shù)。
一個網(wǎng)絡(luò)節(jié)點的權(quán)重越大,表明支持目標x位于該網(wǎng)絡(luò)節(jié)點的地標越多。同時,本發(fā)明根據(jù)所有網(wǎng)絡(luò)節(jié)點的權(quán)重先篩選出目標x最有可能所在的一個或多個網(wǎng)絡(luò)節(jié)點,避免計算目標x位于所有網(wǎng)絡(luò)節(jié)點的最大概率,減少了計算量,因此提高了定位效率。
下面給出一個完整而詳盡的例子,對本發(fā)明進一步詳細說明。
實施例7
遠程數(shù)據(jù)存儲位置驗證方法的技術(shù)方案同實施例1-6。
定位理論模型設(shè)計
本發(fā)明所使用的理論模型,參照圖3,令n個節(jié)點構(gòu)成節(jié)點集合v,|v|=n。對于任意節(jié)點i,j∈v,τij表示節(jié)點i到節(jié)點j的時間延遲。定義ti為節(jié)點i與v中各節(jié)點間時間延遲構(gòu)成的集合,|ti|=m。因為可能
記ti={τi1,τi2,…,τim},τiγ是ti的任意一個元素,1≤γ≤m。t={ti|i∈v},顯然|t|=|v|=n。
定義piγ為:piγ={j|j∈v,τij=τiγ},即piγ是集合v中與節(jié)點i時間延遲為τiγ的節(jié)點集,故
構(gòu)造集合pi={piγ|i∈v}。因為對于v中任意一節(jié)點j,其與i的時間延遲τij=τiγ∈ti,可得j∈piγ,且
定義映射h:ti→pi,由ti和pi的定義可知,h既為單射,又為滿射,故為雙射。
考慮最壞情況,v中的任意一節(jié)點i到其余n-1個節(jié)點的時間延遲都相等,均為τi。但i與其自身的時間延遲為εi,εi≠τi,則|ti|=m=2。pi={pi1,pi2},pi1={i},pi2=v-{i}。定位i時,只能使用除i以外的節(jié)點,故必須使用除節(jié)點i以外的n-1個節(jié)點才可確定i。證明如下:
設(shè)v={1,2,…,n},i為被定位的節(jié)點,1≤i≤n,j為除i的任意一節(jié)點,可得τj=τji,pj={pj1,pj2},其中pj1={j},pj2=v-{j}。將i與j的時間延遲τji代入映射h可得:
h(τji)=pj2=v-{j}
又因為:
(v-{1})∩(v-{2})∩...∩(v-{j})={i}
其中1≤i≠j≤n。
由上兩式可得:
h(τ1i)∩h(τ2i)∩...∩h(τji)={i}
上式即為最壞情況下的定位方程。顯然在最優(yōu)情況下,只使用除節(jié)點i以外的一個節(jié)點即可定位節(jié)點i,其條件為任意兩節(jié)點i與j之間的時間延遲不相等。
本發(fā)明中,定位集合v中任意節(jié)點i,需使用至少1個節(jié)點,節(jié)點即地標??梢姳景l(fā)明原則上只需1臺地標便可定位遠程數(shù)據(jù),成本很低,如果使用更多的地標,則定位的精度更高。
建立延遲匹配庫
建立延遲匹配庫的流程參照圖4,設(shè)被定位的遠程數(shù)據(jù)存儲于目標x,步驟如下:
步驟1、參照圖5,對網(wǎng)絡(luò)節(jié)點發(fā)送探測,并獲取時間延遲
1a)依據(jù)tcp協(xié)議或icmp協(xié)議構(gòu)造探測時間延遲的數(shù)據(jù)包。
1b)所有地標{l1,l2,…,li,…,ln}對地理位置已知各網(wǎng)絡(luò)節(jié)點{n1,n2,…,nj,…,nm}各發(fā)送k次探測,1≤i≤n,1≤j≤m,n為地標總數(shù),m為網(wǎng)絡(luò)節(jié)點總數(shù)。
1c)地標發(fā)送探測后,設(shè)置超時限制t0。若網(wǎng)絡(luò)節(jié)點nj在t0之內(nèi)未響應(yīng)地標li的第s次探測,則li設(shè)置tijs=-1,tijs表示li對節(jié)點nj第s次探測所得時間延遲,1≤i≤n,1≤j≤m,n為地標總數(shù),m為網(wǎng)絡(luò)節(jié)點總數(shù)。
1d)地標li對所有網(wǎng)絡(luò)節(jié)點探測完畢后,獲得地標li對所有網(wǎng)絡(luò)節(jié)點的時間延遲集合tij={tij1,tij2,…,tijs,…,tijk},tijs是地標li對網(wǎng)絡(luò)節(jié)點nj發(fā)送的第s次探測所得時間延遲,1≤i≤n,1≤j≤m,1≤s≤k,n為地標總數(shù),m為網(wǎng)絡(luò)節(jié)點總數(shù),k為發(fā)送探測的總次數(shù)。
步驟2、處理步驟1所得時間延遲,刪除較大和較小值
2a)對于時間延遲集合tij,若其中有元素為負值,將該元素刪去,tij代表地標li對網(wǎng)絡(luò)節(jié)點nj的時間延遲集合,1≤i≤n,1≤j≤m,n與m分別為地標和網(wǎng)絡(luò)節(jié)點總數(shù)。
2b)對于地標li對所有網(wǎng)絡(luò)節(jié)點的時間延遲集合tij,計算其元素的中位數(shù)mij,若其任意元素tijs滿足:|tijs-mij|>0.5*mij,則將tijs從集合tij中刪除,tijs為地標li對網(wǎng)絡(luò)節(jié)點nj的第s次探測結(jié)果。
2c)經(jīng)過2a與2b兩小步之后,若地標li對所有網(wǎng)絡(luò)節(jié)點的時間延遲集合tij為空,為其添加一個元素無窮大∞。
步驟3、計算時間延遲的正態(tài)分布的概率密度函數(shù)
3a)經(jīng)過步驟2處理后,計算集合tij中元素的平均值μij與標準差σij,tij代表地標li對網(wǎng)絡(luò)節(jié)點nj探測結(jié)果的集合,1≤i≤n,1≤j≤m,n與m分別為地標和網(wǎng)絡(luò)節(jié)點總數(shù)。標準差的公式為:
k為集合tij中元素的個數(shù),tijs為地標li對網(wǎng)絡(luò)節(jié)點nj的第s次探測結(jié)果。
3b)得到集合tij的平均值μij與標準差σij后,地標li與網(wǎng)絡(luò)節(jié)點nj間正態(tài)分布的概率密度函數(shù)fij(x)的公式如下:
步驟4、計算網(wǎng)絡(luò)節(jié)點間的時間延遲相似度
4a)對于網(wǎng)絡(luò)節(jié)點nj,由步驟3可得其時間延遲平均值的n維向量(μ1j,μ2j,…,μij,…,μnj),其中μij為地標li與網(wǎng)絡(luò)節(jié)點nj時間延遲的平均值,1≤i≤n,1≤j≤m,n與m分別為地標和網(wǎng)絡(luò)節(jié)點總數(shù)。
4b)利用閔可夫斯基距離分別計算節(jié)點nj與其余m-1個網(wǎng)絡(luò)節(jié)點間n維向量的距離,可得m-1個結(jié)果,取最小值作為節(jié)點nj的時間延遲相似度μj。閔可夫斯基距離公式為:
其中djh表示網(wǎng)絡(luò)節(jié)點nj與網(wǎng)絡(luò)節(jié)點nh的閔可夫斯基距離,μij表示地標li與網(wǎng)絡(luò)節(jié)點nj間時間延遲平均值,1≤i≤n,1≤h≤m,j≠h,n與m分別為地標和網(wǎng)絡(luò)節(jié)點總數(shù)。
步驟5、計算各網(wǎng)絡(luò)節(jié)點的時間延遲波動
對于網(wǎng)絡(luò)節(jié)點nj,由步驟3可得其時間延遲標準差的n維向量(σ1j,σ2j,…,σij,…,σnj),其中σij為地標li與網(wǎng)絡(luò)節(jié)點nj間時間延遲的標準差,1≤i≤n,n為地標總數(shù)。將向量求和并除以n,得nj的時間延遲波動σj。
請求遠程數(shù)據(jù)并獲取時間延遲
參照圖6,各地標對目標x執(zhí)行pdp協(xié)議發(fā)送挑戰(zhàn),以地標li為例具體如下:
步驟6、地標生成挑戰(zhàn)并發(fā)送給目標
地標li從文件f分塊索引集合[1,p]中隨機選取c個塊索引{s1,s2,…,sc},為每一個索引生成一個隨機數(shù),將兩者一起生成挑戰(zhàn)發(fā)送給目標x,并開始計時。f是被進行驗證存儲位置的文件,p是文件f的分塊數(shù),sc是第c個塊索引,文件f便是遠程數(shù)據(jù)。
步驟7、目標根據(jù)挑戰(zhàn)做出響應(yīng)
目標x根據(jù)其所存儲的文件數(shù)據(jù){f,ф},生成完整證據(jù)p,并將計算耗時θix添加至數(shù)據(jù)包,一并返回給地標li。其中ф為同態(tài)標簽集合。
步驟8、地標接收目標的響應(yīng)計算時間延遲
若地標li未接收到目標x的響應(yīng),則置時間延遲tix=-1。
若地標li接收到目標x響應(yīng)的證據(jù)p以及θix后,結(jié)束計時,得到總時間延遲τix,隨后驗證p是否正確。若p正確,計算tix=τix-θix;若p不正確,則目標x未完整存儲被定位的遠程數(shù)據(jù),通知用戶,定位結(jié)束。
計算目標所在位置
參照圖7,本步驟的具體實現(xiàn)如下:
步驟9、計算目標位于各網(wǎng)絡(luò)節(jié)點的概率
地標li將步驟8中所得時間延遲tix依次代入其所存儲的各正態(tài)分布的概率密度函數(shù){fi1(x),fi2(x),…,fij(x),…,fim(x)}中,按下式得到目標x位于網(wǎng)絡(luò)節(jié)點nj的概率pri(x=nj):
pri(x=nj)=fij(tix)/fij(μij)
其中fij(x)為地標li與網(wǎng)絡(luò)節(jié)點nj間時間延遲的正態(tài)分布概率密度函數(shù),μij是地標li與節(jié)點nj間時間延遲的平均值,1≤i≤n,1≤j≤m,n,m分別為地標和網(wǎng)絡(luò)節(jié)點的總數(shù)。
步驟10、計算候選集合
10a)設(shè)置閾值δ,可設(shè)置為任意小于1大于0的值,δ≥0.5。
10b)若步驟9中地標li所得目標x位于網(wǎng)絡(luò)節(jié)點nj的概率pri(x=nj)>δ,則將節(jié)點nj加入地標li的候選集合pi,并記錄其概率pri(x=nj),即pi={(nj,pri(x=nj))|pri(x=nj)>δ,1≤j≤m},1≤i≤n,n與m分別為地標和網(wǎng)絡(luò)節(jié)點的總數(shù)。
步驟11、計算候選集合中各網(wǎng)絡(luò)節(jié)點的權(quán)重
將所有地標(l1,l2,…,li,…,ln)得到的所有候選集合p={p1,p2,…,pi,…,pn}發(fā)送至中央服務(wù)器cl。pi代表li所得候選集合,1≤i≤n,n為地標總數(shù)。中央服務(wù)器cl統(tǒng)計網(wǎng)絡(luò)節(jié)點nj在集合p中各元素中出現(xiàn)的總次數(shù),稱為權(quán)重wj,1≤j≤m,m為網(wǎng)絡(luò)節(jié)點總數(shù)。
步驟12、計算權(quán)重最大網(wǎng)絡(luò)節(jié)點的概率
12a)中央服務(wù)器cl計算權(quán)重的最大值wmax=max(w1,w2,…,wj,…,wm),1≤j≤m,m為網(wǎng)絡(luò)節(jié)點總數(shù),wj為網(wǎng)絡(luò)節(jié)點nj的權(quán)重。
12b)中央服務(wù)器cl計算wj=wmax的網(wǎng)絡(luò)節(jié)點nj的最大概率pr(x=nj),計算公式為pr(x=nj)=max(pr1(x=nj),pr2(x=nj),…,pri(x=nj),…,prn(x=nj)),1≤i≤n,n為地標總數(shù),pri(x=nj)為地標li所得目標x位于網(wǎng)絡(luò)節(jié)點nj的概率。
12c)將滿足wj=wmax的nj以及其概率pr(x=nj)組成二維向量(nj,pr(x=nj))加入集合r中,1≤j≤m,m為網(wǎng)絡(luò)節(jié)點總數(shù)。
步驟13、得出定位結(jié)果
若集合r為空集,通知用戶在某一驗證區(qū)域內(nèi)未搜索到該遠程數(shù)據(jù),定位失??;否則,集合r中概率pr(x=nj)最大的網(wǎng)絡(luò)節(jié)點nj為最終定位結(jié)果,即目標x位于網(wǎng)絡(luò)節(jié)點nj,定位結(jié)束。
本發(fā)明構(gòu)造了將時間延遲直接映射為地理位置的定位方法,不同于現(xiàn)有技術(shù)先將時間延遲映射為地理距離,再將地理距離映射為地理位置的方法。由于在實際的環(huán)境中,時間延遲與地理距離間的線性關(guān)系較弱,因此現(xiàn)有技術(shù)的誤差較大,而本發(fā)明避免了這一映射,故降低了誤差,精度較高。
下面通過仿真,對本發(fā)明的技術(shù)效果再作說明。
實施例8
遠程數(shù)據(jù)存儲位置驗證方法的技術(shù)方案同實施例1-7。
驗證遠程數(shù)據(jù)存儲位置的實驗
在使用開發(fā)的系統(tǒng)進行實驗時,選擇我國除港澳臺外所有省會城市,直轄市等共計36個城市作為網(wǎng)絡(luò)節(jié)點與目標所在地。所使用的8臺地標分布于北京,上海,成都等8個城市。
建立延遲匹配庫
利用所有地標對各網(wǎng)絡(luò)節(jié)點ip發(fā)送探測,共分10個時段進行,間隔1小時。每個時段內(nèi),8個地標對36個目標發(fā)送80次syn探測,發(fā)送間隔為1分鐘。其中有少數(shù)探測超時,記錄為-1。
因為所收集的時間延遲中存在異常值,在建立延遲匹配庫前,需對數(shù)據(jù)進行處理。每個地標——目標對擁有80個時間延遲數(shù)據(jù),刪除其中的過小值與過大值后,計算其余值的平均值,標準差得到正態(tài)分布概率密度函數(shù)。計算時間延遲相似度與時間延遲波動,建立延遲匹配庫。
將上述所得延遲匹配庫視為二維數(shù)組,地標節(jié)點作為其行索引,目標節(jié)點作為列索引。
使用三臺地標定位
要強調(diào)的是,本發(fā)明定位時不能使用同一位置的多個地標。因為它們所得的結(jié)果相似度較高,會增加目標的權(quán)重,影響最終定位結(jié)果。
僅闡述位于北京,上海和成都的3臺地標進行的定位,增加地標與使用不同地標的實驗類似。定位時,各地標分別對同一目標發(fā)送挑戰(zhàn),等待目標響應(yīng)。根據(jù)響應(yīng)計算時間延遲,并利用正態(tài)分布的概率密度函數(shù)計算目標位于各城市(網(wǎng)絡(luò)節(jié)點)的概率。按照本發(fā)明的方法進行計算,得到定位結(jié)果。依次對36個目標進行如上操作,得到實驗數(shù)據(jù)。
數(shù)據(jù)表明,上述使用3臺地標的實驗正確率達到91.7%,有3個目標被錯誤定位,它們分別位于南昌,昆明,呼和浩特。
實驗分別計算了每個網(wǎng)絡(luò)節(jié)點的時間延遲波動與時間延遲相似度,參見圖8。圖中為了觀察的直觀性,取時間延遲相似度的自然對數(shù)。被錯誤定位的目標的特點是,其時間延遲波動(斜線填充)較大,而時間延遲相似度的自然對數(shù)(空白填充)較小??梢杂^察到,共有7個目標的時間延遲波動值大于1.9,其中3個是定位失敗的目標(圖中的黑色填充)。
這表明錯誤定位目標與地標間時間延遲的波動較大,且其它目標到地標間的時間延遲與錯誤定位目標到地標間的時間延遲相近。因此,目標被成功定位的概率與時間延遲波動呈負相關(guān)關(guān)系,而與延遲相似度呈正相關(guān)關(guān)系。
實施例9
遠程數(shù)據(jù)存儲位置驗證方法的技術(shù)方案同實施例1-7。實驗執(zhí)行方式,條件及內(nèi)容同實施例8。
將時間延遲相似度除以時間延遲波動得到定位正確率因子,參見圖9,錯誤定位目標用黑色填充標出,可以發(fā)現(xiàn),定位正確率因子小于2的目標共6個,其中3個為錯誤定位。而定位正確率因子大于2的所有目標均被正確定位。這表明本發(fā)明定義的定位正確率因子可以用來評估本發(fā)明定位的實際正確率。
計算被定位目標間的最短距離,可得該值平均為478km。去掉兩個被正確定位的最遠目標,該均值僅為330km。實驗表明使用3個地標在90%以上的概率可區(qū)分相距330km的目標。并且其中16個目標間最短距離均小于330km,平均185km,它們均被正確定位,即正確率100%。實驗也證明本發(fā)明以較低的成本實現(xiàn)了100~300km粒度下城市級別的定位。
本發(fā)明突破了基于cbg技術(shù)的方案所受的限制,即網(wǎng)絡(luò)節(jié)點間的時間延遲需要與地理距離有較好的線性關(guān)系。而實際的網(wǎng)絡(luò)環(huán)境中,該線性關(guān)系較弱,根據(jù)時間延遲計算所得的地理距離誤差較大,導(dǎo)致距離較近的網(wǎng)絡(luò)節(jié)點無法被區(qū)分。從實驗數(shù)據(jù)上看,本發(fā)明在使用了3個地標的情況下,實現(xiàn)了百公里級別上的準確定位,相對于現(xiàn)有技術(shù)的定位精度有大幅度的提高。以本發(fā)明300km的誤差相比于現(xiàn)有技術(shù)的800km,誤差降低了62.5%。
與基于cbg的方案相比,本發(fā)明使用了更少的資源實現(xiàn)了更高的精度,大大降低了成本。增加地標數(shù)量,可提高定位的正確率。故3臺地標以上的實驗類似,不再列舉。
當僅使用1臺與2臺地標時,定位的正確率僅有44.4%與66.7%。因此推薦使用3臺或3臺以上地標進行定位。
簡而言之,本發(fā)明公開的一種遠程數(shù)據(jù)存儲位置的驗證方法,主要解決現(xiàn)有技術(shù)在定位遠程數(shù)據(jù)時存在的誤差較大、成本高以及要求網(wǎng)絡(luò)上時間延遲與地理距離近似為線性關(guān)系的問題。其實現(xiàn)方案是:計算時間延遲的正態(tài)分布的概率密度函數(shù);計算網(wǎng)絡(luò)節(jié)點間的時間延遲相似度;計算時間延遲波動;建立延遲匹配庫;獲取被定位目標x相對于各地標的時間延遲;各地標計算目標x位于各網(wǎng)絡(luò)節(jié)點的概率;計算各地標的候選集合;計算所有候選集合中各網(wǎng)絡(luò)節(jié)點的權(quán)重;計算權(quán)重最大網(wǎng)絡(luò)節(jié)點的概率;得出遠程數(shù)據(jù)存儲位置的定位結(jié)果。換句話說,在本發(fā)明中所有地標對目標可能所在的網(wǎng)絡(luò)節(jié)點發(fā)送多次探測,收集它們間的時間延遲,計算時間延遲的正態(tài)分布概率密度函數(shù),建立延遲匹配庫。定位時,各地標對目標發(fā)送請求。記錄目標響應(yīng)所需的時間延遲。根據(jù)時間延遲從延遲匹配庫中計算目標可能所在網(wǎng)絡(luò)節(jié)點的概率。最后依據(jù)概率計算結(jié)果。本發(fā)明僅需三臺地標,便可實現(xiàn)城市級別的定位。不僅克服了時間延遲與地理距離在非線性關(guān)系下的誤差,且所需服務(wù)器資源少。可用于定位云端數(shù)據(jù)或直接進行ip定位。
以上描述僅是本發(fā)明的一個具體實例,顯然對于本領(lǐng)域的專業(yè)人員來說,在了解了本發(fā)明內(nèi)容和原理后,都可能在不背離本發(fā)明原理、結(jié)構(gòu)的情況下,進行形式和細節(jié)上的各種修正和改變,但是這些基于本發(fā)明思想的修正和改變?nèi)栽诒景l(fā)明的權(quán)利要求保護范圍之內(nèi)。