一種社會調(diào)查數(shù)據(jù)的空間抽樣方法
【專利摘要】本發(fā)明公開了一種社會調(diào)查數(shù)據(jù)的空間抽樣方法,本發(fā)明首先通過分層空間抽樣得到抽樣樣本,然后利用空間點模式分析方法根據(jù)參數(shù)計算結(jié)果判斷抽樣結(jié)果分布的均衡性;如果不符合空間均衡性要求,則重新抽樣,直至得到滿足空間均衡性的抽樣結(jié)果。本發(fā)明將空間抽樣和空間均衡性評價與社會調(diào)查有機結(jié)合,實現(xiàn)了非空間數(shù)據(jù)與空間化技術(shù)的有效銜接。改善了傳統(tǒng)的抽樣方法,為社會調(diào)查提供了較好的輔助支持。通過將抽樣結(jié)果可視化,提供了更為直觀的可視化結(jié)果,并通過空間均衡性評價可以得到更加準(zhǔn)確的判斷。
【專利說明】
-種社會調(diào)查數(shù)據(jù)的空間抽樣方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于空間人文社會學(xué)領(lǐng)域,設(shè)及一種空間抽樣方法,尤其設(shè)及一種社會調(diào) 查數(shù)據(jù)的空間抽樣方法。
【背景技術(shù)】
[0002] 地理信息系統(tǒng)(GIS)技術(shù)被廣泛應(yīng)用于現(xiàn)代測繪、國防軍事、野外數(shù)據(jù)采集等自然 科學(xué)領(lǐng)域,并逐步應(yīng)用于社會調(diào)查、歷史、文化等社會學(xué)領(lǐng)域。GIS具有數(shù)據(jù)綜合、地理模擬 和空間分析等能力。在社會調(diào)查及其數(shù)據(jù)分析過程中,利用GIS技術(shù)輔助傳統(tǒng)的抽樣方法, 是空間社會學(xué)的一個重要研究課題。
[0003] 抽樣是社會調(diào)查的前期手段,通過科學(xué)的抽樣方法,確定被調(diào)查的樣本,使樣本更 加科學(xué)精確,更具有代表性,從而達到優(yōu)化調(diào)查結(jié)果的目的。抽樣是將總體集(連續(xù))按某種 規(guī)律劃分為樣本集(離散)且不損失總體主要信息的方法??臻g抽樣是針對地理空間對象 的,是具有空間關(guān)聯(lián)性的抽樣。抽樣調(diào)查是地理研究、資源評估、環(huán)境問題研究和社會經(jīng)濟 問題研究的重要手段。社會調(diào)查數(shù)據(jù)往往具有空間相關(guān)性,傳統(tǒng)的抽樣調(diào)查方法無法滿足 日益增長的空間抽樣需求。
【發(fā)明內(nèi)容】
[0004] 為了解決上述技術(shù)問題,本發(fā)明提供了一種社會調(diào)查數(shù)據(jù)的空間抽樣方法。
[0005] 本發(fā)明所采用的技術(shù)方案是:一種社會調(diào)查數(shù)據(jù)的空間抽樣方法,其特征在于,包 含W下步驟:
[0006] 步驟1:根據(jù)已有的居委會名稱,界定查詢范圍,利用逆地理編碼查詢到居委會的 經(jīng)締度信息,國內(nèi)的各種在線地圖都根據(jù)國家測繪局標(biāo)準(zhǔn)統(tǒng)一對經(jīng)締度作了糾偏處理,而 百度地圖在運個基礎(chǔ)上用自己的算法做了二次糾偏,基于此,通過百度提供的糾偏API對經(jīng) 締度進行糾偏,匹配在0SM底圖上;
[0007] 步驟 2:
[000引第一層抽樣;
[0009] W市轄區(qū)為單位,采用完全隨機抽樣方法抽樣得到街道辦事處;
[0010] 第二層抽樣;
[0011] 在第一層抽樣的基礎(chǔ)上,W街道辦事處為單位,采用完全隨機抽樣方法抽樣得到 居委會;
[001 ^ 步驟3:空間均觀性評價;
[0013] W每個區(qū)為單位對最終的抽樣結(jié)果使用最鄰近距離法進行空間均衡性評價,如果 抽樣點的分布屬于均勻模式,則表示抽樣結(jié)果合理。如果不合理則重新抽樣,直到合理為 止;最后匯總最終的抽樣結(jié)果。
[0014] 作為優(yōu)選,步驟2中的具體實現(xiàn)包括W下子步驟:
[0015] 步驟2.1:輸入居委會數(shù)據(jù)和抽樣區(qū)域底圖;
[0016] 步驟2.2:選擇一個市轄區(qū);
[0017] 步驟2.3:輸入擬抽取街道辦事處的個數(shù);
[0018] 步驟2.4:輸入每個街道辦事處中擬抽取的居委會個數(shù);
[0019] 步驟2.5:在底圖上顯示抽樣結(jié)果;
[0020] 步驟2.6:如果完成了所有市轄區(qū)的抽樣,則表示抽樣完成;
[0021 ]若是,則執(zhí)行下述步驟2.7;
[0022] 若否,則回轉(zhuǎn)執(zhí)行步驟2.2;
[0023] 步驟2.7:存儲抽樣結(jié)果。
[0024] 作為優(yōu)選,步驟4中所述最鄰近距離法,其具體實現(xiàn)包括W下子步驟:
[0025] 步驟3.1:計算考慮研究區(qū)域的邊緣效應(yīng)的最鄰近距離的期望,公式如下:
[0026]
姜中η是事件的數(shù)量,A為研究區(qū)的面積,P為 研究區(qū)域的邊長;計算平均距離的公式為
i中Si為研究區(qū)域中的事件, cUin是任意一點到其最鄰近點的距離;
[0027] 步驟3.2:計算最鄰近指數(shù)
[002引步驟3.3:均衡性評價,若R= 1,說明觀測事件過程來自于完全隨機模式,屬于隨機 分布;若R<1,說明觀測事件在空間上相互接近,屬于空間聚集模式;若R〉l,說明觀測事件在 空間商相互排斥地趨于均勻分布,屬于空間均勻模式。
[0029] 本發(fā)明基于社會調(diào)查數(shù)據(jù),在社會調(diào)查與數(shù)據(jù)分析中引入本發(fā)明,將空間抽樣和 空間均衡性評價與社會調(diào)查有機結(jié)合,實現(xiàn)了非空間數(shù)據(jù)與空間化技術(shù)的有效銜接。所開 發(fā)的空間抽樣軟件改善了傳統(tǒng)的抽樣方法,將抽樣框內(nèi)嵌在軟件中,為社會調(diào)查提供了較 好的輔助支持。通過將抽樣結(jié)果在軟件界面空間可視化,提供了更為直觀的可視化結(jié)果,并 通過空間均衡性評價可W得到更加準(zhǔn)確的判斷。
【附圖說明】
[0030] 圖1是本發(fā)明實施例的整體流程圖。
[0031 ]圖2是本發(fā)明實施例的完全隨機抽樣方法流程圖。
[0032] 圖3是本發(fā)明實施例的空間均衡性評價最鄰近距離算法流程圖。
【具體實施方式】
[0033] 為了便于本領(lǐng)域普通技術(shù)人員理解和實施本發(fā)明,下面結(jié)合附圖及實施例對本發(fā) 明作進一步的詳細描述,應(yīng)當(dāng)理解,此處所描述的實施示例僅用于說明和解釋本發(fā)明,并不 用于限定本發(fā)明。
[0034] 本發(fā)明提供的方法能夠用計算機軟件技術(shù)實現(xiàn)流程。參見圖1、圖2和圖3,由于利 用逆地理編碼查詢到居委會的經(jīng)締度信息屬于數(shù)據(jù)準(zhǔn)備階段,實施例W-個抽樣并評價結(jié) 果的過程為例對本發(fā)明的流程進行具體的闡述。
[0035] 步驟1:在軟件界面依次導(dǎo)入實驗數(shù)據(jù)jwhsampl ing. shp和area. shp,實現(xiàn)武漢市 全部居委會在13個市轄區(qū)內(nèi)的空間可視化。
[0036] 步驟2:在頁面上方選擇抽樣平臺頁面,點擊隨機抽樣,彈出抽樣對話框,下拉選擇 抽樣的市轄區(qū),默認(rèn)為江岸區(qū),選擇洪山區(qū)(可按照任意順序,最終13個區(qū)都抽到并最終結(jié) 果的分布都均勻即可),輸入需要抽取的街道辦事處的個數(shù)(如4個);然后輸入每個街道辦 事處需要抽取的居委會的數(shù)目(如2個);點擊確定,在對話框中得到被抽取到的居委會的ID 和名稱,具體如下:
[0037] 1141群聯(lián)村委會
[0038] 1150新村村委會
[0039] 1171曙光居民委員會
[0040] 1170關(guān)東社區(qū)居委會
[0041] 1009建材社區(qū)居委會
[0042] 1008張家灣社區(qū)居委會
[0043] 1158新農(nóng)村委會
[0044] 1159新建村委會
[0045] 此時可W在地圖上看到被抽取的點高亮顯示,至此洪山區(qū)的抽樣完成。
[0046] 步驟3,抽樣點空間均衡性評價。繼續(xù)點擊測算空間均衡性按鈕,得到最鄰近距離 法中判斷空間分布模式的R值。
[0047] 首先計算任意一點到其最鄰近點的距離dmin。然后計算平均距離,計算公式為
庚中Si為研究區(qū)域中的事件,η是事件的數(shù)量。接著在CSR模式中計算期 望
,其中A為研究區(qū)的面積。考慮研究區(qū)域的邊緣效應(yīng),公式可W改寫為
其中P為研究區(qū)域的邊長。最后計算最鄰近指數(shù)
根據(jù)W上步驟,得到R = 〇. 710547822763475。由于R<1,判斷分布模式為聚集 模式,即:抽樣結(jié)果點的空間分布不均衡,需返回重新抽樣。
[004引步驟4:點擊清除按鈕,清除上一次的抽樣結(jié)果,重新點擊確定,得到新的抽樣結(jié) 果。
[0049] 1090春和村委會
[00加]1078白稱村委會 [0化1] 1153王店社區(qū)居委會
[0化2] 1159新建村委會
[0化3] 1170關(guān)東社區(qū)居委會
[0化4] 1173關(guān)南居委會
[0化日]996華農(nóng)東社區(qū)居委會 [0化6] 1000通惠社區(qū)居委會
[0化7] 同時測算空間均衡性,R=1.14008547051084,R〉1,分布模式為均勻,故結(jié)果可w 被采納。
[005引步驟5:不斷重復(fù),直到抽樣結(jié)果空間分布均勻為止,保留最后的抽樣結(jié)果。
[0059] 步驟6:重復(fù)步驟2到步驟4,完成13個區(qū)的抽樣,保留最后的抽樣結(jié)果。
[0060] 步驟7:抽樣完成。
[0061] 本發(fā)明基于空間人文社會學(xué),研究GIS在社會科學(xué)中的應(yīng)用,提出一種空間抽樣并 將抽樣結(jié)果空間可視化,同時判斷抽樣結(jié)果的空間分布均衡性的方法。本方法充分考慮了 抽樣的科學(xué)性和抽樣結(jié)果分布的空間均衡性,通過完全隨機的方法抽取樣本并通過均衡性 評價判斷抽樣結(jié)果的代表性和合理性。通過本發(fā)明獲得的抽樣結(jié)果更加科學(xué)、精確,更具有 實用性。
[0062] 應(yīng)當(dāng)理解的是,本說明書未詳細闡述的部分均屬于現(xiàn)有技術(shù)。
[0063] 應(yīng)當(dāng)理解的是,上述針對較佳實施例的描述較為詳細,并不能因此而認(rèn)為是對本 發(fā)明專利保護范圍的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的啟示下,在不脫離本發(fā)明權(quán) 利要求所保護的范圍情況下,還可W做出替換或變形,均落入本發(fā)明的保護范圍之內(nèi),本發(fā) 明的請求保護范圍應(yīng)W所附權(quán)利要求為準(zhǔn)。
【主權(quán)項】
1. 一種社會調(diào)查數(shù)據(jù)的空間抽樣方法,其特征在于,包含以下步驟: 步驟1:根據(jù)已有的居委會名稱,界定查詢范圍,利用逆地理編碼查詢到居委會的經(jīng)煒 度信息,并對經(jīng)煒度進行糾偏,匹配在OSM底圖上; 步驟2: 第一層抽樣; 以市轄區(qū)為單位,采用完全隨機抽樣方法抽樣得到街道辦事處; 第二層抽樣; 在第一層抽樣的基礎(chǔ)上,以街道辦事處為單位,采用完全隨機抽樣方法抽樣得到居委 會; 步驟3:空間均衡性評價; 以每個區(qū)為單位對最終的抽樣結(jié)果使用最鄰近距離法進行空間均衡性評價,如果抽樣 點的分布屬于均勻模式,則表示抽樣結(jié)果合理;如果不合理則重新抽樣,直到合理為止;最 后匯總最終的抽樣結(jié)果。2. 根據(jù)權(quán)利要求1所述的社會調(diào)查數(shù)據(jù)的空間抽樣方法,其特征在于:步驟2中的具體 實現(xiàn)包括以下子步驟: 步驟2.1:輸入居委會數(shù)據(jù)和抽樣區(qū)域底圖; 步驟2.2:選擇一個市轄區(qū); 步驟2.3:輸入擬抽取街道辦事處的個數(shù); 步驟2.4:輸入每個街道辦事處中擬抽取的居委會個數(shù); 步驟2.5:在底圖上顯示抽樣結(jié)果; 步驟2.6:如果完成了所有市轄區(qū)的抽樣,則表示抽樣完成; 若是,則執(zhí)行下述步驟2.7; 若否,則回轉(zhuǎn)執(zhí)行步驟2.2; 步驟2.7:存儲抽樣結(jié)果。3. 根據(jù)權(quán)利要求1所述的社會調(diào)查數(shù)據(jù)的空間抽樣方法,其特征在于:步驟3中所述最 鄰近距離法,其具體實現(xiàn)包括以下子步驟: 步驟3.1:計算考慮研究區(qū)域的邊緣效應(yīng)的最鄰近距離的期望,公式如下:其中η是事件的數(shù)量,A為研究區(qū)的面積,p為研究 區(qū)域的邊長;計算平均距離的公式為,其中SiS研究區(qū)域中的事件,dmin 是任意一點到其最鄰近點的距離;步驟3.3:均衡性評價,若R=l,說明觀測事件過程來自于完全隨機模式,屬于隨機分 布;若R〈l,說明觀測事件在空間上相互接近,屬于空間聚集模式;若R>1,說明觀測事件在空 間商相互排斥地趨于均勻分布,屬于空間均勻模式。
【文檔編號】G06F17/30GK105825338SQ201610152789
【公開日】2016年8月3日
【申請日】2016年3月17日
【發(fā)明人】秦昆, 李琰, 林曾
【申請人】武漢大學(xué)