本發(fā)明涉及氣象數(shù)據(jù)處理領域,具體而言,涉及一種氣象數(shù)據(jù)處理方法和裝置。
背景技術:
近年來國內國外采用基于CFD(Computational Fluid Dynamics,計算流體動力學)數(shù)值模擬技術(或稱為微尺度數(shù)值模擬技術)進行風資源的評估取得了一定發(fā)展,由于基于CFD技術的風資源評估技術精度較高,因而其應用范圍逐漸擴大。但是到目前為止,這種技術存在如下缺陷:1、邊界條件按照定常、表面均勻的假定設定,不能適用于復雜地形;2、計算所用到的關鍵參量,例如,大氣邊界層參量等,都是主觀設定的,沒有實測數(shù)據(jù)基礎。以上缺陷均影響了CFD的計算精度,特別是在復雜地形條件下的計算結果的精度。近年來由于天氣預報技術和計算機技術的發(fā)展,計算機的運算能力大幅度提高,中尺度天氣預報模式得到迅速發(fā)展與廣泛應用。中尺度天氣預報模式是以觀測數(shù)據(jù)和背景場預測數(shù)據(jù)或再分析數(shù)據(jù)為基礎,通過同化和數(shù)值模擬生成規(guī)則格點數(shù)據(jù)的模式,所以具有觀測數(shù)據(jù)的基礎。用中尺度數(shù)值模擬的數(shù)據(jù)結果來構建微尺度數(shù)值模擬的邊界條件,可以使得微尺度數(shù)值模擬邊界條件具有實測數(shù)據(jù)基礎,因而是國際國內研究人員研究的課題。但是,由于中尺度數(shù)值模擬輸出的時間序列數(shù)據(jù)(通常不少于1年)數(shù)據(jù)量過于龐大,超出目前一般的計算機的運算能力,因此直接采用中尺度數(shù)值模擬的輸出數(shù)據(jù)作為微尺度的邊界條件(也即直接耦合方式)還不具有實用性。因此,如何根據(jù)大量的中尺度時間序列氣象數(shù)據(jù)執(zhí)行微尺度數(shù)值模擬、成為必須要解決的問題。
針對相關技術中直接運用大量中尺度氣象數(shù)據(jù)執(zhí)行微尺度數(shù)據(jù)模擬運算量過大的技術問題,目前尚未提出有效的解決方案。
技術實現(xiàn)要素:
本發(fā)明實施例提供了一種氣象數(shù)據(jù)處理方法和裝置,以至少解決相關技術中直接運用大量中尺度氣象數(shù)據(jù)執(zhí)行微尺度數(shù)據(jù)模擬運算量過大的技術問題。
根據(jù)本發(fā)明實施例的一個方面,提供了一種氣象數(shù)據(jù)處理方法,該方法包括:獲取中尺度時間序列氣象數(shù)據(jù),其中,中尺度時間序列氣象數(shù)據(jù)是對背景場數(shù)據(jù)和實測數(shù)據(jù)執(zhí)行同化和中尺度數(shù)值模擬之后得到的數(shù)據(jù);根據(jù)中尺度時間序列氣象數(shù)據(jù)的格點分布確定與目標區(qū)域對應的微尺度水平模擬區(qū)域并使微尺度水平模擬區(qū)域的邊界之上或邊界的預設范圍內存在中尺度時間序列氣象數(shù)據(jù);將位于邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)進行轉換并按預設順序組成向量集合;生成初始中心點;基于初始中心點使用聚類算法將向量集合進行分組處理并使得到的多個向量組的有效性指標滿足預設條件;確定進行分組處理之后得到的每個向量組的中心點,其中,中心點用于產(chǎn)生微尺度數(shù)值模擬邊界條件的向量。
進一步地,根據(jù)中尺度時間序列氣象數(shù)據(jù)的格點分布確定與目標區(qū)域對應的微尺度水平模擬區(qū)域包括:在中尺度時間序列氣象數(shù)據(jù)的格點分布的地域上確定至少覆蓋目標區(qū)域的區(qū)域為微尺度水平模擬區(qū)域,其中,微尺度水平模擬區(qū)域為需要進行微尺度數(shù)值模擬的區(qū)域在水平面投影的矩形區(qū)域,微尺度水平模擬區(qū)域的邊界在預設地理坐標系統(tǒng)中滿足預設位置條件,且在微尺度水平模擬區(qū)域的邊界之上或邊界的預設范圍內存在中尺度時間序列氣象數(shù)據(jù)。
進一步地,將位于邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)進行轉換并按預設順序組成向量集合包括:將每個時點對應的在邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)轉換為一個向量,以得到向量集合。
進一步地,生成初始中心點為在不同的大氣穩(wěn)定度、不同的日間時段以及不同的季節(jié)的中尺度時間序列氣象數(shù)據(jù)中隨機產(chǎn)生。
進一步地,中心點的分量屬性與對應的一個向量組中每個向量的分量屬性相同,其中,聚類算法用于提高中心點與對應的一個向量組中每個向量的相似度。
進一步地,基于初始中心點使用聚類算法將向量集合進行分組處理并使得到的多個向量組的有效性指標滿足預設條件包括:根據(jù)聚類算法的分組結果計算有效性指標;判斷聚類算法的分組結果的有效性指標是否滿足預設條件,其中,有效性指標至少包括以下之一:每個向量組的相似度均值、每個向量組的相似度均方根偏差、任意兩個向量組的中心點之間的相似度。
進一步地,在判斷聚類算法的分組結果的有效性指標是否滿足預設條件之后,該方法還包括:如果判斷出聚類算法的分組結果的有效性指標不滿足預設條件,則對多個向量組中不滿足預設條件的向量組進行合并或拆分以重新分組,并根據(jù)重新分組后的分組結果重新生成中心點;將重新生成的中心點作為初始中心點并使用聚類算法將向量集合進行分組處理直至分組結果的有效性指標滿足預設條件。
進一步地,相似度為由兩個向量對應分量之間的正比例關系確定的標量。
根據(jù)本發(fā)明實施例的另一方面,還提供了一種氣象數(shù)據(jù)處理裝置,該裝置包括:獲取單元,用于獲取中尺度時間序列氣象數(shù)據(jù),其中,中尺度時間序列氣象數(shù)據(jù)是對背景場數(shù)據(jù)和實測數(shù)據(jù)執(zhí)行同化和中尺度數(shù)值模擬之后得到的數(shù)據(jù);第一確定單元,用于根據(jù)中尺度時間序列氣象數(shù)據(jù)的格點分布確定與目標區(qū)域對應的微尺度水平模擬區(qū)域并使微尺度水平模擬區(qū)域的邊界之上或邊界的預設范圍內存在中尺度時間序列氣象數(shù)據(jù);轉換單元,用于將位于邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)進行轉換并按預設順序組成向量集合;生成單元,用于生成初始中心點;分組單元,用于基于初始中心點使用聚類算法將向量集合進行分組處理并使得到的多個向量組的有效性指標滿足預設條件;第二確定單元,用于確定進行分組處理之后得到的每個向量組的中心點,其中,中心點用于產(chǎn)生微尺度數(shù)值模擬邊界條件的向量。
進一步地,第一確定單元包括:確定模塊,用于在中尺度時間序列氣象數(shù)據(jù)的格點分布的地域上確定至少覆蓋目標區(qū)域的區(qū)域為微尺度水平模擬區(qū)域,其中,微尺度水平模擬區(qū)域為需要進行微尺度數(shù)值模擬的區(qū)域在水平面投影的矩形區(qū)域,微尺度水平模擬區(qū)域的邊界在預設地理坐標系統(tǒng)中滿足預設位置條件,且在微尺度水平模擬區(qū)域的邊界之上或邊界的預設范圍內存在中尺度時間序列氣象數(shù)據(jù)。
在本發(fā)明實施例中,通過獲取中尺度時間序列氣象數(shù)據(jù),其中,中尺度時間序列氣象數(shù)據(jù)是對背景場數(shù)據(jù)和實測數(shù)據(jù)執(zhí)行同化和中尺度數(shù)值模擬之后得到的數(shù)據(jù);根據(jù)中尺度時間序列氣象數(shù)據(jù)的格點分布確定與目標區(qū)域對應的微尺度水平模擬區(qū)域并使微尺度水平模擬區(qū)域的邊界之上或邊界的預設范圍內存在中尺度時間序列氣象數(shù)據(jù);將位于邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)進行轉換并按預設順序組成向量集合;生成初始中心點;基于初始中心點使用聚類算法將向量集合進行分組處理并使得到的多個向量組的有效性指標滿足預設條件;確定進行分組處理之后得到的每個向量組的中心點,其中,中心點用于產(chǎn)生微尺度數(shù)值模擬邊界條件的向量,解決了相關技術中直接運用大量中尺度氣象數(shù)據(jù)執(zhí)行微尺度數(shù)據(jù)模擬運算量過大的技術問題,進而實現(xiàn)了能夠根據(jù)中尺度氣象數(shù)據(jù)執(zhí)行微尺度數(shù)值模擬的技術效果。
附圖說明
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:
圖1是根據(jù)本發(fā)明實施例的一種可選的氣象數(shù)據(jù)處理方法的流程圖;
圖2是根據(jù)本發(fā)明實施例的另一種可選的氣象數(shù)據(jù)處理方法的流程圖;
圖3是根據(jù)本發(fā)明實施例的一種可選的預設區(qū)域的示意圖;
圖4是根據(jù)本發(fā)明實施例的一種可選的氣象數(shù)據(jù)處理裝置的示意圖。
具體實施方式
為了使本技術領域的人員更好地理解本發(fā)明方案,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分的實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應當屬于本發(fā)明保護的范圍。
需要說明的是,本發(fā)明的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本發(fā)明的實施例能夠以除了在這里圖示或描述的那些以外的順序實施。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產(chǎn)品或設備固有的其它步驟或單元。
術語解釋:
中尺度時間序列氣象數(shù)據(jù),即采用同化技術將時間序列背景場數(shù)據(jù)和測量數(shù)據(jù)轉換為數(shù)值分析數(shù)據(jù),然后通過中尺度數(shù)值模擬技術對上述分析數(shù)據(jù)進行降尺度處理,實現(xiàn)時間分辨率和空間分辨率的提高,這樣得到的規(guī)則格點氣象數(shù)據(jù)為中尺度時間序列氣象數(shù)據(jù)。
目標區(qū)域,是指風資源評估的目標區(qū)域,即要運用基于CFD數(shù)值模擬的風資源評估技術進行數(shù)值模擬的區(qū)域。
微尺度水平模擬區(qū)域,是指將要進行的微尺度數(shù)值模擬的區(qū)域在水平面投影的矩形區(qū)域,微尺度水平模擬區(qū)域的邊界線盡可能與經(jīng)線或緯線平行,且在邊界線上或附近存在中尺度氣象數(shù)據(jù)水平格點。
位置,指由經(jīng)緯度或其它地理坐標系統(tǒng)確定的一組格點的水平地理標識。
向量,是指由同一時點的所有在微尺度水平模擬區(qū)域邊界上或附近的中尺度時間序列氣象數(shù)據(jù)經(jīng)數(shù)據(jù)轉換和有序組合形成的向量。
中心點,所謂某向量組的中心點,是指所構造的一個向量,它與本組所有向量都有很高的相似度。
聚類,是指將物理或抽象對象的集合分成由類似的對象組成的多個類的過程。
WRF,是指一種中尺度天氣預報模式(Whether Research and Forecasting)。
根據(jù)本申請實施例,提供了一種氣象數(shù)據(jù)處理方法。
圖1是根據(jù)本發(fā)明實施例的一種可選的氣象數(shù)據(jù)處理方法的流程圖,如圖1所示,該方法包括如下步驟:
步驟S101,獲取中尺度時間序列氣象數(shù)據(jù)。其中,中尺度時間序列氣象數(shù)據(jù)是對背景場數(shù)據(jù)和實測數(shù)據(jù)執(zhí)行同化和中尺度數(shù)值模擬之后得到的數(shù)據(jù)??蛇x地,可以獲取預設時間段內的中尺度時間序列氣象數(shù)據(jù),預設時間段可以是一個完整年。
步驟S102,根據(jù)中尺度時間序列氣象數(shù)據(jù)的格點分布確定與目標區(qū)域對應的微尺度水平模擬區(qū)域并使微尺度水平模擬區(qū)域的邊界之上或邊界的預設范圍內存在中尺度時間序列氣象數(shù)據(jù)。
步驟S103,將位于邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)進行轉換并按預設順序組成向量集合。其中,對中尺度時間序列氣象數(shù)據(jù)進行數(shù)據(jù)轉換可以生成對分析邊界的流場狀況更直接、更有價值的數(shù)據(jù),然后將水平模擬區(qū)域邊界上或附近的中尺度時間序列氣象數(shù)據(jù)進行數(shù)據(jù)轉換并按照格點、層級、數(shù)據(jù)項的順序組合成向量集合,即中尺度時間系列數(shù)據(jù)向量的集合,下文中簡稱為向量集合。
步驟S104,生成初始中心點。其中,初始中心點可以在不同的大氣穩(wěn)定度、不同的日間時段以及不同的季節(jié)的中尺度時間序列氣象數(shù)據(jù)中隨機產(chǎn)生。
步驟S105,基于初始中心點使用聚類算法將向量集合進行分組處理并使得到的多個向量組的有效性指標滿足預設條件。其中,有效性指標是用于評價聚類效果的指標。
步驟S106,確定進行分組處理之后得到的每個向量組的中心點,其中,中心點用于產(chǎn)生微尺度數(shù)值模擬邊界條件的向量。其中,在進行分組之后,可以計算分組結果的有效性指標是否達到標準,或者說,是否滿足預設條件,如果滿足預設條件,則輸出所有的向量分組和所有中心點,并結束聚類,否則,對分組結果進行調整優(yōu)化之后重新進行聚類。
該實施例通過對背景場數(shù)據(jù)和實測數(shù)據(jù)進行同化和中尺度數(shù)值模擬而獲取中尺度時間序列氣象數(shù)據(jù)后,基于中尺度時間序列氣象數(shù)據(jù)的格點分布確定與目標區(qū)域對應的微尺度水平模擬區(qū)域,建立聚類方法將中尺度時間序列氣象數(shù)據(jù)向量聚類(分組),使多個向量組的有效性指標滿足預設條件?;谶@些向量生成與組內所有數(shù)據(jù)高度相似的向量,用于為目標區(qū)域進行微尺度計算流體動力學(CFD)數(shù)值模擬生成所需的邊界條件,從而避免將所有中尺度時間序列氣象數(shù)據(jù)直接用于產(chǎn)生微尺度數(shù)值模擬邊界條件而造成的目前運算條件所不能承受的開銷,解決了相關技術中直接運用大量中尺度氣象數(shù)據(jù)執(zhí)行微尺度數(shù)據(jù)模擬運算量過大的技術問題,進而實現(xiàn)了能夠根據(jù)中尺度氣象數(shù)據(jù)執(zhí)行微尺度數(shù)值模擬的技術效果。
可選地,根據(jù)中尺度時間序列氣象數(shù)據(jù)的格點分布確定與目標區(qū)域對應的微尺度水平模擬區(qū)域包括:在中尺度時間序列氣象數(shù)據(jù)的格點分布的地域上確定至少覆蓋目標區(qū)域的區(qū)域為微尺度水平模擬區(qū)域,其中,微尺度水平模擬區(qū)域為需要進行微尺度數(shù)值模擬的區(qū)域在水平面投影的矩形區(qū)域,微尺度水平模擬區(qū)域的邊界在預設地理坐標系統(tǒng)中滿足預設位置條件,且在微尺度水平模擬區(qū)域的邊界之上或邊界的預設范圍內存在中尺度時間序列氣象數(shù)據(jù),可選地,預設地理坐標系統(tǒng)可以是經(jīng)緯度地理坐標系統(tǒng),也可以是其它地理坐標系統(tǒng),微尺度水平模擬區(qū)域的邊界在預設地理坐標系統(tǒng)中滿足預設位置條件可以設置為使微尺度水平模擬區(qū)域的邊界在經(jīng)緯度地理坐標系統(tǒng)中與經(jīng)線或緯線盡可能的平行,也即,使邊界與經(jīng)線或緯線的夾角在預設角度之內。
可選地,將位于邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)進行轉換并按預設順序組成向量集合包括:將每個時點對應的在邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)轉換為一個向量,以得到向量集合,可選地,在邊界的預設范圍內為在邊界的附近。
可選地,將位于邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)進行轉換并按預設順序組成向量集合包括:將每個時點對應的在邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)轉換為一個向量,以得到向量集合。
可選地,生成初始中心點為在不同的大氣穩(wěn)定度、不同的日間時段以及不同的季節(jié)的中尺度時間序列氣象數(shù)據(jù)中隨機產(chǎn)生。
可選地,中心點的分量屬性與對應的一個向量組中每個向量的分量屬性相同,其中,聚類算法用于提高中心點與對應的一個向量組中每個向量的相似度,并且,聚類算法的分組結果需要使多個向量組的有效性指標滿足預設條件。
可選地,基于初始中心點使用聚類算法將向量集合進行分組處理并使得到的多個向量組的有效性指標滿足預設條件包括:根據(jù)聚類算法的分組結果計算有效性指標;判斷聚類算法的分組結果的有效性指標是否滿足預設條件,其中,有效性指標至少包括以下之一:每個向量組的相似度均值、每個向量組的相似度均方根偏差、任意兩個向量組的中心點之間的相似度。
可選地,在判斷聚類算法的分組結果的有效性指標是否滿足預設條件之后,該方法還包括:如果判斷出聚類算法的分組結果的有效性指標不滿足預設條件,則對多個向量組中不滿足預設條件的向量組進行合并或拆分以重新分組,并根據(jù)重新分組后的分組結果重新生成中心點;將重新生成的中心點作為初始中心點并使用聚類算法將向量集合進行分組處理直至分組結果的有效性指標滿足預設條件。
可選地,相似度為由兩個向量對應分量之間的正比例關系確定的標量。
下面結合一個應用場景對上述實施例的一種具體實施方式進行描述,如圖2所示,該實施例包括如下步驟:
步驟一,獲取中尺度時間序列氣象數(shù)據(jù):
可選地,可以獲取一個完整年的中尺度時間序列氣象數(shù)據(jù),這些數(shù)據(jù)可以以netCDF文件的形式存儲。在netCDF文件中,每組格點數(shù)據(jù)包含但不限于如下數(shù)據(jù)項(以下命名與WRF模式中的netCDF文件一致),如下是數(shù)據(jù)項的英文名和對應的中文解釋:
Time:日期與時間;
bottom_top:層級序號;
south_north:格點的南北序號;
west_east:格點的東西序號;
U:東西方向的風速分量;
V:南北方向的風速分量;
W:垂直方向的風速分量;
XLAT:緯度;
XLONG:經(jīng)度;
PH:擾動位勢;
PHB:基態(tài)位勢;
HGT:地面高度;
T:擾動位溫;
P:擾動氣壓;
PB:基態(tài)氣壓;
QVAPOR:水汽混合比;
TH2:地面2米高度位溫。
步驟二,確定微尺度水平模擬區(qū)域:
基于中尺度時間序列氣象數(shù)據(jù)的格點分布確定與目標區(qū)域對應的微尺度水平模擬區(qū)域,使水平模擬區(qū)域邊界上或邊界附近存在中尺度時間序列氣象數(shù)據(jù),具體方法可以是:
(1)在分布有中尺度時間序列氣象數(shù)據(jù)的格點的地域上選定一個水平矩形區(qū)域,該水平矩形區(qū)域覆蓋要進行風資源評估的區(qū)域(即目標區(qū)域)。
(2)該微尺度水平模擬區(qū)域左右兩條邊上的中尺度時間序列氣象數(shù)據(jù)的東西序號相等。
(3)該微尺度水平模擬區(qū)域上下兩條邊上的中尺度時間序列氣象數(shù)據(jù)的南北序號相等。
(4)將西南和東北格點的經(jīng)緯度坐標值轉換為TUM坐標值,兩點坐標值分別為(x1,y1)和(x3,y3),則(x1,y1),(x1,y3),(x3,y3),(x3,y1)四個頂點連接而成的矩形為微尺度水平模擬區(qū)域。
如圖3所示,目標區(qū)域是不規(guī)則區(qū)域,微尺度水平模擬區(qū)域是虛線框內的區(qū)域,每個空心的○和實心的●均表示一個格點,一個格點也即一個地理位置,一個格點上有一個時間序列的中尺度氣象數(shù)據(jù),每個中尺度氣象數(shù)據(jù)為一個時刻的氣象數(shù)據(jù),實心的●表示微尺度水平模擬區(qū)域內所包含的格點。
步驟三,數(shù)據(jù)轉換并生成中尺度時間序列向量:
將微尺度水平模擬區(qū)域邊界上或邊界附近的中尺度氣象數(shù)據(jù)按照格點、層級、數(shù)據(jù)項的順序組合成向量集合。在該實施例的應用場景中,每個中尺度氣象數(shù)據(jù)可以按照下面的順序構成向量:
(1)通過轉換數(shù)據(jù)轉換得到如下格點參量:時間t,根據(jù)格點序號i和j確定的向量序號q,層級k,風速分量u,v,w,氣壓p,位勢溫度θ,距地面高度h,其中,t為日期時間,i為格點的南北方向序號,j為格點的東西方向序號,k為格點的垂直方向序號,u為南北方向水平風速分量,v為東西方向水平風速分量,w為垂直方向風速分量,p為氣壓,θ為位溫,h為距地面高度。
轉換公式如下(等式右側的參數(shù)名稱為WRF模式輸出的netCDF文件中的參數(shù)名稱):
t=time;
i=south_north-(min(south_north)),其中min(south_north)是模擬區(qū)域中格點的south_north最小的一個值,1≤i≤I;
j=west_east-(min(west_east)),其中min(west_east)是模擬區(qū)域中格點的west_east最小的一個值,1≤j≤J;
k=bottom_top,1≤k≤K;
u=U,v=V,w=W;
p=PB+P;
θ=T+TH2;
h=PHB+PH-HGT(此處用位勢高度代替幾何高度)
每個中尺度時間序列格點上包含以下數(shù)據(jù):組號、時間(t),格點序號(i,j),層級(k),風速分量(u,v,w),氣壓(p),位勢溫度(θ),距地面高度(h),其中,組號將在下面采用聚類算法進行分組時用到。
(2)生成中尺度時間序列向量。具體方法可以是:
選擇步驟2中由方法(1)、(2)、(3)確定的矩形區(qū)域邊界上的格點,顯然這些格點也在微尺度水平模擬區(qū)域邊界上或附近。然后將i,j2維格點序號轉換為1維序號i,i按照邊界上的格點反時針排列。
將每個時間點的各點數(shù)據(jù):組號、時間(t),格點序號(i,j),層級(k),風速分量(u,v,w),氣壓(p),位勢溫度(θ),距地面高度(h),排列為一個向量,排列順序為:格點序號(先東西后南北)、層級、數(shù)據(jù)項,這樣全部向量數(shù)與時點數(shù)一樣多。
步驟四,生成初始中心點:
在不同的大氣穩(wěn)定度、不同的日間時段以及不同的季節(jié)的中尺度時間序列氣象數(shù)據(jù)中隨機產(chǎn)生初始中心點。具體方法可以是:
第一步,根據(jù)實際的運算能力和精度要求設定初始中心點的個數(shù)k(偶數(shù));第二步,將獲取的中尺度時間序列向量的時間段均等劃分為k/2個時間區(qū)間;第三步,在每個時間區(qū)間內隨機選出兩個時點,其中一個時點t_1的時間區(qū)間在某天的白天,即6:00≤t_1<18:00(當?shù)貢r間),另一個時點t_2的時間區(qū)間在某天的晚上,即18:00≤t_2<24:00或0:00≤t_2<6:00(當?shù)貢r間),其中t_1和t_2為中尺度時間序列向量時間間隔的整倍數(shù);第四步,在所有中尺度時間序列向量中將時點為t_1和t_2的向量選出,這k個向量就是中心點。
步驟五,聚類方法,包括用所定義的相似度來判斷是否具有相似性的方法、定義中心點的方法、建立聚類有效性指標的方法、在聚類迭代過程中不斷調整中心點和分組的方法、為提高性能增加分組和產(chǎn)生新的中心點的方法等不斷調整優(yōu)化的方法。具體方法可以是:
(1)首先,定義兩個向量之間的相似度:
相似度是一種標量,可選地,對于兩個向量,兩個向量的對應維度的正比例關系越相近,兩個向量對應的維度的相似度就越高,兩個向量的相似度越高,或稱為越相似,反之越低。例如,設兩個向量與則與之間的相似度:
如果需要對目標區(qū)域內的風資源進行評估,則參與相似度計算的向量分量只有風速風量。
(2)其次,定義每組向量分組的中心點:
設一組向量其中1≤j≤m,m為本組向量的個數(shù),則本組向量的中心點為
步驟六,有效性指標達到標準:
該實施例中設置分類結果所需要滿足的預設條件為有效性指標達到標準,有效性指標包括:
1)有效性指標1:每個向量種類中所有向量與中心點的相似度的平均值;
2)有效性指標2:每個向量種類中所有向量與中心點的相似度的均方根誤差;
3)有效性指標3:各中心點任意兩個向量的相似度。
預設條件可以設置為:有效性指標的閾值A、B和C,當有效性指標1大于A,有效性指標2小于B,有效性指標3小于C時,視為有效性指標達到預設閾值。
步驟七,優(yōu)化聚類結果:
首先設置迭代次數(shù)預定值,然后開始迭代:
第一步,通過聚類算法進行分組,依次計算所有中尺度時間序列向量與各個中心點的相似度,并將每個中尺度時間序列向量歸到與其相似度最高的中心點所代表的向量組中;
第二步,對每個向量組按照中心點定義計算其新的中心點,并計算各組的有效性指標;
其中,如果有效性指標達到標準設置聚類成功標志并結束聚類,否則,如果迭代次數(shù)小于預定值,則返回第一步,否則設置聚類不成功標志并結束聚類。
為提高性能增加分組和產(chǎn)生新的中心點以進行調整優(yōu)化的方法為:如果聚類不成功,根據(jù)如下三種原因進行調整優(yōu)化:
如果某組的有效性指標1和/或有效性指標2達不到預設標準,則將此組的中心點刪除并生成兩個新的初始中心點;如果是有效性指標3達不到預設標準則將相關兩組的中心點按照對應分量取平均值的方法合并為一個向量作為初始中心點重新聚類。
步驟八,輸出所有中心點和中尺度時間序列向量組:
在有效性指標達到預設標準或者優(yōu)化聚類結果的優(yōu)化次數(shù)達到預設值之后,輸出聚類結果,其中,每個分組的中心點可以用于產(chǎn)生微尺度水平模擬區(qū)域執(zhí)行微尺度數(shù)值模擬的邊界條件。
需要說明的是,在附圖的流程圖雖然示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
根據(jù)本申請實施例,提供了一種氣象數(shù)據(jù)處理裝置。
圖4是根據(jù)本發(fā)明實施例的一種可選的氣象數(shù)據(jù)處理裝置的示意圖,如圖4所示,該裝置包括獲取單元10,第一確定單元20,轉換單元30,生成單元40,分組單元50和第二確定單元60。
獲取單元用于獲取中尺度時間序列氣象數(shù)據(jù),其中,中尺度時間序列氣象數(shù)據(jù)是對背景場數(shù)據(jù)和實測數(shù)據(jù)執(zhí)行同化和中尺度數(shù)值模擬之后得到的數(shù)據(jù);第一確定單元用于根據(jù)中尺度時間序列氣象數(shù)據(jù)的格點分布確定與目標區(qū)域對應的微尺度水平模擬區(qū)域并使微尺度水平模擬區(qū)域的邊界之上或邊界的預設范圍內存在中尺度時間序列氣象數(shù)據(jù);轉換單元用于將位于邊界之上或邊界的預設范圍內的中尺度時間序列氣象數(shù)據(jù)進行轉換并按預設順序組成向量集合;生成單元用于生成初始中心點;分組單元用于基于初始中心點使用聚類算法將向量集合進行分組處理并使得到的多個向量組的有效性指標滿足預設指標;第二確定單元用于確定進行分組處理之后得到的每個向量組的中心點,其中,中心點用于產(chǎn)生微尺度數(shù)值模擬邊界條件的向量。
該實施例解決了相關技術中直接運用大量中尺度氣象數(shù)據(jù)執(zhí)行微尺度數(shù)據(jù)模擬運算量過大的技術問題,進而實現(xiàn)了能夠根據(jù)中尺度氣象數(shù)據(jù)執(zhí)行微尺度數(shù)值模擬的技術效果。
可選地,第一確定單元包括:確定模塊,用于在中尺度時間序列氣象數(shù)據(jù)的格點分布的地域上確定至少覆蓋目標區(qū)域的區(qū)域為微尺度水平模擬區(qū)域,其中,微尺度水平模擬區(qū)域為需要進行微尺度數(shù)值模擬的區(qū)域在水平面投影的矩形區(qū)域,微尺度水平模擬區(qū)域的邊界在預設地理坐標系統(tǒng)中滿足預設位置條件,且在微尺度水平模擬區(qū)域的邊界之上或邊界的預設范圍內存在中尺度時間序列氣象數(shù)據(jù)。
可選地,生成單元用于在不同的大氣穩(wěn)定度、不同的日間時段以及不同的季節(jié)的中尺度時間序列氣象數(shù)據(jù)中隨機產(chǎn)生。
可選地,中心點的分量屬性與對應的一個向量組中每個向量的分量屬性相同。分組單元還用于通過聚類算法提高中心點與對應的一個向量組中每個向量的相似度。
可選地,分組單元還用于根據(jù)聚類算法的分組結果計算有效性指標;判斷聚類算法的分組結果的有效性指標是否滿足預設條件,其中,有效性指標至少包括以下之一:每個向量組的相似度均值、每個向量組的相似度均方根偏差、任意兩個向量組的中心點之間的相似度。
可選地,該裝置還包括:重新分組單元,用于在判斷聚類算法的分組結果的有效性指標是否滿足預設條件之后,如果判斷出聚類算法的分組結果的有效性指標不滿足預設條件,則對至少一個向量組中不滿足預設條件的向量組進行合并或拆分以重新分組,并根據(jù)重新分組后的分組結果重新生成中心點;其中,分組單元還用于將重新生成的中心點作為初始中心點并使用聚類算法將向量集合進行分組處理直至分組結果的有效性指標滿足預設條件。
可選地,相似度為由兩個向量對應分量之間的正比例關系確定的標量。
上述的裝置可以包括處理器和存儲器,上述單元均可以作為程序單元存儲在存儲器中,由處理器執(zhí)行存儲在存儲器中的上述程序單元來實現(xiàn)相應的功能。
存儲器可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內存等形式,如只讀存儲器(ROM)或閃存(flash RAM),存儲器包括至少一個存儲芯片。
上述本申請實施例的順序不代表實施例的優(yōu)劣。
在本申請的上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。在本申請所提供的幾個實施例中,應該理解到,所揭露的技術內容,可通過其它的方式實現(xiàn)。
其中,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。
另外,在本申請各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質中?;谶@樣的理解,本申請的技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可為個人計算機、服務器或者網(wǎng)絡設備等)執(zhí)行本申請各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質。
以上所述僅是本申請的優(yōu)選實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本申請原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本申請的保護范圍。