亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方法及終端的制作方法

文檔序號:10553358閱讀:881來源:國知局
一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方法及終端的制作方法
【專利摘要】本發(fā)明提供一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方法及終端,所述方法包括以下步驟:步驟100,輸入需要處理的曲線數(shù)據(jù);步驟200,對輸入的曲線數(shù)據(jù)進行初步篩選處理,獲取初步篩選數(shù)據(jù)段集合;步驟300,對所述初步篩選數(shù)據(jù)段集合中的曲線數(shù)據(jù)進行二次篩選處理,獲取匹配曲線片段并輸出。本發(fā)明通過對曲線數(shù)據(jù)進行兩次篩處理,從而獲取高相似度的匹配曲線;在二次篩選處理過程中通過對曲線數(shù)據(jù)進行水平伸縮處理和采用波峰波谷識別法將波峰波谷區(qū)域設置為敏感識別區(qū)域,并加大對波峰波谷區(qū)域的相似度識別權值,再利用加權DTW距離計算法進行距離值計算,使得距離值的計算相似度準確性更高。
【專利說明】
一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方法及終端
技術領域
[0001] 本發(fā)明涉及大數(shù)據(jù)領域,尤其涉及一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方 法及終端。
【背景技術】
[0002] 目前,相似曲線匹配問題的實現(xiàn)方案有以下三種:(1)皮爾遜相關系數(shù)法;(2)最小 二乘法曲線擬合法;(3)DTW(Dynamic Time Warping)動態(tài)時間規(guī)整算法,其中,皮爾遜相關 系數(shù)法和最小二乘曲線擬合法只能處理長度相等的兩個曲線,而對于長度不同的曲線在計 算相似度時會產(chǎn)生極大的誤差,這種誤差基本導致結果失去參考價值;DTW算法雖然能夠很 好的解決兩段長度不相等的離散曲線相似度計算問題,但其無法避免在曲線上的細節(jié)在處 理過程中干擾相似度的計算。

【發(fā)明內(nèi)容】

[0003] 為了解決上述問題,本發(fā)明提供一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方法 及終端的設計方案。
[0004] -種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方法,所述方法包括:
[0005] 輸入需要處理的曲線數(shù)據(jù);
[0006] 對輸入的曲線數(shù)據(jù)進行初步篩選處理,獲取初步篩選數(shù)據(jù)段集合;
[0007] 對所述初步篩選數(shù)據(jù)段集合中的曲線數(shù)據(jù)進行二次篩選處理,獲取匹配曲線片段 并輸出;
[0008] 其中,對所述初步篩選數(shù)據(jù)段集合中的曲線數(shù)據(jù)進行二次篩選處理,具體包括:對 曲線數(shù)據(jù)進行正則化處理、平滑處理、垂直伸縮處理和水平伸縮處理,獲取拉伸后的曲線數(shù) 據(jù);識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域;對敏感區(qū)域的曲線數(shù)據(jù)進行加權DTW距離計 算,并計算產(chǎn)生距離值;對所述距離值進行DTW距離排序,獲取匹配曲線片段并輸出。
[0009] 具體的,所述對輸入的曲線數(shù)據(jù)進行初步篩選處理,具體包括:對輸入的曲線數(shù)據(jù) 進行正則化處理、平滑處理和垂直伸縮處理,獲取拉伸后的曲線數(shù)據(jù);對所述拉伸后的曲線 數(shù)據(jù)進行DTW距離計算,并計算產(chǎn)生距離值;對所述距離值進行DTW距離排序,獲得初步篩選 數(shù)據(jù)段集合。
[0010] 具體的,識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域,具體包括:通過高斯濾波法將所 述拉伸后的曲線數(shù)據(jù)處理并得到平滑的曲線;設原始的曲線數(shù)據(jù)序列為x(t),經(jīng)過濾波處 理后的曲線數(shù)據(jù)序列為f(t),則有: 2(7
[0011] x(t) = ^ Wtx(t + I) i=-2cr
[0012] 其中
,〇表示濾波步長參數(shù),i表示數(shù)據(jù)節(jié)點w的下標,j 與i含義相同;設曲線數(shù)據(jù)總長度為len,則d二0.1 * kid表示經(jīng)驗數(shù)據(jù);根據(jù)曲線的斜 率判斷波峰和波谷的位置,若某一點的前向斜率與后向斜率相反,則該點為波峰或波谷點。
[0013] 具體的,識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域還包括:若兩個相鄰的波峰波谷 之間的垂直距離差小于預設閾值9,則剔除該波峰波谷;當確定波峰和波谷點后,設波峰或 波谷點的坐標為《 i,則坐標區(qū)間為[? i-0,《 i+0]的所有采樣點均被認為屬于敏感區(qū)域, 其中0表示敏感區(qū)域識別區(qū)間參數(shù)。
[0014] 具體的,對敏感區(qū)域的曲線數(shù)據(jù)進行加權DTW距離計算包括:設Y(i)為參考曲線的 數(shù)據(jù)集,Z(j)為對比曲線的數(shù)據(jù)集,y(i)為參考曲線數(shù)據(jù)集的敏感區(qū)域標記集合,z(j)為對 比曲線數(shù)據(jù)集的敏感區(qū)域標記集合,有以下定義: 〇 i/" F(i)e非敏感區(qū)域
[0015] >;(〇 = 1 1 波峰敏感區(qū)域 ?-1 波谷敏感區(qū)域 〇 if Z(i)e非敏感區(qū)域
[0016] z(i) = 1 i/"Z(〇e 波峰敏感區(qū)域 1 i/Z(〇e波谷敏感區(qū)域
[0017] 則若警告DTW路徑搜索后得到匹配點對Y(a)與Z(b),其中,a和b為數(shù)據(jù)集索引下 標,則該點對的距離S為: (p(Y^a),Z(hJ) ,'/'y(a)二 z⑷=0 (y(a),Z(/})) _ p - z{h) ^ 0
[0019] 其中,少(?)表示距離度量函數(shù),屮(?Z(b))表示歐式距離,且
,p(〇<p<l)表示敏感區(qū)域加權系數(shù)
[0020] -種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配終端,所述終端包括:
[0021] 輸入模塊,用于輸入需要處理的曲線數(shù)據(jù);初步篩選模塊,用于對輸入的曲線數(shù)據(jù) 進行初步篩選處理,獲取初步篩選數(shù)據(jù)段集合;二次篩選模塊,用于對所述初步篩選數(shù)據(jù)段 集合中的曲線數(shù)據(jù)進行二次篩選處理,獲取匹配曲線片段并輸出;其中,所述二次篩選模塊 包括:
[0022] 處理單元,用于對曲線數(shù)據(jù)進行正則化處理、平滑處理、垂直伸縮處理和水平伸縮 處理、獲取拉伸后的曲線數(shù)據(jù);
[0023]識別單元,用于識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域;
[0024]加權計算單元,用于對敏感區(qū)域關注識別的曲線數(shù)據(jù)進行加權DTW距離計算、并計 算產(chǎn)生距離值;
[0025]排序單元,用于對所述距離值進行DTW距離排序、獲取匹配曲線片段并輸出。
[0026]具體的,所述初步篩選模塊包括:
[0027] 處理單元,用于對輸入的曲線數(shù)據(jù)進行正則化處理、平滑處理和垂直伸縮處理、獲 取拉伸后的曲線數(shù)據(jù);
[0028] 計算單元,用于對所述拉伸后的曲線數(shù)據(jù)進行DTW距離計算、并計算產(chǎn)生距離值;
[0029] 排序單元,用于對所述距離值進行DTW距離排序、獲得初步篩選數(shù)據(jù)段集合。
[0030] 具體的,所述識別單元具體用于:通過高斯濾波法將所述拉伸后的曲線數(shù)據(jù)處理 并得到平滑的曲線;設原始的曲線數(shù)據(jù)序列為x(t),經(jīng)過濾波處理后的曲線數(shù)據(jù)序列為 則,則有:
[0031] x(£) = ^ WjX(t + t) i=-20
[0032] 其中:
,〇表示濾波步長參數(shù),i表示數(shù)據(jù)節(jié)點w的下標,j 與i含義相同;設曲線數(shù)據(jù)總長度為len,則3二0.1 *表示經(jīng)驗數(shù)據(jù);根據(jù)曲線的斜 率判斷波峰和波谷的位置,若某一點的前向斜率與后向斜率相反,則該點為波峰或波谷點。
[0033] 具體的,還包括差異度檢測模塊,用于若兩個相鄰的波峰波谷之間的垂直距離差 小于預設閾值9,則剔除該波峰波谷;當確定波峰和波谷點后,設波峰或波谷點的坐標為《 i,則坐標區(qū)間為[?1_0,《1+0]的所有采樣點均被認為屬于敏感區(qū)域,其中0表示敏感區(qū)域 識別區(qū)間參數(shù)。
[0034] 具體的,所述加權計算單元具體用于:設Y(i)為參考曲線的數(shù)據(jù)集,Z(j)為對比曲 線的數(shù)據(jù)集,y(i)為參考曲線數(shù)據(jù)集的敏感區(qū)域標記集合,z(j)為對比曲線數(shù)據(jù)集的敏感 區(qū)域標記集合,有以下定義: '〇 非敏感區(qū)域
[0035] y(i) = 1 yr⑴e波峰敏感區(qū)域 i/1⑴e波谷敏感區(qū)域 〇 if Z⑴e非敏感區(qū)域
[0036] Z(〇二.1 i/Z⑴d皮峰敏感區(qū)域 "_1 i/Z⑴d皮谷敏感區(qū)域
[0037] 則若警告DTW路徑搜索后得到匹配點對Y(a)與Z(b),其中,a和b為數(shù)據(jù)集索引下 標,則該點對的距離S為: (p(y{cL),Z(b)) [f y(0) - z(b) - 0
[0038] a 二,,、,、、 J K J (p p - z(b) ^ 0
[0039] 其中,例:)表示距離度量函數(shù),爐(F(?(h))表示歐式距離,且
P(0<P<1)表示敏感區(qū)域加權系數(shù)。
[0040] 綜上所述,本發(fā)明具有以下有益效果:通過對曲線數(shù)據(jù)進行兩次篩處理,從而獲取 高相似度的匹配曲線;在二次篩選處理過程中通過對曲線數(shù)據(jù)進行水平伸縮處理和采用波 峰波谷識別法將波峰波谷區(qū)域設置為敏感識別區(qū)域,并加大對波峰波谷區(qū)域的相似度識別 權值,再利用加權DTW距離計算法進行距離值計算,使得距離值的計算相似度準確性更高, 本發(fā)明在計算機集群中,通過opencl實現(xiàn)并發(fā)計算,效率更高。
【附圖說明】
[0041] 為了更清楚地說明本發(fā)明實施例中的技術方案,下面將對實施例描述中所需要使 用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于 本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0042] 圖1為本發(fā)明實施例提供的基于大數(shù)據(jù)的趨勢曲線局部特征的識別與匹配方法的 流程圖。
[0043] 圖2為本發(fā)明實施例提供的基于大數(shù)據(jù)的趨勢曲線局部特征的識別與匹配方法中 的步驟200的子流程圖。
[0044] 圖3為本發(fā)明實施例提供的基于大數(shù)據(jù)的趨勢曲線局部特征的識別與匹配方法中 的步驟300的子流程圖。
[0045] 圖4為本發(fā)明實施例提供的基于大數(shù)據(jù)的趨勢曲線局部特征的識別與匹配方法中 的某一樣本曲線的示意圖。
[0046] 圖5為本發(fā)明實施例提供的基于大數(shù)據(jù)的趨勢曲線局部特征的識別與匹配方法中 的某一樣本曲線濾波處理后的示意圖。
[0047] 圖6為本發(fā)明實施例提供的基于大數(shù)據(jù)的趨勢曲線局部特征的識別與匹配方法中 的某一樣本曲線通過波峰波谷識別確定參考曲線和對比曲線的敏感區(qū)域后的示意圖。
[0048] 圖7為圖6中所述的樣本曲線被識別為匹配點對的示意圖。
[0049] 圖8為圖4中所述的樣本曲線進行波峰波谷差異度檢測步驟的示意圖。
[0050] 圖9為本發(fā)明實施例提供的基于大數(shù)據(jù)的趨勢曲線局部特征的匹配終端的功能框 圖。
[0051] 圖10為本發(fā)明實施例提供的基于大數(shù)據(jù)的趨勢曲線局部特征的匹配終端中的二 次篩選模塊的子功能框圖。
[0052] 圖11為本發(fā)明實施例提供的基于大數(shù)據(jù)的趨勢曲線局部特征的匹配終端中的初 次篩選模塊的子功能框圖。
【具體實施方式】
[0053]為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明實施方 式作進一步地詳細描述。
[0054]圖1示出了本發(fā)明實施例一提供的一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方 法的流程圖,包括以下步驟:
[0055]步驟100,輸入需要處理的曲線數(shù)據(jù);
[0056]步驟200,對輸入的曲線數(shù)據(jù)進行初步篩選處理,獲取初步篩選數(shù)據(jù)段集合;
[0057]步驟300,對所述初步篩選數(shù)據(jù)段集合中的曲線數(shù)據(jù)進行二次篩選處理,獲取匹配 曲線片段并輸出。
[0058]請參看圖2,在本發(fā)明的實施例中,所述的對當前曲線數(shù)據(jù)進行初步篩選處理的步 驟,具體包括:
[0059] 步驟201,對輸入的曲線數(shù)據(jù)進行正則化處理、平滑處理和垂直伸縮處理,獲取拉 伸后的曲線數(shù)據(jù);
[0060] 在本實施例中,由于曲線數(shù)據(jù)的絕對值可能不是同一數(shù)量級,而曲線識別則是識 別相對變化趨勢而非絕對變化趨勢,因此需對曲線數(shù)據(jù)進行正則化處理,所述正則化處理, 使得參與識別的曲線數(shù)據(jù)段處于同一數(shù)量級,進而保證之后的DTW距離計算是相對距離計 算;所述平滑處理,可以通過平滑處理過濾掉毛刺細節(jié),而只保留曲線數(shù)據(jù)的大趨勢;所述 垂直伸縮處理,可以拉伸一些形態(tài)相似但價格幅值存在差距的曲線數(shù)據(jù),這樣能夠使當前 曲線數(shù)據(jù)與參考數(shù)據(jù)保持基本相近的幅值再進行DTW距離計算,使得本發(fā)明能夠篩選出這 類"形似"但數(shù)值幅值不相似的曲線。
[0061] 步驟202,對所述拉伸后的曲線數(shù)據(jù)進行DTW距離計算,并計算產(chǎn)生距離值;
[0062]步驟203,對所述距離值進行DTW距離排序,獲得初步篩選數(shù)據(jù)段集合。
[0063]請參看圖3,在本發(fā)明的實施例中,所述的對所述初步篩選數(shù)據(jù)段集合中的曲線數(shù) 據(jù)進行二次篩選處理的步驟,具體包括(其中所述正則化處理、平滑處理、垂直伸縮處理與 初步篩選處理的步驟相同,因此不再詳述):
[0064]步驟301,對初步篩選數(shù)據(jù)段集合的曲線數(shù)據(jù)進行正則化處理、平滑處理、垂直伸 縮處理和水平伸縮處理,獲取拉伸后的曲線數(shù)據(jù);
[0065]在本實施例中,所述水平伸縮處理可以在保持曲線形態(tài)不變的情況下拉伸或者收 縮至任意比例長度,使得參考曲線數(shù)據(jù)和對比曲線數(shù)據(jù)在保持形態(tài)不變的情況下變得長度 相等或近似,在二次篩選處理過程中能夠提高相似度匹配精度。
[0066]步驟302,識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域;
[0067]請參看圖4和圖5,分別示出了某一樣本曲線的示意圖和經(jīng)過濾波處理后的樣本曲 線的示意圖。在圖4和圖5中,該樣本曲線中波峰區(qū)域為N、M,波谷區(qū)域為F。具體的,在本步驟 302中,所述識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域,具體包括:
[0068]步驟3021,通過高斯濾波法將所述拉伸后的曲線數(shù)據(jù)處理并得到較為平滑的曲 線;
[0069]步驟3022,設原始的曲線數(shù)據(jù)序列為x(t),經(jīng)過濾波處理后的曲線數(shù)據(jù)序列為 f⑴,則有:
[0070] f (t) = E?=-2〇- + 〇 r
[0071] 其中,
〇表示濾波步長參數(shù),i表示數(shù)據(jù)節(jié)點w的下標,j 與i含義相同;
[0072] 步驟3023,設曲線數(shù)據(jù)總長度為len,則有二0.1 * Zen,5表示經(jīng)驗數(shù)據(jù);需要 說明的是,9可以根據(jù)實際情況調(diào)整,一般來說8越大,濾波力度越大;
[0073] 步驟3024,當濾波力度足夠時,整個曲線已經(jīng)在各個區(qū)間區(qū)域基本呈單調(diào)遞增或 遞減趨勢,便可以根據(jù)曲線的斜率判斷波峰和波谷的位置,若某一點的前向斜率與后向斜 率相反,則認為該點為波峰或波谷點。
[0074]步驟303,對敏感區(qū)域的曲線數(shù)據(jù)進行加權DTW距離計算,并計算產(chǎn)生距離值;
[0075]請參見圖6示出了某一樣本曲線通過波峰波谷識別確定參考曲線和對比曲線的敏 感區(qū)域后,標記這些區(qū)域的數(shù)據(jù)點,其中,圖6中參考曲線為P、對比曲線為P',參考曲線P的 標記數(shù)據(jù)點為〇、〇',對比曲線P'的標記數(shù)據(jù)點為K、K',在進行DTW距離計算時,如果匹配的 點對同時屬于各自曲線的標記數(shù)據(jù)點構成的敏感區(qū)域,則計算點對距離時乘以一個小于1 的加權系數(shù)。這樣一來,兩段曲線的敏感區(qū)域數(shù)據(jù)點匹配上的越多,最終的加權DTW距離和 就越小,能夠更好地反應曲線敏感區(qū)域對整體形態(tài)相似度的貢獻。具體的,在本步驟303中, 所述對敏感區(qū)域的曲線數(shù)據(jù)進行加權DTW距離計算的方法包括如下:設Y(i)為參考曲線的 數(shù)據(jù)集,Z(j)為對比曲線的數(shù)據(jù)集,對應地有y(i)為參考曲線數(shù)據(jù)集的敏感區(qū)域標記集合, z(j)則為對比曲線數(shù)據(jù)集的敏感區(qū)域標記集合,有以下定義: (〇 i/" F(〇e非敏感區(qū)域
[0076] >'(〇 = I 1 i/r(i)d皮峰敏感區(qū)域 (-1 i/y(i)d皮谷敏感區(qū)域 〇 i/Z(i)e非敏感區(qū)域
[0077] z(〇 = 1 i/Z(〇e波峰敏感區(qū)域 (―1 i/Z(〇e波谷敏感區(qū)域
[0078] 則若警告DTW路徑搜索后得到匹配點對Y(a)與Z(b),其中,a和b為數(shù)據(jù)集索引下 標,則該點對的距離S為: w(Y{a),Z(by) if y(a) - z(b) - 0
[0079] S 二,,、,,、、 )i (p Z{b)j p i/v(a) = z(b) ^ 0
[0080] 其中,#()表示距離度量函數(shù)4(?Z(b))表示歐式距離,且
,P(0<P<1)表示敏感區(qū)域加權系數(shù)。
[0081] 具體的,用戶可以根據(jù)自己的關注程度需求設定合理的P,P值越小表示對敏感區(qū) 域的關注度越大,敏感區(qū)域對最終的DTW距離值影響就越大。例如,圖7所示的點對G,在DTW 路徑搜尋中被識別為匹配點對,并且根據(jù)敏感區(qū)域識別,這兩個數(shù)據(jù)點都屬于各自曲線的 敏感區(qū)域,因此在計算歐式距離時,需要乘以加權系數(shù)P。
[0082]步驟304,對所述距離值進行DTW距離排序,獲取匹配曲線片段并輸出。
[0083]值得一提的是,對應上述識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域的具體步驟,本 發(fā)明一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方法,其還可以包括以下步驟:
[0084]步驟3021',通過高斯濾波法將所述拉伸后的曲線數(shù)據(jù)處理并得到平滑的曲線; [0085]步驟3022',設原始的曲線數(shù)據(jù)序列為x(t),經(jīng)過濾波處理后的曲線數(shù)據(jù)序列為 則,則有:
[0086] x(t) = W[X(t + 0 ,
[0087] 其中,〇表示濾波步長參數(shù),i表示數(shù)據(jù)節(jié)點w的下標,j 與i含義相同;
[0088] 步驟3023',設曲線數(shù)據(jù)總長度為len,則有:0.1 * leil j表示經(jīng)驗數(shù)據(jù);
[0089 ]步驟3024 ',根據(jù)曲線的斜率判斷波峰和波谷的位置,若某一點的前向斜率與后向 斜率相反,則該點為波峰或波谷點;
[0090] 步驟3025',若發(fā)現(xiàn)兩個相鄰的波峰波谷之間的垂直距離差小于預設閾值0,則認 為這一對波峰波谷屬于干擾點,則剔除該波峰波谷;當確定波峰和波谷點后,設波峰或波谷 點的坐標為w i,則坐標區(qū)間為[? i-0, ? i+0]的所有采樣點均被認為屬于敏感區(qū)域,其中0 表示敏感區(qū)域識別區(qū)間參數(shù)。
[0091] 具體的,請參看圖8,由于曲線數(shù)據(jù)經(jīng)過濾波處理,當濾波力度不夠而導致少量一 些干擾波峰或者波谷,如圖中的干擾波峰R1、干擾波谷R2,便可以進行以上相鄰波峰波谷差 異度檢測步驟進行檢測。當發(fā)現(xiàn)兩個相鄰的波峰波谷之間的垂直距離差小于預設閾值9,則 認為這一對波峰波谷屬于干擾點,應當予以剔除;當確定波峰和波谷點后,設波峰的坐標為 w 1、波谷的坐標為〇2,則坐標區(qū)間為[? 1-0,《 1+0]、[ ?2-0,《2+0]的所有采樣點均被認 為屬于敏感區(qū)域,其中0表示敏感區(qū)域識別區(qū)間參數(shù),可根據(jù)需求自行設定。
[0092] 請參看圖9,對應上述基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方法,本發(fā)明還提出 一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配終端,包括:
[0093]輸入模塊11,用于輸入需要處理的曲線數(shù)據(jù);
[0094] 初步篩選模塊12,用于對輸入的曲線數(shù)據(jù)進行初步篩選處理,獲取初步篩選數(shù)據(jù) 段集合;
[0095] 二次篩選模塊13,用于對所述初步篩選數(shù)據(jù)段集合中的曲線數(shù)據(jù)進行二次篩選處 理,獲取匹配曲線片段并輸出。
[0096] 其中,請參看圖10,所述二次篩選模塊13包括:
[0097] 處理單元131,用于對曲線數(shù)據(jù)進行正則化處理、平滑處理、垂直伸縮處理和水平 伸縮處理,獲取拉伸后的曲線數(shù)據(jù);
[0098]識別單元132,用于識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域;
[00"]加權計算單元133,用于對敏感區(qū)域的曲線數(shù)據(jù)進行加權DTW距離計算,并計算產(chǎn) 生距離值;
[0100]排序單元134,用于對所述距離值進行DTW距離排序,獲取匹配曲線片段并輸出。
[0101 ]具體的,請參看圖11,在本發(fā)明實施例中,所述初步篩選模塊11,包括:
[0102] 處理單元111,用于對輸入的曲線數(shù)據(jù)進行正則化處理、平滑處理和垂直伸縮處 理,獲取拉伸后的曲線數(shù)據(jù);
[0103] 計算單元112,用于對所述拉伸后的曲線數(shù)據(jù)進行DTW距離計算,并計算產(chǎn)生距離 值;
[0104] 排序單元113,用于對所述距離值進行DTW距離排序,獲得初步篩選數(shù)據(jù)段集合。
[0105] 本發(fā)明實施例中所述的識別單元132具體用于:通過高斯濾波法將所述拉伸后的 曲線數(shù)據(jù)處理并得到平滑的曲線;設原始的曲線數(shù)據(jù)序列為x(t),經(jīng)過濾波處理后的曲線 數(shù)據(jù)序列為我t),則有: 20-
[0106] f (t) = ^ wtx(t -f i) i = - 2〇'
[0107] 其中,_ 表示濾波步長參數(shù),i表示數(shù)據(jù)節(jié)點w的下標,j 與i含義相同;設曲線數(shù)據(jù)總長度為len,則Q = 〇.l * terwQ,表示經(jīng)驗數(shù)據(jù),可以根據(jù)情況 調(diào)整,一般來說8越大,濾波力度越大;根據(jù)曲線的斜率判斷波峰和波谷的位置,若某一點的 前向斜率與后向斜率相反,則該點為波峰或波谷點。
[0108] 具體的,在本發(fā)明實施例中,還包括差異度檢測模塊14,用于若兩個相鄰的波峰波 谷之間的垂直距離差小于預設閾值9,則剔除該波峰波谷;當確定波峰和波谷點后,設波峰 或波谷點的坐標為《 i,則坐標區(qū)間為[? i-0,《 i+0]的所有采樣點均被認為屬于敏感區(qū) 域,其中0表示敏感區(qū)域識別區(qū)間參數(shù)。
[0109] 本發(fā)明實施例中所述的加權計算單元133具體用于:設Y(i)為參考曲線的數(shù)據(jù)集, Z(j)為對比曲線的數(shù)據(jù)集,y(i)為參考曲線數(shù)據(jù)集的敏感區(qū)域標記集合,z(j)為對比曲線 數(shù)據(jù)集的敏感區(qū)域標記集合,有以下定義: ^ 〇 i/r〇非敏感區(qū)域
[0110] y(0 二.1 i/K(i)e波峰敏感區(qū)域 (一 1 i/ K(i)e波谷敏感區(qū)域 f 〇 ⑴e非敏感區(qū)域
[0111] z(〇 = I 1 i/Z(i)e 波峰敏感區(qū)域 (―1 i/Z(i)e波谷敏感區(qū)域
[0112] 則若警告DTW路徑搜索后得到匹配點對Y(a)與Z(b),其中,a和b為數(shù)據(jù)集索引下 標,則該點對的距離S為: <p(K(a),Z(/))) if y(〇) = z(h) - 0
[0113] 谷= {/.,.、,、、 ,、 (p ? p ify{ci) - z{b) ^ 0
[0114] 其中,識(?)表示距離度量函數(shù),寧(F(?Z(b))表示歐式距離,且
,P(0<P<1)表示敏感區(qū)域加權系數(shù)。
[0115] 相比現(xiàn)有技術,本發(fā)明的有益效果在于:通過以上方法和終端對曲線數(shù)據(jù)進行兩 次篩處理,從而獲取高相似度的匹配曲線;在二次篩選處理過程中通過對曲線數(shù)據(jù)進行水 平伸縮處理和采用波峰波谷識別法將波峰波谷區(qū)域設置為敏感識別區(qū)域,并加大對波峰波 谷區(qū)域的相似度識別權值,再利用加權DTW距離計算法進行距離值計算,使得距離值的計算 相似度準確性更高,并克服了準確性受曲線局部細節(jié)的影響;本發(fā)明在計算機集群的應用 中,通過opencl實現(xiàn)并發(fā)計算,效率更高。
[0116]本實施例只是本發(fā)明的較優(yōu)實施方式,未進行詳細描述的部分均采用公知的成熟 技術。需要說明的是,在不背離本發(fā)明精神及其實質(zhì)的情況下,熟悉本領域的技術人員當可 根據(jù)本發(fā)明作出各種相應的改變和變形,但這些改變和變形都應屬于本發(fā)明所附的權利要 求的保護范圍。
【主權項】
1. 一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方法,其特征在于,所述方法包括: 輸入需要處理的曲線數(shù)據(jù); 對輸入的曲線數(shù)據(jù)進行初步篩選處理,獲取初步篩選數(shù)據(jù)段集合; 對所述初步篩選數(shù)據(jù)段集合中的曲線數(shù)據(jù)進行二次篩選處理,獲取匹配曲線片段并輸 出;其中,對所述初步篩選數(shù)據(jù)段集合中的曲線數(shù)據(jù)進行二次篩選處理,具體包括: 對曲線數(shù)據(jù)進行正則化處理、平滑處理、垂直伸縮處理和水平伸縮處理,獲取拉伸后的 曲線數(shù)據(jù); 識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域; 對敏感區(qū)域的曲線數(shù)據(jù)進行加權DTW距離計算,并計算產(chǎn)生距離值; 對所述距離值進行DTW距離排序,獲取匹配曲線片段并輸出。2. 如權利要求1所述的方法,其特征在于,所述對輸入的曲線數(shù)據(jù)進行初步篩選處理, 具體包括: 對輸入的曲線數(shù)據(jù)進行正則化處理、平滑處理和垂直伸縮處理,獲取拉伸后的曲線數(shù) 據(jù); 對所述拉伸后的曲線數(shù)據(jù)進行DTW距離計算,并計算產(chǎn)生距離值; 對所述距離值進行DTW距離排序,獲得初步篩選數(shù)據(jù)段集合。3. 如權利要求1所述的方法,其特征在于,識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域,具 體包括: 通過高斯濾波法將所述拉伸后的曲線數(shù)據(jù)處理并得到平滑的曲線; 設原始的曲線數(shù)據(jù)序列為x(t),經(jīng)過濾波處理后的曲線數(shù)據(jù)序列為寵狂),則有:其中表示濾波步長參數(shù),i表示數(shù)據(jù)節(jié)點W的下標,j與i含 義相同;設曲線數(shù)據(jù)總長度為len,則8 = 0.1 * Zen, S表示經(jīng)驗數(shù)據(jù); 根據(jù)曲線的斜率判斷波峰和波谷的位置,若某一點的前向斜率與后向斜率相反,則該 點為波峰或波谷點。4. 如權利要求3所述的方法,其特征在于,識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域還包 括:若兩個相鄰的波峰波谷之間的垂直距離差小于預設闊值9,則剔除該波峰波谷;當確定 波峰和波谷點后,設波峰或波谷點的坐標為《i,則坐標區(qū)間為[?1-0,《1+0]的所有采樣 點均被認為屬于敏感區(qū)域,其中e表示敏感區(qū)域識別區(qū)間參數(shù)。5. 如權利要求1所述的方法,其特征在于,對敏感區(qū)域的曲線數(shù)據(jù)進行加權DTW距離計 算包括:設Y(i)為參考曲線的數(shù)據(jù)集,Z(j)為對比曲線的數(shù)據(jù)集,y(i)為參考曲線數(shù)據(jù)集的 敏感區(qū)域標記集合,z(j)為對比曲線數(shù)據(jù)集的敏感區(qū)域標記集合,有W下定義:則若警告DTW路徑捜索后得到匹配點對Y(a)與Z(b),其中,a和b為數(shù)據(jù)集索引下標,貝U 該點對的距離S六其中,取0表示距離度量函數(shù),餐(y〇), Z(W)表示歐式距離,且表示敏感區(qū)域加權系數(shù)。6. -種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配終端,其特征在于,包括: 輸入模塊,用于輸入需要處理的曲線數(shù)據(jù); 初步篩選模塊,用于對輸入的曲線數(shù)據(jù)進行初步篩選處理,獲取初步篩選數(shù)據(jù)段集合; 二次篩選模塊,用于對所述初步篩選數(shù)據(jù)段集合中的曲線數(shù)據(jù)進行二次篩選處理、獲 取匹配曲線片段并輸出;其中,所述二次篩選模塊包括: 處理單元,用于對曲線數(shù)據(jù)進行正則化處理、平滑處理、垂直伸縮處理和水平伸縮處 理、獲取拉伸后的曲線數(shù)據(jù); 識別單元,用于識別所述拉伸后的曲線數(shù)據(jù)的敏感區(qū)域; 加權計算單元,用于對敏感區(qū)域的曲線數(shù)據(jù)進行加權DTW距離計算,并計算產(chǎn)生距離 值; 排序單元,用于對所述距離值進行DTW距離排序、獲取匹配曲線片段并輸出。7. 如權利要求6所述的終端,其特征在于,所述初步篩選模塊包括: 處理單元,用于對輸入的曲線數(shù)據(jù)進行正則化處理、平滑處理和垂直伸縮處理、獲取拉 伸后的曲線數(shù)據(jù); 計算單元,用于對所述拉伸后的曲線數(shù)據(jù)進行DTW距離計算、并計算產(chǎn)生距離值; 排序單元,用于對所述距離值進行DTW距離排序、獲得初步篩選數(shù)據(jù)段集合。8. 如權利要求6所述的終端,其特征在于,所述識別單元具體用于: 通過高斯濾波法將所述拉伸后的曲線數(shù)據(jù)處理并得到平滑的曲線; 設原始的曲線數(shù)據(jù)序列為x(t),經(jīng)過濾波處理后的曲線數(shù)據(jù)序列為f(t),則有:其中O表示濾波步長參數(shù),i表示數(shù)據(jù)節(jié)點W的下標,j與i含 義相同; 設曲線數(shù)據(jù)總長度為len,則d = (U *: ten,團表示經(jīng)驗數(shù)據(jù); 根據(jù)曲線的斜率判斷波峰和波谷的位置,若某一點的前向斜率與后向斜率相反,則該 點為波峰或波谷點。9. 如權利要求8所述的終端,其特征在于,還包括差異度檢測模塊,用于若兩個相鄰的 波峰波谷之間的垂直距離差小于預設闊值9,則剔除該波峰波谷;當確定波峰和波谷點后, 設波峰或波谷點的坐標為《 i,則坐標區(qū)間為[?i-e,《 i+e]的所有采樣點均被認為屬于敏 感區(qū)域,其中e表示敏感區(qū)域識別區(qū)間參數(shù)。10. 如權利要求6所述的終端,其特征在于,所述加權計算單元具體用于:設Y( i)為參考 曲線的數(shù)據(jù)集,Z(j)為對比曲線的數(shù)據(jù)集,y(i)為參考曲線數(shù)據(jù)集的敏感區(qū)域標記集合,Z (j)為對比曲線數(shù)據(jù)集的銳威區(qū)域標巧集合,有Pi下吿父:則若警告DTW路徑捜索后得到匹配點對Y(a)與Z(b),其中,a和b為數(shù)據(jù)集索引下標,貝U 該點對的距離S為:其中,與()表示距離度站鳴數(shù),與(的)表示歐式距離,且表示敏感區(qū)域加權系數(shù)。
【文檔編號】G06K9/62GK105913062SQ201610264725
【公開日】2016年8月31日
【申請日】2016年4月26日
【發(fā)明人】吳子鐸
【申請人】深圳前海云漢金融科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1