亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

識(shí)別時(shí)間序列模式的方法和裝置制造方法

文檔序號(hào):6514378閱讀:186來(lái)源:國(guó)知局
識(shí)別時(shí)間序列模式的方法和裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種識(shí)別時(shí)間序列模式的方法和裝置,屬于信息【技術(shù)領(lǐng)域】。包括:對(duì)需要分析的時(shí)間序列進(jìn)行預(yù)處理,得到至少兩個(gè)歸一化的子序列;對(duì)每個(gè)歸一化的子序列轉(zhuǎn)化的符號(hào)化的子序列進(jìn)行預(yù)設(shè)次數(shù)的隨機(jī)投影;記錄每個(gè)符號(hào)化的子序列在預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其他符號(hào)化的子序列在投影位置上具有相同符號(hào)的次數(shù);將大于第一閾值的每個(gè)次數(shù)所對(duì)應(yīng)的每?jī)蓚€(gè)歸一化的子序列構(gòu)成初始模式,比較長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)間的距離,得到一組時(shí)間序列片段,每組時(shí)間序列片段及未組成時(shí)間序列片段的初始模式分別構(gòu)成時(shí)間序列模式。本發(fā)明通過(guò)比較長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)之間的距離,以構(gòu)成時(shí)間序列模式,提高識(shí)別時(shí)間序列模式的準(zhǔn)確性。
【專利說(shuō)明】識(shí)別時(shí)間序列模式的方法和裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息【技術(shù)領(lǐng)域】,特別涉及一種識(shí)別時(shí)間序列模式的方法和裝置。

【背景技術(shù)】
[0002] 隨著信息技術(shù)的發(fā)展,越來(lái)越多的數(shù)據(jù)呈現(xiàn)為時(shí)間序列的形式,如股票數(shù)據(jù)、心電 圖數(shù)據(jù)等。在這些時(shí)間序列中有許多重復(fù)出現(xiàn)的子序列,這些重復(fù)出現(xiàn)的子序列形成的模 式被稱為時(shí)間序列模式。由于這些時(shí)間序列模式對(duì)統(tǒng)計(jì)規(guī)律和預(yù)測(cè)有十分重要的意義,因 此,如何從一段時(shí)間序列中識(shí)別出時(shí)間序列模式,成為研究時(shí)間序列問(wèn)題的關(guān)鍵。
[0003] 在識(shí)別時(shí)間序列模式時(shí),文章 Discovering original motifs with different lengths from time series, Tang H, Liao S S. [J]. Knowledge-Based Systems,2008, 21(7) :666-671提出首先將需要分析的時(shí)間序列作歸一化處理,得到至少兩個(gè)歸一化的子 序列。其次,通過(guò)SAX(Symbolic Aggregate approximation,符號(hào)集近似)方法將每個(gè)歸一 化的子序列轉(zhuǎn)化為符號(hào)化的子序列,再對(duì)每個(gè)符號(hào)化的子序列進(jìn)行預(yù)設(shè)次數(shù)的隨機(jī)投影, 記錄每個(gè)符號(hào)化的子序列在所述預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其他符號(hào)化的子序列在投 影位置上具有相同符號(hào)的次數(shù)。最后,將記錄的次數(shù)大于閾值的每個(gè)次數(shù)所對(duì)應(yīng)的每?jī)蓚€(gè) 歸一化的子序列分別作為橫坐標(biāo)和縱坐標(biāo),并在坐標(biāo)系中標(biāo)記出來(lái),坐標(biāo)系的橫軸和縱軸 的坐標(biāo)分別代表對(duì)應(yīng)的歸一化的子序列。將坐標(biāo)系中用戶指定范圍內(nèi)的橫坐標(biāo)對(duì)應(yīng)的子序 列構(gòu)成一個(gè)時(shí)間序列片段,縱坐標(biāo)對(duì)應(yīng)的子序列構(gòu)成一個(gè)時(shí)間序列片段,得到一組時(shí)間序 列片段,每組時(shí)間序列片段及坐標(biāo)系中未連接的子序列分別構(gòu)成時(shí)間序列模式。
[0004] 在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問(wèn)題:
[0005] 由于上述識(shí)別時(shí)間序列模式的方式中,將記錄的大于第一閾值的每個(gè)次數(shù)所對(duì)應(yīng) 的每?jī)蓚€(gè)歸一化的子序列在坐標(biāo)系中標(biāo)記出來(lái)之后,會(huì)將坐標(biāo)系中用戶指定范圍內(nèi)的橫坐 標(biāo)及縱坐標(biāo)對(duì)應(yīng)的子序列分別構(gòu)成時(shí)間序列片段,并將每組時(shí)間序列片段構(gòu)成時(shí)間序列模 式,導(dǎo)致原本在需要分析的時(shí)間序列中重復(fù)出現(xiàn)的概率不高的序列通過(guò)上述過(guò)程識(shí)別后被 識(shí)別出來(lái),而這類時(shí)間序列模式中的子序列之間可能存在較大的位移差別,因而識(shí)別出的 時(shí)間序列模式不夠精準(zhǔn)。


【發(fā)明內(nèi)容】

[0006] 為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明實(shí)施例提供了一種識(shí)別時(shí)間序列模式的方法和 裝置。所述技術(shù)方案如下:
[0007] -方面,提供了一種識(shí)別時(shí)間序列模式的方法,所述方法包括:
[0008] 獲取需要分析的時(shí)間序列,對(duì)所述時(shí)間序列進(jìn)行預(yù)處理,得到至少兩個(gè)歸一化的 子序列;
[0009] 將每個(gè)歸一化的子序列轉(zhuǎn)化為符號(hào)化的子序列,并對(duì)每個(gè)符號(hào)化的子序列進(jìn)行預(yù) 設(shè)次數(shù)的隨機(jī)投影;
[0010] 記錄每個(gè)符號(hào)化的子序列在所述預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其他符號(hào)化的子 序列在投影位置上具有相同符號(hào)的次數(shù);
[0011] 將記錄的次數(shù)與第一閾值進(jìn)行比較,并將大于第一閾值的每個(gè)次數(shù)所對(duì)應(yīng)的每?jī)?個(gè)歸一化的子序列構(gòu)成一個(gè)初始模式,每個(gè)初始模式包括的兩個(gè)歸一化的子序列中位置靠 前的子序列為所述初始模式的起點(diǎn),位置靠后的子序列為所述初始模式的終點(diǎn),每個(gè)初始 模式的起點(diǎn)與終點(diǎn)之間的距離為初始模式的長(zhǎng)度;
[0012] 比較長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)之間的距離,將距離小于第二閾值且長(zhǎng)度 相同的每?jī)蓚€(gè)初始模式的起點(diǎn)與起點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,終點(diǎn) 與終點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,得到一組時(shí)間序列片段,每組時(shí)間 序列片段及未組成時(shí)間序列片段的初始模式分別構(gòu)成時(shí)間序列模式。
[0013] 優(yōu)選地,所述對(duì)所述時(shí)間序列進(jìn)行預(yù)處理,得到至少兩個(gè)歸一化的子序列,包括:
[0014] 以預(yù)設(shè)窗口大小將所述時(shí)間序列劃分成至少兩個(gè)子序列;
[0015] 對(duì)每個(gè)子序列進(jìn)行Z歸一化處理,得到至少兩個(gè)歸一化的子序列。
[0016] 優(yōu)選地,所述每組時(shí)間序列片段及未組成時(shí)間序列片段的初始模式分別構(gòu)成時(shí)間 序列模式之后,還包括:
[0017] 將起點(diǎn)相鄰的每?jī)蓚€(gè)時(shí)間序列模式的起點(diǎn)之間的距離與第一預(yù)設(shè)距離進(jìn)行比 較;
[0018] 如果存在起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式的起點(diǎn)之間的距離小于等于第一預(yù)設(shè)距 離,則將所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差與第三閾值進(jìn)行比較,并將所述 起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的均值與第四閾值進(jìn)行比較;
[0019] 如果所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差小于等于第三閾值,且所述 起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的均值小于等于第四閾值,則確定所述起點(diǎn)相鄰的兩個(gè) 時(shí)間序列模式構(gòu)成帶有形變的連續(xù)模式。
[0020] 優(yōu)選地,所述確定所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式構(gòu)成帶有形變的連續(xù)模式之 后,還包括:
[0021] 從帶有形變的連續(xù)模式及未構(gòu)成帶有形變的連續(xù)模式的時(shí)間序列模式中選擇一 個(gè)模式作為第一模式,并選擇另一個(gè)模式作為第二模式,將所述第一模式的起點(diǎn)與所述第 二模式的起點(diǎn)之間的距離與所述第一預(yù)設(shè)距離進(jìn)行比較;
[0022] 如果所述第一模式的起點(diǎn)與所述第二模式的起點(diǎn)之間的距離大于所述第一預(yù)設(shè) 距離,將所述第一模式與所述第二模式之間的標(biāo)準(zhǔn)差與所述第三閾值進(jìn)行比較,并將所述 第一模式與所述第二模式之間的均值與所述第四閾值進(jìn)行比較;
[0023] 如果所述第一模式與所述第二模式之間的標(biāo)準(zhǔn)差小于等于所述第三閾值,且所述 第一模式與所述第二模式之間的均值小于等于所述第四閾值,則確定所述第一模式與所述 第二模式構(gòu)成帶有間隔的連續(xù)模式。
[0024] 優(yōu)選地,所述確定所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式構(gòu)成帶有形變的連續(xù)模式之 后,還包括:
[0025] 如果存在起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式,則將起點(diǎn)有重疊的兩個(gè)帶有形 變的連續(xù)模式合并為一個(gè)帶有形變的連續(xù)模式。
[0026] 優(yōu)選地,所述將起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式合并為一個(gè)帶有形變的連 續(xù)模式之前,還包括:
[0027] 確定所述起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式之間的重疊范圍是否滿足第一 預(yù)設(shè)條件,如果滿足第一預(yù)設(shè)條件,則執(zhí)行將起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式合并 為一個(gè)帶有形變的連續(xù)模式的步驟。
[0028] 優(yōu)選地,所述確定所述第一模式與所述第二模式構(gòu)成帶有間隔的連續(xù)模式之后, 還包括:
[0029] 如果存在起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式,則將起點(diǎn)有重疊的兩個(gè)帶有間 隔的連續(xù)模式合并為一個(gè)帶有間隔的連續(xù)模式。
[0030] 優(yōu)選地,所述將起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式合并為一個(gè)帶有間隔的連 續(xù)模式之前,還包括:
[0031] 確定所述起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式之間的重疊范圍是否滿足第二 預(yù)設(shè)條件,如果滿足第二預(yù)設(shè)條件,則執(zhí)行將起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式合并 為一個(gè)帶有間隔的連續(xù)模式的步驟。
[0032] 另一方面,提供了一種識(shí)別時(shí)間序列的裝置,所述裝置包括:
[0033] 獲取模塊,用于獲取需要分析的時(shí)間序列;
[0034] 預(yù)處理模塊,用于對(duì)所述時(shí)間序列進(jìn)行預(yù)處理,得到至少兩個(gè)歸一化的子序列;
[0035] 轉(zhuǎn)化模塊,用于將每個(gè)歸一化的子序列轉(zhuǎn)化為符號(hào)化的子序列;
[0036] 投影模塊,用于對(duì)每個(gè)符號(hào)化的子序列進(jìn)行預(yù)設(shè)次數(shù)的隨機(jī)投影;
[0037] 記錄模塊,用于記錄每個(gè)符號(hào)化的子序列在所述預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其 他符號(hào)化的子序列在投影位置上具有相同符號(hào)的次數(shù);
[0038] 第一比較模塊,用于將記錄的次數(shù)與第一閾值進(jìn)行比較,并將大于第一閾值的每 個(gè)次數(shù)所對(duì)應(yīng)的每?jī)蓚€(gè)歸一化的子序列構(gòu)成一個(gè)初始模式,每個(gè)初始模式包括的兩個(gè)歸一 化的子序列中位置靠前的子序列為所述初始模式的起點(diǎn),位置靠后的子序列為所述初始模 式的終點(diǎn),每個(gè)初始模式的起點(diǎn)與終點(diǎn)之間的距離為初始模式的長(zhǎng)度;
[0039] 第二比較模塊,用于比較長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)之間的距離,將距離 小于第二閾值且長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)與起點(diǎn)之間的歸一化的子序列構(gòu)成一 個(gè)時(shí)間序列片段,終點(diǎn)與終點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,得到一組時(shí) 間序列片段,每組時(shí)間序列片段及未組成時(shí)間序列片段的初始模式分別構(gòu)成時(shí)間序列模 式。
[0040] 優(yōu)選地,所述預(yù)處理模塊包括:
[0041] 劃分單元,用于以預(yù)設(shè)窗口大小將所述時(shí)間序列劃分成至少兩個(gè)子序列;
[0042] 處理單元,用于對(duì)每個(gè)子序列進(jìn)行Z歸一化處理,得到至少兩個(gè)歸一化的子序列。
[0043] 優(yōu)選地,所述裝置還包括:
[0044] 第三比較模塊,用于將起點(diǎn)相鄰的每?jī)蓚€(gè)時(shí)間序列模式的起點(diǎn)之間的距離與第一 預(yù)設(shè)距離進(jìn)行比較;
[0045] 第四比較模塊,用于當(dāng)存在起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式的起點(diǎn)之間的距離小于 等于第一預(yù)設(shè)距離時(shí),將所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差與第三閾值進(jìn)行 比較,并將所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的均值與第四閾值進(jìn)行比較;
[0046] 第一確定模塊,用于當(dāng)所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差小于等于 第三閾值,且所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的均值小于等于第四閾值時(shí),確定所 述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式構(gòu)成帶有形變的連續(xù)模式。
[0047] 優(yōu)選地,所述裝置還包括:
[0048] 選擇模塊,用于從帶有形變的連續(xù)模式及未構(gòu)成帶有形變的連續(xù)模式的時(shí)間序列 模式中選擇一個(gè)模式作為第一模式,并選擇另一個(gè)模式作為第二模式;
[0049] 第五比較模塊,用于將所述第一模式的起點(diǎn)與所述第二模式的起點(diǎn)之間的距離與 所述第一預(yù)設(shè)距離進(jìn)行比較;
[0050] 第六比較模塊,用于當(dāng)所述第一模式與所述第二模式的起點(diǎn)之間的距離大于所述 第一預(yù)設(shè)距離時(shí),將所述第一模式與所述第二模式之間的標(biāo)準(zhǔn)差與所述第三閾值進(jìn)行比 較,并將所述第一模式與所述第二模式之間的均值與所述第四閾值進(jìn)行比較;
[0051] 第二確定模塊,用于當(dāng)所述第一模式與所述第二模式之間的標(biāo)準(zhǔn)差小于等于所述 第三閾值,且所述第一模式與所述第二模式之間的均值小于等于所述第四閾值時(shí),確定所 述第一模式與所述第二模式構(gòu)成帶有間隔的連續(xù)模式。
[0052] 優(yōu)選地,所述裝置還包括:
[0053] 第一合并模塊,用于當(dāng)存在起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式時(shí),將起點(diǎn)有 重疊的兩個(gè)帶有形變的連續(xù)模式合并為一個(gè)帶有形變的連續(xù)模式。
[0054] 優(yōu)選地,所述將裝置還包括:
[0055] 第三確定模塊,用于確定所述起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式之間的重疊 范圍是否滿足第一預(yù)設(shè)條件;
[0056] 所述第一合并模塊,用于當(dāng)滿足第一預(yù)設(shè)條件時(shí),執(zhí)行將起點(diǎn)有重疊的兩個(gè)帶有 間隔的連續(xù)模式合并為一個(gè)帶有間隔的連續(xù)模式的步驟。
[0057] 優(yōu)選地,所述裝置還包括:
[0058] 第二合并模塊,用于當(dāng)存在起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式時(shí),將起點(diǎn)有 重疊的兩個(gè)帶有間隔的連續(xù)模式合并為一個(gè)帶有間隔的連續(xù)模式。
[0059] 優(yōu)選地,所述將裝置還包括:
[0060] 第四確定模塊,用于確定所述起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式之間的重疊 范圍是否滿足第二預(yù)設(shè)條件;
[0061] 所述第二合并模塊,用于當(dāng)滿足第二預(yù)設(shè)條件時(shí),執(zhí)行將起點(diǎn)有重疊的兩個(gè)帶有 間隔的連續(xù)模式合并為一個(gè)帶有間隔的連續(xù)模式的步驟。
[0062] 本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果是:
[0063] 通過(guò)將每個(gè)符號(hào)化的子序列進(jìn)行預(yù)設(shè)次數(shù)的隨機(jī)投影,并記錄在預(yù)設(shè)次數(shù)的隨機(jī) 投影過(guò)程中每個(gè)符號(hào)化的子序列與其他符號(hào)化的子序列在投影位置上具有相同符號(hào)的次 數(shù)后,將記錄的達(dá)到第一閾值的次數(shù)所對(duì)應(yīng)的每?jī)蓚€(gè)歸一化的子序列構(gòu)成一個(gè)初始模式, 之后將長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)與起點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序 列片段,終點(diǎn)與終點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,每組時(shí)間序列片段及 未進(jìn)行連接的初始模式分別構(gòu)成時(shí)間序列模式,從而實(shí)現(xiàn)了將子序列連接成一個(gè)大的時(shí)間 序列模式,不僅提供了明確的識(shí)別方法,且由于時(shí)間序列模式中的子序列之間的距離小于 第二閾值,因而時(shí)間序列模式中的子序列之間的位移差別較小,從而使識(shí)別出的時(shí)間序列 模式具有更高的準(zhǔn)確性及可靠性。

【專利附圖】

【附圖說(shuō)明】
[0064] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使 用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于 本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0065] 圖1是本發(fā)明實(shí)施例一提供的一種識(shí)別時(shí)間序列模式的方法流程圖;
[0066] 圖2是本發(fā)明實(shí)施例二提供的一種識(shí)別時(shí)間序列模式的方法流程圖;
[0067] 圖3是本發(fā)明實(shí)施例二提供的一種需要分析的時(shí)間序列示意圖;
[0068] 圖4是本發(fā)明實(shí)施例二提供的一種符號(hào)化的子序列的矩陣示意圖;
[0069] 圖5是本發(fā)明實(shí)施例二提供的一種隨機(jī)投影的示意圖;
[0070] 圖6是本發(fā)明實(shí)施例二提供的另一種隨機(jī)投影的示意圖;
[0071] 圖7是本發(fā)明實(shí)施例二提供的一種初始模式在坐標(biāo)系中的示意圖;
[0072] 圖8是本發(fā)明實(shí)施例二提供的一種坐標(biāo)系中的時(shí)間序列模式的示意圖;
[0073] 圖9是本發(fā)明實(shí)施例二提供的一種時(shí)間序列模式的示意圖;
[0074] 圖10是本發(fā)明實(shí)施例二提供的一種坐標(biāo)系中的時(shí)間序列模式的示意圖;
[0075] 圖11是本發(fā)明實(shí)施例三提供的第一種識(shí)別時(shí)間序列模式的裝置結(jié)構(gòu)示意圖;
[0076] 圖12是本發(fā)明實(shí)施例三提供的預(yù)處理模塊的結(jié)構(gòu)示意圖;
[0077] 圖13是本發(fā)明實(shí)施例三提供的第二種識(shí)別時(shí)間序列模式的裝置結(jié)構(gòu)示意圖;
[0078] 圖14是本發(fā)明實(shí)施例三提供的第三種識(shí)別時(shí)間序列模式的裝置結(jié)構(gòu)示意圖;
[0079] 圖15是本發(fā)明實(shí)施例三提供的第四種識(shí)別時(shí)間序列模式的裝置結(jié)構(gòu)示意圖;
[0080] 圖16是本發(fā)明實(shí)施例三提供的第五種識(shí)別時(shí)間序列模式的裝置結(jié)構(gòu)示意圖;
[0081] 圖17是本發(fā)明實(shí)施例三提供的第六種識(shí)別時(shí)間序列模式的裝置結(jié)構(gòu)示意圖;
[0082] 圖18是本發(fā)明實(shí)施例三提供的第七種識(shí)別時(shí)間序列模式的裝置結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0083] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方 式作進(jìn)一步地詳細(xì)描述。
[0084] 實(shí)施例一
[0085] 本發(fā)明實(shí)施例提供了一種識(shí)別時(shí)間序列模式的方法,參見(jiàn)圖1,本實(shí)施例提供的方 法流程包括:
[0086] 101 :獲取需要分析的時(shí)間序列,對(duì)該時(shí)間序列進(jìn)行預(yù)處理,得到至少兩個(gè)歸一化 的子序列。
[0087] 作為一種優(yōu)選的實(shí)施例,對(duì)時(shí)間序列進(jìn)行預(yù)處理,得到至少兩個(gè)歸一化的子序列, 包括:
[0088] 以預(yù)設(shè)窗口大小將時(shí)間序列劃分成至少兩個(gè)子序列;
[0089] 對(duì)每個(gè)子序列進(jìn)行Z歸一化處理,得到至少兩個(gè)歸一化的子序列。
[0090] 102 :將每個(gè)歸一化的子序列轉(zhuǎn)化為符號(hào)化的子序列,并對(duì)每個(gè)符號(hào)化的子序列進(jìn) 行預(yù)設(shè)次數(shù)的隨機(jī)投影。
[0091] 103:記錄每個(gè)符號(hào)化的子序列在所述預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其他符號(hào)化 的子序列在投影位置上具有相同符號(hào)的次數(shù)。
[0092] 104 :將記錄的次數(shù)與第一閾值進(jìn)行比較,并將大于第一閾值的每個(gè)次數(shù)所對(duì)應(yīng)的 每?jī)蓚€(gè)歸一化的子序列構(gòu)成一個(gè)初始模式,每個(gè)初始模式包括的兩個(gè)歸一化的子序列中位 置靠前的子序列為初始模式的起點(diǎn),位置靠后的子序列為所述初始模式的終點(diǎn),每個(gè)初始 模式的起點(diǎn)與終點(diǎn)之間的距離為初始模式的長(zhǎng)度。
[0093] 105:比較長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)之間的距離,將距離小于第二閾值且 長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)與起點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段, 終點(diǎn)與終點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,得到一組時(shí)間序列片段,每組 時(shí)間序列片段及未組成時(shí)間序列片段的初始模式分別構(gòu)成時(shí)間序列模式。
[0094] 作為一種優(yōu)選的實(shí)施例,每組時(shí)間序列片段及未組成時(shí)間序列片段的初始模式分 別構(gòu)成時(shí)間序列模式之后,還包括:
[0095] 將起點(diǎn)相鄰的每?jī)蓚€(gè)時(shí)間序列模式的起點(diǎn)之間的距離與第一預(yù)設(shè)距離進(jìn)行比 較;
[0096] 如果存在起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式的起點(diǎn)之間的距離小于等于第一預(yù)設(shè)距 離,則將起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差與第三閾值進(jìn)行比較,并將起點(diǎn)相鄰 的兩個(gè)時(shí)間序列模式之間的均值與第四閾值進(jìn)行比較;
[0097] 如果起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差小于等于第三閾值,且起點(diǎn)相鄰 的兩個(gè)時(shí)間序列模式之間的均值小于等于第四閾值,則確定起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式 構(gòu)成帶有形變的連續(xù)模式。
[0098] 作為一種優(yōu)選的實(shí)施例,確定起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式構(gòu)成帶有形變的連續(xù) 模式之后,還包括:
[0099] 從帶有形變的連續(xù)模式及未構(gòu)成帶有形變的連續(xù)模式的時(shí)間序列模式中選擇一 個(gè)模式作為第一模式,并選擇另一個(gè)模式作為第二模式,將第一模式的起點(diǎn)與第二模式的 起點(diǎn)之間的距離與第一預(yù)設(shè)距離進(jìn)行比較;
[0100] 如果第一模式的起點(diǎn)與第二模式的起點(diǎn)之間的距離大于第一預(yù)設(shè)距離,則將第一 模式與第二模式之間的標(biāo)準(zhǔn)差與第三閾值進(jìn)行比較,并將第一模式與第二模式之間的均值 與第四閾值進(jìn)行比較;
[0101] 如果第一模式與第二模式之間的標(biāo)準(zhǔn)差小于等于第三閾值,且第一模式與第二模 式之間的均值小于等于第四閾值,則確定第一模式與第二模式構(gòu)成帶有間隔的連續(xù)模式。
[0102] 作為一種優(yōu)選的實(shí)施例,確定起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式構(gòu)成帶有形變的連續(xù) 模式之后,還包括:
[0103] 如果存在起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式,則將起點(diǎn)有重疊的兩個(gè)帶有形 變的連續(xù)模式合并為一個(gè)帶有形變的連續(xù)模式。
[0104] 作為一種優(yōu)選的實(shí)施例,將起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式合并為一個(gè)帶 有形變的連續(xù)模式之前,還包括:
[0105] 確定起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式之間的重疊范圍是否滿足第一預(yù)設(shè) 條件,如果滿足第一預(yù)設(shè)條件,則執(zhí)行將起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式合并為一 個(gè)帶有形變的連續(xù)模式的步驟。
[0106] 作為一種優(yōu)選的實(shí)施例,確定第一模式與第二模式構(gòu)成帶有間隔的連續(xù)模式之 后,還包括:
[0107] 如果存在起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式,則將起點(diǎn)有重疊的兩個(gè)帶有間 隔的連續(xù)模式合并為一個(gè)帶有間隔的連續(xù)模式。
[0108] 作為一種優(yōu)選的實(shí)施例,將起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式合并為一個(gè)帶 有間隔的連續(xù)模式之前,還包括:
[0109] 確定起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式之間的重疊范圍是否滿足第二預(yù)設(shè) 條件,如果滿足第二預(yù)設(shè)條件,則執(zhí)行將起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式合并為一 個(gè)帶有間隔的連續(xù)模式的步驟。
[0110] 本發(fā)明實(shí)施例提供的方法,通過(guò)將每個(gè)符號(hào)化的子序列進(jìn)行預(yù)設(shè)次數(shù)的隨機(jī)投 影,并記錄在預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中每個(gè)符號(hào)化的子序列與其他符號(hào)化的子序列在投 影位置上具有相同符號(hào)的次數(shù)后,將記錄的達(dá)到第一閾值的每個(gè)次數(shù)所對(duì)應(yīng)的每?jī)蓚€(gè)歸一 化的子序列構(gòu)成一個(gè)初始模式,之后將長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)與起點(diǎn)之間的歸 一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,終點(diǎn)與終點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序 列片段,每組時(shí)間序列片段及未進(jìn)行連接的初始模式分別構(gòu)成時(shí)間序列模式,從而實(shí)現(xiàn)了 將子序列連接成一個(gè)大的時(shí)間序列模式,不僅提供了明確的識(shí)別方法,且由于時(shí)間序列模 式中的子序列之間的距離小于第二閾值,因而時(shí)間序列模式中的子序列之間的位移差別較 小,從而使識(shí)別出的時(shí)間序列模式具有更高的準(zhǔn)確性及可靠性。
[0111] 實(shí)施例二
[0112] 隨著統(tǒng)計(jì)學(xué)的發(fā)展,越來(lái)越多的數(shù)據(jù)呈現(xiàn)時(shí)間序列形式。時(shí)間序列是指將某種現(xiàn) 象或某一個(gè)統(tǒng)計(jì)指標(biāo)在不同時(shí)間上的各個(gè)數(shù)值,按時(shí)間先后順序排列而形成的序列。常見(jiàn) 的時(shí)間序列包括但不限于股票數(shù)據(jù)、心電圖數(shù)據(jù)等。在對(duì)這些時(shí)間序列進(jìn)行研究時(shí)發(fā)現(xiàn):時(shí) 間序列中有許多重復(fù)出現(xiàn)的子序列,這些重復(fù)出現(xiàn)的子序列形成時(shí)間序列模式。由于時(shí)間 序列模式蘊(yùn)含著一些重要的原理,而這些重要的原理對(duì)理解現(xiàn)象的本質(zhì)、統(tǒng)計(jì)規(guī)律和預(yù)測(cè) 十分有意義,為此,本發(fā)明實(shí)施例提供了一種識(shí)別時(shí)間序列模式的方法。為了便于理解,現(xiàn) 結(jié)合上述實(shí)施例一的內(nèi)容,對(duì)本實(shí)施例提供的識(shí)別時(shí)間序列模式的方法進(jìn)行詳細(xì)地解釋說(shuō) 明。參見(jiàn)圖2,本實(shí)施例提供的方法流程包括:
[0113] 201 :獲取需要分析的時(shí)間序列。
[0114] 針對(duì)該步驟,關(guān)于獲取需要分析的時(shí)間序列的方式,本實(shí)施例不作具體限定,包括 但不限于通過(guò)如下方式獲?。?br> [0115] 首先,統(tǒng)計(jì)某一事物在一段時(shí)間內(nèi)的數(shù)據(jù);
[0116] 其次,將統(tǒng)計(jì)時(shí)間及統(tǒng)計(jì)得到的數(shù)據(jù)在坐標(biāo)系中標(biāo)記出來(lái),得到該事物在統(tǒng)計(jì)時(shí) 間內(nèi)相應(yīng)的數(shù)據(jù)變化曲線,該曲線即為獲取到的時(shí)間序列;
[0117] 其中,坐標(biāo)系的X軸表示統(tǒng)計(jì)時(shí)間,Y軸表示統(tǒng)計(jì)的數(shù)據(jù)。
[0118] 為了便于理解,以統(tǒng)計(jì)心臟在一天內(nèi)的跳動(dòng)數(shù)據(jù)為例,得到心臟在一天內(nèi)的跳動(dòng) 數(shù)據(jù)之后,將統(tǒng)計(jì)時(shí)間及統(tǒng)計(jì)得到的跳動(dòng)數(shù)據(jù)在坐標(biāo)系中標(biāo)記出來(lái),得到心臟在一天內(nèi)相 應(yīng)的數(shù)據(jù)變化曲線,將該曲線作為獲取到的時(shí)間序列。
[0119] 202 :對(duì)獲取到的時(shí)間序列進(jìn)行預(yù)處理,得到至少兩個(gè)歸一化的子序列。
[0120] 針對(duì)該步驟,由于獲取到的時(shí)間序列一般較長(zhǎng),從較長(zhǎng)的時(shí)間序列中識(shí)別時(shí)間序 列模式的過(guò)程較為復(fù)雜,因此,為了簡(jiǎn)化時(shí)間序列模式的識(shí)別難度,本實(shí)施例提供的方法在 對(duì)時(shí)間序列模式進(jìn)行識(shí)別之前,需要將獲取到的時(shí)間序列進(jìn)行預(yù)處理。其中,對(duì)時(shí)間序列進(jìn) 行預(yù)處理的方式包括但不限于如下過(guò)程:
[0121] 第一步,以預(yù)設(shè)窗口大小將時(shí)間序列劃分成至少兩個(gè)子序列;
[0122] 針對(duì)第一步,預(yù)設(shè)窗口為將時(shí)間序列劃分成子序列的劃分尺度。其中,預(yù)設(shè)窗口的 大小可以為1個(gè)數(shù)據(jù)長(zhǎng)度、2個(gè)數(shù)據(jù)長(zhǎng)度、3個(gè)數(shù)據(jù)長(zhǎng)度,當(dāng)然也可以是其他值,本實(shí)施例不 對(duì)預(yù)設(shè)窗口大小作具體限定及數(shù)據(jù)長(zhǎng)度的單位長(zhǎng)度進(jìn)行限定。由于預(yù)設(shè)窗口大小可以決定 時(shí)間序列被劃分的子序列的數(shù)量,為了保證識(shí)別結(jié)果的可靠性及準(zhǔn)確性,劃分的子序列數(shù) 量不宜太多,也不宜太少,本實(shí)施例不對(duì)劃分的子序列數(shù)量進(jìn)行限定。具體實(shí)施時(shí),可結(jié)合 需要分析的時(shí)間序列的長(zhǎng)度確定預(yù)設(shè)窗口大小,從而確定劃分的子序列的數(shù)量。但是,無(wú)論 確定的預(yù)設(shè)窗口大小是多少,根據(jù)預(yù)設(shè)窗口大小將時(shí)間序列劃分為子序列時(shí),劃分的子序 列數(shù)量至少為兩個(gè)。
[0123] 關(guān)于以預(yù)設(shè)窗口大小將時(shí)間序列劃分成至少兩個(gè)子序列的方式,可以采用從時(shí)間 序列的起點(diǎn)到終點(diǎn)的劃分方式依次進(jìn)行劃分,也可采用從時(shí)間序列的終點(diǎn)到起點(diǎn)的劃分方 式依次進(jìn)行劃分,本實(shí)施例對(duì)此不作具體限定。為了便于后續(xù)的分析和計(jì)算,本實(shí)施例中采 用從時(shí)間序列的起點(diǎn)到終點(diǎn)的劃分方式,將時(shí)間序列劃分為一系列的子序列,并將劃分后 的子序列從時(shí)間序列的起點(diǎn)到終點(diǎn)依次順序進(jìn)行編號(hào),分別為第1個(gè)子序列,第2個(gè)子序 列,第3個(gè)子序列,……,直到最后一個(gè)子序列。
[0124] 第二步,將每個(gè)子序列進(jìn)行z歸一化處理,得到至少兩個(gè)歸一化的子序列。
[0125] 針對(duì)第二步,雖然第一步已將時(shí)間序列劃分成至少兩個(gè)子序列,但由于每個(gè)子序 列的位移和縮放比例可能不同,對(duì)不同位移和縮放比例的子序列進(jìn)行模式識(shí)別較困難,因 此,為了將不同位移和縮放比例的子序列識(shí)別出來(lái),可以將每個(gè)子序列進(jìn)行z歸一化處理。
[0126] z歸一化作為一種無(wú)量綱處理手段,可以將物理系統(tǒng)數(shù)值由絕對(duì)值變成相對(duì)值。采 用z歸一化處理可將不同位移和縮放比例的子序列統(tǒng)一到一個(gè)參考系下,進(jìn)而能夠?qū)Σ煌?位移和縮放比例的子序列進(jìn)行計(jì)算。由于第一步中已經(jīng)將時(shí)間序列劃分為至少兩個(gè)子序 列,因此,在對(duì)每個(gè)子序列進(jìn)行Z歸一化處理時(shí),至少可以得到兩個(gè)歸一化的子序列。具體 地,對(duì)個(gè)子序列進(jìn)行Z歸一化處理的原理如下:
[0127] 如果Z歸一化處理前的子序列為X,Z歸一化處理后的子序列為X ',那么X '= (X-均值)/標(biāo)準(zhǔn)差。其中,標(biāo)準(zhǔn)差代表子序列的比例縮放信息,均值代表子序列的位移信 肩、。
[0128] 203 :將每個(gè)歸一化的子序列轉(zhuǎn)化為符號(hào)化的子序列。
[0129] 針對(duì)該步驟,雖然上述步驟202已將需要分析的時(shí)間序列進(jìn)行預(yù)處理得到了至少 兩個(gè)歸一化的子序列,但由于這些歸一化的子序列的維度較高,直接對(duì)這些歸一化的子序 列進(jìn)行模式識(shí)別的計(jì)算量很大。由于在低維空間對(duì)子序列進(jìn)行計(jì)算的計(jì)算量相對(duì)高維空間 要小的多,為了減小對(duì)歸一化的子序列進(jìn)行模式識(shí)別的計(jì)算量,可將歸一化的子序列進(jìn)行 降維處理,以通過(guò)降維處理使歸一化的子序列轉(zhuǎn)換到一個(gè)低維空間。目前,模式識(shí)別時(shí)的主 要降維方法有奇異值分解法、符號(hào)集近似法等,其中應(yīng)用最廣的方法是符號(hào)集近似SAX方 法。具體實(shí)施時(shí),本實(shí)施例以采用SAX方法為例進(jìn)行說(shuō)明。
[0130] 其中,SAX方法作為一種典型的降維方法,對(duì)歸一化的子序列進(jìn)行降維處理時(shí),首 先將歸一化的子序列進(jìn)行PAA (Piecewise Aggregate Approximation,分段聚合近似),然 后根據(jù)由高斯分布確定的分割點(diǎn)將歸一化的子序列用離散符號(hào)表示,進(jìn)而得到了符號(hào)化的 子序列。進(jìn)一步地,在根據(jù)SAX方法將歸一化的子序列轉(zhuǎn)化為符號(hào)化的子序列時(shí),表不符號(hào) 化的子序列的符號(hào)數(shù)和所用的符號(hào)種類包括但不限于由用戶設(shè)定。在用戶設(shè)定表示符號(hào)化 的子序列的符號(hào)數(shù)和所用符號(hào)的種類后,每個(gè)符號(hào)化的子序列將代替相應(yīng)的歸一化的子序 列參與后續(xù)的計(jì)算。
[0131] 對(duì)于上述過(guò)程,為了便于理解,下面以一個(gè)具體的例子進(jìn)行詳細(xì)的解釋說(shuō)明。
[0132] 如圖3所示,T代表一個(gè)需要分析的時(shí)間序列,經(jīng)過(guò)預(yù)處理后,時(shí)間序列T被劃分為 了 η個(gè)歸一化的子序列,其中,η等于1000。采用SAX方法將歸一化的子序列轉(zhuǎn)化為符號(hào)化 的子序列時(shí),如果用戶設(shè)定表示符號(hào)化的子序列的符號(hào)數(shù)為4個(gè),表示符號(hào)化的子序列的 符號(hào)種類為a、b和c,則根據(jù)用戶確定的符號(hào)種類,將時(shí)間序列T中任意一個(gè)子序列Cl轉(zhuǎn) 化為符號(hào)化的子序列時(shí),Cl可以表示為a c b a,則在后續(xù)的計(jì)算中以a c b a代替子序列 Cl進(jìn)行計(jì)算。
[0133] 需要說(shuō)明的是,將歸一化的子序列轉(zhuǎn)化為符號(hào)化的子序列后,為了便于后續(xù)對(duì)符 號(hào)化的子序列進(jìn)行識(shí)別,本步驟將符號(hào)化的子序列進(jìn)行存儲(chǔ)。關(guān)于存儲(chǔ)符號(hào)化的子序列的 方式,包括但不限于通過(guò)矩陣、表格等方式進(jìn)行存儲(chǔ),本實(shí)施例不對(duì)存儲(chǔ)符號(hào)化的子序列的 方式進(jìn)行限定。
[0134] 204 :對(duì)每個(gè)符號(hào)化的子序列進(jìn)行預(yù)設(shè)次數(shù)的隨機(jī)投影,并記錄每個(gè)符號(hào)化的子序 列在預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其他符號(hào)化的子序列在投影位置上具有相同符號(hào)的次 數(shù)。
[0135] 其中,隨機(jī)投影是在時(shí)間序列模式識(shí)別中廣泛使用的一種方法。隨機(jī)投影的主要 原理是越是出現(xiàn)次數(shù)多的模式,在離散化以后,子序列相同位置越有可能出現(xiàn)相同的符號(hào)。 隨機(jī)投影的預(yù)設(shè)次數(shù)可以是1000次,也可以是2000次,當(dāng)然也可以是其他值,本實(shí)施例不 對(duì)預(yù)設(shè)次數(shù)的具體值進(jìn)行限定。
[0136] 在對(duì)每個(gè)符號(hào)化的子序列進(jìn)行預(yù)設(shè)次數(shù)的隨機(jī)投影時(shí),可以隨機(jī)選擇投影位置, 該投影位置可以為符號(hào)化的子序列對(duì)應(yīng)的列,例如,可以選擇兩列進(jìn)行投影,也可以選擇三 列進(jìn)行投影。具體投影時(shí),用戶可根據(jù)符號(hào)化的子序列的情況隨機(jī)進(jìn)行設(shè)定。在確定投影的 符號(hào)化的子序列的列數(shù)后,具體選擇符號(hào)化的子序列的哪些列作為投影位置也是隨機(jī)的。 如果確定投影的符號(hào)化的子序列的列數(shù)為兩列,那么在隨機(jī)投影時(shí),符號(hào)化的子序列的任 意兩列都可以被選擇。具體投影時(shí)可以選擇符號(hào)化的子序列的第1列和第2列,也可以選 擇符號(hào)化的子序列的第2列和第3列,當(dāng)然,也可以選擇符號(hào)化的子序列的其他兩列。由于 隨機(jī)投影時(shí)選擇投影的符號(hào)化的子序列的列數(shù)是隨機(jī)的,選擇具體投影的符號(hào)化的子序列 的哪些列也是隨機(jī)的。但由于相同模式的符號(hào)化的子序列在相同投影位置上的符號(hào)是相同 的,經(jīng)過(guò)預(yù)設(shè)次數(shù)的隨機(jī)投影后,相同模式的子序列在相同的投影位置上出現(xiàn)相同符號(hào)的 次數(shù)相對(duì)較多。因此,為了將時(shí)間序列模式識(shí)別出來(lái),需要記錄并存儲(chǔ)每個(gè)符號(hào)化的子序列 在預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其他符號(hào)化的子序列在投影位置上具有相同符號(hào)的次數(shù)。 其中,記錄并存儲(chǔ)每個(gè)符號(hào)化的子序列在預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其他符號(hào)化的子序 列在投影位置上具有相同符號(hào)的次數(shù)的方式,本實(shí)施例不作具體的限定,包括但不限于通 過(guò)矩陣、表格等方式記錄并存儲(chǔ)。
[0137] 為了便于理解上述過(guò)程,下面以通過(guò)矩陣的形式記錄每個(gè)符號(hào)化的子序列在預(yù)設(shè) 次數(shù)的隨機(jī)投影過(guò)程中與其他符號(hào)化的子序列在投影位置上具有相同符號(hào)的次數(shù)為例,對(duì) 隨機(jī)投影過(guò)程進(jìn)行詳細(xì)的解釋說(shuō)明。
[0138] 其中,矩陣中的每一行每一列分別代表一個(gè)符號(hào)化的子序列,關(guān)于矩陣中行和列 的符號(hào)化的子序列的排列方式,可以按符號(hào)化的子序列編號(hào)從小到大的順序排列,也可以 按符號(hào)化的子序列編號(hào)從大到小的順序排列,本實(shí)施例不對(duì)矩陣中行和列的符號(hào)化的子序 列的排列方式作具體的限定。如果在第一次隨機(jī)投影過(guò)程中,兩個(gè)符號(hào)化的子序列在投影 位置上具有相同符號(hào),則在矩陣中這兩個(gè)符號(hào)化的子序列的交叉位置上記錄1,表示在一次 隨機(jī)投影過(guò)程中這兩個(gè)符號(hào)化的子序列符號(hào)相同的次數(shù)為一次;如果在第二次隨機(jī)投影過(guò) 程中,這兩個(gè)符號(hào)化的子序列在投影位置上還具有相同的符號(hào),則在矩陣中這兩個(gè)符號(hào)化 的子序列的交叉位置上記錄2,表示在兩次隨機(jī)投影過(guò)程中這兩個(gè)符號(hào)化的子序列符號(hào)相 同的次數(shù)為兩次。最后將預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中這兩個(gè)子符號(hào)化的序列在投影位置上 具有相同的符號(hào)的次數(shù)累計(jì)起來(lái),并將累計(jì)的次數(shù)記錄在矩陣中這兩個(gè)子序列的交叉位置 上,表示在預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中這兩個(gè)符號(hào)化的子序列在投影位置上具有相同符號(hào) 的次數(shù)。以上僅以兩列為例,對(duì)于其他列的符號(hào)化的子序列也采用上述方式進(jìn)行記錄,在此 不再贅述。
[0139] 需要說(shuō)明的是,由于矩陣的行和列都表示符號(hào)化的子序列,因此,兩個(gè)符號(hào)化的子 序列在矩陣中的交叉位置有兩個(gè),但這兩個(gè)位置表示的符號(hào)化的子序列的模式是相同的。 為了避免重復(fù)記錄,本實(shí)施例中將隨機(jī)投影過(guò)程中兩個(gè)符號(hào)化的子序列編號(hào)小的用矩陣的 行來(lái)表示,編號(hào)大的用矩陣的列來(lái)表示。
[0140] 205:將記錄的次數(shù)與第一閾值進(jìn)行比較,并將大于第一閾值的每個(gè)次數(shù)所對(duì)應(yīng)的 每?jī)蓚€(gè)歸一化的子序列構(gòu)成一個(gè)初始模式,每個(gè)初始模式包括的兩個(gè)歸一化的子序列中位 置靠前的子序列為初始模式的起點(diǎn),位置靠后的子序列為初始模式的終點(diǎn),每個(gè)初始模式 的起點(diǎn)與終點(diǎn)之間的距離為初始模式的長(zhǎng)度。
[0141] 針對(duì)該步驟,第一閾值可以是1000、2000、3000等,本實(shí)施例不對(duì)第一閾值的大小 作具體的限定。將記錄的次數(shù)與第一閾值進(jìn)行比較,比較結(jié)果有兩種,可以是記錄的次數(shù)大 于第一閾值,也可以是記錄的次數(shù)小于等于第一閾值,本實(shí)施例中將比較結(jié)果為記錄的大 于第一閾值的每個(gè)次數(shù)所對(duì)應(yīng)的兩個(gè)歸一化的子序列構(gòu)成一個(gè)初始模式,每個(gè)初始模式中 包括兩個(gè)歸一化的子序列,將每個(gè)初始模式中位置靠前的子序列作為初始模式的起點(diǎn),位 置靠后的子序列作為初始模式的終點(diǎn),每個(gè)初始模式的起點(diǎn)與終點(diǎn)之間的距離為初始模式 的長(zhǎng)度。
[0142] 對(duì)于上述過(guò)程,為了便于理解,下面將以設(shè)定第一閾值為1000為例,進(jìn)行詳細(xì)的 解釋說(shuō)明。
[0143] 例如,得到記錄每個(gè)符號(hào)化的子序列在預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其他符號(hào)化 的子序列在投影位置上具有相同符號(hào)的次數(shù)的矩陣后,從矩陣中可以得到記錄的大于1000 的次數(shù)所對(duì)應(yīng)的每?jī)蓚€(gè)歸一化的子序列有:子序列1和6、子序列9和20以及子序列100 和130。由于記錄的大于第一閾值的次數(shù)所對(duì)應(yīng)的每?jī)蓚€(gè)歸一化的子序列可以構(gòu)成一個(gè)初 始模式,因此,子序列1和6構(gòu)成一個(gè)初始模式,子序列9和20構(gòu)成一個(gè)初始模式,子序列 100和130構(gòu)成一個(gè)初始模式。以子序列1和6構(gòu)成的一個(gè)初始模式來(lái)說(shuō),子序列1在時(shí)間 序列中的位置比較靠前,因此,子序列1為這個(gè)初始模式的起點(diǎn),子序列6在時(shí)間序列中位 置比較靠后,因此,子序列6為這個(gè)初始模式的終點(diǎn),而這個(gè)初始模式的長(zhǎng)度為子序列1和6 之間的距離。上述過(guò)程僅以子序列1和6構(gòu)成的一個(gè)初始模式為例進(jìn)行說(shuō)明,對(duì)于其他初 始模式原理相同,此處不再贅述。
[0144] 進(jìn)一步地,為了更直觀地標(biāo)識(shí)得到的初始模式,便于后續(xù)對(duì)初始模式進(jìn)行處理,在 本步驟中,可將得到的初始模式在二維空間中標(biāo)記出來(lái)。其中,標(biāo)記初始模式的二維空間包 括但不限于坐標(biāo)系、矩陣等,本實(shí)施例對(duì)標(biāo)記初始模式的二維空間不作具體的限定。
[0145] 為了便于理解上述步驟203至205的整個(gè)過(guò)程,下面將以設(shè)定的表示符號(hào)化的子 序列的符號(hào)種類為a b c,表示符號(hào)化的子序列的符號(hào)數(shù)為4個(gè),并結(jié)合圖4至圖7所示的 示意圖為例進(jìn)行詳細(xì)的解釋說(shuō)明。
[0146] 其中,圖4為記錄每個(gè)符號(hào)化的子序列的矩陣的示意圖,圖5和圖6為將符號(hào)化的 子序列進(jìn)行第一次和第二次隨機(jī)投影后的結(jié)果示意圖,圖7為標(biāo)記初始模式的坐標(biāo)系的示 意圖。其中,圖5為第一次隨機(jī)投影得到的投影結(jié)果,該第一次隨機(jī)投影選擇的投影位置分 別為圖4中的符號(hào)化的子序列的第1列和第2列。從圖5可以看出,第一次隨機(jī)投影過(guò)程 中第1個(gè)符號(hào)化的子序列和第58個(gè)符號(hào)化的子序列在投影位置上具有相同符號(hào),將第一次 隨機(jī)投影過(guò)程中第1個(gè)符號(hào)化的子序列與第58個(gè)符號(hào)化的子序列在投影位置上具有相同 符號(hào)的次數(shù)在圖5所示的矩陣中第1行和第58行交叉的位置上記錄下來(lái),即在圖5所示的 矩陣中橫軸為第1行和縱軸為第58行的交叉位置上記錄1 ;從圖5還可以看出,第一次隨機(jī) 投影過(guò)程中第2個(gè)符號(hào)化的子序列和第985個(gè)符號(hào)化的子序列在投影位置上也具有相同符 號(hào),將第一次隨機(jī)投影過(guò)程中第2個(gè)符號(hào)化的子序列與第985個(gè)符號(hào)化的子序列在投影位 置上具有相同符號(hào)的次數(shù)在圖5所示的矩陣中第2行和第985行交叉的位置上記錄下來(lái), 即在矩陣中橫軸為第2行和縱軸為第985行的交叉位置上記錄1。
[0147] 圖6為第二次隨機(jī)投影得到的投影結(jié)果,該第二次隨機(jī)投影選擇的投影位置分別 為圖4中的第2列和第4列。從圖6可以看出,第二次隨機(jī)投影過(guò)程中第1個(gè)符號(hào)化的子序 列和第58個(gè)符號(hào)化的子序列在投影位置上具有相同符號(hào),由于第一次隨機(jī)投影過(guò)程中第1 個(gè)符號(hào)化的子序列和第58個(gè)符號(hào)化的子序列在投影位置上具有相同符號(hào)的次數(shù)為1次,因 此,兩次隨機(jī)投影過(guò)程中第1個(gè)符號(hào)化的子序列和第58個(gè)符號(hào)化的子序列在投影位置上具 有相同符號(hào)的次數(shù)為2次,將兩次隨機(jī)投影過(guò)程中第1個(gè)符號(hào)化的子序列和第58個(gè)符號(hào)化 的子序列在投影位置上具有相同符號(hào)的次數(shù)在圖6所示的矩陣中第1行和第58行交叉的 位置上記錄下來(lái),即在矩陣中橫軸為第1行和縱軸為第58行的交叉位置上記錄2 ;從圖6可 以看出,第二次投影過(guò)程中第2個(gè)符號(hào)化的子序列和第985個(gè)符號(hào)化的子序列在投影位置 上符號(hào)不同,由于第一次隨機(jī)投影過(guò)程中第2個(gè)符號(hào)化的子序列和第985個(gè)符號(hào)化的子序 列在投影位置上具有相同符號(hào)的次數(shù)為1次,因此,兩次隨機(jī)投影過(guò)程中第2個(gè)符號(hào)化的子 序列和第985個(gè)符號(hào)化的子序列在投影位置上具有相同符號(hào)的次數(shù)為1次,將兩次隨機(jī)投 影過(guò)程中第2個(gè)符號(hào)化的子序列和第985個(gè)符號(hào)化的子序列在投影位置上具有相同符號(hào)的 次數(shù)在圖6所示的矩陣中第2行和第985行交叉的位置上記錄下來(lái),即在矩陣中橫軸為第 2行和縱軸為第985行的交叉位置上記錄1。
[0148] 上述僅以第1個(gè)符號(hào)化的子序列和第58個(gè)符號(hào)化的子序列、第2個(gè)符號(hào)化的子序 列和第985個(gè)符號(hào)化的子序列為例進(jìn)行說(shuō)明,圖中其他符號(hào)化的子序列的第一次和第二次 隨機(jī)投影的原理與圖4中第1個(gè)符號(hào)化的子序列和第58個(gè)符號(hào)化的子序列、第2個(gè)符號(hào)化 的子序列和第985個(gè)符號(hào)化的子序列的投影原理相同,具體參見(jiàn)對(duì)第1個(gè)符號(hào)化的子序列 和第58個(gè)符號(hào)化的子序列、第2個(gè)符號(hào)化的子序列和第985個(gè)符號(hào)化的子序列的分析,此 處不再一一說(shuō)明。
[0149] 經(jīng)過(guò)預(yù)設(shè)次數(shù)的隨機(jī)投影,可以得到記錄預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中每個(gè)符號(hào)化 的子序列與其他符號(hào)化的子序列在投影位置上具有相同符號(hào)的次數(shù)的矩陣,若設(shè)定第一閾 值為1000,將矩陣中記錄的大于1000的次數(shù)所對(duì)應(yīng)的每?jī)蓚€(gè)歸一化的子序列構(gòu)成一個(gè)初 始模式,并將該初始模式在圖7所示的坐標(biāo)系中標(biāo)記出來(lái)。坐標(biāo)系中的點(diǎn)的橫坐標(biāo)為初始 模式中位置靠前的子序列的編號(hào),縱坐標(biāo)為初始模式中位置靠后的子序列的編號(hào)。
[0150] 206:比較長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)之間的距離,將距離小于第二閾值且 長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)與起點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段, 終點(diǎn)與終點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,得到一組時(shí)間序列片段,每組 時(shí)間序列片段及未進(jìn)行連接的初始模式分別構(gòu)成時(shí)間序列模式。
[0151] 針對(duì)該步驟,由于受到噪聲以及隨機(jī)投影算法的概率原理等因素影響,致使本應(yīng) 連續(xù)的有些初始模式之間存在間斷,由于這些間斷的存在使得有些初始模式比實(shí)際模式要 短,而連續(xù)的大的模式對(duì)后續(xù)研究有著重要的意義,因此,為了提高識(shí)別出的初始模式的準(zhǔn) 確性,本實(shí)施例提供的方法可將由于噪聲以及隨機(jī)投影算法的概率原理等因素造成間斷的 初始模式連接起來(lái),構(gòu)成大的時(shí)間序列模式。
[0152] 對(duì)于上述過(guò)程,具體操作時(shí),考慮到位移差異,可將長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的 起點(diǎn)之間的距離進(jìn)行比較,如果每?jī)蓚€(gè)初始模式的起點(diǎn)之間的距離小于第二閾值,則將每 兩個(gè)初始模式的起點(diǎn)與起點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,終點(diǎn)與終點(diǎn)之 間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,這樣就可得到一組時(shí)間序列片段。這組時(shí)間 序列片段的起點(diǎn)為滿足條件的每?jī)蓚€(gè)初始模式的起點(diǎn)與起點(diǎn)之間的歸一化的子序列,終點(diǎn) 為滿足條件的每?jī)蓚€(gè)初始模式的終點(diǎn)與終點(diǎn)之間的歸一化的子序列。其中,第二閾值的大 小可以為1個(gè)數(shù)據(jù)長(zhǎng)度、2個(gè)數(shù)據(jù)長(zhǎng)度等,本實(shí)施例不對(duì)第二閾值的大小及數(shù)據(jù)長(zhǎng)度的大小 作具體的限定。由于在將長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)之間的距離進(jìn)行比較時(shí),會(huì)存 在長(zhǎng)度相同的兩個(gè)初始模式的起點(diǎn)之間的距離大于或等于第二閾值的情況。對(duì)于這種情 況,本實(shí)施例中不會(huì)將這些初始模式組成時(shí)間序列片段,但這些未組成時(shí)間序列片段的初 始模式和得到的每組時(shí)間序列片段可以分別構(gòu)成時(shí)間序列模式。
[0153] 為了將上述過(guò)程直觀地展現(xiàn)出來(lái),以坐標(biāo)系為例,詳細(xì)介紹構(gòu)成時(shí)間序列模式的 過(guò)程。該過(guò)程在具體執(zhí)行時(shí),分為如下幾步:
[0154] 第一步,將步驟205中得到的初始模式在坐標(biāo)系中標(biāo)記出來(lái)。具體標(biāo)記的初始模 式為 SMjnitial=IMiIMi = (Si_x,< Si_y,。其中,SM_initial 表示一個(gè)初始模式 集合,Mi表示第i個(gè)初始模式在坐標(biāo)系中的位置,Si^表示此初始模式的起點(diǎn)在坐標(biāo)系中的 位置,S i y表示此初始模式的終點(diǎn)在坐標(biāo)系中的位置。
[0155] 第二步,對(duì)標(biāo)記的所有初始模式增加標(biāo)簽bp判斷每?jī)蓚€(gè)初始模式的起點(diǎn)之間的 距離是否滿足第一條件,若滿足第一條件則認(rèn)為這兩個(gè)初始模式上的標(biāo)簽相同,并在坐標(biāo) 系中將這兩個(gè)具有相同標(biāo)簽的初始模式的起點(diǎn)連接起來(lái)。在連接過(guò)程中,還將繼續(xù)判斷連 接后的初始模式的起點(diǎn)與下一個(gè)初始模式的起點(diǎn)是否滿足條件。若滿足第一條件則認(rèn)為這 個(gè)連接后的初始模式上的標(biāo)簽與下一個(gè)初始模式上的標(biāo)簽相同,并在坐標(biāo)系中將這兩個(gè)具 有相同標(biāo)簽的初始模式的起點(diǎn)連接起來(lái)。以后依次判斷每?jī)蓚€(gè)初始模式的起點(diǎn)之間的距離 是否滿足第一條件,若滿足條件則認(rèn)為這兩個(gè)初始模式上的標(biāo)簽相同,并將具有相同標(biāo)簽 的初始模式的起點(diǎn)連接起來(lái)。若兩個(gè)初始模式的起點(diǎn)之間的距離不滿足第一條件,則將不 滿足第一條件的初始模式上的標(biāo)簽作為初始標(biāo)簽,從初始標(biāo)簽對(duì)應(yīng)的初始模式開(kāi)始判斷該 初始模式的起點(diǎn)與其他的初始模式的起點(diǎn)之間的距離是否滿足第一條件,具體的判斷過(guò)程 與上述判斷過(guò)程相同,此處不再贅述。
[0156] 其中,第一條件為I Sj X-Si x| = | Sj y_Si y|彡α,α為第二閾值。Si χ和Si y為第i 個(gè)初始模式的起點(diǎn)和終點(diǎn)在坐標(biāo)系中的位置,Sj_x為和Sj_y為第j個(gè)初始模式的起點(diǎn)和終點(diǎn) 在坐標(biāo)系中位置。如果兩個(gè)初始模式的起點(diǎn)之間的距離等于這兩個(gè)初始模式的終點(diǎn)之間的 距離,并且小于第二閾值,則將這兩個(gè)初始模式進(jìn)行連接,得到一條線段,該線段表示一組 時(shí)間序列片段。當(dāng)然,在進(jìn)行上述判斷時(shí),會(huì)存在某一初始模式與其他任意初始模式間都不 滿足條件的情況。對(duì)于這種情況,本實(shí)施例同樣不會(huì)將坐標(biāo)系中的這些初始模式進(jìn)行處理, 即未進(jìn)行連接的初始模式與得到的每組時(shí)間序列片段分別構(gòu)成時(shí)間序列模式。
[0157] 需要說(shuō)明的是,由于一個(gè)初始模式的起點(diǎn)和終點(diǎn)在坐標(biāo)系中為同一個(gè)點(diǎn),在坐標(biāo) 系中將每?jī)蓚€(gè)初始模式的起點(diǎn)和起點(diǎn)進(jìn)行連接,與終點(diǎn)和終點(diǎn)進(jìn)行連接時(shí),連接的為同一 點(diǎn),因此,此處僅用將兩個(gè)初始模式的起點(diǎn)進(jìn)行連接來(lái)表示將這兩個(gè)初始模式的起點(diǎn)和起 點(diǎn)進(jìn)行連接、終點(diǎn)和終點(diǎn)進(jìn)行連接。實(shí)際應(yīng)用中,將兩個(gè)初始模式的終點(diǎn)進(jìn)行連接的原理與 將兩個(gè)初始模式的終點(diǎn)進(jìn)行連接的原理相同。
[0158] 第三步,將第二步得到的時(shí)間序列模式在坐標(biāo)系中表示出來(lái)。如果第二步判斷出 有η個(gè)初始模式的起點(diǎn)之間的距離滿足條件,則連接后得到的時(shí)間序列的起點(diǎn)為第一個(gè)初 始模式的位置,終點(diǎn)為第η個(gè)初始模式的位置。具體得到的時(shí)間序列模式在坐標(biāo)系中表示 為:
[01 59] SM-Bp (Mp-begin,Mp-en(j) [ (Sp-begin-x,Sp-bengin-y),(Sp-end-x,Sp-end-y) ] 0
[0160] 其中,SM_Bp表示第p個(gè)時(shí)間序列模式在坐標(biāo)系中的位置,Mp b_為(sp b_ x,sp b__y),表示第P個(gè)初始模式在坐標(biāo)系中的開(kāi)始位置,M p md為(sp md x,Sp md y),表示第p個(gè) 初始模式在坐標(biāo)系中的結(jié)束位置。sp_begin_x表示第P個(gè)初始模式x方向上的起點(diǎn)在需要分 析的時(shí)間序列中的位置,s p begin y表示第p個(gè)初始模式的終點(diǎn)在需要分析的時(shí)間序列中的位 置,sp_md_x表示第η個(gè)初始^模式的起點(diǎn)在需要分析的時(shí)間序列中的位置, Sp md y表示第η個(gè) 初始模式的終點(diǎn)在需要分析的時(shí)間序列中的位置。
[0161] 進(jìn)一步地,雖然經(jīng)過(guò)上述步驟已識(shí)別出時(shí)間序列模式,但在更大的范圍內(nèi)可能會(huì) 存在更長(zhǎng)的模式,而更長(zhǎng)的模式對(duì)于未來(lái)的分析也是十分有意義的,因此,本實(shí)施例提供的 方法還提供了識(shí)別出可能存在的更長(zhǎng)模式的后續(xù)步驟。
[0162] 207:將起點(diǎn)相鄰的每?jī)蓚€(gè)時(shí)間序列模式的起點(diǎn)之間的距離與第一預(yù)設(shè)距離進(jìn)行 比較。
[0163] 針對(duì)該步驟,之所以將起點(diǎn)相鄰的每?jī)蓚€(gè)時(shí)間序列模式的起點(diǎn)之間的距離與第一 預(yù)設(shè)距離進(jìn)行比較,是為了保證識(shí)別出的更長(zhǎng)模式中的時(shí)間序列差異不會(huì)太大,從而保證 識(shí)別出的時(shí)間序列模式的準(zhǔn)確性。為此,本實(shí)施例提供的方法先將起點(diǎn)相鄰的每?jī)蓚€(gè)時(shí)間 序列模式的起點(diǎn)之間的距離與第一預(yù)設(shè)距離進(jìn)行比較,而該第一預(yù)設(shè)距離可以反映出起點(diǎn) 相鄰的兩個(gè)時(shí)間序列模式構(gòu)成一個(gè)更長(zhǎng)模式時(shí),該起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的差 異范圍。其中,第一預(yù)設(shè)距離的大小可以是1個(gè)數(shù)據(jù)長(zhǎng)度、2個(gè)數(shù)據(jù)長(zhǎng)度、3個(gè)數(shù)據(jù)長(zhǎng)度,本 實(shí)施例不對(duì)第一預(yù)設(shè)距離的大小及數(shù)據(jù)長(zhǎng)度的大小作具體的限定。
[0164] 在將起點(diǎn)相鄰的每?jī)蓚€(gè)時(shí)間序列模式的起點(diǎn)之間的距離與第一預(yù)設(shè)距離進(jìn)行比 較時(shí),本實(shí)施例不對(duì)具體比較方式進(jìn)行限定。具體實(shí)施時(shí),比較結(jié)果包括但不限于:起點(diǎn)相 鄰的兩個(gè)時(shí)間序列模式的起點(diǎn)之間的距離小于第一預(yù)設(shè)距離、起點(diǎn)相鄰的兩個(gè)時(shí)間序列模 式的起點(diǎn)之間的距離大于第一預(yù)設(shè)距離及起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式的起點(diǎn)之間的距 離等于第一預(yù)設(shè)距離的情況。
[0165] 該步驟在坐標(biāo)系中表示時(shí),具體過(guò)程如下:
[0166] 第一步,將步驟206中得到的時(shí)間序列模式在坐標(biāo)系中標(biāo)識(shí)出來(lái)后,時(shí)間序列模 式在坐標(biāo)系中表為:
[01 67] SM-Bp (Mp-begin,Mp-end) I- ^p_begin_x? ^p bengin y^ ? ^p_end_x? ^p end y^ -I °
[0168] 其中,時(shí)間序列模式中的各個(gè)字母的含義與上述步驟206中時(shí)間序列模式的各個(gè) 字母的含義相同,具體詳見(jiàn)上述步驟206,此處不再贅述。
[0169] 第二步,一條直線上相鄰的兩個(gè)時(shí)間序列模式作為起點(diǎn)相鄰的時(shí)間序列模式,將 起點(diǎn)相鄰的時(shí)間序列模式的起點(diǎn)之間的距離與第一預(yù)設(shè)距離進(jìn)行比較。
[0170] 具體地,由于時(shí)間序列模式在坐標(biāo)系中可用直線y=x+b表示,在確定坐標(biāo)系中兩 個(gè)時(shí)間序列模式是否在一條直線上時(shí),如果起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式中的起點(diǎn)的第一 個(gè)時(shí)間序列模式的最后一個(gè)片段和第二個(gè)時(shí)間序列模式的最開(kāi)始的片段在一條直線上,則 判定這兩個(gè)起點(diǎn)相鄰的時(shí)間序列模式在一條直線上。
[0171] 第三步,在判斷兩個(gè)時(shí)間序列模式在一條直線上后,相鄰的兩個(gè)時(shí)間序列模式的 起點(diǎn)分別對(duì)應(yīng)坐標(biāo)系中X坐標(biāo),因此,繼續(xù)判斷起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式的起點(diǎn)間的 距離與第一預(yù)設(shè)距離的關(guān)系。該步在具體實(shí)施時(shí),將坐標(biāo)系中位于同一直線上相鄰的兩個(gè) 時(shí)間序列模式的橫坐標(biāo)之間的距離與第一預(yù)設(shè)距離進(jìn)行比較。
[0172] 208 :如果存在起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式的起點(diǎn)之間的距離小于等于第一預(yù) 設(shè)距離,則將起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差與第三閾值進(jìn)行比較,并將起點(diǎn) 相鄰的兩個(gè)時(shí)間序列模式之間的均值與第四閾值進(jìn)行比較。
[0173] 針對(duì)該步驟,為了使構(gòu)成的更長(zhǎng)模式更為準(zhǔn)確,本實(shí)施例提供的方法在將兩個(gè)時(shí) 間序列模式構(gòu)成更長(zhǎng)模式時(shí),不僅要考慮兩個(gè)時(shí)間序列模式之間的距離,還要考慮位移信 息和比例縮放信息。由于標(biāo)準(zhǔn)差可以反映兩個(gè)模式之間的比例縮放信息,均值可以反映兩 個(gè)模式之間的位移信息,因此,如果存在起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式的起點(diǎn)之間的距離 小于等于第一預(yù)設(shè)距離的情況,本實(shí)施例提供的方法將進(jìn)一步將起點(diǎn)相鄰的兩個(gè)時(shí)間序列 模式之間的標(biāo)準(zhǔn)差與第三閾值進(jìn)行比較,并將起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的均值與 第四閾值進(jìn)行比較。其中,第三閾值代表構(gòu)成更長(zhǎng)模式時(shí)可允許的比例縮放誤差范圍,第四 閾值代表構(gòu)成更長(zhǎng)模式時(shí)可允許的位移誤差范圍。本實(shí)施例不對(duì)第三閾值及第四閾值的具 體數(shù)值進(jìn)行限定,具體實(shí)施時(shí),可根據(jù)經(jīng)驗(yàn)數(shù)據(jù)設(shè)定。
[0174] 對(duì)于上述過(guò)程,下面將以設(shè)定第一預(yù)設(shè)距離為1個(gè)數(shù)據(jù)長(zhǎng)度為例進(jìn)行詳細(xì)的解釋 說(shuō)明。
[0175] 例如,時(shí)間序列模式1和時(shí)間序列模式2的起點(diǎn)相鄰,時(shí)間序列模式2和時(shí)間序列 模式3的起點(diǎn)相鄰,時(shí)間序列模式3和時(shí)間序列模式4的起點(diǎn)相鄰,且時(shí)間序列模式1和時(shí) 間序列模式2的起點(diǎn)之間的距離為0. 5個(gè)數(shù)據(jù)長(zhǎng)度,時(shí)間序列模式2和時(shí)間序列模式3的 起點(diǎn)之間的距離為1. 5個(gè)數(shù)據(jù)長(zhǎng)度。由于第一預(yù)設(shè)距離為1數(shù)據(jù)長(zhǎng)度,時(shí)間序列模式1和 時(shí)間序列模式2的起點(diǎn)之間的距離為0. 5個(gè)數(shù)據(jù)長(zhǎng)度,0. 5個(gè)數(shù)據(jù)長(zhǎng)度小于1數(shù)據(jù)長(zhǎng)度,則 繼續(xù)將這兩個(gè)時(shí)間序列模式的標(biāo)準(zhǔn)差與第三閾值進(jìn)行比較,并將這兩個(gè)時(shí)間序列模式的均 值與第四閾值進(jìn)行比較。同理,由于時(shí)間序列模式2和時(shí)間序列模式3的起點(diǎn)之間的距離 大于第一預(yù)設(shè)距離,則不會(huì)繼續(xù)將這兩個(gè)時(shí)間序列模式的標(biāo)準(zhǔn)差與第三閾值進(jìn)行比較,并 將這兩個(gè)時(shí)間序列模式的均值與第四閾值進(jìn)行比較。
[0176] 進(jìn)一步地,結(jié)合上述步驟得到的結(jié)果,如果存在起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式的 起點(diǎn)之間的距離小于等于第一預(yù)設(shè)距離,則將起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn) 差與第三閾值進(jìn)行比較,并將起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的均值與第四閾值進(jìn)行比 較,即比較起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式在X方向的縮放比例與Y方向的縮放比例是否接 近,起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式在X方向的位移和Y方向的位移是否一致。
[0177] 為了便于理解上述過(guò)程,下面以坐標(biāo)系中起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式為如下所 示的時(shí)間序列模式為例進(jìn)行詳細(xì)的解釋說(shuō)明。
[0178] SM_Bi = (Mi begin,Mi end) = [(si begin-x,si engin_ _y) '(Si -end-x' Si-end-y)]矛口
[0179] SM_Bj - (Mj begin, Mj end) - [ (s』-begin-x,Sj:engin- y),(s』-end-x,Sj:end- y)],
[0180] 其中,SiLBi為起點(diǎn)相鄰的時(shí)間序列的第i個(gè)時(shí)間序列模式,SM_B^為第j個(gè)時(shí)間 序列模式。若SiLB i在直線y=x+b上,則SiLBi的坐標(biāo)滿足直線方程y=x+b,將SiLBi的最后 一個(gè)片段(s j end_x,Sj end y)代入方程,可得 si end_y=si end_x+b,整理得到 b = Si end y-Si end x。若 Sj-begin-y = Sj-begin-χ+b,其中 b = Si---y-Si-end-χ,則 SlVLBi 的最后一個(gè)片段(Suaid-廠Suindj)和 SM_Bj的第一個(gè)片段(sjJregin_x,Sj_be;gin_ y)在一條直線上,進(jìn)而得出SM_Bi和SM_Bj在一條直線 上。
[0181] 進(jìn)一步地,如果得出SiLBj和SiLBi起點(diǎn)之間的距離接近第一預(yù)設(shè)距離,用公式表 示為

【權(quán)利要求】
1. 一種識(shí)別時(shí)間序列模式的方法,其特征在于,所述方法包括: 獲取需要分析的時(shí)間序列,對(duì)所述時(shí)間序列進(jìn)行預(yù)處理,得到至少兩個(gè)歸一化的子序 列; 將每個(gè)歸一化的子序列轉(zhuǎn)化為符號(hào)化的子序列,并對(duì)每個(gè)符號(hào)化的子序列進(jìn)行預(yù)設(shè)次 數(shù)的隨機(jī)投影; 記錄每個(gè)符號(hào)化的子序列在所述預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其他符號(hào)化的子序列 在投影位置上具有相同符號(hào)的次數(shù); 將記錄的次數(shù)與第一閾值進(jìn)行比較,并將大于第一閾值的每個(gè)次數(shù)所對(duì)應(yīng)的每?jī)蓚€(gè)歸 一化的子序列構(gòu)成一個(gè)初始模式,每個(gè)初始模式包括的兩個(gè)歸一化的子序列中位置靠前的 子序列為所述初始模式的起點(diǎn),位置靠后的子序列為所述初始模式的終點(diǎn),每個(gè)初始模式 的起點(diǎn)與終點(diǎn)之間的距離為初始模式的長(zhǎng)度; 比較長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)之間的距離,將距離小于第二閾值且長(zhǎng)度相同 的每?jī)蓚€(gè)初始模式的起點(diǎn)與起點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,終點(diǎn)與終 點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,得到一組時(shí)間序列片段,每組時(shí)間序列 片段及未組成時(shí)間序列片段的初始模式分別構(gòu)成時(shí)間序列模式。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述時(shí)間序列進(jìn)行預(yù)處理,得到至 少兩個(gè)歸一化的子序列,包括: 以預(yù)設(shè)窗口大小將所述時(shí)間序列劃分成至少兩個(gè)子序列; 對(duì)每個(gè)子序列進(jìn)行Z歸一化處理,得到至少兩個(gè)歸一化的子序列。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述每組時(shí)間序列片段及未組成時(shí)間序 列片段的初始模式分別構(gòu)成時(shí)間序列模式之后,還包括: 將起點(diǎn)相鄰的每?jī)蓚€(gè)時(shí)間序列模式的起點(diǎn)之間的距離與第一預(yù)設(shè)距離進(jìn)行比較; 如果存在起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式的起點(diǎn)之間的距離小于等于第一預(yù)設(shè)距離,則 將所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差與第三閾值進(jìn)行比較,并將所述起點(diǎn)相 鄰的兩個(gè)時(shí)間序列模式之間的均值與第四閾值進(jìn)行比較; 如果所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差小于等于第三閾值,且所述起點(diǎn) 相鄰的兩個(gè)時(shí)間序列模式之間的均值小于等于第四閾值,則確定所述起點(diǎn)相鄰的兩個(gè)時(shí)間 序列模式構(gòu)成帶有形變的連續(xù)模式。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述確定所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列 模式構(gòu)成帶有形變的連續(xù)模式之后,還包括: 從帶有形變的連續(xù)模式及未構(gòu)成帶有形變的連續(xù)模式的時(shí)間序列模式中選擇一個(gè)模 式作為第一模式,并選擇另一個(gè)模式作為第二模式,將所述第一模式的起點(diǎn)與所述第二模 式的起點(diǎn)之間的距離與所述第一預(yù)設(shè)距離進(jìn)行比較; 如果所述第一模式的起點(diǎn)與所述第二模式的起點(diǎn)之間的距離大于所述第一預(yù)設(shè)距離, 將所述第一模式與所述第二模式之間的標(biāo)準(zhǔn)差與所述第三閾值進(jìn)行比較,并將所述第一模 式與所述第二模式之間的均值與所述第四閾值進(jìn)行比較; 如果所述第一模式與所述第二模式之間的標(biāo)準(zhǔn)差小于等于所述第三閾值,且所述第一 模式與所述第二模式之間的均值小于等于所述第四閾值,則確定所述第一模式與所述第二 模式構(gòu)成帶有間隔的連續(xù)模式。
5. 根據(jù)權(quán)利要求3或4所述的方法,其特征在于,所述確定所述起點(diǎn)相鄰的兩個(gè)時(shí)間序 列模式構(gòu)成帶有形變的連續(xù)模式之后,還包括: 如果存在起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式,則將起點(diǎn)有重疊的兩個(gè)帶有形變的 連續(xù)模式合并為一個(gè)帶有形變的連續(xù)模式。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述將起點(diǎn)有重疊的兩個(gè)帶有形變的連 續(xù)模式合并為一個(gè)帶有形變的連續(xù)模式之前,還包括: 確定所述起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式之間的重疊范圍是否滿足第一預(yù)設(shè) 條件,如果滿足第一預(yù)設(shè)條件,則執(zhí)行將起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式合并為一 個(gè)帶有形變的連續(xù)模式的步驟。
7. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述確定所述第一模式與所述第二模式 構(gòu)成帶有間隔的連續(xù)模式之后,還包括: 如果存在起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式,則將起點(diǎn)有重疊的兩個(gè)帶有間隔的 連續(xù)模式合并為一個(gè)帶有間隔的連續(xù)模式。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述將起點(diǎn)有重疊的兩個(gè)帶有間隔的連 續(xù)模式合并為一個(gè)帶有間隔的連續(xù)模式之前,還包括: 確定所述起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式之間的重疊范圍是否滿足第二預(yù)設(shè) 條件,如果滿足第二預(yù)設(shè)條件,則執(zhí)行將起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式合并為一 個(gè)帶有間隔的連續(xù)模式的步驟。
9. 一種識(shí)別時(shí)間序列模式的裝置,其特征在于,所述裝置包括: 獲取模塊,用于獲取需要分析的時(shí)間序列; 預(yù)處理模塊,用于對(duì)所述時(shí)間序列進(jìn)行預(yù)處理,得到至少兩個(gè)歸一化的子序列; 轉(zhuǎn)化模塊,用于將每個(gè)歸一化的子序列轉(zhuǎn)化為符號(hào)化的子序列; 投影模塊,用于對(duì)每個(gè)符號(hào)化的子序列進(jìn)行預(yù)設(shè)次數(shù)的隨機(jī)投影; 記錄模塊,用于記錄每個(gè)符號(hào)化的子序列在所述預(yù)設(shè)次數(shù)的隨機(jī)投影過(guò)程中與其他符 號(hào)化的子序列在投影位置上具有相同符號(hào)的次數(shù); 第一比較模塊,用于將記錄的次數(shù)與第一閾值進(jìn)行比較,并將大于第一閾值的每個(gè)次 數(shù)所對(duì)應(yīng)的每?jī)蓚€(gè)歸一化的子序列構(gòu)成一個(gè)初始模式,每個(gè)初始模式包括的兩個(gè)歸一化的 子序列中位置靠前的子序列為所述初始模式的起點(diǎn),位置靠后的子序列為所述初始模式的 終點(diǎn),每個(gè)初始模式的起點(diǎn)與終點(diǎn)之間的距離為初始模式的長(zhǎng)度; 第二比較模塊,用于比較長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)之間的距離,將距離小于 第二閾值且長(zhǎng)度相同的每?jī)蓚€(gè)初始模式的起點(diǎn)與起點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí) 間序列片段,終點(diǎn)與終點(diǎn)之間的歸一化的子序列構(gòu)成一個(gè)時(shí)間序列片段,得到一組時(shí)間序 列片段,每組時(shí)間序列片段及未組成時(shí)間序列片段的初始模式分別構(gòu)成時(shí)間序列模式。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述預(yù)處理模塊,包括: 劃分單元,用于以預(yù)設(shè)窗口大小將所述時(shí)間序列劃分成至少兩個(gè)子序列; 處理單元,用于對(duì)每個(gè)子序列進(jìn)行Z歸一化處理,得到至少兩個(gè)歸一化的子序列。
11. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括: 第三比較模塊,用于將起點(diǎn)相鄰的每?jī)蓚€(gè)時(shí)間序列模式的起點(diǎn)之間的距離與第一預(yù)設(shè) 距離進(jìn)行比較; 第四比較模塊,用于當(dāng)存在起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式的起點(diǎn)之間的距離小于等 于第一預(yù)設(shè)距離時(shí),將所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差與第三閾值進(jìn)行比 較,并將所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的均值與第四閾值進(jìn)行比較; 第一確定模塊,用于當(dāng)所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的標(biāo)準(zhǔn)差小于等于第三 閾值,且所述起點(diǎn)相鄰的兩個(gè)時(shí)間序列模式之間的均值小于等于第四閾值時(shí),確定所述起 點(diǎn)相鄰的兩個(gè)時(shí)間序列模式構(gòu)成帶有形變的連續(xù)模式。
12. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述裝置還包括: 選擇模塊,用于從帶有形變的連續(xù)模式及未構(gòu)成帶有形變的連續(xù)模式的時(shí)間序列模式 中選擇一個(gè)模式作為第一模式,并選擇另一個(gè)模式作為第二模式; 第五比較模塊,用于將所述第一模式的起點(diǎn)與所述第二模式的起點(diǎn)之間的距離與所述 第一預(yù)設(shè)距離進(jìn)行比較; 第六比較模塊,用于當(dāng)所述第一模式的起點(diǎn)與所述第二模式的起點(diǎn)之間的距離大于所 述第一預(yù)設(shè)距離時(shí),將所述第一模式與所述第二模式之間的標(biāo)準(zhǔn)差與所述第三閾值進(jìn)行比 較,并將所述第一模式與所述第二模式之間的均值與所述第四閾值進(jìn)行比較; 第二確定模塊,用于當(dāng)所述第一模式與所述第二模式之間的標(biāo)準(zhǔn)差小于等于所述第三 閾值,且所述第一模式與所述第二模式之間的均值小于等于所述第四閾值時(shí),確定所述第 一模式與所述第二模式構(gòu)成帶有間隔的連續(xù)模式。
13. 根據(jù)權(quán)利要求11或12所述的裝置,其特征在于,所述裝置還包括: 第一合并模塊,用于當(dāng)存在起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式時(shí),將起點(diǎn)有重疊 的兩個(gè)帶有形變的連續(xù)模式合并為一個(gè)帶有形變的連續(xù)模式。
14. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括: 第三確定模塊,用于確定所述起點(diǎn)有重疊的兩個(gè)帶有形變的連續(xù)模式之間的重疊范圍 是否滿足第一預(yù)設(shè)條件; 所述第一合并模塊,用于當(dāng)滿足第一預(yù)設(shè)條件時(shí),執(zhí)行將起點(diǎn)有重疊的兩個(gè)帶有形變 的連續(xù)模式合并為一個(gè)帶有形變的連續(xù)模式的步驟。
15. 根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述裝置還包括: 第二合并模塊,用于當(dāng)存在起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式時(shí),將起點(diǎn)有重疊 的兩個(gè)帶有間隔的連續(xù)模式合并為一個(gè)帶有間隔的連續(xù)模式。
16. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述裝置還包括: 第四確定模塊,用于確定所述起點(diǎn)有重疊的兩個(gè)帶有間隔的連續(xù)模式之間的重疊范圍 是否滿足第二預(yù)設(shè)條件; 所述第二合并模塊,用于當(dāng)滿足第二預(yù)設(shè)條件時(shí),執(zhí)行將起點(diǎn)有重疊的兩個(gè)帶有間隔 的連續(xù)模式合并為一個(gè)帶有間隔的連續(xù)模式的步驟。
【文檔編號(hào)】G06F17/30GK104516914SQ201310461049
【公開(kāi)日】2015年4月15日 申請(qǐng)日期:2013年9月30日 優(yōu)先權(quán)日:2013年9月30日
【發(fā)明者】李建強(qiáng), 段運(yùn)強(qiáng), 劉春辰, 劉博
申請(qǐng)人:日電(中國(guó))有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1