一種基于局部距離度量學(xué)習(xí)的多交易賬戶識(shí)別方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于局部距離度量學(xué)習(xí)的多交易賬戶識(shí)別方法,包括步驟:收集多個(gè)多交易賬戶的歷史數(shù)據(jù)作為訓(xùn)練樣本集,并對(duì)每個(gè)訓(xùn)練樣本進(jìn)行類(lèi)型標(biāo)記;提取標(biāo)記后的每個(gè)訓(xùn)練樣本所對(duì)應(yīng)多交易賬戶的操作特征和用戶基本特征;根據(jù)所標(biāo)記的訓(xùn)練樣本集,訓(xùn)練用于判斷兩個(gè)樣本是否為同一類(lèi)型的局部距離度量模型;根據(jù)所述局部距離度量模型對(duì)待識(shí)別多交易賬戶的類(lèi)型進(jìn)行識(shí)別。本發(fā)明可以自動(dòng)獲取各個(gè)交易賬戶對(duì)應(yīng)用戶的偏好,即對(duì)用戶進(jìn)行分類(lèi)標(biāo)記,以便于更加靈活地的安排各個(gè)用戶在交易過(guò)程中的行為,也使得可通過(guò)對(duì)不同用戶的行為進(jìn)行分析,以評(píng)估不同用戶風(fēng)險(xiǎn)承受能力的實(shí)現(xiàn)成為可能。
【專(zhuān)利說(shuō)明】-種基于局部距離度量學(xué)習(xí)的多交易賬戶識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種模式識(shí)別與人工智能技術(shù),尤其涉及一種基于局部距離度量學(xué)習(xí) 的多交易賬戶識(shí)別方法。
【背景技術(shù)】
[0002] 利用計(jì)算機(jī)平臺(tái)輸入交易指令的算法交易已經(jīng)成為目前主流的交易方式之一。普 通的算法委托平臺(tái)支持單個(gè)交易賬號(hào)操作,這種方式造成了操作分散影響交易的效率,并 且在單交易賬戶情況下無(wú)法設(shè)置靈活可靠的交易、止損等策略,限制了自動(dòng)算法交易的能 力。而目前的多交易賬戶管理方式仍需要大量的人為操作,這種方式不僅繁瑣,而且工作量 較大,工作效率低。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明實(shí)施例所要解決的技術(shù)問(wèn)題在于,提供基于局部距離度量學(xué)習(xí)的多交易賬 戶識(shí)別方法,從而通過(guò)利用局部距離度量學(xué)習(xí)方法對(duì)多個(gè)多交易賬戶已有的行為進(jìn)行分析 學(xué)習(xí)以自動(dòng)獲取各個(gè)用戶偏好,即根據(jù)該偏好將用戶進(jìn)行分類(lèi)標(biāo)記,以便于更加靈活地的 安排各個(gè)用戶在交易過(guò)程中的行為,也使得可通過(guò)對(duì)不同用戶的行為進(jìn)行分析,以評(píng)估不 同用戶風(fēng)險(xiǎn)承受能力的實(shí)現(xiàn)成為可能。
[0004] 為了解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供了一種基于局部距離度量學(xué)習(xí)的多交 易賬戶識(shí)別方法,包括步驟:
[0005] 收集多個(gè)交易賬戶的歷史數(shù)據(jù)作為訓(xùn)練樣本集,并對(duì)每個(gè)訓(xùn)練樣本進(jìn)行類(lèi)型標(biāo) 記;
[0006] 提取標(biāo)記后的每個(gè)訓(xùn)練樣本所對(duì)應(yīng)交易賬戶的操作特征和用戶基本特征;
[0007] 根據(jù)所標(biāo)記的訓(xùn)練樣本集,訓(xùn)練用于判斷兩個(gè)樣本是否為同一類(lèi)型的局部距離度 量模型;
[0008] 根據(jù)所述局部距離度量模型對(duì)待識(shí)別多個(gè)交易賬戶的類(lèi)型進(jìn)行識(shí)別。
[0009] 進(jìn)一步地,所述根據(jù)局部距離度量模型對(duì)待識(shí)別多個(gè)交易賬戶的類(lèi)型進(jìn)行識(shí)別的 步驟,具體包括:
[0010] 收集待識(shí)別的多個(gè)交易賬戶的歷史數(shù)據(jù)作為待標(biāo)記樣本集;
[0011] 設(shè)定已標(biāo)記的訓(xùn)練樣本集中訓(xùn)練樣本的個(gè)數(shù)為n個(gè),待標(biāo)記樣本集中待標(biāo)記樣本 個(gè)數(shù)為u個(gè),并給定一對(duì)特征向量對(duì)Xi和\分別代表兩個(gè)樣本,給定一個(gè)包含所有已標(biāo)記 訓(xùn)練樣本和所有待標(biāo)記樣本的圖結(jié)構(gòu)G,并形成正則化框架:
[0012]
【權(quán)利要求】
1. 一種基于距離度量學(xué)習(xí)的多交易賬戶識(shí)別方法,其特征在于,包括步驟: 收集多個(gè)多交易賬戶的歷史數(shù)據(jù)作為訓(xùn)練樣本集,并對(duì)每個(gè)訓(xùn)練樣本進(jìn)行類(lèi)型標(biāo)記; 提取標(biāo)記后的每個(gè)訓(xùn)練樣本所對(duì)應(yīng)的交易賬戶的操作特征和用戶基本特征; 根據(jù)所標(biāo)記的訓(xùn)練樣本集,訓(xùn)練用于判斷兩個(gè)樣本是否為同一類(lèi)型的局部距離度量模 型; 根據(jù)所述局部距離度量模型對(duì)待識(shí)別多交易賬戶的類(lèi)型進(jìn)行識(shí)別。
2. 如權(quán)利要求1所述的基于距離度量學(xué)習(xí)的多交易賬戶識(shí)別方法,其特征在于,所述 根據(jù)局部距離度量模型對(duì)待識(shí)別多交易賬戶的類(lèi)型進(jìn)行識(shí)別的步驟,具體包括: 收集待識(shí)別的多個(gè)交易賬戶的歷史數(shù)據(jù)作為待標(biāo)記樣本集; 設(shè)定已標(biāo)記的訓(xùn)練樣本集中訓(xùn)練樣本的個(gè)數(shù)為η個(gè),待標(biāo)記樣本集中待標(biāo)記樣本個(gè)數(shù) 為u個(gè),并給定一對(duì)特征向量對(duì)Xi和\分別代表兩個(gè)樣本,給定一個(gè)包含所有已標(biāo)記訓(xùn)練 樣本和所有待標(biāo)記樣本的圖結(jié)構(gòu)G,并形成正則化框架:
s.t.Wi $ 0,i= 1,…,n+u, 其中,W = [W1,...,wn+u]是由η個(gè)已標(biāo)記訓(xùn)練樣本和u個(gè)待標(biāo)記樣本的樣本自適應(yīng) 距離Wi組成的;當(dāng)樣本Xi和樣本&是同類(lèi)型的多交易賬戶時(shí),則樣本Xi和\的示性變量 =1,且Yi =y」,其中Yi表示樣本Xi的標(biāo)記,yj表示樣本Xj的標(biāo)記,而當(dāng)樣本Xi和Xj不 是同類(lèi)型的多交易賬戶時(shí),該示性變量&_=-1 ; 1是一個(gè)任意的凸損失函數(shù);Ω是一個(gè)正 則化項(xiàng);集合Si是由與標(biāo)記訓(xùn)練樣本Xi來(lái)自于同類(lèi)型的訓(xùn)練樣本組成的集合;集合Di是由 與已標(biāo)記訓(xùn)練樣本Xi來(lái)自于不同類(lèi)型的訓(xùn)練樣本組成的集合;λ是調(diào)節(jié)損失函數(shù)和正則 化項(xiàng)重要性的參數(shù); 利用二次規(guī)劃求解算法求解上式,獲得每個(gè)樣本的局部距離度量; 根據(jù)獲得的每個(gè)樣本的局部距離度量,對(duì)所述待標(biāo)記樣本集進(jìn)行類(lèi)型標(biāo)記。
3. 如權(quán)利要求2所述的基于局部距離度量學(xué)習(xí)的多交易賬戶識(shí)別方法,其特征在于, 所述1為應(yīng)用于分類(lèi)的hinge損失函數(shù)或者用于回歸模型的平方損失函數(shù)。
4. 如權(quán)利要求2所述的基于局部距離度量學(xué)習(xí)的多交易賬戶識(shí)別方法,其特征在于, 所述根據(jù)所獲得的每個(gè)樣本的局部距離度量,對(duì)所述待標(biāo)記樣本集進(jìn)行類(lèi)型標(biāo)記的步驟, 具體為: 根據(jù)各自的距離度量函數(shù),計(jì)算每個(gè)待標(biāo)記樣本到其近鄰的標(biāo)記樣本之間的距離,由 其近鄰進(jìn)行加權(quán)投票得到該待標(biāo)記樣本的類(lèi)型,并進(jìn)行標(biāo)記。
【文檔編號(hào)】G06K9/66GK104318268SQ201410629744
【公開(kāi)日】2015年1月28日 申請(qǐng)日期:2014年11月11日 優(yōu)先權(quán)日:2014年11月11日
【發(fā)明者】詹德川, 周尚晨 申請(qǐng)人:蘇州晨川通信科技有限公司