亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種數(shù)據(jù)處理方法及裝置與流程

文檔序號:12464790閱讀:281來源:國知局
一種數(shù)據(jù)處理方法及裝置與流程
本發(fā)明涉及計算機領域,尤其涉及一種數(shù)據(jù)處理方法及裝置。
背景技術
:數(shù)據(jù)挖掘是數(shù)據(jù)庫知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabases,KDD)中的一個步驟,通過從大量數(shù)據(jù)中尋找隱藏的關系提取出有價值的信息。數(shù)據(jù)挖掘的一般流程包括業(yè)務理解、數(shù)據(jù)理解、數(shù)據(jù)準備、超參數(shù)(Hyperparameter)設置、建立模型、模型評估、模型部署,其中,建立模型需要使用超參數(shù),可以使用隨機森林算法建立模型,隨機森林是一種有監(jiān)督的集成學習分類技術,其模型由一組決策樹分類器組成,模型對數(shù)據(jù)的分類是通過單個決策樹的分類結(jié)果進行集體投票來決定最終結(jié)果。它結(jié)合了LeoBreiman的Bagging集成學習理論與Ho提出的隨機子空間方法,通過對訓練樣本空間和屬性空間注入隨機性,充分保證了每個決策樹之間的獨立性和差異性,很好地克服了決策樹過擬合問題,同時對噪聲和異常值也有較好的魯棒性(Robust)。數(shù)據(jù)挖掘技術主要分為兩個發(fā)展方向,一個是針對靜態(tài)數(shù)據(jù)進行建立模型分析,一個是針對不斷變化的數(shù)據(jù)進行增量建立模型分析。在增量建立模型分析中,當有新的數(shù)據(jù)集時,需要更新原來已創(chuàng)建的模型,以確保更新后的模型能夠反映新的數(shù)據(jù)集的信息。增量建立模型分析處理的是不斷變化的數(shù)據(jù)集,數(shù)據(jù)集不同,建立模型所需要使用的超參數(shù)就可能不同。因此,為了保證使用新數(shù)據(jù)集更新原來已創(chuàng)建的模型后,得到的更新后的模型的模型效果不變差,就需要對創(chuàng)建原模型時使用的超參數(shù)進行調(diào)整。然而,在數(shù)據(jù)不斷變化的情況下,目前對超參數(shù)進行調(diào)整依賴專家經(jīng)驗,需要專家根據(jù)模型效果來調(diào)整超參數(shù),效率低下,導致在進行數(shù)據(jù)處理時的效率低下。技術實現(xiàn)要素:本發(fā)明的實施例提供一種數(shù)據(jù)處理方法和裝置,能夠解決在數(shù)據(jù)不斷變化的情況下,調(diào)整超參數(shù)依賴專家經(jīng)驗導致超參數(shù)調(diào)整效率低, 從而導致數(shù)據(jù)處理效率低的問題。第一方面,提供了一種數(shù)據(jù)處理方法,包含數(shù)據(jù)處理裝置利用第一數(shù)據(jù)模型對接收到的數(shù)據(jù)集進行處理的過程,所述第一數(shù)據(jù)模型根據(jù)超參數(shù)確定,所述方法包括:所述數(shù)據(jù)處理裝置獲取第一數(shù)據(jù)集,確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于第二數(shù)據(jù)集的數(shù)據(jù)特征的變化,所述第二數(shù)據(jù)集為所述數(shù)據(jù)處理裝置在獲取所述第一數(shù)據(jù)集之前收到的數(shù)據(jù)集;當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù);根據(jù)所述確定的超參數(shù)和所述第一數(shù)據(jù)集確定第一數(shù)據(jù)模型;根據(jù)所述確定的第一數(shù)據(jù)模型進行數(shù)據(jù)處理。結(jié)合第一方面的實現(xiàn)方式,在第一方面第一種可能的實現(xiàn)方式中,所述方法還包括第二數(shù)據(jù)模型,根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果;根據(jù)所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)模型,確定第三數(shù)據(jù)模型;根據(jù)所述第一數(shù)據(jù)集確定所述第三數(shù)據(jù)模型的效果;確定所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化;當所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。結(jié)合第一方面、第一方面的第一種可能的實現(xiàn)方式,在第二種可能實現(xiàn)的方式中,所述方法還包括窗口長度,所述窗口長度為大于等于1的整數(shù)。結(jié)合第一方面、第一方面的第一種至第二種可能的實現(xiàn)方式,在第三種可能實現(xiàn)的方式中,在確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化之前,所述方法還包括:根據(jù)所述窗口長度確定第二數(shù)據(jù)集;當所述窗口長度大于1時,確定所述第二數(shù)據(jù)集的數(shù)據(jù)特征,包括:確定每個所述第二數(shù)據(jù)集的數(shù)據(jù)特征;則所述確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化包括:確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于每個所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化;則當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于至少一個所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。結(jié)合第一方面、第一方面的第一種至第三種可能的實現(xiàn)方式,在第四種可能實現(xiàn)的方式中,在所述根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果之前,所述方法還包括:根據(jù)所述窗口長度確定第二數(shù)據(jù)模型;當所述窗口長度大于1時,所述根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果包括:根據(jù)所述第一數(shù)據(jù)集確定每個所述第二數(shù)據(jù)模型的效果;則所述確定所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化包括:確定所述第三數(shù)據(jù)模型的效果相對于每個所述第二數(shù)據(jù)模型的效果的變化;則所述當所述第三數(shù)據(jù)模型的效果相對于所述二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:當所述第三數(shù)據(jù)模型的效果相對于至少一個所述第二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。結(jié)合第一方面、第一方面的第一種至第四種可能的實現(xiàn)方式,在第五種可能實現(xiàn)的方式中,所述方法還包括超參數(shù)模型,所述根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征和所述超參數(shù)模型確定超參數(shù)。結(jié)合第一方面、第一方面的第一種至第五種可能的實現(xiàn)方式,在第六種可能實現(xiàn)的方式中,還根據(jù)所述第二數(shù)據(jù)模型確定所述第一數(shù) 據(jù)模型。結(jié)合第一方面、第一方面的第一種至第六種可能的實現(xiàn)方式,在第七種可能實現(xiàn)的方式中,所述數(shù)據(jù)特征包括樣本數(shù)、樣本數(shù)的對數(shù)、特征數(shù)、特征數(shù)的對數(shù)、類別數(shù)、有缺失值的樣本數(shù)、有缺失值的樣本比例、有缺失值的特征數(shù)、有缺失值的特征比例、缺失值數(shù)量、缺失值比例、數(shù)值型特征的個數(shù)、范疇型特征的個數(shù)、數(shù)值型特征的個數(shù)與范疇型特征的個數(shù)之比、范疇型特征的個數(shù)與數(shù)值型特征的個數(shù)之比、數(shù)據(jù)集的維度、數(shù)據(jù)集的維度的對數(shù)、數(shù)據(jù)集轉(zhuǎn)置后的維度、數(shù)據(jù)集轉(zhuǎn)置后的維度的對數(shù)、類別概率最小值、類別概率最大值、類別概率平均值、類別概率標準差、范疇型數(shù)據(jù)最少取值數(shù)量、范疇型數(shù)據(jù)最大取值數(shù)量、范疇型數(shù)據(jù)取值數(shù)量的平均值、范疇型數(shù)據(jù)取值數(shù)量的標準差、范疇型數(shù)據(jù)取值總數(shù)量、所有特征的峰態(tài)的最小值、所有特征的峰態(tài)的最大值、所有特征的峰態(tài)的平均值、所有特征的峰態(tài)的標準差、所有特征的偏態(tài)的最小值、所有特征的偏態(tài)的最大值、所有特征的偏態(tài)的平均值、所有特征的偏態(tài)的標準差、標準差比、所有特征的兩兩相關系數(shù)的平均值、類的平均熵、特征的平均熵中的至少一種。第二方面,提供了一種數(shù)據(jù)處理裝置,所述數(shù)據(jù)處理裝置利用第一數(shù)據(jù)模型對接收到的數(shù)據(jù)集進行處理的過程,所述第一數(shù)據(jù)模型根據(jù)超參數(shù)確定,其特征在于,所述數(shù)據(jù)處理裝置包括獲取模塊和處理模塊:所述獲取模塊,用于獲取第一數(shù)據(jù)集,確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于第二數(shù)據(jù)集的數(shù)據(jù)特征的變化,所述第二數(shù)據(jù)集為所述數(shù)據(jù)處理裝置在獲取所述第一數(shù)據(jù)集之前收到的數(shù)據(jù)集;所述處理模塊,用于當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù);所述處理模塊,還用于根據(jù)所述確定的超參數(shù)和所述第一數(shù)據(jù)集確定第一數(shù)據(jù)模型;所述處理模塊,還用于根據(jù)所述確定的第一數(shù)據(jù)模型進行數(shù)據(jù)處 理。結(jié)合第二方面的實現(xiàn)方式,在第二方面第一種可能的實現(xiàn)方式中,還包括第二數(shù)據(jù)模型,所述處理模塊還用于根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果;根據(jù)所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)模型,確定第三數(shù)據(jù)模型;根據(jù)所述第一數(shù)據(jù)集確定所述第三數(shù)據(jù)模型的效果;確定所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化;當所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。結(jié)合第二方面、第二方面的第一種可能的實現(xiàn)方式,在第二種可能實現(xiàn)的方式中,還包括窗口長度,所述窗口長度為大于等于1的整數(shù)。結(jié)合第二方面、第二方面的第一種至第二種可能的實現(xiàn)方式,在第三種可能實現(xiàn)的方式中,在確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化之前,所述處理模塊還用于:根據(jù)所述窗口長度確定第二數(shù)據(jù)集;當所述窗口長度大于1時,確定所述第二數(shù)據(jù)集的數(shù)據(jù)特征,包括:確定每個所述第二數(shù)據(jù)集的數(shù)據(jù)特征;則所述確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化包括:確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于每個所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化;則當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于至少一個所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。結(jié)合第二方面、第二方面的第一種至第三種可能的實現(xiàn)方式,在第四種可能實現(xiàn)的方式中,在所述根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果之前,所述處理模塊還用于:根據(jù)所述窗口長度確定第二數(shù)據(jù)模型;當所述窗口長度大于1時,所述根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果包括:根據(jù)所述第一數(shù)據(jù)集確定每個所述第二數(shù)據(jù)模型的效果;則所述確定所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化包括:確定所述第三數(shù)據(jù)模型的效果相對于每個所述第二數(shù)據(jù)模型的效果的變化;則所述當所述第三數(shù)據(jù)模型的效果相對于所述二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:當所述第三數(shù)據(jù)模型的效果相對于至少一個所述第二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。結(jié)合第二方面、第二方面的第一種至第四種可能的實現(xiàn)方式,在第五種可能實現(xiàn)的方式中,還包括超參數(shù)模型,所述根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征和所述超參數(shù)模型確定超參數(shù)。結(jié)合第二方面、第二方面的第一種至第五種可能的實現(xiàn)方式,在第六種可能實現(xiàn)的方式中,還根據(jù)所述第二數(shù)據(jù)模型確定所述第一數(shù) 據(jù)模型。結(jié)合第二方面、第二方面的第一種至第六種可能的實現(xiàn)方式,在第七種可能實現(xiàn)的方式中,所述數(shù)據(jù)特征包括樣本數(shù)、樣本數(shù)的對數(shù)、特征數(shù)、特征數(shù)的對數(shù)、類別數(shù)、有缺失值的樣本數(shù)、有缺失值的樣本比例、有缺失值的特征數(shù)、有缺失值的特征比例、缺失值數(shù)量、缺失值比例、數(shù)值型特征的個數(shù)、范疇型特征的個數(shù)、數(shù)值型特征的個數(shù)與范疇型特征的個數(shù)之比、范疇型特征的個數(shù)與數(shù)值型特征的個數(shù)之比、數(shù)據(jù)集的維度、數(shù)據(jù)集的維度的對數(shù)、數(shù)據(jù)集轉(zhuǎn)置后的維度、數(shù)據(jù)集轉(zhuǎn)置后的維度的對數(shù)、類別概率最小值、類別概率最大值、類別概率平均值、類別概率標準差、范疇型數(shù)據(jù)最少取值數(shù)量、范疇型數(shù)據(jù)最大取值數(shù)量、范疇型數(shù)據(jù)取值數(shù)量的平均值、范疇型數(shù)據(jù)取值數(shù)量的標準差、范疇型數(shù)據(jù)取值總數(shù)量、所有特征的峰態(tài)的最小值、所有特征的峰態(tài)的最大值、所有特征的峰態(tài)的平均值、所有特征的峰態(tài)的標準差、所有特征的偏態(tài)的最小值、所有特征的偏態(tài)的最大值、所有特征的偏態(tài)的平均值、所有特征的偏態(tài)的標準差、標準差比、所有特征的兩兩相關系數(shù)的平均值、類的平均熵、特征的平均熵中的至少一種。根據(jù)本發(fā)明實施例提供的技術方案,數(shù)據(jù)處理裝置通過獲取第一數(shù)據(jù)集,確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于第二數(shù)據(jù)集的數(shù)據(jù)特征的變化,所述第二數(shù)據(jù)集為所述數(shù)據(jù)處理裝置在獲取所述第一數(shù)據(jù)集之前收到的數(shù)據(jù)集;當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù);根據(jù)所述確定的超參數(shù)和所述第一數(shù)據(jù)集確定第一數(shù)據(jù)模型;根據(jù)所述確定的第一數(shù)據(jù)模型進行數(shù)據(jù)處理,提高了確定第一數(shù)據(jù)模型的效率,從而提高了進行數(shù)據(jù)處理的效率。附圖說明為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而 易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是依據(jù)本發(fā)明一實施例的計算機設備100的硬件結(jié)構(gòu)示意圖;圖2是依據(jù)本發(fā)明一實施例的數(shù)據(jù)處理方法200的示范性流程圖;圖3是依據(jù)本發(fā)明一實施例的數(shù)據(jù)處理裝置300的結(jié)構(gòu)示意圖。具體實施方式以下描述中,為了說明而不是為了限定,提出了諸如特定系統(tǒng)結(jié)構(gòu)、接口、技術之類的具體細節(jié),以便透徹理解本發(fā)明。然而,本領域的技術人員應當清楚,在沒有這些具體細節(jié)的其它實施例中也可以實現(xiàn)本發(fā)明。在其它情況中,省略對眾所周知的裝置、電路以及方法的詳細說明,以免不必要的細節(jié)妨礙本發(fā)明的描述。圖1是依據(jù)本發(fā)明一實施例的計算機設備100的硬件結(jié)構(gòu)示意圖。如圖1所示,計算機設備100包括處理器102、存儲器104、通信接口106和總線108。其中,處理器102、存儲器104和通信接口106通過總線108實現(xiàn)彼此之間的通信連接。處理器102可以采用通用的中央處理器(CentralProcessingUnit,CPU),微處理器,應用專用集成電路(ApplicationSpecificIntegratedCircuit,ASIC),或者一個或多個集成電路,用于執(zhí)行相關程序,以實現(xiàn)本發(fā)明實施例所提供的技術方案。存儲器104可以是只讀存儲器(ReadOnlyMemory,ROM),靜態(tài)存儲設備,動態(tài)存儲設備或者隨機存取存儲器(RandomAccessMemory,RAM)。存儲器104可以存儲操作系統(tǒng)1041和其他應用程序1042。在通過軟件或者固件來實現(xiàn)本發(fā)明實施例提供的技術方案時,用于實現(xiàn)本發(fā)明實施例提供的技術方案的程序代碼保存在存儲器104中,并由處理器102來執(zhí)行。通信接口106使用例如但不限于收發(fā)器一類的收發(fā)裝置,來實現(xiàn) 與其他設備或通信網(wǎng)絡之間的通信??偩€108可包括一通路,在各個部件(例如處理器102、存儲器104、通信接口106)之間傳送信息。計算機設備100可以是通用計算機設備或?qū)S糜嬎銠C設備。在實際應用中,計算機設備100可以是臺式計算機、手提電腦、網(wǎng)絡服務器、個人數(shù)字助理(PDA)、移動電話、平板電腦、無線終端設備、電信設備、嵌入式系統(tǒng)或其他具有與圖1相似結(jié)構(gòu)的設備。其中,處理器102用于執(zhí)行獲取第一數(shù)據(jù)集,確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于第二數(shù)據(jù)集的數(shù)據(jù)特征的變化,所述第二數(shù)據(jù)集為所述數(shù)據(jù)處理裝置在獲取所述第一數(shù)據(jù)集之前收到的數(shù)據(jù)集;當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù);根據(jù)所述確定的超參數(shù)和所述第一數(shù)據(jù)集確定第一數(shù)據(jù)模型;根據(jù)所述確定的第一數(shù)據(jù)模型進行數(shù)據(jù)處理。圖2是依據(jù)本發(fā)明一實施例的數(shù)據(jù)處理方法200的示范性流程圖。在具體實現(xiàn)過程中,數(shù)據(jù)處理方法200可以由例如但不限于計算機設備100來執(zhí)行。S201,計算機設備獲取第一數(shù)據(jù)集,確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征。在本發(fā)明實施例的一種實現(xiàn)方式中,可以通過接收數(shù)據(jù)流的方式獲取第一數(shù)據(jù)集,也可以通過數(shù)據(jù)庫讀取方式獲取第一數(shù)據(jù)集。在本發(fā)明實施例的一種實現(xiàn)方式中,數(shù)據(jù)特征包括樣本數(shù)(numberofpatterns)、樣本數(shù)的對數(shù)(lognumberofpatterns)、特征數(shù)(numberoffeatures)、特征數(shù)的對數(shù)(lognumberoffeatures)、類別數(shù)(numberofclasses)、有缺失值的樣本數(shù)(numberofpatternswithmissingvalues)、有缺失值的樣本比例(percentageofpatternswithmissingvalues)、有缺失值的特征數(shù)(numberoffeatureswithmissing values)、有缺失值的特征比例(percentageoffeatureswithmissingvalues)、缺失值數(shù)量(numberofmissingvalues)、缺失值比例(percentageofmissingvalues)、數(shù)值型特征的個數(shù)(numberofnumericalfeatures)、范疇型特征的個數(shù)(numberofcategoricalfeatures)、數(shù)值型特征的個數(shù)與范疇型特征的個數(shù)之比(rationumericaltocategorical)、范疇型特征的個數(shù)與數(shù)值型特征的的個數(shù)之比(ratiocategoricaltonumerical)、數(shù)據(jù)集的維度(datasetdimensionality)、數(shù)據(jù)集的維度的對數(shù)(logdatasetdimensionality)、數(shù)據(jù)集轉(zhuǎn)置后的維度(inversedatasetdimensionality)、數(shù)據(jù)集轉(zhuǎn)置后的維度的對數(shù)(loginversedatasetdimensionality)、類別概率最小值(classprobabilityminimum)、類別概率最大值(classprobabilitymaximum)、類別概率平均值(classprobabilitymean)、類別概率標準差(classprobabilityStandardDeviation)、范疇型數(shù)據(jù)最少取值數(shù)量(minimumcountofcategoricalvalues)、范疇型數(shù)據(jù)最大取值數(shù)量(maximumcountofcategoricalvalues)、范疇型數(shù)據(jù)取值數(shù)量的平均值(meancountofcategoricalvalues)、范疇型數(shù)據(jù)取值數(shù)量的標準差(StandardDeviationofcountofcategoricalvalues)、范疇型數(shù)據(jù)取值總數(shù)量(totalcountofcategoricalvalues)、所有特征的峰態(tài)的最小值(kurtosisminimum)、所有特征的峰態(tài)的最大值(kurtosismaximum)、所有特征的峰態(tài)的平均值(kurtosismean)、所有特征的峰態(tài)的標準差(kurtosisStandardDeviation)、所有特征的偏態(tài)的最小值(skewnessminimum)、所有特征的偏態(tài)的最大值(skewnessmaximum)、所有特征的偏態(tài)的平均值(skewnessmean)、所有特征的偏態(tài)的標準差(skewnessStandardDeviation)、標準差比(standarddeviationratio)、所有特征的兩兩相關系數(shù)的平均值、類的平均熵(classentropymean)、特征的平均熵(featuresentropymean)中的至少一種。例如,第一數(shù)據(jù)集為關于應用推薦的數(shù)據(jù):表1第一數(shù)據(jù)集舉例以統(tǒng)計表1中第一數(shù)據(jù)集的樣本數(shù)、類別數(shù)、類的平均熵這三個數(shù)據(jù)特征元素為例,可以得到該第一數(shù)據(jù)集的數(shù)據(jù)特征為樣本數(shù)類別數(shù)類的平均熵10020.1對于表1所示的第一數(shù)據(jù)集來說,每一行數(shù)據(jù)為一個樣本,樣本數(shù)為100。類別數(shù)為最后一列“是否喜歡”的取值種類個數(shù),本例中“是否喜歡”有“1”和“0”兩種取值,類別數(shù)為2。類的平均熵可以通過公式計算,其中,m表示類別數(shù),j為小于等于m的正整數(shù),πj表示每一種類別的樣本數(shù)在整個樣本數(shù)中的占比。前面統(tǒng)計出類別數(shù)為2,所以這里m=2;π1=(類別為1的樣本數(shù))/樣本數(shù),π2=(類別為0的樣本數(shù))/樣本數(shù),用C1表示類別為1的樣本數(shù),用C2表示類別為0的樣本數(shù),那么π1=C1/(C1+C2), π2=C2/(C1+C2),最終假設表1中計算出的第一數(shù)據(jù)集的類的平均熵為0.1。S202,所述計算機設備根據(jù)第二數(shù)據(jù)集,確定所述第二數(shù)據(jù)集的數(shù)據(jù)特征,所述第二數(shù)據(jù)集為所述計算機設備在獲取所述第一數(shù)據(jù)集之前收到的數(shù)據(jù)集。S203,所述計算機設備確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化。在本發(fā)明實施例的一種實現(xiàn)方式中,可以將數(shù)據(jù)特征作為向量,通過計算向量之間的距離或者余弦相似度,來確定向量的變化,從而確定第一數(shù)據(jù)集的數(shù)據(jù)特征相對于第二數(shù)據(jù)集的數(shù)據(jù)特征的變化。例如,假設確定出的第二數(shù)據(jù)集的數(shù)據(jù)特征元素為樣本數(shù)類別數(shù)類的平均熵20020.2第一數(shù)據(jù)集的數(shù)據(jù)特征元素為樣本數(shù)類別數(shù)類的平均熵10020.1余弦相似度計算公式為其中符號“||||”表示求模運算,根據(jù)余弦相似度計算公式計算第一數(shù)據(jù)集的數(shù)據(jù)特征與第二數(shù)據(jù)集的數(shù)據(jù)特征的余弦相似度為如果用P表示第一數(shù)據(jù)集的數(shù)據(jù)特征與自身的余弦相似度,用Q 表示第一數(shù)據(jù)集的數(shù)據(jù)特征與第二數(shù)據(jù)集的數(shù)據(jù)特征的余弦相似度,則可以用P-Q來表示第一數(shù)據(jù)集的數(shù)據(jù)特征相對于第二數(shù)據(jù)集的數(shù)據(jù)特征的變化。由于第一數(shù)據(jù)集的數(shù)據(jù)特征與自身的余弦相似度為1,因此,第一數(shù)據(jù)集的數(shù)據(jù)特征相對于第二數(shù)據(jù)集的數(shù)據(jù)特征的變化可表示為1-0.99995=0.00005。S204,當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,所述計算機設備根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。例如,預設數(shù)據(jù)特征閾值為0.00001,則當?shù)谝粩?shù)據(jù)集的數(shù)據(jù)特征相對于第二數(shù)據(jù)集的數(shù)據(jù)特征的變化為0.00005時,超出預設數(shù)據(jù)特征閾值0.00001,則計算機設備應根據(jù)第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,數(shù)據(jù)處理方法200還包括超參數(shù)模型,所述根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征和所述超參數(shù)模型確定超參數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,超參數(shù)模型的建立方式可以為:根據(jù)每一次更新模型所使用的數(shù)據(jù)集的數(shù)據(jù)特征和對應的超參數(shù)建立超參數(shù)模型。例如,使用隨機森林算法建立超參數(shù)模型時,假設有兩個超參數(shù):樹的棵數(shù)m和樹的深度n,計算機設備保存了每一次更新模型所使用的數(shù)據(jù)集的數(shù)據(jù)特征和對應的超參數(shù),如表2所示表2數(shù)據(jù)集的數(shù)據(jù)特征與對應的超參數(shù)樣本數(shù)類別數(shù)類平均熵樹的棵數(shù)m樹的深度n10000020.14100011000020.330022101120.24003…………………………將數(shù)據(jù)集的數(shù)據(jù)特征作為建立超參數(shù)模型的特征值,超參數(shù)作為建立超參數(shù)模型的目標值,通過隨機森林算法可以建立得到超參數(shù)模型??梢苑謩e建立目標值為樹的棵數(shù)m、樹的深度n的超參數(shù)模型。超參數(shù)模型建立之后,將其應用于上述第一數(shù)據(jù)集的數(shù)據(jù)特征,可以得出對應于該第一數(shù)據(jù)集的數(shù)據(jù)特征的超參數(shù)的取值范圍。在得到對應于該第一數(shù)據(jù)集的數(shù)據(jù)特征的超參數(shù)的取值范圍之后,在本發(fā)明實施例的一種實現(xiàn)方式中,可以通過二分搜索法的方式從超參數(shù)的取值范圍中確定出最優(yōu)超參數(shù),最優(yōu)超參數(shù)指在確定出的超參數(shù)的取值范圍中,提升數(shù)據(jù)模型效果最好的超參數(shù)。數(shù)據(jù)模型為根據(jù)數(shù)據(jù)集確定。在確定最優(yōu)超參數(shù)的過程中,使用二分搜索法,每次搜索都將超參數(shù)的取值范圍從中間平均分成兩半,只在提升數(shù)據(jù)模型效果更好的一半進行搜索。例如,假設得到的超參數(shù)樹的棵數(shù)m的取值范圍為{8,9,10,11,12},在m=8和m=12時分別求得數(shù)據(jù)模型效果,在中間值m=(8+12)/2=10處也求得數(shù)據(jù)模型效果,如果在左端8到中間值10之間的數(shù)據(jù)模型效果優(yōu)于中間值10到右端12的數(shù)據(jù)模型效果,則縮小超參數(shù)樹的棵樹m的取值范圍為{8,9,10},否則,縮小超參數(shù)樹的棵樹m的取值范圍為{10,11,12}。依次類推,直到確定出最優(yōu)超參數(shù)。由于經(jīng)過超參數(shù)模型確定出的超參數(shù)的取值范圍都較小,因此采用二分搜索法的方式只需較少的搜索次數(shù)就可以確定出最優(yōu)超參數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,在S204中,所述數(shù)據(jù)處理方法200還包括第二數(shù)據(jù)模型,根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果;根據(jù)所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)模型,確定第三數(shù)據(jù)模型;根據(jù)所述第一數(shù)據(jù)集確定所述第三數(shù)據(jù)模型的效果;確定所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化;當所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定 超參數(shù)。例如,第一數(shù)據(jù)集為表1所示的關于應用推薦的數(shù)據(jù),則根據(jù)表1中的“ID”列、“流量套餐”列、“應用類型”列、“應用名稱”列和第一數(shù)據(jù)模型,可以得出表示“是否喜歡”的預測值,根據(jù)預測值和表1中作為目標值的“是否喜歡”列,統(tǒng)計預測值跟目標值一致的樣本數(shù)H,用H除以第一數(shù)據(jù)集的樣本數(shù)100,可以得到預測值的準確率,能夠反映出數(shù)據(jù)模型的效果。假設統(tǒng)計得到樣本數(shù)H為73,則根據(jù)表1中的數(shù)據(jù)集得出的第二數(shù)據(jù)模型的效果A1為0.73;根據(jù)第一數(shù)據(jù)集和第二數(shù)據(jù)模型確定第三數(shù)據(jù)模型時,還利用建立第二數(shù)據(jù)模型的超參數(shù)。例如,假設建立的第二數(shù)據(jù)模型為隨機森林模型,建立第二數(shù)據(jù)模型的超參數(shù)有2個,分別為樹的棵數(shù)m=5,樹的深度n=2,則根據(jù)第二數(shù)據(jù)模型和表1中的第一數(shù)據(jù)集確定第三數(shù)據(jù)模型時,將“ID”列、“流量套餐”列、“應用類型”列、“應用名稱”列作為自變量,將“是否喜歡”列作為因變量,利用超參數(shù)m=5,n=2確定第三數(shù)據(jù)模型。之后,根據(jù)表1中的“ID”列、“流量套餐”列、“應用類型”列、“應用名稱”列和建立得到的第三數(shù)據(jù)模型,可以得出表示“是否喜歡”的預測值,根據(jù)預測值和表1中作為目標值的“是否喜歡”列,統(tǒng)計預測值跟目標值一致的樣本數(shù)J,用J除以第一數(shù)據(jù)集的樣本數(shù)100,可以得到預測值的準確率,能夠反映出數(shù)據(jù)模型的效果。假設統(tǒng)計得到樣本數(shù)J為70,則根據(jù)表1中的數(shù)據(jù)集得出的第三數(shù)據(jù)模型的效果A2為0.70。則第三數(shù)據(jù)模型的效果相對于第二數(shù)據(jù)模型的效果的變化可以表示為假設預設模型效果閾值為1%,則第三數(shù)據(jù)模型的效果相對于第二數(shù)據(jù)模型的效果的變化大于預設模型效果閾值,則計算機設備根據(jù)第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,數(shù)據(jù)處理方法200還包括窗 口長度,所述窗口長度為大于等于1的整數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,在S202和S204中,在所述根據(jù)存儲的第二數(shù)據(jù)集,確定所述第二數(shù)據(jù)集的數(shù)據(jù)特征之前,數(shù)據(jù)處理方法200還包括:根據(jù)所述窗口長度確定第二數(shù)據(jù)集;當所述窗口長度大于1時,所述確定所述第二數(shù)據(jù)集的數(shù)據(jù)特征包括:確定每個所述第二數(shù)據(jù)集的數(shù)據(jù)特征;則所述確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化包括:確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于每個所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化;則當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于至少一個所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,根據(jù)窗口長度確定的第二數(shù)據(jù)集為計算機設備最近存儲的窗口長度個數(shù)據(jù)集。例如,假設窗口長度為3,則根據(jù)窗口長度確定出計算機設備最近存儲的3個數(shù)據(jù)集,假設這3個數(shù)據(jù)集分別為數(shù)據(jù)集D1、D2、D3,則計算機設備分別確定數(shù)據(jù)集D1、D2、D3的數(shù)據(jù)特征,可以計算第一數(shù)據(jù)集的數(shù)據(jù)特征與數(shù)據(jù)集D1、D2、D3的數(shù)據(jù)特征的余弦相似度,根據(jù)余弦相似度確定第一數(shù)據(jù)集的數(shù)據(jù)特征相對于數(shù)據(jù)集D1、D2、D3的數(shù)據(jù)特征的變化,假設計算得出的余弦相似度為則第一數(shù)據(jù)集的數(shù)據(jù)特征相對于數(shù)據(jù)集D1、D2、D3的數(shù)據(jù)特征的變化可表示為假設預設數(shù)據(jù)特征閾值為0.10,由于第一數(shù)據(jù)集的數(shù)據(jù)特征相對數(shù)據(jù)集D1的數(shù)據(jù)特征變化0.12大于預設數(shù)據(jù)特征閾值0.10,因此計算機設備根據(jù)第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。由于數(shù)據(jù)特征的變化有時是緩慢的,第一數(shù)據(jù)集的數(shù)據(jù)特征相對于計算機設備存儲的最近一個數(shù)據(jù)集的數(shù)據(jù)特征的變化達不到預設數(shù)據(jù)特征閾值,但相對于計算機設備更早存儲的數(shù)據(jù)集的數(shù)據(jù)特征的變化達到了預設數(shù)據(jù)特征閾值,此時應該重新確定超參數(shù),因此確定窗口長度個內(nèi)的數(shù)據(jù)特征的變化能夠處理這種數(shù)據(jù)特征變化緩慢的情況,使得超參數(shù)的調(diào)整更及時的進行。在本發(fā)明實施例的一種實現(xiàn)方式中,在S204中,在所述根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果之前,數(shù)據(jù)處理方法200還包括:根據(jù)所述窗口長度確定第二數(shù)據(jù)模型;當所述窗口長度大于1時,所述根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果包括:根據(jù)所述第一數(shù)據(jù)集確定每個所述第二數(shù)據(jù)模型的效果;則所述確定所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化包括:確定所述第三數(shù)據(jù)模型的效果相對于每個所述第二數(shù)據(jù)模型的效果的變化;則所述當所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:當所述第三數(shù)據(jù)模型的效果相對于至少一個所述第二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,根據(jù)窗口長度確定的第一數(shù)據(jù)模型為計算機設備最近存儲的窗口長度個數(shù)據(jù)模型。例如,假設窗口長度為3,則根據(jù)窗口長度確定出計算機設備最近存儲的3個數(shù)據(jù)模型,假設這3個數(shù)據(jù)模型分別為M1、M2、M3,則計算機設備根據(jù)第一數(shù)據(jù)集分別計算數(shù)據(jù)模型M1、M2、M3的效果,假設計算得到的數(shù)據(jù)模型的效果為M1的效果A1M2的效果A2M3的效果A30.75980.75960.7328假設第二數(shù)據(jù)模型的效果A為0.7234,則第二數(shù)據(jù)模型的效果相對于數(shù)據(jù)模型M1、M2、M3的效果的變化為A相對A1的變化A相對A2的變化A相對A3的變化4.79%4.77%1.28%假設預設模型效果閾值為4.7%,由于第二數(shù)據(jù)模型的效果相對于數(shù)據(jù)模型M1的效果變化4.79%、數(shù)據(jù)模型M2的效果變化4.77%大于預設模型效果閾值4.7%,因此計算機設備根據(jù)第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。由于數(shù)據(jù)模型效果的變化有時是緩慢的,第二數(shù)據(jù)模型的效果相對于計算機設備存儲的最近一個數(shù)據(jù)模型的效果的變化達不到預設模型效果閾值,但相對于計算機設備更早存儲的數(shù)據(jù)模型的效果的變化達到了預設模型效果閾值,此時應該重新確定超參數(shù),因此確定窗口長度個內(nèi)的數(shù)據(jù)模型效果的變化能夠處理這種數(shù)據(jù)模型效果變化緩慢的情況,使得超參數(shù)的調(diào)整更及時的進行。S205,所述計算機設備根據(jù)所述確定的超參數(shù)和所述第一數(shù)據(jù)集確定第一數(shù)據(jù)模型。S206,所述計算機設備根據(jù)所述確定的第一數(shù)據(jù)模型進行數(shù)據(jù)處理。在本發(fā)明實施例的一種實現(xiàn)方式中,根據(jù)第一數(shù)據(jù)集和確定出的超參數(shù)確定第一數(shù)據(jù)模型的過程與S204中確定第三數(shù)據(jù)模型的過程 相同,此處不再贅述。在本發(fā)明實施例的一種實現(xiàn)方式中,該數(shù)據(jù)處理方法可以為應用推薦方法,進行數(shù)據(jù)處理可以為進行應用推薦??梢愿鶕?jù)確定出的第一數(shù)據(jù)模型,利用用戶信息和應用信息確定出需要推薦的應用。數(shù)據(jù)處理裝置通過獲取第一數(shù)據(jù)集,確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于第二數(shù)據(jù)集的數(shù)據(jù)特征的變化,所述第二數(shù)據(jù)集為所述數(shù)據(jù)處理裝置在獲取所述第一數(shù)據(jù)集之前收到的數(shù)據(jù)集;當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù);根據(jù)所述確定的超參數(shù)和所述第一數(shù)據(jù)集確定第一數(shù)據(jù)模型;根據(jù)所述確定的第一數(shù)據(jù)模型進行數(shù)據(jù)處理,提高了確定第一數(shù)據(jù)模型的效率,從而提高了進行數(shù)據(jù)處理的效率。圖3是依據(jù)本發(fā)明一實施例的數(shù)據(jù)處理裝置300的結(jié)構(gòu)示意圖。數(shù)據(jù)處理裝置300包括獲取模塊302和處理模塊304。獲取模塊302,用于獲取第一數(shù)據(jù)集,確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于第二數(shù)據(jù)集的數(shù)據(jù)特征的變化,所述第二數(shù)據(jù)集為所述數(shù)據(jù)處理裝置在獲取所述第一數(shù)據(jù)集之前收到的數(shù)據(jù)集;處理模塊304,用于當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù);處理模塊304,還用于根據(jù)所述確定的超參數(shù)和所述第一數(shù)據(jù)集確定第一數(shù)據(jù)模型;處理模塊304,還用于根據(jù)所述確定的第一數(shù)據(jù)模型進行數(shù)據(jù)處理。在本發(fā)明實施例的一種實現(xiàn)方式中,還包括第二數(shù)據(jù)模型,所述處理模塊304還用于根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果;根據(jù)所述第一數(shù)據(jù)集和所述第二數(shù)據(jù)模型,確定第三數(shù)據(jù)模型;根據(jù)所述第一數(shù)據(jù)集確定所述第三數(shù)據(jù)模型的效果;確定所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化;當所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化大于或等于預 設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,還包括窗口長度,所述窗口長度為大于等于1的整數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,在確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化之前,所述處理模塊還用于:根據(jù)所述窗口長度確定第二數(shù)據(jù)集;當所述窗口長度大于1時,確定所述第二數(shù)據(jù)集的數(shù)據(jù)特征,包括:確定每個所述第二數(shù)據(jù)集的數(shù)據(jù)特征;則所述確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化包括:確定所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于每個所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化;則當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:當所述第一數(shù)據(jù)集的數(shù)據(jù)特征相對于至少一個所述第二數(shù)據(jù)集的數(shù)據(jù)特征的變化大于或等于預設數(shù)據(jù)特征閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,在所述根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果之前,所述處理模塊還用于:根據(jù)所述窗口長度確定第二數(shù)據(jù)模型;當所述窗口長度大于1時,所述根據(jù)所述第一數(shù)據(jù)集確定所述第二數(shù)據(jù)模型的效果包括:根據(jù)所述第一數(shù)據(jù)集確定每個所述第二數(shù)據(jù)模型的效果;則所述確定所述第三數(shù)據(jù)模型的效果相對于所述第二數(shù)據(jù)模型的效果的變化包括:確定所述第三數(shù)據(jù)模型的效果相對于每個所述第二數(shù)據(jù)模型的效果的變化;則所述當所述第三數(shù)據(jù)模型的效果相對于所述二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:當所述第三數(shù)據(jù)模型的效果相對于至少一個所述第二數(shù)據(jù)模型的效果的變化大于或等于預設模型效果閾值時,根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,還包括超參數(shù)模型,所述根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征確定超參數(shù)包括:根據(jù)所述第一數(shù)據(jù)集的數(shù)據(jù)特征和所述超參數(shù)模型確定超參數(shù)。在本發(fā)明實施例的一種實現(xiàn)方式中,還根據(jù)所述第二數(shù)據(jù)模型確定所述第一數(shù)據(jù)模型。其中,所述“模塊”可以為專用集成電路(ApplicationSpecificIntegratedCircuit,ASIC)、電子線路、執(zhí)行一個或多個軟件或固件程序的處理器和存儲器、組合邏輯電路和其他提供上述功能的組件。在本發(fā)明實施例的一種實現(xiàn)方式中,數(shù)據(jù)處理裝置300通過計算機設備的形式來實現(xiàn),獲取模塊302可以通過計算機設備的處理器、存儲器和通信接口來實現(xiàn),處理模塊304可以通過處理服務器的處理器和存儲器來實現(xiàn)。應注意,盡管圖1所示的計算機設備100僅僅示出了處理器102、存儲器104、通信接口106和總線108,但是在具體實現(xiàn)過程中,本領域的技術人員應當明白,上述數(shù)據(jù)處理裝置還包含實現(xiàn)正常運行所必須的其他器件。同時,根據(jù)具體需要,本領域的技術人員應當明白,上述數(shù)據(jù)處理裝置還可包含實現(xiàn)其他附加功能的硬件器件。此外,本領域的技術人員應當明白,上述數(shù)據(jù)處理裝置也可僅僅包含實現(xiàn)本發(fā)明實施例所必須的器件,而不必包含圖1中所示的全部器件。另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn), 也可以采用軟件功能單元的形式實現(xiàn)。所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術方案本質(zhì)上或者說對現(xiàn)有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)或處理器(processor)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-OnlyMemory)、隨機存取存儲器(RAM,RandomAccessMemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本
技術領域
的技術人員在本發(fā)明揭露的技術范圍內(nèi),可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應以所述權利要求的保護范圍為準。當前第1頁1 2 3 
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1