數(shù)據(jù)處理方法和裝置與流程

文檔序號(hào)：12271088閱讀：256來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域，具體而言，涉及一種數(shù)據(jù)處理方法和裝置。

背景技術(shù)：

目前，對(duì)回合制事件的數(shù)據(jù)處理規(guī)則相對(duì)簡(jiǎn)單，用于對(duì)事件執(zhí)行的對(duì)象對(duì)事件擁有全局事件信息，并且輪流行動(dòng)，對(duì)事件有較長的決策時(shí)間，事件行為立刻實(shí)行，通過反饋確定，例如，回合制事件為回合制游戲，其規(guī)則相對(duì)簡(jiǎn)單，游戲玩家擁有全局信息，輪流行動(dòng)，有較長的決策時(shí)間，行為可以立刻實(shí)行，也可以反饋確定，例如，圍棋。

而對(duì)實(shí)時(shí)事件的數(shù)據(jù)處理規(guī)則復(fù)雜，用于對(duì)事件執(zhí)行的對(duì)象只有部分事件信息，同時(shí)行動(dòng)，對(duì)事件的決策時(shí)間較短，事件行為需要時(shí)間執(zhí)行并且具有一定的成功概率，因此，對(duì)實(shí)時(shí)事件的數(shù)據(jù)處理與對(duì)回合制事件的數(shù)據(jù)處理存在差異。

在回合制事件中，圍棋智能程序阿爾法狗(AlphaGo)是利用深度學(xué)習(xí)訓(xùn)練策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)，并用蒙特卡洛樹整合來實(shí)現(xiàn)高水平圍棋走子的算法。圖1是根據(jù)相關(guān)技術(shù)中的一種AlphaGo算法的決策網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)的結(jié)構(gòu)示意圖。如圖1所示，AlphaGo算法采用深度學(xué)習(xí)訓(xùn)練策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)。人類專家側(cè)(Human expert positions)通過分類(Classification)推出策略(Rollout Policy)，將人類專家側(cè)的策略網(wǎng)絡(luò)(SL Network)通過策略算法(Policy Gradient)傳輸至人工智能側(cè)(Self-play Positions)。在人工智能側(cè)，通過人工智能側(cè)的策略網(wǎng)絡(luò)(RL Network)和價(jià)值網(wǎng)絡(luò)(Value Network)進(jìn)行訓(xùn)練，得到數(shù)據(jù)(Data)，其中，人類專家一側(cè)的策略網(wǎng)絡(luò)和人工智能側(cè)的策略網(wǎng)絡(luò)為策略網(wǎng)絡(luò)(Policy Network)，策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)通過一定的算法公式進(jìn)行訓(xùn)練，通過蒙地卡洛樹搜索(Monte Carlo Tree Search，簡(jiǎn)稱為MCTS)算法進(jìn)行實(shí)現(xiàn)。

圖2是根據(jù)相關(guān)技術(shù)中的一種蒙地卡洛樹搜索算法的示意圖。如圖2所示，通過策略網(wǎng)絡(luò)選擇落子概率、對(duì)落子樣本進(jìn)行擴(kuò)展、通過價(jià)值網(wǎng)絡(luò)評(píng)估當(dāng)前走子收益、反饋當(dāng)前走子收益的結(jié)果，通過蒙地卡洛樹搜索算法對(duì)策略網(wǎng)絡(luò)選擇的落子概率和價(jià)值網(wǎng)絡(luò)評(píng)估的當(dāng)前走子的收益進(jìn)行整合仿真，并最終根據(jù)當(dāng)前盤面選擇最佳落子位置。

實(shí)時(shí)事件的數(shù)據(jù)處理復(fù)雜度遠(yuǎn)高于上述回合制事件的數(shù)據(jù)處理復(fù)雜度，由于回合制事件的數(shù)據(jù)處理和實(shí)時(shí)事件的數(shù)據(jù)處理存在較多的差異，使得AlphaGo的算法的兩層網(wǎng)絡(luò)的結(jié)合方式無法滿足實(shí)時(shí)事件宏觀決策需求滿足，更無法滿足微觀操作層次，無法滿足實(shí)時(shí)事件智能系統(tǒng)的需要，數(shù)據(jù)處理效率低。

針對(duì)上述的數(shù)據(jù)處理效率低的問題，目前尚未提出有效的解決方案。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明實(shí)施例提供了一種數(shù)據(jù)處理方法和裝置，以至少解決相關(guān)技術(shù)的數(shù)據(jù)處理效率低的技術(shù)問題。

根據(jù)本發(fā)明實(shí)施例的一個(gè)方面，提供了一種數(shù)據(jù)處理方法。該數(shù)據(jù)處理方法包括：獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)；對(duì)樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，其中，多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象；按照預(yù)設(shè)處理算法對(duì)每層數(shù)據(jù)組合執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果；對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令，其中，目標(biāo)指令用于指示游戲應(yīng)用客戶端同時(shí)執(zhí)行不同層數(shù)據(jù)組合對(duì)應(yīng)的不同的目標(biāo)事件對(duì)象。

根據(jù)本發(fā)明實(shí)施例的另一方面，還提供了一種數(shù)據(jù)處理裝置。該數(shù)據(jù)處理裝置包括：第一獲取單元，用于獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)；第一處理單元，用于對(duì)樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，其中，多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象，目標(biāo)事件對(duì)象為在游戲應(yīng)用客戶端上待同時(shí)執(zhí)行的事件對(duì)象；第二處理單元，用于按照預(yù)設(shè)處理算法對(duì)每層數(shù)據(jù)組合執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果；第三處理單元，用于對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令，其中，目標(biāo)指令用于指示游戲應(yīng)用客戶端同時(shí)執(zhí)行不同層數(shù)據(jù)組合對(duì)應(yīng)的不同的目標(biāo)事件對(duì)象。

在本發(fā)明實(shí)施例中，通過獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)；對(duì)樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象，目標(biāo)事件對(duì)象為在游戲應(yīng)用客戶端上待同時(shí)執(zhí)行的事件對(duì)象；按照預(yù)設(shè)處理算法對(duì)每層數(shù)據(jù)組合執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果；對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令，達(dá)到了對(duì)多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令的目的，從而實(shí)現(xiàn)了提高數(shù)據(jù)處理效率的技術(shù)效果，進(jìn)而解決了相關(guān)技術(shù)的數(shù)據(jù)處理效率低的技術(shù)問題。

附圖說明

此處所說明的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解，構(gòu)成本申請(qǐng)的一部分，本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明，并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中：

圖1是根據(jù)相關(guān)技術(shù)中的一種AlphaGo算法的決策網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)的結(jié)構(gòu)示意圖；

圖2是根據(jù)相關(guān)技術(shù)中的一種蒙地卡洛樹搜索算法的示意圖；

圖3是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)處理方法的硬件環(huán)境的示意圖；

圖4是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)處理方法的流程圖；

圖5是根據(jù)本發(fā)明實(shí)施例的一種根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記的方法的流程圖；

圖6是根據(jù)本發(fā)明實(shí)施例的一種對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理的方法的流程圖；

圖7是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理方法的流程圖；

圖8是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理方法的流程圖；

圖9是根據(jù)本發(fā)明實(shí)施例的一種按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理的方法的流程圖；

圖10是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理方法的流程圖；

圖11是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理方法的流程圖；

圖12是根據(jù)本發(fā)明實(shí)施例的一種游戲過程中的交互過程的示意圖；

圖13是根據(jù)本發(fā)明實(shí)施例的另一種根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記的方法的流程圖；

圖14是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理方法的流程圖；

圖15是根據(jù)本發(fā)明實(shí)施例的一種游戲交互的方法的流程示意圖；

圖16是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)處理裝置的示意圖；

圖17是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖；

圖18是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖；

圖19是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖；

圖20是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖；

圖21是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖；

圖22是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖；

圖23是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖；以及

圖24是根據(jù)本發(fā)明實(shí)施例的一種終端的結(jié)構(gòu)框圖。

具體實(shí)施方式

為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案，下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。

需要說明的是，本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對(duì)象，而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換，以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外，術(shù)語“包括”和“具有”以及他們的任何變形，意圖在于覆蓋不排他的包含，例如，包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元，而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

實(shí)施例1

根據(jù)本發(fā)明實(shí)施例，提供了一種數(shù)據(jù)處理方法的實(shí)施例。

可選地，在本實(shí)施例中，上述數(shù)據(jù)處理方法可以應(yīng)用于如圖3所示的由服務(wù)器302和終端304所構(gòu)成的硬件環(huán)境中。圖3是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)處理方法的硬件環(huán)境的示意圖。如圖3所示，服務(wù)器302通過網(wǎng)絡(luò)與終端304進(jìn)行連接，上述網(wǎng)絡(luò)包括但不限于：廣域網(wǎng)、城域網(wǎng)或局域網(wǎng)，終端304并不限定于PC、手機(jī)、平板電腦等。本發(fā)明實(shí)施例的數(shù)據(jù)處理方法可以由服務(wù)器302來執(zhí)行，也可以由終端304來執(zhí)行，還可以是由服務(wù)器302和終端304共同執(zhí)行。其中，終端304執(zhí)行本發(fā)明實(shí)施例的數(shù)據(jù)處理方法也可以是由安裝在其上的客戶端來執(zhí)行。

圖4是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)處理方法的流程圖。如圖4所示，該數(shù)據(jù)處理方法可以包括以下步驟：

步驟S402，獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)。

在本申請(qǐng)上述步驟S402提供的技術(shù)方案中，獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)。

游戲應(yīng)用客戶端用于執(zhí)行事件，比如，執(zhí)行實(shí)時(shí)游戲中的人機(jī)對(duì)戰(zhàn)模式中的事件，該實(shí)時(shí)游戲區(qū)別于回合制游戲。獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)，該樣本數(shù)據(jù)也即輸入樣本，可以為游戲樣本，該游戲樣本包括多個(gè)樣本序列，多個(gè)樣本序列具有不同的優(yōu)先級(jí)，不同的樣本序列可以包括相同數(shù)據(jù)幀。

步驟S404，對(duì)樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合。

在本申請(qǐng)上述步驟S404提供的技術(shù)方案中，對(duì)樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，其中，多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象，目標(biāo)事件對(duì)象為在游戲應(yīng)用客戶端上待同時(shí)執(zhí)行的事件對(duì)象。

由于游戲數(shù)據(jù)的設(shè)計(jì)維度眾多，無法直接用作訓(xùn)練數(shù)據(jù)，在獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)之后，獲取樣本數(shù)據(jù)的多個(gè)樣本序列，根據(jù)多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)，可以通過預(yù)設(shè)標(biāo)記邏輯對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記?？蛇x地，根據(jù)輸入樣本的一個(gè)特征序列，根據(jù)預(yù)設(shè)的邏輯配置標(biāo)記整個(gè)樣本，進(jìn)而得到標(biāo)記樣本數(shù)據(jù)。

由于規(guī)則復(fù)雜，會(huì)出現(xiàn)多個(gè)樣本序列包括相同數(shù)據(jù)幀的情況，也即，同一數(shù)據(jù)幀屬于多個(gè)樣本序列的情況，可以根據(jù)事件的特性分出多個(gè)樣本序列的優(yōu)先級(jí)。按照樣本序列的優(yōu)先級(jí)順序標(biāo)記不同的樣本序列，可以使用預(yù)設(shè)規(guī)則或者預(yù)設(shè)樣本分割算法對(duì)樣本序列進(jìn)行標(biāo)記，得到標(biāo)記幀。遍歷所有的標(biāo)記幀，將相鄰相同的標(biāo)記幀標(biāo)記為一個(gè)樣本序列，標(biāo)記各樣本序列的起始幀和結(jié)束幀，得到標(biāo)記樣本序數(shù)據(jù)。

在根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)之后，對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理?？梢允褂猛ㄓ玫臓顟B(tài)函數(shù)在標(biāo)記樣本數(shù)據(jù)中提取當(dāng)前盤面的狀態(tài)信息，將狀態(tài)信息組裝成多層數(shù)據(jù)組合。目標(biāo)事件對(duì)象為在游戲應(yīng)用客戶端上待同時(shí)執(zhí)行的事件對(duì)象，比如，存儲(chǔ)本方角色狀態(tài)、友方角色狀態(tài)、敵方傷害力、地圖信息和非玩家控制角色(Non Player Controlled Character，簡(jiǎn)稱為NPC)信息等。

多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合與同一目標(biāo)事件中的目標(biāo)事件對(duì)象具有一一對(duì)應(yīng)關(guān)系，多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象，比如，本方角色狀態(tài)作為第一層，友方角色狀態(tài)按照實(shí)力排名放在第二層至第五層，敵方按照傷害力排名放在第六層至第十層，最外層為地圖信息和NPC信息，其它數(shù)據(jù)組裝原則也適用。將每層數(shù)據(jù)組合中的樣本數(shù)據(jù)的狀態(tài)信息，每個(gè)角色數(shù)據(jù)根據(jù)游戲規(guī)則狀態(tài)映射至某一個(gè)合法的動(dòng)作空間中，獲得事件數(shù)據(jù)。將每層數(shù)據(jù)組合中的狀態(tài)信息，每個(gè)角色數(shù)據(jù)、每個(gè)事件數(shù)據(jù)組成每層數(shù)據(jù)組合中的樣本信息。對(duì)對(duì)樣本數(shù)據(jù)執(zhí)行旋轉(zhuǎn)處理以擴(kuò)展樣本數(shù)據(jù)對(duì)應(yīng)的樣本數(shù)量，其它用戶信息也可以加入樣本信息中，比如，將之行事件的失誤率、操作頻次加入樣本信息中，從而便于訓(xùn)練，實(shí)現(xiàn)了對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合的目的。

步驟S406，按照預(yù)設(shè)處理算法對(duì)每層數(shù)據(jù)組合執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果。

在本申請(qǐng)上述步驟S406提供的技術(shù)方案中，按照預(yù)設(shè)處理算法對(duì)每層數(shù)據(jù)組合執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果。

多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合具有對(duì)應(yīng)的處理算法，在每層數(shù)據(jù)組合中，按照樣本信息學(xué)習(xí)當(dāng)前狀態(tài)信息下的事件執(zhí)行概率的概率模型和事件的執(zhí)行價(jià)值的價(jià)值模型，具體算法可以為AlphaGo整合策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)的蒙特卡洛樹搜索算法，蒙特卡洛樹搜索算法是一種用于決策的啟發(fā)式搜索算法，通過擴(kuò)展搜索樹和仿真來選擇受益最大的行為從而做出最優(yōu)決策，得到每層數(shù)據(jù)組合的處理結(jié)果。

步驟S408，對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令。

在本申請(qǐng)上述步驟S408提供的技術(shù)方案中，對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令，其中，目標(biāo)指令用于指示游戲應(yīng)用客戶端同時(shí)執(zhí)行不同層數(shù)據(jù)組合對(duì)應(yīng)的不同的目標(biāo)事件對(duì)象。

在按照與對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果之后，對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行加權(quán)整合，得到目標(biāo)指令，該目標(biāo)指令也即最終策略，用于指示游戲應(yīng)用客戶端同時(shí)執(zhí)行不同層數(shù)據(jù)組合對(duì)應(yīng)的不同的目標(biāo)事件對(duì)象。該目標(biāo)指令可以加入狀態(tài)評(píng)估函數(shù)，以確定當(dāng)前盤面下是否需要改變目標(biāo)指令，從而滿足多變的事件執(zhí)行環(huán)境。

通過上述步驟S402至步驟S408，通過獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)；對(duì)樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象，目標(biāo)事件對(duì)象為在游戲應(yīng)用客戶端上待同時(shí)執(zhí)行的事件對(duì)象；按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果；對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令，其中，目標(biāo)指令用于指示游戲應(yīng)用客戶端同時(shí)執(zhí)行不同層數(shù)據(jù)組合對(duì)應(yīng)的不同的目標(biāo)事件對(duì)象，可以解決相關(guān)技術(shù)的數(shù)據(jù)處理效率低的技術(shù)問題，進(jìn)而達(dá)到提高數(shù)據(jù)處理效率的技術(shù)效果。

作為一種可選的實(shí)施方式，步驟S404，對(duì)樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合包括：根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)；對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，其中，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)不同的處理算法和不同的樣本信息。這樣多層數(shù)據(jù)組合各自使用不同的算法，可以在決策時(shí)長和仿真深度上做折衷，以滿足多變的游戲場(chǎng)景，可以應(yīng)對(duì)不同決策時(shí)長的要求，決策執(zhí)行使用簡(jiǎn)單高效，可以保證行為的快速執(zhí)行。

步驟S406，按照預(yù)設(shè)處理算法對(duì)每層數(shù)據(jù)組合執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果包括：按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果。

作為一種可選的實(shí)施方式，在步驟S404中，根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)包括：按照多個(gè)樣本序列中每個(gè)樣本序列的優(yōu)先級(jí)依次通過標(biāo)記幀對(duì)每個(gè)樣本序列進(jìn)行標(biāo)記，得到多個(gè)標(biāo)記樣本序列，再將多個(gè)標(biāo)記樣本序列中相鄰的標(biāo)記樣本序列按照相同的標(biāo)記幀進(jìn)行合并得到的合并標(biāo)記樣本序列中的起始幀和結(jié)束幀進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)。

圖5是根據(jù)本發(fā)明實(shí)施例的一種根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記的方法的流程圖。如圖5所示，該根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記的方法包括以下步驟：

步驟S501，確定多個(gè)樣本序列中每個(gè)樣本序列的優(yōu)先級(jí)。

在本申請(qǐng)上述步驟S501提供的技術(shù)方案中，確定多個(gè)樣本序列中每個(gè)樣本序列的優(yōu)先級(jí)。樣本數(shù)據(jù)包括多個(gè)樣本序列，多個(gè)樣本序列中每個(gè)樣本序列具有優(yōu)先級(jí)，由于事件執(zhí)行規(guī)則復(fù)雜，會(huì)出現(xiàn)同一數(shù)據(jù)幀屬于多個(gè)樣本序列的情況，在獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)之后，確定多個(gè)樣本序列中每個(gè)樣本序列的優(yōu)先級(jí)，進(jìn)而根據(jù)每個(gè)樣本序列的優(yōu)先級(jí)得出多個(gè)樣本序列的排列順序。

步驟S502，按照優(yōu)先級(jí)依次通過標(biāo)記幀對(duì)每個(gè)樣本序列進(jìn)行標(biāo)記，得到多個(gè)標(biāo)記樣本序列。

在本申請(qǐng)上述步驟S502提供的技術(shù)方案中，按照優(yōu)先級(jí)依次通過標(biāo)記幀對(duì)每個(gè)樣本序列進(jìn)行標(biāo)記，得到多個(gè)標(biāo)記樣本序列。在確定多個(gè)樣本序列中每個(gè)樣本序列的優(yōu)先級(jí)之后，按照多個(gè)樣本序列的排列順序通過標(biāo)記幀標(biāo)記不同的樣本序列?？蛇x地，通過預(yù)設(shè)規(guī)則或者預(yù)設(shè)樣本分割算法來通過標(biāo)記幀按照多個(gè)樣本序列的排列順序標(biāo)記不同的樣本序列，得到多個(gè)標(biāo)記樣本序列。

步驟S503，將多個(gè)標(biāo)記樣本序列中相鄰的標(biāo)記樣本序列按照相同的標(biāo)記幀進(jìn)行合并，得到合并標(biāo)記樣本序列。

在本申請(qǐng)上述步驟S503提供的技術(shù)方案中，將多個(gè)標(biāo)記樣本序列中相鄰的標(biāo)記樣本序列按照相同的標(biāo)記幀進(jìn)行合并，得到合并標(biāo)記樣本序列。

遍歷多個(gè)標(biāo)記樣本序列的標(biāo)記幀。將相鄰相同標(biāo)記幀的樣本序列標(biāo)記為同一個(gè)序列，得到合并標(biāo)記樣本序列。

步驟S504，對(duì)合并標(biāo)記樣本序列的起始幀和結(jié)束幀進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)。

在本申請(qǐng)上述步驟S504提供的技術(shù)方案中，對(duì)合并標(biāo)記樣本序列的起始幀和結(jié)束幀進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)。

在將多個(gè)標(biāo)記樣本序列中相鄰的標(biāo)記樣本序列按照相同的標(biāo)記幀進(jìn)行合并，得到合并標(biāo)記樣本序列之后，標(biāo)記各合并標(biāo)記樣本序列的起始幀和結(jié)束幀，得到標(biāo)記樣本數(shù)據(jù)。

該實(shí)施例通過確定多個(gè)樣本序列中每個(gè)樣本序列的優(yōu)先級(jí)；按照優(yōu)先級(jí)依次通過標(biāo)記幀對(duì)每個(gè)樣本序列進(jìn)行標(biāo)記，得到多個(gè)標(biāo)記樣本序列；將多個(gè)標(biāo)記樣本序列中相鄰的標(biāo)記樣本序列按照相同的標(biāo)記幀進(jìn)行合并，得到合并標(biāo)記樣本序列；對(duì)合并標(biāo)記樣本序列的起始幀和結(jié)束幀進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)，實(shí)現(xiàn)了根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)的目的。

作為一種可選的實(shí)施方式，在步驟S404中，對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合包括：對(duì)游戲應(yīng)用客戶端執(zhí)行當(dāng)前事件對(duì)象的不同的狀態(tài)信息執(zhí)行組裝，得到多層數(shù)據(jù)組合。

圖6是根據(jù)本發(fā)明實(shí)施例的一種對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理的方法的流程圖。如圖6所示，該對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理的方法包括以下步驟：

步驟S601，通過預(yù)設(shè)狀態(tài)函數(shù)在標(biāo)記樣本數(shù)據(jù)中提取游戲應(yīng)用客戶端執(zhí)行當(dāng)前事件對(duì)象的不同的狀態(tài)信息。

在本申請(qǐng)上述步驟S601提供的技術(shù)方案中，通過預(yù)設(shè)狀態(tài)函數(shù)在標(biāo)記樣本數(shù)據(jù)中提取游戲應(yīng)用客戶端執(zhí)行當(dāng)前事件對(duì)象的不同的狀態(tài)信息。

在根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)之后，通過通用的狀態(tài)函數(shù)在標(biāo)記樣本數(shù)據(jù)中提取當(dāng)前盤面的不同的狀態(tài)信息，該不同的狀態(tài)信息可以為游戲應(yīng)用客戶端在實(shí)時(shí)游戲過程中的本方角色狀態(tài)、友方角色狀態(tài)、敵方角色狀態(tài)等狀態(tài)信息，當(dāng)前事件對(duì)象為游戲應(yīng)用客戶端當(dāng)前執(zhí)行的事件對(duì)象。

步驟S602，對(duì)不同的狀態(tài)信息執(zhí)行組裝，得到多層數(shù)據(jù)組合。

在本申請(qǐng)上述步驟S602提供的技術(shù)方案中，對(duì)不同的狀態(tài)信息執(zhí)行組裝，得到多層數(shù)據(jù)組合。

在通過預(yù)設(shè)狀態(tài)函數(shù)在標(biāo)記樣本數(shù)據(jù)中提取游戲應(yīng)用客戶端執(zhí)行當(dāng)前事件對(duì)象的不同的狀態(tài)信息之后，將不同的狀態(tài)信息執(zhí)行組裝，比如，將本方角色狀態(tài)、友方角色狀態(tài)、敵方角色狀態(tài)等狀態(tài)信息執(zhí)行組裝，得到多層數(shù)據(jù)組合，該多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象，目標(biāo)事件對(duì)象為在游戲應(yīng)用客戶端上待同時(shí)執(zhí)行的事件對(duì)象，比如，在一個(gè)雙方各五人的實(shí)時(shí)游戲中，本方角色狀態(tài)作為第一層，友方角色狀態(tài)按照實(shí)力排名放在第二層至第五層，敵方角色狀態(tài)按照傷害力排名放在第六層至第十層，最外層為地圖信息和NPC信息，其它的數(shù)據(jù)組裝方法也可以適用。

該實(shí)施例通過預(yù)設(shè)狀態(tài)函數(shù)在標(biāo)記樣本數(shù)據(jù)中提取游戲應(yīng)用客戶端執(zhí)行當(dāng)前事件對(duì)象的不同的狀態(tài)信息，當(dāng)前事件對(duì)象為游戲應(yīng)用客戶端當(dāng)前執(zhí)行的事件對(duì)象；對(duì)不同的狀態(tài)信息執(zhí)行組裝，得到多層數(shù)據(jù)組合，實(shí)現(xiàn)了對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合的目的，進(jìn)而提高了數(shù)據(jù)處理效率。

作為一種可選的實(shí)施方式，在按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果之前，將狀態(tài)信息、游戲應(yīng)用客戶端上的角色數(shù)據(jù)和目標(biāo)事件的事件數(shù)據(jù)生成樣本信息。

圖7是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理方法的流程圖。如圖7所示，該數(shù)據(jù)處理方法包括以下步驟：

步驟S701，獲取游戲應(yīng)用客戶端上的角色數(shù)據(jù)。

在本申請(qǐng)上述步驟S701提供的技術(shù)方案中，獲取游戲應(yīng)用客戶端上的角色數(shù)據(jù)。

游戲應(yīng)用客戶端在執(zhí)行目標(biāo)事件時(shí)，具有角色數(shù)據(jù)，該角色數(shù)據(jù)用于表示執(zhí)行目標(biāo)事件的虛擬應(yīng)用主體的數(shù)據(jù)。該角色數(shù)據(jù)包括多個(gè)角色數(shù)據(jù)，每個(gè)角色數(shù)據(jù)對(duì)應(yīng)一個(gè)虛擬應(yīng)用主體的數(shù)據(jù)，獲取游戲應(yīng)用客戶端上的每個(gè)角色數(shù)據(jù)。

步驟S702，將狀態(tài)信息和角色數(shù)據(jù)按照預(yù)設(shè)映射系映射至預(yù)設(shè)處理模型，得到目標(biāo)事件的事件數(shù)據(jù)。

在本申請(qǐng)上述步驟S702提供的技術(shù)方案中，狀態(tài)信息和角色數(shù)據(jù)可以通過游戲規(guī)則狀態(tài)映射到合法的動(dòng)作空間中，該動(dòng)作空間中具有和狀態(tài)信息、角色數(shù)據(jù)相對(duì)應(yīng)的目標(biāo)事件的事件數(shù)據(jù)，可以為動(dòng)作數(shù)據(jù)，從而通過狀態(tài)信息和角色數(shù)據(jù)以及合法的動(dòng)作空間得到目標(biāo)事件的事件數(shù)據(jù)。

步驟S703，根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息。

在本申請(qǐng)上述步驟S703提供的技術(shù)方案中，根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息。

在將狀態(tài)信息和角色數(shù)據(jù)按照預(yù)設(shè)映射系映射至預(yù)設(shè)處理模型，得到目標(biāo)事件的事件數(shù)據(jù)之后，根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息，該樣本信息為幀信息。每個(gè)事件數(shù)據(jù)對(duì)應(yīng)一個(gè)樣本信息。比如，將狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)以<S，u，a>表示，其中，S為狀態(tài)信息、u為角色數(shù)據(jù)，a為事件數(shù)據(jù)。

該實(shí)施例通過在按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果之前，獲取游戲應(yīng)用客戶端上的角色數(shù)據(jù)；將狀態(tài)信息和角色數(shù)據(jù)按照預(yù)設(shè)映射系映射至預(yù)設(shè)處理模型，得到目標(biāo)事件的事件數(shù)據(jù)；根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息，進(jìn)而提高了數(shù)據(jù)處理的效率。

作為一種可選的實(shí)施方式，在根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息之后，添加預(yù)設(shè)信息至樣本數(shù)量的樣本信息中。

圖8是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理方法的流程圖。如圖8所示，該數(shù)據(jù)處理方法還包括以下步驟：

步驟S801，對(duì)樣本數(shù)據(jù)執(zhí)行旋轉(zhuǎn)處理以擴(kuò)展樣本數(shù)據(jù)對(duì)應(yīng)的樣本數(shù)量。

在本申請(qǐng)上述步驟S801提供的技術(shù)方案中，在根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息之后，對(duì)樣本數(shù)據(jù)執(zhí)行旋轉(zhuǎn)處理以擴(kuò)展樣本數(shù)據(jù)對(duì)應(yīng)的樣本數(shù)量。

步驟S802，添加預(yù)設(shè)信息至樣本數(shù)量的樣本信息中。

在本申請(qǐng)上述步驟S802提供的技術(shù)方案中，添加預(yù)設(shè)信息至樣本數(shù)量的樣本信息中。

在對(duì)樣本數(shù)據(jù)執(zhí)行旋轉(zhuǎn)處理以擴(kuò)展樣本數(shù)據(jù)對(duì)應(yīng)的樣本數(shù)量之后，添加預(yù)設(shè)信息至樣本數(shù)量的樣本信息中。該預(yù)設(shè)信息可以為其他用戶的信息，比如，失誤率，操作頻次等信息，將失誤率，操作頻次等信息加入幀信息中，以便于訓(xùn)練個(gè)性化的策略。

作為一種可選的實(shí)施方式，在步驟S406中，按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果包括：按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)概率模型、預(yù)設(shè)價(jià)值模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行概率和執(zhí)行價(jià)值，并通過與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行概率和與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行價(jià)值得到目標(biāo)指令。

圖9是根據(jù)本發(fā)明實(shí)施例的一種按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理的方法的流程圖。如圖9所示，該方法包括以下步驟：

步驟S901，按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)概率模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行概率。

在本申請(qǐng)上述步驟S901提供的技術(shù)方案中，每層數(shù)據(jù)組合對(duì)應(yīng)預(yù)設(shè)概率模型，每層數(shù)據(jù)組合根據(jù)每層數(shù)據(jù)組合的樣本信息學(xué)習(xí)當(dāng)前狀態(tài)下動(dòng)作執(zhí)行的預(yù)設(shè)概率模型，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行概率。

步驟S902，按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)價(jià)值模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行價(jià)值。

在本申請(qǐng)上述步驟S902提供的技術(shù)方案中，每層數(shù)據(jù)組合對(duì)應(yīng)預(yù)設(shè)價(jià)值模型，每層數(shù)據(jù)組合根據(jù)每層數(shù)據(jù)組合的樣本信息學(xué)習(xí)當(dāng)前狀態(tài)下動(dòng)作執(zhí)行的預(yù)設(shè)價(jià)值模型，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的價(jià)值概率。

步驟S903，對(duì)與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行概率和與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行價(jià)值進(jìn)行整合處理，得到目標(biāo)指令。

在本申請(qǐng)上述步驟S903提供的技術(shù)方案中輸出最終策略，在策略進(jìn)行中，加入狀態(tài)評(píng)估函數(shù)，從而確定當(dāng)前盤面下是否需要改變策略，應(yīng)對(duì)多變的事件執(zhí)行環(huán)境。

該實(shí)施例通過按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)概率模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行概率；按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)價(jià)值模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行價(jià)值，實(shí)現(xiàn)了按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果，對(duì)與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行概率和與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行價(jià)值進(jìn)行整合處理，得到目標(biāo)指令，提高了數(shù)據(jù)處理效率。

作為一種可選的實(shí)施方式，在對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令之后，在需要更新目標(biāo)指令的情況下，對(duì)目標(biāo)指令進(jìn)行更新。

圖10是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理方法的流程圖。如圖10所示，該數(shù)據(jù)處理方法包括以下步驟：

步驟S1001，根據(jù)預(yù)設(shè)狀態(tài)評(píng)估函數(shù)判斷是否需要更新目標(biāo)指令。

在本申請(qǐng)上述步驟S1001提供的技術(shù)方案中，根據(jù)預(yù)設(shè)狀態(tài)評(píng)估函數(shù)判斷是否需要更新目標(biāo)指令。

在獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令之后，根據(jù)目標(biāo)指令執(zhí)行目標(biāo)事件，返回對(duì)應(yīng)的盤面信息，根據(jù)預(yù)設(shè)狀態(tài)評(píng)估函數(shù)判斷是否需要更新目標(biāo)指令，可以通過行為樹(Behavior Tree)判斷是否需要更新目標(biāo)指令，該行為樹為一種圖形化的模型語言，在游戲中用來描述不同行為的執(zhí)行條件和方式。

步驟S1002，如果判斷出需要更新目標(biāo)指令，對(duì)目標(biāo)指令進(jìn)行更新。

在本申請(qǐng)上述步驟S1002提供的技術(shù)方案中，如果判斷出需要更新目標(biāo)指令，對(duì)目標(biāo)指令進(jìn)行更新。

在根據(jù)預(yù)設(shè)狀態(tài)評(píng)估函數(shù)判斷是否需要更新目標(biāo)指令之后，如果判斷出需要更新目標(biāo)指令，對(duì)目標(biāo)指令進(jìn)行更新，從而應(yīng)對(duì)多變的事件處理環(huán)境。

該實(shí)施例通過在對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令之后，根據(jù)預(yù)設(shè)狀態(tài)評(píng)估函數(shù)判斷是否需要更新目標(biāo)指令；如果判斷出需要更新目標(biāo)指令，對(duì)目標(biāo)指令進(jìn)行更新，提高了數(shù)據(jù)處理效率。

作為一種可選的實(shí)施方式，在對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令之后，根據(jù)目標(biāo)指令執(zhí)行不同的目標(biāo)事件對(duì)象時(shí)的不同的目標(biāo)狀態(tài)信息更新每層數(shù)據(jù)組合的處理結(jié)果，得到每層數(shù)據(jù)組合的更新處理結(jié)果，通過對(duì)多層數(shù)據(jù)組合的更新處理結(jié)果進(jìn)行整合處理，得到更新目標(biāo)指令。

圖11是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理方法的流程圖。如圖11所示，該數(shù)據(jù)處理方法包括以下步驟：

步驟S1101，獲取在游戲應(yīng)用客戶端根據(jù)目標(biāo)指令執(zhí)行不同的目標(biāo)事件對(duì)象時(shí)的不同的目標(biāo)狀態(tài)信息。

在本申請(qǐng)上述步驟S1101提供的技術(shù)方案中，在獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令之后，游戲應(yīng)用客戶端根據(jù)目標(biāo)指令執(zhí)行不同的目標(biāo)事件對(duì)象，獲取在游戲應(yīng)用客戶端根據(jù)目標(biāo)指令執(zhí)行不同的目標(biāo)事件對(duì)象時(shí)的不同的目標(biāo)狀態(tài)信息。

步驟S1102，根據(jù)不同的目標(biāo)狀態(tài)信息更新每層數(shù)據(jù)組合的處理結(jié)果，得到每層數(shù)據(jù)組合的更新處理結(jié)果。

在本申請(qǐng)上述步驟S1102提供的技術(shù)方案中，獲取在游戲應(yīng)用客戶端根據(jù)目標(biāo)指令執(zhí)行不同的目標(biāo)事件對(duì)象時(shí)的不同的目標(biāo)狀態(tài)信息之后，根據(jù)不同的目標(biāo)狀態(tài)信息更新每層數(shù)據(jù)組合的處理結(jié)果，得到每層數(shù)據(jù)組合的更新處理結(jié)果。獲取每層數(shù)據(jù)組合的更新處理結(jié)果，并對(duì)多層數(shù)據(jù)組合的更新處理結(jié)果進(jìn)行整合處理，得到更新目標(biāo)指令。

該實(shí)施例通過獲取在游戲應(yīng)用客戶端根據(jù)目標(biāo)指令執(zhí)行不同的目標(biāo)事件對(duì)象時(shí)的不同的目標(biāo)狀態(tài)信息；根據(jù)不同的目標(biāo)狀態(tài)信息更新每層數(shù)據(jù)組合的處理結(jié)果，得到每層數(shù)據(jù)組合的更新處理結(jié)果，提高了數(shù)據(jù)處理的效率。

實(shí)施例2

下面結(jié)合優(yōu)選的實(shí)施例對(duì)本發(fā)明的技術(shù)方案進(jìn)行說明。

該實(shí)施例應(yīng)用于游戲智能系統(tǒng)中。實(shí)時(shí)游戲一般都有復(fù)雜的游戲規(guī)則、多變的動(dòng)態(tài)場(chǎng)景、行為達(dá)成不確定、信息不完全、決策時(shí)間短等特點(diǎn)。面對(duì)如此巨大的決策空間和決策的實(shí)時(shí)需求，如何制定、選擇和執(zhí)行策略是游戲智能系統(tǒng)面對(duì)的最主要問題。在回合制游戲上，利用多個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)的方法已經(jīng)被證明具有較強(qiáng)的決策能力，但是無法直接應(yīng)用在實(shí)時(shí)游戲上，其中，深度學(xué)習(xí)(Deep Learning)是通過使用多個(gè)復(fù)雜結(jié)構(gòu)或非線性變換處理層的神經(jīng)網(wǎng)絡(luò)算法，較淺層神經(jīng)網(wǎng)絡(luò)有更好的高層抽象能力，實(shí)時(shí)游戲(Real Time Game)是一種游戲過程即時(shí)進(jìn)行而不是采用回合制的游戲類型，相對(duì)于圍棋、象棋等回合制游戲。本方案提出一種分層解決方法，把策略選擇分散到多個(gè)層次，從而使龐大的扁平化數(shù)據(jù)能夠被分散學(xué)習(xí)，進(jìn)而降低了狀態(tài)空間的緯度，并能各自使用不同算法。該實(shí)施例可以在決策時(shí)長和仿真深度上做折衷，以滿足多變的游戲場(chǎng)景。

實(shí)時(shí)游戲的規(guī)則復(fù)雜，玩家只有部分信息，同時(shí)行動(dòng)，決策時(shí)長較短，行為需要時(shí)間執(zhí)行并且概率成功。

該實(shí)施例模擬人類玩家的決策過程，將整個(gè)智能系統(tǒng)分為決策選擇、決策實(shí)行、反饋調(diào)優(yōu)三個(gè)模塊，使得系統(tǒng)能夠應(yīng)對(duì)實(shí)時(shí)游戲復(fù)雜多變的場(chǎng)景。在宏觀層面，考慮了游戲玩家的決策深度問題，將根據(jù)自上而下的抽象層次不同，選取合適的數(shù)據(jù)樣本和算法進(jìn)行決策學(xué)習(xí)，從而降低運(yùn)算的復(fù)雜度。在微觀層面，決策的執(zhí)行使用某些快速簡(jiǎn)單的算法執(zhí)行，能夠反饋結(jié)果，不需進(jìn)行過多的決策考量。

該實(shí)施例可以應(yīng)用在實(shí)時(shí)游戲的人機(jī)對(duì)戰(zhàn)模式中，可以提供更加擬人化的人工智能角色，優(yōu)化玩家的體驗(yàn)。

圖12是根據(jù)本發(fā)明實(shí)施例的一種游戲過程中的交互過程的示意圖。如圖12所示，該實(shí)施例將策略選擇和策略執(zhí)行分離，決策層包括策略層1、策略層2至策略層n，具有較大的深度，能夠模擬玩家游戲決策路徑，策略執(zhí)行關(guān)注執(zhí)行效率，不作過多決策，通過反饋調(diào)優(yōu)。

游戲數(shù)據(jù)設(shè)計(jì)緯度眾多，無法直接用作訓(xùn)練數(shù)據(jù)，需要根據(jù)預(yù)定規(guī)則進(jìn)行標(biāo)記。主要方法是根據(jù)輸入樣本為的一個(gè)特征序列，根據(jù)預(yù)設(shè)的邏輯配置標(biāo)記整個(gè)樣本。圖13是根據(jù)本發(fā)明實(shí)施例的另一種根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記的方法的流程圖。如圖13所示，該根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記的方法包括以下步驟：

步驟S1301，按照游戲特性分出樣本序列的優(yōu)先級(jí)，得到樣本序列順序。

因?yàn)橛螒蛞?guī)則復(fù)雜，會(huì)出現(xiàn)同一幀屬于多種序列的情況，所以第一步需要根據(jù)游戲特性分出樣本序列的優(yōu)先級(jí)。

步驟S1302，按照樣本序列順序標(biāo)記不同序列。

按照樣本序列順序標(biāo)記不同序列，方法可以使用預(yù)設(shè)規(guī)則或者某些樣本分割算法。

步驟S1303，遍歷所有標(biāo)記幀。

遍歷所有標(biāo)記幀，標(biāo)記為后向第一個(gè)已標(biāo)記幀的序列。

步驟S1304，將相鄰相同幀標(biāo)記為同一個(gè)序列。

遍歷所有幀，將相鄰相同幀標(biāo)記為同一個(gè)序列。

步驟S1305，標(biāo)記各序列的起始結(jié)束幀。

標(biāo)記各序列的起始幀和結(jié)束幀。

該實(shí)施例通過按照游戲特性分出樣本序列的優(yōu)先級(jí)，得到樣本序列順序，按照樣本序列順序標(biāo)記不同序列，遍歷所有標(biāo)記幀，將相鄰相同幀標(biāo)記為同一個(gè)序列，標(biāo)記各序列的起始結(jié)束幀，從而實(shí)現(xiàn)了根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記的目的。

圖14是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理方法的流程圖。如圖14所示，該對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理方法包括以下步驟：

步驟S1401，通過通用狀態(tài)函數(shù)在樣本中提取當(dāng)前盤面的狀態(tài)信息。

通過通用狀態(tài)函數(shù)在樣本中提取當(dāng)前盤面的狀態(tài)信息，稱為S狀態(tài)。

步驟S1402，將狀態(tài)信息組裝成多層數(shù)據(jù)組合。

假設(shè)一個(gè)雙方各5人的實(shí)時(shí)游戲，本方角色狀態(tài)作為第一層，友方角色狀態(tài)按照實(shí)力排名放在2-5層，敵方按傷害力排名放在6-10層，最外層為地圖信息和NPC信息。其他數(shù)據(jù)組裝原則也可使用。

步驟S1403，在每層數(shù)據(jù)組合將樣本的狀態(tài)信息，每個(gè)角色數(shù)據(jù)根據(jù)游戲規(guī)則狀態(tài)映射到合法的動(dòng)作空間中，從而獲取事件數(shù)據(jù)。

步驟S1404，根據(jù)每個(gè)動(dòng)作樣本生成<S，u，a>，對(duì)樣本進(jìn)行旋轉(zhuǎn)以擴(kuò)充樣本數(shù)量。

步驟S1405，添加預(yù)設(shè)信息至樣本數(shù)量的樣本信息中。

添加信息其他用戶信息例如失誤率，操作頻次也可加入幀信息中，以便于訓(xùn)練個(gè)性化人工智能(Artificial Intelligence，簡(jiǎn)稱為AI)。

在每個(gè)決策層根據(jù)樣本的<S，u，a>信息，學(xué)習(xí)當(dāng)前狀態(tài)下動(dòng)作執(zhí)行概率模型和動(dòng)作的價(jià)值模型，算法可以參照AlphaGo用蒙地卡洛樹算法整合策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)。加權(quán)整合各個(gè)決策層的輸出，得出最終策略。策略進(jìn)行中可加入狀態(tài)評(píng)估函數(shù)，以確定當(dāng)前盤面下是否需要改變策略，應(yīng)對(duì)多變的游戲環(huán)境。

在策略執(zhí)行時(shí)，返回對(duì)應(yīng)的盤面信息以共策略選擇模塊更新學(xué)習(xí)，算法可以使用行為樹。

該實(shí)施例提出了一種多層的智能系統(tǒng)架構(gòu)，將智能系統(tǒng)分成多個(gè)決策層的構(gòu)建思路，模擬玩家在實(shí)際游戲中的多層抽象決策行為，將決策選擇和決策執(zhí)行分離，以應(yīng)對(duì)實(shí)時(shí)游戲的需求。決策層應(yīng)用多層深度學(xué)習(xí)框架，合理構(gòu)建樣本，進(jìn)行樣本策略序列的標(biāo)記與處理，并且可以應(yīng)對(duì)不同決策時(shí)長的要求。決策執(zhí)行使用簡(jiǎn)單高效，可以保證行為的快速執(zhí)行，提高了數(shù)據(jù)處理效率。整個(gè)系統(tǒng)模擬玩家的思考過程，能夠有效地提升A的能力，從而提升了游戲玩家的用戶體驗(yàn)。

實(shí)施例3

本發(fā)明實(shí)施例的應(yīng)用環(huán)境可以但不限于參照上述實(shí)施例中的應(yīng)用環(huán)境，本實(shí)施例中對(duì)此不再贅述。本發(fā)明實(shí)施例提供了用于實(shí)施上述數(shù)據(jù)處理方法的一種可選的具體應(yīng)用。

本發(fā)明的技術(shù)方案可以應(yīng)用在實(shí)時(shí)游戲的人機(jī)對(duì)戰(zhàn)中，可以提供更加擬人化的人工智能角色，從而優(yōu)化游戲玩家的體驗(yàn)。

圖15是根據(jù)本發(fā)明實(shí)施例的一種游戲交互的方法的流程示意圖。如圖15所示，游戲客戶端獲取當(dāng)前游戲的狀態(tài)，將當(dāng)前游戲的狀態(tài)通過網(wǎng)絡(luò)發(fā)送到策略選擇服務(wù)器上。策略選擇服務(wù)器為多個(gè)服務(wù)器，通過模型進(jìn)行策略選擇，選擇最佳的動(dòng)作并返回給游戲客戶端，游戲客戶端根據(jù)最佳的動(dòng)作執(zhí)行策略，并進(jìn)行盤面信息、策略反饋。

該實(shí)施例模擬游戲玩家的決策過程，將整個(gè)智能系統(tǒng)分為決策選擇、決策實(shí)行、反饋調(diào)優(yōu)三個(gè)模塊，使得系統(tǒng)能夠應(yīng)對(duì)實(shí)時(shí)游戲復(fù)雜多變的場(chǎng)景。在宏觀層面，該實(shí)施例考慮了玩家決策深度問題，根據(jù)自上而下的抽象層次不同，選取合適的數(shù)據(jù)樣本和算法進(jìn)行決策學(xué)習(xí)，從而降低運(yùn)算的復(fù)雜度。在微觀層面，決策的執(zhí)行使用某些快速簡(jiǎn)單的算法執(zhí)行，能夠反饋結(jié)果，不需進(jìn)行過多的決策。實(shí)現(xiàn)了游戲交互方法將策略選擇和策略執(zhí)行分開，決策層具有較大的深度，能夠模擬游戲玩家決策路徑，執(zhí)行層側(cè)重于執(zhí)行效率，不做過多決策，提高了數(shù)據(jù)處理效率。

需要說明的是，對(duì)于前述的各方法實(shí)施例，為了簡(jiǎn)單描述，故將其都表述為一系列的動(dòng)作組合，但是本領(lǐng)域技術(shù)人員應(yīng)該知悉，本發(fā)明并不受所描述的動(dòng)作順序的限制，因?yàn)橐罁?jù)本發(fā)明，某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次，本領(lǐng)域技術(shù)人員也應(yīng)該知悉，說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例，所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。

通過以上的實(shí)施方式的描述，本領(lǐng)域的技術(shù)人員可以清楚地了解到根據(jù)上述實(shí)施例的方法可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn)，當(dāng)然也可以通過硬件，但很多情況下前者是更佳的實(shí)施方式?；谶@樣的理解，本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來，該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如ROM/RAM、磁碟、光盤)中，包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī)，計(jì)算機(jī)，服務(wù)器，或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。

實(shí)施例4

根據(jù)本發(fā)明實(shí)施例，還提供了一種用于實(shí)施上述數(shù)據(jù)處理方法的數(shù)據(jù)處理裝置。圖16是根據(jù)本發(fā)明實(shí)施例的一種數(shù)據(jù)處理裝置的示意圖。如圖16所示，該數(shù)據(jù)處理裝置可以包括：第一獲取單元10，第一處理單元20，第二處理單元30和第三處理單元40。

第一獲取單元10，用于獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)。

第一處理單元20，用于對(duì)樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，其中，多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象，目標(biāo)事件對(duì)象為在游戲應(yīng)用客戶端上待同時(shí)執(zhí)行的事件對(duì)象。

第二處理單元30，用于按照預(yù)設(shè)處理算法對(duì)每層數(shù)據(jù)組合執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果。

第三處理單元40，用于對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令，其中，目標(biāo)指令用于指示游戲應(yīng)用客戶端同時(shí)執(zhí)行不同層數(shù)據(jù)組合對(duì)應(yīng)的不同的目標(biāo)事件對(duì)象。

需要說明的是，該實(shí)施例中的第一獲取單元10可以用于執(zhí)行本申請(qǐng)實(shí)施例1中的步驟S402，該實(shí)施例中的第一處理單元20可以用于執(zhí)行本申請(qǐng)實(shí)施例1中的步驟S404，該實(shí)施例中的第二處理單元30可以用于執(zhí)行本申請(qǐng)實(shí)施例1中的步驟S406，該實(shí)施例中的第三處理單元40可以用于執(zhí)行本申請(qǐng)實(shí)施例1中的步驟S408。

圖17是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖。如圖17所示，該數(shù)據(jù)處理裝置可以包括：第一獲取單元10，第一處理單元20，第二處理單元30和第三處理單元40。其中，第一處理單元20包括：標(biāo)記模塊21和處理模塊22。

需要說明的是，該實(shí)施例的第一獲取單元10，第一處理單元20，第二處理單元30和第三處理單元40與圖16所示實(shí)施例的數(shù)據(jù)處理裝置中的作用相同，此處不再贅述。

標(biāo)記模塊21，用于根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)。

處理模塊22，用于對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，其中，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)不同的處理算法和不同的樣本信息。

第二處理單元30用于按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果。

圖18是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖。如圖18所示，該數(shù)據(jù)處理裝置可以包括：第一獲取單元10，第一處理單元20，第二處理單元30和第三處理單元40。其中，第一處理單元20包括：標(biāo)記模塊21和處理模塊22，標(biāo)記模塊21包括：確定子模塊211，第一標(biāo)記子模塊212，合并子模塊213和第二標(biāo)記子模塊214。

需要說明的是，該實(shí)施例的第一獲取單元10，第一處理單元20，第二處理單元30和第三處理單元40，標(biāo)記模塊21和處理模塊22與圖17所示實(shí)施例的數(shù)據(jù)處理裝置中的作用相同，此處不再贅述。

確定子模塊211，用于確定多個(gè)樣本序列中每個(gè)樣本序列的優(yōu)先級(jí)。

第一標(biāo)記子模塊212，用于按照優(yōu)先級(jí)依次通過標(biāo)記幀對(duì)每個(gè)樣本序列進(jìn)行標(biāo)記，得到多個(gè)標(biāo)記樣本序列。

合并子模塊213，用于將多個(gè)標(biāo)記樣本序列中相鄰的標(biāo)記樣本序列按照相同的標(biāo)記幀進(jìn)行合并，得到合并標(biāo)記樣本序列。

第二標(biāo)記子模塊214，用于對(duì)合并標(biāo)記樣本序列的起始幀和結(jié)束幀進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)。

圖19是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖。如圖19所示，該數(shù)據(jù)處理裝置可以包括：第一獲取單元10，第一處理單元20，第二處理單元30和第三處理單元40。其中，第一處理單元20包括：標(biāo)記模塊21和處理模塊22，處理模塊22包括：提取子模塊221和組裝子模塊222。

需要說明的是，該實(shí)施例的第一獲取單元10，第一處理單元20，第二處理單元30和第三處理單元40，標(biāo)記模塊21和處理模塊22與圖17所示實(shí)施例的數(shù)據(jù)處理裝置中的作用相同。

提取子模塊221，用于通過預(yù)設(shè)狀態(tài)函數(shù)在標(biāo)記樣本數(shù)據(jù)中提取游戲應(yīng)用客戶端執(zhí)行當(dāng)前事件對(duì)象的不同的狀態(tài)信息，當(dāng)前事件對(duì)象為游戲應(yīng)用客戶端當(dāng)前執(zhí)行的事件對(duì)象。

組裝子模塊222，用于對(duì)不同的狀態(tài)信息執(zhí)行組裝，得到多層數(shù)據(jù)組合。

圖20是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖。如圖20所示，該數(shù)據(jù)處理裝置可以包括：第一獲取單元10，第一處理單元20，第二處理單元30和第三處理單元40。其中，第一處理單元20包括：標(biāo)記模塊21和處理模塊22，處理模塊22包括：提取子模塊221和組裝子模塊222，該數(shù)據(jù)處理裝置還包括：第二獲取單元50，映射單元60和生成單元70。

需要說明的是，該實(shí)施例的第一獲取單元10，第一處理單元20，第二處理單元30和第三處理單元40，提取子模塊221和組裝子模塊222與圖19所示實(shí)施例的數(shù)據(jù)處理裝置中的作用相同，此處不再贅述。

第二獲取單元50，用于在按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果之前，獲取游戲應(yīng)用客戶端上的角色數(shù)據(jù)。

映射單元60，用于將狀態(tài)信息和角色數(shù)據(jù)按照預(yù)設(shè)映射系映射至預(yù)設(shè)處理模型，得到目標(biāo)事件的事件數(shù)據(jù)。

生成單元70，用于根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息。

圖21是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖。如圖21所示，該數(shù)據(jù)處理裝置可以包括：第一獲取單元10，第一處理單元20，第二處理單元30，第三處理單元40，第二獲取單元50，映射單元60和生成單元70。其中，第一處理單元20包括：標(biāo)記模塊21和處理模塊22，處理模塊22包括：提取子模塊221和組裝子模塊222。該數(shù)據(jù)處理裝置還包括：第四處理單元80和添加單元90。

需要說明的是，該實(shí)施例的第一獲取單元10，第一處理單元20，第二處理單元30，第三處理單元40，第二獲取單元50，映射單元60和生成單元70，標(biāo)記模塊21和處理模塊22，提取子模塊221和組裝子模塊222與圖20所示實(shí)施例的數(shù)據(jù)處理裝置中的作用相同，此處不再贅述。

第四處理單元80，用于在根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息之后，對(duì)樣本數(shù)據(jù)執(zhí)行旋轉(zhuǎn)處理以擴(kuò)展樣本數(shù)據(jù)對(duì)應(yīng)的樣本數(shù)量。

添加單元90，用于添加預(yù)設(shè)信息至樣本數(shù)量的樣本信息中。

圖22是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖。如圖22所示，該數(shù)據(jù)處理裝置可以包括：第一獲取單元10，第一處理單元20，第二處理單元30和第三處理單元40。其中，第二處理單元30包括：第一處理模塊31和第二處理模塊32。

需要說明的是，該實(shí)施例的第一獲取單元10，第一處理單元20，第二處理單元30第三處理單元40與圖17所示實(shí)施例的數(shù)據(jù)處理裝置中的作用相同，此處不再贅述。

第一處理模塊31，用于按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)概率模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行概率。

第二處理模塊32，用于按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)價(jià)值模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行價(jià)值。

第三處理單元40用于對(duì)與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行概率和與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行價(jià)值進(jìn)行整合處理，得到目標(biāo)指令。

圖23是根據(jù)本發(fā)明實(shí)施例的另一種數(shù)據(jù)處理裝置的示意圖。如圖23所示，該數(shù)據(jù)處理裝置可以包括：第一獲取單元10，第一處理單元20，第二處理單元30，第二處理單元30和第三處理單元40。該數(shù)據(jù)處理裝置還包括：判斷單元100和更新單元110。

判斷單元100，用于在獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令之后，根據(jù)預(yù)設(shè)狀態(tài)評(píng)估函數(shù)判斷是否需要更新目標(biāo)指令。

更新單元110，用于在判斷出需要更新目標(biāo)指令，對(duì)目標(biāo)指令進(jìn)行更新。

本發(fā)明實(shí)施例通過第一獲取單元10獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)，通過第一處理單元20對(duì)樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象，目標(biāo)事件對(duì)象為在游戲應(yīng)用客戶端上待同時(shí)執(zhí)行的事件對(duì)象，通過第二處理單元30按照預(yù)設(shè)處理算法對(duì)每層數(shù)據(jù)組合執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果，通過第三處理單元40對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令，目標(biāo)指令用于指示游戲應(yīng)用客戶端同時(shí)執(zhí)行不同層數(shù)據(jù)組合對(duì)應(yīng)的不同的目標(biāo)事件對(duì)象，解決了相關(guān)技術(shù)的數(shù)據(jù)處理效率低的技術(shù)問題，進(jìn)而達(dá)到提高數(shù)據(jù)處理效果的技術(shù)效果。

此處需要說明的是，上述單元和模塊與對(duì)應(yīng)的步驟所實(shí)現(xiàn)的示例和應(yīng)用場(chǎng)景相同，但不限于上述實(shí)施例所公開的內(nèi)容。需要說明的是，上述模塊作為裝置的一部分可以運(yùn)行在如圖3所示的硬件環(huán)境中，可以通過軟件實(shí)現(xiàn)，也可以通過硬件實(shí)現(xiàn)，其中，硬件環(huán)境包括網(wǎng)絡(luò)環(huán)境。

實(shí)施例5

根據(jù)本發(fā)明實(shí)施例，還提供了一種用于實(shí)施上述數(shù)據(jù)處理方法的服務(wù)器或終端。

圖24是根據(jù)本發(fā)明實(shí)施例的一種終端的結(jié)構(gòu)框圖。如圖24所示，該終端可以包括：一個(gè)或多個(gè)(圖中僅示出一個(gè))處理器241、存儲(chǔ)器243、以及傳輸裝置245，如圖24所示，該終端還可以包括輸入輸出設(shè)備247。

其中，存儲(chǔ)器243可用于存儲(chǔ)軟件程序以及模塊，如本發(fā)明實(shí)施例中的數(shù)據(jù)處理方法和裝置對(duì)應(yīng)的程序指令/模塊，處理器241通過運(yùn)行存儲(chǔ)在存儲(chǔ)器243內(nèi)的軟件程序以及模塊，從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理，即實(shí)現(xiàn)上述的數(shù)據(jù)處理方法。存儲(chǔ)器243可包括高速隨機(jī)存儲(chǔ)器，還可以包括非易失性存儲(chǔ)器，如一個(gè)或者多個(gè)磁性存儲(chǔ)裝置、閃存、或者其他非易失性固態(tài)存儲(chǔ)器。在一些實(shí)例中，存儲(chǔ)器243可進(jìn)一步包括相對(duì)于處理器241遠(yuǎn)程設(shè)置的存儲(chǔ)器，這些遠(yuǎn)程存儲(chǔ)器可以通過網(wǎng)絡(luò)連接至終端。上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動(dòng)通信網(wǎng)及其組合。

上述的傳輸裝置245用于經(jīng)由一個(gè)網(wǎng)絡(luò)接收或者發(fā)送數(shù)據(jù)，還可以用于處理器與存儲(chǔ)器之間的數(shù)據(jù)傳輸。上述的網(wǎng)絡(luò)具體實(shí)例可包括有線網(wǎng)絡(luò)及無線網(wǎng)絡(luò)。在一個(gè)實(shí)例中，傳輸裝置245包括一個(gè)網(wǎng)絡(luò)適配器(Network Interface Controller，NIC)，其可通過網(wǎng)線與其他網(wǎng)絡(luò)設(shè)備與路由器相連從而可與互聯(lián)網(wǎng)或局域網(wǎng)進(jìn)行通訊。在一個(gè)實(shí)例中，傳輸裝置245為射頻(Radio Frequency，RF)模塊，其用于通過無線方式與互聯(lián)網(wǎng)進(jìn)行通訊。

其中，具體地，存儲(chǔ)器243用于存儲(chǔ)應(yīng)用程序。

處理器241可以通過傳輸裝置245調(diào)用存儲(chǔ)器243存儲(chǔ)的應(yīng)用程序，以執(zhí)行下述步驟：

獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)；

對(duì)樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，其中，多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象，目標(biāo)事件對(duì)象為在游戲應(yīng)用客戶端上待同時(shí)執(zhí)行的事件對(duì)象；

按照預(yù)設(shè)處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果；

對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令，其中，目標(biāo)指令用于指示游戲應(yīng)用客戶端同時(shí)執(zhí)行不同層數(shù)據(jù)組合對(duì)應(yīng)的不同的目標(biāo)事件對(duì)象。

處理器241還用于執(zhí)行下述步驟：根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)；對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，其中，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)不同的處理算法和不同的樣本信息；按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果。

處理器241還用于執(zhí)行下述步驟：確定多個(gè)樣本序列中每個(gè)樣本序列的優(yōu)先級(jí)；按照優(yōu)先級(jí)依次通過標(biāo)記幀對(duì)每個(gè)樣本序列進(jìn)行標(biāo)記，得到多個(gè)標(biāo)記樣本序列；將多個(gè)標(biāo)記樣本序列中相鄰的標(biāo)記樣本序列按照相同的標(biāo)記幀進(jìn)行合并，得到合并標(biāo)記樣本序列；對(duì)合并標(biāo)記樣本序列的起始幀和結(jié)束幀進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)。

處理器241還用于執(zhí)行下述步驟：通過預(yù)設(shè)狀態(tài)函數(shù)在標(biāo)記樣本數(shù)據(jù)中提取游戲應(yīng)用客戶端執(zhí)行當(dāng)前事件對(duì)象的不同的狀態(tài)信息，當(dāng)前事件對(duì)象為游戲應(yīng)用客戶端當(dāng)前執(zhí)行的事件對(duì)象；對(duì)不同的狀態(tài)信息執(zhí)行組裝，得到多層數(shù)據(jù)組合。

處理器241還用于執(zhí)行下述步驟：在按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果之前，獲取游戲應(yīng)用客戶端上的角色數(shù)據(jù)；將狀態(tài)信息和角色數(shù)據(jù)按照預(yù)設(shè)映射系映射至預(yù)設(shè)處理模型，得到目標(biāo)事件的事件數(shù)據(jù)；根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息。

處理器241還用于執(zhí)行下述步驟：在根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息之后，對(duì)樣本數(shù)據(jù)執(zhí)行旋轉(zhuǎn)處理以擴(kuò)展樣本數(shù)據(jù)對(duì)應(yīng)的樣本數(shù)量；添加預(yù)設(shè)信息至樣本數(shù)量的樣本信息中。

處理器241還用于執(zhí)行下述步驟：按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)概率模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行概率；按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)價(jià)值模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行價(jià)值；其中，獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令包括：對(duì)與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行概率和與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行價(jià)值進(jìn)行整合處理，得到目標(biāo)指令。

處理器241還用于執(zhí)行下述步驟：在獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令之后，根據(jù)預(yù)設(shè)狀態(tài)評(píng)估函數(shù)判斷是否需要更新目標(biāo)指令；如果判斷出需要更新目標(biāo)指令，對(duì)目標(biāo)指令進(jìn)行更新。

處理器241還用于執(zhí)行下述步驟：在獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令之后，獲取在游戲應(yīng)用客戶端根據(jù)目標(biāo)指令執(zhí)行不同的目標(biāo)事件對(duì)象時(shí)的不同的目標(biāo)狀態(tài)信息；根據(jù)不同的目標(biāo)狀態(tài)信息更新每層數(shù)據(jù)組合的處理結(jié)果，得到每層數(shù)據(jù)組合的更新處理結(jié)果；其中，獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令包括：獲取每層數(shù)據(jù)組合的更新處理結(jié)果，并對(duì)多層數(shù)據(jù)組合的更新處理結(jié)果進(jìn)行整合處理，得到更新目標(biāo)指令。

采用本發(fā)明實(shí)施例，提供了一種數(shù)據(jù)處理方法的方案。通過獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)；根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)；對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，其中，多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中的一種目標(biāo)事件對(duì)象，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)同一目標(biāo)事件中不同的目標(biāo)事件對(duì)象，目標(biāo)事件對(duì)象為在游戲應(yīng)用客戶端上待同時(shí)執(zhí)行的事件對(duì)象，不同層數(shù)據(jù)組合對(duì)應(yīng)不同的處理算法和不同的樣本信息；按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果；獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令，其中，目標(biāo)指令用于指示游戲應(yīng)用客戶端同時(shí)執(zhí)行不同層數(shù)據(jù)組合對(duì)應(yīng)的不同的目標(biāo)事件對(duì)象，達(dá)到了對(duì)多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令的目的，從而實(shí)現(xiàn)了提高數(shù)據(jù)處理效率的技術(shù)效果，進(jìn)而解決了相關(guān)技術(shù)的數(shù)據(jù)處理效率低的技術(shù)問題。

可選地，本實(shí)施例中的具體示例可以參考上述實(shí)施例中所描述的示例，本實(shí)施例在此不再贅述。

本領(lǐng)域普通技術(shù)人員可以理解，圖24所示的結(jié)構(gòu)僅為示意，終端可以是智能手機(jī)(如Android手機(jī)、iOS手機(jī)等)、平板電腦、掌上電腦以及移動(dòng)互聯(lián)網(wǎng)設(shè)備(Mobile Internet Devices，MID)、PAD等終端設(shè)備。圖24其并不對(duì)上述電子裝置的結(jié)構(gòu)造成限定。例如，終端還可包括比圖24中所示更多或者更少的組件(如網(wǎng)絡(luò)接口、顯示裝置等)，或者具有與圖24所示不同的配置。

本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令終端設(shè)備相關(guān)的硬件來完成，該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中，存儲(chǔ)介質(zhì)可以包括：閃存盤、只讀存儲(chǔ)器(Read-Only Memory，ROM)、隨機(jī)存取器(Random Access Memory，RAM)、磁盤或光盤等。

實(shí)施例6

本發(fā)明的實(shí)施例還提供了一種存儲(chǔ)介質(zhì)?？蛇x地，在本實(shí)施例中，上述存儲(chǔ)介質(zhì)可以用于執(zhí)行數(shù)據(jù)處理方法的程序代碼。

可選地，在本實(shí)施例中，上述存儲(chǔ)介質(zhì)可以位于上述實(shí)施例所示的網(wǎng)絡(luò)中的多個(gè)網(wǎng)絡(luò)設(shè)備中的至少一個(gè)網(wǎng)絡(luò)設(shè)備上。

可選地，在本實(shí)施例中，存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼：

獲取游戲應(yīng)用客戶端執(zhí)行事件的樣本數(shù)據(jù)；

按照預(yù)設(shè)處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果；

可選地，存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼：根據(jù)樣本數(shù)據(jù)的多個(gè)樣本序列對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)；對(duì)標(biāo)記樣本數(shù)據(jù)執(zhí)行預(yù)處理，得到多層數(shù)據(jù)組合，其中，多層數(shù)據(jù)組合中的不同層數(shù)據(jù)組合對(duì)應(yīng)不同的處理算法和不同的樣本信息；按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果。

可選地，存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼：確定多個(gè)樣本序列中每個(gè)樣本序列的優(yōu)先級(jí)；按照優(yōu)先級(jí)依次通過標(biāo)記幀對(duì)每個(gè)樣本序列進(jìn)行標(biāo)記，得到多個(gè)標(biāo)記樣本序列；將多個(gè)標(biāo)記樣本序列中相鄰的標(biāo)記樣本序列按照相同的標(biāo)記幀進(jìn)行合并，得到合并標(biāo)記樣本序列；對(duì)合并標(biāo)記樣本序列的起始幀和結(jié)束幀進(jìn)行標(biāo)記，得到標(biāo)記樣本數(shù)據(jù)。

可選地，存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼：通過預(yù)設(shè)狀態(tài)函數(shù)在標(biāo)記樣本數(shù)據(jù)中提取游戲應(yīng)用客戶端執(zhí)行當(dāng)前事件對(duì)象的不同的狀態(tài)信息，當(dāng)前事件對(duì)象為游戲應(yīng)用客戶端當(dāng)前執(zhí)行的事件對(duì)象；對(duì)不同的狀態(tài)信息執(zhí)行組裝，得到多層數(shù)據(jù)組合。

可選地，存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼：在按照與多層數(shù)據(jù)組合中的每層數(shù)據(jù)組合對(duì)應(yīng)的處理算法對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到每層數(shù)據(jù)組合的處理結(jié)果之前，獲取游戲應(yīng)用客戶端上的角色數(shù)據(jù)；將狀態(tài)信息和角色數(shù)據(jù)按照預(yù)設(shè)映射系映射至預(yù)設(shè)處理模型，得到目標(biāo)事件的事件數(shù)據(jù)；根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息。

可選地，存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼：在根據(jù)狀態(tài)信息、角色數(shù)據(jù)和事件數(shù)據(jù)生成樣本信息之后，對(duì)樣本數(shù)據(jù)執(zhí)行旋轉(zhuǎn)處理以擴(kuò)展樣本數(shù)據(jù)對(duì)應(yīng)的樣本數(shù)量；添加預(yù)設(shè)信息至樣本數(shù)量的樣本信息中。

可選地，存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼：按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)概率模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行概率；按照與每層數(shù)據(jù)組合對(duì)應(yīng)的預(yù)設(shè)價(jià)值模型對(duì)每層數(shù)據(jù)組合中的樣本信息執(zhí)行處理，得到與每層數(shù)據(jù)組合對(duì)應(yīng)的游戲應(yīng)用客戶端執(zhí)行目標(biāo)事件的執(zhí)行價(jià)值；其中，獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令包括：對(duì)與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行概率和與每層數(shù)據(jù)組合對(duì)應(yīng)的執(zhí)行價(jià)值進(jìn)行整合處理，得到目標(biāo)指令。

可選地，存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼：在獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令之后，根據(jù)預(yù)設(shè)狀態(tài)評(píng)估函數(shù)判斷是否需要更新目標(biāo)指令；如果判斷出需要更新目標(biāo)指令，對(duì)目標(biāo)指令進(jìn)行更新。

可選地，存儲(chǔ)介質(zhì)還被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼：在獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令之后，獲取在游戲應(yīng)用客戶端根據(jù)目標(biāo)指令執(zhí)行不同的目標(biāo)事件對(duì)象時(shí)的不同的目標(biāo)狀態(tài)信息；根據(jù)不同的目標(biāo)狀態(tài)信息更新每層數(shù)據(jù)組合的處理結(jié)果，得到每層數(shù)據(jù)組合的更新處理結(jié)果；其中，獲取每層數(shù)據(jù)組合的處理結(jié)果，并對(duì)每層數(shù)據(jù)組合的處理結(jié)果進(jìn)行整合處理，得到目標(biāo)指令包括：獲取每層數(shù)據(jù)組合的更新處理結(jié)果，并對(duì)多層數(shù)據(jù)組合的更新處理結(jié)果進(jìn)行整合處理，得到更新目標(biāo)指令。

可選地，本實(shí)施例中的具體示例可以參考上述實(shí)施例中所描述的示例，本實(shí)施例在此不再贅述。

可選地，在本實(shí)施例中，上述存儲(chǔ)介質(zhì)可以包括但不限于：U盤、只讀存儲(chǔ)器(ROM，Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM，Random Access Memory)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。

上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述，不代表實(shí)施例的優(yōu)劣。

上述實(shí)施例中的集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí)，可以存儲(chǔ)在上述計(jì)算機(jī)可讀取的存儲(chǔ)介質(zhì)中?；谶@樣的理解，本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來，該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在存儲(chǔ)介質(zhì)中，包括若干指令用以使得一臺(tái)或多臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。

在本發(fā)明的上述實(shí)施例中，對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重，某個(gè)實(shí)施例中沒有詳述的部分，可以參見其他實(shí)施例的相關(guān)描述。

在本申請(qǐng)所提供的幾個(gè)實(shí)施例中，應(yīng)該理解到，所揭露的客戶端，可通過其它的方式實(shí)現(xiàn)。其中，以上所描述的裝置實(shí)施例僅僅是示意性的，例如所述單元的劃分，僅僅為一種邏輯功能劃分，實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式，例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng)，或一些特征可以忽略，或不執(zhí)行。另一點(diǎn)，所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口，單元或模塊的間接耦合或通信連接，可以是電性或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位于一個(gè)地方，或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。

另外，在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中，也可以是各個(gè)單元單獨(dú)物理存在，也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn)，也可以采用軟件功能單元的形式實(shí)現(xiàn)。

以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式，應(yīng)當(dāng)指出，對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說，在不脫離本發(fā)明原理的前提下，還可以做出若干改進(jìn)和潤飾，這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李英杰;萬樂;鄧大付;殷俊;程序;杜家春;
技術(shù)所有人：騰訊科技（深圳）有限公司;
我是此專利的發(fā)明人

上一篇：多系統(tǒng)通信方法及終端與流程
上一篇：一種URL匹配方法及裝置與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

數(shù)據(jù)處理的方法相關(guān)技術(shù)

數(shù)據(jù)處理方法有哪些相關(guān)技術(shù)

實(shí)驗(yàn)數(shù)據(jù)處理方法相關(guān)技術(shù)

數(shù)據(jù)處理方法相關(guān)技術(shù)

大數(shù)據(jù)處理方法相關(guān)技術(shù)

數(shù)學(xué)建模數(shù)據(jù)處理方法相關(guān)技術(shù)

常用的數(shù)據(jù)處理方法相關(guān)技術(shù)

正交實(shí)驗(yàn)數(shù)據(jù)處理方法相關(guān)技術(shù)

缺失數(shù)據(jù)處理方法相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

數(shù)據(jù)處理方法和裝置與流程