專利名稱:隊(duì)伍匹配的制作方法
專利說明隊(duì)伍匹配 背景 在對(duì)游戲的玩家進(jìn)行排名時(shí),典型的排名系統(tǒng)僅僅跟蹤玩家的技能。例如,Arpad Elo介紹了一種在諸如國際象棋、世界杯足球聯(lián)盟等許多兩支隊(duì)伍的游戲環(huán)境中使用的ELO排名系統(tǒng)。在ELO排名系統(tǒng)中,玩家的表現(xiàn)或技能假定通過緩慢地改變正態(tài)分布的隨機(jī)變量的均值來測(cè)量。該均值是從獲勝、平局和失敗中估算的。該均值然后通過將實(shí)際與預(yù)期的游戲獲勝和失敗的次數(shù)進(jìn)行比較來線性地更新。
附圖簡(jiǎn)述 當(dāng)結(jié)合附圖考慮時(shí),本發(fā)明的上述方面和許多附帶優(yōu)點(diǎn)將變得更容易理解,因?yàn)檫@些可以通過參考以下詳細(xì)描述來更好地理解,附圖中
圖1是用于實(shí)現(xiàn)評(píng)分系統(tǒng)的示例計(jì)算系統(tǒng); 圖2是示例評(píng)分系統(tǒng)的數(shù)據(jù)流圖; 圖3是兩個(gè)潛在得分分布的示例曲線圖; 圖4是兩個(gè)玩家的得分的聯(lián)合分布的示例曲線圖; 圖5是更新兩個(gè)玩家或隊(duì)伍的得分的示例方法的流程圖; 圖6是基于其得分分布來匹配兩個(gè)玩家或隊(duì)伍的示例方法的流程圖; 圖7是更新多支隊(duì)伍的得分的示例方法的流程圖; 圖8是匹配多支隊(duì)伍的得分的示例方法的流程圖; 圖9是使用期望值最大化來逼近截?cái)嗟母咚狗植嫉氖纠椒ǖ牧鞒虉D; 圖10是測(cè)量匹配質(zhì)量的示例的曲線圖; 圖11是匹配兩支或多支隊(duì)伍的示例方法的流程圖。
詳細(xì)描述 示例性操作環(huán)境 圖1和以下討論旨在提供其中可實(shí)現(xiàn)評(píng)分系統(tǒng)的合適的計(jì)算環(huán)境β的簡(jiǎn)要概括描述。圖1的操作環(huán)境僅是合適的操作環(huán)境的一個(gè)示例,并不旨在對(duì)該操作環(huán)境的使用范圍或功能提出任何局限??蛇m用于此處所描述的評(píng)分系統(tǒng)的其它公知的計(jì)算系統(tǒng)、環(huán)境和/或配置包括但不限于,個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持式或膝上型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、可編程消費(fèi)電子產(chǎn)品、網(wǎng)絡(luò)個(gè)人計(jì)算機(jī)、小型計(jì)算機(jī)、大型計(jì)算機(jī)、包括上述系統(tǒng)或設(shè)備中的任一個(gè)的分布式計(jì)算環(huán)境等等。
盡管并非所需,但該評(píng)分系統(tǒng)將在諸如程序模塊等由一個(gè)或多個(gè)計(jì)算機(jī)或其它設(shè)備執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述。一般而言,程序模塊包括執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。通常,程序模塊的功能在各個(gè)環(huán)境中可以按需組合或分布。
參考圖1,用于實(shí)現(xiàn)評(píng)分系統(tǒng)的一個(gè)示例性系統(tǒng)包括諸如計(jì)算設(shè)備100等計(jì)算設(shè)備。在其最基本的配置中,計(jì)算設(shè)備100通常包括至少一個(gè)處理單元102和存儲(chǔ)器104。根據(jù)計(jì)算設(shè)備的確切配置和類型,存儲(chǔ)器104可以是易失性(如RAM)、非易失性(如ROM、閃存等)或兩者的某一組合。這一最基本配置在圖1中由虛線106示出。此外,設(shè)備100也可以具有另外的特征和/或功能。例如,設(shè)備100也可包括另外的存儲(chǔ)(例如,可移動(dòng)和/或不可移動(dòng)),包括但不限于,磁盤、光盤或磁帶。這類另外的存儲(chǔ)在圖1中由可移動(dòng)存儲(chǔ)108和不可移動(dòng)存儲(chǔ)110示出。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括以用于儲(chǔ)存如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)等信息的任一方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性、可移動(dòng)和不可移動(dòng)介質(zhì)。存儲(chǔ)器104、可移動(dòng)存儲(chǔ)108和不可移動(dòng)存儲(chǔ)110都是計(jì)算機(jī)存儲(chǔ)介質(zhì)的示例。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括但不限于,RAM、ROM、EEPROM、閃存或其它存儲(chǔ)器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其它光存儲(chǔ)、磁帶盒、磁帶、磁盤存儲(chǔ)或其它磁存儲(chǔ)設(shè)備、或可以用來儲(chǔ)存期望的信息并可由計(jì)算設(shè)備100訪問的任一其它介質(zhì)。任一這類計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是設(shè)備100的一部分。
設(shè)備100也可包含允許設(shè)備100與其它計(jì)算進(jìn)行通信的通信連接112。通信連接112是通信介質(zhì)的一個(gè)示例。通信介質(zhì)通常以諸如載波或其它傳輸機(jī)制等已調(diào)制數(shù)據(jù)信號(hào)來體現(xiàn)計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù),并包括任一信息傳送介質(zhì)。術(shù)語“已調(diào)制數(shù)據(jù)信號(hào)”指以對(duì)信號(hào)中的信息進(jìn)行編碼的方式設(shè)置或改變其一個(gè)或多個(gè)特征的信號(hào)。作為示例而非局限,通信介質(zhì)包括有線介質(zhì),如有線網(wǎng)絡(luò)或直接線連接,以及無線介質(zhì),如聲學(xué)、RF、紅外和其它無線介質(zhì)。此處使用的術(shù)語計(jì)算機(jī)可讀介質(zhì)包括存儲(chǔ)介質(zhì)和通信介質(zhì)兩者。
設(shè)備100也可具有(多個(gè))輸入設(shè)備112,如鍵盤、鼠標(biāo)、筆、語音輸入設(shè)備、觸摸輸入設(shè)備、激光測(cè)距儀、紅外線照相機(jī)、視頻輸入設(shè)備和/或任何其它輸入設(shè)備。也可包括(多個(gè))輸出設(shè)備114,如顯示器、揚(yáng)聲器、打印機(jī)和/或任何其它輸出設(shè)備。
評(píng)分系統(tǒng) 游戲環(huán)境,尤其是電子在線游戲環(huán)境中的玩家可相對(duì)于彼此或相對(duì)于一預(yù)定評(píng)分系統(tǒng)來評(píng)分。如此處所使用的,玩家的得分并不是該玩家通過在游戲中獲取點(diǎn)數(shù)或其它獎(jiǎng)勵(lì)而得到的“得分”;而是,得分意味著對(duì)玩家技能的排名或其它指示。應(yīng)當(dāng)理解,任何游戲環(huán)境可適合與以下進(jìn)一步描述的評(píng)分系統(tǒng)一起使用。例如,游戲的玩家可以通過一在線游戲環(huán)境與一中央服務(wù)器通信、直接連接到游戲控制臺(tái)、玩實(shí)體世界的游戲(例如,國際象棋、紙牌、網(wǎng)球)等等。
評(píng)分可用于跟蹤玩家在該游戲環(huán)境中的進(jìn)步和/或地位,和/或可用于在未來的游戲中將玩家彼此匹配。例如,具有基本相等的或滿足預(yù)定和/或用戶定義閾值的得分的玩家可被匹配以對(duì)每一玩家形成游戲中基本相等的挑戰(zhàn)。
每一玩家的評(píng)分可以基于在兩支或多支隊(duì)伍中相互比賽的玩家之間的一次或多次游戲的結(jié)局,其中每一支隊(duì)伍具有一個(gè)或多個(gè)玩家。每一次游戲的結(jié)局可更新參與該游戲的每一玩家的得分。游戲的結(jié)局可被指示為特定勝者、參與玩家的排名列表以及可能的平局或和局。一數(shù)值等級(jí)表上的每一玩家的得分可被表示為潛在得分上的分布,該分布可用平均得分μ和得分方差σ2來對(duì)每一玩家參數(shù)化。方差可指示表示玩家的得分的分布中的置信水平。每一玩家的得分分布可以用高斯分布來建模,并且可以通過貝葉斯推論算法來確定。
圖2示出了用于為多個(gè)玩家確定得分的示例評(píng)分系統(tǒng)。盡管以下示例是相對(duì)于在游戲中與另一單個(gè)玩家對(duì)抗以產(chǎn)生游戲結(jié)局的一個(gè)玩家來討論的,但是應(yīng)當(dāng)理解,以下示例將討論包括一個(gè)或多個(gè)玩家的與另一隊(duì)伍對(duì)抗的隊(duì)伍,以及多隊(duì)伍游戲。圖2的評(píng)分系統(tǒng)200包括一得分更新模塊,它接受兩個(gè)或多個(gè)玩家之間的游戲的結(jié)局210。應(yīng)當(dāng)理解,游戲結(jié)局可以通過任何合適的方法來接收。例如,結(jié)局可以從諸如在線系統(tǒng)等玩家環(huán)境傳送到中央處理器,并諸如通過全球通信網(wǎng)絡(luò)等以任何合適的方式傳送到評(píng)分系統(tǒng)。在另一示例中,對(duì)抗玩家的得分可被傳送到主存該得分系統(tǒng)的玩家的游戲系統(tǒng)。以此方式,各個(gè)游戲系統(tǒng)可諸如通過全球通信網(wǎng)絡(luò)等按任何合適的方式來接收對(duì)抗玩家的得分。在又一示例中,該評(píng)分系統(tǒng)可以是諸如家庭游戲系統(tǒng)等由玩家用于玩游戲的游戲環(huán)境的一部分。在再一示例中,如果游戲環(huán)境無法將游戲結(jié)局傳送到得分系統(tǒng),例如游戲是諸如板式國際象棋等“真實(shí)”世界游戲,則游戲結(jié)局可以被手動(dòng)輸入到評(píng)分系統(tǒng)中。
如圖2所示,結(jié)局210可以是獲勝隊(duì)伍、失敗隊(duì)伍和/或平局或和局的標(biāo)識(shí)。例如,如果兩個(gè)玩家(玩家A和玩家B)在游戲中彼此對(duì)抗,則游戲結(jié)局可以是三種可能結(jié)果中的一種,即玩家A獲勝且玩家B失敗、玩家A失敗且玩家B獲勝、以及玩家A和B打平。每一玩家具有得分212,該得分可由動(dòng)態(tài)得分模塊和得分更新模塊兩者根據(jù)隨著時(shí)間的推移由于玩家進(jìn)步(或不幸的退步)而引起的可能改變以及游戲的結(jié)果來更新到經(jīng)更新的得分216。更具體地,在玩家得分212是一分布的情況下,每一玩家的得分的均值和方差可鑒于結(jié)局和/或隨著時(shí)間的推移由于玩家進(jìn)步(或不幸的退步)引起的可能變化來更新。
得分更新模塊202通過一個(gè)或多個(gè)游戲的結(jié)局來學(xué)習(xí)玩家的得分。可任選動(dòng)態(tài)得分模塊204允許一個(gè)或多個(gè)玩家的得分212因玩家進(jìn)步(或不幸的退步)而隨時(shí)間改變。為允許玩家技能隨時(shí)間改變,玩家得分盡管是從一個(gè)或多個(gè)游戲的結(jié)局確定的,但也可以不是隨時(shí)間為靜態(tài)的。在一個(gè)示例中,得分均值可以增加,和/或得分方差或得分中的置信度可被加寬。以此方式。每一玩家的得分可被修改成動(dòng)態(tài)玩家得分214以允許玩家的進(jìn)步。動(dòng)態(tài)玩家得分214然后可用作得分更新模塊的輸入。以此方式,每一玩家的得分可通過在兩個(gè)或多個(gè)玩家之間玩的一系列游戲來學(xué)習(xí)。
每一玩家的動(dòng)態(tài)的或經(jīng)更新的得分可由玩家匹配模塊206用于基于諸如玩家指示的偏好和/或得分匹配技術(shù)來創(chuàng)建玩家之間的匹配。匹配的玩家用其動(dòng)態(tài)玩家得分214或經(jīng)更新的得分216然后可彼此對(duì)抗并生成游戲結(jié)局210。
排行榜(leaderboard)模塊218在某些示例中可用于確定兩個(gè)或多個(gè)玩家的排名,并可向一個(gè)或多個(gè)設(shè)備提供排名列表的至少一部分,諸如在顯示設(shè)備上公布該排行榜排名列表的至少一部分、儲(chǔ)存該排行榜排名列表以供一個(gè)或多個(gè)玩家訪問等等。
在某些情況下,為準(zhǔn)確地確定n個(gè)玩家的排名,可對(duì)至少log(n!),或近似地n log(n)個(gè)游戲結(jié)局進(jìn)行評(píng)估以生成具有近似正確的排名的完整的排行榜。對(duì)數(shù)的基數(shù)取決于兩個(gè)玩家之間的獨(dú)特結(jié)局的數(shù)量。在此示例中,基數(shù)是3,因?yàn)橛腥N可能的結(jié)局(玩家A獲勝,玩家A失敗,以及玩家A和B打平)。所評(píng)估的結(jié)局的下界可以僅在每一結(jié)局提供完整信息時(shí)達(dá)到,即,游戲結(jié)局先驗(yàn)地具有基本相等的概率。由此,在許多游戲中,玩家可被匹配為具有相等強(qiáng)度以增加從每一結(jié)局中獲得的知識(shí)。此外,玩家可以愿意接受來自對(duì)等玩家的合理挑戰(zhàn)。在某些情況下,在玩家排名和評(píng)分的概率性處理中,玩家的匹配可以在玩家排名中結(jié)合“不確定性”。
在某些情況下,可以有m個(gè)不同等級(jí)的玩家排名。如果不同等級(jí)數(shù)m實(shí)質(zhì)上小于玩家數(shù)n,則在某些情況下可將最小(提供信息)游戲數(shù)減少到nlog(m)。此外,如果游戲的結(jié)局是k支隊(duì)伍之間的排名,則每一游戲可提供多達(dá)log(k!)位,且以此方式,可玩大約至少
次提供信息的游戲來提取足夠的信息以對(duì)玩家排名。
可以理解,盡管動(dòng)態(tài)得分模塊204、得分更新模塊202、玩家匹配模塊206以及排行榜模塊此處是作為評(píng)分系統(tǒng)200中的單獨(dú)進(jìn)程來討論的,但是可由其它進(jìn)程或組件中的任一個(gè)來提供評(píng)分系統(tǒng)200的任何功能或組件。此外,可以理解,其它評(píng)分系統(tǒng)配置也可以是適當(dāng)?shù)摹@?,可提供多于一個(gè)動(dòng)態(tài)得分模塊204、得分更新模塊202、得分向量和/或玩家匹配模塊,可以有多于一個(gè)數(shù)據(jù)庫可用于儲(chǔ)存得分、排名和/或游戲結(jié)局,評(píng)分系統(tǒng)的模塊的任何部分可被硬編碼到支持評(píng)分系統(tǒng)的軟件中,和/或評(píng)分系統(tǒng)200的任何部分可由作為網(wǎng)絡(luò)的一部分或網(wǎng)絡(luò)外部的任何計(jì)算系統(tǒng)來提供。
學(xué)習(xí)得分 兩個(gè)或多個(gè)玩家和/或隊(duì)伍之間的游戲的結(jié)局可以諸如通過玩家和/或隊(duì)伍對(duì)該特定游戲的排名等以任何適當(dāng)?shù)姆绞絹碇甘?。例如,在兩個(gè)玩家的游戲中,結(jié)局可以是玩家A獲勝、玩家A失敗、或玩家A和B打平。根據(jù)游戲結(jié)局,游戲的每一玩家可以根據(jù)一數(shù)值等級(jí)表來排名。例如,一玩家的排名ri可以對(duì)勝者具有值1,而對(duì)失敗者具有值2。在平局中,兩個(gè)玩家將具有相同的排名。在多隊(duì)伍示例中,玩家可從1枚舉到n。k支隊(duì)伍之間的游戲可由第j支隊(duì)伍中的nj個(gè)玩家(nj=1用于其中僅有單個(gè)玩家且沒有多玩家隊(duì)伍的游戲)的k個(gè)索引ij∈{1,...,n}nj來指定,并且每一隊(duì)伍所得到的排名rj可被表示為r=(r1,...,rk)T∈{1,...,k}k。再一次,可假定勝者具有排名1。
玩家的技能可由得分來表示。玩家的得分si可以指示該玩家相對(duì)于標(biāo)準(zhǔn)等級(jí)表或其它玩家的地位。得分可以是單獨(dú)的,即對(duì)作為玩家來行動(dòng)的一個(gè)或多個(gè)人(例如,隊(duì)伍),或?qū)τ螒蝾愋汀⒂螒驊?yīng)用等是單獨(dú)的。在某些情況下,隊(duì)伍的技能可以是第j支隊(duì)伍中的玩家的所有技能或得分的函數(shù)
該函數(shù)可以是任何適當(dāng)?shù)暮瘮?shù)。在隊(duì)伍僅包括單個(gè)玩家的情況下,函數(shù)S可以是恒等函數(shù),例如
每一玩家的得分si可以具有一隨機(jī)傳遞性質(zhì)。更具體地,如果玩家i的得分高于玩家j的,則玩家i更有可能戰(zhàn)勝玩家j而非玩家j戰(zhàn)勝玩家i。在數(shù)學(xué)上 si≥sj→P(玩家i獲勝)≥P(玩家j獲勝)(1) 該隨機(jī)傳遞性質(zhì)意味著玩家i獲勝或平局的可能性要大于或等于一半,因?yàn)樵趦蓚€(gè)玩家之間的任何游戲中,僅有三種互斥的結(jié)局(玩家i獲勝、失敗或平局)。
為諸如在圖2的得分更新模塊202中那樣對(duì)每一玩家估算得分,可使用貝葉斯學(xué)習(xí)方法。采用貝葉斯方法,一玩家的真實(shí)得分si的置信可被指示為得分的概率密度(即,P(s))。在以下示例中,選擇表示真實(shí)得分的置信的得分的概率密度作為具有均值μ以及對(duì)角協(xié)方差矩陣(diag(σ2))的高斯型。高斯密度可被示為 P(s)=N(s;μ,diag(σ2))(2) 選擇該高斯型允許該分布是具有模式μ的單峰。以此方式,不預(yù)期玩家在廣泛變化的玩游戲等級(jí)之間交替。另外,得分的高斯表示可被有效地儲(chǔ)存在存儲(chǔ)器中。具體地,假定一對(duì)角協(xié)方差矩陣實(shí)際上導(dǎo)致允許用兩個(gè)值,即均值μi和方差σi2來表示對(duì)玩家i的每一單獨(dú)得分。
每一玩家的初始的和經(jīng)更新的得分可用任何適當(dāng)?shù)姆绞絹韮?chǔ)存??梢岳斫?,玩家的得分可以被表示為均值μi和方差σ2,或均值μ和標(biāo)準(zhǔn)差σ等等。例如,每一玩家的均值和方差可被儲(chǔ)存在單獨(dú)的向量中,例如均值向量μ和方差向量σ2,被儲(chǔ)存在數(shù)據(jù)存儲(chǔ)中,等等。如果所有可能玩家的所有均值和方差都以向量儲(chǔ)存,例如μ和σ2,則更新公式可僅更新與參與該游戲結(jié)局的玩家相關(guān)聯(lián)的那些均值和方差。替換地或另外地,每一玩家的得分可以被儲(chǔ)存在一玩家簡(jiǎn)介數(shù)據(jù)存儲(chǔ)、得分矩陣等中。每一玩家的得分可以用任何適當(dāng)?shù)姆绞脚c一玩家相關(guān)聯(lián),包括與玩家標(biāo)識(shí)符i的關(guān)聯(lián),數(shù)據(jù)存儲(chǔ)中的放置或位置可指示相關(guān)聯(lián)的玩家等等。
可以理解,可使用任何適當(dāng)格式的任何適當(dāng)?shù)臄?shù)據(jù)存儲(chǔ)來儲(chǔ)存得分和游戲結(jié)局和/或?qū)⑵鋫魉偷皆u(píng)分系統(tǒng)200,包括關(guān)系型數(shù)據(jù)庫、面向?qū)ο蟮臄?shù)據(jù)庫、非結(jié)構(gòu)化數(shù)據(jù)庫、存儲(chǔ)器內(nèi)數(shù)據(jù)庫或其它數(shù)據(jù)存儲(chǔ)??墒褂弥T如ACSII文本、二進(jìn)制文件、通過通信網(wǎng)絡(luò)發(fā)送的數(shù)據(jù)或任何其它文件系統(tǒng)等平面文件文件系統(tǒng)來構(gòu)造存儲(chǔ)陣列。盡管有上述數(shù)據(jù)存儲(chǔ)的這些可能的實(shí)現(xiàn),但此處所使用的隊(duì)伍數(shù)據(jù)存儲(chǔ)和存儲(chǔ)陣列指的是以計(jì)算機(jī)可訪問的任何方式收集和儲(chǔ)存的任何數(shù)據(jù)。
分布的高斯模型可以允許在評(píng)分系統(tǒng)學(xué)習(xí)每一玩家的得分時(shí)有效地更新用于均值μi和方差σi2的等式。在觀察到游戲的結(jié)局之后,例如由該游戲的玩家的排名r所指示的,可使用由下式給出的貝葉斯規(guī)則來更新得分s(例如,玩家i的得分si以及玩家j的得分sj)中的置信分布或密度P(s) (3) 其中變量ik是參與游戲的隊(duì)伍k的每一玩家的標(biāo)識(shí)符或指示符。在兩個(gè)玩家的示例中,第一支隊(duì)伍的向量i1是玩家A的指示符,而第二支隊(duì)伍的向量i2是玩家B的指示符。在以下進(jìn)一步討論的多個(gè)玩家的示例中,向量i可以對(duì)每一隊(duì)伍多于一個(gè)。在以下進(jìn)一步討論的多支隊(duì)伍的示例中,隊(duì)伍數(shù)k可以大于2。在等式(3)的多支隊(duì)伍的示例中,給定玩家的得分時(shí)的排名的概率
可以在給定隊(duì)伍得分S(sik)時(shí)修改,該隊(duì)伍得分是該隊(duì)伍的各個(gè)玩家的得分的函數(shù)。
新更新的置信P(s|r,{i1,...ik})也被稱為后驗(yàn)置信(例如,經(jīng)更新的得分214、216),并且可代替先驗(yàn)置信P(s)(例如,玩家得分212)來用于評(píng)估對(duì)那些對(duì)手的下一次游戲。這一方法被稱為在線學(xué)習(xí),例如,隨著時(shí)間的推移僅維護(hù)置信分布P(s),并且對(duì)參與的玩家{i1,...,ik}的每一觀察到的游戲結(jié)局r被結(jié)合到該置信分布中。
在被結(jié)合到對(duì)玩家得分的確定中之后,可忽略游戲的結(jié)局。然而,游戲結(jié)局r可能沒有被完全裝入每一玩家的得分的確定中。更具體地,后驗(yàn)置信P((s|r,{i1,...ik})可能未用緊湊且高效的方式來表示,并且可能沒有被確切地計(jì)算。在這一情況下,可使用任何適當(dāng)?shù)谋平夹g(shù),包括期望值傳播、變化推論、假設(shè)密度過濾、拉普拉斯逼近、最大似然等,來確定對(duì)真實(shí)后驗(yàn)的最佳逼近。假設(shè)密度過濾(ADF)以喜愛緊湊表示的某一族-諸如具有對(duì)角協(xié)方差的高斯分布-來計(jì)算對(duì)真實(shí)后驗(yàn)的最佳逼近。該最佳逼近可被用作新的先驗(yàn)分布。以下示例是參考通過數(shù)值積分和/或期望值傳播來解的假設(shè)密度過濾來討論的。
高斯分布 每一玩家的得分中的置信可以基于高斯分布。具有n維的高斯密度由下式定義 高斯型N(x)可被定義為用于由N(x;0,I)定義的高斯型的速記表示法。累積高斯分布函數(shù)可以由φ(t;μ,σ2)來指示,其由下式定義 再一次,對(duì)φ(t)的速記指示了累積分布φ(t;0,1)。表示法<f(x)>x~P表示隨機(jī)平局x的期望f,即<f(x)>x~P=∫f(x)dP(x)。給定得分時(shí)的結(jié)局的后驗(yàn)概率或給定結(jié)局時(shí)的得分的概率可能不是高斯型。由此,后驗(yàn)可通過找出使得真實(shí)后驗(yàn)和高斯逼近之間的Kullback-Leibler發(fā)散最小化的最佳高斯型來估算。例如,后驗(yàn)P(θ|x)可以通過N(θ,μx*,∑x*)來逼近,其中上標(biāo)*指示該逼近對(duì)于給定的x是最優(yōu)的。以此方式,逼近的高斯后驗(yàn)的均值和方差可由下式給出 μx*=μ+∑gx (6) ∑x*=∑-∑(gxgxT-2Gx)∑(7) 其中向量gx和矩陣Gx由下式給出 并且函數(shù)Zx由下式定義 Zx(μ,∑)=∫tx(θ)N(θ;μ;∑)dθ=P(x)(10) 校正的截?cái)喔咚剐? 變量x可以根據(jù)一校正的雙截?cái)喔咚剐?從此處開始稱為校正的高斯型)來分布,并且如果x的密度由下式給出,則由 x~R(x;μ,σ2,α,β)來注釋 當(dāng)取變量β在其接近無限的極限時(shí),校正的高斯型可被表示為R(x;μ,σ2,α)。
該類校正的高斯型包含高斯族作為一限制情況。更具體地,如果當(dāng)變量α接近無限時(shí)取校正的高斯型的極限,則該校正的高斯型是由用作得分的先驗(yàn)分布的N(x;μ,σ2)指示的正態(tài)高斯型。
校正的高斯型的均值由下式給出 其中函數(shù)v(·,α,β)由下式給出 校正的高斯型的方差由下式給出 其中函數(shù)w(·,α,β)由下式給出 當(dāng)β接近無限時(shí),函數(shù)v(·,α,β)和w(·,α,β)可被指示為v(·,α)和w(·,α),并使用下式來確定 這些函數(shù)可使用數(shù)值積分技術(shù)或任何其它合適的技術(shù)來確定。函數(shù)w(·,α)可以是對(duì)指示函數(shù)It≤α的平滑逼近,并且可以總是由
來界定。相反,函數(shù)v(·,α)對(duì)于t<α可大致如α-t那樣增長,并且對(duì)于t>α可迅速接近0。
輔助函數(shù)
和
可使用下式來確定 隨時(shí)間學(xué)習(xí)得分 用于得分系統(tǒng)的貝葉斯學(xué)習(xí)過程基于每一玩家所玩的每一比賽的結(jié)局來學(xué)習(xí)每一玩家的得分。貝葉斯學(xué)習(xí)可以假設(shè)每一玩家的未知的、真實(shí)的得分隨時(shí)間是靜態(tài)的,例如,真實(shí)的玩家得分不會(huì)改變。由此,當(dāng)玩家玩更多游戲時(shí),圖2的經(jīng)更新的玩家得分216可以反映該真實(shí)得分中增長的確定性。以此方式,所玩的每一新游戲?qū)τ诮?jīng)更新的玩家得分216中的確定性幾乎沒有影響或效果。
然而,玩家可能會(huì)隨著時(shí)間的推移而相對(duì)于其它玩家和/或標(biāo)準(zhǔn)等級(jí)表有進(jìn)步。以此方式,每一玩家的真實(shí)得分隨時(shí)間并不是真正靜態(tài)的。由此,該評(píng)分系統(tǒng)的學(xué)習(xí)過程可以不僅學(xué)習(xí)每一玩家的真實(shí)得分,而且還可允許每一玩家的真實(shí)得分由于該玩家的改變的能力而隨時(shí)間改變。為考慮到隨時(shí)間改變的玩家能力,可隨時(shí)間修改得分的后驗(yàn)置信P(s|r,{i1,...ik}。例如,一段時(shí)間(例如,Δt)沒有玩游戲可允許玩家的技能退步或變差。由此,玩家的得分的后驗(yàn)置信可以由動(dòng)態(tài)得分模塊基于任何合適的因素,諸如該玩家玩游戲的歷史(例如,自最后一次玩游戲以來的時(shí)間)來修改,以確定如圖2所示的動(dòng)態(tài)得分216。更具體地,用作新先驗(yàn)分布的后驗(yàn)置信可被表示為在給定具有索引i的玩家在Δt的時(shí)間內(nèi)沒有玩游戲的情況下該玩家的得分的后驗(yàn)置信P(si|Δt)。由此,經(jīng)修改的后驗(yàn)分布可被表示為 P(si|Δt)=∫P(si|μi+Δμ)P(Δμ|Δt)d(Δμ)=∫N(si;μi+Δμ,σi2)N(Δμ;0,τ2(Δt))d(Δμ)=N(si;μi,σi2+τ2(Δt)) (21) 其中第一項(xiàng)P(si|μ)是具有索引i的玩家的得分的置信分布,而第二項(xiàng)P(Δμ|Δt)量化了自從最后一次更新以來長度為Δt的時(shí)間內(nèi)未知真實(shí)得分的改變的置信。函數(shù)τ(·)是真實(shí)得分的變量,其是未玩游戲的時(shí)間(例如,Δt)的函數(shù)。函數(shù)τ(Δt)可以對(duì)于小時(shí)間Δt較小,以反映玩家的表現(xiàn)不會(huì)在較小的一段未玩游戲時(shí)間內(nèi)改變。該函數(shù)可隨著Δt的增加而增加(例如,手眼協(xié)調(diào)可能會(huì)退步,等等)。在以下的示例中,如果自最后一次更新以來經(jīng)過的時(shí)間大于0(這指示至少玩了一次游戲),則動(dòng)態(tài)得分函數(shù)τ可返回一恒定值τ0。如果經(jīng)過的時(shí)間為0,則函數(shù)τ可返回0。對(duì)于動(dòng)態(tài)得分函數(shù)τ的常值函數(shù)τ0可被表示為 τ2(Δt)=IΔt>0τ02 (22) 其中I是指示函數(shù)。
對(duì)比賽玩家的推論 特定游戲結(jié)局的置信可用關(guān)于每一玩家的得分所獲得的全部知識(shí)來量化,即P(s)。更具體地,可確定給定所選玩家的得分時(shí)一潛在游戲的結(jié)局。對(duì)所選一組玩家的游戲結(jié)局的置信可被表示為 其中
是用于兩個(gè)玩家的游戲的sA和sB。這一將來結(jié)局的置信可用于對(duì)將來的游戲匹配玩家,如以下進(jìn)一步討論的。
兩個(gè)玩家匹配的示例 當(dāng)在游戲中兩個(gè)玩家(玩家A和玩家B)彼此對(duì)抗時(shí),游戲的結(jié)局可以用一個(gè)變量y來總結(jié),其中如果玩家A獲勝則y為1,如果玩家打平則y為0,且如果玩家A失敗則y為-1。以此方式,變量y可用于唯一地表示玩家的排名r。鑒于以上等式(3),得分更新算法可作為給定得分s1和s2時(shí)游戲結(jié)局y的模型來得出,如下 P(r|sA,sB)=P(y(r)|sA,sB)(24) 其中y(r)=sign(rB-rA),其中如果玩家A獲勝,則rA為1而rB為2,如果玩家B獲勝,則rA為2而rB為1,而如果玩家A和B打平,則rA和rB都為1。
游戲的結(jié)局(例如,變量y)可以基于所有參與的玩家(在兩個(gè)玩家的示例中為玩家A和B)的表現(xiàn)。玩家的表現(xiàn)可由一潛在得分xi來表示,該得分可遵循其均值等于具有索引i的玩家的得分si、且有固定的潛在得分方差β2的高斯分布。更具體地,潛在得分xi可以被表示為N(xi;si,β2)。潛在得分的示例圖形表示在圖3中分別被示為高斯曲線302和306。得分sA和sB分別被示為線304和308。
玩家的潛在得分可進(jìn)行比較以確定游戲的結(jié)局。然而,如果隊(duì)伍之間的差別較小或近似為0,則游戲的結(jié)局可以是平局。以此方式,可引入一潛在平局余量變量∈作為示出兩個(gè)競(jìng)爭(zhēng)玩家之間的基本相等的這一小余量的固定數(shù)字。由此,游戲的結(jié)局可被表示為 如果xA>xB+∈,則玩家A是勝者 (25) 如果xB>xA+∈,則玩家B是勝者 (26) 如果|xA-xB|≤∈,則玩家A和B打平 (27) 一種可能的潛在平局余量在圖3中被示為0附近寬度為2∈的范圍310。在某些情況下,該潛在平局余量可被設(shè)為近似為0,諸如在其中和局是不切實(shí)際的游戲中,諸如賽車游戲。在其它情況下,該潛在平局余量可取決于諸如游戲類型(例如,捕捉標(biāo)志)、隊(duì)伍大小等因素而被設(shè)置得較大或較小。
由于兩個(gè)潛在得分曲線是獨(dú)立的(由于每一玩家的潛在得分的獨(dú)立性),因此給定個(gè)別玩家A和B的得分時(shí)的結(jié)局y的概率可被表示為
其中Δ是潛在得分xA和xB之差(例如,Δ=xA-xB)。
對(duì)玩家A和玩家B的潛在得分的聯(lián)合分布在圖4中被示為等高線,該等高線形成了圖中的“隆起”402,其中第一條軸410指示玩家A的潛在得分,而第二條軸412指示玩家B的潛在得分?!奥∑稹?02,即聯(lián)合分布的放置可通過檢查“隆起”402下的區(qū)域的概率面積量(probability mass of area)來指示玩家A或B獲勝的可能性。例如,線416下的概率面積量406可指示玩家A更有可能獲勝,而線414和416所限定的概率面積量408可指示玩家有可能打平。以此方式,聯(lián)合分布隆起402下的概率面積量404是玩家B獲勝的概率,聯(lián)合分布隆起402下的概率面積量406是玩家A獲勝的概率,而聯(lián)合分布隆起402下的概率面積量408是玩家打平的概率。如在圖4的示例聯(lián)合分布402中所示的,玩家B更有可能獲勝。
兩個(gè)玩家的得分更新 如上所述,每一玩家i(例如玩家A和B)的得分(例如,均值μi和方差σi2)可在知道了這兩個(gè)玩家(例如,玩家A和B)之間的游戲的結(jié)局的情況下更新。更具體地,使用ADF逼近,對(duì)參與玩家的得分的更新可遵循圖5所示的方法500??沙跏蓟?502)靜態(tài)變量。例如,可初始化潛在平局區(qū)∈、動(dòng)態(tài)時(shí)間更新常數(shù)τ0、和/或潛在得分方差β。用于這些參數(shù)的示例初始值可以包括β在約100到約400的范圍內(nèi),且在一個(gè)示例中可以約等于250,τ0在約1到約10的范圍內(nèi),且在一個(gè)示例中可以約等于10,而∈可取決于諸如和局概率等許多因素,且在一個(gè)示例中可以約等于50??蓪?duì)每一玩家i接收(504)得分si(例如,由均值μi和方差σi2來表示),在兩個(gè)玩家的示例中得分包括玩家A的均值μA和方差σA2,以及玩家B的均值μB和方差σB2。
在玩家玩游戲之前,由均值和方差表示的玩家的得分可被初始化為任何適當(dāng)?shù)闹?。在一個(gè)簡(jiǎn)單的情況下,所有玩家的均值可被初始化為同一值,例如μi=1200?;蛘撸悼杀怀跏蓟癁樗⒌耐婕业钠骄档陌俜直?諸如20-50%,并且在某些情況下約為33%)。方差可被初始化以指示關(guān)于所初始化的均值的不確定性,例如,σ2=4002?;蛘?,玩家的初始均值和/或方差可完全或部分地基于另一游戲環(huán)境中該玩家的得分。
如上所述,可更新(505)置信以用任何適當(dāng)?shù)姆绞絹矸从硠?dòng)態(tài)得分。例如,置信可基于時(shí)間來更新,諸如通過基于函數(shù)τ和自從玩家上次玩游戲以來的時(shí)間來更新每一參與玩家的得分的方差。動(dòng)態(tài)時(shí)間更新可以在圖2的評(píng)分系統(tǒng)的動(dòng)態(tài)得分模塊204中完成。如上所述,動(dòng)態(tài)得分函數(shù)τ的輸出可以對(duì)所有大于0的時(shí)間是常數(shù)τ0。以此方式,當(dāng)玩家首次玩游戲時(shí)τ0可以是0,并且之后可以是常數(shù)τ0。每一玩家的得分的方差可通過下式來更新 為基于游戲結(jié)局來更新得分,可計(jì)算(506)參數(shù)。例如,參數(shù)c可被計(jì)算為方差之和,使得參數(shù)c為 c=(nA+nB)β2+σA2+σB2(32)=2β2+σA2+σB2 (33) 其中nA是隊(duì)伍A中的玩家數(shù)(在兩個(gè)玩家的示例中為1),而nB是隊(duì)伍B中的玩家數(shù)(在兩個(gè)玩家的示例中為1)。
參數(shù)h可基于每一玩家的得分的均值和在兩個(gè)玩家的示例中所計(jì)算的參數(shù)c來計(jì)算,參數(shù)h可被計(jì)算為 這表明hA=-hB。參數(shù)∈’可基于玩家數(shù)、潛在平局區(qū)∈和參數(shù)c計(jì)算(506)如下 并且對(duì)于兩個(gè)玩家的示例,這導(dǎo)致 可以接收(508)玩家A和B之間的游戲的結(jié)局。例如,游戲結(jié)局可以被表示為變量y,如果玩家B獲勝則y為-1,如果玩家打平則y為0,而如果玩家A獲勝則y為+1。為改變參與的玩家的得分中的置信,諸如在圖2的得分更新模塊中,可更新(510)每一得分的均值和方差。更具體地,如果玩家A獲勝(例如,y=1),則獲勝玩家A的均值μA可被更新如下 失敗玩家B的均值μB可被更新如下 每一玩家i(在兩個(gè)玩家的示例中為A和B)的方差σi2可在玩家A獲勝時(shí)被更新為 然而,如果玩家B獲勝(例如,y=-1),則失敗玩家A的均值μA可被更新為 獲勝玩家B的均值μB可被更新為 每一玩家i(A和B)的方差σi2可在玩家B獲勝時(shí)被更新為 如果玩家A和B打平,則玩家A的均值μA可被更新為 玩家B的均值μB可被更新為 玩家A的方差σA2可在玩家打平時(shí)被更新為 玩家B的方差σB2可在玩家打平時(shí)被更新為 在以上等式(38-47)中,函數(shù)v( )、w( )、
和
可從高斯型的數(shù)值逼近來確定。具體地,函數(shù)v( )、w( )、
和
可使用以上等式(17-20)使用諸如在Press等人的Numerical Recipes in C(C中的數(shù)值方法)the Art of ScientificComputing(科學(xué)計(jì)算藝術(shù))(第2版),劍橋,劍橋大學(xué)出版社,ISBN-0-521-43108-5中所描述的數(shù)值方法以及任何其它合適的數(shù)值或解析方法來求值,該參考文獻(xiàn)通過引用結(jié)合于此。
以上更新玩家的得分的等式在許多方面都不同于ELO系統(tǒng)。例如,ELO系統(tǒng)假設(shè)每一玩家的方差是相等的,例如公知的。在另一示例中,ELO系統(tǒng)不使用依賴于玩家的不確定性比率的變量K因子。以此方式,與具有某一得分的玩家一起玩允許不確定玩家以比在與另一不確定玩家一起玩的情況下更大的步長向上或向下移動(dòng)。
來自圖2的得分更新模塊202的每一玩家的得分(例如,圖2的經(jīng)更新的得分216)的均值和方差的經(jīng)更新的值可以替換均值和方差(得分212)的舊值。每一玩家的得分的新更新的均值和方差結(jié)合了從玩家A和B之間的游戲的結(jié)局所獲得的附加知識(shí)。
兩個(gè)玩家匹配 經(jīng)更新的玩家得分的置信可用于預(yù)測(cè)兩個(gè)潛在對(duì)手之間的游戲的結(jié)局。例如,圖2所示的玩家匹配模塊206可使用玩家的經(jīng)更新的和/或維持的得分來預(yù)測(cè)任何潛在玩家之間的比賽的結(jié)局,并且匹配滿足諸如近似相等的玩家得分均值、玩家指示的偏好、近似相等的獲勝和/或平局概率等匹配準(zhǔn)則的那些玩家。
為預(yù)測(cè)游戲的結(jié)局,可計(jì)算給定每一潛在玩家的得分的均值和標(biāo)準(zhǔn)差時(shí)一特定結(jié)局y的概率,例如P(y|sA,sB)。因此,結(jié)局的概率P(y)可以從給定玩家得分時(shí)的結(jié)局概率(其中忽略到邊緣得分)中確定。
圖6示出了預(yù)測(cè)游戲結(jié)局的示例方法600,該方法將參考兩個(gè)潛在玩家(玩家A和玩家B)之間的游戲來描述??沙跏蓟?602)靜態(tài)變量。例如,可初始化潛在平局區(qū)∈、動(dòng)態(tài)時(shí)間更新常數(shù)τ0、和/或潛在得分方差β。可對(duì)參與預(yù)測(cè)的游戲的每一玩家i接收(604)得分si(例如,由均值μi和方差σi2來表示)。在兩個(gè)玩家的示例中,玩家得分包括玩家A的均值μA和方差σA2,以及玩家B的均值μB和方差σB2。
可確定(606)參數(shù)??梢赃m當(dāng)?shù)厥褂靡陨系仁?32)或(33)來計(jì)算(606)參數(shù)c為方差之和??尚薷挠糜趨?shù)c的等式(32)和(33),以包括玩家得分的動(dòng)態(tài)得分方面,例如,自從最后一次更新得分以來已經(jīng)過了某些時(shí)間Δt。經(jīng)修改的參數(shù)c可被計(jì)算為 c=(nA+nB)β2+σA2+σB2+(nA+nB)τ0(48) 其中nA是隊(duì)伍A中的玩家數(shù)(在本示例中是1個(gè)玩家),而nB是隊(duì)伍B中的玩家數(shù)(在本示例中是1個(gè)玩家)??蛇m當(dāng)?shù)厥褂蒙鲜龅仁?36)或(37)來計(jì)算參數(shù)∈’。
可確定(608)潛在玩家之間的游戲的每一可能結(jié)局的概率。玩家A獲勝的概率可以使用下式來計(jì)算 玩家B獲勝的概率可以使用下式來計(jì)算 如上所述,函數(shù)φ指示一累積高斯分布函數(shù),其自變量為圓括號(hào)中的值,且均值為0,標(biāo)準(zhǔn)差為1。玩家A和B打平的概率可使用下式來計(jì)算 P(y=0)=1-P(y=1)-P(y=-1)(51) 可使用所確定的結(jié)局的概率來對(duì)一游戲匹配潛在玩家,諸如將任一隊(duì)伍獲勝或打平的概率與預(yù)定的或用戶提供的閾值或其它偏好進(jìn)行比較。對(duì)應(yīng)于任一隊(duì)伍獲勝或打平的概率的預(yù)定閾值可以是諸如約25%的任何適當(dāng)?shù)闹?。例如,玩家可被匹配以提供所有可能結(jié)局上基本相等的分布,其均值得分可以大致相等(例如,在潛在平局余量內(nèi))等等。同樣適用于兩個(gè)玩家的示例的其它匹配技術(shù)將在以下參考多隊(duì)伍示例來討論。
兩支隊(duì)伍 上述兩個(gè)玩家的技術(shù)可被擴(kuò)展,使得“玩家A”包括隊(duì)伍A中的一個(gè)或多個(gè)玩家,而“玩家B”包括隊(duì)伍B中的一個(gè)或多個(gè)玩家。例如,隊(duì)伍A中的玩家可以具有由索引iA指示的任意數(shù)量的玩家nA,而隊(duì)伍B可具有由索引iB指示的任意數(shù)量的玩家nB。隊(duì)伍可被定義為其在游戲中的表現(xiàn)實(shí)現(xiàn)對(duì)該隊(duì)伍上的所有玩家的單個(gè)結(jié)局的一個(gè)或多個(gè)玩家。每一隊(duì)伍的每一玩家可具有由均值μi和方差σi2表示的單獨(dú)得分si。
兩支隊(duì)伍的得分更新 由于僅有兩支隊(duì)伍,因此如以上兩個(gè)玩家的示例一樣,對(duì)一比賽有三種可能的結(jié)果,即隊(duì)伍A獲勝,隊(duì)伍B獲勝,以及隊(duì)伍A和隊(duì)伍B打平。與以上兩個(gè)玩家的示例一樣,該游戲結(jié)局可以由單個(gè)變量y來表示,在一個(gè)示例中,如果隊(duì)伍A獲勝,則y的值為1,如果兩支隊(duì)伍打平,則y的為0,而如果隊(duì)伍B贏得游戲,則y的值為-1。鑒于以上等式(1),可基于給定每一隊(duì)伍的技能或得分siA和siB時(shí)的游戲結(jié)局y的模型來對(duì)游戲的玩家更新得分。這可被表示為 P(r|siA,siB)=P(y(r)|siA,siB)(51.1) 其中基于排名的游戲結(jié)局y(r)可被定義為 y(r)=sign(rB-rA)(51.2) 與以上兩個(gè)玩家匹配的潛在得分一樣,具有索引為i的玩家的隊(duì)伍的隊(duì)伍潛在得分t(i)可以是該隊(duì)伍的各個(gè)玩家的潛在得分xj的線性函數(shù)。例如,隊(duì)伍潛在得分t(i)可以等于b(i)Tx,其中b(i)是具有n個(gè)元素的向量,其中n是玩家數(shù)。由此,游戲的結(jié)局可被表示為 如果t(iA)>t(iB)+∈,則隊(duì)伍A獲勝 (52) 如果t(iB)>t(iA)+∈,則隊(duì)伍B獲勝 (53) 如果|t(iA)-t(iB)|≤∈,則隊(duì)伍A和B打平 (54) 其中,∈是上述潛在平局余量。對(duì)于圖3的示例潛在得分,隊(duì)伍A和B的潛在得分可分別被表示為線304和308。
給定隊(duì)伍的得分
和
時(shí)的結(jié)局的概率在以上等式(28-30)中示出。然而,在隊(duì)伍示例中,以上等式(28-30)的Δ項(xiàng)是隊(duì)伍的潛在得分t(iA)和t(iB)之差。更具體地,Δ項(xiàng)可被確定為 Δ=t(iA)-t(iB)=(b(iA)-b(iB))Tx=aTx(55) 其中x是所有玩家的潛在得分的向量,并且該向量包括線性加權(quán)系數(shù)。
向量a的線性加權(quán)系數(shù)可用作出某一假設(shè)的確切形式來導(dǎo)出。例如,一種假設(shè)可包括如果隊(duì)伍中的玩家具有正的潛在得分,則潛在隊(duì)伍得分將增加;類似地,如果隊(duì)伍中的玩家具有負(fù)的潛在得分,則潛在隊(duì)伍得分將減少。這意味著向量b(i)在i的所有分量中都是正的。個(gè)人的負(fù)的潛在得分使得隊(duì)伍潛在得分減少以應(yīng)付對(duì)游戲結(jié)局有負(fù)面影響的玩家。例如,玩家可以是所謂的“隊(duì)伍殺手”。更具體地,較弱的玩家相比于其能夠通過得分來作出的貢獻(xiàn),更有可能成為其它隊(duì)伍增加潛在隊(duì)伍得分的攻擊目標(biāo)。在每一個(gè)人得分的先驗(yàn)概率中可考慮到大多數(shù)玩家都作出正面的貢獻(xiàn)的這一事實(shí)。另一示例假設(shè)可以是沒有參與一隊(duì)伍(沒有進(jìn)行比賽和/或沒有在參與隊(duì)伍中)的玩家應(yīng)當(dāng)不會(huì)影響隊(duì)伍得分。因此,向量b(i)中未在向量i中的所有分量應(yīng)當(dāng)為0(因?yàn)樗鶅?chǔ)存或生成的向量x可包含所有玩家的潛在得分,而不管其是否在玩游戲)。在某些情況下,僅游戲中的參與玩家可被包括在向量x中,并且以此方式,向量b(i)的所有分量(在i中)都可以是非負(fù)且正的。另一假設(shè)可包括如果兩個(gè)玩家具有相同的潛在得分,則在一給定隊(duì)伍中包括他們兩個(gè)可將隊(duì)伍潛在得分改變相同的量。這意味著向量b(i)在i的所有分量中是正的常數(shù)。另一假設(shè)可以是如果每一隊(duì)伍的大小加倍,并且附加的玩家是原始玩家的重復(fù)(例如,新玩家具有相同的得分si,),則對(duì)任一隊(duì)伍獲勝或和局的概率不受影響。這意味著向量b(i)在i的所有分量中都等于平均隊(duì)伍大小的倒數(shù),使得 其中向量e是除了分量j(為1)之外的所有分量都是帶有0的單位n向量,并且項(xiàng)nA和nB分別是隊(duì)伍A和B中的玩家數(shù)。有了以上四種假設(shè),唯一地確定加權(quán)系數(shù)a。
如果隊(duì)伍是相等大小的,例如,nA=nB,則潛在玩家得分的均值,以及因而的潛在玩家得分x可以被平移一任意量而不會(huì)對(duì)分布Δ有任何改變。由此,潛在玩家得分實(shí)際上形成一間隔標(biāo)度。然而,在某些情況下,隊(duì)伍可以具有不均勻的標(biāo)號(hào),例如nA和nB不相等。在這一情況下,潛在玩家得分在用潛在得分為2x的一個(gè)玩家替換各自的潛在得分為x的兩個(gè)玩家不會(huì)改變潛在隊(duì)伍得分的這一意義上是存活在比例標(biāo)度上的。以此方式,平均得分為s的玩家比平均得分為s/2的玩家要好兩倍。由此,平均得分指示了玩家的平均表現(xiàn)。另一方面,潛在得分指示了一特定游戲中的實(shí)際表現(xiàn),并且存在于間隔標(biāo)度上,因?yàn)闉榱舜_定獲勝、和局和失敗的概率,僅使用隊(duì)伍潛在得分的差,例如t(iA)-t(iB)。
由隊(duì)伍中參與游戲的每一玩家i的均值μi和方差σi2表示的個(gè)人得分si可以基于兩支隊(duì)伍之間的游戲的結(jié)局來更新。用于兩個(gè)玩家的示例的圖5的更新等式和方法可對(duì)兩支隊(duì)伍的示例進(jìn)行修改。參考圖5的方法500,可如上所述初始化(502)潛在平局區(qū)∈、動(dòng)態(tài)時(shí)間更新常數(shù)τ0、和潛在得分方差β。類似地,可對(duì)兩支隊(duì)伍中的每一支中的每一玩家i接收(504)得分si(例如,由均值μi和方差σi2來表示),在兩支隊(duì)伍的示例中,該得分包括用于隊(duì)伍A中的玩家i的均值
和方差
以及用于隊(duì)伍B中的玩家i的均值
和方差
由于對(duì)置信的動(dòng)態(tài)更新(例如,基于自從最后一次玩游戲以來的時(shí)間)僅依賴于該玩家的方差(以及可能的自從該玩家最后一次玩游戲以來的時(shí)間),因此每一隊(duì)伍中的每一玩家的方差可諸如通過使用以上等式(31)等用任何適當(dāng)?shù)姆绞絹砀?505)。如上所述,基于時(shí)間的更新可通過圖2的動(dòng)態(tài)得分模塊204來實(shí)現(xiàn)。
參考圖5,可類似于以上所描述的計(jì)算(506)參數(shù),其中進(jìn)行了某些修改以結(jié)合得分和結(jié)局的隊(duì)伍方面。可如上所述計(jì)算(506)參數(shù)c為方差之和。然而,在其中每一隊(duì)伍可具有一個(gè)或多個(gè)玩家的兩支隊(duì)伍的示例中,參與游戲的所有玩家的方差必須相加。由此,對(duì)于兩支隊(duì)伍的示例,以上等式(32)可被修改為 參數(shù)hA和hB可以如上在等式(34-35)中所述地基于每一隊(duì)伍的得分μA和μB的均值以及所計(jì)算的參數(shù)c來計(jì)算(506)。隊(duì)伍A和B各自的隊(duì)伍平均得分μA和μB可以被計(jì)算為對(duì)每一隊(duì)伍的玩家的均值之和,如 參數(shù)可∈’被計(jì)算(506)為 其中nA是隊(duì)伍A中的玩家數(shù),而nB是隊(duì)伍B中的玩家數(shù)。
可接收(508)隊(duì)伍A和B之間的游戲的結(jié)局。例如,該游戲結(jié)局可以被表示為變量y,如果隊(duì)伍B獲勝則y等于-1,如果隊(duì)伍打平則y等于0,而如果隊(duì)伍A獲勝則y等于+1。為改變每一隊(duì)伍的每一參與的玩家的先前得分的概率的置信,可通過修改上述等式(38-46)來更新(510)每一參與玩家的均值和方差。如果隊(duì)伍A贏得游戲,則可將個(gè)人均值更新為 (任一隊(duì)伍A或B的)每一玩家i的方差σi2可在隊(duì)伍A獲勝時(shí)如上等式(40)中所示地更新。
然而,如果隊(duì)伍B獲勝(例如,y=-1),則每一參與玩家的均值μAi可被更新為 (任一隊(duì)伍A或B)的每一玩家i的方差σi2可在隊(duì)伍B獲勝時(shí)如上在等式(43)中所示地更新。
如014214"果隊(duì)伍A和B打平,則隊(duì)伍A和B的每一玩家各自的均值
和
可被更新為 隊(duì)伍A中的每一玩家的方差
可在隊(duì)伍打平時(shí)被更新為 隊(duì)伍B中的每一玩家的方差
可在隊(duì)伍打平時(shí)被更新為 如同等式(38-43)一樣,函數(shù)v( )、w( )、
和
可使用以上等式(17-20)使用數(shù)值方法來求值。以此方式,每一玩家的得分的均值和方差的經(jīng)更新的值可替換均值和方差的舊值以結(jié)合從隊(duì)伍A和B之間的游戲的結(jié)局中所獲得的附加知識(shí)。
兩支隊(duì)伍匹配 與以上兩支隊(duì)伍得分更新一樣,可修改圖6的匹配方法以適應(yīng)各自有一個(gè)或多個(gè)玩家的兩支隊(duì)伍。與上述一樣,可初始化(602)靜態(tài)變量??蓪?duì)每一玩家接收(604)得分si(諸如每一相應(yīng)隊(duì)伍A和B的每一玩家i的均值
和
以及方差
和
)。另外,進(jìn)行匹配準(zhǔn)則可考慮隊(duì)伍中的得分的變化性。例如,可能期望具有帶均一得分的玩家的隊(duì)伍,因?yàn)樵谀承┣闆r下,他們能更好地協(xié)作。
可如上所述確定(606)參數(shù)。例如,可使用等式(57)來計(jì)算參數(shù)c,可使用等式(58)和(59)來計(jì)算每一隊(duì)伍的均值μA和μB,并且可使用等式(36)來計(jì)算參數(shù)∈’。
可確定(608)兩支潛在隊(duì)伍之間的游戲的每一可能的結(jié)局的概率。隊(duì)伍A獲勝的概率可以使用以上等式(49)來計(jì)算。隊(duì)伍B獲勝的概率可以使用以上等式(50)來計(jì)算。和局的概率可以使用以上等式(51)來計(jì)算。所確定的結(jié)局的概率可用于對(duì)一游戲匹配潛在隊(duì)伍,諸如將任一隊(duì)伍獲勝和/或和局的概率、隊(duì)伍和/或玩家排名、和/或隊(duì)伍和/或玩家得分與預(yù)定或用戶提供的閾值進(jìn)行比較。
多支隊(duì)伍 以上技術(shù)可被進(jìn)一步擴(kuò)展以考慮包括多支隊(duì)伍的游戲,例如,兩支或多支對(duì)抗的隊(duì)伍,其可以由參數(shù)j來指示。索引j指示多支對(duì)抗隊(duì)伍中的隊(duì)伍,并且范圍是從1到k支隊(duì)伍,其中k指示了對(duì)抗隊(duì)伍的總數(shù)。每一隊(duì)伍可具有一個(gè)或多個(gè)玩家i,并且第j支隊(duì)伍可具有由參數(shù)nj指示的數(shù)目的玩家,且玩家由ij來指示。
知道了所有k支隊(duì)伍的排名允許重新排列隊(duì)伍,使得每一隊(duì)伍的排名rj可按排名次序來放置。例如,每一隊(duì)伍的排名可按排名遞減次序來放置,使得r(1)≤r(2)≤...≤r(k),其中索引算子()是從1到k的索引j的排列。由于在某些情況下,假設(shè)排名1指示游戲的勝者,因此該排名遞減次序可表示一數(shù)值上遞增的次序。以此方式,游戲的結(jié)局r可以按照隊(duì)伍索引的排列以及向量y∈{0,+1}k-1來表示。例如,如果隊(duì)伍(j)戰(zhàn)勝隊(duì)伍(j+1),則(yj=+1),而如果隊(duì)伍team(j)與隊(duì)伍(j+1)戰(zhàn)平,則(yj=0)。以此方式,向量y的元素可以被表示為yj=sign(r(j+1)-r(j))。
與以上對(duì)于兩支隊(duì)伍的示例一樣,游戲的結(jié)局可以基于所有參與玩家的表現(xiàn)或潛在得分。潛在得分xi可遵循均值等于索引為i的玩家的得分si,且具有固定潛在得分方差β2的高斯分布。以此方式,潛在得分xi可由N(xi;si,β2)來表示。具有其索引在向量i中的玩家的隊(duì)伍的潛在得分t(i)可以是各個(gè)玩家的潛在得分x的線性函數(shù)。以此方式,該潛在得分可被確定為t(i)=b(i)Tx,其中b(i)如上對(duì)于兩支隊(duì)伍的示例所描述的那樣。以此方式,給定一示例潛在得分x,排名是使得具有最高潛在隊(duì)伍得分t(i)的隊(duì)伍排名第一,具有次高隊(duì)伍得分的隊(duì)伍排名第二,而具有最低潛在隊(duì)伍得分的隊(duì)伍排名最低。此外,如果兩支隊(duì)伍的潛在隊(duì)伍得分相差不多于潛在平局余量∈,則兩支隊(duì)伍戰(zhàn)平。以此方式,排名的隊(duì)伍可根據(jù)其潛在隊(duì)伍得分的值來重新排序。在基于潛在隊(duì)伍得分對(duì)隊(duì)伍重新排序之后,可考慮隊(duì)伍之間的成對(duì)差,以確定具有較高潛在隊(duì)伍得分的隊(duì)伍是否獲勝,或者結(jié)局是否為和局(例如,得分差小于∈)。
為基于潛在得分來確定隊(duì)伍的重新排序,可定義輔助變量的k-1維向量Δ,其中 Δj=t(i(j))-t(i(j+1))=ajTx.(68) 以此方式,向量Δ可被定義為 由于潛在得分x遵循高斯分布(例如,x~N(x;s,β2I),因此向量Δ受高斯分布的支配(例如,Δ~N(Δ;ATs,β2ATA)。以此方式,排名r的概率(基于排列算子()和k-1維向量y通過矩陣A來編碼)可由Δ上的聯(lián)合概率來表達(dá)為 由均值μ和方差來σ2參數(shù)化的每一玩家的得分的置信(P(si))可在給定形式為排名r的游戲結(jié)局時(shí)更新。置信可使用假設(shè)的密度過濾用標(biāo)準(zhǔn)數(shù)值積分方法(例如,Gentz等人的Numerical Computation of Multivariate Normal Probalities(多元正態(tài)概率的數(shù)值計(jì)算),Journal of Computational and Graphical Statistics(計(jì)算和圖形統(tǒng)計(jì)學(xué)期刊)1,1992年,第141-149頁)、期望值傳播技術(shù)(見下文)以及任何其它合適的技術(shù)來確定。在有兩支隊(duì)伍(例如,k=2)的特殊情況中,更新等式精簡(jiǎn)為以上在兩支隊(duì)伍的示例中所述的算法。類似地,如果兩支隊(duì)伍中的每一支都僅有一個(gè)玩家,多隊(duì)伍等式精簡(jiǎn)為以上在兩個(gè)玩家示例中所述的算法。
在此示例中,可用用于高斯積分的數(shù)值積分來確定多隊(duì)伍游戲的玩家的得分的更新算法。類似地,基于自從玩家最后一次玩游戲以來的時(shí)間的得分的動(dòng)態(tài)更新對(duì)未玩游戲時(shí)間大于0可以是常數(shù)τ0,而對(duì)游戲之間的時(shí)間延遲為0或在玩家首次玩游戲時(shí)可以是0。
圖7示出了更新玩多隊(duì)伍游戲的玩家的得分的示例方法700。如上所述,可初始化(702)潛在平局區(qū)∈、動(dòng)態(tài)時(shí)間更新常數(shù)τ0、和潛在得分方差β。另外,可用任何適當(dāng)?shù)囊唤M數(shù)字,諸如0來初始化(702)具有k-1列和n行(即,所有隊(duì)伍中的玩家的總數(shù))的矩陣A。可對(duì)每一隊(duì)伍中的每一玩家i接收(704)得分si(例如,由均值μi和方差σi2來表示),在多隊(duì)伍示例中,該得分包括每一隊(duì)伍j中的每一玩家i的均值
和方差
由于對(duì)置信的動(dòng)態(tài)更新可以基于時(shí)間,因此該動(dòng)態(tài)時(shí)間可依賴于該玩家的方差(以及可能自從該玩家最后一次玩游戲以來的時(shí)間)。由此,可使用以上等式(31)來更新(706)每一玩家的方差。以此方式,對(duì)每一隊(duì)伍中的每一玩家,可在評(píng)估游戲結(jié)局之前確定對(duì)方差的動(dòng)態(tài)更新。更具體地,對(duì)方差的更新基于自從該玩家最后一次玩游戲以來的時(shí)間,并且該玩家的技能可能在評(píng)估當(dāng)前游戲結(jié)局之前在該段時(shí)間內(nèi)改變。或者,動(dòng)態(tài)更新可以在任何適當(dāng)?shù)臅r(shí)間完成,諸如在游戲結(jié)局之后并且在得分更新之前、在得分更新之后基于游戲結(jié)局、等等。
得分可通過根據(jù)參與游戲的玩家的排名r計(jì)算(708)排列()來進(jìn)行排名排序。例如,排名可按排名遞減的次序來放置。
排名r可通過矩陣A來編碼(710)。更具體地,對(duì)于隊(duì)伍(j)和(j+1)的n(j)和n(j+1)個(gè)玩家的每一種組合,矩陣元素Arow,j可以使用以下等式(71)和(72)來確定。具體地,對(duì)于nj個(gè)玩家i(j+1) Arow,j=2/(n(j)+n(j+1))(71) 其中,行變量是由玩家i(j)來定義的,列變量是由從1到k-1(其中k是隊(duì)伍數(shù))的索引j來定義的,而n(j)是第(j)支隊(duì)伍上的玩家數(shù),n(j+1)是第(j+1)支隊(duì)伍上的玩家數(shù)。對(duì)于所有nj+1個(gè)玩家i(j+1) Arow+1,j=-2/(n(j)+n(j+1))(72) 其中行變量是由玩家i(j+1)來定義的,列變量是由從1到k-1(其中k是隊(duì)伍數(shù))的索引j來定義的,而n(j)是第(j)支隊(duì)伍上的玩家數(shù),n(j+1)是第(j+1)支隊(duì)伍上的玩家數(shù)。如果第(j)支隊(duì)伍與第(j+1)支隊(duì)伍排名相同,則截?cái)喔咚剐偷南孪轪和上限b可被設(shè)為 ai=-∈(73) bi=∈ (74) 否則,如果第(j)支隊(duì)伍與第(j+1)支隊(duì)伍排名不同,則截?cái)喔咚剐偷南孪轪和上限b可被設(shè)為 ai=∈(75) bi=∞(76) 所確定的矩陣A可用于確定(712)中間參數(shù)。中間參數(shù)可包括向量u和矩陣C,使用以下等式 u=ATμ (77) C=AT(β2I+diag(σ2))A(78) 其中,向量μ是包含玩家的均值的向量,β是潛在得分方差,而σ2是包含玩家的方差的向量。向量μ和σ2可包含參與玩家或所有玩家的均值。如果該向量包含所有玩家的得分參數(shù),則A的構(gòu)造可對(duì)每一非參與玩家提供系數(shù)0。
中間參數(shù)u和C可用于使用以上等式(6)-(10)和向量a和b的積分極限來確定(714)表示后驗(yàn)的截?cái)喔咚剐偷木郸ず蛥f(xié)方差∑。截?cái)喔咚剐偷木岛蛥f(xié)方差可使用任何適當(dāng)?shù)姆椒▉泶_定,這些方法包括數(shù)值逼近(見Gentz等人的Numerical Computation of Multivariate Normal Probabilities,Journal ofComputational and Graphical Statistics 1,1992,第141-149頁)、期望值傳播(見下文)等。期望值傳播將在以下參考圖9進(jìn)一步討論。
使用所計(jì)算的均值Δ和協(xié)方差∑,可更新(716)由參與多隊(duì)伍游戲的每一玩家的均值μi和方差σi2定義的得分。在一個(gè)示例中,可使用下式來確定函數(shù)向量v和矩陣W v=AC-1(Δ-u) (79) W=AC-1(C-∑)C-1AT(80) 使用向量v和矩陣W,可使用下式來更新每一隊(duì)伍j中的每一玩家i的均值
和方差
以上用于多隊(duì)伍游戲的等式和方法可被精簡(jiǎn)為以上給出的兩支隊(duì)伍和兩個(gè)玩家的示例。
以此方式,對(duì)每一玩家得分的均值的更新可以是基于游戲結(jié)局的線性增加或減少。例如,如果在兩個(gè)玩家的示例中,玩家A的均值大于玩家B的均值,則玩家A應(yīng)被懲罰,類似地,玩家B應(yīng)被獎(jiǎng)勵(lì)。對(duì)每一玩家得分的方差的更新是倍增的。例如,如果結(jié)局是非預(yù)期的,例如玩家A的均值大于玩家B的均值而玩家A在游戲中失敗,則可將每一玩家的方差減少得更多,因?yàn)橛螒蚪Y(jié)局相對(duì)于關(guān)于得分的當(dāng)前置信提供很多信息。類似地,如果玩家的均值大致相等(例如,其差在潛在平局余量內(nèi))且游戲結(jié)果是和局,則更新可對(duì)方差作極小的改變,因?yàn)榻Y(jié)局是所預(yù)期到的。
多支隊(duì)伍匹配 如上所討論的,由每一玩家的均值μ和方差σ2所表示的得分可用于在給定所有參與玩家的得分的平均得分和標(biāo)準(zhǔn)差時(shí)預(yù)測(cè)特定游戲結(jié)局y的概率。所預(yù)測(cè)的游戲結(jié)局可用于對(duì)將來的游戲匹配玩家,諸如通過將潛在游戲的結(jié)局的預(yù)測(cè)的可能性與預(yù)定閾值、玩家指示的偏好進(jìn)行比較,確??赡芙Y(jié)局上的大致相等的分布(例如,在1-25%內(nèi))等等??赡芙Y(jié)局上的大致相等的分布可取決于玩該游戲的隊(duì)伍的數(shù)目。例如,如果有兩支隊(duì)伍,則如果每支隊(duì)伍都有大約50%的獲勝或戰(zhàn)平的機(jī)會(huì),則可設(shè)置匹配。如果游戲具有3支隊(duì)伍,則如果每一對(duì)抗的隊(duì)伍具有約30%的獲勝或戰(zhàn)平機(jī)會(huì),則可作出匹配??梢岳斫?,大致相等的分布可從玩該游戲的隊(duì)伍的數(shù)目的倒數(shù)或用任何其它適當(dāng)?shù)姆绞絹泶_定。
在一個(gè)示例中,由玩家匹配模塊匹配的一個(gè)或多個(gè)玩家可被給予接受或拒絕匹配的機(jī)會(huì)。玩家的決定可基于諸如挑戰(zhàn)者的得分和/或所確定的可能結(jié)局的概率等給定信息。在另一示例中,一玩家可直接被另一玩家挑戰(zhàn)。被挑戰(zhàn)的玩家可基于由玩家匹配模塊提供的信息來接受或拒絕該挑戰(zhàn)比賽。
游戲結(jié)局的概率可通過從給定得分時(shí)的結(jié)局的概率
中計(jì)算游戲結(jié)局y的概率(P(y))來確定,其中所獲得的由每一玩家的均值和方差所表示的得分
上的知識(shí)或不確定性被忽略。
與以上多個(gè)玩家得分更新等式一樣,圖6的匹配方法可被修改以適應(yīng)各自有一個(gè)或多個(gè)玩家的多支隊(duì)伍。確定結(jié)局的概率的示例修改方法800在圖8中示出。與以上一樣,可初始化(802)靜態(tài)變量,諸如潛在得分方差β、潛在平局區(qū)∈、動(dòng)態(tài)常數(shù)τ0、和矩陣A。矩陣A可被初始化為包含全0的矩陣。
可對(duì)每一玩家接收(804)得分si(由每一參與玩家i的均值μi和方差σi2來表示)??山邮?806)k支隊(duì)伍的排名r。對(duì)于參與的每一玩家,諸如方差σi2等得分可對(duì)每一參與玩家動(dòng)態(tài)地更新(808),并且可基于自從該玩家最后一次玩游戲以來的時(shí)間,例如,基于時(shí)間的動(dòng)態(tài)更新。以此方式,每一潛在參與玩家i的方差可使用以上等式(31)來更新。
隊(duì)伍的得分可通過根據(jù)玩家的排名r計(jì)算(810)排列來對(duì)排名排序。例如,如上所述,排名可以按排名遞減的次序放置。
可確定(812)排名的編碼。排名的編碼可使用參考圖7的確定(710)排名編碼來描述的方法并使用等式(71-76)來確定??墒褂靡陨系仁?77-78)并如上參考圖7的確定中間參數(shù)(712)所描述的來確定(814)中間參數(shù)u和C。為將動(dòng)態(tài)更新結(jié)合到游戲結(jié)局的預(yù)測(cè)中,有時(shí)候Δt>0,因?yàn)樽詮淖詈笠淮胃乱詠?,可向以上等?78)的矩陣C的第j個(gè)對(duì)角元素添加一額外的被加數(shù)(n(j)+n(j+1))τ0。
游戲結(jié)局的概率可通過對(duì)具有均值u和方差C的截?cái)喔咚剐偷某?shù)函數(shù)的值求值來確定(816)。如上所述,截?cái)喔咚剐涂捎萌魏芜m當(dāng)?shù)姆绞絹砬笾担〝?shù)值逼近(見Gentz等人的Numerical Computation of Multivariate NormalProbabilities,Journal of Computational and Graphical Statistics 1,1992,第141-149頁)、期望值傳播等等。
數(shù)值逼近 一種合適的數(shù)值逼近技術(shù)在Gentz等人的Numerical Computation ofMultivariate Normal Probabilities,Journal of Computational and GraphicalStatistics 1,1992,第141-149頁中討論。在一個(gè)示例中,如果截?cái)喔咚剐偷木S數(shù)(例如,隊(duì)伍j中的玩家數(shù)nj)較小,則可基于統(tǒng)一隨機(jī)偏離,基于隨機(jī)變量的變換(可以使用以上討論的累積高斯分布來迭代地完成)來估算逼近的后驗(yàn)。
由于歸一化常量Zr(u,C)等于排名r的概率,因此該歸一化常量可通過對(duì)以下等式積分來確定 均值z(mì)可以使用ADF通過下式來確定 數(shù)值逼近以上等式將提供可用于數(shù)值逼近截?cái)喔咚剐偷木岛蜌w一化常量。
期望值傳播 與數(shù)值逼近不同,期望值傳播可用于更新玩家的得分和/或預(yù)測(cè)游戲結(jié)局。在多支隊(duì)伍的情況下,該更新和預(yù)測(cè)方法可基于兩支隊(duì)伍更新和預(yù)測(cè)方法的迭代方案。為減少在期望值傳播期間計(jì)算的轉(zhuǎn)換的數(shù)量??杉俣ǜ咚狗植紴橹葹?的高斯型,例如,似然性ti,r是得分s的一維投影的某一函數(shù)。一般的期望值逼近的效率可通過假設(shè)后驗(yàn)是校正的、截?cái)嗟母咚狗植紒硖岣摺?br>
例如,圖9示出了用期望值傳播來逼近截?cái)喔咚剐偷氖纠椒?200。
可諸如在得分更新的計(jì)算中接收(1202)非截?cái)喔咚剐偷木郸毯蛥f(xié)方差∑??梢岳斫?,輸入的均值μ和∑是非截?cái)喔咚剐偷木岛蛥f(xié)方差,而非玩家得分的均值和方差。均值可具有n個(gè)元素,而協(xié)方差矩陣的維數(shù)可以為nxn??山邮战?cái)喔咚剐偷纳虾拖陆財(cái)帱c(diǎn)。例如,如果第j支隊(duì)伍與第j+1支隊(duì)伍的排名相同,則可對(duì)每一j和j+1玩家設(shè)置截?cái)喔咚剐偷南孪轪和上限b為 ai=-∈(85) bi=∈(86) 否則,如果第j支隊(duì)伍與第j+1支隊(duì)伍的排名不同,則可對(duì)每一j和j+1玩家設(shè)置變量a和b為 ai=∈(87) bi=∞(87.1) 可初始化(1206)期望值傳播的參數(shù)。更具體地,對(duì)于從1到n的每一i,均值μi可被初始化為0或任何其它適當(dāng)?shù)闹?,參?shù)πi可被初始化為0或任何其它適當(dāng)?shù)闹?,參?shù)ζi可被初始化為1或任何其它適當(dāng)?shù)闹?。逼近的均值μ*可被初始化為接收到的均值μ,而逼近的協(xié)方差∑*可被初始化為接收到的協(xié)方差∑。
可選擇(1208)從1到n的索引j??筛?1210)逼近均值和協(xié)方差(μ*和∑*)。更具體地,逼近均值和協(xié)方差可通過下式來更新 其中tj由下式確定 tj=[∑1,j*,∑2,j*,...,∑n,j*] (90) 并且因數(shù)dj和ej由下式確定 dj=πi∑j,j* (91) ej=1-dj (92) 因數(shù)αj和βj由下式確定 其中函數(shù)v()和w()可使用以上等式(17-18)來求值,而參數(shù)φj’、aj’、bj’和ψj可以通過使用下式來求值 φj=μj*+dj(μj*-μj)/ej (95) ψj=∑j,j*/ej (96) bj’=bj/ψ(100) 可更新(1212)因數(shù)、πj、μj和ζj。更具體地,這些因數(shù)可使用下式來更新 πj=1/(βj-1-ψj)(101) μj=φj+αj/βj (102)
然后可評(píng)估(1214)終止準(zhǔn)則。例如,終止條件Δz可使用下式來計(jì)算 Δz=|Z*-Z*old| (104) 任何適當(dāng)?shù)慕K止條件可指示逼近的收斂??蓪⑺_定的終止條件Δz與一預(yù)定終止容許準(zhǔn)則δ進(jìn)行比較。如果所確定的終止條件的絕對(duì)值小于或等于該終止容許準(zhǔn)則,則逼近的均值μ*、方差∑*和歸一化常數(shù)Z*可被認(rèn)為是收斂的。如果不滿足終止準(zhǔn)則,則該方法可返回到選擇索引(1208)。如果滿足終止準(zhǔn)則,則可返回逼近的均值和協(xié)方差。另外,可對(duì)歸一化常數(shù)Z*進(jìn)行求值(1216)。更具體地,該歸一化常數(shù)可使用下式來求值
比賽安排和排行榜 如上所述,所確定的結(jié)局的概率可用于根據(jù)預(yù)定閾值來匹配玩家,使得結(jié)局對(duì)隊(duì)伍可能是有挑戰(zhàn)性的。確定游戲的預(yù)測(cè)結(jié)局在某些情況下在用于儲(chǔ)存對(duì)多于四支隊(duì)伍的整個(gè)結(jié)局分布的存儲(chǔ)器方面是昂貴的。更具體地,有O(2k-1k!)個(gè)結(jié)局,其中k是隊(duì)伍數(shù),而O()意味著“數(shù)量級(jí)”,例如,由O()表示的函數(shù)可以僅在比例因子和/或常量上有區(qū)別。另外,預(yù)測(cè)的結(jié)局在具有不同標(biāo)準(zhǔn)差σi的玩家(如果其均值μi是相同的)之間沒有區(qū)分。在某些情況下,計(jì)算兩個(gè)結(jié)局分布之間的距離在計(jì)算上可能是昂貴的。由此,在某些情況下,計(jì)算兩個(gè)玩家的得分之間的得分間隙可能是有用的。例如,得分間隙可被定義為兩個(gè)得分si和sj之差。預(yù)期的得分間隙E(si-sj)或E[(si-sj)2可使用下式來確定 或 其中uij是玩家的均值之差(即,uij=μi-μj),而σij2是玩家i和j的方差之和(即,σij2=σj2+σj2)。得分間隙的期望可與預(yù)定閾值進(jìn)行比較以確定玩家i和j是否應(yīng)匹配。例如,預(yù)定閾值可以在約3到約6的范圍內(nèi),并且可取決于許多因素,包括可用于匹配的玩家的數(shù)量。更具體地,可用玩家越多,閾值就可被設(shè)置得越低。
此外,玩家i的得分置信可用于計(jì)算保守得分估算為μi-k·σi,其中k因子k是量化保守等級(jí)的正數(shù)??蓪?duì)k選擇任何適當(dāng)?shù)臄?shù)字以指示保守等級(jí),諸如數(shù)字3。保守得分估算可用于排行榜、如以下所討論地確定匹配質(zhì)量等。在許多情況下,k因子k的值可以是正的,然而在某些情況下,諸如當(dāng)確定“樂觀”得分估算時(shí),可使用負(fù)數(shù)。這一保守得分估算的優(yōu)點(diǎn)是對(duì)于新玩家,該估算可以為0(由于大的初始方差σi2),這通常對(duì)于新玩家而言更直觀(“從零開始”)。
匹配質(zhì)量 如上所述,根據(jù)某些用戶定義和/或預(yù)定的偏好,例如平局概率等,可對(duì)一特定游戲匹配一隊(duì)伍中的兩個(gè)或多個(gè)玩家和/或兩個(gè)或多個(gè)隊(duì)伍。兩個(gè)或多個(gè)隊(duì)伍之間的匹配的質(zhì)量可用任何適當(dāng)?shù)姆绞絹泶_定或估計(jì)。
一般而言,兩個(gè)或多個(gè)隊(duì)伍之間的匹配的質(zhì)量可以是這些潛在隊(duì)伍之間的可能游戲結(jié)局上的概率分布的函數(shù)。在某些示例中,良好或優(yōu)選的匹配可被定義為其中每一隊(duì)伍都可贏得游戲的匹配。如果每一參與者(或隊(duì)伍)贏得該潛在匹配的游戲的概率基本相等,則該匹配質(zhì)量可被認(rèn)為是“好”或潛在匹配。例如,在具有各自的獲勝概率為p1、p2和p3的三個(gè)玩家的游戲中,其中p1+p2+p3=1,該分布的熵,即Gini索引可用作匹配質(zhì)量的度量。在另一示例中,如果所有參與隊(duì)伍將戰(zhàn)平的可能性較大,則匹配可以是合乎需要的(例如,匹配質(zhì)量良好)。
在一個(gè)示例中,匹配的質(zhì)量或匹配質(zhì)量度量(q)可以被定義為每一隊(duì)伍戰(zhàn)平的基本相等的可能性(qdraw)。為確定平局的可能性以測(cè)量匹配是否合乎需要,可通過將極限認(rèn)為是∈→0來移除對(duì)平局余量∈的依賴性。如果玩家的當(dāng)前技能置信是由均值向量μ和協(xié)方差向量∑來給出的,則給定均值和協(xié)方差時(shí)極限∈→0中平局的概率P(d raw|μ,∑)可被確定為 其中如上在等式(71)和(72)中所述對(duì)每一匹配確定矩陣A。
給定得分時(shí)等式(108)的平局概率可與任何適當(dāng)?shù)钠ヅ滟|(zhì)量度量進(jìn)行比較,該度量可以在匹配模塊中預(yù)定和/或由用戶提供。在一個(gè)示例中,該匹配質(zhì)量度量可以是其中所有隊(duì)伍具有相同的技能,即ATμ=0,且玩家技能沒有不確定性的同一匹配的平局概率。以此方式,匹配質(zhì)量度量qdraw(μ,∑,β,A)可被確定為 以此方式,匹配質(zhì)量度量可具有使得匹配質(zhì)量度量的值在0和1之間的性質(zhì),其中值1指示最佳匹配。
如果沒有一個(gè)玩家曾經(jīng)玩過游戲(例如,其得分μ、∑尚未被學(xué)習(xí)=初始μ=μ01,∑=σ01)或者玩家的得分已被充分地學(xué)習(xí),則對(duì)于k支隊(duì)伍的匹配質(zhì)量度量可被簡(jiǎn)化為 如果每一隊(duì)伍具有相同數(shù)量的玩家,則等式(110)的匹配質(zhì)量度量可被進(jìn)一步簡(jiǎn)化為 確定并使用匹配質(zhì)量度量的一個(gè)示例方法參考圖11的方法1100來描述。可接收(1102)玩一個(gè)或多個(gè)游戲的多個(gè)玩家的得分。如上所述,每一隊(duì)伍可具有一個(gè)或多個(gè)玩家,并且一個(gè)潛在匹配可包括兩個(gè)或多個(gè)隊(duì)伍??蓮亩鄠€(gè)潛在玩家中選擇(1104)兩個(gè)或多個(gè)隊(duì)伍作為對(duì)一匹配的潛在隊(duì)伍。可至少部分地基于所選隊(duì)伍之間的可能游戲結(jié)局的概率分布的函數(shù),用任何適當(dāng)?shù)姆绞絹泶_定(1108)所選隊(duì)伍之間的匹配的質(zhì)量。如上所述,該概率分布的函數(shù)可以是每一隊(duì)伍獲勝、失敗或戰(zhàn)平的概率;每一隊(duì)伍獲勝、戰(zhàn)平或失敗的分布的熵;等等。
可用任何適當(dāng)?shù)姆绞絹泶_定(1110)匹配質(zhì)量閾值。匹配質(zhì)量閾值可以是指示匹配的質(zhì)量水平的任何適當(dāng)?shù)拈撝?。如上所述,該匹配質(zhì)量度量可取0和1之間的值,其中1指示理想匹配。匹配質(zhì)量閾值然后可被適當(dāng)?shù)仡A(yù)定為1值附近的值或不是該值。如果匹配質(zhì)量閾值是預(yù)定值,則可從存儲(chǔ)器中檢索匹配質(zhì)量閾值。在另一示例中,匹配質(zhì)量閾值可以是諸如從一個(gè)或多個(gè)匹配參與者計(jì)算或接收到的確定的值。匹配質(zhì)量度量然后可以與預(yù)定的匹配質(zhì)量閾值進(jìn)行比較(1112)以確定是否超過閾值。例如,如果高匹配質(zhì)量度量值指示好的匹配,則可將該匹配質(zhì)量度量與該匹配質(zhì)量閾值進(jìn)行比較以確定匹配質(zhì)量度量是否大于該匹配質(zhì)量閾值。然而,可以理解,其它匹配質(zhì)量度量可適當(dāng)?shù)赜幂^低的值來指示好匹配。
如果匹配質(zhì)量比較沒有指示(1114)好匹配,則該方法可返回到選擇(1104)隊(duì)伍組合并評(píng)估該潛在匹配的質(zhì)量。
如果匹配質(zhì)量比較指示(1114)好匹配,例如,超過了該閾值,則可用任何適當(dāng)?shù)姆绞街甘?1116)該所選隊(duì)伍組合提供合適的匹配。在某些情況下,可呈現(xiàn)(1120)第一個(gè)合適的匹配作為對(duì)一游戲的建議的匹配。
在其它情況下,對(duì)于建議的游戲的所呈現(xiàn)的匹配可以是在一段時(shí)間內(nèi)從所有潛在匹配中確定的或以任何其它適當(dāng)?shù)姆绞酱_定的最合適的匹配。如果要確定并比較兩個(gè)或多個(gè)匹配的質(zhì)量,則該方法可返回到選擇(1104)用于下一個(gè)潛在匹配的兩個(gè)或多個(gè)隊(duì)伍,不論所呈現(xiàn)的所選隊(duì)伍是否指示(1116)“好”匹配,例如,超過閾值。在這一情況下,該方法可繼續(xù)確定兩個(gè)或多個(gè)潛在匹配的質(zhì)量,直到評(píng)估(1118)一停止條件。如上所述,該停止條件可以是隊(duì)伍組合的數(shù)量、所確定的好匹配的數(shù)量、時(shí)間段、所有潛在匹配等中的任何一種或多種。如果滿足停止條件,則可呈現(xiàn)(1120)所確定的最佳匹配作為對(duì)游戲的建議的匹配。
可以用任何適當(dāng)?shù)姆绞絹沓尸F(xiàn)(1120)一個(gè)或多個(gè)潛在匹配。滿足質(zhì)量度量的一個(gè)或多個(gè)潛在玩家配對(duì)可被呈現(xiàn)給一個(gè)或多個(gè)玩家以供接受或拒絕,和/或匹配模塊可響應(yīng)于“足夠好”的匹配、可用的“最佳”匹配、使得所有玩家都被匹配的所有可能玩家的匹配(可能不是“最佳匹配”)、以及滿足質(zhì)量準(zhǔn)則的匹配的確定來設(shè)置匹配。在某些情況下,可向玩家呈現(xiàn)所有確定的“好”匹配,并且在某些情況下,這些“好”匹配可以基于匹配的質(zhì)量按降序(或升序)列出。
在一個(gè)示例中,圖11中的確定(1108)匹配質(zhì)量可包括如上對(duì)于圖8的方法800所述的確定平局的概率??沙跏蓟?802)參數(shù)。例如,可設(shè)置表現(xiàn)方差或固定潛在得分方差β2,和/或可將排名編碼的矩陣A初始化為0??扇缟纤龅亟邮?804)玩家得分(例如,均值μ和方差σ2=diag(∑))。可用任何適當(dāng)?shù)姆绞絹斫邮?806)k支隊(duì)伍的排名r。例如,可從存儲(chǔ)器中檢索隊(duì)伍的排名。
可通過根據(jù)玩家的排名r計(jì)算(810)排列()來對(duì)隊(duì)伍的得分排名。例如,如上所述,排名可按排名遞減次序來放置。
可確定(812)排名的編碼。排名的編碼可使用以上參考圖7的確定排名編碼(710)來描述的方法并使用等式(71-76)來確定??纱_定(814)中間參數(shù)。例如,可使用以上等式(77)并如參考圖7的確定中間參數(shù)(712)所描述地來確定參數(shù)u。然而,與等式(78)的參數(shù)C不同,在平局質(zhì)量度量中,參數(shù)C1和C2可使用下式來確定 C1=β2ATA (112) C2=C1+ATdiag(σ2)A (113) 可通過對(duì)具有均值u和方差C的截?cái)喔咚剐偷某?shù)函數(shù)的值求值來確定(816)游戲結(jié)局的概率。使用以上等式(109)的平局質(zhì)量度量,然后可將平局余量極限∈→0中的歸一化平局概率用作確定的匹配質(zhì)量(例如,圖11的步驟108),并且可被確定為 兩個(gè)玩家的匹配質(zhì)量 單個(gè)玩家、兩支隊(duì)伍的示例是圖11的步驟1108中所確定的匹配質(zhì)量度量的特殊情況。如上所述,第一個(gè)玩家可以被表示為A,而第二個(gè)玩家可以被表示為B。匹配質(zhì)量度量q可以按照兩個(gè)玩家的平均得分之差以及兩個(gè)玩家的方差之和來寫出。具體地,均值之差mAB=μA-μB以及方差之和ζAB2=ζA2+ζB2。以此方式,可在圖11的步驟1108處使用以上等式(109)來確定平局質(zhì)量度量為
從等式(115)所得的匹配質(zhì)量度量qdraw的范圍總是在0和1之間,其中0指示最差的可能匹配,而1是最佳的可能匹配。由此,質(zhì)量閾值可以是指示好匹配的等級(jí)的任何適當(dāng)?shù)闹?,該值可以是接?的值,如.75、.85、.95、.99等。
使用等式(115),即使兩個(gè)玩家具有相同的平均得分,得分的不確定性也會(huì)影響建議匹配的質(zhì)量度量。由此,如果任一玩家的得分不確定性(σ)較大,則匹配質(zhì)量準(zhǔn)則遠(yuǎn)小于1,從而減小了匹配質(zhì)量的度量。結(jié)果,如果一個(gè)或多個(gè)方差較大,則平局質(zhì)量度量可能是不適當(dāng)?shù)?,因?yàn)闆]有一個(gè)評(píng)估的匹配可超過該閾值。由此,確定(1108)的匹配質(zhì)量可使用任何其它合適的方法來確定,諸如對(duì)玩家的預(yù)期技能差別進(jìn)行評(píng)估。例如,作為技能差別的度量的匹配質(zhì)量度量可以是在絕對(duì)或平方誤差的意義上。絕對(duì)平局質(zhì)量度量的一個(gè)示例可以是
在另一示例中,平方誤差平局質(zhì)量度量可以是
等式(115)、(116)和(117)的不同平局質(zhì)量度量的示例曲線圖在圖10的示例圖中分別被繪為線1002、1004和1006。軸1008指示
的值,而軸1010指示以下所示的等式(118)的較好玩家獲勝的概率。如可以從曲線圖1000中見到的,線1002的平局概率更好地指示了較好玩家獲勝的實(shí)際概率。
可以理解,變換exp(-( ))將游戲的預(yù)期得分間隙映射到區(qū)間
,使得1對(duì)應(yīng)于高(0間隙)質(zhì)量匹配。由此,質(zhì)量閾值可以是指示好匹配的等級(jí)的任何適當(dāng)?shù)闹担@可以是接近1的值,如.75、.85、.95、.99等。
在等式(116)和(117)的示例中,平局質(zhì)量在絕對(duì)或平方誤差的意義上測(cè)量兩個(gè)玩家的技能差別。這些等式可用于基本相等的平均技能(例如,mAB≈0)的兩個(gè)玩家,因?yàn)橥婕壹寄艿娜魏尾淮_定性會(huì)降低匹配質(zhì)量(即,質(zhì)量度量的值)。
平局質(zhì)量閾值q*的值(諸如在圖11的步驟1110中確定的)可以是任何適當(dāng)?shù)闹?,該值可以作為匹配模塊中的預(yù)定或確定值和/或作為用戶偏好來提供。平局質(zhì)量閾值q*可在較高的閾值導(dǎo)致可用的所有游戲會(huì)話/伙伴都被拒絕的情況下隨時(shí)間的推移而被放松,即降低。參考圖11的方法1100,對(duì)匹配質(zhì)量閾值的確定1110可以基于已經(jīng)發(fā)現(xiàn)可接受的匹配的數(shù)目、找到合適匹配所花的時(shí)間等來改變。
盡管放松匹配質(zhì)量閾值導(dǎo)致較低質(zhì)量的匹配,但是可能有必要允許玩家在超過了一特定等待時(shí)間之后玩游戲。在某些情況下,匹配質(zhì)量閾值q*可被設(shè)置成使得對(duì)數(shù)(1/q*)基本等于要匹配的玩家的方差與要隨時(shí)間增加的參數(shù)t之和,σBt+t,且其中,對(duì)系統(tǒng)的新玩家的方差被設(shè)為1。通過增加t的值,放松了質(zhì)量閾值,并且增加了未被過濾掉的匹配或會(huì)話的數(shù)目,直到最終包括了所有的會(huì)話。
在游戲過程的早期,例如,一個(gè)或多個(gè)玩家或隊(duì)伍的技能有較高的不確定性,或者在均值μ0和方差σ02的初始化值處,兩個(gè)預(yù)期玩家之間的匹配的質(zhì)量可以與質(zhì)量閾值qdraw(0,2σ02,β)進(jìn)行比較,該質(zhì)量閾值是使用固定方差值,通常是發(fā)起玩家技能的方差的值的平局質(zhì)量。
在玩家技能基本收斂之后,例如玩家方差σ2基本為0,則可將兩個(gè)預(yù)期玩家之間的匹配質(zhì)量(如在圖11的步驟1108中所確定的)與被求值為qdraw(mAB,0,β)的平局質(zhì)量閾值(如在圖11的步驟1110中所確定的)進(jìn)行比較。具體地,如果玩家之間的匹配的qdraw大于平局質(zhì)量閾值q*,則該匹配被指示為可接受的。
匹配過濾器 如上參考圖11所述,在某些情況下,為確定兩個(gè)玩家之間的匹配,匹配模塊可從可用玩家中確定對(duì)一玩家的最佳匹配。例如,一玩家可進(jìn)入游戲環(huán)境,并且請(qǐng)求匹配。響應(yīng)于該請(qǐng)求,匹配模塊可確定可用玩家(例如,該游戲環(huán)境中同樣也在尋找匹配的那些玩家)的最佳匹配。在某些情況下,匹配模塊可對(duì)等待匹配的所有當(dāng)前玩家對(duì)qdraw求值?;谄骄仲|(zhì)量閾值(例如,q*),匹配模塊可過濾調(diào)小于平局質(zhì)量閾值q*的那些匹配。
然而,以上方法可能對(duì)于大型游戲環(huán)境并不能很好地縮放。例如,在任何時(shí)刻可能有大約100萬個(gè)用戶正等待匹配。使用實(shí)際的匹配質(zhì)量度量可能要求匹配模塊進(jìn)行完整的線性表排序,這可能被認(rèn)為在計(jì)算上太昂貴。為減少為所有尋求匹配的玩家的排列計(jì)算所有可能游戲結(jié)局的匹配質(zhì)量(例如,概率或其它質(zhì)量度量)的運(yùn)算,匹配模塊可進(jìn)行初始分析(例如,預(yù)過濾預(yù)期玩家配對(duì))。由此,一個(gè)或多個(gè)玩家最初可至少部分地基于諸如連接速度、玩家得分范圍等一個(gè)或多個(gè)過濾準(zhǔn)則而從選擇中過濾掉。
參考圖11,方法1100可包括從匹配分析中過濾(1106)一個(gè)或多個(gè)玩家。過濾器可以基于任何一個(gè)或多個(gè)因素,這減少了要分析的潛在匹配排列的數(shù)量。
例如,一種濾波器可以基于實(shí)現(xiàn)可接受匹配(例如,超過匹配質(zhì)量閾值的匹配質(zhì)量)最初所需的平均得分。在該示例中,匹配質(zhì)量基于平局概率,可解等式qdraw(mAB,2σ2,β))=qdraw(mAB,0,β)來確定最初使一匹配被接受所需的均值差mAB。例如,在平局質(zhì)量qdraw的情況下 以此方式,較佳玩家獲勝的概率是
的函數(shù)。
由此,為減少對(duì)尋求匹配的玩家的所有排列計(jì)算所有可能游戲結(jié)局的概率的運(yùn)算,匹配模塊可基于等式(118)來作出技能等級(jí)差的初始分析(例如,預(yù)過濾預(yù)期玩家配對(duì)),并從匹配分析中移除超過對(duì)技能等級(jí)的簡(jiǎn)單范圍檢查(例如,平均得分μ和/或平均得分差(例如mAB))的那些配對(duì)。
為創(chuàng)建對(duì)于玩家A的簡(jiǎn)單范圍檢查,如果任一方差σA增加或如果均值差的絕對(duì)值|μA-μB|增加,則以上等式(117)的平局質(zhì)量度量q2減小。具體地,如果任一玩家的技能的不確定性增長,或者如果平均技能偏差增長,則匹配質(zhì)量收縮。以此方式,從玩家B的觀點(diǎn)來看
且
由此,如果質(zhì)量度量q2(mAB,σB2,β)和q2(0,ζAB2,β)中的任一個(gè)低于平局質(zhì)量閾值,則匹配模塊可排除該配對(duì),因?yàn)檫@兩個(gè)度量都限制了以上真實(shí)(但搜索成本較高)的匹配度量q2(mAB,ζAB2,β)。更具體地,只要q2(mAB,σB2,β)或q2(0,ζAB2,β)大于諸如等式(119)所示的匹配質(zhì)量度量,則匹配模塊就不會(huì)排除對(duì)一玩家的潛在的好匹配。
等式(119)的范圍檢查過濾器可用任何適當(dāng)?shù)姆绞絹韺?shí)現(xiàn)。例如,可使用等式(120)、(121)和(122)的三種范圍檢查中的一種或多種來檢查每一玩家A和B的均值μ和方差σ2 如上所述,平局質(zhì)量閾值q*的值可以是預(yù)定或確定的任何適當(dāng)?shù)闹怠?br>
現(xiàn)在已經(jīng)描述了本發(fā)明的某些說明性實(shí)施例,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)清楚,上述內(nèi)容僅是說明性而非限制性的,其僅作為示例而提出。眾多修改和其它說明性實(shí)施例在本領(lǐng)域的普通技術(shù)人員的范圍之內(nèi),并且被認(rèn)為落入本發(fā)明的范圍之內(nèi)。特別地,盡管以上示例是參考用高斯型來對(duì)先驗(yàn)和/或后驗(yàn)概率建模來描述的,但是可以理解,以上實(shí)施例可被擴(kuò)展以允許玩家得分的任意分布,這可以是或不是獨(dú)立的。在以上示例中,假設(shè)技能協(xié)方差矩陣是對(duì)角矩陣,即,聯(lián)合技能分布是由每一因素的兩個(gè)數(shù)字(均值和標(biāo)準(zhǔn)差)表示的分解高斯分布。在某些情況下,協(xié)方差矩陣可以使用低秩逼近來確定,使得∑的秩=d的值。對(duì)該操作的存儲(chǔ)器要求是O(n·d),并且對(duì)更新技術(shù)中的所有操作的計(jì)算要求可以不大于O(n·d2)。對(duì)于較小的d值,這可以是可行的存儲(chǔ)器和計(jì)算數(shù)量,并且后驗(yàn)的逼近可以用逼近(而非假設(shè))的協(xié)方差矩陣來改進(jìn)。這一系統(tǒng)能夠充分利用技能之間的相關(guān)。例如,玩家小集團(tuán)的所有成員可以獲益于(或遭受)該小集團(tuán)的單個(gè)成員的游戲結(jié)局。對(duì)協(xié)方差矩陣的低秩逼近可允許對(duì)玩家的可視化(例如,玩家地圖),使得具有高度相關(guān)技能的玩家可被彼此接近地顯示。
此外,盡管此處所提出的許多示例涉及方法操作或系統(tǒng)元件的具體組合,但是應(yīng)當(dāng)理解,這些操作和元件可以用其它方式來組合以實(shí)現(xiàn)相同的目標(biāo)。僅結(jié)合一個(gè)實(shí)施例所討論的操作、元件和特征并不旨在排除其它實(shí)施例中的類似角色。此外,在權(quán)利要求中使用諸如“第一”和“第二”等序數(shù)詞來修飾一權(quán)利要求要素本身并不意味著一個(gè)權(quán)利要求要素相對(duì)于另一個(gè)的任何優(yōu)先級(jí)、優(yōu)先順序或次序,也不意味著執(zhí)行方法操作的時(shí)間次序,而是僅用作將具有特定名稱的一個(gè)權(quán)利要求要素與具有相同名稱(但使用序數(shù)詞)的另一權(quán)利要求要素區(qū)分開來的標(biāo)簽,以便區(qū)分各權(quán)利要求要素。
權(quán)利要求
1.一種方法,包括
a)接收包括表示與第一隊(duì)伍相關(guān)聯(lián)的分布的第一均值和第一方差的第一得分;
b)接收包括表示與第二隊(duì)伍相關(guān)聯(lián)的分布的第二均值和第二方差的第二得分;
c)至少部分地基于包括所述第一均值、所述第一方差、所述第二均值和所述第二方差的組中的至少一個(gè),確定所述第一隊(duì)伍和所述第二隊(duì)伍之間的匹配質(zhì)量;
d)確定一匹配質(zhì)量閾值;
e)基于所述匹配質(zhì)量和所述匹配質(zhì)量閾值來將所述第一隊(duì)伍與所述第二隊(duì)伍匹配;以及
f)向所述第一隊(duì)伍和/或所述第二隊(duì)伍提供所述匹配的指示。
2.如權(quán)利要求1所述的方法,其特征在于,還包括從多個(gè)玩家均值和多個(gè)玩家方差中確定包括所述第一均值和所述第一方差的所述第一得分,每一玩家均值和玩家方差與所述第一隊(duì)伍的多個(gè)玩家中的一個(gè)相關(guān)聯(lián)。
3.如權(quán)利要求1所述的方法,其特征在于,確定匹配質(zhì)量包括確定所述第一隊(duì)伍和所述第二隊(duì)伍之間的平局概率。
4.如權(quán)利要求3所述的方法,其特征在于,確定所述平局概率包括從所述平局概率中移除對(duì)固定平局余量的依賴性,并且所述平局概率至少基于一固定潛在得分方差參數(shù)。
5.如權(quán)利要求4所述的方法,其特征在于,確定所述匹配質(zhì)量閾值包括至少基于約為零的得分均值差、約為初始化方差值的兩倍的得分方差以及所述固定潛在得分方差參數(shù)來確定平局概率。
6.如權(quán)利要求4所述的方法,其特征在于,確定所述匹配質(zhì)量閾值包括至少基于所述第一均值和所述第二均值之差、約為零的得分方差以及所述固定潛在得分方差參數(shù)來確定平局概率。
7.如權(quán)利要求1所述的方法,其特征在于,還包括基于所述第一均值、所述第二均值、所述第一方差和所述第二方差的范圍比較來標(biāo)識(shí)所述第二隊(duì)伍。
8.如權(quán)利要求7所述的方法,其特征在于,所述范圍比較包括確定所述第一均值是否小于所述第二均值μB與所述平局質(zhì)量度量q*的倒數(shù)的對(duì)數(shù)減去所述第二方差σB2的平方根之和
9.如權(quán)利要求7所述的方法,其特征在于,所述范圍比較包括確定所述第一均值是否大于所述第二均值μB與所述平局質(zhì)量度量q*的倒數(shù)的對(duì)數(shù)減去所述第二方差σB2的平方根之差
10.如權(quán)利要求7所述的方法,其特征在于,所述范圍比較包括確定所述第一方差σA是否小于所述平局質(zhì)量度量q*的倒數(shù)的對(duì)數(shù)與所述第二方差σB2之差
11.如權(quán)利要求1所述的方法,其特征在于,還包括基于所述第一均值與一保守等級(jí)指示符乘以所述第一方差的平方根之差來確定所述第一隊(duì)伍的至少一個(gè)玩家的得分估算。
12.一種或多種包括至少一個(gè)計(jì)算機(jī)存儲(chǔ)介質(zhì)的計(jì)算機(jī)可讀介質(zhì),所述一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)包含當(dāng)被實(shí)現(xiàn)時(shí)執(zhí)行一種方法的計(jì)算機(jī)可讀指令,所述方法包括
a)接收第一隊(duì)伍的一玩家的第一得分,所述第一得分包括第一均值和第一方差;
b)接收第二隊(duì)伍的一玩家的第二得分,所述第二得分包括第二均值和第二方差;
c)確定所述第一隊(duì)伍與所述第二隊(duì)伍之間的期望得分間隙;
d)基于所述期望得分間隙與一匹配質(zhì)量閾值的比較來將所述第一隊(duì)伍與所述第二隊(duì)伍匹配;以及
e)向所述第一隊(duì)伍和/或所述第二隊(duì)伍提供所述匹配的指示。
13.如權(quán)利要求12所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,確定所述期望得分間隙包括計(jì)算所述第一隊(duì)伍的所述玩家的第一得分與所述第二隊(duì)伍的所述玩家的第二得分之差。
14.如權(quán)利要求13所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,所述匹配質(zhì)量閾值可以由用戶來定義。
15.如權(quán)利要求12所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,將所述第一隊(duì)伍與所述第二隊(duì)伍匹配包括通過至少基于大約為零的得分均值差、約為初始化方差值的兩倍的得分方差、以及一固定潛在得分方差參數(shù)確定平局概率來確定所述匹配質(zhì)量閾值。
16.如權(quán)利要求12所述的方法,其特征在于,將所述第一隊(duì)伍與所述第二隊(duì)伍匹配包括通過至少基于所述第一均值與所述第二均值之差、約為零的得分方差以及一固定潛在得分方差參數(shù)確定平局概率來確定所述匹配質(zhì)量閾值。
17.一種或多種包含計(jì)算機(jī)可執(zhí)行組件的計(jì)算機(jī)可讀介質(zhì),所述組件包括
a)用于基于第一隊(duì)伍與第二隊(duì)伍之間的游戲的結(jié)局來更新所述第一隊(duì)伍的第一得分和所述第二隊(duì)伍的第二得分的裝置,其中所述第一得分和所述第二得分中的每一個(gè)被建模為一分布;
b)用于基于所述第一得分、所述第三隊(duì)伍的第三得分、以及一匹配質(zhì)量閾值來將所述第一隊(duì)伍與第三隊(duì)伍匹配的裝置;以及
c)用于向所述第一隊(duì)伍和/或所述第三隊(duì)伍提供所述匹配的指示的裝置。
18.如權(quán)利要求17所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,還包括用于從可用于與所述第一隊(duì)伍玩游戲的多個(gè)隊(duì)伍中標(biāo)識(shí)出所述第三隊(duì)伍的裝置。
19.如權(quán)利要求18所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,所述用于標(biāo)識(shí)的裝置包括用于基于對(duì)所述第三隊(duì)伍的得分的范圍檢查來過濾所述多個(gè)隊(duì)伍的裝置。
20.如權(quán)利要求17所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,所述用于匹配的裝置包括用于確定一游戲的結(jié)局為所述第一隊(duì)伍和所述第三隊(duì)伍之間的平局的概率的裝置。
全文摘要
游戲環(huán)境,尤其是電子在線游戲環(huán)境中的玩家可相對(duì)于彼此或相對(duì)于一預(yù)定評(píng)分系統(tǒng)來評(píng)分。每一玩家的評(píng)分可基于一個(gè)或多個(gè)玩家的一個(gè)或多個(gè)隊(duì)伍中彼此競(jìng)爭(zhēng)的玩家之間的游戲的結(jié)局。每一玩家的得分可被表示為潛在得分的分布,該分布可指示表示玩家得分的分布的置信水平。每一玩家的得分分布可以用高斯分布來建模,并且可通過貝葉斯推論算法來確定。評(píng)分可用于跟蹤玩家在游戲環(huán)境中的進(jìn)步和/或級(jí)別、在排名的排行榜指示中使用、和/或可用于在將來的游戲中將玩家彼此匹配。潛在游戲中一個(gè)或多個(gè)隊(duì)伍的匹配可使用一匹配質(zhì)量閾值來評(píng)估,該閾值指示了可以與游戲結(jié)局的概率分布相關(guān)的預(yù)期匹配質(zhì)量的度量。
文檔編號(hào)G06F17/00GK101313322SQ200680043271
公開日2008年11月26日 申請(qǐng)日期2006年11月21日 優(yōu)先權(quán)日2005年11月21日
發(fā)明者T·K·格瑞派爾, R·赫伯齊 申請(qǐng)人:微軟公司