生成裝置、生成方法和程序的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種生成裝置、生成方法和程序。
【背景技術(shù)】
[0002]在有關(guān)技術(shù)的預(yù)測(cè)問(wèn)題中,基于訓(xùn)練數(shù)據(jù)生成預(yù)測(cè)模型,并且將與訓(xùn)練數(shù)據(jù)不同的實(shí)際數(shù)據(jù)應(yīng)用于生成的預(yù)測(cè)模型。然后,獲得與實(shí)際數(shù)據(jù)對(duì)應(yīng)的預(yù)測(cè)結(jié)果(例如,見(jiàn)專利文獻(xiàn)I和2)
[0003][引用列表]
[0004][專利文獻(xiàn)]
[0005][專利文獻(xiàn)I]日本待審專利申請(qǐng)公開(kāi)號(hào)2005-253708
[0006][專利文獻(xiàn)2]日本待審專利申請(qǐng)公開(kāi)號(hào)2013-140548
【發(fā)明內(nèi)容】
[0007][技術(shù)問(wèn)題]
[0008]然而,當(dāng)在預(yù)測(cè)問(wèn)題中在這樣的訓(xùn)練數(shù)據(jù)中包括與待預(yù)測(cè)的領(lǐng)域不對(duì)應(yīng)的特有數(shù)據(jù)時(shí),誤差可能在由預(yù)測(cè)模型生成的預(yù)測(cè)結(jié)果中增加。例如,在例如從在第一區(qū)域中的酒店的以往預(yù)訂信息生成用于酒店費(fèi)率和需求的預(yù)測(cè)模型并且通過(guò)使用預(yù)測(cè)模型來(lái)預(yù)測(cè)用于在第二區(qū)域中的酒店的費(fèi)率和需求的情況中,當(dāng)在訓(xùn)練數(shù)據(jù)中包括第一區(qū)域特有(或者不是大多數(shù)酒店通用)的數(shù)據(jù)時(shí),特有數(shù)據(jù)可能對(duì)用于在第二區(qū)域中的酒店的預(yù)測(cè)誤差施加影響。因此,不可以獲得正確預(yù)測(cè)結(jié)果。
[0009][對(duì)問(wèn)題的解決方案]
[0010]根據(jù)本發(fā)明的第一方面,提供了一種生成裝置、生成方法和程序。該生成裝置包括模型生成單元和模型修改單元。模型生成單元通過(guò)使用訓(xùn)練數(shù)據(jù)的訓(xùn)練來(lái)生成從輸入特征值預(yù)測(cè)輸出特征值的訓(xùn)練的模型。模型修改單元減少輸入特征值中的一些輸入特征值在生成的訓(xùn)練的模型中的影響的程度并且生成實(shí)際使用的修改的模型。
[0011]在本發(fā)明的以上描述的
【發(fā)明內(nèi)容】
中,未列舉本發(fā)明的所有特征。特征的子組合也可以構(gòu)成發(fā)明。
【附圖說(shuō)明】
[0012][圖1]圖1圖示了根據(jù)本實(shí)施例的在預(yù)測(cè)問(wèn)題中的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)的示例性概況。
[0013][圖2]圖2圖示了根據(jù)本實(shí)施例的生成裝置100的示例性配置。
[0014][圖3]圖3圖示了根據(jù)本實(shí)施例的生成裝置100的操作流程的示例性配置。
[0015][圖4]圖4圖示了根據(jù)本實(shí)施例的生成裝置100的示例性修改。
[0016][圖5]圖5圖示了根據(jù)本實(shí)施例的用作生成裝置100的計(jì)算機(jī)1900的示例性硬件配置。
【具體實(shí)施方式】
[0017]以下將通過(guò)使用本發(fā)明的一個(gè)實(shí)施例來(lái)描述本發(fā)明。然而,在權(quán)利要求的范圍中的本發(fā)明不限于以下描述的實(shí)施例。此外,在本發(fā)明中的解決方案未必需要在實(shí)施例中描述的所有特征組合。
[0018]圖1圖示了根據(jù)本實(shí)施例的在預(yù)測(cè)問(wèn)題中的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)的示例性概況。在預(yù)測(cè)問(wèn)題中,通過(guò)使用在圖1中所示的訓(xùn)練數(shù)據(jù)來(lái)生成預(yù)測(cè)模型。然后,向生成的預(yù)測(cè)模型輸入與訓(xùn)練數(shù)據(jù)不同的測(cè)試數(shù)據(jù),并且獲得與測(cè)試數(shù)據(jù)對(duì)應(yīng)的預(yù)測(cè)結(jié)果。
[0019]例如,在時(shí)序預(yù)測(cè)中,例如基于其結(jié)果已知的訓(xùn)練數(shù)據(jù)(比如以往數(shù)據(jù))生成預(yù)測(cè)將來(lái)的預(yù)測(cè)模型,并且通過(guò)向預(yù)測(cè)模型輸入其結(jié)果未知的數(shù)據(jù)(比如實(shí)際或者將來(lái)數(shù)據(jù))來(lái)獲得預(yù)測(cè)結(jié)果。例如,從關(guān)于在第一區(qū)域中的酒店的以往信息預(yù)測(cè)用于在第一區(qū)域(例如,“Izu”)中的酒店的將來(lái)費(fèi)率和需求,或者從關(guān)于在第一區(qū)域中的酒店的以往信息預(yù)測(cè)用于在第二區(qū)域(例如,“Atami”)中的酒店的將來(lái)費(fèi)率和需求。
[0020]然而,在這樣的預(yù)測(cè)中使用的訓(xùn)練數(shù)據(jù)包括適合用于生成預(yù)測(cè)模型的高通用性的數(shù)據(jù)(即,具有將來(lái)或者實(shí)際數(shù)據(jù)公共的特征的數(shù)據(jù))和與將來(lái)或者實(shí)際數(shù)據(jù)不同的訓(xùn)練數(shù)據(jù)特有的數(shù)據(jù)。此外,將來(lái)或者實(shí)際數(shù)據(jù)可以具有特有數(shù)據(jù)。然而,難以在預(yù)測(cè)之前預(yù)先獲得充分?jǐn)?shù)量的將來(lái)或者實(shí)際數(shù)據(jù)。
[0021]在本實(shí)施例中,將描述如下示例,在該示例中,從關(guān)于在區(qū)域A中的酒店的以往信息生成用于酒店費(fèi)率和需求的預(yù)測(cè)模型并且預(yù)測(cè)用于在另一區(qū)域B中的酒店的費(fèi)率和需求。在這一情況中,關(guān)于在區(qū)域A中的酒店的以往信息(訓(xùn)練數(shù)據(jù))包括與關(guān)于在區(qū)域B中的酒店的信息接近的高通用性的數(shù)據(jù)(將來(lái)或者實(shí)際數(shù)據(jù))和與關(guān)于在區(qū)域B中的酒店的信息不同并且是區(qū)域A特有的數(shù)據(jù)。
[0022]例如,區(qū)域A特有的數(shù)據(jù)指示依賴于區(qū)域A特有的情形(比如風(fēng)景和活動(dòng))的酒店費(fèi)率和需求。示例可以是如下情況,在該情況中,在特定日期在區(qū)域A中的特定酒店附近舉行煙火展覽。在通過(guò)使用區(qū)域A特有的這樣的數(shù)據(jù)來(lái)生成預(yù)測(cè)模型時(shí),誤差在用于在區(qū)域B中的酒店的費(fèi)率和需求的預(yù)測(cè)中出現(xiàn)。因此,希望在預(yù)測(cè)模型的生成中刪除這樣的數(shù)據(jù)。然而,在有關(guān)技術(shù)中,除非關(guān)于在區(qū)域B中的酒店的信息預(yù)先已知,否則難以僅刪除特有數(shù)據(jù)。
[0023]即使假設(shè)數(shù)據(jù)是特有的,關(guān)于是否將刪除數(shù)據(jù)的確定的標(biāo)準(zhǔn)也是模糊的并且依賴于用戶的經(jīng)驗(yàn)、感覺(jué)等。在多條特有數(shù)據(jù)存在時(shí),即使有經(jīng)驗(yàn)的用戶也難以確定將從多條數(shù)據(jù)刪除哪條數(shù)據(jù)。因此,根據(jù)本實(shí)施例的一種生成裝置適當(dāng)?shù)販p少由來(lái)自訓(xùn)練數(shù)據(jù)的特有數(shù)據(jù)所產(chǎn)生的影響,并且生成其中減少預(yù)測(cè)誤差的預(yù)測(cè)模型。
[0024]圖2圖示了根據(jù)本實(shí)施例的生成裝置100的示例性配置。生成裝置100接收訓(xùn)練數(shù)據(jù)并且基于訓(xùn)練數(shù)據(jù)生成以減少預(yù)測(cè)誤差這樣的方式修改的預(yù)測(cè)模型。也就是說(shuō),生成裝置100生成用于測(cè)試通過(guò)學(xué)習(xí)接收的訓(xùn)練數(shù)據(jù)而獲得的訓(xùn)練的模型的測(cè)試數(shù)據(jù),并且基于訓(xùn)練的模型的測(cè)試來(lái)修改訓(xùn)練的模型。生成裝置100包括獲取單元110、存儲(chǔ)單元120、模型生成單元130和模型修改單元140。
[0025]獲取單元110獲得訓(xùn)練數(shù)據(jù)。訓(xùn)練數(shù)據(jù)例如是根據(jù)它的特征分類(lèi)的數(shù)據(jù),并且在以接收的輸入特征值為元素的特征矢量中被表達(dá)。例如,特征矢量根據(jù)它的特征(比如在酒店的情況中為日期、客人數(shù)目、設(shè)施、計(jì)劃和房間信息)被分類(lèi)。在特征矢量中,每個(gè)特征被進(jìn)一步劃分成輸入特征值,并且與輸入特征值對(duì)應(yīng)的具體值被用作元素。
[0026]例如,日期的特征以輸入特征值(比如入住日期、入住月份和當(dāng)周日子)為元素??腿藬?shù)目的特征以輸入特征值(比如成人數(shù)目、孩子數(shù)目和嬰兒數(shù)目)為元素。
[0027]訓(xùn)練數(shù)據(jù)包括與特征矢量對(duì)應(yīng)的輸出特征值。輸出特征值是與特征矢量的兀素對(duì)應(yīng)的特征值并且例如是酒店費(fèi)率。
[0028]獲取單元110可以響應(yīng)于用戶直接輸入輸入特征值來(lái)獲得訓(xùn)練數(shù)據(jù)。備選地,可以讀取和獲得在預(yù)定格式中存儲(chǔ)的輸入特征值的數(shù)據(jù)。獲取單元110可以連接到網(wǎng)絡(luò)等,并且可以經(jīng)由網(wǎng)絡(luò)獲得訓(xùn)練數(shù)據(jù)。獲取單元110向存儲(chǔ)單元120和模型生成單元130供應(yīng)獲得的訓(xùn)練數(shù)據(jù)。
[0029]連接到獲取單元110的存儲(chǔ)單元120存儲(chǔ)從獲取單元110接收的訓(xùn)練數(shù)據(jù)。存儲(chǔ)單元120可以存儲(chǔ)在其中生成裝置100生成預(yù)測(cè)模型的過(guò)程中獲得的預(yù)測(cè)模型。
[0030]連接到獲取單元110的模型生成單元130通過(guò)使用從獲取單元110接收的訓(xùn)練數(shù)據(jù)的訓(xùn)練來(lái)生成從多個(gè)輸入特征值預(yù)測(cè)輸出特征值的訓(xùn)練的模型。例如,模型生成單元130生成訓(xùn)練的模型,該訓(xùn)練的模型使用以用于酒店的以往預(yù)訂信息數(shù)據(jù)(日期、客人數(shù)目、酒店屬性、計(jì)劃屬性)的具體值為輸入特征矢量的訓(xùn)練數(shù)據(jù)并且在輸入新(將來(lái))預(yù)訂信息數(shù)據(jù)時(shí)基于訓(xùn)練數(shù)據(jù)和作為對(duì)應(yīng)酒店入住費(fèi)率的輸出特征值的數(shù)據(jù)輸出用于對(duì)應(yīng)費(fèi)率(輸出特征值)的預(yù)測(cè)結(jié)果。
[0031]例如,輸出特征值是與輸入特征值對(duì)應(yīng)的將來(lái)特征值(例如,將來(lái)費(fèi)率)。也就是說(shuō),在這一情況中,模型生成單元130生成函數(shù)f,從而使得酒店費(fèi)率=f(日期,客人數(shù)目,酒店屬性,計(jì)劃屬性)。
[0032]模型生成單元130通過(guò)使用多條接收的訓(xùn)練數(shù)據(jù)中的全部或者一些訓(xùn)練數(shù)據(jù)的訓(xùn)練來(lái)生成唯一地代表輸入/輸出關(guān)系的函數(shù)作為訓(xùn)練的模型。模型生成單元130向模型修改單元140供應(yīng)生成的訓(xùn)練的模型。備選地,模型生成單元130可以連接到存儲(chǔ)單元120。在這一情況中,在存儲(chǔ)單元120中存儲(chǔ)生成的訓(xùn)練的模型,并且模型修改單元140從存儲(chǔ)單元120讀出訓(xùn)練的模型。
[0033]模型修改單元140使用其至少部分與訓(xùn)練數(shù)據(jù)不同的測(cè)試數(shù)據(jù)以減少來(lái)自輸入特征值中的一些輸入特征值的在由模型生成單元130生成的訓(xùn)練的模型中的影響的程度,并且生成被實(shí)際使用的修改的模型。模型修改單元140生成修改的模型,從而使得在減少來(lái)自輸入特征值中的一些輸入特征值的影響的程度時(shí)減少由輸入特征值中的一些輸入特征值的改變所引起的預(yù)測(cè)結(jié)果的改變。
[0034]例如,通過(guò)在生成的訓(xùn)練的模型中將加權(quán)系數(shù)用于輸入特征值來(lái)確定影響的程度。加權(quán)值例如范圍在O與I之間。該值越小,通過(guò)使用該值被加權(quán)的輸入特征值對(duì)生成的訓(xùn)練的模型施加的影響就越小。也就是說(shuō),在這一情況中,模型修改單元140減少與輸入特征值中的一些輸入特