機器學(xué)習(xí)裝置、機器學(xué)習(xí)方法、分類裝置、分類方法
【專利說明】
[0001] 本申請主張以2014年10月31日提出申請的日本專利申請第2014-222600號為 基礎(chǔ)申請的優(yōu)先權(quán),該基礎(chǔ)申請的內(nèi)容全部援引于本申請中。
技術(shù)領(lǐng)域
[0002] 本發(fā)明涉及機器學(xué)習(xí)裝置、機器學(xué)習(xí)方法、分類裝置、分類方法。
【背景技術(shù)】
[0003] 以往,已知將內(nèi)容(例如圖像、聲音、文本等)分類為其內(nèi)容所屬的種類的分類裝 置。該分類裝置按照用于分類內(nèi)容的分類條件來進(jìn)行內(nèi)容的分類。該分類條件一般是由機 器學(xué)習(xí)裝置機器學(xué)習(xí)到的條件。
[0004] 在此,作為學(xué)習(xí)用于將內(nèi)容分類為兩個種類的分類條件的機器學(xué)習(xí)裝置,已知支 持向量機(SVM :Support Vector Machine) 〇
[0005] 該SVM(機器學(xué)習(xí)裝置)利用屬于兩個種類之一的學(xué)習(xí)用內(nèi)容的集合和屬于另 一個種類的學(xué)習(xí)用內(nèi)容的集合,預(yù)先學(xué)習(xí)將這些集合分類為兩個的分類條件(例如用于 分類的函數(shù)等)。然后,分類裝置按照學(xué)習(xí)到的分類條件,將未知的內(nèi)容分類為兩個種類 之中的任一個種類。在此,"GENERALIZED HISTOGRAM INTERSECTION KERNEL FOR IMAGE RECOGNITION"、International Conference on Image Processing(ICIP)、2005 年 9 月公 開了用于將無法線性分離的兩個集合以非線性的方式分離的SVM技術(shù)。
[0006] 其中,SVM利用將學(xué)習(xí)用內(nèi)容的特征定量化后的特征向量來進(jìn)行上述分類條件的 學(xué)習(xí)。在此情況下,SVM學(xué)習(xí)用于對分布于向量空間的一方和另一方的學(xué)習(xí)用內(nèi)容各自的 特征向量進(jìn)行線性分離的分類條件。
[0007] 然而,向量空間中的特征向量的分布的方法根據(jù)學(xué)習(xí)用內(nèi)容的本來的性質(zhì)的不同 而不同,有時無法將一方和另一方的學(xué)習(xí)用內(nèi)容的集合彼此進(jìn)行線性分離。即,是否易于線 性分離較大程度依賴于學(xué)習(xí)用內(nèi)容的本來的性質(zhì),在分布的方法根據(jù)學(xué)習(xí)用內(nèi)容的本來的 性質(zhì)唯一決定的情況下,用于線性分離的自由度較低。
[0008] 因而,存在如下問題,即,縱使機器學(xué)習(xí)裝置學(xué)習(xí)了分類條件,利用該學(xué)習(xí)到的分 類條件的分類裝置針對未知的內(nèi)容也無法精度良好地分類為該未知的內(nèi)容應(yīng)屬的種類。
【發(fā)明內(nèi)容】
[0009] 本發(fā)明正是為了解決上述問題而完成的,其目的在于,提供一種精度良好地分類 為內(nèi)容所屬的種類的機器學(xué)習(xí)裝置、機器學(xué)習(xí)方法、分類裝置、分類方法。
[0010] 本發(fā)明的第1觀點所涉及的機器學(xué)習(xí)裝置的特征在于,具備:內(nèi)容獲取單元,其獲 取η個(η為2以上的自然數(shù))用于種類劃分的帶標(biāo)簽的學(xué)習(xí)用內(nèi)容;特征向量獲取單元, 其從所述內(nèi)容獲取單元獲取到的η個學(xué)習(xí)用內(nèi)容之中分別獲取表示特征的特征向量;向量 變換單元,其基于學(xué)習(xí)用內(nèi)容彼此的類似度,將所述特征向量獲取單元獲取到的所述η個 學(xué)習(xí)用內(nèi)容各自的特征向量變換為類似特征向量;學(xué)習(xí)單元,其基于由所述向量變換單元 變換后的所述類似特征向量、和所述η個學(xué)習(xí)用內(nèi)容各自所附帶的標(biāo)簽,來學(xué)習(xí)用于對該η 個學(xué)習(xí)用內(nèi)容進(jìn)行種類劃分的分類條件;和分類單元,其按照所述學(xué)習(xí)單元學(xué)習(xí)到的分類 條件,對未附帶所述標(biāo)簽的試驗用內(nèi)容進(jìn)行種類劃分。
[0011] 本發(fā)明的第2觀點所涉及的分類裝置的特征在于,具備:未知內(nèi)容分類單元,其按 照第1觀點所涉及的機器學(xué)習(xí)裝置學(xué)習(xí)到的分類條件對與所述學(xué)習(xí)用內(nèi)容和所述試驗用 內(nèi)容不同的未知的內(nèi)容進(jìn)行種類劃分。
【附圖說明】
[0012] 圖1是表示機器學(xué)習(xí)裝置的構(gòu)成的框圖。
[0013] 圖2是表不學(xué)習(xí)用圖像和試驗用圖像的一例的圖。
[0014] 圖3是表示從學(xué)習(xí)用圖像之中獲取到的特征向量的一例的圖。
[0015] 圖4是表示將學(xué)習(xí)用圖像的特征向量變?yōu)轭愃铺卣飨蛄康牧鞒痰囊焕膱D。
[0016] 圖5是表示將試驗用圖像的特征向量變?yōu)轭愃铺卣飨蛄康牧鞒痰囊焕膱D。
[0017] 圖6是表示基于取冪參數(shù)α的取冪后的類似特征向量的示例的圖。
[0018] 圖7是表示與取冪參數(shù)α的值相應(yīng)的取冪前后的值的變化的圖。
[0019] 圖8是用于說明線性SVM(支持向量機)的原理的圖。
[0020] 圖9Α是表示調(diào)整參數(shù)C大的情況下的示例的圖。
[0021] 圖9Β是表示調(diào)整參數(shù)C小的情況下的示例的圖。
[0022] 圖10是表示正誤判定用表的一例的圖。
[0023] 圖11是表示實施方式所涉及的分類處理的流程的流程圖。
[0024] 圖12是表示分類裝置的構(gòu)成的框圖。
[0025] 圖13是表示變形例所涉及的分類處理的流程的流程圖。
[0026] 圖14是表示圖13的分類處理的后續(xù)的流程圖。
【具體實施方式】
[0027] 以下,基于附圖來說明本發(fā)明的實施方式。
[0028] 如圖1所示,機器學(xué)習(xí)裝置100具備存儲部110以及控制部120。該機器學(xué)習(xí)裝置 100是對用于將學(xué)習(xí)用內(nèi)容(圖像、聲音、文本等)分類為兩個種類的分類條件進(jìn)行機器學(xué) 習(xí)的裝置。該機器學(xué)習(xí)裝置100經(jīng)過:根據(jù)學(xué)習(xí)用內(nèi)容來學(xué)習(xí)分類條件的學(xué)習(xí)階段、和按照 學(xué)習(xí)到的分類條件對試驗用內(nèi)容進(jìn)行分類并作出正誤評價的試驗階段。然后,分類裝置在 商用環(huán)境下,按照學(xué)習(xí)到的分類條件對不同于學(xué)習(xí)用內(nèi)容和試驗用內(nèi)容的未知的內(nèi)容進(jìn)行 分類。
[0029] 在本實施方式中,以機器學(xué)習(xí)裝置100的學(xué)習(xí)階段和試驗階段為中心來進(jìn)行說 明。此外,在本實施方式中,作為內(nèi)容而取圖像為例來進(jìn)行說明。此外,在本實施方式中,"學(xué) 習(xí)分類條件"和"生成分類條件"為同義,適當(dāng)根據(jù)任一者來進(jìn)行說明。
[0030] 存儲部110為HDD (Hard Disk Drive,硬盤驅(qū)動器)等非易失性存儲器。該存儲部 110具備圖像存儲部111。該圖像存儲部111存儲圖2所示那樣的學(xué)習(xí)用圖像Si~S n和試 驗用圖像?\~T "。學(xué)習(xí)用圖像Si~S n是附帶有用于將這些學(xué)習(xí)用圖像S S "劃分為兩 個種類的標(biāo)簽的帶標(biāo)簽圖像。該標(biāo)簽取兩個種類之中的一個種類的值(例如1)或者另一 個種類的值(例如-1)當(dāng)中的任一值。另一方面,試驗用圖像Ti-Tm是未附帶有標(biāo)簽的無 標(biāo)簽圖像。
[0031] 此外,由于要劃分為兩個種類,因此帶標(biāo)簽學(xué)習(xí)用圖像的個數(shù)(η個)需要為至少 兩個以上,即η為2以上的自然數(shù)。此外,為了多次執(zhí)行正誤評價,無標(biāo)簽試驗用圖像的個 數(shù)(m個)需要為至少兩個以上,即m為2以上的自然數(shù)。在本實施方式中,為了易于理解, 以η和m的數(shù)相等、即n = m為前提來進(jìn)行以下說明。
[0032] 另外,針對學(xué)習(xí)用圖像Si~Sn,在無需特別確定哪一個學(xué)習(xí)用圖像(例如學(xué)習(xí)用 圖像3 1等)的情況下,簡稱為學(xué)習(xí)用圖像來進(jìn)行以下說明。此外,針對學(xué)習(xí)用圖像Si~Sn, 在將兩個以上的帶標(biāo)簽學(xué)習(xí)用圖像總稱的情況下,適當(dāng)稱作多個學(xué)習(xí)用圖像、η個學(xué)習(xí)用圖 像等來進(jìn)行以下說明。關(guān)于試驗用圖像也相同。
[0033] 在此,說明直至在圖像存儲部111中存儲多個學(xué)習(xí)用圖像和多個試驗用圖像為止 的流程。用戶根據(jù)目的來預(yù)先收集多個學(xué)習(xí)用圖像和多個試驗用圖像。例如,如果用戶想 要按照被攝體的有無使圖像分為兩類,則預(yù)先收集100張有被攝體的人物圖像、以及100張 無被攝體的風(fēng)景圖像。然后,將人物圖像100張之中的50張設(shè)為標(biāo)簽1的學(xué)習(xí)用圖像,將 剩余的50張設(shè)為無標(biāo)簽的試驗用圖像。另一方面,將風(fēng)景圖像100張之中的50張設(shè)為標(biāo) 簽-1的學(xué)習(xí)用圖像,將剩余的50張設(shè)為試驗用圖像。
[0034] 根據(jù)該構(gòu)成,作為一例,獲得帶標(biāo)簽1或者-1的100張的學(xué)習(xí)用圖像和無標(biāo)簽的 100張的試驗用圖像。然后,用戶將收集到的共計200張的圖像存儲至機器學(xué)習(xí)裝置100的 圖像存儲部111。由此,學(xué)習(xí)準(zhǔn)備完成,成為可由機器學(xué)習(xí)裝置100進(jìn)行機器學(xué)習(xí)的狀態(tài)。
[0035] 另外,機器學(xué)習(xí)裝置100在試驗階段執(zhí)行:按照分類條件進(jìn)行分類后的試驗用圖 像是否被分類為正確的種類的正誤判定。因而,為了正誤判定,試驗用圖像與標(biāo)簽(1或 者-1)建立對應(yīng)地存儲至存儲部110。換言之,試驗用圖像除了在被分類之后能夠進(jìn)行正誤 判定(即,在存儲部110中存儲有正誤判定用的表)之外,與無法進(jìn)行正誤判定的未知的圖 像(例如在投放到商用環(huán)境中后由分類裝置進(jìn)行分類的圖像等)是同樣的。另外,關(guān)于試 驗階段中的具體處理將在后面敘述。
[0036] 返回圖1,控制部120由CPU (Centra