本發(fā)明涉及圖像處理方法、圖像處理裝置及程序。
背景技術(shù):
近年來,基于使用了神經(jīng)網(wǎng)絡(luò)的機器學習技術(shù)的一般物體識別呈現(xiàn)出高性能而正受到關(guān)注。
但是,在基于神經(jīng)網(wǎng)絡(luò)的一般物體識別中,為了引出高識別性能,需要大量使用作為識別目標的物體的名稱和/或種類等作為注釋(正確解答信息)而標注的圖像來進行學習處理。
另外,已知在機器學習中若提供大規(guī)模的數(shù)據(jù)(大數(shù)據(jù))作為學習用數(shù)據(jù),則精度會提高。
作為收集大數(shù)據(jù)的方法之一,存在利用眾包(crowd-sourcing)等向第三者外包的方法。眾包是通過互聯(lián)網(wǎng)將簡單的作業(yè)(任務(wù))以低廉的價格委托給不特定的許多人(工作人員)的方法。因而,若利用眾包來進行大數(shù)據(jù)的數(shù)據(jù)收集,則能夠?qū)⑨槍?gòu)成大數(shù)據(jù)的各個數(shù)據(jù)的任務(wù)分配并委托給許多工作人員,所以能夠高效地(以比較低廉的價格在短時間內(nèi))收集大數(shù)據(jù)。
例如,專利文獻1中公開了一種通過盡量少的人數(shù)、以高作業(yè)精度實現(xiàn)眾包的技術(shù)。
現(xiàn)有技術(shù)文獻
專利文獻
專利文獻1:日本特開2013-197785號公報
技術(shù)實現(xiàn)要素:
發(fā)明要解決的問題
但是,即使使用專利文獻1所公開的技術(shù),也存在如下問題:在標注注釋的作業(yè)需要高度的識別的情況下,標注注釋的作業(yè)的精度容易出現(xiàn)眾包的工作人員的個人差異。作為標注注釋的作業(yè)需要高度的識別的情況,可舉出例如標注表示人會橫穿車輛行駛的前方而可能成為危險的危險區(qū)域的注釋。因此,在標注注釋的作業(yè)需要高度的識別的情況下,存在通過眾包得到的學習用數(shù)據(jù)的質(zhì)量會產(chǎn)生偏差這一問題。并且,在使用包含存在質(zhì)量偏差的學習用數(shù)據(jù)的大數(shù)據(jù)進行了機器學習的情況下,學習的精度不會提高。
本公開鑒于上述情況而完成,目的在于提供一種能夠抑制學習用數(shù)據(jù)的質(zhì)量偏差的圖像處理方法、圖像處理裝置及程序。
用于解決問題的技術(shù)方案
為了達成上述目的,本發(fā)明的一個技術(shù)方案的圖像處理方法包括:取得步驟,取得多個圖像,所述多個圖像是被賦予第1注釋且由搭載于車輛的車載攝像頭拍攝到的時序上連續(xù)的多個圖像,所述第1注釋表示至少一個是人物區(qū)域的兩個以上的第1區(qū)域,所述多個圖像至少包含一個以上的所述兩個以上的第1區(qū)域存在于所述車輛的行駛路徑中且所述第1區(qū)域彼此的距離為閾值以下的圖像;判定步驟,在所述取得步驟中取得的所述多個圖像中,一邊從時序上的最后的時刻的圖像開始依次回溯時刻,一邊判定所述兩個以上的第1區(qū)域各自的位置;決定步驟,確定所述多個圖像中的在所述判定步驟中判定為所述兩個以上的第1區(qū)域各自的位置不在所述行駛路徑中的最初的第1時刻的第1圖像,將所確定的所述第1圖像中的所述兩個以上的第1區(qū)域彼此之間的區(qū)域決定為第2區(qū)域;以及賦予步驟,向所述第1時刻的第1圖像賦予表示在所述決定步驟中決定出的所述第2區(qū)域的第2注釋。
此外,這些概括的或具體的方式既可以由系統(tǒng)、方法、集成電路、計算機程序或計算機可讀的cd-rom等記錄介質(zhì)來實現(xiàn),又可以由系統(tǒng)、方法、集成電路、計算機程序及記錄介質(zhì)的任意組合來實現(xiàn)。
發(fā)明的效果
根據(jù)本發(fā)明,能夠?qū)崿F(xiàn)能夠抑制學習用數(shù)據(jù)的質(zhì)量偏差的圖像處理方法等。
附圖說明
圖1是示出實施方式1中的圖像處理裝置的功能結(jié)構(gòu)的一例的圖。
圖2是示出實施方式1中的注釋部所取得的多個圖像的一例的圖。
圖3是實施方式1中的注釋部對圖2所示的多個圖像進行的圖像處理的說明圖。
圖4是實施方式1中的注釋部對圖2所示的多個圖像進行的圖像處理的一例的說明圖。
圖5是示出圖1所示的篩選部的詳細功能結(jié)構(gòu)的一例的圖。
圖6是實施方式1中的篩選部的第1篩選方法的說明圖。
圖7是實施方式1中的篩選部的第2篩選方法的說明圖。
圖8是示出實施方式1中的圖像處理裝置的篩選部的工作的流程圖。
圖9是示出實施方式1中的圖像處理裝置的注釋部中的工作的流程圖。
圖10是實施方式1的效果的說明圖。
圖11a是示出實施方式1中的注釋部所決定的第2區(qū)域的一例的圖。
圖11b是示出變形例1中的注釋部所決定的第2區(qū)域的一例的圖。
圖12是示出變形例2中的注釋部所取得的多個圖像的一例的圖。
圖13是示出變形例2中的注釋部所決定的第2區(qū)域的一例的圖。
圖14是示出變形例3中的注釋部所取得的多個圖像的一例的圖。
圖15是示出變形例3中的注釋部所決定的第2區(qū)域的一例的圖。
圖16是示出變形例4的第1例中的注釋部所賦予的第2注釋的一例的圖。
圖17是示出變形例4的第2例中的注釋部所賦予的第2注釋的一例的圖。
圖18是示出實施方式2中的判定部的詳細結(jié)構(gòu)的一例的圖。
圖19是示出實施方式2中的圖像處理裝置的判定部的工作的流程圖。
圖20是示出實施方式2中的取得部所取得的多個圖像的一例的圖。
圖21是實施方式2中的判定部對圖20所示的多個圖像進行的圖像處理的說明圖。
圖22是示出實施方式3中的圖像處理裝置的功能結(jié)構(gòu)的一例的圖。
具體實施方式
本發(fā)明的一個技術(shù)方案的圖像處理方法包括:取得步驟,取得多個圖像,所述多個圖像是被賦予第1注釋且由搭載于車輛的車載攝像頭拍攝到的時序上連續(xù)的多個圖像,所述第1注釋表示至少一個是人物區(qū)域的兩個以上的第1區(qū)域,所述多個圖像至少包含一個以上的所述兩個以上的第1區(qū)域存在于所述車輛的行駛路徑中且所述第1區(qū)域彼此的距離為閾值以下的圖像;判定步驟,在所述取得步驟中取得的所述多個圖像中,一邊從時序上的最后的時刻的圖像開始依次回溯時刻,一邊判定所述兩個以上的第1區(qū)域各自的位置;決定步驟,確定所述多個圖像中的在所述判定步驟中判定為所述兩個以上的第1區(qū)域各自的位置不在所述行駛路徑中的最初的第1時刻的第1圖像,將所確定的所述第1圖像中的所述兩個以上的第1區(qū)域彼此之間的區(qū)域決定為第2區(qū)域;以及賦予步驟,向所述第1時刻的第1圖像賦予表示在所述決定步驟中決定出的所述第2區(qū)域的第2注釋。
這樣,能夠?qū)τ绍囕d攝像頭拍攝到的多個圖像以機器的方式標注表示若是眾包的工作人員則需要高度的識別的第2區(qū)域的第2注釋。由此,能夠抑制包含該多個圖像的學習用數(shù)據(jù)的質(zhì)量偏差。
在此,例如可以是,在所述決定步驟中,進一步,確定所述兩個以上的第1區(qū)域存在于所述車輛的行駛路徑中且所述第1區(qū)域彼此的距離為所述閾值以下的第2圖像,將從所確定的所述第1圖像到所述第2圖像為止所包含的時序上連續(xù)的多個圖像中的所述兩個以上的第1區(qū)域彼此之間的區(qū)域決定為所述第2區(qū)域。
由此,能夠?qū)σ粋€以上的圖像以機器的方式標注表示第2區(qū)域的第2注釋。
另外,例如可以是,所述圖像處理方法還包括:第1篩選步驟,選擇第1篩選圖像,所述第1篩選圖像是由搭載于所述車輛的車載攝像頭拍攝到的時序上連續(xù)的、與表示所述車輛的制動強度或加速度的信息相關(guān)聯(lián)的所有圖像中的從所述車輛的制動強度或加速度比閾值大的時刻到一定期間前的時刻為止的多個圖像;和第2篩選步驟,從在所述第1篩選步驟中選擇出的所述第1篩選圖像中選擇所述多個圖像。
由此,能夠在篩選為由車載攝像頭拍攝到的多個圖像中的有可能標注表示第2區(qū)域的第2注釋的、包含被標注了表示第1區(qū)域的第1注釋的圖像的時序圖像后,以機器的方式標注表示第2區(qū)域的第2注釋。
在此,例如可以是,所述圖像處理方法還包括如下工作人員步驟:在所述第1篩選步驟之前,使眾包的工作人員對所述所有圖像賦予表示存在于圖像中的所述第1區(qū)域的第1注釋。
另外,例如可以是,所述圖像處理方法還包括如下工作人員步驟:在所述第2篩選步驟之前,使眾包的工作人員對在所述第1篩選步驟中選擇出的所述第1篩選圖像賦予表示存在于該第1篩選圖像中的所述第1區(qū)域的第1注釋。
由此,能夠使眾包的工作人員賦予表示存在于圖像中的第1區(qū)域的第1注釋。
在此,例如可以是,所述兩個以上的第1區(qū)域分別是表示人物的人物區(qū)域。
由此,能夠?qū)⒌?區(qū)域作為在車輛行駛時有可能與人物碰撞的危險區(qū)域,以機器的方式標注表示第2區(qū)域的第2注釋。
另外,例如可以是,所述兩個以上的第1區(qū)域包括表示人物的人物區(qū)域和表示駐停車中的汽車的汽車區(qū)域。
由此,能夠?qū)⒌?區(qū)域作為在車輛行駛時有可能碰撞的危險區(qū)域,以機器的方式標注表示第2區(qū)域的第2注釋。
另外,例如可以是,所述第2區(qū)域是若所述兩個以上的第1區(qū)域所示的物體彼此接近則至少一個所述物體會橫穿所述車輛的前方而有可能與所述車輛碰撞的危險區(qū)域,所述圖像處理方法還包括如下危險度賦予步驟:使在所述賦予步驟中賦予的所述第2注釋還包含所述第2區(qū)域的面積越小則成為越高的值的危險度。
由此,能夠使表示作為車輛行駛時的危險區(qū)域的第2區(qū)域的第2注釋還包含危險度。
另外,例如可以是,所述第2區(qū)域是若所述兩個以上的第1區(qū)域所示的物體彼此接近則至少一個所述物體會橫穿所述車輛的前方而有可能與所述車輛碰撞的危險區(qū)域,所述圖像處理方法還包括如下危險度賦予步驟:使在所述賦予步驟中賦予的所述第2注釋還包含危險度,所述危險度在構(gòu)成所述第2區(qū)域的一側(cè)區(qū)域及另一側(cè)區(qū)域中不同,所述危險度在夾著所述第2區(qū)域的兩個所述第1區(qū)域中移動的大小大的所述第1區(qū)域所在側(cè)的所述一側(cè)區(qū)域或所述另一側(cè)區(qū)域成為高的值。
由此,能夠使表示作為車輛行駛時的危險區(qū)域的第2區(qū)域的第2注釋還包含危險度。
另外,例如可以是,所述判定步驟包括:第1判定步驟,在所述取得步驟中取得的多個圖像中,一邊從時序上的最后的時刻的圖像開始依次回溯時刻,一邊判定未被賦予所述第1注釋的最初的圖像;和第2判定步驟,對于在所述第1判定步驟中判定出的所述最初的圖像的第3時刻的時序上的下一時刻的圖像中的所述第1區(qū)域,一邊從所述第3時刻的圖像開始按照時序依次回溯時刻,一邊通過圖像處理判定在沿朝向與所述車輛的移動方向垂直的方向的方向挪動后的該圖像各自中的位置是否存在所述第1區(qū)域。
由此,即使在未標注應(yīng)該對一部分圖像標注的表示第1區(qū)域的第1注釋的情況下,也能夠通過圖像處理來判定在該一部分圖像中是否存在第1區(qū)域。由此,能夠進一步標注表示需要高度的識別的第2區(qū)域的第2注釋,所以能夠抑制包含該多個圖像的學習用數(shù)據(jù)的質(zhì)量偏差。
另外,本發(fā)明的一個技術(shù)方案的圖像處理裝置具備:取得部,取得多個圖像,所述多個圖像是被賦予第1注釋且由搭載于車輛的車載攝像頭拍攝到的時序上連續(xù)的多個圖像,所述第1注釋表示至少一個是人物區(qū)域的兩個以上的第1區(qū)域,所述多個圖像至少包含一個以上的所述兩個以上的第1區(qū)域存在于所述車輛的行駛路徑中且所述第1區(qū)域彼此的距離為閾值以下的圖像;判定部,在所述取得部取得的所述多個圖像中,一邊從時序上的最后的時刻的圖像開始依次回溯時刻,一邊判定所述兩個以上的第1區(qū)域各自的位置;決定部,確定所述多個圖像中的在所述判定部中判定為所述兩個以上的第1區(qū)域各自的位置不在所述行駛路徑中的最初的第1時刻的第1圖像,將所確定的所述第1圖像中的所述兩個以上的第1區(qū)域彼此之間的區(qū)域決定為第2區(qū)域;以及賦予部,向所述第1時刻的第1圖像賦予表示由所述決定部決定出的所述第2區(qū)域的第2注釋。
此外,這些總體的或具體的技術(shù)方案可以由系統(tǒng)、方法、集成電路、計算機程序或計算機可讀的cd-rom等記錄介質(zhì)來實現(xiàn),也可以由系統(tǒng)、方法、集成電路、計算機程序或記錄介質(zhì)的任意組合來實現(xiàn)。
以下,參照附圖,對本發(fā)明的一個技術(shù)方案的圖像處理方法等進行具體說明。此外,以下說明的實施方式均示出本發(fā)明的一個具體例。在以下的實施方式中示出的數(shù)值、形狀、材料、結(jié)構(gòu)要素、結(jié)構(gòu)要素的配置位置等只是一例,并非旨在對本發(fā)明進行限定。另外,關(guān)于以下的實施方式中的結(jié)構(gòu)要素中未記載于表示最上位概念的獨立權(quán)利要求的結(jié)構(gòu)要素,作為任意的結(jié)構(gòu)要素來進行說明。另外,在所有實施方式中,也能夠?qū)Ω髯缘膬?nèi)容進行組合。
(實施方式1)
[圖像處理裝置10的結(jié)構(gòu)]
圖1是示出實施方式1中的圖像處理裝置10的功能結(jié)構(gòu)的一例的圖。
圖像處理裝置10對存儲于存儲部20的注釋賦予數(shù)據(jù)進行進一步以機器的方式標注若是工作人員則需要高度的識別的注釋的圖像處理,并作為學習用數(shù)據(jù)向存儲部30輸出。在本實施方式中,注釋賦予數(shù)據(jù)是由眾包的工作人員賦予了表示在圖像中明確地存在的人物(人物區(qū)域)的注釋(第1注釋)的、由車載攝像頭拍攝到的多個圖像。此外,在人物明確地存在于圖像中的情況下標注注釋這一工作不要求工作人員進行高度的識別,所以不容易出現(xiàn)工作人員的個人差異,質(zhì)量不存在偏差。
在本實施方式中,如圖1所示,圖像處理裝置10具備注釋部11、篩選部12和存儲部13。以下,對各結(jié)構(gòu)要素進行詳細說明。
[注釋部11]
圖2是示出實施方式1中的注釋部11所取得的多個圖像的一例的圖。圖3及圖4是示出實施方式1中的注釋部11對圖2所示的多個圖像進行的圖像處理的一例的說明圖。
如圖1所示,注釋部11具備取得部111、判定部112、決定部113和賦予部114。
(取得部111)
取得部111取得多個圖像,該多個圖像是被賦予表示至少一個是人物區(qū)域的兩個以上的第1區(qū)域的第1注釋且由搭載于車輛的車載攝像頭拍攝到的時序上連續(xù)的、至少包含一個以上的該兩個以上的第1區(qū)域存在于車輛的行駛路徑中且第1區(qū)域彼此的距離為閾值以下的圖像的多個圖像。以下,假設(shè)兩個以上的第1區(qū)域分別是表示人物的人物區(qū)域來進行說明。
在本實施方式中,取得部111從存儲部13取得例如圖2所示的在時序上連續(xù)的多個圖像那樣的被標注了表示第1區(qū)域的第1注釋的數(shù)據(jù)。
在此,使用圖2對時序上連續(xù)的多個圖像進行說明。
圖2所示的多個圖像,是構(gòu)成學習用數(shù)據(jù)的多個圖像的一部分,例如是構(gòu)成由搭載于車輛的車載攝像頭拍攝到的影像的一部分的時序上連續(xù)的多個圖像。更具體而言,圖2所示的多個圖像,由幀101a、幀101b、幀101c、幀101d等構(gòu)成。在該多個圖像的各圖像中包含(映現(xiàn)有)道路1011和人物60及人物61。通常,在構(gòu)成由車載攝像頭拍攝到的影像的圖像中,汽車等車輛的運動比人物60及人物61的運動大(快),所以在該多個圖像中,人物60及人物61正在遠離(或正在接近)。
而且,對該多個圖像(幀101a~幀101d)賦予了第1區(qū)域(第1注釋)。在此,第1區(qū)域(第1注釋)是表示明確地存在的人物60及人物61的人物區(qū)域。并且,例如在幀101d和幀101c(該多個圖像中的一個以上的圖像)中,表示人物60及人物61的兩個第1區(qū)域存在于車輛的行駛路徑即道路1011中,該兩個第1區(qū)域彼此的距離為閾值以下。在此,閾值例如可以是人物的一人寬度以下,也可以是零距離。
(判定部112)
判定部112在取得部111所取得的多個圖像中,一邊從時序上的最后的時刻的圖像起依次回溯時刻,一邊判定兩個以上的第1區(qū)域各自的位置。
在本實施方式中,判定部112例如在圖2所示的多個圖像中,按照幀101d、幀101c、幀101b、幀101a的順序,基于對各個圖像(幀)標注的第1注釋來判定兩個第1區(qū)域各自的位置。例如,由于對幀101d標注了兩個第1注釋,所以判定部112判定為在幀101d中存在兩個第1區(qū)域,并判定表示存在于幀101d中的兩個第1區(qū)域的框的位置和大小。判定部112針對幀101c~幀101a也按該順序進行同樣的判定,由于與上述相同,所以省略說明。
(決定部113)
決定部113確定多個圖像中由判定部112判定為兩個以上的第1區(qū)域各自的位置不在行駛路徑中的最初的第1時刻的第1圖像。然后,決定部113將確定出的第1圖像中的該兩個以上的第1區(qū)域彼此之間的區(qū)域決定為第2區(qū)域。此外,決定部113也可以進一步確定該兩個以上的第1區(qū)域存在于車輛的行駛路徑中且該第1區(qū)域彼此的距離為閾值以下的第2圖像。在該情況下,決定部113將從所確定的第1圖像到第2圖像為止所包含的時序上連續(xù)的多個圖像中的該兩個以上的第1區(qū)域彼此之間的區(qū)域決定為第2區(qū)域即可。
在本實施方式中,如圖3所示,決定部113確定在圖2所示的多個圖像中由判定部112判定為表示人物60的第1區(qū)域和表示人物61的第1區(qū)域各自的位置不在道路1011中的最初的時刻t1的幀101b(第1圖像)。然后,決定部113將所確定的幀101b中的表示人物60的第1區(qū)域與表示人物61的第1區(qū)域之間的區(qū)域決定為第2區(qū)域。在此,第2區(qū)域意味著在車輛行駛時有可能與第1區(qū)域所示的人物等物體碰撞的危險區(qū)域。
此外,決定部113進一步將幀101d(或幀101c)確定為表示人物60的第1區(qū)域和表示人物61的第1區(qū)域存在于車輛的行駛路徑即道路1011中且這些第1區(qū)域彼此的距離為閾值以下的第2圖像。在該情況下,決定部113將從第1圖像即幀101b到第2圖像即幀101d為止所包含的多個圖像即幀101b~幀101d中的表示人物60的第1區(qū)域與表示人物61的第1區(qū)域之間的區(qū)域決定為第2區(qū)域。
這樣,決定部113能夠?qū)σ粋€以上的圖像以機器的方式?jīng)Q定第2區(qū)域。
(賦予部114)
賦予部114賦予表示由決定部113決定出的第2區(qū)域的第2注釋。
在本實施方式中,賦予部114將表示由決定部113決定出的第2區(qū)域的第2注釋例如向圖4所示的圖像賦予。另外,賦予部114將標注了第2注釋的多個圖像(對注釋賦予數(shù)據(jù)進一步標注了第2注釋后的圖像)作為學習用數(shù)據(jù)而輸出至存儲部30。
此外,注釋部11也可以不輸出多個圖像。在該情況下,賦予部114例如輸出表示人物60、61的第1區(qū)域的坐標值和第2區(qū)域的坐標值等與應(yīng)該標注注釋的多個圖像相關(guān)的信息即可。
[篩選部12的結(jié)構(gòu)]
圖5是示出圖1所示的篩選部12的詳細功能結(jié)構(gòu)的一例的圖。圖6是實施方式1中的篩選部12的第1篩選方法的說明圖。圖7是實施方式1中的篩選部12的第2篩選方法的說明圖。
如圖5所示,篩選部12具備第1篩選部121和第2篩選部122。
篩選部12將從存儲部20取得的注釋賦予數(shù)據(jù)篩選為預(yù)定的時序圖像,并保存于存儲部13。在此,預(yù)定的時序圖像是指有可能標注危險區(qū)域的時序圖像,該危險區(qū)域是在車輛行駛時若人物彼此接近則會橫穿車輛的前方而有可能與車輛碰撞的、若是工作人員則需要高度的識別的危險區(qū)域。
在本實施方式中,存儲部20由hdd(harddiskdrive)和存儲器等構(gòu)成,存儲有由眾包的工作人員標注了注釋的數(shù)據(jù)(注釋賦予數(shù)據(jù))。
更具體而言,注釋賦予數(shù)據(jù)是由搭載于車輛的車載攝像頭拍攝到的時序上連續(xù)的、與表示車輛的制動強度或加速度的信息相關(guān)聯(lián)的所有圖像。另外,關(guān)于注釋賦予數(shù)據(jù),由眾包的工作人員在該所有圖像中標注了表示作為在圖像中存在的人物區(qū)域的第1區(qū)域的第1注釋。
第1篩選部121將存儲于存儲部20的作為注釋賦予數(shù)據(jù)的所有圖像通過制動信息等而篩選為例如如圖6所示的與第1期間相關(guān)聯(lián)的多個圖像(第1篩選圖像)。更具體而言,第1篩選部121選擇由搭載于車輛的車載攝像頭拍攝到的時序上連續(xù)的與表示車輛的制動強度或加速度的信息相關(guān)聯(lián)的所有圖像中的、作為從該車輛的制動強度或加速度比閾值大的時刻到一定期間前的時刻為止的多個圖像的第1篩選圖像。
然后,第2篩選部122從由第1篩選部121選擇出的第1篩選圖像中篩選出上述的多個圖像。在本實施方式中,第2篩選部122進一步通過圖像處理等對由第1篩選部121篩選出的多個圖像(第1篩選圖像)進行篩選。更具體而言,第2篩選部122篩選為如下的多個圖像,該多個圖像例如如圖7的幀101d所示,是被賦予了表示示出人物60、61的兩個第1區(qū)域的第1注釋且由搭載于車輛的車載攝像頭拍攝到的時序上連續(xù)的、至少包含該兩個第1區(qū)域存在于道路1011中且第1區(qū)域彼此的距離為閾值以下的一個以上的圖像的多個圖像。
然后,第2篩選部122將篩選出的該多個圖像存儲于存儲部13。
[存儲部13]
存儲部13由hdd(harddiskdrive)和存儲器等構(gòu)成。存儲部13存儲有由篩選部12篩選出的多個圖像。
[圖像處理裝置10的工作]
接著,使用圖8及圖9,對如以上那樣構(gòu)成的圖像處理裝置10的工作進行說明。
圖8是示出實施方式1中的圖像處理裝置10的篩選部12的工作的流程圖。
在圖8中,首先,圖像處理裝置10的篩選部12從存儲部20取得注釋賦予數(shù)據(jù)。
接著,篩選部12進行通過制動信息等對所取得的注釋賦予數(shù)據(jù)進行篩選的第1篩選處理(s90)。具體而言,如上所述,篩選部12選擇由搭載于車輛的車載攝像頭拍攝到的時序上連續(xù)的與表示車輛的制動強度或加速度的信息相關(guān)聯(lián)的所有圖像中的、作為從該車輛的制動強度或加速度比閾值大的時刻到一定期間前的時刻為止的多個圖像的第1篩選圖像。
接著,篩選部12進行進一步通過圖像處理等對在s90中篩選出的第1篩選圖像進行篩選的第2篩選處理(s91)。更具體而言,如上所述,篩選部12選擇由第1篩選處理篩選出的第1篩選圖像中的多個圖像,該多個圖像是被賦予了表示示出人物的兩個第1區(qū)域的第1注釋且由搭載于車輛的車載攝像頭拍攝到的時序上連續(xù)的、至少包含該兩個第1區(qū)域存在于行駛路徑中且第1區(qū)域彼此的距離為閾值以下的一個以上的圖像的多個圖像。然后,將由第2篩選處理選擇出(篩選出)多個圖像存儲于存儲部13。
圖9是示出實施方式1中的圖像處理裝置10的注釋部11中的工作的流程圖。
在圖9中,首先,圖像處理裝置10的注釋部11進行取得處理:從存儲部13取得由第2篩選處理篩選出的多個圖像(s101)。
接著,注釋部11進行判定處理:一邊在s101中取得的多個圖像的各個圖像中從時序上的最后的時刻的圖像開始依次回溯時刻,一邊判定兩個以上的第1區(qū)域各自的位置(s102)。
接著,注釋部11進行決定處理:確定在s102中在多個圖像中被判定為兩個以上的第1區(qū)域各自的位置不在行駛路徑中的最初的第1時刻的第1圖像,并將所確定的第1圖像中的該兩個以上的第1區(qū)域彼此之間的區(qū)域決定為第2區(qū)域(s103)。
接著,注釋部11進行賦予處理:賦予表示在s103中決定出的第2區(qū)域的第2注釋(s104)。然后,注釋部11將賦予了第2注釋的多個圖像作為學習用數(shù)據(jù)向存儲部30輸出。
這樣,圖像處理裝置10能夠?qū)Υ鎯τ诖鎯Σ?0的注釋賦予數(shù)據(jù)進行進一步以機器的方式標注若是工作人員則需要高度的識別的注釋的圖像處理,并作為學習用數(shù)據(jù)向存儲部30輸出。
此外,在上述,雖然說明為圖像處理裝置10使用存儲于存儲部20的注釋賦予數(shù)據(jù)來進行第1篩選處理(s90)及第2篩選處理(s91),但不限于此。即,雖然說明為圖像處理裝置10在第1篩選處理(s90)之前使眾包的工作人員對所有圖像賦予表示作為存在于圖像中的人物區(qū)域的第1區(qū)域的第1注釋并生成了注釋賦予數(shù)據(jù),但不限于此。
也就是說,也可以是,圖像處理裝置10取得未被賦予注釋的由車載攝像頭拍攝到的時序上連續(xù)的所有圖像,并對所取得的所有圖像進行第1篩選處理(s90)。在該情況下,使眾包的工作人員對進行了第1篩選處理后的多個圖像(第1篩選圖像)賦予表示示出是存在于圖像中的運動物體的區(qū)域的注釋即可。即,圖像處理裝置10在第2篩選處理(s91)之前使眾包的工作人員對在第1篩選處理(s90)中選擇出的第1篩選圖像賦予表示作為存在于該第1篩選圖像中的人物區(qū)域的第1區(qū)域的第1注釋即可。
[效果等]
如上述那樣,根據(jù)本實施方式,能夠?qū)崿F(xiàn)能夠抑制包含該多個圖像的學習用數(shù)據(jù)的質(zhì)量偏差的圖像處理方法等。
在此,使用圖10對本實施方式的圖像處理方法等的效果進行說明。圖10是實施方式1的效果的說明圖。圖10的(a)所示的多個圖像是由搭載于車輛的車載攝像頭對前方(行駛方向)進行拍攝而得到的時序上連續(xù)的多個圖像的一例。在圖10的(b)中示出了與圖10的(a)所示的多個圖像分別相關(guān)聯(lián)的制動強度或加速度。此外,對與圖2等同樣的要素標注了同一標號,省略詳細的說明。
從圖10的(a)及(b)可知如下情形:該搭載有車載攝像頭的車輛的駕駛員在時刻tp的幀101c中開始看見人物60及人物61接近而橫穿車輛的前方,進行緊急制動而加速度正在變化,以便避免該車輛與人物60及人物61相撞。
于是,為了將在人物60及人物61接近時會橫穿車輛的前方而在車輛行駛時成為危險區(qū)域的人物60及人物61之間的區(qū)域通知給車輛的駕駛員,需要使用將該危險區(qū)域作為注釋(正確解答信息)標注的圖像來進行學習處理。
但是,若因為當人物彼此接近時會橫穿車輛的前方而在車輛行駛時變得危險,所以這些人物之間的區(qū)域是車輛不能通過的危險區(qū)域,則眾包的工作人員的識別情況容易產(chǎn)生工作人員的個人差異。因而,對這樣的危險區(qū)域標注注釋的作業(yè),容易出現(xiàn)工作人員的個人差異。這是因為,例如觀察圖10的(a)所示的時刻t1的幀101b,將人物60及人物61之間的區(qū)域識別為當人物60及人物61接近時會橫穿車輛的前方而在車輛行駛時是危險區(qū)域,需要經(jīng)驗和/或與下一時刻的圖像進行比較等高度的識別。
另一方面,在圖10的(a)所示的所有圖像(幀101a~幀101d)中,標注表示人物60及人物61的第1區(qū)域的注釋作業(yè),不容易出現(xiàn)眾包的工作人員的個人差異。這是因為,工作人員能夠在圖像中如所看到的那樣標注表示人物60及人物61的注釋(第1區(qū)域),所以不需要高度的識別。
由以上可知,在本實施方式的圖像處理方法中,使眾包的工作人員在由車載攝像頭拍攝到的時序圖像中進行表示圖像內(nèi)看到的人物等物體的注釋即可。
并且,使圖像處理裝置10或執(zhí)行圖像處理方法的計算機等機器進行表示當人物彼此接近時會橫穿車輛的前方而在車輛行駛時成為危險區(qū)域的人物彼此之間的區(qū)域(第2區(qū)域)的注釋的賦予即可。具體而言,首先,篩選為多個圖像,該多個圖像是被賦予了表示示出人物的兩個第1區(qū)域的第1注釋且由搭載于車輛的車載攝像頭拍攝到的時序上連續(xù)的、至少包含該兩個第1區(qū)域存在于該車輛的行駛路徑中且第1區(qū)域彼此的距離為閾值以下的一個以上的圖像的多個圖像。然后,在該多個圖像中,一邊回溯時序上的時刻,一邊確定判定為該兩個第1區(qū)域各自的位置不在行駛路徑中的最初的時刻的第1圖像,將確定出的第1圖像中的該兩個以上的第1區(qū)域彼此之間的區(qū)域決定為第2區(qū)域,向第1圖像賦予表示危險區(qū)域(第2區(qū)域)的第2注釋即可。
通過以上那樣,本實施方式的圖像處理方法等能夠使眾包的工作人員賦予表示作為存在于圖像中的人物區(qū)域的第1區(qū)域的第1注釋。另外,本實施方式的圖像處理方法等,能夠?qū)τ绍囕d攝像頭拍攝到的多個圖像以機器的方式標注表示若是眾包的工作人員則需要高度的識別的第2區(qū)域的第2注釋。由此,能夠抑制包含該多個圖像的學習用數(shù)據(jù)的質(zhì)量偏差。
此外,本實施方式的圖像處理方法等,確定判定為該兩個第1區(qū)域各自的位置不在行駛路徑中的最初的時刻的第1圖像,并將所確定的第1圖像中的該兩個以上的第1區(qū)域彼此之間的區(qū)域決定為第2區(qū)域,但不限于此。也可以確定分別表示人物的兩個第1區(qū)域存在于車輛的行駛路徑中且兩個第1區(qū)域彼此的距離為閾值以下的第2圖像。在該情況下,可以將包含第2圖像在內(nèi)的從第2圖像到預(yù)定時間前的圖像(例如第1圖像)中該兩個以上的第1區(qū)域彼此之間的區(qū)域決定為第2區(qū)域。
(變形例1)
圖11a是示出實施方式1中的注釋部11所決定的第2區(qū)域的一例的圖。圖11b是示出變形例1中的注釋部11所決定的第2區(qū)域的一例的圖。
在實施方式1中,如圖11a所示,第2區(qū)域作為兩個第1區(qū)域之間的二維區(qū)域而進行了說明,但不限于此。在注釋部11所取得的多個圖像所包含的兩個第1區(qū)域所示的人物分別存在距離信息的情況下,注釋部11也可以如圖11b所示那樣,將連結(jié)兩個人物(人物區(qū)域)之間的空間決定為第2區(qū)域。
(變形例2)
在實施方式1中,作為兩個以上的第1區(qū)域所表示的物體,以兩個第1區(qū)域所表示的兩個人物區(qū)域為例來進行了說明,但不限于此。兩個以上的第1區(qū)域也可以設(shè)為表示三個以上的人物區(qū)域。在本變形例中,對四個第1區(qū)域表示四人的人物區(qū)域的情況進行說明。
圖12是示出變形例2中的注釋部11所取得的多個圖像的一例的圖。圖13是示出變形例2中的注釋部11所決定的第2區(qū)域的一例的圖。
變形例2中的注釋部11取得如圖12所示的包含幀103i及幀103n的多個圖像。在圖12所示的多個圖像中分別包含道路1031和人物62、人物63、人物64及人物65。而且,對圖12所示的多個圖像賦予了表示人物62、人物63、人物64及人物65的四個第1區(qū)域(第1注釋)。
在此,變形例2中的注釋部11在圖12所示的多個圖像中,將幀103a(未圖示)確定為被判定為表示人物62~65的四個第1區(qū)域的位置不在道路1031中的最初的時刻的第1圖像。另外,變形例2中的注釋部11將時刻t2的幀103n確定為表示人物62~65的四個第1區(qū)域的位置存在于車輛的行駛路徑即道路1031中且這些第1區(qū)域彼此的距離為閾值以下的第2圖像。
然后,變形例2中的注釋部11如圖13所示那樣,例如將從作為第1圖像的幀103a到作為第2圖像的幀103n所包含的多個圖像即幀103i中的表示人物62~65的四個第1區(qū)域之間的區(qū)域決定為第2區(qū)域即可。
這樣一來,本變形例的圖像處理方法等,即使在三個以上的第1區(qū)域表示三個以上的人物區(qū)域的情況下,也能夠同樣地以機器的方式?jīng)Q定作為車輛行駛時的危險區(qū)域的第2區(qū)域,能夠以機器的方式標注表示該第2區(qū)域的第2注釋。
(變形例3)
在實施方式1及變形例1、2中,設(shè)為第1區(qū)域表示人物而進行了說明,但不限于此。第1區(qū)域所表示的物體也可以是駐停車中的汽車。在本變形例中,設(shè)為兩個第1區(qū)域的一方是人物區(qū)域,另一方是表示駐停車中的汽車的汽車區(qū)域,使用圖14及圖15來進行說明。
圖14是示出變形例3中的注釋部11所取得的多個圖像的一例的圖。圖15是示出變形例3中的注釋部11所決定的第2區(qū)域的一例的圖。
變形例3中的注釋部11取得圖14所示的包含幀104a、…、幀104i、…、幀104n的多個圖像。在圖14所示的多個圖像中分別包含道路1041和汽車66及人物67。而且,對圖14所示的多個圖像賦予了表示汽車66及人物67的兩個第1區(qū)域(第1注釋)。
變形例3中的注釋部11在圖14所示的多個圖像中,將時刻t1的幀104a確定為被判定為表示人物67的第1區(qū)域的位置不在道路1041中的最初的時刻的第1圖像。另外,變形例3中的注釋部11將時刻t2的幀104n確定為表示汽車66及人物67的兩個第1區(qū)域的位置存在于車輛的行駛路徑即道路1041中且該兩個第1區(qū)域彼此的距離為閾值以下的第2圖像。
然后,變形例3中的注釋部11如圖15的幀104i所示那樣,將例如從作為第1圖像的幀104a到作為第2圖像的幀104n所包含的多個圖像(幀104a~104n)中的表示汽車66及人物67的兩個第1區(qū)域之間的區(qū)域決定為第2區(qū)域。
這樣一來,本變形例的圖像處理方法等,即使在兩個第1區(qū)域所示的物體中的一方是駐停車中的汽車,也能夠與上述同樣地以機器的方式?jīng)Q定作為人會橫穿車輛行駛的前方、若車輛在它們之間通過則會碰撞的危險區(qū)域的第2區(qū)域,能夠以機器的方式標注表示該第2區(qū)域的第2注釋。
(變形例4)
在上述的實施方式1及變形例1~變形例3中,對注釋部11決定第2區(qū)域,并標注表示所決定的第2區(qū)域的第2注釋的情況進行了說明,但不限于此。注釋部11也可以除了決定作為對于行駛中的車輛而言的危險區(qū)域的第2區(qū)域之外,還決定第2區(qū)域的危險度。在該情況下,注釋部11賦予除了表示第2區(qū)域之外還表示其危險度的第2注釋即可。以下,對第2區(qū)域的危險度的決定方法等進行具體說明。
<第1例:危險度的決定方法>
圖16是示出變形例4的第1例中的注釋部11所賦予的第2注釋的一例的圖。
設(shè)為變形例4的第1例中的注釋部11取得了圖14所示的多個圖像,并如圖15所示那樣,決定了第2區(qū)域,該第2區(qū)域是當?shù)?區(qū)域所示的物體彼此接近時會橫穿車輛的前方,有可能與該車輛碰撞,所以是車輛行駛時的危險區(qū)域。此外,關(guān)于注釋部11決定第2區(qū)域的工作,由于在變形例3中已經(jīng)說明,所以在此省略說明。
在本變形例的第1例中,注釋部11還根據(jù)所決定的第2區(qū)域的面積來決定危險度。更具體而言,注釋部11決定第2區(qū)域的大小越小則為越高的值的危險度。這是因為,第2區(qū)域的面積越小,則當車輛在第1區(qū)域所示的汽車66及人物67之間行駛時,與汽車66及人物67碰撞的可能性越高,所以車輛不能通過。此外,在第2區(qū)域的面積為預(yù)定的面積以下的情況下,也可以決定為危險度1.0(危險度100%)。
然后,注釋部11賦予表示所決定的第2區(qū)域和該第2區(qū)域的危險度的第2注釋。更具體而言,在變形例4的第1例中,注釋部11使表示第2區(qū)域的第2注釋還包含第2區(qū)域的面積越小則呈現(xiàn)越高的值的危險度。例如在圖16所是的例子中,注釋部11對時刻t1的幀104a的第2區(qū)域賦予表示危險度0.7的第2注釋,對時刻ti的幀104i的第2區(qū)域賦予表示危險度1.0的第2注釋。此外,當車輛通過幀104i的第2區(qū)域時,必然會與人物67碰撞,所以賦予表示危險度1.0的第2注釋。
<第2例:危險度的決定方法>
圖17是示出變形例4的第2例中的注釋部11所賦予的第2注釋的一例的圖。
設(shè)為變形例4的第2例中的注釋部11也取得了圖14所示的多個圖像,并如圖15所示那樣,決定了第2區(qū)域,該第2區(qū)域是若第1區(qū)域所示的物體彼此接近則會橫穿車輛的前方,有可能與該車輛碰撞,所以是車輛行駛時的危險區(qū)域。此外,關(guān)于注釋部11決定第2區(qū)域的工作,由于在變形例3中已經(jīng)說明,所以在此也省略說明。
在本變形例的第2例中,注釋部11還將所決定的第2區(qū)域的危險度在該第2區(qū)域內(nèi)賦予權(quán)重而決定。更具體而言,注釋部11將第2區(qū)域內(nèi)劃分為兩個區(qū)域,并將賦予權(quán)重后的危險度決定為使表示更大幅移動的人物等的一方的第1區(qū)域側(cè)的區(qū)域成為比另一方的第1區(qū)域側(cè)的區(qū)域高的值。這是因為,可以說車輛在進行穿過行駛路徑的行駛時與大幅移動的人物碰撞的可能性高。
然后,注釋部11賦予表示所決定的第2區(qū)域和該第2區(qū)域的危險度的第2注釋。更具體而言,在變形例4的第2例中,注釋部11使表示第2區(qū)域的第2注釋還包含危險度,該危險度是構(gòu)成第2區(qū)域的一側(cè)區(qū)域及另一側(cè)區(qū)域不同的、夾著第2區(qū)域的兩個第1區(qū)域中移動的大小較大的第1區(qū)域所在側(cè)的一側(cè)區(qū)域或另一側(cè)區(qū)域成為更高的值的危險度。例如在圖17所示的例子中,注釋部11對時刻t1的幀104a的第2區(qū)域中的人物67附近的區(qū)域賦予表示危險度1.0的第2注釋,對該第2區(qū)域中的汽車66附近的區(qū)域賦予表示危險度0.7的第2注釋。
在此,注釋部11對時刻ti的幀104i的第2區(qū)域整體賦予表示危險度1.0的第2注釋。這是因為,上述的人物67附近的區(qū)域的面積成為了預(yù)定的面積以下。此外,在第2區(qū)域的面積為預(yù)定的面積以下的情況下,也可以不賦予上述的帶有權(quán)重的危險度,而賦予均一的危險度。
如以上那樣,根據(jù)本變形例的圖像處理方法等,能夠使表示在車輛行駛時成為危險的危險區(qū)域的第2區(qū)域的第2注釋還包含車輛行駛時的該第2區(qū)域的危險度。
(實施方式2)
在實施方式1中,說明為使眾包的工作人員在由車載攝像頭拍攝到的時序圖像中進行表示圖像內(nèi)看到的人物等物體的注釋。但是,也可考慮如下情況:由于工作人員的作業(yè)質(zhì)量不是恒定的,所以在由車載攝像頭拍攝到的時序圖像中的一部分圖像中,即使人物等物體在圖像內(nèi)看得到,也未標注表示示出該物體存在的第1區(qū)域的注釋。
以下,針對該情況,作為實施方式2,以與實施方式1不同之處為中心進行說明。
[圖像處理裝置10a的結(jié)構(gòu)]
實施方式2的圖像處理裝置10a與實施方式1的圖像處理裝置10相比,在注釋部11a的判定部112a的結(jié)構(gòu)上不同。除此以外的結(jié)構(gòu)與實施方式1的圖像處理裝置10是同樣的,所以省略說明。
[判定部112a]
圖18是示出實施方式2中的判定部112a的詳細結(jié)構(gòu)的一例的圖。
判定部112a在取得部111所取得的多個圖像中,一邊從時序上的最后的時刻的圖像起依次回溯時刻,一邊判定未被賦予第1注釋的最初的圖像。
在本實施方式中,判定部112a在取得部111所取得的多個圖像中,一邊從時序上的最后的時刻的圖像起依次回溯時刻,一邊判定未被賦予第1注釋的最初的圖像。判定部112a,對于判定出的最初的圖像的第3時刻的時序上的下一時刻的圖像中的第1區(qū)域,一邊從第3時刻的圖像起按照時序依次回溯時刻,一邊通過圖像處理判定在沿與所述車輛的移動方向垂直的方向挪動后的該圖像各自中的位置是否存在第1區(qū)域。
[圖像處理裝置10a的工作]
接著,使用圖19~圖21,對如以上那樣構(gòu)成的圖像處理裝置10a的工作進行說明。
圖19是示出實施方式2中的圖像處理裝置10a的判定部112a的工作的流程圖。圖20是示出實施方式2中的取得部111所取得的多個圖像的一例的圖。圖21是實施方式2中的判定部112a對圖20所示的多個圖像進行的圖像處理的說明圖。此外,對與圖2~圖4同樣的要素標注了同一標號,省略詳細的說明。
首先,圖像處理裝置10a的取得部111從存儲部20取得作為注釋賦予數(shù)據(jù)的多個圖像。在本實施方式中,在取得部111所取得的多個圖像的一部分圖像中,即使在圖像內(nèi)看得到人物60或人物61,也未標注表示存在人物60或人物61的第1區(qū)域(第1注釋)。在圖20所示的例子中,在一部分圖像(幀101a、幀101b)中,即使人物60或人物61在圖像(幀)內(nèi)看得到,也未標注第1區(qū)域。
接著,判定部112a進行第1判定處理:在取得部111所取得的多個圖像中,一邊從時序上的最后的時刻的圖像起依次回溯時刻,一邊判定未被賦予第1注釋的最初的圖像(s1021)。例如,判定部112a在圖20所示的多個圖像(幀101a~幀101d)中,一邊從作為時序上的最后的時刻的圖像的幀101d起依次回溯時刻,一邊判定作為未被賦予第1注釋即第1區(qū)域的最初的圖像的幀101b。
接著,判定部112a進行第2判定處理:判定部112a,對于判定出的最初的圖像的第3時刻的時序上的下一時刻的圖像中的第1區(qū)域,一邊從第3時刻的圖像起按照時序依次回溯時刻,一邊通過圖像處理判定在沿與車輛的移動方向垂直的方向挪動后的該圖像各自中的位置是否存在第1區(qū)域(s1022)。例如,如圖21所示,判定部112a,對于幀101b的時刻t3(第3時刻)的時序上的下一時刻t4的幀101c中的第1區(qū)域,一邊從時刻t3的幀101b起按照時序依次回溯時刻,一邊通過圖像處理判定在沿與車輛的移動方向垂直的方向挪動后的該圖像(幀101b~幀101a)各自中的位置是否存在第1區(qū)域。在圖21所示的例子中,判定部112a在幀101a~幀101b中通過圖像處理判定為存在第1區(qū)域。
這樣,判定部112a對取得部111所取得的多個圖像中沒有第1注釋的圖像進一步通過圖像處理來判定表示人物等的第1區(qū)域的有無。
[效果等]
如以上那樣,根據(jù)本實施方式,即使在由車載攝像頭拍攝到的多個圖像的一部分圖像中未標注表示不需要高度的識別的第1區(qū)域的第1注釋的情況下,通過一邊回放多個圖像(影像),一邊追蹤第1區(qū)域,也能夠利用圖像識別來以機器的方式判定該第1區(qū)域的有無。也就是說,即使在對一部分圖像未標注應(yīng)該標注的表示第1區(qū)域的第1注釋的情況下,也能夠通過圖像處理來判定該一部分圖像中是否存在第1區(qū)域。由此,能夠?qū)τ绍囕d攝像頭拍攝到的多個圖像以機器的方式標注表示需要高度的識別的第2區(qū)域的第2注釋,所以能夠?qū)崿F(xiàn)能夠抑制包含該多個圖像的學習用數(shù)據(jù)的質(zhì)量偏差的圖像處理方法等。
(實施方式3)
在實施方式1中,說明為使眾包的工作人員在由行車載攝像頭拍攝到的時序圖像中進行表示圖像內(nèi)能看到的人物等物體的注釋,但不限于此。也可以不是由工作人員而是由圖像處理裝置來對該時序圖像標注表示人物等的第1區(qū)域及表示該第1區(qū)域的第1注釋。
以下,針對該情況,作為實施方式3,以與實施方式1不同的方面為中心進行說明。
[圖像處理裝置10b的結(jié)構(gòu)]
圖22是示出實施方式3的圖像處理裝置10b的功能結(jié)構(gòu)的一例的圖。此外,對與圖1等同樣的要素標注了同一標號,省略詳細的說明。
圖22所示的圖像處理裝置10b與實施方式1的圖像處理裝置10相比,結(jié)構(gòu)在追加了注釋賦予部14b及存儲部20b這點上不同。除此以外的結(jié)構(gòu)與實施方式1的圖像處理裝置10是同樣的,所以省略說明。
存儲部40由hdd(harddiskdrive)或存儲器等構(gòu)成。存儲部40存儲有由車載攝像頭拍攝到的影像數(shù)據(jù)(時序圖像)。
注釋賦予部14b取得存儲于存儲部40的由車載攝像頭拍攝到的影像數(shù)據(jù)(時序圖像)。注釋賦予部14b對所取得的影像數(shù)據(jù)(時序圖像)通過進行圖像處理來標注表示圖像內(nèi)能看到的人物等物體的第1區(qū)域及表示該第1區(qū)域的注釋。注釋賦予部14b將標注有第1注釋的影像數(shù)據(jù)(時序圖像)作為注釋賦予數(shù)據(jù)向存儲部20b輸出。
存儲部20b由hdd(harddiskdrive)和/或存儲器等構(gòu)成。存儲部20b存儲由注釋賦予部14b標注了第1注釋的數(shù)據(jù)(注釋賦予數(shù)據(jù))。
[效果等]
如以上那樣,根據(jù)本實施方式,能夠不是通過眾包的工作人員而是以機器的方式(由圖像處理裝置10b)在由車載攝像頭拍攝到的影像數(shù)據(jù)(時序圖像)中標注表示不需要高度的識別的人物等的第1區(qū)域及表示該第1區(qū)域的注釋。并且,能夠?qū)τ绍囕d攝像頭拍攝到的多個圖像進一步以機器的方式標注表示需要高度的識別的第2區(qū)域的第2注釋。
這樣一來,根據(jù)本實施方式,能夠?qū)崿F(xiàn)能夠抑制包含該多個圖像的學習用數(shù)據(jù)的質(zhì)量偏差的圖像處理方法等。
以上,雖然基于實施方式對本發(fā)明的一個或多個技術(shù)方案的圖像處理方法等進行了說明,但本發(fā)明不限定于該實施方式。只要不脫離本發(fā)明的主旨,那么將本領(lǐng)域技術(shù)人員想到的各種變形對本實施方式實施后而得到的方案和/或?qū)⒉煌瑢嵤┓绞街械慕Y(jié)構(gòu)要素組合而構(gòu)建的方案也可以包含于本發(fā)明的一個或多個技術(shù)方案的范圍內(nèi)。例如,以下那樣的情況也包含于本發(fā)明。
(1)上述的各裝置,具體而言是由微處理器、rom、ram、硬盤單元、顯示器單元、鍵盤、鼠標等構(gòu)成的計算機系統(tǒng)。在所述ram或硬盤單元中存儲有計算機程序。通過所述微處理器按照所述計算機程序進行工作,各裝置達成其功能。在此,計算機程序是為了達成預(yù)定的功能而組合多個表示針對計算機的指令的命令代碼而構(gòu)成的程序。
(2)構(gòu)成上述的各裝置的結(jié)構(gòu)要素的一部分或全部也可以由一個系統(tǒng)lsi(largescaleintegration:大規(guī)模集成電路)構(gòu)成。系統(tǒng)lsi是將多個結(jié)構(gòu)部集成在一個芯片上而制造出的超多功能lsi,具體而言,是構(gòu)成為包含微處理器、rom、ram等的計算機系統(tǒng)。在所述ram中存儲有計算機程序。通過所述微處理器按照所述計算機程序進行工作,系統(tǒng)lsi達成其功能。
(3)構(gòu)成上述的各裝置的結(jié)構(gòu)要素的一部分或全部也可以由能夠相對于各裝置裝卸的ic卡或單體的模塊構(gòu)成。所述ic卡或所述模塊是由微處理器、rom、ram等構(gòu)成的計算機系統(tǒng)。所述ic卡或所述模塊也可以包含上述的超多功能lsi。通過微處理器按照計算機程序進行工作,所述ic卡或所述模塊達成其功能。該ic卡或該模塊也可以具有抗篡改性。
(4)本公開也可以是上述所示的方法。另外,也可以是由計算機實現(xiàn)這些方法的計算機程序,還可以是由所述計算機程序構(gòu)成的數(shù)字信號。
(5)另外,本公開可以是將所述計算機程序或所述數(shù)字信號記錄于計算機可讀記錄介質(zhì),例如軟盤、硬盤、cd-rom、mo、dvd、dvd-rom、dvd-ram、bd(blu-ray(注冊商標)disc)、半導體存儲器等的形態(tài)。另外,還可以是記錄于這些記錄介質(zhì)的所述數(shù)字信號。
(6)另外,本公開也可以是將所述計算機程序或所述數(shù)字信號經(jīng)由電力通信線路、無線或有線通信線路、以互聯(lián)網(wǎng)為代表的網(wǎng)絡(luò)、數(shù)據(jù)播放等來傳送的形態(tài)。
(7)另外,本公開也可以是具備微處理器和存儲器的計算機系統(tǒng),所述存儲器存儲有上述計算機程序,所述微處理器按照所述計算機程序進行工作。
(8)另外,也可以通過將所述程序或所述數(shù)字信號記錄于所述記錄媒體并轉(zhuǎn)送,或?qū)⑺龀绦蚧蛩鰯?shù)字信號經(jīng)由所述網(wǎng)絡(luò)等轉(zhuǎn)送,而由獨立的其他計算機系統(tǒng)來實施。
產(chǎn)業(yè)上的可利用性
本發(fā)明能夠利用于圖像處理方法、圖像處理裝置及其程序。尤其是,能夠利用于用于質(zhì)量均勻地制作在以機器方式學習車輛行駛時若人物彼此接近則會橫穿車輛的前方而有可能與車輛碰撞的危險區(qū)域時所使用的學習用數(shù)據(jù)的圖像處理方法、圖像處理裝置及其程序。
標號的說明
10、10a、10b圖像處理裝置;11、11a注釋部;12篩選部;13、20、20b、30、40存儲部;14b注釋賦予部;60、61、62、63、64、65、67人物;66汽車;101a、101b、101c、101d、102、102a、103a、103i、103n、104a、104i、104n幀;111取得部;112、112a判定部;113決定部;114賦予部;121第1篩選部;122第2篩選部;1011、1021、1031、1041道路。