專利名稱:數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法以及程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法以及程序,并且具體地涉及即使當實時獲取的當前位置的數(shù)據(jù)中存在間斷時也能使預測進行的數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法以及程序。
背景技術(shù):
近年來,已經(jīng)積極地進行以下研究:使用從作為可以被用戶佩戴的傳感器即可佩戴式傳感器獲取的時間序列數(shù)據(jù)對用戶的狀態(tài)進行建模和學習,并且使用通過學習獲取的模型來識別用戶的當前狀態(tài)(見PTLl和PTL2以及NPLl)。如日本專利申請第2009-180780號(在下文中,稱為在先申請I)所述,本申請人之前提出了用于隨機預測用戶在將來的預定時間點的活動狀態(tài)的多個概率的方法。利用根據(jù)在先申請I的方法,根據(jù)時間序列數(shù)據(jù)來學習用戶的活動狀態(tài)作為概率狀態(tài)轉(zhuǎn)移模型,并且使用學習到的概率狀態(tài)轉(zhuǎn)移模型來識別當前的活動狀態(tài),并且因此,可以概率性地預測用戶“在預定的時間之后”的活動狀態(tài)。在在先申請I的情況下,將對用戶“在預定的時間之后”的活動狀態(tài)進行預測的示例作為例子示出,其中使用概率狀態(tài)轉(zhuǎn)移模型來識別用戶的當前位置,在該概率狀態(tài)轉(zhuǎn)移模型中,學習了用戶的移動歷史時間序列數(shù)據(jù)(移動歷史數(shù)據(jù))以預測用戶在預定的時間之后的目的地(地點)。此外,如日本專利申請第2009-208064號(在下文中,稱為在先申請2)所述,本申請人在在先申請I上有所發(fā)展并且提出了用于即使在不存在用作為“在預定的時間之后”的從當前時間點經(jīng)過的時間的說明的情況下預測多個目的地的到達概率、路線以及時間的方法。利用根據(jù)在先申請2的方法,將“移動狀態(tài)”或者“停留狀態(tài)”的屬性添加至組成概率狀態(tài)轉(zhuǎn)移模型的狀態(tài)節(jié)點??梢酝ㄟ^在組成概率狀態(tài)轉(zhuǎn)移模型的狀態(tài)節(jié)點中搜索處于“停留狀態(tài)”的狀態(tài)節(jié)點作為用于目的地的狀態(tài)節(jié)點來自動檢測候選目的地。
如日本專利申請第2010-141946號(在下文中,稱為在先申請3)所述,當添加新的移動路線的移動歷史數(shù)據(jù)時,本申請人使得根據(jù)在先申請2的學習模型(概率狀態(tài)轉(zhuǎn)移模型)能夠被發(fā)展,由此使得有效地學習。引文列表專利文獻PTLl:日本未審查專利申請公開第2006-134080號PTL2:日本未審查專利申請公開第2008-204040號非專利文獻NPLl:^Life Patterns: structure from wearable sensors'Brian PatrickClarkson, Doctor Thesis, MIT, 200
發(fā)明內(nèi)容
技術(shù)問題
然而,利用根據(jù)在先申請3的方法,基于要被實時獲取的當前移動歷史數(shù)據(jù),在估計當前值(當前狀態(tài))之后對目的地進行預測,但是在無法獲取當前位置的數(shù)據(jù)的情況下,無法估計當前狀態(tài),并且也無法進行對目的地的預測。根據(jù)這種情況作出了本發(fā)明,使得即使當實時獲取的當前位置的數(shù)據(jù)中存在間斷時也能夠進行預測。問題解決一種根據(jù)本發(fā)明的一個方面的數(shù)據(jù)處理設(shè)備,包括:學習裝置,被配置成在要被獲取作為用于學習的數(shù)據(jù)的用戶的移動歷史數(shù)據(jù)被表示為表示所述用戶的活動的概率模型的情況下獲取概率模型的參數(shù);目的地和路線點估計裝置,被配置成估計在使用通過所述學習裝置獲取的所述參數(shù)的所述概率模型的狀態(tài)節(jié)點中的與移動目的地和路線點等效的目的地節(jié)點和路線點節(jié)
占.
預測數(shù)據(jù)生成裝置,被配置成:獲取在從現(xiàn)在起的預定時間段內(nèi)的與所述用于學習的數(shù)據(jù)不同的所述用戶的移動歷史數(shù)據(jù)作為用于預測的數(shù)據(jù);以及在所獲取的所述用于預測的數(shù)據(jù)中包括有數(shù)據(jù)缺失部分的情況下,通過插值處理來生成所述用于預測的數(shù)據(jù)中的所述數(shù)據(jù)缺失部分,并且計算與通過所述插值處理所生成的插值數(shù)據(jù)對應的實際數(shù)據(jù)的虛擬誤差;當前點估計裝置,被配置成:將其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)輸入給使用通過學習獲取的所述參數(shù)的所述概率模型;以及在與其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)對應的狀態(tài)節(jié)點序列的估計中,使用針對所述插值數(shù)據(jù)的所述虛擬誤差,將與實際數(shù)據(jù)相比數(shù)據(jù)的貢獻更小的觀測概率作為所述狀態(tài)節(jié)點的觀測概率,來估計與所述用戶的當前位置等效的當前點節(jié)點;搜索裝置,被配置成使用與所估計的所述目的地節(jié)點和所述路線點節(jié)點以及所述當前點節(jié)點有關(guān)的信息、以及通過學習獲取的所述概率模型來搜索從用戶的當前位置到目的地的路線;以及計算裝置,被配置成計算所搜索的目的地的到達概率和所需的時間。一種根據(jù)本發(fā)明的一個方面的數(shù)據(jù)處理方法,包括以下步驟:利用數(shù)據(jù)處理設(shè)備的被配置成對用戶的移動歷史數(shù)據(jù)進行處理的學習裝置,在要被獲取作為用于學習的數(shù)據(jù)的用戶的移動歷史數(shù)據(jù)被表示為表示所述用戶的活動的概率模型的情況下獲取概率模型的參數(shù);利用所述數(shù)據(jù)處理設(shè)備的目的地和路線點估計裝置,估計在使用通過所述學習裝置獲取的所述參數(shù)的所述概率模型的狀態(tài)節(jié)點中的與移動目的地和路線點等效的目的地節(jié)點和路線點節(jié)點;利用所述數(shù)據(jù)處理設(shè)備的預測數(shù)據(jù)生成裝置,獲取在從現(xiàn)在起的預定時間段內(nèi)的與所述用于學習的數(shù)據(jù)不同的所述用戶的移動歷史數(shù)據(jù)作為用于預測的數(shù)據(jù);以及在所獲取的所述用于預測的數(shù)據(jù)中包括有數(shù)據(jù)缺失部分的情況下,通過插值處理來生成所述用于預測的數(shù)據(jù)中的所述數(shù)據(jù)缺失部分,并且計算與通過所述插值處理所生成的插值數(shù)據(jù)對應的實際數(shù)據(jù)的虛擬誤差;利用所述數(shù)據(jù)處理設(shè)備的當前點估計裝置,將其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)輸入給使用通過學習獲取的所述參數(shù)的所述概率模型;以及在與其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)對應的狀態(tài)節(jié)點序列的估計中,使用針對所述插值數(shù)據(jù)的所述虛擬誤差,將與實際數(shù)據(jù)相比數(shù)據(jù)的貢獻更小的觀測概率作為所述狀態(tài)節(jié)點的觀測概率,來估計與所述用戶的當前位置等效的當前點節(jié)點;利用所述數(shù)據(jù)處理設(shè)備的搜索裝置,使用與所估計的所述目的地節(jié)點和所述路線點節(jié)點以及所述當前點節(jié)點有關(guān)的信息、以及通過學習獲取的所述概率模型來搜索從用戶的當前位置到目的地的路線;以及利用所述數(shù)據(jù)處理設(shè)備的計算裝置,計算所搜索的目的地的到達概率和所需的時間。一種根據(jù)本發(fā)明的一個方面的程序,使計算機用作為:學習裝置,被配置成在要被獲取作為用于學習的數(shù)據(jù)的用戶的移動歷史數(shù)據(jù)被表示為表示所述用戶的活動的概率模型的情況下獲取概率模型的參數(shù);目的地和路線點估計裝置,被配置成估計在使用通過所述學習裝置獲取的所述參數(shù)的所述概率模型的狀態(tài)節(jié)點中的與移動目的地和路線點等效的目的地節(jié)點和路線點節(jié)
占.
預測數(shù)據(jù)生成裝置,被配置成:獲取在從現(xiàn)在起的預定時間段內(nèi)的與所述用于學習的數(shù)據(jù)不同的所述用戶的移動歷史數(shù)據(jù)作為用于預測的數(shù)據(jù);以及在所獲取的所述用于預測的數(shù)據(jù)中包括有數(shù)據(jù)缺失部分的情況下,通過插值處理來生成所述用于預測的數(shù)據(jù)中的所述數(shù)據(jù)缺失部分,并且計算與通過所述插值處理所生成的插值數(shù)據(jù)對應的實際數(shù)據(jù)的虛擬誤差;當前點估計裝置,被配置成:將其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)輸入給使用通過學習獲取的所述參數(shù)的所述概率模型;以及在與其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)對應的狀態(tài)節(jié)點序列的估計中,使用針對所述插值數(shù)據(jù)的所述虛擬誤差,將與實際數(shù)據(jù)相比數(shù)據(jù)的貢獻更小的觀測概率作為所述狀態(tài)節(jié)點的觀測概率,來估計與所述用戶的當前位置等效的當前點節(jié)點;搜索裝置,被配置成使用與所估計的所述目的地節(jié)點和所述路線點節(jié)點以及所述當前點節(jié)點有關(guān)的信息、以及通過學習獲取的所述概率模型來搜索從所述用戶的當前位置到目的地的路線;以及計算裝置,被配置成計算所搜索的目的地的到達概率和所需的時間。在本發(fā)明的一個方面的情況下,在要被獲取作為用于學習的數(shù)據(jù)的用戶的移動歷史數(shù)據(jù)被表示為表示用戶的活動的概率模型的情況下,獲取概率模型的參數(shù),并且估計在使用通過學習裝置獲取的參數(shù)的概率模型的狀態(tài)節(jié)點中的與移動目的地和路線點等效的目的地節(jié)點和路線點節(jié)點。獲取在從現(xiàn)在起的預定時間段內(nèi)的與用于學習的數(shù)據(jù)不同的用戶的移動歷史數(shù)據(jù)作為用于預測的數(shù)據(jù),并且在所獲取的用于預測的數(shù)據(jù)中包括有數(shù)據(jù)缺失部分的情況下,通過插值處理來生成所述用于預測的數(shù)據(jù)中的數(shù)據(jù)缺失部分,以及計算與生成的插值數(shù)據(jù)對應的實際數(shù)據(jù)的虛擬誤差。將其數(shù)據(jù)缺失部分已被插值的用于預測的數(shù)據(jù)輸入給使用通過學習獲取的參數(shù)的概率模型,以及在與其數(shù)據(jù)缺失部分已被插值的用于預測的數(shù)據(jù)對應的狀態(tài)節(jié)點序列的估計中,使用針對所述插值數(shù)據(jù)的虛擬誤差,將與實際數(shù)據(jù)相比數(shù)據(jù)的貢獻更小的觀測概率作為狀態(tài)節(jié)點的觀測概率,來估計與用戶的當前位置等效的當前點節(jié)點。使用與所估計的目的地節(jié)點和路線點節(jié)點以及當前點節(jié)點有關(guān)的信息、以及通過學習獲取的概率模型來搜索從用戶的當前位置到目的地的路線,以及計算所搜索的目的地的到達概率和所需的時間。根據(jù)本發(fā)明的一個方面,即使當要被實時獲取的當前位置的數(shù)據(jù)中存在間斷時,也能作出預測。
圖1是示出本發(fā)明應用于其的預測系統(tǒng)的實施方式的配置示例的框圖。圖2是示出預測系統(tǒng)的硬件配置示例的框圖。圖3是示出移動歷史數(shù)據(jù)的示例的圖。圖4是示出HMM的示例的圖。圖5是示出從左到右型HMM的示例的圖。圖6是示出稀疏約束應用于其的HMM的示例的圖。圖7是示出學習預處理器的詳細配置示例的框圖。圖8是用于描述學習預處理器的處理的圖。圖9是用于描述學習預處理器的處理的圖。圖10是示出移動屬性識別添加單元的詳細配置示例的框圖。圖11是示出移動屬性識別單元的學習裝置的配置示例的框圖。圖12是示出在對每一個類型(category)的行為狀態(tài)進行分類的情況下的類別示例的圖。圖13是用于描述行為狀態(tài)標記單元的處理示例的圖。圖14是用于描述行為狀態(tài)標記單元的處理示例的圖。圖15是示出圖11中的行為狀態(tài)標記單元的配置示例的框圖。圖16是示出移動屬性識別單元的詳細配置示例的框圖。圖17是示出移動屬性識別單元的學習裝置的另一配置示例的框圖。圖18是示出移動屬性識別單元的另一配置示例的框圖。圖19是用于描述學習預處理器的處理的流程圖。圖20是示出圖1中的學習主處理器的詳細配置示例的框圖。圖21是示出已知/未知確定單元的詳細配置示例的框圖。圖22是用于描述由未知狀態(tài)節(jié)點添加單元對未知狀態(tài)添加模型的構(gòu)建處理的流程圖。圖23是用于描述用于未知狀態(tài)添加模型的初始概率表的圖。圖24是用于描述用于未知狀態(tài)添加模型的轉(zhuǎn)移概率表的圖。圖25是用于描述用于未知狀態(tài)添加模型的中心值表的圖。圖26是用于描述用于未知狀態(tài)添加模型的分布值表的圖。圖27是線性插值處理的虛擬誤差的圖像圖。圖28是用于描述觀測似然計算處理的流程圖。圖29是用于描述已知/未知確定處理的流程圖。圖30是示出新模型生成單元的詳細配置示例的框圖。
圖31是用于描述借助于普通HMM的學習模型與借助于新模型學習單元的學習模型之間的區(qū)別的圖。圖32是用于描述借助于普通HMM的學習模型與借助于新模型學習單元的學習模型之間的區(qū)別的圖。圖33是使用圖形模型來表示新模型學習單元的學習模型的圖。圖34是用于描述新模型學習單元的新模型學習處理的流程圖。圖35是用于描述參數(shù)重計算單元的參數(shù)重計算處理的流程圖。圖36是通過新模型生成單元進行的總體新模型生成處理的流程圖。圖37是用于描述借助于新模型連接單元的拓撲更新模型生成處理的流程圖。圖38是用于描述用于拓撲更新模型的初始概率表的圖。圖39是用于描述用于拓撲更新模型的轉(zhuǎn)移概率表的圖。圖40是用于描述用于拓撲更新模型的轉(zhuǎn)移概率表的圖。圖41是用于描述用于拓撲更新模型的轉(zhuǎn)移概率表的圖。圖42是用于描述用于拓撲更新模型的中心值表的圖。圖43是用于描述用于拓撲更新模型的分布值表的圖。圖44是通過參數(shù)更新單元進行的總體參數(shù)更新處理的流程圖。圖45是用于描述用于現(xiàn)有模型的初始概率表的圖。圖46是用于描述用于現(xiàn)有模型的轉(zhuǎn)移概率表的圖。圖47是用于描述用于現(xiàn)有模型的轉(zhuǎn)移概率表的圖。圖48是用于描述用于現(xiàn)有模型的轉(zhuǎn)移概率表的圖。圖49是用于描述用于現(xiàn)有模型的中心值表的圖。圖50是用于描述用于現(xiàn)有模型的分布值表的圖。圖51是學習主處理器的總體學習主處理的處理的流程。圖52是用于描述目的地和路線點檢測器的處理的圖。圖53是用于描述學習模塊的總體處理的流程圖。圖54是示出預測預處理器的詳細配置示例的框圖。圖55是保持插值處理的虛擬誤差的圖像圖。圖56是指示在插值處理之后的移動歷史數(shù)據(jù)和虛擬誤差序列數(shù)據(jù)的圖。圖57是根據(jù)移動方式的虛擬誤差的圖像圖。圖58是用于描述借助于預測數(shù)據(jù)生成單元的預測數(shù)據(jù)生成處理的流程圖。圖59是示出預測主處理器的詳細配置示例的框圖。圖60是用于描述樹型搜索處理的流程圖。圖61是用于進一步描述樹型搜索處理的圖。圖62是用于進一步描述樹型搜索處理的圖。圖63是示出樹型搜索處理中的搜索結(jié)果列表的圖。圖64是用于描述代表路線選擇處理的流程圖。圖65是用于描述預測模塊的總體處理的流程圖。圖66是示出本發(fā)明應用于其的計算機的實施方式的配置示例的框圖。
具體實施例方式[預測系統(tǒng)的配置示例]圖1示出了本發(fā)明應用于其的預測系統(tǒng)的實施方式的配置示例。圖1中的預測系統(tǒng)I配置有學習模塊11、用戶模型參數(shù)存儲單元(model-parameter-by-user storage unit) 12 以及預測模塊 13。給學習模塊11提供時間序列數(shù)據(jù),該時間序列數(shù)據(jù)指示在傳感器設(shè)備(未示出)如GPS (全球定位系統(tǒng))傳感器等處在一段預定的時間段獲取的用戶在預定的時間點的位置(緯度和經(jīng)度)。具體地,給學習模塊11提供指示了用戶的移動路線的時間序列數(shù)據(jù)(在下文中,稱為移動歷史數(shù)據(jù)),其由以一定的時間間隔(例如15秒的間隔)依次獲取的位置(維度和經(jīng)度)和在那時的時間點的三個維度的數(shù)據(jù)組成。注意的是,根據(jù)需要,組成時間序列數(shù)據(jù)的一組緯度、經(jīng)度和時間點將被稱為三維數(shù)據(jù)。學習模塊11進行學習處理,其中,通過使用用戶的移動歷史數(shù)據(jù),用戶活動模型(表示用戶的行為和活動模式的狀態(tài)模型)被學習以作為概率狀態(tài)轉(zhuǎn)移模型。例如,可以將包括隱藏狀態(tài)的概率模型如遍歷HMM (隱式馬爾可夫模型)等用作為用于學習的概率狀態(tài)轉(zhuǎn)移模型。對于預測系統(tǒng)1,將稀疏約束應用至其的遍歷HMM用作為概率狀態(tài)轉(zhuǎn)移模型。注意的是,后面將參照圖4至圖6來描述稀疏約束應用至其的遍歷HMM、用于計算遍歷HMM的參數(shù)的方法等。用戶模型參數(shù)存儲單元12存儲了表示通過學習模塊11的學習獲取的用戶的活動模型的參數(shù)。預測模塊13從用戶模型參數(shù)存儲單元12獲取通過學習模塊11的學習獲取的用戶活動模型的參數(shù)。使用根據(jù)通過學習獲取的參數(shù)的用戶活動模型,預測模塊13使用用戶的活動模型來估計用戶的當前位置,并且還根據(jù)當前位置預測移動目的地。此外,預測模塊13還計算到預測的目的地的到達概率、路線以及到達時間(所需時間)。注意的是,目的地的個數(shù)不局限于一個,可以預測多個目的地。將描述學習模塊11和預測模塊13的細節(jié)。學習模塊11配置有歷史數(shù)據(jù)累積單元21、學習預處理器22、學習主處理器23、學習后處理器24以及目的地和路線點檢測器25。歷史數(shù)據(jù)累積單元21將要從傳感器設(shè)備提供的用戶的移動歷史數(shù)據(jù)累積(存儲)作為用于學習的數(shù)據(jù)。歷史數(shù)據(jù)累積單元21根據(jù)需要給學習預處理器22提供移動歷史數(shù)據(jù)。學習預處理器22解決由傳感器設(shè)備造成的問題。具體地,學習預處理器22通過對移動歷史數(shù)據(jù)進行組織以及還對暫時數(shù)據(jù)缺失進行插值處理等來對移動歷史數(shù)據(jù)進行插值。而且,學習預處理器22將其中用戶停留(停止)在同一地點的“停留狀態(tài)”或者其中用戶正在移動的“移動狀態(tài)”中的一個移動屬性添加至組成移動歷史數(shù)據(jù)的每一個三維數(shù)據(jù)中。將添加了移動屬性后的移動歷史數(shù)據(jù)提供給學習主處理器23以及目的地和路線點檢測器25。學習主處理器23對用戶的移動歷史進行建模作為用戶活動模型。具體地,學習主處理器23獲取在將用戶的移動歷史建模成用戶活動模型的時刻的參數(shù)。將通過學習獲取的用戶活動模型的參數(shù)提供給學習后處理器24和用戶模型參數(shù)存儲單元12。
而且,在將用戶的移動歷史學習作為用戶活動模型之后,在提供用作為用于學習的新數(shù)據(jù)的移動歷史數(shù)據(jù)的情況下,學習主處理器23獲取并且更新來自用戶模型參數(shù)存儲單元12的當前的用戶活動模型的參數(shù)。具體地,首先,學習主處理器23確定用作為用于學習的新數(shù)據(jù)的移動歷史數(shù)據(jù)是已知路線的移動歷史數(shù)據(jù)還是未知路線的移動歷史數(shù)據(jù)。在確定用于學習的新數(shù)據(jù)是已知路線的移動歷史數(shù)據(jù)的情況下,學習主處理器23更新現(xiàn)有的用戶活動模型(在下文中,簡稱為現(xiàn)有模型)的參數(shù)。另一方面,在確定用于學習的新數(shù)據(jù)是未知路線的移動歷史數(shù)據(jù)的情況下,學習主處理器23獲取用作為與未知路線的移動歷史數(shù)據(jù)對應的新模型的用戶活動模型的參數(shù)。然后學習主處理器23綜合現(xiàn)有模型的參數(shù)和新模型的參數(shù),由此生成通過連接現(xiàn)有模型和新模型獲取的更新模型?,F(xiàn)在,在下文中,將通過已知路線的移動歷史數(shù)據(jù)更新的用戶活動模型稱為參數(shù)更新模型。另一方面,將其參數(shù)通過未知路線的移動歷史數(shù)據(jù)更新的用戶活動模型稱為拓撲更新模型,這是因為拓撲也根據(jù)未知路線的擴展而更新。而且,在下文中,已知路線的移動歷史數(shù)據(jù)也被簡稱為已知的移動歷史數(shù)據(jù),而未知路線的移動歷史數(shù)據(jù)也被簡稱為未知的移動歷史數(shù)據(jù)。將參數(shù)更新模型的參數(shù)或者拓撲更新模型的參數(shù)提供給學習后處理器24和用戶模型參數(shù)存儲單元12,并且在隨后的階段,將使用更新后的用戶活動模型進行處理。學習后處理器24使用通過學習主處理器23的學習獲取的用戶活動模型,將組成移動歷史數(shù)據(jù)的每一個三維數(shù)據(jù)轉(zhuǎn)換為用戶活動模型的狀態(tài)節(jié)點。具體地,學習后處理器24生成與移動歷史數(shù)據(jù)對應的用戶活動模型的狀態(tài)節(jié)點的時間序列數(shù)據(jù)(節(jié)點序列數(shù)據(jù))。學習后處理器24將轉(zhuǎn)換后的節(jié)點序列數(shù)據(jù)提供給目的地和路線點檢測器25。目的地和路線點檢測器25將學習預處理器22提供的添加了移動屬性之后的移動歷史數(shù)據(jù)與學習后處理器24提供的節(jié)點序列數(shù)據(jù)進行相關(guān)。具體地,目的地和路線點檢測器25將用戶活動模型的狀態(tài)節(jié)點分配給組成移動歷史數(shù)據(jù)的每一個三維數(shù)據(jù)。目的地和路線點檢測器25將目的地的屬性或者路線點的屬性添加至與節(jié)點序列數(shù)據(jù)的狀態(tài)節(jié)點的其移動屬性是“停留狀態(tài)”的三維數(shù)據(jù)對應的狀態(tài)節(jié)點中。因此,將用戶的移動歷史中的預定的地點(對應的狀態(tài)節(jié)點)分配給目的地或者路線點。將關(guān)于通過目的地和路線點檢測器25添加至狀態(tài)節(jié)點的目的地或者路線點的屬性的信息提供給并且存儲在用戶模型參數(shù)存儲單元12中。預測模塊13配置有緩沖單元31、預測預處理器32、預測主處理器33以及預測后處理器34。緩沖單元31緩沖(存儲)用于預測處理的實時獲取的移動歷史數(shù)據(jù)。注意的是,對用于預測處理的移動歷史數(shù)據(jù)來說,其時間段短于在學習處理時的移動歷史數(shù)據(jù)的時間段的數(shù)據(jù)例如100步左右的移動歷史數(shù)據(jù)是足夠的。緩沖單元31不斷地存儲一段等于預定時間段的時間的最新的移動歷史數(shù)據(jù),并且當獲取新數(shù)據(jù)時刪除已存儲的數(shù)據(jù)中的最舊數(shù)據(jù)。以與學習預處理器22相同的方式,預測預處理器32解決由傳感器設(shè)備造成的問題。具體地,預測預處理器32通過對移動歷史數(shù)據(jù)進行組織以及還對暫時數(shù)據(jù)缺失進行插值處理等來對移動歷史數(shù)據(jù)進行插值。
將表示通過學習模塊11的學習獲取的用戶活動模型的參數(shù)從用戶模型參數(shù)存儲單元12提供給預測主處理器33。預測主處理器33使用由預測預處理器32提供的移動歷史數(shù)據(jù)和通過學習模塊11的學習獲取的用戶活動模型,來估計與用戶的當前位置對應的狀態(tài)節(jié)點(當前點節(jié)點)。對狀態(tài)節(jié)點的估計來說,可以使用維特比最大似然估計或者軟判決維特比估計。此外,預測主處理器33在由可以由當前點節(jié)點轉(zhuǎn)移的多個估計的狀態(tài)節(jié)點組成的樹型結(jié)構(gòu)中計算直至目的地的狀態(tài)節(jié)點(目的地節(jié)點)的節(jié)點序列及其發(fā)生概率。注意的是,路線點的節(jié)點可以包括在到目的地的狀態(tài)節(jié)點的節(jié)點序列(路線)中,并且因此,預測主處理器33還與目的地同時地預測路線點。預測后處理器34獲取到同一目的地的多個路線的選擇概率(發(fā)生概率)的和作為到目的地的到達概率。而且,預測后處理器34選擇一個或更多個的路線用作為代表到目的地的路線(在下文中,稱為代表路線),并且計算代表路線所需的時間。然后預測后處理器34輸出到目的地的預測的代表路線、到達概率以及所需時間作為預測結(jié)果。注意的是,可以將頻率而不是路線的發(fā)生概率、以及到達頻率而不是到目的地的到達概率輸出作為預測結(jié)果O[預測系統(tǒng)的硬件配置示例]按照上述配置的預測系統(tǒng)I可以使用例如圖2中示出的硬件配置。具體地,圖2是示出預測系統(tǒng)I的硬件配置示例的框圖。在圖2中,預測系統(tǒng)I配置有三個移動終端51-1至51-3和服務器52。盡管移動終端51-1至移動終端51-3是具有相同功能的同一類型的移動終端51,但是對于移動終端51-1至移動終端51-3來說,擁有這些移動終端的用戶有所不同。因此,在圖2中,僅示出了三個移動終端51-1至51-3,但是實際上,存在其個數(shù)對應于用戶個數(shù)的移動終端51。移動終端51可以通過經(jīng)由網(wǎng)絡(luò)的通信如無線通信、互聯(lián)網(wǎng)等與服務器52進行數(shù)據(jù)交換。服務器52接收移動終端51發(fā)送的數(shù)據(jù),并且對接收到的數(shù)據(jù)進行預定的處理。然后服務器52通過無線通信等將數(shù)據(jù)處理的處理結(jié)果發(fā)送給移動終端51。因此,移動終端51和服務器52具有至少借助于無線電或者線纜的通信單元。此外,可以使用其中移動終端51包括圖1中的預測模塊13并且服務器52包括圖1中的學習模塊11和用戶模型參數(shù)存儲單元12的布置。在使用該布置的情況下,例如,對于學習處理,通過移動終端51的傳感器設(shè)備獲取的移動歷史數(shù)據(jù)被傳送到服務器52?;诮邮盏降挠糜趯W習的移動歷史數(shù)據(jù),服務器52學習用戶活動模型并且將其存儲。對于預測處理,移動終端51則獲取通過學習獲取的用戶活動模型的參數(shù),根據(jù)實時獲取的移動歷史數(shù)據(jù)來估計用戶的當前節(jié)點,并且還計算目的地節(jié)點以及到該目的節(jié)點的到達概率、代表路線以及所需時間。然后移動終端51將預測結(jié)果顯示在顯示單元如未示出的液晶顯示器等上??梢园凑招枰鶕?jù)用作為數(shù)據(jù)處理設(shè)備的每一個的處理能力和通信環(huán)境來確定移動終端51和服務器52之間的角色分工。在學習處理的情況下,每一次處理所需的時間很長,但是該處理不是必須被頻繁處理。因此,一般而言,服務器52的處理能力高于便攜式移動終端51的處理能力,并且因此,服務器52可以基于每天一次左右所累積的移動歷史數(shù)據(jù)進行學習處理(參數(shù)的更新)。
另一方面,對于預測處理,希望快速進行處理并且響應于每小時實時更新的移動歷史數(shù)據(jù)顯示處理結(jié)果,并且因此,希望在移動終端51處進行預測處理。如果通信環(huán)境寬裕,則希望服務器52也進行預測處理并且單獨從服務器52接收預測結(jié)果,這會減少對其便攜性和尺寸減少有要求的移動終端51的負擔。而且,在移動終端51可以作為數(shù)據(jù)處理設(shè)備單獨高速地進行學習處理和預測處理的情況下,顯然移動終端51可以包括圖1中的預測系統(tǒng)I的所有配置。[待被輸入的移動歷史數(shù)據(jù)的示例]圖3示出了在預測系統(tǒng)I處獲取的移動歷史數(shù)據(jù)的示例。在圖3中,水平軸表示經(jīng)度,并且垂直軸表示緯度。圖3示出的移動歷史數(shù)據(jù)指示的是實驗者在持續(xù)了一個半月左右的時間中累積的移動歷史數(shù)據(jù)。如圖3所示,移動歷史數(shù)據(jù)是其中用戶主要移動到附近和四個外出目的地如工作地點等的數(shù)據(jù)。注意的是,該移動歷史數(shù)據(jù)還包括其位置由于未能捕獲衛(wèi)星而遺漏的數(shù)據(jù)。[遍歷HMM]接著,將對被預測系統(tǒng)I用作為學習模型的遍歷HMM作出描述。圖4示出了 HMM的示例。HMM是包括狀態(tài)節(jié)點以及狀態(tài)節(jié)點之間的轉(zhuǎn)移的狀態(tài)轉(zhuǎn)移模型。圖4示出了具有三個狀態(tài)的HMM的示例。
在圖4中,圓形標記表示狀態(tài)節(jié)點,并且箭頭表示狀態(tài)節(jié)點的轉(zhuǎn)移,(這與下列圖中的相同)。注意的是,在下文中,狀態(tài)節(jié)點也將被簡稱為節(jié)點或者狀態(tài)。而且,在圖4中,Si (在圖4中i=l,2,3)表示狀態(tài),并且au表示從狀態(tài)Si至狀態(tài)Sj的狀態(tài)轉(zhuǎn)移概率。此外,h (X)表示其中在至狀態(tài)S」的狀態(tài)轉(zhuǎn)移時觀測到觀測值X的輸出概率密度函數(shù),并且π i表示狀態(tài)Si為初始狀態(tài)的初始概率。注意的是,對于輸出概率密度函數(shù)bj (X),使用例如正態(tài)概率分布等。這里,用狀態(tài)轉(zhuǎn)移概率au、輸出概率密度函數(shù)bj (X)以及初始概率L來定義HMM(連續(xù)HMM)。這些狀態(tài)轉(zhuǎn)移概率au、輸出概率密度函數(shù)h (X)以及初始概率π 被稱為HMM 的參數(shù) X={aij,bj (X),j=l,2,"、M}。M 表示 HMM 的狀態(tài)的個數(shù)。至于用于估計HMM的參數(shù)λ的方法,已經(jīng)廣泛使用了鮑姆 韋爾奇最大似然估計方法(Baum-WeIch’s maximum likelihood estimating method)。鮑姆 韋爾奇最大似然估計方法是用于基于EM算法(EM (期望最大化)算法)來估計參數(shù)的方法。根據(jù)鮑姆.韋爾奇最大似然估計方法,基于待被觀測的時間序列數(shù)據(jù)X=X1, X2,…,xT,進行對HMM的參數(shù)λ的估計以便于使待被根據(jù)發(fā)生概率而獲取的似然最大化,該發(fā)生概率是將觀測到(將發(fā)生)其時間序列數(shù)據(jù)的概率。這里,xt表示在t時間點時待被觀測的信號(采樣值),并且T表示時間序列數(shù)據(jù)的長度(樣本的個數(shù))。在例如"PatternRecognition and Machine Learning (Volume2) , byC.M.Bishop, P.333 (Original English Edition:"Pattern Recognition and MachineLearningC Information Science and Statistics)'Christopher M.BishopSpringer, NewYork, 2006)(在下文中,稱為文獻A)中描述了鮑姆.韋爾奇最大似然估計方法。鮑姆.韋爾奇最大似然估計方法是基于似然最大化的參數(shù)估計方法,但是不保證最優(yōu)性,并且取決于HMM的配置和參數(shù)λ的初始值可以收斂到一個局部最優(yōu)解(局部最小值)。HMM已經(jīng)被廣泛用于音頻識別,但是在用于音頻識別的HMM的情況下,一般而言,要對狀態(tài)的個數(shù)、如何進行狀態(tài)轉(zhuǎn)移等進行預先確定。圖5示出了用于音頻識別的HMM的示例。將圖5中的HMM稱為從左到右型。在圖5中,狀態(tài)的個數(shù)為三個,狀態(tài)轉(zhuǎn)移被限制為僅允許自轉(zhuǎn)移(從狀態(tài)Si至狀態(tài)Si的狀態(tài)轉(zhuǎn)移)和從左邊到右邊相鄰狀態(tài)的狀態(tài)轉(zhuǎn)移的配置。與具有與圖5中的HMM相同的狀態(tài)轉(zhuǎn)移限制的HMM相比,將圖4中示出的沒有狀態(tài)轉(zhuǎn)移限制的HMM即其中可以進行從任意狀態(tài)Si到任意狀態(tài)S」的狀態(tài)轉(zhuǎn)移的HMM稱為遍歷(Ergodic) ΗΜΜ。遍歷HMM是具有最高靈活性配置的ΗΜΜ,但是如果狀態(tài)個數(shù)增加,則對參數(shù)λ的估計變得難以進行。例如,在遍歷HMM的狀態(tài)的個數(shù)為1000的情況下,狀態(tài)轉(zhuǎn)移的個數(shù)變?yōu)橐话偃f(=1000X1000)。因此,在這種情況下,在參數(shù)λ中,對于狀態(tài)轉(zhuǎn)移概率au,必須估計一百萬個狀態(tài)轉(zhuǎn)移概率hj。因此,例如,可以給待設(shè)定為狀態(tài)的狀態(tài)轉(zhuǎn)移施加具有稀疏(Spare)配置的約束(稀疏約束)。這里提到的稀疏配 置是下述配置,在該配置中從某一狀態(tài)出發(fā)變化的狀態(tài)是非常受限的,而不是如其中可以從任意狀態(tài)到任意狀態(tài)進行狀態(tài)轉(zhuǎn)移的遍歷HMM那樣的濃密(density)的狀態(tài)轉(zhuǎn)移?,F(xiàn)在,可以說即使在稀疏配置的情況下,存在至少一個到另一狀態(tài)的狀態(tài)轉(zhuǎn)移,而且也存在自轉(zhuǎn)移。圖6示出了已經(jīng)施加了稀疏約束的HMM。這里,在圖6中,連接兩個狀態(tài)的雙向箭頭表示從兩個狀態(tài)中的一個狀態(tài)到另一個狀態(tài)的狀態(tài)轉(zhuǎn)移,以及從所述另一個狀態(tài)到所述一個狀態(tài)的狀態(tài)轉(zhuǎn)移。而且,在圖6中,每一個狀態(tài)可以進行自轉(zhuǎn)移,并且省略了表示其自轉(zhuǎn)移的箭頭的圖。在圖6中,以網(wǎng)格的方式在二維空間上布置了 16個狀態(tài)。具體地,在圖6中,在水平方向上布置了四個狀態(tài),并且在垂直方向上也布置了四個狀態(tài)。如果說在水平方向上的相鄰狀態(tài)之間的距離和在垂直方向上的相鄰狀態(tài)之間的距離都為1,則圖6中的A示出施加了稀疏約束的HMM,其中可以進行到距離等于或者小于I的狀態(tài)的狀態(tài)轉(zhuǎn)移,并且不能進行到其他狀態(tài)的狀態(tài)轉(zhuǎn)移。而且,圖6中的B示出施加了稀疏約束的HMM,其中可以進行到距離等于或者小于V 2的狀態(tài)的狀態(tài)轉(zhuǎn)移,并且不能進行到其他狀態(tài)的狀態(tài)轉(zhuǎn)移。在圖1中的示例的情況下,對預測系統(tǒng)I提供移動歷史數(shù)據(jù)X=Xl,X2,…,χτ,并且學習模塊11使用移動歷史數(shù)據(jù)X=X1, X2,…,xT對表示用戶活動模型的HMM的參數(shù)λ進行估計。具體地,認為表示用戶的移動軌跡的在每一個時間點的位置(緯度和經(jīng)度)的數(shù)據(jù)是從地圖上的與HMM的狀態(tài)Si中的任一個狀態(tài)對應的一點起以具有預定分布值的展形(spread)而正態(tài)分布的概率變量的觀測數(shù)據(jù)。學習模塊11使地圖上的與狀態(tài)Si (中心值μ P、其分布值σ /以及狀態(tài)轉(zhuǎn)移概率au對應的一點最優(yōu)化。注意的是,可以將狀態(tài)Si的初始概率Jii設(shè)定為相同的值。例如,將M個狀態(tài)Si中的每一個狀態(tài)的初始概率π i設(shè)定為1/M。預測主處理器33將維特比算法應用到通過學習獲取的用戶活動模型(HMM)以實現(xiàn)狀態(tài)轉(zhuǎn)移處理(狀態(tài)序列)(路徑)(在下文中,也稱為最大似然路徑),來使移動歷史數(shù)據(jù)X=X1, X2,…,Xt將被觀測到的似然最大化。因此,識別出對應于用戶當前位置的狀態(tài)Si。這里提到的維特比算法是如下算法,該算法在將每一個狀態(tài)Si作為起點的狀態(tài)轉(zhuǎn)移路徑中確定路徑(最大似然路徑),以通過累積在時間點t時狀態(tài)轉(zhuǎn)移從狀態(tài)Si轉(zhuǎn)移至狀態(tài)Sj的狀態(tài)轉(zhuǎn)移概率au而使值(發(fā)生概率)最大化,并且對于其狀態(tài)轉(zhuǎn)移,在處理后的時間序列數(shù)據(jù)X的長度T期間,確定在移動歷史數(shù)據(jù)X=X1, X2,-,χτ中在時間點t時將觀測到采樣值Xt的概率(根據(jù)輸出概率密度函數(shù)bj (X)獲取的輸出概率)。在以上提及的文獻A的第347頁描述了維特比算法的細節(jié)。[學習預處理器22的配置示例]圖7是示出學習模塊11的學習預處理器22的詳細配置示例的框圖。學習預處理器22配置有數(shù)據(jù)連接/劃分單元71、異常數(shù)據(jù)移除單元72、重采樣處理單元73、移動屬性識別添加單元74以及停留狀態(tài)處理單元75。數(shù)據(jù)連接/劃分單元71進行移動歷史數(shù)據(jù)的連接和劃分處理。移動歷史數(shù)據(jù)以預定的增量如天的增量等從傳感器設(shè)備提供給數(shù)據(jù)連接/劃分單元71作為日志文件。因此,由于數(shù)據(jù)跨接(straddle)在針對一定的目的地的移動的中間,因此通過劃分可以獲取最初應當繼續(xù)的移動歷史數(shù)據(jù)。數(shù)據(jù)連接/劃分單元71連接這樣劃分的移動歷史數(shù)據(jù)。具體地,在一個日志文件中的最后一個三維數(shù)據(jù)(緯度、經(jīng)度、時間點)與在該日志文件后創(chuàng)建的日志文件中的第一個三維數(shù)據(jù)之間的時間差在預定的時間內(nèi)的情況下,數(shù)據(jù)連接/劃分單元71連接這些文件內(nèi)的移動歷史數(shù)據(jù)。此外,例如,在隧道或者地下室中GPS傳感器無法捕獲衛(wèi)星,并且因此,移動歷史數(shù)據(jù)的獲取間隔可能較長。在移動歷史數(shù)據(jù)具有長時間段的間斷的情況下,難以估計用戶在哪。因此,對于獲取的移動歷史數(shù)據(jù),在該數(shù)據(jù)之前和之后的獲取時間間隔等于或者大于預定的時間間隔(在下文中,稱為缺失閾值時間)的情況下,數(shù)據(jù)連接/劃分單元71劃分其間隔之前和之后的移動歷史數(shù)據(jù)。這里提到的缺失閾值時間例如為五分鐘、十分鐘、一小時
坐寸ο異常數(shù)據(jù)移除單元72進行移除移動歷史數(shù)據(jù)中明顯異常數(shù)據(jù)的處理。例如,在一定時間點時在某位置處的數(shù)據(jù)跳躍至距離該位置之前或之后位置IOOm或者更多的情況下,在該位置的數(shù)據(jù)為異常。因此,在一定時間點時在某位置處的數(shù)據(jù)與該位置之前和之后位置二者偏離了等于或者大于預定的距離的量的情況下,異常數(shù)據(jù)移除單元72從移動歷史數(shù)據(jù)中移除其三維數(shù)據(jù)。重采樣處理單元73以適于隨后階段的處理單元(如學習主處理器23等)的一定的時間間隔對移動歷史數(shù)據(jù)進行重采樣。注意的是,在獲取的時間間隔與期望的時間間隔一致的情況下,該處理可以省略。
此外,在獲取的時間間隔等于或者大于缺失閾值時間的情況下,移動歷史數(shù)據(jù)被數(shù)據(jù)連接/劃分單元71劃分,但是保留比缺失閾值時間短的數(shù)據(jù)的間斷。因此,重采樣數(shù)據(jù)處理單元73通過線性插值以重采樣之后的時間間隔來生成(嵌入)比缺失閾值時間短的缺失數(shù)據(jù)。例如,如果說緊接在數(shù)據(jù)缺失之前的時間點T1的三維數(shù)據(jù)為Xraaln,并且當數(shù)據(jù)獲取被恢復時在第一時間點T2的三維數(shù)據(jù)為XMalT2,則可以按照下列表達式(I)計算出在從時間點T1到時間點T2缺失的數(shù)據(jù)中的在時間點t時的三維數(shù)據(jù)xvirtualt。[公式.1]
權(quán)利要求
1.一種數(shù)據(jù)處理設(shè)備,包括: 學習裝置,被配置成在要被獲取作為用于學習的數(shù)據(jù)的用戶的移動歷史數(shù)據(jù)被表示為表示所述用戶的活動的概率模型的情況下獲取概率模型的參數(shù); 目的地和路線點估計裝置,被配置成估計在使用通過所述學習裝置獲取的所述參數(shù)的所述概率模型的狀態(tài)節(jié)點中的與移動目的地和路線點等效的目的地節(jié)點和路線點節(jié)點; 預測數(shù)據(jù)生成裝置,被配置成:獲取在從現(xiàn)在起的預定時間段內(nèi)的與所述用于學習的數(shù)據(jù)不同的所述用戶的移動歷史數(shù)據(jù)作為用于預測的數(shù)據(jù);以及在所獲取的所述用于預測的數(shù)據(jù)中包括有數(shù)據(jù)缺失部分的情況下,通過插值處理來生成所述用于預測的數(shù)據(jù)中的所述數(shù)據(jù)缺失部分,并且計算與通過所述插值處理所生成的插值數(shù)據(jù)對應的實際數(shù)據(jù)的虛擬誤差; 當前點估計裝置,被配置成:將其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)輸入給使用通過學習獲取的所述參數(shù)的所述概率模型;以及在與其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)對應的狀態(tài)節(jié)點序列的估計中,使用針對所述插值數(shù)據(jù)的所述虛擬誤差,將與實際數(shù)據(jù)相比數(shù)據(jù)的貢獻更小的觀測概率作為所述狀態(tài)節(jié)點的觀測概率,來估計與所述用戶的當前位置等效的當前點節(jié)點; 搜索裝置,被配置成使用與所估計的所述目的地節(jié)點和所述路線點節(jié)點以及所述當前點節(jié)點有關(guān)的信息、以及通過學習獲取的所述概率模型來搜索從用戶的當前位置到目的地的路線;以及 計算裝置,被配置成計算所搜索的目的地的到達概率和所需的時間。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理設(shè)備,還包括: 已知/未知確定裝置,被配置成確定通過所述當前點估計裝置獲取的所述當前點節(jié)點是已知狀態(tài)的節(jié)點還是未知狀態(tài)的節(jié)點; 其中,在所述當前點節(jié)點被確定為已知狀態(tài)的節(jié)點的情況下,所述搜索裝置搜索從用戶的當前位置到目的地的路線。
3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)處理設(shè)備,其中,所述已知/未知確定裝置基于要根據(jù)所述狀態(tài)節(jié)點的觀測概率計算的每一個狀態(tài)節(jié)點的觀測似然期望值并且使用給其添加了修正項的所述觀測似然期望值來進行已知/未知確定,其中,所述修正項對所述數(shù)據(jù)缺失部分進行修正以便獲取比實際數(shù)據(jù)更大的值。
4.根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理設(shè)備,其中,所述預測數(shù)據(jù)生成裝置對不包括當前點的過去的數(shù)據(jù)缺失部分進行線性插值,并且通過保持插值對包括當前點的數(shù)據(jù)缺失部分進行插值處理。
5.根據(jù)權(quán)利要求4所述的數(shù)據(jù)處理設(shè)備,其中,所述預測數(shù)據(jù)生成裝置針對通過所述線性插值受到插值處理的移動歷史數(shù)據(jù)計算插值數(shù)據(jù)與在緊接在數(shù)據(jù)缺失之前的移動歷史數(shù)據(jù)的距離或插值數(shù)據(jù)與在數(shù)據(jù)恢復之后緊接的移動歷史數(shù)據(jù)的距離中較小的距離作為所述虛擬誤差,并且針對通過所述保持插值受到插值處理的移動數(shù)據(jù)使用根據(jù)數(shù)據(jù)缺失后的經(jīng)過時間的預定的函數(shù)來計算所述虛擬誤差。
6.根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理設(shè)備,其中,所述學習裝置包括: 學習數(shù)據(jù)生成裝置,被配置成:在一次獲取所述概率模型的參數(shù)后作為用于學習的新數(shù)據(jù)的移動歷史數(shù)據(jù)被提供并且在所述用于學習的新數(shù)據(jù)中存在有數(shù)據(jù)缺失部分的情況下,通過插值處理來生成所述用于學習的新數(shù)據(jù)的所述數(shù)據(jù)缺失部分并且生成包括所述插值數(shù)據(jù)的所述用于學習的新數(shù)據(jù); 已知/未知確定裝置,被配置成確定包括所述插值數(shù)據(jù)的所述用于學習的新數(shù)據(jù)是已知路線的移動歷史數(shù)據(jù)還是未知路線的移動歷史數(shù)據(jù);以及 參數(shù)更新裝置,被配置成不對現(xiàn)有模型的參數(shù)的狀態(tài)節(jié)點的概率分布參數(shù)進行更新,所述現(xiàn)有模型是針對通過所述已知/未知確定裝置被確定為所述已知路線的移動歷史數(shù)據(jù)的插值數(shù)據(jù)已獲取的概率模型。
7.一種數(shù)據(jù)處理方法,包括以下步驟: 利用數(shù)據(jù)處理設(shè)備的被配置成對用戶的移動歷史數(shù)據(jù)進行處理的學習裝置,在要被獲取作為用于學習的數(shù)據(jù)的用戶的移動歷史數(shù)據(jù)被表示為表示所述用戶的活動的概率模型的情況下獲取概率模型的參數(shù); 利用所述數(shù)據(jù)處理設(shè)備的目的地和路線點估計裝置,估計在使用通過所述學習裝置獲取的所述參數(shù)的所述概率模型的狀態(tài)節(jié)點中的與移動目的地和路線點等效的目的地節(jié)點和路線點節(jié)點; 利用所述數(shù)據(jù)處理設(shè)備的預測數(shù)據(jù)生成裝置,獲取在從現(xiàn)在起的預定時間段內(nèi)的與所述用于學習的數(shù)據(jù)不同的所述用戶的移動歷史數(shù)據(jù)作為用于預測的數(shù)據(jù);以及在所獲取的所述用于預測的數(shù)據(jù)中包括有數(shù)據(jù)缺失部分的情況下,通過插值處理來生成所述用于預測的數(shù)據(jù)中的所述數(shù)據(jù)缺失部分,并且計算與通過所述插值處理所生成的插值數(shù)據(jù)對應的實際數(shù)據(jù)的虛擬誤差; 利用所述數(shù)據(jù)處理設(shè)備的當前點估計裝置,將其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)輸入給使用通過學習獲取的所述參數(shù)的所述概率模型;以及在與其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)對應的狀態(tài)節(jié)點序列的估計中,使用針對所述插值數(shù)據(jù)的所述虛擬誤差,將與實際數(shù)據(jù)相比數(shù)據(jù)的貢獻更小的觀測概率作為所述狀態(tài)節(jié)點的觀測概率,來估計與所述用戶的當前位置等效的當前點節(jié)點; 利用所述數(shù)據(jù)處理設(shè)備的搜索裝置,使用與所估計的所述目的地節(jié)點和所述路線點節(jié)點以及所述當前點節(jié)點有關(guān)的信息、以及通過學習獲取的所述概率模型來搜索從用戶的當前位置到目的地的路線;以及 利用所述數(shù)據(jù)處理設(shè)備的計算裝置,計算所搜索的目的地的到達概率和所需的時間。
8.一種程序,使計算機用作為: 學習裝置,被配置成在要被獲取作為用于學習的數(shù)據(jù)的用戶的移動歷史數(shù)據(jù)被表示為表示所述用戶的活動的概率模型的情況下獲取概率模型的參數(shù); 目的地和路線點估計裝置,被配置成估計在使用通過所述學習裝置獲取的所述參數(shù)的所述概率模型的狀態(tài)節(jié)點中的與移動目的地和路線點等效的目的地節(jié)點和路線點節(jié)點;預測數(shù)據(jù)生成裝置,被配置成:獲取在從現(xiàn)在起的預定時間段內(nèi)的與所述用于學習的數(shù)據(jù)不同的所述用戶的移動歷史數(shù)據(jù)作為用于預測的數(shù)據(jù);以及在所獲取的所述用于預測的數(shù)據(jù)中包括有數(shù)據(jù)缺失部分的情況下,通過插值處理來生成所述用于預測的數(shù)據(jù)中的所述數(shù)據(jù)缺失部分,并且計算與通過所述插值處理所生成的插值數(shù)據(jù)對應的實際數(shù)據(jù)的虛擬誤差; 當前點估計裝置,被配置成:將其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)輸入給使用通過學習獲取的所述參數(shù)的所述概率模型;以及在與其所述數(shù)據(jù)缺失部分已被插值的所述用于預測的數(shù)據(jù)對應的狀態(tài)節(jié)點序列的估計中,使用針對所述插值數(shù)據(jù)的所述虛擬誤差,將與實際數(shù)據(jù)相比數(shù)據(jù)的貢獻更小的觀測概率作為所述狀態(tài)節(jié)點的觀測概率,來估計與所述用戶的當前位置等效的當前點節(jié)點; 搜索裝置,被配置成使用與所估計的所述目的地節(jié)點和所述路線點節(jié)點以及所述當前點節(jié)點有關(guān)的信息、以及通過學習獲取的所述概率模型來搜索從所述用戶的當前位置到目的地的路線;以及 計算裝置,被配置成計算所搜索的目的地的到達概率和所需的時間。
全文摘要
本發(fā)明涉及一種即使當實時獲取的當前位置數(shù)據(jù)存在有缺失數(shù)據(jù)時也能夠進行預測的數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法以及程序。學習主處理單元(23)將作為用于學習的數(shù)據(jù)的移動歷史數(shù)據(jù)表示為表示用戶的活動的概率模型,并且導出該概率模型的參數(shù)。預測主處理單元(33)使用通過學習獲取的概率模型根據(jù)實時獲取的移動歷史數(shù)據(jù)來估計用戶的當前位置。如果實時獲取的移動歷史數(shù)據(jù)中缺失了一部分數(shù)據(jù),那么預測主處理單元(33)通過插值處理來生成缺失的數(shù)據(jù)部分,并且估計與經(jīng)插值的預測數(shù)據(jù)對應的狀態(tài)節(jié)點序列。在對狀態(tài)節(jié)點序列進行估計時,針對插值數(shù)據(jù),使用與實際數(shù)據(jù)相比數(shù)據(jù)的貢獻更小的觀測概率。本發(fā)明可應用于根據(jù)移動歷史數(shù)據(jù)來預測目的地的數(shù)據(jù)處理設(shè)備。
文檔編號G06N5/04GK103201754SQ20118005442
公開日2013年7月10日 申請日期2011年11月7日 優(yōu)先權(quán)日2010年11月18日
發(fā)明者井手直紀, 伊藤真人, 佐部浩太郎 申請人:索尼公司