亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

預測和利用地圖服務中出行時間的可變性的制作方法

文檔序號:11450827閱讀:373來源:國知局
預測和利用地圖服務中出行時間的可變性的制造方法與工藝



背景技術:

計算機驅動的地圖服務幫助用戶定位興趣點(例如,特定的建筑物、地址等)等。許多地圖服務還提供路線規(guī)劃應用,其可以建議從起點到目的地的最快或最理想的路線,并且有時甚至提供針對這些路線的預測的出行時間(例如,駕駛時間、步行時間等)。這些預測出行時間通常表示可以從歷史行程數(shù)據(jù)獲得的平均(平均)出行時間。

盡管平均出行時間提供了相當準確的出行時間的預測,但用于預測實際出行時間它不是完全準確的。換句話說,平均出行時間永遠不會一直給出完美的準確結果。至少對于車輛出行,這可能是部分由于在出行時間中由駕駛員習慣/行為的差異、交通信號的未知定時、以及不可觀測的交通、道路和/或天氣狀況(僅命名有助于駕駛時間可變性的幾個因素)引起的相當大的可變性。使用平均出行時間作為出行時間的預測不考慮出行時間的可變性,這進而負面影響用戶體驗。例如,如果預測的出行時間被低估,則用戶可能遲到,而如果預測的出行時間被高估,則用戶可能早于必要時離開,或者可能期待第三方地圖服務,希望找到具有更低的預計出行時間的路線。因此,由于出行時間預測的不準確性,建議具有低平均出行時間但出行時間中高可變性的路線的地圖服務可能導致差的用戶體驗。



技術實現(xiàn)要素:

本文描述了用于預測從起點在起始時間處開始并在目的地結束的行程的出行時間的可變性的技術和系統(tǒng)。最初,由于各種不確定性,人們可以將特定路線的出行時間認為是具有可變性的數(shù)量(即給定路線上的未來出行時間是隨機變量)。機器學習模型可以從歷史行程數(shù)據(jù)進行訓練,并且被用于預測在特定時間沿著從起點到目的地的給定路線的出行時間(的概率分布)的可變性(隨機變量)。特別地,機器學習模型方法通過使用與行程相關聯(lián)的潛在變量(或“隨機效應”)來解決本文中被稱為的“依賴性問題”,從而對構成該行程的連續(xù)路段的相互依賴性進行建模。

“依賴性問題”是指統(tǒng)一構成路線的不同路段(在下文中“路段”可以與“鏈路”互換地使用)上的駕駛時間彼此密切相關的觀測。例如,如果一個人在路線的第一路段上比通常更快地駕駛車輛,則你可能期望該人在路線上的其他路段上同樣比通常更快地駕駛車輛。同樣地,駕駛員在行程的第一路段上經歷的擁堵級別與駕駛員在第二路段、第三路段等上經歷的擁堵級別密切相關。因此,依賴性問題表示:即使在考慮一天中的時間和其他解釋因素之后,沿著路線的個體路段的出行時間是相關的。

本文公開的技術和系統(tǒng)使用機器學習方法來對行程本身內的路線路段上的出行時間的相互依賴性進行建模,和在諸如整個道路網絡的特定路段網絡中的所有路段上的相互依賴性進行建模相反。在“hofleitner,a.,herring,r.,abbeel,p.,andbayen,a.,learningthedynamicsofarterialtrafficfromprobedatausingadynamicbayesiannetwork.ieeetransactionsonintelligenttransportationsystems,pp.1679-1693,2012a”中描述的方法采用后一種方案來預測駕駛時間的可變性;即他們考慮在整個道路圖中代表每條道路路段上的交通擁堵的級別的潛在變量。當在具有復雜交通動態(tài)的高度相互連接的道路網絡中實現(xiàn)預測時,hofleitner系統(tǒng)是計算密集型的,使得這種方案僅適用于小型道路網絡。

本文公開的技術和系統(tǒng)使用機器學習模型,該機器學習模型包括與給定行程相關聯(lián)的潛在變量,從而忽略不是所考慮的行程的一部分的網絡中的剩余路段。因為潛在變量與行程而不是整個道路圖相關聯(lián),因此本文公開的系統(tǒng)比對跨在整個道路網絡中的所有路段的依賴性進行建模的系統(tǒng)(諸如上述hofleitner系統(tǒng))是計算上更高效。

此外,通過對行程內的路段相互依賴進行建模,可以對高度互連路段和復雜的交通動態(tài)(例如,商業(yè)規(guī)模的路線圖)的大型網絡進行出行時間可變性的準確預測。本文公開的技術和系統(tǒng)提供了對上述依賴問題的綜合解決方案,其導致更高精度駕駛時間可變性預測,以進一步改善用戶體驗。

此外,通過使用與行程而不是與道路網絡相關聯(lián)的潛在變量,同時在同一鏈路上出行的實體(例如,車輛)不需要具有相同的潛在變量值。對于上述hofleitner的方法不是這種情況。由于潛在變量捕獲(除了其它方面)車輛所經歷的擁堵程度,所以本文描述的機器學習模型反映了在同一路段/鏈路上的不同車道中出行的車輛可以經歷不同級別的擁堵,影響他們的個體出行時間的事實。例如,當車輛排隊起來進入特定的出口或轉彎時或者當高占用車輛(hov)車道可用時,這會發(fā)生。

包括與行程相關聯(lián)的潛在變量的機器學習模型可以從如通過從移動設備的基于位置的測量所報告的歷史行程數(shù)據(jù)進行訓練。一旦訓練,該模型可用于預測出行時間可變性。

在一些實施例中,預測行程的出行時間的可變性的計算機實現(xiàn)方法包括接收與行程相關聯(lián)的起點、目的地和開始時間;獲得從起點向目的地行進的候選路線;至少部分地基于包括與行程相關聯(lián)的潛在變量的機器學習模型,預測候選路線中的個體候選路線的出行時間的概率分布。

行程的出行時間的預測可變性可以被并入地圖服務輸出。例如,地圖服務輸出可以至少部分地基于概率分布從滿足或最小化標準(例如,出行時間的指定百分位數(shù))的候選路線中推薦一個或多個路線。地圖服務輸出可以進一步提供針對基于預測概率分布的所推薦的一個或多個路線的出行時間的測量;例如,報告出行時間的指定百分位數(shù)。通過考慮出行時間的可變性,可以建議對于用戶通常比通過最小化平均駕駛時間獲得的路線更期望的路線。此外,本文公開的系統(tǒng)和技術可以通過例如減少用戶遲到和/或過早離開的機會來改善用戶體驗。在某些情況下,出行時間的可變性的高精度預測諸如在協(xié)調緊急車輛的到達可能是非常有價值的,其可以顯著地提高關鍵患者(例如心臟病人)的存活率。

本發(fā)明內容提供以簡化的形式介紹概念的選擇,其在以下具體實施方式中進一步描述。本發(fā)明內容不旨在標識所要求保護的主題的關鍵特征或必要特征,也不旨在用于限制所要求保護的主題的范圍。

附圖說明

參照附圖描述具體實施方式。在附圖中,附圖標記的最左邊的數(shù)字標示附圖標記首次出現(xiàn)的附圖。不同附圖中相同的附圖標記指示相似或相同的項目。

圖1是具有包括與行程相關的潛在變量(“隨機效應”)的機器學習模型的計算機驅動的地圖系統(tǒng)的示例架構的示意圖。

圖2是用于預測出行時間的可變性的系統(tǒng)的示意圖。

圖3是用于基于出行時間可變性預測在顯示器上提供地圖服務輸出的示例圖形用戶界面的屏幕呈現(xiàn)。

圖4是構建可以被實現(xiàn)以預測在特定時間處的行程的出行時間的概率分布的機器學習模型的示例過程的流程圖。

圖5是預測行程的出行時間的概率分布的示例過程的流程圖。

具體實施方式

本文描述的是用于預測行程的出行時間的可變性的技術和系統(tǒng)。盡管主要在車輛出行并且特別是在汽車(例如,轎車)中出行的駕駛時間的方面討論示例,但是應當理解,本文公開的技術和系統(tǒng)可以應用于可以以某種方式被跟蹤的任何形式的出行(諸如非車輛出行(例如,經由移動或可穿戴式計算設備進行跟蹤的行走或跑步))或任何形式的車輛出行(包括但不限于公共交通(例如公共汽車、火車等)、航空出行、海上或水上出行等)。此外,本文公開的技術和系統(tǒng)可適用于涉及計算機驅動的路線規(guī)劃的任何類型的地圖服務中的實現(xiàn),包括但不限于消費者地圖服務、商業(yè)地圖服務(例如,用于出租車、公共交通等的地圖服務)、應急車隊管理、車隊決策支持系統(tǒng)(如車隊調度軟件)等。

示例系統(tǒng)

圖1是計算機驅動地圖系統(tǒng)的示例架構100的示意圖,架構100包括機器學習模型102,其包括與行程相關聯(lián)的潛在變量104(或“隨機效應104”),其允許用于解決上述“依賴性問題”以提供出行時間可變性的高精度預測??梢愿鶕?jù)歷史行程數(shù)據(jù)106來訓練機器學習模型102,以便做出出行時間可變性的這種預測,其中可變性預測可以采取出行時間的概率分布的形式。應當理解,架構100僅僅是合適的計算機驅動地圖系統(tǒng)的一個示例,并且本文所描述的技術不限于使用圖1的系統(tǒng)100的性能。

系統(tǒng)100可以包括與用戶110相關聯(lián)的計算設備108(“客戶端設備108”)。計算設備108可以被實現(xiàn)為任何類型的計算設備,包括但不限于移動電話(例如,智能手機)、膝上型計算機、便攜式數(shù)字助理(pda)、電子書(電子書)閱讀器、便攜式游戲機、便攜式媒體播放器、游戲機、機頂盒(stb)、智能電視(tv)、個人計算機、膝上型計算機、車載計算機(例如,導航單元)等。用戶110還可以與他使用的用于從一個位置運輸?shù)搅硪粋€位置的車輛112相關聯(lián)。應當理解,盡管圖1中被示出為與車輛112分離,但是計算設備108可以作為諸如導航系統(tǒng)的車載計算機的一部分集成在車輛112本身中。

如果用戶110期望在其車輛112中從起點114出行到目的地116,則用戶110可以利用計算設備108,以便在地圖上找到目的地116并且/或者計劃路線以使得從起點114到目的地116。圖1圖示了在一些情況下,如何可以存在從起點114到目的地116的多條候選路線(例如路線118a和路線118b)。因此,計算設備108可以包括一個或多個處理器120和一個或多個形式的計算機可讀存儲器122,其存儲具有預測部件126的地圖應用124,除了被存儲在存儲器122中的其它可能的模塊或程序之外。處理器120可以被配置為執(zhí)行存儲在存儲器122中的指令、應用、引擎或程序。在一些實施例中,處理器120可以包括硬件處理器,其包括但不限于硬件中央處理單元(cpu)、現(xiàn)場可編程門陣列(fpga)、復合可編程邏輯器件(cpld)、專用集成電路(asic)、片上系統(tǒng)(soc)或其組合。

計算設備108還可以包括附加數(shù)據(jù)存儲設備,諸如可移動存儲裝置和/或不可移動存儲裝置。計算機可讀介質可以包括至少兩種類型的計算機可讀介質,即計算機存儲介質和通信介質。存儲器122、可移動存儲裝置和/或不可移動存儲裝置都是計算機存儲介質的示例。計算機存儲介質可以包括用于諸如計算機可讀指令、數(shù)據(jù)結構、程序模塊或其他數(shù)據(jù)的信息的存儲的任何方法或技術實現(xiàn)的易失性和非易失性、可移除和不可移除介質。計算機存儲介質包括但不限于隨機存取存儲器(ram)、只讀存儲器(rom)、可擦除可編程只讀存儲器(eeprom)、閃速存儲器或其它存儲器技術、光盤只讀存儲器cd-rom)、dvd或其他光學存儲器、磁帶盒、磁帶、磁盤存儲裝置或其他磁存儲設備、或可用于存儲所需信息、并且可由計算設備108訪問的任何其他非傳輸介質。任何這樣的計算機存儲介質可以是計算設備108的一部分。通常,計算機存儲介質可以包括當由處理器120執(zhí)行時執(zhí)行本文所述的各種功能和/或操作的計算機可執(zhí)行指令。

相比之下,通信媒體體現(xiàn)了計算機可讀指令、數(shù)據(jù)結構、程序模塊或諸如載波的調制數(shù)據(jù)信號中的或其他傳輸機制中的其他數(shù)據(jù)。如本文所定義的計算機存儲介質不包括通信介質。

計算設備108還可以包括用于與計算設備108進行接口連接的一個或多個輸入設備。這樣的輸入設備可以包括但不限于麥克風、指點設備(例如,鼠標、操縱桿等)、物理按鈕、遙控器、像機、觸摸屏顯示器和/或任何其它合適的輸入設備。例如,用戶110可以向計算設備108的觸摸屏顯示器提供觸摸輸入以指定目的地116,供地圖應用程序124使用以規(guī)劃路線118。

地圖應用程序124可以利用由用戶110指定的信息(例如,目的地116、行程的開始時間、偏好等)以及任何其他上下文信息、諸如時間、天氣條件、交通信息、等等,以使用被配置為訪問機器學習模型102、用于做出這種預測的預測部件126來規(guī)劃路線并預測那些路線的出行時間可變性。特別地,計算設備108可以包括一個或多個通信連接,其允許計算設備108經由網絡130與一個或多個遠程計算資源128(例如,一個或多個服務器)進行通信(發(fā)送數(shù)據(jù)到/接收數(shù)據(jù)來自)。網絡126可以表示多種不同類型的有線和/或無線網絡(諸如有線網絡、因特網、局域網、移動電話網絡、廣域網或這種網絡的組合)中的任何一種或組合。

利用通過網絡130訪問機器學習模型102,預測部件126可以利用機器學習模型102對從起點114運行到目的地116的候選路線118做出出行時間可變性預測,以在指定的時間(例如,當前時間、或用戶110指定的行程的未來開始時間)完成行程。可以經由計算設備108的一個或多個輸出設備(例如但不限于顯示器、揚聲器、打印機等)向用戶110輸出一個或多個推薦路線118。例如,計算設備108的顯示器可以提供作為地圖應用124的一部分的地圖上的推薦路線118的視覺輸出。此外,駕駛時間的測量可以由地圖應用124輸出。駕駛時間的這種測量可以包括但不限于預計駕駛時間、駕駛時間的范圍、駕駛時間的百分比等等。顯示器上的輸出的形式可以是基于文本的、圖形化的或在顯示器上提供輸出的任何其它合適的方式。

轉向遠程計算資源128,將更詳細地討論構建機器學習模型102、訓練(和更新/重新訓練)機器學習模型102以及測試機器學習模型102的特征。通常,維護歷史行程數(shù)據(jù)106和機器學習模型102的遠程計算資源128被示為包括一個或多個處理器132和一個或多個形式的計算機可讀存儲器132,其可以包括參照計算設備108的處理器120和計算機可讀存儲器122的上文描述的任一指定形式。

存儲器134可以包括地圖數(shù)據(jù)136,其包括關于諸如城市的區(qū)域的地理、地理特征和/或領土邊界的任何合適的信息。地圖數(shù)據(jù)136中的地理特征可以包括道路網絡,道路網絡包括主要道路(例如高速公路、城市快速公路等)。道路網絡數(shù)據(jù)庫可以根據(jù)道路的性質和主要用途將道路分為不同級別(例如,0級-高速公路、1級–快速公路、2級-主干道路)。與道路相似的其他地理特征(例如小徑、路徑(例如,自行車路徑)等)可被存儲為路段(segment)的網絡并且類似于道路網絡分類。在這個意義上,地圖數(shù)據(jù)136在本文可以被描述為包括關于路段的網絡內的路線的數(shù)據(jù),其中多個路段可以構成兩個興趣點之間的特定路線。此外,道路可以包括多個路段或個體路段。圖1示出了路線118a包括三個路段“a、b和c”,并且路線118b包括三個路段“d、e和f”。任何兩個路段之間的接合點可以表示交叉點或決策點,其中用戶110可以選擇多個可能方向之一從該連接點行進。

存儲器134還可以包括上述歷史行程數(shù)據(jù)106(或“移動性數(shù)據(jù)106”)。可以以各種方式收集歷史行程數(shù)據(jù)106,但是通??梢詮膶嶋H上圍繞某個區(qū)域出行的用戶(例如用戶110)的設備收集。這可以通過從任何合適類型的移動計算設備(例如,移動電話、車輛的導航單元等)報告的收集數(shù)據(jù)來實現(xiàn)。在一些實施例中,圖1的計算設備108可以包括當計算設備108(由用戶110攜帶)圍繞一個區(qū)域移動時,通過網絡130報告基于位置的測量和數(shù)據(jù)的這些移動計算設備中的一個。在一些實施例中,這些基于位置的測量可以包括從移動設備(例如,移動電話、導航單元等)的gps接收器獲得的全球定位系統(tǒng)(gps)數(shù)據(jù),并且該gps數(shù)據(jù)可以包括坐標位置(例如,緯度和經度坐標)、移動設備的速度、航向和/或當進行基于位置的測量時的時間戳。然而,基于位置的測量不限于gps數(shù)據(jù),因為可以使用其他類型的數(shù)據(jù)來獲得關于與移動設備或用戶相關聯(lián)的位置和/或速度和/或時間的信息,以及除了移動計算設備之外的來源可以另外地或備選地用于從移動設備收集數(shù)據(jù)。例如,可以與獲得在得到關于特定實體的出行時間的信息中是有用的基于位置的測量有關的使用蜂窩塔數(shù)據(jù)(“ping”)、無線網絡或接入點數(shù)據(jù)(例如,wifi設備)、道路儀表(例如,傳感器、照相機等)或任何其它類似的位置收集/發(fā)射設備。應當理解,報告基于位置的測量的移動設備不必執(zhí)行地圖應用(例如地圖應用124)以便報告基于位置的測量,因為移動設備就可以周期性地報告(實時地或分批地)與移動設備相關聯(lián)的基于位置的測量序列,只要移動設備通電。此外,跟蹤用戶位置的任何數(shù)據(jù)可以被匿名化以掩蓋或隱藏用戶的身份。包括在數(shù)據(jù)中的任何標識信息可能需要用戶同意才能獲得該數(shù)據(jù)。

然后可以基于基于位置的測量來確定與移動設備相關聯(lián)的出行時間(持續(xù)時間測量)以及可能的其他統(tǒng)計??梢韵鄬︻l繁地報告基于位置的測量,以給出地圖數(shù)據(jù)136內的任何特定路線的出行時間的詳細圖片。在一些實施例中,在地圖數(shù)據(jù)136中的路線的每個路段上的移動設備的出行時間根據(jù)從移動設備收集的數(shù)據(jù)進行觀測或估計。從大量移動設備收集這樣的數(shù)據(jù)可以創(chuàng)建歷史行程數(shù)據(jù)106的大型數(shù)據(jù)庫。此外,地圖數(shù)據(jù)136中的個體路段可以與取決于移動設備穿過該路段的一天中的時間、或星期幾的不同移動設備和/或相同或不同的設備的多個不同的駕駛時間相關聯(lián)。例如,市區(qū)的乘客很容易認識到,在工作日的高峰時段的道路路段的駕駛時間可能與在午夜(或周末期間)相同路段的駕駛時間是明顯不同的。

歷史行程數(shù)據(jù)106還可以包括針對十字路口的駕駛時間,其中與十字路口相關聯(lián)的時間可能大大不同于給定變化的上下文。根據(jù)一個示例,圣誕購物季節(jié)期間中午在購物中心附近的一個十字路口左轉,與在星期二午夜在同一十字路口左轉相比時,可能花費顯著更多的時間。在一些實施例中,歷史行程數(shù)據(jù)106還可以包括附加的上下文數(shù)據(jù),諸如天氣條件、事件數(shù)據(jù)(例如專業(yè)足球游戲)以及可用于標識駕駛時間中的模式并且形成與附加的上下文數(shù)據(jù)的關聯(lián)的類似的上下文數(shù)據(jù)。

建立機器學習模型

可以使用機器學習技術來構建圖1的機器學習模型102,以便從先前觀測到的歷史行程數(shù)據(jù)106準確地確定如何準確地預測出行時間可變性(即出行時間的概率分布)。如本文所使用的機器學習可能屬于與允許計算機從觀測集中“學習”預測或解釋模型的技術的開發(fā)有關的人工智能。圖1的機器學習模型102可以是基于監(jiān)督機器學習、半監(jiān)督機器學習或無監(jiān)督機器學習的任何合適類型的機器學習模型。在一些實施例中,可以利用任何合適的機器學習方法用于優(yōu)化出行時間的可變性的預測,諸如圖形或概率模型、神經網絡、支持向量機、隨機森林、決策樹或其他機器學習算法??梢岳萌魏魏线m的學習方法,諸如極大似然估計、最大后驗估計或矩的方法或非參數(shù)估計。可以利用任何合適的計算方法,例如期望最大化(em)、期望條件最大化(ecm)、變異貝葉斯或蒙特卡羅方法。

機器學習模型102表示出行時間可變性的預測模型,其捕獲地圖中的各個道路路段上的出行時間(例如駕駛時間)的概率分布(在路段級別或鏈接級別的可變性),以及與行程相關聯(lián)的整個路線上的出行時間的概率分布(行程級別的可變性)。根據(jù)從歷史行程數(shù)據(jù)106估計的一些未知數(shù)量,模型102捕獲概率分布。模型102還捕獲不同路段上的出行時間的關系。特別地,模型102包括捕獲特定行程的不同路段上的出行時間的關系(概率依賴性)的術語(在本文中稱為“潛在變量”或“隨機效應”104),其適當?shù)亟鉀Q了“依賴性問題?!?/p>

機器學習模型102還被設計為解釋可變性一些的來源影響整個行程(例如駕駛員的習慣/行為、車輛特性等)而可變性的其他的來源是局部的(例如,由于火車穿越、施工等的延遲)的事實。因此,包括在機器學習模型102中的潛在變量104表示與行程相關聯(lián)并且影響沿著行程的出行時間可變性的未測量或不可觀測(隱藏)量或條件。行程相關聯(lián)的潛在變量104可以采取各種形式,包括但不限于:(i)個體連續(xù)值的“行程效應”,其捕獲在構成路線118的所有道路路段上特定行程比通常行程更快或更慢的程度;(ii)“自回歸”效應,其捕獲路線118中針對彼此靠近的路段的出行速度趨于相似的事實;和(iii)捕獲例如鏈路上的擁堵級別的潛在的分類變量,其依賴性可以跨鏈路被建模。個體道路路段的出行時間的概率分布以及那些駕駛時間的概率依賴性可以取決于一天中的時間、星期幾、觀測到的交通狀況、天氣情況以及的其他因素,以在模型102中指定的方式。

為了對出行時間可變性建模,針對每個行程i∈i中采用的路線的估計可以利用歷史出行數(shù)據(jù)106,意味著所穿過的鏈路(或路段)的序列ri(使得ri,k是針對每個k∈{1,…,|ri|}的網絡鏈路的集合的元素),針對每個鏈路ri,k穿過的距離di,k(使得針對除了行程的第一個和最后一個鏈路之外的所有鏈路,di,k等于鏈路ri,k的長度)和每個鏈路ri,k上的出行時間ti,k。獲得該估計被稱為“地圖匹配”。

已經獲得ti,k的數(shù)值,ti,k的模型可以表示為幾個因子的乘積,如等式(1)所示:

在等式(1)中,ei和si,k分別是與行程和行程鏈路對相關聯(lián)的正值潛在變量104(或“隨機效應104”)。潛在變量ei是前面提到的“行程效應”,該形程效應捕獲到行程i可能具有例如比行程中每個鏈接上的平均速度快10%的速度。這可能是例如由于駕駛員習慣/行為、車輛特性等引起的。潛在變量ei可以取任何正值。例如,對于每一個行程i,存在駕駛員在構成路線118的所有路段上比平常駕駛得快或比平常駕駛得慢的趨勢。這個不可觀測的數(shù)量可以在歷史行程數(shù)據(jù)106中的每次歷史行程中被估計。例如,如果在特定時間在從起點114到目的地116的歷史行程數(shù)據(jù)106中觀測到特定的過去行程,則基于行程的出行時間,可以估計行程效應ei,并且可以確定在行程的所有段上用戶開車比通???%。針對歷史行程數(shù)據(jù)106中其他歷史行程以類似方式估計該不可觀測量。在預測未來行程的出行時間的可變性時,將行程效應ei視為不確定性的來源,并且預測部件126對這個未知數(shù)量進行集成以預測路線118的出行時間的可變性。由于該行程效應ei可以取任何值,所以它具有分布(參見下面的等式(2))。

潛在變量si,k表示在考慮行程效應ei之前鏈路上的出行速度。等式(1)的模型將路線ri上的出行時間的可變性分解為兩種類型:由si,k捕獲的鏈路級可變性和由ei捕獲的和行程級可變性。ei可以以各種方式進行建模,諸如log-t分布、γ分布或非參數(shù)規(guī)范。如何對ei進行建模的一個示例是以下針對未知變量τ2

log(ei)~n(0,τ2)(2)

潛在變量si,k捕獲局部可變性,例如由于本地交通狀況或鏈路ri,k上的結構。si,k可以被建模為影響行程i中的鏈路ri,k的穿過的不可觀測的離散擁堵狀態(tài)qi,k∈{1,…,q}的函數(shù)。該擁堵狀態(tài)qi,k取決于行程,并且是上述分類潛在變量的一個示例,捕獲針對路線中彼此接近的路段的出行速度趨向于相似的事實。以這種方式,對于同時穿過相同鏈路ri,k的兩次行程,qi,k可以不同。對qi,k的條件,可以用對數(shù)正態(tài)分布對si,k進行建模,如下:

在等式(3)中,針對的μj,q和是與在條件下鏈路j上的出行速度相關聯(lián)的未知參數(shù)。

讓b(i,k)∈b是行程i開始穿過鏈路ri,k的一周的時間段(例如,星期一上午交通高峰時段)。時間段可以以任何合適的方式定義。例如,一組時間段可以包括:(i)am高峰時段-工作日7-9am;(ii)pm高峰時段–工作日3-6pm;(iii)夜間-星期日至星期四晚上7pm-6am、星期五晚上8pm-9am、星期六晚上9pm-9am;(iv)工作日白天–工作日的剩余時間;和(v)周末白天-周末的剩余時間??梢匀缦率褂冕槍矶聽顟B(tài)qi,k的markov模型:

是在時間段b∈b期間在鏈路j上開始的行程的初始擁堵狀態(tài)的未知概率向量,并且pj,b是在時間段b期間在鏈路j上的、以行程的先前鏈路中的擁堵狀態(tài)為條件的擁堵狀態(tài)的轉移矩陣。該模型捕獲了鏈路擁堵的趨勢遵循每周周期(例如在工作日高峰時段期間具有較高的擁堵概率)的事實。它還提供了第二種方式以捕獲跨鏈路的駕駛時間的依賴(除了行程效應之外)。這個qi,k的規(guī)范產生針對log(si,k)的(非標準的)高斯混合模型:

這種混合模型是非標準的,因為si,k不被直接觀測,并且由于對擁堵狀態(tài)qi,k的馬爾科夫(markov)模型。為了具有統(tǒng)計可識別性,并且執(zhí)行對混合分量q的解釋作為增加的擁堵級別,可以對每個放置限制μj,q-1≤μj,q。

由等式(1)-(4)表示的統(tǒng)計模型是足夠靈活的,以捕獲廣泛的行為。然而,并不是所有的網絡鏈路都將具有足夠的數(shù)據(jù)(根據(jù)具有ri,k=j的鏈路遍歷i,k的數(shù)量),以準確估計鏈路特定參數(shù)μj,q,和pj,b。對于具有非常少的數(shù)據(jù)的鏈路j,可以使用每個道路類別中的個體參數(shù)集合,道路類別包括道路分類(例如,“高速公路”、“主干”或“街道”)和速度限制的組合。對于每個j,使得nj≡|{i∈i,k∈{1,…,|ri|}:j=ri,k}|作為鏈路j的遍歷次數(shù)。定義最小數(shù)量m的遍歷,對于具有nj<m的鏈路,等式(5)可以被如下指定:

這里,對于的μc,q,和pj,c是與道路類別c相關聯(lián)的參數(shù)。

機器學習模型102集成了由于例如車道之間的結構或速度差異引起的行程級別可變性(例如駕駛員效應)和鏈路級別的可變性。結合車輛在穿過鏈路時保持恒定速度(或沿著跨鏈路的特定速度曲線)的假設,它為行程期間的所有時間提供了車輛位置的真實模型。針對此原因,機器學習模型102可以用于在穿過該路線時給出路線的剩余出行時間的路線預測。機器學習模型102還捕獲每周周期、速度限制和道路分類的影響,這被認為與駕駛速度強相關聯(lián)。

雖然本文提供了與行程相關聯(lián)的潛在變量104的特定示例,但是應當理解,機器學習模型102可以將額外的潛在變量104并入本文所描述的那些變量中。通常,在模型102中可以利用與行程相關聯(lián)的跨行程的路段/鏈路上的建模駕駛時間的依賴性的任何合適類型的潛在變量104,而不改變系統(tǒng)的基本特征。

訓練機器學習模型

在構建機器學習模型102之后,模型訓練部件138可以使用歷史行程數(shù)據(jù)106來訓練機器學習模型102以做出出行時間可變性的準確預測。特別地,從歷史行程數(shù)據(jù)106中學習了指定個體路段上的出行時間的概率分布的未知數(shù)量、這些駕駛時間彼此的概率依賴性、以及諸如一天中的時間的附加因素的影響。在一些實施例中,模型訓練部件138針對感興趣的每個地理區(qū)域(諸如特定的城市或甚至大陸)訓練機器學習模型102。在這個意義上,機器學習模型102可以是區(qū)域特定的。對于每個這樣的區(qū)域,歷史行程數(shù)據(jù)106的子集(通常是最近收集的數(shù)據(jù)的集合)在學習過程中不被使用,而是代之以被保留用于在評估預測的質量中使用。

訓練/學習過程可以以各種方式完成。計算上高效的一種合適的方案是基于最大后驗(map)估計。對于參數(shù)機器學習模型102,這可以涉及獲得參數(shù)的近似map估計。期望條件最大化(ecm)方案可被用于在訓練期間獲取map估計。ecm與期望最大化(em)密切相關,但允許在參數(shù)向量可以被劃分為子向量的情況下的閉合形式更新,如果剩余參數(shù)已知則每個子向量將具有封閉形式的em更新。

為了標記簡單,可以丟棄等式(5)中常用參數(shù)的使用;處理這些的擴展是直接的?,F(xiàn)在考慮觀測數(shù)據(jù)由變換值構成,其中是在鏈路穿過i,k期間的對數(shù)平均速度。為了估計感興趣的未知量最大后驗(map)估計器可以在在參數(shù)空間的支持上是統(tǒng)一的(不可積分的)先驗分布下使用。無界參數(shù)空間上的這種統(tǒng)一先驗通常用于存在很少或沒有與參數(shù)值有關的先驗信息的情況中。在此統(tǒng)一先驗下獲得map估計器也對應于最大化觀測數(shù)據(jù)的密度乘以關于θ的隨后隨機效應104的密度的乘積:

擁堵狀態(tài)qi,k不出現(xiàn)在參數(shù)矢量θ或表達式(6)中;擁堵狀態(tài)qi,k可以被視為丟失數(shù)據(jù)(在em的術語中),并且表達式是對這些丟失數(shù)據(jù)的積分。因此,最大化表達式(6)的目標是重要的,激勵ecm的使用。

雖然em和ecm通常被應用于獲得似然函數(shù)的(局部)最大化,但是它們也可用于獲得后驗密度的(局部)最大化。對于em,這可以通過在每次迭代中最大化完整數(shù)據(jù)對數(shù)似然加上對數(shù)先驗密度的期望來實現(xiàn),而不僅僅是完整的數(shù)據(jù)對數(shù)似然。對于ecm,可以以剩余參數(shù)為條件對每個參數(shù)子向量執(zhí)行此操作。

可以通過將參數(shù)向量劃分為三個子向量θ2=({logei}i∈i)和θ3=τ2來應用ecm。首先,可以推導出以θ[-2]≡(θ1,θ3)為條件的θ2的更新等式。使用em的術語,由等式(1)-(4)表示的模型中的缺失數(shù)據(jù)是以及完整數(shù)據(jù)對數(shù)似然是:

在表達式(7)中,只有最后一項取決于{logei}i∈i,所以在更新θ2期間可以忽略剩余的項。另外,由于表達式(6)被最大化,所以可以添加來自{logei}i∈i的隨機效應密度的對數(shù)的相關項,以產生:

可以關于以觀測數(shù)據(jù)和當前參數(shù)估計為條件的丟失數(shù)據(jù)的分布來采取表達式(8)的期望。由于表達式(8)是涉及至多一個qi,k值的項的總和,所以這個期望是僅針對每個的函數(shù)。由于可以針對{qi,k}使用馬爾科夫(markov)模型(參見等式(4)),可以使用隱馬爾可夫模型的前向-后向算法為每個計算

由于執(zhí)行以為條件的θ2的更新,所以θ2可以被視為未知參數(shù),并且將視為已知。關注表達式(8)中的特定項產生如下:

為了最大化表達式(8)的期望,對于每個i∈i,以下可以相對于logei被最大化,其中

這產生了更新的估計:

在其中例如針對所有j和q的相等的特殊情況下,大約是與其在模型下的期望之間的差在k∈{1,…,|ri|}上的平均,其是對于行程效應潛在變量104的合理估計器。在i和k之間并行地計算φi,k(q)后,可以在i∈i上并行地進行的計算。

以θ[-1]為條件的θ1的更新是針對每個的高斯混合模型參數(shù)的非標準em更新。為了導出這一點,請注意,表達式(7)中的所有項均是θ1的函數(shù),因此與此更新相關。首先,可以考慮這些項的期望,記住由于執(zhí)行以為條件的θ1的更新,所以θ1可以被視為未知參數(shù),可以被視為已知常數(shù)。還定義針對每一個(可以使用前向后向算法計算的另一個數(shù)量),可以獲得以下內容:

上述第一項是唯一涉及的項。因此,為了獲得的更新表達式,可以最大化以下內容:

這產生以下更新:

也就是說,上述表達式產生在時間段b期間對于首先穿過鏈路j的所有行程i的分配概率φi,1(q)的平均值。類似地,的更新是:

高斯混合模型中em的標準計算表明,μj,q和的更新為:

類似地,以為條件的針對θ3=τ2的更新為:

如本文所述的訓練機器學習模型102可以有助于歷史行程數(shù)據(jù)106內的模式、趨勢等的標識,以便估計模型102中的其他變量中的潛在變量104。

在一些實施例中,模型訓練部件138可以用新接收的歷史行程數(shù)據(jù)106來更新或重新訓練機器學習模型102。更新可以周期性地被執(zhí)行(例如,每天一次、每周一次等),或更新可以在諸如用戶發(fā)起的指令的觸發(fā)時、或者在自從最近的訓練或更新發(fā)生接收新的歷史行程數(shù)據(jù)106的閾值量時等發(fā)生。

再次參考圖1,計算機可讀存儲器134還可以包括模型測試器140,其被配置為在其完全被指定和訓練之后測試或檢查模型102以確保系統(tǒng)如期望工作。例如,機器學習模型102可以在特定上下文中進行訓練,使得它不能很好地用于預測新的和不同的上下文中的出行時間可變性。模型102的測試可以通過將經訓練的機器學習模型102應用于歷史行程數(shù)據(jù)106的一部分(稱為“測試數(shù)據(jù)”)來完成,以執(zhí)行測試數(shù)據(jù)中的個體行程的出行時間可變性的預測。也就是說,歷史行程數(shù)據(jù)106的一部分可以用于訓練模型102,而可以保留歷史行程數(shù)據(jù)106的剩余部分或另一部分(稱為測試數(shù)據(jù))(即,不用于訓練模型102)用于測試模型102,并且對于測試數(shù)據(jù)中的每個行程,可以從機器學習模型102獲得出行時間的預測概率分布。該預測可以與行程的觀測到的出行時間進行比較,并且基于預測與實際觀測出行時間的比較來評估預測的質量。以這種方式,可以評估模型102在預測出行時間的可變性方面的準確性,并且基于測試結果,可以采取步驟來改善機器學習模型102的性能。這可以涉及重建或者修改模型102本身,或者通過用更新的歷史行程數(shù)據(jù)106來重新訓練模型102。

模型測試器140可以以各種方式測量用于預測出行時間的可變性的機器學習模型102的精度或質量。例如,模型測試器140可以生成一組數(shù)字測量和/或圖形摘要,用于評估機器學習模型102的性能。數(shù)字測量和/或圖形摘要可以包括但不限于行程的預測的平均駕駛時間和觀測的駕駛時間之間平均差異,使用概率分布獲得的駕駛時間的預測間隔的質量的數(shù)值測量,或預測概率分布的質量的數(shù)值和圖形測量等。用于在預測出行時間可變性中評估機器學習模型102性能的至少一種類型的數(shù)值測量是從模型102獲得的出行時間的95%間隔預測的精度的測量。可以通過使間隔的下限和上限取預測出行時間分布的不同分位數(shù)來獲得間隔預測(例如,可以以0.25和0.975分位數(shù)、或0和0.95分位數(shù)來獲得95%間隔)。另一種類型的數(shù)值測量是從模型中獲得的出行時間的點(“最佳”個體)預測的精確度的測量。為了獲得點預測,可以使用如蒙特卡羅近似的預測出行時間分布的幾何平均。替代地,可以使用預測出行時間分布的中位數(shù),或者預測的出行時間分布的算術平均值來獲得點預測。

模型測試器140可以周期性地(例如,每周、每月等)測試模型102,以檢查對于給定區(qū)域的預測仍然是準確的。在其他實施例中,模型102的測試可以在諸如用戶發(fā)起的指令的觸發(fā)時、或者自從最后的訓練或更新發(fā)生接收到新的歷史行程數(shù)據(jù)106的閾值量時等發(fā)生。預測

在圖1中,當在計算設備108上執(zhí)行時,地圖應用124的預測部件126可以利用經訓練的機器學習模型102結合預測對應于在指定時間從起點114到目的地116的行程的個體路線118的出行時間的概率分布。出行時間概率分布的預測可以表示從一組觀測的推論。該組觀測可以包括經由到計算設備108的用戶輸入獲得的信息,諸如所接收的目的地,以及可能與行程相關聯(lián)的指定的未來開始時間??梢詮挠嬎阍O備108的傳感器和/或網絡130上的遠程資源獲得其他觀測,諸如當前時間(一天中的時間和日期)、計算設備108的當前位置或定位、以及其他上下文數(shù)據(jù),諸如可以通過網絡130從遠程資源獲得的天氣狀況、交通狀況等。預測是概率性的,因為它針對出行時間的隨機變量計算隨機變量的概率分布。在一些實施例中,由預測部件126計算的概率分布包括方差、四分位數(shù)范圍和/或預測間隔。

當對模型102進行訓練時,對于每個i和k,時間段b(i,k)是已知的。然而,當進行預測時,只有與行程中的第一鏈路ri,1相關聯(lián)的時間b(i,1)是已知的。當進行預測時,可以估計行程i開始穿過每個鏈路ri,k的時間t(i,k),并且然后可以將b(i,k)估計為t(i,k)落入的時間段。為了針對每個k∈{2,…,|ri|}估計t(i,k),可以使用行程的已知開始時間t(i,1),加上穿過路線上至鏈路ri,k的所需的預測平均(幾何平均)時間:

此數(shù)量以封閉形式是不可用的。我們用蒙特卡羅對其進行估計。

應當理解,盡管圖1示出了經由網絡130與遠程計算資源128通信的計算設備108的具體實現(xiàn),但架構100并不限于此。例如,在一些實施例中,可以省略網絡130,并且圖1的各種部件和設備可以被實現(xiàn)為個體的、集成的設備,而不需要網絡130本身,諸如可用作客戶端計算設備以維護模型102并且還執(zhí)行行程時間可變性的預測的高性能計算系統(tǒng)。預測部件126可以駐留在遠程計算資源128上,這可能相當于系統(tǒng)的更多的瘦客戶端實現(xiàn)。

圖2是用于預測出行時間的可變性并基于可變性預測來輸出路線建議和/或駕駛時間的測量的系統(tǒng)200的示意圖。系統(tǒng)200可以被實現(xiàn)為地圖服務的一部分,其包括被配置為在圖1的計算設備108上執(zhí)行的地圖應用。系統(tǒng)200可以包括預測部件126和包括與行程相關聯(lián)的潛在變量104(或“隨機效應104”)的機器學習模型102。在圖2的場景中,機器學習模型102已經被圖1的模型訓練部件138訓練。

系統(tǒng)200可以包括輸入部件202,其被配置為以與行程相關聯(lián)的至少起點114、目的地116以及開始時間(例如,當前時間或未來時間)的形式接收輸入。一些輸入可以經由計算設備108處的用戶輸入來接收,諸如在執(zhí)行地圖應用124時用戶110輸入目的地116。其他輸入可以通過計算設備108經由計算設備108上的傳感器、或經由網絡130從遠程資源來獲得。在一些實施例中,輸入可以包括附加的上下文數(shù)據(jù),例如天氣狀況、交通狀況、路況等。

系統(tǒng)200還可以包括路線生成器204,其被配置為獲得從起點114到目的地116行進的候選路線118的集合。在一些實施例中,由路線生成器204獲得的候選路線118可以基于與個體候選路線118相關聯(lián)的平均駕駛時間??梢詮臋C器學習模型102或從其他來源獲得針對個體路線118的平均駕駛時間的數(shù)據(jù)。在一些實施例中,由路線生成器204獲得的候選路線118可以基于其他數(shù)據(jù),諸如開始時間(其可以包括一天中的時間和星期幾(例如,日期)),沿著個體路線118所在的收費站的存在(以及可能的數(shù)量)、以及與路線相關聯(lián)的其他類似數(shù)據(jù)。

由路線生成器204生成的候選路線118的集合可以相對較大。例如,候選路線118的集合可以在數(shù)百個路線118或更多的數(shù)量級上。盡管由路線生成器204獲得潛在的大量候選路線118,但是使用諸如與個體路線118相關聯(lián)的平均駕駛時間的度量來獲得候選路線118大型集合在計算上是相對高效的。

給定來自路線生成器204的候選路線118的集合,預測部件126可以至少部分地基于包括與行程相關聯(lián)的潛在變量104的機器學習模型102來預測候選路線118中的個體路線的出行時間的概率分布206。圖2圖示了正態(tài)(或高斯)分布形式的示例概率分布206,盡管由預測部件126確定的概率分布206不受此限制。特別地,可以使用由本文中所述的模型所暗示的概率分布。

圖2還圖了概率分布206可以包括出行時間的百分位數(shù)208。例如,給定路線118a的預測概率分布206可以指定路線118a的出行時間(例如駕駛時間)的第70個百分位數(shù)為12分鐘。用于不同路線118b的預測概率分布206可以將路線118b的出行時間的第70個百分位數(shù)指定為10分鐘。應當理解,除了百分位數(shù)208之外,可以從概率分布206中收集對路線規(guī)劃應用有用的大量信息。此外,由于與行程相關聯(lián)的潛在變量104,因為它們捕獲在行程的候選路線118的個體道路路段的出行時間之間的關系,由預測部件126做出的出行時間可變性(概率分布206)的預測將提供高精度預測,其可以改善關于地圖服務和應用124的客戶體驗。以這種方式,概率分布預測可以被用于地圖服務輸出中的路線推薦和出行時間報告。

因此,系統(tǒng)200還可以包括排名器210,其被配置為根據(jù)至少部分地基于候選路線118中的個體候選路線的出行時間可變性預測(即,出行時間的概率分布206)的標準來對由路線生成器204獲得的候選路線118進行排名。也就是說,該標準可以用于從候選路線118的集合中評估、排名和選擇路線。例如,候選路線118可以根據(jù)出行時間的指定百分位數(shù)(諸如出行時間的第70個百分位數(shù)或第80個百分位數(shù))進行排名。百分位數(shù)208的選擇控制路線選擇的保守性。例如,特別是諸如冷藏卡車或混凝土運送車的防風險應用,可以使用較高的百分位數(shù)。另一種可能的排名標準是在指定時間之前車輛將到達目的地116的概率。如果路線選擇基于最小化標準,則排名可以從出行時間的百分點208的最低值到最高值,例如候選集合中的所有路線118中的最低值被排名最高。具有最佳排名的一個或多個路線118(例如,駕駛時間的第70個百分位數(shù)的最低值,或者在30分鐘內達到的最高概率)可以由輸出部件212推薦給用戶110。

在一些實施例中,路線排名和選擇可以基于附加標準,例如最小化預測的平均駕駛時間、最小化集成預期的平均駕駛時間連同路線期望的其他測量(諸如路線是否具有收費站)的另一路線標準等。

在一些實施例中,用于路線排名和選擇的標準可以基于用戶風險容忍的用戶說明。例如,地圖應用124可以向用戶界面提供交互式工具,該交互工具允許用戶110控制他們所期望的預測的保守性,和/或在路線選擇中他們希望的預測的保守性。例如,用戶界面可以具有滑動條,其中用戶110移動條以指定對于他們晚到10分鐘比早到10分鐘更壞或更好。在其他示例中,交互式工具可以提供多個選擇選項或類似的選擇機制,以允許用戶110指定風險規(guī)避(或風險容忍)級別。地圖應用124(經由排名器210)可以將該測量轉換為用于路線選擇標準和/或所報告的出行時間標準的百分位數(shù)208。也就是說,路線選擇和出行時間報告的標準可以根據(jù)用戶110指定的風險容忍進行調整。以這種方式,輸出部件212,如果提供行程時間的個體測量/值作為輸出,則可以提供出行時間的第80個百分點作為到更風險規(guī)避的人的輸出(意味著如果他們依賴該預測,則風險規(guī)避的用戶只有在20%的時間晚到),而提供出行時間的第60個百分位給更具風險容忍的人(意味著如果風險容忍的用戶依賴于該預測,則風險容忍的用戶將在40%的時間內晚到)。路線推薦可以以類似的方式運行,以基于用戶110愿意承擔的風險級別來推薦路線。

輸出部件212可以提供至少部分地基于預測概率分布206的任何合適類型的輸出。例如,滿足或最小化標準的一個或多個路線118可被推薦給用戶110。對于每個推薦路線118,輸出還可以包括可以基于出行時間的預測概率分布206的相應路線118的出行時間的一些測量。例如,出行時間的測量可以包括總結出行時間中的可變性的個體預測出行時間(例如,出行時間的特定百分位數(shù)208)。在一些實施例中,輸出部件212可以經由計算設備108的輸出部件向用戶110揭示其提供的出行時間的實際百分位數(shù)。在其他實施例中,輸出部件212可以給出相同概念的更簡單的圖形或數(shù)字顯示。

附加地或備選地,為了向用戶110提供個體預測的出行時間,輸出部件212可以提供推薦路線上出行時間的可變性的測量。一種方案是向用戶提供可能的出行時間的(范圍)上的下限和上限(例如,“駕駛時間預計在45和55分鐘之間”)。這些下限和上限可以使用各種間隔估計方法從預測分布206獲得。在一些實施例中,可以獲得通過使用該分布206的2.5和97.5百分位數(shù)來包含預測出行時間分布206的95%(或90%、或99%等)的間隔。此外,通過使用具有較高或較低概率的間隔可以控制這些下限和上限的保守性;關于99%的時間,99%的間隔是正確的(實際駕駛時間落在下限和上限之間),并且關于90%的時間,90%的間隔是正確的。

向用戶110圖示在推薦路線118上的出行時間的可變性的另一種方案是提供視覺(例如,圖形)顯示,例如直方圖、時鐘上的圖形表示等。圖3是用于基于出行時間可變性預測在諸如計算設備108的顯示器的顯示器上提供地圖服務輸出的示例圖形用戶界面(gui)300的屏幕呈現(xiàn)。在圖3的示例中,用戶110可能已經指定起點114和目的地之間的行程的至少目的地116。推薦路線118可以作為多個候選路線118中的路線118輸出給用戶,該路線沿著路線最小化駕駛時間的第80百分位數(shù),該路線是從候選路線118中的每一個的駕駛時間的概率分布的預測確定的。

除了推薦路線118之外,gui300可以提供基于路線118的出行時間的預測概率分布206的出行時間302的測量。圖3所示的出行時間302的測量包括可能的出行時間的范圍(例如,17到20分鐘的駕駛時間)。圖3還示出了向用戶提供預測出行時間302基于可變性預測的指示304的示例。在該示例中,指示304是對用戶110說明“駕駛時間范圍包括針對推薦路線118的預測出行時間分布206的95%”。gui300還可以包括預測出行時間302的測量的視覺表示306。例如,視覺表示306可以包括表示用戶110可以期望到達目的地116的到達時間范圍的時鐘的圖形表示。

gui300還示出了交互式工具308,其可以向用戶110提供調整其風險容忍以調諧駕駛時間預測302的輸出的能力。例如,交互式工具308向用戶110提供如果他想要更保守的出行時間估計則將條向右滑到“風險規(guī)避”,或如果他對更自由的出行時間估計沒問題則將條向左滑到“風險容忍”的能力。

示例過程

圖4和圖5圖示了可以被執(zhí)行以執(zhí)行本文所描述的技術的示例過程。過程被圖示為邏輯流程圖中的框的集合,其表示可以以硬件、軟件或其組合實現(xiàn)的一系列操作。在軟件的上下文中,框表示存儲在一個或多個計算機可讀存儲介質上的計算機可執(zhí)行指令,其當由一個或多個處理器執(zhí)行時,執(zhí)行所述操作。通常,計算機可執(zhí)行指令包括執(zhí)行特定功能或實現(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、部件、數(shù)據(jù)結構等。其中描述的操作的順序不旨在被解釋為限制,并且任何數(shù)量的所述框可以以任何順序和/或并行組合以實現(xiàn)該過程。此外,在一些實施例中,可以完全省略該過程的一個或多個框。

圖4是構建和訓練機器學習模型102的示例過程400的流程圖,該機器學習模型102可以被實現(xiàn)為預測在指定時間內的行程的出行時間的概率分布206。為了方便起見,參考圖1的架構100和圖2的系統(tǒng)200來描述過程400。

在402處,諸如遠程計算資源128的計算設備可以接收歷史行程數(shù)據(jù)106(或移動性數(shù)據(jù)106)。歷史行程數(shù)據(jù)106可以來自任何合適的來源,諸如向維護和操作遠程計算資源128的實體銷售或租賃數(shù)據(jù)的第三方數(shù)據(jù)聚合器。歷史行程數(shù)據(jù)106可以源自移動設備或其他位置感知設備,報告基于位置的測量至少包括位置數(shù)據(jù)和時間數(shù)據(jù)。例如,歷史行程數(shù)據(jù)106可以包括出行時間信息或從其中可以導出出行時間的信息。例如,來自移動電話的gps數(shù)據(jù)通常包括位置、航向、速度和時間戳,該時間戳在報告周期性測量時導出在路線上的出行時間可能是有用的。

在404處,可以指定包括與行程相關聯(lián)的潛在變量104的機器學習模型102。例如,包括在機器學習模型102中的潛在變量104可以包括但不限于:“行程效應”,其捕獲在構成路線118的所有路段上特定行程比通常更快或更慢的程度;“自回歸”效應,其捕獲對于在路線118中彼此靠近的路段出行速度趨于相似的事實;和/或捕獲例如鏈路上的擁堵級別的潛在分類變量,其依賴性可以跨鏈路被建模。

在406處,模型訓練部件138可以使用歷史行程數(shù)據(jù)106來訓練機器學習模型102。對于參數(shù)模型,訓練可以包括估計模型的參數(shù),包括模型中包括的潛在變量104。

圖5是預測行程的出行時間的概率分布206的示例過程500的流程圖。為了方便起見,參考圖1的架構100和圖2的系統(tǒng)200來描述過程500。

在502處,輸入部件202可以接收與行程相關聯(lián)的至少一個起點114、目的地116和開始時間。在一些實施例中,可以在502處接收其他行程細節(jié),諸如上下文數(shù)據(jù)(例如天氣狀況、交通狀況等)。

在504處,路線生成器204可以獲得從起點114行進到目的地116的候選路線118。由路線生成器204的候選路線選擇可以部分地基于與可以從模型102獲得的個體候選路線相關聯(lián)的平均出行時間。

在506處,預測部件126可以至少部分地基于包括與行程相關聯(lián)的隨機效應104的機器學習模型102來預測候選路線118中的個體候選路線的出行時間的概率分布206。與行程相關聯(lián)的隨機效應104的使用通過捕獲行程的不同路段上的出行時間的關系來解決“依賴問題”。

在一些實施例中,機器學習模型102可以被用于更新出行時間預測路線。例如,當用戶110在路線118上出行時,預測部件126可以將用戶110的當前位置視為新預測的出行時間可變性的起點。也就是說,基于路線118上的用戶110的當前位置,路線118的其余部分可以被視為好像在進行實時的、更新的出行時間可變性預測中本身中的或本身的路線。在一些實施例中,可以評估過去的出行的路段以確定出行時間、速度或與過去出行的路段相關聯(lián)的其他有用信息,然后基于行程的過去出行路段的評估來更新預測。

在508處,輸出部件212(可能使用排名器210)至少部分地基于在506處預測的概率分布206,從候選路線118中推薦滿足或最小化標準的一個或多個路線118。例如,針對在508處的推薦可以選擇最小化出行時間的第80個百分位數(shù)的路線118。

在510處,輸出部件212可以提供推薦路線118的出行時間的測量。在至少一些情況下,這可以包括指示概率分布206的使用的測量。例如,測量可以提供基于駕駛時間的第80個分位數(shù)的出行時間的估計,以及可能的它是駕駛時間的第80個百分位數(shù)的指示。

本文描述的環(huán)境和個體元件當然可以包括許多其它邏輯、程序化和物理部件,其中附圖中所示的那些僅僅是與本文討論有關的示例。

本文描述的各種技術在所給出的示例中被假設為將在計算機可執(zhí)行指令或軟件(諸如程序模塊)的一般上下文中實現(xiàn),該指令或軟件被存儲在計算機可讀存儲裝置中并由一個或多個計算機或諸如附圖中所圖示的那些的其他設備的處理器執(zhí)行。通常,程序模塊包括進程、程序、對象、部件、數(shù)據(jù)結構等,并且定義用于執(zhí)行特定任務或實現(xiàn)特定抽象數(shù)據(jù)類型的操作邏輯。

其他架構可以用于實現(xiàn)所描述的功能,并且旨在在本公開的范圍內。此外,雖然上文為了討論的目的而定義了責任的具體分配,但是根據(jù)具體情況,各種功能和責任可以以不同的方式被分布和劃分。

類似地,軟件可以以各種方式并且使用不同的手段被存儲和分布,并且上述特定的軟件存儲裝置和執(zhí)行配置可以以許多不同的方式變化。因此,實現(xiàn)上述技術的軟件可以分布在各種類型的計算機可讀介質上,不限于具體描述的存儲器的形式。

示例一:一種用于預測針對行程的出行時間的可變性并利用用于路線規(guī)劃的預測可變性的系統(tǒng),該系統(tǒng)包括:一個或多個處理器;以及存儲器,存儲由一個或多個處理器可執(zhí)行的指令,所述存儲器包括:輸入部件,用于接收與所述行程相關聯(lián)的起點、目的地和開始時間;路線生成器,用于獲得從起點向目的地行進的候選路線;預測部件,至少部分地基于包括與該行程相關聯(lián)的潛在變量的機器學習模型來預測針對候選路線中的個體候選路線的出行時間的概率分布;以及輸出部件,用于:至少部分地基于標準來從候選路線中推薦一個或多個路線,該標準至少部分地基于概率分布;以及提供針對所推薦的一個或多個路線中的個體路線的出行時間的測量。

示例二:根據(jù)示例1所述的系統(tǒng),還包括排名器,用于在輸出部件推薦一個或多個路線之前,根據(jù)最小化標準的路線排名候選路線。

示例三:根據(jù)前述示例(單獨的或組合的)中任一項所述的系統(tǒng),其中標準包括以下各項中的至少一個:出行時間的百分位數(shù)、或在指定時間之前到達目的地將發(fā)生的概率。

示例四:根據(jù)前述示例(單獨的或組合的)中任一項所述的系統(tǒng),其中被包括在機器學習模型中的潛在變量包括捕獲在行程的不同路段上的出行時間的概率依賴性的未觀測量。

示例五:根據(jù)前述示例(單獨的或組合的)中任一項所述的系統(tǒng),其中潛在變量包括以下各項中的至少一項:捕獲出行時間的行程級別可變性的潛在變量,作為在構成針對行程的路線的所有路段上特定行程比通常更快或更慢的程度;捕獲出行時間的路段級別可變性的潛在變量,作為在路線中彼此靠近的針對行程的路線的路段上出行速度相似的趨勢;或捕獲路段上的擁堵級別的潛在變量。

示例六:根據(jù)前述示例(單獨的或組合的)中任一項所述的系統(tǒng),其中出行時間的測量包括出行時間的范圍。

示例七:根據(jù)前述示例(單獨的或組合的)中任一項所述的系統(tǒng),其中出行時間的范圍被描繪在系統(tǒng)的顯示器上的圖形表示中。

示例八:根據(jù)前述示例(單獨的或組合的)中任一項所述的系統(tǒng),還包括用戶界面,用于提供調整針對用戶的風險規(guī)避級別的交互式虛擬工具的,所述風險規(guī)避級別在風險的所述級別的調整時引起標準的調整。

示例九:一種計算機實現(xiàn)的方法,包括:接收與所述行程相關聯(lián)的起點、目的地和開始時間;獲得從起點向目的地行進的候選路線;至少部分地基于包括與所述行程相關聯(lián)的隨機效應的機器學習模型來預測候選路線中的個體路線的出行時間的概率分布;至少部分地基于標準來從候選路線中推薦一個或多個路線,該標準至少部分地基于該概率分布;以及提供針對所推薦的一個或多個路線中的個體路線的出行時間的測量。

示例十:根據(jù)示例九所述的方法,其中所述標準包括以下各項中的至少一個:出行時間的百分位數(shù)、或到達目的地將在指定時間之前發(fā)生的概率。

示例十一:根據(jù)前述示例(單獨的或組合的)中任一項所述的計算機實現(xiàn)的方法,其中被包括在機器學習模型中的潛在變量包括捕獲在行程的不同路段上的出行時間的概率依賴性的未觀測量。

示例十二:根據(jù)前述示例(單獨的或組合的)中任一項所述的計算機實現(xiàn)的方法,其中潛在變量包括以下各項中的至少一項:捕獲出行時間的行程級別可變性的潛在變量,作為在構成針對行程的路線的所有路段上特定行程比通常更快或更慢的程度;捕獲出行時間的路段級別可變性的潛在變量,作為針對在路線中彼此靠近的針對行程的路線的路段出行速度相似的趨勢;或捕獲路段上的擁堵水平的潛在變量。

示例十三:根據(jù)前述示例(單獨的或組合的)中任一項所述的計算機實現(xiàn)的方法,其中出行時間的測量包括出行時間的范圍。

示例十四:根據(jù)前述示例(單獨的或組合的)中任一項所述的計算機實現(xiàn)的方法,還包括:經由用戶界面提供用于調整針對用戶的風險規(guī)避水平的交互式虛擬工具;經由交互式虛擬工具接收風險水平的調整;以及基于調整來向上或向下調整標準。

示例十五:一種訓練機器學習模型以被用于預測行程的出行時間的概率分布的計算機實現(xiàn)方法,所述方法包括:接收至少部分地基于從移動設備報告的基于位置的測量的歷史行程數(shù)據(jù),基于位置的測量的個體基于位置的測量至少包括位置數(shù)據(jù)和時間數(shù)據(jù);以及使用歷史行程數(shù)據(jù)來訓練機器學習模型,機器學習模型包括與從起點到目的地的行程相關聯(lián)的潛在變量。

示例十六:根據(jù)示例十五所述的計算機實現(xiàn)的方法,還包括通過將機器學習模型應用于未用于訓練機器學習模型的歷史行程數(shù)據(jù)的一部分來測試機器學習模型在預測出行時間的概率分布方面的性能。

示例十七:根據(jù)前述示例(單獨的或組合的)中任一項所述的計算機實現(xiàn)方法,其中機器學習模型的性能通過以下各項中的至少一項來測量:行程時間的95%間隔預測的精度的測量;或行程時間的點預測的精度的測量。

示例十八:根據(jù)前述示例(單獨的或組合的)中任一項所述的計算機實現(xiàn)方法,用自從訓練后的新接收的歷史行程數(shù)據(jù)來周期性地重新訓練機器學習模型。

示例十九:根據(jù)前述示例(單獨的或組合的)中任一項所述的方法,其中所述重新訓練在閾值量的新接收的歷史行程數(shù)據(jù)的接收時發(fā)生。

示例二十:根據(jù)前述示例(單獨的或組合的)中任一項所述的計算機實現(xiàn)的方法,其中在機器學習模型中包括的潛在變量包括捕獲在行程的不同路段上的出行時間的概率依賴性的未觀測量。

示例二十一:一種用于預測行程的出行時間的可變性并利用路線規(guī)劃的預測可變性的系統(tǒng),該系統(tǒng)包括:用于執(zhí)行計算機可執(zhí)行指令的部件(例如,處理器,包括例如硬件處理器,諸如中央處理單元(cpu)、片上系統(tǒng)(soc)等);以及用于存儲計算機可執(zhí)行指令的部件(例如,存儲器、諸如ram、rom、eeprom、閃存等的計算機可讀存儲介質),所述用于存儲的部件包括:用于接收以與行程相關聯(lián)的起點、目的地和開始時間的形式輸入的部件;用于生成從起點向目的地行進的候選路線的部件;用于至少部分地基于包括與所述行程相關聯(lián)的潛在變量的機器學習模型來預測針對所述候選路線中的個體候選路線的出行時間的概率分布的部件;以及用于提供以下形式的輸出的部件:至少部分地基于標準來從候選路線中推薦一個或多個路線,該標準至少部分地基于概率分布;以及提供所推薦的一個或多個路線中的個體路線的出行時間的測量。

示例二十二:根據(jù)示例二十一所述的系統(tǒng),還包括用于提供交互式虛擬工具的部件,交互式虛擬工具用于調整在風險的水平的調整時導致標準的調整的用戶的風險規(guī)避水平。

結論

最后,盡管各種實施例已經用特定于結構特征和/或方法動作的語言來描述,但是應當理解,附加表示中定義的主題不一定限于所描述的具體特征或動作。相反,具體特征和動作被公開為實現(xiàn)所要求保護的主題的示例形式。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1