亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

識(shí)別實(shí)體的物理位置的制作方法

文檔序號(hào):2585964閱讀:229來(lái)源:國(guó)知局
專利名稱:識(shí)別實(shí)體的物理位置的制作方法
識(shí)別實(shí)體的物理位置
背景技術(shù)
在許多應(yīng)用中,知道企業(yè)或其他實(shí)體的實(shí)際位置是具有重大意義的。例如,地圖應(yīng)用時(shí)常顯示企業(yè)在街道網(wǎng)格上的推測(cè)地理位置。這樣的地圖應(yīng)用也可以提供街道級(jí)圖像, 并且可以將企業(yè)的名稱疊加在其在圖像中的推測(cè)位置上。地理搜索應(yīng)用可以提供顯示與查詢相匹配的企業(yè)或?qū)嶓w的位置的地圖。為了在地圖或圖像上顯示企業(yè)或其他實(shí)體的位置,應(yīng)用必須確定企業(yè)的位置。時(shí)常從實(shí)體的街道地址中推斷該位置。例如,特別街道的特別街區(qū)可能具有被編號(hào)為1到100 的建筑物。如果某實(shí)體在編號(hào)50上,則能夠推斷該實(shí)體大致在街區(qū)的一半位置處。此外, 由于50是偶數(shù),所以通常有可能推斷出該實(shí)體位于街道的哪一側(cè)。另外,一些數(shù)據(jù)源可以提供實(shí)體的實(shí)際緯度和經(jīng)度坐標(biāo)。然而,從街道編號(hào)或甚至從緯度和經(jīng)度坐標(biāo)的某些源中確定實(shí)體的位置可能導(dǎo)致不準(zhǔn)確的位置。由于編號(hào)可能有時(shí)朝向街道的一端“聚成一團(tuán)(bunch up)”,所以街道編號(hào)與沿著街區(qū)的位置之間的關(guān)系可能不是線性的。一些建筑物沒(méi)有被放置在簡(jiǎn)單線條上。例如,街道可能具有U形庭院,并且街道上的若干地址可能位于該庭院的周圍。至于緯度和經(jīng)度坐標(biāo),雖然這些坐標(biāo)可以提供精確的外觀,但是所報(bào)告的實(shí)際坐標(biāo)可能與實(shí)體在該街道上的實(shí)際位置不相對(duì)應(yīng)。例如,特定坐標(biāo)可能指的是遠(yuǎn)離街道向后一直延伸的商店的背面, 或者可能指的是位于商店一側(cè)的停車場(chǎng)。因而,當(dāng)人們想要確定實(shí)體的實(shí)際位置時(shí),依靠街道編號(hào)或甚至地理坐標(biāo)可能提供不準(zhǔn)確的信息。

發(fā)明內(nèi)容
企業(yè)或其他實(shí)體的位置可以從各種源中進(jìn)行挖掘。為了評(píng)估實(shí)體的位置,街道地圖被劃分成分段(segment)。每個(gè)分段可以是街區(qū)的一側(cè),例如特定街道的北行側(cè)上的 100-199街區(qū)。隨后,創(chuàng)建似乎位于那個(gè)分段上的所有實(shí)體的列表。什么實(shí)體位于分段上的確定可以基于列出實(shí)體的街道地址和/或?qū)嶓w的地理位置的目錄。為了識(shí)別哪些企業(yè)在分段上,其街道地址與那個(gè)分段相對(duì)應(yīng)的任何實(shí)體可以被推定為在該分段上。此外,對(duì)于其地理坐標(biāo)是可用的實(shí)體,實(shí)體可以被推定為在它與之最靠近的分段上。地理標(biāo)記的數(shù)據(jù)點(diǎn)也可以被放置在分段上。數(shù)據(jù)點(diǎn)可以是與地理位置相關(guān)聯(lián)的任何類型的信息,諸如照片、微博條目、地理標(biāo)記的查詢、從街邊圖像中恢復(fù)的文本、由企業(yè)或其他實(shí)體在其自己的網(wǎng)站上報(bào)告的位置、由用戶或企業(yè)所有者標(biāo)記的在地圖上的位置等等。例如,如果用戶從其電話中創(chuàng)建表示“我在星巴克”的微博條目,并且其電話上的全球定位系統(tǒng)(GPS)接收機(jī)在輸入時(shí)報(bào)告特定位置,則文本“我在星巴克”是地理標(biāo)記的數(shù)據(jù)點(diǎn)的示例。每一個(gè)這樣的地理標(biāo)記的數(shù)據(jù)點(diǎn)可以被放置在最接近那個(gè)數(shù)據(jù)點(diǎn)的分段上。(用戶位置的收集可以根據(jù)從用戶獲得的適當(dāng)權(quán)限來(lái)完成)。分段中地理標(biāo)記的數(shù)據(jù)點(diǎn)隨后相對(duì)于該分段中的實(shí)體進(jìn)行匹配。例如,表示“我在星巴克”的微博條目能夠與位于該分段中的星巴克咖啡館相匹配?;蛘撸瑮l目“我在購(gòu)買電視”能夠與該分段中的任何電子商店相匹配??梢越o每一個(gè)匹配分配置信度分?jǐn)?shù),其代表匹配是正確的置信水平。由于每一個(gè)數(shù)據(jù)點(diǎn)與地理位置相關(guān)聯(lián),所以用于給定實(shí)體的匹配的集合代表實(shí)體可能位于的地理坐標(biāo)的集合。一旦已創(chuàng)建了匹配的集合,優(yōu)化處理通過(guò)嘗試將用于分段的總的置信度分?jǐn)?shù)最大化來(lái)選擇實(shí)體的實(shí)際位置。該優(yōu)化處理可能受到某些地理約束,諸如確保已知的街道地址編號(hào)在整個(gè)分段中單調(diào)遞增。使得總的置信度分?jǐn)?shù)最大化的實(shí)體位置的選擇可以被推定為實(shí)體的實(shí)際位置。這些位置可以被記錄在數(shù)據(jù)庫(kù)中,并且可以由諸如在線地圖之類的應(yīng)用來(lái)使用。提供這個(gè)概述部分來(lái)以簡(jiǎn)化的形式介紹下面在詳細(xì)描述部分中進(jìn)一步描述的概念的選擇。這個(gè)概述部分并不打算標(biāo)識(shí)所請(qǐng)求保護(hù)的主題的關(guān)鍵特征或基本特征,也不打算用于限制所請(qǐng)求保護(hù)的主題的范圍。


圖1是示例街道網(wǎng)格的框圖。圖2和3 —起是確定實(shí)體的位置的示例處理的流程圖。圖4是顯示示例分配位置給實(shí)體的框圖。圖5是響應(yīng)具有地理?xiàng)l件的搜索請(qǐng)求的示例處理的流程圖。圖6是可以與這里描述的主題的實(shí)施方式結(jié)合使用的示例組件的框圖。
具體實(shí)施例方式許多應(yīng)用利用企業(yè)或其他實(shí)體的實(shí)際位置。例如,一些搜索應(yīng)用允許用戶搜索滿足地理約束的企業(yè)。一些地圖應(yīng)用嘗試顯示某些企業(yè)或在城市的摘要地圖上或在城市的街道級(jí)圖像上疊加的精確位置。一些應(yīng)用組合這些功能,例如,搜索引擎可以響應(yīng)于查詢而顯示一組企業(yè),同時(shí)也顯示這些企業(yè)在地圖上的位置。一般而言,企業(yè)或其他實(shí)體的位置從街道地址中進(jìn)行推斷。有關(guān)街道網(wǎng)格的某些信息可能是已知的,諸如哪一個(gè)街區(qū)包含編號(hào)為100-199的地址,以及街道的哪一側(cè)包含偶數(shù)編號(hào)的地址。但是,根據(jù)其地址的有關(guān)實(shí)體位置的任何推斷是一種近似。有時(shí),實(shí)際的“地面上(on the ground)”數(shù)據(jù)能夠提供企業(yè)地址的更精確指示。這樣的實(shí)際數(shù)據(jù) (on-the-ground data)可能包括實(shí)體的緯度和經(jīng)度坐標(biāo)的實(shí)體的自我報(bào)告。或者,在另一個(gè)示例中,這樣的數(shù)據(jù)可能包括來(lái)自個(gè)人的陳述,諸如包含文本“我在星巴克”的微博條目以及從中發(fā)送該條目的坐標(biāo)(其中該個(gè)人可以給予合適的權(quán)限來(lái)公開這些坐標(biāo))。這里描述的主題允許收獲這種實(shí)際數(shù)據(jù),以便發(fā)現(xiàn)企業(yè)和其他實(shí)體的準(zhǔn)確位置。 實(shí)體被分配到街道網(wǎng)格的分段。分段是包含特定范圍的編號(hào)(一般只有奇數(shù)編號(hào)或偶數(shù)編號(hào))的街區(qū)。包含在范圍100-199中的偶數(shù)建筑物編號(hào)的“第一街道”的街區(qū)是分段的示例。 實(shí)體基于其已知的地址被分配給分段,其中可以從目錄中獲悉這些地址?;蛘?,如果沒(méi)有地址是可用的,那么能夠基于與分段的地理接近度來(lái)將實(shí)體分配給該分段。此外,可能提供有關(guān)實(shí)體位置的提示的地理標(biāo)記的數(shù)據(jù)點(diǎn)被分配給分段。地理標(biāo)記的數(shù)據(jù)點(diǎn)是與已知的地理位置相關(guān)聯(lián)的任何類型的信息,并且這些數(shù)據(jù)點(diǎn)能夠基于其與分段的接近度而被分配給這些分段。在可選的預(yù)處理動(dòng)作中能夠群集(cluster)彼此非常靠近并與相同的實(shí)體相關(guān)聯(lián)的數(shù)據(jù)點(diǎn),從而減少該技術(shù)必須處理的數(shù)據(jù)點(diǎn)的數(shù)量。一旦數(shù)據(jù)點(diǎn)和實(shí)體被分配給分段,那么被分配給相同分段的數(shù)據(jù)點(diǎn)和實(shí)體彼此匹配,并且每一個(gè)匹配接收到代表數(shù)據(jù)點(diǎn)與實(shí)體真實(shí)匹配的確定性水平的分?jǐn)?shù)。例如,表示“我在星巴克”的微博條目將接收到用于匹配星巴克咖啡館的非常高的確定性分?jǐn)?shù)。表示“我在喝咖啡”的微博條目將或許與星巴克相匹配,但是具有較低的確定性水平,這是因?yàn)樵摋l目并沒(méi)有利用名稱來(lái)標(biāo)識(shí)匹配實(shí)體。一旦已為所有的匹配進(jìn)行了評(píng)分,則可以從數(shù)據(jù)點(diǎn)的匹配集合中給每一個(gè)實(shí)體分配沿著該分段的位置。分配位置給實(shí)體的處理一般設(shè)法將分段的總分最大化,這時(shí)常牽涉挑選最高的評(píng)分匹配。但是,可能具有某些物理約束條件。例如,街道上的建筑物編號(hào)通常單調(diào)遞增,因此導(dǎo)致地址沿著街道上上下下而非單調(diào)遞增的地址的位置的分配能夠被拒絕。一旦已給實(shí)體分配了位置,則可以將這些位置存儲(chǔ)在數(shù)據(jù)庫(kù)中,該數(shù)據(jù)庫(kù)可以由搜索應(yīng)用、地圖應(yīng)用等來(lái)使用。現(xiàn)在轉(zhuǎn)到附圖,圖1顯示示例街道網(wǎng)格100。街道網(wǎng)格100具有若干條街道第一街道、第二街道、第三街道、楓樹大道和橡樹大道,其中這些大道與這些街道成直角。在兩條大道之間的街道的一側(cè)的長(zhǎng)度(或者在兩個(gè)街道之間的大道的一側(cè)上)構(gòu)成一分段。例如, 分段102是介于楓樹大道和橡樹大道之間的第二街道的長(zhǎng)度。每一條街道具有兩個(gè)側(cè)邊, 并且分段可以指街道的單個(gè)側(cè)邊。在這個(gè)示例中,分段102包括相比于第一街道而言更靠近第三街道的第二街道的側(cè)邊。實(shí)體(例如,企業(yè))和數(shù)據(jù)點(diǎn)可以與特定分段相關(guān)聯(lián)。在一個(gè)示例中,實(shí)體與特定的分段相關(guān)聯(lián),這是因?yàn)?例如,如在目錄中列出的)其街道地址對(duì)應(yīng)于該分段,即其地址落入定義該分段的數(shù)值范圍內(nèi)。在圖1中,利用圓圈的“X”來(lái)標(biāo)記實(shí)體,并且顯示三個(gè)實(shí)體104、 106和108。因而,實(shí)體104可能是在目錄中被列為位于第二街道117號(hào)上的餐廳。如果分段102是第二街道的楓樹-橡樹街區(qū)的奇數(shù)編號(hào)的一側(cè),那么這個(gè)地址將實(shí)體104放置于分段102上。另一方面,實(shí)體106可能沒(méi)有已知的地址,但是緯度和經(jīng)度數(shù)據(jù)可能將那個(gè)實(shí)體放置在圖1中所示的位置上。由于與分段110相比而言,實(shí)體106稍微更靠近分段102 (如利用相應(yīng)長(zhǎng)度的虛線所示),所以實(shí)體106被確定為與分段102相關(guān)聯(lián)。另一方面,與分段102相比而言,實(shí)體108更靠近分段110 (如利用從實(shí)體108延伸的虛線所示),因此實(shí)體 108被確定為與分段110相關(guān)聯(lián)。地理標(biāo)記的數(shù)據(jù)點(diǎn)也能夠與分段相關(guān)聯(lián)。在圖1中,地理標(biāo)記的數(shù)據(jù)點(diǎn)利用圓圈的“Y”來(lái)標(biāo)記,并且顯示兩個(gè)這樣的數(shù)據(jù)點(diǎn)112和114。地理標(biāo)記的數(shù)據(jù)點(diǎn)可以是能與地理位置相關(guān)聯(lián)的任何類型的可用信息。數(shù)據(jù)點(diǎn)的一些非限制示例包括微博條目(例如,“我在星巴克”加上坐標(biāo));查詢(例如,“夏普電視的價(jià)格加上坐標(biāo)”);從街邊圖像中恢復(fù)的文本(帶有拍攝該圖像的坐標(biāo));由用戶或企業(yè)標(biāo)記的地圖上的位置;或在企業(yè)網(wǎng)站上找到的地圖或其他位置信息。例如,某個(gè)人可以從他的電話中生成微博條目。如果該電話配備有GPS接收機(jī)或其他類型的位置設(shè)備,那么該電話可以利用生成該條目的位置來(lái)標(biāo)記該微博條目。 (攜帶該電話的人可以被請(qǐng)求給予將以這種方式使用其位置的合適權(quán)限)。微博條目的示例是諸如“我在星巴克”之類的陳述。當(dāng)這樣的陳述與地理位置相關(guān)聯(lián)時(shí),使用下面描述的技術(shù),該陳述能夠用于識(shí)別星巴克咖啡館的實(shí)際位置。但是,在進(jìn)行有關(guān)地理標(biāo)記的數(shù)據(jù)點(diǎn)與哪個(gè)實(shí)體相關(guān)的確定之前,那個(gè)數(shù)據(jù)點(diǎn)首先與特定分段相關(guān)聯(lián)。數(shù)據(jù)點(diǎn)能夠被分配給最靠近與那個(gè)數(shù)據(jù)點(diǎn)相關(guān)聯(lián)的位置的分段。例如,在圖1中,數(shù)據(jù)點(diǎn)112和114最靠近分段102,
6因此它們被分配給分段102。一旦實(shí)體和數(shù)據(jù)點(diǎn)已被分配給分段,則這些數(shù)據(jù)點(diǎn)可以用于幫助確定實(shí)體在該分段中的實(shí)際地理位置。基本思想是將一個(gè)或多個(gè)數(shù)據(jù)點(diǎn)與實(shí)體相匹配,從而為實(shí)體創(chuàng)建可能位置的列表。例如,假設(shè)在分段102上具有星巴克咖啡館,并且在分段102上也具有三個(gè)似乎與星巴克相關(guān)聯(lián)的數(shù)據(jù)點(diǎn)。例如,一個(gè)這樣的數(shù)據(jù)點(diǎn)可能是聲稱列出星巴克的地理位置的網(wǎng)站。另一個(gè)數(shù)據(jù)點(diǎn)可能是陳述“我在星巴克”的微博條目,其中該條目已利用創(chuàng)建該條目所在的地理位置進(jìn)行標(biāo)記了。另一個(gè)數(shù)據(jù)點(diǎn)可能是陳述“我在咖啡館”的另一個(gè)微博條目,即使它沒(méi)有通過(guò)名稱而提及星巴克,但這由于星巴克是位于與該數(shù)據(jù)點(diǎn)相同的分段上的咖啡館的事實(shí)而能夠與星巴克相關(guān)聯(lián)。每一個(gè)數(shù)據(jù)點(diǎn)與沿著該分段的不同地理位置相關(guān)聯(lián),并因而這三個(gè)數(shù)據(jù)點(diǎn)為星巴克提供三個(gè)不同的坐標(biāo)位置。這些不同的坐標(biāo)可以進(jìn)行評(píng)分,其中分?jǐn)?shù)代表坐標(biāo)正確識(shí)別實(shí)體的位置的確定性水平。一旦分段上的所有實(shí)體與數(shù)據(jù)點(diǎn)相匹配以創(chuàng)建這些坐標(biāo)位置,則從這些坐標(biāo)中選擇這些實(shí)體在該分段上的實(shí)際位置,以便選擇其總分在這些可能性之中是最大的坐標(biāo)。雖然選擇實(shí)體的位置的處理可以嘗試將總分最大化,但是可以遵從某些限制規(guī)則,例如,基于真正的建筑物編號(hào)并不“交叉”的假設(shè), 可能具有沿著分段的建筑物編號(hào)單調(diào)遞增的規(guī)則。(即,人們將期望在真正街道上的建筑物編號(hào)按照諸如“2、6、16、……”的序列繼續(xù),并且將不期望遭遇如同“2、6、16、12、……”的序列)。圖2和3顯示用于執(zhí)行前述技術(shù)的示例處理。在轉(zhuǎn)到圖2和3的描述之前,注意 在這里包含的流程圖(在圖2-4中)參考圖1所示的組件利用示例來(lái)描述,但是這些處理可以在任何系統(tǒng)中執(zhí)行并且不限于圖1所示的情形。此外,如利用連接方框的線條所示的,圖 2-4中的每一個(gè)流程圖顯示其中以特定順序執(zhí)行處理的各階段的示例,但是這些圖中顯示的各個(gè)階段能夠以任何的順序來(lái)執(zhí)行或采用任何的組合或子組合來(lái)執(zhí)行。圖2和3的處理首先檢查分段的集合,以確定哪些實(shí)體和數(shù)據(jù)點(diǎn)與那個(gè)分段相關(guān)聯(lián)。因而,該處理在202以第一分段開始。該處理隨后繼續(xù)查找與該分段相關(guān)聯(lián)的所有實(shí)體 (方框204)和數(shù)據(jù)點(diǎn)(方框206)。如上所述,如果實(shí)體的地址的街道編號(hào)是已知的話,確定實(shí)體是否與分段相關(guān)聯(lián)可以利用該街道編號(hào)來(lái)確定(方框208)?;蛘撸鳛榱硪皇纠?,如果實(shí)體的地理位置是已知的話,可以基于該實(shí)體距分段的地理距離而將該實(shí)體與該分段相關(guān)聯(lián)(方框210)?;诮值谰幪?hào)將實(shí)體分配給分段的一個(gè)示例是如果該分段包含沿著楓樹大道的100-198中的偶數(shù)編號(hào)的地址并且目錄將所論述的實(shí)體列為具有地址楓樹大道142 號(hào),那么該實(shí)體的街道編號(hào)落入該分段的范圍之內(nèi),于是該實(shí)體能夠被分配給那個(gè)分段。參考圖1,將實(shí)體104分配給分段102是使用這種技術(shù)將實(shí)體分配給分段的示例?;诘乩砭嚯x而將實(shí)體分配給分段的一個(gè)示例是假設(shè)具有兩個(gè)分段A和B。如果沿著分段A的某個(gè)點(diǎn)與該實(shí)體相隔距離D,并且沿著分段B沒(méi)有點(diǎn)距該實(shí)體的距離小于距離D,則將該實(shí)體分配給分段A。參考圖1,將實(shí)體106分配給分段102 (與分段110相對(duì))是基于實(shí)體的地理位置來(lái)分配實(shí)體的示例。注意將數(shù)據(jù)點(diǎn)分配給分段(方框206)可以使用上面結(jié)合方框208和210所描述的相同技術(shù)來(lái)執(zhí)行。注意數(shù)據(jù)點(diǎn)有可能與從其上創(chuàng)建該數(shù)據(jù)點(diǎn)的設(shè)備中獲得的地理坐標(biāo)相關(guān)聯(lián)(例如,利用電話創(chuàng)建并利用在創(chuàng)建該條目時(shí)該電話所在的緯度和經(jīng)度進(jìn)行標(biāo)記的微博條目)。因而,數(shù)據(jù)點(diǎn)通?;谄鋵?duì)于分段的地理接近度而被分配給該分段。但是,如果街道地址信息可用于數(shù)據(jù)點(diǎn),那么街道編號(hào)信息也能夠用于將數(shù)據(jù)點(diǎn)分配給分段。在實(shí)體和數(shù)據(jù)點(diǎn)已被分配給分段之后,該處理可以確定(在212)是否具有附加的分段要考慮。如果有的話,則該處理前進(jìn)到下一分段(在214),并返回到方框204,以便將實(shí)體和數(shù)據(jù)點(diǎn)分配給下一分段。如果沒(méi)有附加的分段要考慮,那么該處理繼續(xù)至方框216。在方框216,似乎與相同的實(shí)體相關(guān)聯(lián)的靠近定位的數(shù)據(jù)點(diǎn)可以被群集在一起。 (能夠進(jìn)行這些點(diǎn)與相同的實(shí)體相關(guān)聯(lián)的某一類型的初步確定,例如,可以初步確定在地理上彼此靠近并且都提及詞“咖啡”的兩個(gè)微博條目與相同的咖啡館有關(guān))。例如,如果兩個(gè)數(shù)據(jù)點(diǎn)具有指示它們彼此間隔五英尺的地理標(biāo)記(或者滿足某一其他的接近標(biāo)準(zhǔn)),則可以假設(shè)這兩個(gè)數(shù)據(jù)點(diǎn)指的是相同的建筑物。除了位置的靠近之外,其他類型的信息也可以用于確定哪些數(shù)據(jù)點(diǎn)來(lái)自相同的建筑物。例如,如果從相同的WiFi路由器向微博服務(wù)發(fā)送兩個(gè)微博條目,則可以確定這兩個(gè)數(shù)據(jù)點(diǎn)是在相同的建筑物中生成的。(路由器的身份可以被包括在與這些微博條目一起發(fā)送的元數(shù)據(jù)或分組信息中。個(gè)人在使用WiFi熱點(diǎn)時(shí)同意的協(xié)議能夠規(guī)定將發(fā)送這樣的信息。這樣,能夠從用戶獲得收集這樣的信息的適當(dāng)同意)。作為方框216的結(jié)果,似乎彼此非??拷娜舾蓚€(gè)點(diǎn)能夠被折疊(collapse)在單個(gè)地理點(diǎn)中。 這樣做減少將不得不利用后續(xù)動(dòng)作進(jìn)行分析的地理點(diǎn)的數(shù)量。通過(guò)將顯然指的是相同實(shí)體的數(shù)據(jù)點(diǎn)折疊在單個(gè)位置中,而不是將顯然實(shí)質(zhì)上指的是相同地方的數(shù)據(jù)點(diǎn)視為它們指的是兩個(gè)不同的位置,這樣做也減小在評(píng)估給定實(shí)體位于何處時(shí)的“噪聲”。注意在方框216 執(zhí)行的群集動(dòng)作是可選的預(yù)處理動(dòng)作;該處理能夠在沒(méi)有此群集的情況下來(lái)執(zhí)行。(但是, 也注意這里描述的和/或在附圖中顯示的所有動(dòng)作是可選的;任何給定的權(quán)利要求僅要求那些在那個(gè)特定權(quán)利要求中明確列出的動(dòng)作)。在218,實(shí)體與特定數(shù)據(jù)點(diǎn)進(jìn)行匹配。此匹配處理嘗試確定哪些數(shù)據(jù)點(diǎn)(或多個(gè)數(shù)據(jù)點(diǎn))似乎指的是特定實(shí)體。例如,如果實(shí)體之一是星巴克咖啡館,那么表示“我在星巴克” 的微博條目是能夠與星巴克實(shí)體相匹配的數(shù)據(jù)點(diǎn)。此外,表示“我在喝咖啡”的條目也能夠與星巴克實(shí)體相匹配。注意表示“我在星巴克”的數(shù)據(jù)點(diǎn)能夠被視為利用比僅僅表示“我在喝咖啡”的實(shí)體(條目)更大的確定性而與星巴克實(shí)體相匹配。但是,如結(jié)合圖3的后續(xù)方框所討論的,可能具有與相同的實(shí)體相匹配的多個(gè)數(shù)據(jù)點(diǎn),并且(使用下面描述的技術(shù))有可能確定哪個(gè)數(shù)據(jù)點(diǎn)將被選擇來(lái)代表給定實(shí)體的實(shí)際位置。在220,可以分配分?jǐn)?shù)給實(shí)體與數(shù)據(jù)點(diǎn)之間的每一個(gè)匹配。該分?jǐn)?shù)代表該數(shù)據(jù)點(diǎn)實(shí)際上與該實(shí)體相關(guān)聯(lián)的確定性的水平。因而,如果將要匹配的實(shí)體是星巴克咖啡館并且數(shù)據(jù)點(diǎn)是表示“我在星巴克”的微博條目,則該數(shù)據(jù)點(diǎn)可以利用非常高的確定性水平與該實(shí)體相匹配(因?yàn)槌瞧鋵?shí)際上是在星巴克,否則某人不太可能會(huì)說(shuō)“我在星巴克”)。另一方面, 如果數(shù)據(jù)點(diǎn)是表示“我在喝咖啡”的條目,則該數(shù)據(jù)點(diǎn)可能利用中等的確定性水平與星巴克實(shí)體相匹配,這是因?yàn)閯?chuàng)建如此條目的人可能是在星巴克,但是也可能反而是在供應(yīng)咖啡的不同餐廳。分配分?jǐn)?shù)的特定方式能夠使用任何恰當(dāng)?shù)募夹g(shù)來(lái)確定。例如,機(jī)器學(xué)習(xí)技術(shù)能夠用于確定如何分配分?jǐn)?shù)。因而,能夠檢查已有的實(shí)體(例如,星巴克咖啡館)和數(shù)據(jù)點(diǎn)的集合,以便對(duì)于出現(xiàn)在數(shù)據(jù)點(diǎn)中的特定詞或短語(yǔ)(例如,“星巴克”、“咖啡”、“拿鐵”等等)來(lái)確定這些詞或短語(yǔ)將與特定類型的實(shí)體相關(guān)聯(lián)的可能性有多大。分?jǐn)?shù)分配算法能夠?qū)@種類型的數(shù)據(jù)進(jìn)行訓(xùn)練。分段中的每一個(gè)實(shí)體已與其可能的數(shù)據(jù)點(diǎn)相匹配,并且一旦如上面220所描述的那樣已為數(shù)據(jù)點(diǎn)評(píng)分,則可以找到位置的最佳分配(在222)。在一個(gè)示例中,位置的最佳分配是在也有可能保持某些物理約束條件的同時(shí)沿著使得實(shí)體的總分最大化的分段選擇實(shí)體的位置的方式。圖4顯示這種分配如何工作的示例?,F(xiàn)在轉(zhuǎn)到圖4,將理解實(shí)體的可能位置是離散的。換言之,在分析與分段相關(guān)聯(lián)的數(shù)據(jù)點(diǎn)之后,實(shí)體與數(shù)據(jù)點(diǎn)相匹配(在圖3的218)。因而,給定實(shí)體的可能位置不是沿著分段的任意位置;相反,給定實(shí)體的可能位置是與已匹配該實(shí)體的數(shù)據(jù)點(diǎn)相關(guān)聯(lián)的那些位置。如上所解釋的,在這種匹配處理發(fā)生之后,給定實(shí)體可能已被發(fā)現(xiàn)與一個(gè)以上的數(shù)據(jù)點(diǎn)相匹配,其中每一個(gè)匹配能夠被分配“確定性分?jǐn)?shù)”,其反映該數(shù)據(jù)點(diǎn)和它被認(rèn)為與之相關(guān)的實(shí)體實(shí)際上相關(guān)的可能性。因而,優(yōu)化位置的處理可以牽涉從沿著分段的可能位置中選擇將那個(gè)分段上的實(shí)體之中總的確定性分?jǐn)?shù)最大化的實(shí)際位置。圖4使用兩個(gè)實(shí)體來(lái)顯示這個(gè)思想的具體示例。在圖4中,特定分段上的兩個(gè)實(shí)體(A和B)已知具有地址楓樹大道12號(hào)和楓樹大道20號(hào)。楓樹大道12號(hào)可能是星巴克咖啡館實(shí)體,而楓樹大道20號(hào)可能是麥當(dāng)勞餐廳實(shí)體。楓樹大道12號(hào)已匹配具有三個(gè)不同位置的三個(gè)數(shù)據(jù)點(diǎn)402、404和406。(返回參考圖 2中的216,注意給定的數(shù)據(jù)點(diǎn)可能實(shí)際上指的是被推斷為與相同的實(shí)體相關(guān)的數(shù)據(jù)點(diǎn)的群集;這樣的數(shù)據(jù)點(diǎn)可能已被折疊為單個(gè)數(shù)據(jù)點(diǎn)。例如,數(shù)據(jù)點(diǎn)402可能實(shí)際上已從若干微博條目中推導(dǎo)出,其中這些微博條目在彼此相距幾英尺內(nèi)制作或通過(guò)相同的WiFi路由器發(fā)送)。在這個(gè)示例中,每一個(gè)數(shù)據(jù)點(diǎn)402、404和406分別具有與之相關(guān)聯(lián)的確定性分?jǐn)?shù) 0. 1,0. 5和0. 2。類似地,楓樹大道20號(hào)與四個(gè)數(shù)據(jù)點(diǎn)408、410、412和414相關(guān)聯(lián),這些數(shù)據(jù)點(diǎn)分別具有確定性分?jǐn)?shù)0. 6,0. 2,0. 1和0. 5。沿著分段416的這些數(shù)據(jù)點(diǎn)的地理位置利用其位置來(lái)顯示(例如,分段416可以是地址0到99的楓樹大道的偶數(shù)側(cè)邊)。如果查看這些數(shù)據(jù)點(diǎn)及其確定性分?jǐn)?shù),能夠看出這些分?jǐn)?shù)之和能夠通過(guò)給楓樹大道20號(hào)分配與數(shù)據(jù)點(diǎn)408相關(guān)聯(lián)的位置以及給楓樹大道12號(hào)分配與數(shù)據(jù)點(diǎn)404相關(guān)聯(lián)的位置而被最大化,這產(chǎn)生0. 6+0. 5=1. 1的總分。但是,這種位置的分配可能違反時(shí)常應(yīng)用于街道的物理?xiàng)l件即,它將較高編號(hào)放置在較低編號(hào)之前。(圖4中在分段416下方的箭頭的方向顯示從左向右升序的建筑物編號(hào))。因而,給實(shí)體分配位置的處理可以搜索不同的解決方案。如能夠看出的,選擇數(shù)據(jù)點(diǎn)402和410滿足街道編號(hào)在整個(gè)分段中單調(diào)遞增的條件,但是這個(gè)選擇產(chǎn)生低得多的0. 1+0. 2=0. 3的總分。但是,數(shù)據(jù)點(diǎn)404和414的選擇滿足單調(diào)遞增條件,并產(chǎn)生0. 5+0. 5=1. 0的分?jǐn)?shù)。這個(gè)分?jǐn)?shù)是在也滿足單調(diào)遞增條件的同時(shí)在所顯示的示例中能夠?qū)崿F(xiàn)的最大分?jǐn)?shù)。因而,數(shù)據(jù)點(diǎn)406和414代表最佳的解決方案。因而,返回到圖2,在222執(zhí)行的動(dòng)作設(shè)法在可能也滿足各種物理約束條件的同時(shí)查找最佳的解決方案。這些約束條件的示例包括沒(méi)有數(shù)據(jù)點(diǎn)將與兩個(gè)獨(dú)立的企業(yè)相匹配的思想(方框224),并且也包括沿著街道的編號(hào)在某個(gè)方向單調(diào)遞增的思想(方框226)。如上面結(jié)合圖4所證明的,這些條件中的后一個(gè)條件(其施加是可選的)意味著諸如12、20、32、 36,72之類的序列是合法的(72、36、32、20、12也是如此,這是因?yàn)槟莻€(gè)序列在相反的方向遞增);但是12、32、20、36、72將不是合法的,這是因?yàn)檫@些數(shù)字并沒(méi)有在一個(gè)方向單調(diào)遞
+曰O一旦選擇數(shù)據(jù)點(diǎn)至企業(yè)的最佳分配,則在228生成用于這些實(shí)體的地理坐標(biāo)的集合。實(shí)體的這些地理坐標(biāo)是222的優(yōu)化處理為那個(gè)企業(yè)選擇的數(shù)據(jù)點(diǎn)相對(duì)應(yīng)的坐標(biāo)。
當(dāng)處理(諸如上述的處理)用于將地理位置分配給實(shí)體時(shí),所分配的位置可以采用任何的方式來(lái)使用。但是,這樣的一組位置的一個(gè)示例應(yīng)用是響應(yīng)具有地理?xiàng)l件的搜索請(qǐng)求。圖5顯示對(duì)這樣的搜索請(qǐng)求進(jìn)行響應(yīng)的示例處理。在502,實(shí)體位置的數(shù)據(jù)庫(kù)被創(chuàng)建。例如,這樣的數(shù)據(jù)庫(kù)可以使用上面結(jié)合圖2和 3所描述的處理來(lái)創(chuàng)建,但是該數(shù)據(jù)庫(kù)也能夠使用任何適當(dāng)?shù)奶幚韥?lái)創(chuàng)建。在504,接收查詢,其中該查詢具有地理分量。例如,“咖啡98052”是帶有地理分量的查詢它尋找“咖啡”, 但是它也規(guī)定有關(guān)(通過(guò)包括為Redmond,Washington的郵政編碼的“98052”)尋找的結(jié)果的一些地理特征?!癈offee Redmond, WA”是帶有地理分量的查詢的另一個(gè)示例。此外,如果有關(guān)查詢的地理上下文的一些信息是已知的(例如,用戶正在其當(dāng)前位置是已知的無(wú)線電話上輸入查詢,或者用戶先前已注冊(cè)了特定的城市作為他或她的默認(rèn)位置),那么甚至查詢“咖啡”可以被理解為具有地理分量,這是因?yàn)閷?shí)際的位置將是不言而喻的(即使沒(méi)有明確說(shuō)明)。在506,數(shù)據(jù)庫(kù)用于生成響應(yīng)于該查詢的結(jié)果。例如,數(shù)據(jù)庫(kù)可能具有所有咖啡館及其相關(guān)聯(lián)位置的列表。如果該查詢尋找在Redmond,Washington中的咖啡館,那么該查詢結(jié)果能夠是Redmond,Washington中的所有咖啡館的列表(或者,例如,在城鎮(zhèn)中心的一英里半徑范圍內(nèi)的所有咖啡館)。這些結(jié)果也可以包括至這些咖啡館的地圖,其顯示這些咖啡館在該地圖上的實(shí)際位置(或者,至少,已利用諸如上面結(jié)合圖2和3描述的處理所推定的位置)。此外,這些結(jié)果可能包括或者鏈接到這些咖啡館的街道級(jí)視圖,并且某一類型的視覺(jué)標(biāo)記(例如,“圖釘”圖形或箭頭)能夠被疊加在街道級(jí)圖像上,以顯示特定咖啡館的實(shí)際的(或推定的)位置。無(wú)論結(jié)果采取的形式如何,在508,這些結(jié)果可以有形地被提供給用戶。例如,這些結(jié)果可以被傳送給用戶或者以耐用的、非暫時(shí)性的方式進(jìn)行存儲(chǔ)。圖6顯示其中可以部署在這里描述的主題的各方面的示例環(huán)境。計(jì)算機(jī)600包括一個(gè)或多個(gè)處理器602以及一個(gè)或多個(gè)數(shù)據(jù)記憶組件604。一個(gè)或多個(gè)處理器602通常是微處理器,諸如在個(gè)人臺(tái)式或膝上計(jì)算機(jī)、服務(wù)器、手持計(jì)算機(jī)或另一類型的計(jì)算設(shè)備中找到的那些微處理器。一個(gè)或多個(gè)數(shù)據(jù)記憶組件604是能夠短期或長(zhǎng)期存儲(chǔ)數(shù)據(jù)的組件。一個(gè)或多個(gè)數(shù)據(jù)記憶組件604的示例包括硬盤、可拆卸磁盤(包括光盤和磁盤)、易失性和非易失性隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、閃存、磁帶等等。 一個(gè)或多個(gè)數(shù)據(jù)記憶組件是計(jì)算機(jī)可讀存儲(chǔ)媒體的示例。計(jì)算機(jī)600可以包括顯示器612 或者與顯示器612相關(guān)聯(lián),其中顯示器可以是陰極射線管(CRT)監(jiān)視器、液晶顯示器(IXD) 監(jiān)視器或任何其他類型的監(jiān)視器。 軟件可以存儲(chǔ)在一個(gè)或多個(gè)數(shù)據(jù)記憶組件604中,并且可以運(yùn)行在一個(gè)或多個(gè)處理器602上。這樣的軟件的示例是實(shí)體定位軟件606,其可以實(shí)現(xiàn)上面結(jié)合圖1-5所描述的一些或所有的功能,但是能夠使用任何類型的軟件。例如,軟件606可以通過(guò)一個(gè)或多個(gè)組件來(lái)實(shí)現(xiàn),其中組件可以是分布式系統(tǒng)中的組件、單獨(dú)的文件、單獨(dú)的功能、單獨(dú)的對(duì)象、單獨(dú)的代碼行等等。其中程序被存儲(chǔ)在硬盤上、被加載到RAM中以及被運(yùn)行在計(jì)算機(jī)的一個(gè)或多個(gè)處理器上的計(jì)算機(jī)(例如,個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持計(jì)算機(jī)等等)代表圖6中所描繪的情形,但是在這里描述的主題并不限于這個(gè)示例。 在這里描述的主題能夠被實(shí)現(xiàn)為存儲(chǔ)在一個(gè)或多個(gè)數(shù)據(jù)記憶組件604中并運(yùn)行
10在一個(gè)或多個(gè)處理器602上的軟件。作為另一個(gè)示例,該主題能夠被實(shí)現(xiàn)為存儲(chǔ)在一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)媒體上的指令。諸如光盤或磁盤之類的有形媒體是存儲(chǔ)媒體的示例。 這些指令可以存在于非暫時(shí)性媒體上。這樣的指令當(dāng)由計(jì)算機(jī)或其他機(jī)器運(yùn)行時(shí)可以導(dǎo)致計(jì)算機(jī)或其他機(jī)器執(zhí)行方法的一個(gè)或多個(gè)動(dòng)作。用于執(zhí)行這些動(dòng)作的指令可以存儲(chǔ)在一個(gè)介質(zhì)上,或者能夠在多個(gè)媒體上進(jìn)行展開,因此這些指令可能一起出現(xiàn)在一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)媒體上,而無(wú)論所有的指令是否碰巧在相同的介質(zhì)上。此外,在這里描述的任何動(dòng)作(無(wú)論是否在圖中顯示)可以由處理器(例如,一個(gè)或多個(gè)處理器602)作為方法的一部分來(lái)執(zhí)行。因而,如果在這里描述動(dòng)作A、B和C,那么可以執(zhí)行包括A、B和C的動(dòng)作的方法。此外,如果在這里描述動(dòng)作A、B和C,那么可以執(zhí)行包括使用處理器來(lái)執(zhí)行A、B和C的動(dòng)作的方法。在一個(gè)示例環(huán)境中,計(jì)算機(jī)600可以通過(guò)網(wǎng)絡(luò)608而通信地連接到一個(gè)或多個(gè)其他設(shè)備??赡茉诮Y(jié)構(gòu)上與計(jì)算機(jī)600相類似的計(jì)算機(jī)610是能夠被連接到計(jì)算機(jī)600的設(shè)備的示例,但是其他類型的設(shè)備也可以如此進(jìn)行連接。雖然以特定于結(jié)構(gòu)特征和/或方法動(dòng)作的語(yǔ)言描述了主題,但是將明白在所附的權(quán)利要求書中定義的主題不一定限于上述的特定特征或動(dòng)作。相反,上述的特定特征和動(dòng)作被披露為實(shí)現(xiàn)這些權(quán)利要求的示例形式。
權(quán)利要求
1.一種識(shí)別實(shí)體的位置的方法,該方法包括查找(204)落入地圖(100)的分段(102)內(nèi)的實(shí)體(104,106); 查找(206)落入所述地圖(100)的所述分段(102)內(nèi)的地理標(biāo)記的數(shù)據(jù)點(diǎn)(112,114); 查找(218)所述實(shí)體(104,106)與所述數(shù)據(jù)點(diǎn)(112,114)之間的匹配集合; 對(duì)于所述匹配集合中的每一個(gè)匹配,給所述匹配分配(220)代表所述匹配中的數(shù)據(jù)點(diǎn) (112)與所述匹配中的實(shí)體(104)相對(duì)應(yīng)的確定性水平的分?jǐn)?shù); 從所述匹配集合中創(chuàng)建(222)所述實(shí)體的位置的最佳分配; 基于所述最佳分配,生成(228)所述實(shí)體在所述分段中的位置坐標(biāo);以及將所述位置坐標(biāo)存儲(chǔ)在數(shù)據(jù)庫(kù)(506)中。
2.權(quán)利要求1的方法,其中查找落入所述分段內(nèi)的實(shí)體和數(shù)據(jù)點(diǎn)包括基于與任何其他的分段相比、實(shí)體或數(shù)據(jù)點(diǎn)更靠近所述分段,將所述實(shí)體或所述數(shù)據(jù)點(diǎn)分配給所述分段。
3.權(quán)利要求1的方法,其中查找落入所述分段內(nèi)的實(shí)體包括基于實(shí)體具有落入數(shù)值范圍內(nèi)的地址,將所述實(shí)體分配給所述分段,其中所述分段對(duì)應(yīng)于落入所述數(shù)值范圍內(nèi)的地址。
4.權(quán)利要求1的方法,其中所述最佳分配的所述創(chuàng)建包括在滿足物理約束條件的同時(shí),從所述匹配集合中選擇導(dǎo)致的總分將比由于所述匹配之中任何其他的位置選擇而導(dǎo)致的總分更高的位置。
5.權(quán)利要求4的方法,其中所述物理約束條件包括沒(méi)有兩個(gè)實(shí)體位于相同位置上的條件。
6.權(quán)利要求4的方法,其中所述物理約束條件包括地址編號(hào)在通過(guò)所述分段的方向單調(diào)遞增的條件。
7.權(quán)利要求1的方法,進(jìn)一步包括群集所述分段上滿足接近標(biāo)準(zhǔn)并且被確定為與相同的實(shí)體相關(guān)聯(lián)的地理標(biāo)記的數(shù)據(jù)點(diǎn)ο
8.權(quán)利要求1的方法,其中所述地圖代表街道網(wǎng)格。
9.權(quán)利要求1的方法,其中所述分段是街道在街道網(wǎng)格的一個(gè)街區(qū)上的側(cè)邊。
10.權(quán)利要求1的方法,其中分段被定義為街道上位于數(shù)字范圍內(nèi)并且是偶數(shù)編號(hào)的地址或被定義為所述街道上位于所述數(shù)字范圍內(nèi)是奇數(shù)編號(hào)的地址。
11.權(quán)利要求1的方法,進(jìn)一步包括 接收具有地理分量的搜索查詢;使用所述數(shù)據(jù)庫(kù)來(lái)生成響應(yīng)于所述查詢的結(jié)果集合;以及給用戶提供所述結(jié)果集合。
12.權(quán)利要求1的方法,其中所述數(shù)據(jù)點(diǎn)包括微博條目,其中所述微博條目中的每一個(gè)包括由用戶提供的文本以及從中制作所述微博條目的位置的緯度和經(jīng)度坐標(biāo)。
13.一種計(jì)算機(jī)可讀介質(zhì),其具有用于執(zhí)行權(quán)利要求1-12之中任一權(quán)利要求的方法的計(jì)算機(jī)可執(zhí)行指令。
14.一種用于識(shí)別實(shí)體的位置的系統(tǒng),該系統(tǒng)包括 存儲(chǔ)器(604);處理器(602);和存儲(chǔ)在所述存儲(chǔ)器(604)中并運(yùn)行在所述處理器(604)上的組件(606),其中所述組件將實(shí)體(104,106)的集合和地理標(biāo)記的數(shù)據(jù)點(diǎn)(112,114)的集合分配(204,206)給街道網(wǎng)格(100)的分段(102),所述分段(102)是數(shù)值范圍內(nèi)的街道的偶數(shù)或奇數(shù)側(cè)邊,其中所述組件(606)或基于地址或基于所述實(shí)體(104,106)和所述地理標(biāo)記的數(shù)據(jù)點(diǎn)(112,114) 與所述分段(102)的地理接近度而將所述實(shí)體(104,106)和所述地理標(biāo)記的數(shù)據(jù)點(diǎn)(112, 114)分配給所述分段(102),其中所述組件(606)創(chuàng)建在相同分段(102)中在實(shí)體(104, 106)與地理標(biāo)記的數(shù)據(jù)點(diǎn)(112,114)之間的匹配集合,并且給所述匹配集合中的每一個(gè)匹配分配(220)代表所述匹配中的地理標(biāo)記的數(shù)據(jù)點(diǎn)(112)與所述匹配中的實(shí)體(104)相對(duì)應(yīng)的確定性水平的分?jǐn)?shù),其中所述組件(606)從所述匹配中查找創(chuàng)建比任何其他的位置分配都更高的總分、滿足物理約束條件(2 ,2 )的所述實(shí)體(104,106)的位置分配,以及其中所述組件(606)將所述位置集合存儲(chǔ)在數(shù)據(jù)庫(kù)中。
15.權(quán)利要求14的系統(tǒng),其中所述物理約束條件包括所述實(shí)體的地址在通過(guò)所述分段的方向單調(diào)遞增的條件。
全文摘要
可以基于各種類型的數(shù)據(jù)給企業(yè)和其他實(shí)體分配地理位置。在一個(gè)示例中,實(shí)體與街道網(wǎng)格中的分段相關(guān)聯(lián)。此外,數(shù)據(jù)點(diǎn)(例如,地理標(biāo)記的博客條目或其他的在線信息)與街道網(wǎng)格中的分段相關(guān)聯(lián)。對(duì)于給定的分段,數(shù)據(jù)點(diǎn)與實(shí)體進(jìn)行比較,以識(shí)別數(shù)據(jù)點(diǎn)與實(shí)體之間的可能匹配。給每一個(gè)匹配分配分?jǐn)?shù),并且每一個(gè)匹配代表用于給定實(shí)體的可能的物理位置。基于實(shí)體的哪一個(gè)分配在滿足一個(gè)或多個(gè)物理約束條件的同時(shí)優(yōu)化該分段的總分而從這些匹配之中分配實(shí)體在街道上的位置。
文檔編號(hào)G09B29/10GK102411615SQ20111033404
公開日2012年4月11日 申請(qǐng)日期2011年10月28日 優(yōu)先權(quán)日2010年10月31日
發(fā)明者埃普什泰因 B., 奧菲克 E. 申請(qǐng)人:微軟公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1