專利名稱:用于地圖搜索的查詢解析的制作方法
技術(shù)領(lǐng)域:
本專利文獻涉及地圖搜索,包括用于地圖搜索的系統(tǒng)、裝置和方法。
背景技術(shù):
地圖搜索是在由一個或多個通信網(wǎng)絡(luò)(諸如因特網(wǎng))中的一個或多個計算機服務(wù)器提供的數(shù)字地理地圖和數(shù)據(jù)庫中的基于計算機的搜索。計算機用戶可以使用地圖搜索引擎來從數(shù)字地理地圖和相關(guān)聯(lián)的數(shù)據(jù)庫搜索并且獲取文檔、文件或數(shù)據(jù),其中該地圖搜索引擎是計算機程序。
發(fā)明內(nèi)容
提供了用于基于用戶查詢解析的地圖搜索的基于計算機的系統(tǒng)、裝置和方法的實現(xiàn)。在一個方面中,提供了一種計算機實現(xiàn)的地圖搜索方法,該方法包括將來自用戶的、用于地圖搜索的輸入條目解析成用于指示輸入搜索條目中的位置信息的位置部分以及用于指示與該輸入條目中的該位置部分相關(guān)聯(lián)的搜索目標的查詢部分;以及實施地圖搜索以便基于該位置部分獲得地理區(qū)域或位置、以及以便搜索關(guān)于與該查詢部分相關(guān)聯(lián)并且位于所獲得的地理區(qū)域或位置處、之內(nèi)或附近的一個或多個實體的信息。在另一個方面中,提供了一種計算機實現(xiàn)的地圖搜索方法,該方法包括將從用戶接收的、用于地圖搜索的輸入條目分解成包括一個或多個令牌(token)的令牌序列,其中每個令牌包括用于表示該輸入條目的段的項以及給該項注釋的、用于指示該項的類型的類型;以及確定該令牌序列的可能的分割位置,其中,可能的分割位置將該令牌序列分割成一個或兩個子序列。該方法還包括對于每個該可能的分割位置確定可能的分割方式,其中, 每個可能的分割方式將該令牌序列分割成以下中的至少一個(1)用于指示位置信息的可能的位置部分和( 用于指示與該位置部分相關(guān)聯(lián)的搜索目標的可能的查詢部分;對于每個該可能的分割方式的正確性的概率確定分割得分;以及選擇具有最高分割得分的該可能的分割方式作為結(jié)果分割方式。在另一個方面中,提供了一種用于提供計算機實現(xiàn)的地圖搜索的系統(tǒng),該系統(tǒng)包括解析模塊,用于將從用戶接收的、用于地圖搜索的輸入條目解析成位置部分和查詢部分中的至少一個;以及搜索模塊,用于接收來自該解析模塊的輸出并且在接收到所解析的位置部分和查詢部分之后搜索與該解析的位置部分和查詢部分相關(guān)的信息以便向該用戶返回地圖搜索結(jié)果。在一個實現(xiàn)中,該系統(tǒng)可以包括計算機網(wǎng)絡(luò),用于向該解析模塊和該搜索模塊并且向計算機提供通信;以及客戶端計算機,該客戶端計算機與該計算機網(wǎng)絡(luò)通信以便從該用戶接收用于地圖搜索的該輸入條目并且以便從該搜索模塊接收結(jié)果。該計算機網(wǎng)絡(luò)將來自該客戶端計算機的該輸入條目導(dǎo)向該解析模塊并且將來自該搜索模塊的結(jié)果導(dǎo)向該客戶端計算機。在另一個方面中,提供了一種用于提供計算機實現(xiàn)的地圖搜索的系統(tǒng),該系統(tǒng)包括令牌模塊,用于將從用戶接收的、用于地圖搜索的輸入條目用令牌表示成包括至少一個令牌的令牌序列,其中每個令牌包括用于表示該輸入條目的段的項以及給該項注釋的類型;用于確定該令牌序列的可能的分割位置的裝置,其中,可能的分割位置將該令牌序列分割成一個或兩個子序列;用于對于每個該可能的分割位置確定可能的分割方式的裝置,其中每個可能的分割方式將該令牌序列分割成可能的查詢部分和可能的位置部分中的至少一個;用于對于每個該可能的分割方式確定分割得分的裝置;用于選擇具有最高分割得分的該可能的分割方式作為結(jié)果分割方式的裝置;以及搜索模塊,用于接收來自該令牌模塊的輸出以實施地圖搜索并且生成到該用戶的地圖搜索結(jié)果。在另一個方面中,提供了一種用于提供計算機實現(xiàn)的地圖搜索的系統(tǒng),該系統(tǒng)包括用于接收由用戶輸入的輸入條目的接口;以及處理單元,用于解析該輸入條目以便將該輸入條目分割成位置部分和查詢部分中的至少一個并且基于解析結(jié)果搜索與該輸入條目相關(guān)的信息。如果該輸入條目被分割成位置部分和查詢部分,則該處理單元基于該位置部分確定地理區(qū)域并且搜索關(guān)于與該查詢部分相關(guān)聯(lián)并且位于該地理區(qū)域中的實體的信肩、ο在另一個方面中,提供了一種用于提供計算機實現(xiàn)的地圖搜索的系統(tǒng),該系統(tǒng)包括用于接收由用戶輸入的輸入條目的接口 ;處理單元,用于將該輸入條目令牌化成包括至少一個令牌的令牌序列并且確定該令牌序列的可能的分割位置。每個令牌包括用于表示該輸入條目的段的項以及給該項注釋的類型,并且可能的分割位置將該令牌序列分割成一個或兩個子序列。該處理單元對于每個該可能的分割位置確定可能的分割方式,每個可能的分割方式將該令牌序列分割成可能的位置部分和/或可能的查詢部分;對于每個可能的分割方式確定分割得分;以及選擇具有最高分割得分的該可能的分割方式作為結(jié)果分割方式。在另一個方面中,提供了一種用于存儲指令的機器可讀記錄介質(zhì)。當(dāng)該指令由機器執(zhí)行時使得該機器執(zhí)行以下步驟在基于來自用戶的、用于地圖搜索的輸入條目實施該地圖搜索之前,將該輸入條目解析成用于指示該輸入搜索條目中的位置信息的位置部分和用于指示與該輸入條目中的該位置部分相關(guān)聯(lián)的搜索目標的查詢部分;以及實施地圖搜索以便基于該位置部分獲得地理區(qū)域或位置、以及以便搜索關(guān)于與該查詢部分相關(guān)聯(lián)并且位于所獲得的地理區(qū)域或位置處、之內(nèi)或附近的一個或多個實體的信息。在另一個方面中,提供了一種用于記錄多個指令的機器可讀記錄介質(zhì)。當(dāng)該指令由機器執(zhí)行時使得該機器執(zhí)行以下動作將從用戶接收的輸入條目令牌化成包括至少一個令牌的令牌序列,其中每個令牌包括用于表示該輸入條目的段的項以及給該項注釋的類型;確定該令牌序列的可能的分割位置,其中可能的分割位置將該令牌序列分割成一個或兩個子序列;對于每個該可能的分割位置確定可能的分割方式,其中每個可能的分割方式將該令牌序列分割成可能的查詢部分和/或可能的位置部分;對于每個可能的分割方式確定分割得分;以及選擇具有最高分割得分的該可能的分割方式作為結(jié)果分割方式。在又一個方面中,提供了一種計算機實現(xiàn)的地圖搜索方法,該方法包括使得在基于來自用戶的、用于地圖搜索的輸入條目實施該地圖搜索之前,將該輸入條目解析成用于指示輸入搜索條目中的位置信息的位置部分和用于指示與該輸入條目中的該位置部分相關(guān)聯(lián)的搜索目標的查詢部分。執(zhí)行對該輸入條目的該解析,而無需在先搜索對應(yīng)于由該輸入條目所指示的位置的地理編碼。該方法包括使得實施地圖搜索以便基于該位置部分獲得地理區(qū)域或位置、以及以便搜索關(guān)于與該查詢部分相關(guān)聯(lián)并且位于所獲得的地理區(qū)域或位置處、之內(nèi)或附近的一個或多個實體的信息。可以實現(xiàn)本文所述的用于計算機實現(xiàn)的地圖搜索的以上以及其他方面,以實現(xiàn)一個或多個以下優(yōu)點,包括有效的地圖搜索、地圖搜索結(jié)果的高準確性以及地圖搜索結(jié)果到用戶的快速遞送。在附圖、說明書和權(quán)利要求中詳細描述了用于計算機實現(xiàn)的地圖搜索的系統(tǒng)、裝置和方法的以上以及其他方面的示例和實現(xiàn)。
圖1是其中實現(xiàn)地圖搜索的系統(tǒng)和方法的網(wǎng)絡(luò)系統(tǒng)100的示例圖。圖2是用于將輸入條目分割成位置部分和查詢部分的解析系統(tǒng)200的概念圖。圖3是用于示出在圖2中示出的字典MO的示例性結(jié)構(gòu)的示意圖。圖4是用于圖示訓(xùn)練統(tǒng)計模型的示例的流程圖。圖5是用于示出在圖2中示出的模型250的示例性結(jié)構(gòu)的示意圖。圖6A是用于圖示解析輸入條目的示例性過程的流程圖。圖6B是用于圖示解析輸入條目的另一個示例性過程的流程圖。圖7A圖示了用于計算令牌序列的位置統(tǒng)計得分的示例性過程。圖7B圖示了用于確定令牌序列的項位置得分的示例性過程。圖7C圖示了用于確定令牌序列的類型位置得分的示例性過程。圖8A圖示了用于計算令牌序列的查詢統(tǒng)計得分的示例性過程。圖8B圖示了用于確定令牌序列的項查詢得分的示例性過程。圖8C圖示了用于確定令牌序列的類型查詢得分的示例性過程。圖9是用于圖示執(zhí)行地圖搜索的示例性過程的流程圖。圖10是用于實現(xiàn)本文檔所描述的技術(shù)的示例性設(shè)備1000的框圖。在各種附圖中相似的附圖標記指示相似的元素。
具體實施例方式在本文檔所描述的地圖搜索方法中,地圖搜索引擎處理由用戶輸入的、用于查詢的輸入條目,并且基于該輸入條目中的信息提供用于反映該用戶的興趣的一個或多個搜索結(jié)果。例如,用戶可能想要搜索關(guān)于特定條目(例如,商業(yè))或關(guān)于位于具體地理位置處、 之內(nèi)或附近的特定種類的實體的信息??梢詫崿F(xiàn)本文中所述的地圖搜索方法和系統(tǒng),以允許用戶在單個框中錄入輸入條目,智能地識別該輸入條目的用于表示在該輸入條目中所包括的地理位置的位置部分,以及該輸入條目的可以將實體或特定種類的實體表示為搜索目標的查詢部分。例如,可以處理錄入到單個框中的用戶輸入條目“煙臺酒店”,以解析出用于指定地理位置的位置部分“煙臺”以及用于表示位于該地理位置處、之內(nèi)或附近的搜索目標的查詢部分“酒店”。因此,地圖搜索引擎識別出用戶旨在查找在煙臺市之中或周邊的酒店并且執(zhí)行地圖搜索。在將輸入條目分割或解析成位置部分和查詢部分時,首先將該輸入條目解析為一個或多個段,并且對段進行分組以構(gòu)造位置部分和查詢部分。在解析期間,如此識別用于表示地址相關(guān)信息的符號、字母、詞或短語的序列,并且相應(yīng)地將該序列解析成在本文檔中被稱為“項”的單個有意義的段??梢酝ㄟ^例如使用一個或多個包括地址相關(guān)信息的字典或數(shù)據(jù)庫來實現(xiàn)對地址相關(guān)信息的識別。在對輸入條目進行解析期間,可以將參數(shù)“類型”分配給或者注釋給項,以指示該項是否包括地址相關(guān)信息,并且如果包括地址相關(guān)信息,則指示該項所表示的地址相關(guān)信息的類型。該類型注釋可用于增加地圖搜索的準確性??梢酝ㄟ^例如參考解析操作中所使用的、包括地址相關(guān)信息的一個或多個字典或數(shù)據(jù)庫來執(zhí)行類型注釋??梢灶A(yù)定義給項注釋的類型。例如,類型可以包括行政區(qū)域的等級,諸如“省”、 “市”、“區(qū)”、“縣”、“鄉(xiāng)”、“鎮(zhèn)”、“村”,以便注釋用于表示此類行政區(qū)域的項。類型還可以包括類型“路”,以指示表示路或街的項。類型還可以包括用于指示對應(yīng)于具體地址后綴或前綴的項的地址后綴或前綴,諸如“地址名后綴”、“方向后綴”(例如,南、北等)以及“量詞后綴”。值得注意的是,定義類型“空”以注釋不表示地址相關(guān)信息的項。對是否將類型“空” 分配給一個項的確定取決于由地圖搜索引擎使用的、包括地址相關(guān)信息的一個或多個字典或數(shù)據(jù)庫中的條目,并且可以將類型“空”分配給用于表示真實地理位置但是在解析操作中所使用的包括地址相關(guān)信息的一個或多個字典或數(shù)據(jù)庫中不具有匹配的項。對于不同的語言,可以基于語言的特點具體定義用于對項進行注釋的類型。在一些實現(xiàn)中,可以在實施地圖搜索之前執(zhí)行解析。就這點而言,搜索引擎可以使用解析操作的結(jié)果的位置部分來首先確定位置,例如通過當(dāng)相關(guān)聯(lián)的類型指示地址相關(guān)信息并且不是“空”時,搜索地理編碼數(shù)據(jù)庫以獲得由經(jīng)度和緯度或由其他方法標記的地理坐標碼(被稱為地理編碼)。當(dāng)項的類型是“空”時,不執(zhí)行例如通過項的地理編碼的搜索所進行的位置確定。在確定位置之后,例如,在找到與位置部分相關(guān)聯(lián)的地理編碼之后,執(zhí)行對于由例如該地理編碼定義的位置處或附近的查詢部分的搜索,并且向用戶遞送搜索結(jié)果??梢允褂迷摲椒ǖ倪@樣一種實現(xiàn)來避免依賴于基于初始輸入條目或其段來執(zhí)行地圖搜索,而無需預(yù)處理,例如,在針對匹配的地理編碼的搜索中通過無需預(yù)處理就將初始輸入條目或其段發(fā)送到地理編碼數(shù)據(jù)庫,其中該實現(xiàn)首先解析輸入條目以提取并且標識位置部分和查詢部分并且隨后通過例如獲取位置部分的地理編碼來確定位置。并且上述實現(xiàn)可以支持按照有效的方式并且在短的搜索時間內(nèi)執(zhí)行并且遞送地圖搜索,該有效的方式在相關(guān)地圖搜索結(jié)果的查找中具有高的準確性。在本文檔中,將解析和類型注釋的操作統(tǒng)稱為“令牌化”。可以將用于將輸入條目解析成段并且向輸入條目的段注釋類型的解析操作描述為將輸入條目令牌化成令牌的序列或令牌序列,其中由用于表示該輸入條目的段的項以及注釋給該項的、用于指示該項表示哪種種類的地址相關(guān)信息的類型來定義每個令牌??梢酝ㄟ^將令牌序列分割成位置部分和查詢部分來確定輸入條目的位置部分和查詢部分。在實現(xiàn)將輸入條目解析為位置部分和查詢部分時,可以使用統(tǒng)計模型來提供統(tǒng)計評分,以對該輸入條目的各種可能段的不同分組進行評級,并且可以選擇具有最高統(tǒng)計得分的段作為解析操作的結(jié)果??梢曰谟?xùn)練模型并且使用從不同數(shù)據(jù)源(諸如數(shù)據(jù)提供商、政府機構(gòu)、諸如黃頁之類的電話目錄等)獲得的訓(xùn)練數(shù)據(jù)來訓(xùn)練本文中的統(tǒng)計模型。訓(xùn)練數(shù)據(jù)包括地址和標題,標題是實體的名稱(諸如商號)。在訓(xùn)練模型中,將每個標題和地址令牌化為令牌序列,并且對于項、類型以及令牌序列中所包括的特定項序列和類型序列, 記錄在標題中出現(xiàn)的頻率以及在地址中出現(xiàn)的頻率,當(dāng)將令牌序列分割成位置部分和查詢部分時,基于統(tǒng)計模型中記錄的頻率,對每個可能的分割計算得分?;谟山y(tǒng)計模型提供的得分,可以應(yīng)用特定過濾規(guī)則來排除不正確的分割并且選擇正確的分割。圖1是適用于實現(xiàn)本文檔所描述的地圖搜索系統(tǒng)和方法的網(wǎng)絡(luò)系統(tǒng)100的示例。 網(wǎng)絡(luò)系統(tǒng)100包括一個或多個客戶端110,客戶端110經(jīng)由網(wǎng)絡(luò)130連接到一個或多個服務(wù)器120或者與一個或多個服務(wù)器120通信,網(wǎng)絡(luò)130提供客戶端110和服務(wù)器120的通信。圖1中的示例為了簡單起見示出了兩個客戶端110和兩個服務(wù)器120。在各種實現(xiàn)中, 網(wǎng)絡(luò)系統(tǒng)100可以包括更多或更少的客戶端110和服務(wù)器120。在一些實現(xiàn)中,客戶端110 可以執(zhí)行服務(wù)器120的一些功能,并且服務(wù)器120可以執(zhí)行客戶端110的一些功能??梢园凑崭鞣N配置中在網(wǎng)絡(luò)系統(tǒng)100中實現(xiàn)地圖搜索引擎,例如在一個或多個服務(wù)器120中或者在一個或多個服務(wù)器120和一個或多個客戶端110這兩者中??梢园凑崭鞣N形式實現(xiàn)客戶端110,這些形式包括諸如移動電話、個人計算機、個人數(shù)字助理(PDA)、膝上型計算機等的設(shè)備或者運行在這些設(shè)備之一上的線程或進程和/ 或可由這些設(shè)備之一執(zhí)行的對象。每個客戶端110包括用于從用戶接收輸入條目并且向該用戶呈現(xiàn)對于該輸入條目的搜索結(jié)果的地圖搜索接口,以及用于經(jīng)由網(wǎng)絡(luò)130向一個或多個服務(wù)器120傳輸該輸入條目并且從一個或多個服務(wù)器120接收搜索結(jié)果的通信接口。在圖1中的示例中,每個服務(wù)器120包括服務(wù)器實體,該服務(wù)器實體包括地圖搜索引擎的、用于解析經(jīng)由網(wǎng)絡(luò)130接收的輸入條目的解析系統(tǒng)200以及地圖搜索引擎的、用于基于解析系統(tǒng)200的解析結(jié)果來執(zhí)行地圖搜索并且返回搜索結(jié)果的地圖搜索系統(tǒng)140。經(jīng)由網(wǎng)絡(luò)130向客戶端110傳輸搜索結(jié)果。在一些實現(xiàn)中,解析系統(tǒng)200和地圖搜索系統(tǒng)140 位于各自不同的服務(wù)器中。在其他實現(xiàn)中,將解析系統(tǒng)200集成為地圖搜索系統(tǒng)140的一部分。可以將客戶端110和服務(wù)器120中的每一個經(jīng)由一個或多個通信鏈路(例如,有線的和無線的通信鏈路和連接)連接到網(wǎng)絡(luò)130??梢园凑崭鞣N通信網(wǎng)絡(luò)配置實現(xiàn)網(wǎng)絡(luò)130,這些配置諸如局域網(wǎng)(LAN)、廣域網(wǎng) (WAN)、城域網(wǎng)(MAN)、電話網(wǎng)、內(nèi)聯(lián)網(wǎng)、因特網(wǎng)或者兩個或更多個這些與其他網(wǎng)絡(luò)的組合。圖2示出了用于將來自用戶的查詢的輸入條目分割或解析成位置部分“哪里”以及查詢部分“什么”的解析系統(tǒng)200的示例,其中位置部分“哪里”表示由該輸入條目所指定的位置,并且查詢部分“什么”表示用于搜索與該位置相關(guān)聯(lián)的目標的請求。例如,輸入條目可以是“上海餐廳”(Sianghai Restaurant),其中“餐廳”是用于指示用戶搜索的目標是餐廳的查詢部分,并且“上海”是用于指示該查詢目標的位置是在上海市中或附近的位置部分?;谟山馕鱿到y(tǒng)200進行的該解析,地圖搜索系統(tǒng)140搜索在“上?!敝谢蚋浇摹安蛷d”并且返回搜索結(jié)果以用于遞送給用戶。解析系統(tǒng)200被設(shè)計為將輸入條目解析成較小的片段(piece)并且處理該較小的片段或段,以構(gòu)造位置部分和查詢部分。由解析系統(tǒng)200解析的該較小的片段或段不能過小以至于段彼此幾乎不具有統(tǒng)計相關(guān)性并且需要相當(dāng)多的處理和時間延遲來從該小片段構(gòu)造有意義的位置部分和查詢部分。例如,可以將以上輸入條目“上海餐廳”的示例分割成各種段⑴單獨的中文字符“上”、“海”、“餐”、和“廳”;⑵“上”、“海餐”和“廳”;以及 (3) “上海”和“餐廳”。示例(1)和O)中的解析出的段對于構(gòu)造位置部分和查詢部分是較無用的并且需要對較小的片段的附加分段和分組來構(gòu)造希望的位置部分和查詢部分。相反,示例(3)中的解析出的片段是正確的位置部分(“上?!?和查詢部分(“餐廳”)。由于特定語言的特定屬性,該特定語言對來自用戶的輸入條目的解析提出了挑戰(zhàn)。例如,英文的用戶查詢由英文單詞構(gòu)成,英文單詞由字母構(gòu)成,在兩個相鄰的單詞之間具有間隔,諸如在 “ShanghaiRestaurant” 中 “Shanghai ” 和 “Restaurant” 由一個空格隔開。在英文中的兩個相鄰單詞之間的該間隔提供了用于分割輸入條目的天然邊界。然而,用戶查詢的中文、 日文或韓文輸入條目可能是在兩個相鄰的字符之間沒有間隔的連續(xù)字符的序列,例如“上海餐廳”(“Sianghai Restaurant”)。本文檔所描述的解析系統(tǒng)200可以被設(shè)計為具有基于地址相關(guān)信息的一個或多個字典以及其他位置或名稱數(shù)據(jù)庫的解析智能(該與地址相關(guān)的信息包括用于表示地址的位置和名稱和后綴以及前綴),以從輸入條目提取位置信息并且以構(gòu)造正確的位置部分和查詢部分。作為一個示例,可以將解析系統(tǒng)200實現(xiàn)為包括基于地址相關(guān)信息的一個或多個字典或數(shù)據(jù)庫的令牌化器,以解析用戶查詢的輸入條目,從而使得由令牌化器保持將輸入條目中的位置名稱作為單個段。該令牌化器可以使用包括管理實體名稱、區(qū)域名稱和路名以及各種后綴和前綴的字典來執(zhí)行對輸入條目的解析,以最小化對于輸入條目中的作為位置名稱的段的不希望的分隔。例如,解析系統(tǒng)200可以將中文輸入條目中所包括的中文街道名“城府路”(Chengfu Road)保持為一個段而不是將其分割成更小的片段。該地址信息識別解析的搜索準確性和搜索響應(yīng)時間往往優(yōu)于使用以下劃分器系統(tǒng)的解析的搜索準確性和搜索響應(yīng)時間,其中該劃分器系統(tǒng)不識別地址相關(guān)信息并且將輸入條目中所包括的位置名稱劃分成更小的片段,諸如將中文街道名“城府路”劃分成單獨的中文字符“城”、“府”、 “路”。在各種實現(xiàn)中,令牌化器可以向輸入條目的段注釋類型,以指示該段是否表示地址相關(guān)信息,并且如果表示地址相關(guān)信息則指示該段所表示的地址相關(guān)信息的種類。圖2中的解析系統(tǒng)200是基于令牌的解析系統(tǒng)并且在所示的示例中,包括令牌化模塊210、模型訓(xùn)練模塊220、解析模塊230、字典240和模型250。這些模塊共同進行操作以使得解析模塊230能夠?qū)⑤斎霔l目解析成位置部分和查詢部分以用于執(zhí)行地圖搜索。令牌化模塊210基于來自位置名稱的字典MO的位置信息,將輸入條目令牌化為令牌。解析模塊230從外部接收輸入條目、向令牌化模塊210發(fā)送輸入條目以用于令牌化、從令牌化模塊210接收令牌并且基于令牌、令牌序列和來自模型250的其他項目的統(tǒng)計評分處理所接收的令牌,以執(zhí)行解析操作。模型訓(xùn)練模塊220生成并且訓(xùn)練模型250,模型訓(xùn)練模塊220 接收并且處理從一個或多個數(shù)據(jù)源獲得的訓(xùn)練數(shù)據(jù)。令牌化模塊210基于可以從例如字典240獲得的地址相關(guān)和位置相關(guān)信息,將輸入條目令牌化成令牌。在實現(xiàn)中,可以將令牌定義為包括用于表示輸入條目的段的項以及注釋給該項的類型,該類型用于指示該項是否表示地址相關(guān)信息并且如果是則指示該項表示什么種類的地址相關(guān)信息。令牌化模塊210可以識別地址相關(guān)信息,并且將地址相關(guān)信息令牌化成有意義的令牌。例如,可以由令牌化模塊210將輸入條目中的中文短語“城府路”識別為路名并且將其令牌化為單個令牌,該單個令牌包括短語“城府路”作為項以及用于指示短語“城府路”表示路名的類型“路”參數(shù)。令牌化模塊210可以使用地址相關(guān)或位置相關(guān)信息的字典240來執(zhí)行令牌化。字典240存儲地址相關(guān)信息。圖3是用于示出字典MO的示例性結(jié)構(gòu)的示意圖。字典240具有字典條目(DE) 300,并且每個DE 300具有兩個字段項字段310和類型字段320。項字段310存儲表示地址相關(guān)信息的項或短語。該項可以是地址名稱,例如,行政區(qū)域的名稱(諸如“北京市”、“朝陽區(qū)”、“朝陽”)或路名(諸如“常德道”和“城府路”)。項還可以表示地址相關(guān)后綴或地址相關(guān)前綴。例如,項可以是地址名稱后綴(諸如“省”、“市”、“區(qū)”、“縣”、“鄉(xiāng)”、“鎮(zhèn)”、 “村”、“路”、“道”)、方向前綴或后綴(諸如“東”、“西”、“南”、“北”、“東北”、“東南”、“西北”、 “西南”)或量詞后綴(諸如“號”)。項還可以是可以用于描述地址的其他詞和表達,例如, 數(shù)字。DE300的類型字段320包括用于指示該項所表示的地址相關(guān)信息的類型的類型??梢远x不同的類型。例如,類型包括行政區(qū)域的級別(諸如“省”、“市”、“區(qū)”、“縣”、“鄉(xiāng)”、 “鎮(zhèn)”、“村”)、地址后綴或前綴(諸如“地址名稱后綴”、“方向后綴”和“量詞后綴”)。類型還可以包括被定義為用于指示表示路名的對應(yīng)項的類型“路”,以及被定義為用于指示表示號(例如,街道號)的對應(yīng)項的類型“號”。還可以根據(jù)需要定義其他類型??蛇x地,字典 240的DE 300還具有語言字段330,以指示該項的語言,例如,阿拉伯文、中文、英文、德文、 日文、韓文等。在一些實現(xiàn)中,基于現(xiàn)有數(shù)據(jù)(諸如現(xiàn)有地址信息數(shù)據(jù)庫)來構(gòu)建字典對0。 在一些實現(xiàn)中,還可以根據(jù)需要預(yù)定義字典的字典條目。返回參考圖2,令牌化模塊210接收輸入條目,將輸入條目令牌化為令牌,并且輸出令牌化結(jié)果作為令牌序列。在一些實現(xiàn)中,令牌化模塊210首先基于字典240執(zhí)行令牌化,以便識別輸入條目中的地址相關(guān)詞或段。作為示例,令牌化模塊210使用前向最大匹配 (FMM)方法來基于字典240執(zhí)行令牌化。FMM方法選擇包括若干字符(例如,中文字符)的字串作為初始最大字串,并且確定初始最大字串是否與字典MO中的項匹配。如果初始最大字串與字典MO中的任何項都不匹配,則通過從該初始最大字串減去一個字符來繼續(xù)對該匹配的確定,并且確定包括其余字符的字串是否與字典MO中的項匹配,直到在字典MO 中找到匹配項或者該字串被減為空為止。在字典240中找到的匹配項和與該匹配項相關(guān)聯(lián)的類型成為令牌的項和類型。除了 FMM方法之外,還可以使用其他方法,例如,后向最大匹配(BMM)方法和雙向匹配(BM)方法??梢栽诠_文獻中找到用于實現(xiàn)FMM方法、BMM方法和BM方法的一些示例。基于字典240的以上處理標識輸入條目的可能表示位置的一個或多個部分。在一些實現(xiàn)中,即使特定的號未被作為項存儲在字典MO中,令牌化模塊210也可以識別號,并且將其令牌化成具有類型“號”的令牌。在一些實現(xiàn)中,對于輸入條目的未被識別為地址相關(guān)信息的部分,即輸入條目的在字典240中不具有匹配項的部分,令牌化模塊210可以將其劃分成詞,使得這些詞成為令牌的項,并且將該令牌的類型注釋為“空”。類型“空”指示對應(yīng)項不屬于字典240中定義的任何類型,并且對應(yīng)項不表示地址相關(guān)信息。例如,當(dāng)對中文輸入條目“城大燈具城”進行令牌化時,令牌化模塊210可以通過參考不具有將“城大”的字典條目作為位置名稱的字典240來確定中文短語“城大”不是位置名稱。由令牌化模塊210生成的令牌與由統(tǒng)計模型250提供的統(tǒng)計得分的相關(guān)聯(lián),并且解析模塊230在將輸入條目解析成位置部分和查詢部分時考慮該統(tǒng)計得分。提供解析系統(tǒng) 200的模型訓(xùn)練模塊220以用于訓(xùn)練并且更新統(tǒng)計模型250。圖4是用于圖示由模型訓(xùn)練模塊220為了訓(xùn)練統(tǒng)計模型250而執(zhí)行的過程400的示例的流程圖。在步驟S410,模型訓(xùn)練模塊220從一個或多個源獲得訓(xùn)練數(shù)據(jù)。在一些實現(xiàn)中,可以從雙框查詢?nèi)罩精@得訓(xùn)練數(shù)據(jù)。在雙框日志的質(zhì)量不足以用于高性能搜索的應(yīng)用中,可以從其他源獲得訓(xùn)練數(shù)據(jù)。例如,可以由諸如商業(yè)實體或政府部門的數(shù)據(jù)提供方提供訓(xùn)練數(shù)據(jù)。還可以從其他源(諸如黃頁、地圖數(shù)據(jù)庫等)獲得訓(xùn)練數(shù)據(jù)。訓(xùn)練數(shù)據(jù)包括地址和標題。標題表示實體的名稱,例如,如“Google”的公司名稱、如“科建大廈”的建筑名稱、如 “北京市政府”的政府機構(gòu)名稱。地址的示例包括“北京市海淀區(qū)中關(guān)村大街四號”。在一些實現(xiàn)中,在將原始獲得的原始數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)來使用之前需要對該始原數(shù)據(jù)進行預(yù)處理。對原始數(shù)據(jù)的預(yù)處理是為了去除該數(shù)據(jù)的不必要部分,例如,標題中的行政區(qū)域的前綴名稱(prefixing name)、地址中的尾標題(trailing title)等。例如,如果標題的原始數(shù)據(jù)的片段是“北京市海淀區(qū)海淀醫(yī)院”,那么該預(yù)處理通過去除前綴的行政區(qū)域名稱“北京市海淀區(qū)”,將其過濾成純標題“海淀醫(yī)院”。作為另一個示例,對于地址“北京市海淀區(qū)中關(guān)村大街四號海淀醫(yī)院”的原始數(shù)據(jù)的片段,該預(yù)處理通過去除后綴的醫(yī)院名稱“海淀醫(yī)院”將其過濾成純地址“北京市海淀區(qū)中關(guān)村大街四號”。在步驟S420,模型訓(xùn)練模塊220向令牌化模塊(例如,令牌化模塊210)傳輸已被預(yù)處理的訓(xùn)練數(shù)據(jù)中的標題和地址中的一個以執(zhí)行令牌化,并且從該令牌化模塊接收將項和類型作為令牌化結(jié)果的令牌的令牌序列??蛇x地,在步驟S430執(zhí)行類型改正,以改正在該令牌序列中錯誤地注釋的類型。根據(jù)一些預(yù)定義的規(guī)則執(zhí)行類型改正。例如,規(guī)則可以規(guī)定如果具有類型“量詞后綴”的項未緊隨具有類型“號”的項,那么將類型“量詞后綴”改為類型“空”。例如,在對地址“中關(guān)村大街四號”進行令牌化之后,獲得具有類型“號”的項“29”并且獲得具有類型“量詞后綴”的項“號”。由于具有類型“量詞后綴”的項“號”緊隨具有類型“號”的項“29”,因此將不改變項“號”。然而,在對標題“中華老字號東來順”進行令牌化之后,可能獲得具有類型“量詞后綴”的項“號”,但是相同的中文字符“號”不再表示號而是表示商業(yè)機構(gòu)的商標。因此,該類型將被改成類型“空”??蛇x擇地,在步驟S440, 可以將令牌序列中項屬于相同的后綴或前綴類型的相鄰的令牌組合成單個令牌。在步驟S450,對于令牌序列中的類型和項,分別對標題和地址中出現(xiàn)的次數(shù)進行計數(shù)。在一些實現(xiàn)中,對于令牌序列中的特定類型序列和項序列執(zhí)行計數(shù)。在一些實現(xiàn)中, 對于以下項目在標題和地址中出現(xiàn)的次數(shù)進行計數(shù)-項一元模型,其為單個項,-項二元模型,其為由兩個相鄰的項組成的項序列,-類型為“空”的相鄰的項的序列,-全部項的序列,-類型一元模型,其為單個類型,-類型二元模型,其為由兩個相鄰的類型組成的類型序列,以及-全部類型的序列例如,當(dāng)將地址“北京朝陽大屯路”令牌化為包括多個令牌[項北京,類型市]、 [項朝陽,類型區(qū)]以及[項大屯路,類型路]的令牌序列時,將對于以下項在地址中的出現(xiàn)進行計數(shù)項一元模型“北京”、“朝陽”、“大屯路”;項二元模型“北京朝陽”、朝陽大屯路“;全部項的序列“北京朝陽大屯路”;
類型一元模型“市”、“區(qū)”、“路”;類型二元模型“市、區(qū)” “區(qū)、路”;全部類型的序列“市、區(qū)、路”;在該示例中未對相鄰項的序列中類型為“空”的上述項進行計數(shù),這是因為在令牌序列[項北京,類型市]、[項朝陽,類型區(qū)]以及[項大屯路,類型路]中不存在類型為“空”的項。在步驟S460,對于每個被計數(shù)的項目,分別在模型250中存儲其在標題中出現(xiàn)的次數(shù)和在地址出現(xiàn)的次數(shù)。圖5示出了模型250的示例性結(jié)構(gòu)。模型250包括模型條目(ME) 500。每個被計數(shù)的項目在模型250中具有對應(yīng)的模型條目。在一個實現(xiàn)中,模型條目具有4個字段-“項目,,字段510,用于記錄項一元模型、類型一元模型和包括類型為“空”的相鄰項的序列的項或類型序列、全部項的序列、類型二元模型和全部類型的序列中的一個或多個的內(nèi)容;-“項目類型”字段520,用于記錄該項目的類型是以下哪種項目類型項一元模型、 類型一元模型、類型二元模型、項二元模型、類型為“空”的相鄰項的序列、全部項的序列、全部類型的序列;-“在標題中出現(xiàn)的次數(shù)”字段530,其記錄對應(yīng)的項目在標題中出現(xiàn)多少次;以及-“在地址中出現(xiàn)的次數(shù)”字段M0,其記錄對應(yīng)的項目在地址中出現(xiàn)多少次。在一些實現(xiàn)中,模型條目還可以具有第五字段“語言”字段550,用于指示該項目的
^五考慮在步驟S450針對地址“北京朝陽大屯路”對項目“朝陽大屯路”進行計數(shù)的示例。如果不存在如下現(xiàn)有模型條目,其“項目,,字段、“項目類型”字段以及“語言”字段如果存在則全部與項目“朝陽大屯路”匹配,則用值為“朝陽大屯路”的“項目”字段、值為“項二元模型”的“項目類型”字段、值為0的“在標題中出現(xiàn)的次數(shù)”字段、值為1的“在地址中出現(xiàn)的次數(shù)”字段以及值為“中文”的“語言”字段,來創(chuàng)建“朝陽大屯路”的模型條目。當(dāng)已存在其“項目”字段、“項目類型”字段以及“語言”字段全部與項目“朝陽大屯路”匹配的現(xiàn)有模型條目時,則將該模型條目的“在地址中出現(xiàn)的次數(shù)”字段的值增加1, 并且該模型條目的其他字段的值保持不變。作為一個具體的示例,考慮對于地址“北京朝陽大屯路”,對項目“市、區(qū)、路”(其類型是“全部類型序列”)進行計數(shù)的另一個示例。如果存在其“項目,,字段是“市、區(qū)、路”、“項目類型”字段是“全部類型序列”并且“語言”字段是“中文”的現(xiàn)有模型條目,即存在其“項目,,字段、“項目類型”字段和“語言”字段全部與項目“市、區(qū)、路”匹配的現(xiàn)有條目,則模型條目的“在標題中出現(xiàn)的次數(shù)”字段和“語言”字段的值保持不變,并且將該模型條目的“在地址中出現(xiàn)的次數(shù)”字段的值增加1。在步驟470,訓(xùn)練模型檢查是否處理了全部標題和地址。如果處理了全部標題和地址,則完成了用于訓(xùn)練統(tǒng)計模型250的過程400,并且生成或更新統(tǒng)計模型250以供由解析模塊230在解析來自用戶查詢的輸入條目時使用。否則,過程400返回到步驟S420以處理下一個標題或地址??梢园凑崭鞣N方式實現(xiàn)由模型訓(xùn)練模塊220進行的對統(tǒng)計模型250的訓(xùn)練。在一些實現(xiàn)中,例如,模型訓(xùn)練模塊220在系統(tǒng)200的操作的開始時訓(xùn)練統(tǒng)計模型250,并且周期性地或者當(dāng)特定事件發(fā)生時(例如當(dāng)更新訓(xùn)練數(shù)據(jù)時)更新統(tǒng)計模型250。解析模塊230可以使用由模型訓(xùn)練模塊220生成的統(tǒng)計模型250來確定針對項目、令牌或令牌序列的位置統(tǒng)計得分和查詢統(tǒng)計得分?!绊椖俊痹诖颂幹甘具@樣一種項目, 對于該項目在標題和地址中出現(xiàn)的次數(shù)進行計數(shù),即項一元模型、項二元模型、類型為“空” 的相鄰的項的序列、全部項的序列、類型一元模型、類型二元模型或全部類型的序列。項目、 令牌或令牌序列的位置統(tǒng)計得分指示該項目、令牌或令牌序列與位置相關(guān)的概率。項目、令牌或令牌序列的查詢統(tǒng)計得分指示該項目、令牌或令牌序列與查詢(即實體名稱或?qū)嶓w類別)相關(guān)的概率。在一些實現(xiàn)中,如果項目在統(tǒng)計模型250中具有對應(yīng)的條目,那么可以通過分別使用等式(1)和( 來計數(shù)該項目的位置統(tǒng)計得分和查詢統(tǒng)計得分項目的位置統(tǒng)計得分=log (l_count) *l_count/ (l_count+q_count)......等式
(1);項目的查詢統(tǒng)計得分=log (q_count) *q_count/ (l_count+q_count)......等式
(2),其中l(wèi)_count和q_count分別表示在統(tǒng)計模型250中存儲的、該項目在地址和標題中出現(xiàn)的次數(shù)。例如,當(dāng)對于項一元模型“朝陽”的項目計算位置統(tǒng)計得分和查詢統(tǒng)計得分時,如果項一元模型“朝陽,,在地址和標題中出現(xiàn)的次數(shù)分別是m和N2,則將該項目的位置統(tǒng)計得分計算為,并且將該項目的查詢統(tǒng)計得分計算為logN2*N2/ (N1+N2)。如果項目在統(tǒng)計模型250中不具有對應(yīng)的條目,那么對于該項目的位置統(tǒng)計得分和查詢統(tǒng)計得分賦值為“0”。在一些實現(xiàn)中,將令牌的位置統(tǒng)計得分定義為該令牌的項(項一元模型)的位置統(tǒng)計得分與該令牌的類型(類型一元模型)的位置統(tǒng)計得分的和。下文描述用于基于統(tǒng)計模型250對于令牌序列計算位置統(tǒng)計得分和查詢統(tǒng)計得分的示例性方法。圖7A圖示了用于計算令牌序列的位置統(tǒng)計得分的示例性過程700A。在步驟S710, 對于令牌序列確定項位置得分。項位置得分是基于關(guān)于該令牌序列的項的項目的位置統(tǒng)計得分確定的統(tǒng)計得分。在圖7B中圖示并且在下文中描述在一個實現(xiàn)中、用于確定令牌序列的項位置得分的過程。在步驟S720,對于令牌序列確定類型位置得分。類型位置得分是基于關(guān)于該令牌序列的類型的項目的位置統(tǒng)計得分確定的統(tǒng)計得分。在圖7C中圖示并且在下文中描述在一個實現(xiàn)中、用于確定令牌序列的類型位置得分的過程。在步驟S730,通過對令牌序列的項位置得分和類型位置得分求和來確定該令牌序列的位置統(tǒng)計得分。圖7B示出了用于確定令牌序列的項位置得分的示例性過程700B。在步驟S7102, 將令牌序列中的第一令牌定義為當(dāng)前令牌。在步驟S7104,通過參考統(tǒng)計模型250來確定令牌序列的下列項目(如果存在這種項目)的位置統(tǒng)計得分當(dāng)前令牌的“項一元模型”以及以當(dāng)前令牌的項開始的“項二元模型”和“類型為‘空’的相鄰的項的序列”。在步驟S7108, 選擇在步驟S7104中確定的位置統(tǒng)計得分中最高的位置統(tǒng)計得分作為當(dāng)前令牌的項位置得分。在步驟S7112,確定在該令牌序列中是否存在下一個令牌,并且如果該確定的結(jié)果為是(在步驟S7112中為是),則在步驟S7114,確定在確定當(dāng)前令牌的項位置得分時是否已考慮過該下一個令牌。如果已考慮過該下一個令牌(在步驟S7114中為是),則跳過已考慮的令牌,并且過程700B繼續(xù)進行步驟S7112,否則(在步驟S7114中為否),如果在確定當(dāng)前令牌的項位置得分時未考慮過該下一個令牌,則將該下一個令牌定義為當(dāng)前令牌(步驟S7116),并且過程700B返回到步驟S7104。在步驟S7112,如果確定在該令牌序列中不存在下一個令牌(在步驟S7112中為否),則過程700B前進到步驟S7118以對令牌的結(jié)果項位置得分求和,作為得分Si。接下來,在步驟S7120通過參考統(tǒng)計模型250,確定令牌序列的項目“全部項的序列”的位置統(tǒng)計得分(標記為得分S》。在步驟S7126,比較得分Sl 與S2,并且如果得分Sl等于或大于得分S2 (在步驟S7126中為是),則將該令牌序列的項位置得分確定為得分Sl (步驟S7128),否則,如果得分Sl小于得分S2 (在步驟S7126中為否),則將該令牌序列的項位置得分確定為得分S2 (步驟S7130),繼而過程700B完成。接下來,通過參考圖7C來描述用于確定令牌序列的類型位置得分的示例性過程 700C。在步驟S7202,將令牌序列中的第一令牌定義為當(dāng)前令牌。在步驟S7204,通過參考統(tǒng)計模型250來確定令牌序列的下列項目的位置統(tǒng)計得分當(dāng)前令牌的“類型一元模型”以及(如果存在的話)以當(dāng)前令牌的類型開始的“類型二元模型”。在步驟S7208,選擇在步驟 S7204中確定的較高位置統(tǒng)計得分作為當(dāng)前令牌的類型位置得分。在當(dāng)前令牌是令牌序列中的最后一個令牌時,當(dāng)然不存在以當(dāng)前令牌的類型開始的“類型二元模型”,并且該當(dāng)前令牌的類型位置是“類型一元模型”的位置統(tǒng)計得分。在步驟S7212,確定在該令牌序列中是否存在下一個令牌,并且如果該確定的結(jié)果為是(在步驟S7212中為是),則在步驟S7214, 確定在確定當(dāng)前令牌的類型位置得分時是否已考慮過該下一個令牌。如果已考慮過該下一個令牌(在步驟S7214中為是),則跳過已考慮的令牌,并且過程700C繼續(xù)進行步驟S7212, 否則,如果在確定當(dāng)前令牌的類型位置得分時未考慮過該下一個令牌(在步驟S7214中為否),則將該下一個令牌定義為當(dāng)前令牌(步驟S7216),并且過程700C返回到步驟S7204。 在步驟S7212,如果確定在該令牌序列中不存在下一個令牌(在步驟S7212中為否),則過程700C前進到步驟S7218以對令牌的結(jié)果類型位置得分求和,并且結(jié)果被標記為得分S3。 接下來,在步驟S7220,通過參考統(tǒng)計模型250,確定令牌序列的項目“全部類型的序列”的位置統(tǒng)計得分(該得分被標記為得分S4)。在步驟S7226,比較得分S3與S4,并且如果得分 S3等于或大于得分S4(在步驟S7226中為是),則將該令牌序列的類型位置得分確定為得分S3 (步驟S7228),否則,如果得分S3小于得分S4 (在步驟S7226中為否),則將該令牌序列的類型位置得分確定為得分S4(步驟S7230),繼而過程700C完成??梢耘c位置統(tǒng)計得分類似地確定令牌序列的查詢統(tǒng)計得分。圖8A圖示了計算令牌序列的查詢統(tǒng)計得分的示例性過程800A??梢酝ㄟ^對令牌序列的項查詢得分和類型查詢得分求和來確定令牌序列的查詢統(tǒng)計得分,其中,項查詢得分是基于關(guān)于該令牌序列的項的項目的查詢統(tǒng)計得分確定的統(tǒng)計得分,并且類型查詢得分是基于關(guān)于該令牌序列的類型的項目的查詢統(tǒng)計得分確定的統(tǒng)計得分。圖8B圖示了計算令牌序列的項查詢得分的示例性過程800B,并且圖8C圖示了計算令牌序列的類型查詢得分的示例性過程800C。通過參考對于圖7A-圖7C的相關(guān)描述可以理解圖8A-圖8C的詳細操作。以下是用于確定具有以下三個令牌的輸入令牌序列的查詢統(tǒng)計得分的示例項北京,類型市項;朝陽,類型區(qū)
項大屯路,類型路首先計算令牌序列的項查詢得分。該計算始于定義第一令牌“項北京,類型市” 作為當(dāng)前令牌,并且確定該當(dāng)前令牌的項查詢得分通過參考統(tǒng)計模型250來確定該當(dāng)前令牌的項一元模型“北京”和以該當(dāng)前令牌的項開始的項二元模型“北京朝陽”的查詢統(tǒng)計得分,比較兩個結(jié)果查詢統(tǒng)計得分并且選擇較高的查詢統(tǒng)計得分(例如,“北京朝陽”的查詢統(tǒng)計得分)作為當(dāng)前令牌的項查詢得分,將其標記為得分ST1。繼而,跳過令牌“項朝陽, 類型區(qū)”,因為當(dāng)確定具有項“北京”的該當(dāng)前令牌的項查詢得分時已經(jīng)考慮了該令牌的該項。下一個令牌是“項大屯路,類型路”,當(dāng)確定當(dāng)前令牌的項查詢得分時未考慮該令牌, 所以將該令牌“項大屯路,類型路”定義為當(dāng)前令牌,并且將該當(dāng)前令牌的項查詢得分確定為存儲在模型中的一元模型項的查詢統(tǒng)計得分,標記為得分ST2。將得分STl與得分ST2 求和,并且將結(jié)果與整個項序列(全部項的序列)“北京朝陽大屯路”的查詢統(tǒng)計得分進行比較,選擇較高的查詢統(tǒng)計得分作為該令牌序列的項查詢得分。接下來,計算輸入令牌序列的類型查詢得分。如上所述,將該令牌序列中的第一令牌“項北京,類型市”定義為當(dāng)前令牌,并且對輸入令牌序列的類型查詢得分的計算始于確定該當(dāng)前令牌“項北京,類型市”的類型查詢得分通過參考模型250來確定該當(dāng)前令牌的類型一元模型“市”和以該當(dāng)前令牌的類型開始的類型二元模型“市區(qū)”的查詢統(tǒng)計得分,比較所獲得的查詢統(tǒng)計得分并且選擇較高的查詢統(tǒng)計得分(例如“市”的查詢統(tǒng)計得分)作為第一令牌的類型查詢得分,將其標記為得分ST3。繼而,將下一個令牌“項朝陽, 類型區(qū)”定義為當(dāng)前令牌,并且通過參考統(tǒng)計模型250來確定類型一元模型“區(qū),,和類型二元模型“區(qū)路”的查詢統(tǒng)計得分,并且選擇較高的查詢統(tǒng)計得分(例如,類型二元模型“區(qū)路”的查詢統(tǒng)計得分)作為第二令牌的類型查詢得分,標記為得分ST4。跳過第三令牌,因為當(dāng)確定先前的令牌“項朝陽,類型區(qū)”的類型查詢得分時已經(jīng)考慮了該第三令牌。將得分ST3與得分ST4求和,并且將結(jié)果與整個類型序列(全部類型的序列)“市區(qū)路”的查詢統(tǒng)計得分進行比較,選擇較高的查詢統(tǒng)計得分作為該令牌序列的類型查詢得分。在此時,將令牌序列的項查詢得分和類型查詢得分加在一起,并且結(jié)果是令牌序列的查詢統(tǒng)計得分。返回參考圖2,系統(tǒng)200的解析模塊230將輸入條目解析成位置部分和查詢部分。 圖6A是用于圖示用于由解析模塊230解析輸入條目的示例性過程600A的流程圖。在步驟S610,例如通過使用令牌化模塊210來接收輸入條目并且對其進行令牌化,并且獲得令牌序列。將輸入條目令牌化為用類型來注釋的令牌的序列。如上所述,該輸入條目可以由用戶在客戶端終端210處輸入并且被經(jīng)由網(wǎng)絡(luò)130傳輸?shù)浇馕瞿K230??蛇x地,在步驟S620,可以執(zhí)行后處理以使用預(yù)定義的類型改正規(guī)則來改正該令牌序列中明顯錯誤的類型。類型改正規(guī)則用于改正給令牌注釋的明顯錯誤的類型。在各種實現(xiàn)中,可以通過兩個部分來定義規(guī)則條件和目標動作或值。如果滿足條件,則執(zhí)行目標動作或返回目標值。例如,類型改正規(guī)則可以規(guī)定如果具有類型“量詞后綴”的令牌不是緊跟具有類型“號”的令牌,則將類型“量詞后綴”改變?yōu)轭愋汀翱铡?。如之前的示例中所述的?將標題“中華老字號東來順”的項“號”的初始注釋類型“量詞后綴”改成類型“空”,因為項 “號”雖然使用與“號”相同的中文字符,但是項“號”表示企業(yè)的商標并且其與項“老字”組合使用以表示“老字號”。
在步驟S630,對于令牌序列中兩個相鄰的令牌之間的每個位置,例如,通過使用預(yù)定義的不分割規(guī)則確定其是否是能夠被分割的可能的位置,并且如果其明顯是不可能的位置則過濾掉該位置。不分割規(guī)則用于規(guī)定不應(yīng)該是分割位置的位置。例如,不分割規(guī)則可以規(guī)定具有類型“街”的令牌與具有類型“號”的令牌之間的位置不應(yīng)該是分割位置。過濾掉明顯錯誤的分割位置的操作可以減少統(tǒng)計模型250中的噪聲效應(yīng)(effects of noises)。在步驟S640,對于每個可能的分割方式計算分割得分。分割得分指示該可能的分割方式的正確性的統(tǒng)計概率。由查詢部分和位置部分定義分割方式。每個可能的分割方式對應(yīng)于一個可能的分割位置??赡艿姆指钗恢每梢允橇钆菩蛄兄械膬蓚€相鄰的令牌之間的位置,其將令牌序列分成兩個部分??赡艿姆指钗恢眠€可以是該令牌序列的第一令牌之前的位置或者最后一個令牌之后的位置,其將該令牌序列“分成”一個子令牌序列。更具體而言,關(guān)于令牌序列中的兩個相鄰的令牌之間的可能的分割位置并且將令牌序列分成兩個部分,即兩個子令牌序列,對于該兩個子令牌序列中的每一個子令牌序列,通過使用例如圖 7A-圖7C和圖8A-圖8C中所示的過程來確定查詢統(tǒng)計得分和位置統(tǒng)計得分。子令牌序列的位置統(tǒng)計得分指示該子令牌序列是位置部分的概率,并且子令牌序列的查詢統(tǒng)計得分指示該子令牌序列是查詢部分的概率。在由可能的分割位置分成的兩個子令牌序列之間,將具有較高位置統(tǒng)計得分的一個子令牌序列視為輸入條目的可能的位置部分,并且將另一個子令牌序列視為該輸入條目的可能的查詢部分?;诜指畹奈恢貌糠值奈恢媒y(tǒng)計得分以及分割的查詢部分的查詢統(tǒng)計得分,確定該對應(yīng)的可能的分割的得分。作為示例,通過對該可能的位置部分的位置統(tǒng)計得分與該可能的查詢部分的查詢統(tǒng)計得分求和,確定該分割的得分。此外,關(guān)于將令牌序列分成一個子令牌序列的可能的分割位置,對于整個令牌序列確定位置統(tǒng)計得分和查詢統(tǒng)計得分。通過將整個令牌序列視為位置部分,確定對應(yīng)于該位置的可能的分割方式,并且如果整個令牌序列的位置統(tǒng)計得分高于該整個令牌序列的查詢統(tǒng)計得分,則將該分割得分確定為該整個令牌序列的位置統(tǒng)計得分。類似地,通過將整個令牌序列視為查詢部分,來確定對應(yīng)于將令牌序列分成一個子令牌序列的位置的可能的分割方式,并且如果整個令牌序列的查詢統(tǒng)計得分高于整個令牌序列的位置統(tǒng)計得分,則將該分割得分確定為整個令牌序列的查詢統(tǒng)計得分??蛇x地,可以確定包括用于查詢部分的查詢乘數(shù)和用于位置部分的位置乘數(shù)的兩個乘數(shù),以用于調(diào)整查詢部分的查詢統(tǒng)計得分和位置部分的位置統(tǒng)計得分。如果可能的分割的查詢乘數(shù)和位置乘數(shù)中的任意一個是零則可以排除該可能的分割??梢匀缦麓_定乘數(shù)。首先確定包括用于查詢部分的基本查詢乘數(shù)和用于位置部分的基本位置乘數(shù)在內(nèi)的兩個基本乘數(shù)。在一個實現(xiàn)中,將基本乘數(shù)預(yù)定義為預(yù)定值。在另一個實現(xiàn)中,基于兩個部分的項和長度來確定基本乘數(shù)??梢灾苯訉⒒境藬?shù)用作為查詢乘數(shù)和位置乘數(shù)。備選地, 可以通過提升或降低來調(diào)整位置基本乘數(shù),并且將經(jīng)調(diào)整位置基本乘數(shù)用作位置乘數(shù)。例如,如果位置部分的令牌序列包括按等級次序的地址分量(諸如[省+市+區(qū)+街]),則可以提升位置乘數(shù)。可以計算分等級管理地址(諸如市、區(qū))的長度和分等級常規(guī)地址(諸如街、樓)的長度,并且可以向位置基本乘數(shù)增加加權(quán)值。作為另一個示例,如果位置部分的令牌序列包括不按等級次序的地址分量,則降低位置基本乘數(shù)。作為又一個示例,如果在令牌序列中存在重復(fù)的地址分量(諸如“北京市北京”),則降低位置基本乘數(shù)。在確定查詢乘數(shù)和位置乘數(shù)之后,使用所確定查詢乘數(shù)和位置乘數(shù)來調(diào)整查詢部分的查詢統(tǒng)計得分和位置部分的位置統(tǒng)計得分。具體而言,將查詢部分的查詢統(tǒng)計得分與查詢乘數(shù)相乘,并且將位置部分的位置統(tǒng)計得分與位置乘數(shù)相乘。可以通過將調(diào)整后的查詢統(tǒng)計得分和位置統(tǒng)計得分求和來確定該分割的得分??蛇x地,在步驟S650,向每個可能的分割分配優(yōu)先權(quán)??梢允褂脙蓚€級別的優(yōu)先權(quán)并且可以將其表示成兩個數(shù)字1和0,其中1是較高優(yōu)先權(quán)并且0是較低優(yōu)先權(quán)??梢匀缦路峙鋬?yōu)先權(quán)。例如,關(guān)于對應(yīng)于令牌序列中的兩個相鄰的令牌之間的分割位置的分割,如果該分割是由諸如空格、逗號等之類的分隔符分割的,則該分割的優(yōu)先權(quán)是1。否則,如果該分割不是由分隔符分割的,則該分割的優(yōu)先權(quán)是0。對于整個令牌序列是查詢部分或位置部分的分割,如果輸入條目包括分隔符,則該分割的優(yōu)先權(quán)是1,否則該分割的優(yōu)先權(quán)是0。在步驟S660,對可能的分割進行排序,并且選擇最高可能的分割作為解析結(jié)果。在一個實現(xiàn)中,通過分割得分對可能的分割進行排序。在向每個可能的分割分配優(yōu)先權(quán)的另一個實現(xiàn)中,可以首先通過優(yōu)先權(quán)繼而再通過得分來對可能的分割進行排序。如上所述,通過結(jié)果分割的查詢部分和位置部分來表示該結(jié)果分割。可選地,在步驟S670,確定整個輸入條目是否是可能的位置。如果輸入條目滿足任何以下條件則將其確定為可能的位置1)該輸入條目滿足一些特定條件,例如,該輸入條目以數(shù)字結(jié)尾;以及幻整個位置分割(即整個令牌序列是位置部分)是具有第二最高得分的分割并且該分割的得分與最高分割得分的比值高于預(yù)定閾值。如果整個輸入條目被確定為可能的位置,則將整個輸入條目是位置部分的該分割視為附加結(jié)果分割,可以將該附加結(jié)果分割作為參考來輸出。可選地,在步驟S680,對于每個結(jié)果分割確定分割置信度(confidence)得分。分割置信度得分指示對于該分割的正確性的置信度。在一個實現(xiàn)中,將分割信息得分如下定義。首先,通過等式C3)和(4)來定義對于項目(包括項一元模型、項二元模型、類型為空的相鄰的項的序列、全部項的序列、類型一元模型、類型二元模型、全部類型的序列)的查詢置信度得分和位置置信度得分query—conf = query—score/ (query—score+location—score)......等式(3)location_conf = location_score/ (query_score+location_score)......等式
(4)其中,query_conf和locatior^conf分別是項目的查詢置信度得分和位置置信度得分,并且query_SCOre和locatior^score分別是該項目的查詢統(tǒng)計得分和位置統(tǒng)計得分。其次,將該分割的查詢部分的查詢置信度得分定義為用于確定該查詢部分的項查詢得分的項目(圖8B)的查詢置信度得分的平均值,并且將該分割的位置部分的位置置信度得分定義為用于確定該位置部分的項位置置信度得分的項目(圖7B)的位置置信度得分的平均值。將該分割的分割置信度得分定義為該分割的位置部分的位置置信度得分與該分割的查詢部分的查詢置信度得分的平均值。作為示例,分割置信度得分具有范圍為W,l]的值, 并且分割置信度得分越高,則對該分割的正確性的置信度越高。分割置信度得分也是可以由解析模塊230作為參考來輸出的附加解析結(jié)果。參考圖6A,在步驟S690,由解析模塊230輸出解析結(jié)果。該解析結(jié)果包括在步驟 S660獲得的結(jié)果分割。在示例性過程600A中,該解析結(jié)果還包括在步驟S670和步驟S680 獲得的附加結(jié)果,系統(tǒng)200的用戶可以將其用作為參考。系統(tǒng)200的用戶包括使用系統(tǒng)200的結(jié)果的模塊、組件或系統(tǒng)。例如,地圖搜索系統(tǒng)140是系統(tǒng)200的用戶之一。可以通過備選處理來實現(xiàn)圖6A中的以上過程的各種處理操作。圖6B是圖示用于由解析模塊230解析輸入條目的另一個示例性過程600B的流程圖。在過程600B中的處理步驟S610、S640、S660和S690本質(zhì)上與在圖6A的過程600A中具有相同的參考標號的那些步驟相同。已經(jīng)關(guān)于圖2-圖8C描述了圖2中用于為了地圖搜索而將輸入條目解析成位置部分和查詢部分的解析系統(tǒng)200的各種特征,以下部分基于解析系統(tǒng)200的輸出描述地圖搜索。在圖1的示例中,由服務(wù)器120處的解析系統(tǒng)200以及地圖搜索系統(tǒng)140執(zhí)行地圖搜索。圖9是圖示用于執(zhí)行地圖搜索的示例性過程的流程圖。在步驟S902,由解析系統(tǒng) 200接收輸入條目??梢杂捎脩粼诳蛻舳?10處將該輸入條目輸入到地圖搜索接口,并且經(jīng)由網(wǎng)絡(luò)130傳輸?shù)浇馕鱿到y(tǒng)200。在步驟S904,由解析系統(tǒng)200解析輸入條目,并且將包括位置部分和查詢部分中的至少一個的解析結(jié)果轉(zhuǎn)發(fā)到地圖搜索系統(tǒng)140。地圖搜索系統(tǒng) 140基于或通過參考該解析結(jié)果來執(zhí)行地圖搜索。在一些實現(xiàn)中,在步驟S906,地圖搜索系統(tǒng)140基于位置部分確定目標地理區(qū)域。例如,地圖搜索系統(tǒng)140可以對位置部分進行地理編碼,以獲得目標地理區(qū)域??梢酝ㄟ^經(jīng)度和緯度定義目標地理區(qū)域。在步驟S908,地圖搜索系統(tǒng)140搜索關(guān)于由該目標地理區(qū)域之內(nèi)的查詢部分所表示的一個或多個目標的信息, 并且在步驟S910例如向客戶端110返回搜索結(jié)果,并且向用戶呈現(xiàn)搜索結(jié)果。圖10是可用于實現(xiàn)本文所述的地圖搜索系統(tǒng)和方法的示例性設(shè)備1000的框圖。設(shè)備1000包括處理設(shè)備1002、第一數(shù)據(jù)存儲區(qū)1004、第二數(shù)據(jù)存儲區(qū)1006、輸入設(shè)備 1008、輸出設(shè)備1010以及網(wǎng)絡(luò)接口 1012。可以使用包括例如數(shù)據(jù)總線和母板的總線系統(tǒng) 1014來建立并且控制組件1002、1004、1006、1008、1010和1012之間的數(shù)據(jù)通信。也可以使用其他示例性系統(tǒng)架構(gòu)。處理設(shè)備1002包括例如一個或多個微處理器。第一數(shù)據(jù)存儲區(qū)1004包括例如隨機訪問存儲器(RAM)存儲設(shè)備,諸如動態(tài)隨機訪問存儲器(DRAM),或其他類型的計算機可讀介質(zhì)存儲器設(shè)備。第二數(shù)據(jù)存儲區(qū)1006包括例如一個或多個硬盤驅(qū)動器、閃存和/或只讀存儲器(ROM),或其他類型的計算機可讀介質(zhì)存儲器設(shè)備。在一些實現(xiàn)中,設(shè)備1000包括數(shù)據(jù)存儲區(qū)(諸如第二數(shù)據(jù)存儲區(qū)1006)中的代碼??梢杂芍噶顏矶x該代碼,其中該指令在被執(zhí)行時使得處理設(shè)備1002執(zhí)行解析系統(tǒng) 200和/或地圖搜索系統(tǒng)140的功能。數(shù)據(jù)存儲區(qū)(諸如第二數(shù)據(jù)存儲區(qū)1006)可以存儲字典240和/或統(tǒng)計模型250。示例性輸入設(shè)備1008包括鍵盤、鼠標、觸針等,并且示例性輸出設(shè)備1010包括顯示器設(shè)備、音頻設(shè)備等。在一些實現(xiàn)中,輸入設(shè)備1008接收用于訓(xùn)練統(tǒng)計模型250的訓(xùn)練數(shù)據(jù)。網(wǎng)絡(luò)接口 1012包括例如可操作來向例如網(wǎng)絡(luò)130傳達數(shù)據(jù)并從例如網(wǎng)絡(luò)130接收數(shù)據(jù)的有線或無線網(wǎng)絡(luò)設(shè)備。網(wǎng)絡(luò)接口 1012可以從遠程設(shè)備接收輸入條目,并且向該遠程設(shè)備傳輸搜索結(jié)果。設(shè)備1000可以響應(yīng)于處理設(shè)備1002執(zhí)行計算機可讀介質(zhì)(諸如第一數(shù)據(jù)存儲區(qū) 1004)中所包括的軟件指令,執(zhí)行本文檔描述的特定操作或過程??梢詫⒂嬎銠C可讀介質(zhì)定義為物理的或邏輯的存儲器設(shè)備和/或載波??梢越?jīng)由網(wǎng)絡(luò)接口 1012,從另一個計算機可讀介質(zhì)(諸如盤片)或者從另一個設(shè)備向第一數(shù)據(jù)存儲區(qū)1004讀入軟件指令。第一數(shù)據(jù)存儲區(qū)1004中所包括的軟件指令可以使得處理設(shè)備1002執(zhí)行本文檔所描述的過程。在實現(xiàn)中,可以獨立地應(yīng)用或者與其他地圖搜索或數(shù)據(jù)處理技術(shù)結(jié)合地應(yīng)用本文檔所描述的用于解析輸入條目并且執(zhí)行地圖搜索的過程。例如,可以由同樣從用于解析或處理輸入條目的其他系統(tǒng)獲得附加結(jié)果的系統(tǒng)使用解析系統(tǒng)200的解析結(jié)果,并且決斷將哪個結(jié)果用于地圖搜索。該示例中的系統(tǒng)可以使用由解析模塊230輸出的分割置信度得分來進行決斷。作為另一個示例,地圖搜索系統(tǒng)可以執(zhí)行本文檔所描述的地圖搜索過程,以及使用其他技術(shù)的其他地圖搜索過程,以獲得多個搜索結(jié)果,并且將不同過程的結(jié)果合成為最終的搜索結(jié)果以用于遞送給用戶。可以將本文檔所描述的主題和功能性操作的實施方式實現(xiàn)為數(shù)字電子電路或計算機軟件、固件或硬件,包括本文檔中所公開的結(jié)構(gòu)和其結(jié)構(gòu)等效物,或者它們中的一個或多個的組合。可以將本文檔所描述的主題的實施方式實現(xiàn)為一個或多個計算機程序產(chǎn)品, 即編碼在有形程序載體上的、用于由數(shù)據(jù)處理裝置執(zhí)行或者用于控制數(shù)據(jù)處理裝置的操作的計算機程序指令的一個或多個模塊。該有形程序載體可以是傳播信號或計算機可讀介質(zhì)。該傳播信號是人工生成的信號,例如機器生成的電信號、光信號或電磁信號,該信號被生成來編碼用于向合適的接收裝置傳輸以用于由計算機執(zhí)行的信息。計算機可讀介質(zhì)可以是機器可讀存儲設(shè)備、機器可讀存儲襯底、存儲器設(shè)備、用于產(chǎn)生機器可讀傳播信號的物質(zhì)的組成物或者它們中的一個或多個的組合。術(shù)語“系統(tǒng)”涵蓋了用于執(zhí)行在此所述的主題的功能的全部系統(tǒng)、裝置、設(shè)備和機器,作為示例包括例如可編程處理器、計算機或多處理器或計算機。系統(tǒng)除了硬件之外還可以包括用于創(chuàng)建用于所述計算機程序的執(zhí)行環(huán)境的代碼,例如,構(gòu)成處理器固件、協(xié)議棧、 數(shù)據(jù)庫管理系統(tǒng)、操作系統(tǒng)或它們中的一個或多個的組合的代碼??梢杂萌我庑问降木幊陶Z言來編寫計算機程序(又被稱為程序、軟件、軟件應(yīng)用、 腳本或代碼),這些編程語言包括編譯語言或解釋語言、或聲明語言或過程語言,并且可以用任意形式來對其進行部署,包括作為獨立的程序或者作為模塊、組件、子例程或者適用于在計算機環(huán)境中使用的其他單元。計算機程序無需對應(yīng)于文件系統(tǒng)中的文件??梢詫⒊绦虼鎯υ谖募挠糜诒3制渌绦蚧驍?shù)據(jù)(例如,存儲在標記語言文檔中的一個或多個腳本)的部分中、在專用于所述程序的單個文件中、或者在多個協(xié)同文件中(例如,用于存儲一個或多個模塊、子程序或代碼部分的文件)。可以將計算機程序部署為在一個計算機或多個計算機上執(zhí)行,其中該多個計算機位于一個地點或者跨多個地點分布并且通過通信網(wǎng)絡(luò)互連??梢杂捎糜趫?zhí)行一個或多個計算機程序以通過在輸入數(shù)據(jù)上進行操作并且生成輸出來執(zhí)行功能的一個或多個可編程處理器來執(zhí)行本文中所述的過程和邏輯流程。還可以由專用邏輯電路(例如,F(xiàn)PGA(現(xiàn)場可編程門陣列)或ASIC(專用集成電路))來執(zhí)行該過程或邏輯流程并且實現(xiàn)裝置。適用于執(zhí)行計算機程序的處理器包括例如通用微處理器和專用微處理器兩者,以及任意種類的數(shù)字計算機的任意一個或多個處理器??傮w而言,處理器將從只讀存儲器或隨機訪問存儲器或這兩者接收指令和數(shù)據(jù)。計算機的基本元件是用于執(zhí)行指令的處理器和用于存儲指令和數(shù)據(jù)的一個或多個存儲器設(shè)備??傮w而言,計算機還將包括(或被可操作地被耦合到)用于存儲數(shù)據(jù)的一個或多個大容量存儲設(shè)備(例如,磁盤、磁光盤或光盤),以從該大容量存儲設(shè)備接收數(shù)據(jù)或向該大容量存儲設(shè)備傳遞數(shù)據(jù)或接收并傳遞數(shù)據(jù)。然而, 計算機不必具有此類設(shè)備。此外,可以將計算機嵌入到另一個設(shè)備中,聊舉數(shù)例,如移動電話、個人數(shù)字助理(PDA)、移動音頻或視頻播放器、游戲機、全球定位系統(tǒng)(GPQ接收器等。適用于存儲計算機程序指令和數(shù)據(jù)的計算機可讀介質(zhì)包括所有形式的非易失性存儲器、介質(zhì)和存儲器設(shè)備,包括例如半導(dǎo)體存儲器設(shè)備(例如,EPROM、EEPROM和閃存設(shè)備)、磁盤(例如,內(nèi)部硬盤或可移動盤片)、磁光盤以及⑶ROM和DVD ROM盤片。處理器和存儲器可以由專用邏輯電路補充或者并入該專用邏輯電路。為了提供與用戶的交互,可以在具有用于向用戶顯示信息的顯示器設(shè)備(例如, CRT(陰極射線管)或LCD(液晶顯示器)監(jiān)視器)和用戶可以用來向計算機提供輸入的鍵盤和指點設(shè)備(例如,鼠標或追蹤球)的計算機上實現(xiàn)本文檔所描述的主題的實施方式。還可以使用其他種類的設(shè)備來提供與用戶的交互;例如,提供給用戶的反饋可以是任意形式的感官反饋,例如,可視反饋、可聽反饋或可觸反饋;并且可以按照任意形式接收來自用戶的輸入,包括聲學(xué)輸入、語音輸入或觸覺輸入??梢栽诎ê蠖私M件以例如作為數(shù)據(jù)服務(wù)器或者包括中間件組件(例如,應(yīng)用服務(wù)器)或者包括前端組件(例如,具有圖形用戶界面或Web瀏覽器的客戶端計算機,用戶可以通過該圖形用戶界面或網(wǎng)絡(luò)瀏覽器與本文檔所描述的主題的實現(xiàn)交互)或者包括一個或多個此類后端組件、中間件組件或前端組件的任意組合的計算系統(tǒng)中實現(xiàn)本文檔所描述的主題的實施方式。系統(tǒng)的組件可以通過任意的數(shù)字數(shù)據(jù)通信形式或介質(zhì)(例如,通信網(wǎng)絡(luò))互連。通信網(wǎng)絡(luò)的示例包括局域網(wǎng)(“LAN”)和廣域網(wǎng)(“WAN”),例如,因特網(wǎng)。計算系統(tǒng)可以包括客戶端和服務(wù)器??蛻舳撕头?wù)器通常彼此遠離并且典型地通過通信網(wǎng)絡(luò)交互。依靠運行在各自的計算機上并且與彼此具有客戶端服務(wù)器關(guān)系的計算機程序建立客戶端和服務(wù)器的關(guān)系。與本文檔所描述的地圖搜索相關(guān)聯(lián)的過程和操作的位置可以位于被用戶用來執(zhí)行地圖搜索的一個計算機網(wǎng)絡(luò)或多個相連接的計算機網(wǎng)絡(luò)中的一個或多個位置。響應(yīng)于用于地圖搜索的用戶輸入條目,在一個或多個計算機處由用于與地圖搜索相關(guān)聯(lián)的過程和操作(包括本文檔所描述的解析操作和基于該解析操作的結(jié)果的搜索操作)的各自的計算機程序觸發(fā)或引起執(zhí)行與地圖搜索相關(guān)聯(lián)的過程和操作。作為一個示例,提供了計算機實現(xiàn)的地圖搜索方法以使得在將來自用戶的用于地圖搜索的輸入條目解析成用于指示輸入搜索條目中的位置信息的位置部分和用于指示與該輸入條目中的該位置部分相關(guān)聯(lián)的搜索目標的查詢部分之后,才基于該輸入條目實施地圖搜索。該方法還使得實施地圖搜索以基于該位置部分獲得地理區(qū)域或位置并且以搜索關(guān)于與該查詢部分相關(guān)聯(lián)并且位于所獲得的地理區(qū)域或位置處、之內(nèi)或附近的一個或多個實體的信息。盡管本文包括多個具體的實現(xiàn)細節(jié),但是不應(yīng)該將這些細節(jié)理解為是作為對于任何發(fā)明或可能要求的發(fā)明的范圍的限制,而是作為對特定發(fā)明的特定實施方式所特有的特征的描述。還可以在單個實施方式的組合中實現(xiàn)在本文檔中獨立的實施方式的背景中所描述的特定特征。相反,也可以在多個獨立的實施方式或者在多個獨立的實施方式的任意合適的子組合中實現(xiàn)本文在單個實施方式的背景中所述的特定特征。此外,雖然上文可能將特征描述為在特定組合中動作并且甚至最初要求這樣,但是在一些情況中可以去除所要求的組合的一個或多個特征,并且所要求的組合可以指向子組合或子組合的變形。類似地,盡管在附圖中按照特定次序來描述操作,但是不應(yīng)該將其理解為需要按照所示的特定次序或者按照順序次序地執(zhí)行該操作,或者需要執(zhí)行全部所示的操作來實現(xiàn)希望的結(jié)果。在某些情況中,多任務(wù)和并行處理可能是有利的。此外,不應(yīng)該將以上所述的實施方式中的各種系統(tǒng)組件的分離理解為在全部實施方式中都需要該分離,并且應(yīng)該理解大體上可以將所述程序組件和系統(tǒng)一起集成為單個軟件產(chǎn)品或包裝成多個軟件產(chǎn)品。已描述了地圖搜索系統(tǒng)、裝置和方法的特定實施方式。可以基于本文中所述的內(nèi)容來做出對所描述的實施方式和其他實施方式的變形和增強。例如,可以按照不同的次序執(zhí)行所述動作并且仍然實現(xiàn)希望的結(jié)果。作為一個示例,附圖中所描繪的過程不必要求所示的特定次序或者按照順序次序來實現(xiàn)希望的結(jié)果。在某些實現(xiàn)中,多任務(wù)和并行處理可能是有利的。
權(quán)利要求
1.一種計算機實現(xiàn)的地圖搜索方法,包括將來自用戶的、用于地圖搜索的輸入條目解析成用于指示輸入搜索條目中的位置信息的位置部分以及用于指示與所述輸入條目中的所述位置部分相關(guān)聯(lián)的搜索目標的查詢部分;以及實施地圖搜索,以便基于所述位置部分獲得地理區(qū)域或位置,以及以便搜索關(guān)于與所述查詢部分相關(guān)聯(lián)并且位于所獲得的地理區(qū)域或位置處、之內(nèi)或附近的一個或多個實體的fn息ο
2.如權(quán)利要求1所述的地圖搜索方法,其中在基于所述輸入條目實施所述地圖搜索之前執(zhí)行所述解析。
3.如權(quán)利要求1所述的地圖搜索方法,其中所述解析包括將所述輸入條目解析成一個或多個令牌的令牌序列,每個令牌包括用于表示所述輸入條目的段的項以及給所述項注釋的類型;以及使用給每個項的實施類型來指示所述項是否包括與地址相關(guān)信息以及所述與地址相關(guān)信息的類型。
4.如權(quán)利要求3所述的地圖搜索方法,包括在獲得與具有指示所述項不包括地址相關(guān)信息的類型的令牌相關(guān)聯(lián)的地理區(qū)域或位置時不執(zhí)行動作。
5.如權(quán)利要求3所述的地圖搜索方法,其中將所述輸入條目解析成所述令牌序列包括將所述輸入條目中的地址相關(guān)詞標識為令牌的項;以及將所述地址相關(guān)詞的類型標識為所述令牌的所述類型。
6.如權(quán)利要求5所述的地圖搜索方法,其中標識所述輸入條目中的地址相關(guān)詞包括 使用地址相關(guān)詞的字典中的條目及其類型來標識所述地址相關(guān)詞和所述令牌類型。
7.如權(quán)利要求5所述的地圖搜索方法,其中所述字典的地址相關(guān)詞包括行政區(qū)域名稱、路名、地址相關(guān)后綴、地址相關(guān)前綴、以及號中的至少一個。
8.如權(quán)利要求7所述的地圖搜索方法,其中地址相關(guān)后綴和地址相關(guān)前綴包括地理名稱后綴、方向前綴或方向后綴、以及量詞后綴中的至少一個。
9.如權(quán)利要求5所述的地圖搜索方法,包括將所述輸入條目中的詞標識為與地址無關(guān)的令牌的項;以及分配“空”作為所述令牌的所述類型,以指示所述令牌的所述項不包括地址相關(guān)信息。
10.如權(quán)利要求3所述的地圖搜索方法,其中對所述輸入條目的所述解析還包括確定所述令牌序列可能的分割位置,每個可能的分割位置將所述令牌序列分割成一個或兩個子令牌序列;對于每個所述可能的分割位置確定可能的分割方式,每個可能的分割方式將所述令牌序列分割成(1)可能的查詢部分和( 可能的位置部分中的至少一個;確定用于指示每個所述可能的分割方式的正確性的統(tǒng)計概率的分割得分;以及選擇具有最高分割得分的所述可能的分割方式作為結(jié)果分割方式。
11.如權(quán)利要求10所述的地圖搜索方法,其中排除將具有“路”類型的令牌與具有“號”類型的令牌之間的位置作為分割位置。
12.如權(quán)利要求10所述的地圖搜索方法,其中對于將所述令牌序列分割成兩個子令牌序列的可能的分割位置確定所述兩個子令牌序列中的每個子令牌序列的位置統(tǒng)計得分和查詢統(tǒng)計得分,以及通過將具有較高位置統(tǒng)計得分的所述子令牌序列視為所述可能的位置部分、并且將另一個子令牌序列視為所述可能的查詢部分來確定對應(yīng)于所述可能的分割位置的所述可能的分割方式;對于將所述令牌序列分割成一個子令牌序列的可能的分割位置通過當(dāng)所述子令牌序列的所述位置統(tǒng)計得分高于所述子令牌序列的所述查詢統(tǒng)計得分時,將所述子令牌序列視為所述位置部分,以及當(dāng)所述子令牌序列的所述查詢統(tǒng)計得分高于所述子令牌序列的所述位置統(tǒng)計得分時,將所述子令牌序列視為所述查詢部分,來確定對應(yīng)于所述可能的分割位置的所述可能的分割方式。
13.如權(quán)利要求12所述的地圖搜索方法,其中對用于指示每個所述可能的分割方式的正確性的統(tǒng)計概率的所述分割得分的確定包括基于所述位置部分的所述位置統(tǒng)計得分和所述查詢部分的所述查詢統(tǒng)計得分中的任意一個或兩者,對于每個可能的分割方式確定用于指示每個可能的分割方式的正確性的概率的分割得分。
14.如權(quán)利要求12所述的地圖搜索方法,其中通過參考統(tǒng)計模型來確定令牌序列的所述位置統(tǒng)計得分和所述查詢統(tǒng)計得分中的至少一個,并且其中令牌序列的所述位置統(tǒng)計得分指示所述令牌序列是位置的概率,并且令牌序列的所述查詢統(tǒng)計得分指示所述令牌序列是查詢的概率。
15.如權(quán)利要求14所述的地圖搜索方法,其中基于包括標題和地址在內(nèi)的訓(xùn)練數(shù)據(jù)生成所述統(tǒng)計模型。
16.如權(quán)利要求15所述的地圖搜索方法,其中在將原始地址和原始標題用作訓(xùn)練數(shù)據(jù)之前,對所述原始地址進行預(yù)處理以去除其中的尾標題,并且對所述原始標題進行預(yù)處理以去除其中的前綴行政區(qū)域名稱。
17.如權(quán)利要求15所述的地圖搜索方法,其中通過以下步驟生成所述統(tǒng)計模型將所述訓(xùn)練數(shù)據(jù)的包括標題和地址在內(nèi)的每個片段解析成包括一個或多個令牌的令牌序列,每個令牌包括項和注釋到所述項以指示所述項的屬性的類型;對于在所述標題和地址的所述令牌序列中所包括的每個項目,分別對在標題中出現(xiàn)的次數(shù)和在地址中出現(xiàn)的次數(shù)進行計數(shù)和存儲,其中,每個項目是任意以下項目具有單個項的項一元模型、具有兩個相鄰的項的項序列的項二元模型、類型為“空”的相鄰的項的序列、全部項的序列、涉及單個類型的類型一元模型、涉及兩個相鄰的類型的類型序列的類型二元模型、以及全部類型的序列。
18.如權(quán)利要求13所述的地圖搜索方法,其中通過將位置部分的所述位置統(tǒng)計得分與所述查詢部分的所述查詢統(tǒng)計得分求和,來確定用于將所述令牌序列分割成所述位置部分和所述查詢部分的所述可能的分割方式的所述分割得分。
19.如權(quán)利要求13所述的地圖搜索方法,其中將用于將所述令牌序列分割成位置部分或查詢部分的所述可能的分割方式的所述分割得分定義為所述位置部分的所述位置統(tǒng)計得分或所述查詢部分的所述查詢統(tǒng)計得分。
20.如權(quán)利要求13所述的地圖搜索方法,包括對于每個可能的分割方式,確定所述查詢部分的查詢乘數(shù)和/或所述位置部分的位置乘數(shù);(1)通過與所述位置乘數(shù)相乘來調(diào)整所述位置部分的所述位置統(tǒng)計得分,并且(2)通過與所述查詢乘數(shù)相乘來調(diào)整所述查詢部分的所述查詢統(tǒng)計得分;通過將所述位置部分的調(diào)整后的位置統(tǒng)計得分與所述查詢部分的調(diào)整后的查詢統(tǒng)計得分求和,確定用于將所述令牌序列分割成位置部分和查詢部分的所述可能的分割方式的所述分割得分;以及將用于將所述令牌序列分割成位置部分或查詢部分的所述可能的分割方式的所述分割得分確定為所述位置部分的所述調(diào)整后的位置統(tǒng)計得分或所述查詢部分的所述調(diào)整后的查詢統(tǒng)計得分。
21.如權(quán)利要求20所述的地圖搜索方法,其中確定所述查詢乘數(shù)包括 基于所述查詢部分的所述項目和長度確定所述查詢乘數(shù)。
22.如權(quán)利要求20所述的地圖搜索方法,其中,確定所述位置乘數(shù)包括 確定與所述位置部分相關(guān)聯(lián)的基本位置乘數(shù);根據(jù)預(yù)定規(guī)則調(diào)整所述基本位置乘數(shù);以及將所述位置乘數(shù)確定為調(diào)整后的基本位置乘數(shù)。
23.如權(quán)利要求22所述的地圖搜索方法,其中根據(jù)預(yù)定規(guī)則調(diào)整所述基本位置乘數(shù)包括如果所述位置部分包括按照等級順序的地址相關(guān)詞,則提升所述基本位置乘數(shù)。
24.如權(quán)利要求22所述的地圖搜索方法,其中根據(jù)預(yù)定規(guī)則調(diào)整所述基本位置乘數(shù)包括如果所述位置部分包括不按照等級順序的地址相關(guān)詞,則降低所述基本位置乘數(shù)。
25.如權(quán)利要求22所述的地圖搜索方法,其中根據(jù)預(yù)定規(guī)則調(diào)整所述基本位置乘數(shù)包括如果所述位置部分包括重復(fù)的地址相關(guān)詞,則降低所述基本位置乘數(shù)。
26.如權(quán)利要求17所述的地圖搜索方法,其中確定令牌序列的位置統(tǒng)計得分包括 基于關(guān)于所述令牌序列的項的項目的位置統(tǒng)計得分,確定所述令牌序列的項位置得分;基于關(guān)于所述令牌序列的類型的項目的位置統(tǒng)計得分,確定所述令牌序列的類型位置得分;以及通過將所述令牌序列的所述項位置得分和所述類型位置得分求和,確定所述令牌序列的所述位置統(tǒng)計得分,其中,將項目的位置統(tǒng)計得分與項目的查詢統(tǒng)計得分分別定義為 項目的位置統(tǒng)計得分=log(l_count)*l_count/(l_count+q_count),以及項目的查詢統(tǒng)計得分=log (q_count) *q_count/ (l_count+q_count), 其中,l_COimt和q_COimt分別表示當(dāng)所述項目在地址和標題中出現(xiàn)的次數(shù)被存儲在所述統(tǒng)計模型中時所述項目在地址和標題中出現(xiàn)的次數(shù);以及當(dāng)所述項目在所述統(tǒng)計模型中不具有對應(yīng)的條目時,將所述項目的所述位置統(tǒng)計得分和查詢統(tǒng)計得分定義為0。
27.如權(quán)利要求沈所述的地圖搜索方法,其中對所述令牌序列的所述項位置得分的確定包括選取所述令牌序列中的第一令牌作為當(dāng)前令牌;確定所述當(dāng)前令牌的“項一元模型”的所述位置統(tǒng)計得分、以及以所述當(dāng)前令牌的所述項開始的所述令牌序列的項目“項二元模型”和“類型為“空”的相鄰的項的序列”的所述位置統(tǒng)計得分;選擇最高位置統(tǒng)計得分作為所述當(dāng)前令牌的項位置得分;將當(dāng)確定所述當(dāng)前令牌的所述項位置得分時不納入考慮的下一個令牌視為新當(dāng)前令牌,以生成一個或多個新當(dāng)前令牌,直到所述令牌序列的結(jié)束為止,并且確定每個新當(dāng)前令牌的項位置得分;將獲得的全部所述項位置得分求和以生成第一值;將所述令牌序列的全部項的序列的位置統(tǒng)計得分確定為第二值;以及選擇所述第一值與第二值之中較大的值作為所述令牌序列的所述項位置得分。
28.如權(quán)利要求沈所述的地圖搜索方法,其中確定所述令牌序列的所述類型位置得分包括選取所述令牌序列中的第一令牌作為當(dāng)前令牌;確定所述當(dāng)前令牌的所述類型一元模型的位置統(tǒng)計得分,以及從所述當(dāng)前令牌的類型開始的所述令牌序列的所述類型二元模型的位置統(tǒng)計得分;選擇所述類型一元模型的所確定位置統(tǒng)計得分與所述類型二元模型的所述位置統(tǒng)計得分之中較高位置統(tǒng)計得分作為所述當(dāng)前令牌的類型位置得分;將當(dāng)確定所述當(dāng)前令牌的所述類型位置得分時不納入考慮的下一個令牌視為新當(dāng)前令牌,以生成一個或多個新當(dāng)前令牌,直到所述令牌序列的結(jié)束為止,并且確定每個新當(dāng)前令牌的類型位置得分;將獲得的全部所述類型位置得分求和以生成第一值;將所述令牌序列的全部類型的序列的位置統(tǒng)計得分確定為第二值;選擇所述第一值與第二值之中較大的值作為所述令牌序列的所述類型位置得分。
29.如權(quán)利要求沈所述的地圖搜索方法,其中確定令牌序列的查詢統(tǒng)計得分包括 fl)基于關(guān)于所述令牌序列的項的項目的查詢統(tǒng)計得分,確定所述令牌序列的項查詢得分;f2)基于關(guān)于所述令牌序列的類型的項目的查詢統(tǒng)計得分,確定所述令牌序列的類型查詢得分;以及f3)通過將所述令牌序列的所述項查詢得分和所述類型查詢得分求和,確定所述令牌序列的所述查詢統(tǒng)計得分。
30.如權(quán)利要求四所述的地圖搜索方法,其中步驟fl)包括 fll)選取所述令牌序列中的第一令牌作為當(dāng)前令牌;fl2)確定所述當(dāng)前令牌的“項一元模型”的所述查詢統(tǒng)計得分,以及以所述當(dāng)前令牌的所述項開始的所述令牌序列的項目“項二元模型”和“類型為“空”的相鄰的項的序列”的所述查詢統(tǒng)計得分;fl3)選擇最高查詢統(tǒng)計得分作為所述當(dāng)前令牌的項查詢得分; fl4)將當(dāng)確定所述當(dāng)前令牌的所述項查詢得分時不納入考慮的下一個令牌視為新當(dāng)前令牌,并且重復(fù)步驟f 11)-步驟f 14)以確定所述新當(dāng)前令牌的項查詢得分,直到所述令牌序列的結(jié)束為止;fl5)將獲得的全部所述項查詢得分求和;fl6)確定所述令牌序列的項目“全部項的序列”的查詢統(tǒng)計得分;以及 fl7)將在步驟fl6)和步驟fl7)處獲得的結(jié)果之中較大的結(jié)果確定為所述令牌序列的所述項查詢得分。
31.如權(quán)利要求四所述的地圖搜索方法,其中步驟f2)包括 f21)選取所述令牌序列中的第一令牌作為當(dāng)前令牌;f22)確定所述當(dāng)前令牌的“類型一元模型”的所述查詢統(tǒng)計得分,以及從所述當(dāng)前令牌的所述類型開始的所述令牌序列的項目“類型二元模型”的所述查詢統(tǒng)計得分; f23)選擇較高的查詢統(tǒng)計得分作為所述當(dāng)前令牌的類型查詢得分; f24)將當(dāng)確定所述當(dāng)前令牌的所述類型查詢得分時不納入考慮的下一個令牌視為新當(dāng)前令牌,并且重復(fù)步驟f21)_步驟f24)以確定所述新當(dāng)前令牌的所述類型查詢得分,直到所述令牌序列結(jié)束位置;f25)將獲得的全部所述類型查詢得分求和;f26)確定所述令牌序列的項目“全部類型的序列”的查詢統(tǒng)計得分;以及 f27)將在步驟f26)和步驟f27)處獲得的結(jié)果之中較大的結(jié)果確定為所述令牌序列的所述類型查詢得分。
32.如權(quán)利要求3所述的地圖搜索方法,其中所述將所述輸入條目解析成所述令牌序列包括改正在所述令牌序列中錯誤地注釋的類型。
33.如權(quán)利要求32所述的地圖搜索方法,其中改正在所述令牌序列中錯誤地注釋的類型包括如果所述項不是跟隨在類型為“號”的項之后,則將項目的所述類型“量詞后綴”改成所述類型“空”。
34.一種計算機實現(xiàn)的地圖搜索方法,包括將從用戶接收的、用于地圖搜索的輸入條目分解成包括一個或多個令牌的令牌序列, 每個令牌包括用于表示所述輸入條目的段的項以及給所述項注釋的、用于指示所述項的類型的類型;確定所述令牌序列的可能的分割位置,其中可能的分割位置將所述令牌序列分割成一個或兩個子序列;對于每個所述可能的分割位置確定可能的分割方式,其中每個可能的分割方式將所述令牌序列分割成以下至少一個(1)用于指示位置信息的可能的位置部分和(2)用于指示與所述位置部分相關(guān)聯(lián)的搜索目標的可能的查詢部分;對于每個所述可能的分割方式的正確性的概率確定分割得分;以及選擇具有最高分割得分的所述可能的分割方式作為結(jié)果分割方式。
35.如權(quán)利要求34所述的地圖搜索方法,其中對于將所述令牌序列分割成兩個子令牌序列的可能的分割位置 確定用于所述兩個子令牌序列中的每一個子令牌序列的位置統(tǒng)計得分和查詢統(tǒng)計得分,并且通過將具有較高位置統(tǒng)計得分的所述子令牌序列當(dāng)作所述可能的位置部分并且將另一個子令牌序列當(dāng)作所述可能的查詢部分來確定對應(yīng)于所述可能的分割位置的所述可能的分割方式;對于將所述令牌序列分割成一個子令牌序列的可能的分割位置 通過當(dāng)所述子令牌序列的所述位置統(tǒng)計得分高于所述子令牌序列的所述查詢統(tǒng)計得分時將所述子令牌序列當(dāng)作所述位置部分,并且當(dāng)所述子令牌序列的所述查詢統(tǒng)計得分高于所述子令牌序列的所述位置統(tǒng)計得分時將所述子令牌序列當(dāng)作所述查詢部分,確定對應(yīng)于所述可能的分割位置的所述可能的分割方式。
36.如權(quán)利要求35所述的地圖搜索方法,其中,對用于指示每個所述可能的分割方式的正確性的統(tǒng)計概率的所述分割得分的確定包括基于所述位置部分的所述位置統(tǒng)計得分和所述查詢部分的所述查詢統(tǒng)計得分中的任意一個或兩者,對于每個可能的分割方式確定用于指示每個所述可能的分割方式的正確性的概率的分割得分。
37.如權(quán)利要求35所述的地圖搜索方法,其中通過參考統(tǒng)計模型來確定令牌序列的所述位置統(tǒng)計得分和所述查詢統(tǒng)計得分中的至少一個,并且其中令牌序列的所述位置統(tǒng)計得分指示所述令牌序列是位置的概率,并且令牌序列的所述查詢統(tǒng)計得分指示所述令牌序列是查詢的概率。
38.如權(quán)利要求37所述的地圖搜索方法,其中基于包括標題和地址的訓(xùn)練數(shù)據(jù)生成所述統(tǒng)計模型。
39.如權(quán)利要求38所述的地圖搜索方法,其中在將原始地址和原始標題用作訓(xùn)練數(shù)據(jù)之前,對所述原始地址進行預(yù)處理以去除其中的尾標題,并且對所述原始標題進行預(yù)處理以去除其中的前綴行政區(qū)域名稱。
40.如權(quán)利要求38所述的地圖搜索方法,其中通過以下步驟生成所述統(tǒng)計模型 將所述訓(xùn)練數(shù)據(jù)的包括標題和地址的每個片段解析成包括一個或多個令牌的令牌序列,每個令牌包括項和注釋給所述項以指示所述項的屬性的類型;對于所述標題和地址的所述令牌序列中所包括的每個項目,分別對在標題中出現(xiàn)的次數(shù)和在地址中出現(xiàn)的次數(shù)進行計數(shù)和存儲,其中,每個項目是以下之中任意項目具有單個項的項一元模型、具有兩個相鄰的項的項序列的項二元模型、類型為“空”的相鄰的項的序列、全部項的序列、涉及單個類型的類型一元模型、涉及兩個相鄰的類型的類型序列的類型二元模型以及全部類型的序列。
41.一種用于提供計算機實現(xiàn)的地圖搜索的系統(tǒng),包括解析模塊,用于將從用戶接收的、用于地圖搜索的輸入條目解析成位置部分和查詢部分中的至少一個;以及搜索模塊,用于接收來自所述解析模塊的輸出,并且在接收到所解析位置部分和查詢部分之后搜索與所述所解析位置部分和查詢部分相關(guān)的信息,以便向所述用戶返回地圖搜索結(jié)果。
42.如權(quán)利要求41所述的系統(tǒng),其中所述解析模塊包括用于將所述輸入條目解析成一個或多個令牌的令牌序列的裝置,每個令牌包括用于表示所述輸入條目的段的項以及給所述項注釋的類型;以及用于使用給每個項的該類型來指示所述項是否包括地址相關(guān)信息以及所述地址相關(guān)信息的類型的裝置。
43.如權(quán)利要求42所述的系統(tǒng),其中所述用于將所述輸入條目解析成所述令牌序列的裝置包括用于將所述輸入條目中的地址相關(guān)詞標識為令牌的項的裝置;以及用于將所述地址相關(guān)詞的類型標識為所述令牌的所述類型的裝置。
44.如權(quán)利要求43所述的系統(tǒng),其中所述用于標識所述輸入條目中的地址相關(guān)詞的裝置包括用于使用地址相關(guān)詞的字典中的條目及其類型來標識所述地址相關(guān)詞和所述令牌類型的裝置。
45.如權(quán)利要求43所述的系統(tǒng),其中所述字典的地址相關(guān)詞包括行政區(qū)域名稱、路名、 地址相關(guān)后綴、地址相關(guān)前綴和號中的至少一個。
46.如權(quán)利要求43所述的系統(tǒng),包括用于將所述輸入條目中的詞標識為與地址無關(guān)的令牌的項的裝置;以及用于分配“空”作為所述令牌的所述類型,以指示所述令牌的所述項不包括地址相關(guān)信息的裝置。
47.如權(quán)利要求43所述的系統(tǒng),其中所述解析模塊包括用于確定所述令牌序列的可能的分割位置的裝置,每個可能的分割位置將所述令牌序列分割成一個或兩個子令牌序列;用于對于每個所述可能的分割位置確定可能的分割方式的裝置,每個可能的分割方式將所述令牌序列分割成以下至少一個(1)可能的查詢部分和( 可能的位置部分;用于確定用于指示每個所述可能的分割方式的正確性的統(tǒng)計概率的分割得分的裝置;以及用于選擇具有最高分割得分的所述可能的分割方式作為結(jié)果分割方式的裝置。
48.如權(quán)利要求43所述的系統(tǒng),包括計算機網(wǎng)絡(luò),用于向所述解析模塊和所述搜索模塊并且向計算機提供通信;以及客戶端計算機,所述客戶端計算機與所述計算機網(wǎng)絡(luò)通信以便從所述用戶接收用于地圖搜索的所述輸入條目,以及以便從所述搜索模塊接收結(jié)果,其中所述計算機網(wǎng)絡(luò)將來自所述客戶端計算機的所述輸入條目導(dǎo)向所述解析模塊并且將來自所述搜索模塊的所述結(jié)果導(dǎo)向所述客戶端計算機。
49.一種用于提供計算機實現(xiàn)的地圖搜索的系統(tǒng),包括令牌模塊,用于將從用戶接收的、用于地圖搜索的輸入條目用令牌表示成包括至少一個令牌的令牌序列,每個令牌包括用于表示所述輸入條目的段的項以及給所述項注釋的類型;用于確定所述令牌序列的可能的分割位置的裝置,其中可能的分割位置將所述令牌序列分割成一個或兩個子序列;用于對于每個所述可能的分割位置確定可能的分割方式的裝置,其中每個可能的分割方式將所述令牌序列分割成可能的查詢部分和可能的位置部分中的至少一個; 用于對于每個可能的分割方式確定分割得分的裝置;用于選擇具有最高分割得分的所述可能的分割方式作為結(jié)果分割方式的裝置;以及搜索模塊,用于接收所述結(jié)果分割方式以實施地圖搜索并且生成到所述用戶的地圖搜索結(jié)果。
50.如權(quán)利要求49所述的系統(tǒng),包括計算機網(wǎng)絡(luò),用于向所述令牌模塊、全部所述裝置以及所述搜索模塊并且向計算機提供通信;以及客戶端計算機,所述客戶端計算機與所述計算機網(wǎng)絡(luò)通信以便從所述用戶接收用于地圖搜索的所述輸入條目,其中所述計算機網(wǎng)絡(luò)將來自所述客戶端計算機的所述輸入條目導(dǎo)向所述令牌模塊并且將來自所述搜索模塊的所述結(jié)果導(dǎo)向所述客戶端計算機。
51.一種用于提供計算機實現(xiàn)的地圖搜索的系統(tǒng),包括 用于接收由用戶輸入的輸入條目的接口 ;處理單元,用于解析所述輸入條目以便將所述輸入條目分割成位置部分和查詢部分中的至少一個;以及基于所述解析結(jié)果搜索與所述輸入條目相關(guān)的信息,其中,如果所述輸入條目被分割成位置部分和查詢部分,則所述處理單元基于所述位置部分確定地理區(qū)域,并且搜索關(guān)于與所述查詢部分相關(guān)聯(lián)并且位于所述地理區(qū)域中的實體的信息。
52.如權(quán)利要求51所述的系統(tǒng),包括計算機網(wǎng)絡(luò),用于向所述處理單元提供通信;以及客戶端計算機,所述客戶端計算機與所述計算機網(wǎng)絡(luò)通信以便從所述用戶接收用于地圖搜索的所述輸入條目,其中所述計算機網(wǎng)絡(luò)經(jīng)由所述接口將來自所述客戶端計算機的所述輸入條目導(dǎo)向所述處理單元、并且將來自所述處理單元的所述結(jié)果導(dǎo)向所述客戶端計算機。
53.一種用于提供計算機實現(xiàn)的地圖搜索的系統(tǒng),包括 用于接收由用戶輸入的輸入條目的接口;處理單元,用于將所述輸入條目令牌化成包括至少一個令牌的令牌序列,每個令牌包括用于表示所述輸入條目的段的項以及給所述項注釋的類型;確定所述令牌序列的可能的分割位置,可能的分割位置將所述令牌序列分割成一個或兩個子序列;對于每個所述可能的分割位置確定可能的分割方式,每個可能的分割方式將所述令牌序列分割成可能的查詢部分和/或可能的位置部分; 對于每個可能的分割方式確定分割得分;以及選擇具有最高分割得分的所述可能的分割方式作為結(jié)果分割方式。
54.一種用于存儲指令的機器可讀記錄介質(zhì),當(dāng)所述指令由機器執(zhí)行時使得所述機器執(zhí)行以下步驟在基于來自用戶的、用于地圖搜索的輸入條目實施所述地圖搜索之前,將所述輸入條目解析成用于指示輸入搜索條目中的位置信息的位置部分和用于指示與所述輸入條目中的所述位置部分相關(guān)聯(lián)的搜索目標的查詢部分;以及實施地圖搜索以便基于所述位置部分獲得地理區(qū)域或位置,以及以便搜索關(guān)于與所述查詢部分相關(guān)聯(lián)并且位于所獲得的地理區(qū)域或位置處、之內(nèi)或附近的一個或多個實體的信肩、ο
55.一種用于記錄多個指令的機器可讀記錄介質(zhì),當(dāng)所述指令由機器執(zhí)行時使得所述機器執(zhí)行以下動作將從用戶接收的輸入條目令牌化成包括至少一個令牌的令牌序列,其中每個令牌包括用于表示所述輸入條目的段的項以及給所述項注釋的類型;確定所述令牌序列的可能的分割位置,其中可能的分割位置將所述令牌序列分割成一個或兩個子序列;對于每個所述可能的分割位置確定可能的分割方式,其中每個可能的分割方式將所述令牌序列分割成可能的查詢部分和/或可能的位置部分;對于每個可能的分割方式確定分割得分;選擇具有最高分割得分的所述可能的分割方式作為結(jié)果分割方式。
56.一種計算機實現(xiàn)的地圖搜索方法,包括使得在基于來自用戶的、用于地圖搜索的輸入條目實施所述地圖搜索之前,將所述輸入條目解析成用于指示輸入搜索條目中的位置信息的位置部分和用于指示與所述輸入條目中的所述位置部分相關(guān)聯(lián)的搜索目標的查詢部分,其中執(zhí)行對所述輸入條目的所述解析,而無需在先搜索對應(yīng)于由所述輸入條目所指示的位置的地理編碼;以及使得實施地圖搜索以便基于所述位置部分獲得地理區(qū)域或位置,以及以便搜索關(guān)于與所述查詢部分相關(guān)聯(lián)并且位于所獲得的地理區(qū)域或位置處、之內(nèi)或附近的一個或多個實體的信息。
57.如權(quán)利要求56所述的地圖搜索方法,其中所述使得解析來自用戶的、用于地圖搜索的輸入條目包括使得將所述輸入條目解析成一個或多個令牌的令牌序列,每個令牌包括用于表示所述輸入條目的段的項以及給所述項注釋的類型;以及使得給每個項的所述類型指示所述項是否包括地址相關(guān)信息和所述地址相關(guān)信息的類型。
全文摘要
用于基于用戶查詢解析的地圖搜索的基于計算機的系統(tǒng)、裝置和方法的實現(xiàn)。例如,提供了一種計算機實現(xiàn)的地圖搜索方法,該方法包括將來自用戶的、用于地圖搜索的輸入條目解析成用于指示輸入搜索條目中的位置信息的位置部分以及用于指示與該輸入條目中的該位置部分相關(guān)聯(lián)的搜索目標的查詢部分;以及實施地圖搜索以便基于該位置部分獲得地理區(qū)域或位置、以及以便搜索關(guān)于與該查詢部分相關(guān)聯(lián)并且位于所獲得的地理區(qū)域或位置處、之內(nèi)或附近的一個或多個實體的信息。
文檔編號G06F17/30GK102483748SQ200980161026
公開日2012年5月30日 申請日期2009年7月7日 優(yōu)先權(quán)日2009年7月7日
發(fā)明者王宇 申請人:谷歌公司