亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于語(yǔ)義識(shí)別的地址匹配方法

文檔序號(hào):6520261閱讀:292來(lái)源:國(guó)知局
一種基于語(yǔ)義識(shí)別的地址匹配方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于語(yǔ)義識(shí)別的地址匹配方法,所述方法包括地址匹配引擎和日志分析引擎,地址匹配引擎包括行政區(qū)劃語(yǔ)義模塊、地名類(lèi)別語(yǔ)義模塊、標(biāo)準(zhǔn)地址模塊、語(yǔ)義規(guī)則模塊、中文分詞模塊、語(yǔ)義識(shí)別模塊、查詢模塊。所述方法根據(jù)用戶輸入的待檢索地址通過(guò)基于語(yǔ)義識(shí)別的地址匹配引擎快速、準(zhǔn)確地查找到匹配的地址,并以在線服務(wù)的形式返回用戶檢索結(jié)果,日志分析引擎記錄并分析查詢?nèi)罩荆鶕?jù)日志分析結(jié)果優(yōu)化地址匹配引擎。
【專(zhuān)利說(shuō)明】一種基于語(yǔ)義識(shí)別的地址匹配方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于對(duì)地觀測(cè)與導(dǎo)航【技術(shù)領(lǐng)域】,具體涉及一種基于語(yǔ)義識(shí)別的地址匹配方法。
【背景技術(shù)】
[0002]地址檢索、查詢服務(wù)是網(wǎng)絡(luò)地圖在線服務(wù)的重要功能。地址匹配是將文字性的描述地址與其空間的地理位置坐標(biāo)建立起對(duì)應(yīng)關(guān)系的過(guò)程,其目的是要根據(jù)用戶輸入的待檢索地址快速查找到匹配的地址,并以在線服務(wù)的形式返回用戶檢索結(jié)果。傳統(tǒng)的方法通常采用基于關(guān)鍵詞的精確或模糊匹配方法,這對(duì)于大規(guī)?;虼蠓秶牡孛刂窋?shù)據(jù),不僅查找的速度慢,很難滿足網(wǎng)絡(luò)地圖在線快速服務(wù)的需要,也沒(méi)有顧及地址的語(yǔ)義信息,導(dǎo)致查找的準(zhǔn)確性比較低,查找結(jié)果多樣且往往不是用戶所需要的結(jié)果。例如,當(dāng)用戶在互聯(lián)網(wǎng)上查找“上海南京路”時(shí),期望的返回結(jié)果應(yīng)該是位于上海,名稱(chēng)為南京路的道路,但普通的查找方法可能會(huì)將南京的上海路和上海的南京路都作為結(jié)果返回。因此,針對(duì)上述兩個(gè)問(wèn)題,發(fā)明了一種基于語(yǔ)義識(shí)別的地址匹配方法,可以有效地提高地址數(shù)據(jù)查找的速度和準(zhǔn)確性,從而提高網(wǎng)絡(luò)地圖在線服務(wù)質(zhì)量,為用戶提供良好的服務(wù)檢驗(yàn)。

【發(fā)明內(nèi)容】

[0003]針對(duì)上述現(xiàn)有技術(shù)中的不足,本發(fā)明的目的在于提供一種基于語(yǔ)義識(shí)別的地址匹配方法。對(duì)于以自然語(yǔ)言形式表示的地址信息,通過(guò)中文分詞技術(shù),并顧及地址的語(yǔ)義建立用于地址匹配的語(yǔ)義庫(kù)或知識(shí)庫(kù),然后根據(jù)地址數(shù)據(jù)表達(dá)的語(yǔ)義特點(diǎn),建立地址匹配的規(guī)則,通過(guò)適當(dāng)?shù)钠ヅ渌惴ㄌ岣叩刂窓z索的速度和準(zhǔn)確性。
[0004]為了實(shí)現(xiàn)上述發(fā)明目的,本申請(qǐng)?zhí)峁┝艘韵录夹g(shù)方案:
[0005]一種基于語(yǔ)義識(shí)別的地址匹配方法,所述方法包括地址匹配引擎和日志分析引擎,所述地址匹配引擎根據(jù)用戶輸入的待檢索地址基于語(yǔ)義識(shí)別快速、準(zhǔn)確地查找到匹配的地址,并以在線服務(wù)的形式返回用戶檢索結(jié)果,所述日志分析引擎記錄并分析查詢?nèi)罩荆鶕?jù)日志分析結(jié)果優(yōu)化地址匹配引擎。地址匹配引擎包括行政區(qū)劃語(yǔ)義模塊、地名類(lèi)別語(yǔ)義模塊、語(yǔ)義規(guī)則模塊、標(biāo)準(zhǔn)地址模塊、語(yǔ)義規(guī)則模塊、中文分詞模塊、語(yǔ)義識(shí)別模塊、查詢模塊。所述方法步驟如下:
[0006]( I)利用行政區(qū)劃語(yǔ)義模塊建立行政區(qū)劃語(yǔ)義庫(kù);
[0007](2)利用地名類(lèi)別語(yǔ)義模塊建立地名類(lèi)別語(yǔ)義庫(kù);
[0008](3)利用標(biāo)準(zhǔn)地址模塊建立規(guī)范化的具體地址庫(kù);
[0009](4)利用語(yǔ)義規(guī)則模塊建立基于語(yǔ)義的地址檢索規(guī)則;
[0010](5)利用中文分詞模塊對(duì)待查地址進(jìn)入中文分詞;
[0011](6)利用語(yǔ)義識(shí)別模塊對(duì)分詞得到的詞元進(jìn)行語(yǔ)義識(shí)別;
[0012](7)利用查詢模塊對(duì)識(shí)別后的詞元基于語(yǔ)義規(guī)則進(jìn)行查詢;
[0013](8)利用日志分析引擎記錄地址匹配日志,分析日志,將分析結(jié)果反饋給地址匹配引擎,優(yōu)化地址匹配引擎。
[0014]在步驟(I)中,所述行政區(qū)劃語(yǔ)義模塊中,行政區(qū)劃以其國(guó)家標(biāo)準(zhǔn)編碼為基本信息,建立相應(yīng)的行政區(qū)劃語(yǔ)義庫(kù),用于地址匹配后續(xù)過(guò)程的行政區(qū)劃語(yǔ)義匹配,行政區(qū)劃是界定地址行政范圍的主要屬性之一,也是地址的基本語(yǔ)義之一,在進(jìn)行地址匹配時(shí),行政區(qū)劃語(yǔ)義是優(yōu)先考慮的語(yǔ)義匹配。
[0015]在步驟(2)中,所述地名類(lèi)別語(yǔ)義模塊,描述了地名地址所歸屬的分類(lèi),是地址的基本語(yǔ)義之一,其中,地名類(lèi)別編碼是多級(jí)編碼的方式。
[0016]步驟(3)中,所述標(biāo)準(zhǔn)地址模塊對(duì)不同區(qū)域的地址數(shù)據(jù)進(jìn)行規(guī)范化設(shè)計(jì),準(zhǔn)確地進(jìn)行地址匹配。
[0017]在步驟(4)中,所述語(yǔ)義規(guī)則模塊,建立基于語(yǔ)義的地址檢索規(guī)則和規(guī)則間的關(guān)系,形成地址檢索的知識(shí)庫(kù),具體方法為
[0018]a、當(dāng)詞元有且僅有一個(gè),并且該詞元類(lèi)型為“行政區(qū)劃”時(shí),進(jìn)行行政區(qū)劃查詢,返回行政區(qū)劃的信息;
[0019]b、當(dāng)詞元有多個(gè)且所有詞元都是“行政區(qū)劃”時(shí),進(jìn)行行政區(qū)劃查詢,返回地區(qū)級(jí)別最小的那個(gè)行政區(qū)劃信息;
[0020]C、當(dāng)詞元有多個(gè)且所有詞元都是“行政區(qū)劃”時(shí),并且行政區(qū)劃不是上下級(jí)關(guān)系,應(yīng)取第一個(gè)行政區(qū)劃做范圍,其他行政區(qū)劃做關(guān)鍵字進(jìn)行普通地名查詢,返回位置在行政區(qū)劃內(nèi),且名稱(chēng)包含指定關(guān)鍵字的地名;
[0021]d、當(dāng)詞元有且僅有一個(gè),并且該詞元類(lèi)型為“類(lèi)別”時(shí),按照類(lèi)別進(jìn)行查詢;
[0022]e、當(dāng)詞元中既有“類(lèi)別”,也有“行政區(qū)劃”的時(shí)候,按照規(guī)則c得到行政區(qū)劃和關(guān)鍵字,在指定類(lèi)別中查找地名;
[0023]f、當(dāng)詞元既不包含“行政區(qū)劃”類(lèi)的詞,也不包含“類(lèi)別”類(lèi)的詞,將這些詞當(dāng)做關(guān)鍵字查找地名;
[0024]g、當(dāng)詞元既包含“行政區(qū)劃”類(lèi)的詞,同時(shí)包含關(guān)鍵字,則在行政區(qū)劃內(nèi)按指定關(guān)鍵字進(jìn)行查詢;
[0025]h、當(dāng)詞元既包含多個(gè)“行政區(qū)劃”類(lèi)的詞,并且行政區(qū)劃不是同一區(qū)域,或者是第二個(gè)行政區(qū)劃大于第一行政區(qū)劃,包含關(guān)鍵字,第一個(gè)當(dāng)行政區(qū)劃,后面當(dāng)做關(guān)鍵字處理;
[0026]1、當(dāng)詞元有多個(gè)且所有詞元都是“地名類(lèi)型”時(shí),按照排列的先后順序,排在最后的為“地名類(lèi)型”,其他詞作為關(guān)鍵字進(jìn)行查詢
[0027]g、當(dāng)包含“門(mén)牌”類(lèi)型詞元時(shí),按以上規(guī)則構(gòu)建查詢條件,并進(jìn)行地址查詢。
[0028]在步驟(5)中,對(duì)待查地址進(jìn)入中文分詞模塊,對(duì)于用戶輸入的以自然語(yǔ)言形式表示的待查地址采用成熟的中文分詞算法,并將行政區(qū)劃語(yǔ)義庫(kù)、地名類(lèi)別語(yǔ)義庫(kù)中的數(shù)據(jù)納入到用于中文分詞的字典中,以改進(jìn)中文分詞算法的查準(zhǔn)性、查全性,適當(dāng)減少中文分詞算法中存在的語(yǔ)義歧義問(wèn)題,分詞過(guò)程中支持同義詞典,分詞后得到地址詞元。
[0029]步驟(6)中,對(duì)分詞得到的詞元進(jìn)入語(yǔ)義識(shí)別模塊,對(duì)于分詞后得到的地址詞元,根據(jù)行政區(qū)劃語(yǔ)義庫(kù)、地名類(lèi)別語(yǔ)義庫(kù)以及專(zhuān)家知識(shí)對(duì)詞元進(jìn)行語(yǔ)義識(shí)別,確定每個(gè)詞元匹配的數(shù)據(jù)庫(kù)表范圍,避免大范圍地檢索無(wú)關(guān)聯(lián)的地址數(shù)據(jù),以減少數(shù)據(jù)庫(kù)檢索的時(shí)間。
[0030]所述步驟(7)中,對(duì)識(shí)別后的詞元基于語(yǔ)義規(guī)則進(jìn)入查詢模塊,在具體地址庫(kù)中采用數(shù)據(jù)庫(kù)查詢語(yǔ)言對(duì)識(shí)別后的詞元基于語(yǔ)義規(guī)則進(jìn)行查詢,返回查詢結(jié)果給用戶。[0031]所述步驟(8)中,日志分析引擎記錄地址匹配日志,并分析日志,將分析結(jié)果反饋給地址匹配引擎,優(yōu)化地址匹配引擎,也能夠?qū)肫渌獠肯到y(tǒng)的日志庫(kù)或知識(shí)庫(kù),并利用其優(yōu)化地址匹配引擎。
[0032]優(yōu)選方案為:
[0033]首先,為了保證地址查找服務(wù)能夠匹配到所需要的結(jié)果,保證檢索的查全性,需要建立符合標(biāo)準(zhǔn)的完整地址庫(kù)。為了達(dá)到良好的地址匹配效果,本發(fā)明對(duì)地址庫(kù)進(jìn)行了以下優(yōu)化設(shè)計(jì):
[0034]I)對(duì)于以自然語(yǔ)言形式表示的地址進(jìn)行語(yǔ)義分析,將語(yǔ)義信息分為行政區(qū)劃語(yǔ)義、地名類(lèi)別語(yǔ)義和具體地址三類(lèi);行政區(qū)劃語(yǔ)義表示了地址所歸屬的行政區(qū)劃范圍,如湖北省。地名類(lèi)別語(yǔ)義表示了地址所屬的類(lèi)別,如行業(yè)性質(zhì)類(lèi)別,比如快餐、超市、大學(xué)。具體地址為地址信息中不能歸于行政區(qū)劃語(yǔ)義、地名類(lèi)別語(yǔ)義的地址語(yǔ)義部分,如測(cè)繪大廈。
[0035]2)依據(jù)上述語(yǔ)義信息類(lèi)別,分別建立多層級(jí)的語(yǔ)義數(shù)據(jù)庫(kù)表,包括行政區(qū)劃語(yǔ)義庫(kù)、地名類(lèi)別語(yǔ)義庫(kù)、和根據(jù)行政區(qū)劃與地名類(lèi)別分類(lèi)的多個(gè)具體地址庫(kù)。
[0036]3)對(duì)上述語(yǔ)義庫(kù)進(jìn)行了規(guī)范化設(shè)計(jì),例如,行政區(qū)劃采用國(guó)家標(biāo)準(zhǔn)編碼,可支持到街道、村級(jí)的編碼。地名類(lèi)別和具體地址參考測(cè)繪行業(yè)標(biāo)準(zhǔn)《地理信息公共服務(wù)平臺(tái)地理實(shí)體與地名地址數(shù)據(jù)規(guī)范》(CH/Z9010-2011)及相關(guān)的國(guó)內(nèi)、國(guó)標(biāo)標(biāo)準(zhǔn)進(jìn)行規(guī)范化設(shè)計(jì),給出了設(shè)計(jì)原則和數(shù)據(jù)庫(kù)表結(jié)構(gòu),具體設(shè)計(jì)在系統(tǒng)實(shí)現(xiàn)時(shí)完成,可以滿足不同系統(tǒng)的地址檢索需求。
[0037]其次,在傳統(tǒng)的地址檢索方法的基礎(chǔ)上,根據(jù)地址檢索的經(jīng)驗(yàn),通過(guò)訪問(wèn)專(zhuān)家和典型用戶建立了基于語(yǔ)義的地址檢索規(guī)則和規(guī)則間的關(guān)系,形成地址檢索的知識(shí)庫(kù)。
[0038]然后,對(duì)用戶輸入的需要查找的地址進(jìn)行中文分詞和語(yǔ)義識(shí)別。中文分詞采用較成熟的分詞算法,但需要顧及上面描述的語(yǔ)義信息分類(lèi),也就是基于行政區(qū)劃語(yǔ)義、地名類(lèi)別語(yǔ)義和具體地址對(duì)用戶描述的地址進(jìn)行分詞,劃分成為基本的地址詞元或關(guān)鍵詞。然后對(duì)地址詞元進(jìn)行語(yǔ)義識(shí)別,判斷地址詞元屬于行政區(qū)劃語(yǔ)義、地名類(lèi)別語(yǔ)義還是具體地址。語(yǔ)義識(shí)別依據(jù)地址詞元的性質(zhì)、詞元的關(guān)系等知識(shí),通過(guò)語(yǔ)義匹配算法實(shí)現(xiàn)。
[0039]最后,通過(guò)建立地址匹配規(guī)則,分別對(duì)語(yǔ)義識(shí)別后的地址詞元進(jìn)行匹配,返回查找結(jié)果,記錄地址匹配日志,并分析日志,將分析結(jié)果反饋給地址匹配引擎,優(yōu)化地址匹配引擎。
[0040]有益效果
[0041]1、先通過(guò)對(duì)地址進(jìn)行語(yǔ)義分析與識(shí)別,對(duì)識(shí)別后的地址詞元快速定位于相應(yīng)的語(yǔ)義庫(kù),并在該語(yǔ)義庫(kù)中進(jìn)行關(guān)鍵詞匹配。由于分類(lèi)后的語(yǔ)義庫(kù)規(guī)模較沒(méi)有進(jìn)行分別的地址規(guī)模小,提高了關(guān)鍵詞匹配的速度,而定位語(yǔ)義庫(kù)的時(shí)間很短,從而整體上可以獲得較高的地址查找速度。同時(shí),由于在進(jìn)行中文分詞時(shí)顧及了地址的語(yǔ)義,使得查找的結(jié)果更能體現(xiàn)用戶的意思,有利于提高查找的準(zhǔn)確性。
[0042]2、本發(fā)明通過(guò)建立基于語(yǔ)義的匹配規(guī)則,充分采用地址匹配的經(jīng)驗(yàn)知識(shí),提高了地址匹配算法的效率。
【專(zhuān)利附圖】

【附圖說(shuō)明】
[0043]圖1是基于語(yǔ)義識(shí)別的地址匹配方法示意圖?!揪唧w實(shí)施方式】
[0044]【具體實(shí)施方式】如下:
[0045]< 一 >建立行政區(qū)劃語(yǔ)義庫(kù)
[0046]行政區(qū)劃是界定地址行政范圍的主要屬性之一,也是地址的基本語(yǔ)義之一。在進(jìn)行地址匹配時(shí),行政區(qū)劃語(yǔ)義是優(yōu)先考慮的語(yǔ)義匹配。
[0047]行政區(qū)劃以其國(guó)家標(biāo)準(zhǔn)編碼為基本信息,建立相應(yīng)的行政區(qū)劃語(yǔ)義庫(kù),用于地址匹配后續(xù)過(guò)程的行政區(qū)劃語(yǔ)義匹配。行政區(qū)劃語(yǔ)義庫(kù)的表結(jié)構(gòu)如表1所示。
[0048]表1行政區(qū)劃語(yǔ)義庫(kù)的表結(jié)構(gòu)
[0049]
【權(quán)利要求】
1.一種基于語(yǔ)義識(shí)別的地址匹配方法,其特征在于,所述方法包括地址匹配引擎和日志分析引擎,所述地址匹配引擎根據(jù)用戶輸入的待檢索地址基于語(yǔ)義識(shí)別快速、準(zhǔn)確地查找到匹配的地址,并以在線服務(wù)的形式返回用戶檢索結(jié)果,所述日志分析引擎記錄并分析查詢?nèi)罩?,根?jù)日志分析結(jié)果優(yōu)化地址匹配引擎。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述地址匹配引擎包括行政區(qū)劃語(yǔ)義模塊、地名類(lèi)別語(yǔ)義模塊、語(yǔ)義規(guī)則模塊、標(biāo)準(zhǔn)地址模塊、語(yǔ)義規(guī)則模塊、中文分詞模塊、語(yǔ)義識(shí)別模塊、查詢模塊,所述地址匹配引擎的運(yùn)行步驟如下, (1)利用行政區(qū)劃語(yǔ)義模塊建立行政區(qū)劃語(yǔ)義庫(kù); (2)利用地名類(lèi)別語(yǔ)義模塊建立地名類(lèi)別語(yǔ)義庫(kù); (3)利用標(biāo)準(zhǔn)地址模塊建立規(guī)范化的具體地址庫(kù); (4)利用語(yǔ)義規(guī)則模塊建立基于語(yǔ)義的地址檢索方法; (5)利用中文分詞模塊對(duì)待查地址進(jìn)入中文分詞; (6)利用語(yǔ)義識(shí)別模塊對(duì)分詞得到的詞元進(jìn)行語(yǔ)義識(shí)別; (7)利用查詢模塊對(duì)識(shí)別后的詞元基于語(yǔ)義方法進(jìn)行查詢。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于:在步驟(1)中,所述行政區(qū)劃語(yǔ)義庫(kù)模塊中,行政區(qū)劃以其國(guó)家標(biāo)準(zhǔn)編碼為基本信息,建立相應(yīng)的行政區(qū)劃語(yǔ)義庫(kù),用于地址匹配后續(xù)過(guò)程的行政區(qū)劃語(yǔ)義匹配,行政區(qū)劃是界定地址行政范圍的主要屬性之一,也是地址的基本語(yǔ)義之一,在進(jìn)行地址匹配時(shí),行政區(qū)劃語(yǔ)義是優(yōu)先考慮的語(yǔ)義匹配。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于:在步驟(2)中,所述地名類(lèi)別語(yǔ)義庫(kù)模塊,描述了地名地址所歸屬 的分類(lèi),是地址的基本語(yǔ)義之一,其中,地名類(lèi)別編碼是多級(jí)編碼的方式。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于:步驟(3)中,所述具體地址庫(kù)模塊對(duì)不同區(qū)域的地址數(shù)據(jù)進(jìn)行規(guī)范化設(shè)計(jì),準(zhǔn)確地進(jìn)行地址匹配。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于:在步驟(4)中,所述基于語(yǔ)義的地址檢索方法模塊,建立基于語(yǔ)義的地址檢索規(guī)則和規(guī)則間的關(guān)系,形成地址檢索的知識(shí)庫(kù),具體方法為 a、當(dāng)詞元有且僅有一個(gè),并且該詞元類(lèi)型為“行政區(qū)劃”時(shí),進(jìn)行行政區(qū)劃查詢,返回行政區(qū)劃的信息; b、當(dāng)詞元有多個(gè)且所有詞元都是“行政區(qū)劃”時(shí),進(jìn)行行政區(qū)劃查詢,返回地區(qū)級(jí)別最小的那個(gè)行政區(qū)劃信息; C、當(dāng)詞元有多個(gè)且所有詞元都是“行政區(qū)劃”時(shí),并且行政區(qū)劃不是上下級(jí)關(guān)系,應(yīng)取第一個(gè)行政區(qū)劃做范圍,其他行政區(qū)劃做關(guān)鍵字進(jìn)行普通地名查詢,返回位置在行政區(qū)劃內(nèi),且名稱(chēng)包含指定關(guān)鍵字的地名; d、當(dāng)詞元有且僅有一個(gè),并且該詞元類(lèi)型為“類(lèi)別”時(shí),按照類(lèi)別進(jìn)行查詢; e、當(dāng)詞元中既有“類(lèi)別”,也有“行政區(qū)劃”的時(shí)候,按照規(guī)則c得到行政區(qū)劃和關(guān)鍵字,在指定類(lèi)別中查找地名; f、當(dāng)詞元既不包含“行政區(qū)劃”類(lèi)的詞,也不包含“類(lèi)別”類(lèi)的詞,將這些詞當(dāng)做關(guān)鍵字查找地名; g、當(dāng)詞元既包含“行政區(qū)劃”類(lèi)的詞,同時(shí)包含關(guān)鍵字,則在行政區(qū)劃內(nèi)按指定關(guān)鍵字進(jìn)行查詢; h、當(dāng)詞元既包含多個(gè)“行政區(qū)劃”類(lèi)的詞,并且行政區(qū)劃不是同一區(qū)域,或者是第二個(gè)行政區(qū)劃大于第一行政區(qū)劃,包含關(guān)鍵字,第一個(gè)當(dāng)行政區(qū)劃,后面當(dāng)做關(guān)鍵字處理; ` 1、當(dāng)詞元有多個(gè)且所有詞元都是“地名類(lèi)型”時(shí),按照排列的先后順序,排在最后的為“地名類(lèi)型”,其他詞作為關(guān)鍵字進(jìn)行查詢 g、當(dāng)包含“門(mén)牌”類(lèi)型詞元時(shí),按以上規(guī)則構(gòu)建查詢條件,并進(jìn)行地址查詢。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于:步驟(5)中對(duì)待查地址進(jìn)入中文分詞模塊,對(duì)于用戶輸入的以自然語(yǔ)言形式表示的待查地址采用成熟的中文分詞算法,并將行政區(qū)劃語(yǔ)義庫(kù)、地名類(lèi)別語(yǔ)義庫(kù)中的數(shù)據(jù)納入到用于中文分詞的字典中,以改進(jìn)中文分詞算法的查準(zhǔn)性、查全性,適當(dāng)減少中文分詞算法中存在的語(yǔ)義歧義問(wèn)題,分詞過(guò)程中支持同義詞典,分詞后得到地址詞元。
8.根據(jù)權(quán)利要求2所述的方法,其特征在于:步驟(6)中,對(duì)分詞得到的詞元進(jìn)入語(yǔ)義識(shí)別模塊,對(duì)于分詞后得到的地址詞元,根據(jù)行政區(qū)劃語(yǔ)義庫(kù)、地名類(lèi)別語(yǔ)義庫(kù)以及專(zhuān)家知識(shí)對(duì)詞元進(jìn)行語(yǔ)義識(shí)別,確定每個(gè)詞元匹配的數(shù)據(jù)庫(kù)表范圍,避免大范圍地檢索無(wú)關(guān)聯(lián)的地址數(shù)據(jù),以減少數(shù)據(jù)庫(kù)檢索的時(shí)間。
9.根據(jù)權(quán)利要求2所述的方法,其特征在于:所述步驟(7)中,對(duì)識(shí)別后的詞元基于語(yǔ)義規(guī)則進(jìn)入查詢模塊,在具體地址庫(kù)中采用數(shù)據(jù)庫(kù)查詢語(yǔ)言對(duì)識(shí)別后的詞元基于語(yǔ)義規(guī)則進(jìn)行查詢,返回查詢結(jié)果給用戶。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述日志分析引擎記錄地址匹配日志,并分析日志,將分析結(jié)果反饋給地址匹配引擎,優(yōu)化地址匹配引擎,也能夠?qū)肫渌獠肯到y(tǒng)的日志庫(kù)或知識(shí)庫(kù),并利用`其優(yōu)化地址匹配引擎。
【文檔編號(hào)】G06F17/30GK103605752SQ201310596806
【公開(kāi)日】2014年2月26日 申請(qǐng)日期:2013年11月21日 優(yōu)先權(quán)日:2013年11月21日
【發(fā)明者】黃俊韜, 魏延峰, 吳杰, 趙雷雷, 劉琳, 劉勇, 肖豪, 鄧躍進(jìn), 宋愛(ài)紅, 范業(yè)穩(wěn), 朱偉奇, 張龍, 陳勝鵬, 程方, 賀楷鍇, 許振華 申請(qǐng)人:武大吉奧信息技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1