亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法及系統(tǒng)的制作方法

文檔序號(hào):6341539閱讀:200來(lái)源:國(guó)知局

專(zhuān)利名稱(chēng)::一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及文字信息處理及發(fā)布領(lǐng)域,特別是涉及一種針對(duì)網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法和系統(tǒng)。
背景技術(shù)
:現(xiàn)實(shí)世界中大量的信息是以文字形式存在的,這些文字內(nèi)容中包含了大量的地理信息(地理特征),例如介紹一篇拙政園的文章"拙政,典故稱(chēng)謂,是蘇州拙政園名稱(chēng)的由來(lái)。拙政園,被譽(yù)為"天下園林之母",與北京頤和園,承德避暑山莊,蘇州留園中稱(chēng)另四大名園"。其中的"蘇州拙政園,北京頤和園,承德避暑山莊,蘇州留園"等就是典型的地理信息。地理信息即位置信息,通常可以用地圖的方式來(lái)表現(xiàn),是一種直觀的信息表達(dá)形式,并且可以進(jìn)一步的利用地理信息技術(shù)來(lái)實(shí)現(xiàn)出行指路等深入的服務(wù)。如果能夠?qū)⑽淖中畔⑴c地理信息相互結(jié)合,讓文字和地理信息一體化展示,讓讀者在瀏覽文字的時(shí)候,也能夠進(jìn)一步了解地名地物的位置,那么將可以大大的提高文字的可讀性和表示的新穎性。例如,在閱讀一篇新聞時(shí),新聞的內(nèi)容介紹的是某地正在舉辦美食節(jié),而讀者就能夠了解美食節(jié)的地點(diǎn),甚至獲取到到達(dá)的路徑,將是一種美好的閱讀體驗(yàn)。然而,現(xiàn)在大量的文字內(nèi)容,特別是互聯(lián)網(wǎng)上新聞內(nèi)容,只是純粹的文字發(fā)布,并沒(méi)有與地理信息進(jìn)行結(jié)合。另外,現(xiàn)有的技術(shù)未完全考慮到全稱(chēng),簡(jiǎn)稱(chēng)的情況,例如"衛(wèi)生監(jiān)督所"與"衛(wèi)監(jiān)所"一般指同一個(gè)地理要素,在檢索時(shí)可能會(huì)導(dǎo)致簡(jiǎn)稱(chēng)被忽略掉的情況。現(xiàn)有技術(shù)未完全考慮到網(wǎng)絡(luò)發(fā)布中模糊匹配的需求,例如"全市衛(wèi)生監(jiān)督所年終總結(jié)大會(huì)",這一段文字需要對(duì)應(yīng)的是全市所有"衛(wèi)生監(jiān)督所"的位置。即一個(gè)地理關(guān)鍵詞對(duì)應(yīng)多個(gè)地理要素,現(xiàn)有技術(shù)無(wú)法進(jìn)行靈活的識(shí)別和判斷。現(xiàn)有技術(shù)未考慮網(wǎng)絡(luò)環(huán)境下發(fā)布帶有地理標(biāo)簽的文本信息,并根據(jù)地理標(biāo)簽進(jìn)行聯(lián)合展示。
發(fā)明內(nèi)容技術(shù)問(wèn)題本發(fā)明目的是針對(duì)
背景技術(shù)
中所述現(xiàn)有技術(shù)存在的缺陷提供一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法及系統(tǒng),解決文字信息與地理信息快速關(guān)聯(lián),生成地理標(biāo)簽,實(shí)現(xiàn)文字與地理信息的關(guān)聯(lián)展示。技術(shù)方案本發(fā)明為實(shí)現(xiàn)上述目的,采用如下技術(shù)方案本發(fā)明一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法,其特征在于包括如下步驟第一步接受原始文本,所述原始文本為文字信息;第二步對(duì)原始文本進(jìn)行地理關(guān)鍵詞分析,獲得原始文本中的第一地理關(guān)鍵詞信息集合,并將所述第一地理關(guān)鍵詞信息集合經(jīng)過(guò)沖突檢查獲得第二地理關(guān)鍵詞信息集合;第三步利用預(yù)置的地理數(shù)據(jù)庫(kù),對(duì)第二步所述的第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息逐一進(jìn)行搜索,獲取與第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞4信息相對(duì)應(yīng)的地理要素匹配信息集合,所述地理要素匹配信息集合由多組相對(duì)應(yīng)的地理位置和匹配度構(gòu)成的匹配信息構(gòu)成;第四步將第三步所述的匹配度最高的匹配信息設(shè)定為地理關(guān)鍵詞信息的關(guān)聯(lián);第五步根據(jù)第四步設(shè)定的關(guān)聯(lián)關(guān)系,將第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息與相對(duì)應(yīng)的地理要素匹配信息集合生成綜合文本,所述的綜合文本是帶有地理標(biāo)簽的網(wǎng)頁(yè)。第二步中,采用預(yù)置的地名詞典對(duì)原始文本進(jìn)行地理關(guān)鍵詞分析,所述地名詞典的構(gòu)造方法如下從預(yù)置的地理數(shù)據(jù)庫(kù)中抽取地理要素名稱(chēng),形成地理要素名稱(chēng)的文本集合即構(gòu)成地名詞典。所述地理關(guān)鍵詞分析采用分詞方法或分詞模塊實(shí)現(xiàn)。第二步所述的沖突檢查方法如下(1)當(dāng)一個(gè)地理關(guān)鍵詞包含另一個(gè)地理關(guān)鍵詞,則根據(jù)最大匹配的原則進(jìn)行過(guò)濾;(2)當(dāng)一個(gè)地理關(guān)鍵詞與另一個(gè)地理關(guān)鍵詞部分重疊,則根據(jù)預(yù)制的規(guī)則進(jìn)行沖突規(guī)避。所述預(yù)制的規(guī)則為后匹配規(guī)則。第三步所述的檢索采用全文搜索方法。將第二步所述的第二地理關(guān)鍵詞信息集合中的每一個(gè)地理關(guān)鍵詞做第二次分詞處理,得到搜索關(guān)鍵詞集合用于全文搜索。第五步所述的綜合文本中引入動(dòng)作腳本。第五步所述的綜合文本中引入遠(yuǎn)程腳本?!N網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的系統(tǒng),包括接收器,用于接收原始文本,所述原始文本為文字信息;分析器,用于分析接收到的原始文本,參考地名詞典,提取出原始文本中的所有第一地理關(guān)鍵詞信息集合;同時(shí),對(duì)第一地理關(guān)鍵詞信息集合進(jìn)行沖突檢查,獲得過(guò)濾后的第二地理關(guān)鍵詞信息集合;搜索器,參考地理數(shù)據(jù)庫(kù),對(duì)第二步所述的第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息逐一進(jìn)行搜索,獲取與第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息相對(duì)應(yīng)的地理要素匹配信息集合;關(guān)聯(lián)匹配器,根據(jù)與第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息相對(duì)應(yīng)的地理要素匹配信息集合,確定關(guān)聯(lián)匹配;綜合文本輸出器,根據(jù)設(shè)定的關(guān)聯(lián)關(guān)系,將第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息與相對(duì)應(yīng)的地理要素匹配信息集合生成綜合文本,所述的綜合文本是帶有地理標(biāo)簽的網(wǎng)頁(yè)。關(guān)聯(lián)系統(tǒng)還包括關(guān)聯(lián)選擇器即選擇界面裝置,根據(jù)與第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息相對(duì)應(yīng)的地理要素匹配信息集合,人工確定關(guān)聯(lián)匹配。有益效果通過(guò)本發(fā)明,網(wǎng)絡(luò)中單純的文字信息可以與地理信息關(guān)聯(lián),從而增加具有地理特征的文字信息表現(xiàn)的豐富度。這種方法可以應(yīng)用于采用文字方式發(fā)布內(nèi)容的各個(gè)領(lǐng)域,例如新聞媒體,電子政務(wù),互動(dòng)社區(qū)等;進(jìn)一步地,可以在在互聯(lián)網(wǎng),移動(dòng)網(wǎng)絡(luò)等環(huán)境下開(kāi)發(fā)各類(lèi)應(yīng)用系統(tǒng)和商業(yè)化產(chǎn)品。采用沖突檢查方法提高匹配的精度,同時(shí)還提供帶有地理標(biāo)簽的網(wǎng)頁(yè)。本發(fā)明建立的關(guān)聯(lián)系統(tǒng),可以進(jìn)行靈活的進(jìn)行文本分析,建立地理標(biāo)簽,以統(tǒng)一的方式標(biāo)注了文字信息與地理信息的關(guān)聯(lián),基于此標(biāo)簽,可以方便的定義和注入各種地理動(dòng)作。這樣,可以提供更加靈活的文字和地理的聯(lián)合展示方式。圖1:本發(fā)明網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法流程圖。圖2:本發(fā)明網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的系統(tǒng)結(jié)構(gòu)圖。具體實(shí)施例方式下面結(jié)合附圖對(duì)發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說(shuō)明如圖1所示,表示了本發(fā)明的一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法實(shí)例。步驟201、接收原始文本,所述文本為一段文字,可能包含地理信息。例如"拙政園,被譽(yù)為"天下園林之母",與北京頤和園,承德避暑山莊,蘇州留園稱(chēng)另四大名園"。其中"拙政園"、"北京"、"頤和園"、"承德"、"蘇州"和"留園"為構(gòu)成地理信息的地理關(guān)鍵詞。步驟202、利用預(yù)置的地名詞典對(duì)原始文本進(jìn)行地理關(guān)鍵詞分析,獲得原始文本中的第一地理關(guān)鍵詞信息集合。地理關(guān)鍵詞分析可以根據(jù)分詞方法進(jìn)行實(shí)現(xiàn),亦可以考慮采用現(xiàn)有的開(kāi)源分詞模塊,如paoding,mmseg等。所述的地名詞典是一系列的地理名詞的集合,可以包括地理實(shí)體名稱(chēng)如道路,河流,綠地,旅游景點(diǎn)等;也包括非地理實(shí)體名稱(chēng),如非物質(zhì)文化遺產(chǎn),事件點(diǎn)等;所述的地理關(guān)鍵詞信息包括地理關(guān)鍵詞名稱(chēng),地理關(guān)鍵詞的在文本中起始位置,地理關(guān)鍵詞的在文本中結(jié)束位置等信息。例如在"拙政園,被譽(yù)為"天下園林之母""的原始文本,經(jīng)過(guò)分析后,返回的第一地理關(guān)鍵詞信息集合如下地理關(guān)鍵詞名稱(chēng)地理關(guān)鍵詞的在文本中起始位置地理關(guān)鍵詞的在文本中結(jié)束位置拙政園13優(yōu)選的,地名詞典可以包括地名全稱(chēng),簡(jiǎn)稱(chēng),俗稱(chēng),歷史名稱(chēng)等。進(jìn)一步的,對(duì)第一地理關(guān)鍵詞信息集合在文本中的位置關(guān)系進(jìn)行沖突檢查。如果一個(gè)關(guān)鍵詞包含另一個(gè)關(guān)鍵詞,例如,"拙政園站"包含"拙政園",可以根據(jù)最大匹配的原則進(jìn)行過(guò)濾,選中"拙政園站"。如果一個(gè)關(guān)鍵詞與另一個(gè)關(guān)鍵詞部分重疊,可以根據(jù)預(yù)制的規(guī)則進(jìn)行沖突規(guī)避。例如,"虎丘公園天下酒店"包含了"虎丘公園"與"公園天下酒店"兩個(gè)地理關(guān)鍵詞,根據(jù)預(yù)制的后匹配規(guī)則(中文的重點(diǎn)詞一般放在后面)可以確定是"公園天下酒店",而忽略前一個(gè)地理關(guān)鍵詞。經(jīng)過(guò)以上的沖突檢查,形成第二地理關(guān)鍵詞信息集合。通過(guò)步驟202,從原始文本內(nèi)容中獲得的第二地理關(guān)鍵詞信息集合。步驟203、對(duì)通過(guò)步驟202獲得的第二地理關(guān)鍵詞信息集合,利用預(yù)置的地理數(shù)據(jù)庫(kù),逐一進(jìn)行搜索,返回一個(gè)或多個(gè)相匹配的地理要素匹配信息。所述的地理數(shù)據(jù)庫(kù)包含地名詞典的所有地名信息,位置信息及其它的附屬信息。所述的地理要素匹配信息可以包括地理要素標(biāo)識(shí),地理要素名稱(chēng),地理位置,匹配度等。例如<table>tableseeoriginaldocumentpage7</column></row><table>優(yōu)選的,搜索過(guò)程利用數(shù)據(jù)庫(kù)的全文搜索進(jìn)行,為解決簡(jiǎn)稱(chēng)匹配以及模糊匹配問(wèn)題,可對(duì)第二地理關(guān)鍵詞信息集合中的每一個(gè)地理關(guān)鍵詞做第二次分詞處理,得到搜索關(guān)鍵詞集合用于全文搜索,所述的搜索關(guān)鍵詞集合包括原始地理關(guān)鍵詞和二次分詞結(jié)果。優(yōu)選的,搜索過(guò)程利用數(shù)據(jù)庫(kù)的全文搜索進(jìn)行,為解決簡(jiǎn)稱(chēng)以及模糊匹配問(wèn)題,可對(duì)第二地理關(guān)鍵詞信息集合中的每一個(gè)地理關(guān)鍵詞做二次分詞處理,得到搜索關(guān)鍵詞集合用于全文搜索,所述的搜索關(guān)鍵詞集合包括原始地理關(guān)鍵詞和二次分詞結(jié)果。例如地理關(guān)鍵詞"蘇州市衛(wèi)監(jiān)所"經(jīng)過(guò)二次分詞后的形成關(guān)鍵詞集合為"蘇州","蘇州市","衛(wèi)","監(jiān)","所",分詞結(jié)果依據(jù)所采用詞庫(kù)。搜索關(guān)鍵詞集合為"蘇州市衛(wèi)監(jiān)所","蘇州市","衛(wèi)","監(jiān)","所"。本例中采用開(kāi)源分詞模塊詞庫(kù)和地名詞典進(jìn)行分詞,lucene建立地理數(shù)據(jù)庫(kù)全文索引,并用lucene進(jìn)行全文搜索,并根據(jù)匹配度返回地理要素匹配信息數(shù)據(jù)集。例如"蘇州市衛(wèi)監(jiān)所"的地理關(guān)鍵詞信息可以有以下的匹配結(jié)果。<table>tableseeoriginaldocumentpage7</column></row><table>通過(guò)步驟203,獲得了一個(gè)按照匹配度從大到小的地理要素匹配信息集合。步驟204、針對(duì)202步獲得的地理關(guān)鍵詞和203步獲得地理要素匹配信息集合,根據(jù)返回的匹配度,設(shè)定最優(yōu)的地理關(guān)鍵詞和地理要素匹配信息的關(guān)聯(lián)。步驟205根據(jù)步驟204得到地理關(guān)鍵詞和地理要素匹配信息的關(guān)聯(lián)關(guān)系,生成綜合信息文本。所述的綜合信息文本是帶有地理標(biāo)簽的網(wǎng)頁(yè)。所述的地理標(biāo)簽是網(wǎng)頁(yè)中地理關(guān)鍵詞的標(biāo)志,可以是html標(biāo)簽,xml標(biāo)簽等等。例如,采用html方式生成綜合文本"拙政園,被譽(yù)為"天下園林之母"的綜合文本為"〈spanid="11320357"name=maptagX="121.234"Y="32.235">拙政園〈/span〉,被譽(yù)為"天下園林之母""。進(jìn)一步的,可以在綜合文本中引入動(dòng)作腳本,瀏覽器就可以執(zhí)行地理標(biāo)簽的各項(xiàng)操作。例如〈spanid=11320357謹(jǐn)e=maptago翻useover=,,鼠標(biāo)滑過(guò)時(shí)的動(dòng)作"onclick="點(diǎn)擊時(shí)的動(dòng)作">拙政園〈/span〉,被譽(yù)為"天下園林之母"。進(jìn)一步的,可以在生成的綜合文本中引入遠(yuǎn)程腳本引用(腳本在服務(wù)器端,這樣可以動(dòng)態(tài)的統(tǒng)一的改變所有的地理標(biāo)簽的樣式和動(dòng)作),瀏覽器則可以動(dòng)態(tài)執(zhí)行地理標(biāo)簽各項(xiàng)操作。例如注入了遠(yuǎn)程腳本keyword_operation.js,生成的綜合文本如下〈scriptsrc=,,http://mapserver/keyword—operation.js,,X/script>〈spanid=11320357name=maptag〉拙政園〈/span〉,被譽(yù)為"天下園林之母"。遠(yuǎn)程腳本keyword_operation.js,可以針對(duì)地理標(biāo)簽定義不同的動(dòng)作。//============遠(yuǎn)禾呈展口本keyword—operation.js======〃對(duì)地理標(biāo)簽注入動(dòng)作。Functioninsert0perations(){Varelements=document.getElementsByName("maptag").For(vari=0;i〈elements.length;i++){Vare=elements[i];e.onmouseover=function(){〃鼠標(biāo)滑過(guò)時(shí)的動(dòng)作。}e.onclick=function(){〃點(diǎn)擊時(shí)的動(dòng)作。}}}本發(fā)明在網(wǎng)絡(luò)環(huán)境下,除了對(duì)網(wǎng)頁(yè)的發(fā)布的文本信息提供地理信息關(guān)聯(lián)外,還提供了帶有地理標(biāo)簽的網(wǎng)頁(yè)。如圖2所示,表示了一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的系統(tǒng)實(shí)例。接收器301,用于接收原始文本,文本中可能包含地理關(guān)鍵詞。分析器302,用于分析接收到的原始文本,參考地名詞典,提取出原始文本中的所有第一地理關(guān)鍵詞信息集合。同時(shí),對(duì)第一地理關(guān)鍵詞信息集合進(jìn)行沖突檢查,獲得過(guò)濾后的第二地理關(guān)鍵詞信息集合。搜索器303,參考地理數(shù)據(jù)庫(kù),用第二地理關(guān)鍵詞信息集合逐一進(jìn)行搜索,獲取地理要素匹配信息集合。關(guān)聯(lián)匹配器304-l,根據(jù)第二地理關(guān)鍵詞信息集合與地理要素匹配信息集合的匹配度,確定關(guān)聯(lián)匹配信息。優(yōu)選的,針對(duì)網(wǎng)絡(luò)文本的發(fā)布,尤其是新聞發(fā)布,本發(fā)明除了提供自動(dòng)化的匹配外,還能提供靈活的人工編輯手段,以輔助信息的有效推送。例如"全市衛(wèi)生監(jiān)督所年終總結(jié)大會(huì)",這一段文字需要對(duì)應(yīng)的是全市所有"衛(wèi)生監(jiān)督所"的位置。即一個(gè)地理關(guān)鍵詞對(duì)應(yīng)多個(gè)地理要素,可以通過(guò)人工對(duì)地理關(guān)鍵詞和地理要素匹配信息的關(guān)聯(lián)進(jìn)行篩選確定。因此,此處采用關(guān)聯(lián)選擇器304-2即選擇界面裝置,輔助人工選擇,用于人工確定關(guān)聯(lián)匹配。綜合文本輸出器305,根據(jù)關(guān)聯(lián)信息,生成帶有地理標(biāo)簽綜合文本。以上對(duì)本發(fā)明所提供的方法和和系統(tǒng)做了詳細(xì)的介紹,以上運(yùn)用的實(shí)例是幫助理解本發(fā)明的核心思想,本領(lǐng)域的一般技術(shù)人員依據(jù)本發(fā)明的思想,在具體實(shí)施方式和應(yīng)用范圍上均會(huì)有改變之處。綜上所述,本說(shuō)明書(shū)的內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。權(quán)利要求一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法,其特征在于包括如下步驟第一步接受原始文本,所述原始文本為文字信息;第二步對(duì)原始文本進(jìn)行地理關(guān)鍵詞分析,獲得原始文本中的第一地理關(guān)鍵詞信息集合,并將所述第一地理關(guān)鍵詞信息集合經(jīng)過(guò)沖突檢查獲得第二地理關(guān)鍵詞信息集合;第三步利用預(yù)置的地理數(shù)據(jù)庫(kù),對(duì)第二步所述的第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息逐一進(jìn)行搜索,獲取與第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息相對(duì)應(yīng)的地理要素匹配信息集合,所述地理要素匹配信息集合由多組相對(duì)應(yīng)的地理位置和匹配度構(gòu)成的匹配信息構(gòu)成;第四步將第三步所述的匹配度最高的匹配信息設(shè)定為地理關(guān)鍵詞信息的關(guān)聯(lián);第五步根據(jù)第四步設(shè)定的關(guān)聯(lián)關(guān)系,將第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息與相對(duì)應(yīng)的地理要素匹配信息集合生成綜合文本,所述的綜合文本是帶有地理標(biāo)簽的網(wǎng)頁(yè)。2.根據(jù)權(quán)利要求l所述的一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法,其特征在于第二步中,采用預(yù)置的地名詞典對(duì)原始文本進(jìn)行地理關(guān)鍵詞分析,所述地名詞典的構(gòu)造方法如下從預(yù)置的地理數(shù)據(jù)庫(kù)中抽取地理要素名稱(chēng),形成地理要素名稱(chēng)的文本集合即構(gòu)成地名詞典。3.根據(jù)權(quán)利要求1或2所述的一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法,其特征在于所述地理關(guān)鍵詞分析采用分詞方法或分詞模塊實(shí)現(xiàn)。4.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法,其特征在于第二步所述的沖突檢查方法如下(1)當(dāng)一個(gè)地理關(guān)鍵詞包含另一個(gè)地理關(guān)鍵詞,則根據(jù)最大匹配的原則進(jìn)行過(guò)濾;(2)當(dāng)一個(gè)地理關(guān)鍵詞與另一個(gè)地理關(guān)鍵詞部分重疊,則根據(jù)預(yù)制的規(guī)則進(jìn)行沖突規(guī)避。5.根據(jù)權(quán)利要求4所述的一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法,其特征在于所述預(yù)制的規(guī)則為后匹配規(guī)則。6.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法,其特征在于第三步所述的搜索采用全文索引方法。7.根據(jù)權(quán)利要求6所述的一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法,其特征在于將第二步所述的第二地理關(guān)鍵詞信息集合中的每一個(gè)地理關(guān)鍵詞做第二次分詞處理,得到搜索關(guān)鍵詞集合用于全文搜索。8.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法,其特征在于第五步所述的綜合文本中引入動(dòng)作腳本。9.根據(jù)權(quán)利要求1所述的一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法,其特征在于第五步所述的綜合文本中引入遠(yuǎn)程腳本。10.—種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的系統(tǒng),其特征在于包括接收器,用于接收原始文本,所述原始文本為文字信息;分析器,用于分析接收到的原始文本,參考地名詞典,提取出原始文本中的所有第一地理關(guān)鍵詞信息集合;同時(shí),對(duì)第一地理關(guān)鍵詞信息集合進(jìn)行沖突檢查,獲得過(guò)濾后的第二地理關(guān)鍵詞信息集合;搜索器,參考地理數(shù)據(jù)庫(kù),對(duì)第二步所述的第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息逐一進(jìn)行搜索,獲取與第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息相對(duì)應(yīng)的地理要素匹配信息集合;關(guān)聯(lián)匹配器,根據(jù)與第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息相對(duì)應(yīng)的地理要素匹配信息集合,確定關(guān)聯(lián)匹配;綜合文本輸出器,根據(jù)設(shè)定的關(guān)聯(lián)關(guān)系,將第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息與相對(duì)應(yīng)的地理要素匹配信息集合生成綜合文本,所述的綜合文本是帶有地理標(biāo)簽的網(wǎng)頁(yè)。11.根據(jù)權(quán)利要求io所述的一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的系統(tǒng),其特征在于還包括關(guān)聯(lián)選擇器即選擇界面裝置,根據(jù)與第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息相對(duì)應(yīng)的地理要素匹配信息集合,人工確定關(guān)聯(lián)匹配。全文摘要本發(fā)明公布了一種網(wǎng)絡(luò)文字信息中嵌入地理標(biāo)簽的方法及系統(tǒng),所述方法如下接受原始文本,所述原始文本為文字信息;對(duì)原始文本進(jìn)行地理關(guān)鍵詞分析,獲得原始文本中的第一地理關(guān)鍵詞信息集合,并經(jīng)過(guò)沖突檢查獲得第二地理關(guān)鍵詞信息集合;利用預(yù)置的地理數(shù)據(jù)庫(kù),對(duì)第二地理關(guān)鍵詞信息集合中的各個(gè)地理關(guān)鍵詞信息逐一進(jìn)行搜索,獲取地理要素匹配信息集合;將匹配度最高的匹配信息設(shè)定為地理關(guān)鍵詞信息的關(guān)聯(lián);生成綜合文本。本發(fā)明系統(tǒng)包括接收器、分析器、搜索器、關(guān)聯(lián)匹配器和綜合文本輸出器。本發(fā)明增加具有地理特征的文字信息表現(xiàn)的豐富度。文檔編號(hào)G06F17/30GK101794277SQ201019026118公開(kāi)日2010年8月4日申請(qǐng)日期2010年3月1日優(yōu)先權(quán)日2010年3月1日發(fā)明者周為群,林金煉,黃暉申請(qǐng)人:蘇州數(shù)字地圖網(wǎng)絡(luò)科技有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1