基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法,包括:獲取由卡口的過車圖片解析后生成的過車圖片的文本描述信息;根據(jù)過車圖片的文本描述信息的主要字段設(shè)置分布式全文檢索系統(tǒng)配置文件;按分布式全文檢索系統(tǒng)配置文件將過車圖片的文本描述信息解析索引到分布式全文檢索系統(tǒng)數(shù)據(jù)庫中,在分布式全文檢索系統(tǒng)數(shù)據(jù)庫中建立倒排索引并進行分布式存儲;接收卡口車輛搜索請求,并解析出所要搜索的目標(biāo)卡口車輛屬性;根據(jù)目標(biāo)卡口車輛屬性從分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到目標(biāo)卡口車輛信息并進行反饋。本發(fā)明加快了卡口車輛搜索、查詢的效率。
【專利說明】
基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及卡口車輛信息搜索的技術(shù)領(lǐng)域,具體地,涉及一種基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法及系統(tǒng)。【背景技術(shù)】
[0002]近年來,隨著互聯(lián)網(wǎng)技術(shù)及信息處理技術(shù)的發(fā)展,各種信息的智能化分析及處理成為業(yè)內(nèi)的熱門研究內(nèi)容。加上現(xiàn)今各地的交通設(shè)備的大量增加,交通信息工程的建設(shè),為人們的日常生活提供了豐富的信息資源的同時,也增加了交通信息數(shù)據(jù)的分析處理量。車輛已經(jīng)成為了人們生活中必不可少的交通工具,每天在各地都會有大量的車輛信息,通過對各地的這些車輛信息數(shù)據(jù)進行分析可以獲取許多重要的信息、情報。
[0003]在現(xiàn)今的交通管理系統(tǒng)中,卡口系統(tǒng)用于采用光電技術(shù)、圖像處理技術(shù)、模式識別技術(shù)等技術(shù)拍下過往各個卡口的每一輛車輛的圖像,識別出車輛的牌照等信息,并將所采集到的車輛信息數(shù)據(jù)保存在服務(wù)器數(shù)據(jù)庫中??谙到y(tǒng)通過上述各種技術(shù)手段最終生成簡單的過車信息,包括:車牌號、車型、車身顏色、車牌顏色、過車時間、行駛速度、卡口編號等。 但是,隨著各地智能交通信息系統(tǒng)工程的持續(xù)建設(shè)和投入,交通設(shè)備設(shè)施的大量增加,以及人們對車輛的依賴性增強,導(dǎo)致卡口系統(tǒng)產(chǎn)生的過車數(shù)據(jù)迅速膨脹。現(xiàn)有技術(shù)將這些過車數(shù)據(jù)存儲在關(guān)系型數(shù)據(jù)庫中,日積月累這些數(shù)據(jù)可能有千萬條,甚至幾億、幾十億條數(shù)據(jù)。
[0004]關(guān)系型數(shù)據(jù)庫以行和列形成交叉二維表的形式存儲數(shù)據(jù),在交叉二維表中,每一行定義實體集的一個實體;每一列定義實體集的一個屬性特征。在卡口系統(tǒng)產(chǎn)生過車信息的速度快,且各個卡口產(chǎn)生的過車信息集合起來數(shù)據(jù)量大,按照二維表的實體即屬性特征進行存儲,會因為存儲數(shù)據(jù)量大增加存儲成本,還會因為較大存儲數(shù)據(jù)的二維表中不能快速查詢到數(shù)據(jù)的存儲定位而不能實時地進行數(shù)據(jù)存儲。并且關(guān)系型數(shù)據(jù)庫的二維表中不能體現(xiàn)各個數(shù)據(jù)之間的聯(lián)系,會造成后續(xù)管理不方便的問題。再者,由于龐大的數(shù)據(jù)存儲量, 后續(xù)對數(shù)據(jù)庫的應(yīng)用中,從龐大的數(shù)據(jù)中快速地查找到目標(biāo)數(shù)據(jù)就顯得更為重要,而按照現(xiàn)有技術(shù)的存儲方式,每次查找數(shù)據(jù)都需要遍歷整個二維表中存儲的龐大數(shù)據(jù),造成查詢效率低下。
[0005]因此,提供一種高效易實施的卡口車輛信息搜索的方法是本領(lǐng)域亟待解決的問題。
【發(fā)明內(nèi)容】
[0006]有鑒于此,本發(fā)明提供了一種基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法及系統(tǒng),解決了在卡口車輛信息存儲數(shù)據(jù)庫中進行卡口車輛搜索效率低下的問題。
[0007]為了解決上述技術(shù)問題,本發(fā)明提出一種基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法,包括:
[0008]獲取由卡口的過車圖片解析后生成的過車圖片的文本描述信息,所述過車圖片的文本描述信息至少包括:車牌號、車型、車身顏色、車牌顏色、卡口信息及過車時間,其中,所述過車圖片的文本描述信息通過分布式發(fā)布訂閱消息系統(tǒng)進行緩存;
[0009]根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置分布式全文檢索系統(tǒng)配置文件;
[0010]按所述分布式全文檢索系統(tǒng)配置文件將所述過車圖片的文本描述信息解析索引到分布式全文檢索系統(tǒng)數(shù)據(jù)庫中,在所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中建立倒排索引并進行分布式存儲;
[0011]接收卡口車輛搜索請求,并解析出所要搜索的目標(biāo)卡口車輛屬性;
[0012]根據(jù)所述目標(biāo)卡口車輛屬性從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到目標(biāo)卡口車輛信息并進行反饋。
[0013]進一步地,其中,所述主要字段至少包括:車牌號、車型、車身顏色、車牌顏色。
[0014]進一步地,其中,所述在所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中建立倒排索引,包括:
[0015]根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置關(guān)鍵詞索引,并以所述過車圖片的文本描述信息的分布式全文檢索系統(tǒng)數(shù)據(jù)的文檔編號為索引內(nèi)容建立倒排索引。
[0016]進一步地,其中,所述根據(jù)所述目標(biāo)卡口車輛屬性從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到目標(biāo)卡口車輛信息并進行反饋,包括:
[0017]根據(jù)所述目標(biāo)卡口車輛屬性設(shè)置索引;
[0018]基于該索引從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到相應(yīng)的目標(biāo)卡口車輛信息的文檔編號;
[0019]再通過查找到的文檔編號獲取目標(biāo)卡口車輛信息并進行反饋。
[0020]進一步地,其中,所述分布式存儲由至少兩臺物理機進行存儲,并通過分布式服務(wù)框架管理各個存儲節(jié)點。
[0021]另外,本發(fā)明還提供一種基于分布式全文檢索系統(tǒng)的卡口車輛搜索的系統(tǒng),所述系統(tǒng)包括:獲取模塊、配置模塊、存儲模塊、接收模塊及處理模塊,其中,
[0022]所述獲取模塊,用于獲取由卡口的過車圖片解析后生成的過車圖片的文本描述信息,所述過車圖片的文本描述信息至少包括:車牌號、車型、車身顏色、車牌顏色、卡口信息及過車時間,其中,所述過車圖片的文本描述信息通過分布式發(fā)布訂閱消息系統(tǒng)進行緩存;
[0023]所述配置模塊,用于根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置分布式全文檢索系統(tǒng)配置文件;
[0024]所述存儲模塊,用于按所述分布式全文檢索系統(tǒng)配置文件將所述過車圖片的文本描述信息解析索引到分布式全文檢索系統(tǒng)數(shù)據(jù)庫中,在所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中建立倒排索引并進行分布式存儲;
[0025]所述接收模塊,用于接收卡口車輛搜索請求,并解析出所要搜索的目標(biāo)卡口車輛屬性;
[0026]所述處理模塊,用于根據(jù)所述目標(biāo)卡口車輛屬性從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到目標(biāo)卡口車輛信息并進行反饋。
[0027]進一步地,其中,所述主要字段至少包括:車牌號、車型、車身顏色、車牌顏色。
[0028]進一步地,其中,所述存儲模塊,用于根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置關(guān)鍵詞索引,并以所述過車圖片的文本描述信息的分布式全文檢索系統(tǒng)數(shù)據(jù)的文檔編號為索引內(nèi)容建立倒排索引。
[0029]進一步地,其中,所述處理模塊,用于:
[0030]根據(jù)所述目標(biāo)卡口車輛屬性設(shè)置索引;[0031 ]基于該索引從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到相應(yīng)的目標(biāo)卡口車輛信息的文檔編號;
[0032]再通過查找到的文檔編號獲取目標(biāo)卡口車輛信息并進行反饋。
[0033]進一步地,其中,所述分布式存儲由至少兩臺物理機進行存儲,并通過分布式服務(wù)框架管理各個存儲節(jié)點。
[0034]與現(xiàn)有技術(shù)相比,本發(fā)明的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法及系統(tǒng),實現(xiàn)了如下的有益效果:
[0035](1)本發(fā)明所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法及系統(tǒng),基于分布式全文檢索系統(tǒng)采用分布式存儲卡口的過車圖片的文本描述信息,可以通過設(shè)置多臺廉價的物理機進行數(shù)據(jù)存儲,再利用一臺物理機統(tǒng)一管理,數(shù)據(jù)存儲量增加時還可以增加物理機,降低了龐大的卡口過車圖片的文本描述信息數(shù)據(jù)的存儲成本。
[0036](2)本發(fā)明所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法及系統(tǒng),基于分布式全文檢索系統(tǒng)建立倒排索引,方便通過用戶的卡口車輛搜索請求中的關(guān)鍵詞進行快速查找,同時,還可以基于分布式存儲采用并行式的查找,大大加快了卡口車輛搜索、查詢的效率。
[0037]當(dāng)然,實施本發(fā)明的任一產(chǎn)品必不一定需要同時達(dá)到以上所述的所有技術(shù)效果。【附圖說明】
[0038]此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
[0039]圖1為本發(fā)明的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法的一個可選實施例的流程示意圖;
[0040]圖2為本發(fā)明實施例1所述基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法中,倒排索引的索引詞與相應(yīng)文檔的結(jié)構(gòu)示意圖;
[0041]圖3為本發(fā)明實施例2所述基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法的一個可選實施例的流程示意圖;
[0042]圖4為本實施例2中應(yīng)用基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法的系統(tǒng)設(shè)備結(jié)構(gòu)示意圖;
[0043]圖5為本實施例3中所述基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法的流程示意圖;
[0044]圖6為本實施例4中公開的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的系統(tǒng)的一個可選實施例的結(jié)構(gòu)示意圖。【具體實施方式】
[0045]如在說明書及權(quán)利要求當(dāng)中使用了某些詞匯來指稱特定組件。本領(lǐng)域技術(shù)人員應(yīng)可理解,硬件制造商可能會用不同名詞來稱呼同一個組件。本說明書及權(quán)利要求并不以名稱的差異來作為區(qū)分組件的方式,而是以組件在功能上的差異來作為區(qū)分的準(zhǔn)則。如在通篇說明書及權(quán)利要求當(dāng)中所提及的“包含”為一開放式用語,故應(yīng)解釋成“包含但不限定于”。“大致”是指在可接收的誤差范圍內(nèi),本領(lǐng)域技術(shù)人員能夠在一定誤差范圍內(nèi)解決所述技術(shù)問題,基本達(dá)到所述技術(shù)效果。說明書后續(xù)描述為實施本發(fā)明的較佳實施方式,然所述描述乃以說明本發(fā)明的一般原則為目的,并非用以限定本發(fā)明的范圍。本發(fā)明的保護范圍當(dāng)視所附權(quán)利要求所界定者為準(zhǔn)。
[0046]實施例1
[0047]如圖1所示,為本發(fā)明的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法的一個可選實施例的流程示意圖,本發(fā)明基于分布式全文檢索系統(tǒng)設(shè)計卡口過車信息的倒排索引并進行分布式存儲,加快了卡口車輛搜索的效率。本實施例中所述分布式全文檢索系統(tǒng)的卡口車輛搜索的方法包括以下步驟:
[0048]步驟101、獲取由卡口的過車圖片解析后生成的過車圖片的文本描述信息,所述過車圖片的文本描述信息至少包括:車牌號、車型、車身顏色、車牌顏色、卡口信息及過車時間,其中,所述過車圖片的文本描述信息通過分布式發(fā)布訂閱消息系統(tǒng)(kafka)進行緩存。
[0049]過車圖片的文本描述信息(VSD過車信息)是由緩存卡口或電警等前端設(shè)備產(chǎn)生的過車圖片后進過解析后生成的,VSD過車信息包含:車牌號、車型、顏色、過車時間、卡口信息等信息。
[0050]優(yōu)選地,所述過車圖片的文本描述信息通過分布式發(fā)布訂閱消息系統(tǒng)緩存在消息服務(wù)器中,本步驟從消息服務(wù)器中獲取過車圖片的文本描述信息,而分布式發(fā)布訂閱消息系統(tǒng)是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),它可以處理消費者規(guī)模的網(wǎng)站中的所有動作流數(shù)據(jù)。分布式發(fā)布訂閱消息系統(tǒng)具有如下特性:(1)通過磁盤數(shù)據(jù)結(jié)構(gòu)提供消息的持久化,這種結(jié)構(gòu)對于即使數(shù)以TB的消息存儲也能夠保持長時間的穩(wěn)定性能;(2)高吞吐量; (3)支持通過分布式發(fā)布訂閱消息系統(tǒng)服務(wù)器和消費機集群來分區(qū)消息;(4)支持分布式計算(Hadoop)并行數(shù)據(jù)加載,可以加快數(shù)據(jù)的加載傳輸;(5)產(chǎn)生和消費消息時自動負(fù)載均衡。在本步驟中,只要檢測到分布式發(fā)布訂閱消息系統(tǒng)中有數(shù)據(jù)就會讀取出來進行解析索引。
[0051]步驟102、根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置分布式全文檢索系統(tǒng)的配置文件。[〇〇52]分布式全文檢索系統(tǒng)(S0LRCL0UD)是基于全文搜索服務(wù)器(solr)和分布式服務(wù)框架(zookeeper)的分布式搜索方案,solr是一個獨立的企業(yè)級搜索應(yīng)用服務(wù)器,它對外提供接口,用戶可以通過發(fā)送請求,向搜索引擎服務(wù)器提交一定格式(例如XML格式)的文件生成索弓丨;也可以通過相關(guān)的獲取操作提出查找請求,并得到返回結(jié)果。分布式服務(wù)框架 (zookeeper)是Hadoop的開源子項目,在分布式系統(tǒng)架構(gòu)中大量的被運用,從而減少分布式架構(gòu)的復(fù)雜度。分布式全文檢索系統(tǒng)(S0LRCL0UD)是使用zookeeper作為集群的配置信息中心,通過分布式服務(wù)框架(zookeeper)進行全文搜索服務(wù)器(so 1 r)各節(jié)點之間的信息同步。 而分布式全文檢索系統(tǒng)(S0LRCL0UD)采用分布式的存儲方式,對索引進行分片,并對每個分片創(chuàng)建多個數(shù)據(jù)復(fù)制(Rep li cat 1n)。每個Replica t 1n都可以對外提供服務(wù),一個 Replicat1n故障不會影響索引服務(wù),更強大的是,它還能自動的在其它機器上幫你把失敗機器上的索引Replicat1n重建并投入使用。
[0053]分布式全文檢索系統(tǒng)有如下幾個特色:(1)集中式的配置信息;(2)自動容錯;(3)近實時搜索:(4)查詢時自動負(fù)載均衡。用戶只需要在配置文件中配置好要索引的過車信息字段(如:車牌號、車型、類別、車身顏色、車牌顏色、過車時間、卡口編號等),并將此配置文件和分布式全文檢索系統(tǒng)中其它配置文件一起上傳到zookeeper中,然后利用此配置文件創(chuàng)建好類聚框架(col lect1n ),在創(chuàng)建col lect1n時還可以設(shè)置副本數(shù)以存儲要索引的過車數(shù)據(jù),啟動分布式全文檢索系統(tǒng)集群,即可提供對車輛的索引和搜索功能。[〇〇54]優(yōu)選地,在本步驟中,消息消費者從上述的消息服務(wù)器中讀取已緩存的過車圖片的文本描述信息,并把這些過車信息按分布式全文檢索系統(tǒng)配置文件中配置好的字段解析索引到分布式全文檢索系統(tǒng)數(shù)據(jù)庫里。其中,所述配置文件是根據(jù)所述過車圖片的文本描述信息的主要字段預(yù)先設(shè)置的,例如,在配置文件中,設(shè)置名稱字段對應(yīng)過車信息字段的英文名:carPlateNo對應(yīng)車牌號、carColor對應(yīng)車身顏色。
[0055]步驟103、按所述分布式全文檢索系統(tǒng)配置文件將所述過車圖片的文本描述信息解析索引到分布式全文檢索系統(tǒng)數(shù)據(jù)庫中,在所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中建立倒排索引并進行分布式存儲。
[0056]優(yōu)選地,在本步驟中,采用分布式全文檢索系統(tǒng)集群索引并存儲過車圖片的文本描述信息,過車圖片的文本描述信息是以配置文件中配置的字段進行倒排索引,倒排索引與正排索引的區(qū)別是:正排索引是由文檔編號找詞,而倒排索引是由詞找文檔編號,倒排索引的形式如圖2所示。[〇〇57]步驟104、接收卡口車輛搜索請求,并解析出所要搜索的目標(biāo)卡口車輛屬性。[〇〇58]用戶通過分布式全文檢索系統(tǒng)提供的接口發(fā)送卡口車輛搜索請求,分布式全文檢索系統(tǒng)接收到該請求后提取其中的目標(biāo)卡口車輛屬性以生成查詢的關(guān)鍵詞。
[0059]步驟105、根據(jù)所述目標(biāo)卡口車輛屬性從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到目標(biāo)卡口車輛信息并進行反饋。
[0060]本實施例的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法,基于分布式全文檢索系統(tǒng)采用分布式存儲卡口的過車圖片的文本描述信息,可以通過設(shè)置多臺廉價的物理機進行數(shù)據(jù)存儲,降低了龐大的卡口過車圖片的文本描述信息數(shù)據(jù)的存儲成本。還通過建立倒排索引,方便通過用戶的卡口車輛搜索請求中的關(guān)鍵詞進行快速查找,以及基于分布式存儲采用并行式的查找方式,大大加快了卡口車輛搜索、查詢的效率,實現(xiàn)了實時查詢的目的。[0061 ] 實施例2
[0062]如圖3所示,為本發(fā)明實施例2的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法。在本實施例中,設(shè)置了基于分布式全文檢索系統(tǒng)建立過車圖片的文本描述信息倒排索引以及查找目標(biāo)卡口車輛信息的具體方法。本實施例中基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法包括以下步驟:
[0063]步驟201、獲取由卡口的過車圖片解析后生成的過車圖片的文本描述信息,所述過車圖片的文本描述信息至少包括:車牌號、車型、車身顏色、車牌顏色、卡口信息及過車時間,其中,所述過車圖片的文本描述信息通過分布式發(fā)布訂閱消息系統(tǒng)進行緩存。
[0064]步驟202、根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置分布式全文檢索系統(tǒng)配置文件。所述主要字段至少包括:車牌號、車型、車身顏色、車牌顏色。
[0065]步驟203、按所述分布式全文檢索系統(tǒng)配置文件將所述過車圖片的文本描述信息解析索引到分布式全文檢索系統(tǒng)數(shù)據(jù)庫中,根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置關(guān)鍵詞索引,并以所述過車圖片的文本描述信息的分布式全文檢索系統(tǒng)數(shù)據(jù)的文檔編號為索引內(nèi)容建立倒排索引并進行分布式存儲。所述分布式存儲由至少兩臺物理機進行存儲,并通過分布式服務(wù)框架管理各個存儲節(jié)點。
[0066]步驟204、接收卡口車輛搜索請求,并解析出所要搜索的目標(biāo)卡口車輛屬性。[〇〇67]步驟205、根據(jù)所述目標(biāo)卡口車輛屬性設(shè)置分布式全文檢索系統(tǒng)索引。
[0068]步驟206、基于該索引從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到相應(yīng)的目標(biāo)卡口車輛信息的文檔編號。[〇〇69]步驟207、再通過查找到的文檔編號獲取目標(biāo)卡口車輛信息并進行反饋。
[0070]當(dāng)根據(jù)用戶的關(guān)鍵詞對卡口車輛進行搜索時,會找到該詞出現(xiàn)過的所有文檔編號,然后再通過該文檔編號尋找文檔的具體內(nèi)容,不用遍歷所有文檔的具體內(nèi)容,以達(dá)到高效搜索的目的。
[0071]在本實施例中,該基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法可應(yīng)用在系統(tǒng)設(shè)備中,如圖4所示,為應(yīng)用本實施例基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法的系統(tǒng)設(shè)備結(jié)構(gòu)示意圖。在圖4中,卡口或電警等前端設(shè)備001采集過車圖片,傳送至消息服務(wù)器 002;所述消息服務(wù)器緩存卡口或電警等前端設(shè)備產(chǎn)生的過車圖片解析生成的過車圖片的文本描述信息;消費者003從所述消息服務(wù)器002讀取已緩存的過車信息,并把這些過車信息按分布式全文檢索系統(tǒng)配置文件中配置好的字段解析索引到分布式全文檢索系統(tǒng)搜索引擎004的分布式全文檢索系統(tǒng)數(shù)據(jù)庫里,所述分布式全文檢索系統(tǒng)搜索引擎004根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置關(guān)鍵詞索引,并以所述過車圖片的文本描述信息的分布式全文檢索系統(tǒng)數(shù)據(jù)的文檔編號為索引內(nèi)容建立倒排索引并進行分布式存儲到分布式全文檢索系統(tǒng)數(shù)據(jù)庫中;當(dāng)用戶通過終端005發(fā)送卡口車輛搜索請求時,終端的卡口車輛搜索應(yīng)用程序?qū)⒃摽谲囕v搜索請求傳輸至所述分布式全文檢索系統(tǒng)搜索引擎004,按照請求中設(shè)置的關(guān)鍵詞在分布式全文檢索系統(tǒng)搜索引擎004中進行卡口車輛搜索并反饋搜索結(jié)果。[〇〇72] 實施例3
[0073]如圖5所示,為本發(fā)明實施例3所述基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法的一個可選實施例。在本實施例,具體設(shè)置了基于分布式全文檢索系統(tǒng)存儲各個卡口的過車圖片的文本描述信息以及進行卡口車輛搜索的方法。本實施例的步驟如下:[〇〇74]步驟301、在消息服務(wù)器上安裝分布式發(fā)布訂閱消息系統(tǒng)并配置環(huán)境變量,緩存卡口或電警等前端設(shè)備產(chǎn)生的過車圖片解析生成的過車圖片的文本描述信息(VSD過車信息hVSD過車信息包含車牌號、車型、顏色、過車時間等信息。[〇〇75]步驟302、基于2n+l (n> = 1)臺服務(wù)器搭建分布式全文檢索系統(tǒng)集群,創(chuàng)建這些服務(wù)器兩兩之間無密碼登陸進行連接并在各個服務(wù)器上安裝好軟件開發(fā)工具包。[0〇76]步驟303、在所述分布式全文檢索系統(tǒng)集群下安裝分布式服務(wù)框架(zookeeper)。
[0077]步驟304、在所述分布式全文檢索系統(tǒng)配置文件中添加要索引的字段,并上傳到分布式服務(wù)框架中。
[0078]步驟305、使用分布式全文檢索系統(tǒng)命令指定分布式全文檢索系統(tǒng)配置文件創(chuàng)建類聚框架(collect1n),用于存放索引的過車信息。
[0079]步驟306、啟動分布式全文檢索系統(tǒng)集群。[〇〇8〇]步驟307、獲取由卡口的過車圖片解析后生成的過車圖片的文本描述信息。
[0081]步驟308、按所述分布式全文檢索系統(tǒng)配置文件將所述過車圖片的文本描述信息解析索引到分布式全文檢索系統(tǒng)數(shù)據(jù)庫中,在所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中建立倒排索引并進行分布式存儲。[〇〇82]步驟309、接收卡口車輛搜索請求,并解析出所要搜索的目標(biāo)卡口車輛屬性。[〇〇83]步驟310、根據(jù)所述目標(biāo)卡口車輛屬性從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到目標(biāo)卡口車輛信息并進行反饋。
[0084]實施例4
[0085]如圖6所示,為本實施例中公開的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的系統(tǒng)的一個可選實施例的結(jié)構(gòu)示意圖。本實施例中所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的系統(tǒng)包括:獲取模塊401、配置模塊402、存儲模塊403、接收模塊404及處理模塊 405,其中,[〇〇86]所述獲取模塊401,與所述配置模塊402相藕接,用于獲取由卡口的過車圖片解析后生成的過車圖片的文本描述信息,所述過車圖片的文本描述信息至少包括:車牌號、車型、車身顏色、車牌顏色、卡口信息及過車時間,其中,所述過車圖片的文本描述信息通過分布式發(fā)布訂閱消息系統(tǒng)進行緩存。[〇〇87]所述配置模塊402,與所述獲取模塊401及存儲模塊403相藕接,用于根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置分布式全文檢索系統(tǒng)配置文件。其中,所述主要字段至少包括:車牌號、車型、車身顏色、車牌顏色。[〇〇88]所述存儲模塊403,與所述配置模塊402、接收模塊404及處理模塊相藕接,用于按所述分布式全文檢索系統(tǒng)配置文件將所述過車圖片的文本描述信息解析索引到分布式全文檢索系統(tǒng)數(shù)據(jù)庫中,在所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中建立倒排索引并進行分布式存儲。[〇〇89]所述接收模塊404,與所述存儲模塊403相藕接,用于接收卡口車輛搜索請求,并解析出所要搜索的目標(biāo)卡口車輛屬性。
[0090]所述處理模塊405,與所述存儲模塊403相藕接,用于根據(jù)所述目標(biāo)卡口車輛屬性從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到目標(biāo)卡口車輛信息并進行反饋。
[0091]上述的存儲模塊403,進一步用于根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置關(guān)鍵詞索引,并以所述過車圖片的文本描述信息的分布式全文檢索系統(tǒng)數(shù)據(jù)的文檔編號為索引內(nèi)容建立倒排索引。[〇〇92]所述處理模塊405,進一步用于根據(jù)所述目標(biāo)卡口車輛屬性設(shè)置索引;
[0093]基于該索引從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到相應(yīng)的目標(biāo)卡口車輛信息的文檔編號;
[0094]再通過查找到的文檔編號獲取目標(biāo)卡口車輛信息并進行反饋。
[0095]在本實施例的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的系統(tǒng)中,所述分布式存儲由至少兩臺物理機進行存儲,并通過分布式服務(wù)框架(zookeeper)管理各個存儲節(jié)點。
[0096]在本發(fā)明中,過車數(shù)據(jù)的存儲與查詢均基于分布式全文檢索系統(tǒng)建立在分布式系統(tǒng)架構(gòu)上,利用大數(shù)據(jù)平臺技術(shù)將過車數(shù)據(jù)保存到分布式存儲系統(tǒng)中,按照倒排索引建立索引機制,且在存儲的過程中已經(jīng)按照需求進行了基礎(chǔ)統(tǒng)計工作,用戶終端通過請求可快速地從數(shù)據(jù)庫中查詢并獲取到所需的過車數(shù)據(jù)。且在本實施例中,數(shù)據(jù)庫采用分布式存儲的方式,用戶終端可以在分布式存儲服務(wù)器上并行地進行查詢,提高了查詢的效率。
[0097]通過以上各個實施例可知,本發(fā)明的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法及系統(tǒng)存在的有益效果是:
[0098](1)本發(fā)明所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法及系統(tǒng),基于分布式全文檢索系統(tǒng)采用分布式存儲卡口的過車圖片的文本描述信息,可以通過設(shè)置多臺廉價的物理機進行數(shù)據(jù)存儲,再利用一臺物理機統(tǒng)一管理,數(shù)據(jù)存儲量增加時還可以增加物理機,降低了龐大的卡口過車圖片的文本描述信息數(shù)據(jù)的存儲成本。
[0099](2)本發(fā)明所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法及系統(tǒng),基于分布式全文檢索系統(tǒng)建立倒排索引,方便通過用戶的卡口車輛搜索請求中的關(guān)鍵詞進行快速查找,同時,還可以基于分布式存儲采用并行式的查找,大大加快了卡口車輛搜索、查詢的效率。
[0100]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、裝置、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。
[0101]上述說明示出并描述了本發(fā)明的若干可選實施例,但如前所述,應(yīng)當(dāng)理解本發(fā)明并非局限于本文所披露的形式,不應(yīng)看作是對其他實施例的排除,而可用于各種其他組合、 修改和環(huán)境,并能夠在本文所述發(fā)明構(gòu)想范圍內(nèi),通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識進行改動。而本領(lǐng)域人員所進行的改動和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護范圍內(nèi)。
【主權(quán)項】
1.一種基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法,其特征在于,包括:獲取由卡口的過車圖片解析后生成的過車圖片的文本描述信息,所述過車圖片的文本 描述信息至少包括:車牌號、車型、車身顏色、車牌顏色、卡口信息及過車時間,其中,所述過 車圖片的文本描述信息通過分布式發(fā)布訂閱消息系統(tǒng)進行緩存;根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置分布式全文檢索系統(tǒng)配置文件;按所述分布式全文檢索系統(tǒng)配置文件將所述過車圖片的文本描述信息解析索引到分 布式全文檢索系統(tǒng)數(shù)據(jù)庫中,在所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中建立倒排索引并進行分 布式存儲;接收卡口車輛搜索請求,并解析出所要搜索的目標(biāo)卡口車輛屬性;根據(jù)所述目標(biāo)卡口車輛屬性從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到目標(biāo)卡口車 輛信息并進行反饋。2.根據(jù)權(quán)利要求1所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法,其特征在 于,所述主要字段至少包括:車牌號、車型、車身顏色、車牌顏色。3.根據(jù)權(quán)利要求1所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法,其特征在 于,所述在所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中建立倒排索引,包括:根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置關(guān)鍵詞索引,并以所述過車圖片的 文本描述信息的分布式全文檢索系統(tǒng)數(shù)據(jù)的文檔編號為索引內(nèi)容建立倒排索引。4.根據(jù)權(quán)利要求3所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方法,其特征在 于,所述根據(jù)所述目標(biāo)卡口車輛屬性從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到目標(biāo)卡口 車輛信息并進行反饋,包括:根據(jù)所述目標(biāo)卡口車輛屬性設(shè)置索引;基于該索引從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到相應(yīng)的目標(biāo)卡口車輛信息的 文檔編號;再通過查找到的文檔編號獲取目標(biāo)卡口車輛信息并進行反饋。5.根據(jù)權(quán)利要求1-4中任一項所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的方 法,其特征在于,所述分布式存儲由至少兩臺物理機進行存儲,并通過分布式服務(wù)框架管理 各個存儲節(jié)點。6.—種基于分布式全文檢索系統(tǒng)的卡口車輛搜索的系統(tǒng),其特征在于,所述系統(tǒng)包括: 獲取模塊、配置模塊、存儲模塊、接收模塊及處理模塊,其中,所述獲取模塊,用于獲取由卡口的過車圖片解析后生成的過車圖片的文本描述信息, 所述過車圖片的文本描述信息至少包括:車牌號、車型、車身顏色、車牌顏色、卡口信息及過 車時間,其中,所述過車圖片的文本描述信息通過分布式發(fā)布訂閱消息系統(tǒng)進行緩存;所述配置模塊,用于根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置分布式全文檢 索系統(tǒng)配置文件;所述存儲模塊,用于按所述分布式全文檢索系統(tǒng)配置文件將所述過車圖片的文本描述 信息解析索引到分布式全文檢索系統(tǒng)數(shù)據(jù)庫中,在所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中建立 倒排索引并進行分布式存儲;所述接收模塊,用于接收卡口車輛搜索請求,并解析出所要搜索的目標(biāo)卡口車輛屬性;所述處理模塊,用于根據(jù)所述目標(biāo)卡口車輛屬性從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到目標(biāo)卡口車輛信息并進行反饋。7.根據(jù)權(quán)利要求6所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的系統(tǒng),其特征在 于,所述主要字段至少包括:車牌號、車型、車身顏色、車牌顏色。8.根據(jù)權(quán)利要求6所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的系統(tǒng),其特征在 于,所述存儲模塊,用于根據(jù)所述過車圖片的文本描述信息的主要字段設(shè)置關(guān)鍵詞索引,并 以所述過車圖片的文本描述信息的分布式全文檢索系統(tǒng)數(shù)據(jù)的文檔編號為索引內(nèi)容建立 倒排索引。9.根據(jù)權(quán)利要求8所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的系統(tǒng),其特征在 于,所述處理模塊,用于:根據(jù)所述目標(biāo)卡口車輛屬性設(shè)置索引;基于該索引從所述分布式全文檢索系統(tǒng)數(shù)據(jù)庫中查找到相應(yīng)的目標(biāo)卡口車輛信息的 文檔編號;再通過查找到的文檔編號獲取目標(biāo)卡口車輛信息并進行反饋。10.根據(jù)權(quán)利要求6-9中任一項所述的基于分布式全文檢索系統(tǒng)的卡口車輛搜索的系 統(tǒng),其特征在于,所述分布式存儲由至少兩臺物理機進行存儲,并通過分布式服務(wù)框架管理 各個存儲節(jié)點。
【文檔編號】G06F17/30GK106021276SQ201610274064
【公開日】2016年10月12日
【申請日】2016年4月28日
【發(fā)明人】李慶功, 辛國茂, 馬述杰
【申請人】泰華智慧產(chǎn)業(yè)集團股份有限公司