一種分布式搜索方法與流程

文檔序號：12041431閱讀：180來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及搜索領(lǐng)域，尤其涉及一種分布式搜索方法。

背景技術(shù)：
目前，基于數(shù)據(jù)庫的全文檢索，是在數(shù)據(jù)庫上增加了一個全文檢索的模塊，該模塊功能和數(shù)據(jù)庫集成在一起，占用數(shù)據(jù)庫服務(wù)器的資源。在查詢壓力比較大的情形下，經(jīng)常導(dǎo)致數(shù)據(jù)庫服務(wù)器負(fù)載過高，不能向應(yīng)用提供正常服務(wù)。

技術(shù)實現(xiàn)要素：
為了解決上述技術(shù)問題，本發(fā)明的目的在于提供一種基于文件系統(tǒng)的全文檢索，把全文檢索的功能獨立出來，成為一個單獨的服務(wù)，這樣可以和數(shù)據(jù)庫分開部署，從而減輕數(shù)據(jù)庫的壓力，同時增強(qiáng)檢索服務(wù)的性能的分布式搜索的架構(gòu)。本發(fā)明的完整技術(shù)方案是，一種分布式搜索方法，包括一個搜索引擎集群，所述搜索引擎集群位于數(shù)據(jù)庫之前、應(yīng)用之后，所述搜索引擎集群包括Zookeeper、Katta、HDFS、Solr；Solr用于創(chuàng)建索引：通過連接到數(shù)據(jù)庫，獲取數(shù)據(jù)行，創(chuàng)建索引分片；HDFS用于存儲索引：通過其中的Hadoop控制臺，存儲分片到HDFS上；Katta用于部署、更新以及查詢索引：通過Katta控制臺，發(fā)布索引分片，Katta自動部署分片到索引節(jié)點；未滿的分片需要繼續(xù)填充索引文檔，然后更新到已發(fā)布的節(jié)點上；應(yīng)用發(fā)出的查詢，由Katta客戶端處理：首先向索引節(jié)點發(fā)出獲取索引ID的請求，進(jìn)行排序等處理，然后根據(jù)ID發(fā)出獲取具體的文檔；Zookeeper作為分布式協(xié)調(diào)器的一部分。所述索引分片的大小小于等于10G或小于等于1500萬行。由上可見，本發(fā)明與現(xiàn)在技術(shù)相比有如下有益效果：本發(fā)明提供一種基于文件系統(tǒng)的全文檢索，把全文檢索的功能獨立出來，成為一個單獨的服務(wù)，這樣可以和數(shù)據(jù)庫分開部署，從而減輕數(shù)據(jù)庫的壓力，同時增強(qiáng)檢索服務(wù)的性能，數(shù)據(jù)庫壓力降低，整體性能得到提升，同時可擴(kuò)展性強(qiáng)。附圖說明此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解，構(gòu)成本申請的一部分，并不構(gòu)成對本發(fā)明的不當(dāng)限定，在附圖中：圖1為本發(fā)明邏輯原理圖；圖2為本發(fā)明的創(chuàng)建索引的示意圖；圖3為本發(fā)明的查詢處理的示意圖；圖4為本發(fā)明的實施例1原理示意圖。具體實施方式下面將結(jié)合附圖以及具體實施例來詳細(xì)說明本發(fā)明，在此本發(fā)明的示意性實施例以及說明用來解釋本發(fā)明，但并不作為對本發(fā)明的限定。實施例1：本實施例一種分布式搜索方法，如圖所示，在數(shù)據(jù)庫之前，應(yīng)用之后，增加三臺服務(wù)器，作為搜索引擎集群。包括一個搜索引擎集群，所述搜索引擎集群采用Zookeeper、Katta、HDFS、Solr為基礎(chǔ)架構(gòu)；Solr用于創(chuàng)建索引：通過連接到數(shù)據(jù)庫，獲取數(shù)據(jù)行，創(chuàng)建索引分片；HDFS用于存儲索引：通過其中的Hadoop控制臺，存儲分片到HDFS上；Katta用于部署、更新以及查詢索引：通過Katta控制臺，發(fā)布索引分片，Katta自動部署分片到索引節(jié)點；未滿的分片需要繼續(xù)填充索引文檔，然后更新到已發(fā)布的節(jié)點上；應(yīng)用發(fā)出的查詢，由Katta客戶端處理：首先向索引節(jié)點發(fā)出獲取索引ID的請求，進(jìn)行排序等處理，然后根據(jù)ID發(fā)出獲取具體的文檔；Zookeeper作為分布式協(xié)調(diào)器的一部分。每臺服務(wù)器至少充當(dāng)三種角色：1.HDFS服務(wù)器，作為分布式存儲系統(tǒng)的一部分2.ZkServer服務(wù)器，作為分布式協(xié)調(diào)器的一部分3.Katta查詢處理服務(wù)器，作為分布式搜索服務(wù)的一部分其中MasterNode服務(wù)器作為主控服務(wù)器，處理創(chuàng)建索引的工作，同時作為查詢服務(wù)器，接收所有的查詢請求，并且轉(zhuǎn)發(fā)給后續(xù)的SlaveNode服務(wù)器；SlaveNode服務(wù)器主要作為查詢處理服務(wù)器，真正處理查詢請求，返回查詢結(jié)果。由上可見，本發(fā)明提供一種基于文件系統(tǒng)的全文檢索，把全文檢索的功能獨立出來，成為一個單獨的服務(wù)，這樣可以和數(shù)據(jù)庫分開部署，從而減輕數(shù)據(jù)庫的壓力，同時增強(qiáng)檢索服務(wù)的性能，數(shù)據(jù)庫壓力降低，整體性能得到提升，同時可擴(kuò)展性強(qiáng)。以上對本發(fā)明實施例所提供的技術(shù)方案進(jìn)行了詳細(xì)介紹，本文中應(yīng)用了具體個例對本發(fā)明實施例的原理以及實施方式進(jìn)行了闡述，以上實施例的說明只適用于幫助理解本發(fā)明實施例的原理；同時，對于本領(lǐng)域的一般技術(shù)人員，依據(jù)本發(fā)明實施例，在具體實施方式以及應(yīng)用范圍上均會有改變之處，綜上所述，本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：嚴(yán)緯
技術(shù)所有人：上海特易信息科技有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

分布式搜索引擎相關(guān)技術(shù)

分布式搜索相關(guān)技術(shù)

分布式搜索引擎架構(gòu)相關(guān)技術(shù)

分布式方法相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種分布式搜索方法與流程