農(nóng)用土地流轉(zhuǎn)信息檢索方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種農(nóng)業(yè)用土地流轉(zhuǎn)信息的檢索方法,本發(fā)明還涉及一種農(nóng)業(yè)用土地 信息檢索系統(tǒng)。
【背景技術(shù)】
[0002] 目前主流的搜索引擎檢索算法是基于關(guān)鍵詞匹配的檢索算法,常用的排序算法包 括詞頻位置加權(quán)排序算法、Direct Hit算法、PageRank算法等。
[0003] 基于關(guān)鍵詞匹配的檢索算法中,可以將所有只要包含查詢語句中涉及詞語中的一 個(gè)或多個(gè)的信息全部檢索出來,這種詞形匹配方式容易造成檢索結(jié)果冗余。而且在進(jìn)行土 地流轉(zhuǎn)信息檢索時(shí),沒有考慮該類信息的地理位置相關(guān)性的重要特點(diǎn),往往得不到理想的 結(jié)果。
[0004]目前,盡管圖像、視頻等內(nèi)容的檢索技術(shù)也有了很好的發(fā)展,但是網(wǎng)絡(luò)上絕大多數(shù) 的信息為文本信息,因此文本信息檢索在信息檢索領(lǐng)域仍然占據(jù)著主要地位。文本信息檢 索是傳統(tǒng)(文獻(xiàn))檢索方式的延續(xù),是指從大量的文本資源集合中自動地找到與用戶查詢 條件相關(guān)的各種信息。傳統(tǒng)的文本信息檢索采用的技術(shù)模型主要有布爾模型、向量空間模 型和概率模型,使用較多的是向量空間模型。
[0005] 傳統(tǒng)的基于關(guān)鍵詞檢索的文本信息檢索方法存在許多問題:
[0006] (1)基于關(guān)鍵詞檢索方法中較常使用的檢索模型是是向量空間模型,此模型可以 將任意文檔表示成詞條向量。當(dāng)文本數(shù)量較多時(shí),該詞項(xiàng)-文檔矩陣將成為高階稀疏矩陣, 空間維數(shù)較高,內(nèi)存占用空間較大,信息處理速度較慢。
[0007] (2)基于關(guān)鍵詞檢索方法僅僅考慮字形匹配,沒有考慮文本信息中詞語之間的語 義關(guān)系,不能處理同義詞、近義詞的問題,準(zhǔn)確率并不理想。
[0008] (3)農(nóng)用土地流轉(zhuǎn)信息中包括很多地理信息,當(dāng)用戶檢索一塊區(qū)域的流轉(zhuǎn)信息時(shí), 基于關(guān)鍵字匹配的檢索方法沒有辦法考慮地理位置的空間信息,將包含在該區(qū)域內(nèi)的地塊 信息全部檢索出來。
[0009]此外,在針對檢索結(jié)果進(jìn)行排序的算法中,詞頻位置加權(quán)排序算法是基于網(wǎng)頁信 息內(nèi)容分析的排序算法,其中詞語與網(wǎng)頁內(nèi)容的相似度則由它出現(xiàn)的頻次和位置決定。 Direct Hit是一種注重信息質(zhì)量和用戶行為反饋的排序算法,網(wǎng)頁被點(diǎn)擊的次數(shù)和瀏覽的 時(shí)間長度都影響網(wǎng)頁與用戶查詢語句的相似度。PageRank算法是一種鏈接分析算法。在該 算法中,網(wǎng)頁的重要性由兩部分決定:(1)該頁面被多少頁面引用(2)該頁面被什么頁面 引用。針對土地流轉(zhuǎn)信息的特點(diǎn),應(yīng)該充分考慮空間關(guān)系對地理要素的語義相似度的影響, 并將這一部分作為影響文檔與查詢語句相似度的一個(gè)重要因素。
【發(fā)明內(nèi)容】
[0010] 針對現(xiàn)有技術(shù)中的不足,本發(fā)明旨在提供一種基于地名匹配的農(nóng)用土地流轉(zhuǎn)信息 檢索方法,以解決傳統(tǒng)算法對于土地流轉(zhuǎn)供求信息檢索效果不佳的問題。
[0011] 進(jìn)一步地,在此基礎(chǔ)上,本發(fā)明還提供了一種基于地理要素的土地流轉(zhuǎn)信息排序 方法,以解決傳統(tǒng)算法對于檢索出的土地流轉(zhuǎn)供求信息排序效果不佳的問題。
[0012] 為了解決上述問題,該種農(nóng)用土地流轉(zhuǎn)信息檢索方法,其包括如下步驟:
[0013] 服務(wù)器接收用戶輸入的檢索條件;
[0014] 服務(wù)器對檢索條件和待檢索的農(nóng)用土地流轉(zhuǎn)信息進(jìn)行分詞處理,得到分詞化檢索 條件和分詞化農(nóng)用土地流轉(zhuǎn)信息;
[0015] 服務(wù)器查找分詞化檢索條件中的包含的地名信息,并根據(jù)地名匹配算法找到各地 名信息所包含的下級地名信息;
[0016] 服務(wù)器根據(jù)該地名信息以及下級地名信息對所述分詞化農(nóng)用土地流轉(zhuǎn)信息進(jìn)行 篩選,得到篩選后的分詞化農(nóng)用土地流轉(zhuǎn)信息;
[0017] 服務(wù)器根據(jù)分詞化檢索條件和篩選后的分詞化農(nóng)用土地流轉(zhuǎn)信息創(chuàng)建向量空間 模型,得到詞匯-文檔矩陣;
[0018] 服務(wù)器計(jì)算該詞匯-文檔矩陣中的分詞化檢索條件與篩選后的分詞化農(nóng)用土地 流轉(zhuǎn)信息之間的相似度Siml ;
[0019] 服務(wù)器將相似度Siml滿足一定闕值的農(nóng)用土地流轉(zhuǎn)信息發(fā)送給用戶。
[0020] 優(yōu)選地,還包括步驟:
[0021] 所述服務(wù)器得到詞匯_文檔矩陣后,對該詞匯-文檔矩陣進(jìn)行潛語義分析操作,得 到去噪后的詞匯-文檔矩陣,服務(wù)器根據(jù)該去噪后的詞匯-文檔矩陣計(jì)算分詞化檢索條件 與篩選后的分詞化農(nóng)用土地流轉(zhuǎn)信息之間的相似度siml。
[0022] 更優(yōu)選地,所述對詞匯-文檔矩陣進(jìn)行潛語義分析操作包括如下步驟:
[0023] 奇異值分解操作:該操作根據(jù)公式:\= T 實(shí)現(xiàn),其中:X ^表示mXn階矩陣, T。為mXm階酉矩陣;S。為半正定mXn階對角矩陣;D。為nXn階酉矩陣,D QT為D。的共軛轉(zhuǎn) 置;
[0024] 選擇\中的前k個(gè)元素,取S ^中k階對角矩陣形成矩陣S、取T ^中的k列形成矩 陣T、取中相應(yīng)的k行形成矩陣DT,從而形成優(yōu)化后的矩陣TSD1,其中:若m>n,l〈k〈n,若 m〈n,l〈k〈m ;
[0025] 對優(yōu)化后的矩陣進(jìn)行奇異值逆分解操作:該操作根據(jù)公式:
【主權(quán)項(xiàng)】
1. 一種農(nóng)用土地流轉(zhuǎn)信息檢索方法,其特征在于包括如下步驟: 服務(wù)器接收用戶輸入的檢索條件; 服務(wù)器對檢索條件和待檢索的農(nóng)用土地流轉(zhuǎn)信息進(jìn)行分詞處理,得到分詞化檢索條件 和分詞化農(nóng)用土地流轉(zhuǎn)信息; 服務(wù)器查找分詞化檢索條件中的包含的地名信息,并根據(jù)地名匹配算法找到各地名信 息所包含的下級地名信息; 服務(wù)器根據(jù)該地名信息以及下級地名信息對所述分詞化農(nóng)用土地流轉(zhuǎn)信息進(jìn)行篩選, 得到篩選后的分詞化農(nóng)用土地流轉(zhuǎn)信息; 服務(wù)器根據(jù)分詞化檢索條件和篩選后的分詞化農(nóng)用土地流轉(zhuǎn)信息創(chuàng)建向量空間模型, 得到詞匯-文檔矩陣; 服務(wù)器計(jì)算該詞匯-文檔矩陣中的分詞化檢索條件與篩選后的分詞化農(nóng)用土地流轉(zhuǎn) 信息之間的相似度Siml