亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于Lucene的光譜曲線檢索方法及引擎的制作方法_3

文檔序號(hào):9217296閱讀:來(lái)源:國(guó)知局
用Lucene對(duì) 光譜庫(kù)中的曲線文件建立索引,在輸入由高光譜像元提取出的光譜曲線之后,從索引文件 中按所選特征的相似度返回檢索結(jié)果,實(shí)現(xiàn)加快讀取文件速度的目的,不但提高了檢索效 率,而且操作簡(jiǎn)單便捷,同時(shí)索引的檢索形式適用于嵌入式及云端處理的開(kāi)發(fā)。
[0073] 其次參照附圖描述根據(jù)本發(fā)明實(shí)施例提出的基于Lucene的光譜曲線檢索引擎。 參照?qǐng)D6所示,該引擎10包括:開(kāi)啟模塊100、建立模塊200、寫入模塊300、輸入模塊400和 檢索模塊500。
[0074] 其中,開(kāi)啟模塊100用于通過(guò)Lucene的FSDirectory類打開(kāi)索引文件夾。建立 模塊200用于選擇索引特征,以利用Lucene對(duì)光譜庫(kù)中的曲線文件建立索引。寫入模塊 300用于調(diào)用Lucene的IndexWriter類將建好的索引寫入到索引文件夾中。輸入模塊400 用于輸入待檢索文件。檢索模塊500用于打開(kāi)索引文件夾,并采用線性搜索將文件夾中的 Document索引文件依次與輸入的特征數(shù)組進(jìn)行相似度比較,以從索引文件中按所選特征的 相似度返回檢索結(jié)果。
[0075] 簡(jiǎn)單而言,本發(fā)明實(shí)施例包括建立索引階段和檢索階段。建立索引階段主要包括: 選擇索引文件夾打開(kāi),索引特征的選取與索引的添加。其中,本發(fā)明實(shí)施例將全文檢索工具 Lucene引入到光譜曲線的檢索中,極大地加快讀取文件速度,利用Lucene讀寫文件時(shí),可 以更有效和快速的訪問(wèn)磁盤,并且基于java編寫,提供跨平臺(tái)的解決方案。檢索階段主要 包括:輸入待檢索文件、提取索引文件與相似度評(píng)分。其中,本發(fā)明實(shí)施例采用索引后再搜 索的形式,一方面可以加快實(shí)際工作中頻繁搜索的速度,另一方面,可以將建好的索引存儲(chǔ) 在嵌入式系統(tǒng)中或云端,檢索時(shí),只需傳入待檢索文件即可在系統(tǒng)中處理并返回檢索結(jié)果, 為后續(xù)的更進(jìn)一步的工作提供方便,并且通過(guò)整合光譜搜索七個(gè)工業(yè)標(biāo)準(zhǔn):相關(guān)性、一階微 分相關(guān)性、絕對(duì)值、歐氏距離、一階微分絕對(duì)值、最小平方、一階微分最小平方等特征,實(shí)現(xiàn) 可以分別索引并檢索,也可以全部索引并分別檢索的目的。
[0076] 在本發(fā)明的實(shí)施例中,首先通過(guò)Lucene的FSDirectory類打開(kāi)索引的文件 夾,Lucene可以判斷了當(dāng)前所使用的操作系統(tǒng)環(huán)境和JRE的不同,然后選用不同的 FSDirectory的實(shí)現(xiàn)來(lái)提升底層文件的操作性能。
[0077] 進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,索引特征包括相關(guān)性、一階微分相關(guān)性、絕 對(duì)值、歐氏距離、一階微分絕對(duì)值、最小平方、一階微分最小平方中的一個(gè)或多個(gè)。
[0078] 進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,索引為特征點(diǎn)索引或全特征索引。
[0079] 具體地,選擇索引特征建索引,特征包括:相關(guān)性、一階微分相關(guān)性、絕對(duì)值、歐氏 距離、一階微分絕對(duì)值、最小平方、一階微分最小平方,同時(shí)還提供特征點(diǎn)索引和全特征索 弓丨。其中,之前的單特征都是通過(guò)計(jì)算得出相應(yīng)的特征數(shù)組并轉(zhuǎn)為字節(jié)數(shù)組再以各自的特 征名存入Lucene的Field類,在添加至Lucene的Document類,S卩一個(gè)按單特征建立的 Document索引文件只包含存儲(chǔ)相應(yīng)特征的一個(gè)Field,而全特征索引是將之前的按單特征 提取出的字節(jié)數(shù)組分別存入相應(yīng)的Field類,再添加至Document類中,即全特征索引建立 的Document索引文件對(duì)所有特征都建立相應(yīng)的Field來(lái)存儲(chǔ)。
[0080] 在本發(fā)明的實(shí)施例中,對(duì)建好的索引調(diào)用Lucene的IndexWriter類將其寫入到索 引文件夾中,以便后續(xù)的檢索需要。
[0081] 進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,待檢索文件為由高光譜像元提取出的光譜 曲線或已提取的特征數(shù)組文件,其中,如果為光譜曲線文件,則通過(guò)所選特征相應(yīng)計(jì)算出字 節(jié)數(shù)組;如果為已提取的特征數(shù)組文件,則上傳特征名以尋找相應(yīng)特征建立的索引文件。
[0082] 具體地,選擇待檢索文件包括光譜曲線或已提取的特征數(shù)組文件,如果是光譜曲 線文件,則通過(guò)所選的特征相應(yīng)計(jì)算出字節(jié)數(shù)組,如果是已提取的特征數(shù)組文件則不需要 計(jì)算,但是需要將特征名傳入到系統(tǒng)中尋找相應(yīng)特征建立的索引文件。
[0083] 進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,相似度評(píng)分公式為:
[0087] 其中,a,b為兩組長(zhǎng)度為1的特征數(shù)組。
[0088] 具體地,在本發(fā)明的一個(gè)實(shí)施例中,首先提取索引文件主要通過(guò)打開(kāi)之前的索引 文件夾,并采用線性搜索即將文件夾中的Document索引文件依此與輸入的特征數(shù)組進(jìn)行 相似度比較,其次)相似度評(píng)分對(duì)越相似的曲線給予更低的評(píng)分,反之亦然,即1〇〇分為最 不相似的曲線,0分為最相似的曲線。同時(shí)考慮縮小相似的曲線間的評(píng)分差。例如,對(duì)于兩 組長(zhǎng)度為1的特征數(shù)組a,b,其相似度評(píng)分為:
[0092] 其中,a,b為待比較的兩組向量,6是對(duì)a做歸一化,即假設(shè)a= [1,2],a1= 1,a^ =2,% = ,巧同理。
[0093] 最后,按評(píng)分由低到高返回檢索出的相似曲線文件。
[0094] 需要注意的是,搜索時(shí)選擇建索引時(shí)相應(yīng)的特征,而對(duì)于全特征索引,搜索時(shí)可以 選擇任意的特征。搜索完成時(shí)按相似度返回相應(yīng)的文件信息。
[0095] 在本發(fā)明的一個(gè)具體實(shí)施例中,參照?qǐng)D2所示,圖2為索引與檢索的流程圖,下面 對(duì)本發(fā)明實(shí)施例進(jìn)行進(jìn)一步具體贅述。
[0096] 其中,參照?qǐng)D3所示,本發(fā)明實(shí)施例在索引階段主要有三項(xiàng)操作:在Select directorytoindex對(duì)話框中選擇要索引的文件夾(這里選擇的是一個(gè)測(cè)試文件 夾data3,包括 1.txt光譜數(shù)據(jù)為:100, 120, 130, 135 ;2.txt:95, 110, 120, 125 ;3.txt: 400, 450, 480, 530;數(shù)據(jù)非真實(shí)光譜數(shù)據(jù),僅為測(cè)試引擎的實(shí)際運(yùn)行效果),然后在 Selectfeaturetoindex下拉界面中選擇要建特征的索弓丨:〃FeaturePoint〃特征 點(diǎn),"SpecAbsolute〃絕對(duì)值,〃SpecGraAbsolute〃 一階微分絕對(duì)值,〃SpecGradient〃 一階 微分,"SpecValue〃相關(guān)性,"LeastSquares〃最小平方,"F0DLS" -階微分最小平方,〃Full〃 是對(duì)所有特征建索引,這里選擇的是對(duì)所有特征建索引。然后點(diǎn)擊Index即可完成索引。
[0097] 進(jìn)一步地,在檢索階段也主要有三項(xiàng)操作:在Selectfiletosearch對(duì)話框中 選擇要檢索的文件(這里選擇的是與1.txt數(shù)據(jù)相同的4.txt),同樣Selectfeatureto search下拉界面中選擇索引依據(jù)的特征。因?yàn)槭且匀卣魉饕?,所以這里可以隨意選擇特 征檢索。先選擇特征絕對(duì)值進(jìn)行檢索,結(jié)果如圖4所示,可以看出相同數(shù)據(jù)的1.txt評(píng)分為 0,也就是最相似的,2.txt與檢索文件在數(shù)據(jù)上也相對(duì)接近,故評(píng)分也很低,而3.txt就比 較高了。整個(gè)檢索過(guò)程僅需613ms。換另一種特征一階微分最小平方檢索,結(jié)果如圖5所 示,可以看出由于1.txt和2.txt在數(shù)據(jù)之間的相關(guān)性與4.txt相似,即光譜曲線形狀比較 接近,故都是最為相似的。
[0098] 進(jìn)一步地,在本發(fā)明的另一個(gè)實(shí)施例中,云端的運(yùn)用主要是將建好的索引存入云 端,需要檢索的時(shí)候只需打開(kāi)云端的索引文件夾,其他步驟與之前相同,為了減少冗余,在 此不作具體贅述。
[0099] 根據(jù)本發(fā)明實(shí)施例提出的基于Lucene的光譜曲線檢索引擎,通過(guò)利用Lucene對(duì) 光譜庫(kù)中的曲線文件建立索引,在輸入由高光譜像元提取出的光譜曲線之后,從索引文件 中按所選特征的相似度返回檢索結(jié)果,實(shí)現(xiàn)加快讀取文件速度的目的,不但提高了檢索效 率,而且操作簡(jiǎn)單便捷,同時(shí)索引的檢索形式適用于嵌入式及云
當(dāng)前第3頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1