亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

關鍵詞變換裝置、關鍵詞變換程序、記錄介質(zhì)以及關鍵詞變換方法

文檔序號:7551410閱讀:181來源:國知局

專利名稱::關鍵詞變換裝置、關鍵詞變換程序、記錄介質(zhì)以及關鍵詞變換方法
技術領域
:本發(fā)明涉及變換檢索中使用的關鍵詞(keyword)的關鍵詞變換裝置。
背景技術
:近年來,被稱為云計算(cloudcomputing)的計算機的利用方式正在普及。在云計算中,利用者可以經(jīng)由網(wǎng)絡將數(shù)據(jù)的保管、管理等計算機處理作為服務利用。在這樣的方式中,作為數(shù)據(jù)的所有者的服務利用者和作為數(shù)據(jù)的管理者的服務提供者是不同的。因此,為了防止服務利用者的機密信息被泄漏給數(shù)據(jù)管理者,一般是將利用者的保存數(shù)據(jù)加密。進一步地,如果可以實現(xiàn)能夠在加密了數(shù)據(jù)的狀態(tài)下檢索期望的數(shù)據(jù)的隱匿檢索服務,則利用者的方便性大幅提聞。為了實現(xiàn)這樣的隱匿檢索,設計有提高用于關鍵詞檢索的索引的隱匿性的方法(參照專利文獻I)。另外,為了提供加密了的字符串的部分一致檢索,設計有通過進行以字符為單位的加密而能夠進行以字符為單位的對照的方法(參照專利文獻2)。專利文獻I:日本特開2007-52698號公報專利文獻2:日本特開2002-108910號公報
發(fā)明內(nèi)容在專利文獻I中,只能進行根據(jù)關鍵詞的完全一致的檢索,不能進行大小關系的比較、部分一致等。因此,如果想進行日期、數(shù)值等的范圍檢索,則需要列舉檢索范圍中包含的全部要素來進行完全一致檢索,在檢索性能(檢索速度)的方面存在問題。在專利文獻2中,在以字符為單位的加密后也保存有和加密前相同的字符順序。因此,抵抗針對保存的加密數(shù)據(jù)的基于多個字符的相關的頻度解析那樣的攻擊的能力很弱,在隱匿性的方面存在問題。本發(fā)明通過日期、數(shù)值的關鍵詞的層次化,削減檢索范圍中包含的要素數(shù)來削減對照次數(shù),并且將表示層次間的位置關系的位置ID(位置信息)和層次的值合并來隱匿。由此,以提供謀求實現(xiàn)高速化并且提高了安全性的范圍檢索方法作為目的。本發(fā)明的關鍵詞變換裝置的特征在于具備登錄側(cè)分割部,該登錄側(cè)分割部輸入登錄用關鍵詞,其中,該登錄用關鍵詞是按照能夠進行分割成多個層次的層次化的規(guī)定的表現(xiàn)形式表現(xiàn)的,并且該登錄側(cè)分割部基于決定了所述層次化的規(guī)律的層次化規(guī)律,將所述登錄用關鍵詞分割成針對每個層次的要素;登錄側(cè)位置信息附加部,對由所述登錄側(cè)分割部分割的各個要素即登錄用層次要素附加表示所屬的層次的位置信息;以及登錄側(cè)數(shù)據(jù)變換部,根據(jù)規(guī)定的數(shù)據(jù)變換規(guī)則,對由所述登錄側(cè)位置信息附加部附加了所述位置信息的各個所述登錄用層次要素進行數(shù)據(jù)變換。根據(jù)本發(fā)明的關鍵詞變換裝置,可以謀求實現(xiàn)基于層次化的檢索的迅速化以及基于位置信息的隱匿化的信息的隱匿化的提高。圖I是實施方式I中的檢索系統(tǒng)100的框圖。圖2是實施方式I中的檢索系統(tǒng)100的登錄處理的流程圖。圖3是實施方式I中的檢索系統(tǒng)100的檢索處理的流程圖。圖4是實施方式I中的加密檢索索引部200的框圖。圖5是表不實施方式I中的信息塊表22的圖。圖6是表示實施方式I中的索引文件204的圖。圖7是實施方式I中的索引文件204的登錄處理的流程圖。圖8是實施方式I中的索引文件204的檢索處理的流程圖。圖9是表示實施方式2中的終端裝置100-1的外觀的一個例子的圖。圖10是表示實施方式2中的終端裝置100-1的硬件資源的一個例子的圖。(附圖標記說明)100:檢索系統(tǒng);100-1:終端裝置;100-2:云側(cè)裝置;101:登錄部;102:檢索部;111:登錄側(cè)分割部;112:登錄側(cè)符號化部;113:登錄側(cè)加密部;114:索引登錄部;120:關鍵詞生成部;121:檢索側(cè)分割部;122:檢索側(cè)符號化部;123:檢索側(cè)加密部;124:索引檢索部;200:加密檢索索引部;201:信息塊表參照部;202:信息塊表;203:信息塊訪問部;204:索引文件;205:登錄處理部;206:檢索處理部。具體實施例方式實施方式I圖I是表示使用與實施方式I相關的范圍檢索方法的檢索系統(tǒng)100(關鍵詞變換裝置)的結構的圖。(檢索系統(tǒng)100的結構)檢索系統(tǒng)100具備登錄部101,檢索部102,以及加密檢索索引部200。登錄部101具備登錄側(cè)分割部111,登錄側(cè)符號化部112(登錄側(cè)位置信息附加部),登錄側(cè)加密部113(登錄側(cè)數(shù)據(jù)變換部),索引登錄部114。檢索部102具備關鍵詞生成部120(檢索側(cè)關鍵詞生成部),檢索側(cè)分割部121,檢索側(cè)符號化部122(檢索側(cè)位置信息附加部),檢索側(cè)加密部123(檢索側(cè)數(shù)據(jù)變換部),以及索引檢索部124。(登錄時)檢索系統(tǒng)100將登錄用關鍵詞和確定包含該登錄用關鍵詞的文本的文本ID關聯(lián)起來,將登錄用關鍵詞加密并登錄到加密檢索索引部200中。如圖I所示,登錄側(cè)分割部111輸入登錄用關鍵詞和文本ID。在如后述那樣地包含屬性信息(屬性ID)的情況下,登錄側(cè)分割部111還輸入屬性信息。例如,將登錄對象的文本中包含的屬性項目“出生年月日”作為檢索關鍵字(key)使用的情況下,將從登錄對象的文本抽取的出生年月日的值(例如“2000年4月I日”)作為登錄用關鍵詞。作為文本ID,可以使用登錄序列號、文本文件名等可以唯一確定文本的ID。在使用文本文件名的情況下,通過事先進行加密,將文本文件名隱匿化。(檢索時)在檢索時,檢索系統(tǒng)100輸入與檢索關鍵字相關的“范圍檢索條件”,輸出在范圍檢索條件的范圍中包含的文本ID。例如,將屬性項目“出生年月日”作為檢索關鍵字,而設為范圍檢索條件“2000年4月I日2000年4月30日”的情況下,檢索系統(tǒng)100輸出該范圍中包含的文本ID。(登錄處理)圖2是表示與實施方式I相關的檢索系統(tǒng)100的登錄流程(登錄工序SlOfS104)的流程圖。(I)SlOl中,登錄側(cè)分割部111基于預先決定的層次化規(guī)律將輸入的登錄用關鍵詞分割成多個層次的值。(2)S102中,登錄側(cè)符號化部112將分割的值以及該值的位置ID或者對它們再合并屬性ID而作為I個符號進行編碼。(3)S103中,登錄側(cè)加密部113針對所述符號進行特定的變換,生成登錄用變換完成符號。(4)S104中,索引登錄部114將登錄用變換完成符號分別與和登錄用關鍵詞相關聯(lián)的文本ID關聯(lián)起來并登錄到加密檢索索引部200中。以下,對在圖2中說明的各個步驟進行進一步的詳細說明。(S101:登錄側(cè)分割部111)如果對檢索系統(tǒng)100輸入了登錄用關鍵詞,則登錄側(cè)分割部111基于預先決定了的“層次化規(guī)律”將登錄用關鍵詞分割成多個層次的值。例如,在將屬性項目“出生年月日”那樣的日期信息進行層次化的情況下,“出生年月日”可以如“年,,、“月”、“日”那樣進行層次化。在該情況下,“2000年4月I日”這樣的登錄用關鍵詞被分割成“2000”、“4”、“I”這樣的3個值(登錄用層次要素)。(層次化規(guī)律)進一步說明層次化規(guī)律。層次化規(guī)律可以針對日期、數(shù)值、字符串等可持有范圍的值的每個種類決定。(I)如果是數(shù)值,則可以針對每固定比特數(shù)分割固定長度的2進制數(shù)來進行層次化。例如,如果將64比特整數(shù)按每8比特(I字節(jié))進行分割,則成為8個層次。在該情況下,作為位置ID,設為從MSB開始數(shù)的從O開始的字節(jié)位置((Γ7)。(2)另外,作為數(shù)值的其它表現(xiàn)方法,也可以使用2進化10進制數(shù)這樣的表現(xiàn)方法。在該情況下,針對10進制的每個位數(shù)將固定長度的2進化10進制數(shù)進行分割,作為位置ID,設為從MSB開始數(shù)的從O開始的位位置。(3)在日期的情況下,除了上述的例子,也可以將過去的特定日作為O進行序列號化,并作為數(shù)值進行層次化。例如,可以將1900年I月I日設為序列號1,通過1900年I月I日開始經(jīng)過的天數(shù)表示日期。另外,也可以將日期表示成“YYYYMMDD”(YYYY是西歷年,麗是月,DD是日)這樣的特定的字符串格式,作為2進化10進制數(shù)進行層次化。(4)時刻的情況下也是同樣地,可以使用按照“時”、“分”、“秒”進行層次化,或者將“00:00:00”作為O進行序列號化,或者表示成“HHmmSS”(HH是24小時表示中的小時,mm是分,SS是秒)等方法。(5)在字符串的情況下,以I個字符為單位進行分割,通過將從O開始數(shù)開頭的字符位置設為位置ID,可以表示可變長的字符串。(S102:登錄側(cè)符號化部112)登錄側(cè)符號化部112向分割了的層次的值附加標簽,并作為I個符號進行編碼。例如,在將日期信息像“年”、“月”、“日”那樣進行層次化的情況下,將層次的位置信息設為“年”“月”“日”,并將這些作為標簽附加到層次的值。此處,“位置信息”是表示被分割到層次的值(登錄用層次要素)所屬的層次的信息。“2000年4月I日”這樣的登錄用關鍵詞被附加位置信息,成為“年2000,,、“月:4”、“日1”這3個符號。此處,按照“標簽值”的形式表示符號。標簽也可以作為XML(EXTENSIBLEMARKUPLANGUAGE,可擴展標記語言)形式,設為“〈標簽〉值〈/標簽〉”。在該情況下,變成“〈年>2000</年>,,、“〈月>2000</月>,,、“〈日>1</日>”。另外,作為其它的例子,也可以將符號編碼成固定長度的2進制整數(shù)。在日期的情況下,也可以設為將I個符號例如以32比特表示,并在高位16比特中將標簽進行編碼,而在低位16比特中將值進行編碼。(屬性信息)進一步地,登錄側(cè)符號化部112也可以將表示屬性的屬性ID(屬性信息)和登錄用關鍵詞一起作為標簽包含在符號中進行編碼。屬性ID是和登錄用關鍵詞一起被輸入。例如,可以將符號作為“屬性ID:位置ID:值”,將標簽雙重(屬性ID和位置ID的標簽)附加。例如,在登錄用關鍵詞是上述的“2000年4月I日”那樣的日期數(shù)據(jù)的情況下,如果將“屬性ID=I”設為屬性項目“出生年月日”,并將“屬性ID=2”設為屬性項目“入會日”,則可以檢索作為“出生年月日”的“2000年4月I日”或者作為“入會日”的“2000年4月I日”。如果是“出生年月日”,則“2000年4月I日”作為“屬性ID:位置ID:值”的表現(xiàn),可以表現(xiàn)為“I:年:2000”、“1:月:4”、“1:日:1”。另外,如果是XML形式,則可以像<屬性IDX位置ID>值〈/位置IDX/屬性ID>這樣記載為嵌套結構。或者,也可以像<屬性ID層次=”位置ID”>值〈/屬性ID>這樣給I個XML標簽賦予屬性。另外,也可以在將符號編碼成固定長度的2進制整數(shù)時,決定屬性ID區(qū)域來進行編碼。例如,可以設為將I個符號以32比特表示、在高位8比特中將屬性ID標簽編碼、在中位8比特中將位置ID標簽編碼、在低位16比特中將值編碼。屬性ID是在系統(tǒng)中唯一確定即可,因此,將屬性名和屬性ID的對應關系進行表管理,由此可以對單純的序列號進行編碼。通過在符號中包含屬性ID,也可以將符號包含在哪個屬性中這樣的信息隱匿化,而提高隱匿性。(S103:登錄側(cè)加密部113)登錄側(cè)加密部113針對符號進行根據(jù)規(guī)定的數(shù)據(jù)變換規(guī)則的“特定的變換”,而生成登錄用變換完成符號。在I個登錄用關鍵詞被編碼為N個符號的情況下,變換N個各符號,而生成N個登錄用變換完成符號。在上述的“2000年4月I日”的例子中,生成“年2000”、“月4”、“日1”這3個符號,在這種情況下,這3個的各自的登錄用變換完成符號由登錄側(cè)加密部113生成。作為由登錄側(cè)加密部113進行的“特定的變換”,通過進行加密、哈希(hash)等可以提高符號的隱匿性。作為加密的方法,可以使用一般的共用密鑰密碼。(S104:索引登錄部114)索引登錄部114將由登錄側(cè)加密部113生成的N個的各個登錄用變換完成符號和與登錄用關鍵詞相關聯(lián)的文本ID關聯(lián)起來并登錄到加密檢索索引部200中。在符號的登錄順序被保存在加密檢索索引部200中那樣的情況下,通過將N個符號按隨機的順序登錄可以提高隱匿性。如以上所述那樣,(I)分割登錄用關鍵詞(S101),(2)將位置ID和值的組進行符號化(S102),(3)對于符號,在實施加密等變換的基礎上(S103),(4)登錄到加密檢索索引中(S104)。將登錄用關鍵詞分割成層次,并且在層次的值中包含登錄用關鍵詞內(nèi)的位置信息,因此能夠?qū)崿F(xiàn)檢索的迅速化和隱匿化的提高。另外,在將多個屬性作為檢索關鍵字來使用的情況下,符號中包含屬性ID,因此,可以將符號被包含在哪個屬性中這一點進行隱匿化。(檢索處理)圖3是表示與實施方式I相關的檢索系統(tǒng)100的檢索處理(檢索工序S201S205)的流程的流程圖。(I)在S201中,關鍵詞生成部120生成多個檢索關鍵詞,其中,該多個檢索關鍵詞可檢索包含在輸入的范圍檢索條件的范圍中的所有要素。(2)在S202中,檢索側(cè)分割部121基于預先決定的層次化規(guī)律(和登錄時相同)將檢索關鍵詞分割成多個層次的值。(3)在S203中,檢索側(cè)符號化部122將分割的值以及該值的位置ID、或者對它們再合并屬性ID作為I個符號進行編碼。(4)在S204中,檢索側(cè)加密部123針對所述符號進行特定的數(shù)據(jù)變換,而生成檢索用變換完成符號。(5)在S205中,索引檢索部124使用加密檢索索引部200進行檢索用變換完成符號的檢索,而輸出結果的文本ID。以下,進一步地詳細說明在圖3中說明的各個步驟。(S201:關鍵詞生成部120)關鍵詞生成部120如果被輸入范圍檢索條件,則生成多個檢索關鍵詞,其中,該多個檢索關鍵詞能夠檢索包含在范圍檢索條件的范圍中的所有要素。關鍵詞生成部120在某個層次可取的值全部被包含在范圍檢索條件的范圍中的情況下,將該層次設為非關注(don’tcare),將包含非關注層次的檢索關鍵詞匯集成I個。例如在日期屬性中,將層次化規(guī)律設為“年”、“月”、“日”的情況下,關鍵詞生成部120將范圍檢索條件“2000年4月I日2000年4月30日”設為I個檢索關鍵詞“2000年4月*日”(*是非關注)。另外,如果是范圍檢索條件“2000年4月16日2002年4月15日”,則關鍵詞生成部120生成以下那樣的〈檢索條件1>?!礄z索條件1>“2000年4月16日”0R“2000年4月17日’’OR......(略)“2000年4月30日”0R“2000年5月*日’’OR“2000年6月*日’’OR......(略)“2000年12月*日”0R“2001年*月*日’’OR“2002年I月*日’’OR“2002年2月*日”O(jiān)R“2002年3月*日”O(jiān)R“2002年4月I日”O(jiān)R“2002年4月2日”0R......(略)“2002年4月15日”。通過生成如〈檢索條件1>所示那樣的檢索關鍵詞,可以檢索出范圍檢索條件的范圍的所有要素。在上述的〈檢索條件1>中,“0R”意味著關鍵詞的檢索結果的邏輯和。這樣,通過使用“非關注”減少對照次數(shù),可以提高檢索速度。進一步地,關于通過“0R”結合的部分,即使更換順序,檢索結果也不會變,因此通過隨機地更換順序,可以提高檢索條件的隱匿性。像這樣,關鍵詞生成部120輸入包含按照能夠進行分割成多個層次的層次化的規(guī)定的表現(xiàn)形式表現(xiàn)了的多個檢索用關鍵詞(2000年4月16日、2002年4月15日)并且作為基于多個檢索用關鍵詞指定檢索對象范圍的檢索條件的“2000年4月16日2002年4月15日”(第I檢索條件)。關鍵詞生成部120判定輸入的第I檢索條件能否變更成第2檢索條件(上述的〈檢索條件1>),該第2檢索條件指定與第I檢索條件的所述檢索對象范圍相同的檢索對象范圍,并包含按照第I檢索條件中包含的檢索用關鍵詞的表現(xiàn)形式表現(xiàn)且作為保有能夠進行非關注表現(xiàn)的特有層次的檢索用關鍵詞的至少一個“特有層次保有檢索用關鍵詞”(在〈檢索條件1>的例子中,包含表示非關注的*的年月日)。關鍵詞生成部120如果判定第I檢索條件(“2000年4月16日2002年4月15日”)能夠變更為第2檢索條件(上述的〈檢索條件1>),則將第I檢索條件變更為第2檢索條件,并輸出第2檢索條件,如果判定為不能變更,則輸出第I檢索條件。在“2000年4月16日2002年4月15日”的情況下,關鍵詞生成部120判定為能夠變更,將上述的〈檢索條件1>作為第2檢索條件輸出。(S202:檢索側(cè)分割部121)檢索側(cè)分割部121與登錄側(cè)分割部111同樣地,基于預先決定的層次化規(guī)律將檢索用關鍵詞分割成多個層次的值。以下所示的〈檢索條件2>是檢索側(cè)分割部121分割由關鍵詞生成部120生成的〈檢索條件1>的例子。〈檢索條件2>“2000年”AND(“4月”AND(“16日”O(jiān)R“17日”O(jiān)R......(略)......OR“30HO)OR“5月’’0R“6月’’0R......(略)......“12月”)OR“2001年”O(jiān)R“2002年”AND(“I月”0R“2月”0R“3月”0R(“4月”AND(“I日”O(jiān)R“2日”O(jiān)R......(略)......OR“15日”)))。通過按上述那樣生成〈檢索條件2>,能夠檢索出范圍的所有要素,可以進一步地削減對照次數(shù)。關于〈檢索條件2>,關于“0R”結合的部分,即使更換順序,檢索結果也不變,因此通過隨機地更換順序,可以提高檢索條件的隱匿性?;蛘?,如果包含“AND”結合部分來更換順序而個別地進行檢索,并將中間結果全部取得之后進行檢索結果的對接,則可以進一步地提高檢索條件的隱匿性。(S203:檢索側(cè)符號化部122)檢索側(cè)符號化部122與登錄側(cè)符號化部112同樣地,將位置ID以及值、或者屬性ID、位置ID以及值編碼成符號。(S204:檢索側(cè)加密部123)檢索側(cè)加密部123與登錄側(cè)加密部113同樣地,進行符號的變換并生成檢索用變換完成符號。以下所示的〈檢索條件3>是檢索側(cè)符號化部122將〈檢索條件2>進行符號化,而檢索側(cè)加密部123將符號化了的檢索條件2進行了數(shù)據(jù)變換的例子。在〈檢索條件2>中,如果將檢索側(cè)符號化部122的編碼設為S(X),而將檢索側(cè)加密部123的數(shù)據(jù)變換設為E(Y),則檢索條件整體變成以下的形式?!礄z索條件3>E(S(2000年))AND(E(S(4月))AND(E(S(16日))0RE(S(17日))0R......(略)......ORE(S(30日))))0RE(S(5月))0RE(S(6月」))0R......(略)......E(S(12B)))0RE(S(2001年))ORE(S(2002年))AND(E(S(I月))0RE(S(2月))0RE(S(3月))0R(E(S(4月))AND(E(S(I日))0RE(S(2日))0R......(略)......ORE(S(15日)))))。(S205:索引檢索部124)索引檢索部124使用加密檢索索引部200進行檢索。如以上所述那樣,通過根據(jù)檢索的層次化削減在范圍檢索中的對照次數(shù),可以使檢索高速化。(加密檢索索引部200)接下來,詳細說明加密檢索索引部200。對在登錄側(cè)加密部113以及檢索側(cè)加密部123中使用共用的確定性的密碼的情況的例子進行說明。“確定性的密碼”是指,如果密鑰相同,則相同的數(shù)據(jù)總是被變換成相同的加密數(shù)據(jù)的加密方法。因此,如果在登錄側(cè)加密部113以及檢索側(cè)加密部123中密鑰是相同的,則關于變換完成符號能夠進行完全一致對照的檢索。加密檢索索引部200可以使用通常被使用著的關系數(shù)據(jù)庫技術來構成。也就是說,通過定義包含變換完成符號以及與變換完成符號相對應的文本ID這2個域(field)的表,可以根據(jù)變換完成符號取得相應(包含該變換完成符號)的文本ID。進一步地,文本ID在用戶側(cè)預先通過“非確定性的密碼”進行加密,然后登錄。而且,通過在取得檢索結果后用戶解密,可以提高加密檢索索引的隱匿性。(加密檢索索引部200)圖4表示加密檢索索引部200的框圖的一個例子。加密檢索索引部200具備信息塊表參照部201,信息塊表(blocktable)202,信息塊訪問部203,索引文件204,登錄處理部205,檢索處理部206。圖5是表不/[目息塊表202的圖。圖6是表示索引文件204的圖。(I)登錄處理部205進行登錄用變換完成符號的登錄處理。(2)檢索處理部206進行檢索用變換完成符號的檢索處理,輸出檢索結果的文本ID。(3)信息塊表參照部201輸入變換完成符號,參照信息塊表202,來取得包含與變換完成符號相對應的文本ID的索引信息塊信息。(4)信息塊訪問部203根據(jù)索引信息塊信息,訪問與索引文件204相應的信息塊,在登錄時向相應信息塊中追加寫入文本ID,在檢索時讀出相應信息塊的文本ID并輸出。(5)信息塊表參照部201通過使用哈希直接生成與變換完成符號相對應的索引信息塊信息的地址,可以高速地取出索引信息塊信息。(6)信息塊表202被保存為盤上的文件,但是也可以在執(zhí)行時保存到主存儲上,而實現(xiàn)高速化。索引文件204也被保存為盤上的文件。(7)在/[目息塊表202的索引彳目息塊彳目息中保存彳目息塊的偏移(offset)以及彳目息塊的大小,其中該信息塊保存索引文件內(nèi)的針對相應符號的文本ID信息。根據(jù)索引信息塊信息,信息塊訪問部203通過必要的最小限度的盤訪問能夠讀寫文本ID信息。為了索引信息塊的隱匿化,索引信息塊可以加密。在該情況下,不是針對索引文件204整體,而是針對各個信息塊分別加密。接下來,說明圖4所示的加密檢索索引部200的動作。(加密檢索索引部200的登錄處理)圖7是表示圖4的加密檢索索引部200中的登錄處理的流程(登錄處理工序S301S307)的流程圖。(I)在S301中,登錄處理部205輸入登錄用變換完成符號。(2)在S302中,登錄處理部205使信息塊表參照部201進行登錄用變換完成符號的息塊表202的參照,使得取得相應的索引信息塊信息。(3)在S303中,登錄處理部205確認信息塊表202中是否有相應的條目(entry)。(4)在有相應的條目的情況下,登錄處理部205在S304中,根據(jù)取得的索引信息塊信息,使信息塊訪問部203從索弓I文件204取得索弓I信息塊,并向索引信息塊中追加與登錄用變換完成符號相關聯(lián)的文本ID。(5)在S303中,在沒有相應的條目的情況下,登錄處理部205在S305中使信息塊表參照部201向信息塊表202追加新的條目。(6)在S306中,登錄處理部205使信息塊訪問部203向索引文件204追加新的索引信息塊,而在S307中向索引信息塊追加文本ID。(檢索處理)圖8是表示圖4的加密檢索索引部200的檢索處理的流程(檢索處理工序S40rS406)的一例的流程圖。(I)在S401中,檢索處理部206輸入檢索用變換完成符號。(2)在S402中,檢索處理部206使信息塊表參照部201進行檢索用變換完成符號的/[目息塊表202的參照,使得從彳目息塊表202取得相應的索引彳目息塊彳目息。(3)在S403中,確認在信息塊表202中是否有相應的條目。(4)在沒有相應的條目的情況下,在S404中,輸出“沒有相應”的檢索結果。(5)在S403中有相應的條目的情況下,在S405中,檢索處理部206根據(jù)取得的索弓I信息塊信息使信息塊訪問部203從索引文件204取得索引信息塊,在S406中從索引信息塊取得文本ID并作為檢索結果輸出。實施方式2實施方式2說明作為計算機的終端裝置100-1(用戶使用)的硬件結構。圖9是表示終端裝置100-1的外觀的一例的圖。在圖9中,終端裝置100-1(關鍵詞變換裝置的一例)經(jīng)由網(wǎng)絡(例如互聯(lián)網(wǎng))與云側(cè)(服務提供者側(cè))的云側(cè)裝置100-2連接。終端裝置100-1執(zhí)行直到圖I的數(shù)據(jù)變換為止的處理(圖I的虛線31的左側(cè)的處理)。云側(cè)裝置100-2執(zhí)行圖I的登錄以及檢索的處理(圖I的虛線31的右側(cè)的處理)。終端裝置100-1以及云側(cè)裝置100-2構成檢索系統(tǒng)100。終端裝置100-1具有登錄側(cè)分割部111、登錄側(cè)符號化部112、登錄側(cè)加密部113、關鍵詞生成部120、檢索側(cè)分割部121、檢索側(cè)符號化部122、檢索側(cè)加密部123的功能。另外,云側(cè)裝置100-2具有索引登錄部114、索引檢索部124、以及加密檢索索引部200的功能。以下說明終端裝置100-1,但是云側(cè)裝置100-2也是與終端裝置100_1同樣的計算機,關于終端裝置100-1的說明也適用于云側(cè)裝置100-2。如圖9所示,終端裝置100-1具備系統(tǒng)組件830、具有CRT(CathodeRayTube,陰極射線管)、LCD(液晶)的顯示畫面的顯示裝置813、鍵盤814(KeyBoard:K/B)、鼠標815、FDD817(FlexibIeDiskDrive,軟盤驅(qū)動器)、高密度盤裝置818(CDDCompactDiskDrive)、打印機819等硬件資源,這些通過電纜、信號線連接。系統(tǒng)組件30經(jīng)由網(wǎng)絡與云側(cè)裝置100-2連接。圖10是表示終端裝置100-1的硬件資源的圖。終端裝置100-1具備執(zhí)行程序的CPU810(CentralProcessingUnit,中央處理單元)。CPU810經(jīng)由總線825與ROM(ReadOnlyMemory,只讀存儲器)811、RAM(RandomAccessMemory,隨機訪問存儲器)812、顯不裝置813、鍵盤814、鼠標815、通信板(communicationboard)816、FDD817、CDD818、打印機裝置819、磁盤裝置820相連接,并控制這些硬件設備。代替磁盤裝置820,也可以用光盤裝置、閃速存儲器等存儲裝置。RAM812是易失性存儲器的一例。R0M811、FDD817、CDD818、磁盤裝置820等存儲介質(zhì)是非易失性存儲器的一例。這些是“存儲裝置”或者是存儲部、保存部、緩沖器的一例。通信板816、鍵盤814、FDD817等是輸入部、輸入裝置的一例。另外,通信板816、顯示裝置813、打印機裝置819等是輸出部、輸出裝置的一例。通信板816被連接到網(wǎng)絡。在磁盤裝置820中存儲有操作系統(tǒng)821(OS)、視窗系統(tǒng)822、程序群823、文件群824。程序群823的程序通過CPU810、操作系統(tǒng)821、視窗系統(tǒng)822被執(zhí)行。在上述程序群823中存儲有執(zhí)行在實施方式的說明中作為“部”說明的功能的程序。程序由CPU810讀出并執(zhí)行。在文件群824中存儲有在以上的實施方式的說明中作為“層次化規(guī)律”說明的信息,作為“的判定結果”、“的計算結果”、“的抽取結果”、“的生成結果”、“的處理結果”說明的信息,數(shù)據(jù)、信號值、變量值、參數(shù)等來作為“文件”、“數(shù)據(jù)庫”(DB)的各項目。“文件”、“數(shù)據(jù)庫”存儲在盤、存儲器等記錄介質(zhì)中。盤、存儲器等存儲介質(zhì)中存儲的信息、數(shù)據(jù)、信號值、變量值、參數(shù)經(jīng)由讀寫電路由CPU810讀出到主存儲器、高速緩沖存儲器中,用于抽取、檢索、參照、比較、運算、計算、處理、輸出、印刷、顯示等CPU動作。抽取、檢索、參照、比較、運算、計算、處理、輸出、印刷、顯示的CPU動作的期間,信息、數(shù)據(jù)、信號值、變量值、參數(shù)被臨時存儲在主存儲器、高速緩沖存儲器、緩沖存儲器中。另外,在上述的實施方式的說明中,數(shù)據(jù)、信號值記錄在RAM812的存儲器、FDD817的軟盤、⑶D818的高密度盤、磁盤裝置820的磁盤、其他的光盤、迷你盤(minidisk)、DVD(DigitalVersatileDisk,數(shù)字多功能盤)等記錄介質(zhì)中。另外,數(shù)據(jù)、信號通過總線825、信號線、電纜、其他的傳送介質(zhì)在線傳送。另外,在以上的實施方式的說明中,作為“部”說明的部分也可以是“單元”、“電路”、“儀器”,另外,也可以是“步驟”、“次序”、“處理”。也就是說,作為“部”說明的部分也可以通過在R0M811中存儲的固件實現(xiàn)?;蛘咭部梢灾煌ㄟ^軟件,或者只通過元件、設備、基板、布線等硬件,或者通過軟件和硬件的組合,進一步地,通過與固件的組合來實施。固件和軟件作為程序存儲在磁盤、軟盤、光盤、高密度盤、迷你盤、DVD等記錄介質(zhì)中。程序由CPU810讀出,并由CPU810執(zhí)行。也就是說,程序使計算機作為上述的“部”發(fā)揮功能?;蛘撸绦蚴褂嬎銠C執(zhí)行上述的“部”的次序、方法。另外,在以上的實施方式中說明了關鍵詞變換裝置,但是也能夠?qū)㈥P鍵詞變換裝置的動作作為關鍵詞變換方法或者關鍵詞變換程序來掌握。進一步地,也能夠作為記錄關鍵詞變換程序的計算機能夠讀取的記錄介質(zhì)來掌握。在以上的實施方式中,說明了實施具備以下步驟的范圍檢索方法的檢索系統(tǒng)。將從成為檢索對象的數(shù)據(jù)抽取的檢索對象關鍵詞登錄到檢索系統(tǒng)中,通過所述檢索系統(tǒng)檢索與具有值的范圍的檢索條件相一致的數(shù)據(jù)的范圍檢索方法中,包含(I)分割步驟,將I個所述檢索對象關鍵詞分割成N個(N3I)值;(2)符號化步驟,關于所述N個值,分別編碼成附加了標簽的符號;(3)數(shù)據(jù)變換步驟,針對所述N個符號分別通過特定的變換來變換成N個登錄用變換完成符號;(4)登錄步驟,將所述N個登錄用變換完成符號與成為所述檢索對象的數(shù)據(jù)關聯(lián)起來并登錄到檢索系統(tǒng)中;(5)檢索關鍵詞生成步驟,根據(jù)具有值的范圍的檢索條件生成多個檢索關鍵詞;(6)檢索側(cè)分割步驟,將I個所述檢索關鍵詞分割成N個值,并抽取其中M個(N蘭M蘭I)值;(7)檢索側(cè)符號化步驟,關于所述M個值,分別編碼成附加了標簽的符號;(8)檢索側(cè)數(shù)據(jù)變化步驟,針對所述M個符號分別通過特定的變換來變換成M個檢索用變換完成符號;(9)檢索步驟,通過檢索系統(tǒng)檢索將M個檢索用變換完成符號全部包含的檢索對象數(shù)據(jù)。在以上的實施方式中說明了如下范圍檢索方法所述進行分割的步驟中在所述檢索對象關鍵詞是字符串數(shù)據(jù)的情況下,將字符串數(shù)據(jù)分割成以字符為單位的值,所述進行編碼的步驟中作為標簽附加所述字符串數(shù)據(jù)中的字符的位置。在以上的實施方式中說明了如下范圍檢索方法所述進行分割的步驟中在所述檢索對象關鍵詞是整數(shù)值數(shù)據(jù)的情況下,將整數(shù)值數(shù)據(jù)分割成以比特為單位的數(shù)值,所述進行編碼的步驟中作為標簽附加所分割的數(shù)值的比特位置。在以上的實施方式中說明了如下范圍檢索方法所述檢索側(cè)分割步驟中在所述檢索對象關鍵詞是日期數(shù)據(jù)或者時刻數(shù)據(jù)的情況下,將日期數(shù)據(jù)或者時刻數(shù)據(jù)進行序列號化而作為所述整數(shù)值數(shù)據(jù)進行分割。在以上的實施方式中說明了如下范圍檢索方法所述檢索步驟中將檢索用變換完成符號的順序隨機地更換之后進行檢索。權利要求1.一種關鍵詞變換裝置,其特征在于,具備登錄側(cè)分割部,該登錄側(cè)分割部輸入登錄用關鍵詞,其中,該登錄用關鍵詞是按照能夠進行分割成多個層次的層次化的規(guī)定的表現(xiàn)形式表現(xiàn)的,并且該登錄側(cè)分割部基于決定了所述層次化的規(guī)律的層次化規(guī)律,將所述登錄用關鍵詞分割成針對每個層次的要素;登錄側(cè)位置信息附加部,對由所述登錄側(cè)分割部分割的各個要素即登錄用層次要素附加表示所屬的層次的位置信息;以及登錄側(cè)數(shù)據(jù)變換部,根據(jù)規(guī)定的數(shù)據(jù)變換規(guī)則,對由所述登錄側(cè)位置信息附加部附加了所述位置信息的各個所述登錄用層次要素進行數(shù)據(jù)變換。2.根據(jù)權利要求1所述的關鍵詞變換裝置,其特征在于所述登錄側(cè)位置信息附加部輸入表示所述登錄用關鍵詞的屬性的屬性信息,并將所述屬性信息附加到各個所述登錄用層次要素;所述登錄側(cè)數(shù)據(jù)變換部根據(jù)所述數(shù)據(jù)變換規(guī)則,對由所述登錄側(cè)位置信息附加部附加了所述位置信息以及所述屬性信息的各個所述登錄用層次要素進行數(shù)據(jù)變換。3.根據(jù)權利要求2所述的關鍵詞變換裝置,其特征在于,所述關鍵詞變換裝置進一步具備檢索側(cè)關鍵詞生成部,輸入第一檢索條件,判定是否能夠?qū)⑺斎氲乃龅谝粰z索條件變更為第二檢索條件,如果判定為能夠?qū)⑺龅谝粰z索條件變更為所述第二檢索條件,則將所述第一檢索條件變更為所述第二檢索條件,并輸出變更了的所述第二檢索條件,如果判定為不能變更,則輸出所述第一檢索條件,其中,所述第一檢索條件包含按照所述登錄用關鍵詞的所述表現(xiàn)形式表現(xiàn)的多個檢索用關鍵詞,并且基于所述多個檢索用關鍵詞指定檢索對象范圍,所述第二檢索條件指定與所述第一檢索條件的所述檢索對象范圍相同的檢索對象范圍,并包含按照所述登錄用關鍵詞的所述表現(xiàn)形式表現(xiàn)且作為保有能夠進行非關注表現(xiàn)的特有層次的檢索用關鍵詞的至少一個特有層次保有檢索用關鍵詞;檢索側(cè)分割部,輸入由所述檢索側(cè)關鍵詞生成部輸出的所述第一檢索條件以及所述第二檢索條件中的某一個所述檢索條件,基于所述登錄側(cè)分割部使用的所述層次化規(guī)律將輸入的所述檢索條件中包含的全部所述檢索用關鍵詞分割成多個要素;檢索側(cè)位置信息附加部,對由所述檢索側(cè)分割部分割的各個要素即檢索用層次要素附加所述位置信息;以及檢索側(cè)數(shù)據(jù)變換部,根據(jù)所述檢索側(cè)數(shù)據(jù)變換部使用的所述數(shù)據(jù)變換規(guī)則,對由所述檢索側(cè)位置信息附加部附加了所述位置信息的各個所述檢索用層次要素進行數(shù)據(jù)變換。4.根據(jù)權利要求3所述的關鍵詞變換裝置,其特征在于所述檢索側(cè)關鍵詞生成部在所述第二檢索條件包含多個所述檢索用關鍵詞的情況下,在所述第二檢索條件中,通過邏輯運算結合各個所述檢索用關鍵詞彼此;所述檢索側(cè)分割部如果輸入所述第二檢索條件,則在維持所述邏輯運算的關系的同時,基于所述層次化規(guī)律將所述第二檢索條件包含的全部所述檢索用關鍵詞分割成多個所述檢索用層次要素。5.一種關鍵詞變換裝置,其特征在于,具備檢索側(cè)關鍵詞生成部,輸入第一檢索條件,判定是否能夠?qū)⑺斎氲乃龅谝粰z索條件變更為第二檢索條件,如果判定為能夠?qū)⑺龅谝粰z索條件變更為所述第二檢索條件,則將所述第一檢索條件變更為所述第二檢索條件,并輸出變更了的所述第二檢索條件,如果判定為不能變更,則輸出所述第一檢索條件,其中,所述第一檢索條件包含按照能夠進行分割成多個層次的層次化的規(guī)定的表現(xiàn)形式表現(xiàn)的多個檢索用關鍵詞,并且基于所述多個檢索用關鍵詞指定檢索對象范圍,所述第二檢索條件指定與所述第一檢索條件的所述檢索對象范圍相同的檢索對象范圍,并包含按照所輸入的所述檢索用關鍵詞的所述表現(xiàn)形式表現(xiàn)且作為保有能夠進行非關注表現(xiàn)的特有層次的檢索用關鍵詞的至少一個特有層次保有檢索用關鍵詞;檢索側(cè)分割部,輸入由所述檢索側(cè)關鍵詞生成部輸出的所述第一檢索條件以及所述第二檢索條件中的某一個所述檢索條件,基于決定了所述層次化的規(guī)律的所述層次化規(guī)律將輸入的所述檢索條件中包含的全部所述檢索用關鍵詞分割成多個要素;檢索側(cè)位置信息附加部,對由所述檢索側(cè)分割部分割的各個要素即檢索用層次要素附加表示所屬的層次的位置信息;以及檢索側(cè)數(shù)據(jù)變換部,根據(jù)規(guī)定的數(shù)據(jù)變換規(guī)則,對由所述檢索側(cè)位置信息附加部附加了所述位置信息的各個所述檢索用層次要素進行數(shù)據(jù)變換。6.—種關鍵詞變換程序,其特征在于,使計算機作為如下部分發(fā)揮功能登錄側(cè)分割部,該登錄側(cè)分割部輸入登錄用關鍵詞,其中,該登錄用關鍵詞是按照能夠進行分割成多個層次的層次化的規(guī)定的表現(xiàn)形式表現(xiàn)的,并且該登錄側(cè)分割部基于決定了所述層次化的規(guī)律的層次化規(guī)律,將所述登錄用關鍵詞分割成針對每個層次的要素;登錄側(cè)位置信息附加部,對由所述登錄側(cè)分割部分割的各個要素即登錄用層次要素附加表示所屬的層次的位置信息;登錄側(cè)數(shù)據(jù)變換部,根據(jù)規(guī)定的數(shù)據(jù)變換規(guī)則,對由所述登錄側(cè)位置信息附加部附加了所述位置信息的各個所述登錄用層次要素進行數(shù)據(jù)變換。7.—種關鍵詞變換程序,其特征在于,使計算機作為如下部分發(fā)揮功能檢索側(cè)關鍵詞生成部,輸入第一檢索條件,判定是否能夠?qū)⑺斎氲乃龅谝粰z索條件變更為第二檢索條件,如果判定為能夠?qū)⑺龅谝粰z索條件變更為所述第二檢索條件,則將所述第一檢索條件變更為所述第二檢索條件,并輸出變更了的所述第二檢索條件,如果判定為不能變更,則輸出所述第一檢索條件,其中,所述第一檢索條件包含按照能夠進行分割成多個層次的層次化的規(guī)定的表現(xiàn)形式表現(xiàn)的多個檢索用關鍵詞,并且基于所述多個檢索用關鍵詞指定檢索對象范圍,所述第二檢索條件指定與所述第一檢索條件的所述檢索對象范圍相同的檢索對象范圍,并包含按照所輸入的所述檢索用關鍵詞的所述表現(xiàn)形式表現(xiàn)且作為保有能夠進行非關注表現(xiàn)的特有層次的檢索用關鍵詞的至少一個特有層次保有檢索用關鍵詞;檢索側(cè)分割部,輸入由所述檢索側(cè)關鍵詞生成部輸出的所述第一檢索條件以及所述第二檢索條件中的某一個所述檢索條件,基于決定了所述層次化的規(guī)律的所述層次化規(guī)律將輸入的所述檢索條件中包含的全部所述檢索用關鍵詞分割成多個要素;檢索側(cè)位置信息附加部,對由所述檢索側(cè)分割部分割的各個要素即檢索用層次要素附加表示所屬的層次的位置信息;檢索側(cè)數(shù)據(jù)變換部,根據(jù)規(guī)定的數(shù)據(jù)變換規(guī)則,對由所述檢索側(cè)位置信息附加部附加了所述位置信息的各個所述檢索用層次要素進行數(shù)據(jù)變換。8.一種計算機可讀取的記錄介質(zhì),其特征在于,記錄了權利要求6或7所述的關鍵詞變換程序。9.一種關鍵詞變換方法,其特征在于(1)輸入按照能夠進行分割成多個層次的層次化的規(guī)定的表現(xiàn)形式表現(xiàn)的登錄用關鍵詞,基于決定了所述層次化的規(guī)律的層次化規(guī)律,將所述登錄用關鍵詞分割成針對每個層次的要素;(2)對所分割的各個要素即登錄用層次要素附加表示所屬的層次的位置信息;(3)根據(jù)規(guī)定的數(shù)據(jù)變換規(guī)則,對附加了所述位置信息的各個所述登錄用層次要素進行數(shù)據(jù)變換。10.一種關鍵詞變換方法,其特征在于(1)輸入第一檢索條件,判定是否能夠?qū)⑺斎氲乃龅谝粰z索條件變更為第二檢索條件,如果判定為能夠?qū)⑺龅谝粰z索條件變更為所述第二檢索條件,則將所述第一檢索條件變更為所述第二檢索條件,并輸出變更了的所述第二檢索條件,如果判定為不能變更,則輸出所述第一檢索條件,其中,所述第一檢索條件包含按照能夠進行分割成多個層次的層次化的規(guī)定的表現(xiàn)形式表現(xiàn)的多個檢索用關鍵詞,并且基于所述多個檢索用關鍵詞指定檢索對象范圍,所述第二檢索條件指定與所述第一檢索條件的所述檢索對象范圍相同的檢索對象范圍,并包含按照所述表現(xiàn)形式表現(xiàn)且作為保有能夠進行非關注表現(xiàn)的特有層次的檢索用關鍵詞的至少一個特有層次保有檢索用關鍵詞;(2)輸入所輸出的所述第一檢索條件以及所述第二檢索條件中的某一個所述檢索條件,基于決定了所述層次化的規(guī)律的所述層次化規(guī)律將輸入的所述檢索條件中包含的全部所述檢索用關鍵詞分割成多個要素;(3)對所分割的各個要素即檢索用層次要素附加表示所屬的層次的位置信息;(4)根據(jù)規(guī)定的數(shù)據(jù)變換規(guī)則,對附加了所述位置信息的各個所述檢索用層次要素進行數(shù)據(jù)變換。全文摘要檢索系統(tǒng)(100)具備登錄側(cè)分割部(111),輸入按照能夠進行分割成多個層次的層次化的規(guī)定的表現(xiàn)形式表現(xiàn)的登錄用關鍵詞,基于決定了層次化的規(guī)律的層次化規(guī)律,將所述登錄用關鍵詞分割成針對每個層次的要素;登錄側(cè)符號化部(112),向作為由登錄側(cè)分割部(111)分割的各個要素的登錄用層次要素中附加表示所屬的層次的位置信息;登錄側(cè)加密部(113),按照規(guī)定的數(shù)據(jù)變換規(guī)則,將由登錄側(cè)符號化部(112)附加了位置信息的各個登錄用層次要素進行數(shù)據(jù)變換。文檔編號H04L9/00GK102985920SQ20108006794公開日2013年3月20日申請日期2010年7月8日優(yōu)先權日2010年7月8日發(fā)明者加藤守,柴田秀哉,郡光則申請人:三菱電機株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1