亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

生成裝置、生成方法、檢索裝置和檢索方法與流程

文檔序號:11733375閱讀:204來源:國知局
生成裝置、生成方法、檢索裝置和檢索方法與流程
本文討論的實施方式涉及數(shù)據(jù)檢索技術(shù)。

背景技術(shù):
關(guān)于電子書、電子詞典等的全文檢索和索引檢索,已經(jīng)公開了利用指示關(guān)聯(lián)關(guān)系的索引信息來壓縮檢索對象文件的這種技術(shù),其中,該關(guān)聯(lián)關(guān)系指示文件組中的哪個文件包括檢索字符串的字符信息。例如,在檢索字符串中包括特定字符信息C的情況下,被指示在預(yù)先生成的索引信息中包括字符信息C的文件被設(shè)置為基于檢索字符串的字符串檢索的檢索對象。另一方面,顯而易見的是,即使不執(zhí)行字符串檢索,索引信息中未指示包括上述字符信息C的文件不包括該檢索字符串。因此,索引信息中未指示包括字符信息C的文件被從字符串檢索的對象中排除。索引信息的示例包括基于針對各個文件分配的各個比特的值來指示文件組中的哪個文件包括字符信息的索引信息。在該索引信息中,按照文件編號的順序排列比特的比特列對應(yīng)于各條字符信息。在文件編號對應(yīng)于比特列中的值為“1”的比特的文件中,存在與該比特列對應(yīng)的字符信息。另一方面,在文件編號對應(yīng)于值為“0”的比特的對象文件中,不存在與該比特列對應(yīng)的字符信息。而且,存在這樣的情況,即,索引信息包括指示哪個文件包括具有多個字符的字符信息的比特列。例如,在針對雙字符的字符信息的情況下,包括多個字符的字符信息是“ab”、“七夕”、“夕祭”、“祭“ri””(初始規(guī)范中,七、夕和祭中的每一個表達(dá)與一個字符碼對應(yīng)的中文字符,“ri”表達(dá)與一個字符碼(UTF-8中的0xE3828A)對應(yīng)的平假名字符り)等。在存在包括單詞“about”的文件F的情況下,將與諸如“ab”和“bo”的字符信息對應(yīng)的比特列中的對應(yīng)于文件F的比特設(shè)置為“1”。而且,在文件F包括單詞“七夕祭“ri””的情況下,將與“七夕”、“夕祭”和“祭“ri””中的每一個對應(yīng)的比特列中的對應(yīng)于文件F的比特設(shè)置為“1”。例如,在利用檢索字符串“七夕祭“ri””執(zhí)行對文件組的檢索的情況下,針對包括在檢索字符串“七夕祭“ri””中的各條字符信息“七夕”、“夕祭”和“祭“ri””來參照索引信息的對應(yīng)部分。作為參照的結(jié)果,針對被指示在索引信息中包括“七夕”、“夕祭”和“祭“ri””中的全部的文件執(zhí)行利用檢索字符串“七夕祭“ri””的字符串檢索(將對應(yīng)于“七夕”、“夕祭”和“祭“ri””中的每一個的比特設(shè)置為“1”)。在諸如html的標(biāo)記語言中,利用通過文本等表達(dá)的標(biāo)簽來指定文本的修改信息(對字符尺寸、組成狀態(tài)等的指定)。基于修改信息的修改的示例包括這樣的修改,即,具有一個含義的語言單位(構(gòu)成語言的單位,諸如單詞和字符)利用采用多種不同的表述(notation)的字符信息(例如,利用閱讀設(shè)置的字符串的表述、利用拼音設(shè)置的中文的表述等)來書寫。在通過標(biāo)記語言編寫的文本中,通過標(biāo)簽指定表述(諸如顯示位置和顯示尺寸的顯示規(guī)則)。例如,在將ruby注解設(shè)置至字符串的情況下,通過標(biāo)簽來區(qū)分是針對閱讀字符指定的表述還是針對要設(shè)置閱讀的字符(親字符)指定的表述?;谥付╮uby注解的標(biāo)簽,親字符和閱讀字符(或表述)按后寫(adscript)形式來設(shè)置。換句話說,親字符與閱讀字符一起被寫下。在html文件中,例如,與文件F中的字符信息“七夕祭“ri””對應(yīng)的部分通過諸如“<ruby><rb>七夕</rb><rp>(</rp><rt>“ta”“na”“ba”“ta”</rt><rp>)</rp><rb>祭</rb><rp>(</rp><rt>“ma”“tsu”</rt><rp>)</rp></ruby>“ri””的描述(描述D1)來表達(dá)。在描述D1的情況下,“七夕”是親字符,而““ta”“na”“ba”“ta””(“ta”“na”“ba”“ta”中的每一個以及“ri”表達(dá)初始規(guī)范中的一個平假名字符)是閱讀字符。通過利用這種表達(dá)指定閱讀,一起顯示多個不同的表述(“七夕”和““ta”“na”“ba”,“祭“ri””和““ma”“tsu”“ri””)。在排除標(biāo)簽信息時,描述D1是“七夕…“ta”“na”“ba”“ta”…祭…“ma”“tsu”…“ri””。例如,當(dāng)在不包括標(biāo)簽信息的情況下生成與每一條雙字符信息對應(yīng)的索引信息時,針對“七夕”、“夕“ta””、““ta”“na””、““na”“ba””、““ba”“ta””、““ta”祭”、“祭“ma””、““ma”“tsu””和““tsu”“ri””中的每一個,將與文件F對應(yīng)的比特設(shè)置為“1”。然而,由于存在修改信息,所以描述D1不包括諸如“夕祭”的字符信息。因此,出現(xiàn)這種可能性,即,包括上述文本的文件未被提取為諸如“七夕祭“ri””的檢索字符串的檢索對象。在字符串檢索中,已經(jīng)公開了這樣的技術(shù),即,用于在沒有閱讀的情況下區(qū)分字符串的信息、親字符以及閱讀字符與每一條字符信息(標(biāo)簽除外)相關(guān)聯(lián),以便僅針對與區(qū)分信息相關(guān)聯(lián)的字符(該字符與和該檢索字符串的開頭字符一致的字符相同)核對該檢索字符串。當(dāng)檢索字符串的開頭與親字符在核對處理中彼此一致時,跳過對直到跟在親字符之后的閱讀字符的核對,而執(zhí)行對跟在所跳過的閱讀字符之后的字符信息的核對。在描述D1中,將親字符和閱讀字符設(shè)置在一起,如“七夕”和““ta”“na”“ba”“ta””,使得所顯示的字符信息包括““ta”“na”“ba”“ta””和“祭“ri””的序列以及“七夕”和““ma”“tsu”“ri””的序列。然而,通過從文件F的描述D1中排除標(biāo)簽信息而獲取的文本“七夕…“ta”“na”“ba”“ta”…祭…“ma”“tsu”…“ri””不包括““ta”祭”和“夕“ma””。因此,即使在生成索引信息時跳過包括指定閱讀(““ta”“na”“ba”“ta””和““ma”“tsu””或者“七夕”和祭)的描述部分,在檢索字符串是““ta”“na”“ba”“ta”祭“ri””或“七夕“ma”“tsu”“ri””時,文件F不被選擇為檢索對象。例如,已經(jīng)公布了日本特開2003-330917號公報、日本特開2011-138230號公報、國際公開2006/123429號公報以及國際公開2008/090606號公報。

技術(shù)實現(xiàn)要素:
根據(jù)本發(fā)明的一方面,一種生成裝置包括:處理器,該處理器被構(gòu)造為生成指示包括多個連續(xù)字符的字符信息被包括在文件中的存在信息,并且在第一并記(adscriptdesignation)和跟在該第一并記之后的第二并記被包括在所述文件中,所述第一并記指定第一字符信息與第二字符信息一起寫下,所述第二并記指定第三字符信息與第四字符信息一起寫下的情況下,生成指示另一字符信息被包括在所述文件中的另一存在信息,所述另一字符信息包括所述第一字符信息的末尾部分和跟在所述末尾部分之后的所述第四字符信息的開頭部分。本發(fā)明的目的和優(yōu)點將通過在權(quán)利要求書中具體指出的元件和組合而實現(xiàn)和獲得。應(yīng)當(dāng)明白,以上總體描述和以下詳細(xì)描述這兩者是示例性和解釋性的,并且不是對要求保護的本發(fā)明的限制。附圖說明圖1A例示了索引信息和基于該索引信息生成的比特列的示例;圖1B例示了索引信息和基于該索引信息生成的比特列的示例;圖2例示了計算機的功能框的示例;圖3例示了生成單元的功能框的示例;圖4例示了文件編號與文件路徑之間的關(guān)聯(lián)關(guān)系;圖5例示了壓縮(narrow-down)單元的功能框的示例;圖6A例示了用于索引生成的自動機(automaton)的示例;圖6B例示了用于索引生成的自動機的示例;圖6C例示了用于索引生成的自動機的示例;圖7A例示了利用自動機的確定處理;圖7B例示了利用自動機的確定處理;圖7C例示了利用自動機的確定處理;圖8例示了計算機的硬件構(gòu)造的示例;圖9例示了在計算機中操作的軟件的構(gòu)造示例;圖10例示了索引生成的處理過程示例;圖11例示了檢索處理的處理過程示例;圖12例示了索引參照的處理過程示例;圖13例示了指示與檢索字符串一致的部分的列表的示例;圖14A例示了文件中是否包括字符信息的確定處理過程的示例;圖14B例示了文件中是否包括字符信息的確定處理過程的示例;圖15A例示了用于提取包括在文件中的字符信息的提取處理;圖15B例示了用于提取包括在文件中的字符信息的提取處理;圖15C例示了用于提取包括在文件中的字符信息的提取處理;圖16A例示了用于索引生成的自動機的示例;圖16B例示了用于索引生成的自動機的示例;圖17A例示了利用自動機的確定處理;圖17B例示了利用自動機的確定處理;圖18例示了利用自動機的確定處理;圖19例示了自動機的數(shù)據(jù)構(gòu)造示例;以及圖20例示了自動機的生成過程的示例。具體實施方式首先,對利用索引信息對檢索對象文件執(zhí)行的壓縮進行描述。圖1A例示了基于作為檢索對象的一組文件F1至Fn的索引信息I1。圖1A中示出的索引信息I1中的最高行指示文件編號。該文件編號對應(yīng)于作為檢索對象的該組文件F1至Fn中的各個文件。在該索引信息I1中,一組字符信息C1至Cm中的各條字符信息對應(yīng)于與該組文件F1至Fn中的各個文件中的字符信息的存在/不存在相關(guān)的比特列。例如,包括在該組字符信息C1至Cm中的字符信息Cj是由一個字符或多個字符的組合組成的字符串。另選的是,字符信息Cj可以是與該字符信息對應(yīng)的二進制碼的一部分。例如,該組字符信息C1至Cm包括組合了根據(jù)假定用途的字符(例如,分配了JIS碼的字符)的預(yù)定數(shù)量的字符的所有組合模式。而且,例如,該組字符信息C1至Cm包括高頻使用的基本單詞。例如,假定該組文件F1至Fn中的特定文件Fi(文件編號為i)包括字符串“七夕祭“ri””。在這種情況下,文件Fi包括作為七、夕、祭和“ri”的多條字符信息,并且還包括作為”七夕”、“夕祭”和“祭“ri””的多條字符信息。在該實施方式中,例示了該組字符信息C1至Cm中的各條字符信息是針對雙字符的字符信息的情況。針對編號1至n中的各個編號i,將有關(guān)字符信息Cj是否被包括在文件Fi中的信息存儲在與字符信息Cj和文件Fi對應(yīng)的存儲區(qū)域中,由此指示該組文件F1至Fn中的多個文件當(dāng)中的哪個文件包括字符信息Cj。例如,在該索引信息I1中,與字符信息Cj是否被包括在文件Fi中有關(guān)的存在/不存在信息的存儲目標(biāo)的地址用地址Pj和文件編號i表示,該地址Pj通過將與字符信息Cj對應(yīng)的二進制碼代入到散列函數(shù)中而獲取。例如,與字符信息“七夕”對應(yīng)的二進制碼(基于JIS的字符碼)是0x3C374D2C(0x指示十六進制表述)。而且,“七夕”的二進制碼在UTF-16中是0x4E035915。在將一個地址Pj分配給一條字符信息Cj的情況下,字符信息Cj的存在/不存在信息被表達(dá)如下。當(dāng)文件Fi中存在字符信息Cj時,存在/不存在信息用值為“1”的比特來表達(dá)。當(dāng)文件Fi中不存在字符信息Cj時,存在/不存在信息用值為“0”的比特來表達(dá)。還存在將多條字符信息(例如,字符信息Cj和字符信息Ck)分配給一個地址Pj的情況。在這種情況下,當(dāng)文件Fi中存在字符信息Cj和字符信息Ck中的至少一個時,存在/不存在信息用值為“1”的比特來表達(dá),而當(dāng)文件Fi中既不存在字符信息Cj也不存在字符信息Ck時,存在/不存在信息用值為“0”的比特來表達(dá)。這里,可以任意地改變存在/不存在信息的表達(dá)。不存在可以用值為“1”的比特來表達(dá),而存在可以用值為“0”的比特來表達(dá)。而且,存在/不存在可以用多個比特來表達(dá)。在圖1A中示出的索引信息中,包括字符信息用值為“1”的比特來表達(dá)。例如,當(dāng)與地址Pj對應(yīng)的字符信息僅為“七夕”時,變得明顯的是,根據(jù)在索引信息I1的地址Pj中表達(dá)的比特列,“七夕”被包括在文件編號為2、3和i的文件中的每一個文件中。而且,例如,當(dāng)僅“夕祭”對應(yīng)于一個地址Pk時,索引信息I1的地址Pk中表達(dá)的比特列表示該組文件F1至Fn中的各個文件是否包括“夕祭”。例如,表示了文件編號為i和n-1的文件包括“夕祭”,而文件編號為1、2、3、j、k等的文件不包括“夕祭”。如圖1A所示,同樣,文件Fi包括除“七夕”以外的其它字符信息,使得不僅與字符信息“七夕”而且與諸如“夕祭”、“祭“ri””等的其它多條字符信息對應(yīng)的位置上的比特具有值“1”。而且,關(guān)于該組文件F1至Fn,與被包括在各個文件中的字符信息對應(yīng)的位置上的比特具有值“1”,盡管圖1A中省略了其描述。當(dāng)針對該組文件F1至Fn執(zhí)行檢索時,利用圖1A中示出的索引信息I1對要作為字符串檢索的檢索對象的文件進行壓縮。例如,假定接收到包括檢索字符串“七夕祭”的檢索請求。檢索字符串“七夕祭”包括字符信息“七夕”和字符信息“夕祭”。在這種情況下,例如,要作為字符串檢索的對象的文件基于在基于“七夕”計算出的地址(圖1A中的Pj)中表達(dá)的比特列以及在基于“夕祭”計算出的地址(圖1A中的Pk)中表達(dá)的比特列來進行壓縮。例如,如圖1B表達(dá)了作為和地址Pj對應(yīng)的比特列與和地址Pk對應(yīng)的比特列之間的邏輯與(AND)運算的結(jié)果的比特列A1。在圖1B中示出的比特列A1中,與值為“1”的比特對應(yīng)的文件(圖1B中,文件編號為i的文件)是要作為字符串檢索的對象的文件。與基于索引信息I1計算出的比特列A1中的值為“0”的比特對應(yīng)的文件,即,明顯不包括字符信息“七夕”和“夕祭”中的至少一個的文件被從檢索對象中排除。這同樣適用于利用半角(half-size)字符的情況。例如,假定文件Fi包括字符串“BIOS(BASICINPUT/OUTPUTSYSTEM)”。例如,在該索引信息I1中,在基于字符信息“INPU”和文件編號i計算出的地址Pj上表達(dá)的位置上的比特具有值“1”。而且,例如,在基于字符信息“OUTP”和文件編號i計算出的地址Pk上表達(dá)的位置上的比特具有值“1”。當(dāng)檢索字符串是“INPUT/OUTPUT”時,例如,分別與“INPU”和“OUTP”對應(yīng)的比特列根據(jù)索引信息I1獲取,而比特列A1(參照圖1B)通過各個比特列的邏輯與(AND)來計算。明顯不包括“INPU”和“OUTP”中的至少一個的文件(在比特列中值為“0”的文件)基于比特列A1被從檢索對象中排除。如上所述,諸如超文本標(biāo)記語言(html)的標(biāo)記語言包括這樣的修改,即,例如,利用多個不同表述的字符信息來書寫具有一個含義的單詞或字符(例如,顯示設(shè)置有閱讀的字符串、顯示設(shè)置有拼音的中文等)。當(dāng)使用這種修改時,在文檔數(shù)據(jù)中連續(xù)地提供作為同一單詞的不同表述的多條字符信息。例如,正常情況下,跟在“七夕”之后的字符信息是“祭“ri””或““ma”“tsu”“ri””。然而,利用標(biāo)記語言的描述D1是“七夕…“ta”“na”“ba”“ta”…祭…“ma”“tsu”…“ri””,使得跟在“七夕”之后的字符信息是““ta”“na”“ba”“ta””。結(jié)果,在該索引信息I1中,針對包括描述“七夕…“ta”“na”“ba”“ta”…祭…“ma”“tsu”…“ri””的文件Fi,與“夕祭”對應(yīng)的比特和與“夕“ma””對應(yīng)的比特具有值“0”。因此,當(dāng)基于諸如“七夕祭“ri””或“七夕“ma”“tsu”“ri””的檢索字符串壓縮文件時,例如,確定既不包括“夕祭”也不包括“夕“ma””。因此,在檢索字符串“七夕祭“ri””和“七夕“ma”“tsu”“ri””這兩種情況下,從字符串檢索的對象中排除文件Fi。在根據(jù)文件Fi的顯示中,確定“七夕”和“祭“ri””的組合、““ta”“na”“ba”“ta””和“祭“ri””的組合以及“七夕”和““ma”“tsu”“ri””的組合都不被包括在文件Fi中,即使這些組合是連續(xù)字符信息。相反,關(guān)于諸如“夕“ta””和“祭“ma””的字符信息,確定文件Fi中連續(xù)存在當(dāng)根據(jù)按照標(biāo)簽信息的指定顯示時不連續(xù)的多條字符信息。不僅在日本文檔中而且在中文文檔和英文文檔中也采用提供多個不同表述的顯示。例如,在英文中,針對縮寫提供閱讀。存在針對縮寫“BIOS”提供諸如“BASICINPUT/OUTPUTSYSTEM”的閱讀的情況。在這種情況下,文件Fi包括描述D2,諸如“<ruby><rb>B</rb><rp>(</rp><rt>BASIC</rt><rp>)</rp><rb>I</rb><rp>(</rp><rt>INPUT/</rt><rp>)</rp><rb>O</rb><rp>(</rp><rt>OUTPUT</rt><rp>)</rp><rb>S</rb><rp>(</rp><rt>SYSTEM</rt><rp>)</rp></ruby>”。同樣在這種情況下,僅通過排除標(biāo)簽來獲取“BBASICIINPUT/OOUTPUTSSYSTEM”,如針對日文的情況。不利的是,確定文件Fi中連續(xù)地存在當(dāng)根據(jù)按照標(biāo)簽信息的指定顯示時不連續(xù)地存在的多條字符信息,而文件Fi中不連續(xù)地存在當(dāng)根據(jù)按照標(biāo)簽信息的指定顯示時連續(xù)地存在的多條字符信息。當(dāng)基于“BBASICIINPUT/OOUTPUTSSYSTEM”生成指示在有關(guān)針對四個英文字符的每一條字符信息的各個文件中是否存在字符信息的索引信息時,這指示包括諸如“INPU”、“PUT/”和“TPUT”的多條字符信息。然而,確定描述D2中不包括諸如“CIOS”和“IOSY”的字符信息,而確定描述D2中包括字符信息“SSYS”。例如,當(dāng)檢索字符串是“BASICIOSYSTEM”時,確定描述D2中不包括“CIOS”和“IOSY”,從而導(dǎo)致文件Fi被從字符串檢索的對象中排除的可能性。而且,存在不僅“BBASICIINPUT/OOUTPUTSSYSTEM”(包括“SSYS”)而且“STOLE(包括“STOL”和“TOLE”)”、“ODYSSEY(包括“DYSS”)”等一起被包括在文件Fi中的情況。例如,當(dāng)檢索字符串是“DYSSYSTOLE”時,即使文件Fi不包括“DYSSYSTOLE”,也因文件Fi包括“DYSS”、“SSYS”、“STOL”和“TOLE”而存在文件Fi被選擇為字符串檢索的對象的可能性。假定被包括在一組文件F1至Fn中的文件Fi包括指定單詞V1的多個表述(表述W1和表述W2)和指定設(shè)置跟在單詞V1之后的、單詞V1的表述W1和表述W2這兩者。應(yīng)用至上述示例,表述W1是設(shè)置閱讀的親字符,而表述W2是閱讀字符。而且,例如,單詞V1是“七夕”。單詞V1按表述W1的字符信息CR1寫為“七夕”并且按表述W2的字符信息CR2寫為““ta”“na”“ba”“ta””。而且,例如,單詞V2是祭。單詞V2按表述W1的字符信息CR3寫為祭并且按表述W2的字符信息CR4寫為““ma”“tsu””。在該實施方式中,執(zhí)行從文件Fi提取字符信息CR3的開頭部分跟在字符信息CR1的末尾部分之后的[1]字符信息和字符信息CR2的開頭部分跟在字符信息CR1的末尾部分之后的[2]字符信息這兩者的過程。而且,在本實施方式中,既不提取字符信息CR2的開頭部分跟在字符信息CR1的末尾部分之后的[3]字符信息,也不提取字符信息CR4的開頭部分跟在字符信息CR3的末尾部分之后的[4]字符信息。而且,執(zhí)行用于在索引信息中將與所提取的字符信息對應(yīng)的比特列中的與文件Fi對應(yīng)的比特設(shè)置為“1”的過程。而且,執(zhí)行用于利用通過上述過程生成的索引信息來壓縮要作為檢索對象的文件的處理。圖2例示了執(zhí)行該實施方式的上述處理的計算機1的功能性構(gòu)造。計算機1包括處理單元11和存儲單元12。存儲單元11生成索引信息并且利用所生成的索引信息執(zhí)行檢索。存儲單元12存儲用于處理單元11的處理的信息(例如,要作為檢索對象的一組文件F1至Fn以及索引信息)。處理單元11包括生成單元13。生成單元13生成索引信息,以將該索引信息存儲在存儲單元12中。圖3例示了生成單元13的功能框的示例。生成單元13包括控制單元131、讀出單元132和確定單元133??刂茊卧?31確保存儲單元12中的存儲區(qū)域,并且從文件F1至文件Fn順序地指定多個文件,以允許讀出單元132和確定單元133執(zhí)行針對所指定的文件的相應(yīng)處理。讀出單元132從存儲單元12讀出該組文件F1至Fn中的由控制單元131指定的文件Fi。確定單元133針對設(shè)置的該組字符信息C1至Cm中的各條字符信息Cj,來確定文件Fi是否包括字符信息Cj。該確定處理稍后將參照圖6A至6C以及圖7A至7C進行描述。當(dāng)確定文件Fi包括字符信息Cj時,控制單元131將指示包括字符信息Cj的信息存儲在確保的多個存儲區(qū)域當(dāng)中的、由基于字符信息Cj和文件Fi的文件編號i計算出的地址表達(dá)的存儲區(qū)域中。圖4例示了存儲文件編號與文件路徑之間的關(guān)聯(lián)關(guān)系的表T1的示例。當(dāng)通過控制單元131指定文件編號時,讀出單元132基于表T1中的所指定的文件編號和與所指定的文件編號對應(yīng)的文件路徑,來指定要作為讀出對象的文件。如圖2中示出,處理單元11還包括檢索控制單元14、壓縮單元15和字符串檢索單元16。檢索控制單元14控制壓縮單元15和字符串檢索單元16,以執(zhí)行與檢索請求對應(yīng)的檢索處理。壓縮單元15利用由生成單元13生成的索引信息來壓縮檢索對象文件。例如,檢索控制單元14從被包括在所接收到的檢索請求中的檢索字符串提取字符信息Ca,并向壓縮單元15通知所提取的字符信息Ca。壓縮單元15向檢索控制單元14通知該組文件F1至Fn當(dāng)中的、除了不包括從檢索控制單元14通知的字符信息Ca的文件以外的其它文件的文件編號。例如,壓縮單元15從索引信息讀出與字符信息Ca對應(yīng)的比特列,以向檢索控制單元14通知與值為“1”的比特對應(yīng)的文件編號。檢索控制單元14向字符串檢索單元16通知通過由壓縮單元15執(zhí)行的壓縮而獲取的文件編號。字符串檢索單元16針對從檢索控制單元14通知的文件,基于由檢索控制單元14接收到的檢索請求,來執(zhí)行字符串檢索。圖5例示了壓縮單元15的功能框的示例。壓縮單元15包括參照單元151和確定單元152。參照單元151從存儲在存儲單元12中的索引信息讀出與從檢索控制單元14通知的字符信息Ca對應(yīng)的部分。例如,通過將字符信息Ca的二進制碼代入散列函數(shù)來獲取表示與字符信息Ca對應(yīng)的部分的地址。確定單元152基于由參照單元151讀取的比特列確定不包括字符信息Ca的文件,以向字符串檢索單元16通知該組文件F1至Fn當(dāng)中的、除了不包括字符信息Ca的文件以外的其它文件的文件編號。例如,確定單元152向字符串檢索單元16通知與被包括在比特列中的多個比特當(dāng)中的值為“1”的比特對應(yīng)的文件編號。檢索控制單元14可以從檢索字符串中提取多條字符信息(例如,字符信息Ca和字符信息Cb)。在這種情況下,參照單元151針對多條字符信息Ca和Cb中的每一個,從索引信息讀出對應(yīng)比特列。而且,確定單元152計算被包括在與字符信息Ca對應(yīng)的比特列中的存在/不存在信息與被包括在與字符信息Cb對應(yīng)的比特列中的存在/不存在信息之間的邏輯與(AND),以基于該計算結(jié)果來確定各個文件中的字符信息Ca和Cb的存在/不存在。按照文件不包括字符信息Ca和字符信息Cb中的任一個的方式確定的文件的文件編號未被通知給字符串檢索單元16。現(xiàn)在描述確定單元133的用于確定文件Fi是否包括被包括在一組字符信息C1至Cm中的字符信息Cj的處理。圖6A至圖6C分別例示了基于字符信息Cj生成的自動機。自動機表達(dá)各個狀態(tài)下的狀態(tài)轉(zhuǎn)換的條件。在特定狀態(tài)下,執(zhí)行從該特定狀態(tài)至與和讀出的字符信息一致的轉(zhuǎn)換條件對應(yīng)的狀態(tài)的轉(zhuǎn)換。圖6A例示了基于字符信息“夕祭”生成的自動機。圖6A中示出的自動機表示當(dāng)在初始狀態(tài)(0)中從文件Fi讀出字符信息夕時,執(zhí)行從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換。而且,圖6A中示出的自動機表示當(dāng)在初始狀態(tài)(0)中讀出除了字符信息夕以外的其它字符信息時,再次執(zhí)行針對初始狀態(tài)(0)的轉(zhuǎn)換。按照類似的方式,圖6A中示出的自動機表示,在狀態(tài)(1)中,當(dāng)讀出字符信息祭時執(zhí)行針對狀態(tài)(F)的轉(zhuǎn)換,而當(dāng)讀出字符信息夕時執(zhí)行針對狀態(tài)(1)的轉(zhuǎn)換。而且,圖6A中示出的自動機表示當(dāng)在狀態(tài)(1)中讀出除了字符信息夕或祭以外的其它字符信息時,再次執(zhí)行針對初始狀態(tài)(0)的轉(zhuǎn)換。狀態(tài)(F)指示通過自動機完成核對。當(dāng)自動機的狀態(tài)變?yōu)闋顟B(tài)(F)時,確定單元133確定文件Fi中存在與“夕祭”一致的字符串。圖6B例示了基于字符信息“夕“ma””生成的自動機。圖6B中示出的自動機表示當(dāng)在初始狀態(tài)(0)中從文件Fi讀出字符信息夕時,執(zhí)行從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換。而且,圖6B中示出的自動機表示當(dāng)在初始狀態(tài)(0)中讀出除了字符信息夕以外的其它字符信息時,再次執(zhí)行針對初始狀態(tài)(0)的轉(zhuǎn)換。按照類似的方式,圖6B中示出的自動機表示,在狀態(tài)(1)中,當(dāng)讀出字符信息“ma”時執(zhí)行針對狀態(tài)(F)的轉(zhuǎn)換,而當(dāng)讀出字符信息夕時執(zhí)行針對狀態(tài)(1)的轉(zhuǎn)換。而且,圖6B中示出的自動機表示當(dāng)在狀態(tài)(1)中讀出除了字符信息夕或“ma”以外的其它字符信息時,再次執(zhí)行針對初始狀態(tài)(0)的轉(zhuǎn)換。當(dāng)自動機的狀態(tài)變?yōu)闋顟B(tài)(F)時,確定單元133確定文件Fi中存在與“夕“ma””一致的字符串。圖6C例示了基于字符信息“夕“ta””生成的自動機。圖6C中示出的自動機表示當(dāng)在初始狀態(tài)(0)中從文件Fi讀出字符信息夕時,執(zhí)行從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換。而且,圖6C中示出的自動機表示當(dāng)在初始狀態(tài)(0)中讀出除了字符信息夕以外的其它字符信息時,再次執(zhí)行針對初始狀態(tài)(0)的轉(zhuǎn)換。按照類似的方式,圖6C中示出的自動機表示,在狀態(tài)(1)中,當(dāng)讀出字符信息“ta”時執(zhí)行針對狀態(tài)(F)的轉(zhuǎn)換,而當(dāng)讀出字符信息夕時執(zhí)行針對狀態(tài)(1)的轉(zhuǎn)換。而且,圖6C中示出的自動機表示當(dāng)在狀態(tài)(1)中讀出除了字符信息夕或“ta”以外的其它字符信息時,再次執(zhí)行針對初始狀態(tài)(0)的轉(zhuǎn)換。當(dāng)自動機的狀態(tài)變?yōu)闋顟B(tài)(F)時,確定單元133確定文件Fi中存在與“夕“ta””一致的字符串。圖7A例示了在確定單元133的確定處理中,圖6A中示出的自動機的狀態(tài)變化。將指示狀態(tài)(狀態(tài)信息)的信息存儲在存儲區(qū)域(000至011)中。編號000至111是二進制數(shù),并且是指示作為多條狀態(tài)信息的存儲目標(biāo)的各個存儲區(qū)域的地址。圖7A例示了在對被包括在文件Fi中的描述D1“<ruby><rb>七夕</rb><rp>(</rp><rt>“ta”“na”“ba”“ta”</rt><rp>)</rp><rb>祭</rb><rp>(</rp><rt>“ma”“tsu”</rt><rp>)</rp></ruby>“ri””進行核對時的狀態(tài)信息變化。這里,圖7A至圖7C的例示不包括<rp>標(biāo)簽。假定在對描述D1進行核對之前的狀態(tài)信息是這樣的,即,狀態(tài)(0)僅被存儲在存儲區(qū)域000中(S1)。當(dāng)從文件Fi讀出<rb>標(biāo)簽時,確定單元133將存儲在存儲區(qū)域000中的狀態(tài)信息復(fù)制到存儲區(qū)域001上(S2)。隨后,確定單元133從文件Fi讀出七,并更新存儲在存儲區(qū)域000中的狀態(tài)信息。存儲在該存儲區(qū)域中的狀態(tài)是狀態(tài)(0)并且不與轉(zhuǎn)換條件夕一致,使得確定單元133將存儲區(qū)域000的狀態(tài)信息設(shè)置為狀態(tài)(0)。接著,確定單元133從文件Fi讀出夕,并更新存儲在存儲區(qū)域000中的狀態(tài)信息。在這種情況下,從文件Fi讀出的夕與狀態(tài)(0)中的轉(zhuǎn)換條件一致,使得確定單元133將存儲區(qū)域000的狀態(tài)信息更新至狀態(tài)(1)(S3)。當(dāng)確定單元133從文件Fi讀出<rt>標(biāo)簽時,確定單元133將更新對象的存儲區(qū)域從存儲區(qū)域000移位至存儲區(qū)域001。確定單元133順序地讀出字符信息“ta”、“na”、“ba”和“ta”,并且更新存儲區(qū)域001的狀態(tài)信息。然而,“ta”、“na”、“ba”和“ta”都不與初始狀態(tài)(0)中的轉(zhuǎn)換條件夕一致,使得存儲區(qū)域001的狀態(tài)信息仍保持在狀態(tài)(0)(S4)。當(dāng)確定單元133從文件Fi讀出<rb>標(biāo)簽時,確定單元133還復(fù)制存儲區(qū)域。確定單元133將存儲區(qū)域000的狀態(tài)信息復(fù)制到存儲區(qū)域010上,并將存儲區(qū)域001的狀態(tài)信息復(fù)制到存儲區(qū)域011上(S5)。接著,確定單元133從文件Fi讀出祭,并更新存儲在存儲區(qū)域000中的狀態(tài)信息。在這種情況下,從文件Fi讀出的祭與狀態(tài)(1)中的轉(zhuǎn)換條件一致,使得確定單元133將存儲區(qū)域000的狀態(tài)信息更新至狀態(tài)(F)。而且,確定單元133同樣對存儲在存儲區(qū)域001中的狀態(tài)信息進行更新。存儲在該存儲區(qū)域中的狀態(tài)是狀態(tài)“0”并且不與轉(zhuǎn)換條件夕一致,使得確定單元133將存儲區(qū)域001的狀態(tài)信息設(shè)置為狀態(tài)(0)(S6)。在S6,將狀態(tài)(F)的狀態(tài)信息存儲在該存儲區(qū)域中,使得確定單元133確定文件Fi包括字符信息“夕祭”。當(dāng)確定單元133從文件Fi讀出<rt>標(biāo)簽時,確定單元133將更新對象的存儲區(qū)域從存儲區(qū)域000和存儲區(qū)域001移位至存儲區(qū)域010和存儲區(qū)域011。確定單元133從文件Fi順序地讀出字符信息“ma”和“tsu”,并更新存儲區(qū)域010和存儲區(qū)域011的狀態(tài)信息。然而,“ma”和“nor”都不與初始狀態(tài)(0)中的轉(zhuǎn)換條件夕一致,使得存儲區(qū)域010的狀態(tài)信息和存儲區(qū)域011的狀態(tài)信息仍保持在狀態(tài)(0)(S7)。而且,當(dāng)確定單元133從文件Fi讀出</ruby>標(biāo)簽時,確定單元133將存儲各條狀態(tài)信息的存儲區(qū)域000至011設(shè)置為更新對象的存儲區(qū)域。確定單元133從文件Fi讀出字符信息“ri”,并對存儲在存儲區(qū)域000至011中的各條狀態(tài)信息進行更新(S8)。確定單元133可以在針對如S6中示出的狀態(tài)(F)的轉(zhuǎn)換中,停止基于圖6A的自動機的以下確定處理。這是因為針對狀態(tài)(F)的轉(zhuǎn)換表示文件Fi明顯包括“夕祭”。例如,基于以下尋址,執(zhí)行對與讀出<rb>標(biāo)簽對應(yīng)的狀態(tài)信息的復(fù)制和對與讀出<rt>標(biāo)簽對應(yīng)的更新對象的存儲區(qū)域的移位。例如,根據(jù)作為復(fù)制源的存儲區(qū)域和復(fù)制的重復(fù)次數(shù)來確定狀態(tài)信息的作為復(fù)制目標(biāo)的存儲區(qū)域。例如,在第一復(fù)制中,地址的最低數(shù)位的值為“0”的存儲區(qū)域是復(fù)制源,而地址的最低數(shù)位的值為“1”的存儲區(qū)域是復(fù)制目標(biāo)。在第一復(fù)制中,將存儲在存儲區(qū)域000中的狀態(tài)信息復(fù)制到存儲區(qū)域001上。在第一復(fù)制之后,確定單元133根據(jù)地址的最低數(shù)位的值來對更新對象進行移位。當(dāng)讀出插入在<rb>標(biāo)簽之間的字符信息時,對存儲在地址的最低數(shù)位的值為“0”的存儲區(qū)域000中的狀態(tài)信息進行更新。當(dāng)讀出插入在<rt>標(biāo)簽之間的字符信息時,對存儲在地址的最低數(shù)位的值為“1”的存儲區(qū)域001中的狀態(tài)信息進行更新。當(dāng)進一步執(zhí)行復(fù)制(第二復(fù)制)時,將地址的第二最低數(shù)位的值為“0”的存儲區(qū)域(用諸如000和001的地址表達(dá))的狀態(tài)信息復(fù)制到地址的第二最低數(shù)位的值為“1”的存儲區(qū)域(用諸如010和011的地址表達(dá))上。在第二復(fù)制之后,確定單元133根據(jù)地址的第二最低數(shù)位對更新對象進行移位。當(dāng)讀出插入在<rb>標(biāo)簽之間的字符信息時,對存儲在地址的第二最低數(shù)位的值為“0”的存儲區(qū)域000中的狀態(tài)信息和存儲在地址的第二最低數(shù)位的值為“0”的存儲區(qū)域001中的狀態(tài)信息進行更新。而且,當(dāng)讀出插入在<rt>標(biāo)簽之間的字符信息時,對存儲在地址的第二最低數(shù)位的值為“1”的存儲區(qū)域010中的狀態(tài)信息和存儲在地址的第二最低數(shù)位的值為“0”的存儲區(qū)域011中的狀態(tài)信息進行更新。根據(jù)上述尋址,即使<rb>標(biāo)簽出現(xiàn)多次,通過基于插入在<rb>標(biāo)簽之間的字符信息的更新和基于插入在<rt>標(biāo)簽之間的字符信息的更新來使得能夠?qū)Ω聦ο蟮拇鎯^(qū)域進行移位。圖7B例示了在確定單元133的確定處理中,圖6B中示出的自動機的狀態(tài)變化。圖6B中示出的自動機被用于與如上所述的字符信息“夕“ma””的一致確定。圖7B例示了對如圖7A的情況的被包括在文件Fi中的描述D1進行核對時的狀態(tài)信息變化。從S1至S5,按照與圖7A中例示的狀態(tài)信息變化類似的方式,改變存儲在存儲區(qū)域000至011中的狀態(tài)信息。接著,確定單元133從文件Fi讀出祭,并對存儲在存儲區(qū)域000中的狀態(tài)信息進行更新。在這種情況下,從文件Fi讀出的祭與狀態(tài)(1)中的轉(zhuǎn)換條件“ma”不一致,使得確定單元133將存儲區(qū)域000的狀態(tài)信息更新至初始狀態(tài)(0)。而且,同樣,確定單元133對存儲在存儲區(qū)域001中的狀態(tài)信息進行更新。存儲在該存儲區(qū)域中的狀態(tài)是狀態(tài)“0”并且不與轉(zhuǎn)換條件夕一致,使得確定單元133將存儲區(qū)域001的狀態(tài)信息設(shè)置為狀態(tài)(0)(S6)。當(dāng)確定單元133從文件Fi讀出<rt>標(biāo)簽時,確定單元133將更新對象的存儲區(qū)域從存儲區(qū)域000和存儲區(qū)域001移位至地址的第二最低值為“1”的存儲區(qū)域010和存儲區(qū)域011。確定單元133從文件Fi順序地讀出字符信息“ma”,并更新存儲區(qū)域010和存儲區(qū)域011的狀態(tài)信息。字符信息“ma”與狀態(tài)(1)中的轉(zhuǎn)換條件“ma”一致,使得確定單元133將存儲區(qū)域010的狀態(tài)信息更新至狀態(tài)(F)。而且,字符信息“ma”與初始狀態(tài)(0)中的轉(zhuǎn)換條件夕不一致,使得存儲區(qū)域011的狀態(tài)信息仍保持在狀態(tài)(0)(S7)。在S7,將狀態(tài)(F)的狀態(tài)信息存儲在該存儲區(qū)域中,使得確定單元133確定文件Fi包括字符信息“夕“ma””。接著,確定單元133從文件Fi讀出字符信息“tsu”,并對存儲在存儲區(qū)域010中的狀態(tài)信息和存儲在存儲區(qū)域011中的狀態(tài)信息進行更新?!皌su”不與該轉(zhuǎn)換條件一致,使得確定單元133將存儲在存儲區(qū)域101和存儲區(qū)域011中的各條狀態(tài)信息更新至初始狀態(tài)(0)(S8)。而且,當(dāng)確定單元133從文件Fi讀出</ruby>標(biāo)簽時,確定單元133將存儲各條狀態(tài)信息的存儲區(qū)域000至011設(shè)置為更新對象的存儲區(qū)域。確定單元133從文件Fi讀出字符信息“ri”,并對存儲在存儲區(qū)域000至011中的每一個中的狀態(tài)信息進行更新(S9)。如上所述,確定單元133可以在針對如在S7中示出的狀態(tài)(F)的轉(zhuǎn)換中,停止基于圖6B的自動機的以下確定處理。這是因為針對狀態(tài)(F)的轉(zhuǎn)換表示文件Fi明顯包括“夕“ma””。圖7C例示了在確定單元133的確定處理中,圖6C中示出的自動機的狀態(tài)變化。圖6C中示出的自動機被用于與如上所述的字符信息“夕“ta””的一致確定。圖7C例示了對如圖7B的情況的被包括在文件Fi中的描述D1進行核對時的狀態(tài)信息變化。從S1至S6,按照與圖7B中例示的狀態(tài)信息變化類似的方式,改變存儲在存儲區(qū)域000至011中的狀態(tài)信息。當(dāng)確定單元133從文件Fi讀出<rt>標(biāo)簽時,確定單元133將更新對象的存儲區(qū)域從存儲區(qū)域000和存儲區(qū)域001移位至地址的第二最低值為“1”的存儲區(qū)域010和存儲區(qū)域011。確定單元133從文件Fi順序地讀出字符信息“ma”和“tsu”,并更新存儲區(qū)域010的狀態(tài)信息和存儲區(qū)域011的狀態(tài)信息。然而,“ma”和“tsu”都不與該轉(zhuǎn)換條件一致,使得存儲區(qū)域010的狀態(tài)信息和存儲區(qū)域011的狀態(tài)信息被設(shè)置為初始狀態(tài)(0)(S7)。而且,當(dāng)確定單元133從文件Fi讀出</ruby>標(biāo)簽時,確定單元133將存儲各條狀態(tài)信息的存儲區(qū)域000至011設(shè)置為更新對象的存儲區(qū)域。確定單元133從文件Fi讀出字符信息“ri”,并將存儲在存儲區(qū)域000至011中的每一個中的狀態(tài)信息更新至初始狀態(tài)(0)(S9)。在圖7A至圖7C中,例如,當(dāng)確定單元133讀出</ruby>標(biāo)簽時,確定單元133釋放存儲區(qū)域000至011當(dāng)中的存儲交疊狀態(tài)信息的存儲區(qū)域。例如,在圖7A的S8中,存儲區(qū)域001、存儲區(qū)域010和存儲區(qū)域011在被釋放時存儲與存儲區(qū)域000的狀態(tài)信息交疊的各條狀態(tài)信息。例如,當(dāng)存儲區(qū)域001、存儲區(qū)域010和存儲區(qū)域011被釋放時,僅針對存儲在存儲區(qū)域000中的狀態(tài)信息,基于文件Fi中的字符信息“ri”執(zhí)行對狀態(tài)信息的更新。已經(jīng)參照圖6A至圖6C以及圖7A至圖7C描述了用于確定文件Fi是否包括字符信息Cj的確定過程。上述示例例示了這樣的情況,即,針對具有一個含義的語言單位指定設(shè)置多種類型的表述的部分按照文檔數(shù)據(jù)中的“七夕…“ta”“na”“ba”“ta”…祭…“ma”“tsu”…“ri””連續(xù)。設(shè)置有多個表述的部分按照顯示中的“七夕祭“ri””、““ta”“na”“ba”“ta”祭“ri””、“七夕“ma”“tsu”“ri””或者““ta”“na”“ba”“ta”“ma”“tsu”“ri””閱讀。然而,該文檔數(shù)據(jù)包括“七夕…“ta”“na”“ba”“ta”…祭…“ma”“tsu”…“ri””,使得“七夕祭“ri””、““ta”“na”“ba”“ta”祭“ri””、“七夕“ma”“tsu”“ri””以及““ta”“na”“ba”“ta”“ma”“tsu”“ri””都不與“七夕…“ta”“na”“ba”“ta”…祭…“ma”“tsu”…“ri””一致。在上述確定處理中,確定設(shè)置有多個表述的連續(xù)部分當(dāng)中包括這樣的字符信息(例如,“夕“ma””),即,連續(xù)地設(shè)置了字符信息“七夕”的末尾(例如,夕)(作為指定了親字符表述的在前部分)和字符信息““ma”“tsu”“ri””的開頭(例如,“ma”)(作為指定了閱讀字符表述的后續(xù)部分)。因此,即使在如“七夕…“ta”“na”“ba”“ta”…祭…“ma”“tsu”…“ri””之間存在諸如““ta”“na”“ba”“ta””和祭的字符信息,也核對并提取諸如“七夕“ma”“tsu”“ri””的連續(xù)字符信息。關(guān)于上述末尾和開頭,足夠的是,作為指定了親字符表述的在前部分的字符信息和作為指定了閱讀字符表述的后續(xù)部分的字符信息是連續(xù)的。由此,字符的數(shù)量不受限。根據(jù)該實施方式的一個方面,在基于包括指定連續(xù)設(shè)置的多個表述的文件來顯示時,抑制了將該文件從包括按照連續(xù)方式顯示的多條字符信息的檢索字符串的檢索對象中排除。然而,該確定過程不限于該示例。可以采用任何確定過程,只要在該過程中從文件Fi提取了這樣的字符信息即可,即,字符信息Cb的表述2(例如,““ma”“tsu””中的“ma”)跟在字符信息Ca的表述1(例如,“七夕”的夕)之后的字符信息(例如,“夕“ma””),或者字符信息的表述1(例如,祭)跟在字符信息Ca的表述2(例如,““ta”“na”“ba”“ta””中的“ta”)之后的字符信息(例如,““ta”祭”)。另選的是,可以采用未從文件Fi中提取到這樣的字符信息的這種過程,即,字符信息Ca的表述2(例如,““ta”“na”“ba”“ta””中的“ta”)跟在字符信息Ca的表述1(例如,“七夕”的夕)之后的字符信息(例如,“夕“ta””),或者字符信息Cb的表述2(例如,““ma”“tsu””中的“ma”)跟在字符信息Cb的表述1(例如,祭)之后的字符信息(例如,“祭“ma””)。稍后參照圖15A至圖15C來描述與根據(jù)圖6A至圖6C和圖7A至圖7C中例示的確定的索引生成過程不同的另一索引生成過程。圖8例示了計算機1的硬件構(gòu)造和包括計算機1的系統(tǒng)的構(gòu)造。圖8中示出的系統(tǒng)包括計算機1、計算機2、存儲裝置3和網(wǎng)絡(luò)4。該組文件F1至Fn被存儲在計算機1的存儲單元12中,但是例如,該組文件F1至Fn可以存儲在經(jīng)由網(wǎng)絡(luò)4連接的存儲裝置3中。在這種情況下,讀出單元132不從存儲單元12而是從存儲裝置3讀出該組文件F1至Fn中的每一個文件。例如,圖2、圖3和圖5中示出的各個功能框通過圖8中示出的硬件構(gòu)造來實現(xiàn)。例如,計算機1包括處理器301、隨機存取存儲器(RAM)302、只讀存儲器(ROM)303、驅(qū)動裝置304、存儲介質(zhì)305、輸入接口(I/F)306、輸入裝置307、輸出接口(I/F)308、輸出裝置309、通信接口(I/F)310和總線311。各個硬件經(jīng)由總線311彼此連接。通信I/F310經(jīng)由網(wǎng)絡(luò)4執(zhí)行對通信的控制。輸入接口306與輸入裝置307連接,并且向處理器301發(fā)送從輸入裝置307接收到的輸入信號。輸出接口308與輸出裝置309連接,并且允許輸出裝置309執(zhí)行與處理器301的指令對應(yīng)的輸出。RAM302是可讀且可寫的存儲裝置,并且是諸如靜態(tài)RAM(SRAM)和動態(tài)RAM(DRAM)的半導(dǎo)體存儲器。另選的是,可以使用閃速存儲器來取代RAM。同樣,ROM包括可編程ROM(PROM)等。驅(qū)動裝置304對存儲在存儲介質(zhì)305中的信息執(zhí)行讀取和寫入中的至少一個。存儲介質(zhì)305存儲由驅(qū)動裝置304寫入的信息。例如,存儲介質(zhì)305是諸如硬盤、光盤(CD)、數(shù)字多功能光盤(DVD)和藍(lán)光光盤的存儲介質(zhì)。例如,計算機1還包括用于多種類型的存儲介質(zhì)中的每一種的驅(qū)動裝置304和存儲介質(zhì)305。輸入裝置307根據(jù)操作發(fā)送輸入信號。例如,輸入裝置307是諸如附接至計算機1的機身的鍵盤和按鈕的鍵裝置以及諸如鼠標(biāo)和觸摸板的指點裝置。輸出裝置309根據(jù)計算機1的控制輸出信息。例如,輸出裝置309是諸如顯示器的圖像輸出裝置(顯示裝置)、諸如揚聲器的音頻輸出裝置等。而且,例如,諸如觸摸屏的輸入/輸出裝置被用作輸入裝置307和輸出裝置309。另選的是,例如,輸入裝置307和輸出裝置309可以不被包括在計算機1中,而可以是從外部連接至計算機1的裝置。處理器301將存儲在ROM303和存儲介質(zhì)305中的程序讀出到RAM302上,并且根據(jù)所讀出的程序的過程執(zhí)行處理單元11的處理。這時,RAM302被用作處理器301的工作區(qū)。存儲單元12的功能被實現(xiàn)為使得ROM303和存儲介質(zhì)305存儲程序和該組文件F1至Fn,而RAM302被用作處理器301的工作區(qū)。參照圖9描述由處理器301讀出的程序。圖9例示了在計算機1中操作的軟件的構(gòu)造示例。在計算機1中操作控制圖9中示出的硬件組21的操作系統(tǒng)(OS)22。處理器301按照根據(jù)OS22的過程進行操作,以控制和管理硬件21。由此,通過硬件21執(zhí)行根據(jù)應(yīng)用程序和中間件的處理。而且,在計算機1中,將索引生成程序23a或檢索處理程序23b讀出到RAM302上,以由處理器301來執(zhí)行。而且,處理器301執(zhí)行基于索引生成程序23a的處理(該處理通過根據(jù)OS22控制硬件21來執(zhí)行),實現(xiàn)生成單元13的功能。處理器301執(zhí)行基于檢索處理程序23b的處理(該處理通過根據(jù)OS22控制硬件21來執(zhí)行),實現(xiàn)檢索控制單元14、壓縮單元15和字符串檢索單元16的功能。圖10例示了索引生成的處理過程示例。當(dāng)啟動索引生成程序23a時(S100),控制單元131執(zhí)行預(yù)處理(S101)。例如,S101的預(yù)處理是將圖4中示出的表T1和該組字符信息C1至Cm讀取到存儲單元12上的處理??刂茊卧?31確定是否請求生成索引信息(S102),并且重復(fù)執(zhí)行該確定,直到請求生成索引信息為止(S102:否)。當(dāng)請求生成索引信息時(S102:是),控制單元131確保用于存儲索引信息的存儲區(qū)域(S103)。例如,S103中確保的存儲區(qū)域中的各個比特被設(shè)置為“0”??刂茊卧?31從圖4中示出的表T1中選擇文件編號i,并且使得讀出單元132能夠讀出具有所選擇的文件編號i的文件Fi(S104)。例如,控制單元131在S104中依次選擇表T1的記錄。接著,確定單元133選擇作為字符信息C1至Cm中的一條字符信息的字符信息Cj(S105)。例如,在S105中,確定單元133可以從通過存儲單元12保持的字符信息C1至Cm的列表中依次選擇字符信息,或者可以在預(yù)定值范圍內(nèi)遞增字符碼,以依次生成字符信息。確定單元133確定文件Fi是否包括字符信息Cj(S106)。在S106中,按照圖7A至圖7C中例示的過程執(zhí)行確定處理。當(dāng)確定單元133確定文件Fi包括字符信息Cj時(S106:是),控制單元131基于文件編號i和字符信息Cj計算地址??刂茊卧?31將與所計算出的地址對應(yīng)的位置上的比特更新為“1”。即,控制單元131將與所計算出的地址對應(yīng)的位置上的比特與“1”之間的邏輯加(OR)運算的結(jié)果存儲在與所計算出的地址對應(yīng)的位置上。例如,將比特列中的與通過將字符信息Cj的二進制碼代入到預(yù)定散列函數(shù)中而獲取的值對應(yīng)的第i比特設(shè)置為“1”。當(dāng)控制單元131對比特進行更新時,確定單元133執(zhí)行S108的處理。當(dāng)確定單元133確定文件Fi不包括字符信息Cj時(S106:否),確定單元133執(zhí)行S108的處理。執(zhí)行針對后續(xù)字符信息的處理。當(dāng)字符信息C1至Cm當(dāng)中存在未選擇的字符信息時,確定單元133再次執(zhí)行S105的處理(S108)。當(dāng)字符信息C1至Cm當(dāng)中不存在未選擇的字符信息時,執(zhí)行S109的處理。在S109中,當(dāng)該組文件F1至Fn中存在未選擇的文件時,讀出單元132再次執(zhí)行S104的處理。當(dāng)該組文件F1至Fn中不存在未選擇的文件時,執(zhí)行S110的處理。控制單元131通知完成了該組文件F1至Fn的索引信息生成處理(S110)。在S110中,控制單元131還將在S103中確保的區(qū)域的信息存儲為索引文件。在S110的處理之后,確定是否已經(jīng)接收到結(jié)束指令(S111)。當(dāng)已經(jīng)接收到結(jié)束指令時(S111:是),處理單元11結(jié)束索引生成程序。當(dāng)未接收到結(jié)束指令時(S111:否),再次執(zhí)行S102的處理。圖11例示了全文索引檢索的處理過程示例。當(dāng)啟動檢索處理程序23b時(S200),檢索控制單元14執(zhí)行預(yù)處理(S201)。S201的預(yù)處理是讀出圖4中示出的表T1以及讀出索引信息。檢索控制單元14確定是否已經(jīng)接收到檢索請求(S202),并且重復(fù)執(zhí)行該確定,直到檢索控制單元14接收到檢索請求為止(S202:否)。當(dāng)檢索控制單元14接收到檢索請求時(S202:是),執(zhí)行索引參照處理(S203)。圖12例示了索引信息的參照處理過程的示例。當(dāng)執(zhí)行S203時(S300),檢索控制單元14取出包括在檢索請求中的檢索字符串,以提取字符信息C1至Cm當(dāng)中的、被包括在檢索字符串中的字符信息Ca、Cb、…(S301)。當(dāng)檢索控制單元14提取字符信息Ca、Cb、…時,壓縮單元15確定該組文件F1至Fn中的各個文件是否為不包括所提取的字符信息Ca、Cb、…中的任何一條的文件。具體來說,選擇提取的多條字符信息當(dāng)中的一條字符信息(S302)。參照單元151基于所選擇的字符信息計算地址,并且讀出存儲在由所計算出的地址指示的位置上的信息(S303)。在S303中,參照單元151通過與S107的操作類似的操作計算地址。這時,例如,參照單元151讀出與通過將所選擇的字符信息的二進制碼代入到預(yù)定散列函數(shù)中而獲取的值對應(yīng)的比特列。當(dāng)所提取的字符信息Ca、Cb、…中存在未選擇的字符信息時,壓縮單元15再次執(zhí)行S302的處理。當(dāng)所提取的字符信息Ca、Cb、…中不存在未選擇的字符信息時,壓縮單元15結(jié)束索引參照處理(S304,S305)。當(dāng)結(jié)束索引參照處理時,壓縮單元15提取作為檢索對象的文件的文件編號(S204)。在S204中,例如,確定單元152針對字符信息Ca、Cb、…中的每一條,計算由參照單元151讀出的比特列之間的邏輯積(AND)。確定單元152生成指示所計算出的比特列中的值為“1”的比特的順序的編號。例如,當(dāng)?shù)趚比特和第y比特在所計算出的比特列中為“1”時,確定單元152生成x和y。檢索控制單元14選擇作為由確定單元152生成的編號x、y、…中的任一個的編號i。字符串檢索單元16讀出具有所選擇的文件編號i的文件Fi(S206)。字符串檢索單元16從與圖4中示出的表T1中的文件編號i對應(yīng)的存儲位置讀出文件。字符串檢索單元16根據(jù)檢索字符串檢索讀出的文件Fi(S207)。例如,當(dāng)字符串檢索單元16檢測文件Fi中的與該檢索字符串一致的字符串時,字符串檢索單元16生成指示一致的字符串在文件Fi中的位置的信息,以按照將該信息與文件Fi的文件編號i關(guān)聯(lián)的方式將該信息存儲在存儲單元12中(參照圖13)。例如,準(zhǔn)備用于對經(jīng)受利用檢索字符串進行的核對的數(shù)據(jù)的量進行計數(shù)的計數(shù)器,并且將計數(shù)器在檢測與字符串的一致性時的值設(shè)置為為指示文件中的位置的信息。在S207的處理之后,當(dāng)由確定單元152生成的編號x、y、…當(dāng)中存在未選擇的編號時,檢索控制單元14執(zhí)行S205的處理。當(dāng)由確定單元152生成的編號x、y、…當(dāng)中不存在未選擇的編號時,檢索控制單元14執(zhí)行S210的處理。檢索控制單元14執(zhí)行檢索結(jié)果的輸出處理(S209)。例如,在S207的處理中,檢索控制單元14執(zhí)行提取與由存儲在表T2(圖13中示出)中的信息指示的位置相鄰的字符串的處理,以在顯示裝置上顯示具有與該文件編號對應(yīng)的文件名等的所提取的字符串。在S210的處理之后,處理單元11確定是否給出結(jié)束指令(S210)。當(dāng)未給出結(jié)束指令時(S210:否),檢索控制單元14執(zhí)行S202的處理。當(dāng)給出結(jié)束指令時(S210:是),處理單元11結(jié)束索引處理程序23b(S211)。圖13例示了與檢索字符串一致的字符信息的位置的列表。當(dāng)存在與S207的字符串檢索中的檢索字符串一致的字符信息時,字符串檢索單元16生成指示一致的字符串在文件Fi中的位置的信息,并且按照將該信息與文件Fi的文件編號i關(guān)聯(lián)的方式將該信息存儲在表T2中。當(dāng)檢索控制單元14輸出檢索結(jié)果時,參照表T2。進一步描述圖10中示出的S106的確定處理的過程。圖14A和圖14B例示了S106的處理過程。當(dāng)開始確定處理時(S400),確定單元133從文件Fi讀出字符信息(S401)。例如,數(shù)據(jù)讀出單元是標(biāo)簽信息單元、針對一個字符的字符信息單元等。接著,確定單元133確定在S401中讀出的數(shù)據(jù)是否不為標(biāo)簽信息(S402)。當(dāng)S401中讀出的字符信息是標(biāo)簽信息時(S402:否),確定單元133確定所讀出的標(biāo)簽信息是否為<rb>標(biāo)簽(S412)。當(dāng)所讀出的標(biāo)簽信息是<rb>標(biāo)簽時(S412:是),確定單元133復(fù)制存儲在存儲區(qū)域中的狀態(tài)信息(S413)。復(fù)制目標(biāo)的地址根據(jù)復(fù)制的重復(fù)次數(shù)d和復(fù)制源的地址來指定,如上所述。而且,確定單元133對復(fù)制的重復(fù)次數(shù)d進行更新(S414)。例如,復(fù)制的重復(fù)次數(shù)d的初始值為0并且每次執(zhí)行復(fù)制時遞增該重復(fù)次數(shù)。確定單元133確認(rèn)復(fù)制d次,并且將存儲在多個存儲區(qū)域的地址當(dāng)中的、地址的第d數(shù)位(d指示重復(fù)次數(shù))為“0”的存儲區(qū)域中的狀態(tài)信息設(shè)置為更新對象(S415)。即,恰好之前執(zhí)行的S413的復(fù)制中的復(fù)制源的狀態(tài)信息被設(shè)置為更新對象。當(dāng)所讀出的標(biāo)簽信息不是<rb>標(biāo)簽時(S412:否),確定單元133確定所讀出的標(biāo)簽信息是否為<rt>標(biāo)簽(S416)。當(dāng)所讀出的標(biāo)簽信息是<rt>標(biāo)簽時(S416:是),確定單元133確認(rèn)重復(fù)次數(shù)d,并且將存儲在多個存儲區(qū)域的地址當(dāng)中的、地址的第d數(shù)位(d指示重復(fù)次數(shù))為“1”的存儲區(qū)域中的狀態(tài)信息設(shè)置為更新對象(S417)。當(dāng)所讀出的標(biāo)簽信息不是<rt>標(biāo)簽時(S416:否),確定單元133確定所讀出的標(biāo)簽信息是否為</ruby>標(biāo)簽(S418)。當(dāng)所讀出的標(biāo)簽信息是</ruby>標(biāo)簽時(S418:是),確定單元133將存儲在多個存儲區(qū)域中的所有各條狀態(tài)信息設(shè)置為更新對象(S419)。在S419中,確定單元133還設(shè)置指示交疊狀態(tài)信息的刪除許可的標(biāo)記。稍后將描述S408中參照的標(biāo)記。當(dāng)所讀出的標(biāo)簽信息不是</ruby>標(biāo)簽時(S418:否),確定單元133使S401中讀出的字符信息的讀出位置前進至與所讀出的標(biāo)簽對應(yīng)的結(jié)束標(biāo)簽(S420)。當(dāng)執(zhí)行S415、S417、S419和S420中的任一個時,再次執(zhí)行S401的字符信息讀出處理。當(dāng)S401中不是讀出標(biāo)簽信息而是讀出字符信息時(S402:是),確定單元133從作為更新對象的多條狀態(tài)信息中選擇一條狀態(tài)信息(S403)。在核對處理開始時,作為更新對象的狀態(tài)信息是被存儲在存儲區(qū)域000中的狀態(tài)信息。在S413的處理中復(fù)制了狀態(tài)信息之后,通過S415、S417或S420來指定要作為更新對象的狀態(tài)信息。當(dāng)確定單元133在S403中選擇狀態(tài)信息時,確定單元133針對所讀出的字符信息執(zhí)行核對處理,以便對所選擇的狀態(tài)信息進行更新(S404)。執(zhí)行該更新,使得確定單元133獲取所選擇的狀態(tài)信息的轉(zhuǎn)換條件(由自動機限定),根據(jù)所選擇的狀態(tài)信息是否滿足所獲取的轉(zhuǎn)換條件來確定轉(zhuǎn)換目標(biāo)狀態(tài),并且將所選擇的狀態(tài)信息更新為轉(zhuǎn)換目標(biāo)狀態(tài)。當(dāng)在S404中執(zhí)行狀態(tài)信息的更新時,確定單元133確定在S404中更新的狀態(tài)信息是否指示“F”(S405)?!癋”指示自動機的結(jié)束點的狀態(tài)。當(dāng)在S405的確定中狀態(tài)信息為“F”時(S405:是),確定單元133在S106的確定處理中,確定字符信息Cj被包括在文件Fi中(S106:是)(S411)。當(dāng)在S405的確定中狀態(tài)信息不是“F”時(S405:否),確定單元133確定作為更新對象的多條狀態(tài)信息當(dāng)中是否存在未選擇的狀態(tài)信息。當(dāng)存在未選擇的狀態(tài)信息時,核對單元17再次執(zhí)行S403的處理,以選擇未選擇的狀態(tài)信息(S406)。當(dāng)不存在未選擇的狀態(tài)信息時,確定單元133執(zhí)行S408的處理。確定單元133確定存儲在存儲區(qū)域中的多條狀態(tài)信息當(dāng)中是否存在按照交疊方式指示相同狀態(tài)信息的多條狀態(tài)信息(S407)。當(dāng)存在多條交疊狀態(tài)信息時,確定單元133通過S419的處理,來確認(rèn)是否設(shè)置了指示交疊狀態(tài)信息的刪除許可的標(biāo)記。當(dāng)設(shè)置了指示刪除許可的標(biāo)記時,確定單元133釋放存儲交疊狀態(tài)信息的存儲區(qū)域,以便從作為更新對象的狀態(tài)信息中排除該狀態(tài)信息(S408)。而且,當(dāng)多條狀態(tài)信息的數(shù)量通過S408的處理變?yōu)橐粋€時,確定單元133清除指示刪除許可的標(biāo)記。當(dāng)在S407的處理中不存在交疊狀態(tài)信息時(S407:否)或者當(dāng)執(zhí)行了S408的處理時,確定單元133確定是否存在要從文件Fi讀出的字符信息(S409)。當(dāng)文件Fi中存在要讀出的字符信息時(S409:是),確定單元133再次執(zhí)行S401的處理。當(dāng)文件Fi中不存在要讀出的字符信息時(S409:否),確定單元133結(jié)束S106的確定處理,并且確定文件Fi中不包括字符信息Cj(S106:否)(S410)。進一步描述利用自動機的確定處理。圖19例示了圖6A中示出的自動機的數(shù)據(jù)構(gòu)造示例。類似的數(shù)據(jù)構(gòu)造被用于圖6B、圖6C、圖16A和圖16B中示出的自動機。圖19中示出的表T3針對可能出現(xiàn)的每一個轉(zhuǎn)換源狀態(tài),將轉(zhuǎn)換條件1與轉(zhuǎn)換目標(biāo)狀態(tài)1之間的組合、轉(zhuǎn)換條件2與轉(zhuǎn)換目標(biāo)狀態(tài)2之間的組合以及轉(zhuǎn)換目標(biāo)狀態(tài)3彼此關(guān)聯(lián)。確定單元133從表T3提取包括與存儲在存儲區(qū)域中的狀態(tài)信息一致的轉(zhuǎn)換源狀態(tài)的記錄。接著,確定單元133確定從文件Fi讀出的字符信息是否滿足被包括在所提取的記錄中的轉(zhuǎn)換條件。當(dāng)滿足轉(zhuǎn)換條件1或轉(zhuǎn)換條件2時,確定單元133將狀態(tài)信息更新為被包括在所提取的記錄中并對應(yīng)于所滿足的轉(zhuǎn)換條件的轉(zhuǎn)換目標(biāo)狀態(tài)。當(dāng)既不滿足轉(zhuǎn)換條件1也不滿足轉(zhuǎn)換條件2時,確定單元133將狀態(tài)信息更新為被包括在所提取的記錄中的轉(zhuǎn)換目標(biāo)狀態(tài)3。圖20例示了自動機的生成過程示例。在由生成單元13執(zhí)行的索引生成和由字符串檢索單元16執(zhí)行的字符串檢索中使用自動機。例如,生成單元13針對圖10中示出的S101中的該組字符信息C1至Cm中的各條字符信息生成自動機。另選的是,當(dāng)在圖10中示出的S105中選擇了字符信息時,生成單元13針對所選擇的字符信息生成自動機。圖11中示出的流程可以在檢索字符串不包括字符信息重復(fù)的部分(類似“七夕“ma”“tsu”“ri””)的情況下使用。例如,諸如““de”“n”“de”“n”“mushi””(在初始規(guī)范中,“de”、“n”、“de”和“n”中的每一個表達(dá)一個平假名字符,并且“mushi”表達(dá)一個中文字符)的字符串包括字符信息的重復(fù)(““de”“n””重復(fù))。當(dāng)針對檢索字符串““de”“n”“de”“n”“mushi””生成自動機時,使用了與圖11中的流程不同的流程。在核對對象中包括諸如“…“de”“n”“de”“n”“de”“n”“mushi”…”的字符串并且使用圖11中例示的流程的情況下,該狀態(tài)被移位直到““de”“n”“de”“n””并且后續(xù)的“de”不與“mushi”一致。因此,生成了用于將該狀態(tài)返回至初始狀態(tài)的自動機。如果該狀態(tài)返回至初始狀態(tài),則該字符串的作為““de”“n”“mushi””的其余部分與““de”“n”“de”“n”“mushi””不一致。根據(jù)以上描述,可以使用另一流程來處理包括諸如““de”“n”“de”“n”“mushi””的字符信息的重復(fù)的檢索字符串。當(dāng)開始自動機的生成處理時(S500),生成單元13首先從該組字符信息C1至Cm獲取字符信息Cj(S501)。接著,生成單元13對所獲取的字符信息Cj的長度N進行計數(shù)(S502)。生成單元13從0至N-1中順序地選擇整數(shù)i,并重復(fù)執(zhí)行從S504至S510的處理(S503)。生成單元13將一個記錄添加至表T3(S504)。生成單元13將在S504中生成的記錄的轉(zhuǎn)換源狀態(tài)設(shè)置為在S503中選擇的整數(shù)“i”(S505)。而且,生成單元13將在S504中生成的記錄的轉(zhuǎn)換條件1設(shè)置為在S501中獲取的檢索字符串的第i+1個字符(S506)。隨后,生成單元13確定整數(shù)i是否為N-1(S507)。當(dāng)整數(shù)i為N-1時(S507:是),將在S504中生成的記錄的轉(zhuǎn)換目標(biāo)狀態(tài)1設(shè)置為“F(指示核對完成的信息)”(S508)。當(dāng)整數(shù)i不為N-1時(S507:否),生成單元13將在S504中生成的記錄的轉(zhuǎn)換目標(biāo)狀態(tài)1設(shè)置為“i+1”(S509)。而且,生成單元13將在S504中生成的記錄的轉(zhuǎn)換條件2設(shè)置為檢索字符串中的第一個字符,將轉(zhuǎn)換目標(biāo)狀態(tài)2設(shè)置為1,將轉(zhuǎn)換目標(biāo)狀態(tài)3設(shè)置為“0”(S510)。在S510的處理之后,生成單元13確定i是否為N-1。當(dāng)i不是N-1時,生成單元13在S503中選擇下一個整數(shù)并且執(zhí)行從S504至S510的處理(S511)。當(dāng)i是N-1時,生成單元13結(jié)束自動機生成處理(S512)。描述了與通過圖6A至圖6C以及圖7A至圖7C中例示的確定的索引生成過程不同的另一索引生成過程。在上述索引生成中,針對特定文件Fi順序地選擇字符信息C1至Cm,并且確定文件Fi中是否存在所選擇的字符信息Cj,以便反映針對索引信息的確定結(jié)果。即,當(dāng)確定文件Fi中存在字符信息Cj時,將與字符信息Cj和文件Fi對應(yīng)的比特更新為“1”。在圖15A至圖15C中例示的索引生成過程中,從文件Fi讀出字符信息,并且將針對索引信息確保的存儲區(qū)域當(dāng)中的、與所讀出的字符信息對應(yīng)的一部分上的比特更新為“1”,以便生成索引信息。在其它索引信息生成過程中,確定單元133確保存儲區(qū)域000至011,并且存儲讀出到存儲區(qū)域000至011中的每一個中的字符信息。在圖15A至圖15C的示例中,假定生成單元13針對用于雙字符的每一條字符信息,生成指示各個文件中是否包括用于雙字符的字符信息的比特列。每當(dāng)確定單元133在各個存儲區(qū)域中存儲雙字符的字符信息時,控制單元131將與存儲在各個存儲區(qū)域中的字符信息對應(yīng)的比特的值更新為“1”。每當(dāng)確定單元133讀出字符時,確定單元133按照所讀出的字符信息存儲通過滑動先前存儲在存儲區(qū)域中的字符信息而獲取的字符信息。例如,所讀出的字符信息的存儲目標(biāo)根據(jù)<rb>標(biāo)簽、<rt>標(biāo)簽、</ruby>標(biāo)簽等的讀出來控制。圖15A至圖15C例示了針對文件Fi(省略了閱讀)中的描述D3“賑“wa”“u”七夕祭“ri””(在原始規(guī)范中,賑、七、夕和祭中的每一個表達(dá)一個中文字符,并且“wa”、“u”和“ri”中的每一個表達(dá)一個平假名字符)執(zhí)行的索引生成處理。當(dāng)確定單元133在存儲區(qū)域什么都沒有存儲的狀態(tài)下從文件Fi讀出賑時(S1),確定單元133將賑存儲在存儲區(qū)域000中(S2)。當(dāng)確定單元133還讀出“wa”時,確定單元133將“賑“wa””存儲在存儲區(qū)域000中(S3)。針對雙字符的字符信息因而被存儲在存儲區(qū)域000中,使得控制單元131在索引信息中將比特列中的與字符信息“賑“wa””對應(yīng)的第i比特的值更新為“1”。按照類似的方式,當(dāng)確定單元133讀出“u”時,確定單元133將存儲區(qū)域000更新為““wa”“u””(S4),并且控制單元131將比特列中的與““wa”“u””對應(yīng)的第i比特更新為“1”。隨后,當(dāng)確定單元133讀出<rb>標(biāo)簽時,確定單元133將存儲在存儲區(qū)域000中的字符信息復(fù)制到存儲區(qū)域001上(S5)。復(fù)制的重復(fù)次數(shù)d因該復(fù)制而變?yōu)?。作為復(fù)制的觸媒和復(fù)制目標(biāo)的地址的標(biāo)簽信息可以通過與圖7A至圖7C中例示的過程相似的過程來指定。當(dāng)確定單元133讀出七時,確定單元133將““u”七”存儲在存儲區(qū)域000中(S6)。當(dāng)確定單元133讀出夕時,確定單元133將“七夕”存儲在存儲區(qū)域000中(S7)。每當(dāng)確定單元133存儲““u”七”和“七夕”時,控制單元131將索引信息中的對應(yīng)比特的值更新為“1”。當(dāng)確定單元133讀出<rt>標(biāo)簽時,確定單元133將更新對象的存儲區(qū)域從存儲區(qū)域000移位至存儲區(qū)域001(S8)。確定單元133響應(yīng)于“ta”、“na”“ba”和“ta”的相應(yīng)讀出,將““u”“ta””、““ta”“na””、““na”“ba””和““ba”“ta””順序地存儲在存儲區(qū)域001中(S9、S10、S11、S12)。每當(dāng)確定單元133將““u”“ta””、““ta”“na””、““na”“ba””和““ba”“ta””順序地存儲在存儲區(qū)域001中時,控制單元131將索引信息中的對應(yīng)比特的值更新為“1”。當(dāng)確定單元133讀出<rb>標(biāo)簽時,確定單元133還復(fù)制存儲區(qū)域(S13)。復(fù)制的重復(fù)次數(shù)d因該復(fù)制而變?yōu)?。當(dāng)確定單元133接著讀出祭時,確定單元133針對地址的第d最低值為“0”的存儲區(qū)域執(zhí)行更新處理。確定單元133將“夕祭”存儲在存儲區(qū)域000中并將““ta”祭”存儲在存儲區(qū)域001中(S14)。當(dāng)確定單元133將“夕祭”存儲在存儲區(qū)域000中時,控制單元131將索引信息中的對應(yīng)比特的值更新為“1”。當(dāng)確定單元133將““ta”祭”存儲在存儲區(qū)域001中時,控制單元131將索引信息中的對應(yīng)比特的值更新為“1”。確定單元133讀出<rt>,并且將更新對象的存儲區(qū)域從地址的第d最低值為“0”的存儲區(qū)域移位至地址的第d最低值為“1”的存儲區(qū)域(S15)。確定單元133響應(yīng)于“ma”和“tsu”中的每一個的讀出,將“夕“ma””和““ma”“tsu””存儲在存儲區(qū)域010中,并將““ta”“ma””和““ma”“tsu””存儲在存儲區(qū)域011中(S16、S17)??刂茊卧?31響應(yīng)于由確定單元133執(zhí)行的將“夕“ma””、““ma”“tsu””和““ta”“ma””中的每一個寫入存儲區(qū)域中,將索引信息中的對應(yīng)比特的值更新為“1”。當(dāng)確定單元133讀出</ruby>時,確定單元133將存儲區(qū)域000至011設(shè)置為更新對象的存儲區(qū)域。當(dāng)確定單元133還讀出“ri”時,確定單元133將“祭“ri””存儲在存儲區(qū)域000中,將“祭“ri””存儲在存儲區(qū)域001中,將““tsu”“ri””存儲在存儲區(qū)域010中,并且將““tsu”“ri””存儲在存儲區(qū)域011中(S18)??刂茊卧?31響應(yīng)于由確定單元133執(zhí)行的將“祭“ri””和““tsu”“ri””寫入存儲區(qū)域中,將索引信息中的對應(yīng)比特的值更新為“1”。確定單元133刪除存儲區(qū)域當(dāng)中的交疊狀態(tài)信息(S19)。刪除存儲在存儲區(qū)域001中的“祭“ri””以及存儲在存儲區(qū)域011中的““tsu”“ri””。通過圖15A至圖15C中示出的上述過程,將文件Fi中的用于雙字符(其被包括在“賑“wa”“u”七夕祭“ri””中(省略了閱讀))的各條字符信息反映至索引信息。以上已經(jīng)描述了顯示有關(guān)中文字符的閱讀的示例,但是該實施方式不限于該示例。可以通過平假名字符來提供有關(guān)片假名字符的閱讀,并且可以在中文語言中向中文字符的表述提供拼音。而且,閱讀被用于英文,并且該實施方式的上述示例可應(yīng)用于英文。例如,如上所述,在文件F中“BIOS”被表達(dá)為描述D2。另一方面,例如,可以將“BIOS”、“BASICINPUT/OUTPUTSYSTEM”或“BASICIOSYSTEM”作為檢索字符串輸入。當(dāng)檢索字符串為“BIOS”時,例如,基于索引信息中的與“BIOS”對應(yīng)的比特列,對作為字符串檢索的對象的文件進行壓縮。例如,當(dāng)檢索字符串為“BASICIOSYSTEM”時,例如,基于索引信息中的與“BASI”、“ASIC”、…、“ICIO”、“CIOS”、…和“STEM”中的每一個對應(yīng)的比特列,對作為字符串檢索的對象的文件進行壓縮。圖16A例示了用于確定文件中是否包括字符信息“BIOS”的自動機。初始狀態(tài)(0)中的轉(zhuǎn)換條件1(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)1為“1”)為“B”。狀態(tài)(1)中的轉(zhuǎn)換條件1(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)為“2”)為“I”,并且轉(zhuǎn)換條件2(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)2為“1”)為“B”。狀態(tài)(2)中的轉(zhuǎn)換條件1(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)為“3”)為“O”,并且轉(zhuǎn)換條件2(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)2為“1”)為“B”。狀態(tài)(3)中的轉(zhuǎn)換條件1(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)為“F”)為“S”,并且轉(zhuǎn)換條件2(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)2為“1”)為“B”。圖16B例示了用于確定文件中是否包括字符信息“CIOS”的自動機。初始狀態(tài)(0)中的轉(zhuǎn)換條件1(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)為“1”)為“C”。狀態(tài)(1)中的轉(zhuǎn)換條件1(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)為“2”)為“I”,并且轉(zhuǎn)換條件2(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)2為“1”)為“C”。狀態(tài)(2)中的轉(zhuǎn)換條件1(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)為“3”)為“O”,并且轉(zhuǎn)換條件2(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)2為“1”)為“C”。狀態(tài)(3)中的轉(zhuǎn)換條件1(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)為“F”)為“S”,并且轉(zhuǎn)換條件2(對應(yīng)的轉(zhuǎn)換目標(biāo)狀態(tài)2為“1”)為“C”。圖17A和圖17B例示了“BIOS”是否被包括在文件Fi中的描述D2中的確定過程。確定單元133基于圖16A中示出的自動機來對存儲在存儲區(qū)域中的狀態(tài)信息進行更新。假定在讀出描述D2之前僅將指示初始狀態(tài)(0)的狀態(tài)信息存儲在存儲區(qū)域0000中(S1)。當(dāng)確定單元133從文件Fi讀出<rb>標(biāo)簽時,確定單元133將存儲在存儲區(qū)域0000中的狀態(tài)信息復(fù)制到存儲區(qū)域0001上(S2)。這里,確定單元133將重復(fù)次數(shù)d設(shè)置為“1”。隨后,當(dāng)確定單元133讀出“B”時,確定單元133根據(jù)圖16A中示出的自動機來對存儲在存儲區(qū)域0000中的狀態(tài)信息進行更新。從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換的條件為“B”,使得要存儲在存儲區(qū)域0000中的狀態(tài)信息是狀態(tài)(1)(S3)。當(dāng)確定單元133讀出<rt>時,確定單元133將更新對象的存儲區(qū)域移位至0001。確定單元133響應(yīng)于“B”、“A”、“S”、“I”和“C”中的每一個的讀出,來對存儲在存儲區(qū)域0001中的狀態(tài)信息進行更新。結(jié)果,存儲區(qū)域0001的狀態(tài)信息被更新為初始狀態(tài)(0)(S4)。當(dāng)確定單元133從文件Fi讀出<rb>標(biāo)簽時,確定單元133將存儲在存儲區(qū)域0000中的狀態(tài)信息以及存儲在存儲區(qū)域0001中的狀態(tài)信息分別復(fù)制到存儲區(qū)域0010和存儲區(qū)域0011上(S5)。這里,確定單元133將重復(fù)次數(shù)d設(shè)置為“2”。隨后,當(dāng)確定單元133讀出“I”時,確定單元133根據(jù)圖16A中示出的自動機來對存儲在存儲區(qū)域0000中的狀態(tài)信息進行更新。從狀態(tài)(1)至狀態(tài)(2)的轉(zhuǎn)換的條件為“I”,使得要存儲在存儲區(qū)域0000中的狀態(tài)信息是狀態(tài)(2)。而且,從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換的條件為“B”,使得要存儲在存儲區(qū)域0001中的狀態(tài)信息是初始狀態(tài)(0)(S6)。當(dāng)確定單元133讀出<rt>時,確定單元133將更新對象的存儲區(qū)域移位至存儲區(qū)域0010和存儲區(qū)域0011。確定單元133響應(yīng)于“I”、“N”、“P”、“U”、“T”和“/”中的每一個的讀出,來對存儲在存儲區(qū)域0010中的狀態(tài)信息和存儲在存儲區(qū)域0011中的狀態(tài)信息進行更新。結(jié)果,將存儲區(qū)域0010的狀態(tài)信息和存儲區(qū)域0011的狀態(tài)信息更新為初始狀態(tài)(0)(S7)。當(dāng)確定單元133從文件Fi讀出<rb>標(biāo)簽時,確定單元133將存儲在存儲區(qū)域0000至0011中的多條狀態(tài)信息分別復(fù)制到存儲區(qū)域0100至0111上(S8)。這里,確定單元133將重復(fù)次數(shù)d設(shè)置為“3”。隨后,當(dāng)確定單元133讀出“O”時,確定單元133根據(jù)圖16A中示出的自動機來對存儲在存儲區(qū)域0000中的狀態(tài)信息進行更新。從狀態(tài)(2)至狀態(tài)(3)的轉(zhuǎn)換的條件為“O”,使得要存儲在存儲區(qū)域0000中的狀態(tài)信息是狀態(tài)(3)。而且,從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換的條件為“B”,使得要分別存儲在存儲區(qū)域0001至0011中的多條狀態(tài)信息是初始狀態(tài)(0)(S9)。當(dāng)確定單元133讀出<rt>時,確定單元133將更新對象的存儲區(qū)域移位至存儲區(qū)域0100至0111(S10)。確定單元133響應(yīng)于“O”、“U”、“T”、“P”、“U”和“T”中的每一個的讀出,來對存儲在存儲區(qū)域0100至0111中的多條狀態(tài)信息進行更新。結(jié)果,存儲區(qū)域0100至0111的多條狀態(tài)信息被更新為初始狀態(tài)(0)(S11)。當(dāng)確定單元133從文件Fi讀出<rb>標(biāo)簽時,確定單元133將存儲在存儲區(qū)域0000至0111中的多條狀態(tài)信息分別復(fù)制到存儲區(qū)域1000至1111上(S12)。這里,確定單元133將重復(fù)次數(shù)d設(shè)置為“4”。隨后,當(dāng)確定單元133讀出“S”時,確定單元133根據(jù)圖16A中示出的自動機來對存儲在存儲區(qū)域0000中的狀態(tài)信息進行更新。從狀態(tài)(3)至狀態(tài)(F)的轉(zhuǎn)換的條件為“S”,使得要存儲在存儲區(qū)域0000中的狀態(tài)信息是狀態(tài)(F)。而且,從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換的條件為“B”,使得要分別存儲在存儲區(qū)域0001至0111中的多條狀態(tài)信息是初始狀態(tài)(0)(S13)。存儲在存儲區(qū)域0000中的狀態(tài)信息指示狀態(tài)(F),使得確定單元133確定文件Fi包括“BIOS”。圖18例示了“CIOS”是否被包括在文件Fi中的描述D2中的確定過程。確定單元133基于圖16B中示出的自動機來對存儲在存儲區(qū)域中的狀態(tài)信息進行更新。確定單元133響應(yīng)于從文件Fi讀出<rb>標(biāo)簽,將存儲在存儲區(qū)域0000中的狀態(tài)信息復(fù)制到存儲區(qū)域0001上(S1)。這里,確定單元133將重復(fù)次數(shù)d設(shè)置為“1”。隨后,當(dāng)確定單元133順序地讀出“B”、“A”、“S”、“I”和“C”時,確定單元133根據(jù)圖16B中示出的自動機來對存儲在存儲區(qū)域0001中的狀態(tài)信息進行更新。從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換的條件為“C”,使得要存儲在存儲區(qū)域0001中的狀態(tài)信息是狀態(tài)(1)(S2)。當(dāng)確定單元133從文件Fi讀出<rb>標(biāo)簽時,確定單元133將存儲在存儲區(qū)域0000中的狀態(tài)信息以及存儲在存儲區(qū)域0001中的狀態(tài)信息分別復(fù)制到存儲區(qū)域0010和存儲區(qū)域0011上(S3)。這里,確定單元133將重復(fù)次數(shù)d設(shè)置為“2”。隨后,當(dāng)確定單元133讀出“I”時,確定單元133根據(jù)圖16B中示出的自動機,來對存儲在存儲區(qū)域0000中的狀態(tài)信息和存儲在存儲區(qū)域0001中的狀態(tài)信息進行更新。從狀態(tài)(1)至狀態(tài)(2)的轉(zhuǎn)換的條件為“I”,使得要存儲在存儲區(qū)域0001中的狀態(tài)信息是狀態(tài)(2)。而且,從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換的條件為“C”,使得要存儲在存儲區(qū)域0000中的狀態(tài)信息是初始狀態(tài)(0)(S4)。當(dāng)確定單元133讀出<rt>時,確定單元133將更新對象的存儲區(qū)域移位至存儲區(qū)域0010和存儲區(qū)域0011。確定單元133響應(yīng)于“I”、“N”、“P”、“U”、“T”和“/”中的每一個的讀出,來對存儲在存儲區(qū)域0010中的狀態(tài)信息和存儲在存儲區(qū)域0011中的狀態(tài)信息進行更新。結(jié)果,將存儲區(qū)域0010的狀態(tài)信息和存儲區(qū)域0011的狀態(tài)信息更新為初始狀態(tài)(0)(S5)。當(dāng)確定單元133從文件Fi讀出<rb>標(biāo)簽時,確定單元133將存儲在存儲區(qū)域0000至0011中的多條狀態(tài)信息分別復(fù)制到存儲區(qū)域0100至0111上(S6)。這里,確定單元133將重復(fù)次數(shù)d設(shè)置為“3”。隨后,當(dāng)確定單元133讀出“O”時,確定單元133根據(jù)圖16B中示出的自動機來對存儲在存儲區(qū)域0000至0011中的多條狀態(tài)信息進行更新。從狀態(tài)(2)至狀態(tài)(3)的轉(zhuǎn)換的條件為“O”,使得要存儲在存儲區(qū)域0001中的狀態(tài)信息是狀態(tài)(3)。而且,從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換的條件為“C”,使得要分別存儲在存儲區(qū)域0000、0010和0011中的多條狀態(tài)信息是初始狀態(tài)(0)(S7)。當(dāng)確定單元133讀出<rt>時,確定單元133將更新對象的存儲區(qū)域移位至存儲區(qū)域0100至0111。確定單元133響應(yīng)于“O”、“U”、“T”、“P”、“U”和“T”中的每一個的讀出,來對存儲在存儲區(qū)域0100至0111中的多條狀態(tài)信息進行更新。結(jié)果,存儲區(qū)域0100至0111的多條狀態(tài)信息被更新為初始狀態(tài)(0)(S8)。當(dāng)確定單元133從文件Fi讀出<rb>標(biāo)簽時,確定單元133將存儲在存儲區(qū)域0000至0111中的多條狀態(tài)信息分別復(fù)制到存儲區(qū)域1000至1111上(S9)。這里,確定單元133將重復(fù)次數(shù)d設(shè)置為“4”。隨后,當(dāng)確定單元133讀出“S”時,確定單元133根據(jù)圖16B中示出的自動機來對存儲在存儲區(qū)域0000至0111中的多條狀態(tài)信息進行更新。從狀態(tài)(3)至狀態(tài)(F)的轉(zhuǎn)換的條件為“S”,使得要存儲在存儲區(qū)域0001中的狀態(tài)信息是狀態(tài)(F)。而且,從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換的條件為“C”,使得要分別存儲在存儲區(qū)域0000以及0010至0111中的多條狀態(tài)信息是初始狀態(tài)(0)(S10)。存儲在存儲區(qū)域0001中的狀態(tài)信息指示狀態(tài)(F),使得確定單元133確定文件Fi包括“CIOS”。確定單元133繼續(xù)該確定處理的情況下,確定單元133在讀出<rt>時,將更新對象的存儲區(qū)域移位至存儲區(qū)域1000至1111。確定單元133響應(yīng)于“S”的讀出來對存儲在存儲區(qū)域1000至1111中的多條狀態(tài)信息進行更新。從狀態(tài)(3)至狀態(tài)(F)的轉(zhuǎn)換的條件為“S”,使得要存儲在存儲區(qū)域1001中的狀態(tài)信息是狀態(tài)(F)。而且,從初始狀態(tài)(0)至狀態(tài)(1)的轉(zhuǎn)換的條件為“C”,使得要分別存儲在存儲區(qū)域1000以及1010至1111中的多條狀態(tài)信息是初始狀態(tài)(0)(S11)。上述實施方式的應(yīng)用使得能夠在檢索字符串為“BIOS”、“BASICINPUT/OUTPUTSYSTEM”或“BASICIOSYSTEM”的任何情況下,提取文件Fi,作為與檢索字符串一致的字符信息。本文詳述的所有示例和條件語言旨在用于教導(dǎo)目的以幫助讀者理解本發(fā)明以及發(fā)明人為技術(shù)進步貢獻(xiàn)的構(gòu)思,并且應(yīng)被解釋為不限于這些具體詳述的示例和條件,說明書中的這些示例的組織也不涉及展示本發(fā)明的優(yōu)勢和劣勢。盡管已經(jīng)詳細(xì)描述了本發(fā)明的實施方式,但是應(yīng)該理解,在不脫離本發(fā)明的精神和范圍的情況下,可對其進行各種改變、替換和更改。
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1