亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

文字搜索方法、裝置以及終端設(shè)備的制作方法

文檔序號:6378812閱讀:145來源:國知局
專利名稱:文字搜索方法、裝置以及終端設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息搜索技術(shù)領(lǐng)域,特別涉及一種文字搜索方法與裝置以及終端設(shè)備。
背景技術(shù)
目前,在文字搜索處理過程中,只要輸入要搜索的內(nèi)容,例如詞語“AB”,則通篇查找與“AB”相匹配的內(nèi)容。有時候,盡管文件中出現(xiàn)了“AB”,但是這個“AB”并非是用戶確實(shí)想要查找的結(jié)果,因此,用戶必需一一檢驗(yàn)其是否為用戶想要查找的目標(biāo),搜索和查找確定過程繁瑣,且效率低。

發(fā)明內(nèi)容
本發(fā)明的目的旨在至少解決所述技術(shù)缺陷之一。為此,本發(fā)明的第一個目的在于提出一種文字搜索方法,該方法提高了用戶進(jìn)行文字搜索的高效性、且具有快捷性和易用性。本發(fā)明的第二個目的在于提出一種文字搜索裝置。本發(fā)明的第三個目的在于提出一種終端設(shè)備。為了實(shí)現(xiàn)上述目的,本發(fā)明第一方面的實(shí)施例提供一種文字搜索方法,包括以下步驟接收用戶輸入的搜索詞;根據(jù)所述搜索詞對目標(biāo)文檔進(jìn)行搜索以生成搜索結(jié)果集合,其中,所述搜索結(jié)果集合包括多個搜索結(jié)果,每個所述搜索結(jié)果包括所述搜索詞所在所述目標(biāo)文檔中的位置信息;針對所述搜索結(jié)果集合中的每個所述搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合,其中,每個所述上下文子集合與所述搜索結(jié)果集合中的一個搜索結(jié)果對應(yīng);以及根據(jù)所述上下文子集合對所述搜索結(jié)果進(jìn)行篩選,并將篩選之后的搜索結(jié)果提供給所述用戶。根據(jù)本發(fā)明實(shí)施例的文字搜索方法,用戶根據(jù)搜索詞對目標(biāo)文檔進(jìn)行搜索以生成搜索結(jié)果集合,通過篩選將針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合提供給用戶。該文字搜索方法提高了用戶進(jìn)行文字搜索的高效性、且具有快捷性和易用性。在本發(fā)明的一個實(shí)施例中,所述根據(jù)上下文子集合對所述搜索結(jié)果進(jìn)行篩選進(jìn)一步包括獲得所述用戶在所述搜索結(jié)果集合中所確定的搜索結(jié)果,并將所述搜索結(jié)果作為標(biāo)準(zhǔn)搜索結(jié)果,以及將所述搜索結(jié)果對應(yīng)上下文子集合作為標(biāo)準(zhǔn)上下文子集合;計(jì)算其他上下文子集合與所述標(biāo)準(zhǔn)上下文子集合之間的相似度;以及如果所述相似度大于預(yù)設(shè)閾值,則將對應(yīng)的上下文集合的搜索結(jié)果刪除。由此,提高了文字搜索的準(zhǔn)確性。在本發(fā)明的一個實(shí)施例中,所述針對所述搜索結(jié)果集合中的每個所述搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合進(jìn)一步包括根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的上下文信息;以及根據(jù)每個所述搜索結(jié)果的上下文信息生成每個所述搜索結(jié)果的上下文子集合。由此,提高了文字搜索的高效性與易用性。在本發(fā)明的一個實(shí)施例中,根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的位置信息;以及根據(jù)每個所述搜索結(jié)果的上下文信息和位置信息生成每個所述搜索結(jié)果的上下文子集合。由此,提高了文字搜索方法的可選擇性,且具有高效性與易用性。在本發(fā)明的一個實(shí)施例中,根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的標(biāo)點(diǎn)符號信息;以及根據(jù)每個所述搜索結(jié)果的上下文信息和標(biāo)點(diǎn)符號信息生成每個所述搜索結(jié)果的上下文子集合。由此,提高了文字搜索方法的可選擇性,且具有高效性與易用性。本發(fā)明第二方面的實(shí)施例提出一種文字搜索裝置,包括接收模塊,接收用戶輸入的搜索詞;搜索模塊,根據(jù)搜索詞對目標(biāo)文檔進(jìn)行搜索;生成模塊,用于生成搜索結(jié)果集合,且針對所述搜索結(jié)果集合的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合,其中,所述搜索結(jié)果集合包括多個搜索結(jié)果,每個所述搜索結(jié)果包括所述搜索詞所在所述目標(biāo)文檔中的位置信息,以及每個所述上下文子集合與所述搜索結(jié)果集合中的一個搜索結(jié)果對應(yīng);篩選模塊,根據(jù)所述上下文子集合對所述搜索結(jié)果進(jìn)行篩選;發(fā)送模塊,用于經(jīng)過所述篩選模塊篩選之后的所述搜索結(jié)果提供給所述用戶。根據(jù)本發(fā)明實(shí)施例的文字搜索裝置,用戶根據(jù)通過接收模塊接收到的搜索詞對目標(biāo)文檔通過搜索模塊進(jìn)行搜索以通過生成模塊生成搜索結(jié)果集合,通過篩選模塊篩選將針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合通過發(fā)送模塊提供給用戶。該文字搜索裝置提高了用戶進(jìn)行文字搜索的高效性、且具有快捷性和易用性。在本發(fā)明的一個實(shí)施例中,所述篩選模塊包括獲取單元,獲得所述用戶在所述搜索結(jié)果集合中所確定的搜索結(jié)果,并將所述搜索結(jié)果作為標(biāo)準(zhǔn)搜索結(jié)果,以及將所述搜索結(jié)果對應(yīng)上下文子集合作為標(biāo)準(zhǔn)上下文子集合;計(jì)算單元,用于計(jì)算其他上下文子集合與所述標(biāo)準(zhǔn)上下文子集合之間的相似度;判斷單元,用于判斷如果所述相似度大于預(yù)設(shè)閾值,則將對應(yīng)的上下文集合的搜索結(jié)果刪除。由此,提高了文字搜索的準(zhǔn)確性。在本發(fā)明的一個實(shí)施例中,所述生成模塊用于根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的上下文信息,以及根據(jù)每個所述搜索結(jié)果的上下文信息生成每個所述搜索結(jié)果的上下文子集合。由此,提高了文字搜索的高效性與易用性。在本發(fā)明的一個實(shí)施例中,所述生成模塊還用于根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的位置信息,以及根據(jù)每個所述搜索結(jié)果的上下文信息和位置信息生成每個所述搜索結(jié)果的上下文子集合。由此,提高了文字搜索方法的可選擇性,且具有高效性與易用性。在本發(fā)明的一個實(shí)施例中,所述生成模塊還用于根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的標(biāo)點(diǎn)符號信息,以及根據(jù)每個所述搜索結(jié)果的上下文信息和標(biāo)點(diǎn)符號信息生成每個所述搜索結(jié)果的上下文子集合。由此,提高了文字搜索方法的可選擇性,且具有高效性與易用性。本發(fā)明第三方面的實(shí)施例提出一種終端設(shè)備,包括上述實(shí)施例提供的文字搜索裝置。
根據(jù)本發(fā)明實(shí)施例的終端設(shè)備,用戶根據(jù)搜索詞對目標(biāo)文檔進(jìn)行搜索以生成搜索結(jié)果集合,通過篩選將針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合提供給用戶。該終端設(shè)備提高了用戶進(jìn)行文字搜索的高效性、且具有快捷性和易用性。在本發(fā)明的一個實(shí)施例中,所述終端設(shè)備為手機(jī)、個人電腦PC或平板電腦。由此,提高了終端設(shè)備的多樣性。本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。


本發(fā)明所述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解,其中圖1為根據(jù)本發(fā)明一個實(shí)施例的文字搜索方法的流程圖;圖2為根據(jù)本發(fā)明實(shí)施例的文字搜索裝置的示意圖;圖3為根據(jù)本發(fā)明實(shí)施例的篩選模塊的示意圖;以及圖4為根據(jù)本發(fā)明實(shí)施例的終端設(shè)備的示意圖。
具體實(shí)施例方式下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對本發(fā)明的限制。此外,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括一個或者更多個該特征。在本發(fā)明的描述中,“多個”的含義是兩個或兩個以上,除非另有明確具體的限定。在本發(fā)明的描述中,需要說明的是,除非另有規(guī)定和限定,術(shù)語“安裝”、“相連”、“連接”應(yīng)做廣義理解,例如,可以是機(jī)械連接或電連接,也可以是兩個元件內(nèi)部的連通,可以是直接相連,也可以通過中間媒介間接相連,對于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù)具體情況理解所述術(shù)語的具體含義。如圖1所示,本發(fā)明實(shí)施例的文字搜索方法的流程圖,包括如下步驟步驟S101,接收用戶輸入的搜索詞。其中,用戶輸入的方式包括但不限于通過手寫輸入、通過按鍵輸入的一種或多種方式的組合等。用戶可以根據(jù)自己的搜索需求輸入搜索詞,其中,搜索詞可以為文字、數(shù)字、字符和字母的一種或多種的組合。例如清晨5點(diǎn)。步驟S102,根據(jù)搜索詞對目標(biāo)文檔進(jìn)行搜索以生成搜索結(jié)果集合。其中,搜索結(jié)果集合包括多個搜索結(jié)果,每個搜索結(jié)果包括搜索詞所在目標(biāo)文檔中的位置信息。目標(biāo)文檔中可能包括一個或多個用戶輸入的搜索詞,則根據(jù)步驟SlOl中用戶輸入的搜索詞在目標(biāo)文檔進(jìn)行搜索,并獲得多個包含該搜索詞信息的搜索結(jié)果。其中,每個搜索結(jié)果中包括該搜索詞在目標(biāo)文檔中的位置。例如,在目標(biāo)文檔中,“清晨5點(diǎn)”分別出現(xiàn)在正文和標(biāo)題中,則搜索結(jié)果集合包括第一搜索結(jié)果和第二搜索結(jié)果,其中,第一搜索結(jié)果包括正文,第二搜索結(jié)果包括標(biāo)題。需要說明的是,搜索結(jié)果的內(nèi)容不限于搜索詞在目標(biāo)文檔中的位置信息,還可以包括與搜索詞相關(guān)的其他信息。步驟S103,針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合。其中,每個上下文子集合與搜索結(jié)果集合中的一個搜索結(jié)果對應(yīng)。例如,針對搜索結(jié)果集合中的第一搜索結(jié)果和第二搜索結(jié)果中的每個搜索結(jié)果的位置信息,分別生成多個結(jié)果上下文子集合。其中,第一搜索結(jié)果包括正文,第二搜索結(jié)果包括標(biāo)題。具體地,根據(jù)每個搜索結(jié)果的位置信息獲得每個搜索結(jié)果的上下文信息。例如,“清晨5點(diǎn)”,在目標(biāo)文檔中的位置信息分別為正文和標(biāo)題中,則從正文和標(biāo)題中分別獲得“清晨5點(diǎn)”的上下文信息。然后,根據(jù)每個搜索結(jié)果的上下文信息生成每個搜索結(jié)果的上下文子集合。例如,將獲得的“清晨5點(diǎn)”的上下文信息生成每個搜索結(jié)果的上下文子集合。而后,根據(jù)每個搜索結(jié)果的位置信息獲得每個搜索結(jié)果的位置信息。例如,“清晨5點(diǎn)”,在目標(biāo)文檔中的位置信息分別為正文和標(biāo)題中,從正文和標(biāo)題兩個位置信息進(jìn)一步地獲得“清晨5點(diǎn)”的位置信息。在獲得每個搜索結(jié)果的位置信息后,根據(jù)每個搜索結(jié)果的上下文信息和位置信息生成每個搜索結(jié)果的上下文子集合。例如,“清晨5點(diǎn)”,在目標(biāo)文檔中的位置信息分別為正文和標(biāo)題中,則根據(jù)“清晨5點(diǎn)”的上下文信息和正文、標(biāo)題兩位置信息生成每個搜索結(jié)果的上下文子集合。進(jìn)一步地,針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合還可以通過以下方式進(jìn)行首先,根據(jù)每個搜索結(jié)果的位置信息獲得每個搜索結(jié)果的標(biāo)點(diǎn)符號信息。然后,根據(jù)每個搜索結(jié)果的上下文信息和標(biāo)點(diǎn)符號信息生成每個搜索結(jié)果的上下文子集合。步驟S104,根據(jù)上下文子集合對搜索結(jié)果進(jìn)行篩選。具體地,首先,獲得用戶在搜索結(jié)果集合中所確定的搜索結(jié)果,并將搜索結(jié)果作為標(biāo)準(zhǔn)搜索結(jié)果,以及將搜索結(jié)果對應(yīng)上下文子集合作為標(biāo)準(zhǔn)上下文子集合。然后,計(jì)算其他上下文子集合與標(biāo)準(zhǔn)上下文子集合之間的相似度。其中,可利用目前現(xiàn)有的余弦相似度算法或者BM25相似度計(jì)算方法等數(shù)學(xué)概率比較算法。如果其他上下文子集合與標(biāo)準(zhǔn)上下文子集合之間的相似度大于預(yù)設(shè)閾值,則將對應(yīng)的上下文集合的搜索結(jié)果刪除。其中,預(yù)設(shè)閾值為用戶根據(jù)實(shí)際需要設(shè)置。步驟S105,將篩選之后的搜索結(jié)果提供給用戶,從而,用戶可以查看到其想要的搜索結(jié)果。根據(jù)本發(fā)明實(shí)施例的文字搜索方法,用戶根據(jù)搜索詞對目標(biāo)文檔進(jìn)行搜索以生成搜索結(jié)果集合,通過篩選將針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合提供給用戶。該文字搜索方法有利于向用戶有區(qū)別地顯示處于不同環(huán)境下的不容搜索結(jié)果,以有助于用戶明顯識別并非他想要的搜索結(jié)果,同時提高了用戶進(jìn)行文字搜索的高效性、且具有快捷性和易用性。進(jìn)一步地,舉例對文字搜索方法進(jìn)行詳細(xì)說明。
首先,接收用戶輸入的搜索詞“AB”,從文件中搜索所有符合“AB”條件的結(jié)果,建立搜索結(jié)果集合。其中,搜索結(jié)果集合包括多個搜索結(jié)果,每個搜索結(jié)果包括搜索詞所在目標(biāo)文檔中的位置信息。從結(jié)果集合中按照各個結(jié)果依次搜索其前后的上下文信息,并建立與結(jié)果集合中的各個結(jié)果相關(guān)的結(jié)果上下文集合。進(jìn)一步地,針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合。例如,搜索結(jié)果集合為“AB1,AB2,...ABn”。ABl的搜索結(jié)果上下文集合為“ABl_a,ABl-b, · · · ABl-m,,。這里,上下文集合可包含多個信息。優(yōu)選地,例如,包括AB出現(xiàn)的具體位置,例如,正文內(nèi)、標(biāo)題內(nèi)、表格內(nèi)等。AB出現(xiàn)的具體位置不限于上述描述,此外的情況不再贅述。優(yōu)選地,包括AB的前后鄰近的若干詞語信息,例如AB之前的詞語、AB之后的詞語。優(yōu)選地,包括AB出現(xiàn)的周圍是否還存在相關(guān)詞語,例如AB的前方是否包括B以形成BAB的形式,或者AB的后方是否存在A以形成ABA的形式。優(yōu)選地,在AB前后與到達(dá)標(biāo)點(diǎn)的字符個數(shù)等與AB出現(xiàn)的具體位置相關(guān)的屬性信息。獲得用戶在搜索結(jié)果集合中所確定的搜索結(jié)果,并將搜索結(jié)果作為標(biāo)準(zhǔn)搜索結(jié)果,以及將搜索結(jié)果對應(yīng)上下文子集合作為標(biāo)準(zhǔn)上下文子集合,提取用戶當(dāng)前頁面所在處的要搜索的參考“AB”的上下文子集合作為標(biāo)準(zhǔn)上下文子集合參考基礎(chǔ)。將各個搜索結(jié)果的上下文集合與其進(jìn)行相似性比較,可利用目前現(xiàn)有的數(shù)學(xué)概率比較算法。如果相似度概率超過一定閾值,也就是說,兩者相似的可能性很大,則可正常顯示,如果相似度概率低于閾值,也就是說,兩者存在很大分歧,則相對高亮顯示。根據(jù)本發(fā)明實(shí)施例的文字搜索方法,用戶根據(jù)搜索詞對目標(biāo)文檔進(jìn)行搜索以生成搜索結(jié)果集合,通過篩選將針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合提供給用戶。該文字搜索方法有利于向用戶有區(qū)別地顯示處于不同環(huán)境下的不容搜索結(jié)果,以有助于用戶明顯識別并非他想要的搜索結(jié)果,同時提高了用戶進(jìn)行文字搜索的高效性、且具有快捷性和易用性。如圖2所示,本發(fā)明實(shí)施例的文字搜索裝置300,包括接收模塊310、搜索模塊320、生成模塊330、篩選模塊340和發(fā)送模塊350。接收模塊310為接收用戶輸入的搜索詞。其中,接收用戶輸入的方式為但不限于通過手寫輸入、通過按鍵輸入的一種或多種方式的組合等。用戶可以根據(jù)自己的搜索需求輸入搜索詞,其中,搜索詞可以為文字、數(shù)字、字符和字母的一種或多種的組合。例如接收模塊310接收到用戶輸入的搜索詞“清晨5點(diǎn)”搜索模塊320為根據(jù)搜索詞對目標(biāo)文檔進(jìn)行搜索。目標(biāo)文檔中可能包括一個或多個用戶輸入的搜索詞,則根據(jù)接收模塊中接收到用戶輸入的搜索詞在目標(biāo)文檔進(jìn)行搜索,并獲得多個包含該搜索詞信息的搜索結(jié)果。其中,每個搜索結(jié)果中包括該搜索詞在目標(biāo)文檔中的位置。例如,在目標(biāo)文檔中,“清晨5點(diǎn)”分別出現(xiàn)在正文和標(biāo)題中,則搜索結(jié)果集合包括第一搜索結(jié)果和第二搜索結(jié)果,其中,第一搜索結(jié)果包括正文,第二搜索結(jié)果包括標(biāo)題。需要說明的是,搜索結(jié)果的內(nèi)容不限于搜索詞在目標(biāo)文檔中的位置信息,還可以包括與搜索詞相關(guān)的其他信息。生成模塊330為用于生成搜索結(jié)果集合,且針對搜索結(jié)果集合的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合,例如,針對搜索結(jié)果集合中的第一搜索結(jié)果和第二搜索結(jié)果中的每個搜索結(jié)果的位置信息,分別生成多個結(jié)果上下文子集合。其中,第一搜索結(jié)果包括正文,第二搜索結(jié)果包括標(biāo)題。其中,搜索結(jié)果集合包括多個搜索結(jié)果,每個搜索結(jié)果包括搜索詞所在目標(biāo)文檔中的位置信息,以及每個上下文子集合與搜索結(jié)果集合中的一個搜索結(jié)果對應(yīng)。進(jìn)一步地,生成模塊330還用于根據(jù)每個搜索結(jié)果的位置信息獲得每個搜索結(jié)果的上下文信息,以及根據(jù)每個搜索結(jié)果的上下文信息生成每個搜索結(jié)果的上下文子集合。例如,“清晨5點(diǎn)”,在目標(biāo)文檔中的位置信息分別為正文和標(biāo)題中,則從正文和標(biāo)題中分別獲得“清晨5點(diǎn)”的上下文信息。將獲得的“清晨5點(diǎn)”的上下文信息生成每個搜索結(jié)果的上下文子集合。生成模塊330還用于根據(jù)每個搜索結(jié)果的位置信息獲得每個搜索結(jié)果的位置信息,以及根據(jù)每個搜索結(jié)果的上下文信息和位置信息生成每個搜索結(jié)果的上下文子集合。例如,“清晨5點(diǎn)”,在目標(biāo)文檔中的位置信息分別為正文和標(biāo)題中,從正文和標(biāo)題兩個位置信息進(jìn)一步地獲得“清晨5點(diǎn)”的位置信息。則根據(jù)“清晨5點(diǎn)”的上下文信息和正文、標(biāo)題兩位置信息生成每個搜索結(jié)果的上下文子集合。生成模塊330還用于根據(jù)每個搜索結(jié)果的位置信息獲得每個搜索結(jié)果的標(biāo)點(diǎn)符號信息,以及根據(jù)每個搜索結(jié)果的上下文信息和標(biāo)點(diǎn)符號信息生成每個搜索結(jié)果的上下文子集合。例如,“清晨5點(diǎn)”,在目標(biāo)文檔中的位置信息分別為正文和標(biāo)題中,從正文和標(biāo)題兩個位置信息進(jìn)一步地獲得“清晨5點(diǎn)”的標(biāo)點(diǎn)符號信息。例如,預(yù)設(shè)在“清晨5點(diǎn)”前后到達(dá)標(biāo)點(diǎn)的字符個數(shù)10,則根據(jù)“清晨5點(diǎn)”的上下文信息和標(biāo)點(diǎn)符號信息生成每個搜索結(jié)果的上下文子集合。篩選模塊340為根據(jù)上下文子集合對搜索結(jié)果進(jìn)行篩選。其中,如圖3所示,篩選模塊包括獲取單元301,計(jì)算單元302和判斷單元303。獲取單元301獲得用戶在所述搜索結(jié)果集合中所確定的搜索結(jié)果,并將搜索結(jié)果作為標(biāo)準(zhǔn)搜索結(jié)果,以及將搜索結(jié)果對應(yīng)上下文子集合作為標(biāo)準(zhǔn)上下文子集合。計(jì)算單元302用于計(jì)算其他上下文子集合與標(biāo)準(zhǔn)上下文子集合之間的相似度。其中,可利用目前現(xiàn)有的余弦相似度算法或者BM25相似度計(jì)算方法等數(shù)學(xué)概率比較算法。判斷單元303用于判斷如果相似度大于預(yù)設(shè)閾值,則將對應(yīng)的上下文集合的搜索結(jié)果刪除。其中,預(yù)設(shè)閾值為用戶根據(jù)實(shí)際需要設(shè)置。發(fā)送模塊350用于將經(jīng)過篩選模塊340篩選之后的搜索結(jié)果提供給用戶,從而,用戶可以查看到其想要的搜索結(jié)果。根據(jù)本發(fā)明實(shí)施例的文字搜索裝置,用戶根據(jù)通過接收模塊接收到的搜索詞對目標(biāo)文檔通過搜索模塊進(jìn)行搜索以通過生成模塊生成搜索結(jié)果集合,通過篩選模塊篩選將針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合通過發(fā)送模塊提供給用戶。該文字搜索裝置提高了用戶進(jìn)行文字搜索的高效性、且具有快捷性和易用性。如圖4所示,本發(fā)明實(shí)施例的終端設(shè)備400,包括文字搜索裝置300。其中終端設(shè)備可以為手機(jī)、個人電腦PC或平板電腦。根據(jù)本發(fā)明實(shí)施例的終端設(shè)備,用戶根據(jù)搜索詞對目標(biāo)文檔進(jìn)行搜索以生成搜索結(jié)果集合,通過篩選將針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合提供給用戶。該終端設(shè)備提高了用戶進(jìn)行文字搜索的高效性、且具有快捷性和易用性。流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說明書而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下具有一個或多個布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤盒(磁裝置),隨機(jī)存取存儲器(RAM),只讀存儲器(R0M),可擦除可編輯只讀存儲器(EPR0M或閃速存儲器),光纖裝置,以及便攜式光盤只讀存儲器(⑶ROM)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^對紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時以其他合適方式進(jìn)行處理來以電子方式獲得所述程序,然后將其存儲在計(jì)算機(jī)存儲器中。應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn)具有用于對數(shù)據(jù)信號實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時,包括方法實(shí)施例的步驟之一或其組合。此外,在本發(fā)明各個實(shí)施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時,也可以存儲在一個計(jì)算機(jī)可讀取存儲介質(zhì)中。上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。在本說明書的描述中,參考術(shù)語“一個實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個或多個實(shí)施例或示例中以合適的方式結(jié)合。
盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在不脫離本發(fā)明的原理和宗旨的情況下在本發(fā)明的范圍內(nèi)可以對上述實(shí)施例進(jìn)行變化、修改、替換和變型。本發(fā)明的范圍由所附權(quán)利要求極其等同限定。
權(quán)利要求
1.一種文字搜索方法,其特征在于,包括以下步驟接收用戶輸入的搜索詞;根據(jù)所述搜索詞對目標(biāo)文檔進(jìn)行搜索以生成搜索結(jié)果集合,其中,所述搜索結(jié)果集合包括多個搜索結(jié)果,每個所述搜索結(jié)果包括所述搜索詞所在所述目標(biāo)文檔中的位置信息; 針對所述搜索結(jié)果集合中的每個所述搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合,其中,每個所述上下文子集合與所述搜索結(jié)果集合中的一個搜索結(jié)果對應(yīng);以及根據(jù)所述上下文子集合對所述搜索結(jié)果進(jìn)行篩選,并將篩選之后的搜索結(jié)果提供給所述用戶。
2.如權(quán)利要求1所述的文字搜索方法,其特征在于,所述根據(jù)上下文子集合對所述搜索結(jié)果進(jìn)行篩選進(jìn)一步包括獲得所述用戶在所述搜索結(jié)果集合中所確定的搜索結(jié)果,并將所述搜索結(jié)果作為標(biāo)準(zhǔn)搜索結(jié)果,以及將所述搜索結(jié)果對應(yīng)上下文子集合作為標(biāo)準(zhǔn)上下文子集合;計(jì)算其他上下文子集合與所述標(biāo)準(zhǔn)上下文子集合之間的相似度;以及如果所述相似度大于預(yù)設(shè)閾值,則將對應(yīng)的上下文集合的搜索結(jié)果刪除。
3.如權(quán)利要求1或2所述的文字搜索方法,其特征在于,所述針對所述搜索結(jié)果集合中的每個所述搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合進(jìn)一步包括根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的上下文信息;以及根據(jù)每個所述搜索結(jié)果的上下文信息生成每個所述搜索結(jié)果的上下文子集合。
4.如權(quán)利要求1-3任一項(xiàng)所述的文字搜索方法,其特征在于,還包括根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的位置信息;以及根據(jù)每個所述搜索結(jié)果的上下文信息和位置信息生成每個所述搜索結(jié)果的上下文子隹A口 O
5.如權(quán)利要求1-3任一項(xiàng)所述的文字搜索方法,其特征在于,還包括根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的標(biāo)點(diǎn)符號信息;以及根據(jù)每個所述搜索結(jié)果的上下文信息和標(biāo)點(diǎn)符號信息生成每個所述搜索結(jié)果的上下文子集合。
6.一種文字搜索裝置,其特征在于,包括接收模塊,接收用戶輸入的搜索詞;搜索模塊,根據(jù)搜索詞對目標(biāo)文檔進(jìn)行搜索;生成模塊,用于生成搜索結(jié)果集合,且針對所述搜索結(jié)果集合的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合,其中,所述搜索結(jié)果集合包括多個搜索結(jié)果,每個所述搜索結(jié)果包括所述搜索詞所在所述目標(biāo)文檔中的位置信息,以及每個所述上下文子集合與所述搜索結(jié)果集合中的一個搜索結(jié)果對應(yīng);篩選模塊,根據(jù)所述上下文子集合對所述搜索結(jié)果進(jìn)行篩選;發(fā)送模塊,用于經(jīng)過所述篩選模塊篩選之后的所述搜索結(jié)果提供給所述用戶。
7.如權(quán)利要求6所述的文字搜索裝置,其特征在于,所述篩選模塊包括獲取單元,獲得所述用戶在所述搜索結(jié)果集合中所確定的搜索結(jié)果,并將所述搜索結(jié)果作為標(biāo)準(zhǔn)搜索結(jié)果,以及將所述搜索結(jié)果對應(yīng)上下文子集合作為標(biāo)準(zhǔn)上下文子集合; 計(jì)算單元,用于計(jì)算其他上下文子集合與所述標(biāo)準(zhǔn)上下文子集合之間的相似度;判斷單元,用于判斷如果所述相似度大于預(yù)設(shè)閾值,則將對應(yīng)的上下文集合的搜索結(jié)果刪除。
8.如權(quán)利要求6或7所述的文字搜索裝置,其特征在于,所述生成模塊用于根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的上下文信息,以及根據(jù)每個所述搜索結(jié)果的上下文信息生成每個所述搜索結(jié)果的上下文子集合。
9.如權(quán)利要求6-8任一項(xiàng)所述的文字搜索裝置,其特征在于,所述生成模塊還用于根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的位置信息,以及根據(jù)每個所述搜索結(jié)果的上下文信息和位置信息生成每個所述搜索結(jié)果的上下文子集合。
10.如權(quán)利要求6-8任一項(xiàng)所述的文字搜索裝置,其特征在于,所述生成模塊還用于根據(jù)每個所述搜索結(jié)果的位置信息獲得每個所述搜索結(jié)果的標(biāo)點(diǎn)符號信息,以及根據(jù)每個所述搜索結(jié)果的上下文信息和標(biāo)點(diǎn)符號信息生成每個所述搜索結(jié)果的上下文子集合。
11.一種終端設(shè)備,其特征在于,包括如權(quán)利要求6-10任一項(xiàng)所述的文字搜索裝置。
12.如權(quán)利要求11所述的終端設(shè)備,其特征在于,所述終端設(shè)備為手機(jī)、個人電腦PC或平板電腦。
全文摘要
本發(fā)明公開了一種文字搜索方法,包括以下步驟接收用戶輸入的搜索詞;根據(jù)搜索詞對目標(biāo)文檔進(jìn)行搜索以生成搜索結(jié)果集合,其中,搜索結(jié)果集合包括多個搜索結(jié)果,每個搜索結(jié)果包括搜索詞所在目標(biāo)文檔中的位置信息;針對搜索結(jié)果集合中的每個搜索結(jié)果中的位置信息分別生成多個結(jié)果上下文子集合,其中,每個上下文子集合與搜索結(jié)果集合中的一個搜索結(jié)果對應(yīng);以及根據(jù)上下文子集合對搜索結(jié)果進(jìn)行篩選,并將篩選之后的搜索結(jié)果提供給所述用戶。該方法解決了在文字搜索過程中既考慮要搜索的內(nèi)容,又考慮上下文信息的技術(shù)問題,本方法提高了用戶文字搜索的有效性、適時性,且具有快捷性和易用性。本發(fā)明還公開了一種文字搜索裝置、以及終端設(shè)備。
文檔編號G06F17/30GK102999556SQ20121039048
公開日2013年3月27日 申請日期2012年10月15日 優(yōu)先權(quán)日2012年10月15日
發(fā)明者劉娟 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1