專利名稱:一種查詢方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息檢索技術(shù)領(lǐng)域,特別是一種查詢方法及系統(tǒng),提高查詢結(jié) 果的精度。
背景技術(shù):
當(dāng)前的查詢系統(tǒng)中,在用戶輸入一個查詢語句后,系統(tǒng)利用一定的算法從 一個特定的集合中查詢與當(dāng)前查詢語句相關(guān)度符合要求的對象,并將查詢得到 的符合要求的對象展現(xiàn)給用戶。
而在使用推薦查詢,計算當(dāng)前查詢語句與歷史查詢語句集中的歷史查詢語 句的相關(guān)度,并利用計算得到的相關(guān)度,從歷史查詢語句集中選擇預(yù)定數(shù)目的 歷史查詢語句作為相關(guān)查詢語句,并基于該相關(guān)查詢語句進行推薦。
發(fā)明人在實現(xiàn)本發(fā)明的過程中,發(fā)現(xiàn)現(xiàn)有的查詢方法和系統(tǒng)至少存在以下
問題
由于僅使用特定算法執(zhí)行一次查詢的過程,由于使用的查詢算法的局限 性,所以結(jié)果中存在很多與用戶需求不符的對象,查詢準(zhǔn)確性低。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于查詢方法及系統(tǒng),提高查詢的準(zhǔn)確性。
為了實現(xiàn)上述目的,本發(fā)明實施例提供了一種查詢方法,包括
步驟A,利用查詢算法從查詢對象中獲取與當(dāng)前查詢語句對應(yīng)的原始查詢
結(jié)果集,所述原始查詢結(jié)果集包括至少一個查詢結(jié)果;
步驟B,利用相關(guān)度算法計算所述原始查詢結(jié)果集中的每個查詢結(jié)果與所
述當(dāng)前查詢語句的相關(guān)度得分;
步驟C,從所述原始查詢結(jié)果集中刪除相關(guān)度得分低于預(yù)設(shè)閾值的查詢結(jié)
果,得到最終查詢結(jié)果集;步驟D,根據(jù)所述最終查詢結(jié)果集進行輸出處理。 上述的方法,其中
所述方法用于推薦查詢時,所述查詢對象為歷史查詢語句集,所述原始查
詢結(jié)果集為包括至少一個歷史查詢語句的原始相關(guān)查詢語句集;
所述步驟B具體為計算每一個第二查詢結(jié)果集與所述第一查詢結(jié)果集 的相關(guān)度得分,所述第一查詢結(jié)果集為利用所述當(dāng)前查詢語句對數(shù)據(jù)庫執(zhí)行查 詢操作得到的查詢結(jié)果集,所述第二查詢結(jié)果集為分別利用所述原始相關(guān)查詢 語句集中的每一個歷史查詢語句對所述數(shù)據(jù)庫執(zhí)行查詢操作得到的查詢結(jié)果
集;
所述相關(guān)度得分低于預(yù)設(shè)閾值的查詢結(jié)果為相關(guān)度得分低于所述預(yù)設(shè)閾 值的第二查詢結(jié)果集所對應(yīng)的歷史查詢語句。
上述的方法,其中,所述計算每一個第二查詢結(jié)果集與所述第一查詢結(jié)果 集的相關(guān)度得分時,所述第二查詢結(jié)果集與所述第一查詢結(jié)果集中相同的查詢 結(jié)果越多,則所述第二查詢結(jié)果集與所述第一查詢結(jié)果集的相關(guān)度得分越高。
上述的方法,其中,所述計算每一個第二查詢結(jié)果集與所述第一查詢結(jié)果 集的相關(guān)度得分時,所述第二查詢結(jié)果集中被用戶訪問過的查詢結(jié)果在所述第 一查詢結(jié)果集中出現(xiàn)的越多,所述第二查詢結(jié)果集與所述第一查詢結(jié)杲集的相 關(guān)度得分越高。
上述的方法,其中,所述步驟D具體為根據(jù)所述最終查詢結(jié)果集中的
部分或全部歷史查詢語句進行推薦輸出。
為了實現(xiàn)上述目的,本發(fā)明實施例還提供了一種查詢系統(tǒng),其中,包括 主查詢模塊,用于利用查詢算法從查詢對象中獲取與當(dāng)前查詢語句對應(yīng)的
原始查詢結(jié)果集,所述原始查詢結(jié)果集包括至少一個查詢結(jié)果;
優(yōu)化模塊,用于利用相關(guān)度算法計算所述原始查詢結(jié)果集中的每個查詢結(jié) 果與所述當(dāng)前查詢語句的相關(guān)度得分,并從所述原始查詢結(jié)果集中刪除相關(guān)度
得分低于預(yù)設(shè)閾值的查詢結(jié)果,得到最終查詢結(jié)果集;
輸出模塊,用于才艮據(jù)所述最終查詢結(jié)果集進行輸出處理。 上述的查詢系統(tǒng),其中
所述查詢系統(tǒng)用于推薦查詢時,所述查詢對象為歷史查詢語句集,所述原始查詢結(jié)果集為包括至少一個歷史查詢語句的原始相關(guān)查詢語句集; 所述優(yōu)化模塊具體包括
計算單元,用于計算每一個第二查詢結(jié)果集與所述第一查詢結(jié)果集的相關(guān)
度得分,所述第一查詢結(jié)果集為利用所述當(dāng)前查詢語句對數(shù)據(jù)庫執(zhí)行查詢操作 得到的查詢結(jié)果集,所述第二查詢結(jié)果集為分別利用所述原始相關(guān)查詢語句集 中的每一個歷史查詢語句對所述數(shù)據(jù)庫執(zhí)行查詢操作得到的查詢結(jié)果集;
刪除單元,從所述原始相關(guān)查詢語句集中刪除相關(guān)度得分低于所述預(yù)設(shè)閾 值的第二查詢結(jié)果集所對應(yīng)的歷史查詢語句。
上述的查詢系統(tǒng),其中,所述第二查詢結(jié)果集與所述第一查詢結(jié)果集中相 同的查詢結(jié)果越多,則所述第二查詢結(jié)果集與所述第一查詢結(jié)果集的相關(guān)度得 分越高。
上述的查詢系統(tǒng),其中,所述第二查詢結(jié)果集中被用戶訪問過的查詢結(jié)果 在所述第一查詢結(jié)果集中出現(xiàn)的越多,所述第二查詢結(jié)果集與所述第一查詢結(jié) 果集的相關(guān)度得分越高。
上述的查詢系統(tǒng),其中,所述輸出模塊具體用于根據(jù)所述最終查詢結(jié)果集 中的部分或全部歷史查詢語句進^f亍推薦輸出。
本發(fā)明實施例具有以下的有益效果
本發(fā)明實施例的方法和系統(tǒng),通過使用其他的算法對第一次查詢得到的結(jié) 果進行篩選,從原始結(jié)果中排除與用戶需求不符的對象,提高了查詢準(zhǔn)確性;
本發(fā)明實施例的方法和系統(tǒng),應(yīng)用于推薦查詢時,通過當(dāng)前查詢語句獲取 一查詢結(jié)果,同時通過原始查詢結(jié)果集中的歷史查詢語句獲取另外一個查詢結(jié) 果,通過計算相關(guān)度得分,利用該得分刪除相關(guān)度得分低于預(yù)設(shè)閾值的查詢結(jié) 果對應(yīng)的歷史查詢語句,提高了推薦查詢的準(zhǔn)確性。
圖1為本發(fā)明實施例的查詢方法的流程示意圖2為本發(fā)明實施例的查詢方法用于推薦查詢時的流程示意圖。
具體實施例方式
6本發(fā)明實施例的查詢方法及系統(tǒng),在獲取原始查詢結(jié)果后,利用一定的方 法對該原始查詢結(jié)果進行過濾,以得到準(zhǔn)確度更高的查詢結(jié)果。
本發(fā)明實施例的查詢方法如圖1所示,包括
步驟11,利用第一算法從查詢對象中獲取與當(dāng)前查詢語句對應(yīng)的原始查 詢結(jié)果集,所述原始查詢結(jié)果集包括至少一個查詢結(jié)果;
步驟12,利用第二算法計算每個所述查詢結(jié)果與所述當(dāng)前查詢語句的相 關(guān)度得分;
步驟13,從所述原始查詢結(jié)果集中刪除得分低于預(yù)設(shè)閾值的查詢結(jié)果, 得到最終查詢結(jié)果集;
步驟l4,根據(jù)所述最終查詢結(jié)果集進行輸出處理。 <具體實施例一>
在本發(fā)明的具體實施例一中,以從文檔數(shù)據(jù)庫中查詢?yōu)槔M行說明。
應(yīng)用于文檔數(shù)據(jù)庫的查詢時,本發(fā)明實施例的方法包括
步驟Al 1 ,利用第一算法從文檔數(shù)據(jù)庫中獲取與當(dāng)前查詢語句對應(yīng)的原始
查詢結(jié)果集,所述原始查詢結(jié)果集包括至少一個文檔;
步驟A12,利用與第一算法不同的相關(guān)度算法(如BM25算法、RWR(隨
機游動)算法、TF/IDF ( Term Frequency/Inverse Document Frequency,詞步貞與
反向文件頻率)算法、Orion算法等算法中的一個或多個)計算原始查詢結(jié)果
集中的每個文檔與當(dāng)前查詢語句的相關(guān)度得分;
步驟A13,刪除原始查詢結(jié)果集中的得分低于預(yù)設(shè)閾值的文檔,得到最終
查詢結(jié)果集;
步驟A14,輸出最終查詢結(jié)果集中的全部查詢結(jié)果或部分查詢結(jié)果。 具體說明如下。
假設(shè)當(dāng)前查詢語句為A,通過隨機游動算法得到了一個原始查詢結(jié)果集, 其中包括A1、 A2、 A3.....An這n個文檔。
在步驟12中,利用BM25算法計算文檔Al與當(dāng)前查詢語句A的相關(guān)度
得分X1、文檔A2與當(dāng)前查詢語句A的相關(guān)度得分X2.....文檔An與當(dāng)前
查詢語句A的相關(guān)度得分Xn。
在得到這些得分后,刪除低于預(yù)設(shè)閾值的得分所對應(yīng)的查詢結(jié)果,最后輸
7出最終的結(jié)果。
通過本發(fā)明的實施例一的描述可以發(fā)現(xiàn),通過另外的算法計算原始查詢結(jié) 果集中的文檔與當(dāng)前查詢語句的相關(guān)度得分,因此,能從原始結(jié)果集中剔除那 些與當(dāng)前查詢語句不太相關(guān)的文檔,提高了查詢的準(zhǔn)確性。
<具體實施例二>
在本發(fā)明的具體實施例二中,以從歷史查詢語句集中查詢?yōu)槔M行說明。
應(yīng)用于歷史查詢語句數(shù)據(jù)庫時,本發(fā)明實施例的方法包括
步驟A21 ,利用第一算法從歷史查詢語句集中獲取與當(dāng)前查詢語句對應(yīng)的 原始相關(guān)查詢語句集,所述原始相關(guān)查詢語句集包括至少一個歷史查詢語句;
步驟A22,利用與第一算法不同的相關(guān)度算法(如BM25算法、RWR (隨 才幾'游動)算'法、TF/IDF ( Term Frequency/Inverse Document Frequency, i司步貞與 反向文件頻率)算法、Orion算法等算法中的一個或多個)計算原始相關(guān)查詢 語句集中的每個歷史查詢語句與當(dāng)前查詢語句的相關(guān)度得分;
步驟A23,刪除原始相關(guān)查詢語句集中的得分低于預(yù)設(shè)閾值的歷史查詢語 句,得到最終相關(guān)查詢語句集;
步驟A24,利用最終相關(guān)查詢語句集進行推薦查詢輸出。
通過本發(fā)明的實施例二的描述可以發(fā)現(xiàn),通過另外的算法計算原始相關(guān)查 詢語句集中的歷史查詢語句與當(dāng)前查詢語句的相關(guān)度得分,避免了單一算法的 局限性,因此,能從原始相關(guān)查詢語句集中剔除那些與當(dāng)前查詢語句不太相關(guān) 的歷史查詢語句,"^是高了查詢的準(zhǔn)確性。
<具體實施例三>
在本發(fā)明的具體實施例三中,還是以推薦查詢?yōu)槔龑Ρ景l(fā)明的方法進行詳 細(xì)i兌明。
如圖2所示,本發(fā)明實施例三的方法,包括
步驟21,利用第一算法計算歷史查詢語句集中的歷史查詢語句與當(dāng)前查 詢語句的相關(guān)度;
步驟22,按照與當(dāng)前查詢語句的相關(guān)度從大到小的順序,從歷史查詢語 句集中選擇預(yù)定數(shù)目的第一歷史查詢語句,組成原始相關(guān)查詢語句集;
步驟23,利用當(dāng)前查詢語句對查詢對象(如文檔數(shù)據(jù)庫、圖片數(shù)據(jù)庫、本地數(shù)據(jù)庫或網(wǎng)絡(luò)數(shù)據(jù)庫等)執(zhí)行查詢操作,得到包括至少一個查詢結(jié)果(對
應(yīng)的文檔或圖片等類型的文件)的第一查詢結(jié)果集;
步驟24,利用所述原始相關(guān)查詢語句集中的每一個第一歷史查詢語句對 所述查詢對象執(zhí)行查詢操作,得到與所述第一相關(guān)歷史查詢語句集中的每一個 第一歷史查詢語句對應(yīng)的第二查詢結(jié)果集;在此,最好與步驟23采用相同的 查詢算法。
步驟25,計算每一個第二查詢結(jié)果集與所述第一查詢結(jié)果集的相關(guān)度; 步驟26,從所述原始相關(guān)查詢語句集中,排除相關(guān)度得分低于預(yù)設(shè)閾值 的第二查詢結(jié)果集所對應(yīng)的第 一歷史查詢語句,得到最終相關(guān)查詢語句集;
步驟27,基于所述最終相關(guān)查詢語句集中的歷史查詢語句進行推薦。 下面對每個步驟進行詳細(xì)說明。
在步驟21中,該第一算法可以是BM25算法、RWR (隨^/L游動算法)、 TF/IDF ( Term Frequency/Inverse Document Frequency , "^司步貞與反向文^牛步頁率) 算法中的一個或多個。
由于上述的算法都是非常成熟的算法,在此不對其具體的實現(xiàn)過程進行詳 細(xì)描述。
在步驟12中,按照與當(dāng)前查詢語句的相關(guān)度從大到小的順序,從歷史查 詢語句集中選擇預(yù)定數(shù)目的第一歷史查詢語句,其中,該預(yù)定數(shù)目可以根據(jù)系 統(tǒng)的要求設(shè)置,可以設(shè)置多一些,也可以設(shè)置少一些。
通過步驟21和步驟22就得到了 一系列的與當(dāng)前查詢語句相關(guān)的歷史查詢 語句,然而該得到的歷史查詢語句有可能有一些并不是用戶所需要的,也就是 說推薦不準(zhǔn)確。
在第二實施例中,通過利用其他的算法計算歷史查詢語句和當(dāng)前查詢語句 的相關(guān)度,進而利用相關(guān)度來剔除不滿足要求的歷史查詢語句,在本發(fā)明的第 三具體實施例中,進一步通過比較當(dāng)前查詢語句與歷史查詢語句各自得到的查 詢結(jié)果集來對相關(guān)歷史查詢語句進行篩選,以提高推薦的準(zhǔn)確性。
在步驟23和24中,使用查詢語句對查詢對象執(zhí)行查詢操作,在此,該查
詢對象可以是本地數(shù)據(jù)庫、網(wǎng)絡(luò)數(shù)據(jù)庫、文檔數(shù)據(jù)庫、圖片數(shù)據(jù)庫、視頻數(shù) 據(jù)庫等不同類型的數(shù)據(jù)庫中的一個或多個。假設(shè)當(dāng)前查詢語句為A,通過步驟21和步驟22得到的原始相關(guān)查詢語句集中包括A1、 A2和A3,則在執(zhí)行步驟13和步驟14,得到以下的結(jié)果
利用A對查詢對象執(zhí)行查詢操作,得到與A對應(yīng)的查詢結(jié)果集B;
利用Al對查詢對象執(zhí)行查詢操作,得到與Al對應(yīng)的查詢結(jié)果集B1;
利用A2對查詢對象執(zhí)行查詢操作,得到與A2對應(yīng)的查詢結(jié)果集B2;
利用A3對查詢對象執(zhí)行查詢操作,得到與A3對應(yīng)的查詢結(jié)果集B3。
然后需要計算查詢結(jié)果集Bl與查詢結(jié)果集B的相關(guān)度X1、查詢結(jié)果集B2與查詢結(jié)果集B的相關(guān)度X2,以及查詢結(jié)果集B3與查詢結(jié)果集B的相關(guān)度X3。
在本發(fā)明的具體實施例中,對于查詢結(jié)果集中的相關(guān)度計算,可以選擇查詢結(jié)果集中所有的查詢結(jié)果進行計算,也可以分別取查詢結(jié)果集中排在前面的預(yù)定數(shù)目的查詢結(jié)果進行計算。
在本發(fā)明的第二具體實施例中,具體采用如下的方法來計算查詢結(jié)果之間的相關(guān)度。
<方式一〉
利用Objective Feedback (客觀反饋)算法。
每個查詢結(jié)果集中都包括多個查詢結(jié)果,在方式一中利用查詢結(jié)果集中的查詢結(jié)果的數(shù)目信息來計算查詢結(jié)果集之間的相關(guān)度。
查詢結(jié)果集A與查詢結(jié)果集B之間的相關(guān)度為查詢結(jié)果集A與查詢結(jié)果集B的交集所包括的查詢結(jié)果的數(shù)目與查詢結(jié)果集A與查詢結(jié)果集B的并集所包括的查詢結(jié)果的數(shù)目的商。
舉例說明如下。
假設(shè)查詢結(jié)果集A包括D1、 D2、 D3、 D5、 D8和D9這6個查詢結(jié)果,而查詢結(jié)果集B包括D1、 D2、 D4、 D5、 D6、 D7和D9這7個查詢結(jié)果,貝'J二者的交集為4個查詢結(jié)果,即D1、 D2、 D5和D9,而二者的并集為9個查詢結(jié)果,為D1到D9,則查詢結(jié)果集A與查詢結(jié)果集B之間的相關(guān)度為4/9。
當(dāng)然,該相關(guān)度還可以是
查詢結(jié)果集A與查詢結(jié)果集B的交集所包括的查詢結(jié)果的數(shù)目與查詢結(jié)果集A的查詢結(jié)果的數(shù)目的商;
10查詢結(jié)果集A與查詢結(jié)果集B的交集所包括的查詢結(jié)果的數(shù)目與查詢結(jié)果集B的查詢結(jié)果的數(shù)目的商;或者
查詢結(jié)果集A與查詢結(jié)果集B的交集所包括的查詢結(jié)果的數(shù)目。<方式二〉
利用Subjective Feedback (主觀反饋)算法。
每個查詢結(jié)果集中都包括多個查詢結(jié)果,在方式二中利用查詢結(jié)果集中被用戶訪問的查詢結(jié)果的數(shù)目信息來計算查詢結(jié)果集之間的相關(guān)度。
查詢結(jié)果集A與查詢結(jié)果集B之間的相關(guān)度為歷史查詢語句對應(yīng)的查詢結(jié)果集B中被用戶訪問的查詢結(jié)果在查詢結(jié)果集A中出現(xiàn)的數(shù)目與歷史查詢語句對應(yīng)的查詢結(jié)果集B中被用戶訪問的查詢結(jié)果的數(shù)目的比值。
假設(shè)當(dāng)前查詢語句的查詢結(jié)果集A包括D1到D9這9個查詢結(jié)果,而歷史查詢語句的查詢結(jié)果集B中包括D1到D12這12個查詢結(jié)果,而這12個查詢結(jié)果中D1、 D3、 D8、 D9、 D10和D12這6個查詢結(jié)果^皮用戶訪問過,此時,則查詢結(jié)果集A與查詢結(jié)果集B之間的相關(guān)度為4/6。
在上面詳細(xì)描述了兩種算法來計算查詢結(jié)果集的相關(guān)度,當(dāng)然,還可以采用其他的算法來計算二者之間的相關(guān)度,在此不一一列舉。
同時,在上面的描述中是以兩個查詢結(jié)果集的所有查詢結(jié)果進行的說明,當(dāng)然也可以同時從兩個查詢結(jié)果集中取部分查詢結(jié)果來進行計算。
本發(fā)明實施例的查詢系統(tǒng)包括
主查詢模塊,用于利用第一算法從查詢對象中獲取與當(dāng)前查詢語句對應(yīng)的原始查詢結(jié)果集,所述原始查詢結(jié)果集包括至少一個查詢結(jié)果;
優(yōu)化模塊,用于利用第二算法計算每個所述查詢結(jié)果與所述當(dāng)前查詢語句的相關(guān)度得分,并從所述原始查詢結(jié)果集中刪除得分低于預(yù)設(shè)閾值的查詢結(jié)果,得到最終查詢結(jié)果集;
輸出模塊,用于根據(jù)所述最終查詢結(jié)果集進行輸出處理。
在用于推薦搜索時,所述查詢對象為歷史查詢語句集,所述原始查詢結(jié)果集為包括至少一個歷史查詢語句的原始相關(guān)查詢語句集,所述優(yōu)化模塊具體包括
第一查詢單元,用于利用當(dāng)前查詢語句對查詢對象(如文檔數(shù)據(jù)庫、圖片數(shù)據(jù)庫、本地數(shù)據(jù)庫或網(wǎng)絡(luò)數(shù)據(jù)庫等)執(zhí)行查詢操作,得到包括至少 一個查詢結(jié)果(對應(yīng)的文檔或圖片等類型的文件)的第一查詢結(jié)果集,并利用所述原始相關(guān)查詢語句集中的每一個歷史查詢語句對所述查詢對象執(zhí)行查詢操作,得到與所述原始相關(guān)查詢語句集的每一個歷史查詢語句對應(yīng)的第二查詢結(jié)果集;計算單元,用于計算每一個第二查詢結(jié)果集與所述第一查詢結(jié)果集的相關(guān)度;.
排除單元,從所述原始相關(guān)查詢語句集中,排除相關(guān)度得分低于預(yù)設(shè)閾值
的第二查詢結(jié)果集所對應(yīng)的第 一歷史查詢語句,得到最終相關(guān)查詢語句集;
所述輸出模塊具體用于基于所述最終相關(guān)查詢語句集中的歷史查詢語句進行推薦。
所述輸出模塊使用的推薦方法包括查詢擴展,推薦相關(guān)查詢語句,推薦相關(guān)文檔,推薦相關(guān)用戶等等。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以作出若干改進和潤飾,這些改進和潤飾也應(yīng)^L為本發(fā)明的保護范圍。
權(quán)利要求
1.一種查詢方法,其特征在于,包括步驟A,利用查詢算法從查詢對象中獲取與當(dāng)前查詢語句對應(yīng)的原始查詢結(jié)果集,所述原始查詢結(jié)果集包括至少一個查詢結(jié)果;步驟B,利用相關(guān)度算法計算所述原始查詢結(jié)果集中的每個查詢結(jié)果與所述當(dāng)前查詢語句的相關(guān)度得分;步驟C,從所述原始查詢結(jié)果集中刪除相關(guān)度得分低于預(yù)設(shè)閾值的查詢結(jié)果,得到最終查詢結(jié)果集;步驟D,根據(jù)所述最終查詢結(jié)果集進行輸出處理。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于所述方法用于推薦查詢時,所述查詢對象為歷史查詢語句集,所述原始查 詢結(jié)果集為包括至少一個歷史查詢語句的原始相關(guān)查詢語句集;所述步驟B具體為計算每一個第二查詢結(jié)果集與所述第一查詢結(jié)果集 的相關(guān)度得分,所述第一查詢結(jié)果集為利用所述當(dāng)前查詢語句對數(shù)據(jù)庫執(zhí)行查 詢操作得到的查詢結(jié)果集,所述第二查詢結(jié)果集為分別利用所述原始相關(guān)查詢 語句集中的每一個歷史查詢語句對所述數(shù)據(jù)庫執(zhí)行查詢操作得到的查詢結(jié)果 集;所述相關(guān)度得分低于預(yù)設(shè)閾值的查詢結(jié)果為相關(guān)度得分低于所述預(yù)設(shè)閾 值的第二查詢結(jié)果集所對應(yīng)的歷史查詢語句。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述計算每一個第二查詢 結(jié)果集與所述第一查詢結(jié)果集的相關(guān)度得分時,所述第二查詢結(jié)果集與所述第 一查詢結(jié)果集中相同的查詢結(jié)果越多,則所述第二查詢結(jié)果集與所述第一查詢 結(jié)果集的相關(guān)度得分越高。
4. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述計算每一個第二查詢 結(jié)果集與所述第一查詢結(jié)果集的相關(guān)度得分時,所述第二查詢結(jié)果集中被用戶 訪問過的查詢結(jié)果在所述第一查詢結(jié)果集中出現(xiàn)的越多,所述第二查詢結(jié)果集 與所述第一查詢結(jié)果集的相關(guān)度得分越高。
5. 根據(jù)權(quán)利要求2或3或4所述的方法,其特征在于,所述步驟D具體為根據(jù)所述最終查詢結(jié)果集中的部分或全部歷史查詢語句進行推薦輸出。
6. —種查詢系統(tǒng),其特征在于,包括主查詢模塊,用于利用查詢算法從查詢對象中獲取與當(dāng)前查詢語句對應(yīng)的 原始查詢結(jié)果集,所述原始查詢結(jié)果集包括至少一個查詢結(jié)果;優(yōu)化模塊,用于利用相關(guān)度算法計算所述原始查詢結(jié)果集中的每個查詢結(jié) 果與所述當(dāng)前查詢語句的相關(guān)度得分,并從所述原始查詢結(jié)果集中刪除相關(guān)度 得分低于預(yù)設(shè)閾值的查詢結(jié)果,得到最終查詢結(jié)果集;輸出模塊,用于根據(jù)所述最終查詢結(jié)果集進行輸出處理。
7. 根據(jù)權(quán)利要求6所述的查詢系統(tǒng),其特征在于所述查詢系統(tǒng)用于推薦查詢時,所述查詢對象為歷史查詢語句集,所述原 始查詢結(jié)果集為包括至少一個歷史查詢語句的原始相關(guān)查詢語句集; 所述優(yōu)化模塊具體包括計算單元,用于計算每一個第二查詢結(jié)果集與所述第一查詢結(jié)果集的相關(guān) 度得分,所述第 一查詢結(jié)果集為利用所述當(dāng)前查詢語句對數(shù)據(jù)庫執(zhí)行查詢操作 得到的查詢結(jié)果集,所述第二查詢結(jié)果集為分別利用所述原始相關(guān)查詢語句集 中的每一個歷史查詢語句對所述數(shù)據(jù)庫執(zhí)行查詢操作得到的查詢結(jié)果集;刪除單元,從所述原始相關(guān)查詢語句集中刪除相關(guān)度得分低于所述預(yù)設(shè)闊 值的第二查詢結(jié)果集所對應(yīng)的歷史查詢語句。
8. 根據(jù)權(quán)利要求7所述的查詢系統(tǒng),其特征在于,所述第二查詢結(jié)果集 與所述第一查詢結(jié)果集中相同的查詢結(jié)果越多,則所述第二查詢結(jié)果集與所述 第一查詢結(jié)果集的相關(guān)度得分越高。
9. 根據(jù)權(quán)利要求7所述的查詢系統(tǒng),其特征在于,所述第二查詢結(jié)果集 中被用戶訪問過的查詢結(jié)果在所述第一查詢結(jié)果集中出現(xiàn)的越多,所述第二查 詢結(jié)果集與所述第一查詢結(jié)果集的相關(guān)度得分越高。
10. 根據(jù)權(quán)利要求7或8或9所述的查詢系統(tǒng),其特征在于,所述輸出模 塊具體用于根據(jù)所述最終查詢結(jié)果集中的部分或全部歷史查詢語句進行推薦 輸出。
全文摘要
本發(fā)明提供一種查詢方法及系統(tǒng),方法包括步驟A,利用查詢算法從查詢對象中獲取與當(dāng)前查詢語句對應(yīng)的原始查詢結(jié)果集,所述原始查詢結(jié)果集包括至少一個查詢結(jié)果;步驟B,利用相關(guān)度算法計算所述原始查詢結(jié)果集中的每個查詢結(jié)果與所述當(dāng)前查詢語句的相關(guān)度得分;步驟C,從所述原始查詢結(jié)果集中刪除相關(guān)度得分低于預(yù)設(shè)閾值的查詢結(jié)果,得到最終查詢結(jié)果集;步驟D,根據(jù)所述最終查詢結(jié)果集進行輸出處理。本發(fā)明實施例通過使用其他的算法對第一次查詢得到的結(jié)果進行篩選,從原始結(jié)果中排除與用戶需求不符的對象,提高了查詢準(zhǔn)確性。
文檔編號G06F17/30GK101661484SQ20081021268
公開日2010年3月3日 申請日期2008年8月29日 優(yōu)先權(quán)日2008年8月29日
發(fā)明者史達飛, 尹悅燕, 剛 李, 燕 李, 魯耀杰 申請人:株式會社理光