一種信息搜索方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)通信領(lǐng)域,特別涉及一種信息搜索方法及裝置。
【背景技術(shù)】
[0002] 目前,為了使用戶從海量的信息中快速查找需要的信息,出現(xiàn)了很多專門用于搜 索信息的搜索平臺(tái)。用戶可以通過終端登錄搜索平臺(tái)來搜索需要的信息。例如,視頻搜索 平臺(tái)是專門用于搜索視頻的搜索平臺(tái),用戶可以通過終端登錄視頻搜索平臺(tái)來搜索需要的 視頻。
[0003] 當(dāng)前,現(xiàn)有技術(shù)提供了一種信息搜索方法,包括:終端接收用戶輸入的關(guān)鍵詞,將 該關(guān)鍵詞發(fā)送給服務(wù)器。服務(wù)器根據(jù)該關(guān)鍵詞獲取所有與該關(guān)鍵詞匹配的信息,計(jì)算每個(gè) 信息與該關(guān)鍵詞之間的相關(guān)度,然后根據(jù)技術(shù)人員事先憑經(jīng)驗(yàn)設(shè)定的篩選條件,對(duì)獲取的 信息進(jìn)行篩選,舍棄不滿足篩選條件的信息。其中,篩選條件與信息的特征有關(guān),信息的特 征可以為相關(guān)度、點(diǎn)擊量或更新時(shí)間等。例如,篩選條件可以為保留相關(guān)度大于預(yù)設(shè)閾值或 點(diǎn)擊量大于預(yù)設(shè)閾值的信息等。將剩余的信息按照相關(guān)度從高到低的順序進(jìn)行排序,將排 序后的信息發(fā)送給終端。終端接收服務(wù)器發(fā)送的信息,將接收的信息顯示給用戶。
[0004] 在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:
[0005] 技術(shù)人員憑經(jīng)驗(yàn)設(shè)定篩選條件,由于技術(shù)人員的經(jīng)驗(yàn)不足,從而很難設(shè)定出涵蓋 信息的所有特征的篩選條件,如此根據(jù)該篩選條件來篩選信息,導(dǎo)致篩選信息的準(zhǔn)確性很 低。
【發(fā)明內(nèi)容】
[0006] 為了提高篩選信息的準(zhǔn)確性,本發(fā)明提供了一種信息搜索方法及裝置。所述技術(shù) 方案如下:
[0007] -種信息搜索方法,所述方法包括:
[0008] 接收終端發(fā)送的關(guān)鍵詞;
[0009] 根據(jù)所述關(guān)鍵詞,搜索與所述關(guān)鍵詞匹配的信息;
[0010] 從所述信息中篩選出滿足某一預(yù)設(shè)篩選條件的信息并組成第一信息集合,所述預(yù) 設(shè)篩選條件為根據(jù)歷史搜索記錄進(jìn)行設(shè)置的,所述歷史搜索記錄中包括用戶歷史搜索的關(guān) 鍵詞、所述關(guān)鍵詞對(duì)應(yīng)的信息和所述信息的點(diǎn)擊次數(shù);
[0011] 向所述終端發(fā)送所述第一信息集合。
[0012] -種信息搜索裝置,所述裝置包括:
[0013] 接收模塊,用于接收終端發(fā)送的關(guān)鍵詞;
[0014] 搜索模塊,用于根據(jù)所述關(guān)鍵詞,搜索與所述關(guān)鍵詞匹配的信息;
[0015] 篩選模塊,用于從所述信息中篩選出滿足某一預(yù)設(shè)篩選條件的信息并組成第一信 息集合,所述預(yù)設(shè)篩選條件為根據(jù)歷史搜索記錄進(jìn)行設(shè)置的,所述歷史搜索記錄中包括用 戶歷史搜索的關(guān)鍵詞、所述關(guān)鍵詞對(duì)應(yīng)的信息和所述信息的點(diǎn)擊次數(shù);
[0016] 發(fā)送模塊,用于向所述終端發(fā)送所述第一信息集合。
[0017] 在本發(fā)明實(shí)施例中,接收終端發(fā)送的關(guān)鍵詞;根據(jù)該關(guān)鍵詞,搜索與該關(guān)鍵詞匹配 的信息;從該信息中篩選出滿足某一預(yù)設(shè)篩選條件的信息并組成第一信息集合,該預(yù)設(shè)篩 選條件為根據(jù)歷史搜索記錄進(jìn)行設(shè)置的,該歷史搜索記錄中包括用戶歷史搜索的關(guān)鍵詞、 關(guān)鍵詞對(duì)應(yīng)的信息和信息的點(diǎn)擊次數(shù);向終端發(fā)送第一信息集合。由于根據(jù)歷史搜索記錄 中包括的用戶歷史搜索的關(guān)鍵詞、關(guān)鍵詞對(duì)應(yīng)的信息和信息的點(diǎn)擊次數(shù)設(shè)置了預(yù)設(shè)篩選條 件,如此設(shè)置的預(yù)設(shè)篩選條件涵蓋的信息的特征比技術(shù)人員憑經(jīng)驗(yàn)設(shè)定的預(yù)設(shè)篩選條件涵 蓋的特征要全面很多,根據(jù)該預(yù)設(shè)篩選條件來篩選信息,可以提高篩選信息的準(zhǔn)確性。
【附圖說明】
[0018] 圖1是本發(fā)明實(shí)施例1提供的一種信息搜索方法流程圖;
[0019] 圖2-1是本發(fā)明實(shí)施例2提供的一種信息搜索方法流程圖;
[0020] 圖2-2是本發(fā)明實(shí)施例2提供的一種搜索接口的示意圖;
[0021] 圖3是本發(fā)明實(shí)施例3提供的一種信息搜索方法流程圖;
[0022] 圖4是本發(fā)明實(shí)施例4提供的一種信息搜索裝置的結(jié)構(gòu)示意圖;
[0023] 圖5是本發(fā)明實(shí)施例5提供的一種服務(wù)器的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0024] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方 式作進(jìn)一步地詳細(xì)描述。
[0025] 實(shí)施例1
[0026] 參見圖1,本發(fā)明實(shí)施例提供了一種信息搜索方法,包括:
[0027] 步驟101 :接收終端發(fā)送的關(guān)鍵詞;
[0028] 步驟102 :根據(jù)該關(guān)鍵詞,搜索與該關(guān)鍵詞匹配的信息;
[0029] 步驟103 :從該信息中篩選出滿足某一預(yù)設(shè)篩選條件的信息并組成第一信息集 合,該預(yù)設(shè)篩選條件為根據(jù)歷史搜索記錄進(jìn)行設(shè)置的,該歷史搜索記錄中包括用戶歷史搜 索的關(guān)鍵詞、關(guān)鍵詞對(duì)應(yīng)的信息和信息的點(diǎn)擊次數(shù);
[0030] 步驟104 :向終端發(fā)送第一信息集合。
[0031] 優(yōu)選地,從該信息中篩選出滿足某一預(yù)設(shè)篩選條件的信息并組成第一信息集合, 包括:
[0032] 分別計(jì)算每個(gè)信息與該關(guān)鍵詞之間的相關(guān)度;
[0033] 將相關(guān)度大于預(yù)設(shè)閾值的信息組成第一信息集合,以及將相關(guān)度小于或等于預(yù)設(shè) 閾值的信息組成第二信息集合;
[0034] 分別獲取第二信息集合中包括的每個(gè)信息的信息特征,以及獲取該關(guān)鍵詞的特 征;
[0035] 根據(jù)第二信息集合中包括的每個(gè)信息的信息特征以及該關(guān)鍵詞的特征,從第二信 息集合中篩選出滿足某一預(yù)設(shè)篩選條件的信息,將篩選的信息加入第一信息集合。
[0036] 進(jìn)一步地,接收終端發(fā)送的關(guān)鍵詞之前,還包括:
[0037] 從第一搜索平臺(tái)存儲(chǔ)的歷史搜索記錄中,獲取點(diǎn)擊次數(shù)滿足預(yù)設(shè)點(diǎn)擊條件的信息 并構(gòu)成第三信息集合以及獲取第三信息集合中的每個(gè)信息對(duì)應(yīng)的關(guān)鍵詞并構(gòu)成關(guān)鍵詞集 合;
[0038] 根據(jù)第三信息集合中的每個(gè)信息的信息特征和關(guān)鍵詞集合中的每個(gè)關(guān)鍵詞的特 征,設(shè)置預(yù)設(shè)篩選條件。
[0039] 優(yōu)選地,從第一搜索平臺(tái)存儲(chǔ)的歷史搜索記錄中,獲取點(diǎn)擊次數(shù)滿足預(yù)設(shè)點(diǎn)擊條 件的信息并構(gòu)成第三信息集合,包括:
[0040] 從第一搜索平臺(tái)存儲(chǔ)的歷史搜索記錄中,獲取歷史搜索記錄中包括的每個(gè)信息的 點(diǎn)擊次數(shù);
[0041] 從每個(gè)信息中,獲取點(diǎn)擊次數(shù)大于預(yù)設(shè)次數(shù)閾值的信息并構(gòu)成第三信息集合;或 者,
[0042] 從每個(gè)信息中,獲取點(diǎn)擊次數(shù)小于或等于預(yù)設(shè)次數(shù)閾值的信息并構(gòu)成第三信息集 合。
[0043] 進(jìn)一步地,從每個(gè)信息中,獲取點(diǎn)擊次數(shù)小于或等于預(yù)設(shè)次數(shù)閾值的信息并構(gòu)成 第三信息集合之后,還包括:
[0044] 從第三信息集合中獲取第一關(guān)鍵詞對(duì)應(yīng)的每個(gè)信息并構(gòu)成第四信息集合,第一關(guān) 鍵詞為關(guān)鍵詞集合中包括的任一關(guān)鍵詞;
[0045] 根據(jù)第一關(guān)鍵詞從第二搜索平臺(tái)存儲(chǔ)的歷史搜索記錄中獲取對(duì)應(yīng)的信息的信息 類型并構(gòu)成類型集合,第二搜索平臺(tái)為搜索平臺(tái)中除第一搜索平臺(tái)以外的任一搜索平臺(tái); [0046] 從第四信息集合中獲取信息類型與類型集合中的每種信息類型相同的信息,從第 二息集合中去除獲取的息。
[0047] 優(yōu)選地,根據(jù)第三信息集合中的每個(gè)信息的信息特征和關(guān)鍵詞集合中的每個(gè)關(guān)鍵 詞的特征,設(shè)置預(yù)設(shè)篩選條件,包括:
[0048] 根據(jù)第三信息集合中的每個(gè)信息的信息特征和關(guān)鍵詞集合中的每個(gè)關(guān)鍵詞的特 征,通過分類模型統(tǒng)計(jì)預(yù)設(shè)篩選條件,該分類模型至少包括決策樹模型、樸素貝葉斯模型和 支持向量機(jī)。
[0049] 在本發(fā)明實(shí)施例中,接收終端發(fā)送的關(guān)鍵詞;根據(jù)該關(guān)鍵詞,搜索與該關(guān)鍵詞匹配 的信息;從該信息中篩選出滿足某一預(yù)設(shè)篩選條件的信息并組成第一信息集合,該預(yù)設(shè)篩 選條件為根據(jù)歷史搜索記錄進(jìn)行設(shè)置的,該歷史搜索記錄中包括用戶歷史搜索的關(guān)鍵詞、 關(guān)鍵詞對(duì)應(yīng)的信息和信息的點(diǎn)擊次數(shù);向終端發(fā)送第一信息集合。由于根據(jù)歷史搜索記錄 中包括的用戶歷史搜索的關(guān)鍵詞、關(guān)鍵詞對(duì)應(yīng)的信息和信息的點(diǎn)擊次數(shù)設(shè)置了預(yù)設(shè)篩選條 件,如此設(shè)置的預(yù)設(shè)篩選條件涵蓋的信息的特征比技術(shù)人員憑經(jīng)驗(yàn)設(shè)定的預(yù)設(shè)篩選條件涵 蓋的特征要全面很多,根據(jù)該預(yù)設(shè)篩選條件來篩選信息,可以提高篩選信息的準(zhǔn)確性。
[0050] 實(shí)施例2
[0051 ] 本發(fā)明實(shí)施例提供了 一種信息搜索方法。
[0052] 當(dāng)用戶通過終端登錄第一搜索平臺(tái)來搜索需要的信息時(shí),第一搜索平臺(tái)可以通過 本發(fā)明實(shí)施例提供的方法來搜索信息。其中,第一搜索平臺(tái)為搜索平臺(tái)中包括的任一搜索 平臺(tái)。
[0053] 其中,搜索平臺(tái)可以為視頻搜索平臺(tái)等,視頻搜索平臺(tái)是專門用于搜索視頻的搜 索平臺(tái)。
[0054] 參見圖2-1,該方法具體包括:
[0055] 其中,在搜索信息之前,需要通過如下步驟201-204的操作來設(shè)置篩選信息的預(yù) 設(shè)篩選條件,該預(yù)設(shè)篩選條件為根據(jù)歷史搜索記錄進(jìn)行設(shè)置的,該歷史搜索記錄中包括用 戶歷史搜索的關(guān)鍵詞、關(guān)鍵詞對(duì)應(yīng)的信息和信息的點(diǎn)擊次數(shù)。
[0056] 步驟201 :從第一搜索平臺(tái)存儲(chǔ)的歷史搜索記錄中,獲取點(diǎn)擊次數(shù)滿足預(yù)設(shè)點(diǎn)擊 條件的信息并構(gòu)成第三信息集合,該預(yù)設(shè)點(diǎn)擊條件為信息的點(diǎn)擊次數(shù)大于預(yù)設(shè)次數(shù)閾值;
[0057] 其中,用戶通過第一搜索平臺(tái)搜索信息時(shí),第一搜索平臺(tái)記錄了用戶搜索的關(guān)鍵 詞,以及根據(jù)該關(guān)鍵詞搜索到的信息,同時(shí)記錄了搜索到的每個(gè)信息被用戶點(diǎn)擊的點(diǎn)擊次 數(shù),并將記錄的用戶歷史搜索的關(guān)鍵詞、該關(guān)鍵詞對(duì)應(yīng)的信息和該信息的點(diǎn)擊次數(shù)組成歷 史搜索記錄。
[0058] 本步驟具體為,從第一搜索平臺(tái)存儲(chǔ)的歷史搜索記錄中,獲取該歷史搜索記錄中 包括的每個(gè)信息的點(diǎn)擊次數(shù)。從歷史搜索記錄中包括的每個(gè)信息中,獲取點(diǎn)擊次數(shù)大于預(yù) 設(shè)次數(shù)閾值的信息并構(gòu)成第三信息集合。
[0059] 例如,本發(fā)明實(shí)施例以搜索視頻為例進(jìn)行說明,則第一搜索平臺(tái)為第一視頻搜索 平臺(tái),搜索的信息為視頻。假設(shè)預(yù)設(shè)次數(shù)閾值為500次。第一視頻搜索平臺(tái)從第一視頻搜 索平臺(tái)存儲(chǔ)的如表1所示的歷史搜索記錄中,獲取該歷史搜索記錄中包括的每個(gè)視頻的點(diǎn) 擊次數(shù),分別為 Videol 為 1000 次,Video2 為 1500 次,Video3 為 800 次,Video4 為 100 次, Video5 為 50 次,Video6 為 20 次,Video7 為 10 次,Video8 為 15 次,Video9 為 30 次。從該 歷史搜索記錄中包括的每個(gè)視頻中,獲取點(diǎn)擊次數(shù)大于預(yù)設(shè)次數(shù)閾值的視頻,即獲取了視 頻Videol、Video2和Video3,將獲取的視頻Videol、Video2和Video3構(gòu)成第三視頻集合 U3。
[0060] 表 1
[0061]
[0062] 其中,由于第三信息集合中的每個(gè)信息的點(diǎn)擊次數(shù)都大于預(yù)設(shè)次數(shù)閾值,說明很 多用戶搜索到這些信息之后瀏覽了這些信息,因此認(rèn)為這些信息都是符合用戶需求的。例 如,假設(shè)用戶根據(jù)關(guān)鍵詞"張三出游"搜索信息,搜索出信息1和信息2,用戶點(diǎn)擊了信息1 而沒有點(diǎn)擊信息2,則認(rèn)為信息