專利名稱:一種用于確定查詢序列的查詢類別的設(shè)備及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及涉及自然語(yǔ)言處理技術(shù),尤其涉及用于確定查詢序列的查詢類別的技 術(shù)。
背景技術(shù):
在現(xiàn)有技術(shù)中,對(duì)用戶的查詢序列進(jìn)行查詢分類時(shí),往往通過靜態(tài)專有名詞詞典 結(jié)合查詢類別需求后綴來簡(jiǎn)單識(shí)別。然而,該分類方法過多地依賴于詞典中專有名詞挖掘 的準(zhǔn)確率和召回率,加上專有名詞相對(duì)比較固定,并不能真正滿足用戶查詢分類的要求。此 處的召回率和準(zhǔn)確率是廣泛應(yīng)用于信息檢索和統(tǒng)計(jì)學(xué)分類領(lǐng)域的兩個(gè)度量值,用于評(píng)價(jià)檢 索或統(tǒng)計(jì)結(jié)果的質(zhì)量,召回率是指檢索出的相關(guān)文檔數(shù)和文檔庫(kù)中所有的相關(guān)文檔數(shù)的比 率,其主要用于衡量檢索系統(tǒng)的查全率;而準(zhǔn)確率是指檢索出的相關(guān)文檔數(shù)與檢索出的文 檔總數(shù)的比率,其主要用于衡量檢索系統(tǒng)的精度。此外,上述傳統(tǒng)的分類方法無(wú)法實(shí)時(shí)添加互聯(lián)網(wǎng)上的新增詞,當(dāng)用戶輸入新的查 詢序列時(shí),與這些新增詞相對(duì)應(yīng)的相關(guān)搜索資源可能無(wú)法提供給用戶,極大地影響了檢索 的召回率。有鑒于此,如何對(duì)查詢序列進(jìn)行擴(kuò)展,并根據(jù)擴(kuò)展后的查詢序列來確定所述查詢 序列的查詢類別,提高檢索的準(zhǔn)確率和召回率,是相關(guān)技術(shù)人員亟待解決的一項(xiàng)課題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于確定查詢序列的查詢類別的設(shè)備及其方法。根據(jù)本發(fā)明的一個(gè)方面,提供一種計(jì)算機(jī)實(shí)現(xiàn)的用于確定查詢序列的查詢類別的 方法,其中,該方法包括以下步驟a獲取待確定查詢類別的查詢序列;b對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量;c將所述擴(kuò)展向量與多個(gè)查詢分類進(jìn)行匹配,以獲取所述擴(kuò)展向量與所述查詢分 類的相關(guān)度;d根據(jù)所述相關(guān)度,確定所述查詢序列的查詢類別。根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種用于確定查詢序列的查詢類別的設(shè)備, 其中,該設(shè)備包括查詢序列獲取裝置,用于獲取待確定查詢類別的查詢序列;擴(kuò)展向量獲取裝置,用于對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相對(duì) 應(yīng)的擴(kuò)展向量;匹配裝置,用于將所述擴(kuò)展向量與多個(gè)查詢分類進(jìn)行匹配,以獲取所述擴(kuò)展向量 與所述查詢分類的相關(guān)度;類別確定裝置,用于根據(jù)所述相關(guān)度,確定所述查詢序列的查詢類別。與現(xiàn)有技術(shù)相比,本發(fā)明首先對(duì)查詢序列進(jìn)行擴(kuò)展,并將擴(kuò)展后的擴(kuò)展向量與多個(gè)查詢分類匹配,根據(jù)所述擴(kuò)展向量與所述查詢分類的相關(guān)度來確定所述查詢序列的查詢 類別,顯著地提高檢索的準(zhǔn)確率和召回率,增強(qiáng)了用戶體驗(yàn)。
通過閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它 特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯圖1示出根據(jù)本發(fā)明一個(gè)方面的用于確定查詢序列的查詢類別的設(shè)備示意圖;圖2示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的用于確定查詢序列的查詢類別的設(shè)備示 意圖;圖3示出根據(jù)本發(fā)明另一個(gè)方面的用于確定查詢序列的查詢類別的方法流程圖;圖4示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的用于確定查詢序列的查詢類別的方法流 程圖。附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
具體實(shí)施例方式下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。圖1示出根據(jù)本發(fā)明一個(gè)方面的用于確定查詢序列的查詢類別的設(shè)備示意圖。其 中,網(wǎng)絡(luò)設(shè)備1包括但不限于單個(gè)搜索引擎服務(wù)器、多個(gè)搜索引擎服務(wù)器集、基于云計(jì)算的 計(jì)算機(jī)集合或者通過網(wǎng)絡(luò)與搜索引擎服務(wù)器相連接的其他第三方的服務(wù)器,此處的網(wǎng)絡(luò)包 括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)、無(wú)線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。 本領(lǐng)域技術(shù)人員應(yīng)能理解上述網(wǎng)絡(luò)設(shè)備1僅為示意性地舉例說明,其他現(xiàn)有的或今后可能 出現(xiàn)的用于確定查詢序列的查詢類別的設(shè)備如可適用本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍 以內(nèi),并以引用方式包含于此。該網(wǎng)絡(luò)設(shè)備1包括查詢序列獲取裝置11、擴(kuò)展向量獲取裝置12、匹配裝置13和類 別確定裝置14。其中,查詢序列獲取裝置11用于獲取待確定查詢類別的查詢序列。具體 地,查詢序列獲取裝置11可以獲取由用戶通過用戶設(shè)備輸入的查詢序列,也可以獲取由諸 如搜索引擎服務(wù)器的查詢序列數(shù)據(jù)庫(kù)中得到的查詢序列。以獲取查詢序列數(shù)據(jù)庫(kù)的查詢序 列為例,當(dāng)查詢序列獲取裝置11向所述查詢序列數(shù)據(jù)庫(kù)發(fā)出查詢序列請(qǐng)求時(shí),所述查詢序 列數(shù)據(jù)庫(kù)對(duì)該請(qǐng)求作出響應(yīng),并將特定的查詢序列返回至查詢序列獲取裝置11。此外,查詢 序列獲取裝置11還可以定期地接收來自查詢序列數(shù)據(jù)庫(kù)的多個(gè)查詢序列,以便更準(zhǔn)確地 確定這些查詢序列的查詢類別。本領(lǐng)域技術(shù)人員應(yīng)能理解上述待確定查詢類別的查詢序列 的獲取方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的查詢序列的獲取方式如可適用于本發(fā) 明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。擴(kuò)展向量獲取裝置12用于對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相 對(duì)應(yīng)的擴(kuò)展向量。具體地,當(dāng)查詢序列獲取裝置11獲取待確定查詢類別的查詢序列后,擴(kuò) 展向量獲取裝置12對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量, 從而實(shí)現(xiàn)對(duì)所述查詢序列的擴(kuò)展。例如,當(dāng)所述查詢序列獲取裝置11獲取所述待確定查詢 類別的查詢序列后,首先,對(duì)所述查詢序列進(jìn)行切詞處理,得到與所述查詢序列相對(duì)應(yīng)的多 個(gè)詞;然后,利用這些詞進(jìn)行搜索,獲取與所述詞相對(duì)應(yīng)的多個(gè)瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為;接著,根據(jù)這些瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。又例 如,當(dāng)所述查詢序列獲取裝置11獲取所述待確定查詢類別的查詢序列后,首先,對(duì)所述查 詢序列進(jìn)行同義變換處理,得到與所述查詢序列相對(duì)應(yīng)的等效查詢序列;然后,對(duì)所述等效 查詢序列進(jìn)行切詞處理,得到與所述等效查詢序列相對(duì)應(yīng)的多個(gè)詞;接著,利用這些詞進(jìn)行 搜索,獲取搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的所有詞以及詞頻和詞位置信息;最后,根據(jù) 搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的這些詞以及詞頻和詞位置信息,獲取與所述查詢序列 相對(duì)應(yīng)的擴(kuò)展向量,其中,可以將搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的這些詞作為所述擴(kuò) 展向量的向量維度,并將這些詞的詞頻和詞位置信息作為所述擴(kuò)展向量中每一向量維度的 權(quán)重。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取擴(kuò)展向量的方式僅為舉例,其他現(xiàn)有的或今后可 能出現(xiàn)的獲取擴(kuò)展向量的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以 引用方式包含于此。匹配裝置13用于將所述擴(kuò)展向量與多個(gè)查詢分類進(jìn)行匹配,以獲取所述擴(kuò)展向 量與所述查詢分類的相關(guān)度。具體地,當(dāng)所述擴(kuò)展向量獲取裝置12獲取與所述查詢序列相 對(duì)應(yīng)的擴(kuò)展向量后,所述匹配裝置13將對(duì)應(yīng)于所述查詢序列的所述擴(kuò)展向量與查詢分類 的多個(gè)詞進(jìn)行匹配。例如,首先將所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,然后將擴(kuò)展后的向量與 所述查詢序列的所述擴(kuò)展向量進(jìn)行匹配。對(duì)所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展的一種優(yōu)選方 式為首先,利用查詢分類的多個(gè)詞進(jìn)行搜索,獲取與所述詞相對(duì)應(yīng)的多個(gè)瀏覽網(wǎng)頁(yè)和/或 點(diǎn)擊行為;接著,根據(jù)這些瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為,獲取與所述查詢分類的多個(gè)詞相對(duì)應(yīng) 的向量。對(duì)所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展的另一種優(yōu)選方式為首先,利用查詢分類的多 個(gè)詞進(jìn)行搜索,獲取搜索結(jié)果中與所述查詢分類的詞相對(duì)應(yīng)的所有詞以及詞頻和詞位置信 息;然后,根據(jù)搜索結(jié)果中與所述查詢分類的詞相對(duì)應(yīng)的所有詞以及詞頻和詞位置信息,獲 取對(duì)所述查詢分類的詞進(jìn)行擴(kuò)展后的向量,其中,將搜索結(jié)果中與所述查詢分類的詞相對(duì) 應(yīng)的所有詞作為所述擴(kuò)展向量的向量維度,并將這些詞的詞頻和詞位置信息作為所述擴(kuò)展 向量中每一向量維度的權(quán)重。此外,將所述查詢分類中的多個(gè)詞進(jìn)行擴(kuò)展后的向量(稱為 “第一向量”)與所述查詢序列的所述擴(kuò)展向量(稱為“第二向量”)進(jìn)行匹配時(shí),匹配方式包 括但不限于以下至少任一項(xiàng)計(jì)算第一向量與第二向量在同一向量空間下的重疊程度,即 夾角余弦值,所述夾角余弦值越大,表示兩個(gè)向量間的夾角越小,也表明兩個(gè)向量更相關(guān); 計(jì)算第一向量與第二向量在同一向量空間下的距離,即向量差,所述向量差越小,表示兩個(gè) 向量更靠近,也表明兩個(gè)向量更相關(guān)。本領(lǐng)域技術(shù)人員應(yīng)能理解上述查詢序列的擴(kuò)展向量 與多個(gè)查詢分類間的匹配方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的查詢序列的擴(kuò)展向 量與多個(gè)查詢分類間的匹配方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并 以引用方式包含于此。類別確定裝置14用于根據(jù)所述相關(guān)度,確定所述查詢序列的查詢類別。具體地, 當(dāng)匹配裝置13獲取所述查詢序列的擴(kuò)展向量與所述查詢分類的相關(guān)度后,類別確定裝置 14根據(jù)所述相關(guān)度,確定所述查詢序列對(duì)應(yīng)于多個(gè)查詢類別中的哪一個(gè)或多個(gè)查詢類別。 例如,當(dāng)所述查詢序列的擴(kuò)展向量與對(duì)應(yīng)于所述查詢類別的向量之間的夾角最小時(shí),根據(jù) 向量間的重疊程度確定所述查詢序列歸屬于所述查詢類別。又例如,當(dāng)所述查詢序列的擴(kuò) 展向量與對(duì)應(yīng)于所述查詢類別的向量之間的距離最小時(shí),根據(jù)向量間的距離遠(yuǎn)近確定所述 查詢序列歸屬于所述查詢類別。此外,對(duì)所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,并將擴(kuò)展后的向量與所述查詢序列的擴(kuò)展向量進(jìn)行匹配時(shí),所述查詢分類的每個(gè)詞擴(kuò)展后的向量與所述查 詢序列的擴(kuò)展向量進(jìn)行匹配后均得到一個(gè)相關(guān)度數(shù)值,通過算術(shù)平均、幾何平均、加權(quán)平均 或其他可適用的均值處理方式,根據(jù)多個(gè)相關(guān)度數(shù)值來獲取所述查詢序列的擴(kuò)展向量與所 述多個(gè)查詢分類之間的平均相關(guān)度,所述類別確定裝置14根據(jù)所述平均相關(guān)度來確定所 述查詢序列的查詢類別。本領(lǐng)域技術(shù)人員應(yīng)能理解上述根據(jù)擴(kuò)展向量與查詢分類間的相關(guān) 度來確定查詢序列的查詢類別的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的確定查詢序 列的查詢類別的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式 包含于此。優(yōu)選地,在上述圖1所描述的實(shí)施例的基礎(chǔ)上,所述擴(kuò)展向量獲取裝置12還用于 根據(jù)所述查詢序列,通過內(nèi)容擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如,當(dāng) 所述查詢序列獲取裝置11獲取所述待確定查詢類別的查詢序列后,對(duì)所述查詢序列切詞, 得到與所述查詢序列相對(duì)應(yīng)的多個(gè)詞,然后利用這些詞進(jìn)行搜索,從搜索結(jié)果中獲取與所 述查詢序列相對(duì)應(yīng)的所有詞以及詞頻和詞位置信息,并根據(jù)搜索結(jié)果中與所述查詢序列相 對(duì)應(yīng)的這些詞以及詞頻和詞位置信息,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量,其中將搜 索結(jié)果中與所述查詢序列相對(duì)應(yīng)的這些詞作為所述擴(kuò)展向量的向量維度,并將這些詞的詞 頻以及詞位置信息作為所述擴(kuò)展向量中每一向量維度的權(quán)重。優(yōu)選地,在上述圖1所描述的實(shí)施例的基礎(chǔ)上,所述擴(kuò)展向量獲取裝置12還用于 根據(jù)所述查詢序列,通過語(yǔ)義擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如,當(dāng) 所述查詢序列獲取裝置11獲取所述待確定查詢類別的查詢序列后,對(duì)所述查詢序列切詞, 得到與所述查詢序列相對(duì)應(yīng)的多個(gè)詞,然后利用這些詞進(jìn)行搜索,從搜索結(jié)果中獲取與所 述詞相對(duì)應(yīng)的多個(gè)瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為,根據(jù)與所述查詢序列相對(duì)應(yīng)的瀏覽網(wǎng)頁(yè)和/ 或點(diǎn)擊行為的集合進(jìn)行統(tǒng)計(jì)分析,從統(tǒng)計(jì)分析結(jié)果中得到與所述查詢序列的詞相對(duì)應(yīng)的多 個(gè)詞,并利用這些詞構(gòu)成詞向量,從而得到與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。優(yōu)選地,在上述圖1所描述的實(shí)施例的基礎(chǔ)上,所述擴(kuò)展向量獲取裝置12還用于 根據(jù)所述查詢序列,結(jié)合大量用戶瀏覽記錄的統(tǒng)計(jì)分析,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò) 展向量。例如,當(dāng)用戶輸入的查詢序列為“護(hù)腕鼠標(biāo)墊”時(shí),可以對(duì)大量用戶的瀏覽記錄進(jìn) 行統(tǒng)計(jì)分析,例如,將與“護(hù)腕鼠標(biāo)墊”相對(duì)應(yīng)的所述大量用戶瀏覽過的“光電鼠標(biāo)墊”、“多 功能鼠標(biāo)墊”、“迷你鼠標(biāo)墊”等查詢序列與用戶輸入的查詢序列相結(jié)合,獲取與所述查詢序 列相對(duì)應(yīng)的擴(kuò)展向量。優(yōu)選地,在上述圖1所描述的實(shí)施例的基礎(chǔ)上,所述擴(kuò)展向量獲取裝置12還用于 根據(jù)所述查詢序列,結(jié)合所述用戶的歷史瀏覽記錄,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向 量。例如,當(dāng)用戶輸入的查詢序列為“護(hù)腕鼠標(biāo)墊”時(shí),可以結(jié)合所述用戶的歷史瀏覽記錄, 將與“護(hù)腕鼠標(biāo)墊”相對(duì)應(yīng)的所述用戶的歷史瀏覽記錄中的“鼠標(biāo)墊價(jià)格”、“護(hù)腕尺寸”、“卡 通護(hù)腕”等查詢序列與當(dāng)前輸入的“護(hù)腕鼠標(biāo)墊”相結(jié)合,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò) 展向量。優(yōu)選地,在上述圖1所描述的實(shí)施例的基礎(chǔ)上,所述匹配裝置13還包括第一獲 取單元和第二獲取單元(圖1均未示出)。其中,第一獲取單元用于根據(jù)預(yù)設(shè)規(guī)則,獲取與 所述查詢分類相對(duì)應(yīng)的中心詞向量;第二獲取單元用于根據(jù)所述擴(kuò)展向量和所述中心詞向 量,獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。此處的預(yù)設(shè)規(guī)則包括但不限于以下至少任一項(xiàng)向量的迭代處理;從所述查詢分類中隨機(jī)抽取的一個(gè)詞;與所述查詢分類相對(duì)應(yīng) 的多個(gè)特征詞。以向量的迭代處理為例,從圖片查詢類別中預(yù)先選取“瀏覽”、“圖片”、“照 片”、“風(fēng)景畫”和“桌面”作為中心詞,構(gòu)成圖片查詢類別的初始中心詞向量A,然后根據(jù)這些 中心詞中的每一個(gè)詞來獲取檢索結(jié)果,并利用所述檢索結(jié)果中的瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為 來得到對(duì)應(yīng)于中心詞的擴(kuò)展向量B1, B2,... ,然后計(jì)算A與B1 的向量相關(guān)度,將與A 相關(guān)度最高的若干詞加入初始中心詞向量A,形成新的初始中心詞向量A’,執(zhí)行迭代操作, 以獲取與所述查詢分類相對(duì)應(yīng)的中心詞向量Af。以所述查詢分類中隨機(jī)抽取一個(gè)詞為例, 利用該詞進(jìn)行擴(kuò)展以生成與所述查詢分類相對(duì)應(yīng)的中心詞向量,然后將所述查詢序列的擴(kuò) 展向量與所述中心詞向量進(jìn)行匹配,以獲取所述查詢序列與所述查詢分類的相關(guān)度。以對(duì) 應(yīng)于所述查詢分類的多個(gè)特征詞為例,可以計(jì)算出所述查詢分類中每個(gè)詞與該查詢分類的 匹配度,然后將匹配度較高的若干詞構(gòu)成與所述查詢分類相對(duì)應(yīng)的中心詞向量,通過所述 中心詞向量與所述查詢序列的擴(kuò)展向量之間的匹配,獲取所述查詢序列與所述查詢分類的 相關(guān)度。更優(yōu)選地,可以動(dòng)態(tài)更新所述查詢分類中的所有詞與查詢分類本身的匹配度,進(jìn)而 動(dòng)態(tài)選取與所述查詢分類相對(duì)應(yīng)的中心詞向量。優(yōu)選地,在上述圖1所描述的實(shí)施例的基礎(chǔ)上,所述匹配裝置13還用于根據(jù)所述 擴(kuò)展向量,結(jié)合所述查詢分類的多個(gè)詞,獲取所述擴(kuò)展向量相對(duì)于所述查詢分類的平均相 關(guān)度;然后根據(jù)所述平均相關(guān)度,獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。例如,對(duì)所 述多個(gè)查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,并將這些詞擴(kuò)展后的向量與所述查詢序列的擴(kuò)展向量 進(jìn)行匹配,從而獲取每個(gè)詞擴(kuò)展后的向量與所述查詢序列的擴(kuò)展向量的相關(guān)度數(shù)值;然后, 通過算術(shù)平均、幾何平均、加權(quán)平均或其他可適用的均值處理方式,根據(jù)多個(gè)相關(guān)度數(shù)值來 獲取所述查詢序列的擴(kuò)展向量與所述多個(gè)查詢分類之間的平均相關(guān)度;最后,根據(jù)所述平 均相關(guān)度,獲取所述查詢序列與所述多個(gè)查詢分類之間的相關(guān)度。圖2示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的用于確定查詢序列的查詢類別的設(shè)備示 意圖。其中,網(wǎng)絡(luò)設(shè)備1’包括但不限于單個(gè)搜索引擎服務(wù)器、多個(gè)搜索引擎服務(wù)器集、基于 云計(jì)算的計(jì)算機(jī)集合或者通過網(wǎng)絡(luò)與搜索引擎服務(wù)器相連接的其他第三方的服務(wù)器,此處 的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)、無(wú)線自組織網(wǎng)絡(luò)(AdHoc網(wǎng) 絡(luò))等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述網(wǎng)絡(luò)設(shè)備1’僅為示意性地舉例說明,其他現(xiàn)有的或 今后可能出現(xiàn)的用于確定查詢序列的查詢類別的設(shè)備如可適用本發(fā)明,也應(yīng)包含在本發(fā)明 保護(hù)范圍以內(nèi),并以引用方式包含于此。該網(wǎng)絡(luò)設(shè)備1’包括查詢序列獲取裝置11’、擴(kuò)展向量獲取裝置12’、匹配裝置13’、 類別確定裝置14’和提供裝置15’。其中,查詢序列獲取裝置11’用于獲取用戶通過用戶設(shè) 備輸入的查詢序列。具體地,查詢序列獲取裝置11’可以主動(dòng)地向所述用戶設(shè)備發(fā)送查詢 序列請(qǐng)求,當(dāng)用戶通過用戶設(shè)備輸入查詢序列時(shí),用戶設(shè)備對(duì)所述查詢序列請(qǐng)求作出響應(yīng) 并將所述用戶輸入的查詢序列作為響應(yīng)結(jié)果返回至所述查詢序列獲取裝置11’。此外,查 詢序列獲取裝置11’也可以接收來自所述用戶設(shè)備的查詢序列,當(dāng)所述用戶設(shè)備檢測(cè)到存 在由用戶輸入的查詢序列時(shí),所述用戶設(shè)備即發(fā)送所述查詢序列至所述查詢序列獲取裝置 11’。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取查詢序列的方式僅為舉例,其他現(xiàn)有的或今后可能 出現(xiàn)的獲取查詢序列的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引 用方式包含于此。
擴(kuò)展向量獲取裝置12’用于對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相 對(duì)應(yīng)的擴(kuò)展向量。具體地,當(dāng)查詢序列獲取裝置11’獲取用戶通過用戶設(shè)備輸入的所述查 詢序列后,擴(kuò)展向量獲取裝置12’對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相對(duì)應(yīng) 的擴(kuò)展向量。例如,當(dāng)所述查詢序列獲取裝置11’獲取用戶通過用戶設(shè)備輸入的所述查詢 序列后,首先,對(duì)所述查詢序列進(jìn)行切詞處理,得到與所述查詢序列相對(duì)應(yīng)的多個(gè)詞;然后, 利用這些詞進(jìn)行搜索,獲取與所述詞相對(duì)應(yīng)的多個(gè)瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為;接著,根據(jù)這 些瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。又例如,當(dāng)所述查詢 序列獲取裝置11’獲取所述用戶通過用戶設(shè)備輸入的所述查詢序列后,首先,對(duì)所述查詢 序列進(jìn)行同義變換處理,得到與所述查詢序列相對(duì)應(yīng)的等效查詢序列;然后,對(duì)所述等效查 詢序列進(jìn)行切詞處理,得到與所述等效查詢序列相對(duì)應(yīng)的多個(gè)詞;接著,利用這些詞進(jìn)行搜 索,獲取搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的所有詞以及詞頻和詞位置信息;最后,根據(jù)搜 索結(jié)果中與所述查詢序列相對(duì)應(yīng)的這些詞以及詞頻和詞位置信息,獲取與所述查詢序列相 對(duì)應(yīng)的擴(kuò)展向量,其中,可以將搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的這些詞作為所述擴(kuò)展 向量的向量維度,并將這些詞的詞頻和詞位置信息作為所述擴(kuò)展向量中每一向量維度的權(quán) 重。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取擴(kuò)展向量的方式僅為舉例,其他現(xiàn)有的或今后可能 出現(xiàn)的獲取擴(kuò)展向量的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引 用方式包含于此。匹配裝置13’用于將所述擴(kuò)展向量與多個(gè)查詢分類進(jìn)行匹配,以獲取所述擴(kuò)展向 量與所述查詢分類的相關(guān)度。具體地,當(dāng)所述擴(kuò)展向量獲取裝置12’獲取與所述查詢序列 相對(duì)應(yīng)的擴(kuò)展向量后,所述匹配裝置13’將對(duì)應(yīng)于所述查詢序列的擴(kuò)展向量與查詢分類的 多個(gè)詞進(jìn)行匹配。例如,可以對(duì)所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,然后將擴(kuò)展后的向量與 所述查詢序列的擴(kuò)展向量進(jìn)行匹配。對(duì)所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展的一種優(yōu)選方式 為首先,利用查詢分類的多個(gè)詞進(jìn)行搜索,獲取與所述詞相對(duì)應(yīng)的多個(gè)瀏覽網(wǎng)頁(yè)和/或點(diǎn) 擊行為;接著,根據(jù)這些瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為,獲取與所述查詢分類的多個(gè)詞相對(duì)應(yīng)的 向量。對(duì)所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展的另一種優(yōu)選方式為首先,利用查詢分類的多 個(gè)詞進(jìn)行搜索,獲取搜索結(jié)果中與所述查詢分類的詞相對(duì)應(yīng)的所有詞以及詞頻和詞位置信 息;然后,根據(jù)搜索結(jié)果中與所述詞相對(duì)應(yīng)的多個(gè)詞以及詞頻和詞位置信息,獲取對(duì)所述查 詢分類的詞進(jìn)行擴(kuò)展后的向量,其中,將搜索結(jié)果中與所述查詢分類的詞相對(duì)應(yīng)的多個(gè)詞 作為所述擴(kuò)展向量的向量維度,并將這些詞的詞頻和詞位置信息作為所述擴(kuò)展向量中每一 向量維度的權(quán)重。此外,將所述查詢分類中的多個(gè)詞進(jìn)行擴(kuò)展后的向量(稱為“第一向量”) 與所述查詢序列的擴(kuò)展向量(稱為“第二向量”)進(jìn)行匹配時(shí),匹配方式包括但不限于以下 至少任一項(xiàng)計(jì)算第一向量與第二向量在同一向量空間下的重疊程度,即夾角余弦值,所述 夾角余弦值越大,表示兩個(gè)向量間的夾角越小,也表明兩個(gè)向量更相關(guān);計(jì)算第一向量與第 二向量在同一向量空間下的距離,即向量差,所述向量差越小,表示兩個(gè)向量更靠近,也表 明兩個(gè)向量更相關(guān)。本領(lǐng)域技術(shù)人員應(yīng)能理解上述查詢序列的擴(kuò)展向量與多個(gè)查詢分類間 的匹配方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的匹配方式如可適用于本發(fā)明,也應(yīng)包 含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。類別確定裝置14’用于根據(jù)所述相關(guān)度,確定所述查詢序列的查詢類別。具體地, 當(dāng)匹配裝置13’獲取所述查詢序列的擴(kuò)展向量與所述查詢分類的相關(guān)度后,類別確定裝置14’根據(jù)所述相關(guān)度來確定所述查詢序列對(duì)應(yīng)于多個(gè)查詢類別中的哪一個(gè)或多個(gè)查詢類 別。例如,當(dāng)所述查詢序列的擴(kuò)展向量與對(duì)應(yīng)于所述查詢類別的向量之間的夾角最小時(shí),根 據(jù)向量間的重疊程度確定所述查詢序列歸屬于所述查詢類別。又例如,當(dāng)所述查詢序列的 擴(kuò)展向量與對(duì)應(yīng)于所述查詢類別的向量之間的距離最小時(shí),根據(jù)向量間的距離遠(yuǎn)近確定所 述查詢序列歸屬于所述查詢類別。在上例中,對(duì)所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,并將擴(kuò)展 后的向量與所述查詢序列的擴(kuò)展向量進(jìn)行匹配時(shí),所述查詢分類的每個(gè)詞擴(kuò)展后的向量與 所述查詢序列的擴(kuò)展向量進(jìn)行匹配后均可以得到一個(gè)相關(guān)度數(shù)值,通過算術(shù)平均、幾何平 均、加權(quán)平均或其他可適用的均值處理方式,根據(jù)多個(gè)相關(guān)度數(shù)值來獲取所述查詢序列的 擴(kuò)展向量與所述多個(gè)查詢分類之間的平均相關(guān)度,并且所述類別確定裝置14’根據(jù)所述平 均相關(guān)度來確定所述查詢序列的查詢類別。本領(lǐng)域技術(shù)人員應(yīng)能理解上述根據(jù)擴(kuò)展向量與 查詢分類間的相關(guān)度來確定查詢序列的查詢類別的方式僅為舉例,其他現(xiàn)有的或今后可能 出現(xiàn)的確定查詢序列的查詢類別的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以 內(nèi),并以引用方式包含于此。提供裝置15’用于根據(jù)所述查詢序列的查詢類別,獲取與所述查詢序列相對(duì)應(yīng)的 搜索結(jié)果,并將所述搜索結(jié)果提供給所述用戶設(shè)備。具體地,當(dāng)類別確定裝置14’根據(jù)所述 查詢序列的擴(kuò)展向量與所述查詢分類的相關(guān)度來確定所述查詢序列的查詢類別后,所述提 供裝置15’根據(jù)所述查詢序列的查詢類別,獲取與所述查詢序列相對(duì)應(yīng)的搜索結(jié)果并將該 結(jié)果提供給所述用戶設(shè)備。優(yōu)選地,所述提供裝置15’還可以根據(jù)所述用戶的相關(guān)查詢信 息,將所述搜索結(jié)果中的一個(gè)或多個(gè)應(yīng)用提供給所述用戶設(shè)備。此處的所述相關(guān)查詢信息 包括以下至少任一項(xiàng)查詢類型;搜索結(jié)果的點(diǎn)擊率;搜索結(jié)果的更新時(shí)間;所述用戶關(guān)于 查詢的偏好設(shè)置。以搜索結(jié)果的點(diǎn)擊率為例,當(dāng)所述提供裝置根據(jù)所述查詢序列的查詢類 別來獲取相應(yīng)的搜索結(jié)果時(shí),可以依據(jù)所述搜索結(jié)果的點(diǎn)擊率高低,將具有最高點(diǎn)擊率的 搜索結(jié)果中的一個(gè)或多個(gè)應(yīng)用提供給所述用戶設(shè)備。以搜索結(jié)果的更新時(shí)間為例,當(dāng)所述 提供裝置根據(jù)所述查詢序列的查詢類別來獲取相應(yīng)的搜索結(jié)果時(shí),可以將更新時(shí)間最快的 搜索結(jié)果中的一個(gè)或多個(gè)應(yīng)用提供給所述用戶設(shè)備。例如,當(dāng)搜索結(jié)果包括最近3年的所 有相關(guān)網(wǎng)頁(yè)時(shí),根據(jù)用戶對(duì)于搜索結(jié)果的更新時(shí)間的要求,可以僅將最近1周的所有搜索 結(jié)果相對(duì)應(yīng)的一個(gè)或多個(gè)應(yīng)用提供至所述用戶設(shè)備。本領(lǐng)域技術(shù)人員應(yīng)能理解上述將搜索 結(jié)果中的一個(gè)或多個(gè)應(yīng)用提供給用戶設(shè)備的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的 將搜索結(jié)果中的一個(gè)或多個(gè)應(yīng)用提供給用戶設(shè)備的方式如可適用于本發(fā)明,也應(yīng)包含在本 發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,在上述圖2所描述的實(shí)施例的基礎(chǔ)上,所述擴(kuò)展向量獲取裝置12’還用于 根據(jù)所述查詢序列,通過內(nèi)容擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。當(dāng)所述查 詢序列獲取裝置11’獲取用戶通過用戶設(shè)備輸入的查詢序列后,對(duì)所述查詢序列切詞,得到 與所述查詢序列相對(duì)應(yīng)的多個(gè)詞,然后利用這些詞進(jìn)行搜索,從搜索結(jié)果中獲取與所述查 詢序列相對(duì)應(yīng)的所有詞以及詞頻和詞位置信息,并根據(jù)這些詞以及詞頻和詞位置信息,獲 取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量,其中將搜索結(jié)構(gòu)中與所述查詢序列相對(duì)應(yīng)的這些詞 作為所述擴(kuò)展向量的向量維度,并將這些詞的詞頻和詞位置信息作為所述擴(kuò)展向量中每一 向量維度的權(quán)重。優(yōu)選地,在上述圖2所描述的實(shí)施例的基礎(chǔ)上,所述擴(kuò)展向量獲取裝置12’還用于根據(jù)所述查詢序列,通過語(yǔ)義擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。當(dāng)所述查 詢序列獲取裝置11’獲取用戶通過用戶設(shè)備輸入的查詢序列后,對(duì)所述查詢序列切詞,得到 與所述查詢序列相對(duì)應(yīng)的多個(gè)詞,然后利用這些詞進(jìn)行搜索,從搜索結(jié)果中獲取與所述詞 相對(duì)應(yīng)的多個(gè)瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為,根據(jù)與所述查詢序列相對(duì)應(yīng)的瀏覽網(wǎng)頁(yè)和/或點(diǎn) 擊行為的查詢序列的集合進(jìn)行統(tǒng)計(jì)分析,從統(tǒng)計(jì)分析結(jié)果中得到與所述查詢序列的詞相對(duì) 應(yīng)的多個(gè)詞,并利用這些詞構(gòu)成詞向量,從而得到與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。優(yōu)選地,在上述圖2所描述的實(shí)施例的基礎(chǔ)上,所述擴(kuò)展向量獲取裝置12’還用于 根據(jù)所述查詢序列,結(jié)合大量用戶瀏覽記錄的統(tǒng)計(jì)分析,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò) 展向量。例如,當(dāng)用戶輸入的查詢序列為“護(hù)腕鼠標(biāo)墊”時(shí),可以對(duì)大量用戶的瀏覽記錄進(jìn) 行統(tǒng)計(jì)分析,例如,將與“護(hù)腕鼠標(biāo)墊”相對(duì)應(yīng)的所述大量用戶瀏覽過的“光電鼠標(biāo)墊”、“多 功能鼠標(biāo)墊”、“迷你鼠標(biāo)墊”等查詢序列與用戶輸入的查詢序列相結(jié)合,獲取與所述查詢序 列相對(duì)應(yīng)的擴(kuò)展向量。優(yōu)選地,在上述圖2所描述的實(shí)施例的基礎(chǔ)上,所述擴(kuò)展向量獲取裝置12’還用于 根據(jù)所述查詢序列,結(jié)合所述用戶的歷史瀏覽記錄,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向 量。例如,當(dāng)用戶輸入的查詢序列為“護(hù)腕鼠標(biāo)墊”時(shí),可以結(jié)合所述用戶的歷史瀏覽記錄, 例如,將與“護(hù)腕鼠標(biāo)墊”相對(duì)應(yīng)的所述用戶的歷史瀏覽記錄中的“鼠標(biāo)墊價(jià)格”、“護(hù)腕尺 寸”、“卡通護(hù)腕”等查詢序列與當(dāng)前輸入的“護(hù)腕鼠標(biāo)墊”相結(jié)合,獲取與所述查詢序列相對(duì) 應(yīng)的擴(kuò)展向量。優(yōu)選地,在上述圖2所描述的實(shí)施例的基礎(chǔ)上,所述匹配裝置13’還包括第一獲 取單元和第二獲取單元(圖2均未示出)。其中,第一獲取單元用于根據(jù)預(yù)設(shè)規(guī)則,獲取與 所述查詢分類相對(duì)應(yīng)的中心詞向量;第二獲取單元用于根據(jù)所述擴(kuò)展向量和所述中心詞向 量,獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。此處的預(yù)設(shè)規(guī)則包括但不限于以下至少 任一項(xiàng)向量的迭代處理;從所述查詢分類中隨機(jī)抽取的一個(gè)詞;與所述查詢分類相對(duì)應(yīng) 的多個(gè)特征詞。以向量的迭代處理為例,從圖片查詢類別中預(yù)先選取“瀏覽”、“圖片”、“照 片”、“風(fēng)景畫”和“桌面”作為中心詞,構(gòu)成圖片查詢類別的初始中心詞向量A,然后根據(jù)這些 中心詞中的每一個(gè)詞來獲取相應(yīng)的檢索結(jié)果,并利用所述檢索結(jié)果中的瀏覽網(wǎng)頁(yè)和/或點(diǎn) 擊行為來得到對(duì)應(yīng)于中心詞的擴(kuò)展向量B1, B2,... ,然后計(jì)算A與B1 的向量相關(guān)度, 將與A相關(guān)度較高的若干詞加入初始中心詞向量A,形成新的初始中心詞向量A’,執(zhí)行迭 代操作,以獲取與所述查詢分類相對(duì)應(yīng)的中心詞向量Af。以所述查詢分類中隨機(jī)抽取一個(gè) 詞為例,利用該詞進(jìn)行擴(kuò)展以生成與所述查詢分類相對(duì)應(yīng)的中心詞向量,然后將所述查詢 序列的擴(kuò)展向量與所述中心詞向量進(jìn)行匹配,以獲取所述查詢序列與所述查詢分類的相關(guān) 度。以對(duì)應(yīng)于所述查詢分類的多個(gè)特征詞為例,可以計(jì)算出所述查詢分類中每個(gè)詞與該查 詢分類的匹配度,然后將匹配度較高的若干詞構(gòu)成與所述查詢分類相對(duì)應(yīng)的中心詞向量, 通過所述中心詞向量與所述查詢序列的擴(kuò)展向量之間的匹配,獲取所述查詢序列與所述查 詢分類的相關(guān)度。更優(yōu)選地,可以動(dòng)態(tài)更新所述查詢分類中的所有詞與查詢分類本身的匹 配度,進(jìn)而動(dòng)態(tài)選取與所述查詢分類相對(duì)應(yīng)的中心詞向量。優(yōu)選地,在上述圖2所描述的實(shí)施例的基礎(chǔ)上,所述匹配裝置13’還用于根據(jù)所述 擴(kuò)展向量,結(jié)合所述查詢分類的多個(gè)詞,獲取所述擴(kuò)展向量相對(duì)于所述查詢分類的平均相 關(guān)度;然后根據(jù)所述平均相關(guān)度,獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。例如,首先,對(duì)所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,并將這些詞擴(kuò)展后的向量與所述查詢序列的擴(kuò)展向量 進(jìn)行匹配,從而獲取每個(gè)詞的擴(kuò)展向量與所述查詢序列的擴(kuò)展向量的相關(guān)度數(shù)值;然后,通 過算術(shù)平均、幾何平均、加權(quán)平均或其他可適用的均值處理方式,根據(jù)多個(gè)相關(guān)度數(shù)值來獲 取所述查詢序列的擴(kuò)展向量與所述多個(gè)查詢分類之間的平均相關(guān)度;最后,根據(jù)所述平均 相關(guān)度,獲取所述查詢序列與所述多個(gè)查詢分類之間的相關(guān)度。圖3示出根據(jù)本發(fā)明另一個(gè)方面的用于確定查詢序列的查詢類別的方法流程圖。 其中,用于確定查詢序列的查詢類別的網(wǎng)絡(luò)設(shè)備包括但不限于單個(gè)搜索引擎服務(wù)器、多個(gè) 搜索引擎服務(wù)器集、基于云計(jì)算的計(jì)算機(jī)集合或者通過網(wǎng)絡(luò)與搜索引擎服務(wù)器相連接的其 他第三方的服務(wù)器,此處的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)、無(wú) 線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述網(wǎng)絡(luò)設(shè)備僅為示意性地舉 例說明,其他現(xiàn)有的或今后可能出現(xiàn)的用于確定查詢序列的查詢類別的設(shè)備如可適用于本 發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。在步驟Sl中,所述網(wǎng)絡(luò)設(shè)備用于獲取待確定查詢類別的查詢序列。具體地,所述 網(wǎng)絡(luò)設(shè)備既可以獲取由用戶通過用戶設(shè)備輸入的查詢序列,也可以獲取由諸如搜索引擎服 務(wù)器的查詢序列數(shù)據(jù)庫(kù)中得到的查詢序列。以獲取查詢序列數(shù)據(jù)庫(kù)的查詢序列為例,當(dāng)所 述網(wǎng)絡(luò)設(shè)備向所述查詢序列數(shù)據(jù)庫(kù)發(fā)出查詢序列請(qǐng)求時(shí),所述查詢序列數(shù)據(jù)庫(kù)對(duì)該請(qǐng)求作 出響應(yīng),并將選取的查詢序列返回至所述網(wǎng)絡(luò)設(shè)備。此外,所述網(wǎng)絡(luò)設(shè)備還可以定期地接 收來自查詢序列數(shù)據(jù)庫(kù)的多個(gè)查詢序列,以便更準(zhǔn)確地確定這些查詢序列的查詢類別。本 領(lǐng)域技術(shù)人員應(yīng)能理解上述待確定查詢類別的查詢序列的獲取方式僅為舉例,其他現(xiàn)有的 或今后可能出現(xiàn)的查詢序列的獲取方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以 內(nèi),并以引用方式包含于此。在步驟S2中,所述網(wǎng)絡(luò)設(shè)備用于對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序 列相對(duì)應(yīng)的擴(kuò)展向量。具體地,當(dāng)所述網(wǎng)絡(luò)設(shè)備獲取待確定查詢類別的查詢序列后,對(duì)所述 查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如,當(dāng)所述網(wǎng)絡(luò)設(shè)備獲取 所述待確定查詢類別的查詢序列后,首先,對(duì)所述查詢序列進(jìn)行切詞處理,得到與所述查詢 序列相對(duì)應(yīng)的多個(gè)詞;然后,利用這些詞進(jìn)行搜索,獲取與所述詞相對(duì)應(yīng)的多個(gè)瀏覽網(wǎng)頁(yè)和 /或點(diǎn)擊行為;接著,根據(jù)這些瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò) 展向量。又例如,當(dāng)所述網(wǎng)絡(luò)設(shè)備獲取所述待確定查詢類別的查詢序列后,首先,對(duì)所述查 詢序列進(jìn)行同義變換處理,得到與所述查詢序列相對(duì)應(yīng)的等效查詢序列;然后,對(duì)所述等效 查詢序列進(jìn)行切詞處理,得到與所述等效查詢序列相對(duì)應(yīng)的多個(gè)詞;接著,利用這些詞進(jìn)行 搜索,獲取搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的所有詞以及詞頻和詞位置信息;最后,根據(jù) 搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的這些詞以及詞頻和詞位置信息,獲取與所述查詢序列 相對(duì)應(yīng)的擴(kuò)展向量,其中,可以將這些詞作為所述擴(kuò)展向量的向量維度,并將這些詞的詞頻 和詞位置信息作為所述擴(kuò)展向量中每一向量維度的權(quán)重。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲 取擴(kuò)展向量的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取擴(kuò)展向量的方式如可適用 于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。在步驟S3中,所述網(wǎng)絡(luò)設(shè)備用于將所述擴(kuò)展向量與多個(gè)查詢分類進(jìn)行匹配,以獲 取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。具體地,所述網(wǎng)絡(luò)設(shè)備獲取與所述查詢序列相 對(duì)應(yīng)的擴(kuò)展向量后,將對(duì)應(yīng)于所述查詢序列的擴(kuò)展向量與多個(gè)查詢分類的多個(gè)詞進(jìn)行匹配。例如,可以將所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,然后將這些詞擴(kuò)展后的向量與所述查 詢序列的擴(kuò)展向量進(jìn)行匹配。對(duì)查詢分類的多個(gè)詞進(jìn)行擴(kuò)展的一種優(yōu)選方式為首先,利 用查詢分類的多個(gè)詞進(jìn)行搜索,獲取與所述詞相對(duì)應(yīng)的多個(gè)瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為;接 著,根據(jù)這些瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為,獲取與所述查詢分類的多個(gè)詞相對(duì)應(yīng)的向量。對(duì)查 詢分類的多個(gè)詞進(jìn)行擴(kuò)展的另一種優(yōu)選方式為首先,利用查詢分類的多個(gè)詞進(jìn)行搜索,獲 取搜索結(jié)果中與所述詞相對(duì)應(yīng)的所有詞以及詞頻和詞位置信息;然后,根據(jù)搜索結(jié)果中與 所述詞相對(duì)應(yīng)的多個(gè)詞以及詞頻和詞位置信息,獲取對(duì)所述查詢分類的詞進(jìn)行擴(kuò)展后的向 量。其中,將搜索結(jié)果中與所述詞相對(duì)應(yīng)的多個(gè)詞作為所述擴(kuò)展向量的向量維度,并將這些 詞的詞頻和詞位置信息作為所述擴(kuò)展向量中每一向量維度的權(quán)重。此外,將所述查詢分類 中的多個(gè)詞進(jìn)行擴(kuò)展后的向量(稱為“第一向量”)與所述查詢序列的所述擴(kuò)展向量(稱為 “第二向量”)進(jìn)行匹配時(shí),匹配方式包括但不限于以下至少任一項(xiàng)計(jì)算第一向量與第二向 量在同一向量空間下的重疊程度,即夾角余弦值,所述夾角余弦值越大,表示兩個(gè)向量間的 夾角越小,也表明兩個(gè)向量更相關(guān);計(jì)算第一向量與第二向量在同一向量空間下的距離,即 向量差,所述向量差越小,表示兩個(gè)向量更靠近,也表明兩個(gè)向量更相關(guān)。本領(lǐng)域技術(shù)人員 應(yīng)能理解上述查詢序列的擴(kuò)展向量與多個(gè)查詢分類間的匹配方式僅為舉例,其他現(xiàn)有的或 今后可能出現(xiàn)的查詢序列的擴(kuò)展向量與多個(gè)查詢分類間的匹配方式如可適用于本發(fā)明,也 應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。在步驟S4中,所述網(wǎng)絡(luò)設(shè)備用于根據(jù)所述相關(guān)度,確定所述查詢序列的查詢類 別。具體地,所述網(wǎng)絡(luò)設(shè)備獲取所述查詢序列的擴(kuò)展向量與所述查詢分類的相關(guān)度后,根據(jù) 所述相關(guān)度來確定所述查詢序列對(duì)應(yīng)于多個(gè)查詢類別中的哪一個(gè)或多個(gè)查詢類別。例如, 當(dāng)所述查詢序列的擴(kuò)展向量與對(duì)應(yīng)于所述查詢類別的向量之間的夾角最小時(shí),根據(jù)向量間 的重疊程度確定所述查詢序列歸屬于所述查詢類別。又例如,當(dāng)所述查詢序列的擴(kuò)展向量 與對(duì)應(yīng)于所述查詢類別的向量之間的距離最小時(shí),根據(jù)向量間的距離遠(yuǎn)近確定所述查詢序 列歸屬于所述查詢類別。對(duì)所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,并將這些詞擴(kuò)展后的向量與 所述查詢序列的擴(kuò)展向量進(jìn)行匹配時(shí),每個(gè)詞的擴(kuò)展向量與所述查詢序列的擴(kuò)展向量匹配 后均可以得到一個(gè)相關(guān)度數(shù)值,通過算術(shù)平均、幾何平均、加權(quán)平均或其他可適用的均值處 理方式,根據(jù)多個(gè)相關(guān)度數(shù)值來獲取所述查詢序列的擴(kuò)展向量與所述多個(gè)查詢分類之間的 平均相關(guān)度,并且所述網(wǎng)絡(luò)設(shè)備根據(jù)所述平均相關(guān)度來確定所述查詢序列的查詢類別。本 領(lǐng)域技術(shù)人員應(yīng)能理解上述根據(jù)擴(kuò)展向量與查詢分類間的相關(guān)度來確定查詢序列的查詢 類別的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的確定查詢序列的查詢類別的方式如可 適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,在上述圖3所描述的實(shí)施例的基礎(chǔ)上,所述步驟S2還用于根據(jù)所述查詢 序列,通過內(nèi)容擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如,所述網(wǎng)絡(luò)設(shè)備獲 取所述待確定查詢類別的查詢序列后,對(duì)所述查詢序列切詞,得到與所述查詢序列相對(duì)應(yīng) 的多個(gè)詞,然后利用這些詞進(jìn)行搜索,從搜索結(jié)果中獲取與所述查詢序列相對(duì)應(yīng)的所有詞 以及詞頻和詞位置信息,并根據(jù)這些詞以及詞頻和詞位置信息,獲取與所述查詢序列相對(duì) 應(yīng)的擴(kuò)展向量,其中將搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的這些詞作為所述擴(kuò)展向量的向 量維度,并將這些詞的詞頻和詞位置信息作為所述擴(kuò)展向量中每一向量維度的權(quán)重。優(yōu)選地,在上述圖3所描述的實(shí)施例的基礎(chǔ)上,所述步驟S2還用于根據(jù)所述查詢序列,通過語(yǔ)義擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如,所述網(wǎng)絡(luò)設(shè)備獲 取所述待確定查詢類別的查詢序列后,對(duì)所述查詢序列切詞,得到與所述查詢序列相對(duì)應(yīng) 的多個(gè)詞,然后利用這些詞進(jìn)行搜索,從搜索結(jié)果中獲取與所述詞相對(duì)應(yīng)的多個(gè)瀏覽網(wǎng)頁(yè) 和/或點(diǎn)擊行為,根據(jù)與所述查詢序列相對(duì)應(yīng)的瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為的查詢序列的集 合進(jìn)行統(tǒng)計(jì)分析,從而獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。優(yōu)選地,在上述圖3所描述的實(shí)施例的基礎(chǔ)上,所述步驟S2還用于根據(jù)所述查詢 序列,結(jié)合大量用戶瀏覽記錄的統(tǒng)計(jì)分析,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如, 當(dāng)用戶輸入的查詢序列為“護(hù)腕鼠標(biāo)墊”時(shí),可以對(duì)大量用戶的瀏覽記錄進(jìn)行統(tǒng)計(jì)分析,例 如,將與“護(hù)腕鼠標(biāo)墊”相對(duì)應(yīng)的所述大量用戶瀏覽過的“光電鼠標(biāo)墊”、“多功能鼠標(biāo)墊”、 “迷你鼠標(biāo)墊”等查詢序列與用戶輸入的查詢序列相結(jié)合,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò) 展向量。優(yōu)選地,在上述圖3所描述的實(shí)施例的基礎(chǔ)上,所述步驟S2還用于根據(jù)所述查詢 序列,結(jié)合所述用戶的歷史瀏覽記錄,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如,當(dāng)用 戶輸入的查詢序列為“護(hù)腕鼠標(biāo)墊”時(shí),可以結(jié)合所述用戶的歷史瀏覽記錄,將與“護(hù)腕鼠標(biāo) 墊”相對(duì)應(yīng)的所述用戶的歷史瀏覽記錄中的“鼠標(biāo)墊價(jià)格”、“護(hù)腕尺寸”、“卡通護(hù)腕”等查詢 序列與當(dāng)前輸入的“護(hù)腕鼠標(biāo)墊”相結(jié)合,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。優(yōu)選地,在上述圖3所描述的實(shí)施例的基礎(chǔ)上,所述步驟S3還包括根據(jù)預(yù)設(shè)規(guī) 則,獲取與所述查詢分類相對(duì)應(yīng)的中心詞向量;根據(jù)所述擴(kuò)展向量和所述中心詞向量,獲取 所述擴(kuò)展向量與所述查詢分類的相關(guān)度。此處的預(yù)設(shè)規(guī)則包括但不限于以下至少任一項(xiàng) 向量的迭代處理;從所述查詢分類中隨機(jī)抽取的一個(gè)詞;與所述查詢分類相對(duì)應(yīng)的多個(gè)特 征詞。以向量的迭代處理為例,從圖片查詢類別中預(yù)先選取“瀏覽”、“圖片”、“照片”、“風(fēng)景 畫”和“桌面”作為中心詞,構(gòu)成圖片查詢類別的初始中心詞向量A,然后根據(jù)這些中心詞中 的每一個(gè)詞來獲取檢索結(jié)果,并利用所述檢索結(jié)果中的瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為來得到對(duì) 應(yīng)于中心詞的擴(kuò)展向量B1,B2,... ,然后計(jì)算A與B1 的向量相關(guān)度,將與A相關(guān)度較 高的若干詞加入初始中心詞向量A,形成新的初始中心詞向量A’,執(zhí)行迭代操作,以獲取與 所述查詢分類相對(duì)應(yīng)的中心詞向量Af。以所述查詢分類中隨機(jī)抽取一個(gè)詞為例,利用該詞 進(jìn)行擴(kuò)展以生成與所述查詢分類相對(duì)應(yīng)的中心詞向量,然后將所述查詢序列的擴(kuò)展向量與 所述中心詞向量進(jìn)行匹配,以獲取所述查詢序列與所述查詢分類的相關(guān)度。以對(duì)應(yīng)于所述 查詢分類的多個(gè)特征詞為例,可以計(jì)算出所述查詢分類中每個(gè)詞與該查詢分類的匹配度, 然后將匹配度較高的若干詞構(gòu)成與所述查詢分類相對(duì)應(yīng)的中心詞向量,通過所述中心詞向 量與所述查詢序列的擴(kuò)展向量之間的匹配,獲取所述查詢序列與所述查詢分類的相關(guān)度。 更優(yōu)選地,可以動(dòng)態(tài)更新所述查詢分類中的所有詞與查詢分類本身的匹配度,進(jìn)而動(dòng)態(tài)選 取與所述查詢分類相對(duì)應(yīng)的中心詞向量。優(yōu)選地,在上述圖3所描述的實(shí)施例的基礎(chǔ)上,所述步驟S3還用于根據(jù)所述擴(kuò)展 向量,結(jié)合所述查詢分類的多個(gè)詞,獲取所述擴(kuò)展向量相對(duì)于所述查詢分類的平均相關(guān)度; 然后根據(jù)所述平均相關(guān)度,獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。例如,對(duì)所述查詢 分類的多個(gè)詞進(jìn)行擴(kuò)展,并將這些詞擴(kuò)展后的向量與所述查詢序列的擴(kuò)展向量進(jìn)行匹配, 從而獲取每個(gè)詞擴(kuò)展后的向量與所述查詢序列的所述擴(kuò)展向量的相關(guān)度數(shù)值;然后,通過 算術(shù)平均、幾何平均、加權(quán)平均或其他可適用的均值處理方式,根據(jù)多個(gè)相關(guān)度數(shù)值來獲取所述查詢序列的擴(kuò)展向量與所述多個(gè)查詢分類之間的平均相關(guān)度;最后,根據(jù)所述平均相 關(guān)度,獲取所述查詢序列與所述多個(gè)查詢分類之間的相關(guān)度。圖4示出根據(jù)本發(fā)明一個(gè)優(yōu)選實(shí)施例的用于確定查詢序列的查詢類別的方法流 程圖。其中,用于確定查詢序列的查詢類別的網(wǎng)絡(luò)設(shè)備包括但不限于單個(gè)搜索引擎服務(wù)器、 多個(gè)搜索引擎服務(wù)器集、基于云計(jì)算的計(jì)算機(jī)集合或者通過網(wǎng)絡(luò)與搜索引擎服務(wù)器相連接 的其他第三方的服務(wù)器,此處的網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng) 絡(luò)、無(wú)線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述網(wǎng)絡(luò)設(shè)備僅為示意 性地舉例說明,其他現(xiàn)有的或今后可能出現(xiàn)的用于確定查詢序列的查詢類別的設(shè)備如可適 用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。在步驟Si’中,所述網(wǎng)絡(luò)設(shè)備用于獲取用戶通過用戶設(shè)備輸入的查詢序列。具體 地,所述網(wǎng)絡(luò)設(shè)備可以主動(dòng)地向所述用戶設(shè)備發(fā)送查詢序列請(qǐng)求,當(dāng)用戶通過用戶設(shè)備輸 入查詢序列時(shí),用戶設(shè)備對(duì)所述查詢序列請(qǐng)求作出響應(yīng)并將所述用戶輸入的查詢序列作為 響應(yīng)結(jié)果返回至所述網(wǎng)絡(luò)設(shè)備。此外,所述網(wǎng)絡(luò)設(shè)備也可以接收來自所述用戶設(shè)備的查詢 序列,當(dāng)所述用戶設(shè)備檢測(cè)到存在由用戶輸入的查詢序列時(shí),所述用戶設(shè)備即發(fā)送所述查 詢序列至所述網(wǎng)絡(luò)設(shè)備。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取查詢序列的方式僅為舉例,其 他現(xiàn)有的或今后可能出現(xiàn)的獲取查詢序列的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保 護(hù)范圍以內(nèi),并以引用方式包含于此。在步驟S2’中,所述網(wǎng)絡(luò)設(shè)備用于對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序 列相對(duì)應(yīng)的擴(kuò)展向量。具體地,所述網(wǎng)絡(luò)設(shè)備獲取用戶通過用戶設(shè)備輸入的所述查詢序列 后,對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如,所述網(wǎng)絡(luò) 設(shè)備獲取用戶通過用戶設(shè)備輸入的所述查詢序列后,首先,對(duì)所述查詢序列進(jìn)行切詞處理, 得到與所述查詢序列相對(duì)應(yīng)的多個(gè)詞;然后,利用這些詞進(jìn)行搜索,獲取與所述詞相對(duì)應(yīng)的 多個(gè)瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為;接著,根據(jù)這些瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為,獲取與所述查詢 序列相對(duì)應(yīng)的擴(kuò)展向量。又例如,所述網(wǎng)絡(luò)設(shè)備獲取所述用戶通過用戶設(shè)備輸入的所述查 詢序列后,首先,對(duì)所述查詢序列進(jìn)行同義變換處理,得到與所述查詢序列相對(duì)應(yīng)的等效查 詢序列;然后,對(duì)所述等效查詢序列進(jìn)行切詞處理,得到與所述等效查詢序列相對(duì)應(yīng)的多個(gè) 詞;接著,利用這些詞進(jìn)行搜索,獲取搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的所有詞以及詞頻 和詞位置信息;最后,根據(jù)搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的這些詞以及詞頻和詞位置 信息,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量,其中,可以將搜索結(jié)果中與所述查詢序列相 對(duì)應(yīng)的這些詞作為所述擴(kuò)展向量的向量維度,并將這些詞的詞頻和詞位置信息作為所述擴(kuò) 展向量中每一向量維度的權(quán)重。本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取擴(kuò)展向量的方式僅為舉 例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取擴(kuò)展向量的方式如可適用于本發(fā)明,也應(yīng)包含在本 發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。在步驟S3’中,所述網(wǎng)絡(luò)設(shè)備用于將所述擴(kuò)展向量與多個(gè)查詢分類進(jìn)行匹配,以 獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。具體地,所述網(wǎng)絡(luò)設(shè)備獲取與所述查詢序列 相對(duì)應(yīng)的擴(kuò)展向量后,將對(duì)應(yīng)于所述查詢序列的擴(kuò)展向量與多個(gè)查詢分類的多個(gè)詞進(jìn)行匹 配。例如,可以將所述查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,然后將這些詞擴(kuò)展后的向量與所述查詢 序列的擴(kuò)展向量進(jìn)行匹配。對(duì)所述查詢分類中的多個(gè)詞進(jìn)行擴(kuò)展的一種優(yōu)選方式為首先, 利用查詢分類的多個(gè)詞進(jìn)行搜索,獲取與所述詞相對(duì)應(yīng)的多個(gè)瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為;接著,根據(jù)這些瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為,獲取與所述查詢分類的多個(gè)詞相對(duì)應(yīng)的向量。對(duì) 所述查詢分類中的多個(gè)詞進(jìn)行擴(kuò)展的另一種優(yōu)選方式為首先,利用查詢分類的多個(gè)詞進(jìn) 行搜索,獲取搜索結(jié)果中與所述詞相對(duì)應(yīng)的所有詞以及詞頻和詞位置信息;然后,根據(jù)搜索 結(jié)果中與所述詞相對(duì)應(yīng)的多個(gè)詞以及詞頻和詞位置信息,獲取對(duì)所述查詢分類的詞進(jìn)行擴(kuò) 展后的向量。其中,將搜索結(jié)果中與所述詞相對(duì)應(yīng)的多個(gè)詞作為所述擴(kuò)展向量的向量維度, 并將這些詞的詞頻和詞位置信息作為所述擴(kuò)展向量中每一向量維度的權(quán)重。此外,將所述 查詢分類中的多個(gè)詞進(jìn)行擴(kuò)展后的向量(稱為“第一向量”)與所述查詢序列的所述擴(kuò)展向 量(稱為“第二向量”)進(jìn)行匹配時(shí),匹配方式包括但不限于以下至少任一項(xiàng)計(jì)算第一向量 與第二向量在同一向量空間下的重疊程度,即夾角余弦值,所述夾角余弦值越大,表示兩個(gè) 向量間的夾角越小,也表明兩個(gè)向量更相關(guān);計(jì)算第一向量與第二向量在同一向量空間下 的距離,即向量差,所述向量差越小,表示兩個(gè)向量更靠近,也表明兩個(gè)向量更相關(guān)。本領(lǐng)域 技術(shù)人員應(yīng)能理解上述查詢序列的擴(kuò)展向量與多個(gè)查詢分類間的匹配方式僅為舉例,其他 現(xiàn)有的或今后可能出現(xiàn)的查詢序列的擴(kuò)展向量與多個(gè)查詢分類間的匹配方式如可適用于 本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。在步驟S4’中,所述網(wǎng)絡(luò)設(shè)備用于根據(jù)所述相關(guān)度,確定所述查詢序列的查詢類 別。具體地,所述網(wǎng)絡(luò)設(shè)備獲取所述查詢序列的擴(kuò)展向量與所述查詢分類的相關(guān)度后,根據(jù) 所述相關(guān)度來確定所述查詢序列對(duì)應(yīng)于多個(gè)查詢類別中的哪一個(gè)或多個(gè)查詢類別。例如, 當(dāng)所述查詢序列的擴(kuò)展向量與對(duì)應(yīng)于所述查詢類別的向量之間的夾角最小時(shí),根據(jù)向量間 的重疊程度確定所述查詢序列歸屬于所述查詢類別。又例如,當(dāng)所述查詢序列的擴(kuò)展向量 與對(duì)應(yīng)于所述查詢類別的向量之間的距離最小時(shí),根據(jù)向量間的距離遠(yuǎn)近確定所述查詢序 列歸屬于所述查詢類別。對(duì)所述多個(gè)查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,并將這些詞擴(kuò)展后的向 量與所述查詢序列的擴(kuò)展向量進(jìn)行匹配時(shí),每個(gè)詞擴(kuò)展后的向量與所述查詢序列的擴(kuò)展向 量進(jìn)行匹配后均可以得到一個(gè)相關(guān)度數(shù)值,通過算術(shù)平均、幾何平均、加權(quán)平均或其他可適 用的均值處理方式,根據(jù)多個(gè)相關(guān)度數(shù)值來獲取所述查詢序列的擴(kuò)展向量與所述多個(gè)查詢 分類之間的平均相關(guān)度,并且所述網(wǎng)絡(luò)設(shè)備根據(jù)所述平均相關(guān)度來確定所述查詢序列的查 詢類別。本領(lǐng)域技術(shù)人員應(yīng)能理解上述根據(jù)擴(kuò)展向量與查詢分類間的相關(guān)度來確定查詢序 列的查詢類別的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的確定查詢序列的查詢類別的 方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。在步驟S5’中,所述網(wǎng)絡(luò)設(shè)備用于根據(jù)所述查詢序列的查詢類別,獲取與所述查詢 序列相對(duì)應(yīng)的搜索結(jié)果,并將所述搜索結(jié)果提供給所述用戶設(shè)備。具體地,所述網(wǎng)絡(luò)設(shè)備根 據(jù)所述查詢序列的擴(kuò)展向量與所述查詢分類的相關(guān)度來確定所述查詢序列的查詢類別后, 根據(jù)所述查詢序列的查詢類別,獲取與所述查詢序列相對(duì)應(yīng)的搜索結(jié)果并將該結(jié)果提供給 所述用戶設(shè)備。優(yōu)選地,所述步驟S5’還用于根據(jù)所述用戶的相關(guān)查詢信息,將所述搜索結(jié) 果中的一個(gè)或多個(gè)應(yīng)用提供給所述用戶設(shè)備。此處的所述相關(guān)查詢信息包括以下至少任一 項(xiàng)查詢類型;搜索結(jié)果的點(diǎn)擊率;搜索結(jié)果的更新時(shí)間;所述用戶關(guān)于查詢的偏好設(shè)置。 以搜索結(jié)果的點(diǎn)擊率為例,當(dāng)所述提供裝置根據(jù)所述查詢序列的查詢類別來獲取相應(yīng)的搜 索結(jié)果時(shí),可以依據(jù)搜索結(jié)果的點(diǎn)擊率,將具有高點(diǎn)擊率的搜索結(jié)果中的一個(gè)或多個(gè)應(yīng)用 提供給所述用戶設(shè)備。以搜索結(jié)果的更新時(shí)間為例,當(dāng)所述提供裝置根據(jù)所述查詢序列的 查詢類別來獲取相應(yīng)的搜索結(jié)果時(shí),可以將更新時(shí)間最快的搜索結(jié)果的一個(gè)或多個(gè)應(yīng)用提供給所述用戶設(shè)備。例如,當(dāng)搜索結(jié)果包括最近3年的所有相關(guān)網(wǎng)頁(yè)時(shí),根據(jù)用戶對(duì)于搜索 結(jié)果的更新時(shí)間的要求,可以僅將最近1周的搜索結(jié)果中的一個(gè)或多個(gè)應(yīng)用優(yōu)先提供至所 述用戶設(shè)備。本領(lǐng)域技術(shù)人員應(yīng)能理解上述將搜索結(jié)果提供給用戶設(shè)備的方式僅為舉例, 其他現(xiàn)有的或今后可能出現(xiàn)的將搜索結(jié)果提供給用戶設(shè)備的方式如可適用于本發(fā)明,也應(yīng) 包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,在上述圖4所描述的實(shí)施例的基礎(chǔ)上,所述步驟S2’還包括根據(jù)所述查 詢序列,通過內(nèi)容擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如,所述網(wǎng)絡(luò)設(shè)備 獲取用戶通過用戶設(shè)備輸入的查詢序列后,對(duì)所述查詢序列切詞,得到與所述查詢序列相 對(duì)應(yīng)的多個(gè)詞,然后利用這些詞進(jìn)行搜索,從搜索結(jié)果中獲取與所述查詢序列相對(duì)應(yīng)的所 有詞以及詞頻和詞位置信息,并根據(jù)這些詞以及詞頻和詞位置信息,獲取與所述查詢序列 相對(duì)應(yīng)的擴(kuò)展向量,其中將搜索結(jié)果中與所述查詢序列相對(duì)應(yīng)的這些詞作為所述擴(kuò)展向量 的向量維度,并將這些詞的詞頻和詞位置信息作為所述擴(kuò)展向量中每一向量維度的權(quán)重。優(yōu)選地,在上述圖4所描述的實(shí)施例的基礎(chǔ)上,所述步驟S2’還包括根據(jù)所述查 詢序列,通過語(yǔ)義擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如,所述網(wǎng)絡(luò)設(shè)備 獲取用戶通過用戶設(shè)備輸入的查詢序列后,對(duì)所述查詢序列切詞,得到與所述查詢序列相 對(duì)應(yīng)的多個(gè)詞,然后利用這些詞進(jìn)行搜索,從搜索結(jié)果中獲取與所述詞相對(duì)應(yīng)的多個(gè)瀏覽 網(wǎng)頁(yè)和/或點(diǎn)擊行為,根據(jù)與所述查詢序列相對(duì)應(yīng)的瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為的查詢序列 的集合進(jìn)行統(tǒng)計(jì)分析,從而獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。優(yōu)選地,在上述圖4所描述的實(shí)施例的基礎(chǔ)上,所述步驟S2’還包括根據(jù)所述查 詢序列,結(jié)合大量用戶瀏覽記錄的統(tǒng)計(jì)分析,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例 如,當(dāng)用戶輸入的查詢序列為“護(hù)腕鼠標(biāo)墊”時(shí),可以對(duì)大量用戶的瀏覽記錄進(jìn)行統(tǒng)計(jì)分析, 例如,將與“護(hù)腕鼠標(biāo)墊”相對(duì)應(yīng)的所述大量用戶瀏覽過的“光電鼠標(biāo)墊”、“多功能鼠標(biāo)墊”、 “迷你鼠標(biāo)墊”等查詢序列與用戶輸入的查詢序列相結(jié)合,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò) 展向量。優(yōu)選地,在上述圖4所描述的實(shí)施例的基礎(chǔ)上,所述步驟S2’還包括根據(jù)所述查 詢序列,結(jié)合所述用戶的歷史瀏覽記錄,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。例如,當(dāng) 用戶輸入的查詢序列為“護(hù)腕鼠標(biāo)墊”時(shí),可以結(jié)合所述用戶的歷史瀏覽記錄,將與“護(hù)腕鼠 標(biāo)墊”相對(duì)應(yīng)的所述用戶的歷史瀏覽記錄中的“鼠標(biāo)墊價(jià)格”、“護(hù)腕尺寸”、“卡通護(hù)腕”等查 詢序列與當(dāng)前輸入的“護(hù)腕鼠標(biāo)墊”相結(jié)合,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。優(yōu)選地,在上述圖4所描述的實(shí)施例的基礎(chǔ)上,所述步驟S3’還包括根據(jù)預(yù)設(shè)規(guī) 則,獲取與所述查詢分類相對(duì)應(yīng)的中心詞向量;根據(jù)所述擴(kuò)展向量和所述中心詞向量,獲取 所述擴(kuò)展向量與所述查詢分類的相關(guān)度。此處的預(yù)設(shè)規(guī)則包括但不限于以下至少任一項(xiàng) 向量的迭代處理;從所述查詢分類中隨機(jī)抽取的一個(gè)詞;與所述查詢分類相對(duì)應(yīng)的多個(gè)特 征詞。以向量的迭代處理為例,從圖片查詢類別中預(yù)先選取“瀏覽”、“圖片”、“照片”、“風(fēng)景 畫”和“桌面”作為中心詞,構(gòu)成圖片查詢類別的初始中心詞向量A,然后根據(jù)這些中心詞中 的每一個(gè)詞來獲取檢索結(jié)果,并利用所述檢索結(jié)果中的瀏覽網(wǎng)頁(yè)和/或點(diǎn)擊行為來得到對(duì) 應(yīng)于中心詞的擴(kuò)展向量B1,B2,... ,然后計(jì)算A與B1 的向量相關(guān)度,將與A相關(guān)度較 高的若干詞加入初始中心詞向量A,形成新的初始中心詞向量A’,執(zhí)行迭代操作,以獲取與 所述查詢分類相對(duì)應(yīng)的中心詞向量Af。以所述查詢分類中隨機(jī)抽取一個(gè)詞為例,利用該詞進(jìn)行擴(kuò)展以生成與所述查詢分類相對(duì)應(yīng)的中心詞向量,然后將所述查詢序列的擴(kuò)展向量與 所述中心詞向量進(jìn)行匹配,以獲取所述查詢序列與所述查詢分類的相關(guān)度。以對(duì)應(yīng)于所述 查詢分類的多個(gè)特征詞為例,可以計(jì)算出所述查詢分類中每個(gè)詞與該查詢分類的匹配度, 然后將匹配度較高的若干詞構(gòu)成與所述查詢分類相對(duì)應(yīng)的中心詞向量,通過所述中心詞向 量與所述查詢序列的擴(kuò)展向量之間的匹配,獲取所述查詢序列與所述查詢分類的相關(guān)度。 更優(yōu)選地,可以動(dòng)態(tài)更新所述查詢分類中的所有詞與查詢分類本身的匹配度,進(jìn)而動(dòng)態(tài)選 取與所述查詢分類相對(duì)應(yīng)的中心詞向量。優(yōu)選地,在上述圖4所描述的實(shí)施例的基礎(chǔ)上,所述步驟S3’還包括根據(jù)所述擴(kuò) 展向量,結(jié)合所述查詢分類的多個(gè)詞,獲取所述擴(kuò)展向量相對(duì)于所述查詢分類的平均相關(guān) 度;然后根據(jù)所述平均相關(guān)度,獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。例如,對(duì)所述 查詢分類的多個(gè)詞進(jìn)行擴(kuò)展,并將這些詞擴(kuò)展后的向量與所述查詢序列的擴(kuò)展向量進(jìn)行匹 配,從而獲取每個(gè)詞擴(kuò)展后的向量與所述查詢序列的擴(kuò)展向量的相關(guān)度數(shù)值;然后,通過算 術(shù)平均、幾何平均、加權(quán)平均或其他可適用的均值處理方式,根據(jù)多個(gè)相關(guān)度數(shù)值來獲取所 述查詢序列的擴(kuò)展向量與所述多個(gè)查詢分類之間的平均相關(guān)度;最后,根據(jù)所述平均相關(guān) 度,獲取所述查詢序列與所述多個(gè)查詢分類之間的相關(guān)度。對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在 不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無(wú)論 從哪一點(diǎn)來看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán) 利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有 變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此 外,顯然“包括” 一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。裝置權(quán)利要求中陳述的多 個(gè)單元或裝置也可以由一個(gè)單元或裝置通過軟件或者硬件來實(shí)現(xiàn)。第一,第二等詞語(yǔ)用來 表示名稱,而并不表示任何特定的順序。
權(quán)利要求
1.一種計(jì)算機(jī)實(shí)現(xiàn)的用于確定查詢序列的查詢類別的方法,其中,該方法包括以下步驟a獲取待確定查詢類別的查詢序列;b對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量; c將所述擴(kuò)展向量與多個(gè)查詢分類進(jìn)行匹配,以獲取所述擴(kuò)展向量與所述查詢分類的 相關(guān)度;d根據(jù)所述相關(guān)度,確定所述查詢序列的查詢類別。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟b還包括-根據(jù)所述查詢序列,通過內(nèi)容擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述步驟b還包括-根據(jù)所述查詢序列,通過語(yǔ)義擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其中,所述步驟b還包括-根據(jù)所述查詢序列,結(jié)合大量用戶瀏覽記錄的統(tǒng)計(jì)分析,獲取與所述查詢序列相對(duì)應(yīng) 的擴(kuò)展向量。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其中,所述步驟b還包括-根據(jù)所述查詢序列,結(jié)合所述用戶的歷史瀏覽記錄,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。
6.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法,其中,所述步驟c還包括 cl根據(jù)預(yù)設(shè)規(guī)則,獲取與所述查詢分類相對(duì)應(yīng)的中心詞向量;c2根據(jù)所述擴(kuò)展向量和所述中心詞向量,獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。
7.根據(jù)權(quán)利要求6所述的方法,其中,所述預(yù)設(shè)規(guī)則包括但不限于以下至少任一項(xiàng) -向量的迭代處理;-從所述查詢分類中隨機(jī)抽取的一個(gè)詞; -與所述查詢分類相對(duì)應(yīng)的多個(gè)特征詞。
8.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法,其中,所述步驟c還包括-根據(jù)所述擴(kuò)展向量,結(jié)合所述查詢分類的多個(gè)詞,獲取所述擴(kuò)展向量相對(duì)于所述查詢 分類的平均相關(guān)度;-根據(jù)所述平均相關(guān)度,獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。
9.根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法,其中,所述步驟a還包括 -獲取用戶通過用戶設(shè)備輸入的所述查詢序列;其中,該方法還包括步驟e:-根據(jù)所述查詢序列的查詢類別,獲取與所述查詢序列相對(duì)應(yīng)的搜索結(jié)果; -將所述搜索結(jié)果提供給所述用戶設(shè)備。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述步驟e還包括-根據(jù)所述用戶的相關(guān)查詢信息,將所述搜索結(jié)果中的一個(gè)或多個(gè)應(yīng)用提供給所述用 戶設(shè)備。
11.根據(jù)權(quán)利要求10所述的方法,其中,所述相關(guān)查詢信息包括以下至少任一項(xiàng) -查詢類型;-搜索結(jié)果的點(diǎn)擊率; -搜索結(jié)果的更新時(shí)間; -所述用戶關(guān)于查詢的偏好設(shè)置。
12.一種用于確定查詢序列的查詢類別的設(shè)備,其中,該設(shè)備包括 查詢序列獲取裝置,用于獲取待確定查詢類別的查詢序列;擴(kuò)展向量獲取裝置,用于對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相對(duì)應(yīng)的 擴(kuò)展向量;匹配裝置,用于將所述擴(kuò)展向量與多個(gè)查詢分類進(jìn)行匹配,以獲取所述擴(kuò)展向量與所 述查詢分類的相關(guān)度;類別確定裝置,用于根據(jù)所述相關(guān)度,確定所述查詢序列的查詢類別。
13.根據(jù)權(quán)利要求12所述的設(shè)備,其中,所述擴(kuò)展向量獲取裝置還用于-根據(jù)所述查詢序列,通過內(nèi)容擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。
14.根據(jù)權(quán)利要求12或13所述的設(shè)備,其中,所述擴(kuò)展向量獲取裝置還用于-根據(jù)所述查詢序列,通過語(yǔ)義擴(kuò)展處理,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。
15.根據(jù)權(quán)利要求12至14中任一項(xiàng)所述的設(shè)備,其中,所述擴(kuò)展向量獲取裝置還用于-根據(jù)所述查詢序列,結(jié)合大量用戶瀏覽記錄的統(tǒng)計(jì)分析,獲取與所述查詢序列相對(duì)應(yīng) 的擴(kuò)展向量。
16.根據(jù)權(quán)利要求12至15中任一項(xiàng)所述的設(shè)備,其中,所述擴(kuò)展向量獲取裝置還用于-根據(jù)所述查詢序列,結(jié)合所述用戶的歷史瀏覽記錄,獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量。
17.根據(jù)權(quán)利要求12至16中任一項(xiàng)所述的設(shè)備,其中,所述匹配裝置還包括 第一獲取單元,用于根據(jù)預(yù)設(shè)規(guī)則,獲取與所述查詢分類相對(duì)應(yīng)的中心詞向量;第二獲取單元,用于根據(jù)所述擴(kuò)展向量和所述中心詞向量,獲取所述擴(kuò)展向量與所述 查詢分類的相關(guān)度。
18.根據(jù)權(quán)利要求17所述的設(shè)備,其中,所述預(yù)設(shè)規(guī)則包括但不限于以下至少任一項(xiàng) -向量的迭代處理;-從所述查詢分類中隨機(jī)抽取的一個(gè)詞; -與所述查詢分類相對(duì)應(yīng)的多個(gè)特征詞。
19.根據(jù)權(quán)利要求12至16中任一項(xiàng)所述的設(shè)備,其中,所述匹配裝置還用于-根據(jù)所述擴(kuò)展向量,結(jié)合所述查詢分類的多個(gè)詞,獲取所述擴(kuò)展向量相對(duì)于所述查詢 分類的平均相關(guān)度;-根據(jù)所述平均相關(guān)度,獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度。
20.根據(jù)權(quán)利要求12至19中任一項(xiàng)所述的設(shè)備,其中,所述查詢序列獲取裝置還用于-獲取用戶通過用戶設(shè)備輸入的所述查詢序列; 其中,該設(shè)備還包括提供裝置,用于-根據(jù)所述查詢序列的查詢類別,獲取與所述查詢序列相對(duì)應(yīng)的搜索結(jié)果;-將所述搜索結(jié)果提供給所述用戶設(shè)備。
21.根據(jù)權(quán)利要求20所述的設(shè)備,其中,所述提供裝置還用于-根據(jù)所述用戶的相關(guān)查詢信息,將所述搜索結(jié)果中的一個(gè)或多個(gè)應(yīng)用提供給所述用 戶設(shè)備。
22.根據(jù)權(quán)利要求21所述的設(shè)備,其中,所述相關(guān)查詢信息包括以下至少任一項(xiàng) -查詢類型;-搜索結(jié)果的點(diǎn)擊率; -搜索結(jié)果的更新時(shí)間; -所述用戶關(guān)于查詢的偏好設(shè)置。
全文摘要
本發(fā)明提供一種用于確定查詢序列的查詢類別的設(shè)備及其方法,包括獲取待確定查詢類別的查詢序列;對(duì)所述查詢序列進(jìn)行擴(kuò)展,以獲取與所述查詢序列相對(duì)應(yīng)的擴(kuò)展向量;將所述擴(kuò)展向量與多個(gè)查詢分類進(jìn)行匹配,以獲取所述擴(kuò)展向量與所述查詢分類的相關(guān)度;根據(jù)所述相關(guān)度,確定所述查詢序列的查詢類別。與現(xiàn)有技術(shù)相比,本發(fā)明對(duì)查詢序列進(jìn)行擴(kuò)展,并將擴(kuò)展后的擴(kuò)展向量與多個(gè)查詢分類匹配,根據(jù)所述擴(kuò)展向量與所述查詢分類的相關(guān)度來確定所述查詢序列的查詢類別,顯著地提高檢索的準(zhǔn)確率和召回率,增強(qiáng)了用戶體驗(yàn)。
文檔編號(hào)G06F17/30GK102063468SQ201010579518
公開日2011年5月18日 申請(qǐng)日期2010年12月3日 優(yōu)先權(quán)日2010年12月3日
發(fā)明者吳中勤 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司