亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

行業(yè)詞典的建立方法和裝置及行業(yè)識(shí)別方法和裝置的制造方法_5

文檔序號(hào):8943042閱讀:來(lái)源:國(guó)知局
擊的搜索結(jié)果的點(diǎn)擊概率大于第二門限值時(shí),將該搜索詞作為精確索引詞,并確定對(duì)應(yīng)的所述點(diǎn)擊概率大于第二門限值的搜索結(jié)果所屬的行業(yè),作為所述精確索引詞對(duì)應(yīng)的行業(yè);建立并保存所述精確索引詞和對(duì)應(yīng)的行業(yè)的詞條對(duì),形成精確詞典。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在統(tǒng)計(jì)各搜索詞的搜索頻率之后,所述方法還包括: 對(duì)于所述搜索頻率小于等于第一門限值的各搜索詞,利用所述精確詞典,對(duì)該搜索詞進(jìn)行拆分,得到該搜索詞對(duì)應(yīng)的子搜索詞,以及所述子搜索詞對(duì)應(yīng)的行業(yè);將該搜索詞對(duì)應(yīng)的子搜索詞作為模糊索引詞,建立并保存所述模糊索引詞、以及所述子搜索詞對(duì)應(yīng)的行業(yè)的詞條對(duì),形成模糊詞典。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在形成模糊詞典之后,所述方法還包括: 在該搜索詞對(duì)應(yīng)的子搜索詞的數(shù)量為至少兩個(gè)時(shí),利用優(yōu)先級(jí)確定策略,確定至少兩個(gè)子搜索詞的優(yōu)先級(jí),建立并保存所述至少兩個(gè)子搜索詞與優(yōu)先級(jí)最高的子搜索詞對(duì)應(yīng)的行業(yè)的詞條對(duì),形成優(yōu)先級(jí)詞典。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,利用優(yōu)先級(jí)確定策略,確定至少兩個(gè)子搜索詞的優(yōu)先級(jí),包括下述至少一項(xiàng): 根據(jù)所述至少兩個(gè)子搜索詞在對(duì)應(yīng)的搜索詞中的位置,確定位置靠后的子搜索詞的優(yōu)先級(jí)高于位置靠前的子搜索詞的優(yōu)先級(jí); 根據(jù)所述至少兩個(gè)子搜索詞的詞長(zhǎng),確定詞長(zhǎng)較長(zhǎng)的子搜索詞的優(yōu)先級(jí)高于詞長(zhǎng)較短的子搜索詞的優(yōu)先級(jí); 根據(jù)所述至少兩個(gè)子搜索詞對(duì)應(yīng)的搜索詞的被點(diǎn)擊的搜索結(jié)果的點(diǎn)擊概率,確定點(diǎn)擊概率較高的被點(diǎn)擊的搜索結(jié)果對(duì)應(yīng)的子搜索詞的優(yōu)先級(jí)高于點(diǎn)擊概率較低的被點(diǎn)擊的搜索結(jié)果對(duì)應(yīng)的子搜索詞的優(yōu)先級(jí)。6.一種行業(yè)詞典的建立裝置,其特征在于,包括: 日志獲取模塊,用于獲取用戶搜索行為日志; 提取模塊,用于從所述用戶搜索行為日志中提取各搜索詞,以及對(duì)應(yīng)的被點(diǎn)擊的搜索結(jié)果; 精確詞典形成模塊,用于根據(jù)所述被點(diǎn)擊的搜索結(jié)果確定搜索詞所屬行業(yè),將所述搜索詞作為精確索引詞,建立并保存所述精確索引詞和對(duì)應(yīng)的行業(yè)的詞條對(duì),形成精確詞典。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述精確詞典形成模塊具體用于: 統(tǒng)計(jì)各搜索詞的搜索頻率,以及所述對(duì)應(yīng)的被點(diǎn)擊的搜索結(jié)果的點(diǎn)擊概率; 對(duì)于所述搜索頻率大于第一門限值的各搜索詞,在該搜索詞對(duì)應(yīng)的被點(diǎn)擊的搜索結(jié)果的點(diǎn)擊概率大于第二門限值時(shí),將該搜索詞作為精確索引詞,并確定對(duì)應(yīng)的所述點(diǎn)擊概率大于第二門限值的搜索結(jié)果所屬的行業(yè),作為所述精確索引詞對(duì)應(yīng)的行業(yè);建立并保存所述精確索引詞和對(duì)應(yīng)的行業(yè)的詞條對(duì),形成精確詞典。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 模糊詞典形成模塊,用于在統(tǒng)計(jì)各搜索詞的搜索頻率之后,對(duì)于所述搜索頻率小于等于第一門限值的各搜索詞,利用所述精確詞典,對(duì)該搜索詞進(jìn)行拆分,得到該搜索詞對(duì)應(yīng)的子搜索詞,以及所述子搜索詞對(duì)應(yīng)的行業(yè);將該搜索詞對(duì)應(yīng)的子搜索詞作為模糊索引詞,建立并保存所述模糊索引詞、以及所述子搜索詞對(duì)應(yīng)的行業(yè)的詞條對(duì),形成模糊詞典。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 優(yōu)先級(jí)確定模塊,用于在形成模糊詞典之后,在該搜索詞對(duì)應(yīng)的子搜索詞的數(shù)量為至少兩個(gè)時(shí),利用優(yōu)先級(jí)確定策略,確定至少兩個(gè)子搜索詞的優(yōu)先級(jí); 優(yōu)先級(jí)詞典形成模塊,用于建立并保存所述至少兩個(gè)子搜索詞與優(yōu)先級(jí)最高的子搜索詞對(duì)應(yīng)的行業(yè)的詞條對(duì),形成優(yōu)先級(jí)詞典。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述優(yōu)先級(jí)確定模塊包括下述至少一個(gè)子模塊: 第一優(yōu)先級(jí)確定子模塊,用于根據(jù)所述至少兩個(gè)子搜索詞在對(duì)應(yīng)的搜索詞中的位置,確定位置靠后的子搜索詞的優(yōu)先級(jí)高于位置靠前的子搜索詞的優(yōu)先級(jí); 第二優(yōu)先級(jí)確定子模塊,用于根據(jù)所述至少兩個(gè)子搜索詞的詞長(zhǎng),確定詞長(zhǎng)較長(zhǎng)的子搜索詞的優(yōu)先級(jí)高于詞長(zhǎng)較短的子搜索詞的優(yōu)先級(jí); 第三優(yōu)先級(jí)確定子模塊,用于根據(jù)所述至少兩個(gè)子搜索詞對(duì)應(yīng)的搜索詞的被點(diǎn)擊的搜索結(jié)果的點(diǎn)擊概率,確定點(diǎn)擊概率較高的被點(diǎn)擊的搜索結(jié)果對(duì)應(yīng)的子搜索詞的優(yōu)先級(jí)高于點(diǎn)擊概率較低的被點(diǎn)擊的搜索結(jié)果對(duì)應(yīng)的子搜索詞的優(yōu)先級(jí)。11.一種行業(yè)識(shí)別方法,基于權(quán)利要求1-5任一所述的行業(yè)詞典的建立方法所建立的詞典實(shí)現(xiàn),其特征在于,包括: 獲取用戶輸入的查詢串; 在預(yù)先建立的精確詞典中精確匹配所述查詢串,將匹配成功的精確索引詞所對(duì)應(yīng)的行業(yè)作為所述查詢串對(duì)應(yīng)的行業(yè),并返回所述查詢串對(duì)應(yīng)的行業(yè)。12.根據(jù)權(quán)利要求11所述的方法,其特征在于,在預(yù)先建立的精確詞典中精確匹配所述查詢串之后,所述方法還包括: 如果匹配失敗,則在預(yù)先建立的模糊詞典中模糊匹配所述查詢串,將匹配成功的模糊索引詞對(duì)應(yīng)的行業(yè)作為所述查詢串對(duì)應(yīng)的行業(yè),并返回所述查詢串對(duì)應(yīng)的行業(yè)。13.根據(jù)權(quán)利要求12所述的方法,其特征在于,在預(yù)先建立的模糊詞典中模糊匹配所述查詢串之后,所述方法還包括: 在檢測(cè)到匹配成功的模糊索引詞的數(shù)量為至少兩個(gè)時(shí),利用預(yù)先建立的優(yōu)先級(jí)詞典,確定所述至少兩個(gè)模糊索引詞對(duì)應(yīng)的行業(yè),作為所述查詢串對(duì)應(yīng)的行業(yè),并返回所述查詢串對(duì)應(yīng)的行業(yè)。14.根據(jù)權(quán)利要求11-13任一所述的方法,其特征在于,在返回所述查詢串對(duì)應(yīng)的行業(yè)之后,所述方法還包括: 根據(jù)所述查詢串對(duì)應(yīng)的行業(yè),對(duì)與所述查詢串對(duì)應(yīng)的搜索結(jié)果進(jìn)行截?cái)嗵幚?,得到所述查詢串?duì)應(yīng)的召回結(jié)果; 返回所述召回結(jié)果。15.根據(jù)權(quán)利要求11-13任一所述的方法,其特征在于,在返回所述查詢串對(duì)應(yīng)的行業(yè)之后,所述方法還包括: 根據(jù)所述查詢串對(duì)應(yīng)的行業(yè)進(jìn)行信息推薦;或者 根據(jù)所述查詢串對(duì)應(yīng)的行業(yè),確定推薦信息,并選取展示組件;按照所選取的展示組件對(duì)所述推薦信息進(jìn)行處理,返回所述處理結(jié)果。16.一種行業(yè)識(shí)別裝置,基于權(quán)利要求6-10任一所述的行業(yè)詞典的建立裝置所建立的詞典實(shí)現(xiàn),其特征在于,包括: 查詢串獲取模塊,用于獲取用戶輸入的查詢串; 行業(yè)識(shí)別模塊,用于在預(yù)先建立的精確詞典中精確匹配所述查詢串,將匹配成功的精確索引詞所對(duì)應(yīng)的行業(yè)作為所述查詢串對(duì)應(yīng)的行業(yè),并返回所述查詢串對(duì)應(yīng)的行業(yè)。17.根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述行業(yè)識(shí)別模塊,還用于在預(yù)先建立的精確詞典中精確匹配所述查詢串之后,如果匹配失敗,則在預(yù)先建立的模糊詞典中模糊匹配所述查詢串,將匹配成功的模糊索引詞對(duì)應(yīng)的行業(yè)作為所述查詢串對(duì)應(yīng)的行業(yè),并返回所述查詢串對(duì)應(yīng)的行業(yè)。18.根據(jù)權(quán)利要求17所述的裝置,其特征在于,所述行業(yè)識(shí)別模塊,還用于在預(yù)先建立的模糊詞典中模糊匹配所述查詢串之后,在檢測(cè)到匹配成功的模糊索引詞的數(shù)量為至少兩個(gè)時(shí),利用預(yù)先建立的優(yōu)先級(jí)詞典,確定所述至少兩個(gè)模糊索引詞對(duì)應(yīng)的行業(yè),作為所述查詢串對(duì)應(yīng)的行業(yè),并返回所述查詢串對(duì)應(yīng)的行業(yè)。19.根據(jù)權(quán)利要求16-18任一所述的裝置,其特征在于,所述裝置還包括: 召回結(jié)果獲取模塊,用于在返回所述查詢串對(duì)應(yīng)的行業(yè)之后,根據(jù)所述查詢串對(duì)應(yīng)的行業(yè),對(duì)與所述查詢串對(duì)應(yīng)的搜索結(jié)果進(jìn)行截?cái)嗵幚?,得到所述查詢串?duì)應(yīng)的召回結(jié)果; 召回結(jié)果返回模塊,用于返回所述召回結(jié)果。20.根據(jù)權(quán)利要求16-18任一所述的裝置,其特征在于,所述裝置還包括: 信息推薦模塊,用于在返回所述查詢串對(duì)應(yīng)的行業(yè)之后,根據(jù)所述查詢串對(duì)應(yīng)的行業(yè)進(jìn)行信息推薦; 或者: 推薦要素確定模塊,用于在返回所述查詢串對(duì)應(yīng)的行業(yè)之后,根據(jù)所述查詢串對(duì)應(yīng)的行業(yè),確定推薦信息,并選取展示組件; 展示處理模塊,用于按照所選取的展示組件對(duì)所述推薦信息進(jìn)行處理,返回所述處理結(jié)果。
【專利摘要】本發(fā)明實(shí)施例提供一種行業(yè)詞典的建立方法和裝置及行業(yè)識(shí)別方法和裝置。該行業(yè)詞典的建立方法包括:獲取用戶搜索行為日志;從用戶搜索行為日志中提取各搜索詞,以及對(duì)應(yīng)的被點(diǎn)擊的搜索結(jié)果;根據(jù)所述被點(diǎn)擊的搜索結(jié)果確定搜索詞所屬行業(yè),將所述搜索詞作為精確索引詞,建立并保存所述精確索引詞和對(duì)應(yīng)的行業(yè)的詞條對(duì),形成精確詞典?;谟脩羲阉餍袨槿罩镜姆治隹勺詣?dòng)建立精確詞典,由于被點(diǎn)擊的搜索結(jié)果反映了用戶的搜索需求,基于此確定搜索詞所屬行業(yè),得到的詞條對(duì)的準(zhǔn)確率高;由于對(duì)精確索引詞的對(duì)應(yīng)的所有被點(diǎn)擊的搜索結(jié)果均進(jìn)行了分析,避免了某些精確索引詞與行業(yè)的一對(duì)多對(duì)應(yīng)關(guān)系的遺漏,提高了精確詞典的詞條對(duì)的準(zhǔn)確率。
【IPC分類】G06F17/30, G06F17/27
【公開(kāi)號(hào)】CN105159884
【申請(qǐng)?zhí)枴緾N201510613993
【發(fā)明人】郭濤
【申請(qǐng)人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
【公開(kāi)日】2015年12月16日
【申請(qǐng)日】2015年9月23日
當(dāng)前第5頁(yè)1 2 3 4 5 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1