亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于中心詞確定搜索建議的方法及裝置的制造方法_4

文檔序號:9818316閱讀:來源:國知局
叫外賣”通過正向最大匹配法進(jìn)行分詞,得到分詞片段“外賣”、“訂餐”、“叫”和“午餐”;若預(yù)置的候選詞表包括“外賣”、“叫”和“訂餐”,將多個分詞片段“夕卜賣”、“訂餐”、“叫”和“午餐”進(jìn)行篩選處理,得到“午餐”不在候選詞表中,隨后濾除分詞片段“午餐”,得到篩選結(jié)果為“外賣”、“訂餐”和“叫”,隨后可將篩選結(jié)果中分詞長度最短的分詞片段“叫”濾除,得到篩選結(jié)果為“外賣”和“訂餐”,并將篩選結(jié)果確定為中心詞訓(xùn)練集。
[0130]其中,生成單元包括表示子單元、提取子單元和生成子單元。表示子單元將各個分詞片段通過向量維度的方式來表示;提取子單元提取中心詞訓(xùn)練集中各個分詞片段的特征屬性;生成子單元基于特征屬性,對以向量維度的方式來表示的分詞片段進(jìn)行分類訓(xùn)練來生成機(jī)器學(xué)習(xí)算法。
[0131]其中,特征屬性包括但不限于:
[0132]詞性相關(guān)信息;
[0133]與相應(yīng)的歷史搜索關(guān)鍵詞的關(guān)系信息;
[0134]TF-1DF;
[0135]特殊詞相關(guān)信息;
[0136]實體詞相關(guān)信息。
[0137]例如,將篩選得到的分詞片段,如“外賣”和“訂餐”通過多維度向量來表示各分詞的不同表示方式,并通過類別標(biāo)注方法為每個通過多維度向量表示后的分詞標(biāo)注分詞類另IJ,并將每個通過多維度向量表示后的分詞與分詞片段“外賣”和“訂餐”對應(yīng)的詞標(biāo)注為正例,其它詞為負(fù)例,隨后,提取中心詞訓(xùn)練集中各個分詞片段的特征屬性,包括詞性相關(guān)信息,如不僅考慮詞自身的詞性,還兼顧其前詞和后詞的詞性的相關(guān)信息、與相應(yīng)的歷史搜索關(guān)鍵詞的關(guān)系信息、TF_IDF(Term Frequency-1nverse Document Frequency)、特殊詞相關(guān)信息,如是否出現(xiàn)在特殊詞表中和實體詞相關(guān)信息如是否在實體詞表中等,基于特征屬性,對以向量維度來表示的分詞片段進(jìn)行分類訓(xùn)練來生成機(jī)器學(xué)習(xí)算法,如可通過Liblinear(分類器)對以向量維度來表示的分詞片段“外賣”和“訂餐”進(jìn)行離線分類訓(xùn)練來生成機(jī)器學(xué)習(xí)算法。
[0138]在一具體應(yīng)用場景中,當(dāng)用戶通過終端設(shè)備在搜索引擎的輸入框中輸入搜索關(guān)鍵詞如“春節(jié)搶紅包”,搜索引擎的服務(wù)器實時獲取用戶輸入的搜索關(guān)鍵詞“春節(jié)搶紅包”;隨后,提取搜索關(guān)鍵詞中對應(yīng)的中心詞,如“春節(jié)”、“搶”和“紅包”,根據(jù)本發(fā)明方案中生成的機(jī)器學(xué)習(xí)算法提取到的中心詞“春節(jié)”、“搶”和“紅包”確定向用戶推薦的與搜索關(guān)鍵詞相關(guān)聯(lián)的搜索建議如“微信搶紅包”、“春節(jié)搶紅包活動”、“春節(jié)搶紅包攻略”、“支付寶春節(jié)搶紅包”等,如圖3所示。
[0139]本技術(shù)領(lǐng)域技術(shù)人員可以理解,本發(fā)明包括涉及用于執(zhí)行本申請中所述操作中的一項或多項的設(shè)備。這些設(shè)備可以為所需的目的而專門設(shè)計和制造,或者也可以包括通用計算機(jī)中的已知設(shè)備。這些設(shè)備具有存儲在其內(nèi)的計算機(jī)程序,這些計算機(jī)程序選擇性地激活或重構(gòu)。這樣的計算機(jī)程序可以被存儲在設(shè)備(例如,計算機(jī))可讀介質(zhì)中或者存儲在適于存儲電子指令并分別耦聯(lián)到總線的任何類型的介質(zhì)中,所述計算機(jī)可讀介質(zhì)包括但不限于任何類型的盤(包括軟盤、硬盤、光盤、CD-ROM、和磁光盤)、R0M(Read-0nly Memory,只讀存儲器)、RAM (Random Access Memory,隨即存儲器)、EPROM(Erasable ProgrammableRead-Only Memory,可擦寫可編程只讀存儲器)、EEPR0M(E1 ectricalIy ErasableProgrammable Read-Only Memory,電可擦可編程只讀存儲器)、閃存、磁性卡片或光線卡片。也就是,可讀介質(zhì)包括由設(shè)備(例如,計算機(jī))以能夠讀的形式存儲或傳輸信息的任何介質(zhì)。
[0140]本技術(shù)領(lǐng)域技術(shù)人員可以理解,可以用計算機(jī)程序指令來實現(xiàn)這些結(jié)構(gòu)圖和/或框圖和/或流圖中的每個框以及這些結(jié)構(gòu)圖和/或框圖和/或流圖中的框的組合。本技術(shù)領(lǐng)域技術(shù)人員可以理解,可以將這些計算機(jī)程序指令提供給通用計算機(jī)、專業(yè)計算機(jī)或其他可編程數(shù)據(jù)處理方法的處理器來實現(xiàn),從而通過計算機(jī)或其他可編程數(shù)據(jù)處理方法的處理器來執(zhí)行本發(fā)明公開的結(jié)構(gòu)圖和/或框圖和/或流圖的框或多個框中指定的方案。
[0141]本技術(shù)領(lǐng)域技術(shù)人員可以理解,本發(fā)明中已經(jīng)討論過的各種操作、方法、流程中的步驟、措施、方案可以被交替、更改、組合或刪除。進(jìn)一步地,具有本發(fā)明中已經(jīng)討論過的各種操作、方法、流程中的其他步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。進(jìn)一步地,現(xiàn)有技術(shù)中的具有與本發(fā)明中公開的各種操作、方法、流程中的步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。
[0142]以上所述僅是本發(fā)明的部分實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
【主權(quán)項】
1.一種基于中心詞確定搜索建議的方法,其特征在于,包括: 獲取來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞; 提取與所述搜索關(guān)鍵詞對應(yīng)的中心詞; 根據(jù)所述中心詞確定向用戶推薦的與所述搜索關(guān)鍵詞相關(guān)聯(lián)的搜索建議。2.根據(jù)權(quán)利要求1所述的基于中心詞確定搜索建議的方法,其中,提取與所述搜索關(guān)鍵詞對應(yīng)的中心詞,包括: 通過機(jī)器學(xué)習(xí)算法提取與所述搜索關(guān)鍵詞對應(yīng)的中心詞。3.根據(jù)權(quán)利要求1或2所述的基于中心詞確定搜索建議的方法,其特征在于,該方法還包括: 獲取對應(yīng)同一統(tǒng)一資源定位符的多個歷史搜索關(guān)鍵詞,并生成對應(yīng)于所述同一統(tǒng)一資源定位符的搜索關(guān)鍵詞集合; 對所述搜索關(guān)鍵詞集合中的多個歷史搜索關(guān)鍵詞進(jìn)行處理,并對處理結(jié)果進(jìn)行模型訓(xùn)練來生成所述機(jī)器學(xué)習(xí)算法。4.根據(jù)權(quán)利要求1-3任一項所述的基于中心詞確定搜索建議的方法,其特征在于,獲取對應(yīng)同一統(tǒng)一資源定位符的多個歷史搜索關(guān)鍵詞,具體包括: 獲取針對多個用戶的歷史搜索點(diǎn)擊記錄; 提取所述歷史搜索點(diǎn)擊記錄中歷史搜索關(guān)鍵詞與搜索結(jié)果項、及搜索結(jié)果項與統(tǒng)一資源定位符的對應(yīng)關(guān)系; 根據(jù)所述對應(yīng)關(guān)系來獲取對應(yīng)同一統(tǒng)一資源定位符的多個歷史搜索關(guān)鍵詞。5.根據(jù)權(quán)利要求1-4任一項所述的基于中心詞確定搜索建議的方法,其特征在于,提取所述歷史搜索點(diǎn)擊記錄中歷史搜索關(guān)鍵詞與搜索結(jié)果項、及搜索結(jié)果項與統(tǒng)一資源定位符的對應(yīng)關(guān)系,具體包括: 提取所述歷史搜索點(diǎn)擊記錄中多個用戶分別輸入的歷史搜索關(guān)鍵詞,及多個用戶基于其各自輸入的歷史搜索關(guān)鍵詞所點(diǎn)擊的搜索結(jié)果項之間的對應(yīng)關(guān)系;及提取所述搜索結(jié)果項與相對應(yīng)的統(tǒng)一資源定位符的對應(yīng)關(guān)系。6.—種基于中心詞確定搜索建議的裝置,其特征在于,包括: 獲取模塊,用于獲取來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞; 提取模塊,用于提取與所述搜索關(guān)鍵詞對應(yīng)的中心詞; 推薦模塊,用于根據(jù)所述中心詞確定向用戶推薦的與所述搜索關(guān)鍵詞相關(guān)聯(lián)的搜索建議。7.根據(jù)權(quán)利要求6所述的基于中心詞確定搜索建議的裝置,所述提取模塊包括: 第一提取單元,用于通過機(jī)器學(xué)習(xí)算法提取與所述搜索關(guān)鍵詞對應(yīng)的中心詞。8.根據(jù)權(quán)利要求6或7所述的基于中心詞確定搜索建議的裝置,其特征在于,該裝置還包括: 獲取生成模塊,用于獲取對應(yīng)同一統(tǒng)一資源定位符的多個歷史搜索關(guān)鍵詞,并生成對應(yīng)于所述同一統(tǒng)一資源定位符的搜索關(guān)鍵詞集合; 處理模塊,用于對所述搜索關(guān)鍵詞集合中的多個歷史搜索關(guān)鍵詞進(jìn)行處理,并對處理結(jié)果進(jìn)行模型訓(xùn)練來生成所述機(jī)器學(xué)習(xí)算法。9.根據(jù)權(quán)利要求6-8任一項所述的基于中心詞確定搜索建議的裝置,其特征在于,所述獲取生成模塊具體包括: 第一獲取單元,用于獲取針對多個用戶的歷史搜索點(diǎn)擊記錄; 第二提取單元,用于提取所述歷史搜索點(diǎn)擊記錄中歷史搜索關(guān)鍵詞與搜索結(jié)果項、及搜索結(jié)果項與統(tǒng)一資源定位符的對應(yīng)關(guān)系; 第二獲取單元,用于根據(jù)所述對應(yīng)關(guān)系來獲取對應(yīng)同一統(tǒng)一資源定位符的多個歷史搜索關(guān)鍵詞。10.根據(jù)權(quán)利要求6-9任一項所述的基于中心詞確定搜索建議的裝置,其特征在于,所述第二提取單元具體用于提取所述歷史搜索點(diǎn)擊記錄中多個用戶分別輸入的歷史搜索關(guān)鍵詞,及多個用戶基于其各自輸入的歷史搜索關(guān)鍵詞所點(diǎn)擊的搜索結(jié)果項之間的對應(yīng)關(guān)系;及提取所述搜索結(jié)果項與相對應(yīng)的統(tǒng)一資源定位符的對應(yīng)關(guān)系。
【專利摘要】本發(fā)明提供了一種基于中心詞確定搜索建議的方法及裝置,包括:獲取來自終端設(shè)備的用戶輸入的搜索關(guān)鍵詞,提取與搜索關(guān)鍵詞對應(yīng)的中心詞,根據(jù)中心詞確定向用戶推薦的與搜索關(guān)鍵詞相關(guān)聯(lián)的搜索建議。本方案通過機(jī)器學(xué)習(xí)算法提取與搜索關(guān)鍵詞對應(yīng)的中心詞,可實現(xiàn)中心詞的自動提取,通過標(biāo)準(zhǔn)化且客觀的方式準(zhǔn)確地提取巨大數(shù)量級的搜索關(guān)鍵詞的中心詞,從而極大地節(jié)約了提取中心詞的人力及時間成本;同時,通過機(jī)器學(xué)習(xí)算法在中心詞提取過程中進(jìn)行分類訓(xùn)練,實現(xiàn)了高效準(zhǔn)確提取巨大數(shù)量級搜索關(guān)鍵詞的中心詞的目的,并根據(jù)提取到的中心詞向用戶推薦最符合其感興趣的搜索關(guān)鍵詞,幫助用戶快速且準(zhǔn)確地搜索到其所需的查詢結(jié)果,提高用戶的搜索體驗。
【IPC分類】G06F17/30
【公開號】CN105589954
【申請?zhí)枴緾N201510965213
【發(fā)明人】劉鎏, 伍兆蓋, 肖峰
【申請人】北京奇虎科技有限公司, 奇智軟件(北京)有限公司
【公開日】2016年5月18日
【申請日】2015年12月21日
當(dāng)前第4頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1