專利名稱:用于補(bǔ)全搜索詞及建立個(gè)體興趣模型的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及一種用于補(bǔ)全搜索詞的方法及裝置,以及一種用于建立客戶端設(shè)備的訪問方的個(gè)體興趣模型的方法及裝置。
背景技術(shù):
隨著計(jì)算機(jī)技術(shù)的發(fā)展和互聯(lián)網(wǎng)用戶規(guī)模的不斷擴(kuò)大,越來越多的互聯(lián)網(wǎng)用戶使用個(gè)人計(jì)算機(jī)通過互聯(lián)網(wǎng)獲得各種各樣所需的信息。同時(shí),為互聯(lián)網(wǎng)用戶提供信息服務(wù)的網(wǎng)站也越來越多,互聯(lián)網(wǎng)網(wǎng)頁的數(shù)量每天都在以驚人的速度增長,互聯(lián)網(wǎng)信息呈現(xiàn)出爆發(fā)式的增長。對(duì)于用戶來說,經(jīng)常需要通過一定的手段,才能在浩如煙海的互聯(lián)網(wǎng)信息中迅速定位最適合自己需求的網(wǎng)站或者需要的信息,比如通過搜索引擎服務(wù)。搜索引擎的服務(wù)器將互聯(lián)網(wǎng)上的大量網(wǎng)站的網(wǎng)頁信息收集起來,經(jīng)過加工處理 后,建立信息數(shù)據(jù)庫和索引數(shù)據(jù)庫,用戶可以通過在搜索引擎提供的入口中輸入搜索查詢詞,獲取搜索引擎針對(duì)該搜索詞返回的搜索結(jié)果。而且,為了提高用戶搜索的效率,可以為其提供搜索查詢詞推薦的技術(shù)服務(wù),這種技術(shù)服務(wù)是在用戶輸入搜索查詢詞的一部分時(shí),為用戶推薦一定數(shù)量的匹配用戶輸入部分的搜索查詢詞的選項(xiàng)(推薦補(bǔ)全搜索詞)供用戶選擇。雖然這種技術(shù)服務(wù)在一定程度上方便了用戶使用搜索引擎,但現(xiàn)有技術(shù)中的補(bǔ)全搜索詞的推薦技術(shù)方案,在為用戶提供推薦選項(xiàng)時(shí),往往只是機(jī)械地結(jié)合用戶的輸入進(jìn)行上下文相關(guān)性的聯(lián)想,相關(guān)詞條很多無法滿足用戶的真實(shí)需求。另外一種為用戶提供推薦選項(xiàng)的技術(shù)方案,是生硬的與當(dāng)前熱點(diǎn)結(jié)合,忽視用戶的真實(shí)需求強(qiáng)行給用戶推薦熱點(diǎn)詞條,不僅無法滿足用戶的真正需求,而且還容易讓用戶反感。由此可見,現(xiàn)有在用戶搜索時(shí)為用戶提供推薦選項(xiàng)的兩種方法,由于與用戶的真正需求匹配度相對(duì)較差,因此不能很好的提高用戶搜索效率。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的用于補(bǔ)全搜索詞的方法和相應(yīng)的用于補(bǔ)全搜索詞的裝置,以及用于建立客戶端設(shè)備的訪問方的個(gè)體興趣模型的方法和相應(yīng)的用于建立客戶端設(shè)備的訪問方的個(gè)體興趣模型的裝置。依據(jù)本發(fā)明的一個(gè)方面,提供了一種用于補(bǔ)全搜索詞的方法,包括匹配客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容,獲取與所述輸入內(nèi)容具有相關(guān)性的若干候選搜索詞;至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括體現(xiàn)所述客戶端設(shè)備的訪問方的個(gè)性化興趣的信息;根據(jù)所述用于補(bǔ)全的搜索詞,對(duì)所述客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容進(jìn)行補(bǔ)全??蛇x地,所述根據(jù)用于補(bǔ)全的搜索詞,對(duì)所述客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容進(jìn)行補(bǔ)全包括向所述客戶端設(shè)備反饋所述用于補(bǔ)全的搜索詞;和/或,在所述客戶端設(shè)備的用戶界面上向所述客戶端設(shè)備的訪問方呈現(xiàn)所述用于補(bǔ)全的搜索詞。可選地,所述至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞候選搜索詞用于補(bǔ)全的搜索詞包括至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序;根據(jù)所述排序的結(jié)果,確定用于補(bǔ)全的搜索詞以及所述用于補(bǔ)全的搜索詞的順序??蛇x地,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括若干興趣點(diǎn),每一所述興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)性化興趣被賦予相應(yīng)的興趣度權(quán)重;所述至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序包括根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的興趣點(diǎn)的興趣度權(quán)重,確定所述候選搜索詞的興趣權(quán)重;至少根據(jù)所述候選搜索詞的興趣權(quán)重,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序。可選地,所述至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞包括至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞??蛇x地,所述至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞候選搜索詞用于補(bǔ)全的搜索詞包括至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序;根據(jù)所述排序的結(jié)果,確定用于補(bǔ)全的搜索詞以及所述用于補(bǔ)全的搜索詞的順序??蛇x地,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括若干興趣點(diǎn),每一所述興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)性化興趣被賦予相應(yīng)的興趣度權(quán)重;所述至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,對(duì)所述若干候選搜索詞的部分或全·部進(jìn)行排序包括根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的興趣點(diǎn)的興趣度權(quán)重,確定所述候選搜索詞的興趣權(quán)重;將所述候選搜索詞與所述當(dāng)前熱點(diǎn)信息進(jìn)行匹配,確定所述候選搜索詞的熱點(diǎn)權(quán)重;至少根據(jù)所述候選搜索詞的興趣權(quán)重和熱點(diǎn)權(quán)重,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序。根據(jù)本發(fā)明的另一方面,提供了一種用于建立客戶端設(shè)備的訪問方的個(gè)體興趣模型的方法,包括收集多臺(tái)基于客戶端設(shè)備的訪問事件的歷史行為數(shù)據(jù);根據(jù)所述多臺(tái)基于客戶端設(shè)備的訪問事件的歷史行為數(shù)據(jù),標(biāo)記和分類客戶端設(shè)備的訪問方的興趣點(diǎn)特征詞;根據(jù)每一所述客戶端設(shè)備的訪問方的個(gè)體歷史行為數(shù)據(jù)以及所述興趣點(diǎn)特征詞進(jìn)行匹配,獲得每個(gè)客戶端設(shè)備的訪問方的個(gè)體興趣模型,所述個(gè)體興趣模型中包括若干興趣點(diǎn),每一興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)體歷史行為數(shù)據(jù)被賦相應(yīng)的興趣度權(quán)重。根據(jù)本發(fā)明的又一方面,提供了一種用于補(bǔ)全搜索詞的裝置,包括接收單元,用于接收客戶端設(shè)備發(fā)送的客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容;候選確定單元,用于根據(jù)接收到的所述輸入內(nèi)容獲取與所述輸入內(nèi)容具有相關(guān)性的若干候選搜索詞;搜索詞確定單元,用于至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括體現(xiàn)所述客戶端設(shè)備的訪問方的個(gè)性化興趣的信息;反饋單元,用于向所述客戶端設(shè)備反饋所述用于補(bǔ)全的搜索
ο可選地,所述搜索詞確定單元包括第一排序單元,用于至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序;第一確定單元,用于根據(jù)所述排序的結(jié)果,確定用于補(bǔ)全的搜索詞以及所述用于補(bǔ)全的搜索詞的順序??蛇x地,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括若干興趣點(diǎn),每一所述興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)性化興趣被賦予相應(yīng)的興趣度權(quán)重;所述第一排序單元包括興趣權(quán)重子單元,用于根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的興趣點(diǎn)的興趣度權(quán)重,確定所述候選搜索詞的興趣權(quán)重;第一搜索詞排序子單元,用于至少根據(jù)所述候選搜索詞的興趣權(quán)重,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序。
可選地,所述搜索詞確定單元,具體用于至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞。可選地,所述搜索詞確定單元包括第二排序單元,用于至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序;第二確定單元,用于根據(jù)所述排序的結(jié)果,確定用于補(bǔ)全的搜索詞以及所述用于補(bǔ)全的搜索詞的順序??蛇x地,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括若干興趣點(diǎn),每一所述興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)性化興趣被賦予相應(yīng)的興趣度權(quán)重;所述第二排序單元包括興趣權(quán)重子單元,用于根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的興趣點(diǎn)的興趣度權(quán)重,確定所述候選搜索詞的興趣權(quán)重;熱點(diǎn)權(quán)重子單元,用于將所述候選搜索詞與所述當(dāng)前熱點(diǎn)信息進(jìn)行匹配,確定所述候選搜索詞的熱點(diǎn)權(quán)重;第二搜索詞排序子單元,用于至少根據(jù)所述候選搜索詞的興趣權(quán)重和熱點(diǎn)權(quán)重,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序??蛇x地,所述興趣點(diǎn)至少包括一級(jí)興趣點(diǎn)和二級(jí)興趣點(diǎn),其中每一所述一級(jí)興趣點(diǎn)包括若干二級(jí)興趣點(diǎn),所述興趣權(quán)重子單元包括第一興趣權(quán)重子單元,用于根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的二級(jí)興趣點(diǎn)的興趣度權(quán)重,以及所述相關(guān)的二級(jí)興趣點(diǎn)所屬一級(jí)興趣點(diǎn)的一級(jí)權(quán)重占比,確定所述候選搜索詞的興趣權(quán)重;或,第二興趣權(quán)重子單元,用于根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的二級(jí)興趣點(diǎn)的興趣度權(quán)重,以及所述相關(guān)的二級(jí)興趣點(diǎn)在所屬一級(jí)興趣點(diǎn)中的二級(jí)權(quán)重占比,確定所述候選搜索詞的興趣權(quán)重??蛇x地,所述興趣點(diǎn)至少包括一級(jí)興趣點(diǎn)和二級(jí)興趣點(diǎn),其中每一所述一級(jí)興趣點(diǎn)包括若干二級(jí)興趣點(diǎn),所述興趣權(quán)重子單元包括第三興趣權(quán)重子單元,用于在如果所述客戶端設(shè)備的訪問方進(jìn)行的搜索是非垂直搜索時(shí),則根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的二級(jí)興趣點(diǎn)的興趣度權(quán)重,以及所述相關(guān)的二級(jí)興趣點(diǎn)所屬一級(jí)興趣點(diǎn)的一級(jí)權(quán)重占比,確定所述候選搜索詞的興趣權(quán)重;以及,第四興趣權(quán)重子單元,用于在如果所述客戶端設(shè)備的訪問方進(jìn)行的搜索是垂直搜索時(shí),確定所述垂直搜索對(duì)應(yīng)的一級(jí)興趣點(diǎn),根據(jù)所述一級(jí)興趣點(diǎn)下與所述候選搜索詞相關(guān)的二級(jí)興趣點(diǎn)的興趣度權(quán)重,以及所述相關(guān)的二級(jí)興趣點(diǎn)在所屬一級(jí)興趣點(diǎn)中的二級(jí)權(quán)重占比,確定所述候選搜索詞的興趣權(quán)重。依據(jù)本發(fā)明的又一方面,提供了一種用于補(bǔ)全搜索詞的裝置,包括輸入獲取單元,用于獲取客戶端設(shè)備的訪問方在客戶端設(shè)備上進(jìn)行搜索的輸入內(nèi)容;候選確定單元,用于根據(jù)所述輸入內(nèi)容獲取與所述輸入內(nèi)容具有相關(guān)性的若干候選搜索詞;搜索詞確定單元,用于至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括體現(xiàn)所述用戶個(gè)性化興趣的信息;信息呈現(xiàn)單元,用于在所述客戶端設(shè)備的用戶界面上向所述客戶端設(shè)備的訪問方呈現(xiàn)所述用于補(bǔ)全的搜索詞??蛇x地,所述搜索詞確定單元,具體用于至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞。依據(jù)本發(fā)明的又一方面,提供了一種用于補(bǔ)全搜索詞的裝置,包括候選單元,用于匹配客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容,獲取與所述輸入內(nèi)容具有相關(guān)性的若干 候選搜索詞;補(bǔ)全搜索詞確定單元,用于至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括體現(xiàn)所述客戶端設(shè)備的訪問方的個(gè)性化興趣的信息;補(bǔ)全單元,用于根據(jù)所述用于補(bǔ)全的搜索詞,對(duì)所述客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容進(jìn)行補(bǔ)全。依據(jù)本發(fā)明的再一方面,提供了一種用于建立客戶端設(shè)備的訪問方的個(gè)體興趣模型的裝置,包括數(shù)據(jù)收集單元,用于收集多臺(tái)基于客戶端設(shè)備的訪問事件的歷史行為數(shù)據(jù);標(biāo)記分類單元,用于根據(jù)所述多臺(tái)基于客戶端設(shè)備的訪問事件的歷史行為數(shù)據(jù),標(biāo)記和分類客戶端設(shè)備的訪問方的興趣點(diǎn)特征詞;匹配單元,用于根據(jù)每一所述客戶端設(shè)備的訪問方的個(gè)體歷史行為數(shù)據(jù)以及所述興趣點(diǎn)特征詞進(jìn)行匹配,獲得每個(gè)客戶端設(shè)備的訪問方的個(gè)體興趣模型,所述個(gè)體興趣模型中包括若干興趣點(diǎn),每一興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)體歷史行為數(shù)據(jù)被賦相應(yīng)的興趣度權(quán)重。根據(jù)本發(fā)明的推薦補(bǔ)全搜索詞的方法和裝置,及具體實(shí)施例,可以通過匹配客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容,獲取與客戶端設(shè)備的訪問方輸入內(nèi)容具有相關(guān)性的若干補(bǔ)全搜索詞,為客戶端設(shè)備的訪問方確定用于補(bǔ)全的搜索詞做好數(shù)據(jù)準(zhǔn)備;然后至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型確定用于補(bǔ)全的搜索詞,可以為不同的客戶端設(shè)備的訪問方確定更符合其興趣要求的補(bǔ)全搜索詞;并根據(jù)用于補(bǔ)全的搜索詞,對(duì)客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容進(jìn)行補(bǔ)全。,由此解決了只是機(jī)械地結(jié)合用戶的輸入進(jìn)行上下文相關(guān)性的聯(lián)想,或生硬的與當(dāng)前熱點(diǎn)結(jié)合,忽視用戶的真實(shí)需求給用戶推薦熱點(diǎn)詞條,而無法滿足用戶的真正需求的問題。取得了能夠在不同用戶進(jìn)行搜索輸入時(shí)為其輸入內(nèi)容補(bǔ)全更符合其個(gè)人興趣要求的搜索詞的有益效果。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式
。
通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中圖I示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的用于補(bǔ)全搜索詞的方法流程圖;圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的用于建立客戶端設(shè)備的訪問方的個(gè)體興趣模型的方法流程圖;圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的用于補(bǔ)全搜索詞的裝置第一實(shí)施例示意圖;以及圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的用于建立客戶端設(shè)備的訪問方的個(gè)體興趣模型的裝置示意圖。
具體實(shí)施例方式下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。請參閱圖1,其示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的用于補(bǔ)全搜索詞的方法流程圖。該方法實(shí)施例包括以下步驟SlOl :匹配客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容,獲取與所述輸入內(nèi)容具有相關(guān)性的若干候選搜索詞;每一個(gè)用戶可以對(duì)應(yīng)一個(gè)客戶端設(shè)備,用戶作為客戶端設(shè)備的訪問方,可以是客戶端設(shè)備的登錄者或輸入者,每個(gè)客戶端設(shè)備的訪問方可以被分配以一個(gè)和客戶端設(shè)備的訪問方對(duì)應(yīng)的唯一性標(biāo)識(shí),以對(duì)不同的客戶端設(shè)備的訪問方進(jìn)行區(qū)分。為敘述方便,下述后續(xù)實(shí)施例以及具體實(shí)施方式
的描述中,在某些具體闡述時(shí)會(huì)以“用戶”代替“客戶端設(shè)備的訪問方”進(jìn)行說明。用戶在使用搜索引擎時(shí),可以通過多種站點(diǎn)的頁面提供的搜索引擎入口來使用,例如可以使用搜索引擎服務(wù)提供商提供的站點(diǎn)頁面中提供的搜索引擎入口,還可以使用一些導(dǎo)航網(wǎng)站的頁面提供的搜索引擎入口等來使用搜索引擎。用戶可以在這些搜索引擎入口輸入關(guān)鍵詞,查詢需要的信息。用戶進(jìn)行搜索的輸入內(nèi)容,狹義的理解可以包括用戶在搜索引擎入口中使用鼠標(biāo)、鍵盤、觸屏等輸入設(shè)備進(jìn)行輸入時(shí)輸入的具體字符等;廣義的理解,還可以包括用戶在搜索引擎入口中使用輸入設(shè)備進(jìn)行輸入時(shí)產(chǎn)生的行為信息,例如用戶將鼠標(biāo)指針定位到搜索引擎入口,或者用戶在搜索引擎入口進(jìn)行點(diǎn)擊等行為所產(chǎn)生的信息。在用戶進(jìn)行輸入時(shí),可以將用戶的輸入內(nèi)容與保存有若干詞的詞庫進(jìn)行匹配,進(jìn)而獲取與用戶輸入的內(nèi)容具有相關(guān)性的若干候選搜索詞。在匹配用戶的輸入內(nèi)容獲取與用戶輸入內(nèi)容具有相關(guān)性的補(bǔ)全搜索詞時(shí),可以獲取與用戶輸入內(nèi)容有上下文相關(guān)性的字詞,例如當(dāng)用戶當(dāng)前輸入的內(nèi)容是“η”時(shí),獲取的作為候選搜索詞可以包括“NBA”、“嫩54”、“1^8”、“0剛”、“嫩5040”等,可以將這些詞作為候選搜索詞。另外有一種特殊情況是,當(dāng)用戶還未在搜索引擎入口輸入任何字符內(nèi)容,但卻產(chǎn)生了廣義上的行為信息時(shí),例如在用戶將鼠標(biāo)指針定位到搜索引擎入口,卻未輸入任何字符內(nèi)容時(shí),可以認(rèn)為此時(shí)的狀態(tài)是用戶的輸入字符為空,用戶的輸入內(nèi)容為用戶將鼠標(biāo)指針定位到搜索入口所產(chǎn)生的行為信息,此時(shí)也可以使用一定的方法獲取候選的補(bǔ)全搜索詞,例如根據(jù)用戶的瀏覽網(wǎng)頁歷史記錄數(shù)據(jù),分析出用戶的瀏覽偏好信息,根據(jù)這些用戶偏好信息,獲取用戶在用戶將鼠標(biāo)指針定位到搜索引擎入口卻還未輸入任何字符時(shí)的候選搜索詞。此外,在用戶輸入的內(nèi)容發(fā)生變化時(shí),還可以根據(jù)變化后的用戶的輸入內(nèi)容進(jìn)行匹配,以實(shí)時(shí)地匹配用戶的搜索內(nèi)容,獲取與用戶輸入的當(dāng)前內(nèi)容具有相關(guān)性的若干補(bǔ)全搜索詞。S102:至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括體現(xiàn)所述客戶端設(shè)備的訪問方的個(gè)性化興趣的信息。為了更充分的公開本步驟的具體實(shí)現(xiàn),首先介紹客戶端設(shè)備的訪問方的個(gè)體興趣模型的相關(guān)技術(shù)特征??蛻舳嗽O(shè)備的訪問方的個(gè)體興趣模型,是體現(xiàn)不同用戶個(gè)體的不同興趣類別的一 種數(shù)據(jù)模型,其包括體現(xiàn)用戶個(gè)性化興趣的信息??蛻舳嗽O(shè)備的訪問方的個(gè)體興趣模型的表達(dá)形式可以是多樣的,即客戶端設(shè)備的訪問方的個(gè)體興趣模型包括的體現(xiàn)用戶個(gè)性化興趣的信息可以是多種多樣的,只要能體現(xiàn)出用戶的興趣即可,本發(fā)明實(shí)施例對(duì)用戶個(gè)體興趣模型的具體形式并沒有限制。例如,可以通過興趣點(diǎn)和興趣點(diǎn)的興趣度權(quán)重作為體現(xiàn)用戶個(gè)性化興趣的信息。例如,客戶端設(shè)備的訪問方的個(gè)體興趣模型可以包括用戶的若干興趣點(diǎn)(或稱興趣分類),每一興趣點(diǎn)包括若干興趣點(diǎn)特征詞,對(duì)于每一興趣點(diǎn)可以基于用戶的個(gè)性化興趣賦予興趣度權(quán)重。為每一興趣點(diǎn)賦予興趣度權(quán)重的過程,可以認(rèn)為是對(duì)具體客戶端設(shè)備的訪問方的個(gè)體興趣模型的實(shí)例化或量化的過程,而根據(jù)具體客戶端設(shè)備的訪問方的個(gè)性化興趣對(duì)此客戶端設(shè)備的訪問方的個(gè)體興趣模型實(shí)例化或量化后,得到的就是此客戶端設(shè)備的訪問方的個(gè)體興趣模型的實(shí)例。比如用集合表示的客戶端設(shè)備的訪問方的個(gè)體興趣模型可以是首先,可以根據(jù)群體用戶的興趣進(jìn)行分類,獲得一個(gè)基準(zhǔn)興趣分類,例如,根據(jù)用戶群體的興趣數(shù)據(jù)獲得如下的一個(gè)基準(zhǔn)興趣分類,每類可以代表一個(gè)興趣點(diǎn),每個(gè)興趣點(diǎn)包括若干興趣點(diǎn)特征詞,例
如{新聞,體育,科技,娛樂,汽車,視頻,......,房產(chǎn),旅游,音樂,時(shí)尚,軍事,教育},這
個(gè)集合包含了某用戶群體的所有興趣點(diǎn),每個(gè)興趣點(diǎn)都可以包括若干興趣點(diǎn)特征詞,比如,“體育”這個(gè)興趣點(diǎn)可以包括興趣點(diǎn)特征詞“姚明”、“奧運(yùn)會(huì)”、“比賽”等等,這些特征詞都屬于該興趣點(diǎn)。而對(duì)于群體中每個(gè)具體的用戶個(gè)體而言,對(duì)集合中每個(gè)興趣點(diǎn)的興趣高低程度可能不盡相同,此時(shí),可以基于基準(zhǔn)興趣分類建立客戶端設(shè)備的訪問方的個(gè)體興趣模型,表示用戶個(gè)體對(duì)基準(zhǔn)興趣分類中各興趣點(diǎn)的興趣高低程度,基于基準(zhǔn)興趣分類的個(gè)體興趣模型可以用數(shù)據(jù)集合的形式來表示,如{cIq 3*1,&2,&3,&4,&5,......,&i,^ ( +ι) & (i+2),&(i+3),& (i+4),&(i+5)^對(duì)集合中的各個(gè)元素進(jìn)行數(shù)量化和實(shí)例化,就可以得到用于表示某個(gè)具體客戶端設(shè)備的訪問方的個(gè)體興趣模型實(shí)例,例如上述的用戶群體中的某個(gè)具體客戶端設(shè)備的訪問方的個(gè)體興趣模型可以實(shí)例化為{950,540,51,855,0,1022,......,10,366,784,599,15,56}集合中每個(gè)元素對(duì)應(yīng)基準(zhǔn)興趣分類中的一個(gè)分類,即一個(gè)興趣點(diǎn),用戶對(duì)于各興趣點(diǎn)的興趣高低程度則通過各元素的取值,即興趣度權(quán)重來反映,如上述的數(shù)據(jù)集合就可以用來表示此用戶某一時(shí)刻對(duì)各個(gè)興趣點(diǎn)的感興趣程度,如元素a5對(duì)應(yīng)的值1022相對(duì)于其他元素較高,則可以看出此用戶此時(shí)對(duì)元素a5對(duì)應(yīng)的視頻類信息的興趣度較高。又如,為了更加細(xì)化用戶興趣分類,還可以使用二維矩陣來建立和表示客戶端設(shè)備的訪問方的個(gè)體興趣模型,二維矩陣表示的個(gè)體興趣模型如下所示
權(quán)利要求
1.一種用于補(bǔ)全搜索詞的方法,包括 匹配客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容,獲取與所述輸入內(nèi)容具有相關(guān)性的若干候選搜索詞; 至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括體現(xiàn)所述客戶端設(shè)備的訪問方的個(gè)性化興趣的信息; 根據(jù)所述用于補(bǔ)全的搜索詞,對(duì)所述客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容進(jìn)行補(bǔ)全。
2.根據(jù)權(quán)利要求I所述的方法,所述根據(jù)用于補(bǔ)全的搜索詞,對(duì)所述客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容進(jìn)行補(bǔ)全包括 向所述客戶端設(shè)備反饋所述用于補(bǔ)全的搜索詞; 和/或, 在所述客戶端設(shè)備的用戶界面上向所述客戶端設(shè)備的訪問方呈現(xiàn)所述用于補(bǔ)全的搜索詞。
3.根據(jù)權(quán)利要求I所述的方法,所述至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞候選搜索詞用于補(bǔ)全的搜索詞包括 至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序; 根據(jù)所述排序的結(jié)果,確定用于補(bǔ)全的搜索詞以及所述用于補(bǔ)全的搜索詞的順序。
4.根據(jù)權(quán)利要求3所述的方法,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括若干興趣點(diǎn),每一所述興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)性化興趣被賦予相應(yīng)的興趣度權(quán)重;所述至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序包括 根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的興趣點(diǎn)的興趣度權(quán)重,確定所述候選搜索詞的興趣權(quán)重; 至少根據(jù)所述候選搜索詞的興趣權(quán)重,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序。
5.根據(jù)權(quán)利要求I所述的方法,所述至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞包括 至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞。
6.根據(jù)權(quán)利要求5所述的方法,所述至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞候選搜索詞用于補(bǔ)全的搜索詞包括 至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序; 根據(jù)所述排序的結(jié)果,確定用于補(bǔ)全的搜索詞以及所述用于補(bǔ)全的搜索詞的順序。
7.根據(jù)權(quán)利要求6所述的方法,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括若干興趣點(diǎn),每一所述興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)性化興趣被賦予相應(yīng)的興趣度權(quán)重;所述至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序包括 根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的興趣點(diǎn)的興趣度權(quán)重,確定所述候選搜索詞的興趣權(quán)重; 將所述候選搜索詞與所述當(dāng)前熱點(diǎn)信息進(jìn)行匹配,確定所述候選搜索詞的熱點(diǎn)權(quán)重;至少根據(jù)所述候選搜索詞的興趣權(quán)重和熱點(diǎn)權(quán)重,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序。
8.一種用于建立客戶端設(shè)備的訪問方的個(gè)體興趣模型的方法,包括 收集多臺(tái)基于客戶端設(shè)備的訪問事件的歷史行為數(shù)據(jù); 根據(jù)所述多臺(tái)基于客戶端設(shè)備的訪問事件的歷史行為數(shù)據(jù),標(biāo)記和分類客戶端設(shè)備的訪問方的興趣點(diǎn)特征詞; 根據(jù)每一所述客戶端設(shè)備的訪問方的個(gè)體歷史行為數(shù)據(jù)以及所述興趣點(diǎn)特征詞進(jìn)行匹配,獲得每個(gè)客戶端設(shè)備的訪問方的個(gè)體興趣模型,所述個(gè)體興趣模型中包括若干興趣點(diǎn),每一興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)體歷史行為數(shù)據(jù)被賦相應(yīng)的興趣度權(quán)重。
9.一種用于補(bǔ)全搜索詞的裝置,包括 接收單元,用于接收客戶端設(shè)備發(fā)送的客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容;候選確定單元,用于根據(jù)接收到的所述輸入內(nèi)容獲取與所述輸入內(nèi)容具有相關(guān)性的若干候選搜索詞; 搜索詞確定單元,用于至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括體現(xiàn)所述客戶端設(shè)備的訪問方的個(gè)性化興趣的信息; 反饋單元,用于向所述客戶端設(shè)備反饋所述用于補(bǔ)全的搜索詞。
10.根據(jù)權(quán)利要求9所述的裝置,所述搜索詞確定單元包括 第一排序單元,用于至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序; 第一確定單元,用于根據(jù)所述排序的結(jié)果,確定用于補(bǔ)全的搜索詞以及所述用于補(bǔ)全的搜索詞的順序。
11.根據(jù)權(quán)利要求10所述的裝置,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括若干興趣點(diǎn),每一所述興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)性化興趣被賦予相應(yīng)的興趣度權(quán)重;所述第一排序單元包括 興趣權(quán)重子單元,用于根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的興趣點(diǎn)的興趣度權(quán)重,確定所述候選搜索詞的興趣權(quán)重; 第一搜索詞排序子單元,用于至少根據(jù)所述候選搜索詞的興趣權(quán)重,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序。
12.根據(jù)權(quán)利要求9所述的裝置 所述搜索詞確定單元,具體用于至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞。
13.根據(jù)權(quán)利要求12所述的裝置,所述搜索詞確定單元包括 第二排序單元,用于至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序; 第二確定單元,用于根據(jù)所述排序的結(jié)果,確定用于補(bǔ)全的搜索詞以及所述用于補(bǔ)全的搜索詞的順序。
14.根據(jù)權(quán)利要求13所述的裝置,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括若干興趣點(diǎn),每一所述興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)性化興趣被賦予相應(yīng)的興趣度權(quán)重;所述第二排序單元包括 興趣權(quán)重子單元,用于根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的興趣點(diǎn)的興趣度權(quán)重,確定所述候選搜索詞的興趣權(quán)重; 熱點(diǎn)權(quán)重子單元,用于將所述候選搜索詞與所述當(dāng)前熱點(diǎn)信息進(jìn)行匹配,確定所述候選搜索詞的熱點(diǎn)權(quán)重; 第二搜索詞排序子單元,用于至少根據(jù)所述候選搜索詞的興趣權(quán)重和熱點(diǎn)權(quán)重,對(duì)所述若干候選搜索詞的部分或全部進(jìn)行排序。
15.根據(jù)權(quán)利要求11或14中任一項(xiàng)所述的裝置,所述興趣點(diǎn)至少包括一級(jí)興趣點(diǎn)和二級(jí)興趣點(diǎn),其中每一所述一級(jí)興趣點(diǎn)包括若干二級(jí)興趣點(diǎn),所述興趣權(quán)重子單元包括 第一興趣權(quán)重子單元,用于根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的二級(jí)興趣點(diǎn)的興趣度權(quán)重,以及所述相關(guān)的二級(jí)興趣點(diǎn)所屬一級(jí)興趣點(diǎn)的一級(jí)權(quán)重占比,確定所述候選搜索詞的興趣權(quán)重; 或, 第二興趣權(quán)重子單元,用于根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的二級(jí)興趣點(diǎn)的興趣度權(quán)重,以及所述相關(guān)的二級(jí)興趣點(diǎn)在所屬一級(jí)興趣點(diǎn)中的二級(jí)權(quán)重占比,確定所述候選搜索詞的興趣權(quán)重。
16.根據(jù)權(quán)利要求11或14中任一項(xiàng)所述的裝置,所述興趣點(diǎn)至少包括一級(jí)興趣點(diǎn)和二級(jí)興趣點(diǎn),其中每一所述一級(jí)興趣點(diǎn)包括若干二級(jí)興趣點(diǎn),所述興趣權(quán)重子單元包括 第三興趣權(quán)重子單元,用于在如果所述客戶端設(shè)備的訪問方進(jìn)行的搜索是非垂直搜索時(shí),則根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型中與所述候選搜索詞相關(guān)的二級(jí)興趣點(diǎn)的興趣度權(quán)重,以及所述相關(guān)的二級(jí)興趣點(diǎn)所屬一級(jí)興趣點(diǎn)的一級(jí)權(quán)重占比,確定所述候選搜索詞的興趣權(quán)重; 以及, 第四興趣權(quán)重子單元,用于在如果所述客戶端設(shè)備的訪問方進(jìn)行的搜索是垂直搜索時(shí),確定所述垂直搜索對(duì)應(yīng)的一級(jí)興趣點(diǎn),根據(jù)所述一級(jí)興趣點(diǎn)下與所述候選搜索詞相關(guān)的二級(jí)興趣點(diǎn)的興趣度權(quán)重,以及所述相關(guān)的二級(jí)興趣點(diǎn)在所屬一級(jí)興趣點(diǎn)中的二級(jí)權(quán)重占比,確定所述候選搜索詞的興趣權(quán)重。
17.一種用于補(bǔ)全搜索詞的裝置,包括 輸入獲取單元,用于獲取客戶端設(shè)備的訪問方在客戶端設(shè)備上進(jìn)行搜索的輸入內(nèi)容; 候選確定單兀,用于根據(jù)所述輸入內(nèi)容獲取與所述輸入內(nèi)容具有相關(guān)性的若干候選搜索詞; 搜索詞確定單元,用于至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括體現(xiàn)所述用戶個(gè)性化興趣的信息;信息呈現(xiàn)單元,用于在所述客戶端設(shè)備的用戶界面上向所述客戶端設(shè)備的訪問方呈現(xiàn)所述用于補(bǔ)全的搜索詞。
18.根據(jù)權(quán)利要求17所述的裝置 所述搜索詞確定單元,具體用于至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型和當(dāng)前熱點(diǎn)信息,在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞。
19.一種用于補(bǔ)全搜索詞的裝置,包括 候選單元,用于匹配客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容,獲取與所述輸入內(nèi)容具有相關(guān)性的若干候選搜索詞; 補(bǔ)全搜索詞確定單元,用于至少根據(jù)客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括體現(xiàn)所述客戶端設(shè)備的訪問方的個(gè)性化興趣的信息; 補(bǔ)全單元,用于根據(jù)所述用于補(bǔ)全的搜索詞,對(duì)所述客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容進(jìn)行補(bǔ)全。
20.一種用于建立客戶端設(shè)備的訪問方的個(gè)體興趣模型的裝置,包括 數(shù)據(jù)收集單元,用于收集多臺(tái)基于客戶端設(shè)備的訪問事件的歷史行為數(shù)據(jù); 標(biāo)記分類單元,用于根據(jù)所述多臺(tái)基于客戶端設(shè)備的訪問事件的歷史行為數(shù)據(jù),標(biāo)記和分類客戶端設(shè)備的訪問方的興趣點(diǎn)特征詞; 匹配單元,用于根據(jù)每一所述客戶端設(shè)備的訪問方的個(gè)體歷史行為數(shù)據(jù)以及所述興趣點(diǎn)特征詞進(jìn)行匹配,獲得每個(gè)客戶端設(shè)備的訪問方的個(gè)體興趣模型,所述個(gè)體興趣模型中包括若干興趣點(diǎn),每一興趣點(diǎn)基于所述客戶端設(shè)備的訪問方的個(gè)體歷史行為數(shù)據(jù)被賦相應(yīng)的興趣度權(quán)重。
全文摘要
本發(fā)明公開了一種用于補(bǔ)全搜索詞的方法,包括匹配客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容,獲取與所述輸入內(nèi)容具有相關(guān)性的若干候選搜索詞;至少根據(jù)所述客戶端設(shè)備的訪問方的個(gè)體興趣模型在所述若干候選搜索詞中確定用于補(bǔ)全的搜索詞,所述客戶端設(shè)備的訪問方的個(gè)體興趣模型包括體現(xiàn)所述客戶端設(shè)備的訪問方的個(gè)性化興趣的信息;根據(jù)所述用于補(bǔ)全的搜索詞,對(duì)所述客戶端設(shè)備的訪問方進(jìn)行搜索的輸入內(nèi)容進(jìn)行補(bǔ)全。本發(fā)明還公開了一種用于補(bǔ)全搜索詞的裝置。能夠在不同用戶進(jìn)行搜索輸入時(shí)為其輸入內(nèi)容補(bǔ)全更符合其個(gè)人興趣要求的搜索詞。
文檔編號(hào)G06F17/30GK102902753SQ201210353539
公開日2013年1月30日 申請日期2012年9月20日 優(yōu)先權(quán)日2012年9月20日
發(fā)明者周浩, 鄧夏瑋 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司