1.一種知識圖譜中實體熱門度的計算方法,其特征在于,包括:
抓取知識圖譜中實體的百科頁面,對所述實體的百科頁面的基礎(chǔ)屬性進行統(tǒng)計,獲取基礎(chǔ)屬性的統(tǒng)計結(jié)果;所述基礎(chǔ)屬性包括屬性數(shù)量、鏈接數(shù)量、頁面篇幅、出品日期/上映時間、百科頁面瀏覽次數(shù)統(tǒng)計、百科頁面最近更新統(tǒng)計、日常用語的實體出現(xiàn)頻率中的一種或多種;
根據(jù)所述基礎(chǔ)屬性的統(tǒng)計結(jié)果,設(shè)置各基礎(chǔ)屬性的初始熱門度;
對各基礎(chǔ)屬性的初始熱門度進行歸一化處理,獲取各基礎(chǔ)屬性的歸一化熱門度;
獲取各基礎(chǔ)屬性的加權(quán)系數(shù);
根據(jù)各基礎(chǔ)屬性的加權(quán)系數(shù),對各基礎(chǔ)屬性的歸一化熱門度進行加權(quán)求和,獲取實體熱門度。
2.根據(jù)權(quán)利要求1所述的知識圖譜中實體熱門度的計算方法,其特征在于,還包括:
定期更新實體熱門度。
3.根據(jù)權(quán)利要求2所述的知識圖譜中實體熱門度的計算方法,其特征在于,所述定期更新實體熱門度的步驟,具體為:
對各基礎(chǔ)屬性的初始熱門度進行更新;
根據(jù)更新后的各基礎(chǔ)屬性的初始熱門度,對各基礎(chǔ)屬性的歸一化熱門度進行更新;
根據(jù)更新后的各基礎(chǔ)屬性的歸一化熱門度,對實體熱門度進行更新;或者,
根據(jù)搜索網(wǎng)站的熱搜榜單、排名及排名變化,獲取熱搜數(shù)據(jù);
對社區(qū)網(wǎng)站的短評與長評按時間序列進行計數(shù),獲取社區(qū)數(shù)據(jù);
對人機對話記錄中的實體按時間序列進行計數(shù),獲取對話數(shù)據(jù);
將所述熱搜數(shù)據(jù)、所述社區(qū)數(shù)據(jù)、所述對話數(shù)據(jù)作為標(biāo)定數(shù)據(jù)集,根據(jù)所述標(biāo)定數(shù)據(jù)集,對各基礎(chǔ)屬性的加權(quán)系數(shù)進行更新;
根據(jù)更新后的各基礎(chǔ)屬性的加權(quán)系數(shù),對實體熱門度進行更新。
4.根據(jù)權(quán)利要求1或2所述的知識圖譜中實體熱門度的計算方法,其特征在于,還包括:
對知識圖譜中相鄰實體的實體熱門度進行修正。
5.一種知識圖譜中實體熱門度在人機對話中的應(yīng)用方法,其特征在于,包括:
根據(jù)用戶輸入的信息,獲取知識類回答和閑聊類回答;所述知識類回答中包括實體;
權(quán)利要求1-4任一項所述的知識圖譜中實體熱門度的計算方法;
根據(jù)實體熱門度,獲取知識類回答分數(shù);
獲取閑聊類回答分數(shù);
根據(jù)所述知識類回答分數(shù)、所述閑聊類回答分數(shù),對知識類回答和閑聊類回答進行排序,獲取排序結(jié)果;
根據(jù)所述排序結(jié)果,對用戶進行回應(yīng)。
6.一種知識圖譜中實體熱門度的計算裝置,其特征在于,包括:
統(tǒng)計模塊,用于抓取知識圖譜中實體的百科頁面,對所述實體的百科頁面的基礎(chǔ)屬性進行統(tǒng)計,獲取基礎(chǔ)屬性的統(tǒng)計結(jié)果;所述基礎(chǔ)屬性包括屬性數(shù)量、鏈接數(shù)量、頁面篇幅、出品日期/上映時間、百科頁面瀏覽次數(shù)統(tǒng)計、百科頁面最近更新統(tǒng)計、日常用語的實體出現(xiàn)頻率中的一種或多種;
設(shè)置模塊,用于根據(jù)所述基礎(chǔ)屬性的統(tǒng)計結(jié)果,設(shè)置各基礎(chǔ)屬性的初始熱門度;
歸一化模塊,用于對各基礎(chǔ)屬性的初始熱門度進行歸一化處理,獲取各基礎(chǔ)屬性的歸一化熱門度;
系數(shù)獲取模塊,用于獲取各基礎(chǔ)屬性的加權(quán)系數(shù);
計算模塊,用于根據(jù)各基礎(chǔ)屬性的加權(quán)系數(shù),對各基礎(chǔ)屬性的歸一化熱門度進行加權(quán)求和,獲取實體熱門度。
7.根據(jù)權(quán)利要求6所述的知識圖譜中實體熱門度的計算裝置,其特征在于,還包括:
更新模塊,用于定期更新實體熱門度。
8.根據(jù)權(quán)利要求7所述的知識圖譜中實體熱門度的計算裝置,其特征在于,所述更新模塊用于:
對各基礎(chǔ)屬性的初始熱門度進行更新;
根據(jù)更新后的各基礎(chǔ)屬性的初始熱門度,對各基礎(chǔ)屬性的歸一化熱門度進行更新;
根據(jù)更新后的各基礎(chǔ)屬性的歸一化熱門度,對實體熱門度進行更新;或者,
根據(jù)搜索網(wǎng)站的熱搜榜單、排名及排名變化,獲取熱搜數(shù)據(jù);
對社區(qū)網(wǎng)站的短評與長評按時間序列進行計數(shù),獲取社區(qū)數(shù)據(jù);
對人機對話記錄中的實體按時間序列進行計數(shù),獲取對話數(shù)據(jù);
將所述熱搜數(shù)據(jù)、所述社區(qū)數(shù)據(jù)、所述對話數(shù)據(jù)作為標(biāo)定數(shù)據(jù)集,根據(jù)所述標(biāo)定數(shù)據(jù)集,對各基礎(chǔ)屬性的加權(quán)系數(shù)進行更新;
根據(jù)更新后的各基礎(chǔ)屬性的加權(quán)系數(shù),對實體熱門度進行更新。
9.根據(jù)權(quán)利要求6或7所述的知識圖譜中實體熱門度的計算裝置,其特征在于,還包括:
修正模塊,用于對知識圖譜中相鄰實體的實體熱門度進行修正。
10.一種知識圖譜中實體熱門度在人機對話中的應(yīng)用裝置,其特征在于,包括:
回答獲取模塊,用于根據(jù)用戶輸入的信息,獲取知識類回答和閑聊類回答;所述知識類回答中包括實體;
權(quán)利要求6-9任一項所述的知識圖譜中實體熱門度的計算裝置;
第一分數(shù)模塊,用于根據(jù)實體熱門度,獲取知識類回答分數(shù);
第二分數(shù)模塊,用于獲取閑聊類回答分數(shù);
排序模塊,用于根據(jù)所述知識類回答分數(shù)、所述閑聊類回答分數(shù),對知識類回答和閑聊類回答進行排序,獲取排序結(jié)果;
回應(yīng)模塊,用于根據(jù)所述排序結(jié)果,對用戶進行回應(yīng)。