亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于知識庫的問答題目生成方法和裝置的制造方法_2

文檔序號:9261430閱讀:來源:國知局
實(shí)體,依據(jù)屬性/實(shí)體詞典,形成二元組數(shù)據(jù)〈實(shí)體,屬性〉。為了方便描述起見,本文用符號S表示實(shí)體,符號P表示屬性。實(shí)體和屬性在通常的語言表達(dá)中以“實(shí)體的屬性”形式成對出現(xiàn),例如,實(shí)體為男明星A,他相應(yīng)的屬性可包括:性別、民族、年齡、妻子等,在通常的語言中表達(dá)為:實(shí)體的屬性,例如,男明星A的性別、男明星A的民族、男明星A的年齡、男明星A的妻子等。
[0025]根據(jù)上述獲取的二元數(shù)據(jù)組〈實(shí)體,屬性 >,可以通過機(jī)器學(xué)習(xí)之類的算法進(jìn)行訓(xùn)練,挖掘語言表達(dá)習(xí)慣的模板。利用挖掘出的語言表達(dá)的模板,可以對二元數(shù)據(jù)組中的實(shí)體和屬性元素進(jìn)行問句改寫,生成對應(yīng)的問題。
[0026]根據(jù)獲取的二元數(shù)據(jù)組〈實(shí)體,屬性 > 從知識庫中獲取該二元數(shù)據(jù)組中實(shí)體的屬性對應(yīng)的屬性值,并將該屬性值與二元數(shù)組合并生成三元數(shù)據(jù)組〈實(shí)體,屬性,屬性值〉。從大規(guī)模的知識庫(例如,語料)中可獲取二元數(shù)據(jù)組〈實(shí)體,屬性〉中實(shí)體的屬性對應(yīng)的屬性值,例如,對于二元數(shù)據(jù)組〈男明星A,妻子〉,從大規(guī)模的語料中可獲得該二元數(shù)據(jù)組中男明星A(實(shí)體)的妻子(屬性)對應(yīng)的屬性值:女明星B。然后,將獲取的屬性值(女明星B)與二元數(shù)據(jù)組〈男明星A,妻子 > 合并得到三元數(shù)據(jù)組〈男明星A,妻子,女明星B〉。
[0027]接下來,執(zhí)行步驟S102,將步驟SlOl獲取的三元數(shù)據(jù)組〈實(shí)體,屬性,屬性值 > 中的任意一個元素作為正確答案根據(jù)語言表達(dá)習(xí)慣的模板生成該正確答案對應(yīng)的問題。例如,可以將三元數(shù)據(jù)組〈實(shí)體,屬性,屬性值〉中的實(shí)體、屬性、屬性值三者中的任意一者作為正確答案,另外二者作為問題的主干結(jié)構(gòu),生成該正確答案對應(yīng)的問題,例如,可以生成多種問句形式的問題。
[0028]在一些實(shí)施方式中,可根據(jù)三元數(shù)據(jù)組〈實(shí)體,屬性,屬性值〉中的實(shí)體和屬性,獲取查詢?nèi)罩?querylog),對querylog中涉及的實(shí)體和屬性進(jìn)行過濾(例如,過濾的邏輯可以為:querylog需要包含一個實(shí)體和一個屬性),然后按照屬性點(diǎn)擊量進(jìn)行累加,得到屬性的重要度數(shù)據(jù)。例如,利用查詢?nèi)罩镜狞c(diǎn)擊量的累加統(tǒng)計(jì),也就是搜索次數(shù)的加權(quán)和,累加是按照相同的屬性累計(jì)。對于:Queryl:點(diǎn)擊加權(quán)5.4包含實(shí)體SI和Pl ;Queryl:點(diǎn)擊加權(quán)1.4包含實(shí)體51和?2山1^^1:點(diǎn)擊加權(quán)3.4包含實(shí)體SI和P1。那么Pl的累加是5.4+3.4,P2的累加是1.4。屬性累加的值越高說明用戶對該屬性越關(guān)注,該屬性越重要。利用這樣的重要度較高的屬性生成問題,對用戶而言,興趣度較高,也可認(rèn)為生成問題的質(zhì)量較高。在獲取屬性重要度數(shù)據(jù)的情形下,可以利用這些屬性生成問句成分包括“實(shí)體的屬性”的問題。例如,實(shí)體(男明星A)的屬性之一妻子的重要度比較高,那么可以生成下述這樣的問題:“男明星A的妻子是?”、“誰是男明星A的妻子? ”等。
[0029]在一些實(shí)施方式中,還可根據(jù)二元數(shù)據(jù)組〈實(shí)體,屬性 > 挖掘人們的語言表達(dá)習(xí)慣,然后利用三元數(shù)據(jù)組〈實(shí)體,屬性,屬性值〉中的一個元素作為正確答案生成問題。例如,可以根據(jù)挖掘的語言表達(dá)習(xí)慣將實(shí)體、屬性、屬性值中的兩者作為主干結(jié)構(gòu)生成問句,也就是說,依據(jù)語言表達(dá)習(xí)慣的模板對三元數(shù)據(jù)中的元素進(jìn)行問句改寫。例如,對于三元數(shù)據(jù)組〈男子A,兒子,男孩B〉,可以改寫為下述形式的問題:“男子A的兒子是? ”、“誰是男子A的兒子? ”、“男子A的兒子名字是? ”、“誰的兒子是男孩B”等。
[0030]在一些實(shí)施方式中,還可以根據(jù)屬性值的不同類型(例如,屬性值為人物類型,或者屬性值為列表),生成另外形式的問句。在屬性值為人物類型的情況下,以該屬性值作為正確答案生成的問題可以是:“哪位是實(shí)體的屬性? ”。例如,對于三元數(shù)據(jù)組〈男明星A,妻子,女明星B〉,屬性值為女明星B的情況下,以該屬性值作為正確答案生成的問題可以是:“哪位是男明星A的妻子? ”。在屬性值為列表的情況下,以該屬性值作為正確答案生成的問題可以是:“哪個是實(shí)體的屬性? ”或者“哪個不是實(shí)體的屬性? ”。例如,哪個是XX的好友?或者,哪個不是XX的好友?。
[0031]在本發(fā)明的一些實(shí)施方式,基于知識庫的問答題目生成方法還可以包括:根據(jù)正確答案和/或生成的問題的約束信息生成該問題的一個以上錯誤答案,其中,約束信息可包括正確答案的約束信息、生成的問題的約束信息以及正確答案和生成的問題的共同的約束信息。約束信息的種類可包括,但不限于下述的一種或多種(例如,大于或等于2種):屬性集合、屬性值結(jié)合、熱門程度以及公知常識。
[0032]例如,屬性值元素作為正確答案,問題為“實(shí)體的屬性是? ”的情形下,可以利用屬性值集合約束信息、屬性集合約束信息或?qū)傩灾导虾蛯傩约霞s束信息三種中的一種、二種或三種。對于屬性值集合約束信息,可以通過查找生成該問題的三元數(shù)據(jù)組中的屬性值所對應(yīng)的屬性值的集合和生成該問題的三元數(shù)據(jù)組中的實(shí)體的屬性對應(yīng)的屬性值的集合的差集,利用共現(xiàn)分析輔助生成。也就是說,從上述屬性值的差集中選取與作為正確答案的屬性值相似的選項(xiàng)作為錯誤選項(xiàng),可選擇多個這樣的錯誤選項(xiàng)。例如,具有下述三元數(shù)據(jù)組:〈男明星A、妻子、女明星a>〈男明星B、妻子、女明星b>,<男明星C、妻子、女明星C〉,<男明星D、妻子、女明星d> ;對于問題:男明星A的妻子?,生成該問題的三元數(shù)據(jù)組〈男明星A、妻子、女明星a>中的屬性值對應(yīng)的集合為SI,8卩{女明星a},生成該問題的實(shí)體的屬性對應(yīng)的屬性值的集合為S2,8卩{女明星a,女明星b,女明星c,女明星d}。集合SI和S2的差集為{女明星b,女明星C,女明星d}。利用這樣的差集可生成相似錯誤選項(xiàng):女明星b,女明星C,女明星d。
[0033]對于屬性集合約束信息,可以利用夫妻屬性、出生日期屬性等作為約束信息。例如,在屬性為妻子或丈夫的情況下,可以限定錯誤選項(xiàng)為女性或男性。又例如,在屬性為出生日期的情況下,可以限定出生日期大于1900等。
[0034]對于熱門程度(例如,可通過用戶搜索量或點(diǎn)擊量等因子進(jìn)行量化)約束信息,可以用于對上面獲取的相似的錯誤選項(xiàng)進(jìn)行篩選,篩選掉熱門程度較低的錯誤選項(xiàng)。在一些實(shí)施方式中,可以省略上面的相似選項(xiàng)選取步驟,僅利用熱門程度生成熱門程度較高的錯誤選項(xiàng)。
[0035]對于公知常識約束信息,例如,在實(shí)體為“XX妹妹”的情況下,她的性別屬性,根據(jù)公知常識可知為女性,她的年齡不會是40歲以上。
[0036]在本發(fā)明的實(shí)施方式中,基于知識庫的問答題目生成方法還可包括:對正確答案和/或錯誤答案進(jìn)行配圖。通過上述的描述可知,正確答案或錯誤答案可以是實(shí)體、屬性或?qū)傩灾抵械囊环N,對正確答案和/或錯誤的答案的配圖可包括對實(shí)體、屬性或?qū)傩灾档呐鋱D。對于實(shí)體的配圖,例如,對于人物實(shí)體,可以采用該人物的頭像、劇照等圖片。對于屬性值(例如,星座、國籍、屬相、職業(yè)、民族等)的配圖,例如,對于國籍的配圖,可以采用該國的國旗等圖片。
[0037]在本發(fā)明的實(shí)施方式中,基于知識庫的問答題目生成方法還可包括:在生成的問題的顯示頁面呈現(xiàn)正確答案查看鏈接,供用戶查看該問題的正確答案。例如,可以如圖2所示,在問題的后面設(shè)置“偷看答案”選項(xiàng),作為正確答案的查看鏈接,點(diǎn)擊該連接,用戶可查看該問題的正確答案,方便了用戶實(shí)時了解自己的答題狀況。
[0038]通過上面的描述,通過海量知識庫的結(jié)構(gòu)化數(shù)據(jù)可生成問題、正確答案和錯誤答案,可與不同的類別
當(dāng)前第2頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1