亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于排序?qū)W習(xí)的自動(dòng)問(wèn)答裝置及方法_2

文檔序號(hào):8258871閱讀:來(lái)源:國(guó)知局
數(shù)子集;以及將所述相關(guān)性特征參數(shù)子集和所述重要性特征子集進(jìn)行組合,得出所述用戶查詢與該候選問(wèn)答集的所述特征參數(shù)集。
[0018]優(yōu)選地,該裝置包括多個(gè)建庫(kù)端,每個(gè)建庫(kù)端對(duì)應(yīng)一個(gè)領(lǐng)域,為所對(duì)應(yīng)的領(lǐng)域構(gòu)建問(wèn)答庫(kù)和針對(duì)該問(wèn)答庫(kù)的問(wèn)答排序模型;以及所述檢索端中的所述檢索模塊還用于接收來(lái)自用戶的領(lǐng)域選擇信息,并根據(jù)該領(lǐng)域選擇信息確定與用戶選擇的領(lǐng)域?qū)?yīng)的問(wèn)答庫(kù),以及根據(jù)所述用戶查詢從與所述用戶選擇的領(lǐng)域?qū)?yīng)的問(wèn)答庫(kù)中篩選與所述用戶查詢有關(guān)的候選問(wèn)答集;以及所述排序模塊利用針對(duì)與所述用戶選擇的領(lǐng)域?qū)?yīng)的問(wèn)答庫(kù)的問(wèn)答排序模型對(duì)與所述用戶查詢有關(guān)的所述候選問(wèn)答集進(jìn)行排序。
[0019]在上述技術(shù)方案中,可以根據(jù)構(gòu)建的問(wèn)答庫(kù)中的預(yù)設(shè)查詢和問(wèn)答集,構(gòu)建出排序訓(xùn)練數(shù)據(jù),并基于機(jī)器學(xué)習(xí)的方法,利用所構(gòu)建的排序訓(xùn)練數(shù)據(jù)進(jìn)行排序?qū)W習(xí),從而自動(dòng)構(gòu)建出問(wèn)答排序模型。通過(guò)排序?qū)W習(xí)過(guò)程,可以自動(dòng)計(jì)算出各項(xiàng)特征參數(shù)的特征權(quán)值,無(wú)需開發(fā)人員進(jìn)行手動(dòng)設(shè)定,從而降低了人工參與成本,并且實(shí)時(shí)性好。即使增加或減少特征參數(shù)、或者因問(wèn)答庫(kù)發(fā)生更新而導(dǎo)致特征參數(shù)的分布發(fā)生變化,也可以通過(guò)上述排序?qū)W習(xí)過(guò)程自動(dòng)擬合出新的特征權(quán)值,從而適應(yīng)這種特征參數(shù)的變化,且保證構(gòu)建出的問(wèn)答排序模型的可靠性和準(zhǔn)確性。
[0020]本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的【具體實(shí)施方式】部分予以詳細(xì)說(shuō)明。
【附圖說(shuō)明】
[0021]附圖是用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說(shuō)明書的一部分,與下面的【具體實(shí)施方式】一起用于解釋本發(fā)明,但并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中:
[0022]圖1示出了根據(jù)本發(fā)明的實(shí)施方式的基于排序?qū)W習(xí)的自動(dòng)問(wèn)答方法的流程圖;
[0023]圖2示出了根據(jù)本發(fā)明的實(shí)施方式的基于排序?qū)W習(xí)的自動(dòng)問(wèn)答裝置的示意圖;
[0024]圖3示出了根據(jù)本發(fā)明的另一實(shí)施方式的基于排序?qū)W習(xí)的自動(dòng)問(wèn)答裝置的示意圖;以及
[0025]圖4示出了根據(jù)本發(fā)明的另一實(shí)施方式的基于排序?qū)W習(xí)的自動(dòng)問(wèn)答裝置的示意圖。
【具體實(shí)施方式】
[0026]以下結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】進(jìn)行詳細(xì)說(shuō)明。應(yīng)當(dāng)理解的是,此處所描述的【具體實(shí)施方式】?jī)H用于說(shuō)明和解釋本發(fā)明,并不用于限制本發(fā)明。
[0027]圖1示出了根據(jù)本發(fā)明的實(shí)施方式的基于排序?qū)W習(xí)的自動(dòng)問(wèn)答方法的流程圖。如圖1所示,該方法可以包括:步驟a:構(gòu)建問(wèn)答庫(kù),該問(wèn)答庫(kù)可以包括多個(gè)預(yù)設(shè)查詢和與每個(gè)預(yù)設(shè)查詢一一對(duì)應(yīng)的問(wèn)答集;步驟b:根據(jù)所述問(wèn)答庫(kù)中包括的所述預(yù)設(shè)查詢和所述問(wèn)答集,為每個(gè)預(yù)設(shè)查詢構(gòu)建訓(xùn)練樣本,并對(duì)所述訓(xùn)練樣本進(jìn)行正負(fù)例標(biāo)注;步驟c:根據(jù)每個(gè)預(yù)設(shè)查詢的訓(xùn)練樣本、以及每個(gè)預(yù)設(shè)查詢的訓(xùn)練樣本的正負(fù)例標(biāo)注,為每個(gè)預(yù)設(shè)查詢構(gòu)建排序訓(xùn)練數(shù)據(jù);步驟d:利用所構(gòu)建的所有排序訓(xùn)練數(shù)據(jù)進(jìn)行排序?qū)W習(xí),得出針對(duì)所述問(wèn)答庫(kù)的問(wèn)答排序模型;步驟e:接收用戶查詢,并根據(jù)所述用戶查詢從所述問(wèn)答庫(kù)中篩選與所述用戶查詢有關(guān)的候選問(wèn)答集;以及步驟f:利用所述問(wèn)答排序模型對(duì)所述候選問(wèn)答集進(jìn)行排序。
[0028]具體地,首先,在步驟a中,可以構(gòu)建問(wèn)答庫(kù),該問(wèn)答庫(kù)可以包括多個(gè)預(yù)設(shè)查詢和與每個(gè)預(yù)設(shè)查詢一一對(duì)應(yīng)的問(wèn)答集。在本發(fā)明中,每個(gè)問(wèn)答集可以包括標(biāo)準(zhǔn)問(wèn)題、標(biāo)準(zhǔn)答案、擴(kuò)展問(wèn)題及擴(kuò)展答案。其中,擴(kuò)展問(wèn)題和擴(kuò)展答案是在標(biāo)準(zhǔn)問(wèn)題和標(biāo)準(zhǔn)答案的基礎(chǔ)上同義擴(kuò)展而得的信息,目的是將同義的問(wèn)答信息打包在一起,作為一個(gè)問(wèn)答集被整體反饋給用戶,從而使得每個(gè)問(wèn)答集的信息更為全面。
[0029]接下來(lái),在步驟b中,根據(jù)所述問(wèn)答庫(kù)中包括的所述預(yù)設(shè)查詢和所述問(wèn)答集,為每個(gè)預(yù)設(shè)查詢構(gòu)建訓(xùn)練樣本,并對(duì)所述訓(xùn)練樣本進(jìn)行正負(fù)例標(biāo)注。具體地,可通過(guò)以下方式為每個(gè)預(yù)設(shè)查詢構(gòu)建訓(xùn)練樣本,并對(duì)所述訓(xùn)練樣本進(jìn)行正負(fù)例標(biāo)注:針對(duì)每個(gè)預(yù)設(shè)查詢,將該預(yù)設(shè)查詢與和其對(duì)應(yīng)的問(wèn)答集構(gòu)建為針對(duì)該預(yù)設(shè)查詢的訓(xùn)練樣本,并將該訓(xùn)練樣本標(biāo)注為正例;針對(duì)每個(gè)預(yù)設(shè)查詢,從所述問(wèn)答庫(kù)中確定與該預(yù)設(shè)查詢有關(guān)的候選問(wèn)答集,該候選問(wèn)答集包括與該預(yù)設(shè)查詢相對(duì)應(yīng)的問(wèn)答集和若干其他問(wèn)答集,將該預(yù)設(shè)查詢與所述若干其他問(wèn)答集一一構(gòu)建為針對(duì)該預(yù)設(shè)查詢的訓(xùn)練樣本,并將該訓(xùn)練樣本標(biāo)注為負(fù)例。
[0030]例如,假設(shè)構(gòu)建的問(wèn)答庫(kù)中包括100個(gè)預(yù)設(shè)查詢和相對(duì)應(yīng)的100個(gè)問(wèn)答集。那么可以首先針對(duì)第I個(gè)預(yù)設(shè)查詢,將該第I個(gè)預(yù)設(shè)查詢和與其對(duì)應(yīng)的第I個(gè)問(wèn)答集構(gòu)建為一訓(xùn)練樣本,并將該訓(xùn)練樣本標(biāo)注為正例。之后,針對(duì)該第I個(gè)預(yù)設(shè)查詢,從問(wèn)答庫(kù)中篩選出與該第I個(gè)預(yù)設(shè)查詢有關(guān)的候選問(wèn)答集??梢酝ㄟ^(guò)多種方式來(lái)篩選候選問(wèn)答集。在本發(fā)明的一個(gè)示例實(shí)施方式中,可以通過(guò)分詞共現(xiàn)率這一參數(shù)來(lái)篩選候選問(wèn)答集。例如,針對(duì)該第I個(gè)預(yù)設(shè)查詢,可以確定出其與問(wèn)答庫(kù)中的100個(gè)問(wèn)答集之間的分詞共現(xiàn)率。然后,根據(jù)分詞共現(xiàn)率對(duì)這100個(gè)問(wèn)答集進(jìn)行排序,挑選出排名靠前的預(yù)定數(shù)量(例如,20個(gè))的問(wèn)答集,作為與該第I個(gè)預(yù)設(shè)查詢有關(guān)的候選問(wèn)答集。可以權(quán)衡最終構(gòu)建的排序訓(xùn)練數(shù)據(jù)量以及所需模型精度來(lái)設(shè)定所述預(yù)定數(shù)量。所挑選出的與該第I個(gè)預(yù)設(shè)查詢有關(guān)的候選問(wèn)答集中,包括問(wèn)答庫(kù)中原本與該第I個(gè)預(yù)設(shè)查詢對(duì)應(yīng)的第I個(gè)問(wèn)答集,以及若干其他問(wèn)答集。那么,將該第I個(gè)預(yù)設(shè)查詢與這些若干其他問(wèn)答集一一構(gòu)建為針對(duì)該第I個(gè)預(yù)設(shè)查詢的訓(xùn)練樣本,并將該訓(xùn)練樣本標(biāo)注為負(fù)例,即,表明這些問(wèn)答集與第I個(gè)預(yù)設(shè)查詢之間的相關(guān)性小于同該第I個(gè)預(yù)設(shè)查詢對(duì)應(yīng)的第I個(gè)問(wèn)答集。例如,假設(shè)候選問(wèn)答集的數(shù)量為20個(gè),那么針對(duì)第I個(gè)預(yù)設(shè)查詢,總共可以構(gòu)建出I個(gè)標(biāo)注為正例的訓(xùn)練樣本,以及19個(gè)標(biāo)準(zhǔn)為負(fù)例的訓(xùn)練樣本。
[0031]針對(duì)問(wèn)答庫(kù)中的每個(gè)預(yù)設(shè)查詢都進(jìn)行上述過(guò)程,這樣,就可以得出針對(duì)每個(gè)預(yù)設(shè)查詢的訓(xùn)練樣本,并對(duì)每個(gè)訓(xùn)練樣本進(jìn)行正負(fù)例標(biāo)注。
[0032]之后,進(jìn)行步驟C,根據(jù)每個(gè)預(yù)設(shè)查詢的訓(xùn)練樣本、以及每個(gè)預(yù)設(shè)查詢的訓(xùn)練樣本的正負(fù)例標(biāo)注,為每個(gè)預(yù)設(shè)查詢構(gòu)建排序訓(xùn)練數(shù)據(jù)。具體地,可以通過(guò)以下方式為每個(gè)預(yù)設(shè)查詢構(gòu)建排序訓(xùn)練數(shù)據(jù):針對(duì)每個(gè)預(yù)設(shè)查詢,確定針對(duì)該預(yù)設(shè)查詢的訓(xùn)練樣本的特征參數(shù)集,并根據(jù)所確定出的特征參數(shù)集、以及所述訓(xùn)練樣本的正負(fù)例標(biāo)注,構(gòu)建針對(duì)該預(yù)設(shè)查詢的排序訓(xùn)練數(shù)據(jù)。
[0033]在本發(fā)明中,所述特征參數(shù)集可以包括相關(guān)性特征參數(shù)子集和重要性特征參數(shù)子集。其中,相關(guān)性特征參數(shù)子集是由多個(gè)相關(guān)性特征參數(shù)組成的,所述相關(guān)性特征參數(shù)能夠表明在一個(gè)訓(xùn)練樣本中的預(yù)設(shè)查詢與該訓(xùn)練樣本中的問(wèn)答集之間的相關(guān)性。
[0034]例如,所述相關(guān)性特征參數(shù)可以包括以下中的至少一者:“查詢與問(wèn)答集”間的分詞共現(xiàn)數(shù)量;“查詢與問(wèn)答集”間的單字共現(xiàn)數(shù)量;“查詢與問(wèn)答集”間的命名實(shí)體識(shí)別共現(xiàn)數(shù)量;“查詢與問(wèn)答集”間的分詞共現(xiàn)比例;“查詢與問(wèn)答集”間的單字共現(xiàn)比例;逆向詞頻賦權(quán)的“查詢與問(wèn)答集”間的分詞共現(xiàn)數(shù)量;逆向詞頻賦權(quán)的“查詢與問(wèn)答集”間的單字共現(xiàn)數(shù)量;逆向詞頻加權(quán)的“查詢與問(wèn)答集”間的分詞共現(xiàn)比例;逆向詞頻加權(quán)的“查詢與問(wèn)答集”間的單字共現(xiàn)比例;“查詢與問(wèn)答集”間的分詞空間向量模型;“查詢與問(wèn)答集”間的單字空間向量模型;詞頻、逆向詞頻加權(quán)的“查詢與問(wèn)答集”間的分詞空間向量模型;詞頻、逆向詞頻加權(quán)的“查詢與問(wèn)答集”間的單子空間向量模型;在二元獨(dú)立模型(BM)基礎(chǔ)上推導(dǎo)出的BM25模型(分成粒度);LMIR模型(分詞粒度):LMIR模型(單字粒度),等等。以上任一相關(guān)性特征參數(shù)的具體計(jì)算方法均是本領(lǐng)域的技術(shù)人員公知的,因此,本發(fā)明在此不進(jìn)行詳細(xì)描述。
[0035]如上所述,在本發(fā)明中,每個(gè)問(wèn)答集可以包括標(biāo)準(zhǔn)問(wèn)題、標(biāo)準(zhǔn)答案、擴(kuò)展問(wèn)題及擴(kuò)展答案。這樣,每個(gè)問(wèn)答集就可以分成五個(gè)部分:標(biāo)準(zhǔn)問(wèn)題部分、標(biāo)準(zhǔn)答案部分、擴(kuò)展問(wèn)題部分、擴(kuò)展答案部分以及整個(gè)問(wèn)答集部分??梢圆捎貌煌臉?biāo)識(shí)來(lái)區(qū)分一個(gè)問(wèn)答集中的標(biāo)準(zhǔn)問(wèn)題、標(biāo)準(zhǔn)答案、擴(kuò)展問(wèn)題和擴(kuò)展答案。
[0036]在本發(fā)明的一個(gè)優(yōu)選實(shí)施方式中,在確定一個(gè)訓(xùn)練樣本中的預(yù)設(shè)查詢與該訓(xùn)練樣本中的問(wèn)答集之間的相關(guān)性特征參數(shù)的時(shí)候,不僅要確定出預(yù)設(shè)查詢與整個(gè)問(wèn)答集部分之間的預(yù)設(shè)類型的相關(guān)性特征參數(shù),而且還要就同種相關(guān)性特征參數(shù),再分別針對(duì)預(yù)設(shè)查詢與標(biāo)準(zhǔn)問(wèn)題部分、與標(biāo)準(zhǔn)答案部分、與擴(kuò)展問(wèn)題部分、以及與擴(kuò)展答案部分之間進(jìn)行計(jì)算。也就是說(shuō),假設(shè)要確定三種類型的相關(guān)性特征參數(shù)(可以選自以上列出的相關(guān)性特征參數(shù)),記為Cl、c2和c3。那么,需要分別針對(duì)標(biāo)準(zhǔn)問(wèn)題部分、標(biāo)準(zhǔn)答案部分、擴(kuò)展問(wèn)題部分、擴(kuò)展答案部分、以及整個(gè)問(wèn)答集部分這五個(gè)部分,計(jì)算出預(yù)設(shè)查詢與它們的這三種類型的相關(guān)性特征參數(shù)。例如,針對(duì)標(biāo)準(zhǔn)問(wèn)題部分計(jì)算出的相關(guān)性特征參數(shù)記為Cl (Cl, c2, c3),針對(duì)標(biāo)準(zhǔn)答案部分計(jì)算出的相關(guān)性特征參數(shù)記為C2(cl,c2, c3),針對(duì)擴(kuò)展問(wèn)題部分計(jì)算出的相關(guān)性特征參數(shù)記為C3(cl,c2, c3),針對(duì)擴(kuò)展答案部分計(jì)算出的相關(guān)性特征參數(shù)記為C4(cl,c2, c3)以及針對(duì)整個(gè)問(wèn)答集部分計(jì)算出的相關(guān)性特征參數(shù)記為C5(c
當(dāng)前第2頁(yè)1 2 3 4 5 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1