;以及在所述步驟f中,利用針對(duì)與所述用戶(hù)選擇的領(lǐng)域?qū)?yīng)的問(wèn)答庫(kù)的問(wèn)答排序模型對(duì)與所述用戶(hù)查詢(xún)有關(guān)的所述候選問(wèn)答集進(jìn)行排序。
[0055]也就是說(shuō),在線上不僅要接收用戶(hù)查詢(xún),還要接收用戶(hù)的領(lǐng)域選擇信息。根據(jù)用戶(hù)的領(lǐng)域選擇信息,可以確定出用戶(hù)要使用的問(wèn)答庫(kù)和問(wèn)答排序模型。之后,根據(jù)用戶(hù)查詢(xún)?cè)诰€上從確定出的用戶(hù)要使用的問(wèn)答庫(kù)中篩選出與用戶(hù)查詢(xún)有關(guān)的候選問(wèn)答集,并利用確定出的用戶(hù)要使用的問(wèn)答排序模型對(duì)這些候選問(wèn)答集進(jìn)行排序。通過(guò)分領(lǐng)域分別構(gòu)建問(wèn)答庫(kù)和問(wèn)答排序模型,可以實(shí)現(xiàn)根據(jù)領(lǐng)域的問(wèn)答排序模型的定制,從而便于領(lǐng)域迀移。
[0056]圖2示出了根據(jù)本發(fā)明的實(shí)施方式的基于排序?qū)W習(xí)的自動(dòng)問(wèn)答裝置的示意圖。如圖2所示,該裝置可以包括:建庫(kù)端10,該建庫(kù)端10可以包括:問(wèn)答庫(kù)構(gòu)建模塊101,用于構(gòu)建問(wèn)答庫(kù)102,該問(wèn)答庫(kù)102包括多個(gè)預(yù)設(shè)查詢(xún)和與每個(gè)預(yù)設(shè)查詢(xún)一一對(duì)應(yīng)的問(wèn)答集;訓(xùn)練樣本構(gòu)建模塊103,用于根據(jù)所述問(wèn)答庫(kù)102中包括的所述預(yù)設(shè)查詢(xún)和所述問(wèn)答集,為每個(gè)預(yù)設(shè)查詢(xún)構(gòu)建訓(xùn)練樣本,并對(duì)所述訓(xùn)練樣本進(jìn)行正負(fù)例標(biāo)注;排序訓(xùn)練數(shù)據(jù)構(gòu)建模塊104,用于根據(jù)每個(gè)預(yù)設(shè)查詢(xún)的訓(xùn)練樣本、以及每個(gè)預(yù)設(shè)查詢(xún)的訓(xùn)練樣本的正負(fù)例標(biāo)注,為每個(gè)預(yù)設(shè)查詢(xún)構(gòu)建排序訓(xùn)練數(shù)據(jù);問(wèn)答排序模型構(gòu)建模塊105,用于利用所構(gòu)建的所有排序訓(xùn)練數(shù)據(jù)進(jìn)行排序?qū)W習(xí),得出針對(duì)所述問(wèn)答庫(kù)102的問(wèn)答排序模型;檢索端20,該檢索端20可以包括:檢索模塊201,用于接收用戶(hù)查詢(xún),并根據(jù)所述用戶(hù)查詢(xún)從所述問(wèn)答庫(kù)102中篩選與所述用戶(hù)查詢(xún)有關(guān)的候選問(wèn)答集;以及排序模塊202,用于利用所述問(wèn)答排序模型對(duì)所述候選問(wèn)答集進(jìn)行排序。
[0057]在本發(fā)明中,問(wèn)答庫(kù)102和問(wèn)答排序模型的構(gòu)建可在線下完成,而檢索端20可以利用線下構(gòu)建的問(wèn)答庫(kù)102和問(wèn)答排序模型來(lái)為用戶(hù)提供線上自動(dòng)問(wèn)答服務(wù)。
[0058]所述訓(xùn)練樣本構(gòu)建模塊103可以通過(guò)以下方式為每個(gè)預(yù)設(shè)查詢(xún)構(gòu)建訓(xùn)練樣本,并對(duì)所述訓(xùn)練樣本進(jìn)行正負(fù)例標(biāo)注:針對(duì)每個(gè)預(yù)設(shè)查詢(xún),將該預(yù)設(shè)查詢(xún)與和其對(duì)應(yīng)的問(wèn)答集構(gòu)建為針對(duì)該預(yù)設(shè)查詢(xún)的訓(xùn)練樣本,并將該訓(xùn)練樣本標(biāo)注為正例;針對(duì)每個(gè)預(yù)設(shè)查詢(xún),從所述問(wèn)答庫(kù)中確定與該預(yù)設(shè)查詢(xún)有關(guān)的候選問(wèn)答集,該候選問(wèn)答集包括與該預(yù)設(shè)查詢(xún)相對(duì)應(yīng)的問(wèn)答集和若干其他問(wèn)答集,將該預(yù)設(shè)查詢(xún)與所述若干其他問(wèn)答集一一構(gòu)建為針對(duì)該預(yù)設(shè)查詢(xún)的訓(xùn)練樣本,并將該訓(xùn)練樣本標(biāo)注為負(fù)例。
[0059]圖3示出了根據(jù)本發(fā)明的另一實(shí)施方式的基于排序?qū)W習(xí)的自動(dòng)問(wèn)答裝置的示意圖。如圖3所示,該自動(dòng)問(wèn)答裝置還可以包括第一特征計(jì)算模塊30 ;以及所述排序訓(xùn)練數(shù)據(jù)構(gòu)建模塊104可以通過(guò)以下方式為每個(gè)預(yù)設(shè)查詢(xún)構(gòu)建排序訓(xùn)練數(shù)據(jù):針對(duì)每個(gè)預(yù)設(shè)查詢(xún),調(diào)用所述第一特征計(jì)算模塊30確定針對(duì)該預(yù)設(shè)查詢(xún)的訓(xùn)練樣本的特征參數(shù)集,并根據(jù)所確定出的特征參數(shù)集、以及所述訓(xùn)練樣本的正負(fù)例標(biāo)注,構(gòu)建針對(duì)該預(yù)設(shè)查詢(xún)的排序訓(xùn)練數(shù)據(jù)。
[0060]訓(xùn)練樣本的特征參數(shù)集可以包括相關(guān)性特征參數(shù)子集和重要性特征參數(shù)子集,并且所述問(wèn)答庫(kù)中的每個(gè)問(wèn)答集可以包括標(biāo)準(zhǔn)問(wèn)題、標(biāo)準(zhǔn)答案、擴(kuò)展問(wèn)題及擴(kuò)展答案。在這種情況下,所述第一特征計(jì)算模塊30可以通過(guò)以下方式確定所述特征參數(shù)集:針對(duì)每個(gè)訓(xùn)練樣本,分別計(jì)算該訓(xùn)練樣本中的預(yù)設(shè)查詢(xún)與問(wèn)答集、以及與該問(wèn)答集中的所述標(biāo)準(zhǔn)問(wèn)題、所述標(biāo)準(zhǔn)答案、所述擴(kuò)展問(wèn)題、所述擴(kuò)展答案之間的同種相關(guān)性特征參數(shù),并將所計(jì)算出的同種相關(guān)性特征參數(shù)進(jìn)行組合,得出該訓(xùn)練樣本的相關(guān)性特征參數(shù)子集;獲取該訓(xùn)練樣本中的問(wèn)答集的重要性特征參數(shù),并將所獲取的重要性特征參數(shù)進(jìn)行組合,得出該訓(xùn)練樣本的重要性特征參數(shù)子集;以及將所述相關(guān)性特征參數(shù)子集和所述重要性特征子集進(jìn)行組合,得出該訓(xùn)練樣本的所述特征參數(shù)集。
[0061]此外,如圖3所示,該自動(dòng)問(wèn)答裝置還可以包括第二特征計(jì)算模塊40 ;以及所述排序模塊202可以通過(guò)以下方式對(duì)所述候選問(wèn)答集進(jìn)行排序:調(diào)用所述第二特征計(jì)算模塊40確定所述用戶(hù)查詢(xún)與篩選出的每個(gè)候選問(wèn)答集之間的特征參數(shù)集;將所述特征參數(shù)集輸入至所述問(wèn)答排序模型,以利用所述問(wèn)答排序模型對(duì)所述每個(gè)候選問(wèn)答集進(jìn)行排序。
[0062]用戶(hù)查詢(xún)與線上篩選出的每個(gè)候選問(wèn)答集之間的特征參數(shù)集也可以包括相關(guān)性特征參數(shù)子集和重要性特征參數(shù)子集。此外,所述問(wèn)答庫(kù)中的每個(gè)問(wèn)答集可以包括標(biāo)準(zhǔn)問(wèn)題、標(biāo)準(zhǔn)答案、擴(kuò)展問(wèn)題及擴(kuò)展答案。在這種情況下,所述第二特征計(jì)算模塊40可以通過(guò)以下方式確定所述特征參數(shù)集:針對(duì)每個(gè)候選問(wèn)答集,分別計(jì)算所述用戶(hù)查詢(xún)與該候選問(wèn)答集、以及與該候選問(wèn)答集中的所述標(biāo)準(zhǔn)問(wèn)題、所述標(biāo)準(zhǔn)答案、所述擴(kuò)展問(wèn)題、所述擴(kuò)展答案之間的同種相關(guān)性特征參數(shù),并將所計(jì)算出的同種相關(guān)性特征參數(shù)進(jìn)行組合,得出所述用戶(hù)查詢(xún)與該候選問(wèn)答集的相關(guān)性特征參數(shù)子集;獲取該候選問(wèn)答集的重要性特征參數(shù),并將所獲取的重要性特征參數(shù)進(jìn)行組合,得出所述用戶(hù)查詢(xún)與該候選問(wèn)答集的重要性特征參數(shù)子集;以及將所述相關(guān)性特征參數(shù)子集和所述重要性特征子集進(jìn)行組合,得出所述用戶(hù)查詢(xún)與該候選問(wèn)答集的所述特征參數(shù)集。
[0063]在本發(fā)明中,第一特征計(jì)算模塊30為線下特征計(jì)算模塊,第二特征計(jì)算模塊40為線上特征計(jì)算模塊。不過(guò)應(yīng)當(dāng)理解的是,雖然采用了不同的表述,但是二者進(jìn)行特征計(jì)算的方法和原理是相一致的。
[0064]優(yōu)選地,為了實(shí)現(xiàn)針對(duì)領(lǐng)域定制問(wèn)答庫(kù)和問(wèn)答排序模型,如圖4所示,所述自動(dòng)問(wèn)答裝置可以包括多個(gè)建庫(kù)端(例如,建庫(kù)端ΙΟΙ-ΙΟη),每個(gè)建庫(kù)端可以對(duì)應(yīng)一個(gè)領(lǐng)域,為所對(duì)應(yīng)的領(lǐng)域構(gòu)建問(wèn)答庫(kù)(例如,問(wèn)答庫(kù)1021-102n)和針對(duì)該問(wèn)答庫(kù)的問(wèn)答排序模型;以及所述檢索端20中的所述檢索模塊201還用于接收來(lái)自用戶(hù)的領(lǐng)域選擇信息,并根據(jù)該領(lǐng)域選擇信息確定與用戶(hù)選擇的領(lǐng)域?qū)?yīng)的問(wèn)答庫(kù),以及根據(jù)所述用戶(hù)查詢(xún)從與所述用戶(hù)選擇的領(lǐng)域?qū)?yīng)的問(wèn)答庫(kù)中篩選與所述用戶(hù)查詢(xún)有關(guān)的候選問(wèn)答集;以及所述排序模塊202利用針對(duì)與所述用戶(hù)選擇的領(lǐng)域?qū)?yīng)的問(wèn)答庫(kù)的問(wèn)答排序模型對(duì)與所述用戶(hù)查詢(xún)有關(guān)的所述候選問(wèn)答集進(jìn)行排序。
[0065]也就是說(shuō),在本發(fā)明中,一個(gè)檢索端20可以對(duì)應(yīng)多個(gè)建庫(kù)端1l-1On以及多個(gè)問(wèn)答庫(kù)1021-102n。根據(jù)用戶(hù)的領(lǐng)域選擇信息,檢索端20可以確定與哪個(gè)建庫(kù)端和哪個(gè)問(wèn)答庫(kù)建立關(guān)聯(lián),例如,在圖4中,與冋答庫(kù)1021和建庫(kù)端101建立關(guān)聯(lián)。之后,就可以從關(guān)聯(lián)的問(wèn)答庫(kù)1021中篩選與用戶(hù)查詢(xún)有關(guān)的候選問(wèn)答集,以及利用關(guān)聯(lián)的建庫(kù)端101中構(gòu)建的問(wèn)答排序模型來(lái)對(duì)這些候選問(wèn)答集進(jìn)行排序,并最終得出排序結(jié)果。通過(guò)分領(lǐng)域分別構(gòu)建問(wèn)答庫(kù)和問(wèn)答排序模型,可以實(shí)現(xiàn)根據(jù)領(lǐng)域的問(wèn)答排序模型的定制,從而便于領(lǐng)域迀移。
[0066]綜上所述,在本發(fā)明提供的自動(dòng)問(wèn)答方法及裝置中,可以根據(jù)構(gòu)建的問(wèn)答庫(kù)中的預(yù)設(shè)查詢(xún)和問(wèn)答集,構(gòu)建出排序訓(xùn)練數(shù)據(jù),并基于機(jī)器學(xué)習(xí)的方法,利用所構(gòu)建的排序訓(xùn)練數(shù)據(jù)進(jìn)行排序?qū)W習(xí),從而自動(dòng)構(gòu)建出問(wèn)答排序模型。通過(guò)排序?qū)W習(xí)過(guò)程,可以自動(dòng)計(jì)算出各項(xiàng)特征參數(shù)的特征權(quán)值,無(wú)需開(kāi)發(fā)人員進(jìn)行手動(dòng)設(shè)定,從而降低了人工參與成本,并且實(shí)時(shí)性好。即使增加或減少特征參數(shù)、或者因問(wèn)答庫(kù)發(fā)生更新而導(dǎo)致特征參數(shù)的分布發(fā)生變化,都可以通過(guò)上述排序?qū)W習(xí)過(guò)程自動(dòng)擬合出新的特征權(quán)值,從而適應(yīng)這種特征參數(shù)的變化,且保證構(gòu)建出的問(wèn)答排序模型的可靠性和準(zhǔn)確性。
[0067]以上結(jié)合附圖詳細(xì)描述了本發(fā)明的優(yōu)選實(shí)施方式,但是,本發(fā)明并不限于上述實(shí)施方式中的具體細(xì)節(jié),在本發(fā)明的技術(shù)構(gòu)思范圍內(nèi),可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行多種簡(jiǎn)單變型,這些簡(jiǎn)單變型均屬于本發(fā)明的保護(hù)范圍。
[0068]另外需要說(shuō)明的是,在上述【具體實(shí)施方式】中所描述的各個(gè)具體技術(shù)特征,在不矛盾的情況下,可以通過(guò)任何合適的方式進(jìn)行組合。為了避免不必要的重復(fù),本發(fā)明對(duì)各種可能的組合方式不再另行說(shuō)明。
[0069] 此外,本發(fā)明的各種不同的實(shí)施方式之間也可以進(jìn)行任意組合,只要其不違背本發(fā)明的思想,其同樣應(yīng)當(dāng)視為本發(fā)明所公開(kāi)的內(nèi)容。
【主權(quán)項(xiàng)】
1.一種基于排序?qū)W習(xí)的自動(dòng)問(wèn)答方法,其特征在于,該方法包括: 步驟a:構(gòu)建問(wèn)答庫(kù),該問(wèn)答庫(kù)包括多個(gè)預(yù)設(shè)查詢(xún)和與每個(gè)預(yù)設(shè)查詢(xún)一一對(duì)應(yīng)的問(wèn)答集; 步驟b:根據(jù)所述問(wèn)答庫(kù)中包括的所述預(yù)設(shè)查詢(xún)和所述問(wèn)答集,為每個(gè)預(yù)設(shè)查詢(xún)構(gòu)建訓(xùn)練樣本,并對(duì)所述訓(xùn)練樣本進(jìn)行正負(fù)例標(biāo)注; 步驟c:根據(jù)每個(gè)預(yù)設(shè)查詢(xún)的訓(xùn)練樣本、以及每個(gè)預(yù)設(shè)查詢(xún)的訓(xùn)練樣本的正負(fù)例標(biāo)注,為每個(gè)預(yù)設(shè)查詢(xún)構(gòu)建排序訓(xùn)練數(shù)據(jù); 步驟d:利用所構(gòu)建的所有排序訓(xùn)練數(shù)據(jù)進(jìn)行排序?qū)W習(xí),得出針對(duì)所述問(wèn)答庫(kù)的問(wèn)答排序模型; 步驟e:接收用戶(hù)查詢(xún),并根據(jù)所述用戶(hù)查詢(xún)從所述問(wèn)答庫(kù)中篩選與所述用戶(hù)查詢(xún)有關(guān)的候選問(wèn)答集;以及 步驟f:利用所述問(wèn)答排序模型對(duì)所述候選問(wèn)答集進(jìn)行排序。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述步驟b中,通過(guò)以下方式為每個(gè)預(yù)設(shè)查詢(xún)構(gòu)建訓(xùn)練樣本,并對(duì)所述訓(xùn)練樣本進(jìn)行正負(fù)例標(biāo)注: 針對(duì)每個(gè)預(yù)設(shè)查詢(xún),將該預(yù)設(shè)查詢(xún)與和其對(duì)應(yīng)的問(wèn)答集構(gòu)建為