本發(fā)明涉及計算機(jī)處理的
技術(shù)領(lǐng)域:
,特別是涉及一種問答對分類模型的訓(xùn)練方法和一種問答對分類模型的訓(xùn)練裝置。
背景技術(shù):
:目前,網(wǎng)絡(luò)上具有許多互動式的問答平臺,用戶在問答平臺上提出自己的問題,問答平臺發(fā)動其他用戶來回答,解決提問者的疑問。問答平臺積累了大量的用戶,產(chǎn)生海量的問答對數(shù)據(jù)(即問題與答案),其中,問答對數(shù)據(jù)的質(zhì)量有高有低,一個低質(zhì)量的問答對數(shù)據(jù)的價值較低,影響用戶體驗(yàn),而高質(zhì)量的問答對數(shù)據(jù),是問答平臺的重要數(shù)據(jù)資源。為挖掘出高質(zhì)量的問答對數(shù)據(jù),傳統(tǒng)的方法是基于人工策略計算質(zhì)量分,通過提問者或其他用戶對答案的反饋信息設(shè)計一個策略,來判定問答對數(shù)據(jù)的質(zhì)量。例如,在問答平臺上設(shè)置互動按鈕,贊標(biāo)簽和踩標(biāo)簽,供其他用戶交互,當(dāng)提問者把答案設(shè)置為“最佳答案”,或者,贊標(biāo)簽被點(diǎn)擊的數(shù)量超過踩標(biāo)簽被點(diǎn)擊的數(shù)量時,可以判定這個答案是一個質(zhì)量較好的答案。但是,人工策略利用的特征信息少,用戶主動反饋率低,依賴提問者的主觀判斷,廣告作弊現(xiàn)象嚴(yán)重,用戶對新的問答對數(shù)據(jù)和歷史的問答對數(shù)據(jù)的反饋信息不平衡導(dǎo)致策略不穩(wěn)定,導(dǎo)致問答對數(shù)據(jù)的準(zhǔn)確率較低。尤其是,新產(chǎn)生的問答對數(shù)據(jù),因?yàn)槿鄙儆脩舴答?,問答對?shù)據(jù)的準(zhǔn)確率更低。技術(shù)實(shí)現(xiàn)要素:鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種問答對分類模型的訓(xùn)練方法和相應(yīng)的一種問答對分類模型的訓(xùn)練裝置。依據(jù)本發(fā)明的一個方面,提供了一種問答對分類模型的訓(xùn)練方法,包括:獲取問答對數(shù)據(jù);從所述問答對數(shù)據(jù)中提取問答對特征;根據(jù)所述問答對數(shù)據(jù)的質(zhì)量對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽;采用所述問答對特征與所述分類標(biāo)簽訓(xùn)練問答對分類模型。可選地,所述問答對特征包括如下的一種或多種:提問者特征、回答者特征、問答對文本語義特征、問答對數(shù)字特征、用戶反饋特征??蛇x地,所述問答對數(shù)據(jù)包括問題與答案,所述問答對文本語義特征包括問答對配對特征;所述從所述問答對數(shù)據(jù)中提取問答對特征的步驟包括:查找所述問題中的詞項(xiàng)與所述答案中的詞項(xiàng)共現(xiàn)的詞對;統(tǒng)計所述共現(xiàn)的詞對的數(shù)量,作為問答對配對特征??蛇x地,所述問答對數(shù)據(jù)包括問題與答案,所述問答對文本語義特征包括問答對最小路由距離;所述從所述問答對數(shù)據(jù)中提取問答對特征的步驟包括:從所述問題中提取關(guān)鍵詞,生成問題關(guān)鍵詞集合;從所述答案中提取關(guān)鍵詞,生成答案關(guān)鍵詞集合;計算所述問題關(guān)鍵詞集合和所述答案關(guān)鍵詞集合之間相似度;將所述相似度進(jìn)行累積,獲得問答對最小路由距離??蛇x地,所述問答對數(shù)據(jù)包括問題與答案,所述問答對文本語義特征包括問答對句子相似度;所述從所述問答對數(shù)據(jù)中提取問答對特征的步驟包括:將所述問題轉(zhuǎn)換為第一句子向量;將所述答案轉(zhuǎn)換為第二句子向量;計算所述第一句子向量與所述第二句子向量之間的相似度,作為問答對句子相似度。可選地,所述根據(jù)所述問答對數(shù)據(jù)的質(zhì)量對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽的步驟包括:查找搜索所述問答對數(shù)據(jù)時記錄的搜索記錄數(shù)據(jù);根據(jù)所述搜索記錄數(shù)據(jù)對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽??蛇x地,所述根據(jù)所述搜索記錄數(shù)據(jù)對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽的步驟包括:挖掘所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的平均點(diǎn)擊權(quán)重;挖掘所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的最后一次點(diǎn)擊權(quán)重;采用所述平均點(diǎn)擊權(quán)重和所述最后一次點(diǎn)擊權(quán)重擬合連續(xù)分值;將所述連續(xù)分值離散化為分類標(biāo)簽。可選地,所述挖掘所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的平均點(diǎn)擊權(quán)重的步驟包括:記錄所述問答對數(shù)據(jù)所屬網(wǎng)頁的地址;計算所述地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值;采用所述點(diǎn)擊分值計算所述地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值分布信息;采用所述點(diǎn)擊分值分布信息計算所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的平均點(diǎn)擊權(quán)重??蛇x地,所述計算所述地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值的步驟包括:統(tǒng)計所述地址在指定的關(guān)鍵詞下的點(diǎn)擊次數(shù);統(tǒng)計指定的關(guān)鍵詞的搜索次數(shù);采用所述點(diǎn)擊次數(shù)與所述搜索次數(shù)計算所述地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值??蛇x地,所述挖掘所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的最后一次點(diǎn)擊權(quán)重的步驟包括:記錄所述問答對數(shù)據(jù)所屬網(wǎng)頁的地址;計算所述地址在指定的搜索關(guān)鍵詞下最后一次點(diǎn)擊分值;采用所述最后一次點(diǎn)擊分值計算所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的最后一次點(diǎn)擊權(quán)重;可選地,所述計算所述地址在指定的搜索關(guān)鍵詞下最后一次點(diǎn)擊分值的步驟包括:統(tǒng)計所述地址在指定的關(guān)鍵詞下最后一次的點(diǎn)擊次數(shù);統(tǒng)計指定的關(guān)鍵詞的搜索次數(shù);采用所述最后一次的點(diǎn)擊次數(shù)與所述搜索次數(shù)計算所述地址在指定的搜索關(guān)鍵詞下最后一次點(diǎn)擊分值??蛇x地,在所述根據(jù)所述問答對數(shù)據(jù)的質(zhì)量對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽的步驟之后,所述方法還包括:對所述問答對特征進(jìn)行歸一化處理。可選地,所述對所述問答對特征進(jìn)行歸一化處理的步驟包括:統(tǒng)計每一維問答對特征的平均值和標(biāo)準(zhǔn)差;將每一維問答對特征減去所述平均值、除以所述標(biāo)準(zhǔn)差??蛇x地,在所述根據(jù)所述問答對數(shù)據(jù)的質(zhì)量對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽的步驟之后,所述方法還包括:根據(jù)鄰近的問答對數(shù)據(jù)對當(dāng)前的問答對數(shù)據(jù)的分類標(biāo)簽進(jìn)行調(diào)整??蛇x地,所述根據(jù)鄰近的問答對數(shù)據(jù)對當(dāng)前的問答對數(shù)據(jù)的分類標(biāo)簽進(jìn)行調(diào)整的步驟包括:將所述問答對數(shù)據(jù)進(jìn)行聚類;對于每一個問答對數(shù)據(jù),選擇聚類后的N個近鄰的問答對數(shù)據(jù);計算當(dāng)前的問答對數(shù)據(jù)與所述近鄰的問答對數(shù)據(jù)之間的距離;基于所述距離重新擬合分類標(biāo)簽??蛇x地,還包括:識別所述問答對特征對于所述問答對分類模型的重要程度;對重要程度最高的M個問答對特征進(jìn)行擴(kuò)展,獲得擴(kuò)展后的問答對特征,返回執(zhí)行所述根據(jù)所述問答對數(shù)據(jù)的質(zhì)量對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽的步驟。根據(jù)本發(fā)明的另一方面,提供了一種問答對分類模型的訓(xùn)練裝置,包括:問答對數(shù)據(jù)獲取模塊,適于獲取問答對數(shù)據(jù);問答對特征提取模塊,適于從所述問答對數(shù)據(jù)中提取問答對特征;分類標(biāo)簽標(biāo)注模塊,適于根據(jù)所述問答對數(shù)據(jù)的質(zhì)量對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽;模型訓(xùn)練模塊,適于采用所述問答對特征與所述分類標(biāo)簽訓(xùn)練問答對分類模型??蛇x地,所述問答對特征包括如下的一種或多種:提問者特征、回答者特征、問答對文本語義特征、問答對數(shù)字特征、用戶反饋特征??蛇x地,所述問答對數(shù)據(jù)包括問題與答案,所述問答對文本語義特征包括問答對配對特征;所述問答對特征提取模塊還適于:查找所述問題中的詞項(xiàng)與所述答案中的詞項(xiàng)共現(xiàn)的詞對;統(tǒng)計所述共現(xiàn)的詞對的數(shù)量,作為問答對配對特征??蛇x地,所述問答對數(shù)據(jù)包括問題與答案,所述問答對文本語義特征包括問答對最小路由距離;所述問答對特征提取模塊還適于:從所述問題中提取關(guān)鍵詞,生成問題關(guān)鍵詞集合;從所述答案中提取關(guān)鍵詞,生成答案關(guān)鍵詞集合;計算所述問題關(guān)鍵詞集合和所述答案關(guān)鍵詞集合之間相似度;將所述相似度進(jìn)行累積,獲得問答對最小路由距離??蛇x地,所述問答對數(shù)據(jù)包括問題與答案,所述問答對文本語義特征包括問答對句子相似度;所述問答對特征提取模塊還適于:將所述問題轉(zhuǎn)換為第一句子向量;將所述答案轉(zhuǎn)換為第二句子向量;計算所述第一句子向量與所述第二句子向量之間的相似度,作為問答對句子相似度??蛇x地,所述分類標(biāo)簽標(biāo)注模塊還適于:查找搜索所述問答對數(shù)據(jù)時記錄的搜索記錄數(shù)據(jù);根據(jù)所述搜索記錄數(shù)據(jù)對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽??蛇x地,所述分類標(biāo)簽標(biāo)注模塊還適于:挖掘所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的平均點(diǎn)擊權(quán)重;挖掘所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的最后一次點(diǎn)擊權(quán)重;采用所述平均點(diǎn)擊權(quán)重和所述最后一次點(diǎn)擊權(quán)重擬合連續(xù)分值;將所述連續(xù)分值離散化為分類標(biāo)簽??蛇x地,所述分類標(biāo)簽標(biāo)注模塊還適于:記錄所述問答對數(shù)據(jù)所屬網(wǎng)頁的地址;計算所述地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值;采用所述點(diǎn)擊分值計算所述地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值分布信息;采用所述點(diǎn)擊分值分布信息計算所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的平均點(diǎn)擊權(quán)重??蛇x地,所述分類標(biāo)簽標(biāo)注模塊還適于:統(tǒng)計所述地址在指定的關(guān)鍵詞下的點(diǎn)擊次數(shù);統(tǒng)計指定的關(guān)鍵詞的搜索次數(shù);采用所述點(diǎn)擊次數(shù)與所述搜索次數(shù)計算所述地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值??蛇x地,所述分類標(biāo)簽標(biāo)注模塊還適于:記錄所述問答對數(shù)據(jù)所屬網(wǎng)頁的地址;計算所述地址在指定的搜索關(guān)鍵詞下最后一次點(diǎn)擊分值;采用所述最后一次點(diǎn)擊分值計算所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的最后一次點(diǎn)擊權(quán)重;可選地,所述分類標(biāo)簽標(biāo)注模塊還適于:統(tǒng)計所述地址在指定的關(guān)鍵詞下最后一次的點(diǎn)擊次數(shù);統(tǒng)計指定的關(guān)鍵詞的搜索次數(shù);采用所述最后一次的點(diǎn)擊次數(shù)與所述搜索次數(shù)計算所述地址在指定的搜索關(guān)鍵詞下最后一次點(diǎn)擊分值??蛇x地,還包括:歸一化模塊,適于對所述問答對特征進(jìn)行歸一化處理。可選地,所述歸一化模塊還適于:統(tǒng)計每一維問答對特征的平均值和標(biāo)準(zhǔn)差;將每一維問答對特征減去所述平均值、除以所述標(biāo)準(zhǔn)差。可選地,還包括:分類標(biāo)簽調(diào)整模塊,適于根據(jù)鄰近的問答對數(shù)據(jù)對當(dāng)前的問答對數(shù)據(jù)的分類標(biāo)簽進(jìn)行調(diào)整。可選地,所述分類標(biāo)簽調(diào)整模塊還適于:將所述問答對數(shù)據(jù)進(jìn)行聚類;對于每一個問答對數(shù)據(jù),選擇聚類后的N個近鄰的問答對數(shù)據(jù);計算當(dāng)前的問答對數(shù)據(jù)與所述近鄰的問答對數(shù)據(jù)之間的距離;基于所述距離重新擬合分類標(biāo)簽??蛇x地,還包括:重要程度識別模塊,適于識別所述問答對特征對于所述問答對分類模型的重要程度;問答對特征擴(kuò)展模塊,適于對重要程度最高的M個問答對特征進(jìn)行擴(kuò)展,獲得擴(kuò)展后的問答對特征,返回調(diào)用所述模型訓(xùn)練模塊。本發(fā)明實(shí)施例提出了基于機(jī)器學(xué)習(xí)的質(zhì)量分計算方法,綜合利用問答對數(shù)據(jù)的各種維度的問答對特征,使用問答對數(shù)據(jù)的質(zhì)量自動標(biāo)注大量訓(xùn)練集,訓(xùn)練問答對分類模型進(jìn)行分類,即預(yù)測質(zhì)量分,避免人工策略,從而避免了人工策略利用的特征信息少,用戶主動反饋率低,依賴提問者的主觀判斷,廣告作弊現(xiàn)象嚴(yán)重,用戶對新的問答對數(shù)據(jù)和歷史的問答對數(shù)據(jù)的反饋信息不平衡導(dǎo)致策略不穩(wěn)定等問題,在歷史的問答對數(shù)據(jù)和新產(chǎn)生的問答對數(shù)據(jù)上,都取得較好的預(yù)測準(zhǔn)確率。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。附圖說明通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:圖1示出了根據(jù)本發(fā)明一個實(shí)施例的一種問答對分類模型的訓(xùn)練方法的步驟流程圖;圖2示出了根據(jù)本發(fā)明一個實(shí)施例的另一種問答對分類模型的訓(xùn)練方法的步驟流程圖;圖3示出了根據(jù)本發(fā)明一個實(shí)施例的一種問答對分類模型的訓(xùn)練裝置的結(jié)構(gòu)框圖;以及圖4示出了根據(jù)本發(fā)明一個實(shí)施例的另一種問答對分類模型的訓(xùn)練裝置的結(jié)構(gòu)框圖。具體實(shí)施方式下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。參照圖1,示出了根據(jù)本發(fā)明一個實(shí)施例的一種問答對分類模型的訓(xùn)練方法的步驟流程圖,具體可以包括如下步驟:步驟101,獲取問答對數(shù)據(jù)。問答對數(shù)據(jù)(Questin&Answer,Q&A),包括問題與答案。例如,問題“珠穆朗瑪峰有多高?”與答案“8844米”組成一個問答對數(shù)據(jù)。由于問答對數(shù)據(jù)具有一個或多個答案,因此,一個問題與一個或多個答案可以組成一個或多個問答對數(shù)據(jù)。步驟102,從所述問答對數(shù)據(jù)中提取問答對特征。在本發(fā)明實(shí)施例中,通過特征工程,從問答對數(shù)據(jù)中提取問答對特征,即體現(xiàn)問答對數(shù)據(jù)特征的信息。在具體實(shí)現(xiàn)中,問答對特征包括如下的一種或多種:1、提問者特征提問者特征為提出問題的用戶(即提問者)的特征,例如:Answer_count_questioner提問者所回答答案數(shù)量Question_posted_count提問者所提問題數(shù)量bestA_count_questioner提問者所回答的最佳答案數(shù)量bestA_ratio_questioner提問者所回答的最佳答案占比2、回答者特征回答者特征為回答問題的用戶(即回答者)的特征,例如:bestA_ratio_answerer回答者在一個季度內(nèi)的最佳答案占比A_count_answerer回答者在一個季度內(nèi)的答案數(shù)量bestA_ratio_answerer回答者在一個季度內(nèi)的最佳答案數(shù)量Q_count_answerer回答者在一個季度內(nèi)所提問題數(shù)量Status_answerer回答者在問答網(wǎng)站上的身份Accept_percent_answerer回答者的答案在問答網(wǎng)站上的被采納率3、問答對文本語義特征問答對文本語義特征為問答對數(shù)據(jù)的語義的特征。在本發(fā)明實(shí)施例的一個示例中,問答對文本語義特征包括問答對配對特征(topic_focus_count_qa),則在此示例中,步驟102可以包括如下子步驟:子步驟1021,查找所述問題中的詞項(xiàng)與所述答案中的詞項(xiàng)共現(xiàn)的詞對;子步驟1022,統(tǒng)計所述共現(xiàn)的詞對的數(shù)量,作為問答對配對特征。問答對配對特征是一個數(shù)字特征,是指問題和答案共現(xiàn)的詞對的數(shù)量。在挖掘時生成一個配對詞典,在大量的問答對數(shù)據(jù)中,統(tǒng)計問題中的實(shí)體詞項(xiàng)和焦點(diǎn)詞項(xiàng)等詞項(xiàng),與答案中詞項(xiàng)共現(xiàn)的詞對。例如,問題“珠穆朗瑪峰有多高”中,“珠穆朗瑪峰”是問題主體(即實(shí)體詞項(xiàng))、“有多高”是問題焦點(diǎn)(即焦點(diǎn)詞項(xiàng)),與答案中的“8848”、“8848米”是高頻的共現(xiàn)的詞對。由于問題有很多種不同的問法,因此,這個特征為共現(xiàn)詞對的數(shù)量,例如:問題中詞項(xiàng)答案中詞項(xiàng)統(tǒng)計指標(biāo)珠穆朗瑪峰88482.7592.9515.71021134661230珠穆朗瑪峰884410.25510.75221.00740834661419珠穆朗瑪峰8848米0.4770.5341.011783466231珠穆朗瑪峰8844米0.2820.3160.598733466134是多少8848米0.0000.0000.000145878231是多少88480.0000.0000.0002458781230是多少008848米0.0000.0000.0002458783在本發(fā)明實(shí)施例的另一個示例中,問答對文本語義特征包括問答對最小路由距離(Word_mover_distance),則在此示例中,步驟102可以包括如下子步驟:子步驟1023,從所述問題中提取關(guān)鍵詞,生成問題關(guān)鍵詞集合;子步驟1024,從所述答案中提取關(guān)鍵詞,生成答案關(guān)鍵詞集合;子步驟1025,計算所述問題關(guān)鍵詞集合和所述答案關(guān)鍵詞集合之間相似度;子步驟1026,將所述相似度進(jìn)行累積,獲得問答對最小路由距離。在本示例中,問答對最小路由距離可以為問題關(guān)鍵詞集合和答案關(guān)鍵詞集合之間的笛卡爾積的累加和。先計算問題關(guān)鍵詞集合和答案關(guān)鍵詞集合中兩兩詞項(xiàng)的相似度(如余弦相似度),再累加成一個數(shù)值。例如,在問題關(guān)鍵詞集合選擇前5個詞項(xiàng),答案關(guān)鍵詞集合選擇前15個,計算75對詞項(xiàng)的余弦相似度,累加到一起即獲得該問答對最小路由距離。在本發(fā)明實(shí)施例的另一個示例中,問答對文本語義特征包括問答對句子相似度(Cosine_sim_qa),則在此示例中,步驟102可以包括如下子步驟:子步驟1027,將所述問題轉(zhuǎn)換為第一句子向量;子步驟1028,將所述答案轉(zhuǎn)換為第二句子向量;子步驟1029,計算所述第一句子向量與所述第二句子向量之間的相似度,作為問答對句子相似度。在本示例中,問題作為句子向量,答案作為句子向量,即可計算兩個句子向量之間的相似度(如余弦相似度)。3、問答對數(shù)字特征問答對數(shù)字特征為問題與答案的數(shù)字化的信息的特征,例如:4、用戶反饋特征。用戶反饋特征為其他用戶(非提問者、回答者)對問答對數(shù)據(jù)的反饋信息的特征。當(dāng)然,上述判斷處理方法只是作為示例,在實(shí)施本發(fā)明實(shí)施例時,可以根據(jù)實(shí)際情況設(shè)置其他問答對特征,本發(fā)明實(shí)施例對此不加以限制。另外,除了上述問答對特征外,本領(lǐng)域技術(shù)人員還可以根據(jù)實(shí)際需要采用其它問答對特征,本發(fā)明實(shí)施例對此也不加以限制。步驟103,根據(jù)所述問答對數(shù)據(jù)的質(zhì)量對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽。本發(fā)明實(shí)施例中,可以將問答對數(shù)據(jù)的質(zhì)量劃分為多個檔次,分別對應(yīng)多個分類標(biāo)簽,將質(zhì)量作為一個多分類的問題。例如,把質(zhì)量分設(shè)定為三個檔次:好、一般、差,分別對應(yīng)三個分類標(biāo)簽:4、2、0。在本發(fā)明的一個實(shí)施例中,步驟103可以包括如下子步驟:子步驟1031,查找搜索所述問答對數(shù)據(jù)時記錄的搜索記錄數(shù)據(jù);子步驟1032,根據(jù)所述搜索記錄數(shù)據(jù)對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽。在本發(fā)明實(shí)施例中,由于用戶在搜索引擎進(jìn)行搜索時,經(jīng)常搜索到問答網(wǎng)站的問答對數(shù)據(jù)作為搜索結(jié)果,記錄用戶對該問答對數(shù)據(jù)的操作,可以形成搜索記錄數(shù)據(jù),存儲在搜索引擎的日志sessionlog中。由于用戶的行為可以在一定程度上體現(xiàn)該問答對數(shù)據(jù)的質(zhì)量,因此,可以通過搜索記錄數(shù)據(jù)對問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽。在本發(fā)明的一個實(shí)施例中,子步驟1032進(jìn)一步可以包括如下子步驟:子步驟10321,挖掘所述問答對數(shù)據(jù)在搜索關(guān)鍵詞(query)下的平均點(diǎn)擊權(quán)重(avg_click_docwei)。在本發(fā)明實(shí)施例的一個示例中,子步驟10321進(jìn)一步可以包括如下子步驟:子步驟103211,記錄問答對數(shù)據(jù)(pair)所屬網(wǎng)頁的地址,如URL(UniformResourceLocator,統(tǒng)一資源定位符)。需要說明的是,一個問答對數(shù)據(jù)是一個文檔,即一個URL。子步驟103212,計算地址在指定的搜索關(guān)鍵詞(query)下的點(diǎn)擊分值(score)。在一種計算方式中,可以統(tǒng)計地址(URL)在指定的關(guān)鍵詞(query)下的點(diǎn)擊次數(shù)(click,即query_url_pair的計數(shù))統(tǒng)計指定的關(guān)鍵詞(query)的搜索次數(shù)(search_count)。采用點(diǎn)擊次數(shù)與搜索次數(shù)計算地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值,例如,點(diǎn)擊次數(shù)與點(diǎn)擊次數(shù)之間的乘積,該乘積與搜索次數(shù)的比值,作為點(diǎn)擊分值,即score=click*click/search_count。子步驟103213,采用點(diǎn)擊分值(score)計算地址(URL)在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值分布信息(dwei)。例如,dwei=score/norm*100,其中,norm是歸一化因子子步驟103214,采用所述點(diǎn)擊分值分布信息計算所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的平均點(diǎn)擊權(quán)重(avg_click_docwei)。例如,其中,n是點(diǎn)擊該地址(URL)的關(guān)鍵詞(query)數(shù)量。子步驟10322,挖掘所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的最后一次點(diǎn)擊權(quán)重(last_click_docwei)。在本發(fā)明實(shí)施例的一個示例中,子步驟10322進(jìn)一步可以包括如下子步驟:子步驟103221,記錄所述問答對數(shù)據(jù)(pair)所屬網(wǎng)頁的地址(URL)。子步驟103222,計算所述地址在指定的搜索關(guān)鍵詞下最后一次點(diǎn)擊分值(last_click_score)。在一種計算方式中,可以統(tǒng)計地址(URL)在指定的關(guān)鍵詞(query)下最后一次的點(diǎn)擊次數(shù)(last_click)。統(tǒng)計指定的關(guān)鍵詞(query)的搜索次數(shù)(search_count)。采用最后一次的點(diǎn)擊次數(shù)(last_click)與搜索次數(shù)(search_count)計算地址在指定的搜索關(guān)鍵詞(query)下最后一次點(diǎn)擊分值(last_click_score)。例如,最后一次的點(diǎn)擊次數(shù)與最后一次的點(diǎn)擊次數(shù)之間的乘積,該乘積與搜索次數(shù)的比值,作為點(diǎn)擊分值,即last_click_score=last_click*last_click/search_count。子步驟103223,采用所述最后一次點(diǎn)擊分值(last_click_score)計算所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的最后一次點(diǎn)擊權(quán)重(last_click_docwei)。例如,對最后一次點(diǎn)擊分值配置預(yù)設(shè)的權(quán)重,即可獲得最后一次點(diǎn)擊權(quán)重,如last_click_docwei=0.60*last_click_score。子步驟10323,采用所述平均點(diǎn)擊權(quán)重和所述最后一次點(diǎn)擊權(quán)重擬合連續(xù)分值(QA_score)。在具體實(shí)現(xiàn)中,將平均點(diǎn)擊權(quán)重和最后一次點(diǎn)擊權(quán)重相加即可獲得連續(xù)分值,即QA_score=avg_click_docwei+last_click_docwei。子步驟10324,將所述連續(xù)分值離散化為分類標(biāo)簽(label)。將連續(xù)分值(QA_score)離散化指之后的值,即可作為分類標(biāo)簽(label)。例如,將連續(xù)分值(QA_score)離散化成4、2或0,表示問答對數(shù)據(jù)的質(zhì)量為好、一般或差。步驟104,采用所述問答對特征與所述分類標(biāo)簽訓(xùn)練問答對分類模型。由于隨機(jī)森林(RandomForest,RF)是一類集成學(xué)習(xí)算法,對缺失數(shù)據(jù)和非平衡的數(shù)據(jù)比較穩(wěn)健,因此,在本發(fā)明實(shí)施例中,可以選擇隨機(jī)森林模型對問答對特征與分類標(biāo)簽訓(xùn)練問答對分類模型,該問答對分類模型可以用于對問答對數(shù)據(jù)進(jìn)行分類(即劃分質(zhì)量檔次),在新的問答對數(shù)據(jù)和歷史的問答對數(shù)據(jù)中都可以取得較好的效果。當(dāng)然,除了隨機(jī)森林之外,還可以采用其他方式訓(xùn)練問答對分類模型,例如,SVM(SupportVectorMachine,支持向量機(jī))、CNN(ConvolutionalNeuralNetwork,卷積神經(jīng)網(wǎng)絡(luò)),等等,本發(fā)明實(shí)施例對此不加以限制。本發(fā)明實(shí)施例提出了基于機(jī)器學(xué)習(xí)的質(zhì)量分計算方法,綜合利用問答對數(shù)據(jù)的各種維度的問答對特征,使用問答對數(shù)據(jù)的質(zhì)量自動標(biāo)注大量訓(xùn)練集,訓(xùn)練問答對分類模型進(jìn)行分類,即預(yù)測質(zhì)量分,避免人工策略,從而避免了人工策略利用的特征信息少,用戶主動反饋率低,依賴提問者的主觀判斷,廣告作弊現(xiàn)象嚴(yán)重,用戶對新的問答對數(shù)據(jù)和歷史的問答對數(shù)據(jù)的反饋信息不平衡導(dǎo)致策略不穩(wěn)定等問題,在歷史的問答對數(shù)據(jù)和新產(chǎn)生的問答對數(shù)據(jù)上,都取得較好的預(yù)測準(zhǔn)確率。參照圖2,示出了根據(jù)本發(fā)明一個實(shí)施例的另一種問答對分類模型的訓(xùn)練方法的步驟流程圖,具體可以包括如下步驟:步驟201,獲取問答對數(shù)據(jù)。步驟202,從所述問答對數(shù)據(jù)中提取問答對特征。步驟203,根據(jù)所述問答對數(shù)據(jù)的質(zhì)量對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽。步驟204,對所述問答對特征進(jìn)行歸一化處理。在本發(fā)明實(shí)施例中,對問答對數(shù)據(jù)的多維(如24維)特征進(jìn)行規(guī)范化,對每一維特征做歸一化。在具體實(shí)現(xiàn)中,統(tǒng)計每一維問答對特征的平均值和標(biāo)準(zhǔn)差,將每一維問答對特征減去平均值、除以標(biāo)準(zhǔn)差,保存平均值和標(biāo)準(zhǔn)差用于模型預(yù)測時使用。本發(fā)明實(shí)施例中的歸一化可以使隨機(jī)噪音信息正負(fù)相抵,強(qiáng)化有效特征的作用,有效訓(xùn)練隨機(jī)森林等模型,得到更好的泛化能力。步驟205,根據(jù)鄰近的問答對數(shù)據(jù)對當(dāng)前的問答對數(shù)據(jù)的分類標(biāo)簽進(jìn)行調(diào)整。由于用戶的點(diǎn)擊行為中可能存在噪音,擬合到的分類標(biāo)簽(label)也可能存在噪音,因此,在本發(fā)明實(shí)施例中,可以微調(diào)分類標(biāo)簽(label)的分布。在具體實(shí)現(xiàn)中,具有相似問答對特征的問答對數(shù)據(jù),其續(xù)分值(QA_score)也接近,離散化時可能因閾值選擇不當(dāng)導(dǎo)致標(biāo)簽不一樣,因此,可以通過近鄰的問答對數(shù)據(jù)對當(dāng)前的問答對數(shù)據(jù)的分類標(biāo)簽進(jìn)行調(diào)整。在本發(fā)明的一個實(shí)施例中,步驟205可以包括如下子步驟:子步驟2051,將所述問答對數(shù)據(jù)進(jìn)行聚類;子步驟2052,對于每一個問答對數(shù)據(jù),選擇聚類后的N個近鄰的問答對數(shù)據(jù);子步驟2053,計算當(dāng)前的問答對數(shù)據(jù)與所述近鄰的問答對數(shù)據(jù)之間的距離;子步驟2054,基于所述距離重新擬合分類標(biāo)簽。在本發(fā)明實(shí)施例中,可以利用KNN(k-NearestNeighboralgorithm,K最鄰近結(jié)點(diǎn)算法)等算法,將問答對數(shù)據(jù)進(jìn)行聚類。對每一個問答對數(shù)據(jù),選擇N(N為正整數(shù),如100)個近鄰的問答對數(shù)據(jù),計算問答對數(shù)據(jù)與近鄰的問答對數(shù)據(jù)的距離(如歐氏距離)。使用基于歐氏距離的高斯核加權(quán)等算法,重新擬合分類標(biāo)簽(label)的值,再離散化成分類標(biāo)簽,有效降低了分類標(biāo)簽(label)中的噪音信息。步驟206,采用所述問答對特征與所述分類標(biāo)簽訓(xùn)練問答對分類模型。在一個示例中,可以收集約5千萬個問答對數(shù)據(jù),從中隨機(jī)選擇50萬個問答對數(shù)據(jù),用于訓(xùn)練隨機(jī)森林模型。在隨機(jī)森林模型中,使用200棵樹,樹的深度50,模型的oobrmse(out-of-bagestimate,衡量RF模型的預(yù)測誤差的方法)約0.652314,在新的問答對數(shù)據(jù)和舊的問答對數(shù)據(jù)上的預(yù)測平均準(zhǔn)確率可達(dá)81%。步驟207,識別所述問答對特征對于所述問答對分類模型的重要程度。步驟208,對重要程度最高的M個問答對特征進(jìn)行擴(kuò)展,獲得擴(kuò)展后的問答對特征,返回執(zhí)行步驟206。對于問答對分類模型,可以分析了每一問答對特征的重要性。在一個示例中,10個重要的問答對特征如下表所示:其中,回答者特征和問答對文本語義特征大多在這10個重要的問答對特征內(nèi),對預(yù)測問答對數(shù)據(jù)的質(zhì)量(即分類)起到有效的作用。在步驟206中隨機(jī)森林模型使用24個基本的問答對特征(即擴(kuò)展前的問答對特征),模型在在新的問答對數(shù)據(jù)和舊的問答對數(shù)據(jù)上的預(yù)測平均準(zhǔn)確率可達(dá)81%。對基本的問答對特征采用笛卡兒積變換的方式進(jìn)行擴(kuò)展,獲得M(M為正整數(shù))個擴(kuò)展的問答對特征,表示與基本的問答對特征之間的交互效果,表達(dá)基本的問答對特征與擴(kuò)展的問答對特征之間的協(xié)同作用,擴(kuò)大了問答對分類模型的泛化能力,從而提高問答對分類模型的預(yù)測準(zhǔn)確率。如果選擇前10個重要的問答對特征做笛卡兒積變換,擴(kuò)展45個問答對特征,部分?jǐn)U展的問答對特征如下:基本的問答對特征和擴(kuò)展的問答對特征共69個特征,重新訓(xùn)練隨機(jī)深林模型,其它參數(shù)不變,模型的oobrmse約0.414505,模型預(yù)測平均準(zhǔn)確率增加3個百分點(diǎn),達(dá)到84%。特征擴(kuò)展后的問答對模型在新的問答對數(shù)據(jù)和舊的問答對數(shù)據(jù)上的預(yù)測平均準(zhǔn)確率可達(dá)84%,優(yōu)于基于人工策略的傳統(tǒng)方法在舊的問答對數(shù)據(jù)上的準(zhǔn)確率74%,而且,傳統(tǒng)方法無法應(yīng)用到新的問答對數(shù)據(jù)的預(yù)測。對于方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動作順序的限制,因?yàn)橐罁?jù)本發(fā)明實(shí)施例,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動作并不一定是本發(fā)明實(shí)施例所必須的。參照圖3,示出了根據(jù)本發(fā)明一個實(shí)施例的一種問答對分類模型的訓(xùn)練裝置的結(jié)構(gòu)框圖,具體可以包括如下模塊:問答對數(shù)據(jù)獲取模塊301,適于獲取問答對數(shù)據(jù);問答對特征提取模塊302,適于從所述問答對數(shù)據(jù)中提取問答對特征;分類標(biāo)簽標(biāo)注模塊303,適于根據(jù)所述問答對數(shù)據(jù)的質(zhì)量對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽;模型訓(xùn)練模塊304,適于采用所述問答對特征與所述分類標(biāo)簽訓(xùn)練問答對分類模型。在具體實(shí)現(xiàn)中,所述問答對特征包括如下的一種或多種:提問者特征、回答者特征、問答對文本語義特征、問答對數(shù)字特征、用戶反饋特征。在本發(fā)明實(shí)施例的一個示例中,所述問答對數(shù)據(jù)包括問題與答案,所述問答對文本語義特征包括問答對配對特征;所述問答對特征提取模塊302還適于:查找所述問題中的詞項(xiàng)與所述答案中的詞項(xiàng)共現(xiàn)的詞對;統(tǒng)計所述共現(xiàn)的詞對的數(shù)量,作為問答對配對特征。在本發(fā)明實(shí)施例的另一個示例中,所述問答對數(shù)據(jù)包括問題與答案,所述問答對文本語義特征包括問答對最小路由距離;所述問答對特征提取模塊302還適于:從所述問題中提取關(guān)鍵詞,生成問題關(guān)鍵詞集合;從所述答案中提取關(guān)鍵詞,生成答案關(guān)鍵詞集合;計算所述問題關(guān)鍵詞集合和所述答案關(guān)鍵詞集合之間相似度;將所述相似度進(jìn)行累積,獲得問答對最小路由距離。在本發(fā)明實(shí)施例的另一個示例中,所述問答對數(shù)據(jù)包括問題與答案,所述問答對文本語義特征包括問答對句子相似度;所述問答對特征提取模塊302還適于:將所述問題轉(zhuǎn)換為第一句子向量;將所述答案轉(zhuǎn)換為第二句子向量;計算所述第一句子向量與所述第二句子向量之間的相似度,作為問答對句子相似度。在本發(fā)明的一個實(shí)施例中,所述分類標(biāo)簽標(biāo)注模塊303還適于:查找搜索所述問答對數(shù)據(jù)時記錄的搜索記錄數(shù)據(jù);根據(jù)所述搜索記錄數(shù)據(jù)對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽。在本發(fā)明的一個實(shí)施例中,所述分類標(biāo)簽標(biāo)注模塊303還適于:挖掘所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的平均點(diǎn)擊權(quán)重;挖掘所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的最后一次點(diǎn)擊權(quán)重;采用所述平均點(diǎn)擊權(quán)重和所述最后一次點(diǎn)擊權(quán)重擬合連續(xù)分值;將所述連續(xù)分值離散化為分類標(biāo)簽。在本發(fā)明的一個實(shí)施例中,所述分類標(biāo)簽標(biāo)注模塊303還適于:記錄所述問答對數(shù)據(jù)所屬網(wǎng)頁的地址;計算所述地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值;采用所述點(diǎn)擊分值計算所述地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值分布信息;采用所述點(diǎn)擊分值分布信息計算所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的平均點(diǎn)擊權(quán)重。在本發(fā)明的一個實(shí)施例中,所述分類標(biāo)簽標(biāo)注模塊303還適于:統(tǒng)計所述地址在指定的關(guān)鍵詞下的點(diǎn)擊次數(shù);統(tǒng)計指定的關(guān)鍵詞的搜索次數(shù);采用所述點(diǎn)擊次數(shù)與所述搜索次數(shù)計算所述地址在指定的搜索關(guān)鍵詞下的點(diǎn)擊分值。在本發(fā)明的一個實(shí)施例中,所述分類標(biāo)簽標(biāo)注模塊303還適于:記錄所述問答對數(shù)據(jù)所屬網(wǎng)頁的地址;計算所述地址在指定的搜索關(guān)鍵詞下最后一次點(diǎn)擊分值;采用所述最后一次點(diǎn)擊分值計算所述問答對數(shù)據(jù)在搜索關(guān)鍵詞下的最后一次點(diǎn)擊權(quán)重;在本發(fā)明的一個實(shí)施例中,所述分類標(biāo)簽標(biāo)注模塊303還適于:統(tǒng)計所述地址在指定的關(guān)鍵詞下最后一次的點(diǎn)擊次數(shù);統(tǒng)計指定的關(guān)鍵詞的搜索次數(shù);采用所述最后一次的點(diǎn)擊次數(shù)與所述搜索次數(shù)計算所述地址在指定的搜索關(guān)鍵詞下最后一次點(diǎn)擊分值。參照圖4,示出了根據(jù)本發(fā)明一個實(shí)施例的另一種問答對分類模型的訓(xùn)練裝置的結(jié)構(gòu)框圖,具體可以包括如下模塊:問答對數(shù)據(jù)獲取模塊401,適于獲取問答對數(shù)據(jù);問答對特征提取模塊402,適于從所述問答對數(shù)據(jù)中提取問答對特征;分類標(biāo)簽標(biāo)注模塊403,適于根據(jù)所述問答對數(shù)據(jù)的質(zhì)量對所述問答對數(shù)據(jù)標(biāo)注分類標(biāo)簽;歸一化模塊404,適于對所述問答對特征進(jìn)行歸一化處理。分類標(biāo)簽調(diào)整模塊405,適于根據(jù)鄰近的問答對數(shù)據(jù)對當(dāng)前的問答對數(shù)據(jù)的分類標(biāo)簽進(jìn)行調(diào)整。模型訓(xùn)練模塊406,適于采用所述問答對特征與所述分類標(biāo)簽訓(xùn)練問答對分類模型。重要程度識別模塊407,適于識別所述問答對特征對于所述問答對分類模型的重要程度;問答對特征擴(kuò)展模塊408,適于對重要程度最高的M個問答對特征進(jìn)行擴(kuò)展,獲得擴(kuò)展后的問答對特征,返回調(diào)用所述模型訓(xùn)練模塊406。在本發(fā)明的一個實(shí)施例中,所述歸一化模塊404還適于:統(tǒng)計每一維問答對特征的平均值和標(biāo)準(zhǔn)差;將每一維問答對特征減去所述平均值、除以所述標(biāo)準(zhǔn)差。在本發(fā)明的一個實(shí)施例中,所述分類標(biāo)簽調(diào)整模塊405還適于:將所述問答對數(shù)據(jù)進(jìn)行聚類;對于每一個問答對數(shù)據(jù),選擇聚類后的N個近鄰的問答對數(shù)據(jù);計算當(dāng)前的問答對數(shù)據(jù)與所述近鄰的問答對數(shù)據(jù)之間的距離;基于所述距離重新擬合分類標(biāo)簽。對于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。在此提供的算法和顯示不與任何特定計算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實(shí)施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書由此明確地并入該具體實(shí)施方式,其中每個權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。本領(lǐng)域那些技術(shù)人員可以理解,可以對實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在與該實(shí)施例不同的一個或多個設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。本發(fā)明的各個部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個或者多個處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的問答對分類模型的訓(xùn)練設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機(jī)程序和計算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲在計算機(jī)可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。應(yīng)該注意的是上述實(shí)施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。當(dāng)前第1頁1 2 3