亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

信息分類方法及裝置與流程

文檔序號(hào):11155444閱讀:768來(lái)源:國(guó)知局
信息分類方法及裝置與制造工藝

本發(fā)明涉及數(shù)據(jù)分類技術(shù)領(lǐng)域,尤其涉及一種信息分類方法及裝置。



背景技術(shù):

相關(guān)技術(shù)中,當(dāng)終端等設(shè)備接收到用戶輸入的語(yǔ)音查詢請(qǐng)求時(shí),會(huì)根據(jù)該查詢請(qǐng)求從預(yù)設(shè)數(shù)據(jù)庫(kù)中查找與該請(qǐng)求對(duì)應(yīng)的答案或者回復(fù),但在整個(gè)預(yù)設(shè)數(shù)據(jù)庫(kù)中進(jìn)行查找,不但不能保證查找到的答案或者回復(fù)的準(zhǔn)確性,而且查找時(shí)間也相對(duì)較長(zhǎng)。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供一種信息分類方法及裝置,用以實(shí)現(xiàn)在保證查找的答案或者回復(fù)的準(zhǔn)確率的基礎(chǔ)上,提高查找效率,從而提升用戶的使用體驗(yàn)。

根據(jù)本發(fā)明實(shí)施例的第一方面,提供一種信息分類方法,包括:

獲取用戶輸入的歷史語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的文本數(shù)據(jù)信息的意圖分類日志記錄;

從所述意圖分類日志記錄的每個(gè)意圖分類中獲取多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息;

根據(jù)所述每個(gè)意圖分類中多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息、預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型和預(yù)設(shè)的轉(zhuǎn)移概率矩陣,確定用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣;

使用所述用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣確定接收到的當(dāng)前語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖類別;

在所述目標(biāo)意圖類別對(duì)應(yīng)的數(shù)據(jù)庫(kù)中查找與所述語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的應(yīng)答信息。

在該實(shí)施例中,在對(duì)歷史語(yǔ)音數(shù)據(jù)信息進(jìn)行分類后,可以獲取意圖分類日志記錄,并從該記錄中獲取每個(gè)意圖類別中多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息,進(jìn)而根據(jù)多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息和預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型和預(yù)設(shè)的轉(zhuǎn)移概率矩陣,確定用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣,并使用所述用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣確定接收到的當(dāng)前語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖類別,在所述目標(biāo)意圖類別對(duì)應(yīng)的數(shù)據(jù)庫(kù)中查找與所述語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的應(yīng)答信息。這樣,不但可以為用戶提供更準(zhǔn)確的應(yīng)答信息,還可以減少查找時(shí)間,提高查找效率,提升用戶的使用體驗(yàn)。

其中,歷史語(yǔ)音數(shù)據(jù)信息,可以采用歷史用戶意圖分類模型和歷史目標(biāo)轉(zhuǎn)移概率矩陣進(jìn)行分類,這樣,在分類的過(guò)程中,不斷根據(jù)歷史分類記錄完善用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣,從而使得分類準(zhǔn)確率不斷提高。

在一個(gè)實(shí)施例中,根據(jù)所述多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息、預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型和預(yù)設(shè)的轉(zhuǎn)移概率矩陣,確定用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣,包括:

將所述多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息作為意圖分類訓(xùn)練語(yǔ)料,利用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到用戶意圖分類模型;

獲取所述多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息中任意兩個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系;

利用所述相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系和所述預(yù)設(shè)的轉(zhuǎn)移概率矩陣進(jìn)行訓(xùn)練,得到所述目標(biāo)轉(zhuǎn)移概率矩陣。

在該實(shí)施例中,利用所述意圖分類訓(xùn)練語(yǔ)料和所述預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到所述用戶意圖分類模型,利用相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系和預(yù)設(shè)的轉(zhuǎn)移概率矩陣進(jìn)行訓(xùn)練,得到目標(biāo)轉(zhuǎn)移概率矩陣這樣,根據(jù)用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣進(jìn)行意圖分類,可以保證分類結(jié)果的準(zhǔn)確性。

在一個(gè)實(shí)施例中,所述文本數(shù)據(jù)信息包括以下至少一項(xiàng):文本信息和拼音信息;

所述意圖分類訓(xùn)練語(yǔ)料包括以下至少一種形式:

文本語(yǔ)料和拼音預(yù)料。

在該實(shí)施例中,在進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí),不但可以采用訓(xùn)練語(yǔ)料的文本形式進(jìn)行訓(xùn)練,還可以采用訓(xùn)練語(yǔ)料的拼音形式進(jìn)行訓(xùn)練,這樣,可以有效的過(guò)濾噪音,避免錯(cuò)誤累積。

在一個(gè)實(shí)施例中,所述使用所述用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣確定接收到的當(dāng)前語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖類別,包括:

將所述當(dāng)前文本數(shù)據(jù)信息作為所述用戶意圖分類模型的輸入,得到所述當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的第一分類結(jié)果;

獲取所述當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的上一句文本數(shù)據(jù)信息所屬的意圖類別;

根據(jù)所述上一句文本數(shù)據(jù)信息所屬的意圖類別和所述目標(biāo)轉(zhuǎn)移概率矩陣,確定所述當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的第二分類結(jié)果;

根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果確定所述當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖分類。

在一個(gè)實(shí)施例中,所述根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果確定所述當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖分類,包括:

根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果的乘積,確定所述當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖分類。

在該實(shí)施例中,將當(dāng)前文本數(shù)據(jù)信息作為用戶意圖分類模型的輸入,得到文本數(shù)據(jù)信息對(duì)應(yīng)的第一分類結(jié)果,該第一分類結(jié)果表明當(dāng)前文本數(shù)據(jù)信息屬于各個(gè)意圖分類的概率,其是一個(gè)1*N維的特征向量,并根據(jù)上一句文本數(shù)據(jù)信息和目標(biāo)轉(zhuǎn)移概率矩陣計(jì)算出當(dāng)前文本數(shù)據(jù)信息屬于每個(gè)意圖類別的概率矩陣,該矩陣可以是N*N維的,進(jìn)而根據(jù)兩者的乘積得到文本數(shù)據(jù)信息屬于每個(gè)意圖類別的總概率,進(jìn)而將總概率值最高對(duì)應(yīng)的意圖類別確定為目標(biāo)意圖類別。

根據(jù)本發(fā)明實(shí)施例的第二方面,提供一種信息分類裝置,包括:

第一獲取模塊,用于獲取用戶輸入的歷史語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的文本數(shù)據(jù)信息的意圖分類日志記錄;

第二獲取模塊,用于從所述意圖分類日志記錄中獲取多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息;

第一確定模塊,用于根據(jù)所述多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息、預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型和預(yù)設(shè)的轉(zhuǎn)移概率矩陣,確定用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣;

第二確定模塊,用于使用所述用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣確定接收到的當(dāng)前語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖類別;

查找模塊,用于在所述目標(biāo)意圖類別對(duì)應(yīng)的數(shù)據(jù)庫(kù)中查找與所述語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的應(yīng)答信息。

在一個(gè)實(shí)施例中,所述第一確定模塊包括:

第一訓(xùn)練子模塊,用于將所述多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息作為意圖分類訓(xùn)練語(yǔ)料,利用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到用戶意圖分類模型;

第一獲取子模塊,用于獲取所述多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息中任意兩個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系;

第二訓(xùn)練子模塊,用于利用所述相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系和所述預(yù)設(shè)的轉(zhuǎn)移概率矩陣進(jìn)行訓(xùn)練,得到所述目標(biāo)轉(zhuǎn)移概率矩陣。

在一個(gè)實(shí)施例中,所述意圖分類訓(xùn)練語(yǔ)料包括以下至少一種形式:

文本語(yǔ)料和拼音預(yù)料。

在一個(gè)實(shí)施例中,所述第二確定模塊包括:

處理子模塊,用于將所述當(dāng)前文本數(shù)據(jù)信息作為所述用戶意圖分類模型的輸入,得到所述當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的第一分類結(jié)果;

第二獲取子模塊,用于獲取所述當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的上一句文本數(shù)據(jù)信息所屬的意圖類別;

第一確定子模塊,用于根據(jù)所述上一句文本數(shù)據(jù)信息所屬的意圖類別和所述目標(biāo)轉(zhuǎn)移概率矩陣,確定所述當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的第二分類結(jié)果;

第二確定子模塊,用于根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果確定所述當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖分類。

在一個(gè)實(shí)施例中,所述第二確定子模塊用于:

根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果的乘積,確定所述當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖分類。

應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本發(fā)明。

本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書中闡述,并且,部分地從說(shuō)明書中變得顯而易見,或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在所寫的說(shuō)明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。

下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。

附圖說(shuō)明

此處的附圖被并入說(shuō)明書中并構(gòu)成本說(shuō)明書的一部分,示出了符合本發(fā)明的實(shí)施例,并與說(shuō)明書一起用于解釋本發(fā)明的原理。

圖1是根據(jù)一示例性實(shí)施例示出的一種信息分類方法的流程圖。

圖2是根據(jù)一示例性實(shí)施例示出的一種信息分類方法中步驟S103的流程圖。

圖3是根據(jù)一示例性實(shí)施例示出的一種信息分類方法中步驟S104的流程圖。

圖4是根據(jù)一示例性實(shí)施例示出的一種信息分類裝置的框圖。

圖5是根據(jù)一示例性實(shí)施例示出的一種信息分類裝置中第一確定模塊的框圖。

圖6是根據(jù)一示例性實(shí)施例示出的一種信息分類裝置中第二確定模塊的框圖。

具體實(shí)施方式

這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說(shuō)明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本發(fā)明相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。

圖1是根據(jù)一示例性實(shí)施例示出的一種信息分類方法的流程圖。該信息分類方法應(yīng)用于終端設(shè)備中,該終端設(shè)備可以是移動(dòng)電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等任一具有語(yǔ)音識(shí)別功能的設(shè)備。如圖1所示,該方法包括步驟S101-S105:

在步驟S101中,獲取用戶已輸入的歷史語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的文本數(shù)據(jù)信息的意圖分類日志記錄;

在步驟S102中,從意圖分類日志記錄中獲取多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息;

在步驟S103中,根據(jù)每個(gè)意圖分類中多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息、預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型和預(yù)設(shè)的轉(zhuǎn)移概率矩陣,確定用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣;

其中,意圖分類日志記錄可以是之前對(duì)語(yǔ)音數(shù)據(jù)信息進(jìn)行意圖分類的歷史記錄。而目標(biāo)轉(zhuǎn)移概率矩陣是根據(jù)語(yǔ)音數(shù)據(jù)信息的上文確定該語(yǔ)音數(shù)據(jù)信息屬于某個(gè)意圖類別的概率。即目標(biāo)轉(zhuǎn)移概率矩陣不關(guān)心當(dāng)前的語(yǔ)音數(shù)據(jù)信息屬于哪個(gè)意圖類別,只獲取上一個(gè)語(yǔ)音數(shù)據(jù)信息屬于哪個(gè)意圖類別。根據(jù)上一個(gè)語(yǔ)音數(shù)據(jù)信息的意圖類別,預(yù)測(cè)當(dāng)前的語(yǔ)音數(shù)據(jù)信息屬于各個(gè)意圖類別的概率。

在步驟S104中,使用用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣確定接收到的當(dāng)前語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖類別;

在步驟S105中,在目標(biāo)意圖類別對(duì)應(yīng)的數(shù)據(jù)庫(kù)中查找與當(dāng)前語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的應(yīng)答信息。

在該實(shí)施例中,在對(duì)歷史語(yǔ)音數(shù)據(jù)信息進(jìn)行分類后,可以獲取意圖分類日志記錄,并從該記錄中獲取每個(gè)意圖類別中多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息,進(jìn)而根據(jù)多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息和預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型和預(yù)設(shè)的轉(zhuǎn)移概率矩陣,確定用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣,并使用用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣確定接收到的當(dāng)前語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖類別,在目標(biāo)意圖類別對(duì)應(yīng)的數(shù)據(jù)庫(kù)中查找與語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的應(yīng)答信息。這樣,不但可以為用戶提供更準(zhǔn)確的應(yīng)答信息,還可以減少查找時(shí)間,提高查找效率,提升用戶的使用體驗(yàn)。

其中,歷史語(yǔ)音數(shù)據(jù)信息,可以采用歷史用戶意圖分類模型和歷史目標(biāo)轉(zhuǎn)移概率矩陣進(jìn)行分類,這樣,在分類的過(guò)程中,不斷根據(jù)歷史分類記錄完善用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣,從而使得分類準(zhǔn)確率不斷提高。

圖2是根據(jù)一示例性實(shí)施例示出的一種信息分類方法中步驟S103的流程圖。

如圖2所示,在一個(gè)實(shí)施例中,上述步驟S103包括步驟S201-S203:

在步驟S201中,將每個(gè)意圖分類中多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息作為意圖分類訓(xùn)練語(yǔ)料,利用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到用戶意圖分類模型;

意圖可以分層級(jí)的,如歌曲的意圖,下面分搜歌曲、搜歌手、播放等意圖,因此,意圖分類訓(xùn)練語(yǔ)料是有層級(jí)的,訓(xùn)練出的用戶意圖分類模型也是有層級(jí)的。先訓(xùn)練出最下層的分類,逐層向上抽取,得到上層分類。每層訓(xùn)練時(shí)輸入的語(yǔ)料是相同的,但是訓(xùn)練的目標(biāo)是不同的,訓(xùn)練的參數(shù)和不變的參數(shù)是不同的。

在步驟S202中,獲取每個(gè)意圖分類中多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息中任意兩個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系;

在步驟S203中,利用相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系和預(yù)設(shè)的轉(zhuǎn)移概率矩陣進(jìn)行訓(xùn)練,得到目標(biāo)轉(zhuǎn)移概率矩陣。

例如,日志中兩個(gè)同意圖的文本數(shù)據(jù)信息為query1與query3,兩者之間的文本書數(shù)據(jù)信息為query2,查看query1與query3之間的關(guān)系,可能query1與query3屬于同一分類,那么,根據(jù)query1,query2和query 3的分類對(duì)預(yù)設(shè)的轉(zhuǎn)移概率矩陣進(jìn)行訓(xùn)練得到目標(biāo)轉(zhuǎn)移概率矩陣,這樣,得到的目標(biāo)概率矩陣可以根據(jù)上下文確定當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的目標(biāo)意圖類別。

在該實(shí)施例中,利用意圖分類訓(xùn)練語(yǔ)料和預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到用戶意圖分類模型,利用相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系和預(yù)設(shè)的轉(zhuǎn)移概率矩陣進(jìn)行訓(xùn)練,得到目標(biāo)轉(zhuǎn)移概率矩陣這樣,根據(jù)用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣進(jìn)行意圖分類,可以保證分類結(jié)果的準(zhǔn)確性。

在一個(gè)實(shí)施例中,所述文本數(shù)據(jù)信息包括以下至少一項(xiàng):文本信息和拼音信息;

意圖分類訓(xùn)練語(yǔ)料包括以下至少一種形式:

文本語(yǔ)料和拼音預(yù)料。

在該實(shí)施例中,在進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí),不但可以采用訓(xùn)練語(yǔ)料的文本形式進(jìn)行訓(xùn)練,還可以采用訓(xùn)練語(yǔ)料的拼音形式進(jìn)行訓(xùn)練,這樣,可以有效的過(guò)濾噪音,避免錯(cuò)誤累積。

圖3是根據(jù)一示例性實(shí)施例示出的一種信息分類方法中步驟S104的流程圖。

如圖3所示,在一個(gè)實(shí)施例中,上述步驟S104包括步驟S301-S304:

在步驟S301中,將當(dāng)前文本數(shù)據(jù)信息作為用戶意圖分類模型的輸入,得到當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的第一分類結(jié)果;

在步驟S302中,獲取當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的上一句文本數(shù)據(jù)信息所屬的意圖類別;

在步驟S303中,根據(jù)上一句文本數(shù)據(jù)信息所屬的意圖類別和目標(biāo)轉(zhuǎn)移概率矩陣,確定當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的第二分類結(jié)果;

在步驟S304中,根據(jù)第一分類結(jié)果和第二分類結(jié)果確定當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖分類。

在一個(gè)實(shí)施例中,所述根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果確定所述當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖分類,包括:

根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果的乘積,確定所述當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖分類。

在該實(shí)施例中,將當(dāng)前文本數(shù)據(jù)信息作為用戶意圖分類模型的輸入,得到文本數(shù)據(jù)信息對(duì)應(yīng)的第一分類結(jié)果,該第一分類結(jié)果表明當(dāng)前文本數(shù)據(jù)信息屬于各個(gè)意圖分類的概率,其是一個(gè)1*N維的特征向量,并根據(jù)上一句文本數(shù)據(jù)信息和目標(biāo)轉(zhuǎn)移概率矩陣計(jì)算出當(dāng)前文本數(shù)據(jù)信息屬于每個(gè)意圖類別的概率矩陣,該矩陣可以是N*N維的,進(jìn)而根據(jù)兩者的乘積得到文本數(shù)據(jù)信息屬于每個(gè)意圖類別的總概率,進(jìn)而將總概率值最高對(duì)應(yīng)的意圖類別確定為目標(biāo)意圖類別。

下述為本發(fā)明裝置實(shí)施例,可以用于執(zhí)行本發(fā)明方法實(shí)施例。

圖4是根據(jù)一示例性實(shí)施例示出的一種信息分類裝置的框圖,該裝置可以通過(guò)軟件、硬件或者兩者的結(jié)合實(shí)現(xiàn)成為終端設(shè)備的部分或者全部。如圖4所示,該信息分類裝置包括:

第一獲取模塊41,用于獲取用戶已輸入的歷史語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的文本數(shù)據(jù)信息的意圖分類日志記錄;

第二獲取模塊42,用于從所述意圖分類日志記錄中獲取多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息;

第一確定模塊43,用于根據(jù)所述多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息、預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型和預(yù)設(shè)的轉(zhuǎn)移概率矩陣,確定用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣;

第二確定模塊44,用于使用所述用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣確定接收到的當(dāng)前語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖類別;

查找模塊45,用于在所述目標(biāo)意圖類別對(duì)應(yīng)的數(shù)據(jù)庫(kù)中查找與所述當(dāng)前語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的應(yīng)答信息。

在該實(shí)施例中,在對(duì)歷史語(yǔ)音數(shù)據(jù)信息進(jìn)行分類后,可以獲取意圖分類日志記錄,并從該記錄中獲取每個(gè)意圖類別中的多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息,進(jìn)而根據(jù)多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息和預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型和預(yù)設(shè)的轉(zhuǎn)移概率矩陣,確定用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣,并使用所述用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣確定接收到的當(dāng)前語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖類別,在所述目標(biāo)意圖類別對(duì)應(yīng)的數(shù)據(jù)庫(kù)中查找與所述語(yǔ)音數(shù)據(jù)信息對(duì)應(yīng)的應(yīng)答信息。這樣,不但可以為用戶提供更準(zhǔn)確的應(yīng)答信息,還可以減少查找時(shí)間,提高查找效率,提升用戶的使用體驗(yàn)。

其中,歷史語(yǔ)音數(shù)據(jù)信息,可以采用歷史用戶意圖分類模型和歷史目標(biāo)轉(zhuǎn)移概率矩陣進(jìn)行分類,這樣,在分類的過(guò)程中,不斷根據(jù)歷史分類記錄完善用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣,從而使得分類準(zhǔn)確率不斷提高。

圖5是根據(jù)一示例性實(shí)施例示出的一種信息分類裝置中第一確定模塊的框圖。

如圖5所示,在一個(gè)實(shí)施例中,所述第一確定模塊43包括:

第一訓(xùn)練子模塊51,用于將所述多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息作為意圖分類訓(xùn)練語(yǔ)料,利用預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到用戶意圖分類模型;

第一獲取子模塊52,用于獲取所述多個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息中任意兩個(gè)相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系;

第二訓(xùn)練子模塊53,用于利用所述相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系和所述預(yù)設(shè)的轉(zhuǎn)移概率矩陣進(jìn)行訓(xùn)練,得到所述目標(biāo)轉(zhuǎn)移概率矩陣。

例如,日志中兩個(gè)同意圖的文本數(shù)據(jù)信息為query1與query3,兩者之間的文本書數(shù)據(jù)信息為query2,查看query1與query3之間的關(guān)系,可能query1與query3屬于同一分類,那么,根據(jù)query1,query2和query 3的分類對(duì)預(yù)設(shè)的轉(zhuǎn)移概率矩陣進(jìn)行訓(xùn)練。

在該實(shí)施例中,利用所述意圖分類訓(xùn)練語(yǔ)料和所述預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到所述用戶意圖分類模型,利用相似的查詢請(qǐng)求對(duì)應(yīng)的文本數(shù)據(jù)信息之間的上下文關(guān)系和預(yù)設(shè)的轉(zhuǎn)移概率矩陣進(jìn)行訓(xùn)練,得到目標(biāo)轉(zhuǎn)移概率矩陣這樣,根據(jù)用戶意圖分類模型和目標(biāo)轉(zhuǎn)移概率矩陣進(jìn)行意圖分類,可以保證分類結(jié)果的準(zhǔn)確性。

在一個(gè)實(shí)施例中,所述文本數(shù)據(jù)信息包括以下至少一項(xiàng):文本信息和拼音信息;

所述意圖分類訓(xùn)練語(yǔ)料包括以下至少一種形式:

文本語(yǔ)料和拼音預(yù)料。

在該實(shí)施例中,在進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí),不但可以采用訓(xùn)練語(yǔ)料的文本形式進(jìn)行訓(xùn)練,還可以采用訓(xùn)練語(yǔ)料的拼音形式進(jìn)行訓(xùn)練,這樣,可以有效的過(guò)濾噪音,避免錯(cuò)誤累積。

圖6是根據(jù)一示例性實(shí)施例示出的一種信息分類裝置中第二確定模塊的框圖。

如圖6所示,在一個(gè)實(shí)施例中,所述第二確定模塊44包括:

處理子模塊61,用于將所述當(dāng)前文本數(shù)據(jù)信息作為所述用戶意圖分類模型的輸入,得到所述當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的第一分類結(jié)果;

第二獲取子模塊62,用于獲取所述當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的上一句文本數(shù)據(jù)信息所屬的意圖類別;

第一確定子模塊63,用于根據(jù)所述上一句文本數(shù)據(jù)信息所屬的意圖類別和所述目標(biāo)轉(zhuǎn)移概率矩陣,確定所述當(dāng)前文本數(shù)據(jù)信息對(duì)應(yīng)的第二分類結(jié)果;

第二確定子模塊64,用于根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果確定所述當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖分類。

在一個(gè)實(shí)施例中,所述第二確定子模塊64用于:

根據(jù)所述第一分類結(jié)果和所述第二分類結(jié)果的乘積,確定所述當(dāng)前文本數(shù)據(jù)信息所屬的目標(biāo)意圖分類。

在該實(shí)施例中,將當(dāng)前文本數(shù)據(jù)信息作為用戶意圖分類模型的輸入,得到文本數(shù)據(jù)信息對(duì)應(yīng)的第一分類結(jié)果,該第一分類結(jié)果表明當(dāng)前文本數(shù)據(jù)信息屬于各個(gè)意圖分類的概率,其是一個(gè)1*N維的特征向量,并根據(jù)上一句文本數(shù)據(jù)信息和目標(biāo)轉(zhuǎn)移概率矩陣計(jì)算出當(dāng)前文本數(shù)據(jù)信息屬于每個(gè)意圖類別的概率矩陣,該矩陣可以是N*N維的,進(jìn)而根據(jù)兩者的乘積得到文本數(shù)據(jù)信息屬于每個(gè)意圖類別的總概率,進(jìn)而將總概率值最高對(duì)應(yīng)的意圖類別確定為目標(biāo)意圖類別。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。

這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。

這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。

顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1