本申請涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種樣本確認(rèn)方法和裝置及系統(tǒng)。
背景技術(shù):
隨著人工智能技術(shù)的日益成熟,越來越多的應(yīng)用系統(tǒng)使用了人工智能相關(guān)技術(shù),如關(guān)鍵詞檢索、身份認(rèn)證、說話人分離、說話人性別確認(rèn)等,都需要對候選樣本進(jìn)行最終的確認(rèn),以確認(rèn)候選樣本是否是目標(biāo)樣本,因此,樣本確認(rèn)的準(zhǔn)確度直接影響最終的應(yīng)用效果。
相關(guān)技術(shù)中,一般直接根據(jù)待確認(rèn)樣本的置信度進(jìn)行樣本確認(rèn),具體確認(rèn)時(shí),設(shè)定置信度閾值,判斷待確認(rèn)樣本的置信度是否超過預(yù)先設(shè)定的閾值,如果超過,則樣本確認(rèn)成功;否則,樣本確認(rèn)失敗。上述方法在樣本確認(rèn)時(shí),僅考慮了單一樣本的信息,而待確認(rèn)樣本在實(shí)際應(yīng)用中經(jīng)常受環(huán)境或信道等外部因素的干擾,單一樣本信息易發(fā)生改變,如果只考慮單一樣本的信息,在樣本確認(rèn)時(shí),常常會導(dǎo)致待確認(rèn)樣本被確認(rèn)錯(cuò)誤,即目標(biāo)待確認(rèn)樣本被錯(cuò)誤的確認(rèn)為非目標(biāo)樣本或非目標(biāo)待確認(rèn)樣本被錯(cuò)誤的確認(rèn)為目標(biāo)樣本,大大降低了樣本確認(rèn)的準(zhǔn)確度,影響應(yīng)用效果。
技術(shù)實(shí)現(xiàn)要素:
本申請旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本申請的一個(gè)目的在于提出一種樣本確認(rèn)方法,該方法可以提高樣本確認(rèn)的準(zhǔn)確度,進(jìn)而提高應(yīng)用效果。
本申請的另一個(gè)目的在于提出一種樣本確認(rèn)裝置。
本申請的另一個(gè)目的在于提出一種樣本確認(rèn)系統(tǒng)。
為達(dá)到上述目的,本申請第一方面實(shí)施例提出的樣本確認(rèn)方法,包括:獲取待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的置信度;確定待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的相似樣本;根據(jù)所述相似樣本對每個(gè)待確認(rèn)樣本的置信度進(jìn)行修正,得到每個(gè)待確認(rèn)樣本的修正后的置信度;根據(jù)每個(gè)待確認(rèn)樣本的修正后的置信度對每個(gè)待確認(rèn)樣本進(jìn)行確認(rèn)。
為達(dá)到上述目的,本申請第二方面實(shí)施例提出的樣本確認(rèn)裝置,包括:獲取模塊,用于獲取待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的置信度;確定模塊,用于確定待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的相似樣本;修正模塊,用于根據(jù)所述相似樣本對每個(gè)待確認(rèn)樣本的置信度進(jìn)行修正,得到每個(gè)待確認(rèn)樣本的修正后的置信度;確認(rèn)模塊,用于根據(jù)每個(gè)待確認(rèn)樣本的修正后的置信度對每個(gè)待確認(rèn)樣本進(jìn)行確認(rèn)。
為達(dá)到上述目的,本申請第三方面實(shí)施例提出的樣本確認(rèn)系統(tǒng),包括:客戶端,用于接收用戶輸入的待確認(rèn)樣本;服務(wù)端,用于接收客戶端發(fā)送的待確認(rèn)樣本,獲取待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的置信度;確定待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的相似樣本;根據(jù)所述相似樣本對每個(gè)待確認(rèn)樣本的置信度進(jìn)行修正,得到每個(gè)待確認(rèn)樣本的修正后的置信度;根據(jù)每個(gè)待確認(rèn)樣本的修正后的置信度對每個(gè)待確認(rèn)樣本進(jìn)行確認(rèn)。
本申請實(shí)施例,通過確定待確認(rèn)樣本的相似樣本,并根據(jù)相似樣本對待確認(rèn)樣本的置信度進(jìn)行修正,以及根據(jù)修正后的置信度進(jìn)行樣本確認(rèn),可以有效提升樣本確認(rèn)的準(zhǔn)確度,尤其是修正前置信度在置信度閾值附近的樣本,提升效果更明顯。
本申請附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本申請的實(shí)踐了解到。
附圖說明
本申請上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1是本申請一個(gè)實(shí)施例提出的樣本確認(rèn)方法的流程示意圖;
圖2是本申請實(shí)施例中使用修正前置信度和修正后置信度分別進(jìn)行樣本確認(rèn)的對比示意圖;
圖3是本申請實(shí)施例中確定待確認(rèn)樣本的相似樣本的方法的流程示意圖;
圖4是本申請另一個(gè)實(shí)施例提出的樣本確認(rèn)方法的流程示意圖;
圖5是本申請一個(gè)實(shí)施例提出的樣本確認(rèn)裝置的結(jié)構(gòu)示意圖;
圖6是本申請另一個(gè)實(shí)施例提出的樣本確認(rèn)裝置的結(jié)構(gòu)示意圖;
圖7是本申請一個(gè)實(shí)施例提出的樣本確認(rèn)系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面詳細(xì)描述本申請的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本申請,而不能理解為對本申請的限制。相反,本申請的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
圖1是本申請一個(gè)實(shí)施例提出的樣本確認(rèn)方法的流程示意圖。
如圖1所示,本實(shí)施例的方法包括:
S11:獲取待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的置信度。
所述待確認(rèn)樣本集合為需要確認(rèn)的多個(gè)候選樣本組成的集合,如關(guān)鍵詞檢索時(shí),將多個(gè)候選關(guān)鍵詞組成待確認(rèn)樣本集合,以確認(rèn)每個(gè)候選關(guān)鍵詞是否是目標(biāo)關(guān)鍵詞。
所述待確認(rèn)樣本的置信度一般根據(jù)應(yīng)用需求,利用待確認(rèn)樣本與目標(biāo)確認(rèn)模型的匹配度得到,如關(guān)鍵詞檢索時(shí),可以通過關(guān)鍵詞訓(xùn)練數(shù)據(jù)構(gòu)建得到關(guān)鍵詞確認(rèn)模型,依次計(jì)算待確認(rèn)關(guān)鍵詞與所述關(guān)鍵詞確認(rèn)模型的匹配度,即可得到每個(gè)待確認(rèn)關(guān)鍵詞的置信度;如說話人確認(rèn)時(shí),可以通過計(jì)算待確認(rèn)說話人的語音數(shù)據(jù)與說話人確認(rèn)模型的匹配度得到待確認(rèn)說話人的置信度。所述置信度的計(jì)算方法可以采用包括現(xiàn)有技術(shù)在內(nèi)的各種相關(guān)技術(shù),本申請對所述置信度的獲取方法不作限定。
S12:確定待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的相似樣本。
S13:根據(jù)所述相似樣本的置信度對每個(gè)待確認(rèn)樣本的置信度進(jìn)行修正,得到每個(gè)待確認(rèn)樣本的修正后的置信度。
具體過程如下所述。
S14:根據(jù)每個(gè)待確認(rèn)樣本的修正后的置信度對每個(gè)待確認(rèn)樣本進(jìn)行確認(rèn)。
具體確認(rèn)時(shí),直接判斷每個(gè)待確認(rèn)樣本的修正后的置信度是否大于預(yù)先設(shè)定的閾值,如果大于,則確認(rèn)成功,即待確認(rèn)樣本為目標(biāo)樣本;否則,確認(rèn)失敗,即待確認(rèn)樣本不是目標(biāo)樣本。
如圖2為使用待確認(rèn)樣本修正后置信度進(jìn)行樣本確認(rèn)示意圖,待確認(rèn)樣本集合中共18個(gè)待確認(rèn)樣本,虛線表示待確認(rèn)樣本置信度閾值分界線,實(shí)心圈表示正例樣本,空心圈表示負(fù)例樣本,所述正例樣本即置信度大于置信度閾值的待確認(rèn)樣本,所述負(fù)例樣本即置信度小于置信度閾值的待確認(rèn)樣本;由于受環(huán)境等外部因素的影響,使用現(xiàn)有方法進(jìn)行樣本確認(rèn)時(shí),容易出現(xiàn)確認(rèn)錯(cuò)誤的待確認(rèn)樣本,如圖2(a)中被錯(cuò)誤確認(rèn)的樣本1和樣本2;
通過本申請所述方法,根據(jù)待確認(rèn)樣本的相似樣本對待確認(rèn)樣本的置信度進(jìn)行修正后,使修正后的置信度包含了更多樣本的信息,如待確認(rèn)樣本1的置信度,同時(shí)包含了待確認(rèn)樣本1和它的3個(gè)相似樣本的信息,采用所述修正后的置信度進(jìn)行樣本確認(rèn)時(shí),可以將之前確認(rèn)錯(cuò)誤的樣本正確確認(rèn),從而提升樣本確認(rèn)的準(zhǔn)確度;
如圖2(b)中,使用待確認(rèn)樣本修正后的置信度進(jìn)行樣本確認(rèn),可以將之前確認(rèn)錯(cuò)誤的樣本1和樣本2正確確認(rèn)。
下面對相似樣本的確定以及置信度的修正過程進(jìn)行說明。
為了提高樣本確認(rèn)的準(zhǔn)確性,本申請從待確認(rèn)樣本集合中找到每個(gè)待確認(rèn)樣本的相似樣本;利用每個(gè)待確認(rèn)樣本的相似樣本的置信度對每個(gè)待確認(rèn)樣本的置信度進(jìn)行修正,使得修正后的置信度利用了每個(gè)待確認(rèn)樣本的相似樣本的信息,具體修正方法如下所述。
如圖3所示,確定待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的相似樣本的方法包括:
S31:計(jì)算待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本與其它待確認(rèn)樣本的相似度。
所述相似度一般使用待確認(rèn)樣本之間的距離描述,如歐式距離、余弦距離,所述距離的計(jì)算方法可以參見包括現(xiàn)有技術(shù)在內(nèi)的各種相關(guān)技術(shù),具體計(jì)算方法不作限定。如關(guān)鍵詞檢索時(shí),通過計(jì)算訓(xùn)練數(shù)據(jù)中待確認(rèn)關(guān)鍵詞與其它關(guān)鍵詞的動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping,DTW)距離得到;如說話人確認(rèn)時(shí),可以通過計(jì)算說話人語音數(shù)據(jù)聲紋特征之間的余弦距離得到,所述聲紋特征如Ivector特征;一般情況下,樣本之間的距離越小,相似度越大。
當(dāng)然也可以采用其它方法描述待確認(rèn)樣本與訓(xùn)練數(shù)據(jù)中每個(gè)樣本的相似度,如直接將待確認(rèn)樣本與其它待確認(rèn)樣本進(jìn)行匹配,得到待確認(rèn)樣本與其它待確認(rèn)樣本的匹配度,使用所述匹配度描述待確認(rèn)樣本與其它待確認(rèn)樣本的相似度。
具體計(jì)算時(shí),依次選擇待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本作為當(dāng)前待確認(rèn)樣本;再依次計(jì)算當(dāng)前待確認(rèn)樣本與其它每個(gè)待確認(rèn)樣本的相似度,使用D(X,xj)表示,其中X表示當(dāng)前待確認(rèn)樣本,xj表示待確認(rèn)樣本集合中除當(dāng)前待確認(rèn)樣本之外的第j個(gè)待確認(rèn)樣本;計(jì)算結(jié)束后,得到待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本與其它待確認(rèn)樣本的相似度。
S32:根據(jù)每個(gè)待確認(rèn)樣本與其它待確認(rèn)樣本的相似度,確定每個(gè)待確認(rèn)樣本的相似樣本。
具體可以先對上述計(jì)算得到的相似度進(jìn)行規(guī)整,再根據(jù)規(guī)整后的相似度確定每個(gè)待確認(rèn)樣本的相似樣本。
具體規(guī)整時(shí),根據(jù)待確認(rèn)樣本集合中所有待確認(rèn)樣本分別與其它待確認(rèn)樣本之間相似度的最大值及最小值依次對每個(gè)待確認(rèn)樣本與其它待確認(rèn)樣本的相似度進(jìn)行規(guī)整,得到每個(gè)待確認(rèn)樣本與其它待確認(rèn)樣本規(guī)整后的相似度;具體規(guī)整方法如式(1)所示:
其中,S(X,xj)為當(dāng)前待確認(rèn)樣本與待確認(rèn)樣本集合中去除當(dāng)前待確認(rèn)樣本后第j個(gè)樣本xj規(guī)整后的相似度,min(D)為待確認(rèn)樣本集合中所有待確認(rèn)樣本分別與其它待確認(rèn)樣本相似度的最小值,max(D)為待確認(rèn)樣本集合中所有待確認(rèn)樣本分別與其它待確認(rèn)樣本相似度的最大值。
在得到規(guī)整后的相似度后,可以將大于預(yù)設(shè)閾值的規(guī)整后的相似度所對應(yīng)的其它待確認(rèn)樣本,確定為每個(gè)待確認(rèn)樣本的相似樣本;或者,對規(guī)整后的相似度按照從大到小的順序排序,選擇排序在前的預(yù)設(shè)個(gè)數(shù)的規(guī)整后的相似度,將選擇的規(guī)整后的相似度所對應(yīng)的其它待確認(rèn)樣本,確定為每個(gè)待確認(rèn)的相似樣本。
在確定出每個(gè)待確認(rèn)樣本的相似樣本后,可以采用如下方法對每個(gè)待確認(rèn)樣本的置信度進(jìn)行修正。
具體地,將每個(gè)待確認(rèn)樣本分別作為當(dāng)前待確認(rèn)樣本,并對應(yīng)當(dāng)前待確認(rèn)樣本執(zhí)行如下步驟:根據(jù)當(dāng)前待確認(rèn)樣本與每個(gè)相似樣本的規(guī)整后的相似度以及每個(gè)相似樣本的置信度,計(jì)算當(dāng)前待確認(rèn)樣本的所有相似樣本的貢獻(xiàn)率;
對當(dāng)前待確認(rèn)樣本的置信度和所述貢獻(xiàn)率進(jìn)行加權(quán)求和,得到當(dāng)前待確認(rèn)樣本的修正后的置信度;
其中,所述貢獻(xiàn)率為當(dāng)前待確認(rèn)樣本的所有相似樣本的貢獻(xiàn)度與當(dāng)前待確認(rèn)樣本與所有相似樣本的規(guī)整后的相似度和的比值,所述貢獻(xiàn)度為當(dāng)前待確認(rèn)樣本與每個(gè)相似樣本的規(guī)整后的相似度與每個(gè)相似樣本的置信度的乘積和。
用公式表示如式(2)所示:
g(X)=(1-α)c(X)+αT(X) (2)
其中,g(X)是當(dāng)前待確認(rèn)樣本的修正后的置信度;c(X)是當(dāng)前待確認(rèn)樣本的修正前的置信度;T(X)是當(dāng)前待確認(rèn)樣本的所有相似樣本的貢獻(xiàn)率;α是當(dāng)前待確認(rèn)樣本的所有相似樣本貢獻(xiàn)率的權(quán)重,可以根據(jù)應(yīng)用需求設(shè)置。
所述貢獻(xiàn)率T(X)是根據(jù)當(dāng)前待確認(rèn)樣本與每個(gè)相似樣本的規(guī)整后的相似度以及每個(gè)相似樣本的置信度計(jì)算得到的,如式(3)所示:
其中,為當(dāng)前待確認(rèn)樣本的所有相似樣本的貢獻(xiàn)度;為當(dāng)前待確認(rèn)樣本與所有相似樣本的規(guī)整后的相似度和;S(X,xi)為當(dāng)前待確認(rèn)樣本與其第i個(gè)相似樣本的規(guī)整后的相似度;c(xi)為當(dāng)前待確認(rèn)樣本的第i個(gè)相似樣本的置信度;n為當(dāng)前待確認(rèn)樣本的相似樣本總數(shù)。
下面以關(guān)鍵詞檢索為例,對樣本確認(rèn)流程進(jìn)行說明。
例如:關(guān)鍵詞檢索時(shí),待確認(rèn)樣本集合為關(guān)鍵詞“A”的所有候選關(guān)鍵詞,如待確認(rèn)樣本集合為L={a1,a2,...,am},其中,每個(gè)元素為一個(gè)待確認(rèn)樣本(候選關(guān)鍵詞),m為待確認(rèn)樣本總數(shù),需要確認(rèn)每個(gè)待確認(rèn)樣本是否是關(guān)鍵詞“A”,每個(gè)待確認(rèn)樣本的置信度可以通過關(guān)鍵詞檢索時(shí)的解碼結(jié)果得到,具體確認(rèn)過程如下:
首先獲取待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的置信度;
然后確定待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的相似樣本;
具體可以通過計(jì)算每個(gè)待確認(rèn)樣本之間的相似度,并對所述相似度進(jìn)行規(guī)整后,設(shè)定相應(yīng)閾值或者選擇固定數(shù)目的相似樣本得到,如待確認(rèn)樣本a1的相似樣本為{a3,a6,a7,a10};
再利用每個(gè)待確認(rèn)樣本的相似樣本對每個(gè)待確認(rèn)樣本的置信度進(jìn)行修正,具體修正時(shí),根據(jù)待確認(rèn)樣本的相似樣本的置信度,以及待確認(rèn)樣本與每個(gè)相似樣本的規(guī)整后的相似度對待確認(rèn)樣本的置信度進(jìn)行修正,得到每個(gè)待確認(rèn)樣本修正后的置信度;
最后根據(jù)修正后的置信度進(jìn)行樣本確認(rèn),以判斷每個(gè)待確認(rèn)樣本是否是關(guān)鍵詞“A”,具體可以通過判斷每個(gè)待確認(rèn)樣本修正后的置信度是否超過預(yù)先設(shè)定的閾值,如果超過,則確認(rèn)成功,即待確認(rèn)樣本是關(guān)鍵詞“A”;否則,確認(rèn)失敗,即待確認(rèn)樣本不是關(guān)鍵詞“A”;
此外,本申請所述方法還可以用于說話人確認(rèn)、男女性別確認(rèn)等需要進(jìn)行樣本確認(rèn)的應(yīng)用中,具體不作限定。
具體實(shí)施時(shí),結(jié)合客戶端與服務(wù)端,給出如圖4所示的流程:
S41:客戶端接收用戶輸入的待確認(rèn)樣本。
例如,在關(guān)鍵詞檢索時(shí),接收用戶輸入的關(guān)鍵詞;或者,在說話人確認(rèn)時(shí),接收用戶輸入的語音數(shù)據(jù)。
S42:客戶端將待確認(rèn)樣本發(fā)送給服務(wù)端。
客戶端可以通過與服務(wù)端之間的網(wǎng)絡(luò)連接將待確認(rèn)樣本發(fā)送給服務(wù)端。
S43:服務(wù)端接收客戶端發(fā)送的待確認(rèn)樣本。
本實(shí)施例以服務(wù)端接收客戶端發(fā)送的待確認(rèn)樣本為例,可以理解的是,服務(wù)端還可以從服務(wù)端的數(shù)據(jù)庫或者通過網(wǎng)絡(luò)爬行獲取到待確認(rèn)樣本,或者,服務(wù)端獲取的待確認(rèn)樣本可以一部分來自客戶端,另一部分來自與服務(wù)端的數(shù)據(jù)庫或網(wǎng)絡(luò)爬行數(shù)據(jù)。
S44:服務(wù)端確定待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的相似樣本。
S45:服務(wù)端根據(jù)所述相似樣本對每個(gè)待確認(rèn)樣本的置信度進(jìn)行修正,得到每個(gè)待確認(rèn)樣本的修正后的置信度。
S46:服務(wù)端根據(jù)每個(gè)待確認(rèn)樣本的修正后的置信度對每個(gè)待確認(rèn)樣本進(jìn)行確認(rèn)。
S47:服務(wù)端根據(jù)確認(rèn)結(jié)果得到反饋結(jié)果,并將反饋結(jié)果發(fā)送給客戶端。
其中,服務(wù)端可以將確認(rèn)結(jié)果直接作為反饋結(jié)果,從而將是否成功確認(rèn)的結(jié)果發(fā)送給客戶端;或者,反饋結(jié)果可以為與目標(biāo)樣本相關(guān)的信息,比如用戶進(jìn)行關(guān)鍵詞檢索時(shí),將檢索到的關(guān)鍵詞相關(guān)信息發(fā)送給客戶端;或者,反饋結(jié)果也可以為樣本確認(rèn)成功后直接進(jìn)行的后續(xù)處理的相關(guān)信息,比如,用戶通過聲音登錄時(shí),如果確認(rèn)用戶的語音數(shù)據(jù)為目標(biāo)樣本,此時(shí)表明樣本確認(rèn)成功,則服務(wù)端可以在樣本確認(rèn)成功后直接進(jìn)行后續(xù)處理,而不需要先將樣本確認(rèn)成功信息發(fā)送給客戶端;服務(wù)端在樣本確認(rèn)成功后直接進(jìn)行后續(xù)處理后,可以將后續(xù)處理的相關(guān)信息作為反饋結(jié)果發(fā)送給客戶端,比如,上述用戶通過聲音登錄時(shí),服務(wù)端確認(rèn)用戶的語音數(shù)據(jù)為目標(biāo)樣本后,則允許用戶登錄,獲取用戶成功登錄后的個(gè)人已登錄頁面,之后服務(wù)端將個(gè)人已登錄頁面的數(shù)據(jù)發(fā)送給客戶端,以便客戶端根據(jù)接收的頁面數(shù)據(jù)進(jìn)行渲染等操作展現(xiàn)對應(yīng)的個(gè)人已登錄頁面??梢岳斫獾氖?,根據(jù)應(yīng)用場景的不同還可以是其他情況,本申請不做限定。
S48:客戶端將所述反饋結(jié)果展現(xiàn)給用戶。
上述各步驟的具體內(nèi)容可以參見相關(guān)實(shí)施例中的相關(guān)描述,在此不再詳述。
可以理解的是,上述的客戶端和服務(wù)端可以分別位于不同的物理設(shè)備中,如客戶端位于用戶側(cè)的終端設(shè)備中,服務(wù)端位于服務(wù)器中,終端設(shè)備與服務(wù)器通過網(wǎng)絡(luò)連接;或者,客戶端和服務(wù)端可以位于相同的物理設(shè)備中,例如,在終端設(shè)備中集成客戶端和服務(wù)端的功能,從而可以在終端設(shè)備本地完成樣本確認(rèn)。
本實(shí)施例中,通過確定待確認(rèn)樣本的相似樣本,并根據(jù)相似樣本對待確認(rèn)樣本的置信度進(jìn)行修正,以及根據(jù)修正后的置信度進(jìn)行樣本確認(rèn),可以有效提升樣本確認(rèn)的準(zhǔn)確度,尤其是修正前置信度在置信度閾值附近的樣本,提升效果更明顯。
圖5是本申請一個(gè)實(shí)施例提出的樣本確認(rèn)裝置的結(jié)構(gòu)示意圖。
如圖5所示,本實(shí)施例的裝置50包括:獲取模塊51、確定模塊52、修正模塊53和確認(rèn)模塊54。
獲取模塊51,用于獲取待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的置信度;
確定模塊52,用于確定待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的相似樣本;
修正模塊53,用于根據(jù)所述相似樣本對每個(gè)待確認(rèn)樣本的置信度進(jìn)行修正,得到每個(gè)待確認(rèn)樣本的修正后的置信度;
確認(rèn)模塊54,用于根據(jù)每個(gè)待確認(rèn)樣本的修正后的置信度對每個(gè)待確認(rèn)樣本進(jìn)行確認(rèn)。
一些實(shí)施例中,參見圖6,所述確定模塊52包括:
計(jì)算子模塊521,用于計(jì)算待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本與其它待確認(rèn)樣本的相似度;
確定子模塊522,用于根據(jù)每個(gè)待確認(rèn)樣本與其它待確認(rèn)樣本的相似度,確定每個(gè)待確認(rèn)樣本的相似樣本。
一些實(shí)施例中,所述確定子模塊522具體用于:
對每個(gè)待確認(rèn)樣本與其它待確認(rèn)樣本的相似度進(jìn)行規(guī)整,得到規(guī)整后的相似度;
根據(jù)規(guī)整后的相似度,確定每個(gè)待確認(rèn)樣本的相似樣本。
一些實(shí)施例中,所述確定子模塊522用于根據(jù)規(guī)整后的相似度,確定每個(gè)待確認(rèn)樣本的相似樣本,包括:
將大于預(yù)設(shè)閾值的規(guī)整后的相似度所對應(yīng)的其它待確認(rèn)樣本,確定為每個(gè)待確認(rèn)樣本的相似樣本;或者,
對規(guī)整后的相似度按照從大到小的順序排序,選擇排序在前的預(yù)設(shè)個(gè)數(shù)的規(guī)整后的相似度,將選擇的規(guī)整后的相似度所對應(yīng)的其它待確認(rèn)樣本,確定為每個(gè)待確認(rèn)的相似樣本。
一些實(shí)施例中,所述修正模塊53具體用于:
將每個(gè)待確認(rèn)樣本分別作為當(dāng)前待確認(rèn)樣本,并對應(yīng)當(dāng)前待確認(rèn)樣本執(zhí)行如下步驟:
根據(jù)當(dāng)前待確認(rèn)樣本與每個(gè)相似樣本的規(guī)整后的相似度以及每個(gè)相似樣本的置信度,計(jì)算當(dāng)前待確認(rèn)樣本的所有相似樣本的貢獻(xiàn)率;
對當(dāng)前待確認(rèn)樣本的置信度和所述貢獻(xiàn)率進(jìn)行加權(quán)求和,得到當(dāng)前待確認(rèn)樣本的修正后的置信度;
其中,所述貢獻(xiàn)率為當(dāng)前待確認(rèn)樣本的所有相似樣本的貢獻(xiàn)度與當(dāng)前待確認(rèn)樣本與所有相似樣本的規(guī)整后的相似度和的比值,所述貢獻(xiàn)度為當(dāng)前待確認(rèn)樣本與每個(gè)相似樣本的規(guī)整后的相似度與每個(gè)相似樣本的置信度的乘積和。
可以理解的是,本實(shí)施例的裝置與上述方法實(shí)施例對應(yīng),具體內(nèi)容可以參見方法實(shí)施例的相關(guān)描述,在此不再詳細(xì)說明。
本實(shí)施例中,通過確定待確認(rèn)樣本的相似樣本,并根據(jù)相似樣本對待確認(rèn)樣本的置信度進(jìn)行修正,以及根據(jù)修正后的置信度進(jìn)行樣本確認(rèn),可以有效提升樣本確認(rèn)的準(zhǔn)確度,尤其是修正前置信度在置信度閾值附近的樣本,提升效果更明顯。
圖7是本申請一個(gè)實(shí)施例提出的樣本確認(rèn)系統(tǒng)的結(jié)構(gòu)示意圖。
如圖7所示,本實(shí)施例的系統(tǒng)包括:客戶端71和服務(wù)端72。
客戶端71,用于接收用戶輸入的待確認(rèn)樣本;
服務(wù)端72,用于接收客戶端發(fā)送的待確認(rèn)樣本,獲取待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的置信度;確定待確認(rèn)樣本集合中每個(gè)待確認(rèn)樣本的相似樣本;根據(jù)所述相似樣本對每個(gè)待確認(rèn)樣本的置信度進(jìn)行修正,得到每個(gè)待確認(rèn)樣本的修正后的置信度;根據(jù)每個(gè)待確認(rèn)樣本的修正后的置信度對每個(gè)待確認(rèn)樣本進(jìn)行確認(rèn)。
一些實(shí)施例中,所述服務(wù)端72還用于:根據(jù)確認(rèn)結(jié)果獲取反饋結(jié)果,并將所述反饋結(jié)果發(fā)送給客戶端;
所述客戶端71還用于:接收所述服務(wù)端發(fā)送的反饋結(jié)果,并將所述反饋結(jié)果反饋給用戶。
圖7中以客戶端與服務(wù)端通過無線網(wǎng)絡(luò)連接為例,可以理解的是,客戶端與服務(wù)端也可以通過有線網(wǎng)絡(luò)連接,或者,如果客戶端與服務(wù)端集成在同一設(shè)備中,客戶端與服務(wù)端可以通過設(shè)備內(nèi)部的總線連接。
可以理解的是,服務(wù)端的功能與上述的裝置一致,因此,服務(wù)端的具體組成可以參見圖5或圖6所示的裝置,在此不再詳述。
本實(shí)施例中,通過確定待確認(rèn)樣本的相似樣本,并根據(jù)相似樣本對待確認(rèn)樣本的置信度進(jìn)行修正,以及根據(jù)修正后的置信度進(jìn)行樣本確認(rèn),可以有效提升樣本確認(rèn)的準(zhǔn)確度,尤其是修正前置信度在置信度閾值附近的樣本,提升效果更明顯。
可以理解的是,上述各實(shí)施例中相同或相似部分可以相互參考,在一些實(shí)施例中未詳細(xì)說明的內(nèi)容可以參見其他實(shí)施例中相同或相似的內(nèi)容。
需要說明的是,在本申請的描述中,術(shù)語“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,在本申請的描述中,除非另有說明,“多個(gè)”的含義是指至少兩個(gè)。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本申請的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本申請的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
應(yīng)當(dāng)理解,本申請的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對數(shù)據(jù)信號實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。
本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
此外,在本申請各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲在一個(gè)計(jì)算機(jī)可讀取存儲介質(zhì)中。
上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本申請的至少一個(gè)實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
盡管上面已經(jīng)示出和描述了本申請的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對本申請的限制,本領(lǐng)域的普通技術(shù)人員在本申請的范圍內(nèi)可以對上述實(shí)施例進(jìn)行變化、修改、替換和變型。