亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

文本分類的處理方法及裝置與流程

文檔序號:12719676閱讀:242來源:國知局
文本分類的處理方法及裝置與流程

本申請涉及文本處理領(lǐng)域,具體而言,涉及一種文本分類的處理方法及裝置。



背景技術(shù):

文本分類是自然語言處理的重要任務(wù)之一,類似于文章的行業(yè)分類,情感分析等許多自然語言處理任務(wù)其實質(zhì)都是文本的分類。目前,無論是基于規(guī)則還是基于機器學(xué)習(xí),處理文本分類問題的方法都有很多。通常,采用一種分類方法對文本進行分類處理,得到分類結(jié)果,輸出分類處理結(jié)果。然后僅采用一種分類方法對文本進行分類處理的準(zhǔn)確性較低。為了提升對文本進行分類的準(zhǔn)確性,相關(guān)技術(shù)中采用了一系列分類方法,旨在使用多個不太精準(zhǔn)的分類方法對文本進行分類處理,得到多個分類處理結(jié)果。然后再對每一個分類處理結(jié)果進行投票,選出最高票的分類處理結(jié)果作為輸出。這種方法在很大程度上彌補了僅僅使用一個分類方法的不足,然而無論是否有必要,該方法對于每一個輸入的文本都需要采用多個分類方法,造成對文本處理性能的下降。

針對相關(guān)技術(shù)中為了提升對文本分類的準(zhǔn)確性導(dǎo)致對文本分類的處理效率低的問題,目前尚未提出有效的解決方案。



技術(shù)實現(xiàn)要素:

本申請的主要目的在于提供一種文本分類的處理方法及裝置,以解決相關(guān)技術(shù)中為了提升對文本分類的準(zhǔn)確性導(dǎo)致對文本分類的處理效率低的問題。

為了實現(xiàn)上述目的,根據(jù)本申請的一個方面,提供了一種文本分類的處理方法。該方法包括:采用第一分類方法對待處理文本進行分類處理,得到第一待確認(rèn)文本類別和第一從屬概率,其中,第一從屬概率為根據(jù)第一分類方法判定待處理文本屬于第一待確認(rèn)文本類別的概率;根據(jù)第一從屬概率和第一歷史從屬概率計算第一目標(biāo)概率,其中,第一歷史從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第一待確認(rèn)文本類別的概率;判斷第一目標(biāo)概率是否高于預(yù)設(shè)閾值;以及當(dāng)?shù)谝荒繕?biāo)概率低于預(yù)設(shè)閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標(biāo)概率高于或等于預(yù)設(shè)閾值為止,并將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別。

進一步地,在采用第一分類方法對待處理文本進行分類處理之前,該方法還包括:確定對待處理文本進行分類處理的多種分類方法;以及獲取多種分類方法組成的分類方 法集合,其中,分類方法集合包括第一分類方法。

進一步地,根據(jù)第一從屬概率和第一歷史從屬概率計算第一目標(biāo)概率包括:將第一從屬概率和第一歷史從屬概率相乘,得到第一目標(biāo)從屬概率;將第一非從屬概率和第一歷史非從屬概率相乘,得到第一目標(biāo)非從屬概率,其中,第一非從屬概率為根據(jù)第一分類方法判定待處理文本不屬于第一待確認(rèn)文本類別的概率,第一歷史非從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本不屬于第一待確認(rèn)文本類別的概率;將第一目標(biāo)從屬概率與第一目標(biāo)非從屬概率相加,得到第一目標(biāo)子概率;以及將第一目標(biāo)從屬概率與第一目標(biāo)子概率相除,得到第一目標(biāo)概率。

進一步地,在將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別之后,該方法還包括:以最終計算出的目標(biāo)概率更新預(yù)設(shè)數(shù)據(jù)庫中存儲的與最終采用的分類方法對應(yīng)的歷史從屬概率。

進一步地,在將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別之后,該方法還包括:輸出目標(biāo)文本類別至目標(biāo)地址。

為了實現(xiàn)上述目的,根據(jù)本申請的另一方面,提供了一種文本分類的處理裝置。該裝置包括:處理單元,用于采用第一分類方法對待處理文本進行分類處理,得到第一待確認(rèn)文本類別和第一從屬概率,其中,第一從屬概率為根據(jù)第一分類方法判定待處理文本屬于第一待確認(rèn)文本類別的概率;計算單元,用于根據(jù)第一從屬概率和第一歷史從屬概率計算第一目標(biāo)概率,其中,第一歷史從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第一待確認(rèn)文本類別的概率;判斷單元,用于判斷第一目標(biāo)概率是否高于預(yù)設(shè)閾值;以及第一確定單元,用于當(dāng)?shù)谝荒繕?biāo)概率低于預(yù)設(shè)閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標(biāo)概率高于或等于預(yù)設(shè)閾值為止,并將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別。

進一步地,該裝置還包括:第二確定單元,用于確定對待處理文本進行分類處理的多種分類方法;以及獲取單元,用于獲取多種分類方法組成的分類方法集合,其中,分類方法集合包括第一分類方法。

進一步地,計算單元包括:第一計算模塊,用于將第一從屬概率和第一歷史從屬概率相乘,得到第一目標(biāo)從屬概率;第二計算模塊,用于將第一非從屬概率和第一歷史非從屬概率相乘,得到第一目標(biāo)非從屬概率,其中,第一非從屬概率為根據(jù)第一分類方法判定待處理文本不屬于第一待確認(rèn)文本類別的概率,第一歷史非從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本不屬于第一待確認(rèn)文本類別的概率;第三計算模塊,用于將第一目標(biāo)從屬概率與第一目標(biāo)非從屬概率相加,得到第一目標(biāo)子概率;以及第四計算模塊,用于將第一目標(biāo)從屬概率與第一目標(biāo)子概率相除,得到第一目標(biāo)概率。

進一步地,該裝置還包括:更新單元,用于以最終計算出的目標(biāo)概率更新預(yù)設(shè)數(shù)據(jù)庫中存儲的與最終采用的分類方法對應(yīng)的歷史從屬概率。

進一步地,該裝置還包括:輸出單元,用于輸出目標(biāo)文本類別至目標(biāo)地址。

通過本申請,采用以下步驟:采用第一分類方法對待處理文本進行分類處理,得到第一待確認(rèn)文本類別和第一從屬概率,其中,第一從屬概率為根據(jù)第一分類方法判定待處理文本屬于第一待確認(rèn)文本類別的概率;根據(jù)第一從屬概率和第一歷史從屬概率計算第一目標(biāo)概率,其中,第一歷史從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第一待確認(rèn)文本類別的概率;判斷第一目標(biāo)概率是否高于預(yù)設(shè)閾值;以及當(dāng)?shù)谝荒繕?biāo)概率低于預(yù)設(shè)閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標(biāo)概率高于或等于預(yù)設(shè)閾值為止,并將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別,解決了相關(guān)技術(shù)中為了提升對文本分類的準(zhǔn)確性導(dǎo)致對文本分類的處理效率低的問題。通過引入目標(biāo)概率,根據(jù)目標(biāo)概率確定待處理文本對應(yīng)的目標(biāo)文本類型,彌補僅使用一種分類方法處理確定目標(biāo)文本類型和有效的減少了通過不必要多次分類處理方法去確定目標(biāo)文本類型,進而達(dá)到了在提升對文本分類的準(zhǔn)確性同時也提升了對文本分類的處理效率的效果。

附圖說明

構(gòu)成本申請的一部分的附圖用來提供對本申請的進一步理解,本申請的示意性實施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。在附圖中:

圖1是根據(jù)本申請實施例的文本分類的處理方法的流程圖;以及

圖2是根據(jù)本申請實施例的文本分類的處理裝置的示意圖。

具體實施方式

需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結(jié)合實施例來詳細(xì)說明本申請。

為了使本技術(shù)領(lǐng)域的人員更好地理解本申請方案,下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分的實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應(yīng)當(dāng)屬于本申請保護的范圍。

需要說明的是,本申請的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二” 等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請的實施例。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

根據(jù)本申請的實施例,提供了一種文本分類的處理方法。

圖1是根據(jù)本申請實施例的文本分類的處理方法的流程圖。如圖1所示,該方法包括以下步驟:

步驟S101,采用第一分類方法對待處理文本進行分類處理,得到第一待確認(rèn)文本類別和第一從屬概率,其中,第一從屬概率為根據(jù)第一分類方法判定待處理文本屬于第一待確認(rèn)文本類別的概率。

可選地,在本申請實施例提供的文本分類的處理方法中,在采用第一分類方法對待處理文本進行分類處理之前,該方法還包括:確定對待處理文本進行分類處理的多種分類方法;以及獲取多種分類方法組成的分類方法集合,其中,分類方法集合包括第一分類方法。

在自然語言處理中,對于文本分類的處理方法有很多種方法,例如利用語言學(xué)規(guī)則,利用機器學(xué)習(xí)的各種分類方法,邏輯回歸、樸素貝葉斯、支持向量機、隨機森林等等多種分類方法,多種分類方法組成分類方法集合。例如,選取分類方法集合中的邏輯回歸分類方法作為第一分類方法對待處理文本進行分類,得到第一待確認(rèn)文本類別。例如,第一待確認(rèn)文本類別可以為待處理文本所屬的文本類型為情感類別。系統(tǒng)會判定采用第一分類方法對待處理文本進行分類處理得到的待處理文本所屬的文本類型為正確率的概率(即第一從屬概率)。

步驟S102,根據(jù)第一從屬概率和第一歷史從屬概率計算第一目標(biāo)概率,其中,第一歷史從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第一待確認(rèn)文本類別的概率。

可選地,在本申請實施例提供的文本分類的處理方法中,根據(jù)第一從屬概率和第一歷史從屬概率計算第一目標(biāo)概率包括:將第一從屬概率和第一歷史從屬概率相乘,得到第一目標(biāo)從屬概率;將第一非從屬概率和第一歷史非從屬概率相乘,得到第一目標(biāo)非從屬概率,其中,第一非從屬概率為根據(jù)第一分類方法判定待處理文本不屬于第一待確認(rèn)文本類別的概率,第一歷史非從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本不屬于第一待確認(rèn)文本類別的概率;將第一目標(biāo)從屬概率與第一目標(biāo)非從屬概率相加,得到第一目標(biāo)子概率;以及將第一目標(biāo)從屬概率與第一目標(biāo)子概率相除,得到第一目標(biāo)概率。

第一目標(biāo)概率為計算出的待處理文本屬于第一待確認(rèn)文本類別的概率。第一歷史從 屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第一待確認(rèn)文本類別的概率;第一從屬概率為系統(tǒng)中根據(jù)第一分類方法判定待處理文本屬于第一待確認(rèn)文本類別的概率。因此兩個條件下均認(rèn)為該待處理文本屬于第一待確認(rèn)文本類別的概率為第一歷史從屬概率與第一從屬概率的乘積。

例如,預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第一待確認(rèn)文本類別的概率為0.6(第一歷史從屬概率),即判定待處理文本不屬于第一待確認(rèn)文本類別的概率為0.4(第一歷史非從屬概率);系統(tǒng)中根據(jù)第一分類方法判定待處理文本屬于第一待確認(rèn)文本類別的概率為0.8(第一從屬概率),即系統(tǒng)判定待處理文本不屬于第一待確認(rèn)文本類別的概率為0.2(第一非從屬概率);根據(jù)以上數(shù)據(jù)計算出第一目標(biāo)概率(待處理文本屬于第一待確認(rèn)文本類別的概率)=(0.6*0.8)/(0.6*0.8+0.4*0.2)=0.857,計算出待處理文本不屬于第一待確認(rèn)文本類別的概率=(0.4*0.2)/(0.6*0.8+0.4*0.2)=0.143。

步驟S103,判斷第一目標(biāo)概率是否高于預(yù)設(shè)閾值。

預(yù)設(shè)閾值可以是用戶或者需求方根據(jù)對分類功能的滿意程度而設(shè)定的值。例如預(yù)設(shè)閾值為0.8。

步驟S104,當(dāng)?shù)谝荒繕?biāo)概率低于預(yù)設(shè)閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標(biāo)概率高于或等于預(yù)設(shè)閾值為止,并將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別。

具體地,當(dāng)?shù)谝荒繕?biāo)概率低于預(yù)設(shè)閾值時,采用第二分類方法對待處理文本進行分類處理,例如,可以采用樸素貝葉斯分類方法,得到第二待確認(rèn)文本類別和第二從屬概率,其中,第二從屬概率為根據(jù)第二分類方法判定待處理文本屬于第二待確認(rèn)文本類別的概率;根據(jù)第二從屬概率和第二歷史從屬概率計算第二目標(biāo)概率,其中,第二歷史從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第二待確認(rèn)文本類別的概率;判斷第二目標(biāo)概率是否高于預(yù)設(shè)閾值,若判斷為是,則將第二待確認(rèn)文本類別作為目標(biāo)文本類別,若判斷為否,則繼續(xù)采用非第一分類方法和第二分類方法的其他分類方法按照上面得過程對待處理文本進行分類處理,直到計算出的目標(biāo)概率高于或等于預(yù)設(shè)閾值為止,并將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別。

例如,預(yù)設(shè)閾值為0.9,上述計算出的第一目標(biāo)概率為0.857,判斷出第一目標(biāo)概率低于預(yù)設(shè)閾值,則系統(tǒng)則會認(rèn)為當(dāng)前第一待確認(rèn)文本類別中的第一待確認(rèn)文本類別不是目標(biāo)文本類型,相應(yīng)地,系統(tǒng)會采用第二分類方法(如:樸素貝葉斯分類方法)對待處理文本進行分類處理,直到計算出的目標(biāo)概率高于或等于預(yù)設(shè)閾值為止,并將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別。

如果預(yù)設(shè)閾值為0.8,上述計算出的第一目標(biāo)概率為0.857,判斷出第一目標(biāo)概率高 于預(yù)設(shè)閾值,則確定第一待確認(rèn)文本類別為待處理文本所屬的目標(biāo)文本類別。例如,確定出待處理文本所屬的文本類型為情感類。

可選地,在本申請實施例提供的文本分類的處理方法中,在將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別之后,該方法還包括:輸出目標(biāo)文本類別至目標(biāo)地址。

將待處理文本所屬的文本類型輸出至目標(biāo)地址,在目標(biāo)地址上顯示或者用戶對其進行分析處理。

可選地,在本申請實施例提供的文本分類的處理方法中,在將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別之后,該方法還包括:以最終計算出的目標(biāo)概率更新預(yù)設(shè)數(shù)據(jù)庫中存儲的與最終采用的分類方法對應(yīng)的歷史從屬概率。

通過將最終計算出的目標(biāo)概率更新預(yù)設(shè)數(shù)據(jù)庫中存儲的與最終采用的分類方法對應(yīng)的歷史從屬概率,保證了預(yù)設(shè)數(shù)據(jù)庫中存儲的歷史從屬概率的準(zhǔn)確性。

在本申請中,通過以上步驟引入了目標(biāo)概率,根據(jù)目標(biāo)概率確定待處理文本對應(yīng)的目標(biāo)文本類型,彌補僅使用一種分類方法處理確定目標(biāo)文本類型和有效的減少了通過不必要多次分類處理方法去確定目標(biāo)文本類型,進而達(dá)到了在提升對文本分類的準(zhǔn)確性同時也提升了對文本分類的處理效率的效果。

本申請實施例提供的文本分類的處理方法,通過采用第一分類方法對待處理文本進行分類處理,得到第一待確認(rèn)文本類別和第一從屬概率,其中,第一從屬概率為根據(jù)第一分類方法判定待處理文本屬于第一待確認(rèn)文本類別的概率;根據(jù)第一從屬概率和第一歷史從屬概率計算第一目標(biāo)概率,其中,第一歷史從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第一待確認(rèn)文本類別的概率;判斷第一目標(biāo)概率是否高于預(yù)設(shè)閾值;以及當(dāng)?shù)谝荒繕?biāo)概率低于預(yù)設(shè)閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標(biāo)概率高于或等于預(yù)設(shè)閾值為止,并將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別,解決了相關(guān)技術(shù)中為了提升對文本分類的準(zhǔn)確性導(dǎo)致對文本分類的處理效率低的問題。通過引入目標(biāo)概率,根據(jù)目標(biāo)概率確定待處理文本對應(yīng)的目標(biāo)文本類型,彌補僅使用一種分類方法處理確定目標(biāo)文本類型和有效的減少了通過不必要多次分類處理方法去確定目標(biāo)文本類型,進而達(dá)到了在提升對文本分類的準(zhǔn)確性同時也提升了對文本分類的處理效率的效果。

需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。

本申請實施例還提供了一種文本分類的處理裝置,需要說明的是,本申請實施例的文本分類的處理裝置可以用于執(zhí)行本申請實施例所提供的用于文本分類的處理方法。以 下對本申請實施例提供的文本分類的處理裝置進行介紹。

圖2是根據(jù)本申請實施例的文本分類的處理裝置的示意圖。如圖2所示,該裝置包括:處理單元10、計算單元20、判斷單元30和第一確定單元40。

處理單元10,用于采用第一分類方法對待處理文本進行分類處理,得到第一待確認(rèn)文本類別和第一從屬概率,其中,第一從屬概率為根據(jù)第一分類方法判定待處理文本屬于第一待確認(rèn)文本類別的概率。

計算單元20,用于根據(jù)第一從屬概率和第一歷史從屬概率計算第一目標(biāo)概率,其中,第一歷史從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第一待確認(rèn)文本類別的概率。

判斷單元30,用于判斷第一目標(biāo)概率是否高于預(yù)設(shè)閾值。

第一確定單元40,用于當(dāng)?shù)谝荒繕?biāo)概率低于預(yù)設(shè)閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標(biāo)概率高于或等于預(yù)設(shè)閾值為止,并將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別。

本申請實施例提供的文本分類的處理裝置,通過處理單元10采用第一分類方法對待處理文本進行分類處理,得到第一待確認(rèn)文本類別和第一從屬概率,其中,第一從屬概率為根據(jù)第一分類方法判定待處理文本屬于第一待確認(rèn)文本類別的概率;計算單元20根據(jù)第一從屬概率和第一歷史從屬概率計算第一目標(biāo)概率,其中,第一歷史從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第一待確認(rèn)文本類別的概率;判斷單元30判斷第一目標(biāo)概率是否高于預(yù)設(shè)閾值;以及第一確定單元40當(dāng)?shù)谝荒繕?biāo)概率低于預(yù)設(shè)閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標(biāo)概率高于或等于預(yù)設(shè)閾值為止,并將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別,解決了相關(guān)技術(shù)中為了提升對文本分類的準(zhǔn)確性導(dǎo)致對文本分類的處理效率低的問題,通過引入目標(biāo)概率,根據(jù)目標(biāo)概率確定待處理文本對應(yīng)的目標(biāo)文本類型,彌補僅使用一種分類方法處理確定目標(biāo)文本類型和有效的減少了通過不必要多次分類處理方法去確定目標(biāo)文本類型,進而達(dá)到了在提升對文本分類的準(zhǔn)確性同時也提升了對文本分類的處理效率的效果。

可選地,在本申請實施例提供的文本分類的處理裝置中,該裝置還包括:第二確定單元,用于確定對待處理文本進行分類處理的多種分類方法;以及獲取單元,用于獲取多種分類方法組成的分類方法集合,其中,分類方法集合包括第一分類方法。

可選地,在本申請實施例提供的文本分類的處理裝置中,計算單元20包括:第一計算模塊,用于將第一從屬概率和第一歷史從屬概率相乘,得到第一目標(biāo)從屬概率;第二計算模塊,用于將第一非從屬概率和第一歷史非從屬概率相乘,得到第一目標(biāo)非從屬概率,其中,第一非從屬概率為根據(jù)第一分類方法判定待處理文本不屬于第一待確認(rèn)文本 類別的概率,第一歷史非從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本不屬于第一待確認(rèn)文本類別的概率;第三計算模塊,用于將第一目標(biāo)從屬概率與第一目標(biāo)非從屬概率相加,得到第一目標(biāo)子概率;以及第四計算模塊,用于將第一目標(biāo)從屬概率與第一目標(biāo)子概率相除,得到第一目標(biāo)概率。

可選地,在本申請實施例提供的文本分類的處理裝置中,該裝置還包括:更新單元,用于以最終計算出的目標(biāo)概率更新預(yù)設(shè)數(shù)據(jù)庫中存儲的與最終采用的分類方法對應(yīng)的歷史從屬概率。

可選地,在本申請實施例提供的文本分類的處理裝置中,該裝置還包括:輸出單元,用于輸出目標(biāo)文本類別至目標(biāo)地址。

所述文本分類的處理裝置包括處理器和存儲器,上述處理單元、計算單元、判斷單元和第一確定單元等均作為程序單元存儲在存儲器中,由處理器執(zhí)行存儲在存儲器中的上述程序單元實現(xiàn)相應(yīng)功能。上述預(yù)設(shè)閾值、預(yù)設(shè)數(shù)據(jù)庫都可以存儲在存儲器中。

處理器中包含內(nèi)核,由內(nèi)核去存儲器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個或以上,通過調(diào)整內(nèi)核參數(shù)處理文本分類。

存儲器可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM),存儲器包括至少一個存儲芯片。

本申請還提供了一種計算機程序產(chǎn)品的實施例,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時,適于執(zhí)行初始化有如下方法步驟的程序代碼:采用第一分類方法對待處理文本進行分類處理,得到第一待確認(rèn)文本類別和第一從屬概率,其中,第一從屬概率為根據(jù)第一分類方法判定待處理文本屬于第一待確認(rèn)文本類別的概率;根據(jù)第一從屬概率和第一歷史從屬概率計算第一目標(biāo)概率,其中,第一歷史從屬概率為預(yù)設(shè)數(shù)據(jù)庫中存儲的待處理文本屬于第一待確認(rèn)文本類別的概率;判斷第一目標(biāo)概率是否高于預(yù)設(shè)閾值;以及當(dāng)?shù)谝荒繕?biāo)概率低于預(yù)設(shè)閾值時,依次采用與第一分類方法不同的至少一種分類方法對待處理文本進行分類處理,直到計算出的目標(biāo)概率高于或等于預(yù)設(shè)閾值為止,并將最終得到的待確認(rèn)文本類別作為目標(biāo)文本類別。

需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請并不受所描述的動作順序的限制,因為依據(jù)本申請,某些步驟可以采用其他順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本申請所必須的。

在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分, 可以參見其他實施例的相關(guān)描述。

在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的裝置,可通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。

另外,在本申請各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。

顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本申請的各模塊或各步驟可以用通用的計算裝置來實現(xiàn),它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本申請不限制于任何特定的硬件和軟件結(jié)合。

以上所述僅為本申請的優(yōu)選實施例,并不用于限制本申請,對于本領(lǐng)域的技術(shù)人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本申請的保護范圍之內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1