亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

確定目標(biāo)文本所屬業(yè)務(wù)類別的方法及裝置與流程

文檔序號(hào):12124511閱讀:305來源:國知局
本發(fā)明涉及計(jì)算機(jī)
技術(shù)領(lǐng)域
,特別涉及一種確定目標(biāo)文本所屬業(yè)務(wù)類別的方法及裝置。
背景技術(shù)
:隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,越來越多的終端已經(jīng)能夠支持語音操作,如智能手機(jī)、智能電視等終端均可以使用戶通過語音對其進(jìn)行操作。用戶通過語音對終端進(jìn)行操作時(shí),終端往往會(huì)先將接收到的語音轉(zhuǎn)換為文本,再對該文本進(jìn)行分類,以確定該文本所屬的業(yè)務(wù)類別,進(jìn)而根據(jù)該文本所屬的業(yè)務(wù)類別來進(jìn)行相應(yīng)的業(yè)務(wù)處理。相關(guān)技術(shù)中,提供的確定目標(biāo)文本所屬業(yè)務(wù)類別的方法為:獲取待處理的目標(biāo)文本,對目標(biāo)文本進(jìn)行詞法、句法和語義分析,根據(jù)分析結(jié)果來確定目標(biāo)文本所屬的業(yè)務(wù)類別。由于對目標(biāo)文本進(jìn)行詞法、句法和語義分析的操作較為復(fù)雜,因此,該文本所屬業(yè)務(wù)類別的確定過程較為繁瑣,文本所屬業(yè)務(wù)類別的確定耗時(shí)較長,文本所屬業(yè)務(wù)類別的確定效率較低。技術(shù)實(shí)現(xiàn)要素:為了解決相關(guān)技術(shù)的問題,本發(fā)明實(shí)施例提供了一種確定目標(biāo)文本所屬業(yè)務(wù)類別的方法及裝置。所述技術(shù)方案如下:一方面,提供了一種確定目標(biāo)文本所屬業(yè)務(wù)類別的方法,所述方法包括:接收待處理的目標(biāo)文本;確定所述目標(biāo)文本與指定文本之間的相似度,所述指定文本為存儲(chǔ)在文本知識(shí)庫中的已確定所屬業(yè)務(wù)類別的文本;當(dāng)所述目標(biāo)文本與所述指定文本之間的相似度大于或等于相似度閾值時(shí),將所述指定文本所屬的業(yè)務(wù)類別確定為所述目標(biāo)文本所屬的業(yè)務(wù)類別??蛇x地,所述確定所述目標(biāo)文本與指定文本之間的相似度,包括:判斷所述目標(biāo)文本包含的字符串與所述指定文本包含的字符串是否相同;當(dāng)所述目標(biāo)文本包含的字符串與所述指定文本包含的字符串相同時(shí),確定所述目標(biāo)文本與所述指定文本相同。可選地,所述確定所述目標(biāo)文本與指定文本之間的相似度,包括:獲取所述目標(biāo)文本的第一切詞結(jié)果和所述指定文本的第二切詞結(jié)果,所述第一切詞結(jié)果中包括多個(gè)第一詞語,所述第二切詞結(jié)果中包括多個(gè)第二詞語;根據(jù)所述第一切詞結(jié)果和所述第二切詞結(jié)果,確定所述目標(biāo)文本對應(yīng)的第一文本向量和所述指定文本對應(yīng)的第二文本向量,其中,所述第一文本向量用于表征所述第一切詞結(jié)果和所述第二切詞結(jié)果中的各個(gè)詞語在所述第一切詞結(jié)果中出現(xiàn)的次數(shù),所述第二文本向量用于表征所述第一切詞結(jié)果和所述第二切詞結(jié)果中的各個(gè)詞語在所述第二切詞結(jié)果中出現(xiàn)的次數(shù);計(jì)算所述第一文本向量與所述第二文本向量之間的相似度;根據(jù)所述第一文本向量與所述第二文本向量之間的相似度確定所述目標(biāo)文本與所述指定文本之間的相似度。可選地,所述確定所述目標(biāo)文本與指定文本之間的相似度,包括:獲取所述目標(biāo)文本的第一標(biāo)注結(jié)果和所述指定文本的第二標(biāo)注結(jié)果,所述第一標(biāo)注結(jié)果中包括多個(gè)第一屬性詞,所述第二標(biāo)注結(jié)果中包括多個(gè)第二屬性詞,所述第一屬性詞和所述第二屬性詞均用于指示詞語類型;根據(jù)所述第一標(biāo)注結(jié)果和所述第二標(biāo)注結(jié)果,確定所述目標(biāo)文本對應(yīng)的第一屬性向量和所述指定文本對應(yīng)的第二屬性向量,其中,所述第一屬性向量用于表征所述第一標(biāo)注結(jié)果和所述第二標(biāo)注結(jié)果中的各個(gè)屬性詞在所述第一標(biāo)注結(jié)果中出現(xiàn)的次數(shù),所述第二屬性向量用于表征所述第一標(biāo)注結(jié)果和所述第二標(biāo)注結(jié)果中的各個(gè)屬性詞在所述第二標(biāo)注結(jié)果中出現(xiàn)的次數(shù);計(jì)算所述第一屬性向量與所述第二屬性向量之間的相似度;根據(jù)所述第一屬性向量與所述第二屬性向量之間的相似度確定所述目標(biāo)文本與所述指定文本之間的相似度??蛇x地,所述獲取所述目標(biāo)文本的第一標(biāo)注結(jié)果,包括:獲取所述目標(biāo)文本的第一切詞結(jié)果,所述第一切詞結(jié)果中包括多個(gè)第一詞語;分別對所述多個(gè)第一詞語進(jìn)行類型標(biāo)注,得到多個(gè)標(biāo)注詞;去除所述多個(gè)標(biāo)注詞中的指定標(biāo)注詞,得到所述第一標(biāo)注結(jié)果??蛇x地,所述計(jì)算所述第一屬性向量與所述第二屬性向量之間的相似度,包括:獲取所述第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重;基于所述第一屬性向量和所述各個(gè)屬性詞的權(quán)重,生成第一向量,所述第一向量的第i個(gè)元素為所述第一屬性向量的第i個(gè)元素與第一權(quán)重的乘積,所述第一權(quán)重為所述第一屬性向量的第i個(gè)元素對應(yīng)的屬性詞的權(quán)重,所述第一向量的第i個(gè)元素為所述第一向量的任一元素;基于所述第二屬性向量和所述各個(gè)屬性詞的權(quán)重,生成第二向量,所述第二向量的第i個(gè)元素為所述第二屬性向量的第i個(gè)元素與第二權(quán)重的乘積,所述第二權(quán)重為所述第二屬性向量的第i個(gè)元素對應(yīng)的屬性詞的權(quán)重,所述第二向量的第i個(gè)元素為所述第二向量的任一元素;計(jì)算所述第一向量與所述第二向量之間的相似度;根據(jù)所述第一向量與所述第二向量之間的相似度確定所述第一屬性向量與所述第二屬性向量之間的相似度。另一方面,提供了一種確定目標(biāo)文本所屬業(yè)務(wù)類別的裝置,所述裝置包括:接收模塊,用于接收待處理的目標(biāo)文本;第一確定模塊,用于確定所述目標(biāo)文本與指定文本之間的相似度,所述指定文本為存儲(chǔ)在文本知識(shí)庫中的已確定所屬業(yè)務(wù)類別的文本;第二確定模塊,用于當(dāng)所述目標(biāo)文本與所述指定文本之間的相似度大于或等于相似度閾值時(shí),將所述指定文本所屬的業(yè)務(wù)類別確定為所述目標(biāo)文本所屬的業(yè)務(wù)類別??蛇x地,所述第一確定模塊包括:判斷單元,用于判斷所述目標(biāo)文本包含的字符串與所述指定文本包含的字符串是否相同;第一確定單元,用于當(dāng)所述目標(biāo)文本包含的字符串與所述指定文本包含的字符串相同時(shí),確定所述目標(biāo)文本與所述指定文本相同??蛇x地,所述第一確定模塊包括:第一獲取單元,用于獲取所述目標(biāo)文本的第一切詞結(jié)果和所述指定文本的第二切詞結(jié)果,所述第一切詞結(jié)果中包括多個(gè)第一詞語,所述第二切詞結(jié)果中包括多個(gè)第二詞語;第二確定單元,用于根據(jù)所述第一切詞結(jié)果和所述第二切詞結(jié)果,確定所述目標(biāo)文本對應(yīng)的第一文本向量和所述指定文本對應(yīng)的第二文本向量,所述第一文本向量用于表征所述第一切詞結(jié)果和所述第二切詞結(jié)果中的各個(gè)詞語在所述第一切詞結(jié)果中出現(xiàn)的次數(shù),所述第二文本向量用于表征所述第一切詞結(jié)果和所述第二切詞結(jié)果中的各個(gè)詞語在所述第二切詞結(jié)果中出現(xiàn)的次數(shù);第一計(jì)算單元,用于計(jì)算所述第一文本向量與所述第二文本向量之間的相似度;第三確定單元,用于根據(jù)所述第一文本向量與所述第二文本向量之間的相似度確定所述目標(biāo)文本與所述指定文本之間的相似度??蛇x地,所述第一確定模塊包括:第二獲取單元,用于獲取所述目標(biāo)文本的第一標(biāo)注結(jié)果和所述指定文本的第二標(biāo)注結(jié)果,所述第一標(biāo)注結(jié)果中包括多個(gè)第一屬性詞,所述第二標(biāo)注結(jié)果中包括多個(gè)第二屬性詞,所述第一屬性詞和所述第二屬性詞均用于指示詞語類型;第四確定單元,用于根據(jù)所述第一標(biāo)注結(jié)果和所述第二標(biāo)注結(jié)果,確定所述目標(biāo)文本對應(yīng)的第一屬性向量和所述指定文本對應(yīng)的第二屬性向量,所述第一屬性向量用于表征所述第一標(biāo)注結(jié)果和所述第二標(biāo)注結(jié)果中的各個(gè)屬性詞在所述第一標(biāo)注結(jié)果中出現(xiàn)的次數(shù),所述第二屬性向量用于表征所述第一標(biāo)注結(jié)果和所述第二標(biāo)注結(jié)果中的各個(gè)屬性詞在所述第二標(biāo)注結(jié)果中出現(xiàn)的次數(shù);第二計(jì)算單元,用于計(jì)算所述第一屬性向量與所述第二屬性向量之間的相似度;第五確定單元,用于根據(jù)所述第一屬性向量與所述第二屬性向量之間的相似度確定所述目標(biāo)文本與所述指定文本之間的相似度??蛇x地,所述第二獲取單元包括:第一獲取子單元,用于獲取所述目標(biāo)文本的第一切詞結(jié)果,所述第一切詞結(jié)果中包括多個(gè)第一詞語;標(biāo)注子單元,用于分別對所述多個(gè)第一詞語進(jìn)行類型標(biāo)注,得到多個(gè)標(biāo)注詞;去除子單元,用于去除所述多個(gè)標(biāo)注詞中的指定標(biāo)注詞,得到所述第一標(biāo)注結(jié)果??蛇x地,所述第二計(jì)算單元包括:第二獲取子單元,用于獲取所述第一標(biāo)注結(jié)果和所述第二標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重;第一生成子單元,用于基于所述第一屬性向量和所述各個(gè)屬性詞的權(quán)重,生成第一向量,所述第一向量的第i個(gè)元素為所述第一屬性向量的第i個(gè)元素與第一權(quán)重的乘積,所述第一權(quán)重為所述第一屬性向量的第i個(gè)元素對應(yīng)的屬性詞的權(quán)重,所述第一向量的第i個(gè)元素為所述第一向量的任一元素;第二生成子單元,用于基于所述第二屬性向量和所述各個(gè)屬性詞的權(quán)重,生成第二向量,所述第二向量的第i個(gè)元素為所述第二屬性向量的第i個(gè)元素與第二權(quán)重的乘積,所述第二權(quán)重為所述第二屬性向量的第i個(gè)元素對應(yīng)的屬性詞的權(quán)重,所述第二向量的第i個(gè)元素為所述第二向量的任一元素;計(jì)算子單元,用于計(jì)算所述第一向量與所述第二向量之間的相似度;確定子單元,用于根據(jù)所述第一向量與所述第二向量之間的相似度確定所述第一屬性向量與所述第二屬性向量之間的相似度。本發(fā)明實(shí)施例提供的技術(shù)方案帶來的有益效果是:在本發(fā)明實(shí)施例中,接收待處理的目標(biāo)文本后,可以確定目標(biāo)文本與指定文本之間的相似度,并當(dāng)目標(biāo)文本與指定文本之間的相似度大于或等于相似度閾值時(shí),可以將指定文本所屬的業(yè)務(wù)類別確定為目標(biāo)文本所屬的業(yè)務(wù)類別,也即是,本發(fā)明僅利用該文本知識(shí)庫中已經(jīng)分類好的指定文本,即可簡單快速地完成對目標(biāo)文本的分類,從而相比于相關(guān)技術(shù)中需要對目標(biāo)文本進(jìn)行詞法、句法和語義分析的繁瑣分類過程,本發(fā)明可以大大節(jié)省文本所屬業(yè)務(wù)類別的確定時(shí)間,提高文本所屬業(yè)務(wù)類別的確定效率。附圖說明為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施例提供的一種確定目標(biāo)文本所屬業(yè)務(wù)類別的方法的流程圖;圖2是本發(fā)明實(shí)施例提供的一種確定目標(biāo)文本所屬業(yè)務(wù)類別流程的示意圖;圖3A是本發(fā)明實(shí)施例提供的一種確定目標(biāo)文本所屬業(yè)務(wù)類別的裝置的結(jié)構(gòu)示意圖;圖3B是本發(fā)明實(shí)施例提供的一種第一確定模塊的結(jié)構(gòu)示意圖;圖3C是本發(fā)明實(shí)施例提供的另一種第一確定模塊的結(jié)構(gòu)示意圖;圖3D是本發(fā)明實(shí)施例提供的又一種第一確定模塊的結(jié)構(gòu)示意圖。具體實(shí)施方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。在對本發(fā)明實(shí)施例進(jìn)行詳細(xì)地解釋說明之前,先對本發(fā)明實(shí)施例的應(yīng)用場景予以說明。本發(fā)明實(shí)施例提供的確定目標(biāo)文本所屬業(yè)務(wù)類別的方法應(yīng)用于終端中,該終端可以為計(jì)算機(jī)、平板電腦、PDA(PersonalDigitalAssistant,個(gè)人數(shù)字助理)、智能手機(jī)、智能電視等,本發(fā)明實(shí)施例對此不做具體限定。進(jìn)一步地,該終端至少具有語音操作功能,用于接收用戶輸入的語音,并基于該語音執(zhí)行相應(yīng)的操作。圖1是本發(fā)明實(shí)施例提供的一種確定目標(biāo)文本所屬業(yè)務(wù)類別的方法流程圖,該方法用于終端中。參見圖1,該方法包括:步驟101:接收待處理的目標(biāo)文本。在進(jìn)行語音操作時(shí),終端往往需要對用戶輸入的語音進(jìn)行分析,以理解用戶意圖,進(jìn)而執(zhí)行相應(yīng)的操作。而在對用戶輸入的語音進(jìn)行分析時(shí),終端通常會(huì)先將該語音轉(zhuǎn)換為文本,再對該文本進(jìn)行分類處理,以便后續(xù)基于分類結(jié)果來進(jìn)行相應(yīng)的業(yè)務(wù)處理,此時(shí)該待處理的文本即是目標(biāo)文本。因此,終端在接收待處理的目標(biāo)文本時(shí),可以在檢測到語音操作指令后,接收輸入的語音,將該語音轉(zhuǎn)換為文本,并將該文本確定為目標(biāo)文本。需要說明的是,語音操作指令用于指示進(jìn)行語音操作,且該語音操作指令可以由用戶觸發(fā),該用戶可以通過指定操作觸發(fā),指定操作可以為單擊操作、雙擊操作、滑動(dòng)操作等。另外,將該語音轉(zhuǎn)換為文本時(shí),可以通過語音文本轉(zhuǎn)換程序或者安裝的語音文本轉(zhuǎn)換軟件等來進(jìn)行轉(zhuǎn)換,本發(fā)明實(shí)施例對此不做具體限定。需要說明的是,實(shí)際應(yīng)用中,終端不僅可以將由輸入的語音轉(zhuǎn)換為的文本確定為目標(biāo)文本,當(dāng)然,也可以將其它文本確定為目標(biāo)文本,如可以將由通過物理鍵盤、虛擬鍵盤、觸摸屏等直接輸入的文本確定為目標(biāo)文本,或者,可以將其它設(shè)備通過網(wǎng)絡(luò)發(fā)送的待處理文本確定為目標(biāo)文本等,本發(fā)明實(shí)施例對此不做具體限定。步驟102:確定目標(biāo)文本與指定文本之間的相似度,指定文本為存儲(chǔ)在文本知識(shí)庫中的已確定所屬業(yè)務(wù)類別的文本。需要說明的是,文本知識(shí)庫中存儲(chǔ)的均為已確定所屬業(yè)務(wù)類別的指定文本,該業(yè)務(wù)類別可以包括看視頻、聽音樂、查節(jié)目單、查天氣等。另外,在構(gòu)建該文本知識(shí)庫時(shí),可以在使用詞法、句法和語義分析的理解系統(tǒng)運(yùn)行一段時(shí)間后,將該理解系統(tǒng)已經(jīng)理解的文本,即已確定所屬業(yè)務(wù)類別的文本直接添加到該文本知識(shí)庫中。當(dāng)然,也可以由終端自動(dòng)或用戶手動(dòng)對這些已經(jīng)理解的文本進(jìn)行篩選,從中選取質(zhì)量較好的文本添加到該文本知識(shí)庫中,該質(zhì)量較好的文本可以為不包含過多的語氣詞、停用詞等的文本。用戶在進(jìn)行相似的業(yè)務(wù)操作時(shí),其輸入的文本的相似度通常會(huì)比較高,例如,用戶第一次觀看劉德華的電影賭神時(shí),輸入的文本是“幫我播放劉德華的電影賭神”,進(jìn)而進(jìn)入看視頻的業(yè)務(wù)類別;當(dāng)用戶再一次想看劉德華的電影賭神時(shí),根據(jù)其輸入習(xí)慣,輸入的文本很有可能是“幫我播放劉德華的電影賭神”,或者當(dāng)用戶想看劉德華的電影天下無賊時(shí),根據(jù)其輸入習(xí)慣,輸入的文本很有可能是“幫我播放劉德華的電影天下無賊”,則此時(shí)可以不對該輸入的文本進(jìn)行句法、語法和語義分析,即可確定該文本所屬的業(yè)務(wù)類別為看視頻。也即是,本發(fā)明實(shí)施例在確定目標(biāo)文本所屬的業(yè)務(wù)類別時(shí),可以不對目標(biāo)文本進(jìn)行句法、語法和語義分析,只需確定目標(biāo)文本與指定文本之間的相似度,進(jìn)而根據(jù)該相似度即可確定目標(biāo)文本所屬的業(yè)務(wù)類別。其中,確定目標(biāo)文本與指定文本之間的相似度的操作可以通過如下三種方式來實(shí)現(xiàn)。第一種方式:判斷目標(biāo)文本包含的字符串與指定文本包含的字符串是否相同;當(dāng)目標(biāo)文本包含的字符串與指定文本包含的字符串相同時(shí),確定目標(biāo)文本與指定文本相同。需要說明的是,上述第一種方式可以由文本字符匹配模塊來執(zhí)行,本發(fā)明實(shí)施例對此不做具體限定。值得說明的是,上述第一種方式僅需比對字符串是否相同即可確定目標(biāo)文本與指定文本之間的相似度,該確定過程簡單方便,確定效率較高。另外,確定目標(biāo)文本與指定文本相同,即是確定目標(biāo)文本與指定文本之間的相似度達(dá)到最高值,如當(dāng)相似度在0到1之間時(shí),目標(biāo)文本與指定文本相同即是指目標(biāo)文本與指定文本之間的相似度為1;當(dāng)相似度在0-2之間時(shí),目標(biāo)文本與指定文本相同即是指目標(biāo)文本與指定文本之間的相似度為2。再者,判斷目標(biāo)文本包含的字符串與指定文本包含的字符串是否相同的操作與相關(guān)技術(shù)中判斷某兩個(gè)字符串是否相同的操作類似,本發(fā)明實(shí)施例對此不進(jìn)行詳細(xì)闡述。例如,目標(biāo)文本為“切換到湖南衛(wèi)視”,指定文本為“切換到湖南衛(wèi)視”,則可以確定目標(biāo)文本包含的字符串與指定文本包含的字符串相同,確定目標(biāo)文本與指定文本相同。第二種方式:獲取目標(biāo)文本的第一切詞結(jié)果和指定文本的第二切詞結(jié)果,第一切詞結(jié)果中包括多個(gè)第一詞語,第二切詞結(jié)果中包括多個(gè)第二詞語;根據(jù)第一切詞結(jié)果和第二切詞結(jié)果,確定目標(biāo)文本對應(yīng)的第一文本向量和指定文本對應(yīng)的第二文本向量,其中,第一文本向量用于表征第一切詞結(jié)果和第二切詞結(jié)果中的各個(gè)詞語在第一切詞結(jié)果中出現(xiàn)的次數(shù),第二文本向量用于表征第一切詞結(jié)果和第二切詞結(jié)果中的各個(gè)詞語在第二切詞結(jié)果中出現(xiàn)的次數(shù);計(jì)算第一文本向量與第二文本向量之間的相似度;根據(jù)第一文本向量與第二文本向量之間的相似度確定目標(biāo)文本與指定文本之間的相似度。需要說明的是,上述第二種方式可以由文本相似度計(jì)算模塊來執(zhí)行,本發(fā)明實(shí)施例對此不做具體限定。值得說明的是,上述第二種方式根據(jù)第一文本向量與第二文本向量之間的相似度確定目標(biāo)文本與指定文本之間的相似度,該確定過程簡單易行,耗時(shí)較短,且可以較為準(zhǔn)確地得到目標(biāo)文本與指定文本之間的相似度。其中,獲取目標(biāo)文本的第一切詞結(jié)果時(shí),可以對目標(biāo)文本進(jìn)行切詞,得到多個(gè)第一詞語,該多個(gè)第一詞語即為目標(biāo)文本的第一切詞結(jié)果。且對目標(biāo)文本進(jìn)行切詞時(shí),可以使用字典、詞庫匹配的切詞方法,或者使用基于詞頻統(tǒng)計(jì)的切詞方法,或者使用基于知識(shí)理解的切詞方法等來對目標(biāo)文本進(jìn)行切詞,本發(fā)明實(shí)施例對此不做具體限定。例如,目標(biāo)文本為“我要聽劉德華的忘情水”,則可以對目標(biāo)文本進(jìn)行切詞,得到多個(gè)第一詞語為我要、聽、劉德華、的、忘情水,此時(shí)目標(biāo)文本的第一切詞結(jié)果即可表示為[我要,聽,劉德華,的,忘情水]。其中,獲取指定文本的第二切詞結(jié)果時(shí),可以從該文本知識(shí)庫中直接獲取指定文本的第二切詞結(jié)果;或者,可以對指定文本進(jìn)行切詞,得到多個(gè)第二詞語,該多個(gè)第二詞語即為指定文本的第二切詞結(jié)果,本發(fā)明實(shí)施例對此不做具體限定。需要說明的是,該文本知識(shí)庫中存儲(chǔ)的指定文本是基于使用詞法、句法和語義分析的理解系統(tǒng)已經(jīng)理解的文本確定得到的,由于在該理解系統(tǒng)理解文本的過程中會(huì)對文本進(jìn)行切詞,因此,在將該已經(jīng)理解的文本添加到該文本知識(shí)庫中時(shí),可以直接將該文本的切詞結(jié)果也對應(yīng)添加到該文本知識(shí)庫中,以便后續(xù)能夠從該文本知識(shí)庫中直接獲取指定文本的第二切詞結(jié)果。其中,根據(jù)第一切詞結(jié)果和第二切詞結(jié)果,確定目標(biāo)文本對應(yīng)的第一文本向量和指定文本對應(yīng)的第二文本向量時(shí),可以確定第一切詞結(jié)果和第二切詞結(jié)果中的各個(gè)詞語在第一切詞結(jié)果中出現(xiàn)的次數(shù),并確定該各個(gè)詞語在第二切詞結(jié)果中出現(xiàn)的次數(shù);基于該各個(gè)詞語在第一切詞結(jié)果中出現(xiàn)的次數(shù),生成第一文本向量;基于該各個(gè)詞語在第二切詞結(jié)果中出現(xiàn)的次數(shù),生成第二文本向量。例如,第一切詞結(jié)果為[我要,聽,劉德華,的,忘情水],第二切詞結(jié)果為[我想,聽,劉德華,的,忘情水],則可知第一切詞結(jié)果和第二切詞結(jié)果中的各個(gè)詞語分別為我要、我想、聽、劉德華、的、忘情水。之后,可以基于該各個(gè)詞語在第一切詞結(jié)果中出現(xiàn)的次數(shù),生成第一文本向量為[1,0,1,1,1,1],基于該各個(gè)詞語在第二切詞結(jié)果中出現(xiàn)的次數(shù),生成第二文本向量為[0,1,1,1,1,1]。其中,計(jì)算第一文本向量與第二文本向量之間的相似度時(shí),可以基于第一文本向量和第二文本向量,通過如下指定公式得到第一文本向量與第二文本向量之間的相似度;指定公式:需要說明的是,cosθ為第一文本向量與第二文本向量之間的相似度,A為第一文本向量,Ak為第一文本向量A的第k個(gè)元素,B為第二文本向量,Bk為第二文本向量B的第k個(gè)元素,k不小于1且不大于n,n為第一文本向量A或第二文本向量B的維數(shù),第一文本向量A的維數(shù)與第二文本向量B的維數(shù)相等。還需要說明的是,實(shí)際應(yīng)用中也可以通過其它方式計(jì)算第一文本向量與第二文本向量之間的相似度,如可以將第一文本向量與第二文本向量之間的歐幾里得距離、曼哈頓距離、馬哈拉諾比斯距離等確定為第一文本向量與第二文本向量之間的相似度,本發(fā)明實(shí)施例對此不做具體限定。其中,根據(jù)第一文本向量與第二文本向量之間的相似度確定目標(biāo)文本與指定文本之間的相似度時(shí),可以將第一文本向量與第二文本向量之間的相似度直接確定為目標(biāo)文本與指定文本之間的相似度;或者,可以將第一文本向量與第二文本向量之間的相似度與指定數(shù)值相乘,得到目標(biāo)文本與指定文本之間的相似度,本發(fā)明實(shí)施例對此不做具體限定。需要說明的是,指定數(shù)值可以預(yù)先設(shè)置,且指定數(shù)值可以為大于0的數(shù)值,如指定數(shù)值可以為1.5、2等。第三種方式:獲取目標(biāo)文本的第一標(biāo)注結(jié)果和獲取指定文本的第二標(biāo)注結(jié)果,第一標(biāo)注結(jié)果中包括多個(gè)第一屬性詞,第二標(biāo)注結(jié)果中包括多個(gè)第二屬性詞,第一屬性詞和第二屬性詞均用于指示詞語類型;基于第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果,確定目標(biāo)文本對應(yīng)的第一屬性向量和指定文本對應(yīng)的第二屬性向量,第一屬性向量用于表征第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中的各個(gè)屬性詞在第一標(biāo)注結(jié)果中出現(xiàn)的次數(shù),第二屬性向量用于表征第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中的各個(gè)屬性詞在第二標(biāo)注結(jié)果中出現(xiàn)的次數(shù);計(jì)算第一屬性向量與第二屬性向量之間的相似度;根據(jù)第一屬性向量與第二屬性向量之間的相似度確定目標(biāo)文本與指定文本之間的相似度。需要說明的是,上述第三種方式可以由屬性相似度計(jì)算模塊來執(zhí)行,本發(fā)明實(shí)施例對此不做具體限定。值得說明的是,上述第三種方式根據(jù)第一屬性向量與第二屬性向量之間的相似度確定目標(biāo)文本與指定文本之間的相似度,從而強(qiáng)化了文本的屬性信息,弱化了文本的原始信息,進(jìn)而提高了確定目標(biāo)文本與指定文本之間的相似度的效率。其中,獲取目標(biāo)文本的第一標(biāo)注結(jié)果時(shí),可以獲取目標(biāo)文本的第一切詞結(jié)果,第一切詞結(jié)果中包括多個(gè)第一詞語;分別對該多個(gè)第一詞語進(jìn)行類型標(biāo)注,得到多個(gè)標(biāo)注詞;去除該多個(gè)標(biāo)注詞中的指定標(biāo)注詞,得到第一標(biāo)注結(jié)果。需要說明的是,指定標(biāo)注詞可以預(yù)先設(shè)置,且指定標(biāo)注詞可以為沒有實(shí)際意義的詞,如指定標(biāo)注詞可以為語氣詞、停用詞等。另外,實(shí)際應(yīng)用中,可以將某一文本的標(biāo)注結(jié)果以第一指定形式組成一個(gè)新文本,該組成的新文本可以稱為該文本的第一加工文本。如可以將第一標(biāo)注結(jié)果以第一指定形式組成目標(biāo)文本的第一加工文本,將第二標(biāo)注結(jié)果以第一指定形式組成指定文本的第一加工文本。再者,第一指定形式可以預(yù)先設(shè)置,如第一指定形式可以為“屬性詞1,屬性詞2,……屬性詞m”、“屬性詞1;屬性詞2;……屬性詞m”等。其中,分別對該多個(gè)第一詞語進(jìn)行類型標(biāo)注,得到多個(gè)標(biāo)注詞時(shí),對于該多個(gè)第一詞語中的每個(gè)第一詞語,可以基于第一詞語,從存儲(chǔ)的詞語與類型之間的對應(yīng)關(guān)系中,獲取對應(yīng)的類型,將獲取的類型確定為第一詞語的標(biāo)注詞。當(dāng)然,也可以通過其它方式分別對該多個(gè)第一詞語進(jìn)行類型標(biāo)注,得到多個(gè)標(biāo)注詞,本發(fā)明實(shí)施例對此不做具體限定。例如,第一詞語為劉德華,則可以基于第一詞語劉德華,從如下表1所示的詞語與類型之間的對應(yīng)關(guān)系中,獲取對應(yīng)的類型為歌手,將歌手確定為劉德華的標(biāo)注詞。表1詞語類型劉德華歌手忘情水歌名…………需要說明的是,本發(fā)明實(shí)施例中,僅以上述表1所示的詞語與類型之間的對應(yīng)關(guān)系為例進(jìn)行說明,上述表1并不對本發(fā)明實(shí)施例構(gòu)成限定。其中,獲取指定文本的第二標(biāo)注結(jié)果時(shí),可以從該文本知識(shí)庫中獲取指定文本的第一加工文本,并從指定文本的第一加工文本中獲取第二標(biāo)注結(jié)果;或者可以獲取指定文本的第二切詞結(jié)果,第二切詞結(jié)果中包括多個(gè)第二詞語,分別對該多個(gè)第二詞語進(jìn)行類型標(biāo)注,得到多個(gè)標(biāo)注詞,去除該多個(gè)標(biāo)注詞中的指定標(biāo)注詞,得到第二標(biāo)注結(jié)果。需要說明的是,該文本知識(shí)庫中存儲(chǔ)的指定文本是基于使用詞法、句法和語義分析的理解系統(tǒng)已經(jīng)理解的文本確定得到的,由于在該理解系統(tǒng)理解文本的過程中會(huì)獲得該文本的多個(gè)標(biāo)注詞,因此,在將該已經(jīng)理解的文本添加到該文本知識(shí)庫中時(shí),可以先將該文本的多個(gè)標(biāo)注詞去除指定標(biāo)注詞后得到該文本的標(biāo)注結(jié)果,再將該文本的標(biāo)注結(jié)果組成該文本的第一加工文本,將該文本的第一加工文本對應(yīng)添加到該文本知識(shí)庫中,以便后續(xù)能夠基于該文本知識(shí)庫中存儲(chǔ)的指定文本的第一加工文本,直接獲取指定文本的第二標(biāo)注結(jié)果。其中,根據(jù)第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果,確定目標(biāo)文本對應(yīng)的第一屬性向量和指定文本對應(yīng)的第二屬性向量時(shí),可以確定第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中的各個(gè)屬性詞在第一標(biāo)注結(jié)果中出現(xiàn)的次數(shù),并確定該各個(gè)屬性詞在第二標(biāo)注結(jié)果中出現(xiàn)的次數(shù);基于該各個(gè)屬性詞在第一標(biāo)注結(jié)果中出現(xiàn)的次數(shù),生成第一屬性向量;基于該各個(gè)屬性詞在第二標(biāo)注結(jié)果中出現(xiàn)的次數(shù),生成第二屬性向量。例如,第一標(biāo)注結(jié)果為[動(dòng)詞聽,歌手,歌名],第二標(biāo)注結(jié)果為[動(dòng)詞放,歌手,歌名],則可知第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中的各個(gè)屬性詞分別為動(dòng)詞聽、動(dòng)詞放、歌手、歌名。之后,可以基于該各個(gè)屬性詞在第一標(biāo)注結(jié)果中出現(xiàn)的次數(shù),生成第一屬性向量為[1,0,1,1],基于該各個(gè)屬性詞在第二標(biāo)注結(jié)果中出現(xiàn)的次數(shù),生成第二屬性向量為[0,1,1,1]。其中,計(jì)算第一屬性向量與第二屬性向量之間的相似度時(shí),可以將第一屬性向量與第二屬性向量之間的余弦相似度、歐幾里得距離、曼哈頓距離、馬哈拉諾比斯距離等確定為第一屬性向量與第二屬性向量之間的相似度;或者可以獲取第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中的各個(gè)屬性詞的權(quán)重,基于第一屬性向量、第二屬性向量和該各個(gè)屬性詞的權(quán)重,確定第一屬性向量與第二屬性向量之間的相似度。需要說明的是,實(shí)際應(yīng)用中,不僅可以將某一文本的標(biāo)注結(jié)果以第一指定形式組成該文本的第一加工文本,還可以將該文本的標(biāo)注結(jié)果和該標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重以第二指定形式組成該文本的第二加工文本。如可以將第一標(biāo)注結(jié)果和第一標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重以第二指定形式組成目標(biāo)文本的第二加工文本,將第二標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重組成指定文本的第二加工文本。另外,第二指定形式可以預(yù)先設(shè)置,如第二指定形式可以為“屬性詞1_權(quán)重1,屬性詞2_權(quán)重2,……屬性詞m_權(quán)重m”、“屬性詞1_權(quán)重1;屬性詞2_權(quán)重2;……屬性詞m_權(quán)重m”等。其中,獲取第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重時(shí),對于第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中的每個(gè)屬性詞,可以基于該屬性詞,從存儲(chǔ)的屬性詞與權(quán)重之間的對應(yīng)關(guān)系中,獲取對應(yīng)的權(quán)重,該獲取的權(quán)重即為該屬性詞的權(quán)重。當(dāng)然,也可以通過其它方式獲取第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重,本發(fā)明實(shí)施例對此不做具體限定。例如,該屬性詞為歌手,則可以基于該屬性詞歌手,從如下表2所示的屬性詞與權(quán)重之間的對應(yīng)關(guān)系中,獲取對應(yīng)的權(quán)重為1,該1即為歌手的權(quán)重。表2屬性詞權(quán)重歌手1歌名1…………需要說明的是,本發(fā)明實(shí)施例中,僅以上述表2所示的屬性詞與權(quán)重之間的對應(yīng)關(guān)系為例進(jìn)行說明,上述表2并不對本發(fā)明實(shí)施例構(gòu)成限定。其中,獲取第二標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重時(shí),還可以從該文本知識(shí)庫中獲取指定文本的第二加工文本,并從指定文本的第二加工文本中獲取第二標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重。需要說明的是,該文本知識(shí)庫中存儲(chǔ)的指定文本是基于使用詞法、句法和語義分析的理解系統(tǒng)已經(jīng)理解的文本確定得到的,由于在該理解系統(tǒng)理解文本的過程中會(huì)獲得該文本的多個(gè)標(biāo)注詞,因此,在將該已經(jīng)理解的文本添加到該文本知識(shí)庫中時(shí),可以先將該文本的多個(gè)標(biāo)注詞去除指定標(biāo)注詞后得到該文本的標(biāo)注結(jié)果,再獲取該文本的標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重,將該各個(gè)屬性詞和該各個(gè)屬性詞的權(quán)重組成該文本的第二加工文本,將該文本的第二加工文本對應(yīng)添加到該文本知識(shí)庫中,以便后續(xù)能夠基于該文本知識(shí)庫中存儲(chǔ)的指定文本的第二加工文本,直接獲取指定文本的第二標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重。其中,基于第一屬性向量、第二屬性向量和該各個(gè)屬性詞的權(quán)重,確定第一屬性向量與第二屬性向量之間的相似度時(shí),可以基于第一屬性向量和該各個(gè)屬性詞的權(quán)重,生成第一向量,第一向量的第i個(gè)元素為第一屬性向量的第i個(gè)元素與第一權(quán)重的乘積,第一權(quán)重為第一屬性向量的第i個(gè)元素對應(yīng)的屬性詞的權(quán)重,第一向量的第i個(gè)元素為第一向量的任一元素;基于第二屬性向量和該各個(gè)屬性詞的權(quán)重,生成第二向量,第二向量的第i個(gè)元素為第二屬性向量的第i個(gè)元素與第二權(quán)重的乘積,第二權(quán)重為第二屬性向量的第i個(gè)元素對應(yīng)的屬性詞的權(quán)重,第二向量的第i個(gè)元素為第二向量的任一元素;計(jì)算第一向量與第二向量之間的相似度;根據(jù)第一向量與第二向量之間的相似度確定第一屬性向量與第二屬性向量之間的相似度。需要說明的是,當(dāng)?shù)谝粚傩韵蛄康牡趇個(gè)元素為某個(gè)屬性詞在第一標(biāo)注結(jié)果中出現(xiàn)的次數(shù)時(shí),該屬性詞即為第一屬性向量的第i個(gè)元素對應(yīng)的屬性詞。當(dāng)?shù)诙傩韵蛄康牡趇個(gè)元素為某個(gè)屬性詞在第二標(biāo)注結(jié)果中出現(xiàn)的次數(shù)時(shí),該屬性詞即為第二屬性向量的第i個(gè)元素對應(yīng)的屬性詞。另外,本發(fā)明實(shí)施例根據(jù)第一向量與第二向量之間的相似度確定第一屬性向量與第二屬性向量之間的相似度,即是將屬性詞和該屬性詞的權(quán)重結(jié)合起來作為依據(jù)來確定目標(biāo)文本與指定文本之間的相似度,從而強(qiáng)化了文本的關(guān)鍵屬性,弱化了文本的非關(guān)鍵屬性,進(jìn)而提高了確定目標(biāo)文本與指定文本之間相似度的效率和準(zhǔn)確率。其中,基于第一屬性向量和該各個(gè)屬性詞的權(quán)重,生成第一向量時(shí),可以將第一屬性向量的第i個(gè)元素與第一權(quán)重的乘積確定為第一向量的第i個(gè)元素;判斷i與第一屬性向量的維數(shù)是否相等;當(dāng)i與第一屬性向量的維數(shù)不相等時(shí),令i=i+1,返回將第一屬性向量的第i個(gè)元素與第一權(quán)重的乘積確定為第一向量的第i個(gè)元素的步驟,直至i與第一屬性向量的維數(shù)相等為止,即可得到第一向量的所有元素。需要說明的是,上述基于第一屬性向量和該各個(gè)屬性詞的權(quán)重,生成第一向量的操作還可以基于權(quán)重向量實(shí)現(xiàn),具體地,可以基于第一屬性向量的各個(gè)元素對應(yīng)的屬性詞的權(quán)重,生成第一權(quán)重向量,第一權(quán)重向量的第i個(gè)元素為第一屬性向量的第i個(gè)元素對應(yīng)的屬性詞的權(quán)重,第一權(quán)重向量的第i個(gè)元素為第一權(quán)重向量的任一元素;將第一屬性向量的第i個(gè)元素與第一權(quán)重向量的第i個(gè)元素的乘積確定為第一向量的第i個(gè)元素;判斷i與第一屬性向量的維數(shù)是否相等;當(dāng)i與第一屬性向量的維數(shù)不相等時(shí),令i=i+1,返回將第一屬性向量的第i個(gè)元素與第一權(quán)重向量的第i個(gè)元素的乘積確定為第一向量的第i個(gè)元素的步驟,直至i與第一屬性向量的維數(shù)相等為止,即可得到第一向量的所有元素。例如,第一屬性向量為[1,0,1,1],第一屬性向量的第1個(gè)元素對應(yīng)的屬性詞的權(quán)重為0.8,第一屬性向量的第2個(gè)元素對應(yīng)的屬性詞的權(quán)重為0.7,第一屬性向量的第3個(gè)元素對應(yīng)的屬性詞的權(quán)重為1,第一屬性向量的第4個(gè)元素對應(yīng)的屬性詞的權(quán)重為1,則可以基于第一屬性向量的各個(gè)元素對應(yīng)的屬性詞的權(quán)重,生成第一權(quán)重向量為[0.8,0.7,1,1],之后,可以基于第一屬性向量[1,0,1,1]和第一權(quán)重向量[0.8,0.7,1,1],生成第一向量為[0.8,0,1,1]。其中,基于第二屬性向量和該各個(gè)屬性詞的權(quán)重,生成第二向量的操作與上述基于第一屬性向量和該各個(gè)屬性詞的權(quán)重,生成第一向量的操作類似,本發(fā)明實(shí)施例對此不再贅述。其中,計(jì)算第一向量與第二向量之間的相似度時(shí),可以將第一向量與第二向量之間的余弦相似度、歐幾里得距離、曼哈頓距離、馬哈拉諾比斯距離等確定為第一屬性向量與第二屬性向量之間的相似度,本發(fā)明實(shí)施例對此不做具體限定。其中,根據(jù)第一向量與第二向量之間的相似度確定第一屬性向量與第二屬性向量之間的相似度時(shí),可以將第一向量與第二向量之間的相似度直接確定第一屬性向量與第二屬性向量之間的相似度;或者,可以將第一向量與第二向量之間的相似度與指定數(shù)值相乘,得到第一屬性向量與第二屬性向量之間的相似度,本發(fā)明實(shí)施例對此不做具體限定。其中,根據(jù)第一屬性向量與第二屬性向量之間的相似度確定目標(biāo)文本與指定文本之間的相似度時(shí),可以將第一屬性向量與第二屬性向量之間的相似度直接確定為目標(biāo)文本與指定文本之間的相似度;或者,可以將第一屬性向量與第二屬性向量之間的相似度與指定數(shù)值相乘,得到目標(biāo)文本與指定文本之間的相似度,本發(fā)明實(shí)施例對此不做具體限定。步驟103:當(dāng)目標(biāo)文本與指定文本之間的相似度大于或等于相似度閾值時(shí),將指定文本所屬的業(yè)務(wù)類別確定為目標(biāo)文本所屬的業(yè)務(wù)類別。由于當(dāng)目標(biāo)文本與指定文本之間的相似度大于或等于相似度閾值時(shí),表明目標(biāo)文本與指定文本的文本信息較為接近,因此,此時(shí)可以將指定文本所屬的業(yè)務(wù)類別確定為目標(biāo)文本所屬的業(yè)務(wù)類別。需要說明的是,相似度閾值可以預(yù)先設(shè)置,如相似度閾值可以為0.8、0.9等。需要說明的是,實(shí)際應(yīng)用中,還可以將步驟102中的三種方式結(jié)合起來實(shí)現(xiàn)本發(fā)明所提供的確定目標(biāo)文本所屬業(yè)務(wù)類別的方法,具體地,結(jié)合圖2來對將步驟102中的三種方式結(jié)合后的確定目標(biāo)文本所屬業(yè)務(wù)類別流程進(jìn)行說明,如圖2所示,該確定目標(biāo)文本所屬業(yè)務(wù)類別流程包括如下步驟201-206:在步驟201中,接收待處理的目標(biāo)文本;在步驟202中,將目標(biāo)文本輸入到文本字符匹配模塊,以判斷目標(biāo)文本包含的字符串與指定文本包含的字符串是否相同;當(dāng)判斷為是時(shí),確定目標(biāo)文本與指定文本相同,繼續(xù)執(zhí)行步驟205;當(dāng)判斷為否時(shí),繼續(xù)執(zhí)行步驟203;在步驟203中,將目標(biāo)文本輸入到文本相似度計(jì)算模塊,以根據(jù)第一文本向量與第二文本向量之間的相似度確定目標(biāo)文本與指定文本之間的相似度;判斷目標(biāo)文本與指定文本之間的相似度是否大于或等于相似度閾值;當(dāng)判斷為是時(shí),繼續(xù)執(zhí)行步驟205;當(dāng)判斷為否時(shí),繼續(xù)執(zhí)行步驟204;在步驟204中,將目標(biāo)文本輸入到屬性相似度計(jì)算模塊,以根據(jù)第一屬性向量與第二屬性向量之間的相似度確定目標(biāo)文本與指定文本之間的相似度;判斷目標(biāo)文本與指定文本之間的相似度是否大于或等于相似度閾值;當(dāng)判斷為是時(shí),繼續(xù)執(zhí)行步驟205;當(dāng)判斷為否時(shí),繼續(xù)執(zhí)行步驟206;在步驟205中,將指定文本所屬的業(yè)務(wù)類別確定為目標(biāo)文本所屬的業(yè)務(wù)類別;在步驟206中,將目標(biāo)文本輸入到使用詞法、句法和語義分析的理解系統(tǒng),以確定目標(biāo)文本所屬的業(yè)務(wù)類別。需要說明的是,上述步驟206中基于使用詞法、句法和語義分析的理解系統(tǒng),確定目標(biāo)文本所屬的業(yè)務(wù)類別后,還可以將目標(biāo)文本直接添加到該文本知識(shí)庫中,當(dāng)然,也可以先確定目標(biāo)文本是否為質(zhì)量較好的文本,進(jìn)而在確定目標(biāo)文本為質(zhì)量較好的文本后,再將目標(biāo)文本添加到該文本知識(shí)庫中,從而實(shí)現(xiàn)對該文本知識(shí)庫的不斷更新,使該文本知識(shí)庫得以不斷完善。在本發(fā)明實(shí)施例中,接收待處理的目標(biāo)文本后,可以確定目標(biāo)文本與指定文本之間的相似度,并當(dāng)目標(biāo)文本與指定文本之間的相似度大于或等于相似度閾值時(shí),可以將指定文本所屬的業(yè)務(wù)類別確定為目標(biāo)文本所屬的業(yè)務(wù)類別,也即是,本發(fā)明僅利用該文本知識(shí)庫中已經(jīng)分類好的指定文本,即可簡單快速地完成對目標(biāo)文本的分類,從而相比于相關(guān)技術(shù)中需要對目標(biāo)文本進(jìn)行詞法、句法和語義分析的繁瑣分類過程,本發(fā)明可以大大節(jié)省文本所屬業(yè)務(wù)類別的確定時(shí)間,提高文本所屬業(yè)務(wù)類別的確定效率。參見圖3A,本發(fā)明實(shí)施例提供了一種確定目標(biāo)文本所屬業(yè)務(wù)類別的裝置,該裝置包括獲取模塊301,第一確定模塊302和第二確定模塊303。接收模塊301,用于接收待處理的目標(biāo)文本;第一確定模塊302,用于確定目標(biāo)文本與指定文本之間的相似度,指定文本為存儲(chǔ)在文本知識(shí)庫中的已確定所屬業(yè)務(wù)類別的文本;第二確定模塊303,用于當(dāng)目標(biāo)文本與指定文本之間的相似度大于或等于相似度閾值時(shí),將指定文本所屬的業(yè)務(wù)類別確定為目標(biāo)文本所屬的業(yè)務(wù)類別??蛇x地,參見圖3B,該第一確定模塊302包括:判斷單元3021,用于判斷目標(biāo)文本包含的字符串與指定文本包含的字符串是否相同;第一確定單元3022,用于當(dāng)目標(biāo)文本包含的字符串與指定文本包含的字符串相同時(shí),確定目標(biāo)文本與指定文本相同??蛇x地,參見圖3C,該第一確定模塊302包括:第一獲取單元3023,用于獲取目標(biāo)文本的第一切詞結(jié)果和指定文本的第二切詞結(jié)果,第一切詞結(jié)果中包括多個(gè)第一詞語,第二切詞結(jié)果中包括多個(gè)第二詞語;第二確定單元3024,用于根據(jù)第一切詞結(jié)果和第二切詞結(jié)果,確定目標(biāo)文本對應(yīng)的第一文本向量和指定文本對應(yīng)的第二文本向量,第一文本向量用于表征第一切詞結(jié)果和第二切詞結(jié)果中的各個(gè)詞語在第一切詞結(jié)果中出現(xiàn)的次數(shù),第二文本向量用于表征第一切詞結(jié)果和第二切詞結(jié)果中的各個(gè)詞語在第二切詞結(jié)果中出現(xiàn)的次數(shù);第一計(jì)算單元3025,用于計(jì)算第一文本向量與第二文本向量之間的相似度;第三確定單元3026,用于根據(jù)第一文本向量與第二文本向量之間的相似度確定目標(biāo)文本與指定文本之間的相似度??蛇x地,參見圖3D,該第一確定模塊302包括:第二獲取單元3027,用于獲取目標(biāo)文本的第一標(biāo)注結(jié)果和指定文本的第二標(biāo)注結(jié)果,第一標(biāo)注結(jié)果中包括多個(gè)第一屬性詞,第二標(biāo)注結(jié)果中包括多個(gè)第二屬性詞,第一屬性詞和第二屬性詞均用于指示詞語類型;第四確定單元3028,用于根據(jù)第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果,確定目標(biāo)文本對應(yīng)的第一屬性向量和指定文本對應(yīng)的第二屬性向量,第一屬性向量用于表征第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中的各個(gè)屬性詞在第一標(biāo)注結(jié)果中出現(xiàn)的次數(shù),第二屬性向量用于表征第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中的各個(gè)屬性詞在第二標(biāo)注結(jié)果中出現(xiàn)的次數(shù);第二計(jì)算單元3029,用于計(jì)算第一屬性向量與第二屬性向量之間的相似度;第五確定單元3030,用于根據(jù)第一屬性向量與第二屬性向量之間的相似度確定目標(biāo)文本與指定文本之間的相似度。可選地,該第二獲取單元3027包括:第一獲取子單元,用于獲取目標(biāo)文本的第一切詞結(jié)果,第一切詞結(jié)果中包括多個(gè)第一詞語;標(biāo)注子單元,用于分別對多個(gè)第一詞語進(jìn)行類型標(biāo)注,得到多個(gè)標(biāo)注詞;去除子單元,用于去除多個(gè)標(biāo)注詞中的指定標(biāo)注詞,得到第一標(biāo)注結(jié)果??蛇x地,該第二計(jì)算單元3029包括:第二獲取子單元,用于獲取第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果中各個(gè)屬性詞的權(quán)重;第一生成子單元,用于基于第一屬性向量和各個(gè)屬性詞的權(quán)重,生成第一向量,第一向量的第i個(gè)元素為第一屬性向量的第i個(gè)元素與第一權(quán)重的乘積,第一權(quán)重為第一屬性向量的第i個(gè)元素對應(yīng)的屬性詞的權(quán)重,第一向量的第i個(gè)元素為第一向量的任一元素;第二生成子單元,用于基于第二屬性向量和各個(gè)屬性詞的權(quán)重,生成第二向量,第二向量的第i個(gè)元素為第二屬性向量的第i個(gè)元素與第二權(quán)重的乘積,第二權(quán)重為第二屬性向量的第i個(gè)元素對應(yīng)的屬性詞的權(quán)重,第二向量的第i個(gè)元素為第二向量的任一元素;計(jì)算子單元,用于計(jì)算第一向量與第二向量之間的相似度;確定子單元,用于根據(jù)第一向量與第二向量之間的相似度確定第一屬性向量與第二屬性向量之間的相似度。在本發(fā)明實(shí)施例中,接收待處理的目標(biāo)文本后,可以確定目標(biāo)文本與指定文本之間的相似度,并當(dāng)目標(biāo)文本與指定文本之間的相似度大于或等于相似度閾值時(shí),可以將指定文本所屬的業(yè)務(wù)類別確定為目標(biāo)文本所屬的業(yè)務(wù)類別,也即是,本發(fā)明僅利用該文本知識(shí)庫中已經(jīng)分類好的指定文本,即可簡單快速地完成對目標(biāo)文本的分類,從而相比于相關(guān)技術(shù)中需要對目標(biāo)文本進(jìn)行詞法、句法和語義分析的繁瑣分類過程,本發(fā)明可以大大節(jié)省文本所屬業(yè)務(wù)類別的確定時(shí)間,提高文本所屬業(yè)務(wù)類別的確定效率。需要說明的是:上述實(shí)施例提供的確定目標(biāo)文本所屬業(yè)務(wù)類別的裝置在確定目標(biāo)文本所屬業(yè)務(wù)類別時(shí),僅以上述各功能模塊的劃分進(jìn)行舉例說明,實(shí)際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實(shí)施例提供的確定目標(biāo)文本所屬業(yè)務(wù)類別的裝置與確定目標(biāo)文本所屬業(yè)務(wù)類別的方法實(shí)施例屬于同一構(gòu)思,其具體實(shí)現(xiàn)過程詳見方法實(shí)施例,這里不再贅述。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1