有相關(guān)性,則刪除其中之一,剩余的一個(gè)可 以繼續(xù)進(jìn)行比較,以此類(lèi)推,就可以在屬性值分布特性相同或相似的多個(gè)屬性數(shù)據(jù)中只保 留一個(gè)屬性數(shù)據(jù),以避免不必要的加權(quán)累計(jì)效應(yīng)。
[0111] 另外,為了優(yōu)化樣本數(shù)據(jù),上述根據(jù)語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù),獲取上述語(yǔ)音業(yè)務(wù)評(píng) 價(jià)模型之前,還可以包括:判斷各語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)是否具有長(zhǎng)尾效應(yīng),若這些語(yǔ)音業(yè) 務(wù)相關(guān)屬性數(shù)據(jù)中包括具有長(zhǎng)尾效應(yīng)的屬性數(shù)據(jù),則消除具有長(zhǎng)尾效應(yīng)的語(yǔ)音業(yè)務(wù)相關(guān)屬 性數(shù)據(jù)中的長(zhǎng)尾數(shù)據(jù)。
[0112] 上述判斷各語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)是否具有長(zhǎng)尾效應(yīng),具體為:根據(jù)各語(yǔ)音業(yè)務(wù) 相關(guān)屬性數(shù)據(jù)對(duì)應(yīng)的屬性值分布,判斷各語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)是否具有長(zhǎng)尾效應(yīng)。
[0113] 進(jìn)一步地,上述消除上述具有長(zhǎng)尾效應(yīng)的語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)中的長(zhǎng)尾數(shù)據(jù), 具體為:根據(jù)各語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)對(duì)應(yīng)的屬性值分布,確定長(zhǎng)尾數(shù)據(jù)閾值;根據(jù)該長(zhǎng) 尾數(shù)據(jù)閾值,消除具有長(zhǎng)尾效應(yīng)的語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)中的長(zhǎng)尾數(shù)據(jù)。更具體地,可以根 據(jù)各屬性數(shù)據(jù)對(duì)應(yīng)的屬性值分布,確定各屬性數(shù)據(jù)中"長(zhǎng)尾數(shù)據(jù)在所有屬性值中的占比"和 "該屬性數(shù)據(jù)中的長(zhǎng)尾數(shù)據(jù)值域區(qū)間占比",然后根據(jù)"長(zhǎng)尾數(shù)據(jù)在所有屬性值中的占比"小 于第一預(yù)設(shè)閾值的數(shù)據(jù)和"該屬性數(shù)據(jù)的長(zhǎng)尾數(shù)據(jù)值域區(qū)間占比"大于第二預(yù)設(shè)閾值的數(shù) 據(jù)確定長(zhǎng)尾數(shù)據(jù)閾值。
[0114] 以具體一個(gè)屬性數(shù)據(jù)"鑒權(quán)請(qǐng)求時(shí)間"舉例說(shuō)明,假設(shè)該屬性數(shù)據(jù)對(duì)應(yīng)的屬性值有 10000個(gè),值域分布在"10~1000"區(qū)間的數(shù)據(jù)為300個(gè),那么此時(shí)長(zhǎng)尾數(shù)據(jù)在所有屬性值 中的占比為3% ;假設(shè)該屬性數(shù)據(jù)的值域跨度為" 1~1000",根據(jù)對(duì)應(yīng)的屬性值分布,發(fā)現(xiàn) 大部分屬性值集中在"1~10",少數(shù)值分布在"10~1000",此時(shí)該屬性數(shù)據(jù)的長(zhǎng)尾數(shù)據(jù)值 域區(qū)間為"10~1000",即長(zhǎng)尾數(shù)據(jù)值域區(qū)間占比為99%。假設(shè)第一閾值為5%,第二閾值 為80%,那么保留"長(zhǎng)尾數(shù)據(jù)在所有屬性值中的占比"大于等于5%的數(shù)據(jù),保留"該屬性數(shù) 據(jù)的長(zhǎng)尾數(shù)據(jù)值域區(qū)間占比"大于等于80%的數(shù)據(jù),根據(jù)"長(zhǎng)尾數(shù)據(jù)在所有屬性值中的占 t匕"小于5%的數(shù)據(jù)和"該屬性數(shù)據(jù)的長(zhǎng)尾數(shù)據(jù)值域區(qū)間占比"小于80%的數(shù)據(jù)確定所述長(zhǎng) 尾數(shù)據(jù)閾值。
[0115] 具體實(shí)現(xiàn)過(guò)程中,可以將屬性數(shù)據(jù)的值域跨度切分為多個(gè)值域區(qū)間來(lái)進(jìn)行判斷, 例如將 "1 ~1000" 切分為:"1 ~50"、"51 ~100"、"101 ~150" ...... "951 ~1000",進(jìn) 而計(jì)算確定每個(gè)值域區(qū)間中的屬性值數(shù)量占所有屬性值數(shù)量的比例,來(lái)確定長(zhǎng)尾數(shù)據(jù)的值 域區(qū)間。然后再確定"長(zhǎng)尾數(shù)據(jù)在所有屬性值中的占比"和"長(zhǎng)尾數(shù)據(jù)在所有屬性值中的占 比"。
[0116] 圖4為本發(fā)明提供的語(yǔ)音業(yè)務(wù)的評(píng)價(jià)處理裝置實(shí)施例一的結(jié)構(gòu)示意圖,如圖1所 示,該裝置包括:獲取模塊401、第一評(píng)價(jià)模塊402和第二評(píng)價(jià)模塊403。其中:
[0117] 獲取模塊401,用于獲取待評(píng)價(jià)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)。
[0118] 第一評(píng)價(jià)模塊402,用于采用根據(jù)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)獲取的語(yǔ)音業(yè)務(wù)評(píng)價(jià)模 型,對(duì)所述待評(píng)價(jià)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)進(jìn)行評(píng)價(jià),獲取所述待評(píng)價(jià)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù) 據(jù)的評(píng)價(jià)值。
[0119] 第二評(píng)價(jià)模塊403,用于根據(jù)所述評(píng)價(jià)值對(duì)所述待評(píng)價(jià)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)對(duì) 應(yīng)的語(yǔ)音業(yè)務(wù)進(jìn)行評(píng)價(jià)處理。
[0120] 圖5為本發(fā)明提供的語(yǔ)音業(yè)務(wù)的評(píng)價(jià)處理裝置實(shí)施例二的結(jié)構(gòu)示意圖,如圖5所 示,在圖4的基礎(chǔ)上,該裝置還可以包括:模型建立模塊404,用于獲取語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù) 據(jù);根據(jù)所述語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù),獲取所述語(yǔ)音業(yè)務(wù)評(píng)價(jià)模型。
[0121] 具體地,所述語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)包括:語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)。相應(yīng)地,模型 建立模塊404,具體用于根據(jù)所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù),獲取所述語(yǔ)音業(yè)務(wù)評(píng)價(jià)模型。
[0122] 繼續(xù)參照?qǐng)D5,模型建立模塊404還可以包括:聚類(lèi)單元501、計(jì)算單元502、排序 單元503以及學(xué)習(xí)單元504。其中:
[0123] 聚類(lèi)單元501,用于采用聚類(lèi)算法,對(duì)所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)進(jìn)行聚類(lèi),獲取 預(yù)設(shè)數(shù)目個(gè)屬性數(shù)據(jù)分類(lèi)。計(jì)算單元502,用于根據(jù)各分類(lèi)中的屬性數(shù)據(jù),計(jì)算各分類(lèi)對(duì)應(yīng) 的分類(lèi)度量指標(biāo)值。排序單元503,用于根據(jù)所述各分類(lèi)對(duì)應(yīng)的所述分類(lèi)度量指標(biāo)值,對(duì)所 述各分類(lèi)進(jìn)行排序,獲取優(yōu)劣排序結(jié)果。學(xué)習(xí)單元504,用于采用機(jī)器學(xué)習(xí)法,對(duì)所述優(yōu)劣排 序結(jié)果進(jìn)行訓(xùn)練,獲取所述語(yǔ)音業(yè)務(wù)評(píng)價(jià)模型。
[0124] 需要說(shuō)明的是,具體實(shí)現(xiàn)過(guò)程中,模型建立模塊404可以集成于上述裝置,也可以 是一個(gè)獨(dú)立的裝置,將建立完成的模型傳送給上述語(yǔ)音業(yè)務(wù)的評(píng)價(jià)處理裝置即可。
[0125] 進(jìn)一步地,所述各分類(lèi)對(duì)應(yīng)的分類(lèi)度量指標(biāo)值包括:所述各分類(lèi)對(duì)應(yīng)的平均值和 標(biāo)準(zhǔn)差。
[0126] 更進(jìn)一步地,排序單元503,具體用于根據(jù)所述各分類(lèi)對(duì)應(yīng)的平均值和各分類(lèi)中屬 性數(shù)據(jù)的屬性特征,對(duì)所述各分類(lèi)進(jìn)行排序,獲取第一排序結(jié)果;若所述第一排序結(jié)果中包 括平均值相同的分類(lèi),則將各所述平均值相同的分類(lèi)按照對(duì)應(yīng)的標(biāo)準(zhǔn)差進(jìn)行排序,獲取第 二排序結(jié)果;根據(jù)所述第一排序結(jié)果和所述第二排序結(jié)果,獲取所述優(yōu)劣排序結(jié)果。
[0127] 圖6為本發(fā)明提供的語(yǔ)音業(yè)務(wù)的評(píng)價(jià)處理裝置實(shí)施例三的結(jié)構(gòu)示意圖,如圖6所 示,在圖5的基礎(chǔ)上,該裝置還可以包括:第一優(yōu)化模塊601,用于若所述語(yǔ)音業(yè)務(wù)相關(guān)屬性 數(shù)據(jù)中包括兩個(gè)屬性值分布具有相關(guān)性的語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù),則在所述兩個(gè)語(yǔ)音業(yè)務(wù) 相關(guān)屬性數(shù)據(jù)中刪除任一個(gè)語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)。
[0128] 圖7為本發(fā)明提供的語(yǔ)音業(yè)務(wù)的評(píng)價(jià)處理裝置實(shí)施例四的結(jié)構(gòu)示意圖,如圖7所 示,在圖5的基礎(chǔ)上,該裝置還可以包括:第二優(yōu)化模塊701,用于判斷各所述語(yǔ)音業(yè)務(wù)相關(guān) 屬性數(shù)據(jù)是否具有長(zhǎng)尾效應(yīng);若所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)中包括具有長(zhǎng)尾效應(yīng)的語(yǔ)音業(yè) 務(wù)相關(guān)屬性數(shù)據(jù),則消除所述具有長(zhǎng)尾效應(yīng)的語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)中的長(zhǎng)尾數(shù)據(jù)。
[0129] 更具體地,第二優(yōu)化模塊701,根據(jù)各所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)對(duì)應(yīng)的屬性值分 布,判斷各所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)是否具有長(zhǎng)尾效應(yīng)。并相應(yīng)地,根據(jù)各所述語(yǔ)音業(yè)務(wù) 相關(guān)屬性數(shù)據(jù)對(duì)應(yīng)的屬性值分布,確定長(zhǎng)尾數(shù)據(jù)閾值;根據(jù)所述長(zhǎng)尾數(shù)據(jù)閾值,消除所述具 有長(zhǎng)尾效應(yīng)的語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)的長(zhǎng)尾數(shù)據(jù)。
[0130] 需要說(shuō)明的是,在某些應(yīng)用場(chǎng)景下,上述第一優(yōu)化模塊601和第二優(yōu)化模塊701可 以同時(shí)存在。
[0131] 另外,所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)包括下述任一項(xiàng)或其任意組合:響鈴時(shí)間、接聽(tīng) 時(shí)間、分配時(shí)間、鑒權(quán)請(qǐng)求時(shí)間、加密請(qǐng)求時(shí)間、業(yè)務(wù)請(qǐng)求接收時(shí)間、掛斷時(shí)間、結(jié)束通信時(shí) 間、釋放時(shí)間、呼叫時(shí)間。
[0132] 圖8為本發(fā)明提供的語(yǔ)音業(yè)務(wù)的評(píng)價(jià)處理裝置實(shí)施例五的結(jié)構(gòu)示意圖,該裝置包 括:存儲(chǔ)器801和處理器802。其中:
[0133] 存儲(chǔ)器801用于存儲(chǔ)指令集。該處理器802被配置為調(diào)用存儲(chǔ)器801中的指令集, 以執(zhí)行如下流程:獲取待評(píng)價(jià)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù);采用根據(jù)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)獲 取的語(yǔ)音業(yè)務(wù)評(píng)價(jià)模型,對(duì)所述待評(píng)價(jià)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)進(jìn)行評(píng)價(jià),獲取所述待評(píng)價(jià) 語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)的評(píng)價(jià)值;根據(jù)所述評(píng)價(jià)值對(duì)所述待評(píng)價(jià)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)對(duì) 應(yīng)的語(yǔ)音業(yè)務(wù)進(jìn)行評(píng)價(jià)處理。
[0134] 進(jìn)一步地,處理器802,還用于在所述采用根據(jù)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)獲取的語(yǔ)音 業(yè)務(wù)評(píng)價(jià)模型,對(duì)所述待評(píng)價(jià)語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)進(jìn)行評(píng)價(jià)之前,獲取語(yǔ)音業(yè)務(wù)相關(guān)記 錄數(shù)據(jù);根據(jù)所述語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù),獲取所述語(yǔ)音業(yè)務(wù)評(píng)價(jià)模型。
[0135] 具體地,所述語(yǔ)音業(yè)務(wù)相關(guān)記錄數(shù)據(jù)包括:語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)。相應(yīng)地,處理 器802,具體用于根據(jù)所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù),獲取所述語(yǔ)音業(yè)務(wù)評(píng)價(jià)模型。
[0136] 處理器802,具體用于采用聚類(lèi)算法,對(duì)所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)進(jìn)行聚類(lèi),獲 取預(yù)設(shè)數(shù)目個(gè)屬性數(shù)據(jù)分類(lèi);根據(jù)各分類(lèi)中的屬性數(shù)據(jù),計(jì)算各分類(lèi)對(duì)應(yīng)的分類(lèi)度量指標(biāo) 值;根據(jù)所述各分類(lèi)對(duì)應(yīng)的所述分類(lèi)度量指標(biāo)值,對(duì)所述各分類(lèi)進(jìn)行排序,獲取優(yōu)劣排序結(jié) 果;采用機(jī)器學(xué)習(xí)法,對(duì)所述優(yōu)劣排序結(jié)果進(jìn)行訓(xùn)練,獲取所述語(yǔ)音業(yè)務(wù)評(píng)價(jià)模型。
[0137] 其中,所述各分類(lèi)對(duì)應(yīng)的分類(lèi)度量指標(biāo)值包括:所述各分類(lèi)對(duì)應(yīng)的平均值和標(biāo)準(zhǔn) 差。
[0138] 更具體地,處理器802,根據(jù)所述各分類(lèi)對(duì)應(yīng)的平均值和各分類(lèi)中屬性數(shù)據(jù)的屬性 特征,對(duì)所述各分類(lèi)進(jìn)行排序,獲取第一排序結(jié)果;若所述第一排序結(jié)果中包括平均值相同 的分類(lèi),則將各所述平均值相同的分類(lèi)按照對(duì)應(yīng)的標(biāo)準(zhǔn)差進(jìn)行排序,獲取第二排序結(jié)果;根 據(jù)所述第一排序結(jié)果和所述第二排序結(jié)果,獲取所述優(yōu)劣排序結(jié)果。
[0139] 處理器802,還用于在根據(jù)所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù),獲取所述語(yǔ)音業(yè)務(wù)評(píng)價(jià)模 型之前,若所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)中包括兩個(gè)屬性值分布具有相關(guān)性的語(yǔ)音業(yè)務(wù)相關(guān) 屬性數(shù)據(jù),則在所述兩個(gè)語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)中刪除任一個(gè)語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)。
[0140] 處理器802,還用于在根據(jù)所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù),獲取所述語(yǔ)音業(yè)務(wù)評(píng)價(jià)模 型之前,判斷各所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)是否具有長(zhǎng)尾效應(yīng);若所述語(yǔ)音業(yè)務(wù)相關(guān)屬性 數(shù)據(jù)中包括具有長(zhǎng)尾效應(yīng)的語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù),則消除所述具有長(zhǎng)尾效應(yīng)的語(yǔ)音業(yè)務(wù) 相關(guān)屬性數(shù)據(jù)中的長(zhǎng)尾數(shù)據(jù)。
[0141] 具體地,處理器802,根據(jù)各所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)對(duì)應(yīng)的屬性值分布,判斷 各所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)是否具有長(zhǎng)尾效應(yīng)。以及相應(yīng)地,根據(jù)各所述語(yǔ)音業(yè)務(wù)相關(guān) 屬性數(shù)據(jù)對(duì)應(yīng)的屬性值分布,確定長(zhǎng)尾數(shù)據(jù)閾值;根據(jù)所述長(zhǎng)尾數(shù)據(jù)閾值,消除所述具有長(zhǎng) 尾效應(yīng)的語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)的長(zhǎng)尾數(shù)據(jù)。
[0142] 另外,所述語(yǔ)音業(yè)務(wù)相關(guān)屬性數(shù)據(jù)包括下述任一項(xiàng)或其任意組合:響鈴時(shí)間、接聽(tīng) 時(shí)間、分配時(shí)間、鑒權(quán)請(qǐng)求時(shí)間、加密請(qǐng)求時(shí)間、業(yè)務(wù)請(qǐng)求接收時(shí)間、掛斷時(shí)間、結(jié)束通信時(shí) 間、釋放時(shí)間、呼叫時(shí)間。