亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

音頻數(shù)據(jù)分析系統(tǒng)和方法

文檔序號:2825340閱讀:466來源:國知局
音頻數(shù)據(jù)分析系統(tǒng)和方法
【專利摘要】提供一種用于與用戶相關(guān)的音頻數(shù)據(jù)的分析系統(tǒng)和方法,以便可以基于分析結(jié)果將用戶分類為具有假設(shè)的概率的多個等級中的一個等級。分析系統(tǒng)包括:音頻變換器(110),適應(yīng)于將與用戶相關(guān)的音頻數(shù)據(jù)變換為頻譜數(shù)據(jù);樣式識別器(120),適應(yīng)于將頻譜數(shù)據(jù)分解為預(yù)定特征向量以獲得頻譜數(shù)據(jù)的分解樣式;評分器(130),適應(yīng)于基于頻譜數(shù)據(jù)的分解樣式和用戶的屬性而使用所訓(xùn)練的模型來計算與用戶相關(guān)的多個等級的假設(shè)得分。
【專利說明】音頻數(shù)據(jù)分析系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻分析【技術(shù)領(lǐng)域】,特別涉及用于分析例如用戶的呼叫者回鈴音等與用戶相關(guān)的音頻數(shù)據(jù)以便可以基于分析結(jié)果來分類用戶的分析系統(tǒng)和方法。本發(fā)明還涉及用于實現(xiàn)音頻分析系統(tǒng)和方法的計算機程序和計算機程序產(chǎn)品。
【背景技術(shù)】
[0002]電話營銷是銷售人員試著撥打并懇求預(yù)期消費者購買產(chǎn)品或服務(wù)的直接營銷方法。很多B2B或B2C公司大量利用這樣的方法。
[0003]傳統(tǒng)的電話營銷系統(tǒng)可為銷售人員提供從例如CRM (消費者關(guān)系管理)系統(tǒng)或EDW(企業(yè)數(shù)據(jù)庫)系統(tǒng)等支持系統(tǒng)所檢索的消費者的背景信息,以便當(dāng)銷售人員與消費者對話時,可以用消費者的背景信息來幫助銷售人員。
[0004]然而,傳統(tǒng)的電話營銷系統(tǒng)通常具有下文的主要缺點:
(1)缺少個性化:支持系統(tǒng)僅可提供例如消費者的名字、電話號碼、電子郵件等最簡單的消費者信息。因此,銷售人員不能為不同消費者找出個性化的策略;以及
(2)缺少在線成績改進循環(huán):因為支持系統(tǒng)僅提供最簡單的消費者信息,所以銷售人員在呼叫的循環(huán)期間不能改進他的成績。
[0005]可以發(fā)現(xiàn)傳統(tǒng)的電話營銷系統(tǒng)的主要缺點主要起因于支持系統(tǒng)的簡單的功能。為了改進電話營銷效率和成績,支持系統(tǒng)應(yīng)提供增強的消費者信息。
[0006]CRBT (呼叫者回鈴音)是RBT (回鈴音)的個性化型式。RBT是在撥打后和呼叫在接收端被接聽前由呼叫方在電話線路上所聽到的歌曲或聲音?,F(xiàn)在,越來越多的人個性化他們的RBT以提供CRBT。
[0007]因此,與傳統(tǒng)的電話營銷系統(tǒng)關(guān)聯(lián)的一個問題是支持系統(tǒng)僅能提供簡單的消費者信息。

【發(fā)明內(nèi)容】

[0008]本發(fā)明的目標(biāo)是在電話營銷系統(tǒng)中增加個性化數(shù)據(jù)。
[0009]根據(jù)本發(fā)明的一方面,采用一種分析系統(tǒng)的幫助來實現(xiàn)此目標(biāo),該分析系統(tǒng)用于分析與用戶相關(guān)的音頻數(shù)據(jù)以便可以基于分析結(jié)果將用戶分類為具有假設(shè)的概率的多個等級中的一個等級。分析系統(tǒng)包括音頻變換器,適應(yīng)于將與用戶相關(guān)的音頻數(shù)據(jù)變換為頻譜數(shù)據(jù);樣式識別器,適應(yīng)于將所述頻譜數(shù)據(jù)分解為預(yù)定特征向量以獲得頻譜數(shù)據(jù)的分解樣式;以及評分器,適應(yīng)于基于頻譜數(shù)據(jù)的分解樣式和用戶的屬性使用所訓(xùn)練的模型來計算與用戶相關(guān)的多個等級的假設(shè)得分。
[0010]可選地,在本發(fā)明的分析系統(tǒng)中,評分器將用戶歸類于在所有多個等級中具有最高假設(shè)得分的等級。與用戶關(guān)聯(lián)的假設(shè)的等級可用于例如電話營銷系統(tǒng)等某個應(yīng)用以用更多個性化的用戶信息幫助銷售人員,以便可改善電話營銷效率和成績。
[0011 ] 可選地,本發(fā)明的分析系統(tǒng)包括訓(xùn)練器,適應(yīng)于基于至少一個歷史項目來訓(xùn)練所訓(xùn)練的模型,每個歷史項目包括對應(yīng)于歷史用戶的歷史音頻數(shù)據(jù)的頻譜數(shù)據(jù)的分解樣式、歷史用戶的屬性以及用于歷史用戶的多個等級中的一個等級的實際得分,以及訓(xùn)練器基于歷史項目和包括頻譜數(shù)據(jù)的分解樣式、用戶的屬性以及多個等級中的實際等級的實際得分的新項目來保持所訓(xùn)練的模型。通過使用歷史項目和實際結(jié)果持續(xù)訓(xùn)練所訓(xùn)練的模型,改進了由評分器使用所訓(xùn)練的模型所計算的假設(shè)結(jié)果的準(zhǔn)確性。
[0012]可選地,在本發(fā)明的分析系統(tǒng)中,評分器基于樸素貝葉斯分類器,并且多個等級的假設(shè)得分是在頻譜數(shù)據(jù)的分解樣式和用戶的屬性上的多個等級的后驗概率。
[0013]可選地,本發(fā)明的分析系統(tǒng)包括:音頻數(shù)據(jù)庫,用于存儲與各用戶相關(guān)的音頻數(shù)據(jù);頻譜數(shù)據(jù)庫,用于存儲從存儲于音頻數(shù)據(jù)庫中的音頻數(shù)據(jù)所變換的頻譜;以及特征向量生成器,適應(yīng)于使用主成分分析法處理頻譜數(shù)據(jù)庫中的頻譜以生成預(yù)定特征向量。
[0014]可選地,在本發(fā)明的分析系統(tǒng)中,要分析的音頻數(shù)據(jù)包括用戶的呼叫者回鈴音(CRBT),這是因為在電信系統(tǒng)中CRBT是通常使用的用戶的個性化音調(diào),當(dāng)本發(fā)明的分析系統(tǒng)用于電話營銷系統(tǒng)時分析用戶的CRBT尤其有用。
[0015]根據(jù)本發(fā)明的另一方面,此目標(biāo)由一種分析方法來實現(xiàn),該分析方法用于分析與用戶相關(guān)的音頻數(shù)據(jù)以便可以基于分析結(jié)果將用戶分類為具有假設(shè)的概率的多個等級中的一個等級。分析方法包括下文的步驟:將與用戶相關(guān)的音頻數(shù)據(jù)變換為頻譜數(shù)據(jù);將所述頻譜數(shù)據(jù)分解為預(yù)定特征向量以獲得頻譜數(shù)據(jù)的分解樣式;以及基于頻譜數(shù)據(jù)的分解樣式和用戶的屬性使用所訓(xùn)練的模型來計算與用戶相關(guān)的多個等級的假設(shè)得分。
[0016]可選地,本發(fā)明的分析方法包括將用戶歸類于在所有多個等級中具有最高假設(shè)得分的等級的步驟。
[0017]可選地,本發(fā)明的分析方法包括基于歷史項目訓(xùn)練所訓(xùn)練的模型的步驟,每個歷史項目包括對應(yīng)于歷史用戶的歷史音頻數(shù)據(jù)的頻譜數(shù)據(jù)的分解樣式、歷史用戶的屬性以及用于歷史用戶的多個等級中的一個等級的實際得分,以及基于歷史項目和包括頻譜數(shù)據(jù)的分解樣式、用戶的屬性以及多個等級中的實際等級的實際得分的新項目來保持所訓(xùn)練的模型的步驟。
[0018]可選地,在本發(fā)明的分析方法中,計算多個等級的假設(shè)得分的步驟基于樸素貝葉斯分類器,以及多個等級的假設(shè)得分是在頻譜數(shù)據(jù)的分解樣式和用戶的屬性上的多個等級的后驗概率。
[0019]可選地,本發(fā)明的分析方法包括將存儲于音頻數(shù)據(jù)庫的與各用戶相關(guān)的音頻數(shù)據(jù)變換為對應(yīng)頻譜的步驟,以及使用主成分分析法處理對應(yīng)頻譜以生成預(yù)定特征向量的步驟。
[0020]可選地,在本發(fā)明的分析方法中,與用戶相關(guān)的音頻包括用戶的呼叫者回鈴音。
[0021]根據(jù)本發(fā)明的另一方面,提供一種電話營銷系統(tǒng),包括本發(fā)明的分析系統(tǒng)以分析與電話營銷系統(tǒng)的客戶相關(guān)的音頻。
[0022]根據(jù)本發(fā)明的另一方面,提供一種計算機程序,包括計算機可讀代碼,當(dāng)在應(yīng)用服務(wù)器上運行該計算機可讀代碼時,使應(yīng)用服務(wù)器執(zhí)行根據(jù)以上描述的實施例中的任一個的分析方法,并且還提供一種計算機可讀介質(zhì),其中在該計算機可讀代碼上存儲有計算機程序。【專利附圖】

【附圖說明】
[0023]當(dāng)與附圖一起閱讀時本發(fā)明的目標(biāo)、優(yōu)點和效果以及特征將從本發(fā)明的實施例的以下詳細(xì)描述而更容易理解,附圖中:
圖1圖示根據(jù)本發(fā)明的實施例的用于分析與用戶相關(guān)的音頻數(shù)據(jù)的分析系統(tǒng);
圖2示出根據(jù)本發(fā)明的實施例的用于分析與用戶相關(guān)的音頻數(shù)據(jù)的分析方法的流程
圖;
圖3示出根據(jù)本發(fā)明的實施例的用于生成預(yù)定特征向量的分析方法的圖2的流程圖的一部分;
圖4示出根據(jù)本發(fā)明的實施例的使用分析系統(tǒng)的電話營銷系統(tǒng);
圖5示出圖示用于實現(xiàn)本發(fā)明的實施例的服務(wù)器的框圖;以及 圖6示出容納或承載用于由服務(wù)器使用的程序代碼的存儲器單元的示意圖。
【具體實施方式】
[0024]在附圖中示出并將在下文中詳細(xì)描述本發(fā)明的實施例,盡管本發(fā)明覆蓋各種修改和備選構(gòu)造。然而,應(yīng)該理解,具體描述和附圖并不旨在將本發(fā)明限制為所公開的具體形式。相反,旨在要求保護的發(fā)明的范圍包括落入如所附的權(quán)利要求中所表達的本發(fā)明的范圍的其所有修改和備選構(gòu)造。
[0025]圖1圖示根據(jù)本發(fā)明的實施例的用于分析與用戶相關(guān)的音頻數(shù)據(jù)的說明分析系統(tǒng)100。如圖1所示,分析系統(tǒng) 100包括適應(yīng)于將與用戶相關(guān)的音頻數(shù)據(jù)變換為頻譜數(shù)據(jù)的音頻變換器110。與用戶相關(guān)的音頻數(shù)據(jù)可以是任何用戶特定音頻數(shù)據(jù),例如是由電信系統(tǒng)中的用戶個性化的呼叫者回鈴音、由用戶說的某東西或可以由用戶個性化以反映用戶的興趣或特性的任何其它音頻數(shù)據(jù)。由音頻變換器110接收的音頻數(shù)據(jù)通常采用數(shù)字形式,并存在可由音頻變換器110使用以將音頻數(shù)據(jù)變換為頻譜范圍的很多方式。根據(jù)實施例,在音頻變換器110中采用FFT (快速傅里葉變換)以將音頻數(shù)據(jù)變換為頻譜數(shù)據(jù)。應(yīng)該注意到FFT僅僅是示例,能將值變換為頻譜范圍的任何技術(shù)可用于本發(fā)明中。例如,STE (短時間能量)、MFCC (Mel頻率倒譜系數(shù))、LPC (線性預(yù)測系數(shù))等中的任一個也可用于變換音頻數(shù)據(jù)。
[0026]分析系統(tǒng)100還包括適應(yīng)于從音頻變換器獲得頻譜數(shù)據(jù)的分解樣式的樣式識別器120。根據(jù)本發(fā)明的實施例,樣式識別器120通過將頻譜數(shù)據(jù)分解為預(yù)定特征向量來獲得頻譜數(shù)據(jù)的分解樣式。預(yù)定特征向量可以從多個現(xiàn)存的音頻數(shù)據(jù)導(dǎo)出,其將在下文描述中詳細(xì)描述。假設(shè)預(yù)定特征向量可以表示為:
€igem?Ar, i'=]".!: ⑴



f
頻譜數(shù)據(jù)可以分解如下:



#
specira(specira _ data) = ^ aeigenvectm~t (2)


”0
其中^是分解因數(shù)并且頻譜數(shù)據(jù)的分解樣式可以是:
paiiem(specir£$_--?α) =□ (3)即,通過將頻譜數(shù)據(jù)分解為特征向量的組分,得到的分解因數(shù)可以記錄為頻譜數(shù)據(jù)的分解樣式。
[0027]分析系統(tǒng)100還包括評分器130,該評分器130適應(yīng)于基于由樣式識別器120所獲得的分解樣式和用戶的背景信息使用所訓(xùn)練的模型來計算與用戶相關(guān)的多個等級的假設(shè)得分。
[0028]與用戶相關(guān)的等級可取決于分析系統(tǒng)100所應(yīng)用的應(yīng)用而變化。例如,在分析系統(tǒng)用于分析用戶購買產(chǎn)品的意愿的情況下,等級可包括具有同意購買Cacxept屬性的等級以及具有拒絕購買屬性的等級。在分析系統(tǒng)用于分析用戶升級某個擁有的服務(wù)的意愿的情況下,等級可包括具有同意升級Ca_pt屬性的等級以及具有拒絕升級屬性的等級。應(yīng)該注意到,等級的數(shù)量不限于兩個,并且可使用多于兩個等級,例如,在分析系統(tǒng)用于分析如上所述的用戶購買產(chǎn)品的意愿的情況下,等級可包括多于兩個等級,例如包括具有同意購買Cacxept屬性的等級、具有同意嘗試Ctay屬性的等級、具有通過延遲而拒絕Cdelay屬性的等級以及具有拒絕購買c;_t屬性的等級。那些等級反映用戶的偏好,其可與用戶的個性化信息(例如由用戶個性化的音頻數(shù)據(jù))具有某種內(nèi)在關(guān)聯(lián)。多個等級的假設(shè)得分表示用戶被分類為由評分器130所計算的那些等級中的一個等級的概率。
[0029]根據(jù)實施例,評分器130可以利用機器學(xué)習(xí)的概率性方法來計算與用戶相關(guān)的多個等級的假設(shè)得分,即,所訓(xùn)練的模型可以是用于機器學(xué)習(xí)的概率性方法的概率模型。下文的描述將以樸素貝葉斯分類器作為由評分器130所使用的概率性方法作為示例,然而,應(yīng)該注意到,本申請不限于樸素貝葉斯分類器,其它機器學(xué)習(xí)中的概率性方法也可應(yīng)用于本申請,例如SVM (支持向量機)。
[0030]在樸素貝葉斯分類器中,有定義的特征的向量,向量的特征可能是
頻譜數(shù)據(jù)的分解樣式和用戶的背景信息。用于等級C的向量的假設(shè)得分定義為在特征的向量上的等級C的后驗概率:
Scoree = p(C\Fi) 0 (4)
基于#;中的獨立性的假設(shè),假設(shè)得分可以表示如下:
SCOtec = I
其中Z是僅取決于<F,的縮放因數(shù),其對所有等級是常數(shù)值并且當(dāng)為每個等級
C計算得分時可以忽略;P (C)是等級C的概率;以及P (Fi |C)表示當(dāng)?shù)燃塁出現(xiàn)時特征Fi存在的概率。應(yīng)該注意到P (C)和P (Fi |C)兩者都是由所訓(xùn)練的模型已知的先驗概率。
[0031]除了通過使用例如上述式子(5)等機器學(xué)習(xí)的概率性方法來計算每個等級的假設(shè)得分以外,可選地,評分器130還能將用戶歸類于在所有多個等級中具有最高假設(shè)得分的建議等級。在采用樸素貝葉斯分類器的實施例中,可以作為具有最高得分score。的等級c來計算建議等級C (Classsuggest):
ciass^mr =argma?i(i£Wtv.J (6)


Ι:ι
用戶的背景信息可以從例如CRM (消費者關(guān)系管理)系統(tǒng)或EDW (企業(yè)數(shù)據(jù)庫)系統(tǒng)等某個傳統(tǒng)的支持系統(tǒng)檢索,并且背景信息可包括年齡、性別、城市等用戶信息。[0032]可選地,用戶的背景信息可以是描述性的(例如關(guān)于用戶的性別的“男性”或“女性”),其不能直接用于要求某個數(shù)字值的評分器130中,分析系統(tǒng)100還包括適應(yīng)于將用戶的背景信息轉(zhuǎn)換為數(shù)字值的屬性標(biāo)準(zhǔn)化器150。例如,關(guān)于用戶的性別,“男性”可以轉(zhuǎn)換為值I以及“女性”可以轉(zhuǎn)換為值O。根據(jù)本發(fā)明的實施例,屬性標(biāo)準(zhǔn)化器150可將用戶的背景信息轉(zhuǎn)換為范圍為從O到I的數(shù)字值,以便評分器130可在操作期間容易地使用背景信息的向量。
[0033]在分析系統(tǒng)100中由訓(xùn)練器140基于歷史項目訓(xùn)練由評分器130所使用的所訓(xùn)練的模型。每個歷史項目對應(yīng)于與由分析系統(tǒng)100在以前分析的歷史用戶相關(guān)的歷史音頻數(shù)據(jù),其可包括對應(yīng)歷史音頻數(shù)據(jù)的頻譜數(shù)據(jù)的分解樣式、歷史用戶的屬性以及歷史用戶的多個等級中的一個等級的實際得分。在由分析系統(tǒng)100提供的假設(shè)得分用于各種應(yīng)用中之后,那些應(yīng)用的用戶可向分析系統(tǒng)100提供等級的實際得分。訓(xùn)練器140可使用機器學(xué)習(xí)的概率性方法領(lǐng)域中已知的任何方法來基于歷史項目訓(xùn)練所訓(xùn)練的模型。根據(jù)本發(fā)明的實施例,假設(shè)所訓(xùn)練的模型可以是例如具有一些要確定的參數(shù)的正態(tài)、對數(shù)正態(tài)、伽瑪和泊松密度函數(shù)模型等預(yù)定模型,并且訓(xùn)練方法涉及使用已知歷史項目以通過任何已知逼近方法來計算那些參數(shù),以便所訓(xùn)練的模型可最準(zhǔn)確地反映那些歷史項目。
[0034]可選地,分析系統(tǒng)100還包括歷史DB存儲160以存儲歷史項目。訓(xùn)練器140可采用持續(xù)方式來訓(xùn)練所訓(xùn)練的模型,即,當(dāng)由分析系統(tǒng)100分析用戶的新音頻數(shù)據(jù)時,訓(xùn)練器140可使用包括對應(yīng)于新音頻數(shù)據(jù)的頻譜數(shù)據(jù)的分解樣式、用戶的背景信息和等級的實際得分的新項目以及歷史項目來保持所訓(xùn)練的模型。通過持續(xù)地使用實踐結(jié)果保持所訓(xùn)練的模型,基于所訓(xùn)練的模型的評分器130能提供越來越準(zhǔn)確的結(jié)果。
[0035]如以上所描述的,預(yù)定特征向量可以從多個已存在的音頻數(shù)據(jù)中導(dǎo)出。為了導(dǎo)出預(yù)定特征向量,可選地,分析系統(tǒng)100還包括:存儲與各用戶相關(guān)的大量音頻數(shù)據(jù)的音頻存儲170 ;存儲從存儲于音頻存儲中的音頻數(shù)據(jù)所變換的頻譜數(shù)據(jù)的頻譜存儲180 ;以及適應(yīng)于處理頻譜存儲180中的頻譜以生成預(yù)定特征向量的特征向量生成器190。存儲于音頻存儲170中的音頻數(shù)據(jù)可以采用數(shù)字形式,并且類似于音頻變換器的操作,音頻數(shù)據(jù)可以使用任何已知方法(例如FFT、STE, MFCC以及LPC)變換到頻譜域并在頻譜存儲180中存儲作為頻譜數(shù)據(jù)。根據(jù)應(yīng)用的實施例,特征向量生成器190使用主成分分析(PCA)法從存儲在頻譜存儲180上的頻譜數(shù)據(jù)導(dǎo)出預(yù)定特征向量,然而,可從作為基礎(chǔ)的頻譜數(shù)據(jù)導(dǎo)出預(yù)定特征向量的任何方法在本申請的保護范圍內(nèi)也可以是可應(yīng)用的。
[0036]通過使用分析系統(tǒng)100,用戶特定音頻數(shù)據(jù)或由用戶個性化的音頻數(shù)據(jù)可用于特性化除了普通的用戶背景信息以外的用戶的偏好。那些音頻數(shù)據(jù)可反映用戶的某個特性并可與用戶的偏好具有某種隱含的關(guān)聯(lián),本發(fā)明的分析系統(tǒng)100提供了操作(leverage)那些用戶音頻數(shù)據(jù)的新的方式,并可使用于各種應(yīng)用用于幫助找出用戶的偏好。
[0037]圖2示出根據(jù)本發(fā)明的實施例的用于分析與用戶相關(guān)的音頻數(shù)據(jù)的分析方法200的流程圖。分析方法200可以由本發(fā)明的分析系統(tǒng)100來執(zhí)行。分析方法200開始于步驟S210,其中與用戶相關(guān)的音頻數(shù)據(jù)被變換為頻譜數(shù)據(jù)。與用戶相關(guān)的音頻數(shù)據(jù)可以是任何用戶特定音頻數(shù)據(jù),例如可以是在電信系統(tǒng)中由用戶個性化的呼叫者回鈴音、由用戶說的某個東西或可以由用戶個性化以反映用戶的興趣或特性的任何其它音頻數(shù)據(jù)。在步驟S210中,存在可用于將音頻數(shù)據(jù)變換為頻譜域的很多方式。根據(jù)本發(fā)明的實施例,可采用FFT(快速傅里葉變換)以將音頻數(shù)據(jù)變換為頻譜數(shù)據(jù)。應(yīng)該注意到其它技術(shù)(例如STE、MFCC和LPC中的任一個)也可用于變換音頻數(shù)據(jù)??蛇x地,步驟S210的過程可由分析系統(tǒng)100的音頻變換器110來執(zhí)行。
[0038]然后方法200前進到步驟S220,其中將在步驟S210中所獲得的頻譜數(shù)據(jù)分解為預(yù)定特征向量以獲得頻譜數(shù)據(jù)的分解樣式。從多個已存在的音頻數(shù)據(jù)導(dǎo)出預(yù)定特征向量,并且用于導(dǎo)出預(yù)定特征向量的步驟將結(jié)合圖3在下文描述。根據(jù)本發(fā)明的實施例,頻譜數(shù)據(jù)的分解樣式可以根據(jù)結(jié)合如上所述的式子(I)- (3)的描述而獲得??蛇x地,步驟S220的過程可由分析系統(tǒng)100的樣式識別器120來執(zhí)行。
[0039]基于在步驟S220中所獲得的頻譜數(shù)據(jù)的分解樣式以及可以從例如CRM(消費者關(guān)系管理)系統(tǒng)或EDW (企業(yè)數(shù)據(jù)庫)系統(tǒng)等某個傳統(tǒng)的支持系統(tǒng)檢索到的用戶的背景信息,在步驟S230中,使用所訓(xùn)練的模型來計算與用戶相關(guān)的多個等級的假設(shè)得分。如以前所描述的,根據(jù)本發(fā)明的實施例,機器學(xué)習(xí)的概率性方法可在步驟S230中使用,并且所訓(xùn)練的模型可以是用于機器學(xué)習(xí)的概率性方法的概率模型。還可以基于上述樸素貝葉斯分類器來計算多個等級的假設(shè)得分??蛇x地,步驟S230的過程可由分析系統(tǒng)100的評分器130來執(zhí)行。
[0040]此外,在已經(jīng)在步驟S230中計算出多個等級的假設(shè)得分之后,分析方法還可包括步驟S240以將用戶歸類于所有多個等級中的具有最高假設(shè)得分的等級。步驟S240還可由分析系統(tǒng)100的評分器130來執(zhí)行。
[0041]可選地,在已經(jīng)在步驟S230中使用用戶的背景信息以計算多個等級的假設(shè)得分之前,方法還包括用于將用戶的背景信息轉(zhuǎn)換為數(shù)字值(尤其是其范圍為從O到I)的步驟,該步驟可由分析系統(tǒng)100的標(biāo)準(zhǔn)化器150來執(zhí)行,以便這樣的背景信息可以容易地在步驟S230中使用。
[0042]可選地,所訓(xùn)練的模型應(yīng)該在使用于步驟S230之前被訓(xùn)練,所訓(xùn)練的模型可以基于歷史項目來訓(xùn)練。每個歷史項目對應(yīng)于通過分析方法在以前分析的音頻數(shù)據(jù),其可包括對應(yīng)于歷史用戶的歷史音頻數(shù)據(jù)的頻譜數(shù)據(jù)的分解樣式、歷史用戶的屬性以及歷史用戶的多個等級中的一個等級的實際得分。本發(fā)明的分析方法還包括用于基于歷史項目使用機器學(xué)習(xí)的概率性方法領(lǐng)域中已知的任何方法來訓(xùn)練所訓(xùn)練的模型的步驟。
[0043]此外,所訓(xùn)練的模型應(yīng)該以持續(xù)的方式來訓(xùn)練,即,當(dāng)由分析方法分析用戶的新音頻數(shù)據(jù)時,分析方法還包括用于使用包括對應(yīng)于新音頻數(shù)據(jù)的頻譜數(shù)據(jù)的分解樣式、用戶的背景信息和等級的實際得分的新項目以及歷史項目來保持所訓(xùn)練的模型的方法步驟。通過使用實踐結(jié)果持續(xù)地保持所訓(xùn)練的模型,所訓(xùn)練的模型可提供更準(zhǔn)確的結(jié)果??蛇x地,用于訓(xùn)練和保持所訓(xùn)練的模型的方法步驟可由分析系統(tǒng)100的訓(xùn)練器140來執(zhí)行。
[0044]如上所述,預(yù)定特征向量可以從多個已存在的音頻數(shù)據(jù)中導(dǎo)出。圖3示出根據(jù)本發(fā)明的實施例的用于生成預(yù)定特征向量的圖2的分析方法的步驟S220的流程圖。在步驟S310中,使用任何用于將數(shù)字信號變換為頻譜域的已知方法(例如FFT)將可存儲于分析系統(tǒng)100的音頻存儲170中的多個音頻數(shù)據(jù)變換為頻譜數(shù)據(jù)。頻譜數(shù)據(jù)可存儲于分析系統(tǒng)100的頻譜存儲180中。然后在步驟S320中,處理在步驟S310中所獲得的頻譜數(shù)據(jù)以生成預(yù)定特征向量。根據(jù)本申請的實施例,使用主成分分析(PCA)法從頻譜數(shù)據(jù)中導(dǎo)出預(yù)定特征向量,然而,可從作為基礎(chǔ)的頻譜數(shù)據(jù)導(dǎo)出預(yù)定特征向量的任何方法在本申請的保護范圍內(nèi)也可以是可應(yīng)用的。
[0045]根據(jù)本發(fā)明的分析方法,用戶特定音頻數(shù)據(jù)或由用戶個性化的音頻數(shù)據(jù)可用于特性化用戶的除了普通的用戶背景信息以外的偏好。那些音頻數(shù)據(jù)可反映用戶的某個特性并可與用戶的偏好具有某種隱含的關(guān)聯(lián),本發(fā)明的分析方法提供了用于操作那些用戶的音頻數(shù)據(jù)的新方式,并可使用于各種應(yīng)用用于幫助找出用戶的偏好。
[0046]圖4示出根據(jù)本發(fā)明的實施例的使用分析系統(tǒng)的電話營銷系統(tǒng)400。電話營銷系統(tǒng)400包括電話營銷控制器410和根據(jù)本發(fā)明的實施例的分析系統(tǒng)420。如圖4所示,電話營銷系統(tǒng)400的銷售人員440可經(jīng)由電話營銷控制器410從例如CRM (消費者關(guān)系管理)系統(tǒng)或EDW (企業(yè)數(shù)據(jù)庫)系統(tǒng)等支持系統(tǒng)430中選擇消費者450,并且然后撥打所選擇的消費者。然后消費者的CRBT將記錄于電話營銷控制器410。電話營銷控制器410將消費者的CRBT以及來自支持系統(tǒng)430的其它背景信息發(fā)送到分析系統(tǒng)420。分析系統(tǒng)420將立即開始分析CRBT和背景信息以輸出評分結(jié)果。當(dāng)對消費者450進行電話營銷時,銷售人員440可立即獲得評分結(jié)果以供早期反饋以做決定以及采取合適的措施。在電話營銷后,銷售人員440可提供銷售結(jié)果(即實際得分)到電話營銷控制器410,并且電話營銷控制器410將這樣的實際得分發(fā)送給分析系統(tǒng)420,以便此實際得分和對應(yīng)CRBT以及用戶的背景信息可用于保持由分析系統(tǒng)420的評分器使用的所訓(xùn)練的模型并且可作為歷史項目而存儲到分析系統(tǒng)420的歷史DB存儲中。
[0047]使用本申請的分析系統(tǒng),電話營銷系統(tǒng)將具有下文的好處,即分析系統(tǒng)可幫助銷售人員作出個性化的決定并基于早期分析結(jié)果為呼叫做出更好的準(zhǔn)備以及可以為每個電話營銷嘗試保持并持續(xù)地改進所訓(xùn)練的模型,這又幫助銷售人員獲得成績提高并提升他的效率。
[0048]應(yīng)該注意到,在分析系統(tǒng)100中,取決于要實現(xiàn)的功能而在邏輯上劃分其中的部件,但是本發(fā)明不限于此,可以取決于要求而重新劃分或組合分析系統(tǒng)100中的相應(yīng)部件,例如,一些部件可以組合為單個部件,或一些部件可以進一步劃分為更多的子部件。
[0049]本發(fā)明的實施例可以采用硬件或作為運行在一個或多個處理器上的軟件模塊或采用其組合來實現(xiàn)。即,本領(lǐng)域技術(shù)人員將意識到,例如專用集成電路(ASIC)或數(shù)字信號處理器(DSP)等具體硬件電路可用于實踐以實現(xiàn)根據(jù)本發(fā)明的實施例的分析系統(tǒng)100的所有部件的一些或所有的功能性。分析系統(tǒng)100的部件的一些或所有功能性可備選地通過與例如計算機程序結(jié)合的應(yīng)用服務(wù)器的微處理器來實現(xiàn),當(dāng)該計算機程序運行在微處理器上時,該計算機程序使應(yīng)用服務(wù)器執(zhí)行例如如上所述的分析方法的步驟。本發(fā)明還可實施為用于執(zhí)行任何本文所描述的方法的部分或全部的一個或多個裝置或器件程序(例如計算機程序和計算機程序產(chǎn)品)。實施本發(fā)明的這樣的程序可以存儲在計算機可讀介質(zhì)上,或可以例如采用一個或多個信號的形式。這樣的信號可以是從因特網(wǎng)網(wǎng)站可下載的數(shù)據(jù)信號,或在載波信號上提供,或采用任何其它形式。
[0050]例如,圖5示出服務(wù)器(例如應(yīng)用服務(wù)器),其可實現(xiàn)本申請的實施例,服務(wù)器以傳統(tǒng)方式可包括處理器510和采用存儲器520的形式的計算機程序產(chǎn)品/計算機可讀介質(zhì)。存儲器520可以是電子存儲器,例如可以是閃速存儲器、EEPROM (電可擦除可編程只讀存儲器)、EPR0M(可擦除可編程只讀存儲器)、硬盤或ROM。存儲器520可具有程序代碼空間530,該程序代碼用于執(zhí)行以上描述的任何方法步驟。例如,程序代碼空間530可包括用于如以前在步驟S210中描述的將與用戶相關(guān)的音頻數(shù)據(jù)變換為頻譜數(shù)據(jù)的程序531,用于如以前在步驟S220中描述的將頻譜數(shù)據(jù)分解為預(yù)定特征向量以獲得頻譜數(shù)據(jù)的分解樣式的程序532,用于如以前在步驟S230中描述的使用所訓(xùn)練的模型計算與用戶相關(guān)的多個等級的假設(shè)得分的程序533,以及用于如以前在步驟S240中描述的將用戶歸類于所有多個等級中具有最高假設(shè)得分的等級的程序534。程序代碼可已經(jīng)寫入一個或多個計算機程序產(chǎn)品,并可以或已經(jīng)從一個或多個計算機程序產(chǎn)品讀出,該計算機程序產(chǎn)品(即程序代碼載體)例如可以是硬盤、壓縮盤(CD)、存儲器卡或軟盤。這樣的計算機程序產(chǎn)品通常是可以是如在圖6中所圖示的便攜式或固定式的存儲器單元。其可具有大體上如在圖5的服務(wù)器的存儲器520中地安排的存儲器段、存儲器元件和存儲器空間。例如可以采用合適的方式來壓縮程序代碼。一般而言,存儲器單元因此包括計算機可讀代碼,即可由電子處理器(例如510)讀取的代碼,其當(dāng)由服務(wù)器運行時使服務(wù)器執(zhí)行用于執(zhí)行服務(wù)器根據(jù)以上描述進行的一個或多個過程或過程步驟的步驟。
[0051]應(yīng)該注意到前述實施例用于說明本發(fā)明而不是限制本發(fā)明,可以由本領(lǐng)域技術(shù)人員設(shè)計替代實施例而不背離所附權(quán)利要求的范圍。詞語“包括”不排除存在但沒有在權(quán)利要求中列出的元件或步驟。元件前面的詞語“一”不排除多個這樣的元件的存在。本發(fā)明可以利用包括若干不同元件的硬件或利用合適地編程的計算機來實現(xiàn)。在列出若干組件的單元權(quán)利要求中,這些組件中的若干個可以具體地實施于相同的硬件項目中。這樣的詞語(如第一、第二、第三)的使用不表示任何順序,其可簡單地解釋為名稱。
【權(quán)利要求】
1.一種用于分析與用戶相關(guān)的音頻數(shù)據(jù)的分析系統(tǒng),包括: 音頻變換器,適應(yīng)于將所述音頻數(shù)據(jù)變換為頻譜數(shù)據(jù); 樣式識別器,適應(yīng)于將所述頻譜數(shù)據(jù)分解為預(yù)定特征向量以獲得所述頻譜數(shù)據(jù)的分解樣式;以及 評分器,適應(yīng)于基于所述頻譜數(shù)據(jù)的所述分解樣式和所述用戶的屬性而使用所訓(xùn)練的模型來計算與所述用戶相關(guān)的多個等級的假設(shè)得分。
2.根據(jù)權(quán)利要求1所述的音頻分析系統(tǒng),其中所述評分器適應(yīng)于將所述用戶歸類于在所有多個等級中具有最高假設(shè)得分的等級。
3.根據(jù)權(quán)利要求1或2所述的音頻分析系統(tǒng),還包括: 訓(xùn)練器,適應(yīng)于基于至少一個歷史項目來訓(xùn)練所述所訓(xùn)練的模型,每個歷史項目包括對應(yīng)于歷史用戶的歷史音頻數(shù)據(jù)的頻譜數(shù)據(jù)的分解樣式、所述歷史用戶的屬性以及用于所述歷史用戶的所述多個等級中的一個等級的實際得分。
4.根據(jù)權(quán)利要求3所述的音頻分析系統(tǒng),其中所述訓(xùn)練器適應(yīng)于基于所述歷史項目和新項目來保持所述所訓(xùn)練的模型,所述新項目包括所述頻譜數(shù)據(jù)的分解樣式、所述用戶的屬性以及所述多個等級中的實際等級的實際得分。
5.根據(jù)權(quán)利要求1-4中的任一項所述的音頻分析系統(tǒng),其中所述評分器基于樸素貝葉斯分類器,并且所述多個等級的假設(shè)得分是所述頻譜數(shù)據(jù)的分解樣式和所述用戶的屬性上的多個等級的后驗概率。`
6.根據(jù)權(quán)利要求1-5中的任一項所述的音頻分析系統(tǒng),還包括: 音頻數(shù)據(jù)庫,存儲與各用戶相關(guān)的音頻數(shù)據(jù); 頻譜數(shù)據(jù)庫,存儲從存儲于所述音頻數(shù)據(jù)庫中的所述音頻數(shù)據(jù)所變換的頻譜;以及 特征向量生成器,適應(yīng)于使用主成分分析法處理所述頻譜數(shù)據(jù)庫中的頻譜以生成預(yù)定特征向量。
7.根據(jù)權(quán)利要求1-6中的任一項所述的音頻分析系統(tǒng),其中所述頻譜數(shù)據(jù)的分解樣式是所述預(yù)定特征向量的分解因數(shù)。
8.根據(jù)權(quán)利要求1-7中的任一項所述的音頻分析系統(tǒng),包括: 屬性標(biāo)準(zhǔn)化器,適應(yīng)于將所述用戶的屬性轉(zhuǎn)換成范圍是從O到I的數(shù)字值。
9.根據(jù)權(quán)利要求1-8中的任一項所述的音頻分析系統(tǒng),其中所述用戶的屬性包括與所述用戶相關(guān)的年齡、性別、城市中的一個或多個。
10.根據(jù)權(quán)利要求1-9中的任一項所述的音頻分析系統(tǒng),其中與所述用戶相關(guān)的音頻包括所述用戶的呼叫者回鈴音。
11.一種用于分析用戶的音頻數(shù)據(jù)的分析方法,包括步驟: 將與所述用戶相關(guān)的音頻數(shù)據(jù)變換為頻譜數(shù)據(jù); 將所述頻譜數(shù)據(jù)分解為預(yù)定特征向量以獲得所述頻譜數(shù)據(jù)的分解樣式;以及 基于所述頻譜數(shù)據(jù)的分解樣式和所述用戶的屬性而使用所訓(xùn)練的模型來計算與所述用戶相關(guān)的多個等級的假設(shè)得分。
12.根據(jù)權(quán)利要求1所述的音頻分析方法,包括步驟: 將所述用戶歸類于在所有所述多個等級中具有最高假設(shè)得分的等級。
13.根據(jù)權(quán)利要求11或12的所述的音頻分析方法,包括步驟:基于歷史項目來訓(xùn)練所述所訓(xùn)練的模型,每個歷史項目包括對應(yīng)于歷史用戶的歷史音頻數(shù)據(jù)的頻譜數(shù)據(jù)的分解樣式、所述歷史用戶的屬性以及用于所述歷史用戶的所述多個等級中的一個等級的實際得分。
14.根據(jù)權(quán)利要求13所述的音頻分析方法,包括步驟: 基于所述歷史項目和新項目來保持所述所訓(xùn)練的模型,所述新項目包括所述頻譜數(shù)據(jù)的分解樣式、所述用戶的屬性以及所述多個等級的實際等級的實際得分。
15.根據(jù)權(quán)利要求11-14中的任一項所述的音頻分析方法,其中所述計算多個等級的假設(shè)得分的步驟基于樸素貝葉斯分類器,以及所述多個等級的假設(shè)得分是在所述頻譜數(shù)據(jù)的分解樣式和所述用戶的屬性上的所述多個等級的后驗概率。
16.根據(jù)權(quán)利要求11-15中的任一項所述的音頻分析方法,還包括步驟: 將存儲于音頻數(shù)據(jù)庫的與各用戶相關(guān)的音頻數(shù)據(jù)變換為對應(yīng)頻譜; 使用主成分分析法處理所述對應(yīng)頻譜以生成所述預(yù)定特征向量。
17.根據(jù)權(quán)利要求11-16中的任一項所述的音頻分析方法,其中所述頻譜數(shù)據(jù)的分解樣式是所述預(yù)定特征向量的分解因數(shù)。
18.根據(jù)權(quán)利要求11-17中的任一項所述的音頻分析方法,包括步驟: 在所述計算所述多個等級的假設(shè)得分的步驟之前,將所述用戶的屬性轉(zhuǎn)換成范圍為從O到I的數(shù)字值。
19.根據(jù)權(quán)利要求11-18中的任一項所述的音頻分析方法,其中所述用戶的屬性包括與所述用戶相關(guān)的年齡、性別、城市中的一個或多個。
20.根據(jù)權(quán)利要求11-19中的任一項所述的音頻分析方法,其中與所述用戶相關(guān)的音頻包括所述用戶的呼叫者回鈴音。
21.一種電話營銷系統(tǒng),包括根據(jù)權(quán)利要求1-10中的任一項所述的音頻分析系統(tǒng)以分析與所述電話營銷系統(tǒng)的消費者相關(guān)的音頻。
22.—種計算機程序,包括計算機可讀代碼,當(dāng)所述計算機可讀代碼運行于應(yīng)用服務(wù)器上時,所述計算機可讀代碼使所述應(yīng)用服務(wù)器執(zhí)行根據(jù)權(quán)利要求11-20中的任一項所述的方法。
23.一種計算機可讀介質(zhì),在其上存儲有根據(jù)權(quán)利要求22所述的計算機程序。
【文檔編號】G10L15/08GK103493126SQ201080070350
【公開日】2014年1月1日 申請日期:2010年11月25日 優(yōu)先權(quán)日:2010年11月25日
【發(fā)明者】劉青焱, 李強, O.倫德斯特倫, 麥興隆 申請人:愛立信(中國)通信有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1