基于文本挖掘技術(shù)的客戶投訴預(yù)警監(jiān)測(cè)分析系統(tǒng)的制作方法

文檔序號(hào)：12125840閱讀：來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>基于文本挖掘技術(shù)的客戶投訴預(yù)警監(jiān)測(cè)分析系統(tǒng)的制作方法與工藝

技術(shù)特征：

1.一種基于文本挖掘技術(shù)的投訴預(yù)警監(jiān)測(cè)分析系統(tǒng)，其特征在于，包括：

文本數(shù)據(jù)規(guī)范化模塊，用于將錄入的文本數(shù)據(jù)轉(zhuǎn)成統(tǒng)一規(guī)則的規(guī)范化數(shù)據(jù)模式；

規(guī)范化數(shù)據(jù)分析預(yù)警模塊，用于通過建立投訴分析等級(jí)聚類模型對(duì)規(guī)范化數(shù)據(jù)模式進(jìn)行分析，根據(jù)聚類結(jié)果劃分投訴風(fēng)險(xiǎn)等級(jí)，根據(jù)風(fēng)險(xiǎn)所在等級(jí)發(fā)出相應(yīng)的預(yù)警。

2.根據(jù)權(quán)利要求1所述的基于文本挖掘技術(shù)的投訴預(yù)警監(jiān)測(cè)分析系統(tǒng)，其特征在于，文本數(shù)據(jù)規(guī)范化模塊包括：

文本初始處理單元，用于對(duì)錄入的文本數(shù)據(jù)進(jìn)行分詞和去噪處理，獲得各個(gè)文本數(shù)據(jù)中的關(guān)鍵詞；

文本特征向量化單元，用于將各個(gè)關(guān)鍵詞進(jìn)行向量化并作歸一化處理，獲得由各個(gè)關(guān)鍵詞W_i在文件d_j中的向量化歸一化結(jié)果建立的實(shí)數(shù)值矩陣，關(guān)鍵詞W_i在文件d_j中的向量化歸一化結(jié)果為：

$<mrow> <msub> <mi>W</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>tf</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>×</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mrow> <mo>(</mo> <mfrac> <mi>N</mi> <msub> <mi>N</mi> <mi>i</mi> </msub> </mfrac> <mo>+</mo> <mn>0.01</mn> <mo>)</mo> </mrow> </mrow> <msqrt> <mrow> <msubsup> <mi>Σ</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </msubsup> <mo>-</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>tf</mi> <mrow> <mi>k</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>×</mo> <msup> <mrow> <mo>[</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mrow> <mo>(</mo> <mfrac> <mi>N</mi> <msub> <mi>N</mi> <mi>i</mi> </msub> </mfrac> <mo>+</mo> <mn>0.01</mn> <mo>)</mo> </mrow> <mo>]</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mfrac> </mrow>$

式中：N表示文件總數(shù)量；N_i表示包含關(guān)鍵詞W_i的文件數(shù)量；n為關(guān)鍵詞總次數(shù)；W_i為第i個(gè)關(guān)鍵詞；d_j表示第j個(gè)文件；tf_ij為關(guān)鍵詞W_i在文件d_j中的詞頻；為所有關(guān)鍵詞在文件d_j中的詞頻平方和；為文件總數(shù)量與包含關(guān)鍵詞W_i文件的數(shù)量比值加上調(diào)整項(xiàng)0.01后取對(duì)數(shù)；

文本數(shù)據(jù)相似性匹配單元，用于根據(jù)建立的實(shí)數(shù)值矩陣，利用余弦定理計(jì)算各關(guān)鍵詞間的余弦相似度，并將余弦距離最近的文本數(shù)據(jù)進(jìn)行匹配，形成近義詞詞庫；

規(guī)范化數(shù)據(jù)生成單元，用于將匹配好的文本數(shù)據(jù)按照設(shè)定的統(tǒng)一規(guī)范化模式生成規(guī)范化數(shù)據(jù)。

3.根據(jù)權(quán)利要求2所述的基于文本挖掘技術(shù)的投訴預(yù)警監(jiān)測(cè)分析系統(tǒng)，其特征在于，規(guī)范化數(shù)據(jù)分析預(yù)警模塊包括：

情感傾向度計(jì)算單元，用于對(duì)規(guī)范化數(shù)據(jù)進(jìn)行情感判斷并劃分為積極、消極和中心三類；

投訴風(fēng)險(xiǎn)等級(jí)劃分單元，用于根據(jù)客戶等級(jí)、業(yè)務(wù)類型、積極傾向度以及投訴歷史參數(shù)建立投訴分析等級(jí)聚類模型，并根據(jù)聚類結(jié)果制定投訴風(fēng)險(xiǎn)等級(jí)規(guī)則；

投訴分析預(yù)警單元，用于根據(jù)制定的投訴風(fēng)險(xiǎn)等級(jí)規(guī)則，選擇模型變量參數(shù)，利用貝葉斯分類建立分類學(xué)習(xí)模型，通過對(duì)分類學(xué)習(xí)模型的訓(xùn)練實(shí)現(xiàn)對(duì)未知文本數(shù)據(jù)的投訴風(fēng)險(xiǎn)等級(jí)的預(yù)測(cè)。

4.根據(jù)權(quán)利要求3所述的基于文本挖掘技術(shù)的投訴預(yù)警監(jiān)測(cè)分析系統(tǒng)，其特征在于，情感傾向度計(jì)算單元的具體工作步驟為：

(1)建立連詞和否定詞詞典庫；

(2)根據(jù)連詞和否定詞詞典庫從規(guī)范化數(shù)據(jù)中抽取連詞和否定詞，并標(biāo)記相應(yīng)詞在規(guī)范化數(shù)據(jù)中的位置；

(3)匹配現(xiàn)有的情感詞典庫，獲得詞匯的極性及其情感評(píng)分值；

(4)通過連詞位置，確定前句與后句所占比重，再根據(jù)否定詞位置判斷雙重否定以及鄰近詞匯的極性反轉(zhuǎn)；

(5)利用詞匯的極性及其情感評(píng)分值帶入連詞和否定詞后對(duì)規(guī)范化數(shù)據(jù)進(jìn)行累加獲得情感計(jì)算評(píng)分；

(6)循環(huán)步驟(2)至(5)，若情感計(jì)算評(píng)分為正則為積極，為負(fù)則為消極，否則為中心。

5.根據(jù)權(quán)利要求3所述的基于文本挖掘技術(shù)的投訴預(yù)警監(jiān)測(cè)分析系統(tǒng)，其特征在于，投訴風(fēng)險(xiǎn)等級(jí)規(guī)則用于根據(jù)聚類結(jié)果將投訴風(fēng)險(xiǎn)等級(jí)劃分為高危極、危險(xiǎn)級(jí)、有投訴傾向級(jí)、一般級(jí)以及無投訴傾向級(jí)這五個(gè)風(fēng)險(xiǎn)等級(jí)。

6.根據(jù)權(quán)利要求3所述的基于文本挖掘技術(shù)的投訴預(yù)警監(jiān)測(cè)分析系統(tǒng)，其特征在于，規(guī)范化數(shù)據(jù)分析預(yù)警模塊還包括：

模型驗(yàn)證單元，用于將驗(yàn)證集數(shù)據(jù)輸入建立的分類學(xué)習(xí)模型，獲得驗(yàn)證集數(shù)據(jù)中各文本數(shù)據(jù)的投訴風(fēng)險(xiǎn)等級(jí)，并將結(jié)果集與驗(yàn)證集數(shù)據(jù)中對(duì)應(yīng)的等級(jí)數(shù)據(jù)進(jìn)行比對(duì)，計(jì)算模型預(yù)測(cè)的正確率。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于文本挖掘技術(shù)的客戶投訴預(yù)警監(jiān)測(cè)分析系統(tǒng)的制作方法