本發(fā)明屬于自然語言處理,具體涉及一種融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法。
背景技術(shù):
1、服務(wù)質(zhì)量不同于可直接接觸的實物產(chǎn)品,它的生產(chǎn)和消費是一體的,因此它更多地依賴于客戶體驗到的與服務(wù)提供者的交互過程,具有無形性的特點。由于不同的人對服務(wù)的需求和期望不盡相同,服務(wù)質(zhì)量的評價標(biāo)準(zhǔn)還具有一定的主觀性和靈活性。這些特點使服務(wù)質(zhì)量評估變得困難,因為必須同時考慮到服務(wù)提供者,消費者,服務(wù)過程等多個因素。為了更好地對服務(wù)質(zhì)量進(jìn)行評估,基于差距分析法的servqual模型被提出,逐漸成為服務(wù)質(zhì)量分析領(lǐng)域的主流模型。該模型將服務(wù)質(zhì)量視為一個多維度概念,具體確定了有形性、可靠性、響應(yīng)性、保證性和移情性五個維度。并將服務(wù)質(zhì)量定義為顧客對服務(wù)的預(yù)期與實際體驗到的服務(wù)水平之間的差距,即認(rèn)為顧客服務(wù)質(zhì)量感知值等于顧客服務(wù)質(zhì)量感知值與顧客服務(wù)質(zhì)量期望值間的差。servqual模型雖應(yīng)用廣泛,但依舊存在著一些不足之處。首先,servqual模型的實施需要根據(jù)具體領(lǐng)域設(shè)計量表,并將其擴(kuò)充為問卷發(fā)放給顧客進(jìn)行調(diào)研,然而實際上愿意填寫調(diào)查問卷的顧客占比較少。隨后還需要收集數(shù)據(jù)、分析結(jié)果等一系列復(fù)雜的操作,需要投入較大的人力和物力成本。其次,servqual模型僅能體現(xiàn)當(dāng)前時刻的服務(wù)質(zhì)量水平,無法對服務(wù)質(zhì)量變化趨勢進(jìn)行追蹤和預(yù)測,使得其在服務(wù)質(zhì)量持續(xù)改進(jìn)方面的應(yīng)用受到限制。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的是提出一種融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,該方法首先通過基于預(yù)訓(xùn)練模型的評論主題提取方法從大規(guī)模線上評論中獲取評論主題及其關(guān)鍵詞并將其映射到servqual模型的維度中。其次,采用文本結(jié)構(gòu)、內(nèi)在語義、外部知識三種超邊構(gòu)造方法將每條評論構(gòu)造為超圖,并使用超圖注意力網(wǎng)絡(luò)對其進(jìn)行處理以提取出顧客的實際感知的服務(wù)質(zhì)量水平。隨后對顧客服務(wù)質(zhì)量期望值進(jìn)行提取,求它與實際感知之間的差作為每條評論反映出的顧客服務(wù)質(zhì)量感知值。再結(jié)合該評價對應(yīng)的評論主題,得出顧客分別在servqual模型的五個不同維度上的滿意度。
2、本發(fā)明通過下述技術(shù)方案來實現(xiàn)。
3、一種融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,步驟如下:
4、步驟一:收集線上網(wǎng)絡(luò)平臺數(shù)據(jù)并構(gòu)建數(shù)據(jù)集;所述線上網(wǎng)絡(luò)平臺數(shù)據(jù)至少包括顧客評論;
5、步驟二:提取顧客評論中蘊(yùn)含的評論主題并確定每個評論主題的關(guān)鍵詞及其權(quán)重;
6、步驟三:對提取的評論主題及關(guān)鍵詞進(jìn)行調(diào)整以優(yōu)化評論主題;
7、步驟四:使用服務(wù)質(zhì)量維度點互信息算法將評論主題映射到servqual模型的五個維度上;
8、步驟五:在數(shù)據(jù)集上進(jìn)行置信學(xué)習(xí)找出標(biāo)簽錯誤樣本并人工更正;
9、步驟六:將顧客評論構(gòu)建為包含文本結(jié)構(gòu)、內(nèi)在語義、外部知識三種類型超邊的超圖,再將超圖輸入超圖注意力網(wǎng)絡(luò)中處理,從而得到顧客評論中蘊(yùn)含的顧客服務(wù)質(zhì)量感知值;
10、步驟七:使用威爾遜區(qū)間法求商家的期望評分,隨后通過貝葉斯平均法修正商家的期望評分;將商家的期望評分和顧客歷史評分均值相加并歸一化作為顧客服務(wù)質(zhì)量期望值;
11、步驟八:結(jié)合評論主題、顧客服務(wù)質(zhì)量期望值、顧客服務(wù)質(zhì)量感知值三個因素,得出顧客分別在servqual模型的五個不同維度上的滿意度。
12、進(jìn)一步優(yōu)選,所述線上網(wǎng)絡(luò)平臺數(shù)據(jù)還包括商家信息、顧客信息和顧客評分。
13、進(jìn)一步優(yōu)選,使用基于預(yù)訓(xùn)練模型roberta的評論主題建模方法來提取顧客評論中蘊(yùn)含的評論主題。
14、進(jìn)一步優(yōu)選,使用c-tf-idf算法確定每個評論主題的關(guān)鍵詞及其權(quán)重;
15、進(jìn)一步優(yōu)選,通過設(shè)置停用詞、更改最小詞頻、調(diào)整n-gram參數(shù)三種方式,對提取的評論主題及關(guān)鍵詞進(jìn)行調(diào)整以優(yōu)化評論主題。
16、進(jìn)一步優(yōu)選,步驟四中,構(gòu)造servqual模型五個維度上的種子詞,將每個評論主題中的關(guān)鍵詞與servqual模型五個維度的種子詞均構(gòu)建為詞語集合;采用服務(wù)質(zhì)量維度點互信息算法(sq-pmi)來計算集合間的相關(guān)值,將評論主題動態(tài)映射到servqual模型的五個維度上。
17、進(jìn)一步優(yōu)選,步驟五中,將數(shù)據(jù)集中的所有顧客評論數(shù)據(jù)分為五等份,再使用fasttext模型在數(shù)據(jù)上進(jìn)行五折交叉驗證,在交叉驗證的過程中求取估計噪聲標(biāo)簽和真實標(biāo)簽的聯(lián)合分布矩陣,最后對照聯(lián)合分布矩陣篩選出低于置信閾值的樣本,即為標(biāo)簽錯誤樣本,其余為標(biāo)簽正確樣本,再將標(biāo)簽錯誤樣本人工更正。
18、進(jìn)一步優(yōu)選,步驟六中,將每一條顧客評論構(gòu)建為超圖,首先,對顧客評論進(jìn)行分詞,以詞語作為圖的節(jié)點,再采用固定大小的滑動窗口來獲取全局詞共現(xiàn),作為順序上下文以此作為超圖的文本結(jié)構(gòu)超邊,將節(jié)點中屬于同一評論主題的單詞用同一條超邊相連以此作為內(nèi)在語義超邊,從conceptnet知識圖譜中獲取外部知識,并構(gòu)建外部知識超邊;在超圖處理環(huán)節(jié)中,將構(gòu)建好的超圖送入超圖注意力網(wǎng)絡(luò)中,超圖注意力網(wǎng)絡(luò)將輸出顧客評論中蘊(yùn)含的顧客服務(wù)質(zhì)量感知值。
19、本發(fā)明在融入servqual模型的五個維度與顧客服務(wù)質(zhì)量感知值計算方法的基礎(chǔ)上,利用顧客評論文本的文本順序結(jié)構(gòu)、內(nèi)部語義關(guān)聯(lián)與知識圖譜三元組知識一起構(gòu)建超圖,再將超圖嵌入至圖神經(jīng)網(wǎng)絡(luò)中處理,具有以下優(yōu)點:
20、1.將傳統(tǒng)的servqual模型與深度學(xué)習(xí)技術(shù)相結(jié)合,對線上評論進(jìn)行情感分析、評論主題建模等處理,從而動態(tài)持續(xù)的對顧客的滿意度進(jìn)行分析,避免了傳統(tǒng)分析辦法中需要設(shè)計、發(fā)放與回收問卷的繁瑣過程。
21、2.設(shè)計了一種評論主題模型與servqual模型的五個維度之間的動態(tài)映射法,使得每一條評價都能被映射到servqual模型的一個維度中。并為難以量化衡量的顧客服務(wù)質(zhì)量期望值提出了一種提取方法。提升了深度學(xué)習(xí)模型與servqual模型之間的契合程度,使它們能夠更好的構(gòu)成一個有機(jī)整體共同對評價進(jìn)行分析。
22、3.分別采用評價文本的順序結(jié)構(gòu)、內(nèi)部潛在的語義信息和知識圖譜提供的外部知識為評價超圖構(gòu)建超邊。三種不同類型的超邊具有互補(bǔ)性,能夠為評價超圖提供多源異構(gòu)的特征并豐富超圖蘊(yùn)含的語義信息。
23、4.引入焦點損失提高模型在樣本不均衡數(shù)據(jù)集上的魯棒性,在正負(fù)比例極端的樣本數(shù)據(jù)集上能夠做到動態(tài)權(quán)重調(diào)整,增加少數(shù)類樣本損失值權(quán)重從而提升網(wǎng)絡(luò)性能。
1.一種融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,其特征在于,步驟如下:
2.根據(jù)權(quán)利要求1所述的融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,其特征在于,所述線上網(wǎng)絡(luò)平臺數(shù)據(jù)還包括商家信息、顧客信息和顧客評分。
3.根據(jù)權(quán)利要求1所述的融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,其特征在于,使用基于預(yù)訓(xùn)練模型roberta的評論主題建模方法來提取顧客評論中蘊(yùn)含的評論主題。
4.根據(jù)權(quán)利要求1所述的融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,其特征在于,使用c-tf-idf算法確定每個評論主題的關(guān)鍵詞及其權(quán)重。
5.根據(jù)權(quán)利要求1所述的融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,其特征在于,通過設(shè)置停用詞、更改最小詞頻、調(diào)整n-gram參數(shù)三種方式,對提取的評論主題及關(guān)鍵詞進(jìn)行調(diào)整以優(yōu)化評論主題。
6.根據(jù)權(quán)利要求1所述的融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,其特征在于,步驟四中,構(gòu)造servqual模型五個維度上的種子詞,將每個評論主題中的關(guān)鍵詞與servqual模型五個維度的種子詞均構(gòu)建為詞語集合;采用服務(wù)質(zhì)量維度點互信息算法來計算集合間的相關(guān)值,將評論主題動態(tài)映射到servqual模型的五個維度上,服務(wù)質(zhì)量維度點互信息算法用下式表示:
7.根據(jù)權(quán)利要求1所述的融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,其特征在于,步驟五中,將數(shù)據(jù)集中的所有顧客評論數(shù)據(jù)分為五等份,再使用fasttext模型在數(shù)據(jù)上進(jìn)行五折交叉驗證,在交叉驗證的過程中求取估計噪聲標(biāo)簽和真實標(biāo)簽的聯(lián)合分布矩陣,最后對照聯(lián)合分布矩陣篩選出低于置信閾值的樣本,即為標(biāo)簽錯誤樣本,其余為標(biāo)簽正確樣本,再將標(biāo)簽錯誤樣本人工更正。
8.根據(jù)權(quán)利要求1所述的融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,其特征在于,使用威爾遜區(qū)間法求商家的期望評分,用下式表示:
9.根據(jù)權(quán)利要求8所述的融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,其特征在于,通過貝葉斯平均法修正商家的期望評分,用下式表示:
10.根據(jù)權(quán)利要求1所述的融合超圖知識的服務(wù)質(zhì)量動態(tài)分析方法,其特征在于,步驟六中,將每一條顧客評論構(gòu)建為超圖,首先,對顧客評論進(jìn)行分詞,以詞語作為圖的節(jié)點,再采用固定大小的滑動窗口來獲取全局詞共現(xiàn)作為順序上下文,作為超圖的文本結(jié)構(gòu)超邊,將節(jié)點中屬于同一評論主題的單詞用同一條超邊相連以此作為內(nèi)在語義超邊,從conceptnet知識圖譜中獲取外部知識,并構(gòu)建外部知識超邊;在超圖處理環(huán)節(jié)中,將構(gòu)建好的超圖送入超圖注意力網(wǎng)絡(luò)中,超圖注意力網(wǎng)絡(luò)將輸出顧客評論中蘊(yùn)含的顧客服務(wù)質(zhì)量感知值。