本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,具體地涉及一種用于確定向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的方法和裝置。
背景技術(shù):
在互聯(lián)網(wǎng)領(lǐng)域,尤其是電商產(chǎn)品中,人機(jī)對(duì)話廣泛地用于網(wǎng)絡(luò)用戶(hù)查詢(xún)、投訴和售后等方面。在人機(jī)對(duì)話過(guò)程中,“機(jī)器人”(比如京東機(jī)器人jimi)能否切實(shí)幫助用戶(hù)解決實(shí)際問(wèn)題,是否能夠向用戶(hù)提供令其滿意的服務(wù),是衡量“機(jī)器人”系統(tǒng)是否完善的重要指標(biāo)。判斷該指標(biāo)是否達(dá)成的一大依據(jù)是用戶(hù)在人機(jī)對(duì)話后的反饋,這同時(shí)也是對(duì)“機(jī)器人”系統(tǒng)進(jìn)行改進(jìn)的重要資源。因此,對(duì)用戶(hù)所反饋的評(píng)價(jià)進(jìn)行收集是非常重要的。
在現(xiàn)有系統(tǒng)中,邀請(qǐng)用戶(hù)評(píng)價(jià)(簡(jiǎn)稱(chēng)“邀評(píng)”)是一種比較常用的方式。在傳統(tǒng)的人工客服體系中,接線員可以自行判斷是否已經(jīng)解決了用戶(hù)的問(wèn)題。此外,接線員還能憑感覺(jué)判斷用戶(hù)是否對(duì)自己的服務(wù)感到滿意(與問(wèn)題是否解決并非完全相關(guān))。當(dāng)判斷用戶(hù)滿意的情況下,接線員會(huì)觸發(fā)系統(tǒng)進(jìn)行邀評(píng),從而保證收集到的好評(píng)率比較高。但在人機(jī)對(duì)話系統(tǒng)中,只能由“機(jī)器人”通過(guò)會(huì)話內(nèi)容判斷中是否應(yīng)該彈出邀評(píng)提示以及何時(shí)彈出邀評(píng)提示,這在技術(shù)上很有挑戰(zhàn)性。
現(xiàn)有的人機(jī)對(duì)話中的邀評(píng)方式,基本是根據(jù)用戶(hù)在回答中輸入的文字是否包含關(guān)鍵詞來(lái)判斷的。比如,用戶(hù)輸入了“謝謝”、“非常感謝”這類(lèi)關(guān)鍵詞,可以理解為用戶(hù)的問(wèn)題已經(jīng)得到了解決,用戶(hù)表示感謝。此時(shí)彈出的邀評(píng)提示,獲得用戶(hù)好評(píng)的概率相對(duì)較高。又如,用戶(hù)的問(wèn)題中多次提到“您好”、“請(qǐng)”等關(guān)鍵詞,可以認(rèn)為用戶(hù)比較有禮貌,向這類(lèi)用戶(hù)進(jìn)行邀評(píng)獲得好評(píng)的概率也比較高。在這種方式中,可以根據(jù)經(jīng)驗(yàn)設(shè)置關(guān)鍵詞庫(kù),并針對(duì)用戶(hù)的每此輸入進(jìn)行關(guān)鍵詞匹配。一旦用戶(hù)的輸入命中關(guān)鍵詞,則彈出邀評(píng)提示。
此外,現(xiàn)有技術(shù)中還存在一些基于統(tǒng)計(jì)的方法,其實(shí)現(xiàn)流程是:
1.獲取一段時(shí)間內(nèi)的所有給過(guò)好評(píng)的用戶(hù)聊天日志;
2.依次將用戶(hù)聊天的每一句話做切詞處理(常用的切詞方法包括n-gram切詞方法),從而將句子轉(zhuǎn)化為詞的形式;
3.生成匯總詞列表,記錄每個(gè)詞出現(xiàn)的次數(shù),并取其中高頻詞,加入到關(guān)鍵詞庫(kù)。
綜上所述,目前業(yè)界比較常用的使用關(guān)鍵詞庫(kù)的判斷方法,詞庫(kù)的建設(shè)可以基于個(gè)人經(jīng)驗(yàn),也可以基于統(tǒng)計(jì)。最終,用戶(hù)的問(wèn)題一旦命中關(guān)鍵詞,則彈出邀評(píng)提示,以此保證收集到較高的好評(píng)率。
基于關(guān)鍵詞的方法,只能解決非常特殊的情況,如果用戶(hù)的問(wèn)題中沒(méi)有包含詞庫(kù)中的關(guān)鍵詞,那這種方法就很難判斷出機(jī)器人是否解決了用戶(hù)的問(wèn)題,也不知道用戶(hù)的評(píng)價(jià)傾向。此外,通過(guò)觀察歷史人機(jī)對(duì)話日志信息得知,大部分給出好評(píng)的用戶(hù),并沒(méi)有使用這些非常有限的標(biāo)示。因此,僅僅根據(jù)一些關(guān)鍵詞去做出邀評(píng)判斷,是有一定局限性的。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)中存在的上述問(wèn)題,本發(fā)明提出了一種用于確定向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的方法和裝置。
根據(jù)本發(fā)明的一個(gè)方面,提出了一種用于確定向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的方法。所述方法包括:從所述網(wǎng)絡(luò)用戶(hù)接收至少一個(gè)評(píng)論消息,所述評(píng)論消息指示所述網(wǎng)絡(luò)用戶(hù)在用戶(hù)端輸入的文本;將所述至少一個(gè)評(píng)論消息中的每一個(gè)中包括的文本分割成至少一個(gè)特征;將所述至少一個(gè)特征中的每一個(gè)與參考特征列表中的參考特征進(jìn)行匹配,所述參考特征列表中的每個(gè)參考特征具有權(quán)重值;針對(duì)存在匹配的特征,根據(jù)與其匹配的參考特征的權(quán)重值確定該特征的權(quán)重值;基于所有存在匹配的特征的權(quán)重值,確定所述網(wǎng)絡(luò)用戶(hù)的評(píng)價(jià)值;以及在所述評(píng)價(jià)值大于閾值的情況下,確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求。
優(yōu)選地,所述參考特征列表是由從特征庫(kù)中選出的特征組成的列表,其中,所述特征庫(kù)由對(duì)歷史文本進(jìn)行分割得到的特征組成,所述歷史文本包括正向歷史文本和負(fù)向歷史文本,所述正向歷史文本是由最終對(duì)相應(yīng)服務(wù)做出積極評(píng)價(jià)的用戶(hù)針對(duì)該相應(yīng)服務(wù)輸入的文本,所述負(fù)向歷史文本是由最終對(duì)相應(yīng)服務(wù)做出消極評(píng)價(jià)的用戶(hù)針對(duì)該相應(yīng)服務(wù)輸入的文本。
優(yōu)選地,針對(duì)特征庫(kù)中的特征x,通過(guò)以下公式來(lái)計(jì)算x的權(quán)重值w(x):
其中,m為正向歷史文本的數(shù)量,ti為第i個(gè)正向歷史文本中的特征總數(shù),ai(x)為x在第i個(gè)正向歷史文本中出現(xiàn)的次數(shù),n為負(fù)向歷史文本的數(shù)量,sj為第j個(gè)負(fù)向歷史文本中的特征總數(shù),bj(x)為x在第j個(gè)負(fù)向歷史文本中出現(xiàn)的次數(shù)。
優(yōu)選地,所述參考特征列表是由所述特征庫(kù)中具有較高權(quán)重值的特征組成的列表。
優(yōu)選地,所述特征庫(kù)中濾除了噪聲特征,所述噪聲特征是預(yù)先指定的。
優(yōu)選地,所述根據(jù)與其匹配的參考特征的權(quán)重值確定該特征的權(quán)重值包括:將與存在匹配的特征相匹配的參考特征的權(quán)重值確定為該存在匹配的特征的權(quán)重值。
優(yōu)選地,所述基于所有存在匹配的特征的權(quán)重值確定所述網(wǎng)絡(luò)用戶(hù)的評(píng)價(jià)值包括:通過(guò)預(yù)先指定的運(yùn)算規(guī)則,從所有存在匹配的特征的權(quán)重值計(jì)算出所述評(píng)價(jià)值。
優(yōu)選地,所述閾值是預(yù)先指定的并且能夠被更新。
優(yōu)選地,在將所述至少一個(gè)特征中的每一個(gè)與參考特征列表中的參考特征進(jìn)行匹配之前,所述方法還包括:將所述至少一個(gè)特征中的每一個(gè)與特定特征集合進(jìn)行匹配;當(dāng)所述至少一個(gè)特征中存在與所述特定特征集合中的特定特征匹配的特征時(shí),確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求。
根據(jù)本發(fā)明的另一方面,提出了一種用于確定向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的裝置。所述裝置包括:用戶(hù)接口,用于從所述網(wǎng)絡(luò)用戶(hù)接收至少一個(gè)評(píng)論消息,所述評(píng)論消息指示所述網(wǎng)絡(luò)用戶(hù)在用戶(hù)端輸入的文本;分割單元,用于將所述至少一個(gè)評(píng)論消息中的每一個(gè)中包括的文本分割成至少一個(gè)特征;以及確定單元。所述確定單元包括第一匹配模塊,用于將所述至少一個(gè)特征中的每一個(gè)與參考特征列表中的參考特征進(jìn)行匹配,所述參考特征列表中的每個(gè)參考特征具有權(quán)重值;權(quán)重值確定模塊,用于針對(duì)存在匹配的特征,根據(jù)與其匹配的參考特征的權(quán)重值確定該特征的權(quán)重值;評(píng)價(jià)值確定模塊,用于基于所有存在匹配的特征的權(quán)重值,確定所述網(wǎng)絡(luò)用戶(hù)的評(píng)價(jià)值;以及判斷模塊,在所述評(píng)價(jià)值大于閾值的情況下,確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求。
優(yōu)選地,所述裝置還包括:存儲(chǔ)單元,用于存儲(chǔ)歷史文本庫(kù)和特征庫(kù),其中所述歷史文本庫(kù)包括正向歷史文本和負(fù)向歷史文本,所述正向歷史文本是由最終對(duì)相應(yīng)服務(wù)做出積極評(píng)價(jià)的用戶(hù)針對(duì)該相應(yīng)服務(wù)輸入的文本,所述負(fù)向歷史文本是由最終對(duì)相應(yīng)服務(wù)做出消極評(píng)價(jià)的用戶(hù)針對(duì)該相應(yīng)服務(wù)輸入的文本,所述特征庫(kù)包括對(duì)所述歷史文本庫(kù)中的歷史文本進(jìn)行分割得到的特征;計(jì)算單元,用于為所述特征庫(kù)中的每個(gè)特征計(jì)算權(quán)重值;列表生成單元,用于基于所述計(jì)算單元的計(jì)算結(jié)果,從特征庫(kù)中的特征生成所述參考特征列表。
優(yōu)選地,所述計(jì)算單元被配置為:針對(duì)特征庫(kù)中的特征x,通過(guò)以下公式來(lái)計(jì)算x的權(quán)重值w(x):
其中,m為歷史文本庫(kù)中正向歷史文本的數(shù)量,ti為第i個(gè)正向歷史文本中的特征總數(shù),ai(x)為x在第i個(gè)正向歷史文本中出現(xiàn)的次數(shù),n為歷史文本庫(kù)中負(fù)向歷史文本的數(shù)量,sj為第j個(gè)負(fù)向歷史文本中的特征總數(shù),bj(x)為x在第j個(gè)負(fù)向歷史文本中出現(xiàn)的次數(shù)。
優(yōu)選地,所述列表生成單元被配置為從所述特征庫(kù)中選擇具有較高權(quán)重值的特征組成所述參考特征列表。
優(yōu)選地,所述特征庫(kù)中濾除了噪聲特征,所述噪聲特征是預(yù)先指定的。
優(yōu)選地,所述權(quán)重值確定模塊被配置為:將與存在匹配的特征相匹配的參考特征的權(quán)重值確定為該存在匹配的特征的權(quán)重值。
優(yōu)選地,所述評(píng)價(jià)值確定模塊被配置為:通過(guò)預(yù)先指定的運(yùn)算規(guī)則,從所有存在匹配的特征的權(quán)重值計(jì)算出所述評(píng)價(jià)值。
優(yōu)選地,所述閾值是預(yù)先指定的并且能夠被更新。
優(yōu)選地,所述確定單元還包括第二匹配模塊,所述第二匹配模塊被配置為將所述至少一個(gè)特征中的每一個(gè)與特定特征集合進(jìn)行匹配,并且所述判斷模塊還被配置為:當(dāng)所述至少一個(gè)特征中存在與所述特定特征集合中的特定特征匹配的特征時(shí),確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求。
通過(guò)使用向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的方法和裝置,能夠在一定程度上解決現(xiàn)有技術(shù)的局限性,并且在很大程度上排除了邀請(qǐng)判斷的偶然性。本發(fā)明的方法提高了判斷的準(zhǔn)確率,并進(jìn)而實(shí)現(xiàn)了更高的好評(píng)率。
附圖說(shuō)明
圖1示出了根據(jù)本發(fā)明的一種實(shí)施例的用于確定向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的方法的流程圖;
圖2示出了根據(jù)本發(fā)明的一種實(shí)施例的用于確定向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的裝置的結(jié)構(gòu)框圖;
圖3示出了根據(jù)本發(fā)明的一種優(yōu)選實(shí)施例的用于確定向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
以下參考附圖對(duì)本發(fā)明進(jìn)行具體描述。
首先,圖1示出了根據(jù)本發(fā)明的一種實(shí)施例的用于確定向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的方法100的流程圖。所述方法100開(kāi)始于步驟s110,在步驟s110中,從所述網(wǎng)絡(luò)用戶(hù)接收至少一個(gè)評(píng)論消息,所述評(píng)論消息指示所述網(wǎng)絡(luò)用戶(hù)在用戶(hù)端輸入的文本。然后,在步驟s120中,將所述至少一個(gè)評(píng)論消息中的每一個(gè)中包括的文本分割成至少一個(gè)特征。接下來(lái),在步驟s130中,將所述至少一個(gè)特征中的每一個(gè)與參考特征列表中的參考特征進(jìn)行匹配,所述參考特征列表中的每個(gè)參考特征具有權(quán)重值。接下來(lái),在步驟s140中,針對(duì)存在匹配的特征,根據(jù)與其匹配的參考特征的權(quán)重值確定該特征的權(quán)重值。接下來(lái),在步驟s150中,基于所有存在匹配的特征的權(quán)重值,確定所述網(wǎng)絡(luò)用戶(hù)的評(píng)價(jià)值。最后,在步驟s160中,在所述評(píng)價(jià)值大于閾值的情況下,確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求。
在步驟s110中,從所述網(wǎng)絡(luò)用戶(hù)接收用戶(hù)輸入的文本,所述文本以評(píng)論消息的形式傳輸并被接收。用戶(hù)輸入的文本包括用戶(hù)輸入的所有文字、表情、符號(hào)等,是用來(lái)判斷用戶(hù)是否滿意以及進(jìn)而是否向其發(fā)送評(píng)價(jià)請(qǐng)求的依據(jù)。
接下來(lái),在步驟s120中,用戶(hù)輸入的文本分割成特征。特征是構(gòu)成文本的元素,包括但不限于,字、詞、詞組、固定搭配等。
在一個(gè)實(shí)施例中,采用常用的切詞方法(比如n-gram切詞方法)來(lái)分割,但應(yīng)該理解的是,本發(fā)明中將文本分割成特征的方法不限于此。
接下來(lái),在步驟s130中,將經(jīng)過(guò)分割得到的特征與參考特征列表中的參考特征進(jìn)行匹配。參考特征列表是由經(jīng)過(guò)預(yù)先選擇的參考特征組成的列表,并且其中的每個(gè)參考特征具有相應(yīng)的權(quán)重值。
所述參考特征列表中的參考特征是由從特征庫(kù)中選出的。特征庫(kù)是通過(guò)對(duì)歷史文本(比如從系統(tǒng)日志、聊天記錄等中得到的)進(jìn)行分割得到的特征組成。在使用本發(fā)明所要求保護(hù)的方法之前,需要首先收集用戶(hù)(所有用戶(hù)或特定的部分用戶(hù),比如金牌及以上用戶(hù))在特定時(shí)間段(比如6個(gè)月)內(nèi)的評(píng)論歷史,并從中提取出所需的歷史文本。采用與步驟s120中一樣的分割方法對(duì)這些歷史文本進(jìn)行分割,得到眾多的特征。然后,這些歷史文本(歷史文本庫(kù))和分割得到的特征(特征庫(kù))均被存儲(chǔ)在服務(wù)器上。
所述歷史文本包括正向歷史文本和負(fù)向歷史文本。正向歷史文本是由最終對(duì)相應(yīng)服務(wù)做出積極評(píng)價(jià)的用戶(hù)針對(duì)該相應(yīng)服務(wù)輸入的文本,即如果某一用戶(hù)在收到評(píng)價(jià)請(qǐng)求后對(duì)某一服務(wù)給出了好評(píng),則在其針對(duì)該服務(wù)進(jìn)行咨詢(xún)時(shí)所輸入的文字便被認(rèn)為是正向歷史文本。相反地,負(fù)向歷史文本是由最終對(duì)相應(yīng)服務(wù)做出消極評(píng)價(jià)的用戶(hù)針對(duì)該相應(yīng)服務(wù)輸入的文本,即如果某一用戶(hù)在收到評(píng)價(jià)請(qǐng)求后對(duì)某一服務(wù)給出了差評(píng),則在其針對(duì)該服務(wù)進(jìn)行咨詢(xún)時(shí)所輸入的文字便被認(rèn)為是負(fù)向歷史文本。
在如上生成特征庫(kù)之前,可以先對(duì)歷史文本進(jìn)行篩選。這樣,可以控制得到的歷史文本庫(kù)和特征庫(kù)的規(guī)模,避免占用過(guò)多的系統(tǒng)資源。優(yōu)選地,篩選出的正向歷史文本和負(fù)向歷史文本的數(shù)量應(yīng)盡量接近。例如,可以選擇例如8000個(gè)正向歷史文本和8000個(gè)負(fù)向歷史文本。
特征庫(kù)中的特征只是用戶(hù)輸入過(guò)的文字,不同的特征對(duì)確定是否發(fā)出評(píng)價(jià)請(qǐng)求的貢獻(xiàn)各不相同。需要對(duì)不同特征的作用進(jìn)行估計(jì)。
在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)權(quán)重值來(lái)表示特征對(duì)所述確定的作用。具體來(lái)講,針對(duì)特征庫(kù)中的某一特征x,通過(guò)以下公式來(lái)計(jì)算x的權(quán)重值w(x):
其中,m為正向歷史文本的數(shù)量,ti為第i個(gè)正向歷史文本中的特征總數(shù),ai(x)為x在第i個(gè)正向歷史文本中出現(xiàn)的次數(shù),n為負(fù)向歷史文本的數(shù)量,sj為第j個(gè)負(fù)向歷史文本中的特征總數(shù),bj(x)為x在第j個(gè)負(fù)向歷史文本中出現(xiàn)的次數(shù)??梢?jiàn),按如上公式計(jì)算出的權(quán)重值越高,說(shuō)明其與好評(píng)結(jié)果有著更大的一致性,從而如果該特征在某一文本中出現(xiàn)的次數(shù)越多,便在一定程度上預(yù)示輸入該文本的客戶(hù)更有可能對(duì)相應(yīng)的服務(wù)給予好評(píng)。
優(yōu)選地,在針對(duì)特征庫(kù)中的特征進(jìn)行權(quán)重值計(jì)算之前,需要剔除掉其中的噪聲特征。所述噪聲特征包括冗余、不相關(guān)、對(duì)最終結(jié)果沒(méi)有影響甚至有負(fù)向影響的特征,比如,助詞(例如“的”、“了”、“嗎”等)、相關(guān)商品名稱(chēng)、用戶(hù)信息等。這些噪聲特征是預(yù)先確定的,或者可通過(guò)預(yù)先確定的規(guī)則來(lái)遍歷特征庫(kù),得到經(jīng)過(guò)優(yōu)化的特征庫(kù)。
此外,為了進(jìn)一步節(jié)約系統(tǒng)資源,并且提高效率,在應(yīng)用已經(jīng)計(jì)算過(guò)權(quán)重值的特征之前,還可以進(jìn)一步對(duì)特征庫(kù)中的特征進(jìn)行選擇,形成步驟s130中所提到的參考特征列表。當(dāng)然,如果不考慮這一點(diǎn),參考特征列表可以等同于整個(gè)特征庫(kù)。
在一個(gè)實(shí)施例中,可以預(yù)先設(shè)定參考特征列表中參考特征的數(shù)量,比如2000。
優(yōu)選地,所述參考特征列表可以是由所述特征庫(kù)中具有較高權(quán)重值的特征組成的列表。比如,可以令特征庫(kù)中權(quán)重值最高的前2000個(gè)特征組成參考特征列表。
備選地,所述參考特征列表可以是由所述特征庫(kù)中具有最高權(quán)重值的特征和具有最低權(quán)重值的特征組成的列表。比如,可以令特征庫(kù)中權(quán)重值最高的前1000個(gè)特征和權(quán)重值最低的前1000個(gè)特征組成參考特征列表。
需要指出的是,雖然上文中對(duì)參考特征列表的來(lái)由進(jìn)行了描述,但本發(fā)明中的參考特征列表不限于此。任何包括參考特征與權(quán)重值對(duì)的參考特征列表都適用于本發(fā)明的技術(shù)方案。比如,本領(lǐng)域技術(shù)人員可以任意指定其認(rèn)為能夠反映用戶(hù)對(duì)服務(wù)的評(píng)價(jià)的特征作為參考特征,并為該參考特征指定相應(yīng)的權(quán)重值。
接下來(lái),在步驟s140中,針對(duì)存在匹配的特征,根據(jù)與其匹配的參考特征的權(quán)重值確定該特征的權(quán)重值。在一個(gè)實(shí)施例中,將與存在匹配的特征相匹配的參考特征的權(quán)重值確定為該存在匹配的特征的權(quán)重值。
從而,在步驟s150中,基于所有存在匹配的特征的權(quán)重值,可以確定發(fā)出所述文本的所述網(wǎng)絡(luò)用戶(hù)的評(píng)價(jià)值。所述評(píng)價(jià)值是通過(guò)預(yù)先指定的運(yùn)算規(guī)則從所有存在匹配的特征的權(quán)重值計(jì)算得到的。所述運(yùn)算規(guī)則可以是四則運(yùn)算,例如加法。
應(yīng)該理解的是,所述運(yùn)算規(guī)則還可以通過(guò)特定算法或程序來(lái)實(shí)現(xiàn),本發(fā)明的發(fā)明人在實(shí)踐中還采用中國(guó)臺(tái)灣大學(xué)的chih-jenlin博士開(kāi)發(fā)的liblinear工具實(shí)現(xiàn)算法,并進(jìn)而得到所述評(píng)價(jià)值。
最后,在步驟s160中,在所述評(píng)價(jià)值大于閾值的情況下,確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求。優(yōu)選地,所述閾值是預(yù)先指定的。此外,系統(tǒng)可以根據(jù)所述方法的結(jié)果隨時(shí)對(duì)所述閾值進(jìn)行更新。
關(guān)于圖1所述的方法100,在一個(gè)實(shí)施例中,首先在步驟s110中接收用戶(hù)輸入的文本,當(dāng)接收到用戶(hù)針對(duì)特定問(wèn)題的答復(fù)時(shí),才開(kāi)始進(jìn)行后續(xù)步驟s120-s160。比如,系統(tǒng)可以在適當(dāng)時(shí)刻向用戶(hù)發(fā)出詢(xún)問(wèn)消息,例如“請(qǐng)問(wèn),您還需要其他幫助嗎?”。當(dāng)用戶(hù)針對(duì)該詢(xún)問(wèn)消息給出否定應(yīng)答時(shí),比如“不需要了!”,則系統(tǒng)此時(shí)開(kāi)始執(zhí)行后續(xù)步驟。
在另一實(shí)施例中,可以在不斷地接收用戶(hù)輸入的文本的同時(shí)(即,人機(jī)對(duì)話的同時(shí))針對(duì)已經(jīng)接收到的部分文本進(jìn)行步驟s120-s160中的一部分步驟,比如步驟s120-s140。在接收到足夠的文本之后或在接收到如上所述針對(duì)特定問(wèn)題的答復(fù)時(shí),再執(zhí)行步驟剩余步驟,比如步驟s150-s160。
在一個(gè)實(shí)施例中,可以在執(zhí)行步驟s130之前,執(zhí)行以下操作:將所述至少一個(gè)特征中的每一個(gè)與特定特征集合進(jìn)行匹配;當(dāng)所述至少一個(gè)特征中存在與所述特定特征集合中的特定特征匹配的特征時(shí),確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求。
所述特定特征集合是預(yù)先制定的集合,該集合中的任一特征都足以預(yù)示用戶(hù)將對(duì)服務(wù)給予好評(píng),比如,所述集合中可包括“非常滿意”、“十分感謝”等特征。當(dāng)從用戶(hù)接收的文本包括上述任一特征時(shí),可以認(rèn)為用戶(hù)很有可能會(huì)對(duì)服務(wù)給予好評(píng)。從而,在此情況下,可以直接確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求,而不再執(zhí)行剩余步驟s130-s160。
接下來(lái),參見(jiàn)圖2。圖2示出了根據(jù)本發(fā)明的一種實(shí)施例的用于確定向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的裝置200的結(jié)構(gòu)框圖。所述裝置200包括用戶(hù)接口210、分割單元220和確定單元230。
所述用戶(hù)接口210用于從所述網(wǎng)絡(luò)用戶(hù)接收至少一個(gè)評(píng)論消息,所述評(píng)論消息指示所述網(wǎng)絡(luò)用戶(hù)在用戶(hù)端輸入的文本。用戶(hù)輸入的文本包括用戶(hù)輸入的所有文字、表情、符號(hào)等,是用來(lái)判斷用戶(hù)是否滿意以及進(jìn)而是否向其發(fā)送評(píng)價(jià)請(qǐng)求的依據(jù)。
所述分割單元220用于將所述至少一個(gè)評(píng)論消息中的每一個(gè)中包括的文本分割成至少一個(gè)特征。特征是構(gòu)成文本的元素,包括但不限于,字、詞、詞組、固定搭配等。
在一個(gè)實(shí)施例中,所述分割單元220采用常用的切詞方法(比如n-gram切詞方法)來(lái)分割,但應(yīng)該理解的是,本發(fā)明中將文本分割成特征的方法不限于此。
所述確定單元230包括第一匹配模塊232、權(quán)重值確定模塊234、評(píng)價(jià)值確定模塊236和判斷模塊238。
所述第一匹配模塊232用于將所述至少一個(gè)特征中的每一個(gè)與參考特征列表中的參考特征進(jìn)行匹配。參考特征列表是由經(jīng)過(guò)預(yù)先選擇的參考特征組成的列表,并且其中的每個(gè)參考特征具有相應(yīng)的權(quán)重值。
所述權(quán)重值確定模塊234用于針對(duì)存在匹配的特征,根據(jù)與其匹配的參考特征的權(quán)重值確定該特征的權(quán)重值。優(yōu)選地,所述權(quán)重值確定模塊234被配置為將與存在匹配的特征相匹配的參考特征的權(quán)重值確定為該存在匹配的特征的權(quán)重值。
所述評(píng)價(jià)值確定模塊236用于基于所有存在匹配的特征的權(quán)重值,確定所述網(wǎng)絡(luò)用戶(hù)的評(píng)價(jià)值。優(yōu)選地,所述評(píng)價(jià)值是通過(guò)預(yù)先指定的運(yùn)算規(guī)則從所有存在匹配的特征的權(quán)重值計(jì)算得到的。所述運(yùn)算規(guī)則可以是四則運(yùn)算,例如加法。
所述判斷模塊238用于在所述評(píng)價(jià)值大于閾值的情況下,確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求。優(yōu)選地,所述閾值是預(yù)先指定的。此外,系統(tǒng)可以根據(jù)所述方法的結(jié)果隨時(shí)對(duì)所述閾值進(jìn)行更新。
優(yōu)選地,所述裝置200還包括用于產(chǎn)生所述參考特征列表的組件。圖3示出了根據(jù)本發(fā)明的一種優(yōu)選實(shí)施例的用于確定向網(wǎng)絡(luò)用戶(hù)進(jìn)行服務(wù)評(píng)價(jià)請(qǐng)求的裝置300的結(jié)構(gòu)框圖。所述裝置300還附加地包括存儲(chǔ)單元240、計(jì)算單元250和列表生成單元260。
所述存儲(chǔ)單元240用于存儲(chǔ)歷史文本庫(kù)和特征庫(kù)。其中,所述歷史文本庫(kù)存儲(chǔ)歷史文本,所述歷史文本可以從例如系統(tǒng)日志、聊天記錄等中收集。歷史文本包括正向歷史文本和負(fù)向歷史文本。正向歷史文本是由最終對(duì)相應(yīng)服務(wù)做出積極評(píng)價(jià)的用戶(hù)針對(duì)該相應(yīng)服務(wù)輸入的文本,即如果某一用戶(hù)在收到評(píng)價(jià)請(qǐng)求后對(duì)某一服務(wù)給出了好評(píng),則在其針對(duì)該服務(wù)進(jìn)行咨詢(xún)時(shí)所輸入的文字便被認(rèn)為是正向歷史文本。相反地,負(fù)向歷史文本是由最終對(duì)相應(yīng)服務(wù)做出消極評(píng)價(jià)的用戶(hù)針對(duì)該相應(yīng)服務(wù)輸入的文本,即如果某一用戶(hù)在收到評(píng)價(jià)請(qǐng)求后對(duì)某一服務(wù)給出了差評(píng),則在其針對(duì)該服務(wù)進(jìn)行咨詢(xún)時(shí)所輸入的文字便被認(rèn)為是負(fù)向歷史文本。
特征庫(kù)是通過(guò)對(duì)歷史文本進(jìn)行分割得到的特征組成。在使用本發(fā)明所要求保護(hù)的裝置之前,需要首先收集用戶(hù)(所有用戶(hù)或特定的部分用戶(hù),比如金牌及以上用戶(hù))在特定時(shí)間段(比如6個(gè)月)內(nèi)的評(píng)論歷史,并從中提取出所需的歷史文本。通過(guò)分割單元(比如圖2中的分割單元220)對(duì)這些歷史文本進(jìn)行分割,得到眾多的特征(該過(guò)程如圖3中的虛線所示)。然后,這些歷史文本(歷史文本庫(kù))和分割得到的特征(特征庫(kù))均被存儲(chǔ)在存儲(chǔ)單元240上。
所述計(jì)算單元250用于為所述特征庫(kù)中的每個(gè)特征計(jì)算權(quán)重值。
優(yōu)選地,所述計(jì)算單元250被配置為:針對(duì)特征庫(kù)中的特征x,通過(guò)以下公式來(lái)計(jì)算x的權(quán)重值w(x):
其中,m為歷史文本庫(kù)中正向歷史文本的數(shù)量,ti為第i個(gè)正向歷史文本中的特征總數(shù),ai(x)為x在第i個(gè)正向歷史文本中出現(xiàn)的次數(shù),n為歷史文本庫(kù)中負(fù)向歷史文本的數(shù)量,sj為第j個(gè)負(fù)向歷史文本中的特征總數(shù),bj(x)為x在第j個(gè)負(fù)向歷史文本中出現(xiàn)的次數(shù)。
所述列表生成單元260用于基于所述計(jì)算單元250的計(jì)算結(jié)果從特征庫(kù)中的特征生成所述參考特征列表。優(yōu)選地,所述列表生成單元260被配置為從所述特征庫(kù)中選擇具有較高權(quán)重值的特征組成所述參考特征列表。
優(yōu)選地,在通過(guò)計(jì)算單元250對(duì)特征庫(kù)中的特征進(jìn)行權(quán)重值計(jì)算之前,需要剔除掉其中的噪聲特征。所述噪聲特征包括冗余、不相關(guān)、對(duì)最終結(jié)果沒(méi)有影響甚至有負(fù)向影響的特征,比如,助詞(例如“的”、“了”、“嗎”等)、相關(guān)商品名稱(chēng)、用戶(hù)信息等。這些噪聲特征是預(yù)先確定的,或者可通過(guò)預(yù)先確定的規(guī)則來(lái)遍歷特征庫(kù),得到經(jīng)過(guò)優(yōu)化的特征庫(kù)。
在一種優(yōu)選實(shí)施例中,所述確定單元230還可包括第二匹配模塊。所述第二匹配模塊被配置為將所述至少一個(gè)特征中的每一個(gè)與特定特征集合進(jìn)行匹配。并且,所述判斷模塊238還被配置為:當(dāng)所述至少一個(gè)特征中存在與所述特定特征集合中的特定特征匹配的特征時(shí),確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求。
所述特定特征集合是預(yù)先制定的集合,該集合中的任一特征都足以預(yù)示用戶(hù)將對(duì)服務(wù)給予好評(píng),比如,所述集合中可包括“非常滿意”、“十分感謝”等特征。當(dāng)從用戶(hù)接收的文本包括上述任一特征時(shí),可以認(rèn)為用戶(hù)很有可能會(huì)對(duì)服務(wù)給予好評(píng)。從而,在此情況下,可以直接確定向所述網(wǎng)絡(luò)用戶(hù)提出服務(wù)評(píng)價(jià)請(qǐng)求,而省略其他模塊的后續(xù)操作。
在以上針對(duì)方法100和裝置200和/或300分別進(jìn)行描述的過(guò)程中,有可能只在針對(duì)方法100的描述(或針對(duì)裝置200和/或300的描述)中對(duì)某些特征或細(xì)節(jié)有所提及。但應(yīng)該理解的是,這些特征或細(xì)節(jié)同樣適用于針對(duì)裝置200和/或300的描述(或針對(duì)方法100的描述)。
盡管以上已經(jīng)結(jié)合本發(fā)明的優(yōu)選實(shí)施例示出了本發(fā)明,但是本領(lǐng)域的技術(shù)人員將會(huì)理解,在不脫離本發(fā)明的精神和范圍的情況下,可以對(duì)本發(fā)明進(jìn)行各種修改、替換和改變。因此,本發(fā)明不應(yīng)由上述實(shí)施例來(lái)限定,而應(yīng)由所附權(quán)利要求及其等價(jià)物來(lái)限定。