1.一種人機(jī)交互構(gòu)建用戶畫像聚類計(jì)算方法,其特征在于,包括:
步驟一:獲取用戶發(fā)送的基于自然情景的語句,采用閾值語音降噪算法對(duì)輸入語句進(jìn)行濾波降噪,并從用戶下達(dá)給機(jī)器人指令中提取代表用戶特征的關(guān)鍵詞作為特征標(biāo)簽,并給每個(gè)特征標(biāo)簽賦予初始分值和初始加權(quán)值,全部特征標(biāo)簽的集合構(gòu)成標(biāo)簽數(shù)據(jù)庫;
步驟二:根據(jù)一段時(shí)間內(nèi)為用戶打上的每一種標(biāo)簽的數(shù)量、使用頻率和使用時(shí)間、利用推導(dǎo)規(guī)則從標(biāo)簽推導(dǎo)出的屬性、推導(dǎo)規(guī)則的邏輯強(qiáng)度值,確定每一種標(biāo)簽推導(dǎo)出的各種屬性的行為分值;
步驟三:將其中一種標(biāo)簽推導(dǎo)出的其中一種屬性的行為分值與預(yù)定閾值進(jìn)行對(duì)比,判斷是否能夠確定用戶屬性包含所述其中一種屬性,若否,則利用所述行為分值連同其他標(biāo)簽下的對(duì)應(yīng)于所述其中一種屬性的行為分值推算聯(lián)合行為屬性閾值,通過聯(lián)合行為屬性閾值判斷是否能夠確定用戶屬性包含所述其中一種屬性;
步驟四:通過多個(gè)語義化的用戶屬性來還原用戶的全貌,完成用戶畫像。
2.根據(jù)權(quán)利要求1所述的人機(jī)交互構(gòu)建用戶畫像聚類計(jì)算方法,其特征在于,所述用戶畫像信息為描述包括所述用戶個(gè)性、特點(diǎn)和行為特征的信息。
3.根據(jù)權(quán)利要求1或2所述的人機(jī)交互構(gòu)建用戶畫像聚類計(jì)算方法,其特征在于,所述步驟二之前,還包括建立標(biāo)簽規(guī)則庫:
提供標(biāo)簽、屬性、以及標(biāo)簽和屬性之間的推導(dǎo)規(guī)則;
根據(jù)所述標(biāo)簽和屬性之間的推導(dǎo)規(guī)則的強(qiáng)弱設(shè)置相應(yīng)的邏輯強(qiáng)度值。
4.根據(jù)權(quán)利要求3所述的一種人機(jī)交互構(gòu)建用戶畫像聚類計(jì)算方法,其特征在于,所述行為分值為:
其中,Ii為對(duì)應(yīng)標(biāo)記為i屬性的行為分值,Li0為初始分值,ωio為初始加權(quán)值,m為標(biāo)簽數(shù)量,f為標(biāo)簽使用頻率。
5.根據(jù)權(quán)利要求1-2或4中任一項(xiàng)所述的人機(jī)交互構(gòu)建用戶畫像聚類計(jì)算方法,其特征在于,還包括獲得并存儲(chǔ)終端的上報(bào)信息,包括:
獲得終端通過軟件開發(fā)包SDK方式傳輸?shù)脑瓷蠄?bào)信息,或者獲得終端通過JS代碼方式傳輸?shù)脑瓷蠄?bào)信息;
對(duì)所述源上報(bào)信息進(jìn)行篩選獲得上報(bào)信息;
將所述上報(bào)信息與預(yù)設(shè)標(biāo)識(shí)符關(guān)聯(lián)存儲(chǔ)。
6.根據(jù)權(quán)利要求5所述的人機(jī)交互構(gòu)建用戶畫像聚類計(jì)算方法,其特征在于,還包括:基于所述關(guān)聯(lián)存儲(chǔ)的標(biāo)識(shí)信息,調(diào)整機(jī)器人的指令推送比重。
7.根據(jù)權(quán)利要求1所述的人機(jī)交互構(gòu)建用戶畫像聚類計(jì)算方法,其特征在于,所述步驟三中聯(lián)合行為屬性閾值為:
Ii為對(duì)應(yīng)標(biāo)簽為i屬性的行為分值,Ii+1為其他標(biāo)簽為i+1屬性的行為分值
8.根據(jù)權(quán)利要求1或7所述的人機(jī)交互構(gòu)建用戶畫像聚類計(jì)算方法,其特征在于,所述語音降噪算法,包括:
a,通過端點(diǎn)檢測(cè)將語音幀區(qū)分為靜音幀和語音幀;
b,對(duì)于靜音幀,計(jì)算當(dāng)前幀的功率譜值作為噪聲功率譜估計(jì)值,對(duì)于語音幀,計(jì)算語音噪聲功率譜估計(jì)值;
c,將語音幀的功率譜減去噪聲功率譜估計(jì)值,得到降噪后的語音功率譜;
d,根據(jù)降噪后的語音功率譜得出降噪后的語音幀。
9.根據(jù)權(quán)利要求8所述的人機(jī)交互構(gòu)建用戶畫像聚類計(jì)算方法,其特征在于,所述語音噪聲功率譜估計(jì)值計(jì)算公式為:
其中,I為噪聲功率譜能量;閾值n為噪音信號(hào)的幀號(hào);j=1-5為轉(zhuǎn)換系數(shù),e為自然常數(shù);π為圓周率;fc為噪音信號(hào)的頻率;τ(t)=0.03t2+0.6t+0.1;t為分解尺度,1≤t≤4。