本申請(qǐng)涉及數(shù)據(jù)挖掘的
技術(shù)領(lǐng)域:
,尤其涉及一種多元關(guān)聯(lián)關(guān)系的分析方法及裝置。
背景技術(shù):
:在運(yùn)營(yíng)企業(yè)細(xì)分市場(chǎng)、力求提供差別服務(wù)的時(shí)代,運(yùn)營(yíng)企業(yè)需面對(duì)日益增加的市場(chǎng)競(jìng)爭(zhēng)壓力,能否擁有一套迅速靈敏、功能強(qiáng)大的數(shù)據(jù)挖掘系統(tǒng),有針對(duì)性地制定戰(zhàn)略,適時(shí)推出各種營(yíng)銷策略,顯得越來越重要。關(guān)聯(lián)分析是數(shù)據(jù)挖掘重要的手段之一,用來發(fā)現(xiàn)數(shù)據(jù)庫(kù)中不同數(shù)據(jù)之間的相關(guān)性。現(xiàn)有的關(guān)聯(lián)分析方法大多是基于機(jī)器學(xué)習(xí)算法,如apriori算法和fpgrowth算法等,分析挖掘頻繁項(xiàng)集,進(jìn)而發(fā)現(xiàn)不同數(shù)據(jù)之間的相關(guān)性。但是,現(xiàn)有的關(guān)聯(lián)分析方法所發(fā)現(xiàn)的數(shù)據(jù)之間的相關(guān)性,會(huì)因外在因素變化而失效,例如在銀行業(yè)務(wù)辦理中,某種信用卡的a型分期付款業(yè)務(wù),比較受儲(chǔ)戶歡迎,但是a型分期付款業(yè)務(wù)已取消,現(xiàn)有的關(guān)聯(lián)分析方法還是會(huì)挖掘出這種已失效的相關(guān)性。除此之外,距離當(dāng)前時(shí)間越接近的數(shù)據(jù)的相關(guān)性越重要,例如,一銀行上周推出某種信用卡的b型分期付款業(yè)務(wù),深受儲(chǔ)戶歡迎,但是現(xiàn)有的關(guān)聯(lián)分析方法會(huì)因支持度不足而無法發(fā)現(xiàn)。因此,現(xiàn)有的關(guān)聯(lián)分析方法不能準(zhǔn)確的定位有使用價(jià)值的關(guān)聯(lián)結(jié)果,不利于決策者制定相應(yīng)的營(yíng)銷策略。技術(shù)實(shí)現(xiàn)要素:本申請(qǐng)?zhí)峁┝艘环N多元關(guān)聯(lián)關(guān)系的分析方法及裝置,以解決現(xiàn)有的關(guān)聯(lián)分析方法不能準(zhǔn)確的定位有使用價(jià)值的關(guān)聯(lián)結(jié)果,不利于決策者制定相應(yīng)的營(yíng)銷策略的問題。第一方面,本申請(qǐng)?zhí)峁┝艘环N多元關(guān)聯(lián)關(guān)系的分析方法,包括:創(chuàng)建元組集,所述元組集包括n個(gè)元組,每個(gè)所述元組包括至少一個(gè)元素,n為大于1的正整數(shù);根據(jù)第m-1個(gè)元組中的元素與第m個(gè)元組中的元素之間的對(duì)應(yīng)關(guān)系,建立所述第m-1個(gè)元組與所述第m個(gè)元組的映射關(guān)系,其中,m=2,3,……,n;根據(jù)所述映射關(guān)系,生成關(guān)聯(lián)表達(dá)式列表;根據(jù)所述關(guān)聯(lián)表達(dá)式列表進(jìn)行關(guān)聯(lián)關(guān)系分析。第二方面,本申請(qǐng)還提供了一種多元關(guān)聯(lián)關(guān)系的分析裝置,包括:創(chuàng)建模塊,用于創(chuàng)建元組集,所述元組集包括n個(gè)元組,每個(gè)所述元組包括至少一個(gè)元素,n為大于1的正整數(shù);映射建立模塊,根據(jù)第m-1個(gè)元組中的元素與第m個(gè)元組中的元素之間的對(duì)應(yīng)關(guān)系,建立所述第m-1個(gè)元組與所述第m個(gè)元組的映射關(guān)系,其中,m=2,3,……,n;生成模塊,用于根據(jù)所述映射關(guān)系,生成關(guān)聯(lián)表達(dá)式列表;關(guān)聯(lián)關(guān)系分析模塊,用于根據(jù)所述關(guān)聯(lián)表達(dá)式列表進(jìn)行關(guān)聯(lián)關(guān)系分析。由以上技術(shù)方案可知,本申請(qǐng)?zhí)峁┝艘环N多元關(guān)聯(lián)關(guān)系的分析方法及裝置,元組的數(shù)量、每個(gè)元組的元素以及不同元組的元素對(duì)應(yīng)關(guān)系可根據(jù)實(shí)際的業(yè)務(wù)場(chǎng)景進(jìn)行設(shè)置,生成適應(yīng)于當(dāng)前的業(yè)務(wù)場(chǎng)景的關(guān)聯(lián)表達(dá)式列表,并且利用關(guān)聯(lián)表達(dá)式所表現(xiàn)的語義能準(zhǔn)確的定位數(shù)據(jù)庫(kù)中有使用價(jià)值的關(guān)聯(lián)結(jié)果,提高關(guān)聯(lián)分析的有效性,有利于決策者制定相應(yīng)的營(yíng)銷策略。而且相比于現(xiàn)有的機(jī)器學(xué)習(xí)算法,利用頻繁集進(jìn)行迭代組合而逐條建立關(guān)聯(lián)表達(dá)式而言,本申請(qǐng)通過多元組模型可同時(shí)生成多條關(guān)聯(lián)表達(dá)式,并對(duì)文本信息進(jìn)行關(guān)聯(lián)關(guān)系分析,從而得到多個(gè)關(guān)聯(lián)分析結(jié)果,提高關(guān)聯(lián)分析的運(yùn)算效率。附圖說明為了更清楚地說明本申請(qǐng)的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,對(duì)于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本申請(qǐng)?zhí)峁┑囊环N多元關(guān)聯(lián)關(guān)系的分析方法一個(gè)實(shí)施例的流程圖;圖2為本申請(qǐng)?zhí)峁┑囊环N多元關(guān)聯(lián)關(guān)系的分析方法另一個(gè)實(shí)施例的流程圖;圖3為圖2中步驟s207的流程圖;圖4為圖3中步驟s301的流程圖;圖5為本申請(qǐng)實(shí)施例提供的一種多元關(guān)聯(lián)關(guān)系模型的示意圖;圖6為本申請(qǐng)?zhí)峁┑囊环N多元關(guān)聯(lián)關(guān)系的分析裝置的結(jié)構(gòu)示意圖;圖7為生成模塊的結(jié)構(gòu)示意圖;圖8為關(guān)聯(lián)關(guān)系分析模塊的結(jié)構(gòu)示意圖;圖9為分析子模塊的結(jié)構(gòu)示意圖;圖10為匹配單元的結(jié)構(gòu)示意圖。具體實(shí)施方式下面結(jié)合說明書附圖,對(duì)本申請(qǐng)實(shí)施例提供的一種多元關(guān)聯(lián)關(guān)系的分析方法及裝置的具體實(shí)施方式進(jìn)行說明。參見圖1,本申請(qǐng)實(shí)施例提供了一種多元關(guān)聯(lián)關(guān)系的分析方法,包括如下步驟:步驟s101:創(chuàng)建元組集,所述元組集包括n個(gè)元組,每個(gè)所述元組包括至少一個(gè)元素,n為大于1的正整數(shù)。元組集內(nèi)的元組可是僅含有一個(gè)元素,也可以是由多個(gè)元素構(gòu)成。多元組定義為元組集中含有相應(yīng)數(shù)量的元組。元組可根據(jù)元素的類型劃分,如含有產(chǎn)品種類的元組、含有業(yè)務(wù)種類的元組和口碑評(píng)價(jià)的元組等等。以三元組構(gòu)成的元組集為例,即元組集中含有三個(gè)元組,第一個(gè)元組是元素僅為“信用卡”,第二個(gè)元組是由元素為“貸款年限”、“還款額度”和“還款期限”構(gòu)成,第三個(gè)元組是由元素為“較高”和“太低”構(gòu)成。步驟s102:根據(jù)第m-1個(gè)元組中的元素與第m個(gè)元組中的元素之間的對(duì)應(yīng)關(guān)系,建立所述第m-1個(gè)元組與所述第m個(gè)元組的映射關(guān)系,其中,m=2,3,……,n。步驟s103:根據(jù)所述映射關(guān)系,生成關(guān)聯(lián)表達(dá)式列表。步驟s104:根據(jù)所述關(guān)聯(lián)表達(dá)式列表進(jìn)行關(guān)聯(lián)關(guān)系分析。由以上技術(shù)方案可知,本申請(qǐng)?zhí)峁┝艘环N多元關(guān)聯(lián)關(guān)系的分析方法,元組的數(shù)量、每個(gè)元組的元素以及不同元組的元素對(duì)應(yīng)關(guān)系可根據(jù)實(shí)際的業(yè)務(wù)場(chǎng)景進(jìn)行設(shè)置,生成適應(yīng)于當(dāng)前的業(yè)務(wù)場(chǎng)景的關(guān)聯(lián)表達(dá)式列表,并且利用關(guān)聯(lián)表達(dá)式所表現(xiàn)的語義能準(zhǔn)確的定位數(shù)據(jù)庫(kù)中有使用價(jià)值的關(guān)聯(lián)結(jié)果,提高關(guān)聯(lián)分析的有效性,有利于決策者制定相應(yīng)的營(yíng)銷策略;而且相比于現(xiàn)有的機(jī)器學(xué)習(xí)算法,利用頻繁集進(jìn)行迭代組合而逐條建立關(guān)聯(lián)表達(dá)式而言,本申請(qǐng)通過多元組模型可同時(shí)建立多條關(guān)聯(lián)表達(dá)式,并對(duì)文本信息進(jìn)行關(guān)聯(lián)關(guān)系分析,從而得到多個(gè)關(guān)聯(lián)分析結(jié)果,提高關(guān)聯(lián)分析的運(yùn)算效率。參見圖2,圖2為本申請(qǐng)?zhí)峁┑囊环N多元關(guān)聯(lián)關(guān)系的分析方法另一個(gè)實(shí)施例的流程圖。本申請(qǐng)的另一實(shí)施例提供了一種多元關(guān)聯(lián)關(guān)系的分析方法,包括:步驟s201:創(chuàng)建元組集,所述元組集包括n個(gè)元組,每個(gè)所述元組包括至少一個(gè)元素,n為大于1的正整數(shù)。元組集內(nèi)的多個(gè)元組可按照預(yù)設(shè)的順序排列,也可以無序排列。元組集內(nèi)元組的數(shù)量以及每個(gè)元組內(nèi)的元素?cái)?shù)量可根據(jù)當(dāng)前的業(yè)務(wù)場(chǎng)景的需要進(jìn)行設(shè)置。元組集內(nèi)的元素可由用戶錄入或?qū)?,也可以在?shù)據(jù)庫(kù)中選取對(duì)應(yīng)的元素,例如,引用現(xiàn)有的與元素類型對(duì)應(yīng)的概念資源。步驟s202:根據(jù)第m-1個(gè)元組中的元素與第m個(gè)元組中的元素之間的對(duì)應(yīng)關(guān)系,建立所述第m-1個(gè)元組與所述第m個(gè)元組的映射關(guān)系,其中,m=2,3,……,n。用戶可根據(jù)實(shí)際業(yè)務(wù)場(chǎng)景,在相鄰的兩個(gè)元組中分別選擇需要建立對(duì)應(yīng)關(guān)系的元素,進(jìn)而建立第一個(gè)元組至第n個(gè)元組的映射關(guān)系,參見圖5,以三元組構(gòu)成的元組集為例,第一個(gè)元組是元素為“信用卡”和“儲(chǔ)蓄卡”,第二個(gè)元組是由元素為“貸款年限”、“還款額度”和“利息”構(gòu)成,第三個(gè)元組是由元素為“較高”、“合適”和“太低”構(gòu)成。用戶可在第一個(gè)元組中選取需要建立對(duì)應(yīng)關(guān)系的元素,例如選擇“信用卡”,在第二元組的元素會(huì)對(duì)應(yīng)“信用卡”分為建立關(guān)系列隊(duì)和未建立關(guān)系列隊(duì),建立關(guān)系列隊(duì)由已與“信用卡”建立對(duì)應(yīng)關(guān)系的元素組成,未建立關(guān)系列隊(duì)由未與“信用卡”建立對(duì)應(yīng)關(guān)系的元素組成,假設(shè)第二個(gè)元組中的元素“貸款年限”、“還款額度”和“還款期限”均未與“信用卡”建立對(duì)應(yīng)關(guān)系,則建立關(guān)系列隊(duì)為空,未建立關(guān)系列隊(duì)包括“貸款年限”、“還款額度”和“利息”。用戶在未建立關(guān)系列隊(duì)中選取需與“信用卡”建立對(duì)應(yīng)關(guān)系的元素,例如“貸款年限”和“還款額度”。響應(yīng)用戶的選擇操作,將“信用卡”分別與“貸款年限”和“還款額度”建立對(duì)應(yīng)關(guān)系,“貸款年限”和“還款額度”由未建立關(guān)系列隊(duì)移動(dòng)到建立關(guān)系列隊(duì),同理,可將“儲(chǔ)蓄卡”與“利息”建立對(duì)應(yīng)關(guān)系,從而完成第一個(gè)元組與第二個(gè)元組的映射關(guān)系,同理,可對(duì)第二個(gè)元組和第三個(gè)元組建立映射關(guān)系。建立對(duì)應(yīng)關(guān)系的方式不限于上述的用戶設(shè)置,也可通過語料學(xué)習(xí)自動(dòng)建立關(guān)聯(lián)關(guān)系,在此不做限制。步驟s203:根據(jù)所述映射關(guān)系,生成至少一個(gè)與映射關(guān)系對(duì)應(yīng)的關(guān)聯(lián)表達(dá)式。根據(jù)第一個(gè)元組至第n個(gè)元組的映射關(guān)系,逐一生成關(guān)聯(lián)表達(dá)式,以圖5所示,生成的關(guān)聯(lián)表達(dá)式如下所示關(guān)聯(lián)表達(dá)式1信用卡-貸款年限-較高關(guān)聯(lián)表達(dá)式2信用卡-貸款年限-合適關(guān)聯(lián)表達(dá)式3信用卡-還款額度-較高關(guān)聯(lián)表達(dá)式4信用卡-貸款年限-太低關(guān)聯(lián)表達(dá)式5儲(chǔ)蓄卡-利息-較高關(guān)聯(lián)表達(dá)式6儲(chǔ)蓄卡-利息-太低步驟s204:根據(jù)每個(gè)所述關(guān)聯(lián)表達(dá)式的語義,確定每個(gè)所述關(guān)聯(lián)表達(dá)式對(duì)應(yīng)的情感傾向值。情感傾向值包括正面情感傾向值、中性情感傾向值和負(fù)面情感傾向值。具體的取值可由用戶具體設(shè)置,例如可設(shè)定正面情感傾值為1,中性情感傾向值為0,負(fù)面情感傾向值為-1。如上表所示,關(guān)聯(lián)表達(dá)式3“信用卡-還款額度-較高”和關(guān)聯(lián)表達(dá)式6“儲(chǔ)蓄卡-利息-太低”屬于負(fù)面情感表達(dá),因此,關(guān)聯(lián)表達(dá)式3和關(guān)聯(lián)表達(dá)式6均為負(fù)面情感傾向值-1;關(guān)聯(lián)表達(dá)式4“信用卡-貸款年限-合適”屬于中性情感表達(dá),為中性情感傾向值0;關(guān)聯(lián)表達(dá)式1“信用卡-貸款年限-較高”和關(guān)聯(lián)表達(dá)式5“儲(chǔ)蓄卡-利息-較高”屬于正面情感表達(dá),為正面情感傾向值1。每個(gè)關(guān)聯(lián)表達(dá)式都賦予對(duì)應(yīng)的情感傾向值,可利用每個(gè)關(guān)聯(lián)表達(dá)式的情感傾向值分析文本信息的情感傾向,有利于提高關(guān)聯(lián)結(jié)果的識(shí)別性,決策者可通過情感傾向值直觀的了解關(guān)聯(lián)結(jié)果所表達(dá)的情感,并且作為制定相應(yīng)營(yíng)銷策略的依據(jù)。步驟s205:根據(jù)每個(gè)關(guān)聯(lián)表達(dá)式和對(duì)應(yīng)的情感傾向值,生成關(guān)聯(lián)表達(dá)式列表。例如,上述的關(guān)聯(lián)表達(dá)式和對(duì)應(yīng)的情感傾向值,可以生成如下的關(guān)聯(lián)表達(dá)式列表,關(guān)聯(lián)表達(dá)式1信用卡-貸款年限-較高1關(guān)聯(lián)表達(dá)式2信用卡-貸款年限-合適0關(guān)聯(lián)表達(dá)式3信用卡-還款額度-較高-1關(guān)聯(lián)表達(dá)式4信用卡-貸款年限-太低-1關(guān)聯(lián)表達(dá)式5儲(chǔ)蓄卡-利息-較高1關(guān)聯(lián)表達(dá)式6儲(chǔ)蓄卡-利息-太低-1步驟s206:獲取至少一個(gè)文本信息。文本信息可以從網(wǎng)站上的評(píng)論中選取,通常,購(gòu)買某個(gè)產(chǎn)品或享有某項(xiàng)業(yè)務(wù)的用戶會(huì)在網(wǎng)站的評(píng)論中分享評(píng)價(jià)和體驗(yàn),另外,也可以從諸如微博、博客和虛擬社區(qū)的社交媒體上發(fā)布的某個(gè)產(chǎn)品或某項(xiàng)業(yè)務(wù)的評(píng)價(jià)中選取。步驟s207:將每個(gè)所述文本信息與所述關(guān)聯(lián)表達(dá)式列表中的每個(gè)關(guān)聯(lián)表達(dá)式相匹配,得到關(guān)聯(lián)分析結(jié)果。逐個(gè)分析獲取到的文本信息,遍歷關(guān)聯(lián)表達(dá)式列表,將每個(gè)文本信息分別與每個(gè)關(guān)聯(lián)表達(dá)式相匹配,得到每個(gè)關(guān)聯(lián)表達(dá)式相匹配的文本信息,得到關(guān)聯(lián)分析結(jié)果,根據(jù)每個(gè)關(guān)聯(lián)表達(dá)式相匹配的文本信息數(shù)量,可以直觀反映是否是強(qiáng)關(guān)聯(lián)關(guān)系,以使決策者作為制定營(yíng)銷策略的依據(jù)。由以上技術(shù)方案可知,本申請(qǐng)?zhí)峁┝艘环N多元關(guān)聯(lián)關(guān)系的分析方法,元組的數(shù)量、每個(gè)元組的元素以及不同元組的元素對(duì)應(yīng)關(guān)系可根據(jù)實(shí)際的業(yè)務(wù)場(chǎng)景進(jìn)行設(shè)置,生成適應(yīng)于當(dāng)前的業(yè)務(wù)場(chǎng)景的關(guān)聯(lián)表達(dá)式列表,并且利用關(guān)聯(lián)表達(dá)式所表現(xiàn)的語義能準(zhǔn)確的定位數(shù)據(jù)庫(kù)中有使用價(jià)值的關(guān)聯(lián)結(jié)果,提高關(guān)聯(lián)分析的有效性,有利于決策者制定相應(yīng)的營(yíng)銷策略。而且相比于現(xiàn)有的機(jī)器學(xué)習(xí)算法,利用頻繁集進(jìn)行迭代組合而逐條建立關(guān)聯(lián)表達(dá)式而言,本申請(qǐng)通過多元組模型可同時(shí)生成多條關(guān)聯(lián)表達(dá)式,并對(duì)文本信息進(jìn)行關(guān)聯(lián)關(guān)系分析,從而得到多個(gè)關(guān)聯(lián)分析結(jié)果,提高關(guān)聯(lián)分析的運(yùn)算效率。參見圖3,上述步驟s207包括以下步驟:步驟s301:將第一關(guān)聯(lián)表達(dá)式中所有的概念與第一文本信息,按照預(yù)設(shè)的匹配規(guī)則進(jìn)行匹配;其中,所述第一關(guān)聯(lián)表達(dá)式是所述關(guān)聯(lián)表達(dá)式列表中的任意一個(gè)關(guān)聯(lián)表達(dá)式;所述概念是在所述第一關(guān)聯(lián)表達(dá)式中,具有關(guān)聯(lián)關(guān)系且分別屬于所述n個(gè)元組的元素;所述第一文本信息是所有文本信息中的任意一個(gè)。以上述的關(guān)聯(lián)表達(dá)式1“信用卡-貸款年限-較高”為例,“信用卡”、“貸款年限”和“較高”為關(guān)聯(lián)表達(dá)式1的概念,需將“信用卡”、“貸款年限”和“較高”均與第一文本信息匹配。預(yù)設(shè)的匹配規(guī)則可以是順序匹配或者無序匹配,順序匹配是不僅要將文本信息與關(guān)聯(lián)表達(dá)式的所有概念進(jìn)行語義匹配,概念的排列順序與文本信息中與概念相匹配的信息的排列順序也要進(jìn)行匹配,無序匹配是僅需要對(duì)文本信息與關(guān)聯(lián)表達(dá)式的所有概念進(jìn)行語義匹配即可。步驟s302:如果所述第一關(guān)聯(lián)表達(dá)式中所有的概念按照預(yù)設(shè)的匹配規(guī)則,均與第一文本信息匹配,則確定所述第一關(guān)聯(lián)表達(dá)式與第一文本信息匹配。對(duì)于順序匹配,例如,文本信息為“我辦了一張信用卡,每月最低還款額度為2000,比其他銀行的高很多”,按照順序匹配規(guī)則,語義和排列順序與該本信息相匹配的是關(guān)聯(lián)表達(dá)式“信用卡-還款額度-較高”。而文本信息“每月最低還款額度為2000,這張信用卡太不劃算了”,則無與其相匹配的關(guān)聯(lián)表達(dá)式。對(duì)于無序匹配,文本信息為“每月最低還款額度為2000,這張信用卡太不劃算了”和“我辦了一張信用卡,每月最低還款額度為2000,比其他銀行的高很多”,按照無序匹配規(guī)則,該兩個(gè)文本信息相匹配的關(guān)聯(lián)表達(dá)式都是“信用卡-還款額度-較高”。參見圖4,上述步驟s301還包括以下步驟:步驟s401:判斷第一關(guān)聯(lián)表達(dá)式中的當(dāng)前概念是否有對(duì)應(yīng)的概念值表達(dá)式列表;概念值表達(dá)式列表中的概念值表達(dá)式可以是特征詞,可以是正則表達(dá)式等。正則表達(dá)式是一種正規(guī)的描述字符串模式的表達(dá)式,可以用來進(jìn)行文本匹配,具體為在給定的文本信息中查找與給定的正則表達(dá)式相匹配的部分。概念值表達(dá)式列表可通過現(xiàn)有的語義模型建設(shè)平臺(tái)進(jìn)行構(gòu)建,也可直接引用已有的概念值表達(dá)式列表。第一關(guān)聯(lián)表達(dá)式中的當(dāng)前概念是指即將要與第一文本信息進(jìn)行匹配的概念。如果所述當(dāng)前概念有對(duì)應(yīng)的概念值表達(dá)式列表,則執(zhí)行步驟s402-s404;如果所述當(dāng)前概念沒有對(duì)應(yīng)的概念值表達(dá)式列表,則執(zhí)行步驟s405。步驟s402:獲取所述概念值值表達(dá)式列表。例如“太低”這一概念,假設(shè)“太低”有對(duì)應(yīng)的概念值表達(dá)式列表,則獲取該概念對(duì)應(yīng)的表達(dá)式列表,該概念值表達(dá)式列表中包括“偏低”等特征詞,也可包含與概念語義相近的正則表達(dá)式,例如,“不.{0,2}高”,“不.{0,2}可觀”等。步驟s403:將概念值表達(dá)式列表中的每個(gè)概念值表達(dá)式與第一文本信息進(jìn)行匹配。步驟s404:如果所述概念值表達(dá)式列表中任意一個(gè)概念值表達(dá)式與所述第一文本信息相匹配,則確定當(dāng)前概念與所述第一文本信息匹配。具體匹配規(guī)則在此不做限定,可采用現(xiàn)有的任何匹配規(guī)則進(jìn)行匹配,例如對(duì)于有序匹配,可采用模式匹配加位置匹配,即從第一文本信息的第一個(gè)字符起與概念值表達(dá)式列表中的任意一個(gè)表達(dá)式的第一個(gè)字符進(jìn)行匹配,若相匹配,則繼續(xù)對(duì)字符進(jìn)行后續(xù)的比較,若不匹配,則從第一文本信息的第二個(gè)字符起與該語義項(xiàng)的第一個(gè)字符重新比較,直至語義項(xiàng)的每個(gè)字符依次與第一文本信息中的一個(gè)連續(xù)的字符序列相等為止,并且記錄第一文本信息中與當(dāng)前概念匹配的信息的位置,如果位置順序與概念排列順序相同,則視為匹配成功,否則匹配失敗。對(duì)于無序匹配,則采用模式匹配即可,即從第一文本信息的第一個(gè)字符起與概念值表達(dá)式列表中的任意一個(gè)概念值表達(dá)式的第一個(gè)字符進(jìn)行匹配,若相匹配,則繼續(xù)對(duì)字符進(jìn)行后續(xù)的比較,若不匹配,則從第一文本信息的第二個(gè)字符起與該語義項(xiàng)的第一個(gè)字符重新比較,直至語義項(xiàng)的每個(gè)字符依次與第一文本信息中的一個(gè)連續(xù)的字符序列相等為止,則視為匹配成功,否則匹配失敗。如果匹配失敗,再重新獲取第二個(gè)概念值表達(dá)式進(jìn)行上述匹配過程,直至有概念值表達(dá)式與第一文本信息匹配成功,或者將所有概念值表達(dá)式都進(jìn)行完匹配過程為止。除了上述的匹配規(guī)則,對(duì)于概念值表達(dá)式列表中的具體的特征詞的匹配,還可采用模糊語義匹配,例如,在假設(shè)文本信息中含有詞語“紙巾”,而在概念值表達(dá)式列表中有“抽紙”,則根據(jù)模糊語義匹配原則,確定“紙巾”與“抽紙”匹配成功,并將“紙巾”作為新的概念值表達(dá)式存儲(chǔ)到概念值表達(dá)式列表中,以豐富概念值表達(dá)式列表,提高匹配的準(zhǔn)確性。對(duì)于正則表達(dá)式的匹配,兩個(gè)字符之間可采用任何符合數(shù)量要求的字符均可視為匹配成功,例如第一文本信息中存在“不是很高”、“不高”或者“不是太高”,均可視為與正則表達(dá)式“不.{0,2}高”匹配成功。步驟s405:將所述當(dāng)前概念與所述第一文本信息進(jìn)行匹配,得到匹配結(jié)果。當(dāng)前概念沒有對(duì)應(yīng)的概念值表達(dá)式列表,則需將當(dāng)前概念直接與所述第一文本信息進(jìn)行匹配。具體匹配規(guī)則在此不做限定,可采用現(xiàn)有的任何匹配規(guī)則進(jìn)行匹配,示例性的,可采用上述的匹配規(guī)則進(jìn)行匹配,不再贅述。采用關(guān)聯(lián)表達(dá)式中概念對(duì)應(yīng)的概念值表達(dá)式列表與文本信息進(jìn)行匹配,由于概念值表達(dá)式列表中含有文本信息中包含的各種語義描述的方式,所以提高匹配的準(zhǔn)確性,從而提高關(guān)聯(lián)結(jié)果的準(zhǔn)確性。第二方面,參見圖6,本申請(qǐng)?zhí)峁┮环N多元關(guān)聯(lián)關(guān)系的分析裝置,包括:創(chuàng)建模塊601,用于創(chuàng)建元組集,所述元組集包括n個(gè)元組,每個(gè)所述元組包括至少一個(gè)元素,n為大于1的正整數(shù);映射建立模塊602,根據(jù)第m-1個(gè)元組中的元素與第m個(gè)元組中的元素之間的對(duì)應(yīng)關(guān)系,建立所述第m-1個(gè)元組與所述第m個(gè)元組的映射關(guān)系,其中,m=2,3,……,n;生成模塊603,用于根據(jù)所述映射關(guān)系,生成關(guān)聯(lián)表達(dá)式列表;關(guān)聯(lián)關(guān)系分析模塊604,用于根據(jù)所述關(guān)聯(lián)表達(dá)式列表進(jìn)行關(guān)聯(lián)關(guān)系分析。進(jìn)一步地,參見圖7,所述生成模塊603還包括:關(guān)聯(lián)表達(dá)式生成單元701,用于根據(jù)所述映射關(guān)系,生成至少一個(gè)與映射關(guān)系對(duì)應(yīng)的關(guān)聯(lián)表達(dá)式;情感傾向值確定單元702,根據(jù)每個(gè)所述關(guān)聯(lián)表達(dá)式的語義,確定每個(gè)所述關(guān)聯(lián)表達(dá)式對(duì)應(yīng)的情感傾向值;關(guān)聯(lián)表達(dá)式列表生成單元703,根據(jù)每個(gè)所述關(guān)聯(lián)表達(dá)式和對(duì)應(yīng)的情感傾向值,生成關(guān)聯(lián)表達(dá)式列表。進(jìn)一步地,參見圖8,所述關(guān)聯(lián)關(guān)系分析模塊604還包括:獲取子模塊801,用于獲取至少一個(gè)文本信息;分析子模塊802,用于將每個(gè)所述文本信息與所述關(guān)聯(lián)表達(dá)式列表中的每個(gè)關(guān)聯(lián)表達(dá)式相匹配,得到關(guān)聯(lián)分析結(jié)果。進(jìn)一步地,參見圖9,所述分析子模塊802包括:匹配單元901,用于將第一關(guān)聯(lián)表達(dá)式中所有的概念與第一文本信息,按照預(yù)設(shè)的匹配規(guī)則進(jìn)行匹配;其中,所述第一關(guān)聯(lián)表達(dá)式是所述關(guān)聯(lián)表達(dá)式列表中的任意一個(gè)關(guān)聯(lián)表達(dá)式;所述概念是在所述第一關(guān)聯(lián)表達(dá)式中,具有關(guān)聯(lián)關(guān)系且分別屬于所述n個(gè)元組的元素;所述第一文本信息是所有文本信息中的任意一個(gè);確定單元902,用于如果所述第一關(guān)聯(lián)表達(dá)式中所有的概念按照預(yù)設(shè)的匹配規(guī)則,均與第一文本信息匹配,則確定所述第一關(guān)聯(lián)表達(dá)式與第一文本信息匹配。進(jìn)一步地,參見圖10,所述匹配單元901包括:判斷子單元1001,用于判斷第一關(guān)聯(lián)表達(dá)式中的當(dāng)前概念是否有對(duì)應(yīng)的概念值表達(dá)式列表;概念值表達(dá)式列表獲取子單元1002,用于如果所述當(dāng)前概念有對(duì)應(yīng)的概念值表達(dá)式列表,則獲取所述概念值表達(dá)式列表;第一匹配子單元1003,用于將所述概念值表達(dá)式列表中的每個(gè)概念值表達(dá)式與所述第一文本信息進(jìn)行匹配;確定子單元1004,用于如果所述概念值表達(dá)式列表中任意一個(gè)概念值表達(dá)式與所述第一文本信息相匹配,則確定當(dāng)前概念與所述第一文本信息匹配;確定子單元1005,還用于如果所述當(dāng)前概念沒有對(duì)應(yīng)的概念值表達(dá)式列表,則將所述當(dāng)前概念與所述第一文本信息進(jìn)行匹配,得到匹配結(jié)果。由以上技術(shù)方案可知,本申請(qǐng)?zhí)峁┝艘环N多元關(guān)聯(lián)關(guān)系的分析方法及裝置,元組的數(shù)量、每個(gè)元組的元素以及不同元組的元素對(duì)應(yīng)關(guān)系可根據(jù)實(shí)際的業(yè)務(wù)場(chǎng)景進(jìn)行設(shè)置,生成適應(yīng)于當(dāng)前的業(yè)務(wù)場(chǎng)景的關(guān)聯(lián)表達(dá)式列表,并且利用關(guān)聯(lián)表達(dá)式所表現(xiàn)的語義能準(zhǔn)確的定位數(shù)據(jù)庫(kù)中有使用價(jià)值的關(guān)聯(lián)結(jié)果,提高關(guān)聯(lián)分析的有效性,有利于決策者制定相應(yīng)的營(yíng)銷策略。而且相比于現(xiàn)有的機(jī)器學(xué)習(xí)算法,利用頻繁集進(jìn)行迭代組合而逐條建立關(guān)聯(lián)表達(dá)式而言,本申請(qǐng)通過多元組模型可同時(shí)生成多條關(guān)聯(lián)表達(dá)式,并對(duì)文本信息進(jìn)行關(guān)聯(lián)關(guān)系分析,從而得到多個(gè)關(guān)聯(lián)分析結(jié)果,提高關(guān)聯(lián)分析的運(yùn)算效率。本領(lǐng)域的技術(shù)人員可以清楚地了解到本申請(qǐng)實(shí)施例中的技術(shù)可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn)。基于這樣的理解,本申請(qǐng)實(shí)施例中的技術(shù)方案本質(zhì)上或者或?qū)ΜF(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在存儲(chǔ)介質(zhì)中,如rom/ram、磁碟、光盤等,包括若干指令用以似的一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。本說明書的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分可相互參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,尤其,對(duì)于裝置實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部分說明即可。當(dāng)前第1頁12