本申請涉及數(shù)據(jù)挖掘技術領域,尤其涉及一種挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法及裝置。
背景技術:
關聯(lián)分析方法是在數(shù)據(jù)挖掘技術領域中,從一個存儲大量數(shù)據(jù)的數(shù)據(jù)庫中發(fā)掘不同數(shù)據(jù)之間的相關性的技術。關聯(lián)分析方法在選擇性行銷和決策分析等領域廣泛應用,例如,運營企業(yè)根據(jù)消費者的購物清單,利用關聯(lián)分析方法挖掘消費者通常會一起購買的商品,了解消費者的購買習慣,然后擬定有效的“捆綁銷售”行銷策略。近年來,關聯(lián)分析方法也被應用到網(wǎng)頁瀏覽行為分析或股市交易分析等領域。
現(xiàn)有的關聯(lián)分析方法大多是基于機器學習算法,如apriori算法,其在數(shù)據(jù)庫中查采用迭代算法,找出支持度大于預置支持度的項集,也就是頻繁集,利用頻繁集構造出大于預置置信度的關聯(lián)關系,進而發(fā)現(xiàn)不同數(shù)據(jù)之間的相關性。
但是,現(xiàn)有的關聯(lián)分析方法所發(fā)現(xiàn)的數(shù)據(jù)之間的相關性,會因外在因素變化而失效,例如在銀行業(yè)務辦理中,某種信用卡的a型分期付款業(yè)務,比較受儲戶歡迎,但是a型分期付款業(yè)務已取消,現(xiàn)有的關聯(lián)分析方法還是會挖掘出這種已失效的相關性。除此之外,距離當前時間越接近的數(shù)據(jù)的相關性越重要,例如,一銀行上周推出某種信用卡的b型分期付款業(yè)務,深受儲戶歡迎,但是現(xiàn)有的關聯(lián)分析方法會因支持度不足而無法發(fā)現(xiàn)。因此,現(xiàn)有的關聯(lián)分析方法不能準確的定位有使用價值的關聯(lián)結果,不利于決策者制定相應的營銷策略。
技術實現(xiàn)要素:
本申請?zhí)峁┝艘环N挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法及裝置,以解決現(xiàn)有的關聯(lián)分析方法不能準確的定位有使用價值的關聯(lián)結果,不利于決策者制定相應的營銷策略的問題。
第一方面,本申請?zhí)峁┝艘环N挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法,包括:
獲取規(guī)則關聯(lián)模型和至少一個樣本信息,所述規(guī)則關聯(lián)模型包括n個元組,n為大于1的正整數(shù),每個所述元組包括至少一個概念;
根據(jù)所述規(guī)則關聯(lián)模型的所有元組中的概念,對所述至少一個樣本信息進行標準化處理,得到至少一個標準樣本信息;
將所述至少一個標準樣本信息進行切詞和去停用詞處理,得到每個所述標準樣本信息所對應的關鍵詞集;
根據(jù)所述關鍵詞集,按照預設算法,計算得到二元關系表達式列表;
將所述關聯(lián)表達式列表和所述規(guī)則關聯(lián)模型的候選關聯(lián)表達式列表進行匹配,所述候選關聯(lián)表達式列表是由至少一個候選關聯(lián)表達式所組成的列表,每個所述候選關聯(lián)表達式由所述規(guī)則關聯(lián)模型的兩個相鄰所述元組中未建立關聯(lián)關系的概念構成;
根據(jù)匹配結果,建立所述規(guī)則關聯(lián)模型的相鄰兩個元組的概念的關聯(lián)關系。
第二方面,本申請還提供了一種挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的裝置,包括:
獲取模塊,用于獲取規(guī)則關聯(lián)模型和至少一個樣本信息,所述規(guī)則關聯(lián)模型包括n個元組,n為大于1的正整數(shù),每個所述元組包括至少一個概念;
標準化處理模塊,用于根據(jù)所述規(guī)則關聯(lián)模型的所有元組中的概念,對所述至少一個樣本信息進行標準化處理,得到至少一個標準樣本信息;
關鍵詞生成模塊,用于將所述至少一個標準樣本信息進行切詞和去停用詞處理,得到每個所述標準樣本信息所對應的關鍵詞集;
關聯(lián)表達式計算模塊,用于根據(jù)所述關鍵詞集,按照預設算法,計算得到二元關系表達式列表;
匹配模塊,用于將所述關聯(lián)表達式列表和所述規(guī)則關聯(lián)模型的候選關聯(lián)表達式列表進行匹配,所述候選關聯(lián)表達式列表是由至少一個候選關聯(lián)表達式所組成的列表,每個所述候選關聯(lián)表達式由所述規(guī)則關聯(lián)模型的兩個相鄰所述元組中未建立關聯(lián)關系的概念構成;
關聯(lián)關系建立模塊,用于根據(jù)匹配結果,建立所述規(guī)則關聯(lián)模型的相鄰兩個元組的概念的關聯(lián)關系。
由以上技術方案可知,本申請?zhí)峁┮环N挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法,該方法利用規(guī)則關聯(lián)模型的元組的數(shù)量、每個元組的概念以及不同元組的概念對應關系可根據(jù)實際的業(yè)務場景進行設置,并且通過對樣本數(shù)據(jù)分析處理,得到二元關系表達式列表,將二元關系表達式列表與候選表達式列表進行匹配,根據(jù)匹配結果,可建立規(guī)則關聯(lián)模型中,未預先設置但有價值的關聯(lián)關系,以對規(guī)則關聯(lián)模型中的相鄰兩個元組的概念的關聯(lián)關系進行補充,使規(guī)則關聯(lián)模型全面直觀的反映實際業(yè)務場景中的有價值的關聯(lián)結果,提高定位有價值關聯(lián)結果的準確率,有利于決策者制定相應的營銷策略。
附圖說明
為了更清楚地說明本申請的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,對于本領域普通技術人員而言,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本申請?zhí)峁┑囊环N挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法一個實施例提供的方法流程圖;
圖2為本申請?zhí)峁┑囊环N挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法另一個實施例提供的流程圖;
圖3為本申請?zhí)峁┑囊?guī)則關聯(lián)模型;
圖4為本申請的一種挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的裝置的結構示意圖;
圖5為圖4中標準化處理模塊的結構示意圖;
圖6為圖4中二元關系表達式計算模塊的結構示意圖;
圖7為圖4中關聯(lián)關系建立模塊的結構示意圖。
具體實施方式
參見圖1,為本申請?zhí)峁┑囊环N挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法一個實施例提供的方法流程圖。本申請實施例提供了一種挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法,包括如下步驟:
步驟101:獲取規(guī)則關聯(lián)模型和至少一個樣本信息,所述規(guī)則關聯(lián)模型包括n個元組,n為大于1的正整數(shù),每個所述元組包括至少一個概念。
規(guī)則關聯(lián)模型包含的元組可是僅含有一個概念構成,也可以是由多個概念構成。多元組定義為元組集中含有相應數(shù)量的元組。元組可根據(jù)概念的類型劃分,如含有產(chǎn)品種類的元組、含有業(yè)務種類的元組和口碑評價的元組等等。以三元組構成的規(guī)則關聯(lián)模型為例,即含有三個元組,第一個元組是概念僅為“信用卡”,第二個元組是由概念由“年限”、“額度”和“期限”構成,第三個元組是由概念由“較高”和“太低”構成。相鄰兩個所述元組的概念可具預先設置好的關聯(lián)關系,該關聯(lián)關系可經(jīng)用戶根據(jù)實際業(yè)務場景進行設置,也可由機器學習算法計算得到,例如,第一元組中“信用卡”可預先與第二元組的“額度”建立關聯(lián)關系,同理,其他相鄰兩個元組的關聯(lián)關系也可進行預先設置。
樣本信息可以從網(wǎng)站上的評論中選取,通常,購買某個產(chǎn)品或享有某項業(yè)務的用戶會在網(wǎng)站的評論中分享評價和體驗,另外,也可以從諸如微博、博客和虛擬社區(qū)的社交媒體上發(fā)布的某個產(chǎn)品或某項業(yè)務的評價中抽樣選取。
步驟102:根據(jù)所述規(guī)則關聯(lián)模型的所有元組中的概念,對所述至少一個樣本信息進行標準化處理,得到至少一個標準樣本信息。
步驟103:將所述至少一個標準樣本信息進行切詞和去停用詞處理,得到每個所述標準樣本信息所對應的關鍵詞集。
步驟104:根據(jù)所述關鍵詞集,按照預設算法,計算得到二元關系表達式列表。
步驟105:將所述二元關系表達式列表和所述規(guī)則關聯(lián)模型的候選關聯(lián)表達式列表進行匹配,所述候選關聯(lián)表達式列表是由至少一個候選關聯(lián)表達式所組成的列表,每個所述候選關聯(lián)表達式由所述規(guī)則關聯(lián)模型的兩個相鄰所述元組中未建立關聯(lián)關系的概念構成。
以圖3為例,候選關聯(lián)表達式列表為“信用卡-利率,黃金-額度,黃金-利息,黃金-利率,額度-較低,額度-很低,額度-很高,利息-很低,利息-交底,利息-很高,利率-交底,利率-很高”。
步驟106:根據(jù)匹配結果,建立規(guī)則關聯(lián)模型的相鄰兩個元組的概念的關聯(lián)關系。
由以上技術方案可知,本申請?zhí)峁┮环N挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法,該方法利用規(guī)則關聯(lián)模型的元組的數(shù)量、每個元組的概念以及不同元組的概念對應關系可根據(jù)實際的業(yè)務場景進行設置,并且通過對樣本數(shù)據(jù)分析處理,得到二元關系表達式列表,將二元關系表達式列表與候選表達式列表進行匹配,根據(jù)匹配結果,可建立規(guī)則關聯(lián)模型中,未預先設置但有價值的關聯(lián)關系,以對規(guī)則關聯(lián)模型中的相鄰兩個元組的概念的關聯(lián)關系進行補充,使規(guī)則關聯(lián)模型全面直觀的反映實際業(yè)務場景中的有價值的關聯(lián)結果,提高定位有價值關聯(lián)結果的準確率,有利于決策者制定相應的營銷策略。
參見圖2,本申請另一實施例提供了一種挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法,包括如下步驟:
步驟201:獲取規(guī)則關聯(lián)模型和至少一個樣本信息,所述規(guī)則關聯(lián)模型包括n個元組,n為大于1的正整數(shù),每個所述元組包括至少一個概念。
步驟202:判斷當前概念是否有對應的概念值表達式列表。
當前概念是指即將與樣本信息進行匹配的概念。
如果所述當前概念有對應的概念值表達式列表,則執(zhí)行步驟203。
如果所述當前概念沒有對應的概念值表達式列表,則執(zhí)行步驟206。
步驟203:獲取所述概念值表達式列表。
概念值表達式列表中的概念值表達式可以是特征詞,也可以是正則表達式。
正則表達式是一種正規(guī)的描述字符串模式的表達式,可以用來進行文本匹配,具體為在給定的字符串中查找與給定的正則表達式相匹配的部分。
以圖3為例的規(guī)則關聯(lián)模型中的“較低”這一概念為例,獲取該概念對應的概念值表達式列表,該概念值表達式列表包含與概念相近的近義詞或同義詞,例如,“偏低”等,也可包含與概念語義相近的正則表達式,例如,“不.{0,2}高”,“不.{0,2}可觀”等。
概念值表達式列表可通過現(xiàn)有的語義模型建設平臺進行構建,也可直接引用已有的概念值表達式列表。
步驟204:將所述概念值表達式列表的每個概念值表達式與所述第一樣本信息進行匹配,所述第一樣本信息是所述至少一個標準樣本信息中的任意一個標準樣本信息。
步驟205:如果第一概念值表達式與所述第一樣本信息相匹配,則將所述第一樣本信息中與所述第一概念值表達式相匹配的信息替換為當前概念,所述第一概念值表達式是所述概念值表達式列表的任意一個概念值表達式。
匹配的規(guī)則可采取任何現(xiàn)有的匹配規(guī)則進行匹配,在此不做限定,示例性的,本步驟采用模式匹配的規(guī)則進行匹配,模式匹配是從第一樣本信息的第一個字符起與概念值表達式列表中的任意一個概念值表達式的第一個字符進行匹配,若相匹配,則繼續(xù)對字符進行后續(xù)的比較,若不匹配,則從第一樣本信息的第二個字符起與該概念值表達式的第一個字符重新比較,直至概念值表達式的每個字符依次與第一樣本信息中的一個連續(xù)的字符序列相等為止,則視為匹配成功,否則匹配失敗,如果匹配失敗,則繼續(xù)獲取下一個概念值表達式,直至所有概念值表達式匹配完成或其中有個概念值表達式與第一樣本信息匹配成功為止。
對于正則表達式的匹配,兩個字符之間可采用任何符合數(shù)量要求的字符均可視為匹配成功,例如第一文本信息中存在“不是很高”、“不高”或者“不是太高”,均可視為與正則表達式“不.{0,2}高”匹配成功。
以第一樣本信息的內容是“貴金屬黃金的利息不是很可觀”和圖3所示的規(guī)則關聯(lián)模型為例,首先,判斷規(guī)則關聯(lián)模型中的每個概念是否有與其相對應的概念值表達式列表,以其中的“較低”概念為例,假設“較低”這個概念有對應的概念值表達式列表,該概念值表達式列表包括“偏低”、“不.{0,2}高”,“不.{0,2}可觀”等概念值表達式,將每個概念值表達式均與第一樣本信息進行模式匹配,由于“不.{0,2}可觀”與第一樣本信息中的“不是很可觀”匹配成功,則將第一樣本信息中的“不是很可觀”替換為“不.{0,2}可觀”所在概念值表達式列表對應的“較低”這一概念,從而得到“貴金屬黃金的利息較低”這一樣本信息,其他概念可采用上述同樣的步驟,對樣本信息進行標準化處理。
步驟206:將所述當前概念與所述第一樣本信息進行匹配。
可參照步驟204的模式匹配的步驟,不再贅述。
步驟207:如果所述當前概念與所述第一樣本信息匹配,則將所述第一樣本信息中與所述當前概念相匹配的信息替換為所述當前概念。
可參照步驟205,不再贅述。
將所有樣本信息進行標準化處理后,可使樣本信息具有標準的表述形式,以提高后續(xù)關聯(lián)分析的準確性,并減少數(shù)據(jù)的處理量,增加運算速度。
步驟208:將所述至少一個標準樣本信息進行切詞和去停用詞處理,得到每個所述標準樣本信息所對應的關鍵詞集。
切詞可按照詞語的詞性將標準樣本信息中的句子進行拆分,得到相應的詞語,并將其中的停用詞去除,得到關鍵詞集。
去掉停用詞處理是預先建立一個停用詞列表,去掉停用詞時,切詞處理結果中每一個詞條與停用詞列表中的詞進行匹配,如果該詞條存在于停用詞列表中,則將該詞條從中文切詞處理后的詞條串中刪除。
本申請中所述停用詞為無實際意義的詞,如語氣助詞或者結構助詞等,例如“的”、“地”、“了”、“嗎”和“吧”等。
例如,標準文本信息為“貴金屬黃金的利息較低啊”,對該標準文本信息進行切詞,得到“貴金屬黃金”、“利息”、“太低”和“啊”,然后去掉“啊”這個停用詞,得到的關鍵詞集包括“貴金屬黃金”、“利息”和“太低”。
步驟209:根據(jù)所述關鍵詞集,生成與所述關鍵詞集對應的上下文詞空間向量模型。
上下文詞空間向量模型是用來記錄關鍵詞集中的關鍵詞集在對應的標準文本信息出現(xiàn)的位置的模型。例如上述的例子,關鍵詞集包括“貴金屬黃金”、“額度”和“太低”,其對應生成的上下文詞空間向量模型可記錄上述關鍵詞在標準文本“貴金屬黃金的利息較低啊”出現(xiàn)的位置,即“貴金屬”在第一位置,“額度”在第二位置,“太低”在第三位置。
由于對所有樣本信息進行標準化處理,使雖然表述存在差異但語義是一樣的樣本信息表述一致,因此其產(chǎn)生的關鍵詞集也相同,進而可使用同一上下文詞空間向量模型即可,避免數(shù)據(jù)的冗余,減少運算量,提高運算速度。
步驟210:根據(jù)所述上下文詞空間向量模型,計算得到二元關系表達式列表。
上下文詞空間向量模型可挖掘出二元關系表達式,二元關系表達式是指在一個標準樣本數(shù)據(jù)中同時頻繁出現(xiàn)的兩個關鍵詞的對應關系,以上述的關鍵詞集包括“貴金屬黃金”、“額度”和“太低”,其對應生成的上下文詞空間向量模型為例,先生成{貴金屬黃金}、{額度}和{太低}三個候選集,計算每個候選集的支持度,即出現(xiàn)該候選集的標準文本信息的數(shù)量占所有標準文本信息的數(shù)量的百分比,將支持度小于預設支持度的候選集進行剪枝處理,假設上述三個候選集的支持度均大于或等于預設支持度,即都是頻繁集,然后,將上述三個候選集進行兩兩組合,生成{貴金屬黃金,額度}、{額度,太低}和{貴金屬黃金,太低}三個集合,由預設支持度為條件,再進行剪枝,將支持度小于預設支持度的集合去除,得到最終的在一個標準樣本數(shù)據(jù)中同時頻繁出現(xiàn)的兩個關鍵詞的對應關系,即二元關系表達式。
步驟211:將所述二元關系表達式列表和所述規(guī)則關聯(lián)模型的候選關聯(lián)表達式列表進行匹配,所述候選關聯(lián)表達式列表是由至少一個候選關聯(lián)表達式所組成的列表,每個所述候選關聯(lián)表達式由所述規(guī)則關聯(lián)模型的兩個相鄰所述元組中未建立關聯(lián)關系的概念構成。
具體匹配方式可采用將二元關系表達式列表中的每個二元關系表達式與候選關聯(lián)表達式列表的所有候選關聯(lián)表達式逐一進行匹配,也可候選關聯(lián)表達式列表的每個候選關聯(lián)表達式與二元關系表達式列表中的所有二元關系表達式逐一進行匹配。
步驟212:如果所述第一二元關系表達式列表的第一二元關系表達式與所述候選關聯(lián)表達式列表的第一候選關聯(lián)表達式相匹配,則判斷所述第一候選關聯(lián)表達式是否滿足預設條件。所述第一二元關系表達式是所述二元關系表達式列表中任意的一個二元關系表達式,所述第一候選關聯(lián)表達式是所述候選關聯(lián)表達式列表中任意的一個候選關聯(lián)表達式。
二元關系表達式中的兩個建立對應關系的關鍵詞與候選關聯(lián)表達式的概念匹配即可視為匹配成功,與概念的位置無關,即二元關系表達式“利息-較低”與候選關聯(lián)表達式“較低-利息”可視為匹配成功。
預設條件可有用戶自行設置,例如,設置候選關聯(lián)表達式所適用的業(yè)務場景,及對匹配的候選關聯(lián)表達式的預設支持度進行設置。
如果滿足預設條件,則執(zhí)行步驟213。
滿足預設條件,即滿足用戶設置的條件,例如,符合設置的業(yè)務場景,并且匹配的候選關聯(lián)表達式的支持度大于或等于預設支持度。
步驟213:建立所述規(guī)則關聯(lián)模型中所述第一候選關聯(lián)表達式對應的關聯(lián)關系。
例如,假設匹配成功的候選關聯(lián)表達式例“黃金-利息”和“利息-較低”均滿足預設條件,即在關聯(lián)模型中建立對應的關聯(lián)關系。
由以上技術方案可知,本申請?zhí)峁┮环N挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法,該方法利用規(guī)則關聯(lián)模型的元組的數(shù)量、每個元組的概念以及不同元組的概念對應關系可根據(jù)實際的業(yè)務場景進行設置,并且通過對樣本數(shù)據(jù)分析處理,得到二元關系表達式列表,將二元關系表達式列表與候選表達式列表進行匹配,根據(jù)匹配結果,可建立規(guī)則關聯(lián)模型中,未預先設置但有價值的關聯(lián)關系,以對規(guī)則關聯(lián)模型中的相鄰兩個元組的概念的關聯(lián)關系進行補充,使規(guī)則關聯(lián)模型全面直觀的反映實際業(yè)務場景中的有價值的關聯(lián)結果,提高定位有價值關聯(lián)結果的準確率,有利于決策者制定相應的營銷策略。
第二方面,參見圖4,本申請?zhí)峁┮环N挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的裝置,包括:
獲取模塊401,用于獲取規(guī)則關聯(lián)模型和至少一個樣本信息,所述規(guī)則關聯(lián)模型包括n個元組,n為大于1的正整數(shù),每個所述元組包括至少一個概念;
標準化處理模塊402,用于根據(jù)所述規(guī)則關聯(lián)模型的所有元組中的概念,對所述至少一個樣本信息進行標準化處理,得到至少一個標準樣本信息;
關鍵詞生成模塊403,用于將所述至少一個標準樣本信息進行切詞和去停用詞處理,得到每個所述標準樣本信息所對應的關鍵詞集;
二元關系表達式計算模塊404,用于根據(jù)所述關鍵詞集,按照預設算法,計算得到二元關系表達式列表;
匹配模塊405,用于將所述二元關系表達式列表和所述規(guī)則關聯(lián)模型的候選關聯(lián)表達式列表進行匹配,所述候選關聯(lián)表達式列表是由至少一個候選關聯(lián)表達式所組成的列表,每個所述候選關聯(lián)表達式由所述規(guī)則關聯(lián)模型的兩個相鄰所述元組中未建立關聯(lián)關系的概念構成;
關聯(lián)關系建立模塊406,用于根據(jù)匹配結果,建立所述規(guī)則關聯(lián)模型的相鄰兩個元組的概念的關聯(lián)關系。
進一步地,參見圖5,所述標準化處理模塊402包括:
第一判斷單元501,判斷當前概念是否有對應的概念值表達式列表;
概念值表達式列表獲取單元,如果所述當前概念有對應的概念值表達式列表,則獲取所述概念值表達式列表;
第一匹配單元502,用于將所述概念值表達式列表的每個概念值表達式與所述第一樣本信息進行匹配,所述第一樣本信息是所述至少一個標準樣本信息中的任意一個標準樣本信息;
第一替換單元503,用于如果第一概念值表達式與所述第一樣本信息相匹配,則將所述第一樣本信息中與所述第一概念值表達式相匹配的信息替換為當前概念,所述第一概念值表達式是所述概念值表達式列表的任意一個概念值表達式。
進一步地,所述標準化處理模塊402還包括:
第二匹配單元504,用于如果所述當前概念沒有對應的概念值表達式列表,則將所述當前概念與所述第一樣本信息進行匹配;
第二替換單元505,用于如果所述當前概念與所述第一樣本信息匹配,則將所述第一樣本信息中與所述當前概念相匹配的信息替換為所述當前概念。
進一步地,參見圖6,所述二元關系表達式計算模塊404包括;
上下文詞空間向量模型生成單元601,用于根據(jù)所述關鍵詞集,生成與所述關鍵詞集對應的上下文詞空間向量模型;
計算單元602,用于根據(jù)上下文詞空間向量模型,計算得到二元關系表達式列表。
進一步地,參見圖7,所述關聯(lián)關系建立模塊406包括:
第二判斷單元701,用于如果所述第一二元關系表達式列表的第一二元關系表達式與所述候選關聯(lián)表達式列表的第一候選關聯(lián)表達式相匹配,則判斷所述第一候選關聯(lián)表達式是否滿足預設條件,所述第一二元關系是所述二元關系表達式列表中任意的一個二元關系表達式,所述第一候選關聯(lián)表達式是所述候選關聯(lián)表達式列表中任意的一個候選關聯(lián)表達式。
構建單元702,用于如果滿足預設條件,則建立所述規(guī)則關聯(lián)模型中所述第一候選關聯(lián)表達式對應的關聯(lián)關系。
由以上技術方案可知,本申請?zhí)峁┮环N挖掘規(guī)則關聯(lián)模型未知關聯(lián)關系的方法及裝置,該方法利用規(guī)則關聯(lián)模型的元組的數(shù)量、每個元組的概念以及不同元組的概念對應關系可根據(jù)實際的業(yè)務場景進行設置,并且通過對樣本數(shù)據(jù)分析處理,得到關聯(lián)表達式列表,將關聯(lián)表達式列表與候選表達式列表進行匹配,根據(jù)匹配結果,可建立規(guī)則關聯(lián)模型中,用戶未設置但有價值的關聯(lián)關系,以對規(guī)則關聯(lián)模型中的相鄰兩個元組的概念的關聯(lián)關系進行補充,使規(guī)則關聯(lián)模型全面直觀的反映實際業(yè)務場景中的有價值的關聯(lián)結果,提高定位有價值關聯(lián)結果的準確率,有利于決策者制定相應的營銷策略。
本領域的技術人員可以清楚地了解到本申請實施例中的技術可借助軟件加必需的通用硬件平臺的方式來實現(xiàn)?;谶@樣的理解,本申請實施例中的技術方案本質上或者或對現(xiàn)有技術做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在存儲介質中,如rom/ram、磁碟、光盤等,包括若干指令用以似的一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行本申請各個實施例或者實施例的某些部分所述的方法。
本說明書的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分可相互參見即可,每個實施例重點說明的都是與其他實施例的不同之處,尤其,對于裝置實施例而言,由于其基本相似于方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。