專利名稱:網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于通信技術(shù)領(lǐng)域,更進(jìn)一步涉及網(wǎng)絡(luò)應(yīng)用層通信技術(shù)領(lǐng)域和海量數(shù)據(jù)分析領(lǐng)域中網(wǎng)絡(luò)消息通信的群發(fā)推薦方法。本發(fā)明針對(duì)網(wǎng)絡(luò)郵件、手機(jī)通話、即時(shí)消息通信、社交網(wǎng)絡(luò)等網(wǎng)絡(luò)消息通信系統(tǒng),可用于局部網(wǎng)絡(luò)消息通信中的群發(fā)推薦。
背景技術(shù):
網(wǎng)絡(luò)消息通信中的群發(fā)推薦是指用戶在進(jìn)行群消息通信時(shí),系統(tǒng)能夠自動(dòng)地為用戶推薦與已輸入信息接收聯(lián)系人關(guān)系較為密切的其他聯(lián)系人,從而方便用戶對(duì)信息接收聯(lián)系人的選擇。目前,信息推薦方法中常見的三種有基于內(nèi)容的推薦、協(xié)同過(guò)濾推薦和混合推薦 方法。曹毅、賀衛(wèi)紅發(fā)表的“基于內(nèi)容過(guò)濾的電子商務(wù)推薦系統(tǒng)研究”(《計(jì)算機(jī)技術(shù)與發(fā)展》2009年6月第19卷,第6期)論文中,對(duì)于基于內(nèi)容的推薦方法進(jìn)行了詳細(xì)的介紹。該方法首先通過(guò)用戶的個(gè)人信息,建立用戶興趣特征描述的模型,其次抽取信息的文本特征向量,接著由用戶的歷史訪問(wèn)數(shù)據(jù)和用戶興趣特征向量建立推薦模型,即通過(guò)計(jì)算待推薦信息的文本特征向量與用戶興趣特征向量之間的匹配度得分,從而按得分從高到低進(jìn)行信息推薦。該方法存在的不足是,需要將所有用戶與所有的信息進(jìn)行匹配度得分的計(jì)算,這樣的全局批量數(shù)據(jù)處理方法會(huì)導(dǎo)致其效率變低,運(yùn)行時(shí)間增長(zhǎng),存儲(chǔ)空間開銷增大。Ben Y. Zhao> John Kubiatowicz、Authony D. Joseph 的 “Tapestry :Aninfrastructure for fault-tolerant wide-area location and routing,, (TechnicalReport UCB/CSD-01-1141,U. C. Berkeley7April 2001)論文中首次提出了協(xié)同過(guò)濾推薦的方法。其主要思想是利用同類用戶具有相似愛(ài)好的特點(diǎn),通過(guò)推理用戶之間的相似度,來(lái)推薦用戶感興趣的資訊信息。整個(gè)推薦的過(guò)程分為三個(gè)步驟(I)建立用戶與信息的關(guān)注矩陣。(2)通過(guò)用戶之間相似度的計(jì)算來(lái)發(fā)現(xiàn)同類用戶。(3)綜合同類用戶關(guān)注的信息來(lái)產(chǎn)生用戶可能感興趣的推薦信息。該方法存在的不足之處在于,在發(fā)現(xiàn)同類用戶時(shí)需要計(jì)算所有用戶之間的相似度,造成了大量的重復(fù)計(jì)算,導(dǎo)致運(yùn)行時(shí)間增長(zhǎng),效率變低?;旌贤扑]方法則是在推薦過(guò)程中混合采用了多種信息推薦方法。如在李勇的“一種引入內(nèi)容特征的混合推薦方法”(江西省科技廳科技支撐項(xiàng)目,2010BGB01303) —文中,先使用基于內(nèi)容推薦的方法對(duì)項(xiàng)目和用戶進(jìn)行分組,然后再結(jié)合協(xié)同過(guò)濾的方法為用戶進(jìn)行項(xiàng)目的推薦。本方法的不足在于,雖然采用了兩種信息推薦方法,增加了結(jié)果的準(zhǔn)確性,但是仍未解決上述兩方法進(jìn)行全局化批量數(shù)據(jù)處理的特征,在效率和運(yùn)行時(shí)間上仍存在一定的問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述已有技術(shù)的不足,提出一種局部網(wǎng)絡(luò)消息通信群發(fā)推薦方法,以實(shí)現(xiàn)消息群發(fā)時(shí)快速準(zhǔn)確的接收信息聯(lián)系人推薦,使消息通信系統(tǒng)變的更便利和人性化。實(shí)現(xiàn)本發(fā)明的技術(shù)思路是首先抽取出用戶的局部關(guān)系網(wǎng)絡(luò),構(gòu)建直接與用戶交互的群組集合,再進(jìn)一步抽取出與用戶存在一定消息通信數(shù)目的有效群組集合,提高聯(lián)系人推薦的準(zhǔn)確率,在此基礎(chǔ)上根據(jù)設(shè)定的規(guī)則獲取每個(gè)有效群組中每個(gè)聯(lián)系人的推薦得分值,然后獲取所有聯(lián)系人的總推薦得分值,最后將總推薦得分值最高的前幾位作為推薦對(duì)象輸出給用戶。為了實(shí)現(xiàn)上述目的,本發(fā)明方法包括如下步驟(I)構(gòu)建群組集合 Ia)任取一未訪問(wèn)消息m ;Ib)從m中抽取出臨時(shí)群組a ;Ic)從群組集合中隨機(jī)選取一個(gè)未被訪問(wèn)的群組b ;Id)判斷a,b之間的集合關(guān)系如果群組b是臨時(shí)群組a的真子集,則更新群組集合;如果群組b和臨時(shí)群組a相同,則更新群組b ;如果群組b不是臨時(shí)群組a的子集,則執(zhí)行步驟Ie);Ie)判斷群組集合中是否存在未訪問(wèn)群組如果群組集合中存在未訪問(wèn)的群組,則重復(fù)步驟Ic)和Id),直到群組集合中所有群組都被訪問(wèn);如果群組集合中的群組均被訪問(wèn),執(zhí)行步驟If);If)判斷歷史消息記錄中是否存在未訪問(wèn)消息如果用戶的歷史消息記錄中存在未被訪問(wèn)的消息,則執(zhí)行步驟Ia)、步驟Ib)、步驟Ic)、步驟Id)、步驟Ie),直到所有的消息都被訪問(wèn);如果用戶的歷史消息記錄中所有消息都已經(jīng)被訪問(wèn),則群組集合構(gòu)建完成。(2)獲得每個(gè)群組的交互消息數(shù)(3)提取有效群組集合訪問(wèn)群組集合中的每個(gè)群組,當(dāng)被訪問(wèn)群組的交互消息數(shù)小于最小交互消息數(shù)閾值時(shí),將其從群組集合中直接刪除;否則,保留;當(dāng)遍歷完群組集合后,就提取出了有效群組集合。(4)獲取每個(gè)有效群組的GR值4a)按照下列步驟獲取有效群組集合中任意一個(gè)有效群組g的GR值第一步,確定權(quán)重系數(shù)ω ;第二步,建立映射函數(shù)P (i);第三步,利用下式獲得有效群組g的GR值
權(quán)利要求
1.一種網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法,包括以下步驟 (1)構(gòu)建群組集合 Ia)任取一未訪問(wèn)消息m; Ib)從m中抽取出臨時(shí)群組a; Ic)從群組集合中隨機(jī)選取ー個(gè)未被訪問(wèn)的群組b ; Id)判斷a,b之間的集合關(guān)系如果群組b是臨時(shí)群組a的真子集,則更新群組集合;如果群組b和臨時(shí)群組a相同,則更新群組b ;如果群組b不是臨時(shí)群組a的子集,則執(zhí)行步驟Ie); Ie)判斷群組集合中是否存在未訪問(wèn)群組如果群組集合中存在未訪問(wèn)的群組,則重復(fù)步驟Ic)和Id),直到群組集合中所有群組都被訪問(wèn);如果群組集合中的群組均被訪問(wèn),執(zhí)行步驟If); If)判斷歷史消息記錄中是否存在未訪問(wèn)消息如果用戶的歷史消息記錄中存在未被訪問(wèn)的消息,則執(zhí)行步驟Ia)、步驟Ib)、步驟Ic)、步驟Id)、步驟Ie),直到所有的消息都被訪問(wèn);如果用戶的歷史消息記錄中所有消息都已經(jīng)被訪問(wèn),則群組集合構(gòu)建完成; (2)獲得每個(gè)群組的交互消息數(shù) (3)提取有效群組集合 訪問(wèn)群組集合中的每個(gè)群組,當(dāng)被訪問(wèn)群組的交互消息數(shù)小于最小交互消息數(shù)閾值時(shí),將其從群組集合中直接刪除;否則,保留;當(dāng)遍歷完群組集合后,就提取出了有效群組集合; (4)獲取每個(gè)有效群組的GR值 .4a)按照下列步驟獲取有效群組集合中任意ー個(gè)有效群組g的GR值 第一歩,確定權(quán)重系數(shù)ω ; 第二步,建立映射函數(shù)P (i); 第三步,利用下式獲得有效群組g的GR值 GR(iAfn 其中,GR是衡量一個(gè)有效群組和用戶之間聯(lián)系強(qiáng)弱程度的數(shù)值;一表示將其左側(cè)計(jì)算獲得的結(jié)果賦值給右側(cè);ω是權(quán)重系數(shù);i表示一條消息通信記錄;Iin,Iout分別表示用戶接收的消息集合和用戶發(fā)送的消息集合;P(i)是映射函數(shù); .4b)訪問(wèn)有效群組集合中的每個(gè)有效群組,由步驟4a)計(jì)算當(dāng)前有效群組的GR值,當(dāng)遍歷完有效群組集合后,就獲得了每個(gè)有效群組的GR值; (5).計(jì)算推薦得分值 .5a).從有效群組集合中任意選取ー個(gè)未訪問(wèn)的有效群組g ; .5b).從有效群組g中任意選取ー個(gè)未訪問(wèn)的聯(lián)系人c ; .5c).判斷c是否在S中如果聯(lián)系人c已經(jīng)在用戶已輸入的聯(lián)系人集合S中,則聯(lián)系人c在有效群組g中的推薦得分值Fg (C)為0,執(zhí)行步驟5e);如果聯(lián)系人c不在已輸入的聯(lián)系人集合S中,則執(zhí)行步驟5d); .5d).判斷g與S的交集是否為空如果有效群組g與用戶已輸入聯(lián)系人集合S的交集為空,則聯(lián)系人c在有效群組g中的推薦得分值Fg (c) =0,執(zhí)行步驟5e);否則聯(lián)系人c在有效群組g中的推薦得分值Fg (c)等于有效群組g的GR值,執(zhí)行步驟5e); 5e).判斷g中是否存在未訪問(wèn)聯(lián)系人如果有效群組g中存在未訪問(wèn)的聯(lián)系人,則執(zhí)行步驟5b)、步驟5c)、步驟5d),直到有效群組g中所有的聯(lián)系人都被訪問(wèn);如果有效群組g中所有的聯(lián)系人均被訪問(wèn),執(zhí)行步驟5f); 5f)判斷有效群組集合中是否存在未訪問(wèn)有效群組如果有效群組集合中存在未訪問(wèn)有效群組,則執(zhí)行步驟5a)、步驟5b)、步驟5c)、步驟5d)、步驟5e),直到有效群組集合中所有有效群組都被訪問(wèn);當(dāng)有效群組集合中所有有效群組均被訪問(wèn)時(shí),完成計(jì)算每個(gè)聯(lián)系人的推薦得分值; (6)獲取總推薦得分值 (7)獲得推薦人 對(duì)所有聯(lián)系人按其總推薦得分值大小進(jìn)行降序排序,將得分最高的前N位聯(lián)系人作為推薦對(duì)象輸出給用戶。
2.根據(jù)權(quán)利要求I所述的網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法,其特征在于,步驟(I)所述的群組是由一組聯(lián)系人構(gòu)成的集合。
3.根據(jù)權(quán)利要求I所述的網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法,其特征在于,步驟Ib)所述的從m中抽取出臨時(shí)群組a的方法是,如果消息m是用戶發(fā)送的,則建立ー個(gè)包含了消息m接收聯(lián)系人全體的臨時(shí)群組a,并將消息m添加到臨時(shí)群組a的接收消息集合屬性中;如果消息m是用戶接收的,則建立一個(gè)包含了消息m的發(fā)送人和除用戶外其他消息接收人的臨時(shí)群組a,并將消息m添加到臨時(shí)群組a的發(fā)送消息集合屬性中。
4.根據(jù)權(quán)利要求I所述的網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法,其特征在于,步驟(2)所述群組的交互消息數(shù)為接收消息集合中消息個(gè)數(shù)與發(fā)送消息集合中消息個(gè)數(shù)的和。
5.根據(jù)權(quán)利要求I所述的網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法,其特征在于,步驟(3)所述的有效群組是指群組的交互消息數(shù)不小于最小交互消息數(shù)閾值的群組,其中,最小交互消息數(shù)閾值范圍為不小于5。
6.根據(jù)權(quán)利要求I所述的網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法,其特征在于,步驟4a)所述的權(quán)重系數(shù)ω表示用戶發(fā)送消息和用戶接收消息對(duì)于用戶和有效群組之間聯(lián)系強(qiáng)度貢獻(xiàn)的強(qiáng)弱,ω的取值范圍為ω > I。
7.根據(jù)權(quán)利要求I所述的網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法,其特征在于,步驟4a)所述的映射函數(shù)P (i)是ー個(gè)將消息i映射到數(shù)值的函數(shù),其建立的步驟為 第一歩,如果消息i是用戶接收的消息,則將消息i的接收時(shí)刻賦值給時(shí)刻t(i),如果消息i是用戶發(fā)送的消息,則將消息i的發(fā)送時(shí)刻賦值給時(shí)刻t(i); 第二步,將程序運(yùn)行當(dāng)前時(shí)刻tnow與時(shí)刻t(i)的時(shí)間間隔,折換成以秒為單位后賦值給時(shí)間間隔diff ; 第三步,將時(shí)間間隔diff與以秒為単位的一年時(shí)間間隔的比值作為函數(shù)的映射結(jié)果,完成從消息i到數(shù)值的映射。
8.根據(jù)權(quán)利要求I所述的網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法,其特征在于,步驟(6)所述的總推薦得分值是對(duì)一個(gè)聯(lián)系人計(jì)算該聯(lián)系人在其所出現(xiàn)的所有有效群組中的推薦得分值的和。
9.根據(jù)權(quán)利要求I所述的網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法,其特征在于,步驟(7)中所述N的取值范圍為N >5 。
全文摘要
本發(fā)明公開一種網(wǎng)絡(luò)消息通信中群發(fā)推薦的方法,解決現(xiàn)有技術(shù)中采用全局批量數(shù)據(jù)處理方法而導(dǎo)致的推薦效率低,運(yùn)行時(shí)間長(zhǎng),存儲(chǔ)空間開銷大的問(wèn)題。其方法步驟為(1)構(gòu)建群組集合;(2)獲得每個(gè)群組的交互消息數(shù);(3)提取有效群組集合;(4)獲取每個(gè)有效群組的GR值;(5)計(jì)算推薦得分值;(6)獲取總推薦得分值;(7)獲得推薦人。本發(fā)明從局部網(wǎng)絡(luò)消息通信中抽取局部關(guān)系網(wǎng)絡(luò),不需要進(jìn)行全局批量數(shù)據(jù)處理,運(yùn)行時(shí)間快,使本發(fā)明能夠應(yīng)用于更大規(guī)模消息通信網(wǎng)絡(luò)中;并且通過(guò)對(duì)局部網(wǎng)絡(luò)消息通信數(shù)據(jù)處理,抽取出局部關(guān)系網(wǎng)絡(luò),考慮與用戶有直接消息交互的聯(lián)系人群組集合,使本發(fā)明在群發(fā)推薦時(shí)能夠獲得較高的準(zhǔn)確率。
文檔編號(hào)H04L12/18GK102664744SQ20121007329
公開日2012年9月12日 申請(qǐng)日期2012年3月19日 優(yōu)先權(quán)日2012年3月19日
發(fā)明者吳志殿, 孫鶴立, 慕鵬, 李偉, 趙貝貝, 雷倩, 黃健斌 申請(qǐng)人:西安電子科技大學(xué)