一種基于超圖模型的與事件相關(guān)的社會(huì)化圖像查找算法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于超圖模型的與事件相關(guān)的社會(huì)化圖像查找算法,其特征是按如下步驟進(jìn)行:1.提取所述社會(huì)化圖像的模態(tài)特征;2.任意的社會(huì)化圖像分別建立超邊;3.由超邊集合構(gòu)成超圖模型;4.建立基于超圖模型的排序模型;5.采用凸優(yōu)化理論獲得最優(yōu)解。本發(fā)明能夠充分利用文檔中的多模態(tài)信息,對(duì)互聯(lián)網(wǎng)平臺(tái)的社會(huì)化圖像進(jìn)行關(guān)聯(lián)和歸檔,從而準(zhǔn)確查找到與事件最相關(guān)的社會(huì)化圖像。
【專(zhuān)利說(shuō)明】一種基于超圖模型的與事件相關(guān)的社會(huì)化圖像查找算法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及社交媒體檢索,尤其涉及一種基于超圖模型的與事件相關(guān)的社會(huì)化圖像查找算法。
【背景技術(shù)】
[0002]隨著社會(huì)化多媒體的快速發(fā)展,大量媒體數(shù)據(jù)被共享到互聯(lián)網(wǎng)上。挖掘社會(huì)化多媒體信息之間的潛在關(guān)聯(lián),高效地進(jìn)行社會(huì)媒體組織和管理成為一個(gè)有現(xiàn)實(shí)意義的技術(shù)難題。近年來(lái),事件作為一種非常有效的信息管理手段,得到了學(xué)術(shù)界越來(lái)越多的關(guān)注。目前互聯(lián)網(wǎng)上面存在不同模態(tài)數(shù)據(jù)的共享平臺(tái),而記錄事件的相關(guān)圖像被不同的用戶,以不同的格式共享到這些平臺(tái)上。如何從互聯(lián)網(wǎng)上大量的社交媒體數(shù)據(jù)中,查找相關(guān)多媒體文檔,以便對(duì)事件進(jìn)行可視化的展示成為現(xiàn)在的研究趨勢(shì)。
[0003]目前存在的一些事件和多媒體文檔關(guān)聯(lián)查找的方法,主要通過(guò)計(jì)算兩種對(duì)象之間單一模態(tài)(特別是文本)之間的相似性,或者利用多模態(tài)信息的簡(jiǎn)單融合進(jìn)行查找相關(guān)多媒體文檔,沒(méi)有對(duì)多模態(tài)信息之間的相關(guān)性進(jìn)行足夠的挖掘。
[0004]在機(jī)器學(xué)習(xí)領(lǐng) 域,超圖模型是一種能夠有效的對(duì)多種模態(tài)信息建模的方法,這種方法在聚類(lèi)、分類(lèi)、排序等多種問(wèn)題上得到了廣泛的應(yīng)用。但是因?yàn)槿缦略?,目前所提出的超圖模型在處理事件和多媒體查找的問(wèn)題時(shí),存在以下的缺陷和不足:
[0005]第一,傳統(tǒng)的超圖模型中,頂點(diǎn)對(duì)超邊的歸屬采用簡(jiǎn)單的0/1表示,無(wú)法體現(xiàn)出不同頂點(diǎn)和超邊的隸屬關(guān)系上的差異。
[0006]第二,超圖模型一般通過(guò)最近鄰(KNN)策略建立,即由每一個(gè)文檔以及其K近鄰組成一條超邊,其中的近鄰參數(shù)K的選取直接影響算法性能,但是近鄰參數(shù)K不好選取。
[0007]第三,對(duì)于不同的特征模態(tài),在表示事件和文檔關(guān)系時(shí)具有不同的權(quán)重,而傳統(tǒng)的超圖模型因選取統(tǒng)一的權(quán)重而沒(méi)有對(duì)超邊的權(quán)重進(jìn)行優(yōu)化,從而無(wú)法獲得最優(yōu)查找結(jié)果。
【發(fā)明內(nèi)容】
[0008]本發(fā)明是為避免現(xiàn)技術(shù)所存在的不足之處,提出一種基于超圖模型的與事件相關(guān)的社會(huì)化圖像查找算法,能夠充分利用文檔中的多模態(tài)信息,對(duì)互聯(lián)網(wǎng)平臺(tái)的社會(huì)化圖像進(jìn)行關(guān)聯(lián)和歸檔,從而準(zhǔn)確查找到與事件最相關(guān)的社會(huì)化圖像。
[0009]本發(fā)明為解決技術(shù)問(wèn)題采用如下技術(shù)方案:
[0010]本發(fā)明一種基于超圖模型的與事件相關(guān)的社會(huì)化圖像查找算法的特點(diǎn)是按如下步驟進(jìn)行:
[0011]步驟1、提取所述社會(huì)化圖像D = {di,1≤i≤η}的模態(tài)特征,所述模態(tài)特征包括文本特征、圖像特征、時(shí)間特征和空間特征,所述文本特征采用TF-1DF模型表示,所述圖像特征采用BagofWord模型表示,所述時(shí)間特征采用社會(huì)化圖像的拍攝時(shí)間表示,所述空間特征采用社會(huì)化圖像拍攝地點(diǎn)的GPS信息表示;
[0012]步驟2、對(duì)任意的社會(huì)化圖像Cli,根據(jù)所述模態(tài)特征分別建立超邊ei:[0013]步驟2.1、計(jì)算所述社會(huì)化圖像Cli的模態(tài)特征分別與其他社會(huì)化圖像+ (j古i)在相應(yīng)的特征空間的距離,獲得與所述社會(huì)化圖像Cli最鄰近的K個(gè)社會(huì)化圖像;所述社會(huì)化圖像Cli與所述K個(gè)社會(huì)化圖像構(gòu)成超邊ei ;
[0014]步驟2.2、利用式(I)獲得所述社會(huì)化圖像Clj和所述超邊ei在第m種模態(tài)下的隸
屬關(guān)系:
[0015]
【權(quán)利要求】
1.一種基于超圖模型的與事件相關(guān)的社會(huì)化圖像查找算法,其特征是按如下步驟進(jìn)行: 步驟1、提取所述社會(huì)化圖像D=汕,1≤i≤η}的模態(tài)特征,所述模態(tài)特征包括文本特征、圖像特征、時(shí)間特征和空間特征,所述文本特征采用TF-1DF模型表示,所述圖像特征采用Bag of Word模型表示,所述時(shí)間特征采用社會(huì)化圖像的拍攝時(shí)間表示,所述空間特征采用社會(huì)化圖像拍攝地點(diǎn)的GPS信息表示; 步驟2、對(duì)任意的社會(huì)化圖像φ,根據(jù)所述模態(tài)特征分別建立超邊ei: 步驟2.1、計(jì)算所述社會(huì)化圖像Cli的模態(tài)特征分別與其他社會(huì)化圖像+(j幸i)在相應(yīng)的特征空間的距離,獲得與所述社會(huì)化圖像Cli最鄰近的K個(gè)社會(huì)化圖像;所述社會(huì)化圖像Cli與所述K個(gè)社會(huì)化圖像構(gòu)成超邊ei ; 步驟2.2、利用式(I)獲得所述社會(huì)化圖像Clj和所述超邊ei在第m種模態(tài)下的隸屬關(guān)系:
【文檔編號(hào)】G06F17/30GK103955524SQ201410195908
【公開(kāi)日】2014年7月30日 申請(qǐng)日期:2014年5月9日 優(yōu)先權(quán)日:2014年5月9日
【發(fā)明者】劉學(xué)亮, 汪萌, 洪日昌 申請(qǐng)人:合肥工業(yè)大學(xué)