圖像標(biāo)注方法和電子設(shè)備的制造方法
【技術(shù)領(lǐng)域】
[0001 ] 本申請涉及圖像標(biāo)注方法和電子設(shè)備。
【背景技術(shù)】
[0002] 目前,隨著具有照相功能的便攜式設(shè)備(如智能手機(jī)、平板電腦等)的普及,數(shù)字 圖像的數(shù)量增長迅速。對這些圖像進(jìn)行標(biāo)注的豐富性和準(zhǔn)確性,關(guān)系到用戶對圖像的檢索、 整理分類等多種操作的效率。
[0003] 傳統(tǒng)的圖像標(biāo)注技術(shù)主要集中在利用圖像的視覺信息或相機(jī)拍照時的一些參數(shù) 對圖像進(jìn)行標(biāo)注。然而,當(dāng)涉及到圖像抽象概念(如吃飯、出差、合影等)的標(biāo)注時,基于視 覺和相機(jī)參數(shù)等少量信息,很難對圖像做出準(zhǔn)確而全面的描述。
[0004] 為此,期望提供一種圖像標(biāo)注方法和電子設(shè)備,其使得用戶能夠準(zhǔn)確地用多模態(tài) 信息標(biāo)注圖像,從而提高用戶的使用體驗(yàn)。
【發(fā)明內(nèi)容】
[0005] 根據(jù)本發(fā)明的實(shí)施例,提供了一種圖像標(biāo)注方法,包括:
[0006] 獲取要標(biāo)注的第一圖像;
[0007] 獲取與所述第一圖像相關(guān)的多種不同類型的信息,所述多種不同類型的信息的每 種用于標(biāo)注所述第一圖像涉及的一個或多個抽象概念類型;
[0008] 根據(jù)獲取的所述多種類型的信息對所述第一圖像的抽象概念類型執(zhí)行概率推測, 以獲得所述第一圖像的每個抽象概念類型的概率分布;以及
[0009] 確定每個抽象概念類型之間的相關(guān)性;
[0010] 根據(jù)確定的相關(guān)性,最大化各個抽象概念類型的聯(lián)合概率,從而確定所述第一圖 像的標(biāo)注結(jié)果。
[0011] 可選地,獲取與所述第一圖像相關(guān)的多種不同類型的信息進(jìn)一步包括:
[0012] 獲取所述第一圖像的視覺信息;以及
[0013] 根據(jù)獲取的所述多種類型的信息對所述第一圖像的抽象概念類型執(zhí)行概率推測, 以獲得所述第一圖像的每個抽象概念類型的概率分布進(jìn)一步包括:
[0014] 根據(jù)獲取的所述第一圖像的視覺信息,利用視覺分類模型對所述第一圖像的抽象 概念類型執(zhí)行概率推測,所述視覺分類模型通過提取多個圖像的視覺特征并進(jìn)行場景類別 訓(xùn)練獲得;
[0015] 獲得所述第一圖像屬于各種場景類別的概率分布。
[0016] 可選地,獲取與所述第一圖像相關(guān)的多種不同類型的信息進(jìn)一步包括:
[0017] 獲取拍攝所述第一圖像的時間信息以及拍攝所述第一圖像的地理位置信息;以及
[0018] 根據(jù)獲取的所述多種類型的信息對所述第一圖像的抽象概念類型執(zhí)行概率推測, 以獲得所述第一圖像的每個抽象概念類型的概率分布進(jìn)一步包括:
[0019] 根據(jù)獲取的所述第一圖像的時間信息和地理位置信息,利用事件記錄信息對所述 第一圖像的抽象概念類型執(zhí)行概率推測,所述事件記錄信息從與用戶相關(guān)的信息源獲??; 以及
[0020] 獲得所述第一圖像屬于不同事件的概率分布。
[0021] 可選地,獲取與所述第一圖像相關(guān)的多種不同類型的信息進(jìn)一步包括:
[0022] 獲取拍攝所述第一圖像的時間信息、拍攝所述第一圖像時當(dāng)?shù)氐奶鞖鉅顩r信息以 及是否使用閃光燈的信息;以及
[0023] 根據(jù)獲取的所述多種類型的信息對所述第一圖像的抽象概念類型執(zhí)行概率推測, 以獲得所述第一圖像的每個抽象概念類型的概率分布進(jìn)一步包括:
[0024] 根據(jù)拍攝所述第一圖像的時間信息、所述第一圖像時當(dāng)?shù)氐奶鞖鉅顩r信息以及是 否使用閃光燈的信息,對所述第一圖像的抽象概念類型執(zhí)行概率推測;以及
[0025] 獲得所述第一圖像的拍攝環(huán)境的概率分布。
[0026] 可選地,獲取與所述第一圖像相關(guān)的多種不同類型的信息進(jìn)一步包括:
[0027] 獲取所述第一圖像中人物數(shù)量的信息、第一圖像中人物排列的信息;以及
[0028] 根據(jù)獲取的所述多種類型的信息對所述第一圖像的抽象概念類型執(zhí)行概率推測, 以獲得所述第一圖像的每個抽象概念類型的概率分布進(jìn)一步包括:
[0029] 根據(jù)所述第一圖像中人物數(shù)量的信息、第一圖像中人物排列的信息對所述第一圖 像的抽象概念類型執(zhí)行概率推測;以及
[0030] 獲得所述第一圖像的拍攝類別的概率分布。
[0031] 可選地,獲取與所述第一圖像相關(guān)的多種不同類型的信息進(jìn)一步包括:
[0032] 獲取拍攝所述第一圖像時的環(huán)境音頻信息;以及
[0033] 根據(jù)獲取的所述多種類型的信息對所述第一圖像的抽象概念類型執(zhí)行概率推測, 以獲得所述第一圖像的每個抽象概念類型的概率分布進(jìn)一步包括:
[0034] 對獲取的拍攝所述第一圖像時的環(huán)境音頻信息執(zhí)行音頻分析處理,獲得環(huán)境音頻 的頻率和幅度,根據(jù)獲得的環(huán)境音頻的頻率和幅度對所述第一圖像的抽象概念類型執(zhí)行概 率推測;以及
[0035] 獲得所述第一圖像的周圍環(huán)境的概率分布。
[0036] 可選地,確定每個抽象概念類型之間的相關(guān)性進(jìn)一步包括:
[0037] 獲取與所述第一圖像相關(guān)聯(lián)的多個圖像;
[0038] 針對獲取的多個圖像,按照所述一個或多個抽象概念類型的信息進(jìn)行數(shù)量統(tǒng)計(jì); 以及
[0039] 根據(jù)統(tǒng)計(jì)結(jié)果計(jì)算不同類型的信息之間的相關(guān)性。
[0040] 可選地,根據(jù)確定的相關(guān)性,最大化各個抽象概念類型的聯(lián)合概率,從而確定所述 第一圖像的標(biāo)注結(jié)果進(jìn)一步包括:
[0041] 根據(jù)獲得的所述第一圖像的每個抽象概念類型的概率分布,根據(jù)計(jì)算的不同類型 的信息之間的相關(guān)性,最大化各個抽象概念類型的聯(lián)合概率,從而確定所述第一圖像的標(biāo) 注結(jié)果。
[0042] 根據(jù)本發(fā)明另一實(shí)施例,提供了 一種電子設(shè)備,包括:
[0043] 圖像獲取單元,配置為獲取要標(biāo)注的第一圖像;
[0044] 相關(guān)信息獲取單元,配置為獲取與所述第一圖像相關(guān)的多種不同類型的信息,所 述多種不同類型的信息的每種用于標(biāo)注所述第一圖像涉及的一個或多個抽象概念類型;
[0045] 概率確定單元,配置為根據(jù)獲取的所述多種類型的信息對所述第一圖像的抽象概 念類型執(zhí)行概率推測,以獲得所述第一圖像的每個抽象概念類型的概率分布;以及
[0046] 相關(guān)性確定單元,配置為確定每個抽象概念類型之間的相關(guān)性;
[0047] 標(biāo)注單元,配置為根據(jù)確定的相關(guān)性,最大化各個抽象概念類型的聯(lián)合概率,從而 確定所述第一圖像的標(biāo)注結(jié)果。
[0048] 可選地,所述圖像獲取單元進(jìn)一步配置為:
[0049] 獲取所述第一圖像的視覺信息;以及
[0050] 所述概率確定單元進(jìn)一步配置為:
[0051] 根據(jù)獲取的所述第一圖像的視覺信息,利用視覺分類模型對所述第一圖像的抽象 概念類型執(zhí)行概率推測,所述視覺分類模型通過提取多個圖像的視覺特征并進(jìn)行場景類別 訓(xùn)練獲得;以及
[0052] 獲得所述第一圖像屬于各種場景類別的概率分布。
[0053] 可選地,所述相關(guān)信息獲取單元進(jìn)一步配置為:
[0054] 獲取拍攝所述第一圖像的時間信息以及拍攝所述第一圖像的地理位置信息;以及
[0055] 所述概率確定單元進(jìn)一步配置為:
[0056] 根據(jù)獲取的所述第一圖像的時間信息和地理位置信息,利用事件記錄信息對所述 第一圖像的抽象概念類型執(zhí)行概率推測,所述事件記錄信息從與用戶相關(guān)的信息源獲??; 以及
[0057] 獲得所述第一圖像屬于不同事件的概率分布。
[0058] 可選地,所述相關(guān)信息獲取單元進(jìn)一步配置為:
[0059] 獲取拍攝所述第一圖像的時間信息、拍攝所述第一圖像時當(dāng)?shù)氐奶鞖鉅顩r信息以 及是否使用閃光燈的信息;以及
[0060] 所述概率確定單元進(jìn)一步配置為:
[0061] 根據(jù)拍攝所述第一圖像的時間信息、所述第一圖像時當(dāng)?shù)氐奶鞖鉅顩r信息以及是 否使用閃光燈的信息,對所述第一圖像的抽象概念類型執(zhí)行概率推測;以及
[0062] 獲得所述第一圖像的拍攝環(huán)境的概率分布。
[0063] 可選地,所述相關(guān)信息獲取單元進(jìn)一步配置為:
[0064] 獲取所述第一圖像中人物數(shù)量的信息、第一圖像中人物排列的信息;以及
[0065] 所述概率確定單元進(jìn)一步配置為:
[0066] 根據(jù)所述第一圖像中人物數(shù)量的信息、第一圖像中人物排列的信息對所述第一圖 像的抽象概念類型執(zhí)行概率推測;
[0067] 獲得所述第一圖像的拍攝類別的概率分布。
[0068] 可選地,所述相關(guān)信息獲取單元進(jìn)一步配置為:
[0069] 獲取拍攝所述第一圖像時的環(huán)境音頻信息;以及
[0070] 所述概率確定單元進(jìn)一步配置為:
[0071] 對獲取的拍攝所述第一圖像時的環(huán)境音頻信息執(zhí)行音頻分析處理,獲得環(huán)境音頻 的頻率和幅度,根據(jù)獲得的環(huán)境音頻的頻率和幅度對所述第一圖像的抽象概念類型執(zhí)行概 率推測;
[0072] 獲得所述第一圖像的周圍環(huán)境的概率分布。
[0073] 可選地,所述相關(guān)性確定單元進(jìn)一步配置為:
[0074] 獲取與所述第一圖像相關(guān)聯(lián)的多個圖像;
[0075] 針對獲取的多個圖像,按照所述一個或多個抽象概念類型的信息進(jìn)行數(shù)量統(tǒng)計(jì); 以及
[0076] 根據(jù)統(tǒng)計(jì)結(jié)果計(jì)算不同類型的信息之間的