一種基于圖片內(nèi)容播放音樂的方法及裝置制造方法
【專利摘要】本公開是關(guān)于一種基于圖片內(nèi)容播放音樂的方法及裝置,該方法包括:按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為每個圖片組分配一個場景標簽;確定與圖片組的場景標簽對應的音樂文件;在顯示圖片組的目標圖片時,播放與圖片組的場景標簽對應的音樂文件。按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,每個圖片組均對應有一個場景標簽,而且,場景標簽與音樂文件存在對應關(guān)系,所以在顯示圖片組中的目標圖片時,便可以確定該圖片組對應的場景標簽,從而可以自動的播放該場景標簽對應的音樂文件。因此,本公開提供的方案可以根據(jù)圖片組的場景標簽來播放對應的音樂文件,從而降低用戶的操作復雜度,并節(jié)省用戶的時間。
【專利說明】—種基于圖片內(nèi)容播放音樂的方法及裝置
【技術(shù)領域】
[0001]本發(fā)明涉及通信【技術(shù)領域】,更具體的說,涉及基于圖片內(nèi)容播放音樂的方法及裝置。
【背景技術(shù)】
[0002]人們在瀏覽相冊或圖庫中的圖片時,通常會播放一些音樂。有時,用戶為了更好的體驗圖片中的氛圍,通常會選擇一些與當前查看的圖片相匹配的音樂。例如,用戶在瀏覽自己在海邊游玩的圖片時,會播放一些歡快的音樂,使自己更好的融入圖片中愉悅的場景。又如,用戶在瀏覽朋友婚禮的圖片時,會播放一些與婚禮有關(guān)的音樂,如婚禮進行曲等。再如,用戶在瀏覽恐怖圖片時,會播放一些詭異或驚悚的音樂,以烘托恐怖氣氛,使用戶充分的體驗恐怖氛圍。
[0003]在研究和實踐過程中,發(fā)明人發(fā)現(xiàn)上述相關(guān)技術(shù)至少存在以下問題:
[0004]由于用戶在瀏覽圖片時,在一段時間內(nèi)可能會查看多張不同內(nèi)容的圖片。例如,用戶在10分鐘之內(nèi)查看了海邊游玩的圖片、朋友婚禮的圖片和恐怖圖片,所以用戶在查看多張不同內(nèi)容的圖片時,經(jīng)常需要手動的去切換適合當前圖片的音樂,以使自己更好的融入當前圖片的場景。但是經(jīng)常的去手動切換與當前瀏覽的圖片相匹配的音樂,會增加用戶的操作復雜度;而且,用戶可能很難在短時間內(nèi)查找到與當前瀏覽的圖片相匹配的音樂,所以用戶在查找與當前瀏覽的圖片相匹配的音樂類型時可能會浪費大量的時間。
[0005]因此,如何根據(jù)圖片內(nèi)容播放適合的音樂,成為目前亟需解決的問題。
【發(fā)明內(nèi)容】
[0006]為克服相關(guān)技術(shù)中存在的問題,本公開提供一種基于圖片內(nèi)容播放音樂的方法及裝置,根據(jù)圖片組的場景標簽來播放對應的音樂文件,從而降低用戶的操作復雜度,并節(jié)省用戶的時間。
[0007]根據(jù)本公開實施例的第一方面,提供一種基于圖片內(nèi)容播放音樂的方法,包括:
[0008]按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為所述每個圖片組分配一個場景標簽;
[0009]確定與所述圖片組的場景標簽對應的音樂文件;
[0010]在顯示所述圖片組的目標圖片時,播放與所述圖片組的場景標簽對應的音樂文件。
[0011]可選的,所述按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為所述每個圖片組分配一個場景標簽步驟包括:
[0012]獲取圖庫中的每張目標圖片;
[0013]利用預先生成的場景判定模型判定出每張所述目標圖片的圖像特征對應的場景標簽;
[0014]將對應相同場景標簽的所述目標圖片確定為一個圖片組,將所述場景標簽確定為所述圖片組的場景標簽。
[0015]可選的,所述按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為所述每個圖片組分配一個場景標簽步驟包括:
[0016]按照預設分組條件將圖庫中的目標圖片分成至少一個圖片組;
[0017]利用預先生成的場景判定模型判定出所述圖片組中的每張目標圖片的圖像特征對應的場景標簽;
[0018]針對每個圖片組,將目標圖片的圖像特征對應的數(shù)量最多的場景標簽作為所述圖片組的場景標簽。
[0019]可選的,所述按照預設分組條件將圖庫中的目標圖片分成至少一個圖片組步驟包括:
[0020]確定圖庫中每個目標圖片的拍照日期或拍照地點;
[0021]將對應同一個所述拍照日期的所述目標圖片確定為一個圖片組,或?qū)粋€所述拍照地點的所述目標圖片確定為一個圖片組。
[0022]可選的,所述方法還包括:
[0023]創(chuàng)建場景標簽;
[0024]獲取與每個場景標簽對應的指定場景圖片;
[0025]提取所述每個場景標簽對應的指定場景圖片的圖像特征;
[0026]利用預設機器學習方法對所述每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
[0027]根據(jù)本公開實施例的第二方面,提供一種基于圖片內(nèi)容播放音樂的裝置,包括:
[0028]分組模塊,用于按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為所述每個圖片組分配一個場景標簽;
[0029]確定模塊,用于確定與所述圖片組的場景標簽對應的音樂文件;
[0030]播放模塊,用于在顯示所述圖片組的目標圖片時,播放與所述圖片組的場景標簽對應的音樂文件。
[0031 ] 可選的,所述分組模塊包括:
[0032]獲取子模塊,用于獲取圖庫中的每張目標圖片;
[0033]第一判定子模塊,用于利用預先生成的場景判定模型判定出每張所述目標圖片的圖像特征對應的場景標簽;
[0034]第一確定子模塊,用于將對應相同場景標簽的所述目標圖片確定為一個圖片組,將所述場景標簽確定為所述圖片組的場景標簽。
[0035]可選的,所述分組模塊包括:
[0036]分組子模塊,用于按照預設分組條件將圖庫中的目標圖片分成至少一個圖片組;
[0037]第二判定子模塊,用于利用預先生成的場景判定模型判定出所述圖片組中的每張目標圖片的圖像特征對應的場景標簽;
[0038]第二確定子模塊,用于針對每個圖片組,將目標圖片的圖像特征對應的數(shù)量最多的場景標簽作為所述圖片組的場景標簽。
[0039]可選的,所述分組子模塊包括:
[0040]第三確定子模塊,用于確定圖庫中每個目標圖片的拍照日期或拍照地點;
[0041]第四確定子模塊,用于將對應同一個所述拍照日期的所述目標圖片確定為一個圖片組,或?qū)粋€所述拍照地點的所述目標圖片確定為一個圖片組。
[0042]可選的,所述裝置還包括:
[0043]創(chuàng)建模塊,用于創(chuàng)建場景標簽;
[0044]獲取模塊,用于獲取與每個場景標簽對應的指定場景圖片;
[0045]提取模塊,用于提取所述每個場景標簽對應的指定場景圖片的圖像特征;
[0046]訓練模塊,用于利用預設機器學習裝置對所述每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
[0047]根據(jù)本公開實施例的第三方面,提供一種基于圖片內(nèi)容播放音樂的裝置,包括:
[0048]處理器;
[0049]用于存儲處理器可執(zhí)行指令的存儲器;
[0050]其中,所述處理器被配置為:
[0051]按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為所述每個圖片組分配一個場景標簽;
[0052]確定與所述圖片組的場景標簽對應的音樂文件;
[0053]在顯示所述圖片組的目標圖片時,播放與所述圖片組的場景標簽對應的音樂文件。
[0054]本公開的實施例提供的技術(shù)方案可以包括以下有益效果:本公開提供的方案可以按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,每個圖片組均對應有一個場景標簽,而且,場景標簽與音樂文件存在對應關(guān)系,所以在顯示圖片組中的目標圖片時,便可以確定該圖片組對應的場景標簽,從而可以自動的播放該場景標簽對應的音樂文件。因此,本公開提供的方案可以根據(jù)圖片組的場景標簽來播放對應的音樂文件,從而降低用戶的操作復雜度,并節(jié)省用戶的時間。
[0055]應當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
【專利附圖】
【附圖說明】
[0056]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本發(fā)明的實施例,并與說明書一起用于解釋本發(fā)明的原理。
[0057]圖1是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的方法的流程圖。
[0058]圖2是根據(jù)一示例性實施例示出的另一種基于圖片內(nèi)容播放音樂的方法的流程圖。
[0059]圖3是根據(jù)一示例性實施例示出的又一種基于圖片內(nèi)容播放音樂的方法的流程圖。
[0060]圖4是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的裝置的示意圖。
[0061]圖5是根據(jù)一示例性實施例示出的另一種基于圖片內(nèi)容播放音樂的裝置的示意圖。
[0062]圖6是根據(jù)一示例性實施例示出的又一種基于圖片內(nèi)容播放音樂的裝置的示意圖。
[0063]圖7是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的裝置的框圖。
【具體實施方式】
[0064]這里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本發(fā)明相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
[0065]實施例一
[0066]圖1是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的方法的流程圖,如圖1所示,圖1所示的基于圖片內(nèi)容播放音樂的方法可以用于終端中。本公開提供的基于圖片內(nèi)容播放音樂的方法可以根據(jù)圖片組的場景標簽來播放對應的音樂文件,從而降低用戶的操作復雜度,并節(jié)省用戶的時間,進而提高了用戶的體驗度。該方法包括以下步驟。
[0067]在步驟Sll中,按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為每個圖片組分配一個場景標簽;
[0068]其中,圖庫中可以存放至少一張目標圖片。目標圖片可以為各種格式的圖片類型,例如,目標圖片可以為BMP或JPG等各種類型的圖片。圖片組可以包括至少一個目標圖片,每個圖片組僅分配一個場景標簽。
[0069]其中,場景標簽可以為多種類型的標簽,例如,場景標簽可以包括寵物、風景和人像等類型,場景標簽可以由用戶預先自行設定。
[0070]另外,預設條件表示生成圖片組和為圖片組分配場景標簽存在多種實現(xiàn)方式,這些實現(xiàn)方式將通過后面的實施例進行詳細說明。
[0071]在步驟S12中,確定與圖片組的場景標簽對應的音樂文件;
[0072]其中,場景標簽與音樂文件的對應關(guān)系可以是用戶預先建立好的,例如,假設場景標簽包括寵物標簽、風景標簽和人像標簽,用戶分別建立寵物標簽與音樂文件A的對應關(guān)系、風景標簽與音樂文件B的對應關(guān)系和人像標簽與音樂文件C的對應關(guān)系。在用戶建立場景標簽與音樂文件的對應關(guān)系的過程中,用戶可以選擇一些與場景標簽相匹配的音樂文件,例如,對于寵物標簽,可以選擇音樂節(jié)奏較為歡快、愉悅的音樂文件;又如,對于風景標簽,可以選擇一些古典的音樂文件。
[0073]在步驟S13中,在顯示圖片組的目標圖片時,播放與圖片組的場景標簽對應的音樂文件。
[0074]其中,與圖片組的場景標簽對應的音樂文件可以為一個或多個。如果一個場景標簽對應有一個音樂文件,那么在顯示圖片組的目標圖片時,播放與圖片組的場景標簽對應的一個音樂文件;如果一個場景標簽對應有多個音樂文件,那么在顯示圖片組的目標圖片時,播放與圖片組的場景標簽對應的多個音樂文件。
[0075]在圖1所示的實施例中,本公開提供的方案可以按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,每個圖片組均對應有一個場景標簽,而且,場景標簽與音樂文件存在對應關(guān)系,所以在顯不圖片組中的目標圖片時,便可以確定該圖片組對應的場景標簽,從而可以自動的播放該場景標簽對應的音樂文件。因此,本公開提供的方案可以根據(jù)圖片組的場景標簽來播放對應的音樂文件,從而降低用戶的操作復雜度,并節(jié)省用戶的時間。
[0076]實施例二
[0077]圖2是根據(jù)一示例性實施例示出的另一種基于圖片內(nèi)容播放音樂的方法的流程圖,如圖2所示,圖2所示的基于圖片內(nèi)容播放音樂的方法可以用于終端中。其中,本實施例是在實施例一的基礎上進行的改進,所以本實施例中與實施例一的相同之處請參見實施例一即可。本公開提供的基于圖片內(nèi)容播放音樂的方法可以根據(jù)圖片組的場景標簽來播放對應的音樂文件,從而降低用戶的操作復雜度,并節(jié)省用戶的時間,進而提高了用戶的體驗度。該方法包括以下步驟。
[0078]在步驟S21中,獲取圖庫中的每張目標圖片。
[0079]在步驟S22中,利用預先生成的場景判定模型判定出每張目標圖片的圖像特征對應的場景標簽。
[0080]其中,目標圖片的圖像特征可以為目標圖片的HOG (Histogram of OrientedGradient,方向梯度直方圖)特征,當然,圖像特征也可以為其他類型的特征,所以圖像特征并不局限于HOG特征。
[0081]另外,場景判定模型為預先生成的一種判定模型,場景判定模型用于識別出目標圖片的圖像特征對應哪一種場景標簽,例如,目標圖片為一張小貓的圖片,那么場景判定模型便可以識別出目標圖片的圖像特征對應的場景標簽為寵物。又如,目標圖片為一張中年男子的圖片,那么場景判定模型便可以識別出目標圖片的圖像特征對應的場景標簽為人像。再如,目標圖片為一張桂林山水的圖片,那么場景判定模型便可以識別出目標圖片的圖像特征對應的場景標簽為風景。
[0082]另外,場景判定模型可以通過以下步驟進行生成:第一步,創(chuàng)建場景標簽;第二步,獲取與每個場景標簽對應的指定場景圖片;第三步,提取每個場景標簽對應的指定場景圖片的圖像特征;第四步,利用預設機器學習方法對每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
[0083]下面舉例說明上述生成場景判定模型的步驟。首先,創(chuàng)建三個場景標簽,這三個場景標簽分別為寵物、風景和人像。其次,分別收集寵物圖片、風景圖片和人像圖片各一萬張,其中,收集到的一萬張寵物圖片可以包括貓類、狗類、蛇類、寵物鼠類和魚類等與寵物相關(guān)的圖片,收集到的一萬張風景圖片可以包括高山、河水、沙漠、海邊、樹木、草地、瀑布、彩虹、云彩和名勝古跡等與風景相關(guān)的圖片,收集到的一萬張人像圖片可以包括兒童面部圖像、老人面部圖像、少女面部圖像和成人面部圖像等與人像相關(guān)的圖片。再次,將收集到的三萬張圖片縮放到統(tǒng)一大小,例如,將這三萬張圖片均縮放到分辨率為200X200的大小。然后,分別提取出縮放后的三萬張圖片的圖像特征,例如,分別提取出縮放后的三萬張圖片的HOG特征。最后,利用預設機器學習方法對三個場景標簽分別對應的一萬張場景圖片的圖像特征進行訓練以生成場景判定模型,例如,預設機器學習方法可以為SVM(Support VectorMachine,支持向量機)方法,通過SVM方法可以訓練出一個場景判定模型,這個場景判定模型可以識別出與寵物、風景和人像相近似的圖片,并判定出該圖片屬于上述三種場景標簽中的哪種場景標簽。
[0084]在步驟S23中,將對應相同場景標簽的目標圖片確定為一個圖片組,將場景標簽確定為圖片組的場景標簽。
[0085]其中,由于很多目標圖片的圖像特征對應的場景標簽都是相同的,所以將對應相同的場景標簽的目標圖片確定為一個圖片組,再將這個圖片組中目標圖片共同對應的場景標簽確定為圖片組的場景標簽,相當于為該圖片組確定一個標識,以區(qū)別于其他的圖片組。
[0086]在步驟S24中,確定與圖片組的場景標簽對應的音樂文件。
[0087]在步驟S25中,在顯示圖片組的目標圖片時,播放與圖片組的場景標簽對應的音樂文件。
[0088]在圖2所示的實施例中,本公開提供的方案可以按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,每個圖片組均對應有一個場景標簽,而且,場景標簽與音樂文件存在對應關(guān)系,所以在顯不圖片組中的目標圖片時,便可以確定該圖片組對應的場景標簽,從而可以自動的播放該場景標簽對應的音樂文件。因此,本公開提供的方案可以根據(jù)圖片組的場景標簽來播放對應的音樂文件,從而降低用戶的操作復雜度,并節(jié)省用戶的時間。
[0089]實施例三
[0090]圖3是根據(jù)一示例性實施例示出的又一種基于圖片內(nèi)容播放音樂的方法的流程圖,如圖3所示,圖3所示的基于圖片內(nèi)容播放音樂的方法可以用于終端中。其中,本實施例是在實施例一的基礎上進行的改進,所以本實施例中與實施例一的相同之處請參見實施例一即可。本公開提供的基于圖片內(nèi)容播放音樂的方法可以根據(jù)圖片組的場景標簽來播放對應的音樂文件,從而降低用戶的操作復雜度,并節(jié)省用戶的時間,進而提高了用戶的體驗度。該方法包括以下步驟。
[0091]在步驟S31中,按照預設分組條件將圖庫中的目標圖片分成至少一個圖片組;
[0092]其中,預設分組條件存在多種方式。
[0093]第一種方式,可以先確定圖庫中每個目標圖片的拍照日期,然后將對應同一個拍照日期的目標圖片確定為一個圖片組。例如,假設圖庫中存在3張圖片,分別為圖片A、圖片B和圖片C,圖片A的拍照日期為2010年I月I日,圖片B的拍照日期為2010年5月10日,圖片C的拍照日期為2010年I月I日,那么在確定出三張圖片的拍照日期以后,可以確定圖片A和圖片C為同一個拍照日期,所以將圖片A和圖片C確定為一個圖片組,將圖片B確定為另一個圖片組。
[0094]第二種方式,可以先確定圖庫中每個目標圖片的拍照地點,然后將對應同一個拍照地點的目標圖片確定為一個圖片組。例如,假設圖庫中存在3張圖片,分別為圖片A、圖片B和圖片C,圖片A的拍照地點為北京,圖片B的拍照地點為北京,圖片C的拍照地點為廣州,那么在確定出三張圖片的拍照地點以后,可以確定圖片A和圖片B為同一個拍照地點,所以將圖片A和圖片B確定為一個圖片組,將圖片C確定為另一個圖片組。
[0095]在步驟S32中,利用預先生成的場景判定模型判定出圖片組中的每張目標圖片的圖像特征對應的場景標簽;
[0096]其中,目標圖片的圖像特征可以為目標圖片的H0G(Histogram of OrientedGradient,方向梯度直方圖)特征,當然,圖像特征也可以為其他類型的特征,所以圖像特征并不局限于HOG特征。
[0097]另外,場景判定模型為預先生成的一種判定模型,場景判定模型用于識別出目標圖片的圖像特征對應哪一種場景標簽,例如,目標圖片為一張小貓的圖片,那么場景判定模型便可以識別出目標圖片的圖像特征對應的場景標簽為寵物。又如,目標圖片為一張中年男子的圖片,那么場景判定模型便可以識別出目標圖片的圖像特征對應的場景標簽為人像。再如,目標圖片為一張桂林山水的圖片,那么場景判定模型便可以識別出目標圖片的圖像特征對應的場景標簽為風景。
[0098]另外,場景判定模型可以通過以下步驟進行生成:第一步,創(chuàng)建場景標簽;第二步,獲取與每個場景標簽對應的指定場景圖片;第三步,提取每個場景標簽對應的指定場景圖片的圖像特征;第四步,利用預設機器學習方法對每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
[0099]下面舉例說明上述生成場景判定模型的步驟。首先,創(chuàng)建三個場景標簽,這三個場景標簽分別為寵物、風景和人像。其次,分別收集寵物圖片、風景圖片和人像圖片各一萬張,其中,收集到的一萬張寵物圖片可以包括貓類、狗類、蛇類、寵物鼠類和魚類等與寵物相關(guān)的圖片,收集到的一萬張風景圖片可以包括高山、河水、沙漠、海邊、樹木、草地、瀑布、彩虹、云彩和名勝古跡等與風景相關(guān)的圖片,收集到的一萬張人像圖片可以包括兒童面部圖像、老人面部圖像、少女面部圖像和成人面部圖像等與人像相關(guān)的圖片。再次,將收集到的三萬張圖片縮放到統(tǒng)一大小,例如,將這三萬張圖片均縮放到分辨率為200X200的大小。然后,分別提取出縮放后的三萬張圖片的圖像特征,例如,分別提取出縮放后的三萬張圖片的HOG特征。最后,利用預設機器學習方法對三個場景標簽分別對應的一萬張場景圖片的圖像特征進行訓練以生成場景判定模型,例如,預設機器學習方法可以為SVM(Support VectorMachine,支持向量機)方法,通過SVM方法可以訓練出一個場景判定模型,這個場景判定模型可以識別出與寵物、風景和人像相近似的圖片,并判定出該圖片屬于上述三種場景標簽中的哪種場景標簽。
[0100]在步驟S33中,針對每個圖片組,將定圖片組的目標圖片的圖像特征對應的數(shù)量最多的場景標簽作為圖片組的場景標簽。
[0101]其中,在確定出一個圖片組的目標圖片的圖像特征對應的場景標簽以后,需要確定出該圖片組的每個目標圖片對應的場景標簽,并且計算出場景標簽出現(xiàn)次數(shù)最多的場景標簽,并將該場景標簽作為圖片組的場景標簽。例如,圖片組X中包括3張圖片,分別為圖片A、圖片B和圖片C,圖片A對應的場景標簽為寵物,圖片B對應的場景標簽也為寵物,圖片C對應的場景標簽為風景,由于場景標簽為寵物的出現(xiàn)次數(shù)最多,所以將寵物作為圖片組X的場景標簽。
[0102]在步驟S34中,確定與圖片組的場景標簽對應的音樂文件。
[0103]在步驟S35中,在顯示圖片組的目標圖片時,播放與圖片組的場景標簽對應的音樂文件。
[0104]在圖3所示的實施例中,本公開提供的方案可以按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,每個圖片組均對應有一個場景標簽,而且,場景標簽與音樂文件存在對應關(guān)系,所以在顯不圖片組中的目標圖片時,便可以確定該圖片組對應的場景標簽,從而可以自動的播放該場景標簽對應的音樂文件。因此,本公開提供的方案可以根據(jù)圖片組的場景標簽來播放對應的音樂文件,從而降低用戶的操作復雜度,并節(jié)省用戶的時間。
[0105]實施例四
[0106]圖4是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的裝置的示意圖。本公開提供的基于圖片內(nèi)容播放音樂的裝置可以根據(jù)圖片組的場景標簽來播放對應的音樂文件,從而降低用戶的操作復雜度,并節(jié)省用戶的時間,進而提高了用戶的體驗度。參照圖4,該裝置包括分組模塊41、確定模塊42和播放模塊43。其中:
[0107]分組模塊41,用于按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為每個圖片組分配一個場景標簽;
[0108]確定模塊42,用于確定與圖片組的場景標簽對應的音樂文件;
[0109]播放模塊43,用于在顯示圖片組的目標圖片時,播放與圖片組的場景標簽對應的首樂文件。
[0110]圖5是根據(jù)一示例性實施例示出的另一種基于圖片內(nèi)容播放音樂的裝置的示意圖。參照圖5,該裝置包括獲取子模塊51、第一判定子模塊52、第一確定子模塊53、確定模塊54和播放模塊55。其中:
[0111]獲取子模塊51,用于獲取圖庫中的每張目標圖片;
[0112]第一判定子模塊52,用于利用預先生成的場景判定模型判定出每張目標圖片的圖像特征對應的場景標簽;
[0113]第一確定子模塊53,用于將對應相同場景標簽的目標圖片確定為一個圖片組,將場景標簽確定為圖片組的場景標簽。
[0114]確定模塊54,用于確定與圖片組的場景標簽對應的音樂文件;
[0115]播放模塊55,用于在顯示圖片組的目標圖片時,播放與圖片組的場景標簽對應的首樂文件。
[0116]圖6是根據(jù)一示例性實施例示出的又一種基于圖片內(nèi)容播放音樂的裝置的示意圖。參照圖6,該裝置包括分組子模塊61、第二判定子模塊62、第二確定子模塊63、確定模塊64和播放模塊65。其中:
[0117]分組子模塊61,用于按照預設分組條件將圖庫中的目標圖片分成至少一個圖片組;
[0118]第二判定子模塊62,用于利用預先生成的場景判定模型判定出圖片組中的每張目標圖片的圖像特征對應的場景標簽;
[0119]第二確定子模塊63,用于針對每個圖片組,將目標圖片的圖像特征對應的數(shù)量最多的場景標簽作為圖片組的場景標簽。
[0120]確定模塊64,用于確定與圖片組的場景標簽對應的音樂文件;
[0121]播放模塊65,用于在顯示圖片組的目標圖片時,播放與圖片組的場景標簽對應的首樂文件。
[0122]在本公開的一個可選的實施例中,分組子模塊61可以包括以下子模塊:第三確定子模塊,用于確定圖庫中每個目標圖片的拍照日期或拍照地點;第四確定子模塊,用于將對應同一個拍照日期的目標圖片確定為一個圖片組,或?qū)粋€所述拍照地點的所述目標圖片確定為Iv圖片組。
[0123]在本公開的一個可選的實施例中,本公開提供的裝置還可以包括以下模塊:創(chuàng)建模塊,用于創(chuàng)建場景標簽;獲取模塊,用于獲取與每個場景標簽對應的指定場景圖片;提取模塊,用于提取每個場景標簽對應的指定場景圖片的圖像特征;訓練模塊,用于利用預設機器學習裝置對每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成場景判定模型。
[0124]關(guān)于上述實施例中的裝置,其中各個模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實施例中進行了詳細描述,此處將不做詳細闡述說明。
[0125]實施例五
[0126]圖7是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的裝置800的框圖。例如,裝置800可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設備,游戲控制臺,平板設備,醫(yī)療設備,健身設備,個人數(shù)字助理等。
[0127]參照圖7,裝置800可以包括以下一個或多個組件:處理組件802,存儲器804,電源組件806,多媒體組件808,音頻組件810,輸入/輸出(I/O)的接口 812,傳感器組件814,以及通信組件816。
[0128]處理組件802通??刂蒲b置800的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關(guān)聯(lián)的操作。處理組件802可以包括一個或多個處理器820來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件802可以包括一個或多個模塊,便于處理組件802和其他組件之間的交互。例如,處理組件802可以包括多媒體模塊,以方便多媒體組件808和處理組件802之間的交互。
[0129]存儲器804被配置為存儲各種類型的數(shù)據(jù)以支持在裝置800的操作。這些數(shù)據(jù)的示例包括用于在裝置800上操作的任何應用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器804可以由任何類型的易失性或非易失性存儲設備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。
[0130]電源組件806為裝置800的各種組件提供電力。電源組件806可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置800生成、管理和分配電力相關(guān)聯(lián)的組件。
[0131]多媒體組件808包括在裝置800和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中,多媒體組件808包括一個前置攝像頭和/或后置攝像頭。當裝置800處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學透鏡系統(tǒng)或具有焦距和光學變焦能力。
[0132]音頻組件810被配置為輸出和/或輸入音頻信號。例如,音頻組件810包括一個麥克風(MIC),當裝置800處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器804或經(jīng)由通信組件816發(fā)送。在一些實施例中,音頻組件810還包括一個揚聲器,用于輸出音頻信號。
[0133]I/0接口 812為處理組件802和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
[0134]傳感器組件814包括一個或多個傳感器,用于為裝置800提供各個方面的狀態(tài)評估。例如,傳感器組件814可以檢測到裝置800的打開/關(guān)閉狀態(tài),組件的相對定位,例如組件為裝置800的顯示器和小鍵盤,傳感器組件814還可以檢測裝置800或裝置800 —個組件的位置改變,用戶與裝置800接觸的存在或不存在,裝置800方位或加速/減速和裝置800的溫度變化。傳感器組件814可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件814還可以包括光傳感器,如CMOS或CXD圖像傳感器,用于在成像應用中使用。在一些實施例中,該傳感器組件814還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
[0135]通信組件816被配置為便于裝置800和其他設備之間有線或無線方式的通信。裝置800可以接入基于通信標準的無線網(wǎng)絡,如WiFi,2G或3G,或它們的組合。在一個示例性實施例中,通信組件816經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中,通信組件816還包括近場通信(NFC)模塊,以促進短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍牙(BT)技術(shù)和其他技術(shù)來實現(xiàn)。
[0136]在示例性實施例中,裝置800可以被一個或多個應用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設備(DSro)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述方法。
[0137]在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器804,上述指令可由裝置800的處理器820執(zhí)行以完成上述方法。例如,非臨時性計算機可讀存儲介質(zhì)可以是ROM、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設備等。
[0138]一種非臨時性計算機可讀存儲介質(zhì),當存儲介質(zhì)中的指令由移動終端的處理器執(zhí)行時,使得移動終端能夠執(zhí)行一種基于圖片內(nèi)容播放音樂的方法,方法包括:按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為每個圖片組分配一個場景標簽;確定與圖片組的場景標簽對應的音樂文件;在顯示圖片組的目標圖片時,播放與圖片組的場景標簽對應的音樂文件。
[0139]本領域技術(shù)人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本發(fā)明的其它實施方案。本申請旨在涵蓋本發(fā)明的任何變型、用途或者適應性變化,這些變型、用途或者適應性變化遵循本發(fā)明的一般性原理并包括本公開未公開的本【技術(shù)領域】中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權(quán)利要求指出。
[0140]應當理解的是,本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來限制。
【權(quán)利要求】
1.一種基于圖片內(nèi)容播放音樂的方法,其特征在于,包括: 按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為所述每個圖片組分配一個場景標簽; 確定與所述圖片組的場景標簽對應的音樂文件; 在顯示所述圖片組的目標圖片時,播放與所述圖片組的場景標簽對應的音樂文件。
2.根據(jù)權(quán)利要求1所述的基于圖片內(nèi)容播放音樂的方法,其特征在于,所述按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為所述每個圖片組分配一個場景標簽步驟包括: 獲取圖庫中的每張目標圖片; 利用預先生成的場景判定模型判定出每張所述目標圖片的圖像特征對應的場景標簽; 將對應相同場景標簽的所述目標圖片確定為一個圖片組,將所述場景標簽確定為所述圖片組的場景標簽。
3.根據(jù)權(quán)利要求1所述的基于圖片內(nèi)容播放音樂的方法,其特征在于,所述按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為所述每個圖片組分配一個場景標簽步驟包括: 按照預設分組條件將圖庫中的目標圖片分成至少一個圖片組; 利用預先生成的場景判定模型判定出所述圖片組中的每張目標圖片的圖像特征對應的場景標簽; 針對每個圖片組,將目標圖片的圖像特征對應的數(shù)量最多的場景標簽作為所述圖片組的場景標簽。
4.據(jù)權(quán)利要求3述的基于圖片內(nèi)容播放音樂的方法,其特征在于,所述按照預設分組條件將圖庫中的目標圖片分成至少一個圖片組步驟包括: 確定圖庫中每個目標圖片的拍照日期或拍照地點; 將對應同一個所述拍照日期的所述目標圖片確定為一個圖片組,或?qū)粋€所述拍照地點的所述目標圖片確定為一個圖片組。
5.根據(jù)權(quán)利要求2至4任意一項所述的基于圖片內(nèi)容播放音樂的方法,其特征在于,所述方法還包括: 創(chuàng)建場景標簽; 獲取與每個場景標簽對應的指定場景圖片; 提取所述每個場景標簽對應的指定場景圖片的圖像特征; 利用預設機器學習方法對所述每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
6.一種基于圖片內(nèi)容播放音樂的裝置,其特征在于,包括: 分組模塊,用于按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為所述每個圖片組分配一個場景標簽; 確定模塊,用于確定與所述圖片組的場景標簽對應的音樂文件; 播放模塊,用于在顯示所述圖片組的目標圖片時,播放與所述圖片組的場景標簽對應的音樂文件。
7.根據(jù)權(quán)利要求6所述的基于圖片內(nèi)容播放音樂的裝置,其特征在于,所述分組模塊包括: 獲取子模塊,用于獲取圖庫中的每張目標圖片; 第一判定子模塊,用于利用預先生成的場景判定模型判定出每張所述目標圖片的圖像特征對應的場景標簽; 第一確定子模塊,用于將對應相同場景標簽的所述目標圖片確定為一個圖片組,將所述場景標簽確定為所述圖片組的場景標簽。
8.根據(jù)權(quán)利要求6所述的基于圖片內(nèi)容播放音樂的裝置,其特征在于,所述分組模塊包括: 分組子模塊,用于按照預設分組條件將圖庫中的目標圖片分成至少一個圖片組; 第二判定子模塊,用于利用預先生成的場景判定模型判定出所述圖片組中的每張目標圖片的圖像特征對應的場景標簽; 第二確定子模塊,用于針對每個圖片組,將目標圖片的圖像特征對應的數(shù)量最多的場景標簽作為所述圖片組的場景標簽。
9.據(jù)權(quán)利要求8述的基于圖片內(nèi)容播放音樂的裝置,其特征在于,所述分組子模塊包括: 第三確定子模塊,用于確定圖庫中每個目標圖片的拍照日期或拍照地點; 第四確定子模塊,用于將對應同一個所述拍照日期的所述目標圖片確定為一個圖片組,或?qū)粋€所述拍照地點的所述目標圖片確定為一個圖片組。
10.根據(jù)權(quán)利要求7至9任意一項所述的基于圖片內(nèi)容播放音樂的裝置,其特征在于,所述裝置還包括: 創(chuàng)建模塊,用于創(chuàng)建場景標簽; 獲取模塊,用于獲取與每個場景標簽對應的指定場景圖片; 提取模塊,用于提取所述每個場景標簽對應的指定場景圖片的圖像特征; 訓練模塊,用于利用預設機器學習裝置對所述每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
11.一種基于圖片內(nèi)容播放音樂的裝置,其特征在于,包括: 處理器; 用于存儲處理器可執(zhí)行指令的存儲器; 其中,所述處理器被配置為: 按照預設條件將圖庫中的目標圖片拆分成至少一個圖片組,并為所述每個圖片組分配一個場景標簽; 確定與所述圖片組的場景標簽對應的音樂文件; 在顯示所述圖片組的目標圖片時,播放與所述圖片組的場景標簽對應的音樂文件。
【文檔編號】G06K9/62GK104268150SQ201410432694
【公開日】2015年1月7日 申請日期:2014年8月28日 優(yōu)先權(quán)日:2014年8月28日
【發(fā)明者】張濤, 陳志軍, 秦秋平 申請人:小米科技有限責任公司