專利名稱:實現(xiàn)分類播放的媒體播放器及分類播放方法
技術(shù)領(lǐng)域:
本發(fā)明涉及媒體播放技術(shù),特別涉及一種實現(xiàn)分類播放的媒體播放器、 以及 一 種媒體文件的分類播放方法。
背景技術(shù):
隨著多媒體技術(shù)的不斷發(fā)展,媒體播放器得到了廣泛的應(yīng)用。圖1為現(xiàn)有媒體播放器的結(jié)構(gòu)示意圖。如圖l所示,現(xiàn)有媒體播放器包括主控單元 101、媒體文件庫102、音頻解碼單元103和音頻輸出單元104。主控單元101根據(jù)外部輸入的用戶指令,將媒體文件庫102中與該用戶 指令對應(yīng)的至少 一個媒體文件輸出給音頻解碼單元103。其中,媒體文件庫102中存儲著多個媒體文件。音頻解碼單元103對接收到的媒體文件進行音頻解碼,并將音頻解碼后 音頻數(shù)據(jù)輸出給音頻輸出單元104。音頻輸出單元104播放輸出接收到的媒體文件。可見,上述媒體播放器通過查找、音頻解碼和輸出,實現(xiàn)了媒體文件的 播放。然而,由于用戶對媒體播放的需求越來越多樣化,例如,用戶在不同 的環(huán)境或不同的時間可能希望播放不同的媒體文件,因此,上述媒體播放器 只能簡單地進行查找、音頻解碼和輸出以實現(xiàn)對媒體文件的播放,已經(jīng)無法 有效滿足用戶的需求,從而使得現(xiàn)有媒體播放的實用性不高。發(fā)明內(nèi)容有鑒于此,本發(fā)明了提供一種實現(xiàn)分類播放的媒體播放器、以及一種媒 體文件的分類播放方法,能夠提高媒體播放的實用性。本發(fā)明提供的一種實現(xiàn)分類播放的媒體播放器,包括主控單元、媒體 文件庫、音頻解碼單元、音頻輸出單元,該媒體播放器進一步包括音樂情 感分類單元,其中,所述音頻解碼單元,對接收到的媒體文件進行音頻解碼,并將音頻解碼后音頻數(shù)據(jù)輸出;所述音樂情感分類單元,對解碼后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感類別進行分類,將分類結(jié)果提供給主控單元;所述主控單元,根據(jù)用戶輸入的類別選擇指令,調(diào)取媒體文件庫中與該指令所表示類別相同的各媒體文件用以播放。所述音樂情感分類單元包括音樂元素分析子單元、心理模型匹配子單元,其中,所述音樂元素分析單元,接收來自所述音頻解碼單元的音頻數(shù)據(jù),從當 前接收到的音頻數(shù)據(jù)中提取各種音樂基本元素,將提取出的音樂基本元素作 為分析結(jié)果,與當前接收到的音頻數(shù)據(jù)對應(yīng)的媒體文件標識一起輸出給所述 心理模型匹配子單元;所述心理模型匹配單元,存儲多個預(yù)設(shè)的心理模型;將當前接收到的分 析結(jié)果與心理模型進行匹配,得到與媒體文件標識表示的媒體文件匹配的心 理模型,將匹配的心理模型作為該媒體文件所屬的情感類別,與對應(yīng)的媒體 文件標識 一 起輸出給所述主控單元。所述音樂情感分類單元中包括簡單特征提取子單元和具有智能學(xué)習(xí)功 能的分類器,其中,所述簡單特征提取子單元,接收音頻解碼后的音頻數(shù)據(jù),從接收到的音 頻數(shù)據(jù)中提取簡單特征后,輸出給所述分類器;所述分類器根據(jù)預(yù)先計算得到的參數(shù),對接收到的簡單特征進行分析, 得到該簡單特征對應(yīng)的媒體文件所匹配的心理模型,并將每個媒體文件匹配 的心理模型與對應(yīng)媒體文件標識 一起輸出給所述主控單元。所述音樂情感分類單元包括列表存儲子單元,用于存儲每個媒體文件 所匹配的情感類別。 所述與媒體文件匹配的心理模型為與所述媒體文件的相關(guān)度大于預(yù)設(shè) 閾值的心理模型。所述列表存儲單元進一步存儲所述心理模型與所述媒體文件的相關(guān)度; 所述媒體播放器進一步包括顯示單元,用于將當前播放的媒體文件與其匹配的心理模型的相關(guān)度顯示輸出。所述音樂基本元素包括音樂的速度、力度、節(jié)奏、旋律、音色。 所述媒體播放器為便攜式播放器,所述音樂情感分類單元進一步按照預(yù)設(shè)的環(huán)境類別與情感類別的對應(yīng)關(guān)系對媒體文件進行分類;其中,所述環(huán)境類別與情感類別的對應(yīng)關(guān)系是按照環(huán)境對人類心理影響和音樂對心理影響之間的相關(guān)性建立的。該媒體播放器中進一步包括環(huán)境感測單元,用于感測該媒體播放器所處外部環(huán)境的環(huán)境參數(shù);所述列表存儲單元中進一步存儲了環(huán)境參數(shù)與環(huán)境類別的對應(yīng)關(guān)系;所述主控單元進一步根據(jù)所述環(huán)境參數(shù)與環(huán)境類別的對應(yīng)關(guān)系,查找與 所述環(huán)境感測單元感測到的環(huán)境參數(shù)所匹配的環(huán)境類別。所述環(huán)境感測單元包括下述之一或任意組合加速度傳感器、溫度傳感器、光傳感器、聲音傳感器、計時器,其中,所述加速度傳感器,感測所述媒體播放器在外力作用下移動時所具有的加速度,并將感測到的加速度取值輸出給所述主控單元;所述溫度傳感器,感測所述媒體播放器所處外部環(huán)境的溫度,并將感測到的溫度取值輸出給所述主控單元;所述光傳感器,感測所述媒體播放器所述外部環(huán)境的光線強度,并將感 測到的光線強度取值輸出給所述主控單元;所述聲音傳感器,感測所述媒體播放器所述外部環(huán)境的聲音的類別和強 度,并將感測到的信息輸出給所述主控單元;所述計時器,將當前時間輸出給所述主控單元。所述音樂情感分類單元進一步按照預(yù)設(shè)的行為狀態(tài)類別與情感類別的 對應(yīng)關(guān)系對媒體文件進行分類;其中,所述行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系是按照人類在不同行為 狀態(tài)下對心理的需求和音樂對心理影響之間的相關(guān)性建立的。本發(fā)明提供的一種媒體文件的分類播放方法,包括 對接收到的媒體文件進行音頻解碼得到音頻數(shù)據(jù); 對解碼后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感類別 進行分類;根據(jù)用戶輸入的類別選擇指令,調(diào)取媒體文件庫中與該指令所表示類別 相同的媒體文件用以播放。所述對解碼后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感 類別進行分類包括從音頻數(shù)據(jù)中提取各種音樂基本元素,將提取出的音樂基本元素作為分 析結(jié)果;將所述分析結(jié)果與預(yù)設(shè)心理模型進行匹配,得到與媒體文件標識表示的 媒體文件匹配的心理模型,將匹配的心理模型作為該媒體文件所屬的情感類 別,與對應(yīng)的媒體文件標識一起輸出。所述對解碼后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感類別進行分類包括從音頻數(shù)據(jù)中提取簡單特征;根據(jù)預(yù)先計算得到的參數(shù),對接收到的簡單特征進行分析,得到該簡單 特征對應(yīng)的媒體文件所匹配的心理模型,并將匹配的心理模型作為該媒體文 件所屬的情感類別,與對應(yīng)媒體文件標識 一起輸出。所述將匹配的心理模型作為該媒體文件所屬的情感類別,與對應(yīng)媒體文 件標識 一起輸出之后,該方法進一 步包括存儲媒體文件所匹配的情感類別。該方法進一步包括設(shè)置所述心理模型與所述媒體文件的相關(guān)度;在播放媒體文件時,將當前播的媒體文件與其匹配的心理模型的相關(guān)度 所述音樂基本元素包括音樂的速度、力度、節(jié)奏、旋律、音色。 所述對解碼后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感類別進行分類進一步包括按照預(yù)設(shè)的環(huán)境類別與情感類別的對應(yīng)關(guān)系對媒體文件進行分類;其中,所述環(huán)境類別與情感類別的對應(yīng)關(guān)系是按照環(huán)境對人類心理影響和音樂對心理影響之間的相關(guān)性建立的。所述按照預(yù)設(shè)的環(huán)境類別與情感類別的對應(yīng)關(guān)系對媒體文件進行分類之前,該方法進一步包括感測外部環(huán)境的環(huán)境參數(shù);根據(jù)所述環(huán)境參數(shù)與環(huán)境類別的對應(yīng)關(guān)系,查找與感測到的環(huán)境參數(shù)所 匹配的環(huán)境類別。所述對解碼后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感 類別進行分類進一步包括按照預(yù)設(shè)的行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系對媒體文件進行分類;其中,所述行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系是按照人類在不同行為 狀態(tài)下對心理的需求和音樂對心理影響之間的相關(guān)性建立的。有上述技術(shù)方案可見,本發(fā)明根據(jù)用戶輸入的指令,將該指令對應(yīng)類別 的各媒體文件進行音頻解碼并播放。例如,用戶可根據(jù)其當前的心情、其當 前所處環(huán)境、其當前行為狀態(tài),輸入相應(yīng)的指令,表示其希望聽到不同舒緩 度、激情度等類別的音樂,媒體播放器即可根據(jù)該指令播放符合用戶需求的 媒體文件,滿足了用戶對媒體播放的多樣化需求,從而能夠提高媒體播放的實用性。
圖1為現(xiàn)有媒體播放器的結(jié)構(gòu)示意圖。圖2為本發(fā)明中實現(xiàn)分類播放的媒體播放器的結(jié)構(gòu)示意圖。
圖3為本發(fā)明中媒體文件的分類播放過程的流程示意圖。 圖4為本發(fā)明中媒體文件分類過程的流程示意圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下參照附圖并舉 實施例,對本發(fā)明進一步詳細說明。本發(fā)明中,根據(jù)用戶輸入的指令,將該指令對應(yīng)類別的各媒體文件進行 音頻解碼并播放。例如,用戶可根據(jù)其當前的心情或其當前所處環(huán)境輸入相 應(yīng)的指令,表示其希望聽到不同舒緩度、激情度等類別的音樂,媒體播放器 即可根據(jù)該指令播放符合用戶需求的媒體文件。其中,媒體文件的分類可以按照如下方式來實現(xiàn)先對音頻解碼后的音 頻數(shù)據(jù)進行音樂基本元素分析,得到包括媒體文件的音樂播放速度、力度、 節(jié)奏、旋律、音色等音樂基本元素的分析結(jié)果;然后將分析結(jié)果與預(yù)設(shè)的心 理模型進行匹配,例如與表示不同舒緩度、激情度等心理模型進行匹配,得 到與媒體文件匹配的心理模型,作為表示情感類別的匹配結(jié)果,匹配相同心 理模型的各媒體文件,即屬于相同的類別。圖2為本發(fā)明中實現(xiàn)分類播放的媒體播放器的結(jié)構(gòu)示意圖。如圖2所示, 該媒體播放器包括主控單元101、媒體文件庫102、音頻解碼單元103、 音頻輸出單元104、音樂情感分類單元205、顯示單元206。音頻解碼單元103,對接收到的媒體文件進行音頻解碼,并將音頻解碼 后的音頻數(shù)據(jù)輸出給音樂情感分類單元205或音頻輸出單元104。音樂情感分類單元205,對解碼后的媒體文件進行情感分析,根椐分析 結(jié)果并按預(yù)設(shè)的情感類別進行分類,將分類結(jié)果提供給主控單元101。主控單元IOI,根據(jù)用戶輸入表示不同情感類別的類別選擇指令,調(diào)取 媒體文件庫102中與該指令所表示類別相同的各媒體文件用以播放。例如,主控單元可將與該指令所表示類別相同的各媒體文件的音頻數(shù)據(jù) 通過顯示魚元206顯示到用戶界面(供用戶選擇是否播放、選擇播放其中的
哪一個或哪幾個媒體文件)、或經(jīng)音頻解碼單元103解碼后由音頻輸出單元 104播放??梢?,上述媒體播放器實現(xiàn)了媒體文件的分類播放。在分類播放之前,主控單元101、音頻解碼單元103和音樂情感分類單 元205還需要進行協(xié)同處理,以對媒體文件庫102中存儲的媒體文件進行分類。主控單元101,將媒體文件庫102中的媒體文件依次輸出給音頻解碼單 元103。音頻解碼單元103,對接收到的媒體文件進行音頻解碼,并將音頻解碼 后的音頻數(shù)據(jù)輸出給音樂情感分類單元205。音樂情感分類單元205,從來自音頻解碼單元103的音頻數(shù)據(jù)中提取媒 體文件的播放速度、力度、節(jié)奏、旋律、音色等各種音樂基本元素;將從各 音頻數(shù)據(jù)中提取出的音樂基本元素分別與預(yù)設(shè)的各心理模型進行匹配,將解 碼后的音頻數(shù)據(jù)匹配不同心理模型的媒體文件分為不同情感類別,并存儲情 感類別與媒體文件的對應(yīng)關(guān)系,以實現(xiàn)如圖2所示的媒體播放器能夠按類別 播放對應(yīng)的媒體文件。這樣,上述如圖2所示的媒體播放器則能夠?qū)崿F(xiàn)基于不同心理模型的媒 體文件分類播放。用戶即可根據(jù)其當前的心情或其當前所處環(huán)境,選擇播放 不同舒緩度、激情度等類別的媒體文件。具體來說,音樂情感分類單元205可以從媒體文件中提取各種音樂基本 元素,并根據(jù)提取出的音樂基本元素與預(yù)設(shè)心理模型的匹配結(jié)果對媒體文件 進行分類;音樂情感分類單元205還可以通過智能學(xué)習(xí)方式對媒體文件進行 分類。如杲采用前一種方式,則音樂情感分類單元205中可以包括音樂元素 分析子單元2051、心理模型匹配子單元2052、列表存儲子單元2053。音樂元素分析子單元2051,從當前接收到的音頻數(shù)據(jù)中提取各種音樂 基本元素,例如音樂播放速度、力度、節(jié)奏、旋律、音色等,并將提取出的 音樂基本元素作為分析結(jié)果,與該音頻數(shù)據(jù)對應(yīng)的媒體文件標識一起輸出給心理模型匹配子單元2052。其中,播放速度、力度、節(jié)奏、旋律、音色等音樂基本元素,均可以按 照其元素特性并利用現(xiàn)有方式來提取。心理模型匹配子單元2052,存儲多個預(yù)設(shè)的心理模型,例如表示不同 舒緩度、不同激情度等心理模型;將當前接收到的分析結(jié)果與心理模型進行 匹配,得到與媒體文件標識表示的媒體文件匹配的心理模型,將匹配的心理 模型作為該媒體文件所屬情感類別,與對應(yīng)的媒體文件標識一起輸出給列表 存儲子單元2503。其中,不同心理模型是由不同取值的各種音樂基太元素構(gòu)成的,因此, 將提取出的音樂基本元素與心理模型中的音樂基本元素進行比較,即可獲得 匹配的心理模型。匹配的方式可以為如果從某一媒體文件的音頻數(shù)據(jù)中提 取的音樂基本元素與某一 心理模型中的各音樂基本元素的相關(guān)度大于預(yù)設(shè) 域值時,即該媒體文件與該心理模型的相關(guān)度大于預(yù)設(shè)域值時,則確定該媒 體文件與該心理模型匹配。例如,當從媒體文件1中提取的音樂基本元素, 與心理模型1中的對應(yīng)音樂基本元素的相關(guān)度為90%,大于預(yù)設(shè)闊值60%, 則確定媒體文件1與心理模型1匹配。該相關(guān)度可看作媒體文件與其所屬類 別的相關(guān)度。列表存儲子單元2053,存儲著分類列表,列表中包括每個媒體文件所匹配的情感類別。如果心理模型匹配子單元2052還將每個媒體文件與其所屬情感類別的 相關(guān)度也輸出給列表存儲子單元2053,則列表存儲單元2053存儲的分類列實際應(yīng)用中,心理模型匹配子單元206可以直接將每個媒體文件所屬情 感類別及其對應(yīng)的媒體文件標識輸出給主控單元101,使得主控單元101獲 知每個媒體文件所屬類別;這種情況下,可以由主控單元101再將每個媒體 并存儲到分類列表中,以便后續(xù)接收到用戶輸入的指令能夠根據(jù)該分類列表 中存儲的對應(yīng)關(guān)系獲知對應(yīng)情感類別的各媒體文件。當然,在確定分類類型后,也可以不以列表存儲子單元2053的形式存在,可以直接在媒體庫的相應(yīng)媒體文件的屬性上加上情感類型即可。心理模型匹配子單元2052還可以直接將每個媒體文件所屬情感類別及 其對應(yīng)的媒體文件標識輸出給存儲列表子單元2053,并存儲到分類列表中, 而不需主控單元101的中繼轉(zhuǎn)發(fā)。這樣,主控單元101根據(jù)外部輸入的用戶指令和列表存儲單元207中的 分類列表,將媒體文件庫102中與該用戶指令對應(yīng)的至少一個類別的各媒體 文件輸出給音頻解碼單元103。例如,心理模型1、心理模型2、心理模型3,分別表示悲傷度、激情 度、舒緩度這3個情感類別,則用戶輸入表示激情度和舒緩度的指令之后, 主控單元101即在列表存儲單元207中查找與心理模型2和心理模型3所對 應(yīng)的各媒體文件標識,然后調(diào)用媒體文件庫102中與查找的各媒體文件標識 對應(yīng)的媒體文件,輸出給音頻解碼單元103。音頻解碼單元103對接收到的媒體文件進行音頻解碼,并將音頻解碼后 的音頻數(shù)據(jù)輸出給音頻輸出單元104。音頻輸出單元104播放輸出接收到的音頻數(shù)據(jù),即實現(xiàn)了滿足激情度等 級2和舒緩度等級1的各媒體文件的播放。用戶輸入的指令可能表示多種情感類別,用戶輸入的指令也可能表示隨 機播放或表示各情感類別。這種情況下,為了使得用戶能夠獲知當前播放的 媒體文件是屬于哪一個情感類別,如圖2所示的媒體播放器中的顯示單元 206,還可以將當前播放的媒體文件所屬情感類別的信息顯示輸出。其中,該信息可以是情感類別所對應(yīng)的心理模型名稱,也可以是心理模 型所表示的情感類別名稱,例如,"舒緩度等級l"、"激情度等級2"等。同時,由于列表存儲單元2053中還可以存儲媒體文件與其所屬類別的 相關(guān)度,因此,顯示單元還可以將當前播放的媒體文件與其所屬類型的相關(guān) 度顯糸輸出。這樣,假設(shè)當前播放的媒體文件對應(yīng)"舒緩度",同時輸出該媒體文件與"舒緩度"所對應(yīng)的心理模型的相關(guān)度80%;假設(shè)上一次播放的媒體文件也對應(yīng)"舒緩度",上一次播放時輸出該媒體文件與"舒緩度"所對應(yīng)的心理模型的相關(guān)度70%,則用戶即可獲知,雖然兩次播放的媒體文件均對應(yīng)"舒緩度",但相比之下,當前播放的媒體文件更加舒緩。可見,本發(fā)明中的媒體播放器可根據(jù)用戶輸入的指令,播放符合用戶在 當前環(huán)境或時間所希望播放的 一個或多個類別的媒體文件,滿足了用戶對媒 體播放的多樣化需求,還能夠進一步顯示輸出當前播放的媒體文件的相關(guān)信 息,從而進一步提高了媒體播放的實用性。上述實施例中音樂基本元素的定義十分直觀,與心理模型之間有著直接 的對應(yīng)關(guān)系,但是其中多數(shù)元素的計算過程較為復(fù)雜,計算結(jié)果也不能充分 表征該元素的意義,因此,我們可以簡化音樂元素的提取,代之以一些計算 簡單的特征,并采用智能學(xué)習(xí)的方法實現(xiàn)媒體文件的分類。該實施方案的特 點在于特征計算簡單、分類器設(shè)計理論成熟、基于學(xué)習(xí)的分類方法更為可靠。在音樂情感分類單元205中,用一個簡單特征提取子單元和分類器替換 音樂元素分析子單元2051和心理模型匹配子單元2052。其中的簡單特征可 以包括短時能量、短時平均幅度、短時譜特征等;分類器可以為現(xiàn)有的人工 神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN )分類器、隱馬爾科夫模型(Hidden Markov Model, HMM )分類器等任意 一種具有學(xué)習(xí)能力的現(xiàn)有分類器。在利用分類器進行媒體文件的分類之前,預(yù)先挑選若干媒體文件,并結(jié) 合經(jīng)驗值對這些媒體文件的心理模型分別進行評定,確定每個媒體文件所匹 配的心理模型。然后將確定的匹配不同心理模型的媒體文件的音頻數(shù)據(jù)作為 分類器的訓(xùn)練樣本;提取訓(xùn)練樣本的簡單特征作為分類器的輸入,將媒體文 件對應(yīng)的心理模型作為分類器的期望輸出,根據(jù)預(yù)設(shè)學(xué)習(xí)法則計算出分類器 的參數(shù),以使得分類器輸出的心理模型盡量接近期望輸出,從而實現(xiàn)分類器 的訓(xùn)練過程,也就是智能學(xué)習(xí)過程。經(jīng)過訓(xùn)練過程的分類器即可實現(xiàn)媒體文件的分類。簡單特征提取子單元 的輸入端與音頻解碼單元103相連,接收音頻解碼后的音頻數(shù)據(jù),從接收到 的音頻數(shù)據(jù)中提取簡單特征后,輸出給分類器;分類器根據(jù)預(yù)先計算得到的 參數(shù),對接收到的簡單特征進行分析,最后輸出該簡單特征對應(yīng)的媒體文件 所匹配的心理模型。除此之外,分類器還可以輸出簡單特征對應(yīng)的媒體文件 與其匹配的心理模型的相關(guān)度,即該媒體文件以多大的概率匹配于該心理模 型。這樣,音樂情感分類單元205即可將分類器得到的每個媒體文件匹配的 心理模型以及對應(yīng)的媒體文件標識一起輸出給主控單元101;還可以根據(jù)每 個媒體文件匹配的心理模型確定并存儲每個文件所屬情感類別,并將每個媒 體文件所屬情感類別及其對應(yīng)的媒體文件標識輸出給主控單元101。上述如圖2所示的媒體播放器,可以為體積小巧,便于攜帶的便攜式播 放器,這樣,用戶隨身攜帶該媒體播放器處于不同的環(huán)境下,則可以輸入其 所處環(huán)境的類別,媒體播放器的列表存儲單元207中還存儲了環(huán)境類別與情 感類別的對應(yīng)關(guān)系,主控單元101即可根據(jù)該對應(yīng)關(guān)系,在列表存儲單元 207中查找與任意一種環(huán)境類別所對應(yīng)情感類別對應(yīng)的各媒體文件標識,并 調(diào)取媒體文件庫102中與查找到的媒體文件標識所對應(yīng)的各媒體文件,經(jīng)由 音頻解碼單元103和音頻輸出單元104來播放。具體來說,音樂情感分類單元205可以進一步按照預(yù)設(shè)的環(huán)境類別與情感 類別的對應(yīng)關(guān)系對媒體文件進行分類,即音樂情感分類單元205中可存儲該對 應(yīng)關(guān)系。主控單元101即可根據(jù)用戶輸入的表示不同環(huán)境類別的類別選擇指令, 以及環(huán)境類別與情感類別的對應(yīng)關(guān)系,調(diào)用媒體文件庫102中,與該指令所表 示環(huán)境類別相同的各情感類別的媒體文件通過顯示單元206顯示到用戶界面、 或經(jīng)音頻解碼單元103解碼后由音頻輸出單元104播放。簡單的說,就是使得 用戶能夠在不同環(huán)境聽不同的音樂。其中,環(huán)境類別與情感類別的對應(yīng)關(guān)系是根據(jù)環(huán)境對人類心理影響和音 樂對心理影響之間的相關(guān)性建立的。而環(huán)境對人類心理影響、音樂對心理影 響可以是預(yù)先統(tǒng)計分析的經(jīng)驗值。 可見,本發(fā)明中的媒體播放器還可以使得用戶能夠根據(jù)其自身所處環(huán)境 來選擇媒體文件,進一步提高了媒體播放器的實用性。進一步地,本發(fā)明中的媒體播放器還可以自動識別其自身所處環(huán)境狀 態(tài),從而自動選擇符合該環(huán)境狀態(tài)的心理模型所對應(yīng)的媒體文件進行播放。這種情況下,該媒體播放器中進一步包括環(huán)境感測單元(圖中未示出), 用于感測該媒體播放器所處外部環(huán)境的環(huán)境參數(shù)。具體來說,環(huán)境感測單元中可以包括下述之一或任意組合加速度傳感器、溫度傳感器、光傳感器、計時器。加速度傳感器,感測媒體播放器在外力作用下移動時所具有的加速度,并將感測到的加速度取值輸出給所述主控單元101,例如,如果媒體播放器為便 攜式,則用戶會帶動該媒體播放器行走、奔跑,對該媒體播放器產(chǎn)生加速度。溫度傳感器,感測媒體播放器所處外部環(huán)境的溫度,并將感測到的溫度取 值輸出給所述主控單元101,主控單元101可根據(jù)當前光照強度選擇對應(yīng)的媒 體文件播放,例如在溫度較高時可以播放激情度較高的媒體文件,在溫度較低 時則播放舒緩度較高的媒體文件。光傳感器,感測媒體播放器所述外部環(huán)境的光線強度,并將感測到的光線 強度取值輸出給主控單元101,主控單元101可根據(jù)當前光照強度選擇對應(yīng)的 媒體文件播放,例如在光照強度較高時可以播放激情度較高的媒體文件,在光 照強度較低時則播放舒緩度較高的媒體文件。聲音傳感器,可以是麥克風(fēng),感測媒體播放器所述外部環(huán)境的聲音的類別 和強度,并將感測到的信息輸出給主控單元101。計時器,將當前時間輸出給所述主控單元101,主控單元101可根據(jù)當前 時間判斷出當前是白天或是夜晚,從而選擇對應(yīng)的媒體文件播放,例如在白天 可以播放激情度較高的媒體文件,在夜晚則播放舒緩度較高的媒體文件。同時,列表存儲單元207中則進一步存儲了環(huán)境參數(shù)與環(huán)境類別的對應(yīng) 關(guān)系;主控單元101則根據(jù)環(huán)境參數(shù)與環(huán)境類別的對應(yīng)關(guān)系,查找與環(huán)境感 測單元感測到的環(huán)境參數(shù)所匹配的環(huán)境類別。
例如,假設(shè)加速度傳感器測量到的加速度值大于預(yù)設(shè)的閾值,則主控單 元根據(jù)環(huán)境參數(shù)與環(huán)境類別的對應(yīng)關(guān)系,判斷出媒體播放器當前所處環(huán)境為 運動環(huán)境,再根據(jù)環(huán)境類別與心理模型的對應(yīng)關(guān)系,在列表存儲單元207中 查找表示激情度等級1 n的心理模型所對應(yīng)的媒體文件標識,從而將媒體文 件庫102中與上述媒體文件標識對應(yīng)的媒體文件輸出給音頻解碼單元103, 以實現(xiàn)激情度等級l~n的媒體文件的播放。同理,主控單元101根據(jù)接收到的各種環(huán)境參數(shù)的取值、以及列表存儲 單元207中環(huán)境參數(shù)與環(huán)境類別的對應(yīng)關(guān)系,自動判斷出媒體播放器當前所 處的環(huán)境類別,進而查找與對應(yīng)心理模型對應(yīng)的媒體文件并播放??梢?,本發(fā)明中的媒體播放器還能夠自動根據(jù)其自身所處環(huán)境來選擇媒 體文件,更進一步地提高了媒體播放器的實用性。本發(fā)明提供的媒體播放器,還能夠根據(jù)用戶所處的行為狀態(tài),例如用戶 在休息、在工作、在健身、在學(xué)習(xí)、睡覺前、在行走、在散步時等行為狀態(tài) 下,對心理的需求,選擇對應(yīng)情感類別的媒體文件進行播放。這種情況下,音樂情感分類單元205進一步按照預(yù)設(shè)的行為狀態(tài)類別與 情感類別的對應(yīng)關(guān)系對媒體文件進行分類,即音樂情感分類單元205中可存 儲該對應(yīng)關(guān)系。主控單元101即可根據(jù)用戶輸入的表示不同行為狀態(tài)類別的 類別選擇指令,例如表示用戶在休息、在工作、在健身、在學(xué)習(xí)、睡覺前、 在行走、在散步時等人類行為狀態(tài),以及行為狀態(tài)類別與情感類別的對應(yīng)關(guān) 系,調(diào)用媒體文件庫102中,與該指令所表示行為狀態(tài)類別相同的各情感類 別的媒體文件通過顯示單元206顯示到用戶界面、或經(jīng)音頻解碼單元103解 碼后由音頻輸出單元104播放。簡單的說,就是使得用戶在做不同的事情時 能夠聽到不同的音樂。其中,行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系是按照人類在不同行為狀態(tài) 下對心理的需求和音樂對心理影響之間的相關(guān)性建立的。人類在不同行為狀 態(tài)下對心理的需求、音樂對心理影響可以是預(yù)先統(tǒng)計分析的經(jīng)驗值。以上是對本發(fā)明中媒體播放器的詳細說明,下面,對本發(fā)明媒體播放中
的分類方法進行詳細說明。圖3為本發(fā)明中媒體文件的分類播放過程的流程示意圖。如圖3所示, 該方法包括以下步驟步驟301,根據(jù)用戶輸入的指令和預(yù)先獲取的情感類別與媒體文件的對應(yīng)關(guān)系,將與該指令所表示類別的各媒體文件進行音頻解碼。本步驟之前,先對媒體文件進行音頻解碼得到音頻數(shù)據(jù),然后對解碼后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情塵類別進行分類,分類過程與如前所述的媒體播放器內(nèi)部處理過程相同,在此不再贅述。 用戶可輸入表示不同情感類別的類別選擇指令,這樣,本步驟中,即可根據(jù)用戶輸入的該指令,查找與其表示的情感類別的各媒體文件,并進行音頻解碼。本步驟之前,用戶還可以輸入表示不同環(huán)境類別或不同行為狀態(tài)類別的 類別選擇指令,這樣,在本步驟中,即可根據(jù)預(yù)先獲取的環(huán)境類別與情感類 別的對應(yīng)關(guān)系、和/或行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系,查找對符合環(huán) 境類別或行為狀態(tài)類別的各媒體文件進行音頻解碼,用以實現(xiàn)用戶能夠在不 同環(huán)境聽不同的音樂、或用戶在做不同的事情時能夠聽到不同的音樂。步驟302,利用解碼后的音頻數(shù)據(jù)播放媒體文件。在執(zhí)行本步驟的同時,還可以將當前播放的媒體文件所屬情感類別顯示 輸出。至此,本流程結(jié)束。其中,在上述流程中的步驟301之前,可以通過如下過程來實現(xiàn)媒體文 件的分類。圖4為本發(fā)明中媒體文件分類過程的流程示意圖。如圖4所示, 步驟401,將媒體文件庫中的媒體文件進行音頻解碼。 步驟402,從音頻解碼后的音頻數(shù)據(jù)中提取各種音樂基本元素,例如該 媒體文件的音樂播放速度、力度、節(jié)奏、旋律、音色等。本步驟中,以節(jié)奏為例,提取音樂基本元素的過程可以為402a,以幀為單位接收音頻解碼后的音頻數(shù)據(jù),對當前接收到的一幀音 頻數(shù)據(jù)(包括1024個采樣點的時域信號)使用FFT變換將信號從時域編換 到頻域,得到頻域復(fù)信號a。+jbn, n為大于等于O且小于等于51的正整數(shù)。402b,計算頻域復(fù)信號的幅度A[n^ Va 2 +b 2 。402c,按照預(yù)先劃分的多個子帶,分別計算每個子帶的幅度,作為瞬時^匕一1" fl匕里。例如,可以按照50~200、 200 400、 400 800、 800 1600、600 3200、 3200Hz以上,共劃分6個子帶。實際應(yīng)用中,瞬時能量可按照如下公式來計算丄I^W,其中,£/[,']表示第i個子帶的瞬時能量、^表示第i個子帶的寬度、S,表示第i個子帶的起始譜線,i為大于l的正整數(shù)。每次執(zhí)行402c之后,均存儲當前幀的各子帶瞬時能量,并按照先進先 出的原則,刪除最先存儲的 一個幀的各子帶瞬時能量。402d,讀取已存儲的m個幀的各子帶的瞬時能量fi0[/],分別計算m個 幀在每個子帶的瞬時能量£/[/]的平均值^[/]和方差。其中,m為1秒內(nèi)緩存在歷史能量緩沖子單元2054的幀數(shù)量,m的取 值通常為43。實際應(yīng)用中,第i個子帶的瞬時能量平均值W[/]和第i個子帶的瞬時能 量方差A(yù),K|/j可以分別按照如下公式來計算£4,1 =丄££0,[,.], j為大于等于l且小于等于m的正整數(shù)、£0,[/1為讀取" H的第j個幀的第i個子帶的瞬時能量; 五「[,]=丄^(£0,[/] —m[/])2。402e,根據(jù)計算得到的W[,1和^7[,],判斷當前幀每個子帶的瞬時能量 /可/]是否為峰值能量,如果是,則將判斷為峰值能量的£/[/]確定為提取的音
樂基本元素并輸出,即實現(xiàn)了音樂基本元素中節(jié)奏的提取。其中,當大于C x E4卩]、且大于V時,判斷£/[/]為峰值能量,C和V是兩個由實驗確定的常數(shù),通常情況下,C=250, V=150。至于播放速度、力度、旋律、音色等音樂基本元素提取,則可通過現(xiàn)有方式來實現(xiàn)。步驟403,將從當前音頻數(shù)據(jù)中提取出的音樂基本元素與預(yù)設(shè)的心理模 型進行匹配,將與當前媒體文件匹配的心理模型作為該音頻數(shù)據(jù)對應(yīng)的媒體 文件所屬的媒體文件類型。本步驟中,預(yù)設(shè)的心理模型可以為表示不同舒緩度、不同激情度等心理模型。其中,不同心理模型是由不同取值的各種音樂基本元素構(gòu)成的,因此, 將提取出的音樂基本元素與心理模型中的音樂基本元素進行比較,即可獲得 匹配的心理才莫型。步驟404,存儲每個媒體文件與其所屬情感類別的對應(yīng)關(guān)系。至此,本流程結(jié)束??梢姡谌鐖D4所示的流程,在媒體播放時,通過如圖3所示的流程 能夠播放符合用戶在當前環(huán)境或時間所希望播放的一個或多個類別的媒體 文件,滿足了用戶對媒體播放的多樣化需求,從而能夠提高媒體播放的實用性。除此之外,本發(fā)明中還可以進一步預(yù)先設(shè)置環(huán)境類別與情感類別的對應(yīng) 關(guān)系、和/或行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系。這樣,在執(zhí)行如圖3所示流程的步驟301之前,如果用戶輸入的指令表 示環(huán)境類別,則步驟301中的具體處理過程可以包括根據(jù)用戶輸入的表示環(huán)境類別和/或行為狀態(tài)類別的指令、環(huán)境類別與 情感類別的對應(yīng)關(guān)系、和/或行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系,確定對 應(yīng)的情感類別;的對應(yīng)關(guān)系,將與所確定的情感類別對應(yīng)的各 媒體文件進行音頻解碼。涉及上述環(huán)境類別和/或行為狀態(tài)類別的分類過程,與如前所述的媒體 播放器內(nèi)部處理過程相同,在此不再贅述。這樣,即可使得用戶根據(jù)其當前所處環(huán)境、和/或其行為狀態(tài),選擇播 放用戶所需的媒體文件。以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范 圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換以及改進等, 均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1、一種實現(xiàn)分類播放的媒體播放器,包括主控單元、媒體文件庫、音頻解碼單元、音頻輸出單元,其特征在于,該媒體播放器進一步包括音樂情感分類單元,其中,所述音頻解碼單元,對接收到的媒體文件進行音頻解碼,并將音頻解碼后音頻數(shù)據(jù)輸出;所述音樂情感分類單元,對解碼后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感類別進行分類,將分類結(jié)果提供給主控單元;所述主控單元,根據(jù)用戶輸入的類別選擇指令,調(diào)取媒體文件庫中與該指令所表示類別相同的媒體文件用以播放。
2、 如權(quán)利要求1所述的媒體播放器,其特征在于,所述音樂情感分類單元 包括音樂元素分析子單元、心理模型匹配子單元,其中,所述音樂元素分析單元,接收來自所述音頻解碼單元的音頻數(shù)據(jù),從當前 接收到的音頻數(shù)據(jù)中提取各種音樂基本元素,將提取出的音樂基本元素作為分 析結(jié)果,與當前接收到的音頻數(shù)據(jù)對應(yīng)的媒體文件標識一起輸出給所述心理模 型匹配子單元;所述心理模型匹配單元,存儲多個預(yù)設(shè)的心理模型;將當前接收到的分析 結(jié)果與心理模型進行匹配,得到與媒體文件標識表示的媒體文件匹配的心理模 型,將匹配的心理模型作為該媒體文件所屬的情感類別,與對應(yīng)的媒體文件標 識一起輸出給所述主控單元。
3、 如權(quán)利要求1所述的媒體播放器,其特征在于,所述音樂情感分類單元 中包括簡單特征提取子單元和具有智能學(xué)習(xí)功能的分類器,其中,所述簡單特征提取子單元,接收音頻解碼后的音頻數(shù)據(jù),從接收到的音頻 數(shù)據(jù)中提取簡單特征后,輸出給所述分類器;所述分類器根據(jù)預(yù)先計算得到的參數(shù),對接收到的簡單特征進行分析,得 到該簡單特征對應(yīng)的媒體文件所匹配的心理模型,并將匹配的心理模型作為該 媒體文件所屬的情感類別,與對應(yīng)媒體文件標識一起輸出。
4、如權(quán)利要求2或3所述的媒體播放器,其特征在于,所述音樂情感分類單元包括列表存儲子單元,用于存儲每個媒體文件所匹配的情感類別。
5.如權(quán)利要求2或3所述的媒體播放器,其特征在于,所述與媒體文件匹 配的心理模型為與所述媒體文件的相關(guān)度大于預(yù)設(shè)閾值的心理模型。
6、 如權(quán)利要求2或3所述的媒體播放器,其特征在于,所述列表存儲單元 進一 步存儲所述心理模型與所述媒體文件的相關(guān)度;所述媒體播放器進一步包括顯示單元,用于將當前播放的媒體文件與其匹 配的心理模型的相關(guān)度顯示輸出。
7、 如權(quán)利要求2所述的媒體播放器,其特征在于,所述音樂基本元素包括 音樂的速度、力度、節(jié)奏、旋律、音色。
8、 如權(quán)利要求2或3所述的媒體播放器,其特征在于,所述媒體播放器為 便攜式播放器,所述音樂情感分類單元進一步按照預(yù)設(shè)的環(huán)境類別與情感類別 的對應(yīng)關(guān)系對媒體文件進行分類;其中,所述環(huán)境類別與情感類別的對應(yīng)關(guān)系是按照環(huán)境對人類心理影響和 音樂對心理影響之間的相關(guān)性建立的。
9、 如權(quán)利要求8所述的媒體播放器,其特征在于,該媒體播放器中進一步 包括環(huán)境感測單元,用于感測該媒體播放器所處外部環(huán)境的環(huán)境參數(shù);所述列表存儲單元中進一步存儲了環(huán)境參數(shù)與環(huán)境類別的對應(yīng)關(guān)系; 所述主控單元進一步根據(jù)所述環(huán)境參數(shù)與環(huán)境類別的對應(yīng)關(guān)系,查找與所 述環(huán)境感測單元感測到的環(huán)境參數(shù)所匹配的環(huán)境類別。
10、 如權(quán)利要求9所述的媒體播放器,其特征在于,所述環(huán)境感測單元包 括下述之一或任意組合加速度傳感器、溫度傳感器、光傳感器、聲音傳感器、 計時器,其中,所述加速度傳感器,感測所述媒體播放器在外力作用下移動時所具有的加 速度,并將感測到的加速度取值輸出給所述主控單元;所述溫度傳感器,感測所述媒體播放器所處外部環(huán)境的溫度,并將感測到 的溫度取值輸出給所述主控單元;所述光傳感器,感測所述媒體播放器所述外部環(huán)境的光線強度,并將感測 到的光線強度取值輸出給所述主控單元;所述聲音傳感器,感測所述媒體播放器所述外部環(huán)境的聲音的類別和強度,并將感測到的信息輸出給所述主控單元;所述計時器,將當前時間輸出給所述主控單元。
11、 如權(quán)利要求2或3所述的媒體播放器,其特征在于,所述音樂情感分類單元進一步按照預(yù)設(shè)的行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系對媒體文件進行分類;其中,所述行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系是按照人類在不同行為狀 態(tài)下對'g理的需求和音樂對'"、理影響之間的相關(guān)性建立的。
12、 一種媒體文件的分類播放方法,其特征在于,包括 對媒體文件進行音頻解碼得到音頻數(shù)據(jù);對解碼后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感類別進 行分類;根據(jù)用戶輸入的類別選擇指令,調(diào)取媒體文件庫中與該指令所表示類別相 同的媒體文件用以播放。
13、 如權(quán)利要求12所述的分類播放方法,其特征在于,所述對解碼后的音 頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感類別進行分類包括從音頻數(shù)據(jù)中提取各種音樂基本元素,將提取出的音樂基本元素作為分析 結(jié)果;將所述分析結(jié)果與預(yù)設(shè)心理模型進行匹配,得到與媒體文件標識表示的媒 體文件匹配的心理模型,將匹配的心理模型作為該媒體文件所屬的情感類別, 與對應(yīng)的媒體文件標識一起輸出。
14、 如權(quán)利要求12所述的分類播放方法,其特征在于,所述對解碼后的音 頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感類別進行分類包括從音頻數(shù)據(jù)中提取簡單特征; 根據(jù)預(yù)先計算得到的參數(shù),對接收到的簡單特征進行分析,得到該簡單特 征對應(yīng)的媒體文件所匹配的心理模型,并將匹配的心理模型作為該媒體文件所 屬的情感類別,與對應(yīng)媒體文件標識一起輸出。
15、 如權(quán)利要求13或14所述的分類播放方法,其特征在于,所述將匹配 的心理模型作為該媒體文件所屬的情感類別,與對應(yīng)媒體文件標識一起輸出之后,該方法進一步包括存儲媒體文件所匹配的情感類別。
16、 如權(quán)利要求13或14所述的分類播放方法,其特征在于,該方法進一 步包括設(shè)置所述心理模型與所述媒體文件的相關(guān)度;在播放媒體文件時,將當前播的媒體文件與其匹配的心理模型的相關(guān)度顯 示輸出。
17、 如權(quán)利要求13所述的媒體播放器,其特征在于,所述音樂基本元素包 括音樂的速度、力度、節(jié)奏、旋律、音色。
18、 如權(quán)利要求13或14所述的分類播放方法,其特征在于,所述對解碼 后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感類別進行分類進一 步包括按照預(yù)設(shè)的環(huán)境類別與情感類別的對應(yīng)關(guān)系對媒體文件進行分類; 其中,所述環(huán)境類別與情感類別的對應(yīng)關(guān)系是按照環(huán)境對人類心理影響和 音樂對心理影響之間的相關(guān)性建立的。
19、 如權(quán)利要求18所述的分類播放方法,其特征在于,所述按照預(yù)設(shè)的環(huán) 境類別與情感類別的對應(yīng)關(guān)系對媒體文件進行分類之前,該方法進一步包括感測外部環(huán)境的環(huán)境參數(shù);根據(jù)所述環(huán)境參數(shù)與環(huán)境類別的對應(yīng)關(guān)系,查找與感測到的環(huán)境參數(shù)所匹 配的環(huán)境類別。
20、 如權(quán)利要求13或14所述的分類播放方法,其特征在于,所述對解碼 后的音頻數(shù)據(jù)進行情感分析,根據(jù)分析結(jié)果并按預(yù)設(shè)的情感類別進行分類進一 步包括按照預(yù)設(shè)的行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系對媒體文件進行分類; 其中,所述行為狀態(tài)類別與情感類別的對應(yīng)關(guān)系是按照人類在不同行為狀 態(tài)下對心理的需求和音樂對心理影響之間的相關(guān)性建立的。
全文摘要
本發(fā)明提供了一種實現(xiàn)分類播放的媒體播放器和一種媒體文件的分類播放方法。本發(fā)明根據(jù)用戶輸入的指令,將該指令對應(yīng)類別的各媒體文件進行音頻解碼并播放。例如,用戶可根據(jù)其當前的心情、其當前所處環(huán)境、其當前行為狀態(tài),輸入相應(yīng)的指令,表示其希望聽到不同舒緩度、激情度等類別的音樂,媒體播放器即可根據(jù)該指令播放符合用戶需求的媒體文件,滿足了用戶對媒體播放的多樣化需求,從而能夠提高媒體播放的實用性。
文檔編號G11B20/10GK101149950SQ20071017743
公開日2008年3月26日 申請日期2007年11月15日 優(yōu)先權(quán)日2007年11月15日
發(fā)明者黨寧娜, 律 謝 申請人:北京中星微電子有限公司