亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種音頻分類方法及裝置制造方法

文檔序號:2826145閱讀:295來源:國知局
一種音頻分類方法及裝置制造方法
【專利摘要】本發(fā)明實施例提供一種音頻分類方法及裝置,其中的方法可包括:對待分類的音頻文件進(jìn)行Pitch檢測,獲得所述音頻文件的Pitch序列;根據(jù)所述Pitch序列,查找所述音頻文件的主音;根據(jù)所述音頻文件的主音,對所述音頻文件進(jìn)行調(diào)式檢測以確定所述音頻文件的類別。本發(fā)明可降低音頻文件的分類成本,提高分類效率,提升智能性。
【專利說明】一種音頻分類方法及裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,具體涉及音頻處理【技術(shù)領(lǐng)域】,尤其一種音頻文件分 類方法及裝置。

【背景技術(shù)】
[0002] 調(diào)式(Mode)指若干高低不同的樂音,圍繞某一有穩(wěn)定感的中心音,按照一定音程 關(guān)系組織在一起,成為一個有機的體系,該體系即稱為調(diào)式,該中心音即稱為主音。音頻文 件可以根據(jù)調(diào)式劃分為大調(diào)式類別和小調(diào)式類別,通常,大調(diào)式類別的音頻文件色彩明亮、 歡快激進(jìn);小調(diào)式類別的音頻文件柔和暗淡。目前,傳統(tǒng)的對音頻文件的分類通常為人工方 式,即需要人工收聽音頻文件的內(nèi)容,以確定音頻文件的類別;此種分類方式的人力資源成 本較高、分類效率較低、智能性較低。


【發(fā)明內(nèi)容】

[0003] 本發(fā)明實施例提供一種音頻分類方法及裝置,可降低音頻文件的分類成本,提高 分類效率,提升智能性。
[0004] 本發(fā)明第一方面提供一種音頻分類方法,可包括:
[0005] 對待分類的音頻文件進(jìn)行Pitch (音高)檢測,獲得所述音頻文件的Pitch序列;
[0006] 根據(jù)所述Pitch序列,查找所述音頻文件的主音;
[0007] 根據(jù)所述音頻文件的主音,對所述音頻文件進(jìn)行調(diào)式檢測以確定所述音頻文件的 類別。
[0008] 本發(fā)明第二方面提供一種音頻分類裝置,可包括:
[0009] 音高檢測模塊,用于對待分類的音頻文件進(jìn)行Pitch檢測,獲得所述音頻文件的 Pitch序列;
[0010] 主音查找模塊,用于根據(jù)所述Pitch序列,查找所述音頻文件的主音;
[0011] 分類模塊,用于根據(jù)所述音頻文件的主音,對所述音頻文件進(jìn)行調(diào)式檢測以確定 所述音頻文件的類別。
[0012] 實施本發(fā)明實施例,具有如下有益效果:
[0013] 本發(fā)明實施例可通過對待分類的音頻文件進(jìn)行音高檢測、查找主音以及調(diào)式檢 測,自動進(jìn)行音頻文件的類別確定,避免了人工方式所帶來的資源耗費,降低了音頻文件的 分類成本,有效地提高了分類效率,提升了智能性。

【專利附圖】

【附圖說明】
[0014] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0015] 圖1為本發(fā)明實施例提供的一種音頻分類方法的流程圖;
[0016] 圖2為圖1所示的步驟S101的具體流程圖;
[0017] 圖3為圖1所示的步驟S102的具體流程圖;
[0018] 圖4為圖1所示的步驟S103的具體流程圖;
[0019]圖5為本發(fā)明實施例提供的一種音頻分類裝置的結(jié)構(gòu)示意圖;
[0020] 圖6為圖5所示的音高檢測模塊的實施例的結(jié)構(gòu)示意圖;
[0021] 圖7為圖6所示的預(yù)處理單元的實施例的結(jié)構(gòu)示意圖;
[0022] 圖8為圖5所示的主音查找模塊的實施例的結(jié)構(gòu)示意圖;
[0023] 圖9為圖5所示的分類模塊的實施例的結(jié)構(gòu)示意圖;
[0024] 圖10為圖9所示的分類單元的實施例的結(jié)構(gòu)示意圖。

【具體實施方式】
[0025] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于 本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護(hù)的范圍。
[0026] 本發(fā)明實施例中,音頻文件可以包括但不限于:歌曲、歌曲片段、清唱歌曲、清唱歌 曲片段、音樂、音樂片段、演奏樂、演奏樂片段等文件。本發(fā)明實施例的音頻分類方案可以應(yīng) 用于互聯(lián)網(wǎng)領(lǐng)域的多個場景中,例如:可以應(yīng)用于對互聯(lián)網(wǎng)音頻庫中的音頻文件添加智能 標(biāo)簽的場景;或者,可以應(yīng)用于對互聯(lián)網(wǎng)音頻庫中的音頻文件進(jìn)行歸類管理的場景;或者, 可以應(yīng)用于對未知的音頻文件進(jìn)行分類的場景;或者,可應(yīng)用于音頻文件的分類搜索,以提 升搜索的效率和匹配度的場景;或者,可應(yīng)用于基于類別進(jìn)行音頻文件的推薦的場景,等 等。
[0027] 下面將結(jié)合附圖1-附圖4,對本發(fā)明實施例提供的音頻文分類方法進(jìn)行詳細(xì)介 紹。需要說明的是,附圖1-附圖4所示的音頻分類方法可以由本發(fā)明實施例提供的音頻分 類裝置所執(zhí)行,該音頻分類裝置可運行于終端設(shè)備或服務(wù)器中,其中,終端設(shè)備可包括但不 限于:PC (Personal Computer,個人計算機)、PAD (平板電腦)、手機、智能手機、筆記本電腦 等設(shè)備。
[0028] 請參見圖1,為本發(fā)明實施例提供的一種音頻分類方法的流程圖;該方法可包括 以下步驟S101-步驟S103。
[0029] S101,對待分類的音頻文件進(jìn)行Pitch檢測,獲得所述音頻文件的Pitch序列。
[0030] 其中,Pitch (音高)指各種不同高低的聲音,即音的高度,音的基本特征的一種。 一個音頻文件可以表示為多幀音頻幀信號組成的一個幀序列。本步驟中,對待分類的音頻 文件進(jìn)行Pitch檢測,可以為對該音頻文件的每一幀音頻幀信號進(jìn)行Pitch檢測,獲得該音 頻文件的每一巾貞音頻巾貞信號的Pitch值,從而構(gòu)建該音頻文件的Pitch序列。
[0031] S102,根據(jù)所述Pitch序列,查找所述音頻文件的主音。
[0032] 音頻文件均包含調(diào)式,調(diào)式指若干高低不同的樂音,圍繞某一有穩(wěn)定感的中心音, 按照一定音程關(guān)系組織在一起,成為一個有機的體系,該體系即稱為調(diào)式,該中心音即稱為 主音(Key)。Key屬于音頻文件的調(diào)式中的核心音,調(diào)式中的其他音或圍繞著Key,或支撐著 Key,或靠近Key。本步驟中,可基于音頻文件的Pitch序列,查找該音頻文件的Key。
[0033] S103,根據(jù)所述音頻文件的主音,對所述音頻文件進(jìn)行調(diào)式檢測以確定所述音頻 文件的類別。
[0034] 由于Key屬于音頻文件的調(diào)式中的核心音,調(diào)式中的其他音或圍繞著Key,或支撐 著Key,或靠近Key。本步驟中,基于音頻文件的Key可對該音頻文件進(jìn)行調(diào)式檢測,確定音 頻文件的調(diào)式,從而確定音頻文件的類別。其中,音頻文件的調(diào)式可以包括大調(diào)式或小調(diào) 式,音頻文件的類別可以包括大調(diào)式類別和小調(diào)式類別。通常,大調(diào)式類別的音頻文件色彩 明亮、歡快激進(jìn);小調(diào)式類別的音頻文件柔和暗淡。
[0035] 下面將結(jié)合附圖2-附圖4,對圖1所示的音頻分類方法中的各步驟進(jìn)行詳細(xì)介紹。
[0036] 請參見圖2,為圖1所示的步驟S101的具體流程圖;該步驟S101可包括以下步驟 sll01-sll04。
[0037] sllOl,對所述音頻文件的每一幀音頻幀信號進(jìn)行預(yù)處理。
[0038] 本發(fā)明實施例中,設(shè)定所述音頻文件包含Μ幀音頻幀信號,Μ為正整數(shù),則該音頻 文件包含的任一巾貞音頻巾貞信號可表不為Xi (η),其中,i表不所述音頻文件中該巾貞音頻巾貞信 號的順序,i為正整數(shù)且i = 1,2,... Μ ;n為正整數(shù)且η = 0, 1,2, N-1,其中N為該幀音頻幀 信號的長度,即Ν為該幀音頻幀信號的采樣點數(shù)。本步驟對Xi (η)的預(yù)處理過程可包括以 下Α-Β兩個步驟:
[0039] Α、將所述音頻文件的每一巾貞音頻巾貞信號進(jìn)行加窗處理。
[0040] 步驟Α可采用矩形窗函數(shù)據(jù)ω (η)對\ (η)進(jìn)行加窗處理,加窗處理后的每一幀 音頻幀信號可表示為如下公式(1):
[0041] Xj ω (η) = ω (η) (η) (1)
[0042] Β、對所述加窗處理后的每一幀音頻幀信號進(jìn)行帶通濾波處理。
[0043] 步驟Β中,采用bpf (η)表示帶通濾波器,該帶通濾波器的下截止頻率可表示為wl, 上截止頻率可表示為wh。對加窗處理后的每一幀音頻幀信號 Xic〇 (n)進(jìn)行帶通濾波處理后, 可得到如下公式(2):
[0044] χ^ω (n) = Xj ω (η) · bpf (η) (2)
[0045] 上述公式(2)中," ?"表示卷積操作;優(yōu)選地,wl可設(shè)置為50,wh可設(shè)置為1500。
[0046] S1102,對所述預(yù)處理后的每一幀音頻幀信號進(jìn)行自相關(guān)計算,獲得所述音頻文件 的每一幀音頻幀信號的自相關(guān)函數(shù)。

【權(quán)利要求】
1. 一種音頻分類方法,其特征在于,包括: 對待分類的音頻文件進(jìn)行音高Pitch檢測,獲得所述音頻文件的Pitch序列; 根據(jù)所述Pitch序列,查找所述音頻文件的主音; 根據(jù)所述音頻文件的主音,對所述音頻文件進(jìn)行調(diào)式檢測以確定所述音頻文件的類 別。
2. 如權(quán)利要求1所述的方法,其特征在于,所述對待分類的音頻文件進(jìn)行Pitch檢測, 獲得所述音頻文件的Pitch序列,包括: 對所述音頻文件的每一幀音頻幀信號進(jìn)行預(yù)處理; 對所述預(yù)處理后的每一幀音頻幀信號進(jìn)行自相關(guān)計算,獲得所述音頻文件的每一幀音 頻幀信號的自相關(guān)函數(shù); 根據(jù)所述音頻文件的每一幀音頻幀信號的自相關(guān)函數(shù),計算所述音頻文件的每一幀音 頻幀信號的Pitch值; 按照所述音頻文件中各幀音頻幀信號的順序?qū)λ鲆纛l文件的每一幀音頻幀信號的 Pitch值進(jìn)行排列,構(gòu)建所述音頻文件的Pitch序列。
3. 如權(quán)利要求2所述的方法,其特征在于,所述對所述音頻文件的每一幀音頻幀信號 進(jìn)行預(yù)處理,包括: 將所述音頻文件的每一幀音頻幀信號進(jìn)行加窗處理; 對所述加窗處理后的每一幀音頻幀信號進(jìn)行帶通濾波處理。
4. 如權(quán)利要求1-3任一項所述的方法,其特征在于,所述根據(jù)所述Pitch序列,查找所 述音頻文件的主音,包括: 將所述Pitch序列轉(zhuǎn)換為樂器數(shù)字接口 MIDI序列; 根據(jù)所述MIDI序列包含的樂器數(shù)字以及每個樂器數(shù)字的出現(xiàn)頻率,生成統(tǒng)計序列; 將所述統(tǒng)計序列中的出現(xiàn)頻率最大的樂器數(shù)字,確定為所述音頻文件的主音。
5. 如權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述音頻文件的主音,對所述音頻 文件進(jìn)行調(diào)式檢測以確定所述音頻文件的類別,包括: 根據(jù)大調(diào)式音階特征,設(shè)置第一矩陣; 根據(jù)小調(diào)式音階特征,設(shè)置第二矩陣; 采用所述音頻文件的主音、所述統(tǒng)計序列和所述第一矩陣,計算所述音頻文件的第一 調(diào)式特征值; 采用所述音頻文件的主音、所述統(tǒng)計序列和所述第二矩陣,計算所述音頻文件的第二 調(diào)式特征值; 根據(jù)所述音頻文件的第一調(diào)式特征值與所述音頻文件的第二調(diào)式特征值,確定所述音 頻文件的類別。
6. 如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述音頻文件的第一調(diào)式特征值 與所述音頻文件的第二調(diào)式特征值,確定所述音頻文件的類別,包括: 判斷所述音頻文件的第一調(diào)式特征值是否大于或等于所述音頻文件的第二調(diào)式特征 值; 如果判斷結(jié)果為是,則確定所述音頻文件的類別為大調(diào)式類別; 如果判斷結(jié)果為否,則確定所述音頻文件的類別為小調(diào)式類別。
7. -種音頻分類裝置,其特征在于,包括: 音高檢測模塊,用于對待分類的音頻文件進(jìn)行音高Pitch檢測,獲得所述音頻文件的 Pitch序列; 主音查找模塊,用于根據(jù)所述Pitch序列,查找所述音頻文件的主音; 分類模塊,用于根據(jù)所述音頻文件的主音,對所述音頻文件進(jìn)行調(diào)式檢測以確定所述 音頻文件的類別。
8. 如權(quán)利要求7所述的裝置,其特征在于,所述音高檢測模塊包括: 預(yù)處理單元,用于對所述音頻文件的每一幀音頻幀信號進(jìn)行預(yù)處理; 自相關(guān)計算單元,用于對所述預(yù)處理后的每一幀音頻幀信號進(jìn)行自相關(guān)計算,獲得所 述音頻文件的每一幀音頻幀信號的自相關(guān)函數(shù); 音高計算單元,用于根據(jù)所述音頻文件的每一幀音頻幀信號的自相關(guān)函數(shù),計算所述 音頻文件的每一幀音頻幀信號的Pitch值; 序列構(gòu)建單元,用于按照所述音頻文件中各幀音頻幀信號的順序?qū)λ鲆纛l文件的每 一幀音頻幀信號的Pitch值進(jìn)行排列,構(gòu)建所述音頻文件的Pitch序列。
9. 如權(quán)利要求8所述的裝置,其特征在于,所述預(yù)處理單元包括: 加窗處理子單元,用于將所述音頻文件的每一幀音頻幀信號進(jìn)行加窗處理; 濾波處理子單元,用于對所述加窗處理后的每一幀音頻幀信號進(jìn)行帶通濾波處理。
10. 如權(quán)利要求7-9任一項所述的裝置,其特征在于,所述主音查找模塊包括: 轉(zhuǎn)換單元,用于將所述Pitch序列轉(zhuǎn)換為樂器數(shù)字接口 MIDI序列; 統(tǒng)計序列生成單元,用于根據(jù)所述MIDI序列包含的樂器數(shù)字以及每個樂器數(shù)字的出 現(xiàn)頻率,生成統(tǒng)計序列; 主音確定單元,用于將所述統(tǒng)計序列中的出現(xiàn)頻率最大的樂器數(shù)字,確定為所述音頻 文件的主音。
11. 如權(quán)利要求10所述的裝置,其特征在于,所述分類模塊包括: 第一設(shè)置單元,用于根據(jù)大調(diào)式音階特征,設(shè)置第一矩陣; 第二設(shè)置單元,用于根據(jù)小調(diào)式音階特征,設(shè)置第二矩陣; 第一特征計算單元,用于采用所述音頻文件的主音、所述統(tǒng)計序列和所述第一矩陣,計 算所述音頻文件的第一調(diào)式特征值; 第二特征計算單元,用于采用所述音頻文件的主音、所述統(tǒng)計序列和所述第二矩陣,計 算所述音頻文件的第二調(diào)式特征值; 分類單元,用于根據(jù)所述音頻文件的第一調(diào)式特征值與所述音頻文件的第二調(diào)式特征 值,確定所述音頻文件的類別。
12. 如權(quán)利要求11所述的裝置,其特征在于,所述分類單元包括: 判斷子單元,用于判斷所述音頻文件的第一調(diào)式特征值是否大于或等于所述音頻文件 的第二調(diào)式特征值; 類別確定子單元,用于如果判斷結(jié)果為是,則確定所述音頻文件的類別為大調(diào)式類別; 或者,用于如果判斷結(jié)果為否,則確定所述音頻文件的類別為小調(diào)式類別。
【文檔編號】G10L15/08GK104091594SQ201310358878
【公開日】2014年10月8日 申請日期:2013年8月16日 優(yōu)先權(quán)日:2013年8月16日
【發(fā)明者】趙偉峰 申請人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1