一種專輯分類方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及多媒體技術(shù)領(lǐng)域,特別涉及一種專輯分類方法和裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的發(fā)展,視頻的影響力正在逐步增強(qiáng),互聯(lián)網(wǎng)上的視頻數(shù)量也與日倶增。為了便于查找和觀看,一些視頻網(wǎng)站提供了將多個(gè)相關(guān)視頻制作成一個(gè)音、視頻專輯的形式的方法,專輯即為多個(gè)音頻和/或視頻的集合,用戶只要找到這個(gè)音、視頻專輯,就可以觀看該音、視頻專輯中的全部視頻,而不需要分別另外查找。
[0003]但是隨著音、視頻專輯數(shù)量的增加,音、視頻專輯名稱和標(biāo)簽重復(fù)的現(xiàn)象不可避免,因此當(dāng)某個(gè)用戶需要查找某個(gè)音、視頻專輯時(shí),結(jié)果中往往出現(xiàn)大量的同名音、視頻專輯,讓用戶無(wú)從選擇。更有甚者,由于專輯名相同,可能導(dǎo)致不同歌手、風(fēng)格完全不同的同名專輯被分類在同一類別下,這為使用者搜尋音視頻造成了不便。
[0004]隨著電子產(chǎn)業(yè)的蓬勃發(fā)展,電腦運(yùn)算或存取的速度以及所能儲(chǔ)存的數(shù)據(jù)量也不斷地提高。而倘若儲(chǔ)存的專輯未進(jìn)行分類,使用者需在龐大的數(shù)據(jù)中搜尋想要觀看的專輯,如此一來(lái)相當(dāng)不便。因此,在現(xiàn)有技術(shù)中,使用者多利用手動(dòng)方式來(lái)確定專輯的類別,以人工分類的方法,將專輯逐一分類至目錄中。
[0005]然而,現(xiàn)有技術(shù)中的專輯分類方法,不僅相當(dāng)耗費(fèi)時(shí)間,而且倘若使用者欲更改其分類方式,則重新分類時(shí)勢(shì)必又要花上許多時(shí)間。因此,現(xiàn)有技術(shù)中缺少一種快速、有效的專輯分類方法,以實(shí)現(xiàn)種類龐雜的音視頻專輯進(jìn)行自動(dòng)分類的目的。
【發(fā)明內(nèi)容】
[0006]本發(fā)明提供一種專輯分類方法和裝置,用以對(duì)專輯內(nèi)的音視頻文件屬性進(jìn)行區(qū)分和判斷,實(shí)現(xiàn)對(duì)專輯進(jìn)行快速類別判定的目的。
[0007]本發(fā)明提供一種專輯分類方法,包括:
[0008]步驟A:獲取待分類專輯中的全部音視頻文件,提取所述全部音視頻文件的標(biāo)題和關(guān)鍵詞,所述關(guān)鍵詞用于標(biāo)識(shí)各個(gè)音視頻文件的語(yǔ)言類型、音樂(lè)類型及演唱者;
[0009]步驟B:對(duì)所述全部音視頻文件的標(biāo)題和關(guān)鍵詞進(jìn)行分詞操作,獲取分詞后的分解標(biāo)題和分解關(guān)鍵詞;
[0010]步驟C:將所述分詞后的分解標(biāo)題和分解關(guān)鍵詞按照詞義特征進(jìn)行聚類操作;
[0011]步驟D:將最大聚類量對(duì)應(yīng)的詞義特征作為所述待分類專輯的類別屬性,根據(jù)得出的類別屬性確定所述待分類專輯的類別并對(duì)其進(jìn)行歸類。
[0012]本發(fā)明實(shí)施例的一些有益效果可以包括:
[0013]該實(shí)施例首先通過(guò)獲取待分類的專輯中的全部音視頻文件,并提取音視頻文件的標(biāo)題和關(guān)鍵詞,標(biāo)題可以是音視頻文件的文件名或?qū)]嬅?,關(guān)鍵詞的作用為標(biāo)識(shí)不同音視頻文件的語(yǔ)言類型(如中文或英文)、音樂(lè)類型(如流行樂(lè)、民俗、搖滾等)、演唱者信息等。然后對(duì)標(biāo)題和關(guān)鍵詞進(jìn)行分詞,并對(duì)分詞后的分解標(biāo)題和分解關(guān)鍵詞進(jìn)行聚類操作,該聚類操作可以是根據(jù)分解標(biāo)題和/或分解關(guān)鍵詞的屬性或類別,例如10個(gè)音視頻文件中,有6個(gè)分解標(biāo)題和/或分解關(guān)鍵詞中包含“王菲”,則以“王菲”作為該10個(gè)音視頻文件組成的專輯的類別屬性,將該專輯分類到王菲類別中。通過(guò)本實(shí)施例的方法,能夠快速確定該專輯的類別屬性,且易于操作,提高了專輯分類的工作效率。
[0014]在一個(gè)實(shí)施例中,還包括:
[0015]步驟E:遍歷專輯內(nèi)的全部音視頻文件,獲取所述音樂(lè)專輯內(nèi)已有音軌號(hào)音視頻文件的音軌號(hào),所述音軌號(hào)用于標(biāo)識(shí)音視頻文件在專輯中的順序;
[0016]步驟F:將預(yù)先設(shè)定的備選音軌號(hào)中與所獲取音軌號(hào)相同的音軌號(hào)去除,得到可用音軌號(hào);
[0017]步驟G:從所述可用音軌號(hào)中確定所述專輯內(nèi)未有音軌號(hào)音視頻文件的音軌號(hào),并將所確定的音軌號(hào)分配給未有音軌號(hào)的音視頻文件;
[0018]步驟H:根據(jù)所述步驟G中的音軌號(hào)分配結(jié)果對(duì)全部音視頻文件進(jìn)行排序。
[0019]該實(shí)施例通過(guò)獲取專輯內(nèi)所有音視頻文件的音軌號(hào),其中音軌號(hào)的作用是為了標(biāo)注各個(gè)音視頻文件在專輯中的順序。例如在專輯的全部10個(gè)音視頻文件中,其中8個(gè)均有自己的音軌號(hào),簡(jiǎn)單表示為1、2、3、4、5、6、8、10,將上述各音軌號(hào)與預(yù)先設(shè)定的備選音軌號(hào)進(jìn)行比對(duì),得到可用的音軌號(hào),例如可以是與上述各音軌號(hào)不重復(fù)的音軌號(hào)。然后將可用的音軌號(hào)(如7、9)分配給專輯內(nèi)沒(méi)有音軌號(hào)的2個(gè)音視頻文件,最后根據(jù)全部10個(gè)音視頻文件的音軌號(hào)對(duì)10個(gè)音視頻文件進(jìn)行排序。本實(shí)施例的方法能夠?qū)]媰?nèi)雜亂無(wú)章的音視頻文件進(jìn)行排列,便于用于根據(jù)需求進(jìn)行提取。
[0020]在一個(gè)實(shí)施例中,在所述步驟B之后還包括:
[0021]步驟1:預(yù)先設(shè)置上下位詞庫(kù),所述上下位詞庫(kù)包含多個(gè)上位詞及分別與所述多個(gè)上位詞對(duì)應(yīng)的下位詞;
[0022]步驟J:將所述分詞后的分解標(biāo)題和分解關(guān)鍵詞與所述上下位詞庫(kù)進(jìn)行匹配,判斷所述分解標(biāo)題和所述分解關(guān)鍵詞是否存在上位詞;
[0023]步驟K:根據(jù)步驟J中的判斷結(jié)果分別進(jìn)行聚類操作。
[0024]該實(shí)施例為根據(jù)音視頻文件的標(biāo)題和/或關(guān)鍵詞進(jìn)行聚類操作的優(yōu)選方法,還可以預(yù)先設(shè)置上下位詞庫(kù),在進(jìn)行分詞操作后,將分詞后的分解標(biāo)題和/或分解關(guān)鍵詞與上下位詞庫(kù)進(jìn)行比對(duì),如果分解標(biāo)題和/或分解關(guān)鍵詞存在上位詞,還可以根據(jù)該上位詞進(jìn)行聚類操作。該實(shí)施例的方法充分考慮到了對(duì)于音視頻文件的標(biāo)題和/或關(guān)鍵詞有關(guān)聯(lián)的相關(guān)詞,并將相關(guān)詞也作為聚類操作的依據(jù),因此,該聚類操作后的詞義特征劃分更加準(zhǔn)確,為確定專輯的類別屬性提供了更加準(zhǔn)確的判斷依據(jù)。
[0025]在一個(gè)實(shí)施例中,所述步驟K具體包括:
[0026]當(dāng)所述分解標(biāo)題和所述分解關(guān)鍵詞分別具有不同的上位詞時(shí),分別對(duì)所述不同的上位詞進(jìn)行聚類操作;
[0027]當(dāng)所述分解標(biāo)題和所述分解關(guān)鍵詞具有相同的上位詞時(shí),對(duì)所述相同的上位詞進(jìn)行聚類操作;
[0028]當(dāng)所述分解標(biāo)題和所述分解關(guān)鍵詞其中之一具有上位詞時(shí),對(duì)該上位詞和不具有上位詞的分解標(biāo)題或分解關(guān)鍵詞進(jìn)行聚類操作;
[0029]當(dāng)所述分解標(biāo)題和所述分解關(guān)鍵詞均不具有上位詞時(shí),分別對(duì)所述分解標(biāo)題和所述分解關(guān)鍵詞進(jìn)行聚類操作。
[0030] 該實(shí)施例主要對(duì)分解標(biāo)題和/或分解關(guān)鍵詞存在上位詞的情形下,如何確定分類操作的依據(jù)進(jìn)行限定。如果二者具有相同的上位詞,則表明二者具有共同的上位詞的詞義特征,則直接以該上位詞進(jìn)行聚類操作即可;如果二者之中僅有一個(gè)存在上位詞,則可以同時(shí)以上位詞和無(wú)上位詞的分解標(biāo)題或分解關(guān)鍵詞作為聚類操作的依據(jù);如果二者均沒(méi)有上位詞,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)了解,只能以二者作為聚類操作的依據(jù)。該實(shí)施例的方法對(duì)于在判斷分解標(biāo)題和/或分解關(guān)鍵詞是否存在上位詞后,根據(jù)不同的判斷結(jié)果,聚類操作的依據(jù)也不同,為如何確定聚類操作的基礎(chǔ)和依據(jù)提供了解決辦法。
[0031 ] 在一個(gè)實(shí)施例中,所述步驟G具體包括:
[0032]將所述專輯內(nèi)未有音軌號(hào)的歌曲按其歌曲名標(biāo)題的首字母在字母表中的順序進(jìn)行排序;
[0033]如果存在首字母相同的未有音軌號(hào)的音視頻文件,則將首字母相同且未有音軌號(hào)的音視頻文件按照其標(biāo)題首字母之后的字母在字母表中的順序進(jìn)行排序。
[0034]按照自然數(shù)順序?qū)λ隹捎靡糗壧?hào)進(jìn)行排序;
[0035]從排序后的可用音軌號(hào)中依次為排序后的未有音軌號(hào)的音視頻文件分配音軌號(hào)。
[0036]該實(shí)施例提供了一種對(duì)沒(méi)有音軌號(hào)的音視頻文件如何分配音軌號(hào)的方法,例如,沒(méi)有音軌號(hào)的音視頻文件的標(biāo)題名分別為:《匆匆那年》、《紅豆》、《致青春》,則上述各標(biāo)題名的首字母分別為C、H、I,即按照C、H、Z在字母表中的順序?qū)ι鲜鲆粢曨l文件進(jìn)行排序。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)了解,如果首字母相同,則以第2個(gè)字母在字母表中的順序進(jìn)行排序,以此類推。然后將可用的音軌號(hào)按照自然數(shù)順序依次對(duì)排序后的沒(méi)有音軌號(hào)的音視頻文件進(jìn)行分配,如7分配給匆匆那年、9分配給紅豆、11分配給致青春。該實(shí)施例對(duì)如何分配音軌號(hào)進(jìn)行詳細(xì)限定,為用戶提高了一種在專輯內(nèi)音視頻文件缺少對(duì)應(yīng)音軌號(hào)時(shí)的分配解決辦法,以便于根據(jù)音軌號(hào)對(duì)音視頻文件進(jìn)行排序。
[0037]—種專輯分類裝置,包括:
[0038]信息獲取模塊,用于獲取待分類專輯中的全部音視頻文件,提取所述全部音視頻文件的標(biāo)題和關(guān)鍵詞,所述關(guān)鍵詞用于標(biāo)識(shí)各個(gè)音視頻文件的語(yǔ)言類型、音樂(lè)類型及演唱者;
[0039]分詞操作模塊,用于對(duì)所述全部音視頻文件的標(biāo)題和關(guān)鍵詞進(jìn)行分詞操作,獲取分詞后的分解標(biāo)題和分解關(guān)鍵詞;
[0040]聚類操作模塊,用于將所述分詞后的分解標(biāo)題和分