專利名稱:音樂剖析的制作方法
技術領域:
本發(fā)明涉及創(chuàng)建包含音頻文件的庫(例如,用戶庫)的概況(profile)并使用這些概況來向用戶推薦基于音頻的內容的方法。
背景技術:
音樂服務系統(tǒng)與基于音頻的內容(例如,音樂、電影、“播客(podcast)”等)的下載一起使用,以在包括個人計算機、便攜式電子音樂播放器(例如,MP3播放器、iPod等) 的電子裝置中進行播放。音樂服務系統(tǒng)通常使得用戶能夠預覽和購買基于音頻的內容。這些音樂服務系統(tǒng)還可以向用戶推薦用戶可能有興趣購買的其它的基于音頻的內容。通常根據(jù)特定的基于音頻的文件(例如,用戶先前已經購買的或者當前正在音樂服務系統(tǒng)上觀看或者“測試”的歌曲、電影、或者播客)來進行這些推薦。例如,如果用戶已經購買了 U2的 ((Where the Streets Have No Name》,則該系統(tǒng)可以推薦由也購買了《Where the Streets Have No Name》的其它用戶購買的其它歌曲。音樂服務系統(tǒng)還可以基于與歌曲關聯(lián)的元數(shù)據(jù)(metadata)來進行推薦。例如,歌曲的音頻文件可以包括指示特定風格(genre)的元數(shù)據(jù)。該音樂服務系統(tǒng)可以向用戶推薦來自與該用戶購買的歌曲相同風格的歌曲。
發(fā)明內容
根據(jù)本發(fā)明的一個方面,提供了一種創(chuàng)建包含音頻內容的庫的概況的方法。在一個方面中,該方法包括以下步驟獲得所述庫中的各個音頻文件的指紋(fingerprint),音頻文件的所述指紋是與所述音頻文件關聯(lián)的聲音數(shù)據(jù)、與所述音頻文件關聯(lián)的非聲音文件、或者它們的組合的代表;以及確定所述庫的指紋,庫指紋是所述庫中的多個音頻文件的所述指紋的合成(composite)。根據(jù)另一方面,所述音頻文件是歌曲文件。根據(jù)另一方面,音頻文件的所述指紋包括與所述音頻文件關聯(lián)的非聲音元數(shù)據(jù)。根據(jù)另一方面,所述庫指紋代表所述庫的音樂概況。所述音樂概況可以是用戶的音樂概況。根據(jù)另一方面,音頻文件的所述指紋是基于所述聲音數(shù)據(jù)的十二音分析(twelve tone analysis)的0根據(jù)另一方面,確定所述庫指紋的步驟包括以下步驟對所述庫中的所述音頻文件的所述指紋求平均。根據(jù)另一方面,確定所述庫指紋的步驟包括以下步驟確定所述庫中的所述音頻文件的指紋的加權合成。根據(jù)另一方面,確定所述音頻文件的指紋的所述加權合成的步驟包括以下步驟 評估與(i)各個音頻文件、( )所述庫、或者(i)和(ii)關聯(lián)的聲音數(shù)據(jù)和非聲音元數(shù)據(jù)。根據(jù)另一方面,所述非聲音元數(shù)據(jù)是風格、活動、位置、時間段、所述音頻文件在所述庫中的占位符(placeholder)、所述音頻文件的平均播放位置、所述音頻文件的播放計數(shù)值、所述音頻文件的平均播放時間或者其中兩個或者更多個的組合。根據(jù)另一方面,所述基于音頻的庫包括存儲在電子裝置上的全部所述音頻文件, 并且所述概況代表總體的基于音頻的概況。根據(jù)另一方面,所述基于音頻的庫是所述整個庫的包含比存儲在所述電子裝置上的全部音頻文件少的音頻文件的子集。根據(jù)另一方面,提供了一種推薦包含在存儲在系統(tǒng)上的音頻文件數(shù)據(jù)庫中的基于音頻的內容的方法。該方法包括以下步驟獲得具有多個音頻文件的用戶庫的指紋,庫指紋是所述庫中的各個音頻文件的指紋的合成;比較所述用戶的庫指紋與所述音頻文件數(shù)據(jù)庫中的所述音頻文件的所述指紋;以及從所述音頻文件數(shù)據(jù)庫中選擇至少一個音頻文件來推薦給用戶,所述選擇的至少一個音頻文件具有在預定容限內與所述用戶的指紋相似的指紋。根據(jù)另一方面,所述音頻文件是歌曲文件。根據(jù)另一方面,獲得所述庫的指紋的步驟包括以下步驟從用戶獲得庫指紋。根據(jù)另一方面,獲得所述庫的指紋的步驟包括所述系統(tǒng)通過以下步驟來獲得指紋⑴獲得用戶庫中的歌曲的列表,(ii)確定所述庫中的各個歌曲的指紋,以及(iii)確定所述庫的指紋。根據(jù)另一方面,(i)所述比較操作包括以下步驟比較所述用戶的庫指紋與所述數(shù)據(jù)庫中的至少一個數(shù)據(jù)庫的庫的指紋,所述至少一個數(shù)據(jù)庫的庫包括來自所述音頻文件數(shù)據(jù)庫的多個歌曲,(ii)所述選擇操作包括以下步驟選擇具有與所述用戶的庫指紋相似的指紋的至少一個數(shù)據(jù)庫的庫,以及(iii)所述推薦操作包括以下步驟向用戶推薦來自所述數(shù)據(jù)庫的庫的至少一個歌曲。根據(jù)本發(fā)明的另一方面,一種電子裝置包括存儲器;存儲在所述存儲器中的多個音頻文件;包含多個所述音頻文件的庫;以及處理器,該處理器執(zhí)行邏輯以執(zhí)行以下步驟獲得所述庫中的各個音頻文件的指紋,所述指紋是與相應的音頻文件關聯(lián)的聲音數(shù)據(jù)、 與相應的音頻文件關聯(lián)的非聲音文件、或者它們的組合的代表;以及確定所述庫的指紋,庫指紋是所述庫中的多個音頻文件的所述指紋的合成。根據(jù)另一方面,所述處理器還執(zhí)行邏輯以向具有音頻文件數(shù)據(jù)庫的系統(tǒng)發(fā)送所述庫指紋以用于推薦基于音頻的內容。根據(jù)另一方面,所述處理器還執(zhí)行邏輯以從具有音頻文件數(shù)據(jù)庫的所述系統(tǒng)接收基于音頻的內容的推薦。根據(jù)另一方面,所述裝置是便攜式通信裝置。根據(jù)另一方面,所述裝置是移動電話。根據(jù)本發(fā)明的另一方面,一種音頻服務系統(tǒng)包括存儲裝置;至少一個音頻文件數(shù)據(jù)庫;以及音頻概況服務器,該音頻概況服務器包含用于比較存儲在所述至少一個音頻文件數(shù)據(jù)庫中的音頻文件的指紋與包含多個音頻文件的庫的指紋的應用,庫指紋代表所述庫中的所述音頻文件的合成。本發(fā)明的另一方面涉及一種存儲在機器可讀介質上的程序,所述程序適合用于電子裝置,其中,所述程序被加載到所述電子裝置中的存儲器中并被執(zhí)行,以使得所述電子裝置執(zhí)行以下步驟獲得包括多個音頻文件的庫中的各個音頻文件的指紋,音頻文件的所述
5指紋是與所述音頻文件關聯(lián)的聲音數(shù)據(jù)的代表;以及確定所述庫的指紋,所述庫指紋是所述庫中的各個音頻文件的所述指紋的合成。本發(fā)明的另一方面涉及一種存儲在機器可讀介質上的程序,其中,所述程序被加載到系統(tǒng)中的存儲器中并被執(zhí)行,以使得所述系統(tǒng)執(zhí)行以下步驟獲得具有多個音頻文件的用戶庫的指紋,庫指紋是所述庫中的各個音頻文件的指紋的合成;比較所述用戶的庫指紋與存儲在所述系統(tǒng)中的音頻文件數(shù)據(jù)庫中的至少一個音頻文件的所述指紋;以及從所述音頻文件數(shù)據(jù)庫中選擇至少一個音頻文件來推薦給用戶,所述選擇的至少一個音頻文件具有在預定容限內與所述用戶的指紋相似的指紋。本發(fā)明的這些和其它特征將參照以下描述和附圖而變得明顯。在這些描述和附圖中,已經詳細公開了本發(fā)明的具體實施方式
,作為可以采用本發(fā)明的原理的一些方法的指示,但是應當理解,本發(fā)明并不相應地在范圍方面被限制。相反,本發(fā)明包括在所附的權利要求的精神和條款內的全部改變、修改和等同物。針對一個實施方式描述或者例示的特征可以在一個或者更多個其它實施方式中以相同方式或者以類似方式使用和/或結合或者代替其它實施方式的特征來使用。應當強調,術語“包括(comprises) /包含(comprising) ”在用于本說明書時是用來指定所陳述的特征、整體、步驟或者組件的存在,但是不排除一個或者更多個特征、整體、 步驟、組件或者它們的組合。
參照附圖將更好地理解本發(fā)明的方面。附圖的組件不必按照比例(scale),相反, 所強調的重點清楚地例示本發(fā)明的原理。同樣地,一個附圖中的元件和特征可以與其它附圖中描繪的元件和特征組合。而且,類似的附圖標記在全部多個附圖中指定對應的部分。盡管這些圖示或流程圖可以示出執(zhí)行功能邏輯塊的特定順序,但是這些塊的執(zhí)行順序可以相對于所示出的順序改變。并且,連續(xù)示出的兩個或者更多個塊可以并行地或者部分并行地執(zhí)行。還可以省略特定的塊。另外,任意數(shù)量的命令、狀態(tài)變量、信號、或者消息可以被添加到邏輯流程中,以用于增強的功用(utility)、利益(accounting)、性能、測量、 故障檢修(troubleshooting)等的目的。應當理解,所有這些變化在本發(fā)明的范圍以內。圖1是適用于執(zhí)行所公開的方法的方面的系統(tǒng)和組件的示意性例示;圖2是根據(jù)本發(fā)明的方面的示例性電子裝置的組件的示意性例示;圖3是被示例作為用戶的音樂庫的庫結構的用戶的基于音頻的內容的庫結構的示意性例示;圖4是例示在創(chuàng)建用戶的基于音頻的庫的指紋時的示例性邏輯的示意性流程圖;圖5是示出用戶的音樂庫中包含的多個歌曲的指紋的曲線圖;以及圖6是例示在基于用戶的庫指紋向用戶推薦基于音頻的內容時的示例性邏輯的示意性流程圖。
具體實施例方式參照圖1,示出了系統(tǒng)10,該系統(tǒng)10包括適用于執(zhí)行或者實現(xiàn)用于獲得用戶的至少一個基于音頻的概況和/或用于基于用戶的所述至少一個基于音頻的概況來向用戶推薦基于音頻的內容的各個方面的組件?!盎谝纛l的概況”在本文中還可以被稱為“基于音頻的指紋”、“庫概況”、或“庫指紋”。在一些方面中,術語“基于音頻的內容”可以針對 (direct to)特定類別的基于音頻的內容,例如音樂、電影、電視節(jié)目、播客等。可互換使用的術語“電子設備”和“電子裝置”包括便攜式無線電通信設備。在下文中被稱作“移動無線電終端”的術語“便攜式無線電通信設備”包括諸如移動電話、尋呼機、 通信器的全部設備,即,電子記事本、個人數(shù)字助理(PDA)、智能電話、便攜式通信設備等。術語“便攜式通信裝置”包括任何便攜式電子設備,包括例如移動無線電終端、移動電話、移動裝置、移動終端、通信器、尋呼機、電子記事本、個人數(shù)字助理、智能電話等。術語“便攜式通信裝置”還可以包括便攜式數(shù)字音樂播放器和/或視頻顯示裝置,例如iPod 裝置、MP3播放器、DVD播放器等。在本申請中,主要在移動電話的上下文中描述本發(fā)明的方面。然而,應當理解,這些方法或者這些方法的方面不限于利用移動電話來執(zhí)行,而是可以采用包括例如計算機 (例如,圖1中的計算機84)的任何類型的電子設備。如圖1所示,系統(tǒng)10可以包括被配置為存儲和播放基于音頻的內容的電子裝置20 和用于向用戶提供基于音頻的內容的系統(tǒng)70。電子裝置20 (被例示為諸如移動電話的便攜式網絡裝置)包括被配置為使得能夠播放諸如音樂、電影、電視節(jié)目、播客等的基于音頻的內容的音頻應用60(還參見圖2~)?;谝纛l的內容可以按照音頻文件的形式被存儲在裝置或者電子設備上。音頻文件可以包括聲音數(shù)據(jù)和元數(shù)據(jù)。在一些方面中,音頻文件可以是具有視頻文件或者視頻分量的另一文件(例如,視聽文件(audio-visual file))的一部分。為了方便的目的,可以參照音樂作為基于音頻的內容來描述系統(tǒng)10和利用這些系統(tǒng)的方法。這樣,可以針對歌曲、音樂、歌曲文件、音樂文件等來描述各個組件。例如,系統(tǒng)70還可以被稱作“音頻服務系統(tǒng)”或者“音樂服務系統(tǒng)”。然而,應當理解,這是為了方便的目的, 而不是將術語“基于音頻的內容”或者術語“基于音頻的內容”所修飾的方面或者組件限制為首樂?;谝纛l的內容可以是按照諸如歌曲文件的音頻文件的形式,并且可以通過例如以下步驟被用戶從該用戶的基于音頻的內容的個人收藏(例如,光盤)中加載到電子裝置 20并存儲在該電子裝置20上將基于音頻的內容從諸如光盤的源上載到計算機;接著將基于音頻的內容從該計算機中上載到電子裝置20。還可以通過以下步驟將基于音頻的內容(諸如音樂)下載到電子裝置20上從諸如系統(tǒng)70的提供商下載基于音頻的內容。電子裝置20被例示為便攜式網絡裝置,并且可以經由互聯(lián)網15連接到系統(tǒng)70,電子裝置20可以通過諸如無線局域網(WLAN) 12的合適的通信標準來訪問互聯(lián)網15?;谝纛l的內容服務系統(tǒng)70包括應用服務器72和諸如用于存儲應用服務器72 可存取或者可使用的數(shù)據(jù)的存儲器的存儲裝置74?;谝纛l的內容服務系統(tǒng)70包括基于音頻的內容的數(shù)據(jù)庫76。數(shù)據(jù)庫76中的基于音頻的內容可以是音頻文件的形式。在一個方面中,數(shù)據(jù)庫76包括多個歌曲文件??梢曰谂c這些音頻文件關聯(lián)的各種特征或者數(shù)據(jù)來將該數(shù)據(jù)庫中的文件設置在數(shù)據(jù)庫的庫中。例如,在音樂或者歌曲的情況下,該數(shù)據(jù)庫可以包括基于特定風格、特定藝術家等的庫。當連接到音樂服務系統(tǒng)70時,用戶可以經由電子裝置20來訪問數(shù)據(jù)庫76以搜索和購買基于音頻的內容(例如,歌曲)。
參照圖1,示出了適于與所公開的方法和應用一起使用的電子裝置20。示例性實施方式中的電子裝置20被示出為便攜式網絡通信裝置(例如,移動電話),并且將被稱作移動電話20。移動電話20被示出為具有“磚狀”或者“塊狀”設計型外殼,但是應當理解,可以使用諸如翻蓋外殼或者滑蓋型外殼的其它類型的外殼而不脫離本發(fā)明的范圍。如圖1所例示,移動電話20可以包括用戶接口,該用戶接口使得用戶能夠容易地和有效地執(zhí)行一個或者更多個通信任務(例如,輸入文本、顯示文本或圖像、發(fā)送電子郵件、顯示電子郵件、接收電子郵件、識別聯(lián)系人、選擇聯(lián)系人、進行電話呼叫、接收電話呼叫等)。移動電話20包括殼體(外殼)、顯示器22、鍵區(qū)對、揚聲器沈、麥克風28和多個按鍵 30。顯示器22可以是任何合適的顯示器,包括例如液晶顯示器、發(fā)光二極管顯示器或者其它顯示器。鍵區(qū)區(qū)域M包括多個按鍵25 (通常被稱為撥號鍵、輸入鍵等)??梢岳缡謩拥鼗蛘咭云渌绞讲僮麈I區(qū)區(qū)域M中的這些按鍵以向移動電話20的電路提供輸入,例如, 以撥打電話號碼、輸入文本性輸入(諸如創(chuàng)建文本消息、創(chuàng)建電子郵件),或者輸入其它文本(例如,代碼、Pin號碼、安全ID),以利用該裝置執(zhí)行一些功能,或者執(zhí)行一些其它功能。按鍵30可以包括具有不同的相應功能的多個按鍵。例如,按鍵32可以是導航鍵、 選擇鍵、或者一些其它類型的按鍵,并且按鍵34可以是例如軟鍵或者軟開關。作為示例,導航鍵32可以用于滾動顯示在顯示器22上的列表、選擇顯示在顯示器22上的列表中的一個或者更多個項(item)等。軟開關34可以被手動地操作以執(zhí)行各種功能,諸如顯示或者列出在顯示器22上的靠近各個軟開關的那些功能。揚聲器沈、麥克風洲、顯示器22、導航鍵32和軟鍵34可以按照通常使用移動電話的通常方式來使用和起作用,例如發(fā)起、接收和 /或應答電話呼叫,發(fā)送和接收文本消息,與諸如互聯(lián)網或者一些其它網絡的網絡連接并經由該網絡執(zhí)行各種功能,在移動電話之間發(fā)送(beam)信息等。這些僅僅是各個組件的適當用途或者功能的示例,并且應當理解,還可以存在其它用途。移動電話20包括顯示器22。顯示器22向用戶顯示諸如操作狀態(tài)、時間、電話號碼、 聯(lián)系人信息、各種導航菜單、一個或者更多個功能的狀態(tài)等的信息,這樣使得用戶能夠利用移動電話20的各個特征。顯示器22還可以用于可視地顯示移動電話20可訪問的內容。所顯示的內容可以包括電子郵件消息、地理信息、日志信息、在移動電話20的存儲器41 (圖2) 中本地存儲和/或相對于移動電話20遠程(例如,在遠程存儲裝置、郵件服務器、遠程個人計算機等上)存儲的音頻和/或視頻呈現(xiàn)(presentation)、與正在通過該裝置播放的音頻內容相關的信息(例如,歌曲標題、藝術家姓名、專輯標題等)等??梢岳鐝耐ㄟ^電子郵件消息接收的多媒體文件(包括音頻和/或視頻文件)、從所存儲的基于音頻的文件或者從所接收的移動無線電和/或電視信號等得到這些呈現(xiàn)。所顯示的內容還可以是用戶輸入到該裝置的文本。可以利用移動電話20的揚聲器沈向用戶廣播音頻分量。另選地,可以通過耳機揚聲器(未示出)向用戶廣播音頻分量。裝置20可選地包括觸摸板或觸摸屏的功能。該觸摸板可以形成顯示器22的全部或者一部分,并且可以耦接到控制電路40以如傳統(tǒng)方式一樣進行操作。除了圖1所例示的那些按鍵以外的各種按鍵可以與移動電話20關聯(lián),該各種按鍵可以包括音量鍵、音頻靜音鍵、開/關電源鍵、網絡瀏覽器開啟鍵、電子郵件應用開啟鍵、相機鍵等。按鍵或類似按鍵的功能還可以被具體實現(xiàn)為與顯示器22關聯(lián)的觸摸屏。 移動電話20包括傳統(tǒng)的呼叫電路,該呼叫電路使得移動電話20能夠建立呼叫、發(fā)送和/或接收電子郵件消息、和/或與被叫/主叫裝置(通常為另一個移動電話或固定電話)交換信號。然而,該被叫/主叫裝置不必是另一個電話,而可以是一些其它裝置,諸如互聯(lián)網網絡服務器、電子郵件服務器、內容提供服務器等。參照圖2,例示了移動電話20的功能框圖。移動電話20包括主控制電路40,該主控制電路40被配置為執(zhí)行移動電話20的功能和操作的整體控制。該主控制電路40可以包括諸如CPU、微控制器或者微處理器的處理裝置42。該處理裝置42執(zhí)行存儲在控制電路 40內的存儲器(未示出)中和/或諸如存儲器41的獨立存儲器中的代碼,以執(zhí)行移動電話 20的操作。存儲器41可以是例如緩沖器、閃速存儲器、硬盤驅動器、可移動介質、易失性存儲器和/或非易失性存儲器。繼續(xù)參照圖1和圖2,移動電話20包括耦接到無線電電路46的天線36。該無線電電路46包括用于如傳統(tǒng)方式一樣經由天線36發(fā)射和接收信號的射頻發(fā)射器和接收器。 移動電話20通常利用該無線電電路46和天線36來通過蜂窩電話網絡進行語音和/或電子郵件通信。移動電話20還包括聲音信號處理電路48,用于處理由該無線電電路46發(fā)射 /從該無線電電路46接收的音頻信號。揚聲器沈和麥克風觀耦接到該聲音處理電路48, 以使得用戶能夠如傳統(tǒng)方式一樣經由移動電話20來進行聽和說。無線電電路46和聲音處理電路48各自耦接到控制電路40,以執(zhí)行整體操作。移動電話20還包括耦接到控制電路40的上述顯示器22和鍵區(qū)M。裝置20和顯示器22可選地包括觸摸板或觸摸屏的功能,該觸摸板或觸摸屏可以是顯示器22的全部或者一部分。移動電話20還包括I/O接口 50。I/O接口 50可以是按照通常的移動電話I/O 接口(諸如位于移動電話20的底部(base)的多元件連接器)的形式。通常,該I/O接口 50可以用于將移動電話20耦接到電池充電器以對移動電話20內的電源單元(PSU) 52充電。另外,或者另選地,該I/O接口 50可以用于經由數(shù)據(jù)線纜等將移動電話20連接到有線個人免提適配器、個人計算機或者其它裝置。移動電話20還可以包括用于執(zhí)行定時功能的定時器M。這些功能可以包括對呼叫和/或事件的持續(xù)時間進行定時、跟蹤呼叫和/或事件的所經過的時間、產生時間戳信息(例如,日期和時間戳)等。移動電話20可以包括各種內置附件。例如,裝置20可以包括用于拍攝數(shù)字照片的相機。與這些照片對應的圖像文件可以被存儲在存儲器41中。在一個實施方式中,移動電話20還可以包括位置數(shù)據(jù)接收器,諸如全球定位衛(wèi)星(GPQ接收器34、伽利略衛(wèi)星系統(tǒng)接收器等。移動電話20還可以包括環(huán)境傳感器以測量移動電話所處(expose)的環(huán)境(例如,溫度、氣壓、濕度等)。移動電話20可以包括諸如藍牙適配器的本地無線接口適配器56,以與諸如無線耳機、另一移動電話、計算機等的其它本地設置的裝置建立無線通信。另外,移動電話20還可以包括無線局域網接口適配器58以與諸如無線局域網、無線接入點等的其它本地設置的裝置建立無線通信。優(yōu)選地,WLAN適配器58與一個或更多個IEEE 802. 11協(xié)議(例如, 802. 11 (a)、802. 11(b)和/或802. 11(g)等)兼容,并且使得移動電話20能夠在WLAN上獲取唯一地址(例如,IP地址)并且與該WLAN上的一個或更多個裝置進行通信,假設用戶具有適當?shù)奶貦嗪?或已經被適當?shù)卣J證(authenticate)。如圖2所示,處理裝置42耦接到存儲器41。存儲器41存儲由處理器42使用以控制該裝置20的各種應用和功能的各種數(shù)據(jù)。應當理解,數(shù)據(jù)可以被存儲在其它附加存儲器組(bank)(未示出)中,并且這些存儲器組可以是任何類型的,諸如只讀存儲器、讀寫存儲器等。存儲器41可以存儲基于音頻的內容(例如,包括歌曲文件的音頻文件),以由該裝置的用戶播放。電子裝置20包括音頻應用60。音頻應用60包含適于使用電子裝置20來存儲和播放基于音頻的文件的應用。音頻應用60可以耦接到存儲器41以訪問存儲在該存儲器41 中的基于音頻的文件。音頻應用60可以包括存儲在該電子裝置中的庫應用62。庫應用62 被配置為提供包含音頻文件的一個或更多個庫和/或允許用戶提供包含音頻文件的一個或更多個庫。如這里所使用的,庫是指多個基于音頻的文件的集合。庫應用62被配置為提供包含存儲在裝置上的所有音頻文件的整體庫或者主庫。庫應用62還被配置為提供包含兩個或更多個音頻文件的子集或者允許用戶創(chuàng)建包含兩個或更多個音頻文件的子集。庫子集可以包含任何數(shù)量的音頻文件,但是所包含的音頻文件比存儲在該裝置上全部音頻文件少。術語“庫”涵蓋主庫和庫子集,該主庫包含存儲在電子裝置上的全部基于音頻的文件,所述庫子集包含存儲在電子裝置上的音頻文件的子集。庫子集還可被簡稱為“庫”,其可以或者可以不被用來限定或標注該庫的內容的另一術語所修飾,或者庫子集還可以被稱作播放列表。該主庫可以指代特定的基于音頻的文件的整個集合。例如,主庫可以是主音樂庫,該主音樂庫包含用戶的全部所存儲的音樂或者歌曲文件。該庫子集可以是用戶創(chuàng)建的或者是由庫應用創(chuàng)建的。庫應用可以基于與音頻文件關聯(lián)的元數(shù)據(jù)來創(chuàng)建庫子集。例如,歌曲文件可以包括諸如風格、藝術家名稱、專輯名稱等的元數(shù)據(jù)。庫應用62還可以被配置為確定與庫關聯(lián)的各個特征或者數(shù)據(jù),諸如例如庫名稱、創(chuàng)建日期、誰創(chuàng)建了該庫、音頻文件的順序、 編輯該庫的日期、播放該庫中的音頻文件的順序(和/或平均順序)、該庫中音頻文件被播放的次數(shù)和/或平均次數(shù)等。如上所述,庫可以指代可存儲在裝置上或者已經存儲在裝置上的音頻文件的任何集合。庫可以包括例如從音頻流或者無線電臺獲得的文件的集合。圖3例示音樂庫結構100的示例。音樂庫100包括主音樂庫102,該主音樂庫102 包括存儲在該電子裝置上的全部歌曲文件。庫100還包括多個庫子集llOa-llOd,這些庫子集IlOa-IlOd中的每一個包含來自主庫102的歌曲。圖3中的庫結構100被示出為具有藝術家?guī)?10a、風格庫110b、用戶創(chuàng)建的庫或播放列表110c、以及該用戶購買的歌曲的庫 110d。藝術家?guī)霫lOa包括主庫102中的全部歌曲,但是被分(break down)為多個附加子集(例如,112a-112c)。庫子集llh-112c各自包含存儲在該裝置上的各個藝術家的歌曲。 例如,庫子集11 可以包含藝術家A,子集112b可以包含藝術家B,并且子集112c可以包含藝術家C。各個藝術家?guī)炜梢园ㄟM一步的庫子集,這些庫子集包含特定藝術家的各個專輯的歌曲。例如,藝術家A的庫子集11 被示出為具有庫子集114a、114b、和114c,這些庫子集lHa、114b、和IHc包含分別來自藝術家A的專輯1、專輯2、和專輯3的歌曲。庫IlOb被示出為風格庫。庫IlOb包括主音樂庫102中的全部歌曲,并且包括包含被識別為屬于特定音樂風格的歌曲文件的庫子集。例如,在圖3中,庫IlOb包括庫子集 116a、116b、和116c,這些庫子集116a、116b、和116c包含分別被分類為搖滾樂、古典音樂和爵士樂的風格的歌曲文件?;谂c音頻文件關聯(lián)的各個元數(shù)據(jù)(例如,藝術家名稱、專輯名稱、風格等)來對庫IlOa和IlOb以及它們的各個庫子集進行分類?;谝纛l的內容應用60(具體地說,庫應用6 包含被配置為提取和識別與音頻文件關聯(lián)的元數(shù)據(jù)并且基于這些數(shù)據(jù)來創(chuàng)建庫子集的邏輯和程序??梢愿鶕?jù)獲得歌曲的源來確定與歌曲關聯(lián)的風格元數(shù)據(jù)。例如,光盤可以存儲有與歌曲關聯(lián)的元數(shù)據(jù),該元數(shù)據(jù)將這些歌曲分類為特定的風格。另選地,如果歌曲是從音樂服務系統(tǒng)購買的,則該音樂服務系統(tǒng)可以將該歌曲分類為屬于特定的風格。用戶還可以編輯該數(shù)據(jù)并且將音頻文件分類為屬于特定的風格。另外,應當理解,藝術家和風格庫子集不限于圖3所示的藝術家、專輯、或者風格的數(shù)量,并且可以包含與主庫中包含的同樣多的藝術家、專輯、和風格。庫結構100還被示出為具有包含所創(chuàng)建的播放列表的庫子集110c。這些所創(chuàng)建的播放列表可以由用戶創(chuàng)建或者可以是從例如基于音頻的內容服務系統(tǒng)70的其它源獲得的播放列表。例如,該服務系統(tǒng)70可以創(chuàng)建各種播放列表,這些播放列表還可以被稱作“合集(mix)”,或者可以包含由其它用戶創(chuàng)建的播放列表,并且這些播放列表可以被電子裝置 20的用戶購買。如圖3所示,庫IlOc包括庫子集118a-118d。庫118a被標識為“鍛煉合集 1”,并且包含6首歌曲(歌曲1-6)。庫118b被標識為“鍛煉合集2”,并且包含歌曲EM2-1 到EM2-n。庫118a和118b中的這些歌曲可以是用戶在鍛煉時喜歡聽的歌曲。庫118c被標識為“駕駛合集1”,并且包含歌曲DM-I到DM-n,用戶在駕駛時喜歡聽這些歌曲。庫118d被標識為“放松合集”,并且包含歌曲RM-I到RM-n,用戶喜歡聽這些歌曲以幫助他們放松。庫子集118a-118d包含比包含在主庫中的全部歌曲少的歌曲。應當理解,作為一個所創(chuàng)建的播放列表的一部分的歌曲還可以是另一所創(chuàng)建的播放列表的一部分。庫結構100還包括庫子集110d,該庫子集IlOd包含用戶從諸如音樂服務系統(tǒng)70 購買的歌曲。當從音樂服務系統(tǒng)購買歌曲時,歌曲文件可以包括標識該歌曲文件被購買的元數(shù)據(jù),并且可以被自動包括在庫IlOd中。用戶的基于音頻的庫(例如,音樂庫)中的各個庫可以用于獲得庫的概況。該概況還可以被稱作指紋,并且可以被認為是該用戶的特定品味或者偏好的表示(因為該概況與特定庫相關)。在用戶的整體音樂庫的上下文中,例如,該庫指紋可以被認為是該用戶的通常音樂品味的表示。圖4是確定諸如音樂庫的基于音頻的庫的概況或者指紋的方法200的示意性例示。在功能塊202,該方法200包括以下步驟提供包括多個音頻文件(例如,歌曲文件)的庫。在功能塊204,該方法包括以下步驟獲得該庫中的各個音頻文件的指紋或者概況。在功能塊206,使用該庫中的各個音頻文件的指紋來確定該庫的指紋。音頻文件的指紋可以被認為是該音頻文件的表示,并且可以基于與該音頻文件關聯(lián)的各種音頻數(shù)據(jù)。該音頻數(shù)據(jù)(可以根據(jù)該音頻數(shù)據(jù)確定指紋)可以包括與音頻文件關聯(lián)的聲音數(shù)據(jù)和/或非聲音元數(shù)據(jù)。音頻應用60包括音頻文件指紋應用66 (圖2),該音頻文件指紋應用66被配置為分析和提取該音頻數(shù)據(jù)(聲音數(shù)據(jù)和/或非聲音數(shù)據(jù))的期望特征并且基于這些特征來建立該音頻文件的概況??梢愿鶕?jù)期望來針對特定目的或預期 (intended)用途選擇要被提取的用于代表音頻文件的音頻數(shù)據(jù)。音頻文件可以包括與例如歌曲、語音錄音等關聯(lián)的聲音數(shù)據(jù)。該聲音數(shù)據(jù)通常由波形的形式組成,并且作為波形文件存儲在存儲器中。該聲音數(shù)據(jù)可以包括與音頻文件關聯(lián)的各種聲音特征或者特性,諸如例如節(jié)拍(beat)、和弦進階(chord progression)、結構
11(structure)、韻律(rhythm)、基調(mood)等。可以根據(jù)期望以任何合適的方式來選擇和分析該聲音數(shù)據(jù)以創(chuàng)建音頻文件的指紋。在一個方面中,該波形文件可以被分析并且創(chuàng)建標識符以表示該音頻文件的方面。在另一個方面中,音頻文件指紋應用66可以使用十二音分析來分析音頻文件的聲音數(shù)據(jù)。十二音分析提供與音頻文件(諸如歌曲文件)的特征相關的信息,包括但是不限于該音樂的音調(key)、和弦進階、節(jié)拍、結構、和韻律。該信息能夠用于推斷該聲音數(shù)據(jù)的特性??梢詮脑撀曇魯?shù)據(jù)提取的特征包括但是不限于節(jié)奏(tempo) (例如,每分鐘的節(jié)拍)、速度(其基于節(jié)奏和韻律)、頻散特性(dispersion)(節(jié)奏的變化)、大調(major)或小調(minor)、和弦類型、每單位時間的音符、韻律比(rhythm ratio)、 振幅、韻律(cadence)、和弦變化、和弦復雜度、音符、清晰度(clearness)、擴展、密度、音高移動(pitch move)、高中音(high mid)、低中音(low mid)等??梢愿鶕?jù)期望來針對特定目的或預期用途選擇要被歌曲指紋應用分析和提取的特征。分析或者確定大量的聲音特征可以提供該音頻文件的更好的或者更精確的表示,并且進而提供庫和用戶的指紋的更好的或者更精確的表示。參照圖5,示出歌曲(例如,來自鍛煉合集118a的歌曲1_6)的示例性指紋。圖5 中的指紋是基于許多因素的,這些因素包括每分鐘節(jié)拍、基調(例如,柔和的、快樂的、悲哀的、莊嚴的、欣快的、幸福的、歡快的、恢復健康的、新鮮的、優(yōu)雅的)、振幅、節(jié)奏、速度、頻散特性、大調、三和弦、韻律、和弦變化、和弦復雜度、音調復雜度、音符、韻律比、強烈的、清晰度、擴展、密度、振幅范圍、持續(xù)時間、釋放、音高移動、高中音、和低中音。該音頻文件指紋應用將分析這些歌曲文件中的聲音數(shù)據(jù),提取所期望的特征,并且基于該聲音數(shù)據(jù)的分析來提供針對各個特征的分數(shù)或者值(例如,圖5中沿著Y軸的數(shù)值)。非聲音元數(shù)據(jù)可以包括與該音頻文件關聯(lián)的數(shù)據(jù),該數(shù)據(jù)能夠用來提供與音頻文件相關的附加信息。非聲音數(shù)據(jù)可以是預先限定的、用戶創(chuàng)建的、和/或播放創(chuàng)建的數(shù)據(jù)。 針對音頻文件的非聲音元數(shù)據(jù)可以包括例如藝術家、專輯、歌曲標題、長度、風格等。這些數(shù)據(jù)可以被預先限定,并且與從CD或獲得的或者從數(shù)據(jù)庫購買的音頻文件關聯(lián)。非聲音元數(shù)據(jù)還可以包括用戶創(chuàng)建的數(shù)據(jù),諸如例如用戶將該音頻文件關聯(lián)到的活動、用戶將該音頻文件關聯(lián)到的年份時間或季節(jié)等。用戶還能夠限定或者創(chuàng)建針對音頻文件的風格數(shù)據(jù)(在預先限定了風格但是用戶不認可該分類的那些情況下)。經播放創(chuàng)建的數(shù)據(jù)可以是根據(jù)用戶的與該音頻文件相關的播放活動(例如,播放次數(shù)計數(shù)、平均播放時間、每天播放的時間等)所確定的數(shù)據(jù)。音頻應用60可以被配置為允許用戶創(chuàng)建和輸入非聲音數(shù)據(jù)和/或確定和提取播放相關的非聲音數(shù)據(jù)。可以按照任何合適的方式表示非聲音數(shù)據(jù)。例如,可以創(chuàng)建代碼(例如,哈希碼)或標識符來表示各種非聲音數(shù)據(jù)。在已經獲得針對庫中的歌曲的指紋之后,然后確定庫指紋??梢岳缤ㄟ^與基于音頻的內容應用60關聯(lián)的庫指紋應用68(圖幻來確定該庫指紋。庫指紋應用68被配置為基于庫中的音頻文件的指紋來確定該庫的合成指紋。在一個方面中,可以通過針對這些音頻文件分析的各個聲音和/或非聲音數(shù)據(jù)特征的分數(shù)的平均值來提供庫指紋。還可以通過考慮非聲音數(shù)據(jù)特征來確定庫指紋。這些非聲音數(shù)據(jù)特征通常作為元數(shù)據(jù)存在于音頻文件或庫文件中,這些非聲音數(shù)據(jù)特征可以是經預先限定的數(shù)據(jù)、由用戶編程的數(shù)據(jù)、或者由庫應用62確定的數(shù)據(jù)??梢员辉u估以確定庫指紋的非聲音數(shù)據(jù)包括但是不限于這些音頻文件在庫(或者播放列表)中的順序或者位置、音頻文件的平均順序
12或者位置(例如,如果用戶以隨機的順序從該庫播放歌曲)、音頻文件的平均播放時間、音頻文件已經被播放的次數(shù)(播放計數(shù)值)、音頻文件在所選擇的時間幀上被播放的次數(shù)、音頻文件在所選擇的時間幀上的平均播放位置、風格、音頻文件是否是使用特定的音樂系統(tǒng)購買的、音頻文件被播放的平均天和/或每天被播放的時間、音頻文件被播放的(多個)日期、與音頻文件關聯(lián)的活動(例如,鍛煉、駕駛、工作、閱讀、休息等)、與音頻文件關聯(lián)的特定位置(例如,在家、在工作、在度假等)等。在另一方面中,庫指紋可以是基于各個音頻文件指紋和與該各個音頻文件指紋關聯(lián)的其它特征和/或與正被分析的特定庫關聯(lián)的特征的指紋的加權合成。這些非聲音數(shù)據(jù)可以各自以適當?shù)姆绞絹肀硎?,或者針對將各個非聲音數(shù)據(jù)特征與指紋或音頻文件關聯(lián)的目的以及針對確定庫指紋的目的來選擇這些非聲音數(shù)據(jù)。在特定庫的上下文中,庫指紋應用68可以被編程為對與音頻文件關聯(lián)的各個聲音和/或非聲音數(shù)據(jù)特征進行計分(score)或者加權。庫指紋應用68可以根據(jù)期望針對特定目的或者預期用途使用包括例如各種相關技術、隨機分析方法等的統(tǒng)計分析方法來分析音頻文件指紋和庫數(shù)據(jù)。以上方法使得能夠針對所選擇的庫來確定指紋或概況。在一個方面中,該方法提供基于與該庫和/或庫子集中的歌曲關聯(lián)的聲音數(shù)據(jù)來確定反映用戶的整體音樂概況的整體指紋和/或反映針對歌曲子集的音樂概況的(多個)指紋子集的途徑。此外,該方法使得該(多個)指紋和/或(多個)概況能夠是動態(tài)的,以使得該(多個)指紋和/或(多個)概況將隨著新音頻文件被添加到用戶的庫或者庫子集被改變并且?guī)熘讣y被重新確定而改變。在另一方面中,該方法通過考慮聲音數(shù)據(jù)和非聲音數(shù)據(jù)這兩者來使得能夠確定反映或者指示用戶的音樂品味以及用戶的收聽習慣這兩者的獨特的(unique)概況或指紋。 例如,該方法可以基于評估諸如播放歷史、播放音頻文件的日期、播放音頻文件的平均順序等的特征來用于確定指示用戶的針對特定時間段(例如,特定年份、特定年份范圍、特定月份或天、特定天范圍的月份等)、特定活動、特定位置、特定風格等的音樂興趣的針對該用戶的多個不同音樂概況或指紋??梢愿鶕?jù)音頻文件的整個集合和完整播放歷史以及其它非聲音數(shù)據(jù)的表示來確定整體音樂概況或指紋。另外,庫指紋應用可以用來通過評估特定的音頻文件和與這些音頻文件關聯(lián)的特定的非聲音數(shù)據(jù)來在特定的時間或時間段(例如,針對年份2000-2008、2000-2003、2006-2008等、或者針對特定月份等)評估整個庫以及創(chuàng)建例如基于在特定活動期間播放的音頻文件的指紋的概況。可以基于用戶創(chuàng)建的庫或者簡單地根據(jù)評估與整個庫中的音頻文件關聯(lián)的數(shù)據(jù)來創(chuàng)建該概況??梢酝ㄟ^選擇怎樣確定庫指紋來創(chuàng)建獨特的指紋,該獨特的指紋是用戶對于特定的基于音頻的內容的品味(諸如用戶的音樂品味)的表示。改變確定指紋的方式(例如,通過改變所評估的參數(shù)的數(shù)量和/或賦予特定聲音和/或非聲音數(shù)據(jù)的權重)可以提供不同的庫指紋(即使針對給定的庫)。在另一方面中,還可以針對特定專輯、特定藝術家(基于特定藝術家的兩個或者更多個專輯)、 用戶所創(chuàng)建的各個播放列表或者庫子集、用戶所購買的歌曲、由用戶標識的歌曲音軌等來確定該用戶的音樂指紋。可以通過考慮聲音和非聲音數(shù)據(jù)來針對特定用戶確定各個唯一的指紋。各個非聲音數(shù)據(jù)可以是動態(tài)的(例如,播放次數(shù)計數(shù)、播放時間、播放長度等),并且因而該方法提供了反映用戶的音樂品味和/或收聽習慣隨著時間的變化的途徑。此外,不同的用戶可以具有獨特的收聽習慣。即使在具有相同音樂庫的用戶之間,使用所公開的方法也可以基于單個用戶的不同的收聽習慣而導致獨特的或者不同的用戶指紋或庫指紋。本發(fā)明還提供基于用戶的基于音頻的內容指紋來向用戶推薦基于音頻的內容的方法。參照圖6,示出了基于用戶的音樂指紋向用戶推薦基于音頻的內容(例如,音樂)的流程圖或邏輯進程300。在方法300中,如功能塊302所示,音頻內容服務系統(tǒng)(例如,圖1 中的系統(tǒng)70)獲得用戶存儲的基于音頻的庫中的特定庫的庫指紋。在功能塊304,音樂服務系統(tǒng)比較庫指紋與音樂服務系統(tǒng)的音樂數(shù)據(jù)庫中的歌曲的指紋??梢岳煤线m的應用(諸如位于音樂服務系統(tǒng)70的音頻概況服務器78上的應用)來實現(xiàn)該功能塊304。在功能塊 306,音頻服務系統(tǒng)識別具有與庫指紋充分相似的指紋的至少一個音頻文件(例如,歌曲)。 音頻概況服務器上的這些應用可以包含預先限定的定義以評估音頻文件指紋是否與庫指紋充分相似。該預先限定的定義可以是例如(要被推薦的)音頻文件的特征(例如,聲音和/或非聲音特征)各自在該庫指紋的特征的預先限定的限制或百分比以內。還可以使用相關技術,例如來比較庫指紋與音頻文件或另一庫,以確定是否向用戶推薦音頻文件(或者庫)。在功能塊308,該音樂系統(tǒng)向該用戶推薦由該音樂系統(tǒng)識別的至少一個歌曲來作為該用戶可能喜歡并且可能希望購買的歌曲。應當理解,推薦音頻內容不限于基于與所選擇的庫進行比較來向用戶推薦單個音頻文件。所推薦的音頻內容可以是具有與進行請求的用戶的庫的指紋相似的指紋的庫,諸如專輯或者由另一用戶創(chuàng)建的播放列表。音頻服務系統(tǒng)70可以按照任何適當?shù)姆绞絹慝@得庫指紋。在一個方面中,當裝置 20連接到音頻服務系統(tǒng)時,用戶的庫可以被音頻服務系統(tǒng)70訪問和讀取。如圖6的功能塊 310所示,用戶的整體音頻庫和/或庫子集可以被音頻服務系統(tǒng)70檢測和讀取。該邏輯可以接著進行到功能塊314,在該功能塊314,音頻服務系統(tǒng)70經由位于例如用戶的不同的庫的概況服務器78上的庫指紋應用來確定指紋。該音頻服務系統(tǒng)接著可以比較該指紋與音頻文件數(shù)據(jù)庫中的音頻文件的指紋,并且能夠基于不同的用戶庫來進行多個不同的歌曲推薦。在另一方面中,音頻服務系統(tǒng)70可以直接從用戶獲得(多個)庫指紋。在這種情況下,電子裝置20可以包含如前所述的應用(例如,歌曲指紋應用66和/或庫指紋應用 68),以確定針對一個或更多個用戶庫的指紋。針對各個庫的指紋接著可以被上載到音頻服務系統(tǒng)70。音頻服務系統(tǒng)70將使用音頻概況服務器78上的程序和應用來比較所獲得的 (多個)指紋與(多個)音頻文件數(shù)據(jù)庫76中的音頻文件的指紋,并且為該用戶選擇一個或者更多個音頻文件。應當理解,該用戶可以選擇希望上載哪(些)個指紋,另選地,當裝置20連接到音頻服務系統(tǒng)70時,全部指紋可以被自動上載到音頻服務系統(tǒng)70或者針對音頻服務系統(tǒng)70可訪問。獲得一個或者更多個用戶的庫的指紋并向用戶進行推薦的步驟可以或者可以不伴隨著用戶針對這種推薦的特定請求。在一個方面中,當在用戶的裝置與音頻服務系統(tǒng)70 之間建立連接時,音頻服務系統(tǒng)70能夠自動地從用戶訪問該用戶的庫和/或庫指紋。音頻服務系統(tǒng)70可以自動地比較庫指紋與存儲在音頻服務系統(tǒng)70的音頻數(shù)據(jù)庫76中的音頻文件,并且向服務器推薦至少一個歌曲。這樣,音頻服務系統(tǒng)70可以向用戶進行多個推薦。 例如,該音樂服務系統(tǒng)可以向用戶提供以下消息
“基于您的整體音樂指紋,您可能喜歡歌曲A、歌曲B、或者歌曲C ;基于針對庫駕駛合集1的指紋,您可能喜歡歌曲A、歌曲D、歌曲E、或者歌曲F?!币纛l服務系統(tǒng)70還可以基于用戶發(fā)起的針對推薦的請求來向用戶推薦至少一個音頻文件。參照圖6,在功能塊316,該用戶可以進行請求。在功能塊318,系統(tǒng)70接收該請求。該處理可以如以上參照圖6所述來進行。應當理解,音頻服務系統(tǒng)70可以在用戶發(fā)起針對推薦的請求之前、與該請求基本上同時地、或者在該用戶發(fā)起該請求之后獲得庫指紋。服務系統(tǒng)70除了基于特定音頻文件的指紋與用戶的庫指紋的相似性來推薦基于音頻的內容以外,還可以從數(shù)據(jù)庫的庫推薦一個或更多個音頻文件,其中該數(shù)據(jù)庫的庫具有與用戶的庫相似的指紋。該數(shù)據(jù)庫的庫可以是包括來自整個數(shù)據(jù)庫的歌曲的子集的庫。 該服務系統(tǒng)可以推薦該數(shù)據(jù)庫的庫中的各個歌曲或者可以推薦從該數(shù)據(jù)庫的庫選擇的歌曲。例如,數(shù)據(jù)庫的庫可以是特定藝術家的專輯。當評估該用戶的整體音樂概況時,例如, 系統(tǒng)70可以識別來自相同的或者不同的藝術家的、具有與該用戶的整體指紋相似的概況或指紋的多個專輯,并且可以向該用戶推薦這些專輯或者來自這些專輯的單個歌曲。作為另一示例,庫中的歌曲被播放的順序可能影響該庫的指紋。該庫可以包含一串快歌(fast song)隨后是慢歌(slow song)接著又是快歌。該指紋可以將此考慮在內, 并且該音頻服務系統(tǒng)能夠推薦具有相似行為的專輯或者播放。編程領域的技術人員在閱讀這里提供的描述后將能夠確定電子裝置并且對該電子裝置進行編程,或者提供系統(tǒng)以針對音頻指紋應用、庫指紋應用、用于比較音頻文件指紋 (包括數(shù)據(jù)庫的庫指紋)與庫指紋的應用、或者其它應用來執(zhí)行這里所述的功能。因此,為了簡潔,省略了具體編程代碼的細節(jié)。另外,盡管在各個電子裝置20 (或84)和系統(tǒng)70的存儲器中執(zhí)行各個應用,但是應當理解,在不脫離本發(fā)明的范圍的情況下,還可以經由專用硬件、固件、軟件、或者它們中的兩個或者更多個的組合來實現(xiàn)這些功能。如上所述創(chuàng)建用戶概況/指紋使得能夠連續(xù)評估用戶的整體音樂品味以及用戶的涉及特定活動、時間、位置、藝術家、風格等的音樂品味,以反映用戶的音樂品味和收聽習慣的動態(tài)方面。該方法使得能夠例如隨著時間評估用戶的音樂品味并反映正在變化的音樂品味。這些獨特的概況使得音樂服務系統(tǒng)能夠推薦與該用戶的(多個)音樂品味和/或收聽習慣一致的音樂或基于音頻的內容,而不是簡單地基于單個歌曲來推薦音樂或基于音頻的內容。此外,該推薦適合于該用戶,而不是可能購買了相似歌曲的其他用戶也已經購買的或者喜歡的歌曲。盡管已經針對電子裝置20具體描述了各種方法,但是這些方法可適用于 (amenable to)用來存儲和播放音頻文件的其它裝置和系統(tǒng)。裝置20被例示為本身能夠連接到音頻服務系統(tǒng)的便攜式網絡裝置。應當理解,用于播放音頻文件的一些裝置可以不是網絡裝置。這些裝置通常與具有網絡功能的另一電子裝置進行通信。例如,參照圖1,這里描述的方法可適用于包括音頻播放器82的系統(tǒng)80,該音頻播放器82用于存儲和播放音頻文件。音頻播放器82可以連接到計算機84 (經由連接86,諸如通過USB線纜),以從計算機84向音頻播放器82傳送音頻文件。該計算機能夠連接到音頻服務系統(tǒng)70 (經由互聯(lián)網)并與該音頻服務系統(tǒng)70進行通信,以下載音頻文件。計算機84還可以包括音頻應用 (諸如針對裝置20描述的那些),以存儲和播放音頻文件。例如,圖1示出計算機84包括音頻應用60和音頻概況應用64。計算機84還可以包括其它應用(例如,庫應用62、諸如音頻文件指紋應用66和庫指紋應用68),以執(zhí)行所描述的方法。 盡管已經參照特定示例性實施方式示出和描述了本發(fā)明,但是,應當理解,本領域其他技術人員在閱讀和理解本說明書時可以想到等同物和修改。本發(fā)明旨在包括落入隨后的權利要求的范圍內的所有這些等同物和修改。
權利要求
1.一種創(chuàng)建存儲在電子裝置00)上并具有多個文件的基于音頻的庫的音頻概況的方法,該方法包括以下步驟獲得所述庫中的各個音頻文件的指紋,音頻文件的所述指紋是與所述音頻文件關聯(lián)的聲音數(shù)據(jù)、與所述音頻文件關聯(lián)的非聲音數(shù)據(jù)、或者它們的組合的表示;以及確定所述庫的指紋,庫指紋是所述庫中的多個音頻文件的指紋的合成。
2.根據(jù)權利要求1所述的方法,其中,所述音頻文件是歌曲文件。
3.根據(jù)權利要求1或2所述的方法,其中,音頻文件的所述指紋是基于所述聲音數(shù)據(jù)的十二音分析的。
4.根據(jù)權利要求1-3中任一權利要求所述的方法,其中,確定所述庫指紋的步驟包括以下步驟對所述庫中的音頻文件的指紋求平均。
5.根據(jù)權利要求1-4中任一權利要求所述的方法,其中,確定所述庫指紋的步驟包括以下步驟確定所述庫中的音頻文件指紋的加權合成。
6.根據(jù)權利要求5所述的方法,其中,確定所述音頻文件指紋的所述加權合成的步驟包括以下步驟評估與(i)各個音頻文件、(ii)所述庫、或者(i)和(ii)這兩者關聯(lián)的聲音數(shù)據(jù)和非聲音元數(shù)據(jù)。
7.根據(jù)權利要求6所述的方法,其中,所述非聲音元數(shù)據(jù)是風格、活動、位置、時間段、 所述音頻文件在所述庫中的占位符、所述音頻文件的平均播放位置、所述音頻文件的播放計數(shù)值、所述音頻文件的平均播放時間或者它們中的兩個或更多個的組合。
8.根據(jù)權利要求1-7中任一權利要求所述的方法,其中,所述基于音頻的庫包括存儲在所述電子裝置上的全部所述音頻文件,并且所述概況表示整個基于音頻的概況。
9.根據(jù)權利要求1-7中任一權利要求所述的方法,其中,所述基于音頻的庫是所述整個庫的包含比存儲在所述電子裝置上的全部所述音頻文件少的音頻文件的子集。
10.一種向用戶推薦存儲在系統(tǒng)(70)上的音頻文件數(shù)據(jù)庫中包含的基于音頻的內容的方法,該方法包括以下步驟獲得用戶的具有多個音頻文件的基于音頻的庫的指紋,庫指紋是所述庫中的各個音頻文件的指紋的合成;比較所述用戶的庫指紋與所述音頻文件數(shù)據(jù)庫中的音頻文件的指紋;以及從所述音頻文件數(shù)據(jù)庫中選擇至少一個音頻文件來推薦給用戶,所選擇的至少一個音頻文件具有在預定容限內與所述用戶的指紋相似的指紋。
11.根據(jù)權利要求10所述的方法,其中,所述音頻文件是歌曲文件。
12.根據(jù)權利要求10或11所述的方法,其中,獲得所述庫的指紋的步驟包括以下步驟 從用戶獲得庫指紋。
13.根據(jù)權利要求10-12中任一權利要求所述的方法,其中,獲得所述庫的指紋的步驟包括所述系統(tǒng)通過以下步驟來獲得指紋(i)獲得用戶庫中的歌曲的列表,(ii)確定所述庫中的各個歌曲的指紋,以及(iii)確定所述庫的指紋。
14.根據(jù)權利要求10-13中任一權利要求所述的方法,其中,(i)所述比較操作包括以下步驟比較所述用戶的庫指紋與所述數(shù)據(jù)庫中的至少一個數(shù)據(jù)庫的庫的指紋,所述至少一個數(shù)據(jù)庫的庫包括來自所述音頻文件數(shù)據(jù)庫的多個歌曲,( )所述選擇操作包括以下步驟選擇具有與所述用戶的庫指紋相似的指紋的至少一個數(shù)據(jù)庫的庫,以及(iii)所述推薦操作包括以下步驟向用戶推薦來自所述數(shù)據(jù)庫的庫的至少一個歌曲。
15.根據(jù)權利要求10-14中任一權利要求所述的方法,其中,從所述音頻文件數(shù)據(jù)庫中選擇至少一個音頻文件以向用戶進行推薦的步驟包括以下步驟從所述音頻文件數(shù)據(jù)庫選擇包括兩個或更多個音頻文件的庫。
16.一種電子裝置(20),該電子裝置包括 存儲器(41);存儲在所述存儲器中的多個音頻文件;包含多個所述音頻文件的庫;以及處理器(42),該處理器執(zhí)行邏輯以執(zhí)行以下步驟獲得所述庫中的各個音頻文件的指紋,所述指紋是與相應音頻文件關聯(lián)的聲音數(shù)據(jù)、 與相應音頻文件關聯(lián)的非聲音數(shù)據(jù)、或者它們的組合的表示;以及確定所述庫的指紋,庫指紋是所述庫中的多個音頻文件的指紋的合成。
17.根據(jù)權利要求16所述的裝置,其中,所述處理器還執(zhí)行邏輯以向具有音頻文件數(shù)據(jù)庫(76)的系統(tǒng)(70)發(fā)送所述庫指紋來推薦基于音頻的內容。
18.根據(jù)權利要求17所述的裝置,其中,所述處理器還執(zhí)行邏輯以從具有音頻文件數(shù)據(jù)庫的所述系統(tǒng)接收基于音頻的內容的推薦。
19.根據(jù)權利要求16-18中任一權利要求所述的裝置,其中,所述裝置00)是便攜式通I H衣且。
20.根據(jù)權利要求16-19中任一權利要求所述的裝置,其中,所述裝置00)是移動電話。
全文摘要
一種創(chuàng)建具有多個音頻文件的庫的概況的方法和一種基于庫概況向用戶推薦基于音頻的內容的方法。所述基于音頻的內容可以是例如音樂或者歌曲。一種創(chuàng)建具有多個音頻文件的庫的概況的方法包括以下步驟獲得所述庫中的各個音頻文件的指紋;以及確定所述庫的指紋。一種向用戶推薦基于音頻的內容的方法包括以下步驟獲得用戶庫的指紋;比較所述用戶的庫指紋與音頻文件數(shù)據(jù)庫中的音頻文件的指紋;以及從所述音頻文件數(shù)據(jù)庫中選擇至少一個音頻文件來推薦給所述用戶,其中,所選擇的音頻文件具有與所述用戶的指紋充分相似的指紋。
文檔編號G06F17/30GK102308295SQ200980156428
公開日2012年1月4日 申請日期2009年7月31日 優(yōu)先權日2009年2月10日
發(fā)明者湯姆·蓋多什, 艾米爾·漢森 申請人:索尼愛立信移動通訊有限公司