用于使用呈現(xiàn)高速緩存針對所請求的音符提供音頻的系統(tǒng)和方法
【專利摘要】公開了一種用于提供與所請求的音樂音符相對應的音頻數(shù)據(jù)的方法,所述方法包括:(a)提供具有多個高速緩存條目的呈現(xiàn)高速緩存,所述高速緩存條目中的每一個與不同音符相對應;(b)從客戶端接收針對第一音符的請求;(c)識別與所述第一音符相對應的第一高速緩存條目;(d)確定與所述第一高速緩存條目相對應的第一音頻分段不可用;(e)識別與所述呈現(xiàn)高速緩存中的接近命中高速緩存條目相對應的第二音頻分段;以及(f)將所述第二音頻分段處理為與所述第一音頻分段基本上類似的第三音頻分段。
【專利說明】用于使用呈現(xiàn)高速緩存針對所請求的音符提供音頻的系統(tǒng)和方法
[0001]本申請要求來自下述申請的優(yōu)先權:于2009年6月I日提交的美國臨時專利申請N0.61/182,982 ;于2009年10月2日提交的美國臨時專利申請N0.61/248,238 ;于2009年12月3日提交的美國臨時專利申請N0.12/791,792 ;均于2010年6月I日提交的美國專利申請 N0.12/791,792、12/791,798、12/791,803 和 12/791,807。
【技術領域】
[0002]本發(fā)明總體涉及音樂的創(chuàng)作,并且更特別地,涉及用于使用呈現(xiàn)高速緩存針對所請求的音符提供音頻的系統(tǒng)和方法。
【背景技術】
[0003]音樂是人類自我表現(xiàn)的以良好聲譽眾所周知的形式。然而,可以以不同方式得到人對這種藝術努力的親身欣賞。通常,這個人可以通過收聽其他人的創(chuàng)作而不是由他自己或她自己生成音樂,來更容易地享受音樂。對許多人來說,聆聽和認識有吸引力的樂曲的能力是天生的,而手動地創(chuàng)作音符的合適采集的能力仍然遙不可及。人的創(chuàng)作新音樂的能力可能受學習樂器好到足以準確地隨意再現(xiàn)曲調(diào)所必需的時間、錢和/或技能約束。對大多數(shù)人來說,他們自己的想象力可以是新音樂的來源,但他們哼唱或吟唱該相同曲調(diào)的能力限制了他們的曲調(diào)可被正式保留和再創(chuàng)作以供其他人享受的程度。
[0004]記錄伴奏樂者的演奏也可能是費力的過程。對相同材料的多個曲段(take)進行記錄且對其煞費苦心地仔細查看,直到能夠在消除掉所有瑕疵的情況下集合成單個曲段為止。良好的曲段通常需要有天賦的藝術家在另一位藝術家的指導下相應地調(diào)整他或她的演奏。在業(yè)余記錄的情況下,最好的曲段是機緣巧合的結(jié)果并因此不能被重復。往往,業(yè)余演奏者制作好部分和差部分二者都有的曲段。如果可以在不必須過細地分析每個曲段的每個部分的情況下構(gòu)造出歌曲,則記錄過程將簡單得多且有更多樂趣。因此,正是關于這些和其他考慮,作出了本發(fā)明。
[0005]此外,人所期望創(chuàng)作的音樂可能是復雜的。例如,想象出的曲調(diào)可能具有多于一種樂器,該多于一種樂器可以按可能的布置與其他樂器同時被演奏。這種復雜性進一步增加了單獨的人生成期望的聲音組合所需的時間、技能和/或錢。大多數(shù)樂器的物理配置還需要人的完全物理注意力來手動地生成音符,從而進一步需要附加人員演奏期望曲調(diào)的附加部分。此外,然后,額外的審核和管理可能是確保期望曲調(diào)的各種所涉及的樂器和元件的合適交互所必需的。
[0006]甚至對已經(jīng)享受創(chuàng)作其自己的音樂的人來說,那些收聽者可能缺乏實現(xiàn)合適作曲和音樂創(chuàng)作的類型的專門知識。由此,所創(chuàng)作的音樂可能包含不處于相同音樂音調(diào)或弦內(nèi)的音符。在大多數(shù)音樂風格中,走調(diào)或脫弦音符(常被稱作“不和諧”音符)的存在使音樂不悅耳和刺耳。相應地,由于他們?nèi)狈?jīng)驗和訓練,音樂收聽者通常創(chuàng)作出的音樂聽起來不合意且不專業(yè)。[0007]對某些人來說,藝術靈感不受典型地與新音樂的生成和記錄相關聯(lián)的相同時間和位置限制所約束。例如,當新曲調(diào)的想法突然成形時,人可能不處于有可演奏的樂器在手的制作工作室中。在靈感的瞬間消逝之后,這個人可能不能夠重拾原始曲調(diào)的完整程度,從而導致藝術努力的損失。此外,這個人可能隨著在僅能再創(chuàng)作他或她的初始音樂啟示的低劣和不完整版本時應用的時間和努力而變得沮喪。
[0008]專業(yè)的音樂作曲和編輯軟件工具當前一般可用。然而,這些工具展現(xiàn)出對初學者用戶來說望而卻步的進入門檻。這種復雜用戶界面可能很快削弱敢于在其藝術幻想的道路上冒險的任何新手的熱情。受限于專業(yè)音響服務器套件也束縛了想要在移動中精制曲調(diào)的移動創(chuàng)作者的風格。
[0009]所需要的是一種音樂創(chuàng)作系統(tǒng)和方法,其能夠容易地與用戶的大多數(shù)基本能力相互作用,卻能夠?qū)崿F(xiàn)與用戶的想象力和期望一樣復雜的音樂創(chuàng)作。還關聯(lián)地需要促進沒有不和諧的音符的音樂創(chuàng)作。此外,在本領域中需要能夠通過基于自動化選擇準則聚合多個曲段的部分來生成音樂合輯音軌的音樂著作(authoring)系統(tǒng)。還期望的是,當靈感出現(xiàn)時,以不受用戶的位置限制的方式實現(xiàn)這種系統(tǒng),從而實現(xiàn)對新樂曲的首次表達的捕獲。
[0010]在本領域中關聯(lián)地需要一種系統(tǒng)和方法,其能夠通過自動地評估先前記錄的音軌的質(zhì)量并選擇經(jīng)由電子著作系統(tǒng)而記錄的先前記錄的音軌中的最佳音軌來從多個曲段創(chuàng)作合輯音軌。
[0011]還期望實現(xiàn)一種用于基于云的音樂創(chuàng)作的系統(tǒng)和方法,從而,處理密集型功能由遠離客戶端設備的服務器實現(xiàn)。然而,由于數(shù)字音樂創(chuàng)作依賴于巨大量的數(shù)據(jù),因此這種配置一般受若干因素限制。對提供者來說,處理、存儲和服務于這樣大量的數(shù)據(jù)可能數(shù)量巨大的,除非中央處理器極為強大并因此從成本和等待時間的觀點來看較昂貴。在給定了用于存儲和發(fā)送數(shù)據(jù)的當前 成本的情況下,數(shù)據(jù)從呈現(xiàn)服務器到客戶端的傳輸可能迅速變得成本過高且還可能增加不期望的等待時間。從客戶端的角度來看,帶寬限制還可能導致顯著的等待時間問題,這減損了用戶體驗。因此,在本領域中還需要能夠解決和克服這些缺陷的系統(tǒng)。
【專利附圖】
【附圖說明】
[0012]參照下面的附圖來描述非限制性且非窮舉性的實施例。在附圖中,貫穿所有各幅圖,相似的附圖標記指代相似的部分,除非以其他方式指定。
[0013]為了更好地理解本公開,將對要與附圖相關聯(lián)地閱讀的下面的【具體實施方式】進行參照,在附圖中:
圖1A、1B和IC圖示了可實施本發(fā)明的方面的系統(tǒng)的若干實施例;
圖2是圖1的系統(tǒng)的音頻轉(zhuǎn)換器140的可能部件的一個實施例的框圖;
圖3圖示了音樂合輯的進展的一個示例性實施例;
圖4是圖2的系統(tǒng)的音軌分區(qū)器204的可能部件的一個實施例的框圖;
圖5是圖示了具有基頻和多個諧波的音頻輸入的頻率分布的示例性頻譜圖;
圖6是示例性的音高相對于時間的曲線圖,其圖示了在第一和第二音高之間改變且隨后在第二首聞周圍安置的人聲的首聞;
圖7是作為音高事件相對于時間而繪制的形態(tài)的示例性實施例,每個音高事件具有離散持續(xù)時間;
圖8是圖示了本發(fā)明的一個實施例中的數(shù)據(jù)文件的內(nèi)容的框圖;
圖9是圖示了用于在連續(xù)循環(huán)的記錄伴奏內(nèi)生成音樂音軌的方法的一個實施例的流程圖;
圖10、10A和IOB —起形成用于在連續(xù)循環(huán)的記錄伴奏內(nèi)生成音樂音軌的一個可能用戶界面的圖示;
圖11是用于校準記錄伴奏的一個可能用戶界面的圖示;
圖12A、12B和12C—起圖示了與在三個分離的時間段處在連續(xù)循環(huán)的記錄伴奏內(nèi)音樂音軌的生成相關聯(lián)的第二可能用戶界面;
圖13A、13B和13C —起圖示了用于使用圖12的用戶界面修改向系統(tǒng)中的音樂音軌輸入的用戶界面的一個可能使用;
圖14A、14B和14C 一起圖示了用于在三個分離的時間段處創(chuàng)建節(jié)奏音軌的一個可能用戶界面;
圖15是圖1的系統(tǒng)的MTAC模塊144的可能部件的一個實施例的框圖;
圖16是圖示了用于確定由音頻輸入的一個或多個音符反映的音樂音調(diào)的一個可能過程的流程圖;
圖16A圖示了可以用于更好地確定音調(diào)符號的音程分布矩陣;
圖16B和16C分別圖示了與音程分布矩陣相關聯(lián)地使用以提供優(yōu)選音調(diào)符號確定的小調(diào)和小調(diào)音程分布矩陣;
圖17、17A和17B —起形成圖示了用于基于弦序列約束對音樂音軌的部分進行打分的一個可能過程的流程圖;
圖18圖示了用于確定形態(tài)的質(zhì)心的過程的一個實施例;
圖19圖示了諧波振蕩器隨時間的階躍響應,具有阻尼響應、過阻尼響應和欠阻尼響
應;
圖20圖示了示出用于對音樂輸入的部分進行打分的一個實施例的邏輯流程圖;
圖21圖示了用于從多個記錄音軌組成“最佳”音軌的過程的一個實施例的邏輯流程
圖;
圖22圖示了得分的示例性音頻波形和圖形表示的一個實施例,其示出了實際音高與理想首聞的差異;
圖23圖示了由先前記錄的音軌的分區(qū)構(gòu)成的新音軌的一個實施例;
圖24圖示了示出用于將伴奏音樂輸入與主奏音樂輸入進行和聲的過程的一個實施例的數(shù)據(jù)流程圖;
圖25圖示了由圖24的變換音符模塊演奏的過程的數(shù)據(jù)流程圖;
圖26圖示了超級鍵盤的一個示例性實施例;
圖27A-B圖示了弦輪的兩個示例性實施例;
圖28圖示了可實施本發(fā)明的網(wǎng)絡配置的一個示例性實施例;
圖29圖示了支持本文討論的過程的設備的框圖;
圖30圖不了音樂網(wǎng)絡設備的一個實施例;
圖31圖示了游戲環(huán)境中的第一界面的一個可能實施例; 圖32圖示了用于在圖31的游戲環(huán)境中創(chuàng)建一個或多個主奏嗓音或樂器音軌的界面的一個可能實施例;
圖33圖示了用于在圖31的游戲環(huán)境中創(chuàng)建一個或多個打擊樂器音軌的界面的一個可能實施例;
圖34A-C圖示了用于在圖31的游戲環(huán)境中創(chuàng)建一個或多個伴奏音軌的界面的可能實施例;
圖35圖示了描繪作為主奏音樂的伴奏而播放的和弦進行的圖形界面的一個可能實施
例;
圖36圖示了用于在圖31的游戲環(huán)境中在音樂合輯的不同段當中進行選擇的一個可能實施例;
圖37A和37B圖示了與可與圖31-36的游戲環(huán)境結(jié)合利用的音樂資產(chǎn)相關聯(lián)的文件結(jié)構(gòu)的可能實施例;
圖38圖示了根據(jù)本發(fā)明的呈現(xiàn)高速緩存的一個實施例;
圖39圖示了示出根據(jù)本發(fā)明的用于針對所請求的音符獲得音頻的一個實施例的邏輯流程圖的一個實施例;
圖40圖示了根據(jù)本發(fā)明的用于實現(xiàn)圖39的高速緩存控制過程的流程圖的一個實施
例;
圖41圖示了根據(jù)本發(fā)明的用于實現(xiàn)呈現(xiàn)高速緩存的架構(gòu)的一個實施例;
圖42圖示了根據(jù)本發(fā)明的用于實現(xiàn)呈現(xiàn)高速緩存的架構(gòu)的第二實施例;
圖43圖示了圖示根據(jù)本發(fā)明的客戶端、服務器和邊緣高速緩存之間的通信的信號圖的一個實施例;
圖44圖示了圖示根據(jù)本發(fā)明的實施例的客戶端、服務器和邊緣高速緩存之間的通信的信號圖的第二實施例;
圖45圖示了根據(jù)本發(fā)明的用于優(yōu)化音頻請求處理隊列的第一過程的實施例;
圖46圖示了根據(jù)本發(fā)明的用于優(yōu)化音頻請求處理隊列的第二過程的實施例;
圖47圖示了根據(jù)本發(fā)明的用于優(yōu)化音頻請求處理隊列的第三過程的實施例;
圖48圖示了根據(jù)本發(fā)明的一個實施例的實況播放循環(huán)的一個示例性實施例;
圖49圖示了根據(jù)本發(fā)明的可被應用于音樂合輯的一系列效果的一個實施例;
圖50圖示了根據(jù)本發(fā)明的可被應用于樂器音軌的一系列樂者角色效果的一個實施
例;
圖51圖示了根據(jù)本發(fā)明的可被應用于樂器音軌的一系列制作者角色效果的一個實施
例;
圖52圖示了根據(jù)本發(fā)明的可被應用于合輯音軌的一系列制作者角色效果的一個實施例。
【具體實施方式】
[0014]現(xiàn)在,將在下文中參照附圖來更全面地描述本發(fā)明,附圖形成本發(fā)明的一部分,并通過圖示的方式示出了可實施本發(fā)明的具體示例性實施例。然而,本發(fā)明可以以許多不同形式體現(xiàn)且不應當被理解為限于本文闡述的實施例;相反,這些實施例被提供以使得本公開將透徹且全面,且會將本發(fā)明的范圍完全傳達給本領域技術人員。除其他事情之外,本發(fā)明可以被體現(xiàn)為方法或設備。相應地,本發(fā)明可以采用完全硬件的實施例、完全軟件的實施例或?qū)④浖陀布矫孢M行組合的實施例的形式。因此,下面的【具體實施方式】不應在限制意義上采用。
[0015]穿Si。
[0016]貫穿說明書和權利要求書,下面的術語采用本文中顯式關聯(lián)的含義,除非上下文以其他方式清楚指示。如本文使用的短語“在一個實施例中”不必然指代相同的實施例,盡管其可以指代相同的實施例。此外,如本文使用的短語“在另一實施例中”不必然指代不同的實施例,盡管其可以指代不同的實施例。因此,如下所述,在不脫離本發(fā)明的范圍或精神的情況下,可以容易地組合本發(fā)明的各個實施例。
[0017]此外,如本文所使用,術語“或”是包括性的“或”算子,并等效于術語“和/或”,除非上下文以其他方式清楚指示。術語“基于”不是排他性的,并允許基于未描述的附加因素,除非上下文以其他方式清楚指示。此外,貫穿說明書,“一”、“一個”和“該”的含義包括復數(shù)引用?!霸凇小钡暮x包括“在……中”且包括復數(shù)引用?!霸凇小钡暮x包括“在……中”和“在……上”。
[0018]如本文所使用,術語“音樂輸入”指代包含通過包括但不限于空氣、麥克風、線路入機制等的多種介質(zhì)傳輸?shù)囊魳泛?或控制信息的任何信號輸入。音樂輸入不限于可能由人耳聽到的信號輸入頻率,并可以包括可由人耳聽到的頻率之外或具有不容易由人耳聽到的形式的其他頻率。此外,術語“音樂的”的使用不意圖傳達對節(jié)拍、節(jié)奏等的內(nèi)在需求。因此,例如,音樂輸入可以包括各種輸入,諸如輕敲(包括單敲)、敲擊、人類輸入(諸如語音(例如do、re、mi)、打擊輸入(例如,ka、cha、da_da)等)、以及通過樂器或其他幅度和/或頻率生成機制經(jīng)由傳輸進行的間接輸入,包括但不限于麥克風輸入、線路入輸入、MIDI輸入、具有可用于傳達音樂輸入的信號信息的文件或者使所傳輸?shù)男盘柲軌虮晦D(zhuǎn)換為音樂的其他輸入。
[0019]如本文所使用,術語“音樂音調(diào)”是一組和諧的音樂音符。音調(diào)通常是大調(diào)或小調(diào)。樂者頻繁地談到樂曲為C大“調(diào)”,例如,這暗示一段音樂和諧地以音符C為中心且利用第一音符或主音為C的大音階。大音階是由完全且大的半音(例如,CDEFGAB或do remi fa so la ti)構(gòu)成的八音符進階。關于鋼琴,例如,中央C (有時稱為“C4”)具有頻率261.626 Hz,而 D4 是 293.665 Hz ;E4 是 329.628 Hz ;F4 是 349.228 Hz ;G4 是 391.995 Hz ;A4是440.000 Hz ;以及B4是493.883 Hz0盡管其他樂器上的相同音符將在相同頻率處演奏,但是還應當理解,一些樂器在一個音調(diào)或另一個音調(diào)中演奏。
[0020]如本文所使用,術語“不和諧音符”是不處于正確音樂音調(diào)或弦中的音符,其中,正確音樂音調(diào)和正確弦是當前正在由另一樂者或音樂源演奏的音樂音調(diào)或弦。
[0021]如本文所使用,術語“藍色音符”是不處于正確音樂音調(diào)或弦中但被允許在不變換的情況下演奏的音符。
[0022]如本文所使用,術語“伴奏音樂輸入的音符”是由伴奏樂者演奏的與在對應主奏旋律中演奏的音符相關聯(lián)的音符。
[0023]本發(fā)明的總體描述。
[0024]下面簡要描述各個實施例,以提供本發(fā)明的一些方面的基本理解。該簡要描述不意圖作為全面的概述。其不意圖標識關鍵或決定性元素或者劃定或以其他方式窄化范圍。其目的僅在于以簡化的方式提出一些構(gòu)思,作為下面提出的更詳細描述的序言。
[0025]簡言之,各個實施例涉及通過循環(huán)通過先前記錄的音頻音軌的集合并接收針對每個添加的音頻音軌的可聽輸入來生成多音軌記錄。在一個實施例中,可以從來自終端用戶的可聽發(fā)聲輸入生成多音軌記錄中的每個音頻音軌??梢栽谥貜突胤女斍坝涗浿筇峁┟總€新可聽輸入,或者循環(huán)每個新可聽輸入一次或多次。由在其期間未接收到新音軌輸入的循環(huán)時段分離的該記錄序列可以允許用戶透徹地、連續(xù)地以及在沒有立即需要的附加輸入的時間相關壓力的情況下收聽當前記錄。與在其中附加音軌被輸入的循環(huán)無關,循環(huán)的回放還可以允許執(zhí)行其他動作,諸如修改先前音軌或改變記錄系統(tǒng)的參數(shù)。
[0026]此外,多音軌記錄中的音頻音軌中的至少一個可以包括基于在可聽輸入中提供的一個或多個不同聲音生成的一個或多個樂器聲音??梢詫邮盏降目陕犦斎雸?zhí)行各種形式的處理以創(chuàng)建音頻音軌,該處理包括可聽輸入的定時的對準和調(diào)整、頻率識別和調(diào)整、將可聽輸入轉(zhuǎn)換為與樂器相關聯(lián)的音色、添加與樂器相關聯(lián)的已知聽覺線索等等。此外,可以實時執(zhí)行這些過程中的每一個,從而允許所生成的音頻音軌的幾乎瞬時回放,并使得能夠立即和后續(xù)接收另一可聽輸入以用于處理且作為音頻音軌覆蓋到多音軌記錄中的一個或多個先前記錄的音軌上。
[0027]在一個實施例中,多音軌記錄的循環(huán)或重復部分可以包括單條音樂。該條的長度可以由與音軌相關聯(lián)的拍子和拍號(time signature)確定。在另一實施例中,條的數(shù)目或者多音軌記錄的回放的循環(huán)點可以是動態(tài)的。即,多音軌記錄中的第一音頻音軌的重復可以發(fā)生在與多音軌記錄中的第二音頻音軌的時間不同的時間處。該動態(tài)循環(huán)點的調(diào)整例如可以基于后續(xù)音軌的可聽輸入的長度而自動確定。
[0028]各個實施例還涉及自動制作源自一系列曲段的單個“最佳”曲段。在一個實施例中,在一個或多個伴奏期間將演奏的多個曲段記錄到多音軌記錄器上。每個曲段被自動分區(qū)為分段?;诳蛇x擇的準則來對多個曲段中的每一個的每個分區(qū)的質(zhì)量進行打分,并且由每個曲段的最佳質(zhì)量分段自動構(gòu)造音軌。在一個實施例中,最佳分段由具有來自多個分段得分內(nèi)的最高得分的分段定義。
[0029]各個實施例還進一步涉及保護樂者免于演奏不和諧音符。在一個實施例中,伴奏樂器的音符被接收,以及來自主奏樂器。然后,基于主奏的音調(diào)、弦和/或定時來修改來自伴奏樂器的音符。在一個實施例中,可以提供虛擬樂器,其中,樂器的輸入音調(diào)動態(tài)地映射到安全音符上。因此,如果虛擬樂器的演奏者對旋律進行伴奏,則虛擬樂器可以識別安全音符,安全音符包括用于被伴奏的旋律的當前弦的音符或者處于旋律的音樂音調(diào)中的音符。
[0030]設各架構(gòu)。
[0031]圖1示出了可在多種設備50上部署的系統(tǒng)100的一個實施例,出于圖示目的,設備50可以是任何多用途計算機(圖1A)、手持計算設備(圖1B)和/或?qū)S糜螒蛳到y(tǒng)(圖1C)。系統(tǒng)100可以被部署為在該設備上安裝的應用??商鎿Q地,可以在http瀏覽器環(huán)境內(nèi)操作該系統(tǒng),該http瀏覽器環(huán)境可以可選地利用web插入技術來擴展瀏覽器的功能以實現(xiàn)與系統(tǒng)100相關聯(lián)的功能。設備50可以包括比圖29中所示的部件多或少的部件。然而,本領域技術人員應當理解,特定部件不是對系統(tǒng)100進行操作所必需的,而諸如處理器、麥克風、視頻顯示器和音頻揚聲器之類的其他部件是重要的,如果不是實施本發(fā)明的方面所必需的話。
[0032]如圖29中所示,設備50包括處理器2902,處理器2902可以是經(jīng)由總線2906與大容量存儲器2904通信的CPU。如本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解的那樣,處理器2902還可以包括單獨或彼此組合的一個或多個通用處理器、數(shù)字信號處理器、其他專用處理器和/或ASIC。設備50還包括電源2908、一個或多個網(wǎng)絡接口2910、音頻接口 2912、顯示驅(qū)動器2914、用戶輸入處理程序2916、照明器2918、輸入/輸出接口 2920、可選觸覺接口 2922和可選全球定位系統(tǒng)(GPS)接收機2924。設備50還可以包括攝像機(未示出),其使視頻能夠被獲取和/或與特定多音軌記錄相關聯(lián)。來自攝像機或其他源的視頻還可以進一步被提供給在線社交網(wǎng)絡和/或在線音樂社區(qū)。設備50還可以可選地與基站(未示出)通信或者直接與另一計算設備通信。其他計算設備(諸如基站)可以包括附加音頻相關部件,諸如專業(yè)音頻處理器、生成器、放大器、揚聲器、XLR連接器和/或電源。[0033]繼續(xù)圖29,電源2908可以包括可再充電或不可再充電電池,或者可以由外部電源(諸如,還可對電池進行補充和/或再充電的AC適配器或供電對接支架)提供。網(wǎng)絡接口2910包括用于將設備50耦合至一個或多個網(wǎng)絡的電路,并被構(gòu)造以與一種或多種通信協(xié)議和技術一起使用,該通信協(xié)議和技術包括但不限于:全球移動通信系統(tǒng)(GSM)、碼分多址(CDMA )、時分多址(TDMA )、用戶數(shù)據(jù)報協(xié)議(UDP )、傳輸控制協(xié)議/互聯(lián)網(wǎng)協(xié)議(TCP/1P )、SMS、通用分組無線電服務(6?1^)、胃4?、超寬帶^18)、IEEE 802.16全球微波接入互操作性(WiMax)、SIP/RTP、或者多種其他無線通信協(xié)議中的任一種。相應地,網(wǎng)絡接口 2910可以包括作為收發(fā)器的收發(fā)設備或網(wǎng)絡接口卡(NIC)。
[0034]音頻接口 2912 (圖29)被布置為產(chǎn)生和接收音頻信號,諸如人類語音的聲音。例如,如在圖1A和IB中最大程度上清楚地示出的那樣,音頻接口 2912可以耦合至揚聲器51和/或麥克風52以實現(xiàn)向系統(tǒng)100中的音樂輸出和輸入。顯示驅(qū)動器2914 (圖29)被布置為產(chǎn)生視頻信號以驅(qū)動各種類型的顯示器。例如,顯示驅(qū)動器2914可以驅(qū)動圖1A中所示的視頻監(jiān)視顯示器75,視頻監(jiān)視顯示器75可以是基于液晶、氣體等離子體或發(fā)光二極管(LED)的顯示器或者可與計算設備一起使用的任何其他類型的顯示器。如圖1B中所示,顯示驅(qū)動器2914可以可替換地驅(qū)動手持觸摸敏感屏幕80,手持觸摸敏感屏幕80還將被布置為經(jīng)由用戶輸入處理程序2916接收來自諸如觸筆之類的對象的輸入或來自人手的數(shù)字(見圖31)。鍵區(qū)55可以包括被布置為接收來自用戶的輸入的任何輸入設備(例如,鍵盤、游戲控制器、軌跡球和/或鼠標)。例如,鍵區(qū)55可以包括一個或多個按鈕、數(shù)字撥號盤和/或鍵。鍵區(qū)55還可以包括與選擇和發(fā)送圖像相關聯(lián)的命令按鈕。
[0035]設備50還包括用于與外部設備(諸如耳機、揚聲器51或者其他輸入或輸出設備)通信的輸入/輸出接口 2920。輸入/輸出接口 2920可以利用一種或多種通信技術,諸如USB、紅外、藍牙(Bluetooth?)等。可選觸覺接口 2922被布置為將觸覺反饋提供給設備50的用戶。例如,在設備50是移動或手持設備的實施例(諸如,圖1B中所示的實施例)中,可選觸覺接口 2922可以被采用以便以特定方式(諸如例如,當計算設備的另一用戶呼叫時)振動設備。
[0036]可選GPS收發(fā)器2924可以確定設備100在地球表面上的物理坐標,這典型地輸出作為維度和經(jīng)度值的位置。GPS收發(fā)器2924還可以采用其他地理定位機制(包括但不限于三角測量、輔助GPS (AGPS)、E-OTD, Cl、SA1、ETA、BSS等)以便進一步確定設備50在地球表面上的物理位置。然而,在一個實施例中,移動設備可以通過其他部件來提供可被采用以確定設備的物理位置的其他信息,包括例如MAC地址、IP地址等。
[0037]如圖29中所示,大容量存儲器2904包括RAM 2924、ROM 2926和其他存儲裝置。大容量存儲器2904圖示了用于存儲諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其他數(shù)據(jù)之類的信息的計算機可讀存儲介質(zhì)的示例。大容量存儲器2904存儲用于控制設備50的低級別操作的基本輸入/輸出系統(tǒng)(“BIOS”)2928。大容量存儲器還存儲用于控制設備50的操作的操作系統(tǒng)2930。將意識到,該部件可以包括通用操作系統(tǒng)(諸如MAC 0S、WIND0WS、UNIX、LINUX的版本)或?qū)S貌僮飨到y(tǒng)(諸如例如Xbox 360系統(tǒng)軟件、Wii IOS,Windows MobileTM,iOS、Android、webOS、QNX或Symbian?操作系統(tǒng))。操作系統(tǒng)可以包括使得能夠經(jīng)由Java應用程序控制硬件部件和/或操作系統(tǒng)操作的Java虛擬機模塊或與該Java虛擬機模塊對接。操作系統(tǒng)還可以包括使得能夠安全地執(zhí)行應用(例如,F(xiàn)lash和Unity)的安全虛擬容器,一般也被稱作“沙盒”。
[0038]一個或多個數(shù)據(jù)存儲模塊132可以被存儲在設備50的存儲器2904中。如本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解的那樣,數(shù)據(jù)存儲模塊132中存儲的信息的部分還可以被存儲在與設備50相關聯(lián)的盤驅(qū)動器或其他存儲介質(zhì)上。這些數(shù)據(jù)存儲模塊132可以存儲多音軌記錄、MIDI文件、WAV文件、音頻數(shù)據(jù)樣本、以及具有上面討論的任一種格式的多種其他數(shù)據(jù)和/或數(shù)據(jù)格式或輸入旋律數(shù)據(jù)。數(shù)據(jù)存儲模塊132還可以存儲描述系統(tǒng)100的各種能力的信息,在請求時或響應于特定事件等等,該信息可以例如作為通信期間的報頭的一部分而被發(fā)送至其他設備。此外,數(shù)據(jù)存儲模塊132還可以被采用以存儲包括地址簿、朋友列表、別名、用戶簡檔信息等的社交網(wǎng)絡信息。 [0039]設備50可以存儲并選擇性地執(zhí)行多個不同應用,包括根據(jù)系統(tǒng)100使用的應用。例如,根據(jù)系統(tǒng)100使用的應用可以包括音頻轉(zhuǎn)換器模塊140、記錄伴奏實況循環(huán)(RSLL)模塊142、多曲段自動合成器(MTAC)模塊144、和聲器模塊146、音軌共享器模塊148、聲音搜索器模塊150、類型匹配器模塊152以及弦匹配器模塊154。下面更詳細地描述這些應用的功能。
[0040]設備50上的應用還可以包括消息器134和瀏覽器136。消息器132可以被配置為使用多種消息收發(fā)通信中的任一種來發(fā)起和管理消息收發(fā)會話,該消息收發(fā)通信包括但不限于電子郵件、短消息服務(SMS)、即時消息(頂)、多媒體消息服務(MMS)、互聯(lián)網(wǎng)中繼聊天(IRC)、mIRC、RSS饋給等等。例如,在一個實施例中,消息器243可以被配置為頂消息收發(fā)應用,諸如AOL即時消息器、Yahoo!消息器、.NET消息器服務器、ICQ等。在另一實施例中,消息器132可以是被配置為綜合并采用多種消息收發(fā)協(xié)議的客戶端應用。在一個實施例中,消息器132可以與瀏覽器134進行交互以管理消息。瀏覽器134可以包括被配置為采用幾乎任何基于web的語言接收和現(xiàn)實圖形、文本、多媒體等的幾乎任何應用。在一個實施例中,使瀏覽器應用能夠采用手持設備標記語言(HDML)、無線標記語言(WML)、WMLScript、JavaScript、標準通用標記語言(SMGL)、超文本標記語言(HTML)、可擴展標記語言(XML)等以顯示和發(fā)送消息。然而,可以采用多種其他基于web的語言中的任一種,包括Python、Java和第三方web插入。
[0041]設備50還可以包括其他應用138,諸如計算機可執(zhí)行指令,其在被客戶端設備100執(zhí)行時發(fā)射、接收和/或以其他方式處理消息(例如,SMS、麗S、頂、電子郵件和/或其他消息)、音頻、視頻并實現(xiàn)與另一客戶端設備的另一用戶的電信。應用程序的其他示例包括日歷、搜索程序、電子郵件客戶端、IM應用、SMS應用、VoIP應用、聯(lián)系人管理器、任務管理器、代碼轉(zhuǎn)換器、數(shù)據(jù)庫程序、文字處理程序、安全應用、電子表格程序、游戲、搜索程序等。可以在設備50上嵌入或可替換地下載和執(zhí)行上述應用中的每一個。
[0042]當然,盡管上面討論的各種應用被示作在設備50上實現(xiàn),但是在可替換實施例中,這些應用中的每一個的一個或多個部分可以被實現(xiàn)在一個或多個遠程設備或服務器上,其中,通過一個或多個網(wǎng)絡在設備50與該一個或多個遠程設備或服務器之間傳遞每個部分的輸入和輸出。可替換地,可以對應用中的一個或多個進行封裝以在外圍設備上執(zhí)行或從外圍設備下載。
[0043]音頻轉(zhuǎn)換器。
[0044]音頻轉(zhuǎn)換器140被配置為接收音頻數(shù)據(jù)并將其轉(zhuǎn)換為更有意義的形式以在系統(tǒng)100內(nèi)使用。在圖2中圖示了音頻轉(zhuǎn)換器140的一個實施例。在該實施例中,音頻轉(zhuǎn)換器140可以包括多種子系統(tǒng),該多種子系統(tǒng)包括音軌記錄器202、音軌分區(qū)器204、量化器206、頻率檢測器208、頻移器210、樂器轉(zhuǎn)換器212、增益控制器214、諧波生成器216、特效編輯器218和手動調(diào)整控制器220。與音頻轉(zhuǎn)換器140的各種子系統(tǒng)的連接以及音頻轉(zhuǎn)換器140的各種子系統(tǒng)之間的互連未被示出,以避免使本發(fā)明模糊,然而,如本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解的那樣,這些子系統(tǒng)將是電連接和/或邏輯連接的。
[0045]音軌記錄器202使用戶能夠記錄來自嗓音或樂器的至少一個音頻音軌。在一個實施例中,用戶可以在沒有任何伴奏的情況下記錄音軌。然而,音軌記錄器202還可以被配置為自動地或在用戶請求時播放音頻,包括節(jié)拍音軌(click track)、音樂伴奏、用戶可對照其判斷他/她的音高和定時的初始音、或者甚至先前記錄的音頻。“節(jié)拍音軌”指代意圖幫助用戶保持一致拍子的周期性咔咕噪聲(clicking noise)(諸如,由機械節(jié)拍器發(fā)出的周期性咔噠噪聲)。音軌記錄器202還可以使用戶能夠?qū)⒁涗浀臅r間長度設置為時間界限(即,一定數(shù)目的分鐘和秒鐘)或一定數(shù)目的音樂條。當結(jié)合MTAC模塊144使用時,如下面所討論,音軌記錄器202還可以被配置為以圖形方式指示與所記錄的音軌的各個部分相關聯(lián)的得分,以指示例如用戶何時走調(diào)等等。
[0046]—般地,音樂合輯由多個抒情段組成。例如,圖3圖示了流行歌曲的一個典型進展,其開始于序曲段,接下來是交替的主歌和合唱段,以及橋段,之后是最后主歌。當然,盡管未示出,但也可以使用其他結(jié)構(gòu),諸如副歌、終曲等。因此,在一個實施例中,音軌記錄器202還可以被配置為使用戶能夠選擇要針對其使用所記錄的音頻音軌的歌曲的段。然后,可以按任何順序(自動地(基于由類型匹配器模塊152進行的確定)或者如終端用戶所選擇的那樣)布置這些段,以創(chuàng)作完整的音樂合輯。
[0047]音軌分區(qū)器204將所記錄的音頻音軌劃分為分離的分區(qū),然后可以尋址這些分區(qū)并潛在地將其存儲為個體可尋址的分離聲音剪輯或文件。分區(qū)被優(yōu)選地選擇為使得端對端粘接的分段導致極少音頻偽像或不導致音頻偽像。例如,讓我們假定可聽輸入包括短語“pum pa pum”。在一個實施例中,該可聽輸入的劃分可以識別該可聽輸入的每個音節(jié)并將其區(qū)分為分離的聲音,諸如“pum”、“pa”和“pum”。然而,應當理解,可以以其他方式描繪該短語,并且單個分區(qū)可以包括多于一個音節(jié)或詞。在圖1A、1B和IC中的顯示器75上圖示了四個分區(qū)(編號為“1”、“2”、“3”和“4”),每個分區(qū)包括多于一個音節(jié)。如所圖示的那樣,分區(qū)“I”具有多個音符,該多個音符可以反映已由音軌記錄器202使用來自人或樂器源的麥克風52的輸入記錄的相同的多個音節(jié)。
[0048]為了執(zhí)行可聽音軌到分離的分區(qū)的劃分,音軌分區(qū)器204可以利用在處理器2902上運行的一個或多個過程。在圖4中所示的一個示例性實施例中,音軌分區(qū)器204可以包括靜默檢測器402、停止檢測器404和/或手動分區(qū)器406,其中每一個可以用于將音頻音軌分區(qū)為在時間上對準的N個分區(qū)。每當檢測到靜默達特定時間段時,音軌分區(qū)器204都可以使用靜默檢測器302來對音軌進行分區(qū)。該“靜默”可以由音量閾值定義,使得當音頻音量下降到低于所定義的閾值達所定義的時間段時,音軌中的位置被視為靜默。音量閾值和時間段二者可以是可配置的。
[0049]另一方面,停止檢測器404可以被配置為使用話音分析(諸如格式分析)來識別音軌中的元音和輔音。例如,輔音(諸如T、D、P、B、G、K)和鼻音由其發(fā)聲中氣流的阻塞來定界。然后,可以使用特定元音或輔音的位置來檢測和識別優(yōu)選地分區(qū)的點。與靜默檢測器402類似,由停止檢測器404利用以識別分區(qū)點的元音和輔音的類型可以是可配置的。還可以提供手動分區(qū)器406,以使用戶能夠手動地對每個分區(qū)進行定界。例如,用戶可以簡單地指定每個分區(qū)的時間長度,從而使音頻音軌被劃分為均具有相等長度的許多分區(qū)。用戶還可以被允許識別音頻音軌中要創(chuàng)建分區(qū)的特定位置。該識別可以是結(jié)合圖1A、1B和IC中所示的圖形用戶界面的類型、使用指點設備(諸如鼠標或游戲控制器)、以圖形方式執(zhí)行的。該識別還可以是通過在由音軌記錄器202對音頻音軌的可聽回放期間按壓用戶輸入設備上的按鈕或鍵(諸如鍵盤55、鼠標54或游戲控制器56)來執(zhí)行的。
[0050]當然,盡管靜默檢測器402、停止檢測器304和手動分區(qū)器406的功能已經(jīng)被分別描述,但是可以想到,音軌分區(qū)器204可以使用靜默檢測器、停止檢測器和/或手動分區(qū)器的任何組合將音頻音軌分區(qū)或劃分為分段。本領域技術人員在其面前有本說明書、附圖和權利要求書時還將理解,還可以使用用于將音頻音軌分區(qū)或劃分為分段的其他技術。
[0051]量化器206被配置為量化接收到的音頻音軌的分區(qū),這可以利用在處理器2902上運行的一個或多個過程。量化(如本文使用該術語)的過程指代每個先前創(chuàng)建的分區(qū)(以及因此,該分區(qū)內(nèi)包含的音符)的時間移位,如為了將分區(qū)內(nèi)的聲音與特定節(jié)拍進行對準而可能必需的那樣。優(yōu)選地,量化器206被配置為按時間順序?qū)⒚總€分區(qū)的開始與先前確定的節(jié)拍進行對準。例如,可以提供韻律,其中,每個條可以包括4個節(jié)拍,并且分離聲音的對準可以相對于四分之一節(jié)拍時間增量而進行,從而在每個四節(jié)拍的條中提供分區(qū)可與之對準的16個時間點。當然,可以使用每個條(諸如,對于華爾茲或波爾卡效果為三個節(jié)拍,對于搖擺樂效果為兩個節(jié)拍,等等)和節(jié)拍的任何數(shù)目的增量,并且在過程期間的任何時間處,可以由用戶手動地調(diào)整或基于特定準則(諸如,音樂的特定風格或類型(例如,藍調(diào)、爵士樂、波爾卡、流行樂、搖滾樂、搖擺樂或華爾茲)的用戶選擇)自動地調(diào)整該任何數(shù)目的增量。
[0052]在一個實施例中,每個分區(qū)可以由量化器206以在記錄時最接近地接收到其的可用時間增量自動地對準。即,如果聲音在節(jié)拍中的兩個時間增量之間開始,則將按時間順序向前或向后移位聲音的回放定時到這些增量中與其初始起始時間更接近的一個增量??商鎿Q地,可以將每個聲音在時間上自動移位到緊接在聲音被初始記錄的相對時間之前的每個時間增量。在又一實施例中,可以將每個聲音在時間上自動移位到緊接在聲音被初始記錄的相對時間之后的每個時間增量??商鎿Q地或附加地,還可以基于針對多音軌記錄而選擇的類型來影響每個分離聲音的時間移位(如何有的話),如下面關于類型匹配器1252進一步討論的那樣。在另一實施例中,還可以自動地將每個聲音與多音軌記錄中的先前記錄的音軌進行時間對準,從而實現(xiàn)卡拉OK型效果。此外,分離聲音的長度可以大于一個或多個時間增量,并且,量化器206的時間移位可以被控制以防止分離聲音被時間移位以使得分離聲音在相同音頻音軌內(nèi)重疊。
[0053]頻率檢測器208被配置為檢測和識別可被包含在每個分區(qū)內(nèi)的一個或多個分離聲音的音高,這可以利用在處理器2902上運行的一個或多個過程。在一個實施例中,可以通過將每個分離聲音轉(zhuǎn)換為頻譜來確定音高。優(yōu)選地,這是使用快速傅里葉變換(FFT)算法(諸如,由iZotope進行的FFT實現(xiàn))來實現(xiàn)的。然而,應當理解,可以使用任何FFT實現(xiàn)。還可以想到,還可以使用離散傅里葉變換(DFT)算法來獲得頻譜。
[0054]為了圖示,圖5描繪了可由對接收到的音頻音軌的部分執(zhí)行的FFT過程的輸出產(chǎn)生的頻譜的一個示例。如可看到的那樣,頻譜400包括單個基頻(F)處的與音高相對應的一個主峰值502,還有在2F、3F、4F……nF處激勵的諧波。在頻譜中存在附加諧波,這是由于當在單個音高處激勵諸如聲帶或小提琴琴弦之類的振蕩器時,該振蕩器典型地在多個頻率處振動。
[0055]在一些實例中,音高的識別可能由于附加噪聲而復雜。例如,如圖5中所示,頻譜可以包括由于音頻輸入來自諸如語音或樂器之類的真實世界振蕩器而出現(xiàn)且顯現(xiàn)為跨越頻譜而散布的低幅度尖峰的噪聲。在一個實施例中,可以通過對低于特定噪聲閾值的FFT輸出進行濾波來提取該噪聲。在一些實例中,音高的識別還可能由顫音的存在而復雜。顫音是可被應用于演奏的故意的頻率調(diào)制,并典型地處于5.5Hz與7.5Hz之間。像在有噪聲的情況下那樣,可以通 過在頻域中應用帶通濾波器來從FFT輸出中濾除掉顫音,但是對顫音進行濾波可能在許多情形中不期望。
[0056]除了上面討論的頻域方法外,還可以想到,還可以使用一種或多種時域方法來確定分區(qū)中的一個或多個聲音的音高。例如,在一個實施例中,可以通過測量信號的過零點之間的距離來確定音高。還可以使用諸如AMDF (平均量值差函數(shù))、ASMDF (平均平方均差函數(shù))和其他類似自相關算法之類的算法。
[0057]為了使對首聞的判斷最有效,還可以將被定首聞的內(nèi)容成組為(恒定頻率的)首符和(穩(wěn)定增加或降低的頻率的)滑音。然而,與具有自然地產(chǎn)生穩(wěn)定離散音高的品或調(diào)的樂器不同,人聲往往滑入音符并以連續(xù)的方式搖曳,從而使向離散音高的轉(zhuǎn)換變得困難。因此,頻率檢測器208還可以優(yōu)選地利用音高脈沖檢測來識別分區(qū)內(nèi)的分離聲音之間的音高中的移位或改變。
[0058]音高脈沖檢測是一種用于對聚焦于在歌手的語音與其對其語音的感知之間形成的控制回路的彈道的音高事件進行定界的方法。一般地,當歌手發(fā)聲時,該歌手片刻之后聽到該聲音。如果歌手聽到音高不正確,則他立即向所意圖的音高修改他的語音。該負反饋回路可以被建模為由周期性脈沖驅(qū)動的阻尼諧波運動。因此,人聲可以被視為單個振蕩器:聲帶。在圖6中可以看到歌手的語音602的音高改變和安置的一個示例圖示。聲帶中的緊張控制音高,并且音高的這種改變可以由對階躍函數(shù)(諸如圖6中的階躍函數(shù)604)的響應來建模。因此,可以通過尋找音高中的阻尼諧波振蕩的起始并觀察收斂到穩(wěn)定值的音高的連續(xù)轉(zhuǎn)折點來確定新音高事件的起始。
[0059]在音頻音軌的分區(qū)內(nèi)的音高事件已被確定之后,其可以被轉(zhuǎn)換和/或存儲到作為音高事件相對于時間的曲線圖的形態(tài)中。在圖7中描繪了形態(tài)(不具有分區(qū))的一個示例。因此,形態(tài)可以包括對每個聲音的發(fā)動、持續(xù)時間和音高或者這些值的任何組合或子集進行標識的信息。在一個實施例中,形態(tài)可以具有MIDI數(shù)據(jù)的形式,盡管形態(tài)可以指代音高相對于時間的任何表示,且不限于半音或任何特定韻律。例如,在通過引用并入本文的“Morphological Metrics” by Larry Polansky, Journal of New Music Research,volume 25,pp.289-368,ISSN: 09929-8215中描述了可使用的形態(tài)的其他這樣的示例。
[0060]頻移器210可以被配置為對可聽輸入的頻率進行移位,這可以利用在處理器2902上運行的一個或多個過程。例如,可以自動地提高或降低可聽輸入的分區(qū)內(nèi)的一個或多個聲音的頻率,以與先前已記錄的分離聲音或可聽輸入的基頻對準。在一個實施例中,對是提高還是降低可聽輸入的頻率的確定依賴于最接近的基頻。換言之,假定樂曲處于C大調(diào),那么如果由音軌記錄器202捕獲的聲頻是270.000Hz,則頻移器210將向下移位音符到261.626Hz (中央C),而如果由音軌記錄器202捕獲的聲頻是280.000Hz,則頻移器210將向上移位音符293.665Hz (或高于中央C的D)。即使當頻移器210將可聽輸入主要調(diào)整到最接近的基頻時,頻移器210也可以進一步被編程為基于音樂音調(diào)、類型和/或弦來對接近呼叫(即,其中,聲頻近似處于兩個音符之間半途)進行不同決定。在一個實施例中,頻移器210可以基于由類型匹配器260和/或弦匹配器270提供的控制將可聽輸入調(diào)整到基于音樂音調(diào)、類型和/或弦而在音樂上更有道理的其他基頻,如下面進一步討論??商鎿Q地或附加地,響應于來自樂器轉(zhuǎn)換器212的輸入,頻移器210還可以分別將一個或多個分區(qū)的一個或多個部分移位成對應于預定集合的頻率或半音,諸如,典型地與所選樂器(諸如鋼琴、吉他或其他弦樂器、木管樂器或銅管樂器)相關聯(lián)的那些頻率或半音。
[0061]樂器轉(zhuǎn)換器212可以被配置為執(zhí)行可聽輸入的一個或多個部分到具有與樂器相關聯(lián)的音色的一個或多個聲音的轉(zhuǎn)換。例如,可以將可聽輸入中的一個或多個聲音轉(zhuǎn)換為一種或多種不同類型的打擊樂器(包括小軍鼓、牛頸鈴、低音鼓、三角鐵等)的一個或多個樂器聲音。在一個實施例中,可聽輸入到一個或多個對應的打擊樂器聲音的轉(zhuǎn)換可以包括:將可聽輸入中的一個或多個聲音的定時和幅度適配為包括打擊樂器的一個或多個聲音的對應音軌,該打擊樂器聲音包括與該一個或多個可聽輸入聲音相同或相似的定時和幅度。對于被使得能夠演奏不同音符的其他樂器(諸如,長號)或其他類型的銅管樂器、弦樂器、木管樂器等,樂器轉(zhuǎn)換可以進一步將可聽輸入聲音的一個或多個頻率與具有由樂器演奏的相同或相似頻率的一個或多個聲音進行相關。此外,每次轉(zhuǎn)換可以由實際上演奏對應物理樂器的物理能力導出和/或限制。例如,針對中音薩克斯音軌生成的樂器聲音的頻率可以由傳統(tǒng)中音薩克斯的實際頻率范圍限制。在一個實施例中,所生成的音頻音軌可以包括轉(zhuǎn)換后的可聽輸入的MIDI格式的表示。由樂器轉(zhuǎn)換器212使用的各種樂器的數(shù)據(jù)將優(yōu)選地被存儲在存儲器2904中并可以從光學或磁介質(zhì)、可移除存儲器或經(jīng)由網(wǎng)絡下載。
[0062]增益控制器214可以被配置為基于其他先前記錄的音軌的音量來自動調(diào)整可聽輸入的相對音量,并可以利用在處理器2902上運行的一個或多個過程。諧波生成器216可以被配置為將諧波并入到音頻音軌中,這可以利用在處理器2902上運行的一個或多個過程。例如,可以確定可聽輸入信號的不同附加頻率并將其添加至所生產(chǎn)的音頻音軌。確定附加頻率還可以基于來自類型匹配器260的類型或者通過使用由用戶輸入的其他預定參數(shù)設置。例如,如果所選類型是華爾茲,則可以在具有“oom-pa-pa”節(jié)拍的34時間中從與主奏音樂和諧的處于緊接在主奏下面的八度音階中的大調(diào)和弦中選擇附加頻率,如下:基音I t基音I |。特效編輯器218可以被配置為將各種效果添加到音頻音軌,諸如回聲、回響等,優(yōu)選地利用在處理器2902上運行的一個或多個過程。
[0063]音頻轉(zhuǎn)換器140還可以包括手動調(diào)整控制器220,以使用戶能夠手動更改由上面討論的模塊自動配置的任何設置。例如,除了其他選項之外,手動調(diào)整控制器220可以使用戶能夠更改音頻輸入或其部分的頻率;使用戶能夠更改每個分離聲音的發(fā)動和持續(xù)時間;增加或減小音頻音軌的增益;選擇要被應用于樂器轉(zhuǎn)換器212的不同樂器。如本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解的那樣,該手動調(diào)整控制器220可以被設計為與一個或多個圖形用戶界面一起使用。下面將與圖13A、13B和13C相關聯(lián)地討論一種特定圖形用戶界面。
[0064]圖8圖示了已由音頻轉(zhuǎn)換器140處理或以其他方式從另一源下載、取得或獲得的音頻音軌的分區(qū)的文件結(jié)構(gòu)的一個實施例。如所示的那樣,在該實施例中,文件包括與文件相關聯(lián)的元數(shù)據(jù)、所獲得的形態(tài)數(shù)據(jù)(例如,具有MIDI格式)和原始音頻(例如,具有.wav格式)。元數(shù)據(jù)可以包括指示與音頻音軌分區(qū)的創(chuàng)建者或供給者相關聯(lián)的簡檔的信息。其還可以包括與數(shù)據(jù)的音頻簽名有關的附加信息,諸如與音頻相關聯(lián)的音調(diào)、拍子和分區(qū)。元數(shù)據(jù)還可以包括與可被應用于分區(qū)中的每個音符的可能可用音高移位、可被應用于每個音符的時間移位的量等有關的信息。例如,應當理解,對于實況記錄的音頻,如果音高被移位多于半音,則存在失真的可能性。相應地,在一個實施例中,可以將約束置于實況音頻上以防止多于一個半音的移位。當然,還可以使用不同設置和不同約束。在另一實施例中,可能音高移位、時間移位等的范圍也可以由音頻音軌分區(qū)的創(chuàng)建者或在該音頻音軌分區(qū)中具有實質(zhì)權利的任何個人(諸如管理員、合作方等)更改或建立。
[0065]記錄伴奏實況循環(huán)。
[0066]記錄伴奏實況循環(huán)(RSLL)模塊142實現(xiàn)數(shù)字音頻工作站,該數(shù)字音頻工作站與音頻轉(zhuǎn)換器140相結(jié)合實現(xiàn)可聽輸入的記錄、分離音頻音軌的生成和多音軌記錄的創(chuàng)建。因此,RSLL模塊1422可以使任何所記錄的音頻音軌(說出的、詠唱的或以其他方式進行的)能夠與先前記錄的音軌進行組合以創(chuàng)建多音軌記錄。如下面進一步討論的那樣,RSLL模塊142還優(yōu)選地被配置為循環(huán)先前記錄的多音軌記錄的至少一條以用于重復回放??梢栽谛驴陕犦斎胝诒挥涗浕蛘逺SLL模塊142正在以其他方式接收針對當前正在進行的記錄伴奏的指令的同時執(zhí)行該重復回放。由此,RSLL模塊142允許用戶在播放和收聽先前記錄的音軌的同時繼續(xù)編輯并合成音樂音軌。如將從下面的討論中理解的那樣,在優(yōu)選地完成這種過程時,先前記錄的音軌的連續(xù)循環(huán)還最小化了用戶對可由被應用于用戶當前正在記錄的音頻音軌的過程引起的任何等待時間的感知。
[0067]圖9圖示了總體示出使用RSLL模塊142與音頻轉(zhuǎn)換器140相結(jié)合創(chuàng)建多音軌記錄的概述過程的一個實施例的邏輯流程圖??傮w上,圖9的操作一般表示記錄伴奏。每當用戶采用系統(tǒng)100以及例如RSLL模塊142時,可以新創(chuàng)建和完成這種伴奏??商鎿Q地,可以繼續(xù)先前伴奏,并且還可以加載和應用其特定元素,諸如先前記錄的多音軌記錄或其他用戶指定記錄參數(shù)。
[0068]在任一種布置中,在開始框后,過程900開始于判決框910處,其中,用戶確定是否要回放當前記錄的多音軌記錄。在使其他動作能夠被執(zhí)行的同時回放當前多音軌記錄的過程在本文中一般被稱作“實況循環(huán)”。在不顯式重復的情況下,當前正在回放的多音軌記錄的部分的內(nèi)容和持續(xù)時間被稱作“實況循環(huán)”。在回放期間,多音軌記錄可以伴隨有節(jié)拍音軌,該節(jié)拍音軌一般包括不與多音軌記錄一起存儲的分離音頻音軌,該分離音頻音軌提供可聽地指示該系統(tǒng)當前被配置為記錄的音軌的速度和小節(jié)的一系列等間隔參考聲音或節(jié)拍。
[0069]在過程900的初始執(zhí)行中,可能尚未生成音頻音軌。在這種狀態(tài)中,可以對框910中的空的多音軌記錄的回放進行仿真,并且,節(jié)拍音軌可以提供被回放給用戶的僅有聲音。然而,在一個實施例中,用戶可以選擇使節(jié)拍音軌減弱,如下面關于框964進一步討論的那樣??梢栽谟涗浧陂g結(jié)合音頻回放將視覺線索提供給用戶。即使當音頻音軌未被記錄并且節(jié)拍音軌被減弱時,也可以將仿真回放和當前回放位置的指示僅限于這些視覺線索,其可以包括例如進度條、指針或某其他圖形指示的改變的顯示(參見例如圖12A、12B和12C)。
[0070]判決框910中回放的實況循環(huán)的多音軌記錄可以包括先前已記錄的一個或多個音頻音軌。該多音軌記錄可以包括總體長度以及作為實況循環(huán)而回放的長度。實況循環(huán)的長度可以被選擇為小于多音軌記錄的總體長度,從而允許用戶分離地分層多音軌記錄的不同條??梢杂捎脩羰謩舆x擇或可替換地基于接收到的可聽輸入自動確定實況循環(huán)的相對于多音軌記錄總體長度的長度。在至少一個實施例中,多音軌記錄和實況循環(huán)的總體長度可以相同。例如,實況循環(huán)和多音軌記錄的長度可以是單條音樂。
[0071]當多音軌記錄被選擇以在判決框910處回放時,可以與至少包括多音軌記錄的針對用戶回放的部分的實況循環(huán)的音頻回放同步地提供附加視覺線索,諸如一個或多個音軌的視覺表示。在多音軌記錄被播放的同時,過程900在判決框920處繼續(xù),其中,由終端用戶進行是否要生成多音軌記錄的音頻音軌的確定??梢曰诮邮盏娇陕犦斎?諸如,由終端用戶生成的嗓音可聽輸入)來發(fā)起記錄。在一個實施例中,可聽輸入的檢測到的幅度可以觸發(fā)在系統(tǒng)100中接收到的可聽輸入信號的采樣和存儲。在可替換實施例中,可以通過由系統(tǒng)100接收到的手動輸入來初始化這種音軌生成。此外,生成新音頻音軌可能需要檢測到的可聽輸入(諸如來自麥克風)和手動指示二者。如果要生成新音頻音軌,則處理在框922處繼續(xù)。如果未發(fā)起音頻音軌的生成,則過程900在判決框940處繼續(xù)。
[0072]在框922處,由音頻轉(zhuǎn)換器140的音軌記錄器202接收可聽輸入,并將該可聽輸入存儲在一個或多個數(shù)據(jù)存儲模塊132中的存儲器2904中。如本文所使用的那樣,“可聽”指代向設備50的輸入的屬性,其中,在該輸入被提供時,其可以同時、自然地且直接地被至少一個用戶在沒有放大或其他電子處理的情況下聽到。在一個實施例中,可以基于首次接收到可聽輸入時的實況循環(huán)內(nèi)的剩余時間量來確定所記錄的可聽輸入的長度。即,可以在實況循環(huán)的結(jié)尾處的時間的長度之后結(jié)束可聽輸入的記錄,而不論是否仍然正在接收可聽輸入的可檢測的量。例如,如果循環(huán)的長度是在每條四個節(jié)拍時的一條長,并且在第二節(jié)拍的開始處首次檢測到或觸發(fā)可聽輸入的接收,則可以記錄與該條的第二、第三和第四節(jié)拍相對應的相當于可聽輸入的三個節(jié)拍,并且因此,將在框910中連續(xù)處理的多音軌記錄回放中循環(huán)這些第二、第三和第四節(jié)拍。在這種布置中,可以作為多音軌記錄的另一分離音軌的基礎,記錄和處理在單個條的結(jié)尾之后接收到的任何可聽輸入??梢詫⒎蛛x音軌的這種附加處理表示為通過至少框910、920和922的分離迭代。
[0073]在至少一個可替換實施例中,可以基于在框922處接收到的可聽輸入的長度來動態(tài)調(diào)整循環(huán)回放的長度。即,可聽輸入可能自動導致當前在框910中回放的多音軌記錄的音軌的長度的擴展。例如,如果在當前實況循環(huán)的長度已被回放之后接收到附加可聽輸入,則可以進一步記錄和維持該更長可聽輸入以導出為新音頻音軌。在這種布置中,可以在后續(xù)實況循環(huán)內(nèi)重復多音軌記錄的先前音軌,以匹配接收到的可聽輸入的長度。在一個實施例中,可以執(zhí)行較短先前多音軌記錄的重復整數(shù)次數(shù)。該整數(shù)次數(shù)的重復保持了先前記錄的較短多音軌記錄的多個條之間的關系,如果有的話。以這種方式,可以動態(tài)更改多音軌記錄和實況循環(huán)的循環(huán)點。
[0074]類似地,在框922處接收的音軌的長度可以比當前播放的實況循環(huán)(即,在四條長的實況循環(huán)的回放期間接收僅一個條的可聽輸入)的長度更短。在這種布置中,當在至少閾值音量的可聽輸入的接收和記錄后的預定時間(例如,所選數(shù)目的秒)之后尚未接收到附加可聽輸入時,可以檢測到可聽輸入的結(jié)尾。在一個實施例中,該靜默的檢測可以基于高于當前實況循環(huán)的閾值音量的輸入的缺失。可替換地或附加地,可以通過手動信號的接收來發(fā)信號通知可聽輸入的結(jié)尾??梢跃途哂信c多音軌記錄相同數(shù)目的節(jié)拍的條的數(shù)目而言確定該較短可聽輸入的關聯(lián)長度。在一個實施例中,條的該數(shù)目被選擇為當前實況循環(huán)的長度的因素。在每一種情況下,一旦在框924處被轉(zhuǎn)換為音軌,可聽輸入就可以被手動或自動選擇以重復足以與當前正在回放的多音軌記錄的長度相匹配的次數(shù)。
[0075]在框924中,可以由音頻轉(zhuǎn)換器140將接收到的可聽輸入轉(zhuǎn)換為音頻音軌。如上所討論,該音頻轉(zhuǎn)換過程可以包括各種操作,其包括分區(qū)、量化、頻率檢測和移位、樂器轉(zhuǎn)換、增益控制、諧波生成、添加特效和手動調(diào)整。這些音頻轉(zhuǎn)換操作中的每一個的順序可以被更改,并在至少一個實施例中可以由終端用戶配置。此外,可以選擇性地應用這些操作中的每一個,從而使得能夠利用如所需要那樣多或如所需要那樣最小的附加處理將可聽輸入轉(zhuǎn)換為音頻音軌。例如,可能不選擇樂器轉(zhuǎn)換,從而允許來自可聽輸入的一個或多個原始聲音基本上被包括在具有其原始音色的所生成的音頻音軌中。在框924中,可以應用回聲消除過程以濾除掉在來自主動記錄的音頻音軌的實況循環(huán)期間播放的其他音軌的音頻。在一個實施例中,這可以是通過下述操作來實現(xiàn)的:識別在實況循環(huán)期間播放的音頻信號;確定輸出音頻信號與輸入音頻信號之間的任何延遲;將輸出音頻信號濾波和延遲成類似于輸入音頻信號;以及從輸入音頻信號減去輸出音頻信號??墒褂玫囊环N優(yōu)選回聲消除過程是由iZotope實現(xiàn)的過程,盡管也可以使用其他實施方式。隨后可以應用或移除框924的過程,如本文關于框942進一步討論的那樣。在框924處將可聽輸入轉(zhuǎn)換為所生成的音頻音軌之后,過程900在框926處繼續(xù)。
[0076]在框926處,可以將來自框924的所生成的音頻音軌實時添加到多音軌記錄。這可以是已經(jīng)發(fā)起的多音軌,或者可替換地,這可以是具有作為其第一音軌而包括的音頻音軌的新的多音軌。在框926之后,過程900可以再次開始于判決框910處,其中,可以利用所包括的最近生成的音頻音軌來回放多音軌。盡管操作922、924和926被示作在圖9中串行執(zhí)行,但是還可以針對每個接收到的可聽輸入并行執(zhí)行這些步驟,以便進一步實現(xiàn)對可聽輸入信號的實時記錄和回放。在每個可聽輸入期間,可以例如針對從可聽輸入識別的每個分離聲音,執(zhí)行這種并行處理,盡管可替換實施例可以包括可聽輸入信號的其他不同大小的部分。
[0077]在判決框940處,進行是否要修改多音軌記錄中的一個或多個音頻音軌的確定。例如,可以接收指示對一個或多個先前記錄的音頻音軌進行修改的終端用戶期望的輸入。在一個實施例中,可以通過手動輸入來接收指示。如上所提及,還可以在當前記錄的多音軌記錄的回放期間執(zhí)行該修改,從而允許針對終端用戶的多音軌記錄的當前狀態(tài)的立即評價。在一個實施例中,該指示可以包括期望將調(diào)整應用于的多音軌記錄的一個或多個音軌。這些音軌還可以包括被手動添加給多音軌記錄的一個或多個新音軌。如果接收到音軌修改的指示,則過程900在框942處繼續(xù);否則,過程900在判決框960處繼續(xù)。
[0078]在框942處,接收一個或多個先前轉(zhuǎn)換的音軌的參數(shù),并可以由終端用戶輸入調(diào)整后的參數(shù)。修改的參數(shù)可以包括可使用音頻轉(zhuǎn)換器140的過程完成的任何調(diào)整,除了其他示例之外,該過程可以包括使音軌減弱或獨奏、移除整個音軌、調(diào)整音軌中的樂器的打擊速度、調(diào)整音軌的音量水平、調(diào)整實況循環(huán)中的所有音軌的回放的拍子、添加或移除來自音軌的所選時間增量的分離聲音、調(diào)整實況循環(huán)的長度和/或多音軌記錄的總體長度。調(diào)整實況循環(huán)的長度可以包括:更改關于總體多音軌記錄的循環(huán)的起始和結(jié)束點,和/或還可以包括將更多條添加到當前正在實況循環(huán)中重復的音軌、添加和/或附加多音軌記錄的先前記錄的條(其中,音軌的至少子集先前與這些條相關聯(lián))、或者從多音軌記錄中刪除條。新音軌的添加可能需要該新音軌的各個方面由終端用戶手動輸入。此外在框942處,可以通過使用聲音搜索器模塊150針對附加音軌進行搜索,以促進終端用戶對先前記錄的音頻音軌的重用。
[0079]在框944處,將調(diào)整后的參數(shù)應用于在判決框940處指示的一個或多個音軌。該應用可以包括將調(diào)整后的參數(shù)轉(zhuǎn)換為與調(diào)整后的一個或多個音軌兼容的格式。例如,可以將一個或多個數(shù)值參數(shù)調(diào)整成與適用于MIDI或其他協(xié)議格式的一個或多個值相對應。在框944之后,過程900可以再次開始于判決框910處,其中,可以利用所包括的一個或多個修改后的音頻音軌來回放至少多音軌記錄的與實況循環(huán)相對應的部分。
[0080]在判決框960處,進行是否要修改記錄設置的確定。例如,可以接收指示用戶是否期望修改記錄設置的一個或多個方面的輸入。還可以通過手動輸入來接收該指示。該指示可以推進對要調(diào)整的記錄設置的一個或多個參數(shù)設置。如果終端用戶期望修改記錄步驟,則過程900在框962處繼續(xù);否則,過程900在判決框980處繼續(xù)。
[0081]在框962處,可以校準記錄系統(tǒng)。特別地,可以校準包括至少音頻輸入源、音頻輸出源和音頻音軌處理部件的記錄電路,以結(jié)合設備50確定系統(tǒng)100的等待時間,優(yōu)選地,該等待時間是在通過音頻輸出源回放聲音與通過音頻輸入源接收可聽輸入之間以數(shù)千秒測量的。例如,如果記錄電路包括耳機和麥克風,則可以由RSLL 142確定該等待時間以改進可聽輸入的接收和轉(zhuǎn)換,特別地,正在回放的多音軌記錄的節(jié)拍與接收到的可聽輸入之間的相對定時的確定。在框962處的校準(如果有的話)之后,過程900繼續(xù)至框964。
[0082]在框964處,可以改變其他記錄系統(tǒng)參數(shù)設置。例如,可以開啟或關閉節(jié)拍音軌的回放。此外,可以修改新音軌或新多音軌記錄的缺省設置,諸如,可以提供框924的可聽輸入的缺省拍子和缺省轉(zhuǎn)換集合。還可以在框964處改變當前多音軌記錄的拍號。還可以提供與數(shù)字音頻工作站相關聯(lián)的其他設置,使得這些其他設置可以由終端用戶修改,如本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解的那樣。在框964之后,過程900可以返回至判決框910,其中,可以將對記錄系統(tǒng)的調(diào)整應用于多音軌記錄的音頻音軌的后續(xù)記錄和修改。
[0083]在框980處,進行是否要結(jié)束記錄伴奏的確定。例如,可以從手動輸入接收指示伴奏的結(jié)束的輸入??商鎿Q地,如果例如數(shù)據(jù)存儲器132為滿,則設備50可以發(fā)起伴奏的結(jié)束。如果接收到伴奏結(jié)束指示,則可以針對附加操作存儲和/或傳輸多音軌記錄。例如,可以將多音軌記錄存儲在數(shù)據(jù)存儲器132中,以用于未來在初始創(chuàng)建多音軌記錄的伴奏的持續(xù)或新伴奏中的檢索、檢查和修改。還可以通過網(wǎng)絡將多音軌記錄從設備50傳輸至另一設備50,以用于在與用戶賬戶相關聯(lián)的至少一個遠程數(shù)據(jù)存儲器中存儲。還可以通過網(wǎng)絡服務器來與在線音樂社區(qū)共享所傳輸?shù)亩嘁糗売涗洠蛘呖梢栽谟删W(wǎng)絡服務器托管的游戲中共享所傳輸?shù)亩嘁糗売涗洝?br>
[0084]如果記錄伴奏未結(jié)束,則過程900再次返回至判決框910。這種事件序列可以表示用戶在決定哪些(如果有的話)附加音軌要被生成或其他修改(如果有的話)要被執(zhí)行的同時正在收聽實況循環(huán)的時段。本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解,圖9中的流程圖圖示的每個框(或者以其他方式)以及流程圖圖示中的框的組合可以由計算機程序指令實現(xiàn)。這些程序指令可以被提供給處理器以產(chǎn)生機器,使得在該處理器上執(zhí)行的指令創(chuàng)建用于實現(xiàn)在一個或多個流程圖框中指定的動作的裝置。計算機程序指令可以由處理器執(zhí)行,以使一系列操作步驟由該處理器執(zhí)行,以產(chǎn)生計算機實現(xiàn)過程,使得在該處理器上執(zhí)行的指令提供用于實現(xiàn)在一個或多個流程圖框中指定的動作的步驟。計算機程序指令還可以使流程圖的框中所示的操作步驟中的至少一些被并行執(zhí)行。此外,還可以跨越多于一個處理器執(zhí)行步驟中的一些,諸如在多處理器計算機系統(tǒng)中可能發(fā)生的那樣。此外,流程圖圖示中的一個或多個框或框組合還可以與其他框或框組合同時執(zhí)行,或者甚至在不脫離本發(fā)明的范圍或精神的情況下按與所圖示不同的順序執(zhí)行。相應地,流程圖圖示的框支持用于執(zhí)行指定動作的裝置的組合、用于執(zhí)行指定動作的步驟的組合和用于執(zhí)行指定動作的程序指令裝置。還將理解,流程圖圖示的每個框以及流程圖圖示中的框組合可以由執(zhí)行指定動作或步驟的專用的基于硬件的系統(tǒng)實現(xiàn)或者由專用硬件和計算機指令的組合實現(xiàn)。
[0085]現(xiàn)在將關于可與實現(xiàn)音頻轉(zhuǎn)換器140和RSSL模塊142的用戶界面相關聯(lián)的各種屏幕顯示器來描述本發(fā)明的特定方面的操作。所圖示的實施例是可與系統(tǒng)100的操作相關聯(lián)地采用的非限制性非窮盡性示例用戶界面。各種屏幕顯示器可以包括比所示出的部件多許多或少許多的部件。此外,部件的布置不限于在這些顯示器中示出的布置,并且還可以想到其他布置,包括各種部件在不同界面上的設置。然而,所示出的部件不足以公開用于實施本發(fā)明的說明性實施例。
[0086]圖10、10A和IOB —起圖示了實現(xiàn)RSLL 142以及音頻轉(zhuǎn)換器140的方面以記錄和修改多音軌記錄的音軌的一個用戶界面。界面1000的總體顯示可以被視為“控制空間”??梢曰趤碜杂脩舻氖謩虞斎?諸如,通過使用鼠標54、觸摸屏80、壓板或被布置為響應于和傳達物理控制的設備)來操作在界面上顯示的每個控制。如所示的那樣,界面1000顯示記錄伴奏和作為該伴奏的一部分而生成的多音軌記錄的各個方面。文件菜單1010包括用于創(chuàng)建新多音軌記錄或加載先前記錄的多音軌記錄的操作,如本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解的那樣。
[0087]拍子控件1012以每分鐘的節(jié)拍顯示多音軌記錄的拍子。拍子控件1012可以由用戶直接手動修改。條控件1014顯示多音軌記錄的條數(shù)目。條控件1014可以被配置為顯示在實況循環(huán)期間的當前條數(shù)目、總體條數(shù)目、或者可替換地可以用于選擇多音軌記錄的特定條數(shù)目以用于進一步顯示在界面1000中。
[0088]節(jié)拍控件1016顯示多音軌記錄的節(jié)拍數(shù)目。節(jié)拍控件1016可以被配置為顯示每個條的節(jié)拍的總數(shù),或者可替換地顯示在多音軌記錄的回放期間的當前節(jié)拍數(shù)目。時間控件1018顯示多音軌記錄的時間。該時間控件1018可以被配置為顯示多音軌記錄的總體時間、當前選擇的實況循環(huán)的時間長度、在實況循環(huán)期間的絕對或相對時間、或者可以用于跳到多音軌記錄的特定絕對時間??梢栽趫D9的框964中改變界面1000的控件(諸如,控件1012、1014、1016、1018和1021-1026)的操作??丶?020與關于圖9的框942和962進一步討論的音軌和記錄設置調(diào)整相對應。
[0089]添加音軌控件1021使用戶能夠?qū)⒁糗壥謩犹砑拥蕉嘁糗売涗?。在選擇控件1021時,將新音軌添加到多音軌記錄,并將該界面更新為包括針對所添加的音軌的附加控件1040-1054,其操作被如下討論。呈現(xiàn)WAV控件1022生成和存儲來自多音軌記錄的至少一部分的WAV文件。在該WAV文件中呈現(xiàn)的多音軌記錄的部分以及其他存儲參數(shù)可以由用戶在選擇呈現(xiàn)WAV控件1022時進一步輸入。此外,除WAV外,其他音頻文件格式也可以通過諸如控件1022之類的控件而可用。
[0090]節(jié)拍音軌控件1023切換節(jié)拍音軌的回放。裝備控件1024切換開和關RSLL 142的記錄部件以及設備的記錄可聽輸入的能力。裝備控件1024使終端用戶能夠與其他用戶講話,實行嗓音輸入,并在記錄伴奏期間創(chuàng)建其他可聽聲音而不使這些聲音轉(zhuǎn)換為由RSLL142進一步處理的可聽輸入。
[0091]電路參數(shù)控件1025使用戶能夠校準記錄電路參數(shù),如關于圖11進一步討論的那樣。滑塊1026使多音軌記錄回放的音量能夠被控制。回放控件1030實現(xiàn)對多音軌記錄的回放。該回放是與通過控件1012-1018進一步顯示和控制的記錄參數(shù)協(xié)作地進行的。例如,回放控件1030可以發(fā)起來自經(jīng)由控件1014-1018指示的位置且以在控件1012中顯示的拍子進行的多音軌記錄的回放。如上所提及,該控件1030還實現(xiàn)對用于生成多音軌記錄的另一音頻音軌的附加可聽輸入的記錄。位置控件1032還可以用于控制多音軌記錄的當前回放位置。例如,控件1032可以使回放在多音軌記錄的絕對開始處或者可替換地在當前實況循環(huán)的開始處被發(fā)起。
[0092]用戶界面1000上的網(wǎng)格1050表示多音軌記錄的一個或多個音軌內(nèi)的分離聲音的回放和定時,其中,每行表示個體音軌,并且每列表示時間增量。每行可以例如包括單個條中的每個時間增量的框??商鎿Q地,每行可以包括足夠的框以表示實況循環(huán)的總體持續(xù)時間的時間增量。網(wǎng)格1050中的具有第一陰影或顏色的框(諸如框1052)可以表示在實況循環(huán)期間回放聲音的位置處的相對定時,而其他框(諸如框1054)中的每一個指示不回放分離聲音的音軌內(nèi)的時間增量。經(jīng)由手動控件1021添加的音軌初始包括諸如框1054之類的框。框(諸如框1052或框1054)的選擇可以在與所選框相關聯(lián)的時間增量處添加或移除來自音軌的聲音。經(jīng)由向網(wǎng)格1050中的框的手動輸入而添加的聲音可以包括針對音軌而選擇的樂器的缺省聲音,或者可替換地包括從音軌的可聽輸入量化的至少一個聲音的拷貝。對于網(wǎng)格1050的該手動操作使可聽輸入能夠生成音軌的一個或多個聲音,然而在該音軌內(nèi)的手動選擇的位置處添加這些聲音中的一個或多個的拷貝。
[0093]進度條1056在視覺上指示多音軌記錄的當前回放位置的時間增量。網(wǎng)格1050中的每個音軌與音軌控件1040、1042、1044、1046和1048的集合相關聯(lián)。移除音軌控件1040使得能夠從多音軌記錄移除音軌,并可以被配置為選擇性地從多音軌記錄的一個或多個條移除首軌。
[0094]樂器選擇控件1042實現(xiàn)對在所生成的音頻音軌中將可聽輸入的聲音轉(zhuǎn)換至的樂器的選擇。如圖1OA中所示,可以從下拉菜單手動選擇包括打擊樂器或其他類型的非打擊樂器的多種樂器??商鎿Q地,可以針對每個給定音頻音軌自動選擇或預先確定缺省樂器或缺省樂器進展。當未選擇樂器時,所生成的音頻音軌中的每個聲音可以基本上對應于與初始可聽輸入的音色一起包括的原始可聽輸入的聲音。在一個實施例中,可以基于訓練RSLL142來選擇樂器,以基于例如每個特定聲音的頻帶的分類將可聽聲中的特定聲音自動轉(zhuǎn)換為關聯(lián)的樂器聲音。
[0095]減弱/獨奏控件1044使關聯(lián)的音軌減弱或使除與控件1044相關聯(lián)的音軌外的所有其他音軌減弱。速度控件1046實現(xiàn)對針對轉(zhuǎn)換后的音頻音軌生成的樂器聲音的初始啟動(attack)或打擊強度的調(diào)整,這可能影響針對關聯(lián)音頻音軌生成的每個樂器聲音的峰值、持續(xù)時間、釋放和總體幅度形狀??梢允謩虞斎牖蛘呖商鎿Q地基于從其生成一個或多個樂器聲音的可聽輸入聲音的屬性來提取這種速度。音量控件1048實現(xiàn)對多音軌記錄中的每個音軌的回放音量的個體控制。
[0096]圖11圖示了用于校準記錄電路的界面1100的一個實施例。界面1100可以表示可在控件1025 (見圖10A)被選擇時出現(xiàn)的屏幕顯示彈出窗口等的一個示例。在一個實施例中,界面1100包括實現(xiàn)對接收到的可聽輸入的幅度的調(diào)整的麥克風增益控件1110。上控件1120和下控件1130以及半壽命控件1140提供用于將接收到的信號識別為可聽輸入以供系統(tǒng)100進一步處理的附加控制和確證。校準電路發(fā)起預定節(jié)拍音軌并可以將用戶引導為在可聽輸入信號中復制該節(jié)拍音軌。在可替換實施例中,用于校準的節(jié)拍音軌可以由諸如麥克風之類的音頻輸入設備直接接收作為可聽輸入,而無需用戶可聽地復制節(jié)拍音軌?;诠?jié)拍音軌中的聲音的生成與可聽輸入中的聲音的接收之間的相對定時差,可以確定系統(tǒng)等待時間1160。該等待時間值可以由RSLL 142進一步采用,以改進可聽輸入的量化以及多音軌記錄的回放與針對要被添加到多音軌記錄的附加音頻音軌的后續(xù)導出而接收的可聽輸入之間的所檢測到的相對定時。
[0097]因此,如所圖示的那樣,界面1100和1110給用戶呈現(xiàn)了熱情且沒有威脅、強大且一致、但在學習方面直觀的控制空間,這對不是專業(yè)樂者或以其他方式不熟悉數(shù)字音頻著作工具的外行用戶來說特別重要。
[0098]圖12A、12B和12C—起圖示了可與多音軌記錄中的音頻音軌的記錄和修改相關聯(lián)地使用的又一示例性視覺顯示器。在該示例中,以圖形方式提供聲頻(實際的和形態(tài)的(由頻移器210進行的后頻移))、分區(qū)、量化和拍子信息,以給用戶提供甚至更直觀的體驗。例如,首先轉(zhuǎn)至圖12A,提供了用于實況循環(huán)的圖形控制空間1200。該控制空間包括標識音軌中的分區(qū)(或音樂小節(jié))(在圖12A-C的情況下,示出了小節(jié)I至4)中的每一個的多個分區(qū)指示符1204。在圖12A-C中所示的圖形用戶界面的一個實施例中,垂直線1206圖示了每個小節(jié)內(nèi)的節(jié)拍,其中,每小節(jié)的垂直線數(shù)目優(yōu)選地對應于拍號的頂數(shù)字。例如,如果樂曲被選擇為使用3/4拍號而作曲,則每個小節(jié)將包括三個垂直線,以指示在該小節(jié)或分區(qū)中存在三個節(jié)拍。在圖12A-C中所示的用戶界面的相同實施例中,水平線1208還可以標識與可聽輸入要被轉(zhuǎn)換至的所選樂器相關聯(lián)的基頻。如圖12A-C的實施例中進一步圖示的那樣,還可以提供樂器圖標1210以指示所選樂器,諸如圖12A-C中所選的吉他。
[0099]在圖12A-C中所示的實施例中,實線1212表示如終端用戶用嗓音或使用樂器記錄的一個音軌的音頻波形;而多個水平條1214表示已由音頻轉(zhuǎn)換器140的量化器206和頻移器210從音頻波形生成的音符的形態(tài)。如所描繪的那樣,所生成的形態(tài)的每個音符已被在時間上移位以與每個分區(qū)的節(jié)拍對準且在頻率上移位以與所選樂器的基頻之一相對應。
[0100]如通過將圖12A與圖12B與圖12C進行比較而描繪的那樣,還可以提供回放條1216以標識與圖9的過程有關的當前正在由音軌記錄器202播放的實況循環(huán)的特定部分。因此,在實況循環(huán)被播放時,回放條1216從左移動到右。在到達第四小節(jié)的結(jié)尾時,回放條返回至小節(jié)I的開始并再次順序地重復循環(huán)。終端用戶可以通過在循環(huán)中的適當點處記錄附加音頻來在實況循環(huán)內(nèi)的任何點處提供附加音頻輸入。盡管在圖12A-C中未示出,但是每個附加記錄可以用于提供新音軌(或音符集合)以在實況循環(huán)內(nèi)描繪??梢酝ㄟ^添加附加樂器圖標1210將分離音軌與不同樂器相關聯(lián)。
[0101]圖13A、13B和13C —起圖示了用于經(jīng)由圖12A-C的界面手動更改先前生成的音符的過程的一個示例。如圖13A中所示,終端用戶可以使用指針1304來選擇一個特定音符1302。如圖13B中所示,終端用戶然后可以與另一水平線1208垂直地拖拽音符,以更改所拖拽的音符的音高。在該示例中,音符1302被示作移動到更高基頻。可以想到,音符還可以被移動到樂器的基頻之間的頻率。如圖13C中所示,還可以通過選擇音符的形態(tài)描繪的結(jié)尾并且然后水平地拖拽該音符來更改該音符的定時。在圖13C中,音符1304的持續(xù)時間已經(jīng)被延長。同樣如圖13C中所描繪,延長音符1304的結(jié)果是由量化器206對音符1306的自動縮短,以維持節(jié)拍和避免由單個樂器演奏重疊音符。如本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解的那樣,可以使用相同或相似的方法來縮短所選音符的持續(xù)時間,從而導致另一相鄰音符的自動延長,并且進一步地,可以以關于修改形態(tài)描繪的尾部而圖示的相同方式從該描繪的開始處改變音符的持續(xù)時間。本領域技術人員還應當類似地理解,可以使用相同方法來從音軌中刪除音符或者拷貝音符以在音軌的其他部分處插入。
[0102]圖14A、14B和14C圖示了與系統(tǒng)100 —起使用的又一示例性視覺顯示器。在該示例中,該視覺顯示器使用戶能夠記錄和修改與打擊樂器相關聯(lián)的多音軌記錄。首先轉(zhuǎn)至圖14A,控制空間1400包括網(wǎng)格1402,網(wǎng)格1402表示一個或多個打擊樂器音軌內(nèi)的分離聲音的回放和定時。如圖12A-C的圖示中那樣,在圖14A-C的示例中描繪了分區(qū)1-4,每個分區(qū)具有四個節(jié)拍。例如,在圖14A中,網(wǎng)格1402的第一行表不與第一低音鼓相關聯(lián)的聲音的回放和定時,網(wǎng)格1402的第二行表不與小軍鼓相關聯(lián)的聲音的回放和定時,網(wǎng)格1402的第三和第四行表不與鐃鈸相關聯(lián)的聲音的回放和定時,并且網(wǎng)格1402的第五行表不與落地鼓相關聯(lián)的聲音的回放和定時。如本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解的那樣,這些特定打擊樂器及其在網(wǎng)格1402上的順序僅意在圖示構(gòu)思,而不應當被視為將構(gòu)思限于該特定示例。[0103]網(wǎng)格中的每個框表示與相關打擊樂器相關聯(lián)的聲音的定時增量,其中,非陰影框指示沒有聲音要在該時間增量處被播放,并且陰影框指示在該時間增量處要播放聲音(與相關打擊樂器的音色相關聯(lián))。因此,圖14A圖示了沒有聲音要被播放的示例,圖14B圖示了要在由陰影框指示的時間處播放低音鼓的聲音的示例,并且圖14C圖示了要在由陰影框指不的時間處播放符號和低音鼓的聲音的不例。對于每個打擊樂器音軌,可以以各種方式將與特定打擊樂器相關聯(lián)的聲音添加至樂器的音軌。例如,如圖14B或14C中所示,可以提供回放條1404,以在視覺上指示在實況循環(huán)期間多音軌記錄的當前回放位置的時間增量。因此,在圖14B中,回放條指示第三小節(jié)的第一節(jié)拍當前正在被播放。然后,可以使用戶能夠通過在回放條1404處于與特定節(jié)拍相關聯(lián)的框上時記錄聲音來以特定節(jié)拍添加與特定打擊樂器相關聯(lián)的聲音。在一個實施例中,聲音要與之相關聯(lián)的樂器音軌可以由選擇或敲擊適當樂器的用戶手動識別。在這種情況下,由用戶作出的聲音的特定特性和音高可能不重要,盡管可以想到,由用戶作出的聲音的音量可能影響針對打擊樂器音軌生成的關聯(lián)聲音的增益??商鎿Q地,由用戶作出的聲音可以指示聲音要與之相關聯(lián)的打擊樂器。例如,用戶可以發(fā)出聲音“boom”、“tSk”或“ka”,以分別指示低音鼓、符號或筒鼓節(jié)拍。在又一實施例中,可以使用戶能夠通過點擊或選擇網(wǎng)格1402中的框來簡單地添加或移除來自音軌的聲
曰?
_4] 多曲段自動合成模塊。
[0105]MTAC模塊144 (圖1A)被配置為結(jié)合音頻轉(zhuǎn)換器140以及可選地結(jié)合RSLL 142進行操作,以實現(xiàn)對從一系列曲段導出的單個“最佳”曲段的自動制作。在圖15中圖示了MTAC模塊144的一個實施例。在該實施例中,MTAC模塊144包括用于對來自所記錄的音頻的每個曲段的分區(qū)進行 打分的分區(qū)打分器1702以及用于基于由分區(qū)打分器1702識別的得分來集合單個“最佳”曲段的合成器1704。
[0106]分區(qū)打分器1702可以被配置為基于一個或多個準則來對分區(qū)進行打分,這可以利用在處理器2902上運行的一個或多個過程。例如,可以基于相對于針對總體樂曲選擇的音調(diào)的分區(qū)的音調(diào)來對分區(qū)進行打分。通常,演奏者可能在不知道的情況下唱出走調(diào)音符。因此,還可以基于音符的音調(diào)與分區(qū)的合適音調(diào)之間的差異來對該分區(qū)內(nèi)的音符進行打分。
[0107]然而,在許多情況下,新手終端用戶可能不知道他想要唱什么音樂音調(diào)。因此,分區(qū)打分器1702還可以被配置為自動識別音調(diào),這可以被稱作“自動音調(diào)檢測”。利用“自動音調(diào)檢測”,分區(qū)打分器1702可以確定與終端用戶的所記錄的音頻演奏的音調(diào)最接近的音調(diào)。系統(tǒng)50可以突出顯示從自動檢測到的音調(diào)走調(diào)的任何音符,并可以進一步將這些音符自動調(diào)整至處于自動確定的音調(diào)符號中的基頻。
[0108]在圖16中描繪了一種用于確定音樂音調(diào)的說明性過程。如第一框中所示,該過程利用對音調(diào)內(nèi)的每個基頻給出的權重,針對12個音樂音調(diào)(C,C#/Db,D#/Eb,E, F,F(xiàn)#/Gb,G,G#/Ab,A,A#/Bb,B)中的每一個對整個音軌進行打分。例如,某任意大調(diào)的音調(diào)權重陣列可能看起來像這樣[1,-1, I, -1, I, I, -1, I, -1, I, -1, I],這給以Do開始且以Re繼續(xù)等等的音階中的12個音符中的每一個指派權重。給每個音符(或來自主音的音程)指派權重適用于任何類型的音調(diào)。走調(diào)的音符被給出負權重。盡管權重的量值一般不那么重要,但是它們可以被調(diào)整至個體用戶品味或者基于來自類型匹配器模塊152的輸入而調(diào)整。例如,在音調(diào)上的一些音對該音調(diào)來說更具決定性,因此其權重的量值可能較高。此外,不在音調(diào)上的一些音比其他音更普遍;其可以保持為負擔具有較小量值。因此,將可能的是,用戶或系統(tǒng)100(基于例如來自類型匹配器模塊152的輸入)開發(fā)大調(diào)的更改善的keyWeights(音調(diào)權重)陣列,其可以是[1,-1,.5,-.5,.8,.9, -1, I, -.8,.9, -.2,.5]。12個大調(diào)中的每一個將與權重陣列相關聯(lián)。如本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解的那樣,可以通過選擇參考示出音符在音調(diào)內(nèi)的相對位置的任何文檔而計及音調(diào)內(nèi)的音的每個陣列的權重來適應小調(diào)(或任何其他音調(diào))。
[0109]如圖16的第三框中所示,將每個音符的對總體段落(或分區(qū))的持續(xù)時間的相對持續(xù)時間乘以當前針對循環(huán)而分析的音調(diào)中的音符的音高等級的“權重”,以確定段落中的每個音符的得分。在每個段落的起始處,使得分歸零,然后將如與當前音調(diào)比較的每個音符的得分彼此相加,直到在段落中不存在更多音符,并且過程循環(huán)回來以開始關于下一音調(diào)來分析段落。該過程的主循環(huán)的結(jié)果是反映段落中的每個音符的所有得分的合計的每個音調(diào)的單個音調(diào)得分。在圖16的過程的最后一框中,具有最高得分的音調(diào)將被選擇為BestKey(最佳音調(diào))(即,對段落來說最適當)。如本領域技術人員將理解的那樣,不同音調(diào)可能打成平局或具有足夠相似的得分以實質(zhì)上打成平局。
[0110]在一個實施例中,可以使用下述公式來確定音調(diào)中的音符的音高等級,由圖17中的值“index (索引)”表不:index: = (note, pitch - key +12) % 12,其中,note, pitch表示與樂器的特定音高相關聯(lián)的數(shù)值,其中,優(yōu)選地,該數(shù)值是按增加音高的順序指派的。舉鋼琴為例,其具有88個首調(diào),每個首調(diào)可以與I和88之間含I和88在內(nèi)的數(shù)值相關聯(lián)。例如,音調(diào)I可以是AO雙踏A,音調(diào)88可以是CS第八個八度音階,并且音調(diào)40可以是中央C0
[0111]可以期望,與利用前述方式實現(xiàn)的精度相比改進音樂音調(diào)確定的精度。在期望這種改進的精度的情況下,分區(qū)打分器1702 (或者可替換地,和聲器146 (下面討論))可以確定是否頂部4個最可能的音調(diào)(由初始音調(diào)確定方法(上面描述)確定)中的每一個具有一個或多個大調(diào)或小調(diào)模式。如本領域技術人員在其面前有本說明書時將理解的那樣,在可能音調(diào)的數(shù)目越大則處理需求越大這一理解下,可以確定任何多個可能音調(diào)的大調(diào)或小調(diào)模式以實現(xiàn)音調(diào)符號精度上的改進。
[0112]可以通過對被饋給到分區(qū)打分器1702 (或者在一些實施例中,由主奏音樂源2404饋給到和聲器146)的音符執(zhí)行音程分布來進行下述確定:是否可能音調(diào)中的每一個具有一個或多個大調(diào)或小調(diào)模式。如圖16A中所示,使用12x12矩陣來執(zhí)行該音程分布,以反映每個可能音高等級。最初,將該矩陣中的值設置為O。然后,對于該一系列音符中的每個音符到音符轉(zhuǎn)移,將兩個音符的持續(xù)時間的平均值加到由PitchClass (音高等級)第一音符:PitchClass第二音符定義的位置處保存的任何預先存在的矩陣值。因此,例如,如果該一系列音符是:
WffIeId IcIdIe Ie
持續(xù)時間_T 0.5 ~~ 0.5 T
這將得到圖16A中描繪的矩陣值。然后,結(jié)合大調(diào)音程分布和小調(diào)音程分布(如下面所討論)使用該矩陣,以計算小調(diào)和以及大調(diào)和。大調(diào)和小調(diào)音程分布中的每一個是12x12矩陣,其包含像圖16A的矩陣那樣的每個可能音高等級,其中,矩陣的每個索引具有-2與2之間的整數(shù)值,以對每個音調(diào)中的各種音高的值進行加權。如本領域技術人員將理解的那樣,音程分布中的值可以被設置為整數(shù)值的不同集合,以實現(xiàn)不同的音調(diào)分布。在圖16B中示出了大調(diào)音程分布的值的一個可能集合,而在圖16C中示出了小調(diào)音程分布的值的一個可能集合。
[0113]然后,可以計算小調(diào)和以及大調(diào)和如下:
1.將小調(diào)和以及大調(diào)和初始化為O;
2.對于音符轉(zhuǎn)移陣列中的每個索引,將整數(shù)值乘以其在小調(diào)音程分布矩陣中的對應位置中的值;
3.將每個乘積加到現(xiàn)行(running)小調(diào)和;
4.對于音符轉(zhuǎn)移陣列中的每個索引,將所存儲的值乘以其在大調(diào)音程分布矩陣中的對應位置;以及
5.將乘積加到現(xiàn)行大調(diào)和。
[0114]在針對矩陣中的每個索引完成這些乘積求和計算之后,將大調(diào)和以及小調(diào)和的值與被指派給通過初始音調(diào)符號而確定的多個最可能音調(diào)的得分進行比較,并且進行關于哪個音調(diào)/模式組合為最佳的確定。在針對矩陣中的每個索引完成這些乘積求和計算之后,將大調(diào)和以及小調(diào)和的值乘以其在每個音程分布中的對應矩陣索引。隨后,這些乘積之和構(gòu)成給定集合的音符處于該模式中的可能性的最終評價。音程,對于圖16A中闡述的示例,對于 C 大調(diào)模式(圖 16B),我們將具有:(1.25 * 1.15) + (1.5 *.08) + (.75 *.91) +(.75 *.47) + (.75 * -.74) = 1.4375 +.12 +.6825 +.3525 + (-.555) = 2.0375。因此,對于C大調(diào),示例旋律將得到2.0375的得分。
[0115]然而,然后,為了確定該模式是否為小調(diào)的值,我們需要將小調(diào)音程分布移位到相對小調(diào)中。這樣做的原因在于:音程分布被設置以將該模式的主音(不是音調(diào)符號的基音)視為我們的第一列和第一行。我們可以通過查看潛在的音樂來理解理解為什么這是真的。任何給定的音調(diào)符號可以是大調(diào)或小調(diào)。例如,與C大調(diào)的音調(diào)符號兼容的大調(diào)模式是C大調(diào)模式。與C大調(diào)的音調(diào)符號兼容的小調(diào)模式是A (自然)小調(diào)模式。由于當考慮C小調(diào)模式時,我們的小調(diào)音程中的左上角數(shù)值表示從C到C的轉(zhuǎn)移,因此比較的所有索引將被移位3個步長(或者更具體地,向右3列且向下3行),這是由于相對于大調(diào)符號的主音/基音,小調(diào)符號的主音/基音向下3個半音。一旦被移位3個步長,在A小調(diào)模式中,我們的音程分布中的左上角數(shù)值表示從A到A的轉(zhuǎn)移。使用我們的圖16A示例來達到數(shù)字(在該移位后的矩陣的情況下):(1.25 *.67) + (1.5 * '08) + (.75 *.91) + (.75 *.67) +(.75 * 1.61) =.8375 + (-.12) +.6825 +.5025 + 1.2075 = 3.11。然后,為了將兩個模式結(jié)果進行比較,我們需要歸一化這兩個音程矩陣。為了這樣做,我們簡單地針對每個矩陣將所有矩陣值加在一起并除以和值。我們發(fā)現(xiàn),大調(diào)矩陣具有累積和的大致1.10比率,音程,我們將我們的小調(diào)模式值乘以該量,以歸一化兩個模式結(jié)果。音程,來自我們示例的結(jié)果將是:音符的示例性集合最可能處于A小調(diào)模式,這是由于3.11 * 1.10 = 3.421,其大于2.0375 (大調(diào)模式的結(jié)果)。
[0116]上述相同過程將適用于任何音調(diào)符號,只要音符轉(zhuǎn)移的初始矩陣相對于所考慮的音符即可。因此,使用圖16A作為參考,如果在不同的示例作曲中,所考慮的音調(diào)符號是F大調(diào),則初始矩陣行和列以及由圖16B和圖16C表示的音程分布的行和列將以F開始并以E結(jié)束,而不是以C開始并以B結(jié)束(如圖16A中所示)。[0117]在終端用戶知道他們希望處于哪個音樂音調(diào)的另一實施例中,用戶可以標識該音調(diào),在這種情況下,將僅針對由終端用戶選擇的一個音調(diào)而不是所指示的12個音調(diào)來開始圖16的過程。以這種方式,可以針對由用戶以上面討論的方式選擇的單個預定音調(diào)來判斷分區(qū)中的每一個。
[0118]在另一實施例中,還可以針對弦約束來判斷分區(qū)。弦序列是可在用戶希望記錄伴奏時采用的音樂約束。典型地,伴奏可以被認為是弦音軌中的符號的寫音譜,并還可以包括弦自身。當然,演奏脫弦的音符是可允許的,但是典型地,必須在其音樂品質(zhì)上對其進行判斷。
[0119]在圖17、17A和17B中描繪了一種用于基于弦序列約束對分區(qū)的和聲的質(zhì)量進行打分的說明性過程。在圖17的過程中,根據(jù)該所選擇的弦將與音頻音軌的給定分區(qū)(或小節(jié))和聲得多好來針對每個通路對一個所選的弦進行打分。每個音符的弦得分是獎勵和乘數(shù)之和。在過程1700的第二框中,針對段落中的每個音符將變量重置為O。然后,將音符的音高的關系與當前所選的弦進行比較。如果音符處于所選弦中,則將乘數(shù)設置為在過程1700的第一框中設置的ChordNoteMultiplier的值。如果音符是和弦基音(例如,C是C大調(diào)和弦的和弦基音)的三全音(即,跨越三個整個音的音樂音程),則將乘數(shù)設置為tritoneMultiplier的值(如圖17A中所示,其為負,從而指示音符未較好地與所選弦和聲)。如果音符是高于基音的一個或八個半音(或者在小調(diào)和弦的情況下,高于基音的四個半音),則將乘數(shù)設置為nonKeyMultiplier的值(如圖17A中所示,其同樣為負,從而指示音符未較好地與所選弦和聲)。未落入到前述類別中的音符被指派有零乘數(shù),并因此對弦得分沒有影響。如圖17B中所示,乘數(shù)由當前音符所占用的段落的片段持續(xù)時間擴縮。如果音符處于段落的開始處,或者如果音符是針對分析而選擇的當前弦的基音,則將獎勵加到弦得分。關于該段落的弦得分是針對每個音符的該計算的累積。一旦第一所選弦被分析,系統(tǒng)50就可以重新使用過程1700來分析其他所選弦(一次一個)??梢詫碜酝ㄟ^過程1700的每個通路的弦得分彼此比較,并且,最高得分將確定將被選擇以伴奏該段落的弦為最適合于該段落。如本領域技術人員在其面前有本說明書、附圖和權利要求書時將理解的那樣,兩個或更多個弦可能被發(fā)現(xiàn)具有關于所選段落的相同得分,在這種情況下,系統(tǒng)50可以基于各種選擇來在這些弦之間決定,這些選擇包括但不限于音樂音軌的類型。本領域技術人員在其面前有本說明書、附圖和權利要求書時還應當理解,上面闡述的打分在某種程度上是對西洋音樂中盛行的音樂類型來說最佳的設計選擇的問題。相應地可以想到,可以針對不同類型的音樂更改乘數(shù)的選擇準則,和/或可以改變在圖17中被指派給的各種乘數(shù)選擇準則的乘數(shù)值,以在不脫離本發(fā)明的精神的情況下反映不同的音樂品味。
[0120]在另一實施例中,分區(qū)打分器1702還可以針對一系列特定所允許的音高值(諸如,如在西洋音樂中典型的半音)來判斷分區(qū)。然而,類似地可以想到其他音樂傳統(tǒng)(諸如,中東文化的音樂傳統(tǒng))的四分音。
[0121]在另一實施例中,還可以基于分區(qū)內(nèi)的各個音高之間的轉(zhuǎn)移質(zhì)量來對該分區(qū)進行打分。例如,如上所討論,可以使用音高脈沖檢測來識別音高中的改變。在一個實施例中,相同的音高脈沖檢測還可以用于識別分區(qū)中的音高轉(zhuǎn)移的質(zhì)量。在一種方法中,系統(tǒng)可以利用阻尼諧波振蕩器一般滿足下述等式的一般理解的構(gòu)思:
【權利要求】
1.一種用于提供與所請求的音樂音符相對應的音頻數(shù)據(jù)的方法,包括: Ca)提供具有多個高速緩存條目的呈現(xiàn)高速緩存,所述高速緩存條目中的每一個與不同音符相對應; (b)從客戶端接收針對第一音符的請求; (C)識別與所述第一音符相對應的第一高速緩存條目; Cd)確定與所述第一高速緩存條目相對應的第一音頻分段不可用; Ce)識別與所述呈現(xiàn)高速緩存中的接近命中高速緩存條目相對應的第二音頻分段;以及 (f)將所述第二音頻分段處理為與所述第一音頻分段基本上類似的第三音頻分段。
2.根據(jù)權利要求1所述的方法,進一步包括:作為對針對第一音符的請求的響應,將所述第三音頻分段提供給所述客戶端。
3.根據(jù)權利要求2所述的方法,其中,將所述第二音頻分段處理為第三音頻分段發(fā)生在所述客戶端處。
4.根據(jù)權利要求3所述的方法,其中,所述第一音符是使用從樂器、音高、持續(xù)時間和速度的組中選擇的一個或多個屬性來識別的。
5.根據(jù)權利要求4所述的方法,其中,所述呈現(xiàn)高速緩存被結(jié)構(gòu)化為η維陣列。
6.根據(jù)權利要求5所述的方法,其中,所述呈現(xiàn)高速緩存被結(jié)構(gòu)化為4維陣列,其中第一維度標識樂器,第二軸標識持續(xù)時間,第三維度標識音高,并且第四維度標識速度。
7.根據(jù)權利要求5所述的方法,其中,識別第二音頻分段的步驟包括:在所述η維陣列內(nèi)確定與所述第一音頻分段距離最短的第二音頻分段。
8.根據(jù)權利要求7所述的方法,其中,識別第二音頻分段的步驟包括:確定具有與所述第一音頻分段的散列值最接近的散列值的第二音頻分段。
9.根據(jù)權利要求1所述的方法,進一步包括:基于與所述多個高速緩存條目中的每一個相關聯(lián)的一個或多個屬性來生成散列值。
10.根據(jù)權利要求1所述的方法,其中,識別第二音頻分段的步驟包括:識別持續(xù)時間與所述第一音頻分段的持續(xù)時間相差小于預定量的第二音頻分段。
11.根據(jù)權利要求1所述的方法,其中,識別第二音頻分段的步驟包括:識別音高與所述第一音頻分段的音高相差小于預定量的第二音頻分段。
12.根據(jù)權利要求1所述的方法,其中,識別第二音頻分段的步驟包括:識別處于距所述第一音頻分段預定數(shù)目的半音內(nèi)的第二音頻分段。
13.根據(jù)權利要求1所述的方法,其中,識別第二音頻分段的步驟包括:識別速度與所述第一音頻分段的速度相差小于預定量的第二音頻分段。
14.根據(jù)權利要求1所述的方法,其中,處理所述第二音頻分段包括:將較短的包絡應用于所述第二音頻分段。
15.根據(jù)權利要求 1所述的方法,其中,處理所述第二音頻分段包括:拉伸所述第二音頻分段的持續(xù)部分。
16.根據(jù)權利要求1所述的方法,其中,處理所述第二音頻分段包括:循環(huán)所述第二音頻分段的持續(xù)部分。
17.根據(jù)權利要求1所述的方法,其中,處理所述第二音頻分段包括:在時域中更改所述第二音頻分段的長度。
18.根據(jù)權利要求1所述的方法,其中,處理所述第二音頻分段包括:更改所述第二音頻分段的幅度。
19.根據(jù)權利要求1所述的方法,其中,所述呈現(xiàn)高速緩存位于與所述客戶端相同的設備上。
20.根據(jù)權利要求1所述的方法,其中,所述呈現(xiàn)高速緩存位于遠程服務器上。
21.根據(jù)權利要求1所述的方法,其中,所述呈現(xiàn)高速緩存位于處于與所述客戶端相關聯(lián)的地理區(qū)域中的邊緣服務器上。
22.根據(jù)權利要求1所述的方法,進一步包括:向用戶顯示對針對第一音符的請求的響應包括了從接近命中高速緩存條目生成的音頻。
23.根據(jù)權利要求1所述的方法,進一步包括:在所述第三音頻分段已經(jīng)被提供給所述客戶端之后呈現(xiàn)所述第一音頻分段;以及將所述第一音頻分段提供給所述客戶端。
24.根據(jù)權利要求1所述的方法,進一步包括:確定是否存在足夠的時間來從樣本庫呈現(xiàn)所述第一音頻分段;以及僅當存在不足以呈現(xiàn)所述第一音頻分段的時間時,才執(zhí)行(e)和⑴。
25.根據(jù)權利要求1所述的方法,其中,所述第二音頻分段被加密,并且其中,處理所述第二音頻分段包 括:使用來自遠程服務器的被提供給所述客戶端的密鑰來對所述第二音頻分段進行解密。
26.根據(jù)權利要求1所述的方法,其中,所述第二音頻分段的至少兩個實例是在高速緩存中提供的,并且其中,所述第二音頻分段的所述至少兩個實例中的每一個是使用不同的加密密鑰來加密的。
27.一種用于提供針對所請求的音符的音頻的方法,包括: 從客戶端接收針對第一音符的音頻請求; 確定所述音頻請求包括失效識別請求; 識別給所述客戶端提供與所述音頻請求相對應的音頻分段的截止時間; 確定所述音頻分段是否能夠在所述截止時間之前被提供給所述客戶端;以及 如果確定了所述音頻分段不能在所述截止時間之前被提供給所述客戶端,則通知所述客戶端。
28.根據(jù)權利要求27所述的方法,其中,如果確定了所述音頻分段不能在所述截止時間之前被提供給所述客戶端,則: 將所述音頻請求置于隊列中以用于處理;以及 在所述截止時間之后將與所述音頻請求相對應的音頻分段提供給所述客戶端。
29.根據(jù)權利要求27所述的方法,其中,如果確定了所述音頻分段不能在所述截止時間之前被提供給所述客戶端,則: 中止所述音頻請求。
30.一種用于提供針對所請求的音符的音頻的方法,包括: 提供多個音軌隊列,所述多個音軌隊列中的每一個包括從至少一個客戶端接收的多個音頻請求以用于處理; 從第一客戶端接收針對第一音符的第一音頻請求;所述音頻請求包括標識所述第一音符的唯一音符ID和與所述第一音符相關聯(lián)的音軌的唯一音軌ID的信息; 基于所述唯一音軌ID來識別第一音軌隊列,所述第一音軌隊列是所述多個音軌隊列之一; 確定所述第一音軌隊列包括與所述唯一音符ID相關聯(lián)的先前接收的音頻請求; 從所述音軌隊列移除先前接收的音頻請求;以及 將所述第一音頻請求添加到所述音軌隊列以用于處理。
31.根據(jù)權利要求30所述的方法,進一步包括:識別先前接收的音頻請求在所述音軌隊列內(nèi)的位置;以及在第一位置處將所述第一音頻請求添加到所述音軌隊列。
32.根據(jù)權利要求30所述的方法,其中,接收到的第一音頻請求進一步包括標識與所述第一音符相關聯(lián)的音軌內(nèi)的所述第一音符的起始時間的信息;以及基于所述起始時間將所述第一音頻請求添加到所述音軌隊列。
33.一種用于提供針對所請求的音符的音頻的方法,包括: 從客戶端接收音頻請求,所述音頻請求與音頻音軌中的第一音符相對應;所述客戶端能夠重復地回放包括所述音頻音軌的至少一部分的實況循環(huán);所述音頻請求包括與所述實況循環(huán)相關的定時信息; 確定所述音頻請求的服務時間,所述服務時間指示直到將在所述實況循環(huán)內(nèi)播放所述第一音符的下一實例為 止的時間; 基于所述服務時間將所述音頻請求添加至隊列以用于處理。
34.根據(jù)權利要求33所述的方法,其中,所述定時信息包括所述實況循環(huán)的持續(xù)時間。
35.根據(jù)權利要求34所述的方法,其中,所述服務時間是基于所述實況循環(huán)的持續(xù)時間來確定的。
36.根據(jù)權利要求35所述的方法,其中,所述服務時間近似等于所述實況循環(huán)的持續(xù)時間的一半。
37.根據(jù)權利要求33所述的方法,其中,所述定時信息包括:音符起始時間,指示所述第一音符相對于所述實況循環(huán)的開始的起始時間;播放頭時間,指示回放條相對于所述實況循環(huán)的開始的位置;以及所述實況循環(huán)的持續(xù)時間。
38.根據(jù)權利要求37所述的方法,其中,所述服務時間是基于所述音符起始時間、所述播放頭時間和所述實況循環(huán)的持續(xù)時間來確定的。
39.根據(jù)權利要求38所述的方法,其中,所述服務時間被確定為: 如果所述音符起始時間大于所述播放頭時間;從所述音符起始時間減去所述播放頭時間; 如果所述播放頭時間大于所述音符起始時間;從所述實況循環(huán)的持續(xù)時間減去所述播放頭時間以得到第一結(jié)果,以及將所述第一結(jié)果加到所述音符起始時間。
【文檔編號】G10H1/057GK103959372SQ201280048029
【公開日】2014年7月30日 申請日期:2012年7月30日 優(yōu)先權日:2011年7月29日
【發(fā)明者】R.拉蘇爾, D.沃納, M.塞爾勒蒂克 申請人:音樂策劃公司