模擬聲音源的方法與流程

文檔序號(hào)：11964515閱讀：247來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

模擬聲音源的方法本申請(qǐng)是申請(qǐng)日為2012年8月10日、申請(qǐng)?zhí)枮?01210460338.6、發(fā)明名稱為“運(yùn)動(dòng)用戶的聲音定位”的專利申請(qǐng)的分案申請(qǐng)。優(yōu)先權(quán)申明本申請(qǐng)要求2011年8月12日提交的申請(qǐng)?zhí)枮?1/523,100、題為“運(yùn)動(dòng)用戶的聲音定位”的美國(guó)臨時(shí)專利申請(qǐng)，以及2011年9月27日提交的申請(qǐng)?zhí)枮?1/539/676、題為“運(yùn)動(dòng)用戶的聲音定位”的美國(guó)臨時(shí)專利申請(qǐng)的優(yōu)先權(quán)，此處以引用形式將其全部并入。相關(guān)申請(qǐng)的交叉引用本申請(qǐng)涉及于2010年11月16日提交的申請(qǐng)?zhí)枮?2/947,290、題為“在共享的穩(wěn)定虛擬空間上維護(hù)多個(gè)視圖”的美國(guó)專利申請(qǐng)；2010年12月20日提交的申請(qǐng)?zhí)枮?2/973,827、題為“共享虛擬空間中便攜式設(shè)備的校準(zhǔn)”的美國(guó)申請(qǐng)；以及2008年10月27日提交的申請(qǐng)?zhí)枮?2/259,181、題為“確定附加球控制器的位置和運(yùn)動(dòng)”的美國(guó)申請(qǐng)，此處以引用形式將其全部并入。技術(shù)領(lǐng)域本發(fā)明涉及遞送（deliver）聲音的方法，更具體而言，涉及三維空間中模擬聲音源的方法。

背景技術(shù)：
電腦游戲業(yè)的發(fā)展趨勢(shì)是增加用戶和游戲系統(tǒng)之間的交互并為玩家提供更加逼真體驗(yàn)的游戲的開(kāi)發(fā)。實(shí)現(xiàn)更豐富的交互體驗(yàn)的方式之一是利用環(huán)繞聲系統(tǒng)，其遞送在多個(gè)揚(yáng)聲器中產(chǎn)生的多個(gè)聲音。然而，目前的環(huán)繞聲系統(tǒng)沒(méi)有考慮用戶的身體特征、用戶的位置、用戶的移動(dòng)或物理三維空間中虛擬對(duì)象的虛擬位置。在某些環(huán)境中，例如電影院中，假設(shè)觀眾正在看屏幕時(shí)遞送聲音。由于聲音被遞送到用戶組，因此聲音遞送不考慮用戶特征或者用戶關(guān)于產(chǎn)生聲音的揚(yáng)聲器的實(shí)際位置。在另一個(gè)場(chǎng)景中，當(dāng)用戶聆聽(tīng)來(lái)自便攜式設(shè)備的音樂(lè)時(shí)，當(dāng)聲音直接來(lái)自于便攜式設(shè)備時(shí)和當(dāng)用戶戴著耳機(jī)時(shí)相比，該聆聽(tīng)體驗(yàn)是不同的。正是在這種背景下，發(fā)明的實(shí)施例出現(xiàn)了。

技術(shù)實(shí)現(xiàn)要素：
本發(fā)明實(shí)施例提供模擬聲音源的方法、設(shè)備和計(jì)算機(jī)程序。本發(fā)明實(shí)施例跟蹤將發(fā)出聲音的位置和用戶的當(dāng)前位置，以便將該聲音投射（project）為好像該聲音來(lái)自位于三維空間內(nèi)的模擬聲音源。例如，該聲音可能看起來(lái)源自便攜式設(shè)備、游戲中的對(duì)象、虛擬嵌入并增強(qiáng)現(xiàn)實(shí)空間的虛擬對(duì)象、玩家等等。應(yīng)該理解：可以以多種方式實(shí)施本發(fā)明，例如處理、設(shè)備、系統(tǒng)、裝置或者計(jì)算機(jī)可讀介質(zhì)上的方法。下面描述本發(fā)明的幾個(gè)創(chuàng)造性實(shí)施例。在一個(gè)實(shí)施例中，方法包括確定空間中用戶頭部位置的操作，其中使用用戶的人臉識(shí)別確定該位置。此外確定遞送到兩個(gè)揚(yáng)聲器的聲音，每個(gè)揚(yáng)聲器與用戶的耳朵相關(guān)聯(lián)。該方法還包括確定空間中的聲音發(fā)出位置的操作，以及基于空間中頭部的位置、聲音、空間中發(fā)出位置以及用戶的聽(tīng)覺(jué)（auditory）特征而為每個(gè)揚(yáng)聲器建立聲信號(hào)（acousticsignal）的操作。該聲信號(hào)傳輸?shù)絻蓚€(gè)揚(yáng)聲器，而且當(dāng)兩個(gè)揚(yáng)聲器播放聲信號(hào)時(shí)，該聲信號(hào)模擬聲音源自空間中的發(fā)出位置。在另一個(gè)實(shí)施例中，模擬聲音源的方法包括用第一設(shè)備確定第一用戶頭部的第一位置的操作。在另一操作中，接收對(duì)應(yīng)于第二用戶頭部的第二位置，其中用第二設(shè)備確定第二位置。此外，該方法包括確定對(duì)應(yīng)于第二設(shè)備關(guān)于第一設(shè)備的位置的第三位置的操作，以及基于第一位置、第二位置以及第一用戶的聽(tīng)覺(jué)特征而為多個(gè)揚(yáng)聲器建立聲信號(hào)的另一個(gè)操作。該聲信號(hào)被傳輸?shù)蕉鄠€(gè)揚(yáng)聲器，其中當(dāng)多個(gè)揚(yáng)聲器播放時(shí)，聲信號(hào)模擬與該聲信號(hào)相關(guān)的聲音源自第二用戶。另一實(shí)施例中，模擬聲音源的方法包括確定對(duì)應(yīng)于用戶頭部的第一位置的操作，以及確定對(duì)應(yīng)于對(duì)象的第二位置的另一操作。使用用戶周圍空間的圖像分析確定第二位置。此外，基于第一位置、第二位置以及用戶的聽(tīng)覺(jué)特征，為多個(gè)揚(yáng)聲器建立聲信號(hào)，其中多個(gè)揚(yáng)聲器位于用戶周圍的空間中。聲信號(hào)被傳輸?shù)蕉鄠€(gè)揚(yáng)聲器，其中當(dāng)由多個(gè)揚(yáng)聲器播放時(shí)，聲信號(hào)模擬與該聲信號(hào)相關(guān)的聲音源自該對(duì)象。在另一實(shí)施例中，模擬聲音源的方法包括生成多個(gè)聲線索（acousticcue）的操作，每個(gè)聲線索與空間中的位置相關(guān)。在該方法的另一實(shí)施例中，為每個(gè)聲線索接收來(lái)自用戶的輸入，每個(gè)輸入具有關(guān)于相應(yīng)聲線索的感知位置的信息。基于接收的輸入，為用戶建立聲音定位函數(shù)（function），其中通過(guò)從多個(gè)現(xiàn)有聲音函數(shù)中選擇現(xiàn)有聲音函數(shù)，或者從多個(gè)現(xiàn)有聲音函數(shù)中組合多于一個(gè)現(xiàn)有聲音函數(shù)，建立聲音定位函數(shù)。此外，基于聲音定位函數(shù)、用戶位置以及聲音源的期望感知位置，將聲音遞送到多個(gè)揚(yáng)聲器，用以模擬聲音源。在另一個(gè)實(shí)施例中，模擬聲音源的方法包括：(a)利用從多個(gè)可能的聲音定位函數(shù)中選擇的聲音定位函數(shù)，為用戶播放聲音；(b)檢測(cè)從用戶到播放聲音的感知聲音位置的指向向量；(c)基于該檢測(cè)減少多個(gè)可能的聲音定位函數(shù)；(d)從多個(gè)可能的聲音定位函數(shù)中選擇新的聲音定位函數(shù)；以及重復(fù)操作（a）-（d），直到播放最后聲音并且為用戶選擇用戶聲音定位函數(shù)，其中利用用戶聲音定位函數(shù)播放的聲音為用戶模擬該聲音源自空間中的期望位置。在另一個(gè)實(shí)施例中，模擬聲音源的方法包括：(a)利用從多個(gè)可能的聲音定位函數(shù)中選擇的聲音定位函數(shù)，為用戶播放聲音；(b)響應(yīng)于播放聲音檢測(cè)用戶正在用手指指向何處；(c)基于該檢測(cè)減少多個(gè)可能的聲音定位函數(shù)；(d)從多個(gè)可能的聲音定位函數(shù)中選擇新的聲音定位函數(shù)；以及重復(fù)操作（a）-（d），直到播放最后聲音并且為用戶選擇用戶聲音定位函數(shù)，其中利用用戶聲音定位函數(shù)播放的聲音為用戶模擬該聲音源自空間中的期望位置。在另一個(gè)實(shí)施例中，模擬聲音源的方法包括：(a)利用從多個(gè)可能的聲音定位函數(shù)中選擇的聲音定位函數(shù)，為用戶播放聲音；(b)響應(yīng)于播放聲音檢測(cè)用戶的視線的方向；(c)基于該檢測(cè)減少多個(gè)可能的聲音定位函數(shù)；(d)從多個(gè)可能的聲音定位函數(shù)中選擇新的聲音定位函數(shù)；以及重復(fù)操作（a）-（d），直到播放最后聲音并且為用戶選擇用戶聲音定位函數(shù)，其中利用用戶聲音定位函數(shù)播放的聲音為用戶模擬該聲音源自空間中的期望位置。結(jié)合附圖從下面的詳細(xì)描述中，其他方面將變得顯而易見(jiàn)。附圖說(shuō)明通過(guò)結(jié)合附圖參考下列說(shuō)明，可最佳地理解本發(fā)明。圖1A-1C例示了聲音從便攜式設(shè)備遞送到用戶的不同實(shí)施例。圖2描繪了根據(jù)一個(gè)實(shí)施例的多玩家增強(qiáng)現(xiàn)實(shí)環(huán)境。圖3A例示了根據(jù)本發(fā)明一個(gè)實(shí)施例的人臉識(shí)別方法。圖3B例示了根據(jù)一個(gè)實(shí)施例的當(dāng)用戶拿著可追蹤控制器時(shí)用戶的頭部的追蹤。圖4例示了根據(jù)一個(gè)實(shí)施例的具有逼真聲音遞送的增強(qiáng)現(xiàn)實(shí)環(huán)境。圖5例示了根據(jù)一個(gè)實(shí)施例的利用射頻標(biāo)識(shí)（RFID）檢測(cè)用戶頭部位置的方法。圖6例示了根據(jù)一個(gè)實(shí)施例的使用三角測(cè)量檢測(cè)用戶頭部位置的方法。圖7是執(zhí)行本發(fā)明實(shí)施例的計(jì)算機(jī)系統(tǒng)的簡(jiǎn)化原理圖。圖8A-8B顯示了根據(jù)本發(fā)明的實(shí)施例的模擬聲音源的算法的流程圖。圖9A例示了根據(jù)一個(gè)實(shí)施例的、基于接收聲音的用戶感知而選擇聲音定位函數(shù)的方法。圖9B例示了根據(jù)一個(gè)實(shí)施例的、基于源自用戶前面的聲音的感知而選擇聲音定位函數(shù)的方法。圖10A例示了根據(jù)一個(gè)實(shí)施例的、使用音頻和視頻線索（cues）選擇聲音定位函數(shù)的方法。圖10B例示了根據(jù)一個(gè)實(shí)施例的、通過(guò)連續(xù)指向在用戶前面移動(dòng)的感知聲音源而選擇聲音定位函數(shù)的方法。圖11顯示了根據(jù)一個(gè)實(shí)施例的選擇一個(gè)或多個(gè)聲音定位函數(shù)的流程圖。圖12顯示了根據(jù)一個(gè)實(shí)施例的從聲音定位函數(shù)數(shù)據(jù)庫(kù)中選擇一個(gè)或多個(gè)聲音定位函數(shù)的流程圖。圖13例示了可用于執(zhí)行本發(fā)明實(shí)施例的設(shè)備的架構(gòu)。圖14例示了可用于執(zhí)行本發(fā)明實(shí)施例的硬件和用戶界面。具體實(shí)施方式下列實(shí)施例描述了模擬聲音源的方法、計(jì)算機(jī)程序及設(shè)備。顯而易見(jiàn)的是：可以無(wú)需這些具體細(xì)節(jié)中的某些或全部而實(shí)施本實(shí)施例。在其他情況下，為了不會(huì)不必要地模糊本實(shí)施例，沒(méi)有詳細(xì)描述公知的步驟操作。圖1A-1C例示了聲音從便攜式設(shè)備遞送到用戶的不同實(shí)施例。圖1A顯示了聆聽(tīng)從便攜式設(shè)備104發(fā)出的音樂(lè)的用戶102，圖1B顯示了戴著耳機(jī)106聆聽(tīng)音樂(lè)的用戶102。當(dāng)用戶戴耳機(jī)時(shí)，在感知聲音所發(fā)生之處（正好面對(duì)耳朵）和聲音實(shí)際發(fā)出處（便攜式設(shè)備）之間存在分離（disconnect）。因此，當(dāng)戴著耳機(jī)時(shí)和不戴耳機(jī)聽(tīng)音樂(lè)時(shí)，用戶102獲得不同的體驗(yàn)。本發(fā)明實(shí)施例允許戴著耳機(jī)的用戶具有和用戶不戴耳機(jī)時(shí)所經(jīng)歷的相似體驗(yàn)。聲音定位（soundlocalization）是指聽(tīng)眾在方向和距離上識(shí)別所檢測(cè)聲音的位置或來(lái)源的能力。它也可以指模擬虛擬3D空間中聲線索的放置的聲學(xué)工程方法。人類聽(tīng)覺(jué)系統(tǒng)使用聲音源定位的若干線索，包括雙耳之間的時(shí)差和級(jí)差、頻譜信息、時(shí)序分析、相關(guān)分析和模式匹配。人類有兩只耳朵，但可在三維上-范圍（距離）、方向的上和下、前和后以及任一側(cè)上定位聲音。大腦、內(nèi)耳和外耳共同努力以做出關(guān)于位置的推論。通過(guò)獲得源自一只耳朵的線索（單耳線索）并通過(guò)比較兩只耳朵處接收的線索（差異線索或雙耳線索），人類估計(jì)源的位置。在這些差異中，線索是到達(dá)的時(shí)間差異以及強(qiáng)度差異。單耳線索來(lái)自聲音源和人體解剖學(xué)之間的交互作用，其中在聲音進(jìn)入耳道而由聽(tīng)覺(jué)系統(tǒng)處理之前修改原始聲音源。這些修改編碼源位置，并可能通過(guò)與源位置和耳朵位置相關(guān)的脈沖響應(yīng)而被捕獲。此脈沖響應(yīng)被稱為與頭相關(guān)的脈沖響應(yīng)（head-relatedimpulseresponse）（HRIR）。如果已在源位置處播放聲音，同時(shí)聽(tīng)眾的耳朵在接收器位置處，則任意聲音源與HRIR的卷積（convolution）將聲音轉(zhuǎn)換為聽(tīng)眾所聽(tīng)到的。HRIR可用于產(chǎn)生虛擬環(huán)繞聲。聲音定位函數(shù)f（此處還稱為聲音函數(shù)，定位函數(shù)，有時(shí)直接為“函數(shù)”）是基于聲音和空間中被感知為聲音源的位置而生成定位聲音的函數(shù)或算法。當(dāng)揚(yáng)聲器播放時(shí)，定位的聲音給用戶聲音源自期望位置的印象，即使聲音實(shí)際上是源自揚(yáng)聲器。函數(shù)f可數(shù)學(xué)表示為：ls=f(s,l)（1）其中s是聲音（例如犬吠），l是期望聲音發(fā)出的位置，而ls是定位的聲音。聲音定位函數(shù)的一個(gè)例子是與頭相關(guān)的傳輸函數(shù)（HRTF），它是刻畫耳朵如何從空間點(diǎn)接收聲音的響應(yīng)。一對(duì)耳朵的HRTF可用于合成似乎來(lái)自空間特定點(diǎn)的雙耳聲音。HRTF還可被描述為將大氣中一個(gè)方向的聲音修改為到達(dá)耳膜的聲音。這些修改包括聽(tīng)眾外耳的形狀、聽(tīng)眾頭部和身體的形狀、其中播放聲音的空間聲學(xué)特征等。所有這些特征影響聽(tīng)眾如何能夠精確地區(qū)分聲音來(lái)自什么方向。由于每個(gè)人的體質(zhì)差異，每個(gè)人都有不同的HRTF。使用HRTF描述本發(fā)明的聲音定位實(shí)施例，但說(shuō)明聽(tīng)眾體質(zhì)特征的其他任何形式的聲音定位可用于本發(fā)明的實(shí)施例。圖1C例示了本發(fā)明的實(shí)施例，其中在耳機(jī)116處遞送的聲音被修改，這樣用戶102感知由耳機(jī)116遞送的聲音，仿佛該聲音從便攜式設(shè)備110發(fā)出，而不是感知到該聲音直接來(lái)自耳機(jī)116。便攜式設(shè)備110跟蹤耳機(jī)（headphones）（也稱為頭戴式耳機(jī)（headset）、頭戴受話器（earphones）或聽(tīng)筒（earpiece））關(guān)于便攜式設(shè)備110位置的位置。一旦耳機(jī)關(guān)于便攜式設(shè)備的相對(duì)位置已知，便攜式設(shè)備操作該聲音（例如使用用戶的HRTF）來(lái)生成定位的聲音，為的是使用戶相信該聲音直接來(lái)自便攜式設(shè)備110。在圖1C所示的實(shí)施例中，將定位的聲音無(wú)線傳輸?shù)綗o(wú)線耳機(jī)116。一旦由耳機(jī)116播放定位的聲音，用戶得到該聲音來(lái)自便攜式設(shè)備110的體驗(yàn)。不同的人有不同的HRTF，當(dāng)使用用戶的HRTF時(shí)遞送最引人入勝（compelling）的體驗(yàn)。在一個(gè)實(shí)施例中，當(dāng)對(duì)于用戶來(lái)說(shuō)HRTF不可得時(shí)使用標(biāo)準(zhǔn)的HRTF。標(biāo)準(zhǔn)的HRTF考慮到人類的平均特征。雖然沒(méi)有利用用戶的HRTF，但是標(biāo)準(zhǔn)的HRTF仍然可以為用戶提供逼真的體驗(yàn)。此外，可使用校準(zhǔn)方法來(lái)進(jìn)一步為特定用戶定制聲音定位體驗(yàn)，用以為用戶開(kāi)發(fā)HRTF。存在跟蹤耳機(jī)位置的多種方式，其依次定義用戶耳朵的位置。通常，此處我們指的是跟蹤用戶耳朵的位置，因?yàn)槎涞奈恢么_定了如何定位聲音。為了便于說(shuō)明，此處我們是指有時(shí)跟蹤用戶的位置，跟蹤用戶頭部的位置，或者跟蹤用戶正戴著的耳機(jī)的位置。所有這些跟蹤方法是等效的，因?yàn)榭梢詮念^部、用戶或耳機(jī)的位置推導(dǎo)出耳朵的位置。圖1C的實(shí)施例中，耳機(jī)116包括光源，例如發(fā)光二極管（LED）114。便攜式設(shè)備110中的相機(jī)112拍攝用戶102所位于的空間的圖像，之后便攜式設(shè)備112執(zhí)行圖像分析，以確定LED114的位置。圖像中的亮點(diǎn)參與LED位置的識(shí)別。此外，基于相機(jī)112拍攝的圖像中LED114的大小而估計(jì)從便攜式設(shè)備到耳機(jī)的距離。一旦確定LED114的位置，假定LED位于耳朵和連接該耳朵的線上方幾英寸之間，根據(jù)耳機(jī)的物理特性，估計(jì)用戶耳朵的位置。需要注意的是：圖1C所示的實(shí)施例是示范性的。其他實(shí)施例可利用跟蹤用戶耳朵位置的不同方法，或者跟蹤方法的組合可用于增加準(zhǔn)確性。例如，通過(guò)使用人臉識(shí)別、超聲波通信、RFID、紅外光、全球定位系統(tǒng)（GPS）等可執(zhí)行定位跟蹤。因此圖lC所例示的實(shí)施例不應(yīng)該被解釋為排斥性的或限制性的，而是示范性的或例示性的。聲音投射為用戶提供了引人入勝的體驗(yàn)，使得耳機(jī)從聆聽(tīng)體驗(yàn)中“消失”。用戶并不覺(jué)得聲音來(lái)自位于耳朵周圍的兩個(gè)揚(yáng)聲器元件，而是感覺(jué)聲音來(lái)自空間中特殊點(diǎn)，依據(jù)該情況，其可能與便攜式設(shè)備、來(lái)自游戲的虛擬元件、虛擬用戶等有關(guān)。隨著虛擬聲音源變化或者隨著用戶位置改變，聲音投射調(diào)適，因此該聲音似乎是從正確的位置產(chǎn)生的。圖2描述了根據(jù)一個(gè)實(shí)施例的多玩家增強(qiáng)現(xiàn)實(shí)環(huán)境。在共享空間的游戲中，多個(gè)設(shè)備交換位置和游戲信息以提供虛擬多玩家體驗(yàn)，其中用戶的顯示器投影共享的虛擬空間。這允許每個(gè)玩家系統(tǒng)訪問(wèn)來(lái)自其他所有玩家的相機(jī)視圖和位置信息，用以同步其校準(zhǔn)位置并共享虛擬空間，一起還被稱為共享空間。圖2的實(shí)施例中，玩家202和204在同一個(gè)房間中，而玩家206正在遠(yuǎn)程游戲（用虛線表示為虛擬玩家）。當(dāng)玩家202和204已經(jīng)參照共同的3D空間中的點(diǎn)（例如桌子上的點(diǎn)）而同步或校準(zhǔn)他們的便攜式設(shè)備后，創(chuàng)建了共同的虛擬場(chǎng)景208。玩家206以類似方式將他的便攜式設(shè)備同步到玩家206周圍空間中的點(diǎn)。每個(gè)玩家都有虛擬場(chǎng)景208的視圖，在這種情況下是戰(zhàn)斗平臺(tái)游戲的虛擬場(chǎng)景好像真的在玩家面前的桌子上。該便攜式設(shè)備起相機(jī)的作用，使得當(dāng)玩家四處移動(dòng)設(shè)備時(shí)，隨著相機(jī)指向不同方向，該視圖與相機(jī)改變顯示同樣的方式改變。結(jié)果，每個(gè)顯示器上的實(shí)際視圖獨(dú)立于其他顯示器上的視圖，該視圖僅僅基于和虛擬場(chǎng)景有關(guān)的便攜式設(shè)備的相對(duì)位置，其固定在3D空間上的實(shí)際物理位置上。通過(guò)使用多個(gè)相機(jī)、加速計(jì)和確定位置的其他機(jī)械設(shè)備以及便攜式設(shè)備之間的高速通信，可能創(chuàng)建3D移動(dòng)捕獲體驗(yàn)，其以可信的方式允許玩家看見(jiàn)或者可能觸摸虛擬的游戲人物和環(huán)境。共享空間游戲利用設(shè)備的高速連接性來(lái)在參加共享空間游戲體驗(yàn)的設(shè)備之間交流信息。通過(guò)將設(shè)備變成留存（persist）在每個(gè)設(shè)備之間空間內(nèi)穩(wěn)定的“魔術(shù)窗口”，通過(guò)該設(shè)備查看虛擬場(chǎng)景208游戲區(qū)。通過(guò)使用移動(dòng)跟蹤、圖像分析和每個(gè)設(shè)備之間信息的高留存性，即使當(dāng)設(shè)備四處移動(dòng)時(shí)，游戲區(qū)呈現(xiàn)在穩(wěn)定的位置。本發(fā)明的實(shí)施例提高了增強(qiáng)現(xiàn)實(shí)的體驗(yàn)，不僅包括用戶所見(jiàn)，還包括用戶所聞。玩游戲期間，玩家202覺(jué)察到聲音來(lái)自板上的虛擬對(duì)象，例如軍隊(duì)218或者大炮220，來(lái)自其他玩家204和206，來(lái)自玩家握著的便攜式設(shè)備212和214等等。在一個(gè)實(shí)施例中，玩家們戴著可包括麥克風(fēng)228的耳機(jī)226。當(dāng)用戶202玩游戲時(shí)，便攜式設(shè)備210重新創(chuàng)建虛擬增強(qiáng)的現(xiàn)實(shí)，其中其他玩家204和206坐在玩家202面前的桌子周圍。一旦玩家們具有了虛擬空間中分配的地點(diǎn)，這些玩家發(fā)出的聲音（例如語(yǔ)音）之后被模擬進(jìn)入增強(qiáng)現(xiàn)實(shí)空間中。遠(yuǎn)程玩家206說(shuō)話時(shí)，語(yǔ)音傳輸?shù)奖銛y式設(shè)備210，其又修改語(yǔ)音，所以玩家202感知到玩家206的語(yǔ)音，所述玩家206的語(yǔ)音被定位到玩家202所位于的同一房間中玩家206的虛擬位置上。每個(gè)便攜式設(shè)備跟蹤各個(gè)玩家的位置，而玩家的位置信息在便攜式設(shè)備之間共享。如果玩家和該玩家所拿的便攜式設(shè)備相關(guān)地移動(dòng)，則該玩家的位置由其他便攜式設(shè)備共享，而當(dāng)玩家說(shuō)話時(shí)，該語(yǔ)音被定位到玩家當(dāng)前所在的地點(diǎn)。當(dāng)兩名玩家（例如玩家202和204）不遠(yuǎn)時(shí)，便攜式設(shè)備不僅必須跟蹤拿著便攜式裝置的玩家的位置，還必須跟蹤附近其他便攜式設(shè)備的位置。在一個(gè)實(shí)施例中，以與跟蹤該玩家相似的方式（例如通過(guò)用相機(jī)所拍攝圖像的圖像識(shí)別）跟蹤其他便攜式設(shè)備的位置。在另一實(shí)施例中，便攜式設(shè)備定義空間中的共同點(diǎn)（例如桌面中心），然后每個(gè)便攜式設(shè)備跟蹤關(guān)于共同點(diǎn)的便攜式設(shè)備的位置。之后關(guān)于共同點(diǎn)的便攜式設(shè)備的位置與其他便攜式設(shè)備共享，為的是確定便攜式設(shè)備之間的相對(duì)位置。應(yīng)當(dāng)注意的是：聲音并不是必須源自便攜式設(shè)備中顯示器所涵蓋的空間內(nèi)。聲音可能來(lái)自視野之外的對(duì)象或玩家。例如，玩家可以直視前方，而聲音可能來(lái)自玩家的右邊。然后該聲音對(duì)玩家來(lái)說(shuō)變成了線索，關(guān)于產(chǎn)生來(lái)自右邊聲音的對(duì)象或人的行蹤。然而，應(yīng)當(dāng)注意的是：好的HRTF模型將大大提高顯示范圍以外對(duì)象的聲音定位準(zhǔn)確性。這是因?yàn)樘摂M環(huán)繞聲系統(tǒng)中的不準(zhǔn)確性由面臨視覺(jué)反饋的大腦忽略。如果玩家認(rèn)為聲音來(lái)自可視對(duì)象，即使在聲音傳輸中有一些錯(cuò)誤，大腦使用視覺(jué)信息來(lái)識(shí)別聲音源。然而，當(dāng)聲音源自視野外，聲音定位的額外視覺(jué)線索丟失。在這種情況下，好的HRTF增強(qiáng)了視野之外對(duì)象的聲音定位。增強(qiáng)現(xiàn)實(shí)游戲中的聲音定位可應(yīng)用到多種類型的游戲中。在射擊游戲中，由另一名玩家開(kāi)的槍似乎來(lái)自其他玩家的武器。在冒險(xiǎn)游戲中，人物的語(yǔ)音似乎來(lái)自人物的位置。在多玩家游戲中，來(lái)自另一名玩家的語(yǔ)音似乎來(lái)自正在說(shuō)話的玩家的位置。在一個(gè)實(shí)施例中，由計(jì)算機(jī)程序生成玩家產(chǎn)生的語(yǔ)音。例如，一名玩家向另一名玩家發(fā)短信，計(jì)算機(jī)程序使用聲音定位來(lái)“讀取”發(fā)給另外玩家的短信，這使得計(jì)算機(jī)生成的語(yǔ)音似乎來(lái)自于發(fā)信息的玩家的口中。此外，虛擬現(xiàn)實(shí)產(chǎn)生的語(yǔ)音可能是經(jīng)翻譯的語(yǔ)音，也就是說(shuō)由機(jī)器翻譯工具生成的語(yǔ)音。例如，遠(yuǎn)程玩家用外語(yǔ)說(shuō)話，隨著遠(yuǎn)程玩家說(shuō)話，外語(yǔ)被翻譯成接收該語(yǔ)音的玩家的母語(yǔ)。圖3A例示了根據(jù)按照本發(fā)明一個(gè)實(shí)施例的人臉識(shí)別方法。在一個(gè)實(shí)施例中，使用游戲區(qū)域360的視頻圖像的圖像分析來(lái)完成玩家臉部或耳朵的位置確定，圖像分析包括檢測(cè)和跟蹤用戶特征，例如眼睛366和368，臉，鼻子372，嘴370，軀干364等等。在圖3A的實(shí)施例中，跟蹤臉部特征以估計(jì)頭部的三維位置并得到耳朵的位置。跟蹤的特征越多，頭部跟蹤越可靠。例如，如果用戶遠(yuǎn)離相機(jī)轉(zhuǎn)動(dòng)頭部，則對(duì)于相機(jī)來(lái)說(shuō)只有一只眼睛是可見(jiàn)的。通過(guò)理解鼻子和嘴的位置，系統(tǒng)確定：用戶已經(jīng)轉(zhuǎn)動(dòng)頭部而不是假設(shè)檢測(cè)臉部失敗。一旦確定用戶耳朵的位置，根據(jù)聲音源和耳朵的位置在聲音上完成了聲音定位。在一個(gè)實(shí)施例中，用戶所在地區(qū)的圖像由便攜式設(shè)備中“臉部所對(duì)的”相機(jī)拍攝。此外，可將閃光燈或其他某一光源照耀到用戶臉部以改善人臉識(shí)別。在另一個(gè)實(shí)施例中，不是跟蹤用戶的便攜式設(shè)備，與用戶相關(guān)聯(lián)的設(shè)備跟蹤便攜式設(shè)備。例如，耳機(jī)352包括相機(jī)354，由相機(jī)354拍攝的圖像用于發(fā)現(xiàn)便攜式設(shè)備。在一個(gè)實(shí)施例中，由相機(jī)354拍攝的圖像被發(fā)送到圖像分析的便攜式設(shè)備。一旦圖像分析確定便攜式設(shè)備的位置，便推導(dǎo)出關(guān)于便攜式設(shè)備的用戶的位置，使得聲音定位成為可能。應(yīng)當(dāng)注意的是：此處所述的跟蹤方法可用于在隔離或其任何組合中。例如，耳機(jī)上的相機(jī)354可用于追蹤便攜式設(shè)備的位置，而便攜式設(shè)備可同事跟蹤用戶的臉部。此外可以利用其他跟蹤方法，如紅外光、超聲波、GPS、RFID等。這些跟蹤方法提供的信息可組合以進(jìn)一步提高跟蹤精度。圖3B例示了：根據(jù)一個(gè)實(shí)施例，當(dāng)用戶拿著可追蹤控制器時(shí)用戶頭部的跟蹤。圖3B的實(shí)施例包括連接到圖像捕獲設(shè)備304的游戲控制臺(tái)302。通過(guò)圖像識(shí)別或通過(guò)其他類型的定位跟蹤，控制器312是可追蹤的。當(dāng)用戶310拿著控制器312時(shí)，游戲控制臺(tái)302基于可跟蹤控制器的位置并基于用戶的位置（如使用人臉識(shí)別）執(zhí)行聲音定位。游戲控制臺(tái)302內(nèi)的位置跟蹤模塊基于控制器的位置確定空間中的頭部位置。位于用戶310周圍的兩個(gè)或多個(gè)揚(yáng)聲器314從游戲控制臺(tái)302接收聲音信號(hào)。當(dāng)執(zhí)行聲音定位時(shí)，根據(jù)用戶的位置、聲音發(fā)出的位置以及揚(yáng)聲器的位置修改發(fā)送到揚(yáng)聲器314的聲音信號(hào)。例如，如果射手從離顯示器306大約20米的位置開(kāi)槍，并且用戶離顯示器306三米遠(yuǎn)，聲音定位將修改正被射擊的槍的聲音，因此射擊似乎來(lái)自離用戶310大約23米遠(yuǎn)的位置。通常可定位遞送給用戶的聲音，這樣聲音似乎源自游戲控制臺(tái)302，來(lái)自顯示器306上的游戲?qū)ο?，?lái)自控制器312，來(lái)自位于用戶物理空間的虛擬游戲?qū)ο?，等等。連續(xù)跟蹤用戶的位置，并且聲音定位基于用戶的當(dāng)前位置。例如，如果用戶轉(zhuǎn)動(dòng)頭部，聲音定位變化，因此該聲音似乎來(lái)自正確位置，即使用戶正在轉(zhuǎn)動(dòng)頭部的時(shí)候。圖4例示了根據(jù)一個(gè)實(shí)施例的具有聲音真實(shí)遞送的增強(qiáng)現(xiàn)實(shí)環(huán)境。玩家406a具有與位于桌子404上方的參考點(diǎn)402同步的設(shè)備408a。在一個(gè)實(shí)施例中，點(diǎn)P0402是參考點(diǎn)而且還是具有坐標(biāo)（X0=0，Y0=0，Z0=0）的坐標(biāo)原點(diǎn)。雖然玩家406a在房間內(nèi)，此處還被稱為虛擬場(chǎng)景的虛擬現(xiàn)實(shí)可擴(kuò)展到超出房間的物理邊界。玩家406b和玩家406a玩同樣的游戲但是在遠(yuǎn)程位置，對(duì)于玩家406a來(lái)說(shuō)，玩家406b被描繪成該游戲中的虛擬元素。玩家406b正拿著便攜式設(shè)備408b，其已同步到玩家406b所在物理空間中的另一個(gè)參考點(diǎn)。在一個(gè)示范性實(shí)施例中，虛擬場(chǎng)景依賴參考點(diǎn)，因?yàn)樘摂M場(chǎng)景的幾何形狀（正如通過(guò)設(shè)備屏幕所見(jiàn)到的）至少部分地基于該參考點(diǎn)。例如，可用參考點(diǎn)確定虛擬場(chǎng)景中虛擬對(duì)象的坐標(biāo)?？墒褂萌魏魏饬繕?biāo)準(zhǔn)測(cè)量坐標(biāo)。然而，為了提供可視化的例子并且不限制使用的實(shí)際坐標(biāo)，如果用米測(cè)量虛擬場(chǎng)景的坐標(biāo)，坐標(biāo)為（1，0，0）的對(duì)象將位于參考點(diǎn)右方一米處。當(dāng)然，隨著場(chǎng)景變化，例如當(dāng)虛擬對(duì)象在場(chǎng)景內(nèi)移動(dòng)時(shí)，可動(dòng)態(tài)更新真實(shí)或虛擬的對(duì)象的坐標(biāo)。此外，可通過(guò)計(jì)算機(jī)設(shè)定的動(dòng)作（例如交互程序）定義該變化，可通過(guò)用戶的動(dòng)作和二者組合來(lái)驅(qū)動(dòng)。此外，為清楚起見(jiàn)，交互程序可以是任何類型的程序，如視頻游戲、商業(yè)程序、網(wǎng)絡(luò)接口或者僅僅是向其他用戶、程序或者對(duì)象提供數(shù)據(jù)訪問(wèn)的圖形用戶界面，該對(duì)象可能會(huì)或可能不會(huì)由揚(yáng)聲器顯示或投射。此外，其他實(shí)施例還可具有不同的坐標(biāo)系統(tǒng)或使用縮放。例如，替代直角坐標(biāo)系，坐標(biāo)系統(tǒng)可以是極性的，球面，拋物面等。此外，參考點(diǎn)并不是必須在坐標(biāo)系的原點(diǎn)，可以位于不同的地方。為了提供實(shí)例，參考點(diǎn)可位于坐標(biāo)（5，5，5）處，在超過(guò)5米的點(diǎn)上必須使用負(fù)坐標(biāo)值之前，使得每個(gè)方向上有5米的緩沖區(qū)。在另一場(chǎng)景中，建立虛擬對(duì)象來(lái)縮放，也是用比例尺來(lái)測(cè)量坐標(biāo)。例如，虛擬對(duì)象可建立在l：10的比例尺上，幾何軸也可具有l(wèi)：10的比例尺，這樣具有坐標(biāo)（1，0，0）的對(duì)象離“真實(shí)”世界1米遠(yuǎn)，而離虛擬世界10米遠(yuǎn)。圖4中，虛擬對(duì)象包括直升機(jī)414a-414c、云、鳥、太陽(yáng)416等。隨著玩家406a移動(dòng)便攜式設(shè)備408a，虛擬場(chǎng)景的視野變化，好像玩家拿著相機(jī)進(jìn)入到虛擬世界。應(yīng)當(dāng)注意的是：設(shè)備408a中所顯示的視圖可包括或可不包括參考點(diǎn)。房間包括除桌子404之外的其他靜態(tài)對(duì)象，例如電視412和窗口410。正如圖4所看出的，虛擬對(duì)象可位于空間的任何地方。當(dāng)便攜式設(shè)備包含相機(jī)時(shí)，可由便攜式設(shè)備使用房間中的靜態(tài)特性，通過(guò)用來(lái)自其相機(jī)的視圖調(diào)整其慣性測(cè)量來(lái)維持當(dāng)前位置的精確測(cè)量。便攜式設(shè)備中的圖像分析可檢測(cè)窗口邊緣、光源、桌子邊緣、墻壁上的畫、電視等。游戲控制臺(tái)422與便攜式設(shè)備108a交流信息以發(fā)送增強(qiáng)現(xiàn)實(shí)環(huán)境。該信息包括游戲信息、用戶跟蹤、便攜式設(shè)備位置、虛擬對(duì)象位置、遠(yuǎn)程玩家的位置等等中的一個(gè)或多個(gè)。在一個(gè)實(shí)施例中，游戲控制臺(tái)422跟蹤玩家406a的耳朵位置。當(dāng)游戲中產(chǎn)生聲音時(shí)（例如，直升機(jī)飛行的聲音），游戲控制臺(tái)422確定虛擬空間中聲音源的坐標(biāo)。一旦耳朵的位置和聲音源的位置已知，游戲控制臺(tái)422確定聲音源和感知聲音的耳朵之間的相對(duì)位置。游戲控制臺(tái)422還具有關(guān)于房間中揚(yáng)聲器420的位置信息。用戶的HRTF用于將該聲音轉(zhuǎn)換成對(duì)于用戶來(lái)說(shuō)似乎來(lái)自聲音源的經(jīng)定位的聲音。為了模擬聲音源的位置，傳送到揚(yáng)聲器420的經(jīng)定位的聲音包括用于每個(gè)揚(yáng)聲器420的不同聲信號(hào)。在另一實(shí)施例中，用戶406a正戴著耳機(jī)（未顯示）。在這種情況下，定位的聲音被傳送到耳機(jī)而不是揚(yáng)聲器。使用揚(yáng)聲器和使用耳機(jī)的聲音定位算法是類似的，但在揚(yáng)聲器的情況下，位置是固定的，而在耳機(jī)的情況下必須跟蹤位置，因?yàn)橛脩粢苿?dòng)時(shí)，耳機(jī)移動(dòng)。此外，在房間揚(yáng)聲器的情況下，對(duì)于來(lái)自每個(gè)揚(yáng)聲器的聲音，存在行程時(shí)間（traveltime），其必須由聲音定位算法考慮。聲音定位算法采用用戶的HRTF以及用戶耳朵的當(dāng)前位置生成用于耳機(jī)的定位聲音。由耳機(jī)播放的定位聲音的聲信號(hào)為考慮空間中虛擬對(duì)象虛擬位置的用戶提供聲線索。在一個(gè)實(shí)施例中，當(dāng)發(fā)出聲音的對(duì)象或人顯示在便攜式設(shè)備顯示器上或連接到游戲控制臺(tái)422的顯示器412上時(shí)，用更高的音量遞送定位聲音的聲信號(hào)。便攜式設(shè)備不僅充當(dāng)相機(jī)，還充當(dāng)定向（directional）麥克風(fēng)。當(dāng)聲音源不在顯示器上時(shí)，聲音的音量較低。因?yàn)楸銛y式設(shè)備作為相機(jī)和定向麥克風(fēng)工作，隨著用戶移動(dòng)便攜式設(shè)備，用戶具有聲音源所在之處的聲線索。給遠(yuǎn)程玩家406b分配玩家406a物理空間中的一個(gè)位置。聲音定位包括產(chǎn)生似乎來(lái)自玩家406b或來(lái)自便攜式設(shè)備408b的聲音。例如，當(dāng)玩家406b說(shuō)話時(shí)，由便攜式設(shè)備408b捕獲該語(yǔ)音，然后傳送到游戲控制臺(tái)422或便攜式設(shè)備408a。之后使用HRTF或某些其他聲音定位算法將來(lái)自用戶406b的語(yǔ)音轉(zhuǎn)換，用以給用戶406a遞送該語(yǔ)音，好像玩家406b正站在玩家406a附近。在一個(gè)實(shí)施例中，GPS用于跟蹤用戶。例如，便攜式設(shè)備中的GPS模塊用于確定便攜式設(shè)備的位置，當(dāng)由便攜式設(shè)備與用戶跟蹤相結(jié)合時(shí)，其將GPS位置提供給用戶。如果用戶406b位于遠(yuǎn)程位置（例如幾英里遠(yuǎn)），用戶406b的GPS位置可用于音效。例如，用戶406b具有由遠(yuǎn)程玩家投射的游戲炮。聲音效果模擬來(lái)自用戶406b實(shí)際位置的炮投射。首先聽(tīng)到開(kāi)槍射擊，隨著炮彈經(jīng)由空氣從玩家406b的位置行進(jìn)（travel）到玩家406a的位置，之后跟隨有炮彈的聲音。由于炮彈通過(guò)空氣行進(jìn)，聲音強(qiáng)度增加，正如在現(xiàn)實(shí)生活那樣。最后，當(dāng)炮彈擊中目標(biāo)時(shí)聽(tīng)到爆炸，而且如果目標(biāo)在用戶附近，將用高音量遞送聲音。圖5例示了根據(jù)一個(gè)實(shí)施例、利用射頻標(biāo)識(shí)（RFID）檢測(cè)用戶頭部位置的方法。戴著耳機(jī)504的用戶502在她口袋里攜佩戴便攜式設(shè)備506。便攜式設(shè)備506包括RFID模塊508，耳機(jī)504中的一個(gè)或兩個(gè)耳機(jī)512包括RFID標(biāo)簽510。RFID模塊508不僅能夠閱讀RFID標(biāo)簽510中的信息，還能夠確定來(lái)自RFID標(biāo)簽510的無(wú)線電信號(hào)的方向和時(shí)序。因此，RFID技術(shù)的使用使得便攜式設(shè)備獲得RFID標(biāo)簽510的距離以及RFID信號(hào)方向的估計(jì)。這樣，即使RFID模塊508和RFID標(biāo)簽510之間不存在視線，便攜式設(shè)備仍然可以得到耳機(jī)512位置的估計(jì)，其指示用戶502的耳朵的位置。其他實(shí)施例可使用除RFID外的其他類型的無(wú)線通信，例如藍(lán)牙、Wi-Fi、無(wú)線電傳輸、超聲波、聲信號(hào)等。在另一實(shí)施例中，耳機(jī)和便攜式設(shè)備包括GPS模塊。GPS模塊提供空間中用戶頭部和便攜式設(shè)備的絕對(duì)位置。便攜式設(shè)備中的位置跟蹤模塊使用GPS位置，用以確定空間中關(guān)于便攜式設(shè)備位置的頭部位置。一旦確定了相對(duì)位置，便攜式設(shè)備能夠執(zhí)行用戶的聲音定位，正如之前所述?？梢允褂萌魏晤愋偷腉PS技術(shù)，例如使用GPS衛(wèi)星星座（constellation），或者使用基于到移動(dòng)電話塔距離的移動(dòng)電話定位技術(shù)。GPS技術(shù)也可與其他形式的跟蹤結(jié)合。例如，便攜式設(shè)備可包括GPS模塊，而便攜式設(shè)備通過(guò)圖像識(shí)別跟蹤用戶耳朵的位置。便攜式設(shè)備的GPS定位可用于具有遠(yuǎn)程虛擬玩家的游戲中。所有玩家的GPS定位用于創(chuàng)建將玩家的相對(duì)位置彼此匹配的聲音效果。圖6例示了根據(jù)一個(gè)實(shí)施例使用三角測(cè)量檢測(cè)頭部位置的方法。在一個(gè)實(shí)施例中（未顯示），耳機(jī)包括超聲波源，超聲波信號(hào)用于跟蹤玩家頭部的位置。一個(gè)或多個(gè)定向麥克風(fēng)可用于確定耳機(jī)的位置，因?yàn)槎ㄏ螓溈孙L(fēng)提供聲音的方向。此外，從耳機(jī)到便攜式設(shè)備行進(jìn)的超聲波時(shí)間量計(jì)時(shí)提供了測(cè)距從耳機(jī)到麥克風(fēng)的距離的信息。當(dāng)多于一個(gè)麥克風(fēng)可用時(shí)，三角測(cè)量可用于微調(diào)用戶的位置。圖6中的實(shí)施例中，超聲波源位于便攜式設(shè)備604處。耳機(jī)606包括三個(gè)超聲波麥克風(fēng)608a-608c。由麥克風(fēng)608a-608c中每一個(gè)捕獲的信息被傳輸?shù)奖銛y式設(shè)備604上。便攜式設(shè)備604中的位置跟蹤模塊分析由麥克風(fēng)捕獲的聲音信息，用以確定耳機(jī)的位置，其包括根據(jù)聲音的方向和聲音到達(dá)麥克風(fēng)的時(shí)間執(zhí)行三角測(cè)量。由位置跟蹤模塊執(zhí)行的分析確定耳機(jī)關(guān)于便攜式設(shè)備的相對(duì)位置。也可以用其他無(wú)線技術(shù)使用三角測(cè)量。例如，便攜式設(shè)備可包括三個(gè)可讀取由RFID標(biāo)簽發(fā)送的RFID無(wú)線電信號(hào)的RFID傳感器。為了改善包括三角測(cè)量信號(hào)源的估計(jì)，空間上彼此遠(yuǎn)離地定位RFID傳感器。同樣，RFID標(biāo)簽可位于耳機(jī)內(nèi)，一個(gè)在右邊的耳機(jī)上，一個(gè)在左邊耳機(jī)上，第三個(gè)在右邊和左邊耳機(jī)之間。應(yīng)當(dāng)注意：三角測(cè)量信號(hào)的其他實(shí)施例可包括除3外的不同數(shù)量的傳感器，例如2，4等。因此圖6所示的實(shí)施例不應(yīng)被解釋為排斥性的或限制性的，而是示范性的和說(shuō)明性的。圖7是執(zhí)行本發(fā)明實(shí)施例的計(jì)算機(jī)系統(tǒng)的簡(jiǎn)化原理圖。應(yīng)當(dāng)理解：可用諸如傳統(tǒng)通用計(jì)算機(jī)系統(tǒng)的數(shù)字處理系統(tǒng)執(zhí)行此處所述的方法。被設(shè)計(jì)或編程為執(zhí)行唯一功能的專用計(jì)算機(jī)可用于備選。計(jì)算設(shè)備712包括處理器732，其耦合到存儲(chǔ)器734、耦合到永久存儲(chǔ)設(shè)備758、以及耦合到計(jì)算設(shè)備712內(nèi)或者連接到計(jì)算設(shè)備712的其他模塊。聲音定位計(jì)算機(jī)程序736駐留在存儲(chǔ)器734中，但也可以駐留在永久存儲(chǔ)設(shè)備758中。計(jì)算設(shè)備712與超聲波捕獲設(shè)備708、圖像捕獲設(shè)備720和顯示器726通信。在一個(gè)實(shí)施例中，聲音捕獲設(shè)備708、圖像捕獲設(shè)備720、RFID模塊706和顯示器726可嵌入到計(jì)算設(shè)備712中或者是獨(dú)立的單元。在一個(gè)實(shí)施例中，超聲波捕獲設(shè)備包括麥克風(fēng)，而在另一個(gè)實(shí)施例中，超聲波捕獲設(shè)備包括麥克風(fēng)陣列。設(shè)備位置跟蹤模塊724確定便攜式設(shè)備的位置。多種技術(shù)可用于位置跟蹤，例如超聲波、GPS、RFID、圖像分析、三角測(cè)量、慣性等，或者其組合。頭部跟蹤模塊738確定用戶耳朵中一個(gè)或兩個(gè)的位置（其可通過(guò)確定耳機(jī)的位置而間接確定）。通過(guò)使用一種或多種不同的技術(shù)，例如圖像識(shí)別、RFID、超聲波、紅外線、三角測(cè)量等，頭部跟蹤模塊738可確定用戶耳朵的位置。為了執(zhí)行聲音定位，聲音投射模塊716修改聲音信號(hào)，期望遞送到聲音系統(tǒng)，這樣接收修改后的聲音信號(hào)的用戶將具有聲音發(fā)自期望位置的印象。聲音投射模塊716使用設(shè)備位置跟蹤模塊724和頭部跟蹤模塊738提供的位置信息以修改聲音信號(hào)。永久存儲(chǔ)設(shè)備758代表持續(xù)的數(shù)據(jù)存儲(chǔ)設(shè)備，例如軟盤驅(qū)動(dòng)或固定光盤驅(qū)動(dòng)，其可能是本地的或遠(yuǎn)程的。網(wǎng)絡(luò)接口746提供網(wǎng)絡(luò)連接，允許與其他設(shè)備通信。應(yīng)該理解：處理器732可嵌入到通用處理器、專用處理器或者專門編程的邏輯器件中。輸入/輸出（I/O）接口742提供了與不同外設(shè)的通信，例如顯示器726、鍵盤752、鼠標(biāo)750、超聲波捕獲設(shè)備708、圖像捕獲設(shè)備720、揚(yáng)聲器754、耳機(jī)704、按鈕、傳感器、觸摸屏756等。通用串行總線（USB）模塊744提供到USB設(shè)備的連接。顯示器726被配置為顯示此處所述的用戶接口。為了向處理器732傳送信息，鍵盤752、鼠標(biāo)750和其他外設(shè)耦合到I/O接口742。應(yīng)該理解：可通過(guò)I/O接口742將數(shù)據(jù)傳送到外部設(shè)備并從外部設(shè)備傳送數(shù)據(jù)。也可在分布式計(jì)算環(huán)境中實(shí)施本發(fā)明，其中由通過(guò)基于有線或無(wú)線網(wǎng)絡(luò)連接的遠(yuǎn)程處理設(shè)備執(zhí)行任務(wù)。數(shù)據(jù)庫(kù)710包括與多個(gè)不同用戶相關(guān)聯(lián)的多個(gè)聲音定位函數(shù)。在一個(gè)實(shí)施例中，聲音定位函數(shù)是為多個(gè)用戶獲取的經(jīng)測(cè)量的HRTF函數(shù)，但還可用其他的聲音定位函數(shù)。正如以下關(guān)于圖9A-12所論述的，數(shù)據(jù)庫(kù)710用于為用戶建立聲音定位函數(shù)，其影響（leverage）為其他用戶獲得的現(xiàn)有函數(shù)。注意的是：圖7所例示的實(shí)施例是示范性的。其他實(shí)施例可利用不同的模塊，或者具有由一個(gè)模塊執(zhí)行的多種函數(shù)等。因此圖7所示的實(shí)施例不應(yīng)被解釋為排斥性的或限制性的，而是示范性的或說(shuō)明性的。圖8A-8B顯示根據(jù)本發(fā)明實(shí)施例的模擬聲音源的算法流程圖。圖8A例示了聲音定位的實(shí)施例。在操作802中確定空間中用戶頭部的位置，其中該用戶戴著包括兩個(gè)揚(yáng)聲器的耳機(jī)。如前所述，多種方法可用于確定耳機(jī)的位置，如超聲波、圖像分析、RFID、GPS、紅外線等。此外，操作804中確定將被遞送到揚(yáng)聲器的聲音，每個(gè)揚(yáng)聲器與用戶的一只耳朵相關(guān)聯(lián)。換句話說(shuō)，一個(gè)揚(yáng)聲器位于左耳旁，另一個(gè)揚(yáng)聲器位于右耳旁。操作806中確定聲音發(fā)出位置。該聲音發(fā)出位置指的是空間中定義將被遞送給用戶的虛擬聲音源的點(diǎn)，這樣用戶得到該聲音來(lái)自該聲音源的印象。操作808中，基于空間中頭部的位置、聲音、空間中的發(fā)出位置和用戶的聽(tīng)覺(jué)特征，為每個(gè)揚(yáng)聲器建立聲信號(hào)。用戶的聽(tīng)覺(jué)特征定義了影響用戶如何定位聲音出處的用戶物理特征。在一個(gè)實(shí)施例中，用戶的聽(tīng)覺(jué)特征由用戶耳朵的HRTF對(duì)定義。操作808之后，該方法流向操作810，其中聲信號(hào)被傳送到兩個(gè)揚(yáng)聲器。當(dāng)聲信號(hào)由兩個(gè)揚(yáng)聲器播放時(shí)，該聲音似乎源自空間中的發(fā)出位置。圖8B例示了模擬聲音源的方法流程圖。操作842中確定空間中用戶頭部的位置。在一個(gè)實(shí)施例中，用戶戴著包括兩個(gè)揚(yáng)聲器的耳機(jī)，而在另一個(gè)實(shí)施例中，多個(gè)揚(yáng)聲器位于用戶周圍的空間中，例如用戶和計(jì)算機(jī)設(shè)備交互的房間中。操作844中，該方法確定在增強(qiáng)現(xiàn)實(shí)環(huán)境中由虛擬對(duì)象產(chǎn)生的聲音，其中該聲音被遞送到多個(gè)揚(yáng)聲器中。在操作846中確定對(duì)應(yīng)于空間中虛擬對(duì)象的虛擬位置的空間中聲音的發(fā)出位置。例如在一個(gè)實(shí)施例中，聲音是由站在真實(shí)的物理桌子上的化身（avatar）所產(chǎn)生的語(yǔ)音。此外，在操作848中，基于空間中頭部的位置、聲音以及空間中的發(fā)出位置為每個(gè)揚(yáng)聲器建立聲信號(hào)。一旦建立了聲信號(hào)，聲信號(hào)在操作850中被傳送到兩個(gè)揚(yáng)聲器上。聲信號(hào)一旦由兩個(gè)揚(yáng)聲器播放就模擬聲音源自空間中的發(fā)出位置。操作852中，增強(qiáng)現(xiàn)實(shí)空間的一部分或者整個(gè)增強(qiáng)現(xiàn)實(shí)空間顯示在便攜式設(shè)備的屏幕上。因?yàn)榇髦鷻C(jī)的人可能隨著時(shí)間推移而移動(dòng)她的頭，因此需要跟蹤來(lái)定期重新計(jì)算用戶的位置。此外，聲音的發(fā)出位置也可能隨時(shí)間而改變。結(jié)果，需要用戶和聲音位置的連續(xù)跟蹤，而在操作854中，該方法確定是否需要更新用戶的位置。在一個(gè)實(shí)施例中，定期更新（例如每隔500ms，雖然其他值也是可能的）用戶的位置。如果操作854中執(zhí)行的檢查確定將要更新位置，則該方法流回到操作842。另一方面，如果操作854中執(zhí)行的檢查決定不需要更新用戶的位置，則該方法流回到操作844用以確定遞送到耳機(jī)的新聲音。根據(jù)一個(gè)實(shí)施例，圖9A例示了：基于所接收聲音的用戶感知而選擇聲音定位函數(shù)的方法。通過(guò)耳機(jī)的虛擬環(huán)繞最適合人的HRTF（或某些其他的聲音定位函數(shù)）的精確測(cè)量。測(cè)量HRTF的過(guò)程是困難的（也就是說(shuō)，該過(guò)程需要在人耳中放入小麥克風(fēng)，并且坐得筆直，當(dāng)在頭部周圍不同的位置和距離處移動(dòng)揚(yáng)聲器時(shí)）。本發(fā)明的實(shí)施例利用了用戶人口的經(jīng)測(cè)量的HRTF數(shù)據(jù)庫(kù)。在一個(gè)實(shí)施例中，利用運(yùn)動(dòng)控制器創(chuàng)建用戶的聲音定位函數(shù)，其基于數(shù)據(jù)庫(kù)中的一個(gè)或多個(gè)HRTF。實(shí)際上沒(méi)有測(cè)量用戶的HRTF，但是通過(guò)發(fā)現(xiàn)為用戶“工作”的一個(gè)或多個(gè)HRTF，提供了具有虛擬聲音遞送的現(xiàn)實(shí)虛擬環(huán)繞聲系統(tǒng)。具有用于數(shù)百萬(wàn)用戶的聲音定位函數(shù)是不實(shí)際的。發(fā)明的實(shí)施例利用用于人的常規(guī)片段的測(cè)量聲音定位函數(shù)，然后執(zhí)行測(cè)試以為特定用戶選擇這些函數(shù)中的一個(gè)。在圖9A的實(shí)施例中，用戶904在具有多個(gè)揚(yáng)聲器902的房間中。應(yīng)當(dāng)注意的是：當(dāng)用戶904戴著耳機(jī)時(shí)，還可執(zhí)行校準(zhǔn)過(guò)程。計(jì)算機(jī)系統(tǒng)通過(guò)揚(yáng)聲器902播放聲音，用戶被要求指出方向908a上的控制器906A，用戶相信其是聲音源的方向。基于由用戶識(shí)別作為聲音源的方向908a，該系統(tǒng)從匹配該方向的數(shù)據(jù)庫(kù)中選擇一個(gè)或多個(gè)聲音定位函數(shù)。換句話說(shuō)，由用戶904的每個(gè)回應(yīng)之后，該系統(tǒng)縮小了可滿足用戶904特征的聲音定位函數(shù)。在一個(gè)實(shí)施例中，給用戶提供兩種選擇。如果用戶不確定聲音來(lái)自哪里，按下控制器上的第一個(gè)按鈕以表明用戶不確定。另一方面，如果用戶識(shí)別出方向，當(dāng)指出聲音的方向時(shí)用戶按下第二個(gè)按鈕。這允許人們通過(guò)搜索聲音定位函數(shù)（例如HRTF）的數(shù)據(jù)庫(kù)而找到適當(dāng)?shù)穆曇舳ㄎ缓瘮?shù)，并找到最匹配用戶輸入（例如由控制器識(shí)別的方向）的函數(shù)。該過(guò)程用在不同位置的其他的聲音重復(fù)?；诳刂破鞯奈恢茫ɡ?06b、906c）為每個(gè)聲音獲得新的方向（例如908b，908c），并且分析聲音定位函數(shù)以找到位置的最佳匹配。在一個(gè)實(shí)施例中，最佳匹配是為所有測(cè)試聲音提供最佳整體性能的聲音定位函數(shù)。在另一實(shí)施例中，用于此特定用戶的函數(shù)是聲音函數(shù)的組合，其中用戶周圍的空間被劃分成部分（sector），來(lái)自每個(gè)部分的聲音使用與該部分相關(guān)的函數(shù)，其中每個(gè)部分具有相關(guān)聯(lián)的不同函數(shù)。在一個(gè)實(shí)施例中使用了插值（interpolation），而某些部分使用來(lái)自兩個(gè)或更多函數(shù)的插值。期望的目標(biāo)不是具有完美的選擇函數(shù)，而是該目標(biāo)是在不同位置具有大量的可接受函數(shù)，其對(duì)于具體的游戲或者對(duì)于一系列游戲來(lái)說(shuō)足夠填滿所需的3D體積。如果認(rèn)為一定數(shù)量的離散傳遞函數(shù)比只選擇一個(gè)函數(shù)更好，那么就沒(méi)有必要只選擇一個(gè)函數(shù)。在一個(gè)實(shí)施例中，插值用來(lái)填充其中尚未執(zhí)行實(shí)際測(cè)試的區(qū)域中的空白，由于為用戶周圍的整個(gè)3-D空間執(zhí)行測(cè)試是非常乏味的。為每個(gè)測(cè)試播放的聲音可能是相同的聲音，但從不同的位置投射，或者該聲音可能隨位置而改變，為的是獲得不同音頻頻率的數(shù)據(jù)。這可能減少用戶困惑，因?yàn)橛脩舨粫?huì)覺(jué)得所有聲音恰好相同并且聲音來(lái)自同一個(gè)地方。在一個(gè)實(shí)施例中，如果一個(gè)傳遞函數(shù)并沒(méi)有恰當(dāng)?shù)仄ヅ渌袦y(cè)試聲音的用戶聲音特征，則為用戶計(jì)算的聲音函數(shù)是不僅考慮到了聲音來(lái)自的區(qū)域而且考慮了正在產(chǎn)生的聲音類型（例如聲音的主頻）的函數(shù)組合。例如，在3D空間中的特定地點(diǎn)，第一函數(shù)可用于低頻聲音，而第二函數(shù)可用于高頻或中頻聲音。由于與用戶904相關(guān)的函數(shù)未知，所以從數(shù)據(jù)庫(kù)中選擇的聲音定位函數(shù)f1，開(kāi)始校準(zhǔn)過(guò)程。當(dāng)用戶在908a方向上點(diǎn)906a時(shí)，該系統(tǒng)分析：當(dāng)使用f1生成聲音時(shí)，什么定位函數(shù)fu或函數(shù)可能引起該響應(yīng)。換句話說(shuō)，系統(tǒng)需要將f1與數(shù)據(jù)庫(kù)中的其他函數(shù)相關(guān)聯(lián)。Ifs是為測(cè)試所選的聲音（例如犬吠），l1是聲音的位置，而ls1是揚(yáng)聲器處遞送的定位聲音，等式（1）變?yōu)椋簂s1=f1(s,l1)（2）當(dāng)用戶指向方向908a時(shí)，基于方向908a計(jì)算位置l2。如果fu是為該聲音和位置l2匹配聲音s用戶的函數(shù)，那么得到下面的公式：ls1=fu(s,l2)（3）這意味著：對(duì)于同樣的聲音測(cè)試（例如犬吠），f1和fu將產(chǎn)生發(fā)送到揚(yáng)聲器的相同聲音，但是由用戶感知的位置因?yàn)椴煌穆曇舳ㄎ缓瘮?shù)而變化。換句話說(shuō)，具有函數(shù)f1的用戶感知來(lái)自l1的聲音，而具有函數(shù)fu的用戶感知來(lái)自l2的相同聲音。將等式（2）和（3）結(jié)合，得到以下恒等式：f1(s,l1)=fu(s,l2)（4）因?yàn)閒1，s，l1和l2是已知的，所以可用等式（4）獲得fu。然而注意的是：fu為此用戶的位置l2工作，但是fu可能不為其他位置工作。因?yàn)閷?duì)于數(shù)據(jù)庫(kù)中的許多函數(shù)來(lái)說(shuō)可滿足等式（4），在不同地點(diǎn)繼續(xù)該測(cè)試允許系統(tǒng)選擇：哪個(gè)可能的函數(shù)更好地為用戶服務(wù)。在一個(gè)實(shí)施例中，通過(guò)消除不工作的函數(shù)，測(cè)試過(guò)程繼續(xù)，直到選擇最后一個(gè)函數(shù)為止（更好地匹配用戶特征的函數(shù)）。在一個(gè)實(shí)施例中，相同的函數(shù)f1用于所有的測(cè)試。在另一實(shí)施例中，隨著該系統(tǒng)開(kāi)始微調(diào)該函數(shù)或者為此用戶最佳工作的函數(shù)，用于每個(gè)測(cè)試的函數(shù)變化。例如在第二測(cè)試中，之前測(cè)試中獲得的選定函數(shù)fu用于第二測(cè)試，而不是f1。第二測(cè)試后，基于兩次測(cè)量選擇新的函數(shù)fu2?；谒袦y(cè)試中的測(cè)量，每次測(cè)試后重復(fù)該過(guò)程以計(jì)算新的函數(shù)。注意的是：校準(zhǔn)正在發(fā)生時(shí)，如果用戶移動(dòng)頭部，該移動(dòng)可能改變結(jié)果。在一個(gè)實(shí)施例中，聲音短，消除或?qū)嵸|(zhì)上減少了頭部運(yùn)動(dòng)的影響。在另一個(gè)實(shí)施中，跟蹤用戶的頭部，這意味著測(cè)試期間耳朵的位置是已知的。在一個(gè)實(shí)施例中，通過(guò)分析用戶拍攝的圖像而執(zhí)行頭部跟蹤，但是也可用其他方法，例如使用具有磁力計(jì)的耳機(jī)等。根據(jù)一個(gè)實(shí)施例，圖9B例示了基于源自用戶前面的聲音感知而選擇聲音定位函數(shù)的方法。戴著耳機(jī)962的用戶904位于顯示器952和相機(jī)956前，相機(jī)952用于拍攝用戶和用戶拿著的控制器的圖像。相機(jī)956連接到計(jì)算機(jī)設(shè)備（未顯示）上。在圖9B所示的實(shí)施例中，將校準(zhǔn)限制在用戶前面的點(diǎn)。校準(zhǔn)測(cè)試點(diǎn)可能在顯示器952上，或者在位于顯示器952后面的墻954上。測(cè)試步驟是與上述參考圖9A類似的步驟，除了用戶知道到聲音的距離，因?yàn)槁曇粼陲@示器952上或者在墻954上。此外，該系統(tǒng)能夠計(jì)算用戶904和顯示器952之間以及用戶904和墻954之間的距離。定位正在測(cè)試的聲音，用以模擬源自顯示器上或墻壁上的聲音。此外，用戶904和聲音之間的距離等于用戶和顯示器952上聲音源位置之間、或者用戶和墻954上聲音源位置之間的距離。在另一實(shí)施例中，用戶周圍的對(duì)象也可用于測(cè)試。這樣，對(duì)象和用戶之間的距離也是已知的，該距離可用于校準(zhǔn)步驟。注意的是：圖9A和9B的校準(zhǔn)步驟比僅僅知道用戶的HRTF更好，因?yàn)樾?zhǔn)過(guò)程中也考慮了用戶的主觀部分（關(guān)于用戶的聲音感知）。如上所述，測(cè)量HRTF涉及將麥克風(fēng)放在用戶的耳朵中，但是HRTF沒(méi)有說(shuō)明聲音進(jìn)入耳道后會(huì)發(fā)生什么。該系統(tǒng)把用戶的印象連接到物理位置上。不是使用“完美的”方法，其中該系統(tǒng)開(kāi)發(fā)了人耳的精確模型，該系統(tǒng)實(shí)際上可將性能調(diào)整到個(gè)人的獨(dú)特偏見(jiàn)。如果人認(rèn)為：特定的聲音似乎來(lái)自一個(gè)方向，不管它是否與人的HRTF匹配，該系統(tǒng)將比只是使用HRTF提供更加引人入勝的體驗(yàn)。上述標(biāo)定方法不僅提供了選擇聲音定位函數(shù)的直觀界面，該校準(zhǔn)方法還提供用戶感知到聲音正在發(fā)出之處和運(yùn)動(dòng)控制器位置之間的登記。在一個(gè)實(shí)施例中，控制器和用戶頭部的位置與聲音定位函數(shù)用于模擬：聲音隨著控制器正被四處移動(dòng)而由運(yùn)動(dòng)控制器產(chǎn)生。根據(jù)一個(gè)實(shí)施例，圖10A例示了使用音頻和視頻線索選擇聲音定位函數(shù)的方法。圖10A的實(shí)施例使用視線檢測(cè)和視覺(jué)線索執(zhí)行校準(zhǔn)。此外，校準(zhǔn)過(guò)程可能是游戲的一部分，隨著測(cè)試的進(jìn)行，其給出了分?jǐn)?shù)或獎(jiǎng)勵(lì)。利用相機(jī)156和計(jì)算設(shè)備（未顯示）來(lái)檢測(cè)用戶158的視線154。揚(yáng)聲器152嵌入到電視機(jī)中并且用于遞送本地化的聲音。對(duì)于校準(zhǔn)來(lái)說(shuō)，屏幕由用戶視線的潛在目標(biāo)填充。目標(biāo)是幫助用戶識(shí)別聲音源的視覺(jué)線索。圖10A所示的例子中包括多只鳥，聲音測(cè)試是一聲鳥鳴，其可能隨測(cè)試而改變。校準(zhǔn)過(guò)程中的每個(gè)聲音提示后，用戶將她的視線瞄準(zhǔn)在用戶認(rèn)為發(fā)出聲音的顯示器上的對(duì)象上。在一個(gè)實(shí)施例中，動(dòng)畫發(fā)生以顯示被選中的鳥兒，例如讓鳥兒飛走、消失、倒在地上，等等。在一個(gè)實(shí)施例中，在允許用戶從之前輸入中執(zhí)行更正的過(guò)程中存在反饋環(huán)。3D可視化提供給映射用戶所選的所有3D位置的用戶。該系統(tǒng)允許用戶重新定義感知的位置，并將輸入彼此聯(lián)系。例如，用戶可以詳述“這個(gè)聲音在那一個(gè)的前面”，或者詳述“這個(gè)聲音在那一個(gè)的后面”。如果以可視化表現(xiàn)放置各種聲音，并且可被單獨(dú)選擇，然后用戶可以使用該信息重置聲音樣本。例如，用戶可能指出：“這個(gè)聲音在我正前方”，但在稍后時(shí)間聽(tīng)到另一個(gè)聲音并詳述“新聲音是在我正前方的那個(gè)”。用戶可以選擇最初的“正前方”聲音，確認(rèn)聲音并不位于她最初以為的地方，要么放棄要么重新定位（reposition）樣本。根據(jù)一個(gè)實(shí)施例，圖10B例示了通過(guò)連續(xù)指向移動(dòng)到用戶前方的感知聲音源而選擇聲音定位函數(shù)的方法。在一個(gè)實(shí)施例中，校準(zhǔn)測(cè)試包括：播放聲音源變化處的聲音序列，模擬聲音源正在移動(dòng)。圖10B的實(shí)施例利用聲音校準(zhǔn)的標(biāo)記分析。在這種情況下，用戶168用她的手指指向162來(lái)指示聲音來(lái)自何處。例如，聲音是正在森林中沿著軌跡166運(yùn)動(dòng)的鳥兒164，但是該鳥兒是不可見(jiàn)的，因?yàn)樗谏掷镲w。注意的是：軌跡166可能留在顯示區(qū)域中，或者該軌跡可能擴(kuò)展到顯示器邊界之外。隨著鳥兒移動(dòng)，用戶168將162指向用戶認(rèn)為鳥兒當(dāng)時(shí)所在的位置。系統(tǒng)分析由手指方向所識(shí)別的方向，并在上述為用戶計(jì)算聲音定位函數(shù)的過(guò)程使用類似的過(guò)程。在一個(gè)實(shí)施例中，該系統(tǒng)定期采樣用戶輸入和相應(yīng)的聲音。然后用獲得的離散樣本計(jì)算聲音函數(shù)，正如上所述。在一個(gè)實(shí)施例中，用戶的聲音定位函數(shù)存儲(chǔ)在網(wǎng)絡(luò)上的服務(wù)器中，其可由許多設(shè)備訪問(wèn)。為了在其他設(shè)備中遞送聲音定位，之后聲音定位函數(shù)可與其他設(shè)備共享。例如，用戶可以使用游戲控制臺(tái)來(lái)計(jì)算函數(shù)，然后當(dāng)用戶戴著連接到便攜式設(shè)備的耳機(jī)時(shí)，聲音定位可提供給用戶。注意的是：圖9A-9B和10A-10B所示的實(shí)施例是示范性的。其他實(shí)施例可利用不同的聲音，不同的揚(yáng)聲器配置，使用不同的輸入（例如，控制器、手持設(shè)備的方向、用戶所做的標(biāo)志等），使用不同類型的揚(yáng)聲器（例如，耳機(jī)，房間中的揚(yáng)聲器，電視上的揚(yáng)聲器等）。因此圖9A-9B和10A-10B所示的實(shí)施例不應(yīng)被解釋為排斥性的或限制性的，而是示范性的或說(shuō)明性的。根據(jù)一個(gè)實(shí)施例，圖11顯示了選擇一個(gè)或多個(gè)聲音定位函數(shù)的流程圖。操作1102中，選擇聲音用于執(zhí)行第一測(cè)試。定位該聲音使其顯示出聲音源自某一位置。操作1104中，通過(guò)多個(gè)揚(yáng)聲器播放聲音，例如環(huán)繞聲系統(tǒng)、一副耳機(jī)、嵌入到電視機(jī)中的揚(yáng)聲器等。提示用戶指出聲音是來(lái)自何處。操作1106中，檢測(cè)用戶的輸入，而用戶的輸入用于確定空間中從用戶到感知聲音源的指向向量。操作1108中，分析存儲(chǔ)在數(shù)據(jù)庫(kù)中的聲音定位函數(shù)，并且基于播放和捕獲的指向向量，給該函數(shù)打分。分?jǐn)?shù)用來(lái)濾除用于此用戶聲音定位的某些可能函數(shù)。操作1110中，該方法確定是否需要更多的測(cè)量來(lái)繼續(xù)減少候選函數(shù)的列表（list）。如果不需要更多的測(cè)量，該方法繼續(xù)到操作1114，否則到操作1112。操作1112中，基于已經(jīng)獲得的結(jié)果選擇新的定位聲音。在一個(gè)實(shí)施例中，預(yù)先確定該聲音并且該系統(tǒng)通過(guò)聲音列表循環(huán)，直到耗盡該列表。例如，該列表可能包括來(lái)自7個(gè)不同地點(diǎn)的7個(gè)不同聲音。收到相應(yīng)的7個(gè)輸入后，之后系統(tǒng)為用戶選擇一個(gè)函數(shù)（操作1114）。在另一個(gè)實(shí)施例中，基于之前的任務(wù)，該方法適應(yīng)接收到的輸入并選擇下一個(gè)聲音。例如，系統(tǒng)可能會(huì)下降到3個(gè)不同的候選函數(shù)，選擇提供良好引導(dǎo)的聲音，用于選擇哪個(gè)是三個(gè)函數(shù)中最好的。操作1114中，為用戶計(jì)算聲音定位函數(shù)。例如看如上所述的關(guān)于圖9A-9B和10A-10B的實(shí)施例。此外，操作1116中，計(jì)算出的聲音定位函數(shù)存儲(chǔ)在數(shù)據(jù)庫(kù)中，這樣其他設(shè)備可使用將聲音定位到此用戶的函數(shù)。根據(jù)一個(gè)實(shí)施例，圖12顯示了從聲音定位函數(shù)的數(shù)據(jù)庫(kù)中選擇一個(gè)或多個(gè)聲音定位函數(shù)的流程圖。操作1202中，選擇與空間中第一位置相關(guān)的第一聲線索，操作1204中，通過(guò)揚(yáng)聲器遞送聲線索。遞送聲隊(duì)列后，該系統(tǒng)在操作1206中從用戶接收輸入。來(lái)自用戶的輸入具有聲線索的感知位置信息。操作1208中，該方法檢查操作1204中是否遞送最后的聲線索。如果是最后的聲線索，該方法繼續(xù)到操作1212，否則到操作1210。操作1210中，該方法選擇下一個(gè)聲線索和聲線索發(fā)出的位置。操作1210之后，該方法返回到操作1204用以遞送新的聲線索。操作1212中，執(zhí)行新的檢查以確定是否單個(gè)聲音定位函數(shù)將用于此用戶，或者是否聲音函數(shù)的組合用于該用戶。例如，如果系統(tǒng)確認(rèn)存在將此用戶和遞送的測(cè)試良好匹配的聲音定位函數(shù)，則該系統(tǒng)將使用從聲音函數(shù)數(shù)據(jù)庫(kù)中檢索的此函數(shù)。然而，如果沒(méi)有用于該用戶的良好匹配，系統(tǒng)將使用根據(jù)空間中最佳匹配每個(gè)函數(shù)的部分而劃分的函數(shù)組合。因此，操作1214中，基于接收的用戶輸入，該方法從數(shù)據(jù)庫(kù)中選擇現(xiàn)有的聲音定位函數(shù)。另一方面，操作1216中，該方法從用戶數(shù)據(jù)庫(kù)中選擇聲音定位函數(shù)的結(jié)合。操作1218上，為了模擬聲音源，基于聲音定位函數(shù)、用戶位置以及聲音源的期望感知位置，聲音被遞送到多個(gè)揚(yáng)聲器。圖13例示了可用于實(shí)現(xiàn)發(fā)明實(shí)施例的設(shè)備架構(gòu)。便攜式設(shè)備是計(jì)算設(shè)備并且包括存在于計(jì)算設(shè)備中的常規(guī)模塊，如處理器、內(nèi)存（RAM、ROM等）、電池或其它電源以及永久性存儲(chǔ)器（例如硬盤）。通信模塊允許便攜式設(shè)備與其他便攜式設(shè)備、其他電腦、服務(wù)器等交流信息。該通信模塊包括通用串行總線（USB）連接器、通信鏈接（例如以太網(wǎng)）、超聲波通信、藍(lán)牙和WiFi。輸入模塊包括輸入按鈕和傳感器、麥克風(fēng)、觸控屏、相機(jī)（正面、背面、深度相機(jī)）和讀卡器。其他輸入/輸出設(shè)備，例如鍵盤或鼠標(biāo)，也可通過(guò)諸如USB或藍(lán)牙的通信鏈接連接到便攜式設(shè)備。輸出模塊包括顯示屏（具有觸控屏）、發(fā)光二極管（LED）、振動(dòng)觸覺(jué)反饋和揚(yáng)聲器。諸如耳機(jī)的其他輸出設(shè)備還可以通過(guò)通信模塊連接到便攜式設(shè)備上。來(lái)自不同設(shè)備的信息可由定位模塊用來(lái)計(jì)算便攜式設(shè)備的位置。這些模塊包括磁力計(jì)、加速度計(jì)、陀螺儀、GPS和指南針。此外，定位模塊可分析用相機(jī)和麥克風(fēng)捕獲的聲音或圖像數(shù)據(jù)用以計(jì)算該位置。此外，定位模塊可執(zhí)行測(cè)試以確定便攜式設(shè)備的位置或附近其他設(shè)備的位置，如WiFiping測(cè)試或超聲波測(cè)試。如前所述，使用定位模塊計(jì)算出的位置，虛擬現(xiàn)實(shí)生成器創(chuàng)建虛擬或增強(qiáng)的現(xiàn)實(shí)。基于虛擬現(xiàn)實(shí)和位置，視圖生成器創(chuàng)建屏幕上顯示的視圖。聲音定位模塊執(zhí)行聲音定位，用于將被遞送到揚(yáng)聲器或耳機(jī)的聲音。應(yīng)當(dāng)理解：圖13所示的實(shí)施例是便攜式設(shè)備的常規(guī)實(shí)現(xiàn)。其他實(shí)施例可使用不同的模塊、模塊子集，或者將相關(guān)的任務(wù)分配到不同的模塊。因此圖13所示的實(shí)施例不應(yīng)被解釋為排斥性的或限制性的，而是示范性或說(shuō)明性的。圖14例示了可用于實(shí)現(xiàn)發(fā)明實(shí)施例的硬件和用戶接口。圖14示意地例示了娛樂(lè)設(shè)備的整體系統(tǒng)架構(gòu)。為系統(tǒng)單元1400提供可連接到系統(tǒng)單元1400的各種外圍設(shè)備。系統(tǒng)單元1400包括：?jiǎn)卧幚砥?428；動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器（XDRAM）單元1426；具有專用視頻隨機(jī)存取存儲(chǔ)器（VRAM）單元1432的現(xiàn)實(shí)合成圖形單元1430；以及I/O橋1434。系統(tǒng)單元1400還包括盤的光盤讀取器1440，用于從盤1440a和可移動(dòng)插槽硬盤驅(qū)動(dòng)器（HDD）1436中讀取，通過(guò)I/O橋1434訪問(wèn)?？蛇x地，系統(tǒng)單元1400還包括存儲(chǔ)卡讀取器1438，用于讀取致密閃存卡、存儲(chǔ)卡和類似物，其同樣地通過(guò)I/O橋1434訪問(wèn)。I/O橋1434還連接到6個(gè)通用串行總線（USB）2.0端口1424；吉比特以太網(wǎng)端口1422；IEEE802.11b/g無(wú)線網(wǎng)絡(luò)（Wi-Fi）端口1420；以及能夠支持多達(dá)7個(gè)藍(lán)牙連接的無(wú)線鏈接端口1418。在操作中，I/O橋1434處理所有無(wú)線、USB和以太網(wǎng)數(shù)據(jù)，包括來(lái)自一個(gè)或多個(gè)游戲控制器1402-1403的數(shù)據(jù)。例如，當(dāng)用戶玩游戲時(shí)，I/O橋1434通過(guò)藍(lán)牙連接從游戲控制器1402-1403接收數(shù)據(jù)，并將其指向單元處理器1428，其相應(yīng)地更新游戲的當(dāng)前狀態(tài)。無(wú)線、USB和以太網(wǎng)接口還提供除了游戲控制器1402-1403的其他外圍設(shè)備的連接，例如遠(yuǎn)程控制1404；鍵盤1406；鼠標(biāo)1408；諸如索尼娛樂(lè)設(shè)備的便攜式娛樂(lè)設(shè)備1410；諸如相機(jī)1412的視頻相機(jī)；耳機(jī)1414以及麥克風(fēng)1415。因此這些外圍設(shè)備原則上可無(wú)線連接到系統(tǒng)單元1400上；例如便攜式娛樂(lè)設(shè)備1410可通過(guò)Wi-Fiad-hoc連接通信，而耳機(jī)1414可通過(guò)藍(lán)牙鏈接通信。提供這些接口意味著：PlayStation3設(shè)備還潛在地與其它外圍設(shè)備兼容，例如數(shù)字視頻錄像機(jī)（DVR）、機(jī)頂盒、數(shù)碼相機(jī)、便攜式媒體播放器、互聯(lián)網(wǎng)協(xié)議（IP）電話上的語(yǔ)音、移動(dòng)電話、打印機(jī)和掃描儀。此外，傳統(tǒng)的存儲(chǔ)卡讀卡器1416可通過(guò)USB端口1424連接到該系統(tǒng)單元，使得能夠讀取由PlayStation或PlayStation2設(shè)備使用這種存儲(chǔ)卡。游戲控制器1402-1403是可操作的，用以通過(guò)藍(lán)牙連接與系統(tǒng)單元1400無(wú)線通信，或者連接到USB端口，因此還提供了充電游戲控制器1402-1403電池的電力。游戲控制器1402-1403還可包括存儲(chǔ)器，處理器，存儲(chǔ)卡讀取器，諸如閃存的永久性存儲(chǔ)器，諸如發(fā)光球形部分、LED或紅外燈的光投射器，用于超聲波通信的麥克風(fēng)和揚(yáng)聲器，聲學(xué)室，數(shù)碼相機(jī)，內(nèi)部時(shí)鐘，面對(duì)游戲控制臺(tái)的可識(shí)別形狀，以及使用諸如WiFiTM等協(xié)議的無(wú)線通信。可識(shí)別的形狀實(shí)質(zhì)上可以是形狀：球體、立方體、平行四邊形、長(zhǎng)方體、圓錐體、金字塔狀、不完美的球體、英式足球、足球或橄欖球、球體的一部分、截棱錐、截圓錐、棒球棒、截?cái)嗔⒎襟w、多面體、星形等，或者這些形狀中兩個(gè)或多個(gè)的組合。游戲控制器1402是設(shè)計(jì)成用雙手使用的控制器，而游戲控制器1403是具有球形接頭的單手控制器。除了一個(gè)或多個(gè)模擬操縱桿和常規(guī)控制按鈕，該游戲控制器對(duì)三維位置的確定敏感。因此游戲控制器的用戶的手勢(shì)和移動(dòng)可被翻譯成游戲輸入，除了或者不是傳統(tǒng)按鈕或操縱桿命令?？蛇x地，諸如便攜式設(shè)備的其他無(wú)線使能外圍設(shè)備可用作控制器。在便攜式設(shè)備的例子中，額外的游戲或控制信息（例如，控制指令或生命數(shù)量）可提供到設(shè)備屏幕上。也可使用其他替代或補(bǔ)充控制裝置，如跳舞毯（未顯示），光槍（未顯示），方向盤和踏板（未顯示）或定制的控制器，例如用于快速反應(yīng)測(cè)試游戲的單個(gè)或幾個(gè)大按鈕（也未顯示）。遠(yuǎn)程控制1404也是可操作的，用以通過(guò)藍(lán)牙鏈接與系統(tǒng)單元1400無(wú)線通信。遠(yuǎn)程控制1404包括適于藍(lán)光光盤BD-ROM閱讀器1440以及用于盤內(nèi)容導(dǎo)航的控制。藍(lán)光光盤BD-ROM光盤閱讀器1440讀取與PlayStation和PlayStation2設(shè)備兼容的CD-ROM是可操作的，除了傳統(tǒng)的預(yù)錄和可記錄CD，以及所謂的超級(jí)音頻CD。閱讀器1440讀取與PlayStation2和PlayStation3設(shè)備兼容的DVD-ROM也是可操作的，除了傳統(tǒng)的預(yù)錄和可記錄DVD。閱讀器1440讀取與PlayStation3設(shè)備以及傳統(tǒng)的預(yù)錄和可記錄藍(lán)光光盤兼容的BD-ROM是進(jìn)一步可操作的。系統(tǒng)單元1400提供音頻和視頻是可操作的，通過(guò)現(xiàn)實(shí)合成圖形單元（RSX）1430，或者由PlayStation3設(shè)備生成或者由其解碼，通過(guò)音頻1450和視頻1452連接器到顯示和聲音輸出設(shè)備1442，例如具有顯示器1444和一個(gè)或多個(gè)揚(yáng)聲器1446或獨(dú)立揚(yáng)聲器1448的顯示器或電視機(jī)。在一個(gè)實(shí)施例中，根據(jù)用戶的視線點(diǎn)（POG），利用聲音和視線輸入朝著特定的音響喇叭播放聲音。音頻連接器1450可包括傳統(tǒng)的模擬和數(shù)字輸出，同時(shí)視頻連接器1452可能不同地包括分量視頻、S-視頻、復(fù)合視頻和一個(gè)或多個(gè)高清晰度的多媒體接口（HDMI）輸出。因此，視頻輸出可能以諸如PAL或NTSC，或者720P、1080i或1080p的高清晰度的形式。音頻處理（生成、解碼等）由單元處理器1428執(zhí)行。PlayStation3設(shè)備的操作系統(tǒng)支持環(huán)繞聲，劇院環(huán)繞聲（DTS）以及來(lái)自藍(lán)光光盤的7.1環(huán)繞聲的解碼。本實(shí)施例中，視頻攝像機(jī)1412包括單個(gè)電荷耦合器件（CCD），LED指示燈，基于硬件的實(shí)時(shí)數(shù)據(jù)壓縮和編碼設(shè)備，以便可以適當(dāng)?shù)母袷絺魉蛪嚎s視頻數(shù)據(jù)，例如基于由系統(tǒng)單元1400解碼的MPEG（運(yùn)動(dòng)圖像專家組）標(biāo)準(zhǔn)的內(nèi)部圖像（intra-image）。安排攝像機(jī)LED指示燈，用以響應(yīng)于來(lái)自系統(tǒng)單元1400的合適控制數(shù)據(jù)而照明，例如表示不利的照明條件。視頻攝像機(jī)1412的實(shí)施例可能不同地通過(guò)USB、藍(lán)牙或Wi-Fi通信端口連接到系統(tǒng)單元1400。視頻攝像機(jī)的實(shí)施例可能包括一個(gè)或多個(gè)相關(guān)的麥克風(fēng)，還能夠傳輸音頻數(shù)據(jù)。在視頻攝像機(jī)的實(shí)施例中，CCD可能具有適于高清晰度視頻捕獲的分辨率。使用中，由視頻攝像機(jī)捕獲的圖像例如可被納入到游戲中或被解釋為游戲控制輸入。在另一實(shí)施例中，該攝像機(jī)是適于檢測(cè)紅外光的紅外攝像機(jī)。通常，為了通過(guò)系統(tǒng)單元1400的一個(gè)通信端口、用諸如視頻攝像機(jī)或遠(yuǎn)程控制的外圍設(shè)備發(fā)生數(shù)據(jù)的成功傳輸，應(yīng)該提供一款合適的軟件，例如設(shè)備驅(qū)動(dòng)程序（devicedriver）。設(shè)備驅(qū)動(dòng)程序技術(shù)是眾所周知的，此處將不會(huì)詳細(xì)描述，但本領(lǐng)域技術(shù)人員將明白：所述的本實(shí)施例中可能需要設(shè)備驅(qū)動(dòng)程序或類似的軟件接口?？捎酶鞣N計(jì)算機(jī)系統(tǒng)配置實(shí)施本發(fā)明的實(shí)施例，包括手持設(shè)備、微處理器系統(tǒng)、基于微處理器或可編程的消費(fèi)類電子產(chǎn)品、微機(jī)、大型機(jī)和類似物。也可在分布式計(jì)算環(huán)境中實(shí)施本發(fā)明，其中由通過(guò)網(wǎng)絡(luò)連接的遠(yuǎn)程處理設(shè)備執(zhí)行任務(wù)?？紤]到上述實(shí)施例，應(yīng)該理解：該發(fā)明可以使用涉及計(jì)算機(jī)系統(tǒng)中存儲(chǔ)數(shù)據(jù)的各種計(jì)算機(jī)執(zhí)行的操作。這些操作是那些需要物理量的物理操作。此處所述的構(gòu)成發(fā)明一部分的任何操作是有用的機(jī)器操作。本發(fā)明還涉及到執(zhí)行這些操作的設(shè)備或儀器。該儀器可能是用于所需目的而專門構(gòu)建的，例如專用計(jì)算機(jī)。當(dāng)定義為專用計(jì)算機(jī)時(shí)，計(jì)算機(jī)也可以執(zhí)行其他處理，程序執(zhí)行或并非專用部分而仍然能夠?qū)ｉT執(zhí)行的程序。作為選擇，可由通用計(jì)算機(jī)執(zhí)行操作，通用計(jì)算機(jī)由計(jì)算機(jī)存儲(chǔ)器、高速緩存中存儲(chǔ)的或通過(guò)網(wǎng)絡(luò)獲得的一個(gè)或多個(gè)計(jì)算機(jī)程序選擇性激活或配置。當(dāng)通過(guò)網(wǎng)絡(luò)獲得數(shù)據(jù)時(shí)，該數(shù)據(jù)可由網(wǎng)絡(luò)上的其他計(jì)算機(jī)處理，例如云計(jì)算資源。本發(fā)明的一個(gè)或多個(gè)實(shí)施例也可制作成計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可讀代碼。計(jì)算機(jī)可讀介質(zhì)是可存儲(chǔ)數(shù)據(jù)的任意數(shù)據(jù)存儲(chǔ)設(shè)備，之后該數(shù)據(jù)可由計(jì)算機(jī)系統(tǒng)讀取。計(jì)算機(jī)可讀介質(zhì)的實(shí)例包括硬盤驅(qū)動(dòng)器、網(wǎng)絡(luò)附加存儲(chǔ)（NAS）、只讀存儲(chǔ)器、隨機(jī)存取存儲(chǔ)器、CD-ROM、CD-R、CD-RW、磁帶及其他光學(xué)和非光學(xué)的數(shù)據(jù)存儲(chǔ)設(shè)備。計(jì)算機(jī)可讀介質(zhì)可以包括在網(wǎng)絡(luò)耦合的計(jì)算機(jī)系統(tǒng)分布的計(jì)算機(jī)可讀有形介質(zhì)，這樣以分布式存儲(chǔ)和執(zhí)行計(jì)算機(jī)可讀代碼。雖然以特定順序描述方法操作，應(yīng)該理解的是：在操作中可執(zhí)行其他的內(nèi)務(wù)管理（housekeeping）操作，或者可以調(diào)整操作，這樣它們發(fā)生在稍微不同的時(shí)間處，或者可能分布在系統(tǒng)中，其允許與處理相關(guān)的不同時(shí)間間隔處發(fā)生處理操作，只要以期望的方式執(zhí)行覆蓋操作的處理。雖然為了清楚理解而稍微詳細(xì)地描述了上述發(fā)明，但是顯而易見(jiàn)的是：在附加權(quán)利要求的范圍內(nèi)可實(shí)施某些改變和修改。因此本實(shí)施例被認(rèn)為是說(shuō)明性的而不是限制性的，而發(fā)明不限于此處給出的細(xì)節(jié)，但可在附加權(quán)利要求的范圍和等效物中修改。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：S.奧斯曼
技術(shù)所有人：索尼電腦娛樂(lè)公司
我是此專利的發(fā)明人

上一篇：一種竹木地板切割裝置的制作方法
上一篇：一種重竹地板精確切割機(jī)的制作方法與工藝

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

模擬聲音源的方法與流程