模擬聲音源的方法本申請(qǐng)是申請(qǐng)日為2012年8月10日、申請(qǐng)?zhí)枮?01210460338.6、發(fā)明名稱為“運(yùn)動(dòng)用戶的聲音定位”的專利申請(qǐng)的分案申請(qǐng)。優(yōu)先權(quán)申明本申請(qǐng)要求2011年8月12日提交的申請(qǐng)?zhí)枮?1/523,100、題為“運(yùn)動(dòng)用戶的聲音定位”的美國(guó)臨時(shí)專利申請(qǐng),以及2011年9月27日提交的申請(qǐng)?zhí)枮?1/539/676、題為“運(yùn)動(dòng)用戶的聲音定位”的美國(guó)臨時(shí)專利申請(qǐng)的優(yōu)先權(quán),此處以引用形式將其全部并入。相關(guān)申請(qǐng)的交叉引用本申請(qǐng)涉及于2010年11月16日提交的申請(qǐng)?zhí)枮?2/947,290、題為“在共享的穩(wěn)定虛擬空間上維護(hù)多個(gè)視圖”的美國(guó)專利申請(qǐng);2010年12月20日提交的申請(qǐng)?zhí)枮?2/973,827、題為“共享虛擬空間中便攜式設(shè)備的校準(zhǔn)”的美國(guó)申請(qǐng);以及2008年10月27日提交的申請(qǐng)?zhí)枮?2/259,181、題為“確定附加球控制器的位置和運(yùn)動(dòng)”的美國(guó)申請(qǐng),此處以引用形式將其全部并入。技術(shù)領(lǐng)域本發(fā)明涉及遞送(deliver)聲音的方法,更具體而言,涉及三維空間中模擬聲音源的方法。
背景技術(shù):電腦游戲業(yè)的發(fā)展趨勢(shì)是增加用戶和游戲系統(tǒng)之間的交互并為玩家提供更加逼真體驗(yàn)的游戲的開(kāi)發(fā)。實(shí)現(xiàn)更豐富的交互體驗(yàn)的方式之一是利用環(huán)繞聲系統(tǒng),其遞送在多個(gè)揚(yáng)聲器中產(chǎn)生的多個(gè)聲音。然而,目前的環(huán)繞聲系統(tǒng)沒(méi)有考慮用戶的身體特征、用戶的位置、用戶的移動(dòng)或物理三維空間中虛擬對(duì)象的虛擬位置。在某些環(huán)境中,例如電影院中,假設(shè)觀眾正在看屏幕時(shí)遞送聲音。由于聲音被遞送到用戶組,因此聲音遞送不考慮用戶特征或者用戶關(guān)于產(chǎn)生聲音的揚(yáng)聲器的實(shí)際位置。在另一個(gè)場(chǎng)景中,當(dāng)用戶聆聽(tīng)來(lái)自便攜式設(shè)備的音樂(lè)時(shí),當(dāng)聲音直接來(lái)自于便攜式設(shè)備時(shí)和當(dāng)用戶戴著耳機(jī)時(shí)相比,該聆聽(tīng)體驗(yàn)是不同的。正是在這種背景下,發(fā)明的實(shí)施例出現(xiàn)了。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例提供模擬聲音源的方法、設(shè)備和計(jì)算機(jī)程序。本發(fā)明實(shí)施例跟蹤將發(fā)出聲音的位置和用戶的當(dāng)前位置,以便將該聲音投射(project)為好像該聲音來(lái)自位于三維空間內(nèi)的模擬聲音源。例如,該聲音可能看起來(lái)源自便攜式設(shè)備、游戲中的對(duì)象、虛擬嵌入并增強(qiáng)現(xiàn)實(shí)空間的虛擬對(duì)象、玩家等等。應(yīng)該理解:可以以多種方式實(shí)施本發(fā)明,例如處理、設(shè)備、系統(tǒng)、裝置或者計(jì)算機(jī)可讀介質(zhì)上的方法。下面描述本發(fā)明的幾個(gè)創(chuàng)造性實(shí)施例。在一個(gè)實(shí)施例中,方法包括確定空間中用戶頭部位置的操作,其中使用用戶的人臉識(shí)別確定該位置。此外確定遞送到兩個(gè)揚(yáng)聲器的聲音,每個(gè)揚(yáng)聲器與用戶的耳朵相關(guān)聯(lián)。該方法還包括確定空間中的聲音發(fā)出位置的操作,以及基于空間中頭部的位置、聲音、空間中發(fā)出位置以及用戶的聽(tīng)覺(jué)(auditory)特征而為每個(gè)揚(yáng)聲器建立聲信號(hào)(acousticsignal)的操作。該聲信號(hào)傳輸?shù)絻蓚€(gè)揚(yáng)聲器,而且當(dāng)兩個(gè)揚(yáng)聲器播放聲信號(hào)時(shí),該聲信號(hào)模擬聲音源自空間中的發(fā)出位置。在另一個(gè)實(shí)施例中,模擬聲音源的方法包括用第一設(shè)備確定第一用戶頭部的第一位置的操作。在另一操作中,接收對(duì)應(yīng)于第二用戶頭部的第二位置,其中用第二設(shè)備確定第二位置。此外,該方法包括確定對(duì)應(yīng)于第二設(shè)備關(guān)于第一設(shè)備的位置的第三位置的操作,以及基于第一位置、第二位置以及第一用戶的聽(tīng)覺(jué)特征而為多個(gè)揚(yáng)聲器建立聲信號(hào)的另一個(gè)操作。該聲信號(hào)被傳輸?shù)蕉鄠€(gè)揚(yáng)聲器,其中當(dāng)多個(gè)揚(yáng)聲器播放時(shí),聲信號(hào)模擬與該聲信號(hào)相關(guān)的聲音源自第二用戶。另一實(shí)施例中,模擬聲音源的方法包括確定對(duì)應(yīng)于用戶頭部的第一位置的操作,以及確定對(duì)應(yīng)于對(duì)象的第二位置的另一操作。使用用戶周圍空間的圖像分析確定第二位置。此外,基于第一位置、第二位置以及用戶的聽(tīng)覺(jué)特征,為多個(gè)揚(yáng)聲器建立聲信號(hào),其中多個(gè)揚(yáng)聲器位于用戶周圍的空間中。聲信號(hào)被傳輸?shù)蕉鄠€(gè)揚(yáng)聲器,其中當(dāng)由多個(gè)揚(yáng)聲器播放時(shí),聲信號(hào)模擬與該聲信號(hào)相關(guān)的聲音源自該對(duì)象。在另一實(shí)施例中,模擬聲音源的方法包括生成多個(gè)聲線索(acousticcue)的操作,每個(gè)聲線索與空間中的位置相關(guān)。在該方法的另一實(shí)施例中,為每個(gè)聲線索接收來(lái)自用戶的輸入,每個(gè)輸入具有關(guān)于相應(yīng)聲線索的感知位置的信息。基于接收的輸入,為用戶建立聲音定位函數(shù)(function),其中通過(guò)從多個(gè)現(xiàn)有聲音函數(shù)中選擇現(xiàn)有聲音函數(shù),或者從多個(gè)現(xiàn)有聲音函數(shù)中組合多于一個(gè)現(xiàn)有聲音函數(shù),建立聲音定位函數(shù)。此外,基于聲音定位函數(shù)、用戶位置以及聲音源的期望感知位置,將聲音遞送到多個(gè)揚(yáng)聲器,用以模擬聲音源。在另一個(gè)實(shí)施例中,模擬聲音源的方法包括:(a)利用從多個(gè)可能的聲音定位函數(shù)中選擇的聲音定位函數(shù),為用戶播放聲音;(b)檢測(cè)從用戶到播放聲音的感知聲音位置的指向向量;(c)基于該檢測(cè)減少多個(gè)可能的聲音定位函數(shù);(d)從多個(gè)可能的聲音定位函數(shù)中選擇新的聲音定位函數(shù);以及重復(fù)操作(a)-(d),直到播放最后聲音并且為用戶選擇用戶聲音定位函數(shù),其中利用用戶聲音定位函數(shù)播放的聲音為用戶模擬該聲音源自空間中的期望位置。在另一個(gè)實(shí)施例中,模擬聲音源的方法包括:(a)利用從多個(gè)可能的聲音定位函數(shù)中選擇的聲音定位函數(shù),為用戶播放聲音;(b)響應(yīng)于播放聲音檢測(cè)用戶正在用手指指向何處;(c)基于該檢測(cè)減少多個(gè)可能的聲音定位函數(shù);(d)從多個(gè)可能的聲音定位函數(shù)中選擇新的聲音定位函數(shù);以及重復(fù)操作(a)-(d),直到播放最后聲音并且為用戶選擇用戶聲音定位函數(shù),其中利用用戶聲音定位函數(shù)播放的聲音為用戶模擬該聲音源自空間中的期望位置。在另一個(gè)實(shí)施例中,模擬聲音源的方法包括:(a)利用從多個(gè)可能的聲音定位函數(shù)中選擇的聲音定位函數(shù),為用戶播放聲音;(b)響應(yīng)于播放聲音檢測(cè)用戶的視線的方向;(c)基于該檢測(cè)減少多個(gè)可能的聲音定位函數(shù);(d)從多個(gè)可能的聲音定位函數(shù)中選擇新的聲音定位函數(shù);以及重復(fù)操作(a)-(d),直到播放最后聲音并且為用戶選擇用戶聲音定位函數(shù),其中利用用戶聲音定位函數(shù)播放的聲音為用戶模擬該聲音源自空間中的期望位置。結(jié)合附圖從下面的詳細(xì)描述中,其他方面將變得顯而易見(jiàn)。附圖說(shuō)明通過(guò)結(jié)合附圖參考下列說(shuō)明,可最佳地理解本發(fā)明。圖1A-1C例示了聲音從便攜式設(shè)備遞送到用戶的不同實(shí)施例。圖2描繪了根據(jù)一個(gè)實(shí)施例的多玩家增強(qiáng)現(xiàn)實(shí)環(huán)境。圖3A例示了根據(jù)本發(fā)明一個(gè)實(shí)施例的人臉識(shí)別方法。圖3B例示了根據(jù)一個(gè)實(shí)施例的當(dāng)用戶拿著可追蹤控制器時(shí)用戶的頭部的追蹤。圖4例示了根據(jù)一個(gè)實(shí)施例的具有逼真聲音遞送的增強(qiáng)現(xiàn)實(shí)環(huán)境。圖5例示了根據(jù)一個(gè)實(shí)施例的利用射頻標(biāo)識(shí)(RFID)檢測(cè)用戶頭部位置的方法。圖6例示了根據(jù)一個(gè)實(shí)施例的使用三角測(cè)量檢測(cè)用戶頭部位置的方法。圖7是執(zhí)行本發(fā)明實(shí)施例的計(jì)算機(jī)系統(tǒng)的簡(jiǎn)化原理圖。圖8A-8B顯示了根據(jù)本發(fā)明的實(shí)施例的模擬聲音源的算法的流程圖。圖9A例示了根據(jù)一個(gè)實(shí)施例的、基于接收聲音的用戶感知而選擇聲音定位函數(shù)的方法。圖9B例示了根據(jù)一個(gè)實(shí)施例的、基于源自用戶前面的聲音的感知而選擇聲音定位函數(shù)的方法。圖10A例示了根據(jù)一個(gè)實(shí)施例的、使用音頻和視頻線索(cues)選擇聲音定位函數(shù)的方法。圖10B例示了根據(jù)一個(gè)實(shí)施例的、通過(guò)連續(xù)指向在用戶前面移動(dòng)的感知聲音源而選擇聲音定位函數(shù)的方法。圖11顯示了根據(jù)一個(gè)實(shí)施例的選擇一個(gè)或多個(gè)聲音定位函數(shù)的流程圖。圖12顯示了根據(jù)一個(gè)實(shí)施例的從聲音定位函數(shù)數(shù)據(jù)庫(kù)中選擇一個(gè)或多個(gè)聲音定位函數(shù)的流程圖。圖13例示了可用于執(zhí)行本發(fā)明實(shí)施例的設(shè)備的架構(gòu)。圖14例示了可用于執(zhí)行本發(fā)明實(shí)施例的硬件和用戶界面。具體實(shí)施方式下列實(shí)施例描述了模擬聲音源的方法、計(jì)算機(jī)程序及設(shè)備。顯而易見(jiàn)的是:可以無(wú)需這些具體細(xì)節(jié)中的某些或全部而實(shí)施本實(shí)施例。在其他情況下,為了不會(huì)不必要地模糊本實(shí)施例,沒(méi)有詳細(xì)描述公知的步驟操作。圖1A-1C例示了聲音從便攜式設(shè)備遞送到用戶的不同實(shí)施例。圖1A顯示了聆聽(tīng)從便攜式設(shè)備104發(fā)出的音樂(lè)的用戶102,圖1B顯示了戴著耳機(jī)106聆聽(tīng)音樂(lè)的用戶102。當(dāng)用戶戴耳機(jī)時(shí),在感知聲音所發(fā)生之處(正好面對(duì)耳朵)和聲音實(shí)際發(fā)出處(便攜式設(shè)備)之間存在分離(disconnect)。因此,當(dāng)戴著耳機(jī)時(shí)和不戴耳機(jī)聽(tīng)音樂(lè)時(shí),用戶102獲得不同的體驗(yàn)。本發(fā)明實(shí)施例允許戴著耳機(jī)的用戶具有和用戶不戴耳機(jī)時(shí)所經(jīng)歷的相似體驗(yàn)。聲音定位(soundlocalization)是指聽(tīng)眾在方向和距離上識(shí)別所檢測(cè)聲音的位置或來(lái)源的能力。它也可以指模擬虛擬3D空間中聲線索的放置的聲學(xué)工程方法。人類聽(tīng)覺(jué)系統(tǒng)使用聲音源定位的若干線索,包括雙耳之間的時(shí)差和級(jí)差、頻譜信息、時(shí)序分析、相關(guān)分析和模式匹配。人類有兩只耳朵,但可在三維上-范圍(距離)、方向的上和下、前和后以及任一側(cè)上定位聲音。大腦、內(nèi)耳和外耳共同努力以做出關(guān)于位置的推論。通過(guò)獲得源自一只耳朵的線索(單耳線索)并通過(guò)比較兩只耳朵處接收的線索(差異線索或雙耳線索),人類估計(jì)源的位置。在這些差異中,線索是到達(dá)的時(shí)間差異以及強(qiáng)度差異。單耳線索來(lái)自聲音源和人體解剖學(xué)之間的交互作用,其中在聲音進(jìn)入耳道而由聽(tīng)覺(jué)系統(tǒng)處理之前修改原始聲音源。這些修改編碼源位置,并可能通過(guò)與源位置和耳朵位置相關(guān)的脈沖響應(yīng)而被捕獲。此脈沖響應(yīng)被稱為與頭相關(guān)的脈沖響應(yīng)(head-relatedimpulseresponse)(HRIR)。如果已在源位置處播放聲音,同時(shí)聽(tīng)眾的耳朵在接收器位置處,則任意聲音源與HRIR的卷積(convolution)將聲音轉(zhuǎn)換為聽(tīng)眾所聽(tīng)到的。HRIR可用于產(chǎn)生虛擬環(huán)繞聲。聲音定位函數(shù)f(此處還稱為聲音函數(shù),定位函數(shù),有時(shí)直接為“函數(shù)”)是基于聲音和空間中被感知為聲音源的位置而生成定位聲音的函數(shù)或算法。當(dāng)揚(yáng)聲器播放時(shí),定位的聲音給用戶聲音源自期望位置的印象,即使聲音實(shí)際上是源自揚(yáng)聲器。函數(shù)f可數(shù)學(xué)表示為:ls=f(s,l)(1)其中s是聲音(例如犬吠),l是期望聲音發(fā)出的位置,而ls是定位的聲音。聲音定位函數(shù)的一個(gè)例子是與頭相關(guān)的傳輸函數(shù)(HRTF),它是刻畫耳朵如何從空間點(diǎn)接收聲音的響應(yīng)。一對(duì)耳朵的HRTF可用于合成似乎來(lái)自空間特定點(diǎn)的雙耳聲音。HRTF還可被描述為將大氣中一個(gè)方向的聲音修改為到達(dá)耳膜的聲音。這些修改包括聽(tīng)眾外耳的形狀、聽(tīng)眾頭部和身體的形狀、其中播放聲音的空間聲學(xué)特征等。所有這些特征影響聽(tīng)眾如何能夠精確地區(qū)分聲音來(lái)自什么方向。由于每個(gè)人的體質(zhì)差異,每個(gè)人都有不同的HRTF。使用HRTF描述本發(fā)明的聲音定位實(shí)施例,但說(shuō)明聽(tīng)眾體質(zhì)特征的其他任何形式的聲音定位可用于本發(fā)明的實(shí)施例。圖1C例示了本發(fā)明的實(shí)施例,其中在耳機(jī)116處遞送的聲音被修改,這樣用戶102感知由耳機(jī)116遞送的聲音,仿佛該聲音從便攜式設(shè)備110發(fā)出,而不是感知到該聲音直接來(lái)自耳機(jī)116。便攜式設(shè)備110跟蹤耳機(jī)(headphones)(也稱為頭戴式耳機(jī)(headset)、頭戴受話器(earphones)或聽(tīng)筒(earpiece))關(guān)于便攜式設(shè)備110位置的位置。一旦耳機(jī)關(guān)于便攜式設(shè)備的相對(duì)位置已知,便攜式設(shè)備操作該聲音(例如使用用戶的HRTF)來(lái)生成定位的聲音,為的是使用戶相信該聲音直接來(lái)自便攜式設(shè)備110。在圖1C所示的實(shí)施例中,將定位的聲音無(wú)線傳輸?shù)綗o(wú)線耳機(jī)116。一旦由耳機(jī)116播放定位的聲音,用戶得到該聲音來(lái)自便攜式設(shè)備110的體驗(yàn)。不同的人有不同的HRTF,當(dāng)使用用戶的HRTF時(shí)遞送最引人入勝(compelling)的體驗(yàn)。在一個(gè)實(shí)施例中,當(dāng)對(duì)于用戶來(lái)說(shuō)HRTF不可得時(shí)使用標(biāo)準(zhǔn)的HRTF。標(biāo)準(zhǔn)的HRTF考慮到人類的平均特征。雖然沒(méi)有利用用戶的HRTF,但是標(biāo)準(zhǔn)的HRTF仍然可以為用戶提供逼真的體驗(yàn)。此外,可使用校準(zhǔn)方法來(lái)進(jìn)一步為特定用戶定制聲音定位體驗(yàn),用以為用戶開(kāi)發(fā)HRTF。存在跟蹤耳機(jī)位置的多種方式,其依次定義用戶耳朵的位置。通常,此處我們指的是跟蹤用戶耳朵的位置,因?yàn)槎涞奈恢么_定了如何定位聲音。為了便于說(shuō)明,此處我們是指有時(shí)跟蹤用戶的位置,跟蹤用戶頭部的位置,或者跟蹤用戶正戴著的耳機(jī)的位置。所有這些跟蹤方法是等效的,因?yàn)榭梢詮念^部、用戶或耳機(jī)的位置推導(dǎo)出耳朵的位置。圖1C的實(shí)施例中,耳機(jī)116包括光源,例如發(fā)光二極管(LED)114。便攜式設(shè)備110中的相機(jī)112拍攝用戶102所位于的空間的圖像,之后便攜式設(shè)備112執(zhí)行圖像分析,以確定LED114的位置。圖像中的亮點(diǎn)參與LED位置的識(shí)別。此外,基于相機(jī)112拍攝的圖像中LED114的大小而估計(jì)從便攜式設(shè)備到耳機(jī)的距離。一旦確定LED114的位置,假定LED位于耳朵和連接該耳朵的線上方幾英寸之間,根據(jù)耳機(jī)的物理特性,估計(jì)用戶耳朵的位置。需要注意的是:圖1C所示的實(shí)施例是示范性的。其他實(shí)施例可利用跟蹤用戶耳朵位置的不同方法,或者跟蹤方法的組合可用于增加準(zhǔn)確性。例如,通過(guò)使用人臉識(shí)別、超聲波通信、RFID、紅外光、全球定位系統(tǒng)(GPS)等可執(zhí)行定位跟蹤。因此圖lC所例示的實(shí)施例不應(yīng)該被解釋為排斥性的或限制性的,而是示范性的或例示性的。聲音投射為用戶提供了引人入勝的體驗(yàn),使得耳機(jī)從聆聽(tīng)體驗(yàn)中“消失”。用戶并不覺(jué)得聲音來(lái)自位于耳朵周圍的兩個(gè)揚(yáng)聲器元件,而是感覺(jué)聲音來(lái)自空間中特殊點(diǎn),依據(jù)該情況,其可能與便攜式設(shè)備、來(lái)自游戲的虛擬元件、虛擬用戶等有關(guān)。隨著虛擬聲音源變化或者隨著用戶位置改變,聲音投射調(diào)適,因此該聲音似乎是從正確的位置產(chǎn)生的。圖2描述了根據(jù)一個(gè)實(shí)施例的多玩家增強(qiáng)現(xiàn)實(shí)環(huán)境。在共享空間的游戲中,多個(gè)設(shè)備交換位置和游戲信息以提供虛擬多玩家體驗(yàn),其中用戶的顯示器投影共享的虛擬空間。這允許每個(gè)玩家系統(tǒng)訪問(wèn)來(lái)自其他所有玩家的相機(jī)視圖和位置信息,用以同步其校準(zhǔn)位置并共享虛擬空間,一起還被稱為共享空間。圖2的實(shí)施例中,玩家202和204在同一個(gè)房間中,而玩家206正在遠(yuǎn)程游戲(用虛線表示為虛擬玩家)。當(dāng)玩家202和204已經(jīng)參照共同的3D空間中的點(diǎn)(例如桌子上的點(diǎn))而同步或校準(zhǔn)他們的便攜式設(shè)備后,創(chuàng)建了共同的虛擬場(chǎng)景208。玩家206以類似方式將他的便攜式設(shè)備同步到玩家206周圍空間中的點(diǎn)。每個(gè)玩家都有虛擬場(chǎng)景208的視圖,在這種情況下是戰(zhàn)斗平臺(tái)游戲的虛擬場(chǎng)景好像真的在玩家面前的桌子上。該便攜式設(shè)備起相機(jī)的作用,使得當(dāng)玩家四處移動(dòng)設(shè)備時(shí),隨著相機(jī)指向不同方向,該視圖與相機(jī)改變顯示同樣的方式改變。結(jié)果,每個(gè)顯示器上的實(shí)際視圖獨(dú)立于其他顯示器上的視圖,該視圖僅僅基于和虛擬場(chǎng)景有關(guān)的便攜式設(shè)備的相對(duì)位置,其固定在3D空間上的實(shí)際物理位置上。通過(guò)使用多個(gè)相機(jī)、加速計(jì)和確定位置的其他機(jī)械設(shè)備以及便攜式設(shè)備之間的高速通信,可能創(chuàng)建3D移動(dòng)捕獲體驗(yàn),其以可信的方式允許玩家看見(jiàn)或者可能觸摸虛擬的游戲人物和環(huán)境。共享空間游戲利用設(shè)備的高速連接性來(lái)在參加共享空間游戲體驗(yàn)的設(shè)備之間交流信息。通過(guò)將設(shè)備變成留存(persist)在每個(gè)設(shè)備之間空間內(nèi)穩(wěn)定的“魔術(shù)窗口”,通過(guò)該設(shè)備查看虛擬場(chǎng)景208游戲區(qū)。通過(guò)使用移動(dòng)跟蹤、圖像分析和每個(gè)設(shè)備之間信息的高留存性,即使當(dāng)設(shè)備四處移動(dòng)時(shí),游戲區(qū)呈現(xiàn)在穩(wěn)定的位置。本發(fā)明的實(shí)施例提高了增強(qiáng)現(xiàn)實(shí)的體驗(yàn),不僅包括用戶所見(jiàn),還包括用戶所聞。玩游戲期間,玩家202覺(jué)察到聲音來(lái)自板上的虛擬對(duì)象,例如軍隊(duì)218或者大炮220,來(lái)自其他玩家204和206,來(lái)自玩家握著的便攜式設(shè)備212和214等等。在一個(gè)實(shí)施例中,玩家們戴著可包括麥克風(fēng)228的耳機(jī)226。當(dāng)用戶202玩游戲時(shí),便攜式設(shè)備210重新創(chuàng)建虛擬增強(qiáng)的現(xiàn)實(shí),其中其他玩家204和206坐在玩家202面前的桌子周圍。一旦玩家們具有了虛擬空間中分配的地點(diǎn),這些玩家發(fā)出的聲音(例如語(yǔ)音)之后被模擬進(jìn)入增強(qiáng)現(xiàn)實(shí)空間中。遠(yuǎn)程玩家206說(shuō)話時(shí),語(yǔ)音傳輸?shù)奖銛y式設(shè)備210,其又修改語(yǔ)音,所以玩家202感知到玩家206的語(yǔ)音,所述玩家206的語(yǔ)音被定位到玩家202所位于的同一房間中玩家206的虛擬位置上。每個(gè)便攜式設(shè)備跟蹤各個(gè)玩家的位置,而玩家的位置信息在便攜式設(shè)備之間共享。如果玩家和該玩家所拿的便攜式設(shè)備相關(guān)地移動(dòng),則該玩家的位置由其他便攜式設(shè)備共享,而當(dāng)玩家說(shuō)話時(shí),該語(yǔ)音被定位到玩家當(dāng)前所在的地點(diǎn)。當(dāng)兩名玩家(例如玩家202和204)不遠(yuǎn)時(shí),便攜式設(shè)備不僅必須跟蹤拿著便攜式裝置的玩家的位置,還必須跟蹤附近其他便攜式設(shè)備的位置。在一個(gè)實(shí)施例中,以與跟蹤該玩家相似的方式(例如通過(guò)用相機(jī)所拍攝圖像的圖像識(shí)別)跟蹤其他便攜式設(shè)備的位置。在另一實(shí)施例中,便攜式設(shè)備定義空間中的共同點(diǎn)(例如桌面中心),然后每個(gè)便攜式設(shè)備跟蹤關(guān)于共同點(diǎn)的便攜式設(shè)備的位置。之后關(guān)于共同點(diǎn)的便攜式設(shè)備的位置與其他便攜式設(shè)備共享,為的是確定便攜式設(shè)備之間的相對(duì)位置。應(yīng)當(dāng)注意的是:聲音并不是必須源自便攜式設(shè)備中顯示器所涵蓋的空間內(nèi)。聲音可能來(lái)自視野之外的對(duì)象或玩家。例如,玩家可以直視前方,而聲音可能來(lái)自玩家的右邊。然后該聲音對(duì)玩家來(lái)說(shuō)變成了線索,關(guān)于產(chǎn)生來(lái)自右邊聲音的對(duì)象或人的行蹤。然而,應(yīng)當(dāng)注意的是:好的HRTF模型將大大提高顯示范圍以外對(duì)象的聲音定位準(zhǔn)確性。這是因?yàn)樘摂M環(huán)繞聲系統(tǒng)中的不準(zhǔn)確性由面臨視覺(jué)反饋的大腦忽略。如果玩家認(rèn)為聲音來(lái)自可視對(duì)象,即使在聲音傳輸中有一些錯(cuò)誤,大腦使用視覺(jué)信息來(lái)識(shí)別聲音源。然而,當(dāng)聲音源自視野外,聲音定位的額外視覺(jué)線索丟失。在這種情況下,好的HRTF增強(qiáng)了視野之外對(duì)象的聲音定位。增強(qiáng)現(xiàn)實(shí)游戲中的聲音定位可應(yīng)用到多種類型的游戲中。在射擊游戲中,由另一名玩家開(kāi)的槍似乎來(lái)自其他玩家的武器。在冒險(xiǎn)游戲中,人物的語(yǔ)音似乎來(lái)自人物的位置。在多玩家游戲中,來(lái)自另一名玩家的語(yǔ)音似乎來(lái)自正在說(shuō)話的玩家的位置。在一個(gè)實(shí)施例中,由計(jì)算機(jī)程序生成玩家產(chǎn)生的語(yǔ)音。例如,一名玩家向另一名玩家發(fā)短信,計(jì)算機(jī)程序使用聲音定位來(lái)“讀取”發(fā)給另外玩家的短信,這使得計(jì)算機(jī)生成的語(yǔ)音似乎來(lái)自于發(fā)信息的玩家的口中。此外,虛擬現(xiàn)實(shí)產(chǎn)生的語(yǔ)音可能是經(jīng)翻譯的語(yǔ)音,也就是說(shuō)由機(jī)器翻譯工具生成的語(yǔ)音。例如,遠(yuǎn)程玩家用外語(yǔ)說(shuō)話,隨著遠(yuǎn)程玩家說(shuō)話,外語(yǔ)被翻譯成接收該語(yǔ)音的玩家的母語(yǔ)。圖3A例示了根據(jù)按照本發(fā)明一個(gè)實(shí)施例的人臉識(shí)別方法。在一個(gè)實(shí)施例中,使用游戲區(qū)域360的視頻圖像的圖像分析來(lái)完成玩家臉部或耳朵的位置確定,圖像分析包括檢測(cè)和跟蹤用戶特征,例如眼睛366和368,臉,鼻子372,嘴370,軀干364等等。在圖3A的實(shí)施例中,跟蹤臉部特征以估計(jì)頭部的三維位置并得到耳朵的位置。跟蹤的特征越多,頭部跟蹤越可靠。例如,如果用戶遠(yuǎn)離相機(jī)轉(zhuǎn)動(dòng)頭部,則對(duì)于相機(jī)來(lái)說(shuō)只有一只眼睛是可見(jiàn)的。通過(guò)理解鼻子和嘴的位置,系統(tǒng)確定:用戶已經(jīng)轉(zhuǎn)動(dòng)頭部而不是假設(shè)檢測(cè)臉部失敗。一旦確定用戶耳朵的位置,根據(jù)聲音源和耳朵的位置在聲音上完成了聲音定位。在一個(gè)實(shí)施例中,用戶所在地區(qū)的圖像由便攜式設(shè)備中“臉部所對(duì)的”相機(jī)拍攝。此外,可將閃光燈或其他某一光源照耀到用戶臉部以改善人臉識(shí)別。在另一個(gè)實(shí)施例中,不是跟蹤用戶的便攜式設(shè)備,與用戶相關(guān)聯(lián)的設(shè)備跟蹤便攜式設(shè)備。例如,耳機(jī)352包括相機(jī)354,由相機(jī)354拍攝的圖像用于發(fā)現(xiàn)便攜式設(shè)備。在一個(gè)實(shí)施例中,由相機(jī)354拍攝的圖像被發(fā)送到圖像分析的便攜式設(shè)備。一旦圖像分析確定便攜式設(shè)備的位置,便推導(dǎo)出關(guān)于便攜式設(shè)備的用戶的位置,使得聲音定位成為可能。應(yīng)當(dāng)注意的是:此處所述的跟蹤方法可用于在隔離或其任何組合中。例如,耳機(jī)上的相機(jī)354可用于追蹤便攜式設(shè)備的位置,而便攜式設(shè)備可同事跟蹤用戶的臉部。此外可以利用其他跟蹤方法,如紅外光、超聲波、GPS、RFID等。這些跟蹤方法提供的信息可組合以進(jìn)一步提高跟蹤精度。圖3B例示了:根據(jù)一個(gè)實(shí)施例,當(dāng)用戶拿著可追蹤控制器時(shí)用戶頭部的跟蹤。圖3B的實(shí)施例包括連接到圖像捕獲設(shè)備304的游戲控制臺(tái)302。通過(guò)圖像識(shí)別或通過(guò)其他類型的定位跟蹤,控制器312是可追蹤的。當(dāng)用戶310拿著控制器312時(shí),游戲控制臺(tái)302基于可跟蹤控制器的位置并基于用戶的位置(如使用人臉識(shí)別)執(zhí)行聲音定位。游戲控制臺(tái)302內(nèi)的位置跟蹤模塊基于控制器的位置確定空間中的頭部位置。位于用戶310周圍的兩個(gè)或多個(gè)揚(yáng)聲器314從游戲控制臺(tái)302接收聲音信號(hào)。當(dāng)執(zhí)行聲音定位時(shí),根據(jù)用戶的位置、聲音發(fā)出的位置以及揚(yáng)聲器的位置修改發(fā)送到揚(yáng)聲器314的聲音信號(hào)。例如,如果射手從離顯示器306大約20米的位置開(kāi)槍,并且用戶離顯示器306三米遠(yuǎn),聲音定位將修改正被射擊的槍的聲音,因此射擊似乎來(lái)自離用戶310大約23米遠(yuǎn)的位置。通常可定位遞送給用戶的聲音,這樣聲音似乎源自游戲控制臺(tái)302,來(lái)自顯示器306上的游戲?qū)ο?,?lái)自控制器312,來(lái)自位于用戶物理空間的虛擬游戲?qū)ο?,等等。連續(xù)跟蹤用戶的位置,并且聲音定位基于用戶的當(dāng)前位置。例如,如果用戶轉(zhuǎn)動(dòng)頭部,聲音定位變化,因此該聲音似乎來(lái)自正確位置,即使用戶正在轉(zhuǎn)動(dòng)頭部的時(shí)候。圖4例示了根據(jù)一個(gè)實(shí)施例的具有聲音真實(shí)遞送的增強(qiáng)現(xiàn)實(shí)環(huán)境。玩家406a具有與位于桌子404上方的參考點(diǎn)402同步的設(shè)備408a。在一個(gè)實(shí)施例中,點(diǎn)P0402是參考點(diǎn)而且還是具有坐標(biāo)(X0=0,Y0=0,Z0=0)的坐標(biāo)原點(diǎn)。雖然玩家406a在房間內(nèi),此處還被稱為虛擬場(chǎng)景的虛擬現(xiàn)實(shí)可擴(kuò)展到超出房間的物理邊界。玩家406b和玩家406a玩同樣的游戲但是在遠(yuǎn)程位置,對(duì)于玩家406a來(lái)說(shuō),玩家406b被描繪成該游戲中的虛擬元素。玩家406b正拿著便攜式設(shè)備408b,其已同步到玩家406b所在物理空間中的另一個(gè)參考點(diǎn)。在一個(gè)示范性實(shí)施例中,虛擬場(chǎng)景依賴參考點(diǎn),因?yàn)樘摂M場(chǎng)景的幾何形狀(正如通過(guò)設(shè)備屏幕所見(jiàn)到的)至少部分地基于該參考點(diǎn)。例如,可用參考點(diǎn)確定虛擬場(chǎng)景中虛擬對(duì)象的坐標(biāo)??墒褂萌魏魏饬繕?biāo)準(zhǔn)測(cè)量坐標(biāo)。然而,為了提供可視化的例子并且不限制使用的實(shí)際坐標(biāo),如果用米測(cè)量虛擬場(chǎng)景的坐標(biāo),坐標(biāo)為(1,0,0)的對(duì)象將位于參考點(diǎn)右方一米處。當(dāng)然,隨著場(chǎng)景變化,例如當(dāng)虛擬對(duì)象在場(chǎng)景內(nèi)移動(dòng)時(shí),可動(dòng)態(tài)更新真實(shí)或虛擬的對(duì)象的坐標(biāo)。此外,可通過(guò)計(jì)算機(jī)設(shè)定的動(dòng)作(例如交互程序)定義該變化,可通過(guò)用戶的動(dòng)作和二者組合來(lái)驅(qū)動(dòng)。此外,為清楚起見(jiàn),交互程序可以是任何類型的程序,如視頻游戲、商業(yè)程序、網(wǎng)絡(luò)接口或者僅僅是向其他用戶、程序或者對(duì)象提供數(shù)據(jù)訪問(wèn)的圖形用戶界面,該對(duì)象可能會(huì)或可能不會(huì)由揚(yáng)聲器顯示或投射。此外,其他實(shí)施例還可具有不同的坐標(biāo)系統(tǒng)或使用縮放。例如,替代直角坐標(biāo)系,坐標(biāo)系統(tǒng)可以是極性的,球面,拋物面等。此外,參考點(diǎn)并不是必須在坐標(biāo)系的原點(diǎn),可以位于不同的地方。為了提供實(shí)例,參考點(diǎn)可位于坐標(biāo)(5,5,5)處,在超過(guò)5米的點(diǎn)上必須使用負(fù)坐標(biāo)值之前,使得每個(gè)方向上有5米的緩沖區(qū)。在另一場(chǎng)景中,建立虛擬對(duì)象來(lái)縮放,也是用比例尺來(lái)測(cè)量坐標(biāo)。例如,虛擬對(duì)象可建立在l:10的比例尺上,幾何軸也可具有l(wèi):10的比例尺,這樣具有坐標(biāo)(1,0,0)的對(duì)象離“真實(shí)”世界1米遠(yuǎn),而離虛擬世界10米遠(yuǎn)。圖4中,虛擬對(duì)象包括直升機(jī)414a-414c、云、鳥、太陽(yáng)416等。隨著玩家406a移動(dòng)便攜式設(shè)備408a,虛擬場(chǎng)景的視野變化,好像玩家拿著相機(jī)進(jìn)入到虛擬世界。應(yīng)當(dāng)注意的是:設(shè)備408a中所顯示的視圖可包括或可不包括參考點(diǎn)。房間包括除桌子404之外的其他靜態(tài)對(duì)象,例如電視412和窗口410。正如圖4所看出的,虛擬對(duì)象可位于空間的任何地方。當(dāng)便攜式設(shè)備包含相機(jī)時(shí),可由便攜式設(shè)備使用房間中的靜態(tài)特性,通過(guò)用來(lái)自其相機(jī)的視圖調(diào)整其慣性測(cè)量來(lái)維持當(dāng)前位置的精確測(cè)量。便攜式設(shè)備中的圖像分析可檢測(cè)窗口邊緣、光源、桌子邊緣、墻壁上的畫、電視等。游戲控制臺(tái)422與便攜式設(shè)備108a交流信息以發(fā)送增強(qiáng)現(xiàn)實(shí)環(huán)境。該信息包括游戲信息、用戶跟蹤、便攜式設(shè)備位置、虛擬對(duì)象位置、遠(yuǎn)程玩家的位置等等中的一個(gè)或多個(gè)。在一個(gè)實(shí)施例中,游戲控制臺(tái)422跟蹤玩家406a的耳朵位置。當(dāng)游戲中產(chǎn)生聲音時(shí)(例如,直升機(jī)飛行的聲音),游戲控制臺(tái)422確定虛擬空間中聲音源的坐標(biāo)。一旦耳朵的位置和聲音源的位置已知,游戲控制臺(tái)422確定聲音源和感知聲音的耳朵之間的相對(duì)位置。游戲控制臺(tái)422還具有關(guān)于房間中揚(yáng)聲器420的位置信息。用戶的HRTF用于將該聲音轉(zhuǎn)換成對(duì)于用戶來(lái)說(shuō)似乎來(lái)自聲音源的經(jīng)定位的聲音。為了模擬聲音源的位置,傳送到揚(yáng)聲器420的經(jīng)定位的聲音包括用于每個(gè)揚(yáng)聲器420的不同聲信號(hào)。在另一實(shí)施例中,用戶406a正戴著耳機(jī)(未顯示)。在這種情況下,定位的聲音被傳送到耳機(jī)而不是揚(yáng)聲器。使用揚(yáng)聲器和使用耳機(jī)的聲音定位算法是類似的,但在揚(yáng)聲器的情況下,位置是固定的,而在耳機(jī)的情況下必須跟蹤位置,因?yàn)橛脩粢苿?dòng)時(shí),耳機(jī)移動(dòng)。此外,在房間揚(yáng)聲器的情況下,對(duì)于來(lái)自每個(gè)揚(yáng)聲器的聲音,存在行程時(shí)間(traveltime),其必須由聲音定位算法考慮。聲音定位算法采用用戶的HRTF以及用戶耳朵的當(dāng)前位置生成用于耳機(jī)的定位聲音。由耳機(jī)播放的定位聲音的聲信號(hào)為考慮空間中虛擬對(duì)象虛擬位置的用戶提供聲線索。在一個(gè)實(shí)施例中,當(dāng)發(fā)出聲音的對(duì)象或人顯示在便攜式設(shè)備顯示器上或連接到游戲控制臺(tái)422的顯示器412上時(shí),用更高的音量遞送定位聲音的聲信號(hào)。便攜式設(shè)備不僅充當(dāng)相機(jī),還充當(dāng)定向(directional)麥克風(fēng)。當(dāng)聲音源不在顯示器上時(shí),聲音的音量較低。因?yàn)楸銛y式設(shè)備作為相機(jī)和定向麥克風(fēng)工作,隨著用戶移動(dòng)便攜式設(shè)備,用戶具有聲音源所在之處的聲線索。給遠(yuǎn)程玩家406b分配玩家406a物理空間中的一個(gè)位置。聲音定位包括產(chǎn)生似乎來(lái)自玩家406b或來(lái)自便攜式設(shè)備408b的聲音。例如,當(dāng)玩家406b說(shuō)話時(shí),由便攜式設(shè)備408b捕獲該語(yǔ)音,然后傳送到游戲控制臺(tái)422或便攜式設(shè)備408a。之后使用HRTF或某些其他聲音定位算法將來(lái)自用戶406b的語(yǔ)音轉(zhuǎn)換,用以給用戶406a遞送該語(yǔ)音,好像玩家406b正站在玩家406a附近。在一個(gè)實(shí)施例中,GPS用于跟蹤用戶。例如,便攜式設(shè)備中的GPS模塊用于確定便攜式設(shè)備的位置,當(dāng)由便攜式設(shè)備與用戶跟蹤相結(jié)合時(shí),其將GPS位置提供給用戶。如果用戶406b位于遠(yuǎn)程位置(例如幾英里遠(yuǎn)),用戶406b的GPS位置可用于音效。例如,用戶406b具有由遠(yuǎn)程玩家投射的游戲炮。聲音效果模擬來(lái)自用戶406b實(shí)際位置的炮投射。首先聽(tīng)到開(kāi)槍射擊,隨著炮彈經(jīng)由空氣從玩家406b的位置行進(jìn)(travel)到玩家406a的位置,之后跟隨有炮彈的聲音。由于炮彈通過(guò)空氣行進(jìn),聲音強(qiáng)度增加,正如在現(xiàn)實(shí)生活那樣。最后,當(dāng)炮彈擊中目標(biāo)時(shí)聽(tīng)到爆炸,而且如果目標(biāo)在用戶附近,將用高音量遞送聲音。圖5例示了根據(jù)一個(gè)實(shí)施例、利用射頻標(biāo)識(shí)(RFID)檢測(cè)用戶頭部位置的方法。戴著耳機(jī)504的用戶502在她口袋里攜佩戴便攜式設(shè)備506。便攜式設(shè)備506包括RFID模塊508,耳機(jī)504中的一個(gè)或兩個(gè)耳機(jī)512包括RFID標(biāo)簽510。RFID模塊508不僅能夠閱讀RFID標(biāo)簽510中的信息,還能夠確定來(lái)自RFID標(biāo)簽510的無(wú)線電信號(hào)的方向和時(shí)序。因此,RFID技術(shù)的使用使得便攜式設(shè)備獲得RFID標(biāo)簽510的距離以及RFID信號(hào)方向的估計(jì)。這樣,即使RFID模塊508和RFID標(biāo)簽510之間不存在視線,便攜式設(shè)備仍然可以得到耳機(jī)512位置的估計(jì),其指示用戶502的耳朵的位置。其他實(shí)施例可使用除RFID外的其他類型的無(wú)線通信,例如藍(lán)牙、Wi-Fi、無(wú)線電傳輸、超聲波、聲信號(hào)等。在另一實(shí)施例中,耳機(jī)和便攜式設(shè)備包括GPS模塊。GPS模塊提供空間中用戶頭部和便攜式設(shè)備的絕對(duì)位置。便攜式設(shè)備中的位置跟蹤模塊使用GPS位置,用以確定空間中關(guān)于便攜式設(shè)備位置的頭部位置。一旦確定了相對(duì)位置,便攜式設(shè)備能夠執(zhí)行用戶的聲音定位,正如之前所述??梢允褂萌魏晤愋偷腉PS技術(shù),例如使用GPS衛(wèi)星星座(constellation),或者使用基于到移動(dòng)電話塔距離的移動(dòng)電話定位技術(shù)。GPS技術(shù)也可與其他形式的跟蹤結(jié)合。例如,便攜式設(shè)備可包括GPS模塊,而便攜式設(shè)備通過(guò)圖像識(shí)別跟蹤用戶耳朵的位置。便攜式設(shè)備的GPS定位可用于具有遠(yuǎn)程虛擬玩家的游戲中。所有玩家的GPS定位用于創(chuàng)建將玩家的相對(duì)位置彼此匹配的聲音效果。圖6例示了根據(jù)一個(gè)實(shí)施例使用三角測(cè)量檢測(cè)頭部位置的方法。在一個(gè)實(shí)施例中(未顯示),耳機(jī)包括超聲波源,超聲波信號(hào)用于跟蹤玩家頭部的位置。一個(gè)或多個(gè)定向麥克風(fēng)可用于確定耳機(jī)的位置,因?yàn)槎ㄏ螓溈孙L(fēng)提供聲音的方向。此外,從耳機(jī)到便攜式設(shè)備行進(jìn)的超聲波時(shí)間量計(jì)時(shí)提供了測(cè)距從耳機(jī)到麥克風(fēng)的距離的信息。當(dāng)多于一個(gè)麥克風(fēng)可用時(shí),三角測(cè)量可用于微調(diào)用戶的位置。圖6中的實(shí)施例中,超聲波源位于便攜式設(shè)備604處。耳機(jī)606包括三個(gè)超聲波麥克風(fēng)608a-608c。由麥克風(fēng)608a-608c中每一個(gè)捕獲的信息被傳輸?shù)奖銛y式設(shè)備604上。便攜式設(shè)備604中的位置跟蹤模塊分析由麥克風(fēng)捕獲的聲音信息,用以確定耳機(jī)的位置,其包括根據(jù)聲音的方向和聲音到達(dá)麥克風(fēng)的時(shí)間執(zhí)行三角測(cè)量。由位置跟蹤模塊執(zhí)行的分析確定耳機(jī)關(guān)于便攜式設(shè)備的相對(duì)位置。也可以用其他無(wú)線技術(shù)使用三角測(cè)量。例如,便攜式設(shè)備可包括三個(gè)可讀取由RFID標(biāo)簽發(fā)送的RFID無(wú)線電信號(hào)的RFID傳感器。為了改善包括三角測(cè)量信號(hào)源的估計(jì),空間上彼此遠(yuǎn)離地定位RFID傳感器。同樣,RFID標(biāo)簽可位于耳機(jī)內(nèi),一個(gè)在右邊的耳機(jī)上,一個(gè)在左邊耳機(jī)上,第三個(gè)在右邊和左邊耳機(jī)之間。應(yīng)當(dāng)注意:三角測(cè)量信號(hào)的其他實(shí)施例可包括除3外的不同數(shù)量的傳感器,例如2,4等。因此圖6所示的實(shí)施例不應(yīng)被解釋為排斥性的或限制性的,而是示范性的和說(shuō)明性的。圖7是執(zhí)行本發(fā)明實(shí)施例的計(jì)算機(jī)系統(tǒng)的簡(jiǎn)化原理圖。應(yīng)當(dāng)理解:可用諸如傳統(tǒng)通用計(jì)算機(jī)系統(tǒng)的數(shù)字處理系統(tǒng)執(zhí)行此處所述的方法。被設(shè)計(jì)或編程為執(zhí)行唯一功能的專用計(jì)算機(jī)可用于備選。計(jì)算設(shè)備712包括處理器732,其耦合到存儲(chǔ)器734、耦合到永久存儲(chǔ)設(shè)備758、以及耦合到計(jì)算設(shè)備712內(nèi)或者連接到計(jì)算設(shè)備712的其他模塊。聲音定位計(jì)算機(jī)程序736駐留在存儲(chǔ)器734中,但也可以駐留在永久存儲(chǔ)設(shè)備758中。計(jì)算設(shè)備712與超聲波捕獲設(shè)備708、圖像捕獲設(shè)備720和顯示器726通信。在一個(gè)實(shí)施例中,聲音捕獲設(shè)備708、圖像捕獲設(shè)備720、RFID模塊706和顯示器726可嵌入到計(jì)算設(shè)備712中或者是獨(dú)立的單元。在一個(gè)實(shí)施例中,超聲波捕獲設(shè)備包括麥克風(fēng),而在另一個(gè)實(shí)施例中,超聲波捕獲設(shè)備包括麥克風(fēng)陣列。設(shè)備位置跟蹤模塊724確定便攜式設(shè)備的位置。多種技術(shù)可用于位置跟蹤,例如超聲波、GPS、RFID、圖像分析、三角測(cè)量、慣性等,或者其組合。頭部跟蹤模塊738確定用戶耳朵中一個(gè)或兩個(gè)的位置(其可通過(guò)確定耳機(jī)的位置而間接確定)。通過(guò)使用一種或多種不同的技術(shù),例如圖像識(shí)別、RFID、超聲波、紅外線、三角測(cè)量等,頭部跟蹤模塊738可確定用戶耳朵的位置。為了執(zhí)行聲音定位,聲音投射模塊716修改聲音信號(hào),期望遞送到聲音系統(tǒng),這樣接收修改后的聲音信號(hào)的用戶將具有聲音發(fā)自期望位置的印象。聲音投射模塊716使用設(shè)備位置跟蹤模塊724和頭部跟蹤模塊738提供的位置信息以修改聲音信號(hào)。永久存儲(chǔ)設(shè)備758代表持續(xù)的數(shù)據(jù)存儲(chǔ)設(shè)備,例如軟盤驅(qū)動(dòng)或固定光盤驅(qū)動(dòng),其可能是本地的或遠(yuǎn)程的。網(wǎng)絡(luò)接口746提供網(wǎng)絡(luò)連接,允許與其他設(shè)備通信。應(yīng)該理解:處理器732可嵌入到通用處理器、專用處理器或者專門編程的邏輯器件中。輸入/輸出(I/O)接口742提供了與不同外設(shè)的通信,例如顯示器726、鍵盤752、鼠標(biāo)750、超聲波捕獲設(shè)備708、圖像捕獲設(shè)備720、揚(yáng)聲器754、耳機(jī)704、按鈕、傳感器、觸摸屏756等。通用串行總線(USB)模塊744提供到USB設(shè)備的連接。顯示器726被配置為顯示此處所述的用戶接口。為了向處理器732傳送信息,鍵盤752、鼠標(biāo)750和其他外設(shè)耦合到I/O接口742。應(yīng)該理解:可通過(guò)I/O接口742將數(shù)據(jù)傳送到外部設(shè)備并從外部設(shè)備傳送數(shù)據(jù)。也可在分布式計(jì)算環(huán)境中實(shí)施本發(fā)明,其中由通過(guò)基于有線或無(wú)線網(wǎng)絡(luò)連接的遠(yuǎn)程處理設(shè)備執(zhí)行任務(wù)。數(shù)據(jù)庫(kù)710包括與多個(gè)不同用戶相關(guān)聯(lián)的多個(gè)聲音定位函數(shù)。在一個(gè)實(shí)施例中,聲音定位函數(shù)是為多個(gè)用戶獲取的經(jīng)測(cè)量的HRTF函數(shù),但還可用其他的聲音定位函數(shù)。正如以下關(guān)于圖9A-12所論述的,數(shù)據(jù)庫(kù)710用于為用戶建立聲音定位函數(shù),其影響(leverage)為其他用戶獲得的現(xiàn)有函數(shù)。注意的是:圖7所例示的實(shí)施例是示范性的。其他實(shí)施例可利用不同的模塊,或者具有由一個(gè)模塊執(zhí)行的多種函數(shù)等。因此圖7所示的實(shí)施例不應(yīng)被解釋為排斥性的或限制性的,而是示范性的或說(shuō)明性的。圖8A-8B顯示根據(jù)本發(fā)明實(shí)施例的模擬聲音源的算法流程圖。圖8A例示了聲音定位的實(shí)施例。在操作802中確定空間中用戶頭部的位置,其中該用戶戴著包括兩個(gè)揚(yáng)聲器的耳機(jī)。如前所述,多種方法可用于確定耳機(jī)的位置,如超聲波、圖像分析、RFID、GPS、紅外線等。此外,操作804中確定將被遞送到揚(yáng)聲器的聲音,每個(gè)揚(yáng)聲器與用戶的一只耳朵相關(guān)聯(lián)。換句話說(shuō),一個(gè)揚(yáng)聲器位于左耳旁,另一個(gè)揚(yáng)聲器位于右耳旁。操作806中確定聲音發(fā)出位置。該聲音發(fā)出位置指的是空間中定義將被遞送給用戶的虛擬聲音源的點(diǎn),這樣用戶得到該聲音來(lái)自該聲音源的印象。操作808中,基于空間中頭部的位置、聲音、空間中的發(fā)出位置和用戶的聽(tīng)覺(jué)特征,為每個(gè)揚(yáng)聲器建立聲信號(hào)。用戶的聽(tīng)覺(jué)特征定義了影響用戶如何定位聲音出處的用戶物理特征。在一個(gè)實(shí)施例中,用戶的聽(tīng)覺(jué)特征由用戶耳朵的HRTF對(duì)定義。操作808之后,該方法流向操作810,其中聲信號(hào)被傳送到兩個(gè)揚(yáng)聲器。當(dāng)聲信號(hào)由兩個(gè)揚(yáng)聲器播放時(shí),該聲音似乎源自空間中的發(fā)出位置。圖8B例示了模擬聲音源的方法流程圖。操作842中確定空間中用戶頭部的位置。在一個(gè)實(shí)施例中,用戶戴著包括兩個(gè)揚(yáng)聲器的耳機(jī),而在另一個(gè)實(shí)施例中,多個(gè)揚(yáng)聲器位于用戶周圍的空間中,例如用戶和計(jì)算機(jī)設(shè)備交互的房間中。操作844中,該方法確定在增強(qiáng)現(xiàn)實(shí)環(huán)境中由虛擬對(duì)象產(chǎn)生的聲音,其中該聲音被遞送到多個(gè)揚(yáng)聲器中。在操作846中確定對(duì)應(yīng)于空間中虛擬對(duì)象的虛擬位置的空間中聲音的發(fā)出位置。例如在一個(gè)實(shí)施例中,聲音是由站在真實(shí)的物理桌子上的化身(avatar)所產(chǎn)生的語(yǔ)音。此外,在操作848中,基于空間中頭部的位置、聲音以及空間中的發(fā)出位置為每個(gè)揚(yáng)聲器建立聲信號(hào)。一旦建立了聲信號(hào),聲信號(hào)在操作850中被傳送到兩個(gè)揚(yáng)聲器上。聲信號(hào)一旦由兩個(gè)揚(yáng)聲器播放就模擬聲音源自空間中的發(fā)出位置。操作852中,增強(qiáng)現(xiàn)實(shí)空間的一部分或者整個(gè)增強(qiáng)現(xiàn)實(shí)空間顯示在便攜式設(shè)備的屏幕上。因?yàn)榇髦鷻C(jī)的人可能隨著時(shí)間推移而移動(dòng)她的頭,因此需要跟蹤來(lái)定期重新計(jì)算用戶的位置。此外,聲音的發(fā)出位置也可能隨時(shí)間而改變。結(jié)果,需要用戶和聲音位置的連續(xù)跟蹤,而在操作854中,該方法確定是否需要更新用戶的位置。在一個(gè)實(shí)施例中,定期更新(例如每隔500ms,雖然其他值也是可能的)用戶的位置。如果操作854中執(zhí)行的檢查確定將要更新位置,則該方法流回到操作842。另一方面,如果操作854中執(zhí)行的檢查決定不需要更新用戶的位置,則該方法流回到操作844用以確定遞送到耳機(jī)的新聲音。根據(jù)一個(gè)實(shí)施例,圖9A例示了:基于所接收聲音的用戶感知而選擇聲音定位函數(shù)的方法。通過(guò)耳機(jī)的虛擬環(huán)繞最適合人的HRTF(或某些其他的聲音定位函數(shù))的精確測(cè)量。測(cè)量HRTF的過(guò)程是困難的(也就是說(shuō),該過(guò)程需要在人耳中放入小麥克風(fēng),并且坐得筆直,當(dāng)在頭部周圍不同的位置和距離處移動(dòng)揚(yáng)聲器時(shí))。本發(fā)明的實(shí)施例利用了用戶人口的經(jīng)測(cè)量的HRTF數(shù)據(jù)庫(kù)。在一個(gè)實(shí)施例中,利用運(yùn)動(dòng)控制器創(chuàng)建用戶的聲音定位函數(shù),其基于數(shù)據(jù)庫(kù)中的一個(gè)或多個(gè)HRTF。實(shí)際上沒(méi)有測(cè)量用戶的HRTF,但是通過(guò)發(fā)現(xiàn)為用戶“工作”的一個(gè)或多個(gè)HRTF,提供了具有虛擬聲音遞送的現(xiàn)實(shí)虛擬環(huán)繞聲系統(tǒng)。具有用于數(shù)百萬(wàn)用戶的聲音定位函數(shù)是不實(shí)際的。發(fā)明的實(shí)施例利用用于人的常規(guī)片段的測(cè)量聲音定位函數(shù),然后執(zhí)行測(cè)試以為特定用戶選擇這些函數(shù)中的一個(gè)。在圖9A的實(shí)施例中,用戶904在具有多個(gè)揚(yáng)聲器902的房間中。應(yīng)當(dāng)注意的是:當(dāng)用戶904戴著耳機(jī)時(shí),還可執(zhí)行校準(zhǔn)過(guò)程。計(jì)算機(jī)系統(tǒng)通過(guò)揚(yáng)聲器902播放聲音,用戶被要求指出方向908a上的控制器906A,用戶相信其是聲音源的方向。基于由用戶識(shí)別作為聲音源的方向908a,該系統(tǒng)從匹配該方向的數(shù)據(jù)庫(kù)中選擇一個(gè)或多個(gè)聲音定位函數(shù)。換句話說(shuō),由用戶904的每個(gè)回應(yīng)之后,該系統(tǒng)縮小了可滿足用戶904特征的聲音定位函數(shù)。在一個(gè)實(shí)施例中,給用戶提供兩種選擇。如果用戶不確定聲音來(lái)自哪里,按下控制器上的第一個(gè)按鈕以表明用戶不確定。另一方面,如果用戶識(shí)別出方向,當(dāng)指出聲音的方向時(shí)用戶按下第二個(gè)按鈕。這允許人們通過(guò)搜索聲音定位函數(shù)(例如HRTF)的數(shù)據(jù)庫(kù)而找到適當(dāng)?shù)穆曇舳ㄎ缓瘮?shù),并找到最匹配用戶輸入(例如由控制器識(shí)別的方向)的函數(shù)。該過(guò)程用在不同位置的其他的聲音重復(fù)?;诳刂破鞯奈恢茫ɡ?06b、906c)為每個(gè)聲音獲得新的方向(例如908b,908c),并且分析聲音定位函數(shù)以找到位置的最佳匹配。在一個(gè)實(shí)施例中,最佳匹配是為所有測(cè)試聲音提供最佳整體性能的聲音定位函數(shù)。在另一實(shí)施例中,用于此特定用戶的函數(shù)是聲音函數(shù)的組合,其中用戶周圍的空間被劃分成部分(sector),來(lái)自每個(gè)部分的聲音使用與該部分相關(guān)的函數(shù),其中每個(gè)部分具有相關(guān)聯(lián)的不同函數(shù)。在一個(gè)實(shí)施例中使用了插值(interpolation),而某些部分使用來(lái)自兩個(gè)或更多函數(shù)的插值。期望的目標(biāo)不是具有完美的選擇函數(shù),而是該目標(biāo)是在不同位置具有大量的可接受函數(shù),其對(duì)于具體的游戲或者對(duì)于一系列游戲來(lái)說(shuō)足夠填滿所需的3D體積。如果認(rèn)為一定數(shù)量的離散傳遞函數(shù)比只選擇一個(gè)函數(shù)更好,那么就沒(méi)有必要只選擇一個(gè)函數(shù)。在一個(gè)實(shí)施例中,插值用來(lái)填充其中尚未執(zhí)行實(shí)際測(cè)試的區(qū)域中的空白,由于為用戶周圍的整個(gè)3-D空間執(zhí)行測(cè)試是非常乏味的。為每個(gè)測(cè)試播放的聲音可能是相同的聲音,但從不同的位置投射,或者該聲音可能隨位置而改變,為的是獲得不同音頻頻率的數(shù)據(jù)。這可能減少用戶困惑,因?yàn)橛脩舨粫?huì)覺(jué)得所有聲音恰好相同并且聲音來(lái)自同一個(gè)地方。在一個(gè)實(shí)施例中,如果一個(gè)傳遞函數(shù)并沒(méi)有恰當(dāng)?shù)仄ヅ渌袦y(cè)試聲音的用戶聲音特征,則為用戶計(jì)算的聲音函數(shù)是不僅考慮到了聲音來(lái)自的區(qū)域而且考慮了正在產(chǎn)生的聲音類型(例如聲音的主頻)的函數(shù)組合。例如,在3D空間中的特定地點(diǎn),第一函數(shù)可用于低頻聲音,而第二函數(shù)可用于高頻或中頻聲音。由于與用戶904相關(guān)的函數(shù)未知,所以從數(shù)據(jù)庫(kù)中選擇的聲音定位函數(shù)f1,開(kāi)始校準(zhǔn)過(guò)程。當(dāng)用戶在908a方向上點(diǎn)906a時(shí),該系統(tǒng)分析:當(dāng)使用f1生成聲音時(shí),什么定位函數(shù)fu或函數(shù)可能引起該響應(yīng)。換句話說(shuō),系統(tǒng)需要將f1與數(shù)據(jù)庫(kù)中的其他函數(shù)相關(guān)聯(lián)。Ifs是為測(cè)試所選的聲音(例如犬吠),l1是聲音的位置,而ls1是揚(yáng)聲器處遞送的定位聲音,等式(1)變?yōu)椋簂s1=f1(s,l1)(2)當(dāng)用戶指向方向908a時(shí),基于方向908a計(jì)算位置l2。如果fu是為該聲音和位置l2匹配聲音s用戶的函數(shù),那么得到下面的公式:ls1=fu(s,l2)(3)這意味著:對(duì)于同樣的聲音測(cè)試(例如犬吠),f1和fu將產(chǎn)生發(fā)送到揚(yáng)聲器的相同聲音,但是由用戶感知的位置因?yàn)椴煌穆曇舳ㄎ缓瘮?shù)而變化。換句話說(shuō),具有函數(shù)f1的用戶感知來(lái)自l1的聲音,而具有函數(shù)fu的用戶感知來(lái)自l2的相同聲音。將等式(2)和(3)結(jié)合,得到以下恒等式:f1(s,l1)=fu(s,l2)(4)因?yàn)閒1,s,l1和l2是已知的,所以可用等式(4)獲得fu。然而注意的是:fu為此用戶的位置l2工作,但是fu可能不為其他位置工作。因?yàn)閷?duì)于數(shù)據(jù)庫(kù)中的許多函數(shù)來(lái)說(shuō)可滿足等式(4),在不同地點(diǎn)繼續(xù)該測(cè)試允許系統(tǒng)選擇:哪個(gè)可能的函數(shù)更好地為用戶服務(wù)。在一個(gè)實(shí)施例中,通過(guò)消除不工作的函數(shù),測(cè)試過(guò)程繼續(xù),直到選擇最后一個(gè)函數(shù)為止(更好地匹配用戶特征的函數(shù))。在一個(gè)實(shí)施例中,相同的函數(shù)f1用于所有的測(cè)試。在另一實(shí)施例中,隨著該系統(tǒng)開(kāi)始微調(diào)該函數(shù)或者為此用戶最佳工作的函數(shù),用于每個(gè)測(cè)試的函數(shù)變化。例如在第二測(cè)試中,之前測(cè)試中獲得的選定函數(shù)fu用于第二測(cè)試,而不是f1。第二測(cè)試后,基于兩次測(cè)量選擇新的函數(shù)fu2?;谒袦y(cè)試中的測(cè)量,每次測(cè)試后重復(fù)該過(guò)程以計(jì)算新的函數(shù)。注意的是:校準(zhǔn)正在發(fā)生時(shí),如果用戶移動(dòng)頭部,該移動(dòng)可能改變結(jié)果。在一個(gè)實(shí)施例中,聲音短,消除或?qū)嵸|(zhì)上減少了頭部運(yùn)動(dòng)的影響。在另一個(gè)實(shí)施中,跟蹤用戶的頭部,這意味著測(cè)試期間耳朵的位置是已知的。在一個(gè)實(shí)施例中,通過(guò)分析用戶拍攝的圖像而執(zhí)行頭部跟蹤,但是也可用其他方法,例如使用具有磁力計(jì)的耳機(jī)等。根據(jù)一個(gè)實(shí)施例,圖9B例示了基于源自用戶前面的聲音感知而選擇聲音定位函數(shù)的方法。戴著耳機(jī)962的用戶904位于顯示器952和相機(jī)956前,相機(jī)952用于拍攝用戶和用戶拿著的控制器的圖像。相機(jī)956連接到計(jì)算機(jī)設(shè)備(未顯示)上。在圖9B所示的實(shí)施例中,將校準(zhǔn)限制在用戶前面的點(diǎn)。校準(zhǔn)測(cè)試點(diǎn)可能在顯示器952上,或者在位于顯示器952后面的墻954上。測(cè)試步驟是與上述參考圖9A類似的步驟,除了用戶知道到聲音的距離,因?yàn)槁曇粼陲@示器952上或者在墻954上。此外,該系統(tǒng)能夠計(jì)算用戶904和顯示器952之間以及用戶904和墻954之間的距離。定位正在測(cè)試的聲音,用以模擬源自顯示器上或墻壁上的聲音。此外,用戶904和聲音之間的距離等于用戶和顯示器952上聲音源位置之間、或者用戶和墻954上聲音源位置之間的距離。在另一實(shí)施例中,用戶周圍的對(duì)象也可用于測(cè)試。這樣,對(duì)象和用戶之間的距離也是已知的,該距離可用于校準(zhǔn)步驟。注意的是:圖9A和9B的校準(zhǔn)步驟比僅僅知道用戶的HRTF更好,因?yàn)樾?zhǔn)過(guò)程中也考慮了用戶的主觀部分(關(guān)于用戶的聲音感知)。如上所述,測(cè)量HRTF涉及將麥克風(fēng)放在用戶的耳朵中,但是HRTF沒(méi)有說(shuō)明聲音進(jìn)入耳道后會(huì)發(fā)生什么。該系統(tǒng)把用戶的印象連接到物理位置上。不是使用“完美的”方法,其中該系統(tǒng)開(kāi)發(fā)了人耳的精確模型,該系統(tǒng)實(shí)際上可將性能調(diào)整到個(gè)人的獨(dú)特偏見(jiàn)。如果人認(rèn)為:特定的聲音似乎來(lái)自一個(gè)方向,不管它是否與人的HRTF匹配,該系統(tǒng)將比只是使用HRTF提供更加引人入勝的體驗(yàn)。上述標(biāo)定方法不僅提供了選擇聲音定位函數(shù)的直觀界面,該校準(zhǔn)方法還提供用戶感知到聲音正在發(fā)出之處和運(yùn)動(dòng)控制器位置之間的登記。在一個(gè)實(shí)施例中,控制器和用戶頭部的位置與聲音定位函數(shù)用于模擬:聲音隨著控制器正被四處移動(dòng)而由運(yùn)動(dòng)控制器產(chǎn)生。根據(jù)一個(gè)實(shí)施例,圖10A例示了使用音頻和視頻線索選擇聲音定位函數(shù)的方法。圖10A的實(shí)施例使用視線檢測(cè)和視覺(jué)線索執(zhí)行校準(zhǔn)。此外,校準(zhǔn)過(guò)程可能是游戲的一部分,隨著測(cè)試的進(jìn)行,其給出了分?jǐn)?shù)或獎(jiǎng)勵(lì)。利用相機(jī)156和計(jì)算設(shè)備(未顯示)來(lái)檢測(cè)用戶158的視線154。揚(yáng)聲器152嵌入到電視機(jī)中并且用于遞送本地化的聲音。對(duì)于校準(zhǔn)來(lái)說(shuō),屏幕由用戶視線的潛在目標(biāo)填充。目標(biāo)是幫助用戶識(shí)別聲音源的視覺(jué)線索。圖10A所示的例子中包括多只鳥,聲音測(cè)試是一聲鳥鳴,其可能隨測(cè)試而改變。校準(zhǔn)過(guò)程中的每個(gè)聲音提示后,用戶將她的視線瞄準(zhǔn)在用戶認(rèn)為發(fā)出聲音的顯示器上的對(duì)象上。在一個(gè)實(shí)施例中,動(dòng)畫發(fā)生以顯示被選中的鳥兒,例如讓鳥兒飛走、消失、倒在地上,等等。在一個(gè)實(shí)施例中,在允許用戶從之前輸入中執(zhí)行更正的過(guò)程中存在反饋環(huán)。3D可視化提供給映射用戶所選的所有3D位置的用戶。該系統(tǒng)允許用戶重新定義感知的位置,并將輸入彼此聯(lián)系。例如,用戶可以詳述“這個(gè)聲音在那一個(gè)的前面”,或者詳述“這個(gè)聲音在那一個(gè)的后面”。如果以可視化表現(xiàn)放置各種聲音,并且可被單獨(dú)選擇,然后用戶可以使用該信息重置聲音樣本。例如,用戶可能指出:“這個(gè)聲音在我正前方”,但在稍后時(shí)間聽(tīng)到另一個(gè)聲音并詳述“新聲音是在我正前方的那個(gè)”。用戶可以選擇最初的“正前方”聲音,確認(rèn)聲音并不位于她最初以為的地方,要么放棄要么重新定位(reposition)樣本。根據(jù)一個(gè)實(shí)施例,圖10B例示了通過(guò)連續(xù)指向移動(dòng)到用戶前方的感知聲音源而選擇聲音定位函數(shù)的方法。在一個(gè)實(shí)施例中,校準(zhǔn)測(cè)試包括:播放聲音源變化處的聲音序列,模擬聲音源正在移動(dòng)。圖10B的實(shí)施例利用聲音校準(zhǔn)的標(biāo)記分析。在這種情況下,用戶168用她的手指指向162來(lái)指示聲音來(lái)自何處。例如,聲音是正在森林中沿著軌跡166運(yùn)動(dòng)的鳥兒164,但是該鳥兒是不可見(jiàn)的,因?yàn)樗谏掷镲w。注意的是:軌跡166可能留在顯示區(qū)域中,或者該軌跡可能擴(kuò)展到顯示器邊界之外。隨著鳥兒移動(dòng),用戶168將162指向用戶認(rèn)為鳥兒當(dāng)時(shí)所在的位置。系統(tǒng)分析由手指方向所識(shí)別的方向,并在上述為用戶計(jì)算聲音定位函數(shù)的過(guò)程使用類似的過(guò)程。在一個(gè)實(shí)施例中,該系統(tǒng)定期采樣用戶輸入和相應(yīng)的聲音。然后用獲得的離散樣本計(jì)算聲音函數(shù),正如上所述。在一個(gè)實(shí)施例中,用戶的聲音定位函數(shù)存儲(chǔ)在網(wǎng)絡(luò)上的服務(wù)器中,其可由許多設(shè)備訪問(wèn)。為了在其他設(shè)備中遞送聲音定位,之后聲音定位函數(shù)可與其他設(shè)備共享。例如,用戶可以使用游戲控制臺(tái)來(lái)計(jì)算函數(shù),然后當(dāng)用戶戴著連接到便攜式設(shè)備的耳機(jī)時(shí),聲音定位可提供給用戶。注意的是:圖9A-9B和10A-10B所示的實(shí)施例是示范性的。其他實(shí)施例可利用不同的聲音,不同的揚(yáng)聲器配置,使用不同的輸入(例如,控制器、手持設(shè)備的方向、用戶所做的標(biāo)志等),使用不同類型的揚(yáng)聲器(例如,耳機(jī),房間中的揚(yáng)聲器,電視上的揚(yáng)聲器等)。因此圖9A-9B和10A-10B所示的實(shí)施例不應(yīng)被解釋為排斥性的或限制性的,而是示范性的或說(shuō)明性的。根據(jù)一個(gè)實(shí)施例,圖11顯示了選擇一個(gè)或多個(gè)聲音定位函數(shù)的流程圖。操作1102中,選擇聲音用于執(zhí)行第一測(cè)試。定位該聲音使其顯示出聲音源自某一位置。操作1104中,通過(guò)多個(gè)揚(yáng)聲器播放聲音,例如環(huán)繞聲系統(tǒng)、一副耳機(jī)、嵌入到電視機(jī)中的揚(yáng)聲器等。提示用戶指出聲音是來(lái)自何處。操作1106中,檢測(cè)用戶的輸入,而用戶的輸入用于確定空間中從用戶到感知聲音源的指向向量。操作1108中,分析存儲(chǔ)在數(shù)據(jù)庫(kù)中的聲音定位函數(shù),并且基于播放和捕獲的指向向量,給該函數(shù)打分。分?jǐn)?shù)用來(lái)濾除用于此用戶聲音定位的某些可能函數(shù)。操作1110中,該方法確定是否需要更多的測(cè)量來(lái)繼續(xù)減少候選函數(shù)的列表(list)。如果不需要更多的測(cè)量,該方法繼續(xù)到操作1114,否則到操作1112。操作1112中,基于已經(jīng)獲得的結(jié)果選擇新的定位聲音。在一個(gè)實(shí)施例中,預(yù)先確定該聲音并且該系統(tǒng)通過(guò)聲音列表循環(huán),直到耗盡該列表。例如,該列表可能包括來(lái)自7個(gè)不同地點(diǎn)的7個(gè)不同聲音。收到相應(yīng)的7個(gè)輸入后,之后系統(tǒng)為用戶選擇一個(gè)函數(shù)(操作1114)。在另一個(gè)實(shí)施例中,基于之前的任務(wù),該方法適應(yīng)接收到的輸入并選擇下一個(gè)聲音。例如,系統(tǒng)可能會(huì)下降到3個(gè)不同的候選函數(shù),選擇提供良好引導(dǎo)的聲音,用于選擇哪個(gè)是三個(gè)函數(shù)中最好的。操作1114中,為用戶計(jì)算聲音定位函數(shù)。例如看如上所述的關(guān)于圖9A-9B和10A-10B的實(shí)施例。此外,操作1116中,計(jì)算出的聲音定位函數(shù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,這樣其他設(shè)備可使用將聲音定位到此用戶的函數(shù)。根據(jù)一個(gè)實(shí)施例,圖12顯示了從聲音定位函數(shù)的數(shù)據(jù)庫(kù)中選擇一個(gè)或多個(gè)聲音定位函數(shù)的流程圖。操作1202中,選擇與空間中第一位置相關(guān)的第一聲線索,操作1204中,通過(guò)揚(yáng)聲器遞送聲線索。遞送聲隊(duì)列后,該系統(tǒng)在操作1206中從用戶接收輸入。來(lái)自用戶的輸入具有聲線索的感知位置信息。操作1208中,該方法檢查操作1204中是否遞送最后的聲線索。如果是最后的聲線索,該方法繼續(xù)到操作1212,否則到操作1210。操作1210中,該方法選擇下一個(gè)聲線索和聲線索發(fā)出的位置。操作1210之后,該方法返回到操作1204用以遞送新的聲線索。操作1212中,執(zhí)行新的檢查以確定是否單個(gè)聲音定位函數(shù)將用于此用戶,或者是否聲音函數(shù)的組合用于該用戶。例如,如果系統(tǒng)確認(rèn)存在將此用戶和遞送的測(cè)試良好匹配的聲音定位函數(shù),則該系統(tǒng)將使用從聲音函數(shù)數(shù)據(jù)庫(kù)中檢索的此函數(shù)。然而,如果沒(méi)有用于該用戶的良好匹配,系統(tǒng)將使用根據(jù)空間中最佳匹配每個(gè)函數(shù)的部分而劃分的函數(shù)組合。因此,操作1214中,基于接收的用戶輸入,該方法從數(shù)據(jù)庫(kù)中選擇現(xiàn)有的聲音定位函數(shù)。另一方面,操作1216中,該方法從用戶數(shù)據(jù)庫(kù)中選擇聲音定位函數(shù)的結(jié)合。操作1218上,為了模擬聲音源,基于聲音定位函數(shù)、用戶位置以及聲音源的期望感知位置,聲音被遞送到多個(gè)揚(yáng)聲器。圖13例示了可用于實(shí)現(xiàn)發(fā)明實(shí)施例的設(shè)備架構(gòu)。便攜式設(shè)備是計(jì)算設(shè)備并且包括存在于計(jì)算設(shè)備中的常規(guī)模塊,如處理器、內(nèi)存(RAM、ROM等)、電池或其它電源以及永久性存儲(chǔ)器(例如硬盤)。通信模塊允許便攜式設(shè)備與其他便攜式設(shè)備、其他電腦、服務(wù)器等交流信息。該通信模塊包括通用串行總線(USB)連接器、通信鏈接(例如以太網(wǎng))、超聲波通信、藍(lán)牙和WiFi。輸入模塊包括輸入按鈕和傳感器、麥克風(fēng)、觸控屏、相機(jī)(正面、背面、深度相機(jī))和讀卡器。其他輸入/輸出設(shè)備,例如鍵盤或鼠標(biāo),也可通過(guò)諸如USB或藍(lán)牙的通信鏈接連接到便攜式設(shè)備。輸出模塊包括顯示屏(具有觸控屏)、發(fā)光二極管(LED)、振動(dòng)觸覺(jué)反饋和揚(yáng)聲器。諸如耳機(jī)的其他輸出設(shè)備還可以通過(guò)通信模塊連接到便攜式設(shè)備上。來(lái)自不同設(shè)備的信息可由定位模塊用來(lái)計(jì)算便攜式設(shè)備的位置。這些模塊包括磁力計(jì)、加速度計(jì)、陀螺儀、GPS和指南針。此外,定位模塊可分析用相機(jī)和麥克風(fēng)捕獲的聲音或圖像數(shù)據(jù)用以計(jì)算該位置。此外,定位模塊可執(zhí)行測(cè)試以確定便攜式設(shè)備的位置或附近其他設(shè)備的位置,如WiFiping測(cè)試或超聲波測(cè)試。如前所述,使用定位模塊計(jì)算出的位置,虛擬現(xiàn)實(shí)生成器創(chuàng)建虛擬或增強(qiáng)的現(xiàn)實(shí)。基于虛擬現(xiàn)實(shí)和位置,視圖生成器創(chuàng)建屏幕上顯示的視圖。聲音定位模塊執(zhí)行聲音定位,用于將被遞送到揚(yáng)聲器或耳機(jī)的聲音。應(yīng)當(dāng)理解:圖13所示的實(shí)施例是便攜式設(shè)備的常規(guī)實(shí)現(xiàn)。其他實(shí)施例可使用不同的模塊、模塊子集,或者將相關(guān)的任務(wù)分配到不同的模塊。因此圖13所示的實(shí)施例不應(yīng)被解釋為排斥性的或限制性的,而是示范性或說(shuō)明性的。圖14例示了可用于實(shí)現(xiàn)發(fā)明實(shí)施例的硬件和用戶接口。圖14示意地例示了娛樂(lè)設(shè)備的整體系統(tǒng)架構(gòu)。為系統(tǒng)單元1400提供可連接到系統(tǒng)單元1400的各種外圍設(shè)備。系統(tǒng)單元1400包括:?jiǎn)卧幚砥?428;動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(XDRAM)單元1426;具有專用視頻隨機(jī)存取存儲(chǔ)器(VRAM)單元1432的現(xiàn)實(shí)合成圖形單元1430;以及I/O橋1434。系統(tǒng)單元1400還包括盤的光盤讀取器1440,用于從盤1440a和可移動(dòng)插槽硬盤驅(qū)動(dòng)器(HDD)1436中讀取,通過(guò)I/O橋1434訪問(wèn)??蛇x地,系統(tǒng)單元1400還包括存儲(chǔ)卡讀取器1438,用于讀取致密閃存卡、存儲(chǔ)卡和類似物,其同樣地通過(guò)I/O橋1434訪問(wèn)。I/O橋1434還連接到6個(gè)通用串行總線(USB)2.0端口1424;吉比特以太網(wǎng)端口1422;IEEE802.11b/g無(wú)線網(wǎng)絡(luò)(Wi-Fi)端口1420;以及能夠支持多達(dá)7個(gè)藍(lán)牙連接的無(wú)線鏈接端口1418。在操作中,I/O橋1434處理所有無(wú)線、USB和以太網(wǎng)數(shù)據(jù),包括來(lái)自一個(gè)或多個(gè)游戲控制器1402-1403的數(shù)據(jù)。例如,當(dāng)用戶玩游戲時(shí),I/O橋1434通過(guò)藍(lán)牙連接從游戲控制器1402-1403接收數(shù)據(jù),并將其指向單元處理器1428,其相應(yīng)地更新游戲的當(dāng)前狀態(tài)。無(wú)線、USB和以太網(wǎng)接口還提供除了游戲控制器1402-1403的其他外圍設(shè)備的連接,例如遠(yuǎn)程控制1404;鍵盤1406;鼠標(biāo)1408;諸如索尼娛樂(lè)設(shè)備的便攜式娛樂(lè)設(shè)備1410;諸如相機(jī)1412的視頻相機(jī);耳機(jī)1414以及麥克風(fēng)1415。因此這些外圍設(shè)備原則上可無(wú)線連接到系統(tǒng)單元1400上;例如便攜式娛樂(lè)設(shè)備1410可通過(guò)Wi-Fiad-hoc連接通信,而耳機(jī)1414可通過(guò)藍(lán)牙鏈接通信。提供這些接口意味著:PlayStation3設(shè)備還潛在地與其它外圍設(shè)備兼容,例如數(shù)字視頻錄像機(jī)(DVR)、機(jī)頂盒、數(shù)碼相機(jī)、便攜式媒體播放器、互聯(lián)網(wǎng)協(xié)議(IP)電話上的語(yǔ)音、移動(dòng)電話、打印機(jī)和掃描儀。此外,傳統(tǒng)的存儲(chǔ)卡讀卡器1416可通過(guò)USB端口1424連接到該系統(tǒng)單元,使得能夠讀取由PlayStation或PlayStation2設(shè)備使用這種存儲(chǔ)卡。游戲控制器1402-1403是可操作的,用以通過(guò)藍(lán)牙連接與系統(tǒng)單元1400無(wú)線通信,或者連接到USB端口,因此還提供了充電游戲控制器1402-1403電池的電力。游戲控制器1402-1403還可包括存儲(chǔ)器,處理器,存儲(chǔ)卡讀取器,諸如閃存的永久性存儲(chǔ)器,諸如發(fā)光球形部分、LED或紅外燈的光投射器,用于超聲波通信的麥克風(fēng)和揚(yáng)聲器,聲學(xué)室,數(shù)碼相機(jī),內(nèi)部時(shí)鐘,面對(duì)游戲控制臺(tái)的可識(shí)別形狀,以及使用諸如WiFiTM等協(xié)議的無(wú)線通信。可識(shí)別的形狀實(shí)質(zhì)上可以是形狀:球體、立方體、平行四邊形、長(zhǎng)方體、圓錐體、金字塔狀、不完美的球體、英式足球、足球或橄欖球、球體的一部分、截棱錐、截圓錐、棒球棒、截?cái)嗔⒎襟w、多面體、星形等,或者這些形狀中兩個(gè)或多個(gè)的組合。游戲控制器1402是設(shè)計(jì)成用雙手使用的控制器,而游戲控制器1403是具有球形接頭的單手控制器。除了一個(gè)或多個(gè)模擬操縱桿和常規(guī)控制按鈕,該游戲控制器對(duì)三維位置的確定敏感。因此游戲控制器的用戶的手勢(shì)和移動(dòng)可被翻譯成游戲輸入,除了或者不是傳統(tǒng)按鈕或操縱桿命令??蛇x地,諸如便攜式設(shè)備的其他無(wú)線使能外圍設(shè)備可用作控制器。在便攜式設(shè)備的例子中,額外的游戲或控制信息(例如,控制指令或生命數(shù)量)可提供到設(shè)備屏幕上。也可使用其他替代或補(bǔ)充控制裝置,如跳舞毯(未顯示),光槍(未顯示),方向盤和踏板(未顯示)或定制的控制器,例如用于快速反應(yīng)測(cè)試游戲的單個(gè)或幾個(gè)大按鈕(也未顯示)。遠(yuǎn)程控制1404也是可操作的,用以通過(guò)藍(lán)牙鏈接與系統(tǒng)單元1400無(wú)線通信。遠(yuǎn)程控制1404包括適于藍(lán)光光盤BD-ROM閱讀器1440以及用于盤內(nèi)容導(dǎo)航的控制。藍(lán)光光盤BD-ROM光盤閱讀器1440讀取與PlayStation和PlayStation2設(shè)備兼容的CD-ROM是可操作的,除了傳統(tǒng)的預(yù)錄和可記錄CD,以及所謂的超級(jí)音頻CD。閱讀器1440讀取與PlayStation2和PlayStation3設(shè)備兼容的DVD-ROM也是可操作的,除了傳統(tǒng)的預(yù)錄和可記錄DVD。閱讀器1440讀取與PlayStation3設(shè)備以及傳統(tǒng)的預(yù)錄和可記錄藍(lán)光光盤兼容的BD-ROM是進(jìn)一步可操作的。系統(tǒng)單元1400提供音頻和視頻是可操作的,通過(guò)現(xiàn)實(shí)合成圖形單元(RSX)1430,或者由PlayStation3設(shè)備生成或者由其解碼,通過(guò)音頻1450和視頻1452連接器到顯示和聲音輸出設(shè)備1442,例如具有顯示器1444和一個(gè)或多個(gè)揚(yáng)聲器1446或獨(dú)立揚(yáng)聲器1448的顯示器或電視機(jī)。在一個(gè)實(shí)施例中,根據(jù)用戶的視線點(diǎn)(POG),利用聲音和視線輸入朝著特定的音響喇叭播放聲音。音頻連接器1450可包括傳統(tǒng)的模擬和數(shù)字輸出,同時(shí)視頻連接器1452可能不同地包括分量視頻、S-視頻、復(fù)合視頻和一個(gè)或多個(gè)高清晰度的多媒體接口(HDMI)輸出。因此,視頻輸出可能以諸如PAL或NTSC,或者720P、1080i或1080p的高清晰度的形式。音頻處理(生成、解碼等)由單元處理器1428執(zhí)行。PlayStation3設(shè)備的操作系統(tǒng)支持環(huán)繞聲,劇院環(huán)繞聲(DTS)以及來(lái)自藍(lán)光光盤的7.1環(huán)繞聲的解碼。本實(shí)施例中,視頻攝像機(jī)1412包括單個(gè)電荷耦合器件(CCD),LED指示燈,基于硬件的實(shí)時(shí)數(shù)據(jù)壓縮和編碼設(shè)備,以便可以適當(dāng)?shù)母袷絺魉蛪嚎s視頻數(shù)據(jù),例如基于由系統(tǒng)單元1400解碼的MPEG(運(yùn)動(dòng)圖像專家組)標(biāo)準(zhǔn)的內(nèi)部圖像(intra-image)。安排攝像機(jī)LED指示燈,用以響應(yīng)于來(lái)自系統(tǒng)單元1400的合適控制數(shù)據(jù)而照明,例如表示不利的照明條件。視頻攝像機(jī)1412的實(shí)施例可能不同地通過(guò)USB、藍(lán)牙或Wi-Fi通信端口連接到系統(tǒng)單元1400。視頻攝像機(jī)的實(shí)施例可能包括一個(gè)或多個(gè)相關(guān)的麥克風(fēng),還能夠傳輸音頻數(shù)據(jù)。在視頻攝像機(jī)的實(shí)施例中,CCD可能具有適于高清晰度視頻捕獲的分辨率。使用中,由視頻攝像機(jī)捕獲的圖像例如可被納入到游戲中或被解釋為游戲控制輸入。在另一實(shí)施例中,該攝像機(jī)是適于檢測(cè)紅外光的紅外攝像機(jī)。通常,為了通過(guò)系統(tǒng)單元1400的一個(gè)通信端口、用諸如視頻攝像機(jī)或遠(yuǎn)程控制的外圍設(shè)備發(fā)生數(shù)據(jù)的成功傳輸,應(yīng)該提供一款合適的軟件,例如設(shè)備驅(qū)動(dòng)程序(devicedriver)。設(shè)備驅(qū)動(dòng)程序技術(shù)是眾所周知的,此處將不會(huì)詳細(xì)描述,但本領(lǐng)域技術(shù)人員將明白:所述的本實(shí)施例中可能需要設(shè)備驅(qū)動(dòng)程序或類似的軟件接口??捎酶鞣N計(jì)算機(jī)系統(tǒng)配置實(shí)施本發(fā)明的實(shí)施例,包括手持設(shè)備、微處理器系統(tǒng)、基于微處理器或可編程的消費(fèi)類電子產(chǎn)品、微機(jī)、大型機(jī)和類似物。也可在分布式計(jì)算環(huán)境中實(shí)施本發(fā)明,其中由通過(guò)網(wǎng)絡(luò)連接的遠(yuǎn)程處理設(shè)備執(zhí)行任務(wù)??紤]到上述實(shí)施例,應(yīng)該理解:該發(fā)明可以使用涉及計(jì)算機(jī)系統(tǒng)中存儲(chǔ)數(shù)據(jù)的各種計(jì)算機(jī)執(zhí)行的操作。這些操作是那些需要物理量的物理操作。此處所述的構(gòu)成發(fā)明一部分的任何操作是有用的機(jī)器操作。本發(fā)明還涉及到執(zhí)行這些操作的設(shè)備或儀器。該儀器可能是用于所需目的而專門構(gòu)建的,例如專用計(jì)算機(jī)。當(dāng)定義為專用計(jì)算機(jī)時(shí),計(jì)算機(jī)也可以執(zhí)行其他處理,程序執(zhí)行或并非專用部分而仍然能夠?qū)iT執(zhí)行的程序。作為選擇,可由通用計(jì)算機(jī)執(zhí)行操作,通用計(jì)算機(jī)由計(jì)算機(jī)存儲(chǔ)器、高速緩存中存儲(chǔ)的或通過(guò)網(wǎng)絡(luò)獲得的一個(gè)或多個(gè)計(jì)算機(jī)程序選擇性激活或配置。當(dāng)通過(guò)網(wǎng)絡(luò)獲得數(shù)據(jù)時(shí),該數(shù)據(jù)可由網(wǎng)絡(luò)上的其他計(jì)算機(jī)處理,例如云計(jì)算資源。本發(fā)明的一個(gè)或多個(gè)實(shí)施例也可制作成計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可讀代碼。計(jì)算機(jī)可讀介質(zhì)是可存儲(chǔ)數(shù)據(jù)的任意數(shù)據(jù)存儲(chǔ)設(shè)備,之后該數(shù)據(jù)可由計(jì)算機(jī)系統(tǒng)讀取。計(jì)算機(jī)可讀介質(zhì)的實(shí)例包括硬盤驅(qū)動(dòng)器、網(wǎng)絡(luò)附加存儲(chǔ)(NAS)、只讀存儲(chǔ)器、隨機(jī)存取存儲(chǔ)器、CD-ROM、CD-R、CD-RW、磁帶及其他光學(xué)和非光學(xué)的數(shù)據(jù)存儲(chǔ)設(shè)備。計(jì)算機(jī)可讀介質(zhì)可以包括在網(wǎng)絡(luò)耦合的計(jì)算機(jī)系統(tǒng)分布的計(jì)算機(jī)可讀有形介質(zhì),這樣以分布式存儲(chǔ)和執(zhí)行計(jì)算機(jī)可讀代碼。雖然以特定順序描述方法操作,應(yīng)該理解的是:在操作中可執(zhí)行其他的內(nèi)務(wù)管理(housekeeping)操作,或者可以調(diào)整操作,這樣它們發(fā)生在稍微不同的時(shí)間處,或者可能分布在系統(tǒng)中,其允許與處理相關(guān)的不同時(shí)間間隔處發(fā)生處理操作,只要以期望的方式執(zhí)行覆蓋操作的處理。雖然為了清楚理解而稍微詳細(xì)地描述了上述發(fā)明,但是顯而易見(jiàn)的是:在附加權(quán)利要求的范圍內(nèi)可實(shí)施某些改變和修改。因此本實(shí)施例被認(rèn)為是說(shuō)明性的而不是限制性的,而發(fā)明不限于此處給出的細(xì)節(jié),但可在附加權(quán)利要求的范圍和等效物中修改。