亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

適應(yīng)于從輸入媒體采樣中提取特征的移動(dòng)臺(tái)和接口的制作方法

文檔序號(hào):7946990閱讀:129來(lái)源:國(guó)知局
專利名稱:適應(yīng)于從輸入媒體采樣中提取特征的移動(dòng)臺(tái)和接口的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及適應(yīng)于對(duì)輸入媒體采樣執(zhí)行數(shù)字處理的無(wú)線式無(wú)線電話設(shè)備的領(lǐng)域。本發(fā)明具體地涉及適應(yīng)于使得能夠從比如流行歌曲的分段這樣的輸入媒體采樣中提取特征的這種設(shè)備及其用戶接口。
背景技術(shù)
流行音樂的所有者最近才接受通過比如互聯(lián)網(wǎng)這樣的電子網(wǎng)絡(luò)來(lái)下載它們版權(quán)作品的數(shù)字拷貝。一個(gè)用于效力于此的流行網(wǎng)站是http://www.apple.com.itunes/,其中用戶經(jīng)由個(gè)人計(jì)算機(jī)(PC)等訪問音樂服務(wù)網(wǎng)站,人工地選擇歌曲標(biāo)題,而且將選定歌曲的數(shù)字版本(例如MP3、AAC)下載到他們用來(lái)訪問網(wǎng)站的PC。然后用戶在PC上播放歌曲或者將它們傳送到比如iPod或者其它專用數(shù)字音樂播放器這樣的便攜設(shè)備。
第二代音樂下載技術(shù)最近已經(jīng)面市,其中用戶無(wú)需在網(wǎng)頁(yè)上按照其標(biāo)題來(lái)人工選擇歌曲。代之以由服務(wù)器或者與網(wǎng)站相關(guān)聯(lián)的其它計(jì)算機(jī)‘收聽’歌曲,而且對(duì)歌曲進(jìn)行數(shù)字分析以便從數(shù)字音樂的數(shù)據(jù)庫(kù)之中識(shí)別該特定歌曲。例如,網(wǎng)站http://shazam.com/uk/do/help_faqs_shazam#4將它的操作說明如下。比如在酒館或者汽車中聆聽歌曲的用戶在歌曲正在播放的同時(shí)在他的/她的移動(dòng)臺(tái)(MS)中輸入代碼。歌曲就通過標(biāo)準(zhǔn)的MS鏈路發(fā)送到掌控網(wǎng)站(hosting website),比如shazam.com,這正如同發(fā)送語(yǔ)音輸入那樣。也就是說,從MS發(fā)送到shazam.com站點(diǎn)的消息是由MS的語(yǔ)音編碼器轉(zhuǎn)換后的輸入模擬音樂采樣,就如同會(huì)對(duì)麥克風(fēng)的任何輸入進(jìn)行轉(zhuǎn)換那樣。掌控網(wǎng)站接收(經(jīng)轉(zhuǎn)換的)原始音樂輸入、對(duì)之進(jìn)行分析,并且將之匹配于它的數(shù)據(jù)庫(kù)中的歌曲之一。Shazam.com技術(shù)對(duì)于在服務(wù)器處使用移動(dòng)臺(tái)僅作為如下渠道來(lái)識(shí)別歌曲而且將結(jié)果回報(bào)給移動(dòng)臺(tái)而言表現(xiàn)出局限性,其中該渠道將模擬輸入轉(zhuǎn)換成數(shù)字并且對(duì)轉(zhuǎn)換后的信號(hào)進(jìn)行打包。另外,由于Shazam.com技術(shù)表現(xiàn)出直至建立無(wú)線鏈路之后才出于識(shí)別的目的而對(duì)采樣進(jìn)行處理,所以僅聽到歌曲較后部分的用戶可能在歌曲結(jié)束之前還沒有讓鏈路得以建立。
不但經(jīng)由個(gè)人計(jì)算機(jī)訪問大多數(shù)音樂下載服務(wù),而且已經(jīng)引入空中(OTA)移動(dòng)下載服務(wù)。移動(dòng)設(shè)備在小型的屏幕尺寸、有限的電源、有限的數(shù)據(jù)連接可靠性和速度方面具有局限性,這使得發(fā)現(xiàn)音樂和將音樂從音樂服務(wù)交付到移動(dòng)終端極具挑戰(zhàn)。通常,音樂服務(wù)具有至少500000首歌曲的音樂收集。使用移動(dòng)設(shè)備用戶接口則難以對(duì)該規(guī)模的音樂目錄進(jìn)行探尋,其中順序的呈現(xiàn)必須使內(nèi)容配合于屏幕。這造成深入的分級(jí)以及難以找到音樂。
人們?cè)诒热缇起^或者音樂會(huì)大廳或者汽車無(wú)線電這樣的公共場(chǎng)所聽音樂是司空見慣的。按照慣例,某人會(huì)對(duì)某一首特定音樂產(chǎn)生興趣,但是不知道歌曲標(biāo)題。該人士然后詢問友人、唱片店銷售人員,或者碰巧從無(wú)線電廣播中聽到歌曲名從而得知標(biāo)識(shí)該歌曲的歌手和標(biāo)題。一些個(gè)人可能使用(如上所述)Shazam.com站點(diǎn)通過調(diào)用關(guān)聯(lián)服務(wù)號(hào)和通過他們的移動(dòng)臺(tái)播放歌曲作為實(shí)況‘廣播’來(lái)識(shí)別歌曲。然后該人士前往唱片店,或者基于由Shazam.com或者類似識(shí)別服務(wù)所返回的標(biāo)識(shí)從因特網(wǎng)服務(wù)購(gòu)買歌曲。然而,通常有如下步驟1)聆聽音樂采樣(刺激);2)識(shí)別歌曲;3)找到待購(gòu)歌曲(基于標(biāo)識(shí));4)購(gòu)買歌曲的拷貝;以及5)交付所購(gòu)拷貝而且將它添加到個(gè)人音樂收集。
步驟1)至3)在傳統(tǒng)方法中是人工的?;谝蛱鼐W(wǎng)的音樂購(gòu)買使得步驟4)和5)自動(dòng)化。比如Shazam.com這樣的服務(wù)使得以在步驟1)的電子‘聆聽’為基礎(chǔ)的步驟2)自動(dòng)化。然而,據(jù)發(fā)明人所知用于執(zhí)行上述步驟的所有現(xiàn)有方法都涉及到希望標(biāo)識(shí)歌曲和購(gòu)買歌曲拷貝的個(gè)人所進(jìn)行的人工步驟。本發(fā)明尋求將更多的上述過程流水化和自動(dòng)化。
由于創(chuàng)建和存儲(chǔ)了較大數(shù)量的數(shù)字文件,所以已經(jīng)產(chǎn)生對(duì)數(shù)字文件的標(biāo)識(shí)方式進(jìn)行標(biāo)準(zhǔn)化的需要。MPEG-7是由運(yùn)動(dòng)圖像專家組(MPEG)開發(fā)的,用來(lái)對(duì)用于標(biāo)識(shí)多媒體文件內(nèi)容的信息表示進(jìn)行標(biāo)準(zhǔn)化。這與本身就是內(nèi)容的信息相矛盾,其中該信息對(duì)于在數(shù)據(jù)庫(kù)中進(jìn)行歸類和搜索而言就不那么可修改。無(wú)論MPEG-7是否變成標(biāo)準(zhǔn)化方法,它都描述了用以有效地對(duì)多媒體文件進(jìn)行編索引、搜索和取回的開發(fā)工具集。這樣的工具在這里以示例性的方式用來(lái)在下文中描述本發(fā)明如何使得音樂或者其它媒體的標(biāo)識(shí)和購(gòu)買自動(dòng)化。

發(fā)明內(nèi)容
本發(fā)明提供了一種移動(dòng)臺(tái)或者其它便攜電子設(shè)備以及用戶接口,特別地適用于在用戶僅有比如可能通過廣播無(wú)線電聽到的比如數(shù)字歌曲文件這樣的媒體文件的未標(biāo)識(shí)媒體采樣時(shí),有助于對(duì)該媒體文件進(jìn)行標(biāo)識(shí)和購(gòu)買。
在一個(gè)方面中,本發(fā)明實(shí)施于包括處理器和用戶輸入機(jī)制的移動(dòng)臺(tái)中。用戶輸入機(jī)制比如是針對(duì)與如下文詳述的采樣標(biāo)識(shí)和文件購(gòu)買有關(guān)的功能而保留的專用按鈕,可操作用以促使處理器從數(shù)字媒體采樣中提取至少一個(gè)特征。數(shù)字媒體采樣可以源自于移動(dòng)臺(tái)外部,如同在經(jīng)由電子郵件接收的或者附加于短消息服務(wù)消息的數(shù)字媒體采樣中那樣;或者它可以源于由移動(dòng)臺(tái)轉(zhuǎn)換成數(shù)字媒體采樣的模擬媒體采樣,如同在移動(dòng)臺(tái)從廣播FM無(wú)線電通過麥克風(fēng)接收輸入時(shí)那樣。該特征描述了媒體采樣的內(nèi)容的標(biāo)識(shí),而且以此方式有別于僅將媒體采樣從一個(gè)形式轉(zhuǎn)換成另一形式的語(yǔ)音編碼器。在其它例子之中,這里描述的特征的例子還包括波形包絡(luò)、諧音頻率、譜質(zhì)心和靜音。優(yōu)選地,移動(dòng)臺(tái)也包括發(fā)送器,而移動(dòng)臺(tái)適于使得在輸入機(jī)制處的單個(gè)用戶輸入用于促使處理器提取特征、啟動(dòng)通向網(wǎng)絡(luò)的無(wú)線鏈路、以及促使發(fā)送器通過鏈路來(lái)發(fā)送由處理器提取的特征。有利地,移動(dòng)臺(tái)優(yōu)選地包括用來(lái)顯示媒體采樣的文本標(biāo)識(shí)符的顯示器接口或者屏幕。這樣的顯示器是響應(yīng)于在接收器處通過鏈路從網(wǎng)絡(luò)接收答復(fù)消息的,其中答復(fù)消息是響應(yīng)于提取特征的發(fā)送的,而且答復(fù)消息包括與媒體采樣相匹配的媒體文件的標(biāo)識(shí)符。這里描述了更多附加的發(fā)明方面。
在另一實(shí)施例中,本發(fā)明是一種便攜設(shè)備的用戶接口。用戶接口具有用戶輸入機(jī)制,當(dāng)在用戶輸入機(jī)制處有單個(gè)用戶輸入時(shí),該用戶輸入機(jī)制能夠促使便攜電子設(shè)備內(nèi)部的處理器引起兩個(gè)動(dòng)作。該單個(gè)用戶輸入促使從數(shù)字媒體采樣中提取多個(gè)特征,以及促使多個(gè)提取特征發(fā)送到設(shè)備外部。數(shù)字媒體采樣可以像這樣輸入到設(shè)備中,或者該設(shè)備可以將輸入的模擬媒體采樣轉(zhuǎn)換成數(shù)字的。用戶接口還包括顯示器屏幕,用以顯示媒體采樣所對(duì)應(yīng)的媒體文件的文本標(biāo)識(shí)符,也就是說,可以從該媒體文件中提取的特征準(zhǔn)確地匹配于提取和發(fā)送的多個(gè)特征。然而,這并不意味著移動(dòng)臺(tái)實(shí)際上從媒體文件中提取特征而且將它們與從數(shù)字媒體采樣中提取的特征做比較。文本標(biāo)識(shí)符是響應(yīng)于接收答復(fù)消息而顯示的,該答復(fù)消息本身是對(duì)發(fā)送特征的答復(fù)。優(yōu)選地,用戶輸入機(jī)制也可以在接收答復(fù)消息之后促使授權(quán)消息發(fā)送到設(shè)備外部。授權(quán)消息包括在答復(fù)消息中接收的媒體文件標(biāo)識(shí)符和對(duì)于將媒體文件的拷貝下載到便攜電子設(shè)備的請(qǐng)求。然而,在對(duì)特征提取和發(fā)送進(jìn)行啟動(dòng)的用戶輸入時(shí),優(yōu)選地并不同樣啟動(dòng)這一授權(quán)消息。
通過參照與附圖相結(jié)合的以下描述,本發(fā)明實(shí)施例的這些和其它方面及優(yōu)點(diǎn)將變得清楚明顯。然而應(yīng)當(dāng)理解,附圖僅被設(shè)計(jì)用于說明的目的而不是對(duì)本發(fā)明的限制進(jìn)行限定。


圖1是本發(fā)明可以在其中起到作用的通信系統(tǒng)的示意圖。
圖2A-2B是分別表示了對(duì)于在移動(dòng)臺(tái)與服務(wù)器之間分布的媒體采樣進(jìn)行特征提取的框圖。
圖3A-3D是對(duì)于在圖1的通信系統(tǒng)中采取的動(dòng)作進(jìn)行詳述的連續(xù)流程圖的各部分。圖3A表示了在移動(dòng)臺(tái)之內(nèi)的步驟,圖3B表示了在服務(wù)器之內(nèi)的步驟,圖3C表示了在提供待購(gòu)媒體文件之下載的服務(wù)器之內(nèi)的步驟,而圖3D表示了在移動(dòng)臺(tái)中響應(yīng)于服務(wù)器的進(jìn)一步步驟。
圖4A是根據(jù)本發(fā)明的教授而特別地改造的移動(dòng)臺(tái)的示意框圖。
圖4B是對(duì)根據(jù)本發(fā)明包括專用媒體采樣識(shí)別按鈕的用戶接口進(jìn)行詳述的移動(dòng)臺(tái)的平面圖。
圖5是對(duì)于在移動(dòng)臺(tái)處連續(xù)地緩沖輸入所具備的優(yōu)點(diǎn)進(jìn)行說明的示意時(shí)序圖。
具體實(shí)施例方式
本發(fā)明針對(duì)具有移動(dòng)電話功能的移動(dòng)臺(tái)(或者其它便攜電子設(shè)備)及其用戶接口。該用戶接口使得用戶能夠容易地標(biāo)識(shí)通過任何手段輸入到移動(dòng)臺(tái)的媒體采樣,比如經(jīng)由麥克風(fēng)輸入的模擬采樣,或者經(jīng)由接收的電子郵件而輸入的或者經(jīng)由與PC的有線連接而上傳的數(shù)字采樣。圖1和3A-3D以及有關(guān)文字描述了MS優(yōu)選地操作于其中的系統(tǒng),而且是于2004年3月26日提交的共同未決和共同擁有的美國(guó)專利申請(qǐng)第10/810,924號(hào)的主題。圖2A-2B描述了出于標(biāo)識(shí)主題媒體采樣的目的而進(jìn)行的分布式特征提取。圖2A描述了MS部分。圖4A-4B和圖5更具體地涉及本發(fā)明的MS和用戶接口。
對(duì)于這里所用的術(shù)語(yǔ)進(jìn)行說明將便于對(duì)以下具體描述的理解。媒體采樣是針對(duì)其執(zhí)行分析的任何大小的音頻、可視或者音頻/可視信號(hào)中的一部分。媒體采樣可以是模擬的(如在MS的轉(zhuǎn)換器處或者在與MS相集成的模擬無(wú)線電接收器處接收的廣播FM無(wú)線電信號(hào)中接收的人類可辨別的音樂分段),或者它可以是數(shù)字的(如在通過有線或者無(wú)線鏈路下載或者上傳到MS的文件)。以下描述是在歌曲的時(shí)間受限分段的背景中進(jìn)行的,該時(shí)間受限分段例如是通過常規(guī)FM無(wú)線電一般播放的三分鐘歌曲的連續(xù)或者連貫十秒分段。該采樣的特征或者它的數(shù)字版本是數(shù)字標(biāo)記符、描述符或者是可以從對(duì)它的數(shù)字分析中進(jìn)行收集或者提取的采樣內(nèi)容的其它標(biāo)識(shí)符。時(shí)點(diǎn)是在采樣之內(nèi)以時(shí)間為序的時(shí)刻。特征常常與時(shí)點(diǎn)相關(guān)聯(lián)。例如,采樣中的最大幅度僅出現(xiàn)在一個(gè)時(shí)點(diǎn);反復(fù)的頻率模式可以開始于以等間距相間隔的時(shí)點(diǎn);特征性的擊發(fā)序列可以僅出現(xiàn)在從可以標(biāo)識(shí)的低音序列結(jié)束起的固定偏移時(shí)間。下面呈現(xiàn)對(duì)特征的更具體描述。從采樣中提取特征以便量化采樣的各種特征。以音樂為例,提取歌曲采樣的特征以便搜索歌曲的數(shù)據(jù)庫(kù)而且從數(shù)以千計(jì)或者甚至數(shù)以百萬(wàn)計(jì)的歌曲之中識(shí)別經(jīng)采樣的歌曲的標(biāo)題(或者版本、音樂家等)。當(dāng)數(shù)據(jù)庫(kù)包括先前已經(jīng)從整個(gè)歌曲中提取的特征時(shí),可以在從當(dāng)前采樣中提取的特征與先前提取的特征之間進(jìn)行一對(duì)一的比較。以這一方式,僅通過整個(gè)歌曲中相對(duì)少的采樣就可以識(shí)別歌曲。盡管可以從媒體采樣或者該采樣的數(shù)字版本中提取特征,但是還可以從已經(jīng)提取的特征中提取附加特征。例如,從媒體采樣或者該采樣的數(shù)字版本中提取的第一特征集將表現(xiàn)出它們本身之間的某種自相關(guān)。該自相關(guān)通過僅對(duì)第一提取特征集的分析就可以確定。
在圖1中圖示了本發(fā)明在其中起到作用的通信系統(tǒng)20。比如FM無(wú)線電這樣的媒體源22提供媒體采樣24,比如歌曲的一部分。移動(dòng)臺(tái)MS 26或者具有無(wú)線通信功能、尤其是無(wú)線電話功能的類似這種便攜設(shè)備接收媒體采樣24以供數(shù)字化、處理和發(fā)送。雖然MS 26可以接收整個(gè)歌曲,但是媒體采樣或者它的數(shù)字化版本是根據(jù)本發(fā)明由MS26對(duì)之進(jìn)行操作的一部分。MS 26創(chuàng)建至少一些媒體采樣24的數(shù)字版本,從該數(shù)字版本中提取一個(gè)或多個(gè)特征,而且通過無(wú)線鏈路28將這些特征發(fā)送到通信服務(wù)30,該通信服務(wù)包括與通信服務(wù)器30B通信的基站30A。
通信服務(wù)30在基站30A接收來(lái)自MS 26的呼叫,對(duì)它們保持跟蹤,而且將來(lái)自MS 26的傳輸重定向到商業(yè)歌曲識(shí)別服務(wù)34。在發(fā)送特征的同時(shí),通信服務(wù)可以根據(jù)所用的通信體制類型來(lái)更改從MS 26接收的確切信號(hào)(比如進(jìn)行解碼、解壓、識(shí)別和糾正錯(cuò)誤等),也可以不這樣做,但是并不改變基本的實(shí)質(zhì)數(shù)據(jù)。此外,通信服務(wù)30編寫短的響應(yīng)消息以供MS 26接收,這一點(diǎn)在下面有詳述。
歌曲識(shí)別服務(wù)34通過通信服務(wù)30來(lái)接收MS 26的傳輸。該傳輸優(yōu)選地包括在歌曲識(shí)別服務(wù)34處被進(jìn)一步加以分析的媒體采樣24的特征。替選地,由MS提取的特征與該采樣的另一分段一起發(fā)送,識(shí)別服務(wù)34從中提取附加特征。隨著MS的處理能力和電池效率的增加,來(lái)自MS 26的傳輸可以包括全面的特征集,其足以使得無(wú)需識(shí)別服務(wù)34進(jìn)行進(jìn)一步的特征提取。在任何情況下都不通過MS 26僅對(duì)整個(gè)媒體采樣34的電話現(xiàn)場(chǎng)饋送進(jìn)行傳輸。無(wú)論怎樣,歌曲識(shí)別服務(wù)34都接收該傳輸,可以根據(jù)從MS 26接收的消息中提取進(jìn)一步的相關(guān)特征,而且將它們與在該消息中接收的由MS提取的特征相結(jié)合。
可以與歌曲識(shí)別服務(wù)34在一起或者不在一起的歌曲簽名數(shù)據(jù)庫(kù)36提供了(由MS 26和識(shí)別服務(wù)34二者)從媒體采樣34中提取的完全特征集與之做比較的數(shù)據(jù)庫(kù)。這一數(shù)據(jù)庫(kù)優(yōu)選地為許多文件中的每個(gè)文件存儲(chǔ)從基本的媒體文件或者其采樣中提取的多個(gè)特征。這些存儲(chǔ)的特征集可以用來(lái)在簽名數(shù)據(jù)庫(kù)36中的所有其它特征集中唯一地標(biāo)識(shí)從中抽取媒體采樣24的基本文件。替選地,簽名數(shù)據(jù)庫(kù)36可以為每個(gè)文件或者歌曲存儲(chǔ)若干提取的非唯一特征以及參考采樣(其組合唯一地標(biāo)識(shí)該基本文件或者歌曲),或者存儲(chǔ)用以從其它歌曲或者文件中唯一地標(biāo)識(shí)一個(gè)歌曲或者文件的任何其它手段。
歌曲識(shí)別服務(wù)34將原來(lái)的采樣與在歌曲簽名數(shù)據(jù)庫(kù)36中存儲(chǔ)的采樣做比較,而且在歌曲簽名數(shù)據(jù)庫(kù)36中尋求MS 26所發(fā)送的特征的僅一個(gè)匹配。當(dāng)MS 26和識(shí)別服務(wù)34各自提取特征時(shí),歌曲識(shí)別服務(wù)34執(zhí)行兩個(gè)單獨(dú)的功能使用所提取的特征來(lái)搜索數(shù)據(jù)庫(kù),以及從媒體采樣的發(fā)送部分中提取進(jìn)一步特征。優(yōu)選地,識(shí)別服務(wù)34并行地執(zhí)行這兩個(gè)功能。當(dāng)歌曲識(shí)別服務(wù)34初始地僅使用先前由MS 26提取的特征來(lái)搜索簽名數(shù)據(jù)庫(kù)36時(shí),可能識(shí)別不出唯一歌曲,但是簽名數(shù)據(jù)庫(kù)36中的潛在匹配將根據(jù)在該初始的搜索中使用的特征數(shù)目而減少到顯著更小的子集。同時(shí),識(shí)別服務(wù)34從MS 26所發(fā)送的該部分媒體采樣24中提取附加特征。提取每個(gè)附加特征時(shí),潛在匹配的子集被減少,直至找到僅有的一個(gè)唯一匹配為止。在這時(shí),識(shí)別服務(wù)34終止進(jìn)一步的特征提取,從而最小了化為將媒體采樣24匹配于簽名數(shù)據(jù)庫(kù)36中的媒體文件而需要的全部處理。
替選地,識(shí)別服務(wù)34可以代之以先從MS 26所發(fā)送的消息中提取附加特征,利用從MS 26接收的特征來(lái)編譯所提取的特征,而且執(zhí)行對(duì)整個(gè)簽名數(shù)據(jù)庫(kù)36的僅一次搜索以找到唯一匹配。該選擇是基于在對(duì)用戶的響應(yīng)(用以搜索數(shù)據(jù)庫(kù)的時(shí)間)與在識(shí)別服務(wù)處用以從來(lái)自許多MS的眾多同時(shí)消息中提取附加特征的可用處理能力之間的市場(chǎng)驅(qū)動(dòng)平衡。
一旦找到唯一匹配,識(shí)別服務(wù)34通過通信服務(wù)30將采樣標(biāo)識(shí)信息(在沒有找到匹配時(shí)該消息也可以是未經(jīng)標(biāo)識(shí)的消息)發(fā)送到MS26。MS 26在顯示器用戶接口UI上顯示歌曲標(biāo)題和音樂家以向用戶告知歌曲名或者其它媒體文件名。
優(yōu)選地,將本發(fā)明擴(kuò)展到僅標(biāo)識(shí)歌曲或者媒體文件以外,而是自動(dòng)地提供如下鏈接,用戶可以通過該鏈接來(lái)購(gòu)買下載到MS 26處的消費(fèi)者的該標(biāo)識(shí)的媒體文件的拷貝。替選地,可以改造為將第一拷貝提供給MS 26而將第二拷貝提供給另一設(shè)備,比如個(gè)人計(jì)算機(jī)44,其中每個(gè)拷貝是針對(duì)下載可用的鏈路28、46的類型而定制的。這一點(diǎn)之所以有利是因?yàn)榈谝豢截惪梢允怯萌缦戮幋a解碼器壓縮后的標(biāo)識(shí)的媒體文件,該編碼解碼器針對(duì)在MS 28處的更有限的存儲(chǔ)和聲音再現(xiàn)能力(以及帶寬考慮)而進(jìn)行優(yōu)化,而同一基本媒體文件的第二拷貝可以用第二編碼解碼器來(lái)壓縮,該第二編碼器針對(duì)在通向PC 44的鏈路46中可用的更大帶寬而進(jìn)行優(yōu)化。消費(fèi)者然后可以將第二拷貝上傳到專用便攜數(shù)字音樂設(shè)備,比如Rio或者iPod,以求高保真的便攜音樂。這種雙拷貝下載替選方案的細(xì)節(jié)是于2004年3月2日提交的共同擁有的美國(guó)專利申請(qǐng)第10/792,547號(hào)的主題,而且在這里通過參考結(jié)合于此。
向用戶提供標(biāo)識(shí)媒體文件的拷貝就要求存儲(chǔ)有待下載的實(shí)際文件或者歌曲的文件或者歌曲存儲(chǔ)數(shù)據(jù)庫(kù)40的配合。在簽名數(shù)據(jù)庫(kù)36存儲(chǔ)特征和文件/歌曲標(biāo)識(shí)(比如可以在找到匹配之后發(fā)送到MS 26的標(biāo)題/作者)的情況下,文件/歌曲存儲(chǔ)數(shù)據(jù)庫(kù)40存儲(chǔ)與在簽名數(shù)據(jù)庫(kù)36中匹配的特征對(duì)應(yīng)的實(shí)際文件/歌曲。兩個(gè)數(shù)據(jù)庫(kù)36、40可以合而為一,不過它們也可以不這樣;來(lái)自簽名數(shù)據(jù)庫(kù)36的標(biāo)識(shí)可以用來(lái)從單獨(dú)的文件/歌曲數(shù)據(jù)庫(kù)40中容易地選擇唯一文件/歌曲。來(lái)自后一數(shù)據(jù)庫(kù)40的文件/歌曲是在本發(fā)明如上所述擴(kuò)展到將歌曲的拷貝及其標(biāo)識(shí)提供給MS 26的用戶時(shí)、優(yōu)選地在文件壓縮之后下載到用戶的文件/歌曲。
當(dāng)要這樣下載歌曲時(shí),優(yōu)選的是,在網(wǎng)絡(luò)32中耦合到歌曲數(shù)據(jù)庫(kù)40的音樂服務(wù)38接收來(lái)自MS 26的請(qǐng)求,而且利用所請(qǐng)求的文件(歌曲、圖像、文本等)以及用于以所述的形式(觸筆、模板、腳本等)呈現(xiàn)該文件的元數(shù)據(jù)來(lái)做出響應(yīng)。音樂服務(wù)38從歌曲存儲(chǔ)數(shù)據(jù)庫(kù)40中查詢數(shù)據(jù)。由于MS 26通過通信服務(wù)30耦合到網(wǎng)絡(luò)32,所以文件穿過它通到MS 26。
也可以包括下載服務(wù)42以便管理通過音樂服務(wù)38從MS 26啟動(dòng)的所有單獨(dú)下載交易。下載服務(wù)42對(duì)于從存儲(chǔ)數(shù)據(jù)庫(kù)40每次下載文件進(jìn)行跟蹤,以便跟蹤計(jì)費(fèi)和遵循版權(quán)約束。本發(fā)明構(gòu)想了在MS 26的用戶接口UI處由單個(gè)輸入,比如單次按壓按鈕或者軟鍵來(lái)自動(dòng)執(zhí)行的端到端的交易。在這一端到端的實(shí)施例中,該單個(gè)輸入在MS 26中啟動(dòng)了媒體采樣的捕獲、特征提取和呼叫建立以及啟動(dòng)了從MS 26的所提取的特征和媒體采樣的一部分的傳輸。使用簽名數(shù)據(jù)庫(kù)36通過提取的特征(一些特征由MS 26提取,一些特征由識(shí)別服務(wù)34提取)來(lái)標(biāo)識(shí)歌曲,而音樂服務(wù)38或者識(shí)別服務(wù)34向MS 26發(fā)送如下消息,該消息向MS用戶標(biāo)識(shí)該歌曲(例如標(biāo)題和音樂家)。
該消息也提供對(duì)音樂服務(wù)38的鏈接,使得利用在MS 26處優(yōu)選為又一次的輸入,用戶就可以請(qǐng)求下載該歌曲到MS 26。音樂服務(wù)存儲(chǔ)歌曲標(biāo)識(shí)符(該標(biāo)識(shí)符可以是標(biāo)題/音樂家,也可以不這樣,因?yàn)槠鋵⒈挥脕?lái)從歌曲數(shù)據(jù)庫(kù)40中數(shù)字化地選擇歌曲),或者將歌曲標(biāo)識(shí)符傳送到下載服務(wù)42,然后該下載服務(wù)存儲(chǔ)歌曲標(biāo)識(shí)符。當(dāng)MS 26請(qǐng)求下載歌曲時(shí),音樂服務(wù)38從歌曲數(shù)據(jù)庫(kù)40中選擇匹配歌曲,通知下載服務(wù)42,該下載服務(wù)通過通信服務(wù)服務(wù)器30B來(lái)安排對(duì)MS 26用戶的計(jì)費(fèi),而音樂服務(wù)38從歌曲數(shù)據(jù)庫(kù)40中提供要下載到MS 26的標(biāo)識(shí)的歌曲。用戶可以使用在標(biāo)識(shí)消息中提供的鏈接直接地從MS 26訪問音樂服務(wù)38,或者可以使用從PC 44的鏈路以獲得歌曲的較高保真版本(不同的壓縮編碼解碼器),因?yàn)樵摪姹緦⒔?jīng)由寬帶或者其它PC鏈路46來(lái)下載,其中該P(yáng)C鏈路在目前的實(shí)踐中通常在帶寬上不像無(wú)線移動(dòng)電話鏈路28那樣受限制。
圖2A和2B廣義地描述了在通信系統(tǒng)20的分布式部件之間對(duì)媒體采樣的分析。圖2A在框圖中圖示了在移動(dòng)臺(tái)26之內(nèi)的操作。媒體采樣24被數(shù)字化201為對(duì)MS 26的任何其它輸入,而MS 26建立到達(dá)比如由歌曲識(shí)別服務(wù)34操作的服務(wù)器這樣的服務(wù)器的數(shù)據(jù)連接(例如經(jīng)由無(wú)線鏈路28和網(wǎng)絡(luò)32)。MS 26開始預(yù)處理202經(jīng)數(shù)字化的音頻輸入信號(hào)201而且從該信號(hào)中提取隨后將作為數(shù)據(jù)分組發(fā)送到服務(wù)器的特征??蛇x地,MS 26已經(jīng)持續(xù)地緩沖音頻輸入,使得可以在按壓識(shí)別鍵或者用以啟動(dòng)該過程的其它用戶輸入之前的時(shí)間所輸入的信號(hào)開始預(yù)處理202。在多數(shù)情況下,用戶在按壓識(shí)別鍵之前已經(jīng)收聽歌曲一段時(shí)間。
用于識(shí)別的特征例如可以是譜平坦度、譜質(zhì)心、節(jié)奏和/或旋律。特征對(duì)媒體文件或者采樣的內(nèi)容進(jìn)行表征以便對(duì)文件進(jìn)行分類和標(biāo)識(shí),而不僅僅是對(duì)輸入到MS 26中的(模擬)媒體采樣24的數(shù)字再形成。雖然MS 26比如通過使用語(yǔ)音編碼器將輸入的媒體采樣24數(shù)字化,但是僅僅這樣卻不是特征提取。優(yōu)選地,特征是非重建的。也就是說,原來(lái)的媒體采樣是無(wú)法僅通過對(duì)于從該采樣中提取的特征進(jìn)行重新處理或者用別的方式對(duì)該特征進(jìn)行操作就可以重建的。非重建特征描述并標(biāo)識(shí)該媒體文件的內(nèi)容,但不能重新創(chuàng)建該內(nèi)容。并非所有特征都需要是非重建的,但是與在即使不是所有實(shí)例中也在多數(shù)實(shí)例中的重建特征相比,在MS 26處提取非重建的特征可產(chǎn)生較小打包的消息以便通過無(wú)線鏈路發(fā)送。
適當(dāng)?shù)奶卣饕呀?jīng)例如在MPEG-7標(biāo)準(zhǔn)(ISO/IEC 1 5938,尤其是ISO/IEC 15938-4,信息技術(shù)-多媒體內(nèi)容描述接口-第4部分音頻,針對(duì)于這里與音頻有關(guān)的實(shí)施例)中進(jìn)行了描述,通過參考將其結(jié)合于此。涉及MPEG-7的文獻(xiàn)使用了術(shù)語(yǔ)描述符以表示從媒體采樣中直接提取的特征,這比如可以根據(jù)本發(fā)明由MS 26來(lái)執(zhí)行。MPEG-7文獻(xiàn)使用了術(shù)語(yǔ)描述方案DS或者描述工具來(lái)描述從描述符中提取的特征。描述符是對(duì)媒體采樣數(shù)字版本的低級(jí)分析,而描述方案是高級(jí)分析(例如是從描述符之間的相互關(guān)系中而不是直接地從采樣中獲取的)。MPEG-7目前處于提煉之中,因此下文是對(duì)于當(dāng)前針對(duì)該標(biāo)準(zhǔn)而構(gòu)思的并與本發(fā)明相關(guān)的某些描述符和描述方案的概括。
描述符是低級(jí)特征,即視聽內(nèi)容的基本質(zhì)量的表示,比如信號(hào)幅度的統(tǒng)計(jì)模型、信號(hào)的基本頻率、在信號(hào)中出現(xiàn)的源的數(shù)目估計(jì)、譜傾斜、情緒內(nèi)容、顯式聲效模型以及任何數(shù)目的具體或者抽象特征。在本發(fā)明的優(yōu)選實(shí)施例中,MS 26提取描述符。
描述方案是描述符的結(jié)構(gòu)化組合。這一結(jié)構(gòu)可以用來(lái)注釋文檔以直接地表達(dá)文檔的結(jié)構(gòu)或者創(chuàng)建形成了對(duì)更高級(jí)概念的更豐富表達(dá)的特征組合。例如,經(jīng)典的音樂DS可以對(duì)Sonata形式的音樂結(jié)構(gòu)進(jìn)行編碼(而且允許有例外)。各種頻譜和時(shí)間描述符可以組合形成適合于描述音質(zhì)或者短聲效的DS。在本發(fā)明的優(yōu)選實(shí)施例中,在網(wǎng)絡(luò)32上的服務(wù)器提取描述方案。
描述符可以被視為限定了媒體采樣內(nèi)容特定特性的一種表示的語(yǔ)法和語(yǔ)義。例如,圖像文件的顏色是一種特性。特征可以是描述符或者特性,其中描述符是二者中更為基本的,而特定的特性可能只有通過若干描述符才可以完全地加以描述。與特性‘顏色’相關(guān)聯(lián)的可能描述符包括色直方圖、紅-綠-藍(lán)(RGB)矢量或者串。MS 26可以針對(duì)特定描述符提取數(shù)值,針對(duì)給定的數(shù)值集提取描述符的示例。例如,RGB=(255,255,255),色串=“紅色”。某些描述符與一類媒體文件相關(guān)或者對(duì)之有效,而與另一類媒體文件無(wú)關(guān)或者對(duì)之無(wú)效。例如,用于可視媒體采樣的描述符可以包括在基本結(jié)構(gòu)特性之內(nèi)的柵格布局和直方圖;在色特性之內(nèi)的色空間、主導(dǎo)色、色直方圖和色量化;在紋理特性之內(nèi)的空間圖像密度分布和同質(zhì)紋理;在形狀特性之內(nèi)的對(duì)象界定框、基于區(qū)域的形狀、基于輪廓的形狀和3D形狀描述符;以及在運(yùn)動(dòng)特性之內(nèi)的攝像機(jī)運(yùn)動(dòng)、對(duì)象運(yùn)動(dòng)軌跡、參數(shù)對(duì)象運(yùn)動(dòng)、運(yùn)動(dòng)行為和運(yùn)動(dòng)軌跡的多個(gè)方面(例如速度、方向、加速度)。與音頻采樣相關(guān)的描述符可以包括在語(yǔ)音注釋特性中的詞語(yǔ)以及音素加元數(shù)據(jù)的晶格;在音質(zhì)特性中的偶諧音與奇諧音之比以及諧音起音連貫性;以及在旋律特性之內(nèi)的旋律輪廓和節(jié)奏。
目前在MPEG-7中有十七個(gè)時(shí)間和空間描述符用于描述音頻采樣基礎(chǔ)、基礎(chǔ)譜、信號(hào)參數(shù)、音質(zhì)時(shí)間、音質(zhì)譜和譜基。此外,靜音描述符已經(jīng)在標(biāo)識(shí)音頻采樣的內(nèi)容中證明其價(jià)值。兩個(gè)基礎(chǔ)音頻描述符是是用于一般用途的在時(shí)間上采樣的標(biāo)量值,適用于所有種類的音頻采樣。波形描述符描述了通常用于顯示目的的音頻波形包絡(luò)(最小和最大)。功率描述符描述了在時(shí)間上平滑的瞬時(shí)功率,該描述符可用作為對(duì)信號(hào)或者采樣的快速概括而且與功率譜相結(jié)合。
四個(gè)基礎(chǔ)譜音頻描述符都共享共同的基礎(chǔ),都從音頻信號(hào)或者采樣的單個(gè)時(shí)間-頻率分析中導(dǎo)出。它們都通過第一描述符來(lái)通知,第一描述符即音頻譜包絡(luò)描述符,該描述符是由二的冪次方的除數(shù)或者倍頻程的倍數(shù)間隔開的對(duì)數(shù)頻率譜。該音頻譜包絡(luò)是對(duì)音頻采樣的短期功率譜進(jìn)行描述的矢量。它可以用來(lái)顯示聲譜圖,以便合成數(shù)據(jù)的原本“聽覺化”,或者用作為用于搜索和比較的通用描述符。其它譜音頻描述符表示了對(duì)數(shù)頻率功率譜的重心(質(zhì)心或者形狀的中心)、圍繞質(zhì)心擴(kuò)展的譜、以及許多頻率帶或者倉(cāng)中的每個(gè)頻率帶或者倉(cāng)的譜平坦度。
兩個(gè)信號(hào)參數(shù)描述符主要應(yīng)用于周期信號(hào)或者準(zhǔn)周期信號(hào)。這些描述符描述了音頻采樣的基本頻率(置信量度)及其諧音(用以區(qū)分例如樂音音調(diào)或者濁音語(yǔ)音、金屬性或者鐘似聲音、如‘f’這樣的摩擦音、或者樂器的密集混合)。
兩個(gè)音質(zhì)時(shí)間描述符描述了聲音分段的時(shí)間特性,而且尤其有助于對(duì)于樂音音質(zhì)的描述,該樂音音質(zhì)是與音調(diào)和響度無(wú)關(guān)的具有特性的音品。一個(gè)這樣的描述符對(duì)聲音的“起音”(信號(hào)從靜音升到最大幅度所花費(fèi)的時(shí)間)進(jìn)行表征,而另一描述符對(duì)信號(hào)包絡(luò)或者質(zhì)心進(jìn)行表征,表示了信號(hào)能量何時(shí)聚焦。當(dāng)衰落的鋼琴音符與維系的風(fēng)琴音符的長(zhǎng)度和起音雷同時(shí),后一描述符例如可以在這兩個(gè)音符之間加以區(qū)別。
五個(gè)音質(zhì)譜描述符是在線性頻率空間中的譜特性,尤其適用于對(duì)樂音音質(zhì)的感知。一個(gè)描述符是線性功率譜中各倉(cāng)的頻率的冪加權(quán)平均,而且類似于如上所述的質(zhì)心描述符,但是又因不同的樂器而對(duì)聲音的“銳度”有所區(qū)別。其余的音質(zhì)譜描述符對(duì)信號(hào)或者采樣的諧音規(guī)則間隔成分進(jìn)行操作。為此,描述符是在線性頻率空間中計(jì)算的,而且包括譜質(zhì)心、譜偏差和譜擴(kuò)展描述符。
兩個(gè)譜基礎(chǔ)描述符表示了高維度譜空間的低維度投影以便有助于緊致和識(shí)別。一個(gè)這樣的描述符是從規(guī)一化功率譜的奇值分解中導(dǎo)出的一連串(潛在地隨時(shí)間變化和/或在統(tǒng)計(jì)上獨(dú)立的)基礎(chǔ)函數(shù)。另一描述符(在與第一描述符相組合時(shí))表示了在秩縮減的基礎(chǔ)上進(jìn)行投影之后的譜的低緯度特性。靜音分段簡(jiǎn)單地將“靜音”(即沒有顯著的聲音)的語(yǔ)義隸屬于音頻分段。雖然這極為簡(jiǎn)單,但它卻是非常有效的描述符。它可以用來(lái)幫助將音頻流進(jìn)一步分段,或者用作為不對(duì)分段進(jìn)行處理的提示。
描述符可以一起用來(lái)查看和緊致地表示聲譜圖的獨(dú)立子空間。這些獨(dú)立的子空間(或者它們的分組)常常強(qiáng)相關(guān)于不同聲源。因此在使用較少的空間時(shí)從聲譜圖中獲得更多的突顯和結(jié)構(gòu)。
描述方案DS反映了在描述符之間的或者在若干頻率倉(cāng)或者譜切片之上的同類描述符之間的相互關(guān)系。以這一方式,DS以某一程度的一般性換來(lái)了描述上的豐富性。一旦在MS 26處從采樣或者該采樣的分段中提取足量描述符,就無(wú)需發(fā)送經(jīng)數(shù)字化的音頻采樣;識(shí)別服務(wù)34僅需要用以從中提取附加特征的提取特征。這些附加特征在本發(fā)明的某些實(shí)施例中類似于MPEG7的DS。例如,音頻簽名DS在統(tǒng)計(jì)上概括譜平坦度描述符。這可以針對(duì)音頻采樣的魯棒自動(dòng)標(biāo)識(shí)來(lái)提供唯一的內(nèi)容標(biāo)識(shí)符。
音質(zhì)DS著眼于描述樂器聲音的感知特性。音質(zhì)是使兩個(gè)聲音具有同一音調(diào)和響度而聽上去不同的感知特性。音質(zhì)DS用縮減的描述符集來(lái)描述這些感知特性,該描述符集能涉及比如聲音的“起音”、“亮度”或者“豐富度”這樣的概念,涉及特定樂器或者樂曲組(打擊樂器)的諧音、連貫、維系音和非維系音等。另一音質(zhì)DS使用距離度量將音質(zhì)時(shí)間描述符與譜質(zhì)心描述符做比較。
旋律DS包括對(duì)于單音旋律信息的豐富表示以便有助于有效、魯棒和富于表現(xiàn)力的旋律相似度匹配,而且包括用于極為扼要、有效的旋律輪廓表示的旋律輪廓DS(5階輪廓表示了相鄰音符之間的間隔差,其中間隔被向上、向下量化成或大或小或相同大小的間隔)以及用于更為詳細(xì)、完整和富于表現(xiàn)力的旋律表示的旋律序列DS(擴(kuò)展的描述符集和較高精確度的音調(diào)間隔編碼)。任一個(gè)描述符或者二者都可以擴(kuò)展為包括關(guān)于旋律的支持信息。在這些核心描述符周圍排列的是應(yīng)用所希望使用的一連串可選的支持描述符,比如歌詞、基調(diào)、韻律和起始音符。
一些“識(shí)別”DS專門地輔助對(duì)基本媒體文件進(jìn)行搜索和編索引,而且使用低級(jí)的譜基礎(chǔ)描述符作為它們的根基,由該根基形成了統(tǒng)計(jì)模型,比如隱含馬爾可夫或者高斯混合模型。所得的概率分類器可以識(shí)別廣泛的聲音分類,比如語(yǔ)音和音樂,或者它們可以被訓(xùn)練用以識(shí)別較窄的類別,比如男性、女性、喇叭或者小提琴。其它應(yīng)用包括風(fēng)格分類和語(yǔ)音識(shí)別。更多DS詳述了在音頻流之內(nèi)的口頭內(nèi)容。
與可以提取的特征有關(guān)的更多細(xì)節(jié)可以在2002年6月27目公布的美國(guó)專利申請(qǐng)第US2002/0083060 A1號(hào)中找到,通過參考將其結(jié)合于此。MS 26中預(yù)處理202的量在范圍上可以從無(wú)到特征矢量的完整提取。用于每個(gè)特征的整個(gè)特征提取過程優(yōu)選地分成若干階段,一些階段與未提取的信號(hào)(例如在MS 26處接收的‘現(xiàn)場(chǎng)’音樂采樣24)相比而言減少了隨后發(fā)送的數(shù)據(jù)量。例如,用于譜特征的第一階段可以是通過計(jì)算瞬時(shí)自相關(guān)矢量而且在時(shí)間段上將它們平均來(lái)估計(jì)數(shù)字化輸入信號(hào)201的自相關(guān)。后繼的階段然后執(zhí)行傅立葉變換而且對(duì)之進(jìn)行進(jìn)一步處理。整個(gè)特征提取過程在MS 26與服務(wù)器34之間劃分。MS 26選擇它執(zhí)行的階段的數(shù)目,而且將作為輔助信息執(zhí)行的階段的數(shù)目M連同預(yù)處理的結(jié)果(由MS提取的特征)一起進(jìn)行打包203。優(yōu)選地,MS 26自適應(yīng)地選擇它提取的特征的數(shù)目和/或類型,這可以基于媒體采樣的類型(音頻、視頻、靜態(tài)圖像等)和/或它將用來(lái)發(fā)送這些提取特征的信道特性。也可以如上所述從MS 26發(fā)送MS 26沒有從中提取特征的媒體采樣24的分段,以供如上所述在識(shí)別服務(wù)34處的進(jìn)一步分析。根據(jù)典型的無(wú)線協(xié)議(星座映射、糾錯(cuò)等)對(duì)分組進(jìn)行編碼204。在處理能力與傳輸帶寬之間的適當(dāng)平衡是基于接入網(wǎng)32和MS 26的功能來(lái)選擇的。經(jīng)由一個(gè)或多個(gè)信道通過無(wú)線鏈路28發(fā)送經(jīng)編碼的分組。
如圖2B中所示,對(duì)分組進(jìn)行接收和解碼205。在端到端畫外音的互聯(lián)網(wǎng)協(xié)議設(shè)置中,無(wú)線鏈路28所特有的解碼可以由通信服務(wù)器30B完成,而單獨(dú)分組的開啟206可以由歌曲識(shí)別服務(wù)34完成。歌曲識(shí)別服務(wù)34的服務(wù)器然后提取標(biāo)識(shí)歌曲標(biāo)識(shí)所需的進(jìn)一步參數(shù)207,該參數(shù)可以根據(jù)從MS 26接收的特征和/或者也從MS 26接收的數(shù)字化媒體采樣的分段中來(lái)提取。在圖2A-2B的例子中,提取了總計(jì)N>M個(gè)特征以實(shí)現(xiàn)媒體采樣的正標(biāo)識(shí)。許多的M個(gè)特征由MS 26提取,而其余的N-M個(gè)特征由服務(wù)器34提取,其中M優(yōu)選地表示較低級(jí)特征,而N-M代表較高級(jí)特征,該較高級(jí)特征是從較低級(jí)特征中提取的,但是不形成媒體采樣的數(shù)字化版本。歌曲識(shí)別服務(wù)服務(wù)器34然后在提取的特征與存儲(chǔ)于歌曲簽名數(shù)據(jù)庫(kù)36處的、各自表示基本媒體文件的特征集之間進(jìn)行比較208。理想地,數(shù)據(jù)庫(kù)中的一個(gè)且僅一個(gè)特征集將匹配于提取特征組,而這樣匹配的特征集表示了從中獲取過媒體采樣的文件?;谔崛〉奶卣?,通過將媒體采樣24的N個(gè)提取特征與歌曲簽名數(shù)據(jù)庫(kù)36提供的基本文件的特征矢量或者矢量集做比較來(lái)識(shí)別該媒體采樣。
圖3A-3D以流程圖的形式圖示了根據(jù)本發(fā)明的方法的各種步驟或者優(yōu)選實(shí)施例,每個(gè)流程圖如圖所示地聯(lián)系到另一圖。圖3A描述在MS 26之內(nèi)初始地接收和處理媒體采樣24的方法。在這一實(shí)施例中,將媒體采樣解析成兩個(gè)分段,一個(gè)分段存儲(chǔ)于MS 26的緩沖器中,而在MS 26處接收時(shí)實(shí)時(shí)地處理另一分段。在MS 26處接收302第一媒體采樣分段、將之?dāng)?shù)字化和存儲(chǔ)于緩沖器中。這一存儲(chǔ)是連續(xù)的,因?yàn)闆]有用戶輸入通知MS 26它應(yīng)當(dāng)根據(jù)這里的教導(dǎo)來(lái)執(zhí)行分析或者用別的方式處理該輸入。用戶按壓識(shí)別鍵304,觸發(fā)MS 26優(yōu)選同時(shí)地執(zhí)行三個(gè)功能MS 26建立306通向基站30A的無(wú)線鏈路28,它從媒體采樣24的緩沖第一分段中提取308較低級(jí)特征,而且它接收310媒體采樣的第二分段、將之?dāng)?shù)字化,并且從中提取較低級(jí)特征??梢运矐B(tài)地存儲(chǔ)第二分段。MS 26然后通過在步驟306建立的無(wú)線鏈路28來(lái)發(fā)送312所提取的特征(以及如上所述如果適用則還發(fā)送由MS 26在提取特定特征時(shí)執(zhí)行的步驟數(shù)目)。替選地,從第一分段中提取特征,也可能從第二分段中提取特征,而且提取的特征連同第二分段一起發(fā)送,該第二分段可以僅僅是數(shù)字化媒體采樣的譜切片或者一連串譜切片。該方法在圖3B中繼續(xù)314。
圖3B詳述了在系統(tǒng)20的網(wǎng)絡(luò)32側(cè)處的步驟。服務(wù)器34從MS 26接收316在圖3A的步驟312發(fā)送的消息。通信服務(wù)器30B可以對(duì)打包消息的無(wú)線具體部分進(jìn)行解碼,而且優(yōu)選地通過網(wǎng)絡(luò)32僅重發(fā)帶有實(shí)質(zhì)數(shù)據(jù)的未開啟分組。歌曲識(shí)別服務(wù)34開啟分組,接收已經(jīng)提取的較低級(jí)特征,而且在簽名數(shù)據(jù)庫(kù)36中搜索318如下文件以求唯一匹配320,該文件承載了與從MS 26接收的那些較低級(jí)特征相匹配的特征集。暫時(shí)存儲(chǔ)該搜索的結(jié)果。如果僅使用由MS提取的特征找不到唯一匹配,則將(在方塊316初始化的)索引K與最大值做比較,而且如果沒有超過最大值,則在方塊326從接收的較低級(jí)特征中提取一個(gè)或更多較高級(jí)特征。在方塊328,使用由服務(wù)器提取的第K個(gè)特征來(lái)搜索與由MS提取的特征相匹配的來(lái)自數(shù)據(jù)庫(kù)的(而且在方塊318暫時(shí)存儲(chǔ)的)那些特征,使得在當(dāng)前的搜索迭代中無(wú)需再次搜索整個(gè)數(shù)據(jù)庫(kù)36。在方塊322暫時(shí)存儲(chǔ)該第K次搜索的結(jié)果,在方塊330對(duì)K進(jìn)行索引加一,而且如果再次沒有找到唯一的匹配320,則針對(duì)甚至更多的提取特征繼續(xù)該循環(huán),直至K超過最大值為止,其中將“沒有找到匹配”消息發(fā)送334到MS。一旦在方塊320找到唯一匹配,就將答復(fù)消息336發(fā)送到MS 26,該答復(fù)消息帶有與匹配于提取特征的數(shù)據(jù)庫(kù)特征集唯一對(duì)應(yīng)的歌曲或者文件的標(biāo)題(或者其它標(biāo)識(shí))。答復(fù)消息336也優(yōu)選地帶有直接通向歌曲或者文件存儲(chǔ)數(shù)據(jù)庫(kù)40處的匹配文件的鏈接,該存儲(chǔ)數(shù)據(jù)庫(kù)40可以與簽名數(shù)據(jù)庫(kù)36在一起,也可以不這樣。
在MS 26與歌曲識(shí)別服務(wù)34之間的通信鏈路優(yōu)選地在MS 26首次發(fā)送它提取的特征的時(shí)間與識(shí)別服務(wù)34發(fā)送它的帶有唯一文件標(biāo)識(shí)符的答復(fù)消息336的時(shí)間之間保持開路。在一個(gè)實(shí)施例中,MS 26發(fā)送具有第一提取特征集的第一消息,而識(shí)別服務(wù)34搜索它的數(shù)據(jù)庫(kù)(提取附加特征或者不這樣)。在沒有找到唯一匹配的情形下,識(shí)別服務(wù)34可以向MS 26發(fā)送請(qǐng)求消息,該消息可以指定它要求MS 26提取的附加特征的數(shù)目和/或類型(MS 26可以從存儲(chǔ)于緩沖器中的媒體采樣的數(shù)字版本中提取附加特征)。例如,假設(shè)識(shí)別服務(wù)34返回來(lái)自數(shù)據(jù)庫(kù)的四個(gè)匹配結(jié)果。然后識(shí)別服務(wù)能確定可以用來(lái)對(duì)四個(gè)匹配結(jié)果唯一地進(jìn)行區(qū)別的一個(gè)或多個(gè)特定特征,該特征可以是較低級(jí)特征,比如信號(hào)包絡(luò)或者質(zhì)心,或者是較高級(jí)特征,比如在音質(zhì)時(shí)間質(zhì)心之間的音質(zhì)時(shí)間距離。在前者中,識(shí)別服務(wù)34可以針對(duì)特定譜切片來(lái)具體地要求將在四個(gè)匹配結(jié)果之間直接地進(jìn)行區(qū)別的質(zhì)心特征;在后者中,它可以要求遺漏的音質(zhì)時(shí)間質(zhì)心,使得識(shí)別服務(wù)然后可以提取將在四個(gè)匹配結(jié)果之間進(jìn)行區(qū)別的附加特征(例如質(zhì)心之間的距離)。MS 26發(fā)送具有在該第二次提取中提取的第二特征集的另一消息,而識(shí)別服務(wù)34再次搜索數(shù)據(jù)庫(kù)。對(duì)數(shù)據(jù)庫(kù)的第二次搜索可以使用第二提取特征集,可以使用從第二特征集中提取的第二附加特征集,或者其組合。以這一方式,可以在MS 26與識(shí)別服務(wù)34之間繼續(xù)‘對(duì)話’,每當(dāng)數(shù)據(jù)庫(kù)搜索未能返回唯一匹配時(shí)識(shí)別服務(wù)34就要求附加特征。優(yōu)選地,在它們之間的通信鏈路保持開路;由于沒有發(fā)送分組,所以在識(shí)別服務(wù)搜索數(shù)據(jù)庫(kù)的時(shí)間期間,分組交換網(wǎng)絡(luò)無(wú)需消耗顯著的帶寬。
優(yōu)選地,歌曲或者文件標(biāo)識(shí)和對(duì)應(yīng)的音樂服務(wù)URI被返回到通信服務(wù)30A-B,該通信服務(wù)編寫對(duì)MS 26的答復(fù)消息而且將它作為SMS/MMS或者類似消息發(fā)送到MS 26。識(shí)別服務(wù)服務(wù)器34也發(fā)送消息338到音樂服務(wù)器38(其中音樂服務(wù)器與識(shí)別服務(wù)服務(wù)器相分離),該消息具有MS 26的唯一標(biāo)識(shí)符以及對(duì)匹配文件的鏈接。
方塊342引向圖3C,音樂服務(wù)器38。音樂服務(wù)器38從圖3B的方塊338接收334消息,而且在下載管理器346處存儲(chǔ)346該信息,這是因?yàn)镸S 26可能無(wú)法立即地請(qǐng)求下載匹配文件或者歌曲。一旦優(yōu)選地在MS 26從識(shí)別服務(wù)服務(wù)器34接收它的答復(fù)消息336之后不久音樂服務(wù)器38就從MS 26接收請(qǐng)求(見圖3D),它將MS 26的唯一標(biāo)識(shí)符匹配350于在下載管理器346中存儲(chǔ)的MS ID,而且取回對(duì)匹配文件的關(guān)聯(lián)鏈接。確認(rèn)支付信息(優(yōu)選地在該MS 26進(jìn)行第一購(gòu)買之后保留存檔和匹配到MS ID),而且匹配文件或者歌曲下載352到MS 26。購(gòu)買發(fā)票提交354到該MS 26的通信服務(wù)器30B,而該過程對(duì)于該方法的網(wǎng)絡(luò)側(cè)而言就此結(jié)束356。
圖3B的方塊340引向在MS 26看來(lái)則是繼續(xù)的圖3D。MS 26從(圖3B的)方塊336接收答復(fù)消息和鏈接,而且將歌曲或者文件標(biāo)題或者其它標(biāo)識(shí)符連同對(duì)它的鏈接一起顯示360。用戶可能是在選擇用戶已經(jīng)存儲(chǔ)可以同時(shí)顯示的若干鏈接之后按壓362下載鍵,這就發(fā)送了364對(duì)于在圖3C的方塊348處提到的對(duì)文件或者歌曲的請(qǐng)求,也構(gòu)成了對(duì)先前透露賬戶進(jìn)行借記或者貸記的授權(quán)。用戶在SM 26處接收336下載的文件或者歌曲,而該方法對(duì)于該交易的MS 26側(cè)而言就此結(jié)束368。
MS 26的具體部件將參照?qǐng)D4A和4B來(lái)詳述。用于接收模擬音頻輸入(先前提到的媒體采樣24)的第一轉(zhuǎn)換器或者麥克風(fēng)48耦合到處理器50。麥克風(fēng)48將模擬媒體采樣24轉(zhuǎn)換成數(shù)字版本,處理器50開始從該數(shù)字版本中提取存儲(chǔ)于計(jì)算機(jī)可讀主儲(chǔ)存器54中的特征。用于特征提取的特定算法可以存儲(chǔ)于儲(chǔ)存器54中作為計(jì)算機(jī)可讀指令,而主儲(chǔ)存器54可以不是單個(gè)一致的存儲(chǔ)介質(zhì),而可以是分布于若干不同存儲(chǔ)部件之間。媒體采樣可以穿過緩沖器儲(chǔ)存器52,該儲(chǔ)存器在采樣被處理之前持續(xù)地存儲(chǔ)有限數(shù)據(jù)容量的采樣。緩沖器儲(chǔ)存器52持續(xù)地存儲(chǔ)在麥克風(fēng)48處最近接收的信號(hào),使得當(dāng)媒體采樣要使得特征在用戶命令之下被提取時(shí),處理器50可以立即開始從當(dāng)前在緩沖器儲(chǔ)存器52之內(nèi)的該部分媒體采樣中提取特征。以這一方式,可以從在先于用戶輸入命令的時(shí)間輸入到MS中的采樣的一部分或者分段中提取特征以標(biāo)識(shí)歌曲或者文件或者鏈接的建立。由于在用戶命令要求這么做之前,對(duì)于在緩沖器存儲(chǔ)器中存儲(chǔ)的信號(hào)就不進(jìn)行附加處理,所以消耗了最少的額外功率。
處理器50以及MS 26的所有部件是通過比如可充電電池56或者可更換燃料電池這樣的便攜電源來(lái)供電的。用戶接口58包括用以將來(lái)自處理器的輸出轉(zhuǎn)換成用戶可辨認(rèn)的文本消息和圖像的顯示器接口58A以及由其用戶可以向處理器50輸入命令/請(qǐng)求的用戶輸入機(jī)制58B(比如多個(gè)按鈕、在顯示器屏幕48之內(nèi)的觸摸或者壓力傳感器、或者具有存儲(chǔ)于主儲(chǔ)存器54中的語(yǔ)音識(shí)別軟件的麥克風(fēng)48)。處理器50通過開關(guān)64耦合到發(fā)送器60和接收器62,使得無(wú)法同時(shí)出現(xiàn)發(fā)送和接收。發(fā)送器60和接收器62各自耦合到天線66,該天線可以內(nèi)置或者外置于包裹處理器50的外殼。處理器也可以在第二轉(zhuǎn)換器或者揚(yáng)聲器68處向用戶提供輸出。為了接收視頻,MS 26可以包括用以向處理器50提供可視媒體采樣的攝像機(jī)70或者其它圖像捕獲設(shè)備。雖然未示出,但是攝像機(jī)70也可以向視頻緩沖器存儲(chǔ)器(未示出)提供輸入,該存儲(chǔ)器的工作方式類似于與麥克風(fēng)48相關(guān)聯(lián)的緩沖器存儲(chǔ)器52。
在圖4B中詳述了根據(jù)本發(fā)明的MS 26的用戶接口的特定方面。具體而言,顯示器接口58A提供可由用戶識(shí)別的輸出,而且可以包括對(duì)信號(hào)強(qiáng)度、鏈路類型和/或電池電壓進(jìn)行指示的狀態(tài)圖標(biāo)74。顯示器屏幕58A還顯示可以由用戶選擇的而且比如經(jīng)由加亮、陰影、改變背景等來(lái)指示的文本76和符號(hào)78。用戶輸入機(jī)制58B可以采用若干不同形式中的一個(gè)或多個(gè)形式,比如文字?jǐn)?shù)字小鍵盤80的一個(gè)鍵、導(dǎo)航按鈕82、軟鍵84或者優(yōu)選為保留用于標(biāo)識(shí)未知媒體采樣和有關(guān)動(dòng)作的專用按鈕86。下面詳述可供選擇的用戶輸入機(jī)制58B。文字?jǐn)?shù)字小鍵盤80在本領(lǐng)域中是已知的,而且主要用于將文本和數(shù)字輸入到MS26中。導(dǎo)航按鈕82操作用以將光標(biāo)或者其它指示符移到顯示器屏幕58A上的不同點(diǎn)。軟鍵84是多功能的,而且操作用以執(zhí)行在顯示器屏幕58A上通常緊鄰于相關(guān)軟鍵84顯示的命令。
與圖4B的圖示相一致,假設(shè)所示MS 26已經(jīng)接收了電子郵件,該電子郵件包括媒體采樣的數(shù)字拷貝作為附件。在這樣的實(shí)例中,用以接收媒體采樣的裝置包括移動(dòng)電話接收器62。用以接收媒體采樣的其它裝置包括麥克風(fēng)48或者攝像機(jī)70、數(shù)據(jù)線纜接受器,MS 26可以通過該接受器鏈接到PC、服務(wù)器或者從其上傳媒體采樣的類似裝置,或者用于光學(xué)鏈路(例如紅外線)的接收器、局域網(wǎng)或者用來(lái)無(wú)線下載媒體采樣的專用網(wǎng)(例如藍(lán)牙)。無(wú)論怎樣,所示電子郵件的文本76請(qǐng)求標(biāo)識(shí),而媒體文件附件作為符號(hào)78顯示在顯示器接口58A上。一旦用戶選擇媒體文件,比如通過所選符號(hào)78的陰影而在顯示器屏幕58A上所指示的媒體文件,在相關(guān)用戶輸入機(jī)制處進(jìn)行進(jìn)一步輸入就促使處理器50開始從媒體采樣中提取特征(在本例中接收的媒體采樣就是從中提取特征的數(shù)字版本)。
圖4B圖示了三種不同的用戶輸入機(jī)制,用戶可以通過該輸入機(jī)制促使處理器50從媒體采樣中提取特征。當(dāng)專用按鈕86用作相關(guān)用戶輸入機(jī)制時(shí),按壓該專用按鈕86就促使處理器50開始提取特征。替選地,可以在用戶選擇符號(hào)78時(shí)使得軟鍵84能夠起到這樣的作用(其中功能標(biāo)志符86可以顯示在顯示器屏幕58A上鄰近于相關(guān)軟鍵84的位置),當(dāng)用戶在經(jīng)由導(dǎo)航按鈕82外圍部分處的輸入來(lái)選擇符號(hào)78之后按壓導(dǎo)航按鈕82的中心部分時(shí),導(dǎo)航按鈕82可以促使處理器提取特征。軟鍵84之所以區(qū)別于專用按鈕86是因?yàn)檐涙I84允許對(duì)于媒體采樣標(biāo)識(shí)和媒體文件購(gòu)買以外的功能。雖然未描繪,但是顯示器屏幕58A的觸摸敏感部分也可以起到用戶輸入機(jī)制的作用。可以將上述任一用戶輸入機(jī)制考慮成如權(quán)利要求中所用的按鈕。與語(yǔ)音識(shí)別計(jì)算機(jī)程序指令相結(jié)合的麥克風(fēng)48也可以起到相關(guān)用戶輸入機(jī)制的作用,該輸入機(jī)制在有語(yǔ)音命令(例如“識(shí)別”)時(shí)促使處理器59從媒體采樣中提取特征,也優(yōu)選地選擇與要標(biāo)識(shí)的媒體文件對(duì)應(yīng)的符號(hào)78。
如上所述,緩沖器儲(chǔ)存器52可以運(yùn)用于MS 26之內(nèi)。在某些實(shí)施例中,促使處理器50提取特征的該同一用戶輸入還促使緩沖器52開始緩沖,其中經(jīng)由麥克風(fēng)48或者攝像機(jī)70接收媒體采樣。在輸入介質(zhì)可以是轉(zhuǎn)換器或者光電裝置(例如數(shù)據(jù)纜線、無(wú)線電子或者光學(xué)鏈路)的實(shí)施例中,當(dāng)在顯示器屏幕上選擇對(duì)應(yīng)符號(hào)78(或者是存儲(chǔ)媒體采樣的其它表示)時(shí),該輸入機(jī)制促使處理器從存儲(chǔ)于主儲(chǔ)存器或者儲(chǔ)存器媒體54中的媒體采樣中提取特征,而在沒有選擇符號(hào)78時(shí)則從轉(zhuǎn)換器處的輸入中提取特征。這就避免了用戶需要進(jìn)行多次輸入以便將處理器指引到恰當(dāng)?shù)拿襟w采樣。
優(yōu)選地,響應(yīng)于促使處理器提取一個(gè)或多個(gè)特征的同一用戶輸入,MS 26也通過無(wú)線電話鏈路28來(lái)發(fā)送具有一個(gè)或多個(gè)提取特征的消息??紤]包括網(wǎng)絡(luò)32和服務(wù)器30B、34、38、42以及數(shù)據(jù)庫(kù)36、40在內(nèi)的如上所述的整個(gè)系統(tǒng),具有提取特征的該消息被發(fā)送到識(shí)別服務(wù)服務(wù)器34的網(wǎng)絡(luò)地址(例如網(wǎng)頁(yè))。響應(yīng)于從該服務(wù)器34接收標(biāo)識(shí)媒體采樣的答復(fù)消息(例如該答復(fù)消息標(biāo)識(shí)了匹配于該媒體采樣的媒體文件),顯示器屏幕58A自動(dòng)地顯示媒體采樣的標(biāo)識(shí)符。這一標(biāo)識(shí)符優(yōu)選地直接取自于答復(fù)消息,而且可以是文本標(biāo)識(shí)符,比如歌曲標(biāo)題、音樂家/標(biāo)題組合、軌道編號(hào)和CD標(biāo)題組合、唱片發(fā)行日期、風(fēng)格、音樂家描述等??梢葬槍?duì)與音樂或者聽覺相關(guān)的媒體文件不匹配的其它標(biāo)識(shí)的媒體采樣(比如圖像采樣)來(lái)顯示類似的文本標(biāo)識(shí)符。標(biāo)識(shí)符可以替選地或者附加地包括圖像,比如唱片封面藝術(shù)、音樂家肖像、圖標(biāo)等,其中該圖標(biāo)鏈接到從媒體文件衍生的鈴音。盡管數(shù)字媒體采樣要經(jīng)由特征和服務(wù)器唯一地匹配于單個(gè)媒體文件,但是優(yōu)選但并非必要的是標(biāo)識(shí)符唯一地標(biāo)識(shí)媒體采樣。例如,如果服務(wù)器返回各自與從數(shù)字媒體采樣的每個(gè)特征相匹配的僅三個(gè)媒體文件,則用于所有這三個(gè)媒體文件的標(biāo)識(shí)符可以發(fā)送到MS 26,可能使得媒體文件本身的采樣剪輯附加到相應(yīng)標(biāo)識(shí)符,使得用戶可以收聽剪輯而且選擇他/她希望下載的一個(gè)媒體文件。替選地,服務(wù)器可以僅返回唱片封面藝術(shù)的圖標(biāo)而不是匹配于數(shù)字媒體采樣的單個(gè)媒體文件,其中該圖標(biāo)鏈接到對(duì)唱片上的每個(gè)音軌進(jìn)行購(gòu)買。
一旦在顯示器屏幕58A上顯示了標(biāo)識(shí)符,在用戶輸入機(jī)制82、84、86、48(后者用于語(yǔ)音識(shí)別)處的另一用戶輸入促使發(fā)送器發(fā)送如下消息,該消息授權(quán)購(gòu)買作為媒體采樣之基本的媒體文件的拷貝,該媒體文件正如先前描述的那樣是在答復(fù)消息中標(biāo)識(shí)的而且可能是在文件存儲(chǔ)數(shù)據(jù)庫(kù)40處存儲(chǔ)的媒體文件??梢灶A(yù)期答復(fù)消息的發(fā)送方也將包括對(duì)可以購(gòu)買媒體文件之場(chǎng)所的鏈接、購(gòu)買條款和條件、價(jià)格以及有助于無(wú)線電子購(gòu)買交易的其它信息。一旦用戶已經(jīng)在先前的交換中同意這種交易的更多一般方面,則發(fā)送方可以發(fā)送該消息的僅若干部分。用來(lái)發(fā)送這一授權(quán)消息的用戶輸入機(jī)制可以是專用按鈕86或者軟鍵84,其中相關(guān)按鈕86、84的功能在答復(fù)消息的接收和/或標(biāo)識(shí)符的顯示之時(shí)自動(dòng)地改變。以這一方式,相關(guān)按鈕86、84激勵(lì)至少兩個(gè)功能提取特征(以及優(yōu)選地發(fā)送它們)和發(fā)送對(duì)購(gòu)買標(biāo)識(shí)媒體文件之拷貝的授權(quán)。當(dāng)利用專用按鈕86時(shí),優(yōu)選地將它的功能僅保留用于媒體采樣的標(biāo)識(shí)(例如特征提取和發(fā)送)和媒體文件的購(gòu)買。專用按鈕之所以優(yōu)選是因?yàn)橛脩魺o(wú)需進(jìn)行多次輸入以便將軟鍵84或者導(dǎo)航按鈕82的當(dāng)前功能設(shè)置為采樣標(biāo)識(shí)。這是因?yàn)閷?shí)時(shí)聽到的任何未標(biāo)識(shí)的媒體采樣(例如經(jīng)由麥克風(fēng)輸入的通過廣播無(wú)線電而聽到的歌曲)就其本性而言是轉(zhuǎn)瞬即逝的。這樣的專用按鈕86還可以包括用以標(biāo)識(shí)它的有限功能的永久標(biāo)記90,該標(biāo)記是在按鈕本身上或者是在MS 26的外殼上位于鄰近于專用按鈕86的位置處。
優(yōu)選地,授權(quán)消息包括媒體文件的標(biāo)識(shí)符(該標(biāo)識(shí)符可以僅僅是在答復(fù)消息中接收的在簽名數(shù)據(jù)庫(kù)36或者儲(chǔ)存數(shù)據(jù)庫(kù)40中的地址)和對(duì)借記或者貸記比如可能作為信用卡或者借記卡之基礎(chǔ)的財(cái)務(wù)賬戶的授權(quán)。實(shí)現(xiàn)購(gòu)買交易所必需的賬戶細(xì)節(jié)(例如信用卡號(hào)、到期、計(jì)費(fèi)地址等)可以在授權(quán)消息之內(nèi)或者存儲(chǔ)于服務(wù)器42處并且通過在授權(quán)消息中包含的安全代碼來(lái)取回。優(yōu)選地,授權(quán)消息授權(quán)立即將標(biāo)識(shí)的媒體文件下載到MS 26,不過該授權(quán)消息(以及它的起始用戶輸入)不必立即在接收答復(fù)消息之后就啟動(dòng)答復(fù)消息和文本標(biāo)識(shí)符可以由用戶存儲(chǔ)于主儲(chǔ)存器52中,比如存儲(chǔ)的電子郵件,并且為媒體文件的稍后購(gòu)買而加以取回。
圖5是對(duì)于在MS 26處緩沖輸入時(shí)獲得的優(yōu)點(diǎn)進(jìn)行描繪的時(shí)序圖。在開始502處開始在MS 26處接收媒體采樣501。在該開始502處用戶開始收聽,而且在確定它是他/她想要其拷貝的歌曲或者文件之后,用戶在請(qǐng)求時(shí)間504例如按壓專用識(shí)別按鈕86。假設(shè)對(duì)于MS 26而言需要最少的(時(shí)間有限的)媒體采樣ΔT以執(zhí)行它的預(yù)處理。這并不是處理時(shí)間而是為了提取用來(lái)標(biāo)識(shí)整個(gè)歌曲或者文件的足夠特征而必需的歌曲量(例如十秒)。當(dāng)利用了緩沖器52時(shí),ΔT開始于先于用戶請(qǐng)求時(shí)間504的時(shí)間506,而且將必不可少的最少采樣時(shí)間擴(kuò)展到緩沖采樣結(jié)束時(shí)間508。在沒有利用緩沖器時(shí),可以捕獲媒體采樣的最早時(shí)間就在請(qǐng)求時(shí)間504。必不可少的最少采樣時(shí)間則必須結(jié)束510于遲于緩沖采樣結(jié)束時(shí)間508的時(shí)間。取決于MS 26對(duì)媒體采樣24的緩沖分段進(jìn)行處理所花費(fèi)的時(shí)間量,兩個(gè)結(jié)束時(shí)間508、510之差512可以與媒體采樣開始時(shí)間506、504之差一般大。由于MS 26優(yōu)選地從它發(fā)送預(yù)處理特征和接收答復(fù)消息起維持連續(xù)的無(wú)線鏈路28,所以該差512僅能通過減少延遲來(lái)增強(qiáng)用戶的體驗(yàn)。
總而言之,本發(fā)明包括一種用戶接口和移動(dòng)臺(tái),該用戶接口和移動(dòng)臺(tái)特別地適合于執(zhí)行從輸入媒體采樣中提取特征,無(wú)論該輸入是模擬的還是數(shù)字的。所具有的新穎功能在于媒體采樣的標(biāo)識(shí)布置于MS26的單個(gè)按鈕上,無(wú)論是專用鍵86還是非專用鍵84、82。按壓該按鈕促使在MS 26處進(jìn)行特征提取和發(fā)送,而在接收答復(fù)消息時(shí)自動(dòng)顯示作為(在前者中未標(biāo)識(shí)的)媒體采樣之基礎(chǔ)的媒體文件的文本標(biāo)識(shí)符。另外,一旦接收標(biāo)識(shí)媒體文件的答復(fù)消息而且顯示文本標(biāo)識(shí)符,同一或者單獨(dú)的按鈕就可以用來(lái)實(shí)現(xiàn)媒體文件的購(gòu)買。
盡管已經(jīng)圖示和描述了當(dāng)前被認(rèn)為是請(qǐng)求保護(hù)的發(fā)明的優(yōu)選實(shí)施例的內(nèi)容,但是將理解到許多變化和改型可以由本領(lǐng)域技術(shù)人員想到。意圖在于所附權(quán)利要求涵蓋落入于請(qǐng)求保護(hù)的本發(fā)明的精神和范圍之內(nèi)的所有這些變化和改型。
權(quán)利要求
1.一種移動(dòng)臺(tái),包括處理器;以及用戶輸入機(jī)制,可操作用以促使所述處理器從數(shù)字媒體采樣中提取至少一個(gè)特征,所述特征描述了所述媒體采樣的內(nèi)容的標(biāo)識(shí)。
2.如權(quán)利要求1所述移動(dòng)臺(tái),其中所述用戶輸入機(jī)制能夠在不同時(shí)間啟動(dòng)不同功能,一個(gè)這樣的功能是促使所述處理器提取所述至少一個(gè)特征。
3.如權(quán)利要求1所述的移動(dòng)臺(tái),其中所述用戶輸入機(jī)制包括專用按鈕,所述專用按鈕具有促使所述處理器提取所述至少一個(gè)特征的單一功能。
4.如權(quán)利要求1所述的移動(dòng)臺(tái),還包括耦合于所述處理器的發(fā)送器,其中在所述輸入機(jī)制處的單個(gè)用戶輸入用于促使所述處理器提取所述至少一個(gè)特征、促使所述處理器啟動(dòng)通向網(wǎng)絡(luò)的無(wú)線鏈路、以及促使所述發(fā)送器通過所述啟動(dòng)的無(wú)線鏈路來(lái)發(fā)送所述至少一個(gè)特征。
5.如權(quán)利要求4所述的移動(dòng)臺(tái),其中所述單個(gè)用戶輸入促使所述發(fā)送器發(fā)送包括從所述數(shù)字媒體采樣中提取的多個(gè)特征的消息,其中所述消息帶有據(jù)之重建所述數(shù)字媒體采樣的非充分信息。
6.如權(quán)利要求4所述的移動(dòng)臺(tái),其中所述鏈路通向音樂識(shí)別服務(wù)的網(wǎng)絡(luò)地址,所述網(wǎng)絡(luò)地址存儲(chǔ)于所述移動(dòng)臺(tái)的存儲(chǔ)介質(zhì)中。
7.如權(quán)利要求4所述的移動(dòng)臺(tái),還包括通過所述處理器相互耦合的接收器和顯示器接口,所述顯示器接口用于響應(yīng)于在所述接收器處通過所述鏈路從所述網(wǎng)絡(luò)接收答復(fù)消息而顯示所述媒體采樣的標(biāo)識(shí)符,所述答復(fù)消息是響應(yīng)于所述發(fā)送的至少一個(gè)提取特征的。
8.如權(quán)利要求7所述的移動(dòng)臺(tái),其中所述標(biāo)識(shí)符是文本標(biāo)識(shí)符。
9.如權(quán)利要求7所述的移動(dòng)臺(tái),其中所述用戶輸入機(jī)制包括第一用戶輸入機(jī)制,所述移動(dòng)臺(tái)還包括由用戶可以用來(lái)通過所述鏈路發(fā)送授權(quán)消息的第二用戶輸入機(jī)制,所述授權(quán)消息針對(duì)于購(gòu)買在所述答復(fù)消息中引用的媒體文件的拷貝。
10.如權(quán)利要求9所述的移動(dòng)臺(tái),其中所述授權(quán)消息是對(duì)于通過所述鏈路立即將所述媒體文件的所述拷貝下載到所述移動(dòng)臺(tái)的授權(quán),所述授權(quán)是響應(yīng)于所述答復(fù)消息而自動(dòng)編譯的。
11.如權(quán)利要求9所述的移動(dòng)臺(tái),其中所述第一用戶輸入機(jī)制和所述第二用戶輸入機(jī)制包括分別在不同時(shí)間實(shí)現(xiàn)第一功能和第二功能的單個(gè)輸入機(jī)制。
12.如權(quán)利要求11所述的移動(dòng)臺(tái),其中所述單個(gè)輸入機(jī)制包括在接收所述答復(fù)消息之后從所述第一功能變?yōu)樗龅诙δ艿陌粹o。
13.如權(quán)利要求11所述的移動(dòng)臺(tái),其中所述單個(gè)按鈕能夠僅實(shí)現(xiàn)所述第一功能和所述第二功能。
14.如權(quán)利要求1所述的移動(dòng)臺(tái),還包括存儲(chǔ)介質(zhì)和可以用來(lái)對(duì)存儲(chǔ)于所述存儲(chǔ)介質(zhì)中的數(shù)字媒體采樣進(jìn)行選擇的顯示器接口,所述用戶輸入機(jī)制用于促使所述處理器從存儲(chǔ)于所述存儲(chǔ)介質(zhì)中的數(shù)字媒體采樣中提取至少一個(gè)特征。
15.如權(quán)利要求1所述的移動(dòng)臺(tái),其中所述用以接收媒體采樣的裝置包括用以接收從中導(dǎo)出所述數(shù)字媒體采樣的模擬媒體采樣的轉(zhuǎn)換器,所述處理器從所述數(shù)字媒體采樣中提取所述至少一個(gè)特征。
16.如權(quán)利要求15所述的移動(dòng)臺(tái),還包括設(shè)置于所述轉(zhuǎn)換器與所述處理器之間的緩沖器存儲(chǔ)器,用以暫時(shí)地存儲(chǔ)所述數(shù)字媒體采樣的至少部分,所述用戶輸入機(jī)制用于促使所述處理器從暫時(shí)存儲(chǔ)于所述緩沖器存儲(chǔ)器中的所述至少的部分中提取至少一個(gè)特征。
17.如權(quán)利要求16所述的移動(dòng)臺(tái),其中所述用戶輸入機(jī)制用于促使所述緩沖器執(zhí)行所述暫時(shí)存儲(chǔ)和促使所述處理器在有單個(gè)用戶輸入時(shí)執(zhí)行所述提取。
18.如權(quán)利要求1所述的移動(dòng)臺(tái),還包括用以接收所述處理器從中提取所述至少一個(gè)特征的所述數(shù)字媒體采樣的裝置,以及用以顯示與所述接收的數(shù)字媒體采樣對(duì)應(yīng)的符號(hào)的顯示器接口。
19.如權(quán)利要求18所述的移動(dòng)臺(tái),還包括用以接收模擬媒體采樣和將所述模擬媒體采樣轉(zhuǎn)換成第二數(shù)字媒體采樣的轉(zhuǎn)換器,其中所述用戶輸入機(jī)制用于在所述顯示符號(hào)由所述移動(dòng)臺(tái)的用戶選擇時(shí)促使所述處理器從所述接收的數(shù)字媒體采樣中提取至少一個(gè)特征,而在沒有顯示符號(hào)由用戶選擇時(shí)促使所述處理器從所述第二數(shù)字媒體采樣中提取至少一個(gè)特征。
20.一種便攜電子設(shè)備的用戶接口,包括用戶輸入機(jī)制,能夠在所述用戶輸入機(jī)制處有單個(gè)用戶輸入時(shí)促使所述設(shè)備內(nèi)部的處理器從數(shù)字媒體采樣中提取多個(gè)特征以及促使所述多個(gè)提取特征發(fā)送到所述設(shè)備外部;以及顯示器屏幕,用以自動(dòng)地響應(yīng)于所述設(shè)備接收對(duì)發(fā)送的所述多個(gè)提取特征的答復(fù)消息而顯示具有與所述多個(gè)提取特征準(zhǔn)確匹配的特征的媒體文件的文本標(biāo)識(shí)符,其中所述多個(gè)提取特征描述了所述媒體采樣的內(nèi)容的標(biāo)識(shí)。
21.如權(quán)利要求20所述的用戶接口,其中所述用戶輸入機(jī)制還能夠在接收所述答復(fù)消息之后促使授權(quán)消息發(fā)送到所述設(shè)備外部,所述授權(quán)消息包括在所述答復(fù)消息中接收的媒體文件標(biāo)識(shí)符;以及對(duì)于將所述媒體文件的拷貝下載到所述設(shè)備的請(qǐng)求。
22.如權(quán)利要求20所述的用戶接口,其中無(wú)法從中重建所述數(shù)字媒體采樣的所述多個(gè)提取特征是在消息中發(fā)送的。
23.一種移動(dòng)臺(tái),包括用于接收媒體采樣的輸入裝置;從所述媒體采樣的數(shù)字版本中提取至少一個(gè)特征的處理裝置,所述特征描述了所述媒體采樣的內(nèi)容的標(biāo)識(shí);以及用于促使所述處理裝置執(zhí)行所述提取的用戶輸入裝置。
24.如權(quán)利要求23所述的移動(dòng)臺(tái),其中所述處理裝置包括計(jì)算機(jī)處理器。
25.如權(quán)利要求23所述的移動(dòng)臺(tái),還包括發(fā)送裝置,而所述用戶輸入裝置還用于促使所述發(fā)送裝置自動(dòng)地在所述處理裝置提取所述至少一個(gè)特征之后發(fā)送包括所述至少一個(gè)提取特征的消息。
26.一種機(jī)器可讀指令的程序,有形地實(shí)施于在移動(dòng)臺(tái)之內(nèi)的信息承載介質(zhì)上,而且可由數(shù)字?jǐn)?shù)據(jù)處理器執(zhí)行用來(lái)進(jìn)行針對(duì)分析媒體采樣的動(dòng)作,所述動(dòng)作包括響應(yīng)于用戶輸入,從媒體采樣的數(shù)字版本中提取特征以及使得發(fā)送器無(wú)線地發(fā)送所述提取特征。
27.如權(quán)利要求26所述的機(jī)器可讀指令的程序,其中響應(yīng)于所述同一用戶輸入來(lái)提取所述特征和促使所述發(fā)送器無(wú)線地進(jìn)行發(fā)送。
全文摘要
一種移動(dòng)臺(tái)具有處理器和比如按鈕這樣的用戶輸入機(jī)制,該用戶輸入機(jī)制可用于促使處理器從數(shù)字媒體采樣中提取至少一個(gè)特征。比如譜質(zhì)心這樣的特征描述了媒體采樣的內(nèi)容的標(biāo)識(shí)。優(yōu)選地,促使特征提取的同一用戶輸入也促使發(fā)送器建立鏈路和將消息發(fā)送到網(wǎng)絡(luò)地址,該消息具有無(wú)法從中重建數(shù)字媒體采樣的多個(gè)提取特征。當(dāng)答復(fù)消息標(biāo)識(shí)與媒體采樣相匹配的媒體文件時(shí),在同一或者不同按鈕處的另一用戶輸入促使發(fā)送授權(quán)消息,使得在答復(fù)消息中標(biāo)識(shí)的而且具有與多個(gè)提取和發(fā)送特征準(zhǔn)確匹配的特征的媒體文件的拷貝被下載到移動(dòng)臺(tái)。
文檔編號(hào)H04M1/725GK1957367SQ200580016283
公開日2007年5月2日 申請(qǐng)日期2005年3月22日 優(yōu)先權(quán)日2004年3月26日
發(fā)明者托尼·科普拉, 米克科·馬基帕阿, 莫里·瓦納南 申請(qǐng)人:諾基亞公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1