專利名稱:通過單個媒體上的嵌入內(nèi)容學(xué)習(xí)語言的系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及媒體管理和語言學(xué)習(xí)工具。具體來說,本發(fā)明涉及一組媒體管理工具,它們采用與娛樂內(nèi)容關(guān)聯(lián)的音頻、視頻和文本來提供用于訪問與音頻和/或視頻內(nèi)容關(guān)聯(lián)的文本和信息的增強服務(wù),以及控制對內(nèi)容的訪問。
背景諸如CD、DVD、盒式錄音磁帶、錄像帶及類似媒體之類的音頻和/或視頻內(nèi)容提供諸如音樂、電影、電視節(jié)目、電臺節(jié)目和類似內(nèi)容的內(nèi)容。大部分媒體的重放限制為呈現(xiàn)媒體上的錄制素材。例如,聽音樂CD的用戶可能使用小型盤播放器或類似裝置來聽錄制的音頻。用戶的選項通常限制為選擇曲目、快退、快進和暫停。
大部分媒體素材是為娛樂而制作的。這些素材不是設(shè)計成有助于學(xué)習(xí)素材中所使用的語言。這種娛樂素材不是初級和中級學(xué)習(xí)者易于理解的,因為這些素材節(jié)奏過快,并且充滿了慣用語、俚語和不規(guī)范的句子結(jié)構(gòu)。
這些娛樂素材還可能包含不適合部分觀眾、如兒童的某些素材。父母必須直接監(jiān)督或限制觀看或聽這類素材。
附圖簡介在附圖的各圖中,作為實例而不是限制來說明本發(fā)明的實施例,附圖中,相同的參考標(biāo)號表示相似的元件。應(yīng)當(dāng)注意,本公開中,“一個”實施例的不同說法不一定表示同一個實施例,這類說法表示至少一個。
圖1是音頻和/或視頻重放系統(tǒng)的示意圖。
圖2A是重放界面的圖示。
圖2B是音頻播放器的圖示。
圖3是音頻和/或視頻重放速度調(diào)整系統(tǒng)的流程圖。
圖4是音頻和/或視頻重放擴充系統(tǒng)的流程圖。
圖5是伴隨源格式的示意圖。
圖6是內(nèi)容控制系統(tǒng)的流程圖。
圖7是內(nèi)容控制界面的圖示。
圖8是推理機的流程圖。
圖9是存儲器暫停功能的流程圖。
詳細說明在一個實施例中,一組音頻和/或視頻重放增強特征包括便攜式媒體上存儲的或者通過網(wǎng)絡(luò)或廣播可訪問的原始內(nèi)容的附加內(nèi)容。增強特征可包括語言學(xué)習(xí)、內(nèi)容控制、使附加內(nèi)容適應(yīng)用戶需求的推理機以及重放位置保存功能。這些增強特征可與諸如音樂、電影、電視節(jié)目、有聲書、小應(yīng)用程序、解說詞和類似內(nèi)容之類的娛樂內(nèi)容配合使用。娛樂內(nèi)容可以是可被動播放的。本文所使用的術(shù)語“可被動播放媒體”或“可被動播放內(nèi)容”表示在典型重放過程中不需要用戶與內(nèi)容交互的內(nèi)容。例如,音樂CD可以是可被動播放的,因為它在重放過程中不需要用戶交互,除非用戶想要跳過某個聲跡或停止重放。這些特征可利用附加內(nèi)容,其中包括伴隨文件中所存儲的數(shù)據(jù)。伴隨文件可存儲在相同媒體、分開的媒體中,或者作為娛樂內(nèi)容利用相同媒體或不同媒體來分發(fā)。
在一個實施例中,增強特征可與交互音頻和/或視頻語言學(xué)習(xí)系統(tǒng)配合使用,該系統(tǒng)包括播放器軟件應(yīng)用程序,允許用戶播放CD、DVD或者包含娛樂素材(例如音樂或故事片)的類似音頻和/或視頻媒體,其中具有幫助語言學(xué)習(xí)的擴充特征和附加內(nèi)容。本文所用的“或者”用于表示具有它的非排他含義,如果“或者”用作排他含義,則使用“或者…或者…”結(jié)構(gòu)。擴充特征和附加內(nèi)容可包括要學(xué)習(xí)的語言的轉(zhuǎn)錄,諸如詞典、語法信息、語音發(fā)音信息及類似的語言相關(guān)信息的語言學(xué)習(xí)工具。播放器應(yīng)用系統(tǒng)采用包含附加內(nèi)容以及對擴充特征的支持的伴隨文件,它可與關(guān)聯(lián)娛樂素材分開存儲或者與其結(jié)合。伴隨文件包含創(chuàng)建可適合語言學(xué)習(xí)的娛樂素材的擴充特征所需的信息。
圖1說明使用戶能夠利用本地機器109和顯示裝置103觀看或聽媒體101中存儲的音頻和/或視頻內(nèi)容的系統(tǒng)100。本地機器109可以是臺式計算機或膝上型計算機、因特網(wǎng)設(shè)備、控制臺系統(tǒng)(例如MicrosoftCorporation制造的Xbox)、DVD播放機、專用裝置或類似裝置。結(jié)合了增強特征的音頻和/或視頻播放器可從連接到本地機器109(例如在DVD、CD、硬盤驅(qū)動器或類似媒體上)的隨機存取或順序存儲裝置105或者經(jīng)由遠程服務(wù)器135訪問和播放音頻和/或視頻內(nèi)容,以及將其中的音頻和/或視頻內(nèi)容與伴隨文件131關(guān)聯(lián),該文件提供附加內(nèi)容來擴充音頻和/或視頻內(nèi)容。
在一個實施例中,伴隨文件131可獨立于音頻和/或視頻內(nèi)容或者與其結(jié)合,并且可源自分開的媒體、同一媒體或類似配置。這個系統(tǒng)可用于使用現(xiàn)成的CD、DVD和類似媒體來幫助語言學(xué)習(xí)。在各種實施例中,存儲音頻、視頻和類似內(nèi)容的隨機存取存儲媒體可以是CD、DVD、磁盤、光存儲媒體、本地硬盤文件、外圍設(shè)備、固態(tài)存儲媒體、網(wǎng)絡(luò)連接的存儲資源或因特網(wǎng)連接的存儲資源其中之一。在另一個實施例中,音頻和/或視頻內(nèi)容可經(jīng)由廣播、流式傳輸或類似方法由用戶用于重放。伴隨文件131可駐留在分開的存儲媒體中、與娛樂內(nèi)容相同的媒體101中,或者可采用娛樂媒體來分發(fā),例如通過諸如FTP、流式媒體、廣播媒體之類的網(wǎng)絡(luò)連接或類似的分發(fā)方法進行。音頻和/或視頻內(nèi)容、附加內(nèi)容和伴隨文件也可以臨時保留在相同或不同的媒體類型中以便于重放。例如,音頻內(nèi)容可以是現(xiàn)成的CD 101,以及附加內(nèi)容可位于該CD上,或者附加內(nèi)容可位于分開的CD上。來自CD 101的音頻內(nèi)容以及附加內(nèi)容可以存儲或緩存在本地機器109中,以便于增強特征的重放速度或響應(yīng)性。在另一個實施例中,內(nèi)容可包含視頻和/或音頻、如DVD或類似媒體。
在一個實施例中,伴隨文件131可在媒體制作時或者在媒體銷售之前放置在與音頻和/或視頻內(nèi)容相同的媒體上。例如,電影制片廠或分銷商可制作和銷售包含影片以及那部影片的適當(dāng)伴隨文件131的DVD。在一個實施例中,這個伴隨文件131或附加內(nèi)容可以“被解鎖”并且不對用戶通過播放器訪問設(shè)置阻礙。在另一個實施例中,伴隨文件131或附加內(nèi)容可“被鎖定”或者在限制情況下可訪問。訪問伴隨文件131或附加內(nèi)容可能要求密碼或其它安全機制。訪問伴隨文件131或附加內(nèi)容可能要求通過網(wǎng)絡(luò)到服務(wù)器或類似關(guān)守的連接。在一個實施例中,獲取密碼以訪問全部或部分附加內(nèi)容可能要求對制片廠或分銷商的附加付費。
在一個實施例中,顯示裝置103可以是基于陰極射線管的裝置、液晶顯示器、等離子體屏幕、數(shù)字投影系統(tǒng)或者能夠與本地機器109交互的類似裝置。本地機器109可包括可移動媒體讀取裝置105,以便訪問媒體101的音頻和/或視頻內(nèi)容。讀取裝置105可以是CD、DVD、VCD、DiVX或類似驅(qū)動器。在一個實施例中,本地機器109包括存儲系統(tǒng)107,用于存儲播放器軟件、解碼/視頻軟件、伴隨源數(shù)據(jù)文件131、本地語言庫軟件123、防盜版軟件121、用戶偏好和跟蹤軟件119以及與播放器軟件配合使用的其它資源文件。本地驅(qū)動器107也可存儲數(shù)據(jù)和應(yīng)用程序,其中包括內(nèi)容控制151、位置跟蹤153和推理機155。本地驅(qū)動器107也可以是存儲裝置,例如ROM、RAM或類似裝置?;蛘呙襟w101或者存儲系統(tǒng)107可以是CD、DVD、磁盤、硬盤、外圍設(shè)備、固態(tài)存儲媒體、網(wǎng)絡(luò)連接的存儲媒體或因特網(wǎng)連接的裝置。在一個實施例中,本地機器109包括與遙控器115通信的無線通信裝置111。遙控器115可產(chǎn)生播放器軟件的輸入,以便訪問語言信息以及調(diào)整視頻內(nèi)容的重放。通信裝置117可將本地機器109連接到網(wǎng)絡(luò)127和服務(wù)器135。
在一個實施例中,防盜版軟件121包括一個系統(tǒng),其中音頻和/或視頻內(nèi)容被唯一標(biāo)識以確保用戶具有那個內(nèi)容的合法副本。在一個實施例中,伴隨文件131或其中某個部分被加密,或者在檢驗用戶具有訪問此文件的適當(dāng)許可(例如,音頻和/或視頻內(nèi)容的合法副本,向語言學(xué)習(xí)服務(wù)登記及類似標(biāo)準(zhǔn))之前是不可訪問的。在一個實施例中,防盜版軟件121管理音頻和/或視頻內(nèi)容和伴隨文件131的本地副本,以便確保單個本地副本在授權(quán)時被使用,以及當(dāng)授權(quán)丟失或者授權(quán)媒體從系統(tǒng)100中移去時被刪除。在一個實施例中,盜版軟件121確定音頻和/或視頻內(nèi)容的授權(quán)副本是否通過在媒體101上對它進行訪問而成為可用的。在一個實施例中,防盜版軟件可強迫使用網(wǎng)絡(luò)連接,以便允許對附加內(nèi)容訪問以及驗證內(nèi)容的使用。如果媒體101不可用,則對本地副本的訪問可受到限制或被排除。
在一個實施例中,服務(wù)器135可為播放器軟件提供對全局語言庫軟件和數(shù)據(jù)庫113、基于萬維網(wǎng)的可下載內(nèi)容、廣播和流式內(nèi)容以及類似資源的訪問。在一個實施例中,播放器軟件能夠瀏覽基于萬維網(wǎng)的內(nèi)容,支持聊天室以及服務(wù)器135所提供的其它資源。
圖2A是用于播放聲跡、MP3和類似格式的播放器軟件的示范說明。類似的播放器界面可用于其它音頻和/或視頻數(shù)據(jù)、如影片和類似內(nèi)容。在一個實施例中,音頻和/或視頻內(nèi)容從例如本地驅(qū)動器105中的CD或DVD之類的媒體101獲取,以及伴隨文件131從例如本地硬盤107之類的分開的媒體獲取。在另一個實施例中,伴隨文件131位于媒體101中。在又一個實施例中,音頻和/或視頻內(nèi)容以及伴隨文件131可通過網(wǎng)絡(luò)經(jīng)由文件傳輸協(xié)議、流式傳輸或類似技術(shù)來獲取。因此,例如,在一個實施例中,原始音頻內(nèi)容、如MP3文件可通過因特網(wǎng)來獲取,以及附加內(nèi)容文件(伴隨文件)也可通過因特網(wǎng)來獲取。音頻和/或視頻內(nèi)容可通過網(wǎng)絡(luò)從與伴隨文件131相同的源或不同的源來訪問。播放器軟件在重放過程中將伴隨文件131與音頻和/或視頻內(nèi)容關(guān)聯(lián),從而擴充音頻和/或視頻內(nèi)容的重放。播放器軟件界面可包括窗口或觀看區(qū)域201,用于顯示例如聲跡的歌詞或單詞等附加內(nèi)容。單詞在被講述時可被突出顯示。單詞的突出顯示被認(rèn)為包括強調(diào)單詞文本的一部分或文本周圍的觀看區(qū)域的任何可視機制。這可包括例如改變當(dāng)前單詞或背景的顏色、當(dāng)單詞被講述時加下劃線、當(dāng)單詞被講述時加上陰影、對所講述單詞加粗或者類似的技術(shù)。突出顯示可伴隨到當(dāng)前單詞的指針211。在另一個實施例中,使用指針211而沒有突出顯示。下面詳細論述從伴隨文件131導(dǎo)出的其它附加內(nèi)容、如序言和后文素材。
在一個實施例中,伴隨文件131通常包括可在重放過程中用來擴充音頻和/或視頻內(nèi)容的附加內(nèi)容。附加內(nèi)容可沒有限制地包括在與所講述的幀或時間點關(guān)聯(lián)的音頻和/或視頻內(nèi)容中所講述單詞的索引、跟蹤音頻和/或視頻內(nèi)容的劇本的一種或多種語言的文本、用于音頻和/或視頻內(nèi)容中的帶有或沒有發(fā)音輔助的任何或全部單詞的定義、用于音頻和/或視頻內(nèi)容中的帶有或沒有定義的慣用語、單詞和/或慣用語的用法示例、現(xiàn)有說明字幕的翻譯及類似內(nèi)容其中的任一項或全部。所顯示文本可包括說明字幕、對話氣球以及類似的可視顯示。發(fā)音輔助可包括例如傳統(tǒng)詞典中所見的基于文本的發(fā)音音標(biāo)(例如語音拼寫習(xí)慣的使用),或者先前錄制或由計算機程序生成的“正確”發(fā)音單詞的音頻。
在一個實施例中,如果音頻和/或視頻內(nèi)容的文本形式存在,則可直接處理它以準(zhǔn)備伴隨文件131。在另一個實施例中,伴隨文件的劇本可由自動過程產(chǎn)生。系統(tǒng)可利用光學(xué)字符識別實用程序來使用與視頻內(nèi)容關(guān)聯(lián)的說明字幕獲取粗略劇本,或者對于聲跡采用語音識別實用程序。翻譯實用程序則可用于將劇本翻譯成預(yù)期語言。然后,人類編者可審閱輸出并糾正錯誤。在另一個實施例中,伴隨文件131的劇本可由審閱原始內(nèi)容的編者人工預(yù)備。
在一個實施例中,人類編者可采用音節(jié)檢測軟件應(yīng)用程序來審閱內(nèi)容,并將單詞的文本與在其中講述它們的音頻和/或視頻內(nèi)容段中的點相關(guān)。本文所用的術(shù)語“段”表示兩個定義點之間的內(nèi)容的一部分。在另一個實施例中,系統(tǒng)可通過估計在某一段中所講述的單詞的近似數(shù)量并在段的時間長度上分配劇本中的單詞,來嘗試預(yù)備將與音頻和/或視頻內(nèi)容對齊的劇本。在一個實施例中,以這種方式預(yù)先對齊的文本的單詞可經(jīng)過審閱,從而更精確地將文本的單詞與音頻和/或視頻內(nèi)容對齊。在一個實施例中,搜索單詞含義、慣用語和類似數(shù)據(jù)的數(shù)據(jù)庫,以便分類和檢查所產(chǎn)生的劇本。
在一個實施例中,播放器軟件提供圖形用戶界面(GUI),從而允許用戶更深入地掌握附加內(nèi)容。例如,用戶能夠單擊字幕中的某個單詞,并從伴隨文件131的詞典中獲得該單詞的定義。示范實施例包括窗口203,用于顯示與音頻和/或視頻內(nèi)容相關(guān)的附加內(nèi)容和轉(zhuǎn)錄。還可配備導(dǎo)航裝置,使得例如單擊詞典中的某個單詞將使用戶轉(zhuǎn)到音頻和/或視頻內(nèi)容中單詞被使用的位置。在一個實施例中,播放器軟件可自動識別可用的媒體,并訪問或檢索諸如藝術(shù)家名稱、發(fā)行商、章節(jié)或聲跡信息及類似數(shù)據(jù)之類的相關(guān)數(shù)據(jù)。播放器可允許用戶選擇要與播放器結(jié)合使用的附加內(nèi)容的方法或位置。
在一個實施例中,GUI還可為用戶提供重復(fù)所觀看或收聽的內(nèi)容的任意部分的能力。例如,可提供軟按鈕,從而引起前一行、先前的歌詞、對話交流、場景或音頻和/或視頻內(nèi)容的相似段的重復(fù)。音頻和/或視頻內(nèi)容以及附加內(nèi)容的隨機存取性質(zhì)允許用戶指定關(guān)于要觀看或收聽音頻和/或視頻內(nèi)容及關(guān)聯(lián)附加內(nèi)容的什么部分到任意粒度等級。這樣,用戶可選擇觀看或收聽場景、對話交流或者只是音頻和/或視頻內(nèi)容中的一行。以任意粒度重復(fù)的能力增強了學(xué)習(xí)體驗。GUI還可為用戶提供控制音頻和/或視頻的速度和/或音調(diào)以便于理解口語的能力。速度可以通過在保持所講述的實際單詞的正常音調(diào)和速度的同時在單詞之間插入間隔來調(diào)整。
在一個實施例中,播放器支持全屏幕和窗口模式。在全屏幕模式中,播放器根據(jù)音頻和/或視頻內(nèi)容的尺寸限制、如縱橫比以及顯示裝置的限制來顯示音頻和/或視頻內(nèi)容。在一個實施例中,GUI包括一組圖標(biāo)或?qū)Ш竭x項213。在一個實施例中,圖標(biāo)或?qū)Ш竭x項213允許用戶通過使用諸如鼠標(biāo)、鍵盤、遙控器或類似裝置的外圍輸入裝置來訪問附加語言內(nèi)容。在一個實施例中,重放選項可根據(jù)用戶的要求被啟用或禁用。
在一個實施例中,圖標(biāo)和導(dǎo)航選項將音頻和/或視頻內(nèi)容鏈接到詞典、目錄和指南以及類似的語言參考和導(dǎo)航工具。這些鏈接可使播放器顯示專用屏幕,向用戶顯示相干內(nèi)容。在一個實施例中,圖標(biāo)或?qū)Ш竭x項鏈接到解釋屏幕,它以多種語言列出一段音頻和/或視頻內(nèi)容中的慣用語。通過圖標(biāo)和導(dǎo)航選項213可訪問的專用屏幕還可顯示與單詞定義、俚語、語法、發(fā)音、語源和語音訓(xùn)練有關(guān)的信息以及訪問菜單、人物信息菜單及類似特征。在另一個實施例中,備選導(dǎo)航技術(shù)用來訪問特殊內(nèi)容,例如熱鍵、超鏈接或類似技術(shù)及其組合。在一個實施例中,當(dāng)訪問專用屏幕時,音頻和/或視頻內(nèi)容被最小化或者減小尺寸,以便在顯示器中創(chuàng)建空間來觀看或收聽附加內(nèi)容,同時在適當(dāng)時候仍然允許觀看或收聽音頻和/或視頻重放。當(dāng)用戶完成審閱專用屏幕的素材時,音頻和/或視頻內(nèi)容用作返回到全屏幕模式的圖標(biāo)或選項。在另一個實施例中,當(dāng)顯示專用內(nèi)容時沒有顯示音頻和/或視頻內(nèi)容。
在一個實施例中,單詞和/或慣用語的詞典可在通過圖標(biāo)、導(dǎo)航選項或者直接突出顯示或選取所顯示文本可訪問的專用屏幕上顯示。詞典數(shù)據(jù)可以是音頻和/或視頻內(nèi)容特定的。例如,它可包括特定的音頻和/或視頻內(nèi)容中使用的單詞或慣用語的定義而不是該單詞或慣用語的全部定義。詞典數(shù)據(jù)可包含不同于音頻和/或視頻內(nèi)容的語言的某種語言的定義及相關(guān)單詞或慣用語。詞典數(shù)據(jù)可包括通用的或者只有特定音頻和/或視頻內(nèi)容才有的其它受關(guān)注數(shù)據(jù)。受關(guān)注數(shù)據(jù)可包括單詞和/或慣用語到另一種語言的翻譯、單詞的用法示例、慣用語與單詞之間的關(guān)聯(lián)、慣用語的定義、慣用語到另一種語言的翻譯、慣用語的用法示例、音頻和/或視頻內(nèi)容中講述單詞的人物、在其中講述單詞或慣用語的場景的標(biāo)識符、與在其中講述單詞或慣用語的場景相關(guān)的主題或者類似信息。這種數(shù)據(jù)可保持在數(shù)據(jù)庫、平面文件或伴隨源文件段中,其中具有關(guān)聯(lián)的鏈接以允許用戶從數(shù)據(jù)庫中的內(nèi)容直接跳轉(zhuǎn)到音頻和/或視頻內(nèi)容的相干部分。
播放器可具有與被播放音頻和/或視頻內(nèi)容的類型有關(guān)的附加特征。在示范實施例中,播放器可標(biāo)識帶有字幕205的音頻和/或視頻作品的標(biāo)題或部分(例如聲跡或場景)。播放器可列出音頻和/或視頻內(nèi)容的其它部分209,用于為每個選擇提供標(biāo)題或標(biāo)簽。播放器還可產(chǎn)生可視表示或相隨的圖形顯示207來伴隨音頻內(nèi)容。
圖2B是音頻內(nèi)容的示范便攜式播放器的圖示。在一個實施例中,便攜式播放器裝置250可在內(nèi)部存儲器或便攜式存儲裝置中存儲音頻內(nèi)容和伴隨文件。便攜式裝置250可以是系統(tǒng)100的縮小形式。在一個實施例中,便攜式播放器250可具有系統(tǒng)100的每個組件。在另一個實施例中,便攜式播放器250可能具有組件的簡化集,其中包括播放選項253和顯示257。顯示257可標(biāo)識被播放的內(nèi)容251以及與內(nèi)容關(guān)聯(lián)的文本。便攜式播放器可支持當(dāng)前可聽文本的突出顯示255。在一個實施例中,便攜式播放器可以是MP3播放器、CD播放器、手持裝置、個人日常/數(shù)字助理(PDA)、蜂窩電話、平板PC或類似的裝置。在又一個實施例中,類似的便攜式視頻內(nèi)容觀看器、如便攜式DVD播放器還可支持具有特征的全集或簡化集的播放機。
圖3是流程圖,說明調(diào)整音頻和/或視頻內(nèi)容的重放的過程。用戶可利用與本地機器109直接或者無線連接的外圍設(shè)備來調(diào)整音頻和/或包括與視頻內(nèi)容關(guān)聯(lián)的音頻部分的視頻內(nèi)容的重放。外圍設(shè)備可以是鼠標(biāo)、鍵盤、軌跡球、操縱桿、游戲控制器、遙控器115或類似裝置。播放器軟件接收來自外圍設(shè)備115的輸入(框315)。在一個實施例中,播放器軟件確定這個輸入與音頻和/或視頻內(nèi)容的重放相關(guān),其中包括確定預(yù)期重放速度和重放的起始點(框317)。播放器軟件將音頻和/或視頻內(nèi)容排隊到預(yù)期起始位置,并開始重放音頻和/或視頻內(nèi)容。播放器軟件根據(jù)來自外圍設(shè)備的輸入來調(diào)整音頻和/或視頻內(nèi)容的重放速率。
在一個實施例中,播放器軟件還調(diào)整音頻和/或視頻內(nèi)容的音頻部分中所講述的單詞的音調(diào)(框319)。在一個實施例中,播放器軟件以調(diào)整后的速度來調(diào)整被重放的單詞的定時和間隔,以便增強與每個單詞關(guān)聯(lián)的聲音的離散集,從而幫助用戶理解單詞(框321)。時間間隔被調(diào)整而沒有影響說話者的語音的音調(diào)。在一個實施例中,播放器軟件以調(diào)整后的速度在內(nèi)容與伴隨源數(shù)據(jù)文件之間將數(shù)據(jù)相關(guān),其中包括以調(diào)整后的速度顯示字幕、以調(diào)整后的速度突出顯示字幕中的單詞以及對擴充重放的類似速度相關(guān)調(diào)整(框323)。在一個實施例中,用戶可根據(jù)各個單詞、句子、段或者劃分視頻內(nèi)容的聲跡的類似方式來選擇重放的類型。
在一個實施例中,外圍設(shè)備115向播放器軟件提供輸入,它確定要提供的調(diào)整重放的類型。在接收到來自外圍輸入設(shè)備115的第一輸入(例如按鈕的單擊)時,播放器軟件以正常速度重復(fù)一段音頻和/或視頻內(nèi)容。如果在預(yù)定周期內(nèi)接收到兩個輸入,則播放器軟件可采用時間間隔和音調(diào)調(diào)整技術(shù)以較慢的速率再播放音頻和/或視頻內(nèi)容段。如果在預(yù)定周期內(nèi)接收到三個輸入,則播放器軟件可采用來自清晰發(fā)音單詞庫的音頻重放該音頻和/或視頻內(nèi)容段。如果在預(yù)定時間周期內(nèi)接收到四個輸入信號,則播放器可顯示與相干音頻和/或視頻內(nèi)容段中的句子相關(guān)的下拉屏幕。下拉屏幕可包括語音、語法以及與句子相關(guān)的類似信息,并且可與減速音頻或來自庫的音頻結(jié)合顯示。在又一個實施例中,包括播放器裝置的輸入機制的圖標(biāo)、導(dǎo)航選項的使用可用來發(fā)起這些調(diào)整重放特征。在一個實施例中,在一段音頻和/或視頻內(nèi)容的重放過程中,在預(yù)定初始時間周期中所接收的輸入信號可發(fā)起音頻和/或視頻內(nèi)容的前一段的重放。
在一個實施例中,播放器軟件包括語音訓(xùn)練子程序,以幫助用戶糾正發(fā)音。語音訓(xùn)練程序提供與調(diào)整重放特征結(jié)合工作的接口,以便以降低的速度重放音頻和/或視頻內(nèi)容的音頻部分的各段,以便于用戶理解音頻部分。在一個實施例中,語音訓(xùn)練程序允許帶有音頻外圍輸入裝置(例如話筒或類似裝置)的用戶重復(fù)所選音頻段。在一個實施例中,語音訓(xùn)練程序向用戶提供建議、評定等級或類似的反饋,以便幫助用戶校正其語音,從而匹配來自音頻部分的語音。在一個實施例中,用戶可訪問已經(jīng)預(yù)先錄制的一組變化的發(fā)音,聽某個人物對一行的發(fā)音或者收聽劇本的相干部分的計算機語音朗讀。在一個實施例中,顯示某個單詞或一組單詞的正確語音發(fā)音。如果用戶記錄某個發(fā)音,則等效于用戶所記錄的內(nèi)容的語音將被顯示,用于比較和反饋。語音訓(xùn)練程序顯示正確發(fā)音的圖形表示,使得用戶可將他的錄制發(fā)音與正確發(fā)音進行比較。例如,這個圖形表示可以是在正確發(fā)音附近或與其重疊顯示的用戶的錄制音頻的波形。在另一個實施例中,圖形表示是錄制音頻的計算機生成的語音轉(zhuǎn)錄,允許用戶查看他的發(fā)音與所錄制單詞的正確語音拼寫進行比較的情況。錄制的用戶音頻和正確的發(fā)音也可作為條形圖、彩色碼映射、動畫生理仿真或類似表示來顯示。
在一個實施例中,播放器軟件包括備選重放選項,它允許音頻和/或視頻內(nèi)容的劇本與諸如演員的語音或計算機生成的語音之類的另一種語音一起播放。這個特征可與調(diào)整重放特征和語音訓(xùn)練特征結(jié)合使用。這在音頻部分不清晰或者未使用正確發(fā)音時幫助用戶。
在一個實施例中,播放器軟件顯示在音頻和/或視頻內(nèi)容以及音頻和/或視頻內(nèi)容段的開始和結(jié)束處附加的介紹屏幕、序言屏幕和后文屏幕。介紹屏幕可能是允許用戶選擇在重放中預(yù)期的選項的菜單。在一個實施例中,用戶可選擇在重放過程中要跟蹤或使用的一組偏好。在一個實施例中,用戶可選擇在重放過程中突出顯示劇本中的單詞的所選集合的‘熱字標(biāo)記’。這些單詞被突出顯示,以及‘提示’單詞也可顯示,它幫助解釋或闡明突出顯示單詞的含義。在一個實施例中,用戶感到有困難的單詞被標(biāo)記為‘熱字’,并被索引或編目錄以供用戶參考。用戶可啟用書簽,它允許用戶在重放過程中標(biāo)記將被返回或索引以供以后觀看或收聽的場景。在一個實施例中,介紹屏幕允許對語言、用戶水平、特定用戶標(biāo)識和類似參數(shù)的選擇,以便使語言學(xué)習(xí)內(nèi)容適應(yīng)用戶的需要。在一個實施例中,用戶水平分為初級、中級、高級和精通。在另一個實施例中,用戶的這些水平基于數(shù)值標(biāo)度、如1-5,具有不斷增加的難度等級和預(yù)計流暢性。每個較高等級比較低等級顯示更多高級內(nèi)容或更少輔助內(nèi)容。在一個實施例中,介紹屏幕可包括其它產(chǎn)品的廣告或者音頻和/或視頻內(nèi)容。
在一個實施例中,序言屏幕可附加到音頻和/或視頻內(nèi)容段的開始處(例如歌曲或電影場景)。在一個實施例中,與某個段關(guān)聯(lián)的單詞和慣用語可在序言屏幕中顯示。所顯示的單詞和信息將符合指定的用戶水平。在一個實施例中,序言屏幕在音頻和/或視頻段之前引入包括以下項目的素材段中的單詞,單詞解釋,單詞發(fā)音,與音頻和/或視頻內(nèi)容或語言相關(guān)的問題,與用戶的先前體驗相關(guān)的信息以及類似素材。序言中的鏈接允許用戶在特定幀開始重放。例如,序言可具有序言與場景中出現(xiàn)的單詞之間的鏈接,以便允許用戶直接跳轉(zhuǎn)到單詞在其中被使用的音頻和/或視頻內(nèi)容中的幀。在一個實施例中,用戶可設(shè)置偏好,它阻止顯示部分或全部序言屏幕,或者只在接收到另一個輸入時才顯示它們。在一個實施例中,屏幕截圖或其它圖像或動畫用于序言屏幕中說明單詞或概念或者標(biāo)識關(guān)聯(lián)場景。在一個實施例中,用于序言屏幕的一組預(yù)先渲染圖像被包裝為播放器軟件的一部分。在一個實施例中,在用戶“選擇參加”之前不顯示序言屏幕,以免中斷音頻和/或視頻內(nèi)容的自然流動。
在一個實施例中,序言屏幕包括將為學(xué)習(xí)過程突出顯示的特定單詞、短語或語法結(jié)構(gòu)。來自與場景相關(guān)的伴隨文件131的相干素材由播放器軟件來編譯。播放器軟件分析與場景中的各數(shù)據(jù)項關(guān)聯(lián)的用戶水平數(shù)據(jù),并構(gòu)造與用戶水平對應(yīng)的或者滿足用戶指定偏好或標(biāo)準(zhǔn)的相干數(shù)據(jù)類型的列表。在一個實施例中,與場景相關(guān)的附加素材可添加到列表中、例如“熱字”,而與它所表明的用戶水平無關(guān)。從列表中刪除由播放器軟件所存儲的跟蹤數(shù)據(jù)表明用戶完全理解或者已經(jīng)由先前的序言屏幕檢測過的素材。隨機或偽隨機函數(shù)則用于從序言屏幕中要使用的匯編列表中選擇單詞、短語、語法結(jié)構(gòu)等。在另一個實施例中,序言屏幕上顯示的單詞或信息由編者選擇或者從所收集的關(guān)于用戶的數(shù)據(jù)來推理。
在一個實施例中,后文屏幕為交互測試或小程序,它測試用戶對于與音頻和/或視頻內(nèi)容相關(guān)的語言和內(nèi)容的理解。在一個實施例中,問題被定時,以及正確和不正確的答案使不同的屏幕或者音頻和/或視頻內(nèi)容被顯示。在一個實施例中,如果出現(xiàn)超時,則顯示正確答案。
在一個實施例中,后文素材位于場景或音頻和/或視頻內(nèi)容的結(jié)尾。在一個實施例中,內(nèi)容和問題根據(jù)觀看或收聽音頻和/或視頻內(nèi)容的過程中所跟蹤的用戶輸入自動產(chǎn)生。例如,基于再播放次數(shù)、用戶感到困難的音頻和/或視頻內(nèi)容段在后文中按照難度順序再播放。在一個實施例中,根據(jù)相似的語言內(nèi)容、人物、主題、演員或類似標(biāo)準(zhǔn),可使用來自另一個音頻和/或視頻內(nèi)容的內(nèi)容或者與來自所觀看或收聽的音頻和/或視頻內(nèi)容的內(nèi)容進行對照。在一個實施例中,后文屏幕顯示包括與序言屏幕相似的鏈接的語言和詞匯信息。后文屏幕可由用戶以與序言屏幕相同的方式來去活或部分激活。在一個實施例中,屏幕截圖或其它圖像或動畫用于后文屏幕中以說明單詞或概念或者標(biāo)識關(guān)聯(lián)場景。在一個實施例中,用于后文屏幕中的一組預(yù)先渲染圖像被包裝為播放器軟件的一部分。播放器軟件訪問伴隨文件131以確定何時插入序言和后文屏幕以及關(guān)聯(lián)內(nèi)容。在一個實施例中,所有后文屏幕‘選擇參加’,但是,一旦音頻和/或視頻內(nèi)容已經(jīng)結(jié)束,例如在影片結(jié)束時,在此情況下,后文將被提供,除非用戶通過提供輸入‘選擇不參加’。
在一個實施例中,如上所述,播放器軟件跟蹤用戶偏好和動作,以便根據(jù)用戶需求更好地調(diào)整擴充重放信息。用戶偏好信息包括用戶精通水平、暫停和調(diào)整重放使用、訓(xùn)練表現(xiàn)、書簽和類似信息。在一個實施例中,播放器軟件根據(jù)用戶輸入編譯可定制的單詞數(shù)據(jù)庫作為詞匯表。
在一個實施例中,用戶偏好可從播放器軟件導(dǎo)出到其它裝置和機器,以便與其它機器上的其它程序和播放器軟件配合使用。在一個實施例中,服務(wù)器存儲用戶偏好,以及允許用戶登錄到服務(wù)器135以便獲取和配置本地播放器軟件來加入偏好。
圖4是將伴隨文件131與音頻和/或視頻內(nèi)容相關(guān)的播放器軟件過程的流程圖。播放器軟件識別用戶希望觀看或收聽的音頻和/或視頻內(nèi)容(框413)。在一個實施例中,播放器軟件訪問音頻和/或視頻內(nèi)容以查找標(biāo)識數(shù)據(jù)序列,并且利用本地或遠程數(shù)據(jù)庫或者通過搜索本地可訪問的伴隨文件131將那個序列與伴隨文件131相關(guān)。一旦音頻和/或視頻內(nèi)容已經(jīng)被識別,播放器軟件確定適當(dāng)?shù)陌殡S源文件的副本是否本地可用。
在一個實施例中,伴隨文件131可存儲在可移動媒體存儲產(chǎn)品、如CD、DVD或類似存儲媒體中。在一個實施例中,如果伴隨文件131不是本地可用的,則播放器軟件通過網(wǎng)絡(luò)127訪問服務(wù)器135,以便下載適當(dāng)?shù)陌殡S源文件。在一個實施例中,音頻和/或視頻內(nèi)容的伴隨文件131還可設(shè)置在相同媒體中,與音頻和/或視頻內(nèi)容結(jié)合傳送,或者從相同的遠程存儲位置傳送。在又一個實施例中,伴隨文件131可存儲在本地驅(qū)動器105或者存儲裝置107中。播放器可根據(jù)它與音頻和/或視頻內(nèi)容的并存來標(biāo)識適當(dāng)?shù)陌殡S文件131(框415)。在一個實施例中,播放器軟件則開始對音頻和/或視頻內(nèi)容的訪問及重放(框419)。本文所用的術(shù)語“媒體”用來表示傳送內(nèi)容的產(chǎn)品、管道及方法,例如CD、DVD、網(wǎng)絡(luò)流、廣播和類似的傳送方法。對位于相同媒體中的兩個項目的說法表明,兩個項目位于相同的產(chǎn)品或流(例如媒體的單個示例)中,對位于相同的媒體類型中的項目的說法表明這兩個項目可能位于一個或多個產(chǎn)品中,例如一對CD或一對DVD或者網(wǎng)絡(luò)流(或者可能位于單個媒體中)。
在一個實施例中,播放器軟件逐幀或者逐個時間點地將音頻和/或視頻內(nèi)容和伴隨文件131相關(guān)(框421)。在一個實施例中,伴隨文件131以順序方式包含基于與音頻和/或視頻內(nèi)容中的各幀或時間點關(guān)聯(lián)的一組索引、關(guān)于音頻和/或視頻內(nèi)容的信息。根據(jù)準(zhǔn)備用于顯示的音頻和/或視頻內(nèi)容的幀或時間點,播放器軟件訪問伴隨文件131中的相關(guān)數(shù)據(jù)以產(chǎn)生擴充重放。相關(guān)數(shù)據(jù)可包括劇本、詞匯、慣用表達以及涉及音頻和/或視頻內(nèi)容的對話的其它語言相關(guān)素材。
在一個實施例中,伴隨文件131可以是平面文件、數(shù)據(jù)庫文件或類似的格式化文件。在一個實施例中,伴隨文件131的數(shù)據(jù)以XML或類似的計算機解釋語言來編碼。在另一個實施例中,伴隨文件131將以具有各單詞、行、場景示例和適當(dāng)?shù)念惖膶ο蟮氖纠硎镜南嗨贫蔚拿嫦驅(qū)ο蟮姆独齺韺崿F(xiàn)。
在一個實施例中,播放器利用伴隨文件131的數(shù)據(jù)來擴充音頻和/或視頻內(nèi)容的重放(框423)。擴充可包括顯示文本、語音發(fā)音、鏈接到附加菜單的圖標(biāo)以及與音頻和/或視頻內(nèi)容相關(guān)的特征,例如與音頻和/或視頻內(nèi)容相關(guān)的指南、菜單以及類似信息。在一個實施例中,通過播放器軟件和伴隨文件131可得到的其它資源包括劇本中句子結(jié)構(gòu)的語法分析和解釋,語法相關(guān)課程,慣用表達的解釋,人物及內(nèi)容相關(guān)索引以及類似資源。在一個實施例中,播放器將訪問初始行或場景部分,并使用其中的信息來查找單詞索引中的起始位置及相應(yīng)的起始幀。重放將依次連續(xù)通過每個部分,除非通過請求訪問特定信息或者跳轉(zhuǎn)到音頻和/或視頻內(nèi)容中不同位置的用戶輸入來轉(zhuǎn)向。
圖5是示范伴隨文件格式的示意圖。在這個實施例中,伴隨文件131配置成與音頻和/或視頻內(nèi)容、如影片、有聲書籍、電視節(jié)目及類似情況配合使用。在一個實施例中,伴隨文件131分為劇本相關(guān)數(shù)據(jù)和元數(shù)據(jù)。在一個實施例中,劇本相關(guān)數(shù)據(jù)主要是依次存儲或索引的數(shù)據(jù),包括與其中包含單詞、行和對話交流的劇本相關(guān)的數(shù)據(jù)以及場景相關(guān)數(shù)據(jù)。元數(shù)據(jù)主要是根據(jù)用戶請求來訪問的輔助或參考相關(guān)數(shù)據(jù),例如詞典數(shù)據(jù)、發(fā)音數(shù)據(jù)和內(nèi)容相關(guān)索引。
在一個實施例中,劇本數(shù)據(jù)以平面順序二進制格式500存儲。平面格式500包括按照所定義分級結(jié)構(gòu)分組的與劇本相關(guān)的多個部分。每個部分中的數(shù)據(jù)以按照劇本的順序的順序方式來組織。在一個實施例中,格式中的字段具有固定長度。在一個實施例中,這些部分包括單詞部分、行部分、對話交流部分、場景部分和其它類似部分。單詞部分包括標(biāo)識單詞部分序列中的單詞位置的單詞示例索引、單詞文本、將單詞鏈接到定義數(shù)據(jù)的單詞定義標(biāo)識或指針、將單詞鏈接到相關(guān)發(fā)音數(shù)據(jù)的發(fā)音標(biāo)識字段或指針、以及標(biāo)識來自音頻和/或視頻內(nèi)容、單詞與其關(guān)聯(lián)的起始和結(jié)束幀的起始和結(jié)束幀字段。在一個實施例中,行部分包括標(biāo)識行部分序列中各行的位置的行索引、表明單詞部分中與行關(guān)聯(lián)的第一單詞的起始單詞索引、表明與行關(guān)聯(lián)的最后一個單詞的結(jié)束單詞索引、表明或指向與劇本行的語言解釋相關(guān)的數(shù)據(jù)的行解釋索引、指向行或者將行與音頻和/或視頻內(nèi)容中的人物鏈接的人物標(biāo)識字段、起始和結(jié)束幀指示符以及類似信息或者指向與行相關(guān)的信息的指針。在一個實施例中,對話交流部分包括標(biāo)識對話交流部分的索引中的位置的交流索引、與對話交流關(guān)聯(lián)的起始幀和結(jié)束幀以及類似指針和信息。在一個實施例中,場景部分包括標(biāo)識場景部分中的場景的位置的索引、序言標(biāo)識字段或指針、后文標(biāo)識字段或指針、起始和結(jié)束幀以及類似指示符和與場景相關(guān)的信息。
在一個實施例中,元數(shù)據(jù)部分包括行解釋部分、單詞詞典部分、單詞發(fā)音部分以及與涉及音頻和/或視頻內(nèi)容及其中語言的輔助和參考類型信息相關(guān)的類似部分。在一個實施例中,解釋部分將包括表明行解釋部分中的行解釋的位置的索引、表明對應(yīng)行的行索引、與為給定行提供的各種語法和語義解釋數(shù)據(jù)相關(guān)的一組解釋數(shù)據(jù)字段以及與對應(yīng)行解釋的數(shù)據(jù)相關(guān)的類似字段。在一個實施例中,單詞發(fā)音部分包括表明單詞發(fā)音部分中的示例位置的索引、指向音頻數(shù)據(jù)的指針、音頻數(shù)據(jù)字段的長度、音頻數(shù)據(jù)類型字段以及類似的發(fā)音相關(guān)數(shù)據(jù)和指針。
在一個實施例中,指針用于字段中來表明大于二進制文件中的字段大小的數(shù)據(jù)。這允許所使用數(shù)據(jù)的大小方面的靈活性,同時保持二進制文件中的字段的標(biāo)準(zhǔn)格式和長度。在一個實施例中,伴隨文件131具有用于編輯和文件創(chuàng)建的備選格式,例如XML和其它標(biāo)記語言、數(shù)據(jù)庫(例如關(guān)系數(shù)據(jù)庫)或面向?qū)ο蟮母袷?。在一個實施例中,伴隨文件131以不同格式存儲在服務(wù)器135中。在一個實施例中,伴隨文件131作為關(guān)系數(shù)據(jù)庫文件來存儲,以便于文件在被創(chuàng)建或編輯時的動態(tài)修改。數(shù)據(jù)庫被平展為平面文件格式,以便于重放過程中由播放器軟件進行訪問。
在另一個實施例中,伴隨文件131的格式可被修改或重新定義以用于其它內(nèi)容類型,例如相冊、歌曲、音樂視頻、教育素材、記錄片、訪談及類似的內(nèi)容。例如,相冊的伴隨文件131可根據(jù)聲跡中的時間點而不是場景和行來組織。打算在便攜式裝置中使用的伴隨文件131可具有基于便攜式播放器裝置的功能的字段的簡化集。例如,與發(fā)音或者劇本的詳細分析相關(guān)的字段可被省略或忽略。
圖6是內(nèi)容控制系統(tǒng)的操作的流程圖。在一個實施例中,內(nèi)容控制系統(tǒng)可允許用戶選擇音頻和/或視頻內(nèi)容中要過濾或改變的內(nèi)容的類型。例如,父母可能想過濾他們的小孩將觀看或收聽的影片或歌曲的褻瀆語言。這個控制內(nèi)容系統(tǒng)可用于語言學(xué)習(xí)系統(tǒng)的上下文中,或者可用于在傳統(tǒng)觀看或收聽娛樂及類似媒體期間控制內(nèi)容。
內(nèi)容控制系統(tǒng)根據(jù)伴隨文件131來起作用,伴隨文件131包含對于與音頻和/或視頻內(nèi)容關(guān)聯(lián)的轉(zhuǎn)錄的單詞和短語分類的信息。僅與內(nèi)容控制系統(tǒng)配合使用的伴隨文件131可具有專用格式,它包括單詞和短語的索引腳本及分類,但可省略與其它增強特征相關(guān)的其它數(shù)據(jù)和字段??蓪τ陔S機或順序存取優(yōu)化伴隨文件131。在另一個實施例中,伴隨文件131中的附加內(nèi)容的索引可能不是基于劇本而是可能基于幀、時間參考或者索引音頻和/或視頻內(nèi)容的類似方法。在一個實施例中,這種索引有助于非語言內(nèi)容控制、例如裸露。
內(nèi)容控制系統(tǒng)取決于伴隨文件131,伴隨文件131包含音頻和/或視頻內(nèi)容所用的劇本中的段、單詞和短語的每個的分類的標(biāo)識(框601)。劇本的每個段、單詞、短語或類似部分可根據(jù)它是否涉及用戶可能希望過濾的性內(nèi)容、暴力內(nèi)容、褻瀆內(nèi)容、邪惡內(nèi)容或類似內(nèi)容來分類(框603)。伴隨文件131與分類數(shù)據(jù)和劇本可在相同媒體、分開的媒體上或者通過相同或分開的分發(fā)方法提供給具有播放器程序的用戶的本地機器(框605)。伴隨文件131可包含與媒體的單詞、幀或段關(guān)聯(lián)的屬性。例如,分配給單詞的某個屬性可能是表明厭惡程度的數(shù)值等級。
用戶可采用播放器所提供的界面來確定要過濾的內(nèi)容集合(框607)。圖7是內(nèi)容控制系統(tǒng)的示范界面屏幕。界面屏幕包括選擇用戶希望觀看、收聽或變更的分類集合的一組導(dǎo)航選項或圖標(biāo)705。在示例界面中,內(nèi)容分為語言、暴力、性、裸露和道德分類。所示的語言屏幕的界面屏幕包括與所選分類關(guān)聯(lián)的單詞或短語的列表。在示例界面屏幕中,在本例中稱作褻瀆語言的語言中的所有單詞和短語均被顯示。用戶可選擇在重放中被顯示或者例如要被忽略的單詞或短語。在一個實施例中,選擇觸發(fā)布爾值,它在激活過濾器時標(biāo)記是否要重放、改變或類似地審查音頻和/或視頻內(nèi)容的單詞、短語、場景或類似部分。在另一個實施例中,更大粒度選擇可允許用戶應(yīng)用可能影響音頻和/或視頻內(nèi)容的過濾的一系列選項??赡苓x項的一部分實例包括使某段靜音、跳過段、跳過相關(guān)段和類似的可能審查技術(shù)。
在示例界面屏幕中,在一個實施例中,選擇可通過滑動指示器703來實現(xiàn)。當(dāng)滑塊朝“冷”移動時,厭惡性的門限變得更低。這樣,在最低處,所有厭惡單詞將被忽略。如果假設(shè)零與十之間的褻瀆標(biāo)度,其中十為最褻瀆,則當(dāng)滑塊位于中間時,具有大于五的褻瀆屬性的單詞將被選擇用于變更。類似的屬性等級可結(jié)合其它分類來指定。在一個實施例中,單詞旁邊的單選按鈕隨著滑塊的移動而改變,因此用戶可看到在選擇時滑塊的移動的效果。在一個實施例中,屬性可以是與特定分類的某個單詞或短語(場景、幀或段)關(guān)聯(lián)的值,它標(biāo)識單詞或短語可能被過濾的條件。屬性通常包含在伴隨文件131中,但在部分實施例中可以是用戶定義的。
在示例屏幕界面中,范圍從‘熱’到‘冷’的滑桿指示器703可用來設(shè)置單詞組或分類的過濾器等級。與屬性值以及一組單詞或短語的滑桿指示器703的位置有關(guān)的信息可由播放器軟件結(jié)合諸如當(dāng)前用戶身份、時刻、內(nèi)容類型(例如音樂或視頻)以及可能影響哪個過濾等級適當(dāng)?shù)念愃茢?shù)據(jù)之類的其它信息使用。
界面屏幕可具有附加特征以便于選擇修改的內(nèi)容。在一個實施例中,界面屏幕可包括觀看屏幕707,以便觀看或收聽單詞或短語在其中出現(xiàn)的一段音頻和/或視頻內(nèi)容。如果內(nèi)容只是音頻,則可視表示可伴隨此音頻。例如,用戶可從分類‘語言’的單詞列表中選擇單詞‘流產(chǎn)’。這個單詞在其中出現(xiàn)的影片或音樂段則可排隊,用于在觀看屏幕707中進行審閱。界面屏幕還可包括導(dǎo)航選項和圖標(biāo)709,以便繼續(xù)進行播放或者訪問附加信息或選項。
在一個實施例中,在重放過程中,播放器連續(xù)檢查被播放的當(dāng)前段,以便確定過濾器是否應(yīng)當(dāng)應(yīng)用到將要播放的單詞或短語(框609)。在一個實施例中,播放器可跳過包含要過濾內(nèi)容的音頻和/或視頻內(nèi)容的場景或段。在另一個實施例中,內(nèi)容可變模糊、靜音、發(fā)出嘩嘩聲或者以阻礙對過濾內(nèi)容的觀看或收聽的類似方式來審查。在一個實施例中,播放器軟件允許用戶從用于過濾的這些選項中選擇要過濾的單詞或短語的不同類別或示例。用戶偏好可保存供以后使用。偏好可結(jié)合到單個內(nèi)容或者在內(nèi)容的各分類上一般化。用戶可完全禁用內(nèi)容控制。在一個實施例中,禁用控制的能力被限制到主用戶,并且可能具有密碼保護或類似保護。
圖8是用于增強用戶為了語言學(xué)習(xí)而觀看或收聽音頻和/或視頻內(nèi)容的學(xué)習(xí)體驗的質(zhì)量的推理機的流程圖。在一個實施例中,播放器可跟蹤與音頻和/或視頻內(nèi)容的重放相關(guān)的用戶輸入。播放器通過以缺省重放模式或者按照播放器的當(dāng)前設(shè)定向用戶呈現(xiàn)音頻和/或視頻內(nèi)容開始(框801)。播放器還根據(jù)用戶能力的缺省水平或者用戶的語言能力的當(dāng)前估計水平來提供對附加內(nèi)容的訪問(框803)。
在一個實施例中,在音頻和/或視頻內(nèi)容及附加內(nèi)容的重放過程中,播放器跟蹤用戶的響應(yīng)和輸入的類型(框805)。所跟蹤的輸入和響應(yīng)的類型可包括用戶回溯音頻和/或視頻內(nèi)容的特定單詞、短語或段的播放的次數(shù)、用戶觀看或收聽某個段的速度、對用戶提供的問題的響應(yīng)、使用對于提示或問題的幫助信息響應(yīng)所耗用的時間、諸如紅外相機讀取、控制器使用、用戶移動、靜止等的生理反饋以及類似的信息和數(shù)據(jù)。推理機分析所收集數(shù)據(jù),以便確定用戶的主觀語言的知識水平(框807)。
在一個實施例中,對用戶在語言方面的能力的這種確定則用來選擇或調(diào)整向用戶呈現(xiàn)音頻和/或視頻內(nèi)容的設(shè)定。推理機可利用可變加權(quán)和類似計算來評估用戶能力。推理機可實現(xiàn)為專家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)或類似系統(tǒng)。在一個實施例中,推理機可被設(shè)計或訓(xùn)練成供不同語言及文化背景的用戶使用。
在一個實施例中,播放器可變更播放單詞或短語的速度,可改變序言或后文段中的問題的類型或數(shù)量,可改變劇本的顯示,變更背景音樂的等級,提供附加內(nèi)容,提供動畫人物,通過各種音調(diào)變化提供劇本的文本的發(fā)聲,提供詞典定義,以及可將重放調(diào)整到適合用戶的學(xué)習(xí)需求的類似動作。在一個實施例中,在音頻和/或視頻內(nèi)容的重放過程中,可提供畫外音來幫助用戶理解內(nèi)容。畫外音可以是劇本的文本的發(fā)聲、內(nèi)容的解釋(例如場景、對話交流、概念、短語、單詞或類似內(nèi)容的解釋)或者在伴隨文件131中提供的類似素材。對重放的其它調(diào)整可包括調(diào)整音頻的各種方面的音量(例如背景音樂、對話和類似聲跡)、靜音、速度調(diào)整、暫停和類似動作。被確定具有高能力水平的用戶一般將接收到較少輔助或者更復(fù)雜的幫助,以及具有較低能力水平的用戶一般將接收到更多輔助以及更簡單的輔助類型。
用戶可忽略推理機的設(shè)定,而選擇獲取更高或更低能力水平的輔助。在一個實施例中,系統(tǒng)存儲推理機跟蹤和狀態(tài)數(shù)據(jù)供將來使用。數(shù)據(jù)和狀態(tài)可用于將來使用特定內(nèi)容,或者用作具有新內(nèi)容的通用模板。所存儲數(shù)據(jù)可包括加權(quán)因子、神經(jīng)連接數(shù)據(jù)、歷史記錄及類似數(shù)據(jù)。
圖9是用于跟蹤播放器的重放位置的系統(tǒng)的流程圖。被跟蹤的重放會話位置信息可用來保存‘書簽’,讓用戶從他或她在音頻和/或視頻內(nèi)容中較早前停止的位置繼續(xù)進行。這個系統(tǒng)以會話開始來開始(框901)。本文所用的“會話”可以是用戶開始音頻和/或視頻內(nèi)容的重放直到重放被停止的一段時間。重放可由用戶的直接選擇或者通過某種系統(tǒng)故障或類似事件、如電力失去來停止。重放監(jiān)測系統(tǒng)按照一定的間隔存儲重放位置(框903)。在一個實施例中,間隔可小于三十秒間隔。在一個實施例中,間隔小于一秒。在部分實施例中,系統(tǒng)的狀態(tài)在每個間隔被存儲。狀態(tài)存儲可通過存儲自上一個間隔以來的狀態(tài)的Δ來實現(xiàn)。只要會話過程中的重放繼續(xù)進行,重放監(jiān)測系統(tǒng)可按照一定間隔連接存儲重放位置(框905)。在一個實施例中,如果重放被中斷或終止,則在重放重新開始時,重放將在先前停止的點自動恢復(fù)(框907)。用戶可利用外圍設(shè)備或類似輸入裝置來選擇不參加。用戶可通過偏好設(shè)定來改變自動重新開始。在另一個實施例中,如果重放被中斷或終止,則在重放重新開始或者在新會話開始時,播放器可提供在上一次保存的位置開始重放。在又一個實施例中,重放的重新開始可在音頻和/或視頻內(nèi)容中比上次播放點稍前的點開始。重放也可在當(dāng)前段的起始處、在前一個句子或?qū)υ捊涣鹘Y(jié)束之后或者在類似的起始點開始。在一個實施例中,自上一次重放會話以來經(jīng)過的時間量可被分解為播放應(yīng)當(dāng)重新開始的位置的確定。例如,如果重放因例如兩分鐘電話呼叫而被中斷,則以最近句子的起始處開始可能是足夠的。但是,如果經(jīng)過數(shù)天,則可能希望返回到例如當(dāng)前對話交流的開頭。
在一個實施例中,播放器利用特殊存儲器或存儲裝置來跟蹤重放位置。在另一個實施例中,與播放器分開的裝置可管理重放位置的存儲。存儲器可以是諸如EPROM、閃存、電池支持的RAM或類似存儲裝置等非易失性存儲器、固定光盤媒體、磁媒體、物理媒體或類似存儲裝置。重放的位置可通過相對音頻和/或視頻內(nèi)容的起始的重放時間點、通過使用索引、段標(biāo)識信息或類似的位置標(biāo)識信息來確定。在一個實施例中,系統(tǒng)可存儲多個重放位置。不同的音頻和/或視頻內(nèi)容的重放位置可同時存儲。在一個實施例中,系統(tǒng)的附加狀態(tài)信息可被跟蹤和存儲,其中包括附加素材重放位置、推理機、變更記錄、當(dāng)前設(shè)定和偏好以及類似數(shù)據(jù)。
在一個實施例中,播放器應(yīng)用、服務(wù)器應(yīng)用和其它要素以軟件(例如微碼、匯編語言或高級語言)來實現(xiàn)。這些軟件實現(xiàn)可存儲在機器可讀媒體中?!皺C器可讀”媒體可包括能夠存儲或傳遞信息的任何媒體。機器可讀媒體的實例包括ROM、軟盤、CD-ROM、DVD、閃存、硬盤驅(qū)動器、光盤或類似媒體。
在以上說明中,參照特定實施例對本發(fā)明作了說明。但是顯然可對其進行各種修改及變更,而未背離所附權(quán)利要求提出的本發(fā)明的廣義精神和范圍。因此,說明和附圖應(yīng)看作是說明性而不是限制性的。
權(quán)利要求
1.一種方法,包括獲取包含聲音記錄的原始數(shù)字音頻內(nèi)容;提供包含所述聲音記錄中存在的單詞的文本的附加數(shù)字內(nèi)容;以及提供單詞的文本與單詞在其中發(fā)聲的原始內(nèi)容的段之間的鏈接。
2.如權(quán)利要求1所述的方法,其特征在于,所述附加數(shù)字內(nèi)容在所述原始內(nèi)容的重放過程中向用戶顯示。
3.如權(quán)利要求1所述的方法,其特征在于,所述附加數(shù)字內(nèi)容還包括有關(guān)所述單詞的信息。
4.如權(quán)利要求1所述的方法,其特征在于,所述附加內(nèi)容和所述原始數(shù)字音頻內(nèi)容在數(shù)據(jù)庫中被鏈接。
5.如權(quán)利要求1所述的方法,其特征在于,所述附加內(nèi)容與所述原始數(shù)字音頻內(nèi)容的重放在時間上同步地向用戶顯示。
6.如權(quán)利要求1所述的方法,其特征在于還包括播放與單詞的文本關(guān)聯(lián)的所述原始數(shù)字音頻內(nèi)容,其中所述單詞的文本的長度和起始點隨用戶輸入而定。
7.如權(quán)利要求1所述的方法,其特征在于還包括播放來自所述單詞的文本的多個順序相鄰單詞,其中重放速度響應(yīng)用戶輸入而調(diào)整。
8.如權(quán)利要求7所述的方法,其特征在于還包括相對于所述重放速度來調(diào)整聲音重放的音調(diào),從而提高所講單詞的可理解性。
9.如權(quán)利要求7所述的方法,其特征在于還包括在重放中相對于所述重放速度來調(diào)整所講單詞之間的時間間隔,從而改進對所講單詞的識別。
10.如權(quán)利要求9所述的方法,其特征在于所述時間間隔之間的各個所講單詞保留其原始的自然音調(diào)和語音速率。
11.如權(quán)利要求1所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述數(shù)字音頻內(nèi)容的數(shù)據(jù)庫、所述附加數(shù)字內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項;指定起始點和結(jié)束點、重放的時間順序、附加數(shù)字內(nèi)容以及重放的修改類型其中至少一項;以及播放符合所述指定的段。
12.如權(quán)利要求1所述的方法,其特征在于,所述附加數(shù)字內(nèi)容包括所述音頻數(shù)字內(nèi)容中的單詞的索引,所述方法還包括響應(yīng)用戶輸入而調(diào)整所述音頻數(shù)字內(nèi)容的重放速度;調(diào)整所述數(shù)字音頻內(nèi)容中單詞的音調(diào)和時間間隔其中至少一項,以便改進可理解性和識別其中至少一項;以及通過引用所述索引保持所述音頻數(shù)字內(nèi)容中的單詞與所述音頻數(shù)字內(nèi)容中的特定點的相關(guān)性。
13.如權(quán)利要求1所述的方法,其特征在于,所述附加數(shù)字內(nèi)容包括所述數(shù)字音頻內(nèi)容中可聽的單詞的索引,所述方法還包括為所述索引中的多個單詞提供可聽發(fā)音的庫;以及響應(yīng)用戶輸入而播放所述發(fā)音。
14.如權(quán)利要求1所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述音頻數(shù)字內(nèi)容的數(shù)據(jù)庫、所述附加數(shù)字內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項,以便標(biāo)識與所述原始內(nèi)容的段相關(guān)的受關(guān)注信息;以及在播放所述段之前呈現(xiàn)所述受關(guān)注信息。
15.如權(quán)利要求1所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述音頻數(shù)字內(nèi)容的數(shù)據(jù)庫、所述附加數(shù)字內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項,以便標(biāo)識與所述原始內(nèi)容的段相關(guān)的受關(guān)注信息;以及提示用戶進行附加輸入,所述附加輸入導(dǎo)致對所述重放的進一步修改。
16.如權(quán)利要求1所述的方法,其特征在于還包括提供到通過分布式網(wǎng)絡(luò)可訪問的其它內(nèi)容的鏈接。
17.如權(quán)利要求11所述的方法,其特征在于,所述修改類型包括播放可聽的附加內(nèi)容。
18.如權(quán)利要求1所述的方法,其特征在于還包括根據(jù)對用戶授予的權(quán)限來控制對內(nèi)容和功能其中至少一項的訪問。
19.如權(quán)利要求18所述的方法,其特征在于,根據(jù)所接收的付款來授予權(quán)限。
20.一種方法,包括定義音頻和視頻數(shù)字內(nèi)容其中至少一項中的段;向所述段分配至少一種屬性;經(jīng)由相同類型的媒體傳遞所述段和屬性分配信息;提供接受關(guān)于所述屬性的用戶指定的界面;以及提供訪問權(quán)以修改符合所述指定的所述媒體的呈現(xiàn)。
21.如權(quán)利要求20所述的方法,其特征在于還包括根據(jù)所述段的屬性為多個段編索引。
22.如權(quán)利要求21所述的方法,其特征在于還包括創(chuàng)建將所述段和屬性相關(guān)的數(shù)據(jù)庫。
23.如權(quán)利要求20所述的方法,其特征在于還包括將附加內(nèi)容鏈接到所述段。
24.如權(quán)利要求20所述的方法,其特征在于,所述屬性與暴力內(nèi)容、性內(nèi)容、裸露及語言內(nèi)容其中至少一項相關(guān)。
25.如權(quán)利要求21所述的方法,其特征在于還包括提供審閱特征以便允許根據(jù)所述指定來呈現(xiàn)內(nèi)容。
26.如權(quán)利要求20所述的方法,其特征在于還包括提供包括在所述音頻和視頻數(shù)字內(nèi)容的聲跡中所講單詞的索引的附加內(nèi)容;響應(yīng)用戶輸入而調(diào)整所述音頻和視頻數(shù)字內(nèi)容其中至少一項的重放速度;調(diào)整單詞的音調(diào)和時間間隔其中至少一項,以便改進可理解性和識別其中至少一項;以及通過引用所述索引保持所講單詞與所述音頻和視頻數(shù)字內(nèi)容其中至少一項中的特定點的相關(guān)性。
27.如權(quán)利要求20所述的方法,其特征在于還包括提供包括在所述音頻或視頻內(nèi)容中所講單詞的索引的附加內(nèi)容;為所述索引中的多個單詞提供可聽發(fā)音的庫;以及響應(yīng)用戶輸入而播放所述發(fā)音。
28.如權(quán)利要求20所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述音頻和視頻數(shù)字內(nèi)容的數(shù)據(jù)庫、附加內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項,以便標(biāo)識與所述音頻或視頻數(shù)字內(nèi)容的段相關(guān)的受關(guān)注信息;以及在播放所述段之前呈現(xiàn)所述受關(guān)注信息。
29.如權(quán)利要求20所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述視聽數(shù)字內(nèi)容的至少一個的數(shù)據(jù)庫、附加內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項,以便標(biāo)識與所述音頻和視頻數(shù)字內(nèi)容中至少一個的段相關(guān)的受關(guān)注信息;以及提示用戶進行附加輸入,所述附加輸入導(dǎo)致對所述重放的進一步修改。
30.如權(quán)利要求20所述的方法,其特征在于還包括提供到通過分布式網(wǎng)絡(luò)可訪問的其它內(nèi)容的鏈接。
31.如權(quán)利要求20所述的方法,其特征在于還包括根據(jù)對用戶授予的權(quán)限來控制對內(nèi)容和功能其中至少一項的訪問。
32.如權(quán)利要求31所述的方法,其特征在于,根據(jù)所接收的付款來授予權(quán)限。
33.一種方法,包括獲取原始內(nèi)容,其中包括最初主要為了非語言學(xué)習(xí)目的而制作的視頻和音頻內(nèi)容其中至少一項;經(jīng)由相同數(shù)字媒體傳遞所述原始內(nèi)容與附加內(nèi)容;其中所述附加內(nèi)容包括所述原始內(nèi)容中存在的單詞的文本數(shù)據(jù)庫;以及其中所述附加內(nèi)容還包括有關(guān)所述單詞的信息。
34.如權(quán)利要求33所述的方法,其特征在于還包括向用戶呈現(xiàn)所述原始內(nèi)容和所述附加內(nèi)容其中至少一項,以幫助語言學(xué)習(xí)。
35.如權(quán)利要求33所述的方法,其特征在于,所述數(shù)字媒體是DVD、分布式網(wǎng)絡(luò)、因特網(wǎng)、電纜傳輸以及無線電傳輸其中之一。
36.如權(quán)利要求33所述的方法,其特征在于,所述附加內(nèi)容與所述原始內(nèi)容的重放在時間上同步地向用戶顯示。
37.如權(quán)利要求33所述的方法,其特征在于還包括播放與多個順序相鄰單詞關(guān)聯(lián)的所述原始內(nèi)容,其中單詞序列的長度和起始點隨用戶輸入而定。
38.如權(quán)利要求33所述的方法,其特征在于還包括播放多個順序相鄰單詞,其中重放速度響應(yīng)用戶輸入而調(diào)整。
39.如權(quán)利要求38所述的方法,其特征在于還包括相對于所述重放速度來調(diào)整聲音重放的音調(diào),從而提高所述原始內(nèi)容中存在的單詞的可理解性。
40.如權(quán)利要求38所述的方法,其特征在于還包括在所述重放過程中相對于所述重放速度來調(diào)整所述原始內(nèi)容中存在的單詞之間的時間間隔,從而改進對所述原始內(nèi)容中存在的單詞的識別。
41.如權(quán)利要求40所述的方法,其特征在于,所述時間間隔之間的所述原始內(nèi)容中存在的各個單詞保留其原始的自然音調(diào)和語音速率。
42.如權(quán)利要求33所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述原始內(nèi)容的數(shù)據(jù)庫、所述附加內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項;指定起始點和結(jié)束點、重放的時間順序、附加內(nèi)容以及所述重放的修改類型其中至少一項;以及播放符合所述指定的段。
43.如權(quán)利要求33所述的方法,其特征在于,所述附加內(nèi)容包括所述原始內(nèi)容的聲跡中講述的單詞的索引,所述方法還包括響應(yīng)用戶輸入而調(diào)整所述原始內(nèi)容的重放速度;調(diào)整單詞的音調(diào)和時間間隔其中至少一項,以便改進可理解性和識別其中至少一項;以及通過引用所述索引保持所講單詞與所述原始內(nèi)容中的特定點的相關(guān)性。
44.如權(quán)利要求33所述的方法,其特征在于,所述附加內(nèi)容包括所述原始內(nèi)容中講述的單詞的索引,所述方法還包括為所述索引中的多個單詞提供可聽發(fā)音的庫;以及響應(yīng)用戶輸入而播放所述發(fā)音。
45.如權(quán)利要求33所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述原始內(nèi)容的數(shù)據(jù)庫、所述附加內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項,以便標(biāo)識與所述原始內(nèi)容的段相關(guān)的受關(guān)注信息;以及在播放所述段之前呈現(xiàn)所述受關(guān)注信息。
46.如權(quán)利要求33所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述原始內(nèi)容的數(shù)據(jù)庫、所述附加內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項,以便標(biāo)識與所述原始內(nèi)容的段相關(guān)的受關(guān)注信息;以及提示用戶進行附加輸入,所述附加輸入導(dǎo)致對所述重放的進一步修改。
47.如權(quán)利要求33所述的方法,其特征在于還包括提供到通過分布式網(wǎng)絡(luò)可訪問的其它內(nèi)容的鏈接。
48.如權(quán)利要求42所述的方法,其特征在于,所述修改類型包括播放可聽的附加內(nèi)容。
49.如權(quán)利要求33所述的方法,其特征在于還包括根據(jù)對用戶授予的權(quán)限來控制對內(nèi)容和功能其中至少一項的訪問。
50.如權(quán)利要求49所述的方法,其特征在于,根據(jù)所接收的付款來授予權(quán)限。
51.一種方法,包括呈現(xiàn)原始內(nèi)容,其中包括最初主要為了非語言學(xué)習(xí)目的而制作的視頻或音頻內(nèi)容其中至少一項;向用戶提供輔助,以幫助語言學(xué)習(xí);觀察用戶的活動;推導(dǎo)用戶的語言知識程度;以及自動調(diào)整對用戶的輔助形式。
52.如權(quán)利要求51所述的方法,其特征在于還包括經(jīng)由相同數(shù)字媒體傳遞所述原始內(nèi)容與附加內(nèi)容;其中所述附加內(nèi)容包括所述原始內(nèi)容中存在的單詞的文本數(shù)據(jù)庫;以及其中所述附加內(nèi)容還包括有關(guān)所述單詞的信息。
53.如權(quán)利要求51所述的方法,其特征在于還包括將來自分開的數(shù)字媒體的附加內(nèi)容與所述原始內(nèi)容結(jié)合;其中所述附加內(nèi)容包括所述原始內(nèi)容中存在的單詞的文本數(shù)據(jù)庫;以及其中所述附加內(nèi)容還包括有關(guān)所述單詞的信息。
54.如權(quán)利要求51所述的方法,其特征在于還包括播放與多個順序相鄰單詞關(guān)聯(lián)的所述原始內(nèi)容,其中所述單詞序列的長度和起始點隨用戶輸入而定。
55.如權(quán)利要求51所述的方法,其特征在于還包括播放多個順序相鄰單詞,其中重放速度響應(yīng)用戶輸入而調(diào)整。
56.如權(quán)利要求55所述的方法,其特征在于還包括相對于所述重放速度來調(diào)整聲音重放的音調(diào),從而提高可聽單詞的可理解性。
57.如權(quán)利要求55所述的方法,其特征在于還包括在所述重放中相對于所述重放速度來調(diào)整可聽單詞之間的時間間隔,從而改進對所述可聽單詞的識別。
58.如權(quán)利要求57所述的方法,其特征在于,所述時間間隔之間的各個可聽單詞保留其原始的自然音調(diào)和語音速率。
59.如權(quán)利要求51所述的方法,其特征在于還包括在重放過程中,基于所述知識程度在某個點自動暫停所述內(nèi)容并持續(xù)一段時間。
60.如權(quán)利要求59所述的方法,其特征在于還包括在暫停過程中根據(jù)所述知識程度自動提供附加內(nèi)容。
61.如權(quán)利要求51所述的方法,其特征在于還包括提示用戶指明他們是否希望更多或更少輔助。
62.如權(quán)利要求51所述的方法,其特征在于還包括提供包括在所述原始內(nèi)容的聲跡中所講單詞的索引的附加內(nèi)容;響應(yīng)用戶輸入而調(diào)整所述原始內(nèi)容的重放速度;調(diào)整單詞的音調(diào)和時間間隔其中至少一項,以便改進可理解性和識別其中至少一項;以及通過引用所述索引保持所講單詞與所述內(nèi)容中的特定點的相關(guān)性。
63.如權(quán)利要求51所述的方法,其特征在于還包括提供包括在所述原始內(nèi)容中所講單詞的索引的附加內(nèi)容;為所述索引中的多個單詞提供可聽發(fā)音的庫;以及響應(yīng)用戶輸入而播放所述發(fā)音。
64.如權(quán)利要求51所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述原始內(nèi)容的數(shù)據(jù)庫、附加內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項,以便標(biāo)識與所述原始內(nèi)容的段相關(guān)的受關(guān)注信息;在播放所述段之前呈現(xiàn)所述受關(guān)注信息。
65.如權(quán)利要求51所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述原始內(nèi)容的數(shù)據(jù)庫、附加內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項,以便標(biāo)識與所述原始內(nèi)容的段相關(guān)的受關(guān)注信息;以及提示用戶進行附加輸入,所述附加輸入導(dǎo)致對所述重放的進一步修改。
66.如權(quán)利要求51所述的方法,其特征在于還包括提供到通過分布式網(wǎng)絡(luò)可訪問的其它內(nèi)容的鏈接。
67.如權(quán)利要求51所述的方法,其特征在于還包括根據(jù)對用戶授予的權(quán)限來控制對內(nèi)容和功能其中至少一項的訪問。
68.如權(quán)利要求67所述的方法,其特征在于,根據(jù)所接收的付款來授予權(quán)限。
69.一種方法,包括獲取原始內(nèi)容,其中包括視頻和音頻可被動播放內(nèi)容其中至少一項;經(jīng)由相同類型的數(shù)字媒體傳遞所述原始內(nèi)容與附加內(nèi)容,所述附加內(nèi)容包括所述原始內(nèi)容中存在的多個單詞的文本數(shù)據(jù)庫;在所述數(shù)據(jù)庫中包含單詞與它們在所述原始內(nèi)容中出現(xiàn)的點之間的鏈接;以及提供訪問權(quán)以根據(jù)所述數(shù)據(jù)庫中的單詞來修改所述原始內(nèi)容的重放。
70.如權(quán)利要求69所述的方法,其特征在于還包括播放與多個順序相鄰單詞關(guān)聯(lián)的所述原始內(nèi)容,其中所述單詞序列的長度和起始點隨用戶輸入而定。
71.如權(quán)利要求69所述的方法,其特征在于還包括播放多個順序相鄰單詞,其中重放速度響應(yīng)用戶輸入而調(diào)整。
72.如權(quán)利要求71所述的方法,其特征在于還包括相對于所述重放速度來調(diào)整聲音重放的音調(diào),從而提高所講單詞的可理解性。
73.如權(quán)利要求71所述的方法,其特征在于還包括在所述重放中相對于所述重放速度來調(diào)整所講單詞之間的時間間隔,從而改進對所講單詞的識別。
74.如權(quán)利要求73所述的方法,其特征在于所述時間間隔之間的各個所講單詞保留其原始的自然音調(diào)和語音速率。
75.如權(quán)利要求69所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述原始內(nèi)容的數(shù)據(jù)庫、所述附加內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項;指定起始點和結(jié)束點、重放的時間順序、附加內(nèi)容以及所述重放的修改類型其中至少一項;以及播放符合所述指定的段。
76.如權(quán)利要求69所述的方法,其特征在于,所述附加內(nèi)容包括所述視頻或音頻內(nèi)容的聲跡中講述的單詞的索引,所述方法還包括響應(yīng)用戶輸入而調(diào)整所述內(nèi)容的重放速度;調(diào)整單詞的音調(diào)和時間間隔其中至少一項,以便改進可理解性和識別其中至少一項;以及通過引用所述索引保持所講單詞與所述內(nèi)容中的特定點的相關(guān)性。
77.如權(quán)利要求69所述的方法,其特征在于,所述附加內(nèi)容包括所述原始內(nèi)容中講述的單詞的索引,所述方法還包括為所述索引中的多個單詞提供可聽發(fā)音的庫;以及響應(yīng)用戶輸入而播放所述發(fā)音。
78.如權(quán)利要求69所述的方法,其特征在于還包括提供到關(guān)于所述原始內(nèi)容段中存在的單詞的信息的鏈接。
79.如權(quán)利要求69所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述原始內(nèi)容的數(shù)據(jù)庫、所述附加內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項,以便標(biāo)識與所述原始內(nèi)容的段相關(guān)的受關(guān)注信息;在播放所述段之前呈現(xiàn)所述受關(guān)注信息。
80.如權(quán)利要求69所述的方法,其特征在于還包括分析用戶輸入、所述用戶輸入的上下文、所述原始內(nèi)容的數(shù)據(jù)庫、所述附加內(nèi)容的數(shù)據(jù)庫以及用戶信息的數(shù)據(jù)庫其中至少一項,以便標(biāo)識與所述原始內(nèi)容的段相關(guān)的受關(guān)注信息;以及提示用戶進行附加輸入,所述附加輸入導(dǎo)致對所述重放的進一步修改。
81.如權(quán)利要求69所述的方法,其特征在于還包括提供到通過分布式網(wǎng)絡(luò)可訪問的其它內(nèi)容的鏈接。
82.如權(quán)利要求75所述的方法,其特征在于,所述修改類型包括播放可聽的附加內(nèi)容。
83.如權(quán)利要求69所述的方法,其特征在于還包括根據(jù)對用戶授予的權(quán)限來控制對內(nèi)容和功能其中至少一項的訪問。
84.如權(quán)利要求83所述的方法,其特征在于,根據(jù)所接收的付款來授予權(quán)限。
85.一種方法,包括在非易失性存儲器中存儲可被動播放的視頻內(nèi)容的重放中最近播放的點;允許終止重放會話;以及在相同內(nèi)容的后續(xù)重放時,返回到所述重放中的相同點。
86.一種其中存儲了指令集的機器可讀媒體,所述指令集被執(zhí)行時,使機器完成包括以下各項的一組操作獲取包含聲音記錄的原始數(shù)字音頻內(nèi)容;提供包含所述聲音記錄中存在的單詞的文本的附加數(shù)字內(nèi)容;以及提供單詞的文本與單詞在其中發(fā)聲的原始內(nèi)容的段之間的鏈接。
87.一種其中存儲了指令集的機器可讀媒體,所述指令集被執(zhí)行時,使機器完成包括以下各項的一組操作定義音頻和視頻數(shù)字內(nèi)容其中至少一項中的段;向所述段分配至少一種屬性;經(jīng)由相同類型的媒體傳遞所述段和屬性分配信息;提供接受關(guān)于所述屬性的用戶指定的界面;以及提供訪問權(quán)以修改符合所述指定的所述媒體的呈現(xiàn)。
88.一種其中存儲了指令集的機器可讀媒體,所述指令集被執(zhí)行時,使機器完成包括以下各項的一組操作獲取原始內(nèi)容,其中包括最初主要為了非語言學(xué)習(xí)目的而制作的視頻和音頻內(nèi)容其中至少一項;經(jīng)由相同數(shù)字媒體傳遞所述原始內(nèi)容與附加內(nèi)容;其中所述附加內(nèi)容包括所述原始內(nèi)容中存在的單詞的文本數(shù)據(jù)庫;以及其中所述附加內(nèi)容還包括有關(guān)所述單詞的信息。
89.一種其中存儲了指令集的機器可讀媒體,所述指令集被執(zhí)行時,使機器完成包括以下各項的一組操作呈現(xiàn)原始內(nèi)容,其中包括最初主要為了非語言學(xué)習(xí)目的而制作的視頻或音頻內(nèi)容其中至少一項;向用戶提供輔助,以幫助語言學(xué)習(xí);觀察用戶的活動;推導(dǎo)用戶的語言知識程度;以及自動調(diào)整對用戶的輔助形式。
90.一種其中存儲了指令集的機器可讀媒體,所述指令集被執(zhí)行時,使機器完成包括以下各項的一組操作獲取原始內(nèi)容,其中包括視頻和音頻可被動播放內(nèi)容其中至少一項;經(jīng)由相同類型的數(shù)字媒體傳遞所述原始內(nèi)容與附加內(nèi)容,所述附加內(nèi)容包括所述原始內(nèi)容中存在的多個單詞的文本數(shù)據(jù)庫;在所述數(shù)據(jù)庫中包含單詞與它們在所述原始內(nèi)容中出現(xiàn)的點之間的鏈接;以及提供訪問權(quán)以根據(jù)所述數(shù)據(jù)庫中的單詞來修改所述原始內(nèi)容的重放。
91.一種其中存儲了指令集的機器可讀媒體,所述指令集被執(zhí)行時,使機器完成包括以下各項的一組操作在非易失性存儲器中存儲可被動播放的視頻內(nèi)容的重放中最近播放的點;允許終止重放會話;以及在相同內(nèi)容的后續(xù)重放時,返回到所述重放中的相同點。
92.一種其中存儲了指令集的機器可讀媒體,所述指令集被執(zhí)行時,使機器完成包括以下各項的一組操作獲取原始內(nèi)容,其中包括視頻和音頻可被動播放內(nèi)容其中至少一項;經(jīng)由相同類型的數(shù)字媒體傳遞所述原始內(nèi)容與附加內(nèi)容,所述附加內(nèi)容包括在所述原始內(nèi)容中存在的多個單詞的文本數(shù)據(jù)庫;在非易失性存儲器中存儲所述原始內(nèi)容的重放中最近播放的點;允許終止重放會話;以及在相同內(nèi)容的后續(xù)重放時返回到所述重放中的已定義點,其中所述已定義點根據(jù)對所述內(nèi)容的分析來確定。
93.如權(quán)利要求92所述的機器可讀媒體,其特征在于,所述已定義點在重放的最后點之前,并且通過確定句子、對話交流、場景、主題或內(nèi)容的其它邏輯段其中至少一項的開始位置來確定。
94.如權(quán)利要求92所述的機器可讀媒體,其特征在于,所述已定義點在重放的最后點之前,通過考慮自上一次重放會話以來經(jīng)過的時間來確定。
全文摘要
結(jié)合擴充語言學(xué)習(xí)內(nèi)容(500)和娛樂媒體(707)使用預(yù)先存在的娛樂媒體、如DVD上的故事片或音樂或CD(101)的學(xué)習(xí)系統(tǒng)。用于觀看或收聽擴充內(nèi)容和娛樂媒體的播放器(250)。播放器可包括諸如父母控制(151)、位置跟蹤(153)和推理機(155)之類的特征。
文檔編號G09B5/06GK1742300SQ200480002864
公開日2006年3月1日 申請日期2004年1月27日 優(yōu)先權(quán)日2003年1月30日
發(fā)明者M·J·G·格萊斯納, M·S·奈頓, T·C·莫耶爾, P·J·德勞倫蒂斯 申請人:電影教學(xué)系統(tǒng)股份有限公司