專(zhuān)利名稱(chēng)::多媒體打印驅(qū)動(dòng)器對(duì)話界面的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及提供多媒體打印界面的系統(tǒng)和方法。本發(fā)明尤其涉及提供允許用戶(hù)格式化多媒體數(shù)據(jù)以生成多媒體數(shù)據(jù)表示(representation)的打印驅(qū)動(dòng)器對(duì)話界面的系統(tǒng)和方法。
背景技術(shù):
:當(dāng)今流行系統(tǒng)中的打印機(jī)沒(méi)有被設(shè)計(jì)成用于生成多媒體文檔。目前還沒(méi)有任何有效的用于以紙張或數(shù)字格式生成易讀的多媒體內(nèi)容的表示方法。幾種不同的技術(shù)和工具可用于訪問(wèn)和引導(dǎo)多媒體信息(例如現(xiàn)有的多媒體播放器)。但是,這些技術(shù)和工具中沒(méi)有一個(gè)為用戶(hù)提供生成使用戶(hù)能夠容易觀察的多媒體文檔并使用戶(hù)通過(guò)其能夠獲得訪問(wèn)多媒體內(nèi)容的選項(xiàng)。當(dāng)今流行系統(tǒng)中的打印機(jī)通常沒(méi)有被設(shè)計(jì)成便于與多媒體內(nèi)容或與打印機(jī)內(nèi)容交互操作。標(biāo)準(zhǔn)的打印機(jī)對(duì)話框?yàn)橛脩?hù)提供了打印作業(yè)中的一些通用的格式化選項(xiàng),諸如將被打印的頁(yè)數(shù)、打印份數(shù)等。但是,流行操作系統(tǒng)中的打印機(jī)驅(qū)動(dòng)器沒(méi)有被設(shè)計(jì)成便于交互操作信息的集聚。由于打印作業(yè)能夠被重定向到另一臺(tái)打印機(jī),或打印協(xié)議不允許這樣的交互會(huì)話,所以不能保證操作系統(tǒng)與用戶(hù)之間的交互操作。由于打印機(jī)交互操作中的這些限制,所以,用戶(hù)不能在標(biāo)準(zhǔn)打印中定義更詳細(xì)的打印選擇。而且,由于目前沒(méi)有獲得這種打印能力,所以,用戶(hù)不能在所有相關(guān)的多媒體內(nèi)容上定義任何打印選擇。因此,用戶(hù)不能使用當(dāng)前打印對(duì)話框選擇希望打印的多媒體內(nèi)容段。當(dāng)前打印對(duì)話框也不允許用戶(hù)預(yù)覽任何多媒體內(nèi)容。而且,沒(méi)有任何方法使用戶(hù)經(jīng)過(guò)冗長(zhǎng)的多媒體段搜索感興趣的特性。例如,目前用戶(hù)不能在新聞段中搜索轉(zhuǎn)換成特定主題的內(nèi)容,也不能在新聞段中搜索特定面孔或事件。此外,不能為所選擇的多媒體內(nèi)容段定義打印格式,也不能通過(guò)打印對(duì)話框直接預(yù)覽或修改打印格式。因此,所需要的是克服現(xiàn)有技術(shù)中發(fā)現(xiàn)的上述限制的、允許用戶(hù)交互操作和控制多媒體表示的生成的系統(tǒng)和方法。
發(fā)明內(nèi)容通過(guò)提供允許用戶(hù)與媒體內(nèi)容分析處理和媒體表示生成處理交互操作的用戶(hù)界面的系統(tǒng)和方法,本發(fā)明克服了現(xiàn)有技術(shù)的不足和限制。本發(fā)明系統(tǒng)包括用戶(hù)界面,用于允許用戶(hù)控制媒體內(nèi)容分析和媒體表示生成;一媒體分析軟件模塊分析和識(shí)別媒體內(nèi)容的特征。此外,系統(tǒng)可以包括一輸出設(shè)備驅(qū)動(dòng)器模塊,用于接收用戶(hù)的指令和驅(qū)動(dòng)媒體內(nèi)容分析和媒體表示生成。例如,該媒體分析軟件模塊識(shí)別諸如面孔、語(yǔ)音、文本等的特征。系統(tǒng)還包括一附加輸出設(shè)備,用于生成媒體表示。處理邏輯管理用戶(hù)界面的顯示,以允許用戶(hù)控制多媒體表示的生成。處理邏輯還控制可打印多媒體表示的生成。所述表示能夠以基于紙件格式、數(shù)字格式或其它任何表示格式生成。用戶(hù)界面包括許多區(qū)域,經(jīng)過(guò)這些區(qū)域,用戶(hù)能夠?yàn)g覽媒體內(nèi)容并修改正生成的媒體表示。本發(fā)明的方法包括與用戶(hù)界面交互操作以控制媒體內(nèi)容分析和媒體表示生成;該方法還包括分析媒體內(nèi)容的特征,用于媒體表示的生成;驅(qū)動(dòng)媒體數(shù)據(jù)分析;以及通過(guò)接收指令和發(fā)送與媒體表示參數(shù)有關(guān)的指令驅(qū)動(dòng)媒體表示生成。此外該方法能夠包括生成一媒體表示。通過(guò)舉例而不是通過(guò)附圖中的各圖進(jìn)行限制的方式對(duì)本發(fā)明進(jìn)行說(shuō)明,其中相同的附圖符記代表相同的組件。圖1的框圖示出了一種用于在生成多媒體數(shù)據(jù)的表示之前提供允許用戶(hù)格式化多媒體數(shù)據(jù)的打印驅(qū)動(dòng)器對(duì)話界面的系統(tǒng);圖2是圖1系統(tǒng)的一個(gè)實(shí)施例的示范性結(jié)構(gòu)的框圖;圖3是與打印機(jī)的交互通信的示范表示;圖4是示范的多媒體重現(xiàn)應(yīng)用程序的圖形表示,其中該應(yīng)用程序中插入有打印選擇按鈕;圖5是在執(zhí)行任何多媒體變換之前,用戶(hù)控制的系統(tǒng)方法的流程圖;圖6是當(dāng)配置系統(tǒng)傳輸多媒體數(shù)據(jù)、執(zhí)行缺省變換和在圖形用戶(hù)界面中顯示結(jié)果時(shí)系統(tǒng)控制的方法的流程圖;圖7是顯示生成包括用戶(hù)選擇的音頻文件范圍的表示的示范用戶(hù)界面的圖形表示;圖8是格式化多媒體表示的示范圖形用戶(hù)界面提供選項(xiàng)的圖形表示;圖9是顯示生成音頻文件雙頁(yè)簡(jiǎn)圖的示范圖形用戶(hù)界面的圖形表示;圖10是顯示將音頻文件的時(shí)間線分成兩部分的示范圖形用戶(hù)界面的圖形表示;圖11是顯示將音頻文件的時(shí)間線分成兩個(gè)垂直部分的示范圖形用戶(hù)界面的圖形表示;圖12是顯示生成包括用戶(hù)選擇的視頻文件范圍的表示的示范用戶(hù)界面的圖形表示;圖13是顯示用于預(yù)覽多媒體內(nèi)容的預(yù)覽區(qū)域的示范用戶(hù)界面的圖形表示;圖14是顯示在預(yù)覽區(qū)域中使用段指示器按鈕的示范用戶(hù)界面的圖形表示;圖15是顯示提供選項(xiàng)給用戶(hù)的對(duì)話框的示范用戶(hù)界面的圖形表示;圖16是顯示編輯視頻段的對(duì)話框的示范用戶(hù)界面的圖形表示;圖17是顯示生成其中已經(jīng)使用了面孔檢測(cè)技術(shù)的視頻表示的示范用戶(hù)界面的圖形表示;圖18是顯示從多個(gè)源中生成視頻表示的示范用戶(hù)界面的圖形表示;圖19是顯示生成其中已經(jīng)使用用戶(hù)定義組合的分析技術(shù)的視頻表示的示范用戶(hù)界面的圖形表示;圖20是包括視頻格式和文本的示范多媒體表示的圖形表示。具體實(shí)施例方式描述了一種用于提供圖形用戶(hù)界面、或打印驅(qū)動(dòng)器對(duì)話界面的系統(tǒng)和方法,其允許用戶(hù)與多媒體表示生成處理交互操作。根據(jù)本發(fā)明的實(shí)施例,提供顯示可以存儲(chǔ)在多媒體文檔中的多媒體信息的圖形用戶(hù)界面。根據(jù)本發(fā)明的教導(dǎo),該界面使用戶(hù)能夠通過(guò)在多媒體文檔中存儲(chǔ)的多媒體信息進(jìn)行指導(dǎo)。對(duì)本發(fā)明來(lái)說(shuō),術(shù)語(yǔ)“媒體”、“多媒體”、“多媒體內(nèi)容”、“多媒體數(shù)據(jù)”或“多媒體信息”表示文本信息、圖形信息、動(dòng)畫(huà)信息、聲音(音頻)信息、視頻信息、幻燈片信息、白板圖像信息以及其它類(lèi)型信息中的任何一種信息。例如電視廣播的視頻記錄可以包括視頻信息和音頻信息。在某些例子中,視頻記錄也可以包括標(biāo)題受到限制(close-captionedCC)的文本信息,其包括與視頻信息相關(guān)的素材,并且在許多情況下,是視頻記錄的音頻部分中所包含語(yǔ)音的準(zhǔn)確表示。多媒體信息還用于表示包括一個(gè)或多個(gè)對(duì)象的信息,其中對(duì)象包含不同類(lèi)型的信息。例如,在多媒體信息中包含的多媒體對(duì)象可以包括文本信息、圖形信息、動(dòng)畫(huà)信息、聲音(音頻)信息、視頻信息、幻燈片信息、白板圖像信息以及其它類(lèi)型信息。對(duì)于本發(fā)明來(lái)說(shuō),當(dāng)提到在某種類(lèi)型介質(zhì)上打印時(shí)采用的術(shù)語(yǔ)“打印”、“打印中”意在包括以數(shù)字格式生成打印、寫(xiě)入、畫(huà)出、刻印、浮雕以及其它格式生成數(shù)據(jù)表示。還對(duì)于本發(fā)明來(lái)說(shuō),系統(tǒng)生成的輸出將被稱(chēng)為“媒體表示”、“多媒體文檔”、“多媒體表示”、“文檔”、“紙件文檔”、或者“視頻紙件”或“音頻紙件”之一。盡管術(shù)語(yǔ)“文檔”和“紙件”在這些術(shù)語(yǔ)中被使用,但是本發(fā)明系統(tǒng)的輸出不限于這種象紙件介質(zhì)的物理介質(zhì)。而是,上述術(shù)語(yǔ)可以指固定在有形介質(zhì)中的任何輸出。在一些實(shí)施例中,本發(fā)明系統(tǒng)的輸出可以是打印在實(shí)際紙件文檔上的多媒體內(nèi)容的表示。以紙件格式,多媒體文檔利用了紙張的高分辨率和便攜性,并提供多媒體信息的可讀表示。根據(jù)本發(fā)明的教導(dǎo),多媒體文檔還可以用于選擇、檢索和訪問(wèn)多媒體信息。在另一些實(shí)施例中,系統(tǒng)的輸出能夠以數(shù)字格式或某種其它有形介質(zhì)來(lái)存在。而且,本發(fā)明的輸出可以指以數(shù)字格式存儲(chǔ)多媒體信息的任何存儲(chǔ)單元(例如一個(gè)文件)。各種不同格式可以用于存儲(chǔ)多媒體信息。這些格式包括各種MPEG格式(例如MPEG1、MPEG2、MPEG4、MPEG7等)、MP3格式、SMIL格式、HTML+TIME格式、WMF(視窗媒體格式)、RM(實(shí)時(shí)媒體)格式、Quicktime格式、Shockwave格式、各種流媒體格式、由工程團(tuán)體正在開(kāi)發(fā)的格式、專(zhuān)用和定制的格式、以及其它格式。在下面的說(shuō)明中,為了解釋的目的,闡明了許多特定細(xì)節(jié)以提供對(duì)本發(fā)明的完整理解。但是,本領(lǐng)域技術(shù)人員將明白,不需要這些特定細(xì)節(jié)也能夠?qū)崿F(xiàn)本發(fā)明。在另一些情況下,結(jié)構(gòu)和設(shè)備以框圖形式示出從而避免混淆本發(fā)明。例如本發(fā)明的某些特征基本參照視頻內(nèi)容進(jìn)行說(shuō)明。雖然說(shuō)明書(shū)僅僅參照視頻信息討論了本發(fā)明的這些特征,但是這些特征可以應(yīng)用到包括音頻內(nèi)容的任何類(lèi)型的媒體內(nèi)容。說(shuō)明書(shū)中提到的“一個(gè)實(shí)施例”或“實(shí)施例”指結(jié)合該實(shí)施例描述的特定特征、結(jié)構(gòu)或特點(diǎn)包含在本發(fā)明的至少一個(gè)實(shí)施例中。在說(shuō)明書(shū)不同地方出現(xiàn)的短語(yǔ)“在一個(gè)實(shí)施例中”不必都指相同的實(shí)施例。參照?qǐng)D1,該圖示出了提供一圖形用戶(hù)界面的示范性系統(tǒng)100,其允許用戶(hù)格式化用于生成多媒體表示的多媒體數(shù)據(jù)。在該實(shí)施例中,示出了一個(gè)增加的輸出設(shè)備或打印機(jī)102,用于生成多媒體表示。打印機(jī)102顯示諸如音頻或視頻數(shù)據(jù)的多媒體數(shù)據(jù),使用戶(hù)能夠通過(guò)用戶(hù)界面或打印驅(qū)動(dòng)器對(duì)話界面(PDDI)122管理和編輯該多媒體數(shù)據(jù)。盡管術(shù)語(yǔ)“打印驅(qū)動(dòng)器對(duì)話界面”或“PDDI”將被用于指出圖形用戶(hù)界面,但是圖形用戶(hù)界面并不限于打印機(jī),并可以是提供下述功能的任何圖形用戶(hù)界面。顯示在PDDI122中的多媒體信息可以存儲(chǔ)在能被系統(tǒng)100訪問(wèn)的多媒體文檔中。多媒體信息可以直接存儲(chǔ)在系統(tǒng)100上,或多媒體信息可以是存儲(chǔ)在通過(guò)連接器140能夠由系統(tǒng)100進(jìn)行訪問(wèn)的外部存儲(chǔ)設(shè)備或服務(wù)器(未示出)中的信息。在另一些實(shí)施例中,代替訪問(wèn)多媒體文檔的是系統(tǒng)100可以從多媒體信息源接收多媒體信息流(流媒體信號(hào)、有線信號(hào)等)。根據(jù)本發(fā)明的實(shí)施例,系統(tǒng)100存儲(chǔ)多媒體文檔中的多媒體信息信號(hào)并接著生成顯示該多媒體信息的界面122。能夠提供多媒體信息給系統(tǒng)100的信息源的例子包括電視機(jī)、電視廣播接收機(jī)、錄像機(jī)、數(shù)字錄像機(jī)、個(gè)人數(shù)字助理(PDA)等。例如,多媒體信息源可以體現(xiàn)為被結(jié)構(gòu)成能夠接收多媒體廣播信號(hào)并將這些信號(hào)發(fā)送給系統(tǒng)100的電視機(jī)。在這個(gè)例子中,信息源可以是將廣播電視饋給信息提供給系統(tǒng)100的電視接收機(jī)/天線。信息源也可以是提供記錄的視頻和/或音頻流給系統(tǒng)100的諸如錄像機(jī)、DVD播放機(jī)、CD播放機(jī)等的設(shè)備。在另一個(gè)實(shí)施例中,信息源可以是能夠提供所捕捉的表示或會(huì)議信息流給系統(tǒng)100的所述表示或會(huì)議記錄設(shè)備。另外,多媒體信息源可以是被結(jié)構(gòu)成用于(例如通過(guò)無(wú)線鏈路)從外部源捕捉或接收多媒體信息、并接著將所捕捉的多媒體信息提供給系統(tǒng)100以便進(jìn)一步處理的接收機(jī)(例如衛(wèi)星碟形天線或有線接收器)。多媒體內(nèi)容可以源于專(zhuān)有的或定制的多媒體播放機(jī),諸如RealPlayerTM、微軟視窗媒體播放器等。在另一個(gè)實(shí)施例中,系統(tǒng)100可以被結(jié)構(gòu)成用于截取由多媒體信息源接收的多媒體信號(hào)。系統(tǒng)100可以直接從多媒體信息源接收多媒體信息或者可以有選擇地通過(guò)通信網(wǎng)絡(luò)接收信息。所增加的輸出設(shè)備或打印機(jī)102包括多個(gè)組件,包括傳統(tǒng)打印機(jī)103、媒體分析軟件模塊104、處理邏輯106和數(shù)字媒體輸出108。打印機(jī)102的傳統(tǒng)打印機(jī)組件103可以包括諸如噴墨打印機(jī)、激光打印機(jī)之類(lèi)的標(biāo)準(zhǔn)或傳統(tǒng)打印設(shè)備或其它打印設(shè)備的全部或某些性能。因此,傳統(tǒng)打印機(jī)103具有打印紙件文檔的功能,并還可以具有傳真機(jī)、復(fù)印機(jī)以及生成物理文檔的其它設(shè)備的性能。在Hart等人于2004年3月30日提交的名稱(chēng)為“NetworkedPrintingSystemHavingEmbeddedFunctionalityforPrintingTime-BasedMedia”的、案卷號(hào)為20412-8341的美國(guó)專(zhuān)利申請(qǐng)中提供了關(guān)于打印系統(tǒng)的更多的信息,其中聯(lián)網(wǎng)的打印系統(tǒng)通過(guò)共享打印機(jī)和諸如計(jì)算機(jī)系統(tǒng)的附加網(wǎng)絡(luò)設(shè)備上的處理資源能夠打印基于時(shí)間的媒體。根據(jù)所接收的基于時(shí)間的媒體數(shù)據(jù),打印系統(tǒng)生成紙件或其它的打印輸出以及相關(guān)的電子輸出??傊?,打印的和電子的輸出提供了基于時(shí)間的媒體的表示。根據(jù)所需要的打印機(jī)應(yīng)用,打印機(jī)可以包括用于接收媒體數(shù)據(jù)、打印所印刷的輸出以及生成電子輸出的任一組合機(jī)制。媒體分析軟件模塊104包括音頻和視頻內(nèi)容識(shí)別和處理軟件。媒體分析軟件模塊104可以位于打印機(jī)102上或可位于諸如個(gè)人計(jì)算機(jī)(PC)的遠(yuǎn)端上。這種多媒體分析軟件的一些例子包括但不限于視頻事件檢測(cè)、視頻前景/背景分割、面孔檢測(cè)、面孔圖像匹配、面孔識(shí)別、面孔分類(lèi)(cataloging)、視頻文本定位、視頻光學(xué)字符識(shí)別(OCR)、語(yǔ)言翻譯、幀分類(lèi)、剪切分類(lèi)、圖像擬合(stitching)、音頻重定格式、話音識(shí)別、音頻事件檢測(cè)、音頻波形匹配、音頻字幕對(duì)準(zhǔn)、視頻OCR和字幕對(duì)準(zhǔn)。一旦用戶(hù)在系統(tǒng)100內(nèi)選擇了“打印”,系統(tǒng)100能夠使用這些技術(shù)中的一種或多種分析多媒體內(nèi)容,并能夠向用戶(hù)提供分析結(jié)果,用戶(hù)能夠根據(jù)該分析結(jié)果生成文檔。在圖1所示的實(shí)施例中,打印機(jī)102附加地包括處理邏輯106,用于控制PDDI122和管理打印機(jī)102的多媒體文檔120或媒體表示的生成。例如,處理邏輯106管理PDDI122的顯示,以允許用戶(hù)控制某些打印機(jī)行為,諸如是多媒體內(nèi)容的處理或被用于在多媒體表現(xiàn)中顯示多媒體內(nèi)容的格式的處理。此外,能夠經(jīng)過(guò)網(wǎng)絡(luò)界面提供PDDI122的功能,以允許用戶(hù)通過(guò)該網(wǎng)絡(luò)界面管理諸如發(fā)出格式化命令的管理打印機(jī)行為。在圖1所示的例子中,PDDI122顯示了用戶(hù)的選擇,包括顯示視頻內(nèi)容的多媒體文檔120的打印。在這個(gè)例子中,用戶(hù)已經(jīng)選擇以視頻紙件格式打印的多媒體內(nèi)容,并且視頻紙件將每場(chǎng)景一幀進(jìn)行顯示。另外,界面122包括顯示用戶(hù)正在創(chuàng)建的多媒體表示的預(yù)覽圖像的預(yù)覽區(qū)域124。在圖1的例子中,PDDI122示出了視頻幀的縮略圖142。此外,PDDI122能夠允許用戶(hù)設(shè)置與所生成的多媒體文檔120有關(guān)的格式選擇。在一些實(shí)施例中,用戶(hù)能夠設(shè)置關(guān)于文檔格式和布局、字體類(lèi)型和大小、每行顯示的信息、標(biāo)題顯示的信息、安排的各欄的大小和位置、字體顏色、行距、每行字?jǐn)?shù)、黑體和大寫(xiě)方法、打印的文檔的語(yǔ)言、紙張尺寸、紙張類(lèi)型等的選擇。例如用戶(hù)可以選擇使多媒體文檔包括大標(biāo)題、并以黑體表示所顯示多媒體內(nèi)容的名字(例如CNN新聞段),并且用戶(hù)可以選擇每頁(yè)將被顯示的視頻幀的排列。如圖1所示的實(shí)施例所示,被稱(chēng)為文檔格式規(guī)范(DFS)112的數(shù)據(jù)結(jié)構(gòu)由打印驅(qū)動(dòng)器軟件生成。DFS112表示多媒體數(shù)據(jù)的變形。DFS112用于填充(populate)PDDI122并由系統(tǒng)100修改。DFS112確定呈現(xiàn)給用戶(hù)的特征提取選項(xiàng),其可被應(yīng)用于多媒體數(shù)據(jù)。DFS112還確定用于生成輸出文檔的格式指南。DFS112可以由諸如PC上的打印驅(qū)動(dòng)器的外部應(yīng)用程序提供;或者可以在打印機(jī)102中內(nèi)部地確定。DFS112可以包括與多媒體文件相關(guān)的元數(shù)據(jù)信息,諸如與多媒體內(nèi)容的標(biāo)題、多媒體內(nèi)容的創(chuàng)作者/出版者等相關(guān)的信息。DFS112還能包括其它信息,諸如是多媒體段的開(kāi)始和結(jié)束時(shí)間(例如音頻記錄的開(kāi)始和結(jié)束時(shí)間)以及能沿時(shí)間線顯示的多媒體數(shù)據(jù)的圖形表示的參數(shù)(例如,表示音頻信號(hào)隨時(shí)間變化的幅值的波形)。DFS112還能包括與沿時(shí)間線顯示的時(shí)間戳標(biāo)記符和用于每個(gè)時(shí)間戳的元數(shù)據(jù)(例如原文標(biāo)簽或條碼)以及用于確定物理多媒體文檔120的出現(xiàn)的布局參數(shù)相關(guān)的規(guī)范。關(guān)于DFS112的更多信息和例子在Hull等人于2004年3月30日提交的名稱(chēng)為“PrintableRepresentationforTime-BasedMedia”的、案卷號(hào)為20412-8497的美國(guó)發(fā)明申請(qǐng)中提供,其中該系統(tǒng)允許用戶(hù)生成基于時(shí)間的媒體表示。該系統(tǒng)包括一用于從媒體內(nèi)容中提取特征的特征提取模塊。例如,特征提取模塊能夠檢測(cè)演奏中的獨(dú)奏、或者能夠檢測(cè)音樂(lè)、鼓掌歡呼聲等。格式化模塊對(duì)系統(tǒng)生成的媒體表示進(jìn)行格式化。格式化模塊也將特征提取信息應(yīng)用到表示,并根據(jù)表示參數(shù)格式化表示。另外,系統(tǒng)能夠包括增加的輸出設(shè)備,該增加的輸出設(shè)備根據(jù)特征提取信息和表示參數(shù)生成媒體表示。該表示能夠以基于紙件的格式、數(shù)字格式或其它任何表示格式來(lái)生成。所生成的表示可以包括用戶(hù)可選擇的識(shí)別符,該用戶(hù)可選擇的識(shí)別符能夠隨機(jī)訪問(wèn)沿媒體內(nèi)容時(shí)間線的各點(diǎn)。本發(fā)明的方法包括從媒體內(nèi)容中提取特征以及使用所提取的特征和根據(jù)定義所述表示格式的數(shù)據(jù)結(jié)構(gòu)的規(guī)范格式化正在生成的媒體表示。該方法還能夠包括根據(jù)格式化結(jié)果生成媒體表示。由打印機(jī)102生成的多媒體文檔120能夠包括各種格式。例如,多媒體文檔120能包括諸如圖1所示的視頻紙件形式的紙件文檔。打印機(jī)102生成的多媒體文檔120還能夠存儲(chǔ)在數(shù)字媒體144中。如圖1所示,該實(shí)施例中的打印機(jī)102包括數(shù)字媒體輸出設(shè)備或接口108。數(shù)字媒體寫(xiě)入硬件可包括例如網(wǎng)絡(luò)接口卡、數(shù)字視頻盤(pán)(DVD)寫(xiě)入器、安全數(shù)字(SD)寫(xiě)入器、光盤(pán)(CD)寫(xiě)入器等。多媒體內(nèi)容能夠存儲(chǔ)在諸如快閃媒體、DVD、CD等的數(shù)字媒體144上。多媒體文檔120可具有多種不同類(lèi)型的布局,并能顯示各種類(lèi)型的信息。圖1提供了顯示來(lái)自一個(gè)或多個(gè)新聞段的視頻幀的視頻紙件文檔的例子。在圖1所示的例子中,視頻紙件文檔包括從視頻信息中提取的幀132或縮略圖,并顯示用戶(hù)能夠預(yù)覽的視頻內(nèi)容。在這個(gè)實(shí)施例中,用戶(hù)能夠通過(guò)PDDI122指定視頻紙件文檔的格式化選擇。布局和格式信息可以規(guī)定用于提取多媒體幀132的采樣頻率、將被從視頻信息中提取的幀132的數(shù)量、幀132在介質(zhì)上的順序和放置位置以及其它類(lèi)似信息。對(duì)于視頻信息,打印機(jī)102能夠提取用于捕捉與多媒體信息的特定段相關(guān)的視頻(或具有信息價(jià)值的幀)的顯著特征的幀132。此外,如前所討論的,打印機(jī)102可以包括識(shí)別性能(例如面孔識(shí)別、面孔檢測(cè)、OCR等),允許用戶(hù)在感興趣的項(xiàng)目的視頻段內(nèi)搜索諸如特定的面孔圖像、以文本顯示的特定詞等等。例如,打印機(jī)102能夠使用面孔識(shí)別技術(shù)提取顯示用戶(hù)在瀏覽過(guò)程中感興趣的特定人的面孔圖像的幀。在本發(fā)明另一個(gè)實(shí)施例中,用戶(hù)可選擇的識(shí)別符134(例如條碼)與每個(gè)幀132相關(guān)聯(lián)。在圖1的例子中,用戶(hù)可選擇的識(shí)別符顯示在每一個(gè)幀132的下面,但是這些幀能夠可選地顯示在該頁(yè)的任何地方。用戶(hù)可選擇的識(shí)別符134用作允許用戶(hù)訪問(wèn)或檢索在多媒體文檔120上顯示的多媒體內(nèi)容的接口。用戶(hù)通過(guò)使用諸如蜂窩電話或PDA等其中被插入有條碼掃描器的任何設(shè)備掃描所打印紙件文檔上的適當(dāng)條碼來(lái)選擇用戶(hù)可選擇的識(shí)別符134。例如,通過(guò)掃描圖1的條碼,用戶(hù)能夠使視頻片段顯示在顯示設(shè)備(例如電視機(jī)、PC監(jiān)視器、蜂窩電話屏幕、PDA等)上,并且用戶(hù)能夠?yàn)g覽該內(nèi)容。作為另一個(gè)例子,紙件多媒體文檔120還可以包括或可選地包括靠近每一幀132的數(shù)字標(biāo)識(shí)符,并且用戶(hù)能夠?qū)⑦@些數(shù)字錄入到數(shù)字按鍵鍵盤(pán)或與設(shè)備有關(guān)的觸摸鍵盤(pán)以使系統(tǒng)100在顯示設(shè)備上顯示視頻片段。而且,如果圖1所示的視頻紙件文檔是數(shù)字格式的,則系統(tǒng)100能夠被結(jié)構(gòu)成使用戶(hù)能夠選擇幀132(即通過(guò)鼠標(biāo)或其它選擇設(shè)備點(diǎn)擊該幀)從而將該視頻內(nèi)容顯示在顯示設(shè)備上。打印機(jī)102能夠檢索與用戶(hù)可選擇標(biāo)識(shí)符134相對(duì)應(yīng)的多媒體信息。從選擇設(shè)備(即具有條碼掃描器的設(shè)備或用于輸入數(shù)字標(biāo)識(shí)符的數(shù)字按鍵鍵盤(pán))到打印機(jī)102通信的信號(hào)可以識(shí)別由用戶(hù)選擇的多媒體內(nèi)容幀132、將被顯示的多媒體內(nèi)容的位置、從中可以選擇某個(gè)段的多媒體紙件文檔、與用戶(hù)選擇的一個(gè)或多個(gè)多媒體顯示設(shè)備(例如電視機(jī))和/或選擇相關(guān)的信息以及其它類(lèi)似信息以方便所請(qǐng)求多媒體信息的檢索。例如系統(tǒng)100能夠訪問(wèn)PC上存儲(chǔ)的視頻文件,并且系統(tǒng)能夠播放用戶(hù)要求的這個(gè)視頻內(nèi)容。圖1的例子進(jìn)一步示出多媒體文檔120中每個(gè)幀132后面的文本信息。該文本信息包括揚(yáng)聲器名字字段126或顯示視頻的幀132中所示的人物名字(例如BritHume)的字段。文本信息還包括顯示有關(guān)視頻段主題(例如Intel-gate介紹)的主題字段128。另外,文本信息包括用于顯示視頻段時(shí)間長(zhǎng)度(例如3分52秒)的時(shí)間字段130。用戶(hù)也可以選擇作為文本而顯示并包括在多媒體文檔120中的幀132的某些音頻信息。例如,用戶(hù)可以選擇具有在多媒體幀132后面顯示的多媒體段的副本(例如新聞節(jié)目段的副本)的一部分。而在另一個(gè)例子中,用戶(hù)可以選擇包括在所打印文檔中的每個(gè)幀132的文本描述或內(nèi)容簡(jiǎn)介,諸如是特定電視段或節(jié)目的簡(jiǎn)短概述。用戶(hù)能夠使用打印驅(qū)動(dòng)器對(duì)話界面122來(lái)識(shí)別將被用于把音頻信息轉(zhuǎn)換為文本信息的技術(shù)(即用于生成音頻信息的文本副本的技術(shù))、用于打印音頻副本的格式和式樣(其可能與用于打印文本信息的相同)、用于打印有關(guān)多媒體內(nèi)容的簡(jiǎn)介文本的格式和式樣等等。此外,在前述的視頻紙件應(yīng)用程序中提供有與檢索多媒體信息和注釋多媒體信息相關(guān)的信息。現(xiàn)在參考圖2,該圖示出了本發(fā)明一實(shí)施例的結(jié)構(gòu)。在這個(gè)實(shí)施例中,系統(tǒng)200包括耦合到數(shù)據(jù)處理系統(tǒng)的打印機(jī)102,該數(shù)據(jù)處理系統(tǒng)在圖2的實(shí)施例中是PC230,但也可以是便攜計(jì)算機(jī)、工作站、計(jì)算機(jī)終端、網(wǎng)絡(luò)計(jì)算機(jī)、大型機(jī)、公用信息機(jī)、標(biāo)準(zhǔn)遙控器、PDA、游戲控制器、諸如蜂窩電話的通信設(shè)備或任何一種其它數(shù)據(jù)系統(tǒng)。打印機(jī)102也可以有選擇地耦合到網(wǎng)絡(luò)環(huán)境中的應(yīng)用程序服務(wù)器212上。在圖2的例子中,打印機(jī)102包括傳統(tǒng)打印機(jī)103、處理器214、多媒體存儲(chǔ)器202以及數(shù)字媒體輸入/輸出108。如上所述,傳統(tǒng)打印機(jī)103包括傳統(tǒng)打印機(jī)通常具有的標(biāo)準(zhǔn)打印能力。處理器214處理數(shù)據(jù)信號(hào)并可以包括各種計(jì)算結(jié)構(gòu),包括復(fù)雜指令集計(jì)算機(jī)(CISC)結(jié)構(gòu)、精簡(jiǎn)指令集計(jì)算機(jī)(RISC)結(jié)構(gòu)或?qū)崿F(xiàn)指令集組合的結(jié)構(gòu)。盡管在圖2中只示出了一種處理器,但是可以包括多種處理器。主存儲(chǔ)器(未示出)可以存儲(chǔ)可由處理器214執(zhí)行的指令和/或數(shù)據(jù),包括系統(tǒng)200的軟件和其它組件。指令和/或數(shù)據(jù)可以包括用于執(zhí)行這里所述的任何和/或全部技術(shù)的代碼。主存儲(chǔ)器(未示出)可以是動(dòng)態(tài)隨機(jī)存取存儲(chǔ)(DRAM)器件、靜態(tài)隨機(jī)存取存儲(chǔ)(SRAM)器件或本領(lǐng)域已知的某些其它存儲(chǔ)器件。如前所述,打印機(jī)102從某個(gè)源中訪問(wèn)或接收諸如音頻或視頻文件的多媒體信息。在一個(gè)實(shí)施例中,多媒體文件被存儲(chǔ)在諸如PC230的數(shù)據(jù)處理系統(tǒng)中,該數(shù)據(jù)處理系統(tǒng)通過(guò)信號(hào)線248耦合到計(jì)算機(jī)102。在圖2的實(shí)施例中,多媒體文件能夠存儲(chǔ)在PC230上的多媒體文件存儲(chǔ)器264中??梢詮囊恍┻h(yuǎn)程源(未示出)來(lái)訪問(wèn)該多媒體文件。作為另一個(gè)例子,多媒體文件可以存儲(chǔ)在打印機(jī)102自身的打印機(jī)多媒體存儲(chǔ)器202中,并且從這個(gè)存儲(chǔ)器202訪問(wèn)該文件。用戶(hù)能夠?yàn)g覽顯示設(shè)備(未示出)上的多媒體內(nèi)容以選擇利用打印機(jī)102打印的特定內(nèi)容,如上所述。顯示設(shè)備(未示出)可以包括陰極射線管(CRT)、諸如液晶顯示器(LCD)的平板設(shè)備、投影設(shè)備等。在另一些實(shí)施例中,打印機(jī)102包括LCD顯示屏或其它類(lèi)型的顯示屏,并且用戶(hù)能夠在打印機(jī)自身上顯示多媒體內(nèi)容。在圖2的實(shí)施例中,用戶(hù)使用PC230上允許用戶(hù)播放、存儲(chǔ)、索引和編輯的多媒體重現(xiàn)應(yīng)用程序(MRA)204瀏覽或操縱文件。MRA204的例子包括專(zhuān)用的或定制的多媒體播放器(例如RealNetworks提供的RealPlayerTM、微軟公司提供的微軟視窗媒體播放器、蘋(píng)果公司提供的QuickTimeTM播放器、Shockwave多媒體播放器等)、錄像機(jī)、電視機(jī)、PDA等。在圖2的實(shí)施例中,MRA204經(jīng)過(guò)總線244耦合到多媒體文件存儲(chǔ)器264。所存儲(chǔ)的多媒體內(nèi)容能夠通過(guò)MRA204被訪問(wèn)并被傳送到MRA204供用戶(hù)瀏覽。更多有關(guān)多媒體形象化的信息提供在下列美國(guó)專(zhuān)利申請(qǐng)中Graham于2001年2月21日提交的、名稱(chēng)為“MultimediaVisualizationandIntegrationEnvironment”的、美國(guó)專(zhuān)利申請(qǐng)?zhí)枮?0/081,129的申請(qǐng);Graham于2003年11月4日提交的、名稱(chēng)為“MultimediaVisualizationandIntegrationEnvironment”的、美國(guó)專(zhuān)利申請(qǐng)?zhí)枮?0/701,966的申請(qǐng);Graham等人于2003年6月18日提交的、名稱(chēng)為“InterfaceForPrintingMultimediaInformation”的、美國(guó)專(zhuān)利申請(qǐng)?zhí)枮?0/465,027的申請(qǐng);Graham等人于2003年6月18日提交的、名稱(chēng)為“TechniquesForDisplayingInformationStoredInMultipleMultimediaDocuments”的申請(qǐng);Graham于2002年6月17日提交的、名稱(chēng)為“Television-BasedVisualizationandNavigationInterface”的、美國(guó)專(zhuān)利申請(qǐng)?zhí)枮?0/174,522的申請(qǐng);以及Graham于2004年3月3日提交的、名稱(chēng)為“MultimediaVisualizationandIntegrationEnvironment”的申請(qǐng)。在圖2的實(shí)施例中,系統(tǒng)200還包括可位于PC230上或者另一個(gè)位置上的輸出設(shè)備驅(qū)動(dòng)器模塊或打印機(jī)驅(qū)動(dòng)器軟件模塊208。打印機(jī)驅(qū)動(dòng)器軟件模塊208在安裝時(shí)被結(jié)構(gòu)為執(zhí)行某些功能。打印機(jī)驅(qū)動(dòng)器軟件208在現(xiàn)有的諸如視窗媒體播放器的MRA204上添加“打印”功能??梢哉?qǐng)求可選的應(yīng)用程序插件206添加“打印”功能??蛇x地,用戶(hù)能夠安裝被設(shè)計(jì)用于此目的的單獨(dú)的MRA204。當(dāng)調(diào)用打印機(jī)102(即用戶(hù)選擇MRA204上的打印按鈕)時(shí),打印機(jī)驅(qū)動(dòng)器軟件模塊208通過(guò)信號(hào)線246接收來(lái)自MRA204的打印請(qǐng)求以及多媒體數(shù)據(jù)和其它相關(guān)信息。打印機(jī)驅(qū)動(dòng)器軟件模塊208經(jīng)過(guò)總線248將多媒體數(shù)據(jù)傳送到打印機(jī)102并指令打印機(jī)應(yīng)用特定的變換例程(例如面孔識(shí)別)。如果需要,打印機(jī)驅(qū)動(dòng)器軟件模塊208還能附加提示用戶(hù)確認(rèn)由用戶(hù)生成的結(jié)果和布局決定。當(dāng)打印機(jī)102接收打印請(qǐng)求時(shí),向處理器214傳送該請(qǐng)求和相關(guān)的多媒體數(shù)據(jù)。處理器214解釋該輸入并激活適當(dāng)?shù)哪K。處理器204被耦合到用于變換多媒體內(nèi)容的多媒體變換軟件模塊(MTS)(未示出)并對(duì)其進(jìn)行控制。如果處理器214已經(jīng)接收了該打印請(qǐng)求,那么,處理器214就可以根據(jù)用戶(hù)是否請(qǐng)求了多媒體數(shù)據(jù)的變換而激活MTS(未示出)。可以在打印機(jī)102上、PC230上(即通過(guò)安裝有打印機(jī)驅(qū)動(dòng)器208的軟件)或某個(gè)其它位置處進(jìn)行多媒體內(nèi)容的變換。MTS(未示出)對(duì)給定的音頻或視頻文件施加特定的變換功能。MTS(未示出)生成適當(dāng)?shù)幕谖臋n的表示并通過(guò)打印驅(qū)動(dòng)器對(duì)話界面與用戶(hù)交互操作來(lái)修改變換參數(shù)和預(yù)覽結(jié)果。多媒體變換的結(jié)果和參數(shù)表示在前述的文檔格式規(guī)范(DFS)中。如上所述,打印機(jī)102能夠包括多媒體存儲(chǔ)器202,用于存儲(chǔ)諸如視頻或音頻文件的多媒體數(shù)據(jù)。處理器214經(jīng)過(guò)總線251耦合到多媒體存儲(chǔ)器202上并能夠傳送多媒體數(shù)據(jù)到多媒體存儲(chǔ)器202。在執(zhí)行打印作業(yè)時(shí)也能存儲(chǔ)該數(shù)據(jù)。存儲(chǔ)器202可以包括多種存儲(chǔ)器,包括用于存儲(chǔ)程序執(zhí)行期間的指令和數(shù)據(jù)的主隨機(jī)存取存儲(chǔ)器(RAM)以及存儲(chǔ)固定指令的只讀存儲(chǔ)器(ROM)。存儲(chǔ)器202還可以包括用于諸如本領(lǐng)域已知的硬盤(pán)驅(qū)動(dòng)器、軟盤(pán)驅(qū)動(dòng)器、CD-ROM設(shè)備、DVD設(shè)備、DVD-RW設(shè)備或其它類(lèi)似存儲(chǔ)設(shè)備的程序和數(shù)據(jù)文件的永久(非易失性)存儲(chǔ)器。一個(gè)或多個(gè)驅(qū)動(dòng)器或設(shè)備可以位于另一個(gè)連接的計(jì)算機(jī)上的遠(yuǎn)端位置。處理器214還控制數(shù)字媒體輸入/輸出108。處理器214經(jīng)過(guò)總線250將信息傳送到數(shù)字媒體輸入/輸出108并從數(shù)字媒體輸入/輸出108接收信息。如前所述,所創(chuàng)建的多媒體文檔能夠被轉(zhuǎn)換成某種數(shù)字格式。數(shù)字媒體寫(xiě)入硬件例如可以包括網(wǎng)絡(luò)接口卡、數(shù)字視頻盤(pán)(DVD)寫(xiě)入器、安全數(shù)字(SD)寫(xiě)入器、光盤(pán)(CD)寫(xiě)入器等。數(shù)字輸出260文檔可以存儲(chǔ)在包括CD、DVD和快閃媒體等的數(shù)字媒體上。因此,用戶(hù)可以創(chuàng)建輸入音頻或視頻文件的數(shù)字輸出260版本,并且該版本能夠在諸如PC、蜂窩電話或PDA等的特定目標(biāo)設(shè)備上被瀏覽。處理器214還管理諸如視頻或音頻紙件文檔的多媒體文檔120的生成。如圖2所示,還可以在紙件文檔或多媒體文檔120中顯示多媒體信息。處理器214經(jīng)過(guò)總線252與傳統(tǒng)打印機(jī)103通信并將打印作業(yè)信息發(fā)送給傳統(tǒng)打印機(jī)103,并且傳統(tǒng)打印機(jī)103生成紙件輸出。所生成的多媒體文檔120包括通過(guò)識(shí)別軟件得到的輸入音頻或視頻文件信息的紙件表示。圖2實(shí)施例中的多媒體文檔120還可以包括諸如條碼的用戶(hù)可選擇的識(shí)別符,和到由打印機(jī)102存儲(chǔ)或存儲(chǔ)在規(guī)定在線數(shù)據(jù)庫(kù)中的多媒體數(shù)據(jù)的其它鏈接。處理器214還通過(guò)諸如網(wǎng)絡(luò)接口控制外部通信硬件。處理器214能夠經(jīng)過(guò)總線254將信息發(fā)送到應(yīng)用程序服務(wù)器212并從應(yīng)用程序服務(wù)器212接收信息。打印機(jī)102還能夠與應(yīng)用程序服務(wù)器212(例如“網(wǎng)站服務(wù)”或“網(wǎng)格計(jì)算”系統(tǒng))通信并從應(yīng)用程序服務(wù)器212獲得信息。在一個(gè)實(shí)施例中,系統(tǒng)200包括通信監(jiān)視模塊或用戶(hù)接口收聽(tīng)器模塊210(UI收聽(tīng)器)。在圖2的實(shí)施例中,UI收聽(tīng)器210位于PC230上,但是UI收聽(tīng)器也可以位于打印機(jī)102、應(yīng)用程序服務(wù)器212或某其它遠(yuǎn)端位置上。UI收聽(tīng)器210被耦合到MRA204并與其通信,并能經(jīng)過(guò)總線240發(fā)送和接收數(shù)據(jù)。具體地說(shuō),UI收聽(tīng)器210接收用戶(hù)對(duì)MRA的打印請(qǐng)求,并從遠(yuǎn)端組件(例如打印機(jī)102、應(yīng)用程序服務(wù)器212等)發(fā)送該請(qǐng)求給用戶(hù)。UI收聽(tīng)器210還耦合到打印機(jī)102并與其通信,并能經(jīng)過(guò)總線242發(fā)送和接收數(shù)據(jù)。具體地說(shuō),UI收聽(tīng)器210將打印請(qǐng)求傳送給打印機(jī)并從打印機(jī)102接收該請(qǐng)求用于來(lái)自用戶(hù)的進(jìn)一步信息。另外,UI收聽(tīng)器210能夠經(jīng)過(guò)網(wǎng)絡(luò)耦合到應(yīng)用程序服務(wù)器212并與其通信,并能經(jīng)過(guò)網(wǎng)絡(luò)連接器(未示出)發(fā)送和接收數(shù)據(jù)。UI收聽(tīng)器210從應(yīng)用程序服務(wù)器212接收諸如來(lái)自用戶(hù)的請(qǐng)求信息的信息,并且UI收聽(tīng)器210能夠返回一個(gè)應(yīng)答。UI收聽(tīng)器210和其功能將在下面更詳細(xì)地討論。參照?qǐng)D3,該圖示出了與系統(tǒng)200內(nèi)的打印機(jī)102交互通信的圖形表示。打印機(jī)驅(qū)動(dòng)器通常不方便于收集交互信息。一旦捕獲到初始打印機(jī)設(shè)置,通常不允許與打印機(jī)102進(jìn)行進(jìn)一步的交互操作。對(duì)這個(gè)問(wèn)題的一個(gè)解決方法是將元數(shù)據(jù)嵌入到打印流自身中。但是,響應(yīng)于根據(jù)由用戶(hù)提供數(shù)據(jù)進(jìn)行的計(jì)算,打印機(jī)102可能需要向用戶(hù)302要求更多的信息。此外,打印機(jī)102自身可能委托某些任務(wù)給其它的應(yīng)用程序服務(wù)器212,其它的應(yīng)用程序服務(wù)器212接著也可能需要更多來(lái)自用戶(hù)的信息。為了允許這種交互操作而不修改基礎(chǔ)操作系統(tǒng)的打印機(jī)驅(qū)動(dòng)器結(jié)構(gòu),可以構(gòu)建諸如圖3所示的一個(gè)附加機(jī)制。一個(gè)解決方案就是構(gòu)建是一程序的UI收聽(tīng)器210,它收聽(tīng)一網(wǎng)絡(luò)插口、接受信息請(qǐng)求、與用戶(hù)302交互操作以獲得這種數(shù)據(jù),然后將該數(shù)據(jù)發(fā)送回給請(qǐng)求者。這種程序可以具有固定的可能指令集或接受允許請(qǐng)求者顯示多種不同請(qǐng)求的靈活命令語(yǔ)法。這種命令語(yǔ)法的例子可以是用于顯示HTML形式的標(biāo)準(zhǔn)網(wǎng)絡(luò)瀏覽器的能力。通過(guò)遠(yuǎn)程服務(wù)器生成這些形式并通過(guò)瀏覽器進(jìn)行顯示,然后其將結(jié)果返回到服務(wù)器。在這個(gè)實(shí)施例中,UI收聽(tīng)器210與瀏覽器不同之處在于用戶(hù)302不生成觀看一個(gè)形式的初始請(qǐng)求。代替的,是由遠(yuǎn)端機(jī)器生成該請(qǐng)求。因此,在這個(gè)實(shí)施例中,UI收聽(tīng)器210是服務(wù)器而不是客戶(hù)機(jī)。因?yàn)檫@種網(wǎng)絡(luò)事項(xiàng)易于生成許多復(fù)雜的錯(cuò)誤條件,所以暫停(timeout)的系統(tǒng)允許進(jìn)行有效的操作。經(jīng)過(guò)網(wǎng)絡(luò)發(fā)送的每個(gè)消息通常要麼是希望得到一應(yīng)答要麼是單向消息。期望應(yīng)答的消息可以具有一暫?;蚱渲锌山邮軕?yīng)答到來(lái)的有限時(shí)間周期。在本發(fā)明中,嵌入的元數(shù)據(jù)應(yīng)當(dāng)包括關(guān)于UI收聽(tīng)器210的元數(shù)據(jù),其中UI收聽(tīng)器210將接受進(jìn)一步信息的請(qǐng)求。這種元數(shù)據(jù)至少由網(wǎng)絡(luò)地址、端口號(hào)以及暫停時(shí)間周期組成。由于用戶(hù)302不能識(shí)別請(qǐng)求是來(lái)自打印機(jī)102還是委托服務(wù)器212或者是惡意代理,所以元數(shù)據(jù)也可以包括認(rèn)證信息,該信息被設(shè)計(jì)用于防止試圖惡意從用戶(hù)302誘導(dǎo)信息。如果打印機(jī)102或委托應(yīng)用程序服務(wù)器212希望更多信息,其能夠使用上述信息來(lái)請(qǐng)求UI收聽(tīng)器210向用戶(hù)302要求所需要的信息。UI收聽(tīng)器210程序可以位于用戶(hù)302的交互操作設(shè)備(例如PC、蜂窩電話或PDA)、打印機(jī)102(即,用于在位于該打印機(jī)的LCD屏上的用戶(hù)交互操作)或另一個(gè)遠(yuǎn)程位置上。圖3示出了上述交互通信系統(tǒng)的例子。在圖3的例子中,用戶(hù)302選擇系統(tǒng)200內(nèi)的“打印”選項(xiàng),這可以通過(guò)點(diǎn)擊附加在MRA204上的打印按鈕或者選擇“打印”選項(xiàng)的其它方法來(lái)實(shí)現(xiàn)。通過(guò)選擇“打印”,用戶(hù)302發(fā)送打印請(qǐng)求304到MRA204或其它應(yīng)用程序。例如,用戶(hù)302能夠請(qǐng)求打印用戶(hù)從CNN上的新聞段選擇的視頻幀的視頻紙件表示。MRA204發(fā)送請(qǐng)求通知消息306給UI收聽(tīng)器210,請(qǐng)求UI收聽(tīng)器210將該打印請(qǐng)求304通知給打印機(jī)102。諸如用戶(hù)定義的視頻紙件的布局和格式選擇之類(lèi)的打印作業(yè)308信息接著被從MRA204發(fā)送到打印機(jī)102。打印作業(yè)308能夠包含嵌入信息,諸如UI收聽(tīng)器210的網(wǎng)絡(luò)地址、認(rèn)證信息以及關(guān)于客戶(hù)機(jī)將收聽(tīng)請(qǐng)求的最后時(shí)間的信息。在圖3的例子中,打印機(jī)102將信息請(qǐng)求310發(fā)送給是位于用戶(hù)302交互設(shè)備上一程序的UI收聽(tīng)器210。例如,打印機(jī)102可以請(qǐng)求與由用戶(hù)選擇用于視頻紙件打印作業(yè)的特定布局選擇相關(guān)的進(jìn)一步信息或可能重新確認(rèn)應(yīng)使用缺省布局。UI收聽(tīng)器210接著將該請(qǐng)求傳送給用戶(hù)302,并且顯示對(duì)話框312給用戶(hù)302,從而允許用戶(hù)302通過(guò)選擇對(duì)話框中的信息響應(yīng)該請(qǐng)求。用戶(hù)302的應(yīng)答314被發(fā)送到打印機(jī)102,以對(duì)打印機(jī)102對(duì)信息310的請(qǐng)求做出回答。此外,在圖3的例子中,打印機(jī)102將信息請(qǐng)求316發(fā)送給應(yīng)用程序服務(wù)器212。例如,打印機(jī)102可以從數(shù)據(jù)庫(kù)請(qǐng)求打印操作所必須的特定數(shù)據(jù),并且數(shù)據(jù)庫(kù)可以需要從用戶(hù)收集更多的信息。在圖3的例子中,應(yīng)用程序服務(wù)器212發(fā)送信息請(qǐng)求318到UI收聽(tīng)器210,UI收聽(tīng)器210接著將該請(qǐng)求318轉(zhuǎn)發(fā)給用戶(hù)302。對(duì)話框320被顯示給用戶(hù)302,從而允許用戶(hù)302對(duì)該請(qǐng)求318做出應(yīng)答。UI收聽(tīng)器210接著將用戶(hù)302的應(yīng)答322轉(zhuǎn)發(fā)到應(yīng)用程序服務(wù)器212,并且應(yīng)用程序服務(wù)器212接著能夠?qū)㈥P(guān)于打印機(jī)102的信息請(qǐng)求316的應(yīng)答324發(fā)送到打印機(jī)102?,F(xiàn)在參照?qǐng)D4,該圖示出了具有被添加到MRA204中的“打印”按鈕402的MRA204的圖像表示。在這個(gè)例子中,MRA204框是視窗媒體播放器(WMP)應(yīng)用程序,但能夠使用如前討論的其它類(lèi)型的MRA204。用戶(hù)能夠通過(guò)點(diǎn)擊打印按鈕402選擇打印選項(xiàng),使打印機(jī)生成多媒體文檔。通過(guò)利用微軟提供的插件特征,打印選項(xiàng)能夠被添加到WMP(版本9)中。插件特征允許開(kāi)發(fā)者在某方面生成補(bǔ)充WMP的應(yīng)用程序??梢陨蓭追N類(lèi)型的插件“顯示”、“設(shè)置”、“元數(shù)據(jù)”、“窗口和背景”等。微軟提供什么是插件以及如何建立插件的解釋。使用一個(gè)用戶(hù)界面插件形式,能夠?qū)⒁粋€(gè)按鈕或面板添加到WMP屏幕上。關(guān)于添加打印選項(xiàng)到一個(gè)應(yīng)用程序的更多信息提供在Hull等人于2004年3月30日提交的、名稱(chēng)為“PrintingSystemwithEmbeddedAudio/VideoContentRecognitionandProcessing”的、案卷號(hào)為20412-8394的美國(guó)專(zhuān)利申請(qǐng)中,在該申請(qǐng)中,打印系統(tǒng)包括執(zhí)行媒體內(nèi)容識(shí)別和處理的嵌入功能。根據(jù)對(duì)媒體內(nèi)容執(zhí)行的內(nèi)容識(shí)別和處理的結(jié)果,打印系統(tǒng)能夠生成媒體內(nèi)容的基于紙件的或其它打印表示。打印系統(tǒng)還可以生成媒體內(nèi)容的對(duì)應(yīng)電子表示,其與打印的表示相結(jié)合,能夠用來(lái)瀏覽和訪問(wèn)媒體內(nèi)容。打印系統(tǒng)還可以包括具有打印功能的媒體重現(xiàn)應(yīng)用程序,用于打印所選擇的媒體內(nèi)容。在運(yùn)行中,系統(tǒng)200提供用于打印多媒體內(nèi)容的方法。用戶(hù)選擇MRA中的打印選項(xiàng),并且初始打印驅(qū)動(dòng)器對(duì)話界面(PDDI)122出現(xiàn)在用戶(hù)面前。初始PDDI122集聚有關(guān)打印機(jī)102的能力的信息以變換多媒體數(shù)據(jù)。初始PDDI122能夠顯示提供給用戶(hù)的用于變換數(shù)據(jù)的選項(xiàng),或者能夠示出使用缺省參數(shù)集執(zhí)行缺省變換的結(jié)果。用戶(hù)能夠選擇這兩個(gè)選項(xiàng)中用戶(hù)優(yōu)選的一個(gè),并且用戶(hù)的選擇能夠被設(shè)置在打印機(jī)102的屬性中。在下面討論的圖5和6中說(shuō)明這些選項(xiàng)的每一個(gè)的操作流程。關(guān)于能夠執(zhí)行的不同變換和提供給用戶(hù)用于變換的選項(xiàng)的更多信息提供在上述的美國(guó)專(zhuān)利申請(qǐng)中,即Hull等人于2004年3月30日提交的、名稱(chēng)為“PrinterwithEmbeddedAudio/VideoContentRecognitionandProcessing”的、案卷號(hào)為20412-8394的美國(guó)專(zhuān)利申請(qǐng)中?,F(xiàn)在參照?qǐng)D5,該圖示出了在執(zhí)行任何多媒體變化之前當(dāng)PDDI122顯示給用戶(hù)時(shí)系統(tǒng)200的操作流程。在這個(gè)實(shí)施例中,用戶(hù)通過(guò)按壓MRA中的打印按鈕(例如圖4)輸入“打印”命令到該系統(tǒng)(502)。在進(jìn)行任何變換之前,用戶(hù)可以使用初始PDDI122定義與將生成的多媒體文檔有關(guān)的選擇。用戶(hù)選擇用于變換的參數(shù)(506),該參數(shù)將被應(yīng)用于多媒體內(nèi)容。例如用戶(hù)可以選擇所述文檔以便以用戶(hù)定義的排列形式示出特定數(shù)量的視頻幀。系統(tǒng)200接著等待用戶(hù)按壓PDDI122上的更新按鈕或OK按鈕(508)。如果用戶(hù)選擇取消按鈕,則系統(tǒng)200退出并且PDDI122從視野中消失。一旦用戶(hù)選擇了更新按鈕或OK按鈕,系統(tǒng)200將參數(shù)和其它的用戶(hù)選擇信息發(fā)送給打印機(jī)102(510)。系統(tǒng)200確定多媒體數(shù)據(jù)是否已經(jīng)傳送到打印機(jī)102。如前所述,這個(gè)多媒體數(shù)據(jù)可以位于能夠保持多媒體數(shù)據(jù)的PC、蜂窩電話、PDA或其它設(shè)備上。如果多媒體數(shù)據(jù)還沒(méi)有傳送到打印機(jī)102,則系統(tǒng)200傳送多媒體數(shù)據(jù)到打印機(jī)102,并接著繼續(xù)該操作流程。如果多媒體數(shù)據(jù)已經(jīng)傳送到打印機(jī)102,則系統(tǒng)200確定是否已經(jīng)使用用戶(hù)定義的參數(shù)執(zhí)行了多媒體變換。如果否,則打印機(jī)執(zhí)行514關(guān)于多媒體數(shù)據(jù)的變換;如果是,則系統(tǒng)200接著確定在輸入?yún)?shù)后用戶(hù)是否按壓了更新按鈕,或者可選地是否按壓了OK按鈕。如果用戶(hù)沒(méi)有按壓更新按鈕,而是按壓了OK按鈕,則打印機(jī)102生成文檔、多媒體數(shù)據(jù)以及將多媒體數(shù)據(jù)與紙件文檔鏈接的控制數(shù)據(jù)(516)。此外,系統(tǒng)200將一識(shí)別符(例如條碼)指定給多媒體數(shù)據(jù),以便向用戶(hù)提供通過(guò)其訪問(wèn)多媒體內(nèi)容的界面。如果需要,在生成所述文檔之前,打印機(jī)102可以首先向用戶(hù)提示有關(guān)打印作業(yè)的進(jìn)一步信息。有關(guān)多媒體數(shù)據(jù)的元數(shù)據(jù)和輸入到PDDI122的命令存在于DFS112中。如果用戶(hù)按壓了更新按鈕而不是OK按鈕,則用戶(hù)還沒(méi)有請(qǐng)求打印機(jī)102創(chuàng)建多媒體文檔。代替地,當(dāng)用戶(hù)已經(jīng)修改了PDDI122中的用戶(hù)選擇參數(shù)并且用戶(hù)試圖予覽將被更新的PDDI122的一區(qū)域時(shí),用戶(hù)按壓更新按鈕。如果用戶(hù)按壓了更新按鈕,則系統(tǒng)200將交互地返回結(jié)果以便在交互的PDDI122中進(jìn)行顯示(518)。這允許用戶(hù)預(yù)覽多媒體文檔將如何使用重新添加的參數(shù)修改而出現(xiàn)。操作流程接著返回到用戶(hù)有機(jī)會(huì)選擇參數(shù)的點(diǎn)(506)上,并且系統(tǒng)200能夠再次通過(guò)循環(huán)該流程,繼續(xù)修改交互的PDDI122中的參數(shù),直到生成最終文檔為止?,F(xiàn)在參照?qǐng)D6,該圖示出了當(dāng)系統(tǒng)200被結(jié)構(gòu)成傳送多媒體數(shù)據(jù)、執(zhí)行缺省變換以及在PDDI122中顯示其結(jié)果時(shí)在系統(tǒng)200中的操作流程。在這個(gè)實(shí)施例中,用戶(hù)按壓多媒體重現(xiàn)應(yīng)用程序中的打印按鈕(602)。系統(tǒng)200從打印機(jī)102、PC或其它位置上存儲(chǔ)的打印機(jī)屬性信息中讀取缺省變換和參數(shù)(620)。接著系統(tǒng)200確定多媒體數(shù)據(jù)是否已經(jīng)傳送到打印機(jī)102。如果多媒體數(shù)據(jù)還沒(méi)有被傳送到打印機(jī)102,則系統(tǒng)200將多媒體數(shù)據(jù)傳送給打印機(jī)102(612),并繼續(xù)該操作流程。如果多媒體數(shù)據(jù)已經(jīng)傳送到打印機(jī)102,則系統(tǒng)200確定是否已經(jīng)執(zhí)行了利用所定義參數(shù)的變換。如果否,則打印機(jī)對(duì)該多媒體數(shù)據(jù)執(zhí)行變換(614);如果是,則系統(tǒng)200接著將PDDI122顯示給用戶(hù)(604),以示出變換結(jié)果。用戶(hù)修改應(yīng)用到多媒體數(shù)據(jù)的變換參數(shù)(606)。接著系統(tǒng)200等待用戶(hù)按壓PDDI122上的更新按鈕或者按壓OK按鈕(608)。如果用戶(hù)選擇了取消按鈕,則系統(tǒng)200退出并且PDDI122從視野中消失。如果用戶(hù)按壓了OK按鈕,則打印機(jī)102生成一文檔、多媒體數(shù)據(jù)以及使多媒體數(shù)據(jù)與紙件文檔相互鏈接的控制數(shù)據(jù),并且系統(tǒng)200指定識(shí)別符給多媒體數(shù)據(jù)(616)。如果用戶(hù)按壓了更新按鈕,則系統(tǒng)200將發(fā)送變換參數(shù)給打印機(jī)102(610),并且接著再次循環(huán)該操作流程。下面討論的圖7-19示出了在圖6的方法種將被顯示給用戶(hù)的PDDI122的例子,其中,在用戶(hù)看見(jiàn)PDDI122之前,首先將缺省變換應(yīng)用到多媒體數(shù)據(jù)。而且圖7-19的例子也可以是圖5方法中描述的交互PDDI122,在圖5中的交互PDDI122允許用戶(hù)修改變換結(jié)果。對(duì)于以圖5的方法將初始顯示給用戶(hù)的初始PDDI122的例子,參見(jiàn)上述的美國(guó)專(zhuān)利申請(qǐng),即Hull等人于2004年3月30日提交的、名稱(chēng)為“PrinterwithEmbeddedAudio/VideoContentRecognitionandProcessing”的、案卷號(hào)為20412-8394的美國(guó)專(zhuān)利申請(qǐng)。音頻圖7示出了用于打印音頻文件中用戶(hù)選擇范圍的PDDI122的圖形表示。用戶(hù)能夠?qū)⑿畔⑤斎氲絇DDI122中的區(qū)域以指定有關(guān)布局、段等的用戶(hù)選擇。圖7實(shí)施例中所示的PDDI122包括在諸如打印機(jī)區(qū)域704、打印范圍區(qū)域706、以及份數(shù)和調(diào)節(jié)區(qū)域708等的標(biāo)準(zhǔn)打印機(jī)對(duì)話框中可以找到的一些區(qū)域。但是該P(yáng)DDI122還顯示在標(biāo)準(zhǔn)打印機(jī)對(duì)話框內(nèi)不能找到的區(qū)域,諸如前置選項(xiàng)區(qū)域710、預(yù)覽區(qū)域712以及內(nèi)容選擇區(qū)域714。如在標(biāo)準(zhǔn)打印對(duì)話框中所看到的,PDDI122的頂部包括顯示將被打印的多媒體文件的名字(例如“l(fā)ocomotion.mp3”)的文件名區(qū)域702。在打印機(jī)區(qū)域704中,用戶(hù)能夠選擇哪個(gè)打印機(jī)將執(zhí)行打印作業(yè)以及與打印作業(yè)屬性有關(guān)的其它選項(xiàng)、打印成圖像還是文件以及打印順序等。此外,打印機(jī)區(qū)域704顯示所選擇的打印機(jī)的狀態(tài)、打印機(jī)的類(lèi)型,打印機(jī)位置等。打印范圍區(qū)域706允許用戶(hù)做出文檔的哪一部分將被打印的選擇等。份數(shù)和調(diào)節(jié)區(qū)域708允許用戶(hù)指定在打印作業(yè)中將生成的份數(shù)、與紙張相關(guān)的打印作業(yè)頁(yè)的尺寸、在紙張上打印作業(yè)頁(yè)的位置等。盡管未示出,該對(duì)話框還包括其它傳統(tǒng)的與視頻、音頻或文本文檔的輸出表示相關(guān)的打印參數(shù)的各種組合。在圖7的實(shí)施例中,前置選項(xiàng)區(qū)域710向用戶(hù)提供用于規(guī)定多媒體內(nèi)容的格式化和布局的選項(xiàng)。在這個(gè)實(shí)施例中,用戶(hù)選擇用戶(hù)希望應(yīng)用到多媒體內(nèi)容的分段類(lèi)型。在本發(fā)明的這個(gè)實(shí)施例中,用戶(hù)能夠點(diǎn)擊分段類(lèi)型區(qū)域716中的箭頭,并且將出現(xiàn)一下拉菜單,該下拉菜單顯示用戶(hù)能夠選擇的分段類(lèi)型的列表。分段類(lèi)型的例子包括但不限于音頻事件檢測(cè)、揚(yáng)聲器分段、揚(yáng)聲器識(shí)別、聲音源定位、語(yǔ)音識(shí)別、配置文件分析、視頻事件檢測(cè)、彩色柱狀圖分析、面孔檢測(cè)、分族、面孔識(shí)別、光學(xué)字符識(shí)別(OCR)、運(yùn)動(dòng)分析、距離預(yù)測(cè)、前景/背景分割、場(chǎng)景分割、機(jī)動(dòng)車(chē)識(shí)別以及牌照識(shí)別。在該例子中,用戶(hù)在分段類(lèi)型區(qū)域716中沒(méi)有選擇任何分段類(lèi)型,因此分段類(lèi)型顯示為“無(wú)”。故在該例子中,用戶(hù)通過(guò)在內(nèi)容選擇區(qū)域714中移動(dòng)選擇器736來(lái)在音頻波形時(shí)間線734內(nèi)手動(dòng)地選擇音頻范圍。每個(gè)分段類(lèi)型能夠具有與在該分段中檢測(cè)的每個(gè)事件相關(guān)的置信度。例如如果用戶(hù)已經(jīng)應(yīng)用了根據(jù)出現(xiàn)在音頻數(shù)據(jù)中的鼓掌事件分段音頻數(shù)據(jù)的音頻事件檢測(cè),則每次鼓掌事件將具有定義鼓掌事件被正確檢測(cè)的可信程度的置信度。在前置選項(xiàng)區(qū)域710中,用戶(hù)能夠定義或調(diào)節(jié)關(guān)于與特定分段相關(guān)的置信值的閾值。用戶(hù)通過(guò)將閾值輸入到閾值區(qū)域718中來(lái)設(shè)置閾值。例如,用戶(hù)能夠設(shè)置75%的閾值,并僅顯示高于該值的事件(即事件被正確檢測(cè)為鼓掌事件的概率大于75%)。在另一個(gè)實(shí)施例中,PDDI122包含閾值滑動(dòng)條(未示出),并且用戶(hù)能夠沿著從0%到100%延伸的閾值條移動(dòng)滑動(dòng)條來(lái)選擇該范圍內(nèi)的特定閾值。在一個(gè)實(shí)施例中,用戶(hù)還能夠生成與所生成的多媒體表示有關(guān)的布局選擇。用戶(hù)在“調(diào)試(fiton)”區(qū)域720內(nèi)設(shè)置關(guān)于將被顯示的音頻波形時(shí)間線734的頁(yè)數(shù)。用戶(hù)還在時(shí)間線數(shù)選擇區(qū)域722中選擇每頁(yè)將顯示的時(shí)間線數(shù)。另外,用戶(hù)在方向區(qū)域724中選擇關(guān)于多媒體表示的顯示方向(例如垂直或水平)。例如,如圖7所示,用戶(hù)能夠選擇具有在一頁(yè)上水平顯示的一個(gè)時(shí)間線,并且這樣將在一頁(yè)上水平地顯示整個(gè)音頻波形時(shí)間線734。而另一個(gè)例子中,用戶(hù)能夠選擇將音頻波形時(shí)間線734分成垂直顯示在兩頁(yè)上的四個(gè)部分(即每頁(yè)兩個(gè)時(shí)間線)。在圖7的實(shí)施例中,還示出了各種按鈕,包括更新按鈕726、頁(yè)面設(shè)置按鈕728、OK按鈕730以及取消按鈕732。如參照?qǐng)D5和6所述的,當(dāng)用戶(hù)已經(jīng)修改了PDDI122內(nèi)的打印作業(yè)參數(shù)時(shí),用戶(hù)可以選擇更新按鈕726,并且用戶(hù)將會(huì)看到多媒體表示如何顯示為更新的圖像。在預(yù)覽區(qū)域712中所示的多媒體文檔的圖像將被更新顯示用戶(hù)已經(jīng)在PDDI122內(nèi)生成的任何新的改變。此外,該系統(tǒng)能夠被設(shè)計(jì)為任何時(shí)侯PDDI122中生成變化時(shí)自動(dòng)更新預(yù)覽區(qū)域712。在一個(gè)實(shí)施例中,當(dāng)用戶(hù)選擇頁(yè)面設(shè)置按鈕728時(shí),不同的對(duì)話界面框顯示給用戶(hù),為用戶(hù)提供各種打印格式化選項(xiàng)。這將在下面詳細(xì)討論。圖7的實(shí)施例還包括OK按鈕730,并且當(dāng)用戶(hù)選擇該按鈕時(shí),則打印機(jī)準(zhǔn)備生成按照在PDDI122中設(shè)置的當(dāng)前用戶(hù)定義的選擇的多媒體文檔。如果用戶(hù)在該過(guò)程的任何時(shí)刻選擇取消按鈕732,則結(jié)束打印作業(yè)的創(chuàng)建并且PDDI122消失。在圖7的實(shí)施例中,內(nèi)容選擇區(qū)域714示出了由用戶(hù)選擇并用于變換和打印的音頻數(shù)據(jù)的時(shí)間線上的音頻信息波形。在這個(gè)例子中,音頻波形時(shí)間線734的頂部示出時(shí)間“00:00:00”或者這個(gè)音頻內(nèi)容的開(kāi)始時(shí)間。音頻波形時(shí)間線734的底部示出時(shí)間“00:07:14”或者這個(gè)音頻內(nèi)容的結(jié)束時(shí)間。因此,在這個(gè)例子中的音頻信息是七分十四秒長(zhǎng)。用戶(hù)可以沿波形時(shí)間線724滑動(dòng)選擇器736以選擇音頻內(nèi)容的某些段,對(duì)于這些段,在所生成的多媒體文檔中將顯示對(duì)應(yīng)的標(biāo)記符或識(shí)別符。例如,用戶(hù)能夠使用鼠標(biāo)或其它選擇設(shè)備點(diǎn)擊并滑動(dòng)選擇器736到段740,其在圖7中被示為選擇段。在一個(gè)實(shí)施例中,當(dāng)選擇器736位于用戶(hù)希望選擇的音頻內(nèi)容段上時(shí),用戶(hù)可以單擊或雙擊選擇器736來(lái)選擇段740。在這個(gè)實(shí)施例中,用戶(hù)可以通過(guò)點(diǎn)擊并拖動(dòng)選擇器736跨過(guò)用戶(hù)希望選擇的音頻內(nèi)容段的距離來(lái)選擇較長(zhǎng)的音頻內(nèi)容段。音頻波形時(shí)間線734也可以用許多可選方式進(jìn)行顯示,諸如顯示水平時(shí)間線、并排顯示多于一個(gè)的時(shí)間線、顯示不同的波形形狀、顯示根據(jù)特定原理著色的波形等。在圖7的實(shí)施例中,用戶(hù)在多媒體文檔中選擇將被標(biāo)記的音頻波形時(shí)間線734的三個(gè)區(qū)域。用戶(hù)選擇段740、段742以及段744。這些被選擇段中的每一個(gè)都具有被顯示在多媒體文檔的打印預(yù)覽中單獨(dú)對(duì)應(yīng)的標(biāo)記符或識(shí)別符166(例如條碼)。例如,在圖7的預(yù)覽區(qū)域712中,示出了多媒體文檔的圖像。該文檔示出了一頁(yè),包括音頻時(shí)間線的開(kāi)始在左邊、結(jié)束在右邊顯示的一條水平時(shí)間線。在這個(gè)例子中,整個(gè)音頻波形時(shí)間線734被顯示在該多媒體文檔頁(yè)上。此外,在預(yù)覽區(qū)域712中顯示的時(shí)間線包括三個(gè)標(biāo)記符或識(shí)別符166,一個(gè)用于段740、一個(gè)用于段742以及一個(gè)用于段744。每個(gè)標(biāo)記符166包括條碼以及給出在該音頻內(nèi)容中的段位置的時(shí)間戳。另外,圖7例子所示出的預(yù)覽區(qū)域712包括能夠包括有關(guān)音頻內(nèi)容的信息的標(biāo)題(例如音頻內(nèi)容的名稱(chēng)、創(chuàng)作該音頻內(nèi)容的音樂(lè)人以及該音頻內(nèi)容的日期)。多媒體文檔還包括可位于文檔中任何地方(即底部、中央)的播放標(biāo)記符760或播放識(shí)別符。用戶(hù)能夠以許多方式播放音頻內(nèi)容。例如,用戶(hù)能夠點(diǎn)擊音頻波形時(shí)間線734上的播放選擇器或播放箭頭750使該段開(kāi)始播放。另外,系統(tǒng)能夠被結(jié)構(gòu)得使選擇播放箭頭750將引起音頻波形時(shí)間線734上的全部音頻內(nèi)容開(kāi)始播放。用戶(hù)還能夠右擊任何一個(gè)所選擇的段來(lái)刪除該多媒體文檔上的相應(yīng)標(biāo)記符。紙件多媒體表示也能夠提供用于播放該音頻內(nèi)容的界面。用戶(hù)能夠選擇用于紙件文檔上任一所選擇段的任何標(biāo)記符(例如掃描條碼),并且這將使得所選擇的音頻段被播放。例如,用戶(hù)能夠通過(guò)具有條碼掃描器的蜂窩電話或PDA設(shè)備掃描條碼。用戶(hù)能夠收聽(tīng)蜂窩電話或PDA上的選擇片段,或者用戶(hù)能夠通過(guò)他/她的PC上的聲卡收聽(tīng)該內(nèi)容。此外,用戶(hù)能夠選擇用作暫停按鈕的播放標(biāo)記符760,從而如果用戶(hù)已經(jīng)選擇了該頁(yè)上任一標(biāo)記符并且正在播放對(duì)應(yīng)的音頻內(nèi)容,則用戶(hù)能夠通過(guò)選擇播放標(biāo)記符760暫停該播放。用戶(hù)通過(guò)再次選擇播放標(biāo)記符760能夠恢復(fù)該播放或者用戶(hù)能夠選擇該頁(yè)上的另一個(gè)標(biāo)記來(lái)播放對(duì)應(yīng)的音頻內(nèi)容?,F(xiàn)在參照?qǐng)D8,該圖示出了用于多媒體文檔頁(yè)面設(shè)置或頁(yè)面設(shè)置對(duì)話界面800的PDDI122的圖形表示。如前討論的,當(dāng)用戶(hù)選擇頁(yè)面設(shè)置按鈕728時(shí),頁(yè)面設(shè)置對(duì)話界面800出現(xiàn),并且用戶(hù)能夠選擇格式化選項(xiàng)。在頁(yè)面區(qū)域802中,用戶(hù)能夠設(shè)置用于多媒體打印作業(yè)的紙張尺寸(例如,信紙)和紙張?jiān)?例如,自動(dòng)選擇)。在方向區(qū)域804中,用戶(hù)能夠指定文檔是以縱向還是以橫向格式放置。在選擇區(qū)域806中,用戶(hù)能夠設(shè)置名稱(chēng)和文本字體類(lèi)型以及尺寸(例如,Helvetica,尺寸22英寸)、媒體類(lèi)型(例如視頻)、頁(yè)面上的標(biāo)記符位置(例如,在波形上方),并且用戶(hù)能夠確定是否打印波形、中心名稱(chēng)、時(shí)間線條碼以及他們的頻率和時(shí)間標(biāo)簽。頁(yè)面設(shè)置對(duì)話界面800所示的每個(gè)頁(yè)面設(shè)置選項(xiàng)都能夠有選擇地被插入到諸如圖7所示PDDI的主PDDI122中。頁(yè)面設(shè)置選項(xiàng)不限于圖8所示的那些,且在另一些實(shí)施例中,各種不同的頁(yè)面設(shè)置選項(xiàng)都可以被提供給用戶(hù)。現(xiàn)在參照?qǐng)D9,該圖示出了用于顯示生成音頻文件雙頁(yè)概述的PDDI122的圖形表示。PDDI122與圖7所示的相似,但是用戶(hù)在時(shí)間線數(shù)選擇區(qū)域722中已經(jīng)選擇多媒體文檔的每頁(yè)包含三個(gè)打印的時(shí)間線。此外,用戶(hù)在頁(yè)面安裝區(qū)域720中已經(jīng)選擇在兩頁(yè)上打印多媒體文檔。用戶(hù)在內(nèi)容選擇區(qū)域714中已經(jīng)選擇音頻內(nèi)容的將被顯示有標(biāo)記符的四個(gè)段。所選擇的段包括段902、段904、段906以及段908。圖9的預(yù)覽區(qū)域712所示的多媒體文檔在一頁(yè)上顯示三個(gè)時(shí)間線,并示出已經(jīng)生成了兩頁(yè)。在每個(gè)水平時(shí)間線開(kāi)始處的時(shí)間戳910顯示該時(shí)間線的開(kāi)始時(shí)間。在預(yù)覽區(qū)域712中預(yù)頁(yè)上顯示的時(shí)間線對(duì)應(yīng)于在內(nèi)容選擇區(qū)域714中所示的音頻波形時(shí)間線734的一半。更具體地說(shuō),多媒體文檔顯示了被分成三個(gè)獨(dú)立時(shí)間線的音頻波形時(shí)間線734的上半部。對(duì)應(yīng)于所選擇的段902和904的標(biāo)記符顯示在預(yù)覽區(qū)域712所示的頁(yè)面上。對(duì)應(yīng)于所選擇的段906和908的標(biāo)記符顯示在預(yù)覽區(qū)域712中看不見(jiàn)的內(nèi)容的第二頁(yè)面上。圖9的預(yù)覽區(qū)域712中的文檔還包括靠近該頁(yè)面上顯示的三個(gè)時(shí)間線中每一個(gè)的開(kāi)始和結(jié)束的標(biāo)記符912。這些向用戶(hù)提供了打印文檔中的附加中間界面點(diǎn),經(jīng)過(guò)這些附加中間界面點(diǎn)用戶(hù)能夠訪問(wèn)多媒體內(nèi)容。時(shí)間線標(biāo)記符912表示在音頻內(nèi)容中與每個(gè)打印時(shí)間線的開(kāi)始或結(jié)束相對(duì)應(yīng)的位置,并且用戶(hù)能夠通過(guò)選擇所述標(biāo)記符來(lái)訪問(wèn)這些位置(即如前所討論的掃描條碼)從而使在音頻文件的那個(gè)位置處開(kāi)始播放該音頻內(nèi)容。圖9所示的時(shí)間線標(biāo)記符912顯示在該時(shí)間線的下面,但是這些時(shí)間線標(biāo)記符912也可以顯示在時(shí)間線的上面或靠近時(shí)間線。這些時(shí)間線標(biāo)記符912也將出現(xiàn)在打印的文檔中,從而提供另一個(gè)界面,通過(guò)該界面,用戶(hù)能夠訪問(wèn)規(guī)定位置處的多媒體內(nèi)容。圖10示出了其中將時(shí)間線分成兩部分的PDDI122的圖形表示。這個(gè)PDDI122與圖7所示的相似,但是用戶(hù)在“安裝”區(qū)域720選擇輸出應(yīng)限制在單頁(yè)上。時(shí)間線數(shù)選擇區(qū)域722規(guī)定每頁(yè)兩個(gè)時(shí)間線。因此,在內(nèi)容選擇區(qū)域714中所示的音頻波形時(shí)間線734被分成兩部分,且這兩個(gè)部分等分地在所述媒體文檔上被顯示為兩個(gè)水平的時(shí)間線。用戶(hù)已經(jīng)再次在音頻波形時(shí)間線734內(nèi)選擇了段,并且對(duì)應(yīng)于這些段的標(biāo)記符顯示在多媒體文檔中。具體地,用戶(hù)已經(jīng)選擇了段1002、1004、1006和1008?,F(xiàn)在參照?qǐng)D11,該圖示出了其中將時(shí)間線分成兩個(gè)垂直部分并且已經(jīng)施加了分段類(lèi)型和閾值水平的PDDI122的圖形表示。在這個(gè)例子中,用戶(hù)在時(shí)間線數(shù)選擇區(qū)域722中已經(jīng)選擇了在多媒體文檔的每頁(yè)上打印的兩個(gè)時(shí)間線。此外,用戶(hù)在“安裝”區(qū)域720已經(jīng)選擇在兩頁(yè)上打印多媒體文檔。用戶(hù)還在方向區(qū)域724中選擇在多媒體文檔中垂直顯示時(shí)間線。因此,內(nèi)容選擇區(qū)域714中所示的音頻波形時(shí)間線734被分成兩半,并且上半部分顯示在預(yù)覽區(qū)域712所示頁(yè)面上。下半部分包括在第二頁(yè)上,第二頁(yè)的內(nèi)容沒(méi)有顯示在預(yù)覽區(qū)域712中。在圖11的例子中,不是使用選擇器736手動(dòng)選擇音頻波形時(shí)間線734的段,而是用戶(hù)已經(jīng)對(duì)音頻數(shù)據(jù)應(yīng)用了分段類(lèi)型。用戶(hù)在分段類(lèi)型區(qū)域716中已經(jīng)選擇對(duì)音頻數(shù)據(jù)中的鼓掌事件進(jìn)行音頻檢測(cè)。系統(tǒng)200將搜索音頻數(shù)據(jù)內(nèi)的所述鼓掌事件。但是用戶(hù)還選擇了在閾值選擇區(qū)域718內(nèi)應(yīng)用75%的閾值。因此,只有大于75%可能性為鼓掌事件的音頻事件將被顯示在PDDI122中。在分段顯示區(qū)域1102中顯示鼓掌事件。分段顯示區(qū)域1102中所示的每個(gè)事件段1104對(duì)應(yīng)于大于75%可能性為鼓掌事件的事件。在圖11中事件段1104被顯示為交錯(cuò)排列的框。但是,這些交錯(cuò)排列的框也可以是穿過(guò)分段顯示區(qū)域1102伸出的線或者其它可視的提示符。用戶(hù)能夠右擊任何一個(gè)事件段1104來(lái)刪除該事件段1104。對(duì)應(yīng)于每一個(gè)鼓掌事件段1104的標(biāo)記符(即,條碼、RFID標(biāo)簽、URL、或用于能從其中檢索出多媒體數(shù)據(jù)的位置的某種其它標(biāo)識(shí))1120顯示在預(yù)覽區(qū)域712中顯示的多媒體文檔中。在這個(gè)例子中,時(shí)間戳1122也包含于每個(gè)標(biāo)記符1120。用戶(hù)能夠點(diǎn)擊位于靠近每一個(gè)事件段1104的箭頭750來(lái)播放極可能包含鼓掌的音頻內(nèi)容。因此,用戶(hù)能夠在打印文檔之前檢查所示的事件段1104以確保事件段1104真正對(duì)應(yīng)于鼓掌事件。此外,用戶(hù)能夠在打印文檔中選擇對(duì)應(yīng)于鼓掌事件的標(biāo)記符以便播放鼓掌內(nèi)容。除了在圖11中描述的音頻檢測(cè)事件以外,還有許多其它的分段類(lèi)型能夠應(yīng)用到音頻內(nèi)容或其它類(lèi)型的多媒體內(nèi)容上。這些分段類(lèi)型的每一個(gè)都能夠被顯示在分段類(lèi)型區(qū)域716的菜單中,并且用戶(hù)能從該菜單中選擇應(yīng)該使用的分段類(lèi)型。下面是能夠應(yīng)用的各種不同分段類(lèi)型的簡(jiǎn)單例子。揚(yáng)聲器分段是一個(gè)例子,其中對(duì)應(yīng)于不同的揚(yáng)聲器的每個(gè)段以不同的顏色或不同的圖符進(jìn)行顯示。由相同的揚(yáng)聲器生成的段以相同的顏色或相同的圖符顯示。揚(yáng)聲器識(shí)別是另一個(gè)例子,其中每一個(gè)揚(yáng)聲器的名字伴隨有正確檢測(cè)的置信度。PDDI122包括一系列檢查框,讓用戶(hù)選擇顯示哪個(gè)揚(yáng)聲器。用戶(hù)能夠交替應(yīng)用聲音源位置,其中檢測(cè)聲音的方向被顯示為扇區(qū)。每一個(gè)扇區(qū)伴隨有其被正確檢測(cè)的置信度。用戶(hù)界面包括安置在示例圓的圓周周?chē)囊幌盗袡z查框,以便使用戶(hù)選擇顯示方向。語(yǔ)音識(shí)別是分段類(lèi)型的另一個(gè)例子,其中,時(shí)間線顯示文本并且可選地顯示用于在音頻內(nèi)容期間說(shuō)出的每個(gè)詞或句子的置信度值。視頻圖12示出了用于生成視頻紙件文檔的PDDI122的圖形表示。如利用用于生成音頻文檔的PDDI122,用戶(hù)能夠在PDDI122的區(qū)域中輸入信息以生成視頻文檔。圖12實(shí)施例中所示的PDDI122包括在諸如打印機(jī)區(qū)域704、打印范圍區(qū)域706、以及份數(shù)和調(diào)節(jié)區(qū)域708等標(biāo)準(zhǔn)打印機(jī)對(duì)話框中可以找到的一些區(qū)域。但是該P(yáng)DDI122還顯示諸如前置選項(xiàng)區(qū)域710、預(yù)覽區(qū)域712以及內(nèi)容選擇區(qū)域714等在標(biāo)準(zhǔn)打印機(jī)對(duì)話框內(nèi)不能找到的區(qū)域。在圖12的實(shí)施例中,前置選項(xiàng)區(qū)域710向用戶(hù)提供被規(guī)定用于格式化和布局多媒體內(nèi)容的選項(xiàng)。在這個(gè)實(shí)施例中,用戶(hù)選擇用戶(hù)希望應(yīng)用到視頻內(nèi)容的分段類(lèi)型區(qū)域1202中的分段類(lèi)型。用于生成視頻文檔的分段類(lèi)型的菜單將至少包括參考先前在圖7中生成音頻文檔已經(jīng)討論的分段類(lèi)型。在該例子中,用戶(hù)在分段類(lèi)型區(qū)域1202中沒(méi)有選擇任何分段類(lèi)型,因此分段類(lèi)型1202顯示為“無(wú)”。故在該例子中,用戶(hù)通過(guò)在內(nèi)容選擇區(qū)域714中移動(dòng)選擇器1222、以及通過(guò)點(diǎn)擊用戶(hù)希望選擇的視頻時(shí)間線顯示部分來(lái)手動(dòng)地選擇給定視頻文件段的開(kāi)始和結(jié)束時(shí)間。在前置選項(xiàng)區(qū)域710中,如前所討論的,用戶(hù)能夠?qū)ι婕疤囟ǘ蔚闹眯胖档拈撝颠M(jìn)行定義和調(diào)節(jié)。用戶(hù)通過(guò)將閾值輸入到閾值區(qū)域1204中來(lái)設(shè)置閾值。例如,用戶(hù)能夠設(shè)置75%的閾值,并且將僅僅顯示高于該閾值的幀(即有高于75%的可能該幀包含在面孔檢測(cè)分析中的面孔)。在另一個(gè)實(shí)施例中,PDDI122包含一閾值滑動(dòng)器,并且用戶(hù)能夠沿著從0%到100%的閾值條移動(dòng)該滑動(dòng)器以在該范圍內(nèi)選擇一特定閾值。另外,在圖12實(shí)施例中所示的按鈕包括更新按鈕726、頁(yè)面設(shè)置按鈕728、OK按鈕730以及取消按鈕732,其功能與參照?qǐng)D7討論的相應(yīng)按鈕的功能相似。在圖12的實(shí)施例中,內(nèi)容選擇區(qū)域714示出了時(shí)間線上的視頻幀和文本,其是在貫穿某個(gè)定義的視頻內(nèi)容的正規(guī)區(qū)間提取的。例如,系統(tǒng)能夠每秒保存CNN新聞段的視頻幀,并且視頻時(shí)間線將顯示在該視頻時(shí)間線上的全部或至少是某些被保存的幀。所提取的幀將利用在CNN新聞段中位于時(shí)間線頂部從時(shí)間“00:00:00”開(kāi)始并沿時(shí)間線繼續(xù)直到結(jié)束時(shí)間“00:12:19”為止的幀進(jìn)行顯示。在這個(gè)例子中,視頻時(shí)間線的頂部示出時(shí)間“00:00:00”或者在時(shí)間線中顯示的這個(gè)視頻內(nèi)容的開(kāi)始時(shí)間。視頻時(shí)間線的底部示出時(shí)間“00:12:19”或者這個(gè)視頻內(nèi)容的結(jié)束時(shí)間。在一些實(shí)施例中,視頻幀能沿時(shí)間線以相反的順序顯示。此外,在內(nèi)容選擇區(qū)域714中還顯示有三個(gè)欄1250、1252和1254。一個(gè)欄1250顯示文本信息,和其它兩欄1252和1254顯示視頻幀。在圖12的兩欄1252和1254中顯示的視頻幀是并排顯示的。例如,所選擇的第一幀顯示在時(shí)間線的左上部,和所選擇的第二幀顯示在第一幀的旁邊。所選擇的第三幀顯示在第一幀的下面,并且第四幀顯示在第二幀的下面。視頻幀的顯示以這種模式沿時(shí)間線繼續(xù)。在另一些實(shí)施例中,視頻幀可以沿時(shí)間線以不同的模式顯示、或以一個(gè)欄顯示、或以多于兩個(gè)欄顯示。在圖12中文本副本也沿時(shí)間線從頂部到底部、通??拷鼘?duì)應(yīng)的視頻幀來(lái)顯示。在另一些實(shí)施例中,文本被顯示在兩個(gè)或多個(gè)欄中或被顯示在視頻幀的另一側(cè)、或根本不在時(shí)間線上顯示。用戶(hù)能夠沿視頻時(shí)間線滑動(dòng)選擇器1222以選擇視頻內(nèi)容的某些段,這些段將被顯示在所生成的多媒體文檔中。在一個(gè)實(shí)施例中,一旦選擇器1222被置于用戶(hù)希望選擇的視頻內(nèi)容段上,用戶(hù)就可以點(diǎn)擊選擇器1222來(lái)選擇段1226。視頻時(shí)間線也可以用許多可選方式進(jìn)行顯示,諸如示出水平時(shí)間線、并排示出多于一個(gè)的時(shí)間線和示出不同的視頻幀外形等。如上所討論的,盡管圖12實(shí)施例中的視頻時(shí)間線顯示了視頻幀和相關(guān)文本,但是,在某些實(shí)施例中,視頻時(shí)間線也可以?xún)H顯示視頻幀而不顯示相關(guān)文本。在時(shí)間線僅顯示視頻幀的這些實(shí)施例中,所生成的多媒體表示仍能夠包括文本和視頻幀或者能夠限制為單獨(dú)的視頻幀。在圖12所示的例子中,用戶(hù)在多媒體文檔中選擇將被標(biāo)記的視頻時(shí)間線的四個(gè)區(qū)域。用戶(hù)選擇段1226、段1228、段1230和段1232。這些被選擇段中的每一個(gè)都被顯示為多媒體文檔上的一個(gè)或多個(gè)視頻幀以及相關(guān)的文本。在圖12的預(yù)覽區(qū)域712中,示出了多媒體文檔的圖像。圖12例子的文檔示出了了包括五個(gè)視頻幀1206和相關(guān)文本1216的一個(gè)頁(yè)面。所顯示的視頻幀1206和相關(guān)文本1216中每一個(gè)都對(duì)應(yīng)于在內(nèi)容選擇區(qū)域714中選擇的段。例如開(kāi)始于多媒體文檔左上部的前兩個(gè)視頻幀1206對(duì)應(yīng)于所選擇的段1226。在圖12的例子中,在多媒體文檔的左下角示出的視頻幀1206對(duì)應(yīng)于視頻時(shí)間線上的選擇段1228,在文檔的右上角示出的視頻幀1206對(duì)應(yīng)于視頻時(shí)間線上的選擇段1230,以及在右下角示出的視頻幀1206對(duì)應(yīng)于選擇段1232。此外,在視頻時(shí)間線內(nèi)的每一被顯示的視頻幀的位置被作為時(shí)間標(biāo)識(shí)符1240顯示在每一視頻幀上方。在圖12中,每一個(gè)時(shí)間標(biāo)記符1240對(duì)應(yīng)于從“00:00:00”到“00:12:19”(在視頻時(shí)間線上顯示的視頻內(nèi)容的總長(zhǎng)度)的時(shí)間幀內(nèi)的一個(gè)段。例如,在用于CNN新聞段的多媒體文檔的左上角的視頻幀1206包括“00:04:21”的時(shí)間標(biāo)記符1240。因此,與該視頻幀1206相關(guān)的視頻內(nèi)容開(kāi)始于進(jìn)入該CNN新聞段后的四分二十一秒處。此外,與這個(gè)視頻幀1206相關(guān)的文本1216顯示了該視頻幀1206的副本,并且該副本開(kāi)始于進(jìn)入該CNN新聞段后的四分二十一秒處。用戶(hù)還能夠以多種方式播放視頻內(nèi)容。例如,用戶(hù)能夠點(diǎn)擊視頻時(shí)間線上靠近每一選擇段的播放箭頭1224以使該段開(kāi)始播放。在圖12的實(shí)施例中,每一個(gè)在多媒體文檔上顯示的視頻幀1206都具有位于視頻幀1206下面的相應(yīng)標(biāo)記符或識(shí)別符1208(例如條碼)。這些識(shí)別符1208還能夠提供用于播放視頻內(nèi)容的界面。如在前參照音頻段所討論的,用戶(hù)能夠選擇用于文檔上任一所選段的任一識(shí)別符1208(例如掃描條碼),并且這將使得所選擇的視頻段被播放。當(dāng)用戶(hù)選擇識(shí)別符1208時(shí),將從在相應(yīng)時(shí)間標(biāo)記符1240上顯示的時(shí)間開(kāi)始播放相關(guān)的視頻內(nèi)容。在圖12的實(shí)施例中,與視頻幀1206相關(guān)的對(duì)話將開(kāi)始于文本1216的相關(guān)副本的開(kāi)始處。例如,如果用戶(hù)掃描了圖12預(yù)覽區(qū)域712中所示的多媒體文檔的左上角處的視頻幀下面所示的條碼,則將從進(jìn)入該CNN新聞段之后的四分二十一秒處開(kāi)始播放該CNN新聞段的視頻片段。圖12實(shí)施例中所示的多媒體文檔還示出了用于控制視頻內(nèi)容顯示的控制標(biāo)記符或識(shí)別符。在圖12中,示出了播放標(biāo)記符1210、快進(jìn)(FF)標(biāo)記符1212以及倒退(rewind)標(biāo)記符1214。用戶(hù)能夠選擇打印文檔中的播放標(biāo)記符1210(即通過(guò)蜂窩電話或其它設(shè)備掃描條碼),其用作暫停按鈕。如果用戶(hù)已經(jīng)選擇了打印頁(yè)面上的任何識(shí)別符1208并且對(duì)應(yīng)的視頻內(nèi)容正在諸如蜂窩電話的某種類(lèi)型的顯示設(shè)備(未示出)上播放,則用戶(hù)能夠通過(guò)選擇播放標(biāo)記符1210暫停該播放。用戶(hù)通過(guò)再次選擇打印文檔上的播放標(biāo)記符1210能夠恢復(fù)該視頻內(nèi)容的播放或者用戶(hù)能夠選擇該頁(yè)上的另一個(gè)識(shí)別符1208來(lái)播放對(duì)應(yīng)的視頻內(nèi)容。此外,如果用戶(hù)已經(jīng)選擇了打印頁(yè)面上的任何識(shí)別符1208并且對(duì)應(yīng)的視頻內(nèi)容正在播放,則用戶(hù)能夠通過(guò)分別選擇快進(jìn)標(biāo)記符1212或倒退標(biāo)記符1214,在該視頻片段中進(jìn)行快進(jìn)或倒退。在圖12的例子中,在預(yù)覽區(qū)域712中所示的多媒體文檔包括能夠包括有關(guān)視頻內(nèi)容的信息(例如視頻內(nèi)容的名稱(chēng)和視頻內(nèi)容的日期)的標(biāo)題。例如,圖12中的標(biāo)題將所述視頻內(nèi)容識(shí)別為“CNN新聞”,并且該新聞段曾經(jīng)在“2001年9月19日”播放。圖12實(shí)施例中所示的預(yù)覽區(qū)域712還包括預(yù)覽內(nèi)容區(qū)域1220。該預(yù)覽內(nèi)容區(qū)域1220標(biāo)記一用戶(hù)是正在預(yù)覽多媒體文檔的紙件版本還是正預(yù)覽與多媒體文檔上顯示的視頻幀1206相關(guān)的視頻內(nèi)容。用戶(hù)通過(guò)選擇“視頻”無(wú)線按鈕,經(jīng)過(guò)在PDDI122中嵌入的視頻播放器能夠預(yù)覽所選擇的與視頻幀1206相關(guān)的視頻內(nèi)容。在圖12的實(shí)施例中,根據(jù)一個(gè)特定布局在預(yù)覽區(qū)域712中顯示了多媒體文檔。但是,該文檔能以多種不同的格式安排。例如,該文檔可以不包括標(biāo)題、時(shí)間標(biāo)記符1240可以顯示在視頻幀1206的下面、識(shí)別符1208可以顯示在視頻幀的上面等。圖12還示出了在內(nèi)容選擇區(qū)域714中的視頻時(shí)間線上顯示的預(yù)覽窗口1280。在某些實(shí)施例中,當(dāng)用戶(hù)沿視頻時(shí)間線移動(dòng)選擇器1222時(shí)將出現(xiàn)預(yù)覽窗口1280。預(yù)覽窗口1280將顯示選擇器1222被置于其上的視頻幀的圖像。預(yù)覽窗口1280能夠直接出現(xiàn)在所選擇段上面,或者能夠選擇地出現(xiàn)在該段的下方、上方或該段的旁邊?,F(xiàn)在參照?qǐng)D13,該圖示出了圖12所示其中用戶(hù)正預(yù)覽視頻片段的PDDI122的圖形表示。用戶(hù)能夠選擇在內(nèi)容選擇區(qū)域714中沿視頻時(shí)間線靠近每一被選擇段位置上的播放箭頭1224以使得片段開(kāi)始播放。此外,能夠配置系統(tǒng)使得當(dāng)選擇播放箭頭1224時(shí)開(kāi)始播放視頻時(shí)間線所表示的全部視頻內(nèi)容。當(dāng)在預(yù)覽區(qū)域712中播放視頻時(shí),沿時(shí)間線的相關(guān)段(例如段1226)將變?yōu)楦吡溜@示,并且靠近該段的播放箭頭1224將改變形狀(例如雙線)以表明該段正在播放。此外,能夠設(shè)計(jì)系統(tǒng)使得用戶(hù)能夠選擇視頻幀并僅需通過(guò)點(diǎn)擊或雙擊預(yù)覽區(qū)域712中的多媒體文檔中的特定視頻幀或者通過(guò)點(diǎn)擊視頻時(shí)間線中的幀而開(kāi)始播放所述視頻幀。此外,在某些實(shí)施例中,如果用戶(hù)右擊了視頻時(shí)間線中的一個(gè)段(例如1224),則將出現(xiàn)一對(duì)話框以向用戶(hù)提供播放視頻的選項(xiàng)(在該段開(kāi)始處開(kāi)始)。用戶(hù)能夠選擇對(duì)話框中的播放選項(xiàng),并且視頻幀將開(kāi)始在預(yù)覽區(qū)域712中播放。當(dāng)用戶(hù)選擇特定視頻段進(jìn)行預(yù)覽時(shí),嵌入在PDDI122中的媒體播放器開(kāi)始在預(yù)覽區(qū)域712中從該視頻段開(kāi)始處播放該視頻段。例如,在圖13中,視頻段能夠在進(jìn)入新聞段后的四分二十一秒處開(kāi)始播放,并且該播放對(duì)應(yīng)于從“00:04:20-00:06:35”運(yùn)行的所選片段的開(kāi)始處。如前所討論的,可選地,視頻內(nèi)容能夠從視頻時(shí)間線上的“00:00:00”處而不是特定片段處開(kāi)始播放。此外,可以設(shè)計(jì)系統(tǒng)使得媒體播放器開(kāi)始不播放視頻片段直到用戶(hù)選擇播放按鈕1304為止。因此,在選擇將預(yù)覽的視頻段的基礎(chǔ)上,將出現(xiàn)一個(gè)媒體播放器,其中滑動(dòng)器位于該段的開(kāi)始處,用戶(hù)必須實(shí)際點(diǎn)擊播放按鈕1304來(lái)使內(nèi)容開(kāi)始播放。預(yù)覽區(qū)域712中的媒體播放器還包括許多標(biāo)準(zhǔn)多媒體播放器(例如微軟視窗媒體播放器)的特征,諸如是用于停止/暫停視頻片段顯示的暫停按鈕1310、用于在視頻內(nèi)容中倒退的倒退按鈕1312、用于在視頻內(nèi)容中快進(jìn)的快進(jìn)按鈕1314、用于設(shè)置放映音量的音量調(diào)節(jié)器1306。還包括允許用戶(hù)在視頻內(nèi)容四周移動(dòng)的滑動(dòng)器1308。能夠使滑動(dòng)器1308沿其移動(dòng)的滑動(dòng)器條1316能夠?qū)?yīng)于沿時(shí)間線顯示的全部視頻內(nèi)容的長(zhǎng)度或者滑動(dòng)器條1316能夠僅對(duì)應(yīng)于該片段的長(zhǎng)度。用戶(hù)能夠沿滑動(dòng)器條1316點(diǎn)擊和拖動(dòng)滑動(dòng)器1308以便在視頻內(nèi)容中移動(dòng)。配置快進(jìn)按鈕1314和倒退按鈕1312以允許用戶(hù)僅在所選擇的段中移動(dòng)或者能夠有選擇地允許用戶(hù)在與視頻時(shí)間線相關(guān)的全部視頻內(nèi)容中移動(dòng)。媒體播放器可以缺少圖13所示的任何一種控制按鈕或者能夠包括用于控制視頻顯示的其它按鈕。圖13還在內(nèi)容選擇區(qū)域714中示出了視頻時(shí)間線上顯示的預(yù)覽窗口1280,其與圖12所示相似。這允許用戶(hù)預(yù)覽內(nèi)容選擇區(qū)域714中的視頻內(nèi)容?,F(xiàn)在參照?qǐng)D14,該圖示出了其中在預(yù)覽區(qū)域712中正在顯示視頻片段的PDDI122的圖形表示。圖14示出了通過(guò)使用在該實(shí)施例的媒體播放器中包含的開(kāi)始標(biāo)記符按鈕1402和結(jié)束標(biāo)記符按鈕1404進(jìn)行的段的創(chuàng)建。能夠?qū)⒚襟w播放器設(shè)計(jì)成使得滑動(dòng)器條1316的開(kāi)始對(duì)應(yīng)于與視頻時(shí)間線相關(guān)的視頻內(nèi)容的開(kāi)始(例如在“00:00:00”)或者對(duì)應(yīng)于選擇片段的開(kāi)始。當(dāng)正在播放視頻內(nèi)容時(shí),用戶(hù)能夠使用開(kāi)始標(biāo)記符按鈕1402和結(jié)束標(biāo)記符按鈕1404標(biāo)記感興趣的段。例如,如果用戶(hù)對(duì)討論特定演員的新聞段中的視頻內(nèi)容感興趣,則用戶(hù)能夠在媒體播放器中播放該視頻內(nèi)容。當(dāng)用戶(hù)達(dá)到討論該演員的段時(shí),用戶(hù)能夠點(diǎn)擊開(kāi)始標(biāo)記符按鈕1402來(lái)標(biāo)記位置。當(dāng)該段結(jié)束時(shí),用戶(hù)能夠點(diǎn)擊結(jié)束標(biāo)記符按鈕1404。用戶(hù)能夠?qū)φ麄€(gè)新聞段繼續(xù)如此操作,從而標(biāo)記將被打印或用于任何其它目的的感興趣的段。圖15示出了圖12所示的PDDI122的圖形表示,其中,用戶(hù)已經(jīng)使用鼠標(biāo)或其它點(diǎn)入設(shè)備右擊了內(nèi)容選擇區(qū)域714中所示的視頻時(shí)間線。當(dāng)用戶(hù)右擊了視頻時(shí)間線中的一視頻段時(shí),出現(xiàn)對(duì)話框1502,以便向用戶(hù)提供有關(guān)視頻幀的選項(xiàng)。用戶(hù)能夠在對(duì)話框1502中選擇播放與段相關(guān)的視頻或者如果其目前正在播放則暫停播放該視頻。另外,用戶(hù)能夠選擇編輯該段。編輯選項(xiàng)將在下面詳細(xì)討論。對(duì)話框1502能夠出現(xiàn)在視頻時(shí)間線中被選擇段的上方或靠近視頻時(shí)間線的任何地方。對(duì)話框1502還能夠附加地包括除圖14所示那些選項(xiàng)以外的其它控制選項(xiàng),諸如是倒退選項(xiàng)或快進(jìn)選項(xiàng)?,F(xiàn)在參照?qǐng)D16,該圖示出了圖15所示其中用戶(hù)已經(jīng)選擇了對(duì)話框1502中編輯選項(xiàng)的PDDI122的圖形表示。在對(duì)話框1502中選擇了編輯選項(xiàng)的基礎(chǔ)上,出現(xiàn)一編輯對(duì)話框1602,從而允許用戶(hù)選擇進(jìn)一步的選項(xiàng)。在編輯對(duì)話框1602中,用戶(hù)能夠通過(guò)修改開(kāi)始時(shí)間區(qū)域1604和結(jié)束時(shí)間區(qū)域1606來(lái)修改段的開(kāi)始時(shí)間或結(jié)束時(shí)間。因此,用戶(hù)能夠進(jìn)行選擇以使該段包括在該段到來(lái)前后時(shí)間內(nèi)的一些內(nèi)容。例如由于存在很多用戶(hù)感興趣的介紹或某些引言,所以,用戶(hù)可能感興趣的是觀看在該段規(guī)定開(kāi)始時(shí)間之前45秒鐘在CNN新聞段中發(fā)生的視頻內(nèi)容。此外,用戶(hù)可能感興趣的是觀看該段規(guī)定結(jié)束時(shí)間之后幾秒鐘來(lái)到的視頻內(nèi)容。用戶(hù)能夠有選擇地修改一個(gè)段的開(kāi)始和結(jié)束時(shí)間以縮短該段和消除用戶(hù)不感興趣的無(wú)關(guān)內(nèi)容。在對(duì)開(kāi)始時(shí)間、結(jié)束時(shí)間或者兩者進(jìn)行修改之后,用戶(hù)能夠選擇OK按鈕來(lái)施加這種修改,或者用戶(hù)能夠選擇取消按鈕來(lái)結(jié)束該任務(wù)并使編輯對(duì)話框1602消失。在圖17的例子中,代替使用選擇器1222手動(dòng)選擇視頻時(shí)間線的段,用戶(hù)已經(jīng)對(duì)視頻數(shù)據(jù)應(yīng)用了分段類(lèi)型。用戶(hù)已經(jīng)在分段類(lèi)型區(qū)域1202中選擇執(zhí)行面孔檢測(cè),其中系統(tǒng)將在視頻內(nèi)容中搜索面孔圖像。當(dāng)選擇面孔檢測(cè)時(shí),PDDI122沿時(shí)間線示出包含面孔圖像的段。每一個(gè)段伴隨有表示在片段中檢測(cè)的面孔數(shù)量的整數(shù)以及置信值。用戶(hù)還已經(jīng)在閾值選擇區(qū)域1204中選擇使用80%的閾值。因此,在PDDI122中將只顯示大于80%可能包含面孔圖像的視頻幀。面孔檢測(cè)結(jié)果顯示在分段顯示區(qū)域1702中。每一個(gè)在分段顯示區(qū)域1702中示出的事件段1704對(duì)應(yīng)于大于80%可能包含面孔圖像的一個(gè)視頻幀或者多個(gè)視頻幀。事件段1704在圖17中被表示為交錯(cuò)排列的框。但是這些交錯(cuò)排列的框也可以是穿過(guò)分段顯示區(qū)域1702伸出的線或者其它可視的指示符。用戶(hù)能夠右擊任何一個(gè)事件段1704來(lái)刪除該事件段1704。對(duì)應(yīng)于事件段1704的標(biāo)記符(例如,條碼)能夠顯示在預(yù)覽區(qū)域712中顯示的多媒體文檔中。用戶(hù)能夠點(diǎn)擊位于靠近每一個(gè)事件段1704的播放箭頭1224來(lái)播放極可能包含面孔圖像的視頻內(nèi)容。此外,當(dāng)用戶(hù)沿著視頻時(shí)間線移動(dòng)選擇器1222時(shí)出現(xiàn)預(yù)覽窗口1302,以便向用戶(hù)提供觀看事件段1704中視頻幀的機(jī)會(huì)從而確保存在面孔圖像。另外,可以將系統(tǒng)結(jié)構(gòu)成將顯示相同面孔的圖像視頻內(nèi)容合并到一個(gè)視頻幀中,而不是顯示與特定面孔圖像每一瞬間相關(guān)的單獨(dú)視頻幀。除了圖17的面孔檢測(cè)例子之外,還有許多其它分段類(lèi)型能夠應(yīng)用到視頻內(nèi)容或者其它類(lèi)型的多媒體內(nèi)容中。這些分段類(lèi)型的每一個(gè)能夠顯示在分段類(lèi)型區(qū)域1202中的菜單中,并且用戶(hù)能夠從菜單中選擇將應(yīng)用哪一種分段類(lèi)型。下面是能夠應(yīng)用的各種不同分段類(lèi)型的簡(jiǎn)單例子。視頻事件檢測(cè)是一種用戶(hù)能夠應(yīng)用的分段類(lèi)型,其中PDDI122示出了沿時(shí)間線應(yīng)用視頻事件檢測(cè)算法的結(jié)果。視頻事件的例子包括當(dāng)人們?cè)跁?huì)議中起立或當(dāng)人們進(jìn)入房間時(shí)的情況。彩色柱狀圖分析是用戶(hù)能夠應(yīng)用的另一分段類(lèi)型,其中PDDI122示出了沿時(shí)間線應(yīng)用彩色柱狀圖分析算法的結(jié)果。例如,PDDI122能夠以每30秒間隔顯示彩色柱狀圖,從而允許有經(jīng)驗(yàn)的用戶(hù)快速定位包含日落的視頻部分。另外,能夠應(yīng)用群集方式以便將群集面孔圖像從而使相同面孔的多個(gè)情形被合并到一個(gè)表示的面孔圖像中。面孔識(shí)別是另一個(gè)分段類(lèi)型,其中PDDI122示出了沿時(shí)間線的名字,所述名字是通過(guò)對(duì)沿時(shí)間線對(duì)應(yīng)點(diǎn)處的視頻幀應(yīng)用面孔識(shí)別而得到的。另外提供一系列檢查框以使用戶(hù)能夠通過(guò)選擇名字來(lái)選擇片段。光學(xué)字符識(shí)別(OCR)是一個(gè)分段類(lèi)型,其中對(duì)視頻內(nèi)容中的每一幀執(zhí)行OCR,對(duì)每一幀做二次抽樣(即每30幀一次)。沿時(shí)間線顯示這些結(jié)果。還提供一文本輸入對(duì)話框以便使用戶(hù)輸入在OCR結(jié)果中搜索的字。沿時(shí)間線指出出包含輸入文本的片段。另外,能夠應(yīng)用群集方式從而能夠歸并對(duì)每一幀執(zhí)行OCR時(shí)生成的相似的結(jié)果。沿時(shí)間線指出出包含輸入文本的群集。除了上述分段類(lèi)型之外,還存在能夠被應(yīng)用的其它例子。運(yùn)動(dòng)分析是另一個(gè)分段類(lèi)型,其中PDDI122示出了沿時(shí)間線應(yīng)用運(yùn)動(dòng)分析算法的結(jié)果。該結(jié)果被顯示為例如具有指出所檢測(cè)運(yùn)動(dòng)量的幅值的波形。例如,這將允許有經(jīng)驗(yàn)的用戶(hù)快速定位包含某人跑過(guò)攝像機(jī)視野的視頻部分。距離預(yù)測(cè)是另一個(gè)分段類(lèi)型,其中PDDI122示出了沿時(shí)間線應(yīng)用距離預(yù)測(cè)算法的結(jié)果。例如,在使用兩個(gè)分開(kāi)已知距離的攝像機(jī)的監(jiān)視攝像應(yīng)用中,能夠預(yù)測(cè)每一點(diǎn)距離攝像機(jī)的距離。用戶(hù)能夠根據(jù)他們距離攝像機(jī)的距離來(lái)設(shè)置閾值以選擇給定的視頻文件部分進(jìn)行打印。例如,用戶(hù)可能希望僅看到距離攝像機(jī)大于50碼的物體。還能夠應(yīng)用前景和背景分段,其中PDDI122示出了沿時(shí)間線應(yīng)用前景和背景分段算法的結(jié)果。在每一點(diǎn)上,顯示前景物體。能夠跨相鄰幀的組進(jìn)行群集及合并算法以減少被顯示單個(gè)物體的數(shù)量。用戶(hù)能夠根據(jù)前景和背景分段的置信值以及合并算法來(lái)設(shè)置閾值以便選擇給定視頻文件部分進(jìn)行打印。場(chǎng)景分段是用戶(hù)能夠應(yīng)用的另一種類(lèi)型,其中PDDI122示出了沿時(shí)間線應(yīng)用拍攝分段算法的結(jié)果。每一個(gè)段都伴隨有表示該分段正確的置信值。也能夠應(yīng)用識(shí)別機(jī)動(dòng)車(chē)或牌照的分段類(lèi)型。機(jī)動(dòng)車(chē)的識(shí)別可能對(duì)例如操作監(jiān)視攝像機(jī)的用戶(hù)非常有用,這種監(jiān)視攝像機(jī)生成長(zhǎng)時(shí)間的非??菰锏囊曨l。這種用戶(hù)經(jīng)常需要尋找和打印僅僅包含例如紅色卡迪拉克的特定對(duì)象的那些部分。為此,利用機(jī)動(dòng)車(chē)識(shí)別技術(shù)對(duì)輸入的每一視頻幀進(jìn)行處理,并且沿時(shí)間線顯示結(jié)果。牌照識(shí)別也可能對(duì)操作監(jiān)視攝像機(jī)的用戶(hù)非常有用,并且這樣的用戶(hù)可能需要搜索監(jiān)視視頻來(lái)尋找包含特定牌照號(hào)的部分。為此,利用牌照識(shí)別技術(shù)處理輸入視頻的每一幀,并且沿時(shí)間線顯示結(jié)果(牌照號(hào)、狀態(tài)、牌照顏色、牌照持有者的姓名和地址、牌照持有者的未完成的拘留搜查、犯罪歷史等)。通過(guò)機(jī)動(dòng)車(chē)或牌照識(shí)別,用戶(hù)能夠根據(jù)伴隨機(jī)動(dòng)車(chē)或牌照識(shí)別結(jié)果的置信值設(shè)置一閾值以便選擇給定視頻文件的部分進(jìn)行打印。還提供了一文本輸入對(duì)話框,以允許用戶(hù)輸入與機(jī)動(dòng)車(chē)的制造、型號(hào)、顏色和年代或者牌照的牌號(hào)、國(guó)家和年代等相關(guān)的識(shí)別符。在識(shí)別結(jié)果中搜索這些文本輸入。沿時(shí)間線指出包含所輸入信息的片段?,F(xiàn)在參照?qǐng)D18,該圖示出了包括來(lái)自多于一個(gè)時(shí)間線上顯示的多個(gè)源的視頻內(nèi)容的PDDI122的圖形表示。例如,視頻內(nèi)容能夠源于兩個(gè)不同的CNN新聞段,或者能夠源于CNN新聞段和CSPAN新聞段。系統(tǒng)可以被結(jié)構(gòu)成在多媒體文檔的一個(gè)頁(yè)面上打印來(lái)自一個(gè)新聞段的視頻幀,以及在另一頁(yè)面上打印來(lái)自另一新聞段的視頻幀。圖18顯示了兩個(gè)單獨(dú)的內(nèi)容選擇區(qū)域714a和714b,其中的每一個(gè)都具有顯示所提取視頻幀和相關(guān)文本的單獨(dú)的視頻時(shí)間線。每一個(gè)視頻時(shí)間線包括用于在視頻時(shí)間線中生成選擇的選擇器1222a和1222b;和表示其中有大于80%的機(jī)會(huì)能夠檢測(cè)到面孔圖象幀的事件段1704。每一個(gè)視頻時(shí)間線還包括與示出了通過(guò)對(duì)那個(gè)視頻源應(yīng)用面孔檢測(cè)導(dǎo)致的事件段1704的時(shí)間線相關(guān)的單獨(dú)的分段顯示區(qū)域1102。因此,用戶(hù)能夠獨(dú)立地在每一個(gè)時(shí)間線周?chē)苿?dòng)選擇器1222a和1222b直到用戶(hù)已經(jīng)流覽預(yù)覽窗口1302并確定選擇用于在多媒體文檔中顯示的視頻幀為止。盡管圖18示出了兩個(gè)視頻時(shí)間線,但它可以使用戶(hù)比較多個(gè)源,并由此在PDDI122中生成多個(gè)時(shí)間線。用戶(hù)能夠使用PDDI對(duì)視頻內(nèi)容應(yīng)用多種不同的分段類(lèi)型。例如用戶(hù)可以選擇對(duì)所示的一個(gè)十二分鐘長(zhǎng)的CNN新聞節(jié)目應(yīng)用音頻檢測(cè)和揚(yáng)聲器識(shí)別。圖19示出了圖17的PDDI122,其中應(yīng)用了面孔檢測(cè)。但是,圖19示出了應(yīng)用面孔檢測(cè)和視頻OCR的結(jié)果。在某些實(shí)施例中,該系統(tǒng)被結(jié)構(gòu)成在分段類(lèi)型區(qū)域中包括下拉菜單。該菜單能夠在其中逐一列出每一個(gè)分段類(lèi)型。因此,在這個(gè)實(shí)施例中,用戶(hù)能夠點(diǎn)擊菜單中的多于一個(gè)的分段類(lèi)型(即在進(jìn)行選擇的同時(shí)保持按下CTRL按鍵)并應(yīng)用全部所選擇的分段類(lèi)型。在另一個(gè)實(shí)施例中,該菜單還可以包括一定數(shù)量的不同組合選項(xiàng),以允許用戶(hù)在包含多于一個(gè)分段類(lèi)型的菜單中選擇一個(gè)項(xiàng)。例如,音頻檢測(cè)+揚(yáng)聲器識(shí)別可以是菜單上的一個(gè)組合項(xiàng)。通過(guò)選擇菜單中的這個(gè)選項(xiàng),用戶(hù)使對(duì)多媒體內(nèi)容執(zhí)行音頻檢測(cè)和揚(yáng)聲器識(shí)別。這個(gè)組合菜單項(xiàng)可以將打印機(jī)102的特性預(yù)設(shè)為分段類(lèi)型和分段組合類(lèi)型的缺省表。此外,用戶(hù)能夠定義他或她自己的組合類(lèi)型。當(dāng)用戶(hù)創(chuàng)建用戶(hù)定義的分段類(lèi)型時(shí),該用戶(hù)能夠給該分段類(lèi)型一個(gè)名字,并且該選項(xiàng)將出現(xiàn)在分段類(lèi)型的下拉菜單中。圖19中的分段類(lèi)型名字為“Combol”,并且它是由用戶(hù)定義的單個(gè)分段類(lèi)型的組合。此外,由于多于一個(gè)分段技術(shù)的組合能夠生成可調(diào)節(jié)的大量參數(shù),所以閾值區(qū)域1204被禁止。因此,每一個(gè)技術(shù)組合都具有被證明是性能良好的參數(shù)值缺省集。但是,用戶(hù)可以在點(diǎn)擊選項(xiàng)按鈕1906時(shí)出現(xiàn)的對(duì)話框(未示出)中修改它們。如圖19所示,內(nèi)容選擇區(qū)域714包括兩個(gè)分段顯示區(qū)域1102,其中的一個(gè)用于已經(jīng)被應(yīng)用到視頻內(nèi)容的每一個(gè)分段類(lèi)型。在這個(gè)例子中,對(duì)于組成“Combol”的兩個(gè)分段類(lèi)型的每一個(gè)存在一個(gè)分段顯示區(qū)域1102??拷筮叺姆侄物@示區(qū)域1102顯示了應(yīng)用圖17所示面孔檢測(cè)的結(jié)果。但是事件段1704不是象它們?cè)趫D17中的那樣交錯(cuò)排列的,而是在其它之上排列成一線??拷疫叺姆侄物@示區(qū)域1102示出了對(duì)視頻內(nèi)容應(yīng)用視頻OCR的結(jié)果。在這個(gè)分段顯示區(qū)域1102中所示的事件段1704與靠近左邊的分段顯示區(qū)域1102所示的那些不同。但是在某些實(shí)施例中,在不同分段顯示區(qū)域1102中所示的事件段1704可以顯示相同的事件段。在某些實(shí)施例中,在兩個(gè)分段顯示區(qū)域1102中以不同格式排列事件段1704,或者PDDI1704能夠僅包含示出了用于所應(yīng)用的所有分段類(lèi)型的事件段1704的一個(gè)分段顯示區(qū)域1102。除了圖19所示其中應(yīng)用了分段類(lèi)型的組合(例如Combol)的例子之外,還有許多能夠生成的其它分段類(lèi)型的組合。在分段類(lèi)型區(qū)域1202中的菜單中能夠顯示這些分段類(lèi)型的組合的每一個(gè),并且用戶(hù)能夠從菜單中選擇哪一個(gè)分段類(lèi)型將被應(yīng)用。盡管下面沒(méi)有討論的許多其它組合也可以生成,但下面還是示出了能夠應(yīng)用的各種不同分段類(lèi)型組合的簡(jiǎn)單例子。用戶(hù)能夠應(yīng)用運(yùn)動(dòng)分析與距離預(yù)測(cè)進(jìn)行組合,其中,PDDI122示出了沿一個(gè)時(shí)間線或兩個(gè)單獨(dú)的時(shí)間線應(yīng)用運(yùn)動(dòng)分析算法與距離預(yù)測(cè)算法的結(jié)果。運(yùn)動(dòng)分析時(shí)間線能夠包括其幅值指出被檢測(cè)運(yùn)動(dòng)的量的波形。用戶(hù)能夠設(shè)置閾值允許用戶(hù)根據(jù)所檢測(cè)的運(yùn)動(dòng)量和從攝像機(jī)運(yùn)動(dòng)的距離選擇給定視頻文件的部分去打印。場(chǎng)景分段和面孔識(shí)別是另一種用戶(hù)能夠應(yīng)用的組合,其中PDDI122示出了沿一個(gè)時(shí)間線應(yīng)用拍攝分段算法的結(jié)果。例如色彩或特定圖符能夠指出包含面孔圖像的時(shí)間線上的段。每一個(gè)段能夠伴隨有表示場(chǎng)景分段正確的置信值以及能夠伴隨有表示被檢測(cè)面孔數(shù)量的整數(shù)和置信值。場(chǎng)景分段和OCR是另一種能夠應(yīng)用的組合,其中PDDI122示出了沿一個(gè)時(shí)間線應(yīng)用拍攝分段算法的結(jié)果。還對(duì)視頻內(nèi)容的每一幀執(zhí)行OCR,并且對(duì)該內(nèi)容進(jìn)行二次抽樣。沿相同或不同的時(shí)間線顯示該結(jié)果。用戶(hù)還能夠在OCR結(jié)果中執(zhí)行文本搜索,并且包含所搜索字的段能夠沿時(shí)間線顯示。當(dāng)將分段類(lèi)型組合應(yīng)用到多媒體內(nèi)容時(shí),不限制用戶(hù)只能應(yīng)用兩種組合。用戶(hù)可以應(yīng)用三種或更多分段類(lèi)型,并且這種組合能夠在分段類(lèi)型菜單上通過(guò)缺省而示出或者能夠由用戶(hù)創(chuàng)建。場(chǎng)景分段、OCR和面孔識(shí)別都可以應(yīng)用于該組合中,其中PDDI122示出了沿一個(gè)時(shí)間線應(yīng)用拍攝分段算法的結(jié)果。對(duì)視頻每一幀已經(jīng)執(zhí)行了OCR和二次抽樣,并且沿相同或不同時(shí)間線顯示結(jié)果。通過(guò)對(duì)視頻幀應(yīng)用面孔識(shí)別得出的名字也顯示在相同或不同時(shí)間線上。而且,提供一系列檢查框讓用戶(hù)通過(guò)選擇名字而選擇片段。用戶(hù)能夠設(shè)置與結(jié)果相關(guān)的閾值,以允許用戶(hù)根據(jù)伴隨拍攝分段、OCR和面孔識(shí)別結(jié)果的置信值而選擇打印的給定視頻文件的部分。此外,用戶(hù)能夠應(yīng)用面孔檢測(cè)以及OCR和場(chǎng)景分段。PDDI122將顯示如上所述的OCR和場(chǎng)景分段的結(jié)果。相同或不同的時(shí)間線也能包括含有面孔圖像的段。每一個(gè)段可以伴隨有表示片段中被檢測(cè)面孔數(shù)量的整數(shù)以及置信值。機(jī)動(dòng)車(chē)識(shí)別+運(yùn)動(dòng)分析可以是另一個(gè)可選的分段類(lèi)型組合,其中,利用機(jī)動(dòng)車(chē)識(shí)別技術(shù)對(duì)所輸入的每一視頻幀進(jìn)行識(shí)別并沿時(shí)間線顯示結(jié)果。而且,將運(yùn)動(dòng)分析技術(shù)應(yīng)用到視頻上以逐個(gè)幀地預(yù)測(cè)機(jī)動(dòng)車(chē)的速度。還提供了一文本輸入對(duì)話框,以允許用戶(hù)輸入與機(jī)動(dòng)車(chē)的制造商、型號(hào)、顏色和年代相關(guān)的識(shí)別符以及機(jī)動(dòng)車(chē)速度。在機(jī)動(dòng)車(chē)識(shí)別和運(yùn)動(dòng)分析結(jié)果中搜索這些項(xiàng)目,并且沿該時(shí)間線指出包含所輸入信息的片段。在圖19示出了多于一個(gè)的分段類(lèi)型(例如Combol)正在被應(yīng)用到視頻內(nèi)容上的例子的同時(shí),還能夠?qū)σ纛l內(nèi)容或其它類(lèi)型的多媒體數(shù)據(jù)應(yīng)用多于一個(gè)的分段類(lèi)型。下面是能夠應(yīng)用的分段類(lèi)型的不同組合的簡(jiǎn)單例子,盡管許多下面沒(méi)有討論的其它組合也能生成。音頻事件檢測(cè)+分類(lèi)是組合的一個(gè)例子。PDDI122示出了沿時(shí)間線應(yīng)用音頻事件檢測(cè)的結(jié)果,諸如拍手、大叫或大笑。每一個(gè)檢測(cè)的事件伴隨有其正確檢測(cè)可能的置信值。PDDI122包括一系列檢查框以使用戶(hù)選擇哪一個(gè)事件將被顯示。揚(yáng)聲器分段和揚(yáng)聲器識(shí)別是另一個(gè)組合的例子。每一段以不同顏色或不同圖符沿時(shí)間線示出,并且由相同揚(yáng)聲器生成的段示以相同的顏色或相同的圖符。揚(yáng)聲器識(shí)別結(jié)果包括用于每一個(gè)揚(yáng)聲器名字的文本和可選的置信值。多個(gè)揚(yáng)聲器名字能夠與每一個(gè)段相關(guān)聯(lián)。用戶(hù)能夠可選地應(yīng)用聲源位置和音頻事件檢測(cè)。據(jù)以檢測(cè)聲音的方向以一個(gè)圓的扇區(qū)形表示。每一個(gè)扇區(qū)伴隨有其正確檢測(cè)可能的置信值。用戶(hù)界面包括安置在示例圓的圓周周?chē)囊幌盗袡z查框,以使用戶(hù)選擇顯示方向。每一個(gè)檢測(cè)的音頻事件伴隨有其正確檢測(cè)可能的置信值,并且PDDI122包括一系列檢查框,以使用戶(hù)選擇哪一個(gè)事件將被顯示。用戶(hù)可選地應(yīng)用語(yǔ)音識(shí)別和配置文件分析組合。PDDI122中的時(shí)間線示出說(shuō)出的每一個(gè)詞或句子的文本和可選的置信值。語(yǔ)言識(shí)別結(jié)果與表示用戶(hù)興趣的預(yù)先存在的基于文本的概貌相匹配。用戶(hù)能夠調(diào)節(jié)置信值的閾值,并且,用戶(hù)還能夠調(diào)節(jié)在配置文件和語(yǔ)音識(shí)別結(jié)果之間的匹配程度。語(yǔ)音識(shí)別和音頻事件檢測(cè)是能夠應(yīng)用的另一個(gè)組合的例子。時(shí)間線包括說(shuō)出的每一個(gè)詞或句子的文本和可選的置信值,以及應(yīng)用音頻事件檢測(cè)的結(jié)果。當(dāng)對(duì)媒體內(nèi)容應(yīng)用分段類(lèi)型組合時(shí),用戶(hù)不限于只應(yīng)用兩種組合。用戶(hù)能夠應(yīng)用三個(gè)或更多分段類(lèi)型,并且這種組合能夠在分段類(lèi)型菜單上通過(guò)缺省而示出或者能夠由用戶(hù)創(chuàng)建。語(yǔ)音識(shí)別、音頻事件檢測(cè)和揚(yáng)聲器識(shí)別可以組合應(yīng)用。語(yǔ)音識(shí)別結(jié)果包括每一個(gè)詞或句子的文本和可選的置信值。所檢測(cè)的音頻在相同或不同的時(shí)間線上示出。PDDI122還顯示每一個(gè)檢測(cè)的揚(yáng)聲器的名字,伴隨有其正確檢測(cè)可能的置信值。用戶(hù)界面包括一系列檢查框,以使用戶(hù)選擇顯示哪些揚(yáng)聲器。能夠可選地應(yīng)用語(yǔ)音識(shí)別、音頻事件檢測(cè)和揚(yáng)聲器識(shí)別。除了是顯示揚(yáng)聲器分段事件而不是揚(yáng)聲器識(shí)別事件外,應(yīng)用程序與上述相同。每一個(gè)揚(yáng)聲器段以不同顏色或不同圖符示出,并且由相同揚(yáng)聲器生成的段以相同顏色或相同圖符示出。作為另一個(gè)例子,語(yǔ)音識(shí)別、音頻事件檢測(cè)和聲音定位可以組合應(yīng)用。時(shí)間線將示出與每一個(gè)詞或句子相關(guān)的文本和可選置信值、以及所檢測(cè)的音頻事件。時(shí)間線還以一圓的扇區(qū)形式示出據(jù)以檢測(cè)聲音的方向。每一個(gè)扇區(qū)伴隨有其正確檢測(cè)可能的置信值。用戶(hù)界面包括安置在示例圓圈的圓周周?chē)囊幌盗袡z查框,以使用戶(hù)選擇哪個(gè)方向?qū)⒈伙@示。現(xiàn)在參照?qǐng)D20,該圖示出了顯示能由系統(tǒng)生成的多媒體文檔的另一個(gè)實(shí)施例的表示的多媒體表示(例如視頻紙件文檔)。該文檔2000示出了八個(gè)視頻幀1206,并且某些視頻幀伴隨有通過(guò)圖19的PDDI已經(jīng)生成的文本1216(可以是對(duì)話的副本、視頻內(nèi)容簡(jiǎn)介等)。在這個(gè)實(shí)施例中,分割器2004分割每個(gè)視頻幀1206,并且顯示視頻內(nèi)容每一段開(kāi)始和結(jié)束時(shí)間的時(shí)間戳2006包括在每個(gè)分割器2004中。此外,所示的標(biāo)題2002顯示有關(guān)視頻內(nèi)容的信息。在這個(gè)例子中,標(biāo)題2002顯示名稱(chēng)、CNN新聞、新聞節(jié)目的時(shí)間(例如上午10點(diǎn))、節(jié)目的日期(例如2001年9月19日)以及節(jié)目的長(zhǎng)度(例如十二分鐘19秒長(zhǎng))。識(shí)別符1208示出在每一個(gè)視頻幀1206的下面,并且用戶(hù)能夠選擇這些識(shí)別符1208當(dāng)中的任何一個(gè)以使與該視頻幀1206相關(guān)視頻內(nèi)容開(kāi)始播放。視頻幀1206能夠在揚(yáng)聲器開(kāi)始朗讀相關(guān)的文本1216副本的點(diǎn)處開(kāi)始播放。沒(méi)有被示出文本或被顯示“無(wú)文本”短語(yǔ)的視頻幀1206可以包括其中片段中的人物沒(méi)有說(shuō)話的視頻內(nèi)容或者可以表示其中用戶(hù)沒(méi)有選擇顯示文本的例子。圖20所示實(shí)施例中的多媒體文檔還示出了用于控制視頻內(nèi)容顯示的控制標(biāo)記符或識(shí)別符。在圖20中,示出了播放標(biāo)記符1210、快進(jìn)(FF)標(biāo)記符1212以及倒退標(biāo)記符1214。如前所述的,這些標(biāo)記符提供到多媒體數(shù)據(jù)的界面。盡管已經(jīng)參考某些優(yōu)選實(shí)施例說(shuō)明了本發(fā)明,但是本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到可以提供各種修改。可以在由下述權(quán)利要求限定的本發(fā)明的范圍內(nèi)對(duì)所述優(yōu)選實(shí)施例提供各種變化和修改。權(quán)利要求1.一種允許與媒體數(shù)據(jù)分析和媒體表示生成交互操作的系統(tǒng),該系統(tǒng)包括用戶(hù)界面,用于允許用戶(hù)控制媒體內(nèi)容分析和媒體表示生成;以及媒體分析軟件模塊,用于分析媒體內(nèi)容的特征,所述媒體分析軟件模塊被可通信地耦合到用戶(hù)界面以接收媒體內(nèi)容分析指令。2.如權(quán)利要求1所述的系統(tǒng),所述媒體分析軟件模塊還包括內(nèi)容識(shí)別軟件,用于識(shí)別媒體內(nèi)容的特征。3.如權(quán)利要求1所述的系統(tǒng),還包括用于控制用戶(hù)界面顯示的處理邏輯。4.如權(quán)利要求1所述的系統(tǒng),還包括用戶(hù)控制媒體表示生成的處理邏輯。5.如權(quán)利要求1所述的系統(tǒng),還包括用于以數(shù)字格式寫(xiě)入媒體表示的硬件。6.如權(quán)利要求5所述的系統(tǒng),還包括用于以數(shù)字格式存儲(chǔ)媒體表示的存儲(chǔ)介質(zhì)。7.如權(quán)利要求1所述的系統(tǒng),其中,以紙件格式生成媒體表示。8.如權(quán)利要求7所述的系統(tǒng),其中,紙件格式至少包括一個(gè)允許用戶(hù)訪問(wèn)和控制媒體內(nèi)容的用戶(hù)可選擇識(shí)別符。9.如權(quán)利要求8所述的系統(tǒng),其中,所述至少一個(gè)用戶(hù)可選擇識(shí)別符包括打印在媒體表示上的至少一個(gè)條碼。10.如權(quán)利要求8所述的系統(tǒng),其中,所述至少一個(gè)用戶(hù)可選擇識(shí)別符還包括能夠被選擇用來(lái)播放相關(guān)媒體內(nèi)容的至少一個(gè)播放識(shí)別符。11.如權(quán)利要求1所述的系統(tǒng),還包括用于表示媒體內(nèi)容變換的數(shù)據(jù)結(jié)構(gòu)。12.如權(quán)利要求1所述的系統(tǒng),還包括一通信監(jiān)視模塊,用于監(jiān)視系統(tǒng)組件之間的通信,其中,通信監(jiān)視模塊轉(zhuǎn)發(fā)對(duì)信息的請(qǐng)求并對(duì)系統(tǒng)組件中的請(qǐng)求進(jìn)行應(yīng)答。13.如權(quán)利要求1所述的系統(tǒng),其中,用戶(hù)界面還包括一選擇菜單,用于允許用戶(hù)選擇將對(duì)媒體內(nèi)容執(zhí)行的特征分析。14.如權(quán)利要求1所述的系統(tǒng),其中,用戶(hù)界面還包括設(shè)置與媒體內(nèi)容分析相關(guān)的置信值的閾值的區(qū)域。15.如權(quán)利要求1所述的系統(tǒng),其中,用戶(hù)界面還包括至少一個(gè)用于管理和修改媒體表示上的媒體信息的顯示的區(qū)域。16.如權(quán)利要求1所述的系統(tǒng),其中,用戶(hù)界面還包括用于預(yù)覽所選擇的媒體內(nèi)容中的激活媒體幀的預(yù)覽區(qū)域。17.如權(quán)利要求1所述的系統(tǒng),其中,用戶(hù)界面還包括預(yù)覽將生成的媒體表示的預(yù)覽區(qū)域。18.如權(quán)利要求1所述的系統(tǒng),其中,用戶(hù)界面還包括至少一個(gè)內(nèi)容選擇區(qū)域,用于從將顯示在媒體表示中的至少一個(gè)源中選擇媒體內(nèi)容的段。19.如權(quán)利要求18所述的系統(tǒng),其中,內(nèi)容選擇區(qū)域還包括用戶(hù)能夠沿內(nèi)容選擇區(qū)域滑動(dòng)的選擇器,以便選擇將在媒體表示中顯示的段。20.如權(quán)利要求18所述的系統(tǒng),其中,內(nèi)容選擇區(qū)域還包括媒體內(nèi)容的圖形說(shuō)明,從該圖形說(shuō)明中,用戶(hù)能夠?yàn)g覽媒體內(nèi)容并選擇媒體內(nèi)容的段。21.如權(quán)利要求20所述的系統(tǒng),其中,媒體內(nèi)容的圖形說(shuō)明還包括顯示音頻內(nèi)容的音頻波形時(shí)間線。22.如權(quán)利要求20所述的系統(tǒng),其中,媒體內(nèi)容的圖形說(shuō)明還包括顯示從視頻內(nèi)容提取的視頻幀的視頻時(shí)間線。23.如權(quán)利要求20所述的系統(tǒng),其中,媒體內(nèi)容的圖形說(shuō)明還包括顯示從視頻內(nèi)容提取的文本的時(shí)間線。24.如權(quán)利要求18所述的系統(tǒng),其中,內(nèi)容選取區(qū)域還包括用于顯示媒體內(nèi)容分析結(jié)果的區(qū)域,該結(jié)果被沿時(shí)間線作為定義段顯示。25.如權(quán)利要求1所述的系統(tǒng),其中,還包括輸出設(shè)備驅(qū)動(dòng)器模塊,用于驅(qū)動(dòng)媒體內(nèi)容分析和媒體表示生成,輸出設(shè)備驅(qū)動(dòng)器被通信地耦合到用戶(hù)界面以接收用戶(hù)指令。26.如權(quán)利要求25所述的系統(tǒng),還包括用于生成媒體表示的附加輸出設(shè)備,該附加輸出設(shè)備被通信地耦合到媒體分析軟件模塊以接收變換的媒體數(shù)據(jù),附加輸出設(shè)備被通信地耦合到輸出設(shè)備驅(qū)動(dòng)器模塊以接收用于媒體表示生成的指令。27.一種允許與媒體數(shù)據(jù)分析和媒體表示生成交互操作的方法,該方法包括與界面交互操作以控制媒體內(nèi)容分析和媒體表示生成;分析媒體內(nèi)容的特征,用于媒體表示的生成;驅(qū)動(dòng)媒體數(shù)據(jù)分析;以及通過(guò)接收指令和發(fā)送與媒體表示參數(shù)有關(guān)的指令驅(qū)動(dòng)所述媒體表示生成。28.如權(quán)利要求27所述的方法,還包括生成媒體表示。29.如權(quán)利要求27所述的方法,其中,分析媒體數(shù)據(jù)的特征還包括對(duì)媒體數(shù)據(jù)執(zhí)行語(yǔ)音識(shí)別。30.如權(quán)利要求27所述的方法,其中,分析媒體數(shù)據(jù)的特征還包括對(duì)媒體數(shù)據(jù)執(zhí)行光學(xué)字符識(shí)別。31.如權(quán)利要求27所述的方法,其中,分析媒體數(shù)據(jù)的特征還包括對(duì)媒體數(shù)據(jù)執(zhí)行面孔識(shí)別。32.如權(quán)利要求27所述的方法,其中,分析媒體數(shù)據(jù)的特征還包括對(duì)媒體數(shù)據(jù)執(zhí)行語(yǔ)音識(shí)別。33.如權(quán)利要求27所述的方法,其中,分析媒體數(shù)據(jù)的特征還包括對(duì)媒體數(shù)據(jù)執(zhí)行揚(yáng)聲器檢測(cè)。34.如權(quán)利要求27所述的方法,其中,分析媒體數(shù)據(jù)的特征還包括對(duì)媒體數(shù)據(jù)執(zhí)行面孔檢測(cè)。35.如權(quán)利要求27所述的方法,其中,分析媒體數(shù)據(jù)的特征還包括對(duì)媒體數(shù)據(jù)執(zhí)行事件檢測(cè)。36.如權(quán)利要求27所述的方法,還包括向用于打印媒體表示的媒體重現(xiàn)應(yīng)用程序添加打印功能。37.如權(quán)利要求27所述的方法,在附加輸出設(shè)備可以訪問(wèn)的存儲(chǔ)介質(zhì)中存儲(chǔ)媒體內(nèi)容。38.如權(quán)利要求27所述的方法,其中,與界面交互操作以控制媒體內(nèi)容分析和媒體表示生成還包括使用用戶(hù)界面將媒體格式化選項(xiàng)顯示給用戶(hù)。39.如權(quán)利要求27所述的方法,其中,與界面交互操作以控制媒體內(nèi)容分析和媒體表示生成還包括選擇將被應(yīng)用于媒體內(nèi)容的分析技術(shù),其中,所述分析技術(shù)識(shí)別在媒體內(nèi)容中定義的特征。40.如權(quán)利要求27所述的方法,其中,與界面交互操作以控制媒體內(nèi)容分析和媒體表示生成還包括選擇將被應(yīng)用到與在媒體內(nèi)容中被識(shí)別的定義的特征相關(guān)的置信級(jí)的閾值。41.如權(quán)利要求27所述的方法,其中,與界面交互操作以控制媒體內(nèi)容分析和媒體表示生成還包括預(yù)覽正在預(yù)覽區(qū)域中生成的媒體表示,預(yù)覽區(qū)域如其正被創(chuàng)建時(shí)那樣顯示媒體表示。42.如權(quán)利要求27所述的方法,其中,與界面交互操作以控制媒體內(nèi)容分析和媒體表示生成還包括在用戶(hù)界面上修改內(nèi)容之后選擇更新區(qū)域以更新預(yù)覽區(qū)域。43.如權(quán)利要求27所述的方法,其中與界面交互操作以控制媒體內(nèi)容分析和媒體表示生成還包括在用戶(hù)界面的區(qū)域中通過(guò)沿顯示媒體內(nèi)容的時(shí)間線滑動(dòng)選擇器選擇媒體內(nèi)容段。44.如權(quán)利要求27所述的方法,其中,與界面交互操作以控制媒體內(nèi)容分析和媒體表示生成還包括選擇用戶(hù)界面上的播放選項(xiàng)以播放媒體內(nèi)容。45.如權(quán)利要求27所述的方法,還包括在媒體重現(xiàn)應(yīng)用程序上選擇打印選項(xiàng),其中,用戶(hù)界面出現(xiàn),并且用戶(hù)選擇用于變換媒體內(nèi)容的參數(shù)。46.如權(quán)利要求27所述的方法,還包括在媒體重現(xiàn)應(yīng)用程序上選擇打印選項(xiàng),其中,出現(xiàn)其中已經(jīng)執(zhí)行了缺省媒體內(nèi)容變換的用戶(hù)界面并且媒體表示顯示在用戶(hù)界面的預(yù)覽區(qū)域中。47.如權(quán)利要求27所述的方法,其中,生成可打印的多媒體表示還包括以基于紙件的格式打印媒體表示。48.如權(quán)利要求27所述的方法,還包括選擇基于紙件格式的用戶(hù)可選擇的識(shí)別符以播放相關(guān)的媒體內(nèi)容。全文摘要本發(fā)明系統(tǒng)包括媒體打印界面,允許用戶(hù)與多媒體變換處理交互操作并格式化多媒體數(shù)據(jù)以生成多媒體數(shù)據(jù)的表示。本發(fā)明提供一種用戶(hù)界面,允許用戶(hù)與媒體內(nèi)容分析和媒體表示生成交互操作。媒體分析軟件模塊通過(guò)用戶(hù)界面從用戶(hù)接收媒體內(nèi)容分析指令,并且媒體分析軟件模塊分析和識(shí)別媒體內(nèi)容的特征。媒體表示能夠以紙件格式、數(shù)字格式等生成。用戶(hù)界面包括許多區(qū)域,通過(guò)這些區(qū)域用戶(hù)能夠?yàn)g覽媒體內(nèi)容并修改正生成的媒體表示。本發(fā)明的方法包括與用戶(hù)界面交互操作以控制媒體內(nèi)容分析和媒體表示生成;分析媒體內(nèi)容的特征;驅(qū)動(dòng)媒體數(shù)據(jù)分析;以及通過(guò)發(fā)送與媒體表示參數(shù)有關(guān)的指令和接收指令驅(qū)動(dòng)媒體表示生成。該方法還包括生成媒體表示。文檔編號(hào)H04N7/16GK1648844SQ20041001190公開(kāi)日2005年8月3日申請(qǐng)日期2004年9月24日優(yōu)先權(quán)日2003年9月25日發(fā)明者喬納森·J·赫爾,杰米·格雷厄姆,彼得·E·哈特,庫(kù)爾特·W·皮索爾申請(qǐng)人:株式會(huì)社理光