亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

為移動通信裝置的文檔內容做摘要的方法和裝置的制作方法

文檔序號:6376184閱讀:124來源:國知局
專利名稱:為移動通信裝置的文檔內容做摘要的方法和裝置的制作方法
技術領域
本發(fā)明涉及用于由移動通信裝置接收和處理的電子文檔的摘要信息的產生。
相關技術的描述背景技術使用各種計算機程序,例如文字處理軟件、空白表格程序、財務軟件以及顯示軟件來產生電子文檔。除了文本之外,文檔可以包括″豐富″的內容,例如字體信息、嵌入的圖像、說明、標記和超級鏈接。這些電子文檔可被組織成結構組,例如頁、工作表或幻燈片。當移動通信裝置的用戶希望訪問駐留在遠程計算機上的電子文檔并且在該移動通信裝置上瀏覽該文檔時,一般是經過一個可能帶寬受限的無線網絡把整個電子文檔發(fā)送到該移動通信裝置。例如,如果用戶希望僅瀏覽在一個400頁文檔的開頭位置的一頁條款和條件部分,則通常是把整個文檔發(fā)送到該移動通信裝置,其使用者在該移動通信裝置上僅瀏覽這一頁。
該電子文檔的瀏覽使用的是該移動通信裝置的用戶接口,該用戶接口一般不同于在PC上用于建立和瀏覽文檔的用戶接口。雖然在PC上用于創(chuàng)建一個電子文檔的用戶接口可以包括一個大的彩色顯示和例如鼠標的一個定點裝置,但該移動裝置可能有的是一個小的無彩色的屏面、并且可能沒有鼠標。另外,與用于瀏覽電子文件的可以是很大規(guī)模的PC相比,該移動裝置在處理和存儲能力上則一般有較大的局限性。

發(fā)明內容
針對一個電子文檔產生一文檔摘要(summary),該摘要包括多個摘要條目的一個集合。在該文檔摘要的產生中,分析在該電子文檔中的內容結構或特性。根據(jù)該內容結構或特性的分析,從該電子文檔的內容中選擇多個摘要條目。該電子文檔中的內容結構可以包括一個目錄、多個電子表格工作表、多個文檔頁等。在該電子文檔中的內容特性可以包括文字格式、段落格式編排、段落大小等。優(yōu)選地,在該電子文檔中的最佳可用的內容結構或特性最好在該多個摘要條目的選擇中被識別和利用。響應對于電子文檔的請求,把該文檔摘要提供到一個移動通信裝置。


現(xiàn)將參考附圖通過示例描述本發(fā)明的實施例,其中圖1是其中可以實現(xiàn)對文檔內容進行摘要的一個系統(tǒng)的數(shù)據(jù)處理系統(tǒng)的框圖;圖2是一個文檔服務器的框圖;圖3是摘要文檔內容的一個系統(tǒng)的框圖;圖4是摘要文檔內容的一個方法的流程圖;圖5是摘要一個非結構的電子文檔的一個方法的流程圖;以及圖6是說明摘要一個未格式編排的電子文檔的一個方法的流程圖。
具體的實施方式針對一個電子文檔產生一文檔摘要,該摘要包括有多個摘要條目的一個集合。在該文檔摘要的產生中,分析在該電子文檔中的內容結構或特性。根據(jù)該內容結構或特性的分析,從該電子文檔的內容中選擇多個摘要條目。在該電子文檔中的內容結構可以包括一個目錄、多個電子表格工作表、多個文檔頁等。在該電子文檔中的內容特性可以包括文字格式、段落格式編排、段落大小等。優(yōu)選地,在該電子文檔中的最佳可用的內容結構或特性最好在該多個摘要條目的選擇中被識別和利用。響應對于電子文檔的請求,把該文檔摘要提供到一個移動通信裝置。
圖1是其中可以實現(xiàn)對文檔內容進行摘要的一個系統(tǒng)的數(shù)據(jù)處理系統(tǒng)的框圖。該系統(tǒng)包括一個文檔服務器100,通過互聯(lián)網絡102和無線網絡104與一個移動通信裝置106通信。
將在圖2中進一步描述的文檔服務器100處理和組織來自電子文檔的內容,以便能夠將該內容發(fā)送到請求該內容的一個客戶。該電子文檔可被置于該文檔服務器中,或可以從遠程計算機或服務(未示出)檢取該電子文檔。文檔服務器100處理各種不同格式的電子文檔。例如,一個文檔可以使用由專用文字處理計算機程序識別的一個格式,可以使用對于文本和圖像進行圖形存儲的一個標準格式或可以是僅包括無格式文本的一個文檔。由該文檔服務器100執(zhí)行的這種組織實現(xiàn)了在一個客戶請求該內容時從該文檔高效地傳送該內容。
該移動通信裝置106是從該文檔服務器100請求內容的一個客戶。該移動通信裝置106包括一個用戶接口(未示出)。用戶接口包括例如鍵盤和軌跡輪的一個或者多個輸入設備,以及例如計算機屏幕的一個輸出裝置。用戶使用移動通信裝置106的輸入裝置來啟動從該文檔服務器100針對文檔內容的請求。一旦已經通過互聯(lián)網絡102和無線網絡104把文檔內容從該文檔服務器100發(fā)送到該移動通信裝置106,則在移動通信裝置106的輸出裝置上顯示該內容。
圖2是一個文檔服務器的框圖。文檔服務器包括一個分析模塊200和一個摘要模塊202。該分析模塊200處理電子文檔,并且創(chuàng)建一個通用文檔內容數(shù)據(jù)模式,稱之為文檔目標模塊(DOM)。DOM是一個電子文檔內容的一種統(tǒng)一表示,DOM與文檔的原始格式無關。來自一個電子文檔的內容被分層地組織成一個DOM,這將實現(xiàn)針對一個文檔的具體章節(jié)的提取。一個DOM存儲了例如來自一個電子文檔的文本、格式信息、圖像和嵌入對象,以及組織的輔助工具,例如目錄、超級鏈接、標記、標題、腳注、以及頁編號。該摘要模塊202摘要一個電子文檔的內容,并且產生一個摘要的結果。通過迭代貫穿存儲在DOM中的文檔的分層結構而產生該摘要。該摘要把一個電子文檔的內容組織成對應于該電子文檔的各章節(jié)的命名條目。該入口標號能隨即被用于檢取內容從該對應的章節(jié)的該電子文檔。圖3中示出一個對文檔內容進行摘要的系統(tǒng)。
參考圖1和圖2,當文檔服務器100從例如移動通信裝置106的一個客戶接收一個請求時,該分析模塊200針對來自電子文檔的內容而處理該電子文檔,并且建立與該電子文檔相關的DOM。該摘要模塊202隨后根據(jù)與該電子文檔相關的DOM建立一個摘要。該摘要被隨即發(fā)送到該移動通信裝置106。該摘要條目被展示給移動通信裝置106的用戶,用戶可以隨即挑選條目之一,從而從該文檔服務器100請求對應于該條目的內容。作為響應,文檔服務器100把對應于該條目名稱的內容發(fā)送到該移動通信裝置106。
使用由摘要模塊202產生該摘要,從而使得客戶請求一個電子文檔的一些章節(jié),排除了把整個電子文檔發(fā)送到移動通信裝置106的需要。這將最小化網絡帶寬的消耗量,同時還最小化發(fā)送該電子文檔內容所需要的時間。同樣,用于在移動通信裝置106上顯示內容所需要的存儲量以及處機時間也被最小化。在該移動通信裝置106上該摘要的使用將有助于在一個電子文檔中的定位。在一個具體章節(jié)的搜索中不是遍歷該可能龐大的電子文檔,而是僅從該摘要中選擇該具體章節(jié)。這對于在一個移動通信裝置106上瀏覽電子文檔將特別有用,因為一個移動通信裝置106通常具有受限的輸入裝置,例如一個軌跡輪,這將使得經由大文檔的定位很耗時。
圖3是對文檔內容進行摘要的一個系統(tǒng)的框圖。該系統(tǒng)包括一個結構文檔摘要級300、一個非結構文檔摘要級302、以及一個未格式編排的文檔摘要級304。提供一個根據(jù)電子文檔的DOM作為對于該系統(tǒng)的輸入。該系統(tǒng)的輸出是對于該電子文檔的一個摘要。
結構文檔摘要級300確定該輸入的電子文檔是否具有能被用作一個摘要的結構。詳查(traverse)該DOM來確定該文檔是否具有一個分頁、幻燈片、工作表或其它結構。該級還確定是否有與例如頁面名稱、幻燈片標題或工作表名稱的結構成分相關的描述名稱。
結構的文檔摘要級300還確定該電子文檔是否包括一個目錄。目錄可能已經由被用于產生該電子文檔的計算機軟件產生。該結構文檔摘要級300使用一個目錄來產生該輸出的摘要。該結構文檔摘要級300使用在該目錄中的條目,從一個目錄產生一個摘要。每一個目錄條目都包括名稱、以及在該電子文檔中鏈接到的一個位置。該連接具有一個對應書簽,該對應書簽指定了由在該目錄條目中的連接涉及的段落。從條目名稱目錄復制該摘要條目名稱,而對應于該摘要條目的該電子文檔的章節(jié)就是與該條目目錄相關的該書簽涉及的段落。
在電子文檔中的目錄是分級的,并且可以包括不同的條目等級。在一個目錄的最高級中的條目對應于該文檔的最概括的章節(jié),而在較低級的條目則對應于在較高級別的條目的從屬章節(jié)。該結構文檔摘要級300通過檢查由該條目涉及到的段落的標記的等級來確定一個目錄條目的等級。其對應段落被平等縮排的那些條目是在目錄中的相同的等級。無縮排則表明一個最高等級的條目,而縮排越大則表示等級越低。當客戶首先從包括一個目錄的電子文檔中請求信息內容時,對文檔內容進行匯總的該系統(tǒng)則根據(jù)該目錄的最高等級的條目來返回摘要條目。
針對結構的但沒有目錄的電子文檔,結構文檔摘要級300根據(jù)一個可選結構產生一個摘要。針對其中該結構單元是工作表的電子表格文檔,該摘要包括針對該電子表格文檔中的每一個工作表一個條目。如果在該文檔中有與該工作表相關的描述名稱,則該描述名稱被用作該摘要條目名稱。如果沒有描述名稱,則根據(jù)該文檔中的工作表的位置產生針對該摘要條目的名稱。例如,該產生的條目名稱可能是″表1″、″表2″、″表3″等。
針對其中結構單元是頁的電子文檔,例如某些文字處理和便攜文檔格式(PDF)文檔,該摘要包含對應于以第一頁開始的該電子文檔中的連續(xù)頁數(shù)范圍條目。使用規(guī)定在該摘要中的最大條目的數(shù)目的一個可配置的值以及表示在該電子文檔中的總頁數(shù)的值計算該范圍。除了最后的摘要條目之外,對應于等于全部頁數(shù)的頁數(shù)范圍,每個摘要條目被最大輸入項數(shù)目除,然后上舍入(rounded up)。該最后條目對應于頁數(shù)范圍,但該頁數(shù)范圍還不對應一個摘要條目,并且可能包括比對應于先前摘要條目的范圍少幾頁。該摘要條目的名稱描述的是該摘要條目對應的頁范圍。例如,如果一個電子文檔有十頁,并且在該摘要中該可配置的最大條目數(shù)目是三,則該摘要條目可以是″頁1至頁4″、″頁5至頁8″和″頁9至頁10″。
對于文檔內容進行摘要的系統(tǒng)還包括非結構文檔摘要級302,摘要未被該結構文檔摘要級300確定結構的電子文檔。該非結構的文檔摘要級302在這樣的一個假設條件下操作,即假設一個電子文檔中的大多數(shù)文本被以同樣方式格式編排,而題目和標題則被以不同于在該電子文檔中的大多數(shù)文本的格式方式編排。例如,標題可能是粗體并且具有比在電子文檔中的文本的其余章節(jié)更大的字體。分析對該電子文檔進行的格式編排,以便確定在該電子文檔中是例如標題和題目的章節(jié)標識符的文本單元。隨后使用章節(jié)標識符作為條目名稱來生成一個摘要。對應于使用一個章節(jié)標識符作為其名稱的一個摘要條目的該文檔章節(jié)是包括該章節(jié)標識符的該電子文檔的章節(jié)。
該非結構文檔摘要級302檢查在該電子文檔中的文本格式編排的改變。被檢查的格式編排包括字體特性,這些特性包括字體名稱、大小、磅值和類型,例如斜體和下劃線字體。被檢查的格式編排還包括段落樣式、諸如左或右對齊、以及縮進。在這些格式編排特性中的改變指示在該電子文檔中的可能的章節(jié)標識符。例如,如果一個文檔包含具有字體大小為12的文本,則除了具有字體大小為14并且是粗體的段落之外,則具有更大字體的段落是可能的章節(jié)標識符。
為了確定在一個電子文檔中的哪一段落是將被包括在該摘要中的章節(jié)標識符,該非結構文檔摘要級302將詳查與該電子文檔相關的DOM,以便從該電子文檔收集字體和段落特性以及文本。隨后分析收集的信息,以便產生對于該電子文檔的一個摘要。
該非結構文檔摘要級302詳查在該DOM,檢查在該電子文檔中的段落。收集針對每一個段落的段落信息。針對每一個段落收集的信息包括在該段落中的字符的數(shù)量,使用在該段落中的第一字體的字體特性,使用該段落中的第一字體做格式編排的文本字段,指示該段落中的全部文本是否具有相同字體的格式編排的一個標志,左、中右或兩端對齊的段落對齊方式,以及該段落中文本第一行的縮進等級。
該非結構的文檔摘要級302還詳查該DOM,以便檢查該電子文檔中的每個字符,以及與每一個字符相關的字體特性。收集每一個字體以及在以該字體格式編排的電子文檔中的字符數(shù)目。該收集的字體信息被用于確定哪一個字體是有效的章節(jié)標識符字體。使用該假設,即在一個電子文檔中的大多數(shù)段落是以同樣的方式格式編排并且不是章節(jié)標識符,貫穿電子文檔廣泛使用的字體不是有效的章節(jié)標識符字體并且是放棄。一個無效的章節(jié)標識符字體具有以該字體格式編排的字符數(shù)對于在該電子文檔中的字符總數(shù)的一個比例,該比例高于一個可配置的門限。不是以一個有效章節(jié)標識符字體格式編排的段落不被考慮為章節(jié)標識符,并且放棄該收集的對應于該段落的信息。
該段落信息被進一步篩選,以便放棄不是將被使用作為摘要條目的一個適當規(guī)模的段落。用于不包含不是空格的字符的段落的段落信息被放棄。該段落信息被進一步篩選以便放棄文檔標題段落。文檔標題段落出現(xiàn)在一個電子文檔的開始,并且利用在這電子文檔中唯一的字體和段落特性的一個組合格式編排。
非結構文檔摘要級302把段落信息組織成針對段落的信息組,這些段落以格式編排的文本開始,具有相同的字體和段落特性。每一個段落信息組都由包括字體和段落特性的格式編排信息以及來自被以字體和段落特性格式編排的段落的文本組成。根據(jù)在該組中的格式編排特性排序該段落信息組。被考慮的格式編排特性是這樣的特性,即利用那些特性最可能來格式編排章節(jié)標識符。首先根據(jù)段落的字體大小排序這些組。其字體大小特性指定的字體大小越大,該段落信息組具有的排序越高。根據(jù)在先的判據(jù)屬于是等同的那些組被進一步根據(jù)段落對齊方式排序。其段落對齊方式特性指定中心文本的段落信息組具有較高的排序。同等的組則被根據(jù)在該段中的全部特征是否以一個完全相同的字體格式編排來進一步排序。規(guī)定在該段落中的全部字符被以一個完全相同的字體格式編排的段落信息組具有較高的排序。同等組被進一步根據(jù)縮進的等級排序。其段落縮進特性指定的段落縮進越大,該段落信息組具有的排序越高。同等組被進一步根據(jù)字體磅值排序。其字體磅值特性指定粗體文本的段落信息組具有較高的排序。同等組被進一步根據(jù)字體排序,該字體包括斜體和下劃線文本。其字體特性規(guī)定斜體和下劃線文本的段落信息組具有較高的排序。最后,根據(jù)在先的判據(jù)屬于是等同的那些組被進一步根據(jù)字體名稱排序。其字體名稱特性指定用于格式編排在該電子文檔中的字符越少的字體的段落信息組具有的排序越高。
因此,該段落信息組被排序,使得來自最可能是章節(jié)標識符的段落的文本被包括在該最高排序的組中,而使得來自最不可能是章節(jié)標識符的段落的文本被包括在該最低排序的組中。除非已經收集了僅針對一個段落的信息,僅包括來自一個段落的文本的段落信息組被放棄。
使用具有最高排序的段落信息組生成對于該電子文檔的摘要。根據(jù)在該段落信息組中的段落信息的排序,把用于段落的條目加到該摘要。對于段落信息被包括在該組中的每一個段落來說,以在段落中的該第一字體格式編排的文本字段被認為是一個章節(jié)標識符,并且被包括作為在該摘要中的一個條目名稱。對應于該摘要條目的該電子文檔的章節(jié)是包含該章節(jié)標識符的文檔的章節(jié)。另外,可以使用來自多個段落信息組的段落信息生成該摘要。
對文檔內容進行摘要的系統(tǒng)還包括一個未格式編排文檔摘要級304,其產生針對作為由該非結構文檔摘要級302確定的不包含文本格式編排信息、或其中全部文本被完全相同地格式編排的電子文檔的摘要。該未格式編排的文檔摘要級304檢查段落規(guī)模和段落文本模式,以便確定哪一段落最可能是章節(jié)標識符。例如,較短的段落比較長的段落更可能是章節(jié)標識符。為了確定在一個未格式編排的電子文檔中的哪一段落是將被包括在該摘要中的章節(jié)標識符,該未格式編排的文檔摘要級304將詳查與該電子文檔相關的DOM,以便從該電子文檔收集段落信息以及文本。隨后分析收集的信息,以便產生對于該電子文檔的一個摘要。
該未格式編排的文檔摘要級304詳查在該DOM,檢查在該電子文檔中的段落。收集針對每一個段落的段落信息。針對每一個段落收集的信息包括在該段落中包括的字符數(shù)量以及包含在該段落中的文本。該段落信息被進一步篩選,以便放棄不是將被使用作為摘要條目的一個適當規(guī)模的那些段落。用于不包含不是空格的字符的段落的段落信息被放棄。該未格式編排的文檔摘要級304把物段落信息組織成用于具有相同的字符數(shù)的段落的信息組。每一個段落信息組都包括一個段落規(guī)模以及來自在包含等于該段落規(guī)模的一個字符數(shù)的電子文檔中的段落的文本。根據(jù)該段落規(guī)模把該段落信息組以升序排序,其中規(guī)定越小的段落規(guī)模的段落信息組具有越高的排序。該段落信息組被如此排序,使得來自最可能是章節(jié)標識符的段落的文本被包括在該最高排序的組中,而使得來自最不可能是章節(jié)標識符的段落的文本被包括在該最低排序的組中。
由于段落規(guī)模是確定在一個未格式編排的電子文檔中的哪一段落最可能是章節(jié)標識符的關鍵判據(jù),所以如果在該文檔中的段落規(guī)模中沒有足夠的變化,則該未格式編排的文檔摘要級304把該文檔確定為是不可摘要的。不可摘要的文檔是那些其最大段落的規(guī)模與最小段落的規(guī)模之比不大于一個構成的最小閾值的那些文檔。例如,該閾值可以是2∶1,使得一個未摘要((unsummarizing)的電子文檔是一個其最大段落不大于最小段落的兩倍的一個電子文檔。例如不可摘要的文檔可以是電影副本或未加工的試驗數(shù)據(jù)。
針對被確定為是可摘要的的一個未格式編排的電子文檔,則從段落信息被收集的段落中產生該摘要。檢查該段落信息以便確定該未格式編排的電子文檔是否包括一個列表。如果該段落的文本內容的多數(shù)是以指示一個列表單元的文本模式開始,則該文檔內容被確定為是一個列表。例如,該文本模式可以是升序號碼,使得一個段落以一個″1″開始、一個隨后段落以一個″2″開始、一個隨后段落以一個″3″開始等等。列表元還可能以字母或羅馬數(shù)字開始。
針對被確定為是一個列表的一個未格式編排的電子文檔,屬于是列表元的段落文本內容被認為是章節(jié)標識符,并且被包括作為在該摘要中的條目名稱。針對被確定為不是一個列表的一個未格式編排的電子文檔,不以文本模式開始的段落文本內容被認為是章節(jié)標識符,并且被包括作為在該摘要中的條目名稱。根據(jù)在該段落信息組中的段落信息的排序,把用于段落的條目加到該摘要。對應于每一個摘要條目的該電子文檔的章節(jié)是包含該摘要條目名稱的文檔的章節(jié)。對文檔內容進行摘要的該系統(tǒng)可以把在一個電子文檔中的其它信息標識作為可能的章節(jié)標識符。這種信息包括書簽、元標簽、在一個電子表格文檔中接近一個公式的格式編排的文本、曲線標記和圖例。除了章節(jié)標識符之外,由對文檔內容進行摘要的系統(tǒng)輸出的摘要可以包括導向意義的其它單元的條目,比如圖像和嵌入對象。一個嵌入對象的示例是在單詞處理文檔中嵌入的一個電子表格。
對文檔內容進行摘要的系統(tǒng)還可以包括一個摘要數(shù)據(jù)庫(未示出),該摘要數(shù)據(jù)庫可用于提高該非結構文檔摘要級302以及該未格式編排的文檔摘要級304的精確度。當一個非結構的電子文檔被提供到該對文檔內容進行摘要的系統(tǒng)時,產生一個摘要,或如上所述地把該文檔確定為是不可摘要的文檔。該摘要數(shù)據(jù)庫隨后記錄該摘要的結果,并且記錄該格式編排的特性,該格式編排特性包括字體和段落特性,被用于章節(jié)標識符和在該未格式編排的電子文檔中的其它段落。格式編排信息對于包括在該摘要數(shù)據(jù)庫中的章節(jié)標識符的關系能被一個啟發(fā)性學習過程使用,用于摘要改善屬于是被匯總的每一個附加電子文檔的文檔。
圖4是摘要文檔內容的一個方法的流程圖。該方法產生由一個文檔目標模塊(DOM)表示的一個電子文檔400的摘要。該方法以步驟402開始,確定電子文檔400是否為一個電子表格。電子表格包括以行和列存在的數(shù)據(jù),并且由一個或者多個工作表組成。如果在步驟402確定該電子文檔400是一個電子表格,則該方法以步驟404繼續(xù)。否則,該方法以步驟410繼續(xù)。一個電子表格可能還包括與在該電子表格中的工作表相關的描述名稱。如果在步驟404確定該電子表格包括與該工作表相關的描述名稱,該方法以步驟406繼續(xù)。否則,該方法以步驟408繼續(xù)。在步驟406,根據(jù)該描述工作表名稱產生該電子文檔400的一個摘要。從該工作表描述名稱復制該摘要的條目名稱,并且對應于該摘要條目的文檔章節(jié)是該工作表。在步驟408,根據(jù)針對該工作表產生的名稱產生該電子文檔400的一個摘要。根據(jù)在該電子文檔400中的該工作表的位置產生工作表名稱。例如,如果有三種工作表,則該工作表的名稱可以是″表1″、″表2″和″表3″。對應于該摘要條目的該文檔的章節(jié)是該工作表。
步驟410確定是否DOM以及電子文檔400包括一個目錄表。如果確定該電子文檔400確實包括一個目錄,則在步驟412產生根據(jù)該目錄的摘要。從具有對應于該目錄中的條目中定義的連接的書簽的段落內容復制在該摘要中的條目的名稱。對應于該摘要條目的該文檔章節(jié)是該目錄中的條目涉及的段落。如果在步驟410確定該電子文檔不包括一個目錄,則該方法以步驟414繼續(xù)。
步驟414確定該電子文檔400是否具有一個分頁結構。如果這電子文檔400具有一個分頁結構,則該方法以步驟416繼續(xù)。根據(jù)以第一頁開始的電子文件400中的連續(xù)的頁數(shù)范圍,以步驟416產生一個摘要。在該摘要中的每一個條目都對應于該文檔中的頁數(shù)范圍,并且具有描述該頁數(shù)范圍的一個名稱。根據(jù)該摘要中的一個可配置最大條目數(shù)目、并且根據(jù)該電子文檔400中的頁的數(shù)量來計算該頁數(shù)范圍。除了對應于該最后摘要條目的范圍之外,在每一范圍中的頁的數(shù)量是由該摘要中的最大條目數(shù)目除該文檔中的頁數(shù)而只入不舍的頁數(shù)。在對應于該最后摘要條目的范圍中的條目的數(shù)量是該文檔中的總數(shù),小于在其它范圍中的頁數(shù)的總數(shù)。如果在步驟414確定該電子文檔400不具有一個分頁結構,則該方法以步驟418繼續(xù)。
步驟418確定該電子文檔400是否包含文本格式編排信息。文本格式編排信息包括字型、字體以及字體大小。如果該電子文檔不包括文本格式編排信息,或如果在該電子文檔400中的全部文本都被完全相同地格式編排,則該文檔被確定為是未格式編排的,并且該方法以步驟422繼續(xù)。否則,該方法以步驟420繼續(xù)。在步驟420,根據(jù)該文本格式編排信息產生針對該電子文檔400的一個摘要。通過檢查在該文本格式編排信息中的改變來確定該摘要條目。圖5中示出使用文本格式編排信息來摘要一個非結構電子文檔的方法。在步驟422,根據(jù)該段落文本模式產生針對該電子文檔400的一個摘要。通過檢查段落規(guī)模和段落文本模式來確定該摘要條目。圖6中示出使用段落文本模式來摘要一個未格式編排的電子文檔的方法。
圖5是說明使用文本格式編排信息摘要一個非結構的電子文檔的一個方法的流程圖。該方法產生由一個DOM表示的一個非結構的電子文檔500的一個摘要。該方法以步驟502開始,詳查DOM以便收集字體、段落格式編排和文本信息。針對該非結構電子文檔500中的每一個段落,該收集的信息包括段落對齊方式、段落縮進、段落中的字符的總數(shù)、用于格式編排該段落中的文本的第一字體的字體特性、以及以該第一字體格式編排的文本字段。該字體特性包括字體名稱、字體大小、字體磅值、以及例如斜體字或下劃線文字的字體。
該方法以步驟504繼續(xù),產生對于字符計數(shù)的字體特性的一映射(map)。對于在步驟502收集的不同字體特性的組合,該字體特性到字符計數(shù)的映射包括一個條目,該條目把字體特性的組合映射為等于在以該特性格式編排的非結構電子文檔500中的字符數(shù)量的一個計數(shù)。該方法以步驟506繼續(xù),產生段落信息的一個列表。針對該非結構電子文檔500中的每一個段落,段落信息列表包含一個條目和一個標志,該條目包括字體、段落格式編排以及用于步驟502收集的段落的文本信息,該標志指示以該第一字體格式編排的文本字段的大小是否等于該段落的大小,因此指示在該段落中的全部字符是以相同的字體格式編排的。本方法以步驟508繼續(xù),從該段落信息列表中去除用于空段落的信息??盏亩温洳话瑹o間隔字符。該方法以步驟512繼續(xù),產生對于字體的字符計數(shù)的一個映射。該映射記錄了字符的數(shù)量,這些字符是以使用在該非結構電子文檔500中的每一個字體格式編排,并且根據(jù)在步驟504中產生的字體特性到字符計數(shù)的映射產生。在步驟514,廣泛使用在該非結構電子文檔500中、并且因此被認為是不屬有效摘要條目的格式編排文本的常規(guī)字體被從字符計數(shù)到字體的映射中消除。如果以該字體格式編排的字符對該文檔中的字符數(shù)的比例高于一個可配置的閾值,則該字體被確定為是一常規(guī)字體。
該方法以步驟516繼續(xù),產生有效字體的一個列表。用于每一個有效字體來說,由于以該有效字體格式編排的字符對該文檔中的字符數(shù)的比例低于可配置閾值,所以有效字體是在步驟514之后保持在字符計數(shù)到字體的映射中的那些有效字體。未被以有效字體格式編排段落不包括在該產生的摘要中。該方法以步驟518繼續(xù),產生格式編排特性到段落信息的一映射。該映射是利用字符計數(shù)到步驟512產生的字體、步驟516產生的有效字體列表、以及步驟506產生的段落信息列表的映射。格式編排特性的映射到段落信息映射中的幾個關鍵字包括對特性進行格式編排,該特性被用于確定該段落被包括在該產生的摘要中的可能性的情況。對特性進行格式編排包括在一個段落中的字符是否全部以相同的字體、段落對齊方式、段落縮進、字體名稱、字體大小、表示文本是否為粗體的字體磅值、表示文本是否斜體或下劃線的字形來格式編排。對于每個關鍵字來說,映射到該關鍵字的值是來自對應于在該未格式編排的電子文檔500中的段落的段落信息列表的條目,以包括在該關鍵字中的格式編排特性格式編排該未格式編排的電子文檔500。
通過貫穿該段落信息列表中的條目的迭代來產生格式編排特性到段落信息的映射。對于在該列表中的每個段落信息條目來說,如果該規(guī)定的第一文本字體不在有效字體的列表中,則從該列表中刪除該段落信息條目。如果該規(guī)定的第一文本字體是在有效字體的列表中,則從該段落信息構成一個關鍵字。如果該關鍵字還不在格式編排特性到段落信息的該映射中,則添加該關鍵字。該段落信息被隨即加到在映射中被映射到該關鍵字的值。格式編排特性到段落信息的映射被排序,使得用于屬于最可能被包括在產生的摘要中的段落的段落信息被首先放置在該映射中,而用于屬于最不可能被包括在產生的摘要中的段落的段落信息被最后放置在該映射中。關鍵字被添加到該映射,以便保持該排序。
給定在格式編排特性到段落信息的映射中的兩個關鍵字,則通過比較包括在該關鍵字中的格式編排信息確定相對于這第二關鍵字的排序的該第一關鍵字的排序。如果該第一關鍵字的字體大小特性指定了比該第二關鍵字的字體大小特性更大的規(guī)模,則該第一關鍵字被排序在第二關鍵字之前。如果該第二關鍵字的字體大小特性指定了比該第一關鍵字的字體大小特性更大的規(guī)模,則該第二關鍵字被排序在第一關鍵字之前。另外,如果該第一關鍵字的段落對齊方式特性指定中間對齊文本,并且該第二關鍵字的段落對齊方式沒有指定中間對齊文本,則該第一關鍵字被排序在該第二關鍵字之前。另外,如果該第二關鍵字的段落對齊方式特性指定中間對齊文本,并且該第一關鍵字的段落對齊方式沒有指定中間對齊文本,則該第二關鍵字被排序在該第一關鍵字之前。另外,如果該第一關鍵字指定在一個段落中的全部字符都以完全相同的字體格式編排,而該第二關鍵字不是指定在一個段落中的全部字符都以完全相同的字體格式編排,則該第一關鍵字被排序在該第二關鍵字之前。如果該第二關鍵字指定在一個段落中的全部字符都以完全相同的字體格式編排,而該第一關鍵字不是指定在一個段落中的全部字符都以完全相同的字體格式編排,則該第二關鍵字被排序在該第一關鍵字之前。另外,如果該第一關鍵字的段落縮進特性指定了比該第二關鍵字的縮進特性更大的縮進,則該第一關鍵字被排序在該第二關鍵字之前。如果該第二關鍵字的段落縮進特性指定了比該第一關鍵字的縮進特性更大的縮進,則該第二關鍵字被排序在該第一關鍵字之前。另外,如果該第一關鍵字的字體磅值特性指定了粗體文本,而該第二關鍵字的字體磅值特性沒有指定粗體文本,則該第一關鍵字被排序在該第二關鍵字之前。如果該第二關鍵字的字體磅值特性指定了粗體文本,而該第一關鍵字的字體磅值特性沒有指定粗體文本,則該第二關鍵字被排序在該第一關鍵字之前。另外,如果該第一關鍵字規(guī)定了斜體字型形式,而該第二關鍵字沒有規(guī)定斜體字型形式,則該第一關鍵字被排序在該第二關鍵字之前。如果該第二關鍵字規(guī)定了斜體字型形式,而該第一關鍵字沒有規(guī)定斜體字型形式,則該第二關鍵字被排序在該第一關鍵字之前另外,如果該第一關鍵字規(guī)定了下劃線形式,而該第二關鍵字沒有規(guī)定下劃線字形,則該第一關鍵字被排序在該第二關鍵字之前。如果該第二關鍵字規(guī)定了下劃線型形式,而該第一關鍵字沒有規(guī)定下劃線型形式,則該第二關鍵字被排序在該第一關鍵字之前另外,如果在以第一關鍵字中的字體名稱規(guī)定的字體格式編排的非結構電子文檔中的字符少于以該第二關鍵字中的字體名稱規(guī)定的字體格式編排的字符,則該第一關鍵字被排序在該第二關鍵字之前。如果在以第二關鍵字中的字體名稱規(guī)定的字體格式編排的非結構電子文檔中的字符少于以該第一關鍵字中的字體名稱規(guī)定的字體格式編排的字符,則該第二關鍵字被排序在該第一關鍵字之前否則,該第一和第二關鍵字被認為是相等,并且由該關鍵字映射了對應信息的段落被同樣可能地包括中產生的摘要中。
方法以步驟520繼續(xù),刪除出現(xiàn)在電子文檔的開始的文檔標題段落,并且該文檔標題段落是以在該電子文檔中屬于是唯一的該字體和段落特性的一個組合而格式編排的。如上所述,針對該段落信息列表的第一單元,產生由格式編排信息組成的一個關鍵字,該關鍵字對應于在該非結構的電子文檔500中的第一段落。如果在格式編排屬性到段落信息的映射中存在該關鍵字,則從格式編排特性到段落信息的映射中刪除對應于以包括在該關鍵字中的特性格式編排的非結構電子文檔500中的第一段落開始的連續(xù)地段落。
該方法以步驟522繼續(xù),生成該摘要。通過貫穿在格式編排屬性到段落信息的映射中的關鍵字的迭代來產生該摘要,直到發(fā)現(xiàn)有一個以上條目被映射的一個關鍵字為止。針對其信息由該關鍵字映射的每一段落產生摘要條目。針對這種段落的每一個,該摘要條目名稱是以在該段落中的第一字體格式編排的文本字段。對應于每一個摘要條目的該電子文檔的章節(jié)是包含該摘要條目名稱的文檔的章節(jié)。如果沒有關鍵字被映射到用于多個段落的段落信息,則從由該第一關鍵字映射的段落信息中產生該摘要。另外,可以使用在格式編排特性到段落信息的映射中由多個關鍵字映射的段落信息構造該摘要。
圖6是說明摘要一個未格式編排的電子文檔的一個方法的流程圖。該方法產生由一個DOM表示的一個未格式編排的電子文檔600的一個摘要。該方法以步驟602開始,詳查DOM以便收集段落和文本數(shù)據(jù)。對于在該未格式編排的電子文檔600中的每個段落,收集的信息包含該段落中的字符的總數(shù),以及該段落的文本內容。該方法以步驟604繼續(xù),產生段落信息的一個列表。對于在未格式編排的電子文檔600中的每個段落來說,該段落信息列表包含一個條目,該條目包括在步驟602收集的信息。本方法以步驟605繼續(xù),從該段落信息列表中去除不包含無間隔字符的信息。該方法以步驟607繼續(xù),產生對于段落大小到段落信息的一個映射。通過貫穿該段落信息列表的迭代、并且把用于每一個段落的信息映射到在對應于該段落中的字符的數(shù)量的映射中的一個關鍵字而產生段落大小到段落信息的映射。該映射被排序,使得針對較短段落的信息在該映射中首先出現(xiàn),而針對較長段落的信息在該映射中最后出現(xiàn)。在步驟608,確定該未格式編排的電子文檔600是否為可摘要的電子文檔。如果該最大段落對最小段落的大小比例大于一個可配置的閾值,例如2∶1,則該文檔是可摘要的,并且該方法以步驟612繼續(xù)。否則,該方法終止于步驟610。
在步驟612,確定該未格式編排的電子文檔600是否包括一個列表。通過貫穿該段落信息列表迭代、以及檢查在這段落文本內容的開始的文本來進行這一確定。如果文本內容的多數(shù)以指示一個列表的模式開始,例如升序號碼或字母,則那方法以步驟616繼續(xù)。否則,該方法以步驟614繼續(xù)。在步驟614,如上所述,從來自不以一個列表模式開始的段落信息列表的段落文本內容中產生該摘要。針對不以一個列表模式開始的每一個段落,產生一個摘要條目,該摘要條目的名稱是從段落文本內容復制的。對應于該摘要條目的該未格式編排電子文檔600的章節(jié)是包括該摘要條目名稱的章節(jié)。根據(jù)在段落大小到段落信息的映射中的該段落信息的排序,把用于段落的條目加到該摘要。在步驟616,如上所述,從來自不以一個列表模式開始的段落信息列表的段落文本內容產生該摘要。針對以一個列表模式開始的每一個段落,產生一個摘要條目,該摘要條目的名稱是從該段落文本內容復制的。對應于該摘要條目的該未格式編排電子文檔600的章節(jié)是包括該摘要條目名稱的章節(jié)。根據(jù)在段落大小到段落信息的映射中的該段落信息的排序,把用于段落的條目加到該摘要。摘要文檔內容的方法可能包括比示出圖4-6示出更少、附加、或不同的排序步驟。
在此描述的方法可以通過網絡中的一個或多個服務器執(zhí)行。提供應用程序的計算機程序產品可以包括存儲在一個計算機存儲介質(移動裝置的存儲器或網絡的一個或多個服務器,軟盤或CD-ROM)上的計算機指令,該計算機指令是根據(jù)描述的邏輯寫成的。
最后的評論。已經描述了用于摘要移動通信裝置的文檔內容的方法和裝置。一示例性的方法包括步驟分析在一個電子文檔中的內容結構或特性;根據(jù)該內容結構或特性的分析,產生包括從該電子文檔內容中選擇的多個摘要條目的一個集合的文檔摘要信息;并且提供用于一個移動通信裝置的該文檔摘要信息。在該電子文檔中的內容結構可以包括一個目錄、多個電子表格工作表、多個文檔頁等。在該電子文檔中的內容特性可以包括文字格式、段落格式編排、段落大小等。在該電子文檔中的最佳可用的內容結構或特性最好在該多個摘要條目的選擇中被識別和利用。在該最佳實施例中,如果內容結構是可利用的,則根據(jù)內容結構選擇該摘要條目,如果文本/段落格式編排是可利用的,則在內容結構后面跟隨在文本/段落格式編排中的差異,并且隨后跟隨在段落大小中的差異。提供應用程序的一個相關的計算機程序產品包括一個計算機存儲介質;并且存儲在該計算機存儲介質上的計算機程序指令可在一臺處理器上執(zhí)行,通過分析在一個電子文檔中的內容結構或特性來產生用于一個電子文檔的摘要信息;根據(jù)該內容結構或特性的分析,產生包括從該電子文檔內容中選擇的多個摘要條目的一個集合的文檔摘要信息;并且提供用于一個移動通信裝置的該文檔摘要信息。
針對電子文檔產生摘要信息的服務器包括一個或多個文檔摘要處理,諸如結構文檔摘要處理、格式編排的文獻摘要處理、以及非結構的/未格式編排的文檔摘要處理。通過根據(jù)在該電子文檔中標識的一個預定內容結構而從一個電子文檔選擇多個摘要條目,該結構文檔摘要處理被構成來產生摘要信息。通過根據(jù)在該電子文檔中標識的內容格式編排而從一個電子文檔中選擇多個摘要條目,該格式編排文檔摘要處理被構成來產生摘要信息。通過根據(jù)在該電子文檔中的段落大小中的差異而從一個電子文檔中選擇多個摘要條目,該非結構的/未格式編排的文檔摘要處理被構成來產生摘要信息。
以利于把用于電子文檔的摘要信息傳遞到移動通信裝置的一個系統(tǒng)包括一個服務器、一個無線通信網絡、和一個操作中在該無線通信網絡中的移動通信裝置。該服務器包括一個或多個文檔摘要處理,諸如結構文檔摘要處理、格式編排的文獻摘要處理、以及非結構的/未格式編排的文檔摘要處理。通過根據(jù)在該電子文檔中標識的一個預定內容結構而從一個電子文檔選擇多個摘要條目,該結構文檔摘要處理被構成來產生摘要信息。通過根據(jù)在該電子文檔中標識的內容格式編排而從一個電子文檔中選擇多個摘要條目,該格式編排文檔摘要處理被構成來產生摘要信息。通過根據(jù)在該電子文檔中的段落大小中的差異而從一個電子文檔中選擇多個摘要條目,該非結構的/未格式編排的文檔摘要處理被構成來產生摘要信息。該無線通信網絡被構成來響應對于電子文檔的請求而把摘要信息傳遞到一個移動通信裝置。
上述描述涉及本發(fā)明的一個示例。對于在本領域中的技術人員來說將明顯有許多變化,并且這種變化是在該應用的范圍之內。例如,雖然圖1示出的示例中一個移動通信裝置106通過一個無線網絡104和互聯(lián)網絡102與一種文檔服務器100通信,但除移動通信裝置106以外的客戶能夠從文檔服務器100請求電子文檔的摘要,并且可以通過不同網絡與文檔服務器100通信。在此處列舉的權利要求中描述的本發(fā)明打算覆蓋和包含在技術中的全部適當?shù)母淖儭?br> 權利要求
1.一種針對一個電子文檔產生由一個移動通信裝置使用的摘要信息的方法,包括步驟分析在一個電子文檔之內的一個內容結構或特性;根據(jù)該內容結構或特性的分析,產生包括從該電子文檔內容中選擇的多個摘要條目的一個集合的文檔摘要信息;并且提供用于一個移動通信裝置的該文檔摘要信息。
2.權利要求1的方法,還包括其中分析該內容結構或特性的行為包括標識在該電子文檔中的目錄表。
3.權利要求1的方法,還包括其中分析該內容結構或特性的行為包括標識在該電子文檔中的多個電子表格工作表。
4.權利要求1的方法,還包括其中分析該內容結構或特性的行為包括標識在該電子文檔中的文檔頁。
5.權利要求1的方法,還包括其中分析該內容結構或特性的行為包括分析在該電子文檔中的文本格式編排。
6.權利要求1的方法,還包括分析該內容結構或特性的行為包括分析在該電子文檔中的文本字體名稱、文本字體大小、文本字體磅值、以及文本字形的至少之一。
7.權利要求1的方法,還包括其中分析該內容結構或特性的行為包括標識在該電子文檔中的段落對齊方式或縮排中的差異。
8.權利要求1的方法,還包括其中分析該內容結構或特性的行為包括標識在該電子文檔中的段落大小的差異。
9.權利要求1的方法,其中該摘要信息被提供到該移動通信裝置而沒有電子文檔。
10.一種計算機程序產品,包括一個計算機存儲介質;存儲在該計算機存儲介質上的計算機程序指令;可通過下列步驟在一個處理器上執(zhí)行該計算機程序指令,以便產生用于一個電子文檔的摘要信息分析在一個電子文檔之內的一個內容結構或特性;根據(jù)該內容結構或特性的分析,產生包括從該電子文檔內容中選擇的多個摘要條目的一個集合的文檔摘要信息;并且提供用于一個移動通信裝置的該文檔摘要信息。
11.權利要求10的計算機程序產品,其中該計算機程序指令可是進一步執(zhí)行用于通過標識在該電子文檔中的一個目錄來分析該內容結構或特性。
12.權利要求10的計算機程序產品,其中該計算機程序指令可是進一步執(zhí)行用于通過標識在該電子文檔中的多個電子表格工作表來分析該內容結構或特性。
13.權利要求10的計算機程序產品,其中該計算機程序指令可進一步執(zhí)行用于通過標識在該電子文檔中的多個文檔頁來分析該內容結構或特性。
14.權利要求10的計算機程序產品,其中該計算機程序指令可進一步執(zhí)行用于通過標識在該電子文檔中的文本格式編排來分析該內容結構或特性。
15.權利要求10的計算機程序產品,其中該計算機程序指令可進一步執(zhí)行用于通過分析在該電子文檔中的文本格式編排來分析該內容結構或特性;并且其中根據(jù)在該電子文檔中的文本格式編排中的不同從該電子文檔的內容中選擇的多個摘要條目。
16.權利要求10的計算機程序產品,其中該計算機程序指令可進一步執(zhí)行用于通過分析在該電子文檔中的文本字體名稱、文本字體大小、文本字體磅值、以及文本字形的至少之一來分析該內容結構或特性。
17.權利要求10的計算機程序產品,其中該計算機程序指令可進一步執(zhí)行用于通過標識在該電子文檔中的段落對齊方式或縮排中的不同來分析該內容結構或特性。
18.權利要求10的計算機程序產品,其中該計算機程序指令可進一步執(zhí)行用于通過標識在該電子文檔中的段落大小中的不同來分析該內容結構或特性。
19.產生用于一個電子文檔的摘要信息的方法,包括步驟標識一個電子文檔,針對該電子文檔產生具有多個摘要條目的摘要信息;在該摘要信息的產生中如果該電子文檔具有一個預定的內容結構,則根據(jù)該預定的內容構造從該電子文檔中選擇多個摘要條目;以及另外,如果該電子文檔具有內容特性,則根據(jù)在該內容特性中的不同而從該電子文檔中選擇多個摘要條目。
20.權利要求19的方法,還包括響應一個移動通信裝置對于該電子文檔的請求而提供該摘要信息。
21.權利要求19的方法,還包括如果該電子文檔沒有預定的內容結構以及沒有內容特性,則根據(jù)在段落規(guī)模中的不同從該電子文檔中選擇多個摘要條目。
22.權利要求19的方法,其中該預定的內容結構包括一個目錄表。
23.權利要求19的方法,其中該預定的內容結構包括多個電子表格工作表。
24.權利要求19的方法,其中該預定的內容結構包括一個便攜文檔格式編排的多個文檔頁。
25.權利要求19的方法,其中該內容特性包括文字格式。
26.權利要求19的方法,其中該內容特性包括文本格式編排,該格式編排包括文本字體名稱、文本字體大小、文本字體磅值、以及文本字形的至少一個。
27.權利要求19的方法,其中該內容特性包括段落對齊方式或縮排。
28.針對產生針對電子文檔的摘要信息的一個服務器,包括一個結構文檔摘要處理,通過根據(jù)在該電子文檔中標識的一個預定內容結構而從一個電子文檔選擇多個摘要條目來產生摘要信息。以及一個格式編排文檔摘要處理,通過根據(jù)在該電子文檔中標識的內容格式編排中的不同而從一個電子文檔選擇多個摘要條目來產生摘要信息。
29.權利要求28的服務器,進一步包括一個非結構/未格式編排的文檔摘要處理,根據(jù)在段落大小中的不同而通過從一個電子文檔選擇多個摘要條目來產生摘要信息。
30.權利要求28的服務器,其中該預定的內容結構包括一個目錄表。
31.權利要求28的服務器,其中該預定的內容結構包括多個電子表格工作表。
32.權利要求28的服務器,其中該預定的內容結構包括多個文檔頁。
33.權利要求28的服務器,其中該內容格式編排包括文本字體名稱、文本字體大小、文本字體磅值以及文本字形的至少之一。
34.權利要求28的服務器,其中該內容格式編排包括段落對齊方式或縮排。
35.以利于用于電子文檔的摘要信息傳遞到移動通信裝置的一個系統(tǒng),包括一個服務器,具有一個結構文檔摘要處理,通過根據(jù)在該電子文檔中標識的一個預定內容結構而從一個電子文檔選擇多個摘要條目來產生摘要信息。一個無線通信網絡,響應對于那電子文檔的一個請求將摘要信息傳遞到一個移動通信裝置。
36.權利要求35的系統(tǒng),還包括一個移動通信裝置,響應對于該電子文檔的請求而接收該摘要信息。
37.權利要求35的系統(tǒng),還包括該服務器具有一個格式編排文檔摘要處理,通過根據(jù)在該電子文檔中標識的內容格式編排中的不同而從一個電子文檔選擇多個摘要條目來產生摘要信息。
38.權利要求35的系統(tǒng),還包括該服務器具有一個非結構/未格式編排的文檔摘要處理,根據(jù)在該電子文檔中的段落大小的不同而通過從一個電子文檔選擇多個摘要條目來產生摘要信息。
39.權利要求35的系統(tǒng),還包括該服務器具有一個格式編排文檔摘要處理,通過根據(jù)在該電子文檔中標識的內容格式編排中的不同而從一個電子文檔選擇多個摘要條目來產生摘要信息;以及該服務器具有一個非結構/未格式編排的文檔摘要處理,根據(jù)在該電子文檔中的段落大小的不同而通過從一個電子文檔選擇多個摘要條目來產生摘要信息。
全文摘要
針對一個電子文檔(400)產生一文檔摘要,該摘要包括多個摘要條目的一個集合。在該文檔摘要的產生中,分析在該電子文檔中的內容結構或特性。根據(jù)該內容結構或特性的分析,從該電子文檔的內容中選擇多個摘要條目。在該電子文檔中的內容結構可以包括一個目錄表(410)、多個電子表格工作表(402)、多個文檔頁(414)等。該電子文檔中的內容特性可以包括文字格式(420)、段落格式(422)、段落大小(422)等。優(yōu)選地,在該電子文檔中的最佳可用的內容結構或特性在該多個摘要條目(406,408,412,416,420,422)的選擇中被識別和利用。響應對于電子文檔的請求,把該文檔摘要提供到一個移動通信裝置。
文檔編號G06F17/21GK1732451SQ200380108099
公開日2006年2月8日 申請日期2003年10月24日 優(yōu)先權日2002年10月31日
發(fā)明者袁建偉, 奧拉夫·A·西爾澤 申請人:艾瑞贊公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1