內(nèi)容提取方法、內(nèi)容提取裝置和用于內(nèi)容提取的系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本公開涉及文本處理領(lǐng)域,更具體地,涉及文本處理領(lǐng)域中的內(nèi)容提取方法、內(nèi)容提取裝置和用于內(nèi)容提取的系統(tǒng)。
【背景技術(shù)】
[0002]用戶通常在他們通過文檔顯示設(shè)備介紹文檔時使用輸入動作(例如用戶手勢)來讓他們被其它用戶理解。文檔顯示設(shè)備可以是屏幕中的文檔窗口、觸摸面板或投影儀的投影。例如,可以通過在屏幕中移動鼠標(biāo)、對觸摸面板執(zhí)行觸摸或滑動操作、或者在投影上使用用戶手勢,來直接對正被顯示的文檔進行一些動作。在用戶手勢用于提取文檔中的內(nèi)容以介紹該文檔的情況下,幫助系統(tǒng)通常被提出,其使得能夠接收用戶手勢并將用戶的選擇定位在文檔顯示設(shè)備上。
[0003]例如,在旅游機構(gòu)中,職員通常使用文檔顯示設(shè)備來向顧客解釋不同的旅游計劃。文檔顯示設(shè)備被設(shè)計為接收具有關(guān)于旅游計劃的內(nèi)容的輸入文檔和用戶手勢,并輸出由用戶手勢點擊或選擇的內(nèi)各。
[0004]提出了多種方法來根據(jù)用戶手勢選擇文檔中的文本區(qū)域,這些方法將文檔中的文本的坐標(biāo)與用戶手勢的坐標(biāo)進行比較以確定用戶手勢選擇了哪個文本并然后輸出所確定的文本。例如,在相關(guān)技術(shù)中,記錄用戶手勢的位置,并選擇與用戶手勢距離最小的文本作為輸出。
[0005]然而,這樣的方法根據(jù)坐標(biāo)距離的信息可能僅僅獲得文本的一些分段,并通??赡懿惠敵鲇脩粝胍赶虻挠幸饬x的內(nèi)容。
[0006]此外,由于這樣的方法僅僅使用坐標(biāo)距離的信息,因此靠近用戶手勢的所有單詞(文本)可能被獲得,因為這些單詞可能具有小于預(yù)定閾值的到用戶手勢的距離。因此,所選擇的單詞通常不是用戶實際想要選擇的,從而導(dǎo)致根據(jù)用戶手勢獲得的內(nèi)容不準(zhǔn)確。例如,如果用戶想要選擇文檔的第一行中的第一個單詞,那么,當(dāng)用戶使用手勢在該第一個單詞下方劃過時,通??赡芡瑫r選擇第一行中的該第一個單詞以及第二行中的第一個和/或第二個單詞,因為所有這些所選擇的單詞可能具有到手勢的最小距離。再例如,如果用戶想要選擇第一行和第二行以對它們進行比較,那么用戶將指向這些行中的每一個單詞,這對于用戶而言是非常單調(diào)乏味且浪費時間的。如果用戶僅僅在邊上指向第一行和第二行,那么第一行和第二行中靠近手勢的單詞可能被選擇而不是整個行。
[0007]因此,存在當(dāng)用戶想要從文檔提取內(nèi)容時改進準(zhǔn)確性的需要。
【發(fā)明內(nèi)容】
[0008]本公開內(nèi)容公開了內(nèi)容提取方法、內(nèi)容提取裝置和用于內(nèi)容提取的系統(tǒng),其能夠在改進內(nèi)容提取的準(zhǔn)確性同時還向用戶提供有意義的內(nèi)容。
[0009]根據(jù)本發(fā)明的一個方面,提供了一種內(nèi)容提取方法,包括:提取輸入文檔中的多個主題內(nèi)容區(qū)域,其中每個主題內(nèi)容區(qū)域由輸入文檔中的關(guān)于同一主題的一個或多個元素組成;對于至少一部分主題內(nèi)容區(qū)域中的每個主題內(nèi)容區(qū)域,確定該主題內(nèi)容區(qū)域的結(jié)構(gòu)類型,其中所述結(jié)構(gòu)類型通過該主題內(nèi)容區(qū)域中包含的元素確定;對于所述至少一部分主題內(nèi)容區(qū)域中的每個主題內(nèi)容區(qū)域,根據(jù)該主題內(nèi)容區(qū)域的結(jié)構(gòu)類型識別該主題內(nèi)容區(qū)域中的興趣內(nèi)容,其中該主題內(nèi)容區(qū)域中的興趣內(nèi)容指示該主題內(nèi)容區(qū)域中最可能被用戶注意的至少一個元素;以及根據(jù)用戶輸入動作和所述至少一部分主題內(nèi)容區(qū)域中的每個主題內(nèi)容區(qū)域中的興趣內(nèi)容,提取響應(yīng)于用戶輸入動作的主題內(nèi)容區(qū)域。
[0010]根據(jù)本發(fā)明的另一方面,提供了一種內(nèi)容提取裝置,包括:區(qū)域提取單元,被配置為提取輸入文檔中的多個主題內(nèi)容區(qū)域,其中每個主題內(nèi)容區(qū)域由輸入文檔中的關(guān)于同一主題的一個或多個元素組成;確定單元,被配置為對于至少一部分主題內(nèi)容區(qū)域中的每個主題內(nèi)容區(qū)域,確定該主題內(nèi)容區(qū)域的結(jié)構(gòu)類型,其中所述結(jié)構(gòu)類型通過該主題內(nèi)容區(qū)域中包含的元素確定;識別單元,被配置為對于所述至少一部分主題內(nèi)容區(qū)域中的每個主題內(nèi)容區(qū)域,根據(jù)該主題內(nèi)容區(qū)域的結(jié)構(gòu)類型識別該主題內(nèi)容區(qū)域中的興趣內(nèi)容,其中該主題內(nèi)容區(qū)域中的興趣內(nèi)容指示該主題內(nèi)容區(qū)域中最可能被用戶注意的至少一個元素;以及內(nèi)容提取單元,被配置為根據(jù)用戶輸入動作和所述至少一部分主題內(nèi)容區(qū)域中的每個主題內(nèi)容區(qū)域中的興趣內(nèi)容,提取響應(yīng)于用戶輸入動作的主題內(nèi)容區(qū)域。
[0011]根據(jù)本發(fā)明的再一方面,提供了一種用于內(nèi)容提取的系統(tǒng),包括:文檔獲取裝置,被配置為獲取輸入文檔;以及如上所述的內(nèi)容提取裝置。
[0012]根據(jù)上述技術(shù)方案,由于每個主題內(nèi)容區(qū)域包括關(guān)于同一主題的元素,因此由用戶輸入動作選擇的主題內(nèi)容區(qū)域可以向用戶提供有意義的內(nèi)容。此外,由于響應(yīng)于用戶輸入動作提取的內(nèi)容是一個主題內(nèi)容區(qū)域中的所有內(nèi)容,并且是基于用戶輸入動作與興趣內(nèi)容之間的關(guān)系、而不是基于用戶輸入動作和分別分離的單詞之間的坐標(biāo)距離,因此,所提取的內(nèi)容可以更準(zhǔn)確并向用戶提供他想要選擇的內(nèi)容。借助于主題內(nèi)容區(qū)域和興趣內(nèi)容,內(nèi)容提取的準(zhǔn)確性可以提高,同時可以向用戶提供有意義的內(nèi)容。
[0013]從參照附圖的以下描述中,本發(fā)明的其它特性特征和優(yōu)點將變得清晰。
【附圖說明】
[0014]并入說明書并且構(gòu)成說明書的一部分的附圖圖示了本發(fā)明的實施例,并且與描述一起用于說明本發(fā)明的原理。
[0015]圖1是示出能夠?qū)嵤┍景l(fā)明的實施例的計算機系統(tǒng)的示例性硬件配置的框圖。
[0016]圖2示出了根據(jù)本發(fā)明的實施例的內(nèi)容提取方法的流程圖。
[0017]圖3示出了根據(jù)本發(fā)明的實施例的提取主題內(nèi)容區(qū)域的處理的流程圖。
[0018]圖4A — 4D示出了分別具有單信息強調(diào)型、比較強調(diào)型、群信息強調(diào)型和對應(yīng)強調(diào)型的主題內(nèi)容區(qū)域的一些例子。
[0019]圖5示出了根據(jù)本發(fā)明的實施例的確定主題內(nèi)容區(qū)域的結(jié)構(gòu)類型的處理的流程圖。
[0020]圖6示出了給出分別用于單信息強調(diào)型、比較強調(diào)型、群信息強調(diào)型和對應(yīng)強調(diào)型的提示詞和焦點詞的一些例子的表格。
[0021]圖7示出了根據(jù)本發(fā)明的實施例的識別輸入文檔中的提示詞的處理的流程圖。
[0022]圖8A示出了歷史文檔中的與不同結(jié)構(gòu)類型有關(guān)的單詞和/或短語的一些例子。
[0023]圖SB示出了與不同結(jié)構(gòu)類型有關(guān)的歷史提示詞信息的一些例子。
[0024]圖9示出了根據(jù)本發(fā)明的實施例的識別輸入文檔中的提示詞的處理的另一流程圖。
[0025]圖1OA和1B示出了用于更好解釋圖9中的處理的一些例子。
[0026]圖11示出了計算用戶輸入動作和興趣內(nèi)容之間的距離的例子的示圖。
[0027]圖12示出了根據(jù)本發(fā)明的實施例的基于用戶輸入動作的速度提取內(nèi)容的處理的流程圖。
[0028]圖13示出了根據(jù)本發(fā)明的實施例的內(nèi)容提取裝置的結(jié)構(gòu)框圖。
[0029]圖14示出了根據(jù)本發(fā)明的實施例的內(nèi)容提取裝置的另一結(jié)構(gòu)框圖。
[0030]圖15示出了根據(jù)本發(fā)明的實施例的用于內(nèi)容提取的系統(tǒng)的結(jié)構(gòu)框圖。
【具體實施方式】
[0031 ] 以下將參照附圖詳細(xì)描述本發(fā)明的實施例。
[0032]請注意,類似的參考數(shù)字和字母指的是圖中的類似的項目,因而一旦在一幅圖中定義了一個項目,就不需要在之后的圖中討論了。
[0033]在本公開中,術(shù)語“第一”和“第二”等僅用于區(qū)分要素或步驟,但是不意圖表示時間次序、優(yōu)選性或重要性。
[0034]圖1是示出能夠?qū)嵤┍景l(fā)明的實施例的計算機系統(tǒng)1000的硬件配置的框圖。
[0035]如圖1中所示,計算機系統(tǒng)包括計算機1110。計算機1110包括經(jīng)由系統(tǒng)總線1121連接的處理單元1120、系統(tǒng)存儲器1130、固定非易失性存儲器接口 1140、可移動非易失性存儲器接口 1150、用戶輸入接口 1160、網(wǎng)絡(luò)接口 1170、視頻接口 1190和輸出外圍接口1195ο
[0036]系統(tǒng)存儲器1130包括R0M(只讀存儲器)1131和RAM(隨機存取存儲器)1132。B1S(基本輸入輸出系統(tǒng))1133駐留在ROM 1131中。操作系統(tǒng)1134、應(yīng)用程序1135、其它程序模塊1136和某些程序數(shù)據(jù)1137駐留在RAM 1132中。
[0037]諸如硬盤之類的固定非易失性存儲器1141連接到固定非易失性存儲器接口1140。固定非易失性存儲器1141例如可以存儲操作系統(tǒng)1144、應(yīng)用程序1145、其它程序模塊1146和某些程序數(shù)據(jù)1147。
[0038]諸如軟盤驅(qū)動器1151和⑶-ROM驅(qū)動器1155之類的可移動非易失性存儲器連接到可移動非易失性存儲器接口 1150。例如,軟盤1152可以被插入到軟盤驅(qū)動器1151中,以及⑶(光盤)1156可以被插入到⑶-ROM驅(qū)動器1155中。
[0039]諸如鼠標(biāo)1161和鍵盤1162之類的輸入設(shè)備被連接到用戶輸入接口 1160。
[0040]計算機1110可以通過網(wǎng)絡(luò)接口 1170連接到遠(yuǎn)程計算機1180。例如,網(wǎng)絡(luò)接口1170可以經(jīng)由局域網(wǎng)1171連接到遠(yuǎn)程計算機1180?;蛘撸W(wǎng)絡(luò)接口 1170可以連接到調(diào)制解調(diào)器(調(diào)制器一解調(diào)器)1172,以及調(diào)制解調(diào)器1172經(jīng)由廣域網(wǎng)1173連接到遠(yuǎn)程計算機
1180ο
[0041]遠(yuǎn)程計算機1180可以包括諸如硬盤之類的存儲器1181,其存儲遠(yuǎn)程應(yīng)用程序1185ο
[0042]視頻接口 1190連接到監(jiān)視器1191。
[0043]輸出外圍接口 1195連接到打印機1196和揚聲器1197。
[0044]圖1所示的計算機系統(tǒng)僅僅是說明性的并且決不意圖對本發(fā)明、其應(yīng)用或用途進行任何限制。
[0045]圖1所示的計算機系統(tǒng)可以被實施于任何實施例,可作為獨立計算機,或者也可作為裝置中的處理系統(tǒng),可以移除一個或更多個不必要的組件,也可以向其添加一個或更多個附加的組件。
[0046]現(xiàn)在,參考圖2,將描述根據(jù)本發(fā)明的實施例的內(nèi)容提取方法200。
[0047]內(nèi)容提取方法200從輸入文檔提取分別包括關(guān)于同一主題的元素的主題內(nèi)容區(qū)域。關(guān)于所提取的主題內(nèi)容區(qū)域中的至少一部分主題內(nèi)容區(qū)域中的每一個,內(nèi)容提取方法200確定該主題內(nèi)容區(qū)域的結(jié)構(gòu)類型,然后通過使用該結(jié)構(gòu)類型識別該主題內(nèi)容區(qū)域中的一個或多個興趣內(nèi)容?;谟脩糨斎雱幼骱团d趣內(nèi)容之間的關(guān)系,內(nèi)容提取方法200可以確定用戶想要選擇哪個主題內(nèi)容區(qū)域,并提取該主題內(nèi)容區(qū)域以用于例如顯示、編輯、存儲等。因為主題內(nèi)容區(qū)域由于所包括的關(guān)于同一主題的元素而具有有意義的內(nèi)容,并且用戶輸入動作和興趣內(nèi)容之間的關(guān)系被使用,因此可以更準(zhǔn)確地提取用戶想要選擇的內(nèi)容,并可以以有意義的方式將該內(nèi)容提供給用戶。下面,將描述內(nèi)容提取方法200的細(xì)節(jié)。
[0048]在步驟S210中,提取輸入文檔中的多個主題內(nèi)容區(qū)域,其中每個主題內(nèi)容區(qū)域由輸入文檔中的關(guān)于同一主題的一個或多個元素組成。這里,每個元素可以選自包括單詞、短語、句子、段落、圖片和表格中的至少一個的組。
[0049]具體而言,主題內(nèi)容區(qū)域包括用戶想要例如強調(diào)、高亮顯示、選擇、談?wù)摰鹊膬?nèi)容,其可以表達能夠被人們理解的完整含義。例如,如果一些句子與富士山有關(guān),那么可以構(gòu)成主題內(nèi)容區(qū)域的完整信息可以包括富士山的位置、高度和歷史。如果一些句子與旅游計劃相關(guān),那么完整信息可以包括旅游的旅游方法、時間、距離、成本和食物。
[0050]一個主題內(nèi)容區(qū)域是用戶可能想要在例如進行介紹或進行拷貝以填表時選擇或高亮顯示的輸入文檔(或顯示文檔)中的主題內(nèi)容的區(qū)域。主題內(nèi)容區(qū)域可以包括用戶想要一次預(yù)覽的內(nèi)容,并且可以盡可能得小。主題內(nèi)容區(qū)域不需要是文檔中的連續(xù)的物理區(qū)域。主題內(nèi)容區(qū)域可以是邏輯意義上的區(qū)域,其可以由物理上存在的元素構(gòu)成,物理上存在的元素包括文檔中的單詞、短語、句子、段落、圖片和/或表格。構(gòu)成的元素可能形成文檔中的連續(xù)的物理區(qū)域,也可能形成文檔的不同部分中的分離的物理區(qū)域。不管同一主題內(nèi)容區(qū)域中的元素位于文檔中的什么地方,這些元素關(guān)于同一主題。例如,這些元素可以描述同一關(guān)鍵詞(例如“富士山”),或者可以指示應(yīng)該被關(guān)注的重要信息(例如“地震”),或者可以提供關(guān)于同一活動的多條比較信息(例如,當(dāng)選擇哪個房屋更適合購買時的信息),或者可以針對關(guān)于同一圖片或表格的信息。
[0051]根據(jù)本發(fā)明的實施例,文檔中的主題內(nèi)容區(qū)域可以由用戶預(yù)先定義,從而當(dāng)文檔被使用或顯示時,可以自動提取預(yù)先定義的主題內(nèi)容區(qū)域。
[0052]例如,在用戶進行介紹之前,用戶可能選擇一些要高亮顯示的關(guān)鍵詞。當(dāng)用戶進行介紹時,用戶可以在這些關(guān)鍵詞附近使用手勢以使這些關(guān)鍵詞被高亮顯示。以銀行中的使用情