專利名稱:用于實(shí)現(xiàn)文字概括的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及文字的概括。
背景技術(shù):
存在有使用計(jì)算機(jī)的兩種主要的人對(duì)人通訊電子郵件和各種形式的實(shí)時(shí)交談(例如使用IBM公司提供的LotusSametime)。實(shí)時(shí)交談系統(tǒng)允許人們彼此輸入消息,并且這些允許消息幾乎立即出現(xiàn)在接收者的顯示屏幕上。這種系統(tǒng)允許比經(jīng)由電子郵件所可能發(fā)生的交互和討論更加自然的交互和討論。(IBM、Lotus和Sametime是在美國(guó)、或者其他國(guó)家或者兩者的國(guó)際商用機(jī)器公司的商標(biāo))。
當(dāng)用戶打字時(shí),他們的交談系統(tǒng)產(chǎn)生“交談抄本(transcript)”顯示每個(gè)用戶說的是什么。格式通常是“姓名言語”(例如,尼科你什么時(shí)候吃午飯?)通常,將交談抄本保留在正在參與交談的每個(gè)客戶的本地。每個(gè)參與者的交談抄本通常從參與者開始加入交談的時(shí)候以后以及僅僅當(dāng)該參與者與他們正在運(yùn)行的即時(shí)消息接發(fā)軟件連接的時(shí)候才顯示交談對(duì)話。所以除非當(dāng)前的參與者解釋之前的情況,否則交談的新參與者、或者臨時(shí)斷開的參與者在他們離線的時(shí)候可能錯(cuò)過基于即時(shí)消息接發(fā)的小組討論。
人們已經(jīng)知道用于概括信息的技術(shù)。例如,可以在下面網(wǎng)址找到對(duì)現(xiàn)存概括工具的評(píng)論itt.nissat.tripod.com/itt0202/ruoi0202.htm。此外,美國(guó)專利6,101,532示教了對(duì)線程化(threaded)討論的概括。而且,美國(guó)專利公開2004/0122657公開了一種用于基于交互話題概括的技術(shù),其中基于從例如一篇文字的句子位置得來的關(guān)聯(lián)高分(high score)在基于話題的概括中對(duì)于結(jié)論選擇句子。
但是,在業(yè)界需要用于概括文字的改進(jìn)的技術(shù)。
發(fā)明內(nèi)容
根據(jù)一個(gè)方面,提供一種用于實(shí)現(xiàn)文字概括的方法,包括根據(jù)文字在文檔內(nèi)相對(duì)于其他文字的位置或者在一種文檔結(jié)構(gòu)中的多個(gè)文檔內(nèi)包含該文字的文檔的位置,來請(qǐng)求對(duì)文檔中該文字的概括。
根據(jù)另一個(gè)方面,提供一種用于實(shí)現(xiàn)文字概括的方法,包括結(jié)合文檔的版本或者包括該文檔的文檔結(jié)構(gòu)根據(jù)用戶與應(yīng)用程序的交互,請(qǐng)求在該文檔中對(duì)文字的概括。
當(dāng)然,對(duì)概括的請(qǐng)求可以是遠(yuǎn)程服務(wù)或者可以對(duì)請(qǐng)求者是本地的(例如在相同的機(jī)器上)。
在一個(gè)實(shí)施方式中,應(yīng)用程序是即時(shí)消息接發(fā)應(yīng)用程序,而文檔是即時(shí)消息接發(fā)對(duì)話抄本。當(dāng)然,上述情形僅僅是示例的形式??梢詫⒈景l(fā)明應(yīng)用于諸如電子郵件的文檔、文字處理文檔和博客文檔、以及諸如新聞組討論和wikis之類的文檔結(jié)構(gòu)。
在一個(gè)實(shí)施方式中,在與即時(shí)消息接發(fā)對(duì)話抄本關(guān)聯(lián)的即時(shí)消息接發(fā)對(duì)話中存在多個(gè)參與者,而且每個(gè)參與者具有對(duì)話抄本的版本。為了概括文字,最好請(qǐng)求對(duì)話抄本的版本(例如,最完整的版本)。
如果給出了文檔中的文字位置,則可以使用規(guī)則來指示用于請(qǐng)求的概括等級(jí)。
最好在文檔中較后出現(xiàn)的文字與在文檔中較早出現(xiàn)的文字相比需要較少程度的概括。
在一個(gè)實(shí)施方式中,將即時(shí)消息接發(fā)對(duì)話抄本分段。然后最好請(qǐng)求每個(gè)段內(nèi)的文字概括的不同等級(jí)。
分段可以基于抄本中的行數(shù)?;蛘撸梢允褂迷谄陂g產(chǎn)生抄本的時(shí)間段。可以使用用戶偏好來確定如何對(duì)即時(shí)消息接發(fā)對(duì)話抄本進(jìn)行分段。
當(dāng)接收到概括的交談抄本段時(shí),最好將它們合并在一起顯示給用戶。這種合并涉及對(duì)段進(jìn)行格式化以指示用于每個(gè)段的概括等級(jí)。
在一個(gè)實(shí)施方式中,結(jié)合文檔的版本或者結(jié)合文檔結(jié)構(gòu)根據(jù)從用戶與應(yīng)用程序的最后交互所經(jīng)過的時(shí)間,來確定是否請(qǐng)求對(duì)文字的概括。
在即時(shí)消息接發(fā)情形中,可以存在幾個(gè)版本的文檔(交談抄本),并且每個(gè)用戶經(jīng)由他們的本地應(yīng)用程序來訪問他們文檔的版本。
在一個(gè)實(shí)施方式中,根據(jù)在由用戶所發(fā)送的最后消息和用戶希望發(fā)送另一個(gè)即時(shí)消息以參與對(duì)話并因此修改抄本的指示之間的即時(shí)消息接發(fā)對(duì)話抄本所關(guān)聯(lián)的即時(shí)消息接發(fā)對(duì)話中,由其他參與者所發(fā)送的即時(shí)消息的數(shù)量,作出是否請(qǐng)求文字概括的決定。
注意,用戶與即時(shí)消息接發(fā)對(duì)話抄本的交互可以不是直接的交互。例如,消息的發(fā)送可能導(dǎo)致與潛在消息抄本的交互。還要注意,用戶的交互歷史可能為空-換句話說,他們對(duì)于即時(shí)消息對(duì)話是新來的,之前沒有打開過文字處理文檔或者查看過特別的新聞組等。
最好,在即時(shí)消息接發(fā)情形中,接收關(guān)于用戶希望發(fā)送即時(shí)消息的指示。
在一個(gè)實(shí)施方式中,根據(jù)用戶最后訪問文檔或者文檔結(jié)構(gòu)的時(shí)間來確定是否請(qǐng)求概括??梢允褂梦臋n的長(zhǎng)度。在另一個(gè)實(shí)施方式中,可以使用當(dāng)用戶最后與文檔結(jié)構(gòu)進(jìn)行交互時(shí)所相關(guān)的文檔結(jié)構(gòu)中的文檔數(shù)量來確定是否請(qǐng)求概括。
根據(jù)另一個(gè)方面,提供一種用于實(shí)現(xiàn)文字概括的設(shè)備,包括用于根據(jù)文字在文檔內(nèi)相對(duì)于其他文字的位置,或者根據(jù)在文檔結(jié)構(gòu)中的多個(gè)文檔內(nèi)包含該文字的文檔的位置,請(qǐng)求概括該文檔中的文字的裝置。
根據(jù)另一個(gè)方面,提供一種用于實(shí)現(xiàn)文字概括的設(shè)備,包括用于結(jié)合文檔的版本或者結(jié)合包括該文檔的文檔結(jié)構(gòu),根據(jù)用戶與應(yīng)用程序的交互來請(qǐng)求概括該文檔中的文字的裝置。
可以用計(jì)算機(jī)軟件來實(shí)現(xiàn)本發(fā)明。
將參照附圖僅僅通過例子來描述本發(fā)明的優(yōu)選實(shí)施方式圖1示出了如何實(shí)施這種消息接發(fā)系統(tǒng);圖2a和2b示出了根據(jù)本發(fā)明的優(yōu)選實(shí)施方式的通過其創(chuàng)建即時(shí)消息接發(fā)抄本的概括的處理和部件;圖3a和3b示出了根據(jù)本發(fā)明的優(yōu)選實(shí)施方式的可以通過其將交談抄本進(jìn)行分段并且進(jìn)行不同程度概括的處理和部件;和圖4a和4b示出了根據(jù)本發(fā)明的優(yōu)選實(shí)施方式的,可以通過其根據(jù)參與者最后參與即時(shí)消息接發(fā)對(duì)話的時(shí)間將摘要提供給即時(shí)消息接發(fā)參與者的處理和部件。
具體實(shí)施例方式
能夠以各種不同的方式來實(shí)施即時(shí)消息接發(fā)。用戶通常具有“朋友”列表,他們與這些朋友經(jīng)常通訊。例如使用即時(shí)消息程序ICQ,用戶聯(lián)系ICQ服務(wù)器,從而該服務(wù)器可以確定用戶的那些朋友在線。然后,ICQ服務(wù)器將關(guān)于用戶的在線朋友的必要聯(lián)系詳情發(fā)送給用戶,而且確保其他用戶可以看見該用戶。隨后,在用戶和其他人之間發(fā)生直接的通訊。服務(wù)器不需要介入實(shí)際的對(duì)話。僅僅當(dāng)用戶終止他們的會(huì)話時(shí),他們的機(jī)器才通知ICQ服務(wù)器,從而其可以將用戶的狀態(tài)改為“離線”。
諸如微軟即時(shí)消息者之類的其他消息接發(fā)系統(tǒng)使用中間服務(wù)器以將每個(gè)消息轉(zhuǎn)發(fā)到所期望的接收者。圖1示出了如何實(shí)現(xiàn)這種消息接發(fā)系統(tǒng)的例子。
客戶端A和B同時(shí)運(yùn)行即時(shí)消息接發(fā)軟件10、20。如果客戶端A的用戶想要與客戶端B的用戶進(jìn)行實(shí)時(shí)通訊,則客戶端A發(fā)送即時(shí)消息給中央即時(shí)消息接發(fā)服務(wù)器40。即時(shí)消息包含發(fā)送者和接收者識(shí)別信息,而服務(wù)器40使用用戶查詢部件50來訪問已知用戶列表55,以確定該消息的發(fā)送者對(duì)于服務(wù)器來說是否是已知的。(注意在實(shí)際使用即時(shí)消息接發(fā)軟件之前用戶通常經(jīng)由用戶注冊(cè)部件60與服務(wù)器進(jìn)行注冊(cè)。)假設(shè)用戶對(duì)于服務(wù)器40已經(jīng)是已知的,并且還使用用戶查詢部件50和用戶列表55來確定消息的接收者對(duì)于服務(wù)器來說是否是已知的。而且假設(shè)該接收者是已知的,交談抄本創(chuàng)建部件70創(chuàng)建新交談抄本。服務(wù)器以[用戶姓名][即時(shí)消息的文字]的形式來對(duì)抄本進(jìn)行添加。然后,將該信息轉(zhuǎn)發(fā)到客戶端B以經(jīng)由客戶端的即時(shí)消息接發(fā)軟件10進(jìn)行顯示。還將相同的信息轉(zhuǎn)發(fā)到客戶端A以經(jīng)由客戶端的即時(shí)消息接發(fā)軟件20進(jìn)行顯示。如果客戶端B的用戶隨后回應(yīng)該消息,則服務(wù)器40根據(jù)上述相同的格式來創(chuàng)建新的一行文字,并且將該文字轉(zhuǎn)發(fā)到客戶端A、B兩者。然后每個(gè)客戶端可以使用所接收到的信息以對(duì)交談抄本進(jìn)行添加,并且將此顯示給客戶端的用戶。
在本例中由交談中的每個(gè)參與者將交談抄本保留在本地。
在所述的例子中,在關(guān)于即將來臨的會(huì)議的對(duì)話中涉及A和B。在他們對(duì)話中間,在點(diǎn)n,C上線并且A或B邀請(qǐng)C加入他們的對(duì)話。
C不知道在被邀請(qǐng)加入A和B的交談之前他們已經(jīng)討論了什么。根據(jù)優(yōu)選實(shí)施方式,本發(fā)明提供一種機(jī)制,通過該機(jī)制將對(duì)C加入之前已經(jīng)發(fā)生的對(duì)話的摘要提供給C。
參照附圖2a和2b示出了經(jīng)由其產(chǎn)生A和B的交談抄本的摘要的部件和處理。
在步驟100,C的邀請(qǐng)接收器200從當(dāng)前交談參與者之一(例如A或B)接收加入他們的交談的邀請(qǐng)。在步驟110,C的邀請(qǐng)接收器200(使用聯(lián)系詳情部件205)詢問邀請(qǐng)者關(guān)于當(dāng)前交談參與者的聯(lián)系詳情。因?yàn)檠?qǐng)者一直在與其他參與者進(jìn)行交談,所以他們具有對(duì)這些詳情的訪問。邀請(qǐng)者發(fā)送所請(qǐng)求的詳情給C,C使用這些詳情(經(jīng)由抄本尺寸部件210)來請(qǐng)求由每個(gè)參與者所保持的交談(相關(guān)抄本的)的行數(shù)(步驟120)。最好接收這種信息作為帶外(out-of-band)控制消息。然后抄本尺寸部件210選擇最完整的抄本,并且請(qǐng)求擁有該抄本的交談參與者將其發(fā)送給C(步驟130)。
注意,可以簡(jiǎn)單地將參與者識(shí)別符提供給C,并且C可以通過中間消息接發(fā)服務(wù)器40請(qǐng)求交談抄本尺寸,或者可以將完整的聯(lián)系詳情(例如IP地址)提供給C。在后一種情況中,C可以直接聯(lián)系參與者。
如果所有交談參與者都已經(jīng)參與交談了相同的時(shí)間,則所有抄本應(yīng)該長(zhǎng)度相同。在這種情況中,抄本尺寸部件可以簡(jiǎn)單地隨機(jī)地或者根據(jù)某些預(yù)定條件(例如,從網(wǎng)絡(luò)距離的角度來說最接近的抄本)來選擇一個(gè)交談抄本。
在另一方面,如果一個(gè)或者多個(gè)參與者半途加入交談,則該參與者的交談抄本將具有不同的長(zhǎng)度。
由抄本尺寸部件210在步驟140接收所選擇的交談抄本。
由抄本概括器部件220將所接收的交談抄本作為輸入提供給概括服務(wù)240(步驟150)。可以在橫跨網(wǎng)絡(luò)230的某個(gè)位置提供這種概括服務(wù)?;蛘撸梢詫⑦@種服務(wù)作為即時(shí)消息接發(fā)服務(wù)器的一部分提供,或者在交談參與者之一處提供。
概括軟件最好是諸如IBM的DB2Intelligent MinerTM或者在市場(chǎng)上可獲得的多種其他概括引擎之一之類的非定制(off the shelf)概括引擎。可以在網(wǎng)址itt.nissat.tripod.com/itt0202/ruoi0202.htm上發(fā)現(xiàn)對(duì)現(xiàn)存系統(tǒng)的評(píng)價(jià)。
(DB2和Intelligent Miner是在美國(guó)、其他國(guó)家或者兩者的國(guó)際商用機(jī)器公司的商標(biāo))將概括引擎的輸出提供給C。因此C能夠接收對(duì)在交談參與者A和B之間之前已經(jīng)發(fā)生的交談的摘要。
如上所述,消息接發(fā)服務(wù)器可以在交談抄本中創(chuàng)建每一行以轉(zhuǎn)發(fā)給交談中的參與者。這樣的交談行通常遵循這樣的格式[用戶姓名][即時(shí)消息的文字]。由即時(shí)消息接發(fā)服務(wù)器提供給客戶端的用戶名字可以是用戶的電子郵件地址。然后,每個(gè)客戶端根據(jù)預(yù)設(shè)的短名來解釋該電子郵件地址。因此交談抄本可能被特別客戶端所使用的名字弄亂。所以,最好在將交談抄本發(fā)送給進(jìn)行請(qǐng)求的客戶端之前,由擁有交談抄本的即時(shí)消息接發(fā)軟件將這樣的綽號(hào)轉(zhuǎn)換回完整的識(shí)別符。然后,進(jìn)行請(qǐng)求的客戶端可以以這種形式提交抄本或者使用轉(zhuǎn)換部件(未示出)來將完整的識(shí)別符映射到已經(jīng)為交談參與者設(shè)置的綽號(hào)。
但是,還非??赡茉诙喾綄?duì)話中不是所有的對(duì)話都與后加入者非常相關(guān)??赡芤?yàn)樽罱f的某些事情與他們相關(guān)或者需要他們的意見,所以已經(jīng)邀請(qǐng)這樣的用戶加入正在進(jìn)行的對(duì)話。因此,在替代實(shí)施方式中,根據(jù)較近的交流比較先的交流具有更少的可舍棄內(nèi)容,將交談抄本的多個(gè)部分進(jìn)行不同程度的概括。
參照?qǐng)D3a和3b來描述本替代實(shí)施方式的處理和部件。
當(dāng)新參與者進(jìn)入多方對(duì)話時(shí),經(jīng)由上述過程(例如使用抄本尺寸部件210)來獲得至今現(xiàn)存的參與者之間的整個(gè)對(duì)話的抄本(步驟300)。
使用抄本尺寸部件210在步驟310確定在抄本中的行數(shù)??赡芤呀?jīng)在圖2a的步驟130處接收了該行數(shù)。
由分段器400將抄本分為x個(gè)段(步驟S320)。用戶喜好(未示出)指示所期望的段數(shù),然后分段器使用這些來將所接收到的交談抄本分為適當(dāng)數(shù)量的相等長(zhǎng)度的段。例如,如果用戶喜好指示需要四段并且確定在該交談抄本中有十五行,則產(chǎn)生具有四行的三個(gè)相等的段和包含剩余的三行的第四段。注意,用戶喜好可能指示所期望的段數(shù)依賴于在交談抄本中的行數(shù)。例如,對(duì)于少于50行的抄本執(zhí)行“a”,而對(duì)于多于50行的那些執(zhí)行“b”。
在另一種實(shí)施方式中,用戶可以不指定分段喜好。而可以將所使用的段數(shù)硬編碼(hard-code)為即時(shí)消息接發(fā)應(yīng)用程序。
分段器400為每個(gè)分段分配識(shí)別符(例如,數(shù)字識(shí)別符),從而給出段的順序。
對(duì)于每個(gè)段,使用規(guī)則訪問器420來訪問概括規(guī)則410。概括規(guī)則指示所需要的概括等級(jí)(步驟330)。例如,具有標(biāo)識(shí)符1的段可能需要70%的概括。而具有識(shí)別符5的段可能需要5%的概括。這后面的原因就是較早的段可能比較新的段包含較少的相關(guān)信息,從而可以壓縮得更多。
抄本概括器部件220輸入每個(gè)段到概括服務(wù)240并且指示所需要的概括等級(jí)(步驟340)。注意,當(dāng)前的概括軟件已經(jīng)能夠?qū)⑽淖指爬ǖ讲煌牡燃?jí)。例如,Sinope的概括器工具允許用戶指定所需要的概括的長(zhǎng)度。網(wǎng)址www.sinope.info/en/info/25/解釋了用戶可以通過拖動(dòng)滑動(dòng)條來選擇概括長(zhǎng)度。在本發(fā)明的實(shí)施方式中,使用自動(dòng)的代理來選擇適當(dāng)?shù)幕瑒?dòng)條位置并且輸入文字到概括軟件。
對(duì)于某些段,根本就不需要概括。在這樣的情況中,不將這樣的段提供給服務(wù)但是將它們保留在客戶端處。
概括器部件220在步驟S350接收關(guān)于每個(gè)段的概括的輸出。然后段合并器部件430將所有的x個(gè)段再次合并回到一起,并且將所概括的輸出呈現(xiàn)給客戶端C的用戶(步驟360)。合并器部件最好將輸出適當(dāng)?shù)剡M(jìn)行格式化。例如,可以將指示概括等級(jí)、發(fā)送消息的時(shí)間幀等的頭部給予每個(gè)段。
雖然在上述實(shí)施方式中,根據(jù)交談抄本中的行數(shù)來產(chǎn)生段,但是本發(fā)明并不限于此。在另一種實(shí)施方式中,對(duì)不同發(fā)言(contribution)的時(shí)間標(biāo)記進(jìn)行分析并且創(chuàng)建對(duì)話的時(shí)間安排(timeline)。然后,將這種時(shí)間安排分為幾個(gè)部分(例如,四個(gè)),表示討論的不同“階段”。
在本實(shí)施方式中,在將每個(gè)消息發(fā)送到參與的客戶端之前由即時(shí)消息服務(wù)器40將其進(jìn)行時(shí)間標(biāo)記。使用服務(wù)器的時(shí)鐘對(duì)即時(shí)消息進(jìn)行時(shí)間標(biāo)記,確保所有消息的時(shí)間標(biāo)記都同步并且不存在分布的時(shí)鐘不符合性。提供規(guī)則來確定在分割對(duì)話時(shí)如何使用時(shí)間標(biāo)記。例如,如果對(duì)話已經(jīng)持續(xù)了30分鐘,則可以將對(duì)話分割為10分鐘的段。
還可以使用其他更加先進(jìn)的方法將對(duì)話更加準(zhǔn)確的分割為“早期”、“中期”、“后期”等階段。例如,可以對(duì)不同人的發(fā)言數(shù)量進(jìn)行分析以搜集關(guān)于對(duì)話結(jié)構(gòu)的進(jìn)一步情況。作為“Jabber”(不是相同名字的更加新近的即時(shí)消息系統(tǒng))項(xiàng)目的一部分,多倫多大學(xué)在該領(lǐng)域已經(jīng)進(jìn)行了工作。該工作涉及對(duì)研討會(huì)、多方電話、討論等的存檔抄本進(jìn)行分析以添加描述元數(shù)據(jù)到其中,從而使得識(shí)別抄本的感興趣部分成為可能。例如,對(duì)涉及的人數(shù)和交互速度(速度可能指示爭(zhēng)論(argument))進(jìn)行分析。該工作還涉及使用對(duì)話類型來確定對(duì)話結(jié)構(gòu)。例如,在多方電話中,前序部分通常涉及各方自我介紹,所以當(dāng)對(duì)電話內(nèi)容進(jìn)行概括時(shí)對(duì)前序部分的興趣小于對(duì)電話的結(jié)束部分。
在本發(fā)明的實(shí)施方式中,還可以根據(jù)對(duì)話結(jié)構(gòu)來確定階段數(shù)量。在該例子實(shí)施方式中,認(rèn)為四個(gè)到六個(gè)階段就足夠了。
不論使用任何方法,不同程度地概括即時(shí)消息接發(fā)對(duì)話的這種機(jī)制允許新參與者能夠快速地跟上之前已經(jīng)進(jìn)行的對(duì)話的速度,而且?guī)椭麄兺耆貐⑴c到在討論中最近已經(jīng)發(fā)生的事情中來。
最好使用其標(biāo)準(zhǔn)API,將隨后的概括經(jīng)由正在使用的合作工具(例如,即時(shí)消息)發(fā)送給新參與者。最好將趕上(catch-up)文字呈現(xiàn)在新參與者的屏幕上的新窗口中,或者在他們要加入的對(duì)話中作為頭幾行出現(xiàn)。
上述討論對(duì)于即時(shí)消息接發(fā)對(duì)話的新加入者或者也許已經(jīng)被臨時(shí)斷開的參與者都特別相關(guān)。但是,已經(jīng)參與即時(shí)消息接發(fā)對(duì)話的客戶端不一定想要看見對(duì)于之前討論的摘要(除非特別請(qǐng)求)。因此提供一種機(jī)制,其中根據(jù)他們最后參與討論的時(shí)間來將摘要提供給用戶。例如,如果他們?cè)谧詈?分鐘內(nèi)或者最后5次交互中發(fā)了言,則不需要概括。但是如果用戶已經(jīng)離開了較長(zhǎng)時(shí)間,則概括可能確實(shí)非常有用。用戶最好可以配置在參與者會(huì)自動(dòng)地接收新摘要之前所應(yīng)該經(jīng)過的交互次數(shù)或者時(shí)間。無論用戶的即時(shí)消息接發(fā)客戶端是否在整個(gè)參與期間保持連接到討論,最好都可以應(yīng)用這些選擇。
將參照?qǐng)D4a和4b來討論本發(fā)明的實(shí)施方式的過程和部件。
在步驟500,C的即時(shí)消息接發(fā)軟件接收關(guān)于C想要參與即時(shí)消息接發(fā)對(duì)話的指示(參與部件600)??梢越?jīng)由相關(guān)的交談窗口獲得對(duì)這種指示的關(guān)注。但是在某些實(shí)施方式中,用戶的交談窗口可以保持受到關(guān)注同時(shí)他們參加會(huì)議或者以其他方式變得注意力分散。因此可能需要用戶主動(dòng)指定他們現(xiàn)在想要參與對(duì)話。例如,可以將按鈕呈現(xiàn)給用戶以選擇他們何時(shí)想要參與。
一旦接收到了指示,則在步驟510確定從用戶最后參與對(duì)話所經(jīng)過的時(shí)間(時(shí)間部件610)。其最好是從用戶最后發(fā)送被監(jiān)測(cè)到并且在該點(diǎn)被使用的消息所經(jīng)過的時(shí)間。
如果所經(jīng)過的時(shí)間少于“y”秒(即,用戶相對(duì)新近參與過),則用戶正常地參與對(duì)話(步驟520、530)。如果在另一方面已經(jīng)經(jīng)過了多于“y”秒,則由抄本概括器部件220來請(qǐng)求和接收(步驟520、540)完整的交談抄本。
由抄本概括器部件220將抄本輸入到概括引擎并且從其接收概括以呈現(xiàn)給用戶(步驟550、560)。
用戶最好能夠配置什么時(shí)候需要摘要(即,“y”)。將這種信息作為用戶喜好620存儲(chǔ)。
再次,用戶可能不想要全部交談抄本的完整摘要。相反地,如上所述,概括等級(jí)可能變化。
如上所述,概括軟件可以位于許多位置的任何一個(gè)處。其可能形成即時(shí)消息軟件自己的一部分,其可以是在橫跨網(wǎng)絡(luò)的某處的獨(dú)立的服務(wù),其可以形成即時(shí)消息接發(fā)服務(wù)器的部分或者與服務(wù)器布置在一起。由于概括軟件可能消耗大量的存儲(chǔ)空間和處理能力,所以最好將其提供為獨(dú)立的服務(wù)。
如上所述,對(duì)于概括處理最好使用非現(xiàn)貨概括引擎。對(duì)于不能處理由即時(shí)消息服務(wù)所提供的對(duì)話類型的任何這種軟件,可以使用參照共同未決的美國(guó)專利申請(qǐng)?zhí)?0/660063(內(nèi)部檔號(hào)GB92002082)所描述的技術(shù)。該專利申請(qǐng)描述了一種機(jī)制,通過該機(jī)制可以將上下文添加到交談抄本以指示其中一個(gè)用戶傳遞信息給另一個(gè)用戶的方式(情緒)。因此將關(guān)于其中敘說某些事情的方式的信息添加到即時(shí)消息抄本(憤怒、大聲地等)。然后可以進(jìn)一步地操控即時(shí)消息抄本以形成連續(xù)文字并且去除任何識(shí)別符/綽號(hào)信息。還可以提供規(guī)則來添加適當(dāng)?shù)臉?biāo)點(diǎn)并且適當(dāng)?shù)亟忉尪绦问降脑~語(例如,u->you,r->are等)。因此下面LucasWhen have you scheduled that meeting for?BharatOh gosh I had forgotten all about it!LucasNever mind-)BharatRight,lets meet at 2pm.
LucasIn the conference roomBharaGood idea.
LucasSee you then.
BharatBye.
可能變成Lucas問“When have you scheduled that meeting for?”。Bharat嚷到“Ohgosh I had forgotten all about it!”。Lucas笑著說“Never mind”。Bharat說“Right,lets meet at 2pm”。Bharat同意“Good idea”。Lucas說“See you then”。Bharat說“Bye”。
可以提供概括服務(wù)中所使用的任何規(guī)則作為即時(shí)消息軟件的一部分,或者有即時(shí)消息接發(fā)服務(wù)器或者概括服務(wù)來提供它們。然后可以由即時(shí)消息接發(fā)客戶端請(qǐng)求這些規(guī)則。
任何交談抄本的分段都不是必須通過即時(shí)消息接發(fā)客戶端來進(jìn)行,而是相反地可以通過概括服務(wù)(由插件)或者通過即時(shí)消息接發(fā)服務(wù)器自己來執(zhí)行。
雖然已經(jīng)從每個(gè)即時(shí)消息客戶端處所存儲(chǔ)的交談抄本的角度描述了本發(fā)明,但是并不必須是這樣。還可以將抄本存儲(chǔ)在即時(shí)消息接發(fā)服務(wù)器處。但是,為了升級(jí)的原因較不推薦這種方案。
最后,雖然已經(jīng)從即時(shí)消息接發(fā)的角度描述了本發(fā)明,但是本發(fā)明并不限于此。可以將本發(fā)明等同地應(yīng)用于諸如電子郵件、博客等之類的文檔、或者諸如線程化的新聞組或者wikis之類的文檔結(jié)構(gòu)。
例如,可以使用本發(fā)明根據(jù)最后打開電子郵件的時(shí)間來概括電子郵件。是否概括電子郵件還可以依賴于其長(zhǎng)度。對(duì)于文字處理文檔也是如此??梢钥紤]在wiki文檔結(jié)構(gòu)中的文檔數(shù)量,或者在wiki結(jié)構(gòu)中的具體文檔的長(zhǎng)度。因此根據(jù)文檔最后被打開的時(shí)間以及其長(zhǎng)度來將概括呈現(xiàn)給用戶。例如,可以概括500個(gè)詞以上的文檔,而將不概括較小的文檔。利用wiki,可以將時(shí)間標(biāo)記過的cookie存儲(chǔ)在用戶的計(jì)算機(jī)上并且用于確定用戶最后訪問wiki的時(shí)間??梢愿鶕?jù)用戶最后訪問新聞組的時(shí)間來概括新聞組討論。例如,用戶可以為進(jìn)行概括而選擇新聞組內(nèi)的特定線程化的討論。然后使用代理從每個(gè)新聞組文章中提取文字,并且在提交文字用于進(jìn)行概括之前對(duì)文字進(jìn)行格式化(例如指示該文章來自誰)。還可以考慮從用戶最后與文檔結(jié)構(gòu)交互起新文章的數(shù)量。
而且可以將文檔的不同部分根據(jù)文字出現(xiàn)的位置而進(jìn)行不同程度的概括。這可以是基于句子的總數(shù)或者期間添加文字的時(shí)間段。在線程化的新聞組討論中,可以根據(jù)特別的回應(yīng)深入到該討論中的程度來對(duì)該討論進(jìn)行不同的概括。在隨機(jī)添加文檔和文檔結(jié)構(gòu)的情況中,改變概括的程度特別有用。換句話說,其中將新情況添加到文檔或者結(jié)構(gòu)的末尾的文檔/文檔結(jié)構(gòu)。例如,這對(duì)于包括巨大數(shù)量的引導(dǎo)至事件的最新近狀態(tài)的歷史文字(以前的電子郵件)的電子郵件非常有用。
應(yīng)該理解所述的各種實(shí)施方式可以彼此結(jié)合使用。
權(quán)利要求
1.一種用于實(shí)現(xiàn)文字概括的方法,包括根據(jù)文字在文檔內(nèi)相對(duì)于其他文字的位置或者在文檔結(jié)構(gòu)中的多個(gè)文檔內(nèi)包含該文字的文檔的位置,來請(qǐng)求對(duì)文檔中該文字的概括。
2.根據(jù)權(quán)利要求1所述的方法,其中,應(yīng)用程序是即時(shí)消息接發(fā)應(yīng)用程序,而文檔是即時(shí)消息接發(fā)對(duì)話抄本。
3.根據(jù)權(quán)利要求2所述的方法,其中,在與即時(shí)消息對(duì)話抄本關(guān)聯(lián)的即時(shí)消息接發(fā)對(duì)話中存在多個(gè)參與者,而且每個(gè)參與者具有對(duì)話抄本的版本,根據(jù)該文字在即時(shí)消息抄本內(nèi)相對(duì)于其他文字的位置在文檔中概括該文字的步驟包括請(qǐng)求對(duì)話抄本的版本。
4.根據(jù)權(quán)利要求3所述的方法,其中,根據(jù)文字在即時(shí)消息抄本內(nèi)相對(duì)于其他文字的位置在文檔中概括該文字的步驟包括如果給出了文字在文檔中的位置,則訪問指示用于請(qǐng)求的概括等級(jí)的規(guī)則。
5.根據(jù)權(quán)利要求4所述的方法,其中,在文檔中較后出現(xiàn)的文字與在文檔中較早出現(xiàn)的文字相比需要較低程度的概括。
6.根據(jù)權(quán)利要求3、4或者5所述的方法包括將即時(shí)消息對(duì)話抄本分段;和在每個(gè)段內(nèi)請(qǐng)求文字概括的不同等級(jí)。
7.根據(jù)權(quán)利要求6所述的方法,包括根據(jù)抄本中的行數(shù)來將即時(shí)消息對(duì)話抄本分段。
8.根據(jù)權(quán)利要求7所述的方法,包括根據(jù)其間創(chuàng)建抄本的時(shí)間段來對(duì)即時(shí)消息對(duì)話抄本分段。
9.根據(jù)權(quán)利要求6、7、或者8所述的方法,包括使用用戶喜好來確定如何對(duì)即時(shí)消息對(duì)話抄本進(jìn)行分段。
10.根據(jù)權(quán)利要求6到9中的任何一項(xiàng)所述的方法,包括接收概括的交談抄本段;和將分段合并到一起以顯示給用戶。
11.根據(jù)權(quán)利要求10所述的方法,其中將分段合并到一起的步驟包括對(duì)段進(jìn)行格式化以指示用于每個(gè)段的概括等級(jí)。
12.一種用于實(shí)現(xiàn)文字概括的方法,包括結(jié)合文檔的版本或者包括該文檔的文檔結(jié)構(gòu)根據(jù)用戶與應(yīng)用程序的交互,請(qǐng)求在該文檔中對(duì)文字的概括。
13.根據(jù)權(quán)利要求12所述的方法,其中應(yīng)用程序是即時(shí)消息接發(fā)應(yīng)用程序,而文檔是即時(shí)消息接發(fā)對(duì)話抄本。
14.根據(jù)權(quán)利要求12或者13所述的方法,其中結(jié)合文檔的版本根據(jù)用戶與應(yīng)用程序的交互來請(qǐng)求對(duì)文檔中的文字進(jìn)行概括的步驟包括根據(jù)在由用戶所發(fā)送的最后消息和用戶希望發(fā)送另一個(gè)即時(shí)消息以在對(duì)話中發(fā)言并因此修改抄本的指示之間的即時(shí)消息接發(fā)對(duì)話抄本所關(guān)聯(lián)的即時(shí)消息接發(fā)對(duì)話中由其他參與者所發(fā)送的即時(shí)消息的數(shù)量,作出是否請(qǐng)求文字概括的決定。
15.根據(jù)權(quán)利要求14的方法,包括接收用戶想要發(fā)送即時(shí)消息的指示。
16.根據(jù)權(quán)利要求12所述的方法,其中,結(jié)合文檔的版本或者包括該文檔的文檔結(jié)構(gòu)根據(jù)用戶與應(yīng)用程序的交互來請(qǐng)求對(duì)文檔中的文字進(jìn)行概括的步驟包括根據(jù)用戶最后訪問文檔的版本或者文檔結(jié)構(gòu)的時(shí)間來確定是否請(qǐng)求概括。
17.根據(jù)權(quán)利要求16所述的方法,包括使用文檔的長(zhǎng)度來確定是否請(qǐng)求概括。
18.根據(jù)權(quán)利要求16所述的方法,包括使用與在用戶最后與文檔結(jié)構(gòu)交互時(shí)所存在的文檔數(shù)量相對(duì)的文檔結(jié)構(gòu)中的文檔數(shù)量來確定是否請(qǐng)求概括。
19.一種用于實(shí)現(xiàn)文字概括的設(shè)備,包括用于根據(jù)文字在文檔內(nèi)相對(duì)于其他文字的位置,或者根據(jù)在文檔結(jié)構(gòu)中的多個(gè)文檔內(nèi)包含該文字的文檔的位置,請(qǐng)求概括該文檔中的文字的裝置。
20.根據(jù)權(quán)利要求19所述的設(shè)備,其中應(yīng)用程序是即時(shí)消息接發(fā)應(yīng)用程序,而文檔是即時(shí)消息接發(fā)對(duì)話抄本。
21.根據(jù)權(quán)利要求20所述的設(shè)備,其中,在與即時(shí)消息接發(fā)對(duì)話抄本關(guān)聯(lián)的即時(shí)消息接發(fā)對(duì)話中存在多個(gè)參與者,而且每個(gè)參與者具有對(duì)話抄本的版本,其中用于根據(jù)文字在即時(shí)消息抄本內(nèi)相對(duì)于其他文字的位置在文檔中概括該文字的裝置包括用于請(qǐng)求對(duì)話抄本的版本的裝置。
22.根據(jù)權(quán)利要求21所述的設(shè)備,其中根據(jù)文字在即時(shí)消息抄本內(nèi)相對(duì)于其他文字的位置在文檔中概括該文字的裝置包括用于在給出了文檔中的文字位置的情況下訪問指示用于請(qǐng)求的概括等級(jí)的規(guī)則的裝置。
23.根據(jù)權(quán)利要求22所述的設(shè)備,其中在文檔中較后出現(xiàn)的文字與在文檔中較早出現(xiàn)的文字相比需要較低程度的概括。
24.根據(jù)權(quán)利要求21、22或者23所述的設(shè)備包括用于將即時(shí)消息接發(fā)對(duì)話抄本分段的裝置;和用于在請(qǐng)求每個(gè)段內(nèi)的文字概括的不同等級(jí)的裝置。
25.根據(jù)權(quán)利要求24所述的設(shè)備包括用于根據(jù)抄本中的行數(shù)來將即時(shí)消息對(duì)話抄本分段的裝置。
26.根據(jù)權(quán)利要求25所述的設(shè)備包括用于根據(jù)其間創(chuàng)建抄本的時(shí)間段來對(duì)即時(shí)消息對(duì)話抄本分段的裝置。
27.根據(jù)權(quán)利要求24、25或者26所述的設(shè)備包括用于使用用戶喜好來確定如何對(duì)即時(shí)消息對(duì)話抄本進(jìn)行分段的裝置。
28.根據(jù)權(quán)利要求24到27中的任何一項(xiàng)所述的設(shè)備,包括用于接收經(jīng)概括的交談抄本段的裝置;和用于將各分段合并到一起以顯示給用戶的裝置。
29.根據(jù)權(quán)利要求28所述的設(shè)備,其中,用于將各分段合并到一起的裝置包括用于對(duì)段進(jìn)行格式化以指示用于每個(gè)段的概括等級(jí)的裝置。
30.一種用于實(shí)現(xiàn)文字概括的設(shè)備,包括用于結(jié)合文檔的版本或者包括該文檔的文檔結(jié)構(gòu)根據(jù)用戶與應(yīng)用程序的交互,請(qǐng)求在該文檔中對(duì)文字的概括的裝置。
31.根據(jù)權(quán)利要求30所述的裝置,其中應(yīng)用程序是即時(shí)消息接發(fā)應(yīng)用程序,而文檔是即時(shí)消息對(duì)話抄本。
32.根據(jù)權(quán)利要求30或者31所述的設(shè)備,其中用于結(jié)合文檔的版本根據(jù)用戶與應(yīng)用程序的交互來請(qǐng)求對(duì)文檔中的文字進(jìn)行概括的裝置包括用于根據(jù)在由用戶所發(fā)送的最后消息和用戶希望發(fā)送另一個(gè)即時(shí)消息以在對(duì)話中發(fā)言并因此修改抄本的指示之間的即時(shí)消息接發(fā)對(duì)話抄本所關(guān)聯(lián)的即時(shí)消息接發(fā)對(duì)話中,由其他參與者所發(fā)送的即時(shí)消息的數(shù)量,作出是否請(qǐng)求文字概括的決定的裝置。
33.根據(jù)權(quán)利要求32的設(shè)備,包括用于接收用戶想要發(fā)送即時(shí)消息的指示的裝置。
34.根據(jù)權(quán)利要求30所述的設(shè)備,其中用于結(jié)合文檔的版本或者包括該文檔的文檔結(jié)構(gòu)根據(jù)用戶與應(yīng)用程序的交互來請(qǐng)求對(duì)文檔中的文字進(jìn)行概括的裝置包括用于根據(jù)用戶最后訪問文檔的版本或者文檔結(jié)構(gòu)來確定是否請(qǐng)求概括的裝置。
35.根據(jù)權(quán)利要求34所述的設(shè)備,包括用于使用文檔的長(zhǎng)度來確定是否請(qǐng)求概括的裝置。
36.根據(jù)權(quán)利要求34所述的設(shè)備,包括用于使用在用戶最后與該文檔結(jié)構(gòu)交互時(shí)所存在的文檔數(shù)量相對(duì)的文檔結(jié)構(gòu)中的文檔數(shù)量來確定是否請(qǐng)求概括的裝置。
全文摘要
公開了用于實(shí)現(xiàn)文字概括的方法和設(shè)備??梢愿鶕?jù)文字在文檔內(nèi)相對(duì)于其他文字的位置或者根據(jù)在文檔結(jié)構(gòu)中的多個(gè)文檔內(nèi)包含文字的文檔的位置,來請(qǐng)求對(duì)文檔中的文字進(jìn)行概括。還可以結(jié)合文檔的版本或者結(jié)合包括該文檔的文檔結(jié)構(gòu)根據(jù)用戶與應(yīng)用程序的交互來請(qǐng)求對(duì)文檔中的文字的概括。
文檔編號(hào)H04L12/58GK1971551SQ20061012166
公開日2007年5月30日 申請(qǐng)日期2006年8月28日 優(yōu)先權(quán)日2005年11月24日
發(fā)明者盧卡斯·W·帕特里奇, 馬丁·J·蓋爾, 馬克·S·卡特, 安德魯·J·斯坦福-克拉克, 巴拉特·V·貝迪 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司