信息處理方法、系統(tǒng)和裝置的制造方法
【專利摘要】本申請(qǐng)涉及信息處理方法、系統(tǒng)和裝置,并具體提供了一種方法,其中知識(shí)管理器生成包括安全注釋令牌和術(shù)語(yǔ)令牌的知識(shí)結(jié)構(gòu)。安全注釋令牌中的每一個(gè)被存儲(chǔ)在并行字段中,并對(duì)齊到術(shù)語(yǔ)令牌中的至少一個(gè)。知識(shí)管理器將對(duì)應(yīng)于搜索請(qǐng)求的安全策略與安全注釋令牌中的一個(gè)或多個(gè)進(jìn)行匹配,并進(jìn)而基于對(duì)齊到所匹配的安全注釋令牌的術(shù)語(yǔ)令牌中的一個(gè)或多個(gè)術(shù)語(yǔ)令牌的模糊化來(lái)生成搜索結(jié)果。
【專利說(shuō)明】
信息處理方法、系統(tǒng)和裝置
【背景技術(shù)】
[0001]文檔安全是描述保護(hù)文檔不被未授權(quán)用戶使用的通用術(shù)語(yǔ)。傳統(tǒng)地,作為防止未授權(quán)的查看的簡(jiǎn)單方法,文檔創(chuàng)建器可以密碼保護(hù)文檔。使用這種傳統(tǒng)的方法,用戶可以鍵入正確的密碼并查看整個(gè)文檔。否則,用戶被禁止查看該文檔的任何部分。
[0002]信息檢索和問(wèn)題應(yīng)答系統(tǒng)從許多源吸取文檔以創(chuàng)建從中獲取結(jié)果的知識(shí)庫(kù)。文檔可以具有取決于知識(shí)庫(kù)的領(lǐng)域的變化的分類(lèi)級(jí)別。例如,公司或軍事知識(shí)庫(kù)可以包括秘密(conf idential)、機(jī)密(secret)和絕密(top secret)文檔。在另一示例中,醫(yī)學(xué)知識(shí)庫(kù)可以包括具有諸如社會(huì)安全號(hào)、保險(xiǎn)信息等的敏感患者信息的醫(yī)學(xué)文檔。
[0003]信息檢索和問(wèn)題應(yīng)答系統(tǒng)對(duì)文檔添加注釋,作為將元數(shù)據(jù)、實(shí)體信息或附加知識(shí)并入搜索以提高信息查全和應(yīng)答精確性的方式。軟件開(kāi)發(fā)者可以使用各種方法來(lái)將注釋鏈接到文檔,諸如通過(guò)將注釋存儲(chǔ)為文檔級(jí)別的元數(shù)據(jù)、將注釋存儲(chǔ)在分開(kāi)的結(jié)構(gòu)化資源中、或者通過(guò)將注釋直接嵌入到文檔中來(lái)修改文檔。
【發(fā)明內(nèi)容】
[0004]根據(jù)本公開(kāi)內(nèi)容的一個(gè)實(shí)施例,提供了這樣一種方法,在該方法中,知識(shí)管理器生成包括安全注釋令牌和術(shù)語(yǔ)令牌的知識(shí)結(jié)構(gòu)。每個(gè)安全注釋令牌被存儲(chǔ)在并行字段中,并與至少一個(gè)術(shù)語(yǔ)令牌對(duì)齊。知識(shí)管理器將對(duì)應(yīng)于搜索請(qǐng)求的安全策略與一個(gè)或多個(gè)安全注釋令牌匹配,并且進(jìn)而基于對(duì)與所匹配的安全注釋令牌對(duì)齊的一個(gè)或多個(gè)術(shù)語(yǔ)令牌的模糊化來(lái)生成搜索結(jié)果。
[0005]前述是概要,并因而必然包含簡(jiǎn)化、概括和對(duì)細(xì)節(jié)的省略;因此,本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,該概要僅是說(shuō)明性的,并且不是旨在以任何方式進(jìn)行限定。僅通過(guò)權(quán)利要求限定的本公開(kāi)內(nèi)容的其它方面、發(fā)明性特征和優(yōu)點(diǎn)將在以下闡述的非限定性詳細(xì)描述中變得清
/H- ο
【附圖說(shuō)明】
[0006]通過(guò)參考附圖,本公開(kāi)內(nèi)容可以被更好地理解,并且其眾多對(duì)象、特征和優(yōu)點(diǎn)對(duì)本領(lǐng)域技術(shù)人員而言變得清楚,其中:
[0007]圖1描繪了計(jì)算機(jī)網(wǎng)絡(luò)中的知識(shí)管理器系統(tǒng)的一個(gè)說(shuō)明性實(shí)施例的示意圖;
[0008]圖2示出了信息處理系統(tǒng),更具體地示出了處理器和公共部件,該信息處理系統(tǒng)是能夠執(zhí)行本文所描述的計(jì)算操作的計(jì)算機(jī)系統(tǒng)的簡(jiǎn)化示例;
[0009]圖3是描繪知識(shí)管理器的示例性圖,該知識(shí)管理器創(chuàng)建包括與術(shù)語(yǔ)令牌對(duì)齊的安全注釋令牌的知識(shí)結(jié)構(gòu),并通過(guò)匹配安全令牌與安全策略來(lái)使用該知識(shí)結(jié)構(gòu)提供精細(xì)粒度的已過(guò)濾結(jié)果;
[0010]圖4是描繪與安全行為子系統(tǒng)對(duì)接以提供對(duì)搜索請(qǐng)求的已過(guò)濾應(yīng)答的查詢子系統(tǒng)的示例性圖;
[0011]圖5是描繪由源文檔預(yù)處理子系統(tǒng)處理的文檔的示例性圖;
[0012]圖6是描繪知識(shí)管理器從已預(yù)處理的文檔生成的知識(shí)結(jié)構(gòu)的示例性圖;
[0013]圖7是描繪提供對(duì)搜索請(qǐng)求的特定于術(shù)語(yǔ)的已過(guò)濾應(yīng)答的查詢子系統(tǒng)的示例性圖;
[0014]圖8是描繪包括敏感患者信息的醫(yī)學(xué)文檔的示例性圖;
[0015]圖9是描繪基于請(qǐng)求者的信用的患者文檔的各種視圖的示例性圖;
[0016]圖10是描繪由知識(shí)管理器采取以在文檔吸取期間將安全注釋令牌添加到并行字段中并生成可搜索知識(shí)結(jié)構(gòu)的步驟的示例性流程圖;
[0017]圖11是顯示由知識(shí)管理器采取以使用原始文本和對(duì)應(yīng)的注釋來(lái)生成知識(shí)結(jié)構(gòu)的步驟的流程圖;和
[0018]圖12是顯示在處理搜索請(qǐng)求并基于文檔的存儲(chǔ)在一組并行字段中的安全注釋令牌來(lái)過(guò)濾該文檔的步驟的示例性流程圖。
【具體實(shí)施方式】
[0019]本文使用的術(shù)語(yǔ)僅是為了描述特定實(shí)施例的目的,并非旨在限制本公開(kāi)內(nèi)容。如本文所使用的,單數(shù)形式的“一”、“一個(gè)”和“這個(gè)”旨在也包括復(fù)數(shù)形式,除非上下文以其他方式明確指出。將進(jìn)一步理解到,當(dāng)用在本說(shuō)明書(shū)中時(shí),術(shù)語(yǔ)“包括”和/或“包含”規(guī)定所指明的特征、整體、步驟、操作、元件和/或部件的存在,但不排除一個(gè)或多個(gè)其它特征、整體、步驟、操作、元件、部件和/或前述這些的組的存在或添加。
[0020]在下面的權(quán)利要求中的所有單元或步驟加上功能元件的對(duì)應(yīng)結(jié)構(gòu)、材料、行為和等同形式旨在包括用于結(jié)合具體要求保護(hù)的其它受保護(hù)元件來(lái)執(zhí)行功能的任何結(jié)構(gòu)、材料或行為。本公開(kāi)內(nèi)容的說(shuō)明書(shū)是為了說(shuō)明和描述目的給出,而非旨在窮盡或者被限定為所公開(kāi)的形式下的本公開(kāi)內(nèi)容。在不脫離本公開(kāi)內(nèi)容的范圍和精神的情況下,各種修改和變型對(duì)本領(lǐng)域技術(shù)人員而言是清楚的。選擇和描述實(shí)施例是為了最好地解釋本公開(kāi)內(nèi)容的原理和可行的應(yīng)用,以及為了使本領(lǐng)域其他技術(shù)人員能夠理解本公開(kāi)內(nèi)容的具有適合于所構(gòu)想的特定用途的各種修改的各種實(shí)施例。
[0021]本發(fā)明可以是系統(tǒng)、方法和/或計(jì)算機(jī)程序產(chǎn)品。計(jì)算機(jī)程序產(chǎn)品可以包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上載有用于使處理器實(shí)現(xiàn)本發(fā)明的各個(gè)方面的計(jì)算機(jī)可讀程序指令。
[0022]計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是可以保持和存儲(chǔ)由指令執(zhí)行設(shè)備使用的指令的有形設(shè)備。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是一一但不限于一一電存儲(chǔ)設(shè)備、磁存儲(chǔ)設(shè)備、光存儲(chǔ)設(shè)備、電磁存儲(chǔ)設(shè)備、半導(dǎo)體存儲(chǔ)設(shè)備或者上述的任意合適的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:便攜式計(jì)算機(jī)盤(pán)、硬盤(pán)、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可擦式可編程只讀存儲(chǔ)器(EPROM或閃存)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、便攜式壓縮盤(pán)只讀存儲(chǔ)器(CD-ROM)、數(shù)字多功能盤(pán)(DVD)、記憶棒、軟盤(pán)、機(jī)械編碼設(shè)備、例如其上存儲(chǔ)有指令的打孔卡或凹槽內(nèi)凸起結(jié)構(gòu)、以及上述的任意合適的組合。這里所使用的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)不被解釋為瞬時(shí)信號(hào)本身,諸如無(wú)線電波或者其他自由傳播的電磁波、通過(guò)波導(dǎo)或其他傳輸媒介傳播的電磁波(例如,通過(guò)光纖電纜的光脈沖)、或者通過(guò)電線傳輸?shù)碾娦盘?hào)。
[0023]這里所描述的計(jì)算機(jī)可讀程序指令可以從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)下載到各個(gè)計(jì)算/處理設(shè)備,或者通過(guò)網(wǎng)絡(luò)、例如因特網(wǎng)、局域網(wǎng)、廣域網(wǎng)和/或無(wú)線網(wǎng)下載到外部計(jì)算機(jī)或外部存儲(chǔ)設(shè)備。網(wǎng)絡(luò)可以包括銅傳輸電纜、光纖傳輸、無(wú)線傳輸、路由器、防火墻、交換機(jī)、網(wǎng)關(guān)計(jì)算機(jī)和/或邊緣服務(wù)器。每個(gè)計(jì)算/處理設(shè)備中的網(wǎng)絡(luò)適配卡或者網(wǎng)絡(luò)接口從網(wǎng)絡(luò)接收計(jì)算機(jī)可讀程序指令,并轉(zhuǎn)發(fā)該計(jì)算機(jī)可讀程序指令,以供存儲(chǔ)在各個(gè)計(jì)算/處理設(shè)備中的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。
[0024]用于執(zhí)行本發(fā)明操作的計(jì)算機(jī)程序指令可以是匯編指令、指令集架構(gòu)(ISA)指令、機(jī)器指令、機(jī)器相關(guān)指令、微代碼、固件指令、可能的應(yīng)答設(shè)置數(shù)據(jù)、或者以一種或多種編程語(yǔ)言的任意組合編寫(xiě)的源代碼或目標(biāo)代碼,所述編程語(yǔ)言包括面向?qū)ο蟮木幊陶Z(yǔ)言一諸如Smalltalk、C++等,以及常規(guī)的過(guò)程式編程語(yǔ)言一諸如“C”語(yǔ)言或類(lèi)似的編程語(yǔ)言。計(jì)算機(jī)可讀程序指令可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過(guò)任意種類(lèi)的網(wǎng)絡(luò)一包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)—連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng)連接)。在一些實(shí)施例中,通過(guò)利用計(jì)算機(jī)可讀程序指令的可能的應(yīng)答信息來(lái)個(gè)性化定制電子電路,例如可編程邏輯電路、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)或可編程邏輯陣列(PLA),該電子電路可以執(zhí)行計(jì)算機(jī)可讀程序指令,從而實(shí)現(xiàn)本發(fā)明的各個(gè)方面。
[0025]這里參照根據(jù)本發(fā)明實(shí)施例的方法、裝置(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或框圖描述了本發(fā)明的各個(gè)方面。應(yīng)當(dāng)理解,流程圖和/或框圖的每個(gè)方框以及流程圖和/或框圖中各方框的組合,都可以由計(jì)算機(jī)可讀程序指令實(shí)現(xiàn)。
[0026]這些計(jì)算機(jī)可讀程序指令可以提供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機(jī)器,使得這些指令在通過(guò)計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器執(zhí)行時(shí),產(chǎn)生了實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的裝置。也可以把這些計(jì)算機(jī)可讀程序指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,這些指令使得計(jì)算機(jī)、可編程數(shù)據(jù)處理裝置和/或其他設(shè)備以特定方式工作,從而,存儲(chǔ)有指令的計(jì)算機(jī)可讀介質(zhì)則包括一個(gè)制造品,其包括實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的各個(gè)方面的指令。
[0027]也可以把計(jì)算機(jī)可讀程序指令加載到計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備上,使得在計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置或其它設(shè)備上執(zhí)行一系列操作步驟,以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的過(guò)程,從而使得在計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備上執(zhí)行的指令實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作。
[0028]附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個(gè)實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段或指令的一部分,所述模塊、程序段或指令的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。在有些作為替換的實(shí)現(xiàn)中,方框中所注釋的功能也可以以不同于附圖中所注釋的順序發(fā)生。例如,兩個(gè)連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動(dòng)作的專用的基于硬件的系統(tǒng)來(lái)實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。以下詳細(xì)描述將在總體上遵循本公開(kāi)內(nèi)容的如以上所闡述的概要,在必要時(shí)進(jìn)一步解釋和展開(kāi)本公開(kāi)內(nèi)容的各種方面和實(shí)施例的定義。
[0029]圖1描繪了計(jì)算機(jī)網(wǎng)絡(luò)102中的問(wèn)題/應(yīng)答創(chuàng)建(QA)系統(tǒng)100的一個(gè)說(shuō)明性實(shí)施例的示意圖。知識(shí)管理器100可以包括連接到計(jì)算機(jī)網(wǎng)絡(luò)102的計(jì)算設(shè)備104(包括一個(gè)或多個(gè)處理器和一個(gè)或多個(gè)存儲(chǔ)器,并且潛在包括本領(lǐng)域一般已知的任何其它計(jì)算設(shè)備元件,包括總線、存儲(chǔ)設(shè)備、通信接口等)。網(wǎng)絡(luò)102可以包括經(jīng)由一個(gè)或多個(gè)有線和/或無(wú)線數(shù)據(jù)通信鏈路相互通信以及與其它設(shè)備或部件通信的多個(gè)計(jì)算設(shè)備104,其中每個(gè)通信鏈路包括導(dǎo)線、路由器、開(kāi)關(guān)、發(fā)射器、接收器等中的一個(gè)或多個(gè)。知識(shí)管理器100和網(wǎng)絡(luò)102可以為一個(gè)或多個(gè)內(nèi)容用戶啟用問(wèn)題/應(yīng)答(QA)生成功能。知識(shí)管理器100的其它實(shí)施例可以與本文所描繪的那些部件、系統(tǒng)、子系統(tǒng)和/或設(shè)備之外的部件、系統(tǒng)、子系統(tǒng)和/或設(shè)備一起被使用。
[0030]知識(shí)管理器100可以被配置為從各種源接收輸入。例如,知識(shí)管理器100可以從網(wǎng)絡(luò)102、電子文檔106或其它數(shù)據(jù)的語(yǔ)料庫(kù)、內(nèi)容創(chuàng)建器108、內(nèi)容用戶和其它可能的輸入源接收輸入。在一個(gè)實(shí)施例中,到知識(shí)管理器100的輸入中的一些或者全部可以通過(guò)網(wǎng)絡(luò)102被路由。網(wǎng)絡(luò)102上的各種計(jì)算設(shè)備104可以包括用于內(nèi)容創(chuàng)建器和內(nèi)容用戶的訪問(wèn)點(diǎn)。一些計(jì)算設(shè)備104可以包括用于存儲(chǔ)數(shù)據(jù)語(yǔ)料庫(kù)的數(shù)據(jù)庫(kù)的設(shè)備。在各種實(shí)施例中,網(wǎng)絡(luò)102可以包括本地網(wǎng)絡(luò)連接和遠(yuǎn)程連接,使得知識(shí)管理器100可以在包括本地和全局(例如因特網(wǎng))的任何尺寸的環(huán)境中操作。此外,知識(shí)管理器100充當(dāng)前端系統(tǒng),該前端系統(tǒng)能夠使得從文檔、網(wǎng)絡(luò)可訪問(wèn)的源和/或結(jié)構(gòu)化的數(shù)據(jù)源中提取或者在其中被表示的各種知識(shí)可用。以這種方式,一些處理利用知識(shí)填充知識(shí)管理器。知識(shí)管理器還包括接收知識(shí)請(qǐng)求并相應(yīng)地響應(yīng)的輸入接口。
[0031]在一個(gè)實(shí)施例中,內(nèi)容創(chuàng)建器在文檔106中創(chuàng)建內(nèi)容,以供作為具有知識(shí)管理器100的數(shù)據(jù)語(yǔ)料庫(kù)的一部分。文檔106可以包括供在知識(shí)管理器100中使用的任何文件、文本、文章或數(shù)據(jù)源。內(nèi)容用戶可以經(jīng)由網(wǎng)絡(luò)連接或到網(wǎng)絡(luò)102的因特網(wǎng)連接訪問(wèn)知識(shí)管理器100,并且可以向知識(shí)管理器100輸入問(wèn)題,該問(wèn)題可以通過(guò)數(shù)據(jù)語(yǔ)料庫(kù)中的內(nèi)容得到應(yīng)答。如以下進(jìn)一步描述的,當(dāng)處理評(píng)價(jià)文檔的給定部分的語(yǔ)義內(nèi)容時(shí),處理可以使用各種慣例來(lái)從知識(shí)管理器中查詢它。一種慣例是發(fā)送符合語(yǔ)法規(guī)則的問(wèn)題。語(yǔ)義內(nèi)容是基于諸如詞、短語(yǔ)、標(biāo)記和符號(hào)的能指與它們所代表的內(nèi)容、它們的字面意義或內(nèi)涵意義之間的關(guān)系的內(nèi)容。換言之,語(yǔ)義內(nèi)容是諸如通過(guò)使用自然語(yǔ)言(NL)處理來(lái)解釋表達(dá)的內(nèi)容。在一個(gè)實(shí)施例中,處理向知識(shí)管理器發(fā)送符合語(yǔ)法規(guī)則的問(wèn)題(例如,自然語(yǔ)言問(wèn)題等)ο知識(shí)管理器100可以解釋該問(wèn)題,并向內(nèi)容用戶提供包含對(duì)該問(wèn)題的一個(gè)或多個(gè)應(yīng)答的響應(yīng)。在一些實(shí)施例中,知識(shí)管理器100可按應(yīng)答的排序列表向用戶提供響應(yīng)。
[0032]在一些說(shuō)明性實(shí)施例中,知識(shí)管理器100可以是從紐約Armonk的國(guó)際商用機(jī)器公司可得的IBM Watson? QA系統(tǒng),該系統(tǒng)利用下文描述的說(shuō)明性實(shí)施例的機(jī)制進(jìn)行增強(qiáng)。IBMWatson?知識(shí)管理器系統(tǒng)可以接收輸入問(wèn)題,然后它進(jìn)行解析以提取該問(wèn)題的主要特征,然后這些特征進(jìn)而被用來(lái)制定被施加到數(shù)據(jù)語(yǔ)料庫(kù)上的查詢?;趯?duì)數(shù)據(jù)語(yǔ)料庫(kù)施加查詢,通過(guò)遍歷數(shù)據(jù)語(yǔ)料庫(kù)查找數(shù)據(jù)語(yǔ)料庫(kù)的對(duì)于包含對(duì)該輸入問(wèn)題的有價(jià)值的響應(yīng)的具有某些潛力的部分,生成對(duì)該輸入問(wèn)題的一組假設(shè)或者候選應(yīng)答。
[0033]然后,IBMWatson? QA系統(tǒng)對(duì)該輸入問(wèn)題的語(yǔ)言和使用各種論證算法在施加查詢的過(guò)程中找到的數(shù)據(jù)語(yǔ)料庫(kù)的各部分中的每一部分使用的語(yǔ)言執(zhí)行深度分析??赡苡袔装倩蛘呱踔翈浊ХN論證算法被施加,其中每種論證算法執(zhí)行例如比較的不同分析,并生成得分。例如,一些論證算法可以察看輸入問(wèn)題和數(shù)據(jù)語(yǔ)料庫(kù)的已找到部分的語(yǔ)言內(nèi)的術(shù)語(yǔ)和同義詞的匹配。其它論證算法可以察看語(yǔ)言中的時(shí)間或空間特征,而其它算法可以評(píng)價(jià)數(shù)據(jù)語(yǔ)料庫(kù)的部分的源,并評(píng)價(jià)其真實(shí)性。
[0034]根據(jù)各種論證算法得到的得分指示基于該論證算法的特定關(guān)注范圍通過(guò)輸入問(wèn)題推理得到潛在響應(yīng)的程度。然后針對(duì)統(tǒng)計(jì)模型對(duì)每個(gè)結(jié)果得到的得分進(jìn)行加權(quán)。統(tǒng)計(jì)模型捕獲在IBM Watson? QA系統(tǒng)的訓(xùn)練時(shí)段期間論證算法在建立特定領(lǐng)域的兩個(gè)相似片段之間的推理時(shí)執(zhí)行得如何。然后,統(tǒng)計(jì)模型可以用來(lái)概括IBM Watson? QA系統(tǒng)關(guān)于通過(guò)問(wèn)題推理得到潛在響應(yīng)(即候選應(yīng)答)的證據(jù)所具有的置信度水平??梢詫?duì)候選應(yīng)答中的每一個(gè)重復(fù)這一處理,直至IBM Watson? QA系統(tǒng)識(shí)別顯露出顯著強(qiáng)于其它應(yīng)答的候選應(yīng)答,并因此為輸入問(wèn)題生成最終應(yīng)答或者應(yīng)答的排序集合。關(guān)于IBM Watson? QA系統(tǒng)的更多信息可以例如從IBM公司網(wǎng)站、IBM紅皮書(shū)等獲得。例如,關(guān)于IBM Watson? QA系統(tǒng)的信息可以在2011 年IBM developerWorks上Yuan等人的 “Watson and Healthcare” 以及2012年由RobHigh所編寫(xiě)的IBM紅皮書(shū) “The Era of Cognitive Systems: An Inside Look at IBMWatson and How it Works” 中找到。
[0035]能夠利用知識(shí)管理器100的信息處理系統(tǒng)的類(lèi)型的范圍包括從諸如手持計(jì)算機(jī)/移動(dòng)電話110的小型手持設(shè)備到諸如大型計(jì)算機(jī)170的大型機(jī)系統(tǒng)。手持計(jì)算機(jī)110的示例包括個(gè)人數(shù)字助理(PDA)、諸如MP3播放器的個(gè)人娛樂(lè)設(shè)備、便攜式電視和緊湊盤(pán)播放器。信息處理系統(tǒng)的其它示例包括筆式或臺(tái)式計(jì)算機(jī)120、膝上型或筆記本計(jì)算機(jī)130、個(gè)人計(jì)算機(jī)系統(tǒng)150和服務(wù)器160。如所示,各種信息處理系統(tǒng)可以使用計(jì)算機(jī)網(wǎng)絡(luò)100聯(lián)網(wǎng)在一起??捎脕?lái)互連各種信息處理系統(tǒng)的計(jì)算機(jī)網(wǎng)絡(luò)102的類(lèi)型包括局域網(wǎng)(LAN)、無(wú)線局域網(wǎng)(WLAN)、因特網(wǎng)、公共交換電話網(wǎng)(PSTN)、其它無(wú)線網(wǎng)絡(luò)和可用來(lái)互連信息處理系統(tǒng)的任何其它網(wǎng)絡(luò)拓?fù)?。許多信息處理系統(tǒng)包括非易失性數(shù)據(jù)存儲(chǔ)裝置,諸如硬盤(pán)驅(qū)動(dòng)和/或非易失性存儲(chǔ)器。圖1中所示的一些信息處理系統(tǒng)描繪了單獨(dú)的非易失性數(shù)據(jù)存儲(chǔ)裝置(服務(wù)器160利用非易失性數(shù)據(jù)存儲(chǔ)裝置165,并且大型計(jì)算機(jī)170利用非易失性數(shù)據(jù)存儲(chǔ)裝置175)。非易失性數(shù)據(jù)存儲(chǔ)裝置可以是在各種信息處理系統(tǒng)外部的部件,或者可以在信息處理系統(tǒng)之一的內(nèi)部。圖2中示出了顯示示例性處理器和常見(jiàn)地被處理器訪問(wèn)的各種部件的信息處理系統(tǒng)的說(shuō)明性示例。
[0036]圖2示出了信息處理系統(tǒng)200,更具體地,示出了處理器和常見(jiàn)部件,該信息處理系統(tǒng)是能夠執(zhí)行本文描述的計(jì)算操作的計(jì)算機(jī)系統(tǒng)的簡(jiǎn)化示例。信息處理系統(tǒng)200包括耦接到處理器接口總線212的一個(gè)或多個(gè)處理器210。處理器接口總線212將處理器210連接到北橋215,北橋215也被稱為存儲(chǔ)器控制器集線器(MCH)。北橋215連接到系統(tǒng)存儲(chǔ)器220,并提供使處理器210訪問(wèn)系統(tǒng)存儲(chǔ)器的手段。圖形控制器225也連接到北橋215。在一個(gè)實(shí)施例中,PCI高速總線218將北橋215連接到圖形控制器225。圖形控制器225連接到顯示器設(shè)備230,諸如計(jì)算機(jī)監(jiān)視器。
[0037]北橋215和南橋235使用總線219彼此連接。在一個(gè)實(shí)施例中,該總線是直接介質(zhì)接口(DMI)總線,該DMI總線在北橋215和南橋235之間在每個(gè)方向上以高速傳輸數(shù)據(jù)。在另一實(shí)施例中,外圍部件互連(PCI)總線連接北橋和南橋。南橋235(也被稱作1/0控制器集線器(ICH))是一般實(shí)現(xiàn)與由北橋提供的能力相比以更低的速度操作的能力的芯片。南橋235通常提供用來(lái)連接各種部件的各種總線。這些總線包括:例如PCI和PCI高速總線、ISA總線、系統(tǒng)管理總線(SM總線或SMB)、和/或低針計(jì)數(shù)(LPC)總線。LPC總線常常連接低帶寬設(shè)備,諸如引導(dǎo)ROM 296和“傳統(tǒng)”1/0設(shè)備(使用“超級(jí)I/O”芯片)?!皞鹘y(tǒng)”1/0設(shè)備(298)可以包括例如串行和并行端口、鍵盤(pán)、鼠標(biāo)和/或軟盤(pán)控制器。LPC總線還將南橋235連接到可信賴平臺(tái)模塊(TPM) 295。常常包括在南橋235中的其它部件包括直接存儲(chǔ)器訪問(wèn)(DMA)控制器、可編程中斷控制器(PIC)和存儲(chǔ)設(shè)備控制器,該存儲(chǔ)設(shè)備控制器使用總線284將南橋235連接到諸如硬盤(pán)驅(qū)動(dòng)的非易失性存儲(chǔ)設(shè)備285。
[0038]高速卡255是將可熱插拔設(shè)備連接到信息處理系統(tǒng)的插槽。因?yàn)楦咚倏?55使用通用串行總線(USB)和PCI高速總線二者連接到南橋235,所以它支持PCI高速和USB連接性二者。南橋235包括對(duì)連接到USB的設(shè)備提供USB連接性的USB控制器240。這些設(shè)備包括網(wǎng)絡(luò)攝像頭(相機(jī))250、紅外(IR)接收器248、鍵盤(pán)和軌跡板244以及藍(lán)牙設(shè)備246,藍(lán)牙設(shè)備246提供無(wú)線個(gè)域網(wǎng)(PAN) WSB控制器240還向其它雜項(xiàng)USB連接設(shè)備242提供USB連接性,這樣的設(shè)備242諸如鼠標(biāo)、可移除非易失性存儲(chǔ)設(shè)備245、調(diào)制器、網(wǎng)卡、ISDN連接器、傳真機(jī)、打印機(jī)、USB集線器和許多其他類(lèi)型的USB連接設(shè)備。雖然可移除非易失性存儲(chǔ)設(shè)備245被示出為USB連接設(shè)備,可移除非易失性存儲(chǔ)設(shè)備245可以使用諸如火線接口等的不同接口進(jìn)行連接。
[0039]無(wú)線局域網(wǎng)(LAN)設(shè)備275經(jīng)由PCI或PCI高速總線272連接到南橋235 JAN設(shè)備275通常實(shí)現(xiàn)IEEE 802.11標(biāo)準(zhǔn)的空中調(diào)制技術(shù)之一,該IEEE 802.11標(biāo)準(zhǔn)的空中調(diào)制技術(shù)均使用相同的協(xié)議來(lái)在信息處理系統(tǒng)200和另一計(jì)算機(jī)系統(tǒng)或設(shè)備之間進(jìn)行無(wú)線通信。光學(xué)存儲(chǔ)設(shè)備290使用串行ATA(SATA)總線288連接到南橋235。串行ATA適配器和設(shè)備經(jīng)高速串行鏈路進(jìn)行通信。串行ATA總線還將南橋235連接到其他形式的存儲(chǔ)設(shè)備,諸如硬盤(pán)驅(qū)動(dòng)。諸如聲卡的音頻電路260經(jīng)由總線258連接到南橋235。音頻電路260還提供諸如音頻線輸入和光學(xué)數(shù)字音頻輸入端口 262、光學(xué)數(shù)字輸出和頭戴式耳機(jī)插孔264、內(nèi)部揚(yáng)聲器266和內(nèi)部麥克風(fēng)268的功能。以太網(wǎng)控制器270使用諸如PCI或PCI高速總線的總線連接到南橋235。以太網(wǎng)控制器270將信息處理系統(tǒng)200連接到諸如局域網(wǎng)(LAN)、因特網(wǎng)和其它公共或?qū)S糜?jì)算機(jī)網(wǎng)絡(luò)的計(jì)算機(jī)網(wǎng)絡(luò)。
[0040]盡管圖2示出了一種信息處理系統(tǒng),但是信息處理系統(tǒng)可以采取許多形式,在圖1中示出其中的一些。例如,信息處理系統(tǒng)可以采取以下形式:桌面型、服務(wù)器、便攜式、膝上型、筆記本或其它形狀因子的計(jì)算機(jī)或數(shù)據(jù)處理系統(tǒng)。此外,信息處理系統(tǒng)可以采取其它形狀因子,諸如個(gè)人數(shù)字助理(PDA)、游戲設(shè)備、ATM機(jī)、便攜式電話設(shè)備、通信設(shè)備或包括處理器和存儲(chǔ)器的其它設(shè)備。
[0041]圖3-12描繪了可以在信息處理系統(tǒng)上執(zhí)行的方法。信息處理系統(tǒng)從被包括在原始源文檔中的術(shù)語(yǔ)中生成術(shù)語(yǔ)令牌,并基于對(duì)應(yīng)于原始源文檔的安全策略生成安全注釋令牌。信息處理系統(tǒng)生成包括原始文本字段和與原始文本字段對(duì)齊的并行字段的知識(shí)結(jié)構(gòu)。術(shù)語(yǔ)令牌被存儲(chǔ)在原始文本字段中,并且安全注釋令牌被存儲(chǔ)在相應(yīng)的并行字段中。進(jìn)而,信息處理系統(tǒng)提供優(yōu)化且精細(xì)粒度的安全框架,以使用安全注釋令牌保護(hù)文檔部分,同時(shí)提供全術(shù)語(yǔ)分辨力。
[0042]在一個(gè)實(shí)施例中,信息處理系統(tǒng)提供多個(gè)模糊化點(diǎn),諸如在持續(xù)、處理和可視化期間。照此,信息處理系統(tǒng)可以檢索和分析敏感信息,而不打破安全策略。在另一實(shí)施例中,信息處理系統(tǒng)為結(jié)構(gòu)化的、未結(jié)構(gòu)化的或者混合的數(shù)據(jù)實(shí)施例提供精細(xì)粒度的安全框架。
[0043]圖3是描繪知識(shí)管理器的示例性圖,該知識(shí)管理器創(chuàng)建包括與術(shù)語(yǔ)令牌對(duì)齊的安全注釋令牌的知識(shí)結(jié)構(gòu),并通過(guò)將安全令牌與安全策略匹配來(lái)使用該知識(shí)結(jié)構(gòu)提供精細(xì)粒度的已過(guò)濾結(jié)果。圖3顯示了知識(shí)管理器100的各種子系統(tǒng),諸如源文檔預(yù)處理310、安全模型和策略子系統(tǒng)320、知識(shí)結(jié)構(gòu)生成器350和查詢子系統(tǒng)380。本領(lǐng)域技術(shù)人員可以認(rèn)識(shí)到,知識(shí)管理器100可以包括與圖3中所示相比更多、更少或不同的子系統(tǒng)。此外,如本文所討論的,知識(shí)管理器100可以是信息檢索系統(tǒng)、問(wèn)題應(yīng)答系統(tǒng)或者接收請(qǐng)求并為該請(qǐng)求提供結(jié)果的其他類(lèi)型的系統(tǒng)。
[0044]知識(shí)管理器100使用源文檔預(yù)處理310來(lái)將原始源文檔300格式化為可接受的格式。參考圖5,源文檔預(yù)處理310可以基于由安全模型和策略子系統(tǒng)320提供的信息來(lái)添加特定的安全注釋標(biāo)簽520、530和540。特別地,注釋標(biāo)識(shí)符子系統(tǒng)325可以確定在原始源文檔中施加注釋的地點(diǎn)并相應(yīng)地添加并行字段。在一個(gè)實(shí)施例中,基于來(lái)自存儲(chǔ)在安全過(guò)濾器規(guī)則335、字典340和機(jī)器學(xué)習(xí)模型345中的安全策略的信息,知識(shí)管理器100在吸取階段(經(jīng)由源文檔預(yù)處理310)以及在運(yùn)行時(shí)期間(經(jīng)由查詢子系統(tǒng)380)識(shí)別感興趣的注釋(關(guān)系、概念等)O
[0045]知識(shí)管理器100使用知識(shí)結(jié)構(gòu)生成器350來(lái)從被包括在原始源文檔300中的術(shù)語(yǔ)(例如,詞)中生成術(shù)語(yǔ)令牌,并將術(shù)語(yǔ)令牌索引到原始文本字段372中。術(shù)語(yǔ)令牌包括針對(duì)它們對(duì)應(yīng)的術(shù)語(yǔ)的術(shù)語(yǔ)地點(diǎn)信息,諸如跨度和偏移信息(見(jiàn)圖6和對(duì)應(yīng)的文本以獲得進(jìn)一步的細(xì)節(jié))。
[0046]知識(shí)結(jié)構(gòu)生成器350還包括安全解釋子系統(tǒng)355和數(shù)據(jù)吸取子系統(tǒng)360。安全解釋子系統(tǒng)355解釋由源文檔預(yù)處理310生成的安全注釋標(biāo)簽,并識(shí)別在其中存儲(chǔ)對(duì)應(yīng)的安全注釋令牌的并行字段。在一個(gè)實(shí)施例中,安全解釋子系統(tǒng)355將安全注釋標(biāo)簽轉(zhuǎn)換成包括安全級(jí)別和地點(diǎn)的安全注釋令牌。例如,參考圖6,安全注釋令牌670指示從字符偏移40到58的原始文本被分類(lèi)成“TS”(絕密)。
[0047]數(shù)據(jù)吸取子系統(tǒng)360將原始源文檔300中的原始文本字段連同并行字段信息(包括安全注釋令牌)組織成知識(shí)結(jié)構(gòu)370。知識(shí)結(jié)構(gòu)370包括存儲(chǔ)術(shù)語(yǔ)令牌的原始文本字段372和存儲(chǔ)安全注釋令牌的對(duì)應(yīng)并行字段374(見(jiàn)圖6和對(duì)應(yīng)的文本以獲得進(jìn)一步的細(xì)節(jié))。照此,知識(shí)管理器100可以通過(guò)匹配安全策略與存儲(chǔ)在并行字段中的安全注釋令牌來(lái)過(guò)濾來(lái)自原始源文檔300的未更改的原始文本低至詞級(jí)別(見(jiàn)圖6和圖7以及對(duì)應(yīng)的文本以獲得進(jìn)一步的細(xì)節(jié))。在一個(gè)實(shí)施例中,知識(shí)結(jié)構(gòu)生成器350利用特定算法來(lái)將多個(gè)注釋令牌的位置和偏移對(duì)齊到術(shù)語(yǔ)令牌。知識(shí)結(jié)構(gòu)生成器350在知識(shí)庫(kù)106中存儲(chǔ)知識(shí)結(jié)構(gòu)370,以供隨后由(以下討論的)查詢子系統(tǒng)380利用。
[0048]查詢子系統(tǒng)380接收搜索請(qǐng)求392,并確定一組注釋/注釋類(lèi)型和要搜索的一組術(shù)語(yǔ)。安全行為子系統(tǒng)330基于例如用戶的信用向查詢子系統(tǒng)380提供安全過(guò)濾器規(guī)則。在一個(gè)實(shí)施例中,安全行為子系統(tǒng)330是指導(dǎo)查詢子系統(tǒng)380如何處理具有安全注釋的已訪問(wèn)數(shù)據(jù)的抽象運(yùn)行時(shí)控制器。在這個(gè)實(shí)施例中,查詢子系統(tǒng)380可以向安全行為子系統(tǒng)330發(fā)送具有安全注釋的一段數(shù)據(jù)(例如,文檔),并且安全行為子系統(tǒng)330向查詢子系統(tǒng)380返回被允許的行為,諸如是否在主搜索中包括該數(shù)據(jù)段。在另一實(shí)施例中,安全行為子系統(tǒng)330可以根據(jù)安全策略和安全注釋令牌修改文檔,并向查詢子系統(tǒng)380返回經(jīng)修改的文檔以供分析。
[0049]在一個(gè)實(shí)施例中,數(shù)據(jù)處理子系統(tǒng)385對(duì)各種注釋類(lèi)型(實(shí)體、安全等)生成子查詢,并將子查詢聚合在復(fù)合查詢中,該復(fù)合查詢考慮諸如相對(duì)注釋位置、加權(quán)等的一組期望的參數(shù)。在另一實(shí)施例中,每個(gè)子查詢使用特定于注釋的信息,諸如變化的間隔(slop)值(在查詢術(shù)語(yǔ)之間允許的非相關(guān)術(shù)語(yǔ)數(shù)量)、用于每個(gè)并行字段的特定于注釋的提升以及不同的所需或最優(yōu)的術(shù)語(yǔ)。在這個(gè)實(shí)施例中,子查詢?nèi)缓蟊磺短谆蚪M合以形成復(fù)合查詢。
[0050]可視化子系統(tǒng)390與安全行為子系統(tǒng)330交互,以模糊化對(duì)齊到匹配安全策略的安全注釋令牌的特定術(shù)語(yǔ)或短語(yǔ)。例如,醫(yī)生可以訪問(wèn)患者的病史,但是醫(yī)生不“需要知道”患者的保險(xiǎn)信息。照此,可視化子系統(tǒng)390可以遮蓋患者的保險(xiǎn)信息,并提供具有被遮蓋的信息的搜索結(jié)果394(見(jiàn)圖9中的視圖910和對(duì)應(yīng)的文本,以獲得進(jìn)一步的細(xì)節(jié))。
[0051]圖4是描繪與安全行為子系統(tǒng)對(duì)接以提供對(duì)搜索請(qǐng)求的已過(guò)濾應(yīng)答的查詢子系統(tǒng)的示例性圖。查詢子系統(tǒng)380接收搜索請(qǐng)求392,并對(duì)問(wèn)題執(zhí)行問(wèn)題分析400。例如,問(wèn)題分析可以對(duì)請(qǐng)求執(zhí)行自然語(yǔ)言處理,以理解搜索請(qǐng)求392的上下文。
[0052]假設(shè)生成410使用問(wèn)題分析400的成果來(lái)執(zhí)行主搜索412、片段評(píng)分和過(guò)濾414以及候選應(yīng)答生成416。主搜索412,聯(lián)合安全行為子系統(tǒng)330,通過(guò)使用存儲(chǔ)在并行字段中的安全注釋令牌以提供限制可用于搜索的文本部分的“運(yùn)行前”約束能力來(lái)搜索知識(shí)庫(kù)106。例如,如果文檔中的短語(yǔ)被分類(lèi)成絕密,而用戶具有機(jī)密的許可,則主搜索412可以在生成候選應(yīng)答時(shí)從整個(gè)搜索中省略絕密的短語(yǔ)。在另一實(shí)施例中,如果用戶具有適當(dāng)?shù)男庞?,則知識(shí)管理器100可以在主搜索412期間解密已加密的片段或短語(yǔ)。
[0053]片段評(píng)分和過(guò)濾414,聯(lián)合安全行為子系統(tǒng)330,基于評(píng)分限制策略對(duì)用于視作應(yīng)答的源的片段進(jìn)行過(guò)濾和排序。例如,基于由安全行為子系統(tǒng)330提供的、與并行字段中存儲(chǔ)的安全注釋令牌相比較的評(píng)分限制策略,知識(shí)管理器100可能不對(duì)片段或片段的部分進(jìn)行評(píng)分。此外,候選應(yīng)答生成器416可以基于相對(duì)于由安全行為子系統(tǒng)330提供的安全策略的所存儲(chǔ)的安全注釋令牌,去除從未授權(quán)的片段得到的候選應(yīng)答。
[0054]假設(shè)證據(jù)評(píng)分420接收來(lái)自假設(shè)生成410的候選應(yīng)答,并以與以上討論的片段評(píng)分和過(guò)濾414的方式類(lèi)似的方式使用安全行為子系統(tǒng)330執(zhí)行應(yīng)答評(píng)分422。進(jìn)而,查詢子系統(tǒng)380執(zhí)行上下文應(yīng)答評(píng)分424,以基于候選應(yīng)答的上下文內(nèi)容對(duì)候選應(yīng)答進(jìn)行評(píng)分。
[0055]最后的合并和排序430對(duì)候選應(yīng)答進(jìn)行排序,這饋送到支持證據(jù)合并和排序440中。在一個(gè)實(shí)施例中,支持證據(jù)合并和排序440識(shí)別存儲(chǔ)在知識(shí)管理器106中的對(duì)應(yīng)于候選應(yīng)答的實(shí)際片段。照此,在一個(gè)實(shí)施例中,可視化生成450根據(jù)安全行為子系統(tǒng)330提供的可視化授權(quán)安全策略模糊化實(shí)際片段和/或支持證據(jù)的各種術(shù)語(yǔ)、短語(yǔ)等,從而產(chǎn)生搜索結(jié)果394。例如,查詢子系統(tǒng)380可以不改變所顯示的應(yīng)答的排序,而可以用安全警告替換應(yīng)答中的未授權(quán)內(nèi)容,諸如圖7中所示的已過(guò)濾應(yīng)答720。
[0056]圖5是描繪由源文檔預(yù)處理子系統(tǒng)處理的文檔的示例性圖。預(yù)處理文檔500包括來(lái)自原始源文檔300的片段510。在預(yù)處理期間,知識(shí)管理器識(shí)別與片段510對(duì)應(yīng)的安全注釋,并將該安全注釋存儲(chǔ)為以下討論的安全注釋標(biāo)簽520、530和540。
[0057]安全注釋標(biāo)簽520指示整個(gè)片段510被分類(lèi)成“機(jī)密”。例如,知識(shí)管理器可能已經(jīng)識(shí)別了文檔首頁(yè)上的對(duì)應(yīng)源文檔的整體分類(lèi)。安全注釋標(biāo)簽530指示襲擊的時(shí)間和日期的特定細(xì)節(jié)被分類(lèi)成“絕密”。例如,注釋標(biāo)識(shí)符子系統(tǒng)325可以使用安全過(guò)濾器規(guī)則335,安全過(guò)濾器規(guī)則335中的一個(gè)指定時(shí)間和日期應(yīng)當(dāng)被分類(lèi)成比源文檔的整體分類(lèi)更高的一個(gè)安全級(jí)別。類(lèi)似地,安全注釋540指示襲擊的地點(diǎn)的特定細(xì)節(jié)也被分類(lèi)成“絕密”。
[0058]照此,知識(shí)管理器(例如,知識(shí)結(jié)構(gòu)生成器350)分析已預(yù)處理的文檔500,并生成查詢子系統(tǒng)380用來(lái)應(yīng)答請(qǐng)求的知識(shí)結(jié)構(gòu)(圖6所示)。
[0059]圖6是描繪知識(shí)管理器100從已預(yù)處理的文檔500中生成的知識(shí)結(jié)構(gòu)的示例性圖。知識(shí)結(jié)構(gòu)370包括列610、620、630、640、650、660和680。如本領(lǐng)域技術(shù)人員能認(rèn)識(shí)到的,知識(shí)結(jié)構(gòu)370可以具有其它格式,比如數(shù)據(jù)陣列、數(shù)據(jù)庫(kù)或者允許注釋令牌在術(shù)語(yǔ)位置的分辨力上與術(shù)語(yǔ)令牌對(duì)齊的其它類(lèi)型的結(jié)構(gòu)。
[0060]列610包括原始文本的術(shù)語(yǔ)位置的列表。圖6中所示的示例對(duì)應(yīng)于文檔中的第一個(gè)句子。照此,第一術(shù)語(yǔ)“US”位于第一位置處。列620包括原始文本字段372和對(duì)應(yīng)的術(shù)語(yǔ)令牌。每個(gè)術(shù)語(yǔ)令牌包括術(shù)語(yǔ)和指示原始文本流中的術(shù)語(yǔ)地點(diǎn)的字符偏移信息。列630包括指示術(shù)語(yǔ)令牌之間的位置數(shù)量的位置增量的列表。每個(gè)位置增量為“I”,因?yàn)樾g(shù)語(yǔ)令牌被存儲(chǔ)在每個(gè)原始文本字段位置中。
[0061]列640包括存儲(chǔ)具有注釋類(lèi)型“實(shí)體”的注釋令牌并且與列620中它們的對(duì)應(yīng)文本令牌對(duì)齊的一組并行字段。每個(gè)注釋令牌包括注釋和術(shù)語(yǔ)地點(diǎn)信息,該信息如在第一位置中所示,可以覆蓋多于一個(gè)術(shù)語(yǔ)令牌。如在位置I中可以看到的,注釋令牌ORGANIZAT1N與字符偏移3到13對(duì)齊,這包括“Navy”術(shù)語(yǔ)令牌和“Seals”術(shù)語(yǔ)令牌二者。
[0062]列650包括與列640中的注釋令牌對(duì)應(yīng)的位置增量列表,該位置增量指示注釋令牌之間的位置數(shù)量。例如,列650中對(duì)于位置8的位置增量是“3”,因?yàn)門(mén)IME實(shí)體距離ORGANIZAT1N(位置5)有3個(gè)位置。
[0063]列660包括包含安全注釋令牌的并行字段374。安全注釋令牌665對(duì)應(yīng)于圖5中的安全注釋520,該安全注釋令牌665指示字符偏移O至104(整個(gè)片段)被分類(lèi)成“S”或機(jī)密。安全令牌670對(duì)應(yīng)于圖5中的安全注釋530,該安全令牌670指示字符偏移40至58被分類(lèi)成“TS”或絕密。參考列620,字符偏移40至58包括“10AM Monday Feb 16”。
[0064]類(lèi)似地,安全令牌675對(duì)應(yīng)于圖5中的安全注釋540,該安全令牌指示字符偏移89至104被分類(lèi)成“TS”或絕密。參考列620,字符偏移89至104包括“Benghazi,Libya”。列680包括對(duì)應(yīng)于列660中的安全注釋令牌的位置增量的列表,該位置增量類(lèi)似于以上討論的列650,指示安全注釋令牌之間的位置的數(shù)量。
[0065]在一個(gè)實(shí)施例中,知識(shí)結(jié)構(gòu)370可以包括用于其它注釋類(lèi)型的列,諸如概念注釋類(lèi)型(例如,實(shí)體的規(guī)范名稱)、情感注釋類(lèi)型、地理空間坐標(biāo)注釋類(lèi)型、句法關(guān)系結(jié)構(gòu)注釋類(lèi)型(例如,主-賓-謂關(guān)系)和共同引用注釋類(lèi)型(例如,代詞分辨力)。
[0066]圖7是描繪提供對(duì)搜索請(qǐng)求的特定于術(shù)語(yǔ)的已過(guò)濾應(yīng)答的查詢子系統(tǒng)的示例性圖。查詢子系統(tǒng)380接收搜索請(qǐng)求392,并且在識(shí)別候選應(yīng)答和對(duì)候選應(yīng)答評(píng)分之后,查詢子系統(tǒng)380確定片段510對(duì)應(yīng)于候選應(yīng)答。查詢子系統(tǒng)380向安全行為子系統(tǒng)330發(fā)送用戶信用710,該安全行為子系統(tǒng)330返回用于對(duì)應(yīng)用戶的“機(jī)密”許可715。因此,用戶不預(yù)覽片段510內(nèi)具有“絕密”分類(lèi)的短語(yǔ)。照此,并參考圖5,查詢子系統(tǒng)380將兩個(gè)絕密短語(yǔ)過(guò)濾成字符偏移40-58 (時(shí)間和日期)和89-104 (地點(diǎn))。
[0067]進(jìn)而,查詢子系統(tǒng)380生成已過(guò)濾的應(yīng)答720,該應(yīng)答包括片段510的用戶被許可查看的一部分和用安全警告模糊化的文本部分。通過(guò)向用戶提供已過(guò)濾的應(yīng)答720而不是過(guò)濾整個(gè)文檔,用戶知曉包括用戶不被許可查看的更多細(xì)節(jié)信息的文檔是可用的。結(jié)果,用戶可以通知具有絕密許可的上司關(guān)于該文檔,進(jìn)而上司可以提交單獨(dú)的請(qǐng)求并查看片段510的整個(gè)內(nèi)容。
[0068]在一個(gè)實(shí)施例中,查詢子系統(tǒng)380在需要知道的基礎(chǔ)上提供搜索結(jié)果。在這個(gè)實(shí)施例中,如果用戶具有適當(dāng)?shù)脑S可,但沒(méi)有理由知道特定的信息段,則查詢子系統(tǒng)380相應(yīng)地對(duì)應(yīng)答進(jìn)行過(guò)濾。例如,查詢子系統(tǒng)380可以從安全行為子系統(tǒng)330接收安全信息,該安全信息指示發(fā)起請(qǐng)求的用戶的需要知道準(zhǔn)則,比如用戶是否屬于特定的部門(mén)或項(xiàng)目。
[0069]圖8是描繪包括患者的敏感信息的醫(yī)學(xué)文檔的示例性圖。原始片段800包括與患者對(duì)應(yīng)的個(gè)人信息810、醫(yī)學(xué)概況820和病史830。一般地,基于發(fā)起請(qǐng)求的用戶的角色,原始片段800的一部分與該發(fā)起請(qǐng)求的用戶相關(guān)。例如,醫(yī)生需要病史830,但可能不需要一些個(gè)人信息810。反之,計(jì)費(fèi)部門(mén)需要患者的個(gè)人信息,但是可能不必知道病史830。
[0070]照此,知識(shí)管理器100在本文所討論的并行字段中向原始片段800添加安全注釋令牌,以便知識(shí)管理器100向各種請(qǐng)求者提供生成相關(guān)和授權(quán)信息的精細(xì)粒度安全框架。例如,知識(shí)管理器100可能將“計(jì)費(fèi)”安全注釋令牌與患者的社會(huì)安全號(hào)、駕駛員執(zhí)照號(hào)和保險(xiǎn)號(hào)相關(guān)聯(lián),并且可以將“醫(yī)生”安全注釋令牌與患者的病史相關(guān)聯(lián)。進(jìn)而,知識(shí)管理器100基于不同請(qǐng)求者的角色向請(qǐng)求者提供原始片段800的不同視圖(見(jiàn)圖9和對(duì)應(yīng)的文本以獲得更多細(xì)節(jié))。
[0071]圖9是描繪基于請(qǐng)求者的信用的患者文檔的各種視圖的示例性圖。視圖900包括原始片段800的三個(gè)不同視圖,這些視圖各自基于與存儲(chǔ)在相對(duì)于原始片段800中的術(shù)語(yǔ)令牌的并行字段中的安全注釋令牌相比較的請(qǐng)求者的信用。
[0072]主醫(yī)生視圖910包括諸如患者的社會(huì)安全號(hào)、駕駛員執(zhí)照號(hào)和保險(xiǎn)策略信息的模糊化的個(gè)人信息。換言之,對(duì)應(yīng)于患者的社會(huì)安全號(hào)、駕駛員執(zhí)照號(hào)和保險(xiǎn)策略信息的安全注釋令牌指示它們對(duì)應(yīng)的術(shù)語(yǔ)令牌對(duì)醫(yī)生是不可查看的。參考圖4,可視化子系統(tǒng)390可以接收來(lái)自安全行為子系統(tǒng)330的模糊化信息(可視化安全策略)以遮蓋未被授權(quán)用于醫(yī)生視圖的術(shù)語(yǔ)令牌。
[0073]醫(yī)學(xué)研究者視圖920包括對(duì)應(yīng)于發(fā)起請(qǐng)求的用戶是醫(yī)學(xué)研究者的信息。如能夠看到的,醫(yī)學(xué)研究者視圖920省略患者的個(gè)人信息,包括患者的名字。此外,醫(yī)學(xué)研究者視圖920概括各種概要信息,諸如患者“小于50歲”,而不是指明如原始片段800中所示的患者的準(zhǔn)確年齡。此外,醫(yī)學(xué)研究者視圖920將患者的病史的區(qū)段概括到簡(jiǎn)明的段落。在一個(gè)實(shí)施例中,知識(shí)管理器100在吸取期間生成概要文本,并且將概要文本與所吸取的原始片段800包括在一起。然后,基于用戶的許可級(jí)別,知識(shí)管理器100顯示詳細(xì)視圖、概要視圖或者相應(yīng)地遮蓋文本的一些部分。
[0074]計(jì)費(fèi)管理員視圖940包括用于計(jì)費(fèi)目的所需的個(gè)人信息和處理信息。如能夠看到的,計(jì)費(fèi)管理員視圖940不包括醫(yī)生所需的患者病史的全部,而是提供足夠的信息以對(duì)患者和/或患者的保險(xiǎn)公司計(jì)費(fèi)。
[0075]圖10是描繪由知識(shí)管理器采取以在文檔吸取期間將安全注釋令牌添加到并行字段中以生成能夠搜索的知識(shí)結(jié)構(gòu)的步驟的示例性流程圖。處理開(kāi)始于1000,然后,在步驟1010,處理格式化原始源文檔300以供吸取,并相應(yīng)地創(chuàng)建并行字段。
[0076]在步驟1020處,處理基于文檔特性和注釋生成安全注釋標(biāo)簽。在一個(gè)實(shí)施例中,處理識(shí)別原始源文檔300內(nèi)的安全注釋,諸如標(biāo)示在文檔的每頁(yè)的頂部的“機(jī)密”。在另一實(shí)施例中,處理基于安全過(guò)濾器規(guī)則、字典等識(shí)別原始源文檔內(nèi)的安全注釋區(qū)域,諸如識(shí)別被分類(lèi)的文檔內(nèi)的時(shí)間、日期、地點(diǎn)。參考圖5,處理生成與包括片段510的文檔對(duì)應(yīng)的安全注釋標(biāo)簽520、530 和 540。
[0077]在預(yù)定義處理1030處,處理生成包括并行字段中的安全注釋令牌的知識(shí)結(jié)構(gòu)并將知識(shí)結(jié)構(gòu)存儲(chǔ)在知識(shí)庫(kù)106中。例如,參考圖6,處理將安全注釋令牌675添加到位置17的并行字段中,因?yàn)閬?lái)自圖5的安全注釋標(biāo)簽540包括為89的起始偏移,該起始偏移對(duì)應(yīng)于圖6中位置17的起始位置(見(jiàn)圖11和對(duì)應(yīng)的文本以獲得處理細(xì)節(jié))。處理之后圖10結(jié)束于1040。
[0078]圖11是顯示由知識(shí)管理器采取以使用原始文本和對(duì)應(yīng)的注釋來(lái)生成知識(shí)結(jié)構(gòu)的步驟的流程圖。在一個(gè)實(shí)施例中,原始文本是諸如在文檔吸取階段期間從文檔中提取的原始文本流。
[0079]處理開(kāi)始于1100,然后處理將傳入的安全注釋標(biāo)簽連同對(duì)應(yīng)的術(shù)語(yǔ)地點(diǎn)信息(例如跨度和字符偏移)映射到安全注釋令牌中。例如,處理將圖5中的安全注釋標(biāo)簽530映射到圖6中的安全注釋令牌670。
[0080]在步驟1120處,處理在每個(gè)注釋類(lèi)型(例如,安全注釋類(lèi)型)的基礎(chǔ)上將安全注釋令牌包括在未排序的注釋令牌映射中。在步驟1130處,處理從生成自原始源文檔的原始文本流中生成術(shù)語(yǔ)令牌(例如,在圖6的列620中示出的術(shù)語(yǔ)令牌)。在一個(gè)實(shí)施例中,每個(gè)術(shù)語(yǔ)對(duì)應(yīng)于原始文本流中的詞,并且術(shù)語(yǔ)令牌包括對(duì)應(yīng)于術(shù)語(yǔ)在原始文本流內(nèi)的地點(diǎn)的術(shù)語(yǔ)地點(diǎn)信息。在步驟1140處,處理饋送術(shù)語(yǔ)令牌和未排序的安全注釋令牌映射到注釋令牌流生成器中,以生成排序的注釋令牌映射。
[0081]在步驟1150,處理創(chuàng)建包括原始文本字段和用于每個(gè)注釋類(lèi)型的一組并行字段的知識(shí)結(jié)構(gòu)框架,諸如圖6中示出的知識(shí)結(jié)構(gòu)370。在步驟1160處,處理將術(shù)語(yǔ)令牌索引到原始文本字段中,并且在步驟1170處,處理將排序的注釋令牌映射索引到它們各自的并行字段中。照此,并行字段基于術(shù)語(yǔ)地點(diǎn)信息與原始文本字段對(duì)齊,由此為注釋提供用于后處理任務(wù)的術(shù)語(yǔ)位置分辨力,以諸如用于檢索對(duì)應(yīng)于注釋令牌查詢匹配的原始文本。處理之后圖11在1180處返回到調(diào)用例程(圖10)。
[0082]圖12是示出在處理搜索請(qǐng)求和基于文檔的存儲(chǔ)在一組并行字段中的安全注釋令牌來(lái)過(guò)濾文檔時(shí)采取的步驟的示例性流程圖。處理開(kāi)始于1200,然后在步驟1210處,處理接收搜索請(qǐng)求(查詢、問(wèn)題等)并分析來(lái)自安全行為子系統(tǒng)330的相對(duì)于問(wèn)題和用戶授權(quán)的安全策略。在一個(gè)實(shí)施例中,搜索請(qǐng)求可以是這樣的問(wèn)題:知識(shí)管理器使用諸如自然語(yǔ)言處理的技術(shù)來(lái)分析該問(wèn)題以理解該問(wèn)題的上下文和含義。在這個(gè)實(shí)施例中,知識(shí)管理器可以基于問(wèn)題分析的結(jié)果生成搜索請(qǐng)求。
[0083]在1220處,處理利用安全行為子系統(tǒng)檢查用戶授權(quán),諸如安全級(jí)別、需要知道準(zhǔn)則等。在步驟1230處,處理基于搜索限制策略搜索知識(shí)庫(kù)106。在一個(gè)實(shí)施例中,搜索限制策略限制文本(術(shù)語(yǔ)令牌)的可用于對(duì)其進(jìn)行搜索的部分。取決于請(qǐng)求搜索的人的角色,知識(shí)管理器可以使知識(shí)庫(kù)中的片段被省略而不被搜索。參考圖4,主搜索412基于由安全行為子系統(tǒng)330提供的搜索限制策略搜索知識(shí)庫(kù)106。在一個(gè)實(shí)施例中,處理為對(duì)應(yīng)于注釋搜索集合的每個(gè)注釋類(lèi)型創(chuàng)建子查詢,并且為術(shù)語(yǔ)搜索集合創(chuàng)建子查詢。在這個(gè)實(shí)施例中,處理施加期望的集合配置,諸如向特定的注釋、術(shù)語(yǔ)等添加加權(quán),并且可以包括要求注釋令牌在距離彼此的某個(gè)位置偏移內(nèi)的相對(duì)位置要求。進(jìn)而,處理根據(jù)期望的集合配置將子查詢嵌套或聚合到復(fù)合查詢中。
[0084]在步驟1240處,處理部分基于評(píng)分安全策略對(duì)搜索結(jié)果進(jìn)行評(píng)分和過(guò)濾(例如,圖4中示出的片段評(píng)分和過(guò)濾414)。在一個(gè)實(shí)施例中,處理基于評(píng)分安全策略對(duì)知識(shí)庫(kù)中供視作用于應(yīng)答的源的片段進(jìn)行過(guò)濾和排序。
[0085]在步驟1250處,處理基于片段授權(quán)安全策略生成應(yīng)答(例如,圖4中示出的候選應(yīng)答生成器416和應(yīng)答評(píng)分422)。例如,處理可以在繼續(xù)最后的合并和隨后的管線處理步驟之前刪除從未授權(quán)的片段得來(lái)的候選應(yīng)答。
[0086]在步驟1260處,處理基于可視化安全策略顯示應(yīng)答,諸如通過(guò)圖4中示出的可視化生成器450。參考圖9中的視圖940,視圖940對(duì)應(yīng)于需要患者的計(jì)費(fèi)信息但是不需要患者的詳細(xì)病史信息的計(jì)費(fèi)管理員。照此,視圖940向計(jì)費(fèi)管理員提供相關(guān)的計(jì)費(fèi)信息和高級(jí)別的醫(yī)學(xué)信息,但是省略詳細(xì)醫(yī)學(xué)信息。處理之后圖12在1260處結(jié)束。
[0087]雖然已經(jīng)示出和描述了本公開(kāi)內(nèi)容的具體實(shí)施例,但對(duì)本領(lǐng)域技術(shù)人員而言顯然的是,基于本文的教導(dǎo),可以在不脫離本公開(kāi)內(nèi)容和它的更寬的方面的情況下做出改變和修改。因此,隨附權(quán)利要求要將在本公開(kāi)內(nèi)容的真實(shí)精神和范圍內(nèi)的所有這樣的改變和修改包含在它們的范圍內(nèi)。而且,應(yīng)當(dāng)理解,本公開(kāi)內(nèi)容僅由隨附權(quán)利要求限定。本領(lǐng)域技術(shù)人員將理解到,如果引入的權(quán)利要求元件的特定數(shù)量是有意的,那么這種意圖將在權(quán)利要求中明確地記載,并且在沒(méi)有這種記載時(shí)不存在這種限制。作為非限制性的例子,作為理解的輔助,以下隨附權(quán)利要求包含使用引導(dǎo)性短語(yǔ)“至少一個(gè)”和“一個(gè)或多個(gè)”以引入權(quán)利要求元件。但是,使用這樣的短語(yǔ)不應(yīng)當(dāng)被理解成暗示通過(guò)不定冠詞“一”或“一個(gè)”對(duì)權(quán)利要求元件的引入將包含這樣的被引入的權(quán)利要求元件的任何特定的權(quán)利要求限定到僅包含一個(gè)這樣的元件的公開(kāi)內(nèi)容,即使在同樣的權(quán)利要求包括引導(dǎo)性短語(yǔ)“一個(gè)或多個(gè)”或“至少一個(gè)”和諸如“一”或“一個(gè)”的不定冠詞時(shí);同樣情況對(duì)于權(quán)利要求中定冠詞的使用也是成立的。
【主權(quán)項(xiàng)】
1.一種由信息處理系統(tǒng)實(shí)現(xiàn)的方法,所述信息處理系統(tǒng)包括存儲(chǔ)器和處理器,所述方法包括: 創(chuàng)建包括多個(gè)安全注釋令牌和多個(gè)術(shù)語(yǔ)令牌的知識(shí)結(jié)構(gòu),其中所述多個(gè)安全注釋令牌中的每一個(gè)安全注釋令牌被存儲(chǔ)在對(duì)應(yīng)于所述多個(gè)術(shù)語(yǔ)令牌中的至少一個(gè)術(shù)語(yǔ)令牌的多個(gè)并行字段的至少一個(gè)并行字段中; 將對(duì)應(yīng)于搜索請(qǐng)求的一個(gè)或多個(gè)安全策略與所述多個(gè)安全注釋令牌中的一個(gè)或多個(gè)安全注釋令牌進(jìn)行匹配;以及 基于每個(gè)術(shù)語(yǔ)令牌都對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌中的至少一個(gè)安全注釋令牌的所述多個(gè)術(shù)語(yǔ)令牌的子集的模糊化,生成對(duì)所述搜索請(qǐng)求的一個(gè)或多個(gè)應(yīng)答。2.根據(jù)權(quán)利要求1所述的方法,還包括: 確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的搜索限制策略;以及 在知識(shí)庫(kù)的搜索期間,省略所述術(shù)語(yǔ)令牌的子集。3.根據(jù)權(quán)利要求1所述的方法,還包括: 確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的評(píng)分限制策略;以及 在對(duì)與所述一個(gè)或多個(gè)應(yīng)答對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果評(píng)分期間,省略所述術(shù)語(yǔ)令牌的子集。4.根據(jù)權(quán)利要求1所述的方法,還包括: 確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的片段授權(quán)安全策略;以及 基于所述片段授權(quán)安全策略,刪除一個(gè)或多個(gè)候選應(yīng)答。5.根據(jù)權(quán)利要求1所述的方法,還包括: 確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的可視化安全策略;以及 顯示所述一個(gè)或多個(gè)應(yīng)答的遮蓋所述術(shù)語(yǔ)令牌的子集中的一個(gè)或多個(gè)術(shù)語(yǔ)令牌的經(jīng)修改的一個(gè)應(yīng)答。6.根據(jù)權(quán)利要求5所述的方法,還包括: 利用一個(gè)或多個(gè)安全警告消息替換所遮蓋的一個(gè)或多個(gè)術(shù)語(yǔ)令牌。7.根據(jù)權(quán)利要求1所述的方法,其中,在創(chuàng)建所述知識(shí)結(jié)構(gòu)之前,所述方法還包括: 基于文檔的一個(gè)或多個(gè)文檔特性,向所述文檔分配多個(gè)安全注釋標(biāo)簽; 從所述多個(gè)安全注釋標(biāo)簽中生成所述多個(gè)安全注釋令牌;以及 從被包括在所述文檔中的多個(gè)術(shù)語(yǔ)中生成所述多個(gè)術(shù)語(yǔ)令牌。8.—種信息處理系統(tǒng),包括: 一個(gè)或多個(gè)處理器; 耦合到所述處理器中的至少一個(gè)處理器的存儲(chǔ)器;以及 一組計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令被存儲(chǔ)在所述存儲(chǔ)器中并由所述處理器中的至少一個(gè)處理器執(zhí)行以便執(zhí)行以下動(dòng)作: 創(chuàng)建包括多個(gè)安全注釋令牌和多個(gè)術(shù)語(yǔ)令牌的知識(shí)結(jié)構(gòu),其中所述多個(gè)安全注釋令牌中的每一個(gè)安全注釋令牌被存儲(chǔ)在對(duì)應(yīng)于所述多個(gè)術(shù)語(yǔ)令牌中的至少一個(gè)術(shù)語(yǔ)令牌的多個(gè)并行字段的至少一個(gè)并行字段中; 將對(duì)應(yīng)于搜索請(qǐng)求的一個(gè)或多個(gè)安全策略與所述多個(gè)安全注釋令牌中的一個(gè)或多個(gè)安全注釋令牌進(jìn)行匹配;以及 基于每個(gè)術(shù)語(yǔ)令牌都對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌中的至少一個(gè)安全注釋令牌的所述多個(gè)術(shù)語(yǔ)令牌的子集的模糊化,生成對(duì)所述搜索請(qǐng)求的一個(gè)或多個(gè)應(yīng)答。9.根據(jù)權(quán)利要求8所述的信息處理系統(tǒng),其中所述一個(gè)或多個(gè)處理器中的至少一個(gè)處理器執(zhí)行包括以下的附加動(dòng)作: 確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的搜索限制策略;以及 在知識(shí)庫(kù)的搜索期間,省略所述術(shù)語(yǔ)令牌的子集。10.根據(jù)權(quán)利要求8所述的信息處理系統(tǒng),其中所述一個(gè)或多個(gè)處理器中的至少一個(gè)處理器執(zhí)行包括以下的附加動(dòng)作: 確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的評(píng)分限制策略;以及 在對(duì)與所述一個(gè)或多個(gè)應(yīng)答對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果評(píng)分期間,省略所述術(shù)語(yǔ)令牌的子集。11.根據(jù)權(quán)利要求8所述的信息處理系統(tǒng),其中所述一個(gè)或多個(gè)處理器中的至少一個(gè)處理器執(zhí)行包括以下的附加動(dòng)作: 確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的片段授權(quán)安全策略;以及 基于所述片段授權(quán)安全策略,刪除一個(gè)或多個(gè)候選應(yīng)答。12.根據(jù)權(quán)利要求8所述的信息處理系統(tǒng),其中所述一個(gè)或多個(gè)處理器中的至少一個(gè)處理器執(zhí)行包括以下的附加動(dòng)作: 確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的可視化安全策略;以及 顯示所述一個(gè)或多個(gè)應(yīng)答的遮蓋所述術(shù)語(yǔ)令牌的子集中的一個(gè)或多個(gè)術(shù)語(yǔ)令牌的經(jīng)修改的一個(gè)應(yīng)答。13.根據(jù)權(quán)利要求12所述的信息處理系統(tǒng),其中所述一個(gè)或多個(gè)處理器中的至少一個(gè)處理器執(zhí)行包括以下的附加動(dòng)作: 利用一個(gè)或多個(gè)安全警告消息替換所遮蓋的一個(gè)或多個(gè)術(shù)語(yǔ)令牌。14.根據(jù)權(quán)利要求8所述的信息處理系統(tǒng),其中在創(chuàng)建所述知識(shí)結(jié)構(gòu)之前,所述一個(gè)或多個(gè)處理器中的至少一個(gè)處理器執(zhí)行包括以下的附加動(dòng)作: 基于文檔的一個(gè)或多個(gè)文檔特性,向所述文檔分配多個(gè)安全注釋標(biāo)簽; 從所述多個(gè)安全注釋標(biāo)簽中生成所述多個(gè)安全注釋令牌;以及 從被包括在所述文檔中的多個(gè)術(shù)語(yǔ)中生成所述多個(gè)術(shù)語(yǔ)令牌。15.—種信息處理裝置,包括: 用于創(chuàng)建包括多個(gè)安全注釋令牌和多個(gè)術(shù)語(yǔ)令牌的知識(shí)結(jié)構(gòu)的模塊,其中所述多個(gè)安全注釋令牌中的每一個(gè)安全注釋令牌被存儲(chǔ)在對(duì)應(yīng)于所述多個(gè)術(shù)語(yǔ)令牌中的至少一個(gè)術(shù)語(yǔ)令牌的多個(gè)并行字段的至少一個(gè)并行字段中; 用于將對(duì)應(yīng)于搜索請(qǐng)求的一個(gè)或多個(gè)安全策略與所述多個(gè)安全注釋令牌中的一個(gè)或多個(gè)安全注釋令牌進(jìn)行匹配的模塊;以及 用于基于每個(gè)術(shù)語(yǔ)令牌都對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌中的至少一個(gè)安全注釋令牌的所述多個(gè)術(shù)語(yǔ)令牌的子集的模糊化來(lái)生成對(duì)所述搜索請(qǐng)求的一個(gè)或多個(gè)應(yīng)答的t吳塊。16.根據(jù)權(quán)利要求15所述的信息處理裝置,還包括: 用于確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的搜索限制策略的模塊;以及 用于在知識(shí)庫(kù)的搜索期間省略所述術(shù)語(yǔ)令牌的子集的模塊。17.根據(jù)權(quán)利要求15所述的信息處理裝置,還包括: 用于確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的評(píng)分限制策略的模塊;以及 用于在對(duì)與所述一個(gè)或多個(gè)應(yīng)答對(duì)應(yīng)的一個(gè)或多個(gè)搜索結(jié)果評(píng)分期間省略所述術(shù)語(yǔ)令牌的子集的模塊。18.根據(jù)權(quán)利要求15所述的信息處理裝置,還包括: 用于確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的片段授權(quán)安全策略的模塊;以及 用于基于所述片段授權(quán)安全策略來(lái)刪除一個(gè)或多個(gè)候選應(yīng)答的模塊。19.根據(jù)權(quán)利要求15所述的信息處理裝置,還包括: 用于確定所述一個(gè)或多個(gè)安全策略中的至少一個(gè)安全策略是對(duì)應(yīng)于所匹配的一個(gè)或多個(gè)安全注釋令牌的可視化安全策略的模塊;以及 用于顯示所述一個(gè)或多個(gè)應(yīng)答的遮蓋所述術(shù)語(yǔ)令牌的子集中的一個(gè)或多個(gè)術(shù)語(yǔ)令牌的經(jīng)修改的一個(gè)應(yīng)答的模塊。20.根據(jù)權(quán)利要求19所述的信息處理裝置,還包括: 用于利用一個(gè)或多個(gè)安全警告消息替換所遮蓋的一個(gè)或多個(gè)術(shù)語(yǔ)令牌的模塊。21.根據(jù)權(quán)利要求15所述的信息處理裝置,其中在創(chuàng)建所述知識(shí)結(jié)構(gòu)之前,所述信息處理裝置還包括:: 用于基于文檔的一個(gè)或多個(gè)文檔特性來(lái)向所述文檔分配多個(gè)安全注釋標(biāo)簽的模塊; 用于從所述多個(gè)安全注釋標(biāo)簽中生成所述多個(gè)安全注釋令牌的模塊;以及 用于從被包括在所述文檔中的多個(gè)術(shù)語(yǔ)中生成所述多個(gè)術(shù)語(yǔ)令牌的模塊。22.—種由信息處理系統(tǒng)實(shí)現(xiàn)的方法,所述信息處理系統(tǒng)包括存儲(chǔ)器和處理器,所述方法包括: 接收由用戶發(fā)起的搜索請(qǐng)求; 識(shí)別對(duì)應(yīng)于所述用戶的一個(gè)或多個(gè)用戶授權(quán);以及 基于所述一個(gè)或多個(gè)用戶授權(quán),生成所述搜索請(qǐng)求的一個(gè)或多個(gè)應(yīng)答,其中生成所述一個(gè)或多個(gè)應(yīng)答包括: 利用對(duì)應(yīng)于所述一個(gè)或多個(gè)用戶授權(quán)的一個(gè)或多個(gè)搜索限制策略,從搜索知識(shí)結(jié)構(gòu)中創(chuàng)建一個(gè)或多個(gè)初步搜索結(jié)果,其中所述知識(shí)結(jié)構(gòu)包括多個(gè)安全注釋令牌和多個(gè)術(shù)語(yǔ)令牌,所述多個(gè)安全注釋令牌中的每一個(gè)安全注釋令牌被存儲(chǔ)在對(duì)應(yīng)于所述多個(gè)術(shù)語(yǔ)令牌中的至少一個(gè)術(shù)語(yǔ)令牌的多個(gè)并行字段的至少一個(gè)并行字段中; 基于對(duì)應(yīng)于所述一個(gè)或多個(gè)用戶授權(quán)的一個(gè)或多個(gè)評(píng)分安全策略對(duì)所述一個(gè)或多個(gè)初步搜索結(jié)果評(píng)分,結(jié)果產(chǎn)生一個(gè)或多個(gè)已評(píng)分的初步搜索結(jié)果;以及 基于對(duì)應(yīng)于所述一個(gè)或多個(gè)用戶授權(quán)的一個(gè)或多個(gè)片段授權(quán)安全策略,通過(guò)從所述已評(píng)分的初步搜索結(jié)果中除去一個(gè)或多個(gè)片段來(lái)從所述已評(píng)分的初步搜索結(jié)果中生成所述一個(gè)或多個(gè)應(yīng)答。23.根據(jù)權(quán)利要求22所述的方法,還包括: 顯示所述一個(gè)或多個(gè)應(yīng)答中的至少一個(gè)應(yīng)答的已修改版本,其中所述一個(gè)或多個(gè)應(yīng)答的所述已修改版本模糊化其對(duì)應(yīng)的安全注釋令牌與對(duì)應(yīng)于所述一個(gè)或多個(gè)用戶授權(quán)的至少一個(gè)或多個(gè)可視化安全策略匹配的所述多個(gè)術(shù)語(yǔ)令牌中的一個(gè)或多個(gè)術(shù)語(yǔ)令牌。24.一種信息處理系統(tǒng),包括: 一個(gè)或多個(gè)處理器; 耦接到所述處理器中的至少一個(gè)處理器的存儲(chǔ)器;以及 一組計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令被存儲(chǔ)在所述存儲(chǔ)器中并由所述處理器中的至少一個(gè)處理器執(zhí)行以便執(zhí)行以下動(dòng)作: 接收由用戶發(fā)起的搜索請(qǐng)求; 識(shí)別對(duì)應(yīng)于所述用戶的一個(gè)或多個(gè)用戶授權(quán);以及 基于所述一個(gè)或多個(gè)用戶授權(quán),生成所述搜索請(qǐng)求的一個(gè)或多個(gè)應(yīng)答,其中生成所述一個(gè)或多個(gè)應(yīng)答包括: 利用對(duì)應(yīng)于所述一個(gè)或多個(gè)用戶授權(quán)的一個(gè)或多個(gè)搜索限制策略,從搜索知識(shí)結(jié)構(gòu)中創(chuàng)建一個(gè)或多個(gè)初步搜索結(jié)果,其中所述知識(shí)結(jié)構(gòu)包括多個(gè)安全注釋令牌和多個(gè)術(shù)語(yǔ)令牌,所述多個(gè)安全注釋令牌中的每一個(gè)安全注釋令牌被存儲(chǔ)在對(duì)應(yīng)于所述多個(gè)術(shù)語(yǔ)令牌中的至少一個(gè)術(shù)語(yǔ)令牌的多個(gè)并行字段的至少一個(gè)并行字段中; 基于對(duì)應(yīng)于所述一個(gè)或多個(gè)用戶授權(quán)的一個(gè)或多個(gè)評(píng)分安全策略對(duì)所述一個(gè)或多個(gè)初步搜索結(jié)果評(píng)分,結(jié)果產(chǎn)生一個(gè)或多個(gè)已評(píng)分的初步搜索結(jié)果;以及 基于對(duì)應(yīng)于所述一個(gè)或多個(gè)用戶授權(quán)的一個(gè)或多個(gè)片段授權(quán)安全策略,通過(guò)從所述已評(píng)分的初步搜索結(jié)果中除去一個(gè)或多個(gè)片段來(lái)從所述已評(píng)分的初步搜索結(jié)果中生成所述一個(gè)或多個(gè)應(yīng)答。25.根據(jù)權(quán)利要求24所述的信息處理系統(tǒng),其中所述一個(gè)或多個(gè)處理器中的至少一個(gè)處理器執(zhí)行包括以下的附加動(dòng)作: 顯示所述一個(gè)或多個(gè)應(yīng)答中的至少一個(gè)應(yīng)答的已修改版本,其中所述一個(gè)或多個(gè)應(yīng)答的所述已修改版本模糊化其對(duì)應(yīng)的安全注釋令牌與對(duì)應(yīng)于所述一個(gè)或多個(gè)用戶授權(quán)的至少一個(gè)或多個(gè)可視化安全策略匹配的所述多個(gè)術(shù)語(yǔ)令牌中的一個(gè)或多個(gè)術(shù)語(yǔ)令牌。
【文檔編號(hào)】G06F21/62GK106055994SQ201610236028
【公開(kāi)日】2016年10月26日
【申請(qǐng)日】2016年4月15日
【發(fā)明人】B·B·比莫恩, B·M·德布羅尼, O·F·費(fèi)羅蒂, B·J·基萊, C·M·諾拉恩
【申請(qǐng)人】國(guó)際商業(yè)機(jī)器公司