亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于體裁的多維信息檢索系統(tǒng)的制作方法_2

文檔序號:8339703閱讀:來源:國知局
用戶名、任務名、體裁名、時間>。
[0029]本發(fā)明與現(xiàn)有技術(shù)相比具有如下有益效果:
[0030](I)本發(fā)明創(chuàng)新設(shè)計了一種基于體裁的多維信息檢索系統(tǒng),通過采集用戶在桌面完成的各種任務過程中的事件信息和用戶查詢歷史信息,從而獲取用戶查詢意圖,建立用戶體裁查詢表示,從而顯著提高用戶查詢精度,使得用戶可以快速得到查詢結(jié)果,省去對不相關(guān)查詢信息的篩選,節(jié)省用戶信息檢索時間,提高效率,改善用戶查詢體驗;
[0031](2)本發(fā)明把語言學體裁的概念用到信息空間,建立信息空間體裁向量的概念,用向量的方式來表示體裁,從文本內(nèi)容之外的維度來精確用戶查詢目標的匹配;
[0032](3)本發(fā)明構(gòu)造獨立于搜索引擎的任務監(jiān)視器,實現(xiàn)用戶任務上下文層次的信息采集和處理。其原理和方法既可以用于信息檢索,也可以在廣告推薦等領(lǐng)域得到實用化;
[0033](4)本發(fā)明對任務分析引擎中的用戶任務體裁分析器進行創(chuàng)新優(yōu)化設(shè)計,實現(xiàn)用戶任務的體裁形式表示,通過體裁形式表示可以更精確的獲取用戶的查詢意圖,使得查詢準確度更高;
[0034](5)本發(fā)明構(gòu)造一種適合于商業(yè)信息檢索系統(tǒng)的獨立的用戶任務體裁分析器;月艮務器基于主流SOA架構(gòu)和主體(Agent)基礎(chǔ)開發(fā),可以方便各主流搜索引擎系統(tǒng)調(diào)用;
[0035](6)本發(fā)明的軟件模塊運行于應用層,易于用戶操作,并且能根據(jù)用戶的需求進行靈活的配置,增加或者刪除一些功能模塊。
【附圖說明】
[0036]圖1為本發(fā)明多維信息檢索系統(tǒng)結(jié)構(gòu)示意圖;
[0037]圖2為本發(fā)明任務監(jiān)視器功能示意圖;
[0038]圖3為本發(fā)明用戶任務體裁分析器功能示意圖。
【具體實施方式】
[0039]下面結(jié)合附圖和具體實施例對本發(fā)明進一步詳細的描述:
[0040]如圖1所示為本發(fā)明多維信息檢索系統(tǒng)結(jié)構(gòu)示意圖,本發(fā)明多維信息檢索系統(tǒng)結(jié)構(gòu)包括客戶端和搜索引擎,搜索引擎包括任務分析引擎和索引匹配引擎。其中客戶端包括任務監(jiān)視器、用戶任務分析模塊和用戶接口模塊,任務分析引擎包括體裁數(shù)據(jù)庫、用戶任務體裁分析器和用戶任務日志數(shù)據(jù)庫。索引匹配引擎包括爬蟲模塊、原始數(shù)據(jù)庫、索引模塊、內(nèi)容-體裁索引庫、匹配模塊和查詢接口??蛻舳酥饕獙τ脩舢斍昂蜌v史任務進行監(jiān)控和分析,與用戶任務分析器一起識別興趣文檔體裁。搜索引擎主要對文檔-體裁進行多維相關(guān)性匹配,返回用戶感興趣的文檔。
[0041]本發(fā)明中的體裁定義為:對資源或信息按照功能、形式、目的進行的分類。例如“電影”可以分為四十多種不同的體裁,包括懸疑、科幻、戰(zhàn)爭、動畫等;再例如“蘋果”的體裁包括水果、電子產(chǎn)品、服裝等等。
[0042]如圖2所示為本發(fā)明任務監(jiān)視器功能示意圖,任務監(jiān)視器實時采集用戶在桌面完成的各種任務過程中的事件信息,并將事件信息傳送給用戶任務分析模塊。由圖可知任務監(jiān)視器包括事件攔截器、窗口切換歷史分析器與標題語義分析器;其中:事件攔截器為任務監(jiān)視器的中樞,對窗口事件進行攔截,得到編碼信息,對編碼信息進行分類處理,并傳送給用戶任務分析模塊,具體分類處理方法為:如果窗口事件數(shù)量超過設(shè)定閾值,則交由標題語義分析器進行語義分析,并把所述窗口事件分配到對應的任務類中;若窗口事件數(shù)量小于設(shè)定閾值,則交由窗口切換歷史分析器處理,處理方法為在不同窗口之間切換次數(shù)超過設(shè)定閾值的不同窗口事件屬于同一類事件,分到相應的任務類中。
[0043]用戶接口模塊將用戶查詢歷史信息實時發(fā)送給用戶任務分析模塊;當接收到用戶輸入的查詢請求時,將查詢請求同時發(fā)送給索引匹配引擎和用戶任務分析模塊;并從索引匹配引擎接收最終查詢結(jié)果返回給用戶。
[0044]用戶任務分析模塊實時接收任務監(jiān)視器輸出的所述事件信息和用戶接口模塊輸出的用戶查詢歷史信息,發(fā)送給用戶任務體裁分析器;當用戶輸入查詢請求時,接收用戶接口模塊輸出的查詢請求,并發(fā)送給用戶任務體裁分析器。
[0045]體裁數(shù)據(jù)庫用于存儲各種體裁分類的集合,例如,文章體裁包括:記敘文、說明文、議論文、應用文,詩歌、散文、小說、戲劇等;音樂體裁包括:交響樂、奏鳴曲、頌歌、浪漫曲、
歌曲等。
[0046]如圖3所示為本發(fā)明用戶任務體裁分析器功能示意圖,由圖可知用戶任務體裁分析器包括用戶任務消息接口,用戶任務體裁分析引擎,用戶任務體裁生成器和任務體裁標注模塊,其中:
[0047]用戶任務消息接口實時接收任務監(jiān)視器輸出的用戶在桌面完成的各種任務過程中的事件信息和用戶接口模塊輸出的用戶查詢歷史信息,以及從用戶任務分析模塊接收查詢請求,發(fā)送給用戶任務體裁分析引擎。
[0048]用戶任務體裁分析引擎對接收到的信息進行判斷,若為實時接收的任務監(jiān)視器輸出的用戶在桌面完成的各種任務過程中的事件信息和用戶接口模塊輸出的用戶查詢歷史信息,則發(fā)送給任務體裁標注模塊;若為從用戶任務分析模塊接收到的查詢請求,則發(fā)送給用戶任務體裁生成器;并從用戶任務體裁生成器接收以體裁形式表示的用戶查詢請求,發(fā)送給索引匹配引擎。
[0049]任務體裁標注模塊從用戶任務體裁分析引擎接收該事件信息和該用戶查詢歷史信息,查詢體裁數(shù)據(jù)庫,將事件信息和用戶查詢歷史信息按照體裁分類進行體裁標注并存儲到用戶任務日志數(shù)據(jù)庫。
[0050]用戶任務體裁生成器從用戶任務體裁分析引擎接收查詢請求,從用戶任務日志數(shù)據(jù)庫中獲取該查詢請求的用戶的任務日志信息,生成以體裁形式表示的該用戶的查詢請求,并返回給用戶任務分析引擎。
[0051]用戶任務日志數(shù)據(jù)庫用于存儲體裁標注后的事件信息和用戶查詢歷史信息,存儲內(nèi)容包括用戶名、任務名、體裁類型和時間,存儲的信息形式為:〈用戶名、任務名、體裁名、時間>。
[0052]如圖1所示,索引匹配引擎包括爬蟲模塊、原始數(shù)據(jù)庫、索引模塊、內(nèi)容-體裁索引庫、匹配模塊和查詢接口,其中:
[0053]爬蟲模塊實時從互聯(lián)網(wǎng)抓取原始數(shù)據(jù)并保存到原始數(shù)據(jù)庫。
[0054]原始數(shù)據(jù)庫保存爬蟲模塊從互聯(lián)網(wǎng)抓取的原始數(shù)據(jù)。
[0055]索引模塊對抓取的原始數(shù)據(jù)建立內(nèi)容-體裁索引,即原始數(shù)據(jù)的內(nèi)容索引和體裁索引,并將內(nèi)容-體裁索引保存到內(nèi)容體裁索引庫。
[0056]內(nèi)容體裁索引庫用于存儲原始數(shù)據(jù)的內(nèi)容-體裁索引。
[0057]匹配模塊從查詢接口接收用戶查詢請求,將用戶查詢請求與建立的內(nèi)容索引作匹配,得到初始查詢結(jié)果;之后從用戶任務體裁分析器接收以體裁形式表示的查詢請求,將初始查詢結(jié)果根據(jù)該以體裁形式表示的查詢請求、以及建立的體裁索引作二次匹配,得到最終的用戶查詢結(jié)果,返回給查詢接口。
[0058]查詢接口將從用戶接口模塊接收的查詢請求發(fā)送給匹配模塊,并將匹配模塊接收的用戶查詢結(jié)果返回給用戶接口模塊。
[0059]本發(fā)明多維信息檢索方法,具體實現(xiàn)步驟如下:
[0060]步驟(一)、任務監(jiān)視器實時采集用戶在桌面完成的各種任務過程中的事件信息,并將事件信息傳送給用戶任務分析模塊;用戶接口模塊將用戶查詢歷史信息實時發(fā)送給用戶任務分析模塊。
[0061]步驟(二)、用戶任務分析模塊將事件信息與用戶查詢歷史信息實時發(fā)送給用戶任務體裁分析器。
[0062]步驟(三)、用戶任務體裁分析器實時接收該事件信息和用戶查詢歷史信息,同時查詢體裁數(shù)據(jù)庫,將該事件信息和用戶查詢歷史信息按照體裁分類進行體裁標注并存儲到用戶任務日志數(shù)據(jù)庫,體裁數(shù)據(jù)庫為存儲各種體裁分類的集合。
[0063]步驟(四)、索引匹配引擎實時從互聯(lián)網(wǎng)抓取原始數(shù)據(jù)并保存,對原始數(shù)據(jù)建立內(nèi)容-體裁索引,內(nèi)容體裁索引庫即對原始數(shù)據(jù)同時建立內(nèi)容索引和體裁索引,并存儲到內(nèi)容體裁索引庫。
[0064]步驟(五)、當用戶輸入查詢請求時,用戶接口模塊將接收到的查詢請求同時發(fā)送給索引匹配引擎的查詢接口和用戶任務分析模塊;
[0065]步驟(六)、用戶任務分析模塊將接收的查詢請求發(fā)送給用戶任務體裁分析器,用戶任務體裁分析器根據(jù)用戶任務日志數(shù)據(jù)庫得到該查詢請求的體裁形式表示并發(fā)送給索引匹配引擎的匹配模塊。
[0066]步驟(七)匹配模塊將從查詢接口接收到的用戶查詢請求與內(nèi)容體裁索引庫中的內(nèi)容索引作匹配,得到初始查詢結(jié)果;同時從用戶任務體裁分析器接收以體裁形式表示的查詢請求,將初始查詢結(jié)果根據(jù)該以體裁形式表示的查詢請求,以及內(nèi)容體裁索引庫中的體裁索引作二次匹配,得到最
當前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1