亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

標(biāo)桿智能搜索引擎系統(tǒng)的制作方法

文檔序號(hào):6554966閱讀:552來源:國知局
專利名稱:標(biāo)桿智能搜索引擎系統(tǒng)的制作方法
技術(shù)領(lǐng)域
網(wǎng)絡(luò)技術(shù)的發(fā)展給人類的生活和工作帶來了前所未有的影響,網(wǎng)絡(luò)所蘊(yùn)藏的巨大信息量對(duì)每一個(gè)渴望信息的人來說都是一種不可抗拒的誘惑。搜索引擎的應(yīng)運(yùn)而生為從浩若煙海的網(wǎng)絡(luò)信息中迅速查找有效信息提供了途徑,并成為每一個(gè)上網(wǎng)沖浪者離不開的工具。標(biāo)桿網(wǎng)絡(luò)技術(shù)有限公司研制開發(fā)的“標(biāo)桿智能搜索引擎系統(tǒng)”是實(shí)現(xiàn)海量網(wǎng)絡(luò)信息全行業(yè)、多類型、多載體三維定位,全方位、多途徑、多方式檢索,跨網(wǎng)絡(luò)平臺(tái)作業(yè)和獨(dú)特查詢功能,“準(zhǔn)、全、便、快”地獲得有效信息的最佳搜索引擎系統(tǒng)。
二十世紀(jì)九十年代以來,國內(nèi)許多科研單位、網(wǎng)絡(luò)技術(shù)公司開展了網(wǎng)絡(luò)信息查詢技術(shù)的研究,先后也有一些產(chǎn)品問世,例如,北信易寶公司研制的TRS實(shí)時(shí)信息系統(tǒng),北京金信橋網(wǎng)絡(luò)技術(shù)公司研制的金信橋全文檢索系統(tǒng),北京海文公司研制的科技文獻(xiàn)資料全文檢索軟件等,這些軟件各具特點(diǎn),但我們研制開發(fā)的“標(biāo)桿智能搜索引擎系統(tǒng)”則更具獨(dú)特的創(chuàng)新之處
1、該系統(tǒng)有國家信息產(chǎn)業(yè)部認(rèn)可的標(biāo)桿公司研制開發(fā)的“網(wǎng)絡(luò)信息分類系統(tǒng)”(待批行業(yè)標(biāo)準(zhǔn))及其后續(xù)課題“網(wǎng)絡(luò)信息分類主題一體化系統(tǒng)”和大型詞表庫作為網(wǎng)絡(luò)信息組織和查詢的基礎(chǔ)和支撐,技術(shù)起點(diǎn)較高,難度較大。
2、可從16種信息類型、8種信息載體、135個(gè)行業(yè)(學(xué)科)快速實(shí)現(xiàn)網(wǎng)絡(luò)信息的三維定位。
3、同時(shí)支持目錄式搜索和索引式搜索。用戶可從知識(shí)鏈和產(chǎn)品鏈的主題樹目錄逐層瀏覽,直至找到所需信息;或者通過索引式搜索,在搜索框中輸入主題詞、關(guān)鍵詞或自然語言,都能準(zhǔn)確而無遺漏地找到所需信息。
4、支持超文本、超媒體搜索方式。利用標(biāo)桿公司開發(fā)的“網(wǎng)絡(luò)信息分類主題一體化系統(tǒng)”,以節(jié)點(diǎn)為基本單位,建立節(jié)點(diǎn)間的超鏈連接,將文本信息組織成立體網(wǎng)狀結(jié)構(gòu),使用戶可以從任意節(jié)點(diǎn),以不同的方式、不同的角度,靈活、方便地瀏覽和查詢信息。也可從文本信息中選中主題詞進(jìn)行查詢(不必從查詢框中輸入主題詞、關(guān)鍵詞或自然語言)。
5、同時(shí)支持受控語言和自然語言的檢索方式。該系統(tǒng)可接受主題詞、關(guān)鍵詞或一段檢索要求語言,進(jìn)行分詞并和“網(wǎng)絡(luò)信息分類主題詞表”的主題詞匹配,匹配者進(jìn)行索引式檢索,未匹配者則進(jìn)行單漢字、詞、短語的全文檢索。
6、支持同義詞聯(lián)動(dòng)檢索。系統(tǒng)接受一檢索詞,即去分類主題詞表查找,判斷該詞有無同義詞,若有,則把同義詞聯(lián)動(dòng)起來,進(jìn)行一組同義詞的“或”檢索。
7、支持全文檢索。輸入一個(gè)或若干個(gè)字、詞、句,就可從全文庫中檢索出此字、詞、句的全部記錄。也可對(duì)檢索結(jié)果進(jìn)行二次檢索。
8、支持字段檢索。對(duì)已建立字段索引的字段,它是通過指定字段條件進(jìn)行檢索;對(duì)于字段內(nèi)容取值較少的字段,可通過彈出式菜單選擇字段內(nèi)容,也可通過鍵盤輸入字段的檢索條件。檢索方式可以是完全匹配、前綴匹配、后綴匹配、包含匹配、不包含匹配。
9、支持組合檢索。多個(gè)字段之間可以進(jìn)行“與”、“或”、“非”運(yùn)算,對(duì)檢索結(jié)果進(jìn)行二次檢索。
10、支持定題檢索服務(wù)。該系統(tǒng)為用戶提供特定數(shù)據(jù)庫、特定查詢內(nèi)容的定期檢索功能,為此,系統(tǒng)設(shè)有用戶管理、查詢內(nèi)容管理,并可把查詢結(jié)果按固定格式保存起來。發(fā)明目的標(biāo)桿公司研制開發(fā)“智能搜索引擎系統(tǒng)”的目的,是為政府部門、教育部門、科研單位、企事業(yè)單位和公司等廣大用戶提供互聯(lián)網(wǎng)信息的智能檢索平臺(tái)、強(qiáng)有力的多功能網(wǎng)絡(luò)信息智能檢索工具。該系統(tǒng)可實(shí)現(xiàn)海量網(wǎng)絡(luò)信息在行業(yè)分類、信息類型、信息載體三維空間的存儲(chǔ)和檢索,實(shí)現(xiàn)信息在不同行業(yè)、不同信息類型、不同信息載體之間,以及規(guī)范詞和自由詞之間的超鏈和跳轉(zhuǎn)。從搜索引擎的基本功能而言,一切從對(duì)網(wǎng)絡(luò)信息的準(zhǔn)確定位及提取出發(fā),達(dá)到信息檢索所要求的“準(zhǔn)、全、便、快”的整體目標(biāo)。
此外,該系統(tǒng)包含一個(gè)難得的網(wǎng)絡(luò)信息分類標(biāo)準(zhǔn),還有一個(gè)全行業(yè)的分類主題詞表庫,可提供全行業(yè)、全學(xué)科(19個(gè)門類、135個(gè)行業(yè)、學(xué)科)和知識(shí)與產(chǎn)品的7個(gè)領(lǐng)域(主學(xué)科、基礎(chǔ)學(xué)科、科學(xué)研究、工程、實(shí)物產(chǎn)品、技術(shù)產(chǎn)品、服務(wù)產(chǎn)品)的分類主題編碼表,作為網(wǎng)絡(luò)信息的分類、加工、組織與瀏覽導(dǎo)航的基本支撐。19個(gè)門類、135個(gè)行業(yè)(學(xué)科)的分類名稱與代碼見附件。
(1)檢索功能1)信息類型分類檢索當(dāng)用戶點(diǎn)擊類名或輸入關(guān)鍵詞進(jìn)行查詢時(shí),系統(tǒng)會(huì)根據(jù)用戶的輸入定位到分類系統(tǒng)中的某一個(gè)類目上。通過遞歸操作,找到分類系統(tǒng)的頂級(jí)類目到底級(jí)類目的路徑。記錄這一系列類目名稱,然后返回符合用戶檢索條件的類目,顯示該級(jí)類目的信息集合,并統(tǒng)計(jì)信息條目的數(shù)量。
2)載體類型分類檢索載體類型分類檢索的功能與信息類型分類檢索的功能相同。
3)行業(yè)、學(xué)科分類檢索行業(yè)、學(xué)科分類檢索的功能與信息類型分類檢索的功能相同。
4)特征字段檢索特征字段檢索就是根據(jù)用戶的需求在指定的字段中進(jìn)行查找。
5)參見信息檢索在行業(yè)分類中,有些信息同時(shí)屬于兩種以上的分類,例如“農(nóng)業(yè)經(jīng)濟(jì)”同時(shí)屬于農(nóng)業(yè)類和經(jīng)濟(jì)類,參見類檢索是通過一個(gè)類目跳轉(zhuǎn)到它的參見類去檢索。
6)產(chǎn)業(yè)鏈信息檢索當(dāng)用戶將檢索要求定位到一個(gè)行業(yè)類目時(shí),產(chǎn)業(yè)鏈檢索可以檢索出包含這個(gè)行業(yè)類目及其上游產(chǎn)業(yè)和下游產(chǎn)業(yè)的整個(gè)產(chǎn)業(yè)鏈的信息。
7)主題詞字順檢索利用主題詞字順表進(jìn)行主題詞的前方一致(前綴)檢索。
8)主題詞輪排檢索利用主題詞輪排表,根據(jù)詞素一致的原則在輪排表中查找主題詞的檢索。
9)主題詞詞族排序檢索利用主題詞詞族排序表,進(jìn)行主題詞的后方一致(后綴)檢索。
10)同義詞檢索同義詞檢索是通過同義詞表查出和用戶輸入主題詞、關(guān)鍵詞的同義詞,并對(duì)一組同義詞進(jìn)行“或”運(yùn)算檢索。
11)異形詞檢索異形詞檢索是通過異形詞表查出用戶輸入關(guān)鍵詞的異形詞,并對(duì)查到的異形詞進(jìn)行“或”運(yùn)算檢索。
12)組配檢索當(dāng)用戶輸入多個(gè)詞時(shí),系統(tǒng)根據(jù)用戶選擇的組合條件(“與”、“或”、“非”),把用戶輸入的多個(gè)詞組配成相應(yīng)的查詢條件進(jìn)行全文檢索。
13)語句切分檢索將用戶輸入的短語或句子,利用“自動(dòng)標(biāo)引系統(tǒng)”進(jìn)行分詞處理,從中抽取出關(guān)鍵詞,再利用這些關(guān)鍵詞與主題詞匹配,并進(jìn)行“與”運(yùn)算檢索。
14)多語種檢索多語種檢索是把用戶輸入的主題詞、關(guān)鍵詞翻譯成其他語言進(jìn)行的檢索。
15)全文檢索用戶輸入的關(guān)鍵詞在系統(tǒng)中不能匹配到相應(yīng)的主題詞,即將輸入的關(guān)鍵詞送到全文檢索模塊,使用全文檢索技術(shù)在信息資源庫中進(jìn)行的檢索。
(2)檢索結(jié)果顯示功能1)詞語釋義顯示功能從檢索條件存儲(chǔ)模塊中獲取最后一個(gè)輸入詞,在語義表中檢索。如果找到相應(yīng)的詞,則在頁面上顯示這個(gè)詞的解釋。
2)信息條目數(shù)量顯示功能用戶的每一次檢索都會(huì)在信息分類系統(tǒng)中找到對(duì)應(yīng)類目的信息條目,進(jìn)行統(tǒng)計(jì)顯示。如果這個(gè)類目還有子類存在,則還需要統(tǒng)計(jì)每一個(gè)子類中符合用戶檢索條件的信息數(shù)目。
3)信息條目內(nèi)容顯示功能用戶點(diǎn)擊一條信息的標(biāo)題后,系統(tǒng)則會(huì)讀取該標(biāo)題的正文內(nèi)容并顯示在頁面中。
4)檢索條件歷史記錄顯示功能從查尋模塊中獲取用戶輸入的查詢條件列表并顯示出來。
以上15種不同的檢索方式可以獨(dú)立檢索,也可以組合檢索,或在上一次檢索結(jié)果的基礎(chǔ)上,再次進(jìn)行檢索。在多種方式混合檢索中,每一步的檢索結(jié)果都可以根據(jù)需要顯示出來。檢索結(jié)果包括4種顯示,即詞語釋義顯示、信息條目數(shù)量顯示、信息條目內(nèi)容顯示和檢索條件歷史記錄顯示。
表1搜索引擎檢索、顯示功能


(3)存儲(chǔ)檢索條件功能系統(tǒng)將每一步輸入的檢索條件記錄下來,提供給下一步的檢索方式作為已檢索信息范圍,或提供給4種顯示方式作為信息輸出。這樣,在技術(shù)上保證了不同種的檢索方式可以銜接,同時(shí)利用存儲(chǔ)檢索條件功能,進(jìn)行用戶定題檢索服務(wù)。
(4)信息維護(hù)功能實(shí)現(xiàn)16種信息類型,即新聞、商品、基本活動(dòng)單位、權(quán)威組織、重要人物、權(quán)威會(huì)議、報(bào)紙、期刊、報(bào)告、論文、法律法規(guī)、專利、標(biāo)準(zhǔn)、圖書、工具書、非書資料的管理(增、刪、改等各項(xiàng)操作功能)和信息屬性字段的自定義設(shè)置功能。
(1)智能檢索功能摸塊1)搜索引擎結(jié)構(gòu)框架(見圖2)2)檢索過程模塊(見圖3)(2)信息存儲(chǔ)維護(hù)模塊
1)16類信息存儲(chǔ)維護(hù)模塊對(duì)16類信息進(jìn)行分析,找到共同點(diǎn)作為公用字段,同時(shí)還要找出每類信息不同于其他類信息的特征,作為特征字段,以此全面反映各類信息。
應(yīng)該特別指出的是,商品是16類信息中極具殊性的一種類型,不僅135行業(yè)(學(xué)科)的商品之間,就是每個(gè)行業(yè)內(nèi)的商品之間,都存在很大的差別,需要根據(jù)不同的特點(diǎn)選擇特征字段進(jìn)行描述,進(jìn)行個(gè)性化定義。由于商品分類具有上下位關(guān)系,商品自定義屬性也存在繼承關(guān)系,所以系統(tǒng)巧妙地對(duì)此進(jìn)行了一系列的技術(shù)處理。
2)8種載體信息存儲(chǔ)維護(hù)模塊8種載體信息存儲(chǔ)維護(hù)模塊負(fù)責(zé)存儲(chǔ)印刷型、微縮型、視聽型、機(jī)讀型、光盤型、聯(lián)機(jī)數(shù)據(jù)庫、多媒體、互聯(lián)網(wǎng)等8種類型信息載體的特征內(nèi)容,并對(duì)該部分信息進(jìn)行維護(hù),包括增、刪、改的功能。
用戶在查找希望編輯和修改的信息條目時(shí)需要系統(tǒng)提供簡單的字段查詢功能。查詢模塊根據(jù)用戶選擇或填寫的載體類型或關(guān)鍵詞,在載體數(shù)據(jù)庫中查找相應(yīng)信息。
增加一條信息時(shí),需要分離出描述載體特征的信息,向載體信息數(shù)據(jù)庫中單條添加信息,實(shí)現(xiàn)向數(shù)據(jù)庫中插入信息的操作。
修改功能只對(duì)單條數(shù)據(jù)庫信息執(zhí)行修改操作。
進(jìn)行刪除操作時(shí),在指定希望刪除的信息后,在刪除信息類型數(shù)據(jù)庫中信息的同時(shí),刪除載體類型中的載體特征信息。刪除功能只對(duì)載體數(shù)據(jù)庫中的一條信息執(zhí)行刪除操作。系統(tǒng)將用戶選定的信息的編號(hào)以數(shù)組的形式記錄,然后執(zhí)行刪除操作。
(3)分類主題存儲(chǔ)維護(hù)模塊為實(shí)現(xiàn)135個(gè)行業(yè)信息內(nèi)容的分級(jí)管理,根椐行業(yè)分類編碼規(guī)則,把135個(gè)行業(yè)的信息存儲(chǔ)在一個(gè)統(tǒng)一的行業(yè)分類表中。
為實(shí)現(xiàn)主題詞檢索,而存儲(chǔ)字順表、輪排表、詞族表、同義詞表、異型詞表、詞素表、多語種詞表等不同形式的詞表,并提供增、刪、改、排序等維護(hù)功能。
解決檢索方案的關(guān)鍵技術(shù)
(1)采用檢索流程模塊化和后臺(tái)檢索流程設(shè)置的技術(shù),可以在15種基本的檢索方式和4種檢索結(jié)果顯示方式中自定義設(shè)計(jì)檢索步驟和結(jié)果。
(2)檢索方式可以根據(jù)用戶的需要隨意組合,采用統(tǒng)一的接口和參數(shù),記錄用戶輸入的檢索條件和返回結(jié)果范圍,供下一步的檢索利用,實(shí)現(xiàn)檢索方式的靈活性。
(3)采用檢索樣式模塊化和設(shè)置模板技術(shù),解決用戶對(duì)頁面形式的特殊化要求,實(shí)現(xiàn)檢索模板設(shè)置的靈活性。
系統(tǒng)評(píng)估“標(biāo)桿智能搜索引擎系統(tǒng)”是跨網(wǎng)絡(luò)平臺(tái)的信息智能檢索系統(tǒng),可在局域網(wǎng)或廣域網(wǎng)環(huán)境下運(yùn)行,操作系統(tǒng)可為WINDOWS 2000、NT,UNIX,LINUX等。該系統(tǒng)是一個(gè)技術(shù)先進(jìn)、功能完善、運(yùn)行穩(wěn)定、操作簡便的大眾化產(chǎn)品,其特點(diǎn)1、即裝即用,面向最終用戶,無需專業(yè)知識(shí)。
2、操作簡便、界面友好,是高級(jí)傻瓜型檢索系統(tǒng)。
3、可隨時(shí)添加、插入、修改、刪除、更新數(shù)據(jù)、自動(dòng)維護(hù)索引。
4、支持大量的(用戶數(shù)基本不限)并發(fā)用戶對(duì)數(shù)據(jù)庫進(jìn)行同時(shí)訪問。
5、檢索效率高,查準(zhǔn)率、查全率完全達(dá)到用戶需求。行業(yè)(學(xué)科)分類表






權(quán)利要求
1.一種標(biāo)桿智能搜索引擎系統(tǒng),該系統(tǒng)有國家信息產(chǎn)業(yè)部認(rèn)可、我公司開發(fā)的“網(wǎng)絡(luò)信息主題分類體系”標(biāo)準(zhǔn)(待批國家標(biāo)準(zhǔn))作為網(wǎng)絡(luò)信息組織的基礎(chǔ)和支撐。
2.根據(jù)權(quán)利要求1所述的標(biāo)桿智能搜索引擎系統(tǒng),可從8種信息載體、16種信息類型、135個(gè)行業(yè)(學(xué)科)快速實(shí)現(xiàn)三維信息定位。
3.根據(jù)權(quán)利要求1所述的標(biāo)桿智能搜索引擎系統(tǒng),同時(shí)支持目錄式搜索和索引式搜索。用戶可從知識(shí)鏈和產(chǎn)品鏈的主題樹目錄逐層瀏覽,直至找到所需信息;或者通過索引式搜索,在搜索框中輸入關(guān)鍵詞、主題詞或自然語言,都能準(zhǔn)確而不漏的找到所需信息。
4.根據(jù)權(quán)利要求1所述的標(biāo)桿智能搜索引擎系統(tǒng),支持超文本、超媒體搜索方式。利用“網(wǎng)絡(luò)信息分類主題”樹形結(jié)構(gòu),以節(jié)點(diǎn)為基本單位,建立節(jié)點(diǎn)間的超鏈方式將文本信息組織成立體網(wǎng)狀結(jié)構(gòu),可使用戶從任一節(jié)點(diǎn)、不同角度、靈活、方便地瀏覽和查詢信息。也可從文本信息中選中關(guān)鍵詞進(jìn)行查詢。
5.根據(jù)權(quán)利要求1所述的標(biāo)桿智能搜索引擎系統(tǒng),同時(shí)支持自然語言和受控語言的檢索方式。該系統(tǒng)可接受主題詞、關(guān)鍵詞或一段檢索要求語言,由系統(tǒng)進(jìn)行分詞處理和與“分類主題詞表”的主題詞匹配,匹配者則進(jìn)行索引式檢索,未匹配者則進(jìn)行關(guān)鍵詞或短語的全文檢索。
6.根據(jù)權(quán)利要求1所述的標(biāo)桿智能搜索引擎系統(tǒng),支持同義詞聯(lián)動(dòng)檢索。系統(tǒng)接受一檢索詞,即去“分類主題詞表”中查找,判斷該詞有無同義詞,若有,則把同義詞聯(lián)動(dòng)起來,進(jìn)行一組同義詞的“或”運(yùn)算檢索。
7.根據(jù)權(quán)利要求1所述的標(biāo)桿智能搜索引擎系統(tǒng),支持全文檢索。輸入一個(gè)或若干個(gè)字,詞、句就可從全字段中檢索出包含此字、詞、句的全部記錄。也可對(duì)檢索結(jié)果進(jìn)行二次檢索。
8.根據(jù)權(quán)利要求1所述的標(biāo)桿智能搜索引擎系統(tǒng),支持字段檢索。它是對(duì)已建立字段索引的字段進(jìn)行字段級(jí)檢索,對(duì)于字段內(nèi)容取值較少的字段,可通過彈出式菜單選擇檢索內(nèi)容,也可通過鍵盤輸入字段的檢索條件。檢索方式可以是完全匹配、前綴匹配、后綴匹配、包含匹配、不包含匹配。
9.根據(jù)權(quán)利要求1所述的標(biāo)桿智能搜索引擎系統(tǒng),支持組合檢索。在多個(gè)字段之間可以進(jìn)行“與”、“或”、“非”運(yùn)算,對(duì)布爾檢索式進(jìn)行搜索。還可對(duì)檢索結(jié)果進(jìn)行二次檢索。
10.根據(jù)權(quán)利要求1所述的標(biāo)桿智能搜索引擎系統(tǒng),支持定題檢索服務(wù)。該系統(tǒng)為用戶提供預(yù)定數(shù)據(jù)庫、預(yù)定查詢內(nèi)容的定期檢索服務(wù),設(shè)有用戶管理、查詢內(nèi)容管理,以及把查詢結(jié)果按固定格式保存起來的功能。
全文摘要
一種標(biāo)桿智能搜索引擎系統(tǒng)能把海量網(wǎng)絡(luò)信息“準(zhǔn)、全、便、快”地定位,是實(shí)現(xiàn)信息全方位、全行業(yè)、多途徑、多類型和多種檢索技術(shù)組合的跨平臺(tái)的智能搜索引擎。它具有獨(dú)特的創(chuàng)新;是一個(gè)技術(shù)先進(jìn)、功能完善、運(yùn)行穩(wěn)定、操作簡便的大眾化產(chǎn)品,其特點(diǎn)1.即裝即用,面向最終用戶,無需專業(yè)知識(shí)。2.操作簡便、界面友好、高級(jí)傻瓜型和智能型搜索引擎。3.隨時(shí)添加、插入、修改、刪除、更新數(shù)據(jù)、自動(dòng)維護(hù)索引。4.支持大量(用戶數(shù)基本無限制)并發(fā)用戶對(duì)數(shù)據(jù)庫進(jìn)行同時(shí)訪問。5.檢索效率高,查準(zhǔn)率、查全率完全達(dá)到用戶需求。
文檔編號(hào)G06F17/30GK1432943SQ0210037
公開日2003年7月30日 申請(qǐng)日期2002年1月17日 優(yōu)先權(quán)日2002年1月17日
發(fā)明者張明盛 申請(qǐng)人:北京標(biāo)桿網(wǎng)絡(luò)技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1