亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

網(wǎng)絡(luò)服務(wù)的描述信息獲取方法和裝置的制作方法

文檔序號:6585384閱讀:196來源:國知局

專利名稱::網(wǎng)絡(luò)服務(wù)的描述信息獲取方法和裝置的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及軟件技術(shù),尤其涉及一種網(wǎng)絡(luò)服務(wù)的描述信息獲取方法和裝置。
背景技術(shù)
:隨著軟件技術(shù)的發(fā)展,構(gòu)件技術(shù)的出現(xiàn)成為軟件技術(shù)發(fā)展史上的一次變革,基于構(gòu)件的軟件開發(fā),不僅使軟件產(chǎn)品在客戶需求吻合度、上線時間、軟件質(zhì)量上領(lǐng)先于同類產(chǎn)品,提高了項目的成功率,而且對軟件的開發(fā)和維護變得十分簡單,客戶可以隨時隨地應(yīng)對商業(yè)環(huán)境變化和IT技術(shù)變化,實現(xiàn)"敏捷定制"。在目前的基于構(gòu)件的軟件開發(fā)過程中,通常利用軟件構(gòu)件庫來保存大量構(gòu)件,軟件構(gòu)件庫是對可復(fù)用的軟件構(gòu)件進行管理,并對軟件構(gòu)件的復(fù)用過程提供支持的基礎(chǔ)設(shè)施。隨著網(wǎng)絡(luò)服務(wù)(WebServices)技術(shù)的發(fā)展,目前因特網(wǎng)(Internet)環(huán)境中的構(gòu)件資源主要以WebServices的形式出現(xiàn),WebServices作為一種布署在網(wǎng)絡(luò)(Web)上的構(gòu)件,其應(yīng)用越來越廣泛。目前,在Internet上存在大量的WebServices資源,用戶通常通過普通的搜索引擎(如谷歌、百度等)來檢索想要的WebServices。然而現(xiàn)有的搜索引擎是基于網(wǎng)頁信息的搜索引擎,并未考慮本身的特性,也不能提供專門針對WebServices的搜索服務(wù)。而且用戶從現(xiàn)有搜索引擎獲取的WebServices大部分不包含用于說明WebServices的主要功能和接口使用方法的描述信息,或包含很少的描述信息。由于缺乏WebServices的描述信息,使得用戶理解難于理解該WebServices的功能以及使用方法,同時用戶也不能方便地查詢禾口檢索該WebServices。
發(fā)明內(nèi)容本發(fā)明的目的在于提供一種網(wǎng)絡(luò)服務(wù)的描述信息獲取方法和裝置,實現(xiàn)自動地獲取網(wǎng)絡(luò)服務(wù)的描述信息,便于用戶理解該網(wǎng)絡(luò)服務(wù)的功能和使用方法。為了實現(xiàn)上述目的,本發(fā)明提供了一種網(wǎng)絡(luò)服務(wù)的描述信息獲取方法,包括從網(wǎng)絡(luò)服務(wù)描述語言文件中獲取網(wǎng)絡(luò)服務(wù)的自身信息;通過搜索引擎獲取與所述網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息;解析所述網(wǎng)頁信息,并獲取網(wǎng)頁的主體信息;根據(jù)所述網(wǎng)絡(luò)服務(wù)的自身信息和所述網(wǎng)頁的主體信息獲取所述網(wǎng)絡(luò)服務(wù)的描述信息。本發(fā)明還提供了一種網(wǎng)絡(luò)服務(wù)的描述信息獲取裝置,包括第一獲取模塊,用于從網(wǎng)絡(luò)服務(wù)描述語言文件中獲取網(wǎng)絡(luò)服務(wù)的自身信息;第二獲取模塊,用于通過搜索引擎獲取與所述網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息;解析模塊,用于解析所述第二獲取模塊獲取的所述網(wǎng)頁信息,并獲取網(wǎng)頁的主體信息;第三獲取模塊,用于根據(jù)所述第一獲取模塊獲取的所述網(wǎng)絡(luò)服務(wù)的自身信息和所述解析模塊獲取的所述網(wǎng)頁的主體信息獲取所述網(wǎng)絡(luò)服務(wù)的描述信息。本發(fā)明提供的一種網(wǎng)絡(luò)服務(wù)的描述信息獲取方法和裝置,通過搜索引擎獲取與網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息,并根據(jù)網(wǎng)絡(luò)服務(wù)的自身信息從相關(guān)網(wǎng)頁信息中獲取網(wǎng)絡(luò)服務(wù)的描述信息,實現(xiàn)了自動地獲取網(wǎng)絡(luò)服務(wù)的描述信息,便于用戶理解該網(wǎng)絡(luò)服務(wù)的功能和使用方法,為用戶提供了極大的便利。圖1為本發(fā)明網(wǎng)絡(luò)服務(wù)的描述信息獲取方法實施例的流程圖;圖2為本發(fā)明網(wǎng)絡(luò)服務(wù)的描述信息獲取裝置實施例的結(jié)構(gòu)圖。具體實施例方式下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進一步的詳細描述。圖l為本發(fā)明網(wǎng)絡(luò)服務(wù)的描述信息獲取方法實施例的流程圖,如圖l所示,本實施例提供了一種網(wǎng)絡(luò)服務(wù)的描述信息獲取方法,具體包括如下步驟步驟101,從網(wǎng)絡(luò)服務(wù)描述語言文件中獲取網(wǎng)絡(luò)服務(wù)的自身信息。從網(wǎng)絡(luò)服務(wù)描述語言(WebServicesDescriptionLanguage;以下簡稱WSDL)文件中獲取網(wǎng)絡(luò)服務(wù)(WebServices)的自身信息。其中,WebServices是由統(tǒng)一資源標(biāo)識符(UniformResourceIdentifier;以下簡稱URL)標(biāo)識的軟件應(yīng)用,該應(yīng)用的接口和綁定可通過可擴展標(biāo)識語言(eXtensiveMarkupLanguage;以下簡稱XML)制品進行定義、描述和發(fā)現(xiàn),同時,該應(yīng)用可通過基于Internet的XML消息協(xié)議與其它軟件應(yīng)用直接交互。WebServices是一種布署在Web上的構(gòu)件,而構(gòu)件是軟件系統(tǒng)中具有相對獨立功能、可以明確辨識、接口由契約制定,和語境有明顯依賴關(guān)系、可獨立部署、且多由第三方提供的可組裝軟件實體。WSDL是一種AML應(yīng)用,它將WebServices描述定義為一組服務(wù)訪問點,客戶端可以通過這些服務(wù)訪問點對包含面向文檔信息或面向過程調(diào)用的服務(wù)進行訪問。從WSDL文檔中解析并獲取WebServices的自身信息,自身信息包括服務(wù)名稱、服務(wù)的接口名稱以及該服務(wù)自身的描述信息等。WSDL本身也是一種XML文檔,因此,在獲取WebServices的自身信息時,可以利用XML文檔解析的方法將所需要的標(biāo)簽內(nèi)容一一解析出來,例如WebServices的自身信息中的服務(wù)名稱所對應(yīng)的標(biāo)簽為〈servicename="LDAPService">,即獲取到的該服務(wù)的服務(wù)名稱為LDAPService,WebServices的自身信息中的服務(wù)接口名稱所對應(yīng)的標(biāo)簽為〈operationname="getUnitSubTree">,即獲取到的該服務(wù)的某個服務(wù)接口名稱為getUnitSubTree。步驟102,通過搜索引擎獲取與網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息。通過普通的搜索引擎,如谷歌,從Internet上獲取與WebServices相關(guān)的網(wǎng)頁信息,即通過在搜索引擎上進行關(guān)鍵字搜索,來獲取與該WebServices相關(guān)的網(wǎng)頁。具體地,與WebServices相關(guān)的網(wǎng)頁信息可以為WebServices的WSDL文件的URL的反向鏈接(backlink)指向的網(wǎng)頁信息,以及包含WSDL文件的URL的相對路徑的網(wǎng)頁信息,即此處相關(guān)的含義為與WebServices的WSDL文件的URL有鏈接關(guān)系的網(wǎng)頁,或者在搜索到的網(wǎng)頁中包含WebServices的鏈接,或者一個網(wǎng)頁中包含有該WebServices的名稱信息。本步驟為從Internet上獲取與該WebServices相關(guān)的全部網(wǎng)頁信息,以備后續(xù)步驟的使用。需要指出的是,上述步驟101和步驟102的執(zhí)行順序可以根據(jù)實際需要進行調(diào)整,如先執(zhí)行步驟102,再執(zhí)行步驟IOI,或者并列地同時執(zhí)行步驟101和步驟102,本領(lǐng)域技術(shù)人員可以理解,上述步驟的執(zhí)行先后順序并不會影響本發(fā)明實施例的技術(shù)方案,以及最終達到的技術(shù)效果。步驟103,解析網(wǎng)頁信息,并獲取網(wǎng)頁的主體信息。在從Internet上獲取到與WebServices相關(guān)的網(wǎng)頁信息后,對獲取到的網(wǎng)頁信息進行解析處理,獲取該網(wǎng)頁的主體信息。在通過搜索引擎搜索到的相關(guān)網(wǎng)頁信息中,顯示給用戶的為具有一定格式的網(wǎng)頁界面,其中可以包含表格、圖片以及對文字的特殊編輯格式,如黑體等。本步驟中對網(wǎng)頁信息的解析處理為對網(wǎng)頁信息所對應(yīng)的超文本標(biāo)記語言(HypertextMarkupLanguage;以下簡稱HTML)文件進行解析處理,其中,在HTML文件中包含各種標(biāo)簽,如〈P>、〈title〉、〈table〉、〈hl>等等,利用這些標(biāo)簽來體現(xiàn)網(wǎng)頁界面顯示的各種編輯格式,如〈P>表示一個段落,〈title〉標(biāo)識網(wǎng)頁的題目,〈table〉表示表格的信息,〈hl〉表示粗體的重要的網(wǎng)頁信息等。本步驟在獲取網(wǎng)頁的主體信息時,可以采用外部包nekohtml.jar將獲取的網(wǎng)頁信息中的各個標(biāo)簽去掉,從中抽取出網(wǎng)頁的主體信息。NekoHTML是一個簡單的HTML掃描器和標(biāo)簽補償器(tagbalancer),可以使得程序能解析HTML文檔,并用標(biāo)準(zhǔn)的XML接口來訪問其中的信息。該解析器還能對HTML文檔進行掃描,并對HTML文檔在編寫過程中出現(xiàn)的常規(guī)錯誤進行修正。NekoHTML還可以增補缺失的父元素、自動用結(jié)束標(biāo)簽關(guān)閉相應(yīng)的元素,以及不匹配的內(nèi)嵌元素標(biāo)簽。步驟104,根據(jù)網(wǎng)絡(luò)服務(wù)的自身信息和網(wǎng)頁的主體信息獲取網(wǎng)絡(luò)服務(wù)的描述信息。在獲取到WebServices的自身信息和網(wǎng)頁的主體信息后,根據(jù)這些信息進一步獲取該WebServices的相關(guān)描述信息。具體地,本步驟104可以包括首先,對WebServices的自身信息進行切詞處理,并獲取自身信息的詞語向量。WebServices的自身信息包括服務(wù)名稱、服務(wù)的接口名稱和服務(wù)的自身描述信息等。對WebServices的自身信息進行的切詞處理可以為將自身信息分解為多個的單個詞語,并將切詞處理后的自身信息表示為一個一維的詞語向量,如〈wl,w2,w3,...,wn〉,其中wi(i=1,2...n)為第i個單個詞語。其次,將網(wǎng)頁的主體信息組織成語句向量,并對語句向量中的各個語句進行切詞處理,并獲取各個語句的詞語向量。在獲取到網(wǎng)頁的主體信息之后,將該主體信息組織成語句向量,即該主體信息按照句子的形式進行組織,形成多個的單個語句,并將組織后的主體信息表示為一個一維的語句向量,如〈Sl,S2,...,Sn〉,其中Si(i=1,2...n)為第i個單個語句。并對語句向量中的各個語句進行切詞處理,將切詞處理后的語句也表示為一個一維的詞語向量,如將Si表示為詞語向量〈w'1,w'2,...,w'm〉,得到各個語句對應(yīng)的詞語向量。再次,根據(jù)自身信息的詞語向量和各個語句的詞語向量獲取WebServices的描述信息。根據(jù)上述得到的WebServices的自身信息的詞語向量〈wl,w2,w3,...,wn>和各個語句的詞語向量〈w'1,w'2,...,w'm〉,其中,〈w'1,w'2,...,w'm>為第i個語句對應(yīng)的詞語向量,進一步獲取WebServices的相關(guān)描述信息。具體地,在上述步驟中,所述根據(jù)自身信息的詞語向量和各個語句的詞語向量獲取網(wǎng)絡(luò)服務(wù)的描述信息可以具體為根據(jù)自身信息的詞語向量和各個語句的詞語向量計算網(wǎng)絡(luò)服務(wù)的自身信息和各個語句的相似度;分別比較各個語句的相似度與預(yù)設(shè)的相似度閾值,如果語句的相似度大于相似度閾值,則獲取語句為網(wǎng)絡(luò)服務(wù)的描述信息。在進行WebServices的描述信息的獲取時,可以根據(jù)WebServices的自身信息和從Internet上獲取到的相關(guān)網(wǎng)頁的主體信息的相似程度來從中得到該WebServices的相關(guān)描述信息,具體可以根據(jù)上述步驟中獲得的自身信息的詞語向量和網(wǎng)頁信息的主體信息的各個語句的詞語向量,來分別計算WebServices的自身信息和網(wǎng)頁信息的主體信息的各個語句的相似度。并根據(jù)經(jīng)驗預(yù)先設(shè)定相似度閾值,通過將各個相似度與相似度閾值進行比較,將大于相似度閾值的相似度對應(yīng)的網(wǎng)頁信息的主體信息的各個語句作為該WebServices的描述信息。進一步地,在上述步驟中,所述根據(jù)自身信息的詞語向量和各個語句的詞語向量計算網(wǎng)絡(luò)服務(wù)的自身信息和各個語句的相似度可以具體為分別計算各個語句的詞語向量和自身信息的詞語向量的并集,即計算各個語句的詞語向量和自身信息的詞語向量〈wl,w2,w3,...,wn>的并集,在本實施例中,以第i個語句的詞語向量〈w'l,w'2,...,w'm>為例進行說明,其余語句與此類似,假設(shè)得到的并集為〈wl,w2,...,wp>。統(tǒng)計并集中的詞語在語句的詞語向量中出現(xiàn)的詞頻,并記錄在第一詞頻向量中,即統(tǒng)計并集〈wl,w2,...,wp>中的詞語在網(wǎng)頁信息的主體信息的第i個語句的詞語向量〈w'1,w'2,...,w'm>中出現(xiàn)的詞頻,如果未出現(xiàn),則詞頻表示為O,并將統(tǒng)計結(jié)果記錄在第一詞頻向量〈cl,c2,...,cp>中。同時,統(tǒng)計并集中的詞語在自身信息的詞語向量中出現(xiàn)的詞頻,并記錄在第二詞頻向量中,即統(tǒng)計并集〈wl,w2,...,wp>中的詞語在WebServices的自身信息的詞語向量〈wl,w2,...,wn>中出現(xiàn)的詞頻,如果未出現(xiàn),則詞頻表示為O,并將統(tǒng)計結(jié)果記錄在第一詞頻向量〈c'1,c'2,.,.,c'p〉中。利用第一詞頻向量和第二詞頻向量計算網(wǎng)絡(luò)服務(wù)的自身信息和各個語句的相似度,即利用向量〈cl,c2,...,cp〉和〈c'1,c'2,...,c'p〉來計算WebServices的自身信息和各個語句的相似度,具體地,可以采用如下公式進行計算<formula>formulaseeoriginaldocumentpage7</formula>其中,a為向量〈cl,c2,,cp>,b為向量〈c'1,c'2,,c'p〉,公式(1)中分子為向量a和向量b的內(nèi)積,分母為向量a的模和向量b的模的乘積。本發(fā)明提供的一種網(wǎng)絡(luò)服務(wù)的描述信息獲取方法,通過搜索引擎獲取與網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息,并根據(jù)網(wǎng)絡(luò)服務(wù)的自身信息從相關(guān)網(wǎng)頁信息中獲取網(wǎng)絡(luò)服務(wù)的描述信息,實現(xiàn)了自動地獲取網(wǎng)絡(luò)服務(wù)的描述信息,便于用戶理解該網(wǎng)絡(luò)服務(wù)的功能和使用方法,為用戶提供了極大的便利。圖2為本發(fā)明網(wǎng)絡(luò)服務(wù)的描述信息獲取裝置實施例的結(jié)構(gòu)圖,如圖2所示,本實施例提供了一種網(wǎng)絡(luò)服務(wù)的描述信息獲取裝置,具體包括第一獲取模塊1、第二獲取模塊2、解析模塊3和第三獲取模塊4。其中,第一獲取模塊1用于從網(wǎng)絡(luò)服務(wù)描述語言文件中獲取網(wǎng)絡(luò)服務(wù)的自身信息。第二獲取模塊2用于通過搜索引擎獲取與所述網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息。解析模塊3用于解析第二獲取模塊2獲取的所述網(wǎng)頁信息,并獲取網(wǎng)頁的主體信息。第三獲取模塊4用于根據(jù)第一獲取模塊1獲取的所述網(wǎng)絡(luò)服務(wù)的自身信息和解析模塊3獲取的網(wǎng)頁的主體信息獲取網(wǎng)絡(luò)服務(wù)的描述信息。具體地,第三獲取模塊4可以具體包括第一向量獲取子模塊41、第二向量獲取子模塊42和信息獲取子模塊43。其中,第一向量獲取子模塊41用于對第一獲取模塊1獲取的所述網(wǎng)絡(luò)服務(wù)的自身信息進行切詞處理,并獲取自身信息的詞語向量。第二向量獲取子模塊42用于將解析模塊3獲取的所述網(wǎng)頁的主體信息組織成語句向量,并對所述語句向量中的各個語句進行切詞處理,并獲取所述各個語句的詞語向量。信息獲取子模塊43用于根據(jù)第一向量獲取子模塊41獲取的所述自身信息的詞語向量和第二向量獲取子模塊42獲取的所述各個語句的詞語向量獲取所述網(wǎng)絡(luò)服務(wù)的描述信息。進一步地,信息獲取子模塊43可以具體包括計算單元431和比較單元432。其中,計算單元431用于根據(jù)第一向量獲取子模塊41獲取的自身信息的詞語向量和第二向量獲取子模塊42獲取的各個語句的詞語向量計算所述網(wǎng)絡(luò)服務(wù)的自身信息和所述各個語句的相似度。比較單元432用于分別比較各個語句的相似度與預(yù)設(shè)的相似度閾值,如果所述語句的相似度大于所述相似度閾值,則獲取所述語句為所述網(wǎng)絡(luò)服務(wù)的描述信息。更進一步地,計算單元431可以包括并集計算子單元4311、統(tǒng)計子單元4312和相似度計算子單元4313。其中并集計算子單元4311用于分別計算所述各個語句的詞語向量和所述自身信息的詞語向量的并集。統(tǒng)計子單元4312用于統(tǒng)計所述并集中的詞語在所述語句的詞語向量中出現(xiàn)的詞頻,并記錄在第一詞頻向量中,以及統(tǒng)計所述并集中的詞語在所述自身信息的詞語向量中出現(xiàn)的詞頻,并記錄在第二詞頻向量中。相似度計算子單元4313用于利用所述第一詞頻向量和所述第二詞頻向量計算所述網(wǎng)絡(luò)服務(wù)的自身信息和所述各個語句的相似度。本發(fā)明提供的一種網(wǎng)絡(luò)服務(wù)的描述信息獲取裝置,通過設(shè)置第一獲取模塊、第二獲取模塊、解析模塊和第三獲取模塊,通過搜索引擎獲取與網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息,并根據(jù)網(wǎng)絡(luò)服務(wù)的自身信息從相關(guān)網(wǎng)頁信息中獲取網(wǎng)絡(luò)服務(wù)的描述信息,實現(xiàn)了自動地獲取網(wǎng)絡(luò)服務(wù)的描述信息,便于用戶理解該網(wǎng)絡(luò)服務(wù)的功能和使用方法,為用戶提供了極大的便利。最后應(yīng)說明的是以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解其依然可以對前述實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明實施例技術(shù)方案的精神和范圍。權(quán)利要求一種網(wǎng)絡(luò)服務(wù)的描述信息獲取方法,其特征在于,包括從網(wǎng)絡(luò)服務(wù)描述語言文件中獲取網(wǎng)絡(luò)服務(wù)的自身信息;通過搜索引擎獲取與所述網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息;解析所述網(wǎng)頁信息,并獲取網(wǎng)頁的主體信息;根據(jù)所述網(wǎng)絡(luò)服務(wù)的自身信息和所述網(wǎng)頁的主體信息獲取所述網(wǎng)絡(luò)服務(wù)的描述信息。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述網(wǎng)絡(luò)服務(wù)的自身信息和所述網(wǎng)頁的主體信息獲取所述網(wǎng)絡(luò)服務(wù)的描述信息包括對所述網(wǎng)絡(luò)服務(wù)的自身信息進行切詞處理,并獲取自身信息的詞語向量;將所述網(wǎng)頁的主體信息組織成語句向量,并對所述語句向量中的各個語句進行切詞處理,并獲取所述各個語句的詞語向量;根據(jù)所述自身信息的詞語向量和所述各個語句的詞語向量獲取所述網(wǎng)絡(luò)服務(wù)的描述信息。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述自身信息的詞語向量和所述各個語句的詞語向量獲取所述網(wǎng)絡(luò)服務(wù)的描述信息包括根據(jù)所述自身信息的詞語向量和所述各個語句的詞語向量計算所述網(wǎng)絡(luò)服務(wù)的自身信息和所述各個語句的相似度;分別比較各個語句的相似度與預(yù)設(shè)的相似度閾值,如果所述語句的相似度大于所述相似度閾值,則獲取所述語句為所述網(wǎng)絡(luò)服務(wù)的描述信息。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述自身信息的詞語向量和所述各個語句的詞語向量計算所述網(wǎng)絡(luò)服務(wù)的自身信息和所述各個語句的相似度包括分別計算所述各個語句的詞語向量和所述自身信息的詞語向量的并集;統(tǒng)計所述并集中的詞語在所述語句的詞語向量中出現(xiàn)的詞頻,并記錄在第一詞頻向量中,以及統(tǒng)計所述并集中的詞語在所述自身信息的詞語向量中出現(xiàn)的詞頻,并記錄在第二詞頻向量中;利用所述第一詞頻向量和所述第二詞頻向量計算所述網(wǎng)絡(luò)服務(wù)的自身信息和所述各個語句的相似度。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述與所述網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息包括所述網(wǎng)絡(luò)服務(wù)的網(wǎng)絡(luò)服務(wù)描述語言文件的統(tǒng)一資源標(biāo)識符的反向鏈接指向的網(wǎng)頁信息、包含所述網(wǎng)絡(luò)服務(wù)描述語言文件的統(tǒng)一資源標(biāo)識符的相對路徑的網(wǎng)頁信息。6.—種網(wǎng)絡(luò)服務(wù)的描述信息獲取裝置,其特征在于,包括第一獲取模塊,用于從網(wǎng)絡(luò)服務(wù)描述語言文件中獲取網(wǎng)絡(luò)服務(wù)的自身信息;第二獲取模塊,用于通過搜索引擎獲取與所述網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息;解析模塊,用于解析所述第二獲取模塊獲取的所述網(wǎng)頁信息,并獲取網(wǎng)頁的主體信息;第三獲取模塊,用于根據(jù)所述第一獲取模塊獲取的所述網(wǎng)絡(luò)服務(wù)的自身信息和所述解析模塊獲取的所述網(wǎng)頁的主體信息獲取所述網(wǎng)絡(luò)服務(wù)的描述信息。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第三獲取模塊包括第一向量獲取子模塊,用于對所述第一獲取模塊獲取的所述網(wǎng)絡(luò)服務(wù)的自身信息進行切詞處理,并獲取自身信息的詞語向量;第二向量獲取子模塊,用于將所述解析模塊獲取的所述網(wǎng)頁的主體信息組織成語句向量,并對所述語句向量中的各個語句進行切詞處理,并獲取所述各個語句的詞語向量;信息獲取子模塊,用于根據(jù)所述第一向量獲取子模塊獲取的所述自身信息的詞語向量和所述第二向量獲取子模塊獲取的所述各個語句的詞語向量獲取所述網(wǎng)絡(luò)服務(wù)的描述信息。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述信息獲取子模塊包括計算單元,用于根據(jù)所述第一向量獲取子模塊獲取的所述自身信息的詞語向量和所述第二向量獲取子模塊獲取的所述各個語句的詞語向量計算所述網(wǎng)絡(luò)服務(wù)的自身信息和所述各個語句的相似度;比較單元,用于分別比較各個語句的相似度與預(yù)設(shè)的相似度閾值,如果所述語句的相似度大于所述相似度閾值,則獲取所述語句為所述網(wǎng)絡(luò)服務(wù)的描述信息。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述計算單元包括并集計算子單元,用于分別計算所述各個語句的詞語向量和所述自身信息的詞語向量的并集;統(tǒng)計子單元,用于統(tǒng)計所述并集中的詞語在所述語句的詞語向量中出現(xiàn)的詞頻,并記錄在第一詞頻向量中,以及統(tǒng)計所述并集中的詞語在所述自身信息的詞語向量中出現(xiàn)的詞頻,并記錄在第二詞頻向量中;相似度計算子單元,用于利用所述第一詞頻向量和所述第二詞頻向量計算所述網(wǎng)絡(luò)服務(wù)的自身信息和所述各個語句的相似度。全文摘要本發(fā)明公開了一種網(wǎng)絡(luò)服務(wù)的描述信息獲取方法和裝置,網(wǎng)絡(luò)服務(wù)的描述信息獲取方法包括從網(wǎng)絡(luò)服務(wù)描述語言文件中獲取網(wǎng)絡(luò)服務(wù)的自身信息;通過搜索引擎獲取與所述網(wǎng)絡(luò)服務(wù)相關(guān)的網(wǎng)頁信息;解析所述網(wǎng)頁信息,并獲取網(wǎng)頁的主體信息;根據(jù)所述網(wǎng)絡(luò)服務(wù)的自身信息和所述網(wǎng)頁的主體信息獲取所述網(wǎng)絡(luò)服務(wù)的描述信息。網(wǎng)絡(luò)服務(wù)的描述信息獲取裝置包括第一獲取模塊、第二獲取模塊、解析模塊和第三獲取模塊。本發(fā)明實現(xiàn)了自動地獲取網(wǎng)絡(luò)服務(wù)的描述信息,便于用戶理解該網(wǎng)絡(luò)服務(wù)的功能和使用方法,為用戶提供了極大的便利。文檔編號G06F17/30GK101794288SQ20091024392公開日2010年8月4日申請日期2009年12月25日優(yōu)先權(quán)日2009年12月25日發(fā)明者劉飛,張良杰,李戈,王立杰,謝冰,黃藝燕申請人:北京大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1