本發(fā)明涉及網(wǎng)絡(luò)音頻信息傳輸技術(shù)領(lǐng)域,具體涉及一種異構(gòu)語(yǔ)音數(shù)據(jù)接入平臺(tái)。
背景技術(shù):
目前各部門大都提出實(shí)現(xiàn)信息化要求,由于各部門、各省市縣等不同業(yè)務(wù)、不同地區(qū)等條件限制,采用了不同的軟硬件環(huán)境以適應(yīng)自身的信息化需求,從而使得在各部門存在了多種不同的軟硬件平臺(tái)、操作系統(tǒng)和數(shù)據(jù)庫(kù)管理系統(tǒng)等。
目前的異構(gòu)數(shù)據(jù)庫(kù),主要包括:SQL Server,Oracle,MySql等多種關(guān)系型數(shù)據(jù)庫(kù)以及HBase等NoSql數(shù)據(jù)庫(kù),同時(shí)還涉及多種操作系統(tǒng),包括:Linux,Windows,UNIXWARE,SOLARIS等等。異構(gòu)主要表現(xiàn)在以下幾個(gè)方面:
命名沖突:表達(dá)同樣內(nèi)容的數(shù)據(jù)在不同的數(shù)據(jù)源中有不同的名稱,或者相同的名稱表達(dá)了不同的含義。
數(shù)據(jù)格式不同:在不同的數(shù)據(jù)源中,相同內(nèi)容的數(shù)據(jù)字段存在數(shù)據(jù)類型、數(shù)據(jù)經(jīng)度和數(shù)據(jù)方位的不同。
結(jié)構(gòu)不同:在不同的數(shù)據(jù)源中,相同內(nèi)容的數(shù)據(jù)實(shí)體表示不同。
以上因素導(dǎo)致了不同部門、不同業(yè)務(wù)和不同地區(qū)之間存在了一個(gè)個(gè)的信息孤島和各部門之間的數(shù)據(jù)異構(gòu)。尤其是語(yǔ)音系統(tǒng),由于行業(yè)內(nèi)目前尚不存在統(tǒng)一的通信和建設(shè)標(biāo)準(zhǔn),各部門建設(shè)的語(yǔ)音系統(tǒng)存在大量的不同數(shù)據(jù)定義以及數(shù)據(jù)通信協(xié)議等問(wèn)題,導(dǎo)致數(shù)據(jù)接入及其困難。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種異構(gòu)語(yǔ)音數(shù)據(jù)接入平臺(tái),解決異構(gòu)數(shù)據(jù)源存在的軟硬件不同、數(shù)據(jù)管理軟件不同、數(shù)據(jù)元定義不同等問(wèn)題,能實(shí)現(xiàn)各部門語(yǔ)音數(shù)據(jù)的集成。
本發(fā)明的技術(shù)方案如下:
一種異構(gòu)語(yǔ)音數(shù)據(jù)接入平臺(tái),包括數(shù)據(jù)源層、數(shù)據(jù)訪問(wèn)層、邏輯處理服務(wù)層、應(yīng)用層,其特征在于:
所述數(shù)據(jù)源層是數(shù)據(jù)的提供者,來(lái)自不同來(lái)源的數(shù)據(jù)構(gòu)成,包含各種類型是數(shù)據(jù)庫(kù)、文 件、多媒體信息;
所述數(shù)據(jù)訪問(wèn)層負(fù)責(zé)查詢執(zhí)行引擎與底層數(shù)據(jù)源之間的數(shù)據(jù)通信;數(shù)據(jù)訪問(wèn)服務(wù)器接收邏輯處理服務(wù)發(fā)送來(lái)的子查詢,將其轉(zhuǎn)換為數(shù)據(jù)源能處理的查詢,并將查詢結(jié)果轉(zhuǎn)換為XML形式發(fā)送給邏輯處理服務(wù)器層;
所述邏輯處理層用于向下協(xié)調(diào)各源數(shù)據(jù)庫(kù),向上為訪問(wèn)整合數(shù)據(jù)的應(yīng)用提供統(tǒng)一的數(shù)據(jù)模式和訪問(wèn)接口方法;
所述應(yīng)用層接收用戶的輸入,將用戶的輸入傳遞給業(yè)務(wù)邏輯服務(wù)器,顯示從業(yè)務(wù)邏輯服務(wù)器返回的查詢結(jié)果。
本發(fā)明基于XML的數(shù)據(jù)集成及應(yīng)用,從數(shù)據(jù)集成和需要解決的任務(wù)為出發(fā)點(diǎn),提出了一種基于XML的數(shù)據(jù)集成方法。采用XML Schema、XFire和XQuery作為異構(gòu)數(shù)據(jù)的公用數(shù)據(jù)模型和查詢語(yǔ)句,通過(guò)實(shí)現(xiàn)一個(gè)通信中間件的方式,達(dá)到數(shù)據(jù)源之間的數(shù)據(jù)集成。采用防火墻和入侵監(jiān)測(cè)等手段,同時(shí)建立一套安全認(rèn)證機(jī)制保證數(shù)據(jù)完整,并以數(shù)據(jù)庫(kù)和CA認(rèn)證鑒別訪問(wèn)者身份,確保數(shù)據(jù)安全性。數(shù)據(jù)庫(kù)和CA數(shù)字整數(shù)之間通信通過(guò)SSL加密保證數(shù)據(jù)傳輸過(guò)程中的安全性。本發(fā)明解決了異構(gòu)數(shù)據(jù)源存在的軟硬件不同、數(shù)據(jù)管理軟件不同、數(shù)據(jù)元定義不同等問(wèn)題,能實(shí)現(xiàn)各部門語(yǔ)音數(shù)據(jù)的集成。
具體實(shí)施方式
本發(fā)明的平臺(tái)包括數(shù)據(jù)源層、數(shù)據(jù)訪問(wèn)層、邏輯處理服務(wù)層、應(yīng)用層。
數(shù)據(jù)源層是數(shù)據(jù)的提供者,來(lái)自不同來(lái)源的數(shù)據(jù)構(gòu)成。包含各種類型是數(shù)據(jù)庫(kù)(關(guān)系型數(shù)據(jù)庫(kù)和NoSql數(shù)據(jù)庫(kù)等)、文件、多媒體信息等。
數(shù)據(jù)訪問(wèn)層服務(wù)器集群層負(fù)責(zé)查詢執(zhí)行引擎與底層數(shù)據(jù)源之間的數(shù)據(jù)通信。數(shù)據(jù)訪問(wèn)服務(wù)器接收邏輯處理服務(wù)發(fā)送來(lái)的子查詢,將其轉(zhuǎn)換為數(shù)據(jù)源能處理的查詢,并將查詢結(jié)果轉(zhuǎn)換為XML形式發(fā)送給邏輯處理服務(wù)器層。
邏輯處理層服務(wù)器集群用于向下協(xié)調(diào)各源數(shù)據(jù)庫(kù),向上為訪問(wèn)整合數(shù)據(jù)的應(yīng)用提供統(tǒng)一的數(shù)據(jù)模式和訪問(wèn)接口方法。
邏輯處理服務(wù)層分為:API、管理控制臺(tái)、API和設(shè)計(jì)工具。通過(guò)調(diào)用元數(shù)據(jù)信息庫(kù)訪問(wèn)和管理元數(shù)據(jù),通過(guò)調(diào)用安全認(rèn)證服務(wù)對(duì)用戶的資源方位請(qǐng)求進(jìn)行身份和權(quán)限控制,通過(guò)調(diào)用日志服務(wù)記錄必要的日志信息,通過(guò)調(diào)用數(shù)據(jù)訪問(wèn)服務(wù)實(shí)現(xiàn)對(duì)異構(gòu)數(shù)據(jù)的訪問(wèn)。
應(yīng)用層接收用戶的輸入,將用戶的輸入傳遞給業(yè)務(wù)邏輯服務(wù)器,顯示從業(yè)務(wù)邏輯服務(wù)器返回的查詢結(jié)果。
本發(fā)明具體實(shí)施時(shí),平臺(tái)技術(shù)實(shí)現(xiàn)方案包括以下幾點(diǎn):
XML:XML的數(shù)據(jù)結(jié)構(gòu)非常靈活,支持智能代理和高級(jí)視圖,同時(shí)符合數(shù)據(jù)接入服務(wù)平臺(tái)的要求。使用XML作為異構(gòu)數(shù)據(jù)源交互的中間媒介,通過(guò)XML的自定義標(biāo)簽即可將數(shù)據(jù)內(nèi)容和表現(xiàn)完全分離開(kāi)來(lái),同時(shí)還具有強(qiáng)大的擴(kuò)展功能,可以表示簡(jiǎn)單和復(fù)雜的數(shù)據(jù)結(jié)構(gòu)。XML提供的應(yīng)用系統(tǒng)集成功能,可以提高平臺(tái)的重用性和互操作性。
XFire:當(dāng)前常用的webservice方式有多種,XFire相比其他方式表現(xiàn)優(yōu)點(diǎn)有:輕量級(jí),開(kāi)發(fā)文檔眾多,接口使用簡(jiǎn)潔明了,性能高。
XQuery語(yǔ)言:XQuery基于XML查詢語(yǔ)音發(fā)展而來(lái),設(shè)計(jì)精干靈活,功能強(qiáng)大。適合應(yīng)用與多種數(shù)據(jù)源場(chǎng)景。實(shí)現(xiàn)異構(gòu)語(yǔ)音數(shù)據(jù)中間件使用。
模式集成:由于不同數(shù)據(jù)源是獨(dú)立開(kāi)發(fā),描述數(shù)據(jù)的數(shù)據(jù)模型或者存儲(chǔ)結(jié)構(gòu)也存在不同,這就使得不同數(shù)據(jù)源模式的合并非常困難。即使是關(guān)系型數(shù)據(jù)庫(kù),也很難分辨出不同的數(shù)據(jù)庫(kù)中的數(shù)據(jù)模式是描述相同的數(shù)據(jù)。本平臺(tái)使用面向?qū)ο竽J剑咕植繑?shù)據(jù)模式到輸出模式的映射實(shí)現(xiàn)R-O映射,將關(guān)系模式映射到對(duì)射模式。首先對(duì)數(shù)據(jù)源輸出模式對(duì)比,指定元素之間的沖突類型,然后消解沖突,最后對(duì)模式進(jìn)行合并、重構(gòu),得到全局模式。
安全策略:LDAP是一種基于X.500目錄標(biāo)準(zhǔn)的開(kāi)放性標(biāo)準(zhǔn),簡(jiǎn)單、精煉并且具有良好的可擴(kuò)展性并且是跨平臺(tái)的,這意味著幾乎任何計(jì)算機(jī)平臺(tái)上運(yùn)行的任何程序都可以基于LDAP獲取數(shù)據(jù)。通過(guò)ACL來(lái)控制對(duì)目錄的訪問(wèn)來(lái)提供細(xì)粒度的訪問(wèn)控制。結(jié)合LDAP和ACL,可以實(shí)現(xiàn)LDAP與大多數(shù)現(xiàn)有的安全性認(rèn)證系統(tǒng)集成在一起。NDS是目前流行的LDAP產(chǎn)品,是Novell公司提供的。它提供了安全的、地點(diǎn)無(wú)關(guān)的訪問(wèn),可以訪問(wèn)分布廣泛的網(wǎng)絡(luò)資源。