技術(shù)編號:9911107
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。 本發(fā)明涉及數(shù)據(jù)集成,特別涉及一種利用實體抽取技術(shù),針對文本數(shù)據(jù) 與可擴展標記語言(XML,EXtensible Markup Language)文檔進行匹配以實現(xiàn)數(shù)據(jù)集成的 方法。背景技術(shù) 在大數(shù)據(jù)的時代,很多企業(yè)采用大數(shù)據(jù)技術(shù)對各類數(shù)據(jù)進行集中統(tǒng)一分析,然而 大數(shù)據(jù)技術(shù)的前提是高效的數(shù)據(jù)集成。要為企業(yè)提供全面的數(shù)據(jù)共享,就需要把不同來源、 格式、特點性質(zhì)的數(shù)據(jù)在邏輯上或物理上有機地集中。 數(shù)據(jù)集成為各種異構(gòu)數(shù)據(jù)提供統(tǒng)一的表示、存儲和管理。數(shù)據(jù)集成屏蔽了...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。