本發(fā)明涉及數(shù)據(jù)存儲(chǔ),尤其涉及一種結(jié)構(gòu)化報(bào)表管理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在當(dāng)今的數(shù)據(jù)驅(qū)動(dòng)型社會(huì)中,企業(yè)和組織在運(yùn)營(yíng)過(guò)程中會(huì)產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)經(jīng)過(guò)處理和分析后以報(bào)表的形式呈現(xiàn),為決策提供重要依據(jù)。隨著數(shù)據(jù)量的不斷增長(zhǎng)和數(shù)據(jù)類型的日益多樣化,傳統(tǒng)的報(bào)表存儲(chǔ)方式逐漸暴露出諸多問(wèn)題。
2、現(xiàn)有技術(shù)在非結(jié)構(gòu)化的存儲(chǔ)環(huán)境中,報(bào)表文件的查找、檢索和管理變得極為困難,耗費(fèi)大量的時(shí)間和人力成本。同時(shí),不同部門和系統(tǒng)生成的報(bào)表格式各異,缺乏統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范,導(dǎo)致數(shù)據(jù)的整合與共享面臨巨大挑戰(zhàn),嚴(yán)重影響了工作效率和決策的及時(shí)性。此外,傳統(tǒng)存儲(chǔ)方式在數(shù)據(jù)的安全性和完整性方面也存在隱患,容易受到數(shù)據(jù)丟失、篡改和泄露的威脅。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種結(jié)構(gòu)化報(bào)表管理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),以通過(guò)結(jié)構(gòu)化處理和索引優(yōu)化,大幅提高數(shù)據(jù)檢索速度,減少等待時(shí)間。
2、根據(jù)本發(fā)明的一方面,提供了一種結(jié)構(gòu)化報(bào)表管理方法,該方法包括:
3、獲取原始報(bào)表文件,對(duì)原始報(bào)表文件進(jìn)行處理以生成結(jié)構(gòu)化數(shù)據(jù);
4、根據(jù)結(jié)構(gòu)化數(shù)據(jù)建立索引,根據(jù)索引和結(jié)構(gòu)化數(shù)據(jù)生成存儲(chǔ)數(shù)據(jù);
5、獲取用戶查詢請(qǐng)求,基于查詢請(qǐng)求從存儲(chǔ)數(shù)據(jù)中確定目標(biāo)數(shù)據(jù),根據(jù)目標(biāo)數(shù)據(jù)生成重建報(bào)表。
6、可選的,對(duì)原始報(bào)表文件進(jìn)行處理以生成結(jié)構(gòu)化數(shù)據(jù),包括:識(shí)別原始報(bào)表文件的文件格式和內(nèi)容結(jié)構(gòu);基于文件格式和內(nèi)容結(jié)構(gòu)對(duì)原始報(bào)表文件進(jìn)行數(shù)據(jù)抽取,以生成各抽取數(shù)據(jù),其中,抽取數(shù)據(jù)包括單元格數(shù)據(jù)、格式、樣式和嵌入圖表;對(duì)各抽取數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理以生成結(jié)構(gòu)化數(shù)據(jù)。
7、可選的,根據(jù)結(jié)構(gòu)化數(shù)據(jù)建立索引,包括:將單元格數(shù)據(jù)對(duì)應(yīng)的結(jié)構(gòu)化數(shù)據(jù)作為第一數(shù)據(jù),將格式、樣式和嵌入圖表對(duì)應(yīng)的結(jié)構(gòu)化數(shù)據(jù)作為第二數(shù)據(jù);確定第一數(shù)據(jù)中的關(guān)鍵字段,針對(duì)關(guān)鍵字段建立第一索引;針對(duì)第二數(shù)據(jù)建立第二索引。
8、可選的,根據(jù)索引和結(jié)構(gòu)化數(shù)據(jù)生成存儲(chǔ)數(shù)據(jù),包括:將結(jié)構(gòu)化數(shù)據(jù)進(jìn)行壓縮以生成壓縮數(shù)據(jù);根據(jù)壓縮數(shù)據(jù)和索引的對(duì)應(yīng)關(guān)系以生成存儲(chǔ)數(shù)據(jù)。
9、可選的,基于查詢請(qǐng)求從存儲(chǔ)數(shù)據(jù)中確定目標(biāo)數(shù)據(jù),包括:通過(guò)查詢請(qǐng)求對(duì)存儲(chǔ)數(shù)據(jù)的索引進(jìn)行匹配,以獲取與查詢請(qǐng)求對(duì)應(yīng)的目標(biāo)索引;從存儲(chǔ)數(shù)據(jù)中獲取與目標(biāo)索引對(duì)應(yīng)的目標(biāo)壓縮數(shù)據(jù)作為目標(biāo)數(shù)據(jù)。
10、可選的,根據(jù)目標(biāo)數(shù)據(jù)生成重建報(bào)表,包括:對(duì)目標(biāo)數(shù)據(jù)進(jìn)行解壓以生成解壓后的目標(biāo)數(shù)據(jù);確定解壓后的目標(biāo)數(shù)據(jù)對(duì)應(yīng)的目標(biāo)報(bào)表元素,其中,目標(biāo)報(bào)表元素包括目標(biāo)單元格數(shù)據(jù)、目標(biāo)格式、目標(biāo)樣式和目標(biāo)嵌入圖表;通過(guò)報(bào)表工具根據(jù)目標(biāo)報(bào)表元素生成重建報(bào)表。
11、可選的,方法,還包括:對(duì)存儲(chǔ)數(shù)據(jù)進(jìn)行定期評(píng)估以確定評(píng)估結(jié)果,其中,評(píng)估結(jié)果包括查詢頻率和數(shù)據(jù)更新頻率;根據(jù)評(píng)估結(jié)果確定調(diào)整參數(shù),根據(jù)調(diào)整參數(shù)對(duì)存儲(chǔ)數(shù)據(jù)進(jìn)行調(diào)整,其中,調(diào)整參數(shù)包括索引結(jié)構(gòu)參數(shù)和數(shù)據(jù)壓縮參數(shù)。
12、根據(jù)本發(fā)明的另一方面,提供了一種結(jié)構(gòu)化報(bào)表管理裝置,該裝置包括:
13、結(jié)構(gòu)化數(shù)據(jù)生成模塊,用于獲取原始報(bào)表文件,對(duì)原始報(bào)表文件進(jìn)行處理以生成結(jié)構(gòu)化數(shù)據(jù);
14、存儲(chǔ)數(shù)據(jù)生成模塊,用于根據(jù)結(jié)構(gòu)化數(shù)據(jù)建立索引,根據(jù)索引和結(jié)構(gòu)化數(shù)據(jù)生成存儲(chǔ)數(shù)據(jù);
15、重建報(bào)表生成模塊,用于獲取用戶查詢請(qǐng)求,基于查詢請(qǐng)求從存儲(chǔ)數(shù)據(jù)中確定目標(biāo)數(shù)據(jù),根據(jù)目標(biāo)數(shù)據(jù)生成重建報(bào)表。
16、根據(jù)本發(fā)明的另一方面,提供了一種電子設(shè)備,所述電子設(shè)備包括:
17、至少一個(gè)處理器;
18、以及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;
19、其中,所述存儲(chǔ)器存儲(chǔ)有能夠被所述至少一個(gè)處理器執(zhí)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本發(fā)明任一實(shí)施例所述的一種結(jié)構(gòu)化報(bào)表管理方法。
20、根據(jù)本發(fā)明的另一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)本發(fā)明任一實(shí)施例所述的一種結(jié)構(gòu)化報(bào)表管理方法。
21、本發(fā)明實(shí)施例的技術(shù)方案,通過(guò)獲取原始報(bào)表文件并處理生成結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)了對(duì)報(bào)表文件的規(guī)范化和標(biāo)準(zhǔn)化,提高了數(shù)據(jù)的質(zhì)量和可用性。根據(jù)結(jié)構(gòu)化數(shù)據(jù)建立索引,顯著提升了數(shù)據(jù)的檢索速度和效率。根據(jù)索引和結(jié)構(gòu)化數(shù)據(jù)生成存儲(chǔ)數(shù)據(jù),優(yōu)化了數(shù)據(jù)的存儲(chǔ)方式,減少了存儲(chǔ)空間的占用,同時(shí)提高了數(shù)據(jù)的存儲(chǔ)安全性和穩(wěn)定性。在面對(duì)大量報(bào)表數(shù)據(jù)時(shí),能夠根據(jù)用戶查詢請(qǐng)求快速為用戶提供準(zhǔn)確、有價(jià)值的報(bào)表信息,節(jié)省了查詢時(shí)間,增強(qiáng)了用戶體驗(yàn),有助于提高報(bào)表文件管理的效率和質(zhì)量,提升數(shù)據(jù)的價(jià)值和利用度。
22、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本發(fā)明的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本發(fā)明的范圍。本發(fā)明的其它特征將通過(guò)以下的說(shuō)明書而變得容易理解。
1.一種結(jié)構(gòu)化報(bào)表管理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述原始報(bào)表文件進(jìn)行處理以生成結(jié)構(gòu)化數(shù)據(jù),包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述結(jié)構(gòu)化數(shù)據(jù)建立索引,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述索引和所述結(jié)構(gòu)化數(shù)據(jù)生成存儲(chǔ)數(shù)據(jù),包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述基于所述查詢請(qǐng)求從所述存儲(chǔ)數(shù)據(jù)中確定目標(biāo)數(shù)據(jù),包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述目標(biāo)數(shù)據(jù)生成重建報(bào)表,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法,還包括:
8.一種結(jié)構(gòu)化報(bào)表管理裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
10.一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,所述計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7中任一項(xiàng)所述的方法。