專利名稱:根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于文件存儲(chǔ)管理技術(shù)領(lǐng)域,具體涉及一種根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法及系統(tǒng)。
背景技術(shù):
文件管理是操作系統(tǒng)的五大職能之一,主要涉及文件的邏輯組織和物理組織,目錄的結(jié)構(gòu)和管理。所謂文件管理,就是操作系統(tǒng)中實(shí)現(xiàn)文件統(tǒng)一管理的一組軟件、被管理的文件以及為實(shí)施文件管理所需要的一些數(shù)據(jù)結(jié)構(gòu)的總稱(是操作系統(tǒng)中負(fù)責(zé)存取和管理文件信息的機(jī)構(gòu))從系統(tǒng)角度來(lái)看,文件系統(tǒng)是對(duì)文件存儲(chǔ)器的存儲(chǔ)空間進(jìn)行組織,分配和回收,負(fù)責(zé)文件的存儲(chǔ),檢索,共享和保護(hù)?,F(xiàn)有的文件存儲(chǔ)管理技術(shù)是以文件路徑和文件名作為條件去判斷文件的唯一性,進(jìn)而實(shí)現(xiàn)文件的存儲(chǔ),同時(shí)需要手動(dòng)為文件添加標(biāo)簽,未能實(shí)現(xiàn)文件多重信息的標(biāo)簽歸類,不利于文件的分類管理和查找。比如A文件夾中存儲(chǔ)有第一季度的財(cái)務(wù)報(bào)告、第一季度的生產(chǎn)報(bào)告、第一季度的安全報(bào)告等等,在B文件夾中存儲(chǔ)有第二季度的財(cái)務(wù)報(bào)告、第二季度的生產(chǎn)報(bào)告、第二季度的安全報(bào)告等等,如果用戶要查看財(cái)務(wù)報(bào)告,就需要到每個(gè)文件夾去查找出來(lái)再集合到一塊供用戶使用。這種依靠文件路徑和文件名的方式,使得文件查找和管理效率低下,尤其是數(shù)據(jù)龐大的時(shí)候,比如調(diào)取十年的財(cái)務(wù)報(bào)告。
發(fā)明內(nèi)容
為了解決上述問(wèn)題,本發(fā)明的目的在于提供一種根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法及系統(tǒng),以優(yōu)化文件分類管理和查找。為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明所采取的技術(shù)方案如下一種根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法,包括以下步驟根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息;根據(jù)第一文件的屬性信息生成第一文件標(biāo)簽集合,所述第一文件標(biāo)簽集合中包括有多個(gè)文件標(biāo)簽;在文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找是否已經(jīng)存在與所述第一文件相同的文件特征碼信息,所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)包括一存儲(chǔ)文件內(nèi)容的文件內(nèi)容存儲(chǔ)單元、一存儲(chǔ)文件特征碼信息的文件特征碼信息存儲(chǔ)單元、以及一存儲(chǔ)文件標(biāo)簽集合的文件標(biāo)簽集合存儲(chǔ)單元,在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中同一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合具有一一對(duì)應(yīng)綁定關(guān)系;若已存在,則根據(jù)所述文件特征碼信息在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找出與該文件特征碼信息一一對(duì)應(yīng)的第二文件標(biāo)簽集合,比對(duì)所述第一文件標(biāo)簽集合與第二文件標(biāo)簽集合,并將存在于所述第一文件標(biāo)簽集合中且不存在于第二文件標(biāo)簽集合中的文件標(biāo)簽信息添加到第二文件標(biāo)簽集合中;
若不存在,則將所述第一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合分別存儲(chǔ)至所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)的文件特征碼信息存儲(chǔ)單元、文件內(nèi)容存儲(chǔ)單元和文件標(biāo)簽集合存儲(chǔ)單元中。進(jìn)一步的,所述根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi)容--對(duì)應(yīng)的文
件特征碼信息,具體是根據(jù)第一文件內(nèi)容信息采用散列算法計(jì)算獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息。進(jìn)一步的,所述散列算法為MD5算法或者SHAl算法。進(jìn)一步的,所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)為數(shù)組與鏈表的集合、或者數(shù)據(jù)庫(kù)。一種根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的系統(tǒng),包括以下模塊文件特征碼信息生成模塊,用于根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi) 容一一對(duì)應(yīng)的文件特征碼信息;文件標(biāo)簽集合生成模塊,用于根據(jù)第一文件的屬性信息生成第一文件標(biāo)簽集合,所述第一文件標(biāo)簽集合中包括有多個(gè)文件標(biāo)簽;相同文件特征碼查詢模塊,用于在文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找是否已經(jīng)存在與所述第一文件相同的文件特征碼信息;若已存在,則執(zhí)行文件標(biāo)簽集合更新模塊;若不存在,則執(zhí)行文件添加模塊;所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)包括一存儲(chǔ)文件內(nèi)容的文件內(nèi)容存儲(chǔ)單元、一存儲(chǔ)文件特征碼信息的文件特征碼信息存儲(chǔ)單元、以及一存儲(chǔ)文件標(biāo)簽集合的文件標(biāo)簽集合存儲(chǔ)單元,在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中同一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合具有對(duì)應(yīng)綁定關(guān)系;文件標(biāo)簽集合更新模塊,用于根據(jù)所述文件特征碼信息在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找出與該文件特征碼信息一一對(duì)應(yīng)的第二文件標(biāo)簽集合,比對(duì)所述第一文件標(biāo)簽集合與第二文件標(biāo)簽集合,并將存在于所述第一文件標(biāo)簽集合中且不存在于第二文件標(biāo)簽集合中的文件標(biāo)簽信息添加到第二文件標(biāo)簽集合中;文件添加模塊,用于將所述第一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合分別存儲(chǔ)至所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)的文件特征碼信息存儲(chǔ)單元、文件內(nèi)容存儲(chǔ)單元和文件標(biāo)簽集合存儲(chǔ)單元中。進(jìn)一步的,所述文件特征碼信息生成模塊根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息,具體是根據(jù)第一文件內(nèi)容信息采用散列算法計(jì)算獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息。進(jìn)一步的,所述散列算法為MD5算法或者SHAl算法。進(jìn)一步的,所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)為數(shù)組與鏈表的集合、或者數(shù)據(jù)庫(kù)。本發(fā)明利用文件特征碼算法為每一文件根據(jù)文件內(nèi)容計(jì)算特征碼,確定文件的唯一性,在此基礎(chǔ)上為文件自動(dòng)添加文件標(biāo)簽,實(shí)現(xiàn)文件、文件特征碼、文件標(biāo)簽的綁定存儲(chǔ)。進(jìn)而利用同一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合具有一一對(duì)應(yīng)綁定關(guān)系,實(shí)現(xiàn)文件的多重信息存儲(chǔ)管理,可讓使用者根據(jù)自己對(duì)文檔文件已知的文件標(biāo)簽信息快速查找目標(biāo)文件。因此,采用本發(fā)明方法和系統(tǒng),可實(shí)現(xiàn)文件的多重信息存儲(chǔ)管理,提高文件的分類管理和查找效率。
此
所提供的圖片用來(lái)輔助對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定,在附圖中圖1是本發(fā)明方法的流程圖;圖2是本發(fā)明系統(tǒng)對(duì)應(yīng)的框圖。
具體實(shí)施例方式如圖1所示,本實(shí)施例公開(kāi)了一種根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法,包括以下步驟(I)根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息;本步驟的目的在于獲取與文件內(nèi)容唯一對(duì)應(yīng)的文件特征碼,文件特征碼的計(jì)算方法可以采用現(xiàn)有散列算法,如MD5算法或者SHAl算法,兩種算法都是根據(jù)文件內(nèi)容計(jì)算獲得所述文件特征碼;本步驟所述的第一文件即是需要添加文件標(biāo)簽的文件,所述第一文件的內(nèi)容信息是指存儲(chǔ)在外部介質(zhì)上的數(shù)據(jù)的集合,比如一個(gè)word文件,其中記錄I萬(wàn)字的故事,那么這一萬(wàn)字就是文件內(nèi)容信息;因?yàn)槲募卣鞔a具有唯一性,可以通過(guò)本步驟獲得文件特征碼唯一標(biāo)識(shí)和查找文件,比如兩個(gè)不同名稱的文件,其文件內(nèi)容是完全相同的,如果采用了文件特征碼來(lái)標(biāo)識(shí)它,就不會(huì)混亂,在管理時(shí)也可以避免同一文件放在不同目錄或者應(yīng)用不同名稱重復(fù)存儲(chǔ)占用存儲(chǔ)空間,進(jìn)而有利于優(yōu)化文件存儲(chǔ)管理;(2)根據(jù)第一文件的屬性信息生成第一文件標(biāo)簽集合,所述第一文件標(biāo)簽集合中包括有多個(gè)文件標(biāo)簽;所述第一文件的屬性信息包括文件名、文件大小、文件創(chuàng)建時(shí)間、查看時(shí)間、文字?jǐn)?shù)量、全文摘要等等,包括文件固有的屬性信息和用戶自定義的屬性信息兩部分,固有屬性信息如頁(yè)數(shù)、作者、標(biāo)題、文件大小、文字?jǐn)?shù)量、可自動(dòng)總結(jié)的全文摘要等,自定義屬性信息主要是指外界為文件添加的其他屬性信息如操作系統(tǒng)記錄的文件創(chuàng)建時(shí)間、操作系統(tǒng)記錄的文件修改時(shí)間、操作系統(tǒng)記錄的文件查看時(shí)間、操作系統(tǒng)記錄的文件名、手動(dòng)添加的作者名、手動(dòng)添加的摘要、手動(dòng)指定的關(guān)鍵詞、手動(dòng)標(biāo)明的用途等;文件標(biāo)簽,就是與某個(gè)文件屬性相對(duì)應(yīng)的、用以表針文件特性的標(biāo)簽,比如文件頁(yè)碼數(shù)為A、文件作者為B的屬性信息就對(duì)應(yīng)生成“A”與“B”的文件標(biāo)簽;需要說(shuō)明的是,文件標(biāo)簽與文件屬性不是完全一一對(duì)應(yīng)的關(guān)系,一個(gè)文件屬性可以對(duì)應(yīng)多個(gè)關(guān)聯(lián)的標(biāo)簽項(xiàng),例如一個(gè)文件于三個(gè)不同的時(shí)間段進(jìn)行查閱,則文件查看時(shí)間這個(gè)屬性即可對(duì)應(yīng)三個(gè)關(guān)于文件查看時(shí)間的標(biāo)簽;所謂的文件標(biāo)簽集合,就是所有與文件屬性對(duì)應(yīng)的標(biāo)簽的集合;(3)在文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找是否已經(jīng)存在與所述第一文件相同的文件特征碼信息,所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)包括一存儲(chǔ)文件內(nèi)容的文件內(nèi)容存儲(chǔ)單元、一存儲(chǔ)文件特征碼信息的文件特征碼信息存儲(chǔ)單元、以及一存儲(chǔ)文件標(biāo)簽集合的文件標(biāo)簽集合存儲(chǔ)單元,在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中同一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合具有一一對(duì)應(yīng)綁定關(guān)系;本步驟實(shí)際是向文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中添加第一文件前,看看文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中是否已經(jīng)存在第一文件,因?yàn)槲募卣鞔a是唯一標(biāo)識(shí)文件的信息,所以通過(guò)判斷文件特征碼信息是否已經(jīng)存在,就可以判斷該文件是否存在;所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)為數(shù)組與鏈表的集合、或者數(shù)據(jù)庫(kù),就是用于存放數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu),可以是現(xiàn)有的關(guān)系數(shù)據(jù)庫(kù)或其他非關(guān)系數(shù)據(jù)庫(kù),也可以是任何一種可以存儲(chǔ)信息的數(shù)據(jù)結(jié)構(gòu)的軟件實(shí)現(xiàn),比如一個(gè)多維數(shù)組、鏈表,都算數(shù)據(jù)存儲(chǔ)系統(tǒng);若已存在,則執(zhí)行第(41)步;若不存在,則執(zhí)行第(42)
I K
少;(41)根據(jù)所述文件特征碼信息在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找出與該文件特征碼信息一一對(duì)應(yīng)的第二文件標(biāo)簽集合,比對(duì)所述第一文件標(biāo)簽集合與第二文件標(biāo)簽集合,并將存在于所述第一文件標(biāo)簽集合中且不存在于第二文件標(biāo)簽集合中的文件標(biāo)簽信息添加到第二文件標(biāo)簽集合中;本步驟是在文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中已經(jīng)存儲(chǔ)有該文件的情況下,檢測(cè)其文件標(biāo)簽是不是有更新,如果有新的標(biāo)簽內(nèi)容產(chǎn)生就把新產(chǎn)生的文件標(biāo)簽添加到原來(lái)的標(biāo)簽集合中去,以更加豐富的記載文件屬性信息,以便于分類管理;(42)將所述第一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合分別存儲(chǔ)至所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)的文件特征碼信息存儲(chǔ)單元、文件內(nèi)容存儲(chǔ)單元和文件標(biāo)簽集合存儲(chǔ)單元中;本步驟就是將文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中不存在的文件的相關(guān)信息都存儲(chǔ)在其中,以便于管理查找。本實(shí)施例還公開(kāi)了一種與前述方法完全對(duì)應(yīng)的根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的系統(tǒng),包括以下模塊文件特征碼信息生成模塊1,用于根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息,具體可是根據(jù)第一文件內(nèi)容信息采用散列算法計(jì)算獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息,所述散列算法為MD5算法或者SHAl算法。文件標(biāo)簽集合生成模塊2,用于根據(jù)第一文件的屬性信息生成第一文件標(biāo)簽集合,所述第一文件標(biāo)簽集合中包括有多個(gè)文件標(biāo)簽;相同文件特征碼查詢模塊3,用于在文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找是否已經(jīng)存在與所述第一文件相同的文件特征碼信息;若已存在,則執(zhí)行文件標(biāo)簽集合更新模塊4 ;若不存在,則執(zhí)行文件添加模塊5 ;所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)包括一存儲(chǔ)文件內(nèi)容的文件內(nèi)容存儲(chǔ)單元、一存儲(chǔ)文件特征碼信息的文件特征碼信息存儲(chǔ)單元、以及一存儲(chǔ)文件標(biāo)簽集合的文件標(biāo)簽集合存儲(chǔ)單元,在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中同一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合具有一一對(duì)應(yīng)綁定關(guān)系;所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)為數(shù)組與鏈表的集合、或者數(shù)據(jù)庫(kù);文件標(biāo)簽集合更新模塊4,用于根據(jù)所述文件特征碼信息在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找出與該文件特征碼信息一一對(duì)應(yīng)的第二文件標(biāo)簽集合,比對(duì)所述第一文件標(biāo)簽集合與第二文件標(biāo)簽集合,并將存在于所述第一文件標(biāo)簽集合中且不存在于第二文件標(biāo)簽集合中的文件標(biāo)簽信息添加到第二文件標(biāo)簽集合中;文件添加模塊5,用于將所述第一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合分別存儲(chǔ)至所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)的文件特征碼信息存儲(chǔ)單元、文件內(nèi)容存儲(chǔ)單元和文件標(biāo)簽集合存儲(chǔ)單元中。本發(fā)明提出一種根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法,通過(guò)文件特征碼算法為每一個(gè)文件的內(nèi)容計(jì)算特定的文件特征碼,以此作為條件判斷文件的唯一性,并根據(jù)文件屬性信息自動(dòng)為文件生成文件標(biāo)簽,在數(shù)據(jù)存儲(chǔ)系統(tǒng)中實(shí)現(xiàn)文件、文件特征碼與文件標(biāo)簽的綁定存儲(chǔ),此外,保持文件標(biāo)簽信息的更新存儲(chǔ),從而實(shí)現(xiàn)文件多重信息類別的
存儲(chǔ)管理。
比如A文件夾中存儲(chǔ)有第一季度的財(cái)務(wù)報(bào)告、第一季度的生產(chǎn)報(bào)告、第一季度的安全報(bào)告等等,在B文件夾中存儲(chǔ)有第二季度的財(cái)務(wù)報(bào)告、第二季度的生產(chǎn)報(bào)告、第二季度的安全報(bào)告等等。通過(guò)以上實(shí)施例公開(kāi)的方法或系統(tǒng)可以為A文件夾中的第一季度的財(cái)務(wù)報(bào)告、第一季度的生產(chǎn)報(bào)告、第一季度的安全報(bào)告分別生成一個(gè)標(biāo)簽集合,包括多個(gè)文件標(biāo)簽存儲(chǔ)路徑、名稱、創(chuàng)建時(shí)間等等;為B文件夾中的第二季度的財(cái)務(wù)報(bào)告、第二季度的生產(chǎn)報(bào)告、第二季度的安全報(bào)告分別生成一個(gè)標(biāo)簽集合,包括多個(gè)文件標(biāo)簽存儲(chǔ)路徑、名稱、創(chuàng)建時(shí)間等等。那么在查找和管理文件時(shí),就不再單純的利用文件存儲(chǔ)路徑和文件名來(lái)管理文件,可以利用文件的所有屬性來(lái)管理文件;比如用戶要查找財(cái)務(wù)報(bào)告,就可以快速地在各個(gè)文件標(biāo)簽集合中查找出具有文件標(biāo)簽為財(cái)務(wù)報(bào)告的文件出來(lái),從而提高其分類管理效率。以上詳細(xì)描述了本發(fā)明的較佳具體實(shí)施例,應(yīng)當(dāng)理解,本領(lǐng)域的普通技術(shù)無(wú)需創(chuàng)造性勞動(dòng)就可以根據(jù)本發(fā)明的構(gòu)思做出諸多修改和變化。因此,凡本技術(shù)領(lǐng)域中技術(shù)人員依本發(fā)明構(gòu)思在現(xiàn)有技術(shù)基礎(chǔ)上通過(guò)邏輯分析、推理或者根據(jù)有限的實(shí)驗(yàn)可以得到的技術(shù)方案,均應(yīng)該在由本權(quán)利要求書(shū)所確定的保護(hù)范圍之中。
權(quán)利要求
1.一種根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法,其特征在于包括以下步驟 根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息; 根據(jù)第一文件的屬性信息生成第一文件標(biāo)簽集合,所述第一文件標(biāo)簽集合中包括有多個(gè)文件標(biāo)簽; 在文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找是否已經(jīng)存在與所述第一文件相同的文件特征碼信息,所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)包括一存儲(chǔ)文件內(nèi)容的文件內(nèi)容存儲(chǔ)單元、一存儲(chǔ)文件特征碼信息的文件特征碼信息存儲(chǔ)單元、以及一存儲(chǔ)文件標(biāo)簽集合的文件標(biāo)簽集合存儲(chǔ)單元,在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中同一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合具有一一對(duì)應(yīng)綁定關(guān)系; 若已存在,則根據(jù)所述文件特征碼信息在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找出與該文件特征碼信息一一對(duì)應(yīng)的第二文件標(biāo)簽集合,比對(duì)所述第一文件標(biāo)簽集合與第二文件標(biāo)簽集合,并將存在于所述第一文件標(biāo)簽集合中且不存在于第二文件標(biāo)簽集合中的文件標(biāo)簽信息添加到第二文件標(biāo)簽集合中; 若不存在,則將所述第一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合分別存儲(chǔ)至所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)的文件特征碼信息存儲(chǔ)單元、文件內(nèi)容存儲(chǔ)單元和文件標(biāo)簽集合存儲(chǔ)單元中。
2.根據(jù)權(quán)利要求1所述的根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法,其特征在于 所述根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息,具體是根據(jù)第一文件內(nèi)容信息采用散列算法計(jì)算獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息。
3.根據(jù)權(quán)利要求2所述的根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法,其特征在于 所述散列算法為MD5算法或者SHAl算法。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法,其特征在于 所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)為數(shù)組與鏈表的集合、或者數(shù)據(jù)庫(kù)。
5.一種根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的系統(tǒng),其特征在于包括以下模塊 文件特征碼信息生成模塊,用于根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息; 文件標(biāo)簽集合生成模塊,用于根據(jù)第一文件的屬性信息生成第一文件標(biāo)簽集合,所述第一文件標(biāo)簽集合中包括有多個(gè)文件標(biāo)簽; 相同文件特征碼查詢模塊,用于在文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找是否已經(jīng)存在與所述第一文件相同的文件特征碼信息;若已存在,則執(zhí)行文件標(biāo)簽集合更新模塊;若不存在,則執(zhí)行文件添加模塊;所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)包括一存儲(chǔ)文件內(nèi)容的文件內(nèi)容存儲(chǔ)單元、一存儲(chǔ)文件特征碼信息的文件特征碼信息存儲(chǔ)單元、以及一存儲(chǔ)文件標(biāo)簽集合的文件標(biāo)簽集合存儲(chǔ)單元,在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中同一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合具有一一對(duì)應(yīng)綁定關(guān)系; 文件標(biāo)簽集合更新模塊,用于根據(jù)所述文件特征碼信息在所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找出與該文件特征碼信息一一對(duì)應(yīng)的第二文件標(biāo)簽集合,比對(duì)所述第一文件標(biāo)簽集合與第二文件標(biāo)簽集合,并將存在于所述第一文件標(biāo)簽集合中且不存在于第二文件標(biāo)簽集合中的文件標(biāo)簽信息添加到第二文件標(biāo)簽集合中; 文件添加模塊,用于將所述第一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合分別存儲(chǔ)至所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)的文件特征碼信息存儲(chǔ)單元、文件內(nèi)容存儲(chǔ)單元和文件標(biāo)簽集合存儲(chǔ)單元中。
6.根據(jù)權(quán)利要求5所述的根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的系統(tǒng),其特征在于 所述文件特征碼信息生成模塊根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息,具體是根據(jù)第一文件內(nèi)容信息采用散列算法計(jì)算獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息。
7.根據(jù)權(quán)利要求6所述的根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的系統(tǒng),其特征在于 所述散列算法為MD5算法或者SHAl算法。
8.根據(jù)權(quán)利要求5-7任一項(xiàng)所述的根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的系統(tǒng),其特征在于 所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)為數(shù)組與鏈表的集合、或者數(shù)據(jù)庫(kù)。
全文摘要
本發(fā)明屬于文件存儲(chǔ)管理技術(shù)領(lǐng)域,具體公開(kāi)了一種根據(jù)文件特征碼為文件自動(dòng)添加文件標(biāo)簽的方法及系統(tǒng)。本發(fā)明方法是根據(jù)第一文件的內(nèi)容信息獲得與所述第一文件內(nèi)容一一對(duì)應(yīng)的文件特征碼信息,再根據(jù)第一文件的屬性信息生成第一文件標(biāo)簽集合,在文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中查找是否已經(jīng)存在與所述第一文件相同的文件特征碼信息,若已存在,則將存在于所述第一文件標(biāo)簽集合中且不存在于第二文件標(biāo)簽集合中的文件標(biāo)簽信息添加到第二文件標(biāo)簽集合中;若不存在,則將所述第一文件的文件特征碼信息、文件內(nèi)容和文件標(biāo)簽集合分別存儲(chǔ)至所述文件特征碼數(shù)據(jù)存儲(chǔ)系統(tǒng)中。本發(fā)明方法和系統(tǒng)可實(shí)現(xiàn)文件的多重信息存儲(chǔ)管理,提高文件的分類管理和查找效率。
文檔編號(hào)G06F17/30GK102999637SQ20121059051
公開(kāi)日2013年3月27日 申請(qǐng)日期2012年12月29日 優(yōu)先權(quán)日2012年12月29日
發(fā)明者王暉, 黃祖瑩 申請(qǐng)人:珠海金山辦公軟件有限公司, 北京金山辦公軟件有限公司