專利名稱:一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別涉及一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的 方法和系統(tǒng)。
背景技術(shù):
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)上購(gòu)物蓬勃發(fā)展,出現(xiàn)了很多購(gòu)物類網(wǎng) 站,人們只需在購(gòu)物網(wǎng)站上注冊(cè),將商品信息傳遞到網(wǎng)上就可以足不出戶的 進(jìn)行交易。
例如,目前購(gòu)物網(wǎng)站淘寶網(wǎng)有1.8億商品,當(dāng)有賣家發(fā)布商品時(shí),每件商 品都對(duì)應(yīng)了名稱、圖片、簡(jiǎn)介說(shuō)明、價(jià)格區(qū)間和相關(guān)屬性,因此,這些商品 的數(shù)據(jù)存在大量的冗余。比如諾基亞的N73,現(xiàn)在是每個(gè)N73商品都會(huì)對(duì)應(yīng)各 自賣家發(fā)布的圖片、簡(jiǎn)介說(shuō)明、屬性等內(nèi)容。這就使得購(gòu)物網(wǎng)的數(shù)據(jù)庫(kù)需要 大量的存儲(chǔ)空間,現(xiàn)在購(gòu)物網(wǎng)使用的多數(shù)是產(chǎn)品庫(kù),需要運(yùn)營(yíng)人工維護(hù)大量 的產(chǎn)品。
在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問(wèn)題 現(xiàn)有技術(shù)中使用的是產(chǎn)品庫(kù),需要運(yùn)營(yíng)人工維護(hù)大量的產(chǎn)品,不夠靈活。 每件商品都對(duì)應(yīng)了名稱、圖片、簡(jiǎn)介說(shuō)明、價(jià)格區(qū)間和相關(guān)屬性,在這些商 品的數(shù)據(jù)存在大量的冗余,對(duì)商品進(jìn)行規(guī)范不方便;同時(shí),隨著網(wǎng)站的發(fā)展, 產(chǎn)品數(shù)量迅速增長(zhǎng),增加了運(yùn)營(yíng)人員的困難。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法和系統(tǒng),通過(guò)使用數(shù) 據(jù)倉(cāng)庫(kù)的挖掘算法,對(duì)后臺(tái)類目下同類屬性商品聚合分析,提取出標(biāo)準(zhǔn)屬性 單元,減少數(shù)據(jù)庫(kù)的存儲(chǔ)空間和圖片在網(wǎng)絡(luò)上的傳輸流量,解決了運(yùn)營(yíng)困難 的問(wèn)題。
5節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間 的方法,包括以下步驟
從商品信息中,提取出標(biāo)準(zhǔn)屬性單元,建立標(biāo)準(zhǔn)屬性單元庫(kù); 計(jì)算所述標(biāo)準(zhǔn)屬性單元庫(kù)中的標(biāo)準(zhǔn)屬性單元,生成標(biāo)準(zhǔn)屬性單元序列化
文件,定期推送所述標(biāo)準(zhǔn)屬性單元序列化文件;
判斷新發(fā)布商品和所迷標(biāo)準(zhǔn)屬性單元序列化文件是否匹配,如杲是,綁 定所述新發(fā)布商品和所匹配到的標(biāo)準(zhǔn)屬性單元。
本發(fā)明實(shí)施例另一方面提供了一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的系統(tǒng),包括
數(shù)據(jù)庫(kù),用于存儲(chǔ)商品信息和正式的標(biāo)準(zhǔn)屬性單元;
標(biāo)準(zhǔn)屬性單元服務(wù)器,用于緩存來(lái)自所述數(shù)據(jù)庫(kù)和后臺(tái)服務(wù)器的數(shù)據(jù), 包括來(lái)自所述數(shù)據(jù)庫(kù)的正式的標(biāo)準(zhǔn)屬性單元和商品屬性及來(lái)自所述后臺(tái)服務(wù) 器的正式的標(biāo)準(zhǔn)屬性單元,計(jì)算正式的標(biāo)準(zhǔn)屬性單元,生成標(biāo)準(zhǔn)屬性單元序 列化文件;
后臺(tái)服務(wù)器,用于根據(jù)來(lái)自所述標(biāo)準(zhǔn)屬性單元服務(wù)器的商品信息,生成 正式的標(biāo)準(zhǔn)屬性單元;
前臺(tái)服務(wù)器,用于接收來(lái)自所述標(biāo)準(zhǔn)屬性單元服務(wù)器的標(biāo)準(zhǔn)屬性單元序 列化文件,匹配商品和所匹配到的標(biāo)準(zhǔn)屬性單元。
與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn)
本發(fā)明實(shí)施例通過(guò)引入標(biāo)準(zhǔn)屬性單元表示商品的共同屬性,如果所發(fā)布 商品可以匹配到序列化文件中的標(biāo)準(zhǔn)屬性單元,則綁定商品和匹配的序列化 文件中的標(biāo)準(zhǔn)屬性單元,這樣既可以節(jié)約存儲(chǔ),便于規(guī)范商品;還可以通過(guò) 使用標(biāo)準(zhǔn)屬性單元的圖片來(lái)節(jié)省圖片存儲(chǔ)的空間,減少存儲(chǔ)開(kāi)銷及網(wǎng)絡(luò)流量。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所 需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā) 明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)"i并,在不付出創(chuàng)造性勞動(dòng)的前 提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施例一的一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法流程圖2是本發(fā)明實(shí)施例二的一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法流程圖; 圖3是本發(fā)明實(shí)施例三的一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法流程圖; 圖4是本發(fā)明實(shí)施例四的一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法流程圖; 圖5是本發(fā)明實(shí)施例五的一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的系統(tǒng)結(jié)構(gòu)圖; 圖6是本發(fā)明實(shí)施例五中數(shù)據(jù)庫(kù)的具體結(jié)構(gòu)圖; 圖7是本發(fā)明實(shí)施例五中標(biāo)準(zhǔn)屬性單元服務(wù)器的具體結(jié)構(gòu)圖; 圖8是本發(fā)明實(shí)施例五中后臺(tái)服務(wù)器的具體結(jié)構(gòu)圖; 圖9是本發(fā)明實(shí)施例五中前臺(tái)服務(wù)器的具體結(jié)構(gòu)圖。
具體實(shí)施例方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行 清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明的一部分實(shí)施例, 而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有 做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例一提供了一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法,如圖l所示,包 括以下步驟
步驟S101,從商品信息中,提取出正式的SPU (Standard Property Unit, 標(biāo)準(zhǔn)屬性單元),建立SPU庫(kù)。
利用搜索引擎從商品信息中搜索出商品的關(guān)鍵屬性,根據(jù)搜索出的商品 的關(guān)鍵屬性,使用數(shù)據(jù)庫(kù)的挖掘算法挖掘商品的共同屬性,根據(jù)挖掘的商品 的共同屬性,聚合分析提取出具有商品共同屬性的待審核的SPU,判斷審核 待審核的SPU是否為商品的共同屬性,如果是,則生成正式的SPU,建立SPU 庫(kù)。
SPU,定義為后臺(tái)標(biāo)準(zhǔn)類目葉子節(jié)點(diǎn)下一組共同屬性的集合,具有名稱、 簡(jiǎn)介、圖片(可以是多個(gè))、價(jià)格、主屬性、綁定屬性,并能關(guān)聯(lián)其它SPU。 在眾多商品中,服務(wù)器可以將具有某些相同屬性的商品歸類到一起,稱為一 個(gè)SPU, SPU以數(shù)據(jù)表的形式存儲(chǔ),數(shù)據(jù)表包含該SPU的SPU—ID,并通過(guò)類目ID字段外聯(lián)到類目,表示該SPU所屬類目,這樣,可以找到一個(gè)類目下
所有的SPU。 SPU可以重復(fù)使用。
步驟S102,計(jì)算SPU庫(kù)中的SPU,生成SPU序列化文件,按照設(shè)定的時(shí)間 間隔,定期向前臺(tái)推送SPU序列化文件。
其中,SPU序列化文件是數(shù)據(jù)庫(kù)中數(shù)據(jù)的集合,包含后臺(tái)類目、SPU和關(guān) 聯(lián)SPU等信息。例如手機(jī)諾基亞N73的SPU序列化文件中,后臺(tái)類目為手機(jī), 在該類目下可以找到一個(gè)SPU,該SPU包含品牌為諾基亞,型號(hào)為N73,操作 系統(tǒng)為***等信息,還可以找到關(guān)聯(lián)SPU (如手機(jī)諾基亞N73的電池的SPU)。
生成SPU序列化文件,具體可以為在后臺(tái)類目中獲取類目信息,根據(jù)得 到的類目信息通過(guò)訪問(wèn)SPU庫(kù)獲取該類目下所有的SPU,所獲取的SPU生成 SPU序列化文件。
步驟S103,判斷新發(fā)布商品和SPU序列化文件中的SPU是否匹配,如果是, 綁定新發(fā)布商品和匹配的SPU 。
具體的,綁定新發(fā)布商品和匹配的SPU為,建立新發(fā)布商品和上述的匹配 的SPU之間的對(duì)應(yīng)關(guān)系,并保存該對(duì)應(yīng)關(guān)系,用于后續(xù)操作。
如果新發(fā)布商品可以匹配到序列化文件中的SPU,將匹配成功的SPU和該
新發(fā)布的商品建立對(duì)應(yīng)關(guān)系,未匹配成功的屬性為商品的特有屬性,保存在 屬性字段中。
通過(guò)本發(fā)明實(shí)施例的技術(shù)方案,使用數(shù)據(jù)庫(kù)的挖掘算法,對(duì)后臺(tái)類目下
的同類屬性商品提取聚合分析,把商品具有的相同特征抽取出來(lái),引入SPU 表示商品的共同屬性,如果新發(fā)布商品匹配到序列化文件中的SPU,則綁定商 品和匹配的序列化文件中的SPU,從而將網(wǎng)站中上億的商品變成百萬(wàn)級(jí)別數(shù)量 的SPU,這樣既可以節(jié)約存儲(chǔ),便于規(guī)范商品;還可以通過(guò)使用SPU的圖片來(lái) 節(jié)省圖片存儲(chǔ)的空間,減少存儲(chǔ)開(kāi)銷及網(wǎng)絡(luò)流量。
本發(fā)明實(shí)施例二提供了一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法,如圖2所示,包 括以下步驟
步驟S201 ,利用搜索引擎搜索數(shù)據(jù)庫(kù)中商品的關(guān)鍵屬性。 搜索引擎搜索的是預(yù)先整理好的索引數(shù)據(jù)庫(kù)。搜索引擎,指收集了上幾千萬(wàn)到幾十億個(gè)商品屬性并對(duì)商品屬性中的每一個(gè)屬性和屬性值組合進(jìn)行索 引,建立索引數(shù)據(jù)庫(kù)的全文搜索引擎。當(dāng)查找某個(gè)主屬性的時(shí)候,所有包含 了該屬性和屬性值組合的商品屬性都將作為搜索結(jié)果被搜出來(lái)。
步驟S202,根據(jù)步驟S201搜索出的商品的關(guān)鍵屬性,使用數(shù)據(jù)庫(kù)的挖掘 算法,挖掘出商品的共同屬性。
DM (Data Mining,數(shù)據(jù)挖掘)是從大型數(shù)據(jù)庫(kù)的數(shù)據(jù)中提取人們感興趣的 知識(shí)。這些知識(shí)是隱含的、事先未知的、潛在有用的信息,提取的知識(shí)表示 為概念(Concepts)、規(guī)則(Rules)、規(guī)律(Regularities)、模式(Pattems)等形式。這 種定義^te數(shù)據(jù)挖掘的對(duì)象定義為數(shù)據(jù)庫(kù),而更廣義的說(shuō)法是數(shù)據(jù)挖掘是在 一些事實(shí)或觀察數(shù)據(jù)的集合中尋找模式的決策支持過(guò)程。數(shù)據(jù)挖掘的對(duì)象不 僅是數(shù)據(jù)庫(kù),也可以是文件系統(tǒng),或其他任何組織在一起的數(shù)據(jù)集合。數(shù)據(jù) 挖掘的最終目的是發(fā)現(xiàn)人們不易察覺(jué)的、隱含的才莫式。 一般說(shuō)來(lái),這些模式 中最易于理解的是統(tǒng)計(jì)模型。其次是對(duì)數(shù)據(jù)的外圍檢測(cè),對(duì)大規(guī)模數(shù)據(jù)集的 模式識(shí)別、分類或聚類。最后是從理論和計(jì)算上解決在大多數(shù)數(shù)據(jù)庫(kù)管理系 統(tǒng)中存在的多維空間和大量的數(shù)據(jù)處理的問(wèn)題。
搜索引擎搜索出數(shù)據(jù)庫(kù)中商品的關(guān)鍵屬性后,使用數(shù)據(jù)庫(kù)的挖掘算法對(duì) 數(shù)據(jù)庫(kù)中商品的屬性進(jìn)一步挖掘,計(jì)算出商品的共同屬性。這里所說(shuō)的商品 的共同屬性是指大量數(shù)據(jù)中存在的規(guī)律性或不同特征屬性值之間存在的[if then]規(guī)則。從大量數(shù)據(jù)中獲取商品共同屬性的有兩個(gè)含義首先,與科學(xué)發(fā) 現(xiàn)有關(guān)。從觀測(cè)客觀世界的大量實(shí)驗(yàn)數(shù)據(jù)(往往是數(shù)值)中發(fā)現(xiàn)數(shù)據(jù)的整體 結(jié)構(gòu)特性和數(shù)據(jù)之間的函數(shù)關(guān)系,并根據(jù)統(tǒng)計(jì)特征推斷客觀世界中存在的規(guī)
律性;其次,與商業(yè)數(shù)據(jù)等事實(shí)數(shù)據(jù)所構(gòu)成的數(shù)據(jù)庫(kù)中發(fā)現(xiàn)其中隱含的規(guī)則 或規(guī)律性有關(guān)。第二類是將人工智能技術(shù)與數(shù)據(jù)庫(kù)理論相融合的應(yīng)用性研究 課題。
步驟S203,根據(jù)步驟S202挖掘的商品的共同屬性,對(duì)后臺(tái)類目下同類屬 性商品聚合分析,提取出具有商品共同屬性的待審核的SPU。
后臺(tái)類目是指產(chǎn)品的類型,比如手機(jī)、mp3等。后臺(tái)類目的結(jié)構(gòu)包括后臺(tái) 標(biāo)準(zhǔn)類目表、產(chǎn)品相關(guān)屬性、相關(guān)SPU。步驟S204,審核待審核的SPU,提取出正式的SPU。步驟S203提取出的SPU 有可能不是很準(zhǔn)確,需要人工進(jìn)行審核,判斷待審核的SPU是否是商品具有的 共同屬性,如果是,則生成正式的SPU,放入SPU庫(kù)中。
步驟S205,正式的SPU經(jīng)過(guò)計(jì)算生成SPU序列化文件,在設(shè)定程序的控制 下,定時(shí)向前臺(tái)推送SPU序列化文件。
步驟S206,判斷新發(fā)布商品和步驟S205定時(shí)推送的SPU序列化文件是否 匹配。當(dāng)賣家發(fā)布商品時(shí),首先需要點(diǎn)選商品的屬性,將賣家點(diǎn)選的屬性和 定時(shí)向前臺(tái)推送的SPU序列化文件進(jìn)行匹配,如果匹配成功,則將商品與匹配 成功的SPU綁定,未匹配成功的屬性為商品的特有屬性,保存在屬性字段中。
本發(fā)明實(shí)施例三還提供了 一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法,如圖3所示, 包括以下步驟
步驟S301,利用搜索引擎自動(dòng)搜索數(shù)據(jù)庫(kù)中商品的關(guān)鍵屬性。例如,搜 索手機(jī)諾基亞N73,搜索引擎搜索到手機(jī)諾基亞N73的屬性,包括品牌諾 基亞;型號(hào)N73;操作系統(tǒng)***等。
步驟S302,根據(jù)步驟S301搜索出的商品的關(guān)鍵屬性,使用數(shù)據(jù)庫(kù)的挖掘 算法,挖掘出商品的共同屬性。例如,經(jīng)過(guò)搜索得到了手機(jī)諾基亞N73的屬性 集合,應(yīng)用數(shù)據(jù)庫(kù)的挖掘算法計(jì)算搜索出的手機(jī)諾基亞N73的關(guān)鍵屬性,提取 出手機(jī)諾基亞N73的共同屬性品牌是諾基亞,型號(hào)是N73,存儲(chǔ)卡是***, 操作系統(tǒng)是***等。
步驟S303,根據(jù)步驟S302挖掘的商品的共同屬性,對(duì)后臺(tái)類目下同類屬 性商品聚合分析,提取出具有商品共同屬性的待審核的SPU。后臺(tái)類目為手機(jī), 根據(jù)數(shù)據(jù)庫(kù)挖掘算法挖掘出的商品的共同屬性,通過(guò)聚合分析等技術(shù),提取 出手機(jī)諾基亞N73的共同特征,生成待審核的SPU,手機(jī)諾基亞N73相關(guān)屬性 (如手機(jī)配件等)則生成手機(jī)諾基亞N73的待審核的相關(guān)SPU。
步驟S304,審核待審核的SPU,批準(zhǔn)成正式的SPU。步驟S303提取出的SPU 有可能不是很準(zhǔn)確,需要人工進(jìn)行審核,判斷待審核的SPU是否是商品具有的 共同屬性,如果是,則生成正式的SPU,放入SPU庫(kù)中。
10步驟S305,正式的SPU經(jīng)過(guò)計(jì)算生成SPU序列化文件,在設(shè)定程序的控制下,定時(shí)向前臺(tái)推送SPU序列化文件。
步驟S306,判斷新發(fā)布商品和步驟S305定時(shí)推送的SPU序列化文件是否匹配。當(dāng)賣家發(fā)布商品時(shí),首先需要點(diǎn)選商品的屬性,將賣家點(diǎn)選的屬性和定時(shí)推送的SPU序列化文件進(jìn)行匹配,如果匹配成功,則將商品與匹配成功的SPU綁定,未匹配成功的屬性為商品的特有屬性,保存在屬性字段中。賣家發(fā)布商品為手機(jī)諾基亞N73,將商品和手機(jī)諾基亞N73的SPU綁定,且手機(jī)諾基亞N73的SPU可以關(guān)聯(lián)相關(guān)的SPU (如手機(jī)諾基亞N73的電池的SPU)。
本發(fā)明實(shí)施例四還提供了 一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法,如圖4所示,包括以下步驟
步驟S401,利用搜索引擎搜索數(shù)據(jù)庫(kù)中商品的關(guān)鍵屬性。例如,搜索手機(jī)諾基亞N73、手機(jī)諾基亞N72、手機(jī)諾基亞N76,搜索引擎搜索到手機(jī)諾基亞N73、手機(jī)諾基亞N72、手機(jī)諾基亞N76的屬性,包括商品品牌、操作系統(tǒng)、存儲(chǔ)卡類型、鈴聲類型、高級(jí)特性、像素等。
步驟S402,根據(jù)步驟S401搜索出的商品的關(guān)鍵屬性,使用數(shù)據(jù)庫(kù)的挖掘算法,挖掘出商品的共同屬性。例如,經(jīng)過(guò)搜索得到了手機(jī)諾基亞N73、手機(jī)諾基亞N72、手機(jī)諾基亞N76的屬性集合,數(shù)椐庫(kù)的挖掘算法計(jì)算搜索出的屬性,分別提取出機(jī)諾基亞N73、手機(jī)諾基亞N72、手機(jī)諾基亞N76的共同屬性。
步驟S403,根據(jù)步驟S302挖掘的商品的共同屬性,對(duì)后臺(tái)類目下同類屬性商品聚合分析,提取出具有商品共同屬性的待審核的SPU。根據(jù)數(shù)據(jù)庫(kù)挖掘算法挖掘出的商品的共同屬性,通過(guò)提取聚合分析等技術(shù),分別提取出手機(jī)諾基亞N73、手機(jī)諾基亞N72、手機(jī)諾基亞N76的共同特征,生成待審核的SPU,相關(guān)屬性(如手機(jī)配件等)則分別生成手機(jī)諾基亞N73、手機(jī)諾基亞N72、手機(jī)諾基亞N76的待審核的相關(guān)SPU。
步驟S404,審核待審核的SPU,提取出正式的SPU。步驟S403提取出的SPU有可能不是很準(zhǔn)確,需要人工進(jìn)行審核,判斷待審核的SPU是否是商品具有的共同屬性,如果是,則生成正式的SPU,分別是手機(jī)諾基亞N73、手機(jī)諾基亞N72、手機(jī)諾基亞N76的SPU和手機(jī)諾基亞N73、手機(jī)諾基亞N72、手機(jī)諾基亞N76的相關(guān)SPU,放入SPU庫(kù)。
步驟S405,步驟S404獲得的正式的SPU為細(xì)粒度的SPU,都具有相同的屬性,經(jīng)過(guò)計(jì)算算出手機(jī)諾基亞N73、手機(jī)諾基亞N72、手機(jī)諾基亞N76的SPU的共同屬性,得到手機(jī)諾基亞N系列的SPU,即細(xì)粒度的SPU組裝成粗粒度的SPU。
步驟S406,正式的SPU經(jīng)過(guò)計(jì)算生成SPU序列化文件,在設(shè)定程序的控制下,定時(shí)向前臺(tái)推送SPU序列化文件。
步驟S407,判斷新發(fā)布商品和步驟S305定時(shí)推送的SPU序列化文件是否匹配。當(dāng)賣家發(fā)布商品時(shí),首先需要點(diǎn)選商品的屬性,將賣家點(diǎn)選的屬性和定時(shí)推送的SPU序列化文件進(jìn)行匹配,如果匹配成功,則將商品與匹配成功的SPU綁定,未匹配成功的屬性為商品的特有屬性,保存在屬性字段中。
本發(fā)明實(shí)施例五提供了一節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的系統(tǒng),如圖5所示,包括DB (database,數(shù)據(jù)庫(kù))510, SPU服務(wù)器520,后臺(tái)服務(wù)器530,前臺(tái)服務(wù)器540。
其中,DB510,用于存儲(chǔ)商品信息和正式的SPU。
例如,在購(gòu)物網(wǎng)站淘寶網(wǎng)上,賣家在發(fā)布商品時(shí),每件商品都對(duì)應(yīng)了名稱、圖片、簡(jiǎn)介說(shuō)明、價(jià)格區(qū)間及相關(guān)屬性等信息,這些信息都存儲(chǔ)在DB510中。來(lái)自SPU服務(wù)器520的正式的SPU,也存儲(chǔ)在DB510中。
DB5IO是依照某種數(shù)據(jù)模型組織起來(lái)并存放在二級(jí)存儲(chǔ)器中的數(shù)據(jù)集合。這種數(shù)據(jù)集合具有如下特點(diǎn)盡可能不重復(fù),以最優(yōu)方式為某個(gè)特定組織的多種應(yīng)用服務(wù),數(shù)據(jù)結(jié)構(gòu)獨(dú)立于使用的應(yīng)用程序,對(duì)數(shù)據(jù)的增、刪、改和檢索由統(tǒng)一軟件管理和控制。數(shù)據(jù)庫(kù)是數(shù)據(jù)管理的高級(jí)階段,由文件管理系統(tǒng)發(fā)展而來(lái)。
SPU服務(wù)器520,用于緩存來(lái)自DB510和后臺(tái)服務(wù)器530的數(shù)據(jù),包括來(lái)自DB510的正式的SPU和商品屬性及來(lái)自后臺(tái)服務(wù)器530的正式的SPU。其中,正式的SPU經(jīng)過(guò)計(jì)算生成SPU序列化文件,在設(shè)定程序的控制下,定時(shí)向前臺(tái)服務(wù)器540推送SPU序列化文件;發(fā)送商品屬性到后臺(tái)服務(wù)器530,接收經(jīng)過(guò)后臺(tái)服務(wù)器530的處理生成正式的SPU,發(fā)送給DB510。
后臺(tái)服務(wù)器530,用于根據(jù)來(lái)自SPU服務(wù)器520的商品屬性,經(jīng)過(guò)程序自動(dòng)生成待審核SPU,然后經(jīng)過(guò)運(yùn)營(yíng)審核,生成正式SPU。后臺(tái)服務(wù)器530使用搜索引擎搜索來(lái)自SPU服務(wù)器520的商品屬性,提取出商品的關(guān)鍵屬性,應(yīng)用數(shù)據(jù)庫(kù)挖掘算法挖掘出商品的共同屬性,將共同屬性聚合分析,得到具有商品共同屬性的待審核的SPU,審核待審核的SPU是否為商品的共同屬性,如果是,則生成正式的SPU,發(fā)送正式的SPU到SPU服務(wù)器520。
前臺(tái)服務(wù)器540,用于接收SPU服務(wù)器520定時(shí)推送的SPU序列化文件,匹配商品和序列化文件中的SPU。前臺(tái)服務(wù)器540接收并保存SPU服務(wù)器520定時(shí)推送的SPU序列化文件。當(dāng)賣家發(fā)布商品時(shí),首先需要點(diǎn)選商品的屬性,將賣家點(diǎn)選的屬性和前臺(tái)服務(wù)器540存儲(chǔ)的SPU序列化文件中的SPU進(jìn)行匹配,如果匹配成功,則將商品與匹配成功的SPU綁定,未匹配成功的屬性為商品的特有屬性,保存在屬性字段中。
其中,DB510結(jié)構(gòu)如圖6所示,具體包括第一存儲(chǔ)模塊511,第二存儲(chǔ)模塊512。
第 一存儲(chǔ)模塊511,用于存儲(chǔ)來(lái)自SPU服務(wù)器520的具有商品共同屬性的正式的SPU。
第二存儲(chǔ)模塊512,用于存儲(chǔ)所有商品信息。
SPU服務(wù)器520結(jié)構(gòu)如圖7所示,具體包括接收模塊521,計(jì)算模塊522,控制模塊523,第一發(fā)送模塊524,第二發(fā)送模塊525。
接收模塊521,用于接收來(lái)自DB510的正式的SPU和商品信息及來(lái)自第二發(fā)送模塊525的正式的SPU,其中,來(lái)自DB510的正式的SPU發(fā)送給計(jì)算模塊522,來(lái)自DB510的商品信息發(fā)送給第二發(fā)送模塊525,來(lái)自第二發(fā)送模塊525的正式的SPU發(fā)送給DB510 。
計(jì)算模塊522 ,用于根據(jù)來(lái)自接收模塊521的正式的SPU計(jì)算得到SPU序列化文件,向第一發(fā)送模塊524發(fā)送SPU序列化文件。
第一發(fā)送模塊524,用于在控制模塊523的控制下發(fā)送來(lái)自計(jì)算模塊522的SPU序列化文件。
第二發(fā)送模塊525,用于向后臺(tái)服務(wù)器530發(fā)送商品信息及接收后臺(tái)服務(wù)器530生成的正式的SPU。
控制模塊523,用于通過(guò)設(shè)置傳送SPU序列化文件的時(shí)間間隔,控制第一發(fā)送模塊524定時(shí)傳送SPU序列化文件。
后臺(tái)服務(wù)器530,具體包括獲取模塊531,搜索模塊532,挖掘模塊533,聚類模塊534,運(yùn)營(yíng)模塊535。
獲取模塊531,用于從DB510獲取商品信息,并將商品信息傳遞給搜索模塊532。
搜索模塊532,用于搜索來(lái)自獲取模塊531的商品屬性,獲取商品的關(guān)鍵屬性。
挖掘模塊533,用于接收搜索模塊532搜索的商品關(guān)鍵屬性,使用數(shù)據(jù)庫(kù)的挖掘算法進(jìn)一步提取出商品的共同屬性。
聚類模塊534,用于聚類分析挖掘模塊533提取的商品的共同屬性,生成待審核的SPU。
運(yùn)營(yíng)模塊535,用于接收聚類模塊534生成的待審核的SPU,通過(guò)運(yùn)營(yíng)小二審核待審核的SPU,判斷待審核的SPU是否具有商品的共同屬性,如果是,生成正式的SPU,將正式的SPU發(fā)送給SPU服務(wù)器520。
前臺(tái)服務(wù)器540,具體包括接收模塊541,判斷模塊542,綁定模塊543,合并模塊544。
接收模塊541 ,用于接收來(lái)自SPU服務(wù)器520的SPU序列化文件和賣家發(fā)布商品時(shí)商品的信息,包括所屬類目,屬性等。
判斷模塊542,用于判斷來(lái)自接收模塊541的賣家發(fā)布商品的屬性和SPU序列化文件中的SPU是否匹配。
綁定模塊543,根據(jù)判斷模塊542的判斷結(jié)果,進(jìn)行商品和SPU序列化文件的綁定,如果匹配成功,則將商品與匹配成功的SPU綁定。
合并模塊544,用于當(dāng)買(mǎi)家查看商品詳情時(shí),合并所述綁定模塊543綁定的標(biāo)準(zhǔn)屬性單元中的標(biāo)準(zhǔn)屬性和商品的個(gè)性屬性,展示給買(mǎi)家。
14上述模塊可以分布于一個(gè)裝置,也可以分布于多個(gè)裝置。上述模塊可以合并為一個(gè)模塊,也可以進(jìn)一步拆分成多個(gè)子^^莫塊。
綜上所述,通過(guò)本發(fā)明實(shí)施例的技術(shù)方案,引入SPU表示商品的共同屬性,將網(wǎng)站中上億的商品變成百萬(wàn)級(jí)別數(shù)量的SPU,既可以節(jié)約存儲(chǔ),便于規(guī)范商
品;還可以通過(guò)使用SPU的圖片來(lái)節(jié)省圖片存儲(chǔ)的空間,減少存儲(chǔ)開(kāi)銷及網(wǎng)絡(luò)流量。
通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可以通過(guò)硬件實(shí)現(xiàn),也可以借助軟件加必要的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn)?;谶@樣的理解,本發(fā)明的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該軟件產(chǎn)品可以存儲(chǔ)在一個(gè)非易失性存儲(chǔ)介質(zhì)(可以是CD-ROM, U盤(pán),移動(dòng)硬盤(pán)等)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
本領(lǐng)域技術(shù)人員可以理解附圖只是一個(gè)優(yōu)選實(shí)施例的示意圖,附圖中的模塊或流程并不一定是實(shí)施本發(fā)明所必需的。
本領(lǐng)域技術(shù)人員可以理解實(shí)施例裝置中的模塊可以按照實(shí)施例描述分布于實(shí)施例的裝置中,也可以進(jìn)行相應(yīng)變化位于不同于本實(shí)施例的一個(gè)或多個(gè)裝置中。上述實(shí)施例的模塊可以合并為一個(gè)模塊,也可以進(jìn)一步拆分成多個(gè)子模塊。
上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。以上公開(kāi)的僅為本發(fā)明的幾個(gè)具體實(shí)施例,但是,本發(fā)明并非局限于此,任何本領(lǐng)域的技術(shù)人員能思之的變化都應(yīng)落入本發(fā)明的保護(hù)范圍。
權(quán)利要求
1、一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法,其特征在于,包括從商品信息中,提取出標(biāo)準(zhǔn)屬性單元,建立標(biāo)準(zhǔn)屬性單元庫(kù);計(jì)算所述標(biāo)準(zhǔn)屬性單元庫(kù)中的標(biāo)準(zhǔn)屬性單元,生成標(biāo)準(zhǔn)屬性單元序列化文件,定期推送所述標(biāo)準(zhǔn)屬性單元序列化文件;判斷新發(fā)布商品和所述標(biāo)準(zhǔn)屬性單元序列化文件中的標(biāo)準(zhǔn)屬性單元是否匹配,如果是,綁定所述新發(fā)布商品和所述匹配的標(biāo)準(zhǔn)屬性單元。
2、 如權(quán)利要求l所述的方法,其特征在于,所述提取出標(biāo)準(zhǔn)屬性單元具 體包括利用搜索引擎從所述商品信息中搜索出商品的關(guān)鍵屬性; 根據(jù)所述搜索出的商品的關(guān)鍵屬性,使用數(shù)據(jù)庫(kù)的挖掘算法挖掘商品的 共同屬性;根據(jù)所述挖掘算法挖掘的商品的共同屬性,聚合分析提取出具有商品共 同屬性的待審核的標(biāo)準(zhǔn)屬性單元;審核所述待審核的標(biāo)準(zhǔn)屬性單元是否為商品的共同屬性,如果是,則批 準(zhǔn)成正式的標(biāo)準(zhǔn)屬性單元。
3、 如權(quán)利要求2所述的方法,其特征在于,所述待審核的標(biāo)準(zhǔn)屬性單元包括商品的標(biāo)準(zhǔn)屬性單元和相關(guān)屬性的屬性 單元。
4、 如權(quán)利要求2所述的方法,其特征在于,所述正式的標(biāo)準(zhǔn)屬性單元為細(xì)粒度標(biāo)準(zhǔn)屬性單元和粗粒度標(biāo)準(zhǔn)屬性單 元,所述粗粒度標(biāo)準(zhǔn)屬性單元由所述細(xì)粒度標(biāo)準(zhǔn)屬性單元組裝構(gòu)成。
5、 一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的系統(tǒng),其特征在于,包括 數(shù)據(jù)庫(kù),用于存儲(chǔ)商品信息和正式的標(biāo)準(zhǔn)屬性單元; 標(biāo)準(zhǔn)屬性單元服務(wù)器,用于緩存來(lái)自所述數(shù)據(jù)庫(kù)和后臺(tái)服務(wù)器的數(shù)據(jù),包括來(lái)自所述數(shù)據(jù)庫(kù)的正式的標(biāo)準(zhǔn)屬性單元和商品屬性及來(lái)自所述后臺(tái)服務(wù) 器的正式的標(biāo)準(zhǔn)屬性單元,計(jì)算所述正式的標(biāo)準(zhǔn)屬性單元,生成標(biāo)準(zhǔn)屬性單 元序列化文件;后臺(tái)服務(wù)器,用于根據(jù)來(lái)自所述標(biāo)準(zhǔn)屬性單元服務(wù)器的商品屬性,生成正式的標(biāo)準(zhǔn)屬性單元;前臺(tái)服務(wù)器,用于接收來(lái)自所述標(biāo)準(zhǔn)屬性單元服務(wù)器的標(biāo)準(zhǔn)屬性單元序 列化文件,匹配商品和所述匹配的標(biāo)準(zhǔn)屬性單元。
6、 如權(quán)利要求5所述的系統(tǒng),其特征在于,所述數(shù)據(jù)庫(kù)具體包括 第一存儲(chǔ)模塊,用于存儲(chǔ)來(lái)自所述標(biāo)準(zhǔn)屬性單元服務(wù)器的具有商品共同屬性的正式的標(biāo)準(zhǔn)屬性單元;第二存儲(chǔ)模塊,用于存儲(chǔ)所述商品信息。
7、 如權(quán)利要求5所述的系統(tǒng),其特征在于,所述標(biāo)準(zhǔn)屬性單元服務(wù)器具 體包括接收模塊,用于接收來(lái)自所述數(shù)據(jù)庫(kù)的正式的標(biāo)準(zhǔn)屬性單元和所述商品 信息及來(lái)自第二發(fā)送模塊的正式的標(biāo)準(zhǔn)屬性單元,將來(lái)自所述數(shù)據(jù)庫(kù)的正式 的標(biāo)準(zhǔn)屬性單元發(fā)送給計(jì)算模塊,商品信息發(fā)送給所述第二發(fā)送模塊,將來(lái) 自所述第二發(fā)送模塊的正式的標(biāo)準(zhǔn)屬性單元發(fā)送給所述數(shù)據(jù)庫(kù);計(jì)算模塊,用于根據(jù)來(lái)自所述接收模塊的正式的標(biāo)準(zhǔn)屬性單元計(jì)算得到 標(biāo)準(zhǔn)屬性單元序列化文件,向第一發(fā)送模塊發(fā)送所述標(biāo)準(zhǔn)屬性單元序列化文 件;第一發(fā)送模塊,用于在控制模塊的控制下向所述前臺(tái)服務(wù)器發(fā)送來(lái)自所 述計(jì)算模塊的標(biāo)準(zhǔn)屬性單元序列化文件;第二發(fā)送模塊,用于向所述后臺(tái)服務(wù)器發(fā)送所述商品信息及接收所述后 臺(tái)服務(wù)器生成的正式的標(biāo)準(zhǔn)屬性單元;控制模塊,用于控制所述第一發(fā)送模塊定時(shí)傳送所述標(biāo)準(zhǔn)屬性單元序列 化文件。
8、 如權(quán)利要求5所述的系統(tǒng),其特征在于,所述后臺(tái)服務(wù)器具體包括 獲取模塊,用于從所述數(shù)據(jù)庫(kù)獲取商品信息,并將所述商品信息傳遞給搜索模塊;搜索模塊,用于利用搜索引擎搜索來(lái)自所述獲取模塊的商品信息,獲取 商品的關(guān)鍵屬性;挖掘模塊,用于接收所述搜索模塊搜索的商品關(guān)鍵屬性,使用數(shù)據(jù)庫(kù)的挖掘算法進(jìn)一 步挖掘出商品的共同屬性;聚類模塊,用于聚類分析所述挖掘模塊挖掘的商品的共同屬性,生成待審核的標(biāo)準(zhǔn)屬性單元;運(yùn)營(yíng)模塊,用于接收所述聚類模塊生成的待審核的標(biāo)準(zhǔn)屬性單元,判斷 生成正式的標(biāo)準(zhǔn)屬性單元,將所述正式的標(biāo)準(zhǔn)屬性單元發(fā)送給所述標(biāo)準(zhǔn)屬性 單元服務(wù)器。
9、如權(quán)利要求5所述的系統(tǒng),其特征在于,所述前臺(tái)服務(wù)器具體包括 接收模塊,用于接收來(lái)自所述標(biāo)準(zhǔn)屬性單元服務(wù)器的標(biāo)準(zhǔn)屬性單元序列化文件和賣家發(fā)布商品時(shí)商品的信息;判斷模塊,用于判斷來(lái)自所述接收模塊接收的賣家發(fā)布商品時(shí)商品的信息和所述標(biāo)準(zhǔn)屬性單元序列化文件中的標(biāo)準(zhǔn)屬性單元是否匹配;綁定模塊,用于根據(jù)所述判斷模塊的判斷結(jié)果,綁定商品和匹配成功的 標(biāo)準(zhǔn)屬性單元;合并模塊用于當(dāng)買(mǎi)家查看商品詳情時(shí),合并所述綁定模塊綁定的標(biāo)準(zhǔn) 屬性單元中的標(biāo)準(zhǔn)屬性和商品的個(gè)性屬性,展示給買(mǎi)家。
全文摘要
本發(fā)明公開(kāi)了一種節(jié)約數(shù)據(jù)庫(kù)存儲(chǔ)空間的方法和系統(tǒng),該方法包括以下步驟從商品信息中,提取出標(biāo)準(zhǔn)屬性單元,建立標(biāo)準(zhǔn)屬性單元庫(kù);計(jì)算所述標(biāo)準(zhǔn)屬性單元庫(kù)中的標(biāo)準(zhǔn)屬性單元,生成標(biāo)準(zhǔn)屬性單元序列化文件,定期推送所述標(biāo)準(zhǔn)屬性單元序列化文件;判斷新發(fā)布商品和所述標(biāo)準(zhǔn)屬性單元序列化文件中的標(biāo)準(zhǔn)屬性單元是否匹配,如果是,綁定所述新發(fā)布商品和所述匹配的標(biāo)準(zhǔn)屬性單元。在具體實(shí)現(xiàn)中,采用該方法能夠有效地節(jié)約存儲(chǔ)的空間,減少網(wǎng)絡(luò)流量。
文檔編號(hào)G06F17/30GK101650717SQ20081014705
公開(kāi)日2010年2月17日 申請(qǐng)日期2008年8月13日 優(yōu)先權(quán)日2008年8月13日
發(fā)明者岳旭強(qiáng), 靈 曹, 晨 朱, 科 靳, 駱靜峰, 虎 魏 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司