亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種從文本中提取物品信息的方法和裝置制造方法

文檔序號:6635728閱讀:219來源:國知局
一種從文本中提取物品信息的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種從文本中提取物品信息的方法和裝置。該方法,包括:讀取文本中攜帶的文字內(nèi)容,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù);在物品信息列表中查找信息條目;將查找成功的信息條目對應(yīng)的信息數(shù)據(jù)添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目并將對應(yīng)的信息數(shù)據(jù)添加到物品信息列表。通過預(yù)設(shè)的信息提取策略從文本中獲取物品信息的相關(guān)內(nèi)容,再在物品信息列表中查找信息,將相關(guān)內(nèi)容直接添加或新建信息條目后添加,實現(xiàn)了物品信息的大數(shù)據(jù)快速收集保存。
【專利說明】一種從文本中提取物品信息的方法和裝置

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種從文本中提取物品信息的方法和裝置。

【背景技術(shù)】
[0002]當(dāng)前,電子商務(wù)快速發(fā)展,產(chǎn)品經(jīng)濟日趨繁榮,為廣大消費者提供了更多消費途徑的同時,也為電子商務(wù)網(wǎng)站為海量物品的信息處理提出了越來越高的要求。
[0003]在大量的物品信息的編輯過成中,如果全部靠人工對物品網(wǎng)頁對產(chǎn)品進行信息管理,需要投入龐大的人力和勞動時間,需要一種快速的數(shù)據(jù)處理方式對大量的物品信息進行快速處理。


【發(fā)明內(nèi)容】

[0004]本發(fā)明提供了一種從文本中提取物品信息的方法和裝置,該方法通過預(yù)設(shè)的信息提取策略從文本中獲取物品彳目息的相關(guān)內(nèi)容,再在物品彳目息列表中查找信息,將相關(guān)內(nèi)容直接添加或新建信息條目后添加,實現(xiàn)了物品信息的大數(shù)據(jù)快速收集保存。
[0005]為達此目的,本發(fā)明采用以下技術(shù)方案:
[0006]一方面提供一種從文本中提取物品信息的方法,包括:
[0007]讀取文本中攜帶的文字內(nèi)容,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù);
[0008]在物品信息列表中查找信息條目;
[0009]將查找成功的信息條目對應(yīng)的信息數(shù)據(jù)添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目并將對應(yīng)的信息數(shù)據(jù)添加到物品信息列表。
[0010]其中,所述物品為電子商務(wù)中的物品。
[0011]其中,所述信息條目包括物品的品牌、型號和價格。
[0012]其中,還包括:
[0013]當(dāng)提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應(yīng)的信息數(shù)據(jù)。
[0014]其中,所述信息條目還包括添加時間;
[0015]所述讀取文本中攜帶的文字內(nèi)容,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù),具體為:
[0016]讀取文本中攜帶的文字內(nèi)容并記錄讀取的時間作為添加時間,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù)。
[0017]另一方面提供一種從文本中提取物品信息的裝置,包括:
[0018]文本內(nèi)容讀取模塊,用于讀取文本中攜帶的文字內(nèi)容,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù);
[0019]信息條目查找模塊,用于在物品信息列表中查找信息條目;
[0020]信息數(shù)據(jù)添加模塊,用于將查找成功的信息條目對應(yīng)的信息數(shù)據(jù)添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目并將對應(yīng)的信息數(shù)據(jù)添加到物品信息列表。
[0021]其中,所述物品為電子商務(wù)中的物品。
[0022]其中,所述信息條目包括物品的品牌、型號和價格。
[0023]其中,還包括:
[0024]信息數(shù)據(jù)刪除模塊,用于當(dāng)提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應(yīng)的信息數(shù)據(jù)。
[0025]其中,所述信息條目還包括添加時間;
[0026]所述文本內(nèi)容讀取模塊,具體用于:
[0027]讀取文本中攜帶的文字內(nèi)容并記錄讀取的時間作為添加時間,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù)。
[0028]本發(fā)明的有益效果為:通過預(yù)設(shè)的信息提取策略從文本中獲取物品信息的相關(guān)內(nèi)容,再在物品信息列表中查找信息,將相關(guān)內(nèi)容直接添加或新建信息條目后添加,實現(xiàn)了物品信息的大數(shù)據(jù)快速收集保存。

【專利附圖】

【附圖說明】
[0029]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對本發(fā)明實施例描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)本發(fā)明實施例的內(nèi)容和這些附圖獲得其他的附圖。
[0030]圖1是本發(fā)明【具體實施方式】中提供的一種從文本中提取物品信息的方法的第一實施例的方法流程圖。
[0031]圖2是本發(fā)明【具體實施方式】中提供的一種從文本中提取物品信息的方法的第二實施例的方法流程圖。
[0032]圖3是本發(fā)明【具體實施方式】中提供的一種從文本中提取物品信息的裝置的第一實施例的結(jié)構(gòu)方框圖。
[0033]圖4是本發(fā)明【具體實施方式】中提供的一種從文本中提取物品信息的裝置的第二實施例的結(jié)構(gòu)方框圖。

【具體實施方式】
[0034]為使本發(fā)明解決的技術(shù)問題、采用的技術(shù)方案和達到的技術(shù)效果更加清楚,下面將結(jié)合附圖對本發(fā)明實施例的技術(shù)方案作進一步的詳細描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0035]請參考圖1,其是本發(fā)明【具體實施方式】中提供的一種從文本中提取物品信息的方法的第一實施例的方法流程圖。本發(fā)明中的從文本中提取物品信息的方法主要用于對物品信息進行自動收集,實現(xiàn)大數(shù)據(jù)的快速處理。如圖所示,該方法包括:
[0036]步驟3101:讀取文本中攜帶的文字內(nèi)容,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù)。
[0037]當(dāng)前許多電子商務(wù)網(wǎng)站都是通過多個供貨商提供各種物品,在通知供貨商供貨時準備好各種物品的相關(guān)物品信息,對于電子商務(wù)網(wǎng)站而言只需要將收到的物品信息集中處理即可,而對于供貨商,所有的物品信息在生產(chǎn)過程中已經(jīng)準備好,所需要做的僅僅是將需要的物品信息進行篩選提供即可。所以整個過程中,沒有增加供貨商的負擔(dān),電子商務(wù)網(wǎng)站也不需要重新對物品信息,特別是大數(shù)據(jù)的物品信息進行處理。
[0038]步驟S102:在物品信息列表中查找信息條目。
[0039]預(yù)先已經(jīng)設(shè)計好物品信息列表,在對物品信息進行處理時,直接根據(jù)提取到的信息條目進行查詢,對應(yīng)填入即可。
[0040]步驟S103:將查找成功的信息條目對應(yīng)的信息數(shù)據(jù)添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目并將對應(yīng)的信息數(shù)據(jù)添加到物品信息列表。
[0041]對于物品信息列表中已經(jīng)存在的條目,查找到之后直接信息數(shù)據(jù)對應(yīng)填入即可;而對于物品信息列表中尚未存在的信息條目,則在物品信息列表中增加新的信息條目,將對應(yīng)的信息數(shù)據(jù)添加到新增的信息條目。
[0042]綜上所述,通過預(yù)設(shè)的信息提取策略從文本中獲取物品信息的相關(guān)內(nèi)容,再在物品信息列表中查找信息,將相關(guān)內(nèi)容直接添加或新建信息條目后添加,實現(xiàn)了物品信息的大數(shù)據(jù)快速收集保存。
[0043]請參考圖2,其是本發(fā)明【具體實施方式】中提供的一種從文本中提取物品信息的方法的第二實施例的方法流程圖。如圖所示,該方法包括:
[0044]步驟S201:讀取文本中攜帶的文字內(nèi)容并記錄讀取的時間作為添加時間,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù)。
[0045]所述物品為電子商務(wù)中的物品。例如用于出售的某種手機。所述信息條目包括物品的品牌、型號和價格。例如A品牌的B型號的手機,價格為C元。
[0046]為了實現(xiàn)對物品信息的變化過程的記錄,在實際記錄過程中物品信息的添加時間,以實現(xiàn)對歷史物品信息的跟蹤。
[0047]在物品信息列表中,還可以為物品設(shè)置物品編號的信息條目,每一個新的物品賦予一個獨一無二的編號。
[0048]步驟S202:在物品信息列表中查找信息條目。
[0049]物品信息列表的處理過程可以視為對數(shù)據(jù)庫或表格的處理過程,在此不做進一步說明。
[0050]步驟S203:將查找成功的信息條目對應(yīng)的信息數(shù)據(jù)添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目并將對應(yīng)的信息數(shù)據(jù)添加到物品信息列表。
[0051]步驟S204:當(dāng)提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應(yīng)的信息數(shù)據(jù)。
[0052]為了使得物品信息列表中保存物品信息處于最新更新狀態(tài),將之前更新的物品信息予以刪除,當(dāng)然,這只是一種優(yōu)選的方式,也可以將所有的物品信息保存,從而方便對某一物品的信息變化過程進行全面統(tǒng)計和分析。對應(yīng)的,對于同一物品的物品信息的添加,可以不用更改物品編號,這里所說的物品信息是指具有相同的物理特征的物品,例如同一品牌、同一型號和同一配置的手機。
[0053]在實際的物品信息列表的使用過程中,也可建立物品信息列表與物品的網(wǎng)頁之間的關(guān)聯(lián),物品信息列表之中的數(shù)據(jù)跟新之后,直接對應(yīng)網(wǎng)頁中的物品信息進行更新,快速在后臺進行物品展示的相關(guān)工作。
[0054]綜上所述,通過預(yù)設(shè)的信息提取策略從文本中獲取物品信息的相關(guān)內(nèi)容,再在物品信息列表中查找信息,將相關(guān)內(nèi)容直接添加或新建信息條目后添加,實現(xiàn)了物品信息的大數(shù)據(jù)快速收集保存。同時,對物品信息的刪除也能減少物品信息列表中的冗余數(shù)據(jù)。
[0055]以下是本發(fā)明一種從文本中提取物品信息的裝置的實施例,裝置的實施例基于上述的方法的實施例實現(xiàn),在裝置的實施例中未盡的描述,請參考上述方法的實施例。
[0056]請參考圖3,其是本發(fā)明一種從文本中提取物品信息的裝置的第一實施例的結(jié)構(gòu)方框圖。如圖所示,該裝置包括:
[0057]文本內(nèi)容讀取模塊310,用于讀取文本中攜帶的文字內(nèi)容,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù);
[0058]信息條目查找模塊320,用于在物品信息列表中查找信息條目;
[0059]信息數(shù)據(jù)添加模塊330,用于將查找成功的信息條目對應(yīng)的信息數(shù)據(jù)添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目并將對應(yīng)的信息數(shù)據(jù)添加到物品信息列表。
[0060]綜上所述,在上述個模塊的協(xié)同工作下,通過預(yù)設(shè)的信息提取策略從文本中獲取物品信息的相關(guān)內(nèi)容,再在物品信息列表中查找信息,將相關(guān)內(nèi)容直接添加或新建信息條目后添加,實現(xiàn)了物品信息的大數(shù)據(jù)快速收集保存。
[0061]請參考圖4,其是本發(fā)明一種從文本中提取物品信息的裝置的第二實施例的結(jié)構(gòu)方框圖。如圖所示,該裝置包括:
[0062]文本內(nèi)容讀取模塊310,用于讀取文本中攜帶的文字內(nèi)容,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù);
[0063]信息條目查找模塊320,用于在物品信息列表中查找信息條目;
[0064]信息數(shù)據(jù)添加模塊330,用于將查找成功的信息條目對應(yīng)的信息數(shù)據(jù)添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目并將對應(yīng)的信息數(shù)據(jù)添加到物品信息列表。
[0065]其中,所述物品為電子商務(wù)中的物品。
[0066]其中,所述信息條目包括物品的品牌、型號和價格。
[0067]其中,還包括:
[0068]信息數(shù)據(jù)刪除模塊340,用于當(dāng)提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應(yīng)的信息數(shù)據(jù)。
[0069]其中,所述信息條目還包括添加時間;
[0070]所述文本內(nèi)容讀取模塊310,具體用于:
[0071]讀取文本中攜帶的文字內(nèi)容并記錄讀取的時間作為添加時間,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù)。
[0072]綜上所述,通過上述模塊的協(xié)同工作,通過預(yù)設(shè)的信息提取策略從文本中獲取物品信息的相關(guān)內(nèi)容,再在物品信息列表中查找信息,將相關(guān)內(nèi)容直接添加或新建信息條目后添加,實現(xiàn)了物品信息的大數(shù)據(jù)快速收集保存。同時,對物品信息的刪除也能減少物品信息列表中的冗余數(shù)據(jù)。
[0073]以上結(jié)合具體實施例描述了本發(fā)明的技術(shù)原理。這些描述只是為了解釋本發(fā)明的原理,而不能以任何方式解釋為對本發(fā)明保護范圍的限制。基于此處的解釋,本領(lǐng)域的技術(shù)人員不需要付出創(chuàng)造性的勞動即可聯(lián)想到本發(fā)明的其它【具體實施方式】,這些方式都將落入本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種從文本中提取物品信息的方法,其特征在于,包括: 讀取文本中攜帶的文字內(nèi)容,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù); 在物品信息列表中查找信息條目; 將查找成功的信息條目對應(yīng)的信息數(shù)據(jù)添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目并將對應(yīng)的信息數(shù)據(jù)添加到物品信息列表。
2.根據(jù)權(quán)利要求1所述的一種從文本中提取物品信息的方法,其特征在于,所述物品為電子商務(wù)中的物品。
3.根據(jù)權(quán)利要求2所述的一種從文本中提取物品信息的方法,其特征在于,所述信息條目包括物品的品牌、型號和價格。
4.根據(jù)權(quán)利要求3所述的一種從文本中提取物品信息的方法,其特征在于,還包括: 當(dāng)提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應(yīng)的信息數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的一種從文本中提取物品信息的方法,其特征在于,所述信息條目還包括添加時間; 所述讀取文本中攜帶的文字內(nèi)容,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù),具體為: 讀取文本中攜帶的文字內(nèi)容并記錄讀取的時間作為添加時間,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù)。
6.一種從文本中提取物品信息的裝置,其特征在于,包括: 文本內(nèi)容讀取模塊,用于讀取文本中攜帶的文字內(nèi)容,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù); 信息條目查找模塊,用于在物品信息列表中查找信息條目; 信息數(shù)據(jù)添加模塊,用于將查找成功的信息條目對應(yīng)的信息數(shù)據(jù)添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目并將對應(yīng)的信息數(shù)據(jù)添加到物品信息列表。
7.根據(jù)權(quán)利要求6所述的一種從文本中提取物品信息的裝置,其特征在于,所述物品為電子商務(wù)中的物品。
8.根據(jù)權(quán)利要求7所述的一種從文本中提取物品信息的裝置,其特征在于,所述信息條目包括物品的品牌、型號和價格。
9.根據(jù)權(quán)利要求8所述的一種從文本中提取物品信息的裝置,其特征在于,還包括: 信息數(shù)據(jù)刪除模塊,用于當(dāng)提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應(yīng)的信息數(shù)據(jù)。
10.根據(jù)權(quán)利要求6所述的一種從文本中提取物品信息的裝置,其特征在于,所述信息條目還包括添加時間; 所述文本內(nèi)容讀取模塊,具體用于: 讀取文本中攜帶的文字內(nèi)容并記錄讀取的時間作為添加時間,根據(jù)預(yù)設(shè)的信息提取策略從所述文字內(nèi)容中提取物品的至少一個信息條目及對應(yīng)的信息數(shù)據(jù)。
【文檔編號】G06Q30/02GK104375985SQ201410687153
【公開日】2015年2月25日 申請日期:2014年11月25日 優(yōu)先權(quán)日:2014年11月25日
【發(fā)明者】楊明坤 申請人:蘇州迪云信息科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1