一種采用模板方式抽取結(jié)構(gòu)化信息的方法
【專利摘要】本發(fā)明公開了一種采用模板方式抽取結(jié)構(gòu)化信息的方法,它包括如下步驟:選定結(jié)構(gòu)化信息的抽取對(duì)象,再根據(jù)抽取對(duì)象配置抽取模板,所述抽取模板中設(shè)置好的需要抽取的信息;將抽取對(duì)象導(dǎo)入步驟1)配置完畢的抽取模板,所述抽取模板根據(jù)預(yù)先設(shè)置的信息,對(duì)抽取對(duì)象進(jìn)行抽取操作,獲得需要的結(jié)構(gòu)化信息;所述結(jié)構(gòu)化信息抽取完畢后,經(jīng)打包處理發(fā)送至目標(biāo)單元。本發(fā)明的有益效果在于:結(jié)構(gòu)簡(jiǎn)單,設(shè)計(jì)巧妙,通過(guò)采用功能化的結(jié)構(gòu)設(shè)計(jì),克服了傳統(tǒng)技術(shù)中的不足,填補(bǔ)了相關(guān)市場(chǎng)的空白,從而實(shí)現(xiàn)本發(fā)明的目的。
【專利說(shuō)明】ー種采用模板方式抽取結(jié)構(gòu)化信息的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息處理軟件領(lǐng)域,具體的說(shuō),特別涉及到ー種采用模板方式抽取結(jié)構(gòu)化信息的方法。
【背景技術(shù)】
[0002]互連網(wǎng)上出現(xiàn)的海量信息,大概分為結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化三種。結(jié)構(gòu)化信息如電子商務(wù)信息,信息的性質(zhì)和量值的出現(xiàn)的位置是固定的;半結(jié)構(gòu)化的信息如專業(yè)網(wǎng)站上的細(xì)分頻道,其標(biāo)題和正文的語(yǔ)法相當(dāng)規(guī)范,關(guān)鍵詞的范圍相當(dāng)局限;非結(jié)構(gòu)化的信息如BLOG和BBS,所有內(nèi)容都是不可預(yù)知的。
[0003]結(jié)構(gòu)化信息和非結(jié)構(gòu)化信息是IT應(yīng)用的兩個(gè)世界,它們有著各自不同的應(yīng)用進(jìn)化特點(diǎn)和規(guī)律。但是,這兩個(gè)世界之間還缺少相互連接的橋梁,而這種缺失使企業(yè)中不可避免地存在“活動(dòng)”、“信息和知識(shí)”的分離,其后果就是:雖然它們都在進(jìn)行著“知識(shí)化”的努力,但兩個(gè)世界分離的IT應(yīng)用模式,注定使其難以真正實(shí)現(xiàn)它們的初衷——“在最合適的時(shí)間,將最合適的信息傳送給最合適的人。
[0004]綜上所述,針對(duì)現(xiàn)有技術(shù)的缺陷,特別需要ー種采用模板方式抽取結(jié)構(gòu)化信息的方法,以解決以上提到的問(wèn)題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于提供ー種采用模板方式抽取結(jié)構(gòu)化信息的方法,通過(guò)采用功能化的結(jié)構(gòu)設(shè)計(jì),克服了傳統(tǒng)技術(shù)中的不足,從而實(shí)現(xiàn)本發(fā)明的目的。
[0006]本發(fā)明所解決的技術(shù)問(wèn)題可以采用以下技術(shù)方案來(lái)實(shí)現(xiàn):
ー種采用模板方式抽取結(jié)構(gòu)化信息的方法,包括如下步驟:
1)選定結(jié)構(gòu)化信息的抽取對(duì)象,再根據(jù)抽取對(duì)象配置抽取模板,所述抽取模板中設(shè)置好的需要抽取的信息;
2)將抽取對(duì)象導(dǎo)入步驟I)配置完畢的抽取模板,所述抽取模板根據(jù)預(yù)先設(shè)置的信息,對(duì)抽取對(duì)象進(jìn)行抽取操作,獲得需要的結(jié)構(gòu)化信息;
3)所述結(jié)構(gòu)化信息抽取完畢后,經(jīng)打包處理發(fā)送至目標(biāo)單元。
[0007]在本發(fā)明的一個(gè)實(shí)施例中,所述抽取模板抽取的結(jié)構(gòu)化信息包括營(yíng)運(yùn)內(nèi)容、部門內(nèi)容、Web內(nèi)容和多媒體內(nèi)容。
[0008]在本發(fā)明的一個(gè)實(shí)施例中,所述結(jié)構(gòu)化信息抽取完畢后,添加信息的大小、類別、轉(zhuǎn)換日期,便于后續(xù)處理。
[0009]本發(fā)明的有益效果在干:結(jié)構(gòu)簡(jiǎn)單,設(shè)計(jì)巧妙,通過(guò)采用功能化的結(jié)構(gòu)設(shè)計(jì),克服了傳統(tǒng)技術(shù)中的不足,填補(bǔ)了相關(guān)市場(chǎng)的空白,從而實(shí)現(xiàn)本發(fā)明的目的。
【具體實(shí)施方式】
[0010]為使本發(fā)明實(shí)現(xiàn)的技術(shù)手段、創(chuàng)作特征、達(dá)成目的與功效易于明白了解,下面結(jié)合【具體實(shí)施方式】,進(jìn)ー步闡述本發(fā)明。
[0011]本發(fā)明所述的ー種采用模板方式抽取結(jié)構(gòu)化信息的方法,包括如下步驟:
1)選定結(jié)構(gòu)化信息的抽取對(duì)象,再根據(jù)抽取對(duì)象配置抽取模板,所述抽取模板中設(shè)置好的需要抽取的信息;
2)將抽取對(duì)象導(dǎo)入步驟I)配置完畢的抽取模板,所述抽取模板根據(jù)預(yù)先設(shè)置的信息,對(duì)抽取對(duì)象進(jìn)行抽取操作,獲得需要的結(jié)構(gòu)化信息;
3)所述結(jié)構(gòu)化信息抽取完畢后,經(jīng)打包處理發(fā)送至目標(biāo)單元。
[0012]在本發(fā)明的一個(gè)實(shí)施例中,為了增加所述方法的泛用性,所述抽取模板抽取的結(jié)構(gòu)化信息包括營(yíng)運(yùn)內(nèi)容、部門內(nèi)容、Web內(nèi)容和多媒體內(nèi)容。
[0013]尤其需要指出的是,所述結(jié)構(gòu)化信息抽取完畢后,添加信息的大小、類別、轉(zhuǎn)換日期,便于后續(xù)處理。
[0014]本發(fā)明結(jié)構(gòu)簡(jiǎn)單,設(shè)計(jì)巧妙,通過(guò)采用功能化的結(jié)構(gòu)設(shè)計(jì),克服了傳統(tǒng)技術(shù)中的不足,填補(bǔ)了相關(guān)市場(chǎng)的空白,從而實(shí)現(xiàn)本發(fā)明的目的。
[0015]以上顯示和描述了本發(fā)明的基本原理和主要特征和本發(fā)明的優(yōu)點(diǎn)。本行業(yè)的技術(shù)人員應(yīng)該了解,本發(fā)明不受上述實(shí)施例的限制,上述實(shí)施例和說(shuō)明書中描述的只是說(shuō)明本發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會(huì)有各種變化和改進(jìn),這些變化和改進(jìn)都落入要求保護(hù)的本發(fā)明范圍內(nèi)。本發(fā)明要求保護(hù)范圍由所附的權(quán)利要求書及其等效物界定。
【權(quán)利要求】
1.ー種采用模板方式抽取結(jié)構(gòu)化信息的方法,其特征在于,包括如下步驟: 1)選定結(jié)構(gòu)化信息的抽取對(duì)象,再根據(jù)抽取對(duì)象配置抽取模板,所述抽取模板中設(shè)置好的需要抽取的信息; 2)將抽取對(duì)象導(dǎo)入步驟I)配置完畢的抽取模板,所述抽取模板根據(jù)預(yù)先設(shè)置的信息,對(duì)抽取對(duì)象進(jìn)行抽取操作,獲得需要的結(jié)構(gòu)化信息; 3)所述結(jié)構(gòu)化信息抽取完畢后,經(jīng)打包處理發(fā)送至目標(biāo)單元。
2.根據(jù)權(quán)利要求1所述的ー種采用模板方式抽取結(jié)構(gòu)化信息的方法,其特征在于,所述抽取模板抽取的結(jié)構(gòu)化信息包括營(yíng)運(yùn)內(nèi)容、部門內(nèi)容、Web內(nèi)容和多媒體內(nèi)容。
3.根據(jù)權(quán)利要求1所述的ー種采用模板方式抽取結(jié)構(gòu)化信息的方法,其特征在于,所述結(jié)構(gòu)化信息抽取完畢后,添加信息的大小、類別、轉(zhuǎn)換日期,便于后續(xù)處理。
【文檔編號(hào)】G06F17/30GK103455553SQ201310332442
【公開日】2013年12月18日 申請(qǐng)日期:2013年8月2日 優(yōu)先權(quán)日:2013年8月2日
【發(fā)明者】徐方林 申請(qǐng)人:徐方林