不是底層數(shù)據(jù)標(biāo)簽,數(shù)據(jù)標(biāo)簽層級判斷單元則向單獨(dú)詞判斷單元發(fā)送單獨(dú)詞判斷指令,所述單獨(dú)詞判斷單元在接收到單獨(dú)詞判斷指令時,判斷該數(shù)據(jù)標(biāo)簽是否為單獨(dú)詞。
[0116]所述數(shù)據(jù)標(biāo)簽層級判斷單元根據(jù)關(guān)聯(lián)關(guān)系信息判斷數(shù)據(jù)標(biāo)簽是否為底層數(shù)據(jù)標(biāo)簽。
[0117]所述單獨(dú)詞判斷單元將數(shù)據(jù)標(biāo)簽與存儲有若干單獨(dú)詞的字典進(jìn)行匹配,若匹配,則判定該數(shù)據(jù)標(biāo)簽為單獨(dú)詞。
[0118]所述多級數(shù)據(jù)存儲裝置還可以包括:標(biāo)記單元,用于采用不同方式標(biāo)記記錄有語義內(nèi)容的數(shù)據(jù)標(biāo)簽以及未記錄有語義內(nèi)容的數(shù)據(jù)標(biāo)簽。
[0119]具體的,所述標(biāo)記單元可以僅標(biāo)記記錄有語義內(nèi)容的數(shù)據(jù)標(biāo)簽,也可以僅標(biāo)記未記錄有語義內(nèi)容的數(shù)據(jù)標(biāo)簽,還可以采用不同標(biāo)記標(biāo)記兩種不同的數(shù)據(jù)標(biāo)簽。
[0120]本實施例的多級數(shù)據(jù)存儲裝置除了對底層數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容外,對底層數(shù)據(jù)標(biāo)簽之外的其他數(shù)據(jù)標(biāo)簽也可以記錄語義內(nèi)容,改變了相互關(guān)聯(lián)的多級數(shù)據(jù)的存儲結(jié)構(gòu),使得存儲結(jié)構(gòu)相對簡單,由于數(shù)據(jù)標(biāo)簽記錄了語義內(nèi)容提高信息檢索的精度和效率;對底層數(shù)據(jù)標(biāo)簽之外的數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容進(jìn)行判斷,提升了數(shù)據(jù)存儲的選擇性。此外,由于相互關(guān)聯(lián)的所有數(shù)據(jù)信息都是記錄在了一個數(shù)據(jù)結(jié)構(gòu)中,此時的數(shù)據(jù)標(biāo)簽不會與其它的數(shù)據(jù)標(biāo)簽發(fā)生沖突,因此數(shù)據(jù)標(biāo)簽就具有了實際的語義。
[0121]本發(fā)明實施例還提供了一種信息檢索方法,用于檢索采用上述多級數(shù)據(jù)的存儲方法存儲的多級數(shù)據(jù);請參考圖6,所述方法包括步驟:
[0122]步驟S301,從接收到的服務(wù)請求中確定關(guān)鍵詞;
[0123]步驟S302,在所述數(shù)據(jù)分類結(jié)構(gòu)的語義內(nèi)容及關(guān)聯(lián)關(guān)系信息中檢索所述關(guān)鍵詞,以得到與所述關(guān)鍵詞對應(yīng)的標(biāo)準(zhǔn)問;
[0124]步驟S303,在服務(wù)數(shù)據(jù)庫中查詢與所述標(biāo)準(zhǔn)問匹配的服務(wù)內(nèi)容。
[0125]對上述多級數(shù)據(jù)的存儲方法形成的單個數(shù)據(jù)分類結(jié)構(gòu)進(jìn)行檢索時,由于單個數(shù)據(jù)分類結(jié)構(gòu)中各級數(shù)據(jù)標(biāo)簽可以記錄語義內(nèi)容,即使得該數(shù)據(jù)標(biāo)簽具有了實際的語義,因而進(jìn)行檢索時只需要對一個數(shù)據(jù)分類結(jié)構(gòu)進(jìn)行檢索,使得檢索的范圍減小,提高了檢索的效率。
[0126]以對本發(fā)明的方法形成的前述“外企”詞類庫進(jìn)行檢索作為示例,由于“外企”詞類庫的父級詞類標(biāo)簽“外企”記錄有對應(yīng)的語義內(nèi)容:外企、外資企業(yè)、外商投資企業(yè)。服務(wù)請求中確定要檢索“外企”這個關(guān)鍵詞;在“外企”詞類庫中查找到與關(guān)鍵詞“外企”對應(yīng)的語義內(nèi)容:外企、外資企業(yè)、外商投資企業(yè);在服務(wù)數(shù)據(jù)庫中查詢與所述該語義內(nèi)容匹配的服務(wù)內(nèi)容。
[0127]進(jìn)一步地,當(dāng)采用不同方式標(biāo)記記錄有語義內(nèi)容的數(shù)據(jù)標(biāo)簽以及未記錄有語義內(nèi)容的數(shù)據(jù)標(biāo)簽時,還可以根據(jù)檢索的具體需求,確定不同的檢索范圍,從而可以進(jìn)一步縮小檢索范圍,提高檢索的效率。
[0128]綜上,本發(fā)明實施例的多級數(shù)據(jù)存儲方法,采用單個數(shù)據(jù)分類結(jié)構(gòu)存儲相互關(guān)聯(lián)的多級數(shù)據(jù)結(jié)構(gòu),在單個數(shù)據(jù)分類結(jié)構(gòu)不僅生成數(shù)據(jù)標(biāo)簽以及記錄數(shù)據(jù)的上下級關(guān)系關(guān)聯(lián)關(guān)系信息,并且本發(fā)明的存儲方法,除了對底層數(shù)據(jù)標(biāo)簽記錄內(nèi)容外,對底層數(shù)據(jù)標(biāo)簽之外的其他數(shù)據(jù)標(biāo)簽也可以記錄語義內(nèi)容,改變了相互關(guān)聯(lián)的多級數(shù)據(jù)的存儲結(jié)構(gòu),使得存儲結(jié)構(gòu)相對簡單,由于數(shù)據(jù)標(biāo)簽記錄了語義內(nèi)容提高信息檢索的精度和效率;對底層數(shù)據(jù)標(biāo)簽之外的數(shù)據(jù)標(biāo)簽對是都記錄語義內(nèi)容進(jìn)行判斷,提升了數(shù)據(jù)存儲的選擇性。
[0129]本發(fā)明實施例的形成詞類庫的方法,除了對底層詞類標(biāo)簽記錄內(nèi)容外,對底層詞類標(biāo)簽之外的其他詞類標(biāo)簽也可以記錄語義內(nèi)容,提高信息檢索的精度和效率;對底層詞類標(biāo)簽之外的詞類標(biāo)簽對是都記錄語義內(nèi)容進(jìn)行判斷,提升了數(shù)據(jù)存儲的選擇性。
[0130]本發(fā)明實施例的多級數(shù)據(jù),除了對底層數(shù)據(jù)標(biāo)簽記錄內(nèi)容外,對底層數(shù)據(jù)標(biāo)簽之外的其他數(shù)據(jù)標(biāo)簽也可以記錄語義內(nèi)容,提高信息檢索的精度和效率。
[0131]本發(fā)明實施例的多級數(shù)據(jù)的存儲裝置,用于建立多級數(shù)據(jù),并可以對數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容。
[0132]本發(fā)明實施例的信息檢索方法,對采用上述多級數(shù)據(jù)存儲方法存儲的多級數(shù)據(jù)進(jìn)行檢索時,由于相關(guān)的多級數(shù)據(jù)都是放在一個多級數(shù)據(jù)結(jié)構(gòu)中,因此只需對該多級數(shù)據(jù)結(jié)構(gòu)進(jìn)行檢索即可,從而大大縮小了檢索數(shù)據(jù)結(jié)構(gòu)的數(shù)目,使得搜索過程更加簡單,最終提高了檢索的效率,提升了檢索的準(zhǔn)確度。
[0133]雖然本發(fā)明披露如上,但本發(fā)明并非限定于此。任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),均可作各種更動與修改,因此本發(fā)明的保護(hù)范圍應(yīng)當(dāng)以權(quán)利要求所限定的范圍為準(zhǔn)。
【主權(quán)項】
1.一種多級數(shù)據(jù)存儲方法,其特征在于,采用單個數(shù)據(jù)分類結(jié)構(gòu)存儲相互關(guān)聯(lián)的多級數(shù)據(jù);所述方法包括: 分別生成各級數(shù)據(jù)的數(shù)據(jù)標(biāo)簽及分別記錄各數(shù)據(jù)標(biāo)簽對應(yīng)的關(guān)聯(lián)關(guān)系信息,并記錄底層數(shù)據(jù)標(biāo)簽的語義內(nèi)容,所述關(guān)聯(lián)關(guān)系信息用于保存該數(shù)據(jù)及其所對應(yīng)的上下級數(shù)據(jù)之間的關(guān)系; 判斷是否對各數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容; 如果是,則對對應(yīng)的數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容。2.如權(quán)利要求1所述多級數(shù)據(jù)存儲方法,其特征在于,判斷是否對各數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容的過程包括:判斷數(shù)據(jù)標(biāo)簽是否為底層數(shù)據(jù)標(biāo)簽,若該數(shù)據(jù)標(biāo)簽不是底層數(shù)據(jù)標(biāo)簽,則判斷該數(shù)據(jù)標(biāo)簽是否為單獨(dú)詞,若該數(shù)據(jù)標(biāo)簽為單獨(dú)詞,則進(jìn)行對該數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容的步驟。3.如權(quán)利要求2所述多級數(shù)據(jù)存儲方法,其特征在于,判斷數(shù)據(jù)標(biāo)簽是否為單獨(dú)詞的過程包括:提供字典,所述字典中存儲有若干單獨(dú)詞;將數(shù)據(jù)標(biāo)簽與字典進(jìn)行匹配,若匹配,則該數(shù)據(jù)標(biāo)簽為單獨(dú)詞。4.如權(quán)利要求1所述多級數(shù)據(jù)存儲方法,其特征在于,還包括:采用不同方式標(biāo)記記錄有語義內(nèi)容的數(shù)據(jù)標(biāo)簽以及未記錄有語義內(nèi)容的數(shù)據(jù)標(biāo)簽。5.如權(quán)利要求1所述多級數(shù)據(jù)存儲方法,其特征在于,所述語義內(nèi)容與對應(yīng)的數(shù)據(jù)標(biāo)簽存儲的位置相同。6.如權(quán)利要求1所述多級數(shù)據(jù)存儲方法,其特征在于,所述語義內(nèi)容為表達(dá)對應(yīng)的數(shù)據(jù)標(biāo)簽的語義的詞語集合。7.如權(quán)利要求1所述多級數(shù)據(jù)存儲方法,其特征在于,還包括:當(dāng)需要添加具有新的數(shù)據(jù)標(biāo)簽的數(shù)據(jù)時,在所述數(shù)據(jù)分類結(jié)構(gòu)中增加該數(shù)據(jù)的數(shù)據(jù)標(biāo)簽,并對需要記錄語義內(nèi)容的數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容;更新所述數(shù)據(jù)對應(yīng)的上下級數(shù)據(jù)的關(guān)聯(lián)關(guān)系信息。8.如權(quán)利要求1所述多級數(shù)據(jù)存儲方法,其特征在于,還包括:當(dāng)需要刪除一數(shù)據(jù)標(biāo)簽下的所有數(shù)據(jù)時,在所述數(shù)據(jù)分類結(jié)構(gòu)中刪除該數(shù)據(jù)的數(shù)據(jù)標(biāo)簽、語義內(nèi)容及關(guān)聯(lián)關(guān)系信息;更新所述數(shù)據(jù)對應(yīng)的上下級數(shù)據(jù)的關(guān)聯(lián)關(guān)系信息。9.由權(quán)利要求1至8任一項所述的多級數(shù)據(jù)存儲方法形成詞類庫的方法,其特征在于,所述數(shù)據(jù)標(biāo)簽是詞類標(biāo)簽;所述關(guān)聯(lián)關(guān)系信息中保存上下級詞類名稱之間的關(guān)系;語義內(nèi)容是表達(dá)所述詞類標(biāo)簽語義的詞語集合。10.一種信息檢索方法,用于檢索采用如權(quán)利要求1至8任一項所述的多級數(shù)據(jù)存儲方法存儲的多級數(shù)據(jù);其特征在于,所述方法包括: 從接收到的服務(wù)請求中確定關(guān)鍵詞; 在所述數(shù)據(jù)分類結(jié)構(gòu)的語義內(nèi)容及關(guān)聯(lián)關(guān)系信息中檢索所述關(guān)鍵詞,以得到與所述關(guān)鍵詞對應(yīng)的標(biāo)準(zhǔn)問; 在服務(wù)數(shù)據(jù)庫中查詢與所述標(biāo)準(zhǔn)問匹配的服務(wù)內(nèi)容。11.一種多級數(shù)據(jù)結(jié)構(gòu),其特征在于,包括: 多級數(shù)據(jù)標(biāo)簽以及各數(shù)據(jù)標(biāo)簽對應(yīng)的關(guān)聯(lián)關(guān)系信息; 至少部分?jǐn)?shù)據(jù)標(biāo)簽的語義內(nèi)容。12.如權(quán)利要求11所述的多級數(shù)據(jù)結(jié)構(gòu),其特征在于,所述語義內(nèi)容與對應(yīng)的數(shù)據(jù)標(biāo)簽存在相同的位置。13.如權(quán)利要求11所述的多級數(shù)據(jù)結(jié)構(gòu),其特征在于,具有語義內(nèi)容的數(shù)據(jù)標(biāo)簽位于底層或者為單獨(dú)詞。14.一種多級數(shù)據(jù)存儲裝置,其特征在于,包括: 數(shù)據(jù)標(biāo)簽生成單元,用于分別生成各級數(shù)據(jù)的數(shù)據(jù)標(biāo)簽; 關(guān)聯(lián)關(guān)系信息記錄單元,用于記錄各數(shù)據(jù)標(biāo)簽對應(yīng)的關(guān)聯(lián)關(guān)系信息,所述關(guān)聯(lián)關(guān)系信息用于保存該數(shù)據(jù)及其所對應(yīng)的上下級數(shù)據(jù)之間的關(guān)系; 判斷單元,用于判斷是否對各數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容; 語義內(nèi)容記錄單元,用于對需要記錄語義內(nèi)容的數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容。15.如權(quán)利要求14所述多級數(shù)據(jù)存儲裝置,其特征在于,所述判斷單元包括數(shù)據(jù)標(biāo)簽層級判斷單元和單獨(dú)詞判斷單元,所述數(shù)據(jù)標(biāo)簽層級判斷單元用于判斷數(shù)據(jù)標(biāo)簽是否為底層數(shù)據(jù)標(biāo)簽,所述單獨(dú)詞判斷單元用于在數(shù)據(jù)標(biāo)簽不是底層數(shù)據(jù)標(biāo)簽時,判斷該數(shù)據(jù)標(biāo)簽是否為單獨(dú)詞。
【專利摘要】一種多級數(shù)據(jù)存儲方法及裝置、多級數(shù)據(jù)結(jié)構(gòu)、信息檢索方法。所述多級數(shù)據(jù)存儲方法包括:采用單個數(shù)據(jù)分類結(jié)構(gòu)存儲相互關(guān)聯(lián)的多級數(shù)據(jù);所述方法包括:分別生成各級數(shù)據(jù)的數(shù)據(jù)標(biāo)簽及分別記錄各數(shù)據(jù)標(biāo)簽對應(yīng)的關(guān)聯(lián)關(guān)系信息,并記錄底層數(shù)據(jù)標(biāo)簽的語義內(nèi)容,所述關(guān)聯(lián)關(guān)系信息用于保存該數(shù)據(jù)及其所對應(yīng)的上下級數(shù)據(jù)之間的關(guān)系;判斷是否對各數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容;如果是,則對對應(yīng)的數(shù)據(jù)標(biāo)簽記錄語義內(nèi)容。本發(fā)明存儲方法形成的多級數(shù)據(jù)結(jié)構(gòu)簡單,數(shù)據(jù)標(biāo)簽具有了實際的語義,有利于提升信息檢索的精度和效率。
【IPC分類】G06F17/30, G06N5/02
【公開號】CN105404660
【申請?zhí)枴緾N201510745016
【發(fā)明人】曾永梅, 李波, 朱頻頻
【申請人】上海智臻智能網(wǎng)絡(luò)科技股份有限公司
【公開日】2016年3月16日
【申請日】2015年11月5日