由于同一個(gè)詞的hash值是唯一的,因此,若詞典表中存儲(chǔ)的是詞的MD5值,則查找請(qǐng)求中攜帶的是詞的MD5值;若詞典表中存儲(chǔ)的是詞的SHAl值,則查找請(qǐng)求中攜帶的是詞的SHAl值,以此類推。
[0071]相應(yīng)的,圖3所示為本發(fā)明另一實(shí)施例中詞典表的應(yīng)用方法的流程圖,該方法包括以下步驟S31-S33:
[0072]步驟S31,接收查找詞典表中某詞的標(biāo)識(shí)的查找請(qǐng)求,其中,該查找請(qǐng)求中攜帶有該詞的hash值。
[0073]步驟S32,根據(jù)該詞的hash值查找該詞的標(biāo)識(shí)。
[0074]步驟S33,返回該詞的標(biāo)識(shí)。
[0075]上文步驟S31中提及的詞的hash值與步驟S21相同,此處不再贅述。
[0076]本實(shí)施例中,可以根據(jù)詞的hash值從詞典表中查找到該詞的標(biāo)識(shí),從而實(shí)現(xiàn)靈活查找數(shù)據(jù)資源的目的。
[0077]對(duì)應(yīng)于上述實(shí)施例中的詞典表的生成方法,本發(fā)明還提供了一種詞典表的生成裝置。如圖4所示為本發(fā)明一實(shí)施例中詞典表的生成裝置的結(jié)構(gòu)示意圖,包括:
[0078]計(jì)算模塊41,用于計(jì)算一個(gè)或多個(gè)詞的hash值;
[0079]分配模塊42,用于分配一個(gè)或多個(gè)詞各自即將在詞典表中的標(biāo)識(shí);
[0080]存儲(chǔ)模塊43,用于將一個(gè)或多個(gè)詞本身、各自即將在詞典表中的標(biāo)識(shí)以及各自對(duì)應(yīng)的hash值作為詞典表的數(shù)據(jù)項(xiàng)進(jìn)行存儲(chǔ)。
[0081]在本發(fā)明一實(shí)施例中,如圖5所示,圖4展示的裝置還可以包括:
[0082]查找模塊51,用于當(dāng)存在新詞即將存儲(chǔ)至詞典表時(shí),上述計(jì)算模塊41計(jì)算新詞的hash值之后,查找詞典表的數(shù)據(jù)項(xiàng)中是否已存在新詞的hash值;
[0083]上述分配模塊42,還用于若查找模塊查找詞典表的數(shù)據(jù)項(xiàng)中不存在新詞的hash值,則分配新詞即將在詞典表中的標(biāo)識(shí);
[0084]上述存儲(chǔ)模塊43,還用于將新詞本身、其即將在詞典表中的標(biāo)識(shí)以及其對(duì)應(yīng)的hash值作為詞典表的數(shù)據(jù)項(xiàng)存儲(chǔ)至詞典表中。
[0085]在本發(fā)明一實(shí)施例中,如圖6所示,圖5展示的裝置還可以包括:
[0086]處理模塊61,用于若查找模塊51查找詞典表的數(shù)據(jù)項(xiàng)中存在新詞的hash值,則確定詞典表中已存在新詞,從而對(duì)新詞不再進(jìn)行存儲(chǔ)操作。
[0087]本發(fā)明實(shí)施例的上述裝置:計(jì)算一個(gè)或多個(gè)詞的hash值,并分配一個(gè)或多個(gè)詞各自即將在詞典表中的標(biāo)識(shí),隨后將一個(gè)或多個(gè)詞本身、各自即將在詞典表中的標(biāo)識(shí)以及各自對(duì)應(yīng)的hash值作為詞典表的數(shù)據(jù)項(xiàng)進(jìn)行存儲(chǔ)。由于hash值是一串字符,從而在詞典表中查找詞時(shí),可以以hash值(即字符形式)進(jìn)行查找,相比于現(xiàn)有技術(shù)中以詞本身(即文字形式)查找,查找更靈活、速度更快。進(jìn)一步,詞典表中存儲(chǔ)了各個(gè)詞的標(biāo)識(shí),從而在后續(xù)工作中可以以詞的標(biāo)識(shí)進(jìn)行存儲(chǔ),而無(wú)需存儲(chǔ)詞本身,節(jié)約了資源存儲(chǔ)空間。
[0088]對(duì)應(yīng)于上述實(shí)施例中的詞典表的應(yīng)用方法,本發(fā)明還提供了一種詞典表的應(yīng)用裝置。如圖7所示為本發(fā)明一實(shí)施例中詞典表的應(yīng)用裝置的結(jié)構(gòu)示意圖,包括:
[0089]請(qǐng)求發(fā)送模塊71,用于若當(dāng)前需要對(duì)詞進(jìn)行存儲(chǔ)時(shí),向詞典表發(fā)送查找該詞的標(biāo)識(shí)的查找請(qǐng)求,其中,該查找請(qǐng)求中攜帶有該詞的hash值;
[0090]標(biāo)識(shí)接收模塊72,用于接收詞典表根據(jù)該詞的hash值查找到的該詞的標(biāo)識(shí);
[0091]標(biāo)識(shí)存儲(chǔ)模塊73,用于存儲(chǔ)該詞的標(biāo)識(shí),以實(shí)現(xiàn)對(duì)該詞的存儲(chǔ)。
[0092]本發(fā)明實(shí)施例的上述裝置:在當(dāng)前需要對(duì)詞進(jìn)行存儲(chǔ)時(shí),可以從詞典表中查找到該詞的標(biāo)識(shí),從而存儲(chǔ)該詞的標(biāo)識(shí),以實(shí)現(xiàn)對(duì)該詞的存儲(chǔ),節(jié)約了資源存儲(chǔ)空間。進(jìn)一步,若當(dāng)前儲(chǔ)存了詞的標(biāo)識(shí),則可以根據(jù)詞的標(biāo)識(shí)從詞典表中查找到該詞本身,從而實(shí)現(xiàn)靈活查找數(shù)據(jù)資源的目的。
[0093]相應(yīng)的,如圖8所示為本發(fā)明另一實(shí)施例中詞典表的應(yīng)用裝置的結(jié)構(gòu)示意圖,包括:
[0094]請(qǐng)求接收模塊81,用于接收查找詞典表中某詞的標(biāo)識(shí)的查找請(qǐng)求,其中,查找請(qǐng)求中攜帶有該詞的hash值;
[0095]標(biāo)識(shí)查找模塊82,用于根據(jù)該詞的hash值查找該詞的標(biāo)識(shí);
[0096]標(biāo)識(shí)發(fā)送模塊83,用于返回該詞的標(biāo)識(shí)。
[0097]本發(fā)明實(shí)施例的上述裝置:可以根據(jù)詞的hash值從詞典表中查找到該詞的標(biāo)識(shí),從而實(shí)現(xiàn)靈活查找數(shù)據(jù)資源的目的。
[0098]在產(chǎn)品應(yīng)用中,詞典表的另一功能是用來(lái)生成詞典數(shù)據(jù)表:
[0099]首先,從元數(shù)據(jù)表中提取至少一條最新數(shù)據(jù)資源信息,可以得到屬性信息、關(guān)鍵詞、通過(guò)對(duì)標(biāo)題摘要和內(nèi)容分詞后得到的人物、地點(diǎn)、機(jī)構(gòu)等。
[0100]其次,依次分類通過(guò)上面詞匯計(jì)算出詞匯的hash值,到詞典表中找到詞匯的標(biāo)識(shí)。從而,對(duì)于一條數(shù)據(jù)資源信息來(lái)說(shuō),依次分類通過(guò)上面詞匯的一個(gè)或多個(gè)標(biāo)識(shí),存儲(chǔ)到詞典數(shù)據(jù)表的一條記錄,詞典數(shù)據(jù)表字段包括:屬性、人物、機(jī)構(gòu)、地點(diǎn)、關(guān)鍵字等,多個(gè)標(biāo)識(shí)間可以以逗號(hào)分隔。
[0101]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤(pán)存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0102]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0103]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0104]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0105]顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
【主權(quán)項(xiàng)】
1.一種詞典表的生成方法,其特征在于,包括: 計(jì)算一個(gè)或多個(gè)詞的哈希hash值; 分配所述一個(gè)或多個(gè)詞各自即將在詞典表中的標(biāo)識(shí); 將所述一個(gè)或多個(gè)詞本身、各自即將在詞典表中的標(biāo)識(shí)以及各自對(duì)應(yīng)的hash值作為所述詞典表的數(shù)據(jù)項(xiàng)進(jìn)行存儲(chǔ)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 當(dāng)存在新詞即將存儲(chǔ)至所述詞典表時(shí),計(jì)算所述新詞的hash值; 查找所述詞典表的數(shù)據(jù)項(xiàng)中是否已存在所述新詞的hash值; 若不存在,則分配所述新詞即將在所述詞典表中的標(biāo)識(shí),并將所述新詞本身、其即將在所述詞典表中的標(biāo)識(shí)以及其對(duì)應(yīng)的hash值作為所述詞典表的數(shù)據(jù)項(xiàng)存儲(chǔ)至所述詞典表中。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述查找所述詞典表的數(shù)據(jù)項(xiàng)中是否已存在所述新詞的hash值之后,還包括: 若存在,則確定所述詞典表中已存在所述新詞,從而對(duì)所述新詞不再進(jìn)行存儲(chǔ)操作。
4.一種詞典表的應(yīng)用方法,其特征在于,包括: 若當(dāng)前需要對(duì)詞進(jìn)行存儲(chǔ)時(shí),向詞典表發(fā)送查找該詞的標(biāo)識(shí)的查找請(qǐng)求,其中,所述查找請(qǐng)求中攜帶有該詞的hash值; 接收所述詞典表根據(jù)該詞的hash值查找到的該詞的標(biāo)識(shí); 存儲(chǔ)該詞的標(biāo)識(shí),以實(shí)現(xiàn)對(duì)該詞的存儲(chǔ)。
5.—種詞典表的應(yīng)用方法,其特征在于,包括: 接收查找詞典表中某詞的標(biāo)識(shí)的查找請(qǐng)求,其中,所述查找請(qǐng)求中攜帶有該詞的hash值; 根據(jù)該詞的hash值查找該詞的標(biāo)識(shí); 返回該詞的標(biāo)識(shí)。
6.—種詞典表的生成裝置,其特征在于,包括: 計(jì)算模塊,用于計(jì)算一個(gè)或多個(gè)詞的哈希hash值; 分配模塊,用于分配所述一個(gè)或多個(gè)詞各自即將在詞典表中的標(biāo)識(shí); 存儲(chǔ)模塊,用于將所述一個(gè)或多個(gè)詞本身、各自即將在詞典表中的標(biāo)識(shí)以及各自對(duì)應(yīng)的hash值作為所述詞典表的數(shù)據(jù)項(xiàng)進(jìn)行存儲(chǔ)。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 查找模塊,用于當(dāng)存在新詞即將存儲(chǔ)至所述詞典表時(shí),所述計(jì)算模塊計(jì)算所述新詞的hash值之后,查找所述詞典表的數(shù)據(jù)項(xiàng)中是否已存在所述新詞的hash值; 所述分配模塊,還用于若所述查找模塊查找所述詞典表的數(shù)據(jù)項(xiàng)中不存在所述新詞的hash值,則分配所述新詞即將在所述詞典表中的標(biāo)識(shí); 所述存儲(chǔ)模塊,還用于將所述新詞本身、其即將在所述詞典表中的標(biāo)識(shí)以及其對(duì)應(yīng)的hash值作為所述詞典表的數(shù)據(jù)項(xiàng)存儲(chǔ)至所述詞典表中。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 處理模塊,用于若所述查找模塊查找所述詞典表的數(shù)據(jù)項(xiàng)中存在所述新詞的hash值,則確定所述詞典表中已存在所述新詞,從而對(duì)所述新詞不再進(jìn)行存儲(chǔ)操作。
9.一種詞典表的應(yīng)用裝置,其特征在于,包括: 請(qǐng)求發(fā)送模塊,用于若當(dāng)前需要對(duì)詞進(jìn)行存儲(chǔ)時(shí),向詞典表發(fā)送查找該詞的標(biāo)識(shí)的查找請(qǐng)求,其中,所述查找請(qǐng)求中攜帶有該詞的hash值; 標(biāo)識(shí)接收模塊,用于接收所述詞典表根據(jù)該詞的hash值查找到的該詞的標(biāo)識(shí); 標(biāo)識(shí)存儲(chǔ)模塊,用于存儲(chǔ)該詞的標(biāo)識(shí),以實(shí)現(xiàn)對(duì)該詞的存儲(chǔ)。
10.一種詞典表的應(yīng)用裝置,其特征在于,包括: 請(qǐng)求接收模塊,用于接收查找詞典表中某詞的標(biāo)識(shí)的查找請(qǐng)求,其中,所述查找請(qǐng)求中攜帶有該詞的hash值; 標(biāo)識(shí)查找模塊,用于根據(jù)該詞的hash值查找該詞的標(biāo)識(shí); 標(biāo)識(shí)發(fā)送模塊,用于返回該詞的標(biāo)識(shí)。
【專利摘要】本發(fā)明公開(kāi)了一種詞典表的生成方法及裝置,以及一種詞典表的應(yīng)用方法及裝置,用以實(shí)現(xiàn)節(jié)約資源存儲(chǔ)空間、提高檢索速度的目的。所述詞典表的生成方法,包括:計(jì)算一個(gè)或多個(gè)詞的哈希hash值;分配所述一個(gè)或多個(gè)詞各自即將在詞典表中的標(biāo)識(shí);將所述一個(gè)或多個(gè)詞本身、各自即將在詞典表中的標(biāo)識(shí)以及各自對(duì)應(yīng)的hash值作為所述詞典表的數(shù)據(jù)項(xiàng)進(jìn)行存儲(chǔ)。
【IPC分類】G06F17-30
【公開(kāi)號(hào)】CN104765831
【申請(qǐng)?zhí)枴緾N201510173324
【發(fā)明人】楊乾磊
【申請(qǐng)人】天脈聚源(北京)傳媒科技有限公司
【公開(kāi)日】2015年7月8日
【申請(qǐng)日】2015年4月13日