建立獲取題目知識(shí)點(diǎn)模型、獲取題目知識(shí)點(diǎn)的方法和裝置的制造方法
【專利摘要】本發(fā)明提供一種建立獲取題目知識(shí)點(diǎn)模型、獲取題目知識(shí)點(diǎn)的方法和裝置,其中,獲取題目知識(shí)點(diǎn)的方法包括:確定總知識(shí)點(diǎn)集及訓(xùn)練集中各題目的知識(shí)點(diǎn)集;合并訓(xùn)練集中所有題目的分詞結(jié)果得到特征詞語(yǔ)集;根據(jù)特征詞語(yǔ)集將各題目的分詞結(jié)果轉(zhuǎn)換為特征向量,根據(jù)總知識(shí)點(diǎn)集將各題目的知識(shí)點(diǎn)集轉(zhuǎn)換為知識(shí)點(diǎn)向量;將特征向量作為輸入,對(duì)應(yīng)題目的知識(shí)點(diǎn)向量作為輸出,采用機(jī)器學(xué)習(xí)方法建立獲取題目知識(shí)點(diǎn)的模型;根據(jù)特征詞語(yǔ)集將待處理題目的分詞結(jié)果轉(zhuǎn)換為特征向量;將待處理題目的特征向量輸入獲取題目知識(shí)點(diǎn)的模型得知識(shí)點(diǎn)向量,將知識(shí)點(diǎn)向量與總知識(shí)點(diǎn)集相匹配,得到待處理題目知識(shí)點(diǎn)。本發(fā)明能夠自動(dòng)獲取題目知識(shí)點(diǎn),提高標(biāo)注題目知識(shí)點(diǎn)的效率。
【專利說(shuō)明】
建立獲取題目知識(shí)點(diǎn)模型、獲取題目知識(shí)點(diǎn)的方法和裝置
技術(shù)領(lǐng)域
[0001 ]本申請(qǐng)屬于計(jì)算機(jī)教學(xué)領(lǐng)域,特別涉及一種建立獲取題目知識(shí)點(diǎn)模型的方法和裝置、獲取題目知識(shí)點(diǎn)的方法和裝置。
【背景技術(shù)】
[0002]隨著計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的發(fā)展,中小學(xué)教育,乃至大學(xué)教育中的練習(xí)和考試題目均實(shí)現(xiàn)了電子化存儲(chǔ),并可上傳到網(wǎng)絡(luò)上供學(xué)生使用。隨著時(shí)間的推移,題目的數(shù)量會(huì)越來(lái)越大,例如某教學(xué)機(jī)構(gòu)的題庫(kù)系統(tǒng)已經(jīng)存儲(chǔ)了數(shù)十萬(wàn)道題目。這給題目的搜尋和有效索引帶來(lái)了困難,例如想要從海量的題目中找到涵蓋某個(gè)知識(shí)點(diǎn)的題目,將變得不易。目前常用的解決方式是:由老師和教輔人員手動(dòng)對(duì)題目進(jìn)行標(biāo)注,以指定該題目對(duì)應(yīng)哪些知識(shí)點(diǎn)。然而此種方式增加老師工作強(qiáng)度,費(fèi)時(shí)費(fèi)力,具有標(biāo)注效率低的缺陷。
【發(fā)明內(nèi)容】
[0003]本發(fā)明提供了一種建立獲取題目知識(shí)點(diǎn)模型的方法及裝置、獲取題目知識(shí)點(diǎn)的方法和裝置,用于解決現(xiàn)有技術(shù)中沒(méi)有獲取題目知識(shí)點(diǎn)的模型,人工識(shí)別和手動(dòng)標(biāo)注題目知識(shí)點(diǎn)的方式費(fèi)時(shí)費(fèi)力,標(biāo)注效率低的問(wèn)題。
[0004]為了解決上述技術(shù)問(wèn)題,本發(fā)明的一技術(shù)方案為提供一種建立獲取題目知識(shí)點(diǎn)模型的方法,包括:確定總知識(shí)點(diǎn)集及訓(xùn)練集中各題目的知識(shí)點(diǎn)集;
[0005]對(duì)訓(xùn)練集中各題目進(jìn)行分詞,合并訓(xùn)練集中所有題目的分詞結(jié)果,得到特征詞語(yǔ)集;
[0006]根據(jù)所述特征詞語(yǔ)集將訓(xùn)練集中各題目的分詞結(jié)果分別轉(zhuǎn)換為特征向量,根據(jù)所述總知識(shí)點(diǎn)集將訓(xùn)練集中各題目的知識(shí)點(diǎn)集分別轉(zhuǎn)換為知識(shí)點(diǎn)向量;
[0007]將每個(gè)題目的特征向量作為輸入,對(duì)應(yīng)題目的知識(shí)點(diǎn)向量作為輸出,采用機(jī)器學(xué)習(xí)方法建立獲取題目知識(shí)點(diǎn)的模型。
[0008]本發(fā)明的一實(shí)施例中,建立獲取題目知識(shí)點(diǎn)模型的方法還包括:對(duì)知識(shí)點(diǎn)體系文本內(nèi)容進(jìn)行分詞;合并訓(xùn)練集中所有題目的分詞結(jié)果得到特征詞語(yǔ)集進(jìn)一步為:合并訓(xùn)練集中所有題目的分詞結(jié)果及知識(shí)點(diǎn)體系文本內(nèi)容的分詞結(jié)果得到特征詞語(yǔ)集。
[0009]本發(fā)明的一實(shí)施例中,根據(jù)所述特征詞語(yǔ)集將訓(xùn)練集中各題目的分詞結(jié)果分別轉(zhuǎn)換為特征向量,根據(jù)所述總知識(shí)點(diǎn)集將訓(xùn)練集中各題目的知識(shí)點(diǎn)集分別轉(zhuǎn)換為知識(shí)點(diǎn)向量進(jìn)一步包括:
[0010]對(duì)于訓(xùn)練集中每一題目,建立一與所述特征詞語(yǔ)集長(zhǎng)度相同的特征向量,查找所述題目的分詞結(jié)果中每個(gè)詞語(yǔ)在所述特征詞語(yǔ)集中的位置,將所述特征向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O;
[0011]對(duì)于訓(xùn)練集中每一題目,建立一與所述總知識(shí)點(diǎn)集長(zhǎng)度相同的知識(shí)點(diǎn)向量,查找所述題目的知識(shí)點(diǎn)集中每個(gè)知識(shí)點(diǎn)在總知識(shí)點(diǎn)集中的位置,將所述知識(shí)點(diǎn)向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O。
[0012]本發(fā)明的一實(shí)施例中,在計(jì)算所述特征向量及所述知識(shí)點(diǎn)向量前還包括:利用字典排序法對(duì)所述特征詞語(yǔ)集及所述總知識(shí)點(diǎn)集中的元素進(jìn)行排序。
[0013]本發(fā)明的一實(shí)施例中,通過(guò)支持向量機(jī)或神經(jīng)網(wǎng)絡(luò)方法建立所述獲取題目知識(shí)點(diǎn)的模型。
[0014]本發(fā)明還提供一種獲取題目知識(shí)點(diǎn)的方法,包括:利用前述任一實(shí)施例的方法建立獲取題目知識(shí)點(diǎn)的模型;
[0015]根據(jù)特征詞語(yǔ)集將待處理題目的分詞結(jié)果轉(zhuǎn)換為特征向量;
[0016]將所述待處理題目對(duì)應(yīng)的特征向量輸入所述獲取題目知識(shí)點(diǎn)的模型,得到所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量,將所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量與所述總知識(shí)點(diǎn)集相匹配,得到待處理題目知識(shí)點(diǎn)。
[0017]本發(fā)明還提供一種建立獲取題目知識(shí)點(diǎn)模型的裝置,包括:知識(shí)點(diǎn)確定模塊,用于確定總知識(shí)點(diǎn)集及訓(xùn)練集中各題目的知識(shí)點(diǎn)集;
[0018]特征詞語(yǔ)確定模塊,用于對(duì)訓(xùn)練集中各題目進(jìn)行分詞,合并訓(xùn)練集中所有題目的分詞結(jié)果得到特征詞語(yǔ)集;
[0019]向量計(jì)算模塊,用于根據(jù)所述特征詞語(yǔ)集將訓(xùn)練集中各題目的分詞結(jié)果分別轉(zhuǎn)換為特征向量,根據(jù)所述總知識(shí)點(diǎn)集將訓(xùn)練集中各題目的知識(shí)點(diǎn)集分別轉(zhuǎn)換為知識(shí)點(diǎn)向量;
[0020]模型計(jì)算模塊,用于將每個(gè)題目的特征向量作為輸入,將對(duì)應(yīng)題目的知識(shí)點(diǎn)向量作為輸出,采用機(jī)器學(xué)習(xí)方法建立獲取題目知識(shí)點(diǎn)的模型。
[0021]本發(fā)明的一實(shí)施例中,所述特征詞語(yǔ)確定模塊還用于對(duì)知識(shí)點(diǎn)體系文本內(nèi)容進(jìn)行分詞,合并訓(xùn)練集中所有題目的分詞結(jié)果及知識(shí)點(diǎn)體系文本內(nèi)容的分詞結(jié)果得到特征詞語(yǔ)集。
[0022]本發(fā)明的一實(shí)施例中,所述向量計(jì)算模塊具體用于,對(duì)于訓(xùn)練集中每一題目,建立一與所述特征詞語(yǔ)集長(zhǎng)度相同的特征向量,查找所述題目的分詞結(jié)果中每個(gè)詞語(yǔ)在所述特征詞語(yǔ)集中的位置,將所述特征向量相應(yīng)位置處的元素設(shè)定為1,其余位置處的元素設(shè)定為O;
[0023]對(duì)于訓(xùn)練集中每一題目,建立一與所述總知識(shí)點(diǎn)集長(zhǎng)度相同的知識(shí)點(diǎn)向量,查找所述題目的知識(shí)點(diǎn)集中每個(gè)知識(shí)點(diǎn)在總知識(shí)點(diǎn)集中的位置,將所述知識(shí)點(diǎn)向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O。
[0024]本發(fā)明的一實(shí)施例中,建立獲取題目知識(shí)點(diǎn)模型的裝置還包括排序模塊,用于在所述向量計(jì)算模塊計(jì)算所述特征向量及所述知識(shí)點(diǎn)向量前,利用字典排序法對(duì)所述特征詞語(yǔ)集及所述總知識(shí)點(diǎn)集中的元素進(jìn)行排序。
[0025]本發(fā)明的一實(shí)施例中,所述模型計(jì)算模塊通過(guò)支持向量機(jī)或神經(jīng)網(wǎng)絡(luò)方法建立所述獲取題目知識(shí)點(diǎn)的模型。
[0026]本發(fā)明還提供一種獲取題目知識(shí)點(diǎn)的裝置,包括:建模模塊,用于利用前述任一實(shí)施例的裝置建立獲取題目知識(shí)點(diǎn)的模型;
[0027]特征向量計(jì)算模塊,用于根據(jù)特征詞語(yǔ)集將待處理題目的分詞結(jié)果轉(zhuǎn)換為特征向量;
[0028]題目知識(shí)點(diǎn)計(jì)算模塊,用于將所述待處理題目對(duì)應(yīng)的特征向量輸入所述獲取題目知識(shí)點(diǎn)的模型,得到所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量,將所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量與所述總知識(shí)點(diǎn)集相匹配,得到待處理題目知識(shí)點(diǎn)。
[0029]本發(fā)明通過(guò)對(duì)訓(xùn)練集中題目進(jìn)行分析,建立了獲取題目知識(shí)點(diǎn)的模型,將待處理題目對(duì)應(yīng)的特征向量輸入獲取題目知識(shí)點(diǎn)的模型能夠快速的得到待處理題目的知識(shí)點(diǎn)。本發(fā)明能夠提高標(biāo)注題目知識(shí)點(diǎn)的效率,降低老師工作強(qiáng)度,節(jié)省老師勞動(dòng)時(shí)間,從而提高教學(xué)效率。
【附圖說(shuō)明】
[0030]為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0031 ]圖1為本發(fā)明一實(shí)施例建立獲取題目知識(shí)點(diǎn)模型的方法的流程圖;
[0032]圖2為本發(fā)明一實(shí)施例獲取題目知識(shí)點(diǎn)的方法的流程圖;
[0033]圖3為本發(fā)明一實(shí)施例建立獲取題目知識(shí)點(diǎn)模型的裝置的結(jié)構(gòu)圖;
[0034]圖4為本發(fā)明另一實(shí)施例建立獲取題目知識(shí)點(diǎn)模型的裝置的結(jié)構(gòu)圖;
[0035]圖5為本發(fā)明一實(shí)施例獲取題目知識(shí)點(diǎn)的裝置的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0036]為了使本發(fā)明的技術(shù)特點(diǎn)及效果更加明顯,下面結(jié)合附圖對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步說(shuō)明,本發(fā)明也可有其他不同的具體實(shí)例來(lái)加以說(shuō)明或?qū)嵤魏伪绢I(lǐng)域技術(shù)人員在權(quán)利要求范圍內(nèi)做的等同變換均屬于本發(fā)明的保護(hù)范疇。
[0037]如圖1所示,圖1為本發(fā)明一實(shí)施例建立獲取題目知識(shí)點(diǎn)模型的方法的流程圖。該方法通過(guò)對(duì)訓(xùn)練集中題目進(jìn)行分析,建立了獲取題目知識(shí)點(diǎn)的模型。
[0038I具體的,所述方法包括:
[0039]步驟101:確定總知識(shí)點(diǎn)集及訓(xùn)練集中各題目的知識(shí)點(diǎn)集;
[0040]其中,總知識(shí)點(diǎn)集為一知識(shí)體系中所有知識(shí)點(diǎn)的集合。題目的知識(shí)點(diǎn)集為題目包含的知識(shí)點(diǎn)??傊R(shí)點(diǎn)集及訓(xùn)練集中各題目的知識(shí)點(diǎn)集可通過(guò)專業(yè)技術(shù)人員確定,如教師或輔導(dǎo)人員根據(jù)教學(xué)大綱、知識(shí)體系等依據(jù)進(jìn)行建立。
[0041]訓(xùn)練集包含隨機(jī)篩選出的多個(gè)題目,本發(fā)明對(duì)訓(xùn)練集中包含的題目個(gè)數(shù)不做限定,可根據(jù)建模精度具體設(shè)定。
[0042]步驟102:對(duì)訓(xùn)練集中各題目進(jìn)行分詞,合并訓(xùn)練集中所有題目的分詞結(jié)果,得到特征詞語(yǔ)集;
[0043]這里所述的對(duì)題目進(jìn)行分詞指的是對(duì)題目的文本內(nèi)容(也可稱之為題干)進(jìn)行分詞,具體實(shí)施時(shí),可利用自然語(yǔ)言處理的方法對(duì)各題目文本內(nèi)容進(jìn)行分詞。
[0044]步驟103:根據(jù)所述特征詞語(yǔ)集將訓(xùn)練集中各題目的分詞結(jié)果分別轉(zhuǎn)換為特征向量,根據(jù)所述總知識(shí)點(diǎn)集將訓(xùn)練集中各題目的知識(shí)點(diǎn)集分別轉(zhuǎn)換為知識(shí)點(diǎn)向量;
[0045]每個(gè)題目的分詞結(jié)果以詞語(yǔ)集合的形式進(jìn)行存儲(chǔ)。其中,特征向量與知識(shí)點(diǎn)向量均為計(jì)算機(jī)能夠識(shí)別的數(shù)值向量,特征向量長(zhǎng)度與特征詞語(yǔ)集長(zhǎng)度相同(即特征向量與特征詞語(yǔ)集包含的元素個(gè)數(shù)相等),知識(shí)點(diǎn)向量長(zhǎng)度與總知識(shí)點(diǎn)集長(zhǎng)度相同。
[0046]步驟104:將每個(gè)題目的特征向量作為輸入,對(duì)應(yīng)題目的知識(shí)點(diǎn)向量作為輸出,采用機(jī)器學(xué)習(xí)方法建立獲取題目知識(shí)點(diǎn)的模型;
[0047]實(shí)施時(shí),為了提高建模的速度及精度,通過(guò)支持向量機(jī)(SupportVectorMachine,SVM)或多層人工神經(jīng)網(wǎng)絡(luò)方法建立獲取題目知識(shí)點(diǎn)的模型。
[0048]具體實(shí)施時(shí),本發(fā)明對(duì)步驟101與步驟102執(zhí)行的先后順序不做限定,可先執(zhí)行步驟101,也可先執(zhí)行步驟102。
[0049]本實(shí)施例能夠建立獲取題目知識(shí)點(diǎn)的模型,找到題目分詞結(jié)果與題目知識(shí)點(diǎn)的對(duì)應(yīng)關(guān)系,為自動(dòng)獲取題目知識(shí)點(diǎn)奠定了基礎(chǔ)。
[0050]進(jìn)一步的,為了保證特征詞語(yǔ)集的全面性,進(jìn)而提高建模的準(zhǔn)確度,本發(fā)明一實(shí)施例中,建立獲取題目知識(shí)點(diǎn)模型的方法還包括對(duì)知識(shí)點(diǎn)體系文本內(nèi)容進(jìn)行分詞,步驟102中的合并訓(xùn)練集中所有題目的分詞結(jié)果得到特征詞語(yǔ)集進(jìn)一步為合并訓(xùn)練集中所有題目的分詞結(jié)果及知識(shí)點(diǎn)體系文本內(nèi)容的分詞結(jié)果得到特征詞語(yǔ)集。例如,訓(xùn)練集中包括η個(gè)題目,其中,題目I的分詞結(jié)果為X1集合、題目2的分詞結(jié)果為X2集合…題目η的分詞結(jié)果為乂?集合,知識(shí)點(diǎn)體系文本內(nèi)容的分詞結(jié)果為Y集合,則特征詞語(yǔ)集為XiUX2U.._UXnUY。
[0051]一實(shí)施例中,為了簡(jiǎn)化特征向量及知識(shí)點(diǎn)向量的轉(zhuǎn)換效率,提高建模效率,具體實(shí)施時(shí),步驟103進(jìn)一步為:
[0052]對(duì)于訓(xùn)練集中每一題目,建立一與所述特征詞語(yǔ)集長(zhǎng)度相同的特征向量,查找所述題目的分詞結(jié)果中每個(gè)詞語(yǔ)在所述特征詞語(yǔ)集中的位置,將所述特征向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O;
[0053]對(duì)于訓(xùn)練集中每一題目,建立一與所述總知識(shí)點(diǎn)集長(zhǎng)度相同的知識(shí)點(diǎn)向量,查找所述題目的知識(shí)點(diǎn)集中每個(gè)知識(shí)點(diǎn)在總知識(shí)點(diǎn)集中的位置,將所述知識(shí)點(diǎn)向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O。
[0054]為了提高查找效率,本發(fā)明在計(jì)算特征向量及知識(shí)點(diǎn)向量前還包括,利用字典排序法對(duì)特征詞語(yǔ)集及總知識(shí)點(diǎn)集中的元素進(jìn)行排序。字典排序法為現(xiàn)有方法,本發(fā)明對(duì)其具體排序過(guò)程不再贅述。當(dāng)然,具體實(shí)施時(shí),還可采用其他排序方法對(duì)特征詞語(yǔ)集及知識(shí)點(diǎn)集中的元素進(jìn)行排序。
[0055]如圖2所示,圖2為本發(fā)明一實(shí)施例獲取題目知識(shí)點(diǎn)的方法的流程圖。獲取題目知識(shí)點(diǎn)的方法包括:
[0056]步驟201:利用前述實(shí)施例所述的建立獲取題目知識(shí)點(diǎn)模型的方法建立獲取題目知識(shí)點(diǎn)的模型;建立獲取題目知識(shí)點(diǎn)的模型過(guò)程參見(jiàn)上述實(shí)施例,此處不再贅述。
[0057]步驟202:根據(jù)特征詞語(yǔ)集將待處理題目的分詞結(jié)果轉(zhuǎn)換為特征向量;
[0058]其中,特征詞語(yǔ)集為訓(xùn)練集中所有題目的分詞結(jié)果的合集。訓(xùn)練集為建立獲取題目知識(shí)點(diǎn)模型時(shí)選取的樣本集合。實(shí)施時(shí),可利用自然語(yǔ)言處理方法對(duì)待處理題目文本內(nèi)容進(jìn)行分詞。
[0059]步驟203:將所述待處理題目對(duì)應(yīng)的特征向量輸入所述獲取題目知識(shí)點(diǎn)的模型,得到所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量,將所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量與所述總知識(shí)點(diǎn)集相匹配,得到待處理題目知識(shí)點(diǎn)。
[0060]詳細(xì)的說(shuō),待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量中的每個(gè)元素值為總知識(shí)點(diǎn)集對(duì)應(yīng)位置詞語(yǔ)的置信度。得到待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量后,比較知識(shí)點(diǎn)向量中各元素值與預(yù)定閾值(預(yù)定閾值為接近I的值)的大小,記錄大于預(yù)定閾值元素的位置,提取總知識(shí)點(diǎn)集相應(yīng)位置處的知識(shí)點(diǎn),這些知識(shí)點(diǎn)組成的集合即為該待處理題目知識(shí)點(diǎn)。
[0061]本實(shí)施例能夠?qū)崿F(xiàn)自動(dòng)標(biāo)注題目知識(shí)點(diǎn),提高了標(biāo)注效率,降低老師工作強(qiáng)度,節(jié)省老師勞動(dòng)時(shí)間,能夠提高教學(xué)效率。
[0062]如圖3所示,圖3為本發(fā)明一實(shí)施例建立獲取題目知識(shí)點(diǎn)模型的裝置的結(jié)構(gòu)圖。本實(shí)施例可以通過(guò)邏輯電路或者芯片實(shí)現(xiàn),或者安裝于現(xiàn)有的高性能計(jì)算終端,例如手機(jī)、平板電腦、計(jì)算機(jī)等設(shè)備中,或者以功能模塊的方式由軟件實(shí)現(xiàn)各部件的功能。
[0063]具體的,建立獲取題目知識(shí)點(diǎn)模型的裝置包括:知識(shí)點(diǎn)確定模塊301、特征詞語(yǔ)確定模塊302、向量計(jì)算模塊303、模型計(jì)算模塊304。
[0064]知識(shí)點(diǎn)確定模塊301用于確定總知識(shí)點(diǎn)集及訓(xùn)練集中各題目的知識(shí)點(diǎn)集;
[0065]特征詞語(yǔ)確定模塊302用于對(duì)訓(xùn)練集中各題目進(jìn)行分詞,合并訓(xùn)練集中所有題目的分詞結(jié)果得到特征詞語(yǔ)集;
[0066]向量計(jì)算模塊303用于根據(jù)所述特征詞語(yǔ)集將訓(xùn)練集中各題目的分詞結(jié)果分別轉(zhuǎn)換為特征向量,根據(jù)所述總知識(shí)點(diǎn)集將訓(xùn)練集中各題目的知識(shí)點(diǎn)集分別轉(zhuǎn)換為知識(shí)點(diǎn)向量,根據(jù)所述特征詞語(yǔ)集將待處理題目的分詞結(jié)果轉(zhuǎn)換為特征向量;
[0067]模型計(jì)算模塊304用于將每個(gè)題目的特征向量作為輸入,將對(duì)應(yīng)題目的知識(shí)點(diǎn)向量作為輸出,采用機(jī)器學(xué)習(xí)方法建立獲取題目知識(shí)點(diǎn)的模型;
[0068]具體實(shí)施時(shí),為了提高建模精度及速度,通過(guò)支持向量機(jī)或神經(jīng)網(wǎng)絡(luò)的方法建立所述獲取題目知識(shí)點(diǎn)的模型。
[0069]—實(shí)施例中,為了保證特征詞語(yǔ)集的全面性,進(jìn)而提高建模的準(zhǔn)確度,所述特征詞語(yǔ)確定模塊302還用于對(duì)知識(shí)點(diǎn)體系文本內(nèi)容進(jìn)行分詞,合并訓(xùn)練集中所有題目的分詞結(jié)果及知識(shí)點(diǎn)體系文本內(nèi)容的分詞結(jié)果得到特征詞語(yǔ)集。
[0070]一實(shí)施例中,為了簡(jiǎn)化特征向量及知識(shí)點(diǎn)向量的轉(zhuǎn)換效率,向量計(jì)算模塊303計(jì)算特征向量及知識(shí)點(diǎn)向量的過(guò)程包括:
[0071]對(duì)于訓(xùn)練集中每一題目,建立一與所述特征詞語(yǔ)集長(zhǎng)度相同的特征向量,查找所述題目的分詞結(jié)果中每個(gè)詞語(yǔ)在所述特征詞語(yǔ)集中的位置,將所述特征向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O;
[0072]對(duì)于訓(xùn)練集中每一題目,建立一與所述總知識(shí)點(diǎn)集長(zhǎng)度相同的知識(shí)點(diǎn)向量,查找所述題目的知識(shí)點(diǎn)集中每個(gè)知識(shí)點(diǎn)在總知識(shí)點(diǎn)集中的位置,將所述知識(shí)點(diǎn)向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O。
[0073]本發(fā)明一實(shí)施例中,如圖4所示,建立獲取題目知識(shí)點(diǎn)模型的裝置還包括排序模塊305,用于在向量計(jì)算模塊303計(jì)算特征向量及知識(shí)點(diǎn)向量前,利用字典排序法對(duì)特征詞語(yǔ)集及總知識(shí)點(diǎn)集中的元素進(jìn)行排序。本實(shí)施能夠提高查找速度,提高建模效率。
[0074]如圖5所示,圖5為本發(fā)明一實(shí)施例獲取題目知識(shí)點(diǎn)的裝置的結(jié)構(gòu)圖。具體的,獲取題目知識(shí)點(diǎn)的裝置包括:
[0075]建模模塊501,利用前述任一實(shí)施例所述的建立獲取題目知識(shí)點(diǎn)模型的裝置建立獲取題目知識(shí)點(diǎn)的模型;
[0076]特征向量計(jì)算模塊502,用于根據(jù)特征詞語(yǔ)集將待處理題目的分詞結(jié)果轉(zhuǎn)換為特征向量;
[0077]題目知識(shí)點(diǎn)計(jì)算模塊503,用于將所述待處理題目對(duì)應(yīng)的特征向量輸入所述獲取題目知識(shí)點(diǎn)的模型,得到所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量,將所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量與所述總知識(shí)點(diǎn)集相匹配,得到待處理題目知識(shí)點(diǎn)。
[0078]本發(fā)明能夠提高標(biāo)注題目知識(shí)點(diǎn)的效率,降低老師工作強(qiáng)度,節(jié)省老師勞動(dòng)時(shí)間,從而提尚教學(xué)效率。
[0079]以上所述僅用于說(shuō)明本申請(qǐng)技術(shù)方案,任何本領(lǐng)域普通技術(shù)人員均可在不違背本發(fā)明的精神及范疇下,對(duì)上述實(shí)施例進(jìn)行修飾與改變。因此,本發(fā)明的權(quán)利保護(hù)范圍應(yīng)視權(quán)利要求范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1.一種建立獲取題目知識(shí)點(diǎn)模型的方法,其特征在于,包括: 確定總知識(shí)點(diǎn)集及訓(xùn)練集中各題目的知識(shí)點(diǎn)集; 對(duì)訓(xùn)練集中各題目進(jìn)行分詞,合并訓(xùn)練集中所有題目的分詞結(jié)果,得到特征詞語(yǔ)集; 根據(jù)所述特征詞語(yǔ)集將訓(xùn)練集中各題目的分詞結(jié)果分別轉(zhuǎn)換為特征向量,根據(jù)所述總知識(shí)點(diǎn)集將訓(xùn)練集中各題目的知識(shí)點(diǎn)集分別轉(zhuǎn)換為知識(shí)點(diǎn)向量; 將每個(gè)題目的特征向量作為輸入,對(duì)應(yīng)題目的知識(shí)點(diǎn)向量作為輸出,采用機(jī)器學(xué)習(xí)方法建立獲取題目知識(shí)點(diǎn)的模型。2.如權(quán)利要求1所述的建立獲取題目知識(shí)點(diǎn)模型的方法,其特征在于,所述方法還包括對(duì)知識(shí)點(diǎn)體系文本內(nèi)容進(jìn)行分詞; 合并訓(xùn)練集中所有題目的分詞結(jié)果得到特征詞語(yǔ)集進(jìn)一步為: 合并訓(xùn)練集中所有題目的分詞結(jié)果及知識(shí)點(diǎn)體系文本內(nèi)容的分詞結(jié)果得到特征詞語(yǔ)集。3.如權(quán)利要求1所述的建立獲取題目知識(shí)點(diǎn)模型的方法,其特征在于,根據(jù)所述特征詞語(yǔ)集將訓(xùn)練集中各題目的分詞結(jié)果分別轉(zhuǎn)換為特征向量,根據(jù)所述總知識(shí)點(diǎn)集將訓(xùn)練集中各題目的知識(shí)點(diǎn)集分別轉(zhuǎn)換為知識(shí)點(diǎn)向量進(jìn)一步包括: 對(duì)于訓(xùn)練集中每一題目,建立一與所述特征詞語(yǔ)集長(zhǎng)度相同的特征向量,查找所述題目的分詞結(jié)果中每個(gè)詞語(yǔ)在所述特征詞語(yǔ)集中的位置,將所述特征向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O; 對(duì)于訓(xùn)練集中每一題目,建立一與所述總知識(shí)點(diǎn)集長(zhǎng)度相同的知識(shí)點(diǎn)向量,查找所述題目的知識(shí)點(diǎn)集中每個(gè)知識(shí)點(diǎn)在總知識(shí)點(diǎn)集中的位置,將所述知識(shí)點(diǎn)向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O。4.如權(quán)利要求3所述的建立獲取題目知識(shí)點(diǎn)模型的方法,其特征在于,在計(jì)算所述特征向量及所述知識(shí)點(diǎn)向量前還包括:利用字典排序法對(duì)所述特征詞語(yǔ)集及所述總知識(shí)點(diǎn)集中的元素進(jìn)行排序。5.如權(quán)利要求1所述的建立獲取題目知識(shí)點(diǎn)模型的方法,其特征在于,通過(guò)支持向量機(jī)或神經(jīng)網(wǎng)絡(luò)方法建立所述獲取題目知識(shí)點(diǎn)的模型。6.一種獲取題目知識(shí)點(diǎn)的方法,其特征在于,包括: 利用權(quán)利要求1至5任一項(xiàng)所述的方法建立獲取題目知識(shí)點(diǎn)的模型; 根據(jù)特征詞語(yǔ)集將待處理題目的分詞結(jié)果轉(zhuǎn)換為特征向量; 將所述待處理題目對(duì)應(yīng)的特征向量輸入所述獲取題目知識(shí)點(diǎn)的模型,得到所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量,將所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量與所述總知識(shí)點(diǎn)集相匹配,得到待處理題目知識(shí)點(diǎn)。7.一種建立獲取題目知識(shí)點(diǎn)模型的裝置,其特征在于,包括: 知識(shí)點(diǎn)確定模塊,用于確定總知識(shí)點(diǎn)集及訓(xùn)練集中各題目的知識(shí)點(diǎn)集; 特征詞語(yǔ)確定模塊,用于對(duì)訓(xùn)練集中各題目進(jìn)行分詞,合并訓(xùn)練集中所有題目的分詞結(jié)果得到特征詞語(yǔ)集; 向量計(jì)算模塊,用于根據(jù)所述特征詞語(yǔ)集將訓(xùn)練集中各題目的分詞結(jié)果分別轉(zhuǎn)換為特征向量,根據(jù)所述總知識(shí)點(diǎn)集將訓(xùn)練集中各題目的知識(shí)點(diǎn)集分別轉(zhuǎn)換為知識(shí)點(diǎn)向量; 模型計(jì)算模塊,用于將每個(gè)題目的特征向量作為輸入,將對(duì)應(yīng)題目的知識(shí)點(diǎn)向量作為輸出,采用機(jī)器學(xué)習(xí)方法建立獲取題目知識(shí)點(diǎn)的模型。8.如權(quán)利要求7所述的建立獲取題目知識(shí)點(diǎn)模型的裝置,其特征在于,所述特征詞語(yǔ)確定模塊還用于對(duì)知識(shí)點(diǎn)體系文本內(nèi)容進(jìn)行分詞,合并訓(xùn)練集中所有題目的分詞結(jié)果及知識(shí)點(diǎn)體系文本內(nèi)容的分詞結(jié)果得到特征詞語(yǔ)集。9.如權(quán)利要求7所述的建立獲取題目知識(shí)點(diǎn)模型的裝置,其特征在于,所述向量計(jì)算模塊具體用于, 對(duì)于訓(xùn)練集中每一題目,建立一與所述特征詞語(yǔ)集長(zhǎng)度相同的特征向量,查找所述題目的分詞結(jié)果中每個(gè)詞語(yǔ)在所述特征詞語(yǔ)集中的位置,將所述特征向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O; 對(duì)于訓(xùn)練集中每一題目,建立一與所述總知識(shí)點(diǎn)集長(zhǎng)度相同的知識(shí)點(diǎn)向量,查找所述題目的知識(shí)點(diǎn)集中每個(gè)知識(shí)點(diǎn)在總知識(shí)點(diǎn)集中的位置,將所述知識(shí)點(diǎn)向量相應(yīng)位置處的元素設(shè)定為I,其余位置處的元素設(shè)定為O。10.如權(quán)利要求9所述的建立獲取題目知識(shí)點(diǎn)模型的裝置,其特征在于,還包括排序模塊,用于在所述向量計(jì)算模塊計(jì)算所述特征向量及所述知識(shí)點(diǎn)向量前,利用字典排序法對(duì)所述特征詞語(yǔ)集及所述總知識(shí)點(diǎn)集中的元素進(jìn)行排序。11.如權(quán)利要求7所述的建立獲取題目知識(shí)點(diǎn)模型的裝置,其特征在于,所述模型計(jì)算模塊通過(guò)支持向量機(jī)或神經(jīng)網(wǎng)絡(luò)方法建立所述獲取題目知識(shí)點(diǎn)的模型。12.一種獲取題目知識(shí)點(diǎn)的裝置,其特征在于,包括: 建模模塊,用于利用權(quán)利要求7至11任一項(xiàng)所述的裝置建立獲取題目知識(shí)點(diǎn)的模型; 特征向量計(jì)算模塊,用于根據(jù)特征詞語(yǔ)集將待處理題目的分詞結(jié)果轉(zhuǎn)換為特征向量; 題目知識(shí)點(diǎn)計(jì)算模塊,用于將所述待處理題目對(duì)應(yīng)的特征向量輸入所述獲取題目知識(shí)點(diǎn)的模型,得到所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量,將所述待處理題目對(duì)應(yīng)的知識(shí)點(diǎn)向量與所述總知識(shí)點(diǎn)集相匹配,得到待處理題目知識(shí)點(diǎn)。
【文檔編號(hào)】G06Q50/20GK105930319SQ201610301360
【公開(kāi)日】2016年9月7日
【申請(qǐng)日】2016年5月9日
【發(fā)明人】熊蜀光
【申請(qǐng)人】北京新唐思創(chuàng)教育科技有限公司