本發(fā)明涉及機器學習方法的研究與應用,具體為一種高校教學質量評價方法。
背景技術:
教學質量的好壞對于高等院校來說是一個重要的指標,它反映了高等院校教學環(huán)節(jié)的有效性,對課程進行教學質量的有效評價,能夠為高等院校在教學活動、人才培養(yǎng)、師資隊伍建設等方面的決策提供有力支持。高等院校對課程的教學質量評價由一些獨立的指標構成,例如學生的上課表現(xiàn)、考試成績、對課程教學的評價、教學督導的評價等,但是這些指標有主觀指標,也有客觀指標,會混雜一些人為因素于其中,僅從這些指標加權組合得到的指標并不能準確反映真實的教學質量;而且把某些定量指標納入到明確的教學質量計算公式中,往往會在相當程度上左右著教師和學生努力的方向,教與學的方式方法,對教學工作起著顯著的導向作用,會使教學活動的根本目標發(fā)生偏離。目前研究人員采用機器學習和統(tǒng)計學習的方法從教學過程的原始數(shù)據(jù)出發(fā),對課程的教學質量進行評價。文獻“胡帥,顧艷,曲巍巍等.基于PCA-LVQ神經(jīng)網(wǎng)絡的教學質量評價模型研究[J].河南科學,2015,(7):1247-1252.”提出一種基于主成分分析(PCA)和學習矢量量化神經(jīng)網(wǎng)絡(LVQ)相結合的教學質量評價模型。使用層次分析法(AHP)建立教學質量評價體系,再用主成分分析提取初始評價指標體系的特征信息,將經(jīng)過降維處理后的特征信息輸入到LVQ神經(jīng)網(wǎng)絡。該方法把層次分析法與矢量量化神經(jīng)網(wǎng)絡進行結合,提取了教學質量評價體系中的規(guī)律,并用神經(jīng)網(wǎng)絡進行建模。該方法的問題在于需要對現(xiàn)有指標體系的各個指標進行主成分分析,而不能完全做到由原始數(shù)據(jù)直接得到教學質量的好壞程度,并且受到神經(jīng)網(wǎng)絡訓練代價大的影響,難以提取出教學質量評價中的核心因素,且在樣本數(shù)量較小的情況下過度擬合的情況比較嚴重,很難得到一個能夠反映普遍規(guī)律的模型。
現(xiàn)有方法的不足之處是:
(1).大多數(shù)方法是基于固定的公式,通過對教學過程中的指標進行加權得到教學質量的定量評價,很多時候這并不能反映真實的教學質量的水平,同時也為教學活動帶來了負面的導向性作用;
(2).現(xiàn)有方法很少考慮到學生對于教學過程反饋的有效性,以及待評價課程歷史上的成績水平等因素,難以對教學質量進行有效而真實的評價。
基于此,本發(fā)明提出一種高校教學質量評價方法,以解決當前高校教學質量評價方法的不足,采用深度學習技術建立評價模型,對教學過程中的學生成績、學生評教問卷、教學督導打分表、學生以往的表現(xiàn)、待評價課程以往的教學質量水平、任課教師以往的教學質量水平等因素的內在關系進行建模,挖掘出決定教學質量的核心因素,為高等院校在教學活動、人才培養(yǎng)、師資隊伍建設等方面的決策提供有力支持.
技術實現(xiàn)要素:
為了克服現(xiàn)有的高校教學質量評價方法的不足之處,包括現(xiàn)有方法多是基于固定的公式,通過對教學過程中的指標進行加權得到教學質量的定量評價,現(xiàn)有方法很少考慮到學生對于教學過程反饋的有效性,以及待評價課程歷史上的成績水平等因素,本發(fā)明專利提出了一種基于深度學習的高校教學質量評價方法。本發(fā)明的特征包括教學評價數(shù)據(jù)的預處理、深度學習模型的設計、模型訓練、教學質量評價結果的計算,每個過程包含若干個步驟,其特征分別描述如下:
(1).教學評價數(shù)據(jù)的預處理
本發(fā)明針對的教學評價數(shù)據(jù)包括三種,分別為學生成績數(shù)據(jù)、學生評教數(shù)據(jù)、教學督導評價數(shù)據(jù),三種類型的數(shù)據(jù)的預處理方式如下:
C.學生成績數(shù)據(jù)
每個科目每位學生一條記錄,本發(fā)明中處理的數(shù)據(jù)為“期末考試成績”和“平時成績”,對這兩個成績進行標準化,使其轉化為[0,1]區(qū)間里的值。標準化方法為:
-對于分數(shù)類型的成績,如0-100分之間的成績,采用直接除以滿分的方法,例如滿分是100分,某學生的分數(shù)為90分,則標準化后該學生的分數(shù)為90/100=0.9分;
-對于等級型成績,如A、B、C、D、E五等,按最好的等級為1分,最低的等級為0分,其余各等級在0和1分之間均勻分布;
D.學生評教數(shù)據(jù)
學生評教數(shù)據(jù)為問卷類型,是在學生完成某門課程的學習后填寫的,包括從教學內容、教材、任課教師等方面進行評價。一般來說對于問卷的每一個問題或一組問題,會有相應的權值,用于計算最后的評教得分。在本發(fā)明中使用學生評教問卷的原始數(shù)據(jù),不考慮權值。問卷由一系列的選擇題構成,在本發(fā)明中對問卷數(shù)據(jù)的處理方式為啞變量化,例如,對于某個選擇題,有4個選項,某個學生對該題的選擇為1和2,則啞變量化為1100。
不考慮問卷中的文字回答的題目。
E.教學督導評價數(shù)據(jù)
教學督導評價是對課堂教學情況的評價,包括對教學內容、教學技巧、備課情況、互動性、學生聽課狀態(tài)等評價,每一項評價內容一般采用等級型的形式,例如優(yōu)、良、中、及格、差,或采用百分制形式。
-對于分數(shù)類型的評價,如0-100分之間的成績,采用直接除以滿分的方法,例如滿分是100分,某項評價的分數(shù)為90分,則標準化后該項評價的分數(shù)為90/100=0.9分;
-對于等級型評價,如優(yōu)、良、中、及格、差五等,按最好的等級為1分,最低的等級為0分,其余各等級在0和1分之間均勻分布;
(2).深度學習模型的設計
A.成績-評教模型的設計
成績-評教模型接受經(jīng)過步驟(1)預處理的學生某一門課程分數(shù)(包括期末考試成績和平時成績)和對該課程的評教數(shù)據(jù)作為輸入,輸出為學生到目前為止所有課程成績的排名等次,一共分p個等次,例如一共有100個學生,10個等次,則1-10名為第1等次,11-20名為第二等次,依此類推。具體來說,該模型的輸入層是一個向量,向量的前半部分是學生某一門課程經(jīng)過標準化后的“期末考試成績”和“平時成績”,后半部分是該學生對該課程的經(jīng)過標準后的評教向量,兩者連接成一個輸入向量;該模型的輸出是一個長度為p且其值在[0,1]之間的實值向量,在每得到一個輸出后,設置其中最大的分量為1,其余位為0,某一位為1代表模型輸出該學生為該位所代表的等次,在每個輸出向量中,有且只有一位為1,其余位均為0。若在某個輸出中存在并列的最大分量,則隨機選擇一個為1,其余均設置為0。
模型采用深度神經(jīng)網(wǎng)絡的結構,由多個塊組成,其中除最后一個塊外,每個塊均包括一個全連接層、激活層和屏蔽層,最后一個塊由全連接層和激活層組成。
-全連接層
在本發(fā)明中的統(tǒng)一使用結點個數(shù)為原始輸入層向量長度3倍的全連接層,例如輸入向量為50維,則每一個全連接層的結點數(shù)均為150,全連接層中的每一個結點與上一層的所有結點都有一個連接,每個連接都有一個[0,1]之間的實數(shù)權值,在全連接層的每個結點處執(zhí)行加權求和的操作;
-激活層
在每一個全連接層后面跟一個激活層,激活層的結點個數(shù)與全連接層的結點個數(shù)相同,每個激活層的結點對應上一個全連接層的結點,對由全連接層結點的輸出值進行sigmoid函數(shù)的計算,即:其中x是上一個全連接層對應結點的輸出,y是激活層相應結點的輸出;
-屏蔽層
在每一個激活層后面跟一個屏蔽層,屏蔽層隨機屏蔽上一個激活層的g%的結點,被屏蔽的結點不再參與下一個全連接層的計算。在模型開始訓練之前就通過隨機選擇的方式確定每一個屏蔽層需要被屏蔽的結點。
B.教學質量評價模型的設計
教學質量評價模型的輸入包括兩部分,其一是經(jīng)過標準化后的教學督導評價數(shù)據(jù),其二是對每個教學班每門課程的成績-評教模型的最后一個塊的激活層輸出特征統(tǒng)計,它是一個q維向量,它是這樣得到的:把該班每一個學生的期末考試成績和該學生對該課程的評教信息輸入成績-評教模型之后,獲取該模型的最后一個塊的激活層輸出特征向量,把由每個學生得到這個向量的每個分量相加,然后再把每一個分量除以該教學班的學生人數(shù)。
教學質量評價模型的輸出為一個0-1之間的數(shù)值,代表教學質量的評分。
模型采用深度神經(jīng)網(wǎng)絡的結構,由全連接層、激活層和屏蔽層構成,這三種類型的層與本部分的A點相同,模型結構與本部分的A點相同。
(4).模型訓練
采用深度神經(jīng)網(wǎng)絡標準的誤差反向傳播學習算法對模型的權值進行調整,調整是根據(jù)模型的輸出與真實的目標值之間的差異進行的。
對于成績-評教模型的誤差計算,根據(jù)輸出的0-1向量與通過歷史數(shù)據(jù)計算的學生等次向量(計算方法見步驟(2).A)的差異進行,若兩個向量在某一位上相同,則該位的誤差為0,反之為1。
對于教學質量評價模型的誤差計算,按模型輸出的教學質量評分與由教學管理人員給出的教學質量評分之間的差異進行。
模型的權值采用[0,1]之間的隨機數(shù)進行初始化,進行多輪訓練,所有訓練樣本輸入到模型中并且完成權值調整為一輪,直到模型的輸出誤差不再下降為止。
(5).教學質量評價
對某個教學班的某門課程進行教學質量評價的步驟如下:
D.根據(jù)步驟(1)獲取并預處理學生成績數(shù)據(jù)、學生評教數(shù)據(jù)、教學督導評價數(shù)據(jù);
E.對教學班的每位學生,根據(jù)步驟(2).B計算由成績-評教模型得到的q維特征向量;
F.把得到的q維特征向量與標準化后的教學督導評價數(shù)據(jù)進行連接,輸入到教學質量評價模型,模型的輸出為一個[0,1]之間的分數(shù),該分數(shù)反映該教學班在該門課程上的教學質量。
具體實施例
本發(fā)明在發(fā)明人所在高校的教學質量評價過程中進行測試,取得了較好的效果。下面給出一個實施例,對該高校的網(wǎng)絡工程專業(yè)中的“操作系統(tǒng)”課程進行教學質量評價。
(1)數(shù)據(jù)預處理
教學班為三年級上學期的學生,一共有98名學生,在前兩年的學習過程中已經(jīng)完成了18門課程。待評價課程“操作系統(tǒng)”的期末考試成績和平時成績均為100分制,按發(fā)明內容的步驟(1).A進行標準化。
學生評教數(shù)據(jù)為每門課程每學生填寫一張問卷,問卷包含21道單項選擇題和1道文字回答題,單項選擇題均為4個選項,按發(fā)明內容的步驟(1).B對每位學生對于21道單項選擇題的回答進行啞變量化,啞變量化之后得到一個84維的0-1向量。
教學督導評價數(shù)據(jù)為每門課程填寫一張問卷,問卷包含15個方面的評價,其中有8個方面需要給出0-100分之間的評價,另外7個方面需要在五檔評價當中進行選擇,按發(fā)明內容的步驟(1).C對這部分數(shù)據(jù)進行標準化,標準化后得到一個15維的實值向量,每個分量的值在[0,1]之間。
(2)深度學習模型的設計
A.成績-評教模型的設計
按發(fā)明內容的步驟(2).A進行,其中p取20,g取20。模型的輸入維數(shù)為2+84=86維。網(wǎng)絡的輸出維數(shù)為20維。表1展示了成績-評教模型的具體設計方案。
表1.成績-評教模型設計表
B.教學質量評價模型的設計
按發(fā)明內容的步驟(2).B進行,輸維數(shù)為258+15=273維,其中258維的數(shù)據(jù)來自成績-評教模型的最后一個激活層的輸出特征(見表1的第36層)。網(wǎng)絡的輸出維數(shù)為1維。表2展示了教學質量評價模型的具體設計方案。
表2.教學質量評價模型設計表
(3).模型訓練
在MatConvNet(http://www.vlfeat.org/matconvnet/)中通過配置文件實現(xiàn)表1和表2中的模型結構,把數(shù)據(jù)集做成Matlab數(shù)據(jù)文件.mat格式,然后使用MatConvNet提供的訓練腳本cnn_train.m進行訓練。訓練進行70輪,學習率分別為0.05,0.01,0.005,0.001,0.0005,0.0001和0.00005。訓練的損失函數(shù)采用zero-one loss。每個模型經(jīng)過70輪訓練后,系統(tǒng)會生成70個.mat文件,分別保存了各輪訓練結束時模型的參數(shù)。
(4).教學質量評價
先使用第70輪訓練結束時的成績-評教模型對“操作系統(tǒng)”的考試成績和學生評教數(shù)據(jù)組成的向量進行特征提取,提取每個學生的數(shù)據(jù)輸入到模型后的最后一個激活層的輸出(為一個258維的向量),把98個這樣的向量的每個分量取平均,然后把這個經(jīng)過平均之后的258維向量與經(jīng)過標準化后的“操作系統(tǒng)”的教學督導評價數(shù)據(jù)進行連接,輸入第70輪訓練結束時的教學質量評價模型,最終得到一個0-1之間的分數(shù),再乘以100,代表該教學班在該課程上的教學質量。