《中学生数理化》
一、引言
中学的课业负担较重,特别是初三和高三毕业班,他们面临着升学的压力。中学生怎样才能在较短的时间内提高自己呢?大部分的科任老师仅凭感觉或者经验得知本班学生或个别学生哪些方面的知识点较薄弱,这种缺乏数据支撑的“个人感知”往往很难准确地制定针对性的教学计划、设计教学案例。为了更好地解决该问题,文章认为对中学生的学习进行跟踪,通过数据分析了解学生的真实水平,这样学生自身知道了差距方便调整学习计划,科任老师也可根据学生的实际情况调整教学方案。为此文章将设计学生课业水平预测算法,对学生的课业水平进行预测。
学生课业水平一直受到国内外学者的广泛关注,我国广大的学生家长对课业成绩的追捧从未停止过,众多学者都做过深入的研究。吴兴惠等学者利用随机森林算法对学生成绩评进行了预测,张子誉学者也提出了基于随机森林模型的成绩预测算法,尽管取得了不俗的精确度,但他们都脱离了学生学习的实际情况,有可能存在误判;王婧妍等学者提出了基于特征选择优化的学生成绩预测算法,通过设置特征向量,计算各个特征的概率值来预测成绩,预测精度值得商榷;张彦荣、刘毓、周剑等学者都在神经网络的基础上提出了学生成绩的预测算法,神经网络具备了一定的学习能力,精度有很大的提高,但仍然因为对学生实际缺乏足够的了解,预测是存在一定的偏差;刘艳杰、韩丽娜等学者利用贝叶斯算法,通过计算概率值来测算学生的成绩,误差较大,在中学生的课业预测中有一定的困难。文章首先设计了学生知识点“掌握总体指数”的计算方法,该方法用于实际计算学生对某知识点的掌握程度,这是学生的真实情况,不存在预测成分;然后根据试卷或测验中所包含的知识点数量和学生的各知识点的“掌握总体指数”来预测特定试卷学生的成绩。文章用学生对知识点掌握的真实情况来预测特定试卷或测验的成绩,相对于近从数据着手、“抛开学生实际情况”的相关算法,具有一定的优势。
二、学生课业水平预测
(一)知识点“掌握指数”
以初三或高三学生为例,设整个中学学习阶段(初中或高中)的知识点集合为I={I1,I2,…,In},每次考试抽取了部分知识点形成子集Si作为试卷,若Si(Ij)表示第i次考试知识点Ij出现的次数,某学生对知识点Ij的掌握情况如公式(1)所示。
公式(1)中如果学生做对了该知识点则为1,否则为0,公式(2)的分子表示知识点Ij学生在所有的试卷总做对次数,因此Masti表示知识点Ij学生在第i次考试中的“掌握指数”,即做对的比例,做对次数越多,该值越接近1,例如若某学生知识点Ij的掌握指数呈现如图1所示状况。
图1 学生知识点掌握指数
从图1可以知道该学生第一次没有掌握该知识点,从第二次到第六次曲线是单调递增的,说明这几次都是做对了,即掌握了该知识点,但后面几次出现了反复,说明掌握得不够牢固,或者是粗心大意没有做对,从第十次开始是直线上升的,说明后面几次都做得对。公式(3)表示学生对知识点Ij最近几次的掌握情况,计算方法是从第m次为起点,累计算到最后一次考试的“掌握指数”的算术平均值,为了更好地量化计算,公式(4)用分段函数表示“掌握总体指数”。
通过公式(2)和公式(4)的计算可以获得每一位学生每个知识点的每次考试的“掌握指数”和最后的“掌握总体指数”,并画出类似如图1所示的掌握指数图,这样学生和老师都能一目了然地知道学生对每个知识点的掌握情况。
(二)成绩预测
设某次试卷抽取了知识点I的子集Si={Si1,Si2,…,Sin},每个知识点出的题目数量可能有若干题,例如某知识点出了两题,其中一题为3分,另一题为5分,则可以把该知识点处理为总共出了1题,总分值为5分。设每个知识点的总分值Value={N1,N2,…,Nn},则利用公式(5)来预测学生在该份试卷中的得分。
公式(5)表示某个知识点的得分由其分值和该知识点的“掌握总体指数”的乘积来表示,最后累加即可得到总成绩。科任老师根据公式(5)可以测算出本班所有学生分数,也可以可计算出平均成绩,即可知道本班学生的总体情况。
三、实验
为了验证上述公式的有效性,文章作者作为某中学的班主任老师,带领某班学生从高一直到高三,积累了该班学生各个科目的考试数据。该班学生人数52人,在某次考试中设置了20个知识点,各个知识的分值{5,5,6,3,4,8,7,10,15,8,5,6,7,3,4,6,13,11,15,9},根据历次的考试情况可以得到每个学生每个知识点的“掌握总体指数”,对于这次实验则需要有20个知识点的“掌握总体指数”,则52个学生,总共有52×20=1040个“掌握总体指数”,这样可以测算出每个学生的考试成绩。经过实际考试对比后得知,精确预测出了49人的成绩,精确度达到94.2%,其他3人的成绩在预测值误差在2分以内,误差非常低。