摘 要 本文描述了现在教学过程中评价学生学习效能的评价方法,指出当将此种方法推广到大学教育中,由于大学教育的特殊性,会出现不适用的现象。并针对大学教育的特点,提出了一种使用模糊聚类分析的评价方法及其实现算法。
关键词 有监督分类 无监督分类 模糊聚类分析
目前在我国教育各个环节中,对学习参与者,如:学生,的学习效能,主要采用考试的方式进行评测,即根据学习参与者在考试中获得的成绩进行学习效能检测。可表示为:学习参与者S学习课程P,在S学习课程P的过程中,会参与1,2,3……,n次测试,获得X1,...,Xn个测试成绩,S在学习课程P的过程中获得的全部成绩T记做(X1,...,Xn)T为一个n维的向量。记为:。
在中学阶段对学生S的学习效能评价是基于T(X1,...,Xn)T中各元素的算术平均值进行,即,X=∑Xi,而对学生S在课程P的第n+1次测试中,所应获得的成绩的预期是基于|Xn+1-|≤ε进行的,ε:为学习参与者第n+1次测试成绩偏差预测,基于教师的经验和测试的难度。这种评价方法,在中学阶段,能有效的评价和预测学生成绩的发展,然而将这种评价方法应用在大学教育中,就会不完全适用。
一、问题提出
首先,大学教育采用学分制,学科单科结业方式,基本不存在课程学习过程中反复测试的情况,课程结业考试往往就是课程学习的唯一测试,即:学生S在学习课程P的过程中获得的全部成绩T为:T(X1)T =X1 这种情况下,由于原始数据的不足,使用算术平均值方法,已经没有任何意义。如下表所示数据:
在结业考试中,学生1、学生2、学生3的考试总成绩是一样的,我们无法使用算术平均值方法,分析出学生1、2、3之间的学习差异。但从具体的知识点分析,学生1成绩记为(5,5,3,2,5,5,10,10,10,10)T;学生2成绩记为(0,0,5,5,6,4,10,10,10,15)T;学生3成绩记为(5,0,3,2,5,5,0,15,15,15)T,形成3个并不等价的单独向量,这三者在他们存在的线性空间中并不相等。自然这3个单独向量所代表的3个学生的成绩也不相等了。
所以,当我们将中学阶段的学生成绩评价方法,推广到大学阶段时,就会出现如下情况:
(一)对任意一门课程,在课程学习过程中,不存在多次测试成绩X1,...,Xn,从而也就无法用统计的方法求出。
(二)当只存在单次测试成绩X1时,X1中存在n个知识点,n个知识点构成一个(X1,...,Xn)T的n阶向量。
(三)对于任意一门课程,学生成绩评价的实质是对m个参加测试的学生,所获得的m个n阶向量的比较和分类。
二、问题解决
(一)我们知道数学是从量的方面,研究客观世界的一门科学。
一提起数学人们自然想到它是精确的,然而精确的数学有时不能描述现实世界中存在的大量模糊现象,如:好与坏,长与短,热与冷。在学生成绩评价过程中,学生成绩的好与坏,就是一对模糊量,很难说成绩超过90分的就是好学生,而89分的就是学的不好的学生,这时模糊数学就派上用场。模糊数学是指将传统的真值值域从{0,1}扩展到[0,1]区间的有理数,并利用真值函数t:{命题}→[0,1]来表达连续或者“模糊”逻辑。应用模糊数学判断学生成绩“好与坏”,就会得出好、有点好、不好不坏、有点坏、坏等多值判定,而这种判定,更符合教师对学生成绩的分析。
(二)对学生成绩的分析实质是一个模式识别的过程,模式识别又称模式分类,从处理问题的性质和解决问题的方法,模式识别可分为有监督分类和无监督分类。
有监督分类,又称有教师分类或有指导分类,在这种分类中,已知模式类别和某些样本的先验属性,首先用具有类别标记的样本对分类系统进行训练,使该分类系统能够对所有已知样本进行分类。如:m个学生参加考试,在考试之前我们已经知道第i个学生Si是好学生,在本次考试中学生Si的成绩是Xi,则根据有监督分类,在本次考试中所有成绩超过Xi的都是好学生,反之,则是学习成绩较差的学生。有监督分析方法缺点:
1.无法解决“90分是好学生,89分是学习较差学生”这一传统困境。
2.很难预先获得有标识的样本,在每次考试前很难确定好学生一定在本次考试中取得好成绩,即“好学生并不总能获得好成绩”。
3.“好学生”往往不是一个人,而是一群人,判定规则的制定是个难题。
无监督分类,又称聚类分析,是指在没有先验知识的情况下,对已有的全体无标识样本进行分类,聚类就是按照一定的要求和规律对事务进行区分和分类的过程。在这一过程中,没有任何先验知识,没有任何教师指导,仅仅依靠事物间的相似性作为类属划分准则。无监督分析,可以轻松解决“难于预先获得有标识样本”和“判定规则制订困难”等难题,然而仍无法解决“90分是好学生,89分是学习较差学生”这一传统问题。
(三)模糊聚类分析:
传统的聚类分析是一种硬划分,它将每个待辨识的对象严格的划分在某类中,具有“非此即彼”的性质,因此这种类别划分的界限是分明的,而实际上大多数对象并没有严格的属性,它们在性质和类属上存在中介性,具有“亦此亦彼”的性质
如上表,4号样本即可划入(92,94,90,89,88)这一集合中,也可以划入(89,88,86,87,84,85)这一集合中,这种划分轻易地解决了“90分是好学生,89分是学习较差学生”这一传统困境。使用模糊数学的模糊集理论的提出,为这种划分提供了有力的分析工具,并将之称为模糊聚类分析,由于模糊聚类分析更容易反映问题的实质,从而成为聚类分析的主流。
(四)结论:
使用模糊聚类分析方法可以有效解决大学教育中学科单科结业方式,缺少足够多的原始数据,而导致的学生学习效能评测中的算术平均值方法失效问题。
三、算法描述
设:一次测试中n名学生参加,测试m个知识点,则任意学生{Si|i∈[1,n]}的测试成绩T(X1,...,Xm)T,{Sj|j∈[1,m]}为学生Si在本次测试中第j个知识点上获得的成绩,从而在本次测试中,全体学生成绩可描述为n个m阶向量T(X1,...,Xm)T。
1.初始化:
令n个m阶向量自成一类,即建立n个子集,T1(0),T2(0),...,Xn(0),使用模糊聚类方法计算各子集之间的距离,即可得到一个n×n维的距离矩阵D(0),其右上角标号代表模糊聚类运行的迭代次数b ,初始运行时迭代次数b=0,记为(0)。
2.运算一:
求距离矩阵D(b)中的最小元素(对角线元素除外),如果该最小元素为Di,j,则是子集Tjb与Tib的距离,将Tjb与Tib合并为一新子集,记为:Ti,j(b+1),并构建新的分类T1(b+1),T2(b+1),T3(b+1)...。
3.运算二:
计算合并后新分类子集中Ti,j(b+1)与其它没有合并的T1(b+1),T2(b+1),X3(b+1)...间的距离,得到新分类的距离矩阵D(b+1)。
4.运算三:
令迭代次数b=b+1,跳转到运算一,重复计算和合并。预先指定一阈值Q,当迭代获得的距离矩阵D(b)中的最小元素超过阈值Q,迭代中止,所得到的结果即为聚类分类结果。
四、结论
通过模糊聚类分析方法,不仅可以有效地评价学生单科结业成绩,还可以通过对考试数据分析,事后识别考试中出现的某些违规现象,是算术平均值方法的一种有效补充。
相关热词搜索: 评价 分析 学习