版权归原作者所有,如有侵权,请联系我们

[科普中国]-操作测验

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

概念

操作测验项目多属于对图片、实物、工具、模型的辨认和操作,无需使用文字作答,所以不受文化因素的限制。2

操作测验也称作非文字测验。测验题目多属于对图形、实物、工具、模型的辨认和操作,被试通过指认、手工操作向主试提供答案,无需使用文字作答。3

技术支持近年来,计算机技术不断进步,开发出许多模拟程序,这些模拟程序可以提高包含真实生活技能的虚拟现实测验(virtual reality testing)。使用这些设备时要让受测者戴上一个头盔式显示器(head-mounted display),通过显示器受测者能够置身于虚拟的真实情境中。这些设备不仅用于教授和测量知觉运动机能(perceptual-motor skills,如驾驶和飞行技能),而且可以在虚拟情境中进行判断、问题解决和治疗干预。1

举例1)作者曾经和一组生产管理者一起举办了一次人类关系研讨会。虽然研讨会上提交的书面测验材料中,所有的管理者都回答得很好,他们一致认为民主的监督方法由于专制的监督方法,但是回到生产线后,大多数管理者仍然继续他们的习惯做法,又实行起专制的监督办法。

2)学生们在课堂上或者纸笔测验中能说出正确的答案,但是面临真实情境时,他们却不知所措。

课堂中的许多学习都和非学术背景中的行为相关,但这种关系远非完美。对言语知识来说,要把课堂上学到的知识和技能迁移到工作及学校之外的情境中。自然科学、体育、戏剧、音乐、工业美术、演讲、外语、书法、农业以及其它领域的教师都意识到,要学好并灵活运用技能,学生们需要反复地练习,反复地体验。参加科学实验和工程,在游戏和运动中应用习得的动作技能,弹奏乐器和唱歌,戏剧表演,建造或者应用车间里有用的物体,练习用英语和其它语言在公众面前讲话和交谈等,所有这些都提供了学习和联系技能的机会。这些技能在课外将会有用,并为日后实践经验的学习打下基础。4

评价必要性纸笔测验是所有测验类型中最有效和最客观的,但是关于个人做事或制造某物的能力,它们通常只能提供间接的信息。

通过论述测验、选择题测验或其它的书面测验方式,在较短时间内可以相当彻底地了解受测者对学科知识的理解。然而,了解某一主题的大量信息,或者能够解释如何做某事,和在实际情境中运用信息或者技能是不一样的。4

和书面测验相比,操作性测验更加现实。正因为这点,操作性测验有时又被称为真实性评价或替代性评价,以强调它是书面测验之外的另一种选择。替代性评价不仅强调测量一个人知道什么,而且强调测量一个人会做什么。它所评估的行为通常是现实行为,如果在模拟的现实情境中测量,可能会得到一个以上的正确答案。1

优点1)受文化因素限制少,可用于幼儿和不识字的成人

2)情境性,真实性,

缺点1)不宜团体实施

2)需要花费大量时间,成本高,效率低

3)效度、信度不足

4)受主观因素影响大,客观性不足

补充说明编制行为清单要测量一个人一项特殊技能学得如何,虽然不一定要遵循动作技能目标分类法,但是编制一张详细的行为清单是很有用的。这些行为应该能揭示技能的熟练程度,一开始就必须确定操作的每一方面的权重,以及错误、迟钝、粗心等问题应从中扣除多少(如果有的话)。1

强调内容不唯一操作性测验主要应该强调操作技能的产物或最后结果,但操作的方式也很重要。例如,在打高尔夫球时,最重要的是击球入洞所需的次数。但是所有的高尔夫球教练都认为,形式或者风格也很重要。对于制造产品的操作测验,不仅要注意产品的数量和质量,也要注意产品的效用。

主观性等缺陷对于操作的产品和过程的评价方法一般都是主观的,主要包括观察、书面记录或者电子记录以及核查表或者评定量表。一段时期内学生的操作及产品的完整资料或收集物,也可以用来核查或者评价。尽可能没有偏见地仔细观察对准确评价学生的操作是至关重要的。

结构化操作测验经常比非结构化操作测验更客观。对于前者来说,每个受测者在相同的条件下接受测验;而对后者来说,学生是在课堂上、大厅里或者操场上接受暗中的观察和评价的。即便极其小心,但由于操作测验本身不是很客观,所以还是不如书面测验那么可靠。

除此之外,操作测验需要比书面测验花更多的时间、昂贵的器材以及其它耗时的安排。出于这些原因,操作测验情景性的优点还不足以弥补它的高成本和低效率。因此,书面测验更可取。4