Theoretical Model and Quantitative Assessment of Scientific Thinking and Reasoning
科学思维的理论模型与量化评估
B. 科学思维测评工具的开发
在iSTAR评估框架的指导下,本研究进一步开发了测量学生科学思维的评估工具即iSTAR测试。当前的测试版本包含35道单选题,涉及三个技能维度:控制变量(COV),数据分析(DA),以及因果决策(CDM)。为了方便测试的开展,另一项研究也在进行当中,即把完整长度的iSTAR测试分成两个短版本的平行测试,每个短版本包含约20道题目。目的是在同一个被试群体中随机地使用两个短版本测试并能产生与完整版本等价的结果。表1总结了iSTAR的技能维度、子技能和问题的分布。
控制变量的子技能具有一个从易到难的进阶特征,包括对控制变量实验的简单识别和设计,到“给出实验数据并且要求学生确定某些变量是否具有因果影响”的更为复杂的情况[72]。问题的设计通过融入场景特征,例如真实生活情景和基于STEM的场景来控制任务的难度。总共有9个题目来评估COV维度及其子技能。
数据分析维度包含了数量最多的子技能,总共涉及15个问题。这些子技能彼此之间相对独立,且没有进行难度梯度设计。从表1中可以看出,DA技能侧重于各种概率概念和评估技能,特别是条件概率和贝叶斯概率,它们对于在在概念层面上理解概率性条件的目的和需求,以及在操作层面对因果决策中的定量权重的计算,都发挥着重要的作用[73]。
如前所述,因果决策维度是基于证据和假设得出有效结论的关键能力。该能力包含5个子技能,总共11题,其中,理解相关与协变之间的差异,掌握因果条件规则是最为重要的。大量的研究表明,学生经常将相关关系视为基于协变的因果关系[74, 75]。培养这方面的能力将提高学生对科学实验和公共媒体报道的数据的解读能力。同时,因果条件规则提供了逻辑计算能力,它能使学生恰当地链接推理中的证据、观点、条件,以识别逻辑正确且证据一致的因果关系。这些都是使学生能够在不同条件下协调主张与证据的基本技能。
表1 iSTAR的评估维度、子技能的场景以及问题分布