Theoretical Model and Quantitative Assessment of Scientific Thinking and Reasoning
科学思维的理论模型与量化评估
C.3 关于因果决策的问题
在 iSTAR 评估框架中,因果决策(CDM) 代表了在推理任务中基于证据得出有效因果结论的核心环节。例如,在一个假设验证任务中,学习者需要使用变量控制和数据分析技能来建立有效的协变条件,并识别合乎逻辑和计算的DCR结果,以及在机理上可成立的MCR机制,然后评估证据和假设的因果关系之间的一致性和有效性,最后将其纳入一系列决策过程,以确定关于所涉的假设和证据的有效性和可信度的最可能的结论。
LCTSR中假设演绎推理的技能维度与iSTAR测试中的CDM维度相对应。然而,CDM技能维度涉及一套定义明确且领域更为宽广的子技能,而LCTSR中的假设演绎推理主要侧重于衡量基于给定假设的证据和预测结果之间的一致性。LCTSR中,假设演绎问题的设计也因其内容的有效性而受到批评,因为其中包含了不合理的假设[37]。由于LCTSR中假设演绎题的效度问题,iSTAR测试中的11道CDM题目均为新设计的题目。图11呈现了两个示例。
图11中的第一个问题测量的是学生在CDM过程中区分相关性和因果关系的推理能力。这个问题的场景与现实世界中的许多例子类似,比如特定的饮食习惯是否与特定的健康状况有关。在这些情况下,一个通常的错误思维是将混淆相关和因果关系,简单地将不同变量之间的相关关系认同为某种因果关系。同样,在这个问题中,给定的观察结果显示了长颈鹿的身高和力量与它是否吃某种水果之间的相关性。然而,由于缺乏对变量的控制,该数据不能形成有效的协变设计,因为只有高大的长颈鹿才能达到吃掉水果的高度,这是问题以一种相对隐含的形式给出的潜在不确定因素。因此,选项 d 是正确答案,即不能得出基于协变的因果关系。选项 a、b 和 c 代表了将相关性视为因果关系而不了解有效协变所需条件的思维模式。选择e代表了基于机制的先验知识对推理的影响,即观察到的数据被忽略或没有形成有意义的认知,故而学生没有对其进行解释,其决策完全基于现有的知识和主观想法。这种类型的推理表明学生在DCR和MCR之间缺乏理解和综合,意味着因果决策依赖于其先验知识。
图11. iSTAR 中有关因果决策的示例问题。答案的百分比分布是基于下一节讨论的大学生群体的测试结果。正确答案标有星号 (*)。
图11中的第二个问题是基于Watson的选择任务[76],该任务测量了“在条件逻辑规则下判断证据和结论之间的一致性”的推理能力。问题中的假设性主张代表了“如果…那么…”关系的充分条件;换言之,如果纸牌的正面有偶数,则纸牌的背面必须是灰色的。对于这个题目,可以用两种逻辑思路的操作来展示题目中的假设可能是错误的。一种是正向的思维,通过翻开偶数纸牌检查其背面颜色来测试题中假设是否符合“如果…那么…”关系。第二种则是用逆向思维来测试相反的逻辑。既然纸牌数字为偶数是其背面为灰色的充分条件,如果一张纸牌的背面不是灰色(是白色),这个纸牌数字就不会是偶数(一定是奇数)。因此,为了测试题目中给出的假设,应该翻开纸牌数字为偶数的纸牌和背面为白色的纸牌(选项e)。其他纸牌的结果对评估假设的有效性没有提供任何有用的信息。从对学生的访谈以及他们的测试结果来看,学生们倾向于遵循正向的演绎推理(一种确认型的推理)来关注证据,从而导致他们选择偶数纸牌和灰色纸牌(选项b和f)。此外,许多学生只是简单地想使用所有纸牌,但却没有意识到纸牌在条件逻辑中的作用。这些结果说明大部分大学阶段的学生在因果决策中缺乏对条件逻辑的充分理解。
表 2. 映射到建模和评估框架中针对目标技能的所设计的评估问题。这六个示例问题旨在探究 COV、DA 和 CDM 的三个主要维度下的各种技能,重点在于不同的因果推理成分(DCR 和/或 MCR)以及 IDEA-Loop 过程。图3与图4中定义的特定因果关系与相关推理流程复杂度之间的映射也被包含其中。
在现有的文献中,关于理论与证据之间的推理已经得到了充分的研究[38]。CDM维度的问题是针对支持“理论与证据间的协调操作”的基本思维技能而专门设计的。这些基本思维技能例如评估协变关系的有效性的技能,或是在以DCR为基础的证据和以MCR为基础的理论之间达成一致所需的技能。如表 2 所示,这两个 CDM 问题都包括完整的 IDEA-Loop 循环,用于在 DCR 和 MCR 之间进行协调,以形成一种综合性的DMCR 类型的因果理解。这两个问题根据学生的相关子技能,例如识别隐藏的变量和关系,或是处理条件规则,做了针对性的设计,以从任务所涉及的因果关系的不同结构和复杂性方面评估学生的思维水平。