A Response to Wyse Et, al. | Pedagogy Non Grata

对 2022 年 Wyse 和 Bradbury 论文的回应。

最近，一篇论文由多米尼克·怀斯和爱丽丝布拉德伯里，标题为“读战争还是读和解？对强有力的研究证据、课程政策和教师在教授语音和阅读方面的实践进行严格审查”，这在社交媒体上引起了巨大轰动。该论文的作者声称，存在强有力的新研究证据表明合成语音不如全语言方法。然而，尽管这篇论文很长，但作者实际上并没有提供令人信服的证据来支持他们的总体主张。

作者提出的一个论点是，英国标准化考试成绩（一个使用合成语音的国家）正在下降。然而，在引入基于语音的课程之前使用的标准化测试与之后使用的标准化测试不同，这使得比较没有用处。而且，之后收集的考试成绩的种类和等级也有波动。这里的主要论点似乎取决于在英国引入语音课程和今天之间考试成绩下降的事实。确实如此，但是这个差距只有5%，而且这个下降不是线性的，实际上分数是逐年波动的，平均分数最高的是2015年，也就是课程变更后的4年。如果我们通过比较单个测试分数与平均结果的 p 值测试来计算这些统计数据，我们会得到 0.49 的高得离谱的 p 值。将其放在上下文中，为了使数据具有相关性，它的 p 值应该低于 0.05。换句话说，作者使用年度标准化考试成绩的小随机波动来反驳政策决策的有效性。

这并不是说标准化考试成绩不是评估公共政策的重要工具，但考虑到国家考试成绩等范围的大小，5% 的变动不能被视为对政策效力的有效测试。特别是，当我们考虑有多少其他因素会影响这种微距镜头的结果时。如果我们将其与 PISA 分数进行比较，英国在 2009 年的阅读分数为 494，排名世界第 25，而 2018 年英国的阅读分数为 504，排名第 12。当然，公平地说，这可能也不是统计上显着的结果，因为英国上升了 13 个排名，但实际得分仅提高了 2%。

这篇论文的作者还指出了加拿大的高 PISA 排名，它使用了平衡读写方法，在世界上排名第 8，证明平衡读写方法比合成语音方法更有效。然而，正如安大略省 IDA 最近透露的那样，加拿大排名所依据的测试分数通常会排除大多数有严重阅读困难的学生，并为许多参与其中的苦苦读者提供抄写员。例如，在 2019 年，18.3% 的 6 年级学生在标准化识字测试中拥有抄写员，而 9.3% 的 3 年级学生拥有抄写员。这并不能完全进行公平的统计比较，其中排除和修改要低得多。此外，将英国解码水平与加拿大解码水平进行比较的研究发现，英国的表现要好得多。从 IDA 的 2021 年报告“提升 EQAO 分数的极限”中获取此信息图。

奇怪的是，这篇论文的作者还指出了几个 PISA 分数低于英国的国家，它们开设了全语言课程，证明全语言在某种程度上是积极的？但是我看不到，指出与英国不同的国家有全语言课程而不是合成语音课程的表现不如英国，这在某种程度上是支持全语言的观点。

该论文的作者还对该主题进行了自己的“荟萃分析”。然而，他们的纳入标准似乎有些偏颇。首先，他们只收录了两篇研究综述中的论文：Bowers 2020 Torgerson 2019。当然，这两篇论文是关于该主题最广为人知的两篇荟萃分析，因为它们的效应量最低。他们还排除了 2008 年之前撰写的任何论文，这些论文没有对方法学质量进行评估，也没有对发表偏倚进行自我分析。结果的荟萃分析仅包括 55 项研究，而 Hattie 的荟萃分析包括 1000 多项研究，ES 为 0.60。

然而，由于其他定性原因，他们排除了所有剩下的 55 项研究，声称“总之，没有研究符合以下所有标准：随机分配的实验设计；纵向设计；阅读典型的儿童样本；由标准班主任授课；阅读理解措施包括并在英格兰使用英语进行。”换句话说，在这个主题上进行了 1000 多项研究，本文的作者找不到一篇完全符合他们筛选过程的论文。此外，对于他们的“荟萃分析”，作者实际上并未尝试根据他们对研究的分析来计算效果大小或提供任何统计证据。他们只对有关该主题的论文提出定性批评。换句话说，他们没有任何实验数据来支持他们的观点，所以他们攻击了确实存在的实验研究的完整性。

最后，该论文的作者对英国小学二年级教师进行了调查。他们的调查包括 634 名受访者，其中 49 名受访者表示他们反对语音教学。作者似乎强调了这一点，证明教师对课程中包含的语音不满意。然而，这一数据仍然意味着 93% 的教师在语音教学方面持中立或积极态度。此外，66% 的受访者表示，合成语音是他们读写能力的主要教学重点，71% 的教师使用语音筛选测试来帮助改进教学。

这篇论文的作者提倡全语言教学方法，声称有“强有力的研究证据”反对合成语音。然而，他们提供的实验证据为零，他们的“荟萃分析”（如果你可以这么说的话）实际上并不包括任何统计分析（甚至任何研究……）。事实上，他们的整个论点似乎都取决于这样一个事实，即英国标准化考试成绩在过去十年中波动了 5%，而加拿大的 PISA 成绩提高了 3%。当然，这些数据都不足以通过零假设检验。这也不是任何负责任的学者衡量教学方法有效性的方式。

另一方面，荟萃分析后的荟萃分析表明，Phonics 优于 Whole Language。事实上，即使是 Bowers 2020 元分析（他们引用作为整体语言优于语音学的证据）也没有尝试做出这种断言。根据 John Hattie 对该主题的元分析，Whole Language 的 ES 为 0.06，Phonics 的 ES 为 0.60，这是十倍的统计差异。根据 Graham 等人 2017 年的一项荟萃分析，优于全语言的平衡读写能力仍然只有 0.38 的 ES。现实情况是，在将语音教学与全语言进行比较的问题上，这是一个已经确定的辩论，没有严肃的学者会建议全语言的证据显示出更大的功效。引用 Starett 的话，“与其参与关于是否应该教授语音学的辩论，有效的阅读和写作教师会询问何时、如何、多少以及在什么情况下应该教授语音学。”_cc781905-5cde-3194- bb3b-136bad5cf58d_

参考文献：

经合组织。（2010）。比萨排名。取自 <https://www.oecd.org/pisa/pisaproducts/46619703.pdf>.

行动地图。（2018 年）。 PISA 2018 全球排名。取自 <http://factsmaps.com/pisa-2018-worldwide-ranking-average-score-of-mathematics-science-reading/>.

-NRP。（2001 年）。教孩子阅读：对阅读教学科学文献的循证评估。美国政府。取自 <https://www.nichd.nih.gov/sites/default/files/publications/pubs/nrp/Documents/report.pdf>。

国际开发协会。（2021 年）。提升 EQAO 测试分数的 Viel。取自 <https://www.idaontario.com/wp-content/uploads/2021/09/LiftingTheCurtainOnEQAO69747.pdf>.

S、格雷厄姆等人。（2017）。平衡阅读和写作教学的扫盲计划的有效性：荟萃分析。阅读研究季刊。第 53 卷：问题 3.

J，海蒂。（2021 年）。可见学习 Metax。取自 <https://www.visiblelearningmetax.com/>.

Wyse, D. 和 Bradbury, A. (2022)。读战争还是读和解？对强有力的研究证据、课程政策和教师在教学语音和阅读方面的实践进行严格审查。教育评论，10，e3314。 https://doi.org/10.1002/rev3.3314

N，汉斯福德。（2021 年）。形态学：二次元分析。取自 <https://www.pedagogynongrata.com/morphology>.

对 2022 年 Wyse 和 Bradbury 论文的回应。

订阅表格