最近DeepSeek大火,用了一下也超出了想像。今天测试一下DeepSeek解决统计问题的能力和写代码的能力。
问题来源于舒华老师的《心理与教育研究中的多因素实验设计 》一书中,两因素完全随机实验设计的例子。之所以选择两因素方差分析的例子,一是方差分析本身是一种比较复杂的统计方法,很多经常使用统计方法的人对此方法了解都不深入;另一方面各种资料中,能够完成严谨、规范进行方差分析的资料很少。今天就测试一下DeepSeek的能力。
- 测试时间:2025年1月31日
- 开启“深度思考(R1)”功能
- 关闭“联网搜索”功能,一是联网搜索功能无法上传数据文件,二是近期该产品搜索服务繁忙,关闭了联网搜索功能。
- 注:前两天我在DeepSeek上问过此问题,所以可能对结果有影响
第一次对话:进行方差分析
首先将数据文件作为附件上传。
(数据可以从博文前面下载,电脑浏览器打开可见,或者自己找个数据集进行测试)
输入指令:主题熟悉度a因素分为2个水平(不熟悉、熟悉),生字密度b因素分为3个水平(5:1,10:1,15:1),该研究材料共6篇主题熟悉度不同、生字密度不同的文章。研究者随机选取了24名被试参加实验,被试随机分为6组,每组阅读其中一篇文章,阅读完毕后对其进行阅读测验。请使用R语言分析主题熟悉度、生字密度对阅读测验的影响。
输出结果:
DeepSeek首先将思考的过程给了出来,这是一个很好的学习资料。
DeepSeek给出了R语言代码,其中包括数据的建立、方差分析、事后检检(即多重比较)和方差分析前提条件的检验,其中需要关注的就是数据文件的建立和方差分析部分的代码,事后检验需要看方差分析的结果,正态性、方差齐性的要求本身不是很严格。
需要关注的部分代码如下:
# 创建数据框
data <- data.frame(
id = 1:24,
熟悉程度 = factor(rep(rep(c("不熟悉", "熟悉"), each = 12), times = 1)),
生字密度 = factor(rep(c("5:1", "10:1", "15:1"<