16、教育机器人资源的文本数据分析

教育机器人资源的文本数据分析

1. 引言

在教育领域,教师的实践教学内容知识(Enacted PCK,ePCK)是其在特定教学场景中运用的具体知识和技能,涵盖教学规划与反思等方面。由于其动态性,较难直接观察。而教师编写的教学资源可作为ePCK的一种体现。文本数据分析虽在教育领域并非主流方法,但已有一些研究将计算方法应用于教育文本分析。

2. 数据收集与方法
  • 数据来源
    • 第一部分是法国和瑞士职前教师在信息学教学研讨会上制作的59份教育资源,用于教育机器人活动。
    • 第二部分是61份来自经验更丰富教师的在线教育资源,主题相同。
  • 资源形式 :这些资源主要是教学场景描述,包括学习目标、师生角色、教学安排和所需材料等,部分还包含遇到的困难反馈。职前教师的资源形式多样,如2 - 15页的PDF书面场景、用于口试的PPT演示、视频(提取并转录音频);在线资源为4 - 20页的PDF文档。
  • 数据预处理
    1. 文本提取 :从资源中提取所有文本,并添加分类变量作为文档元数据,如机器人类型(顺序或事件驱动)、教师经验(新手或有经验)、年级水平等。
    2. 文本分割 :为进行Reinert聚类,将语料库分割成约40个单词的片段,尽量保持完整句子,共得到4784个文本片段。
    3. 词形还原 :使用spacyr(R中spaCy Python库的包装器)和fr_dep_news_trf(法语变压器管道模型)将每个单词的屈折形式替换为其唯一的规范化形式,避免因屈折形式被视为不同单词而丢失信息。
    4. 分词 :将连续文本转换为单个标记或单词,去除标点、符号和URL,使用自定义的449个停用词列表去除停用词,专注于名词和动词所表达的概念。
    5. 排除列表 :在分类过程中创建排除列表,去除聚类中无分析意义的单词,如学年缩写、机构或学校名称等,共116个单词。
    6. 文档 - 特征矩阵 :预处理后得到一个包含2599个单词和4784个片段的文档 - 特征矩阵,作为Reinert聚类的基础。
  • Reinert聚类
    • 这是一种无监督的分裂聚类方法,对文档 - 特征矩阵进行迭代二分,将片段分为两组,使组内片段尽可能相似,组间片段尽可能不同,通过Pearson卡方检验计算距离确定相似性。
    • 采用双重聚类,分别设置最小片段大小为10和15进行两次简单聚类,交叉结果以获得更稳健的类别。最终保留11个聚类,生成包含与每个聚类强相关单词列表的图表。

以下是数据预处理流程的mermaid流程图:

graph LR
    A[提取文本] --> B[文本分割]
    B --> C[词形还原]
    C --> D[分词]
    D --> E[去除停用词]
    E --> F[创建排除列表]
    F --> G[生成文档 - 特征矩阵]
3. 结果分析
  • Reinert聚类结果

    • 分类图展示了11个聚类,每个聚类显示30个最显著相关的标记。未分类片段有821个(约占17%),为保证聚类同质性,未强制分类。
    • 主要聚类及相关词汇如下表所示:
      | 聚类编号 | 聚类名称 | 相关词汇示例 | 片段数量 |
      | ---- | ---- | ---- | ---- |
      | 1 | 目标 | 领域、年级、语言、能力、目标、教学、学习 | 1029 |
      | 5 | 移动 | 擦除、前进、记忆、左、右、转弯、旋转、Beebot | 203 |
      | 6 | 路径 | 路径、路线、覆盖、绘制、时间 | 230 |
      | 7 | 分享 | 制度化、学生、小组、集体、分享 | 531 |
      | 8 | 编程 | 指令、正方形、开始、程序、编程、检查、错误、Bluebot | 537 |
      | 10 | 事件 | 传感器、检测、行为、对象、事件、探索、Thymio | 543 |
      | 11 | 舞蹈 | 动作、舞蹈、平板电脑、代码、应用程序、Ozobot | 515 |
  • 多重对应分析(MCA)结果

    • 构建一个包含8个分类变量(聚类、机器人编程范式、机器人名称、教师专业水平、四个年级水平)的列联表,以4784个文本片段为行。去除很少出现的机器人相关片段和小聚类(2、3、4和9)中的片段,得到4216行8列的列联表。
    • MCA结果显示,前两个轴分别保留了22%和10.3%的惯性。
4. 讨论
  • 主题分析
    • 通过聚类分析,可提取七个主要主题。根据Magnusson的PCK模型,五个聚类(5、6、8、10和11)与课程知识相关,一个(1)与计算机科学教学方向相关,一个(7)与教学策略知识相关。
  • 机器人与词汇关系
    • 四个聚类与特定机器人显著相关:
      • 聚类5(操作)与Beebot相关,涉及物体的移动和初步操作。
      • 聚类8(编程)与Bluebot相关,与编程概念和活动有关,代表计算机科学学习的更高级阶段。
      • 聚类10(事件)与Thymio相关,涉及机器、事件和行为。
      • 聚类11(舞蹈)与Ozobot相关,与舞蹈概念有关。
    • 尽管这些关联可能对有经验的人来说看似平常,但它们是从数据中归纳得出,而非基于预设概念框架。此外,分析还揭示了Beebot和Bluebot在词汇使用上的差异,表明教师为它们关联了不同的概念。
  • 变量关系分析
    • MCA中,四个聚类与相关机器人位置接近,证实了它们之间的关联。
    • 第一个轴显示事件驱动机器人(Thymio、Ozobot)和顺序机器人(Beebot、Bluebot)在词汇使用上存在对立。
    • 第二个轴较难解释,似乎体现了中学或幼儿教育资源与小学教育资源之间的对立。
    • 有趣的是,教师专业水平在MCA中不突出,其值接近平面中心,这与通常认为新手和有经验教师的PCK差异较大的观点不同。未与机器人明确关联的聚类(1、6和7)在MCA中未起到显著区分作用。
5. 结论

本研究将Reinert聚类和多重对应分析应用于教育机器人教学资源文本分析,通过分析聚类结果和相关词汇,能够确定教师编写教学资源时涉及的主要主题,为回答研究问题提供了依据。这种计算方法在计算机科学教育文本分析中具有价值,能处理大量文本,且聚类结果可帮助理解教师的思维主题,结合多重对应分析可解释特定变量与聚类之间的关系。

教育机器人资源的文本数据分析

6. 研究价值与应用
  • 理解教师知识 :教师的知识难以直接观察,而教学资源作为其规划活动的痕迹,反映了他们的实践教学内容知识(ePCK)。通过对教学资源内容进行文本分析,可以了解教师在教学规划中所运用的知识和概念,进而洞察他们的教学思维和专业认知。
  • 课程设计优化 :根据聚类分析得到的主题,可以为课程设计提供参考。例如,对于与课程知识相关的聚类(如编程、事件等),可以进一步丰富和深化课程内容;对于与教学策略知识相关的聚类(如分享),可以设计更多促进学生合作学习的活动。
  • 机器人教学适配 :明确不同机器人与特定词汇和概念的关联,有助于教师根据教学目标和学生特点选择合适的机器人。例如,对于初学者可以选择与操作相关的Beebot,对于有一定基础的学生可以选择与编程相关的Bluebot。

以下是研究价值与应用的列表总结:
- 理解教师知识,洞察教学思维和专业认知
- 优化课程设计,丰富课程内容和设计教学活动
- 适配机器人教学,根据教学目标和学生特点选择机器人

7. 研究局限与展望
  • 数据格式差异 :研究中教学资源的格式因来源不同而存在差异,这可能对分析结果产生一定影响。未来可以尝试统一数据格式,或者采用更灵活的分析方法来减少这种影响。
  • 教师专业水平因素 :在多重对应分析中,教师专业水平未成为显著的区分因素,这与预期不符。后续研究可以扩大样本规模,或者引入更多与教师专业水平相关的变量,进一步探究其在教学资源中的体现。
  • 拓展研究领域 :本研究仅聚焦于教育机器人领域的教学资源,未来可以将研究范围扩展到其他教育技术领域,如虚拟现实、人工智能教育等,以更全面地了解教师在不同教育技术环境下的教学知识和实践。

以下是研究局限与展望的表格呈现:
| 局限与展望 | 具体内容 |
| ---- | ---- |
| 数据格式差异 | 统一数据格式或采用更灵活分析方法 |
| 教师专业水平因素 | 扩大样本规模,引入更多相关变量 |
| 拓展研究领域 | 扩展到其他教育技术领域 |

8. 总结与启示
  • 研究总结 :本研究通过对教育机器人教学资源进行文本分析,运用Reinert聚类和多重对应分析方法,确定了教师编写资源时涉及的主要主题,揭示了机器人与词汇、不同变量之间的关系。
  • 实践启示
    • 教师在教学过程中应充分利用教学资源分析结果,优化教学内容和方法,提高教学效果。
    • 教育研究者可以进一步深入研究教师的ePCK,为教师专业发展提供更有针对性的支持。
    • 教育机构可以根据研究结果,合理配置教育资源,推动教育机器人在教学中的有效应用。

以下是研究流程的mermaid流程图:

graph LR
    A[数据收集] --> B[数据预处理]
    B --> C[Reinert聚类]
    C --> D[多重对应分析]
    D --> E[结果分析与讨论]
    E --> F[总结与应用]

综上所述,对教育机器人资源进行文本数据分析是一种有价值的研究方法,能够为教育领域的教学实践和研究提供有益的参考和启示。通过不断改进和拓展研究方法,有望进一步深入了解教师的教学知识和实践,推动教育技术的发展和应用。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值