学习与机构分析的程序框架:理论与实践
1. 分析前的准备:明确问题与约束评估
在开展分析之前,需要明确问题以及涉及的关键参与者。之后,要对可能影响分析设计的约束条件进行评估,其目的是识别环境约束,这些约束可能包括技术、财务、伦理、法律、行政和后勤等方面的问题。例如,对目标的监测可能需要不易获取、成本高昂或者收集过程受法律限制和伦理审查的数据。提前评估成功执行分析所需的资源,能够避免在实施和交付过程中出现短缺。
2. 数据阶段:收集与预处理
数据阶段的目标是收集相关数据并提供给分析组件。数据大致可分为两类:组织内部收集的数据(如学生生成的内容)和从第三方服务获取的外部数据(如 IP 地址地理位置数据库)。在很多情况下,分析应用会混合使用多种数据源和类型。以下是数据阶段的具体步骤和相关问题:
| 流程步骤 | 引导问题 |
| — | — |
| 识别数据来源和类型 | 数据来源是什么? |
| 获取数据 | 如何检索数据? |
| 处理数据 | 数据中哪些部分是无关或冗余的? |
数据通常由不同系统以各种格式存储,因此需要采用定制化方法。在获取数据后、分析之前,数据需要进行预处理,过滤掉不必要的部分。例如,进行课程评价的情感分析时,发布消息所用的网页浏览器类型信息可以安全移除。数据获取和处理步骤具有技术性,分析系统的最终用户无需与原始数据交互,只需访问分析结果。
3. 分析阶段:方法选择与执行
分析阶段主要关注确定数据分析的方法和技术,并进行分析。分析可以使用统计和机器学习技术。统计技术常用于定量研究,而机器学习是计算机科学中一个不断发展的领域,专注于发现数据模式的