数据科学中的关键阶段、概率统计与数据类型
1. 数据科学项目的关键阶段
1.1 实施阶段(The Operationalize Phase)
在实施阶段,需要交付一些最终报告、简报,以及相关的代码和技术文档。数据科学家通常要花费时间向业务中的相关人员展示如何处理信息,以满足他们的需求。由于很多关键决策者往往没有技术背景,理解这些信息会有困难,所以数据科学家需要花时间整理信息,使其更易于理解。
此外,有时会开展试点项目,该项目可以在生产环境中实时实施。这样能让我们在不将成果推广到整个公司的情况下,尝试一些发现的见解,从而在大规模部署前,更好地了解工作进展以及所采用的流程是否可行。
1.2 沟通结果阶段(The Communicate Results Phase)
在这个阶段,评估是否实现了项目初期设定的目标非常重要。如果在项目过程中未能达成目标,就需要做出必要的改变。在此阶段,要花时间确定所有关键发现,并在利益相关者之间沟通这些信息,然后根据项目初期制定的标准,判断项目结果是成功还是失败。
2. 概率在生活中的应用
2.1 概率的基本概念
概率作为一个数学术语,涉及事件发生的可能性,比如从一袋各种颜色的物品中取出绿色物品,或者从一副牌中抽出一张 A。在日常决策过程中,即使我们可能没有意识到,也会使用概率。
2.2 生活中的概率实例
- 天气规划 :气象学家无法准确预测天气状况,他们会利用仪器和工具来确定下雪、冰雹或下雨的可能性。例如,在相同天气条件下,100 天中有 60 天下