解锁 SAP 数据价值:数据科学与机器学习应用指南
1. 数据获取与角色职责
在处理 SAP 数据时,我们常常会遇到不同的获取数据的场景。有时候,我们清楚自己想要的数据,也了解 SAP 应用数据模型能提供什么,但却缺乏 ABAP 技能来自行构建数据获取方案,这时可能就需要采用直接数据库访问(Direct DB access)的方式。还有一种情况,别人知道我们想要的数据,但只能通过到屏幕上获取并以 Excel 形式提供给我们。
数据科学涉及一系列技能,包括统计学、编程、机器学习、分析、架构和工程等。关于数据科学的角色划分,网络上有很多讨论,不同的阵营有不同的界定方式。比如,有的将角色分为数据分析师、数据工程师、数据架构师、数据科学家和数据通才等。但实际上,除非是在拥有数据科学团队的大型公司,否则团队里很难有一个人具备所有这些技能。所以,我们往往需要身兼多职。
如果公司没有 SQL 数据库却想提取和存储 SAP 数据,或者想要自动化数据提取工作流,这些我们都可以进行探索和实践。我们的目标是培养“公民数据科学家”,让他们了解如何在组织中运用数据科学。在这个过程中,可能会缺乏资源支持,甚至在寻求帮助时会遇到阻力,很多时候需要先证明自己的理论可行,才能获得他人的协助。
对于 SAP 专业人士来说,如果想讲述关于自己数据的故事,可以考虑使用 Python 和 R 等编程语言,以及 Tableau 和 Power BI 等可视化工具。而数据科学家若想挖掘 SAP 中的数据,可以通过 BAPIs 以基于函数的方式检索数据,使用 OData 建立可重复和可预测的 HTTP 服务,或者在不得已的情况下将屏幕数据导出到 Excel 或直接查询 SAP 数据库。
超级会员免费看
订阅专栏 解锁全文
178

被折叠的 条评论
为什么被折叠?



