数据科学——使数据有用的学科,是一个涵盖三个学科的总称:机器学习、统计、分析。
统计:
在你开始做决定之前,你知道你想要做多少决定。如果你想在不确定的情况下做一些重要的决定,那就是统计。
机器学习(自动化、人工智能):
如果你想自动化,在很多
不确定情况下做出许多决定,就是机器学习和人工智能。
分析:
在开始之前,你想做出多少决定?在寻找灵感的过程中,遇到许多的未知数。你想了解你的世界。这就是分析。
统计学家本质:
是哲学家,
认识论者。
他们非常非常小心
保护决策者不
得出错误的结论。
如果您热衷于这种关心和严谨,
我会推荐统计。
数据生态系统:
生态系统是一组与一个元素相互作用的元素。
数据生态系统由相互交互的各种元素组成,
以产生、管理、存储、组织、分析和共享数据。
云:
云是在网络上保存数据的地方,而不是保存在计算机硬盘上的地方。
数据存储在组织网络内的某处,
这些数据是通过互联网访问的。 因此
云只是我们用来描述虚拟位置的一个术语。
案例(零售店数据库):
您可以访问零售店的数据库,
这是一个充满客户姓名、地址、
以前的购买和客户评论。
作为数据分析师,您可以使用这些信息来预测哪些
客户将来会购买,
并确保商店在需要时有产品和库存。
案例(人力资源):
让我们考虑一下人力资源部门使用的数据生态系统。
这个生态系统将包括来自招聘网站的帖子等信息,
当前劳动力市场的统计数据,
就业率,以及有关潜在员工的社交媒体数据。
数据分析师可以使用这些信息来帮助他们的团队招募新员工
并提高员工敬业度和保留率。
案例(农业):
农业公司经常使用数据生态系统 ,
包括信息,包括天气运动中的地质模式。
数据分析师可以使用这些数据来帮助农民预测作物产量。
一些数据分析师甚至使用数据生态系统来保存真实的数据 环境生态系统。
在斯克里普斯海洋研究所,珊瑚礁遍布
世界受到数字化监控,因此他们可以看到生物如何随时间变化,
跟踪他们的增长,并衡量任何增长或
个别殖民地的衰退。
数据科学家:
数据科学被定义为创建新的建模方法和使用原始数据了解未知。数据科学家使用数据创建新问题。
数据分析师:
分析师发现
通过从数据源创建洞察来回答现有问题。
数据分析:
数据分析是收集、转换、
和组织数据以得出结论,
做出预测,并推动明智的决策。
数据驱动决策:
使用事实来指导业务战略,第一步是明确业务需求。通常这是一个需要解决的问题。
无论问题是什么,一旦定义,数据分析师就会发现数据,
分析它并使用它来发现趋势、模式和关系。
主题专家:
通过确保将数据内置到每个业务战略中,
数据分析师在其公司的成功中发挥着关键作用,但
需要注意的是,无论数据驱动的决策多么有价值,
单独的数据永远不会像数据结合人类经验那样强大,
观察,有时甚至是直觉。
为了充分利用数据驱动的决策,重要的是要包括
来自熟悉业务问题的人的见解。 这些人被称为主题专家,
他们有能力看
在数据分析的结果并确定任何不一致之处,
理解灰色区域,并最终验证所做的选择。