教你如何成为数据科学家(一)

本文介绍了成为数据科学家所需掌握的基础知识,包括线性代数、关系代数、数据处理技术等核心概念,为初学者提供了清晰的学习路径。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先要推荐原始的出处:

http://sobigdata.com/2013/08/07/long-journey-to-data-scientists/

然后说明一下,该页也是再加工的网页,更加原始的出处:

http://nirvacana.com/thoughts/becoming-a-data-scientist/

作者叫Swami Chandrasekaran,是ibm的成员,Watson 项目,如果我没有记错的话,应该是那个赢得了智力问答的人工智能团队的。

他用信息图的方式将如何成为数据科学家的步骤画了出来,有较大的参考意义,当然这只是一家之言,不过可以让没有入门的同学快速有个参考也是功德无量的。

然后有人将信息图中详细步骤取出来,然后链接上wiki百科,这也是非常好的一个二次加工。

我在这里只是简单翻译引用一下,后续如果有比较好的具体参考书,再列在下面。

第一 基础部分:

  • Fundamentals
  1. Metrics & Linear Algebra Fundamentals      线性代数基础
  2. Hash FunctionsBinary TreeO(n)              hash算法,二叉树,大O估算
  3. Relational AlgebraDB Basics                     关系代数,数据块基础
  4. InnerOuterCrossTheta Join                   关系代数的几个原语
  5. CAP Theorem                                              分布式的CAP原理
  6. Tabular Data                                                列数据
  7. Entropy                                                        熵/信息量
  8. Data Frames & Series                                  数据帧&时间数列
  9. Sharding                                                      分片
  10. OLAP                                                           在线分析
  11. Multidimensional Data Model                       多维数据模型
  12. Extract/Transform/Load(ETL)                      数据提取、转换、加载
  13. Reporting vs BI vs Analytics                        报告vs商业智能vs分析
  14. JSON & XML                                                 JSON&XML 2种常见的数据格式
  15. NoSQL                                                         NoSQL
  16. Regex                                                           正则
  17. Vendor Landsacpe                                      厂商远景(不是很确定)
  18. Env Setup                                                    环境搭建

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值