教你如何成为数据科学家(十)完

本文介绍了一个合格的数据科学家必备的工具箱,包括从简单的Excel到复杂的Hadoop生态系统等工具。涵盖编程语言如Python、R,数据处理软件如Weka、RapidMiner,以及大数据处理框架如Spark和Storm等内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一个合格的数据科学家必须有称手的工具,不能每次都赤手空拳的去处理一堆数据。一个好的数据科学家应该有自己的工具箱,遇到了不同的问题时候,知道应该用工具箱内的那个工具才合适。

最后一个部分,介绍了原作者推荐的工具箱,我们来一起看一下是否有什么是我们比较熟悉的,有什么是很陌生的。


  • Toolbox
  1. MS Excel w/ Analysis ToolPak                                 微软的excel(简单实用,堪称数据处理中的好折凳^_^不过要用好也比较难)
  2. JavaPython                                                           java python 2种常见语言
  3. RR-StudioRattle                                                  R,及其R相关的包
  4. WekaKnimeRapidMiner                                       三种数据处理工具
  5. Hadoop Dist of Choice                                             选择hadoop的哪个发行版
  6. SparkStorm                                                            hadoop相关的实时处理框架
  7. FlumeScribeChukwa                                            日志处理系统    
  8. NutchTalendScraperwiki                                       搜索引擎,中间件,多种数据源处理
  9. WebscraperFlumeSqoop (Flume Dup?)               网页抓取,日志处理
  10. tmRWekaNLTK                                                     R相关的自然语言处理,python相关的自然语言处理
  11. RHIPE                                                                       R与hadoop相关的开发环境
  12. D3.jsggplot2Shiny                                                可视化相关
  13. IBM Languageware                                                  IBM的自然语言处理
  14. CassandraMongoDB                                              2种NoSql数据库

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值