机器学习-数据科学库 01 数据分析介绍和环境安装

本文探讨了为何要学习数据分析,包括发现规律、作为机器学习基础及满足岗位需求。数据分析涉及数据清洗、处理、得出结论及可视化。推荐使用conda和Anaconda进行环境管理,以及Jupyter进行交互式计算。此外,文章提到了数据科学的关键步骤,从问题定义到成果展示,强调了每一步的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

为什么学习数据分析

  • 通过数据分析、机器学习等,找到感兴趣的规律和经验
  • 机器学习、python 数据科学的基础,相对 vanilla 方式更便捷和规范
  • 岗位需求,如大盘看板、产品改进等

什么是数据分析

用适当方法对大量数据进行分析,帮助人们做出判断,以便采取行动。

数据分析流程

提出问题
准备数据
分析数据
获得结论
成果可视化

上述流程图可以用做代码框架

  • 提出问题:问题可能不是很清楚需要尽早明确
  • 准备数据:数据清洗,比如理解某些字段、需要过滤某些字段、按某些格式
  • 数据分析:按照要求进行处理,可以借助诸如 numpy、pandas 等
  • 获得结论:结论可能比较简单
  • 成果可视化:通过图表形式更容易理解,可以借助如 matplotlib 等

开发环境介绍

conda & anaconda

https://www.anaconda.com/

Package, dependency and environment management for any languag
Anaconda offers the easiest way to perform Python/R data science and machine learning on a single machine

https://docs.conda.io/en/latest/

Package, dependency and environment management for any language
The conda package and environment manager is included in all versions of Anaconda®, Miniconda, and Anaconda Repository.

Anaconda 是一套集成环境,包括了科学计算包和 python,如果不想自己手工维护可以一站式安装;如果希望自己做手工包管理则可选

homebrew

brew install --cask anaconda

jupyter

https://jupyter.org/

interactive computing across all programming languages

docs

https://docs.jupyter.org/en/latest/running.html

homebrew

brew install jupyterlab
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值