2、Python 数据处理与编程入门

Python 数据处理与编程入门

1. 数据故事讲述的起点

在数据的世界里,无论是记者、分析师还是初出茅庐的数据科学家,都希望通过编程来分析数据、总结发现并清晰地传达给他人,本质上是在讲述一个数据故事。

传统的故事讲述或新闻报道常以个体故事展现整体发现或趋势,数据成为次要特征。但也有人认为数据本身应是主要主题。

要开启数据故事之旅,首先要确定探索的主题。比如,探索不同人群或社会的沟通习惯,可从具体问题入手,像“网络上人们成功分享信息的特质有哪些”;或者对历史棒球统计数据感兴趣,思考其是否显示了比赛随时间的变化。

确定兴趣领域后,需寻找可用于深入探索主题的数据。例如,研究人类行为可从 Twitter API 获取数据;研究棒球历史可使用 Sean Lahman 的棒球数据库。这些大数据集通常需筛选和分块分析以解答具体问题,而小数据集在涉及本地或区域问题时也同样有趣且有意义。

以美国公立高中为例,有学校对毕业生收取费用,引发了对学区资金紧张原因的疑问。初始问题往往会引出更深入的问题,如学区的资金去向、支出模式随时间的变化等。明确主题和问题后,就能确定所需的数据,如该学区的支出和预算数据。

在继续之前,先来看看从问题识别到最终故事呈现的整个过程:

graph LR
    A[确定问题] --> B[寻找数据集]
    B --> C[获取并转换数据]
    C --> D[数据探索与清理]
    D --> E[呈现数据故事]

确定问题后,可对数据提出一系列问题,如哪些数据集

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值