Python数据处理与可视化实战
1. 使用Pandas处理数据
在某些操作中,简单的计算是不够的。Python在处理复杂数学运算时性能不佳,而使用专门的包(如Pandas)可以大大提高性能。Pandas是一个易于使用的Python数据分析库,在科学界广泛使用。
1.1 准备工作
我们将使用上一个操作得到的CSV文件,该文件接收并转换以下格式的日志:
[<Timestamp>] - SALE - PRODUCT: <product id> - PRICE: <price>
每行代表一个销售日志。
安装Pandas模块,将其添加到 requirements.txt 文件中:
$ echo "pandas==1.0.1" >> requirements.txt
$ pip install -r requirements.txt
在GitHub仓库中有一些待处理的日志文件,结构如下:
sale_logs/
OH
logs.txt
ON
logs.txt
代码可在 GitHub仓库
超级会员免费看
订阅专栏 解锁全文
3306

被折叠的 条评论
为什么被折叠?



