数据格式:CSV与电子表格的优劣分析
1. CSV文件的优势
1.1 工具的普遍性
CSV文件及其分隔或固定宽度的同类文件,最大的优势在于读写它们的工具无处不在。几乎所有处理数据框或数组的库,无论使用何种编程语言,都知道如何处理CSV文件。大多数情况下,这些库能很好地解析一些特殊情况。例如,每个电子表格程序都支持导入和导出CSV文件,每个关系型数据库管理系统(RDBMS)以及大多数非关系型数据库也都如此。甚至大多数程序员的文本编辑器都具备方便编辑CSV文件的功能。Python有一个标准库模块 csv ,可以逐行读取许多不同方言的CSV(或其他分隔格式)文件。
以下是使用Pandas读取TSV文件的示例代码:
import pandas as pd
parts = pd.read_csv('data/parts.tsv', sep='\t', parse_dates=['Date'])
print(parts)
我们可以验证数据框中日期列的数据类型:
print(parts.dtypes)
输出结果如下:
| 列名 | 数据类型 |
| ---- | ---- |
| Part_No | object |
| Description | object |
| Date | datetime64[ns] |
| Price (USD) | float64
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



