一、表格类数据获取
pandas模块中的read_csv()函数和read_execl()函数分别读取csv文件和Excel工作簿中的表格类数据,read_html()函数可以从网页上读取表格类数据。
1、读写csv文件
CSV文件的规范:
- 使用回车换行(两个字符)作为行分隔符,最后一行数据可以没有这两个字符。
- 标题行是否需要,要双方显示约定
- 每行记录的字段数要相同,使用逗号分隔。逗号是默认使用的值,双方可以约定别的。
- 任何字段的值都可以使用双引号括起来. 为简单期间,可以要求都使用双引号。
- 字段值中如果有换行符,双引号,逗号的,必须要使用双引号括起来。这是必须的。
- 如果值中有双引号,使用一对双引号来表示原来的一个双引号
csv文件可以使用记事本或excel软件打开,excel软件会自动按照csv文件规则加载csv文件。
例如某一行如下:
12,aa,"12,aa"
它表示了3列,第1列为“12”字符串,第2列为“aa”字符串,第3列为“12,aa”字符串。
另外需要说明的是写入writer.writerow()函数接收的是列表参数,无论是什么数据都会先迭代转化为列表再一次打印输出