pandas read_html

本文介绍了一种从网页中直接读取table元素的方法,并将其转化为Python中的DataFrame格式,便于进一步的数据处理与分析。通过使用pd.read_html函数,可以轻松地获取网页上的多个表格数据,并选择性地将其中一个或多个表格转换为DataFrame。最后,文章演示了如何将DataFrame存储为csv文件。

这个能够直接读取网页中的table

返回一个列表

应为一个网页中不止有一个table,

然后通过遍历出每一个表,然后通过pd.DataFrame就可以将表转化成DataFrame的格式的数据;

然后可以直接存储成为csv文件了;

例子:

data = pd.read_html('./US_State_StateCode_Map.html')
# print(data)
# print(data[0])
data = pd.DataFrame(data[0])
print(data.head())

结果:

    0               1
0  AL         Alabama
1  AK          Alaska
2  AS  American Samoa
3  AZ         Arizona
4  AR        Arkansas

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值