这个能够直接读取网页中的table
返回一个列表
应为一个网页中不止有一个table,
然后通过遍历出每一个表,然后通过pd.DataFrame就可以将表转化成DataFrame的格式的数据;
然后可以直接存储成为csv文件了;
例子:
data = pd.read_html('./US_State_StateCode_Map.html') # print(data) # print(data[0]) data = pd.DataFrame(data[0]) print(data.head())
结果:
0 1
0 AL Alabama
1 AK Alaska
2 AS American Samoa
3 AZ Arizona
4 AR Arkansas