pandas to_html

本文介绍了一种将表格数据转换为图片的方法,以防止数据被爬虫抓取。通过使用pandas的to_html方法生成HTML表格,再利用selenium结合Chrome浏览器截图功能,实现数据的图片化展示。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如何将表格数据以图片的形式展现,主要目的则是为了防止爬虫。

为了解决这个问题,刚开始选择的是matplotlib.pyplot.table,但由于随着数据的字段长短不一,且matplotlib实际落地的过程中存在许许多多的坑,最终还是没有采用。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
 
 
df = pd.DataFrame(np.zeros((10,3)),columns=["c1","c2","c3"])
 
fig, axs = plt.subplots()
clust_data = df.values
collabel = df.columns
axs.axis('tight')
axs.axis('off')
the_table = axs.table(cellText=clust_data,colLabels=collabel,loc='center')
plt.show()

  

目前的解决方案:

1. 生成html table代码

2. chrome 屏幕大小调整后截屏

寻寻觅觅到头来发现pandas 有一个叫做to_html的方法,DataFrame数据流直接生成表单html。

截屏代码:

from selenium import webdriver

driver = webdriver.Chrome()
driver.set_window_size(1000, 680)
driver.get('file:///C:/Users/KC10/Desktop/data%20clearn/table.html')
driver.save_screenshot('table.png')
driver.quit()

  

  

转载于:https://www.cnblogs.com/zenan/p/10319990.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值