web自定义字体转图片

本文探讨了如何处理网页上自定义字体的数字显示问题,尤其是针对猫眼电影今日票房的案例。作者尝试通过将字体转换为图片再进行OCR识别,但遇到pytesseract无法识别标准图像的问题。接下来的解决方案可能是调整图片样式或预先训练模型以提高识别准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

之前看到爬虫攻防之前端策略简析中提到猫眼电影的今日票房栏为自定义字体,但是博客中提到使用fonttools进行加载然后人工先把几个数字的座标点进行标记,然后每次刷新时,拿到新的woff字体时,通过fonttool将字体转换成xml格式,根据座标点信息,判断其uncode值分别是多少。然后再将代码中的“方框”转换成真实数字。

感觉这样比较麻烦,于是想通过转为图片然后进行识别得到数字,代码如下

from reportlab.graphics import renderPM
from reportlab.graphics.shapes import Group, Drawing, scale

path = 'E:/pycharm_workplace/black_list/d2080.woff'
font = TTFont(path)  # it would work just as well with fontTools.t1Lib.T1Font
glyf = font['glyf']
for glyphName in glyf.keys():
    imageFile = "%s.png" % glyphName
    gs = font.getGlyphSet()
    pen = ReportLabPen(gs, Path(fillColor=colors.black, strokeWidth=1))
    g = gs[glyphNa
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值