文本处理
文章平均质量分 62
hisrDT
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
暴力强行复制网页内容,终极手法
1.按F12,缩放网页到最小全屏显示,复制正文部分的html源码。2.python处理文本。3.处理结果不理想的,要自己微调,手动加上。有时间再优化原创 2024-01-02 04:00:13 · 3580 阅读 · 0 评论 -
数据标注--文本行检测标注项目,结果文件 json 数据重组
先记录1条吧,稍后再修改文章文本行检测标注-6931.保存日志2.源码# -*- coding:utf-8 -*-import jsonimport sysimport osimport shutilfrom pip._vendor.distlib.compat import raw_inputdef mod_jsonVal(file,logFlag,logFile): with open(file,encoding="utf-8") as f: .原创 2021-12-06 18:05:43 · 676 阅读 · 0 评论
分享