- 博客(7)
- 资源 (2)
- 收藏
- 关注
原创 关键信息提取技术的发展
OCR深度学习模型识别文字,大语言模型提前信息。OCR+LLM是较易实现且效果稳定有保障的方法。弱点:存在不稳定性,性能良好的模型不容易训练。使用视觉大模型提取关键信息将是最终阶段。目前代表:读光 Doc Master。弱点:需要对不同的版面进行分类处理。目前代表:qwen-vl-max。百度飞桨的关键信息提取套件。弱点:只能适应固定版面格式。
2024-04-21 01:11:13
430
1
原创 PaddleOCR检测模型训练深度解析
b 指标数据漂亮 hmean 0.9以上,但你很难纠正模型固有的思维(除非拿近似级别的数据量去纠正),效果难达到预期。b 在开源数据集上训练,带有开源数据集的基本特征。因为官方模型或三方模型不能有效的达到项目检测目标,所以自训练能实现需求的模型。b 公开数据泛化强,针对弱。b 在一定精度上起步,精度指标天生高,对自有数据实际效果不明显。a 从0起步训练,对自有数据的效果明显,但提高训练精度指标难。b:基于PP-OCR模型的微调(官方训练出的基座模型上微调)a:从骨干网络基础上训练模型(自己训练基座模型)
2023-10-03 05:54:19
368
原创 rattle安装问题GTK+:自下载、设置GTK环境包
rattle安装问题GTK+rattle是R环境中一个常用于简单数据挖掘的包。安装rattle一般不会出现问题,当你看到“去轻摇、晃动、翻滚你的数据”时,rattle已经安装成功。(图1)
2021-01-05 10:32:47
1722
1
原创 联想昭阳E46G笔记本识别4G内存问题
2010的老本E46G年代虽远,但办公用性能足够。而很多软件都不支持XP了,必须升级到win7。为了流畅运行win7,添了一根2G内存,和原来的2G组成双通道4G,提升性能。但都安好后,win7 64bit版的系统,仍然只认出2.9G,网上有的说是32位系统问题,有的说是msconfig引导问题。都试了遍,仍没解决。后来发现是bios问题,升级后可解决。现有BIOS版本为25cn32ww,要升级...
2018-12-11 13:29:43
3866
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人