- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 飞浆paddlehub实现一个简单文字识别功能
chinese_ocr_db_crnn_mobile 模型是一个超轻量级的中文OCR(光学字符识别)模型,主要用于识别图片中的汉字,总大小仅约8.1M,非常适合移动端和资源受限环境部署,采用DB(Differentiable Binarization)算法进行文本检测,CRNN(卷积递归神经网络)进行文本识别,兼顾检测精度和识别效率,支持中英文数字组合识别、竖排文本识别、长文本识别,提供从图像预处理到结果可视化的完整流程。简单来说就是一个框架。2.4.0下的numpy会有个版本问题,需要卸载后重新安装。
2025-09-07 10:31:13
800
原创 图像查找解决方案:多方法融合实现高精度定位
本文详细介绍了一个完善图像查找(通过小图在大图中查找具体的位置)解决方案的实现过程,该方案通过结合多种先进的图像处理技术和匹配算法,实现了在大图中精确查找小图位置的功能。不同于传统的单一模板匹配方法,本方案采用了特征匹配、模板匹配和多尺度金字塔匹配的融合策略,能够有效应对旋转、缩放、光照变化等复杂场景,提供高精度的定位结果。
2025-08-31 16:51:14
245
原创 Java 文本文件读写全面指南:从经典 IO 到现代 NIO 的演进与实践
使用平台默认的字符编码(如 Windows 上是 GBK),无法指定编码,容易导致乱码。:它会一次性将整个文件内容加载到内存中,如果文件非常大(如几个GB),会导致内存溢出(OOM)。可以按正则表达式或自定义分隔符解析文本,非常适合读取结构化的数据(如 CSV)。除非是处理非常小的、简单的、且编码与系统默认一致的文件,否则不推荐使用。读取格式已知的、结构化的文本数据(如由空格、逗号分隔的数据文件)。是处理文本文件的神器,非常适合逻辑按行处理的场景。文本内容的绝大多数情况(如日志分析、数据文件读取)。
2025-08-20 14:39:06
1092
原创 Milvus向量数据库在Ubuntu安装部署
在当今数据爆炸的时代,我们面对的数据类型越来越多样化。文本、图片、音频、视频等占据了数据总量的绝大部分。如何高效地存储、检索和理解这些海量非结构化数据,成为了人工智能和大数据领域的关键挑战。传统的(如 MySQL, PostgreSQL)擅长处理结构化的表格数据,通过精确匹配关键词或数值进行查询。然而,对于非结构化数据,它们显得力不从心。我们更关心的是数据的,例如:“找到与这张图片风格相似的图片。“搜索与这段文字意思相近的文档。“推荐与用户刚听过的歌曲风格类似的音乐。解决这类问题的核心技术是和。
2025-08-15 16:08:16
844
原创 Phabricator搭建
最近一直想搭建一个代码审查的系统,最后选了Phabricator。Phabricator这个软件就不多介绍了,直接切入主题。 1.系统选择CentOS6.5,当然也可以在windows上安装(本人未尝试过),个人觉得毕竟多数开源软件都是基于Linux来的,所以建议还是在Linux上部署,可以避免很多不必要的麻烦。 查看系统版本命令lsb_release -a 官方解释: Phabricato
2016-03-31 15:14:06
7838
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅