自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 资源 (2)
  • 收藏
  • 关注

原创 甲骨文图片检测模型经验总结(pytorch + onnx)

在传统的交叉熵损失函数(Cross-Entropy Loss)中,分类错误的样本会被等同对待,这对于正负样本极其不平衡的情况显然不合适。计算过程如下图所示:x是模型经过sigmod的输出,y是样本的真实标签(计算中需要转换为float类型),n是样本数。模型需要处理如上示例图片中的每个字符(汉字、字母、标点等),web端4个线程并行发起处理请求,接口通过4个协程并发处理4张不同的图片,总计处理13张图片。其中,x表示模型的输出, y y y表示真实标签, C C C表示类别数, n n n表示样本数。

2025-07-30 09:42:31 967

原创 aarch64架构,昇腾npu + pytorch 训练大模型

参考链接:https://github.com/shibing624/MedicalGPT/wiki/%E6%95%B0%E6%8D%AE%E9%9B%86。

2025-07-01 17:29:48 837

原创 LLM训练阶段、数据格式、核心难点、注意事项

根据研究,LLM 所掌握的知识绝大部分都是在预训练过程中学会的,因此,为了使训练出的 LLM 能够覆盖尽可能广的知识面,预训练语料需要组织多种来源的数据,并以一定比例进行混合。预训练的核心作用是赋予模型海量的知识,而所谓对齐,其实就是让模型与人类价值观一致,从而输出人类希望其输出的内容。但是,为了让 LLM 获得泛化的指令遵循能力,在多种任务指令上表现良好,需要在训练数据集中覆盖多种类型的任务指令,同时也需要相对较大的训练数据量,表现良好的开源 LLM SFT 数据量一般在数 B token 左右。

2025-06-30 11:08:36 878

原创 opencv 文字检测若干经验

个人通过opencv进行文字检测的一些经验,不定期更新。

2025-05-28 16:21:55 411

原创 torch环境,指定gpu(nvidia、华为昇腾910)的几种方法比较(vscode、shell)

本文章介绍在vscode、linux bash中,指定某张或某几种gpu的方法。环境为:torch+nvidia、torch+910。

2024-06-06 16:43:24 4303 3

原创 docker大模型环境详细配置流程

本篇文章主要介绍在docker下,配置大模型环境并部署服务。

2024-06-05 09:00:38 1415

原创 linux 操作命令,不定期更新

系统信息类使用代理。

2024-04-24 16:43:57 239 3

原创 centos7下,源码离线升级gcc、glibc等系统库,以及yum修复方法

make 报错 :configure: error: C++ compiler missing or inoperational。升级原因:pyinstaller打包平台gblic版本太高,部署机器版本低,导致可执行程序无法正常启动。说明:这里使用了在线安装g++的方式,因为yum可以自动下载适合操作系统的版本,并且同时下载好相关依赖。:yum下载安装包,然后移动到离线环境服务器上,使用rpm离线安装方式。需要升级的库(如下图):gcc、make、bison、python。7)清除缓存,生成新的缓存。

2023-12-22 13:43:15 3051 1

原创 国产(以麒麟为例)环境,离线安装docker、docker-compose、milvus

各种linux操作系统,离线安装docker方式docker错误记录

2023-10-24 15:06:04 1259 1

原创 mysql迁移达梦,linux下不安装DM数据库,编辑dm-python

dmPython 是 DM 提供的依据 Python DB API version 2.0 中 API 使用规定而开发的数据库访问接口。使用场景为:应用服务器与数据库服务器分开规划,且应用服务器上不安装数据库,这种情况下安装dmPython。

2023-08-21 16:48:38 353

转载 paddleocr打包全问题解决办法

https://blog.youkuaiyun.com/ilrr288/article/details/126196051

2023-07-07 09:55:15 376

原创 linux下开启远程访问端口、防火墙相关操作

linux 开启端口远程访问

2023-02-23 17:12:53 353

原创 linux下源码安装python,多版本共存

linux下python安装配置环境,多版本共存

2023-01-05 16:57:56 812

原创 mysql 索引、去重插入、存储带引号json、高级sql语句的一些经验

mysql的一些tripspython 处理数据库中 带引号的 json数据联合唯一索引去重插入方法select 多字段排序

2022-10-14 15:06:06 1703

原创 valgrind:c++ 内存泄漏检测与解决方法

c++ 内存泄漏检测

2022-08-19 14:50:16 1264

原创 linux服务器配置免密登录方式(vscode 以及 MobaXterm 登录)

远程连接,免密

2022-07-22 17:44:31 1637

原创 如何快速清理Linux磁盘空间

linux目录清理

2022-07-06 09:55:33 256

原创 c++写入中文到mysql乱码解决方法

c++ 写入mysql乱码

2022-06-16 22:27:24 1310

原创 python(pyinstaller) 打包总结以及dll not found 、ModuleNotFoundError解决方法

pyinstaller

2022-06-09 17:09:27 16327

原创 docker、docker-compose笔记 以及部署torch模型

docker离线安装方式,各种linux系统,包括国产麒麟

2022-05-31 21:50:03 1621

原创 循环神经网络 - RNN篇

RNN的作用RNN结构图各种参数的意义前向传播RNN的问题

2021-08-18 16:57:00 791 1

原创 shapely包导入问题

OSError: [WinError 126] 找不到指定的模块最近在使用PaddleOCR时,win10下安装好paddle框架和相关依赖后,控制台下执行测试程序报如下错误:“OSError: [WinError 126] 找不到指定的模块。”错误原因:找不到shapely中依赖的dll文件使用环境:anconda中的python环境,笔者环境目录为:E:/anconda/envs/paddleOCR解决方法:复制shapely/DLLs目录下的dll文件,到E:/anconda..

2021-01-26 14:42:22 879 1

原创 python调用带参数的exe可执行程序

工程中经常需要跨语言调用各种接口、exe文件。今天介绍一下python调用C++的.exe的过程。python有很多现成的包调用exe可执行文件,我使用的os.system这个包。想了解其他方式的朋友,可以去搜一下相关的帖子,有很多。开始干货:1.c++的exe可执行程序通常有依赖的dll,首先把他们打包到一起,放在一个文件夹中。这样保证exe可正确执行2.调用过程,上代码para="%s %s %s%s%s%s"%("sly\\learn.exe",freq,cost,...

2020-12-31 17:20:54 3348 3

原创 vs2017控制台应用程序调用DLL

网上这类帖子乱而杂,废话不多说,直接上干货。1、创建一个c++控制台应用程序,这块不清楚的小伙伴,可以查一下其它的帖子。2、复制dll、lib、.h等你所需要的文件到项目根目录下3、右键点击项目名,选择属性 ---》VC++目录,配置“包含目录”,将.h文件所在的路径添加进去,如下图:4、与步骤3同一个页面,配置“库目录”,将lib文件所在路径添加进去。具体如下如:5、连接器 ---》输入中配置 “附加依赖项”,将用到的lib文件添加进去,注意,这块添加的是带lib后缀的文件名.

2020-12-22 09:27:03 3191 5

【计算机视觉】OpenCV图像处理函数详解:图像转换、形态学操作及轮廓检测在图像预处理中的应用

内容概要:本文档是《opencv函数手册》,详细介绍了OpenCV中常用的图像处理函数及其应用实例。主要内容包括颜色空间转换(cvtColor)、高斯模糊降噪(GaussianBlur)、自适应二值化(adaptiveThreshold)、形态学操作(getStructuringElement、erode、dilate、morphologyEx)、轮廓检测与绘制(findContours、drawContours)、最小矩形边界计算(boundingRect)、水平二次检测、位运算(bitwise_or)以及图像减法(subtract)。每个函数都配有详细的参数说明、使用示例和效果图展示,帮助用户理解各个函数的功能和应用场景。 适合人群:具备一定编程基础,尤其是对计算机视觉和图像处理感兴趣的开发者和技术人员。 使用场景及目标:①用于图像预处理,如颜色转换、降噪、二值化等;②进行图像形态学操作,如腐蚀、膨胀、开闭运算等;③实现图像轮廓检测与绘制,辅助文字识别或其他图像分析任务;④处理表格结构图像,如去除表格线、提取文字区域等。 阅读建议:由于手册涉及多个图像处理技术,建议读者结合实际项目需求选择相关函数进行深入学习,并通过动手实践加深理解。同时,注意不同函数之间的组合使用,以达到更好的图像处理效果。

2025-05-28

CRF++百度网盘链接.txt

crf++ 0.58官方源码,需要分析源代码的朋友,放心下载。由于网络问题zip形式的源码总是上传失败,所以放在了百度网盘

2021-01-05

crf++ 0.58 exe可执行程序

exe可执行程序,包含crf_learn.exe和crl_test.exe以及依赖的dll,可直接双击运行进行训练和测试

2021-01-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除