般若-波罗蜜-优快云博客

原创甲骨文图片检测模型经验总结(pytorch + onnx)

在传统的交叉熵损失函数（Cross-Entropy Loss）中，分类错误的样本会被等同对待，这对于正负样本极其不平衡的情况显然不合适。计算过程如下图所示：x是模型经过sigmod的输出，y是样本的真实标签（计算中需要转换为float类型），n是样本数。模型需要处理如上示例图片中的每个字符（汉字、字母、标点等），web端4个线程并行发起处理请求，接口通过4个协程并发处理4张不同的图片，总计处理13张图片。其中，x表示模型的输出， y y y表示真实标签， C C C表示类别数， n n n表示样本数。

2025-07-30 09:42:31 967

原创 aarch64架构，昇腾npu + pytorch 训练大模型

参考链接：https://github.com/shibing624/MedicalGPT/wiki/%E6%95%B0%E6%8D%AE%E9%9B%86。

2025-07-01 17:29:48 837

原创 LLM训练阶段、数据格式、核心难点、注意事项

根据研究，LLM 所掌握的知识绝大部分都是在预训练过程中学会的，因此，为了使训练出的 LLM 能够覆盖尽可能广的知识面，预训练语料需要组织多种来源的数据，并以一定比例进行混合。预训练的核心作用是赋予模型海量的知识，而所谓对齐，其实就是让模型与人类价值观一致，从而输出人类希望其输出的内容。但是，为了让 LLM 获得泛化的指令遵循能力，在多种任务指令上表现良好，需要在训练数据集中覆盖多种类型的任务指令，同时也需要相对较大的训练数据量，表现良好的开源 LLM SFT 数据量一般在数 B token 左右。

2025-06-30 11:08:36 878

原创 opencv 文字检测若干经验

个人通过opencv进行文字检测的一些经验，不定期更新。

2025-05-28 16:21:55 411

原创 torch环境，指定gpu（nvidia、华为昇腾910）的几种方法比较（vscode、shell）

本文章介绍在vscode、linux bash中，指定某张或某几种gpu的方法。环境为：torch+nvidia、torch+910。

2024-06-06 16:43:24 4303 3

原创 docker大模型环境详细配置流程

本篇文章主要介绍在docker下，配置大模型环境并部署服务。

2024-06-05 09:00:38 1415

原创 linux 操作命令，不定期更新

系统信息类使用代理。

2024-04-24 16:43:57 239 3

原创 centos7下，源码离线升级gcc、glibc等系统库，以及yum修复方法

make 报错：configure: error: C++ compiler missing or inoperational。升级原因：pyinstaller打包平台gblic版本太高，部署机器版本低，导致可执行程序无法正常启动。说明：这里使用了在线安装g++的方式，因为yum可以自动下载适合操作系统的版本，并且同时下载好相关依赖。：yum下载安装包，然后移动到离线环境服务器上，使用rpm离线安装方式。需要升级的库（如下图）：gcc、make、bison、python。7）清除缓存，生成新的缓存。

2023-12-22 13:43:15 3051 1

原创国产（以麒麟为例）环境，离线安装docker、docker-compose、milvus

各种linux操作系统，离线安装docker方式docker错误记录

2023-10-24 15:06:04 1259 1

原创 mysql迁移达梦，linux下不安装DM数据库，编辑dm-python

dmPython 是 DM 提供的依据 Python DB API version 2.0 中 API 使用规定而开发的数据库访问接口。使用场景为：应用服务器与数据库服务器分开规划，且应用服务器上不安装数据库，这种情况下安装dmPython。

2023-08-21 16:48:38 353

转载 paddleocr打包全问题解决办法

https://blog.youkuaiyun.com/ilrr288/article/details/126196051

2023-07-07 09:55:15 376

原创 linux下开启远程访问端口、防火墙相关操作

linux 开启端口远程访问

2023-02-23 17:12:53 353

原创 linux下源码安装python，多版本共存

linux下python安装配置环境，多版本共存

2023-01-05 16:57:56 812

原创 mysql 索引、去重插入、存储带引号json、高级sql语句的一些经验

mysql的一些tripspython 处理数据库中带引号的 json数据联合唯一索引去重插入方法select 多字段排序

2022-10-14 15:06:06 1703

原创 valgrind：c++ 内存泄漏检测与解决方法

c++ 内存泄漏检测

2022-08-19 14:50:16 1264

原创 linux服务器配置免密登录方式（vscode 以及 MobaXterm 登录）

远程连接，免密

2022-07-22 17:44:31 1637

原创如何快速清理Linux磁盘空间

linux目录清理

2022-07-06 09:55:33 256

原创 c++写入中文到mysql乱码解决方法

c++ 写入mysql乱码

2022-06-16 22:27:24 1310

原创 python（pyinstaller）打包总结以及dll not found 、ModuleNotFoundError解决方法

pyinstaller

2022-06-09 17:09:27 16327

原创 docker、docker-compose笔记以及部署torch模型

docker离线安装方式，各种linux系统，包括国产麒麟

2022-05-31 21:50:03 1621

原创循环神经网络 - RNN篇

RNN的作用RNN结构图各种参数的意义前向传播RNN的问题

2021-08-18 16:57:00 791 1

原创 shapely包导入问题

OSError: [WinError 126] 找不到指定的模块最近在使用PaddleOCR时，win10下安装好paddle框架和相关依赖后，控制台下执行测试程序报如下错误：“OSError: [WinError 126] 找不到指定的模块。”错误原因：找不到shapely中依赖的dll文件使用环境：anconda中的python环境，笔者环境目录为：E:/anconda/envs/paddleOCR解决方法：复制shapely/DLLs目录下的dll文件，到E:/anconda..

2021-01-26 14:42:22 879 1

原创 python调用带参数的exe可执行程序

工程中经常需要跨语言调用各种接口、exe文件。今天介绍一下python调用C++的.exe的过程。python有很多现成的包调用exe可执行文件，我使用的os.system这个包。想了解其他方式的朋友，可以去搜一下相关的帖子，有很多。开始干货：1.c++的exe可执行程序通常有依赖的dll，首先把他们打包到一起，放在一个文件夹中。这样保证exe可正确执行2.调用过程，上代码para="%s %s %s%s%s%s"%("sly\\learn.exe",freq,cost,...

2020-12-31 17:20:54 3348 3

原创 vs2017控制台应用程序调用DLL

网上这类帖子乱而杂，废话不多说，直接上干货。1、创建一个c++控制台应用程序，这块不清楚的小伙伴，可以查一下其它的帖子。2、复制dll、lib、.h等你所需要的文件到项目根目录下3、右键点击项目名，选择属性 ---》VC++目录，配置“包含目录”，将.h文件所在的路径添加进去，如下图：4、与步骤3同一个页面，配置“库目录”，将lib文件所在路径添加进去。具体如下如：5、连接器 ---》输入中配置 “附加依赖项”，将用到的lib文件添加进去，注意，这块添加的是带lib后缀的文件名.

2020-12-22 09:27:03 3191 5

【计算机视觉】OpenCV图像处理函数详解：图像转换、形态学操作及轮廓检测在图像预处理中的应用

内容概要：本文档是《opencv函数手册》，详细介绍了OpenCV中常用的图像处理函数及其应用实例。主要内容包括颜色空间转换（cvtColor）、高斯模糊降噪（GaussianBlur）、自适应二值化（adaptiveThreshold）、形态学操作（getStructuringElement、erode、dilate、morphologyEx）、轮廓检测与绘制（findContours、drawContours）、最小矩形边界计算（boundingRect）、水平二次检测、位运算（bitwise_or）以及图像减法（subtract）。每个函数都配有详细的参数说明、使用示例和效果图展示，帮助用户理解各个函数的功能和应用场景。适合人群：具备一定编程基础，尤其是对计算机视觉和图像处理感兴趣的开发者和技术人员。使用场景及目标：①用于图像预处理，如颜色转换、降噪、二值化等；②进行图像形态学操作，如腐蚀、膨胀、开闭运算等；③实现图像轮廓检测与绘制，辅助文字识别或其他图像分析任务；④处理表格结构图像，如去除表格线、提取文字区域等。阅读建议：由于手册涉及多个图像处理技术，建议读者结合实际项目需求选择相关函数进行深入学习，并通过动手实践加深理解。同时，注意不同函数之间的组合使用，以达到更好的图像处理效果。

2025-05-28

CRF++百度网盘链接.txt

crf++ 0.58官方源码，需要分析源代码的朋友，放心下载。由于网络问题zip形式的源码总是上传失败，所以放在了百度网盘

2021-01-05

crf++ 0.58 exe可执行程序

exe可执行程序，包含crf_learn.exe和crl_test.exe以及依赖的dll，可直接双击运行进行训练和测试

2021-01-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人