图像魔法师-优快云博客

原创在布署OmniGen时遇到flash-attn安装编译卡住问题的解决办法

然而在安装flash-attn时会出现进度条/光标卡住不动的问题，那就要检查ninja是否安装成功。那就直接去下载whl。

2025-12-12 11:55:14 182

原创基于opencv-python的薄片颜色、形状、姿态倾斜角度、同名边框的识别控制机械臂抓取分类，来源于第九届集创赛海云捷讯杯

本文介绍了一个基于计算机视觉的自动化机械臂抓取分类系统，该系统通过摄像头实时识别工作台上不同颜色和形状的物块，计算其空间位置和姿态，并控制机械臂完成精确抓取和分类搬运。系统采用HSV色彩空间和分水岭算法进行目标识别，通过透视变换将图像坐标转换为实际坐标，结合机械臂逆运动学实现精确控制。用户可自定义目的地区域和放置角度，系统支持红、黄、蓝、黑四种颜色及正方形、圆形、六边形、三角形四种形状的识别。关键技术包括图像处理、坐标转换、运动学计算和串口通信，实现了从图像采集到机械臂控制的完整自动化流程。

2025-09-10 18:55:09 1142

原创基于opencv-python的平面房屋结构图的语义分割(基本环境：Python 3.9 + OpenCV + Tesseract OCR)

本项目实现了房屋结构图的语义分割与可视化，主要贡献包括：提出基于OCR + 图像处理的房间语义分割方法。结合形态学操作与角点检测，解决了墙壁间隙导致的区域分割不完整问题。成功实现房间标签与几何区域的匹配与填色，提升了房屋结构图的可读性。

2025-09-10 15:53:49 894

原创基于opencv-python的文档扫描OCR字符识别（基础环境： opencv3.4 .1.15 python3.6 Tesseract-OCR）

本文介绍了一个基于计算机视觉的文档扫描与OCR识别系统。该系统通过图像预处理、边缘检测、轮廓提取和透视变换等步骤，将拍摄的纸质文档照片转换为标准化的电子版图像，并利用Tesseract OCR引擎识别提取文字内容。系统实现了文档自动校正、二值化处理和文字识别功能，适用于档案管理、票据识别等场景。实验结果表明，该系统能有效处理印刷体文档，但对复杂背景和手写体识别率较低。未来可结合深度学习方法提升识别准确率。项目代码展示了完整的图像处理流程，包括轮廓检测、透视变换和OCR识别等关键技术实现。

2025-09-09 17:08:53 1182

原创基于opencv-python的信用卡账号数字识别（基础环境： opencv3.4 .1.15 python3.6 ）

本项目通过模板匹配+图像预处理+轮廓分析实现信用卡数字识别，优点是无需训练、实现简单、实时性好。可扩展为：手机或嵌入式设备上的刷卡识别。自动表单数据录入。结合深度学习进一步提高识别复杂字体或旋转数字的能力。

2025-09-09 11:05:27 926

原创基于FPGA-DE2的乒乓球和贪吃蛇游戏

【代码】基于FPGA-DE2的乒乓球和贪吃蛇游戏。

2025-09-01 19:31:15 128

原创基于Msp432实现的循迹避障小车

基于Msp432的循迹避障小车

2025-09-01 19:05:13 206

原创基于C语言实现的贪吃蛇小游戏（Linux系统）

【代码】基于C语言实现的贪吃蛇小游戏（Linux系统）

2025-08-19 00:51:10 130

原创 Linux多线程编程

【代码】Linux多线程编程。

2025-08-13 21:28:12 106

原创基于VS中MFC、opencv开发的简易Photoshop（C++实现）

VII、镜像打开、显示图片首先在OnInitDialog()函数中设置显示图片的窗口，定义一个指向 CWnd类型的指针变量pWnd1，用于存储获取到的控件的指针，利用GetDlgItem(IDC_STATIC)函数获取对应Picture Control控件的指针,用pWnd1->GetClientRect(&rect1)获得控件自身的坐标大小，用namedWindow("img", WINDOW_AUTOSIZE)设置窗口名；

2024-02-20 11:47:43 1479 2

原创 MATLAB拨号音识别

【代码】MATLAB拨号音识别。

2023-10-26 20:03:09 1230 4

原创用MATLAB绘制极坐标图

【代码】用MATLAB绘制极坐标图。

2023-10-23 17:10:21 888

原创 MATLAB绘制直角坐标图

【代码】MATLAB绘制直角坐标图。

2023-10-23 16:51:52 472

原创基于Arduino和Asrpro的智能语音识别分类垃圾桶

1、语音识别功能该功能主要是通过ASRpro语音识别模块来实现，结合舵机部分，通过天问block编程，以达到用户输入语音指令，通过正确识别后控制舵机打开相应垃圾桶盖子，以实现垃圾分类（可回收垃圾、其他垃圾、厨余垃圾、有害垃圾）。2、满溢警示功能该功能是利用Arduino Uno开发板结合红外对管和LED灯等器件实现，红外模块时刻发送红外信号，当检测到的反射的信号值高于红外阈值，判定垃圾桶已经盈。

2023-10-07 12:48:24 5803 1

原创 ESP-32+Arduino之 7行代码实现蓝牙音箱

用七行代码搞定蓝牙音箱

2023-10-07 12:15:54 11564 20

原创 Modelsim入门教程

最简洁的Modelsim入门教程，部分文本可能来源于网络，请原创联系我修改删除谢谢！

2023-10-01 12:26:16 2394 1

donghaodonghaodo的博客