- 博客(16)
- 收藏
- 关注
原创 在布署OmniGen时遇到flash-attn安装编译卡住问题的解决办法
然而在安装flash-attn时会出现进度条/光标卡住不动的问题,那就要检查ninja是否安装成功。那就直接去下载whl。
2025-12-12 11:55:14
182
原创 基于opencv-python的薄片颜色、形状、姿态倾斜角度、同名边框的识别控制机械臂抓取分类,来源于第九届集创赛海云捷讯杯
本文介绍了一个基于计算机视觉的自动化机械臂抓取分类系统,该系统通过摄像头实时识别工作台上不同颜色和形状的物块,计算其空间位置和姿态,并控制机械臂完成精确抓取和分类搬运。系统采用HSV色彩空间和分水岭算法进行目标识别,通过透视变换将图像坐标转换为实际坐标,结合机械臂逆运动学实现精确控制。用户可自定义目的地区域和放置角度,系统支持红、黄、蓝、黑四种颜色及正方形、圆形、六边形、三角形四种形状的识别。关键技术包括图像处理、坐标转换、运动学计算和串口通信,实现了从图像采集到机械臂控制的完整自动化流程。
2025-09-10 18:55:09
1142
原创 基于opencv-python的平面房屋结构图的语义分割(基本环境:Python 3.9 + OpenCV + Tesseract OCR)
本项目实现了房屋结构图的语义分割与可视化,主要贡献包括:提出基于OCR + 图像处理的房间语义分割方法。结合形态学操作与角点检测,解决了墙壁间隙导致的区域分割不完整问题。成功实现房间标签与几何区域的匹配与填色,提升了房屋结构图的可读性。
2025-09-10 15:53:49
894
原创 基于opencv-python的文档扫描OCR字符识别 (基础环境: opencv3.4 .1.15 python3.6 Tesseract-OCR)
本文介绍了一个基于计算机视觉的文档扫描与OCR识别系统。该系统通过图像预处理、边缘检测、轮廓提取和透视变换等步骤,将拍摄的纸质文档照片转换为标准化的电子版图像,并利用Tesseract OCR引擎识别提取文字内容。系统实现了文档自动校正、二值化处理和文字识别功能,适用于档案管理、票据识别等场景。实验结果表明,该系统能有效处理印刷体文档,但对复杂背景和手写体识别率较低。未来可结合深度学习方法提升识别准确率。项目代码展示了完整的图像处理流程,包括轮廓检测、透视变换和OCR识别等关键技术实现。
2025-09-09 17:08:53
1182
原创 基于opencv-python的信用卡账号数字识别 (基础环境: opencv3.4 .1.15 python3.6 )
本项目通过模板匹配+图像预处理+轮廓分析实现信用卡数字识别,优点是无需训练、实现简单、实时性好。可扩展为:手机或嵌入式设备上的刷卡识别。自动表单数据录入。结合深度学习进一步提高识别复杂字体或旋转数字的能力。
2025-09-09 11:05:27
926
原创 基于VS中MFC、opencv开发的简易Photoshop(C++实现)
VII、镜像打开、显示图片首先在OnInitDialog()函数中设置显示图片的窗口,定义一个指向 CWnd类型的指针变量pWnd1,用于存储获取到的控件的指针,利用GetDlgItem(IDC_STATIC)函数获取对应Picture Control控件的指针,用pWnd1->GetClientRect(&rect1)获得控件自身的坐标大小,用namedWindow("img", WINDOW_AUTOSIZE)设置窗口名;
2024-02-20 11:47:43
1479
2
原创 基于Arduino和Asrpro的智能语音识别分类垃圾桶
1、语音识别功能该功能主要是通过ASRpro语音识别模块来实现,结合舵机部分,通过天问block编程,以达到用户输入语音指令,通过正确识别后控制舵机打开相应垃圾桶盖子,以实现垃圾分类(可回收垃圾、其他垃圾、厨余垃圾、有害垃圾)。2、满溢警示功能该功能是利用Arduino Uno开发板结合红外对管和LED灯等器件实现,红外模块时刻发送红外信号,当检测到的反射的信号值高于红外阈值,判定垃圾桶已经盈。
2023-10-07 12:48:24
5803
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅