
开发日常
文章平均质量分 87
深图智能
嵌入式视觉算法开发,技术交流和合作。QQ:3355138068
展开
-
深度学习语义分割数据集全景解析
语义分割是计算机视觉领域的核心任务之一,目标是通过算法将图像中的每个像素精准划分到对应的语义类别(如道路、车辆、行人等)。高质量标注数据集是推动该领域发展的关键因素。本文将系统梳理主流数据集的技术特征与适用场景。原创 2025-03-06 22:29:44 · 1149 阅读 · 0 评论 -
如何在OpenCV中实现中文绘制?
OpenCV内置的函数仅支持ASCII字符集渲染,其底层实现基于矢量字体库,未包含中文字形数据。该函数在处理多字节编码时会自动过滤非ASCII字符,导致中文显示为乱码或空白区域。FreeType作为开源字体引擎,提供跨平台字体渲染能力。其核心优势在于:通过集成FreeType到OpenCV项目,可实现以下技术路线:本文选用OpenCV内置的模块,该模块自OpenCV 3.0起提供对FreeType的官方封装。2.3 CMake项目配置三、核心实现流程3.1 实现流程图#mermaid-svg-7j原创 2025-03-05 10:43:55 · 1585 阅读 · 3 评论 -
大模型时代下的数据标注革命:工具、挑战与未来趋势
随着大模型技术的飞速发展,人工智能对高质量标注数据的依赖愈发显著。传统的人工标注方式在效率、成本和场景适应性上逐渐显现瓶颈,而大模型凭借其强大的泛化能力和多模态理解能力,正在推动数据标注从“劳动密集型”向“智能工业化”转型。本文将深入探讨大模型如何重塑数据标注行业,并聚焦三款代表性工具——,分析其技术特性、应用场景及行业价值,同时展望未来的发展方向与挑战。原创 2025-03-03 22:11:12 · 853 阅读 · 0 评论 -
嵌入式图像处理算法工程师的核心技能体系
嵌入式图像处理算法工程师需要构建"垂直深度+横向广度"的能力矩阵:既要深入理解从像素传感器到显示终端的完整信号链,又要具备将数学公式转化为可执行代码的工程能力,更要培养针对具体应用场景的技术洞察力。随着边缘智能时代的到来,这一岗位将持续向算法-硬件-系统三位一体的方向发展,成为推动智能终端进化的核心力量。原创 2025-02-25 22:12:42 · 806 阅读 · 1 评论 -
RTSP协议简要说明(小白级)
RTSP(Real-Time Streaming Protocol,实时流传输协议)诞生于1996年,由RealNetworks、Netscape和哥伦比亚大学联合开发,并于1998年正式标准化为。其设计初衷是提供一种类似“网络录像机遥控器”的功能,支持对媒体流的播放、暂停、快进等控制操作,从而解决早期互联网流媒体的实时控制需求。RTSP的语法和运行机制与HTTP类似,但核心区别在于其专注于流媒体的实时控制,而非静态资源传输。原创 2025-02-25 09:51:30 · 1276 阅读 · 8 评论 -
ffmpeg新手入门的两大天坑,都是泪呀!
小白使用ffmpeg的不平路,解决ffmpeg编译时无法解析的外部符号、视频路径的中文等基础问题。原创 2025-02-24 10:41:41 · 153 阅读 · 0 评论 -
FFmpeg视频处理入门级教程
FFmpeg 是开源的跨平台多媒体处理工具集,支持 1000+ 编解码器和容器格式。其核心功能包括:音视频转码(如 MP4→MOV)流媒体处理(RTMP/HLS 推拉流) 剪辑拼接(无损切割视频段落) 滤镜处理(加水印/调整速度等)原创 2025-02-24 10:23:47 · 1158 阅读 · 5 评论 -
VS2022配置FFMPEG库基础教程
FFmpeg诞生于2000年,由法国工程师Fabrice Bellard主导开发,其名称源自"Fast Forward MPEG",初期定位为多媒体编解码工具。2004年后由Michael Niedermayer接任维护,逐步发展成为包含音视频采集、格式转换、流媒体处理等完整功能的开源项目。经过25年迭代,当前最新7.x版本已支持H.266/VVC、AV1等新一代编码标准,在全球开发者社区贡献下形成包含7大核心库的生态系统。原创 2025-02-23 13:37:30 · 1261 阅读 · 2 评论 -
Eigen3开发入门指南:矩阵操作与核心功能详解
Eigen3是一款开源的C++模板库,专注于线性代数运算的高效实现。维度描述零依赖仅需标准C++库支持,无需第三方组件高性能通过表达式模板优化实现接近手写汇编的性能完备功能覆盖矩阵运算、几何变换、数值分析等200+种算法本指南将系统解构Eigen3的核心功能模块,通过理论说明与工程实践结合的方式,帮助开发者快速掌握工业级应用开发能力。免费下载地址,VS2022编译完成的Eigen3。本指南系统梳理了Eigen3的核心技术体系,从基础操作到高级应用层层递进。原创 2025-02-22 11:46:42 · 988 阅读 · 1 评论 -
Deepseek文生图的新思路
DeepSeek 本身并不是一个直接生成图像的工具,但它在代码生成方面表现出了强大的能力,尤其是生成 HTML 和 CSS 代码的能力。利用这一特点,我们可以借助 DeepSeek 来实现图像的“间接生成”。具体来说,DeepSeek 可以根据用户的描述生成 HTML 和 CSS 代码,这些代码可以用来在网页中绘制图像,从而实现图像的生成效果。这种方法虽然不能直接生成位图或矢量图,但通过代码生成图像,可以实现高度可控、灵活且精确的视觉效果。原创 2025-02-17 11:57:01 · 1797 阅读 · 9 评论 -
VS2022+OpenVINO的开发环境配置
假如没有英伟达的显卡,但是有英特尔的CPU,性能还不错,你又想部署一些深度学习模型,那么OpenVINO将是你一个不错的选择。原创 2025-02-14 12:16:04 · 1137 阅读 · 9 评论 -
QtCreator配置OpenCV的C++开发环境
windows平台下的C++开发中,当你引入一个第三方DLL(Dynamic Link Library)库时,通常需要处理三个文件:.h(头文件)、.lib(库文件)和.dll(动态链接库文件)。Qt Creator 的 .pro 文件是用于 Qt 项目的一个项目文件,它包含了构建项目所需的各种配置信息。简单来说,就是在QtCreator创建的项目中的.pro文件中进行OpenCV的配置。TARGET:指定项目的目标名称,即生成的可执行文件或库文件的名称。DEPENDPATH:指定依赖文件的搜索路径。原创 2025-02-12 10:13:41 · 1384 阅读 · 2 评论 -
DeepSeek-R1模型的介绍
在这一背景下,DeepSeek-R1模型作为一种前沿的人工智能模型,凭借其独特的架构和强大的功能,正在引起学术界和工业界的广泛关注。DeepSeek-R1模型作为一种前沿的人工智能模型,凭借其独特的架构和核心技术,在多个领域中展现了强大的应用潜力。未来,随着技术的不断进步和应用的深入,DeepSeek-R1模型有望在更多领域中发挥其价值,为人类社会带来更多的便利与创新。在智能问答系统中,DeepSeek-R1模型能够通过多模态交互模块,结合图像和文本信息,提供更加精准和全面的回答。原创 2025-02-08 12:45:49 · 1105 阅读 · 0 评论 -
深耕C/C++,解锁CV技术深度的钥匙
在众多编程语言中,C/C++以其独特的性能优势、深厚的底层访问能力、丰富的库与框架支持、良好的跨平台兼容性以及对于培养深厚编程基础的重要作用,成为学习计算机视觉算法的强烈推荐之选原创 2025-01-22 15:48:13 · 1297 阅读 · 10 评论 -
如何有效学习PyTorch:从基础到实践的全面指南
PyTorch是一个基于Torch库的开源机器学习库,主要用于深度学习应用。它提供了强大的GPU加速功能,使得深度学习模型的训练和推理速度大大加快。在安装PyTorch之前,需要确保系统已经安装了Python和pip。此外,为了充分利用PyTorch的GPU加速功能,还需要安装CUDA和cuDNN。安装完成后,可以通过简单的测试代码来验证PyTorch是否安装成功。原创 2025-01-16 23:54:37 · 1269 阅读 · 0 评论 -
windows下安装yolov11的GPU版本
安装yolov11的环境,说难不难,说简单嘛,对于才上手的小伙伴还是有点麻烦的。别无他法,亲身去安装一次,有问题就百度。原创 2025-01-13 20:53:15 · 1643 阅读 · 0 评论 -
如何编写计算机视觉类算法设计报告?
编写优秀的技术文档是确保技术信息准确传达、促进团队协作和项目成功的关键。在计算机视觉类(CV)算法开发岗位上工作时,一份优秀的算法设计报告,不仅仅是工作成果的一种展现方式,同时,也是可以大大降低与同事之间的沟通成本。那么,在实际工作中,该如何编写算法设计报告呢?通常一份算法设计报告,都应该包含引言、算法设计、算法实现、仿真实验和分析,这些章节。原创 2024-12-07 22:21:31 · 219 阅读 · 0 评论 -
VisualStudio2022配置OpenCV4.10.0
VisualStudio配置opencv是一个老生常谈的话题了,已经有很多博主写了详细、周到的文章。原创 2024-11-17 22:54:24 · 1256 阅读 · 0 评论