CV
文章平均质量分 92
Macropodus
为了无法价值的Coding
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
GPT Image 1.5
摘要:GPT Image 1.5是OpenAI推出的新一代图像生成与编辑模型,在速度、编辑能力和成本方面均有优化。其优势包括编辑精准度高、生成速度快(提升4倍)、成本降低20%,支持多种创意操作,但存在非英语文本处理差、特定场景表现不足等缺点。与Google Gemini Nano Banana Pro相比,在文本处理、画质和逻辑推理方面有明显差距。用户测试显示其能生成角色形象和传统服饰图像,但体验一般。该模型适用于普通用户和专业开发者,已在多个行业应用。原创 2025-12-18 08:27:59 · 831 阅读 · 0 评论 -
计算机视觉CV-目标检测OB
目标检测,也称目标提取,是计算机视觉四大基础任务之一(分类、定位、检测、分割),是一种基于目标几何和统计特征的图像分割。目的是对图像上的预定目标进行分割和识别,通俗来说就是检测图像中有什么,以及在哪里,通常用矩形框圈定目标。传统机器学习时代,目标检测经典算法大都基于滑动窗口、人工特征提取等技术手段,代表算法有VJ检测器、HOG行人检测器和DPM检测器等;深度学习时代大放异彩的卷积神经网络也被引入目标检测任务并大放异彩,实现了真正意义上的工业级使用。...原创 2022-07-27 10:32:52 · 1782 阅读 · 0 评论 -
计算机视觉CV-骨干网络Backbone
2012-2022是深度学习集中爆发的10年,在这10年间,涌现出许许多多的新技术新理论,尤其是在骨干网络上。ConvNet-1989接近现代卷积神经网络CNN了,它具有两个特征(专利),一个是跨步卷积(strided-convolution),另一个是独立池化层(Pool)。基于该网络架构的系统被用于用于手写邮政编码识别。LenNet-5是一个简单的浅层卷积神经网络,激活函数为sigmoid,其输入INPUT为3232像素的单通道图像;第一个block的卷积层C1为6个53最大池化(步长2),...原创 2022-07-27 10:29:07 · 3758 阅读 · 0 评论 -
mmdetection使用记录汇总
最近需要用到多模态尤其是CV方面的知识, 所以学习和使用了一下mmdetection和其他CV项目, 总结记录下遇到的各种问题, 以便往后查阅。mmdetection版本为当前最新的2.24.1, 总的安装见mmdetection/requirements.txt, 实际上包括requirements/build.txt/optional.txt/runtime.txt/tests.txt四个文件的包,建议手动安装, 尤其是涉及的torch、mmcv-full、opencv-python、detectro原创 2022-07-05 14:32:51 · 1116 阅读 · 0 评论
分享