学计算机视觉的阿斌-优快云博客

原创 Opencv计算机视觉编程攻略-第九节检测兴趣点

一般而言，如果一个物体在一幅图像中被检测到关键点，那么同一个物体在其他图像中也会检测到同一个关键点。图像匹配是关键点的常用功能之一，它的作用包括关联同一场景的两幅图像、检测图像中事物的发生地点等等。

2025-04-04 12:14:06 550

在计算机视觉领域，兴趣点（也称关键点或特征点）应用包括目标识别、图像配准、视觉跟踪、三维重建等。这个概念的原理是，从图像中选取某些特征点并对图像进行局部分析（即提取局部特征），而非观察整幅图像（即提取全局特征）。只要图像中有足够多可检测的兴趣点，并且这些兴趣点各不相同且特征稳定、能被精确地定位，上述方法就十分有效。因为要用于图像内容的分析，所以不管图像拍摄时采用了什么视角、尺度和方位，理想情况下同一个场景或目标位置都要检测到特征点。视觉不变性是图像分析中一个非常重要的属性，目前有大量关于它的研究。

2025-04-03 22:30:41 890

原创 Opencv计算机视觉编程攻略-第七节提取直线、轮廓和区域

图像的边缘区域勾画出了图像含有重要的视觉信息。正因如此，边缘可应用于目标识别等领域。

2025-04-02 21:08:03 819

原创 Opencv计算机视觉编程攻略-第六节图像滤波

滤波是信号和图像处理中的一种基本操作。它的目的是选择性地提取图像中某些方面的内容，这些内容在特定应用环境下传达了重要信息。滤波可去除图像中的噪声，提取有用的视觉特征，对图像重新采样，等等。

2025-04-01 20:51:42 844

原创 Opencv计算机视觉编程攻略-第五节用形态学运算变换图像

数学形态学是一门20 世纪60 年代发展起来的理论，用于分析和处理离散图像。它定义了一系列运算，用预先定义的形状元素探测图像，从而实现图像的转换。这个形状元素与像素邻域的相交方式决定了运算的结果。本章将介绍几种最重要的形态学运算，并探讨用基于形态学运算的算法进行图像分割和特征检测的问题。形态学滤波器的应用过程就包含了用这个结构元素探测图像中每个像素的操作过程。把某个像素设为结构元素的原点后，结构元素和图像重叠部分的像素集（下图的九个阴影像素）就是特定形态学运算的应用对象。

2025-03-31 23:18:13 1053

原创 Opencv计算机视觉编程攻略-第四节图直方图统计像素

对于彩色图像（如RGB），可以通过将每个颜色通道分别映射到特定索引来构建其直方图，并利用核密度估计的方法来累积权重，从而得到更精确的颜色分布信息。区域内图像的统计直方图某种程度表示了整体颜色分布特征，因而可以使用区域的统计直方图作为特征进行相似内容查找，以区域内白云的颜色为例进行统计。在灰度图内进行统计分析，难以分割出较好的效果，使用rgb往往可以获得不错的效果，彩色图使用同一个函数。上文了解了统计直方图和查找表，基于直方图统计结果构建均衡化的查找表，从而全局修改图像整体颜色。

2025-03-27 21:45:25 1008

原创 Opencv计算机视觉编程攻略-第三节图像颜色处理

GrabCut分割图像通过用户标记前景框，算法为2004年提出，主要是将图像依据颜色相似进行图块分割，然后再使用边缘特征进一步分割，将问题转化为连通图的合并问题，最后以四种类型作为结果输出。floodFill函数，支持用户选择种子点，opencv依据差异值进行快速处理，比如office中的设置透明色，就类似于该算法的实现。将图像转换到连续空间Lab进行处理往往可以获得更为连续的结果，而HSV颜色表示更加符合人类视觉感知。两种方法对比图下，GrabCut能够有效保留前景要素边缘特征。

2025-03-25 22:22:58 404

原创 Opencv计算机视觉编程攻略-第二节图像像素操作

以椒盐噪声为例展示像素值访问的几种方法。该节相关代码已上传到个人文档，按需下载。

2025-03-24 22:22:02 405

原创将无人机拍摄范围内要素投影到无人机图片中

相机外参的推导外参矩阵由旋转矩阵‌R‌和平移向量‌t‌组成，描述世界坐标系到相机坐标系的变换：‌P_c = R·P_w + t‌，旋转矩阵R的计算已知欧拉角（航向角Yaw（Yaw+90）、俯仰角Pitch（无人机坐标系与常见空间坐标系不同：90+abs（Pitch））、横滚角Roll），需按特定顺序转换为旋转矩阵：‌旋转顺序‌：通常为Z轴(Yaw) → Y轴(Pitch) → X轴(Roll)‌。‌计算公式‌：

2025-03-24 20:17:42 381

原创 Opencv计算机视觉编程攻略-第一节图像读取与基本处理

导入依赖项的h文件。

2025-03-19 22:50:11 305

原创 labelme等标注的单个数据转voc标准数据集格式

【代码】labelme等标注的单个数据转voc标准数据集格式。

2025-02-25 22:39:14 335

原创 selenium自动化测试全流程

selenium自动化测试全流程

2025-02-11 23:19:48 177

原创实现正射图像中某个像素的位置定位，基于大疆无人机实现

无人机正射拍摄，已知像素物理尺寸，使用大疆飞机拍摄的信息，进行像素坐标估算，理论精度应该在米级，但是航偏角以及定位误差导致与实际有所不同。详细完整代码放在我的资源下载，可以免费下载。

2025-01-24 16:22:44 267

原创 opencv 抽取无人机影像视频帧及对应坐标参数

基于opencv-python ，依据设置的帧数间隔提取关键帧，以及解析无人机字幕数据，生成csv。

2024-12-20 17:46:03 252

原创 pyautocad批量处理cad

【代码】pyautocad批量处理cad。

2024-11-26 15:50:59 288

原创文本解码原理-以MindNLP为例

gpt这类语言模型的构建已经不再像是一个简单的模型工作，反而像是一个工程，每一个部分均可以进行调整优化，并且不同的装配也能获得不同的生成效果，此次主要选了三种经典的选择方法，贪心，集束以及概率选取，针对每一类都有不同的变种产生，后续可以再进行探索，同时了解到了模型同类输入的缓存加速设计，这些技术的应用正是推动大模型落地的有效策略。本次主要学习文本解码的选择策略，GPT模型（以及其他基于Transformer的生成模型）的一个核心是。个词，并从中最终选择出概率最高的序列来降低丢失潜在的高概率序列的风险。

2024-11-23 12:10:06 648

原创基于MindNLP的Roberta模型Prompt Tuning

这就是p-tuning 和 p-tuning v2 的发展变化，两者都是旨在改进自然语言处理中提示学习（Prompt Learning）的方法，它们的核心思想都是将提示视为可学习的参数，而不是离散的文本片段。此次课程学习收获颇丰，语言模型的快速发展中不仅仅是模型结构的修改，还包括训练方式的修改，思路的变化，甚至让机器去替换传统的人工部分，每一次的迭代都会带来很大的提升，这种提示词模块微调的方法极大的拓宽了模型的应用范围，使得语言模型在通用智能上走的更远，这提高了模型的泛化能力，并减少了训练时间。

2024-11-22 23:26:29 805

原创基于MindSpore的GPT2文本摘要

GPT2相比于1.0在通用模型的研究方向上走的更远，期望模型能够自主学习到任务需要，并生成数据，而且其中的类似无监督学习和填空mask也进一步增强模型的泛化性，结构上依然是transfomer的编码部分进行修改，只是模型参数量翻倍的增长，在mindnlp中已经将该模型封装的非常完整，在使用中只需要对超参进行调整即可完成模型构建和训练，整体体验流程非常流程。上文介绍的GPT 1.0是最早的版本，是于2018年发布，其基于12层的Transformer 编码结构堆叠而成的架构，拥有1.5亿个参数。

2024-11-20 20:31:56 872

原创基于MindSpore通过GPT实现情感分类

gpt1.0框架同样可以看作transfomer的一些变种，但是目标方向却在向通用模型变化，旨在让模型从大量文本中无监督学习，然后在目标任务上微调，实践证明也确实取得了相当好的效果，模型整体结构依然比较简单，再度证明了多头注意力机制以及词嵌入这些决策确实行之有效。与上次学习的BERT类似，GPT-1采取pre-train + fine-tune的思路：先基于大量未标注语料数据进行预训练（在预训练中，判别语句与人类表述方式的接近程度），然后基于少量标注数据进行微调。

2024-11-19 21:07:35 983

原创第二节基于MindSpore的BERT模型的情感分析

语言模型的发展：①将离散的文本数据转换为固定长度的静态词向量，然后根据下游任务训练不同的语言模型②预训练模型将文本数据结合上下文信息，转换为动态词向量，根据下游任务训练不同的语言模型③同样将文本数据转换为动态词向量，能够更好地捕捉句子级别的信息与语境信息，后续只需对BERT参数进行微调，仅重新训练最后的输出层即可适配下游任务④等预训练语言模型主要用于文本生成类任务，需要通过prompt方法来应用于下游任务，指导模型生成特定的输出。

2024-11-18 21:18:38 493

原创基于MindSpore的transfomer模型学习

第一次完整地学习了transfomer，并在mindspore框架上进行了代码学习实现，代码注释流程很清晰，尤其是逐步解析多头注意力机构的实现，能够将数学原理和代码实践结合，尤其是其中时间序列掩码get_attn_subsequent_mask 函数生成的后续掩码（subsequent mask），确保在解码阶段，模型只能关注到当前位置之前的输出，而不能“看到”未来的输出。然而，在训练过程中，通常使用“教师强制”策略，即使用真实的标签序列（而非模型之前生成的输出）作为解码器的输入，以。

2024-11-16 23:05:43 916

原创昇思MindSpore模型迁移零烦恼

由于此次实验是选择MindTorch进行代码迁移，建议选择交互式环境，然后镜像默认调用mindspare和MindTorch配置好的环境，如果是自己手动配置环境需要设置环境变量，否则会报错。1.包名进行替换，需要注意要偷懒直接只修改import mindtorch.torch as torch，会出现错误引用。这次迁移工作很快就结束了，总体而言未发现很大问题，后续可以尝试将更复杂的模型进行迁移。模型训练与pytoch可以通过设置环境变量实现，一键支持backward计算。

2024-11-12 21:16:01 376

原创利用单张影像，求解图像中点位的世界坐标

近期同事提出一个在已知无人机影像的外参，内参的情况下，如果假设地面是平整的即相对高度为0,的情况下，能够将倾斜拍摄的影像转为遥感影像。1.参考github大佬代码，实现图像点转空间点。2.使用rastio将坐标转入遥感影像。

2024-10-25 19:31:32 377

原创 rust 国内安装方法

国内由于各种奇奇怪怪的原因，安装rust大概只有两种方法，1.科学上网，2.修改镜像，主要介绍在Ubuntu上的安装。

2024-09-19 16:32:37 718

原创 flutter弹出框设置上传下载进度显示

在flutter中通过showDialog添加用户上传下载窗体，并实时显示进度可以通过信息流StreamController实现进度的发布和消费，注意在这里只能在一个地方监听使用，这里使用?修饰延迟到使用的地方进行实现。

2024-09-09 16:36:55 602

原创 python multiprocess使用

为了确保你的多进程代码能够正确运行，无论是直接在主程序入口调用还是通过其他函数间接调用，都需要确保多进程的启动和管理逻辑在。为了确保在多文件、多模块情况下使用多进程时不会卡在 join()，需要确保在主程序入口执行多进程逻辑。这意味着在 Windows 上尤其需要确保多进程启动是在 if。spawn【run参数传必备资源】【不支持文件对象/线程锁传参】【unix，win】【main代码块开始】【慢慢】fork 【几乎开拷贝所有的父进程资源】【支持文件对象/线程锁传参】【unix】【任意位置开始】【快】

2024-08-29 16:32:26 432 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_44242403的博客

原创 Opencv计算机视觉编程攻略-第九节检测兴趣点

原创 Opencv计算机视觉编程攻略-第八节检测兴趣点

原创 Opencv计算机视觉编程攻略-第七节提取直线、轮廓和区域

原创 Opencv计算机视觉编程攻略-第六节图像滤波

原创 Opencv计算机视觉编程攻略-第五节用形态学运算变换图像

原创 Opencv计算机视觉编程攻略-第四节图直方图统计像素

原创 Opencv计算机视觉编程攻略-第三节图像颜色处理

原创 Opencv计算机视觉编程攻略-第二节图像像素操作

原创将无人机拍摄范围内要素投影到无人机图片中

原创 Opencv计算机视觉编程攻略-第一节图像读取与基本处理

原创 labelme等标注的单个数据转voc标准数据集格式

原创 selenium自动化测试全流程

原创实现正射图像中某个像素的位置定位，基于大疆无人机实现

原创 opencv 抽取无人机影像视频帧及对应坐标参数

原创 pyautocad批量处理cad

原创文本解码原理-以MindNLP为例

原创基于MindNLP的Roberta模型Prompt Tuning

原创基于MindSpore的GPT2文本摘要

原创基于MindSpore通过GPT实现情感分类

原创第二节基于MindSpore的BERT模型的情感分析

原创基于MindSpore的transfomer模型学习

原创昇思MindSpore模型迁移零烦恼

原创利用单张影像，求解图像中点位的世界坐标

原创 rust 国内安装方法

原创 flutter弹出框设置上传下载进度显示

原创 python multiprocess使用

原创【无标题】

原创 arcengine无法使用backgroundwork的解决方法

原创 arcpy代码在vscode可以使用，添加进arcmap工具集失效

原创 vs2012适用的IndentGuides v14

原创 windows + python + opencv 打开双目摄像头chusei3d踩坑

opencv C++ 视觉教程代码三维视觉重建零基础入门主要介绍基于opencv 的C++图像处理的常用代码，设计图像处理，三维重建等领域

opencv 直方图均衡化处理

第三节图像颜色转换代码实现

Opencv计算机视觉编程攻略-第二节图像像素操作代码

实现正射图像中某个像素的位置定位，基于大疆无人机实现，其中要求拍摄角度为-90度

高级系统分析师论文写作

软考案例资料2024：系统分析与设计方法详解

空空如也

opencv C++ 视觉教程代码 三维视觉重建 零基础入门 主要介绍基于opencv 的C++图像处理的常用代码，设计图像处理，三维重建等领域

opencv 直方图均衡化处理

第三节 图像颜色转换代码实现

Opencv计算机视觉编程攻略-第二节 图像像素操作代码

实现正射图像中某个像素的位置定位，基于大疆无人机实现，其中要求拍摄角度为-90度

高级系统分析师 论文写作

软考案例资料2024：系统分析与设计方法详解

空空如也

opencv C++ 视觉教程代码三维视觉重建零基础入门主要介绍基于opencv 的C++图像处理的常用代码，设计图像处理，三维重建等领域

第三节图像颜色转换代码实现

Opencv计算机视觉编程攻略-第二节图像像素操作代码

高级系统分析师论文写作