Robo-网络矿产提炼工
计算机视觉、故障诊断与深度学习领域爱好者与研究者。
展开
-
deepseek大模型-初探
许多专家学者们对深度学习的工具属性日益敏感,并逐步分成了两派,一派觉得深度学习并不可靠,可能用来做一做行业应用尚可,但是对于科学问题的探索并不可靠;另一方面,大模型虽然精准性不足,但是在帮助人们理解和学习新知识以及做一些简单的规划任务上展现出惊人潜力!原创 2025-01-05 17:33:16 · 4281 阅读 · 0 评论 -
CVPR和其他2024顶会论文阅读(资源整理【1】)
总结了一些今年视觉方向的顶会论文,后续会继续完善!原创 2024-12-05 15:56:44 · 1404 阅读 · 0 评论 -
Scaling vision Transformer 论文理解
基于注意力的神经网络,例如视觉transformer(ViT),最近在许多计算机视觉基准测试上取得了新新进展。模型的规模(大小)是获得优异结果的主要因素。因此,了解模型的规模特性是有效设计后代的关键。虽然已经研究了Transformer语言模型的缩放规律,但尚不清楚Vision Transformers是如何缩放的。为了解决这个问题,我们向上和向下缩放ViT模型和数据,并描述错误率、数据和计算之间的关系。一路上,我们改进了ViT的体系结构和训练,减少了内存消耗,提高了结果模型的准确性。原创 2024-06-06 14:59:23 · 388 阅读 · 0 评论 -
强化学习笔记系列入门【0】
最近在学习西湖大学赵世钰老师的强化学习课程,今天好像又看到更新了一个对他这个整体框架图的一个说明的更新视频。确实这样讲一下,对整个脉络有了更为清楚的认知。原创 2024-04-03 09:23:26 · 151 阅读 · 0 评论 -
采用齐次变换矩阵-旋转特点角度和平移特定距离
我们固定不动的参考坐标系为xyz,需要被旋转的坐标系为abc。初始状态两个坐标值完全重合,现在的目标是旋转坐标abc到达指定位置。所谓的外在旋转指的是三次旋转中每次旋转的旋转轴都是固定参考系中的xyz轴中的一个轴。例如:Tait–Bryanangles的xyz顺序,那么在旋转abc的时候,每次旋转把abc坐标系围绕固定参考系xyz中的某个轴旋转;而内在旋转指的是在旋转abc的时候,每次旋转围绕的的轴是上一次abc旋转后的某个轴。原创 2024-03-29 15:54:18 · 231 阅读 · 0 评论 -
并联机器人建模【1】-Delta机器人简介与工作空间分析
Delta机器人是典型的空间三自由度并联机构,整体结构精密、紧凑,驱动部分均布于固定平台,这些特点使它具有如下特性: ①承载能力强、刚度大、自重负荷比小、动态性能好。②并行三自由度机械臂结构,重复定位精度高。③超高速拾取物品,一秒钟多个节拍。原创 2024-03-28 15:22:33 · 2428 阅读 · 0 评论 -
文章阅读-自动化领域论文选读
自动化领域的几篇论文选读。原创 2024-03-27 17:09:26 · 943 阅读 · 0 评论 -
查看安装的Microsoft visual c++版本(Windows环境下loris包安装报错)
本篇博客主要介绍了Win10环境下如何查看visual studio的安装版本,并且针对loris包安装编译出错的问题,提供了一个替代性解决方案。原创 2024-02-26 20:27:42 · 563 阅读 · 0 评论 -
PyQt系列-1 PyQT安装与最简DEMO
这个系列是对PyQT UI的一个简单且详细的系列教程,旨在帮助PyQt新手快速上手一些新项目。原创 2024-02-25 11:16:28 · 324 阅读 · 0 评论 -
Ansys方法基础
本博客简单介绍了有限元中的显式求解和隐式求解两种方法。原创 2024-02-11 11:35:27 · 260 阅读 · 0 评论 -
相机(机器视觉系统)标定、相机校准、内参和外参
本篇博客对机器视觉系统(工业相机)的标定、相机校准、内参和外参进行了详细的介绍。并给出了相机标定的一个demo程序。原创 2024-01-17 09:24:46 · 970 阅读 · 0 评论 -
常见厂商的自动驾驶-智能网联汽车方案比较
特斯拉拥有数百万辆实车在路上实时收集数据并提供直接反馈,这是其他公司无法企及的。这种独特的能力使得特斯拉目前是唯一一个可供消费者购买的可扩展自动驾驶解决方案。最近小鹏的G9max上市,带有激光雷达的MAX版本进行XNGP辅助驾驶内容的更新,辅助驾驶方面的提升相当的给力!每天通勤开车不是负担,每次上车,全新升级的智能座舱,能设置家和公司的地址!国产车相比于某些进口车的优势就在于引入了激光雷达传感,Tesla等车企放弃了激光雷达,也就意味着在中国的复杂城市交通环境下,更难以实现全无人管控下的自动驾驶功能。原创 2024-01-16 16:47:34 · 229 阅读 · 0 评论 -
论文阅读-Koopa: Learning Non-stationary Time Series Dynamics with Koopman Predictors
真实世界的时间序列具有内在的非平稳性,这是深度预测模型面临的主要挑战。这篇博客介绍了一个基于DMD方法的深度学习模型,用于非平稳信号的预测。原创 2024-01-16 16:21:46 · 487 阅读 · 1 评论 -
解决报错ImportError: cannot import name ‘Markup‘ ‘Escape‘ from ‘jinja2‘‘
stackoverflow给出的方案由于是实际的他人经验,测试后直接解决了,可以说虽然Chatgpt改变了一些代码BUG的解决方式,但实际上也存在一些仍然难以解决的疑难杂症问题,仍然需要Stackoverflow等进行解决。原创 2023-12-01 20:00:15 · 1102 阅读 · 0 评论 -
基于Python OpenCV的金铲铲自动进游戏、D牌...
基于OpenCV Python的小demo原创 2023-11-05 22:39:17 · 2221 阅读 · 0 评论 -
能源化工过程-故障诊断数据集初探-田纳西-伊斯曼过程数据集
田纳西-伊斯曼过程数据集是一个重要的化工过程模拟数据集,本博客对一些关键性的文献进行了总结和分析。原创 2023-11-02 21:29:03 · 2821 阅读 · 0 评论 -
深度强化学习用于博弈类游戏-基础测试与说明【1】
简要介绍了一个AutoLOL的工作。原创 2023-10-29 17:04:01 · 369 阅读 · 0 评论 -
Pytorch深度学习模型的指标测试【1】(如:模型大小、模型操作量)
几种轻量级深度学习模型的保存文件大小和模型的操作量统计。原创 2023-09-29 16:36:05 · 229 阅读 · 0 评论 -
传统目标检测算法【1】-Mean shift
基于Mean shift 运动目标检测算法说明及Opencv Python的方法实现原创 2023-09-18 17:04:57 · 265 阅读 · 0 评论 -
目标检测-计算IOU,mAP指标
IoU,全称Intersection over Union,可翻译为交并比,是两个框交集与并集的比值。计算IoU的公式如下图,可以看到IoU是一个比值,即交并比。在分子中,我们计算预测框和ground-truth之间的重叠区域;分母是并集区域,是预测框和ground-truth所包含的总区域。重叠区域和并集区域的比值,就是IoU。原创 2023-08-17 16:26:51 · 541 阅读 · 0 评论 -
GPU编程基础-CUDA实现图像处理
随着GPU芯片的不断更新换代,大规模并行计算正在信息时代逐渐普及,相比于CPU计算,GPU的并行计算到底有哪些特点和优势呢?本博客以图像处理为例子,深入浅出的说明了GPU并行计算在图像预处理等任务上的应用优势。原创 2023-08-16 21:07:07 · 2451 阅读 · 1 评论 -
科大讯飞-大视角差图像特征提取及匹配挑战赛2023
大多数图像匹配方法包含三个阶段:特征检测、特征描述、特征匹配。检测阶段,在图像中依据像素、轮廓信息检测特征点;描述阶段, 围绕这些特征点周边区域提取局部描述符;匹配阶段,通过最近邻算法进行匹配得到结果。传统图像匹配方法以基于特征的 ORB、SURF 、SIFT等为代表,其实质是在基元相似性的条件下,运用匹配准则的最佳搜索问题。原创 2023-08-11 17:43:42 · 482 阅读 · 2 评论 -
科大讯飞-鸟类分类挑战赛-测试【1】
为了解决这个问题,人工智能技术成为了一个非常有前途的解决方案。利用人工智能技术,我们可以自动地识别和分类各种不同的鸟类,实现对鸟类的高效监测和保护。这个错误就是加载的数据太大了,map函数难以处理这么大的数据,因此,可以选择调小batch size或者进一步降低resize尺寸。这个相比于前面的几个数据集的图像分辨率和数据集总大小更大。将模型头部修改为25类(待分类鸟类数据集总类数:25)原创 2023-08-02 20:51:14 · 1258 阅读 · 0 评论 -
stable difussion Pytorch实现与测试
Stable Diffusion是目前最火的AI绘画工具之一,它是一个免费开源的项目,可以被任何人免费部署和使用。通过Stable Diffusion,可以很轻松的通过文字描述,生成对应的图片。由于它是一个开源项目,开源社区(如:GitHub)中有很多插件和训练好的模型,我们可以直接使用。,基于这个算法能够实现官方发布的封装后模型的完整测试,算法基于Stable Diffusion v1.x的参数。配置好这个本地包,就可以利用本地的cpu或者gpu推理得到需要的特定图片。原创 2023-07-31 15:41:15 · 1423 阅读 · 2 评论 -
科大讯飞-X光安检图像识别挑战赛2023-测试【1】
X光安检是目前在城市轨交、铁路、机场、物流业广泛使用的物检手段。使用人工智能技术,辅助一线安检员进行X光安检判图,可以有效降低因为安检员经验、能力或工作状态造成的错漏检问题。在实际场景中,因待检测物品的多样性、成像角度、重叠遮挡等问题,X光安检图像检测算法研究存在一定挑战。本博客采用最新的YOLO框架测试了算法在实际X光检测应用中的可行性。原创 2023-07-28 20:11:28 · 809 阅读 · 2 评论 -
基于Python的工业图像异常检测基础技术详解
这篇博客对当前几种典型的进行了比较,包括Kmeans、Kmeans++以及大津法(OTSU),并给出了相关的代码实现与测试方法。原创 2023-07-19 09:23:14 · 412 阅读 · 0 评论 -
# Pytorch 深度卷积模型的特征可视化
采用pytorch可视化中间特征层的结果原创 2023-07-15 17:11:53 · 2741 阅读 · 1 评论 -
CVPR2023 Openlanev2 挑战赛:第一名方案解读
博客解读了最新的CVPR 2023 挑战赛Openlanev2作者们公开的方法。原创 2023-07-01 16:03:27 · 874 阅读 · 0 评论 -
Deep SHAP 深度学习模型的可解释性分析
Deep SHAP 算法是一种用于解释深度学习模型的技术, 该算法通过将每个特征的重要性与输出值相关联来进行解释。本博客对深度学习的模型可解释性进行了分析。原创 2023-06-14 17:33:07 · 4212 阅读 · 0 评论 -
网格搜索:Python遍历网格中每个点
最近需要实现一个对矩阵赋值并对矩阵表示的网格参数进行测试的任务,写了一段代码提供参考。原创 2023-06-03 21:24:35 · 1239 阅读 · 0 评论 -
论文学习之对比学习【1】-SimCLR:论文阅读与简单demo测试
对比学习simCLR的解读和基于Pytorch的简单测试。原创 2023-05-31 21:24:13 · 986 阅读 · 0 评论 -
神经形态学计算框架:LAVA简单mnist测试
近年来,以数据为中心的高效计算与存储技术不断发展,作为一种高效架构,存算一体技术近年取得极快进展。与冯诺依曼架构中计算与存储分离的设计相比,其通过减少对数据处理流程中的不必要流动过程,存算一体技术在有效提升了数据处理效率。Lava是一个开源软件框架,用于开发神经形态硬件架构的应用程序。它为开发人员提供了开发分布式和大规模并行应用程序的抽象和工具。这些应用程序可以部署到包含传统处理器的异构系统架构中,以及利用基于事件的消息传递进行通信的神经形态芯片。原创 2023-04-21 21:15:47 · 583 阅读 · 0 评论 -
轻量级深度卷积模型的一些评价指标
旨在分享一些轻量级深度学习模型的通用性指标评价概念和python实现,帮助大家理解也方便自己查阅。这篇博客主要是对轻量级深度模型的一些指标概念阐述和pytorch的一个简单demo实现。原创 2023-04-19 21:01:50 · 1342 阅读 · 0 评论 -
论文阅读【1】--PCWGAN-GP: A New Method for Imbalanced Fault Diagnosis of Machines
在实际工业应用场景中,机械设备大多数时间都处在健康状态下。因而监测系统所获取的健康样本数量往往远远多于故障样本数量,这导致了在许多诊断任务中,故障样本的数量要远远少于健康状态下的样本,即诊断模型在设计上面临着数据不平衡问题。一般而言,通过人为的干预设计实验,可以获得足够量的故障数据,进而构建平衡的数据集。然而,局限于实际监测应用的成本,多数监测任务难以获取到足够量且平衡的数据集。因此,本研究提出了一种基于数据扩充的方法来解决这一问题。原创 2023-04-16 20:14:36 · 499 阅读 · 0 评论 -
报错处理:RuntimeError: Input type (torch.FloatTensor) and weight type (torch.cuda.FloatTensor) should...
这篇博客解决的是pytorch训练图像分类模型中常常遇到的一个常见问题:就是模型在GPU,但是数据加载到了CPU原创 2023-04-11 15:52:10 · 4107 阅读 · 0 评论 -
关于GAP(全局平均池化层)的起源与逐步改进和进化版本
全局协方差池化在卷积网络中相比于一阶方法取得了显著进展。最近的工作表明,矩阵平方根正则化在实现最佳性能中扮演了重要角色。然而,由于EIG和SVD在GPU上的适配性较差, 而现存的方法却强烈依赖于特征分解(EIG)或者奇异值分解(SVD)方法。基于这个问题现状,这篇提出了一种迭代式的矩阵平方根归一化方法,用于快速的协方差池化网络训练。由于只涉及到矩阵乘法,提出方法相比于基于EIG的方法和SVD的方法速度更快,适用于在GPU上并行实现。此外,提出方法在ResNet结构中的测试效果表明提出方法能够加速模型与训练。原创 2023-04-05 09:43:23 · 584 阅读 · 0 评论 -
# CVPR2023挑战赛之-开放车道拓扑信息(OpenLane Topology)的测试【1】
CVPR2023 Openlanev2挑战赛的初次测试原创 2023-04-02 11:14:46 · 1343 阅读 · 1 评论 -
# YOLOv8训练自己的分类模型
YOLOv8分类模型训练自己的数据集及其小BUG总结原创 2023-03-22 09:58:11 · 1827 阅读 · 3 评论 -
视觉测振相关基础【1】
视觉测振技术的发展与基础理论,以及结构健康监测领域近年来相关文献总结原创 2023-03-21 15:19:03 · 480 阅读 · 0 评论 -
推土机距离(Wasserstein distance)以及其他几种常用的分布差异度量方法(mark)
几种分布差异度量方法及其python实现原创 2022-07-23 19:38:40 · 7722 阅读 · 0 评论