自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 收藏
  • 关注

原创 记录gemma-3 pro生成的安卓程序打包到APK流程

本文记录了使用Gemma-3Pro和DeepSeek进行安卓APP开发的完整流程。通过AI工具生成了目标打卡和计划日记程序,详细介绍了从环境配置(安装Node.js、Capacitor)到Android Studio打包(处理Gradle报错、生成签名密钥)的全过程,并对比了iOS发布的差异。最终实现了无需联网、隐私安全的个性化应用,比市面软件更灵活实用。文章还提供了代码更新后的重新编译指南,为安卓开发新手提供了实用参考。

2025-11-26 15:38:46 758

原创 YOLO11 tensorRT导出以及跨设备部署

本文介绍了使用TensorRT加速YOLO模型部署的全流程。首先阐述了TensorRT的优势:提升推理速度、降低资源消耗、简化部署流程。详细说明了环境配置步骤,包括安装PyTorch、TensorRT等依赖库。然后讲解了数据准备过程,包括使用labelme标注数据并转换为YOLO格式。接着介绍了YOLO模型的训练方法,以及将训练好的模型导出为ONNX格式。重点对比了基础版和优化版TensorRT的推理性能,优化版通过FP16加速等技术实现了1.9倍的加速比。最后提供了Python打包部署方案,将Tensor

2025-11-25 09:00:00 1539

原创 ONNX面试100问(第五部分)

手动算子融合模式包括图级优化(如ONNXOptimizer)、硬件定制融合(如TensorRT/OpenVINO)、算子重写和内存感知融合等,可显著提升性能。ONNX模型验证需系统测试输出一致性,通过余弦相似度、最大绝对误差等指标评估微小差异是否可接受。生产部署需考虑模型加密、访问控制等安全因素,并监控性能指标如延迟、吞吐量。复杂模型导出可采用"分而治之"策略,核心推理部分单独导出,预处理/后处理独立优化。边缘设备部署需注重模型压缩和低功耗优化。优秀部署工程师需掌握多框架导出、深度优化及

2025-11-23 17:01:48 601

原创 AI模型部署最全知识问题——ONNX面试100问(第四部分)

本文摘要:文章系统整理了ONNX模型转换与部署中的常见问题及解决方案。涵盖错误排查流程(如算子不兼容、设备不一致等)、可视化工具(Netron、ONNXChecker)、性能调试工具(ONNXRuntime、Polygraphy)。针对特定错误如"RuntimeError"和"Non-zero status code",提供了详细的调试方法。重点论述了不兼容算子的处理方案:包括自定义导出实现、等价算子组合替换等。同时介绍了ONNX形状推断的重要性及缺失后果,以及内置优

2025-11-17 09:40:49 815

原创 AI模型部署最全知识问题——ONNX面试100问(第三部分)

本文摘要: ONNX模型导出第三部分聚焦动态维度、控制流与高级导出策略。主要内容包括:1) 动态维度的表示方法及配置技巧(BatchSize、图像尺寸、序列长度);2) 控制流导出的挑战与解决方案(trace模式局限、静态化重写、script模式应用);3) 高级导出问题处理(动态切片陷阱、混合精度类型匹配、量化转换)。文章指出CNN等静态结构模型是ONNX"良好公民",而含动态控制流或非标准算子的模型则易成为"刺头"。最佳实践建议根据实际需求权衡动态/静态维度,合理

2025-11-11 09:00:00 1439

原创 AI模型部署最全知识问题——ONNX面试100问(第一、二部分)

ONNX(开放神经网络交换)是一种标准化的模型表示格式,充当不同深度学习框架间的桥梁。它在AI部署中提供框架互操作性、硬件适配和性能优化能力。相比直接使用PyTorch模型,ONNX能提升推理效率、支持跨平台部署,并与TensorRT等推理引擎集成。ONNX模型包含计算图、节点、张量和属性等核心组件,通过算子集版本(opset_version)定义兼容性范围。 导出ONNX时,需注意: 使用model.eval()禁用训练模式随机性 提供真实样本作为输入参数 多GPU模型需先移除DataParallel封装

2025-11-10 15:56:10 1387

原创 C++面试高级篇——内存管理(三、内存管理与操作系统)

本文分析了C++内存管理与操作系统机制的深层关联。从new操作到物理内存分配的完整链路揭示了延迟分配、缺页中断等内核优化;探讨了TLB、NUMA架构对性能的影响,提出内存池预热、NUMA感知分配等优化策略;剖析了mmap零拷贝机制及其在C++对象构造中的限制;针对系统内存回收机制,给出了内存压力感知和信号安全处理方案。这些OS级内存知识对C++高性能编程和系统级调试具有重要意义,尤其在实时系统、图像处理等场景中,合理利用底层机制可显著提升程序性能与稳定性。

2025-11-10 13:48:59 662

原创 C++面试高级篇——内存管理(二、综合考查)

本文探讨了C++内存管理的三个核心问题:智能指针循环引用的解决方案、自定义内存池的设计与优化、以及Boost.Pool在OpenCV特征点管理中的应用。首先分析了std::shared_ptr循环引用的产生机制,提出使用std::weak_ptr的解决方案及其多线程安全性考;其次详细介绍了高性能内存池的设计原理,包括固定块管理、placement new构造和析构调用等关键技术;最后针对OpenCV高频创建KeyPoint的场景,阐述了Boost.Pool的内部机制、适用边界和线程安全优化策略。文章通过代码

2025-11-07 15:59:14 590

原创 C++面试高级篇——内存管理(一)

本文深入探讨了C++内存管理的优化策略,重点关注高频对象创建/销毁场景下的性能瓶颈及解决方案。主要内容包括: 分析标准new/delete的性能问题:系统调用开销大、内存碎片、缓存局部性差和多线程竞争 详细介绍placement new机制及其正确使用方法,强调必须手动调用析构函数 对比shared_ptr与make_shared的区别,解释循环引用的危害及weak_ptr的解决方案 系统讲解内存池设计:适用场景、基本实现思路、对齐要求、线程安全方案 比较boost::object_pool与std::pm

2025-11-07 15:36:28 1042

原创 记录win10/win11安装docker desktop全过程

windows docker安装详解

2025-06-10 11:37:11 2536

原创 深入理解交叉熵损失函数——全面推演各种形式

带你从不一样的视角综合认识交叉熵损失,阅读这篇文章,帮你建立其分类问题,对比学习,行人重识别,人脸识别等问题的联系,阅读这篇文章相信对你阅读各种底层深度学习论文有帮助。

2025-05-31 21:30:06 1425

原创 MCP Python技术实践

如果你经常与AI应用打交道,你可能会遇到这样的困扰:想让AI助手访问你的本地文件、连接数据库、或者调用某个API,但每次都需要复杂的配置和集成工作。而且,不同的AI应用有不同的集成方式,维护起来十分麻烦。Model Context Protocol(MCP)就是为了解决这个问题而诞生的。简单来说,MCP是一个标准化的协议,它就像是AI应用和外部数据源之间的"通用接口"。想象一下,如果所有的电子设备都需要不同的充电接口,那该多么麻烦。

2025-05-31 21:14:50 1606

原创 《三维点如何映射到图像像素?——相机投影模型详解》

本文系统梳理了3D视觉中的投影变换全流程,详细讲解了从世界坐标系到相机坐标系再到像素坐标的转换过程。主要内容包括:1)四大核心步骤:刚体变换(世界→相机坐标系)、透视投影(相机→归一化图像坐标)、内参变换(归一化→像素坐标)和图像后处理;2)相机坐标系的构建原理与旋转矩阵的数学推导;3)通过具体案例演示完整计算过程,包括存在夹角时的复合旋转处理;4)关键参数(内参矩阵、焦距、主点等)的物理意义和作用。文章通过可视化示例和数学推导相结合的方式,帮助读者透彻理解3D投影变换原理,避免实际应用中的常见错误。

2025-05-26 16:07:09 2382 1

原创 从UNet训练到TensorRT部署:完整语义分割模型部署优化指南(windows版本)

本文详细介绍了从UNet模型训练到TensorRT部署的完整流程,涵盖了数据准备、模型训练、ONNX导出、TensorRT优化以及Python/C++推理实现等关键环节。通过TensorRT部署,我们能够显著提升模型的推理速度,满足实际生产环境对实时性的要求

2025-04-25 10:38:56 1828 1

原创 Python手把手搭建基于Deepseek大模型的本地知识库

在前面的文章,我介绍了基于LM studio的大模型部署和API调用,本文将介绍一个实际的项目案例,即利用Python构建一个本地化的知识库来加深大家对于大模型本地化应用的理解。构建基于Python的大模型本地知识库成为提升信息检索效率和保障数据隐私的关键手段。对于企业和个人用户而言,这不仅能加速日常工作的信息查找过程,支持更明智的决策制定,同时也提供了一个深入学习最新自然语言处理技术的机会。

2025-04-24 20:16:11 2093

原创 三角化与极几何

本文系统讲解三维重建与对极几何理论,包括相机模型、本质矩阵推导和极线约束原理。提供完整的Python实现方案,涵盖特征匹配、基础矩阵估计、相机姿态恢复和三角化等关键步骤。通过可视化分析极线几何,深入探讨本质矩阵计算方法及尺度问题解决方案,为三维视觉实践提供理论指导和代码参考

2025-04-21 15:31:40 1176

原创 图像分割大模型SAM2 ONNX导出部署全流程

图像分割大模型的onnx部署简单部署流程

2025-04-15 15:56:17 2764 8

原创 LLM Studio本地部署deepseek的API调用,基于Python实现简易对话客户端

本教程将详细介绍如何使用LM Studio在本地部署DeepSeek大模型,并构建一个带图形界面的聊天应用。教程从模型导入到客户端开发,适合零基础用户跟随操作。

2025-04-14 11:49:39 1652

原创 CUDA编程面试高频30题

CUDA(Compute Unified Device Architecture)是由NVIDIA开发的一种并行计算平台和应用程序接口模型。它允许开发者利用NVIDIA GPU进行通用计算任务,而不仅仅是图形渲染。CUDA提供了一个编程模型,使得开发者可以通过C、C++或Fortran等语言编写程序,并在支持CUDA的GPU上运行这些程序以获得显著的性能提升。Warp是GPU执行的基本单位,通常包含32个线程。Warp内的线程以单指令多线程(SIMT)方式执行相同的指令流。

2025-03-21 10:11:57 1948

原创 CUDA编程基础

本文简要介绍了CUDA编程的核心概念与实践,包括内存层次结构、线程模型、核函数设计等关键知识点,并通过实例讲解了如何优化程序性能,如利用共享内存减少全局内存访问、合理配置线程块大小以充分利用GPU资源。此外,还提及了使用CUDA流实现异步执行及最新架构特性,为读者提供了一个全面了解CUDA编程的概览。

2025-03-20 16:40:36 1849

原创 机器学习面试重点第二部分(动画版)

Fisher判别分析是一种监督降维方法,其核心思想是通过最大化类间距离与类内距离的比值,找到最优的投影方向,使得不同类别的数据在低维空间中尽可能分开。LDA是一种监督降维方法,其核心思想是通过最大化类间距离和最小化类内距离,找到最优的投影方向,使得不同类别的数据在低维空间中尽可能分开。PCA是一种无监督降维方法,其核心思想是通过正交变换将原始数据投影到低维空间,使得投影后的数据方差最大,从而保留尽可能多的信息。SVD是一种矩阵分解方法,其核心思想是将一个矩阵分解为三个矩阵的乘积,从而提取矩阵的主要特征。

2025-03-19 15:10:17 1194

原创 机器学习面试重点第一部分(动画版)

自己整理了些面试常见的问题,然后尽可能使用直观的方式帮助大家记忆,后面会陆续介绍各个关键的基础知识,帮助大家校招和社招。目录一、KNN1. 原理问题1:KNN算法的核心思想是什么?问题2:KNN算法中距离度量有哪些常见方法?问题3:KNN算法中K值的选择对结果有什么影响?2. 实现问题1:KNN算法的实现步骤是什么?问题2:KNN算法的时间复杂度是多少?3. 优化与加速算法问题1:KNN算法的主要缺点是什么?如何优化?4. 代码实现5. 综合问题二、SVM1. ​什么是支持向量机(SVM)?2. ​SVM如

2025-03-15 12:10:45 1420

原创 三维重建基础——单视测量(第一部分)

齐次坐标通过增加一个维度来表示点。二维点(x,y)的齐次坐标为(x,y,1)。无穷远点的齐次坐标为(x,y,0)。关键点如果w!=0,则(x,y,w)表示有限点,等价于欧氏空间中的点(x/w,y/w)。如果w=0,则(x,y,0)表示无穷远点。无穷远点(x,y,0)的定义来源于投影几何的极限概念。当w→0时,点(x,y,w)趋向于无穷远。数学推导考虑点(x,y,w),当w→0时,x/w和y/w趋向于无穷大,因此(x,y,0)表示一个无穷远点。​齐次坐标的作用。

2025-03-11 17:14:52 1779

原创 深入解析相机标定:从数学原理到工程实践

参数物理意义未标定的后果标定后的精度提升f_xX方向等效焦距深度计算误差(比例性偏差)深度误差<0.1%c_x图像中心X坐标物体水平定位偏移中心定位误差<1像素k_1二阶径向畸变系数图像边缘弯曲(桶形/枕形)直线弯曲度<0.1像素p_1切向畸变系数图像倾斜变形角度偏差<0.1度采集图像:从不同角度拍摄标定板(建议15-20张)角点检测:提取标定板的角点坐标参数初始化:估计初始内参和畸变系数优化求解:最小化重投影误差,优化参数结果评估:计算标定误差,验证精度。

2025-03-08 11:59:23 1611

原创 相机几何:从三维世界到二维图像的映射

本文将带领读者开启一场独特的三维视觉工程之旅。我们不再止步于教科书式的公式推导,而是聚焦于如何将抽象的数学原理转化为可落地的工程实践。通过解剖相机的光学特性、构建成像数学模型、解析坐标系转换链条,直至亲手实现参数标定代码,我们将层层剥开三维视觉系统的核心构造。在这场旅程中,您将理解为何简单的针孔模型能衍生出自动驾驶的感知算法,掌握透镜畸变参数如何影响AR眼镜的虚实配准精度,洞悉坐标系转换矩阵怎样支撑工业机器人的空间定位。我们特别设计了"理论-建模-代码"三位一体的讲解框架,让OpenCV中的标定函数不再

2025-03-06 22:01:15 1366

原创 大模型基石——Transformer介绍

例如,在句子“The cat sat on the mat”中,当你看到单词“sat”时,你的注意力可能会集中在“cat”和“mat”上,因为它们与“sat”有直接的语义关系。注意力机制的核心思想是:模型在处理序列中的某个元素时,可以“关注”序列中的其他元素,而不需要严格按照顺序处理。注意力机制的作用就是让模型在处理某个单词时,能够“关注”句子中的其他单词,从而捕捉上下文信息。在Transformer中,注意力机制的作用是让模型在处理某个单词时,能够“关注”句子中的其他单词,从而捕捉上下文信息。

2025-03-05 20:46:59 1286

原创 由浅入深系列——Distinctive Image Featuresfrom Scale-Invariant Keypoints(SIFT)

一文吃透SIFT

2025-02-28 16:12:48 892

原创 由浅入深系列——傅里叶变换

频率(Frequency)是单位时间内周期性事件重复的次数,单位为赫兹(Hz)。​心跳:1 Hz ≈ 60次/分钟,频域中对应一个尖峰(图2)。​钢琴中央C:261.63 Hz,代表每秒振动次数,与琴弦长度/张力相关。哲学延伸:频率是物质的“振动指纹”。从DNA双螺旋到银河系旋转,宇宙本质是不同频率振动的叠加。

2025-02-26 15:20:50 1398 1

原创 由浅入深系列——卡尔曼滤波

卡尔曼滤波自1960年诞生以来,已从一篇控制论论文演变为跨越学科的工具,但其核心思想价值远超越数学公式本身。它提供了一种在噪声与混沌中逼近本质的方法论,既是对技术局限的妥协,也是对人性认知的隐喻。

2025-02-26 14:35:07 1624

原创 记录在 Windows 上安装 OpenSSL供VS使用:详细步骤与常见问题解决(包括 X64 版本)

通过遵循以上步骤,我成功地在 Windows 上安装了 OpenSSL。无论是32 位还是64 位的版本,只需要在配置阶段使用不同的命令(VC-WIN32或VC-WIN64A)即可。主要的挑战包括权限问题和确保所有构建工具正确配置。通过使用Visual Studio 开发者命令提示符并确保以管理员身份运行命令,我能够顺利解决这些问题,并完成 OpenSSL 的安装。

2025-02-20 11:22:33 1412

原创 从 YOLOv2 到 YOLOv10 看目标检测任务的关键难点和核心改进方法

目标检测任务通常应用于。

2025-02-12 15:20:59 1235

原创 通过 YOLOv1 剖析基于深度学习的单阶段目标检测核心思路

✅。

2025-02-12 14:34:24 982

原创 虚拟机双网卡搭建

项目描述:我们将探讨如何通过虚拟机中集群化部署的 centos系统来控制海康摄像机,并利用 OpenCV 实现基础的视频流处理。整个过程的实现,主要参考了海康的 API 文档,目标是通过虚拟机有效控制监控设备并进行视频数据的处理。博文描述:博文还将介绍如何在虚拟机中配置双网络环境,使得系统同时能够访问内网和公网。这一技术方案对于其他类似项目也具有很高的借鉴意义,特别是在需要同时进行公网和内网资源访问的场景下。由于考虑K8S的集群化部署,在实验过程中,最大的挑战之一便是虚拟机的网络配置。

2025-02-08 10:28:01 1183

原创 Ubuntu Docker 安装与远程连接笔记

在VSCode中配置Remote-SSH插件,填写相应的服务器IP、端口等信息,即可实现远程开发环境。在Ubuntu系统中,可能已经预装了低版本的Docker。首先需要卸载这些旧版本以避免冲突。,尽管实际上你的zlib版本高于1.2.3。完成上述步骤后,再次尝试拉取镜像应能正常工作。工具存在bug导致的。当尝试拉取镜像时可能会遇到错误提示。注:更改后需要重新登录才能生效。下载并编译最新版本的。

2025-02-05 13:47:17 1200

原创 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcement Learning 论文重点部分翻译和要点解读

推理任务:(1) DeepSeek-R1在AIME 2024上实现了79.8%的Pass@1得分,略高于OpenAI-o1-1217。在MATH-500上,它取得了令人印象深刻的97.3%得分,与OpenAI-o1-1217持平,并显著超越其他模型。(2) 在与编码相关的任务中,DeepSeek-R1展示了专家级别的能力,在Codeforces竞赛中获得了2,029的Elo评分,超过了96.3%的人类参赛者。

2025-02-03 12:03:00 1183

原创 零基础本地部署DEEPSEEK大模型教程(LM Studio版)

上面两部主要是看CUDA是否成功加载,不然是CPU跑可能就很慢,一般来说都没有问题,有问题可能需要安装CUDA的库。在框中输入刚才搜的模型,因为你搜的模型会告诉你这个模型是否符合你的电脑配置,注:DEEPSEEK R1的GGUF量化版(如Q4_K_M)约需8GB显存。国内网盘镜像(含DEEPSEEK R1各量化版本): 暂未上传。:消费级显卡即可运行(实测NVIDIA 4060s流畅运行)(使用VS Code/VSCode的批量替换功能更高效):模型加载后可直接对话。中保存常用提示词模板。

2025-02-02 19:17:04 12579 1

原创 pytorch常见问题和技巧——标签格式错误

在模型训练过程中,标签格式错误是导致模型性能下降或训练失败的常见原因之一。以下总结了常见的标签错误情况及其可能的错误结果,并提供了相应的解决方案。

2025-02-02 13:07:43 1135

原创 pytorch常见问题和技巧——数值不稳定,loss为Nan等

总结一些模型在训练过程中常见的导致数值不稳定的原因,一般来说可以检测这些函数是否正确使用

2025-02-02 11:55:44 1199

原创 论文原文翻译加深度解读系列视觉篇——SIFT

SIFT论文

2025-02-02 11:41:27 1561

原创 使用 PyInstaller 打包 Python 应用

PyInstaller 虽然可以自动识别依赖项,但有时也会出现遗漏的情况,需要手动添加。将 Python 解释器、依赖项以及脚本打包成一个可执行文件 (Windows 下为。打包后的文件体积会比较大,因为它包含了 Python 解释器和所有依赖项。打包后的程序只能在相同操作系统和架构的机器上运行。,Linux/macOS 下为无后缀文件)。目录,直接运行生成的可执行文件即可。脚本,自动识别其依赖项。目录下生成打包后的文件。

2025-01-31 15:04:17 369

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除