清澜-优快云博客

原创记录gemma-3 pro生成的安卓程序打包到APK流程

本文记录了使用Gemma-3Pro和DeepSeek进行安卓APP开发的完整流程。通过AI工具生成了目标打卡和计划日记程序，详细介绍了从环境配置（安装Node.js、Capacitor）到Android Studio打包（处理Gradle报错、生成签名密钥）的全过程，并对比了iOS发布的差异。最终实现了无需联网、隐私安全的个性化应用，比市面软件更灵活实用。文章还提供了代码更新后的重新编译指南，为安卓开发新手提供了实用参考。

2025-11-26 15:38:46 758

原创 YOLO11 tensorRT导出以及跨设备部署

本文介绍了使用TensorRT加速YOLO模型部署的全流程。首先阐述了TensorRT的优势：提升推理速度、降低资源消耗、简化部署流程。详细说明了环境配置步骤，包括安装PyTorch、TensorRT等依赖库。然后讲解了数据准备过程，包括使用labelme标注数据并转换为YOLO格式。接着介绍了YOLO模型的训练方法，以及将训练好的模型导出为ONNX格式。重点对比了基础版和优化版TensorRT的推理性能，优化版通过FP16加速等技术实现了1.9倍的加速比。最后提供了Python打包部署方案，将Tensor

2025-11-25 09:00:00 1539

原创 ONNX面试100问（第五部分）

手动算子融合模式包括图级优化（如ONNXOptimizer）、硬件定制融合（如TensorRT/OpenVINO）、算子重写和内存感知融合等，可显著提升性能。ONNX模型验证需系统测试输出一致性，通过余弦相似度、最大绝对误差等指标评估微小差异是否可接受。生产部署需考虑模型加密、访问控制等安全因素，并监控性能指标如延迟、吞吐量。复杂模型导出可采用"分而治之"策略，核心推理部分单独导出，预处理/后处理独立优化。边缘设备部署需注重模型压缩和低功耗优化。优秀部署工程师需掌握多框架导出、深度优化及

2025-11-23 17:01:48 601

原创 AI模型部署最全知识问题——ONNX面试100问(第四部分)

本文摘要：文章系统整理了ONNX模型转换与部署中的常见问题及解决方案。涵盖错误排查流程（如算子不兼容、设备不一致等）、可视化工具（Netron、ONNXChecker）、性能调试工具（ONNXRuntime、Polygraphy）。针对特定错误如"RuntimeError"和"Non-zero status code"，提供了详细的调试方法。重点论述了不兼容算子的处理方案：包括自定义导出实现、等价算子组合替换等。同时介绍了ONNX形状推断的重要性及缺失后果，以及内置优

2025-11-17 09:40:49 815

原创 AI模型部署最全知识问题——ONNX面试100问(第三部分)

本文摘要： ONNX模型导出第三部分聚焦动态维度、控制流与高级导出策略。主要内容包括：1) 动态维度的表示方法及配置技巧（BatchSize、图像尺寸、序列长度）；2) 控制流导出的挑战与解决方案（trace模式局限、静态化重写、script模式应用）；3) 高级导出问题处理（动态切片陷阱、混合精度类型匹配、量化转换）。文章指出CNN等静态结构模型是ONNX"良好公民"，而含动态控制流或非标准算子的模型则易成为"刺头"。最佳实践建议根据实际需求权衡动态/静态维度，合理

2025-11-11 09:00:00 1439

原创 AI模型部署最全知识问题——ONNX面试100问（第一、二部分)

ONNX（开放神经网络交换）是一种标准化的模型表示格式，充当不同深度学习框架间的桥梁。它在AI部署中提供框架互操作性、硬件适配和性能优化能力。相比直接使用PyTorch模型，ONNX能提升推理效率、支持跨平台部署，并与TensorRT等推理引擎集成。ONNX模型包含计算图、节点、张量和属性等核心组件，通过算子集版本(opset_version)定义兼容性范围。导出ONNX时，需注意：使用model.eval()禁用训练模式随机性提供真实样本作为输入参数多GPU模型需先移除DataParallel封装

2025-11-10 15:56:10 1387

原创 C++面试高级篇——内存管理(三、内存管理与操作系统)

本文分析了C++内存管理与操作系统机制的深层关联。从new操作到物理内存分配的完整链路揭示了延迟分配、缺页中断等内核优化；探讨了TLB、NUMA架构对性能的影响，提出内存池预热、NUMA感知分配等优化策略；剖析了mmap零拷贝机制及其在C++对象构造中的限制；针对系统内存回收机制，给出了内存压力感知和信号安全处理方案。这些OS级内存知识对C++高性能编程和系统级调试具有重要意义，尤其在实时系统、图像处理等场景中，合理利用底层机制可显著提升程序性能与稳定性。

2025-11-10 13:48:59 662

原创 C++面试高级篇——内存管理(二、综合考查)

本文探讨了C++内存管理的三个核心问题：智能指针循环引用的解决方案、自定义内存池的设计与优化、以及Boost.Pool在OpenCV特征点管理中的应用。首先分析了std::shared_ptr循环引用的产生机制，提出使用std::weak_ptr的解决方案及其多线程安全性考；其次详细介绍了高性能内存池的设计原理，包括固定块管理、placement new构造和析构调用等关键技术；最后针对OpenCV高频创建KeyPoint的场景，阐述了Boost.Pool的内部机制、适用边界和线程安全优化策略。文章通过代码

2025-11-07 15:59:14 590

原创 C++面试高级篇——内存管理(一)

本文深入探讨了C++内存管理的优化策略，重点关注高频对象创建/销毁场景下的性能瓶颈及解决方案。主要内容包括：分析标准new/delete的性能问题：系统调用开销大、内存碎片、缓存局部性差和多线程竞争详细介绍placement new机制及其正确使用方法，强调必须手动调用析构函数对比shared_ptr与make_shared的区别，解释循环引用的危害及weak_ptr的解决方案系统讲解内存池设计：适用场景、基本实现思路、对齐要求、线程安全方案比较boost::object_pool与std::pm

2025-11-07 15:36:28 1042

原创记录win10/win11安装docker desktop全过程

windows docker安装详解

2025-06-10 11:37:11 2536

原创深入理解交叉熵损失函数——全面推演各种形式

带你从不一样的视角综合认识交叉熵损失，阅读这篇文章，帮你建立其分类问题，对比学习，行人重识别，人脸识别等问题的联系，阅读这篇文章相信对你阅读各种底层深度学习论文有帮助。

2025-05-31 21:30:06 1425

原创 MCP Python技术实践

如果你经常与AI应用打交道，你可能会遇到这样的困扰：想让AI助手访问你的本地文件、连接数据库、或者调用某个API，但每次都需要复杂的配置和集成工作。而且，不同的AI应用有不同的集成方式，维护起来十分麻烦。Model Context Protocol（MCP）就是为了解决这个问题而诞生的。简单来说，MCP是一个标准化的协议，它就像是AI应用和外部数据源之间的"通用接口"。想象一下，如果所有的电子设备都需要不同的充电接口，那该多么麻烦。

2025-05-31 21:14:50 1606

原创《三维点如何映射到图像像素？——相机投影模型详解》

本文系统梳理了3D视觉中的投影变换全流程，详细讲解了从世界坐标系到相机坐标系再到像素坐标的转换过程。主要内容包括：1）四大核心步骤：刚体变换（世界→相机坐标系）、透视投影（相机→归一化图像坐标）、内参变换（归一化→像素坐标）和图像后处理；2）相机坐标系的构建原理与旋转矩阵的数学推导；3）通过具体案例演示完整计算过程，包括存在夹角时的复合旋转处理；4）关键参数（内参矩阵、焦距、主点等）的物理意义和作用。文章通过可视化示例和数学推导相结合的方式，帮助读者透彻理解3D投影变换原理，避免实际应用中的常见错误。

2025-05-26 16:07:09 2382 1

原创从UNet训练到TensorRT部署：完整语义分割模型部署优化指南(windows版本)

本文详细介绍了从UNet模型训练到TensorRT部署的完整流程，涵盖了数据准备、模型训练、ONNX导出、TensorRT优化以及Python/C++推理实现等关键环节。通过TensorRT部署，我们能够显著提升模型的推理速度，满足实际生产环境对实时性的要求

2025-04-25 10:38:56 1828 1

原创 Python手把手搭建基于Deepseek大模型的本地知识库

在前面的文章，我介绍了基于LM studio的大模型部署和API调用，本文将介绍一个实际的项目案例，即利用Python构建一个本地化的知识库来加深大家对于大模型本地化应用的理解。构建基于Python的大模型本地知识库成为提升信息检索效率和保障数据隐私的关键手段。对于企业和个人用户而言，这不仅能加速日常工作的信息查找过程，支持更明智的决策制定，同时也提供了一个深入学习最新自然语言处理技术的机会。

2025-04-24 20:16:11 2093

原创三角化与极几何

本文系统讲解三维重建与对极几何理论，包括相机模型、本质矩阵推导和极线约束原理。提供完整的Python实现方案，涵盖特征匹配、基础矩阵估计、相机姿态恢复和三角化等关键步骤。通过可视化分析极线几何，深入探讨本质矩阵计算方法及尺度问题解决方案，为三维视觉实践提供理论指导和代码参考

2025-04-21 15:31:40 1176

原创图像分割大模型SAM2 ONNX导出部署全流程

图像分割大模型的onnx部署简单部署流程

2025-04-15 15:56:17 2764 8

原创 LLM Studio本地部署deepseek的API调用，基于Python实现简易对话客户端

本教程将详细介绍如何使用LM Studio在本地部署DeepSeek大模型，并构建一个带图形界面的聊天应用。教程从模型导入到客户端开发，适合零基础用户跟随操作。

2025-04-14 11:49:39 1652

原创 CUDA编程面试高频30题

CUDA（Compute Unified Device Architecture）是由NVIDIA开发的一种并行计算平台和应用程序接口模型。它允许开发者利用NVIDIA GPU进行通用计算任务，而不仅仅是图形渲染。CUDA提供了一个编程模型，使得开发者可以通过C、C++或Fortran等语言编写程序，并在支持CUDA的GPU上运行这些程序以获得显著的性能提升。Warp是GPU执行的基本单位，通常包含32个线程。Warp内的线程以单指令多线程（SIMT）方式执行相同的指令流。

2025-03-21 10:11:57 1948

原创 CUDA编程基础

本文简要介绍了CUDA编程的核心概念与实践，包括内存层次结构、线程模型、核函数设计等关键知识点，并通过实例讲解了如何优化程序性能，如利用共享内存减少全局内存访问、合理配置线程块大小以充分利用GPU资源。此外，还提及了使用CUDA流实现异步执行及最新架构特性，为读者提供了一个全面了解CUDA编程的概览。

2025-03-20 16:40:36 1849

原创机器学习面试重点第二部分(动画版)

Fisher判别分析是一种监督降维方法，其核心思想是通过最大化类间距离与类内距离的比值，找到最优的投影方向，使得不同类别的数据在低维空间中尽可能分开。LDA是一种监督降维方法，其核心思想是通过最大化类间距离和最小化类内距离，找到最优的投影方向，使得不同类别的数据在低维空间中尽可能分开。PCA是一种无监督降维方法，其核心思想是通过正交变换将原始数据投影到低维空间，使得投影后的数据方差最大，从而保留尽可能多的信息。SVD是一种矩阵分解方法，其核心思想是将一个矩阵分解为三个矩阵的乘积，从而提取矩阵的主要特征。

2025-03-19 15:10:17 1194

原创机器学习面试重点第一部分(动画版)

自己整理了些面试常见的问题，然后尽可能使用直观的方式帮助大家记忆，后面会陆续介绍各个关键的基础知识，帮助大家校招和社招。目录一、KNN1. 原理问题1：KNN算法的核心思想是什么？问题2：KNN算法中距离度量有哪些常见方法？问题3：KNN算法中K值的选择对结果有什么影响？2. 实现问题1：KNN算法的实现步骤是什么？问题2：KNN算法的时间复杂度是多少？3. 优化与加速算法问题1：KNN算法的主要缺点是什么？如何优化？4. 代码实现5. 综合问题二、SVM1. 什么是支持向量机（SVM）？2. SVM如

2025-03-15 12:10:45 1420

原创三维重建基础——单视测量(第一部分)

齐次坐标通过增加一个维度来表示点。二维点(x,y)的齐次坐标为(x,y,1)。无穷远点的齐次坐标为(x,y,0)。关键点如果w!=0，则(x,y,w)表示有限点，等价于欧氏空间中的点(x/w,y/w)。如果w=0，则(x,y,0)表示无穷远点。无穷远点(x,y,0)的定义来源于投影几何的极限概念。当w→0时，点(x,y,w)趋向于无穷远。数学推导考虑点(x,y,w)，当w→0时，x/w和y/w趋向于无穷大，因此(x,y,0)表示一个无穷远点。齐次坐标的作用。

2025-03-11 17:14:52 1779

原创深入解析相机标定：从数学原理到工程实践

参数物理意义未标定的后果标定后的精度提升f_xX方向等效焦距深度计算误差（比例性偏差）深度误差<0.1%c_x图像中心X坐标物体水平定位偏移中心定位误差<1像素k_1二阶径向畸变系数图像边缘弯曲（桶形/枕形）直线弯曲度<0.1像素p_1切向畸变系数图像倾斜变形角度偏差<0.1度采集图像：从不同角度拍摄标定板（建议15-20张）角点检测：提取标定板的角点坐标参数初始化：估计初始内参和畸变系数优化求解：最小化重投影误差，优化参数结果评估：计算标定误差，验证精度。

2025-03-08 11:59:23 1611

原创相机几何：从三维世界到二维图像的映射

本文将带领读者开启一场独特的三维视觉工程之旅。我们不再止步于教科书式的公式推导，而是聚焦于如何将抽象的数学原理转化为可落地的工程实践。通过解剖相机的光学特性、构建成像数学模型、解析坐标系转换链条，直至亲手实现参数标定代码，我们将层层剥开三维视觉系统的核心构造。在这场旅程中，您将理解为何简单的针孔模型能衍生出自动驾驶的感知算法，掌握透镜畸变参数如何影响AR眼镜的虚实配准精度，洞悉坐标系转换矩阵怎样支撑工业机器人的空间定位。我们特别设计了"理论-建模-代码"三位一体的讲解框架，让OpenCV中的标定函数不再

2025-03-06 22:01:15 1366

空空如也

空空如也