- 博客(20)
- 收藏
- 关注
原创 机器人正向运动学
摘要:机器人正向运动学研究机械臂末端执行器相对于参考坐标系的位置和姿态,涉及连杆几何参数和关节变量。六自由度机械臂通过转动或平动关节连接刚性连杆,其中3自由度控制位置,3自由度控制姿态。采用Denavit-Hartenberg(DH)参数法描述连杆关系,通过连杆长度、扭角、距离和夹角四个参数建立坐标系变换。相邻连杆坐标系间的变换由四个基础变换矩阵连乘实现,最终构成完整的运动学方程。该方法为机器人运动分析提供了系统化的数学建模基础。
2025-11-04 08:43:29
867
原创 向量和矩阵范数
本文探讨了线性方程组的迭代解法,重点研究了迭代格式建立、收敛条件、收敛速度和误差估计等关键问题。通过引入向量和矩阵范数理论,系统阐述了不同范数的定义、性质及其相互关系,包括1-范数、2-范数、F-范数和无穷范数。特别分析了矩阵谱半径与范数的联系,证明了对称矩阵的2-范数等于其谱半径等重要结论,为迭代法的理论分析提供了数学基础。
2025-11-01 12:18:51
839
原创 卷积为何能精准识别图像
卷积神经网络能实现图像识别,关键在于其设计完美契合图像特性:1)局部连接捕获边缘等局部特征;2)参数共享实现平移不变性;3)多层卷积构建层次化特征(从边缘到语义);4)保留空间结构信息。这些特性使卷积能高效提取关键特征,跨越像素到语义的鸿沟。
2025-10-27 09:29:03
839
原创 深入解析CNN核心操作与参数设计
本文深入解析卷积神经网络(CNN)的核心操作机制,围绕特征提取与模型学习展开。主要内容包括:1)卷积操作的计算逻辑与参数设计,重点分析多通道处理及变体形式;2)激活函数的非线性特性及其适用场景;3)池化操作的空间降维与平移不变性实现;4)批归一化的标准化处理与训练推理差异;5)扁平化与全连接层的特征转换作用。文章通过详实的公式说明和参数计算,揭示了各操作间的协同机制,并对比分析了不同变体形式的适用条件,为CNN模型设计提供了技术参考。
2025-10-27 09:25:34
2299
原创 感知机:二分类的线性模型基石
感知机是一种基础二分类线性模型,由Frank Rosenblatt于1957年提出,采用"输入-加权求和-激活输出"的结构。其核心是通过学习特征权重和偏置,在特征空间建立分类超平面。模型包含输入层、权重、偏置和激活函数(如符号函数),通过梯度下降法更新参数以最小化分类误差。感知机虽然结构简单、计算高效,但仅适用于线性可分问题,且存在解不唯一等局限性。需注意与神经科学中的"感受野"概念区分。感知机是神经网络和支持向量机的基础模型。
2025-10-26 08:21:31
788
原创 卷积运算:从数学到AI的核心利器
卷积是一种关键数学运算,通过翻转、滑动、相乘、求和四个步骤实现函数间的加权叠加。它分为连续时间(积分)和离散时间(求和)两种形式,本质是加权平均和特征提取。在信号处理中用于滤波降噪,图像处理中实现模糊/锐化/边缘检测,更是卷积神经网络(CNN)的核心运算层,能自动提取图像的层次化特征。这种运算的普适性使其成为多领域的基础工具。
2025-10-26 08:14:37
295
原创 OpenCV入门:从零玩转图像处理
OpenCV是一个开源的跨平台计算机视觉库,支持图像处理、目标检测等任务。核心知识点包括:图像以numpy数组存储(BGR格式),基础操作如读写、显示、缩放、裁剪等;视频处理通过VideoCapture实现;常用功能包括色彩空间转换、绘图标注、图像滤波和边缘检测。建议结合实践案例学习,注意BGR与RGB格式转换问题,并掌握numpy数组操作。OpenCV适合传统视觉任务,复杂场景可结合深度学习。
2025-10-25 08:48:01
624
原创 YOLO目标检测标注全攻略
YOLO目标检测模型训练需要规范的数据集标注,核心要点如下:标注文件为TXT格式,每行包含类别索引、归一化坐标(中心点x/y、宽/高)。推荐使用LabelImg等工具自动生成标注文件,支持直接导出YOLO格式。标注规范要求边界框准确完整、类别一致、避免漏标或重复标注。后期需通过可视化脚本检查标注质量,并按比例划分训练集/验证集/测试集。规范的标注流程直接影响模型检测精度,需特别注意小目标标注和坐标归一化计算。
2025-10-25 08:43:03
1056
原创 揭秘爬虫:互联网数据的隐形猎手
网络爬虫是一种自动化抓取网页数据的程序,通过发送请求、解析数据和存储数据三个核心步骤工作。其应用广泛,包括搜索引擎构建、市场分析、业务自动化和内容聚合等。使用时需注意合法性,遵守robots.txt协议,尊重版权与隐私,并控制爬取频率避免恶意访问。爬虫技术为数据获取提供了高效手段,但必须遵循法律和道德规范。
2025-10-24 14:23:12
966
原创 Python入门指南:从零到精通
Python是一种简洁易学的解释型编程语言,具有丰富的第三方库和跨平台特性。基础内容包括变量与数据类型、运算符、控制流、函数定义等核心语法。Python支持模块化编程,可通过import导入内置模块或第三方库。文件操作、异常处理等实用技能也是必备基础。编程时应遵循PEP8规范,注重实践练习。掌握这些内容即可具备Python入门能力,为后续Web开发、数据分析等方向学习打下基础。
2025-10-24 14:17:54
1142
原创 内积空间的定义与性质
内积空间的基本概念与性质 本文介绍了内积空间的基本定义和重要性质。内积空间是在线性空间上定义了一种满足特定条件的二元运算(内积)的结构,实数域上的内积空间称为欧几里得空间,复数域上的称为酉空间。文中给出了几个内积空间的例子,包括向量空间、实连续函数空间和正定矩阵定义的空间。在内积空间中可以定义向量的正交性,正交向量组具有线性无关性。通过施密特正交化方法,可以将任意基转化为标准正交基。标准正交基的充要条件是过渡矩阵为单位阵,且向量在标准正交基下的坐标可以通过内积直接计算。
2025-10-23 17:49:24
1285
原创 线性空间:从基到子空间的全面解析
什么是线性空间?是一个元素(称为)的集合,这些元素可以进行和(乘以一个数,称为)两种运算,并且这些运算遵循一系列直观合理的规则。线性空间包含的三个要素是什么?集合,标量域(或),两种运算(和线性空间必须满足的八大公理?对于集合中的任意向量: () ++ (: 存在一个特殊的,使得对于任何向量,都有。: 对于任何向量,都存在一个,使得+ (-) =。: a() = a+ a: (a + b)= a+ b: a(b) =ab): 数字 1 作为标量时,满足 1。常见的线性空间有哪些?
2025-10-23 10:01:18
2967
原创 机器学习和深度学习
例如,要构建一个识别猫的机器学习模型,专家可能需要手动设计特征,比如“胡须的长度”、“眼睛的形状”、“毛发的纹理”等。深度学习模型(特别是神经网络)能够直接从原始数据(如图像的像素、音频的波形)中自动学习到多层次的特征表示。· 需要“手动”特征工程。· 例如,在识别猫的深度学习模型中,你只需要输入大量猫和不是猫的图片(像素数据)以及对应的标签。例如,决策树的规则、逻辑回归的系数都很容易理解和解释,符合人类的逻辑。· 在足够数据和支持下,对于图像、语音、文本等复杂任务,其性能可以远超传统的机器学习模型。
2025-10-21 22:00:50
269
原创 LRN局部响应归一化
对于一个点,LRN 会看它“前后左右”(实际上是“前后”的通道)的邻居的值。如果邻居的值很小,而它自己的值很大,那么它的相对重要性就会更加突出。· Layer Normalization / Instance Normalization / Group Normalization:这些是 BN 的变体,适用于不同的场景(如RNN、小批量训练、风格迁移等)。BN 不是在同一层内对通道进行归一化,而是在一个Batch内,对每个通道的所有神经元进行归一化(均值为0,方差为1)。效果 有限,不稳定。
2025-10-21 07:40:37
345
原创 目标检测技术演进:从传统到智能的变革
2008 年 DPM(可变形部件模型)作为传统方法巅峰,通过混合模型和困难负样本挖掘,在 VOC07 上 mAP 提升至 45%,其分治思想影响深远。在 Faster R-CNN 基础上增加实例分割分支,提出 ROI Align 消除量化误差,COCO 数据集上检测 AP 达 39.7%,同时解决分割任务。首次将 Transformer 应用于检测,通过匈牙利算法实现端到端匹配,消除锚框和 NMS 后处理,COCO mAP 达 42.0%,开创检测新范式。
2025-10-20 12:47:24
2131
原创 OOP编程:从概念到实战
面向对象编程是一种编程范式,基于“对象”的概念,对象包含数据(属性)和操作数据的方法(行为)。OOP 的核心思想是通过封装、继承和多态提高代码的可重用性、灵活性和可维护性。子类继承父类的属性和方法,实现代码复用和层次化设计。支持单继承(多数语言)或多继承(如 C++)。将数据和行为捆绑在一个单元(类)中,隐藏内部实现细节,仅暴露必要接口。通过方法重写(Override)和接口实现达成。提取共性特征形成抽象类或接口,忽略非本质细节。如需深入特定语言或模式,可进一步探讨具体实现细节。
2025-10-20 12:42:06
454
原创 Python入门必备:20个基础语法速览
Python使用缩进来表示代码块,通常使用4个空格。语句以换行符结束,但可以使用分号将多条语句写在同一行。注释以开头,多行注释使用三引号'''或"""。# 单行注释x = 1 # 语句'''多行注释'''
2025-10-20 12:40:39
449
原创 Python编程:10大优势让你爱不释手
Python拥有活跃的开发者社区,遇到问题时能快速找到解决方案(如Stack Overflow、GitHub),文档和教程资源丰富。Python是解释型语言,代码可在Windows、Linux、macOS等系统上无缝运行,只需安装对应平台的Python解释器。可通过C/C++扩展性能关键模块,或与Java(Jython)、.NET(IronPython)等语言交互。Python是开源语言,可自由使用和修改,企业级应用无需支付许可费用。用于Web开发),覆盖数据分析、人工智能、网络爬虫等领域。
2025-10-20 12:03:12
362
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅