机器学习
文章平均质量分 94
JuyaoHuang
北京邮电大学在读本科。博客链接:juayohuang.top
联系邮箱:mail@juayohuang.top
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
PyTorch 核心数据结构:Tensor 详解与操作指南
本文系统介绍了 PyTorch 核心数据结构 Tensor。内容涵盖 Tensor 的创建、属性查看、索引切片及形状变换(如 reshape)等基础操作。重点详解了各类数学运算(逐元素、线性代数)、广播机制规则,以及与 NumPy 的互换和 CPU/GPU 设备移动方法。该文档旨在为 PyTorch 开发者提供详尽的语法参考和操作指南。原创 2025-12-02 23:11:15 · 889 阅读 · 0 评论 -
PyTorch 万字长文深度解析:核心架构原理与非线性激活机制
本文深入解析 PyTorch 框架的底层逻辑。通过“机器组装”比喻,将 Tensor、Autograd、nn 等核心模块映射为从原材料到调校引擎的完整训练系统。明确了 PyTorch 专注模型构建与 Pandas/NumPy 负责数据处理的分工边界。重点探讨激活函数的本质,阐述非线性变换如何赋予模型“万能逼近”能力,并提供了隐藏层(如 ReLU)与输出层(如 Softmax)的具体选型指南,为构建高效神经网络提供理论依据与实践策略。原创 2025-12-02 22:53:25 · 665 阅读 · 0 评论 -
一文读懂机器学习损失函数:从MSE到交叉熵
本文深入解析了机器学习中指导模型优化的核心指标——损失函数。文章首先通过老师与学生的生动比喻,直观阐释了损失函数的工作机制。随后,详细对比了分类任务(如二元/多类交叉熵)与回归任务(如MSE、MAE、Huber)中主流损失函数的数学原理、优缺点及对异常值的敏感度。最后,文章提供了 Scikit-learn 和 PyTorch 的代码实现示例,帮助开发者根据具体场景(如数据是否包含噪音、标签是否互斥)选择最合适的损失函数,从而有效提升模型预测性能原创 2025-12-01 14:30:06 · 1166 阅读 · 0 评论 -
全景解析:机器学习核心评价指标详解(分类、回归与聚类)
训练出的模型究竟表现如何?仅看准确率往往会产生误导。本文系统性地梳理了机器学习三大任务的核心评价指标:分类模型(从混淆矩阵到 F1-Score 的权衡)、回归模型(MAE、RMSE 与 R² 的差异分析)以及聚类模型(轮廓系数等无监督评估方法)。文章不仅深入浅出地解释了各指标的数学原理与适用场景(如数据不平衡处理),还提供了基于 Scikit-learn 的 Python 代码示例,助你快速上手实战,科学量化模型性能,在实际业务中做出正确决策。原创 2025-12-01 15:16:05 · 604 阅读 · 0 评论 -
解锁数据洞察:Matplotlib 核心绘图技巧与 Pandas 联动实战
Matplotlib 是 Python 数据可视化领域的奠基石。本文不只是简单的函数罗列,而是从“一切皆对象”的核心理念入手,带你彻底搞懂 Figure 与 Axes 的底层逻辑,掌握官方推荐的面向对象绘图接口。内容涵盖从基础折线图到热力图的绘制、细节定制、多子图布局及图片导出,并深入讲解了与 Pandas 的 .plot() 方法的高效联动。通过本指南,你将能够灵活创建高质量图表,并为未来学习 Seaborn 等高级可视化库打下坚实基础。原创 2025-11-30 12:31:14 · 806 阅读 · 0 评论 -
Pandas 核心技术指南:从入门到数据分析实战(万字长文解析)
本文是 Python 核心数据分析库 Pandas 的全面教学指南。文章从其核心数据结构 DataFrame 和 Series 入手,系统讲解了数据读取、查看、索引、清洗(缺失值与重复值处理)、转换、分组聚合及数据可视化等关键操作,是高效处理和分析表格数据的必备手册原创 2025-11-30 12:15:45 · 1323 阅读 · 0 评论 -
万字小长文Numpy语法介绍
本文全面介绍了 Python 科学计算的基石——NumPy 库。文章从 NumPy 的核心数据结构 N 维数组 (ndarray) 出发,阐述了其相比原生 Python 列表在性能和内存上的巨大优势。重点讲解了向量化计算与广播机制,这是 NumPy 实现高性能运算的关键。内容涵盖了数组的创建、高级索引与切片(特别是布尔索引)、通用函数、数学与统计方法,以及在线性代数和信号处理中的应用。掌握 NumPy 是通往 Pandas、Scikit-learn 等高级数据分析工具的必经之路。原创 2025-11-29 12:35:04 · 952 阅读 · 0 评论 -
两万字长文带你快速入门并掌握机器学习
本文系统阐述了机器学习的完整实施框架,旨在为AI学习者奠定基础。内容涵盖从问题定义、数据清洗与EDA、特征工程,到模型选择、训练(含损失函数与梯度下降)、评估及部署监控的全流程。文章深入解析了分类、回归与聚类三大类算法及其评价指标(如精确率、F1分数),并重点讲解了过拟合处理(正则化)、数据不平衡(SMOTE)等关键技术。通过结合Scikit-learn与PyTorch代码示例,提供了从理论到实践的详细指导。原创 2025-11-29 12:05:08 · 893 阅读 · 0 评论
分享