- 博客(8)
- 收藏
- 关注
原创 数据分析与数据挖掘
本文系统介绍了数据分析与挖掘的关键概念及技术流程。首先区分了数据分析(验证假设)与数据挖掘(发现模式)的差异,指出数据挖掘是数据分析工作流的重要环节。随后详细阐述了数据预处理的三大核心内容:数据质量评估(完整性、一致性等)、数据清洗技术(缺失值处理、噪声消除等)以及特征工程(特征选择/构建/提取)。文章还概述了常用分析方法(分类/关联/聚类/回归)和可视化工具Matplotlib,最后列举了多个实战案例(泰坦尼克分析、房价预测等)。全文构建了从理论到实践的完整知识框架,为数据分析工作提供了系统性指导。
2025-10-14 02:56:54
434
原创 PyTorch详解
PyTorch 是一个基于 Python 的开源机器学习框架,由 Facebook AI Research (FAIR) 团队开发,专注于提供灵活的动态计算图和高效的张量计算,尤其受到学术界和研究领域的广泛欢迎。
2025-04-03 19:13:40
1407
原创 关于 TensorFlow
TensorFlow 是一个由 Google Brain 团队开发的开源机器学习框架,用于构建和训练各种机器学习模型,尤其是深度学习模型。它提供了灵活的工具、库和社区资源,支持从研究原型到生产部署的全流程
2025-04-03 18:35:28
439
原创 Scikit-learn 常用函数及其用法
Scikit-learn 是 Python 中最流行的机器学习库之一,提供了从数据预处理到模型训练、评估和部署的全流程工具。下面我将详细分类介绍 scikit-learn 的核心功能及其用法。
2025-04-03 18:18:53
417
原创 LoRA微调BERT情感分析
LoRA本质上是一种通过低秩分解实现参数高效(parameter-efficient)的迁移学习技术,其加速训练是降低计算资源需求的副产品,而非直接优化计算量本身。
2025-03-31 16:24:24
374
原创 神经网络基础知识
神经网络(Neural Network, NN)是一种受生物神经系统启发的数学模型和计算系统,主要用于处理复杂的非线性关系,在模式识别、机器学习和人工智能等领域有广泛应用。它本质上是一种函数近似器,能够学习数据之间的映射关系。
2025-03-31 15:23:12
1512
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅