- 博客(21)
- 收藏
- 关注
原创 一文讲通:数据建模、数据分析项目中爆火的SHAP图起源于什么思想?怎么绘制?怎么解读?
SHAP(SHapley Additive exPlanations)图的起源可以追溯到中的,由诺贝尔经济学奖得主于1953年提出。SHAP 图则是将这一理论应用于的一种方法。
2025-12-24 14:34:31
764
原创 神经网络1.0:感知机(Perceptron)--神经网络的原点!*详细图解+代数表达+示例数据=通俗易懂*
神经网络1.0:感知机(Perceptron)--神经网络的原点!*详细图解+代数表达+示例数据=通俗易懂*
2025-12-19 14:38:19
486
原创 Python分类问题进阶--构建均衡数据集,解决分类数据不平衡问题,从结构上提升模型准确率!!!
每篇文章都有详细的代码和数据集及较为完整的分析过程~欢迎关注哦~
2025-12-04 16:14:24
887
原创 Python算法建模进阶之--选对损失函数,让模型准确率飞起来!(——经典机器学习损失函数全景指南)
回归MSE是是线性回归回归MAE否(次梯度)否鲁棒回归回归Huber是中等鲁棒回归二分类BCE(LogLoss)是中等Logistic回归二分类Hinge Loss否(次梯度)否SVM二分类是极敏感AdaBoost多分类是中等Softmax分类器多标签BCE Sum是中等Sigmoid多标签多标签Focal Loss是低(可调)不平衡多标签度量学习是中等嵌入网络。
2025-11-28 11:07:22
307
1
原创 AI 是怎么“看”图的?——揭秘Python图像识别建模中的数据变形记
很多小伙伴的建模进行图像识别的过程中都会很好奇其中的数据转换是什么样子的,这篇文章就形象且具体的描述一下具体的图片是怎么变成一个分类结果的。
2025-10-24 15:04:38
450
原创 Python深度学习图像识别(可复现,附全部代码及数据集,Pytorch+GPU+CNN+Kaggle)
根据 CSV 标签文件和图像目录,构建有效样本列表(跳过缺失图像),并在读取失败时返回默认图像,提升鲁棒性。
2025-10-20 17:20:10
958
原创 Python回归预测进阶-目标变量对数化处理
当我们做回归建模时,目标变量(被预测的指标,比如房价 SalePrice)不符合正态分布时,通常会选择 对数化(log transform),原因主要有以下几个方面:很多现实中的数值(房价、收入、销售额、人口规模等)往往是 右偏分布(long tail):大多数值比较小少数值特别大(“豪宅”、“超级富豪”、“爆款商品”)右偏分布不利于建模,因为模型容易受极端值(outliers)的影响。对数化之后,大的值被“压缩”,小的值被“拉伸”,分布更对称,接近正态。📌 举例:房价从 50,000 到 750,00
2025-09-06 01:59:27
754
原创 Python回归预测建模(可复现,附全部代码、注释及示例数据集,House Prices+LightGBM+模型可解释性)
House Prices – Advanced Regression Techniques:这是 Kaggle 上颇受欢迎的经典回归竞赛,挑战你使用高级回归技术(如随机森林、梯度提升树等)来预测房价和练习特征工程。你可以访问该竞赛的概览页面(https://www.kaggle.com/competitions/house-prices-advanced-regression-techniques/overview)了解任务说明、数据集详情与竞赛规则。读入数据 → 读取train/test。观察数据 → 可
2025-09-06 01:49:58
476
原创 创建虚拟环境(Windows+linux)
有时项目需要 Python 3.8,另一个需要 Python 3.11。测试第三方库时,可以放在虚拟环境里,避免对系统环境造成不可逆的影响。适合团队协作,大家的运行环境一致,避免“我这能跑,你那报错”。虚拟环境只在项目目录/conda 环境下修改,不会影响系统。做科研/数据科学,需要频繁尝试不同版本的 ML/DL 库。在同一台机器上开发多个项目,每个项目依赖版本不同。精确记录虚拟环境依赖,换一台机器一键复现。虚拟环境允许你在一台机器上同时管理多个版本。1.已经安装anaconda。
2025-08-22 14:52:56
340
原创 Python分类建模进阶(二):根据分类问题及数据内部联系,切换其他模型,提升准确率(附完整代码及注释解读)
摘要:本文介绍了机器学习分类问题中两种常用模型——随机森林(RF)和LightGBM(LGBM)的核心原理与区别。RF采用Bagging并行训练多棵独立决策树,通过投票降低方差;LGBM采用Boosting串行训练,基于梯度优化逐步修正误差。在分类问题上,RF稳健适用于小数据集,LGBM则更适合处理大规模高维数据和复杂特征交互。文章还提供了完整的Python实现代码,帮助读者对比两种模型在实际分类任务中的表现差异,并指导如何根据数据特点选择合适的模型以提升预测准确率。
2025-08-19 17:46:56
2044
原创 Python建模优化中,如何避免调参中的“数据重叠”,如何消除“乐观偏差”?
🔎 数据重叠在哪里?⚠️ 数据重叠会带来什么后果?📌如何避免这种情况?
2025-08-18 15:36:00
362
原创 Python分类预测建模(附完整过程及代码,Titanic+随机森林)
Python分类预测建模(附完整过程及代码,Titanic+随机森林)新建一个notebook来运行我们的代码,步骤见这一篇。将notebook和数据文件放在一个文件夹下面。
2025-08-04 11:54:11
552
原创 Python零基础入门之Jupyter Notebook安装及使用
下载地址:https://www.anaconda.com/https://www.anaconda.com/
2025-07-30 11:27:00
146
原创 Python监控数据更新、提取数据、封装json、上传HTTP、定时结束
本项目用于持续监控某数据表的更新状态,当检测到数据更新完成后,自动从数据库中提取数据、封装成符合 API 要求的 JSON 格式,并通过 HTTP 接口上传
2025-07-08 16:44:16
272
1
原创 下载PHYSICAL REVIEW JOURNALS的TEX模板
使用texstudio投稿PHYSICAL REVIEW JOURNALStexstudio+texlive的安装aps physics期刊tex模板的下载合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入texstudio+texlive的
2021-08-13 00:10:16
2649
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅