- 博客(78)
- 问答 (5)
- 收藏
- 关注
原创 派森先生与马斯小姐的故事⑮:决策树与集成学习的智慧之林
派森先生、马斯小姐和分析师步入了一片枝繁叶茂的森林。派森先生指着不远处一棵巨大的老树:“而当多棵决策树联手时,它们就变成了更厉害的军团,比如。派森先生补充:“构建决策树的过程中,通常使用一些指标来衡量划分的好坏,比如:””马斯小姐笑着说,“这里孕育着机器学习中最直观也最强大的模型之一——”派森先生兴奋地说。每一个问题就是一条分支,最终的叶子节点给出“买”或“不买”的预测。策略,通过组合多棵树,提升预测的稳定性与准确率。,通过不断修正前一棵树的误差,逐步提升整体性能。
2025-04-27 16:33:17
705
原创 派森先生与马斯小姐的故事⑬:正则化之森与过拟合的迷雾
没错,”派森先生微笑着回答,“但是如果模型在训练集上表现太好,甚至记住了噪声和异常值,它就会对新数据不适用,这就是。当三人走出正则化之森,他们发现远处的天空突然亮了起来,出现了一道巨大的光束,光中隐隐可以看到一只金色的剑,剑上刻着“”马斯小姐指向前方,“在这里,模型过度‘学习’数据,导致它看起来非常强大,但在新数据上却表现糟糕。派森先生兴奋地说:“下集,我们就要进入支持向量机的魔法之境,学习如何用它来解决更复杂的分类问题!派森先生解释:“λ 是正则化强度的控制参数,越大,惩罚越强,越能抑制模型的复杂性。
2025-04-24 08:27:12
710
原创 派森先生与马斯小姐的故事⑫:梯度之谷里的线性修炼术
用计算梯度每次更新 w,让模型更接近真实值损失下降曲线帮助判断收敛情况派森先生提醒:“你可以尝试不同的学习率,看看什么是过大导致震荡,什么是太小训练太慢。马斯小姐补充:“还可以尝试提前停止(early stopping)、批量更新、甚至引入动量……那是更高级的魔法,我们之后会遇到。
2025-04-21 08:28:44
404
原创 [特殊字符] 派森先生与马斯小姐的故事⑪:线性回归魔法阵与预测术的起源
派森先生举起法杖:“线性回归虽然简单,但用梯度优化却是现代机器学习的根——下一篇,我们要手写梯度法优化线性模型。”马斯小姐双手交握,语气庄重,“这是机器学习世界最早也是最基础的预测术。”马斯小姐轻轻一笑,“我们可以用正规方程直接解出来。这就是线性回归的闭式解,不用迭代,一次求出最优权重 ww。XX:输入数据(矩阵,每一行是一个样本,每列是一个特征)。“其实,”派森先生语气一转,“当样本很多、特征很多时,。的领地,但这次,是为了解决真实的数据建模问题。马斯小姐语气变得严肃:“接下来,我们将再次踏入。
2025-04-18 08:40:14
783
原创 派森先生与马斯小姐的故事⑩:奇异之门与矩阵重塑术
马斯小姐在空中写出一个神秘公式:A=UΣVTA:任意 m×n 的原始矩阵U:左奇异向量构成的正交矩阵(表示行的结构)Σ:对角矩阵(奇异值,表示“重要性”)VT:右奇异向量的转置(表示列的结构)派森先生解释:“简单说,我们把原始矩阵分解成三部分:结构、强度、方向。就像把一幅图分解成主色调、浓度和纹理。
2025-04-17 09:16:17
653
原创 派森先生与马斯小姐的故事⑨:特征之塔与维度的秘密
派森先生拍拍背包:“别怕,今天我们会告诉你,为什么特征值是数据降维、主成分分析(PCA)、图像压缩等神器的基础。“这是 PCA 的魔法场景,”她解释道,“我们通过计算协方差矩阵的特征值与特征向量,选出能保留最多信息的主方向。马斯小姐带分析师登上塔顶,一眼望去——一副“二维数据”被压成“一维主线”的画面出现在空中。对应两个方向(特征向量),其中第一个方向是“最重要”的(更大的 $\lambda$)分析师有点发懵:“听起来就很数学……“现在,”马斯小姐微笑着说,“让我们用 Python 打开特征塔的大门吧。
2025-04-16 08:16:25
762
原创 派森先生与马斯小姐的故事⑧:数组、向量与矩阵的魔法世界
今天,我们:理解了 Python 中的数组(array)是一切的基础;学会了用向量(vector)来表示方向、变化与数据特征;掌握了矩阵(matrix)的核心运算与应用;初窥了它们在机器学习与数据分析中的巨大作用!
2025-04-14 21:26:10
546
原创 派森先生与马斯小姐的故事⑦:拟牛顿法与共轭梯度法的优化秘籍
通过拟牛顿法和共轭梯度法,我们学习了如何在复杂的高维优化问题中提高计算效率。这两种方法分别通过逼近海森矩阵和选择共轭方向来加速收敛,显著减少了计算量。
2025-04-11 13:26:35
623
原创 派森先生与马斯小姐的故事⑥:最速下降法与牛顿法的优化之旅
通过最速下降法和牛顿法,我们看到了在优化问题中如何通过不同的策略加速收敛,找到最优解。最速下降法通过动态调整步长来提升效率,而牛顿法则利用了二阶导数信息,显著加速了优化过程。在更复杂的优化问题中,常常需要用到更加智能的优化方法,例如拟牛顿法和共轭梯度法。这些方法将在多维和大规模问题中发挥巨大作用。
2025-04-10 08:23:42
475
原创 派森先生与马斯小姐的故事⑤:拉格朗日之湖与约束优化的奥秘
今天,我们通过拉格朗日乘子法学习了如何在约束条件下进行优化。通过引入拉格朗日乘子,我们可以在同时满足约束条件的情况下,找到最优解。在优化领域中,还有很多有趣的算法等待我们探讨。我们将一起学习如何使用最速下降法和牛顿法等更加高效的优化方法,帮助我们解决更复杂的优化问题。
2025-04-08 09:23:18
1047
原创 [特殊字符] 派森先生与马斯小姐的故事④:泰勒魔塔与函数近似魔法
今天,我们通过泰勒展开式学习了如何用局部的导数信息来逼近复杂的函数,同时也通过 Python 代码实践了这个概念。
2025-04-08 08:22:47
724
原创 派森先生与马斯小姐的故事:用 Python 学数学的冒险启程
在数据分析的王国里,住着两位奇妙的角色:一位是派森先生,另一位是马斯小姐。派森先生其实就是Python语言的化身,他像一位魔法师,擅长处理各种数据和自动化任务;马斯小姐则代表数学本身,掌管着概率、公式和逻辑推理的力量。两人本该是天作之合的搭档,可是在这个王国中,不少新人分析师对马斯小姐敬而远之。
2025-04-05 19:04:00
818
原创 Excel商务数据分析|数据分析引领商业变革。
重点提炼:1. 商务数据分析与商务数据分析流程2. 商业模式画布3. 常见电商平台数据分析指标在我们学习之前呢,请各位小伙伴思考这样一个问题首先,初次打开APP注册完成后,会产生注册数据;进入APP搜索、浏览商品时,会产生行为数据;购买商品之后,产生相应的交易数据;收货后满意与否会产生用户评价数据;不满意情绪致使用户转换其他同类APP,会产生外部数据,这里的“外部”是相对于当前APP而言。这些都是个人行为,当有一群人发生上述行为时,就会产生行业数据。
2025-02-12 17:05:48
238
原创 数据科学之数据管理|统计学
什么是统计学:统计学是通过搜索、整理、分析、描述等手段,以达到推断所测对象的本质,甚至预测味蕾的一门综合性科学为什么要学习统计学统计思维:用相对简单的特征;来尽量准确第刻画复杂的真实情况,并且允许对不确定性进行量化应用范围广泛:统计学几乎在所有领域里发挥着重要作用。什么是描述统计:如何取得反映客观现象的数据(数据的收集)通过图表形式对数据进行加工处理和可视化通过概括与分析得出反映客观现象的规律性和数量特征、数据的有效性和可靠性:有效性:实际测量的对象=希望测量的对象。
2025-02-12 16:41:55
514
原创 数据科学之数据管理|python for office
python操作word,我们主要是用的是python-docx库。官方文档:为了使用python-docx我们需要安装。安装命令:pip install python-docx介绍python-pptx 是一个用于创建、读取和更新 PowerPoint (.pptx) 文件的 Python 库。典型用途是从动态内容(例如数据库查询、分析输出或 JSON 有效负载)生成 PowerPoint 演示文稿,可能是响应 HTTP 请求并下载生成的 PPTX 文件作为响应。
2025-02-12 16:39:56
715
原创 数据科学之数据管理|python for Excel
openpyxl是一个用于读写 Excel 2010 及更高版本的 xlsx/xlsm/xltx/xltm 文件的 Python 库。它允许您通过 Python 脚本创建、读取、修改和保存 Excel 文件,这对于数据分析、自动化办公和报告生成等任务非常有用。
2025-02-12 16:38:25
492
原创 数据科学之数据管理|NumPy数据管
NumPy是Python中科学计算的基础包。它是一个Python库,提供多维数组对象,各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种API,有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数,基本统计运算和随机模拟等等。NumPy包的核心是ndarray对象。它封装了python原生的同数据类型的n维数组,为了保证其性能优良,其中有许多操作都是代码在本地进行编译后执行的。
2025-02-12 16:37:06
123
原创 数据科学之数据可视化——Tableau可视化词云图
词云图,也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频抵质的文本信息,使得浏览者只要一眼扫过文本就可以领略文本的主旨。
2023-06-15 21:57:51
884
原创 数据科学之数据可视化——Tableau可视化气泡图
大家好,我是大鹏,今天给大家分享一个新的一个知识“气泡图”。气泡图就是用气泡的大小和颜色表示不同的数据。
2023-06-14 22:57:31
544
原创 小姐姐们,一起学数据分析
或许你们会觉得这听起来有点枯燥和无趣,但是请容我来告诉你们,学习数据分析不仅仅是一项技能,更是给你的未来增添了无限的浪漫与激情!想象一下,你们与其他领域的专业人士携手,为解决实际问题贡献智慧与力量,这种合作的火花将点燃你们的热情!🌐 世界的舞台,你的表演:数据分析是一种通用技能,可以让你们的职业之路穿越国界,走向国际舞台。学习数据分析,我们将获得超越文化和地理限制的能力,开启更广阔的职业道路,实现属于自己的梦想!女生们,你们拥有睿智的头脑和敏锐的洞察力,学习数据分析将让你们成为职场上的明星。
2023-06-13 20:45:09
251
原创 数据科学之数据可视化——Tableau可视化树形图
使用树形图可以在嵌套的矩形中显示数据,可以使用维度定义树形图结构,使用度量定义各个矩形的大小和颜色。树形图是一种相对简单的数据可视化形式,可通过具体视觉吸引力的格式提供分析见解。
2023-06-07 21:43:23
523
原创 数据科学之数据可视化——Tableau可视化基本表和凸显表
可视化基本表和凸显表都是数据分析的工具,用于将数据可视化展示,以便更加直观地理解和分析数据。
2023-06-06 18:48:39
487
原创 数据科学之数据可视化——Tableau可视化饼图
Tableau 是一款数据可视化软件,可以帮助用户将数据转化为清晰易懂的图表和图形。选择饼图模板:在 Tableau 左侧的“工作表”选项卡中,选择“显示标记”并选择“饼图”。准备数据:将您需要绘制的数据整理成表格形式,列出各个类别或部分的数量或比例。拖拽数据:将您整理好的数据拖拽到 Tableau 的“行”和“列”区域中。打开 Tableau:打开 Tableau 软件并导入数据。设计布局:您可以将饼图调整为所需的大小并添加任何标签或注释。完成饼图:完成饼图后,您可以保存并分享您的可视化结果。
2023-05-26 22:10:15
1126
原创 数据科学之数据可视化——Tableau可视化数据预处理
数据预处理的必要性:改进数据的质量,有助于提高其后决策过程的精度和性能;高质量的决策必然依赖于高质量的数据,数据预处理是知识发现过程的重要步骤。我是大鹏,今天给大家分享Tableau可视化数据预处理。
2023-05-24 21:36:58
381
原创 数据科学之数据可视化——Tableau可视化直方图
大家好,我是大鹏,今天给大家分享一个新的知识——直方图。我们先简单的认识一下直方图,直方图主要是用来呈现数据的分布情况的,直方图的矩形的高度表示每一组的频数或频率,宽度表示组距。注:直方图的绘制先要创建“数据桶”(右键“评分”>>创建>>数据同桶),数据桶用于设定组距。
2023-04-11 20:04:29
801
空空如也
请求帮我看看第八题第九题
2021-11-05
新手写码属实好痛苦自学好难
2021-10-28
练习题不会啊,求指点
2021-10-15
一道数组练习题请求找错
2021-10-28
代码遇到了小问题,重复的怎么扣。在线求解
2021-10-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
5