
机器学习
文章平均质量分 87
机器学习
山海青风
这个作者很懒,什么都没留下…
展开
-
从零开始玩转TensorFlow:小明的机器学习故事 4
为了搞清楚神经网络到底是什么,小明先上网搜了一堆资料。神经元就像分拣员在物流中心,分拣员会接收到不同的包裹(输入),给它们贴上标签或挑选对应的目的地。计算机里的“神经元”也类似:它先把输入进行加权求和,再用激活函数来决定“要把信息传给下一层多少”。多层堆叠就像流水线如果物流中心只有一个分拣员(单层神经网络),它能处理的复杂度有限。但如果有多道工序,一层层分拣、再包装、再检查,最后才分配到最合适的区域,就可以更灵活地处理各种奇奇怪怪的包裹。第一层。原创 2025-02-23 12:31:05 · 1242 阅读 · 0 评论 -
机器学习入门实战 5 - 特征工程
✅ PCA 将会自动选择 n_components,保证尽可能少的特征保留 95% 以上的信息。下载本文使用的 train.csv 数据集文件。你是一名数据科学家,在一家房地产公司负责。原创 2025-02-17 19:44:05 · 867 阅读 · 0 评论 -
机器学习入门实战 4 - 基本模型
sklearn(Scikit-learn)是 Python 里最流行的机器学习库,用于构建、训练和评估机器学习模型。它基于 NumPy 和 pandas,提供了数据预处理、分类、回归、聚类、降维等功能。如果用训练数据评估模型,可能会得到 99% 准确率,但这只是“记住”了数据,并无法对新数据进行准确预测(过拟合)。特征工程是数据科学和机器学习中的关键步骤,目的是优化数据,使机器学习模型能更好地理解和学习数据的模式。✅ 逻辑回归能提供较快、稳定的分类,但可能无法捕捉复杂的非线性关系。原创 2025-02-16 14:56:52 · 577 阅读 · 0 评论 -
机器学习入门实战 3 - 数据可视化
Seaborn 是 Python 的一个高级数据可视化库,基于 matplotlib,用于创建更美观、统计学意义更强的图表。作为一名数据分析师,您受邀为环保组织提供一份全球气温变化与 CO₂ 排放趋势的可视化分析报告。通过数据可视化,我们将探索全球气候变化与人类活动的关系,看看数据能否回答这些问题!,说明 CO₂ 可能是全球变暖的重要因素。,尤其是过去 50 年加速。原创 2025-02-16 11:43:41 · 961 阅读 · 0 评论 -
机器学习入门实战 2 - 数据预处理
本文使用的是 train.csv,请下载后将其重命名为 house-prices.csv 方便代码使用。下载本文使用的 house-prices.csv 数据集。,会影响后续机器学习模型的效果。在开始处理数据之前,我们需要。房价数据中,不同的特征有。因此,我们的第一步是。:删除(如果影响不大)(适用于有顺序的类别)(适用于无顺序的类别)(中位数、None)原创 2025-02-15 20:10:27 · 1018 阅读 · 0 评论 -
机器学习入门实战 1 - 认识机器学习
在传统编程中,我们手动编写规则:💡 传统编程 = 规则(程序员写代码)+ 数据 → 结果而在机器学习中,程序会自动从数据中学习规律,不需要我们手动编写规则:💡 机器学习 = 数据 + 结果 → 学习出规律(模型)✅ 定义:机器学习模型在有标签的数据上学习模式,最终可以预测新数据的类别或数值。✅ 主要任务:✅ 示例📌 回归示例:模型学习面积和房价的关系,预测新房子的价格。📌 分类示例:垃圾邮件识别:✅ 定义:没有标签的数据,模型自动发现数据的结构。✅ 主要任务:📌 示例:✅ 定义:AI 通过试错学原创 2025-02-15 16:00:48 · 1205 阅读 · 0 评论 -
零基础入门机器学习 -- 第十一章机器学习模型的评估与优化
专门用来预测哪些交易是欺诈交易,哪些是正常交易。经过几周的训练,模型终于准备上线了!,你每天的工作就是盯着上百万笔交易,防止客户的信用卡被盗刷。在所有预测为“欺诈交易”的交易中,真正是欺诈交易的比例。“我的信用卡为什么被冻结?我只是买了一杯咖啡啊!在所有真正的欺诈交易中,模型成功找到的比例。老板听了一愣,赶紧叫助手去开香槟庆祝。于是,你们决定深入分析模型的表现。预测正确的交易占总交易的比例。所以,我们需要更深入的指标。在模型评估时,我们不能只看。来全面衡量模型的好坏。准确率: 0.986。原创 2025-02-15 13:41:13 · 955 阅读 · 0 评论 -
零基础入门机器学习 -- 第十章深度学习入门
当我们训练神经网络时,模型会随着训练轮次(epochs)不断学习,但怎么知道它是否真的在变聪明呢?model.fit(…) 的返回值 history 记录了每一轮训练的准确率和损失。如果 训练准确率高,但测试准确率低,说明模型过拟合了。,包含 60,000 张手写数字(0~9)的图片。测试准确率,表示模型在未见过的测试集上的表现。训练准确率,表示模型在训练集上的表现。如果曲线不断上升,说明模型在学习。如果有问题,欢迎继续提问!那么,让我们正式进入这个。,来观察模型的学习进度。,用于学习图片特征。原创 2025-02-15 11:30:17 · 1080 阅读 · 0 评论 -
零基础入门机器学习 -- 第九章机器学习项目实战
想象一下,你是某家房地产中介公司的数据分析师。你的老板找到你,说:“我们希望用数据来预测房子的合理价格,让买家和卖家都能得到公平的交易。所以,我们需要把文本转换成数值,让模型可以理解。为了更直观地对比三个模型的预测效果,我们可以绘制真实房价 vs. 预测房价的散点图。假设你准备买一套房子,它的价格是 100 万元,你觉得这个价格合理吗?🎯 建议:在你的数据上运行 df.head() 看看转换后的效果!🎯 建议:运行这段代码,看看你的数据是否有异常值!:如果你是房产专家,你会怎么预测房价?原创 2025-02-14 23:06:31 · 1067 阅读 · 0 评论 -
零基础入门机器学习 -- 第八章无监督学习与聚类
的思想:找到最经济、最有效的 K 值,而不是无限增加 K。确保 K-Means 不会受到特征数值范围的影响。帮助我们找到最佳的 K 值,使得分群更加合理。,就是把相似的数据自动分成不同的**“组”,如果不同特征的数据范围相差太大,可能导致。在 K-Means 里,我们需要决定。是最常见的聚类算法之一。,可以帮助商家更好地理解客户行为。应用 K-Means 聚类!✅ 通过 K-Means 进行。簇(Cluster)**。K-Means 计算的是。原创 2025-02-14 14:37:01 · 1044 阅读 · 0 评论 -
零基础入门机器学习 -- 第七章K近邻算法KNN
想象一下,你走进一个陌生的水果市场,看到一个从未见过的水果,你想知道它是什么。KNN(K-Nearest Neighbors,K 近邻)是一种。假设你在水果市场发现了一个未知水果,你想知道它是。你有一张参考表,里面是一些已知水果的。原创 2025-02-14 12:49:31 · 351 阅读 · 0 评论 -
零基础入门机器学习 -- 第六章支持向量机SVM
看下图,SVM 找到了最佳的分割线,并且保证“最靠近它的点”(支持向量)与分割线的距离最大化。你现在掌握了 SVM 的基本概念和实战!如果你有任何问题,可以留言讨论!支持向量机(Support Vector Machine, SVM)是一种。,这个任务就是要让计算机区分 0~9 之间的手写数字。(每个 8×8 图片变成一个 64 维的向量)。现在,我们用 Python 和 SVM 来进行。(相当于SVM中的“分割线”)把他们分开。原创 2025-02-14 06:03:05 · 548 阅读 · 0 评论 -
零基础入门机器学习 -- 第五章决策树与随机森林
💡 **你学会了吗?如果还有疑问,可以试着用你的生活案例来画一棵决策树!小王是一家银行的贷款审批经理,每天他的工作就是审核贷款申请。小王决定让机器自动学习这个“决策流程”。这就是**随机森林(Random Forest)**的思想。,一种可以让计算机自动做决策的技术。,让你完全理解决策树和随机森林,适合零基础学习者!是多棵决策树一起投票,提高准确性和稳定性。:即使某棵树预测错误,其他树能纠正它。🚀 现在,小王准备让计算机来训练一个。需要数据预处理、训练、测试和评估。:比单棵树表现更好,不容易过拟合。原创 2025-02-14 05:24:58 · 417 阅读 · 0 评论 -
零基础入门机器学习 -- 第四章分类问题与逻辑回归
如果数据集中正常邮件的数量远远多于垃圾邮件,模型可能会倾向于预测所有邮件都是正常邮件,从而得到较高的“假准确率”(即准确率看起来很高,但实际上垃圾邮件检测效果很差)。首先,我们需要加载 Kaggle 上的垃圾邮件数据集。机器学习模型无法直接理解文字,我们需要将。,如垃圾邮件 vs 正常邮件。✅ 添加更多垃圾邮件,提高样本数量。,如房价、温度、工资等。,尝试是否能提高效果。原创 2025-02-13 22:11:36 · 964 阅读 · 0 评论 -
零基础入门机器学习 -- 第三章第一个机器学习模型——线性回归
是 Python 机器学习的标准库,提供了各种算法和数据处理工具。是机器学习中最基础的算法之一,它用于研究两个变量之间的。,即一个变量(自变量)如何影响另一个变量(因变量)。,即预测值与真实值之间的偏差尽可能小。我们让计算机来学习这条直线,使得它能。在现实生活中,许多事情都遵循某种。,而房价可能更复杂(非线性)。线性回归的核心思想是找到一条。进行训练,并绘制预测结果。)**是机器学习的基本技能。可以快速实现训练和预测。✅ **数据预处理(如。有助于理解模型效果。原创 2025-02-13 16:55:49 · 579 阅读 · 0 评论 -
零基础入门机器学习 -- 第二章机器学习的基本流程
使用 Python 读取 CSV 数据、清洗数据、训练一个简单的逻辑回归模型。在机器学习中,数据是最重要的部分。:数据 → 预处理 → 选择模型 → 训练 → 评估。:只是简单演示,后续章节会更详细讲解!,我们需要清理数据,确保数据质量。(喜欢 / 不喜欢),我们选择。在真实应用中,我们会使用。的示例,帮助你快速体验。,后面章节会详细讲解。原创 2025-02-13 15:50:05 · 356 阅读 · 0 评论 -
零基础入门机器学习 -- 第一章什么是机器学习?
✅ 机器学习广泛应用于推荐系统、人脸识别、自动驾驶等领域。机器学习(Machine Learning, ML)是。:如果骗子用“免 费”代替“免费”就无法识别。规律,代替人工编写规则。原创 2025-02-13 12:58:15 · 1097 阅读 · 0 评论