
程序猿之机器学习
文章平均质量分 90
主要是建立起机器学习的知识网络体系发现自己的不足
夏驰和徐策
一个喜欢打游戏的计算机专业学生;这是我的GitHub:https://github.com/XiaChiandXuce
展开
-
[特殊字符] 吴恩达机器学习 - 梯度下降
梯度下降是一种迭代式最优化方法,用于在连续可导函数中找到局部最小值(在凸函数中也即全局最小值)。给定代价函数 J(θ)J(\theta)J(θ),参数更新公式如下:其中:θj\theta_jθj:模型的第 jjj 个参数α\alphaα:学习率(Step Size)∂∂θjJ(θ)\frac{\partial}{\partial \theta_j} J(\theta)∂θj∂J(θ):对第 jjj 个参数的偏导数(即梯度分量)原创 2025-04-04 19:14:48 · 422 阅读 · 0 评论 -
[特殊字符] 吴恩达机器学习 - 代价函数(Cost Function)全解析
在监督学习中,模型的任务是“从输入预测输出”,而我们需要有一个“评价标准”,来衡量模型当前的预测表现到底好不好。衡量模型输出与真实标签之间差距的函数。严谨的说:在所有监督学习问题中,目标是通过已有样本构造一类函数 hθ(x)h_\theta(x)hθ(x),使其在未见数据上具有良好的泛化能力。显然,需要一个度量指标来判断模型在已知样本上的“表现”,即衡量预测值 hθ(x(i))h_\theta(x^{(i)})hθ(x(i)) 与真实值 y(i)y^{(i)}y(i) 之间的偏离程度。原创 2025-04-04 09:37:40 · 541 阅读 · 0 评论 -
[特殊字符] 吴恩达机器学习 - 线性回归
线性回归是机器学习中最基础也最经典的模型之一,用来解决这样的问题:给定一些输入变量 x,我们能否通过一个“公式”去预测输出变量 y?线性回归(Linear Regression)是机器学习中最基础、最重要的一类模型,用来建模“输入特征 $x$ 与输出目标 $y$ 之间的线性关系”。它试图寻找一条直线,使得所有训练数据点尽可能贴近这条线。线性回归就是“让你画出那条最贴近现实的数据趋势线”比如:根据房子的面积来预测它的价格;根据学习时间来预测考试成绩;根据身高预测体重。原创 2025-04-03 10:40:13 · 904 阅读 · 0 评论 -
9.1 聚类任务
聚类是指:将一组无标签的数据样本,自动划分为若干个不重叠的子集,每个子集称为一个簇(cluster),簇内的数据应当彼此相似,而簇间的数据则应当差异较大。比如,我们拿到一堆不同特征的西瓜数据,不知道每个瓜的类型,但希望能将它们划分为“浅色瓜”和“深色瓜”、“有籽瓜”和“无籽瓜”这样的类别。这时,聚类算法就能派上用场,它会根据瓜的各种特征(颜色、大小、纹理等)自动将其分为若干簇。至于这些簇到底代表什么含义,需要我们人类去解释和命名——这正是聚类的魅力所在。原创 2025-04-02 19:56:14 · 470 阅读 · 0 评论 -
[特殊字符] 吴恩达机器学习 - 非监督学习
非监督学习就是:在无标签中找结构、在混乱中找模式、在未知中重建逻辑。👉 下一篇我们将讲解“异常检测”或“聚类算法实战”,你想看哪一个?欢迎留言!原创 2025-04-02 19:53:50 · 769 阅读 · 0 评论 -
[特殊字符] 吴恩达机器学习 - 监督学习
在机器学习的世界里,监督学习(Supervised Learning)是我们踏入智能预测的第一道大门。给定输入和输出样本,通过学习,建立一个能够对新输入做出预测的模型。更直白一点:就像教一个孩子识字,我们告诉他“这个是‘狗’、那个是‘猫’”,教多了,他就能自己看图说话。在数学形式上,我们拥有一个训练数据集:我们要学习一个函数 $h_\theta(x)$,让它能尽可能接近真实输出 $y$。有输入、有输出、有规则训练 = 调整规则参数最终目标 = 在未见过的新数据上做出准确判断。原创 2025-04-02 19:35:27 · 533 阅读 · 0 评论 -
1.4 归纳偏好
归纳偏好指的是:算法在面对多个与训练数据一致的模型时,它更偏向选择哪类模型的“倾向性”。它是算法内在的一种“价值观”或“选择偏好”。比如:有的算法偏爱“特殊规则”(尽可能详细、具体);有的算法偏爱“通用规则”(更具概括性);有的算法偏爱“结构简单”的模型。这就像人做决策时会凭经验、直觉、信念做判断一样,算法也需要“倾向”去打破等价模型的僵局。没有归纳偏好的算法会怎样?它在训练集等价的多个模型之间犹豫不决,每次都随机选一个,那预测结果就毫无稳定性、也没有意义。类比对象对应概念。原创 2025-04-02 10:47:04 · 528 阅读 · 0 评论 -
1.3 假设空间
通过对假设空间的学习,我们希望最终获得一个具有良好泛化能力的模型,能够对未见过的样例做出正确的判断,而不仅仅是“记住”训练集中的样例。这种学习方式可以帮助我们建立一个强泛化能力的模型,处理更多的未见过的情况,并在实际应用中表现出色。原创 2024-10-10 12:39:10 · 945 阅读 · 0 评论 -
1.2 基本术语
这一节让我找到了数据集的较为精确且易懂的解释机器学习的核心在于通过数据学习出模型,这个模型帮助我们在新情况下做出预测。通过理解样本、数据集、属性、特征等基本术语,我们能够更好地理解学习算法是如何从数据中提取信息,并将其转化为对现实问题的解决方案。在接下来的学习中,这些概念将为我们奠定坚实的基础。原创 2024-10-04 14:16:08 · 956 阅读 · 0 评论 -
1.1 引言
今天在学习yolov8的训练过程中的时候发现了很多会的知识点比如:机器学习模型的整个生命周期——从数据摄取、模型训练到验证、部署和实际跟踪。这个生命周期我不记得了不得不开始重新学习机器学习,在学校的时候老师讲过这门课但是我大天朝的教学质量是世人皆知的,因此我准备把接下来的重点放在这一部分到机器学习模型的生命周期。古语云——工欲善其事必先利其器机器学习是一门致力于研究如何通过计算手段利用经验来改善系统性能的学科。原创 2024-10-04 13:48:12 · 788 阅读 · 0 评论 -
1.1 机器学习简介
机器学习(Machine Learning)是研究计算机如何模拟或实现人类的学习行为,以便获取新的知识或技能,并通过重新组织已有的知识结构来不断改善其自身性能。机器学习在人工智能中占据重要位置,是实现人工智能的关键途径之一。研究方向:机器学习是人工智能的一个研究方向,主要研究对象是人工智能算法,研究重点是如何在经验学习中改善具体算法的性能。自动改进:机器学习研究能通过经验来自动改进自身的算法,这使得计算机能够从数据中学习,不断提升其决策能力。数据驱动。原创 2024-08-28 09:42:51 · 2124 阅读 · 0 评论