
机器学习
文章平均质量分 92
算法金
资料在 算法金 公众号领 | 【算法金】 0 基础跨行转 AI 上岸,多个算法赛 Top;多次受邀为 211 高校 AI 实训 | 日更万日,让更多人享受智能乐趣
展开
-
算法金 | 这绝对是不一样的,独一无二的逻辑回归算法体验
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」原创 2024-07-16 23:44:34 · 519 阅读 · 0 评论 -
回归求助 & 教程分享
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」原创 2024-07-13 23:51:53 · 912 阅读 · 0 评论 -
算法金 | 推导式、生成器、向量化、map、filter、reduce、itertools,再见 for 循环
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」原创 2024-07-07 23:16:38 · 905 阅读 · 0 评论 -
算法金 | 一个强大的算法模型,GPR !!
GPR 的定义高斯过程回归(Gaussian Process Regression, GPR)是一种基于高斯过程的统计模型,用于处理回归问题。高斯过程是一种分布,每个样本点都遵循一个高斯分布,这使得 GPR 在处理数据的非线性关系时表现出色。GPR 的核心是利用高斯过程的性质,通过指定合适的核函数,对数据进行建模和预测。核心思想和原理GPR 的核心思想是通过高斯过程来描述输入数据的潜在函数,即假设数据来自一个多变量正态分布。核函数是 GPR 的关键,它决定了模型的平滑度、周期性等特性。原创 2024-07-06 23:49:58 · 1004 阅读 · 0 评论 -
算法金 | 平均数、众数、中位数、极差、方差,标准差、频数、频率 一“统”江湖
平均数,江湖人称“均值”,是一帮数字里的“老大”,它把一伙数字的总和给分了,分给每个数字一样多。就像是帮派里的老大,把抢来的金银财宝平均分给手下的兄弟们。众数,就是一帮数字里最“招人喜欢”的那个,出现次数最多的数字。好比在江湖里,最有名的大侠,被提及的次数最多。中位数,江湖上称之为“中间值”,就是一帮数字排成一列,站在队伍最中间的那个数字。如果数字的个数是奇数,那中间那个就是中位数;如果是偶数,那就取中间两个数字的平均数作为中位数。原创 2024-07-05 23:41:55 · 912 阅读 · 0 评论 -
算法金 | 我最常用的两个数据可视化软件,强烈推荐
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」预警:今天文章的描述可能会让你有点别扭;如感到不适,请及时停止在我行走江湖的行囊中,有两件利器,tableau与matplotlib,它们足以让我应对各种数据可视化的较量。tableau,乃是BI领域的名门正派,其可视化之术,与PowerBI不相上下。matplotlib,则是Python江湖中的一位侠客,以编程之力,绘制图表,既精妙又实用。防失联,进免费知识星球,直达算法金 AI 实验室。原创 2024-07-04 23:36:07 · 464 阅读 · 0 评论 -
算法金 | 欧氏距离算法、余弦相似度、汉明、曼哈顿、切比雪夫、闵可夫斯基、雅卡尔指数、半正矢、Sørensen-Dice
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」在算法模型构建中,我们经常需要计算样本之间的相似度,通常的做法是计算样本之间的距离。今天,一键拿下九种距离算法。走你~原创 2024-07-02 23:44:13 · 1409 阅读 · 0 评论 -
算法金 | 线性回归:不能忽视的五个问题
线性回归是一种统计方法,用于研究因变量 𝑌 和一个或多个自变量 𝑋 之间的线性关系。最小二乘法(OLS):线性回归通过最小化残差平方和(即观测值与预测值之间的差值的平方和)来确定最佳拟合直线。这种方法称为最小二乘法。假设前提:线性回归模型的应用依赖于一些关键假设,包括线性关系、同方差性、独立性和正态性。线性回归的本质在于通过假设因变量和自变量之间存在线性关系,并通过最小化残差平方和来确定最佳拟合模型。虽然这些假设在现实中可能并不总是严格成立,但它们提供了一个简单而有效的方法来分析和预测数据。原创 2024-06-30 23:53:31 · 758 阅读 · 0 评论 -
算法金 | 协方差、方差、标准差、协方差矩阵
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」原创 2024-06-29 23:23:56 · 1751 阅读 · 0 评论 -
超强,必会的机器学习评估指标
大侠幸会,在下全网同名[算法金] 0 基础转 AI 上岸,多个算法赛 Top [日更万日,让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。选择正确的验证指标就像选择一副水晶球:它使我们能够以清晰的视野看到模型的性能。在本指南中,我们将探讨分类和回归的基本指标和有效评估模型的知识。学习何时使用每个指标、优点和缺点以及如何在 Python 中实现它们。原创 2024-06-28 23:42:31 · 774 阅读 · 0 评论 -
资深博导:我以为数据预处理是常识,直到遇到自己的学生
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」在光谱学领域,数据预处理是不可或缺的一环。本文将基于 NIR soil 近红外光谱数据,运用 Python 语言进行数据处理,并通过图表直观反映预处理带来的变化。(数据集:后台回复 [ NIR soil ] 获取 )原创 2024-06-26 23:49:05 · 847 阅读 · 0 评论 -
算法金 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost 算法大全
决策树的定义:决策树是一种树形结构,其中每个节点表示一个特征的测试,每个分支表示一个测试结果,每个叶子节点表示一个类别或回归值。决策树的目标是通过一系列的特征测试,将数据分成尽可能纯的子集。决策树的原理:决策树通过递归地选择最优特征进行分割来构建。最优特征的选择通常基于某种度量标准,如信息增益、基尼指数或方差减少。每次分割都会将数据集分成更小的子集,直到满足停止条件(如达到最大深度或子集纯度)为止。集成学习是通过结合多个学习器的预测结果来提高模型性能的一种方法。原创 2024-06-25 23:38:36 · 1260 阅读 · 0 评论 -
算法金 | K-均值、层次、DBSCAN聚类方法解析
聚类分析(Clustering Analysis)是一种将数据对象分成多个簇(Cluster)的技术,使得同一簇内的对象具有较高的相似性,而不同簇之间的对象具有较大的差异性。这种方法在无监督学习(Unsupervised Learning)中广泛应用,常用于数据预处理、模式识别、图像处理和市场分析等领域通过聚类分析,可以有效地发现数据中的结构和模式,为进一步的数据分析和挖掘提供基础。例如,在市场分析中,聚类分析可以帮助企业将客户群体进行细分,从而制定更有针对性的营销策略。原创 2024-06-23 23:31:10 · 964 阅读 · 0 评论 -
算法金 | 统计学的回归和机器学习中的回归有什么差别?
统计学中的回归:用于解释和推断变量之间的关系,假设严格,模型简单,适用于小数据集。重点在于理解数据和变量关系,模型解释性强。机器学习中的回归:用于预测和优化,假设少,模型复杂,适用于大数据集。重点在于提高模型的预测性能,模型灵活性高。原创 2024-06-22 22:11:26 · 791 阅读 · 0 评论 -
算法金 | 奇奇怪怪的正则化
正则化是一种防止机器学习模型过拟合的技术过拟合是指模型在训练数据上表现良好,但在新数据上表现不佳。这会导致模型无法准确预测未知数据,从而降低模型的实用性通过添加额外的约束或惩罚项,正则化限制了模型的复杂度,使其在训练数据和未知数据上表现更一致例如,当我们使用线性回归模型时,正则化可以通过限制回归系数的大小,防止模型对训练数据的噪声过于敏感。原创 2024-06-21 23:22:50 · 894 阅读 · 0 评论 -
审稿人:拜托,请把模型时间序列去趋势!!
1.1 时间序列的定义时间序列是按照时间顺序记录的一系列数据点。常见的时间序列数据包括股票价格、温度记录、经济指标等。这些数据具有时间相关性,即前后数据点之间存在一定的依赖关系1.2 趋势的定义与分类趋势是时间序列数据中的一种长期变化模式。趋势可以是线性的,也可以是非线性的。上升趋势:数据点随时间增加而上升下降趋势:数据点随时间增加而下降平稳趋势:数据点随时间变化较小,保持稳定1.3 去趋势的基本概念去趋势是指从时间序列数据中去除长期趋势成分,使得数据更加平稳和易于分析。原创 2024-06-20 22:58:43 · 1374 阅读 · 0 评论 -
算法金 | 再见!!!梯度下降(多图)
梯度下降优化算法的概述,目的在于帮助读者理解不同算法的优缺点梯度下降优化算法是机器学习和深度学习中最常用的优化算法之一。它通过不断调整模型参数,使得损失函数的值逐渐减小,从而使模型逐步逼近最优解梯度下降法是机器学习和深度学习中最基础和常用的优化算法之一。通过不断调整模型参数,使得损失函数的值逐渐减小,梯度下降法能够帮助模型逐步逼近最优解。根据数据集和具体应用场景的不同,可以选择不同形式的梯度下降法,如批梯度下降法、随机梯度下降法和小批量梯度下降法。1. 批梯度下降法使用整个数据集计算梯度。原创 2024-06-19 22:53:09 · 1332 阅读 · 0 评论 -
算法金 | 一个强大的算法模型:t-SNE !!
t-SNE 是一种非线性降维技术,用于将高维数据映射到低维空间,以便进行可视化。它通过保持高维空间中数据点之间的局部相似性来生成低维空间的表示。这种方法特别适用于揭示复杂数据集中的模式和结构。原创 2024-06-18 23:07:50 · 1773 阅读 · 0 评论 -
李沐:用随机梯度下降来优化人生!
大侠幸会,在下全网同名「算法金」0 基础转 AI 上岸,多个算法赛 Top「日更万日,让更多人享受智能乐趣」今天我们来聊聊达叔 6 大核心算法之 —— 优化 算法。梯度下降优化算法是机器学习和深度学习中最常用的优化算法之一。它通过不断调整模型参数,使得损失函数的值逐渐减小,从而使模型逐步逼近最优解梯度下降优化算法的优点梯度下降优化算法的缺点梯度下降算法的改进为了克服上述缺点,研究人员提出了多种改进算法,如动量法、Adagrad、Adam等。这些改进算法在加速收敛、避免局部最优等方面有显著效果。原创 2024-06-17 22:53:31 · 1258 阅读 · 0 评论 -
算法金 | 一文看懂人工智能、机器学习、深度学习是什么、有什么区别!
人工智能(AI),简而言之,是让机器模仿人类的认知功能,如学习、解决问题和理解语言的科学和工程。AI旨在创造出能够执行任务且在某些情况下甚至超越人类能力的智能系统。机器学习是AI的一个分支,它允许软件应用程序变得更加精确地预测结果而无需显式编程。通过分析数据和识别模式,机器学习算法可以学习其执行任务的指令。2.1.1 从数据中学习的算法机器学习算法通过训练过程从提供的数据集中学习,并根据学习到的数据模式做出决策或预测。2.1.2 与传统编程的区别在传统编程中,程序员编写规则来处理数据并产生输出。原创 2024-06-16 16:36:38 · 912 阅读 · 0 评论 -
算法金 | 选择最佳机器学习模型的 10 步指南
在开启任何机器学习或数据科学项目的旅程前,明确项目的目标是至关重要的第一步。这个过程就像是定下你武学修行的目的,无论是为了自我提升、护村防敌还是挑战江湖榜首,清晰的目标将指引你的学习方向和进步。原创 2024-06-15 22:47:05 · 1047 阅读 · 0 评论 -
算法金 | 再见!!!K-means
什么是 k-means 算法k-means 算法是一种用于聚类分析的非监督学习算法。它通过将数据点划分为 k 个簇,使得每个簇中的数据点尽可能相似,而不同簇之间的数据点尽可能不同。这个算法的名称来源于其中的 k 个簇(clusters)和每个簇的均值(mean)。k-means 算法的工作原理初始化中心点分配样本到最近的中心点更新中心点迭代直到收敛下面我们来浅浅的感受一下,走你~原创 2024-06-14 21:39:18 · 972 阅读 · 0 评论 -
算法金 | 一个强大的算法模型,GP !!
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」高斯过程算法是一种强大的非参数机器学习方法,广泛应用于回归、分类和优化等任务中。其核心思想是利用高斯分布来描述数据的分布,通过核函数来度量数据之间的相似性。与传统的机器学习方法相比,高斯过程在处理小样本数据和不确定性估计方面具有独特的优势。接下来,我们将详细探讨高斯过程的基本原理、数学表述及其在机器学习中的应用,并提供相关的代码示范和实际案例分析。原创 2024-06-13 22:52:51 · 792 阅读 · 0 评论 -
深度学习最常用的 10 大激活函数数学原理及优缺点
激活函数(Activation Function)是一种添加到人工神经网络中的函数,旨在帮助网络学习数据中的复杂模式,是确定神经网络输出的数学方程式激活函数是神经网络模型重要的组成部分,俺们从激活函数的数学原理出发,详解激活函数的优缺点。文末总结处,看闻[激]起舞;Sigmoid函数是一种常用的激活函数,其数学形式为:它将输入的实数映射到(0,1)之间,常用于输出层的二分类问题,可以将神经网络的输出解释为概率。1.2 手动实现并可视化。原创 2024-06-12 23:59:44 · 802 阅读 · 0 评论 -
算法金 | 一个强大的算法模型,多项式回归!!
多项式回归是对线性回归的一种扩展,它通过添加多项式项来拟合数据中的非线性关系。其基本思想是将原始特征扩展为多项式特征,然后应用线性回归模型。原创 2024-06-12 21:00:00 · 1125 阅读 · 0 评论 -
算法金 | 一文彻底理解机器学习 ROC-AUC 指标
ROC 曲线,即接收者操作特征曲线,ROC曲线产生于第二次世界大战期间,最早用在信号检测领域,侦测战场上的敌军载具(飞机、船舰)。现在是是用来评价二分类模型性能的常用图形工具。它通过显示真阳性率(True Positive Rate,简称 TPR)与假阳性率(False Positive Rate,简称 FPR)之间的权衡来帮助我们理解模型的分类能力。AUC,即曲线下面积(Area Under Curve),是 ROC 曲线下面积的一个数值表示。它提供了一个定量的指标,用来衡量分类模型的整体表现。原创 2024-06-11 21:00:00 · 1741 阅读 · 0 评论 -
算法金 | A - Z,115 个数据科学 机器学习 江湖黑话(全面)
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」机器学习本质上和数据科学一样都是依赖概率统计,今天整整那些听起来让人头大的机器学习江湖黑话。原创 2024-06-10 16:20:28 · 880 阅读 · 0 评论 -
算法金 | AI 基石,无处不在的朴素贝叶斯算法
朴素贝叶斯分类器是一种基于贝叶斯定理的简单但强大的分类算法。它假设特征之间是独立的,即某一特征的出现与其他特征的出现没有关系。尽管这一假设在实际中很少成立,但朴素贝叶斯分类器在许多实际问题中表现非常出色。简直是神奇绝绝子~贝叶斯网络是一种表示变量之间条件依赖关系的有向无环图。它不仅可以用于概率推断,还能用于决策分析、因果推理等领域。贝叶斯网络的节点表示随机变量,边表示变量之间的条件依赖关系。贝叶斯推理是一种基于贝叶斯定理的推理方法,用于更新对某一事件的信念。原创 2024-06-10 12:50:14 · 1243 阅读 · 0 评论 -
算法金 | 只需十四步:从零开始掌握Python机器学习(附资源)
Python是一种解释型、高级、通用的编程语言。它支持多种编程范式,包括面向对象、命令式、函数式和过程式编程。Python拥有丰富的科学计算库,这些库为机器学习提供了强大的支持。深度学习在图像识别、语音识别、自然语言处理等领域取得了显著的成就。本节将介绍深度学习的基本概念,包括前馈神经网络、卷积神经网络(CNN)、循环神经网络(RNN)等。原创 2024-06-09 23:29:52 · 1297 阅读 · 0 评论 -
算法金 | LSTM 原作者带队,一个强大的算法模型杀回来了
LSTM 是一种改进的循环神经网络(RNN),专门用于解决传统 RNN 中的长期依赖问题。RNN 在处理序列数据时,能够利用前面的信息,但是当序列过长时,信息会逐渐丢失。而 LSTM 通过引入记忆单元(Memory Cell)和门控机制(Gate Mechanisms),有效地解决了这一问题。原创 2024-06-08 23:08:11 · 1483 阅读 · 0 评论 -
算法金 | 不愧是腾讯,问基础巨细节 。。。
大侠幸会,在下全网同名「算法金」0 基础转 AI 上岸,多个算法赛 Top「日更万日,让更多人享受智能乐趣」最近,有读者参加了腾讯算法岗位的面试,面试着重考察了基础知识,并且提问非常详细。特别是关于AdaBoost算法的问题,面试官问了很多。今天,我们就来和大家探讨一下 AdaBoost 算法的相关知识。原创 2024-06-07 22:15:57 · 1192 阅读 · 0 评论 -
算法金 | 再见!!!KNN
KNN算法,全称为K-Nearest Neighbors,是一种基于实例的学习算法,或者说是一种基于记忆的学习方法。它的核心思想是,通过一个样本的K个最近邻居的多数属于某个类别,来预测该样本的类别。原创 2024-06-06 21:15:00 · 2690 阅读 · 0 评论 -
算法金 | 读者问了个关于深度学习卷积神经网络(CNN)核心概念的问题
大侠幸会,在下全网同名[算法金] 0 基础转 AI 上岸,多个算法赛 Top [日更万日,让更多人享受智能乐趣]读者问了个关于卷积神经网络核心概念的问题,如下,【问】神经元、权重、激活函数、参数、图片尺寸,卷积层、卷积核,特征图,平均池化,全家平均池化,全连接层、隐藏层,输出层 【完整问题】神经元、权重、激活函数、参数、图片尺寸,卷积层、卷积核,特征图平均池化,全家平均池化,全连接层、隐藏层,输出层,这一堆的概念,他们之间分别由什么关联和区别,啊啊啊我嘎了~很好的问题,搞清楚概念很重要。原创 2024-06-06 20:45:00 · 1405 阅读 · 0 评论 -
算法金 | 一文读懂K均值(K-Means)聚类算法
2.1 监督学习与无监督学习的对比监督学习需要预先标记的输出结果来训练模型,常用于分类和回归任务。无监督学习不依赖于标注输出,而是通过分析数据的内在结构和关系来学习数据的分布或模式,聚类是无监督学习中的典型例子。2.2 K-Means算法简介K-Means算法通过迭代过程选择簇中心和划分簇来优化簇内距离,直到达到最优或满足停止条件。该算法只需要指定簇的数量 k,并对初始簇中心的选择敏感。2.3 K-Means的应用实例。原创 2024-06-05 22:30:00 · 2634 阅读 · 0 评论 -
算法金 | 10 大必知的自动化机器学习库(Python)
大侠幸会,在下全网同名[算法金] 0 基础转 AI 上岸,多个算法赛 Top [日更万日,让更多人享受智能乐趣]原创 2024-06-05 21:45:00 · 2367 阅读 · 0 评论 -
算法金 | 有史以来最详细的卷积神经网络(CNN)及其变体讲解!!!(多图)
卷积神经网络(Convolutional Neural Networks,CNN)是人工智能领域中一种重要的深度学习模型,被广泛应用于图像识别、目标检测、自然语言处理等领域。它的出现标志着计算机视觉和模式识别领域的重大进步,也推动了人工智能技术的发展。在这个前言部分,我们将简要回顾卷积神经网络的发展历程,探讨它的重要性,并引入接下来文章的主题和目的。卷积神经网络的发展可以追溯到上世纪80年代,但直到近年来随着计算能力的提升和大数据的普及,CNN才真正展现了其强大的能力。原创 2024-06-04 23:55:07 · 19759 阅读 · 0 评论 -
算法金 | 再见,PCA 主成分分析!
大侠幸会,在下全网同名[算法金] 0 基础转 AI 上岸,多个算法赛 Top [日更万日,让更多人享受智能乐趣]原创 2024-06-04 23:54:27 · 1515 阅读 · 0 评论 -
算法金 | 你真的完全理解 Logistic 回归算法了吗
大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」今日 178/10000。原创 2024-06-03 12:46:54 · 712 阅读 · 0 评论 -
算法金 | 人工智能的第一性原理是什么?
数学、物理不但是其他学科的基础,更是AI的基础。为什么要基于物理学研究AI基础理论?这是因为物理学是研究物质运动最一般规律和物质基本结构的学科,是自然科学的带头学科,其他各自然科学学科的研究基础都建立在物理学科之上,而且哲学与物理的关系也非常紧密。著名物理学家斯蒂芬·霍金(Stephen Hawking)在他的论著《大设计》(The Grand Design)第一页上就语出惊人地宣称“哲学已死”,因为“哲学跟不上科学,特别是物理学现代发展的步伐。在我们探索知识的旅程中,科学家已成为火炬手。转载 2024-06-02 17:41:06 · 232 阅读 · 0 评论 -
算法金 | 94 页论文综述 深度学习卷积神经网络(CNN):从基础技术到研究前景
大侠幸会,在下全网同名「算法金」0 基础转 AI 上岸,多个算法赛 Top「日更万日,让更多人享受智能乐趣」来源丨机器之心编辑丨算法金卷积神经网络(CNN)在计算机视觉领域已经取得了前所未有的巨大成功,但我们目前对其效果显著的原因还没有全面的理解。近日,约克大学电气工程与计算机科学系的 Isma Hadji 和 Richard P. Wildes 发表了论文《What Do We Understand About Convolutional Networks?》,对卷积网络的技术基础、组成模块、当转载 2024-06-02 16:57:05 · 188 阅读 · 0 评论