
Python机器学习
文章平均质量分 97
机器学习是以数据驱动的人工智能,通过算法和模型让计算机从数据中学习,进行模型训练和优化,做出预测、分类和决策支持。主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。本专栏介绍基于Python机器学习的相关算法与实现。
Francek Chen
征途漫漫,惟有奋斗!优快云大数据领域优质创作者,2024博客之星TOP47,阿里云社区专家博主,华为云云享专家。热爱学习大数据与人工智能的相关知识,专注Hadoop、Spark实战,打造了《大数据技术基础》《Python机器学习》等热门专栏,助力行业技术落地。多篇热文登榜TOP,开源项目解析广受好评。以代码为笔,记录成长;以博客为媒,传递价值。关注我,一起畅游于数据变化的世界中,发现更多精彩~~
展开
-
【机器学习 | 数据挖掘】离群点检测
本文首先介绍了离群点检测的相关概念和方法,接着详细讲解了离群点检测的具体方法,包括基于模型的离群点检测方法和基于聚类的离群点检测方法,最后在Sklearn中应用异常值的检测方法。原创 2025-01-14 09:00:00 · 2021 阅读 · 30 评论 -
【机器学习 | 数据挖掘】时间序列算法
本文首先介绍了常用的时间序列算法和时间序列的预处理,接着讲解平稳时间序列分析,包括AR模型、MA模型和ARMA模型,最后讲解基于ARIMA模型的非平稳时间序列分析。原创 2025-01-01 09:00:00 · 5278 阅读 · 57 评论 -
【机器学习 | 数据挖掘】智能推荐算法
本文首先介绍了智能推荐的概念、应用、评价指标,然后讲解了智能推荐常见的关联规则算法,包括Apriori和FP-Growth,最后讲解常见的协同过滤推荐技术,包括基于用户的协同过滤推荐和基于物品的协同过滤推荐。原创 2024-12-28 09:00:01 · 3320 阅读 · 53 评论 -
【机器学习-无监督学习】自编码器
本文介绍了无监督学习和深度学习中的重要模型之一——自编码器。讲解了自编码器的结构,并利用PyTorch库在手写数字数据集MNIST上实现自编码器,用自编码器提取图像的特征。原创 2024-10-28 09:00:00 · 2748 阅读 · 59 评论 -
【1024特辑 | 机器学习-无监督学习】EM算法
本文介绍了求解带有隐变量数据分布下的MLE问题的EM算法,动手实现了GMM拟合数据分布,讲解了一般情况下的EM算法及其收敛性。原创 2024-10-24 09:00:00 · 3540 阅读 · 70 评论 -
【机器学习-无监督学习】概率图模型
本文主要讲述了概率图模型的贝叶斯网络和马尔可夫网络,并动手实现了两者的应用,用朴素贝叶斯模型完成文本分类,用马尔可夫网络完成图像去噪。原创 2024-10-07 09:37:58 · 2827 阅读 · 69 评论 -
【机器学习-无监督学习】降维与主成分分析
本文介绍了数据降维的常用算法之一:PCA算法。数据降维是无监督学习的重要问题,在机器学习中有广泛的应用。利用特征分解进行PCA,动手实现了PCA算法,并使用sklearn实现PCA算法。原创 2024-10-01 10:27:22 · 2688 阅读 · 42 评论 -
【机器学习-无监督学习】聚类
本文主要介绍了k均值聚类算法和其改进版k-means++,并动手实现了k均值算法。然后学会使用sklearn中的Kmeans算法、层次聚类算法和DBSCAN算法。原创 2024-09-24 14:41:29 · 3279 阅读 · 46 评论 -
【机器学习-监督学习】朴素贝叶斯
本文介绍了贝叶斯原理以及朴素贝叶斯分类器,并动手实现朴素贝叶斯分类器,完成了垃圾信息的分类。然后学会使用sklearn中的朴素贝叶斯,并对三类朴素贝叶斯模型进行了比较。原创 2024-09-16 11:53:46 · 2729 阅读 · 48 评论 -
【机器学习-监督学习】集成学习与梯度提升决策树
本文主要介绍了集成学习的基本概念和3类不同的集成学习框架。包括自举聚合与随机森林、集成学习器和提升算法。各个框架各有优劣,面对不同的任务和条件限制时,我们应当根据具体情况选择合适的集成学习算法。原创 2024-09-11 21:05:16 · 3093 阅读 · 41 评论 -
【机器学习-监督学习】决策树
本文介绍了决策树模型的基本概念和最基础的决策树生成算法ID3算法,以及分类和回归树CART算法。然后动手实现了ID3算法的改进版本C4.5算法的决策树,并学会使用Sklearn中的决策树工具。原创 2024-09-07 08:15:27 · 1794 阅读 · 41 评论 -
【机器学习-神经网络】循环神经网络
本文主要介绍了循环神经网络及其变体门控循环单元,并在简单的数据集上实现了GRU模型。与其他的神经网络结构相比,RNN充分利用了数据中的序列特性,将中间向量按时间步不断向后传播,从而具有捕捉序列型关联的能力。原创 2024-09-03 09:11:23 · 2181 阅读 · 59 评论 -
【机器学习-神经网络】卷积神经网络
本文介绍了卷积神经网络和其在图像处理任务中的应用,包括用卷积神经网络完成图像分类任务、用预训练的卷积神经网络完成色彩风格迁移。原创 2024-08-30 11:21:20 · 2764 阅读 · 71 评论 -
【机器学习-监督学习】神经网络与多层感知机
本文讲解了神经网络的发展历程,以及一个曾经得到大规模应用的重要神经网络模型——多层感知机。其中包含的前馈结构、反向传播等思想,深刻地影响了后续神经网络的发展。原创 2024-08-26 09:02:42 · 2596 阅读 · 56 评论 -
【机器学习-监督学习】支持向量机
本文介绍了支持向量机的原理及其求解算法SMO。由于SVM属于非参数化模型,其模型中的参数与数据集的规模相同,求解较为复杂,但SMO算法大大降低了求解的难度。对于非线性分布的数据,通过引入非线性的核函数使SVM完成分类任务,达到和神经网络中激活函数类似的效果。原创 2024-08-24 15:33:08 · 1005 阅读 · 29 评论 -
【机器学习-监督学习】双线性模型
本文介绍了双线性模型的来源和特点,以及与线性模型的区别。以因子分解机和概率矩阵分解两个推荐系统中的常用模型为例,具体讲解了双线性模型的应用,并动手实现了矩阵分解MF模型和因子分解机FM模型。这两个模型都是目前推荐系统所用模型的基础,从它们改进和衍生的模型仍然有广泛应用。原创 2024-08-22 14:03:44 · 2589 阅读 · 29 评论 -
【机器学习-监督学习】逻辑斯谛回归
本文讲解了二分类问题的最简单的线性模型:逻辑斯谛回归。利用最大似然估计解决了模型优化与训练的问题,在数据集上分别用梯度下降法和sklearn中的工具进行了实践,并推导了交叉熵的公式,得到分类问题中交叉熵与最大似然估计的等价性。原创 2024-08-19 08:52:34 · 2255 阅读 · 43 评论 -
【机器学习的基本思想】模型优化与评估
本文介绍了一些机器学习的基本思想,主要关于模型优化和评估,包括欠拟合与过拟合、正则化约束、输入特征与相似度、参数与超参数和数据集划分与交叉验证。原创 2024-08-13 14:52:30 · 1397 阅读 · 5 评论 -
【机器学习数据预处理】特征工程
本文详细讲解了机器学习数据预处理中特征工程的相关知识点,包括特征变换和特征选择,并通过代码示例进行演示。原创 2024-08-12 08:00:00 · 1129 阅读 · 6 评论 -
【机器学习基础】线性回归
本文讲解了线性回归问题和求解方法。线性回归是机器学习中最基础的参数化学习模型,线性回归任务是机器学习中最基础的有监督学习任务。讨论了求解线性回归问题的不同方法和预测误差,并在房屋售价数据集上进行了实践。原创 2024-08-09 15:23:55 · 1573 阅读 · 4 评论 -
【机器学习基础】k近邻算法
本文讲解KNN算法的原理,并在分类和回归任务上进行了应用。KNN算法作为最简单的机器学习算法之一,其统计的思想仍然在多个领域中有着广泛应用。原创 2024-08-08 08:26:43 · 1410 阅读 · 7 评论 -
【机器学习基础】Scikit-learn主要用法
本文讲解Python机器学习库scikit-learn的用法,主要包括数据预处理、划分数据集、构建并拟合模型、模型评价与优化等。原创 2024-08-03 15:34:58 · 1992 阅读 · 10 评论 -
【机器学习数据预处理】数据准备
本文详细讲解机器学习数据预处理部分的数据准备相关步骤和知识点,包括数据质量校验、数据分布与趋势探查、数据清洗和数据合并。原创 2024-08-02 13:43:48 · 2238 阅读 · 8 评论 -
【机器学习基础】机器学习概述与实践基础
本文主要介绍机器学习的相关概念与应用领域、实现机器学习的通用流程和Python中的机器学习工具库。原创 2024-07-31 11:11:44 · 1172 阅读 · 8 评论 -
【机器学习基础】机器学习的数学基础
本文讲解机器学习算法中常用的数学工具。包括向量、矩阵、梯度和凸函数。重点放在机器学习算法的讲解与实践上,将数学概念以直观的方式展示,并没有过多地展示数学证明与定理。原创 2024-07-30 18:14:37 · 1347 阅读 · 5 评论 -
【机器学习基础】初探机器学习
本文以简要的形式介绍了机器学习是什么,它在人工智能领域是一个怎样的位置,机器学习模型有哪些分类,机器学习奏效的本质是其泛化能力,不同的模型往往有不同的归纳偏置,机器学习本身也存在一些限制。原创 2024-07-29 13:56:38 · 1260 阅读 · 6 评论 -
Scikit-Learn机器学习要点总结
《数据采集与分析》课程sklearn机器学习部分重要知识点,复习总结sklearn库的相关内容。原创 2024-05-20 18:02:54 · 1640 阅读 · 5 评论 -
【机器学习与实现】支持向量机SVM
本文介绍机器学习的支持向量机SVM,包括硬间隔、软间隔、核函数和scikit-learn中的SVM分类器及其主要参数。原创 2024-05-20 12:59:53 · 1029 阅读 · 5 评论 -
【机器学习与实现】逻辑回归分析
本文介绍机器学习的逻辑回归分析,包括逻辑回归的基本概念、分类思想、损失函数、参数求解和Scikit-learn的LogisticRegression类。原创 2024-05-18 12:24:17 · 995 阅读 · 7 评论 -
【机器学习与实现】kNN分类算法示例
本文介绍机器学习中的kNN分类算法示例,主要包括对鸢尾花数据集进行分类。原创 2024-05-15 13:51:24 · 1459 阅读 · 2 评论 -
【机器学习与实现】K近邻算法
本文介绍机器学习中的K近邻算法,即KNN算法。原创 2024-05-13 18:31:59 · 1158 阅读 · 1 评论 -
【机器学习与实现】线性回归示例——波士顿房价分析
本文介绍一个线性回归模型示例——波士顿房价分析。原创 2024-05-07 17:28:45 · 5508 阅读 · 12 评论 -
【机器学习与实现】线性回归分析
本文介绍机器学习的线性回归分析,包括线性回归的概念和方程、线性回归模型的损失函数与参数估计以及线性回归的正则化。原创 2024-05-06 13:38:02 · 1573 阅读 · 0 评论 -
【机器学习与实现】机器学习概述
本文介绍机器学习的概述,包括机器学习的基本概念和方法、步骤总结、预处理、类型以及学习路线。原创 2024-04-24 13:22:41 · 1064 阅读 · 0 评论