Python中级
文章平均质量分 88
潜洋
二十几年的资深程序员,做过高级管理,最热衷的还是技术和代码,日活几千万级别的系统也做过。最近主力研究的方向是人工智能。 把体会到的、基础的东西写出来,尽量写的浅显易懂,欢迎大家多多支持我。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python AI教程之二十四:监督学习之KNN算法(3)使用 Python 从 Scratch 实现 K 近邻算法
K 近邻分类是基于实例学习的分类技术之一。基于实例学习的模型可以超越训练示例进行推广。为此,它们首先存储训练示例。当遇到新实例(或测试示例)时,它们会立即在存储的训练示例和这个新实例之间建立关系,为这个新实例分配目标函数值。基于实例的方法有时被称为懒惰学习方法,因为它们会推迟学习,直到遇到新实例进行预测。原创 2025-01-18 07:32:12 · 1157 阅读 · 0 评论 -
Python AI教程之二十三:监督学习之KNN算法(2)Python实现KNN算法
在这篇文章中,我们了解了什么是监督学习以及它的类别。在对监督学习有了基本的了解之后,我们探索了用于解决监督机器学习问题的 k-最近邻算法。我们还探索了如何测量模型的准确性。原创 2025-01-17 07:38:39 · 1125 阅读 · 0 评论 -
Python AI教程之二十二:监督学习之KNN算法(1)
K-最近邻 (KNN) 算法是一种用于解决分类和回归问题的监督机器学习方法。Evelyn Fix 和 Joseph Hodges 于 1951 年开发了该算法,随后由 Thomas Cover 进行了扩展。本文探讨了 KNN 算法的基础知识、工作原理和实现。原创 2025-01-16 07:30:45 · 1064 阅读 · 0 评论 -
Python AI教程之二十一:监督学习之支持向量机(SVM)算法
支持向量机(SVM)是一种功能强大的机器学习算法,广泛用于线性和非线性分类以及回归和异常值检测任务。SVM 具有很强的适应性,适用于各种应用,例如文本分类、图像分类、垃圾邮件检测、笔迹识别、基因表达分析、人脸检测和异常检测。本文介绍支持向量机算法如何工作?支持向量机术语。数学计算:SVM;支持向量机的类型;SVM中的流行核函数;在 Python 中实现 SVM 算法;支持向量机(SVM)的优点和缺点原创 2025-01-15 07:50:34 · 1721 阅读 · 0 评论 -
Python AI教程之二十:监督学习之集成分类器
集成学习通过组合多个模型来帮助提高机器学习结果。与单个模型相比,这种方法可以产生更好的预测性能。基本思想是学习一组分类器(专家)并允许它们投票。优点:提高预测准确率。缺点:很难理解分类器集合。原创 2025-01-14 07:28:41 · 407 阅读 · 0 评论 -
Python AI教程之十九:监督学习之决策树(10)超参调整
决策树中的超参数为什么要调整决策树中的超参数?决策树中的超参数调整方法在决策树中实现超参数调整原创 2025-01-13 07:21:53 · 1788 阅读 · 0 评论 -
Python AI教程之十八:监督学习之决策树(9) 决策树模型中的过度拟合
克服决策树模型过度拟合的策略修剪技术限制树的深度每个叶节点的最小样本数特征选择与工程集成方法交叉验证增加训练数据原创 2025-01-12 07:37:09 · 1358 阅读 · 0 评论 -
Python AI教程之十七:监督学习之决策数据(8)修剪决策树和实例
决策树修剪是机器学习中的一项关键技术,用于通过减少过度拟合和提高对新数据的泛化来优化决策树模型。在本指南中,我们将探讨决策树修剪的重要性、其类型、实现及其在机器学习模型优化中的意义。原创 2025-01-11 07:26:07 · 880 阅读 · 0 评论 -
Python AI教程之十六:监督学习之决策树(7)和其它算法的比较
本文介绍了决策树和其它类似算法的优缺点比较。包括,逻辑回归与决策树分类;随机森林和决策树之间的比较;机器学习中的 KNN 与决策树的比较;决策树、聚类算法和线性回归之间的比较。原创 2025-01-10 07:36:30 · 2658 阅读 · 0 评论 -
Python AI教程之十五:监督学习之决策树(6)高级算法C5.0决策树算法介绍
C5.0 是之前ID3和C4.5算法的增强版本,是一种用于机器学习分类的强大决策树方法。它由 Ross Quinlan 创建,通过基于输入特征构建决策树来预测分类结果。C5.0 使用自上而下的递归方法划分数据集,在每个节点上选择最佳特征。它考虑生成的子组的大小和质量,同时使用信息增益和增益比标准确定最佳分割。C5.0 中包含修剪机制,以防止过度拟合并提高对新数据的泛化能力。它还可以很好地管理分类变量、数字属性和缺失值。生成的决策树为分类任务提供了易于理解的指导方针,并且由于其精确性、适应性和管理复杂数据集的原创 2025-01-09 08:00:16 · 1680 阅读 · 0 评论 -
Python AI教程之十三:监督学习之决策树(4)决策树中的概念和指标
文章介绍了决策树中的概念和指标,包括:一、ML | 决策树中的基尼不纯度和熵二、决策树中的信息增益三、决策树中的期望值四、决策树中的训练误差五、决策树中的最佳分割原创 2025-01-07 07:41:07 · 1505 阅读 · 0 评论 -
Python AI教程之十二:监督学习之决策树(3)使用 Python 中的决策树进行文本分类
文本分类是将文本文档分类到预定义类别的过程。在本文中,我们将探讨如何利用决策树对文本数据进行分类。文本分类涉及根据文本文档的内容为其分配预定义类别或标签。决策树是一种分层树结构,可根据输入特征的值递归地划分特征空间。由于其简单性、可解释性和处理非线性关系的能力,它们特别适合分类任务。原创 2025-01-06 07:31:08 · 1242 阅读 · 0 评论 -
Python AI教程之十一:监督学习之决策树(2)使用 sklearn 进行决策树回归
决策树是一种决策工具,它使用类似流程图的树结构,或者说是决策及其所有可能结果(包括结果、投入成本和效用)的模型。决策树算法属于监督学习算法类别。它适用于连续和分类输出变量。本文使用Python Sklearn库实现决策数的例子原创 2025-01-05 07:30:10 · 1696 阅读 · 2 评论 -
Python AI之十:监督学习之决策树(1)- 机器学习中的决策树
决策树是一种监督学习算法,常用于机器学习,根据输入数据对结果进行建模和预测。它是一种树状结构,其中每个内部节点都测试属性,每个分支对应属性值,每个叶节点代表最终决策或预测。决策树算法属于监督学习类别。它们可用于解决回归和分类问题。本文深入探讨决策树的组成部分、术语、构造和优势,探索其应用和学习算法。原创 2025-01-04 07:23:14 · 1327 阅读 · 0 评论 -
Python Ai教程之九:监督学习之逻辑回归算法
逻辑回归是一种用于分类任务的监督机器学习算法,其目标是预测实例属于给定类别的概率。逻辑回归是一种统计算法,用于分析两个数据因素之间的关系。本文探讨了逻辑回归的基础知识、类型和实现。目录什么是逻辑回归?逻辑函数-Sigmoid函数逻辑回归的类型逻辑回归的假设逻辑回归如何工作?逻辑回归的代码实现逻辑回归阈值设置中的精确度-召回率权衡如何评估逻辑回归模型?线性回归和逻辑回归之间的差异原创 2025-01-03 07:36:58 · 915 阅读 · 0 评论 -
Python AI教程之八:监督学习之支持向量回归(SVR)
支持向量回归 (SVR) 是一种用于回归任务的支持向量机 (SVM)。它试图找到一个函数,能够最好地预测给定输入值的连续输出值。SVR 可以使用线性和非线性核。线性核是两个输入向量之间的简单点积,而非线性核则是更复杂的函数,可以捕捉数据中更复杂的模式。核的选择取决于数据的特征和任务的复杂性。原创 2025-01-02 07:37:04 · 1495 阅读 · 0 评论 -
Python AI教程之七:多项式回归
多项式回归是一种线性回归,其中独立变量 x 和因变量 y 之间的关系被建模为n 次多项式。多项式回归拟合 x 的值与 y 的相应条件均值之间的非线性关系,表示为 E(y | x)。在本文中,我们将深入探讨多项式回归。原创 2025-01-01 07:47:06 · 1461 阅读 · 0 评论 -
Python AI教程之六:监督学习算法之线性回归
线性回归是一种监督式机器学习算法,它根据一个或多个独立变量预测连续目标变量。它假设因变量和自变量之间存在线性关系,并使用线性方程来模拟这种关系。本文介绍了简单线性回归的优缺点、梯度公式、评估指标、代码实例、正则化等内容原创 2024-12-31 07:32:31 · 1306 阅读 · 0 评论 -
Python AI 教程之五: 强化学习
强化学习 (RL) 是机器学习的一个分支,专注于在特定情况下做出决策以最大化累积奖励。与依赖具有预定义答案的训练数据集的监督学习不同,强化学习涉及通过经验进行学习。在强化学习中,代理通过执行操作并通过奖励或惩罚获得反馈来学习在不确定、可能复杂的环境中实现目标。原创 2024-12-30 07:49:55 · 1021 阅读 · 0 评论 -
Python AI 教程之四:无监督学习
无监督学习是机器学习的一个分支,用于处理未标记的数据。与监督学习(其中数据被标记为特定类别或结果)不同,无监督学习算法的任务是在不了解数据含义的情况下寻找数据中的模式和关系。这使得无监督学习成为探索性数据分析的强大工具,其目标是了解数据的底层结构。原创 2024-12-29 08:28:44 · 1203 阅读 · 0 评论 -
Python AI教程之三:半监督学习
半监督学习是一种介于监督学习和无监督学习之间的机器学习。它是一种使用少量标记数据和大量未标记数据来训练模型的方法。半监督学习的目标是学习一个可以根据输入变量准确预测输出变量的函数,类似于监督学习。然而,与监督学习不同的是,该算法是在包含标记和未标记数据的数据集上进行训练的。原创 2024-12-28 08:06:16 · 756 阅读 · 0 评论 -
Python AI教程之二: 监督机器学习
监督式机器学习是机器学习和人工智能的基本方法。本文介绍监督学习的定义,工作原理,监督学习类型、监督学习的实例、监督学习的算法以及监督学习的模型、关键步骤。总结了监督学习的优点和缺点。原创 2024-12-27 07:26:40 · 930 阅读 · 0 评论 -
Python AI教程之一:大纲
在这里,您将学习 Python 的所有 AI 概念。首先,我们介绍 AI,包括机器学习、深度学习、NLP 和计算机视觉等分支。此外,我们还探索流行的 AI 技术,包括生成式 AI 等。人工智能概念Python 人工智能 - 机器学习Python 人工智能 - 深度学习Python 人工智能 - 自然语言处理 (NLP)Python 人工智能 - 计算机视觉使用 Python 实现人工智能 - 生成式人工智能原创 2024-12-26 07:55:43 · 1177 阅读 · 0 评论 -
Pandas教程之三十九:在 Python 中将 CSV 转换为 HTML 表
PrettyTable 是一个简单的 Python 库,旨在让您快速轻松地以视觉上有吸引力的 ASCII 表格形式表示表格数据。输入以下命令安装此模块。文件是逗号分隔值文件,使用逗号分隔值。它主要用于在不同应用程序之间交换数据。其中,各行由换行符分隔。每行中的数据字段用逗号分隔。将 CSV 文件转换为 HTML 表的最简单方法之一是使用 pandas。在命令提示符中输入以下代码来安装 pandas。假设 CSV 文件如下所示 -姓名、工资、年龄、工作年限。使用上面的 CSV 文件。原创 2024-12-25 07:35:14 · 1018 阅读 · 0 评论 -
Pandas教程之三十八:如何使用 pandas 在 Python 中执行 vLookup
执行此操作后,我们得到一个表,其中包含两个表中的所有数据,并且数据匹配。右连接有点类似于左连接,其中输出数据框将由第二个数据框中的所有行和第一个数据框中的匹配行组成。第一个表包含学生信息,第二列包含他们所注册的各个课程的信息。左连接操作提供第一个数据框中的所有行和第二个数据框中的匹配行。如果行在第二个数据框中不匹配,则它们将被 NaN 替换。外连接提供由两个数据框的行组成的输出数据框。如果行匹配,则显示值,否则,对于不匹配的行,将显示 NaN。内连接仅生成那些在两行中都满足条件的行的输出数据框。原创 2024-12-24 07:38:59 · 1113 阅读 · 0 评论 -
Pandas教程之三十七:使用Pandas数据可视化
要使用各种技术(例如添加标题、标签和应用样式表)自定义 Pandas 中的图表,您可以直接使用 Pandas 的绘图功能,这些功能建立在 Matplotlib 之上。通过利用 Pandas 与 Matplotlib 的集成及其内置绘图功能,您可以创建各种各样的图表来有效地探索和传达您的数据。要在 Pandas 中创建密度图,您可以使用 plot.kde() 或 plot.density() 方法,它们本质上可以互换,并使用核密度估计 (KDE) 来估计随机变量的概率密度函数 (PDF)。原创 2024-12-23 08:15:19 · 1491 阅读 · 0 评论 -
Pandas教程之三十六:XlsxWriter使用详解(3)
XlsxWriter是一个用于以 XLSX 文件格式写入文件的 Python 模块。它可用于将文本、数字和公式写入多个工作表。此外,它还支持格式化、图像、图表、页面设置、自动筛选、条件格式等功能。Python Pandas 是一个数据分析库。它可以读取、过滤和重新排列小型和大型数据集,并以包括 Excel 在内的多种格式输出它们。使用 Pandas 和 XlsxWriter 绘制柱形图。使用 Pandas 和 XlsxWriter 绘制折线图。使用 Pandas 和 XlsxWriter 绘制散点图。原创 2024-12-22 07:38:15 · 1231 阅读 · 0 评论 -
Pandas教程之三十五:XlsxWriter使用详解(2)
它可用于将文本、数字和公式写入多个工作表。此外,它还支持格式化、图像、图表、页面设置、自动筛选、条件格式等功能。使用 Pandas 和 XlsxWriter 将具有日期时间的 Pandas 数据框转换为具有默认日期时间和日期格式的 Excel 文件。使用 Pandas 和 XlsxWriter 将 Pandas 数据框转换为具有用户定义标题格式的 Excel 文件。使用 Pandas 和 XlsxWriter 将 Pandas 数据框转换为具有列格式的 Excel 文件。原创 2024-12-21 07:30:07 · 1207 阅读 · 0 评论 -
Pandas教程之三十四:XlsxWriter使用详解(1)
它可用于将文本、数字和公式写入多个工作表。此外,它还支持格式化、图像、图表、页面设置、自动筛选、条件格式等功能。它可以读取、过滤和重新排列小型和大型数据集,并以包括 Excel 在内的多种格式输出它们。使用 Pandas 和 XlsxWriter 将 Pandas 数据框转换为 xlsx 文件。使用 Pandas 和 XlsxWriter 将多个数据框写入工作表。使用 Pandas 和 XlsxWriter 在工作表中定位数据框。使用 XlsxWriter 模块写入 Excel 文件。原创 2024-12-20 07:30:58 · 1014 阅读 · 0 评论 -
Pandas教程之三十三:Pandas读取 CSV详细介绍
要从 CSV 文件访问数据,我们需要 Pandas 中的 read_csv() 函数,该函数以数据框的形式检索数据。如果没有传递任何名称,即 header=None,则它将第一列显示为 0,第二列显示为 1,依此类推。此 na_values 参数将指定的字符串(例如 "N/A", "Unknown")替换为 NaN,从而能够在分析过程中一致处理缺失或不完整的数据。该 skiprows 参数会跳过文件开头不必要的行,这对于忽略不属于数据集的元数据或额外标题很有用。:csv 文件的位置。原创 2024-12-19 07:51:44 · 1908 阅读 · 0 评论 -
Pandas教程之三十二:Pandas 处理文本数据
从名称可以看出,str.lstrip() 用于从字符串左侧删除空格,str.rstrip() 用于从字符串右侧删除空格,str.strip() 用于从两侧删除空格。如输出图像所示,地址列在第一次出现“a”时被分隔,而没有在后面出现时被分隔,因为 n 参数设置为 1(字符串中最多 1 个分隔符)。如输出图所示,Team 列中每个与 Name 列中的字符串具有相同索引的字符串都用分隔符“, ”连接起来。如输出图所示,比较对所有 3 个条件都返回 False,这意味着成功从两侧删除空格,并且字符串不再有空格。原创 2024-12-18 09:00:11 · 1012 阅读 · 0 评论 -
Pandas教程之三十一:pandas.date_range() 方法
Pandas 中用于生成日期序列的函数date_range()。它允许您指定生成的日期的开始日期、结束日期、频率和时区,使其适用于各种基于时间的应用程序。软件包的出色生态系统。代码将提供从开始开始的具有预定数量的周期和时区 tz 的一系列日期。中的通用函数之一,用于返回固定频率的DatetimeIndex。在生成日期范围之前将开始/结束日期标准化为午夜。代码将提供从开始到结束的一系列日期,默认频率为。代码将提供从开始到结束具有给定频率的一系列日期。代码将提供从一开始具有预定数量的周期的日期范围。原创 2024-12-17 08:10:33 · 988 阅读 · 0 评论 -
Pandas教程之三十:替换Pandas时间戳
正如我们在输出中看到的,该Timestamp.replace()函数返回了一个 Timestamp 对象,其年份值等于 2019,月份值等于 12,小时值等于 1。该代码展示了如何构建一个表示 Pandas Timestamp 的对象,然后使用 Pandas Timestamp.replace 方法编辑时间戳的各个部分。正如我们在输出中看到的,该Timestamp.replace()函数返回了一个年份值等于 2019 的 Timestamp 对象。函数用于替换给定 Timestamp 的成员值。原创 2024-12-16 07:29:46 · 950 阅读 · 0 评论 -
Pandas教程之二十九: 使用 Pandas 处理日期和时间
为数据分析和可视化指定自定义时区设置。Python3。原创 2024-12-15 07:46:47 · 1903 阅读 · 0 评论 -
Pandas教程之二十八:Pandas str.join() 使用传递的分隔符连接字符串/列表元素
Pandasstr.join()方法用于将列表中的所有元素与传递的分隔符连接起来。由于字符串也是字符数组(或字符列表),因此当将此方法应用于一系列字符串时,字符串将在每个字符处与传递的分隔符连接起来。如前所述,字符串也是一个字符数组,因此字符串的每个字符都将使用 str.join() 方法与传递的分隔符连接起来。如输出图像所示,使用 str.split() 将数据拆分为列表,然后使用 str.join() 以分隔符“_”连接列表。如输出图所示,name 列中的字符串已通过传递的分隔符按字符连接。原创 2024-12-14 09:40:42 · 988 阅读 · 0 评论 -
Pandas教程之二十七: Pandas Series.combine()
在此示例中,创建了两个列表并使用 .Series() 方法将其转换为 pandas 系列。使用 lambda 创建一个函数,该函数检查两个系列中哪个值较小,并返回较小的值。传递了一个 lambda 函数,它将比较两个系列中的值并返回较大的一个。Python 是一种非常适合进行数据分析的语言,这主要是因为它拥有以数据为中心的 Python 包的出色生态系统。输出系列的形状与调用者系列相同。如输出所示,在合并系列之前,该系列中的 NaN 值被替换为 5。如输出图像所示,返回的系列具有比两个系列更小的值。原创 2024-12-13 09:10:32 · 897 阅读 · 0 评论 -
Pandas教程之二十六: Pandas Index.append()
该函数用于将单个或一组索引附加在一起。对于索引集合,所有索引都会按照传递给函数的顺序附加到原始索引。该函数返回附加的索引。软件包的出色生态系统。Pandas就是其中之一,它使导入和分析数据变得更加容易。使用Index.append()函数在给定索引的末尾附加索引集合。使用Index.append()函数将单个索引附加到给定索引。是一种出色的数据分析语言,这主要归功于以数据为中心的。让我们将 df2 索引附加到 df1 的末尾。正如我们在输出中看到的,第二个索引即。索引或索引列表/元组。原创 2024-12-12 08:12:22 · 364 阅读 · 0 评论 -
Pandas教程之二十五:Pandas dataframe.append()
函数用于将其他数据框的行添加到现有数据框的末尾,并返回一个新的数据框对象。原始数据框中不存在的列将添加为新列,新单元格将填充 NaN 值。注意,第二个数据框的索引值在附加数据框中保留。方法用于将一个 DataFrame 的行附加到另一个 DataFrame。如果数据框中的列数不相等,则其中一个数据框中不存在的值将用 NaN 值填充。在这个例子中,我们创建两个数据框,并使用 df.append() 将第二个数据框附加到第一个数据框。方法将一个 DataFrame 附加到另一个 DataFrame。原创 2024-12-11 08:41:40 · 1378 阅读 · 0 评论 -
Pandas教程之二十四:Pandas Series.str.cat() 连接字符串
从数据框中可以看出,在索引位置 4 和 5 处,有一个 NULL 值,该值已被替换为“No College”,并且来自 Team 列的字符串已成功连接。Python 是一种非常适合进行数据分析的语言,这主要是因为它拥有以数据为中心的 Python 包的出色生态系统。在此示例中,Team 列使用分隔符“,”连接到 Name 列的末尾。如输出图所示,Team 列中每个与 Name 列中的字符串具有相同索引的字符串都用分隔符“, ”连接起来。可以传递来自不同系列的不同值,但两个系列的长度必须相同。原创 2024-12-10 08:22:26 · 1035 阅读 · 0 评论 -
Pandas教程之二十三:Pandas 合并、连接和串联
join() 采用可选的参数,该参数可以是一列或多个列名,它指定传递的 DataFrame 要在 DataFrame 中的该列上对齐。为了连接数据框,我们使用 .join() 函数,该函数用于将两个可能不同索引的 DataFrame 的列组合成一个结果 DataFrame。该函数在之前就存在了 .concat。为了将单索引数据框与多索引数据框连接起来,级别将根据单索引框的索引名称与多索引框的级别名称进行匹配。为了连接一个数据框,我们使用 .concat() 函数该函数连接一个数据框并返回一个新的数据框。原创 2024-12-09 07:52:40 · 1342 阅读 · 0 评论
分享