- 博客(16)
- 收藏
- 关注
原创 机器学习--(随机森林,线性回归)
集成学习的基本思想就是将多个分类器组合,从而实现一个预测效果更好的集成分类器。集成算法可以说从一方面验证了中国的一句老话:三个臭皮匠,赛过诸葛亮。集成算法大致可以分为:Bagging,Boosting 和 Stacking 三大类型。(1)每次有放回地从训练集中取出 n 个训练样本,组成新的训练集;(2)利用新的训练集,训练得到M个子模型;(3)对于分类问题,采用投票的方法,得票最多子模型的分类类别为最终的类别;
2025-02-26 18:24:09
2246
原创 机器学习介绍与数据集
机器学习(Machine Learning)是让计算机从数据中自动学习规律,并依据这些规律对未来数据进行预测的技术。它涵盖聚类、分类、决策树、贝叶斯、神经网络、深度学习(Deep Learning)等多种算法 ,基本思路是模拟人类学习行为,通过经验归纳总结规律来预测未来。scikit - learn 是 Python 语言的机器学习工具,包含许多智能的机器学习算法实现,文档完善,上手容易,拥有丰富的 API 接口函数。
2025-02-24 18:14:51
2163
原创 机器学习-特征工程与 sklearn 机器学习概述
实例化预估器 (估计器) 对象 (estimator):根据任务选择,如分类(KNeighborsClassifier、MultinomialNB 等)、回归(LinearRegression、Ridge)、无监督学习(KMeans)。进行训练模型评估方式 1:对比 y_predict = estimator.predict (x_test) 和 y_test。方式 2:计算准确率 accuracy = estimator.score (x_test, y_test)。使用模型 (预测)
2025-02-24 18:11:26
1173
原创 OpenCV图像预处理
在计算机视觉和图像处理领域,图像预处理是一个重要的步骤,它能够提高后续处理(如特征提取、目标检测等)的准确性和效率。OpenCV 提供了许多图像预处理的函数和方法,以下是一些常见的图像预处理操作:图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学。
2025-02-18 18:42:10
845
原创 OpenCV图像基础
OpenCV其实就是一堆C和C++语言的源代码文件,这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV的全称是Open Source Computer Vision Library,是一个开放源代码的计算机视觉库OpenCV最初由英特尔公司发起并开发,以BSD许可证授权发行,可以在商业和研究领域中免费使用,现在美国Willow Garage为OpenCV提供主要的支持OpenCV可用于开发实时的图像处理,计算机视觉以及模式识别程序,目前在工业界以及科研领域广泛采用。
2025-02-14 19:05:37
960
原创 数据结构
数据结构是计算机科学中的一个核心概念,它是指数据的组织、管理和存储方式,以及数据元素之间的关系。数据结构通常用于允许高效的数据插入、删除和搜索操作。:数组、链表、栈、队列等。:树、二叉树、堆、图等。:哈希表。:B树、B+树等。
2025-02-11 18:40:32
898
原创 Pandas读取文件,图表
CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本);CSV 是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。
2025-02-10 17:17:02
692
原创 Pandas函数
注意:numpy的方差默认为总体方差,pandas默认为样本方差分母为n-1的样本方差的期望等于总体的方差,因此样本方差是总体方差的无偏估计。
2025-02-08 18:40:13
626
原创 Pandas
Pandas 是一个开源的第三方 Python 库,从 Numpy 和 Matplotlib 的基础上构建而来Pandas 名字衍生自术语 "panel data"(面板数据)和 "Python data analysis"(Python 数据分析)Pandas 已经成为 Python 数据分析的必备高级工具,它的目标是成为强大、灵活、可以支持任何编程语言的数据分析工具Pandas 是 Python 语言的一个扩展程序库,用于数据分析。
2025-02-07 16:44:21
749
原创 Matplotlib图形
*kwargs: 其他可选参数,用于定制柱状图的外观,如 color、edgecolor、linewidth 等。**kwargs: 其他可选参数,用于定制直方图的外观,如 color、edgecolor、linewidth 等。autopct: 控制显示每个扇区的占比,可以是格式化字符串或函数,默认为 None。柱状图(Bar Chart)是一种常用的数据可视化工具,用于展示分类数据的分布情况。explode: 一个数组,表示每个扇区偏离圆心的距离,默认为 None。
2025-02-07 16:32:35
779
原创 Matplotlib函数
Matplotlib 可以自动根据因变量和自变量设置坐标轴范围,也可以通过 set_xticks() 和 set_yticks() 函数手动指定刻度,接收一个列表对象作为参数,列表中的元素表示对应数轴上要显示的刻度。subplot 是一个较早的函数,用于创建并返回一个子图对象。颜色:'b':蓝色 'g':绿色 'r':红色 'c':青色 'm':洋红色 'y':黄色 'k':黑色 'w':白色。axis: 指定要显示网格线的轴,可以是 'both'(两个轴)、'x'(X 轴)或 'y'(Y 轴)。
2025-02-06 16:53:11
906
原创 Matplotlib基础
Matplotlib 库:是一款用于数据可视化的 Python 软件包,支持跨平台运行,它能够根据 NumPy ndarray 数组来绘制 2D 图像,它使用简单、代码清晰易懂Figure:指整个图形,您可以把它理解成一张画布,它包括了所有的元素,比如标题、轴线等Axes:绘制 2D 图像的实际区域,也称为轴域区,或者绘图区Axis:指坐标系中的垂直轴与水平轴,包含轴的长度大小(图中轴长为 7)、轴标签(指 x 轴,y轴)和刻度标签。
2025-02-06 16:39:07
709
原创 Numpy基础
NumPy 的全称是“ Numeric Python”,它是 Python 的第三方扩展包,主要用来计算、处理一维或多维数组在数组算术计算方面, NumPy 提供了大量的数学函数NumPy 的底层主要用 C语言编写,因此它能够高速地执行数值计算NumPy 还提供了多种数据结构,这些数据结构能够非常契合的应用在数组和矩阵的运算上。
2025-02-05 17:51:46
675
原创 Numpy
1.a:需要操作的数组new_shape:返回的数组的形状,如果元素数量不够,重复数组元素来填充新的形状2.arr:输入的数组values:向 arr 数组中添加的值,需要和 arr 数组的形状保持一致axis:默认为 None,返回的是一维数组;当 axis =0 时,追加的值会被添加到行, 而列数保持不变,若 axis=1 则与其恰好相反3.arr:输入的数组obj:表示索引值,在该索引值之前插入 values 值。
2025-02-05 17:09:49
961
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人