- 博客(63)
- 资源 (4)
- 问答 (2)
- 收藏
- 关注
原创 sk15.【scikit-learn基础】-- 应用案例
鸢尾花数据集(Iris Dataset)是机器学习中最经典的入门数据集之一。鸢尾花数据集包含了三种鸢尾花(Setosa、Versicolor、Virginica)每种花的 4 个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。接下来我们的任务是基于这些特征来预测鸢尾花的种类。
2025-10-16 13:42:22
650
原创 sk14.【scikit-learn基础】-- 模型的保存与加载
在机器学习中,模型的训练过程通常是耗时的,为了避免每次重新训练模型,我们可以将训练好的模型保存下来,便于以后进行加载和预测。joblib。
2025-10-16 13:31:57
607
原创 sk13.【scikit-learn基础】-- 自定义模型与功能
转换器是用于对数据进行转换的组件,例如标准化、特征选择等。自定义转换器可以继承,并实现fit和transform方法。fit方法:通常用于学习数据的属性(如均值、方差、特征选择标准等)。fit方法返回转换器本身,以便可以进行链式调用。transform方法:应用已学习的属性,对数据进行转换或处理。假设我们希望实现一个自定义的标准化转换器,标准化是将数据的每个特征缩放到均值为 0、方差为 1 的范围。"""计算每个特征的均值和标准差"""return self # 返回对象本身"""标准化数据。
2025-10-16 13:04:14
616
原创 sk12.【scikit-learn基础】-- 管道(Pipeline)
Pipeline 是一个可按顺序执行多个数据处理步骤和模型训练步骤的工具。在 Pipeline 中,每个步骤是一个元组,包含一个名称和一个对象。转换器(Transformer)是执行数据转换的对象,比如数据预处理(例如归一化、标准化、特征选择等)。估计器(Estimator)是用于训练模型的对象,例如分类器或回归器。Pipeline使得将多个步骤整合为一个可重用的工作流变得简单,并且可以确保数据处理过程的一致性,避免因代码重复或手动处理导致的错误。
2025-10-16 11:01:09
917
原创 sk11.【scikit-learn基础】--模型评估与调优
交叉验证(Cross-Validation)是一种用于评估模型性能的技术,它通过将数据集分成多个子集(折叠),并多次训练和测试模型来获得更稳定、可靠的评估结果。交叉验证有助于检测模型是否过拟合,并且能够更准确地评估模型的泛化能力。K-fold 交叉验证:将数据分成 K 个折叠,依次选择其中一个折叠作为测试集,其他 K-1 个折叠作为训练集,重复 K 次,最后计算 K 次的结果平均值。留一法交叉验证(Leave-One-Out Cross-Validation, LOOCV)
2025-10-16 10:52:36
921
原创 sk10.【scikit-learn基础】--『无监督学习』之主成分分析
主成分分析(PCA)是一种统计方法,它可以通过正交变换将一组可能相关的变量转换成一组线性不相关的变量,这些变量称为主成分。PCA在降维、去噪和数据的可视化中非常有用。简单说,PCA做了两件关键的事:把高维数据“投影”到低维空间,减少特征数量;尽可能保留原始数据中“最重要的信息”(即数据的变异程度)。
2025-10-16 09:58:15
1068
原创 sk09.【scikit-learn基础】--『无监督学习』之K均值聚类
聚类是针对给定的样本,依据样本特征的相似度或距离,将其归并到若干个“类”或“簇”的算法。聚类的目的是通过得到的类或簇来发现数据的特点,在数据挖掘、模式识别等领域有着广泛的应用。区别于监督学习的“特征+标签”的样本模式,聚类的样本只有“特征”,事先并不知道样本的标签(类或簇)。
2025-10-15 16:21:38
1138
原创 sk08.【scikit-learn基础】--『监督学习』之K近邻算法
K 近邻算法(K-Nearest Neighbors,简称 KNN)是一种简单且常用的分类和回归算法。K 近邻算法属于监督学习的一种,核心思想是通过计算待分类样本与训练集中各个样本的距离,找到距离最近的 K 个样本,然后根据这 K 个样本的类别或值来预测待分类样本的类别或值。
2025-10-15 15:04:12
1050
原创 朴素贝叶斯分类
在用历史数据估算出以上的类别概率表与特征概率表后,当进来一个特征X时,按判别公式计算样本属于各个类别时的判别值即可。朴素贝叶斯算法的核心思想是通过考虑特征概率来预测分类,即对于给出的待分类样本,求解在此样本出现的条件下各个类别出现的概率,哪个最大,就认为此待分类样本属于哪个类别。(1) 历史样本中,属于各类别的概率 P(属于类别k)P(属于类别k)1. 类别概率表:记录属于各个类别的概率。(2) 历史样本中,特征表现概率表 P(表现为特征xi∣已知属于类别k)P(表现为特征xi∣已知属于类别k)
2025-10-15 14:49:45
1038
原创 sk07.【scikit-learn基础】--『监督学习』之支持向量机
支持向量机(Support Vector Machine,简称 SVM)是一种监督学习算法,主要用于分类和回归问题。
2025-09-29 15:53:29
478
原创 sk06.【scikit-learn基础】--『监督学习』之决策树
决策树(Decision Tree)是一种常用的机器学习算法,广泛应用于分类和回归问题。决策树通过树状结构来表示决策过程,每个内部节点代表一个特征或属性的测试,每个分支代表测试的结果,每个叶节点代表一个类别或值。
2025-09-29 15:43:59
911
原创 sk05.【scikit-learn基础】--『监督学习』之逻辑回归
逻辑回归通过使用Sigmoid函数将线性回归的输出转换为概率值,用于解决二分类问题。逻辑回归的训练过程通过最小化对数损失函数来优化模型参数。梯度下降法是常用的优化方法,用来更新模型参数 ww 和 bb。Python中的库提供了简单易用的接口来实现逻辑回归,并且能够轻松地进行模型训练、评估和可视化。
2025-09-19 11:14:30
564
原创 sk04.【scikit-learn基础】--『监督学习』之 线性回归
线性回归(Linear Regression)是机器学习中最基础且广泛应用的算法之一。线性回归 (Linear Regression) 是一种用于预测连续值的最基本的机器学习算法,它假设目标变量 y 和特征变量 x 之间存在线性关系,并试图找到一条最佳拟合直线来描述这种关系。y是预测值x是特征变量w是权重 (斜率)b是偏置 (截距)线性回归的目标是找到最佳的w和b,使得预测值y与真实值之间的误差最小。常用的误差函数是均方误差 (MSE):我们的目标是通过调整 w 和 b ,使得 MSE 最小化。
2025-09-19 10:42:14
814
原创 sk03.【scikit-learn基础】-- 预处理
数据预处理是机器学习项目中的一个关键步骤,它直接影响模型的训练效果和最终性能。在进行机器学习建模时,数据预处理是至关重要的一步,它帮助我们清洗和转换原始数据,以便为机器学习模型提供最佳的输入。数据预处理涉及多个步骤,包括处理缺失值、数据转换、标准化、编码等。合适的预处理不仅能提高模型的准确性,还能帮助模型更好地泛化。
2025-09-18 11:24:59
757
原创 sk02.【scikit-learn基础】-- 数据集
这些数据集分为几类,包括小规模的内置数据集、可在线下载的大规模数据集、计算机生成的数据集、以及其他格式的数据集,如svmlight/libsvm格式和从openml.org在线下载的数据集。在使用这些数据集时,重要的是要理解每个数据集的特点和适用的任务类型。对于初学者来说,内置的小规模数据集是一个很好的起点,因为它们容易加载和使用。对于更高级的用户,生成的数据集和在线下载的数据集提供了更多的灵活性和挑战。还提供了函数来生成数据集,这些数据集可以用于更具体的机器学习任务测试。内置的小规模数据集可以通过。
2025-09-16 13:25:11
350
原创 sk01.【scikit-learn基础】-- 简介
全称为,是一个基于 Python 的开源机器学习库。Sklearn 是一个功能强大、易于使用的机器学习库,提供了从数据预处理到模型评估的一整套工具。Sklearn 构建在 NumPy 和 SciPy 基础之上,因此它能够高效地处理数值计算和数组操作。Sklearn 适用于各类机器学习任务,如分类、回归、聚类、降维等。Sklearn 凭借其简洁而一致的 API,Sklearn 已经成为了机器学习爱好者和专家的必备工具之一。
2025-09-12 14:44:41
840
转载 “反向传播算法”过程及公式推导(超直观好懂的Backpropagation)
本文通过两组图示详细讲解了神经网络的前向传播和反向传播算法。第一组图直观展示了三层神经网络的前向计算、误差计算及反向传播权重更新过程。第二组图通过具体计算案例,演示了如何利用链式法则求导,实现误差对权重参数的梯度计算和更新。文章强调只要掌握基本高等数学知识,结合生动案例就能理解反向传播原理,特别适合初学者入门。整个讲解从理论到实践,逐步拆解了BP算法的核心思想与实现步骤。
2025-08-21 18:18:14
301
原创 全国31个省份及直辖市的景区信息
中华人民共和国旅游景区质量等级共分为五级,从高到低依次为AAAAA、AAAA、AAA、AA、A级五级。5A级景区代表着中国的世界级精品旅游风景区等级。本数据集汇总整理了全国31个省份及直辖市的景区信息,涵盖了景区名称、省份、景区级别、地址、经纬度等信息,为相关研究助力!总计景点数据14847条。
2025-06-16 13:56:04
387
原创 中国地方特产-详细版(5)
"三江源玉树冬虫夏草(头期大虫草)","三江源玉树冬虫夏草(头期大虫草)","三江源玉树冬虫夏草(头期大虫草)","三江源玉树冬虫夏草(头期大虫草)","新疆兵团八十四团色素菊花","新疆兵团八十四团色素菊花","丰都红心柚(三元红心柚)","新疆兵团二十七团啤酒花","新疆兵团三十一团罗布麻","新疆兵团二十七团啤酒花","新疆兵团二十七团啤酒花","大方豆干/大方手撕豆腐","大方豆干/大方手撕豆腐","新疆兵团一八四团苹果","新疆兵团一八四团苹果","新疆兵团一八四团苹果",
2025-05-27 10:50:23
521
原创 中国地方特产-详细版(4)
中国地大物博、特产丰富,由于我国地域辽阔,在不同的地理区域环境影响下,饮食文化结构与地方风土人情也存在着较大的差异性,近而形成了全国各地特有的具有代表性的特色产品。"探味君红心芭乐(番石榴)","流汁土豆粉宽粉(酸辣粉)","高州农家自种爆皮王番薯","四季优美随便果酵素梅子","百家鲜桂林风味辣椒酱","李禧记辉顺德大良蹦砂","农家传统手工九陂切粉","富田桥曾氏游浆豆腐","富田桥曾氏游浆豆腐","神农堂二十四味凉茶","皇冠世家 广州四宝","晨光供港壹号纯牛奶","柏塘凉果/博罗凉果",
2025-05-27 10:49:01
1237
原创 中国地方特产-详细版(3)
"江西鄱阳特产名将葱酥饼","胡姬花特香型压榨花生油","即墨黄酒/即墨老酒","即墨黄酒/即墨老酒","高密夏庄大金钩韭菜","东平草编、条编织品","坻坞小米/仰韶小米","坻坞小米/仰韶小米","坻坞小米/仰韶小米","汝南五香鸡汁豆腐干","百年浆果紫苏酸枣糕","农家自制风干萝卜条","商河魁王金丝小枣","夏庄杠六九西红柿","大黄埠樱桃西红柿","夏庄杠六九西红柿","临朐三山峪大山楂","高密毛家屋子小米","微山湖四鼻孔鲤鱼",
2025-05-27 10:47:59
1218
原创 中国地方特产-详细版(2)
中国地大物博、特产丰富,由于我国地域辽阔,在不同的地理区域环境影响下,饮食文化结构与地方风土人情也存在着较大的差异性,近而形成了全国各地特有的具有代表性的特色产品。"南京云锦汉服荷包刺绣","牯牛降 香辣味牛肉酱","南京云锦汉服荷包刺绣","飘零大叔酥脆猪肉脯","飘零大叔酥脆猪肉脯","庐江梁大妈蒸肉米粉","金菜地大肉粒牛肉酱","漳州传统糕点白香饼","三江口多味萝卜腌菜","西顺河红衣小花生","大沙河红富士苹果","大沙河红富士苹果","小草湾红心猕猴桃","兰溪金丝琥珀蜜枣",
2025-05-27 10:45:12
773
原创 中国地方特产-详细版(1)
"三江源玉树冬虫夏草(头期大虫草)","饶河东北黑蜂系列产品","饶河东北黑蜂系列产品","东北长白糕(牛舌饼)","辽阳山里红/辽红山楂","鄂托克阿尔巴斯山羊肉","鄂托克阿尔巴斯山羊肉","鄂托克阿尔巴斯山羊肉","巴彦淖尔二狼山白绒山羊""铁力“中国林蛙”油","铁力“中国林蛙”油","露水河红松母林籽仁","露水河红松母林籽仁","地海农庄有机玉米面","三井十里香酒酿酒工艺""杭锦旗塔拉沟山羊肉","杭锦旗塔拉沟山羊肉","杭锦旗塔拉沟山羊肉","巴彦淖尔河套肉苁蓉",
2025-05-27 10:43:08
938
原创 《麻省理工公开课:线性代数》 中文学习笔记
麻省理工公开课:线性代数》是麻省理工公开课中广为流传的一门好课。这是我学习MIT线性代数课程 Linear Algebra的。希望在自己学习的同时,也对大家学习有所帮助。
2025-02-11 10:29:56
2255
2
原创 在人工智能领域 ⊕、⊗和 ⊙ 符号是什么含义?
参考原文链接:https://blog.youkuaiyun.com/weixin_44878336/article/details/124501040。可以看到就是普通的矩阵乘法,要求 A 矩阵第二维度与 B 矩阵第一维度相等。从公式可以看到,⊕ 表示对应元素相加,即两个矩阵的形状必须相同。torch.mm() 或 torch.matmul()与矩阵加法 ⊕类似,也是要求两个矩阵的维度必须相同。* 或 torch.mul(A, B)+ 或 torch.add(A, B)两个矩阵对应位置元素相乘(自动广播)
2025-02-10 18:05:59
4443
原创 泰勒公式到底是什么?
简单来讲就是用一个多项式函数去逼近一个给定的函数(即尽量使多项式函数图像拟合给定的函数图像),注意,逼近的时候一定是从函数图像上的某个点展开。注意,这里的余项即为误差,因为使用多项式函数在某点展开,逼近给定函数,最后肯定会有一丢丢的误差,我们称之为余项。是最简单的一类初等函数。如果函数足够平滑,在已知函数在某一点的各阶导数值的情况下,泰勒公式可以利用这些导数值来做系数,构建一个多项式近似函数,求得在这一点的邻域中的值。因为是用多项式函数去无限逼近给定的函数,所以两者之间肯定存在一丢丢的误差。
2025-02-10 17:31:16
1804
原创 二项分布之抛硬币
然后,15×0.0078125=0.117187515×0.0078125=0.1171875。要计算在10次抛硬币中出现3次正面的概率,我们可以使用二项分布的概率质量函数。首先,120×0.125=15120×0.125=15。因此,10次抛硬币中恰好出现3次正面的概率约为11.72%。这个结果可以表示为小数:0.1171875。或者转换为百分比:约11.72%
2025-02-10 11:51:28
566
原创 Python最全迭代器有哪些?
python中迭代器的使用是最广泛的,凡是使用for语句,其本质都是迭代器的应用。从代码角度看,迭代器是实现了迭代器协议的对象或类。__iter__()方法返回对象本身,他是for语句使用迭代器的要求。__next__()方法用于返回容器中下一个元素或者数据。当容器中的数据用尽时,引发StopIteration异常。任何一个类,只要实现了或者具有这两个方法,就可以称其为迭代器,也可以说是可迭代的。内置迭代器工具。
2023-04-25 15:15:42
640
原创 Pandas技术重点来了
Pandas库建立在NumPy之上,并为Python编程语言提供了易于使用的数据结构和数据分析工具。>>> df.info() #返回dataframe的基本信息。>>> df.iloc[0][0] # 根据索引获取。>>> df.shape # 返回行列(3,3)>>> df.index # 返回索引信息。一种具有潜在不同类型的列的二维标记数据结构。>>> df.columns #返回。一种能够保存任何数据类型的一维标记数组。2.1读取和写到Excel。2.1读取和写到CSV。
2023-04-25 10:49:23
598
原创 docker安装redis及使用
安装Redis1.通过docker search redis和docker pull redis下载redis镜像#docker pull redis2.创建 data 、conf、以及redis.conf配置文件,如若不然,无法通过redis deskTop manager访问#mkdir -p /root/redis/data //-p 表示递归创建 如果没有就创建mkdir -p /root/redis/confvim /root/redis/conf/redis.conf
2023-04-24 15:27:11
390
原创 带着疑问学C语言-C语言常用变量
目录一、声明变量和定义变量的区别是什么?一、声明变量和定义变量的区别是什么?什么是定义?在C语言中,使用变量前必须先定义变量。就是编译器创建了一个变量,为这个变量分配一块内存并命名(变量名)。例如:int a;int b=1;这条语句说明a是一个整型变量,编译器为其分配了一块大小为int型数据所占的内存空间。a没有被赋值,它的默认值为0,定义时也可以为其赋值进行初始化,如变量b。注意:不应该在头文件中定义变量,因为一个头文件可能会被一个程序的许多源文件所包含。什
2023-04-24 15:24:13
600
原创 NnumPy的技术重点来了
NumPy库是Python中科学计算的核心库。它提供了一个高性能的多维数组对象,以及使用这些数组的工具。可分为1维数组,2维数组,多维数组。
2023-04-24 13:41:08
211
原创 xshell xftp下载
xshell链接:https://pan.baidu.com/s/14gsry3LVjttIE6-raqp_lQ提取码:5b1wxftp链接:https://pan.baidu.com/s/1DvcVHo6_NM8Xskmfo6u3mQ提取码:qmii
2021-12-27 18:01:48
335
转载 docker安装redis及使用
安装Redis1.通过docker search redis和docker pull redis下载redis镜像#docker pull redis2.创建 data 、conf、以及redis.conf配置文件,如若不然,无法通过redis deskTop manager访问#mkdir -p /root/redis/data //-p 表示递归创建 如果没有就创建mkdir -p /root/redis/confvim /root/redis/conf/redis.conf
2021-12-02 14:00:16
532
原创 dpkg: error processing package initramfs-tools (--configure):
E: mkinitramfs failure find 141 cpio 141 gzip 1update-initramfs: failed for /boot/initrd.img-5.4.0-91-generic with 1.dpkg: error processing package initramfs-tools (--configure):installed initramfs-tools package post-installation script subprocess retu.
2021-12-02 13:57:58
2682
原创 flask应用celery(and factory)
本篇文章将解决flask在工厂模式下如何应用celery,解决celery循环导入,不能启动celery,在windows环境下不能处理接收任务的问题
2021-11-26 10:36:10
421
1
原创 Python中的wraps修饰器,@wraps的作用
在了解wraps修饰器之前,我们首先要了解partial和update_wrapper这两个函数,因为在wraps的代码中,用到了这两个函数。partial首先说partial函数,在官方的描述中,这个函数的声明如下:functools.partial(func, *args, **keywords)。它的作用就是返回一个partial对象,当这个partial对象被调用的时候,就像通过func(*args, **kwargs)的形式来调用func函数一样。如果有额外的位置参数(args)或者...
2021-11-16 16:57:48
796
1
lanms-neo-1.0.2-cp39-cp39-win-amd64.whl
2024-09-04
Python 数据分析与数据结构 齐伟著
2024-03-26
PotPlay视频播放器 安装包
2022-05-12
mysql分组提取特定组所有数据
2021-04-27
MySQL 分组后提取特定组数据
2021-04-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅