自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 聚类算法实践-KMeans算法

第一步和前几天实验一样,安装工具包,我们制定五个中心,以这五个点位为中心发散,定义这个发散后形成簇的大小,以及发散程度然后进行决策边界,我们要指定簇的个数k,查看他们的结果,可以发现每个点的归属,比如第一个点归属第3个簇下面的是测试,指定了四个点,用kmeans测试,这些0,4,1,1表示当前点所在的簇用下面模块可以看到那4个点到5个簇的距离。

2025-02-28 13:45:33 218

原创 DBSCAN算法

i=0,1,...n},计算点p(i)到集合D的子集中所以点之间的距离,距离按照从小到大的顺序排序,d(k)就被称为k距离。密度可达:若有一个点的序列q0、q1、...对任意qi-qi-1是直接密度可达的,则称从q0到qk密度可达,这实际上是直接密度可达的"传播"核心对象:在一个圆中存在的点的数量,也算是密度,如果我们设密度为3,那么我们会把最少有三个点的聚为一类。噪声点:不属于任何一个簇,比如核心对象为3,可旁边最多2个点聚在一起,这些点就称为噪声点。-领域的距离阈值:就是刚刚设定那个圆的半径r。

2025-02-24 13:04:32 410

原创 KMEANS算法

聚类:在我们手里没有监督位(标签),还要把所以相似的分在一起根据我们数据分布的不同,我们分成了几块,也就是聚类完,得到了几个类别。

2025-02-21 12:23:17 449

原创 逻辑回归.

图像画出来可以看到,随着花瓣宽度增加也就是横坐标,属于Vir这个花的概率在增加,属于其它类别的概率值在减小中间交会的地方(1.6,0.5)这个地方最难分辨。线性回归中,得到了具体回归值,逻辑回归是完成分类的,它是借助sigmoid函数来完成数值映射,通过概率值比较来完成分类任务。x0是竖着相同,x1是横着相同,我们接下来我们要把他们组合起来,也就是把所以可能的数据点全部做出来。通过y找到正确值的概率,传入对数函数中,越接近1,正确率越高,表示损失越小。我们以蓝色为正确值,越接近外面概率值越小,往里越大。

2025-02-20 12:53:51 270

原创 多项式回归

数据个数设为100,然后横坐标取值范围X设定为[-3,3],纵坐标可以随便找一个一元二次方程加上一个随机抖动前面的2.63是X,后面的6.95是X的平方接下来开始训练,把线性回归导进来,打印出来的结果表示0.96x+0.52x^2+0.03,这个回归方程和之前定义的结果差不多,也就是我们通过PolynomialFeatures训练后,得到一个多项式方程。

2025-02-18 19:55:55 542

原创 线性回归-代码

这个回归方程,对于每一个x都对应一个是偏置项,现在我们用这个最小二乘法能不能把这个算出来先构造一堆数据点,现在我们要构建一个回归方程来拟合这些数据点第一步我们要加,这个全为1,加上这一列来控制我们偏置项一个偏置项,一个权重项预测两个点,来构造一条线预测结果利用工具包来算权重和偏置。

2025-02-16 21:58:38 269

原创 模型评估方法

怎么用这个sklearn,我们可以先点开一个API文档,这个文档中我们可以搜索相关模块的作用,它会详细的介绍参数,属性调用,调用这个模型能做什么事,还有例子。我们这里手动取60000个train,10000个test,然后进行打乱数据,然后取一个数来训练,我们取了一个5,可以发现,我们在前10个样本中没有5。交叉验证方法比较多,接下来我们用sklearn中一种交叉验证方法(cross_val_score),在API中可以搜一下,这个比较容易些。还有降为算法,模型选择,数据预处理。

2025-02-13 13:24:06 278

原创 机器学习-梯度下降

当前我们优化要让它下降,所以我们要让它向山的最低点走,看山上的红圈该怎么下山,我们在图中给出三种下山路线,我们不光要下山,我们要选一条最快方式下山的路线,显然沿着切线方向是最快的,要下山我们现在要求它的一个梯度(切点或切点方向),正常求出的梯度是一个上升的方向,此时,我们要的是下山,沿着一个梯度的反方向走,所以我们管这个优化算法叫做。应该分开做,因为数据样本之间是独立的,如下图,我们先找到。我们挑十个样本,batch(批量),一般常见程序员都是2的几次幂,64,128等。

2025-02-09 19:51:31 172

原创 独立分布的意义

独立有什么影响:若拿到的数据是事先排好的,有逻辑性的,那么有可能对结果的输出就有一定的影响,例如成绩排名,若让模型判别好坏,若前几名学生判为好,那么对结果就会有一定影响,而我们希望每个数据是独立的,所以我们拿到数据一开始要打乱顺序。如果用乘积,则对结果很难求出,所以我们利用log,把乘换成加,但有人觉得那不结果也发生变化了,现在我们要求的的是L(:通过大量数据,找到最合适的一个参数,一旦独立同分布,则有一个前提,那就是联合概率密度=边缘概率密度的乘积。,数据x,标签y,当前不知道的是参数。

2025-02-08 11:34:16 318

原创 第五章 学习的机制

本章主要讲解的是如何自动化通过拟合函数。深度神经网络就是我们讨论一般函数,同时使用pytorch在这个过程中尽可能简单学习。

2025-02-07 14:39:14 446

原创 第4章 使用张量表征真实数据

pytorch深度学习基础入门

2025-01-17 21:09:06 830

实验六-1.py

实验六-1.py

2023-12-17

实验六-1-刘晓东.cbp

实验六-1-刘晓东.cbp

2023-12-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部