
机器学习
文章平均质量分 57
独酌无言
非宁静无以致远
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
刘建平博客latex公式提取
【代码】刘建平博客latex公式提取。原创 2024-06-18 17:11:59 · 395 阅读 · 0 评论 -
anaconda的基础用法
Conda创建环境相当于创建一个虚拟的空间将这些包都装在这个位置,我不需要了可以直接打包放入垃圾箱,同时也可以针对不同程序的运行环境选择不同的conda虚拟环境进行运行。这样就在这个房间里面买了一个’工具‘也就是所谓python包,我们的程序可以在这个房间里面运行。环境 = “好比一栋楼,在楼里面分配一间屋给各种‘包’放,每间房里面的‘包’互不影响”激活环境 = “告诉电脑,我现在要用这个屋子里面的‘包’来做东西了所以要进这间屋子”这是我已经安装的包,在这里面有的包我都可以当工具来使用。原创 2024-06-18 17:08:43 · 381 阅读 · 0 评论 -
间隔分离最大化的存在唯一性
证明存在性证明唯一性总结原创 2024-06-17 17:12:23 · 131 阅读 · 0 评论 -
SVM-SMO算法
输入是m个样本x1y1x2y2xmymx1y1x2y2...xmym其中x为n维特征向量。y为二元输出,值为1,或者-1.精度e。输出是近似解α1)取初值α00k0α00k02)按照选第一个变量的方法选择α1k\alpha_1^kα1k,接着按照选第二个变量的方法选择α2k\alpha_2^kα2k,求出新的α2newuncα2newuncα。原创 2024-06-16 20:31:22 · 1149 阅读 · 0 评论 -
逻辑斯蒂回归与最大熵
感觉深度之眼比较模棱两可,还是刘建平老师牛逼,清晰易懂。原创 2024-06-15 22:25:15 · 201 阅读 · 0 评论 -
SVM支持向量机
打个比方,要把刀哥和吴彦祖分开,豆子代表人们,加上几个特征(维度)1.20-40岁 2.女性 就可以大致将人们分的差不多了,可以继续加特征(维度)来使其更加分离。尽量小,误分类的点尽可能的少。都可以作为最终的结果, 但是我们一般采用一种更健壮的办法,即求出所有支持向量所对应的。我们可以先求优化函数对于w,b的极小值, 接着再求拉格朗日乘子α和 μ的极大值。都是一样的,这里我们仍然这么写是为了和后面加入软间隔后的SVM的算法描述一致。是函数间隔,是可变的间隔,所以我们通过变换将要求的几何间隔变为求函数间隔。原创 2024-06-15 22:24:07 · 727 阅读 · 0 评论 -
决策树的概念和构建
构建的二叉树尽量均衡就像一个班60个人的实力都差不多,现在要选一个人去拯救世界,就确定不了,但是一个班有一个人能力特别特出,选这个人去拯救世界的概率就比较大,就比前面的情况更有确定性最大的那个值就算均匀分布时候的那个值原创 2024-06-05 00:37:00 · 672 阅读 · 0 评论 -
朴素贝叶斯
那个不太懂的点其实是Dodo讲错了,那里还是累乘的符号,然后64种情况累乘起来就是P(X=x),这是固定的,假设为C。P(Y=CK)这是按照训练集0~9的个数来计算的,注意维度的区别,有些是像素维度,有些是图片维度。注意之前我们讲的数据集是8*8的矩阵,然后我们处理矩阵的方式就是讲矩阵排列成一行。我们假设这个像素点的出现是相互独立的(在现实中并不是相互独立的)如果训练集中没有0,那么P(Y=CK)=0,就不能当分母了。注意P(B)=1, 已经知道路人抽中的就是绿豆。在X的条件下分别等于0~9的概率。原创 2024-05-26 23:41:11 · 460 阅读 · 0 评论 -
k近邻和kd树
前提是已经有了一棵kd树,然后来一个实例点。采用树这个特殊的数据结构来实现k近邻算法。选取k值的时候可以采用交叉验证的方法。找这个中位数是按照每棵子树来创建的。下面讲解kd树的完整构造过程。原创 2024-05-24 16:18:25 · 349 阅读 · 0 评论 -
感知机代码
这段代码主要是判断给的图片是不是0-9之间的数据,不可细分0-9。相当于是28*28=784维度的空间,然后训练w。tqdm可以显示进度条。原创 2024-05-14 22:31:32 · 167 阅读 · 0 评论 -
感知机导论
感知机也可以多分类,把多个感知机模型结合起来方便统一形式,规定一下后面的格式规定这种格式主要目的是为了简洁推导和方便coding最后一个式子是我们想办法要推导的k≤Rγ2k≤γR2∣∣wopt∣∣1∣∣wopt∣∣1表示这是几何距离,这是单位法向量.统一了单位存在γ0yiwopt∗xibopt≥γ\gamma>0,\;原创 2024-05-08 11:40:04 · 414 阅读 · 0 评论 -
统计学习方法-导论
就像一个小学生不做作业,然后被爸爸打了,然后小学生就知道做作业了,因为赌博还没有被爸爸打,所以小学生以为赌博是对的,就去赌博,然后又被爸爸打了,小学生才知道不能赌博无监督模型后面没有label(是否招女孩子喜欢)对于监督学习而言呢,从数学形式来讲,主要分两种,我们首先看一下训练集呢,我一般是这样表述的,这个T就代表训练集去圈你。training data, x1就表示这条样本,y就表示是否招女孩子喜欢,比如说这个x(x(1),x(2)…)就是我们之前的体重,身高,年龄对于每一个x呢,它其实是有很多维度的,它原创 2024-05-06 00:55:10 · 662 阅读 · 1 评论 -
anaconda的安装和Jupyter Notebook修改默认路径
c.NotebookApp.notebook_dir = //这个不是搜索出来的,是要自己加上去的一条。然后不能在开始菜单中通过快捷方式打开,这个打开那个路径不生效,自己也不知道什么原因。要是没有配置这个环境变量,后面就不能cmd启动Jupyter Notebook。按照那个标志打开,那个文件的属性是没有网上说的那个属性的。我们要找到Jupyter Notebook的配置文件。很多文章都比较老旧了,这个问题一个是新版本才有的。就可以找到存放配置文件的路径了。只能通过管理员模式的cmd打开。原创 2024-04-30 19:43:04 · 768 阅读 · 1 评论