
机器学习专题
文章平均质量分 61
hi-ha-hi
这个作者很懒,什么都没留下…
展开
-
(一)RAG
检索增强生成(Retrieval-Augmented Generation)RAG是一个将输入与一组相关的支持文档结合起来的技术,这些文档通常来自于像维基百科这样的来源。这些文档被添加到输入提示中,一起送入文本生成器,从而产生最终的输出。RAG的这一机制特别适用于需要应对信息不断更新的场景,因为大语言模型(LLM)所依赖的参数知识本质上是静态的。通过RAG,语言模型可以不经过重新训练而直接访问最新信息,以便生成可靠的、基于检索的输出。RAG的典型工作流程是指LLM系统需要回答的问题。转载 2025-04-20 16:25:38 · 10 阅读 · 0 评论 -
如何使用Ubuntu下载kaggle数据
kaggle在ubunut下面使用命令行原创 2022-07-19 14:14:00 · 501 阅读 · 0 评论 -
如何使用tensorboard可视化训练结果
如何使用tensorboard可视化训练结果。原创 2022-07-17 09:37:32 · 552 阅读 · 0 评论 -
pytorch训练分类模型时的注意事项
使用pytorch训练模型时,损失函数与激活函数的关系原创 2022-06-19 16:49:03 · 236 阅读 · 0 评论 -
keras使用load_weights遇到报错
keras如何加载模型原创 2022-06-10 10:34:46 · 4110 阅读 · 0 评论 -
第六章 支持向量机
本章内容简单介绍支持向量机利用SMO(序列最小优化)进行优化利用核函数对数据进行空间转换将SVM和其他分类器进行对比一、基于最大间隔分隔数据支持向量机SVM优点:返回错误率低,计算开销不大,结果已解释缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二分类问题适用数据类型:数值型和标称型数据一些概念线性可分:使用一条直线分隔两类数据。分隔超平面:将数据集分隔开来的直线称为分隔超平面。在二维平面上,分隔超平面是一条直线,在三维数据上,分隔超平面就是一个平原创 2021-07-18 16:07:34 · 235 阅读 · 1 评论 -
第五章 Logistic回归
本章内容Sigmoid函数和Logistic回归分类器最优化理论初步梯度下降最优化算法数据中的缺失项处理文章目录本章内容`Logistic`回归的一般过程一、基于`Logistic`回归和`Sigmoid`函数的分类`Logistic`回归二、基于最优化方法的最佳回归系数确定梯度上升法梯度下降训练算法:使用梯度上升找到最佳参数分析数据:画出决策边界训练算法:随机梯度上升三、从疝气病预测病马的死亡率准备数据:处理数据中的缺失值测试算法:用`Logistic`回归进行分类附录:代码原创 2021-06-12 21:35:45 · 493 阅读 · 2 评论 -
第四章 基于概率论的分类方法-朴素贝叶斯
文章目录本章内容一、基于贝叶斯决策理论的分类方法二、条件概率三、适用条件概率来分类四、使用朴素贝叶斯进行文档分类五、使用Python进行文本分类准备数据:从文本中构建词向量训练算法:从词向量计算概率测试算法:根据现实情况修改分类器准备数据:文档词袋模型六、示例:使用朴素贝叶斯过滤垃圾邮件测试算法:使用朴素贝叶斯进行交叉验证附录:代码本章内容使用概率论分布进行分类学习朴素贝叶斯分类器解析RSS源数据使用朴素贝叶斯来分析不同地区的态度一、基于贝叶斯决策理论的分类方法优点:数据较少的情况相爱仍原创 2021-06-07 13:49:09 · 418 阅读 · 0 评论 -
第三章 决策树
文章目录决策树:本章内容一、决策树简介二、决策树的构造划分数据信息增益划分数据集递归构建决策树使用`Matplotlib`注解绘制树形图构造注解树三、测试和存储分类器测试算法:使用决策树执行分类使用算法:决策树的存储四、示例:使用决策树预测隐形眼镜类型五、附录:代码决策树:本章内容决策树简介在数据集中度量一致性使用递归构造决策树使用Matplotlib绘制树形图一、决策树简介如下图所示的流程图就是一个决策树。正方形代表判断模块;椭圆形代表终止模块,可以已经得出结论,可以终止运行。从判断原创 2021-06-06 15:15:57 · 233 阅读 · 0 评论 -
第二章 k-近邻算法
k-近邻算法本章内容k-近邻算法从文本文件中解析和导入数据使用Matplotlib创建扩散图归一化数值K-近邻算法(kNN)简单说,k-近邻算法采用测量不同特征值之间的距离方法进行分类优点精度高,对异常值不敏感,无数据输入假定缺点计算复杂度高,空间复杂度高使用数据范围:数值型和标称型工作原理存在一个样本数据集合,也称为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系输入没有标签的新数据后,将新数据的每个特征与样本集原创 2021-06-02 15:31:16 · 144 阅读 · 1 评论 -
第一章机器学习实战-绪论
基本概念有监督学习分类和回归在分类算法中目标变量的类型通常是标称型的,在回归算法中通常是连续型的无监督学习聚类:将数据集合分成由类似的对象组成的多个类的过程被称为聚类密度估计:寻找描述数据统计值的过程称为密度估计用于执行分类、回归、聚类和密度估计的机器学习算法监督学习算法监督学习算法用途k-近邻算法线性回归朴素贝叶斯算法局部加权线性回归支持向量机Ridge回归决策树Lasso最小回归系数估计无监督学习算法无监督学习原创 2021-06-02 15:30:35 · 112 阅读 · 0 评论 -
PyTorch加载模型碰到Missing key(s) in state_dict报错
问题描述在PyTorch训练好模型以后,需要加载模型,加载模型代码如下ckpt = torch.load(model_path_len)model.load_state_dict(ckpt['state_dict'])结果碰到的问题为:Missing key(s) in state_dictraise RuntimeError('Error(s) in loading state_dict for {}:\n\t{}'.format(RuntimeError: Error(s) in原创 2021-05-06 18:53:49 · 14252 阅读 · 11 评论 -
numpy常用操作
numpy.meannp.mean(data,axis=0)np.mean(data,axis=1)此处data是二维数组,axis=0输出一行,表示求每一列的均值,axis=1输出的是一列,表示求每一行的均值np.std此函数用于求标准差np.std(data,axis=0)np.std(data,axis=1)data为二维数组,axis=0求每一列的标准差,输出为一行;axis=1求每一行的标准差。输出为一列。np.where返回一组索引值如果是一维数组,则返回原创 2021-03-28 20:43:25 · 431 阅读 · 0 评论 -
(一)torchvision对象检测微调教程(Kaggle运行)
在Notebook中,如何引入外铺的py文件在本篇文章中,将通过演示torchvision对象检测微调教程(pytorch的目标检测的官方教程)在运行本代码之前,需要注意一下几点:1、官方给出的代码中,有些依赖是没有的,需要我们自己去下载[依赖下载],此处给出的是一个github地址,把其中的references/detection/*下面的py文件全部下载复制到你的运行的目录下2、由1可以知道,这个项目需要引入外部的py文件,如果是在pycharm中,则直接import即可,但...原创 2021-01-25 12:48:24 · 937 阅读 · 1 评论