自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Sklearn 与 TensorFlow 机器学习实用指南-第八章 降维-笔记

降维→训练速度会加快降维≠更好的训练效果,效果取决于数据集。

2025-04-23 18:29:47 1289

原创 Sklearn 与 TensorFlow 机器学习实用指南-第七章 集成学习和随机森林-笔记

对一个复杂问题来说,很多人的答案的组合,往往比一个专家的答案要好。这就叫做群体智慧。合并一组分类器的预测(像分类或者回归),往往也会得到比单一分类器更好的预测结果。上述一组分类器就叫做集成,例如,决策树的集成就叫做随机森林本章中我们会讨论特别著名的集成方法,包括 bagging, boosting, stacking等,会讨论随机森林。

2025-04-17 18:55:11 1042

原创 Sklearn 与 TensorFlow 机器学习实用指南-第六章 决策树-笔记

补充:本文是关于《Sklearn 与 TensorFlow 机器学习实用指南》的学习笔记,基于本文和原文的区别:本文会更精简、系统地表述书中概念,会对书中未介绍的陌生概念加以解释,每行我都会添加注释,介绍具体做了什么。后续会持续更新所有章节正文开始 ~

2025-04-11 18:41:57 889

原创 Sklearn 与 TensorFlow 机器学习实用指南-第五章-支持向量机-笔记

需要非线性分类 → 选 SVC;线性分类且数据量适中 → 选 LinearSVC;数据极大或需在线更新 → 选 SGDClassifier。上述分类器的损失函数:

2025-04-09 18:33:38 935

原创 Sklearn 与 TensorFlow 机器学习实用指南-第四章 训练模型-笔记

本章讨论对于机器学习模型的理解、构建。首先,以一个简单的线性回归模型为例,讨论两种不同的训练方法来得到模型的最优解:方式一:使用公式,计算得到使损失函数达到最小值的模型参数方式二:使用迭代优化方法:梯度下降(GD),也会介绍一些梯度下降的变体形式:批量梯度下降(Batch GD)、小批量梯度下降(Mini-batch GD)、随机梯度下降(Stochastic GD)接下来研究一个更复杂的模型-多项式回归,探讨什么是过拟合以及正则化。

2025-03-31 18:17:12 947

原创 Sklearn 与 TensorFlow 机器学习实用指南-第三章 分类-笔记

MNIST数据集:由美国的高中生和美国人口调查局的职员手写而成的70000 张数字图片。类似我们将基于这个数据集,介绍分类。

2025-03-27 17:36:44 695

原创 Sklearn 与 TensorFlow 机器学习实用指南-第二章 端到端的机器学习项目-笔记

转换器:实现增加组合属性、数据清洗之类的操作的类(对本例来说)下面是一个增加组合属性的转换器rooms_ix, bedrooms_ix, population_ix, household_ix = 3, 4, 5, 6 # 所在列的索引# 创建一个类并执行三个方法:fit()(返回self),transform(),和fit_transform()

2025-02-28 19:19:57 713

原创 Sklearn 与 TensorFlow 机器学习实用指南-第一章 机器学习概览-笔记

机器学习是通过编程让计算机从数据中进行学习的科学(和艺术)。机器学习是让计算机具有学习的能力,无需进行明确编程。—— 亚瑟·萨缪尔,1959计算机程序利用经验E学习任务T,性能是P,如果针对任务T的性能P随着经验E不断增长,则称为机器学习。—— 汤姆·米切尔,1997(例如垃圾邮件分类,任务T就是标记新邮件是否是垃圾邮件,经验E是训练数据,性能P需要定义:例如,可以使用正确分类的比例。这个性能指标称为准确率,通常用在分类任务中。

2025-02-28 10:44:51 847

原创 ubuntu安装ragflow+ollama,构架本地知识库大模型,踩坑记录

等一起食用。

2025-02-19 16:51:07 1838

原创 transformer实战-序列标注的代码解读

第九章:序列标注任务 · Transformers快速入门本文扩展的内容:1.功能概括更精简、具体,2.代码逐句详细解读,3.包含原文中涉及到的专业名词简介序列标注任务即为词语打标签,分为两类,本文针对命名实体识别命名实体识别 NER :识别出文本中诸如人物、地点、组织等实体,即为所有的待识别词语打标签。

2024-11-04 13:40:50 899

原创 transformer实战-抽取式问答任务-代码解读

我们的目的是使用 Transformers 库来完成pipeline自动封装的过程(文本编码,将输入送入模型,对模型输出进行处理)下面我们用transformer来完成基于context中回答question的功能,并且返回截取片段的起始终止位置和概率。首先了解分词器tokenizer以及相关概念和调用方法。

2024-10-30 14:27:41 206

原创 # 基于Transformers的BERT模型实战之微调句子对分类模型-代码逐句解读

【代码】# 基于Transformers的BERT模型实战之微调句子对分类模型-代码逐句解读。

2024-10-23 18:10:18 274

原创 图片分类,代码逐句解读

FashionMNIST 数据集是一个常用的计算机视觉数据集,常用于训练和测试图像分类模型。它包含 10 类不同类型的服装图像,每类有 6000 张训练图像和 1000 张测试图像。我们构建了一个含有ReLU激活函数的两个全连接隐藏层和一个分类层的神经网络,在训练集上训练迭代得到最佳参数,然后测试集上检查正确率。

2024-10-18 15:00:28 608

原创 transformer代码逐句解读

transformer代码解读

2024-10-10 18:25:00 494

原创 逐句解析如何使用nnlm模型实现单词预测

实现了一个简单的神经网络语言模型(NNLM),用于预测给定前n-1个单词的下一个单词。通过训练,模型能够学习到单词之间的上下文关系,从而进行预测。

2024-09-05 14:46:24 195

原创 docker容器占用资源的管理

如果不指定或将其设置为0,都将使用默认值。为了避免内存不足,唤起的内存管理器OOM killer杀掉docker进程时,我们可以给它的--oom-score-adj 配置一个比较低的数值(但应高于docker进程的该值,默认-500)注意,指定--memory大小时,会自动将--memory-swap设置成--memory的两倍,更改--memory大小时候,需要注意--memory-swap的限制。新建:docker run -it --rm --cpuset-cpus="1" 镜像名称:版本。

2023-11-13 18:36:23 424

原创 python 成绩排名,排位次(不使用第三方库)

成绩排名,排名次,rank

2023-02-23 18:21:34 2752 1

原创 docker打包本地python项目为镜像时,排错记录

docker 排错

2023-02-13 15:23:04 1081 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除