自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

wxchyy的博客

笔者用以记录学习过程中的笔记和反思

  • 博客(34)
  • 收藏
  • 关注

原创 动手学生成式深度学习VAE(包含变分自编码器生成数字图像实践 | 完整代码 | Pytorch实现)

本期以一个生成手写数字图像的图像讲述了VAE模型架构的原理,下期我们将以GAN的方式完成这个实践。

2025-04-05 09:00:00 454

原创 动手学循环神经网络(RNN | LSTM | GRU)(LSTM预测股票行情 | Pytorch实现完整代码)

本期介绍了RNN、LSTM以及GRU,并用一个小示例LSTM预测股票的行情来让大家加深对于循环神经网络的了解。

2025-04-04 12:09:50 550 4

原创 动手学卷积神经网络(CNN)(VGG网络模型实现CIFAR-10多分类)(包含 VGG11,VGG13,VGG16,VGG19 Pytorch 代码实现)

本期使用了VGG16架构的卷积神经网络去处理了上期讲的CIFAR-10多分类问题,精度相较于上期也是有了不小的提高,下期我们实践操作RNN循环神经网络。

2025-04-03 09:00:00 875 6

原创 动手学卷积神经网络(CNN)( CIFAR-10多分类实战完整代码 | 手把手教你 | Pytorch实现)

CIFAR-10数据集由10个类的60000个32×32彩色图像组成,每个类有6000个图像。有50000个训练图像和10000个测试图像。1 引入头文件2 数据集下载笔者把数据集放在百度网盘里了,有需要的可以自取。数据集注意:本项目我们只需要用到python版本,将这个文件解压在你的数据文件路径之下。由于我们已经下载并解压了文件夹,所以我们用torchvision.datasets.CIFAR10函数的参数download设置为False。

2025-04-02 15:55:47 1007

原创 万字长文一文了解常用激活函数 | 常用损失函数 | 常用梯度优化算法 | 过拟合与欠拟合 | 梯度消失和梯度爆炸

本期将对深度学习中所需要的基础知识进行总结。之后几期我们将开启实战专栏,一步一步带领大家搭建深度神经网络,从入门到实践。RMSprop、Adadelta和Adam被认为是自适应优化算法,因为它们会自动更新学习率。而使用SGD时,必须手动选择学习率和动量参数,通常会随着时间的推移而降低学习率。有时可以考虑综合使用这些优化算法,如采用先使用Adam,然后使用SGD的优化方法,这个想法,实际上是由于在训练的早期阶段SGD对参数调整和初始化非常敏感。

2025-04-01 14:30:00 790

原创 PyTorch 快速上手:从张量操作到深度学习的必备指南

本期将介绍深度学习PyTorch框架。utils.data包括Dataset和DataLoader。torch.utils.data.Dataset为抽象类。定义数据集需要继承这个类,并实现两个函数,一个是__len__,另一个是__getitem__。__getitem__一次只能获取一个数据,所以需要通过torch.utils.data.DataLoader来定义一个新的迭代器,实现batch读取。dataset,shuffle=False,#是否将数据打乱sampler=None,#样本抽样。

2025-04-01 09:00:00 946 6

原创 《后端开发必收藏!这篇文章让你彻底搞懂 Web 基础》(万字长文一文通透理解)

本期也属于Java后端专栏,笔者为复习Web基础知识所特意出的一期,仅作为复习参考笔记。本期从HTTP协议以及CGI技术讲起,分别介绍了Java Web开发中最基础的Servlet技术和JSP技术以及Java Web开发中主流的MVC设计模式。

2025-03-31 09:00:00 1851 12

原创 NumPy 向量化运算:让你的代码快到飞起的秘密武器

本期笔者将开设新的专栏深度学习,手把手带领大家进入深度学习的世界,不过在这之前,我们需要先学习Pytorch框架,而学习Pytorch首先需要对Numpy有一定了解。Numpy支持向量化运算,相较于Python中的循环速度快了大概400倍。本期为Numpy基础。下期为Pytorch入门。Numpy的创建以及操作到此就基本结束了,下一篇我们将介绍一下Pytorch框架。

2025-03-30 14:17:41 759 6

原创 JAVA基础知识总结(万字长文一文了解JAVA所有基础知识)(补充篇)(正则表达式+Lambda表达式)

这期是Java长文总结的补充篇,主要总结Java中遇到的正则表达式与Lambda表达式。!!本期总结了正则表达式和Lambda表示式。

2025-03-30 09:00:00 939 2

原创 JAVA基础知识总结(万字长文一文了解JAVA所有基础知识)(并发+反射+注解+动态代理+类加载器)(下)

这期是Java长文总结的下篇,主要总结Java中并发以及Java中的动态特性相关知识。!!继承 ClassLoader 类:自定义类加载器需要继承 java.lang.ClassLoader 类。重写 findClass 方法:在 findClass 方法中实现从特定来源加载类的字节码,并调用 defineClass 方法将字节码转换为 Class 对象。示例代码如下:@Overridetry {//示例Class<?Class<?if(class1!

2025-03-29 09:02:10 765 6

原创 【蓝桥杯备赛】——每日一题(劲舞团+召唤数学精灵)(文件输入处理+找规律)(第十五届蓝桥杯C++组大赛)(day9)

今天是蓝桥杯备赛每日一题的第九天,感兴趣的小伙伴,可以订阅一下专栏。友友们一定要一起跟着做一下,这样印象才深刻!!!今天的话来两道填空题,填空题也是蓝桥杯必不可少的题型。

2025-03-28 09:00:00 1047 6

原创 【蓝桥杯备赛】——每日一题(植物生命力)(树状数组+单点修改+区间查询)(第十五届蓝桥杯C++组大赛)(day8)

今天是蓝桥杯备赛每日一题的第八天,感兴趣的小伙伴,可以订阅一下专栏。友友们一定要一起跟着做一下,这样印象才深刻!!!本题需要前置知识树状数组,题目包含了对树状数组最基本的操作,单点修改和区间查询。

2025-03-27 17:25:16 840 2

原创 【蓝桥杯备赛】——每日一题(最大异或结点)(字典树+删除操作)(第十五届蓝桥杯C++组大赛)(day7)

今天是蓝桥杯备赛每日一题的第七天,感兴趣的小伙伴,可以订阅一下专栏。友友们一定要一起跟着做一下,这样印象才深刻!!!今天的题目是关于Trie树的,题目还是比较有趣的。

2025-03-24 09:00:00 1795 2

原创 JAVA基础知识总结(万字长文一文了解JAVA所有基础知识)(中)

这期是Java长文总结的中篇,主要总结Java中常用的类、泛型、容器相关知识。长文预警!!!容器类有两个根接口,分别是Collection和Map, Collection表示单个元素的集合,Map表示键值对的集合。Collection表示的数据集合有基本的增、删、查、遍历等方法,但没有定义元素间的顺序或位置,也没有规定是否有重复元素。List是Collection的子接口,表示有顺序或位置的数据集合,增加了根据索引位置进行操作的方法。

2025-03-23 15:20:22 2266 8

原创 【蓝桥杯备赛】——每日一题(封闭图形个数)(STL(vector) + 自定义排序)(第十五届蓝桥杯C++组大赛)(day6)

今天是蓝桥杯备赛每日一题的第六天,感兴趣的小伙伴,可以订阅一下专栏。友友们一定要一起跟着做一下,这样印象才深刻!!!今天的题目相对简单,大家可以动手做一张。

2025-03-23 09:00:00 382

原创 【蓝桥杯备赛】——每日一题(砍柴)(线性筛质数+动态规划+博弈论)(第十五届蓝桥杯C++组大赛)(day5)

今天是蓝桥杯备赛每日一题的第五天,感兴趣的小伙伴,可以订阅一下专栏。友友们一定要一起跟着做一下,这样印象才深刻!!!

2025-03-22 09:00:00 1240

原创 JAVA基础知识总结(万字长文一文了解JAVA所有基础知识)(上)

今天笔者将会开启新的专栏,后端开发,在这之前,笔者先总结一下所有JAVA基础知识以及后续JVM的深度解析,以供后续阅览参考,由于篇幅原因,Java专栏将分为上、中、下三期。本篇仅供查阅复习使用。后几期也会进行总结。长文警告!!!我们将类看作自定义数据类型,用于表示和处理基本类型以外的其他数据。一个数据类型由其包含的属性和该类型可以进行的操作组成,属性可以分为类本身的属性,也可以是实例具有的属性,操作也类似。类型本身具有的属性,通过类变量体现。类型本身可以进行的操作,通过类方法体现。

2025-03-21 19:36:52 847 13

原创 【蓝桥杯备赛】——每日一题(智力测试)(离散化+组合数+逆元+前缀积)(第十五届蓝桥杯C++组大赛)(day4)

今天是蓝桥杯备赛每日一题的第四天,感兴趣的小伙伴,可以订阅一下专栏。感兴趣的友友可以一起跟着做一下!!!今天的题目特别繁琐,博主debug了好一会,会把遇到的坑写下来,希望友友们能够快速AC。

2025-03-21 09:00:00 1073

原创 【蓝桥杯备赛】——每日一题(挖矿)(贪心+前缀和)(第十五届蓝桥杯C++组大赛)(day3)

今天是蓝桥杯备赛每日一题的第三天,感兴趣的小伙伴,可以订阅一下专栏,每天早上9点会有一道题目。感兴趣的友友可以一起跟着做一下!!!

2025-03-20 09:00:00 863 2

原创 【蓝桥杯备赛】——每日一题(吊坠)(Prim算法+最长公共子串算法结合)(第十五届蓝桥杯C++组大赛)(day2)

今天是蓝桥杯备赛每日一题的第二天,加油!!!

2025-03-19 12:08:35 842 4

原创 【蓝桥杯备赛】——每日一题(商品库存管理)(差分+前缀和)(day1)

今天会开一个新的专栏,蓝桥杯备赛专栏,由于博主报名参加了蓝桥杯算法C++竞赛,所以会带着大家每天刷一道题目,同时之后也会分享博主花了7天时间准备的算法笔记。

2025-03-18 22:04:23 448

原创 强化学习:TRPO,PPO,GRPO算法(一文深度解析deepseek中的强化学习算法)——手把手教你入门强化学习(九)

在上期我们介绍了策略梯度(PG算法),这期我们将继续深入PG算法,从TPRO、PPO,到最后最近大火的deepseek中的强化学习算法GPRO。这期我们从TRPO入手,讲了KL散度约束以及在约束下,最大期望优势函数,之后PPO在TRPO的基础上,采用了剪裁概率,进行了计算复杂度的改进,以及引入可自适应的KL惩罚,在这基础之上,GRPO通过组相对策略优化,直接消除了价值函数。希望本文能帮助你自然地理解 TRPO,PPO 以及 GRPO。

2025-03-17 19:09:36 1992 26

原创 强化学习:策略梯度算法(PG算法族)——手把手教你入门强化学习(八)

上期我们解释了DQN算法,就是使用神经网络去模拟了状态动作价值函数,这期我们同样是使用神经网络,跟上期不一样的是,我们是去模拟策略函数。而PG方法同样有很多算法,这期我讲几个重要的经典算法,DPG和Actor-Critic算法。使用DQN算法,我们得到的并不是一个完整的策略,而是一个列表。机器人输入一个状态s,相当于将这个s作为索引,遍历Q(s,a),通过比较得到一个估值比较高的a。每次都要通过查表获得一个动作,然后将一个个片段连接起来,才能构成一个完整的、貌似思维连贯的策略。

2025-03-17 11:29:11 717 5

原创 强化学习:一文通透DQN算法及其变种(你要的深度强化学习算法)——手把手教你入门强化学习(七)

上期我们讲了Q-Learning算法,但是这个算法对一些复杂场景可能解决不了,类似环境输入为图像,视频这种(维度太高)。这时候我们就可以把深度学习和强化学习结合起来,用深度神经网络去模拟状态动作价值函数Q,这也就产生了我们本期想要讲的算法——DQN(Deep Q-Learning Netword),本期将讲述三个不同版本的DQN算法,从2013版DQN,2015版DQN最后再讲一下DQN的变种Double DQN算法。同时理解本期内容需要一定深度学习知识。

2025-03-16 16:36:29 1161 6

原创 强化学习:时间差分(TD)(SARSA算法和Q-Learning算法)(看不懂算我输专栏)——手把手教你入门强化学习(六)

前两期我们介绍了动态规划算法,还有蒙特卡洛算法,不过它们对于状态价值函数的估值都有其缺陷性,像动态规划,需要从最下面向上进行递推,而蒙特克洛则需要一个Episode(回合)结束才能对其进行估值,有没有更直接的方法,智能体能边做动作,边估值一次,不断学习策略?答案是有的。这就是本期需要介绍的算法,时间差分法(Time Difference,TD)法。本期将介绍两个典型经典的TD算法,SARSA算法 和 Q-learing算法。它们都是无模型强化学习方法,直接跟环境进行交互来估算动作价值函数。

2025-03-16 11:52:03 1090

原创 强化学习:蒙特卡洛算法求解最优状态价值函数——手把手教你入门强化学习(五)

上期介绍了动态规划,本期将介绍蒙特卡罗算法。我们也会称“蒙特卡洛法”,翻译的不同,我们就不深究了,同样,这期笔者会尽量用通俗易懂的语言来让大家能够真正读懂!!!蒙特卡罗法的过程,是一个通过不断采样让样本丰富起来,进而比较准确地估算出由策略π驱使的某个状态的估值Vπ(s)的过程。一旦准确地计算出这个估值,我们就可以沿用动态规划的方法进行策略优化了。缺点:在开始的几十个甚至上百个Episode中,前几次实验结果的方差一定大得惊人,因为这时候我们的初始数据是随机的。

2025-03-15 12:56:10 925

原创 强化学习:动态规划求解最优状态价值函数——手把手教你入门强化学习(四)

首先我们将强化学习算法分为基于模型的和不基于模型的,本期博客将会首先介绍基于模型的强化学习算法,基于模型的强化学习算法,主要包括动态规划策略求解,蒙特卡罗算法,以及Dyna-Q,本次先从介绍动态规划入手。本期详细介绍了动态规划求解最优状态价值函数。下期会介绍蒙特卡罗法,希望大家点点关注!!!如果想要更深入学习强化学习的内容,关注我,下期更精彩。

2025-03-14 21:12:29 804 2

原创 强化学习:实践理解Markov决策过程(MDP)——手把手教你入门强化学习(三)

本博客将带领大家编程进行实践,巩固上期博客中Markov决策过程的核心概念。新来的友友还不是很了解强化学习的,可以看笔者的前两期博客,看完后,你一定会有所收获的,话不多说,咱们直接干中学吧!!!本期为代码实践环节,从构建学生马尔可夫奖励过程到构建学生马尔可夫决策过程,我们能更好的理解上期所讲述的内容。如果想要更深入学习 的内容,关注我,下期更精彩。

2025-03-13 21:20:54 755

原创 强化学习:Markov决策过程(MDP)——手把手教你入门强化学习(二)

本期是手把手教你入门强化学习第二篇了,在这期,笔者会介绍强化学习中最核心的数学模型——Markov决策过程,用来描述智能体(Agent)与环境(Environment)交互的框架。同样会尽量通俗易懂,不过本次会有大量数学推导,如果对此不了解的友友,看不懂的没有关系,跟上期一样同样会有实践代码环节,帮助大家更好地理解背后的原理。本博客从马尔可夫性质引入,到马尔可夫过程,再到马尔可夫奖励过程,最后到马尔可夫决策过程,从中讲述了强化学习中最重要的几个概念,包括策略函数状态转移价值函数最优行为价值函数。

2025-03-13 19:14:01 984

原创 强化学习:基础知识篇(包含Gym库的简单实践)——手把手教你入门强化学习(一)

本期笔者将开启新的专栏–手把手教你入门强化学习。强化学习正在改变人类社会的方方面面,像基于强化学习的游戏AI,AlphaGo,以及最近大火的Deepseek的GRPO算法等等。所以笔者希望能带领大家走入强化学习的世界,同样笔者会尽量以通俗易懂的语言带领大家入门强化学习,当然,我的栏目还是喜欢以实践为主,本教程依旧是从入门到实践,先会简单介绍强化学习基础概念,然后会以Gym(强化学习环境库)进行一个案例的实操。在了解一个概念之前,我们必须先知道,它是什么,能帮我们解决什么问题以及它有什么优势。

2025-03-12 16:18:46 1469

原创 云计算——Docker容器实践入门(手把手教你入门云计算(三))

这个实践内容特别简单,不过却可以让你对于docker的使用有个初步的了解,如果想要更深入的内容,关注我,下期更精彩。

2025-03-11 21:42:17 880

原创 手把手教你入门云计算(二):这些技术改变了世界,你也能轻松掌握

由于笔者上一篇只是总结了基础知识方面,这一篇开始走进云计算核心技术方面,还是照旧,我会以尽量用简单的语言来总结知识点。话不多说,坐稳扶好,咱们开始!!!如果不熟悉基础知识的可以看笔者的上篇文章。虚拟化是指将物理IT资源转换为虚拟IT资源的过程。它的本质是“物理资源抽象化与逻辑化重构”,通过软件将硬件资源转化为可灵活分配、隔离且可编程的虚拟资源,打破物理设备的固有边界,实现资源利用率与灵活性的革命性提升。

2025-03-10 15:34:40 1205

原创 手把手教你入门云计算(一):云计算居然是“电”,和云计算谈一场永不分手的恋爱?这篇攻略收好

由于笔者最近需要编一本教材关于云计算方面的章节,目前会先总结一下云计算的基础知识,由于是基础知识,本文不会有特别多的技术深度,但也会尽可能的让你理解云计算的本质,知道它的来世今生,当然,笔者会把它揉碎给你讲清楚,语言也会尽量通俗易懂,废话不多说,进入正篇!!!云计算,我们究其本质,它是一种“计算”模式,它从“传统模式的本地部署”、“固定资源配置”及“集中式管理”,向以“广泛的网络接入”​、​“计算、存储的集中资源池化”​、​“快捷的弹性伸缩”​、​“按需自助及可计量的服务”为典型特征的云计算模式的演变。

2025-03-09 17:44:00 1039 3

原创 小白避坑指南:国内用Colossal-AI微调DeepSeek 1.5B的完整踩坑记录(附镜像加速方案)

使用Colossalai+Lora进行sft微调deepseek蒸馏模型

2025-03-08 17:52:48 1756

深度学习与Web开发依赖包解析:requirements.txt详细解读及其应用场景

内容概要:本文档详细列出了用于深度学习与网络应用项目的 Python 第三方库依赖列表(requirements.txt)。它主要包含了一大批用于数据处理、机器学习模型构建训练、部署、加速计算等方面的依赖项。从版本号可以看到,很多组件处于更新活跃期,在深度学习框架、加速库(如 CUDA、cuBLAS)等方面提供了硬件层的支持。对于Web应用框架,FastAPI和Starlette则为项目提供高效的异步路由处理能力。 适合人群:从事AI算法研发的数据科学家、机器学习工程师,以及进行高性能Web服务开发的技术人员。特别是那些已经在了解或熟悉相关工具链的人群。 使用场景及目标:这份依赖配置主要用于支持需要集成深度学习模型的应用服务搭建工作,比如图像识别、自然语言处理、音频分析等领域的产品落地时所需的软件堆栈定义;另外也可以作为入门参考资料来指导新手建立类似项目。 阅读建议:建议有Python编程基础并计划参与深度学习平台建设的相关从业者深入理解各个库的作用,同时注意不同库间的协同关系以确保系统的兼容性和稳定性。

2025-03-18

Deepseek微调代码

包含数据集,使用Colossal-AI+LoRa微调DeepSeek 1.5B模型。

2025-03-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除