自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 新手结合ai如何本地/云端部署大模型?

本文提供了在Google Colab上快速搭建大模型的入门指南。使用HuggingFace transformers库和Qwen2.5-7B-Instruct模型,通过4位量化技术解决显存不足问题。详细介绍了从环境配置、模型加载到实现对话交互的全流程,包括单轮问答和多轮对话的实现方法。重点讲解了量化技术、模型生成参数调优以及对话历史管理,帮助新手理解大模型应用的底层逻辑。文章还指出了Colab免费版的使用限制,为初学者提供了一个低成本体验大模型开发的实用方案。

2025-11-09 22:20:11 1010

原创 多人协作对github个人博客的修改

可见。

2025-04-30 14:06:29 423

原创 用hexo+github搭建个人博客

需要先安装 Node.js 和 Git。Node.js 包含了 npm(Node Package Manager),用于安装 Hexo 及其插件;Git 则用于部署博客到远程仓库。

2025-04-30 00:21:54 1738

原创 神经网络要素初识

(1)学习率的调整。(2)参数更新。

2025-04-02 12:21:26 289

原创 深度学习中的早停机制

而早停的操作在于通过监控一个验证指标(如验证集损失、准确率等),当该指标在一定数量的训练周期内不再改善时,提前终止训练。模型在训练集上的性能通常会随着训练的进行而提升,但在验证集上可能会出现先上升后下降的情况,这意味着模型开始过拟合。4. 保存最佳模型:每次有明显改善的时候,就记录model的参数,确保早停时模型能够重新载入最新的最佳的模型参数。2. 设置delta参数:如果指标的改善在delta阈值以内,可以认为没有改善。1. 设置patience参数:代表指标没有改善的最大训练周期数。

2025-03-22 11:33:17 646

原创 逐点卷积+nn.Conv1d

输入张量的形状必须是 (batch_size, in_channels, sequence_length)。使用3个1×1的卷积核,每个卷积核在深度方向(5个像素)上进行加权求和。* nn.Conv1d 的卷积操作一定是针对 dim=1 的通道维度进行变换。实现:输入: 32×32×5 目标输出:32×32×3。逐点卷积:在不修改其他维度的前提下修改通道数。

2025-03-21 15:31:02 265

原创 时序数据的归一化和反归一化处理

通常做法是引入一个叫做RevIN(Reversible Instance Normalization,可逆实例归一化)的层。

2025-03-19 17:08:57 1423

原创 第一次git->github全流程

提升输入密码,输入密码后,即使密钥被盗,没有密码也无法使用。可以选择输入密码(更安全)或者直接按回车键不设置密码(方便,但安全性稍低)。-C "your_email@example.com" 是添加一个标签,通常是你的邮箱地址,方便识别密钥的用途。-t ed25519 表示使用 ed25519 算法生成密钥对(推荐,因为它比 RSA 更安全)。方式一:通过源代码管理板块实现(不记得是自带的 还是插件了)(2)根据上面的路径找到公钥并复制到github上。方式二:在VSCode终端新建Bash 运行。

2025-03-19 12:15:23 431

原创 深度学习中的checkpoints

训练过程中保存多个checkpoints。并在验证集中验证这几个模型,选择表示最佳的模型,避免过拟合,提高泛化能力。定时保存训练过程中的模型参数,避免因为故障、程序崩溃和资源使用受限而失去训练进度的方法。利于研究者观察模型的参数变化,进而分析模型训练动态,调整训练策略。

2025-03-18 21:18:45 393

原创 神经网络训练中的数据加载

其中__init__方法进行数据集的初始化,存储数据源信息,例如文件路径、数据维度、类别标签等,还可以进行必要的数据预处理(例如归一化、标准化、图像的旋转、翻转等)简单来说,就是继承Dataset类,根据自己的数据的特性和需求,重写这三个方法,以达到创建自己的数据集的目的。继承PyTorch中的Dataset类,重写方法:__init__、__len__和__getitem____getitem__方法接受一个参数index代表索引,根据这个索引找到对应的数据集中的样本并返回。1. 数据来源:图片;

2025-03-18 21:06:53 224

原创 不同的Python环境下库的隔离性

找到了第一个和pytorch的安装的位置一样,在无法运行的时候,其是第二个条目。所以我需要把和pytorch的安装位置一致的解释器路径设置为首选。命令时,使用的是另一个 Python 环境,这个环境中并未安装 PyTorch。时,显示的是某个 Python 环境中 PyTorch 的安装情况;命令时,系统会按照一定的顺序查找这些路径来确定使用哪个 Python 解释器。PS:环境变量配置:高级系统设置->环境变量->系统变量->配置Path。在cmd运行where python:【显示是问题解决的结果】

2025-03-18 16:10:20 398

原创 个人所得税计算器GUI界面分享

我要实现的个人所得税计算器共五个功能:1.计算个人所得税,2.修改个人征税起点,3.修改税率, 4.显示各级税率 ,5.退出程序。除了第5个功能以外,其他四个功能都要求我完成多页面的用户界面以及界面的切换。

2024-03-24 12:24:40 770 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除