自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 async知识点摘记

本文介绍了Python异步编程的关键概念。主要内容包括:1) async def定义协程函数,指出直接await coroutine比创建task更高效,但在需要并发执行时应使用await task;2) async for的工作原理及其与异步迭代器的关系;3) async with实现异步上下文管理,通过__aenter__和__aexit__方法管理资源。文章通过代码示例展示了这些异步语法的实际应用场景和性能考量。

2025-11-24 13:42:12 276

原创 lora的各种变体

本文总结了LoRA(低秩适应)的多种改进变体,包括:1)LoRA+通过分层学习率加速收敛;2)VeRA引入随机投影减少参数量;3)LoRA-FA冻结矩阵A减半参数;4)LoRA-Drop选择性训练层;5)QLoRA采用4位量化优化存储;6)AdaLoRA基于SVD自适应分配参数;7)LongLoRA改进注意力机制处理长序列。这些方法通过不同方式优化了LoRA的计算效率、内存占用和模型性能。

2025-11-24 13:40:35 657

原创 git的相关知识摘记

1. git init -b (note that after executing this command the default status of the files in this repository is untracked):create a local github repository and let it be a branch called 2. git rebase [branch]:Pretend you have two branch called branch_1 and b

2025-11-14 19:38:35 290

原创 WebSocket知识点随笔

# Sec-WebSocket-Key的作用。

2025-11-14 14:03:53 225

原创 paraformer

非自回归方法面临两大挑战:无法预测输出标记数量及提取隐藏变量,以及输出标记间相互依赖性建模不足。论文提出Paraformer模型解决方案:1) 基于连续积分-触发(CIF)的预测器预测标记数量并生成隐藏变量;2) 引入仅用于训练的GLM采样器,通过语义嵌入替换增强上下文依赖性建模。模型包含三大核心模块:预测器通过可训练权重α计算字符长度,采样器按λ比例替换预测/真实嵌入向量,损失函数整合MAE、交叉熵和MWER三项优化目标。图示展示了模型的推理和训练流程。

2025-10-23 12:44:36 903

原创 十三届蓝桥杯javaB组拉箱子

有没有大神能够告诉我这道压轴题有什么更快的做法,本以为数据不大深搜加剪枝能过的,只能向网上的acm帅哥求真经了。最后一个案例没有过去,但是有人用了200ms的做法过了,我实在想不出有什么更快的方法了,感觉这题用动态规划可变参数会特别麻烦应该不是最优做法吧(我猜的)。先附上我超时的代码:算是记录一下。​import java.util.HashSet;import java.util.Scanner;public class Main { static int ans = 0;

2022-05-04 20:52:43 562

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除