- 博客(6)
- 收藏
- 关注
原创 async知识点摘记
本文介绍了Python异步编程的关键概念。主要内容包括:1) async def定义协程函数,指出直接await coroutine比创建task更高效,但在需要并发执行时应使用await task;2) async for的工作原理及其与异步迭代器的关系;3) async with实现异步上下文管理,通过__aenter__和__aexit__方法管理资源。文章通过代码示例展示了这些异步语法的实际应用场景和性能考量。
2025-11-24 13:42:12
276
原创 lora的各种变体
本文总结了LoRA(低秩适应)的多种改进变体,包括:1)LoRA+通过分层学习率加速收敛;2)VeRA引入随机投影减少参数量;3)LoRA-FA冻结矩阵A减半参数;4)LoRA-Drop选择性训练层;5)QLoRA采用4位量化优化存储;6)AdaLoRA基于SVD自适应分配参数;7)LongLoRA改进注意力机制处理长序列。这些方法通过不同方式优化了LoRA的计算效率、内存占用和模型性能。
2025-11-24 13:40:35
657
原创 git的相关知识摘记
1. git init -b (note that after executing this command the default status of the files in this repository is untracked):create a local github repository and let it be a branch called 2. git rebase [branch]:Pretend you have two branch called branch_1 and b
2025-11-14 19:38:35
290
原创 paraformer
非自回归方法面临两大挑战:无法预测输出标记数量及提取隐藏变量,以及输出标记间相互依赖性建模不足。论文提出Paraformer模型解决方案:1) 基于连续积分-触发(CIF)的预测器预测标记数量并生成隐藏变量;2) 引入仅用于训练的GLM采样器,通过语义嵌入替换增强上下文依赖性建模。模型包含三大核心模块:预测器通过可训练权重α计算字符长度,采样器按λ比例替换预测/真实嵌入向量,损失函数整合MAE、交叉熵和MWER三项优化目标。图示展示了模型的推理和训练流程。
2025-10-23 12:44:36
903
原创 十三届蓝桥杯javaB组拉箱子
有没有大神能够告诉我这道压轴题有什么更快的做法,本以为数据不大深搜加剪枝能过的,只能向网上的acm帅哥求真经了。最后一个案例没有过去,但是有人用了200ms的做法过了,我实在想不出有什么更快的方法了,感觉这题用动态规划可变参数会特别麻烦应该不是最优做法吧(我猜的)。先附上我超时的代码:算是记录一下。import java.util.HashSet;import java.util.Scanner;public class Main { static int ans = 0;
2022-05-04 20:52:43
562
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅