- 博客(2)
- 收藏
- 关注
原创 新手使用llama-factory框架进行lora微调全过程实例+部分代码及指令(纯小白使用教程)
在微调大模型的过程中从0开始,最开始搞不懂终端、服务器、环境等概念,看不太明白脚本也不会debug,这期间踩过的坑和犯过的傻不少。很多东西在实践上手之后才发现很多细节比想象中的要繁琐(当然也有可能是本人太倒霉了在整个微调过程中比别人都坎坷不少),所以打算写下这篇文章给一些同样需要做微调但比较小白的朋友做个参考。从整个流程开始到小白进门时可以规避的坑,希望能帮助到大家顺利应用实现微调,要是有大佬发现有问题存在也请指正
2025-01-25 14:14:09
803
原创 多级学习神经网络解决谱分量偏差问题
谱分量偏差在深度学习中表现为,网络倾向于学习函数的低频信息,对高频信息的表达欠佳。在图像处理领域此问题可能导致生成的图像只有模糊的背景与轮廓(低频信息),难以刻画图像细节内容(高频信息)。为处理上述问题,文章提出了一种新型网络结构及学习的方式,即multi-grade deeplearning (MGDL) model。这是一个逐级学习的神经网络,每一级以上一级的残差为学习目标。可以类比到人类学习过程中逐步学习,每次都学自己上次没学懂的东西。
2024-12-05 11:43:59
885
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人