- 博客(5)
- 收藏
- 关注
原创 大模型微调框架学习----在autodl上部署和使用LLaMA Factory工具流程及遇到问题的解决方案
最近实习工作需要自己着手学习多模态大模型微调的相关知识,在此之前笔者只有一些模糊的理论知识,实践经验几乎为0,特此记录学习路径,欢迎大家评论区讨论学习~
2025-08-13 11:01:05
377
原创 大模型知识涌现现象、顿悟现象
大模型的知识涌现现象指的是模型规模达到一定阈值之后,模型涌现出前所未有的能力。引起知识涌现现象的原因是随着模型规模的扩大,参数交互的密度也在逐渐变大,当达到某个阈值之后,模型就有了其它的能力。知识涌现现象往往是不能够预测的。大模型的顿悟现象可以视为知识涌现现象的一个子类,指的是模型性能的突然提升,通过实现是可以观察到的。
2025-05-19 22:29:17
279
原创 大模型幻觉学习
大模型的幻觉问题指的是大模型在回答时说胡话,说一些乱七八糟或者是逻辑混乱的话。最主要的原因是训练数据的质量(例如时效性、逻辑性等)
2025-05-19 22:16:53
269
原创 配置环境的一些坑
在使用jupyter notebook的过程中,发现默认的工作目录非常杂乱,不利于学习,因此想要修改默认工作路径并保存自己的学习代码和数据。上述红框中就是默认工作路径啦。
2025-02-26 14:46:09
439
原创 一些杂碎记录
七、在终端conda安装的python3.8,在pycharm中使用的方法(在pycharm终端运行,激活虚拟环境后可以在右下角进行选择)六、在conda中安装一个新的python版本、创建虚拟环境并激活,比如3.8。一、使用清华镜像安装TensorFlow(命令行或者终端运行)三、查看python版本以及每个路径下的python版本。二、如何查找电脑中所有的python版本(终端运行)五、怎么使用conda在pycharm中创建虚拟环境。四、查看电脑中是否安装了Conda以及位置。
2025-02-07 21:35:46
126
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅