
AI大语言模型学习
文章平均质量分 65
无哈哈哈啊
智刃纪元
智刃纪元官方账号,主要研究方向为深度学习,会继续完善C语言与C++的博客,后续会往AI系统开发工程师和AI全栈工程师的方向发展。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【大模型学习】Qwen-2.5-VL制作gradio前端demo页面
千问2.5VL-7B,从头搭建,并附带gradio页面原创 2025-04-25 11:38:18 · 1096 阅读 · 0 评论 -
【大模型学习】使用DPO技术对大模型Qwen2进行微调
你需要配置 DPO 的训练参数,包括模型配置、训练设置等。3、数据格式:将数据处理为 DPO 所需的格式。通常,DPO 需要一个包含对话对和相应偏好标签的数据集。根据单轮对话和多轮对话的需求,你需要选择合适的数据集,并将其处理为 DPO 所需的格式。1、选择数据集:lvwerra/stack-exchange-paired。创建 DPO 训练器。原创 2024-08-12 14:56:53 · 1945 阅读 · 0 评论 -
【大模型学习】知识储备
大语言模型是一种基于深度学习的人工智能模型,能够理解和生成类似人类的自然语言文本。先在大规模通用语料上进行预训练,然后在特定任务数据上进行微调。表示模型的规模,参数越多,模型越复杂。模型在未见过特定任务的情况下,仍能进行推理和生成。LLM 生成内容时可能出现不真实或不准确的信息。正在学习大模型相关知识内容,以上问题会慢慢补充,之后先死记硬背,后续融会贯通!原创 2025-04-08 16:48:25 · 328 阅读 · 0 评论 -
【大模型学习】Qwen2.5-VL-7B-Instruct部署
大模型学习:图文理解记录原创 2025-03-13 14:35:25 · 990 阅读 · 0 评论 -
【大模型学习】浦语灵笔7B-代码解析与扩展
图文理解转载 2025-02-24 16:10:32 · 52 阅读 · 0 评论