- 博客(12)
- 收藏
- 关注
原创 InternLM 论文分类微调实践
每条记录是一个完整论文的元数据 + 摘要(如标题、作者、分类、license、abstract 等)可用于构造 SFT 任务(如论文分类、摘要生成),但每条记录是一个类似“问答对话”的结构,system 明确设定任务(如“你是个优秀的论文分类师”),human 提问、assistant 给出带有分类信息的回答是明确格式化的,直接可用于论文分类任务的微调输入预训练如用 LoRA、QLoRA 或 instruction tuning 可处理后使用微调(分类)✅。
2025-05-26 20:20:39
1143
原创 沐曦玩转 LMDeploy、XTuner 和 InternLM3
1.1 下载LMDeploy1.2 部署验证结果,用internlm3-8b-instruct模型验证,验证程序如下1.3结果如下。
2025-05-04 18:02:39
395
原创 【书生大模型训练营-基础岛】XTuner 微调实践
模型转换的本质其实就是将原本使用 Pytorch 训练出来的模型权重文件转换为目前通用的 HuggingFace 格式文件,那么我们可以通过以下命令来实现一键转换。微调出来的模型其实并不是一个完整的模型,而是一个额外的层(Adapter),训练完的这个层最终还是要与原模型进行合并才能被正常的使用。脚本来观察微调后的对话效果,不过在运行之前,我们需要将脚本中的模型路径修改为微调后的模型的路径。我们写一个脚本生成修改我们需要的微调训练数据,在当前目录下创建一个。太长了,下面的就不截了。
2025-02-28 23:56:55
1636
原创 【书生大模型训练营-基础岛】OpenCompass 评测实践
获得 api key 和 api 服务地址 (也可以从第三方平台。3) 配置数据集: 在终端中运行。. 预计运行10分钟后, 得到结果。2) 配置模型: 在终端中运行。1) 打开网站浦语官方地址。
2025-02-28 22:57:00
629
原创 【书生大模型训练营-基础岛】Llamaindex RAG 实践
任务要求:基于 LlamaIndex 构建自己的 RAG 知识库,寻找一个问题 A 在使用 LlamaIndex 之前浦语 API 不会回答,借助 LlamaIndex 后浦语 API 具备回答 A 的能力,截图保存。注意:写博客提交作业时切记不要泄漏自己 api_key!能够正确地回答“Xtuner 是什么这个问题”,并且回答很全面。
2025-02-28 20:49:20
288
原创 【书生大模型训练营-基础岛】 玩转书生「多模态对话」与「AI搜索」产品
2024 年诺贝尔物理学奖为何会颁发给人工智能领域,这一举动对这两个领域的从业人员会有什么影响?知乎 2024 年诺贝尔物理学奖为何会颁发给人工智能领域,这一举动对这两个领域的从业人员会有什么影响?请以 MindSearch 的回复作为参考 (推荐) 或者直接粘贴 MindSearch 的回复内容在知乎上回答 3 个问题的任意一个。1. 注明回答中使用了 AI 搜索引擎 MindSearch (任何方式注明均可,比如“以下答案参考 AI 搜索引擎。浦语小助手将基础任务中的三个问题在知乎上进行了提问。
2025-02-24 20:47:42
373
原创 书生大模型全链路开源体系
已经打通大模型的全链路。从数据的收集整理、数据标注,到模型训练、模型微调、模型评测,再到基于模型的 Agent、RAG、搜索引擎,以及最后AI应用的部署,都得到了实现以及开源。注:大海捞针实验指的是,在向模型提供大量背景信息的情况下,测试模型能否准确地从这些海量信息中定位并提取出任何位置的具体内容。InternLM2.5——强大的推理能力,解锁复杂任务。」 写一篇关于书生大模型全链路开源开放体系的笔记。观看「本关卡视频」和「经历了一年以来的努力,
2025-02-24 20:26:56
1305
原创 【书生大模型训练营-入门岛】 Hugging Face/魔搭/魔乐篇
任务描述:使用 Hugging Face 平台、魔搭社区平台(可选)和魔乐社区平台(可选)下载文档中提到的模型(至少需要下载 config. json 文件、model. safetensors. index. json 文件),请在必要的步骤以及结果当中截图。在GitHub CodeSpace 上从 huggingface 下载。下载internlm2_5-chat-1_8b并打印示例输出。
2025-02-24 20:22:51
282
原创 【书生大模型训练营-入门岛】 Python篇
实现将非结构化文本转化成结构化json的例子,其中有一个小bug会导致报错。请大家自行通过debug功能定位到报错原因。发现第 29行可以正常调用书生大模型,但返回值与正常的 json 格式不一致,猜测由于书生大模型返回的值实际为。因此使用 VScode 调试工具对第 29 行和第 30行设置断点。错误,猜测 json 解析出问题。结尾的现象,因此更改prompt。运行代码,发现第 30行报。任务描述:下面是一段调用。
2025-02-15 21:41:42
256
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅