- 博客(25)
- 收藏
- 关注
原创 XTuner 微调个人小助手认知
在 XTuner 中提供了一键合并的命令 xtuner convert merge,在使用前我们需要准备好三个路径,包括原模型的路径、训练好的 Adapter 层的(模型格式转换后的)路径以及最终保存的路径。该命令需要三个参数:LLM 表示原模型路径,ADAPTER 表示 Adapter 层的路径, SAVE_PATH 表示合并后的模型最终的保存路径。对于全量微调的模型(full)其实是不需要进行整合这一步的,因为全量微调修改的是原模型的权重而非微调一个新的 Adapter ,因此是不需要进行模型整合的。
2024-08-30 17:19:53
772
原创 llamaindex+Internlm2 RAG实践
RAG(检索增强生成(Retrieval Augmented Generation),即RAG)是一种让基础模型实现非参数知识更新,无需训练就可以掌握新领域的知识。本次课程选用了LlamaIndex框架。LlamaIndex 是一个上下文增强的 LLM 框架,旨在通过将其与特定上下文数据集集成,增强大型语言模型(LLMs)的能力。它允许您构建应用程序,既利用 LLMs 的优势,又融入您的私有或领域特定信息。
2024-08-30 10:13:05
784
原创 书生实战营-浦语提示词工程实践
背景问题:近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,例如认为13.8<13.11。任务要求:利用LangGPT优化提示词,使LLM输出正确结果。完成一次并提交截图即可。
2024-08-27 09:56:47
352
原创 基础岛第二关-8G 显存玩转书生大模型 Demo
初始硬件设备:使用10%A100 GPU硬件环境,cuda版本选择12.2创建虚拟环境并安装必备的python库是一款开源的分词工具,由Google开发并维护。它采用了基于统计的分词方法,可以将句子切割成具有相同语义的子字符串(即“词”),并生成一个高效的编码表示。与传统的分词工具不同,SentencePiece支持增量分词和变长分词,可以更加准确地处理各种语言数据。是一个用于简化数据操作的Python 库,专注于张量的重排、分块以及维度变换等操作。此库尤其适用于深度学习和图像处理领域。
2024-08-25 11:24:54
1660
原创 书生实战营-Git基础知识
命名格式为,其中<id>是您的报名问卷ID。文件路径应为。【大家可以叫我】内容可以是 GitHub 昵称、微信昵称或其他网名。在 GitHub 上创建一个 Pull Request,提供对应的 PR 链接。
2024-08-23 14:04:22
292
原创 书生大模型训练营L0第二次作业
请使用本地vscode连接远程开发机,将上面你写的wordcount函数在开发机上进行debug,体验debug的全流程,并完成一份debug笔记(需要截图)。请实现一个wordcount函数,统计英文字符串中每个单词出现的次数。返回一个字典,key为单词,value为对应单词出现的次数。
2024-08-09 17:45:32
181
原创 书生训练营第一次学习
个人PC会远程连接到开发机唯一暴露在外的37367端口,(这个在SSH的时候提到过每个人的开发机暴露的端口都不一样),并设置隧道选项。是一种网络技术,它可以将外网中的任意端口映射到内网中的相应端口,实现内网与外网之间的通信。任何发送到本地7860端口的流量,都会被SSH隧道转发到远程服务器的127.0.0.1地址上的7860端口。这意味着,即使开发机的这个端口没有直接暴露给外部网络,我们也可以通过这个隧道安全地访问远程服务器上的服务。使用“Ctrl+Shift+~”快捷键。,在终端的右侧可以找到端口选项。
2024-08-07 10:29:44
411
原创 代码随想录算法训练营第四天|24. 两两交换链表中的节点、19.删除链表的倒数第N个节点 、面试题 02.07. 链表相交、142.环形链表II
算法训练营第四天
2023-01-14 21:15:20
66
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅