忙叔叔√-优快云博客

原创 L0G1-书生大模型提示词实践

对章来说,前后加不同的词完全含义不同,本质上是对前面内容的续写。deepseek等强化学习方法只是约束了推理空间。将提示词框架化,不满意的地方直接安装框架去修改。将大模型定义成要完成任务的角色。

2025-06-20 11:12:07 212

原创 L2G4000 InternVL 多模态模型部署微调实践

假设输入特征图尺寸为 (N, C×r², H, W)，其中 N 为批量大小，C 为目标通道数，r 为上采样因子，H 和 W 为原始分辨率的高度和宽度。左塔中 q是一些可以学习的向量,可以把图片重要信息抽取出来,输入vit的图片模型,在cross attention中混合特征,然后进行ff输出.：经过重组后，输出尺寸变为 (N, C, H×r, W×r)。llava将图片进行切片,切到图像处理器可以处理的尺寸,然后再加上一个缩略图,将1张大图变成5张,预设了一些动态分辨率,去匹配。

2025-03-17 21:49:38 590

原创第6关 L1G6000 OpenCompass 评测书生大模型实践

又会有新的报错 cannot import name ‘cached_download’ from ‘huggingface_hub’ ,说新版本的huggingface_hub没有这个函数, ok 直接进源码,发现其实是更新问题。按照这个安装,然后运行 python run.py --models puyu_api.py --datasets demo_cmmlu_chat_gen.py --debug。然后就是配置的无限报错,我真的是没空搞了,很累= =别这样安装,没用的,需要指定版本。

2025-03-13 16:41:51 389

原创第3关 L2G3000 LMDeploy 量化部署进阶实践

大模型只做transformer的decode,核心算子是attention,再attention中,我们对输入x首先要做3个线性变换变成qkv,其中qk做内积计算得分,v做注意力汇聚,输入阶段可以理解为对大模型输入问题的阶段,问题是一个序列x,包含多个token,这些token是一次性输入给大模型的,我们再计算时会一次性拿到所有的qkv,这个阶段称为预填充阶段,新的迭代只输入新的 Qx_ 与历史的k和v进行计算注意力分数,将每轮迭代的KV都进行缓存,可以供下次迭代使用。

2025-03-13 16:40:28 884

原创 L2G2000 Lagent 自定义你的 Agent 智能体

将你的Agent部署到 Hugging Face 或 ModelScope 平台，应用名包含 Lagent 关键词（优秀学员必做，注意千万别泄露了 API Key，不要在上传到 Hugging Face 的代码里面明文写 Key 而是使用环境变量的方式获取。工具: 一个json 包含工具描述,工具参数,工具名称等,现在的书生是没有查询天气的模块的,可以自定义大模型天气助手。react 范式,边想边做,推理+行动两个步骤交替,继承行动类,实现工具的run方法,然后装饰方法。

2025-03-05 20:22:25 273

原创 L2G1000 探索书生大模型能力边界

任务二，考倒 InternThinker：选择到 5 道您对题目答案有把握的且在互联网社交媒体上尽可能没出现过的 puzzle 推理题(您所在专业题目、面试代码题、逻辑思维题、行测找规律问题、高等数学题、奥赛题等等，请勿使用 leetcode 的题目) 考倒 InternThinker：让 InternThinker 生成错误的回复。为了解决这个问题，我们需要确定a和b各自购买的手机数量，然后计算它们之间的差距。首先，我们来分析题目给出的信息：价格分段：少于50个：176元/个。

2025-03-05 14:46:13 929

原创基础岛：第5关 L1G5000 XTuner 微调个人小助手认知

转换完成后，可以看到模型被转换为 HuggingFace 中常用的 .bin 格式文件，这就代表着文件成功被转化为 HuggingFace 格式了。./internlm2_5_chat_7b_qlora_alpaca_e3_copy.py：微调时使用的配置文件（包含模型结构和训练参数）。pth_to_hf：将 PyTorch 的 .pth 格式转换为 Hugging Face 格式。head -n 1：取排序后的第一个文件（即最新的训练权重）。${pth_file}：上一步获取的 .pth 模型文件路径。

2025-03-04 16:01:33 354

原创基础岛：第4关 L1G4000 InternLM + LlamaIndex RAG 实践

任务要求2（可选，参考readme.md）：基于 LlamaIndex 构建自己的 RAG 知识库，寻找一个问题 A 在使用 LlamaIndex 之前 InternLM2-Chat-1.8B 模型不会回答，借助 LlamaIndex 后 InternLM2-Chat-1.8B 模型具备回答 A 的能力，截图保存。rag是通过外部知识库提供信息, 提供准确事实性回答,对时事新闻,但是很依赖外部知识库的质量和覆盖范围。问答知识库,结构提取,对话, 数据输入,嵌入式,向量化数据输入,向量提取。

2025-02-28 18:20:53 411

原创基础岛：第3关 L1G3000 浦语提示词工程实践

在这里插入图片描述](https://i-blog.csdnimg.cn/direct/4628c6a6f26d4ae6b16c624883c39851.pn。链式思考,给出过程,推理步骤等。

2025-02-28 15:39:33 150

原创第2关 L1G2000 玩转书生「多模态对话」与「AI搜索」产品

每个元素 nums[i] 表示从索引 i 向后跳转的最大长度。请以 MindSearch 的回复作为参考 (推荐) 或者直接粘贴 MindSearch 的回复内容在知乎上回答 3 个问题的任意一个。返回到达 nums[n - 1] 的最小跳跃次数。生成的测试用例可以到达 nums[n - 1]。给定一个长度为 n 的 0 索引整数数组 nums。最近大火的中国 3A 大作《黑神话·悟空》里有什么让你难忘的精彩故事情节!最近大火的中国 3A 大作《黑神话·悟空》里有什么让你难忘的精彩故事情节？

2025-02-27 17:22:48 238

原创书生大模型第四期—L1G1000 书生大模型全链路开源体系

书生大模型第四期—L1G1000 书生大模型全链路开源体系

2025-02-27 16:33:22 145

原创书生大模型第四期—L0G4000 玩转HF/魔搭/魔乐社区

1.2 模型下载使用Hugging Face平台、魔搭社区平台（可选）和魔乐社区平台（可选）下载文档中提到的模型（至少需要下载config.json文件、model.safetensors.index.json文件），请在必要的步骤以及结果当中截图。经过操作后在Hugging Face的个人profile里面看到这个model,这里完成模型上传。新建文件,下载internlm2_5-chat-1_8b并打印示例输出。将项目git到workplace,然后修改html文件。

2025-02-27 16:29:52 162

原创书生大模型第四期—L0G3000 git基础知识

任务2: 实践项目：构建个人项目创建并维护一个公开的大模型相关项目或笔记仓库。如果您不常使用 GitHub，您可以选择其他代码管理平台，如 Gitee，并提交相应的链接。仓库介绍中添加超链接跳转 GitHub 仓库（https://github.com/InternLM/Tutorial）将此项目报名参加第四期实战营项目评选将解锁 30% A100 和 168 团队算力点资源，提交地址：https://github.com/InternLM/Tutorial 的 class 分支～

2025-02-25 16:47:24 222

原创书生大模型第四期—L0G2000 Python 基础知识

找到错误, res生成的内容不是json格式,所以下面json.loads会报错,可以有两种解决办法。

2025-02-24 16:22:56 213

原创第四期书生大模型实战营L0G1000作业

完成SSH连接与端口映射并运行hello_world.py。

2025-02-24 11:17:53 141

原创四非院校的我是如何从化工行业转行成为一名数据挖掘工程师的

在大家这四年不断的催更声中,我更新了.没错,我转行了.我2016年在江苏龙城边的普通二本毕业,专业是化学工程与工艺,2019年深圳大学化学工程毕业,在知乎上这样的学历混深圳有多惨不用我赘述了吧T0T,不是司徒不更新,而是不知道怎么说才好啊!（´＿｀）研一的时候还沉浸在读研的喜悦中，班上的同学有一半本科是211以上的学校，心里窃喜自己的选择。而且我选择了当时比较火的新能源电池专业，细...

2020-05-03 21:53:32 2344

转载转载数据挖掘的面试所要知道的30个点

作者：TalkingData链接：https://www.zhihu.com/question/27292215/answer/796916349来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。最近看到一篇比较不错的数据挖掘的文章，主要讲述的就是30个数据挖掘的知识点，我觉得作为入门是比较不错的，这篇文章因为转载较多，所以已经无法找到初始作者了，如果有人知道可...

2019-11-28 17:35:45 390

原创 putorch-模型容器Containers

1.容器Containersnn.Sequential:按照顺序包装多个网络层nn.ModuleList:像python的list一样包装多个网络层nn.ModuleDict:像python的dict一样包装多个网络层2.容器之SequentialfeaturesclassifierConvpool1Conv2Pool2fc2fc3fc4import torchimport torchv...

2019-10-28 16:57:11 306

原创 pytorch-模型的创建

1.模型的创建步骤模型 nn.Model模型创建权值初始化构建网络层拼接网络层卷积层-池化层-激活函数-全连接层LeNet-AlexNet-ResNet等均匀分布-正态分布-Kaiming-Xavier2.模型构建的要素模型构建两要素构建子模块拼接子模块forward函数__init__层3.python实现LeNet模型import torch.nn as nnimport torc...

2019-10-28 14:50:06 433

原创数据增强-pytorch+transforms的使用笔记整理

数据增强-pytorch+transforms的使用笔记整理先上代码# -*- coding: utf-8 -*-"""深度之眼学习记录：强化学习"""import osimport numpy as npimport torchimport randomfrom torch.utils.data import DataLoaderimport torchvision.tra...

2019-10-26 15:12:54 1459

weixin_44780490的博客