自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 L0G1-书生大模型提示词实践

对章来说,前后加不同的词完全含义不同,本质上是对前面内容的续写。deepseek等强化学习方法只是约束了推理空间。将提示词框架化,不满意的地方直接安装框架去修改。将大模型定义成要完成任务的角色。

2025-06-20 11:12:07 212

原创 L2G4000 InternVL 多模态模型部署微调实践

假设输入特征图尺寸为 (N, C×r², H, W),其中 N 为批量大小,C 为目标通道数,r 为上采样因子,H 和 W 为原始分辨率的高度和宽度。左塔中 q是一些可以学习的向量,可以把图片重要信息抽取出来,输入vit的图片模型,在cross attention中混合特征,然后进行ff输出.:经过重组后,输出尺寸变为 (N, C, H×r, W×r)。llava将图片进行切片,切到图像处理器可以处理的尺寸,然后再加上一个缩略图,将1张大图变成5张,预设了一些动态分辨率,去匹配。

2025-03-17 21:49:38 590

原创 第6关 L1G6000 OpenCompass 评测书生大模型实践

又会有新的报错 cannot import name ‘cached_download’ from ‘huggingface_hub’ ,说新版本的huggingface_hub没有这个函数, ok 直接进源码,发现其实是更新问题。按照这个安装,然后运行 python run.py --models puyu_api.py --datasets demo_cmmlu_chat_gen.py --debug。然后就是配置的无限报错,我真的是没空搞了,很累= =别这样安装,没用的,需要指定版本。

2025-03-13 16:41:51 389

原创 第3关 L2G3000 LMDeploy 量化部署进阶实践

大模型只做transformer的decode,核心算子是attention,再attention中,我们对输入x首先要做3个线性变换变成qkv,其中qk做内积计算得分,v做注意力汇聚,输入阶段可以理解为对大模型输入问题的阶段,问题是一个序列x,包含多个token,这些token是一次性输入给大模型的,我们再计算时会一次性拿到所有的qkv,这个阶段称为预填充阶段,新的迭代只输入新的 Qx_ 与历史的k和v进行计算注意力分数,将每轮迭代的KV都进行缓存,可以供下次迭代使用。

2025-03-13 16:40:28 884

原创 L2G2000 Lagent 自定义你的 Agent 智能体

将你的Agent部署到 Hugging Face 或 ModelScope 平台,应用名包含 Lagent 关键词(优秀学员必做,注意千万别泄露了 API Key,不要在上传到 Hugging Face 的代码里面明文写 Key 而是使用环境变量的方式获取。工具: 一个json 包含工具描述,工具参数,工具名称等,现在的书生是没有查询天气的模块的,可以自定义大模型天气助手。react 范式,边想边做,推理+行动两个步骤交替,继承 行动类,实现工具的run方法,然后 装饰方法。

2025-03-05 20:22:25 273

原创 L2G1000 探索书生大模型能力边界

任务二,考倒 InternThinker:选择到 5 道您对题目答案有把握的且在互联网社交媒体上尽可能没出现过的 puzzle 推理题(您所在专业题目、面试代码题、逻辑思维题、行测找规律问题、高等数学题、奥赛题等等,请勿使用 leetcode 的题目) 考倒 InternThinker:让 InternThinker 生成错误的回复。为了解决这个问题,我们需要确定a和b各自购买的手机数量,然后计算它们之间的差距。首先,我们来分析题目给出的信息:价格分段:少于50个:176元/个。

2025-03-05 14:46:13 929

原创 基础岛:第5关 L1G5000 XTuner 微调个人小助手认知

转换完成后,可以看到模型被转换为 HuggingFace 中常用的 .bin 格式文件,这就代表着文件成功被转化为 HuggingFace 格式了。./internlm2_5_chat_7b_qlora_alpaca_e3_copy.py:微调时使用的配置文件(包含模型结构和训练参数)。pth_to_hf:将 PyTorch 的 .pth 格式转换为 Hugging Face 格式。head -n 1:取排序后的第一个文件(即最新的训练权重)。${pth_file}:上一步获取的 .pth 模型文件路径。

2025-03-04 16:01:33 354

原创 基础岛:第4关 L1G4000 InternLM + LlamaIndex RAG 实践

任务要求2(可选,参考readme.md):基于 LlamaIndex 构建自己的 RAG 知识库,寻找一个问题 A 在使用 LlamaIndex 之前 InternLM2-Chat-1.8B 模型不会回答,借助 LlamaIndex 后 InternLM2-Chat-1.8B 模型具备回答 A 的能力,截图保存。rag是通过外部知识库提供信息, 提供准确事实性回答,对时事新闻,但是很依赖外部知识库的质量和覆盖范围。问答知识库,结构提取,对话, 数据输入,嵌入式,向量化数据输入,向量提取。

2025-02-28 18:20:53 411

原创 基础岛:第3关 L1G3000 浦语提示词工程实践

在这里插入图片描述](https://i-blog.csdnimg.cn/direct/4628c6a6f26d4ae6b16c624883c39851.pn。链式思考,给出过程,推理步骤等。

2025-02-28 15:39:33 150

原创 第2关 L1G2000 玩转书生「多模态对话」与「AI搜索」产品

每个元素 nums[i] 表示从索引 i 向后跳转的最大长度。请以 MindSearch 的回复作为参考 (推荐) 或者直接粘贴 MindSearch 的回复内容在知乎上回答 3 个问题的任意一个。返回到达 nums[n - 1] 的最小跳跃次数。生成的测试用例可以到达 nums[n - 1]。给定一个长度为 n 的 0 索引整数数组 nums。最近大火的中国 3A 大作《黑神话·悟空》里有什么让你难忘的精彩故事情节!最近大火的中国 3A 大作《黑神话·悟空》里有什么让你难忘的精彩故事情节?

2025-02-27 17:22:48 238

原创 书生大模型第四期—L1G1000 书生大模型全链路开源体系

书生大模型第四期—L1G1000 书生大模型全链路开源体系

2025-02-27 16:33:22 145

原创 书生大模型第四期—L0G4000 玩转HF/魔搭/魔乐社区

1.2 模型下载 使用Hugging Face平台、魔搭社区平台(可选)和魔乐社区平台(可选)下载文档中提到的模型(至少需要下载config.json文件、model.safetensors.index.json文件),请在必要的步骤以及结果当中截图。经过操作后在Hugging Face的个人profile里面看到这个model,这里完成模型上传。新建文件,下载internlm2_5-chat-1_8b并打印示例输出。将项目git到workplace,然后修改html文件。

2025-02-27 16:29:52 162

原创 书生大模型第四期—L0G3000 git基础知识

任务2: 实践项目:构建个人项目创建并维护一个公开的大模型相关项目或笔记仓库。如果您不常使用 GitHub,您可以选择其他代码管理平台,如 Gitee,并提交相应的链接。仓库介绍中添加超链接跳转 GitHub 仓库(https://github.com/InternLM/Tutorial)将此项目报名参加第四期实战营项目评选将解锁 30% A100 和 168 团队算力点资源,提交地址:https://github.com/InternLM/Tutorial 的 class 分支~

2025-02-25 16:47:24 222

原创 书生大模型第四期—L0G2000 Python 基础知识

找到错误, res生成的内容不是json格式,所以下面json.loads会报错,可以有两种解决办法。

2025-02-24 16:22:56 213

原创 第四期书生大模型实战营L0G1000作业

完成SSH连接与端口映射并运行hello_world.py。

2025-02-24 11:17:53 141

原创 四非院校的我是如何从化工行业转行成为一名数据挖掘工程师的

在大家这四年不断的催更声中,我更新了.没错,我转行了.我2016年在江苏龙城边的普通二本毕业,专业是化学工程与工艺,2019年深圳大学化学工程毕业,在知乎上这样的学历混深圳有多惨不用我赘述了吧T0T,不是司徒不更新,而是不知道怎么说才好啊!(´_`)研一的时候还沉浸在读研的喜悦中,班上的同学有一半本科是211以上的学校,心里窃喜自己的选择。而且我选择了当时比较火的新能源电池专业,细...

2020-05-03 21:53:32 2344

转载 转载 数据挖掘的面试所要知道的30个点

作者:TalkingData链接:https://www.zhihu.com/question/27292215/answer/796916349来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。最近看到一篇比较不错的数据挖掘的文章,主要讲述的就是30个数据挖掘的知识点,我觉得作为入门是比较不错的,这篇文章因为转载较多,所以已经无法找到初始作者了,如果有人知道可...

2019-11-28 17:35:45 390

原创 putorch-模型容器Containers

1.容器Containersnn.Sequential:按照顺序包装多个网络层nn.ModuleList:像python的list一样包装多个网络层nn.ModuleDict:像python的dict一样包装多个网络层2.容器之SequentialfeaturesclassifierConvpool1Conv2Pool2fc2fc3fc4import torchimport torchv...

2019-10-28 16:57:11 306

原创 pytorch-模型的创建

1.模型的创建步骤模型 nn.Model模型创建权值初始化构建网络层拼接网络层卷积层-池化层-激活函数-全连接层LeNet-AlexNet-ResNet等均匀分布-正态分布-Kaiming-Xavier2.模型构建的要素模型构建两要素构建子模块拼接子模块forward函数__init__层3.python实现LeNet模型import torch.nn as nnimport torc...

2019-10-28 14:50:06 433

原创 数据增强-pytorch+transforms的使用笔记整理

数据增强-pytorch+transforms的使用笔记整理先上代码# -*- coding: utf-8 -*-"""深度之眼学习记录:强化学习"""import osimport numpy as npimport torchimport randomfrom torch.utils.data import DataLoaderimport torchvision.tra...

2019-10-26 15:12:54 1459

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除