自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_43125088的博客

原创 InternVL 多模态模型部署微调实践

在 InternVL2-Tutorial 文件夹下的 demo.py 文件中，MODEL_PATH 表示传入的模型路径，这里默认为 InternVL2-2B，如果你使用的是 InternStudio 开发机进行实验则该路径无需修改，但如果你使用的是 VSCode 远程连接开发机则需要把这个路径修改成自己的本地路径。‌Type D架构‌：Type D架构将多模态信息的融合放在模型的输入层，通过一个预融合模块将不同模态的数据预处理并整合成一个统一的表示。然而，这种设计在模型训练和优化方面存在一定的挑战‌。

2024-12-27 21:36:02 906

原创 L2G3000: LMDeploy 量化部署进阶实践

使用结合W4A16量化与kv cache量化的internlm2_5-1_8b-chat模型封装本地API并与大模型进行一次对话，作业截图需包括显存占用情况与大模型回复，参考4.1 API开发，请注意2.2.3节与4.1节应使用作业版本命令。关于Function call，即函数调用功能，它允许开发者在调用模型时，详细说明函数的作用，并使模型能够智能地根据用户的提问来输入参数并执行函数。我们通过2.1 LMDeploy API部署InternLM2.5的实践为例，输入以下指令，启动API服务器。

2024-12-27 16:09:15 506

原创 MindSearch深度解析实践

XUEXI

2024-12-26 23:20:45 1119

原创进阶篇2 Lagent：从零搭建你的 Multi-Agent

大语言模型

2024-12-26 12:21:36 1133

原创 OpenCompass 评测书生大模型实践

opencompass

2024-11-27 19:00:57 419

原创 XTuner 微调实践微调

大模型

2024-11-21 23:12:06 197

原创【无标题】

给模型注入新知识的方式，可以简单分为两种方式，一种是内部的，即更新模型的权重，另一个就是外部的方式，给模型注入格外的上下文或者说外部信息，不改变它的的权重。第一种方式，改变了模型的权重即进行模型训练，这是一件代价比较大的事情，大语言模型具体的训练过程，可以参考InternLM2技术报告。第二种方式，并不改变模型的权重，只是给模型引入格外的信息。类比人类编程的过程，第一种方式相当于你记住了某个函数的用法，第二种方式相当于你阅读函数文档然后短暂的记住了某个函数的用法。下图中问答均未给出准确的答案。

2024-11-18 20:28:03 273

原创【无标题】

书生浦语大模型 prompt 统计strawberry中r的个数

2024-11-15 22:19:32 239

原创 Hugging Face平台下载模型

GitHub CodeSpace的使用

2024-11-10 23:30:35 473

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除