自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

nnxiong

生产中。

  • 博客(19)
  • 收藏
  • 关注

原创 多模态大语言模型 MLLM 部署微调实践

# 1.导入相关依赖包## 2.使用你的模型初始化推理管线## 3.读取图片(此处使用PIL读取也行)## 4.配置推理参数## 5.利用 pipeline.chat 接口 进行对话,需传入生成参数## 6.之后的对话轮次需要传入之前的session,以告知模型历史上下文。

2024-12-11 16:45:08 1319

原创 大模型 LMDeploy 量化部署

关于Function call,即函数调用功能,它允许开发者在调用模型时,详细说明函数的作用,并使模型能够智能地根据用户的提问来输入参数并执行函数。此时对于24GB的显卡,即30%A100,权重占用14GB显存,剩余显存24-14=10GB,因此kv cache占用10GB*0.8=8GB,加上原来的权重14GB,总共占用14+8=22GB。“组团”挑选显著权重权重。模型在运行时,占用的显存可大致分为三部分:模型参数本身占用的显存、kv cache占用的显存,以及中间运算结果占用的显存。

2024-12-09 21:11:01 1253 1

原创 AgentLego:组装大模型智能体“乐高”

AgentLego是一个提供了多种开源工具 API 的多模态工具包,旨在像是乐高积木一样,让用户可以快速简便地拓展自定义工具,从而组装出自己的智能体。

2024-12-04 16:03:36 1042

原创 Lagent:轻松制作属于你自己的智能体 Agent

智能体是一种能够自主感知环境并根据感知结果采取行动的实体,以感知序列为输入,以动作作为输出的函数。它可以以软件形式(如聊天机器人、推荐系统)存在,也可以是物理形态的机器(如自动驾驶汽车、机器人)。自主性:能够在没有外部干预的情况下做出决策。交互性:能够与环境交换信息。适应性:根据环境变化调整自身行为。目的性:所有行为都以实现特定目标为导向。

2024-12-03 21:59:16 1327

原创 Git 使用

GitHub是全球最大的代码托管平台之一,拥有丰富的开源项目和活跃的开发者社区。它提供了版本控制、项目管理、协作开发等功能,并支持多种编程语言。GitLab一个自托管或基于云的平台,提供了完整的 DevOps 工具链,包括代码托管、持续集成/持续部署(CI/CD)、问题跟踪等。Gitee国内的代码托管平台,提供了代码托管、项目管理、协作开发等功能,对国内开发者来说,访问速度可能更快,也更符合国内的使用习惯。路径 ./icamp4/id.md。

2024-12-03 15:36:03 633

原创 OpenCompass 大语言模型测评

OpenCompass(司南)是由上海人工智能实验室开源的一款大模型评测平台,旨在为AI研究者、模型开发者及企业决策者提供一个公平、开放和可复现的大模型评测环境。OpenCompass提供了 API 模式评测和本地直接评测两种方式。其中 API 模式评测针对那些以 API 服务形式部署的模型,而本地直接评测则面向那些可以获取到模型权重文件的情况。

2024-12-03 11:21:44 1478

原创 大语言模型微调与 XTuner 微调实战

大语言模型微调(Fine-tuning of Large Language Models)是指在预训练的大型语言模型基础上,使用特定任务的数据进一步训练模型,以使其更好地适应和执行特定任务的过程,用于使LLM(Large Language Models)获得处理特殊任务的能力。

2024-12-01 16:07:16 1483

原创 RAG (Retrieval Augmented Generation) 检索增强生成

是一种结合了检索(Retrieval)和生成(Generation)的技术,旨在通过利用外部知识库来增强大型语言模型(LLMs)的性能。它通过检索与用户输入相关的信息片段,并结合这些信息来生成更准确、更丰富的回答。正式介绍检索增强生成(Retrieval Augmented Generation,RAG)技术以前,大家不妨想想为什么会出现这样一个技术。给模型注入新知识的方式,可以简单分为两种方式,一种是内部的,即更新模型的权重,另一个就是外部的方式,给模型注入格外的上下文或者说外部信息,不改变它的的权重。

2024-11-29 22:37:51 2352

原创 提示工程实践

提示工程是一种通过设计和调整输入(Prompts)来改善模型性能或控制其输出结果的技术。在模型回复的过程中,首先获取用户输入的文本,然后处理文本特征并根据输入文本特征预测之后的文本,原理为next token prediction,类似我们日常使用的输入法。指令要清晰提供参考内容复杂的任务拆分成子任务给 LLM“思考”时间(给出过程)使用外部工具系统性测试变化在提示工程中,第一点给出清晰的指令是至关重要的。

2024-11-29 17:06:26 1179

原创 玩转书生「多模态对话」与「AI搜索」产品

模型地址:分析示例:你对目前中国就业形势怎么看?

2024-11-28 21:48:37 284

原创 书生大模型全链路开源开放体系

书生大模型使用了OpenCompass作为评测框架,其特点包括全面性、多维度指标和对比分析,提供全面的模型能力测试,帮助开发者识别模型的优劣和改进方向。大模型智能体是指基于大型语言模型构建的智能体,具有强大的语言理解和处理能力,可以自动化地完成各种复杂的任务。书生大模型的部署采用了LMdeploy工具,这是一套完整的大模型部署解决方案,支持模型压缩和优化、GPU部署和自动化部署流程,提高推理速度和运行效率。

2024-11-28 20:52:34 300

原创 使用Hugging Face下载模型并使用

尽管他们的聊天机器人项目并未取得预期的成功,但他们在GitHub上开源的Transformers库却意外地在机器学习领域引起了巨大轰动。如今,Hugging Face已经发展成为一个拥有超过100,000个预训练模型和10,000个数据集的平台,被誉为机器学习界的GitHub。下载速度跟网速和模型参数量大小相关联,如果网速较慢的小伙伴可以只尝试下载1.8b模型对应的config.json文件以及其他配置文件。创建好环境后,可以进入网页版VSCode的界面,这就是CodeSpace提供给我们的在线编程环境。

2024-11-28 16:52:38 2227

原创 非结构化文本转化成结构化json报错

调用书生浦语API实现将非结构化文本转化成结构化json的例子,其中有一个小bug会导致报错。

2024-11-27 20:21:54 854

原创 leecode 383. 赎金信

力扣 383. 赎金信

2024-11-27 16:35:37 389

原创 SSH连接与端口映射

端口映射是一种网络技术,它可以将外网中的任意端口映射到内网中的相应端口,实现内网与外网之间的通信。通过端口映射,可以在外网访问内网中的服务或应用,实现跨越网络的便捷通信。端口映射实现步骤,可访问端口转发+内网映射。

2024-11-27 15:31:02 1598

转载 UML类图中的六大关系:关联(单向、双向、自关联)、聚合、组合、依赖、继承、实现

一、简介        在UML类图中,类之间的关系可以分成:关联(association)、聚合(aggregation)、组合(composition)、依赖(dependency)、泛化(generalization)/继承(inheritance)和实现(realization)。这六种关系如下图所描绘:               上面的关系可以.

2020-05-22 16:11:39 14308

原创 子类可以继承父类的哪些成员?所有成员吗?

首先,子类可以继承父类所有的成员。1.对于特殊的 private 成员。子类仍然可以继承,但是子类此时没有使用权,不能直接访问,这时候若需要访问,只能调用父类的getter,setter方法来访问与赋值。...

2020-05-09 08:53:45 5390 2

原创 《Java 并发编程实战》学习内置锁可重入

《Java 并发编程实战》这是一个之前的问题,那时候查的各种博客解决的提供参考的博客:博客在第二章线程安全 重入这一小节有这样的一段话:“然而,如果内置锁是不可重入的。那么在调用super.dosomething时将无法获得Widget上的锁,因为这个锁已经被持有。”public class Widget { public synchronized void doSometh...

2020-05-04 21:25:22 214

原创 pta 给定一个字符串。请去除串中的数字并反转。

给定一个字符串。请去除串中的数字并反转。输入格式:原始串。输出格式:去除数字后的反转字符串。输入样例:he11ll00o w0or8ld!输出样例:!dlrow olleh代码如下import java.util.ArrayList;import java.util.Scanner;public class Main { public static void main(...

2020-04-29 20:03:22 5326 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除