金闪闪_Li-优快云博客

原创模型压缩：剪枝、量化、蒸馏

在模型应用程序中，推理时间是至关重要的，模型压缩是缩短推理时间的有效办法，常见的模型压缩方法有剪枝、量化和知识蒸馏

2024-04-07 21:40:10 3097 1

原创 LoRA论文学习总结

NLP模型训练的一般范式就是在领域数据集上进行预训练来适应特定的任务，但当模型越来越大时，重新训练所有模型参数的微调就变得不太可行。LoRA（Low-Rank Adaptation）微调的思想是冻结与训练的模型权重，并将可训练的秩分解矩阵注入到Transformer架构的每一层，大大减少了下有任务的可训练参数的数量

2023-12-16 20:48:16 446

原创 CogVLM论文总结

CogVLM是一个开源的视觉语言基础模型，与流行的将图像特征映射到语言模型输入空间的浅层对齐方法不同，CogVLM 通过注意力层和 FFN 层中的可训练视觉专家模块弥合了冻结的预训练语言模型和图像编码器之间的差距

2023-12-07 12:43:57 555

原创 python web框架使用总结

这篇文章介绍了python常用的http web框架、rpc web框架和日志脚本

2023-12-02 15:45:29 498

原创 OpenAI能力总结

openai布局AI应用场景的大部分领域，比如文本生成、图像生成、语音合成、语音识别、多模态模型等。funciont call能力的实现大大提高了chatgpt的应用能力，用户可以充分发挥想象力，做一些实用的工具，例如让工具查询天气，读取文件，分析数据等等，从而实现一个强大的AI Agent。

2023-11-26 22:46:38 860

原创 MetaGPT使用总结

MetaGPT是基于ChatGPT的一个AI Agent应用，这个应用将LLM组成一个软件开发公司，并在公司中设置了老板、产品经理、架构师、项目经理、研发工程师、测试工程师等角色。用户只需输入一句话，告诉MetaGPT想要开发一个什么样的软件，它就会提供一个软件开发的全过程的标准作业程序（SOP），开发出一个可以直接运行的软件，还可以自动生成文档，开发可视化界面等功能

2023-11-12 22:49:19 4175 2

原创 OpenAI Assistants使用总结

Assistants可以指示和利用模型，工具和知识库去响应用户的问题，目前Assistants支持三种工具：代码解释器，检索和函数调用

2023-11-08 17:15:39 8861 15

AI Agent（人工智能代理）是一种计算机程序，具有自主性、学习性、适应性、智能性和可扩展性等特征。它能够在不依赖人类干预的情况下，独立地完成任务和解决问题。AI Agent 通过与环境和用户互动，不断积累经验，提高自身的智能水平。随着大语言模型的快速发展，基于大模型的人工智能代理技术受到广泛关注，今天要介绍的是到目前为止github上star最多的一个关于AI Agent的开源项目：AutoGPT

2023-11-02 17:56:18 1776

原创基于ComfyUI的AnimateDiff的使用总结

AnimateDiff是一个可以对文生图模型进行动画处理的实用框架。框架的核心是将新初始化的运动模块插入到冻结的文生图模型中，从而产生多样化和个性化的动画图像。简单的说，AnimateDiff是一个可以从文本到动画的框架

2023-10-30 19:36:45 7526 10

原创 StableSwarmUI使用总结

StableSwarmUI是Stability AI官方的stable diffusion WebUI，前端网页采用HTML/JS开发，后端服务使用C#开发，可以提供响应迅速的和支持多线程的后端服务

2023-10-25 21:20:30 2680 2

原创 ComfyUI使用总结

ComfyUI，它的主要特点是以工作流的形式来进行和展现基于stable diffusion模型的文生图和图生图的过程，拖拽式操作来链接各个节点，比如base model、vae、controlnet、lora、hypernet等。让整个生成过程更加清晰，易于理解。

2023-10-24 21:15:40 12262 2

金闪闪_Li的博客