- 博客(6)
- 收藏
- 关注
原创 多智能体编排框架学习--Swarm
就个人理解,Swarm框架并没有给出很多传统意义上的创新型内容,它更多的可能还是通过封装对大模型原生能力的调用,来定义了一个多智能体中的通信协议,为后续建立智能体生态奠定了比较好的基础。正如作者所说,整个项目更偏向于实验性质,因此整个工程代码中仍有不少瑕疵,但瑕不掩瑜,Swarm仍是一个比较好的学习多智能体及多智能体通信的框架。basic。
2024-11-02 10:27:00
1798
1
原创 DeepSpeed-Chat训练实践
本次尝试使用开源数据进行deepspeed的三段式训练,因离线运行,所以修改了很多数据位置、模型位置等信息,如果能自动下载相关数据,一键式部署还是比较方便的。本篇博文参考了一键式RLHF训练 DeepSpeed Chat(二):实践篇,写的很详细,但在自己运行中也出现了一些不太一样的情况,均进行了记录。
2023-07-24 09:24:24
632
3
原创 TensorRT安装及使用--通用模型
TensorRT是Nvidia为了加速基于自家GPU训练模型的推理而设计的,当我们将模型训练好后,TensorRT可以直接对模型进行网络层的一一对应,从而加速比较大模型的推理部署。最近使用TensorRT加速了一些模型,我将用两篇文章对使用过程和其中遇到的坑进行记录说明。本篇文章将对通用模型的TensorRT转换进行一个记录,对transformer类模型的转换我们将在下一篇文章进行记录。本文记录的安装基于TensorRT6.0。1、 TensorRT的安装1.1 官网下载安装包...
2021-09-21 21:38:13
2324
1
原创 win10子系统ubuntu中安装docker
目录一、按照常规步骤安装docker二、问题一:ubuntu默认使用了WSL而不是WSL2三、问题二:未打开windows下Docker Desktop的TLS开关四、问题三:Cannot connect to the Docker daemon at tcp://0.0.0.0:2375. Is the docker daemon running?在上篇文章中我们已经一步一步的展示了如何在win10系统中安装ubuntu子系统。本篇文章我们将记录如何在之前安装的子系统...
2021-09-04 10:01:13
2535
2
原创 win10子系统ubuntu安装
对于程序员,在生活中我们往往需要使用linux系统,而在windows系统中写文档等正常操作也是很必要的。可能有些人会选择双系统,但双系统需要来回切换系统,是很不方便的;也有些人会选择虚拟机,但使用虚拟机常常以牺牲性能为代价,这些方案都不是最优的。win10出的子系统可谓是程序员的福音,它可以使用户在一个系统中使用双系统。这篇文章就让我们看看如何安装子系统。1、打开开发者模式要安装子系统,我们首先需要先配置电脑。 配置步骤为:设置->更新安全-...
2021-08-15 10:26:06
1675
原创 ACL2021--ChineseBert论文分享
最近在看2021年的acl时,发现了一个最新的中文预训练模型,论文名称为:ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information。该模型在原有bert类模型中结合了中文的字形和拼音两种具有中国语言特色的特征,使该预训练模型在各种任务上都比原有模型有了明显提升。目前该论文也将实现的代码放在了github,大家有兴趣的可以去拜读这篇论文和代码。本篇文章对该论文进行一个简单的分享,并提出自己的一些观点。...
2021-08-08 19:26:45
860
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人