大模型之路1:趟一条小路


在人工智能的浪潮中,大模型以其强大的性能和广泛的应用前景,成为了研究者和开发者们关注的焦点。作开源大语言模型的代表,LIama2是典型的代表。不过我暂时用的是Baichuan2-13B-Chat做的测试。本文主要是介绍如何尝试搭建Baichuan2-13B-Chat的软硬件环境,为探索大模型之路趟一条小路。

一、硬件准备

搭建大模型环境首先需要有足够的硬件支持。由于大模型训练和推理过程中涉及大量的数据计算和存储,因此对计算资源的要求较高。在准备硬件时,应重点考虑以下几个方面:
处理器:选择高性能的CPU,以保证模型训练和推理的速度。
内存:大模型通常需要较大的内存空间来存储中间数据和模型参数,因此建议配备足够的RAM。
存储:确保有足够的硬盘空间来存储训练数据、模型文件和日志等。
显卡:对于支持GPU加速的大模型,配备高性能的显卡可以显著提升训练和推理的效率。
参考推理的效果:
(1)在笔记本上曾经跑起来过7B和7B-4bit模型,当然,速度是很慢的。当时配置是 10885(i9)+2080Super+96G内存(这个不是必须),对话的时候,大概1-3分钟回答一句吧。13B的模型是跑不起来的。
(2)在台式机(刃9000K),13900KF + 4080 + 96G内存,对话大概1分钟以内
(3)在一个服务器上,CPU频数不高,忘了,3090的卡,对话大概不到1分钟
(4)在新服务器上,用的是8*A800的小型环境,之前的7B没尝试,直接上的13B,感觉十来秒就能对话。而且回答内容明显效果要比7B的好。
个人感觉,自用的桌面电脑,最好采用14900K+4090+128G内存+液冷,相对来说性价比还是比较高的,现在192内存有点太贵了不合适。当然,对CPU和GPU的液冷也是个人偏见,感觉似乎更安静一点点,长期用的安全性还请大神指点。


二、软件环境搭建

软件搭建过程涉及多个步骤,包括环境配置、模型下载与安装、以及必要的依赖库的安装等。

操作系统:之前笔记本上是在Win+PyCharm环境上尝试的,能debug就很棒,起码不用频繁的每次等待加载模型。
深度学习环境配之前,首先查看硬

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值