- 博客(4)
- 收藏
- 关注
原创 第三期书生大模型实战营——L1(书生大模型全链路开源体系)
模型使用了轻量级的高效预训练框架InternEvo进行训练,该框架使我们能在签个GPU扩展模型训练,是用过数据,张量,序列和管道并行技术实现这一点。回到语言建模的本质,我们都知道大模型它本质上在做语言建模这件事情,也就是说我们通过给定的Context,预测接下来的Token,这里面最关键的就是我们要有高质量的语料,让模型能够学会更好的建模能力。总结来说,深度置信网络是一种复杂的模型,它通过堆叠RBM并逐层训练来学习数据的深层特征,并能够生成新的数据样本,从而在许多机器学习任务中发挥重要作用。
2024-07-29 20:58:20
1471
原创 第三期书生大模型实战营——L1(8G 显存玩转书生大模型 Demo)
环境配置完后,运行cli_demo.py文件。通过端口映射运行web demo。启动streamlit服务。生成300字的小故事。
2024-07-29 19:43:31
454
原创 第三期书生大模型实战营——L0(Linux基础知识)
使用 VSCODE 远程连接开发机并创建一个conda环境。将Linux基础命令在开发机上完成一遍。创建并运行test.sh文件。
2024-07-25 13:36:58
703
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人