- 博客(3)
- 收藏
- 关注
原创 Datawhale AI夏令营 第四期大模型应用开发 0811直播分享
GitHub - JessyTsui/awesome_LLM_beginner: 送给LLM初学者的路径,看我心情和时间更新(faiss:Facebook开源出的一个向量检索引擎)将练手demo那个学完,会收获很大LLaMA Factory开源框架还没用过,安排上!
2024-08-12 11:20:05
1558
1
原创 Datawhale AI夏令营 第四期大模型应用开发 学习day1
此外,预训练过程中还涉及诸多细节,诸如数据配比、学习率调度、模型行为监测等,这些往往缺乏公开的最佳实践指导,需要研发团队具备深厚的训练经验与故障排查能力,以规避训练过程中的回溯与重复迭代,节约计算资源,提高训练效率。大语言模型(Large Language Model, LLM):基于“扩展法则”(Scaling Law),即通过增加模型参数或训练数据,可以提升下游任务的性能,同时具有小模型不具有的“涌现能力”(Emergent Abilities)。一个完整的大模型应用包含一个客户端和一个服务端。
2024-08-12 09:30:35
1665
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人