安格1121-优快云博客

原创 Datawhale AI夏令营第四期大模型应用开发学习day3

源大模型RAG实战

2024-08-16 23:40:09 1518

原创 Datawhale AI夏令营第四期大模型应用开发 0811直播分享

GitHub - JessyTsui/awesome_LLM_beginner: 送给LLM初学者的路径，看我心情和时间更新（faiss：Facebook开源出的一个向量检索引擎）将练手demo那个学完，会收获很大LLaMA Factory开源框架还没用过，安排上！

2024-08-12 11:20:05 1558 1

原创 Datawhale AI夏令营第四期大模型应用开发学习day1

此外，预训练过程中还涉及诸多细节，诸如数据配比、学习率调度、模型行为监测等，这些往往缺乏公开的最佳实践指导，需要研发团队具备深厚的训练经验与故障排查能力，以规避训练过程中的回溯与重复迭代，节约计算资源，提高训练效率。大语言模型（Large Language Model, LLM）：基于“扩展法则”（Scaling Law），即通过增加模型参数或训练数据，可以提升下游任务的性能，同时具有小模型不具有的“涌现能力”（Emergent Abilities）。一个完整的大模型应用包含一个客户端和一个服务端。

2024-08-12 09:30:35 1665

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 Datawhale AI夏令营 第四期大模型应用开发 学习day3

原创 Datawhale AI夏令营 第四期大模型应用开发 0811直播分享

原创 Datawhale AI夏令营 第四期大模型应用开发 学习day1

空空如也

空空如也

原创 Datawhale AI夏令营第四期大模型应用开发学习day3

原创 Datawhale AI夏令营第四期大模型应用开发 0811直播分享

原创 Datawhale AI夏令营第四期大模型应用开发学习day1