
MindSpore
文章平均质量分 96
青云遮夜雨
这个作者很懒,什么都没留下…
展开
-
早期超大规模语言模型的尝试——BLOOM模型论文解读,附使用MindSpore和MindNLP的模型和实验复现
BLOOM是由BigScience社区开发和发布的,也是第一个开源开放的超过100B的语言模型。BLOOM 本身是变换器网络Transformer解码器(Decoder-Only)模型,在一个称之为ROOTS的语料库上训练出来的176B参数规模【和 GPT-3一样的规模】的自回归语言模型。训练 BLOOM 的算力成本超过300万欧元,由CNRS 和 GENCI提供,训练模型的机器是法国巴黎的Jean Zay超级计算机。BLOOM是在2021年5月至2022年5月的一年时间里完成训练并发布的。原创 2024-11-21 13:24:34 · 1270 阅读 · 0 评论 -
Baichuan2 模型详解,附实验代码复现
近年来,大规模语言模型(LLM)领域取得了令人瞩目的进展。语言模型的参数规模从早期的数百万(如 ELMo、GPT-1),发展到如今的数十亿甚至上万亿(如 GPT-3、PaLM 和 Switch Transformers)。随着模型规模的增长,LLM 的能力显著提升,展现出更接近人类的语言流畅性,并能执行多样化的自然语言任务。ChatGPT 的推出进一步证明了 LLM 在生成类人文本方面的强大能力,引起了广泛关注。原创 2024-11-21 13:21:57 · 1386 阅读 · 0 评论 -
MindPilot:一款基于MindSpore和MindNLP的开源智能助手——基于MindPilot和MindNLP的智能AI Agent助手MindPilot正式开源!
与市场上现有的智能助手相比,MindPilot最大的创新之一在于其。原创 2024-10-08 10:02:02 · 1274 阅读 · 0 评论