潞晨科技官方-优快云博客

原创 AI大模型推理速度翻倍，Colossal-Inference开源发布

潞晨科技公司为此打造了高效易用的Colossal-Inference推理引擎，可显著提高AI大模型吞吐速度，以应对推理场景中的性能瓶颈和成本挑战。该推理引擎集成了分块显存管理与分页注意力算法，预设与自定义模型优化策略，连续批处理调度。预设中提供高性能手写算子, 第三方的算子加速库；而在预设之外，用户可以通过使用基础算子与模型层，自行搭建自定义模型优化策略，对指定模型进行优化。

2024-05-22 16:57:34 1418

原创 H800算力低至5.99元/卡时！抢鲜体验LLaMA3最佳实践就在潞晨云

潞晨云推出限时特惠，H800GPU算力低至5.99元/卡时，助力LLaMA3 8B和70B的训练与微调。

2024-04-24 15:12:31 1238

原创 Open-Sora全面开源模型参数和所有训练细节

不久前OpenAI Sora以其惊人的视频生成效果迅速走红，在一众文生视频模型中突出重围，成为全球瞩目的焦点。继2周前推出成本直降46%的Sora训练推理复现流程后，Colossal-AI团队推出新的开源方案「Open-Sora 1.0」，涵盖了整个训练流程，包括数据处理、所有训练细节和模型权重，携手全球AI热爱者共同推进视频创作的新纪元。先睹为快，我们先看一段由Colossal-AI团队发布的「Open-Sora 1.0」模型生成的都市繁华掠影视频。

2024-04-01 13:39:16 5860

原创 3140亿参数Grok-1推理加速3.8倍，高效易用的PyTorch+HuggingFace版来了

在单台8*H800 80GB服务器上，推理性能相比JAX、HuggingFace的auto device map等方法，Colossal-AI将在近期进一步推出对Grok-1在并行加速、量化降低显存成本等优化，欢迎持续关注。结合Colossal-AI在AI大模型系统优化领域的丰富积累，已迅速支持对Grok-1的张量并行。Grok-1一经发布便在开源社区引发广泛关注，并登上GitHub热度榜单世界第一。」，是当前参数量最大的开源大语言模型，并允许自由改动分发和商用。由马斯克旗下大模型公司 xAI 开源的。

2024-04-01 13:33:16 430

原创李开复周鸿祎力荐！NUS尤洋教授新书《实战AI大模型》登顶京东图书榜

《实战AI大模型》全面覆盖了从基础理论到前沿实践的每一个方面。上线一周荣登京东图书榜人工智能书籍第一名。

2024-01-15 10:08:59 1320

原创多轮对话推理速度提升46%，开源方案打破LLM多轮对话的长度限制

Colossal-AI团队开源了SwiftInfer，基于TensorRT实现了StreamingLLM，可以进一步提升大模型推理性能46%，为多轮对话推理提供了高效可靠的落地方案。

2024-01-15 09:58:02 1654

原创万元预算打造高质量13B私有模型，Colossal-AI LLaMA-2 开源方案再升级

Colossal-AI 团队再次迭代中文LLaMA2，通过构建更为细致完善的数据体系，利用 25B token 的数据，打造了效果更佳的 13B 模型，并在主仓库开源相关权重。

2024-01-15 09:47:57 1527

原创专家并行再升级，开源MoE模型训练效率提升9倍

Colossal-AI-MoE模块升级，系统完善，效率提升，性能卓越！

2023-11-10 10:06:01 2511

原创潞晨科技与澜舟科技签署战略合作协议，联手打造更高效的企业级大模型解决方案

潞晨科技与澜舟科技共同推动AI大模型在多个领域的工程化产业应用和落地，积极助力各产业的数字化转型。

2023-10-03 17:45:41 406

原创千元预算半天训练，效果媲美主流大模型，开源可商用中文LLaMA-2

低成本构建任意领域垂类基座大模型的轻量化流程

2023-09-28 13:31:09 556

原创荣获2023年度AIGC两项行业大奖，潞晨科技势头正劲，实力出圈

潞晨科技获“AIGC2023年度新势力企业”和“2023最值得关注的AIGC公司”双项荣誉。

2023-09-20 14:47:21 550

原创使用Colossal-AI云平台精调私有GPT

Colossal-AI云平台重新定义了大型AI模型训练的领域，使复杂的模型训练变得简单。使用Colossal-AI云平台，无需繁琐的环境配置或深入研究复杂的加速方法——您只需点击几下即可实现模型训练显著的加速。最快短短3天内，您就可以拥有自己经过精调的大型模型。

2023-09-19 15:19:11 457 1

原创潞晨科技与超级计算中心达成战略合作，Colossal-AI系统再添新翼助力AI大模型

近日，潞晨科技与某海外超级计算中心达成战略合作伙伴关系。本次合作旨在将海外超算中心的超级计算机和优质算力与潞晨科技基于Colossal-AI的大模型训练推理加速系统相结合，联手打造AI大模型最佳解决方案。同时，该合作还有助于建设潞晨科技新上线的智能化云平台，为云平台用户带来更充沛的算力保障。

2023-09-13 21:08:36 573

原创 700 亿参数 LLaMA2 训练加速 195%，基础大模型最佳实践再升级

作为全球规模最大、最活跃的大模型开发工具与社区，Colossal-AI再次迭代，提供开箱即用的 8 到 512 卡 LLaMA2 训练、微调、推理方案，对 700 亿参数训练加速 195%，并提供一站式云平台解决方案，极大降低大模型开发和落地应用成本。

2023-09-04 19:42:12 368

原创 650亿参数大模型预训练加速38%，打造类LLaMA基础大模型最佳实践已开源

Colossal-AI 以LLaMA为例，提供开箱即用的650亿参数预训练方案，可提升训练速度38%，为大模型企业节省大量成本。

2023-07-18 16:10:48 345

原创开源方案复现ChatGPT流程！1.62GB显存即可体验，单机训练提速7.73倍

开源方案复现ChatGPT流程！1.62GB显存即可体验，单机训练提速7.73倍

2023-02-15 13:33:55 4803

原创硬件预算最高直降46倍！低成本上手AIGC和千亿大模型，一行代码自动并行，Colossal-AI再升级

硬件预算最高直降46倍！低成本上手AIGC和千亿大模型，一行代码自动并行，Colossal-AI再升级

2023-01-04 14:12:23 954

原创 Colossal-AI助力，摩尔线程预训练语言模型MusaBert荣登CLUE榜单TOP10

Colossal-AI助力，摩尔线程预训练语言模型MusaBert荣登CLUE榜单TOP10

2022-12-19 13:56:23 419

原创 Diffusion预训练成本降低6.5倍，微调硬件成本降低7倍！Colossal-AI完整开源方案低成本加速AIGC产业落地

Diffusion预训练成本降低6.5倍，微调硬件成本降低7倍！Colossal-AI完整开源方案低成本加速AIGC产业落地

2022-11-09 12:16:15 988

原创仅用笔记本电脑解析90%蛋白质，单卡推理序列长度破万！Colossal-AI开源方案让AlphaFold推理提速5倍，显存降低75%

仅用笔记本电脑解析90%蛋白质，单卡推理序列长度破万！Colossal-AI开源方案让AlphaFold推理提速5倍，显存降低75%

2022-10-28 09:44:48 1156

原创 NVIDIA GPU加速AI落地，潞晨科技Colossal-AI助力大模型普适化

NVIDIA GPU加速AI落地，潞晨科技Colossal-AI助力大模型普适化

2022-10-26 16:03:48 996

原创仅需1% Embedding 参数，硬件成本降低百倍，开源方案单GPU训练超大推荐模型

仅需1% Embedding 参数，硬件成本降低十倍，开源方案单GPU训练超大推荐模型

2022-10-19 12:16:10 735

原创 Colossal-AI团队亮相全球超级计算机大会等多项国际盛会

Colossal-AI团队亮相全球超级计算机大会等多项国际盛会

2022-08-30 16:11:14 1149

原创开源方案11倍加速蛋白质单体与复合物的结构预测！Colossal-AI 团队联合百图生科发布xTrimo Multimer

Colossal-AI 团队联合百图生科发布xTrimo Multimer

2022-08-23 15:28:17 1118

原创开源星「001号」落地 Colossal-AI，欢迎登陆赢神秘大礼包！

开源星「001号」落地 Colossal-AI，欢迎登陆赢神秘大礼包！

2022-08-12 17:28:13 530

转载无缝支持Hugging Face社区，Colossal-AI低成本轻松加速大模型

无缝支持Hugging Face社区，Colossal-AI低成本轻松加速大模型

2022-07-13 12:46:11 718

原创潞晨科技获邀加入NVIDIA初创加速计划

潞晨科技获邀加入NVIDIA初创加速计划

2022-06-21 12:21:17 1285

转载推理加速性能超越英伟达FasterTransformer 50%，开源方案打通大模型落地关键路径

伴随着深度学习模型规模的指数型增长，常见的单卡推理解决方案已然无法满足前沿AI大模型的推理需求。例如1750亿参数的GPT-3模型，仅仅是加载模型参数就需要数百GB的存储空间，远超单个GPU的容纳能力。因此，对于AI大模型使用多卡并行的方式进行推理已成为必然选择。针对现有推理系统的这一痛点，Colossal-AI团队以“高性能、高可用、可伸缩”的理念，深入单实例多设备推理场景，开发了大模型推理系统Energon-AI，在性能和易用性上兼具优势：仅需对现有项目进行极少量修改，用户便可完成自定义大模型的

2022-05-31 18:00:04 1188

luchentech的博客