
AI4D
文章平均质量分 87
字节跳动开源
这个作者很懒,什么都没留下…
展开
-
首次覆盖超 11 类真实编程场景!豆包大模型团队开源代码大模型全新基准
字节跳动豆包大模型团队开源 FullStack Bench,一个专注于全栈编程和多语言编程的代码评估数据集。FullStack Bench 能够真实反映大模型在多种实际代码开发场景中的表现,有助于推动代码智能领域的进一步发展。原创 2024-12-06 18:16:30 · 1247 阅读 · 0 评论 -
大幅降低数据科学门槛!豆包大模型团队开源AutoKaggle,端到端解决数据处理
字节跳动豆包大模型团队与 M-A-P 社区于近日提出 AutoKaggle ,为数据科学家提供了一个端到端的数据处理解决方案,帮助简化和优化日常数据科学工作流程的同时,极大降低数据科学的门槛,可帮助更多没有相关背景的使用者进行有价值的探索。最后,我们统计了不同错误类型及出现次数,可以看到,每个子任务阶段都有可能发生错误。未来,团队成员还将继续探索智数据科学课题及相关开源工作,并关注 Kaggle 上的最新前沿技术,如果你也对智能体协作、数据科学、大模型对复杂问题的解决感兴趣,有志于探索前沿课题,原创 2024-11-29 18:29:45 · 812 阅读 · 0 评论 -
无文本编码器仍能媲美CLIP!豆包大模型团队首创SuperClass模型
实验结果表明,SuperClass 在各种纯视觉场景和视觉 - 语言多模态场景下均优于 CLIP,同时基于分类的方法,模型展现出与 CLIP 相当,甚至更优的 Scalability。为了更好度量预训练得到的视觉表征能力,我们固定住训练好的视觉模型的参数,将其应用到 Linear probing、zero-shot、10-shot 等分类任务,同时接入到 LLM 做视觉和语言多模态下游任务进行评测。CLIP 广泛应用的另一个场景是多模态理解,作为多模态大模型中的视觉编码器,展现了很好的跨模态能力。原创 2024-11-29 18:17:33 · 748 阅读 · 0 评论 -
最高提升20倍吞吐量!豆包大模型团队发布全新 RLHF 框架,现已开源!
然而,控制流和计算流高度耦合,当设计新的 RL 算法,组合相同的计算流和不同的控制流时,需要重写计算流代码,修改所有相关模型,增加了开发难度。基于 Ray 的分布式编程,动态计算图,异构调度能力,通过封装单模型的分布式计算、统一模型间的数据切分,以及支持异步 RL 控制流,HybridFlow 能够高效地实现和执行各种 RL 算法,复用计算模块和支持不同的模型部署方式,大大提升了系统的灵活性和开发效率。这种灵活的模型部署方式,满足了不同算法、模型和硬件环境下的资源和性能需求。原创 2024-11-12 18:11:07 · 1076 阅读 · 0 评论 -
字节跳动冯佳时:大语言模型在计算机视觉领域的应用、问题和我们的解法
字节跳动研究科学家、豆包大模型视觉基础研究团队负责人冯佳时介绍字节跳动视觉基础研究团队在这个方向的探索与进展,包括 LLMs 在图像理解与视频生成上的阶段性结果。原创 2024-09-18 17:03:46 · 1051 阅读 · 0 评论