字节跳动开源-优快云博客

原创首届 Apache Gluten 社区年度盛会 —— GlutenCon 2025 正式启动！

在这个数据爆炸的时代，如何让 Spark 等计算引擎跑得更快？如何通过原生向量化执行突破性能瓶颈？2025 年 12 月 6 日（周六），首届 Apache Gluten 社区年度盛会 —— GlutenCon 2025 将于北京举办。来自字节跳动、IBM、微软、腾讯、华为、小红书、小米、BIGO 等企业的技术专家将带来硬核技术分享，带你深入了解 Bolt 加速库、GPU 优化、内存管理等核心议题。

2025-12-04 11:59:53 371

原创 AIBrix v0.5.0 正式发布：实现批量API支持、KVCache v1连接器升级，全面提升P/D架构协同效能

今日，我们正式发布 AIBrix v0.5.0。此版本引入与 OpenAI 兼容的批处理 API，专为处理高吞吐、时延不敏感的离线推理与评估任务设计，有效避免对实时端点造成干扰。同时，新版本集成了全新的 KVCache 连接器（AIBrixOffloadingConnectorV1Type3），借助其流水线式预取与分层卸载机制，显著提升 KVCache 卸载与复用的效率。

2025-11-25 13:44:04 1268 1

原创开源可信MCP，AICC机密计算新升级！

火山引擎 AICC 机密计算迎来新升级，发布支持 MCP 的可信方案——Trusted MCP，并正式开源该组件。开发者和企业可通过该功能实现 MCP 核心组件及组件间的通信数据安全，有效解决 MCP 应用过程中的数据泄露和身份验证等风险。

2025-10-31 14:29:14 867

原创 AIO Sandbox：为 AI Agent 打造的一体化、可定制的沙箱环境

AIO Sandbox 通过一个 Docker 镜像整合所有能力，提供统一文件系统与鉴权，并支持镜像定制，提升了 Agent 任务执行与交付效率。

2025-10-31 11:27:44 1037

原创 AI 体验走查 - 火山引擎存储的 AI UX 探索之路

火山引擎存储技术团队驱动 AI 自主完成用户体验走查 / 可用性测试的执行与评价，帮助业务改善交互体验。立项“故事走查”的背景诉求和 AI 机遇如何搭建“AI 评价”能力，精准识别交互问题让交互体验故事走查变为技术产品，讲解系统设计，包括流程、User Story 维护、框架和 AI 模型选型、Midscene.js 的集成技巧等

2025-07-04 14:45:28 2508

原创抖音内容技术团队开源ContentV：有限算力下高效训练视频生成模型的新路径

抖音内容技术团队开源了 ContentV，一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上，使用 256 块显卡，在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限，ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。该工作探索了在有限算力条件下训练视频生成模型的可行路径。目前，推理代码与模型权重已对外开放。

2025-07-03 14:30:37 1051

原创 NeurIPS 2024|统一的多模态文字理解与生成大模型

本文介绍NeurIPS 2024录用论文“Harmonizing Visual Text Comprehension and Generation”的主要工作。这篇文章提出了首个OCR领域的大一统多模态文字理解与生成大模型，即TextHarmony。TextHarmony不仅精通视觉文本的感知（文字检测识别等）、理解（KIE、VQA等）和生成（视觉文字生成、编辑、抹除等），而且在单一模型中实现了视觉与语言模态生成的和谐统一。

2025-06-17 10:48:21 869

原创 Gödel Rescheduler：适用于云原生系统的全局最优重调度框架

字节跳动研发了 Gödel Rescheduler——一个适用于全局最优调度策略的重调度框架。它不仅能识别集群中的异常节点和任务，还能智能推荐任务到最合适的位置，并通过图算法生成详细的迁移步骤，确保集群的整体稳定性，真正实现全局最优调度。

2025-06-16 11:37:33 1129

原创基于 MCP 的 AI Agent 应用开发实践

最近大家都在聊 MCP，发现有个最重要的点被忽略了『通过标准化协议，将工具提供方与应用研发者解耦』，这一点带来的将是 AI Agent 应用研发范式的转移（类似 Web 应用研发的前后端分离）。本文以开发 Agent TARS 应用为例，尽可能详细地介绍 MCP 在『开发范式』、『工具生态扩展』上起到的作用。

2025-04-25 15:03:18 1093

原创字节跳动开源 Godel-Rescheduler：适用于云原生系统的全局最优重调度框架

字节跳动研发了 Godel-Rescheduler，一个基于全局最优调度策略的重调度框架。它不仅能识别集群中的异常节点和任务，还能智能推荐任务到最合适的位置，并通过图算法生成详细的迁移步骤，确保集群的整体稳定性，真正实现全局最优调度。

2025-04-15 17:10:25 965

原创是时候正视开源合规的重要性了！我们给你准备了一套体系课程

为了帮助大家系统了解开源软件的合规知识，字节跳动开源团队及知识产权法务团队将推出开源合规精选培训课程，4月24日 19:00-19:30即将开启第一课，自5月8日起，将连续 5 周在周四晚上19:00-19:30进行直播分享。

2025-04-03 12:00:00 370

原创基于控制面单元化的 Kubernetes 集群联邦

字节跳动在云原生技术架构设计中构建了统一的云原生基础设施平台。其中，上层平台层直接对接Kubernetes集群资源，并基于 Kubernetes 原生 API 标准，通过大规模集群联邦模式实现多集群的统一接入与管理。目前，集群联邦已经覆盖了字节跳动90%以上的资源，节点数超过21万，管理超10万在线微服务与1000万Pod，是目前业界规模最大的生产级集群联邦应用。

2025-04-02 14:16:58 765

原创基于控制面单元化的 Kubernetes 集群联邦

字节跳动在云原生技术架构设计中构建了统一的云原生基础设施平台。其中，上层平台层直接对接Kubernetes集群资源，并基于 Kubernetes 原生 API 标准，通过大规模集群联邦模式实现多集群的统一接入与管理。目前，集群联邦已经覆盖了字节跳动90%以上的资源，节点数超过21万，管理超10万在线微服务与1000万Pod，是目前业界规模最大的生产级集群联邦应用。

2025-04-02 14:13:51 967

原创 MySQL遇到AI：字节跳动开源 MySQL 虚拟索引 VIDEX

虚拟索引技术在数据库系统的查询优化、索引推荐等场景中扮演着关键角色。简单来说，虚拟索引可以理解为数据库的'沙盘推演'系统——无需真实构建索引，仅基于统计信息即可精准模拟不同索引方案对查询计划的优化效果。由于虚拟索引的创建/删除代价极低，使用者可以大量创建和删除索引、反复推演，确定最有效的索引方案。在AI时代，基于机器学习模型的NDV、Cardinality 估计算法层出不穷，但是在MySQL落地往往遇到很大挑战：无法在MySQL生成查询计划时注入机器学习模型的预测值，优化器便难以给出更合适的索引推荐结果。

2025-03-28 12:00:30 1244

原创 Midscene.js：AI 在前端测试领域的应用

Midscene.js 是由字节跳动 Web Infra 团队全新开源的 UI 自动化工具。通过引入多模态 AI 推理能力，Midscene.js 将帮助开发者打破传统 UI 自动化难于编写和维护的困境。

2025-03-20 15:43:43 2203

原创深度解析：通过 AIBrix 多节点部署 DeepSeek-R1 671B 模型

本文详细介绍了如何通过 AIBrix 分布式推理平台实现 DeepSeek-R1 671B 的多节点部署。

2025-03-18 14:40:52 1219

原创 FlowGram 简介：开源前端流程搭建引擎

FlowGram 是一套基于节点编辑的流程搭建引擎，帮助开发者快速创建固定布局或自由连线布局的流程，并提供一套交互的最佳实践, 很适合有明确输入和输出的可视化工作流。

2025-03-17 12:06:02 6105

原创 vArmor：云原生容器安全的多场景应用实践

特权容器通常指包含设置的容器，此类容器被授予全部 capabilities，可访问宿主机所有设备和内核接口。本文将所有拥有打破隔离性配置的容器称为 “特权容器”，包括但不限于 privileged container、sensitive capabilities、sensitive mounts、shared namespaces、sensitive RBAC permissions。许多企业因历史遗留问题、系统设计需求、安全意识不足等原因，在生产环境的业务负载和系统组件中引入了 “特权容器”。

2025-03-10 16:06:03 1342

原创 AIBrix 深度解读：字节跳动大模型推理的云原生实践

随着 LLaMA、DeepSeek、Qwen 等开源大模型的快速崛起，企业在模型部署的灵活性、成本与自主可控性方面迎来了新的机遇。然而，仅靠对模型本身的优化尚不足以将这些模型部署成高效且可扩展的生产级 API。大模型推理往往引入诸多独特的系统挑战，如 GPU 弹性伸缩指标的非线性问题，长尾模型和精调模型流量过低的问题，多机推理时的角色编排以及 GPU 卡型的异构管理等，都对易用性和成本控制提出了更高要求。

2025-03-10 11:36:59 1885

原创 2025 年，微服务架构和大模型能 “玩出” 什么新花样？

3 月 22 日，以《云原生 × AI 时代的微服务架构与技术实践》为主题的 CloudWeGo 技术沙龙将在深圳科技园希尔顿惠庭酒店正式启幕。本次活动汇聚了多位来自字节跳动、火山引擎、智谱 AI 的技术大咖，共同探讨云原生与 AI 技术融合趋势下，微服务架构的演进方向与最佳实践。

2025-02-26 15:53:52 740

原创 AIBrix: 专为 vLLM 打造的可扩展、高性价比控制面

2025年2月21日，vLLM通过官方博客宣布了由字节跳动开发的AIBrix大模型推理系统开源，为vLLM推理引擎提供可扩展且高性价比的控制面。开源72 小时内，AIBrix 收获的GitHub Star 数已超 1000, 96 小时突破2000, 截止本文发布保持着榜第一的位置。

2025-02-26 15:53:40 2216

原创大语言模型应用开发框架 —— Eino 正式开源！

在组件定义和通用基座能力的基础上，我们认为，大模型应用开发存在相对固定的数据流转和流程编排范式：以 ChatModel（大模型）为核心，通过 ChatTemplate 注入用户输入和系统 prompt，通过 Retriever、Document Loader & Transformer 等注入上下文，经过 ChatModel 生成，输出 Tool Call 并执行，或输出最终结果。在明确的组件定义基础之上，我们认为，大模型应用开发存在通用的基座性质的能力，包括但不限于：处理模型输出的流式编程能力；

2025-01-22 15:53:25 1410

原创 ICLR 2025 Workshop 征稿：推动基础模型的开源、开放、可复现

Open Foundation Models：预训练策略，包括数据扩展、模型架构、多模态和多任务预训练。学习算法，如元学习、模型融合、模型合并和为开放、可扩展模型设计的持续学习。Open Replication of Proprietary Systems：复现专有的基础模型和系统，确保更广泛的研究和开发的透明度和可重复性。Open Compute Efficiency Techniques：专注于模型蒸馏、压缩、量化和优化注意力或内存机制，以提高基础模型的计算效率。2025 年 2 月 10 日。

2025-01-22 14:08:44 2006

原创豆包 MarsCode + 开源 = ？AI 助力开源社区新人成长

使用豆包MarsCode 学习开源项目

2025-01-22 13:57:02 1681

原创数据处理不再是“脏活累活”，听听开发者们怎么说？

本次活动也收集到了不少来自开发者的改进建议，ByConity 社区将根据这些反馈持续优化产品功能，构建一个更加活跃的开源生态。

2025-01-02 15:48:31 377

原创首次覆盖超 11 类真实编程场景！豆包大模型团队开源代码大模型全新基准

字节跳动豆包大模型团队开源 FullStack Bench，一个专注于全栈编程和多语言编程的代码评估数据集。FullStack Bench 能够真实反映大模型在多种实际代码开发场景中的表现，有助于推动代码智能领域的进一步发展。

2024-12-06 18:16:30 1496

原创 Kitex/Hertz 助力大模型：三周年重要特性回顾｜CloudWeGo

本文根据 CloudWeGo 三周年《Kitex/Hertz 助力大模型：三周年重要特性回顾》分享整理，介绍近一年来 Kitex/Hertz 的重要特性，希望为企业用户、社区同学在自己的项目中更好的应用 Kitex/Hertz 构建自己的微服务体系提供帮助。

2024-12-06 15:24:33 1098

原创大幅降低数据科学门槛！豆包大模型团队开源AutoKaggle，端到端解决数据处理

字节跳动豆包大模型团队与 M-A-P 社区于近日提出 AutoKaggle ，为数据科学家提供了一个端到端的数据处理解决方案，帮助简化和优化日常数据科学工作流程的同时，极大降低数据科学的门槛，可帮助更多没有相关背景的使用者进行有价值的探索。最后，我们统计了不同错误类型及出现次数，可以看到，每个子任务阶段都有可能发生错误。未来，团队成员还将继续探索智数据科学课题及相关开源工作，并关注 Kaggle 上的最新前沿技术，如果你也对智能体协作、数据科学、大模型对复杂问题的解决感兴趣，有志于探索前沿课题，

2024-11-29 18:29:45 1120

原创无文本编码器仍能媲美CLIP！豆包大模型团队首创SuperClass模型

实验结果表明，SuperClass 在各种纯视觉场景和视觉 - 语言多模态场景下均优于 CLIP，同时基于分类的方法，模型展现出与 CLIP 相当，甚至更优的 Scalability。为了更好度量预训练得到的视觉表征能力，我们固定住训练好的视觉模型的参数，将其应用到 Linear probing、zero-shot、10-shot 等分类任务，同时接入到 LLM 做视觉和语言多模态下游任务进行评测。CLIP 广泛应用的另一个场景是多模态理解，作为多模态大模型中的视觉编码器，展现了很好的跨模态能力。

2024-11-29 18:17:33 973 1

原创最高提升20倍吞吐量！豆包大模型团队发布全新 RLHF 框架，现已开源！

然而，控制流和计算流高度耦合，当设计新的 RL 算法，组合相同的计算流和不同的控制流时，需要重写计算流代码，修改所有相关模型，增加了开发难度。基于 Ray 的分布式编程，动态计算图，异构调度能力，通过封装单模型的分布式计算、统一模型间的数据切分，以及支持异步 RL 控制流，HybridFlow 能够高效地实现和执行各种 RL 算法，复用计算模块和支持不同的模型部署方式，大大提升了系统的灵活性和开发效率。这种灵活的模型部署方式，满足了不同算法、模型和硬件环境下的资源和性能需求。

2024-11-12 18:11:07 1433

原创开源三年，CloudWeGo 的生态发展和社区增长

对于 Hertz 来说，在社区开发者的大力支持和参与下，同样构建了丰富的周边生态，在服务注册发现以及可观测性方面，和 Kitex 的能力集成体验上几乎是一致的，技术栈可以保持统一。微服务架构下，随着业务的发展，对服务的管控难度会越来越大，服务治理的作用就是为了解决服务拆分所引发的一系列问题，以让服务更稳定地运行，涉及的主题包含了服务注册与发现、负载均衡、服务熔断、服务降级、服务限流等。首先，Bookinfo 是 Istio 官方提供的经典 demo 应用，它的目的是演示 Istio 的各种各样特性。

2024-11-12 17:53:29 1184

原创在离线统一调度器 Gödel Scheduler 性能优化: 算法设计思想与数据结构应用

本文将以几个经典优化为例，阐述基于这些构思所衍生的算法设计思想与数据结构应用，说明其对提升 Gödel Scheduler 调度性能并最终解决实际问题所发挥的巨大作用。

2024-09-26 14:41:23 1086

原创字节跳动冯佳时：大语言模型在计算机视觉领域的应用、问题和我们的解法

字节跳动研究科学家、豆包大模型视觉基础研究团队负责人冯佳时介绍字节跳动视觉基础研究团队在这个方向的探索与进展，包括 LLMs 在图像理解与视频生成上的阶段性结果。

2024-09-18 17:03:46 1312

原创字节跳动开放计算最佳实践，亮相 2024 开放计算中国峰会

8 月 8 日，由两大开放计算组织 OCP（Open Compute Project）与 OCTC（开放计算标准工作委员会）联合主办的主题为 “开放协同：协作、智慧、创新” 的 2024 开放计算中国峰会在北京举行，以期与全球开放计算领域的社区和企业领袖、技术专家以及行业先锋，共同探讨新时代开放计算技术的最新进展和实践经验，促进生态融合、智能化实践和技术创新。而随着人工智能、大模型的爆发，传统的计算正在朝着多模态、多元算力等智能计算融合发展，如何进一步实现生态协同、开放共赢，对开放计算提出了新的要求。

2024-09-14 16:27:14 1161

原创完整的数仓能力，ByConity 1.0 版本发布！

在传统的数据分析架构中，这部分工作是由 Hive、Spark、Flink 等产品来完成的。二、增加了对 task 重试的支持：通过设置 bsp_max_retry_num（task的最大重试次数，默认值为5），可以在作业的中间 task 发生失败时，从失败的 task 开始重试，而不是从头开始重试，进而大大减少 failover 对执行时长的影响。ByConity 是字节跳动开源的云原生数据仓库，在满足数仓用户对资源弹性扩缩容，读写分离，资源隔离，数据强一致性等多种需求的同时，提供优异的查询，写入性能。

2024-09-10 17:42:43 1082

原创 Rspack 1.0 发布了！

近两年，社区中涌现出多个基于 Rust 的 bundler，它们的性能表现都相当优异。Rspack 在确保卓越性能的同时，也在灵活度、兼容性等方面做到了社区领先。Rspack 当前的目标是：帮助现有的 webpack 项目渐进地迁移到高性能的 bundler 上，使构建性能不再成为项目迭代的瓶颈；

2024-09-06 16:36:36 1577

原创开源活动预告｜抖音集团专家聚焦电商、PB级实时场景带来数据技术分享

8 月 31 日 13:30，Apache Doris x 字节跳动开源联合 Meetup 北京站即将开启。

2024-08-30 12:36:49 273

原创 CausalMatch v0.0.1正式发布！字节跳动开源因果推理利器，助力科学决策分析

因此我们需要用匹配的方法，为报名了活动的商家1和商家3在未报名活动的商家中寻找相似商家 - 商家1需要在“报名前7日无登陆抖店”的商家中搜寻对照组、商家3需要在“报名前7日有登陆抖店”的商家中搜寻对照组。在这种情况下，如何科学的估计策略效应成了数据分析或者数据科学团队的一个挑战。因此我们将日常业务中应用最广泛的因果效应估计方法 —— 匹配，进行了理论梳理，并开发了一套专注于匹配的轻量化因果关系分析工具 CausalMatch，为使用该方法来做决策分析的业务场景构建一套流程性且规范化的分析框架。

2024-08-28 14:03:44 1096

原创字节云原生数仓 ByConity 开源一周年！听听 Committer 们怎么说

通过和几位 committer 的沟通，我们发现他们对于想参与社区的同学给出了几乎类似的建议。兴趣驱动和业务驱动是两个主要方面，但是只有先用起来，才会发现问题，并通过在社区上寻求帮助或反馈问题逐渐加入社区。同时也非常欢迎大家把使用或者迁移经验分享到社区，并通过丰富社区生态，让 ByConity 社区逐渐壮大。–END–

2024-08-06 18:12:32 1205

原创打造运营商实时分析平台——浩鲸科技 ByConity 应用实践

借助 ByConity 的能力，WhaleHouse 成为一款极速全场景 MPP 企业级数据库产品，具备水平在线扩缩容，兼容 MySQL 和 ClickHouse 等语法协议，提供全面向量化引擎与多种数据源联邦查询等重要特性，致力于在全场景 OLAP 业务上为用户提供统一的解决方案，适用于对性能、实时性、并发能力和灵活性有较高要求的各类应用场景。传统的 MPP 的数据库很困难扩缩容，例如 ClickHouse 和 GP，如果扩展主机，则会导致数据的重新分布，造成生产环境业务中断。原始数据包含数以千计的表。

2024-08-01 12:30:03 870

空空如也

空空如也