- 博客(191)
- 收藏
- 关注
原创 保姆级操作指南|如何在火山方舟上构建下一代 Agent 应用?
12月19日,火山引擎2025冬季FORCE原动力大会开发者专场论坛举办,众多技术负责人、开发者与企业代表汇聚,共同围绕“如何构建一个更好用的AI应用”议题,分享技术干货。下一代Agent应用该是什么样的?火山方舟通过Responses API、Serverless RL平台及火山 Viking 三大核心产品,为企业构建出了具备长期记忆、自主进化和复杂任务执行能力的完整Agent,助力开发者将更智能、更懂业务、更具价值的Agent应用带入千行百业。
2025-12-24 10:45:32
341
原创 APMPlus:重新定义 AI 时代的全景全栈观测
在人工智能浪潮席卷千行百业的今天,大型语言模型(LLM)正以前所未有的深度重塑应用架构。然而,这种技术变革也带来了新的运维挑战。现代 AI 应用,尤其是基于 LLM 的应用,其内部结构日益复杂,往往由多个业务服务、AI 框架和模型调用链交织而成,形成了一个难以捉摸的“黑盒”。大模型推理结果的随机性让传统的确定性监控失效Token 消耗波动、推理延迟抖动、会话上下文丢失等问题频发智能体决策链路复杂,问题溯源如同在迷宫中寻路从用户输入到智能体决策,再到模型推理,链路跨越多个系统边界。
2025-12-23 16:16:52
421
原创 “大晓机器人”携手火山引擎多模态数据湖探索千万小时级视频处理新路径
在本次合作中,“大晓机器人”依托专业技术沉淀,专注于世界模型工具链的构建与应用,其技术范围涵盖物理AI数据闭环、生成式世界引擎及闭环仿真等等;火山引擎多模态数据湖解决方案则基于LAS AI数据湖产品,充分发挥在多模态数据预处理领域的优势,为“大晓机器人”的整个研发体系构建了坚实的技术基座。
2025-12-23 14:55:09
373
原创 “数字员工”上岗了! ——TextIn大模型加速器+火山引擎,多语言文档处理挑战营
“数字员工”上岗了!近期,由合合信息 TextIn 打造、火山引擎提供平台支撑的“大模型加速器”升级版正式发布,为企业与开发者提供一站式 AI 工程化能力。
2025-12-23 10:17:54
323
原创 扣子编程,开启免费公开测试
这个案例,是我们的产品经理通过自然语言和简单的两三轮对话就完成的一个效果,我们告诉扣子企业的可视化需求,要求它可以支持上传数据,并完全把我们的数据可视化。通过这个案例可以看到,只要你有足够的逻辑思考能力,足够的想象和理解能力,把需求表达清楚,扣子编程就会给你一个非常有意思的结果。彼时,大模型还有很多缺陷,比如逻辑能力不稳定,推理速度很慢,不会调工具等等,我们围绕着这些大模型的“缺点”,一步步的完善了我们的Agent IDE和Workflow IDE,解决了成千上万希望利用AI能力来改造业务的实际需求。
2025-12-19 19:45:36
901
原创 Force 开发者日:火山引擎 Agent 开发者生态全面升级
当前,由 Agentic AI 驱动的范式革新,正在系统性地重塑 AI 技术架构的基石、产业形态格局乃至人与技术交互的本质。然而,开发者在构建稳定可用的 AI Agent 时仍面临高成本、技术复杂、落地难等诸多困难。全新的软件纪元正在开启,要如何前瞻布局、制胜未来?
2025-12-19 19:44:36
925
原创 火山引擎 Force 大会发布 veRoCE 传输协议!
在2%丢包率下,veRoCE的有效吞吐仍能达到网卡带宽的约95.7%左右,而RoCEv2在这一场景下因为丢包过多而通信中断。我们欢迎更多设备厂商与云厂商的参与,共同完善以太网高性能传输生态。同时,在云网络的发展下,通用计算、存储等业务也对RDMA组网提出了更高的要求。veRoCE注重兼容性和易用性,支持通用的verbs接口,消息语义与保序模型和RoCEv2一致,业务可以无缝切换。在此背景下,字节跳动推出自研高性能传输协议veRoCE,从源头解决RoCEv2的遗留问题,为大规模GPU集群通信提供更优解。
2025-12-19 19:43:54
489
原创 TRAE CN 企业版正式发布:让 AI 成为企业研发的确定性生产力
12月18日,字节跳动旗下 AI 编程工具 TRAE CN 企业版正式发布,旨在为企业提供高效、安全、可定制的 AI 编程解决方案。2025 年被视为 AI 编程元年,大模型在代码生成、补全、审查等场景中展现出切实的效果与价值。AI 编程正在企业开发中快速普及,并逐步成为主流实践。企业对 AI 编程工具的期待也进一步提升,关注点已从“是否采用”转向“更好地集成、更稳定地落地、更高效地推进”,这一领域正进入规模化、深度化发展的快车道。
2025-12-19 19:42:48
760
原创 两大模型发布!豆包大模型日均使用量突破 50 万亿 Tokens
今天,在FORCE原动力大会上,火山引擎。经过一年多的持续升级,豆包大模型家族在多模态理解和生成能力、Agent 能力上,已位于全球第一梯队。同时,火山引擎持续创新模型服务的定价模式,推出“”,这是业内首个大模型节省计划,让企业达到模型使用成本的全局最优。更强模型、更低价格,让豆包大模型的产业落地高速增长。截至今年12月,目前,已有火山引擎总裁 谭待火山引擎总裁谭待表示,我们正迈向以Agent为技术主体的时代,
2025-12-19 19:31:44
506
原创 获奖名单来啦!Vibe Coze AI 挑战赛 -企业 AI 应用赛道圆满收官!
📣经过激烈角逐,最终获奖结果正式揭晓!我们欣喜地看到 AI 正在成为企业解决问题时的“效率伙伴”。未来,愿每一份对“AI 落地”的探索,都能让工作更高效,让创造更从容。🏆点击海报查看获奖作品~
2025-12-17 19:54:08
116
原创 倒计时 3 天!重磅嘉宾已就位,Force 原动力大会开发者日见!
火山引擎 Force 原动力大会开发者日主论坛重磅演讲嘉宾已就位!从大模型服务平台到 Agent 开发平台和 Agent 开发工具,火山方舟、扣子、TRAE、AgentKit……为开发者带来 Agent 开发落地的高效指引。技术分享、案例解析、动手实操、展区互动。一场 AI 云原生的年终技术盛宴。
2025-12-17 19:52:00
113
原创 同价位性能暴涨 7 倍?火山引擎 Milvus 凭 CAGRA+GPU 破解向量检索性价比悖论
在大模型、多模态应用爆发的今天,向量数据库已成为支撑 AI 检索、语义理解、推荐系统的核心基础设施。随着数据规模的飙升,传统 CPU 向量数据库逐渐陷入“检索瓶颈”——构建时间长,响应速度、批量处理能力不足,甚至成为整个 AI 系统的性能短板。而 GPU 加速向量数据库的出现,不仅彻底打破了这一瓶颈,更重新定义了向量检索的速度边界。
2025-12-10 16:41:46
877
原创 DeepSeek-V3.2正式登陆火山方舟
12月1日,DeepSeek-V3.2 正式版发布。该模型具备出色的推理能力,在公开的推理类 Benchmark 测试中,达到了 GPT-5 的水平。此外,DeepSeek-V3.2 首次将思考融入工具使用,并同时支持思考模式与非思考模式的工具调用。今日,火山方舟正式上线 DeepSeek-V3.2 ,依托充沛算力与极致推理层优化,为用户提供高速、稳定的“满血版”高质量 Tokens 服务。
2025-12-05 20:39:51
448
原创 Vector Bucket:云原生向量存储新范式
在当前的大模型、推荐系统和 AI Agent 等热门技术中,“向量”成为了实现落地的关键。传统的搜索依赖。例如,搜索“新能源车”可能错过提到“电动车”或“绿色出行”的内容。这种方式的局限在于检索引擎。而不同。当文本被转化为向量时,其含义被编码在中。在这个语义空间里,“新能源车”和“电动车”的向量会非常接近,即使字面上完全不同。这意味着机器第一次具备了理解“意思”的能力,而不仅仅是字面匹配。在 AI 世界,这种“理解”正是通过向量来实现的。
2025-12-05 20:39:04
1108
原创 豆包图像创作模型 Seedream 4.5发布:聚焦商业生产力场景
12月3日,火山引擎正式发布(以下简称 Seedream 4.5)。新一代模型在等方面实现迭代,进一步提升了图像生成的整体质量与稳定性。此次升级重点强化了,确保多源素材融合时的自然感与一致性;同时优化了,支持高精度图文混排,广告物料生成更简单高效。目前,Seedream 4.5已全面支持等核心场景应用。
2025-12-03 19:52:31
1377
原创 火山引擎年终技术盛宴,邀你共话 AI Agent 开发与应用!
大会将以 Agent 开发为主题,通过技术分享、案例解析、动手实操、展区互动等形式,带来豆包大模型、火山方舟、Agentkit、扣子和 TRAE 等最新内容,帮助你了解如何编排可靠的工作流、精准设计提示词、构建维护知识库,为你呈现一场 AI 云原生的年终技术盛宴!当技术瓶颈与场景需求碰撞,当创新机遇与时代趋势重叠,我们诚邀每一位心怀热爱与远见的开发者,共同参与见证 Agent 的爆发,用技术突破边界,用创新定义未来,让每一行代码成为开启未来的钥匙!
2025-12-02 18:07:14
278
原创 火山引擎向量数据库 Milvus 版正式商业化:AI 时代的向量检索新标杆
数据堆成了山,却像乱码一样没法用”——这是当下不少企业在AI浪潮中的共同窘境。当大模型像潮水般涌入业务,文本、图像、音频这些“不规则”的非结构化数据,正以每天数十亿条的速度疯狂增长,IDC给出了更详细的数据:2025 年,全年新产生的数据中将有 90% 是非结构化数据,它们本该是企业的“金矿”,却因传统工具“读不懂、查不快、管不好”,沦为食之无味的“数据鸡肋”——只有 18% 的企业机构认为他们有效地利用了非结构化数据。
2025-12-01 15:20:40
614
原创 火山引擎多模态数据湖联合 AI 命令行工具 veCLI:用自然语言完成数据开发全流程
中国智能手机市场相关数据以数据集形式存储于 AI 数据湖 LAS 中,当用户通过 veCLI 输入自然语言指令时,LAS MCP 通过标准化接口实现与 veCLI 的无缝对接,一键启动 “信息采集→整理→分析→可视化” 的全流程自动化闭环,高效完成从指令到成果的转化。据介绍,这套解决方案已在智能驾驶、金融科技、具身智能等多个行业深度应用,比如在自动驾驶场景中,面对车端、路端数据不断膨胀,管理及存储成本高企等问题,多模态数据湖帮助某车企实现了存储成本降低30%、管理效率提升50%。
2025-11-27 18:40:59
308
原创 让文件存储“会说话”:vePFS 数据洞察功能全新发布
在数据驱动的时代,文件存储不应再是“沉默的仓库”,而应是企业的核心数据资产。vePFS 数据洞察功能,以技术创新打破了文件存储与数据分析之间的壁垒,让每一份数据的价值都清晰可见,让每一次存储决策都有据可依。从今天起,选择 vePFS 数据洞察,告别“数据黑箱”,开启文件存储的“透明化”管理新时代。点击【阅读原文】,了解更多 vePFS 信息。
2025-11-27 18:39:59
343
原创 火山引擎 MongoDB 进化史:从扛住抖音流量洪峰到 AI 数据底座
在生成式人工智能和大模型迅猛发展的当下,数据已不再仅仅是「存储」对象,而是智能应用的核心资产。MongoDB 凭借灵活的数据模型、丰富且高性能的查询能力以及原生向量检索能力,成为构建 RAG 系统、智能问答、推荐引擎等 AI 应用的理想基础。而在字节跳动庞大的技术版图中,MongoDB 也并非简单的 “数据库工具”,而是伴随业务从创业期到 AI 时代的 “核心数据底座”。
2025-11-20 19:44:07
1240
原创 veDB-Search 实战:多路召回,文搜万物
而 veDB-Search,则是基于 veDB MySQL 版的技术底座,拓展出的一站式混合检索的全新服务:用户仅使用 SQL ,即可完成对向量+全文+标量数据的存储和混合检索。如果用户不想使用 RRF,或是想获取具体 score 值,可以使用 veDB-Search 提供的 similarity 函数,此函数返回已经范式化的 score 值,可直接参与 ORDER BY 排序。veDB-Search支持对多路召回结果进行加权,既能确保标量和全文检索的精确性,同时也能保障向量搜索的语义理解能力。
2025-11-19 16:09:10
942
原创 豆包编程模型发布!AI 程序员双十一大促9.9元到岗
举例来说,创建一个美观的交互式英语学习网站,相同tokens量下(0-32k输入区间),Claude Sonnet 4.5成本约4.05元,GLM-4.6约0.77元,而Doubao-Seed-Code仅0.34元。,在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等多项权威基准测试中表现优异,领先国内同类模型。:专为 Agentic 编程任务深度优化,在SWE-Bench-Verified官方榜单中。
2025-11-19 15:57:52
1034
原创 实战|从手绘稿到小游戏,豆包编程模型上手指南
打开方舟 Coding Plan(https://www.volcengine.com/activity/codingplan),活动页面,对比选择适合的套餐,轻量化使用考虑Lite,频繁使用考虑Pro。(https://console.volcengine.com/ark/region:ark+cn-beijing/apikey)使用已注册的火山引擎账号访问实名认证页面(https://console.volcengine.com/user/authentication/detail/)
2025-11-13 20:21:33
1091
原创 Vibe Coze-企业 AI 应用赛道开启
参赛选手需从企业真实需求(如数据分析、办公助手、知识查询/管理、营销推广等场景)出发,基于扣子(coze.cn) /扣子空间的能力创建一个 H5 或其他可复现的成品项目,推荐结合使用豆包编程模型 Doubao-Seed-Code、火山引擎 veCLI。三大赛道均可参与,形式不限,你可以选择帮你的作品/开发过程等等瞬间发布到抖音、小红书、即刻、B站、公众号、社群等任意社交平台上,艾特@扣子Coze,打上#扣子AI工坊 #扣子空间 两个tag,即可参与评选。
2025-11-12 16:20:15
1025
原创 Agent Developer Group 正式启航,共赴 Agent 技术新征程!
成立 ADG 社区,正是为了搭建一个开放、共享、协作的平台,汇聚各方智慧与力量,共同交流、探索 Agent 开发与应用的话题,让更多开发者能在 AI 时代学习和实践最前沿的技术。ADG 并非火山引擎的销售渠道,也不隶属于火山引擎,它是一个独立运营的用户与开发者社区,为成员提供结识新友、学习新技术的平台。从技术原理的深度剖析,到实际项目的案例解析,再到动手实践的操作指导,最后实现技术的落地应用,形成一个完整的学习与实践闭环,助力大家在 Agent 技术领域不断成长与进步。
2025-11-10 18:09:53
795
原创 Data+AI 时代,对象存储为 AI 应用注入全局动力
在 Data+AI 时代,面对生成式 AI 与智能驾驶等场景所催生的海量数据存储需求,传统对象存储需应对三大核心挑战:POSIX 协议转换性能不足、分布式训练数据跨域协同困难、分布式训练场景下的存储性能瓶颈(高频并发访问导致算力空转)。针对这些问题,TOS 创新性地提出FSX+MRAP+加速器全链路加速方案。
2025-11-06 21:19:23
823
原创 veRL CollabLLM recipe: 奖励全局最优,训练出善于对话的协作型 LLM
LLM 协作能力瓶颈与 CollabLLM 的创新思路大型语言模型(LLMs)已经能够解决奥林匹克竞赛等难题,但却常在极其简单的日常多轮对话中表现较差。对于大多数用户提出的不够具体的需求,这些 AI 工具可能会作出不当假设、忽略关键细节或未能提出澄清问题、以及无法主动提供建议。
2025-10-23 10:01:52
1171
原创 火山方舟原生支持自持密钥 HYOK|密钥管理最佳实践
为了向用户提供更高数据安全等级和掌控权,火山方舟首发支持 MaaS 原生的 HYOK(Hold Your Own Key,自持密钥)能力,数据集与精调模型的传输、存储、调用过程全部支持使用用户自持密钥。
2025-10-23 09:58:24
839
原创 5 倍性能优于开源版,火山 Milvus 集成 DiskANN+RaBitQ
向量检索正在进入“既要又要”的时代:既要高召回、低时延,又要可扩到亿级、成本可控。此前在火山云搜索中,我们引入磁盘化向量索引 DiskANN[1],通过将向量存储在磁盘上,内存仅保留图文件,低成本支撑百亿级数据,将向量检索的成本减少 90% 以上。
2025-10-23 09:54:17
732
原创 火山引擎发布 veFusionX:“两行代码” 实现智驾模型训练效率翻倍!
veFusionX 的核心目标是:用最少的代码改动,换最大的效率提升—— 只需两行代码,就能让数据吞吐提升 100%;同时兼容多硬件平台,降低开发者迁移成本。
2025-10-14 14:58:56
590
原创 为 AI Agent 行为立“规矩”——字节跳动提出 Jeddak AgentArmor 智能体安全框架
继 LLM(大语言模型)之后,AI Agent(智能体)正掀起新一轮的技术革命。它们不再仅仅是语言的“复读机”,而是能够自主理解、规划并执行现实世界任务的“行动派”。从自动预订旅行、管理复杂的云资源,到处理成千上万封邮件,AI Agent 展现出的巨大潜力,预示着一个由 AI 驱动的自动化新纪元。
2025-10-14 14:52:53
871
原创 AI 时代火山引擎对象存储:为数据松绑,让算力起飞
痛点直击:谁在拖慢智能化进程?在 AI 浪潮下,无论是追求技术突破的 AI 算法公司,还是致力于自动驾驶的研发团队,都面临同一"隐形杀手"——存储带宽瓶颈。这个看似不起眼的问题,却可能让你的智能化项目功亏一篑。
2025-09-25 14:34:18
1165
原创 MCP 安全“体检” | AI 驱动的 MCP 安全扫描系统
Model Context Protocol (MCP) 作为 AI 应用生态系统中的关键协议,为大语言模型与外部工具、数据源的集成提供了标准化接口。随着 MCP 在企业级应用中的快速普及,其安全风险也日益凸显。构建一套智能化的 MCP 安全扫描系统,不仅是技术发展的必然需求,更是保障 AI 生态安全的重要基础设施。
2025-09-25 14:32:15
1114
原创 火山引擎正式发布弹性文件存储
AI 训练和推理对存储系统的极致挑战在 AI 浪潮中,大模型训练与推理正以前所未有的速度推动计算能力突破极限。从自动驾驶 PB 级数据洪流到生成式 AI 微秒级推理响应,算力竞速已成为科技前沿的焦点。
2025-09-24 10:16:59
1004
原创 火山引擎 veCLI 发布,开启智能开发新模式
在当前 AI 技术快速发展的浪潮中,企业普遍认识到利用 AI 技术提升软件开发效率已成为重要的创新方向。然而,在复杂的国际环境下,国内开发者面临着无法使用 Claude Code、Gemini CLI 等国外 AI 工具的困境,这使得对找到高效的 AI 支持开发工具变得愈发迫切。
2025-09-18 14:47:50
542
原创 豆包・图像创作模型 Seedream 4.0 正式发布!
9 月 9 日,火山引擎正式发布豆包・图像创作模型 Seedream 4.0(以下简称 Seedream 4.0)。该模型首次支持 4K 多模态生图,灵活支持文本、图像的组合输入,实现多图融合创作、参考生图、组合生图、图像编辑等核心能力,且主体一致性大幅增强。
2025-09-11 17:16:29
2064
原创 Claude用不了?火山引擎为开发者上线“搬家”方案
9 月 5 日,Anthropic 宣布停止向中国资本控股(超 50% 股权)的企业及其子公司提供 Claude 服务。此前,Claude 系列模型因其编程能力出众受到开发者的好评和广泛应用。
2025-09-05 22:04:55
847
原创 即梦AI携手火山引擎全面开放API服务!
火山引擎、即梦AI 正式官宣即梦AI 正式上线火山引擎面向企业开放 API 服务涵盖图片生成、视频生成、数字人生成三大类
2025-09-05 13:58:24
505
原创 通过工具增强 LLM Agent 能力:veRL+ReTool 的完整实践指南
字节跳动的 ReTool 框架,用 “冷启动 SFT+RL 策略学习” 的组合拳,让 LLM 学会 “思考 - 执行 - 反馈” 的闭环:先通过监督微调(SFT)掌握基础工具调用,再用强化学习(RL)优化策略,最终在 AIME2024 数学数据集上达到 67% 准确率(仅 400 步训练),远超文本基线 RL 的 40%(需 1080 步)。
2025-09-03 10:56:58
997
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅