- 博客(79)
- 收藏
- 关注
原创 GPU 云服务器的软件系统设计和实践
我们在设计 GPU 云服务器时,需要综合考虑上面 GPU 数据处理链路的每一个环节,然后结合业务特点和使用成本,进行 GPU 云服务器的设计。
2025-03-03 19:47:39
787
原创 百度百舸 DeepSeek 企业套件上线,加速 DeepSeek 融入企业生产业务
点击「文件上传」上传本地文件。快速部署只是企业落地 DeepSeek 的第一步,真正将 DeepSeek 投入实际业务中,还需要在这个基础上进行扩展功能的开发和系统对接,如联网搜索、文件上传解析、对接知识库、内容审核等,才能让 DeepSeek 真正地在业务中发挥价值。访问百度百舸页面,在工具市场的工具模版中,选择「DeepSeek-R1(FP8)」镜像,点击「部署工具」按钮,快速部署 DeepSeek-R1。完成配置后点击确认,当「工具实例」状态从「创建中」变为「运行中」,表明工具已部署成功。
2025-02-28 11:12:21
527
原创 百度百舸 DeepSeek 一体机发布,支持昆仑芯 P800 单机 8 卡满血版开箱即用
百度百舸 DeepSeek 一体机基于百度百舸平台打造,提供纯国产的算力组合,支持昆仑芯 P800 单机 8 卡部署满血版 DeepSeek R1/V3,支持 8bit 推理。企业可以将一体机部署在私有云环境中,从开箱上电到服务上线最快仅需半天。
2025-02-17 10:04:33
1915
原创 核心业务上云,如何释放国产 CPU 极致性能?专有云 ABC Stack 给出答案
性能要求较低的业务则可关闭所有性能优化措施,充分利用碎片化资源,从而最大化提升云平台的资源利用率。实施以上优化方案,客户的国产 CPU 专有云整体性能显著提升:业务平均 TPS 增加 36%,核心业务平均 TPS 增加 64%,实现了业务全面上国产化 CPU 云的目标。通过实施以上优化方案,客户的国产 CPU 专有云整体性能显著提升:业务平均 TPS 增加 36%,核心业务平均 TPS 增加 64%,帮助客户实现业务全面上国产化 CPU 云的目标,满足各类业务的性能需求,提升了云平台的资源利用率。
2025-02-11 11:54:24
826
原创 如何在百度百舸部署满血版 DeepSeek-V3、DeepSeek-R1 模型
百度百舸·AI 异构计算平台已支持快速部署 DeepSeek V3、R1 及其蒸馏的 Llama、Qwen 等小规模 dense 模型。
2025-02-07 13:41:54
279
原创 0 Token 间间隔 100% GPU 利用率,百度百舸 AIAK 大模型推理引擎极限优化 TPS
优化推理引擎的终极目标其实就是,极限提升前向推理的吞吐,同时极限压缩 Token 间间隔,最终提高极限出字率。
2025-01-07 17:46:55
1275
原创 唤醒 AI 算力,专有云 ABC Stack 面向企业级智算平台的 GPU 提效实践
基于百度在大规模集群的技术积累和工程实践,在向企业交付智算平台后,专有云 ABC Stack 还为客户提供了一套面向整体 GPU 算力平均利用率、训推任务加速和稳定性等场景的 GPU 提效服务。
2025-01-02 14:13:16
822
原创 MySQL 遇到瓶颈怎么办?GaiaDB 支撑「账三丰·代账业务」服务数万家企业
北京神州三丰互联网科技有限公司(以下简称:神州三丰科技)是国内早期提出代理行业 CRS 管理与服务理念的企业。神州三丰科技旗下品牌“账三丰”是专为代理记账公司量身定制的智能财税 SaaS 软件,致力于推动代理记账行业从电算化时代进入互联网数智化管理时代。目前,账三丰软件已为数万家代账公司提供 CRM + CRS + 智能做账一体化解决方案。账三丰软件,通过对未成交客户管理,签约客户管理,内部审批即专门针对代账行业的轻量级 CRM+ 内部 OA 系统,帮助提升代理记账行业的协同管理与服务质量;
2024-12-27 11:39:03
566
原创 广告投放系统成本降低 70%+,基于 Redis 容量型数据库 PegaDB 的方案设计和业务实践
如果该数据在短时间内被频繁访问,则升级为热数据,由运维人员手工将数据从 MySQL 同步至 Redis,以便加速应用的下一次访问速度。更新 Cache 的逻辑设定为每 10 秒钟一个周期,每周期清空 LRU Cache 中的旧数据(即最长时间未被访问的数据,被视为冷数据),同时更新最新的热点数据,将热点数据加载到缓存中。数据删除:切换完成后,老数据还会占用磁盘空间,业务可以在命令空间提交删除老数据的任务,整个删除的任务流程耗时为分钟级,任务完成后,磁盘空间会立即腾出,删除过程不断连不阻写。
2024-12-19 11:28:47
1108
原创 专有云 ABC Stack 推出生态网关,让专有硬件快速上云一个都不能少
为了解决专有硬件入云难以及后续的管理问题,百度智能云的「专有云 ABC Stack 」推出了生态网关。在不进行物理网络改造的前提下,用户即可通过生态网关,便捷地将各类专有硬件一键集成到云平台中。生态网关赋予专有硬件「云属性」,让其享受到与云实例同等的云内互连及安全特性,使云内资源高效、安全的访问专有硬件所提供的服务。生态网关会按需监测专有硬件的运行状态,及时发现链路故障并自动容灾切换,保障云平台与硬件互访的端到端高可靠。
2024-12-13 11:57:59
308
原创 轻松搞定平稳运行,数据库平台 DBStack 帮助 DBA 运维不同基础设施上的各类数据库
DBStack 为企业提供了一站式的多云和混合云管理解决方案,客户可以通过 DBStack 平台和数据库内核引擎实现不同云 IaaS 层的统一管理,无缝对接国内外云基础设施,确保用户在不同云环境下都能获得一致的数据库使用体验,同时保持数据的安全和合规。在某大型国有银行的 IT 系统中,依据不同业务等级和场景的需要,使用的数据库引擎也有所不同。然而,不同的数据库引擎有着各自的特点和管理方式,这就代表数据库的运维人员需要掌握多种技能和工具,这无形中增加了数据库管理的难度与运维工作的复杂性。
2024-11-27 14:29:43
1048
原创 百度智能云千帆大模型平台引领企业创新增长
提供了最专业的应用开发工具、最丰富的大模型、最全面的工具链。千帆 ModelBuilder 提供的就是全流程的、模型训练和模型精调的工具链,包含:数据管理、训练模式、开发工具、评估优化、推理部署、大模型周边系统。除了智能体作为应用载体之外,还有非常多的企业级传统应用,过去是通过写代码的方式开发,今天我们通过大模型也实现了零代码分钟级开发,它就是 AI 速搭平台。今天我的发布到此结束,非常希望通过千帆平台,以及我们的一系列样板间,持续为大家提供最低门槛、最高效易用的大模型落地工具,加速企业落地的最后一公里。
2024-11-19 13:55:41
3611
原创 百度智能云 VectorDB 优势数量 TOP 1
近日,IDC 发布了《RAG 与向量数据库市场前景预测》报告,深入剖析了检索增强生成(RAG)技术和向量数据库市场的发展趋势。报告不仅绘制了 RAG 技术的发展蓝图,还评估了市场上的主要厂商。在这一评估中,百度智能云的向量数据库 VectorDB 在核心性能、功能全面性、大模型支持、战略与生态合作、工程化落地五个关键领域保持领先,综合排名并列 TOP 1。
2024-11-15 11:04:07
1578
2
原创 数据湖系列之四 | 数据湖存储加速方案的发展和对比分析
我们期望本文能够帮助读者对大数据和 AI 场景下的「数据湖存储加速」这个主题建立一个整体把握,为选出适合自己业务的方案提供参考。
2024-11-12 12:22:14
808
原创 百度沧海·存储统一技术底座架构演进
我们认为各种存储系统实际上是由元数据面和数据面两部分组成,通过提炼出高度可复用的元数据面和数据面的统一技术底座,就能积木式搭建各种云存储系统,比如对象存储、文件存储、块存储等,最大化减少重复开发的工作。
2024-11-04 13:00:32
1061
原创 AI 原生时代,更要上云:百度智能云云原生创新实践
在基础设施层面要更加全面彻底的云原生化,以此为基础构建 AI 原生的应用架构,并面向 AI 研发进行 MLOps/LMOps 的研发流程升级
2024-10-28 17:45:16
1131
原创 百度智能云千帆 AppBuilder 大模型应用开发解读
最后一个,前面我们介绍的都是工具,其实工具摆在这儿,用好和用不好,最终产生的结果是截然不同的,所以在这个过程中我们也沉淀了一套应用落地方法论,包括大量不同尺寸大模型到底怎么选、Prompt 怎么调、RAG 调优怎么调、问数调优怎么调,以及组件开发和 Agent 调优能力,我们将这些经验变成文档,变成课程输出给我们的客户和伙伴,让大模型真正落地变得更简单。整个的应用的分发都是通过千帆 AppBuilder 平台来完成的,所以它能看到应用日常使用的情况,评估应用效果并指导更新迭代。
2024-10-23 14:52:53
1718
原创 百度智能云千帆 ModelBuilder 大模型服务及开发解读
除此之外,我们提供了大量的垂直场景大模型,用于一些非常垂直的,对效果和性能要求非常高的场景,比如说用于角色扮演的 ERNIE Character 模型,用于函数调用 ERNIE Functions 模型,用于小说生成电影场景的 ERNIE Novel 模型。在旗舰大模型上我们提供了重要的升级,包括了ERNIE 4.0 Turbo,相对于原来的 ERNIE 4.0,在大多数的通用场景上效果更好,速度更快,也是我们现在用的最多的旗舰型模型。大多数的大模型强化学习都是用的传统 RLHF 的方式,使用难度非常大。
2024-10-18 18:02:47
1642
原创 大模型时代,云原生数据底座的创新和实践
缓存数据库核心挑战还是在性能、成本、高可用方面,在过去一年里面,我们核心优化了这些方面,性能上支持批量加载,高用上支持异地多活的能力,成本上支持冷热分离,通过把相对较冷的数据自动迁移到 SSD 上显著降低成本。百度智能云提供一站式云原生数据底座,覆盖完整的数据库的关系型、NoSQL、工具、大数据的开发工具,离线计算,在线中间等全套产品和服务。doris 是百度开源出去的数据仓库。百度智能云的云原生数据底座也在持续演进,给客户提供更快、更强、更智能、更易用的能力,使能大模型业务,满足百行千业客户的诉求。
2024-10-14 19:25:35
1205
原创 百度智能云新一代云原生产品加速 AI 原生应用落地
在异构计算方面,百度智能云提供支持多种异构芯片的计算产品,包括国际主流的 L20/H20 等 GPU,以及自研加速芯片等计算产品,面向推理和训练场景全面优化性能,最高配备 3.2T 的 RDMA 高速网络,实现算力和网络的最佳配比,形成形态丰富的异构算力矩阵。以容器产品为基础,全面加强云原生应用产品的企业级产品特性,简化运维复杂度,做到性能和稳定性的提升,覆盖应用部署、应用可观测和应用可运维的应用全生命周期,释放开发者生产力。基于新一代目录树架构技术,进一步提升了云原生数据湖的性能和大数据分析的产品功能。
2024-10-12 13:30:38
956
原创 百度网盘企业版数据快速上云,数据流转平台 CloudFlow 加速大模型训练迭代
一个项目的周期应该如何计算,将计算开始运行作为起点,计算结束运行作为终点?
2024-09-20 15:06:01
528
原创 HelixFold 3 全球首个完整复现 AlphaFold 3,百度智能云 CHPC 为人类生命探索提供算力平台支撑
在这两个版本的数据集上,HelixFold 3 即便在没有指定蛋白质结构的情况下,仍然展示出卓越的表现,成功率甚至超过了依赖已知蛋白质结构的方法,其预测精度与目前顶尖的 AlphaFold 3 相当,这表明 HelixFold 3 在蛋白质-配体相互作用预测领域的出色潜力。众所周知,在包括人体在内的生物体当中,蛋白质并不是孤立运作的,蛋白质与各种其他分子的相互作用会贯穿不同的生物功能,这影响着研究生物和疾病的机理和通路、药物的研发等。但是,AlphaFold 2 无法预测蛋白质与其他类型分子的相互作用。
2024-09-12 15:43:10
607
1
原创 百度智能云向量数据库创新和应用实践分享
本文整理自第 15 届中国数据库技术大会 DTCC 2024 演讲《百度智能云向量数据库创新和应用实践分享》在 IT 行业,数据库有超过 70 年的历史了。对于快速发展的 IT 行业来说,一个超过 70 年历史的技术,感觉像恐龙一样,非常稀有和少见。但是数据库之所以有这么长的生命力,核心是在不停的变更和创新。简单回顾一下数据库的历史,在过去的 70 年里面,数据库一直跟着底层基础设施和上层业务的变化的潮流,一直在变化。
2024-09-06 10:13:19
1918
原创 云高性能计算平台 CHPC 让企业的传统 HPC 玩出新花样
在混合云 HPC 集群和最新一代硬件的基础上,CHPC 还提供了任务动态调度和资源弹性伸缩能力,确保了集群的资源能够被充分利用,提交的任务可以被第一时间运行,降低企业投入资源成本的同时,提升任务运行速度。通过最新一代的硬件资源,结合任务动态调度和资源弹性伸缩等管理能力,打造强大的 HPC 集群基座的同时,还需要对上层的应用进行优化,充分发挥基座的能力,使得整个任务运行效果达到最优。能够全面监控计算节点的资源使用状态,将处于排队中的任务动态调度到空闲的队列上,这样就能够很好的解决资源浪费的问题。
2024-08-12 15:33:59
93
原创 百度智能云 ABC Stack 获可信云技术最佳实践,共建一云多算生态
此外,百度智能云联合信通院等共同启动了「一云多算生态共建计划」,并发布《一云多算综合技术能力要求》标准,共同推动以一朵云的方式将通用算力、超算、智能算力等多种资源池融合,提供统一调度、管理、运维运营等操作的技术能力。因在该标准制定过程中的突出贡献,百度智能云获评「一云多算标准最佳贡献单位」。会上,百度智能云混合云总经理杜海和中国信通院云大所所长何宝宏签署业务合作协议,未来中国信通院云大所和百度智能云将在云原生、专有云、智算服务、开源治理、数字化转型等多个领域深度合作,共同助力云计算产业健康有序发展。
2024-07-31 12:52:18
602
原创 如何定量分析 Llama 3,大模型系统工程师视角的 Transformer 架构
Llama 3 技术博客说 70B 模型、最长序列 8K、15T Tokens,训练了 640w GPU 时,这发挥了 H100 理论算力(989TFlops)的百分之多少?
2024-07-25 15:01:52
1181
原创 无需业务改造,一套数据库满足 OLTP 和 OLAP,GaiaDB 发布并行查询能力
与传统 MySQL 单线程相比,在 32 线程并行执行下,GaiaDB 单表复杂查询性能最高提升 14 倍,平均提升 8+ 倍。
2024-07-17 18:52:14
1126
1
原创 百度智能云将大模型引入网络故障定位的智能运维实践
用千帆大模型平台雇了一个文心大模型来给网络运维打工。这个打工人可以告诉你,他是如何从复杂的网络信息中进行逻辑推理,实现快速精准的故障定位。
2024-07-10 18:36:04
1248
3
原创 千帆大模型平台升级十大能力,企业级 RAG 全面升级
在医疗领域,杭州全诊医学基于百度智能云千帆平台打造了 AI Agent 应用——AI 医生助理,在预诊、诊间、住院、手术等多个医疗场景中为医护人员提供病史采集、病历书写、诊疗辅助等支持,大幅提升医护人员工作效率、改善病患就医体验。此外,针对企业精调专用模型经常遇到的特定场景数据欠缺、大模型通用能力被遗忘等问题, ModelBuilder 全新推出混合文心大模型高质量数据功能,支持用户将文心大模型通用混合语料、文心大模型垂直领域语料与业务数据进行融合,精调出更稳定、效果更好的专用大模型。
2024-07-08 10:59:46
948
原创 轻松两步,借助向量数据库 VectorDB 与千帆 Appbuilder 构建个性化本地问答知识库
在我们日常的工作和生活中,经常会遇到需要快速获取和管理大量信息的情况。无论是解答客户的问题,还是整理公司内部的资料,一个高效的知识库系统都能帮我们省下大量时间和精力。为了帮助大家快速构建 RAG 应用,我们之前发布了一个的文章,意在 Step By Step 打通搭建的壁垒,但是广大的用户反馈还是比较复杂,至少需要 9 步才能搭建,这对于很多人来说确实是个不小的挑战。为了让更多人能够轻松构建自己的知识库,我们开发了一个全新的 RAGFlow SDK。
2024-06-24 17:58:44
1231
原创 基于 Native 技术加速 Spark 计算引擎
本文整理自 2024 年 6 月 DataFunSummit 2024 OLAP 架构峰会 Lakehouse 湖仓一体化架构论坛的同名主题分享。今天分享的主题是基于 Native 技术加速 Spark 计算引擎,大家将会了解到如何基于 ClickHouse 来改造 Spark 引擎,最终获得较为可观的性能提升。分享主要分为如下四个部分:1)Spark 性能优化背景;2)ClickHouse 性能优势解析;3)Spark Native 加速方案设计和实现;4)加速效果分析。1Spark 性能
2024-06-24 14:08:45
1285
原创 百度智能云推出智能运维工具,云助手让云服务器运维更简单
为了提升云服务器执行命令的效率,百度智能云发布了 SmartTerm 远程连接终端。不止于此,为了更加极致地提升运维效率,我们又推出了「」这款轻量快捷的运维工具。只有做过云服务器运维的人才知道管理上万台云服务器有多崩溃。在海量虚机中执行命令时,要逐台登录、粘贴执行、查看结果、查漏补缺,让人变成流水线中没有感情的机器臂,重复着拧螺丝的动作。
2024-06-18 13:44:20
914
原创 通过搭建 24 点小游戏应用实战,带你了解 AppBuilder 的技术原理
本质上来说,组件是函数或者 API 的抽象表达,那么对于思考模型来说,了解组件的功能以及组件的输入是比较重要的,需要「告诉」思考模型。在构建 AppBuilder 的过程中,思考模型需要遵循复杂的指令,例如格式遵循、用户指令、系统指令、对话历史、组件执行历史等,底座模型的指令遵循能力是最关键的能力,其效率、稳定性、成本是构建 Agent 的关键。定义思考模块的功能边界是创建一个效果不错的 Agent 最重要的步骤,包括角色指令、组件描述、组件入参设计、组件输出的设计、思考模型选择等。
2024-06-12 11:54:11
1002
原创 低代码组件扩展方案在复杂业务场景下的设计与实践
组件是爱速搭的前端页面可视化模块的核心能力之一,它将前端研发人员从无休止的页面样式微调和分辨率兼容工作中解放了出来。目前,爱速搭通过内置的上百种功能组件(120+),基本可以覆盖大部分中后台页面的可视化设计场景。组件的相关的设计理念和实现细节我们可以在前文。
2024-06-12 10:57:49
1507
原创 Doris 实现原理之高效存取 varchar 字符串
字符串采用列存,切分为不同的 page,page 是存储和读取的最小单位。自适应识别高基数列和低基数列,低基数列采用字典编码,高基数列采用 plain 编码。当采用字典编码,会结合 bitshuffle 算法来提升 lz4 压缩效率。segment 内部维护了一个行号,OrdinalIndex 记录了行号与 page 位置的关系。segment 内部自动维护 2 个索引,前缀索引和 zonemap 索引。用户可以额外的创建 bloomfilter 索引和 bitmap 索引,来加速查询。
2024-05-20 16:06:06
1305
原创 都说视频智能分析落地难,但是这次有了大模型!
百度智能云边缘计算团队成功地将大模型、业务场景、边缘设备进行融合,使得上的算子具备了「场景自适应能力」,并实现了「采集 - 清洗 - 标注 - 训练 - 部署 - 迭代」全流程的自动化。在视频智能分析场景中,研发人员使用少量业务现场收集的数据,就可以在短时间内研发出满足业务需要的算子,实现项目的冷启动。已经部署在中的算子,能够随着时间推移实现自我进化,始终保持业务的最佳效果。在大模型的加持下,基于边缘服务器 ECS 建设的视频智能分析项目,落地时间从过去数周缩短为数天,乃至更短。
2024-05-15 13:56:30
229
原创 百度百舸 AIAK-LLM 的大模型训练和推理加速实践
具体的原理是先通过一个用相同数据集训练好的小模型来生成多个位置的 token,然后再经过原始的大模型并发的进行各 token 的计算,来选择每个位置正确的 token(不正确的会丢弃掉),decoder 阶段的 MFU 会有比较大的提升,这样在一次计算中即可产出多个位置的 token。当前大家做模型研发都离不开一个社区 Hugging Face,大家的模型是从 Hugging Face 来的,早期的代码也是 Hugging Face 的,我们这种专有的加速工具对于早期客户来说往往遇到切换成本高的问题。
2024-05-15 13:41:30
936
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人