- 博客(162)
- 收藏
- 关注
原创 JuiceFS sync 原理解析与性能优化,企业级数据同步利器
是一款强大的数据同步工具,支持在对象存储、JuiceFS、本地文件系统之间进行数据同步。sync 能将大规模全量迁移的效率提升到接近链路带宽上限,使 PB 级数据迁移通常具备“按天/周”量级的可行性(具体时长取决于带宽与云端限速)除此之外,还支持通过 SSH 访问远程目录、HDFS、WebDAV 等,同时提供增量同步、模式匹配(类似 rsync)、分布式同步等高级功能。本文将围绕 sync 的核心执行原理展开,介绍其在单机与集群模式下的架构与任务调度机制,并详细说明如何通过并发优化提升性能。
2025-11-26 15:27:48
387
原创 NAS、对象存储与 JuiceFS:百亿量化基金的存储选型实践
在量化投研过程中,因子数据、交易策略等敏感信息的保护至关重要。存储系统必须提供强大的模块化访问权限管理机制,保障数据的隐私与安全性。此外,随着越来越多的数据存储转向云环境,数据加密、审计和合规管理等功能成为必须提供的安全措施,以确保敏感数据在云上安全存储和访问。
2025-11-20 15:17:24
632
原创 深入解析 JuiceFS 垃圾回收机制
JuiceFS的垃圾回收机制背后的执行流程相对复杂,用户难以直观理解文件状态变更和资源释放的时机。为帮助用户深入理解文件删除与存储回收的内部逻辑,本文将系统梳理垃圾回收的关键流程与实现原理,解析常见问题的成因,并提供高效清理与运维的操作建议。
2025-10-30 15:30:49
765
原创 基于 JuiceFS 构建 AI 推理:多模态复杂 I/O、跨云与多租户支持
随着 AI 技术的快速发展,推理服务的需求在市场中不断增长,已成为各行各业广泛关注的关键应用。随着思维链、慢思考等技术的出现,模型的推理能力也在不断的增强。推理能力的实际应用覆盖了更多行业和场景,成为企业部署 AI 基础设施时不可忽视的关键因素。更多企业关注如何高效、可靠、经济地将 AI 落地并解决实际应用中的问题。将更多的计算资源投入推理计算已成为更具性价比的性能提升方式。与此同时,。如何选择合适的存储方案,已成为企业在构建 AI 基础设施过程中必须面对的重要课题。
2025-10-17 16:00:34
1031
原创 九识智能:基于 JuiceFS 的自动驾驶多云亿级文件存储
九识智能 Zelos 是一家专注于自动驾驶与无人配送技术的高新技术企业,具备自动驾驶系统及 AI 芯片的自主研发与规模化落地能力。公司核心产品已在全国 200 多个城市广泛部署,整车销售市占率超过 90%,在中国 L4 城配自动驾驶领域持续领先。。此外,随着算法迭代加速和跨地域业务部署,多云环境下的数据流转与资源调度需求日益频繁,但存在数据分散、迁移成本高和调度复杂等问题。部分存储工具社区支持有限、响应慢,进一步增加了运维难度。
2025-09-24 16:24:19
1048
原创 从 MLPerf Storage v2.0 看 AI 训练中的存储性能与扩展能力
8 月 5 日,全球权威 AI 工程联盟 MLCommons 发布了最新的 MLPerf® Storage v2.0 基准测试结果。本次评测吸引了众多厂商参与,包括 Cloud、Shared File、Fabric-Attached Block、Direct-Attached Block 这几大类存储厂商。由于各厂商在硬件配置、节点规模和应用场景上的差异,直接进行横向比较存在局限性。因此,本文将聚焦于共享文件系统这一类别,分析其在相同测试标准下的表现。
2025-09-17 16:50:18
1532
原创 实现 TB 级聚合带宽,JuiceFS 分布式缓存网络优化实践
随着数据量和模型规模的爆炸性增长,多个客户端频繁访问相同数据的场景变得愈发普遍。分布式缓存通过聚合多个节点的本地缓存,形成大容量缓存池,从而提升缓存命中率、增强读带宽和 IOPS,降低读延迟,满足高性能的需求。然而,节点间的数据交换极度依赖网络性能。带宽不足会限制数据传输速度并增加延迟;过高的网络延迟则会影响缓存响应,降低系统效率;同时,网络数据处理所消耗的 CPU 资源也可能成为瓶颈,制约整体性能。
2025-09-03 13:48:36
863
原创 JuiceFS writeback:写加速机制与适用场景解析
为了提升写入效率,JuiceFS 提供了 writeback 功能。例如在写入 1 万条数据的案例中,启用 writeback 后,数据传输在 10 秒 内完成;未启用 writeback 时则需要 2 分钟。然而,writeback 功能也伴随着一些风险和使用限制。本文将详细介绍 JuiceFS 的写入机制,解析 writeback 的工作原理、适用场景以及使用时的注意事项,帮助用户全面了解该功能的优势与潜在问题。
2025-08-25 14:41:36
1026
原创 稿定科技:多云架构下的 AI 存储挑战与 JuiceFS 实践
稿定科技(gaoding.com)是一家专注于为企业和个人提供视觉内容创新方案的科技公司,致力于打造全新的设计方式,帮助更多用户轻松掌控设计,创造价值。随着 AI 技术的加速发展,数据存储和管理成为支撑公司创新与发展的关键基础设施。最初,“稿定”的 AI 训练数据主要依赖公有云厂商提供的对象存储和 NAS 服务。但随着业务快速发展,单一云厂商的 GPU 资源已无法满足需求,“稿定”逐步转向多云架构,以获取更灵活的计算资源。
2025-08-08 14:34:52
719
原创 3000 台 JuiceFS Windows 客户端性能评估
该测试场景基于实际渲染环境设计,但具有更高的负载与性能要求,旨在验证 JuiceFS 在渲染任务中的数据处理能力。测试内容涵盖 JuiceFS 的整体产品能力,包括 Windows 客户端、元数据服务器软件和分布式缓存集群软件。测试结果表明,JuiceFS 能够支持至少 3000 台 Windows 设备同时进行渲染前置存储相关读取的任务,平均完成时间为 22 分钟 22 秒,最大任务完成时间在 34 分钟以内,显示了 JuiceFS 在大多数渲染场景中能够有效满足实际业务对存储的需求。
2025-08-06 17:30:16
755
原创 JuiceFS on Windows: 首个 Beta 版的探索与优化之路
在近期发布的 JuiceFS 社区版1.3 和企业版 5.2 中,我们对 Windows 客户端进行了大量的优化工作。在早期版本中,JuiceFS 也尝试支持 Windows 平台,但是在使用体验和稳定性方面存在诸多问题,无法达到一个稳定的可用状态。去年,我们决定重新对 Windows 客户端 进行全面改进,力求在提高性能的同时,提供更加稳定和高质量的用户体验。在近期的一次云端渲染场景测试中,我们对 3000 台 Windows 客户端进行了小文件读写性能测试,结果表明性能已能满足大规模使用需求。
2025-08-04 16:48:23
978
原创 从资源闲置到弹性高吞吐,JuiceFS 如何构建 70GB/s 吞吐的缓存池?
本文介绍了 JuiceFS 在 AI 训练与推理场景中的应用。在这些场景中,虽然延迟和 IOPS 重要,但吞吐性能和性价比同样不可忽视。针对传统并行文件系统(PFS)成本高且吞吐量与存储容量绑定的问题,JuiceFS 提供了一种低成本、高效益的解决方案。其通过数据与元数据分离的架构,能够将业务节点上的闲置磁盘、内存和网络资源池化,按需构建高性能的分布式缓存集群,避免了容量绑定的限制。
2025-08-01 14:49:00
871
原创 探索 LanceDB 在多种存储方案下的查询效率
LanceDB 是一个专为多模态数据设计的高性能向量数据库,旨在高效管理和搜索大规模的向量数据,特别适合用于 AI/ML 等应用场景,尤其是在多模态数据(如图像与文本嵌入)场景。JuiceFS 是一个为云原生环境设计的分布式 POSIX 文件系统。它采用元数据与数据分离架构,从而实现了对跨多个存储后端的大型数据集的高效管理。JuiceFS 提供了极高的可扩展性,适用于需要多个节点并行访问数据的场景,如大规模的 AI/ML 工作负载。
2025-07-30 15:29:47
927
原创 多模态“卷王”阶跃星辰:如何利用 JuiceFS 打造高效经济的大模型存储平台
在业界有“多模态卷王”之称的阶跃星辰,自研的 22 款基础模型中有 16 款为多模态模型,覆盖文字、语音、图像、视频、音乐与推理等多个方向。为支撑多模态模型的研发与落地,团队在基础设施层需覆盖从数据生成、清洗,到模型预训练、后训练、推理部署的完整链路,对存储系统在数据吞吐、访问延迟与读写效率等方面提出了极高要求。随着业务规模的快速扩展,早期采用的商业存储系统逐渐暴露出扩展性有限、稳定性不足、运维复杂等问题,难以满足多模态大模型持续增长的存储需求。
2025-07-23 17:41:45
894
原创 合合信息:基于 JuiceFS 构建统一存储,支撑 PB 级 AI 训练
合合信息是一家专注于智能文字识别、图像处理、自然语言处理、知识图谱与大数据挖掘的科技公司,依托自主研发的 AI 与大数据技术,已在上交所科创板上市。公司主要 C 端产品包括扫描全能王、名片全能王和启信宝。随着 AI 训练平台规模持续扩展,公司积累了千亿级文件和百 PB 级数据,覆盖 NLP、CV 等多种任务类型,存储需求愈发复杂。原有架构中,BeeGFS 作为高速并行存储提供 RDMA 访问,但容量有限;SeaweedFS 提供大容量对象存储,但性能存在瓶颈,且与在线服务混合部署,易出现资源抢占问题。
2025-07-18 14:21:51
671
原创 JuiceFS 社区版 V1.3 正式发布:支持 Python SDK、亿级备份加速、SQL 和 Windows 全面优化
JuiceFS 社区版 v1.3 今日正式发布,是自 2021 年开源以来的第四个重要版本。四年多的开源历程中,JuiceFS 在 GitHub 上已获得超 11.8K star,数据用量超过 800 PiB,并在企业的生产环境中得到了长时间的验证,核心功能逐步趋于稳定。JuiceFS v1.3 在此基础上,重点针对一些大规模、高并发等复杂场景进行了性能与稳定性优化。该版本为长期支持版本(LTS),我们将继续维护 v1.3 和 v1.2,v1.1 将停止更新。
2025-07-08 10:58:24
1069
原创 Lustre 与 JuiceFS :架构设计、文件分布与特性比较
在 AI 模型训练、高性能计算等对 I/O 敏感的场景中,底层文件系统的架构和性能将直接影响训练效率、资源利用率与整体成本。Lustre 作为传统高性能文件系统,以极致性能著称;而 JuiceFS 则以云原生设计和对象存储集成为核心,提供更高的部署灵活性与经济性。为了帮助用户深入理解这两类系统在架构实现、性能优化和运维复杂度上的差异,我们撰写了这篇对比文章,供技术选型时参考。
2025-06-18 17:07:37
1017
原创 深度解析 JuiceFS 权限管理:Linux 多种安全机制全兼容
在多用户和高安全性要求的系统中,文件与目录权限控制是实现资源隔离与系统安全的基础机制。Linux 操作系统的文件权限模型提供了灵活强大的权限控制机制,通过对用户、组和其他用户的权限设置,确保系统资源的安全性和合规性。作为一款支持 Linux 系统的分布式文件系统,JuiceFS 需要与 Linux 权限管理模型兼容,以实现一致的访问控制和数据安全。本文将深入探讨 JuiceFS 在实际应用中的权限管理实践,帮助用户更好地理解和应用。
2025-06-12 16:19:30
830
原创 JuiceFS v1.3-Beta2:集成 Apache Ranger,实现更精细化的权限控制
JuiceFS 作为一个 POSIX 文件系统,其权限管理方式与本地文件系统类似。每个文件或目录都通过用户和用户组进行管理。用户和用户组管理:每个文件或目录都有一个所属用户和用户组。这些用户和用户组的信息存储在 JuiceFS 的元数据中,通常以 UID(用户 ID)和 GID(组 ID)的形式存储,而不是直接存储用户名或组名。由于不同机器上相同的 UID 可能对应不同的用户名,因此在使用 JuiceFS 时,通常需要确保所有节点上的 UID/GID 与用户名的映射关系保持一致。ACL(访问控制列表)
2025-06-06 10:44:55
1031
原创 JuiceFS 企业版 5.2:迈入千亿文件时代,稳定性与性能再升级,首次支持 Windows 客户端
JuiceFS 企业版 5.2 版本近日发布,文件管理规模迈入千亿级。此次升级重点提升了超大规模集群的稳定性,优化了分布式缓存的网络性能,并增强了系统的易用性与安全性,旨在支持高并发访问等复杂的高性能应用场景。JuiceFS 企业版专为高性能场景设计,自 2019 年起开始应用于机器学习领域,现已成为 AI 行业核心基础设施之一。我们的商业客户涵盖大模型公司,如 MiniMax、智谱 AI、阶跃星辰;GenAI 服务与应用提供商如 Lepton AI、Fal.ai、LiblibAI 等;
2025-05-28 15:50:26
1173
原创 JuiceFS v1.3-Beta1:一亿文件备份分钟级完成,性能优化全解析
在最新发布的 JuiceFS v1.3 Beta1 版本中,我们引入了一种全新的二进制备份机制,旨在更高效地应对亿级文件规模下的备份与迁移场景。相比现有的 JSON 备份方式,该机制在导入导出元数据时不仅大幅提升了处理速度,还显著降低了内存占用。
2025-05-21 15:31:28
1156
原创 中国科学院计算所:从 NFS 到 JuiceFS,大模型训推平台存储演进之路
中科院计算所在建设大模型训练与推理平台过程中,模型规模与数据集数量呈爆发式增长。最初采用简单的裸机存储方案,但很快面临数据孤岛、重复冗余、管理混乱和资源利用不均等问题,于是升级到了 NFS 系统。然而,随着使用强度增加,NFS 的瓶颈日益凸显:高峰期训练任务严重延迟甚至完全停滞,多用户并发时系统性能断崖式下降,存储扩容困难且缺乏有效的数据一致性保障。这些问题严重影响到了实验室研究人员的使用,迫使我们寻求更先进的存储方案。经过对多种开源存储系统的评估对比,我们选择了 JuiceFS。
2025-05-15 13:49:19
1091
原创 JuiceFS v1.3-beta1:新增 Python SDK,特定场景性能 3 倍于 FUSE
在当前众多 AI 和数据科学应用中,Python 已成为最主流的编程语言之一。为了方便用户在这些场景中更高效地使用 JuiceFS,我们在社区版 v1.3 中推出了 JuiceFS Python SDK(下文简称 Python SDK)。它不仅简化了对 JuiceFS 的访问方式,还提升了在受限环境下的可用性。例如在 Serverless 场景中,用户通常无法自己挂载文件系统,通过 Python SDK,无需挂载即可直接读写 JuiceFS 中的数据,极大提升了灵活性。
2025-05-13 14:10:45
931
原创 百图生科:基于 JuiceFS 构建生命科学大模型存储平台,成本降 90%
百图生科(BioMap)由百度创始人李彦宏先生联合创立,专注于生命科学领域的人工智能技术。公司推出了全球最大的生命科学 AI 基础模型 xTrimo V3,拥有 2100 亿参数,覆盖蛋白质、DNA、RNA 等多个生命科学领域。随着生命科学领域数据量的爆发式增长,存储成本日益增加。为了降本增效,百图生科对 Lustre、Alluxio、JuiceFS 等多个存储方案进行评估。综合考虑成本、性能和运维等因素后,最终选择了JuiceFS。
2025-05-07 14:01:32
789
原创 JuiceFS v1.3-beta1:全面优化 SQL 数据库支持,十亿级元数据管理新选项
元数据管理直接关系到文件系统的性能与稳定性,JuiceFS 提供对多种具备事务支持的引擎的兼容能力。文件型(如 SQLite) 适用于单机挂载的文件系统,适合百万级文件和以读取为主的场景。内存 KV 类型(如 Redis) 支持多点挂载,适合文件数在一亿以内的场景。SQL 数据库(如 MySQL、PostgreSQL) 支持多点挂载,适合文件总数在十亿以内的场景。分布式 KV(如 TiKV) 支持多点挂载,适合百亿级文件的场景。
2025-04-23 16:37:14
1129
原创 DeepSeek 3FS 与 JuiceFS:架构与特性比较
大规模 AI 训练中最主要的需求是高读带宽,为此 3FS 采用了性能优先的设计策略,将数据存储在高速磁盘上,并且用户需要自行管理底层数据存储。这种方法提升了性能,但成本较高,维护也更繁重。此外,为了充分发挥底层硬件的性能,其架构实现了客户端到网卡的零拷贝,利用共享内存和信号量减少 I/O 延迟和内存带宽占用。此外,通过带 TLS 的 I/O buffer pool 和合并网络请求,3FS 增强了小 I/O 和文件元数据操作的能力,并引入了性能更优的 RDMA 技术。
2025-03-18 13:19:57
1344
原创 稳定且高性价比的大模型存储:携程 10PB 级 JuiceFS 工程实践
在过去两年多的时间里,随着 AI 大模型的快速发展,JuiceFS 在携程内部得到了越来越多 AI 用户的关注。目前,携程通过 JuiceFS 管理着 10PB 数据规模,为 AI 训练等多个场景提供存储服务。本文将介绍携程如何使用 JuiceFS,以及基于 JuiceFS 实现的关键管理能力,包括多租户权限管理、计费功能、故障排查和监控等方面。同时,还将分享 3 个生产环境中的排障案例。
2025-03-10 11:59:29
999
原创 FUSE,从内核到用户态文件系统的设计之路
FUSE(Filesystem in Userspace)是一个允许用户在用户态创建自定义文件系统的接口,诞生于 2001 年。FUSE 的出现大大降低了文件系统开发的门槛,使得开发者能够在不修改内核代码的情况下实现创新的文件系统功能。JuiceFS 就是基于 FUSE 构建的高性能分布式文件系统,充分发挥了 FUSE 的灵活性和扩展性。
2025-02-27 16:40:41
1445
原创 加速 AI 训推:Lepton AI 如何构建多租户、低延迟云存储平台
Lepton AI 是一款面向开发者的 AI 平台,旨在提供易用、高效且可扩展的基础设施能力。该平台适用于各种训练、推理需求,GPU充足,在保证高性能的同时,能够灵活应对不断变化的工作负载。用户可以快速在 Lepton 平台上部署推理服务和执行训练任务,无需关注基础设施和稳定性问题。作为一家初创公司,Lepton AI 致力于在云端为企业提供领先的 AI 推理与训练技术,而在存储这类基础设施建设,希望能够在市场上找到合适的供应商,以保障更高效的产品研发。
2025-01-17 10:45:51
1172
原创 多云架构,JuiceFS 如何实现一致性与低延迟的数据分发
随着大模型的普及,GPU 算力成为稀缺资源,单一数据中心或云区域的 GPU 资源常常难以满足用户的全面需求。同时,跨地域团队的协作需求也推动了企业在不同云平台之间调度数据和计算任务。多云架构正逐渐成为一种趋势,然而该架构下的数据分发面临一系列挑战。
2025-01-10 14:58:29
1340
原创 JuiceFS 2024:开源与商业并进,迈向 AI 原生时代
即将过去的 2024 年,是 JuiceFS 开源版本推出的第 4 年,企业版的第 8 个年头。回顾过去这一年,JuiceFS 社区版依旧保持着快速成长的势头,GitHub 星标突破 11.1K,各项使用指标增长均超过 100%,其中文件系统总数量较前一年更是增长了 8.5 倍;。2024年,随着 AI 技术的迅猛发展,AI 正逐渐成为企业发展的新基建,企业的基础架构正朝着 AI 原生化趋势迈进。在这一变革的推动下,JuiceFS 社区也迎来了显著的增长。
2025-01-08 10:48:26
1360
原创 缓存管理自动化:JuiceFS 企业版 Cache Group Operator 新特性发布
近期,JuiceFS 企业版推出了 Cache Group Operator,用于自动化创建和管理缓存组集群。Operator 是一种简化 Kubernetes 应用管理的工具,它能够自动化应用程序的生命周期管理任务,使部署、扩展和运维更加高效。
2024-12-27 14:23:54
1426
原创 从 CephFS 到 JuiceFS:同程旅行亿级文件存储平台构建之路
随着公司业务的快速发展,同程旅行的非结构化的数据突破 10 亿,在 2022 年,同程首先完成了对象存储服务的建设。当时,分布式文件系统方面,同程使用的是 CephFS,随着数据量的持续增长,CephFS 的高复杂性和运维难度逐渐成为瓶颈。考虑到可观测性、稳定性和管理效率等维度,同程最终决定转向 JuiceFS。目前,同程已在 JuiceFS 上构建了一个企业级存储平台,平台规模涵盖了超过 20 个文件系统和 2000 多个客户端挂载点,能够高效管理亿级文件和百 TiB 级别的数据量。
2024-12-13 15:16:47
1269
原创 Conda + JuiceFS :增强 AI 开发环境共享能力
本文简要分享了在多机环境下,如何利用 JuiceFS 复用 Conda 虚拟环境的具体方法与注意事项。希望这篇文章中的技巧和经验能够为读者的日常开发和团队协作提供帮助,并提升工作效率。我们鼓励感兴趣的读者亲自动手尝试,并在实践中探索更多的优化方式。如果您在配置和使用过程中遇到任何问题,欢迎前往 JuiceFS 用户社区进行反馈、提问与交流。您的问题和分享将有助于推动整个社区的进步。
2024-12-06 15:17:30
738
原创 使用 JuiceFS 快照功能实现数据库发布与端到端测试
今天的博客来自 JuiceFS 云服务用户 Jerry,他们通过使用 JuiceFS snapshot 功能,创新性地实现了数据的版本控制。Jerry,是一家位于北美的科技公司,利用人工智能和机器学习技术,简化用户购买汽车和家庭保险的比较及购买流程。在软件开发领域,严格的测试和受控发布已经成为几十年来的标准做法。但如果我们能将这些原则应用到数据库和数据仓库中会怎样?想象一下,能够为数据基础设施定义一套带有测试用例的标准,自动应用于每个新的"发布",以确保客户始终看到准确和一致的数据。
2024-11-15 14:36:39
796
原创 海柔仿真系统存储实践:混合云架构下实现高可用与极简运维
海柔创新是一家专注于箱式仓储机器人系统的研发和设计的科技公司,其仿真平台通过数字模拟技术,再现实际仓库环境和设备,利用导入的地图、订单、库存及策略配置等数据来验证和优化仓储解决方案,确保设计方案的效率和合理性。最初,海柔的仿真平台在单机环境中运行,但随着数据量的增长,运维逐渐面临挑战。因此,平台被迁移到私有云的 Kubernetes 环境中,团队随后开始寻找适合在 k8s 环境中运用的分布式文件系统。仿真平台的数据特征包括:大量小文件、并发写入、跨云架构等。
2024-11-11 14:29:11
761
原创 好未来:多云环境下基于 JuiceFS 建设低运维模型仓库
在推理场景下,整个模型仓库需要挂载到容器中。如果客户端的挂载权限过大(例如挂载了一个包含大量模型的目录),就可能导致模型泄露或误删除的问题。特别是当挂载方式为可读可写时,客户端甚至有可能删除模型文件。由此衍生出不同场景对模型仓库的存储需求。
2024-11-08 10:48:49
1193
原创 JuiceFS CSI:Mount Pod 的平滑升级及其实现原理
鉴于目前的有损升级方案存在诸多缺陷,JuiceFS CSI Driver 在 v0.25.0 版本中,支持了 Mount Pod 的平滑升级。CSI 提供了两种平滑升级方案,包括二进制升级和 Pod 重建升级。二进制升级风险小,但不支持更新 Mount Pod 的其他配置;Pod 重建升级在集群环境较复杂的情况下有失败的风险,但支持更新 Mount Pod 的其他配置,比如可以根据 Mount Pod 的实际资源使用情况,动态调整资源配比等。
2024-11-01 10:47:20
951
原创 vivo 轩辕文件系统:AI 计算平台存储性能优化实践
在早期阶段,vivo AI 计算平台使用 GlusterFS 作为底层存储基座。随着数据规模的扩大和多种业务场景的接入,开始出现性能、维护等问题。为此,vivo 转而采用了自研的轩辕文件系统,该系统是基于 JuiceFS 开源版本开发的一款分布式文件存储方案。本文将介绍 vivo 轩辕文件系统在 JuiceFS 基础之上开发的新特性。以及 vivo 针对一些关键场景,如样本数据读取速度慢和检查点写入环节的优化措施。
2024-10-25 15:30:57
1423
原创 详解 JuiceFS 在多云架构下的数据同步与一致性
随着大模型流行,GPU 算力资源正变得日益稀缺,传统的“算力跟着存储跑”的策略需要转变为“存储跟着算力跑”。为了确保数据一致性和管理的便捷性,企业通常在特定地区的公有云上选择对象存储作为所有模型数据的集中存储点。当进行计算任务调度时,往往需要人工介入,手动进行数据拷贝和迁移方法不仅成本高昂,还存在管理和维护的复杂性,包括权限控制等问题都极为棘手。JuiceFS 企业版的 “镜像文件系统” 功能允许用户从一个地区自动复制元数据到多个地区,形成一对多的复制模式。
2024-10-18 14:21:14
1574
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅