据计划将大量本地数据迁移到亚马逊云科技服务的客户反馈,他们希望简化存储管理、降低成本,并提高数据的易访问性,以便将数据用于分析、机器学习训练、基因组学等其他用例。客户已经在本地使用网络附属存储(NAS),并且正在寻找一种基于云服务的升级方案,能够提供包括即时快照、数据克隆和用户管理在内的类似功能。
Amdocs、Vela Games、Astera Labs等亚马逊云科技客户,已经在Amazon FSx for OpenZFS上运行其关键任务型和性能密集型NAS工作负载,如数据库、游戏开发和流媒体以及半导体芯片设计。他们一直在使用Amazon FSx上的现有SSD存储类,来提供这些工作负载所需的可预测高性能。
然而,许多客户的大型数据集存储在基于HDD或混合SSD/HDD的本地NAS存储上,将这些数据集迁移到全SSD存储的成本过高。此外,这些客户在为不可预测的数据集管理预留存储空间方面,面临着日益严峻的挑战和不断攀升的成本。由于NAS数据在未来构建新模型、制定投资策略或开发新产品时可能具有巨大价值,客户需要确保长期保留这些数据,因此他们不得不投入更多的时间和精力来监控数据的访问模式,并在热存储和冷存储介质之间迁移数据,以优化成本。
Amazon FSx Intelligent-Tiering
考虑以上因素,亚马逊云科技推出Amazon FSx Intelligent-Tiering存储类别,该类别现已可用于Amazon FSx for OpenZFS文件系统。
与现有的SSD存储类别相比,该存储类别价格降低了85%,比传统基于HDD的本地部署降低了20%,同时为NAS数据集提供了充分的弹性和智能分层功能。
无需进行任何操作,您的数据会在高频访问层、低频访问层和归档层这三个存储层之间自动迁移,帮助您自动节省成本,且无需预付费用或做出任何承诺。各存储层的工作原理如下。
高频访问层:此层级存储的是在最近30天内访问过的数据。
低频访问层:此层级存储的是在30至90天内未被访问的数据,其成本比频繁访问层低44%。
归档层:此层级存储的是90天及以上未被访问的数据,其成本比非频繁访问层低65%。
无论采用何种存储层级,您的数据都会跨多个亚马逊云科技可用区域进行存储,以确保数据冗余和可用性,并可在毫秒内立即检索。
用户无需管理或预先配置存储,因此该存储类别非常适合基因组学、金融数据分析、地震图像分析和机器学习等用例,因为在这些用例中,存储需求可能会在几天或几周内发生显著变化。
不止节省成本,更为用户提供高性能体验。每个OpenZFS文件系统的IOPS高达40万次、吞吐量为20GB/秒,且所有存储类别下所有数据的首字节时间仅为几十毫秒。此外,您还可以配置基于SSD的读取缓存(64 GiB—512 TiB),可将缓存数据的首字节时间缩短10到100倍。
创建文件系统
您可以使用亚马逊云科技管理控制台、Amazon CLI、API或Amazon CloudFormation创建文件系统。本例选择亚马逊云科技管理控制台,点击“创建文件系统”即可。
亚马逊云科技管理控制台:
https://console.aws.amazon.com/
Amazon CloudFormation:
https://aws.amazon.com/cloudformation/
选择Amazon FSx for OpenZFS,然后点击“下一步”。
为文件系统输入名称(jeff_fsx_openzfs_1),并选择Amazon FSx Intelligent-Tiering存储类别。选择所需的吞吐量容量,选择三种读取缓存大小模式之一,点击“下一步”,再确认您的选择以创建文件系统。
几分钟后便可以使用,您可以将其通过NFS挂载到Amazon EC2实例上。
$ sudo mkdir /fsx_zfs
$ sudo mount -t nfs -o noatime,nfsvers=4.2,sync,nconnect=16,rsize=1048576,wsize=1048576 \
fs-00fc74f020d1e6f4e.fsx.us-east-2.aws.internal:/fsx/ /fsx_zfs/
左右滑动查看完整示意
将有代表性的工作负载运行一段时间后,您可以查看指标,评估文件系统性能。
本例中的吞吐量充足,但读取缓存可能大于实际需要量。因为本例是在自动配置模式下创建的缓存,分配了3200 GiB,只需点击几次就可更改,并且还能节省费用。
您也可以根据需要更改吞吐量。
Amazon FSx NAS功能与属性
Amazon FSx for OpenZFS和Amazon FSx Intelligent-Tiering存储类别将是满足您的NAS级存储需求的极佳选择,其部分功能如下。
内置备份功能:Amazon FSx会在指定的备份窗口期间,自动为每个文件系统创建每日备份,并在指定的保留期内存储备份。这些备份不仅与文件系统保持一致,而且具备高度耐用性和增量性。您也可以自行创建备份,并根据需要任意设定保留时长。
即时快照:您可以随时创建OpenZFS卷的只读镜像,快照存储在文件系统中并占用存储空间,其可用于恢复卷、恢复单个文件和文件夹,或以克隆或完全复制的方式创建新卷。
复制功能:您可以跨文件系统、亚马逊云科技区域和亚马逊云科技账户,将OpenZFS卷的时间点快照复制到其他卷。Amazon FSx在后台采用ZFS发送与接收技术来执行复制操作,并自动建立和维护文件系统之间的网络连接,以便处理中断情况,并在需要时恢复数据传输。
数据压缩功能:您可以在OpenZFS卷上启用ZSTD或LZ4压缩功能,以降低存储成本并加快数据传输速度。
用户和卷配额功能:可以限制单个卷或用户所使用的存储空间量。
ZFS发送与接收技术:
https://openzfs.github.io/openzfs-docs/man/master/8/zfs-send.8.html
须知事项
以下为您需要注意的须知事项。
可用区域:Amazon FSx Intelligent-Tiering可用的亚马逊云科技区域包括:美国东部(俄亥俄州、弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(孟买、新加坡、悉尼、东京)、加拿大(中部)和欧洲(法兰克福、爱尔兰)。
定价:定价基于主存储消耗量(GB/月)和读取缓存配置量(GB/月)。详细信息,请参阅Amazon FSx for OpenZFS定价页面。
Amazon FSx for OpenZFS定价:
https://aws.amazon.com/fsx/openzfs/pricing/
本篇作者
Jeff Barr
亚马逊云科技首席布道师
星标不迷路,开发更极速!
关注后记得星标「亚马逊云开发者」
听说,点完下面4个按钮
就不会碰到bug了!
点击阅读原文查看博客!获得更详细内容!