一、GlusterFS

GlusterFS是一个开源的分布式文件系统,无元数据服务器,提供扩展性、高可用性和全局统一命名空间。其工作原理涉及客户端通过挂载点访问数据,经过VFS和FUSE传递到GlusterFS client,再由client处理并发送到服务器。卷类型包括分布式卷、条带卷、复制卷、分布式条带卷和分布式复制卷,各有其特点和适用场景。

一、GlusterFS

(一)、GlusterFS简介

GlusterFS 是一个开源的分布式文件系统。
由存储服务器、客户端以及NFS/Samba 存储网关(可选,根据需要选择使用)组成。
没有元数据服务器组件,这有助于提升整个系统的性能、可靠性和稳定性。

(二)、GlusterFS特点

1.扩展性和高性能(分布式特性)

2.高可用性(冗余 有容灾的能力)

3.全局统一命名空间

4.弹性卷管理 (RAID 0 1 5 01 10)

5.基于标准协议(GFS http nFS FTP)

(三)、常用术语

1、Brick:GFS中的存储单元,通过是一个受信存储池中的服务器的一个导出目录。可以通过主机名和目录名来标识,如’SERVER:EXPORT’
2、Volume:卷
3、FUSE:内核文件系统,Filesystem Userspace是一个可加载的内核模块,其支持非特权用户创建自己的文件系统而不需要修改内核代码。通过在用户空间运行文件系统的代码通过FUSE代码与内核进行桥接。
4、VFS:虚拟文件系统
5、Glusterd:Gluster management daemon,要在trusted storage pool中所有的服务器上运行。

(四)、GlusterFS工作原理(工作流程)

1、客户端或应用程序通过GlusterFS的挂载点访问数据
2、linux系统内核通过VFS API收到请求并处理
3、VFS将数据递交给FUSE内核文件系统, fuse文件系统则是将数据通过/dev/fuse设备文件递交给了GlusterFS client端
4、GlusterFS client 收到数据后,client根据配置文件的配置对数据进行处理
5、通过网络将数据传递至远端的GlusterFS Server,并且将数据写入到服务器存储设备上

(五)、GlusterFS的卷类型

1.分布式卷

文件通过 HASH 算法分布到所有 Brick Server 上,这种卷是 GlusterFS 的默认卷;以文件为单位根据 HASH 算法散列到不同的 Brick,其实只是扩大了磁盘空间,如果有一块磁盘损坏,数据也将丢失,属于文件级的 RAID0, 不具有容错能力。
在该模式下,并没有对文件进行分块处理,文件直接存储在某个 Server 节点上。 由于直接使用本地文件系统进行文件存储,所以存取效率并没有提高,反而会因为网络通信的原因而有所降低。

特点:文件分布在不同的服务器,不具备冗余性、单点故障会造成数据丢失、依赖底层的数据保护,更容易和廉价地扩展卷的大小。

2.条带卷

类似 RAID0,文件被分成数据块并以轮询的方式分布到多个 Brick Server 上,文件存储以数据块为单位,支持大文件存储, 文件越大,读取效率越高,但是不具备冗余性

特点:数据被分割成更小块分布到块服务器群中的不同条带区、分布减少了负载且更小的文件加速了存取的速度、没有数据冗余

3.复制卷

将文件同步到多个 Brick 上,使其具备多个文件副本,属于文件级 RAID 1,具有容错能力。因为数据分散在多个 Brick 中,所以读性能得到很大提升,但写性能下降。
复制卷具备冗余性,即使一个节点损坏,也不影响数据的正常使用。但因为要保存副本,所以磁盘利用率较低。

特点:卷中所有的服务器均保存一个完整的副本、卷的副本数量可由客户创建的时候决定,但复制数必须等于卷中 Brick 所包含的存储服务器数、至少由两个块服务器或更多服务器、具备冗余性

4.分布式条带卷

Brick Server 数量是条带数(数据块分布的 Brick 数量)的倍数 主要用于大文件访问处理,创建一个分布式条带卷最少需要 4 台服务器

特点:兼具分布式卷和条带卷的特点。

5.分布式复制卷、

Brick Server 数量是镜像数(数据副本数量)的倍数,兼具分布式卷和复制卷的特点。主要用于需要冗余的情况下

二、GlusterFS群集部署

Node1节点:node1/192.168.177.4		  磁盘: /dev/sdb1			挂载点: /data/sdb1
											/dev/sdc1					/data/sdc1
											/dev/sdd1					/data/sdd1
											/dev/sde1					/data/sde1

Node2节点:node2/192.168.177.8		  磁盘: /dev/sdb1			挂载点: /data/sdb1
											/dev/sdc1					/data/sdc1
											/dev/sdd1					/data/sdd1
											/dev/sde1					/data/sde1

Node3节点:node3/192.168.177.11		  磁盘: /dev/sdb1			挂载点: /data/sdb1
											/dev/sdc1					/data/sdc1
											/dev/sdd1					/data/sdd1
											/dev/sde1					/data/sde1

Node4节点:node4/192.168.177.18  	   磁盘: /dev/sdb1			挂载点: /data/sdb1
											/dev/sdc1					/data/sdc1
											/dev/sdd1					/data/sdd1
											/dev/sde1					/data/sde1

1.节点磁盘挂载,安装本地源(以node为例)

[root@node1 ~] # systemctl stop firewalld
[root@node1 ~] # setenforce 0

[root@node1 ~] # vim /opt/fdisk.sh

#!/bin/bash
NEWDEV=`ls /dev/sd* | grep -o 'sd[b-z]' | uniq`
for VAR in $NEWDEV
do
   echo -e "n\np\n\n\n\nw\n" | fdisk /dev/$VAR &> /dev/null
   mkfs.xfs /dev/${VAR}"1" &> /dev/null
   mkdir -p /data/${VAR}"1" &> /dev/null
   echo "/dev/${VAR}"1" /data/${VAR}"1" xfs defaults 0 0" >> /etc/fstab
done
mount -a &> /dev/null

——————wq

[root@node1 ~] # chmod +x /opt/fdisk.sh
[root@node1 ~] # cd /opt/
[root@node1 /opt] # ./fdisk.sh

[root@node1 /opt] # echo "192.168.177.4 node1" >> /etc/hosts
[root@node1 /opt] # echo "192.168.177.8 node2" >> /etc/hosts
[root@node1 /opt] # echo "192.168.177.11 node3" >> /etc/hosts
[root@node1 /opt] # echo "192.168.177.18 node4" >> /etc/hosts

[root@node1 /opt] # ls
fdisk.sh  rh
[root@node1 /opt] # rz -E
[root@node1 /opt] # ls
fdisk.sh  gfsrepo.zip  rh
[root@node1 /opt] # unzip gfsrepo.zip 

[root@node1 /opt] # cd /etc/yum.repos.d/
[root@node1 /etc/yum.repos.d] # ls
[root@node1 /etc/yum.repos.d] # mv * repos.bak/
[root@node1 /etc/yum.repos.d] # ls
[root@node1 /etc/yum.repos.d] # vim glfs.repo

[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

————wq

[root@node1 /etc/yum.repos.d] # yum clean all && yum makecache

[root@node1 /etc/yum.repos.d] # yum -y install glusterfs glusterfs-server glusterfs-fuse glusterfs-rdma

[root@node1 /etc/yum.repos.d] # systemctl start glusterd.service 
[root@node1 /etc/yum.repos.d] # systemctl enable glusterd.service
Created symlink from /etc/systemd/system/multi-user.target.wants/glusterd.service to /usr/lib/systemd/system/glusterd.service.

[root@node1 /etc/yum.repos.d] # systemctl status glusterd.service

2.添加节点集群

[root@node1 ~] # gluster peer probe node1
peer probe: success. Probe on localhost not needed
[root@node1 ~] # gluster peer probe node2
peer probe: success. 
[root@node1 ~] # gluster peer probe node3
peer probe: success. 
[root@node1 ~] # gluster peer probe node4
peer probe: success. 

[root@node1 ~] # gluster peer status
Number of Peers: 3

Hostname: node2
Uuid: 2ee63a35-6e83-4a35-8f54-c9c0137bc345
State: Peer in Cluster (Connected)

Hostname: node3
Uuid: e63256a9-6700-466f-9279-3e3efa3617ec
State: Peer in Cluster (Connected)

Hostname: node4
Uuid: 9931effa-92a6-40c7-ad54-7361549dd96d
State: Peer in Cluster (Connected)

3.根据规则创建卷

卷名称卷类型Brick
dis-volume分布卷式node1(/data/sdb1)、node2(/data/sdb1)
stripe-volume条带卷node1(/data/sdc1)、node2(/data/sdc1)
rep-volume复制卷node3(/data/sdb1)、node4(/data/sdb1)
dis-stripe分布式条带卷node1(/data/sdd1)、node2(/data/sdd1)、node3(/data/sdd1)、node4(/data/sdd1)
dis-rep分布式复制卷node1(/data/sde1)、node2(/data/sde1)、node3(/data/sde1)、node4(/data/sde1)

(1)、创建分布式卷

[root@node1 ~] # gluster volume create dis-volume node1:/data/sdb1 node2:/data/sdb1 force
volume create: dis-volume: success: please start the volume to access data

[root@node1 ~] # gluster volume list
dis-volume

[root@node1 ~] # gluster volume start dis-volume
volume start: dis-volume: success

[root@node1 ~] # gluster volume info dis-volume

Volume Name: dis-volume
Type: Distribute
Volume ID: 8f948537-5ac9-4091-97eb-0bdcf142f4aa
Status: Started
Snapshot Count: 0
Number of Bricks: 2
Transport-type: tcp
Bricks:
Brick1: node1:/data/sdb1
Brick2: node2:/data/sdb1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on

(2)、创建条带卷

[root@node1 ~] # gluster volume create stripe-volume stripe 2 node1:/data/sdc1 node2:/data/sdc1 force
volume create: stripe-volume: success: please start the volume to access data

[root@node1 ~] # gluster volume start stripe-volume
volume start: stripe-volume: success

[root@node1 ~] # gluster volume info stripe-volume

Volume Name: stripe-volume
Type: Stripe
Volume ID: b1185b78-d396-483f-898e-3519d3ef8e37
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 2 = 2
Transport-type: tcp
Bricks:
Brick1: node1:/data/sdc1
Brick2: node2:/data/sdc1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on

(3)、创建复制卷

[root@node1 ~] # gluster volume create rep-volume replica 2 node3:/data/sdb1 node4:/data/sdb1 force
volume create: rep-volume: success: please start the volume to access data

[root@node1 ~] # gluster volume start rep-volume
volume start: rep-volume: success

[root@node1 ~] # gluster volume info rep-volume

Volume Name: rep-volume
Type: Replicate
Volume ID: 9d39a2a6-b71a-44a5-8ea5-5259d8aef518
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 2 = 2
Transport-type: tcp
Bricks:
Brick1: node3:/data/sdb1
Brick2: node4:/data/sdb1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on

(4)、创建分布式条带卷

[root@node1 ~] # gluster volume create dis-stripe stripe 2 node1:/data/sdd1 node2:/data/sdd1 node3:/data/sdd1 node4:/data/sdd1 force
volume create: dis-stripe: success: please start the volume to access data

[root@node1 ~] # gluster volume start dis-stripe
volume start: dis-stripe: success

[root@node1 ~] # gluster volume info dis-stripe

Volume Name: dis-stripe
Type: Distributed-Stripe
Volume ID: beb7aa78-78d1-435f-8d29-c163878c73f0
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: node1:/data/sdd1
Brick2: node2:/data/sdd1
Brick3: node3:/data/sdd1
Brick4: node4:/data/sdd1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on

(5)、创建分布式复制卷

[root@node1 ~] # gluster volume create dis-stripe stripe 2 node1:/data/sdd1 node2:/data/sdd1 node3:/data/sdd1 node4:/data/sdd1 force
volume create: dis-stripe: success: please start the volume to access data

[root@node1 ~] # gluster volume start dis-stripe
volume start: dis-stripe: success

[root@node1 ~] # gluster volume info dis-stripe

Volume Name: dis-stripe
Type: Distributed-Stripe
Volume ID: beb7aa78-78d1-435f-8d29-c163878c73f0
Status: Started
Snapshot Count: 0
Number of Bricks: 2 x 2 = 4
Transport-type: tcp
Bricks:
Brick1: node1:/data/sdd1
Brick2: node2:/data/sdd1
Brick3: node3:/data/sdd1
Brick4: node4:/data/sdd1
Options Reconfigured:
transport.address-family: inet
nfs.disable: on

4.部署Gluster客户端

[root@promote ~]#systemctl stop firewalld
[root@promote ~]#setenforce 0

[root@promote ~]#cd /opt
[root@promote opt]#ls
rh
[root@promote opt]#rz -E
[root@promote opt]#ls
[root@promote opt]#unzip gfsrepo.zip 

[root@promote opt]#cd /etc/yum.repos.d/
[root@promote yum.repos.d]#ls
[root@promote yum.repos.d]#mv * repos.bak/
[root@promote yum.repos.d]#ls
[root@promote yum.repos.d]#vim glfs.repo

[glfs]
name=glfs
baseurl=file:///opt/gfsrepo
gpgcheck=0
enabled=1

————wq

[root@promote yum.repos.d]#yum clean all && yum makecache

[root@promote yum.repos.d]#yum -y install glusterfs glusterfs-fuse

[root@promote yum.repos.d]#mkdir -p /test/{dis,stripe,rep,dis_stripe,dis_rep}
[root@promote yum.repos.d]#cd /test/
[root@promote test]#ls
[root@promote test]#

[root@promote test]#echo "192.168.177.4 node1" >> /etc/hosts
[root@promote test]#echo "192.168.177.8 node2" >> /etc/hosts
[root@promote test]#echo "192.168.177.11 node3" >> /etc/hosts
[root@promote test]#echo "192.168.177.18 node4" >> /etc/hosts
[root@promote test]#
[root@promote test]#mount.glusterfs node1:dis-volume /test/dis
[root@promote test]#mount.glusterfs node1:stripe-volume /test/stripe
[root@promote test]#mount.glusterfs node1:rep-volume /test/rep
[root@promote test]#mount.glusterfs node1:dis-stripe /test/dis_stripe
[root@promote test]#mount.glusterfs node1:dis-rep /test/dis_rep
[root@promote test]#
[root@promote test]#df -h

[root@promote test]#cd /opt
[root@promote opt]#dd if=/dev/zero of=/opt/demo1.log bs=1M count=40
[root@promote opt]#dd if=/dev/zero of=/opt/demo2.log bs=1M count=40
[root@promote opt]#dd if=/dev/zero of=/opt/demo3.log bs=1M count=40
[root@promote opt]#dd if=/dev/zero of=/opt/demo4.log bs=1M count=40
[root@promote opt]#dd if=/dev/zero of=/opt/demo5.log bs=1M count=40
[root@promote opt]#ls -lh /opt
[root@promote opt]#cp demo* /test/dis
[root@promote opt]#cp demo* /test/stripe/
[root@promote opt]#cp demo* /test/rep/
[root@promote opt]#cp demo* /test/dis_stripe/
[root@promote opt]#cp demo* /test/dis_rep/

[root@promote opt]#cd /test/
[root@promote test]#tree
.
├── dis
│   ├── demo1.log
│   ├── demo2.log
│   ├── demo3.log
│   ├── demo4.log
│   └── demo5.log
├── dis_rep
│   ├── demo1.log
│   ├── demo2.log
│   ├── demo3.log
│   ├── demo4.log
│   └── demo5.log
├── dis_stripe
│   ├── demo1.log
│   ├── demo2.log
│   ├── demo3.log
│   ├── demo4.log
│   └── demo5.log
├── rep
│   ├── demo1.log
│   ├── demo2.log
│   ├── demo3.log
│   ├── demo4.log
│   └── demo5.log
└── stripe
    ├── demo1.log
    ├── demo2.log
    ├── demo3.log
    ├── demo4.log
    └── demo5.log

5 directories, 25 files
GlusterFS种开源的分布式文件系统,适用于大规模数据存储和高可用性需求的场景。它支持横向扩展,可以轻松集成多个存储节点,提供统的命名空间和高性能的数据访问能力。以下是部分内容,涵盖 GlusterFS 的基本使用指南、配置教程以及常见问题。 ### 安装与配置 在开始配置 GlusterFS 之前,需要在所有节点上安装 GlusterFS 软件包。以基于 Red Hat 的系统为例,可以通过以下命令安装: ```bash sudo yum install centos-release-gluster sudo yum install glusterfs-server ``` 启动并启用 GlusterFS 服务: ```bash sudo systemctl start glusterd sudo systemctl enable glusterd ``` #### 配置 GlusterFS 集群 1. **添加节点**:在任意个节点上执行以下命令添加其他节点到集群中: ```bash sudo gluster peer probe <节点IP> ``` 2. **创建卷**:假设每个节点上都有个用于存储数据的目录 `/data/brick1`,可以创建个复制卷(Replicated Volume)以提高可用性: ```bash sudo gluster volume create test-volume replica 2 \ transport tcp \ server1:/data/brick1 \ server2:/data/brick1 ``` 3. **启动卷**:创建完成后,启动卷: ```bash sudo gluster volume start test-volume ``` 4. **挂载卷**:客户端可以通过以下方式挂载卷: ```bash sudo mount -t glusterfs server1:/test-volume /mnt/glusterfs ``` ### 常见问题 #### 1. **卷无法启动** 如果卷无法启动,检查节点之间的网络连接是否正常,并确认 `glusterd` 服务是否已启动。查看日志文件 `/var/log/glusterfs/glusterd.log` 可能会提供有用的线索。 #### 2. **性能问题** GlusterFS 的性能受多种因素影响,包括网络带宽、磁盘 I/O 和卷类型。对于需要高性能的场景,建议使用分布式卷(Distributed Volume)或条带化卷(Striped Volume)。此外,调整 `performance.cache-size` 参数可以优化缓存性能。 #### 3. **数据致性问题** GlusterFS 提供了多种机制来确保数据致性,例如使用复制卷(Replicated Volume)或仲裁卷(Quorum-based Volume)。确保在创建卷时选择合适的类型,并根据需求调整配置参数。 #### 4. **扩容问题** 当需要扩展存储容量时,可以通过添加新的 brick 到现有卷中实现。例如: ```bash sudo gluster volume add-brick test-volume server3:/data/brick1 ``` 扩容后,重新平衡卷以确保数据均匀分布: ```bash sudo gluster volume rebalance test-volume start ``` ### 高可用性与容错 GlusterFS 支持多种容错机制,包括复制卷和自愈功能。复制卷通过在多个节点上存储相同的数据副本,确保即使某个节点失效,数据仍然可用。自愈功能可以在节点恢复后自动修复数据不致的问题。 此外,GlusterFS 支持快照功能,可以用于备份和恢复数据。快照可以通过以下命令创建: ```bash sudo gluster snapshot create snap-name test-volume ``` ### 性能调优 为了优化 GlusterFS 的性能,可以调整以下参数: - **缓存大小**:通过 `performance.cache-size` 参数调整缓存大小,以适应不同的工作负载。 - **线程数**:增加 `performance.io-thread-count` 和 `performance.flush-behind` 参数可以提高并发性能。 - **网络优化**:使用 RDMA 或 InfiniBand 等高速网络技术可以显著提升性能。 ### 安全性 GlusterFS 提供了多种安全机制,包括基于 IP 的访问控制和加密传输。可以通过配置 `auth.allow` 和 `auth.reject` 参数限制客户端的访问权限。此外,启用 SSL/TLS 加密可以保护数据在传输过程中的安全性。 ### 日常维护 定期检查卷的状态和性能指标,确保系统正常运行。可以通过以下命令查看卷的状态: ```bash sudo gluster volume status ``` 如果发现某个节点的磁盘空间不足,可以考虑添加新的 brick 或调整数据分布策略。 ### 监控与日志 GlusterFS 提供了丰富的监控工具和日志信息,帮助管理员了解系统的运行状态。可以使用 `gluster volume profile` 命令分析卷的性能瓶颈。日志文件通常位于 `/var/log/glusterfs/` 目录下,查看这些日志可以帮助诊断问题。 ### 备份与恢复 为了确保数据的安全性,建议定期备份 GlusterFS 卷。可以使用 `rsync` 或 `gluster snapshot` 命令进行备份。恢复数据时,可以通过快照或备份文件还原卷的状态。 ### 相关问题 1. 如何在 GlusterFS 中配置复制卷以提高数据可用性? 2. GlusterFS 的性能调优有哪些常用方法? 3. 如何解决 GlusterFS 卷无法启动的问题? 4. GlusterFS 的快照功能如何使用? 5. 如何在 GlusterFS 中实现高可用性和容错?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值