大数据实验总结

本次大数据实验涉及torque、mpich、mongodb、hadoop、zookeeper和hbase的配置。在搭建过程中,遇到了诸如主机配置、端口管理和日志分析等挑战。体会到配置过程中主从控制和交互通信的重要性,尤其是MongoDB的复杂性和torque的难度。通过实验,学会了查看日志和使用工具提高效率。

大数据实验总结

实验总要求

给五台主机,先后配置torque,mpich,mongodb,hadoop,zookeeper,hbased

  • torque
    有主有从
    master:lk
    slave:slave2~5

  • mpich
    各台机器是平等的

  • mongodb
    需要分片,副本集,还有各种角色的配置

lkslave2slave3slave4slave5
mongosmongosmongos
config serverconfig serverconfig servershard1shard1
shard1shard2shard2shard2shard3
shard3shard3shard4shard4shard4

一台机器可以有不同的角色,但是要给不同角色配置不同的端口

副本集端口
config server21000
mongos20000
shard127001
shard227002
shard327003
shard427004

- hadoop,zookeeper

lkslave2slave3slave4slave5
namenodeyynn
datanodennyy
resourcemanageryynn
jouralnodeyyyy
zookeeperyyyn

zookeeper只在前面三台机器上安装,安装结果应该是一个leader和两个follower

  • hbase
    master:lk
    backup-master:slave2
    regionservers:slave3~5

基础环境

基础环境就是所有软件安装中都需要的

  • 免密码登陆
    方便交互

  • 关闭防护墙
    防止各台机器在交互时候通信受到影响

  • /etc/hosts/etc/hostname
    给各个机器取别名,要一致

心得体会

整个环境其实搭了很久,属于边摔跤边学会走路的那种,参考了很多网上的资料,可以说是既是帮了很大的忙,又是挖了很大的坑。

因为以前没有接触过这些,所以是网上的教程把我带上路,但是因为每个人的机器什么的都是不同的,要求也不一样,所以单纯的粘贴复制肯定是不行的,要小心的把每个点都看清楚然后再进行配置,比如,我在配置MongoDB的时候,有一个地方IP忘了改成自己机器的IP,导致浪费了很多时间。
出现问题不可怕,多去网上看看别人的解决方法就可以了

整个集群的环境,有一些关键词吧:交互通信,主从控制等,我感觉还是在配置过程中感受到了这方面的思想。

torque和MongoDB是比较难搭的。torque是一个搭的,一是刚刚开始做,所以比较不熟悉,二是torque主从的搭建不一样,需要理清哪些在master上面搭建,哪些在slave上面搭建;MongoDB的难点在于组件多和配置多,config server,shard分片和mongos的配置,比较繁琐。

hadoop中等难度吧,其他的mpich,hbase都不是很难

我这次实验的最大感受是要学会看日志,日志真的很有用,只有知道哪里错了才能对症下药

还有,要学会积累工具。在hadoop搭建的时候,看到网上基本都用到了deploy.conf,deploy.shrunRemoteCmd.sh这三个文件,通过这三个文件,可以很方便的在一台机器上实现对多台机器的操作(前提是免密登陆和权限足够),就不需要在集群搭建的时候经常进行切换,对每个机器做重复的操作。

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值