
Hadoop
文章平均质量分 92
程序员对白
「对白的算法屋」作者,带你少走弯路进大厂!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
谷歌、阿里、腾讯等在大规模图神经网络上必用的GNN加速算法
点击上方,选择星标或置顶,每天给你送上干货作者 | 对白出品 | 对白的算法屋大家好,我是对白。今天我们来聊一聊在大规模图神经网络上必用的GNN加速算法。GNN在图结构的任务上取得了很好的结果,但由于需要将图加载到内存中,且每层的卷积操作都会遍历全图,对于大规模的图,需要的内存和时间的开销都是不可接受的。现有一些用于加速GNN的算法,基本思路是使用mini-batch来计算,用min-batch的梯度估计full-batch的梯度,通过多次迭代达到基本一致的效果。根据使用的方法不同,大致分为以下三类:Nei原创 2022-04-10 14:55:54 · 1286 阅读 · 0 评论 -
搭建Hadoop集群的HA高可用架构(超详细步骤+已验证)
一、集群的规划Zookeeper集群:192.168.182.12 (bigdata12)192.168.182.13 (bigdata13)192.168.182.14 (bigdata14) Hadoop集群:192.168.182.12 (bigdata12) NameNode1主节点 ResourceManager1主节点 Journa...原创 2018-07-05 12:40:50 · 1932 阅读 · 0 评论 -
Hive、Pig、HBase的关系与区别,值得收藏!
欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯! Pig一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了。当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护。不过现在还是有些公司在用,不过我认为与其使用pig不如使用hive。:)...原创 2018-03-04 23:52:44 · 13798 阅读 · 0 评论 -
详解管理所有大数据组件的可视化利器:Hue
欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯!剖析管理所有大数据组件的可视化利器:Hue日常的大数据使用都是在服务器命令行中进行的,可视化功能仅仅依靠各个组件自带的web界面来实现,不同组件对应不同的端口号,如:HDFS(50070),Yarn(8088),Hbase(16010)等等,...原创 2018-03-04 23:49:01 · 1039 阅读 · 0 评论 -
带您详细解读分布式文件系统HDFS
欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯!一、HDFS的由来:本地系统:一个节点作为系统,以前数据是存放在本地文件系统上的,但本地文件系统存在两个问题:1、本地节点存储容量不够大;2、本地节点会坏,数据不够安全。这时,人们开始利用闲置的计算机组成了分布式系统,分布式系统是用计算机网络...原创 2018-03-04 23:44:58 · 286 阅读 · 0 评论 -
带你看懂大数据采集引擎之Flume&采集目录中的日志
欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯!带你看懂大数据采集引擎之Flume&采集目录中的日志一、Flume的介绍:Flume由Cloudera公司开发,是一种提供高可用、高可靠、分布式海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于采集...原创 2018-03-04 23:39:45 · 577 阅读 · 0 评论 -
详细解读大数据分析引擎Pig&PigLatin语句
欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯!详细解读大数据分析引擎Pig&PigLatin语句Pig一、Pig的介绍:Pig由Yahoo开发,主要应用于数据分析,Twitter公司大量使用Pig处理海量数据,Pig之所以是数据分析引擎,是因为Pig相当于一个翻译器,将P...原创 2018-03-04 23:33:49 · 2066 阅读 · 0 评论 -
一文让您全面了解清楚HBase数据库的所有知识点,值得收藏!
欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯!一、HBase基本概念:列式数据库在Hadoop生态体系结构中,HBase位于HDFS(Hadoop分布式文件系统)的上一层,不依赖于MapReduce,那么如果没有HBase这种Nosql数据库会有什么影响呢?传统的关系型数据库由于存储数据...原创 2018-03-04 23:27:47 · 335 阅读 · 0 评论 -
SSH无密码验证
一、安装和启动SSH协议假设没有安装ssh和rsync,可以通过下面命令进行安装。sudo apt-get install ssh 安装SSH协议 sudo apt-get install rsync service sshd restart 启动服务 (rsync是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件)确保所有的服务器都安装,上面命令执行完毕,各台...转载 2018-03-10 22:37:44 · 494 阅读 · 0 评论 -
详解分布式应用程序协调服务Zookeeper
欢迎关注大数据和人工智能技术文章发布的微信公众号:清研学堂,在这里你可以学到夜白(作者笔名)精心整理的笔记,让我们每天进步一点点,让优秀成为一种习惯! 主从结构:HDFS、Yarn、HBase、storm、spark、zookeeper都存在单点故障问题 hadoop1.x没有解决方案 hadoop2.x利用zookeeper实现HAzookeeper是开源的分布式应用程序协调服务,是G...原创 2018-03-09 20:57:49 · 625 阅读 · 0 评论