- 博客(11)
- 收藏
- 关注
原创 Hadhoop生态(Hadoop)
Hadoop 是 Apache 旗下的一个用 java 语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。HDFS(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理的框架):解决资源任务调度MAPREDUCE(分布式运算编程框架):解决海量数据计算广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起。
2025-04-06 10:51:55
541
原创 Hadhoop生态(ZooKeeper)
Zookeeper是一个分布式协调服务的开源框架。主要用来解决分布式集群中应用系统的一致性问题。ZooKeeper本质上是一个分布式的小文件存储系统。提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理。从而用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理。
2025-03-31 10:11:45
659
原创 powerBI
在这里插入图片描述](https://i-blog.csdnimg.cn/direct/f648c6fa6c0043c9b6a5c6309fd0872d.png#pic_center)进入Power Query界面,选择将第一行作用标题。Lookupvalue函数:就是Vlookup。度量值在表中不可见,但是可以在报表视图中看到。可以通过编辑查询更改列标签。最后关闭应用就完成了。
2025-03-22 12:04:06
203
原创 pands包中describe不显示全部内容的解决办法
在pandas库中,我们有时候会遇到显示全部统计信息的时候会省略的情况。这里有两种方法可以轻松解决这个问题。
2024-10-12 16:25:19
367
原创 Linux基础
Linux在服务器领域的应用是最强的。主要应用:机顶盒、数字电视、网络电话、手机、PDA、智能家 居、智能硬件等应用领域。在以后的物联网应用中会更加广泛。特点:免费、稳定、高效吉祥物:tux。
2024-06-30 21:08:41
450
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人