- 博客(3)
- 收藏
- 关注
原创 华为无限网络产品线软开-大数据开发工程师面经
3.了解数据结构吗,bfs和dfs是用数据结构实现的,了解的类的继承吗。着重问了我的一个数据分析项目,问我项目里遇到的难点,以及如何解决的。4.知道zookpeer的作用吗,为什么要用hive。1.查看100万行数据用python怎么处理。手撕算法:给你一个字符串,输出所有排列组合。2.100万行数据怎么插入一张表里。算法:用数组实现一个栈。
2024-09-13 17:08:24
400
原创 学习mapreduce有感 日记1
mapreduce是一个高性能并行计算分布式计算平台,可部署在廉价的集群上它将计算分成了map,shuffle,reduce阶段,可以通过接口对map,reduce过程进行编程hdfs中一个文件过大的话会被intformat方法分成几个小块,然后分发给mapper(数量自己可以设置),mapper将接收的数据转换成键值对形式(key,value)输出,然后输出的内容会进入环形缓冲区。
2024-09-04 21:16:04
773
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人