1.排序语法,默认是降序吗?
不是 默认asc 升序
2.限制多少行语法?
limit3.分组函数有哪些?
max(expr) :求expr的最大值
min(expr) :求expr的最小值
sum(expr) :求expr的和
avg(expr) :求expr的平均值
count(expr) :求expr的个数
4.分组语法是什么?
group by 后面跟的是分组的条件
如果要以sal_id为分组条件,可以写为group by sal_id
如果有多重分组条件,只需要在后面添加筛选条件即可。
5.分组语法的注意点是什么?
查询列要放到group by 里面,函数除外
6.join有哪几种?
left join(左联接):返回包括左表中的所有记录和右表中联接字段相等的记录
right join(右联接):返回包括右表中的所有记录和左表中联接字段相等的记录
inner join(等值联接):只返回两个表联接字段相等的行
7.left join是哪个表数据全?
左表
8.union 和union all 区别是什么?
union: 去重
union all :不去重
9.谈谈你们觉得什么是子表?
任何的查询结果都可以作为子表,相当于临时表,或者缓存。
10.模糊查询名称name的有s字符的名称有哪些?
查询以s开头的:
例如:select scott.ename from scot where scott.ename like 's%';
查询以s结尾的:
例如:select scott.ename from scot where scott.ename like '%s';
查询第二个字符为s的:
例如:select scott.ename from scot where scott.ename like '%s%';
查询包含有s字符的:
例如:select scott.ename from scot where scott.ename like '_s%';
11.like查询语法,比如是第三个字符是s,那么前面是不是要用两个占位符?
是的 like '_s%'
12.谈谈你们对hadoop的理解?
hadoop是一个由Apache基金会所开发的分布式系统基础架构
它的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。
13.hadoop包含哪三大组件,分别是做什么的?
hdfs:存储
hdfs:分布式文件系统,采用主从模式,其架构主要包含:
一台NameNode服务器和多台DateNode组成
1、NameNode:名称节点,用来存储元数据(就是数据块的映射),运行一个实例,因此要解决单点故障的问题。
2、DateNode:数据节点,用于存储真实的数据,并将自己管理的数据块信息上报给NameNode,运行多个实例;
yarn:资源和作业调度
1、yarn:是一个通用的资源管理平台,可为各类计算框架提供资源的管理和调度。
marpreduce:计算
1、marpreduce:它是一个分布式计算框架,完成大数据的计算,提高效率
14.hadoop官网地址是什么?
hadoop.apache.org
15.maven编译是不是需要pom.xml?
需要
16.maven的默认仓库文件夹在哪?
可改变默认的 .m2 目录下的默认本地存储库文件夹
通过修改${user.home}/.m2/settings.xml 配置本地仓库路径 ,没有settings这个xml文件就新建,或者如下复制个
17.我们进行hadoop部署是什么模式?有进程吗?
有以下三种部署模式:
单机模式:没有进程
伪分布式:进程存在+1节点 一般用于开发环境
集群部署:进程存在+n节点 用于开发和生产环境
18.hdfs的存储也是从 根目录 开始的吗?
是的
19.伪分布式部署时要配置jdk和ssh,那么请问你们 配置ssh无密码的访问,这个流程会吗?
会
20.tar解压时,特别要留意一个东西是什么?
用户和用户组的问题