【八大排序】day2.基数排序

本文详细介绍了基数排序算法的实现原理及步骤。通过一个具体的Java代码示例展示了如何通过基数排序对整数数组进行排序,包括确定最大数的位数、创建临时存储数组等关键环节。

一、基数排序

/**
 * 基数排序:
 * 基数排序是把整数按位次从右到左(从低位到高位)切割成个位数,然后按照每个位数进行比较。
 * 所以我们需要先找出最长的那个数,那个数的长度就是我们需要比较的次数。其他数长度不够逻辑补0。
 */
public class _8_RadixSort {
    public static void main(String[] args) {
        Integer[] arr = {3, 5, 1, 7, 2, 3, 4, 8};
        radixSort(arr);
        System.out.println(Arrays.toString(arr));
    }

    public static void radixSort(Integer[] arr) {
        //找出数组中长度最长的数
        int max = Integer.MIN_VALUE;
        for (int num : arr) {
            if (num > max) {
                max = num;
            }
        }
        //计算最大数字是几位数
        int maxLen = (max + "").length();
        //用于临时存储数据,x轴是0~9,y轴是当前循环中某位次在某一个x上的个数,y的最大值是arr.length
        int[][] temp = new int[10][arr.length];
        //用于存储本次循环中0~9上有几个数
        int[] counts = new int[10];
        //根据最大长度数的位数来决定比较次数
        for (int i = 0, n = 1; i < maxLen; i++, n *= 10) {
            //比较数组中的每个数
            for (int j = 0; j < arr.length; j++) {
                //计算余数
                int remainder = arr[j] / n % 10;
                //把当前数放进temp中存储
                temp[remainder][counts[remainder]] = arr[j];
                //记录数量
                counts[remainder]++;
            }
            //记录取出来的元素放的位置
            int idx = 0;
            //取出每个数
            for (int j = 0; j < counts.length; j++) {
                //如果当前counts不为0,说明里面有数需要取
                if (counts[j] != 0) {
                    //循环取出数
                    for (int k = 0; k < counts[j]; k++) {
                        arr[idx] = temp[j][k];
                        //记录下个位置
                        idx++;
                    }
                }
                //把数量清空
                counts[j] = 0;
            }
        }
    }
}
1.简述HADOOP 的组成以及各节点的作用。 2.简述 MAP-REDUCE的原理 3.2NN是NN的热备吗?还有其他作用吗?请说明 4.简述Hadoop的副本设置策略 5fsimage和edits文件分别存的是什么内容?主要用来于什么?这些文件会存放业务数据吗? 6.Hive和其他数据库的区别,离线和在线的区别 7.创建一个以month_id,day_id为分区的内部表SC,字段为ID,类型为字符,要求以竖线分割,month_id为静态分区,day_id为动态分区 8.sc表以 select方式覆盖插入三条数据,month_id为静态分区,值为202107,day_id 为动态分区,值为01,02,03,结果如下 ID,MONTH_ID,DAY ID 1 202107 01 2 202107 02 3 202107 03 写出 hql语句 9.Overwrite 和into 的区别是什么? 10.Hive默认是否允许全部设置为动态分区,并指出采用默认设置的理由,如果主分区为动态分区,子分区为静态分区会产生什么问题?请写出设置全部分区为动态分区的参数(5分) 11.从linux主机向hive数仓的SC表(sid,cid,score)导入一个SC.TXT的文件,在 hdfs 新建一个/test的目录,从本地向hdfs上传一个SC.TXT文件,然后导入hive数仓的SC表,再从hdfs把SC.TXT文件拉到linux主机,分别写出执行语句 12、分桶表与分区表的区别,指出分桶的理由 13.Order by 和 sort by、distribute by、partitionby的区别,请指出各自适用的场景和用法 14.列出hive表常用的存储格式和压缩格式并说明其特点(5分) 15、将一个hive 脚本挂到后台,该脚本可以动态创建日志的目录,并将脚本自定义日志定向到该目录下。写出示例脚本。(5分) 16.写出hive 脚本从测试、挂后台和定时调度、日志监控、杀job所用到的全部语 17、怎么査看hive表在 hdfs的存储路径,并查看某个分区占用的空间 18、控制 map数量需要遵循两个原则是什么? 19、如果在hive 中使用了orderby,那么MR会产生多少个ruduce?为什么? 20、请简述数据倾斜产生的原因及解决办法。
08-19
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值