数据结构和算法,相信是每个技术从业者都绕不过去的坎,每次技术面都逃不过的虐。但在实际工作中,很少会真正用到自己实现底层的数据结构和底层的算法实现。各类编程语言都已经进行了高级的封装,只需调用诸如sort/rank函数就可以实现排序算法,利用诸如array/arrayList等容器就可实现数组存储与引用,那为什么数据结构和算法还要学?面试中还会被大量提问呢?
正如武林高手修炼内功一样,数据结构和算法就是技术行业的内功心法。在技术行业,比起你的工作经验、项目经历,企业更看重的是面试者的基础和持续学习能力,像“无忌”一样,有了数据结构和算法基础这一九阳神功护体学什么都快。
面对生活中每个坎,迈过了就是成长,迈不过去就是个坑。那今天我们就一起迈过排序算法这道坎。
0 排序算法概述
0.1 排序算法类别
排序对于任何一个程序员来说,可能都不会陌生。你学的第一个算法,可能就是排序。大部分编程语言中,也都提供了排序函数。在平常的项目中,我们也经常会用到排序。排序算法真的的太多了,有些算法可能连名字都没有听过,比如猴子排序、睡眠排序、面条排序等。今天只分享最经典、最常见的一些算法
常用排序算法
0.2算法对比
前面已经提到排序算法有那么多,那在实际使用中如何择优呢,这就涉及到了算法的比较,从稳定性、时间复杂度、空间复杂度对排序算法进行比较。
稳定性:数组中相同元素在排序前后位置是否发生了改变,如果a原本在b前面,而a=b,排序之后a仍然在b的前面,即为稳定。
时间复杂度:对排序数据的总的操作次数。反映当n变化时,操作次数的变化趋势,也就是我们平时所说的大O复杂度。
空间复杂度:是指算法在计算机内执行时所需存储空间的度量,它也是数据规模n的函数。
1、冒泡排序
1.1 核心思想
将数组元素两两比较,将不符合顺序关系的元素交换位置,遍历执行。
1.2算法描述
- 比较相邻的元素。如果第一个比第二个大,就交换它们两个;
- 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;
- 针对所有的元素重复以上的步骤,除了最后一个;
- 重复步骤1~3,直到排序完成。
1.3 算法联想
冒泡排序可以联想这样一个场景,上学期间体育课都要按身高排队,体育老师的一种做法是先让学生们随机排成一队,然后老师从排头依次向后走只允许调整相邻两人的位置,发现前面高于后面的情况就交换两人位置,那第一次走完最高的就到了排尾,第二次走完第二高的就到了排位第二位置,以此类推,当然了实际中可能没有哪位体育老师会傻到一遍一遍来回走,所以,这是一个比较低效的排序算法。
2、选择排序
2.1 核心思想
建立另外一个有序区来存储排序后的数列,每次从无序区中取出最小元素放到有序区,并将其从无序数列中删除。
2.2 算法描述
- 初始状态:无序区为R[1…n],有序区为空;
- 第i次排序(i=1,2,3…n-1)开始时,当前有序区和无序区分别为R[1…i-1]和R(i…n)。该趟排序从当前无序区中-选出关键字最小的记录
R[k],将它与无序区的第1个记录R交换,使R[1…i]和R[i+1…n)分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区; - n-1次结束,数组有序化了。
2.3 算法联想
选择排序设想这样一个场景,你正在跟两个舍友斗地主,突然翔意袭来,那你肯定得让舍友帮忙把牌抓出来。办事归来需要理牌,那你的做法可以是这样的,抓起桌上杂乱无章的牌,寻找王放在最左边,寻找2放在王的右边,直到把3放在最右边。没错,你正在使用选择排序的算法思想。
3、插入算法
3.1 核心思想
通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入冒泡算法是通过位置来找数,插入算法则是通过数来找位置
3.2 算法描述
- 从第一个元素开始,该元素可以认为已经被排序;
- 取出下一个元素,在已经排序的元素序列中从后向前扫描;
- 如果该元素(已排序)大于新元素,将该元素移到下一位置;
- 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置;
- 将新元素插入到该位置后;
- 重复步骤2~5。
3.3 算法联想
这个算法的联想就很简单了,还是打牌的场景,这次你全程没有翔意,而是正常抓牌,插牌的过程就是在做插入排序啦。
4、希尔算法
4.1 核心思想
简单插入排序的改进版,是第一个时间复杂度小于O(n2)它与插入排序的不同之处在于,它会优先比较距离较远的元素。希尔排序又叫缩小增量排序。插入排序可以看作是gap=1的希尔排序
4.2 算法描述
先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,具体算法描述:
- 选择一个增量序列t1,t2,…,tk,其中ti>tj,tk=1;
- 按增量序列个数k,对序列进行k 趟排序;
- 每趟排序,根据对应的增量ti,将待排序列分割成若干长度为m 的子序列,分别对各子表进行直接插入排序。仅增量因子为1
时,整个序列作为一个表来处理,表长度即为整个序列的长度。
4.3 算法联想
还是打牌的案例,这次你带着你对象一起打牌,他也想参与进来,你们一起抓牌,每人抓一轮顺带撒狗粮,这样你就得到了两堆牌,每堆牌都是用插入排序进行排序好的从3到王,接着再对两堆排序好的牌进行插入排序,这就是gap=2的希尔算法。如果再加上你的两个孩子那就是gap=4的排序算法啦!
5、归并排序
5.1 核心思想
采用分治法。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。涉及两种操作:排序和合并
5.2 算法描述
- 把长度为n的输入序列分成两个长度为n/2的子序列;
- 对这两个子序列分别采用归并排序;
- 将两个排序好的子序列合并成一个最终的排序序列。
5.3 算法联想
想象你正在玩的不是一般的牌,而是每人有1000张甚至10000的牌,那你办完大事归来看到被舍友抓好堆在面前的牌如何理牌呢?一个直觉的做法是将这堆牌不断分成小堆,理好一撮撮小堆的牌最后整个也就有序了
6、快速排序
6.1核心思想
选出一个基准值,通过排序将待排记录分隔成独立的两部分,其中左半边比基准值小,右半边比基准值大,再从左右各选出基准值重复以上过程,以达到整个序列有序。
6.2 算法描述
快速排序使用分治法来把一个串(list)分为两个子串(sub-lists)。具体算法描述如下:
- 从数列中挑出一个元素,称为 “基准”(pivot);
- 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
- 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
6.3 算法联想
还是你理大牌的那里(1000张无序牌),这时你分组的时候不再是随机分了,而是取出第一张牌假设是J那你把大于J的QKA2鬼放在一组,小于J的放在另一组进行分组排序,这就是快排了。