快速排序
【注】参考自教材「算法导论」。
1. 简介
快速排序是一种被广泛运用的排序算法,虽然其最坏情况下的时间复杂度为 ,但其平均时间复杂度为 ,而且其常数因子非常小,所以实际情况下跑的很快。快速排序是不稳定的、原址的排序算法。
【注】实际上只要保证快排的每一层枢轴左右两边的序列大小的划分比不超过某一常数比(即与序列大小 无关),那么最终快排的时间复杂度就为 。
2. 思想
以从小到大排序的快速排序为例,快速排序主要思想是:
- 首先在序列中选定一个元素作为枢轴
- 然后将序列中所有小于枢轴的元素都交换到枢轴左侧,所有大于枢轴的元素都交换到枢轴右侧
- 接着递归处理枢轴左侧的序列和右侧的序列
其中最重要的就是实现将小于枢轴的元素交换到枢轴左侧,将大于枢轴的元素交换到枢轴右侧。
2.1 基础快排
- 维护两个指针,分别从序列首部和尾部往相反方向扫过去
- 第一个指针停在扫到的第一个大于枢轴的元素位置,然后交换两个指针指向的元素;第二个指针停在扫到的第一个小于枢轴的元素位置,然后交换两个指针指向的元素
【注】基础快排在原序列完全有序的情况下的复杂度达到 。
影响快排效率的因素
快排效率的高低本质上取决于 划分的左右两部分是否均衡。
- 而划分是否均衡又和最开始选取的枢轴有关,对于有序序列,固定选取第一个元素作为枢轴会导致每层递归只能将序列长度减一,从而达到最坏复杂度 。
- 对于包含大量重复元素的序列,比如某个序列全为相同的元素,则此时也会导致每层递归只能将序列长度减一,从而达到最坏复杂度 。其实,在当前递归中,和枢轴相同的元素本质上都可以不需要再参与下一层的递归。
快排优化方法
- 对于由于选取枢轴不合理导致划分不平衡的问题,可以采用随机选取序列中的元素作为枢轴的方法,也可以分别选取序列的首、中、尾三个元素然后取它们的中位数作为枢轴。
- 对于由于重复元素导致重复处理的问题,可以采用三路快排的思想,将序列划分为连续的三部分:小于枢轴、等于枢轴、大于枢轴的三个部分。
- 其他优化:当序列长度较小()时,插入排序的效率要高于快排,所以可以截断快排的递归而改用插入排序。
2.2 随机化快排
随机选取序列中的某一个元素作为枢轴,交换到第一个元素的位置。
2.3 三数取中快排
选取序列的首、中、尾三个元素然后取它们的中位数作为枢轴,交换到第一个元素的位置。
2.4 三路快排
设待排序的序列为 ,则在三路快排的每一层递归中:
- 维护三个指针:,使得 均小于枢轴, 均等于枢轴, 均大于枢轴,而 为仍未处理的序列。
- 初始化枢轴 为序列的首元素, 。
- 判断 和枢轴 的关系:
- 如果 ,则 。
- 如果 ,则 。
- 如果 ,则 。
- 直到 ,则成功将序列划分为三个部分: 均小于枢轴, 均等于枢轴, 均大于枢轴。
- 然后只需要递归处理 和 两部分即可。
3. 模板
3.1 基础快排
- 原始版本
1 |
|
- 其他版本
1 |
|
3.2 随机化版本
1 |
|
3.3 三数取中快排
1 |
|
3.4 三路快排
1 |
|
3.5 随机化 + 三路快排
1 |
|
3.6 三数取中 + 三路快排
1 |
|
3.7 随机化 + 三路快排 + 插入排序截断
1 |
|
3.8 随机化 + 三数取中 + 三路快排 + 插入排序截断
1 |
|
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!