[ 数据结构 -- 手撕排序算法第三篇 ] 希尔排序

Source

文章目录

前言
一、常见的排序算法
二、希尔排序
三、希尔排序实现代码
四、希尔排序的时间复杂度
五、希尔排序和直接插入排序效率测试
六、希尔排序特性总结

前言

手撕排序算法第三篇：希尔排序！
从本篇文章开始，我会介绍并分析常见的几种排序，例如像插入排序，冒泡排序，希尔排序，选择排序，快速排序，堆排序，归并排序等等！
这篇文章我先来给大家手撕一下希尔排序！

大家可以点下面的链接去阅读其他的排序算法：
C语言手撕排序算法

正文开始！

一、常见的排序算法

在这里插入图片描述
直接插入排序是一种简单的插入排序法，其基本思想是：把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中，知道所有的记录插入完为止，得到一个新的有序序列。
实际中我们玩扑克牌的时候，就用了插入排序的思想。

二、希尔排序

2.1 希尔排序(缩小增量排序)

希尔排序又称缩小增量法。希尔排序法的基本思想是：先选定一个整数gap，把待排序文件中所有记录分成个组，所有距离相差gap的记录分在同一组，并对每一组内的记录进行排序。然后去重复上述分组和排序的工作。当到达gap=1时，所有记录在统一组内排好序。

简要理解就是：

首先进行预排序,使其序列接近有序。
在进行直接插入排序。

预排序(分组排)就是让大的数更快的到后面，小的数更快的到前面，使其接近有序。

画图分析：

在这里插入图片描述

如果gap越小，就越接近有序。
gap越大的，打的数据可以更快的到后面，小的数可以更快的到前面去，但是它越不接近有序。

2.1.1 预排序阶段

在第一趟的时候取gap=5，那么{9,4}，{1,8}，{2,6}，{5,3}，{7,5}一共被分为了五组，在每一组内在进行插入排序，排完序之后的结果为{4,9}，{1,8}，{2,6}，{3,5}，{5,7}；此时每组中较大的数就被交换到了后面，较小的数就被交换到了前面。
在第二趟的时候，我们取gap=gap/3+1(除以3是一个普遍的写法，+1的原因是因为gap如果小于3的话，gap/3会让gap=0，此时就会进入死循环的)，这时gap为2，{4,2,5,8,5},{1,3,9,6,7}分成了两组，在每组内再进插入排序，让这一组有序。

2.1.2 插入排序阶段

当gap=1的时候，我们使用的就是插入排序，这时候经过之前的预排序，整个数组已经变得接近有序，较大的数字都会被移到后面，较小的数字都会被移到前面，这时使用插入排序的效率就会很高。

2.2 单趟希尔排序

2.2.1 思路分析

单趟希尔排序就是将差为gap的为一组，大的数字往后面放，小的数字往前面放。
在这里插入图片描述
具体插入排序的思想大家可以参考博文：[ 数据结构 – 手撕排序算法第一篇 ] 插入排序

int gap = 3;
	int end;
	int tmp = a[end + gap];
	while (end>=0)
	{
    
      
		if (tmp < a[end])
		{
    
      
			a[end + gap] = a[end];
			end -= gap;
		}
		else
		{
    
      
			break;
		}
	}
	a[end + gap] = tmp;

三、希尔排序实现代码

在单趟循环循环的基础下，加上一个大循环。

void ShellSort(int* a,int n)
{
    
      
	int gap = n;
	while (gap>1)
	{
    
      
		gap = gap / 3 + 1;
		for (int i = 0; i < n - gap; i++)
		{
    
      
			int end = i;
			int tmp = a[end + gap];
			while (end >= 0)
			{
    
      
				if (tmp < a[end])
				{
    
      
					a[end + gap] = a[end];
					end -= gap;
				}
				else
				{
    
      
					break;
				}
			}
			a[end + gap] = tmp;
		}
	}
}
void TestShellSort()
{
    
      
	int a[] = {
    
       6,3,1,4,2,5 };
	printf("排序前：");
	PrintArray(a, sizeof(a) / sizeof(a[0]));
	ShellSort(a, sizeof(a) / sizeof(a[0]));
	printf("排序后：");
	PrintArray(a, sizeof(a) / sizeof(a[0]));
}
int main()
{
    
      
	TestShellSort();
	return 0;
}

在这里插入图片描述

四、希尔排序的时间复杂度

希尔排序的时间复杂度不好计算，因为gap的取值方法有很多，导致很难去计算，因此有许多书籍给出的希尔排序的时间复杂度都不固定。

但是我们可以将希尔排序的时间复杂度相比之间插入排序进行比较，在最坏的情况下也是逆序排顺序。假设有N个数字，直接插入排序的时间复杂度为O(n^2)。
但是如果使用希尔排序此事进行分组时，对每个组进行排序，在最后gap=1的时候时间复杂度可以认为是O(n)，所以结合起来希尔排序的时间复杂度是大于O(n)小于O(n^2).

但是希尔排序也是存在缺陷的，这种情况就是原数组本身有序，那么直接插入排序的时间复杂度为O(n)，而使用希尔排序在gap>1的时候进行预排序其实是没有作用的，但是计算机不知道，因此还会做一边预排序，当gap=1的时候在直接插入排序。因此时间复杂度是大于O(n)。但是这毕竟是少数情况，大多数排序都是随机数组或者逆序排顺序。

以下是两本书中对希尔排序时间复杂度的描述：

因为我们的gap是按照Knuth提出的方式取值的，而且Knuth进行了大量的实验统计，我们暂时就按照
来计算。

《数据结构(C语言版)》— 严蔚敏
在这里插入图片描述 《数据结构-用面相对象方法与C++描述》— 殷人昆

在这里插入图片描述

五、希尔排序和直接插入排序效率测试

为了更好的比较希尔排序和直接插入排序的效率，我们可以生成一组随机数进行比较查看他们所消耗的时间。

5.1 测试

我们创建一个数组，数组的元素个数有100000个，让其数字全部随机生成，我们通过希尔排序和直接插入排序分别对这个数组进行排序。观察他们所消耗的时间。

//时间对比
void TestOP()
{
    
      
	srand(time(0));
	const int N = 100000;
	int* a1 = (int*)malloc(sizeof(int) * N);
	int* a2 = (int*)malloc(sizeof(int) * N);

	for (int i = 0; i < N; ++i)
	{
    
      
		a1[i] = rand();
		a2[i] = a1[i];
	}

	int begin1 = clock();
	InsertSort(a1, N);
	int end1 = clock();

	int begin2 = clock();
	ShellSort(a2, N);
	int end2 = clock();


	printf("InsertSort:%d\n", end1 - begin1);
	printf("ShellSort:%d\n", end2 - begin2);

	free(a1);
	free(a2);
}

int main()
{
    
      
	TestOP();
	return 0;
}

5.2 结论

5.2.1 随机数比较

在这里插入图片描述
由程序的运行结果我们可以看出对十万的无序数组进行排序的时间，希尔排序要优于直接插入排序很多。

我们也可以改变数组大小再测试测试。

在这里插入图片描述
数据量越大，希尔排序的效率就明显越高。

5.2.2 有序数组比较

在这里插入图片描述
正如我们所分析的那样，当数组本身有序时，希尔排序的预排序阶段就会不起作用，此时希尔排序的效率不及直接插入排序。

六、希尔排序特性总结

希尔排序是对直接插入排序的优化
当gap>1时是预排序，目的是让数组更接近于有序。当gap==1时，数组已经接近有序了，这样就会很快。这样对于整体而言，可以达到优化的效果。我们实现后也进行了性能的比较。
希尔排序的时间复杂度不好计算，因为gap的取值方法有很多，导致很难去计算，因此在很多书中给出希尔排序的时间复杂度是不固定的。
稳定性：不稳定。

（本篇完！）