“重用与增量有序”的设计套路,前文已经介绍,这次介绍另一个招数--重用与分治的设计思想,这个套路在合并排序的算法设计中有所体现。

重用已经是一种被广泛使用的套路,小程之前介绍了重用的含义,而合并排序的重用,体现在对自身的反复调用。首先,认定合并排序算法就是让数列有序的,只要经过它处理,就一定会变得有序,这个信念很重要,做人要信。然后,把数列分为两部分,分别重用合并排序,重用完,这两部分就变得有序了。最后,把有序的两部分数列,合并起来,就解决了排序的问题。

也就是,合并排序本身就是一个标准作业,可以反复被重用。

选定标准作业,是很重要的,它会演化出不同的算法。比如,插入排序是不能以自身作为标准作业的,因为如果这样设计,它就不叫“插入排序”了,很可能变成了合并排序。

以上介绍了重用套路在合并排序算法中的体现。

另一个经典的套路,是分治。

分治,就是分而治之,你应该经常听到这样的说法:“没有什么是搞不定的!只要你把它分解得足够小,就能解决!”,换一个说法就是:没有什么是退一步不能解决的,如果有,那就退两步。

分是第一步,分出来解决后,还要把结果组合起来。

合并排序的分治套路,表现很明显:把数列分为两部分,重用自己令这两部分有序后,再组合起来。

而且,合并排序的分治,是很简单的分治,从中间分开再处理就可以了。当分到只有一个元素时,就不能再分,此时这一个元素是有序的。

算法4:合并排序的套路 | 重用 | 分治-LMLPHP

至此,合并排序的两个重要的套路(重用与分治)就差不多介绍完毕了。

为了让读者更清晰地感受这两个套路,小程接下来从具体的排序实例来详细介绍。

合并排序,先是要分(一分为二),分到只有一个元素为止(一个元素时就是有序的)。然后是合,先是两个元素合在一起,之后是多个元素合在一起。

参考以下这个演示图,可以更好地理解合排的设计与实现:
算法4:合并排序的套路 | 重用 | 分治-LMLPHP

上面这个图,注意不同颜色框的变化(分与合的变化)。

再参考另一个演示图(来自网络):
算法4:合并排序的套路 | 重用 | 分治-LMLPHP

以上是算法套路,接下是代码实现,这两者是两个话题,之前已经解释过。

#include <stdio.h>
#include <stdlib.h>

void merge(int* arr, int f, int m, int l, int* tmparr) {
    int i=f, j=m+1;
    int k=0;
    while (i<=m && j<=l) {
        if (arr[i] > arr[j]) {
            tmparr[k++]=arr[j++];
        }
        else {
            tmparr[k++]=arr[i++];
        }
    }
    while (i<=m) {
        tmparr[k++]=arr[i++];
    }
    while (j<=l) {
        tmparr[k++]=arr[j++];
    }
    for (i=0; i<k; i++) {
        arr[f++]=tmparr[i];
    }
}

void _sort_merge(int* arr, int f, int l, int* tmparr) {
    if (f < l) {
        int m=(f+l)>>1;
        _sort_merge(arr, f, m, tmparr);
        _sort_merge(arr, m+1, l, tmparr);
        merge(arr, f, m, l, tmparr);
    }
}

void sort_merge(int* arr, int size) {
    int* tmparr=(int*)malloc(sizeof(int) * size);
    _sort_merge(arr, 0, size-1, tmparr);
    free(tmparr);
}

int main(int argc, char *argv[])
{
    int arr[] = {4, 2, 5, 1, 6, 6, 8, 9, 8, 3};
    int size=sizeof arr/sizeof *arr;
    for (int i = 0; i < size; i ++) {
        printf("%d, ", arr[i]);
    }
    sort_merge(arr, size);
    printf("\nafter_sort:\n");
    for (int i = 0; i < size; i ++) {
        printf("%d, ", arr[i]);
    }
    printf("\n");
    return 0;
}

另外,在分治的套路中,可以混搭增量有序的套路,也就是,合并排序在划分到数量较小时,可以使用插入排序来完成排序(因为在数量较小时,插入排序更快一些),这种套路混搭,打出来的就是组合拳


以下这部分,介绍了合排与快排的对比,你可以忽略掉,因为时间复杂度或速度方面,跟套路并无直接关系。

合并排序的分(O(lgn))与合(O(n)),整体的时间复杂度是O(nlgn),而且是稳定排序。

在工程中,快排的效果比合排更优,但注意高层次的设计思想,也就是套路,是一样的。


总结一下,本文介绍了合并排序的套路,即重用与分治,这两种思想都是经典的套路,重用能简化问题的思考,而分治能把问题变小,能熟练掌握这两种套路就具备了很厉害的功力。


算法4:合并排序的套路 | 重用 | 分治-LMLPHP

05-05 22:35