hello-algo/docs/chapter_sorting/insertion_sort.md

---
comments: true
---

# 插入排序

顾名思义，「插入排序 Insertion Sort」是一种基于 **数组插入操作** 的排序算法。

「插入操作」思想：选定数组的某个元素 `base` ，将 `base` 与其左边的元素依次对比大小，并 “插入” 到正确位置。

然而，由于数组元素是连续的，因此我们无法直接把 `base` 插入到目标位置，而是需要把从正确位置到 `base` 之间的所有元素向右移动一位。

![insertion_operation](insertion_sort.assets/insertion_operation.png)

## 算法流程

第 1 轮先选取数组的 **第 2 个元素** 为 `base` ，执行「插入操作」后， **数组前 2 个元素已完成排序**。

第 2 轮选取 **第 3 个元素** 为 `base` ，执行「插入操作」后， **数组前 3 个元素已完成排序**。

以此类推……最后一轮选取 **数组尾元素** 为 `base` ，执行「插入操作」后 **所有元素已完成排序**。

![insertion_sort](insertion_sort.assets/insertion_sort.png)

=== "Java"

    ```java
    /* 插入排序 */
    void insertionSort(int[] nums) {
        // 外循环：base = nums[1], nums[2], ..., nums[n-1]
        for (int i = 1; i < nums.length; i++) {
            int base = nums[i], j = i - 1;
            // 内循环：将 base 插入到左边的正确位置
            while (j >= 0 && nums[j] > base) {
                nums[j + 1] = nums[j];  // 1. 将 nums[j] 向右移动一位
                j--;
            }
            nums[j + 1] = base;         // 2. 将 base 赋值到正确位置
        }
    }
    ```

## 算法分析

**时间复杂度 $O(n^2)$ ：** 各轮插入操作最多循环 $n - 1$ , $n-2$ , $\cdots$ , $2$ , $1$ 次，求和为 $\frac{(n - 1) n}{2}$ ，使用 $O(n^2)$ 时间。

**空间复杂度 $O(1)$ ：** 指针 $i$ , $j$ 使用常数大小的额外空间。

**原地性：** 指针变量仅使用常数大小额外空间，因此是 **原地排序** 。

**稳定性：** 不交换相等元素，因此是 **稳定排序** 。

**自适应：** 当输入数组完全有序时，每次插入操作（即内循环）仅循环一次，此时时间复杂度为 $O(n)$  。

## 插入排序 vs 冒泡排序

!!! question

    虽然「插入排序」和「冒泡排序」的时间复杂度皆为 $O(n^2)$ ，但实际运行速度却有很大差别，这是为什么呢？

回顾复杂度分析，两个方法的循环次数都是 $\frac{(n - 1) n}{2}$ 。但不同的是，「冒泡操作」是在做 **元素交换** ，需要借助一个临时变量实现，共 3 个单元操作；而「插入操作」是在做 **赋值** ，只需 1 个单元操作；因此，可以粗略估计出冒泡排序的计算开销约为插入排序的 3 倍。

插入排序运行速度快，并且具有原地、稳定、自适应的优点，因此很受欢迎。实际上，包括 Java 在内的许多编程语言的排序库函数的实现都用到了插入排序。库函数的大致思路：

- 对于 **长数组**，采用基于分治的排序算法，例如「快速排序」，时间复杂度为 $O(n \log n)$ ；
- 对于 **短数组**，直接使用「插入排序」，时间复杂度为 $O(n^2)$ ；

在数组较短时，复杂度中的常数项（即每轮中的单元操作数量）占主导作用，此时插入排序运行地更快。这个现象与「线性查找」和「二分查找」的情况类似。