--- comments: true --- # 空间复杂度 「空间复杂度 Space Complexity」统计 **算法使用内存空间随着数据量变大时的增长趋势** 。这个概念与时间复杂度很类似。 ## 算法相关空间 算法运行中,使用的内存空间主要有以下几种: - 「输入空间」用于存储算法的输入数据; - 「暂存空间」用于存储算法运行中的变量、对象、函数上下文等数据; - 「输出空间」用于存储算法的输出数据; !!! tip 通常情况下,空间复杂度统计范围是「暂存空间」+「输出空间」。 暂存空间可分为三个部分: - 「暂存数据」用于保存算法运行中的各种 **常量、变量、对象** 等。 - 「栈帧空间」用于保存调用函数的上下文数据。系统每次调用函数都会在栈的顶部创建一个栈帧,函数返回时,栈帧空间会被释放。 - 「指令空间」用于保存编译后的程序指令,**在实际统计中一般忽略不计**。 ![space_types](space_complexity.assets/space_types.png)
Fig. 算法使用的相关空间
=== "Java" ```java title="" /* 类 */ class Node { int val; Node next; Node(int x) { val = x; } } /* 函数(或称方法) */ int function() { // do something... return 0; } int algorithm(int n) { // 输入数据 final int a = 0; // 暂存数据(常量) int b = 0; // 暂存数据(变量) Node node = new Node(0); // 暂存数据(对象) int c = function(); // 栈帧空间(调用函数) return a + b + c; // 输出数据 } ``` === "C++" ```cpp title="" ``` === "Python" ```python title="" """ 类 """ class Node: def __init__(self, x): self.val = x # 结点值 self.next = None # 指向下一结点的指针(引用) """ 函数(或称方法) """ def function(): # do something... return 0 def algorithm(n): # 输入数据 a = 0 # 暂存数据(常量) b = 0 # 暂存数据(变量) node = Node(0) # 暂存数据(对象) c = function() # 栈帧空间(调用函数) return a + b + c # 输出数据 ``` ## 推算方法 空间复杂度的推算方法和时间复杂度总体类似,只是从统计 “计算操作数量” 变为统计 “使用空间大小” 。与时间复杂度不同的是,**我们一般只关注「最差空间复杂度」**。这是因为内存空间是一个硬性要求,我们必须保证在所有输入数据下都有足够的内存空间预留。 **最差空间复杂度中的 “最差” 有两层含义**,分别为输入数据的最差分布、算法运行中的最差时间点。 - **以最差输入数据为准。** 当 $n < 10$ 时,空间复杂度为 $O(1)$ ;但是当 $n > 10$ 时,初始化的数组 `nums` 使用 $O(n)$ 空间;因此最差空间复杂度为 $O(n)$ ; - **以算法运行过程中的峰值内存为准。** 程序在执行最后一行之前,使用 $O(1)$ 空间;当初始化数组 `nums` 时,程序使用 $O(n)$ 空间;因此最差空间复杂度为 $O(n)$ ; === "Java" ```java title="" void algorithm(int n) { int a = 0; // O(1) int[] b = new int[10000]; // O(1) if (n > 10) int[] nums = new int[n]; // O(n) } ``` === "C++" ```cpp title="" ``` === "Python" ```python title="" def algorithm(n): a = 0 # O(1) b = [0] * 10000 # O(1) if n > 10: nums = [0] * n # O(n) ``` **在递归函数中,需要注意统计栈帧空间。** 例如函数 `loop()`,在循环中调用了 $n$ 次 `function()` ,每轮中的 `function()` 都返回并释放了栈帧空间,因此空间复杂度仍为 $O(1)$ 。而递归函数 `recur()` 在运行中会同时存在 $n$ 个未返回的 `recur()` ,从而使用 $O(n)$ 的栈帧空间。 === "Java" ```java title="" int function() { // do something return 0; } /* 循环 O(1) */ void loop(int n) { for (int i = 0; i < n; i++) { function(); } } /* 递归 O(n) */ void recur(int n) { if (n == 1) return; return recur(n - 1); } ``` === "C++" ```cpp title="" ``` === "Python" ```python title="" def function(): # do something return 0 """ 循环 O(1) """ def loop(n): for _ in range(n): function() """ 递归 O(n) """ def recur(n): if n == 1: return return recur(n - 1) ``` ## 常见类型 设输入数据大小为 $n$ ,常见的空间复杂度类型有(从低到高排列) $$ \begin{aligned} O(1) < O(\log n) < O(n) < O(n^2) < O(2^n) \newline \text{常数阶} < \text{对数阶} < \text{线性阶} < \text{平方阶} < \text{指数阶} \end{aligned} $$ ![space_complexity_common_types](space_complexity.assets/space_complexity_common_types.png)Fig. 空间复杂度的常见类型
!!! tip 部分示例代码需要一些前置知识,包括数组、链表、二叉树、递归算法等。如果遇到看不懂的地方无需担心,可以在学习完后面章节后再来复习,现阶段先聚焦在理解时间复杂度含义和推算方法上。 ### 常数阶 $O(1)$ 常数阶常见于数量与输入数据大小 $n$ 无关的常量、变量、对象。 需要注意的是,在循环中初始化变量或调用函数而占用的内存,在进入下一循环后就会被释放,即不会累积占用空间,空间复杂度仍为 $O(1)$ 。 === "Java" ```java title="space_complexity_types.java" /* 常数阶 */ void constant(int n) { // 常量、变量、对象占用 O(1) 空间 final int a = 0; int b = 0; int[] nums = new int[10000]; ListNode node = new ListNode(0); // 循环中的变量占用 O(1) 空间 for (int i = 0; i < n; i++) { int c = 0; } // 循环中的函数占用 O(1) 空间 for (int i = 0; i < n; i++) { function(); } } ``` === "C++" ```cpp title="space_complexity_types.cpp" ``` === "Python" ```python title="space_complexity_types.py" """ 常数阶 """ def constant(n): # 常量、变量、对象占用 O(1) 空间 a = 0 nums = [0] * 10000 node = ListNode(0) # 循环中的变量占用 O(1) 空间 for _ in range(n): c = 0 # 循环中的函数占用 O(1) 空间 for _ in range(n): function() ``` ### 线性阶 $O(n)$ 线性阶常见于元素数量与 $n$ 成正比的数组、链表、栈、队列等。 === "Java" ```java title="space_complexity_types.java" /* 线性阶 */ void linear(int n) { // 长度为 n 的数组占用 O(n) 空间 int[] nums = new int[n]; // 长度为 n 的列表占用 O(n) 空间 ListFig. 递归函数产生的线性阶空间复杂度
### 平方阶 $O(n^2)$ 平方阶常见于元素数量与 $n$ 成平方关系的矩阵、图。 === "Java" ```java title="space_complexity_types.java" /* 平方阶 */ void quadratic(int n) { // 矩阵占用 O(n^2) 空间 int numMatrix[][] = new int[n][n]; // 二维列表占用 O(n^2) 空间 ListFig. 递归函数产生的平方阶空间复杂度
### 指数阶 $O(2^n)$ 指数阶常见于二叉树。高度为 $n$ 的「满二叉树」的结点数量为 $2^n - 1$ ,使用 $O(2^n)$ 空间。 === "Java" ```java title="space_complexity_types.java" /* 指数阶(建立满二叉树) */ TreeNode buildTree(int n) { if (n == 0) return null; TreeNode root = new TreeNode(0); root.left = buildTree(n - 1); root.right = buildTree(n - 1); return root; } ``` === "C++" ```cpp title="space_complexity_types.cpp" ``` === "Python" ```python title="space_complexity_types.py" """ 指数阶(建立满二叉树) """ def build_tree(n): if n == 0: return None root = TreeNode(0) root.left = build_tree(n - 1) root.right = build_tree(n - 1) return root ``` ![space_complexity_exponential](space_complexity.assets/space_complexity_exponential.png)Fig. 满二叉树下的指数阶空间复杂度
### 对数阶 $O(\log n)$ 对数阶常见于分治算法、数据类型转换等。 例如「归并排序」,长度为 $n$ 的数组可以形成高度为 $\log n$ 的递归树,因此空间复杂度为 $O(\log n)$ 。 再例如「数字转化为字符串」,输入任意正整数 $n$ ,它的位数为 $\log_{10} n$ ,即对应字符串长度为 $\log_{10} n$ ,因此空间复杂度为 $O(\log_{10} n) = O(\log n)$ 。